发烧论坛

注册

 

发新话题 回复该主题

现时数字音源最大的局限性(相较LP之类而言) [复制链接]

查看: 15552|回复: 86
1#
局限性:没有完整的方法来证明,人的听觉是线性叠加的。

比如,单独听正弦波,人耳可以听到1k,2k,3k...直到20k就不能再往上了。但也许有这类可能:对12k和24k混合的波形(而非单独一个正弦波),人耳却能听到其中的24k?(只要能分辨出和单独的12k声音不同即可)

(由于这类“非线性叠加”的可能性有无穷种,看似没有完整的方法来证明人耳“不是非线性”。而你要说人耳是理想线性的,你说我都不信呐!

--比如,人眼就不是个理想线性的器官。附图中“明处的”方格A和“阴影中的”方格B亮度是一样的,但我们看起来确实阴影中的明显“白”一点。大量的这类非线性的例子可以在图像处理的书中找到。)

现时的采样定理假定人耳是理想线性的,从而把高频在22k(对CD)齐刷刷的截掉,是留有疑问的做法。(SACD截在96k也一样)

所以LP和CD的区别就在于:LP的失真比较均衡、不会突变,也不会有被齐刷刷砍掉的高频。如果真存在“数码声”,那我看以上原理就是“数码声”的来源。

ps...本文写出来,我自己都觉得实际中用不着[upload=jpg]Upload/20064214201189903.jpg[/upload]
分享 转发
TOP
2#

felixcat 在 2006-4-3 1:51:05 发表的内容
还有,使用与不使用UV镜,在某些时候有成像差异,不是因为人眼是否能看到紫外线的原因。而是:众所周知,滤镜其实是一个天然的滤波器,但是世界上不存在完美的滤波器——也就是说不存在UV镜能够严格地滤掉紫外线的同时,一点都不影响、改变可见光频段的信息,这个网页提供了UV镜的原理和各种不同牌子UV镜的性能测试:

http://www.photo.net/equipment/filters/

这就好比我们知道音频中的滤波器都有“频响曲线”这个概念一样。

还有,假如不使用UV镜,在某些拍摄场景的时候,由于胶片的物理特性,会造成胶片蓝色感光物质过度曝光的不正常的现象,使得照片整体背景带有一层异常的蓝紫色。

所以有时候拍照片,使用与不使用UV镜的结果会有人眼可辨的差别,但这绝对不能说明人眼能够感受紫外线。

最后,我觉得讨论似乎有点跑题了。我觉得应该回到这个话题上来:

我的反应是:根据我自己亲身经历的盲听试验,我没听出有什么不同。

不好意思,你好像理解错了我的意思

请举起一块UV镜,用肉眼透过镜观看暗处。对比下不用镜时的效果

12k混合24k只是我的一个举例,事实上会有无穷个这样的例子,你得找方法全部否定(或者肯定一部分)才行。如果这个准备工作都不做,那现今数字音源的音质就无法在理论上保证。
最后编辑Timme
TOP
3#

felixcat 在 2006-4-2 14:50:04 发表的内容

我觉得关于听觉,应该区分两个阶段:首先,器官是否能接收到;其次:人脑如何处理接收到的信息。

楼主举的是觉得例子造成的区别,是在于第二阶段“人脑如何处理接收到的信息”——也就是说眼睛的感光细胞可以正确接收图片每一处的明暗信息,但人脑却未必会把眼睛传来的两处明暗相同的点的信息,真的处理成明暗相同的感觉。

但是楼主举的12k和24k混合的例子,我想混合之后,人耳还是不能感觉到24k的那一部分的。因为这是“第一阶段”的问题:人耳本身不会对24k的信号有任何反应,它根本感受不到24k的信号。人脑不会自身平白无故地产生一个24k的听感。

我们也可以用实验亲自验证:我的电脑声卡可支持最高96k的取样率,所以我可以用Cool Edit产生高达48k的信号;同时我用Sennheiser HD580耳机来试听,该耳机频响高到30k。

我用Cool Edit产生一个12k的纯粹的正弦波,另外也产生一个12k + 24k的混合正弦波。结果用我自己的耳朵去听,不管音量多大多小,两者听上去完全一模一样,没任何区别。

以上是我个人的一点意见,仅供参考。


你是广受数字处理理论灌输出来的思路,在数学上并不严谨。“人耳能接收”是否是除频率外是无条件的呢?还有,顺着你DSP的思路来理论:完全接收不到的信号是不存在的,看衰减多少而已。假入人耳在30k衰减了90db,那人脑在30k再提升90db不就行了?如此,你的“第一阶段”和“第二阶段”不就统一了?

人耳底噪很不错的,耳膜移动一个氢原子大小的距离都能被感受到(这个不是我自己编的),所以90db也不是问题。
TOP
4#

那个standford的文章不是讨论怎样节省硬件资源的么,那么具像的东西和我楼顶的抽象假设有何联系?

这么“导航”的文章,你总得告诉我它发表在哪吧?

“这些振动则由基底膜上的毛细胞来感受,有的毛细胞专门感受低频的振动,有的专门感受高频振动”

想提一下的是,有非线性关系那也不是占主导地位的,有99%的纯线性就差不多了--不然现在的数字音源早被砖头拍死了。

提醒一下,“声学”与“听觉”是不同的,正如“光学”和“视觉”。红绿蓝三色能组合出紫色的视觉,而紫色比它们三色频率都要高,我们是否凭空“造”出了更高频的视觉?--粗略的讨论参见《费恩曼物理学讲义》第一卷“色视觉”章,这年头学高中物理竞赛的都看过这本书了。ps:最先证明光是电磁波的是用哲学,不是科学。

甚至有这个可能:你按住人中来听音乐,比不按人中听音乐来得好听。主观上这是很荒谬的,但数学上你必须严格的证明它不对,否则就没有充足的理由去否定它。(回应你的“手机”假设)

最后我还有个自创的理论:紫外线人是可以感觉到的,具体表现为夜里暗处的噪点(人眼感觉到的噪点,不是DC)。你可用相机用的UV镜来检验一下。
TOP
5#

felixcat 在 2006-4-3 3:31:44 发表的内容
还有一点,Timme兄在前一页第一个帖子里说CD是在22kHz齐刷刷地砍掉——虽然理论上应该是这样的,但是现实中我们却造不出“齐刷刷砍掉”的滤波器。


截高频是DAC前就完成的事。即便滤波器不理想,那残存的高频也是错误的高频信号(对传统DAC是频谱镜像,对超采样DAC是噪音)
TOP
6#

松香味 在 2006-4-4 21:18:29 发表的内容
suifengqingwu 在 2006-4-4 2:00:32 发表的内容
CD,22K处是被按一定斜率衰减了,而非“齐刷刷的截掉”;LP,虽说没有认为的故意削频(姑且这么称呼),但从整个录制及还原的机制来看,其频响高端并不见得超过CD,但削减坡度比较平直,其泛音表现与CD风格自然不同,但不见得比它高明。

这才是真正理性的理解。
不访用自己初中、高中的知识计算一下就知道了。

22k前有缓慢衰减,到22k突然被全部截掉。这是采样定律+模拟滤波器共同作用的结果
最后编辑Timme
TOP
7#

yyy9 在 2006-4-5 20:09:09 发表的内容

朋友,从说话语气上看,贴主说你的发言"在数学上并不严谨"...
有人这样拿数学来攻击你,我象你道歉!
作为一个从事数学工作的人员,我衷心希望大家能从你的发言中体会什么是数学提倡的严谨...


数学的严谨性已被哥德尔不完全定理否决
TOP
8#

科研级旗舰 在 2006-4-7 18:05:35 发表的内容

有的厂家在数字低通部分刻以造成这种非垂直滾降的曲线,据说为了避免相位失真。

ft,我记得数字低通是给超采样反馈作噪声整形的,和模拟低通的功能扯不上关系吧??
TOP
9#

科研级旗舰 在 2006-4-7 22:07:15 发表的内容
数字低通是为了把高频量化噪音滤掉的。在数字放大器里就是这样一个功能,CD里面是否有给超采样反馈作噪声整形不太清楚(早期比特流和ΔΣ的机器要这样做?),不过既然数字低通这块可以去处掉............


在超采样系统中,数字低通把噪音“打”到高频然后用模拟低通滤掉,由于总噪声功率恒定,听觉内的噪声便减小,借以提高信噪比。没数字低通,则是超采样的原始形式,信噪比也比非超采样的好得多。不过,不管数字低通还是超采样,都只影响信噪比,不影响失真。
TOP
发新话题 回复该主题