发烧论坛

注册

 

发新话题 回复该主题

现时数字音源最大的局限性(相较LP之类而言) [复制链接]

查看: 15550|回复: 86
1#

felixcat 在 2006-4-2 16:17:55 发表的内容
Timme 在 2006-4-2 15:06:47 发表的内容
你是广受数字处理理论灌输出来的思路,在数学上并不严谨。“人耳能接收”是否是除频率外是无条件的呢?还有,顺着你DSP的思路来理论:完全接收不到的信号是不存在的,看衰减多少而已。假入人耳在30k衰减了90db,那人脑在30k再提升90db不就行了?如此,你的“第一阶段”和“第二阶段”不就统一了?

人耳底噪很不错的,耳膜移动一个氢原子大小的距离都能被感受到(这个不是我自己编的),所以90db也不是问题。


在声波引起人的听觉神经产生反应的这一个环节之前,首先是不同频率的声波在人耳基底膜上的不同位置引起振动,高频率的声波在靠近基底膜底部的地方产生最高峰,低频率的声波在靠近基底膜顶部的地方产生最高峰——而这些振动则由基底膜上的毛细胞来感受,有的毛细胞专门感受低频的振动,有的专门感受高频振动(Timme兄你瞧,人耳的生理构造其实和各种频率的振动的叠加是相当之类似的),毛细胞感受高频振动是有个上限的,频率太高的话真是什么都引不起反应的,所以在这个意义上来讲,人耳可感受的声波真是除频率外无条件的。

假如您说其实毛细胞可以感受很高频率的声波,只是由于有了衰减所以才显得“听不到”——那您要知道,人耳的毛细胞能承受的声波的最大强度是有一个上限的,超过了这个强度,就不是毛细胞能不能感受到的问题了,而是毛细胞是否会被摧毁的问题(震聋了)!同时,人脑生来就是这个模样的,你不可能改造人脑说让它强行增强某个频率信号。所以假如想让一个人感受到30k的信号,唯一的做法便是增大声波的能量——不过我估计声波的音量还没增大到能引起人耳毛细胞的感觉,所有的毛细胞就被这么大能量的声波所摧毁了,聋了。

所以这样看来,人耳可感受的声波的频率上限,仍然是除频率外无条件的。

并且我们也能够理解:为何我们的听力的范围是20 - 20kHz:因为我自己也试验过:我自己产生21k、22k的信号,正常音量我什么都听不见,只有把音量旋钮弄到最大(冒着耳机被烧的危险),才能感受到音感,但是这种耳朵的感受是极端痛苦的,我听了一两秒就要把耳机脱下,并且耳朵要过好一阵子才舒服过来——这个试验我不肯再做第二次了,实在是太痛苦了。所以可见,让我的耳朵明确听见22k的信号,是可以的,但是代价是音量几乎要摧毁我的耳朵。所以在不损毁人耳的前提下,可闻频率的上限是绝对的。

还有请问Timme兄:您所说的“人耳在30k衰减了90db”,那具体是在人的哪一个器官(请不要笼统地说“人耳”哦),哪一个环节发生了您所说的这种“衰减”呢?

还有,什么是“人耳的底噪”呢?这个“底噪”由什么产生呢?它的频率分布是怎样的呢?它(它们)是在人的整个听觉系统中的哪一个环节被加入的呢?这种“底噪”影响到产生听觉的哪些环节呢?

再有“耳膜移动一个氢原子大小的距离都能被感受到”吗?——有时侯是,有时候却不是:比如说假如现在让你耳膜移动一个H原子大小(其实应该说是原子直径吧?)的距离,不过整个过程的时间长度是10年,那请问耳朵能否感觉得到?——因此产生感受的两个因素是:耳膜震动的“距离”;产生这个震动的时间长度——太长不行(对应极低频);太短了也不行(对应极高频)。

同时我觉得Timme兄没必要以批判的眼光来对待数字处理——实际上不存在没严谨数学分析之下的DSP的。我知道Timme兄可能有些敌视DSP,或许也以为是专家们在某些方面骗我们——但是我从没发现是这样——倒是很多情况下由于我们对某个领域不够深入的掌握,对于某些问题产生一些“想当然”、“类似可得”的思路。假如我们真的用心去钻研一下就会看到真正的原因远比我们想象的复杂

我推荐一篇很新的(2004年),并且很有里程碑式的paper,它是处于这个领域里公认的“导航”式的地位的:

http://www-stat.stanford.edu/~donoho/Reports/2004/CompressedSensing091604.pdf

尽管Compressive Sensing并不是100%等同于以人体感觉为基础的,但是我觉得Donoho的这个工作对于数字领域里面的传感压缩、最优还原的讨论和结论,相当漂亮,很让人吃惊——请Timme兄不要说这是实现不了的讨论——实际上Bell Lab的Cormode和新泽西州立大学的Muthukrishnan两人在紧接着的2005年,就写出了可实现上述结论的实用算法,可以用芯片实现的!(这是DIMACS的一个项目,报告请看DIMACS TR 2005-40)

请Timme兄不妨看看上面推荐的两篇paper,里面的内容绝对可以改变您的头贴里面的想法。不是说这里故意要把问题弄得很复杂——而是这个问题本来就不简单的,想要说到点子上不是几段话就能说明白的,因此我们不妨看看这个领域里面专家们的精彩结论。

不管怎样,大家用自己的电脑,按我前一个帖子说的方法,产生信号,自己听一听不就心里有数了

朋友,从说话语气上看,贴主说你的发言"在数学上并不严谨"...
有人这样拿数学来攻击你,我象你道歉!
作为一个从事数学工作的人员,我衷心希望大家能从你的发言中体会什么是数学提倡的严谨...
最后编辑yyy9
分享 转发
TOP
2#

Timme 在 2006-4-2 14:20:32 发表的内容
局限性:没有完整的方法来证明,人的听觉是线性叠加的。

比如,单独听正弦波,人耳可以听到1k,2k,3k...直到20k就不能再往上了。但也许有这类可能:对12k和24k混合的波形(而非单独一个正弦波),人耳却能听到其中的24k?(只要能分辨出和单独的12k声音不同即可)

(由于这类“非线性叠加”的可能性有无穷种,看似没有完整的方法来证明人耳“不是非线性”。而你要说人耳是理想线性的,你说我都不信呐!

--比如,人眼就不是个理想线性的器官。附图中“明处的”方格A和“阴影中的”方格B亮度是一样的,但我们看起来确实阴影中的明显“白”一点。大量的这类非线性的例子可以在图像处理的书中找到。)

现时的采样定理假定人耳是理想线性的,从而把高频在22k(对CD)齐刷刷的截掉,是留有疑问的做法。(SACD截在96k也一样)

所以LP和CD的区别就在于:LP的失真比较均衡、不会突变,也不会有被齐刷刷砍掉的高频。如果真存在“数码声”,那我看以上原理就是“数码声”的来源。

ps...本文写出来,我自己都觉得实际中用不着[upload=jpg]Upload/20064214201189903.jpg[/upload]

168这样的半科学半猜测的东西太多...
TOP
3#

胡思 在 2006-4-3 12:31:34 发表的内容
有兴趣的人可以做一个实验:
听听方波和正弦波的区别,如果在8K还能听出区别,就能听到24K;如果在9K还能听出区别,就能听到27K。因为方波只有奇次谐波。

麻烦大侠讲讲协波的概念,方波为什么只有奇次协波?
TOP
4#

felixcat 在 2006-4-2 14:50:04 发表的内容
Timme 在 2006-4-2 14:20:32 发表的内容
局限性:没有完整的方法来证明,人的听觉是线性叠加的。

比如,单独听正弦波,人耳可以听到1k,2k,3k...直到20k就不能再往上了。但也许有这类可能:对12k和24k混合的波形(而非单独一个正弦波),人耳却能听到其中的24k?(只要能分辨出和单独的12k声音不同即可)

(由于这类“非线性叠加”的可能性有无穷种,看似没有完整的方法来证明人耳“不是非线性”。而你要说人耳是理想线性的,你说我都不信呐!



我觉得关于听觉,应该区分两个阶段:首先,器官是否能接收到;其次:人脑如何处理接收到的信息。

楼主举的是觉得例子造成的区别,是在于第二阶段“人脑如何处理接收到的信息”——也就是说眼睛的感光细胞可以正确接收图片每一处的明暗信息,但人脑却未必会把眼睛传来的两处明暗相同的点的信息,真的处理成明暗相同的感觉。

但是楼主举的12k和24k混合的例子,我想混合之后,人耳还是不能感觉到24k的那一部分的。因为这是“第一阶段”的问题:人耳本身不会对24k的信号有任何反应,它根本感受不到24k的信号。人脑不会自身平白无故地产生一个24k的听感。

我们也可以用实验亲自验证:我的电脑声卡可支持最高96k的取样率,所以我可以用Cool Edit产生高达48k的信号;同时我用Sennheiser HD580耳机来试听,该耳机频响高到30k。

我用Cool Edit产生一个12k的纯粹的正弦波,另外也产生一个12k + 24k的混合正弦波。结果用我自己的耳朵去听,不管音量多大多小,两者听上去完全一模一样,没任何区别。

以上是我个人的一点意见,仅供参考。

辛苦了,看到老兄回答过不少类似的凭借想象得到的"科学"推断.
有机会希望看到兄弟把自己的体会写出来的文章...
TOP
5#

Timme 在 2006-4-5 22:46:48 发表的内容
yyy9 在 2006-4-5 20:09:09 发表的内容

朋友,从说话语气上看,贴主说你的发言"在数学上并不严谨"...
有人这样拿数学来攻击你,我象你道歉!
作为一个从事数学工作的人员,我衷心希望大家能从你的发言中体会什么是数学提倡的严谨...


数学的严谨性已被哥德尔不完全定理否决

朋友,衷心希望你多谈些自己真正明白,或者自己一些经过实践的感受,不清楚不要紧,千万不要把自己都没有搞清楚的东西当真理来普及.
TOP
6#

胡思 在 2006-4-6 12:22:09 发表的内容
yyy9 在 2006-4-5 21:06:28 发表的内容
胡思 在 2006-4-3 12:31:34 发表的内容
有兴趣的人可以做一个实验:
听听方波和正弦波的区别,如果在8K还能听出区别,就能听到24K;如果在9K还能听出区别,就能听到27K。因为方波只有奇次谐波。

麻烦大侠讲讲协波的概念,方波为什么只有奇次协波?

公式如下,
[upload=gif]Upload/20064612205484102.gif[/upload]

谢谢胡思兄的解答!
从你给出的公式可以看出,这是奇函数f(t)的傅里叶展开式,另外请问方波是否仅限于你给出的f(t)的函数图象这种类形?
我给你个周期函数,f(t)其最大值占每个周期的1/6,其他地方函数值都等于0.
请回答以下两个问题:
第一,这样的f(t)的图象是否是方波?
第二,这个函数的协波是否只有奇次协波?
TOP
发新话题 回复该主题