发烧论坛

注册

 

发新话题 回复该主题

计算芯片的发展将让普通CD战胜LP [复制链接]

查看: 51470|回复: 320
51#

yxiao 在 2004-11-19 14:38:25 发表的内容
唉!多了我也不说了,请问你的误差评估模型里有无“概率”二字,如果没有,我们就不必对话了;如果有,“经验”二字自己去体会吧,谁要你的“计算公式了”?


绝对没有任何概率的成分。

只要您看了误差公式,一切都会很清楚的。
TOP
52#

我前面的帖子提到过,一般厂家告诉用户的只是这台设备在某个频率处的失真度,所以买机器的时候也不能光看厂家给的那个数据。不过假如我能够比较全面地了解一台CD机在各个主要的频段上的失真度的话(当然,这样要费些功夫),我想我会按照这个了解去购买机器的。
TOP
53#

噢对了,这里提供上面的那个算法的MATLAB源程序:

[rar]Upload/200411206151258210.rar[/rar]

解压之后,不用改文件名;把MATLAB的工作路径设定为这个源程序所在的那个文件夹下,然后在MATLAB的控制窗口键入comx,回车即可。
TOP
54#

Dr kuang 在 2004-11-20 14:00:00 发表的内容
接触过一些升频CD解码,我只是想知道,FELIXCAT网友提供的解码方法是否比这类升频解码(目前民用器材最高到700多赫兹)的解码方式能还原更平滑准确的音频曲线?和24bit96Hz格式的DVD和格式更高的DVD—AUDIO及SACD呢?
如果答案是肯定的,能以700M左右的原始数据还原出比5G以上原始数据更平滑准确的声频曲线,这项技术必将带来音响产业的革命了。
再进一步推论,如果以5G以上的原始数据以某种更先进的算法语言来进行解码,是否会有更准确平滑的声频曲线?


恩,这个我想不管在CD解码的时候如何升频,尽管或许能够得出更大的动态性能,但是重现曲线的准确度,肯定是比不上SACD或者DVDA的,这个前面就已经论述过了。

另外对于高频率的声波的重现,对于光滑性(也就是高次导数仍然连续可导)和准确性两者,重视谁是构造解码算法的关键。当然,两者都能照顾到当然最好,但这是不可能的。因为人耳敏感的声波频率都不是太低了(中频区段),所以就算是真实的波形,尽管其处处肯定光滑,但是在波峰处,由于高频率,所以那处的导数变化得很快(在没到最顶端的时候是正值,一过了顶端,立刻变成负的加速递减),所以仍然呈现出直观上相对尖锐的图像(尽管其还是光滑的),所以按照这个理念,我觉得应该首先照顾准确性。

假如只照顾光滑性,那么直接用三次样条插值即可,它的特点是处处两次连续可导(具有一定的光滑型),但是缺点就是误差一般都较大(三次多项式,逼近能力有限)。

还有另外一个瓶颈就是电路的设计。目前的电路似乎都是输入端给一个脉冲,输出就只能是另一个脉冲;所以就算CPU里面存储着一个准确的多项式,目前的电路仍然无法输出严格的连续光滑的信号——这一段信息是别人告诉我的,我不知道是否一定正确。
TOP
55#

科研级旗舰 在 2004-11-20 22:51:40 发表的内容


科研兄,说到这方面的知识,呵呵,我还得向你请教呢!其实我懂得比你更少,你所说的一些概念我还不知道它的定义呢。

现在既然找了老师,那么这件事情就要做下去了。他刚才给我email说其实他对此有更好的思路,这真是探索无止境啊!呵呵说不定最后写出来的Report比起现在我的模型,真可能面目全非了,呵呵。
TOP
56#

yxiao 在 2004-11-19 23:29:17 发表的内容
本不想再和这位朋友争论了,根本是对牛弹琴。但这位朋友实在是太能能装蒜了,有些朋友的思想比较容易产生混乱,所以有必要向大家澄清一下事实。我将努力用比较通俗的语言向大家解释,以便更多的朋友能够了解问题的所在,更多的朋友能够参与进来。

1、没有任何一种算法在任何时候都是绝对的优或绝对的劣。譬如,一组由1,-1,1,-1,1,-1……组成的PCM编码,可能代表一组方型波或者锯齿型波,那么假设现在有三种算法,算法A把这样的PCM编码解码为正弦波,算法B把这样的PCM编码解码为方型波,算法C把这样的PCM编码解码为锯齿型波,那么,我们怎么比较算法 A、B和C 的优劣呢?显然简单的“计算公式”是行不通的,因为在第一种情况下,算法B最优、算法A居中、算法C最劣;而在第二种情况下,算法C最优、算法A居中、算法B最劣。。


首先,我没有说我的算法是最好的,以至于没有更好的算法了。我只是说,我这种算法,它的误差数量级比较小。完全有可能,存在同样误差数量级的其它算法,有时候我厉害过它,有时候它厉害过我。但是,数量级绝对是评判一种算法优劣的最基本原则之一,这个原则无需我来辩护。

两种算法,假如根本不是同一个数量级的,那么肯定最后会挑数量级较小的那个。这位朋友举的ABC的例子,数量级之类的什么的信息都是未知的,根本就无法讨论——假如有那么一个时刻的编码,使得A的确出来一个正弦波——但是相位差了一个什么60度70度(角度制)之类的,那么它任何情况下都不可能处于“居中”的;还有,还有,两种解码接出来的波形有误差,我们不是说看谁的形状比较“像”真实的那个就行的,你可以计算它的误差数量级的,计算的结果肯定是符合直观的,不信您可以自己代个具体数据,定义一种描绘误差的标准(是定义为两者相减的差的绝对值的最大值呢?还是定义为差的平方的积分的值呢?)。所以说这位朋友要想举例子,请实实在在、具具体体写清楚。假如您嫌在电脑上打数据公式麻烦,那么麻烦您一下,举个反例(实际的数据,具体的算法),算好结果后,拍个数码照片传给我,我帮您打印出来,贴到坛子上来。

想要推翻一种算法的最简单之间的方法就是找一个实际的反例,一代进去算,真假立现。


2、既然我们已经知道我们不可能针对任意连续曲线提供一重“万能”的计算公式,那么我们是不是就不可能客观地评价这些算法的优劣呢。万幸的是,任何一种模拟量的曲线(例如音频曲线),都具有一定的数学特征,例如前面的1,-1序列如果是从音频曲线编码出来的,再假定我们已经知道多数音频曲线不太可能象方波或锯齿波那么“呲牙咧嘴”而是比较柔和一些,那么显然,这时我们“差不多”就可以知道三种算法中较好的一种应当是算法A。这里用到的数学方法是概率统计学,而上面提到的模拟量的曲线“数学特征”的取得,来自于我们声学工程师的经验。


“再假定我们已经知道多数音频曲线不太可能象方波或锯齿波那么‘呲牙咧嘴’而是比较柔和一些”——这句话似乎保守了一点吧?声波都是由不同频率的正余弦波线性相加,怎么会出现相加的结果是不光滑的呢?

我所说的曲线一直都是指音频曲线,假如造成任何误解的话,请见谅。这个是我的疏忽,以后我会注意把所有名词的全称每次都书写完整。

另外,概率或者是统计(请注意概率和统计是两个不同的方向)在这方面的运用,不如请这位朋友详细一些介绍一下如何?我愿听其详。虽然我现在的方向不是纯粹的概率或统计,但我的方向也需要我会一些概率和统计。我所听说过的概率或统计在帮助声频领域方面的研究,能够相关的主要是语音识别,对于音频的其它方向我真的还没听说过有人或者企业在做这方面,或许我孤陋寡闻了。所以这里请熟悉这方面的这位朋友不吝赐教。


3、从上面的讨论,朋友们已经看出了一种算法以及与之相关的评估体系的选用,与算法的用途直接相关。不存在一种万能的算法,可以一般地优于其他对手,事实上,适合语音、人声还原的算法就不一定适合器乐的解码还原,因为他们具有不同的“数学特征”。也许这也是不同品牌的CD解码器具有不同风格的原因之一吧。


语音的特点,不必用数学去分析这么麻烦了,只要一看波形图,它们能量集中在哪一些频段就立刻清楚了——物理特征。

现在有很多很多品牌和很多很多解码器;不过能够独立研制自己的解码算法和制造芯片的厂家,似乎我们可以几下子数出来的——其它很多厂家其实都是用一些成品芯片,然后自己设计电路的。那么,造成它们之间声音风格不同的原因,使究竟主要在于解码算法上呢?还是电路的设计上呢?

最后,我原理、算式、结果、图表、实际数据验证及其所代表的意义都实实在在给出来了,并且都是一步一步推出来的,哪一步出问题,您可以直接指出来。我绝对不是所谓的“装蒜”(您这个词,实在是有点过份了),哪个地方我有疏忽、有错,我一定会及时说明并且更正的。
最后编辑felixcat
TOP
57#

恩,多谢开心果兄的指正!插值多项式的一个最大的缺点(呵呵,也是特点)就是头尾几个点肯定有较大误差。我会想办法继续完善它的(比如说只取最中间的那些点,尽管这样会减低运算效率)。

我的PC(迅驰1.6G)运行计算最后一组数据的时间,假如要画出图象的话,要0.16秒;假如仅仅是计算,不画图的话,仅用0.06秒。
TOP
58#

开心果 在 2004-11-20 19:30:31 发表的内容
楼主辛苦了,麻烦您把下面另两条曲线恢复一下(取样频率不变)。到时我把三条曲线的情况说一说。


开心果朋友要的曲线如下,分别对应前后两组数据:

1.
[upload=jpg]Upload/200411211492490783.jpg[/upload]


2.
[upload=jpg]Upload/200411211495363509.jpg[/upload]

可能是我的疏漏吧,我在前面还应该说明,尽管数据点越多越好,但是插值多项式的自变量范围也不能随便随着次数而发散性递增——那样的话效果等于一边加水一边同时漏水——不然的话假如把CD上的所有数据点都一次性地用一个多项式来插值,那么通过误差公式就可以算出因为数据点太多了并且处在太广的范围,误差的上界肯定惊人地大。实际操作起来我想插出来的图像已经是面目全非了。所以我觉得比较合适的方法就是一次取比如说13个数据点,算出来之后取中间那些数据点的曲线,然后依次一段一段来,那么就能得到较好的结果了。

缺点是在衔接处的曲线有时会出现类似上面图像那样的奇怪的小振幅抖动,这一点我想我们可以通过在那点邻近两点(一共三点)处采用三次样条磨滑。

所以我觉得下一步还是应该把算法细化,我现在的这个想法是粗糙了。
TOP
59#

开心果 在 2004-11-22 13:26:22 发表的内容
是有个系数,但该系数不会影响的,就象把音量开大和开小不会使波形改变一样。


呵呵,我把归一化系数加上去了(是0.49582566980509),下面这幅图是我的算法的逼近效果图(开头和结尾几个点由于前后分别缺少数据不能继续下去了,所以误差较大——这个责任不在算法上;还有中间两个点由于是采用分段计算,所以衔接处有误差,不过这个可以在衔接处再做一次三次样条插值即告解决;剩下的其余所有点都得到很不错的逼近,甚至算出来的插值多项式还准确地预示出一些存在于两个取样点之间的未知的振幅):

红色线为原始信号,蓝色线为插值逼近结果,可以看见在很多地方两条曲线已经几乎完全重合在一起了:

[upload=jpg]Upload/2004112213565550169.jpg[/upload]

但是在某一些波峰处似乎还有待改善,看来继续努力做一些改进把上述缺点解决掉。
最后编辑felixcat
TOP
60#

ACE 在 2004-11-23 7:29:21 发表的内容
疑问二:楼主认为LP不如CD,同时认为XRCD和SACD不如普通CD,再又认为普通CD中以头版最好。从中是否得出“CD的技术从来就没有进步过”的结论?(以上观点大量见证于楼主在音乐唱片版的贴子)


这个问题涉及两个方面,一张音质好的CD,其成功取决于两个不同的方面,此两者缺一不可:第一,混音要做得好,做得恰当,尽量保持原汁原味;第二,制作CD的设备性能越高越好。

我觉得这两点比起来,第一点重要多了,因为混音调得不好,一下子就会把高性能的设备的优点全部给抹掉了,试想,一张调音调得高频刺耳、动态狭窄的CD,就算用类如20bit、24/96之类技术制作,听上去也是很难听的;而第二点也是不可或缺的,相信大家也明白。

我为什么最喜欢大部分的头版CD呢?其实我真的很推荐各位朋友抽空阅读一下这篇由录音专业人士撰写的参考文章:

http://georgegraham.com/compress.html

里面有很详尽的解释。我觉得这位作者看问题很准,我仔细比较过手头的头版和再版,尤其是EMI的那些,我发现绝大部分真的被他的描述说中了。当然要说两者差别,较小,但却是明显的。再加上现在找这些头版CD,价钱也不太贵,在能力允许的情况下,收集一些此类CD也是未尝不可的。

当然现在也有好的再版的,我在我写的帖子里面都介绍好的再版的,比如说EMI FDS系列、Everest等等;新的90年代的数码录音我也推荐过(比如说Muti指挥费城爱乐的布拉姆斯交响曲录音等)。我的原则是:只要我听过是好的,那么我都会推荐;在帖子里面,我推荐我认为声音最好的一个版次。

至于为何我的介绍里老录音比例大一些呢?——这个我也不知道,反正我买唱片的时候是很随意的,也很看心情的,反正这样不知不觉积累下来,竟然老录音多占了一些优势。这个方面,因人而异。

我记得没说过SACD不如CD之类的话啊?我只是说SACD的混音工作难度大而已。关于XRCD,在我所听过的Living Stereo系列里,我觉得混音的确是做得不是太好(或许是录音风格的缘故,所以我平时不怎么介绍RCA的唱片);至于其他录音的XRCD,我没听过,所以不对音效做保证;我所批评的是它的离谱售价而已。

真的,那篇文章很不错,诚意推荐!http://georgegraham.com/compress.html
TOP
发新话题 回复该主题