4

HiFi耳机音箱/声学十大常见误区

 3 years ago
source link: https://zhuanlan.zhihu.com/p/308606629
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

有些是“坊间传说”,但有些即便是一些“专业人士”也经常会陷入误区。这篇文章总结了过去我最常遇到的十个关于HiFi/声学的误区理解。

“录音室就是消声室”

这是一个非常常见的误区,尤其是对于一些录音行业的人,认为他们平时所使用的录音室/混音室等有一定声学处理的房间就是消声室。但实际上,常见的录音室虽然有声学处理,但也只是部分吸收和扩散反射声,或者说只是将一些不利于工作位置的反射声,尤其是可能导致声染色的一部分早期反射声处理。

v2-f73e7fb434292bf8241a3e515eb26543_720w.jpg

然而,真正的消声室是在房间内任何位置都放有吸声材料,尽可能减少任何反射声以模拟自由场(如果是半消室则是5个面有吸声材料)。而且通常消声室所使用的吸声材料,例如常见的尖劈,实际的吸声系数和效果也与录音室或者听音室所使用的不同。并且即便是全消声室,也存在低频截止频率。

所以常见的录音室仍然存在一定的反射声,也就存在一定的后期反射声即混响。所以对于耳机这种回放过程中没有类似于音箱系统反射的回放类型,即便对于混响的还原也是残缺的。

“人有两个耳朵,所以立体声更HiFi”

这是基本上随处可见的一种错误言论。

人有两个耳朵,所以一个乐队中只能有一个人声唱歌+一个乐器一共两个声源人才能听?人有两只眼睛,所以看电视要两块屏幕?看球赛里面只有两个人能踢球?人有十个手指,所以手机应该有十个按键?

这其实都是风马牛不相及的事情。

事实上,如果要回放一个由1个歌手+4个乐器组成的乐队,那么最好用5只音箱,每只音箱摆在对应乐器和乐手的位置和高度,模拟5个声源,才能获得更好的声场效果。

此外,高品质的多声道系统拥有中置声道带来的真实声像,和天空声道有效还原三维空间的声源和反射声。立体声系统虽然可以通过录音和音箱摆位做到人声声像接近真实声像,但是人头动态因素导致的声像漂移、声像定位变化、声像聚焦等问题是立体声音箱系统的先天缺陷,无法或者说很难弥补。中置音箱可以有效且较好的还原人声声像,定位准、声音不漂。

而对于天空声道,可以通过算法或者预先混音对音乐厅剧院等中大型建筑三维声场的还原,相比立体声系统就是降维打击。

而对于音色,其他条件都确定的情况下,只要多声道系统的音箱和立体声是一致的,那么音色就大致是一致的。之所有很多发烧友认为多声道系统中的家庭影院系统音质不如HiFi,很多时候是因为用同价位的两套HiFi音箱系统和家庭影院系统对比。通俗的讲,如果用两万一对的HiFi音箱和7~10万一套的多声道音箱再对比,就不会有多声道系统音质不HiFi的想法了。

更形象的讲,你花5万买了一套杰士家庭影院,你可能会觉得音质不如你同样花了五万多买的JBL 4367。但如果你用7个4367做一套家庭影院7.2.4中的7(先不考虑功放音源等其他因素),那么你就不会觉得这7个4367音质不如你原来的两个4367,因为它们都是一模一样的4367。。。

“低音炮不HiFi”

很多人一提到低音炮想到的就是“动次打次”和“土嗨”,确实市面上有不少低音炮就是给足量感,音质表现放飞自我听个爽。也有一些专门为家庭影院设计的低音炮侧重于高额定功率,而不是很看重低音的失真以及灵敏度等方面的表现。但低音炮也有可以用于HiFi/监听的,它们往往拥有一定的灵敏度,并且由较低的失真,而且在有着更低下潜的情况下瞬态动态等表现和一些HiFi音箱的低音单元相当。单纯认为只要有低音炮的系统就不是HiFi的,是一种很片面的看法。

相反,由于房间模式固有的属性,以及在几何声场范围内房间反射以及直达声角度对空间印象感知的影响,要同时获得比较好的低音表现和声场表现,理论上低音单元不应该和中高音单元在同一位置。2.2系统理论上要优于2.0系统。

“房间曲线/耳机曲线平直才是HiFi的”

音箱的频响曲线应该在轴向和离轴保持尽可能的平直才是HiFi的。(对于直达声占主导的频段,轴向和听觉窗口保持即可)

鬼斧神工119:市面上一些音箱表现究竟如何?如何通过数据解读音箱的音质和声场表现?CEA2034A标准详解​zhuanlan.zhihu.com图标

但是音箱在房间内,房间曲线通常应该在低频有一定的增益,并且在高频有一定的衰减。这是由于房间对不同频率声音的吸收不同以及常见的音箱在不同频率的指向性不同而导致的。如果房间完全不改变音箱的频响,即平直的音箱放在房间内曲线依旧是平直的,那么这样的房间通常是上面所提到的消声室。理想听音环境绝不应该是没有任何反射的,去消声室里听一下音乐就明白了。

而对于耳机,一个基本的逻辑是,如果一个音箱+房间的系统有着很好的声音表现,那么把耳机的声音(音质音色)做成类似的声音也应该有很好的表现。低音属于波动声学区域,音箱的Sound Power起主要作用。所以耳机的低音与音箱在房间内的稳态曲线应该呈现类似的趋势,所以耳机的低频应该相对来说有一定的增益。此外,还有一种解释是耳机这种压力场的低频频率响应应该等效于音箱在自由场内+6B。

我们日常听音的环境,既不是扩散场也不是自由场。(看到那么多人说哈曼曲线是基于扩散场曲线的,我真的都不知道说什么是好)我们日常听音的环境,既不是扩散场也不是自由场。(看到那么多人说哈曼曲线是基于扩散场曲线的,我真的都不知道说什么是好)

经常有人认为这张图中低频部分耳机相对于绿色曲线多出的部分全都属于主观偏好低频的增益。实则是完全错误的理解。

上图中,绿色曲线的低频部分仅为把房间曲线调平,而非理想听音系统低频的房间稳态曲线。此时对应的音箱曲线并非平直,而这样做的主要目的仅是方便归零。其实上图中绿色曲线的注释也写的非常明确,通过音箱加载EQ使得房间曲线平直。

不论是音箱系统的房间稳态曲线,还是耳机曲线,低频部分都不应该是平直的。所以不论是之前旧的音特美曲线,还是之前的真力房间校准套件在低频部分的能量都是错误的。相比之下,Dirac的低频校准则更接近正确一些。而对于上文所说,认为哈曼曲线的低频部分高出绿色曲线部分的能量均为主观偏好修正,实际听感真的多出那么多低频,基本上暴露了两个问题:

  1. 缺乏基本听音能力,对于实际声学产品的低频到底相较于标准声音大致到底高出多少无法通过听觉判断
  2. 缺乏基本的声学和心理声学常识,对于常见形态的曲线的意义没有正确的认识。

“通过房间内频响曲线调整房间声学处理和摆位"

这只适用于低于过渡频段的波动声学区域。要从本质上了解这个问题的关键,还是要明白一个房间存在两种声场。对于波动声学而言。可以用RTA曲线代表实际听到的声音,通常也就是低频的Sound Power。

但是,对于过渡带宽和几何声学的区域,音箱系统实际的主观听感还取决于直达声和反射声的关系以及音箱与听音者连线的角度等因素。即便是房间内的测量也要考虑RTA还是FFT,以及FFT的timing window和窗函数等问题,以对应上文提到的房间稳态曲线问题。

Floyd Toole博士就曾举过一个例子。一个房间内音箱放在角落里,听音位在另一个角落里,与一个房间内音箱和听音位都在房间的中间。我们可以通过EQ把两个房间内的曲线调成大致相同,但是我们听到的声音是不同的。再比如我们可以在同一个位置把音箱朝向不同的角度和方向,依旧可以通过EQ把房间曲线调成大致相同,但是实际听感也是不同的。除非还测量双耳互相关传递函数IACC和早期侧向声能比LF之类的。但这也仅仅代表音箱本身可能产生的音色和声场,但对于一些多声道音箱系统而言还要考虑到算法和混音逻辑等。这是音箱系统的问题。我还可以举一个更极端的例子,例如一个房间内把两个音箱和听音位以等边三角形摆放并且指向听音位,而另一个房间内把两个音箱挨着并排放在听音位的正前方,显然前者会获得不错的声场表现,而后者会将立体声几乎变为单声道。

这与耳机和耳机曲线的对应关系是不同的,这本质上还是自由场/混响场(音箱)和压力场(耳机)的区别。

对于压力场而言,空间中处处的声压是相同的,耳机也不存在现实中声源的直达声和反射声。但是对于音箱系统而言,固然高品质的音箱在良好声学装修和摆位的房间内的房间稳态曲线是趋同的,但是不能反推。

“好的音箱可以不用摆位/可以无视房间影响”

这完全就是无稽之谈。任何音箱都需要摆位,房间模式是房间的固有声学属性,不以人的意志和音箱的好坏为转移。

固然,好的音箱即便在较差的房间内也可以有一定的效果。但是房间和摆位始终会制约音箱系统的最终表现。更准确的说是,Floyd Toole博士的研究发现,不同的房间环境并不会影响不同音箱之间音质好坏的相对顺序,或者说即便在较差的房间内,好音箱声音依旧比差音箱声音好,并不会因为房间不同而反过来。例如三个音箱ABC在一个房间里,分别是567分,另一个房间里可能是678分。房间不会改变好坏顺序,但会改变天花板,可以大概这样理解。而同一房间内不同位置会引起区别。这又是另一个问题。

之前看到过有人将一个15寸的音箱放在一个很小且没有什么声学处理的房间内,并且摆位存在问题,但是音箱的所有者声称这个音箱的低音很“柔和”所以小房间不摆位也能出好声音。上面已经提到,房间并不会管你的音箱“柔不柔和”,更不会管你“发不发烧”,问题一直就在那里。而我认为之所以他会认为柔和,是因为房间的驻波和边际临界效应等因素,大幅度削弱了低频一些频段的能量。

低频如此,房间反射和摆位对soundstage和image的影响亦是如此。

“好的耳机可以达到音箱的效果”

对于目前市面上在售的耳机来说,这基本上是不可能的。

原因主要有以下几点:

一、耳机的音质与音箱在低频部分存在本质不同。

这主要还是因为人在接受现实世界和音箱的低频时,与耳机的接收方式有所不同。

二、传统耳机和音箱的声场表现存在较大差异。

三、耳机和音箱在高频或者说超高频部分的表现有所不同。

耳机很难找到精确匹配每个人人耳对应的曲线/传递函数,或者说市面上很难找到超高频刚好可以比较完美适合你的耳机的耳机,并且这本身受到佩戴等不确定因素的干扰。而对于音箱,只要保证超高频部分轴向和轴向附近的频响曲线平直且失真较小即可。这显然来说对于音箱并不难实现,只要高音单元的设计和成本达到一定的水平。而这对于传统的耳机来说几乎是不可能的。只要音箱的音质达到一定的水平,耳机的音质是不可能和音箱有可比性的。或者说音箱音质的天花板比耳机高,而声场表现更像是降维打击。

这些区别是原理性的,并且在一段时间内很难有实际突破,也不是花钱买几个贵的耳机就能超过的,何况音箱通常更贵。我不善比喻,只是简单打个不恰当的比方,再好的自行车也是自行车,没办法变成汽车或者飞机,虽然它们都有轮子。

“瀑布图”

建议任何想要深入了解这个问题的人,先学习一些基本的信号与系统相关的知识,以及人耳察觉域。

鬼斧神工119:【预告】市面上主流音箱表现究竟如何?如何通过数据解读音箱的音质?——频响曲线的Q值与再谈瀑布图。​zhuanlan.zhihu.com图标

很多人看到瀑布图,会想当然的认为其中的一些时域“振铃”或者时间轴相关的东西能够独立于频响曲线代表时域表现,抑或是可以通过这些瀑布图中的时域问题看出听感中的时域问题。这其实和上文提到的耳机和房间曲线低频是否平直一样,属于一个想当然的问题。

相比于高Q值resonance,低Q值resonance更容易被察觉。

而另外一个问题,则在于高Q值谐振需要一定的时间或者说过程才能够触发可闻性。即音乐中必须要有内容在这个频率上,并且维持一定的时间,才能够使人听出可闻区别。这也许也是为什么音乐信号相比于Pink Noise需要更高的幅度(尤其是在高Q值)才能触发的重要原因之一。

而对于低Q值resonance,在很短的时间就可以触发。

所以从某种意义上,低Q值才更容易暴露一些瞬态问题。也就是那些频响曲线中“看似不起眼”的范围很宽的“隆起或者凹陷”。

而低Q值的resonance恰恰不容易在瀑布图中产生“振铃”

此处的内容我不想再多做重复,有兴趣详细了解的,可以去看一下上面两个文章链接。这里再做一个系统性总结:

  1. 耳机在大部分频段都属于最小相位系统或具有最小相位特性,时域和频域可以通过一定方式变换,对于这些频段,解决频域问题等效于解决时域问题。
  2. 对于200Hz以上而言,我们听到的是频域的隆起而非时域振铃
  3. 低Q值谐振更容易触发“时域问题”,而低Q值谐振反而不容易引起瀑布图中的“振铃”。

依旧是前文提到的Dirac,其实用Dirac校准低频频响,也能看到冲激响应的变化。

这里再做两点补充:

  1. 由于频域和时域精度的制衡关系,时间轴越精确的瀑布图反而越影响频域精度,或者说瀑布图获得的察觉域信息反而比频响曲线更不准确。
  2. 分频系统分频点附近所引发的群时延通常不会影响可听性。

“非线性失真”

这也是一个老生常谈的误区。

我赌你的枪里没有子弹,绝大多数觉得非线性失真很重要影响音质的人,可能根本不知道典型的非线性失真听起来是什么样的。

人类听觉有一种特性叫作掩蔽效应,对于常见的立体声耳机和立体声音箱而言,如果一个较大的声音和一个较小的声音同时存在,那么较小的声音可能会被较大的声音掩蔽掉。而对于谐波而言,有一个范围叫作谐波掩蔽阈,低于这个范围的谐波失真会被掩蔽掉。也就是说,谐波失真要超出一定的值,才能被我们的人耳感知。其他类型的非线性失真也有类似的阈值。他们都属于我们的听觉极限。

对于非线性失真而言。并不是数值越小影响就越小。JBL的Alex Voishvillo博士曾经证明,硬削波产生的22.6%的THD,比交越失真产生的2.8%的THD更容易令人接受一些。

Voishvillo A. Assessment of Nonlinearity in Transducers and Sound Systems–from THD to Perceptual Models[C]//Audio Engineering Society Convention 121. Audio Engineering Society, 2006.

对于大部分情况下出现的低次谐波失真,恰好能够被人耳感知到的数值大约是1%.

Moir J. Just detectable' distortion levels[J]. Wireless World, 1981, 87: 32.

交越失真有可能在0.3%或者更低一些被人耳感知到。

Moir J. Transients and Loudspeaker Damping[J]. Wireless World, 1950, 56: 166-170.

P.A. Fryer的研究表明,对于钢琴而言,刚好能被人耳感知的互调失真IMD约为2%~4%,而对于其他类型的测试信号,约为5%.

Russell K F, Fryer P A. Loudspeakers: An Approach to Objective Listening[C]//Audio Engineering Society Convention 63. Audio Engineering Society, 1979.

我们不难发现,以上引用的数值都很高。因此,你可能想要知道,为什么这么多年过去了,对于HiFi产品的低失真的追求没有被停止。一方面是,以上这些数字如此之高,对于很多人来说是难以置信的。另一方面则是,会有商业利益推动这些技术指标继续进步,不论这些技术指标是否可以被人感知。

Douglas Self, Audio Power Amplifier Design

想要知道你自己的非线性失真的听觉极限是多少,还是这个视频,可以去做一下测试,如果有兴趣也可以下载视频中的源文件。

只有当非线性失真高出一定值时,才会对主观听感有影响。而如果频响曲线并不标准,或者说频响曲线引发的谐波组成变化大于非线性失真,那么频响曲线依旧是影响听感的主要因素。除非两个回放设备的频响曲线相同或非常相似,且两者非线性失真有较大区别且存在超出听觉阈限的情况下,非线性失真才有可能成为影响声音的主要因素或主要矛盾。例如我过去测评过的一些失真比较明显的便携播放器。

“蓝牙耳机一定不如有线耳机”

这其实影射了一系列问题。例如:入耳式耳机一定不如头戴式耳机、耳机音质一定不如音箱、家庭影院音质一定不如HiFi音箱等等。

固然对于声学性能类似且频响相似的耳机,通常有线耳机音质比蓝牙耳机更好,这是因为通常蓝牙传输和编解码是有损的。但这些年蓝牙技术也一直在进步,有些盲听实验中,其他条件确定的情况下,蓝牙音质已经能够达到有线耳机的8成左右。这相比于前几年老旧蓝牙协议只有有线耳机可能4成还不到的音质来说,已经是不小的进步。好的蓝牙耳机,音质并不比一些较差的有线耳机差。或者说频响曲线和蓝牙协议都较好的耳机,很有可能比频响曲线不好的有线耳机综合音质更好。

耳机市场本就混乱,音质和价格之间的关系微乎其微。

盲听实验结果多组科学实验证明耳机音质与价格之间的关系很小

例如花一千块很有可能买到音质不怎么样的有线耳机,或者更具体地说,就是一些大品牌很出名但实际上HuFi的耳机,这里不具体点名。而对于蓝牙耳机而言,通常可以内置EQ调音,千元左右买到一个频响说得过去蓝牙协议也说的过去的耳机其实也并不难。而对于这样的蓝牙耳机,可能综合音质这就比一些HuFi耳机要强,当然,对于一部分人来说,可能要排除先验的影响。

与此同时,入耳式耳机和头戴式耳机、家庭影院音质和HiFi音箱等等,也会有类似的结论。


以上就是我对最常见到的一些关于HiFi和声学的误区的集中总结,其中不乏一些很容易混淆或者误解的问题,尤其是对于一些对类似问题没有深入透彻理解的人。希望如果有对这些问题真的很感兴趣的人,可以仔细认真学习相关内容和思考。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK