很遗憾,尽管你认为“这个问题似乎很少有人搞清楚过”,然而早在几十年前,大家就把这个问题搞得七七八八了。
我们的故事要从一只音箱说起。
这只音箱的名字叫做Auratone 5C,从上个世纪70年代开始,这玩意就一直都是录音室里的监听标准。
你觉得这只音箱会有什么特点?
精准的三频?
超乎想象的下潜?
平直的频响?
很抱歉,以上这些,它统统没有。
它的声音,跟一般意义上的“监听音箱”比起来,就像是一坨大便。
你注意到那个可怕的纵轴了吗?
作为对比,纽曼KH310的频响曲线是这样的:
这只扬声器有一个“臭名远扬”的外号,叫做“Horror-tones”,意思是用这东西重放出来的声音实在是恐怖得要命。然而录音师们还是对这东西爱不释手,以至于2005年这货停产之后一箱难求,一些高端的监听音箱甚至还要专门搞个“一键模拟”的功能出来,去模拟这个小箱子的声音。
你猜是为什么?
答案很简单,因为它足够难听。它没有低频,没有高频,几乎全部声音都集中在了中频里,这使得它的声音跟当时的汽车音响或者是家用收音机的声音很像,而人声与大部分乐器的基波和低次谐波都集中在这个频段上,所以假如你的音乐在这只箱子上听上去还不错,那么在别的地方听上去应该也不会太差。
在混音发展的早期,大家普遍认为混音师应该使用他们所拥有的最好的监听系统来进行混音。商业录音棚中的主监听扬声器(简称主监听)质量往往会比家用的扬声器质量好得多,因此很多混音作品尽管在录音棚中听来很不错,但是拿到廉价的家用扬声器上重放时却表现不佳。
这种现象曾给混音行业带来了不少奇怪的习惯,比如说“car test”——就是在录音室里干完活之后跑到车上再听一遍。(实际上就算是有了Auratone 5C之后大家也经常这么干)为的就是确保自己的作品在辣鸡设备上也能有个不错的效果。
而作为一只微型全频扬声器,手机的外放扬声器同样是问题多多。咱们拿Iphone4的外放扬声器举个例子(因为我实在是懒得找最新的了,不过相信我,即使是9012年,肾4的扬声器依然是要比不少千元机更强的)
再来另外一个厂商的
看到那可怕的F0了么?接近1KHz。
简单来说,在手机外放上听起来很难听是正常的,因为一般的手机扬声器都没有低频,没有高频,这意味着你红线之外的所有内容在手机扬声器上很可能都是没法回放的(当然,我就是这么一标,不是很准确):
不恰当的讲,这相当于你给自己的作品加上一个带通,只保留下了中间的这一段——你可以试试这么干一下,看看自己的作品会不会听上去很奇怪。
不过这还没完,这里我还是要提一下等响曲线和遮蔽效应(详细可见https://www.zhihu.com/question/316654040/answer/631783382),因为手机的微型扬声器的低频都很糟糕,而人的听力等响曲线决定了只有在低频声压级很强的情况下你才能感知到低频,所以一些手机的外放扬声器通常会人为的制造出“低频浑厚”的感觉。而中低频的增强又会对中高频产生较强的遮蔽效应。这会让你的作品变得更难听。
当然了,考虑到大多数手机的外放都只是单声道,所以在你将立体声信号合并为单声道之后还会产生一些兼容性问题。不过目前这个问题的解决方案已经比较成熟了,很多插件都可以实现单声道监听,我就不废话了。
所以我给你的意见呢,就是在你编曲的时候集中精力做好250Hz到6KHz之间的部分,不要过度迷恋低频和高频的部分。
现在的监听设备跟30年前比起来几乎已经有了翻天覆地的变化,雅马哈的老白盆低频只能下潜到90Hz,而现在就算是3寸的真力8010也能轻松摸到这个频率上。以前你可能得先花上几千刀搞声学处理,然后再花上几千刀来搞到一对频响平直的箱子,现在只要几千块的测量话筒+软件就可以把你听音点上的声音调整到接近平直。可是对一般人来讲,大家现在用的各种蓝牙音箱、电脑音箱以及手机的外放扬声器却没有比30年前好多少(甚至是更糟了)。所以想让更多人接受你的作品,你就必须试着抛开自己那些昂贵的设备,努力让自己的作品去适应一般人的那些蓝牙小音箱、手机扬声器。
Ninety-five percent of people listen to music in their car or on a cheap home stereo; 5 percent may have better systems; and maybe 1 percent have a $20,000 stereo. So if it doesn’t sound good on something small, what’s the point? You can mix in front of these huge, beautiful, pristine, $10,000 powered monitors all you want. But no one else has these monitors, so you’re more likely to end up with a translation problem.——Chris Lord-Alge
以上。
你这个问题也不是1500人民币能解决的,不然很多人也不用花近几十万的学费去学了对吧哈哈哈。
既然学到了就分享给大家,我一直认为学习知识的意义重在传承,这也是知乎的精神吧?
不过吹完牛逼以后,要是解决了也别忘了发红包啊哈哈哈哈哈哈哈哈哈。
我相信你肯定明白手机扬声器不如专业的监听音箱,所以实际上你的问题是为什么别人的作品在手机上听还可以,而你自己的作品在手机上听就感觉很差,但录音棚里听还不错对吗?
你的猜测没错,混音做的好的话,手机上外放也不会太差。
这三个概念我首先会比较详细的解释,每个后面我也会有一个说人话的部分尽可能的以更通俗的方式帮助更多人理解。
如果有问题欢迎提问。
遮蔽效应(Masking): 本是基于人耳的构造而提出的理论,简单理解就是不同频率的声音所占的带宽不一样。
当有相同分贝的两个不同频率的声音通过空气将震动传入耳朵内时,占有较大带宽的频率的声音就会将占有较低带宽频率的声音给遮蔽住了。
比如都是15db,基础频率为1khz的声音与15khz的声音听起来1khz会更响一些。
根据这个理论得出人耳的等响曲线。
而手机的扬声器就像人的耳朵一样,只不过一个是生物驱动的、一个是由电驱动的。
当你的混音中存在过量的低频时,也许因为你录音棚重放设备的性能还可以所以几乎听不到明显的失真。
但是当你在小体积的手机扬声器上播放时,受限于手机功放的功率以及振膜的尺寸,因为低频的振幅很大,功放就会拼命输出大功率去重现低频,然而振膜却没有相对应的面积以足够大的力量去''扇动''足够量的空气。
所以振膜幅度虽然有了,低频的音量却很小。同时在这个过程中因为大部分功率用来重现低频了,也因为振膜的振动幅度较大的原因,所以其他频率的表现就变差了。
还有一个因素就是有的手机的功放部分其实也有类似限制器这样的电路,你给的低频越多,剩余给其他频率的空间就越少。如果你的扬声器不能以合适的音量重现低频段的声音,那么低频多了,整体音量反而小了。
这个是扬声器上的遮蔽效应,虽然和人耳的不同但是相同的概念是声音频率的带宽是有限的。
说人话就是,首先应该尝试的思路: 降低大约20~150hz左右的低频,提升厚度还可以在中低频上做文章,应该用较大Q值的EQ在450hz~600hz左右适量提升。
不同的乐器有不同的声音特性,尽可能地将带宽留给那个频段最需要的乐器。比如对于Bass来说最重要的50hz~250hz,而对于木吉他来说50hz~250hz相对不是那么重要。
你不可能既想要保持木吉他声音原有的厚度,又想要保持贝斯的低音下潜。相比之下只能把木吉他的50~250hz给切了或者衰减,否则混音听起来会糊成一团,在手机上重放更差。
别说木吉他了,哪怕是斯坦威的钢琴,该切也得切。这也是为什么流行音乐录音,相比斯坦威更喜欢Yamaha的四钢弦钢琴,听起来没斯坦威那么厚不用切太多,而且还亮,更便宜又能达成效果。
中频是最拥挤的也是最重要的频段,基本上一首作品的层次感都在这体现了。
为什么有的录音棚喜欢用老白盆,早知道它的低频下潜到80hz就没有了,可以说是非常差劲的监听音箱。一方面是因为时代的原因,但是更重要是它优异的中频重现能力。
在摇滚中,哪怕是通常最重要的人声大多数时候还是得在中频给其他乐器让步。因为摇滚乐,特别是金属,失真电吉他在中频的表现远比人声重要多了。
不同风格的音乐处理方式不一样,像在流行音乐中人声就必须得给到它最优先的待遇。不像摇滚,流行音乐中最重要的就是人声,什么鼓、贝斯、吉他全部都得让步。
中频也是手机扬声器稍微能够较好重现的频段,只要你把这个频段不同乐器的层次关系给处理好了,手机上听起来外放也不会太差的。
至于高频,只要不是刚混音的人喜欢把高频弄得特别刺耳,基本上都不会有太大的问题。因为这个频段是多数乐器的泛音频段还有混响的部分,没有那么拥挤。
声音的来源: 不少人有一种错误的认知,认为混音可以完美拯救很烂的声音。例如当录入一段很薄的声音时,疯狂用EQ提升低频妄图去将声音变厚,殊不知提升的多是不自然的声音。
因为你录进的声音中,低频有效的信息不够多。换个例子讲,比如一支Shure SM58的麦克风,它的频响范围不明显衰减的部分,我个人称之为有效信息的频段部分大概是100hz~10khz左右。
如果去提升17khz的部分,
那你提升的到底是什么?
噪音。
因为这个17khz的频段在这支麦克风中衰减非常严重,几乎没有多少的有效信息。
再回到我刚才说的例子,前期录入的声音的有效信息部分就是固定那么多的。
假如你觉得这个录好的声音还是薄,这个时候就说明你录入的声音低频部分的有效信息不够多。
EQ永远是最后没有办法的手段,你应当优先利用近讲效应(Proximity Effect)在录音阶段去有效地提升歌手的嗓音厚度,而不是随便一录音完了就不管了,然后后期再通过EQ再拉低频。
因为你提升的低频是在一个很薄的,很少低频共鸣的声音基础上去把这个现有的声音的低频的部分给做了一个提升,那是不自然、混浊的声音。
这样出来的声音能好听吗?混音应当是最后补救方案,不应该是优先解决问题的方式。
说人话就是,录的声音不好听,再后期也是扯。
立体声相位抵消: 相位叠加抵消这个概念我们都很熟悉了,这里就不再大费周章地解释这个概念了。但是你可能不了解的是立体声左右声道之间也会相互有部分相位抵消的情况发生。
所以数值-1, 0, 1到底分别是什么意思呢?
它是用来检查左右声道之间波形的相位关系的。
当数值完全正好为-1时,表明在当前时间轴上左右声道之间的波形完美相互呈180度的关系(Out of Phase)。假如把这两个波形进行相互叠加,则会相互抵消变成没有声音的状态。
当数值完全正好为0时,则说明当前时间轴上左右声道之间的波形完全不同。也就是说这两个波形之间无任何共同点*,是差异最大化的状态。理解到混音上则是目前立体声宽度最宽时的状态。
同时也是如果将两个波形进行叠加,不会发生任何抵消而只会增加的Correlation值的最低点,低于0就是抵消的开始,低至-1则是完全抵消。假如你是一个喜欢把混音做的很宽的人,那么尽量维持整首作品立体声母线的Correlation在差不多0的附近不远处浮动则是能够同时最小程度兼顾单声道兼容性,又能保持原有的混音宽度在立体声播放设备上重现时的最佳范围。
我觉得可以理解成是一个底线吧,因为假设你的作品只在夜店、酒吧等单身道音频遍地的地方播放的话那你本身就没必要做立体声,直接单声道进行混音就好了。
当数值完全正好为1时,意味着当前时间轴上左右声道之间的波形完全一样。也就是哪怕你有两个声道,但是输出的东西实际上在这一时刻完全是单声道的状态。如果相互进行叠加,只是把音量进行放大罢了。
所以这些概念与我的作品在手机上听起来难听有什么关系?
我想说的是这本身是一个很复杂的问题。
首先我们都知道立体声是有左右两个通道分别最终分别输出到左右两只监听音箱或者耳机上的。
这意味着哪怕两个通道的之间的波形相位完全相反,但是从两个音箱里播放你还是能够听到声音。因为两个波形分别独立地从左右两只音箱传播到空气中就已经发生了改变了,它们之间并不会发生非常完美的相位抵消。
但是这两个声音信号在系统里是完全相位相反的,所以它在空气中会在某一个点,特别是低频上会发生很明显部分相位抵消效应。
听起来就是声音会变得非常单薄,特别是在近距离听的时候。可能在你自己的监听设备上听起来还不是太差,可一旦这个听音环境变成非常恶劣的日常生活场景,这个问题就会被放大。
所以当混音在别的设备上变得非常难听时,你很有可能遭遇了比较严重的立体声相位抵消。
实际上声音在空气传播是一种很复杂的状态,这里很难一言两语将其涵盖完毕。
当声音以90度角撞击到你面前的墙壁时,反射回来的那部分声音它的波形相位状态刚好又是碰撞之前完全相反的。
回到话题,简单理解,说人话的时间: 我们只需要知道你应该尽可能让立体声母线上的Correlation Value大于0。
如果它频繁地小于0,同时又很接近-1的位置时,在单声道扬声器上播放时,它听起来一定就跟一团shit一样烂,而用立体声扬声器听起来同样有很大概率会挺糟糕的。
而手机扬声器绝大多数都是单声道的,立体声转单声道其实就是简单将左右声道的信号进行叠加整除2以后再通过扬声器功放播放出来。
所以当发生了严重的相位抵消,而音量又通过立体声转单身道之后本身就被降低了一半,所以听起来就会很小声,这不仅是手机扬声器频率响应的问题。
顺带科普一下立体声转单声道的简易的电路图你就明白了不是简单的左右声道捏一块就完了,这样整体信号有可能是原来的两倍的。
所以本来听起来还凑合的混音一到单声道上就很差劲了,一定要检查一下单声道的兼容性。看看立体声左右声道时间有无严重的相位抵消。
不仅仅是''为了单声道的兼容性'',也是为了在立体声放音设备上能更好的重现你的作品。
那如何修正有问题的相位关系呢?
最好的方式就是重新做混音,当然目前插件也是有解决方案的。
通过调节左右声道之间微小的延迟与EQ关系去修正相位问题,当然这货我不建议你整个往立体声母线上一丢去调整就完事了。
要么就分段式检查用类似Pro Tools上Audio Suite的这种破坏式编辑的方式去修正,要么就试下两两比对。
每次Solo两个轨道看下是哪两个轨道的声音在左右声道经常之间发生很矛盾。
这里我也想说明一个观点,我不认为你能在整首作品中能够完美的保证所有时间点都不会发生立体声相位抵消。事实上,简短偶尔的不严重的相位抵消是可以允许发生的。
本身以目前的科技,立体声放音设备就没有办法完全还原声音本来的模样。这也是这个时代我认为遇到的瓶颈吧。
你应该确保的是Correlation尽可能地绝大部分时间都在0-1之间的范围波动,偶尔掉到0以下哪怕有那么一次掉到-1我都不觉得是问题。
但是如果Correlation大部分时间在-1和0之前波动那么这一定是问题了,你需要去修正它,或者重做混音。
就这样,完啦。