百科问答小站 logo
百科问答小站 font logo



无损音乐在人耳听力范围外的频率有意义吗? 第1页

  

user avatar   meng-yu-ling-quan 网友的相关建议: 
      

把楼中楼回复拿出来,给题主一个参考吧,说得通俗一点,有些概念不很精确,领会精神就好

320k是每秒的文件大小,并不是采样率。。。。完全等同这属于基本原理错误,因为奈奎斯特定律的二倍原因,要记录频率20khz的声音,那么主流音频文件采样率都是40khz以上的,一般有44.1khz,48khz,96khz,192khz几种,越是采样高,高频差拍控制就越好,如果题主拍过照片就知道拍照条纹多了会产生摩尔纹纱窗效应,音频也是一样,如果采样源太密,就会在采样结果的高频产生类似摩尔纹的干扰,所以要提升采样的“时间节点细致程度”,让采样的频次比原音频次高一倍以上,就不会出现“摩尔纹”

但这和文件码率是两回事儿,当然了文件码率是采样率的必要基础,如果你采样率超高但文件码率固定在超低水平,就会导致同采样频率下每次采样的细节大大损失

这是因为

音频采样和其他信息采样一样,都是由采样频率和位深,也就是所谓bit值决定的,采样频率决定采样精度,即一个波形,采样精度越高,模拟波形越平滑,而位深决定了你采样结果本身实际内容反应在动态范围的上下限,每一位bit能够精确记录6db的声音,那么要满足足够大的动态范围,就需要增加每一个采样点的bit容量,16bit就是96db,记录一般乐音,这个动态范围就够了,但如果有更高要求,就要增加动态范围宽容性,减少采样源本来的大动态因为动态范围压缩造成的动态失真

总的来说就是

采样精度决定波形沿着时间截取得细致不细致,是横轴

而bit位深决定了动态范围,也就是非失真的响度变化,也就是波形上下的反差值包容性,也就是说如果bit位深只有0位,也就是1个自由度,那么不管你采样多细致,每个采样单位的自由度也只有一个,如果bit位深是2,那么就是四个动态范围自由度,那么越高,越精细,能够反映的动态变化也就越自然,越顺滑,所以是纵轴

如下图所示,横轴是time,那么采样率越高,就越在横轴方向上把时间分得越细

而纵轴方向上,16bit就只有96db级,如果是24bit就有114db的纵轴信息量

横纵轴的越精细划分,数字采样就越接近原始波形

而如果是一个采样率和采样bit都确定规格的格式下的无损,就好像是预先确定好的棋盘一样,如果是无损全纪录,那么即使是空音也要占据空间,就好像拍照片黑位也要占据像素一个道理

而这样的“棋盘”要把棋子放进去,就成了音乐文件,我们叫它PCM,它的大小一定是固定的,比如常见的CD音质,就是由16bit位深和44.1khz采样所决定的 44.1×16×2(声道)=1411.2kbps

而如果想要压缩,就要找到算法用更好的语句把这个一格一格记录下来的棋盘概括出来形成一个文件

而完全概括的就叫无损,不能完全概括必须牺牲一部分信息的就叫有损

所以“无损”只是针对一种方式的采样结果来说的,而采样本身必然是有损的,比如说44khz格式下就只能相对完整记录22khz的声音,其上的部分还是要串扰,所以就仍然要低通滤波把22khz以上频率的声音滤掉

这是基本原理

你需要理解了这个,再去思考什么MP3削了什么频率的问题

实际上,就用上面的话来解释,比如说如果PCM是一张棋盘,如果直接的文件语句表述就必须把黑子白子每个位置的状况全部复述一遍,这显然太麻烦

那么压缩算法实际上就相当于“换个说法来解释这个棋盘”,然后在通过解码方式把棋盘还原出来

比如说,“第一横列除了纵6之外全是黑子没有空位”,“一6和六14连接对角线决定的长方形里完全空位”之类的语句,就能用较小的信息量高度概括棋盘态势,音频压缩的处理方式与之类似

实际上视频压缩也是这么处理的

但是如果棋盘精度太高,而我们只需要一个在我们更加敏感的部分留有印象,就可以把浪费文件解释语句空间的超高精度同时我们也不是很在乎的部分剔除掉,然后再去解释这个棋盘,这就是Mp3了

下面看看mp3是怎么剔除的

这是44.1 16bit无损采样的声谱图,可以看到实际上记录的22k的信息符合奈奎斯特定律的二倍记录精度,切口很齐,实际上之上仍然是有声谱的,但是因为上面说过的原因,如果记录会产生差拍串扰,所以被滤波掉了——这也是我说得无损只是针对采样结果本身,而对于采样源,只要确定了采样方式,就肯定是“有损的”


而这是最高码率(320)MP3声谱分析图,可以看到20k之上的部分全部被切下去了

那么下一个问题,这个切下去的部分是不是那么重要?这里面还有编码方式压缩方法的问题,再看这个图

这个声谱,除了正常的20k切断之外,为了进一步压缩高频采样占据的空间,在16khz的地方也出现了一个不自然的声音密度突然下降,而高频声音比重更大的乐音,比如小提琴的泛音,在这个频率就属于基本可感知范围了,这是梁祝的声谱


一般而言如果题主换一个好耳机做一个频率发生测试,会发现14-16khz是会有听觉反馈的

而更低的码率压缩的高频阈值更低,影响就会更加严重

本质上说,这些东西对你是否重要,要经过解码播放设备和扬声回放设备的水平限定之后,再看你在两方面是不是有需求,一是你的耳朵是不是足够敏感,二是即使你的耳朵足够敏感,你自己对这些细节带来的乐音美感是否在意




  

相关话题

  换耳放让耳机的“声场”变大了,是不是只是改变了频响导致的? 
  是否现在大多数「HiFi 发烧友」都只听过高档耳机而没听过高档音响? 
  有没有什么可以解DSD的解码器? 
  如何评价森海塞尔最新发布的奥菲斯二代静电耳机? 
  什么是HiFi圈里经常出现的“素质”? 
  为什么现在年轻人玩hifi都玩耳机而很少烧音箱? 
  4.4平衡口和一般的3.5耳机口有什么区别,音效真的好些吗? 
  人的听觉范围是 20 Hz ~ 20 kHz,但部分耳机的频响范围会超过 20 kHz,有什么意义? 
  未来商家会不会都把耳机的频响曲线做平,然后完全通过 EQ 调整音感? 
  耳机的声场有没有讨论的必要? 

前一个讨论
在校生为了面试,有必要强行记住一些复杂算法如红黑树、KMP等的实现吗?
下一个讨论
Web 前端密码加密是否有意义?





© 2024-11-24 - tinynew.org. All Rights Reserved.
© 2024-11-24 - tinynew.org. 保留所有权利