音频压缩
- 有损编码
- 消除冗余信息
- 人的听觉范围之外的音频信号。
- 被掩盖掉的音频信号
- 频域遮蔽
- 时域遮蔽
- 消除冗余信息
- 无损编码
- 熵编码
- 哈夫曼编码
- 算术编码
- 香农编码
- 熵编码
音频编码过程
时域转频域变换+心里声学模型--->量化编码-->比特格式化+辅助数据(可选)--->比特流
常见的音频编码器
opus、AAC、ogg、Speex、iLBC、AMR、G.711
opus:webRTC使用,近几年兴起;延迟小,压缩率高;
AAC:最广泛
ogg:收费
Speex:7、8年前广泛
G.711:用于固话,声音损耗严重;
ACC编码器
目的是取代MP3;常用规格:AAC LC、AAC HE V1、AAC HE V2;
AAC LC:(low complexity)地府再度规格,码流128k,音质好;
AAC HE:等于AAC LC + SBR(spectral band replication),其核心思想是按频谱分保存,低频编码保存主要成分,高频编码单独放大编码保存音质,码流64k。
AAC HE V2:等于AAC LC + SBR + PS(parametric stereo),核心思想是:双声道的声音存在某种相似性,只需要存储一个声道的全部信息,然后花很少的字节用参数描述另一个声道和它不同的地方;
AAC格式
ADIF(audio data Interchange format)特点是可以确定找到这个音频数据的开始,只能从头开始解码,不能再音频数据流中间开始,这种格式常用在磁盘文件中。
ADTS(audio data transport stream)特点是每一帧都有同步字,所以可以再音频流的任意位置开始解码,它类似于数据流的格式。由7或者9个字节组成。
Comments NOTHING