初级音视频开发技术2day

发布于 2023-03-10  592 次阅读


音频压缩

  1. 有损编码
    • 消除冗余信息
      • 人的听觉范围之外的音频信号。
      • 被掩盖掉的音频信号
        • 频域遮蔽
        • 时域遮蔽
  2. 无损编码
    • 熵编码
      • 哈夫曼编码
      • 算术编码
      • 香农编码

音频编码过程

时域转频域变换+心里声学模型--->量化编码-->比特格式化+辅助数据(可选)--->比特流

常见的音频编码器

opus、AAC、ogg、Speex、iLBC、AMR、G.711

opus:webRTC使用,近几年兴起;延迟小,压缩率高;

AAC:最广泛

ogg:收费

Speex:7、8年前广泛

G.711:用于固话,声音损耗严重;

ACC编码器

目的是取代MP3;常用规格:AAC LC、AAC HE V1、AAC HE V2;

AAC LC:(low complexity)地府再度规格,码流128k,音质好;

AAC HE:等于AAC LC + SBR(spectral band replication),其核心思想是按频谱分保存,低频编码保存主要成分,高频编码单独放大编码保存音质,码流64k。

AAC HE V2:等于AAC LC + SBR + PS(parametric stereo),核心思想是:双声道的声音存在某种相似性,只需要存储一个声道的全部信息,然后花很少的字节用参数描述另一个声道和它不同的地方;

AAC格式

ADIF(audio data Interchange format)特点是可以确定找到这个音频数据的开始,只能从头开始解码,不能再音频数据流中间开始,这种格式常用在磁盘文件中。

ADTS(audio data transport stream)特点是每一帧都有同步字,所以可以再音频流的任意位置开始解码,它类似于数据流的格式。由7或者9个字节组成。

  • alipay_img
  • wechat_img
届ける言葉を今は育ててる
最后更新于 2023-03-10