一.基本概念
AAC:即MPEG-2 Advanced Audio Coding,分为流格式和文件格式。文件格式主要用于文件存储和文件播放,流格式主要用于流媒体在线播放。
文件格式:adif格式
adif格式
该格式特点:只有开头有一个头部信息,后面都是AAC裸数据。适应磁盘存储和文件播放
流格式:adts_frame格式
adts_frame格式
该格式特点:每一帧数据=固定头(fixed_header)+ 可变头(variable_header)+帧数据(raw_data),适合流媒体在线播放。
流式AAC可以简单理解如下图:
固定头如下:
syncword 同步字The bit string ‘1111 1111 1111’,说明一个ADTS帧的开始。
ID MPEG 标示符, 设置为1.
layer Indicates which layer is used. Set to ‘00’
protection_absent 表示是否误码校验
profile 表示使用哪个级别的AAC,如01 Low Complexity(LC)--- AACLC
sampling_frequency_index 表示使用的采样率下标
channel_configuration 表示声道数
frame_length 一个ADTS帧的长度包括ADTS头和raw data block.
可变头如下:
adts_buffer_fullness 0x7FF 说明是码率可变的码流
number_of_raw_data_blocks_in_frame
表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧.
所以说number_of_raw_data_blocks_in_frame == 0 表示说ADTS帧中有一个AAC数据块并不是说没有。
其他字段为定义,可以忽略,。
Raw数据块:
一个帧包含1024个采样
Duration算法:
一个AAC原始帧包含一段时间内1024个采样及相关数据。
一个AAC音频帧的播放时间=一个AAC帧对应的采样样本的个数/采样率。总时间t=总帧数x一个AAC音频帧的播放时间。
时间t=总帧数x一个AAC音频帧的播放时间。
二. 实战演练
1)使用ffmpeg抽取一个mp4文件中的aac音频如下:
ffmpeg.exe -i CCTV-2-dszg-1.mp4 -vn -y -acodec copy audio.aac
2)利用工具分析该aac音频固定头和可变头字段如下:
adts头解析
3)使用程序代码解析
#include "stdafx.h" #include<windows.h> typedef struct _AdtsHeader { unsigned int nSyncWord; unsigned int nId; unsigned int nLayer; unsigned int nProtectionAbsent; unsigned int nProfile; unsigned int nSfIndex; unsigned int nPrivateBit; unsigned int nChannelConfiguration; unsigned int nOriginal; unsigned int nHome; unsigned int nCopyrightIdentificationBit; unsigned int nCopyrigthIdentificationStart; unsigned int nAacFrameLength; unsigned int nAdtsBufferFullness; unsigned int nNoRawDataBlocksInFrame; } AdtsHeader; int _tmain(int argc, _TCHAR* argv[]) { FILE *fd = fopen("D:\\ffmpeg-4.1-tool\\bin\\audio.aac", "rb+"); if (fd == NULL) { printf("fopen is failed,err %d\n", GetLastError()); } char adts[7]; int adtslen = 7; int ret = fread(adts, adtslen, 1, fd); if (ret != 1) { printf("fread is failed,err %d\n", GetLastError()); } char *p = adts; GetAdtsSpecificConfig(p, &tAdtsHeader); printf("AAC key param: \n"); printf("id: %d\n", tAdtsHeader.nId); printf("layer: %d\n", tAdtsHeader.nLayer); printf("ProtectionAbsent: %d\n", tAdtsHeader.nProtectionAbsent); printf("Profile: %d\n", tAdtsHeader.nProfile); printf("SfIndex: %d\n", tAdtsHeader.nSfIndex); printf("PrivateBit: %d\n", tAdtsHeader.nPrivateBit); printf("ChannelConfiguration: %d\n", tAdtsHeader.nChannelConfiguration); printf("Original: %d\n", tAdtsHeader.nOriginal); printf("nHome: %d\n", tAdtsHeader.nHome); printf("nCopyrigthIdentificationStart: %d\n", tAdtsHeader.nCopyrigthIdentificationStart); printf("nAacFrameLength: %d\n", tAdtsHeader.nAacFrameLength); printf("nAdtsBufferFullness: %d\n", tAdtsHeader.nAdtsBufferFullness); printf("NoRawDataBlocksInFrame: %d\n", tAdtsHeader.nNoRawDataBlocksInFrame); getchar(); return 0; }
由此可见:代码读出来的参数和工具分析参数一致。