【音视频 | AAC】AAC格式音频文件解析
作者:mmseoamin日期:2024-02-02

😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀

🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C++、数据结构、音视频🍭

🤣本文内容🤣:🍭介绍AAC格式音频文件解析🍭

😎金句分享😎:🍭你不能选择最好的,但最好的会来选择你——泰戈尔🍭

本文未经允许,不得转发!!!

目录

  • 🎄一、概述
  • 🎄二、AAC文件分析
    • ✨2.1 ADTS帧
    • ✨2.2 AAC文件解析
    • 🎄三、解析AAC文件的C语言代码
    • 🎄四、总结

      【音视频 | AAC】AAC格式音频文件解析,在这里插入图片描述,第1张

      🎄一、概述

      现在较常使用的AAC文件格式是使用ADTS帧来保存的,本文介绍以ADTS格式的AAC文件的解析过程。主要分为两个部分,第一部分是用编辑器直接打开一个AAC文件来分析;第二部分是引用一个C语言代码来解析ADTS格式的AAC文件。

      关于AAC格式的一些基础知识,可以看上篇文章:【音视频 | AAC】AAC音频编码详解 。

      【音视频 | AAC】AAC格式音频文件解析,在这里插入图片描述,第2张

      🎄二、AAC文件分析

      本节使用编辑器打开一个AAC文件分析,分析前,先简单了解一下ADTS帧。

      ✨2.1 ADTS帧

      ADTS格式是AAC编码的其中一种格式,将整个AAC文件分成一个个ADTS帧,ADTS帧头一般是7个字节(没有CRC)或者9个字节(有CRC)。

      【音视频 | AAC】AAC格式音频文件解析,在这里插入图片描述,第3张

      ADTS头部又分为固定头部、可变头部,下面简单介绍ADTS头部的各个字段含义:

      固定头部各个字段解析:

      • syncword(12bit):所有的bit位都是1。总是0xFFF,代表一个ADTS帧的开始,作为分界符,用于同步每帧起始位置。
      • ID(1 bit):表示MPEG版本,0代表MPEG-4, 1代表MPEG-2,一般用 0,因为都是属于 MPEG 的规范.。
      • layer:占用 2 bit;一直是0;
      • protection_absent:占用 1 bit;设置 1 表示没有CRC,整个ADST头为7字节;0 表示有CRC,整个ADST头为9字节。
      • profile_ObjectType:占用 2 bit,表示使用的AAC规格(profile);

        该字段的解释取决于ID位的值。如果ID等于1,则该字段包含与ISO/IEC 13818-7中定义的ADTS流中的配置文件字段相同的信息,也就是MPEG-2的规格;当ID为0是表示的是MPEG-4的规格,该字段的值等于 Audio Object Type 的值减1。字段取值如下面图片的表格。

        【音视频 | AAC】AAC格式音频文件解析,在这里插入图片描述,第4张

      • sampling_frequency_index:占用 4 bit;表示采样率下标,字段取值及解释如下图:

        【音视频 | AAC】AAC格式音频文件解析,在这里插入图片描述,第5张

      • private_bit:占用 1 bit,编码时设置为0,解码时忽略;
      • channel_configuration:占用 3 bit;

        通道配置即声道数,一般 2 表示立体声双声道。更多的值参考下图:

      • original_copy:占用 1 bit,编码时设置为0,解码时忽略;
      • home:占用 1 bit,编码时设置为0,解码时忽略。

      可变头部字段解析:

      字段解析:

      • copyright_identification_bit:占用 1 bit,编码时设置为0,解码时忽略;
      • copyright_identification_start:占用 1 bit,编码时设置为0,解码时忽略;
      • frame_length:占用 13 bit,当前 ADTS 帧的长度,包括 ADTS 头(固定+可变)和 AAC 原始流,单位byte;
      • adts_buffer_fullness:占用 11 bit,0x7FF 表示码率可变的码流,0x000 表示固定码率的码流;
      • number_of_raw_data_blocks_in_frame:占用 2 bit;

        该字段表示当前ADST帧中所包含的AAC帧的个数减一。为了最大的兼容性通常每个ADTS frame 包含一个AAC frame,所以该值一般为0。一个AAC原始帧包含一段时间内1024个采样及相关数据

      ✨2.2 AAC文件解析

      下图是用编辑器打开一个AAC文件,用十六进制查看的截图:

      【音视频 | AAC】AAC格式音频文件解析,在这里插入图片描述,第6张

      没有CRC的情况下,文件开头的7个字节是ADTS帧头部,这里7个字节的数据是:0xff 0xf1 0x4c 0x80 0x20 0x02 0x80,我们按照ADTS帧的头部数据来解析看看这7个字节表示什么?

      • 前面1-12bit为 0xff 0xf,对应了ADTS头部的 syncword 字段,表示ADTS帧的开始。
      • 13-16bit为0x01,二进制是 0001,也就是说

        ID的1bit为0(MPEG-4);

        layer的2bit为00;

        protection_absent的1bit为1,表示没有CRC,整个头部7个字节。

      • 17-24bit为0x4c,二进制是 0100 1100,意思是

        profile_ObjectType的2bit为 01,结合前面ID为0,表示MPEG-4 AAC LC 规格;

        sampling_frequency_index的4bit为0011,也就是0x3,表示采样率为48000;

        private_bit的1bit为0;

        剩余1bit,结合后面的再看;

      • 25-32bit为0x80,二进制是 1000 0000,意思是

        channel_configuration的3bit(结合前面剩下的1bit)为 010,表示双声道;

        original_copy的1bit为0;

        home的1bit为0;

        copyright_identification_bit的1bit为0;

        copyright_identification_start的1bit为0;

        剩余2bit,结合下个字段再看;

      • 33-44bit为0x200,二进制是 0010 0000 0000,加上前面剩下的2bit,就是00 0010 0000 0000:

        frame_length的13bit为00 0010 0000 000,也就是0x100,表示这个ADTS帧的长度是0x100;那么下个ADTS就是0x100开始的;

        剩余1bit,留到下个字段再看;

      • 45-56bit为0x280,二进制是 0010 1000 0000,加上前面剩下的1bit,就是 0 0010 1000 0000:

        adts_buffer_fullness的11bit为 0 0010 1000 00,十六进制0xa0;(目前不知道有什么作用2023-12-20 19:34:07)

        number_of_raw_data_blocks_in_frame的2bit为 00,表示包含一个AAC frame。

        后面的ADTS帧也可以类似上面的过程去解析。frame_length是代表了整个ADTS的大小。

        【音视频 | AAC】AAC格式音频文件解析,在这里插入图片描述,第7张

        🎄三、解析AAC文件的C语言代码

        代码来源于:视音频数据处理入门:AAC音频码流解析

        /**
         * 最简单的视音频数据处理示例
         * Simplest MediaData Test
         *
         * 雷霄骅 Lei Xiaohua
         * leixiaohua1020@126.com
         * 中国传媒大学/数字电视技术
         * Communication University of China / Digital TV Technology
         * http://blog.csdn.net/leixiaohua1020
         *
         * 本项目包含如下几种视音频测试示例:
         *  (1)像素数据处理程序。包含RGB和YUV像素格式处理的函数。
         *  (2)音频采样数据处理程序。包含PCM音频采样格式处理的函数。
         *  (3)H.264码流分析程序。可以分离并解析NALU。
         *  (4)AAC码流分析程序。可以分离并解析ADTS帧。
         *  (5)FLV封装格式分析程序。可以将FLV中的MP3音频码流分离出来。
         *  (6)UDP-RTP协议分析程序。可以将分析UDP/RTP/MPEG-TS数据包。
         *
         * This project contains following samples to handling multimedia data:
         *  (1) Video pixel data handling program. It contains several examples to handle RGB and YUV data.
         *  (2) Audio sample data handling program. It contains several examples to handle PCM data.
         *  (3) H.264 stream analysis program. It can parse H.264 bitstream and analysis NALU of stream.
         *  (4) AAC stream analysis program. It can parse AAC bitstream and analysis ADTS frame of stream.
         *  (5) FLV format analysis program. It can analysis FLV file and extract MP3 audio stream.
         *  (6) UDP-RTP protocol analysis program. It can analysis UDP/RTP/MPEG-TS Packet.
         *
         */
        #include 
        #include 
        #include 
        int getADTSframe(unsigned char* buffer, int buf_size, unsigned char* data ,int* data_size){
        	int size = 0;
        	if(!buffer || !data || !data_size ){
        		return -1;
        	}
        	while(1){
        		if(buf_size  < 7 ){
        			return -1;
        		}
        		//Sync words
        		if((buffer[0] == 0xff) && ((buffer[1] & 0xf0) == 0xf0) ){
        			size |= ((buffer[3] & 0x03) <<11);     //high 2 bit
        			size |= buffer[4]<<3;                //middle 8 bit
        			size |= ((buffer[5] & 0xe0)>>5);        //low 3bit
        			break;
        		}
        		--buf_size;
        		++buffer;
        	}
        	if(buf_size < size){
        		return 1;
        	}
        	memcpy(data, buffer, size);
        	*data_size = size;
        	return 0;
        }
        int simplest_aac_parser(char *url)
        {
        	int data_size = 0;
        	int size = 0;
        	int cnt=0;
        	int offset=0;
        	//FILE *myout=fopen("output_log.txt","wb+");
        	FILE *myout=stdout;
        	unsigned char *aacframe=(unsigned char *)malloc(1024*5);
        	unsigned char *aacbuffer=(unsigned char *)malloc(1024*1024);
        	FILE *ifile = fopen(url, "rb");
        	if(!ifile){
        		printf("Open file error\n");
        		return -1;
        	}
        	printf("-----+- ADTS Frame Table -+------+\n");
        	printf(" NUM | Profile | Frequency| Size |\n");
        	printf("-----+---------+----------+------+\n");
        	while(!feof(ifile)){
        		data_size = fread(aacbuffer+offset, 1, 1024*1024-offset, ifile);
        		unsigned char* input_data = aacbuffer;
        		while(1)
        		{
        			int ret=getADTSframe(input_data, data_size, aacframe, &size);
        			if(ret==-1){
        				break;
        			}else if(ret==1){
        				memcpy(aacbuffer,input_data,data_size);
        				offset=data_size;
        				break;
        			}
        			char profile_str[10]={0};
        			char frequence_str[10]={0};
        			unsigned char profile=aacframe[2]&0xC0;
        			profile=profile>>6;
        			switch(profile){
        			case 0: sprintf(profile_str,"Main");break;
        			case 1: sprintf(profile_str,"LC");break;
        			case 2: sprintf(profile_str,"SSR");break;
        			default:sprintf(profile_str,"unknown");break;
        			}
        			unsigned char sampling_frequency_index=aacframe[2]&0x3C;
        			sampling_frequency_index=sampling_frequency_index>>2;
        			switch(sampling_frequency_index){
        			case 0: sprintf(frequence_str,"96000Hz");break;
        			case 1: sprintf(frequence_str,"88200Hz");break;
        			case 2: sprintf(frequence_str,"64000Hz");break;
        			case 3: sprintf(frequence_str,"48000Hz");break;
        			case 4: sprintf(frequence_str,"44100Hz");break;
        			case 5: sprintf(frequence_str,"32000Hz");break;
        			case 6: sprintf(frequence_str,"24000Hz");break;
        			case 7: sprintf(frequence_str,"22050Hz");break;
        			case 8: sprintf(frequence_str,"16000Hz");break;
        			case 9: sprintf(frequence_str,"12000Hz");break;
        			case 10: sprintf(frequence_str,"11025Hz");break;
        			case 11: sprintf(frequence_str,"8000Hz");break;
        			default:sprintf(frequence_str,"unknown");break;
        			}
        			fprintf(myout,"%5d| %8s|  %8s| %5d|\n",cnt,profile_str ,frequence_str,size);
        			data_size -= size;
        			input_data += size;
        			cnt++;
        		}   
        	}
        	fclose(ifile);
        	free(aacbuffer);
        	free(aacframe);
        	return 0;
        }
        int main()
        {
        	simplest_aac_parser((char*)"./audio_chn0.aac");
        	return 0;
        }
        

        保存后, gcc simplest_mediadata_aac.cpp编译,运行结果:

        【音视频 | AAC】AAC格式音频文件解析,在这里插入图片描述,第8张

        【音视频 | AAC】AAC格式音频文件解析,在这里插入图片描述,第9张

        🎄四、总结

        👉本文介绍用编辑器打开aac文件,怎样去分析,了解后,可以对aac文件有更深的认识。最后,借鉴了一份解析aac文件的源码。

        【音视频 | AAC】AAC格式音频文件解析,在这里插入图片描述,第10张

        如果文章有帮助的话,点赞👍、收藏⭐,支持一波,谢谢 😁😁😁

        参考资料:

        视音频数据处理入门:AAC音频码流解析