CN105448299A

CN105448299A - 一种鉴别数字音频aac格式编解码器的方法

Info

Publication number: CN105448299A
Application number: CN201510796684.5A
Authority: CN
Inventors: 杨锐; 王刚; 刘红梅
Original assignee: Shenzhen University; National Sun Yat Sen University
Current assignee: Shenzhen University; National Sun Yat Sen University
Priority date: 2015-11-17
Filing date: 2015-11-17
Publication date: 2016-03-30
Anticipated expiration: 2035-11-17
Also published as: CN105448299B

Abstract

本发明公开一种鉴别数字音频AAC编解码器的方法，是根据不同编解码器对同一音频在压缩时会产生不同编码结果而提出的统计判别方法，属于多媒体信号处理领域。本发明方法依据数字音频在压缩时MDCT系数会发生变化，进而导致Huffman编码的不同，不同编解码器会产生不同的编码结果。本发明方法正是将不同编解码器与同一编解码器的Huffman编码小值的差异组成特征值，再利用SVM分类器分类，对鉴别产生AAC格式的数字音频的编解码器有很好的效果。本发明可以作为鉴别产生AAC格式文件的编解码器的一种有效手段，可以广泛应用在编解码器的鉴别和音频取证方面。

Description

一种鉴别数字音频AAC格式编解码器的方法

技术领域

本发明涉及多媒体信号处理领域，具体涉及一种鉴别产生数字音频AAC格式的编解码器的分析方法。

背景技术

随着科学的不断发展，形形色色的多媒体成为人们日常生活中必不可少的一部分。存储空间小，音质效果好的AAC格式数字音频逐步取代mp3格式数字音频，占据主流地位。正是由于AAC格式数字音频的兴起，各种各样针对AAC格式数字音频的编解码器应运而生。种类繁杂的编解码器会产生不同的音质效果，但并不会留下明显的不同编解码器的痕迹，这种区别并不大，这在音频取证等方面如何有效的鉴别出产生AAC数字音频的编解码器提出了挑战。录音设备上的AAC编码器通常与音频编辑软件的编码器不一样，因此通过识别数字录音的编码器来鉴定该录音的原始性和真实性。

人们常用数字签名和水印技术来鉴别数字音频信息，然而不同编解码器产生AAC文件时并不一定会留下认证信息，这两种方法适用于事先知道待测音频和不同编解码器加密解密信息的情况，对现实生活中种类各样的编解码器产生AAC数字音频并且没留下任何信息的情况并不适用。

对产生AAC格式音频文件的编解码器进行鉴别，目前暂时还没发现有文献进行此类工作。

发明内容

为了克服上述现有技术的不足，本发明提出一种鉴别数字音频AAC格式编解码器的方法，用于分析判断鉴别产生数字音频AAC格式的编解码器；本发明是依据数字音频在压缩时MDCT系数会发生变化，进而导致Huffman编码的不同，不同的编解码器将产生不同的编码结果。本发明方法将不同编解码器与同一编解码器的Huffman编码小值的差异组成特征值，再利用SVM分类器分类，对鉴别产生AAC格式的数字音频的编解码器有很好的效果。

为了实现上述目的，本发明的技术方案为：

一种鉴别数字音频AAC格式编解码器的方法，步骤如下：

1）数字音频集的构造：

11）不同编解码器压缩一次AAC音频集的构造：首先从CD中选取无损的WAV格式文件，裁剪成若干10秒钟长度的音频片段，然后分别用不同编解码器以同一码率压缩成AAC格式的音频，取得不同编解码器压缩一次的AAC音频集；

12）同一编解码器再次压缩音频集的构造：对步骤11）中生成的AAC文件用同一编解码器进行解码得到WAV格式文件，再将它们用同一编解码器分别以相同的码率再次压缩成AAC文件，得到同一编解码器再次压缩的音频集；

2）音频集特征提取：

对上述得到的两种音频集，按以下方法提取特征：

21）对上述两种AAC音频集进行解码，两次解码都用同一编解码器进行，根据AAC标准，每帧提取1024个Huffman编码值；

22）统计每个音频片段中所有帧的Huffman编码值为0的个数，±1的个数和以及±2的个数和，然后除以帧数，得到平均每帧中0，±1，±2的个数，将平均每帧中0，±1，±2的个数称作Huffman小值；

23）依据步骤22）中的方法，用不同编解码器压缩一次音频片段的Huffman小值减去用同一编解码器再次压缩音频片段的Huffman小值，得到不同编解码器特征值；

3）分类器的构造：

将步骤2）中得到的不同编解码器特征值进行训练，得到一个能鉴别分析产生AAC音频信号的编解码器分类器模型Model；

4）鉴别待测音频：

首先，将待测音频用同一编解码器解码，得到Huffman小值；然后，将解码得到的音频文件再次用同一编解码器压缩成AAC文件，而后再解码，得到另一组Huffman小值；将这两组Huffman小值相减，组成待测音频特征值；最后，利用步骤3）中训练出来的Model进行鉴别；待测音频最接近哪一组编解码器的特征值，即判断产生待测音频的编解码器就是哪一种。

现在市场上流行各种各样的移动媒体和存储介质，对AAC数字音频采用的编解码器也各不相同。如在人们的生活中有各种各样的手机、电脑、平板、音乐播放器等等，怎样有效的鉴别出产生AAC格式数字音频的编解码器是十分困难的。对一个AAC数字音频信号，本发明通过分析其内在的本质特征以及不同的编解码器之间的差别，鉴定它是由哪一种编解码器产生。

附图说明

图1是本发明方法鉴别数字音频AAC编解码器流程图。

图2是AAC标准中解码流程图。

图3是不同编解码器压缩一次Huffman小值分布图。

图4是不同编解码器压缩一次与同一编解码器再次压缩Huffman小值差的分布图。

具体实施方式

下面结合附图对本发明方法作进一步说明。

本发明提出的一种鉴别数字音频AAC格式编解码器的方法，该方法鉴别待测音频是由哪一种编解码器产生的过程十分简单，如图1所示。对于输入未知是由哪一种编解码器产生的AAC格式的待测音频，首先，将其解码获得第一组Huffman小值。然后，将解码得到的文件再次压缩，再解码获得第二组Huffman小值。最后，将两次获得的Huffman小值做差组成待测音频的特征值，利用SVM分类器进行分类鉴别。具体步骤如下：

1）数字音频集的构造：

11）不同编解码器压缩一次AAC音频集的构造：首先选取无损WAV格式文件，包括中文歌曲、外文歌曲、戏曲、钢琴曲、摇滚、爵士、古典等等各种各样的音频文件，包含的范围尽可能广。将上述这些数字音频利用ffmpeg等音频编辑软件裁剪成若干10秒钟长度的音频片段，然后分别用不同编解码器以同一码率压缩成AAC格式的音频，取得不同编解码器压缩一次AAC音频集；

2）音频集特征提取：

对上述音频集中的每个音频片段，按以下方法提取特征：

由于两次解码都需要采用同一编解码器，在本实施例中利用比较流行的开源的fdk_aac(http://sourceforge.net/p/opencore-amr/fdk-aac/.)编解码器，通过在解码端增加少量代码即可输出Huffman编码值。而后利用功能强大的开源ffmpeg（https://ffmpeg.org/）对fdk_aac进行编译，即可在音频解码时输出Huffman编码值。

22）统计每个音频片段中所有帧的Huffman编码值分别为0的个数，±1的个数和以及±2的个数和，然后分别除以帧数，得到平均每帧中的0，±1，±2的个数。将平均每帧中0，±1，±2的个数称作“Huffman小值”。将20552个音频片段以64kbps码率分别利用不同编解码器进行编码一次，而后用fdk_aac解码，其huffman小值分布如图3所示。从图中可以看出，不同编解码器对同一音频片段编码的数据虽然各不相同，但是区别并不明显，不能很好的区分不同编解码器。

23）依据22）中的方法，分别用不同编解码器压缩一次音频片段的Huffman小值减去用同一编解码器再次压缩音频片段的Huffman小值，得到不同编解码器特征值。如图4所示，不同编解码器压缩一次与同一编解码器再次压缩音频片段Huffman小值的差统计分布。从图中可以明显的看出，随着压缩次数的增多，不同编解码器与同一编解码器的差有较好的区分效果，虽然用一个特征值还不能很好的鉴别不同编解码器，但是用0，±1，±2三个特征值就已经能得到较高的正确率。

3）分类器的构造：

将2）中得到的不同编解码器的特征值利用SVM分类器进行训练，得到一个能鉴别AAC格式的数字音频编解码器的分类器模型Model。

4）鉴别待测音频：

首先，将输入AAC格式的待测音频用fdkaac编解码器解码，根据AAC解码标准每帧得到1024个Huffman编码值。然后，将解码得到的音频文件再用fdkaac压缩，再用fdkaac解码得到另一组Huffman小值。将这两组Huffman小值相减，组成待测音频特征值。最后，利用3）中训练出来的Model进行鉴别，待测音频特征值与model中哪一组特征值最接近则判断该待测音频为对应的编解码器产生。

本发明方法的原理如下：

数字音频在压缩过程中谱线系数会发生变化，利用不同的编解码器产生的AAC格式数字音频的谱线系数不同，但区别并不明显。谱线系数也会随着压缩次数的变化而变化，通过选定同一编解码器进行再次压缩得到两次压缩的差异，对于鉴别AAC格式的数字音频编解码器有很好的效果。

下面给出本发明方法的一些实验结果。

从CD中取得无损的各种音乐文件，然后利用ffmpeg软件剪裁成20552个10秒钟的音频片段，采样率44100Hz，16bit。本文随机选择6种不同的AAC编解码器：aacenc，audition，faac，fairstars，ffmpeg，fdkaac进行试验。

首先，分别用这些编解码器以64kbps将上述无损的WAV音频片段压缩成AAC格式文件，从而得到压缩一次的数字音频集。

然后，利用fdkaac编解码器分别对上述压缩一次的音频集解码，得到不同编解码器压缩一次的Huffman小值。

其次，用fdkaac对上一步中解码得到的音频集进行再压缩后再解码，得到不同编解码器压缩一次后用同一编解码器再次压缩的Huffman小值。将这两组Huffman小值做差组成对应编解码器的特征值。

最后，将这6组不同编解码器特征值进行SVM训练，得到能鉴别待测音频编解码器的model。在鉴别待测音频时，比较待测音频的特征值是属于上述训练模型中的哪一组特征值的类型即可判断待测音频是由哪一种编解码器产生。

实验结果如下表所示：

表格一：不同编解码器

	aacenc	audition	faac	fairstars	ffmpeg	fdkaac
							aacenc	86.17%	0.01%	0.00%	0.58%	8.60%	4.63%
audition	0.00%	94.88%	0.00%	5.12%	0.00%	0.00%
							faac	0.05%	0.13%	98.99%	0.76%	0.00%	0.06%
fairstars	0.12%	1.41%	0.37%	98.02%	0.01%	0.07%
							ffmpeg	3.69%	0.01%	0.00%	0.00%	96.29%	0.00%
fdkaac	1.63%	0.08%	0.01%	0.32%	0.01%	97.95%

其中aacenc编解码器的编解码性能不稳定，编解码效果比较差，产生AAC格式数字音频的质量也相对不好，因此市场上用的并不多。从实验结果上看，本发明提出的方法可以十分有效的鉴别AAC数字音频编解码器。

Claims

1.一种鉴别数字音频AAC格式编解码器的方法，其特征在于，包括以下步骤：

1）数字音频集的构造：

11）不同编解码器压缩一次AAC音频集的构造：首先选取无损的WAV格式文件，裁剪成若干t秒钟长度的音频片段，然后分别用不同编解码器以同一码率压缩成AAC格式的音频，取得不同编解码器压缩一次AAC音频集；

2）音频集特征提取：

对上述得到的两种音频集，按以下方法提取特征：

23）依据步骤22）中的方法，用不同编解码器压缩一次音频片段的Huffman小值减去用同一编解码器再次压缩音频片段的Huffman小值，组成不同编解码器特征值；

3）分类器的构造：

4）鉴别待测音频：

首先，将待测音频用同一编解码器解码，得到Huffman小值；然后，将解码得到的音频文件再次用同一编解码器压缩成AAC文件，而后再解码，得到另一组Huffman小值；将这两组Huffman小值相减，组成待测音频特征值；最后，利用步骤3）中训练出来的Model进行鉴别；待测音频特征值最接近哪一组编解码器的特征值，则判断产生待测音频的编解码器就是哪一种。

2.根据权利要求1所述的方法，其特征在于，所述步骤3）中利用LibSVM分类器进行训练。