CN105448299A - 一种鉴别数字音频aac格式编解码器的方法 - Google Patents
一种鉴别数字音频aac格式编解码器的方法 Download PDFInfo
- Publication number
- CN105448299A CN105448299A CN201510796684.5A CN201510796684A CN105448299A CN 105448299 A CN105448299 A CN 105448299A CN 201510796684 A CN201510796684 A CN 201510796684A CN 105448299 A CN105448299 A CN 105448299A
- Authority
- CN
- China
- Prior art keywords
- codec
- audio
- aac
- huffman
- different
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 239000012634 fragment Substances 0.000 claims description 18
- 238000007906 compression Methods 0.000 claims description 15
- 230000006835 compression Effects 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 5
- 238000012545 processing Methods 0.000 abstract description 2
- 238000012850 discrimination method Methods 0.000 abstract 1
- 239000000203 mixture Substances 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开一种鉴别数字音频AAC编解码器的方法,是根据不同编解码器对同一音频在压缩时会产生不同编码结果而提出的统计判别方法,属于多媒体信号处理领域。本发明方法依据数字音频在压缩时MDCT系数会发生变化,进而导致Huffman编码的不同,不同编解码器会产生不同的编码结果。本发明方法正是将不同编解码器与同一编解码器的Huffman编码小值的差异组成特征值,再利用SVM分类器分类,对鉴别产生AAC格式的数字音频的编解码器有很好的效果。本发明可以作为鉴别产生AAC格式文件的编解码器的一种有效手段,可以广泛应用在编解码器的鉴别和音频取证方面。
Description
技术领域
本发明涉及多媒体信号处理领域,具体涉及一种鉴别产生数字音频AAC格式的编解码器的分析方法。
背景技术
随着科学的不断发展,形形色色的多媒体成为人们日常生活中必不可少的一部分。存储空间小,音质效果好的AAC格式数字音频逐步取代mp3格式数字音频,占据主流地位。正是由于AAC格式数字音频的兴起,各种各样针对AAC格式数字音频的编解码器应运而生。种类繁杂的编解码器会产生不同的音质效果,但并不会留下明显的不同编解码器的痕迹,这种区别并不大,这在音频取证等方面如何有效的鉴别出产生AAC数字音频的编解码器提出了挑战。录音设备上的AAC编码器通常与音频编辑软件的编码器不一样,因此通过识别数字录音的编码器来鉴定该录音的原始性和真实性。
人们常用数字签名和水印技术来鉴别数字音频信息,然而不同编解码器产生AAC文件时并不一定会留下认证信息,这两种方法适用于事先知道待测音频和不同编解码器加密解密信息的情况,对现实生活中种类各样的编解码器产生AAC数字音频并且没留下任何信息的情况并不适用。
对产生AAC格式音频文件的编解码器进行鉴别,目前暂时还没发现有文献进行此类工作。
发明内容
为了克服上述现有技术的不足,本发明提出一种鉴别数字音频AAC格式编解码器的方法,用于分析判断鉴别产生数字音频AAC格式的编解码器;本发明是依据数字音频在压缩时MDCT系数会发生变化,进而导致Huffman编码的不同,不同的编解码器将产生不同的编码结果。本发明方法将不同编解码器与同一编解码器的Huffman编码小值的差异组成特征值,再利用SVM分类器分类,对鉴别产生AAC格式的数字音频的编解码器有很好的效果。
为了实现上述目的,本发明的技术方案为:
一种鉴别数字音频AAC格式编解码器的方法,步骤如下:
1)数字音频集的构造:
11)不同编解码器压缩一次AAC音频集的构造:首先从CD中选取无损的WAV格式文件,裁剪成若干10秒钟长度的音频片段,然后分别用不同编解码器以同一码率压缩成AAC格式的音频,取得不同编解码器压缩一次的AAC音频集;
12)同一编解码器再次压缩音频集的构造:对步骤11)中生成的AAC文件用同一编解码器进行解码得到WAV格式文件,再将它们用同一编解码器分别以相同的码率再次压缩成AAC文件,得到同一编解码器再次压缩的音频集;
2)音频集特征提取:
对上述得到的两种音频集,按以下方法提取特征:
21)对上述两种AAC音频集进行解码,两次解码都用同一编解码器进行,根据AAC标准,每帧提取1024个Huffman编码值;
22)统计每个音频片段中所有帧的Huffman编码值为0的个数,±1的个数和以及±2的个数和,然后除以帧数,得到平均每帧中0,±1,±2的个数,将平均每帧中0,±1,±2的个数称作Huffman小值;
23)依据步骤22)中的方法,用不同编解码器压缩一次音频片段的Huffman小值减去用同一编解码器再次压缩音频片段的Huffman小值,得到不同编解码器特征值;
3)分类器的构造:
将步骤2)中得到的不同编解码器特征值进行训练,得到一个能鉴别分析产生AAC音频信号的编解码器分类器模型Model;
4)鉴别待测音频:
首先,将待测音频用同一编解码器解码,得到Huffman小值;然后,将解码得到的音频文件再次用同一编解码器压缩成AAC文件,而后再解码,得到另一组Huffman小值;将这两组Huffman小值相减,组成待测音频特征值;最后,利用步骤3)中训练出来的Model进行鉴别;待测音频最接近哪一组编解码器的特征值,即判断产生待测音频的编解码器就是哪一种。
现在市场上流行各种各样的移动媒体和存储介质,对AAC数字音频采用的编解码器也各不相同。如在人们的生活中有各种各样的手机、电脑、平板、音乐播放器等等,怎样有效的鉴别出产生AAC格式数字音频的编解码器是十分困难的。对一个AAC数字音频信号,本发明通过分析其内在的本质特征以及不同的编解码器之间的差别,鉴定它是由哪一种编解码器产生。
附图说明
图1是本发明方法鉴别数字音频AAC编解码器流程图。
图2是AAC标准中解码流程图。
图3是不同编解码器压缩一次Huffman小值分布图。
图4是不同编解码器压缩一次与同一编解码器再次压缩Huffman小值差的分布图。
具体实施方式
下面结合附图对本发明方法作进一步说明。
本发明提出的一种鉴别数字音频AAC格式编解码器的方法,该方法鉴别待测音频是由哪一种编解码器产生的过程十分简单,如图1所示。对于输入未知是由哪一种编解码器产生的AAC格式的待测音频,首先,将其解码获得第一组Huffman小值。然后,将解码得到的文件再次压缩,再解码获得第二组Huffman小值。最后,将两次获得的Huffman小值做差组成待测音频的特征值,利用SVM分类器进行分类鉴别。具体步骤如下:
1)数字音频集的构造:
11)不同编解码器压缩一次AAC音频集的构造:首先选取无损WAV格式文件,包括中文歌曲、外文歌曲、戏曲、钢琴曲、摇滚、爵士、古典等等各种各样的音频文件,包含的范围尽可能广。将上述这些数字音频利用ffmpeg等音频编辑软件裁剪成若干10秒钟长度的音频片段,然后分别用不同编解码器以同一码率压缩成AAC格式的音频,取得不同编解码器压缩一次AAC音频集;
12)同一编解码器再次压缩音频集的构造:对步骤11)中生成的AAC文件用同一编解码器进行解码得到WAV格式文件,再将它们用同一编解码器分别以相同的码率再次压缩成AAC文件,得到同一编解码器再次压缩的音频集;
2)音频集特征提取:
对上述音频集中的每个音频片段,按以下方法提取特征:
21)对上述两种AAC音频集进行解码,两次解码都用同一编解码器进行,根据AAC标准,每帧提取1024个Huffman编码值;
由于两次解码都需要采用同一编解码器,在本实施例中利用比较流行的开源的fdk_aac(http://sourceforge.net/p/opencore-amr/fdk-aac/.)编解码器,通过在解码端增加少量代码即可输出Huffman编码值。而后利用功能强大的开源ffmpeg(https://ffmpeg.org/)对fdk_aac进行编译,即可在音频解码时输出Huffman编码值。
22)统计每个音频片段中所有帧的Huffman编码值分别为0的个数,±1的个数和以及±2的个数和,然后分别除以帧数,得到平均每帧中的0,±1,±2的个数。将平均每帧中0,±1,±2的个数称作“Huffman小值”。将20552个音频片段以64kbps码率分别利用不同编解码器进行编码一次,而后用fdk_aac解码,其huffman小值分布如图3所示。从图中可以看出,不同编解码器对同一音频片段编码的数据虽然各不相同,但是区别并不明显,不能很好的区分不同编解码器。
23)依据22)中的方法,分别用不同编解码器压缩一次音频片段的Huffman小值减去用同一编解码器再次压缩音频片段的Huffman小值,得到不同编解码器特征值。如图4所示,不同编解码器压缩一次与同一编解码器再次压缩音频片段Huffman小值的差统计分布。从图中可以明显的看出,随着压缩次数的增多,不同编解码器与同一编解码器的差有较好的区分效果,虽然用一个特征值还不能很好的鉴别不同编解码器,但是用0,±1,±2三个特征值就已经能得到较高的正确率。
3)分类器的构造:
将2)中得到的不同编解码器的特征值利用SVM分类器进行训练,得到一个能鉴别AAC格式的数字音频编解码器的分类器模型Model。
4)鉴别待测音频:
首先,将输入AAC格式的待测音频用fdkaac编解码器解码,根据AAC解码标准每帧得到1024个Huffman编码值。然后,将解码得到的音频文件再用fdkaac压缩,再用fdkaac解码得到另一组Huffman小值。将这两组Huffman小值相减,组成待测音频特征值。最后,利用3)中训练出来的Model进行鉴别,待测音频特征值与model中哪一组特征值最接近则判断该待测音频为对应的编解码器产生。
本发明方法的原理如下:
数字音频在压缩过程中谱线系数会发生变化,利用不同的编解码器产生的AAC格式数字音频的谱线系数不同,但区别并不明显。谱线系数也会随着压缩次数的变化而变化,通过选定同一编解码器进行再次压缩得到两次压缩的差异,对于鉴别AAC格式的数字音频编解码器有很好的效果。
下面给出本发明方法的一些实验结果。
从CD中取得无损的各种音乐文件,然后利用ffmpeg软件剪裁成20552个10秒钟的音频片段,采样率44100Hz,16bit。本文随机选择6种不同的AAC编解码器:aacenc,audition,faac,fairstars,ffmpeg,fdkaac进行试验。
首先,分别用这些编解码器以64kbps将上述无损的WAV音频片段压缩成AAC格式文件,从而得到压缩一次的数字音频集。
然后,利用fdkaac编解码器分别对上述压缩一次的音频集解码,得到不同编解码器压缩一次的Huffman小值。
其次,用fdkaac对上一步中解码得到的音频集进行再压缩后再解码,得到不同编解码器压缩一次后用同一编解码器再次压缩的Huffman小值。将这两组Huffman小值做差组成对应编解码器的特征值。
最后,将这6组不同编解码器特征值进行SVM训练,得到能鉴别待测音频编解码器的model。在鉴别待测音频时,比较待测音频的特征值是属于上述训练模型中的哪一组特征值的类型即可判断待测音频是由哪一种编解码器产生。
实验结果如下表所示:
表格一:不同编解码器
aacenc | audition | faac | fairstars | ffmpeg | fdkaac | |
aacenc | 86.17% | 0.01% | 0.00% | 0.58% | 8.60% | 4.63% |
audition | 0.00% | 94.88% | 0.00% | 5.12% | 0.00% | 0.00% |
faac | 0.05% | 0.13% | 98.99% | 0.76% | 0.00% | 0.06% |
fairstars | 0.12% | 1.41% | 0.37% | 98.02% | 0.01% | 0.07% |
ffmpeg | 3.69% | 0.01% | 0.00% | 0.00% | 96.29% | 0.00% |
fdkaac | 1.63% | 0.08% | 0.01% | 0.32% | 0.01% | 97.95% |
其中aacenc编解码器的编解码性能不稳定,编解码效果比较差,产生AAC格式数字音频的质量也相对不好,因此市场上用的并不多。从实验结果上看,本发明提出的方法可以十分有效的鉴别AAC数字音频编解码器。
Claims (2)
1.一种鉴别数字音频AAC格式编解码器的方法,其特征在于,包括以下步骤:
1)数字音频集的构造:
11)不同编解码器压缩一次AAC音频集的构造:首先选取无损的WAV格式文件,裁剪成若干t秒钟长度的音频片段,然后分别用不同编解码器以同一码率压缩成AAC格式的音频,取得不同编解码器压缩一次AAC音频集;
12)同一编解码器再次压缩音频集的构造:对步骤11)中生成的AAC文件用同一编解码器进行解码得到WAV格式文件,再将它们用同一编解码器分别以相同的码率再次压缩成AAC文件,得到同一编解码器再次压缩的音频集;
2)音频集特征提取:
对上述得到的两种音频集,按以下方法提取特征:
21)对上述两种AAC音频集进行解码,两次解码都用同一编解码器进行,根据AAC标准,每帧提取1024个Huffman编码值;
22)统计每个音频片段中所有帧的Huffman编码值为0的个数,±1的个数和以及±2的个数和,然后除以帧数,得到平均每帧中0,±1,±2的个数,将平均每帧中0,±1,±2的个数称作Huffman小值;
23)依据步骤22)中的方法,用不同编解码器压缩一次音频片段的Huffman小值减去用同一编解码器再次压缩音频片段的Huffman小值,组成不同编解码器特征值;
3)分类器的构造:
将步骤2)中得到的不同编解码器特征值进行训练,得到一个能鉴别分析产生AAC音频信号的编解码器分类器模型Model;
4)鉴别待测音频:
首先,将待测音频用同一编解码器解码,得到Huffman小值;然后,将解码得到的音频文件再次用同一编解码器压缩成AAC文件,而后再解码,得到另一组Huffman小值;将这两组Huffman小值相减,组成待测音频特征值;最后,利用步骤3)中训练出来的Model进行鉴别;待测音频特征值最接近哪一组编解码器的特征值,则判断产生待测音频的编解码器就是哪一种。
2.根据权利要求1所述的方法,其特征在于,所述步骤3)中利用LibSVM分类器进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510796684.5A CN105448299B (zh) | 2015-11-17 | 2015-11-17 | 一种鉴别数字音频aac格式编解码器的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510796684.5A CN105448299B (zh) | 2015-11-17 | 2015-11-17 | 一种鉴别数字音频aac格式编解码器的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105448299A true CN105448299A (zh) | 2016-03-30 |
CN105448299B CN105448299B (zh) | 2019-04-05 |
Family
ID=55558405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510796684.5A Expired - Fee Related CN105448299B (zh) | 2015-11-17 | 2015-11-17 | 一种鉴别数字音频aac格式编解码器的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105448299B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5727124A (en) * | 1994-06-21 | 1998-03-10 | Lucent Technologies, Inc. | Method of and apparatus for signal recognition that compensates for mismatching |
US20080262852A1 (en) * | 2005-10-05 | 2008-10-23 | Lg Electronics, Inc. | Method and Apparatus For Signal Processing and Encoding and Decoding Method, and Apparatus Therefor |
CN101562016A (zh) * | 2009-05-26 | 2009-10-21 | 上海大学 | 一种全盲的数字语音认证方法 |
CN102547371A (zh) * | 2012-02-27 | 2012-07-04 | 中山大学 | 一种基于h.264/avc视频二次压缩检测方法 |
CN103187066A (zh) * | 2012-01-03 | 2013-07-03 | 摩托罗拉移动有限责任公司 | 处理音频帧以在不同编解码器之间转变的方法和装置 |
CN103871405A (zh) * | 2014-01-14 | 2014-06-18 | 中山大学 | 一种amr音频的鉴定方法 |
-
2015
- 2015-11-17 CN CN201510796684.5A patent/CN105448299B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5727124A (en) * | 1994-06-21 | 1998-03-10 | Lucent Technologies, Inc. | Method of and apparatus for signal recognition that compensates for mismatching |
US20080262852A1 (en) * | 2005-10-05 | 2008-10-23 | Lg Electronics, Inc. | Method and Apparatus For Signal Processing and Encoding and Decoding Method, and Apparatus Therefor |
CN101562016A (zh) * | 2009-05-26 | 2009-10-21 | 上海大学 | 一种全盲的数字语音认证方法 |
CN103187066A (zh) * | 2012-01-03 | 2013-07-03 | 摩托罗拉移动有限责任公司 | 处理音频帧以在不同编解码器之间转变的方法和装置 |
CN102547371A (zh) * | 2012-02-27 | 2012-07-04 | 中山大学 | 一种基于h.264/avc视频二次压缩检测方法 |
CN103871405A (zh) * | 2014-01-14 | 2014-06-18 | 中山大学 | 一种amr音频的鉴定方法 |
Non-Patent Citations (1)
Title |
---|
RUI YANG ET AL: "detecting double compression of audio signal", 《PROCEEDINGS OF SPIE》 * |
Also Published As
Publication number | Publication date |
---|---|
CN105448299B (zh) | 2019-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chou et al. | Robust singing detection in speech/music discriminator design | |
Herre et al. | Robust matching of audio signals using spectral flatness features | |
US7460994B2 (en) | Method and apparatus for producing a fingerprint, and method and apparatus for identifying an audio signal | |
JP5440051B2 (ja) | コンテンツ同定方法、コンテンツ同定システム、コンテンツ検索装置及びコンテンツ利用装置 | |
Yang et al. | Defeating fake-quality MP3 | |
US20040074378A1 (en) | Method and device for characterising a signal and method and device for producing an indexed signal | |
CN102394065B (zh) | 一种鉴定wav数字音频信号是否经过压缩以及分析其此前被压缩的码率的方法 | |
CN105632516B (zh) | 一种基于边信息统计特性的mp3录音文件来源识别方法 | |
Luo et al. | Compression history identification for digital audio signal | |
Cotton et al. | Soundtrack classification by transient events | |
CN105719660A (zh) | 一种基于量化特性的语音篡改定位检测方法 | |
CN1623289A (zh) | 基于特征的音频内容识别 | |
CN103294696A (zh) | 音视频内容检索方法及系统 | |
Li et al. | Robust audio identification for MP3 popular music | |
Kim et al. | Lossy audio compression identification | |
Jiao et al. | MDCT-based perceptual hashing for compressed audio content identification | |
CN105448299A (zh) | 一种鉴别数字音频aac格式编解码器的方法 | |
CN105845132A (zh) | 一种基于编码参数统计特性的aac录音文件来源识别方法 | |
You et al. | Music identification system using MPEG-7 audio signature descriptors | |
Wei et al. | Controlling bitrate steganography on AAC audio | |
CN109785848B (zh) | 基于比例因子系数差值的aac双压缩音频检测方法 | |
Huang et al. | AAC audio compression detection based on QMDCT coefficient | |
CN105205102A (zh) | 一种鉴别数字音频aac格式多次压缩的方法 | |
CN105575401B (zh) | 一种基于C-MAC特征的AACHuffman域隐写分析方法 | |
CN101667423A (zh) | 基于概率密度比的压缩域高鲁棒语音/音乐分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190405 Termination date: 20211117 |
|
CF01 | Termination of patent right due to non-payment of annual fee |