CN105448299A - 一种鉴别数字音频aac格式编解码器的方法 - Google Patents

一种鉴别数字音频aac格式编解码器的方法 Download PDF

Info

Publication number
CN105448299A
CN105448299A CN201510796684.5A CN201510796684A CN105448299A CN 105448299 A CN105448299 A CN 105448299A CN 201510796684 A CN201510796684 A CN 201510796684A CN 105448299 A CN105448299 A CN 105448299A
Authority
CN
China
Prior art keywords
codec
audio
aac
huffman
different
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510796684.5A
Other languages
English (en)
Other versions
CN105448299B (zh
Inventor
杨锐
王刚
刘红梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
National Sun Yat Sen University
Original Assignee
Shenzhen University
National Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University, National Sun Yat Sen University filed Critical Shenzhen University
Priority to CN201510796684.5A priority Critical patent/CN105448299B/zh
Publication of CN105448299A publication Critical patent/CN105448299A/zh
Application granted granted Critical
Publication of CN105448299B publication Critical patent/CN105448299B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开一种鉴别数字音频AAC编解码器的方法,是根据不同编解码器对同一音频在压缩时会产生不同编码结果而提出的统计判别方法,属于多媒体信号处理领域。本发明方法依据数字音频在压缩时MDCT系数会发生变化,进而导致Huffman编码的不同,不同编解码器会产生不同的编码结果。本发明方法正是将不同编解码器与同一编解码器的Huffman编码小值的差异组成特征值,再利用SVM分类器分类,对鉴别产生AAC格式的数字音频的编解码器有很好的效果。本发明可以作为鉴别产生AAC格式文件的编解码器的一种有效手段,可以广泛应用在编解码器的鉴别和音频取证方面。

Description

一种鉴别数字音频AAC格式编解码器的方法
技术领域
本发明涉及多媒体信号处理领域,具体涉及一种鉴别产生数字音频AAC格式的编解码器的分析方法。
背景技术
随着科学的不断发展,形形色色的多媒体成为人们日常生活中必不可少的一部分。存储空间小,音质效果好的AAC格式数字音频逐步取代mp3格式数字音频,占据主流地位。正是由于AAC格式数字音频的兴起,各种各样针对AAC格式数字音频的编解码器应运而生。种类繁杂的编解码器会产生不同的音质效果,但并不会留下明显的不同编解码器的痕迹,这种区别并不大,这在音频取证等方面如何有效的鉴别出产生AAC数字音频的编解码器提出了挑战。录音设备上的AAC编码器通常与音频编辑软件的编码器不一样,因此通过识别数字录音的编码器来鉴定该录音的原始性和真实性。
人们常用数字签名和水印技术来鉴别数字音频信息,然而不同编解码器产生AAC文件时并不一定会留下认证信息,这两种方法适用于事先知道待测音频和不同编解码器加密解密信息的情况,对现实生活中种类各样的编解码器产生AAC数字音频并且没留下任何信息的情况并不适用。
对产生AAC格式音频文件的编解码器进行鉴别,目前暂时还没发现有文献进行此类工作。
发明内容
为了克服上述现有技术的不足,本发明提出一种鉴别数字音频AAC格式编解码器的方法,用于分析判断鉴别产生数字音频AAC格式的编解码器;本发明是依据数字音频在压缩时MDCT系数会发生变化,进而导致Huffman编码的不同,不同的编解码器将产生不同的编码结果。本发明方法将不同编解码器与同一编解码器的Huffman编码小值的差异组成特征值,再利用SVM分类器分类,对鉴别产生AAC格式的数字音频的编解码器有很好的效果。
为了实现上述目的,本发明的技术方案为:
一种鉴别数字音频AAC格式编解码器的方法,步骤如下:
1)数字音频集的构造:
11)不同编解码器压缩一次AAC音频集的构造:首先从CD中选取无损的WAV格式文件,裁剪成若干10秒钟长度的音频片段,然后分别用不同编解码器以同一码率压缩成AAC格式的音频,取得不同编解码器压缩一次的AAC音频集;
12)同一编解码器再次压缩音频集的构造:对步骤11)中生成的AAC文件用同一编解码器进行解码得到WAV格式文件,再将它们用同一编解码器分别以相同的码率再次压缩成AAC文件,得到同一编解码器再次压缩的音频集;
2)音频集特征提取:
对上述得到的两种音频集,按以下方法提取特征:
21)对上述两种AAC音频集进行解码,两次解码都用同一编解码器进行,根据AAC标准,每帧提取1024个Huffman编码值;
22)统计每个音频片段中所有帧的Huffman编码值为0的个数,±1的个数和以及±2的个数和,然后除以帧数,得到平均每帧中0,±1,±2的个数,将平均每帧中0,±1,±2的个数称作Huffman小值;
23)依据步骤22)中的方法,用不同编解码器压缩一次音频片段的Huffman小值减去用同一编解码器再次压缩音频片段的Huffman小值,得到不同编解码器特征值;
3)分类器的构造:
将步骤2)中得到的不同编解码器特征值进行训练,得到一个能鉴别分析产生AAC音频信号的编解码器分类器模型Model;
4)鉴别待测音频:
首先,将待测音频用同一编解码器解码,得到Huffman小值;然后,将解码得到的音频文件再次用同一编解码器压缩成AAC文件,而后再解码,得到另一组Huffman小值;将这两组Huffman小值相减,组成待测音频特征值;最后,利用步骤3)中训练出来的Model进行鉴别;待测音频最接近哪一组编解码器的特征值,即判断产生待测音频的编解码器就是哪一种。
现在市场上流行各种各样的移动媒体和存储介质,对AAC数字音频采用的编解码器也各不相同。如在人们的生活中有各种各样的手机、电脑、平板、音乐播放器等等,怎样有效的鉴别出产生AAC格式数字音频的编解码器是十分困难的。对一个AAC数字音频信号,本发明通过分析其内在的本质特征以及不同的编解码器之间的差别,鉴定它是由哪一种编解码器产生。
附图说明
图1是本发明方法鉴别数字音频AAC编解码器流程图。
图2是AAC标准中解码流程图。
图3是不同编解码器压缩一次Huffman小值分布图。
图4是不同编解码器压缩一次与同一编解码器再次压缩Huffman小值差的分布图。
具体实施方式
下面结合附图对本发明方法作进一步说明。
本发明提出的一种鉴别数字音频AAC格式编解码器的方法,该方法鉴别待测音频是由哪一种编解码器产生的过程十分简单,如图1所示。对于输入未知是由哪一种编解码器产生的AAC格式的待测音频,首先,将其解码获得第一组Huffman小值。然后,将解码得到的文件再次压缩,再解码获得第二组Huffman小值。最后,将两次获得的Huffman小值做差组成待测音频的特征值,利用SVM分类器进行分类鉴别。具体步骤如下:
1)数字音频集的构造:
11)不同编解码器压缩一次AAC音频集的构造:首先选取无损WAV格式文件,包括中文歌曲、外文歌曲、戏曲、钢琴曲、摇滚、爵士、古典等等各种各样的音频文件,包含的范围尽可能广。将上述这些数字音频利用ffmpeg等音频编辑软件裁剪成若干10秒钟长度的音频片段,然后分别用不同编解码器以同一码率压缩成AAC格式的音频,取得不同编解码器压缩一次AAC音频集;
12)同一编解码器再次压缩音频集的构造:对步骤11)中生成的AAC文件用同一编解码器进行解码得到WAV格式文件,再将它们用同一编解码器分别以相同的码率再次压缩成AAC文件,得到同一编解码器再次压缩的音频集;
2)音频集特征提取:
对上述音频集中的每个音频片段,按以下方法提取特征:
21)对上述两种AAC音频集进行解码,两次解码都用同一编解码器进行,根据AAC标准,每帧提取1024个Huffman编码值;
由于两次解码都需要采用同一编解码器,在本实施例中利用比较流行的开源的fdk_aac(http://sourceforge.net/p/opencore-amr/fdk-aac/.)编解码器,通过在解码端增加少量代码即可输出Huffman编码值。而后利用功能强大的开源ffmpeg(https://ffmpeg.org/)对fdk_aac进行编译,即可在音频解码时输出Huffman编码值。
22)统计每个音频片段中所有帧的Huffman编码值分别为0的个数,±1的个数和以及±2的个数和,然后分别除以帧数,得到平均每帧中的0,±1,±2的个数。将平均每帧中0,±1,±2的个数称作“Huffman小值”。将20552个音频片段以64kbps码率分别利用不同编解码器进行编码一次,而后用fdk_aac解码,其huffman小值分布如图3所示。从图中可以看出,不同编解码器对同一音频片段编码的数据虽然各不相同,但是区别并不明显,不能很好的区分不同编解码器。
23)依据22)中的方法,分别用不同编解码器压缩一次音频片段的Huffman小值减去用同一编解码器再次压缩音频片段的Huffman小值,得到不同编解码器特征值。如图4所示,不同编解码器压缩一次与同一编解码器再次压缩音频片段Huffman小值的差统计分布。从图中可以明显的看出,随着压缩次数的增多,不同编解码器与同一编解码器的差有较好的区分效果,虽然用一个特征值还不能很好的鉴别不同编解码器,但是用0,±1,±2三个特征值就已经能得到较高的正确率。
3)分类器的构造:
将2)中得到的不同编解码器的特征值利用SVM分类器进行训练,得到一个能鉴别AAC格式的数字音频编解码器的分类器模型Model。
4)鉴别待测音频:
首先,将输入AAC格式的待测音频用fdkaac编解码器解码,根据AAC解码标准每帧得到1024个Huffman编码值。然后,将解码得到的音频文件再用fdkaac压缩,再用fdkaac解码得到另一组Huffman小值。将这两组Huffman小值相减,组成待测音频特征值。最后,利用3)中训练出来的Model进行鉴别,待测音频特征值与model中哪一组特征值最接近则判断该待测音频为对应的编解码器产生。
本发明方法的原理如下:
数字音频在压缩过程中谱线系数会发生变化,利用不同的编解码器产生的AAC格式数字音频的谱线系数不同,但区别并不明显。谱线系数也会随着压缩次数的变化而变化,通过选定同一编解码器进行再次压缩得到两次压缩的差异,对于鉴别AAC格式的数字音频编解码器有很好的效果。
下面给出本发明方法的一些实验结果。
从CD中取得无损的各种音乐文件,然后利用ffmpeg软件剪裁成20552个10秒钟的音频片段,采样率44100Hz,16bit。本文随机选择6种不同的AAC编解码器:aacenc,audition,faac,fairstars,ffmpeg,fdkaac进行试验。
首先,分别用这些编解码器以64kbps将上述无损的WAV音频片段压缩成AAC格式文件,从而得到压缩一次的数字音频集。
然后,利用fdkaac编解码器分别对上述压缩一次的音频集解码,得到不同编解码器压缩一次的Huffman小值。
其次,用fdkaac对上一步中解码得到的音频集进行再压缩后再解码,得到不同编解码器压缩一次后用同一编解码器再次压缩的Huffman小值。将这两组Huffman小值做差组成对应编解码器的特征值。
最后,将这6组不同编解码器特征值进行SVM训练,得到能鉴别待测音频编解码器的model。在鉴别待测音频时,比较待测音频的特征值是属于上述训练模型中的哪一组特征值的类型即可判断待测音频是由哪一种编解码器产生。
实验结果如下表所示:
表格一:不同编解码器
aacenc audition faac fairstars ffmpeg fdkaac
aacenc 86.17% 0.01% 0.00% 0.58% 8.60% 4.63%
audition 0.00% 94.88% 0.00% 5.12% 0.00% 0.00%
faac 0.05% 0.13% 98.99% 0.76% 0.00% 0.06%
fairstars 0.12% 1.41% 0.37% 98.02% 0.01% 0.07%
ffmpeg 3.69% 0.01% 0.00% 0.00% 96.29% 0.00%
fdkaac 1.63% 0.08% 0.01% 0.32% 0.01% 97.95%
其中aacenc编解码器的编解码性能不稳定,编解码效果比较差,产生AAC格式数字音频的质量也相对不好,因此市场上用的并不多。从实验结果上看,本发明提出的方法可以十分有效的鉴别AAC数字音频编解码器。

Claims (2)

1.一种鉴别数字音频AAC格式编解码器的方法,其特征在于,包括以下步骤:
1)数字音频集的构造:
11)不同编解码器压缩一次AAC音频集的构造:首先选取无损的WAV格式文件,裁剪成若干t秒钟长度的音频片段,然后分别用不同编解码器以同一码率压缩成AAC格式的音频,取得不同编解码器压缩一次AAC音频集;
12)同一编解码器再次压缩音频集的构造:对步骤11)中生成的AAC文件用同一编解码器进行解码得到WAV格式文件,再将它们用同一编解码器分别以相同的码率再次压缩成AAC文件,得到同一编解码器再次压缩的音频集;
2)音频集特征提取:
对上述得到的两种音频集,按以下方法提取特征:
21)对上述两种AAC音频集进行解码,两次解码都用同一编解码器进行,根据AAC标准,每帧提取1024个Huffman编码值;
22)统计每个音频片段中所有帧的Huffman编码值为0的个数,±1的个数和以及±2的个数和,然后除以帧数,得到平均每帧中0,±1,±2的个数,将平均每帧中0,±1,±2的个数称作Huffman小值;
23)依据步骤22)中的方法,用不同编解码器压缩一次音频片段的Huffman小值减去用同一编解码器再次压缩音频片段的Huffman小值,组成不同编解码器特征值;
3)分类器的构造:
将步骤2)中得到的不同编解码器特征值进行训练,得到一个能鉴别分析产生AAC音频信号的编解码器分类器模型Model;
4)鉴别待测音频:
首先,将待测音频用同一编解码器解码,得到Huffman小值;然后,将解码得到的音频文件再次用同一编解码器压缩成AAC文件,而后再解码,得到另一组Huffman小值;将这两组Huffman小值相减,组成待测音频特征值;最后,利用步骤3)中训练出来的Model进行鉴别;待测音频特征值最接近哪一组编解码器的特征值,则判断产生待测音频的编解码器就是哪一种。
2.根据权利要求1所述的方法,其特征在于,所述步骤3)中利用LibSVM分类器进行训练。
CN201510796684.5A 2015-11-17 2015-11-17 一种鉴别数字音频aac格式编解码器的方法 Expired - Fee Related CN105448299B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510796684.5A CN105448299B (zh) 2015-11-17 2015-11-17 一种鉴别数字音频aac格式编解码器的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510796684.5A CN105448299B (zh) 2015-11-17 2015-11-17 一种鉴别数字音频aac格式编解码器的方法

Publications (2)

Publication Number Publication Date
CN105448299A true CN105448299A (zh) 2016-03-30
CN105448299B CN105448299B (zh) 2019-04-05

Family

ID=55558405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510796684.5A Expired - Fee Related CN105448299B (zh) 2015-11-17 2015-11-17 一种鉴别数字音频aac格式编解码器的方法

Country Status (1)

Country Link
CN (1) CN105448299B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5727124A (en) * 1994-06-21 1998-03-10 Lucent Technologies, Inc. Method of and apparatus for signal recognition that compensates for mismatching
US20080262852A1 (en) * 2005-10-05 2008-10-23 Lg Electronics, Inc. Method and Apparatus For Signal Processing and Encoding and Decoding Method, and Apparatus Therefor
CN101562016A (zh) * 2009-05-26 2009-10-21 上海大学 一种全盲的数字语音认证方法
CN102547371A (zh) * 2012-02-27 2012-07-04 中山大学 一种基于h.264/avc视频二次压缩检测方法
CN103187066A (zh) * 2012-01-03 2013-07-03 摩托罗拉移动有限责任公司 处理音频帧以在不同编解码器之间转变的方法和装置
CN103871405A (zh) * 2014-01-14 2014-06-18 中山大学 一种amr音频的鉴定方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5727124A (en) * 1994-06-21 1998-03-10 Lucent Technologies, Inc. Method of and apparatus for signal recognition that compensates for mismatching
US20080262852A1 (en) * 2005-10-05 2008-10-23 Lg Electronics, Inc. Method and Apparatus For Signal Processing and Encoding and Decoding Method, and Apparatus Therefor
CN101562016A (zh) * 2009-05-26 2009-10-21 上海大学 一种全盲的数字语音认证方法
CN103187066A (zh) * 2012-01-03 2013-07-03 摩托罗拉移动有限责任公司 处理音频帧以在不同编解码器之间转变的方法和装置
CN102547371A (zh) * 2012-02-27 2012-07-04 中山大学 一种基于h.264/avc视频二次压缩检测方法
CN103871405A (zh) * 2014-01-14 2014-06-18 中山大学 一种amr音频的鉴定方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RUI YANG ET AL: "detecting double compression of audio signal", 《PROCEEDINGS OF SPIE》 *

Also Published As

Publication number Publication date
CN105448299B (zh) 2019-04-05

Similar Documents

Publication Publication Date Title
Chou et al. Robust singing detection in speech/music discriminator design
Herre et al. Robust matching of audio signals using spectral flatness features
US7460994B2 (en) Method and apparatus for producing a fingerprint, and method and apparatus for identifying an audio signal
JP5440051B2 (ja) コンテンツ同定方法、コンテンツ同定システム、コンテンツ検索装置及びコンテンツ利用装置
Yang et al. Defeating fake-quality MP3
US20040074378A1 (en) Method and device for characterising a signal and method and device for producing an indexed signal
CN102394065B (zh) 一种鉴定wav数字音频信号是否经过压缩以及分析其此前被压缩的码率的方法
CN105632516B (zh) 一种基于边信息统计特性的mp3录音文件来源识别方法
Luo et al. Compression history identification for digital audio signal
Cotton et al. Soundtrack classification by transient events
CN105719660A (zh) 一种基于量化特性的语音篡改定位检测方法
CN1623289A (zh) 基于特征的音频内容识别
CN103294696A (zh) 音视频内容检索方法及系统
Li et al. Robust audio identification for MP3 popular music
Kim et al. Lossy audio compression identification
Jiao et al. MDCT-based perceptual hashing for compressed audio content identification
CN105448299A (zh) 一种鉴别数字音频aac格式编解码器的方法
CN105845132A (zh) 一种基于编码参数统计特性的aac录音文件来源识别方法
You et al. Music identification system using MPEG-7 audio signature descriptors
Wei et al. Controlling bitrate steganography on AAC audio
CN109785848B (zh) 基于比例因子系数差值的aac双压缩音频检测方法
Huang et al. AAC audio compression detection based on QMDCT coefficient
CN105205102A (zh) 一种鉴别数字音频aac格式多次压缩的方法
CN105575401B (zh) 一种基于C-MAC特征的AACHuffman域隐写分析方法
CN101667423A (zh) 基于概率密度比的压缩域高鲁棒语音/音乐分割方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190405

Termination date: 20211117

CF01 Termination of patent right due to non-payment of annual fee