CN105913856A

CN105913856A - 基于幅度共生向量特征的音频篡改检测方法及系统

Info

Publication number: CN105913856A
Application number: CN201610247687.8A
Authority: CN
Inventors: 黄继武; 孙蒙蒙; 罗达
Original assignee: Shenzhen University
Current assignee: Shenzhen University
Priority date: 2016-04-20
Filing date: 2016-04-20
Publication date: 2016-08-31

Abstract

本发明公开了一种基于幅度共生向量特征的音频篡改检测方法及系统。其中，所述基于幅度共生向量特征的音频篡改检测方法通过音频处理模块选取预设长度的原始音频，并对原始音频进行单一预设类型的后处理；之后由特征提取模块提取原始音频和经后处理音频的幅度共生向量特征；之后由检测判断模块检测待测音频的幅度共生向量特征，并根据原始音频和经后处理音频的幅度共生向量特征判断待测音频是否被后处理篡改，若被篡改，则继续判断后处理的类型，通过提取并对比原始音频、经预设类型后处理音频及待测音频的幅度共生向量特征，不仅能检测待测音频是否经过了后处理篡改，还能检测出其具体经过了哪种形式的篡改，为音频取证提供了自动化的技术手段。

Description

基于幅度共生向量特征的音频篡改检测方法及系统

技术领域

本发明涉及音频取证技术领域，特别涉及基于幅度共生向量特征的音频篡改检测方法及系统。

背景技术

由于音频处理技术的发展，音频编辑软件的功能越来越强大，并且它也为美化和修饰音频信号提供了便利。然而，一些非法分子为谋取利益刻意地篡改音频，此时这些音频编辑软件也就成了他们的工具。往往一些音频篡改过之后（例如拼接，删除，替换），要利用一些后处理操作来消除这些痕迹，使人耳听不出任何的差别，从而掩盖他们的犯罪事实。

在最近的20多年中，人们已经研究出了许多检测方法用于音频取证，这些技术分别使用了物理、统计等特征。如篡改的音频信号在高阶统计中有更强的相关性，因此研究人员提出了一种利用双边频谱分析的方法来检测音频中可能存在的篡改痕迹；另外有研究人员指出在有电网信号的环境下使用录音设备进行音频录制的过程中，不仅获取了音频信号，同时也可获得电网频率信息，我们就能通过分析录制时间和地点来用于取证技术的研究，另外也提出通过分析MDCT系数来判断是否存在帧偏移，利用这个原理来检测MP3篡改位置。

另一类技术是通过对录制设备进行研究从而检测音频的压缩痕迹的，它能间接被应用于音频的真实性检测，音频被篡改之后，录制设备的某些固有特性会发生改变，也就是说可以通过检测麦克风的某种固有特性是否存在来判定音频的真实性。还有文献公开了分析小幅值MDCT系数的不同之后，提出了一个MP3二次压缩的检测算法，以及利用MDCT子带统计特征来检测双重MP3压缩，同时还提出了MDCT和MFCC参数混合特征来估计音频波形的压缩痕迹。然而上述检测方法均只检测音频是否经过后处理篡改及篡改位置，而没有检测其具体经过了哪种形式的篡改。

因而现有技术还有待改进和提高。

发明内容

鉴于上述现有技术的不足之处，本发明的目的在于提供一种基于幅度共生向量特征的音频篡改检测方法及系统，通过提取并对比原始音频、经预设类型后处理音频及待测音频的幅度共生向量特征，不仅能检测待测音频是否经过了后处理篡改，还能检测出其具体经过了哪种形式的篡改，为音频取证提供了自动化的技术手段，为多媒体信息安全提供保障。

为了达到上述目的，本发明采取了以下技术方案：

一种基于幅度共生向量特征的音频篡改检测方法，其包括如下步骤：

A、由音频处理模块选取预设长度的原始音频，并对所述原始音频进行单一预设类型的后处理；

B、由特征提取模块提取所述原始音频和经后处理音频的幅度共生向量特征；

C、由检测判断模块检测待测音频的幅度共生向量特征，并根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改，若被篡改，则根据待测音频和经后处理音频的幅度共生向量特征继续判断后处理的类型。

所述的基于幅度共生向量特征的音频篡改检测方法中，所述步骤A包括

A1、由音频选取单元选取预设长度的原始音频；

A2、由后处理单元对所述原始音频进行单一预设类型的后处理，生成包含多个经后处理的音频的音频集。

所述的基于幅度共生向量特征的音频篡改检测方法中，所述步骤B包括：

B1、由预处理单元对所述原始音频和经后处理音频进行正则化和高通滤波处理，并输出样本点；

B2、由量化单元根据预设阈值量化所述样本点；

B3、由提取单元选择预设数量的相邻的经量化后的样本点，生成幅度共生向量；

B4、由计算单元计算所有幅度共生向量的概率分布，生成所述原始音频和经后处理音频的幅度共生向量特征。

所述的基于幅度共生向量特征的音频篡改检测方法中，所述步骤C包括：

C1、由检测单元检测待测音频的幅度共生向量特征；

C2、由判断单元根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改，若被篡改，则执行步骤C3;

C3、由分类单元对比待测音频的幅度共生向量特征和经后处理的音频的幅度共生向量特征，判断待测音频的后处理的类型。

所述的基于幅度共生向量特征的音频篡改检测方法中，所述步骤C3还包括：由分类单元根据经后处理音频的幅度共生向量特征生成多个分类模型。

一种基于幅度共生向量特征的音频篡改检测系统，其包括：

音频处理模块，用于选取预设长度的原始音频，并对所述原始音频进行单一预设类型的后处理；

特征提取模块，用于提取所述原始音频和经后处理音频的幅度共生向量特征；

检测判断模块，用于检测待测音频的幅度共生向量特征，并根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改，若被篡改，则根据待测音频和经后处理音频的幅度共生向量特征继续判断后处理的类型。

所述的基于幅度共生向量特征的音频篡改检测系统中，所述音频处理模块包括：

音频选取单元，用于选取预设长度的原始音频；

后处理单元，用于对所述原始音频进行单一预设类型的后处理，生成包含多个经后处理的音频的音频集。

所述的基于幅度共生向量特征的音频篡改检测系统中，所述特征提取模块包括：

预处理单元，用于对所述原始音频和经后处理音频进行正则化和高通滤波处理，并输出样本点；

量化单元，用于根据预设阈值量化所述样本点；

提取单元，用于选择预设数量的相邻的经量化后的样本点，生成幅度共生向量；

计算单元，用于计算所有幅度共生向量的概率分布，生成所述原始音频和经后处理音频的幅度共生向量特征。

所述的基于幅度共生向量特征的音频篡改检测系统中，所述检测判断模块包括：

检测单元，用于检测待测音频的幅度共生向量特征；

判断单元，用于根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改；

分类单元，用于当待测音频被后处理篡改时，对比待测音频的幅度共生向量特征和经后处理的音频的幅度共生向量特征，判断待测音频的后处理的类型。

所述的基于幅度共生向量特征的音频篡改检测系统中，所述分类单元还用于根据经后处理音频的幅度共生向量特征生成多个分类模型。

相较于现有技术，本发明提供的基于幅度共生向量特征的音频篡改检测方法及系统中，所述基于幅度共生向量特征的音频篡改检测方法通过音频处理模块选取预设长度的原始音频，并对所述原始音频进行单一预设类型的后处理；之后由特征提取模块提取所述原始音频和经后处理音频的幅度共生向量特征；之后由检测判断模块检测待测音频的幅度共生向量特征，并根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改，若被篡改，则根据待测音频和经后处理音频的幅度共生向量特征继续判断后处理的类型，通过提取并对比原始音频、经预设类型后处理音频及待测音频的幅度共生向量特征，不仅能检测待测音频是否经过了后处理篡改，还能检测出其具体经过了哪种形式的篡改，为音频取证提供了自动化的技术手段，为多媒体信息安全提供保障。

附图说明

图1 为本发明提供的基于幅度共生向量特征的音频篡改检测方法的流程图。

图2a、图2b、图2c和图2d为本发明提供的基于幅度共生向量特征的音频篡改检测方法中原始音频和经预设类型后处理音频的幅度共生向量的概率分布图。

图3为本发明提供的基于幅度共生向量特征的音频篡改检测系统的结构框图。

图4为本发明提供的应用实施例中音频信号和阈值T的示意图。

图5为本发明提供的应用实施例中量化后的样本点和幅度共生向量的形成示意图。

具体实施方式

鉴于现有技术中无法检测音频文件具体经过了哪种形式的篡改的缺点，本发明的目的在于提供一种基于幅度共生向量特征的音频篡改检测方法及系统，通过提取并对比原始音频、经预设类型后处理音频及待测音频的幅度共生向量特征，不仅能检测待测音频是否经过了后处理篡改，还能检测出其具体经过了哪种形式的篡改，为音频取证提供了自动化的技术手段，为多媒体信息安全提供保障。

为使本发明的目的、技术方案及效果更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

请参阅图1，本发明提供的基于幅度共生向量特征的音频篡改检测方法包括如下步骤：

S100、由音频处理模块选取预设长度的原始音频，并对所述原始音频进行单一预设类型的后处理；

S200、由特征提取模块提取所述原始音频和经后处理音频的幅度共生向量特征；

S300、由检测判断模块检测待测音频的幅度共生向量特征，并根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改，若被篡改，则根据待测音频和经后处理音频的幅度共生向量特征继续判断后处理的类型。

本发明通过音频处理模块选取预设长度的原始音频，并对所述原始音频进行单一预设类型的后处理，得到多个经不同后处理的音频模板；之后由特征提取模块提取所述原始音频和所有经后处理音频的幅度共生向量特征；之后检测判断模块检测待测音频的幅度共生向量特征，并根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改，若待测音频被后处理篡改，则根据待测音频和经后处理音频的幅度共生向量特征继续判断后处理的具体类型，从而实现了不仅检测待测音频是否经过了后处理篡改，还能检测出其具体经过了哪种形式、类型的篡改，提高了音频篡改检测的准确性。

进一步地，所述步骤S100包括：由音频选取单元选取预设长度的原始音频；由后处理单元对所述原始音频进行单一预设类型的后处理，生成包含多个经后处理的音频的音频集。具体实施时，将音频数据库中的原始音频切分成长度如1-5秒的片段，由音频选取单元选取预设长度的原始音频，并由后处理单元对选取的原始音频进行单一预设类型的后处理，所述预设类型的后处理包括变速、变调、相位仪、动态处理、房间回声、嘶声消除、回声、高通滤波、滤除噪声、带通滤波、机械声和混响，即对原始音频进行单一的上述预设类型的后处理，生成包含12个分别经上述预设类型后处理的音频的音频集，为后续检测判断待测音频具体经过了哪种形式的篡改提供了对比音频，保证检测的准确性，当然，所述预设类型可根据实际需要增加或减少，本发明对此不作限定。

更进一步地，所述步骤S200包括：由预处理单元对所述原始音频和经后处理音频进行正则化和高通滤波处理，并输出样本点；由量化单元根据预设阈值量化所述样本点；由提取单元选择预设数量的相邻的经量化后的样本点，生成幅度共生向量；由计算单元计算所有幅度共生向量的概率分布，生成所述原始音频和经后处理音频的幅度共生向量特征。

由于在音频篡改过程中，相当一部分的后处理操作将在音频信号的高频部分留下一些特殊的痕迹，因此本发明提供的基于幅度共生向量特征的音频篡改检测方法中直接提取音频信号的高频部分进行分析。具体地，由预处理单元对所述原始音频和经后处理音频进行正则化和高通滤波处理，其中正则化处理即减去均值后除以方差，高通滤波采用公式y(t)=2*x(t)-x(t-1)-x(t+1)，经预处理后输出相应的样本点至量化单元，由量化单元根据预设阈值量化所述样本点，量化之后的样本点的取值为-1、0或1，具体地量化方法为：当x_i≤-T时，y_i=-1；当-T＜x_i＜T时，y_i=0；当x_i≥T时，y_i=1；其中，T为预设阈值，xi为样本点的信号值，yi为量化后的样本点的取值，从而将预处理后的音频信号使用预设阈值T将其量化到{-1,0,1}三个值上。

进一步地，由提取单元选择预设数量的相邻的经量化后的样本点，生成幅度共生向量，并计算单元计算所有幅度共生向量的概率分布，生成所述原始音频和经后处理音频的幅度共生向量特征，请一并参阅图2a、图2b、图2c和图2d，图中有选择性的列出了四种共生向量的概率分布情况，其中包括原始音频和三种类型的后处理音频，选取预设阈值T=0.02来进行对比，从图中可看出，当T=0.02时，共生向量的一种可能（0 0 0）对于原始音频来说其概率接近10%，相同的条件下三种后处理篡改操作的概率都比原始音频高很多。另外对于原始信号的共生向量分布情况在各种后处理信号的条件下是不同的，因此共生向量能够很好的检测原始音频和经过后处理操作的音频，为音频取证提供了可靠的技术手段。

本发明提供的基于幅度共生向量特征的音频篡改检测方法中，所述步骤S300包括：由检测单元检测待测音频的幅度共生向量特征；由判断单元根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改，若被篡改，则由分类单元对比待测音频的幅度共生向量特征和经后处理的音频的幅度共生向量特征，判断待测音频的后处理的类型。进一步地，所述分类单元还对比待测音频的幅度共生向量特征和经后处理的音频的幅度共生向量特征，判断待测音频的后处理的类型。

即当需要检测单侧音频是否经后处理篡改以及具体经过了哪种类型的篡改时，由检测单元按上述步骤S200检测待测音频的幅度共生向量特征，之后判断单元根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改，对于原始信号的共生向量分布情况在各种后处理信号的条件下是不同的，因此幅度共生向量特征能够很好的检测原始音频和经过后处理操作的音频，实现辨别待测音频是否被后处理篡改，若被篡改，则由分类单元对比待测音频的幅度共生向量特征和经后处理的音频的幅度共生向量特征，判断待测音频的后处理的类型，具体地，由分类单元根据经后处理音频的幅度共生向量特征生成多个分类模型，由于经不同类型后处理的音频的幅度共生向量特征各不相同，由分类单元根据所有经后处理音频的幅度共生向量特征对其进行分类，当待测音频被判断为被篡改时，分类单元根据待测音频的幅度共生向量特征以及分类模型判断待测音频的后处理的类型，从而实现了不仅能检测待测音频是，否经过了后处理篡改，还能检测出其具体经过了哪种形式的篡改，为多媒体信息安全提供保障。

本发明还相应提供一种基于幅度共生向量特征的音频篡改检测系统，如图3所示，所述基于幅度共生向量特征的音频篡改检测系统包括音频处理模块10、特征提取模块20和检测判断模块30，所述音频处理模块10、特征提取模块20和检测判断模块30依次连接。其中，所述音频处理模块10用于选取预设长度的原始音频，并对所述原始音频进行单一预设类型的后处理；所述特征提取模块20用于提取所述原始音频和经后处理音频的幅度共生向量特征；所述检测判断模块30用于检测待测音频的幅度共生向量特征，并根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改，若被篡改，则根据待测音频和经后处理音频的幅度共生向量特征继续判断后处理的类型。

本发明通过音频处理模块10选取预设长度的原始音频，并对所述原始音频进行单一预设类型的后处理，得到多个经不同后处理的音频模板；之后由特征提取模块20提取所述原始音频和所有经后处理音频的幅度共生向量特征；之后检测判断模块30检测待测音频的幅度共生向量特征，并根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改，若待测音频被后处理篡改，则根据待测音频和经后处理音频的幅度共生向量特征继续判断后处理的具体类型，从而实现了不仅检测待测音频是否经过了后处理篡改，还能检测出其具体经过了哪种形式、类型的篡改，提高了音频篡改检测的准确性。

进一步地，所述音频处理模块10包括音频选取单元101和后处理单元102，所述音频选取单元101和后处理单元102连接，所述音频选取单元101和后处理单元102均连接特征提取模块20。其中，所述音频选取单元101用于选取预设长度的原始音频；所述后处理单元102，用于对所述原始音频进行单一预设类型的后处理，生成包含多个经后处理的音频的音频集。具体实施时，将音频数据库中的原始音频切分成长度如1-5秒的片段，由音频选取单元101选取预设长度的原始音频，并由后处理单元102对选取的原始音频进行单一预设类型的后处理，所述预设类型的后处理包括变速、变调、相位仪、动态处理、房间回声、嘶声消除、回声、高通滤波、滤除噪声、带通滤波、机械声和混响，即对原始音频进行单一的上述预设类型的后处理，生成包含12个分别经上述预设类型后处理的音频的音频集，为后续检测判断待测音频具体经过了哪种形式的篡改提供了对比音频，保证检测的准确性，当然，所述预设类型可根据实际需要增加或减少，本发明对此不作限定。

更进一步地，所述特征提取模块20包括预处理单元201、量化单元202、提取单元203和计算单元204，所述预处理单元201、量化单元202、提取单元203和计算单元204依次连接，所述预处理单元201还连接音频选取单元101和后处理单元102，所述计算单元204还连接检测判断模块30。其中，所述预处理单元201用于对所述原始音频和经后处理音频进行正则化和高通滤波处理，并输出样本点；所述量化单元202用于根据预设阈值量化所述样本点；所述提取单元203用于选择预设数量的相邻的经量化后的样本点，生成幅度共生向量；所述计算单元204用于计算所有幅度共生向量的概率分布，生成所述原始音频和经后处理音频的幅度共生向量特征。

由于在音频篡改过程中，相当一部分的后处理操作将在音频信号的高频部分留下一些特殊的痕迹，因此本发明提供的基于幅度共生向量特征的音频篡改检测方法中直接提取音频信号的高频部分进行分析。具体地，由预处理单元201对所述原始音频和经后处理音频进行正则化和高通滤波处理，其中正则化处理即减去均值后除以方差，高通滤波采用公式y(t)=2*x(t)-x(t-1)-x(t+1)，经预处理后输出相应的样本点至量化单元202，由量化单元202根据预设阈值量化所述样本点，量化之后的样本点的取值为-1、0或1，具体地量化方法为：当x_i≤-T时，y_i=-1；当-T＜x_i＜T时，y_i=0；当x_i≥T时，y_i=1；其中，T为预设阈值，xi为样本点的信号值，yi为量化后的样本点的取值，从而将预处理后的音频信号使用预设阈值T将其量化到{-1,0,1}三个值上。

进一步地，由提取单元203选择预设数量的相邻的经量化后的样本点，生成幅度共生向量，并计算单元204计算所有幅度共生向量的概率分布，生成所述原始音频和经后处理音频的幅度共生向量特征，请一并参阅图2a、图2b、图2c和图2d，图中有选择性的列出了四种共生向量的概率分布情况，其中包括原始音频和三种类型的后处理音频，选取预设阈值T=0.02来进行对比，从图中可看出，当T=0.02时，共生向量的一种可能（0 0 0）对于原始音频来说其概率接近10%，相同的条件下三种后处理篡改操作的概率都比原始音频高很多。另外对于原始信号的共生向量分布情况在各种后处理信号的条件下是不同的，因此共生向量能够很好的检测原始音频和经过后处理操作的音频，为音频取证提供了可靠的技术手段。

本发明提供的基于幅度共生向量特征的音频篡改检测系统中，所述检测判断模块30包括检测单元301、判断单元302和分类单元303，所述检测单元301、判断单元302和分类单元303依次连接，所述判断单元302还连接计算单元204。其中，所述检测单元301用于检测待测音频的幅度共生向量特征；所述判断单元302用于根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改；所述分类单元303用于当待测音频被后处理篡改时，对比待测音频的幅度共生向量特征和经后处理的音频的幅度共生向量特征，判断待测音频的后处理的类型。进一步地，所述分类单元303还用于根据经后处理音频的幅度共生向量特征生成多个分类模型。

即当需要检测单侧音频是否经后处理篡改以及具体经过了哪种类型的篡改时，由检测单元301按上述步骤检测待测音频的幅度共生向量特征，之后判断单元302根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改，对于原始信号的共生向量分布情况在各种后处理信号的条件下是不同的，因此幅度共生向量特征能够很好的检测原始音频和经过后处理操作的音频，实现辨别待测音频是否被后处理篡改，若被篡改，则由分类单元303对比待测音频的幅度共生向量特征和经后处理的音频的幅度共生向量特征，判断待测音频的后处理的类型，具体地，由分类单元303根据经后处理音频的幅度共生向量特征生成多个分类模型，由于经不同类型后处理的音频的幅度共生向量特征各不相同，由分类单元303根据所有经后处理音频的幅度共生向量特征对其进行分类，当待测音频被判断为被篡改时，分类单元303根据待测音频的幅度共生向量特征以及分类模型判断待测音频的后处理的类型，从而实现了不仅能检测待测音频是，否经过了后处理篡改，还能检测出其具体经过了哪种形式的篡改，为多媒体信息安全提供保障。

为更好地理解本发明的技术方案，以下结合图1至图5，举具体应用实施例对本发明提供的基于幅度共生向量特征的音频篡改检测方法的过程作详细说明。

在本发明中，使用了两个数据库（WSJ和TIMIT）中的音频片段作为原始音频。然后两个数据库的音频信号都被切分成长度为1-5秒的片段。接着利用Goldwave软件和Cooledit软件来完成后处理的篡改操作。其中，Cooledit软件上选取了六种后处理篡改操作，分别是变速、变调、相位仪、动态处理、房间回声和嘶声消除，而在Goldwave软件上分别是回声、高通滤波、滤除噪声、带通滤波、机械声和混响（如表1所示）。

表1. 两种软件的后处理操作

之后从WSJ数据库选择音频作为原始音频（长度为5秒一段的音频共2160段），然后使用两个软件进行后处理篡改操作。如图4和图5所示，首先对音频进行预处理操作，分别是正则化（即减去均值除以方差）和高通滤波，选取阈值T，对预处理后的音频进行量化，量化后取值为-1、0或者1，之后选取预设数量W，选择音频信号中连续的W个相邻量化后的样本点组成幅度共生向量，图5中取W为3，选择音频信号中连续的3个相邻量化后的样本点组成幅度共生向量，因为幅度共生向量中的元素值属于限定的集中，因此W维共生向量有着固定的组合。计算共生向量的每一种可能性的概率，即可得到幅度共生向量概率分布，即为幅度共生向量特征，其具体算法如下：

已知条件：

输入信号，X(x₁，x₂，…，x_n)；

阈值，T；

窗尺寸，W；

满足要求：

幅度共生向量特征，F_ACV

S1、开始

S2、for i=1:n

S3、// 利用x_i 计算y_i

S4、如果满足条件，x_i > T

S5、则 y_i = 1；

S6、如果满足x_i < - T

S7、则 y_i = -1；

S8、如果以上两个条件都不满足：

S9、则 y_i = 0；

S10、if循环结束

S11、for循环结束

S12、定义一个矢量为，V(v₁，v₂，…，v_w)，缩写为“ACV”

S13、定义 Pattern(V) 为ACV 的概率分布

S14、初始化，Pattern(V) = 0

S15、for i=0:n-W

S16、V(v₁，v₂，…，v_w)= (y_i+1，y_i+2，…，y_i+w)；

S17、Pattern(V) = Pattern(V) +1

S18、for循环结束

S19、// 计算每个ACV 的概率分布作为特征

S20、F_ACV (*) = Pattern(*)/(n-W+1)

S21、返回F_ACV (*)

S22、结束

在本应用实施例的后处理中，选择的预设阈值（即窗口尺寸）为5，结合4个不同的阈值T，将得到的不同的共生向量概率分布联合起来进行分类和建模，实验结果显示在表2和表3中。由此可以看出，检测每种篡改的最佳T值是不同的。然而，联合这四种阈值的特征分布能够得到一个相对较好的检测结果。由表格可见，检测出由Cooledit软件后处理操作和Goldwave软件后处理操作的准确率分别是95.71%和95.10%。

表2. WSJ 数据集在CoolEdit软件下的后处理操作检测的准确率[%]

表3. WSJ 数据集在GoldWave软件下的后处理操作检测的准确率[%]

此外，也能够判别一个后处理操作来自哪个软件。实验中使用的不同的后处理操作被随机的选择。仍旧使用2160段原始音频（original），然后加上两类软件后处理过的音频样本，总共6480（2160*3）段。另外，使用4个T值的联合特征，窗口大小参数W=5。结果如表4所示，能够有效的鉴别出音频片段后处理篡改的来源。

表4. WSJ 数据集鉴别原始音频和两种软件的后处理操作的检测率[%]

之后，对不同的后处理的种类进行鉴定，依然使用2160段音频，每一段长度为5秒，因此，数据总共有15120段（=2160*7）。特征参数的保证不变，即：使用四个不同的T值的联合特征，窗口大小参数W=5。实验结果分别在表5和表6。如第一行的第一个数95.58%表示的是在原始音频和其他六种后处理篡改检测中，原始音频被判定为正确判断的概率。由表可见，每一种后处理操作都能很好的被区分开，因此可以鉴定后处理类型。

表5. WSJ 数据集原始音频和经过Cooledit软件后处理音频的识别率[%]

（*标志表示值小于1%）

表6. WSJ 数据集原始音频和经过GoldWave软件后处理音频的识别率[%]

（*标志表示值小于1%）

为了进一步考虑参数对本发明提供的基于幅度共生向量特征的音频篡改检测方法准确性的影响，以下使用变化的窗口大小和音频长度验证该方法的准确性。结果展示在表7和表8中。通常来说，窗尺寸越大，则准确率将更佳。然而，当窗尺寸W增加时，则意味着共生向量的特征维数也会相应增加。下面展示了W=3和W=5两个窗尺寸的结果，可以看出W=3时结果仅仅比W=5的情况稍差一点。另外，音频长度也是另一个重要影响因素。表中分析了从1秒到5秒的准确率变化。对于长度一秒的音频，结果稍差，但是性能总体也还可以接受。可见，该方法在不同的参数情况具有较好的鲁棒性和延展性。

表7. WSJ 数据集使用COOLEDIT软件的检测准确率[%]

表8. WSJ 数据集使用GOLDWAVE软件的检测准确率[%]

之后验证该方法在TIMIT数据库中的性能。由于TIMIT数据库中的音频每一段都较短，所以截取了长度为1秒的音频共6299段来进行验证。其他设置不变，同样对原始音频做了12种的篡改处理，采用4种T值的联合特征以及窗口W=5。后处理检测和后处理鉴定的结果，分别如表9和表10所示。可看到该方法在TIMIT数据库上的性能和WSJ数据的性能相差不大，展示了该方法的可扩展性。

表9. TIMIT数据库中后处理检测的准确率[%]

表10. TIMIT数据库中鉴别原始音频和后处理篡改的实验结果[%]

综上所述，本发明提供的基于幅度共生向量特征的音频篡改检测方法及系统中，所述基于幅度共生向量特征的音频篡改检测方法通过音频处理模块选取预设长度的原始音频，并对所述原始音频进行单一预设类型的后处理；之后由特征提取模块提取所述原始音频和经后处理音频的幅度共生向量特征；之后由检测判断模块检测待测音频的幅度共生向量特征，并根据所述原始音频和经后处理音频的幅度共生向量特征判断所述待测音频是否被后处理篡改，若被篡改，则根据待测音频和经后处理音频的幅度共生向量特征继续判断后处理的类型，通过提取并对比原始音频、经预设类型后处理音频及待测音频的幅度共生向量特征，不仅能检测待测音频是否经过了后处理篡改，还能检测出其具体经过了哪种形式的篡改，为音频取证提供了自动化的技术手段，为多媒体信息安全提供保障。

可以理解的是，对本领域普通技术人员来说，可以根据本发明的技术方案及其发明构思加以等同替换或改变，而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。

Claims

1.一种基于幅度共生向量特征的音频篡改检测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于根据待测音频和经后处理音频的幅度共生向量特征幅度共生向量特征的音频篡改检测方法，其特征在于，所述步骤A包括：

A1、由音频选取单元选取预设长度的原始音频；

3.根据权利要求1所述的基于幅度共生向量特征的音频篡改检测方法，其特征在于，所述步骤B包括：

B2、由量化单元根据预设阈值量化所述样本点；

4.根据权利要求1所述的基于幅度共生向量特征的音频篡改检测方法，其特征在于，所述步骤C包括：

C1、由检测单元检测待测音频的幅度共生向量特征；

5.根据权利要求4所述的基于幅度共生向量特征的音频篡改检测方法，其特征在于，所述步骤C3还包括：由分类单元根据经后处理音频的幅度共生向量特征生成多个分类模型。

6.一种基于幅度共生向量特征的音频篡改检测系统，其特征在于，包括：

7.根据权利要求6所述的基于幅度共生向量特征的音频篡改检测系统，其特征在于，所述音频处理模块包括：

音频选取单元，用于选取预设长度的原始音频；

8.根据权利要求6所述的基于幅度共生向量特征的音频篡改检测系统，其特征在于，所述特征提取模块包括：

量化单元，用于根据预设阈值量化所述样本点；

9.根据权利要求6所述的基于幅度共生向量特征的音频篡改检测系统，其特征在于，所述检测判断模块包括：

检测单元，用于检测待测音频的幅度共生向量特征；

10.根据权利要求9所述的基于幅度共生向量特征的音频篡改检测系统，其特征在于，所述分类单元还用于根据经后处理音频的幅度共生向量特征生成多个分类模型。