CN104282310A - 一种针对MP3Stego隐写后的音频的隐写检测方法 - Google Patents

一种针对MP3Stego隐写后的音频的隐写检测方法 Download PDF

Info

Publication number
CN104282310A
CN104282310A CN201410502396.XA CN201410502396A CN104282310A CN 104282310 A CN104282310 A CN 104282310A CN 201410502396 A CN201410502396 A CN 201410502396A CN 104282310 A CN104282310 A CN 104282310A
Authority
CN
China
Prior art keywords
sample
audio
centerdot
frame
steganography
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410502396.XA
Other languages
English (en)
Other versions
CN104282310B (zh
Inventor
王让定
羊开云
严迪群
金超
孙冉
周劲蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo University
Original Assignee
Ningbo University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo University filed Critical Ningbo University
Priority to CN201410502396.XA priority Critical patent/CN104282310B/zh
Publication of CN104282310A publication Critical patent/CN104282310A/zh
Application granted granted Critical
Publication of CN104282310B publication Critical patent/CN104282310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种针对MP3Stego隐写后的音频的隐写检测方法,其先将未隐写的MP3压缩音频和隐写MP3压缩音频构成样本库;然后对每个样本进行重压缩编码,获得每个样本的载体估计;接着提取每个样本中的每帧的量化后的MDCT系数,获取每个样本对应的第一系数矩阵,同样提取每个载体估计中的每帧的量化后的MDCT系数,获取每个载体估计对应的第二系数矩阵;再通过计算对应的第一系数矩阵与第二系数矩阵中对应列之间的Hausdorff距离值,得到每个样本的最终隐写分析特征行向量;之后通过SVM分类器训练得到训练模板;最后利用训练模板对待检测的MP3压缩音频进行检测;优点是能很准确地确定MP3压缩音频是否经过MP3Stego隐写,尤其在隐秘信息嵌入率较低的情况下依然能获得很高的检测效率。

Description

一种针对MP3Stego隐写后的音频的隐写检测方法
技术领域
本发明涉及一种隐写检测方法,尤其是涉及一种针对MP3Stego隐写后的音频的隐写检测方法。
背景技术
隐写术是一种结合公开传播的多媒体文件的自身特点,将要传递的隐秘信息通过隐写算法隐藏到多媒体文件中的技术。隐写后的多媒体文件具有良好的不可感知性,在传输的过程中一般较难被检测出其携带的隐秘信息,只有隐写者指定的特定人群才能够从隐写后的多媒体文件中提取出隐秘信息。为防止不法分子将隐写术用于危害公共安全,需利用隐写检测技术对公开传播的多媒体文件进行检测,来判断公开传播的多媒体文件是否经过隐写。
作为隐写载体的多媒体文件的格式主要有图像、文本、视频、音频等。音频文件因其近年来在互联网上广泛流传,已成为隐写者与隐写检测者关注的热点。MP3Stego是目前最典型并且应用最广泛的音频隐写工具。针对MP3Stego隐写音频,目前已有很多检测算法,但大多数针对MP3Stego隐写音频的检测算法都是直接提取作为隐秘信息嵌入点的音频中的每一帧的编码块长度或者其他编码参数,通过分析这些编码参数变化特点来检测音频是否经过MP3Stego隐写,然而由于音频风格变化存在多样性,因此会影响编码块长度或其他编码参数的变化,从而会对隐写检测工作造成干扰,最终影响检测准确率。近年来,出现了一些对待检测音频进行消除隐写痕迹的操作如去噪,从而得到对原始音频的估计,然后将估计得到的音频与待检测音频相减从而消除音频本身风格变化的影响,提高了检测率,然而这些方法对原始音频的估计操作不能很好的消除隐写痕迹,因此得到的对原始音频的估计不够精确,导致在音频嵌入较少隐秘信息的情况下,检测效果不够理想。
发明内容
本发明所要解决的技术问题是提供一种针对MP3Stego隐写后的音频的隐写检测方法,其在隐秘信息嵌入率较低的情况下,依然能够获得很高的检测效率。
本发明解决上述技术问题所采用的技术方案为:一种针对MP3Stego隐写后的音频的隐写检测方法,其特征在于包括以下步骤:
①选取N个变化风格各不相同且未压缩的WAV音频,其中,N≥100;然后利用MP3音频8HZ编码器对每个WAV音频进行压缩编码,得到每个WAV音频对应的MP3压缩音频;并利用MP3Stego音频隐写工具对每个WAV音频隐写不同长度、不同内容的隐秘信息,得到每个WAV音频对应的隐写MP3压缩音频;再将N个MP3压缩音频和N个隐写MP3压缩音频构成一个样本库;
②利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩,得到样本库中的每个音频样本对应的WAV音频,在解压缩过程中,对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正;然后利用MP3音频lame编码器对样本库中的每个音频样本对应的WAV音频进行压缩编码,得到样本库中的每个音频样本对应的载体估计;
③利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩,提取出样本库中的每个音频样本中的每帧的576个量化后的MDCT系数,以每个音频样本中的每帧的576个量化后的MDCT系数作为一行,将样本库中的每个音频样本对应的所有量化后的MDCT系数构成一个第一系数矩阵,将样本库中的第i个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵记为Xi X i = x 1,1 x 1,2 · · · x 1,575 x 1,576 x 2,1 x 2,2 · · · x 2,575 x 2,576 · · · · · · · · · · · · · · · x N i f , 1 x N i f , 2 · · · x N i f , 575 x N i f , 576 , 其中,1≤i≤2N,Xi的维数为表示样本库中的第i个音频样本中包含的帧的总数,x1,1、x1,2、x1,575、x1,576对应表示样本库中的第i个音频样本中的第1帧的第1个、第2个、第575个、第576个量化后的MDCT系数,x2,1、x2,2、x2,575、x2,576对应表示样本库中的第i个音频样本中的第2帧的第1个、第2个、第575个、第576个量化后的MDCT系数,对应表示样本库中的第i个音频样本中的第帧的第1个、第2个、第575个、第576个量化后的MDCT系数;
同样,利用MP3音频lame解码器对样本库中的每个音频样本对应的载体估计进行解压缩,提取出样本库中的每个音频样本对应的载体估计中的每帧的576个量化后的MDCT系数,以每个载体估计中的每帧的576个量化后的MDCT系数作为一行,将样本库中的每个音频样本对应的载体估计对应的所有量化后的MDCT系数构成一个第二系数矩阵,将样本库中的第i个音频样本对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵记为Xi', X i ′ = x ′ 1,1 x ′ 1,2 · · · x ′ 1,575 x ′ 1,576 x ′ 2,1 x ′ 2,2 · · · x ′ 2,575 x ′ 2,576 · · · · · · · · · · · · · · · x ′ N i f , 1 x ′ N i f , 2 · · · x ′ N i f , 575 x ′ N i f , 576 , 其中,1≤i≤2N,Xi'的维数为表示样本库中的第i个音频样本中包含的帧的总数,亦表示样本库中的第i个音频样本对应的载体估计中包含的帧的总数,x'1,1、x'1,2、x'1,575、x'1,576对应表示样本库中的第i个音频样本对应的载体估计中的第1帧的第1个、第2个、第575个、第576个量化后的MDCT系数,x'2,1、x'2,2、x'2,575、x'2,576对应表示样本库中的第i个音频样本对应的载体估计中的第2帧的第1个、第2个、第575个、第576个量化后的MDCT系数,对应表示样本库中的第i个音频样本对应的载体估计中的第帧的第1个、第2个、第575个、第576个量化后的MDCT系数;
④计算样本库中的每个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵中的每一列与该音频样本对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵中对应列之间的Hausdorff距离值,将样本库中的每个音频样本对应的576个Hausdorff距离值构成一个初级隐写分析特征行向量,将样本库中的第i个音频样本对应的576个Hausdorff距离值构成的初级隐写分析特征行向量记为Fi,Fi=[hd1 hd2…hdk…hd575 hd576],其中,1≤i≤2N,hdk表示Xi中的第k列与Xi'中的第k列之间的Hausdorff距离值,1≤k≤576;
⑤根据样本库中的每个音频样本对应的576个Hausdorff距离值构成的初级隐写分析特征行向量,获取样本库中的每个音频样本对应的最终隐写分析特征行向量,将样本库中的第i个音频样本对应的最终隐写分析特征行向量记为Fi',Fi'=[μi mi σi pi si],其中,1≤i≤2N,μi表示Fi中的所有元素的均值,mi表示Fi中的所有元素中的最大值,mi=max(hd1,hd2,...,hdk,...,hd576),max()为取最大值函数,σi表示Fi中的所有元素的方差,pi表示Fi中的所有元素的峰度系数,si表示Fi中的所有元素的三阶中心距, s i = 1 576 Σ k = 1 576 ( hd k - μ i ) 3 ;
⑥对样本库中的每个音频样本对应的最终隐写分析特征行向量进行标记,对于样本库中的第i个音频样本,如果该音频样本为MP3压缩音频,则将该音频样本对应的最终隐写分析特征行向量标记为-1,如果该音频样本为隐写MP3压缩音频,则将该音频样本对应的最终隐写分析特征行向量标记为+1,其中,1≤i≤2N;然后将所有标记后的最终隐写分析特征行向量输入SVM分类器进行训练,得到训练模板;
⑦对于任意一个待检测的MP3压缩音频,按照步骤②至步骤⑤的过程,以相同的方式获取该MP3压缩音频对应的最终隐写分析特征行向量,然后利用训练模板对该MP3压缩音频对应的最终隐写分析特征行向量进行检测,以确定该MP3压缩音频是否经过MP3Stego音频隐写工具隐写。
所述的步骤②中对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正的具体过程为:
②-1、将样本库中当前待处理的第i个音频样本定义为当前音频样本,其中,1≤i≤2N;
②-2、假设当前音频样本中包含有帧,且帧序号从1开始编,并将当前音频样本中当前待处理的第j帧定义为当前帧,其中,
②-3、如果当前帧的帧序号j为奇数,则保持当前帧的编码参数量化步长不变,然后执行步骤②-4;如果当前帧的帧序号j为偶数,则将前一帧的编码参数量化步长作为当前帧的编码参数量化步长,完成对当前帧的编码参数量化步长的修正,然后执行步骤②-4;
②-4、令j=j+1,然后将当前音频样本中下一帧待处理的帧作为当前帧,再返回步骤②-3继续执行,直至当前音频样本中的所有帧处理完毕,其中,j=j+1中的“=”为赋值符号;
②-5、令i=i+1,然后将样本库中下一个待处理的音频样本作为当前音频样本,再返回步骤②-2继续执行,直至样本库中的所有音频样本处理完毕,其中,i=i+1中的“=”为赋值符号。
所述的步骤④中Xi中的第k列与Xi'中的第k列之间的Hausdorff距离值hdk的获取过程为:
④-1、将Xi中的第k列记为Ci,k,将Xi'中的第k列记为C'i,k
④-2、将Ci,k中当前待处理的第j个元素定义为当前元素,其中,
④-3、计算当前元素与C'i,k中的每个元素之间的欧氏距离,得到当前元素对应的个欧氏距离,然后获取当前元素对应的个欧氏距离中的最小欧氏距离值;
④-4、令j=j+1,然后将Ci,k中下一个待处理的元素作为当前元素,再返回步骤④-3继续执行,直至Ci,k中的所有元素处理完毕,得到Ci,k中的每个元素对应的一个最小欧氏距离值,其中,j=j+1中的“=”为赋值符号;
④-5、获取Ci,k对应的个最小欧氏距离值中的最大值,然后将该最大值作为Xi中的第k列与Xi'中的第k列之间的Hausdorff距离值,记为hdk
与现有技术相比,本发明的优点在于:
1)本发明方法根据MP3Stego音频隐写工具的隐写原理,提出在每个音频样本解压缩过程中对音频样本中帧序号为偶数的帧的编码参数量化步长进行修正,从而得到对隐写后音频没隐写之前的状态的估计,这种方式能有效去除隐写痕迹,因此其与待测音频结合能够消除音频本身风格变化对隐写检测结果的干扰,从而提高检测效率,特别是在音频嵌入较少隐秘信息的情况下检测效率依然很高。
2)本发明方法通过计算音频样本对应的系数矩阵中的每一列与音频样本对应的载体估计对应的系数矩阵中对应列之间的Hausdorff(豪斯多夫)距离值,来获取音频样本对应的初级隐写分析特征行向量,使得本发明方法能够敏锐检测出隐写操作对待检测音频中的每帧量化后的MDCT系数的微小变化,从而能够有效提高检测效率。
3)本发明方法根据音频样本对应的初级隐写分析特征行向量,构造五个高阶统计特征,以得到音频样本对应的最终隐写分析特征行向量,这使得本发明方法能够在较少的特征维数情况下得到较高的检测率,从而提高了检测效率。
附图说明
图1为本发明方法的总体实现框图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
本发明提出的一种针对MP3Stego隐写后的音频的隐写检测方法,其总体实现框图如图1所示,其包括以下步骤:
①选取N个变化风格各不相同且未压缩的WAV音频,其中,N≥100;然后利用MP3音频8HZ编码器对每个WAV音频进行压缩编码,得到每个WAV音频对应的MP3压缩音频;并利用MP3Stego音频隐写工具对每个WAV音频隐写不同长度、不同内容的隐秘信息,得到每个WAV音频对应的隐写MP3压缩音频;再将N个MP3压缩音频和N个隐写MP3压缩音频构成一个样本库。
在实际操作时,选取的N个WAV音频的长度既可以全部相同,也可以部分相同,也可以各不相同,即对选取的WAV音频的长度不作要求;N可取值为100;利用MP3音频8HZ编码器对每个WAV音频进行压缩编码,实际上可以直接利用MP3Stego音频隐写工具对每个WAV音频不隐写隐秘信息,只进行压缩编码,同样可以得到每个WAV音频对应的MP3压缩音频。
②利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩,得到样本库中的每个音频样本对应的WAV音频,在解压缩过程中,对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正;然后利用MP3音频lame编码器对样本库中的每个音频样本对应的WAV音频进行压缩编码,得到样本库中的每个音频样本对应的载体估计。
在此具体实施例中,步骤②中对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正的具体过程为:
②-1、将样本库中当前待处理的第i个音频样本定义为当前音频样本,其中,1≤i≤2N。
②-2、假设当前音频样本中包含有帧,且帧序号从1开始编,并将当前音频样本中当前待处理的第j帧定义为当前帧,其中,
②-3、如果当前帧的帧序号j为奇数,则保持当前帧的编码参数量化步长不变,然后执行步骤②-4;如果当前帧的帧序号j为偶数,则将当前帧的前一帧的编码参数量化步长作为当前帧的编码参数量化步长,完成对当前帧的编码参数量化步长的修正,然后执行步骤②-4。
②-4、令j=j+1,然后将当前音频样本中下一帧待处理的帧作为当前帧,再返回步骤②-3继续执行,直至当前音频样本中的所有帧处理完毕,其中,j=j+1中的“=”为赋值符号。
②-5、令i=i+1,然后将样本库中下一个待处理的音频样本作为当前音频样本,再返回步骤②-2继续执行,直至样本库中的所有音频样本处理完毕,其中,i=i+1中的“=”为赋值符号。
在一个音频中,每帧的编码参数量化步长控制该帧在编码不失真情况下的精度,由于利用MP3Stego音频隐写工具进行隐写操作会改变每帧的编码参数量化步长,因此为了去除隐写痕迹,本发明方法对帧序号为偶数的所有帧的编码参数量化步长进行修正,即对于帧序号为偶数的帧,舍弃其本身的编码参数量化步长,复制其上一帧的编码参数量化步长进行编码。
③利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩,提取出样本库中的每个音频样本中的每帧的576个量化后的MDCT系数,以每个音频样本中的每帧的576个量化后的MDCT系数作为一行,将样本库中的每个音频样本对应的所有量化后的MDCT系数构成一个第一系数矩阵,将样本库中的第i个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵记为Xi X i = x 1,1 x 1,2 · · · x 1,575 x 1,576 x 2,1 x 2,2 · · · x 2,575 x 2,576 · · · · · · · · · · · · · · · x N i f , 1 x N i f , 2 · · · x N i f , 575 x N i f , 576 , 其中,1≤i≤2N,Xi的维数为表示样本库中的第i个音频样本中包含的帧的总数,x1,1、x1,2、x1,575、x1,576对应表示样本库中的第i个音频样本中的第1帧的第1个、第2个、第575个、第576个量化后的MDCT系数,x2,1、x2,2、x2,575、x2,576对应表示样本库中的第i个音频样本中的第2帧的第1个、第2个、第575个、第576个量化后的MDCT系数,对应表示样本库中的第i个音频样本中的第帧的第1个、第2个、第575个、第576个量化后的MDCT系数。
同样,利用MP3音频lame解码器对样本库中的每个音频样本对应的载体估计进行解压缩,提取出样本库中的每个音频样本对应的载体估计中的每帧的576个量化后的MDCT系数,以每个载体估计中的每帧的576个量化后的MDCT系数作为一行,将样本库中的每个音频样本对应的载体估计对应的所有量化后的MDCT系数构成一个第二系数矩阵,将样本库中的第i个音频样本对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵记为Xi', X i ′ = x ′ 1,1 x ′ 1,2 · · · x ′ 1,575 x ′ 1,576 x ′ 2,1 x ′ 2,2 · · · x ′ 2,575 x ′ 2,576 · · · · · · · · · · · · · · · x ′ N i f , 1 x ′ N i f , 2 · · · x ′ N i f , 575 x ′ N i f , 576 , 其中,1≤i≤2N,Xi'的维数为表示样本库中的第i个音频样本中包含的帧的总数,亦表示样本库中的第i个音频样本对应的载体估计中包含的帧的总数,x'1,1、x'1,2、x'1,575、x'1,576对应表示样本库中的第i个音频样本对应的载体估计中的第1帧的第1个、第2个、第575个、第576个量化后的MDCT系数,x'2,1、x'2,2、x'2,575、x'2,576对应表示样本库中的第i个音频样本对应的载体估计中的第2帧的第1个、第2个、第575个、第576个量化后的MDCT系数,对应表示样本库中的第i个音频样本对应的载体估计中的第帧的第1个、第2个、第575个、第576个量化后的MDCT系数。
④计算样本库中的每个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵中的每一列与该音频样本对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵中对应列之间的Hausdorff距离值,将样本库中的每个音频样本对应的576个Hausdorff距离值构成一个初级隐写分析特征行向量,将样本库中的第i个音频样本对应的576个Hausdorff距离值构成的初级隐写分析特征行向量记为Fi,Fi=[hd1 hd2…hdk…hd575 hd576],其中,1≤i≤2N,Fi的维数为576,hd1表示Xi中的第1列与Xi'中的第1列之间的Hausdorff距离值,hd2表示Xi中的第2列与Xi'中的第2列之间的Hausdorff距离值,hdk表示Xi中的第k列与Xi'中的第k列之间的Hausdorff距离值,hd575表示Xi中的第575列与Xi'中的第575列之间的Hausdorff距离值,hd576表示Xi中的第576列与Xi'中的第576列之间的Hausdorff距离值,1≤k≤576。
在此具体实施例中,步骤④中Xi中的第k列与Xi'中的第k列之间的Hausdorff距离值hdk的获取过程为:
④-1、将Xi中的第k列记为Ci,k,将Xi'中的第k列记为C'i,k
④-2、将Ci,k中当前待处理的第j个元素定义为当前元素,其中,
④-3、计算当前元素与C'i,k中的每个元素之间的欧氏距离,得到当前元素对应的个欧氏距离,然后获取当前元素对应的个欧氏距离中的最小欧氏距离值。
④-4、令j=j+1,然后将Ci,k中下一个待处理的元素作为当前元素,再返回步骤④-3继续执行,直至Ci,k中的所有元素处理完毕,得到Ci,k中的每个元素对应的一个最小欧氏距离值,其中,j=j+1中的“=”为赋值符号。
④-5、获取Ci,k对应的个最小欧氏距离值中的最大值,然后将该最大值作为Xi中的第k列与Xi'中的第k列之间的Hausdorff距离值,记为hdk
⑤为了减少初级隐写分析特征行向量的维数,及提高检测效果,本发明方法将步骤④中得到的576个元素的五个高阶统计量作为最终隐写分析特征行向量,即根据样本库中的每个音频样本对应的576个Hausdorff距离值构成的初级隐写分析特征行向量,获取样本库中的每个音频样本对应的最终隐写分析特征行向量,将样本库中的第i个音频样本对应的最终隐写分析特征行向量记为Fi',Fi'=[μi mi σi pi si],其中,1≤i≤2N,Fi'的维数为5,μi表示Fi中的所有元素的均值,mi表示Fi中的所有元素中的最大值,mi=max(hd1,hd2,...,hdk,...,hd576),max()为取最大值函数,σi表示Fi中的所有元素的方差,pi表示Fi中的所有元素的峰度系数,si表示Fi中的所有元素的三阶中心距,
⑥对样本库中的每个音频样本对应的最终隐写分析特征行向量进行标记,对于样本库中的第i个音频样本,如果该音频样本为MP3压缩音频,则将该音频样本对应的最终隐写分析特征行向量标记为-1,如果该音频样本为隐写MP3压缩音频,则将该音频样本对应的最终隐写分析特征行向量标记为+1,其中,1≤i≤2N;然后将所有标记后的最终隐写分析特征行向量输入SVM分类器进行训练,得到训练模板。
⑦对于任意一个待检测的MP3压缩音频,按照步骤②至步骤⑤的过程,以相同的方式获取该MP3压缩音频对应的最终隐写分析特征行向量,即利用MP3音频lame解码器对该MP3压缩音频进行解压缩,得到该MP3压缩音频对应的WAV音频,在解压缩过程中,对该MP3压缩音频中的所有帧序号为偶数的帧的编码参数量化步长进行修正,然后利用MP3音频lame编码器对该MP3压缩音频对应的WAV音频进行压缩编码,得到该MP3压缩音频对应的载体估计,利用MP3音频lame解码器对该MP3压缩音频进行解压缩,提取出该MP3压缩音频中的每帧的576个量化后的MDCT系数,以该MP3压缩音频中的每帧的576个量化后的MDCT系数作为一行,将该MP3压缩音频对应的所有量化后的MDCT系数构成一个第一系数矩阵,同样利用MP3音频lame解码器对该MP3压缩音频对应的载体估计进行解压缩,提取出该MP3压缩音频对应的载体估计中的每帧的576个量化后的MDCT系数,以该MP3压缩音频载体估计中的每帧的576个量化后的MDCT系数作为一行,将该MP3压缩音频对应的载体估计对应的所有量化后的MDCT系数构成一个第二系数矩阵,计算该MP3压缩音频对应的所有量化后的MDCT系数构成的第一系数矩阵中的每一列与该MP3压缩音频对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵中对应列之间的Hausdorff距离值,将该MP3压缩音频对应的576个Hausdorff距离值构成一个初级隐写分析特征行向量,根据该MP3压缩音频对应的576个Hausdorff距离值构成的初级隐写分析特征行向量,获取该MP3压缩音频对应的最终隐写分析特征行向量;然后利用训练模板对该MP3压缩音频对应的最终隐写分析特征行向量进行检测,以确定该MP3压缩音频是否经过MP3Stego音频隐写工具隐写。
为更好地说明本发明方法的可行性和有效性,对本发明方法进行实验验证。
一次隐写分析的结果可能会出现以下四种情况的其中一种:1)待检测的MP3压缩音频为含密载体,隐写检测方法的判断结果也为含密载体,属于真阳性(True Positive);2)待检测的MP3压缩音频为原始载体,隐写检测方法判断其为含密载体,属于假阳性,虚警(False Positive);3)待检测的MP3压缩音频为原始载体,隐写检测方法的判断结果也为原始载体,属于真阴性(True Negative);4)待检测的MP3压缩音频为含密载体,隐写检测方法判断其为原始载体,属于假阴性,误警(False Negative)。
在实验中,任意选取风格变化较大的50个未隐写的MP3压缩音频和50个经MP3Stego音频隐写工具一次隐写最小文本长度的隐秘信息后的隐写MP3压缩音频,然后利用本发明方法的步骤②至步骤⑤的过程,以相同的方式分别获得这100个音频各自对应的最终隐写分析特征行向量,再利用本发明方法的步骤⑥获得的训练模板分别对这100个音频进行检测,检测结果为:属于真阳性有49个音频,属于假阳性的有0个音频,属于真阴性的有50个音频,属于假阴性的有1个音频,检测正确率如表1所列,从表1中可以看出,本发明方法的检测正确率很好,充分说明了本发明方法的可行性和有效性。。
表1对50个未隐写的MP3压缩音频和50个经MP3Stego音频隐写工具一次隐写后的隐写MP3压缩音频的检测结果的比较

Claims (3)

1.一种针对MP3Stego隐写后的音频的隐写检测方法,其特征在于包括以下步骤:
①选取N个变化风格各不相同且未压缩的WAV音频,其中,N≥100;然后利用MP3音频8HZ编码器对每个WAV音频进行压缩编码,得到每个WAV音频对应的MP3压缩音频;并利用MP3Stego音频隐写工具对每个WAV音频隐写不同长度、不同内容的隐秘信息,得到每个WAV音频对应的隐写MP3压缩音频;再将N个MP3压缩音频和N个隐写MP3压缩音频构成一个样本库;
②利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩,得到样本库中的每个音频样本对应的WAV音频,在解压缩过程中,对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正;然后利用MP3音频lame编码器对样本库中的每个音频样本对应的WAV音频进行压缩编码,得到样本库中的每个音频样本对应的载体估计;
③利用MP3音频lame解码器对样本库中的每个音频样本进行解压缩,提取出样本库中的每个音频样本中的每帧的576个量化后的MDCT系数,以每个音频样本中的每帧的576个量化后的MDCT系数作为一行,将样本库中的每个音频样本对应的所有量化后的MDCT系数构成一个第一系数矩阵,将样本库中的第i个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵记为Xi X i = x 1,1 x 1,2 · · · x 1,575 x 1,576 x 2,1 x 2,2 · · · x 2,575 x 2,576 · · · · · · · · · · · · · · · x N i f , 1 x N i f , 2 · · · x N i f , 575 x N i f , 576 , 其中,1≤i≤2N,Xi的维数为表示样本库中的第i个音频样本中包含的帧的总数,x1,1、x1,2、x1,575、x1,576对应表示样本库中的第i个音频样本中的第1帧的第1个、第2个、第575个、第576个量化后的MDCT系数,x2,1、x2,2、x2,575、x2,576对应表示样本库中的第i个音频样本中的第2帧的第1个、第2个、第575个、第576个量化后的MDCT系数,对应表示样本库中的第i个音频样本中的第帧的第1个、第2个、第575个、第576个量化后的MDCT系数;
同样,利用MP3音频lame解码器对样本库中的每个音频样本对应的载体估计进行解压缩,提取出样本库中的每个音频样本对应的载体估计中的每帧的576个量化后的MDCT系数,以每个载体估计中的每帧的576个量化后的MDCT系数作为一行,将样本库中的每个音频样本对应的载体估计对应的所有量化后的MDCT系数构成一个第二系数矩阵,将样本库中的第i个音频样本对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵记为Xi', X i ′ = x ′ 1,1 x ′ 1,2 · · · x ′ 1,575 x ′ 1,576 x ′ 2,1 x ′ 2,2 · · · x ′ 2,575 x ′ 2,576 · · · · · · · · · · · · · · · x ′ N i f , 1 x ′ N i f , 2 · · · x ′ N i f , 575 x ′ N i f , 576 , 其中,1≤i≤2N,Xi'的维数为表示样本库中的第i个音频样本中包含的帧的总数,亦表示样本库中的第i个音频样本对应的载体估计中包含的帧的总数,x'1,1、x'1,2、x'1,575、x'1,576对应表示样本库中的第i个音频样本对应的载体估计中的第1帧的第1个、第2个、第575个、第576个量化后的MDCT系数,x'2,1、x'2,2、x'2,575、x'2,576对应表示样本库中的第i个音频样本对应的载体估计中的第2帧的第1个、第2个、第575个、第576个量化后的MDCT系数,对应表示样本库中的第i个音频样本对应的载体估计中的第帧的第1个、第2个、第575个、第576个量化后的MDCT系数;
④计算样本库中的每个音频样本对应的所有量化后的MDCT系数构成的第一系数矩阵中的每一列与该音频样本对应的载体估计对应的所有量化后的MDCT系数构成的第二系数矩阵中对应列之间的Hausdorff距离值,将样本库中的每个音频样本对应的576个Hausdorff距离值构成一个初级隐写分析特征行向量,将样本库中的第i个音频样本对应的576个Hausdorff距离值构成的初级隐写分析特征行向量记为Fi,Fi=[hd1 hd2…hdk…hd575 hd576],其中,1≤i≤2N,hdk表示Xi中的第k列与Xi'中的第k列之间的Hausdorff距离值,1≤k≤576;
⑤根据样本库中的每个音频样本对应的576个Hausdorff距离值构成的初级隐写分析特征行向量,获取样本库中的每个音频样本对应的最终隐写分析特征行向量,将样本库中的第i个音频样本对应的最终隐写分析特征行向量记为Fi',Fi'=[μi mi σi pi si],其中,1≤i≤2N,μi表示Fi中的所有元素的均值,mi表示Fi中的所有元素中的最大值,mi=max(hd1,hd2,...,hdk,...,hd576),max()为取最大值函数,σi表示Fi中的所有元素的方差,pi表示Fi中的所有元素的峰度系数,si表示Fi中的所有元素的三阶中心距, s i = 1 576 Σ k = 1 576 ( hd k - μ i ) 3 ;
⑥对样本库中的每个音频样本对应的最终隐写分析特征行向量进行标记,对于样本库中的第i个音频样本,如果该音频样本为MP3压缩音频,则将该音频样本对应的最终隐写分析特征行向量标记为-1,如果该音频样本为隐写MP3压缩音频,则将该音频样本对应的最终隐写分析特征行向量标记为+1,其中,1≤i≤2N;然后将所有标记后的最终隐写分析特征行向量输入SVM分类器进行训练,得到训练模板;
⑦对于任意一个待检测的MP3压缩音频,按照步骤②至步骤⑤的过程,以相同的方式获取该MP3压缩音频对应的最终隐写分析特征行向量,然后利用训练模板对该MP3压缩音频对应的最终隐写分析特征行向量进行检测,以确定该MP3压缩音频是否经过MP3Stego音频隐写工具隐写。
2.根据权利要求1所述的一种针对MP3Stego隐写后的音频的隐写检测方法,其特征在于所述的步骤②中对样本库中的每个音频样本中的所有帧序号为偶数的帧的编码参数量化步长进行修正的具体过程为:
②-1、将样本库中当前待处理的第i个音频样本定义为当前音频样本,其中,1≤i≤2N;
②-2、假设当前音频样本中包含有帧,且帧序号从1开始编,并将当前音频样本中当前待处理的第j帧定义为当前帧,其中,
②-3、如果当前帧的帧序号j为奇数,则保持当前帧的编码参数量化步长不变,然后执行步骤②-4;如果当前帧的帧序号j为偶数,则将前一帧的编码参数量化步长作为当前帧的编码参数量化步长,完成对当前帧的编码参数量化步长的修正,然后执行步骤②-4;
②-4、令j=j+1,然后将当前音频样本中下一帧待处理的帧作为当前帧,再返回步骤②-3继续执行,直至当前音频样本中的所有帧处理完毕,其中,j=j+1中的“=”为赋值符号;
②-5、令i=i+1,然后将样本库中下一个待处理的音频样本作为当前音频样本,再返回步骤②-2继续执行,直至样本库中的所有音频样本处理完毕,其中,i=i+1中的“=”为赋值符号。
3.根据权利要求1或2所述的一种针对MP3Stego隐写后的音频的隐写检测方法,其特征在于所述的步骤④中Xi中的第k列与Xi'中的第k列之间的Hausdorff距离值hdk的获取过程为:
④-1、将Xi中的第k列记为Ci,k,将Xi'中的第k列记为C'i,k
④-2、将Ci,k中当前待处理的第j个元素定义为当前元素,其中,
④-3、计算当前元素与C'i,k中的每个元素之间的欧氏距离,得到当前元素对应的个欧氏距离,然后获取当前元素对应的个欧氏距离中的最小欧氏距离值;
④-4、令j=j+1,然后将Ci,k中下一个待处理的元素作为当前元素,再返回步骤④-3继续执行,直至Ci,k中的所有元素处理完毕,得到Ci,k中的每个元素对应的一个最小欧氏距离值,其中,j=j+1中的“=”为赋值符号;
④-5、获取Ci,k对应的个最小欧氏距离值中的最大值,然后将该最大值作为Xi中的第k列与Xi'中的第k列之间的Hausdorff距离值,记为hdk
CN201410502396.XA 2014-09-26 2014-09-26 一种针对MP3Stego隐写后的音频的隐写检测方法 Active CN104282310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410502396.XA CN104282310B (zh) 2014-09-26 2014-09-26 一种针对MP3Stego隐写后的音频的隐写检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410502396.XA CN104282310B (zh) 2014-09-26 2014-09-26 一种针对MP3Stego隐写后的音频的隐写检测方法

Publications (2)

Publication Number Publication Date
CN104282310A true CN104282310A (zh) 2015-01-14
CN104282310B CN104282310B (zh) 2017-05-03

Family

ID=52257129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410502396.XA Active CN104282310B (zh) 2014-09-26 2014-09-26 一种针对MP3Stego隐写后的音频的隐写检测方法

Country Status (1)

Country Link
CN (1) CN104282310B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104637484A (zh) * 2015-02-03 2015-05-20 宁波大学 一种基于共生矩阵分析的mp3音频隐写检测方法
CN105070297A (zh) * 2015-07-16 2015-11-18 宁波大学 一种mp3音频压缩历史检测方法
CN105118512A (zh) * 2015-07-23 2015-12-02 武汉大学 一种面向aac数字音频的通用隐写分析方法
CN105513600A (zh) * 2016-01-13 2016-04-20 宁波大学 一种与时长相关的相同码率mp3双压缩检测方法
CN105719660A (zh) * 2016-01-21 2016-06-29 宁波大学 一种基于量化特性的语音篡改定位检测方法
CN109448744A (zh) * 2018-12-14 2019-03-08 中国科学院信息工程研究所 一种基于符号位自适应嵌入的mp3音频信息隐藏方法和系统
CN110390941A (zh) * 2019-07-01 2019-10-29 清华大学 基于系数相关模型的mp3音频隐写分析方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101494051A (zh) * 2008-01-23 2009-07-29 武汉大学 一种针对时域音频lsb隐写的检测方法
CN101847411A (zh) * 2010-05-28 2010-09-29 中国科学技术大学 一种midi音频隐写分析方法及装置
CN102063907A (zh) * 2010-10-12 2011-05-18 武汉大学 一种针对音频扩频隐写的隐写分析方法
CN102509551A (zh) * 2011-11-23 2012-06-20 北京邮电大学 基于倒谱和差分方差的音频隐写分析算法
CN103106901A (zh) * 2013-01-22 2013-05-15 宁波大学 一种基于索引值的压缩域音频数字隐写及提取方法
CN103236265A (zh) * 2013-04-08 2013-08-07 宁波大学 一种针对MP3Stegz的隐写检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101494051A (zh) * 2008-01-23 2009-07-29 武汉大学 一种针对时域音频lsb隐写的检测方法
CN101847411A (zh) * 2010-05-28 2010-09-29 中国科学技术大学 一种midi音频隐写分析方法及装置
CN102063907A (zh) * 2010-10-12 2011-05-18 武汉大学 一种针对音频扩频隐写的隐写分析方法
CN102509551A (zh) * 2011-11-23 2012-06-20 北京邮电大学 基于倒谱和差分方差的音频隐写分析算法
CN103106901A (zh) * 2013-01-22 2013-05-15 宁波大学 一种基于索引值的压缩域音频数字隐写及提取方法
CN103236265A (zh) * 2013-04-08 2013-08-07 宁波大学 一种针对MP3Stegz的隐写检测方法

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
CHAO JIN ET AL: ""A NOVEL DETECTION SCHEME FOR MP3STEG0 WITH LOW PAYLOAD"", 《SIGNAL AND INFORMATION PROCESSING,2014 IEEE CHINA SUMMIT & INTERNATIONAL CONFERENCE》 *
DIQUN YAN ET AL: ""Steganalysis for MP3Stego using differential statistics of quantization step"", 《DIGITAL SIGNAL PROCESSING》 *
MENGYU QIAO ET AL: ""Feature Mining and Intelligent Computing for MP3 Steganalysis"", 《2009 INTERNATIONAL JOINT CONFERENCE ON BIOINFORMATICS, SYSTEMS BIOLOGY AND INTELLIGENT COMPUTING》 *
MENGYU QIAO ET AL: ""MP3 audio steganalysis"", 《INFORMATION SCIENCES》 *
QINGZHONG LIU ET AL: ""Temporal Derivative-B ased Spectrum and Mel-Cepstrum Audio Steganalysis"", 《IEEE TRANSACTIONS ON TNFORMATION FORENSICS AND SECURITY》 *
S.GEETHA ET AL: ""Audio steganalysis with Hausdorff distance higher order statistics using a rule based decision tree paradigm"", 《EXPERT SYSTEMS WITH APPLICATIONS》 *
郭洪刚 等: ""基于差分统计量的MP3Stego隐写分析算法"", 《计算机工程与应用》 *
陈益如 等: ""基于Huffman码表索引的MP3 Stego隐写分析方法"", 《计算机工程与应用》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104637484A (zh) * 2015-02-03 2015-05-20 宁波大学 一种基于共生矩阵分析的mp3音频隐写检测方法
CN105070297A (zh) * 2015-07-16 2015-11-18 宁波大学 一种mp3音频压缩历史检测方法
CN105070297B (zh) * 2015-07-16 2018-10-23 宁波大学 一种mp3音频压缩历史检测方法
CN105118512A (zh) * 2015-07-23 2015-12-02 武汉大学 一种面向aac数字音频的通用隐写分析方法
CN105118512B (zh) * 2015-07-23 2018-11-13 武汉大学 一种面向aac数字音频的通用隐写分析方法
CN105513600A (zh) * 2016-01-13 2016-04-20 宁波大学 一种与时长相关的相同码率mp3双压缩检测方法
CN105513600B (zh) * 2016-01-13 2019-02-05 宁波大学 一种与时长相关的相同码率mp3双压缩检测方法
CN105719660A (zh) * 2016-01-21 2016-06-29 宁波大学 一种基于量化特性的语音篡改定位检测方法
CN105719660B (zh) * 2016-01-21 2019-08-20 宁波大学 一种基于量化特性的语音篡改定位检测方法
CN109448744A (zh) * 2018-12-14 2019-03-08 中国科学院信息工程研究所 一种基于符号位自适应嵌入的mp3音频信息隐藏方法和系统
CN109448744B (zh) * 2018-12-14 2022-02-01 中国科学院信息工程研究所 一种基于符号位自适应嵌入的mp3音频信息隐藏方法和系统
CN110390941A (zh) * 2019-07-01 2019-10-29 清华大学 基于系数相关模型的mp3音频隐写分析方法及装置

Also Published As

Publication number Publication date
CN104282310B (zh) 2017-05-03

Similar Documents

Publication Publication Date Title
CN104282310A (zh) 一种针对MP3Stego隐写后的音频的隐写检测方法
Ali et al. High capacity, transparent and secure audio steganography model based on fractal coding and chaotic map in temporal domain
CN103533343B (zh) 一种基于数字水印的立体图像质量客观评价方法
CN102413328B (zh) Jpeg图像双重压缩检测方法及系统
CN102156955B (zh) 基于直方图邻域的鲁棒可逆水印嵌入与提取方法
CN104661037B (zh) 压缩图像量化表篡改的检测方法和系统
Ahani et al. Colour image steganography method based on sparse representation
Yang et al. Estimating JPEG compression history of bitmaps based on factor histogram
CN110457996B (zh) 基于vgg-11卷积神经网络的视频运动对象篡改取证方法
CN104795071A (zh) 一种盲音频水印嵌入及水印提取的处理方法
CN101835049A (zh) 一种jpeg图像自嵌入数字水印的生成及认证方法
CN103310235A (zh) 一种基于参数识别与估计的隐写分析方法
Xu et al. No‐reference stereoscopic image quality assessment based on saliency‐guided binocular feature consolidation
CN103067713A (zh) 一种位图jpeg压缩检测的方法及系统
CN100399353C (zh) 一种基于图像特征的电子印章认证方法
CN101923700B (zh) 一种双效数字水印方法
CN103903214B (zh) 基于mcuu模型下的dct域图像隐写容量的评估方法
Luo et al. Steganalysis of adaptive image steganography in multiple gray code bit-planes
CN102664014B (zh) 一种基于对数量化索引调制的盲音频水印实现方法
CN104715440A (zh) 基于Gabor滤波器组与DWT变换的遥感影像感知哈希认证方法
CN104637484A (zh) 一种基于共生矩阵分析的mp3音频隐写检测方法
Fridrich Effect of cover quantization on steganographic fisher information
CN106530198A (zh) 基于参数拟合安全容量的自适应批量隐写方法
CN105046286A (zh) 基于自动视图生成和联合l1,2范数最小化的监督多视图特征选择方法
CN105070297B (zh) 一种mp3音频压缩历史检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant