CN107610711A - 基于量化索引调制qim的g.723.1语音信息隐写分析方法 - Google Patents

基于量化索引调制qim的g.723.1语音信息隐写分析方法 Download PDF

Info

Publication number
CN107610711A
CN107610711A CN201710788895.3A CN201710788895A CN107610711A CN 107610711 A CN107610711 A CN 107610711A CN 201710788895 A CN201710788895 A CN 201710788895A CN 107610711 A CN107610711 A CN 107610711A
Authority
CN
China
Prior art keywords
qim
steganography
index
matrix
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710788895.3A
Other languages
English (en)
Inventor
吴志军
姜园春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Civil Aviation University of China
Original Assignee
Civil Aviation University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Civil Aviation University of China filed Critical Civil Aviation University of China
Priority to CN201710788895.3A priority Critical patent/CN107610711A/zh
Publication of CN107610711A publication Critical patent/CN107610711A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明的隐写分析方法属于信息安全领域中信息隐藏技术的一种。方法通过检测语音载体中是否含有秘密信息,用于对抗量化索引调制(QIM,Quantization Index Modulation)隐写术的非法使用。本发明以G.723.1语音编码器为载体,针对QIM隐写方法进行检测。方法在对G.723.1语音编码矢量量化过程中,QIM隐写前后,码字索引值分布特性的变化进行分析的基础上,进行两项工作:(1)通过对索引的分布和转移概率矩阵进行量化,使用主成分分析法进行降维处理,得到维数较低的特征向量,并通过实验验证了降维后的特征向量仍对QIM隐写灵敏;(2)将提取的特征向量作为支持向量机(SVM,Support Vector Machine)分类器的输入,针对不同类别的语音样本进行实验,通过大量样本训练分类器,进行隐写分析实现与性能分析。

Description

基于量化索引调制QIM的G.723.1语音信息隐写分析方法
技术领域:
本发明属于计算机信息安全领域中的信息隐藏子领域,是一种隐写分析方法,特别针对G.723.1这种具体的语音编码信息的QIM隐写进行隐写分析。
背景技术:
目前,信息安全领域的两个主要分支是密码学和信息隐藏技术。隐写术是信息隐藏技术的重要分支,其英文为Steganography,主要用于传递隐秘信息,近年来发展迅猛,但是如果隐写术被不法分子所利用,将会严重影响信息安全传输,甚至危害国家安全。隐写分析技术的目的正是为了对抗隐写术的非法使用,检测载体中是否含有秘密信息,阻断非法信息的传递,保证通信安全。最早开始从事隐写分析研究工作的学者是美国乔治梅森大学(Gergo Mason University)大学的Neil F.Johnson,研究方向主要是图像隐写分析。
从专用隐写分析的角度来看,主要隐写分析方法的有以下几种:
(1)基于最低有效位(LSB,Least Significant Bit)的隐写分析方法
(2)基于回声隐藏的隐写方法
(3)基于相位隐藏的隐写分析方法
(4)基于扩频隐藏的隐写分析方法
(5)基于隐写软件的隐写分析方法
(6)基于量化索引调制的隐写分析方法
目前,对各隐写分析方法的研究都取得了一定成果,基于量化索引调制的隐写分析方法研究现状如下所述:
高海英分析QIM隐写后音频的变换域系数直方图,使用系数直方图较大值的距离构建特征向量,进而建立特征矩阵,提出了一种QIM盲检测算法,实验证明该方法只对简单的QIM有效,对DM-QIM(Dither Modulation QIM)算法效果并不明显。
Malik H、Subbalakshmi K P和Chandramouli R基于在变换域观察QIM隐写干扰邻域的相关性,使用核密度估计方法来检测概率密度函数的统计变化,估计参数密度模型,然后用于隐秘信息检测,并研究了内核的选择对估计密度的影响。隐写分析检测率高,但是运算量较大,漏检率也较大。
Fu J W等人提出了一种基于主成分分析(PCA,Principal Component Analysis)的小波域音频隐写分析方法。音频信号是通过四级离散小波变换分解,然后计算36个统计矩的直方图和频域直方图的音频信号和它的小波子带作为特征,使用PCA预处理的统计特征和径向基函数(RBF,Radial Basis Function)作为分类器。该方案不仅有效地降低了特征向量的维数,简化了分类器的设计,而且保持了检测性能,可用来检测检测音频信号的小波域LSB嵌入、量化索引调制法(QIM)和叠加法(AM,Addition Method)。
Liu Qingzhong等人提出了一种针对音频信号的二阶导数的基于傅立叶谱统计和梅尔倒谱系数的隐写分析方法,还设计了基于小波变换的频谱和美尔倒谱音频隐写分析。因为语音经过压缩编码后,产生失真较大,不能有效反应载体语音的特征,所以检测率并不高,但对最低有效位隐写检测效果良好。
李松斌等人研究了G.729编码过程中QIM隐写造成码流的显著性特征变化,提取了码字分布特性的量化特征,将131072维特征聚类,结合支持向量机的分类器,实现了对QIM的检测。另一项研究分析QIM隐写改变了压缩语音流中的音素分布特性(不均衡性和相关性),构建音素向量空间模型和音素状态转移模型,对音素分布特性进行量化,使用支持向量机(SVM,Support Vector Machine)构建了隐写检测器。该方法检测准确率高,而且无需解码即可在压缩域提取特征,节省了解码语音的时间。李松斌和黄永峰分析QIM隐写导致码流中的LPC滤波器的分布特性发生的变化,设计了相应的模型来进行特征提取,结合支持向量机进行检测,对时长为1秒的G.729A码流,检测准确率超过90%,耗时小于15毫秒,基本实现了对QIM隐写的快速有效检测。
孙建芳和汤光明针对DM-QIM隐写进行了检测,首先根据变换域系数差的绝对值,画出直方图,然后以直方图中一定间隔的点为特征,进行盲检测。
除此之外,还有一些相对研究较少的针对音频的隐写分析方法,例如对基于基音调制的信息隐写方法,李松斌、贾已真等人分析了语音流中相邻语音帧自适应码书的关联特性,设计码书关联网络模型来提取对隐写敏感的特征向量,结合支持向量机SVM进行检测,对低速率语音编码标准G.729以及G.723.1进行实验证明了该方法性能够对基于基音调制的隐写方法进行快速有效检测。
总之,在音频信息隐写方法中,量化索引调制QIM的隐写方法具有实现简单、算法复杂性低、语音失真小、隐蔽性和鲁棒性良好等优点,越来越受到研究者的青睐,对应的隐写分析方法陆续出现,但研究进展依然相对落后,需要不断提升。
发明内容:
本发明以G.723.1语音编码器为载体,为实现对基于量化索引调制(QIM,Quantization Index Modulation)的隐写方法的检测,发明了基于量化索引调制QIM的G.723.1语音信息隐写分析方法。
本发明的隐写分析方法是基于对隐写分析原理的分析提出的,隐写分析原理的系统模型如图1所示。在系统模型中,特征提取与选择这一环节在整个隐写分析过程中起着至关重要的作用,直接影响最终检测结果的好坏。提取的特征需要相对独立,受载体影响较小,同时对隐写方法反应灵敏,在隐写前后会发生一定变化。因此本发明对特征提取的处理进行了详细的说明。发明同时提供了对隐写分析方法的性能检测,主要包括用检测率、虚警率、漏检率和全局检测率等指标来定量表示的准确性和可靠性。
本发明中的方法首先需要以G.723.1语音编码器为载体,在编码过程实现隐写,编码器原理图如图2所示。编码器采用基于线性预测分析合成编码算法,并使感知加权误差信号最小。编码器工作的语音帧长度为240个样点,这相当于8kHz采样时的30ms语音长度。QIM隐写在语音编码的线性预测矢量量化过程中进行,线性预测矢量量化过程如下所述:
语音信号输入G.723.1语音编码器后,先经过高通滤波、分帧等处理过程,对前一子帧、当前子帧和下一子帧构成的数据进行加窗,窗是长度为180个样点的Hamming窗,窗对准当前子帧的中心,然后进行10阶LPC分析。
首先,对从窗口对准的信号中计算出R[0]~R[10]共11个自相关系数。然后,应用一个白噪声纠正因子(1025/1024)对R[0]进行修正,计算公式为R[0]=R[0](1+1/1024),对于R[1]~R[10]这10个自相关系数,分别乘以二项式窗口系数表中相应的值。最后,对每一个输入语音帧的4个子帧,使用Levinson-Durbin算法进行计算,获得4组10阶LPC系数[45]
LPC的合成滤波器定义如下公式所示。
其中,aij是LPC滤波器系数;i是子帧索引,取值为0,1,2,3。
因为LPC系数有较大的波动,可能会导致滤波器不稳定,所以LPC系数并不适合直接量化,需要进一步转换。于是,在经过频带扩展后,通过在单位圆上搜索和过零内插的方法,将LPC系数转换成线谱对(LSP,Line Spectrum Pair)系数,也称为线谱频率(LSF,LineSpectrum Frequency),对最后一个子帧的LSP系数进行预测分裂矢量量化PSVQ。
LSP系数分为两个3维矢量和一个4维矢量,三个分裂矢量分别记为f1,f2,f3,与之相对应的码本分别为L1,L2,L3,大小均为8比特,每个码本都拥有一个大小为28=256的码字空间,分别是{L1,0,L1,1,L1,2,L,L1,255},{L2,0,L2,1,L2,2,L,L2,255},{L3,0,L3,1,L3,2,L,L3,255},可统一记为{Li,0,Li,1,Li,2,L,Li,255},i=1,2,3。
根据最小误差准则,每个分裂矢量从相应的码本中选择最优码字,输出相应的码字索引,即为量化结果。
QIM隐写方法的精髓是码本划分算法,具体操作的过程是在上述矢量量化过程中从码本中选择最优码字的步骤。码本划分算法将码本分为几个互斥部分。即某一码本为L,分N个子码本L1,L2...LN,且满足且LiI Lj=φ。图3为两码本划分法的QIM隐写流程图。
为减小QIM算法因引入加性量化噪声,使得语音质量降低的现象,本发明在隐写时采用了一种改进的QIM隐写算法,降低了语音质量的失真。该方法依据互补邻居顶点算法(CNV,Complementary Neighbor Vertex)进行码本划分,所有的码字分为不同的连通图,每个连通图中含有偶数个码字,每个码字和与它欧氏距离最小的码字(最近顶点)属于同一个连通图,对码字及其最近顶点进行相反的标记,使得他们位于不同的子码本中。经过CNV-QIM隐写,码字搜索范围发生了变化:未进行隐写时,分裂矢量在一个码本(256个码字)中搜索最优码字;进行隐写后,码本被分为两个子码本,嵌入秘密信息比特“0”和“1”时,分裂矢量分别在其对应的子码本(128个码字)中搜索最优码字。为表明CNV-QIM隐写对其码字索引值分布特征影响,进行如下实验与分析:输入N个G.723.1语音帧,则这段语音输出的量化索引序列QIS(Quantization Index Sequence)可以表示为QISi={Si,1,Si,2,L,Si,jL,Si,N},其中Si,j∈[0,255],i=1,2,3,j∈[1,N]。更加明确地表示见表1,表1中一列数据表示一帧语音输出的3个量化索引序列,而表中一行数据表示N帧语音的第i个量化索引序列QISi的N个值。
表1量化索引序列
进行隐写后,与载体语音的量化索引序列相比,载密语音输出的量化索引序列会发生变化。为了更加直观地展示出QIS发生的变化,进行了如下步骤的实验。
步骤1:选取3s的语音片段(载体语音),即100帧语音,输入到G.723.1语音编码器,提取其输出的量化索引序列,记为“cover”类样本。
步骤2:对同一段语音进行CNV-QIM隐写,经过G.723.1语音编码后得到载密语音,提取输出的量化索引序列,记为“stego”类样本。
步骤3:选取“cover”类和“stego”类的第一个量化索引序列QIS1为代表,通过Matlab编码绘制出“cover”类和“stego”类的量化索引序列的分布图,如图4所示。
通过统计学的相关知识可以对索引值分布特性的变化进行量化,就可以对QIM进行隐写分析。因此,本发明中的方法对索引的分布概率和转移概率进行计算和处理:
假设N帧G.723.1语音输出的某一个量化索引序列QIS(Quantization IndexSequence)记为QIS={S1,S2,L,SjL,SN},其中Sj∈[0,255],j∈[1,N]。
索引序列中任意一位索引值Sj可以取得0~255之间任意一个整数值,可表示为Sj=k,k∈[0,255],概率P(Sj=k)定义如公式下所示。
其中,∑n(Sj=k)表示在N个语音帧中索引Sj=k出现的次数。
构造索引的概率分布矩阵A,如下公式所示。
概率分布矩阵A的维数是N×256,代表N帧语音信号的索引在其每种可能的取值(共256种)上的概率,表征索引分布的长时特征。
根据语音产生模型以及统计学规律,可将选择最优码字的过程视为离散时间随机过程。假设每个码字的出现仅与它前一码字有关,于是,任意索引Sj与它前j-1个索引的关系如公式下所示。
P(Sj/S1,S2,L,Sj-1)=P(Sj/Sj-1)
语音信号在一定时间内(一般认为10~30ms)具有短时平稳性,相邻的子帧之间具有一定的相关性。可以将量化索引序列QIS看作是一阶马尔可夫链,通过马尔可夫转移概率对索引之间的相关性进行量化表示。
通常情况下直接计算上面公式表示的条件概率比较困难,可进一步转换,如下所示。
计算马尔可夫转移概率mij,如下公式所示。
其中,Si,Sj∈[0,255]。
在得到转移概率后,即可表示出马尔可夫转移概率矩阵M,如下公式所示。
马尔可夫转移概率矩阵M表征索引之间的相关性,其维数是256×256。
原始矩阵的维数过高,将会使得训练误差过小,不利于分类器对样本统计特性进行估计,所以通过主成分分析(PCA,Principal Components Analysis)法对概率分布矩阵A和马尔可夫转移概率矩阵M进行降维处理。
主成分分析法是在尽可能少丢失信息的基础上,利用降维的思想,设法将具有相关性的大量变量,转化成一组较少的互不相关的变量,然后按照一定标准从中选取最能代表原始数据的变量,极大减少了计算量,得到的变量对分析问题更加有效。这些反映原始数据绝大部分特点的变量被称为主成分,每个主成分所含信息互不重叠。
将原始矩阵Yn×p,记为
主成分分析的计算步骤具体如下:
步骤1:计算协方差矩阵,如下面公式所示。
其中,i,j∈[1,p],yi和yj分别表示矩阵Y中第i列和第j列的列向量;分别表示矩阵Y中第i列和第j列的均值,
记xij=cov(yi,yj),则协方差矩阵如下面公式所示。
步骤2:计算协方差矩阵C的特征值和相应的特征向量。
用QR法或雅克比法求出协方差矩阵C的特征值,并按照从大到小的顺序排列,记为{λ1,λ2,L,λp},与之相应的特征向量记为{ai=(ai1,ai2,L,aip),i∈[1,p]}。a1,a2,L分别被称为第一主成分,第二主成分,...。
步骤3:选择重要的主成分。
引入贡献率达概念,贡献率是指某个特征值占全部特征值的比例,可表示为选取几个主成分,主要根据主成分的累积贡献率来决定,为了保证选取的主成分能够反映原始数据绝大部分特点,一般要求选取的主成分的累计贡献率达到85%以上。通过实验发现,当选取的特征值的数量为120时,累计贡献率可达到85%以上,也就是说,前120个特征向量能够充分反映原始数据的特点。
步骤4:降维处理,以进行进一步的统计分析。
选择完主要成分后,可以得到p×120维特征矩阵,把原始矩阵Y与特征矩阵相乘,就得到降维之后的n×120维矩阵,算法结束。
降维之后概率分布矩阵A变成N×120维矩阵A′,马尔可夫转移概率矩阵M变成256×120维矩阵M′,矩阵A′和矩阵M′分别表征索引的长时特征和索引之间的相关性。
为了检验经过PCA方法降维后,选取的特征向量能否表现出索引分布的长时特征和索引之间的相关性,进行如下实验:
步骤1:随机选取一段3s的语音片段(载体语音),即100帧语音,输入到G.723.1语音编码器,因为三个输出的量化索引序列都是经过8bit码书进行量化的,量化过程中又各自独立,所以提取第一个量化索引序列QIS1作为代表,计算其概率分布向量和马尔可夫转移概率矩阵,并进行降维处理,得到特征矩阵A′和M′,记为“cover”样本。
步骤2:对同一段语音进行CNV-QIM隐写,嵌入率100%,经过与步骤1中同样的处理过程后,得到矩阵A″和M″,记为“stego”样本。
步骤3:比较“cover”样本和“stego”样本对应的两个矩阵A′和A″中元素的变化率,记为γ1,γ1=A′和A″中对应元素不同的个数/(N×120);同样计算矩阵M′和M″中元素的变化率,记为γ2,γ2=M′和M″中对应元素不同的个数/(256×120)。
步骤4:选取10组3s语音,重复进行上述步骤,得到10组γ1和γ2的数值。为了更直观地展示,将10组变化率γ1和γ2绘制成曲线如图5所示。
从图5中可以看出,变化率γ1 -和γ2均在60%以上,表示降维后的特征矩阵对QIM隐写方法反应灵敏,仍旧能良好地反映出索引分布的长时特征和索引之间的相关性。
然后,本发明方法就可以使用降维后的特征矩阵对支持向量机SVM作为分类器进行训练,进行隐写分析以及方法的性能检测。方法的流程图如图6所示。方法的实验框架示意图如图7所示。实验具体环境与步骤及结果分析方式在具体实施方式中给出。
附图说明:
图1隐写分析系统模型
图2 G.723.1语音编码器方框图
图3 N=2时QIM隐写的流程图
图4量化索序列分布图
图5变化率γ1和γ2
图6隐写分析过程流程图
图7实验框架示意图
具体实施方式:
1.搭建方法实现及验证的实验环境:
实验是在Win7系统环境进行的,主要采用Visual Studio和Matlab软件进行编程,以G.723.1语音编码器为载体,用CVN-QIM隐写方法嵌入秘密信息。实验说明如下:
(1)样本语音首先进行8kHz采样,每个采样点进行16bit线性量化,存储为PCM格式文件,作为G.723.1语音编码器的输入信号。
(2)实验样本包含5种类别,分别是中文男声(CM,Chinese Man)、中文女声(CW,Chinese Woman)、英文男声(EM,English Man)、英文女声(EW,English Woman)、其余四种类别的混合语音(Hybrid)。
(3)每种类别的样本准备100个时长9s的语音片段,共计500个,经过隐写后,总样本数量达到1000个。
(4)本文采用支持向量机SVM作为分类器,并通过LIBSVM软件包来实现。选择的核函数是径向基核函数RBF,如下公式所示。
k(x,y)=exp(-γ||x-y||2)
RBF核函数中所有相关参数(公式中的γ和目标函数中的惩罚系数c)通过交叉验证调整到最佳。
2.方法实现的具体实验流程如下:
步骤1:采集100个时长为9s的语音片段,量化后以PCM格式存储,输入G.723.1语音编码器中,即可得到普通载体样本,记为“cover”类。
步骤2:使用CNV-QIM隐写方法(二分码本)在采集的语音片段中嵌入秘密信息,获得与步骤1中相对应的含密载体语音样本,记为“stego”类。
步骤3:提取所获得的两类样本的特征,构造特征向量,按照样本的类别标记每个向量。
步骤4:使用步骤3获得的“cover”类和“stego”类特征向量各80%作为训练样本,用来训练SVM分类器,得到特征向量的分类模型。
步骤5:将“cover”类和“stego”类剩余的20%特征向量作为待测样本,通过LIBSVM来实现SVM分类器功能,对待测样本进行隐写检测,输出检测结果。
3.方法性能分析结果:
将对概率分布矩阵A′和转移概率矩阵M′的检测分别记为一类检测和二类检测。采用检测率TPR、虚警率FPR和全局检测率Pr来评价隐写分析方法的准确性和可靠性。计算公式如下:
当嵌入率为100%时,一类检测和二类检测结果的平均值如下表表2所示。
表2一类和二类检测结果的平均值(%)
从表2中可以看出,对于五种类别的样本,其检测率均在90%以上,而虚警率均低于8%,证明本发明所提出的隐写分析方法是有效的;对于五种类别的样本,全局检测率均在均在90%以上,证明该算法可靠性良好。
针对上述五类样本,选用时长为9s的语音片段,与基于Mel倒谱系数统计特征的检测方法(简记为MFCC)进行对比,得到对检测率、虚警率和全局检测率的对比结果:
一类检测和二类检测的检测率和全局检测率均高于MFCC方法,而一类检测和二类检测的虚警率明显低于MFCC方法,说明本发明所提出的隐写分析方法准确性和可靠性更好。
依旧针对上述五类样本,每种类别的样本准备100个嵌入率为100%的语音片段,针对不同时长,进行实验,一类和二类检测的平均准确率(%)如下表表3所示。
表3一类和二类检测的平均准确率(%)
从表3中可以明显看出,时长越长,一类和二类检测的平均全局检测率越高,原因是语音时长越长,嵌入的秘密信息越多,导致隐写前后分布概率矩阵和条件转移概率矩阵变化明显,因而检测率越高。当时长达到3s以上时,一类检测的平均准确率才达到85%以上;而当时长达到2.4s以上时,二类检测的平均准确率达到85%以上;说明一类检测对时长变化更敏感,二类检测更适应不同时长的检测。

Claims (2)

1.基于量化索引调制QIM的G.723.1语音信息隐写分析方法,其特征体现在以下步骤的实施中,通过以下步骤说明此方法提出的过程与方法若干方面的性能分析:
(1)在一般性隐写分析模型的基础上,针对G.723.1语音编码原理中的线性预测矢量量化过程,进行QIM隐写对其码字索引值分布特征影响的实验分析;
(2)在(1)步骤后,针对QIM方法引起码本中码字索引值分布特性的变化做统计学分析:具体是计算索引的分布概率,得到分布概率矩阵A,表征索引分布的长时特征;马尔可夫转移概率,得到转移概率矩阵M,表征索引之间的相关性;然后,通过主成分分析(PCA,Principal Components Analysis)法对A和M进行降维处理,使其更有利于分类器对样本统计特性进行估计;
(3)对(2)产生的降维矩阵的特征向量,进行实验验证,判断其是否能表征出索引分布的长时特征和索引之间的相关性;
(4)在(3)验证的基础上,制定实验流程,选择支持向量机SVM分类器对QIM隐写进行隐写分析实验,并分析方法性能;性能包括:以检测率、全局检测率及虚警率为指标的准确性和可靠性;针对不同嵌入率和不同时长语音样本进行所提方法的隐写分析,并进行性能对比。
2.根据权利要求1所述的基于量化索引调制QIM的G.723.1语音信息隐写分析方法,其各个步骤中的计算处理及方法实现设计过程,具体内容及其相应的特征如下:
(1)权利要求1所述方法中的步骤(1)中,QIM隐写采用了互补邻居顶点算法(CNV,Complementary Neighbor Vertex)进行码本划分,其特征在于:减小因隐写而产生的失真;分析了QIM隐写对其码字索引值分布特征发生变化的原因,其特征在于:经过CNV-QIM隐写,码字搜索范围发生了变化:未进行隐写时,分裂矢量在一个码本(256个码字)中搜索最优码字;进行隐写后,码本被分为两个子码本,嵌入秘密信息比特“0”和“1”时,分裂矢量分别在其对应的子码本(128个码字)中搜索最优码字;提供了实验验证步骤,其特征如下:实验最终绘制出“cover”类(载体语音量化索引序列)和“stego”类(载密语音量化索引序列)的量化索引序列的分布图,以直观表示量化索引序列的变化,流程具体如下见说明书,分布图中同一帧“cover”类和“stego”类的索引值若不同,则表示载密语音和载体语音进行矢量量化时选择的最优码字不同;
(2)权利要求1所述方法的步骤(2)中,采用了主成分分析法对量化索引值分布特征,即分布概率矩阵和马尔可夫转移概率矩阵的降维处理的实施,其特征在于:降维之后概率分布矩阵A变成N×120维矩阵A′,马尔可夫转移概率矩阵M变成256×120维矩阵M′,矩阵A′和矩阵M′分别表征索引的长时特征和索引之间的相关性,降维处理有利于分类器对样本统计特性进行估计;
(3)权利要求1所述方法的步骤(3)中,采用了实验验证降维后的矩阵特征向量依然保证表征分布特征,其特征在于:实验验证结果通过变化率反应,通过计算“cover”样本和“stego”样本对应的两个矩阵A′和A″中元素的变化率,记为γ1,γ1=A′和A″中对应元素不同的个数/(N×120),同样计算矩阵M′和M″中元素的变化率,记为γ2,γ2=M′和M″中对应元素不同的个数/(256×120),绘制10组3s语音的变化率曲线图,得到验证结果,验证结果为:变化率γ1和γ2均在60%以上,表示降维后的特征矩阵对QIM隐写方法反应灵敏,仍旧能良好地反映出索引分布的长时特征和索引之间的相关性;
(4)权利要求1所述方法的步骤(4)中,针对Q.723.1语音信息QIM隐写分析的实验框架及流程的设计,其特征在于:采用支持向量机SVM作为分类器,针对中文男声CM、中文女声CW、英文男声EM、英文女声EW以及混合语音(Hybrid)5种类别的语音片段进行实验;通过实验对本发明方法进行性能检测,其特征在于:以检测率、虚警率和全局检测率为指标,分析本发明方法的准确性和可靠性,并与基于Mel倒谱系数统计特征的检测方法(简记为MFCC)对比,体现方法的性能优势;对不同嵌入率和不同时长的语音样本进行了隐写分析及性能对比,检验其对所提隐写分析方法性能的影响。
CN201710788895.3A 2017-08-29 2017-08-29 基于量化索引调制qim的g.723.1语音信息隐写分析方法 Pending CN107610711A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710788895.3A CN107610711A (zh) 2017-08-29 2017-08-29 基于量化索引调制qim的g.723.1语音信息隐写分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710788895.3A CN107610711A (zh) 2017-08-29 2017-08-29 基于量化索引调制qim的g.723.1语音信息隐写分析方法

Publications (1)

Publication Number Publication Date
CN107610711A true CN107610711A (zh) 2018-01-19

Family

ID=61057489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710788895.3A Pending CN107610711A (zh) 2017-08-29 2017-08-29 基于量化索引调制qim的g.723.1语音信息隐写分析方法

Country Status (1)

Country Link
CN (1) CN107610711A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109192217A (zh) * 2018-08-06 2019-01-11 中国科学院声学研究所 面向多类低速率压缩语音隐写的通用信息隐藏检测方法
CN109388959A (zh) * 2018-09-30 2019-02-26 陕西师范大学 结合差异聚类和最小误差纹理合成的生成式信息隐藏方法
CN109817233A (zh) * 2019-01-25 2019-05-28 清华大学 基于层次注意力网络模型的语音流隐写分析方法及系统
CN110663194A (zh) * 2017-03-20 2020-01-07 Hyphy美国有限公司 整合自适应压缩的媒体接口
CN110968845A (zh) * 2019-11-19 2020-04-07 天津大学 基于卷积神经网络生成的针对lsb隐写的检测方法
CN111028308A (zh) * 2019-11-19 2020-04-17 珠海涵辰科技有限公司 一种图像中信息的隐写及读取方法
CN117079669A (zh) * 2023-10-17 2023-11-17 博上(山东)网络科技有限公司 一种针对低嵌入率lsb音频隐写的特征向量提取方法
CN117614740A (zh) * 2024-01-18 2024-02-27 华侨大学 一种基于多级矢量联合优化的ip语音隐写方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102568469A (zh) * 2011-12-22 2012-07-11 清华大学 G.729a压缩语音流信息隐藏检测装置及检测方法
US8281138B2 (en) * 2008-04-14 2012-10-02 New Jersey Institute Of Technology Steganalysis of suspect media
CN103985389A (zh) * 2014-05-30 2014-08-13 武汉大学 一种针对amr音频文件的隐写分析方法
CN105847250A (zh) * 2016-03-22 2016-08-10 甘肃农业大学 VoIP流媒体多维度信息隐写实时检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8281138B2 (en) * 2008-04-14 2012-10-02 New Jersey Institute Of Technology Steganalysis of suspect media
CN102568469A (zh) * 2011-12-22 2012-07-11 清华大学 G.729a压缩语音流信息隐藏检测装置及检测方法
CN103985389A (zh) * 2014-05-30 2014-08-13 武汉大学 一种针对amr音频文件的隐写分析方法
CN105847250A (zh) * 2016-03-22 2016-08-10 甘肃农业大学 VoIP流媒体多维度信息隐写实时检测方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
JIN LIU ET AL.: "Neighbor-index-division steganography based on QIM method for G.723.1 speech streams", 《JOURNAL OF AMBIENT INTELLIGENCE AND HUMANIZED COMPUTING》 *
SONG-BIN LI ET AL.: "Detection of quantization index modulation steganography in G.723.1 bit stream based on quantization index sequence analysis", 《JOURNAL OF ZHEJIANG UNIVERSITY SCIENCE C(COMPUTER & ELECTRON)》 *
吴彦鹏: "网络语音流隐写分析技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
张婕: "基于支持向量机的语音信息隐写检测技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
李松斌等: "一种基于码字分布特性的G.729A压缩语音流隐写分析方法", 《电子学报》 *
李松斌等: "基于统计模型及SVM的低速率语音编码QIM隐写检测", 《计算机学报》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110663194A (zh) * 2017-03-20 2020-01-07 Hyphy美国有限公司 整合自适应压缩的媒体接口
CN109192217A (zh) * 2018-08-06 2019-01-11 中国科学院声学研究所 面向多类低速率压缩语音隐写的通用信息隐藏检测方法
CN109388959A (zh) * 2018-09-30 2019-02-26 陕西师范大学 结合差异聚类和最小误差纹理合成的生成式信息隐藏方法
CN109388959B (zh) * 2018-09-30 2021-08-27 陕西师范大学 结合差异聚类和最小误差纹理合成的生成式信息隐藏方法
CN109817233A (zh) * 2019-01-25 2019-05-28 清华大学 基于层次注意力网络模型的语音流隐写分析方法及系统
CN110968845A (zh) * 2019-11-19 2020-04-07 天津大学 基于卷积神经网络生成的针对lsb隐写的检测方法
CN111028308A (zh) * 2019-11-19 2020-04-17 珠海涵辰科技有限公司 一种图像中信息的隐写及读取方法
CN111028308B (zh) * 2019-11-19 2022-11-04 珠海涵辰科技有限公司 一种图像中信息的隐写及读取方法
CN110968845B (zh) * 2019-11-19 2023-10-27 天津大学 基于卷积神经网络生成的针对lsb隐写的检测方法
CN117079669A (zh) * 2023-10-17 2023-11-17 博上(山东)网络科技有限公司 一种针对低嵌入率lsb音频隐写的特征向量提取方法
CN117614740A (zh) * 2024-01-18 2024-02-27 华侨大学 一种基于多级矢量联合优化的ip语音隐写方法
CN117614740B (zh) * 2024-01-18 2024-04-16 华侨大学 一种基于多级矢量联合优化的ip语音隐写方法

Similar Documents

Publication Publication Date Title
CN107610711A (zh) 基于量化索引调制qim的g.723.1语音信息隐写分析方法
CN111276131B (zh) 一种基于深度神经网络的多类声学特征整合方法和系统
CN111582020B (zh) 信号处理方法、装置、计算机设备及存储介质
Janicki Spoofing countermeasure based on analysis of linear prediction error.
CN102568469B (zh) G.729a压缩语音流信息隐藏检测装置及检测方法
CN102237085A (zh) 音频信号的分类方法及装置
CN112259123B (zh) 一种鼓点检测方法、装置及电子设备
US11694678B2 (en) Signal processor employing neural network trained using evolutionary feature selection
CN115102789B (zh) 一种反通信网络诈骗研判预警拦截综合平台
CN114492521A (zh) 一种基于声振信号的随钻岩性智能识别方法与系统
CN115393760A (zh) Deepfake合成视频检测方法、系统及设备
Huang et al. A long sequence speech perceptual hashing authentication algorithm based on constant q transform and tensor decomposition
Mohammed et al. Advantages and disadvantages of automatic speaker recognition systems
CN114220443A (zh) 基于bn优化sngan的自适应音频隐写模型的训练方法和系统
CN116153337B (zh) 合成语音溯源取证方法及装置、电子设备及存储介质
CN111916059B (zh) 一种基于深度学习的平滑语音检测方法、装置及智能设备
CN115472179A (zh) 面向数字音频删除和插入篡改操作自动检测方法及系统
Büker et al. Angular margin softmax loss and its variants for double compressed amr audio detection
Huang et al. Encrypted speech perceptual hashing authentication algorithm based on improved 2D-Henon encryption and harmonic product spectrum
Huang et al. Robust Speech Perception Hashing Authentication Algorithm Based on Spectral Subtraction and Multi-feature Tensor.
Zhang et al. Speech Perceptual Hashing Authentication Algorithm Based on Spectral Subtraction and Energy to Entropy Ratio.
Rabaoui et al. Using HMM-based classifier adapted to background noises with improved sounds features for audio surveillance application
CN114048770A (zh) 面向数字音频删除和插入篡改操作自动检测方法及系统
CN112927700A (zh) 一种盲音频水印嵌入和提取方法及系统
CN111524523A (zh) 基于声纹识别技术的仪器设备状态检测系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180119