CN107910009B - 一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统 - Google Patents

一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统 Download PDF

Info

Publication number
CN107910009B
CN107910009B CN201711063280.0A CN201711063280A CN107910009B CN 107910009 B CN107910009 B CN 107910009B CN 201711063280 A CN201711063280 A CN 201711063280A CN 107910009 B CN107910009 B CN 107910009B
Authority
CN
China
Prior art keywords
code element
value
steganography
distribution
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711063280.0A
Other languages
English (en)
Other versions
CN107910009A (zh
Inventor
李松斌
杨洁
邓浩江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanhai Research Station Institute Of Acoustics Chinese Academy Of Sciences
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN201711063280.0A priority Critical patent/CN107910009B/zh
Publication of CN107910009A publication Critical patent/CN107910009A/zh
Application granted granted Critical
Publication of CN107910009B publication Critical patent/CN107910009B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种基于贝叶斯推理的码元改写信息隐藏检测方法,所述方法包括:步骤1)在训练样本中根据压缩语音码元取值分布熵选取隐写敏感码元,由此构建码元强关联网络;基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数;步骤2)根据码元贝叶斯网络分类器和训练样本计算隐写指数阈值Jthr;步骤3)对于一段未知类型的压缩语音,计算其隐写指数J0,若J0≥Jthr,判定该语音段为未隐写语音段;若J0<Jthr,判定该语音段为隐写语音段。本发明的方法能够得到更准确的隐写检测结果;而且本发明的方法以码流中的码元作为分析对象,不需要进行解码,可以达到实时隐写检测的效果。

Description

一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统
技术领域
本发明涉及信息安全和机器学习技术领域,特别涉及一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统。
背景技术
随着带宽的持续增长以及网络融合趋势的增强,基于网络数据通信的网络流媒体服务得到了空前的发展,网络压缩语音码流成为隐蔽通信常用载体之一。它给人们的生活和工作带来便利的同时,也给犯罪分子带来了可乘之机。对于敏感机构而言,需要对机构中的语音码流进行评估审查,确定是否存在隐蔽通信信道进行秘密信息的外泄。信息隐藏检测技术作为隐蔽通信的对抗技术,能够有效的监控网络压缩语音码流中的隐蔽通信,实现对敏感机构中的语音码流信息隐藏检测。
在压缩语音中进行信息隐藏之后,都会对码元造成不同程度的改写。现有的压缩语音信息隐藏检测方法绝大部分是在解码过程中进行的,即针对某种编码过程的信息隐藏进行检测,如线性预测编码、开环基音预测、码本搜索等;还有小部分是针对特定的信息隐藏方法直接分析压缩语音码流,该类方法针对单一码元分别进行分析,以效果最好的码元检测结果为最终检测结果。现有的码元改写信息隐藏检测方法都只能针对特定的信息隐藏方法进行检测,目前尚未有能适合任意码元改写的检测方法。在实际应用过程中,很难获取到压缩语音中使用的是何种信息隐藏方法,因此,研究一种通用的码元改写信息隐藏检测方法很有必要。
发明内容
本发明的目的在于提出一种通用的码元改写信息隐藏检测方法,该方法首先分析压缩语音各个码元自身取值统计特征,计算得到码元分布熵,选取分布熵较小的码元作为隐写敏感码元;接着以同类隐写敏感码元帧内取值和相邻帧间取值关系构建码元关联网络;然后以马尔科夫转移概率为关联指数对码元关联网络进行剪枝,得到码元强关联网络;最后基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习网络参数,从而实现对码元改写的信息隐藏检测。
为了实现上述目的,本发明提供了一种基于贝叶斯推理的码元改写信息隐藏检测方法,所述方法包括以下步骤:
步骤1)在训练样本中根据压缩语音码元取值分布熵选取隐写敏感码元,由此构建码元强关联网络;基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数;
步骤2)根据码元贝叶斯网络分类器和训练样本计算隐写指数阈值Jthr
步骤3)对于一段未知类型的压缩语音,计算其隐写指数J0,若J0≥Jthr,判定该语音段为未隐写语音段;若J0<Jthr,判定该语音段为隐写语音段。
作为上述方法的一种改进,所述步骤1)具体包括:
步骤S1)根据训练样本计算压缩语音码元取值分布熵,选取分布熵小于阈值的码元作为隐写敏感码元;
步骤S2)以隐写敏感码元帧内取值和相邻帧间取值关系构建码元关联网络,以马尔科夫转移概率为关联指数对码元关联网络进行剪枝,得到码元强关联网络;
步骤S3)基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数。
作为上述方法的一种改进,所述步骤S1)具体包括:
步骤S1-1)计算压缩语音码元取值分布,记第k个码元的取值范围为[0,rk],其取值概率分布为
Figure BDA0001455218580000021
步骤S1-2)根据码元取值概率分布计算各个码元取值分布熵,第k个码元的分布熵Ek计算如下:
Figure BDA0001455218580000022
步骤S1-3)选取分布熵小于阈值Ethr的码元作为隐写敏感码元。
作为上述方法的一种改进,所述步骤S2)具体包括:
步骤S2-1)根据步骤S1-3)得到的隐写敏感码元构建码元关联网络,记为有向图D=(V,E),定义如下:
V={vi[k],i∈{0,1,2,...}}
E={<vu[p],vv[q]>,vu[p],vv[q]∈V,v-u∈{0,1}}
其中,V为有向图中的顶点构成的集合,每个顶点对应一个隐写敏感码元vi[k],vi[k]表示第i帧中的第k个码元;其中E为有向图中的有向边构成的集合,<vu[p],vv[q]>表示由顶点vu[p]指向vv[q]的有向边,且vu[p]和vv[q]为取值范围相同的同类码元,即rp=rq;当v-u=0时,表示帧内关联边;当v-u=1时,表示帧间关联边;
步骤S2-2)根据步骤S2-1)得到的码元关联网络,计算每条边对应的码元取值转移概率矩阵Rpq,如下:
Figure BDA0001455218580000031
其中Pi,j,i=0,1,...,rp,j=0,1,...,rq,rp=rq表示第p个码元取值为i,第q个码元取值为j时的转移概率;
步骤S2-3)根据步骤S2-2)得到的转移概率矩阵Rpq计算关联指数REpq,计算公式如下:
Figure BDA0001455218580000032
REpq表示两个码元取值相同时的转移概率之和;
步骤S2-4)根据步骤S2-3)得到的关联指数REpq,去掉关联指数REpq小于阈值REthr的关联边,得到码元强关联网络D′=(V′,E′),记V′中包含N个顶点,为V′=v1,v2,...,vN
作为上述方法的一种改进,所述步骤S3)具体包括:
步骤S3-1)根据步骤S2-4)得到的码元强关联网络,构建码元贝叶斯网络分类器,其网络节点随机变量记为U={X0,X1,…,XM},M为节点的总个数;随机变量相应的取值记为u={u0,u1,…,uM};
步骤S3-2)根据步骤S3-1)得到的码元贝叶斯网络分类器,使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数。
作为上述方法的一种改进,所述步骤S3-1)具体包括:
步骤S3-1-1)以压缩语音帧类别作为码元贝叶斯网络分类器的根节点X0,帧类别为:未隐写和隐写;
步骤S3-1-2)根据步骤S2-4)得到的码元强关联网络,将顶点V′中每个码元取值范围分为多个取值集合;其中,对于取值范围大于255的码元,利用训练样本计算码元取值直方图,将码元取值直方图按降序排列,将排序后的取值均匀划分为256个取值集合;对于取值范围小于或者等于255的码元,每个取值为一个集合;以码元取值集合作为子节点X1,X2,...,XN,构成由X0→X1,X0→X2,...,X0→XN的N条有向边,节点Xi取值对应码元vi的一个取值集合;
步骤S3-1-3)根据步骤S2-4)得到的码元强关联网络,若存在帧内关联边<vi[p],vi[q]>,则增加子节点
Figure BDA0001455218580000041
构成由
Figure BDA0001455218580000042
的两条有向边,节点
Figure BDA0001455218580000043
表示帧内码元v[p]和v[q]取值关系,取值关系包括:取值不同和取值相同,取值不同记为0;取值相同记为1;
步骤S3-1-4)根据步骤S2-4)得到的码元强关联网络,若存在相邻帧间关联边<vi[p],vi+1[p]>,则增加子节点
Figure BDA0001455218580000044
构成由
Figure BDA0001455218580000045
的两条有向边,节点
Figure BDA0001455218580000046
表示同一码元v[p]帧间取值关系,取值关系包括:取值不同和取值相同,取值不同记为0;取值相同记为1,至此完成码元贝叶斯网络分类器的构建,其网络节点随机变量记为U={X0,X1,…,XM},随机变量相应的取值记为u={u0,u1,…,uM}。
作为上述方法的一种改进,所述步骤S3-2)具体包括:
步骤S3-2-1)根据步骤S3-1)得到的码元贝叶斯网络分类器,记随机变量Xi共有Ki个取值,Xi的取值概率为
Figure BDA0001455218580000048
其中θijk表示随机变量Xi取其第k个取值且Xi的父节点Pa(Xi)取其第j个取值时的条件概率,则θijk表示为:
θijk=P(Xi=xik|Pa(Xi)=Pa(Xi)j)
初始化随机变量Xi取值先验分布π(θij)为Dirichlet分布,即:
Figure BDA0001455218580000047
其中Γ(·)为gamma函数,αijk为超参数,初始值根据经验设定;
步骤S3-2-2)根据步骤S3-2-1)得到的Xi取值先验分布π(θij),统计样本χ中满足Xi=xik且Pa(Xi)=Pa(Xi)j的个数为βijk,由于后验分布π(θ|χ)也服从Dirichlet分布,则π(θij|χ)表示为:
Figure BDA0001455218580000051
步骤S3-2-3)根据步骤S3-2-2)得到的后验分布π(θij|χ),采用最大似然估计方法计算码元贝叶斯网络分类器每个参数
Figure BDA0001455218580000052
表示为:
Figure BDA0001455218580000053
作为上述方法的一种改进,所述步骤2)具体包括:
步骤2-1)根据步骤S3)得到的码元贝叶斯网络分类器,利用子节点X1,…,XM的取值及相应的节点参数来推理父节点X0的取值后验概率,即语音帧的类别,其中为未隐写帧的后验概率计算为:
Figure BDA0001455218580000054
为隐写帧的后验概率计算为:
Figure BDA0001455218580000055
步骤2-2)根据步骤2-1)得到的语音帧类别后验概率,计算语音段的隐写指数Jx
记一段包含T帧的语音段第i帧为未隐写帧的概率为pui,为隐写帧的概率为psi,则Jx表示为:
Figure BDA0001455218580000056
步骤2-3)根据步骤2-2)得到的语音段隐写指数Jx,根据训练样本计算隐写指数阈值Jthr
设训练样本包含L段语音,记训练样本在未隐写情况下的隐写指数为JU={Ju1,Ju2,…,JuL},在隐写情况下的隐写指数为JS={Js1,Js2,…,JsL},则Jthr由下式得到:
Figure BDA0001455218580000057
其中,CNT(JU:Juj≥Jx)表示未隐写指数JU中满足Juj≥Jx的个数,即未隐写情况下判定正确的语音数;CNT(JS:Jsj<Jx)表示隐写指数JS中满足Jsj<Jx的个数。
一种基于贝叶斯推理的码元改写信息隐藏检测系统,包括存储器、处理器和存储在存储器上的并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述方法的步骤。
本发明的方法优点在于:
1、本发明的方法中的贝叶斯网络分类器是基于隐写敏感码元强关联网络构建的,能确保贝叶斯网络结构能充分体现隐写对码元自身、同类码元帧间、同一码元帧间关联的影响;
2、本发明的方法以Dirichlet分布作为先验分布,结合样本数据对先验分布修正,有效地提高了参数学习的精度,从而得到更准确的隐写检测结果;
3、本发明的方法以码流中的码元作为分析对象,不需要进行解码,可以达到实时隐写检测的效果。
附图说明
图1是本发明的基于贝叶斯推理的码元改写信息隐藏检测方法的流程示意图;
图2是本发明的码元强关联网络示意图;
图3是本发明的码元贝叶斯网络分类器示意图。
具体实施方式
现结合附图和具体实施例对本发明做进一步的描述。
如图1所示,一种基于贝叶斯推理的码元改写信息隐藏检测方法,所述方法包括以下步骤:
步骤S1)根据训练样本计算压缩语音码元取值分布熵,选取分布熵小于阈值的码元作为隐写敏感码元;具体包括:
步骤S1-1)计算压缩语音码元取值分布,记第k个码元的取值范围为[0,rk],其取值概率分布为
Figure BDA0001455218580000061
步骤S1-2)根据码元取值概率分布计算各个码元取值分布熵,第k个码元的分布熵Ek计算如下:
Figure BDA0001455218580000071
步骤S1-3)选取分布熵小于阈值Ethr的码元作为隐写敏感码元;
步骤S2)以隐写敏感码元帧内取值和相邻帧间取值关系构建码元关联网络,以马尔科夫转移概率为关联指数对码元关联网络进行剪枝,得到码元强关联网络;如
图2所示;所述步骤S2)具体包括:
步骤S2-1)根据步骤S1-3)得到的隐写敏感码元构建码元关联网络,记为有向图D=(V,E),定义如下:
V={vi[k],i∈{0,1,2,...}}
E={<vu[p],vv[q]>,vu[p],vv[q]∈V,v-u∈{0,1}}
其中V为有向图中的顶点构成的集合,每个顶点对应一个隐写敏感码元vi[k],vi[k]表示第i帧中的第k个码元。其中E为有向图中的有向边构成的集合,<vu[p],vv[q]>表示由顶点vu[p]指向vv[q]的有向边,且vu[p]和vv[q]为取值范围相同的同类码元,即rp=rq;当v-u=0时,表示帧内关联边;当v-u=1时,表示帧间关联边。
步骤S2-2)根据步骤S2-1)得到的码元关联网络,计算每条边对应的码元取值转移概率矩阵Rpq,如下:
Figure BDA0001455218580000072
其中Pi,j(i=0,1,...,rp,j=0,1,...,rq,rp=rq)表示第p个码元取值为i,第q个码元取值为j时的转移概率。
步骤S2-3)根据步骤S2-2)得到的转移概率矩阵Rpq计算关联指数REpq,计算公式如下:
Figure BDA0001455218580000073
REpq表示两个码元p和q取值相同时的转移概率之和。
步骤S2-4)根据步骤S2-3)得到的关联指数REpq,去掉关联指数REpq小于阈值REthr的关联边,得到码元强关联网络D′=(V′,E′),记V′中包含N个顶点,为V′=v1,v2,...,vN,如图2所示;
步骤S3)基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习网络参数;具体包括:
步骤S3-1)根据步骤S2-4)得到的码元强关联网络,构建码元贝叶斯网络分类器;具体包括:
如图3所示;贝叶斯网络节点随机变量记为U={X0,X1,…,XM},随机变量相应的取值记为u={u0,u1,…,uM};
步骤S3-1-1)以压缩语音帧类别作为贝叶斯网络分类器的根节点X0,帧类别为:未隐写(记为0)和隐写(记为1)两种;
步骤S3-1-2)根据步骤S2-4)得到的码元强关联网络,将顶点V′中每个码元取值范围分为多个取值集合;其中,对于取值范围大于255的码元,利用训练样本计算码元取值直方图,将码元取值直方图按降序排列,将排序后的取值均匀划分为256个取值集合;对于取值范围小于或者等于255的码元,每个取值为一个集合;以码元取值集合作为子节点X1,X2,...,XN,构成由X0→X1,X0→X2,...,X0→XN的N条有向边,节点Xi取值对应码元vi的一个取值集合;
步骤S3-1-3)根据步骤S2-4)得到的码元强关联网络,若存在帧内关联边,如图2中虚线框内的<vi[p],vi[q]>,则增加子节点
Figure BDA0001455218580000081
构成如图3所示的由
Figure BDA0001455218580000082
Figure BDA0001455218580000083
的两条有向边,节点
Figure BDA0001455218580000084
表示帧内码元v[p]和v[q]取值关系,有取值不同(记为0)和取值相同(记为1)两种;
步骤S3-1-4)根据步骤S2-4)得到的码元强关联网络,若存在相邻帧间关联边,图2中<vi[p],vi+1[p]>,则增加子节点
Figure BDA0001455218580000085
构成由如图3所示
Figure BDA0001455218580000086
的两条有向边,节点
Figure BDA0001455218580000087
表示同一码元v[p]帧间取值关系,有取值不同(记为0)和取值相同(记为1)两种,至此完成码元贝叶斯网络的构建,网络节点随机变量记为U={X0,X1,…,XM},随机变量相应的取值记为u={u0,u1,…,uM};M为节点总个数;
步骤S3-2)根据步骤S3-1)得到的贝叶斯网络分类器,使用Dirichlet分布作为先验分布计算网络分类器的参数;具体包括:
步骤S3-2-1)根据步骤S3-1)得到的码元贝叶斯网络分类器,记随机变量Xi共有Ki个取值,Xi的取值概率为
Figure BDA0001455218580000095
其中θijk表示随机变量Xi取其第k个取值且Xi的父节点Pa(Xi)取其第j个取值时的条件概率,则θijk表示为:
θijk=P(Xi=xik|Pa(Xi)=Pa(Xi)j)
初始化随机变量Xi取值先验分布π(θij)为Dirichlet分布,即:
Figure BDA0001455218580000091
其中Γ(·)为gamma函数,αijk为超参数,初始值根据经验设定;
步骤S3-2-2)根据步骤S3-2-1)得到的Xi取值先验分布π(θij),统计样本χ中满足Xi=xik且Pa(Xi)=Pa(Xi)j的个数为βijk,由于后验分布π(θ|χ)也服从Dirichlet分布,则π(θ|χ)可表示为:
Figure BDA0001455218580000092
步骤S3-2-3)根据步骤S3-2-2)得到的后验分布π(θ|χ),采用最大似然估计方法计算每个网络分类器的参数
Figure BDA0001455218580000093
可表示为:
Figure BDA0001455218580000094
步骤S4)运用码元贝叶斯网络分类器,对未知类型的压缩语音进行隐写检测;具体包括:
步骤S4-1)根据步骤S3)得到的贝叶斯网络分类器,利用子节点X1,…,XM的取值及相应的节点参数来推理父节点X0的取值后验概率,即语音帧的类别,其中为未隐写帧的后验概率计算为:
Figure BDA0001455218580000101
为隐写帧的后验概率计算为:
Figure BDA0001455218580000102
步骤S4-2)根据步骤S4-1)得到的语音帧类别后验概率,计算语音段的隐写指数Jx
记一段包含N帧的语音段第i帧为未隐写帧的概率为pui,为隐写帧的概率为psi,则Jx表示为:
Figure BDA0001455218580000103
步骤S4-3)根据步骤S4-2)得到的语音段隐写指数Jx,根据训练样本计算隐写指数阈值Jthr
设训练样本包含M段语音,记训练样本在未隐写情况下的隐写指数为JU={Ju1,Ju2,…,JuM},在隐写情况下的隐写指数为JS={Js1,Js2,…,JsM},则Jthr由下式得到:
Figure BDA0001455218580000104
其中CNT(JU:Juj≥Jx)表示未隐写指数JU中满足Juj≥Jx的个数,即未隐写情况下判定正确的语音数;CNT(JS:Jsj<Jx)表示隐写指数JS中满足Jsj<Jx的个数。
步骤S4-4)根据步骤S4-3)得到的隐写指数阈值Jthr,给定一段未知类型的压缩语音,计算其隐写指数J0,若J0≥Jthr,判定该语音段为未隐写语音段;若J0<Jthr,判定该语音段为隐写语音段。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (8)

1.一种基于贝叶斯推理的码元改写信息隐藏检测方法,所述方法包括:
步骤1)在训练样本中根据压缩语音码元取值分布熵选取隐写敏感码元,由此构建码元强关联网络;具体包括:
步骤S1)根据训练样本计算压缩语音码元取值分布熵,选取分布熵小于阈值的码元作为隐写敏感码元;
步骤S2)以隐写敏感码元帧内取值和相邻帧间取值关系构建码元关联网络,以马尔科夫转移概率为关联指数对码元关联网络进行剪枝,得到码元强关联网络;
步骤S3)基于码元强关联网络构建码元贝叶斯网络分类器,并使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数;
步骤2)根据码元贝叶斯网络分类器和训练样本计算隐写指数阈值Jthr
步骤3)对于一段未知类型的压缩语音,计算其隐写指数J0,若J0≥Jthr,判定该语音段为未隐写语音段;若J0<Jthr,判定该语音段为隐写语音段。
2.根据权利要求1所述的贝叶斯推理的码元改写信息隐藏检测方法,其特征在于,所述步骤S1)具体包括:
步骤S1-1)计算压缩语音码元取值分布,记第k个码元的取值范围为[0,rk],其取值概率分布为Pk={p0,p1,...,prk};
步骤S1-2)根据码元取值概率分布计算各个码元取值分布熵,第k个码元的分布熵Ek计算如下:
Figure FDA0002665035840000011
步骤S1-3)选取分布熵小于阈值Ethr的码元作为隐写敏感码元。
3.根据权利要求2所述的贝叶斯推理的码元改写信息隐藏检测方法,其特征在于,所述步骤S2)具体包括:
步骤S2-1)根据步骤S1-3)得到的隐写敏感码元构建码元关联网络,记为有向图D=(V,E),定义如下:
V={vi[k],i∈{0,1,2,...}}
E={<vu[p],vv[q]>,vu[p],vv[q]∈V,v-u∈{0,1}}
其中,V为有向图中的顶点构成的集合,每个顶点对应一个隐写敏感码元vi[k],vi[k]表示第i帧中的第k个码元;其中E为有向图中的有向边构成的集合,<vu[p],vv[q]>表示由顶点vu[p]指向vv[q]的有向边,且vu[p]和vv[q]为取值范围相同的同类码元,即rp=rq;当v-u=0时,表示帧内关联边;当v-u=1时,表示帧间关联边;
步骤S2-2)根据步骤S2-1)得到的码元关联网络,计算每条边对应的码元取值转移概率矩阵Rpq,如下:
Figure FDA0002665035840000021
其中Pi,j,i=0,1,...,rp,j=0,1,...,rq,rp=rq表示第p个码元取值为i,第q个码元取值为j时的转移概率;
步骤S2-3)根据步骤S2-2)得到的转移概率矩阵Rpq计算关联指数REpq,计算公式如下:
Figure FDA0002665035840000022
REpq表示两个码元取值相同时的转移概率之和;
步骤S2-4)根据步骤S2-3)得到的关联指数REpq,去掉关联指数REpq小于阈值REthr的关联边,得到码元强关联网络D′=(V′,E′),记V′中包含N个顶点,为V′=v1,v2,...,vN
4.根据权利要求3所述的贝叶斯推理的码元改写信息隐藏检测方法,其特征在于,所述步骤S3)具体包括:
步骤S3-1)根据步骤S2-4)得到的码元强关联网络,构建码元贝叶斯网络分类器,其网络节点随机变量记为U={X0,X1,…,XM},M为节点的总个数;随机变量相应的取值记为u={u0,u1,…,uM};
步骤S3-2)根据步骤S3-1)得到的码元贝叶斯网络分类器,使用Dirichlet分布作为先验分布学习码元贝叶斯网络分类器的参数。
5.根据权利要求4所述的贝叶斯推理的码元改写信息隐藏检测方法,其特征在于,所述步骤S3-1)具体包括:
步骤S3-1-1)以压缩语音帧类别作为码元贝叶斯网络分类器的根节点X0,帧类别为:未隐写和隐写;
步骤S3-1-2)根据步骤S2-4)得到的码元强关联网络,将顶点V′中每个码元取值范围分为多个取值集合;其中,对于取值范围大于255的码元,利用训练样本计算码元取值直方图,将码元取值直方图按降序排列,将排序后的取值均匀划分为256个取值集合;对于取值范围小于或者等于255的码元,每个取值为一个集合;以码元取值集合作为子节点X1,X2,...,XN,构成由X0→X1,X0→X2,...,X0→XN的N条有向边,节点Xi取值对应码元vi的一个取值集合;
步骤S3-1-3)根据步骤S2-4)得到的码元强关联网络,若存在帧内关联边<vi[p],vi[q]>,则增加子节点
Figure FDA0002665035840000031
构成由
Figure FDA0002665035840000032
的两条有向边,节点XN1表示帧内码元v[p]和v[q]取值关系,取值关系包括:取值不同和取值相同,取值不同记为0;取值相同记为1;
步骤S3-1-4)根据步骤S2-4)得到的码元强关联网络,若存在相邻帧间关联边<vi[p],vi+1[p]>,则增加子节点XN2,构成由X0→XN2,Xp→XN2的两条有向边,节点XN2表示同一码元v[p]帧间取值关系,取值关系包括:取值不同和取值相同,取值不同记为0;取值相同记为1,至此完成码元贝叶斯网络分类器的构建,其网络节点随机变量记为U={X0,X1,…,XM},随机变量相应的取值记为u={u0,u1,…,uM}。
6.根据权利要求5所述的贝叶斯推理的码元改写信息隐藏检测方法,其特征在于,所述步骤S3-2)具体包括:
步骤S3-2-1)根据步骤S3-1)得到的码元贝叶斯网络分类器,记随机变量Xi共有Ki个取值,Xi的取值概率为
Figure FDA0002665035840000033
其中θijk表示随机变量Xi取其第k个取值且Xi的父节点Pa(Xi)取其第j个取值时的条件概率,则θijk表示为:
θijk=P(Xi=xik|Pa(Xi)=Pa(Xi)j)
初始化随机变量Xi取值先验分布π(θij)为Dirichlet分布,即:
Figure FDA0002665035840000041
其中Γ(·)为gamma函数,αijk为超参数,初始值根据经验设定;
步骤S3-2-2)根据步骤S3-2-1)得到的Xi取值先验分布π(θij),统计样本χ中满足Xi=xik且Pa(Xi)=Pa(Xi)j的个数为βijk,由于后验分布π(θ|χ)也服从Dirichlet分布,则π(θij|χ)表示为:
Figure FDA0002665035840000042
步骤S3-2-3)根据步骤S3-2-2)得到的后验分布π(θij|χ),采用最大似然估计方法计算码元贝叶斯网络分类器每个参数
Figure FDA0002665035840000043
表示为:
Figure FDA0002665035840000044
7.根据权利要求5或6所述的贝叶斯推理的码元改写信息隐藏检测方法,其特征在于,所述步骤2)具体包括:
步骤2-1)根据步骤S3)得到的码元贝叶斯网络分类器,利用子节点X1,…,XM的取值及相应的节点参数来推理父节点X0的取值后验概率,即语音帧的类别,其中为未隐写帧的后验概率计算为:
Figure FDA0002665035840000045
为隐写帧的后验概率计算为:
Figure FDA0002665035840000046
步骤2-2)根据步骤2-1)得到的语音帧类别后验概率,计算语音段的隐写指数Jx
记一段包含T帧的语音段第i帧为未隐写帧的概率为pui,为隐写帧的概率为psi,则Jx表示为:
Figure FDA0002665035840000051
步骤2-3)根据步骤2-2)得到的语音段隐写指数Jx,根据训练样本计算隐写指数阈值Jthr
设训练样本包含L段语音,记训练样本在未隐写情况下的隐写指数为JU={Ju1,Ju2,…,JuL},在隐写情况下的隐写指数为JS={Js1,Js2,…,JsL},则Jthr由下式得到:
Figure FDA0002665035840000052
其中,CNT(JU:Juj≥Jx)表示未隐写指数JU中满足Juj≥Jx的个数,即未隐写情况下判定正确的语音数;CNT(JS:Jsj<Jx)表示隐写指数JS中满足Jsj<Jx的个数。
8.一种基于贝叶斯推理的码元改写信息隐藏检测系统,包括存储器、处理器和存储在存储器上的并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1~7任一项所述方法的步骤。
CN201711063280.0A 2017-11-02 2017-11-02 一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统 Active CN107910009B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711063280.0A CN107910009B (zh) 2017-11-02 2017-11-02 一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711063280.0A CN107910009B (zh) 2017-11-02 2017-11-02 一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统

Publications (2)

Publication Number Publication Date
CN107910009A CN107910009A (zh) 2018-04-13
CN107910009B true CN107910009B (zh) 2020-12-01

Family

ID=61843192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711063280.0A Active CN107910009B (zh) 2017-11-02 2017-11-02 一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统

Country Status (1)

Country Link
CN (1) CN107910009B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109192217B (zh) * 2018-08-06 2023-03-31 中国科学院声学研究所 面向多类低速率压缩语音隐写的通用信息隐藏检测方法
CN109525607B (zh) * 2019-01-07 2021-04-23 四川虹微技术有限公司 对抗攻击检测方法、装置及电子设备
CN111415289B (zh) * 2020-03-25 2022-04-01 武汉大学 基于自适应代价敏感特征学习的不平衡隐写分析方法
CN112528316B (zh) * 2020-09-18 2022-07-15 江苏方天电力技术有限公司 基于贝叶斯网络的隐私保护世系工作流发布方法

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020114463A1 (en) * 2000-12-07 2002-08-22 Pelly Jason Charles Modifying material
CN1478337A (zh) * 2000-12-14 2004-02-25 Ħ��������˾ 具有干扰预测的多路跳频网络
CN101414378A (zh) * 2008-11-24 2009-04-22 罗向阳 特征维数可选的图像信息隐藏盲检测方法
CN101609680A (zh) * 2009-06-01 2009-12-23 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
CN101951520A (zh) * 2010-10-21 2011-01-19 上海交通大学 自适应h.264压缩域视频水印嵌入与提取方法
CN102034478A (zh) * 2010-11-17 2011-04-27 南京邮电大学 基于压缩感知和信息隐藏的语音保密通信系统设计方法
CN102063907A (zh) * 2010-10-12 2011-05-18 武汉大学 一种针对音频扩频隐写的隐写分析方法
CN102148034A (zh) * 2011-04-07 2011-08-10 南京邮电大学 基于回声隐藏的水印嵌入和提取方法
CN103345767A (zh) * 2013-07-02 2013-10-09 中国科学技术大学 一种高安全性的jpeg图像隐写方法
CN103577835A (zh) * 2013-08-02 2014-02-12 中国科学技术大学苏州研究院 采用多维特征向量检测ip id隐信道的方法
CN105162686A (zh) * 2015-08-03 2015-12-16 福建北卡科技有限公司 基于图媒介的多形态即时信息隐密通信方法与系统
CN105575401A (zh) * 2015-12-23 2016-05-11 武汉大学 一种基于C-MAC特征的AACHuffman域隐写分析方法
CN106253909A (zh) * 2016-09-11 2016-12-21 复旦大学 一种路网轨迹的无损压缩方法
US20170337913A1 (en) * 2014-11-27 2017-11-23 Thomson Licensing Apparatus and method for generating visual content from an audio signal

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4286860B2 (ja) * 2004-05-21 2009-07-01 旭化成株式会社 動作内容判定装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020114463A1 (en) * 2000-12-07 2002-08-22 Pelly Jason Charles Modifying material
CN1478337A (zh) * 2000-12-14 2004-02-25 Ħ��������˾ 具有干扰预测的多路跳频网络
CN101414378A (zh) * 2008-11-24 2009-04-22 罗向阳 特征维数可选的图像信息隐藏盲检测方法
CN101609680A (zh) * 2009-06-01 2009-12-23 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
CN102063907A (zh) * 2010-10-12 2011-05-18 武汉大学 一种针对音频扩频隐写的隐写分析方法
CN101951520A (zh) * 2010-10-21 2011-01-19 上海交通大学 自适应h.264压缩域视频水印嵌入与提取方法
CN102034478A (zh) * 2010-11-17 2011-04-27 南京邮电大学 基于压缩感知和信息隐藏的语音保密通信系统设计方法
CN102148034A (zh) * 2011-04-07 2011-08-10 南京邮电大学 基于回声隐藏的水印嵌入和提取方法
CN103345767A (zh) * 2013-07-02 2013-10-09 中国科学技术大学 一种高安全性的jpeg图像隐写方法
CN103577835A (zh) * 2013-08-02 2014-02-12 中国科学技术大学苏州研究院 采用多维特征向量检测ip id隐信道的方法
US20170337913A1 (en) * 2014-11-27 2017-11-23 Thomson Licensing Apparatus and method for generating visual content from an audio signal
CN105162686A (zh) * 2015-08-03 2015-12-16 福建北卡科技有限公司 基于图媒介的多形态即时信息隐密通信方法与系统
CN105575401A (zh) * 2015-12-23 2016-05-11 武汉大学 一种基于C-MAC特征的AACHuffman域隐写分析方法
CN106253909A (zh) * 2016-09-11 2016-12-21 复旦大学 一种路网轨迹的无损压缩方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《低速率语音码流中的码元替换信息隐藏检测》;李松斌,杨洁,蒋雨欣;《网络新媒体技术》;20170131;全文 *
《基于检测熵的自然语言隐写术检测算法》;张蒙,黄曦,舒扬扬;《科技传播》;20140731;全文 *
《基于统计模型及SVM的低速率语言编码QIM隐写检测》;李松斌,黄永峰;《计算机学报》;20130630;全文 *

Also Published As

Publication number Publication date
CN107910009A (zh) 2018-04-13

Similar Documents

Publication Publication Date Title
CN107910009B (zh) 一种基于贝叶斯推理的码元改写信息隐藏检测方法及系统
ALIAS PARTH GOYAL et al. Z-forcing: Training stochastic recurrent networks
CN111985245B (zh) 基于注意力循环门控图卷积网络的关系提取方法及系统
CN112613303B (zh) 一种基于知识蒸馏的跨模态图像美学质量评价方法
CN112685597B (zh) 一种基于擦除机制的弱监督视频片段检索方法和系统
CN110458084B (zh) 一种基于倒置残差网络的人脸年龄估计方法
US9536206B2 (en) Method and apparatus for improving resilience in customized program learning network computational environments
Peng et al. Multilevel hierarchical network with multiscale sampling for video question answering
Véniat et al. Stochastic adaptive neural architecture search for keyword spotting
CN114218998A (zh) 一种基于隐马尔可夫模型的电力系统异常行为分析方法
CN113780584B (zh) 标签预测方法、设备、存储介质
Zhu et al. Adversarial training of LSTM-ED based anomaly detection for complex time-series in cyber-physical-social systems
Fonseca et al. Model-agnostic approaches to handling noisy labels when training sound event classifiers
Kuzina et al. Diagnosing vulnerability of variational auto-encoders to adversarial attacks
Schwier et al. Zero knowledge hidden markov model inference
Wang et al. Towards performance-maximizing neural network pruning via global channel attention
CN116030077A (zh) 基于多数据集协作学习的视频显著性区域检测方法
WO2014188659A1 (en) Latent feature models estimation device, method, and program
US20220207321A1 (en) Convolution-Augmented Transformer Models
CN115426671A (zh) 图神经网络训练、无线小区故障预测方法、系统及设备
CN111476131B (zh) 一种视频处理方法和装置
CN115348215A (zh) 一种基于时空注意力机制的加密网络流量分类方法
CN113327265A (zh) 一种基于指导学习策略的光流估计方法和系统
Almoussawi et al. Fire Detection and Verification using Convolutional Neural Networks, Masked Autoencoder and Transfer Learning
Lee et al. Attention-Based Self-Supervised Feature Learning for Security Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220712

Address after: 100190, No. 21 West Fourth Ring Road, Beijing, Haidian District

Patentee after: INSTITUTE OF ACOUSTICS, CHINESE ACADEMY OF SCIENCES

Patentee after: Nanhai research station, Institute of acoustics, Chinese Academy of Sciences

Address before: 100190, No. 21 West Fourth Ring Road, Beijing, Haidian District

Patentee before: INSTITUTE OF ACOUSTICS, CHINESE ACADEMY OF SCIENCES

TR01 Transfer of patent right