CN103456308B - 一种可恢复的密文域语音内容认证方法 - Google Patents

一种可恢复的密文域语音内容认证方法 Download PDF

Info

Publication number
CN103456308B
CN103456308B CN201310335479.XA CN201310335479A CN103456308B CN 103456308 B CN103456308 B CN 103456308B CN 201310335479 A CN201310335479 A CN 201310335479A CN 103456308 B CN103456308 B CN 103456308B
Authority
CN
China
Prior art keywords
signal
voice
frame
ciphertext
watermark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310335479.XA
Other languages
English (en)
Other versions
CN103456308A (zh
Inventor
王宏霞
刘正辉
刘双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CN201310335479.XA priority Critical patent/CN103456308B/zh
Publication of CN103456308A publication Critical patent/CN103456308A/zh
Application granted granted Critical
Publication of CN103456308B publication Critical patent/CN103456308B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了一种可恢复的密文域语音内容认证方法,首先将原始语音信号X置乱加密,置乱后的语音密文信号S分为N帧,每帧分为三段。然后将第一段信号能量比生成的水印嵌入在第三段中,将帧号对应的二值序列扩频后嵌入在第二段中,得到含水印的语音密文信号。本发明在利用帧号对恶意篡改进行精确定位的基础上,借助于置乱加密的特点,使被攻击部分替换的信号在反置乱操作后分散到整个语音信号中。该方法提高了水印系统的安全性和篡改定位精度,同时又具有篡改恢复能力,解决了敏感语音在云存储中的安全问题。

Description

一种可恢复的密文域语音内容认证方法
技术领域
本发明数字语音处理技术,具体涉及敏感语音在云存储中的安全。
背景技术
高速网络的发展以及计算机等技术的普及,使云计算从理论走向实际成为了可能。然而,云计算中数据的安全问题却阻碍着其推广和应用。云存储是一种外包形式的服务,数据的拥有者对这种服务形式并不信任。对于敏感数据,企业和用户为了保护数据隐私,在上传到云存储中心之前,往往会对数据做加密处理。用户或者授权者在需要的时候从云存储中下载需要的密文数据。由于云存储自身的特点,用户下载的数据可能是不真实的,或者被恶意攻击的。如何对用户下载密文数据的真实性进行认证,在恶意攻击后又如何恢复被攻击的内容是目前多媒体信息安全研究的热点之一,该问题的解决也将推动云计算和云存储的普及和应用。
数字语音信号作为一种敏感的、重要的信息载体,广泛应用在电话通讯,新闻报导等和人们生活息息相关的场合。为了保证数字语音的真实性和完整性,人们从不同方面,采用不同的方法对其进行了保护。例如,在内容认证和说话人识别方面做了大量的工作,也已取得了较大进展。然而,相比之下,关于语音密文内容认证和篡改恢复方面的研究成果则鲜有报道。文献“Content-dependent watermarkingscheme in compressed speech with identifying manner and location ofattacks”(Chen O.T-C,Liu Chia-hsiung,IEEE Transactions on Audio,Speech,and Language Processing,vol.15,no.5,pp.1605-1616,2007)提出了一种基于语音压缩的语音内容认证算法。该算法适用于基于CELP(Codebook-excite Linear Prediction)编码的语音信号。水印由相应帧的LSF(Line Spectrum Frequency)生成,基于LSB的方法来嵌入水印。在实际生活当中,由于播放格式的特殊要求或存储的方便等原因,含水印的语音信号不可避免地会受到一些信号处理。而基于LSB的水印嵌入方法对信号处理不具有鲁棒性,所以该方法在实际应用中受到诸多限制。抗去同步攻击音频水印方案的设计是一个难点,常见的是基于同步码的抗去同步攻击方法。文献“Blind and robustaudio watermarking scheme based on SVD-DCT”(Bai Ying Lei,IngYann Soon,Zhen Li,Signal Processing,vol.91,no.8,pp.1973-1984,2011)提出了一种基于同步码的抗去同步攻击的音频内容认证算法,同步码的嵌入增强了算法的鲁棒性,同时也带来了一些不足。一方面,同步码的嵌入增加了信号的负载;另一方面,同步码的嵌入方法存在安全隐患。文中嵌入同步码所采用的特征是公开的,且嵌入方法是已知的。攻击者可以得到特征并提取同步码,并采用相同的方法将提取的同步码嵌入在另一段信号中,然后将该信号替换原始含水印的信号,该攻击不会被认证端察觉。此类算法的载体都是明文信号,不能直接应用于语音密文,且对于恶意篡改,不具有恢复的能力。
发明内容
鉴于现有技术的以上不足,研究安全的、可恢复的语音密文内容认证技术具有重要的现实意义,并能推动云计算和云存储的普及和推广。本发明的目的在于提供一种可恢复的密文域语音内容认证算法,该算法对于语音密文所受到的恶意篡改能够篡改定位,同时具有篡改恢复能力,提高了语音密文的安全性和在云存储中的可靠性。
为实现这样的目的,本发明利用帧号对恶意篡改进行精确定位的基础上,借助于置乱加密的特点,设计了一种可恢复密文域语音内容认证方法。
一种可恢复的密文域语音内容认证方法,对语音密文篡改定位并对被恶意篡改的部分进行篡改恢复,其具体步骤包含如下:
(1)含水印语音密文的生成:首先对原始语音信号X做混沌置乱加密处理,置乱后的语音密文信号记为S;接着,将S等分为不重叠的N个帧,每帧长为P,第i帧记为Si;Si分为三段,分别记为S1i,S2i,S3i;然后,计算各段信号的能量比,用第一段信号的能量比生成水印W1i,并嵌入在第三段S3i中;将帧号i的对应的二值序列扩频为W2i,并嵌入在第二段信号S2i中。用该方法完成每个语音密文帧的水印嵌入,得到含水印的语音密文信号;
(2)语音密文内容认证和篡改恢复:与含水印语音密文生成过程类似,首先将待检测的语音密文WS进行分帧,每帧长为P,第i帧记为WSi;将WSi分为三段,计算各段信号的能量比;用第一段信号能量比生成的水印和第三段信号提取的水印做比较;记第二段信号提取的二值序列为 W 2 i * = { w 2 i , j * | w 2 i , j * ∈ ( 0,1 ) , 1 ≤ j ≤ 2 M } , (1≤j≤M)和(M+1≤j≤2M)作比较;若(1≤j≤M)=(M+1≤j≤2M),则认为第i帧是真实的,否则,认为第i帧存在被攻击的部分,以此实现对语音密文的内容认证;
假设检测到第i帧存在被攻击的部分,通过移位的方法找到下一个能通过认证的连续P个样本点,并提取该帧的帧号i′;通过对比i′和i-1来判断攻击的类型和内容;然后选择幅值为0的信号替换被攻击的部分;幅值为0的信号在反置乱加密之后将分散到整个语音信号的不同部分,替换的信号不会影响原始信号要表达的内容,以此来实现语音信号的篡改恢复。
与现有的算法相比,本发明利用帧号来进行篡改定位,水印嵌入采用的特征对攻击者是保密的,提高了定位精度和水印系统的安全性。置乱加密操作保证了敏感语音在云存储中的数据隐私,其自身特点也为篡改恢复提供了依据。这些保证了本方法的安全性和篡改恢复能力,确保了云存储中语音密文的可靠性,为本发明的广为推广提供了强有力的支持。
附图说明
图1为本发明关键科技问题。
图2为含水印语音密文生成框图。
图3为含水印语音密文内容认证框图。
图4为篡改恢复框图。
图5为含水印信号在不同量化步长下的SNR值。
图6为删除不同个数的样本点后恢复信号的SDG值。
图7为SDG值大于-1的条件下不同语音段允许删除最大样本点的个数。
图8为原始语音信号和含水印语音密文信号。
图9为删除攻击的篡改定位和篡改恢复结果。
图10为替换攻击的篡改定位和篡改恢复结果。
图10为图9(d)和图10(d)篡改恢复信号的SDG值。
以上图,图6和图7中,ND表示删除样本点的个数;图9(b)和图10(b)中,TL(i)=0表示对应的语音帧是真实的,TL(i)=1表示对应的帧是被攻击的部分。
图11删除和替换攻击篡改恢复信号的SDG值表。
具体实施方式
在本申请的叙述中,能量比的定义:
对于两个不同的信号X={x(i),1≤i≤N}和Y={y(i),1≤i≤N},定义ER(X,Y)为信号X对Y的能量比,如下式
ER ( X , Y ) = 101 g ( 1 + Σ i = 1 N x ( i ) 2 Σ i = 1 N y ( i ) 2 )
其中,即信号Y为非零信号;ER(X,Y)≥0,单位为dB。(1)ER(X,Y)反映了信号X和Y能量上的差别。ER(X,Y)的值和10lg2相差越小,则X和Y的能量越接近;反之,X和Y的能量差别越大。(2)ER(X,Y)反映了信号X能量。在信号Y保持不变的情况下,ER(X,Y)越大,X的能量也越大;反之,X的能量越小。
由能量比的定义可得,若要计算两个信号的能量比,必须同时得到两个信号。实际应用中,我们可以将信号Y作为密钥,这样能量比ER(X,Y)作为语音信号的特征对攻击者即是保密的。
综上,X对Y的能量比ER(X,Y)不仅体现了信号的能量特征,同时也提高了该特征用于水印系统的安全性。
下面,结合附图和实施例对本发明的技术方案作进一步描述。
1、原始语音信号置乱加密:
(1)基于伪随机序列的置乱。由如下的初值为k的Logistic映射产生伪随机序列Y,Y={yl,1≤l≤L}。
yl+1=μyl(1-yl),y0=k,3.5699≤μ≤4
将Y中的元素按升序排列,得到ya(l)=ascend(yl),l=1,2,…L,a(l)为升序排列后混沌序列的地址索引。
(2)原始语音信号X={xl,1≤l≤L}置乱后的密文信号为S={sl,1≤l≤L},其中sl=xa(l),l=1,2,…L。
2、含水印语音密文的生成:
(1)将S等分为不重叠的N个语音帧,每帧长为P,第i帧记为Si;Si分为三段,分别记为S1i,S2i,S3i;接着将S1i和S3i等分为M个子段,第j个子段记为S1i,j和S3i,j;S2i等分为2M个子段,第j个子段记为S2i,j;S1i,j,S2i,j和S3i,j的长度均为L1
(2)选取一段序列作为密文序列,计算S1i,j,S2i,j,S3i,j和密文序列的能量比。这里选取伪随机序列B作为密文序列,B={bl,1≤l≤L1},bl=yl,1≤l≤L1
(3)计算S1i,j,S2i,j,S3i,j和B的能量比,分别记为E1i,j,E2i,j,E3i,j
(4)第i帧的水印信息记为W1i={w1i,j|w1i,j∈(0,1),1≤j≤M},对第i帧的信号Si而言,将其帧号i转换为二进制Wi={wi,j|wi,j∈(0,1),1≤j≤M},这里,如果Wi的长度小于M,则在Wi后面补零。将Wi扩频为2M比特,并记为W2i={w2i,j|w2i,j∈(0,1),1≤j≤2M},其中w2i,j=wi,j,1≤j≤M;w2i,j=wi,j-M,M+1≤j≤2M。例如,如果i=3,M=5,Wi={00011},则W2i={0001100011}。
(5)将W1i和W2i分别嵌入在S3i和S2i中,嵌入方法如下:
若w1i,j=0,
若w1i,j=1,
其中Δ表示量化步长,QE3i,j表示量化后的量能比。
假设WS3i={WS3i,j,1≤j≤M}为信号S3i对应的含水印信号,则WS3i,j可由下式得到
WS 3 i , j ( l ) = S 3 i , j ( l ) × 10 Q E 3 i , j 10 - 1 10 E 3 i , j 10 - 1 , 1 ≤ l ≤ L 1
其中WS3i,j(l)和S3i,j(l)分别表示WS3i,j和S3i,j的第l个样本点。采用上述方法将W2i嵌入在S2i中。
(6)对N个语音帧依次进行这样的嵌入,直至嵌完所有语音帧,便得到含水印的语音密文信号WS。
3、语音密文内容认证和篡改恢复:
(1)与含水印语音密文生成过程的步骤(1)类似,对待检测的语音密文信号WS分帧、分段。第i帧记为WSi,长度和Si相等;WS1i,WS2i和WS3i分别表示WSi的第1,2和第3段;将WS1i和WS3i分为M个子段,WS2i分为2M个子段,第j个子段分别记为WS1i,j,WS2i,j和WS3i,j,长度均为L1
(2)计算WS1i,j,WS2i,j,WS3i,j和B的能量比,并记为WE1i,j,WE2i,j和WE3i,j。记 W 1 i * = { w 1 i , j * | w 1 i , j * ∈ ( 0,1 ) , 1 ≤ j ≤ M } 为第i帧生成的水印,其中为提取的帧号,其中 W 3 i * = { w 3 i , j * | w 3 i , j * ∈ ( 0,1 ) , 1 ≤ j ≤ M } 为第i帧提取的水印,
(3)如果 Σ j = 1 M w 1 i , j * ⊕ w 3 i , j * = 0 Σ j = 1 M w 2 i , j * ⊕ w 2 i , j + M * = 0 同时成立,则认为第i帧的内容是真实和完整的;否则,认为第i帧的内容存在被攻击的部分。
在检测到第i帧存在被攻击的部分之后,通过移位的方法找到下一个能通过认证的连续P个样本点,并提取该帧的帧号i′;通过对比i′和i-1来判断攻击的类型和内容;然后选择幅值为0的信号替换被攻击的部分。幅值为0的信号在反置乱加密之后将分散到整个语音信号中,替换的信号不会影响原始信号要表达的内容,实现语音信号的篡改恢复。
本发明方法的效果可以通过以下的性能分析验证:
1、不可听性和篡改恢复能力
选取100段采样率为22.05kHz,样本长度为1024000,分辨率为16比特的单声道WAV格式的语音信号进行置乱加密和水印嵌入,得到100段含水印的语音密文信号。
(1)不可听性
图5给出了在不同量化步长下100段语音信号的SNR平均值,可见本方法在量化步长小于0.5的时候具有很好的不可听性。
(2)篡改恢复能力
篡改恢复能力用Rc表示,定义如下:
R c = L c L
其中,Lc表示允许删除的样本点个数,L表示语音信号的长度。
图6给出了删除不同数量的样本点后,按照本发明恢复信号的SDG值。图7给出了在恢复信号的SDG值大于-1的情况下,100个语音段每段允许删除的最大样本点个数。可以看出,在SDG值大于-1的情况下,允许删除的样本点的个数大约为102400。由篡改恢复能力的定义可得,本发明的篡改恢复能力大约为1/10。
2、篡改定位和篡改恢复
图8(a)和(b)给出了原始语音信号和含水印语音密文信号。图9(a),(b),(c)和(d)分别给出了对图8(b)删除攻击后的信号,篡改定位结果,用幅值为0的信号替换被攻击的部分和篡改恢复的信号。图10(a),(b),(c)和(d)分别给出了对图8(b)替换攻击后的信号,篡改定位结果,用幅值为0的信号替换被攻击的部分和篡改恢复的信号。图11给出了删除和替换攻击篡改恢复信号的SDG值。从测试结果来看,本发明能够精确地篡改定位和高质量的篡改恢复。

Claims (1)

1.一种可恢复的密文域语音内容认证方法,对语音密文篡改定位并对被恶意篡改的部分进行篡改恢复,其具体步骤包含如下:
(1)含水印语音密文的生成:首先对原始语音信号X做混沌置乱加密处理,置乱后的语音密文信号记为S;接着,将S等分为不重叠的N个帧,每帧长为P,第i帧记为Si;Si分为三段,分别记为S1i,S2i,S3i;然后,计算各段信号的能量比,用第一段信号的能量比生成水印W1i,并嵌入在第三段S3i中;将帧号i的对应的二值序列扩频为W2i,并嵌入在第二段信号S2i中;用该方法完成每个语音密文帧的水印嵌入,得到含水印的语音密文信号;
(2)语音密文内容认证和篡改恢复:与含水印语音密文生成过程类似,首先将待检测的语音密文WS进行分帧,每帧长为P,第i帧记为WSi;将WSi分为三段,计算各段信号的能量比;用第一段信号能量比生成的水印和第三段信号提取的水印做比较;记第二段信号提取的二值序列为 W 2 i * = { w 2 i , j * | w 2 i , j * ∈ ( 0,1 ) , 1 ≤ j ≤ 2 M } , w 2 i , j * ( 1 ≤ j ≤ M ) w 2 i , j * ( M + 1 ≤ j ≤ 2 M ) 作比较;若 W 1 i * = W 3 i * , w 2 i , j * ( 1 ≤ j ≤ M ) = w 2 i , j * ( M + 1 ≤ j ≤ 2 M ) , 则认为第i帧是真实的,否则,认为第i帧存在被攻击的部分,以此实现对语音密文的内容认证;
假设检测到第i帧存在被攻击的部分,通过移位的方法找到下一个能通过认证的连续P个样本点,并提取该帧的帧号i′;通过对比i′和i-1来判断攻击的类型和内容;然后选择幅值为0的信号替换被攻击的部分;幅值为0的信号在反置乱加密之后将分散到整个语音信号的不同部分,替换的信号不会影响原始信号要表达的内容,以此来实现语音信号的篡改恢复。
CN201310335479.XA 2013-08-05 2013-08-05 一种可恢复的密文域语音内容认证方法 Expired - Fee Related CN103456308B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310335479.XA CN103456308B (zh) 2013-08-05 2013-08-05 一种可恢复的密文域语音内容认证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310335479.XA CN103456308B (zh) 2013-08-05 2013-08-05 一种可恢复的密文域语音内容认证方法

Publications (2)

Publication Number Publication Date
CN103456308A CN103456308A (zh) 2013-12-18
CN103456308B true CN103456308B (zh) 2015-08-19

Family

ID=49738605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310335479.XA Expired - Fee Related CN103456308B (zh) 2013-08-05 2013-08-05 一种可恢复的密文域语音内容认证方法

Country Status (1)

Country Link
CN (1) CN103456308B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156655B (zh) * 2015-03-26 2019-01-08 中国科学院声学研究所 一种面向云存储的文件压缩及认证方法
CN105304091B (zh) * 2015-06-26 2018-10-26 信阳师范学院 一种基于dct的语音篡改恢复方法
CN106531176B (zh) * 2016-10-27 2019-09-24 天津大学 音频信号篡改检测与恢复的数字水印算法
CN107993669B (zh) * 2017-11-20 2021-04-16 西南交通大学 基于修改最低有效位数权重的语音内容认证和篡改恢复方法
CN110379436A (zh) * 2019-06-14 2019-10-25 东南大学 一种基于dwt-dct-svd的信息隐藏方法
CN110460424B (zh) * 2019-08-19 2020-07-31 兰州理工大学 一种支持隐私保护的语音数据加密方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009025805A1 (en) * 2007-08-17 2009-02-26 Realnetworks, Inc. Advanced watermarking system and method
CN102867513A (zh) * 2012-08-07 2013-01-09 西南交通大学 一种基于伪Zernike矩的语音内容认证方法
CN102915740A (zh) * 2012-10-24 2013-02-06 兰州理工大学 可实现篡改定位的语音感知哈希内容认证方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060227968A1 (en) * 2005-04-08 2006-10-12 Chen Oscal T Speech watermark system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009025805A1 (en) * 2007-08-17 2009-02-26 Realnetworks, Inc. Advanced watermarking system and method
CN102867513A (zh) * 2012-08-07 2013-01-09 西南交通大学 一种基于伪Zernike矩的语音内容认证方法
CN102915740A (zh) * 2012-10-24 2013-02-06 兰州理工大学 可实现篡改定位的语音感知哈希内容认证方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘正辉,王宏霞.抗恒特征攻击的音频内容认证算法.《铁道学报》.2013,第35卷(第3期),76-82. *
钱清,王宏霞.用于语音内容认证的脆弱水印算法.《四川大学学报(自然科学版)》.2011,第48卷(第6期),1293-1299. *

Also Published As

Publication number Publication date
CN103456308A (zh) 2013-12-18

Similar Documents

Publication Publication Date Title
CN103456308B (zh) 一种可恢复的密文域语音内容认证方法
CN101345054B (zh) 用于声频文件的数字水印制作及识别方法
CN107993669B (zh) 基于修改最低有效位数权重的语音内容认证和篡改恢复方法
Atoum et al. A Steganography Method Based on Hiding secrete data in MPEG/Audio Layer III
Mane et al. Data hiding technique: Audio steganographyusing lsb technique
Hemida et al. A restorable fragile watermarking scheme with superior localization for both natural and text images
Sadkhan et al. Recent Audio Steganography Trails and its Quality Measures
Ghoshal et al. A novel technique for image authentication in frequency domain using discrete Fourier transformation technique (IAFDDFTT)
CN105304091A (zh) 一种基于dct的语音篡改恢复方法
CN102867513B (zh) 一种基于伪Zernike矩的语音内容认证方法
CN102073978B (zh) 利用不规则区域分割的数字图像认证与恢复方法及系统
Qian et al. A dual fragile watermarking scheme for speech authentication
Atoum et al. New technique for hiding data in audio files
Elmahi et al. Text steganography using compression and random number generators
Kaur et al. Audio steganography techniques-a survey
Wu et al. Robust and blind audio watermarking algorithm in dual domain for overcoming synchronization attacks
CN102523535A (zh) 基于数字水印技术的视频流与gps实时配准与同步传输方法
CN101350198B (zh) 基于骨导的语音压缩水印方法
Liu et al. Pseudo-zernike moments-based audio content authentication algorithm robust against feature-analysed substitution attack
Wang A new watermarking method of digital audio content for copyright protection
CN105895109A (zh) 一种基于dwt和dct的数字语音取证和篡改恢复方法
Qian et al. A fragile watermarking algorithm for speech authentication by modifying least significant digits
Fan A source coding scheme for authenticating audio signal with capability of self-recovery and anti-synchronization counterfeiting attack
Singla et al. A Hash Based Approach for secure image stegnograpgy using canny edge detection method
Al-Taay et al. Multimedia Data Hiding Evaluation Metrics

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150819

Termination date: 20180805

CF01 Termination of patent right due to non-payment of annual fee