CN102157154B - 基于音频内容的非均匀离散余弦变换音频可靠性认证方法 - Google Patents

基于音频内容的非均匀离散余弦变换音频可靠性认证方法 Download PDF

Info

Publication number
CN102157154B
CN102157154B CN201110035947A CN201110035947A CN102157154B CN 102157154 B CN102157154 B CN 102157154B CN 201110035947 A CN201110035947 A CN 201110035947A CN 201110035947 A CN201110035947 A CN 201110035947A CN 102157154 B CN102157154 B CN 102157154B
Authority
CN
China
Prior art keywords
audio
watermark
watermarks
ndct
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110035947A
Other languages
English (en)
Other versions
CN102157154A (zh
Inventor
黄雄华
崔更申
周巍
李宏周
刘达见
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN201110035947A priority Critical patent/CN102157154B/zh
Publication of CN102157154A publication Critical patent/CN102157154A/zh
Application granted granted Critical
Publication of CN102157154B publication Critical patent/CN102157154B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提出一种基于音频内容生成水印的非均匀余弦变换NDCT的音频可靠性认证方法。水印嵌入过程首先对原始音频A分帧,然后对每帧Ai作三级小波变换3DWT,量化三级小波近似系数cA3的均值mi生成水印wi,量化长为同时修改cA3各系数使其均值位于量化区间的中点并作NDCT变换,并量化
Figure DSA00000432433000012
嵌入水印wi,量化长为
Figure DSA00000432433000013
最后每帧作逆NDCT和逆3DWT并连接所有含水印帧
Figure DSA00000432433000014
和不含水印的音频部分
Figure DSA00000432433000015
完成水印的嵌入。音频认证首先对待认证音频A*分帧,对每帧
Figure DSA00000432433000016
作3DWT,以
Figure DSA00000432433000017
为量化长量化三级小波近似系数cA3*的均值重构水印
Figure DSA00000432433000018
然后对cA3*作NDCT变换,并以
Figure DSA00000432433000019
为量化长量化
Figure DSA000004324330000110
提取水印计算的归一化值认证音频的完整性。
Figure DSA000004324330000114
Figure DSA000004324330000115
需满足
Figure DSA000004324330000116
(N是NDCT矩阵维数,S是其第二列元素的和)。本发明适合于对数据可靠性要求很高的领域数据完整性的认证。

Description

基于音频内容的非均匀离散余弦变换音频可靠性认证方法
技术领域
本发明是一种基于音频内容生成水印的音频可靠性认证方法,适合于数字音频传输和存储中可靠性和完整性认证,并能定位非同步攻击下被恶意篡改的音频位置。 
技术背景
在计算机技术和网络技术迅速发展的今天,随着音频压缩技术和计算机应用软件技术的不断发展,数字音频的传输、复制、存储、修改越来越方便、快捷,随之造成的盗版、侵权、篡改等问题也凸现出来;并且,由于传输线路的安全性因素,音频在传输中也可能发生误码,丢包等问题,因此迫切需要数字音频的认证技术来鉴别知识产权的归属性和传输内容的可靠性。目前,解决该问题的数字水印技术成为国内外学者研究的热点。根据应用目的的不同,数字音频水印可分为鲁棒水印、脆弱水印和半脆弱水印。鲁棒水印主要用于电子作品的版权保护,载体音频在受到一定的扰动后,水印仍能被检测出来;半脆弱水印对常规的信号处理操作有一定的抵抗力,对恶意的篡改无法容忍,但能定位篡改位置,一般适用于非重要的音频数据的检测认证;在数据的可靠性要求很高的场合中,一般通过脆弱音频水印方案来认证信号的可靠性与完整性,脆弱水印是一种对篡改十分敏感的水印技术。这些水印方法中几乎都采用了外部的比特信息作为水印,或者随机数比特序列,或者M序列,或者混沌序列,或者二值图像,或者灰度图像或者彩色图像。王宏霞教授的论文《基于质心的混合域半脆弱音频水印算法》(中国科学:信息科学,2010,40(2):313~326.)和范明泉博士的论文《基于音频内容的混合域脆弱水印算法》(铁道学 报,2010,32(1):118~122)均指出已有采用二值图像作为水印的脆弱音频水印算法,会带来因传输过程中二值图像被篡改引起的虚警和认证无法判别的问题。灰度图像和彩色图像也存在同样的问题。由密钥方式产生水印序列的随机数方式、M序列方式、混沌序列方式,其本质都是一比特水印方法,无法对篡改进行定位,同时,也因其存在虚警问题,不能满足一些场合鉴定认证等的需要。目前,已有学者开始探索基于音频内容的局部化水印方法。因此,研究基于音频内容的水印生成技术和认证方法具有重要的现实意义。 
发明内容
目前已有的以脆弱水印技术为基础的音频认证方法,其水印一般来自外部的图像或者比特序列,与音频的内容缺少直接的联系,要么篡改定位困难,要么存在虚警和认证无法判别的问题,本发明提供一种基于音频内容生成多比特水印的音频可靠性认证方法。先对音频分帧,对每帧作三级离散小波变换(3DWT),量化三级小波近似系数cA3的均值mi生成水印;同时,修改cA3各系数,使其均值位于相应量化区间的中点,然后对其作非均匀离散余弦变换(NDCT),并量化变换第一个交流系数 
Figure BSA00000432433300021
嵌入水印。音频的认证首先对待认证的信号分帧,对每帧作3DWT并计算cA3*的均值 
Figure BSA00000432433300022
通过量化的方法提取水印 
Figure BSA00000432433300023
同时,对每帧cA3*作NDCT变换,量化其第一个交流系数 
Figure BSA00000432433300024
重构水印 
Figure BSA00000432433300025
通过计算 
Figure BSA00000432433300026
和 
Figure BSA00000432433300027
的归一化相关值对音频作完整性认证,通过 
Figure BSA00000432433300028
和 
Figure BSA00000432433300029
的积运算定位篡改位置。 
为保证认证的安全性和可靠性,防止认证的安全性攻击,NDCT的参数αi由密钥控制的混沌序列通过线性映射获得。 
为实现这样的目的,本发明设计的音频认证方案中,包括4个部分:1、水印的生成部分;2、NDCT矩阵的构造部分;3、水印的嵌入部分;4、音频的认证部分。每个部分说明如下: 
1、水印的生成 
首先对原始音频信号A分帧,帧长为lf,帧数即水印长lw;然后对每帧作3DWT,并计算每帧cA3的均值mi;最后量化mi,量化长度为 
Figure BSA00000432433300031
生成水印序列wi(wi∈{1,-1}),并对mi作如下处理: 
Figure BSA00000432433300032
Figure BSA00000432433300033
表示向下取整函数,式(1)的实质是计算mi相应量化区间的中值。并按下式修改cA3 
cA 3 T ( i , j ) = cA 3 ( i , j ) - m i + m i T - - - ( 2 )
其中i是帧序号,j是帧中系数的序号,式(2)的实质是修改均值使其位于相应量化区间的中点。 
2、NDCT矩阵的构造 
NDCT矩阵如式(3)所示: 
Figure BSA00000432433300035
N表示矩阵维数。构造NDCT矩阵就是生成相应的αi。本发明αi由式(4)生成 
ai=i+xi-0.5                  (4) 
其中i自然数,xi是密钥控制的Logistic映射序列,具体由公式(5)产生 
xi+1=u·xi·(1-xi)           (5) 
公式(5)中0.3699456<u≤4,xi∈(0,1),u和初值x1是非公开的已知密钥K。 
在NDCT矩阵Λ产生后,计算其逆阵Λ-1。 
3、水印的嵌入部分 
对步骤1中的cA3T(i,j)作NDCT变换,变换矩阵为Λ,变换后系数为 
Figure BSA00000432433300041
量化 
Figure BSA00000432433300042
(第二个系数)嵌入水印,量化长度取 
Figure BSA00000432433300043
量化后的系数记作 并对 
Figure BSA00000432433300045
作逆NDCT变换,变换矩阵为Λ-1,再作逆3DWT得到含水印的各帧 
Figure BSA00000432433300046
依次连接 
Figure BSA00000432433300047
及没嵌入水印的音频部分 
Figure BSA00000432433300048
完成水印的嵌入过程。 
4、音频的认证部分 
先将待认证音频A*分帧,并对每帧 
Figure BSA00000432433300049
作3DWT,量化cA3的均值 
Figure BSA000004324333000410
重构水印序列 
Figure BSA000004324333000411
然后对cA3作NDCT变换,变换矩阵为Λ,变换系数为 以长 量化 
Figure BSA000004324333000414
(第二个系数)提取水印 
Figure BSA000004324333000415
然后计算 和 
Figure BSA000004324333000417
的归一化相关值判断认证音频的完整性。如受到非同步攻击的恶意篡改,计算 
Figure BSA000004324333000418
和 
Figure BSA000004324333000419
的积定位篡改的位置。 
本发明充分利用了音频内容自身的特点生成水印,水印的嵌入过程和音频的认证使用混沌产生NDCT变换矩阵参数ai,加强了安全性。因为水印与音频内容紧密相关,音频遭受篡改,生成的水印和重构的水印都会发生大的变动,可以方便的检测到篡改并能定位非同步攻击的篡改位置。 
附图说明
图1为水印的生成过程图。 
图2为NDCT矩阵的生成过程图。 
图3水印的嵌入过程图。 
图4音频的认证过程图。 
图5认证实例。其中5(a)为一原始音频波形;5(b)为嵌入水印的波形;5(c)为篡改部分内容后的波形;5(d)为篡改定位结果。 
具体实施方式
以下结合附图和实施例对本发明的技术方案作进一步描述。 
1、水印的生成。 
由如图1的流程生成水印。音频用A={ai|ai,1≤i≤la}表示,la是音频的长度。帧长lf为已知,本发明的实例中lf=256。帧数即水印长度为 
Figure BSA00000432433300052
表示向下取整函数,分帧后各音频帧用Ai表示。对Ai作3DWT,用cA3(i,j)表示三级小波分解后近似分量的系数,i表示帧号,j表示该帧第j个小波系数,然后计算各帧三级小波系数近似分量cA3的均值mi,并根据奇偶量化原理,按式(6)量化mi生成水印比特序列wi,其中 
Figure BSA00000432433300053
是量化步长,mod(·)表示取模运算。 
mod ( m i / l 1 q , 2 ) ≤ 1 , w i = + 1 mod ( m i / l 1 q , 2 ) > 1 , w i = - 1 - - - ( 6 )
2、NDCT矩阵的构造。 
NDCT矩阵的构造如图2所示。首先设置Logistical映射的初值x1和参数u(0.3699456<u≤4)作为密钥K,按xi+1=u·xi·(1-xi)生成混沌序列xi,xi∈(0,1),并由ai=i+xi-0.5映射生成ai(i是自然数),由ai确定的NDCT矩阵如下所示: 
在Λ矩阵产生后,判断其逆矩阵是否存在,如果存在,计算其逆阵Λ-1,如果逆矩阵不存在需重新设置初值x1,本发明中用随机数发生器产生的随机数作初值作了1万次实验,所得Λ矩阵均可逆。矩阵的维数N=lf/23。本发明中具体实施例中u=3.85,x1=0.6。 
3、水印的嵌入过程 
水印嵌入过程如图3的流程所示。对音频A分帧,帧长为lf,帧数即水印长lw,每帧记为Ai,对Ai作3DWT变换,并按关系式 
Figure BSA00000432433300061
修改变换后的系数cA3(i,j)。其中, 
Figure BSA00000432433300062
mi是三级小波近似系数均值, 
Figure BSA00000432433300063
是向下取整函数。 
对修改后的三级小波近似系数cA3T(i,j)作NDCT变换,变换矩阵为Λ,变换后系数为 通过量化第一个交流系数 
Figure BSA00000432433300065
嵌入水印wi,量化长度为 水印嵌入后再作逆NDCT变换和逆3DWT并连接各含水印音频帧 和不含水印的音频部分 
Figure BSA00000432433300068
获得含水印音频。 
本发明的具体实施例中,随机截取了名为“going home.wav”歌曲的一段波形,如图5(a)所示,嵌入水印的音频波形如图5(b)所示,从波形上难以觉察到差别,客观的信噪比SNR=41.83dB。一般地,SNR>22dB就难以感觉听觉上的差异,因此客观的SNR值也证明了水印的不可听性。 
为保证本发明所要达到的完整性认证的目的,两次的量化长度 
Figure BSA00000432433300069
和 
Figure BSA000004324333000610
需要满足合适的数学关系式。具体说明如下: 
假设水印嵌入过程中量化误差是e,那么在NDCT逆变换每个系数发生的变化量为e×cr,1,cr,1是Λ-1的第2列的第r个元素。那么cA3均值的变化量 
Figure BSA000004324333000611
N是Λ-1的维数。根据量化原理,在音频无信号处理和其它攻击情况下能准确检测到水印的条件是: 
| Δ | ≤ l 1 q / 2 - - - ( 7 )
| e × ( Σ r c r , 1 ) / N | ≤ l 1 q / 2 - - - ( 8 )
标记 
Figure BSA000004324333000614
那么(8)可写为 
| e | ≤ N × l 1 q 2 | S | - - - ( 9 )
根据量化原理 
Figure BSA00000432433300072
联立(9)(10)及水印能检测原则极限 
l 2 q × | S | × 2 N ≤ l 1 q - - - ( 11 )
(11)表明了水印能实现无虚警检测量化长度 
Figure BSA00000432433300074
满足的数学关系式。 
对DCT而言,S=0,本发明NDCT的构造约束αi在i附近波动,S值较小,在实际选择 
Figure BSA00000432433300075
时,首先选择 
Figure BSA00000432433300076
再根据(11),确定 
Figure BSA00000432433300077
一般地,使 
Figure BSA00000432433300078
并保持二者在同一数量级。本发明的实例中 
Figure BSA00000432433300079
选择0.01, 
Figure BSA000004324333000710
选择0.005。 
4、音频的认证过程。 
音频的认证过程如图4所示。首先将待认证的音频A*以帧长lf分帧,然后将各帧 
Figure DEST_PATH_GSB00000804964800011
作三级小波变换,cA3*(i,j)为其三级小波近似系数,其中i是帧号,j是帧中系数序号。计算各帧cA3*(i,j)统计均值 并以量化长度 
Figure DEST_PATH_GSB00000804964800013
量化 
Figure DEST_PATH_GSB00000804964800014
重构水印 
Figure DEST_PATH_GSB00000804964800015
同时,对各帧cA3*(i,j)作NDCT变换,变换矩阵为Λ。对NDCT变换后的第一个交流系数 
Figure DEST_PATH_GSB00000804964800016
进行量化提取水印 
Figure DEST_PATH_GSB00000804964800017
然后按式(12)计算 
Figure DEST_PATH_GSB00000804964800018
和 
Figure DEST_PATH_GSB00000804964800019
的归一化相关值以认证音频的完整性。 
ρ = 1 l w Σ i w i * × w i * * - - - ( 12 )
公式(12)用来表示两个信号的相似程度,其值在[0,1]间,如果值为0,表示两个信号无关,如果值为1,表示两个信号完全相同。值越大表示两个信号越接近,因此可用于信号的完整性认证。在完整性认证中ρ大于设定的门限表示音频是完整的,否则音频不是完整的。同时,按式(13)定位音频篡改位置。 
x ( i ) = w i * × w i * * - - - ( 13 )
因为 
Figure DEST_PATH_GSB000008049648000112
所以x(i)=-1表示所在的帧被篡改。 
本发明的实例中图5(c)为恶意篡改后的水印音频波形,图5(d)为篡改定位的结果,其中值为-1的部分表示被篡改的音频位置。 

Claims (2)

1.基于音频内容的非均匀离散余弦变换的音频可靠性认证方法,其特征在于含有下述步骤:
(1)以
Figure FSB00000804964900011
为量化步长,按公式 mod ( m i / l 1 q , 2 ) ≤ 1 , w i = + 1 mod ( m i / l 1 q , 2 ) ≤ 1 , w i = - 1 量化音频帧三级小波近似系数cA3均值mi生成水印序列wi
(2)以量化步长
Figure FSB00000804964900013
量化非均匀离散余弦变换的第一个交流系数嵌入水印,其中量化长度
Figure FSB00000804964900014
与量化长度
Figure FSB00000804964900015
需要满足关系式(1)
l 2 q × | S | × 2 / N ≤ l 1 q - - - ( 1 )
其中N是Λ矩阵维数,S是Λ的逆阵Λ-1的第二列系数的和;非均匀离散余弦变换矩阵Λ的参数ai由Logistical混沌映射和线性映射生成,具体为:ai=i+xi-0.5;其中i是自然数,xi是由Logistical映射产生的混沌序列,即xi+1=u·xi·(1-xi),其中0.3699456<u≤4,xi∈(0,1);由u和初值x1组成密钥K控制混沌序列,生成的Λ矩阵如式(2):
Figure FSB00000804964900017
其中N是矩阵维数;
(3)待认证的音频,通过重构水印比特和提取水印比特
Figure FSB00000804964900019
的归一化相关值ρ进行完整性认证,通过计算其积定位篡改位置。
2.如权利要求1所述的基于音频内容的非均匀离散余弦变换的音频可靠性认证方法,其特征在于:水印wi由音频帧的三级小波近似系数cA3量化而成,水印与音频内容相关联,音频内容受到篡改,水印序列也发生变化。
CN201110035947A 2011-01-28 2011-01-28 基于音频内容的非均匀离散余弦变换音频可靠性认证方法 Expired - Fee Related CN102157154B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110035947A CN102157154B (zh) 2011-01-28 2011-01-28 基于音频内容的非均匀离散余弦变换音频可靠性认证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110035947A CN102157154B (zh) 2011-01-28 2011-01-28 基于音频内容的非均匀离散余弦变换音频可靠性认证方法

Publications (2)

Publication Number Publication Date
CN102157154A CN102157154A (zh) 2011-08-17
CN102157154B true CN102157154B (zh) 2012-09-05

Family

ID=44438617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110035947A Expired - Fee Related CN102157154B (zh) 2011-01-28 2011-01-28 基于音频内容的非均匀离散余弦变换音频可靠性认证方法

Country Status (1)

Country Link
CN (1) CN102157154B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102664014B (zh) * 2012-04-18 2013-12-04 清华大学 一种基于对数量化索引调制的盲音频水印实现方法
CN105304091B (zh) * 2015-06-26 2018-10-26 信阳师范学院 一种基于dct的语音篡改恢复方法
CN106373584A (zh) * 2015-07-24 2017-02-01 韶关学院 利用复合特征量和非对称分帧的鲁棒音频水印方法
CN106373585A (zh) * 2015-07-24 2017-02-01 韶关学院 基于酉变换和抖动量化的安全音频水印方法
CN105374361A (zh) * 2015-12-16 2016-03-02 广东石油化工学院 一种基于混沌系统的音频水印算法
CN106875954A (zh) * 2017-03-27 2017-06-20 中国农业大学 一种抗声码器处理的语音信息隐藏电路结构及其控制方法
CN107256346B (zh) * 2017-05-22 2021-01-05 努比亚技术有限公司 保护文件版权的方法、系统、及存储介质
CN107222309B (zh) * 2017-06-29 2019-10-08 常州机电职业技术学院 一种基于离散小波变换的时间式网络隐信道构建方法
CN108962267B (zh) * 2018-07-09 2019-11-15 成都信息工程大学 一种基于哈希特征的加密语音内容认证方法
CN111028850B (zh) * 2018-10-10 2022-09-06 中国移动通信集团浙江有限公司 一种音频水印的嵌入方法和提取方法
CN113506580B (zh) * 2021-04-28 2024-05-07 合肥工业大学 抗任意剪切和翻录的音频水印方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001054053A1 (en) * 2000-01-24 2001-07-26 Ecole Polytechnique Federale De Lausanne Transform domain allocation for multimedia watermarking

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Huang Xiong-Hua et al.Robust audio watermarking based non-uniform DCT.《Intelligent Computing and Intelligent Systems (ICIS)》.2010,585-588. *
王宏霞.基于内容的自适应音频水印研究综述.《西南交通大学学报》.2009,430-435. *
邓艺 et al.基于非均匀DCT的量化索引调制隐写.《电子与信息学报》.2010, *

Also Published As

Publication number Publication date
CN102157154A (zh) 2011-08-17

Similar Documents

Publication Publication Date Title
CN102157154B (zh) 基于音频内容的非均匀离散余弦变换音频可靠性认证方法
Lei et al. Robust SVD-based audio watermarking scheme with differential evolution optimization
CN100361437C (zh) 一种数字图像哈希签名方法
Fan et al. Chaos-based discrete fractional Sine transform domain audio watermarking scheme
Wang et al. Centroid-based semi-fragile audio watermarking in hybrid domain
CN100507936C (zh) 一种基于Zernike矩的鲁棒哈希图像认证方法
CN100596061C (zh) 一种基于盲源分离的小波域数字音频多目的水印方法
CN104795071A (zh) 一种盲音频水印嵌入及水印提取的处理方法
CN101441870A (zh) 一种基于离散分数变换的鲁棒数字音频水印方法
CN101330610A (zh) 水印嵌入方法及装置、提取方法及装置和处理系统
Maha et al. DCT based blind audio watermarking scheme
CN107993669A (zh) 基于修改最低有效位数权重的语音内容认证和篡改恢复方法
CN103050120B (zh) 大容量数字音频可逆水印处理方法
CN109344578A (zh) 基于混沌和小波变换的音频水印嵌入、提取方法
CN102867513B (zh) 一种基于伪Zernike矩的语音内容认证方法
Sarker et al. FFT-based audio watermarking method with a gray image for copyright protection
CN104637484A (zh) 一种基于共生矩阵分析的mp3音频隐写检测方法
Kushwaha et al. Multiple watermarking on digital audio based on DWT technique
CN101609675B (zh) 一种基于质心的脆弱音频水印方法
CN114999502B (zh) 基于自适应字分帧的语音内容水印生成、嵌入方法、语音内容的完整性认证及篡改定位方法
Liu et al. Pseudo-zernike moments-based audio content authentication algorithm robust against feature-analysed substitution attack
Dutta et al. An adaptive robust watermarking algorithm for audio signals using SVD
CN108877819B (zh) 一种基于系数自相关度的语音内容取证方法
Chowdhury A Robust Audio Watermarking In Cepstrum Domain Composed Of Sample's Relation Dependent Embedding And Computationally Simple Extraction Phase
Khan et al. A new audio watermarking method based on discrete cosine transform with a gray image

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120905

Termination date: 20130128