CN102157154A - 基于音频内容的非均匀离散余弦变换音频可靠性认证方法 - Google Patents
基于音频内容的非均匀离散余弦变换音频可靠性认证方法 Download PDFInfo
- Publication number
- CN102157154A CN102157154A CN2011100359472A CN201110035947A CN102157154A CN 102157154 A CN102157154 A CN 102157154A CN 2011100359472 A CN2011100359472 A CN 2011100359472A CN 201110035947 A CN201110035947 A CN 201110035947A CN 102157154 A CN102157154 A CN 102157154A
- Authority
- CN
- China
- Prior art keywords
- audio
- watermark
- watermarks
- mrow
- discrete cosine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 239000011159 matrix material Substances 0.000 claims abstract description 29
- 238000013507 mapping Methods 0.000 claims description 8
- 230000000739 chaotic effect Effects 0.000 claims description 7
- 238000013139 quantization Methods 0.000 abstract description 21
- 230000008569 process Effects 0.000 abstract description 13
- 238000010606 normalization Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000010276 construction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000009432 framing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Editing Of Facsimile Originals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本发明提出一种基于音频内容生成水印的非均匀余弦变换NDCT的音频可靠性认证方法。水印嵌入过程首先对原始音频A分帧,然后对每帧Ai作三级小波变换3DWT,量化三级小波近似系数cA3的均值mi生成水印wi,量化长为同时修改cA3各系数使其均值位于量化区间的中点并作NDCT变换,并量化嵌入水印wi,量化长为最后每帧作逆NDCT和逆3DWT并连接所有含水印帧和不含水印的音频部分完成水印的嵌入。音频认证首先对待认证音频A*分帧,对每帧作3DWT,以为量化长量化三级小波近似系数cA3*的均值重构水印然后对cA3*作NDCT变换,并以为量化长量化提取水印计算和的归一化值认证音频的完整性。与需满足(N是NDCT矩阵维数,S是其第二列元素的和)。本发明适合于对数据可靠性要求很高的领域数据完整性的认证。
Description
技术领域
本发明是一种基于音频内容生成水印的音频可靠性认证方法,适合于数字音频传输和存储中可靠性和完整性认证,并能定位非同步攻击下被恶意篡改的音频位置。
技术背景
在计算机技术和网络技术迅速发展的今天,随着音频压缩技术和计算机应用软件技术的不断发展,数字音频的传输、复制、存储、修改越来越方便、快捷,随之造成的盗版、侵权、篡改等问题也凸现出来;并且,由于传输线路的安全性因素,音频在传输中也可能发生误码,丢包等问题,因此迫切需要数字音频的认证技术来鉴别知识产权的归属性和传输内容的可靠性。目前,解决该问题的数字水印技术成为国内外学者研究的热点。根据应用目的的不同,数字音频水印可分为鲁棒水印、脆弱水印和半脆弱水印。鲁棒水印主要用于电子作品的版权保护,载体音频在受到一定的扰动后,水印仍能被检测出来;半脆弱水印对常规的信号处理操作有一定的抵抗力,对恶意的篡改无法容忍,但能定位篡改位置,一般适用于非重要的音频数据的检测认证;在数据的可靠性要求很高的场合中,一般通过脆弱音频水印方案来认证信号的可靠性与完整性,脆弱水印是一种对篡改十分敏感的水印技术。这些水印方法中几乎都采用了外部的比特信息作为水印,或者随机数比特序列,或者M序列,或者混沌序列,或者二值图像,或者灰度图像或者彩色图像。王宏霞教授的论文《基于质心的混合域半脆弱音频水印算法》(中国科学:信息科学,2010,40(2):313~326.)和范明泉博士的论文《基于音频内容的混合域脆弱水印算法》(铁道学报,2010,32(1):118~122)均指出已有采用二值图像作为水印的脆弱音频水印算法,会带来因传输过程中二值图像被篡改引起的虚警和认证无法判别的问题。灰度图像和彩色图像也存在同样的问题。由密钥方式产生水印序列的随机数方式、M序列方式、混沌序列方式,其本质都是一比特水印方法,无法对篡改进行定位,同时,也因其存在虚警问题,不能满足一些场合鉴定认证等的需要。目前,已有学者开始探索基于音频内容的局部化水印方法。因此,研究基于音频内容的水印生成技术和认证方法具有重要的现实意义。
发明内容
目前已有的以脆弱水印技术为基础的音频认证方法,其水印一般来自外部的图像或者比特序列,与音频的内容缺少直接的联系,要么篡改定位困难,要么存在虚警和认证无法判别的问题,本发明提供一种基于音频内容生成多比特水印的音频可靠性认证方法。先对音频分帧,对每帧作三级离散小波变换(3DWT),量化三级小波近似系数cA3的均值mi生成水印;同时,修改cA3各系数,使其均值位于相应量化区间的中点,然后对其作非均匀离散余弦变换(NDCT),并量化变换第一个交流系数嵌入水印。音频的认证首先对待认证的信号分帧,对每帧作3DWT并计算cA3*的均值通过量化的方法提取水印同时,对每帧cA3*作NDCT变换,量化其第一个交流系数重构水印通过计算和的归一化相关值对音频作完整性认证,通过和的积运算定位篡改位置。
为保证认证的安全性和可靠性,防止认证的安全性攻击,NDCT的参数αi由密钥控制的混沌序列通过线性映射获得。
为实现这样的目的,本发明设计的音频认证方案中,包括4个部分:1、水印的生成部分;2、NDCT矩阵的构造部分;3、水印的嵌入部分;4、音频的认证部分。每个部分说明如下:
1、水印的生成
表示向下取整函数,式(1)的实质是计算mi相应量化区间的中值。并按下式修改cA3
其中i是帧序号,j是帧中系数的序号,式(2)的实质是修改均值使其位于相应量化区间的中点。
2、NDCT矩阵的构造
NDCT矩阵如式(3)所示:
N表示矩阵维数。构造NDCT矩阵就是生成相应的αi。本发明αi由式(4)生成
ai=i+xi-0.5 (4)
其中i自然数,xi是密钥控制的Logistic映射序列,具体由公式(5)产生
xi+1=u·xi·(1-xi) (5)
公式(5)中0.3699456<u≤4,xi∈(0,1),u和初值x1是非公开的已知密钥K。
在NDCT矩阵Λ产生后,计算其逆阵Λ-1。
3、水印的嵌入部分
对步骤1中的cA3T(i,j)作NDCT变换,变换矩阵为Λ,变换后系数为量化(第二个系数)嵌入水印,量化长度取量化后的系数记作并对作逆NDCT变换,变换矩阵为Λ-1,再作逆3DWT得到含水印的各帧依次连接及没嵌入水印的音频部分完成水印的嵌入过程。
4、音频的认证部分
先将待认证音频A*分帧,并对每帧作3DWT,量化cA3的均值重构水印序列然后对cA3作NDCT变换,变换矩阵为Λ,变换系数为以长量化(第二个系数)提取水印然后计算和的归一化相关值判断认证音频的完整性。如受到非同步攻击的恶意篡改,计算和的积定位篡改的位置。
本发明充分利用了音频内容自身的特点生成水印,水印的嵌入过程和音频的认证使用混沌产生NDCT变换矩阵参数ai,加强了安全性。因为水印与音频内容紧密相关,音频遭受篡改,生成的水印和重构的水印都会发生大的变动,可以方便的检测到篡改并能定位非同步攻击的篡改位置。
附图说明
图1为水印的生成过程图。
图2为NDCT矩阵的生成过程图。
图3水印的嵌入过程图。
图4音频的认证过程图。
图5认证实例。其中5(a)为一原始音频波形;5(b)为嵌入水印的波形;5(c)为篡改部分内容后的波形;5(d)为篡改定位结果。
具体实施方式
以下结合附图和实施例对本发明的技术方案作进一步描述。
1、水印的生成。
由如图1的流程生成水印。音频用A={ai|ai,1≤i≤la}表示,la是音频的长度。帧长lf为已知,本发明的实例中lf=256。帧数即水印长度为 表示向下取整函数,分帧后各音频帧用Ai表示。对Ai作3DWT,用cA3(i,j)表示三级小波分解后近似分量的系数,i表示帧号,j表示该帧第j个小波系数,然后计算各帧三级小波系数近似分量cA3的均值mi,并根据奇偶量化原理,按式(6)量化mi生成水印比特序列wi,其中是量化步长,mod(·)表示取模运算。
2、NDCT矩阵的构造。
NDCT矩阵的构造如图2所示。首先设置Logistical映射的初值x1和参数u(0.3699456<u≤4)作为密钥K,按xi+1=u·xi·(1-xi)生成混沌序列xi,xi∈(0,1),并由ai=i+xi-0.5映射生成ai(i是自然数),由ai确定的NDCT矩阵如下所示:
在Λ矩阵产生后,判断其逆矩阵是否存在,如果存在,计算其逆阵Λ-1,如果逆矩阵不存在需重新设置初值x1,本发明中用随机数发生器产生的随机数作初值作了1万次实验,所得Λ矩阵均可逆。矩阵的维数N=lf/23。本发明中具体实施例中u=3.85,x1=0.6。
3、水印的嵌入过程
水印嵌入过程如图3的流程所示。对音频A分帧,帧长为lf,帧数即水印长lw,每帧记为Ai,对Ai作3DWT变换,并按关系式修改变换后的系数cA3(i,j)。其中,mi是三级小波近似系数均值,是向下取整函数。
对修改后的三级小波近似系数cA3T(i,j)作NDCT变换,变换矩阵为Λ,变换后系数为通过量化第一个交流系数嵌入水印wi,量化长度为水印嵌入后再作逆NDCT变换和逆3DWT并连接各含水印音频帧和不含水印的音频部分获得含水印音频。
本发明的具体实施例中,随机截取了名为“going home.wav”歌曲的一段波形,如图5(a)所示,嵌入水印的音频波形如图5(b)所示,从波形上难以觉察到差别,客观的信噪比SNR=41.83dB。一般地,SNR>22dB就难以感觉听觉上的差异,因此客观的SNR值也证明了水印的不可听性。
假设水印嵌入过程中量化误差是e,那么在NDCT逆变换每个系数发生的变化量为e×cr,1,cr,1是Λ-1的第2列的第r个元素。那么cA3均值的变化量N是Λ-1的维数。根据量化原理,在音频无信号处理和其它攻击情况下能准确检测到水印的条件是:
即
联立(9)(10)及水印能检测原则极限
4、音频的认证过程。
音频的认证过程如图4所示。首先将待认证的音频A*以帧长lf分帧,然后将各帧作三级小波变换,cA3*(i,j)为其三级小波近似系数,其中i是帧号,j是帧中系数序号。计算各帧cA3*(i,j)统计均值并以量化长度量化重构水印w*(i);同时,对各帧cA3*(i,j)作NDCT变换,变换矩阵为Λ。对NDCT变换后的第一个交流系数进行量化提取水印w**(i)。然后按式(12)计算w*(i)和w**(i)的归一化相关值以认证音频的完整性。
公式(12)用来表示两个信号的相似程度,其值在[0,1]间,如果值为0,表示两个信号无关,如果值为1,表示两个信号完全相同。值越大表示两个信号越接近,因此可用于信号的完整性认证。在完整性认证中ρ大于设定的门限表示音频是完整的,否则音频不是完整的。同时,按式(13)定位音频篡改位置。
x(j)=w*(j)×w**(j) (13)
因为w*(j)、w**(j)∈{-1,+1},所以x(j)=-1表示所在的帧被篡改。
本发明的实例中图5(c)为恶意篡改后的水印音频波形,图5(d)为篡改定位的结果,其中值为-1的部分表示被篡改的音频位置。
Claims (4)
1.基于音频内容的非均匀离散余弦变换的音频可靠性认证方法,其特征在于含有下述步骤:
(1)通过量化音频帧三级小波近似系数cA3均值mi生成水印序列w(i);
(2)通过量化非均匀离散余弦变换的第一个交流系数嵌入水印,非均匀离散余弦变换矩阵Λ的参数ai由Logistical混沌映射和线性映射生成;
(3)待认证的音频,通过重构水印比特w*(i)和提取水印比特w**(i)的归一化相关值ρ进行完整性认证,通过计算其积定位篡改位置。
2.如权利要求1所述的基于音频内容的非均匀离散余弦变换的音频可靠性认证方法,其特征在于:水印w(i)由音频帧的三级小波近似系数cA3量化而成,水印与音频内容相关联,音频内容受到篡改,水印序列也发生变化。
3.如权利要求1所述的基于音频内容的非均匀离散余弦变换的音频可靠性认证方法,其特征在于:步骤(2)中非均匀离散余弦变换矩阵Λ的参数ai由密钥控制的混沌序列经过映射生成。具体为:ai=i+xi-0.5;其中i是自然数,xi是由Logistical映射产生的混沌序列,即xi+1=u·xi·(1-xi),其中0.3699456<u≤4,xi∈(0,1);由u和初值x1组成密钥K控制混沌序列。生成的Λ矩阵如(1)所示:
其中N是矩阵维数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110035947A CN102157154B (zh) | 2011-01-28 | 2011-01-28 | 基于音频内容的非均匀离散余弦变换音频可靠性认证方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110035947A CN102157154B (zh) | 2011-01-28 | 2011-01-28 | 基于音频内容的非均匀离散余弦变换音频可靠性认证方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102157154A true CN102157154A (zh) | 2011-08-17 |
CN102157154B CN102157154B (zh) | 2012-09-05 |
Family
ID=44438617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110035947A Expired - Fee Related CN102157154B (zh) | 2011-01-28 | 2011-01-28 | 基于音频内容的非均匀离散余弦变换音频可靠性认证方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102157154B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102664014A (zh) * | 2012-04-18 | 2012-09-12 | 清华大学 | 一种基于对数量化索引调制的盲音频水印实现方法 |
CN105304091A (zh) * | 2015-06-26 | 2016-02-03 | 信阳师范学院 | 一种基于dct的语音篡改恢复方法 |
CN105374361A (zh) * | 2015-12-16 | 2016-03-02 | 广东石油化工学院 | 一种基于混沌系统的音频水印算法 |
CN106373584A (zh) * | 2015-07-24 | 2017-02-01 | 韶关学院 | 利用复合特征量和非对称分帧的鲁棒音频水印方法 |
CN106373585A (zh) * | 2015-07-24 | 2017-02-01 | 韶关学院 | 基于酉变换和抖动量化的安全音频水印方法 |
CN106875954A (zh) * | 2017-03-27 | 2017-06-20 | 中国农业大学 | 一种抗声码器处理的语音信息隐藏电路结构及其控制方法 |
CN107222309A (zh) * | 2017-06-29 | 2017-09-29 | 常州机电职业技术学院 | 一种基于离散小波变换的时间式网络隐信道构建方法 |
CN107256346A (zh) * | 2017-05-22 | 2017-10-17 | 努比亚技术有限公司 | 保护文件版权的方法、系统、及存储介质 |
CN108962267A (zh) * | 2018-07-09 | 2018-12-07 | 成都信息工程大学 | 一种基于哈希特征的加密语音内容认证方法 |
CN111028850A (zh) * | 2018-10-10 | 2020-04-17 | 中国移动通信集团浙江有限公司 | 一种音频水印的嵌入方法和提取方法 |
CN113506580A (zh) * | 2021-04-28 | 2021-10-15 | 合肥工业大学 | 抗任意剪切和翻录的音频水印方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001054053A1 (en) * | 2000-01-24 | 2001-07-26 | Ecole Polytechnique Federale De Lausanne | Transform domain allocation for multimedia watermarking |
-
2011
- 2011-01-28 CN CN201110035947A patent/CN102157154B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001054053A1 (en) * | 2000-01-24 | 2001-07-26 | Ecole Polytechnique Federale De Lausanne | Transform domain allocation for multimedia watermarking |
Non-Patent Citations (3)
Title |
---|
《Intelligent Computing and Intelligent Systems (ICIS)》 20101029 Huang Xiong-Hua et al Robust audio watermarking based non-uniform DCT 585-588 , 2 * |
《电子与信息学报》 20100228 邓艺 et al 基于非均匀DCT的量化索引调制隐写 , 2 * |
《西南交通大学学报》 20090630 王宏霞 基于内容的自适应音频水印研究综述 430-435 , 2 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102664014A (zh) * | 2012-04-18 | 2012-09-12 | 清华大学 | 一种基于对数量化索引调制的盲音频水印实现方法 |
CN102664014B (zh) * | 2012-04-18 | 2013-12-04 | 清华大学 | 一种基于对数量化索引调制的盲音频水印实现方法 |
CN105304091A (zh) * | 2015-06-26 | 2016-02-03 | 信阳师范学院 | 一种基于dct的语音篡改恢复方法 |
CN105304091B (zh) * | 2015-06-26 | 2018-10-26 | 信阳师范学院 | 一种基于dct的语音篡改恢复方法 |
CN106373584A (zh) * | 2015-07-24 | 2017-02-01 | 韶关学院 | 利用复合特征量和非对称分帧的鲁棒音频水印方法 |
CN106373585A (zh) * | 2015-07-24 | 2017-02-01 | 韶关学院 | 基于酉变换和抖动量化的安全音频水印方法 |
CN105374361A (zh) * | 2015-12-16 | 2016-03-02 | 广东石油化工学院 | 一种基于混沌系统的音频水印算法 |
CN106875954A (zh) * | 2017-03-27 | 2017-06-20 | 中国农业大学 | 一种抗声码器处理的语音信息隐藏电路结构及其控制方法 |
CN107256346A (zh) * | 2017-05-22 | 2017-10-17 | 努比亚技术有限公司 | 保护文件版权的方法、系统、及存储介质 |
CN107256346B (zh) * | 2017-05-22 | 2021-01-05 | 努比亚技术有限公司 | 保护文件版权的方法、系统、及存储介质 |
CN107222309A (zh) * | 2017-06-29 | 2017-09-29 | 常州机电职业技术学院 | 一种基于离散小波变换的时间式网络隐信道构建方法 |
CN108962267A (zh) * | 2018-07-09 | 2018-12-07 | 成都信息工程大学 | 一种基于哈希特征的加密语音内容认证方法 |
CN111028850A (zh) * | 2018-10-10 | 2020-04-17 | 中国移动通信集团浙江有限公司 | 一种音频水印的嵌入方法和提取方法 |
CN111028850B (zh) * | 2018-10-10 | 2022-09-06 | 中国移动通信集团浙江有限公司 | 一种音频水印的嵌入方法和提取方法 |
CN113506580A (zh) * | 2021-04-28 | 2021-10-15 | 合肥工业大学 | 抗任意剪切和翻录的音频水印方法及系统 |
CN113506580B (zh) * | 2021-04-28 | 2024-05-07 | 合肥工业大学 | 抗任意剪切和翻录的音频水印方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102157154B (zh) | 2012-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102157154A (zh) | 基于音频内容的非均匀离散余弦变换音频可靠性认证方法 | |
Rakhmawati et al. | A recent survey of self-embedding fragile watermarking scheme for image authentication with recovery capability | |
Celik et al. | Hierarchical watermarking for secure image authentication with localization | |
Zhu et al. | When seeing isn't believing [multimedia authentication technologies] | |
CN100395776C (zh) | 基于混沌散列函数的分块脆弱水印生成与认证方法 | |
Liu et al. | A novel speech content authentication algorithm based on Bessel–Fourier moments | |
Li et al. | Tamper detection and self-recovery of biometric images using salient region-based authentication watermarking scheme | |
El'arbi et al. | Image authentication algorithm with recovery capabilities based on neural networks in the DCT domain | |
CN107993669B (zh) | 基于修改最低有效位数权重的语音内容认证和篡改恢复方法 | |
Yuan et al. | Multiscale fragile watermarking based on the Gaussian mixture model | |
CN104795071A (zh) | 一种盲音频水印嵌入及水印提取的处理方法 | |
CN110211020B (zh) | 基于swt-dft的图像水印嵌入与提取方法 | |
CN102509257B (zh) | 基于人类视觉特性压缩感知的灰度图像篡改检测方法 | |
US20050165690A1 (en) | Watermarking via quantization of rational statistics of regions | |
Santosa et al. | Audio-to-image wavelet transform based audio steganography | |
Li et al. | Audio-lossless robust watermarking against desynchronization attacks | |
Liu et al. | Adaptive feature calculation and diagonal mapping for successive recovery of tampered regions | |
CN102867513B (zh) | 一种基于伪Zernike矩的语音内容认证方法 | |
CN107358072B (zh) | 基于i码和cff码的矢量地图数字指纹版权保护方法 | |
CN104866737B (zh) | 一种顾及地形特征的dem脆弱水印完整性认证方法 | |
CN108877819B (zh) | 一种基于系数自相关度的语音内容取证方法 | |
CN114630130A (zh) | 一种基于深度学习的换脸视频溯源方法及系统 | |
CN106373584A (zh) | 利用复合特征量和非对称分帧的鲁棒音频水印方法 | |
Fang et al. | Image tampering location and restoration watermarking based on blockchain technology | |
CN110047495A (zh) | 基于2级奇异值分解的大容量音频水印算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120905 Termination date: 20130128 |