CN103854652A - 基于svd和ann的鲁棒盲音频水印算法 - Google Patents

基于svd和ann的鲁棒盲音频水印算法 Download PDF

Info

Publication number
CN103854652A
CN103854652A CN201410107951.9A CN201410107951A CN103854652A CN 103854652 A CN103854652 A CN 103854652A CN 201410107951 A CN201410107951 A CN 201410107951A CN 103854652 A CN103854652 A CN 103854652A
Authority
CN
China
Prior art keywords
audio frequency
svd
watermarking
matrix
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410107951.9A
Other languages
English (en)
Inventor
雷敏
杨榆
刘博怀
王剑锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201410107951.9A priority Critical patent/CN103854652A/zh
Publication of CN103854652A publication Critical patent/CN103854652A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)

Abstract

随着互联网应用的普及,大量的音频信息以各种形式在网络上快速的交流和传播。为防止音频的盗版、复制等非法操作,本发明提出了一种结合ANN和SVD的音频盲水印算法,以实现对音频信息的版权保护。本发明先对原始音频分成长度为1600个样点的段。对角矩阵的元素标记由下式求得:嵌入强度α=0.2,wk为数字水印。对修改后的对角矩阵进行ISVD,得到矩阵。将降为一维信号,得到修改后的DCT系数,然后进行IDCT,再进行逆二级离散小波包分解,将他们转换回时域的音频信号。用已训练好的神经网络计算出W':原始音频与嵌入了水印音频间的区别,并得到了一个映射,其输入为期望输出为。实验表明本发明具有较好的透明性,见摘要附图1,同时对常规音频信号处理攻击具有较强的鲁棒性。

Description

基于SVD和ANN的鲁棒盲音频水印算法
技术领域本发明提出一种基于奇异值分解和神经网络的音频盲水印算法,该算法具有较好的鲁棒性和隐蔽性。属于数字水印领域。
背景技术随着多媒体业务,如电子商务的发展,按次视图,视频点播,电子报纸,和P2P媒体共享,多媒体数据可以快速通过高速的网络连接获得。然而,作者,出版社,所有人和多媒体数据的提供者都不愿意将他们的文件在网络环境中的发布,因为这些文件很容易被拦截、复制并重组信息进入原文件,造成版权侵犯。
随着互联网应用的普及,越来越多的数字化多媒体内容信息纷纷以各种形式在网络上快速的交流和传播。如何对数字化多媒体内容进行有效的管理和保护,成为信息安全领域的研究热点。信息隐藏可以在载体中嵌入难以被感知的秘密信息以保护数字内容的版权或用于保密通信,可以很好的解决上述问题。信息隐藏不同于传统的数据加密,数据加密隐藏信息的内容,让第三方看不懂;信息隐藏不但隐藏了信息的内容,而且隐藏了信息的存在性,让第三方看不见。隐写术与数字水印是信息隐藏的两个重要研究分支,采用的原理都是将一定量的信息嵌入到载体数据中,但由于应用环境和应用场合的不同,对具体的性能要求不同。
数字水印是通过对载体进行难以被感知的改动,从而嵌入与载体有关的信息,嵌入的信息不一定是秘密的,也有可能是可见。数字水印的目的是保护数字内容的所有权。音频水印嵌入的信息可以是音频版权保护信息、作品序列号、艺术家和歌曲名字等,用于音频的版权保护、盗版追踪和拥有者识别等。
目前的音频盲水印算法是建立在扩频原理上的。尽管该方法允许可靠的通信甚至强攻击,但解码器和盲检测扩频水印是不知道主机信号是否受到严重的数据干扰时,扩频为基础的系统鲁棒性较差。当前的水印方案的鲁棒性是远远不能满足需要,特别是音频水印方案。他们中的大多数能抵御只有某些有限的攻击。
发明内容针对以上问题,本发明提出了一种基于奇异值分解(SVD)和人工神经网络(ANN)的音频盲水印算法,该算法具有较好的隐蔽性和较强的鲁棒性。同时,由于神经网络具有记忆和适应能力,该方案可以提取水印信息,而无需原始音频。
本发明包括两个主要算法,水印嵌入算法、水印提取算法。
水印嵌入算法中:先将水印图像降维,然后对原始音频进行分成N块,每块包含1600个样点。从N个块中选出M1×M2个块,每块嵌入到一比特的水印信息中。求得对角矩阵的元素标记后对对角矩阵进行逆奇异值分解,得到矩阵
Figure BDA0000480232500000011
,将矩阵降为一维信号,然后对其进行逆离散余弦变换,再进行逆二级离散小波包分解,以将他们转换回时域的音频信号。最后用已训练好的神经网络计算出W'。实验中:假设数字水印信息是一个二进制图像W,包含M1×M2比特。
水印提取算法中:将音频分为N个块,每块有1600个采样点。从N个块中选出M1×M2个块,每块嵌入到一比特的水印信息中。对每个块进行2级离散小波包分解,然后选择包含400个样点的近似子带系数Ca1w。近似子带系数Ca1w由离散余弦变换分解而来,第一象限的离散余弦变换系数转换为一个10*10阶矩阵 Aw j k ( k = 1,2 , . . . , M 1 × M 2 ) . 对矩阵 Aw j k ( k = 1,2 , . . . , M 1 × M 2 ) 进行奇异值分解,得到10*10阶的对角矩阵
Figure BDA0000480232500000025
根据TNN的输入可以得到实体输出
Figure BDA0000480232500000026
。根据数字水印样本
Figure BDA0000480232500000027
以及相应的实体输出
Figure BDA0000480232500000028
,TNN可估算出每一比特所提取出的数字水印,并获得二进制图像。
本发明是一个盲水印算法,水印提取时不需要原始音频文件的参与。但嵌入水印时分段的长度大小需要作为密钥传递给提取方以完成水印信息的提取。
本发明具有易于实现、执行效率高等优点,在实践中具有较高的理论与应用价值。
附图说明下面结合附图和具体实施方式,对本发明做进一步的详细说明。
图1是本发明提出的音频水印嵌入算法流程图。
图2音频的奇异值分解系数S(1,1)。
图3是本发明提出的音频水印提取算法流程图。
图4、5是本发明提出的音频水印嵌入算法的隐蔽性实验验证结果。
具体实施方式
图1表示了本发明提出的水印嵌入算法,具体步骤如下:
定义X=(x1,x2,...,xM)为主机音频,定义W(i,j),(0≤i<M1,0≤j<M2)为数字水印信息。
步骤1:水印图像的降维。因为音频信号是一维的,但数字水印W(i,j)是二维的。因此数字水印应该变换为一维信号: w = { w ( i ) = w ( m 1 , m 2 ) | 1 ≤ m 1 ≤ M 1 , 1 ≤ m 2 ≤ M 2 , 1 ≤ i ≤ M 1 × M 2 }
步骤2:选择最理想的音频块。令音频X=(x1,x2,...,xM)与M PCM(脉冲编码调制)样本分割为
Figure BDA0000480232500000022
个块:B={b1,b2,...,bN},其中N≥M1×M2。每一块包含1600个样点。我们可以选择从N个块中选出M1×M2个块,每块嵌入到一比特的水印信息中。选择算法如下:
(1)对音频块bi(i=1,2,...,N)进行二级离散小波变换,接下来选择包含400个样点近似的子带系数Ca1。
(2)近似子带系数Ca1是离散余弦变换的分解,将离散余弦变换系数的第一象限转换为一个10*10矩阵Ai(i=1,2,...,N).
(3)对矩阵Ai(i=1,2,...,N)进行奇异值分解,得到一个10*10的对角矩阵Si(i=1,2,...,N)
(4)选择 S k ( k ∈ K = { j 1 , j 2 , · · · , j M 1 × M 2 } , j i ∈ { 1,2 , · · · , N } , i = { 1,2 , · · · , M 1 × M 2 } ) , 其中满足Sk(1,1)≥Sn(1,1),并且k∈K,n∈{1,2,...N}/K。
步骤3:对角矩阵的元素标记
Figure BDA0000480232500000033
由下面的式子求得:
Figure BDA0000480232500000034
其中嵌入强度α=0.2,wk为数字水印。
步骤4:对修改后的对角矩阵进行逆奇异值分解,得到矩阵
Figure BDA0000480232500000035
步骤5:将矩阵
Figure BDA0000480232500000036
降为一维信号,得到修改后的离散余弦变换系数。然后对修改后的离散余弦变换系数进行逆离散余弦变换,得到修改后的离散小波变换系数。
步骤6:对修改后的离散小波变换系数进行逆二级离散小波包分解,以将他们转换回时域的音频信号。
步骤7:我们可以用已训练好的神经网络计算出W':原始音频与嵌入了水印音频间的区别,并得到了一个映射,其输入为 ( S j k - t , . . . S j k - 1 , S ′ j k , S j k + 1 , . . . , S j k + t ) , 期望输出为
Figure BDA0000480232500000038
如今大多数的水印嵌入算法都是轮流嵌入一比特的水印信息,但我们提出的算法发现了使用TNN技术的最佳架构,并嵌入水印信息。音频信号的奇异值分解系数S(1,1)不是采集自随机连续音频信号,见图3.
图2表示了音频信号的奇异值分解系数S(1,1)
图3表示了本发明提出的水印提取算法,具体步骤如下:
从水印嵌入中得到TNN,可以存储原始音频和对应的加过水印的音频的关系。下面列出水印提取所需的参数:
所有TNN的突触权重值W'
水印中包含的M1×M2比特矩阵的数量W。
水印提取的结构在图4中描述。详细的水印提取算法在下面给出:
步骤1:将音频Xw=(xw1,xw2,...,xwM)分段为
Figure BDA0000480232500000031
个块Bw={bw1,bw2,...,bwN},其中N≥M1×M2。每一块有1600个样点。我们可以从N个块中选择M1×M2个块,每个块都可以嵌入到一个比特的水印信息中。
步骤2:对加过数字水印的音频块
Figure BDA0000480232500000043
进行2级离散小波包分解,然后选择包含400个样点的近似子带系数Ca1w。
步骤3:近似子带系数Ca1w由离散余弦变换分解而来,第一象限的离散余弦变换系数转换为一个10*10阶矩阵 Aw j k ( k = 1,2 , . . . , M 1 × M 2 )
步骤4:对矩阵进行奇异值分解,得到10*10阶的对角矩阵 Sw j k ( k = 1,2 , . . . , M 1 × M 2 )
步骤5:我们可以根据TNN的输入 ( Sw j k - 4 ( 1,1 ) , Sw j k - 3 ( 1,1 ) , Sw j k - 2 ( 1,1 ) , Sw j k - 1 ( 1,1 ) , Sw j k ( 1,1 ) , Sw j k + 1 ( 1,1 ) , Sw j k + 2 ( 1,1 ) , Sw j k + 3 ( 1,1 ) , Sw j k + 4 ( 1,1 ) , ) 得到实体输出
Figure BDA0000480232500000047
步骤6:根据数字水印样本
Figure BDA0000480232500000048
以及相应的实体输出
Figure BDA0000480232500000049
,对于TNN,第k比特的提取出的数字水印W可用下式估计: W k = 1 , if Sw j k ( 1,1 ) - S w j k ′ > 0.05 0 , else
步骤7:我们可以从提取的数字水印中获得二进制图像。
图4示意三份加过水印的音频文件与其原版。
图5示意他们之间的区别:X为音频信号,X’为加过水印的音频信号。在选取的3种音频中嵌入水印前后的波形图几乎看不出有多大差别,说明本发明具有很好的隐蔽性。
表1:我们所提出的数字水印方法应用于不同嵌入强度α、不同类型音频所产生的信噪比结果。我们所提出的数字水印方法所带来的信噪比阈值为21dB到48dB之间。
表1不同类型音频在不同嵌入强度下的信噪比结果
Pop Speech Classic
α=0.1 48.406 31.386 37.186
α=0.2 42.385 25.366 31.166
α=0.3 38.864 21.844 27.644
本发明试验中对加载水印音频进行以下鲁棒性测试:(1)无攻击,(2)添加20dB的高斯噪声,(3)以0.5倍的采样率做非整数倍下采样,(4)以11.025kHZ为截止频率的低通滤波,(5)8bit重新量化,(6)在64kbit/s的比特率下进行MP3压缩,(7)、在32kbit/s的比特率下进行MP3压缩,(8)在128kbit/s的比特率下进行MP3压缩,(9)替换。
表2给出了本发明在100%的嵌入率下,三种不同类型的加载水印音频对上述攻击方式的误码率和相关系数。
表2不同音频类型在音频攻击后的比较表
Figure BDA0000480232500000051
表3给出了本发明提出的算法和现有算法在加载水印音频对一些常见攻击方式的误码率。是按照三种音频的平均值来计算。
表3不同算法在音频攻击后的误码率比较表
Figure BDA0000480232500000052
实验表明本发明提出的基于奇异值分解和神经网络的音频盲水印方法,具有较好的隐蔽性,且算法的效率较高,并且对于MP3压缩、重量化、重采样、低通滤波、高斯加噪、裁剪替换等常见音频信号处理攻击具有很强的鲁棒性。

Claims (4)

1.基于SVD和ANN的鲁棒盲音频水印算法,其特征在于:结合奇异值分解(SVD)和人工神经网络(ANN)的音频盲水印方法。
2.如权利要求1所说的基于SVD-ANN的音频盲水印算法的水印嵌入算法,其特征在于:先将水印图像降维,然后对原始音频进行分成N块,每块包含1600个样点。从N个块中选出M1×M2个块,每块嵌入到一比特的水印信息中。求得对角矩阵的元素标记后对对角矩阵进行逆奇异值分解,得到矩阵
Figure FDA0000480232490000011
将矩阵
Figure FDA0000480232490000012
降为一维信号,然后对其进行逆离散余弦变换,再进行逆二级离散小波包分解,以将他们转换回时域的音频信号。最后用已训练好的神经网络计算出W'。实验中:假设数字水印信息是一个二进制图像W,包含M1×M2比特。
3.如权利要求1所说的基于SVD-ANN的音频盲水印算法的的水印提取算法,其特征在于:将音频分为N个块,每块有1600个采样点。从N个块中选出M1×M2个块,每块嵌入到一比特的水印信息中。对每个块进行2级离散小波包分解,然后选择包含400个样点的近似子带系数Ca1w。近似子带系数Ca1w由离散余弦变换分解而来,第一象限的离散余弦变换系数转换为一个10*10阶矩阵 Aw j k ( k = 1,2 , . . . , M 1 × M 2 ) . 对矩阵 Aw j k ( k = 1,2 , . . . , M 1 × M 2 ) 进行奇异值分解,得到10*10阶的对角矩阵
Figure FDA0000480232490000015
根据TNN的输入可以得到实体输出
Figure FDA0000480232490000016
。根据数字水印样本
Figure FDA0000480232490000017
以及相应的实体输出
Figure FDA0000480232490000018
,TNN可估算出每一比特所提取出的数字水印,并获得二进制图像。
4.本发明是一个盲水印算法,水印提取时不需要原始音频文件的参与。但嵌入水印时分段的长度大小需要作为密钥传递给提取方以完成水印信息的提取。
CN201410107951.9A 2014-03-21 2014-03-21 基于svd和ann的鲁棒盲音频水印算法 Pending CN103854652A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410107951.9A CN103854652A (zh) 2014-03-21 2014-03-21 基于svd和ann的鲁棒盲音频水印算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410107951.9A CN103854652A (zh) 2014-03-21 2014-03-21 基于svd和ann的鲁棒盲音频水印算法

Publications (1)

Publication Number Publication Date
CN103854652A true CN103854652A (zh) 2014-06-11

Family

ID=50862222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410107951.9A Pending CN103854652A (zh) 2014-03-21 2014-03-21 基于svd和ann的鲁棒盲音频水印算法

Country Status (1)

Country Link
CN (1) CN103854652A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778650A (zh) * 2014-11-26 2015-07-15 北京邮电大学 一种基于中文汉字复杂度的抗打印扫描文本水印算法
CN105185397A (zh) * 2014-06-17 2015-12-23 北京司响无限文化传媒有限公司 视频标记方法和装置
CN105468935A (zh) * 2015-11-13 2016-04-06 福州瑞芯微电子股份有限公司 一种保证key安全烧录的方法、发送端、工具端及烧录端
CN106297778A (zh) * 2015-05-21 2017-01-04 中国科学院声学研究所 数据驱动的基于奇异值分解的神经网络声学模型裁剪方法
CN110379436A (zh) * 2019-06-14 2019-10-25 东南大学 一种基于dwt-dct-svd的信息隐藏方法
CN112927700A (zh) * 2021-02-06 2021-06-08 兰州理工大学 一种盲音频水印嵌入和提取方法及系统
WO2021155697A1 (zh) * 2020-02-04 2021-08-12 北京达佳互联信息技术有限公司 水印信息添加方法、提取方法及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040250078A1 (en) * 2001-03-22 2004-12-09 John Stach Quantization -based data hiding employing calibration and locally adaptive quantization
CN101593324A (zh) * 2009-06-17 2009-12-02 浙江师范大学 基于可信计算应用技术的网络多级审批方法及系统
CN102419979A (zh) * 2011-11-23 2012-04-18 北京邮电大学 一种实现篡改区域精确定位的音频半脆弱水印算法
CN102496367A (zh) * 2011-12-06 2012-06-13 北京邮电大学 基于dwt-dct-svd的音频盲水印算法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040250078A1 (en) * 2001-03-22 2004-12-09 John Stach Quantization -based data hiding employing calibration and locally adaptive quantization
CN101593324A (zh) * 2009-06-17 2009-12-02 浙江师范大学 基于可信计算应用技术的网络多级审批方法及系统
CN102419979A (zh) * 2011-11-23 2012-04-18 北京邮电大学 一种实现篡改区域精确定位的音频半脆弱水印算法
CN102496367A (zh) * 2011-12-06 2012-06-13 北京邮电大学 基于dwt-dct-svd的音频盲水印算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
胡金艳等: ""一种基于神经网络的小波域音频水印算法"", 《西安交通大学学报》, vol. 37, no. 4, 20 April 2003 (2003-04-20) *
雷敏: ""音频数字水印与隐写分析算法研究"", 《中国博士学位论文全文数据库信息科技辑》, 18 June 2011 (2011-06-18) *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105185397A (zh) * 2014-06-17 2015-12-23 北京司响无限文化传媒有限公司 视频标记方法和装置
CN104778650A (zh) * 2014-11-26 2015-07-15 北京邮电大学 一种基于中文汉字复杂度的抗打印扫描文本水印算法
CN106297778A (zh) * 2015-05-21 2017-01-04 中国科学院声学研究所 数据驱动的基于奇异值分解的神经网络声学模型裁剪方法
CN105468935A (zh) * 2015-11-13 2016-04-06 福州瑞芯微电子股份有限公司 一种保证key安全烧录的方法、发送端、工具端及烧录端
CN110379436A (zh) * 2019-06-14 2019-10-25 东南大学 一种基于dwt-dct-svd的信息隐藏方法
WO2021155697A1 (zh) * 2020-02-04 2021-08-12 北京达佳互联信息技术有限公司 水印信息添加方法、提取方法及设备
CN112927700A (zh) * 2021-02-06 2021-06-08 兰州理工大学 一种盲音频水印嵌入和提取方法及系统
CN112927700B (zh) * 2021-02-06 2024-03-19 兰州理工大学 一种盲音频水印嵌入和提取方法及系统

Similar Documents

Publication Publication Date Title
CN103854652A (zh) 基于svd和ann的鲁棒盲音频水印算法
Dubolia et al. Digital image watermarking by using discrete wavelet transform and discrete cosine transform and comparison based on PSNR
Dixit et al. A review on digital image watermarking techniques
Kaur et al. Steganographic approach for hiding image in DCT domain
CN102496367A (zh) 基于dwt-dct-svd的音频盲水印算法
Benhocine et al. New images watermarking scheme based on singular value decomposition.
Divecha et al. Implementation and performance analysis of DCT-DWT-SVD based watermarking algorithms for color images
Najih et al. Digital image watermarking based on angle quantization in discrete contourlet transform
CN105632506A (zh) 基于极谐变换的鲁棒数字音频水印嵌入及检测方法
Gupta et al. Image Watermarking using IWT-SVD and its Comparative Analysis with DWT-SVD
Vasudev A review on digital image watermarking and its techniques
Kumar et al. A hybrid digital watermarking approach using wavelets and LSB
Mansoori et al. A new semi-blind watermarking algorithm using ordered Hadamard transform
Singh et al. A hybrid algorithm for image watermarking against signal processing attacks
Kumar et al. Digital image steganography based on combination of DCT and DWT
Tang et al. Dual watermarking algorithm based on the Fractional Fourier Transform
Abraham et al. Image watermarking using DCT in selected pixel regions
Natgunanathan et al. Robust patchwork-based watermarking method for stereo audio signals
Yang et al. A robust digital audio watermarking using higher-order statistics
CN102075319A (zh) 应用混沌系统的音频水印方法
Awasthi et al. Robust image watermarking based on discrete wavelet transform, discrete cosine transform & singular value decomposition
Janardhanan et al. Performance analysis of discrete wavelet transform based audio watermarking on Indian classical songs
Kaur et al. An efficient adaptive data hiding scheme for image steganography
Bansal et al. Comparative analysis of digital watermarking techniques
Channapragada et al. Digital watermarking algorithm based on CCC-FWHT technique

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140611