CN1808970A - 一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法 - Google Patents

一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法 Download PDF

Info

Publication number
CN1808970A
CN1808970A CNA2006100202367A CN200610020236A CN1808970A CN 1808970 A CN1808970 A CN 1808970A CN A2006100202367 A CNA2006100202367 A CN A2006100202367A CN 200610020236 A CN200610020236 A CN 200610020236A CN 1808970 A CN1808970 A CN 1808970A
Authority
CN
China
Prior art keywords
watermark
audio signal
discrete fourier
fourier transform
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006100202367A
Other languages
English (en)
Other versions
CN100527662C (zh
Inventor
张家树
谢玲
和红杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Jiaotong University
Original Assignee
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Jiaotong University filed Critical Southwest Jiaotong University
Priority to CNB2006100202367A priority Critical patent/CN100527662C/zh
Publication of CN1808970A publication Critical patent/CN1808970A/zh
Application granted granted Critical
Publication of CN100527662C publication Critical patent/CN100527662C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法。该方法首先结合了鲁棒音频水印本身需要满足的条件和非均匀离散傅立叶变换(Nonuniform Discrete Fourier Transform,NDFT)的特性,得到了在NDFT域可嵌入水印的中频选取范围;再对分段后的每段音频信号利用一定规则在此范围内随机选择一个水印嵌入的中频频率点;在此频率点和DFT变换中除中频外的其它频率点做NDFT变换,在中频嵌入水印。该发明算法简单,容易实现,不仅对常规信号处理攻击具有较高鲁棒性,而且提高了抗恶意攻击的鲁棒性,有利于鲁棒音频数字水印技术的推广与实际应用。

Description

一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法
所属技术领域
本发明涉及一种基于离散傅立叶变换的数字水印方法,属于多媒体信息安全技术领域。
背景技术
近几年来,随着因特网的日益普及,特别是随着计算机网络通信技术的发展,音频等多媒体信息的交流已达到了前所未有的深度和广度,音频数据的交换和传输变成了一个相对简单的过程;然而网络信息的全透明性和易操作性,再加上各种各样便捷的信号处理操作可以不留痕迹地对音频数据进行任意分发拷贝,导致音频内容的剽窃、版权纠纷以及音频信号的真伪鉴别等问题,这都使得艺术作品的作者、发行者和消费者的利益受到极大损害。在版权保护、广播监控、指纹鉴别、拷贝控制、标注、法庭证明等场合,人们需要确切知道数字音频作品的版权所有者、发行者和消费者是否享有应有的权利及音频内容的真伪等。因此网络环境下的音频数据版权保护与真伪鉴别问题,已成为当前迫切需要解决的难题。在当今信息版权保护领域,鲁棒音频数字水印作为解决该问题的技术之一日益为学术界和商界所关注。
用于版权保护的音频数字水印通常应该满足以下几点:①感知透明性,②鲁棒性,③检测不需要原始音频,④安全性;在某些应用场合不仅需要对常规信号处理操作保持高鲁棒性,还要求音频水印能够对恶意攻击具有较高鲁棒性,这就为鲁棒音频数字水印技术提出了更高的要求。现有的鲁棒音频水印技术中,通常来说,变换域方法比时域方法具有更强鲁棒性,具代表性的频率域方法为基于振幅和相位编码的鲁棒水印技术:人耳对声音的相位不太敏感,尤其是缺乏感知绝对相位值的能力,但对相位值的相对差异较敏感。参考文献“Techiniques for data hiding”(W.Bender,D.Gruhl,N.Morimoto,A.Lu,IBMSystems Journal,pp:313-336,1996)把总长度为N的信号分割为小的音频片段,对每个音频片段应用离散傅立叶变换(DFT),把时域信号片段转换为频率、幅度和相位,并计算出幅度和相位。保持相邻两个音频片段间的相位差不变,量化相位嵌入水印。参考文献“基于量化数字音频信号频域参数的水印嵌入算法”(王秋生,孙圣和,声学学报,2004.7 pp:379-385)通过量化处理数字音频信号的离散傅立叶变换系数的幅度或相位的方法嵌入视觉可辨二值图像水印,进一步提高算法对常规信号处理的鲁棒性,在用于数字音频信号的版权保护或对其内容的原始性进行校验时具有视觉直观性。
上述的鲁棒音频水印技术在对增强音频水印技术鲁棒性的共同特点是:通过修改变换域系数的参数,将预处理后的水印信息嵌入在变换域,达到对常规信号处理操作具有高鲁棒性的目的;其不足之处在于它们都是通过修改常规离散傅立叶变换的变换域系数参数(幅值或相位),而常规离散傅立叶变换存在变换已知的缺点,即:只要已知变换的点数,变换后的系数就是透明的。常规离散傅立叶变换的数学表达式为: X ( k ) = Σ n = 0 N - 1 x ( n ) e - j 2 π N kn , k=0,1,...,N-1;当N=8时,单位圆上的频率点如图1所示。在修改这些透明系数的同时也就暴露了水印嵌入的频点。根据Kerckhoff假设,加密算法的安全性依赖于密钥而不是算法本身。暴露水印的嵌入位置是鲁棒音频水印技术对抗恶意攻击的严重安全漏洞。
含水印的音频信号在网络传输过程中,允许一些正当的常规信号处理操作;而对于某些重要的音频信号,恶意攻击者蓄意破坏、去除甚至更改所嵌入的水印以达到某种特殊目的,这是不允许的。如果采用上述方法,对正当的常规信号处理操作鲁棒性较高,仍可以提取水印;而由于水印嵌入频点的公开使得对抗恶意攻击性能较弱,安全性差。因此采用上述鲁棒音频水印技术会造成:一、重要的音频信号得不到有效的版权保护,甚至错判成非法用户,妨碍鲁棒音频数字水印技术的推广与应用,二、音频内容的真实性无法得到鉴定,使得作为诉讼证据和新闻材料的音频内容,无法得到正确的采用。
发明内容
本发明提供一种基于非均匀离散傅立叶变换(Nonuniform DiscreteFourier Transform,NDFT)的鲁棒音频数字水印方法,其目的就是提高鲁棒音频数字水印方法的安全性。该方法不仅对常规信号处理操作具有较高鲁棒性,而且能有效抵抗恶意攻击;密钥空间大,水印算法简单而且安全。
本发明解决其安全性问题所采用的技术方案为:一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法,包括如下步骤:
(1)、对音频信号A={a(l),0≤l<L}按N=8进行分段,得到分段后的每段音频信号Ae(k),(k=1,2,...,L/N),对Ae(k)做非均匀离散傅立叶变换,得到变换系数Fe(k)=NDFT(Ae(k),f(k)),其中f(k)是对应第k段音频信号的非均匀离散傅立叶变换的可变频点;
(2)、在得到的8个变换系数Fe(k)中,选取可变频点f(k)对应的变换系数Fe(k)embed,并在Fe(k)embed的幅值|Fe(k)embed|上嵌入水印,得到已嵌入水印的频率系数Fe(k)embed w
(3)、将Fe(k)embed w进行非均匀离散傅立叶反变换,得到各段含水印音频信号Ae(k)w
(4)、将各段含水印音频信号Ae(k)w,(k=1,2,...,L/N)按顺序组合起来即为含水印音频信号Aw
(5)、对含水印音频信号Aw传输后收到的被测音频A*,按照长度N=8进行分段处理后表示为Ae(k)*,(k=1,2,...,L/N),按(1)步方法对Ae(k)*进行Fe(k)*=NDFT(Ae(k)*,f(k))变换后,在可变频点f(k)对应的系数Fe(k)embed *幅值|Fe(k)embed *|上提取水印,然后进行验证。
与现有技术相比,本发明的有益效果是:
本发明是基于非均匀离散傅立叶变换的鲁棒音频水印方法。其中,非均匀离散傅立叶变换的数学表达式为: X ( k m ) = Σ n = 0 N - 1 x ( n ) e - j k m n , m=1,2,...,M,即:km可以是任意的实数,利用非均匀离散傅立叶变换可任意选取频率点的特性,在鲁棒性要求相对较高而听觉透明性要求相对较低的应用场合,可将嵌入水印的频率点选在较低的频率范围内;同理,当对鲁棒性要求较低而更重视听觉不敏感性时,可将嵌入水印的频率点选取在较高的频率范围内,从而使鲁棒音频数字水印技术更灵活、更能满足实际应用的需要。
本发明方法的实现复杂度与基于离散傅立叶变换的鲁棒音频水印方法基本相同,但后者是在公开频率点系数上嵌入水印,缺点是安全性差;本发明利用了非均匀离散傅立叶变换可根据具体应用选取频率点的特性,在可变频率点的幅值上嵌入水印,使得水印的嵌入频点具有隐蔽性,从而提高了水印技术抗恶意攻击的性能。因此,本发明的方法不仅算法简单而且安全;能使重要的音频信号得到有效的版权保护,不会被错判成非法用户;音频内容的真实性可以得到准确鉴别,使其作为证据材料能够得到正确的采用,如诉讼证据和新闻材料,有利于鲁棒音频数字水印技术的应用与推广。
上述鲁棒性音频水印中,非均匀离散傅立叶变换Fe(k)=NDFT(Ae(k),f(k))的变换频率点为(0, f(k),
Figure A20061002023600082
π,
Figure A20061002023600083
2π-f(k),
Figure A20061002023600084
其可变频率点f(k)的可变范围为: f ( k ) ∈ [ 817 π 2048 , 1329 π 2048 ] .
现有的均匀离散傅立叶变换是按固定频率点(0, π 4 , π 2 , 3 π 4 , π, 5 π 4 , 3 π 2 , 7 π 4 ) 对分段后的每段音频信号Ae(k)进行变换。在大量实验基础上,本发明首先确定了适合音频水印的非均匀离散傅立叶变换点数为8,其对应变换核的频率点为: k m = { 0 , π 4 , f ( k ) , 3 π 4 , π , 5 π 4 , 2 π - f ( k ) , 7 π 4 } ; 然后对每8个音频信号采样值进行非均匀离散傅立叶变换Fe(k)=NDFT(Ae(k),f(k)),其中频率点f(k)是可变的,其范围是 f ( k ) ∈ ( π 4 , 3 π 4 ) 以步长 进行等间隔选取;最后确定了适于嵌入音频水印的频率范围是 f ( k ) ∈ [ 817 π 2048 , 1329 π 2048 ] . 该范围作为水印嵌入点的效果最好,通过以下实验仿真及理论分析得到证明:
在所选变换系数Fe(k)embed幅值|Fe(k)embed|上试嵌入水印,得到在变换系数Fe(k)嵌有水印的音频信号AFe(k) w,k=1,2,...,1022;为寻找听觉效果较好的可嵌入水印频率区间,通过计算试嵌入水印的含水印音频信号AFe(k) w和原始音频信号A的信噪比(SNR)来衡量含水印音频的听觉效果,得到含水印音频信号随所选嵌入水印频率点变化的信噪比曲线,选取SNR大于阈值T1=32dB的区间作为听觉不敏感区间;通过对试嵌入水印的含水印音频信号进行添加噪声攻击,以寻找鲁棒性较好的可嵌入水印频率区间,通过计算被攻击后的提取水印与原始水印的归一化相关系数来衡量抗噪声攻击的鲁棒性,得到归一化相关系数随所选嵌入水印频率点变化的相似度曲线,选取相似度大于阈值T2=0.8的区间作为鲁棒性较好的可嵌入水印频率区间;折中听觉不敏感性和鲁棒性,将大于阈值T1=32dB的频率区间和大于阈值T2=0.8的频率区间的交集作为适于音频水印的非均匀离散傅立叶变换的频率选取范围 Θ ∈ [ 817 π 2048 , 1329 π 2048 ] .
以上实验表明,本发明在非均匀离散傅立叶变换域折中了音频水印不可感知性和鲁棒性的频率选取范围Θ中,选出的嵌入水印频点 f ( k ) ∈ [ 817 π 2048 , 1329 π 2048 ] 通过非均匀离散傅立叶变换嵌入水印,不仅保证了水印技术对常规信号处理操作的鲁棒性,而且增大了水印嵌入位置的选择范围,使其更具隐蔽性。这样在保证对常规信号处理较高鲁棒性的基础上,提高了抗恶意攻击的性能,更有利于鲁棒音频数字水印技术的应用与推广。
上述的可变频率点f(k)的确定方法为:根据用户密钥,对每一段音频信号Ae(k)在 [ 817 π 2048 , 1329 π 2048 ] 中随机选取一个频率点f(k);或者先将 [ 817 π 2048 , 1329 π 2048 ] 按步长 q = π 2048 等间隔量化成512个频率点,再根据用户密钥,对每一段音频信号Ae(k)随机从512个频率点中选取一个频率点f(k)。
本发明在非均匀离散傅立叶变换域频率选取范围 Θ ∈ [ 817 π 2048 , 1329 π 2048 ] 内,基于用户密钥根据一定规则对每段音频信号随机选择嵌入水印频率点,进一步提高了水印嵌入位置的随机性和抗预测能力,扩大了密钥空间,增强了安全保密性,更进一步提高了抗恶意攻击的性能。
具体实施方式
下面结合实施例对本发明作进一步说明。
附图说明
图1为8点离散傅立叶变换核的固定频点示意图。
图2为本发明实施例1所使用的第一个原始音频信号和嵌入水印后的音频信号波形、原始待嵌入的水印图像以及提取出来的水印图像。其中,(a)分图表示该音频信号的原始音频信号1-original,横坐标Number表示音频信号的点数,纵坐标Amplitude表示音频信号的幅度值;(b)分图表示原始音频信号为1-original时,采用实施例1方法嵌入水印后的含水印音频信号1-watermarked,其横、纵坐标的意义与(a)分图相同。
图3为本发明实施例1所使用的第二个原始音频信号和嵌入水印后的音频信号波形、原始待嵌入的水印图像以及提取出来的水印图像。其中,(a)分图表示第二个音频信号的原始音频信号2-original,横坐标和纵坐标的意义与图2的(a)分图相同;(b)分图表示原始音频信号为2-original时,采用实施例1方法嵌入水印的含水印音频信号2-watermarked,横坐标和纵坐标的意义与图2的(a)分图相同。
图4为本发明实施例1所使用的待嵌入和提取出的水印图像。(a)分图表示为原始待嵌入图2(a)分图、图3(a)分图中的水印图像“swjtu.bmp”;(b)分图表示为采用实施例1方法从图2(b)分图、图3(b)分图中提取出的水印图像“swjtu-extract.bmp”。
图5为试嵌入水印时含水印音频信号的信噪比和受噪声攻击后提取水印相似度的曲线图。其中:(a)分图代表在低频和高频区间内,利用非均匀离散傅立叶变换变化频率点时,含水印音频信号与原始音频信号相比的信噪比随不同嵌入水印频率点的变化曲线,横坐标代表在低频和高频之间变化的频率点Frequency,纵坐标表示信噪比SNR;(b)分图代表对试嵌入水印的含水印音频信号进行噪声攻击后,提取水印图像和原始水印图像的相似度随不同嵌入水印频率点的变化曲线,横坐标代表在低频和高频之间变化的频率点Frequency,纵坐标表示相似度ρ;(c)分图为可嵌入在单位圆上水印频率选取范围示意图。
图6为本发明实施例的水印嵌入与提取步骤框图。
图7为本发明实施例1方法(NDFT)与传统离散傅立叶变换方法(DFT)遭受固定频率点恶意攻击后,接受方提取水印相似度示意图。其中:(a)分图表示对图2(a)分图的信号分别基于NDFT和DFT的水印技术生成的含水印音频信号1-watermarked,遭受不同程度恶意攻击后提取水印平均相似度的比较示意图,横坐标表示遭受恶意攻击的含水印音频信号占整个含水印音频信号的比例Ratio,纵坐标表示遭受恶意攻击后接受方提取水印的相似度ρ;(b)分图表示对图3(a)分图的信号分别基于NDFT和DFT的水印技术生成的含水印音频信号2-watermarked,遭受不同程度恶意攻击后提取水印平均相似度的比较示意图,横坐标和纵坐标的意义同(a)分图。
图8为本发明实施例1方法(NDFT)与传统离散傅立叶变换方法(DFT)遭受基于不同密钥选取的频率点恶意攻击后,接受方提取水印相似度示意图。其中:(a)分图和(b)分图的坐标含义与图7(a)和(b)分图的含义相同。
图9为本发明实施例1混沌随机序列的密钥空间示意图。
图10为本发明实施例2生成组合混沌跳频序列示意图。
图11为本发明实施例2中根据生成的组合混沌跳频序列在非均匀离散傅立叶变换域可嵌入水印频率范围的随机选取示意图。
图12为本发明实施例2方法(NDFT)与传统离散傅立叶变换方法(DFT)遭受固定频率点恶意攻击后,接受方提取水印相似度示意图。其中:(a)和(b)分图的坐标含义与图7(a)和(b)分图的含义相同。
图13为本发明实施例2方法(NDFT)与传统离散傅立叶变换方法(DFT)遭受基于不同密钥选取的频率点恶意攻击后,接受方提取水印相似度示意图。其中:(a)和(b)分图的坐标含义与图7(a)和(b)分图的含义相同。
图14为本发明实施例2中组合混沌跳频序列的密钥空间示意图。
实施例1
图6示出本发明的一种具体实施方式为,一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法:
一、包括如下步骤:
(1)、对音频信号A={a(l),0≤l<L}按N=8进行分段,得到分段后的每段音频信号Ae(k),(k=1,2,...,L/N),对Ae(k)做非均匀离散傅立叶变换,得到变换系数Fe(k)=NDFT(Ae(k),f(k)),其中f(k)是对应第k段音频信号的非均匀离散傅立叶变换的可变频点;
本实施例中,采用16-bit 44.1K采样/s的数字音频信号作为原始信号,按长度为8将其进行分段,即每8个音频数据中嵌入1bit水印的像素信息;
非均匀离散傅立叶变换定义为:
F ( k m ) = Σ n = 0 N - 1 f ( n ) e - j k m n f ( n ) = 1 M Σ m = 0 M - 1 F ( k m ) e j k m n , m=0,...,M-1    (1)
其中,km可以取任意的实数值。
本实施例中,根据参考文献“The Nonuniform Discrete Fourier Transformand Its Application in Filter Design”(Sonali Bagchi,Sanjit K Mitra IEEETransactions on Circuits and System-II:Analog and Digital SignalProcessing,43(6),pp:422-433,1996)中非均匀离散傅立叶变换的实现过程如下:
定义长度为N的离散序列的非均匀离散傅立叶变换(NDFT)为在z平面内任意选定的N个点上对序列进行z变换。表示为:
X ( z k ) = Σ n = 0 N - 1 x ( n ) z k - n , k=0,1,...N-1    (2)
其中,z0,z1,...,zA-1为在z平面上任意分布的N个不同的点,将上式用矩阵形式表示为:
                         X=Dx    (3)
其中, X = X ( z 0 ) X ( z 1 ) . . . X ( z N - 1 ) , x = x ( 0 ) x ( 1 ) . . . x ( N - 1 ) ,
Figure A20061002023600133
矩阵D为范德蒙矩阵,完全由N点的zk(k=1,2,…,N-1)决定。矩阵D的表达形式为:
det ( D ) = Π i ≠ j , i > j ( z i - 1 - z j - 1 ) - - - ( 4 )
D是非奇异的,所以非均匀离散傅立叶反变换(INDFT)存在并唯一,即:x=D-1X。
(2)、在得到的8个变换系数Fe(k)中,选取可变频点f(k)对应的变换系数Fe(k)embed,并在Fe(k)embed的幅值|Fe(k)embed|上嵌入水印,得到已嵌入水印的频率系数Fe(k)embed w
本实施例中,通过量化所选变换系数Fe(k)embed的幅值|Fe(k)embed|嵌入水印信息,量化嵌入水印时,量化步长借鉴参考文献“基于量化数字音频信号频域参数的水印嵌入算法”(王秋生,孙圣和,声学学报,2004.7pp:379-385)中的量化步长,本实施例取量化步长Δ=5120。量化的基本思想是根据待嵌入的水印信息WW(k)使量化后的变换系数幅值|Fe(k)embed w|位于待量化频率幅值|Fe(k)embed|相应量化间隔的中间坐标值,即:按照量化步长Δ将坐标轴分割成B1区间集和B2区间集交替相隔,当水印信息WW(k)=1时,使量化结果|Fe(k)embed w|位于|Fe(k)embed|最接近的B1区间集中某一区间的中间值;当水印信息WW(k)=0时,使量化结果|Fe(k)embed w|位于|Fe(k)embed|最接近的B2区间集中某一区间的中间值。
量化规则描述如下:
对待量化的系数|Fe(k)embed|做取模和取余数运算:
r=|Fe(k)embed|-m×Δ,
其中,m代表模值,r代表余数,Δ表示量化步长。
| Fe ( k ) embed w | = Δ 2 WW ( k ) = 1 3 Δ 2 WW ( k ) = 0 m = 0 - - - ( 5 )
| Fe ( k ) embed w | = 2 kΔ + 1 2 Δ ifm = 2 k 2 kΔ + 1 2 Δ ifm = 2 k + 1 and | r | ≤ 1 2 ΔWW ( k ) = 1 2 kΔ + 2 Δ + 1 2 Δ ifm = 2 k + 1 and | r | > 1 2 Δ ( 2 k + 1 ) Δ + 1 2 Δ ifm = 2 k + 1 2 kΔ - 1 2 Δ ifm = 2 kand | r | ≤ 1 2 ΔWW ( k ) = 0 ( 2 k + 1 ) Δ + 1 2 Δ ifm = 2 kand | r | > 1 2 Δ m ≠ 0 - - - ( 6 )
在非均匀离散傅立叶变换域嵌入水印需要注意:音频信号的数据幅度值均为实数,为了保证修改后的INDFT系数仍为实数,可以仿照DFT在满足正对称条件下嵌入水印。即:在预设的NDFT频点处,使得X(k)=X*(N-k)。正对称条件为:
|X(k)|←|X(k)|+ε,|X(N-k)|←|X(N-k)|+ε      (7)
(3)、将Fe(k)embed w进行非均匀离散傅立叶反变换,得到各段含水印音频信号Ae(k)w
(4)、将各段含水印音频信号Ae(k)w,(k=1,2,...,L/N)按顺序组合起来即为含水印音频信号Aw
(5)、对含水印音频信号Aw传输后收到的被测音频A*,按照长度N=8进行分段处理后表示为Ae(k)*,(k=1,2,...,L/N),按(1)步方法对Ae(k)*进行Fe(k)*=NDFT(Ae(k)*,f(k))变换后,在可变频点f(k)对应的系数Fe(k)embed *幅值|Fe(k)embed *|上提取水印WW*,然后进行验证。
本实施例中,将被测音频A*按N=8进行分段,第k段表示为Ae(k)*;对每段Ae(k)*做非均匀离散傅立叶变换Fe(k)*=NDFT(Ae(k)*,f(k));在对应嵌入水印的系数Fe(k)embed *的幅值|Fe(k)embed *|上提取水印,提取水印的表达式描述如下:
| Fe ( k ) embed * | ∈ B 1 ifWW ( k ) * = 1 B 2 ifWW ( k ) * = 0 - - - ( 8 )
即水印信息WW(k)*由NDFT系数Fe(k)embed *的幅度值|Fe(k)embed *|是属于B1区间还是B2区间集来表示。
本实施例中,为了对水印技术的鲁棒性有一个客观的评价,消除观测者本身的主观因素和客观的实验条件的影响,采用归一化相关系数对原始水印和提取水印做相似性评价。其定义为:
ρ ( W , W D * ) = Σ i = 1 M 1 Σ j = 1 M 2 w ( i , j ) w D * ( i , j ) Σ i = 1 M 1 Σ j = 1 M 2 w 2 ( i , j ) Σ i = 1 M 1 Σ j = 1 M 2 w D * 2 ( i , j ) - - - ( 9 )
二、本实施例中,非均匀离散傅立叶变换Fe(k)=NDFT(Ae(k),f(k))的变换频率点为(0,
Figure A20061002023600153
f(k),
Figure A20061002023600154
π, 2π-f(k),
Figure A20061002023600156
其中的可变频率点 f ( k ) ∈ [ 817 π 2048 , 1329 π 2048 ] .
图5的(a)和(c)分图表明,当可变频率点f(k)在(c)分图的 [ 817 π 2048 , 1329 π 2048 ] 范围内时,含水印音频信号信噪比均在32dB以上;(b)和(c)分图表明当可变频率点f(k)在(c)分图的 [ 817 π 2048 , 1329 π 2048 ] 范围内时,从含水印音频信号中提取出图4(b)分图的水印“swjtu-extract.bmp”的相似度均在0.8以上。说明这个区间折中了听觉不敏感性和鲁棒性,作为水印嵌入点的效果最好。
三、可变频率点f(k)在其范围 [ 817 π 2048 , 1329 π 2048 ] 内确定具体频率点的方法为:根据用户密钥,对每一段音频信号Ae(k)在 [ 817 π 2048 , 1329 π 2048 ] 中随机选取一个频率点f(k)。
本实施例中,随机选取一个频率点的方法是由Tent混沌映射产生随机数来实现,即:根据用户密钥Key1利用Tent混沌映射生成混沌序列C,将C映射到频率选取范围 Θ ∈ [ 817 π 2048 , 1329 π 2048 ] 中,达到根据用户密钥,对每一段音频信号Ae(k)在 [ 817 π 2048 , 1329 π 2048 ] 中随机选取一个频率点f(k)的目的。
Tent混沌映射定义如下:
x 1 , k + 1 = x 1 k / a 0 &le; x 1 k < a ( 1 - x 1 k ) / ( 1 - a ) a &le; x 1 k &le; 1 - - - ( 10 )
其中,a为常数,且0<a<1。本实施例中,a=0.351,密钥Key1作为该混沌映射的初值。
将混沌序列C映射到非均匀离散傅立叶变换域的频率选取范围 &Theta; &Element; [ 817 &pi; 2048 , 1329 &pi; 2048 ] 的过程采用如下映射函数:
映射函数为:f(k)=0.7854×C(k)+1.2533                (11)
其中 817 &pi; 2048 = 1.2533 , 1329 &pi; 2048 = 2.0387 .
实施例2
实施例2的步骤与实施例1基本相同,唯一不同之处在于:可变频率点f(k)在其范围 [ 817 &pi; 2048 , 1329 &pi; 2048 ] 内确定具体频率点的方法为:先将 [ 817 &pi; 2048 , 1329 &pi; 2048 ] 按步长 q = &pi; 2048 等间隔量化成512个频率点,再根据用户密钥Key2,对每一段音频信号Ae(k)随机从512个频率点中选取一个频率点f(k)。
本实施例中,对每一段音频信号Ae(k)随机从512个频率点中选取一个频率点f(k)的随机方法是利用组合混沌跳频序列产生的随机数来实现。
图10示出,组合混沌跳频序列的生成为:
基于密钥Key2利用Tent混沌映射生成长度为64的混沌序列{xi,i=1,...,64|xi∈[0,1]},其中Key2∈(0,1)。再以每一个xi作为初值利用Chebyshev混沌映射依次产生64个长度为64×9的混沌序列如下:{x1,1,x2,1,...,x64×9,1},{x1,2,x2,2,...,x64×9,2},...{x1,64,x2,64,...x64×9,64},将其降维成长度为64×9×64的混沌实值序列{x1,1,x2,1,...x64×9,1,x1,2,x2,2,...,x64×9,2,...,x1,64,x2,64,...,x64×9,64},并以“0”为阈值进行二值化处理;之后生成512元跳频序列。其具体方法如下:对该二值符号序列进行每9位截断,便可以产生含有512=29个混沌跳频码符的序列,即产生频隙数目为512的混沌跳频序列Posq=(Pos0,Pos1,...,Pos4096-1)。其中,4096是序列的长度,Posn(n=0,1,2,...,4096-1)在整数集合{0,1,…,512-1}中取值。
本实施例中,Tent映射的系数a=0.351,密钥Key2作为该Tent混沌映射的初值。
k阶Chebyshev混沌映射定义如下:
            xn+1=f(xn)=cos(kcos-1xn)   x∈[-1,1]     (12)
通常取k为2的整数次幂。本实施例中初始值为经过Tent映射后的混沌序列,并且取k=4。
本实施例中将混沌实质序列二值化所使用的门限函数表示为:
&sigma; 0 ( x ) = 0 ( x &le; 0 ) 1 ( x > 0 ) - - - ( 13 )
图11为采用组合混沌跳频序列在非均匀离散傅立叶变换域可嵌入水印频率范围内的随机选取示意图。首先,将 [ 817 &pi; 2048 , 1329 &pi; 2048 ] 按步长 q = &pi; 2048 等间隔量化成512个频率点才;然后,根据组合混沌跳频序列Posn(n=0,1,2,...,4095)随机选择fi。例如:当Pos0=2时,选取的频率点 f ( k ) = f 2 = 819 &pi; 2048 ; 当Pos1=3时,选取的频率点 f ( k ) = f 3 = 820 &pi; 2048 ; 当Pos2=510时,选取的频率点 f ( k ) = f 510 = 1328 &pi; 2048 ; 同理可得,当Pos4094=0时,选取的频率点 f ( k ) = f 0 = 817 &pi; 2048 ; 当Pos4095=511时,选取的频率点 f ( k ) = f 511 = 1329 &pi; 2048 . 因此,对每段音频信号Ae(k),根据对应的已生成的组合混沌跳频序列Posn(n=0,1,2,...,4096-1)在已量化的可嵌入频率范围fi,i=0,1,2,...,511中随机选取嵌入水印频率点f(k)。
本发明的可变频率点f(k)在其范围 [ 817 &pi; 2048 , 1329 &pi; 2048 ] 内确定具体频率点的随机方法,既可以采用两个实施例中的混沌映射产生随机数来实现,也可以采用现有的各种随机函数产生随机数来实现。
本发明的效果可以通过以下性能分析验证:
一、不可见性分析:
鲁棒音频水印技术要求加入的水印不可觉察,为了衡量含水印音频信号与原始音频信号之间的差别,定义信噪比SNR(Signal-to-Noise Ratio)为:
SNR = 10 log 10 [ &Sigma; n A 2 ( n ) &Sigma; n | A ( n ) - A W ( n ) | 2 ] - - - ( 14 )
本发明的两个实施例中均把水印信息嵌入到非均匀离散傅立叶变换域的中频系数上,折中了鲁棒性和听觉不敏感性。
二、水印的评价
本发明采用归一化相关系数对原始水印和提取水印做相似性评价,消除了观测者本身的主观因素和客观实验条件的影响,能够对算法本身有一个公正的评价。
三、对常规信号处理操作鲁棒性的分析
对常规信号处理操作而言,变换域嵌入方法比时域嵌入方法具有更高的鲁棒性。本发明在非均匀离散傅立叶变换域嵌入水印,而且利用了非均匀离散傅立叶变换可以根据具体应用任意选取频率点的特性,在折中了鲁棒性和听觉不敏感性的频率区间内嵌入水印,保持了音频水印技术对常规信号处理操作的高鲁棒性。
表1为当水印信号为“swjtu.bmp”和原始音频信号为1-original情况下,本发明实施例2方法(NDFT)与传统离散傅立叶变换方法(DFT)对常规信号处理操作鲁棒性的比较。其中:ρ为提取的水印与原始水印的相似度;SNR为原始音频信号与含水印音频信号的信噪比。
                                  表1
        DFT方法        NDFT方法
  ρ   SNR   ρ   SNR
  无攻击   1   35.0982   1   34.5925
  128Kmp3攻击   0.9989   34.8678   1   34.2847
  重采样44.1-96   0.9998   34.115   0.9883   33.7254
  重量化16bit-8bit   1   34.9029   1   34.4072
  低通滤波器(6阶截至频率22.05K) 1 35.0518 1 34.5542
从表1可以看出,本发明基于NDFT的音频水印方法抗常规信号处理操作仍具有较高的鲁棒性;虽然利用本发明方法(NDFT)得到的信噪比没有离散傅立叶变换方法(DFT)得到的信噪比高,但是这对听觉效果的影响非常小。
四、抗恶意攻击性能分析
本发明利用混沌序列和混沌跳频序列在非均匀离散傅立叶变换域中可嵌入水印信号的频率区间随机选取嵌入位置,隐蔽了水印的嵌入位置,从而增强了抗恶意攻击的性能,迫使恶意攻击者为了达到破坏水印的目的必须破坏较多的音频信号,而这样的破坏会使水印音频信号能被感知甚至于不可使用,以致于攻击者不能达到恶意攻击的目的。
五、安全性分析
根据Kerckhoff假设,一些情况下要求所使用的水印方法是公开的,那么方法的安全性就依靠密钥来控制,因此合理的密钥空间就成为方法安全性的重要保证。
本发明在随机选取嵌入频率点f(k)过程中均使用了混沌序列,混沌系统具有对初值的极端敏感性、良好的随机性等特点,利用混沌系统的初值作为密钥。根据用户密钥Key1生成了实施例1中的混沌序列,根据用户密钥Key2生成了实施例2中的组合混沌跳频序列,整个系统的安全性均依赖于密钥,使得本发明的方法的安全性大为提高。
本发明方法的计算机仿真分析:
取16位44.1K采样/s的数字音频信号中32768个采样值作为原始信号采样值,把大小为64×64的二值视觉可辨图像作为水印图像,用Matlab仿真本发明方法。该仿真对分段长度为8的每段音频信号进行非均匀离散傅立叶变换,并分别利用混沌序列和组合跳频序列控制水印的嵌入位置。含水印音频信号的听觉不敏感性采用信噪比(dB)来衡量;对提取出的水印图像的评价采用归一化相关系数做与原始水印图像的相似度评价。
对于图2(a)分图所示的原始音频信号1-original,当利用非均匀离散傅立叶变换嵌入水印时,原始音频信号A与嵌入水印后的含水印音频信号AW的信噪比为34.5925(dB);对于图3(a)分图所示的原始音频信号2-original,当利用非均匀离散傅立叶变换嵌入水印时,原始音频信号A与嵌入水印后的含水印音频信号AW的信噪比为34.8515(dB),显示该方法具有良好的不可见性。在未受攻击情况下,利用本发明两个实施例的方法提取出的水印图像与原始水印图像的归一化相似度均为1。
本发明设计的恶意攻击方式如下:针对量化嵌入水印方法,在嵌入水印的频率系数上加上或减去一个系数 &delta; &Element; ( &Delta; 2 , &Delta; ] , 即可使提取的水印图像发生错误。当将整个含水印音频信号的水印嵌入点均加上或减去一个δ,则提取水印时水印图像“0”、“1”完全相反;当只修改整个含水印音频信号的一部分时,提取出来的水印图像将会呈现噪声点;当修改的程度达到一定时,在听觉不敏感条件下,就有可能破坏水印。
图7为本发明实施例1方法(NDFT)与传统离散傅立叶变换方法(DFT)遭受固定频率点恶意攻击后,接受方提取水印相似度示意图。其中:(a)分图表示分别基于NDFT和DFT的水印方法生成的含水印音频信号1-watermarked遭受不同程度恶意攻击后提取水印平均相似度的比较示意图,横坐标表示遭受恶意攻击的含水印音频信号占整个含水印音频信号的比例Ratio,纵坐标表示遭受恶意攻击后接受方提取水印的相似度ρ;图示中 代表基于DFT的音频水印方法遭受不同程度恶意攻击后提取水印的平均相似度曲线, 代表基于NDFT的音频水印方法遭受不同程度恶意攻击后提取水印的平均相似度曲线;(b)分图表示分别基于NDFT和DFT的水印方法生成的含水印音频信号2-watermarked遭受不同程度恶意攻击后提取水印平均相似度的比较示意图,坐标的含义和图示内容同(a)分图。
图8为本发明实施例1方法与传统离散傅立叶变换方法遭受基于不同密钥选取的频率点恶意攻击后,接受方提取水印相似度示意图。其中:(a)分图和(b)分图的含义与图7(a)和(b)的含义相同。
从图7和图8可以看出,攻击者不论采用固定频率点攻击方法或基于不用密钥的攻击方法,均能得到类似结果,即:不论攻击强度的大小,基于NDFT的音频水印方法提取出水印的相似度总是大于基于DFT的音频水印方法。利用实施例1的优点在于:实现简单,方便快捷。
图9为本发明实施例1混沌随机序列的密钥空间示意图。
从图9可以看出,密钥Key1的密钥空间为1017,说明密钥空间非常大,本发明方法的安全性很好。
图12为本发明实施例2方法(NDFT)与传统离散傅立叶变换方法(DFT)遭受固定频率点恶意攻击后,接受方提取水印相似度示意图。其中:(a)分图和(b)分图的含义与图7(a)分图和(b)分图的含义相同。
图13为本发明实施例2方法(NDFT)与传统离散傅立叶变换方法(DFT)遭受基于不同密钥选取的频率点恶意攻击后,接受方提取水印相似度示意图。其中:(a)分图和(b)分图的含义与图7(a)分图和(b)分图的含义相同。
从图12和图13可以看出,利用实施例2的方法可以得到与利用实施例1类似的实验结果,即:不论攻击强度的大小,基于NDFT的音频水印方法提取出水印的相似度总是大于基于DFT的音频水印方法。利用实施例2的优点在于:抗破译能力强,保密性好。
图14为本发明实施例2中组合混沌跳频序列的密钥空间示意图。
从图14可以看出,密钥Key2的密钥空间为1017,说明密钥空间非常大,本发明方法的安全性很好。
可见,本发明方法不仅对常规信号处理操作保持较高鲁棒性,而且能有效抵抗恶意攻击,提高了方法对恶意攻击的鲁棒性;较大的系统密钥空间,保证了整个系统的安全性。

Claims (3)

1、一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法,包括如下步骤:
(1)、对音频信号A={a(l),0≤l<L}按N=8进行分段,得到分段后的每段音频信号Ae(k),(k=1,2,...,L/N),对Ae(k)做非均匀离散傅立叶变换,得到变换系数Fe(k)=NDFT(Ae(k),f(k)),其中f(k)是对应第k段音频信号的非均匀离散傅立叶变换的可变频点;
(2)、在得到的8个变换系数Fe(k)中,选取可变频点f(k)对应的变换系数Fe(k)embed,并在Fe(k)embed的幅值|Fe(k)embed|上嵌入水印,得到已嵌入水印的频率系数Fe(k)embed w
(3)、将Fe(k)embed w进行非均匀离散傅立叶反变换,得到各段含水印音频信号Ae(k)w
(4)、将各段含水印音频信号Ae(k)w,(k=1,2,...,L/N)按顺序组合起来即为含水印音频信号Aw
(5)、对含水印音频信号Aw传输后收到的被测音频A*,按照长度N=8进行分段处理后表示为Ae(k)*,(k=1,2,...,L/N),按(1)步方法对Ae(k)*进行Fe(k)*=NDFT(Ae(k)*,f(k))变换后,在可变频点f(k)对应的系数Fe(k)embed *幅值|Fe(k)embed *|上提取水印,然后进行验证。
2、根据权利要求1所述的一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法,其特征在于:所述的非均匀离散傅立叶变换Fe(k)=NDFT(Ae(k),f(k))的变换频率点为 ( 0 , &pi; 4 , f ( k ) , 3 &pi; 4 , &pi; , 5 &pi; 4 , 2 &pi; - f ( k ) , 7 &pi; 4 ) , 其中,可变频率点f(k)的可变范围为: f ( k ) &Element; [ 817 &pi; 2048 , 1329 &pi; 2048 ] .
3、根据权利要求2所述的一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法,其特征在于,所述的可变频率点f(k)的确定方法为:根据用户密钥,对每一段音频信号Ae(k)在
Figure A2006100202360003C1
中随机选取一个频率点f(k);或者先将按步长 q = &pi; 2048 等间隔量化成512个频率点,再根据用户密钥,对每一段音频信号Ae(k)随机从512个频率点中选取一个频率点f(k)。
CNB2006100202367A 2006-01-26 2006-01-26 一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法 Expired - Fee Related CN100527662C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100202367A CN100527662C (zh) 2006-01-26 2006-01-26 一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100202367A CN100527662C (zh) 2006-01-26 2006-01-26 一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法

Publications (2)

Publication Number Publication Date
CN1808970A true CN1808970A (zh) 2006-07-26
CN100527662C CN100527662C (zh) 2009-08-12

Family

ID=36840679

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100202367A Expired - Fee Related CN100527662C (zh) 2006-01-26 2006-01-26 一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法

Country Status (1)

Country Link
CN (1) CN100527662C (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101521011B (zh) * 2009-04-01 2011-09-21 西南交通大学 基于过零率的时间尺度不变的鲁棒音频水印方法
CN102194459A (zh) * 2011-05-11 2011-09-21 北京航空航天大学 一种基于avs音频编码的信息隐藏方法
CN101101754B (zh) * 2007-06-25 2011-09-21 中山大学 一种基于傅立叶离散对数坐标变换的稳健音频水印方法
CN102682239A (zh) * 2012-05-08 2012-09-19 常熟南师大发展研究院有限公司 基于数字水印技术的针对瓦片遥感数据的版权保护方法
CN102682246A (zh) * 2012-05-08 2012-09-19 常熟南师大发展研究院有限公司 一种基于数据点定位的矢量地理数据数字水印方法
CN106203183A (zh) * 2016-07-25 2016-12-07 天津大学 一种基于电磁频谱水印的ip核保护方法
CN107799121A (zh) * 2017-10-18 2018-03-13 广州珠江移动多媒体信息有限公司 一种无线广播音频的数字水印嵌入及检出方法
CN109522445A (zh) * 2018-11-15 2019-03-26 辽宁工程技术大学 一种融合CNNs与相位算法的音频分类检索方法
CN115035903A (zh) * 2022-08-10 2022-09-09 杭州海康威视数字技术股份有限公司 一种物理语音水印的注入方法、语音溯源方法及装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101101754B (zh) * 2007-06-25 2011-09-21 中山大学 一种基于傅立叶离散对数坐标变换的稳健音频水印方法
CN101521011B (zh) * 2009-04-01 2011-09-21 西南交通大学 基于过零率的时间尺度不变的鲁棒音频水印方法
CN102194459A (zh) * 2011-05-11 2011-09-21 北京航空航天大学 一种基于avs音频编码的信息隐藏方法
CN102682239A (zh) * 2012-05-08 2012-09-19 常熟南师大发展研究院有限公司 基于数字水印技术的针对瓦片遥感数据的版权保护方法
CN102682246A (zh) * 2012-05-08 2012-09-19 常熟南师大发展研究院有限公司 一种基于数据点定位的矢量地理数据数字水印方法
CN102682246B (zh) * 2012-05-08 2014-10-29 南京吉印信息科技有限公司 一种基于数据点定位的矢量地理数据数字水印方法
CN106203183A (zh) * 2016-07-25 2016-12-07 天津大学 一种基于电磁频谱水印的ip核保护方法
CN106203183B (zh) * 2016-07-25 2019-03-26 天津大学 一种基于电磁频谱水印的ip核保护方法
CN107799121A (zh) * 2017-10-18 2018-03-13 广州珠江移动多媒体信息有限公司 一种无线广播音频的数字水印嵌入及检出方法
CN109522445A (zh) * 2018-11-15 2019-03-26 辽宁工程技术大学 一种融合CNNs与相位算法的音频分类检索方法
CN115035903A (zh) * 2022-08-10 2022-09-09 杭州海康威视数字技术股份有限公司 一种物理语音水印的注入方法、语音溯源方法及装置

Also Published As

Publication number Publication date
CN100527662C (zh) 2009-08-12

Similar Documents

Publication Publication Date Title
CN1808970A (zh) 一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法
Lei et al. Robust SVD-based audio watermarking scheme with differential evolution optimization
Xiang et al. Histogram-based audio watermarking against time-scale modification and cropping attacks
CN1933391A (zh) 一种隐形编码嵌入和检测的方法
CN101038771A (zh) 用于音乐作品版权保护的数字水印新方法
Erçelebi et al. Audio watermarking scheme based on embedding strategy in low frequency components with a binary image
Wang et al. A robust digital audio watermarking based on statistics characteristics
Avcibas et al. Steganalysis based on image quality metrics
CN100346353C (zh) 基于脆弱水印的电子印章的产生及验证方法
Yusof et al. Digital watermarking for digital images using wavelet transform
Li et al. Protecting the intellectual property of deep neural networks with watermarking: The frequency domain approach
Zamani et al. Genetic substitution-based audio steganography for high capacity applications
Dhar et al. Audio watermarking in transform domain based on singular value decomposition and Cartesian-polar transformation
CN1517855A (zh) 图像数字水印方法
CN1514409A (zh) 基于图像目标区域的小波域数字水印方法
Dhar A blind audio watermarking method based on lifting wavelet transform and QR decomposition
CN104063834A (zh) 一种水印的嵌入、检测方法及装置
Prajwalasimha et al. Performance analysis of combined discrete fourier transformation (DFT) and successive division based image watermarking scheme
Dutta et al. Audio watermarking using pseudorandom sequences based on biometric templates.
CN101339588B (zh) 一种用于盗版追踪与数字取证的数字指纹系统与方法
CN1885339A (zh) 一种基于图像特征的电子印章认证方法
CN1294531C (zh) 图像篡改内容可恢复的定位型认证水印的生成与认证方法
Dhar et al. A blind LWT-based audio watermarking using fast Walsh Hadamard transform and singular value decomposition
CN1175414C (zh) 嵌入/检测一维信息信号中的水印的方法和装置
CN101075343A (zh) 基于塔形方向滤波器组的数字水印方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090812

Termination date: 20120126