CN1540600A - 一种保护音频数据的方法 - Google Patents
一种保护音频数据的方法 Download PDFInfo
- Publication number
- CN1540600A CN1540600A CNA2003101119293A CN200310111929A CN1540600A CN 1540600 A CN1540600 A CN 1540600A CN A2003101119293 A CNA2003101119293 A CN A2003101119293A CN 200310111929 A CN200310111929 A CN 200310111929A CN 1540600 A CN1540600 A CN 1540600A
- Authority
- CN
- China
- Prior art keywords
- watermark
- synchronizing signal
- embed
- wavelet
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000009466 transformation Effects 0.000 claims description 15
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 4
- 230000001256 tonic effect Effects 0.000 claims description 4
- 238000000844 transformation Methods 0.000 claims description 3
- 238000013139 quantization Methods 0.000 claims description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims 5
- 238000002474 experimental method Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002386 leaching Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本发明涉及一种基于小波变换的数字水印技术,属于多媒体信号处理领域。本发明利用小波变换将数字音频数据进行分解,采用置乱和降维的方法对水印进行预处理,然后在小波变换的低频域中嵌入同步信号和处理后的水印。最后通过小波逆变换得到含有同步信号和水印的音频。与原始音频数据相比,人类的听觉系统无法区分两者的区别。而通过水印的提取过程可以对该音频数据进行跟踪或宣称所有权。其中水印可以是任何有意义的自定义信息。本发明可使通过网络传播的音频数据或音频文件获得保护。
Description
技术领域
本发明涉及一种基于小波变换的数字水印技术,属于多媒体信号处理领域。
背景技术
近几年来,随着数字音频数据的广泛应用,数字音频数据的安全性和完整性等一系列问题出现在我们的面前,数字音频水印技术为我们解决这些问题提供了一种可行的路线。尽管目前大多数字水印的研究和文献集中于图象水印和视频水印,但数字音频水印也正在受到越来越多的重视。
数字水印算法中隐藏信息的类型可以是随机序列,也可以是有意义的内容(如文本、图象等)。由随机序列构成的水印只能给出“有水印”或“无水印”的判定,也即只提供1bit的秘密信息,从而使其应用受到限制。在大多数应用场合,要求嵌入的信息是可读的或可视的,如有意义的字符串(所有者的姓名、地址、标志等)、图象(商标、印鉴等)甚至音频、视频等等,因此有意义数据的隐藏有着更广泛的应用场合。
数字水印算法可以分为两类:需要原始媒体的私有系统和不需要原始媒体的公有系统。通常,由于有原始媒体的辅助,私有系统的稳健性要比盲检测系统好,然而由于在大多数应用场合,原始媒体的获取都比较困难甚至不可能实现。所以盲检测的水印系统具有更多的应用价值。
目前的音频水印技术基本上可以被归纳为二类:时域算法和频域算法。时域算法的主要代表有LSB方法、回声隐藏(Echo Coding)等。LSB方法是通过改变音频数据样本的最低比特位来嵌入水印。而回声隐藏则是在原始音频信号f(t)中引入回声α·f(t-Δt)来嵌入水印的,通过使用不同的延时Δt来代表不同的信息。时域算法的特点是计算复杂度低,但水印一般比较脆弱。与图像水印类似,频域算法通过改变音频信号的频域系数(如DCT,DFT,DWT系数)来隐藏水印,通常具有较好的鲁棒性。例如相位编码(Pbase Coding)就通过对信号的DFT(Discrete Fourier Transform)频谱作相位调整来嵌入水印,当然DFT频谱的幅值也可用来嵌入水印。此外还有基于DCT、DWT变换域的水印方案。
目前的多数音频水印算法一般采用随机序列作为标志,即使是有意义的水印算法也存在着隐藏数据量较小,且不够稳健的不足。由于音频信号是时间轴上的函数,考虑到各种攻击(如对音频的裁剪、无线传输中的信号丢失、IP网络中的丢包等),有必要在音频水印系统中引入同步信号来定位水印的嵌入位置,提高水印提取的准确度。
发明内容
本发明的目的是提出一种保护音频文件的数字水印方法,使隐藏信息的检测不需要原始的音频载体;并利用了1bit的随机序列水印作为同步信号来定位有意义水印的嵌入位置,实现了较大的嵌入带宽;降低了检测信息的差错率,在未受攻击的情况下可以达到100%的准确度。
为了实现上述目的,本发明方法采用如下的水印嵌入和提取两个过程。
水印嵌入的流程如图7所示。
水印嵌入过程的步骤是:
水印嵌入过程步骤如下:1)对音频序列进行小波变换,并选取低频子带用于嵌入水印信息;2)对要嵌入的水印进行降维和置乱处理;3)在水印信息前后添加同步信号用于定位其嵌入位置,利用均匀量化的方法嵌入水印和同步信号;4)利用小波变换的时频局部特性来提高在频域中搜索同步信号的速度。具体做法是:
1)将原始音频信号进行分段,然后对每段音频作5级的小波分解DWT,并选取小波分解DWT后的低频子带系数用于隐藏信息,嵌入水印。分段时,每段的长度由同步信号、嵌入的水印及小波分解层数等参数决定;一般说来每一段中的音频样本数为:(同步信号位数+水印位数)*(2^小波分解层数)。小波分解级数是一个可变参数,可由具体的应用所决定(通过实验我们发现5级小波分解能适用于大部分场合),分解层数越高则嵌入强度S可以取的越大,同步信号和水印的鲁棒性就越强。
2)将同步信号(一个{0,1}伪随机序列)和水印(一个64*64的二值图像)转换为一维的伪随机序列;具体方法是将图标通过随机化和降维变成一维的{1,0}序列,然后与同步信号间隔组合成“……、同步信号、水印、同步信号、水印、……”的结构,最后得到一个只含有“0”和“1”的序列{mi}。
3)将步骤2中预处理后的数字水印嵌入到小波分解DWT低频子带系数中,并在每一个数字水印前加一个同步信号用于定位水印的嵌入位置。选取小波域的低频系数嵌入序列{mi};核心的嵌入公式为:
4)用改变后的系数作5级小波逆变换得到含有同步信号和水印的音频数据。
本发明中水印的详细提取流程如图8所示。
水印提取过程的步骤是:
1)将音频序列分段,并对每段进行5级小波变换DWT,抽取DWT低频子带系数。对含有同步信号和水印的待检测音频进行平移并分段(注:提取过程中不需要原始的音频),每个分段的长度要至少包含一个同步信号,并对每段进行5级小波变换,最后选取其低频分量系数。其中“平移”是指以一个音频采样样本为单位的平移,比如说原来的一段音频是[样本1,……样本100],那么平移后的音频段就变为[样本2,……,样本101]。
2)从低频子带中提{0,1}序列,并利用小波变换的时频局部性在该{0,1}序列中搜索同步信号,具体是从小波变换域的低频分量系数中提取{0,1}序{ml*};提取公式如下:
在上面得到的{ml*}序列中搜索同步信号,设{an}是作为同步信号的伪随机序列,{bn}是一个长度为p的待检验的序列,如果{an}与{bn}之间最多只有e个比特不同;则我们就认为{bn}是一个同步信号。其中p是同步信号的长度,e是一个适当的阈值。在给定p和e的情况下我们可以计算出检测同步信号时的虚警概率P1为:
如果再给定原始的比特误码率BER,我们还可以计算同步信号的漏检概P2为:
3)根据同步信号的位置来提出水印信息,如果没有发现同步信号则返回步骤1。在这一步骤中,如果找到同步信号,则根据同步信号的位置来提取紧随其后的水印信息。提取水印信息的方法用类似于步骤2中提取同步信号的方法,最后按嵌入时的转换规则进行逆变换得到原始水印(二值图标)。反之,如果没有找到同步信号则返回步骤1。
本发明与现有音频水印技术比较有以下优点:
1)利用同步信号来定位水印的嵌入位置,因此水印具有抗裁剪的能力;水印具有较高的带宽(如实验中的带宽为1367bps);同步信号和水印信息嵌入到小波变换的低频域中,因此具有非常强的鲁棒性。
2)利用小波变换时频局部特性极大地提高了同步信号的搜索效率,并从理论上计算了同步信号的误检和漏检概率。
3)实验结果表明该算法对抗各种音频处理和攻击都具有非常优异的性能。
4)从理论上分析了原始音频和含水印音频之间的误差(以SNR信噪比为标准),可以为水印的设计提供指导,不再需要通过多次实验来确定合适的嵌入强度值S。实验数据与我们的理论分析完全吻合,如图5所示。
5)从理论上分析了该音频水印方案抗高斯白噪声攻击的性能,并且与实验结论完全吻合,如图6所示。从而从理论上说明了该算法的性能特性。
附图说明
图1是进行曲march.wav的波形图。
图2是轻音乐1ight.wav的波形图。
图3是同步信号的抗裁剪图。
图4为水印误码率与视觉效果图。
图5为原始音频与含水印音频之间的SNR值。
图6为高斯噪声攻击下的水印误码率BER。
图7为水印嵌入流程图。
图8为水印提取流程图。
图1和图2是用于测试的音频数据;图1中的一段为进行曲(标记为march.wav),图2中的一段为轻音乐(标记为light.wav);每段音频的持续时间约为12秒,音频格式为WAV格式,单声道,采样率为44100Hz,量化精度为16bits。同步信号取长为63bits的伪随机序列。水印是一个64*64带有“中山大学”字样的二值图标。同步信号取一周期为63的m序列,阈值T取为21,水印为一个64*64大小带有“中山大学”字样的二值位图。小波基选取Haar小波,小波的分解级数为5。此时同步计算出水印带宽为1367bps,每嵌入一个m序列和水印大约需要3秒的音频数据;根据公式可以计算同步信号的误检概率P1为0.56%。
图3中,为了测试同步信号对抗裁剪攻击的效果,我们将含有水印的light.wav头尾各裁剪掉一段,保留中间从第2秒到10秒音频,(a)为原始音频段(含水印),(b)为light.wav裁剪后的音频段。裁剪后的音频段应该含有两个伪随机序列(同步信号)以及两个相关的二值图像信息。实验表明,的确可以从裁剪后的音频中提出取这两个m序列和相关的两个二值图像的信息。
图4中,通过上述的数据可以看出本发明对抗各种音频处理和攻击都具有非常优异的性能。比如对于MP3压缩解压,即使用44.1kHz样本所允许的最低比特率32kbs来对音频进行压缩,提取数据的原始误码率也只有21.78%和11.23%。此时同步信号的漏检概率分别为1.15%和6.58*10-5%,而二值图标中的″中山大学″字样也可以清楚地被辨别。
需要提到的一点是为了测试不同的正交小波基对水印的影响,我们选取了各种不同的正交小波基来做测试,例如Daubechies正交小波序列、Coiflets正交小波序列以及Symlets正交小波序列。结论是正交小波基的选取对水印性能的影响不是太大,所以在实验中选择了最简单的Haar小波。
图5图6中,每个图中各有两条曲线——理论曲线(Theoretical)和实验曲线(Empirical),从图中可以看出这两条曲线几乎完全重合。
表1是本发明提出的音频水印算法对抗高斯噪声攻击的实验结果。
表2是本发明提出的音频水印算法对抗重采样攻击的实验结果。
表3是本发明提出的音频水印算法对抗重量化攻击的实验结果。
表4是本发明提出的音频水印算法对抗MP3压缩的稳健性测试结果。
表1.抗高斯噪声攻击的实验结果
march.wav light.wav
δ | SNR(dB) | BER(%) | P2(%) | δ | SNR(dB) | BER(%) | P2(%) |
1000 | 19.21 | 2.12 | 3.44*10-19 | 200 | 20.61 | 0.15 | 3.72*10-14 |
1300 | 16.90 | 7.76 | 8.52*10-8 | 300 | 17.38 | 3.22 | 2.18*10-15 |
1600 | 15.09 | 16.08 | 2.06*10-2 | 400 | 14.87 | 11.41 | 8.63*10-5 |
1900 | 13.58 | 23.52 | 2.73 | 500 | 12.94 | 20.95 | 7.28*10-1 |
2200 | 12.31 | 29.89 | 22.88 | 600 | 11.32 | 28.47 | 15.97 |
表2.抗重采样攻击的实验结果
march.wav light.wav
采样率(Hz) | BER(%) | P2(%) | 采样率(Hz) | BER(%) | P2(%) |
22050 | 0 | 0 | 22050 | 0 | 0 |
11025 | 0 | 0 | 11025 | 0 | 0 |
8000 | 0.12 | 2.78*10-16 | 8000 | 1.89 | 3.02*10-20 |
6000 | 1.65 | 1.67*1-21 | 6000 | 9.16 | 1.81*10-6 |
4000 | 27.12 | 10.73 | 4000 | 19.34 | 2.67*10-1 |
表3.抗重量化攻击的实验结果
march.wav light.wav
量化精度(bit) | BER(%) | P2(%) | 量化精度(bit) | BER(%) | P2(%) |
24 | 0 | 0 | 24 | 0 | 0 |
8 | 0 | 0 | 8 | 0 | 0 |
表4.抗MP3压缩的稳健性测试结果
march.wav light.wav
Bit Rate(kbps) | BER(%) | P2(%) | Bit Rate(kbps) | BER(%) | P2(%) |
128 | 0 | 0 | 128 | 0 | 0 |
112 | 0 | 0 | 112 | 0.15 | 3.72*10-44 |
96 | 0 | 0 | 96 | 0.78 | 1.64*10-28 |
80 | 0.39 | 4.56*10-35 | 80 | 3.76 | 5.31*10-14 |
64 | 0 | 0 | 64 | 6.42 | 2.30*10-9 |
56 | 2.34 | 2.77*10-18 | 56 | 7.54 | 4.96*10-8 |
48 | 9.94 | 7.83*10-6 | 48 | 9.50 | 3.49*10-6 |
40 | 14.28 | 3.40*10-3 | 40 | 10.96 | 4.33*10-5 |
32 | 21.78 | 1.15 | 32 | 11.23 | 6.58*10-5 |
Claims (5)
1、一种保护音频数据的水印方法,其特征在于该方法采用水印嵌入和提取两个过程;
水印嵌入过程步骤如下:1)对音频序列进行小波变换,并选取低频子带用于嵌入水印信息;2)对要嵌入的水印进行降维和置乱处理;3)在水印信息前后添加同步信号用于定位其嵌入位置,利用均匀量化的方法嵌入水印和同步信号;4)利用小波变换的时频局部特性来提高在频域中搜索同步信号的速度;
水印提取过程步骤如下:1)将音频序列分段,并对每段进行5级小波变换DWT,抽取DWT低频子带系数;2)从低频子带中提{0,1}序列,并利用小波变换的时频局部性在该{0,1}序列中搜索同步信号;3)根据同步信号的位置来提出水印信息,如果没有发现同步信号则返回本过程的步骤1。
2、根据权利要求1所述的一种保护音频数据的水印方法,其特征是水印嵌入过程的步骤1)是将原始音频信号进行分段,然后对每段音频作5级的小波分解,并选取小波分解后的低频子带系数用于隐藏信息,嵌入水印。
3、根据权利要求1所述的一种保护音频数据的水印方法,其特征是水印嵌入过程的步骤2)是将同步信号和水印64*64二值图像转换为一维的伪随机序列。
4、根据权利要求1所述的一种保护音频数据的水印方法,其特征是水印嵌入过程的步骤3)是将步骤2)中预处理后的数字水印嵌入到小波分解的低频子带系数中,并在每一个数字水印前加一个同步信号用于定位水印的嵌入位置。
5、根据权利要求1所述的一种保护音频数据的水印方法,其特征是水印嵌入过程的步骤4)是用改变后的系数作5级小波逆变换得到含有同步信号和水印的音频数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200310111929 CN1231875C (zh) | 2003-10-29 | 2003-10-29 | 一种保护音频数据的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200310111929 CN1231875C (zh) | 2003-10-29 | 2003-10-29 | 一种保护音频数据的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1540600A true CN1540600A (zh) | 2004-10-27 |
CN1231875C CN1231875C (zh) | 2005-12-14 |
Family
ID=34336303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200310111929 Expired - Fee Related CN1231875C (zh) | 2003-10-29 | 2003-10-29 | 一种保护音频数据的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1231875C (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1848829B (zh) * | 2005-04-14 | 2010-06-16 | 北京中科信利技术有限公司 | 一种自同步的音频水印方法 |
CN101290772B (zh) * | 2008-03-27 | 2011-06-01 | 上海交通大学 | 基于混合域系数矢量量化的音频零水印嵌入和提取方法 |
CN101101754B (zh) * | 2007-06-25 | 2011-09-21 | 中山大学 | 一种基于傅立叶离散对数坐标变换的稳健音频水印方法 |
CN101124624B (zh) * | 2005-01-21 | 2012-01-25 | 无限媒体股份有限公司 | 在有用信号中嵌入数字水印的方法 |
CN102385862A (zh) * | 2011-09-07 | 2012-03-21 | 武汉大学 | 一种面向空气信道传播的音频数字水印方法 |
CN102572732A (zh) * | 2010-12-30 | 2012-07-11 | 中国移动通信集团公司 | 一种获取彩铃特征信息的方法、装置和系统 |
CN105244032A (zh) * | 2014-05-29 | 2016-01-13 | 北京海云创智科技有限公司 | 一种数字音乐版权保护方法及装置 |
US9269362B2 (en) | 2012-06-27 | 2016-02-23 | Tata Consultancy Services Ltd. | Method and system for blind audio watermarking |
CN105611110A (zh) * | 2015-12-25 | 2016-05-25 | 努比亚技术有限公司 | 图像处理方法和装置 |
CN114168908A (zh) * | 2020-09-11 | 2022-03-11 | 四川大学 | 基于音视频分析的版权保护技术 |
-
2003
- 2003-10-29 CN CN 200310111929 patent/CN1231875C/zh not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101124624B (zh) * | 2005-01-21 | 2012-01-25 | 无限媒体股份有限公司 | 在有用信号中嵌入数字水印的方法 |
CN1848829B (zh) * | 2005-04-14 | 2010-06-16 | 北京中科信利技术有限公司 | 一种自同步的音频水印方法 |
CN101101754B (zh) * | 2007-06-25 | 2011-09-21 | 中山大学 | 一种基于傅立叶离散对数坐标变换的稳健音频水印方法 |
CN101290772B (zh) * | 2008-03-27 | 2011-06-01 | 上海交通大学 | 基于混合域系数矢量量化的音频零水印嵌入和提取方法 |
CN102572732A (zh) * | 2010-12-30 | 2012-07-11 | 中国移动通信集团公司 | 一种获取彩铃特征信息的方法、装置和系统 |
CN102572732B (zh) * | 2010-12-30 | 2016-08-10 | 中国移动通信集团公司 | 一种获取彩铃特征信息的方法、装置和系统 |
CN102385862A (zh) * | 2011-09-07 | 2012-03-21 | 武汉大学 | 一种面向空气信道传播的音频数字水印方法 |
US9269362B2 (en) | 2012-06-27 | 2016-02-23 | Tata Consultancy Services Ltd. | Method and system for blind audio watermarking |
CN105244032A (zh) * | 2014-05-29 | 2016-01-13 | 北京海云创智科技有限公司 | 一种数字音乐版权保护方法及装置 |
CN105611110A (zh) * | 2015-12-25 | 2016-05-25 | 努比亚技术有限公司 | 图像处理方法和装置 |
CN114168908A (zh) * | 2020-09-11 | 2022-03-11 | 四川大学 | 基于音视频分析的版权保护技术 |
Also Published As
Publication number | Publication date |
---|---|
CN1231875C (zh) | 2005-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Efficiently self-synchronized audio watermarking for assured audio data transmission | |
Delforouzi et al. | Adaptive digital audio steganography based on integer wavelet transform | |
Özer et al. | An SVD-based audio watermarking technique | |
CN1231875C (zh) | 一种保护音频数据的方法 | |
Wu et al. | Self-synchronized audio watermark in DWT domain | |
Pooyan et al. | LSB-based audio steganography method based on lifting wavelet transform | |
CN1808568A (zh) | 具有水印插入/提取功能的音频编码/解码设备及其方法 | |
CN101038771A (zh) | 用于音乐作品版权保护的数字水印新方法 | |
CN1889176A (zh) | 一种抗da/ad变换的音频水印处理方法 | |
CN101441870A (zh) | 一种基于离散分数变换的鲁棒数字音频水印方法 | |
CN1901442A (zh) | 基于语音识别的伪装通信方法 | |
Maha et al. | DCT based blind audio watermarking scheme | |
CN103455972A (zh) | 一种利用载体增强稳健性的多比特扩频水印方法 | |
CN102324234A (zh) | 一种基于mp3编码原理的音频水印方法 | |
Hmood et al. | A new steganographic method for embedded image in audio file | |
Budiman et al. | QIM-based audio watermarking with combined techniques of SWT-DST-QR-CPT using SS-based synchronization | |
Dhar | A blind audio watermarking method based on lifting wavelet transform and QR decomposition | |
Hemalatha et al. | Audio data hiding technique using integer wavelet transform | |
CN101350198B (zh) | 基于骨导的语音压缩水印方法 | |
CN102867513A (zh) | 一种基于伪Zernike矩的语音内容认证方法 | |
Xiong | Covert communication audio watermarking algorithm based on LSB | |
Elshazly et al. | Synchronized double watermark audio watermarking scheme based on a transform domain for stereo signals | |
Liu et al. | Adaptive audio steganography scheme based on wavelet packet energy | |
CN1414778A (zh) | 采用几何校准的抗几何变换图象水印方法 | |
CN114003870A (zh) | 基于二维码和数字水印技术的音频版权保护方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20051214 Termination date: 20101029 |