CN113506580B - 抗任意剪切和翻录的音频水印方法及系统 - Google Patents
抗任意剪切和翻录的音频水印方法及系统 Download PDFInfo
- Publication number
- CN113506580B CN113506580B CN202110466229.4A CN202110466229A CN113506580B CN 113506580 B CN113506580 B CN 113506580B CN 202110466229 A CN202110466229 A CN 202110466229A CN 113506580 B CN113506580 B CN 113506580B
- Authority
- CN
- China
- Prior art keywords
- audio
- watermark
- sequence
- embedded
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000013518 transcription Methods 0.000 title description 8
- 230000035897 transcription Effects 0.000 title description 8
- 238000005516 engineering process Methods 0.000 claims abstract description 20
- 238000001228 spectrum Methods 0.000 claims abstract description 17
- 230000002787 reinforcement Effects 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 19
- 238000000354 decomposition reaction Methods 0.000 claims description 18
- 230000009466 transformation Effects 0.000 claims description 18
- 238000013139 quantization Methods 0.000 claims description 17
- 230000005236 sound signal Effects 0.000 claims description 11
- 230000003595 spectral effect Effects 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000010845 search algorithm Methods 0.000 claims description 4
- 238000010008 shearing Methods 0.000 abstract description 11
- 239000000284 extract Substances 0.000 abstract description 6
- 238000012360 testing method Methods 0.000 description 13
- 238000011084 recovery Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 241000207840 Jasminum Species 0.000 description 2
- 235000010254 Jasminum officinale Nutrition 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本发明提供的一种抗任意剪切和翻录的音频水印方法及系统,涉及音频水印技术领域。本发明的技术方案针对待嵌入水印的音频,首先提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改和量化以获取特征值序列和量化特征序列,基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频,然后基于m序列将水印与所述量化特征序列进行绑定。该技术方案将m序列与DWT‑DCT‑SVD域的水印技术相结合,通过该法嵌入至音频的水印可在音频遭受极大破坏的情况下仍能完整性恢复。
Description
技术领域
本发明涉及音频水印技术领域,具体涉及一种抗任意剪切和翻录的音频水印方法及系统。
背景技术
随着互联网覆盖率程度的不断加深以及人们阅读习惯的逐渐改变,作为传播知识重要载体的有声读物也越来越受到市场的关注,并被越来越多的读者所接受。然而随着市场规模的不断扩大,不法分子开始使用盗版音频来牟取非法利益,损害了有声读物、音乐等音频所有者的利益。因此,如何保护有声读物、音乐等音频所有者的版权已成为亟待解决的问题。
目前,在音频水印技术领域,有基于稳健特征点的平稳小波域数字水印算法,也有基于离散余弦系数均值特征的水印方案,等等,这些音频水印技术能够在音频完整、遭受较小攻击的情况下实现水印的嵌入和提取,一定程度上满足了技术人员的需要。
然而,这些现有的音频水印技术难以抵抗对音频任意剪切的攻击,特别是剪切长度过多的情况,同时也难以抵抗翻录软件和录音笔line-in模式的翻录攻击。由此可见,现有技术无法在音频被极大破坏的情况下完整恢复水印。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种抗任意剪切和翻录的音频水印方法及系统,解决了现有技术无法在音频被极大破坏的情况下完整恢复水印的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
第一方面,本发明提出了一种抗任意剪切和翻录的音频水印方法,所述方法包括:
提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列,并基于所述特征值序列生成对应的量化特征序列;
基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频;
基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频。
优选的,所述提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列包括:
对待嵌入水印的音频信号进行分段,并对每一段依次进行三级离散小波变换和离散余弦变换,并将获得系数进行奇异值分解,从而获得音频的变换域特征;
对音频的变换域特征进行修改以获取特征值序列。
优选的,所述基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频包括:
选择本原多项式并生成对应的m序列,然后将m序列与音频的所述量化特征序列进行异或生成密钥1,并将一维的水印序列与m序列进行异或生成密钥2。
优选的,所述基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频时,基于启发式搜索算法对参数进行寻优,以不断调整水印嵌入时的嵌入强度。
优选的,所述方法还包括:采用同嵌入水印时相同的量化规则对水印进行提取,其具体过程包括:
S41、采用改进的谱熵法对已嵌入水印的音频进行时域上的恢复;
S42、对已嵌入水印的音频进行分段,并对每一段依次进行三级离散小波变换,离散余弦变换,奇异值分解,然后采用嵌入水印时相同的规则对变换域特征进行量化以获取量化特征序列;
S43、将现有音频的特征与所述量化特征序列进行对比,然后结合密钥1和密钥2提取水印图像。
优选的,所述方法还包括:
S44、当利用S41-S43步骤提取水印失败后,采用模式匹配-回滚法对已嵌入水印的音频进行时域上的恢复,然后继续进行S42-S43步骤对水印进行提取。
第二方面,本发明还提出了一种抗任意剪切和翻录的音频水印系统,所述系统包括:
嵌入预处理模块,用于提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列,并基于所述特征值序列生成对应的量化特征序列;
水印嵌入模块,用于基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频;
水印绑定模块,用于基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频。
优选的,所述嵌入预处理模块提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列包括:
对待嵌入水印的音频信号进行分段,并对每一段依次进行三级离散小波变换和离散余弦变换,并将获得系数进行奇异值分解,从而获得音频的变换域特征;
对音频的变换域特征进行修改以获取特征值序列。
优选的,所述水印绑定模块基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频包括:
选择本原多项式并生成对应的m序列,然后将m序列与音频的所述量化特征序列进行异或生成密钥1,并将一维的水印序列与m序列进行异或生成密钥2。
优选的,所述系统还包括水印提取模块:采用同嵌入水印时相同的量化规则对水印进行提取,其具体过程包括:
S41、采用改进的谱熵法对已嵌入水印的音频进行时域上的恢复;
S42、对已嵌入水印的音频进行分段,并对每一段依次进行三级离散小波变换,离散余弦变换,奇异值分解,然后采用嵌入水印时相同的规则对变换域特征进行量化以获取量化特征序列;
S43、将现有音频的特征与所述量化特征序列进行对比,然后结合密钥1和密钥2提取水印图像;
S44、当利用S41-S43步骤提取水印失败后,采用模式匹配-回滚法对已嵌入水印的音频进行时域上的恢复,然后进行S42-S43步骤以提取水印。
(三)有益效果
本发明提供了一种抗任意剪切和翻录的音频水印方法及系统。与现有技术相比,具备以下有益效果:
本发明的技术方案针对待嵌入水印的音频,首先提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改和量化以获取特征值序列和量化特征序列,基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频,然后基于m序列将水印与所述量化特征序列进行绑定。该技术方案将m序列与DWT-DCT-SVD域的水印技术相结合,通过该法嵌入至音频的水印可在音频遭受极大破坏的情况下仍能完整性恢复。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明抗任意剪切和翻录的音频水印嵌入过程的流程图;
图2为本发明中音频特征提取与量化过程流程图;
图3为本发明中水印与音频特征绑定流程图;
图4为本发明中水印嵌入流程图;
图5为本发明中参数λ优化流程图;
图6为本发明中水印提取流程图;
图7为本发明中对剪切后音频进行时域恢复流程图;
图8为使用本法的水印鲁棒性测试结果图;
图9为使用方法一的水印鲁棒性测试结果图;
图10为使用方法二的水印鲁棒性测试结果图;
图11为本发明实施例检测水印不可感知性时的音频信号波形图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种抗任意剪切和翻录的音频水印方法及系统,解决了现有技术无法在音频被极大破坏的情况下完整恢复水印的问题,实现了在音频经过任意剪切和翻录后,仍然可以正确的提取出水印,以保护音频作品版权的目的。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
本发明的技术方案为了实现音频在被极大破坏的情况下仍能完整恢复水印的目的,在音频嵌入水印时,首先,提取待嵌入水印的音频特征并进行修改和量化以获取特征值序列和量化特征序列,基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频,然后基于m序列将水印与所述量化特征序列进行绑定。而在提取音频水印时,根据音频水印被攻击的具体情况,选用短时改进子带谱熵法与双门限法或者使用模式匹配-回滚法,以实现对遭受大面积攻击后的音频的时域特征进行恢复,从而最终实现水印的提取,可提高水印的鲁棒性。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例1:
本发明首先提出了一种抗任意剪切和翻录的音频水印方法,所述方法包括:
S1、提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列,并基于所述特征值序列生成对应的量化特征序列;
S2、基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频;
S3、基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频。
由此可见,本发明的技术方案针对待嵌入水印的音频,首先提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改和量化以获取特征值序列和量化特征序列,基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频,然后基于m序列将水印与所述量化特征序列进行绑定。该技术方案将m序列与DWT-DCT-SVD域的水印技术相结合,通过该法嵌入至音频的水印可在音频遭受极大破坏的情况下仍能完整性恢复。
在本发明实施例的实现过程当中,为了提取待嵌入水印的音频在DWT-DCT-SVD这个变换域的特征,同时对相应的特征进行修改与量化,使它能够嵌入水印信息,一种较佳的处理方式是,提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列时包括:
对待嵌入水印的音频信号进行分段,并对每一段依次进行三级离散小波变换和离散余弦变换,并将获得系数进行奇异值分解,从而获得音频的变换域特征;
对音频的变换域特征进行修改以获取特征值序列。
实际上,为了根据很少的连续音频特征完整地恢复出整个水印,从而有效地保护音频与视频发行人的版权,本发明实施例使用了m序列与本原多项式,而在基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频包括:
选择本原多项式并生成对应的m序列,然后将m序列与音频的所述量化特征序列进行异或生成密钥1,并将一维的水印序列与m序列进行异或生成密钥2。
另外,为了在嵌入水印时选择一个合适的水印嵌入强度,一种较佳的处理方式是,在基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频时,基于启发式搜索算法对参数进行寻优,以不断调整水印嵌入时的嵌入强度。
在本发明实施例的实现过程当中,为了在音频遭受大规模剪切和翻录时仍能很方便的提取出水印,一种较佳的处理方式是,本发明的抗任意剪切和翻录的音频水印方法还包括:采用同嵌入水印时相同的量化规则对水印进行提取,其具体过程包括:
S41、采用改进的谱熵法对已嵌入水印的音频进行时域上的恢复;
S42、对已嵌入水印的音频进行分段,并对每一段依次进行三级离散小波变换,离散余弦变换,奇异值分解,然后采用嵌入水印时相同的规则对变换域特征进行修改与量化以获取量化特征序列;
S43、将现有音频的特征与所述量化特征序列进行对比,然后结合密钥1和密钥2提取水印图像。
另外,当利用S41-S43步骤提取水印失败后,执行S44、采用模式匹配-回滚法对已嵌入水印的音频进行时域上的恢复,然后继续进行S42-S43步骤对水印进行提取。在提取音频水印时利用模式匹配-回滚法,可实现对遭受大面积剪切攻击后的音频的时域特征的恢复,从而间接地提高了水印的鲁棒性。
下面结合对S1-S3具体步骤的解释,来详细说明本发明的具体实现过程。
S1、提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列,并基于所述特征值序列生成对应的量化特征序列。
提取待嵌入水印的音频在DWT-DCT-SVD这个变换域的特征,同时对相应的特征进行修改与量化以分别获取特征值序列和量化特征序列,使音频能够嵌入水印信息。参见图2,音频特征提取与量化的过程具体为:
首先,对待嵌入水印的音频信号进行分段,并对每一段音频信号依次进行离散小波变换(Discrete Wavelet Transformation,DWT)和离散余弦变换(Discrete CosineTransform,DCT),并将获得的系数进行奇异值分解(Singular Value Decomposition,SVD),从而获得相应的变换域的特征。例如,以每10000个样本点为一段对音频进行分段,然后采用db1小波将每一段音频进行三级DWT变换,再进行DCT变换,并对其进行奇异值分解后,然后将奇异值保存在列表feature中。
将feature中的每n个特征分为一组,将分得的每一组分别记为F(1),F(2),…,F(x),最后会得到x组【x=length(feature)-mod(length(feature),2n)】,其中,mod表示对x的值取余数的意思。而在对变换域的特征进行量化与修改时,不会对feature中序号超出n*x的元素进行量化与修改。此时F(1),F(2),…,F(x)每一组中都含有n个元素,将每组号为i中的第j个元素记为F(i)(j),其中,i为组号,j为组内的元素的序号,且1<=x<=i,1<=j<=n。对于上述组号为F(2*t-1)与F(2*t)中的每个元素(1≤t≤x/2),将F(2*t-1)(k)与F(2*t)(k)进行比较。将F(2*t-1)(k)与F(2*t)(k)分别记作A,B,并计算A/(A+B),若abs(A/(A+B)-0.5)<0.1,则判断A/(A+B)是否大于0.5,若大于0.5,则令A=A+λ(A+B),B=B-λ(A+B),反之,则令A=A-λ(A+B),B=B+λ(A+B),将A,B分别保存在feature((2*t-2)*n+k),feature((2*t-1)*n+k)中,并且如果A>B则令存储音频特征的列表feature_watermark中的feature_watermark((2*t-2)*n+k)=1,feature_watermark((2*t-1)*n+k)=0,反之若A<B,则令feature_watermark((2*t-2)*n+k)=0,feature_watermark((2*t-1)*n+k)=1。其中,k代表组内元素的序号,(2*t-2)*n+k与(2*t-1)*n+k的结果所代表的含义是此元素在feature,feature_watermark中的位置。在一般情况下令n=2。
S2、基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频。
采用扩频技术将修改过的上述特征值序列写回到音频的DWT-DCT-SVD域中获取经过特征强化后的音频,同时为了保障水印的鲁棒性与不可感知性,在嵌入水印时采用基于启发式搜索算法的参数调整方案,不断地调整嵌入强度,以满足出版商对水印的鲁棒性与不可感知性的高标准要求。参见图4,水印嵌入过程具体为:
首先,将分段后的音频的每一段依次进行三级离散小波变换,离散余弦变换,奇异值分解,然后采用扩频技术嵌入水印,将feature(i)替换原音频对应的奇异值V,之后对嵌入后含水印的音频依次进行SVD反变换,IDCT变换,以及IDWT变换,从而得到了含水印信息的音频。
然后,进行音频品质与水印鲁棒性的判断。如果在遭受了模拟攻击后,仍然能够提取出水印,且音频的信噪比与水印的不可感知性符合要求,则证明所选择的嵌入强度符合要求,最终,便以此时的强度嵌入水印,从而得到包含版权水印信息并且具有极高品质的音频。此处,以λ表示水印嵌入音频的嵌入强度,并采用上述的嵌入原理来嵌入水印。在此过程中,为了得到最佳的水印嵌入强度,可利用启发式搜索方法调整参数λ,具体过程为:
(1)初始化参数,设置参数λ的上界max,下界min、信噪比SNR的阈值thred,此处,取thred=30db;
(2)计算Δ=max-min,min=(max+min)/2,λ=roundn(min,-2),其中,λ=roundn(min,-2)表示精确到小数点后第二位;
(3)对含水印的音频计算其信噪比SNR,若SNR<thred,则max=λ,否则min=λ;计算Δ=max-min。
(4)重复步骤(2)和步骤(3)直到Δ>0.01。
至此获得参数λ的一个大致范围,此范围保证了水印的不可感知性,接着在取值范围[min,max]内通过基于目标函数的线性规划对参数λ进行寻优。参见图5,为参数λ的优化过程,图中,目标函数计算方法如下:
object=αSNR+β(1-MBER)
α=(1-MBER)/(SNR+1-MBER)
β=(1-MBER)/(SNR+1-MBER)
其中,MBER表示八种基本信号处理攻击下误码率BER的均值,Best_object表示最优目标函数值,Best_λ表示最优参数,step为线性规划采用的步长,这里设为step=0.001。
按照上述步骤获取最优参数,并以此强度进行最终的嵌入。
S3、基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频。
在获得量化特征序列后,基于m序列将水印与量化特征序列进行绑定,从而使音频特征真正的成为水印的载体,参见图3,水印与音频特征的绑定过程为:
首先,根据本原多项式表选择的12阶本原多项式生成对应的m序列,然后将m序列与音频量化后的特征进行异或,从而生成密钥1,再将一维的水印序列与m序列进行异或,从而生成密钥2。具体地,选定本原多项式D^12+D^11+D^10+D^7+D^6+D^5+D^4+D^1+1,根据此本原多项式生成对应的m序列m_sequence,m序列的长度为4095。读取音频水印图像,大小为64*64,并将此图像转成一维的序列watermark。将m序列与音频量化后的特征进行异或,从而生成密钥1,再将一维的水印序列与m序列进行异或,从而生成密钥2。其中,对于feature_watermark中的每个元素,与m序列中序号与之对应的元素进行异或,将结果保存在secret1中,用代码形式可表示为:
Secret1=[]
Fori=1:length(feature_watermark)
Secret1(i)=mod(feature_watermark(i)+m_sequence(i),2);
对于m序列中的每个元素,与水印序列watermark中序号与之对应的元素进行异或,将结果保存在secret2中,用代码形式可表示为:
Secert2=[]
For i=1:length(m_sequence)
Secret2(i)=mod(watermark(i)+m_sequence(i),2)。
此外,在实际应用中,为了实现版权的认定,上述抗任意剪切和翻录的音频水印方法还包括对嵌入音频的水印进行提取过程。采用同嵌入水印时相同的量化规则,在音频的DWT-DCT-SVD这个变换域中对水印进行提取,从而实现版权的认定。参见图6,水印的提取过程为:
首先,采用改进的谱熵法对音频进行动态帧检测,对音频进行时域上的恢复,再对音频进行分段,对每一段分别进行三级离散小波变换,离散余弦变换,奇异值分解;然后根据嵌入时选定的规则对相应的特征进行量化;在此之后,将现有音频的特征与原始特征进行对比,如果满足条件,则将此信息送入对应的处理函数中,进行水印的恢复;最后根据两级密钥,解密出相应的水印图像。具体地:
首先,采用改进的谱熵法(《MATLAB在语音信号分析与合成中的应用2013版》,宋知用)对音频进行动态帧检测,对音频进行时域上的恢复,然后将音频进行分段,每10000个样本点为一段,将每一段音频采用db1小波进行三级DWT变换,再采用DCT变换,再将其进行奇异值分解后,并将奇异值保存在列表feature中,再根据上述嵌入时的原理,得出它的量化特征ex_feature_watermark,将此时的特征与原音频的量化特征feature_watermark进行对比,找到连续的12个与原音频特征完全相同的量化特征段symbol,记录下这一特征组的第一个值对应于原音频特征ex_feature_watermark的第几个值,将此位置记为i,同时将ex_feature_watermark中从i开始的12个元素存入特征列表symbol中,并将位置i与特征段symbol作为参数传入函数watermark_recovery中,水印恢复watermark_recovery的工作流程为:
1)水印恢复函数watermark_recovery会根据参数i(i表示是这段与对应的原始特征相比,是正确的特征的起始位置)与symbol,利用secret1对特征进行解密,得到此时的m序列的12个初值;
2)根据参数i与m序列的12个初值恢复出对应的m序列(当i不等于1时,恢复出的m序列与原m序列相比可能有移位),(根据m序列的周期性);
3)根据i的值,将恢复出m序列的循环右移i位,得到正确嵌入时的顺序,将其命名为result;
4)将result与secret2的每一项进行模2加法,即异或操作,得出解密后的水印序列watermark,此水印序列长度为4095,令watermark(4096)=0,至此,便可完成全部水印的提取。
若音频遭受大规模的减切,通过上述过程无法提取出水印时,则可以采用模式匹配-回滚法对音频进行时域上的恢复,再利用上述水印提取流程的后续步骤提取出水印。参见图7,利用模式匹配-回滚法对剪切后音频进行时域恢复的大致流程为:
1)将原音频A分段,每10000个样本点为1段,每一段分别记为A(i)(1≤i≤n);
2)在剪切后的音频B中,设置一个滑动窗口,使窗口内的值为B(j,j+9999),此滑动窗口大小为10000,滑动值为20,其中j为窗口起始值的样本点编号;
3)将窗口内的样本点进行5级DWT,并将结果与原音频A(i)的5级DWT后的系数进行对照,即求相关系数;
4)当corr>=0.4时,认为这一段未经剪切,将它放入恢复结果列表list中,并将滑动计数器的值置为0,并且使参照对象变为原始音频A(i)的下一段A(i+1),令窗口起始值j=j+10000;
5)若corr<0.4,则令窗口继续向前滑动,滑动计数器counter的值增加相应的滑动样本点数,即令j=j+20;
6)反之滑动计数器的值若超过了规定的滑动次数11000个样本点,还未满足corr>=0.4的条件,则认定这一帧音频被剪掉了,将这一帧的所有样本点补0,然后存入恢复结果列表list,并且使参照对象变为原始音频A(i)的下一段A(i+1),将滑动计数器的值置为0,音频B窗口的起始值变为j-counter,窗口范围不变;
7)重复上述步骤3)-6),直至i>n,或窗口滑至音频B的最后一个样本点。
然后再按照上述水印提取的相同步骤继续提取水印,此处不再赘述。
至此,则完成了本发明一种抗任意剪切和翻录的音频水印方法的全部过程。
为了验证本发明实施例的有效性,我们通过实验来验证经过本发明的方法嵌入至音频的水印的鲁棒性和不可感知性。具体地:
1、水印鲁棒性的测试。分别对使用本法、使用基于稳健特征点的平稳小波域数字水印算法(方法一),以及使用基于DCT-CLM的抗翻录攻击的鲁棒音频水印算法(方法二)嵌入水印的音频文件test1(茉莉花)和test2(Blues)(音频文件均为WAV格式,采样率44100,量化精度16bit)进行水印鲁棒性测试,使它们遭受常见的8种攻击与录音笔翻录,其中,翻录条件1:使用电脑内部自带的系统混音进行翻录(相当于低品质的DA-AD转换);翻录条件2:使用录音笔进行翻录(不经过空气信道,利用录音笔的line-in模式),在翻录的同时,降低采样频率,(从44100降到7100);剪切1:音频每隔400个样本点减去5个样本点;剪切2:一次性减去音频的75%的样本点。最终取出的水印与平均误码率如图8-10所示。其中,图8为使用本法嵌入水印经过攻击后的误码率以及水印完整性情况,图9为使用方法一嵌入水印的水印鲁棒性测试结果,图10为使用方法二嵌入水印的水印鲁棒性测试结果。通过对比可知,利用本方案嵌入的水印在遭受MP3压缩、噪声攻击、低通滤波、中值滤波等8种常见的信号处理攻击后误码率为零,而且在遭受任意剪切攻击和录音笔翻录后的误码率也为0。因此,本方案在音频中嵌入的水印具有极高的鲁棒性。
2.水印的不可感知性测试。
ITU-R的BS.1387标准[20]是目前国际上采用最多的评价音频不可听性的客观标准。该标准弥补了SNR没有考虑到人耳听觉系统(HAS)特性的缺陷,其测试工具PEAQ计算出的听觉质量客观区分度ODG是不可听性的衡量指标。主观标准我们采用ITU-R BS.1116中定义的听觉质量主观区分度SDG[11]。该方法具体做法是提供给听众原始音频和含水印音频,让他们通过打分评价二者的区分度,然后取他们打分的平均值。ODG和SDG的评分标准如下表4所示。从表中可以看出,ODG值和SDG值越接近0,意味着嵌入水印的不可听性越好。
表4听觉质量客观区分度ODG评价标准
对音频文件test 1(茉莉花)和test2(Blues)(WAV格式,采样率44100,量化精度16bit)进行水印不可听性测试。
原始音频信号和采用本法嵌入水印的音频信号的波形图分别如图11(a)和(b)所示,从图中可以看出,二者在波形图上几乎没有差别。
将我们的水印方案与采用方法一和方法二的水印方案进行对比,其结果如下表5所示。
表5 SNR、ODG和SDG测试结果
从表5可以看出,本系统嵌入水印后的音频具有很好的不可感知性,其SNR,ODG,SDG指标均优于其他方案。
实施例2:
第二方面,本发明还公开了一种抗任意剪切和翻录的音频水印系统,该系统包括:
嵌入预处理模块,用于提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列,并基于所述特征值序列生成对应的量化特征序列;
水印嵌入模块,用于基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频;
水印绑定模块,用于基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频。
优选的,所述嵌入预处理模块提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列包括:
对待嵌入水印的音频信号进行分段,并对每一段依次进行三级离散小波变换和离散余弦变换,并将获得系数进行奇异值分解,从而获得音频的变换域特征;
对音频的变换域特征进行修改以获取特征值序列。
优选的,所述水印绑定模块基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频包括:
选择本原多项式并生成对应的m序列,然后将m序列与音频的所述量化特征序列进行异或生成密钥1,并将一维的水印序列与m序列进行异或生成密钥2。
优选的,所述系统还包括水印提取模块:采用同嵌入水印时相同的量化规则对水印进行提取,其具体过程包括:
S41、采用改进的谱熵法对已嵌入水印的音频进行时域上的恢复;
S42、对已嵌入水印的音频进行分段,并对每一段依次进行三级离散小波变换,离散余弦变换,奇异值分解,然后采用嵌入水印时相同的规则对变换域特征进行量化以获取量化特征序列;
S43、将现有音频的特征与所述量化特征序列进行对比,然后结合密钥1和密钥2提取水印图像;
S44、当利用S41-S43步骤提取水印失败后,采用模式匹配-回滚法对已嵌入水印的音频进行时域上的恢复,然后进行S42-S43步骤以提取水印。
可理解的是,本发明实施例提供的一种抗任意剪切和翻录的音频水印系统与上述抗任意剪切和翻录的音频水印方法相对应,其有关内容的解释、举例、有益效果等部分可以参考抗任意剪切和翻录的音频水印方法中的相应内容,此处不再赘述。
综上所述,与现有技术相比,具备以下有益效果:
1、本发明的技术方案针对待嵌入水印的音频,首先提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改和量化以获取特征值序列和量化特征序列,基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频,然后基于m序列将水印与所述量化特征序列进行绑定。该技术方案将m序列与DWT-DCT-SVD域的水印技术相结合,通过该法嵌入至音频的水印可在音频遭受极大破坏的情况下仍能完整性恢复;
2、本发明使用m序列与本原多项式,可以根据很少的连续音频特征完整地恢复出整个水印,从而有效地保护音频与视频发行人的版权;
3、本发明在提取音频水印时,利用短时改进子带谱熵法与双门限法,对翻录后的音频在时域特征上进行恢复,以便于提取出水印;
4、本发明在提取音频水印时,利用模式匹配-回滚法,实现对遭受大面积剪切攻击后的音频的时域特征的恢复,从而间接地提高了水印的鲁棒性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (6)
1.一种抗任意剪切和翻录的音频水印方法,其特征在于,所述方法包括:
提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列,并基于所述特征值序列生成对应的量化特征序列;
基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频;
基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频;
所述提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列包括:
对待嵌入水印的音频信号进行分段,并对每一段依次进行三级离散小波变换和离散余弦变换,并将获得系数进行奇异值分解,从而获得音频的变换域特征;
对音频的变换域特征进行修改以获取特征值序列;
所述基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频包括:
选择本原多项式并生成对应的m序列,然后将m序列与音频的所述量化特征序列进行异或生成密钥1,并将一维的水印序列与m序列进行异或生成密钥2。
2.如权利要求1所述的方法,其特征在于,所述基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频时,基于启发式搜索算法对参数进行寻优,以不断调整水印嵌入时的嵌入强度。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:采用同嵌入水印时相同的量化规则对水印进行提取,其具体过程包括:
S41、采用改进的谱熵法对已嵌入水印的音频进行时域上的恢复;
S42、对已嵌入水印的音频进行分段,并对每一段依次进行三级离散小波变换,离散余弦变换,奇异值分解,然后采用嵌入水印时相同的规则对变换域特征进行量化以获取量化特征序列;
S43、将现有音频的特征与所述量化特征序列进行对比,然后结合密钥1和密钥2提取水印图像。
4.如权利要求3所述的方法,其特征在于,所述方法还包括:
S44、当利用S41-S43步骤提取水印失败后,采用模式匹配-回滚法对已嵌入水印的音频进行时域上的恢复,然后继续进行S42-S43步骤对水印进行提取。
5.一种抗任意剪切和翻录的音频水印系统,其特征在于,所述系统包括:
嵌入预处理模块,用于提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列,并基于所述特征值序列生成对应的量化特征序列;
水印嵌入模块,用于基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频;
水印绑定模块,用于基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频;
所述嵌入预处理模块提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改以获取特征值序列包括:
对待嵌入水印的音频信号进行分段,并对每一段依次进行三级离散小波变换和离散余弦变换,并将获得系数进行奇异值分解,从而获得音频的变换域特征;
对音频的变换域特征进行修改以获取特征值序列;
所述水印绑定模块基于m序列将水印与所述量化特征序列进行绑定获取包含水印信息的音频包括:
选择本原多项式并生成对应的m序列,然后将m序列与音频的所述量化特征序列进行异或生成密钥1,并将一维的水印序列与m序列进行异或生成密钥2。
6.如权利要求5所述的系统,其特征在于,所述系统还包括水印提取模块:采用同嵌入水印时相同的量化规则对水印进行提取,其具体过程包括:
S41、采用改进的谱熵法对已嵌入水印的音频进行时域上的恢复;
S42、对已嵌入水印的音频进行分段,并对每一段依次进行三级离散小波变换,离散余弦变换,奇异值分解,然后采用嵌入水印时相同的规则对变换域特征进行量化以获取量化特征序列;
S43、将现有音频的特征与所述量化特征序列进行对比,然后结合密钥1和密钥2提取水印图像;
S44、当利用S41-S43步骤提取水印失败后,采用模式匹配-回滚法对已嵌入水印的音频进行时域上的恢复,然后进行S42-S43步骤以提取水印。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110466229.4A CN113506580B (zh) | 2021-04-28 | 2021-04-28 | 抗任意剪切和翻录的音频水印方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110466229.4A CN113506580B (zh) | 2021-04-28 | 2021-04-28 | 抗任意剪切和翻录的音频水印方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113506580A CN113506580A (zh) | 2021-10-15 |
CN113506580B true CN113506580B (zh) | 2024-05-07 |
Family
ID=78008325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110466229.4A Active CN113506580B (zh) | 2021-04-28 | 2021-04-28 | 抗任意剪切和翻录的音频水印方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113506580B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556393A (zh) * | 2022-08-05 | 2024-02-13 | 华为技术有限公司 | 一种数字内容的处理、确权和溯源方法及系统 |
CN116825116B (zh) * | 2023-07-18 | 2024-03-12 | 合肥工业大学 | 抗去同步攻击的鲁棒音频水印嵌入和提取方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2276378A1 (en) * | 1998-06-24 | 1999-12-24 | Nec Corporation | Robust digital watermarking |
KR20070061285A (ko) * | 2005-12-08 | 2007-06-13 | 한국전자통신연구원 | 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법 |
CN101101754A (zh) * | 2007-06-25 | 2008-01-09 | 中山大学 | 一种基于傅立叶离散对数坐标变换的稳健音频水印方法 |
WO2011026365A1 (zh) * | 2009-09-03 | 2011-03-10 | 中兴通讯股份有限公司 | 一种图像数字水印嵌入和提取的方法及系统 |
CN102157154A (zh) * | 2011-01-28 | 2011-08-17 | 桂林电子科技大学 | 基于音频内容的非均匀离散余弦变换音频可靠性认证方法 |
CN102496367A (zh) * | 2011-12-06 | 2012-06-13 | 北京邮电大学 | 基于dwt-dct-svd的音频盲水印算法 |
CN102664014A (zh) * | 2012-04-18 | 2012-09-12 | 清华大学 | 一种基于对数量化索引调制的盲音频水印实现方法 |
CN104658542A (zh) * | 2015-03-16 | 2015-05-27 | 武汉大学 | 基于正交的加性扩频音频水印嵌入方法、检测方法及系统 |
CN106504757A (zh) * | 2016-11-09 | 2017-03-15 | 天津大学 | 一种基于听觉模型的自适应音频盲水印方法 |
CN110379436A (zh) * | 2019-06-14 | 2019-10-25 | 东南大学 | 一种基于dwt-dct-svd的信息隐藏方法 |
CN112712811A (zh) * | 2020-12-08 | 2021-04-27 | 天津大学 | 自适应量化均值去同步攻击鲁棒音频水印方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9269362B2 (en) * | 2012-06-27 | 2016-02-23 | Tata Consultancy Services Ltd. | Method and system for blind audio watermarking |
CN109300078B (zh) * | 2018-08-31 | 2022-12-30 | 太原理工大学 | 一种具有自适应嵌入强度的图像扩频水印嵌入方法 |
-
2021
- 2021-04-28 CN CN202110466229.4A patent/CN113506580B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2276378A1 (en) * | 1998-06-24 | 1999-12-24 | Nec Corporation | Robust digital watermarking |
KR20070061285A (ko) * | 2005-12-08 | 2007-06-13 | 한국전자통신연구원 | 하이브리드 변환을 이용한 디지털 오디오 워터마킹 방법 |
CN101101754A (zh) * | 2007-06-25 | 2008-01-09 | 中山大学 | 一种基于傅立叶离散对数坐标变换的稳健音频水印方法 |
WO2011026365A1 (zh) * | 2009-09-03 | 2011-03-10 | 中兴通讯股份有限公司 | 一种图像数字水印嵌入和提取的方法及系统 |
CN102157154A (zh) * | 2011-01-28 | 2011-08-17 | 桂林电子科技大学 | 基于音频内容的非均匀离散余弦变换音频可靠性认证方法 |
CN102496367A (zh) * | 2011-12-06 | 2012-06-13 | 北京邮电大学 | 基于dwt-dct-svd的音频盲水印算法 |
CN102664014A (zh) * | 2012-04-18 | 2012-09-12 | 清华大学 | 一种基于对数量化索引调制的盲音频水印实现方法 |
CN104658542A (zh) * | 2015-03-16 | 2015-05-27 | 武汉大学 | 基于正交的加性扩频音频水印嵌入方法、检测方法及系统 |
CN106504757A (zh) * | 2016-11-09 | 2017-03-15 | 天津大学 | 一种基于听觉模型的自适应音频盲水印方法 |
CN110379436A (zh) * | 2019-06-14 | 2019-10-25 | 东南大学 | 一种基于dwt-dct-svd的信息隐藏方法 |
CN112712811A (zh) * | 2020-12-08 | 2021-04-27 | 天津大学 | 自适应量化均值去同步攻击鲁棒音频水印方法 |
Non-Patent Citations (3)
Title |
---|
Su, Zhaopin, et al..SNR-constrained heuristics for optimizing the scaling parameter of robust audio watermarking.《IEEE Transactions on Multimedia》.第2631-2644页. * |
一种基于DCT的扩频音频数字水印技术;张凤英, 罗予东;湛江师范学院学报;20040630(第03期);全文 * |
基于启发式搜索的音频水印方案;常乐杰 等;《应用科学学报》;20160731;第34卷(第4期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113506580A (zh) | 2021-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kang et al. | Geometric invariant audio watermarking based on an LCM feature | |
US8681978B2 (en) | Efficient and secure forensic marking in compressed domain | |
US20040059918A1 (en) | Method and system of digital watermarking for compressed audio | |
CN113506580B (zh) | 抗任意剪切和翻录的音频水印方法及系统 | |
Kirovski et al. | Spread-spectrum audio watermarking: requirements, applications, and limitations | |
Ketcham et al. | Intelligent audio watermarking using genetic algorithm in DWT domain | |
Dhar | A blind audio watermarking method based on lifting wavelet transform and QR decomposition | |
Li et al. | An audio watermarking technique that is robust against random cropping | |
Megías et al. | A robust audio watermarking scheme based on MPEG 1 layer 3 compression | |
Kirovski et al. | Audio watermark robustness to desynchronization via beat detection | |
Park et al. | Speech authentication system using digital watermarking and pattern recovery | |
Maha et al. | A blind audio watermarking scheme based on neural network and psychoacoustic model with error correcting code in wavelet domain | |
Chetan et al. | Audio watermarking using modified least significant bit technique | |
Salma et al. | A robust audio watermarking technique based on the perceptual evaluation of audio quality algorithm in the multiresolution domain | |
Beauget et al. | Informed detection of audio watermark for resolving playback speed modifications | |
Dutta et al. | Blind watermarking in audio signals using biometric features in wavelet domain | |
Megías et al. | An audio watermarking scheme robust against stereo attacks | |
Kaabneh et al. | Muteness-based audio watermarking technique | |
Ketcham et al. | An algorithm for intelligent audio watermaking using genetic algorithm | |
CN116825116B (zh) | 抗去同步攻击的鲁棒音频水印嵌入和提取方法 | |
Megías et al. | Robust frequency domain audio watermarking: a tuning analysis | |
Dutt | A survey of digital audio watermarking techniques | |
Foo et al. | Audio watermarking based on compression-expansion technique | |
Dhavale et al. | High capacity lossless semi-fragile audio watermarking in the time domain | |
Garlapati et al. | A symbol based watermarking approach for spread spectrum audio watermarking methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |