CN109102814A - 一种dct变换下面向相位的音频水印方法 - Google Patents
一种dct变换下面向相位的音频水印方法 Download PDFInfo
- Publication number
- CN109102814A CN109102814A CN201811065808.2A CN201811065808A CN109102814A CN 109102814 A CN109102814 A CN 109102814A CN 201811065808 A CN201811065808 A CN 201811065808A CN 109102814 A CN109102814 A CN 109102814A
- Authority
- CN
- China
- Prior art keywords
- dct
- audio
- watermark
- coefficient
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 33
- 238000012512 characterization method Methods 0.000 claims abstract description 4
- 238000003780 insertion Methods 0.000 claims description 14
- 230000037431 insertion Effects 0.000 claims description 14
- 230000000873 masking effect Effects 0.000 claims description 13
- 238000009432 framing Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 2
- 230000006798 recombination Effects 0.000 claims description 2
- 238000005215 recombination Methods 0.000 claims description 2
- 230000005236 sound signal Effects 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 14
- 238000005457 optimization Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000272194 Ciconiiformes Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013432 robust analysis Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2209/00—Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
- H04L2209/60—Digital content management, e.g. content distribution
- H04L2209/608—Watermarking
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Editing Of Facsimile Originals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种DCT变换下面向相位的音频水印方法,以音视频媒体为原始载体,将Patchwork和DCT变换结合然后利用DCT相位的二值性,采用Patchwork法将该水印信息嵌入音频信号DCT低频系数的相位中并形成一组表征位置的密钥。本发明方法在提高音频水印鲁棒性的同时保持较好的不可感知性,可广泛应用于音频保护场景。
Description
技术领域
本发明涉及一种DCT变换下面向相位的音频水印方法,具体涉及一种基于相位和Patchwork的音频水印算法,属于数字水印技术领域,。
背景技术
目前,保护版权的主要方法有加密技术和数字水印技术。加密技术是指运用加密算法将原始载体数据转换成常人无法理解的一串乱码,接收者收到信号后再使用解密算法还原信号。虽然加密技术能够保护数据安全,但只适用于一部分数据,加密数据解密成功后与原始载体数据相同且不再具备版权保护功能,因此加密技术不能深入解决盗版侵权问题。针对加密技术存在的不足,因此引入数字水印技术优化了上述问题,数字水印技术是指运用水印算法将水印信息嵌入原始载体(如文档、图片、音频、视频)中。该技术既不会影响原始载体的使用,也不易被人体的感官系统(如视觉或听觉系统)察觉。通过这些隐藏在原始载体中的水印信息,可以判断原始载体数据是否被篡改,其内容信息是否完整,数字多媒体资源的使有者是否存在盗版侵权问题。
起初数字水印概念的提出主要是为了解决盗版侵权问题,如IBM公司研发的具有版权保护功能的“数字图书馆”软件。随着科技的发展和对数字水印技术的深入研究,该技术除了用于版权保护、内容认证以外,还可以用于内容标注,交易追踪,使用控制,广播检测,隐蔽通信,数字指纹,标题与注释,篡改提示,商务交易中的票据防伪,媒体标记与信息隐藏,隐藏通信及其对抗等。如将照片的拍摄时间与地点等标注信息嵌入图像进行保存;DVD防拷贝系统;数字档案访问控制;根据不同的节目内容在节目信号中嵌入不同的水印信息,统计节目的收视率、广告的播出次数与时长等。然而数字水印技术存在其自身平衡性问题,即不可感知性和鲁棒性矛盾,不可感知性要求越高则鲁棒性随之降低,反之鲁棒性随之提高,所以在实际使用时应根据需求对两者进行权衡和取舍。
音频水印方法种类较多,根据嵌入域的不同,可分为时域和变换域音频水印方案。时域音频水印方案直接将水印嵌入原始音频载体中。其典型方法包括回声隐藏法和最低有效位法。时域音频水印方案具有易实现、水印容量大等优点,但其同样存在鲁棒性、安全性较差等缺点。针对上述不足,变换域音频水印方法改进了这些问题,其将水印信息嵌入音频的变换域系数中。经典变换域水印方法包括离散傅里叶变换(Discrete FourierTransform,DFT)、离散余弦变换(Discrete Cosine Transform,DCT)和离散小波变换(Discrete Wavelet Transform,DWT)音频水印嵌入方案。这类算法实现过程较为复杂,但水印算法鲁棒性较强,安全性较高。变换域水印方法通过选择合适的嵌入位置、嵌入强度和嵌入方式来嵌入水印信息,这就要求该类算法充分考虑数字水印自身的平衡性问题。如何在权衡不可感知性和鲁棒性的基础上选择恰当的嵌入位置、嵌入强度以及嵌入方式是变换域水印算法研究中的一个热点问题。
发明内容
针对现有技术中存在的问题,本发明针对变换域音频水印方法,提供一种DCT域下面向相位的音频水印方法,与现有基于相位的音频水印方案相比,该方法通过调整每段DCT低频系数相位值,将水印嵌入选定的DCT相位中,使得在保证音频听觉质量的同时能有效提高鲁棒性,达到音频版权保护的目的。
本发明为解决上述技术问题采用以下技术方案:
本发明提供一种DCT变换下面向相位的音频水印方法,将Patchwork和DCT变换结合,运用基于颜色特征转变的图像相似度算法,从视频流中提取颜色特征序列作为音频水印信息,然后利用DCT相位的二值性,采用Patchwork法将音频水印信息嵌入音频流DCT低频系数的相位中并形成一组表征位置的密钥。
该音频水印嵌入方法具体包括以下几个步骤:
步骤A:输入原始音视频流,分离出音频流和N帧视频流;将音频流左右声道分离,分别对左、右声道音频流进行分帧,分离出D帧音频流,其中,帧长为A,帧移为B,每帧重叠部分长度为C;
步骤B:运用基于颜色特征转变的图像相似度算法,从N帧视频流中生成N比特音频水印信息Wau;
步骤C:运用听觉掩蔽模型,选出E帧小于掩蔽阈值的左声道音频流,对所选帧进行DCT变换,并选取DCT低频系数;
步骤D:运用Patchwork法,将步骤C得到的每帧DCT低频系数FL分成正负两个子集,并按固定长度分别对两个子集进行分段;在每段第1个DCT系数相位嵌入l比特水印,并将嵌入位置映射成密钥key;完成左声道音频流水印的嵌入;
步骤E:对右声道音频流重复步骤C至D,完成右声道音频流水印的嵌入;在嵌入水印后的左、右声道音频流末尾分别嵌入16比特相同的水印结束标志位;最后对嵌入水印的左、右声道音频流进行IDCT变换,将IDCT变换后的结果进行合并重组,生成含水印音频流;
步骤F:根据密钥key从含水印音频流的DCT低频系数相位中提取水印信息。
作为本发明的进一步优化方案,所述步骤B具体包括以下步骤:
步骤B1:设N帧视频流的第一帧为参考帧,第1比特音频水印信息wau(1)=1;
步骤B2:从第二帧开始,运用基于颜色特征转变的图像相似度算法分别计算每一帧与参考帧的相似度,根据计算得到的相似度生成音频水印信息:
其中,wau(i)为第i比特音频水印信息,Th为设定的相似度阈值。
作为本发明的进一步优化方案,相似度阈值Th值为0.76。
作为本发明的进一步优化方案,所述步骤D具体包括以下步骤:
步骤D1:将步骤C得到的每帧DCT低频系数FL分成正负两个子集FP、FN,子集FP存放正DCT系数FP(d),d=1,2,...,p1,其中,p1为正DCT系数的个数,FP(d)为第d个正DCT系数;子集FN存放负DCT系数FN(l),l=1,2,...,p2,其中,p2为负DCT系数的个数,FN(l)为第l个负DCT系数;并记录FP(d)和FN(l)在对应帧中的相应位置;
步骤D2:将FP分成T段,FN分成R段,每段长度均为S:FP={fp1,...,fpt,...,fpT}、FN={fn1,...,fnr,...,fnR},fpt为FP的第t段DCT系数,fnr为FN的第r段DCT系数,t=1,2,...,T,r=1,2,...,R;并在每段第1个DCT系数对应的DCT相位依次嵌入1比特水印,并将嵌入位置映射成密钥key;;
步骤D3:根据记录的索引值,将嵌入水印后对应的DCT分段系数F′P和F′N合并成DCT低频系数F′L,完成一帧音频的水印嵌入。
作为本发明的进一步优化方案,步骤D2中舍弃子集FP、FN中尾段长度不足S的部分。
作为本发明的进一步优化方案,S=16。
作为本发明的进一步优化方案,所述步骤D2具体包括以下步骤:
1)当wau(i)=0时,将水印嵌入FP第t段第1个DCT系数fpt(1)的相位系数θpt(1)中,嵌入水印后的相位系数θ′pt(1)有以下两种情况:若tempMin(t)<|fpt(1)|<tempAve(t)则θ′pt(1)=θpt(1)-(β×wau(i)-α×tempMin(t)),若tempAve(t)<|fpt(1)|<tempMax(t)则θ′pt(1)=θpt(1)-(β×wau(i)-α×tempAve(t));其中,tempMax(t)、tempMin(t)、tempAve(t)分别为FP中第t段DCT系数fpt的最大DCT系数绝对值、最小DCT系数绝对值、DCT系数平均绝对值,α为DCT系数参与程度因子,β为水印嵌入强度因子;
2)当wau(i)=1时,将水印嵌入FN第r段第1个DCT系数fnr(1)的相位系数θnr(1)中,嵌入水印后的相位系数θ′nr(1)有以下两种情况:若tempMin(r)<|fnr(1)|<tempAve(r)则θ′nr(1)=θnr(1)+(β×wau(i)-α×tempMin(r)),若tempAve(r)<|fnr(1)|<tempMax(r)则θ′nr(1)=θnr(1)+(β×wau(i)-α×tempAve(r));其中,tempMax(r)、tempMin(r)、tempAve(r)分别为FN中第r段数据的最大DCT系数绝对值、最小DCT系数绝对值、DCT系数平均绝对值;
3)水印嵌入位置映射而成的密钥key由FL(idx)=FP(S×(t-1)+1)和key(i)=idx得到,其中,key(i)为密钥key中的第i个密钥值。
作为本发明的进一步优化方案,所述步骤F具体包括以下步骤:
步骤F1:从含水印音频流中分离出左、右声道音频流,并按照步骤A所述的方法分别对左、右声道音频流进行分帧;
步骤F2:运用听觉掩蔽模型,选出E帧小于掩蔽阈值的音频帧,并对所选帧进行DCT变换,选取DCT低频系数;
步骤F3:对左、右声道音频流,分别根据公式 是取每帧水印信息,直至遇到水印结束标志位位置,其中,c(key(i))表示第i个嵌入位置对应的DCT低频系数步骤,wex(i)表示所提取的第i比特音频水印信息。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:与现有基于FFT域相位音频水印方案相比,本发明提供的一种DCT变换下面向相位的音频水印方法,在DCT域内采用Patchwork方法,根据分段后DCT变换域系数统计特性在相位系数嵌入水印信息,在保证一定不可感知性的条件下,具有更好的抗攻击性和稳定性。
附图说明
图1为本发明中音频水印嵌入流程图;
图2为本发明中音频水印提取流程图;
图3为本发明一帧音频数据嵌入DCT相位流程图;
图4为本发明方法与对比方法SNR值比较图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
下面结合附图对本发明的技术方案做进一步的详细说明:
本发明一种DCT变换下面向相位的音频水印方法,首先运用基于颜色特征转变的图像相似度算法,从视频流中提取颜色特征序列作为音频水印信息,然后利用DCT相位的二值性,采用Patchwork法将该水印信息嵌入音频信号DCT低频系数的相位中并形成一组表征位置的密钥。水印提取时,根据密钥从DCT低频系数的相位中提取水印信息。
本发明的一种DCT变换下面向相位的音频水印方法,如图1和2所示,具体包括以下步骤:
步骤A:输入原始音视频流,分离出音频流和N帧视频流。将音频流左右声道分离,分别对左、右声道音频流进行分帧。设帧长为A,帧移为B,每帧重叠部分长度为C,共分离出D帧音频流;
步骤B:运用基于颜色特征转变的图像相似度算法,从N帧视频流中生成N比特音频水印信息Wau;
步骤C:运用听觉掩蔽模型,选出E帧小于掩蔽阈值的左声道音频帧,并对所选帧进行DCT变换,选取DCT低频系数;
步骤D:运用Patchwork法,将每帧的DCT低频系数FL分成正负两个子集,并以16个数据为单位进行分段,在每段第1个DCT系数相位嵌入1比特水印,并将嵌入位置映射成密钥key;
步骤E:左声道音频流水印嵌入完成后,对右声道音频流重复步骤C至D,嵌入完成后。再嵌入16比特水印结束标志位。最后对嵌入水印的左、右声道音频流进行IDCT变换,将二者合并重组、生成含水印音频流;
步骤F:根据密钥key从含水印音频流的DCT低频系数相位中提取水印信息。
所述步骤B具体包括以下步骤:
步骤B1:设N帧视频流的第一帧为参考帧,根据公式(2)得到第一比特音频水印信息;
步骤B2:从第二帧开始,依次使用基于颜色特征转变的图像相似度算法生成水印信息:首先计算每帧相似度,根据公式(1)比较每帧相似度与相似度阈值Th的大小,若第i帧相似度大于相似度阈值Th,则设wau(i)为″1″,反之设wau(i)为″0″,其中相似度阈值Th值为0.76;
步骤B3:生成N比特用于嵌入音频的水印信息wau:
wau(1)=1 (2)
其中,wau(i)为第i比特音频水印信息。
所述步骤D具体包括以下步骤(如图3所示):
步骤D1:将步骤C所选的每帧音频的DCT低频系数FL分成正负两个子集FP、FN,子集FP存放正DCT系数FP(d),(d=1,2,...,p1),其中p1为正DCT系数的个数,FP(d)代表第d个正DCT系数;子集FN存放负DCT系数FN(l),(l=1,2,...,p2),其中p2为负DCT系数的个数,FN(l)代表第l个负DCT系数;并记录相应索引值(FP(d)和FN(l)在当前帧中的位置)以便在音频流重组时使用;
步骤D2:将FP分成T段,FN分成R段,每段长度均为S,设FP={fp1,...,fpt,...,fpT},FN={fn1,...,fnr,...,fnR},得到FP的第t段DCT系数fpt和FN的第r段DCT系数fnr,其中t=1,2,...,T,r=1,2,...,R,S=16,并在每段第1个DCT系数对应的DCT相位依次嵌入1比特水印。设FP中第t段DCT系数fpt的最大DCT系数绝对值为tempMax(t),最小DCT系数绝对值为tempMin(t)、DCT系数平均绝对值为tempAve(t),计算公式如(3)。负DCT系数集合采用同样方法处理,得到FN中第r段数据的最大DCT系数绝对值为tempMax(r),最小DCT系数绝对值为tempMin(r)、DCT系数平均绝对值为tempAve(r);
步骤D3:为了防止嵌入水印后的DCT系数值改变过大而影响不可感知性,需保证每一段数据修改相位后的DCT系数绝对值不超过该段最大值,且不小于该段最小值,所以在嵌入水印前,需比较FP的第t段第1个DCT系数fpt(1)与tempMax(t),tempMin(t),tempAve(t)的大小以及FN第r段第1个DCT系数fnr(1)与tempMax(r),tempMin(r),tempAve(r)的大小,判断fpt(1)和fnr(1)所在区间,修改相应的相位系数,使得修改后的fpt(1)和fnr(1)依然在原来区间内;
步骤D4:引入DCT系数参与程度因子α,水印嵌入强度因子β,水印信息wau,其中wau(i)∈(0,1);
步骤D5:当wau(i)=0时,将水印嵌入FP第t段第1个DCT系数fpt(1)的相位系数θpt(1)中,公式如(4)、(5)。
如果tempMin(t)<|fpt(1)|<tempAve(t)
θ′pt(1)=θpt(1)-(β×wau(i)-α×tempMin(t)) (4)
如果tempAve(t)<|fpt(1)|<tempMax(t)
θ′pt(1)=θpt(1)-(β×wau(i)-α×tempAve(t)) (5)
其中,θpt(1)为fpt(1)的相位值,θ′pt(1)为嵌入水印后的相位值,由公式(6)可知,正DCT系数fpt(1)中相位值为″0″,即θpt(1)值为″0″。根据公式(7)和(8),获取修改的位置key(i);
FL(idx)=FP(S×(t-1)+1) (7)
key(i)=idx (8)
步骤D6:当wau(i)=1时,将水印嵌入FN第r段第1个DCT系数fnr(1)的相位系数θnr(1)中,公式如(9)、(10)。
如果tempMin(r)<|fnr(1)|<tempAve(r)
θ′nr(1)=θnr(1)+(β×wau(i)-α×tempMin(r)) (9)
如果tempAve(r)<|fnr(1)|<tempMax(r)
θ′nr(1)=θnr(1)+(β×wau(i)-α×tempAve(r)) (10)
其中,θnr(1)为fnr(1)的相位值,θ′nr(1)为嵌入水印后的相位值,由公式(6)可知,负DCT系数fnr(1)中相位值为″π″,即θnr(1)值为″n″。同样根据公式(7)和(8),获取修改的位置key(i);
步骤D7:根据记录的索引值,将嵌入水印后对应的DCT分段系数F′N,F′N合并成DCT低频系数F′L,完成一帧音频的水印嵌入。
所述步骤F具体包括以下步骤:
步骤F1:从含水印音频流中分离出左、右声道音频流,并按照步骤A所述的方法进行分帧,设帧长为A,帧移为B,每帧重叠部分长度为C,共分离出D帧音频流;
步骤F2:运用听觉掩蔽模型,选出E帧小于掩蔽阈值的音频帧,并对所选帧进行DCT变换,选取DCT低频系数;
步骤F3:由于嵌入结束后将嵌入位置映射成密钥key,所以第i个水印信息与第i个密钥,即第i个嵌入位置相对应,水印长度N与密钥长度N相对应。设第i个密钥值为key(i),表示第i个嵌入位置对应索引值。根据公式(6)和(11)提取每帧水印信息,其中c(key(i))表示第i个嵌入位置对应DCT系数。若DCT系数为负数,表示嵌入水印时对应DCT相位为″π″,提取水印″1″;若DCT系数为正数,表示嵌入水印时对应DCT相位为″0″,提取水印″0″;
步骤F4:左声道音频流提取结束后,对右声道音频流重复上述步骤,直到遇到水印结束标志位为止,共提取N比特音频水印信息wex。
结合实验条件与结果对本发明做进一步描述:
(1)实验条件
实验在windows 7操作系统,Intel(R)Celeron(R)CPU B800@1.50GHz,1.50GHz主频,4GB内存环境下运行。实验过程中随机选取9组时长28秒的音视频流样例作为实验测试信号,如表1所示,按照视频类型可以分为:动画视频、黑白视频、普通视频;按照音频类型可以分为:流行音乐、古典音乐、民间音乐。从音视频流中分离出的音频流采样率为44.1kHz,16比特量化位,帧长A为2205样点,帧移B为1000样点,相似度阈值Th为0.76。运用Patchwork方法,将每帧DCT低频系数FL分成两个子集FP和FN,并进行分段,每段长度S为16。
表1混合媒体流样例
媒体流编号 | 音视频流名称 | 视频流类型 | 音频流类型 |
1 | ChibiMaruko | 动画视频 | 流行音乐 |
2 | Chinesefood | 普通视频 | 流行音乐 |
3 | Chaplin | 黑白视频 | 流行音乐 |
4 | Westjourney | 动画视频 | 古典音乐 |
5 | Card | 黑白视频 | 古典音乐 |
6 | Africa | 普通视频 | 古典音乐 |
7 | Penguin | 动画视频 | 民间音乐 |
8 | Monkey | 黑白视频 | 民间音乐 |
9 | Wildlife | 普通视频 | 民间音乐 |
本发明提供的方法与现有的一种嵌入FFT域相位的音频水印方法(简称NDF方法)进行对比。分别对9组测试信号在不可感知性和鲁棒性两个方面进行实验,分析实验结果。
(2)实验分析
a.不可感知性分析
音频水印方法的不可感知性利用信噪比(SNR)来衡量,计算公式如(12),实验结果附图2。
从图4可以看出,本发明方法SNR值整体比NDF方法高,平均信噪比为27.02dB,比NDF方法的平均信噪比提高15.4%左右,表明本发明方法不可感知性优于NDF方法。
表2本发明方法和NDF方法在不同音乐类型下的平均SNR值
表2展示了三种音乐类型下,本发明方法和NDF方法平均信噪比的比较情况,其中,就流行音乐而言,本发明方法比NDF方法提高18.1%左右,在古典音乐和民间音乐方面,本发明方法分别比NDF方法提高15.2%和14.2%左右。实验结果表明,与NDF方法相比,本发明方法在流行音乐下的不可感知性最好,其次是古典音乐,最后是民间音乐。但三种音乐类型下的平均SNR值相差不大,表明本发明方法不受音乐类型的影响。
b.鲁棒性分析
音频水印算法的鲁棒性利用误码率(BER)来衡量,计算公式如(13),实验结果如表3所示。
表3本发明方法和NDF方法在不同攻击下的平均误码率
从表3可看出,本发明方法能抵抗重量化、重采样、幅度、噪声、MP3等一定程度上的攻击,提取水印平均误码率在3%以内。本发明方法在相应攻击下的平均误码率低于NDF方法。其中,重量化和噪声攻击下的平均误码率明显低于NDF方法,表明本发明方法鲁棒性较好。
综上所述,本发明方法利用DCT系数的相位具有较好的容错性和二值性,提供了一种DCT变换下面向相位的音频水印方法,首先将音视频流分离,从视频流中生成的水印信息嵌入到音频流。在嵌入过程中,根据听觉掩蔽模型对音频流选帧,并进行DCT变换选取DCT低频系数,然后运用Patchwork方法将水印信息嵌入DCT低频系数相位中。与现有基于相位的音频水印方案相比,本发明方法通过调整每段DCT低频系数相位值,将水印嵌入选定的DCT相位中,使得在保证音频听觉质量的同时能有效提高鲁棒性。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (8)
1.一种DCT变换下面向相位的音频水印方法,其特征在于,将Patchwork和DCT变换结合,运用基于颜色特征转变的图像相似度算法,从视频流中提取颜色特征序列作为音频水印信息,然后利用DCT相位的二值性,采用Patchwork法将音频水印信息嵌入音频流DCT低频系数的相位中并形成一组表征位置的密钥;
该音频水印嵌入方法具体包括以下几个步骤:
步骤A:输入原始音视频流,分离出音频流和N帧视频流;将音频流左右声道分离,分别对左、右声道音频流进行分帧,分离出D帧音频流,其中,帧长为A,帧移为B,每帧重叠部分长度为C;
步骤B:运用基于颜色特征转变的图像相似度算法,从N帧视频流中生成N比特音频水印信息Wau;
步骤C:运用听觉掩蔽模型,选出E帧小于掩蔽阈值的左声道音频流,对所选帧进行DCT变换,并选取DCT低频系数;
步骤D:运用Patchwork法,将步骤C得到的每帧DCT低频系数FL分成正负两个子集,并按固定长度分别对两个子集进行分段;在每段第1个DCT系数相位嵌入1比特水印,并将嵌入位置映射成密钥key;完成左声道音频流水印的嵌入;
步骤E:对右声道音频流重复步骤C至D,完成右声道音频流水印的嵌入;在嵌入水印后的左、右声道音频流末尾分别嵌入16比特相同的水印结束标志位;最后对嵌入水印的左、右声道音频流进行IDCT变换,将IDCT变换后的结果进行合并重组,生成含水印音频流;
步骤F:根据密钥key从含水印音频流的DCT低频系数相位中提取水印信息。
2.如权利要求1所述的DCT变换下面向相位的音频水印方法,其特征在于,所述步骤B具体包括以下步骤:
步骤B1:设N帧视频流的第一帧为参考帧,第1比特音频水印信息wau(1)=1;
步骤B2:从第二帧开始,运用基于颜色特征转变的图像相似度算法分别计算每一帧与参考帧的相似度,根据计算得到的相似度生成音频水印信息:
其中,wau(i)为第i比特音频水印信息,Th为设定的相似度阈值。
3.如权利要求2所述的DCT变换下面向相位的音频水印方法,其特征在于,相似度阈值Th值为0.76。
4.如权利要求1所述的DCT变换下面向相位的音频水印方法,其特征在于,所述步骤D具体包括以下步骤:
步骤D1:将步骤C得到的每帧DCT低频系数FL分成正负两个子集FP、FN,子集FP存放正DCT系数FP(d),d=1,2,…,p1,其中,p1为正DCT系数的个数,FP(d)为第d个正DCT系数;子集FN存放负DCT系数FN(l),l=1,2,…,p2,其中,p2为负DCT系数的个数,FN(l)为第l个负DCT系数;并记录FP(d)和FN(l)在对应帧中的相应位置;
步骤D2:将FP分成T段,FN分成R段,每段长度均为S:FP={fp1,…,fpt,…,fpT}、FN={fn1,…,fnr,…,fnR},fpt为FP的第t段DCT系数,fnr为FN的第r段DCT系数,t=1,2,…,T,r=1,2,…,R;并在每段第1个DCT系数对应的DCT相位依次嵌入1比特水印,并将嵌入位置映射成密钥key;;
步骤D3:根据记录的索引值,将嵌入水印后对应的DCT分段系数F′P和F′N合并成DCT低频系数F′L,完成一帧音频的水印嵌入。
5.如权利要求4所述的DCT变换下面向相位的音频水印方法,其特征在于,步骤D2中舍弃子集FP、FN中尾段长度不足S的部分。
6.如权利要求4或5所述的DCT变换下面向相位的音频水印方法,其特征在于,S=16。
7.如权利要求4所述的DCT变换下面向相位的音频水印方法,其特征在于,所述步骤D2具体包括以下步骤:
1)当wau(i)=0时,将水印嵌入FP第t段第1个DCT系数fpt(1)的相位系数θpt(1)中,嵌入水印后的相位系数θ′pt(1)有以下两种情况:若tempMin(t)<|fpt(1)|<tempAve(t)则θ′pr(1)=θpt(1)-(β×wau(i)-α×tempMin(t)),若tempAve(t)<|fpt(1)|<tempMax(t)则θ′pt(1)=θpt(1)-(β×wau(i)-α×tempAve(t));其中,tempMax(t)、tempMin(t)、tempAve(t)分别为FP中第t段DCT系数fpt的最大DCT系数绝对值、最小DCT系数绝对值、DCT系数平均绝对值,α为DCT系数参与程度因子,β为水印嵌入强度因子;
2)当wau(i)=1时,将水印嵌入FN第r段第1个DCT系数fnr(1)的相位系数θnr(1)中,嵌入水印后的相位系数θn′r(1)有以下两种情况:若tempMin(r)<|fnr(1)|<tempAve(r)则θn′r(1)=θnr(1)+(β×wau(i)-α×tempMin(r)),若tempAve(r)<|fnr(1)|<tempMax(r)则θ′nr(1)=θnr(1)+(β×wau(i)-α×tempAve(r));其中,tempMax(r)、tempMin(r)、tempAve(r)分别为FN中第r段数据的最大DCT系数绝对值、最小DCT系数绝对值、DCT系数平均绝对值;
3)水印嵌入位置映射而成的密钥key由FL(idx)=FP(S×(t-1)+1)和key(i)=idx得到,其中,key(i)为密钥key中的第i个密钥值。
8.如权利要求1所述的DCT变换下面向相位的音频水印方法,其特征在于,所述步骤F具体包括以下步骤:
步骤F1:从含水印音频流中分离出左、右声道音频流,并按照步骤A所述的方法分别对左、右声道音频流进行分帧;
步骤F2:运用听觉掩蔽模型,选出E帧小于掩蔽阈值的音频流,并对所选帧进行DCT变换,选取DCT低频系数;
步骤F3:对左、右声道音频流,分别根据公式 提取每帧水印信息,直至遇到水印结束标志位位置,其中,c(key(i))表示第i个嵌入位置对应的DCT低频系数步骤,wex(i)表示所提取的第i比特音频水印信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811065808.2A CN109102814B (zh) | 2018-09-13 | 2018-09-13 | 一种dct变换下面向相位的音频水印方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811065808.2A CN109102814B (zh) | 2018-09-13 | 2018-09-13 | 一种dct变换下面向相位的音频水印方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109102814A true CN109102814A (zh) | 2018-12-28 |
CN109102814B CN109102814B (zh) | 2020-12-01 |
Family
ID=64866056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811065808.2A Expired - Fee Related CN109102814B (zh) | 2018-09-13 | 2018-09-13 | 一种dct变换下面向相位的音频水印方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109102814B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030174858A1 (en) * | 2002-03-15 | 2003-09-18 | Jin Ho Kim | Method for embedding and extracting a spatial domain blind watermark using sample expansion |
CN103426142A (zh) * | 2013-08-14 | 2013-12-04 | 中山大学深圳研究院 | 一种基于Arnold变换的Patchwork数字水印编解码方法 |
CN104700840A (zh) * | 2013-12-04 | 2015-06-10 | Vixs系统公司 | 用于音频编码/解码/转码的频率域中水印插入 |
CN104751402A (zh) * | 2015-04-16 | 2015-07-01 | 西安电子科技大学 | 一种鲁棒可逆水印嵌入的方法 |
CN105072453A (zh) * | 2015-07-21 | 2015-11-18 | 河海大学 | 一种面向移动终端的视频水印方法 |
CN105976823A (zh) * | 2016-06-22 | 2016-09-28 | 华中师范大学 | 基于相位编码的自适应音频水印方法及系统 |
CN106878827A (zh) * | 2017-03-22 | 2017-06-20 | 河海大学 | 一种高鲁棒性音视频交叉水印算法 |
US20180144755A1 (en) * | 2016-11-24 | 2018-05-24 | Electronics And Telecommunications Research Institute | Method and apparatus for inserting watermark to audio signal and detecting watermark from audio signal |
-
2018
- 2018-09-13 CN CN201811065808.2A patent/CN109102814B/zh not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030174858A1 (en) * | 2002-03-15 | 2003-09-18 | Jin Ho Kim | Method for embedding and extracting a spatial domain blind watermark using sample expansion |
CN103426142A (zh) * | 2013-08-14 | 2013-12-04 | 中山大学深圳研究院 | 一种基于Arnold变换的Patchwork数字水印编解码方法 |
CN104700840A (zh) * | 2013-12-04 | 2015-06-10 | Vixs系统公司 | 用于音频编码/解码/转码的频率域中水印插入 |
CN104751402A (zh) * | 2015-04-16 | 2015-07-01 | 西安电子科技大学 | 一种鲁棒可逆水印嵌入的方法 |
CN105072453A (zh) * | 2015-07-21 | 2015-11-18 | 河海大学 | 一种面向移动终端的视频水印方法 |
CN105976823A (zh) * | 2016-06-22 | 2016-09-28 | 华中师范大学 | 基于相位编码的自适应音频水印方法及系统 |
US20180144755A1 (en) * | 2016-11-24 | 2018-05-24 | Electronics And Telecommunications Research Institute | Method and apparatus for inserting watermark to audio signal and detecting watermark from audio signal |
CN106878827A (zh) * | 2017-03-22 | 2017-06-20 | 河海大学 | 一种高鲁棒性音视频交叉水印算法 |
Non-Patent Citations (4)
Title |
---|
H.KII 等: ""The digital watermarking method by using both patchwork and DCT"", 《PROCEEDINGS IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA COMPUTING AND SYSTEMS》 * |
IN-KWON YEO 等: ""Modified Patchwork Algorithm: a novel audio watermarking scheme"", 《PROCEEDINGS INTERNATIONAL CONFERENCE ON INFORMATION TECHNOLOGY: CODING AND COMPUTING》 * |
XIANG-YANG WANG 等: ""A Novel Synchronization Invariant Audio Watermarking Scheme Based on DWT and DCT"", 《IEEE TRANSACTIONS ON SIGNAL PROCESSING》 * |
甘霖 等: ""基于变换域的Patchwork水印改进算法"", 《成都信息工程大学学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN109102814B (zh) | 2020-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cox et al. | Electronic watermarking: the first 50 years | |
Lei et al. | Robust SVD-based audio watermarking scheme with differential evolution optimization | |
CN111091841A (zh) | 一种基于深度学习的身份认证音频水印算法 | |
US20050273617A1 (en) | Robust recognizer of perceptually similar content | |
CN113257259A (zh) | 基于神经网络的安全音频水印加注 | |
CN108682425B (zh) | 一种基于恒定水印的鲁棒数字音频水印嵌入系统 | |
Dhar et al. | Digital watermarking scheme based on fast Fourier transformation for audio copyright protection | |
Wang et al. | Centroid-based semi-fragile audio watermarking in hybrid domain | |
CN111292221A (zh) | 一种安全鲁棒的大容量图像隐写方法 | |
Dittmann et al. | Combined video and audio watermarking: Embedding content information in multimedia data | |
EP1459555A1 (en) | Quantization index modulation (qim) digital watermarking of multimedia signals | |
Zamani et al. | An artificial-intelligence-based approach for audio steganography | |
CN114999502B (zh) | 基于自适应字分帧的语音内容水印生成、嵌入方法、语音内容的完整性认证及篡改定位方法 | |
Kondo | Multimedia Information Hiding Technologies and Methodologies for Controlling Data | |
CN109102814A (zh) | 一种dct变换下面向相位的音频水印方法 | |
Kekre et al. | Increasing the capacity of the cover audio signal by using multiple LSBs for information hiding | |
Dhar et al. | A DWT-DCT-based audio watermarking method using singular value decomposition and quantization | |
Su et al. | Window switching strategy based semi-fragile watermarking for MP3 tamper detection | |
Chowdhury | A Robust Audio Watermarking In Cepstrum Domain Composed Of Sample's Relation Dependent Embedding And Computationally Simple Extraction Phase | |
Luo et al. | Dual-domain audio watermarking algorithm based on flexible segmentation and adaptive embedding | |
Tegendal | Watermarking in audio using deep learning | |
Tsai et al. | Adaptive signal-dependent audio watermarking based on human auditory system and neural networks | |
Chen et al. | A multipurpose audio watermarking scheme for copyright protection and content authentication | |
Joshi et al. | Watermarking of audio signals using iris data for protecting intellectual property rights of multiple owners | |
CN114630130A (zh) | 一种基于深度学习的换脸视频溯源方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201201 |