CN109102814B

CN109102814B - 一种dct变换下面向相位的音频水印方法

Info

Publication number: CN109102814B
Application number: CN201811065808.2A
Authority: CN
Inventors: 严勤; 汪新园; 肖丽莎
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2018-09-13
Filing date: 2018-09-13
Publication date: 2020-12-01
Anticipated expiration: 2038-09-13
Also published as: CN109102814A

Abstract

本发明公开了一种DCT变换下面向相位的音频水印方法，以音视频媒体为原始载体，将Patchwork和DCT变换结合然后利用DCT相位的二值性，采用Patchwork法将该水印信息嵌入音频信号DCT低频系数的相位中并形成一组表征位置的密钥。本发明方法在提高音频水印鲁棒性的同时保持较好的不可感知性，可广泛应用于音频保护场景。

Description

一种DCT变换下面向相位的音频水印方法

技术领域

本发明涉及一种DCT变换下面向相位的音频水印方法，具体涉及一种基于相位和Patchwork的音频水印算法，属于数字水印技术领域，。

背景技术

目前，保护版权的主要方法有加密技术和数字水印技术。加密技术是指运用加密算法将原始载体数据转换成常人无法理解的一串乱码，接收者收到信号后再使用解密算法还原信号。虽然加密技术能够保护数据安全，但只适用于一部分数据，加密数据解密成功后与原始载体数据相同且不再具备版权保护功能，因此加密技术不能深入解决盗版侵权问题。针对加密技术存在的不足，因此引入数字水印技术优化了上述问题，数字水印技术是指运用水印算法将水印信息嵌入原始载体(如文档、图片、音频、视频)中。该技术既不会影响原始载体的使用，也不易被人体的感官系统(如视觉或听觉系统)察觉。通过这些隐藏在原始载体中的水印信息，可以判断原始载体数据是否被篡改，其内容信息是否完整，数字多媒体资源的使有者是否存在盗版侵权问题。

起初数字水印概念的提出主要是为了解决盗版侵权问题，如IBM公司研发的具有版权保护功能的“数字图书馆”软件。随着科技的发展和对数字水印技术的深入研究，该技术除了用于版权保护、内容认证以外，还可以用于内容标注，交易追踪，使用控制，广播检测，隐蔽通信，数字指纹，标题与注释，篡改提示，商务交易中的票据防伪，媒体标记与信息隐藏，隐藏通信及其对抗等。如将照片的拍摄时间与地点等标注信息嵌入图像进行保存；DVD防拷贝系统；数字档案访问控制；根据不同的节目内容在节目信号中嵌入不同的水印信息，统计节目的收视率、广告的播出次数与时长等。然而数字水印技术存在其自身平衡性问题，即不可感知性和鲁棒性矛盾，不可感知性要求越高则鲁棒性随之降低，反之鲁棒性随之提高，所以在实际使用时应根据需求对两者进行权衡和取舍。

音频水印方法种类较多，根据嵌入域的不同，可分为时域和变换域音频水印方案。时域音频水印方案直接将水印嵌入原始音频载体中。其典型方法包括回声隐藏法和最低有效位法。时域音频水印方案具有易实现、水印容量大等优点，但其同样存在鲁棒性、安全性较差等缺点。针对上述不足，变换域音频水印方法改进了这些问题，其将水印信息嵌入音频的变换域系数中。经典变换域水印方法包括离散傅里叶变换(Discrete FourierTransform,DFT)、离散余弦变换(Discrete Cosine Transform,DCT)和离散小波变换(Discrete Wavelet Transform,DWT)音频水印嵌入方案。这类算法实现过程较为复杂，但水印算法鲁棒性较强，安全性较高。变换域水印方法通过选择合适的嵌入位置、嵌入强度和嵌入方式来嵌入水印信息，这就要求该类算法充分考虑数字水印自身的平衡性问题。如何在权衡不可感知性和鲁棒性的基础上选择恰当的嵌入位置、嵌入强度以及嵌入方式是变换域水印算法研究中的一个热点问题。

发明内容

针对现有技术中存在的问题，本发明针对变换域音频水印方法，提供一种DCT域下面向相位的音频水印方法，与现有基于相位的音频水印方案相比，该方法通过调整每段DCT低频系数相位值，将水印嵌入选定的DCT相位中，使得在保证音频听觉质量的同时能有效提高鲁棒性，达到音频版权保护的目的。

本发明为解决上述技术问题采用以下技术方案：

本发明提供一种DCT变换下面向相位的音频水印方法，将Patchwork和DCT变换结合，运用基于颜色特征转变的图像相似度算法，从视频流中提取颜色特征序列作为音频水印信息，然后利用DCT相位的二值性，采用Patchwork法将音频水印信息嵌入音频流DCT低频系数的相位中并形成一组表征位置的密钥。

该音频水印嵌入方法具体包括以下几个步骤：

步骤A：输入原始音视频流，分离出音频流和N帧视频流；将音频流左右声道分离，分别对左、右声道音频流进行分帧，分离出D帧音频流，其中，帧长为A，帧移为B，每帧重叠部分长度为C；

步骤B：运用基于颜色特征转变的图像相似度算法，从N帧视频流中生成N比特音频水印信息W_au；

步骤C：运用听觉掩蔽模型，选出E帧小于掩蔽阈值的左声道音频流，对所选帧进行DCT变换，并选取DCT低频系数；

步骤D：运用Patchwork法，将步骤C得到的每帧DCT低频系数F_L分成正负两个子集，并按固定长度分别对两个子集进行分段；在每段第1个DCT系数相位嵌入1比特水印，并将嵌入位置映射成密钥key；完成左声道音频流水印的嵌入；

步骤E：对右声道音频流重复步骤C至D，完成右声道音频流水印的嵌入；在嵌入水印后的左、右声道音频流末尾分别嵌入16比特相同的水印结束标志位；最后对嵌入水印的左、右声道音频流进行IDCT变换，将IDCT变换后的结果进行合并重组，生成含水印音频流；

步骤F：根据密钥key从含水印音频流的DCT低频系数相位中提取水印信息。

作为本发明的进一步优化方案，所述步骤B具体包括以下步骤：

步骤B1：设N帧视频流的第一帧为参考帧，第1比特音频水印信息w_au(1)＝1；

步骤B2：从第二帧开始，运用基于颜色特征转变的图像相似度算法分别计算每一帧与参考帧的相似度，根据计算得到的相似度生成音频水印信息：

其中，w_au(i)为第i比特音频水印信息，Th为设定的相似度阈值。

作为本发明的进一步优化方案，相似度阈值Th值为0.76。

作为本发明的进一步优化方案，所述步骤D具体包括以下步骤：

步骤D1：将步骤C得到的每帧DCT低频系数F_L分成正负两个子集F_P、F_N，子集F_P存放正DCT系数F_P(d),d＝1,2,...,p1，其中，p1为正DCT系数的个数，F_P(d)为第d个正DCT系数；子集F_N存放负DCT系数F_N(l),l＝1,2,...,p2，其中，p2为负DCT系数的个数，F_N(l)为第l个负DCT系数；并记录F_P(d)和F_N(l)在对应帧中的相应位置；

步骤D2：将F_P分成T段，F_N分成R段，每段长度均为S：F_P＝{f_p1,...,f_pt,...,f_pT}、F_N＝{f_n1,...,f_nr,...,f_nR}，f_pt为F_P的第t段DCT系数，f_nr为F_N的第r段DCT系数，t＝1,2,...,T,r＝1,2,...,R；并在每段第1个DCT系数对应的DCT相位依次嵌入1比特水印，并将嵌入位置映射成密钥key；

步骤D3：根据记录的索引值，将嵌入水印后对应的DCT分段系数F_P ^′和F_N ^′合并成DCT低频系数F_L ^′，完成一帧音频的水印嵌入。

作为本发明的进一步优化方案，步骤D2中舍弃子集F_P、F_N中尾段长度不足S的部分。

作为本发明的进一步优化方案，S＝16。

作为本发明的进一步优化方案，所述步骤D2具体包括以下步骤：

1)当w_au(i)＝0时，将水印嵌入F_P第t段第1个DCT系数f_pt(1)的相位系数θ_pt(1)中，嵌入水印后的相位系数θ′_pt(1)有以下两种情况：若tempMin(t)<|f_pt(1)|<tempAve(t)则θ′_pt(1)＝θ_pt(1)-(β×w_au(i)-α×tempMin(t))，若tempAve(t)<|f_pt(1)|<tempMax(t)则θ′_pt(1)＝θ_pt(1)-(β×w_au(i)-α×tempAve(t))；其中，tempMax(t)、tempMin(t)、tempAve(t)分别为F_P中第t段DCT系数f_pt的DCT系数绝对值的最大值、DCT系数绝对值的最小值、DCT系数平均绝对值，α为DCT系数参与程度因子，β为水印嵌入强度因子；

2)当w_au(i)＝1时，将水印嵌入F_N第r段第1个DCT系数f_nr(1)的相位系数θ_nr(1)中，嵌入水印后的相位系数θ_n ^′ _r(1)有以下两种情况：若tempMin(r)<|f_nr(1)|<tempAve(r)则θ′_nr(1)＝θ_nr(1)+(β×w_au(i)-α×tempMin(r))，若tempAve(r)<|f_nr(1)|<tempMax(r)则θ′_nr(1)＝θ_nr(1)+(β×w_au(i)-α×tempAve(r))；其中，tempMax(r)、tempMin(r)、tempAve(r)分别为F_N中第r段数据的DCT系数绝对值的最大值、DCT系数绝对值的最小值、DCT系数平均绝对值；

3)水印嵌入位置映射而成的密钥key由F_L(idx)＝F_P(S×(t-1)+1)和key(i)＝idx得到，其中，key(i)为密钥key中的第i个密钥值。

作为本发明的进一步优化方案，所述步骤F具体包括以下步骤：

步骤F1：从含水印音频流中分离出左、右声道音频流，并按照步骤A所述的方法分别对左、右声道音频流进行分帧；

步骤F2：运用听觉掩蔽模型，选出E帧小于掩蔽阈值的音频帧，并对所选帧进行DCT变换，选取DCT低频系数；

步骤F3：对左、右声道音频流，分别根据公式

提取每帧水印信息，直至遇到水印结束标志位位置，其中，c(key(i))表示第i个嵌入位置对应的DCT低频系数，w_ex(i)表示所提取的第i比特音频水印信息。

本发明采用以上技术方案与现有技术相比，具有以下技术效果：与现有基于FFT域相位音频水印方案相比，本发明提供的一种DCT变换下面向相位的音频水印方法，在DCT域内采用Patchwork方法，根据分段后DCT变换域系数统计特性在相位系数嵌入水印信息，在保证一定不可感知性的条件下，具有更好的抗攻击性和稳定性。

附图说明

图1为本发明中音频水印嵌入流程图；

图2为本发明中音频水印提取流程图；

图3为本发明一帧音频数据嵌入DCT相位流程图；

图4为本发明方法与对比方法SNR值比较图。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解的是，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

下面结合附图对本发明的技术方案做进一步的详细说明：

本发明一种DCT变换下面向相位的音频水印方法，首先运用基于颜色特征转变的图像相似度算法，从视频流中提取颜色特征序列作为音频水印信息，然后利用DCT相位的二值性，采用Patchwork法将该水印信息嵌入音频信号DCT低频系数的相位中并形成一组表征位置的密钥。水印提取时，根据密钥从DCT低频系数的相位中提取水印信息。

本发明的一种DCT变换下面向相位的音频水印方法，如图1和2所示，具体包括以下步骤：

步骤A：输入原始音视频流，分离出音频流和N帧视频流。将音频流左右声道分离，分别对左、右声道音频流进行分帧。设帧长为A，帧移为B，每帧重叠部分长度为C，共分离出D帧音频流；

步骤C：运用听觉掩蔽模型，选出E帧小于掩蔽阈值的左声道音频帧，并对所选帧进行DCT变换，选取DCT低频系数；

步骤D：运用Patchwork法，将每帧的DCT低频系数F_L分成正负两个子集，并以16个数据为单位进行分段，在每段第1个DCT系数相位嵌入1比特水印，并将嵌入位置映射成密钥key；

步骤E：左声道音频流水印嵌入完成后，对右声道音频流重复步骤C至D，嵌入完成后。再嵌入16比特水印结束标志位。最后对嵌入水印的左、右声道音频流进行IDCT变换，将二者合并重组、生成含水印音频流；

所述步骤B具体包括以下步骤：

步骤B1：设N帧视频流的第一帧为参考帧，根据公式(2)得到第一比特音频水印信息；

步骤B2：从第二帧开始，依次使用基于颜色特征转变的图像相似度算法生成水印信息：首先计算每帧相似度，根据公式(1)比较每帧相似度与相似度阈值Th的大小，若第i帧相似度大于相似度阈值Th，则设w_au(i)为"1"，反之设w_au(i)为"0"，其中相似度阈值Th值为0.76；

步骤B3：生成N比特用于嵌入音频的水印信息w_au：

w_au(1)＝1 (2)

其中，w_au(i)为第i比特音频水印信息。

所述步骤D具体包括以下步骤(如图3所示)：

步骤D1：将步骤C所选的每帧音频的DCT低频系数F_L分成正负两个子集F_P、F_N，子集F_P存放正DCT系数F_P(d),(d＝1,2,...,p1)，其中p1为正DCT系数的个数，F_P(d)代表第d个正DCT系数；子集F_N存放负DCT系数F_N(l),(l＝1,2,...,p2)，其中p2为负DCT系数的个数，F_N(l)代表第l个负DCT系数；并记录相应索引值(F_P(d)和F_N(l)在当前帧中的位置)以便在音频流重组时使用；

步骤D2：将F_P分成T段，F_N分成R段，每段长度均为S，设F_P＝{f_p1,...,f_pt,...,f_pT}，F_N＝{f_n1,...,f_nr,...,f_nR}，得到F_P的第t段DCT系数f_pt和F_N的第r段DCT系数f_nr，其中t＝1,2,...,T,r＝1,2,...,R,S＝16，并在每段第1个DCT系数对应的DCT相位依次嵌入1比特水印。设F_P中第t段DCT系数f_pt的DCT系数绝对值的最大值为tempMax(t)，DCT系数绝对值的最小值为tempMin(t)、DCT系数平均绝对值为tempAve(t)，计算公式如(3)。负DCT系数集合采用同样方法处理，得到F_N中第r段数据的DCT系数绝对值的最大值为tempMax(r)，DCT系数绝对值的最小值为tempMin(r)、DCT系数平均绝对值为tempAve(r)；

tempMax(t)＝max(|f_pt(1)|,|f_pt(2)|,...,|f_pt(S)|)

tempMin(t)＝min(|f_pt(1)|,|f_pt(2)|,...,|f_pt(S)|) (3)

tempAve(t)＝mean(|f_pt(1)|,|f_pt(2)|,...,|f_pt(S)|)

步骤D3：为了防止嵌入水印后的DCT系数值改变过大而影响不可感知性，需保证每一段数据修改相位后的DCT系数绝对值不超过该段最大值，且不小于该段最小值，所以在嵌入水印前，需比较F_P的第t段第1个DCT系数f_pt(1)与tempMax(t)，tempMin(t)，tempAve(t)的大小以及F_N第r段第1个DCT系数f_nr(1)与tempMax(r)，tempMin(r)，tempAve(r)的大小，判断f_pt(1)和f_nr(1)所在区间，修改相应的相位系数，使得修改后的f_pt(1)和f_nr(1)依然在原来区间内；

步骤D4：引入DCT系数参与程度因子α，水印嵌入强度因子β，水印信息w_au，其中w_au(i)∈(0,1)；

步骤D5：当w_au(i)＝0时，将水印嵌入F_P第t段第1个DCT系数f_pt(1)的相位系数θ_pt(1)中，公式如(4)、(5)。

如果tempMin(t)<|f_pt(1)|<tempAve(t)

θ′_pt(1)＝θ_pt(1)-(β×w_au(i)-α×tempMin(t)) (4)

如果tempAve(t)<|f_pt(1)|<tempMax(t)

θ′_pt(1)＝θ_pt(1)-(β×w_au(i)-α×tempAve(t)) (5)

其中，θ_pt(1)为f_pt(1)的相位值，θ′_pt(1)为嵌入水印后的相位值，由公式(6)可知，正DCT系数f_pt(1)中相位值为"0"，即θ_pt(1)值为"0"。根据公式(7)和(8)，获取修改的位置key(i)；

F_L(idx)＝F_P(S×(t-1)+1) (7)

key(i)＝idx (8)

步骤D6：当w_au(i)＝1时，将水印嵌入F_N第r段第1个DCT系数f_nr(1)的相位系数θ_nr(1)中，公式如(9)、(10)。

如果tempMin(r)<|f_nr(1)|<tempAve(r)

θ′_nr(1)＝θ_nr(1)+(β×w_au(i)-α×tempMin(r)) (9)

如果tempAve(r)<|f_nr(1)|<tempMax(r)

θ′_nr(1)＝θ_nr(1)+(β×w_au(i)-α×tempAve(r)) (10)

其中，θ_nr(1)为f_nr(1)的相位值，θ′_nr(1)为嵌入水印后的相位值，由公式(6)可知，负DCT系数f_nr(1)中相位值为"π"，即θ_nr(1)值为"π"。同样根据公式(7)和(8)，获取修改的位置key(i)；

步骤D7：根据记录的索引值，将嵌入水印后对应的DCT分段系数F′_P，F′_N合并成DCT低频系数F′_L，完成一帧音频的水印嵌入。

所述步骤F具体包括以下步骤：

步骤F1：从含水印音频流中分离出左、右声道音频流，并按照步骤A所述的方法进行分帧，设帧长为A，帧移为B，每帧重叠部分长度为C，共分离出D帧音频流；

步骤F3：由于嵌入结束后将嵌入位置映射成密钥key，所以第i个水印信息与第i个密钥，即第i个嵌入位置相对应，水印长度N与密钥长度N相对应。设第i个密钥值为key(i)，表示第i个嵌入位置对应索引值。根据公式(6)和(11)提取每帧水印信息，其中c(key(i))表示第i个嵌入位置对应DCT系数。若DCT系数为负数，表示嵌入水印时对应DCT相位为"π"，提取水印"1"；若DCT系数为正数，表示嵌入水印时对应DCT相位为"0"，提取水印"0"；

步骤F4：左声道音频流提取结束后，对右声道音频流重复上述步骤，直到遇到水印结束标志位为止，共提取N比特音频水印信息w_ex。

结合实验条件与结果对本发明做进一步描述：

(1)实验条件

实验在windows 7操作系统，Intel(R)Celeron(R)CPU B800@1.50GHz，1.50GHz主频，4GB内存环境下运行。实验过程中随机选取9组时长28秒的音视频流样例作为实验测试信号，如表1所示，按照视频类型可以分为：动画视频、黑白视频、普通视频；按照音频类型可以分为：流行音乐、古典音乐、民间音乐。从音视频流中分离出的音频流采样率为44.1kHz，16比特量化位，帧长A为2205样点，帧移B为1000样点，相似度阈值Th为0.76。运用Patchwork方法，将每帧DCT低频系数F_L分成两个子集F_P和F_N，并进行分段，每段长度S为16。

表1混合媒体流样例

媒体流编号	音视频流名称	视频流类型	音频流类型
				1	ChibiMaruko	动画视频	流行音乐
2	Chinesefood	普通视频	流行音乐
				3	Chaplin	黑白视频	流行音乐
4	Westjourney	动画视频	古典音乐
				5	Card	黑白视频	古典音乐
6	Africa	普通视频	古典音乐
				7	Penguin	动画视频	民间音乐
8	Monkey	黑白视频	民间音乐
				9	Wildlife	普通视频	民间音乐

本发明提供的方法与现有的一种嵌入FFT域相位的音频水印方法(简称NDF方法)进行对比。分别对9组测试信号在不可感知性和鲁棒性两个方面进行实验，分析实验结果。

(2)实验分析

a.不可感知性分析

音频水印方法的不可感知性利用信噪比(SNR)来衡量，计算公式如(12)，实验结果附图2。

从图4可以看出，本发明方法SNR值整体比NDF方法高，平均信噪比为27.02dB，比NDF方法的平均信噪比提高15.4％左右，表明本发明方法不可感知性优于NDF方法。

表2本发明方法和NDF方法在不同音乐类型下的平均SNR值

表2展示了三种音乐类型下，本发明方法和NDF方法平均信噪比的比较情况，其中，就流行音乐而言，本发明方法比NDF方法提高18.1％左右，在古典音乐和民间音乐方面，本发明方法分别比NDF方法提高15.2％和14.2％左右。实验结果表明，与NDF方法相比，本发明方法在流行音乐下的不可感知性最好，其次是古典音乐，最后是民间音乐。但三种音乐类型下的平均SNR值相差不大，表明本发明方法不受音乐类型的影响。

b.鲁棒性分析

音频水印算法的鲁棒性利用误码率(BER)来衡量，计算公式如(13)，实验结果如表3所示。

表3本发明方法和NDF方法在不同攻击下的平均误码率

从表3可看出，本发明方法能抵抗重量化、重采样、幅度、噪声、MP3等一定程度上的攻击，提取水印平均误码率在3％以内。本发明方法在相应攻击下的平均误码率低于NDF方法。其中，重量化和噪声攻击下的平均误码率明显低于NDF方法，表明本发明方法鲁棒性较好。

综上所述，本发明方法利用DCT系数的相位具有较好的容错性和二值性，提供了一种DCT变换下面向相位的音频水印方法，首先将音视频流分离，从视频流中生成的水印信息嵌入到音频流。在嵌入过程中，根据听觉掩蔽模型对音频流选帧，并进行DCT变换选取DCT低频系数，然后运用Patchwork方法将水印信息嵌入DCT低频系数相位中。与现有基于相位的音频水印方案相比，本发明方法通过调整每段DCT低频系数相位值，将水印嵌入选定的DCT相位中，使得在保证音频听觉质量的同时能有效提高鲁棒性。

以上所述，仅为本发明中的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉该技术的人在本发明所揭露的技术范围内，可理解想到的变换或替换，都应涵盖在本发明的包含范围之内，因此，本发明的保护范围应该以权利要求书的保护范围为准。

Claims

1.一种DCT变换下面向相位的音频水印方法，其特征在于，将Patchwork和DCT变换结合，运用基于颜色特征转变的图像相似度算法，从视频流中提取颜色特征序列作为音频水印信息，然后利用DCT相位的二值性，采用Patchwork法将音频水印信息嵌入音频流DCT低频系数的相位中并形成一组表征位置的密钥；

该音频水印嵌入方法具体包括以下几个步骤：

2.如权利要求1所述的DCT变换下面向相位的音频水印方法，其特征在于，所述步骤B具体包括以下步骤：

3.如权利要求2所述的DCT变换下面向相位的音频水印方法，其特征在于，相似度阈值Th值为0.76。

4.如权利要求1所述的DCT变换下面向相位的音频水印方法，其特征在于，所述步骤D具体包括以下步骤：

步骤D1：将步骤C得到的每帧DCT低频系数F_L分成正负两个子集F_P、F_N，子集F_P存放正DCT系数F_P(d)，d＝1，2，...，p1，其中，p1为正DCT系数的个数，F_P(d)为第d个正DCT系数；子集F_N存放负DCT系数F_N(l)，l＝1，2，...，p2，其中，p2为负DCT系数的个数，F_N(l)为第l个负DCT系数；并记录F_P(d)和F_N(l)在对应帧中的相应位置；

步骤D2：将F_P分成T段，F_N分成R段，每段长度均为S：F_P＝{f_p1，...，f_pt，...，f_pT}、F_N＝{f_n1，...，f_nr，...，f_nR}，f_pt为F_P的第t段DCT系数，f_nr为F_N的第r段DCT系数，t＝1，2，...，T，r＝1，2，...，R；并在每段第1个DCT系数对应的DCT相位依次嵌入1比特水印，并将嵌入位置映射成密钥key；

步骤D3：根据记录的索引值，将嵌入水印后对应的DCT分段系数F′_P和F′_N合并成DCT低频系数F′_L，完成一帧音频的水印嵌入。

5.如权利要求4所述的DCT变换下面向相位的音频水印方法，其特征在于，步骤D2中舍弃子集F_P、F_N中尾段长度不足S的部分。

6.如权利要求4或5所述的DCT变换下面向相位的音频水印方法，其特征在于，S＝16。

7.如权利要求4所述的DCT变换下面向相位的音频水印方法，其特征在于，所述步骤D2具体包括以下步骤：

1)当w_au(i)＝0时，将水印嵌入F_P第t段第1个DCT系数f_pt(1)的相位系数θ_pt(1)中，嵌入水印后的相位系数θ′_pt(1)有以下两种情况：若tempMin(t)＜|f_pt(1)|＜tempAve(t)则θ′_pt(1)＝θ_pt(1)-(β×w_au(i)-α×tempMin(t))，若tempAve(t)＜|f_pt(1)|＜tempMax(t)则θ′_pt(1)＝θ_pt(1)-(β×w_au(i)-α×tempAve(t))；其中，tempMax(t)、tempMin(t)、tempAve(t)分别为F_P中第t段DCT系数f_pt的DCT系数绝对值的最大值、DCT系数绝对值的最小值、DCT系数平均绝对值，α为DCT系数参与程度因子，β为水印嵌入强度因子；

2)当w_au(i)＝1时，将水印嵌入F_N第r段第1个DCT系数f_nr(1)的相位系数θ_nr(1)中，嵌入水印后的相位系数θ′_nr(1)有以下两种情况：若tempMin(r)＜|f_nr(1)|＜tempAve(r)则θ′_nr(1)＝θ_nr(1)+(β×w_au(i)-α×tempMin(r))，若tempAve(r)＜|f_nr(1)|＜tempMax(r)则θ′_nr(1)＝θ_nr(1)+(β×w_au(i)-α×tempAve(r))；其中，tempMax(r)、tempMin(r)、tempAve(r)分别为F_N中第r段数据的DCT系数绝对值的最大值、DCT系数绝对值的最小值、DCT系数平均绝对值；

8.如权利要求1所述的DCT变换下面向相位的音频水印方法，其特征在于，所述步骤F具体包括以下步骤：

步骤F2：运用听觉掩蔽模型，选出E帧小于掩蔽阈值的音频流，并对所选帧进行DCT变换，选取DCT低频系数；

步骤F3：对左、右声道音频流，分别根据公式