CN106878827B

CN106878827B - 一种高鲁棒性音视频交叉水印算法

Info

Publication number: CN106878827B
Application number: CN201710173321.5A
Authority: CN
Inventors: 严勤; 潘阳续; 常红霞
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2017-03-22
Filing date: 2017-03-22
Publication date: 2019-08-06
Anticipated expiration: 2037-03-22
Also published as: CN106878827A

Abstract

本发明公开了一种高鲁棒性音视频交叉水印算法，其特征是，解码视频码流，利用视频的帧间相关性生成视频水印；解码音频码流，利用音频码流的低通幅值统计特性生成音频水印；通过视觉显著模型将音频水印嵌入到视频关键帧中；通过叠加的方式将视频水印嵌入到音频码流的低频系数中。本发明所达到的有益效果：1)利用音视频码流特征生成水印，且水印都是在载体视频解码过程中实时动态生成的，嵌入水印的不确定性提高了算法的安全性；2)选择在音频码流和视频码流中均嵌入水印，即使其中之一码流受到破坏导致水印无法提取时，仍可以从另一码流中提取水印，更加全面有效地保护了载体视频，大大提高了水印的鲁棒性。

Description

一种高鲁棒性音视频交叉水印算法

技术领域

本发明涉及一种视频水印方法，具体涉及一种高鲁棒性音视频交叉水印算法。

背景技术

互联网的发展使得人们可以轻易获取各种数字资源(音频、视频、文本等)，数字水印作为一种鲁棒性和不可见性兼备的信息隐藏技术可以很好的保护各种多媒体数字资源的版权，维护正常的市场秩序，打击非法传播、盗版等各种不良行为。

数字水印技术分为嵌入和提取两个过程，嵌入过程将具有版权认证信息的图像、文字等通过数字内嵌的方法隐藏在音频、文本、视频等多媒体数字资源中，使其成为原始载体数据的一部分；提取则是嵌入的逆过程，从包含水印的载体数据中将水印提取出来，从而确定信息内容完整性、版权拥有者、真伪鉴别等。如今，数字水印技术在版权保护、数字内容篡改鉴定、视频监控、视频会议等方面都有着广泛的应用。

如今，常见的多媒体数据都至少包含视频和音频两部分，而且很多应用领域都是将二者作为一个整体进行处理。然而不法分子对多媒体数字作品的拷贝、篡改等可能只是针对其中视频序列、音频或字幕的某一部分进行，破坏数字作品的完整性、使音视频在时空上变得不同步，影响使用效果。因此，仅针对某一种媒体数据的水印算法并不能保证其包含的另外媒体数据的安全或是满足更高级别的版权要求。

多媒体数据中包含的不同数据内容(视频、音频、字幕)在时间和空间上有很强的关联性，彼此制约。现有的视频水印算法多数都是只对视频码流做嵌入提取处理，没有利用音视频之间的关联性，或是根本就没有考虑到音频数据的存在。如果可以将音视频数据之间的关联性应用到视频水印算法的研究中，会使得视频水印算法研究工作取得更大的进步，版权保护和数字内容鉴定将取得更好的效果。

发明内容

为解决现有技术的不足，本发明的目的在于提供一种高鲁棒性音视频交叉水印算法，将音频低通幅值统计特征作为水印嵌入到视频码流中，视频帧间相关性特征作为水印嵌入到音频码流中，有效地实现了音视频码流之间的交叉保护，即使是音频码流、视频码流其中之一被破坏导致水印无法提取，仍可以从另一码流中提取水印完成版权保护，且对各种常见的音视频攻击具有较强的鲁棒性。

为了实现上述目标，本发明采用如下的技术方案：

一种高鲁棒性音视频交叉水印算法，其特征是，包括如下步骤：

步骤1)解码载体视频，获取音频码流和视频码流；

步骤2)利用音频码流的低通幅值统计特性，生成待嵌的音频水印文件；

步骤3)利用视频码流的帧间相关性特征生成待嵌的视频水印文件；

步骤4)对视频的关键帧进行显著性分析，将音频水印W_a(i)量化嵌入至其亮度分量非显著区域离散余弦变换的直流系数上；

步骤5)对音频帧进行离散小波变换，将扩频之后的视频水印W_v(i)通过叠加的方式嵌入到其低频系数中；

步骤6)以T_a帧为周期重复嵌入多次音频水印，以T_v帧为周期重复嵌入多次视频水印；当所有水印嵌入完成，重新编码输出含有水印的视频载体；

步骤7)解码包含水印的视频载体，得到已嵌水印的音频码流和视频码流；

步骤8)对包含水印的视频帧进行显著区域划分，根据量化索引调制的特点，从亮度分量的DCT直流系数中提取视频水印；

步骤9)对包含水印的音频帧进行离散小波变换，通过相应的逆过程从低频系数中提取音频水印。

进一步地，所述步骤2)包括如下步骤：

步骤21)根据A(i)＝A_l(i)+A_r(i)，对左声道码流A_l(i)和右声道码流A_r(i)处理得到A(i)；

步骤22)对音频数据A(i)进行分帧操作，且帧与帧之间没有重叠，并对分帧后的音频数据做低通滤波后得到A'_m(i)，m表示第m帧；

步骤23)对滤波后的音频帧数据A'_m(i)求均值μ_m和标准差σ_m，并根据对其进行二进制编码得到音频水印W_a(i)。

进一步地，所述步骤22)中低通滤波采用500HZ。

进一步地，所述步骤3)具体包括如下步骤：

步骤31)在视频帧序列中依次选择两个相邻的视频帧，对其Y分量做绝对差值运算得到V'(i,j)；

步骤32)对所有的V'(i,j)进行分块降采样处理，按顺序分块成K×L块；

步骤33)对分成的K×L块中的每块采样信息做均值处理，对于每块采样信息合并每块中的均值得到粗略的绝对差值图像其中Δ(m₁,n₁)表示第m₁×n₁个采样信息数据，X和Y表示分块后每块的大小，Q_v(k,l)表示对应第k×l块的最终得到的绝对差值图像；

步骤34)对得到的绝对差值图像Q_v(k,l)进行二进制编码，从而得到水印比特。

进一步地，所述步骤34)具体步骤如下：

a)利用密钥随机生成K×L大小的0-1均值分布矩阵R(k,l)；

b)求得每个随机矩阵的均值Δ，并从R(k,l)中减去该值得到R′(k,l)。

c)对Q_v(k,l)和R'(k,l)进行如下处理，

d)选取合适的阈值th对H(k,l)进行分类二进制编码，求得最终的二进制视频水印

进一步地，所述步骤4)具体包括如下步骤：

步骤41)对视频关键帧采用Itti视觉显著模型进行显著性分析，划分显著区域，通过注意焦点转移策略选取前三个圆形视觉显著区域；

步骤42)对关键帧亮度分量进行8×8分块DCT变换，对步骤41)中得到的显著区域以外的分块，求其DCT直流系数DCT₀(m₀,n₀)，m₀×n₀表示8×8分块后对应的分块；

步骤43)对直流系数DCT₀(m₀,n₀)采用二进制奇偶量化调制算法，以固定步长Δ将其量化至不同的索引区间，实现水印的嵌入，使其满足W_a(i)＝floor(DCT₀(m₀,n₀)/Δ)mod2；

若当前直流系数已经满足上述公式，则调整后的DCT系数为：DCT_w(m₀,n₀)＝floor(DCT₀(m₀,n₀)/Δ)×Δ+Δ/2；

否则，根据下述公式对系数做调整：

步骤44)将量化后的系数作为新的直流系数，进行逆DCT变换，得到嵌入水印后的视频帧。

进一步地，所述步骤5)具体包括如下步骤：

步骤51)视频水印预处理：对W_v(k,l)进行降维操作，得到一维序列B_v(i)；通过密钥生成一个与B_v(i)大小相同的伪随机序列P(i)，利用P(i)对B_v(i)进行扩频调制得到水印序列W_v(i)，其中W_v(i)＝B_v(i)P(i)；

步骤52)视频水印嵌入过程主要包括以下步骤：

a)对音频码流左声道数据A_l(i)进行非重叠分帧操作；

b)对音频帧数据做离散小波变换，得到能量较小的低频分量和能量较大的高频分量；选择低频系数中能量最大的前八个系数作为水印嵌入位置，并记下相应的位置信息；

c)通过修改选定的低频系数嵌入水印，其中，为这八个低频系数位置所对应的音频帧原始数据，m表示第m帧，α为水印嵌入强度，为嵌入水印后的相应位置低频系数，W_v(k)表示视频水印数据；

d)当前音频帧完成水印嵌入工作之后，对其做DWT逆变换，得到嵌入水印的音频信号。

进一步地，所述步骤6)具体内容为：

以T_a帧为周期重复嵌入多次音频水印，若一个水印没有全部嵌完，则选择下一个相邻音频帧继续嵌入；若一个水印已嵌完，则根据周期T_a，搜索下一个周期的音频帧，重新开始嵌入水印；

以T_v帧为周期重复嵌入多次视频水印，当一个水印嵌入完成，根据周期T_v，搜索下一个周期的关键帧，重新开始嵌入水印。

进一步地，所述步骤8)具体包括如下步骤：

步骤81)对包含水印的视频关键帧的亮度分量进行Itti显著性分析，求得前三个显著值最高的圆形显著区域；

步骤82)避开步骤81)提取的视觉显著区域，对其余部分进行8×8分块DCT变换，获取其直流系数DCT₀′(m₀,n₀)，根据W(i)＝floor(DCT₀′(m₀,n₀)/Δ)mod2进行模2运算提取当前帧嵌入的水印；

步骤83)当一帧水印提取完成，根据设置的视频水印嵌入周期，重复上述步骤直至所有水印提取完成。

进一步地，所述步骤9)具体包括如下步骤：

步骤91)对包含水印的音频码流进行分帧操作，帧长与嵌入时相同，并对音频帧做离散小波变换；

步骤92)根据水印嵌入时记下的低频系数位置信息，选择相应的低频系数对其进行解调得到序列S(k)，其中为相应位置的音频帧原始数据，

步骤93)通过将序列S(k)转化为二进制水印；

步骤94)当完成一个水印的提取之后，根据设置的音频水印嵌入周期，重复上述步骤直至所有水印提取完成。

本发明所达到的有益效果：1)利用音视频码流特征生成水印，且水印都是在载体视频解码过程中实时动态生成的，嵌入水印的不确定性提高了算法的安全性；2)选择在音频码流和视频码流中均嵌入水印，使得即使其中之一码流受到破坏导致水印无法提取时，仍可以从另一码流中提取水印，更加全面有效地保护了载体视频，大大提高了水印的鲁棒性。

附图说明

图1是音频水印生成流程图；

图2是视频水印生成流程图；

图3是视频帧嵌入水印过程；

图4是音频帧嵌入水印过程；

图5(a)是原始视频关键帧；

图5(b)是嵌入水印后的视频关键帧；

图6(a)是原始音频码流；

图6(b)是嵌入水印后的音频码流。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

本发明将音频特征生成水印嵌入到视频码流中，视频特征生成水印嵌入到音频码流中，音频和视频码流都得到了保护，在它们其中之一的水印被严重破坏时仍能从另一码流中提取水印从而完成论证。

本发明在具体实施时，对于嵌入音频水印的视频信号采用峰值信噪比PSNR来衡量水印的不可进行，采用误码率BER来衡量水印的鲁棒性；对于嵌入视频水印的音频信号采用信噪比SNR来衡量水印的不可感知性，采用误码率BER来衡量水印的鲁棒性。实验数据表明本发明具有较好的鲁棒性，同时也保证了水印的不可见性。

本方法的具体步骤如下：

步骤1)解码载体视频，获取音频码流和视频码流。

步骤2)利用音频码流的低通幅值统计特性，生成待嵌的音频水印文件，具体步骤为：

步骤22)对音频数据A(i)进行分帧操作，且帧与帧之间没有重叠，并对分帧后的音频数据做500HZ低通滤波后得到A'_m(i)，m表示第m帧；

步骤3)利用视频码流的帧间相关性特征生成待嵌的视频水印文件，具体包括如下步骤：

步骤31)在视频帧序列中选择两个相邻的视频帧V_n(i,j)和V_n+1(i,j)，对其Y分量做绝对差值运算得到V'(i,j)。

步骤32)对V'(i,j)进行分块降采样处理。

步骤33)对分成的K×L块中的每块采样信息做均值处理，对于每块采样信息合并每块中的均值得到粗略的绝对差值图像其中Δ(m₁,n₁)表示第m₁×n₁个采样信息数据，X和Y表示分块后每块的大小，Q_v(k,l)表示对应第k×l块的最终得到的绝对差值图像。

步骤34)对得到的绝对差值图像Q_v(k,l)采用进行二进制编码，从而得到水印比特，具体步骤如下：

34-a)利用密钥随机生成K×L大小的0-1均值分布矩阵R(k,l)。

34-b)求得每个随机矩阵的均值Δ，并从R(k,l)中减去该值得到R'(k,l)。

34-c)对Q_v(k,l)和R'(k,l)进行如下处理，

35-d)选取合适的阈值th对H(k,l)进行分类二进制编码，求得最终的二进制视频水印

步骤4)对视频的关键帧进行显著性分析，将音频水印W_a(i)量化嵌入至其亮度分量非显著区域离散余弦变换的直流系数上，具体包括如下步骤：

否则，根据下述公式对系数做调整：

步骤5)对音频帧进行离散小波变换，将扩频之后的视频水印W_v(i)通过叠加的方式嵌入到其低频系数中，具体包括如下步骤：

步骤51)视频水印预处理：对W_v(k,l)进行降维操作，得到一维序列B_v(i)；通过密钥生成一个与B_v(i)大小相同的伪随机序列P(i)，利用P(i)对B_v(i)进行扩频调制得到水印序列W_v(i)，其中W_v(i)＝B_v(i)P(i)。

步骤52)视频水印嵌入过程主要包括以下步骤：

52-a)对音频码流左声道数据A_l(i)进行非重叠分帧操作；

52-b)对音频帧数据做离散小波变换，得到能量较小的低频分量和能量较大的高频分量；选择低频系数中能量最大的前八个系数作为水印嵌入位置，并记下相应的位置信息；

52-c)通过修改选定的低频系数嵌入水印，其中，为这八个低频系数位置所对应的音频帧原始数据，m表示第m帧，α为水印嵌入强度，为嵌入水印后的相应位置低频系数，W_v(k)表示视频水印数据；

52-d)当前音频帧完成水印嵌入工作之后，对其做DWT逆变换，得到嵌入水印的音频信号。

步骤6)以T_a帧为周期重复嵌入多次音频水印，以T_v帧为周期重复嵌入多次视频水印；当所有水印嵌入完成，重新编码输出含有水印的视频载体，具体内容为：以T_a帧为周期重复嵌入多次音频水印，若一个水印没有全部嵌完，则选择下一个相邻音频帧继续嵌入；若一个水印已嵌完，则根据周期T_a，搜索下一个周期的音频帧，重新开始嵌入水印。以T_v帧为周期重复嵌入多次视频水印，当一个水印嵌入完成，根据周期T_v，搜索下一个周期的关键帧，重新开始嵌入水印。

步骤8)对包含水印的视频帧进行显著区域划分，根据量化索引调制的特点，从亮度分量的DCT直流系数中提取视频水印，具体包括如下步骤：

步骤81)对包含水印的视频关键帧的亮度分量进行Itti显著性分析，求得前三个显著值最高的圆形显著区域。

步骤82)避开步骤81)提取的视觉显著区域，对其余部分进行8×8分块DCT变换，获取其直流系数DCT₀′(m₀,n₀)，根据W(i)＝floor(DCT₀′(m₀,n₀)/Δ)mod2进行模2运算提取当前帧嵌入的水印。

步骤9)对包含水印的音频帧进行离散小波变换，通过相应的逆过程从低频系数中提取音频水印，具体包括如下步骤：

步骤93)通过将序列S(k)转化为二进制水印。

为了进一步对本发明的效果进行说明，本实施例中采用MPEG-2编码，视频帧大小为1024×576，长度为33秒，帧率为29.97fps，分离出的音频码流采样率为44.1KHZ，16位量化比特，MPEG Layer 3编码格式的双声道文件。对于音频水印，选择在视频关键帧中嵌入水印，其中Itti显著模型在划分圆形显著区域时，显著半径为25，水印嵌入周期T_a为300帧，在视频码流中一共嵌入三帧水印；对于视频水印，选择在左声道数据中实现水印的嵌入提取，音频共分为1267帧，每帧时长26毫秒，包含1152比特数据，嵌入8比特的水印，因为生成的视频水印大小为72比特，所以需要9帧音频才能完成一个水印的嵌入，设置水印嵌入周期T_v为300帧，整个音频码流共嵌入5个水印。

如图5(a)是截取的原始视频关键帧，图5(b)是嵌入水印后的该关键帧。水印的嵌入基本不影响视觉效果，所有嵌入水印关键帧的平均PSNR值为39.9614dB。

如图6(a)是原始音频码流，图6(b)是嵌入水印之后的音频码流文件。信噪比SNR值为48.6152dB。

本发明中在未添加外部攻击的情况下，提取的水印已经受到了压缩编码攻击，所以在验证本发明的鲁棒性时，对嵌完水印的音视频码流施加各种常见外部攻击，得到的实验结果均是编码压缩和外部攻击双重攻击下的实验结果。

下面分三种情况讨论对实施例中结果的鲁棒性，以此来对本发明的效果进行阐明。

1)音频水印鲁棒性：

对包含水印的音频信号进行以下几项攻击，得到提取水印误码率如表1所示：

(1)噪声攻击：随机生成信噪比为5dB的高斯白噪声，并将其添加到水印音频信号中。

(2)重量化攻击：实验时将嵌入水印的音频信号的量化位数从16bit降为8bit，之后在升至16bit。

(3)重采样攻击：将水印音频信号的采样率从原始的44.1KHZ降至16KHZ，之后在采样为原始的44.1KHZ。

(4)幅度攻击：将水印音频信号的幅值提升为原始幅值的1.8倍。

攻击方式	BER(％)
		噪声(5dB)	6.944
重量化(16/8/16)	13.889
		重采样(44.1/16/44.1)	12.500
幅度(1.8倍)	5.472

表1不同攻击下提取音频水印的BER

上述数据表明音频水印算法对于MP3压缩、幅度攻击、白噪声具有不错的抵抗能力，提取水印的BER值在4％-7％之间，提取的五个水印中平均每个水印有3-5个比特的错误，当噪声强度达到15dB时，只有一个水印能够提取出来，但是误码率达到16.221％，对于重量化和重采样攻击，由于攻击对音频数据整体改变的增大，五个水印中都只有两个能够提取出来，且提取水印的BER值均大于12％，效果较差。

2)视频水印鲁棒性：

(1)乘性噪声攻击：

对嵌入水印的视频帧分别添加强度为0.005，0.01，0.04的乘性噪声，表2是提取水印的误码率。

噪声强度	0.005	0.01	0.04
				BER值(％)	0.868	3.906	5.208

表2乘性噪声攻击下的提取水印误码率

(2)高斯噪声攻击：

对嵌入水印的视频帧分别添加均值为0，方差为0.01，0.02，0.04的高斯噪声，表3是提取水印的误码率。

方差	0.01	0.02	0.04
				BER值(％)	0.347	2.604	6.163

表3高斯噪声攻击的提取水印误码率

(3)椒盐噪声攻击：

对嵌入水印的视频帧分别添加0.005，0.01，0.03密度的椒盐噪声，表4是提取水印的误码率。

密度	0.005	0.01	0.03
				BER值(％)	2.431	5.382	8.681

表4椒盐噪声攻击的提取水印误码率

(4)饱和度攻击：

用视频编辑软件对包含水印的视频进行饱和度调节，调节幅度为+10、-10、+20，表4.4为提取水印的误码率。

幅度	+10	-10	+20
				BER值(％)	0.954	0.954	0.954

表5饱和度攻击的提取水印误码率

(5)均值滤波攻击：

当对视频进行均值滤波攻击时，视频帧的像素块与周边像素块发生平均处理，视觉显著区域被平均，变得模糊，注意焦点变得不明显，从而使得Itti模型划分的前三个显著区域发生偏差。当对视频帧进行3×3半径的均值滤波时，本章算法仍能有效地提取水印，BER值为5.295％。当滤波半径为5×5的时候，BER值为30.382％，视频画面产生明显的模糊现象，视觉显著区域的识别发生较大偏差，水印不能被正确完整地提取出来。

(6)帧删除、帧插入：

算法将水印嵌在视频独立编码的I帧上，作为B、P帧编码的参考帧，在一般视频处理过程中，I帧不会被删除。在帧删除过程中，因为水印嵌入算法循环了三次，只要有一帧嵌入帧没被删除，就能完整正确地提取水印。

在帧插入过程中，若插入的是B、P帧，对水印的提取不会产生影响；当插入帧为I关键帧，且处在被嵌入水印帧的位置时，嵌入水印帧位置发生偏移，影响当前帧水印的正常提取。

结果表明，视频水印能够完全抵抗MPEG-2压缩，对于MPEG-2压缩和高斯噪声，椒盐噪声，乘性噪声，饱和度调节，帧插入，帧删除等双重攻击具有很好的鲁棒性，大多数攻击下的BER值都在5％以内。

3)综合鲁棒性：

对于算法的整体鲁棒性，分以下三种情况讨论：

(1)视频码流整个被破坏删除无法提取水印，此时对从音频码流左声道数据中提取到的水印做鲁棒性分析，求得BER值如表6。

攻击方式	BER(％)
		无攻击(仅音频编解码)	3.245
噪声(5dB)	7.120
		重量化(16/8/16)	14.875
重采样(44.1/16/44.1)	15.675
		幅度(1.8倍)	5.536

表6视频码流无法提取水印时音频码流提取水印的BER

当视频码流被破坏导致水印无法提取时，本发明仍然可以从音频码流中提取正确的水印，且在未遭受针对音频的外部攻击的情况下，嵌入的五个水印均可以正确提取，每个平均有2个比特的错误，算法对于白噪声和幅度攻击依然具有较好的鲁棒性，BER值维持在5％-8％之间，提取的五个水印，噪声攻击中共有39比特错误，幅度攻击中共有26比特的错误，对于量化和采样攻击，提取水印BER值明显变大，嵌入的水印分别仅有3个和2个能提取出来，且都大于14％。

(2)音频码流整个被删除破坏，此时对视频码流提取水印做鲁棒性分析求得各种攻击下的BER值如表7。

表7音频码流无法提取水印时视频码流提取水印的BER

由表7可以看出，当音频码流整个被删除破坏时，本章算法仍能够有效地从视频码流中提取水印，对于MPEG编码压缩、乘性噪声、高斯噪声、椒盐噪声、饱和度攻击，本发明提取水印的BER值多数都在5％左右。

(3)随机生成1到979之间的若干个随机数，并将对应的视频帧从视频码流中删除。在不考虑外部攻击的情况下对提取的水印计算误码率，结果如表8。综合误码率是通过计算求得的，其中error_audio_bit表示提取音频水印的错误比特数，error_video_bit表示提取视频水印的错误比特数，audio_bit和video_bit分别表示嵌入的音频水印和视频水印总比特数。

表8随机删除视频帧时提取水印的BER值

因为水印在视频码流中是循环嵌入的，对于视频码流，水印是嵌在关键帧上的，在删除码流时，只要包含水印的关键帧没有都被删除，水印就可以正确提取。

当随机删除10帧和30帧时，包含水印的关键帧没有被删除，嵌入的三个视频水印都可以正确地提取出来。

当删除帧数达到100帧时，只有一帧视频水印能够提取出来，仅就视频水印来看，本发明提取水印具有较好辨识度，在视频帧被删除的情况下，本发明依然可以正确地提取音频水印，使得综合误码率得到大大提高，可以看出在随机删除10帧、30帧、80帧、100帧的情况下，本发明的综合BER值均在1％以内。

当删除300帧视频帧时，所有包含水印的关键帧都被删除，此时虽然本发明的综合误码率为94.403％，但是因为音频水印和视频水印在本发明中是两个独立的文件，各自均具有标识性，单就音频水印来看，提取的水印误码率只有4.861％，平均每个水印只有3.5个比特的错误，依然可以具有很好的鲁棒性。

实验结果表明，本发明对于针对音视频码流的常见攻击均具有较好的鲁棒性，且在音视频码流之一受到破坏导致水印无法提取时，仍然可以从另一码流中提取水印完成验证，大大提高了算法的鲁棒性，保证了多媒体数据的安全。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种高鲁棒性音视频交叉水印算法，其特征是，包括如下步骤：

步骤1)解码载体视频，获取音频码流和视频码流；

步骤2)利用音频码流的低通幅值统计特性，生成待嵌的音频水印文件：

步骤23)对滤波后的音频帧数据A'_m(i)求均值μ_m和标准差σ_m，并根据对其进行二进制编码得到音频水印W_a(i)；

步骤3)利用视频码流的帧间相关性特征生成待嵌的视频水印文件：

步骤33)对分成的K×L块中的每块采样信息做均值处理，对于每块采样信息合并每块中的均值得到粗略的绝对差值图像其中Δ(m₁,n₁)表示第m₁×n₁个采样信息数据，X和Y表示分块后每块的大小，Q_v(k,l) 表示对应第k×l块的最终得到的绝对差值图像；

步骤34)对得到的绝对差值图像Q_v(k,l)进行二进制编码，从而得到水印比特；

步骤4)对视频的关键帧进行显著性分析，将音频水印W_a(i)量化嵌入至其亮度分量非显著区域离散余弦变换的直流系数上：

步骤43)对直流系数DCT₀(m₀,n₀)采用二进制奇偶量化调制算法，以固定步长Δ将其量化至不同的索引区间，实现水印的嵌入，使其满足W_a(i)＝floor(DCT₀(m₀,n₀)/Δ)mod 2；

否则，根据下述公式对系数做调整：

步骤44)将量化后的系数作为新的直流系数，进行逆DCT变换，得到嵌入水印后的视频帧；

步骤5)对音频帧进行离散小波变换，将扩频之后的视频水印W_v(i)通过叠加的方式嵌入到其低频系数中：

步骤52)视频水印嵌入过程主要包括以下步骤：

a)对音频码流左声道数据A_l(i)进行非重叠分帧操作；

d)当前音频帧完成水印嵌入工作之后，对其做DWT逆变换，得到嵌入水印的音频信号；

2.根据权利要求1所述的一种高鲁棒性音视频交叉水印算法，其特征是，所述步骤22)中低通滤波采用500HZ。

3.根据权利要求1所述的一种高鲁棒性音视频交叉水印算法，其特征是，所述步骤34)具体步骤如下：

a)利用密钥随机生成K×L大小的0-1均值分布矩阵R(k,l)；

b)求得每个随机矩阵的均值Δ，并从R(k,l)中减去该值得到R′(k,l)；

c)对Q_v(k,l)和R'(k,l)进行如下处理，

4.根据权利要求1所述的一种高鲁棒性音视频交叉水印算法，其特征是，所述步骤6)具体内容为：

5.根据权利要求1所述的一种高鲁棒性音视频交叉水印算法，其特征是，所述步骤8)具体包括如下步骤：

6.根据权利要求1所述的一种高鲁棒性音视频交叉水印算法，其特征是，所述步骤9)具体包括如下步骤：

步骤93)通过将序列S(k)转化为二进制水印；