CN101290772B

CN101290772B - 基于混合域系数矢量量化的音频零水印嵌入和提取方法

Info

Publication number: CN101290772B
Application number: CN2008100352185A
Authority: CN
Inventors: 陈宁; 朱杰
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiao Tong University Wuxi Research Institute
Priority date: 2008-03-27
Filing date: 2008-03-27
Publication date: 2011-06-01
Anticipated expiration: 2028-03-27
Also published as: CN101290772A

Abstract

一种信息安全技术领域的音频处理方法中的基于混合域系数矢量量化的音频零水印嵌入和提取方法，水印嵌入部分：将原始音频信号进行分段处理，对每一段音频进行离散小波变换以提取其小波近似分量，对获得的小波近似分量进行离散余弦变换以及矢量量化；根据矢量量化的索引值的统计特性构造极性矢量；通过对极性矢量和即将嵌入的原始水印信号进行异或运算将水印嵌入到检测密钥中去；水印提取部分：首先，采用与水印嵌入部分相同的方法从待测音频信号中获得极性矢量；然后，对极性矢量和水印检测密钥进行异或运算获得提取的水印信号。本发明对于各种正常的音频信号处理操作和恶意攻击表现出了较强的鲁棒性，另外还省去了重构音频载体信号的麻烦。

Description

基于混合域系数矢量量化的音频零水印嵌入和提取方法

技术领域

本发明涉及一种信息安全技术领域的音频处理方法，具体涉及一种基于混合域系数矢量量化的音频零水印嵌入和提取方法。

背景技术

音频水印中透明性和鲁棒性是一对矛盾体，这个矛盾如果解决不好，将影响音频水印嵌入和提取方法的应用。但目前不可感知性和鲁棒性并不影响水印的可行性。然而，如果水印方法本身存在漏洞，而使得水印系统存在致命的安全性问题，给攻击者可乘之机，那么水印系统的可行性将被置疑，可见安全性的问题是很重要的。安全性问题将通过下面介绍的可逆水印概念加以阐述。

对于一个水印系统(E，D)(E表示水印嵌入方法，D表示水印提取方法)，令O_w＝E(O，w)，如果存在一个映射E^-1，满足下列三个条件：

(1) E^-1(O_w，w′)＝O′

(2) E(O′，w′)＝O_w

(3) D(O，O′)＝w′

则称该水印系统为可逆(Invertible)水印系统。其中，要求原始水印信号w和伪造水印信号w′的格式满足系统的要求，同时伪造原始载体O′和水印载体O_w具有足够的相似度，则水印系统(E，D)是可逆的，否则就是不可逆的(Noninvertible)水印系统。

经对现有技术文献的检索发现，Wang X.-Y.等在《IEEE Transactions on SignalProcessing》(电气与电子工程师学会信号处理期刊)(2006年54卷12期4835-4840)上发表的“A Novel Synchronization Invariant Audio Watermarking Scheme Based onDWT and DCT”(一种新颖的基于DWT和DCT的同步音频水印系统)，提出了基于DWT和DCT的音频水印方法进行了抵御正常音频信号处理和恶意攻击的鲁棒性的以及透明性的对比，但是该文献提出的方法无法从根本上解决音频水印鲁棒性和不可感知性之间的固有矛盾，并且这种方法抵御各种恶意攻击的鲁棒性还有待于提高。

发明内容

本发明的目的在于针对上述现有技术的不足，提出一种基于混合域系数矢量量化的音频零水印嵌入和提取方法，与传统的音频水印方法不同，该方法并没有把水印真正嵌入到音频载体中，而是通过提取载体音频的重要特征构造水印信号，并利用这些重要特征实现水印的盲检测。该方法不仅从根本上解决了音频水印中鲁棒性和不可感知性之间的固有矛盾，同时弥补了由于嵌入算法的存在所造成的可能安全漏洞。

本发明是通过以下技术方案实现的，本发明包括水印嵌入和水印提取两部分，

水印嵌入部分包括如下步骤：

第一步，将原始音频信号进行分段处理；

第二步，对每一段音频进行离散小波变换(DWT)以提取其小波近似分量；

第三步，对第二步中获得的小波近似分量进行离散余弦变换(DCT)以进行能量压缩；

第四步，对第三步中经过离散余弦变换的小波近似分量进行矢量量化；

第五步，根据矢量量化的索引值的统计特性构造极性矢量；

第六步，通过对极性矢量和即将嵌入的原始水印信号进行异或运算将水印嵌入到检测密钥中去，并在认证中心申请检测密钥的时间戳；

水印提取部分包括如下步骤：

首先，采用与水印嵌入部分中第一步到第五步相同的方法从待测音频信号中获得极性矢量；

然后，对极性矢量和水印检测密钥进行异或运算获得提取的水印信号。

所述将原始音频信号进行分段处理，具体为：将原始音频载体信号A分割成长度相等的M×N帧，表示为{F_i|i＝0，…，M×N-1}，每一帧含有L_F个采样点，其中：L_F＝L_A/(M×N)，A＝{a(n)|n＝0，…，L_A-1}，a(n)为第n个采样值，L_A为原始音频载体包含的采样个数。

所述对每一段音频进行离散小波变换提取其小波近似分量，具体为：对每一帧音频数据F_i进行H级小波变换，得到小波分量A_i ^H，D_i ^H，D_i ^H-1，…，D_i ¹，其中A_i ^H为第i帧F_i小波变换的第H级小波近似分量，D_i ^H，D_i ^H-1，…，D_i ¹分别F_i小波变换的第H～1级细节分量。

所述对小波近似分量进行离散余弦变换，具体为：考虑到小波近似分量能够有效抵御各种干扰，因此选择H级小波变换的近似分量A_i ^H进行离散余弦变换，即：A_i ^HC＝DCT(A_i ^H)。

所述对第三步中经过离散余弦变换的小波近似分量进行矢量量化，具体为：对每一帧的DWT-DCT系数进行矢量量化(VQ)，并根据所得的索引值构成向量

，即

，矢量量化所用的码本是由每一帧的DWT-DCT系数构成的训练集通过LBG(一种矢量量化码本训练方法)模型获得的，公式如下：

Y = \cup_{i = 0}^{M \times N - 1} VQ ({A_{i}}^{HC}) = \cup_{i = 0}^{M \times N - 1} y (i) .

所述根据矢量量化的索引值的统计特性构造极性矢量，具体为：首先，计算第i帧的索引值与其相邻两帧的索引值的方差σ²(i)，公式如下：

σ^{2} (i) = \frac{1}{3} Σ_{m = i - 1}^{m = i + 1} y^{2} (m) - {[\frac{1}{3} Σ_{m = i - 1}^{m = i + 1} y (m)]}^{2}

然后，根据σ²(i)由以下两式得到极性矢量P：

P = \cup_{i = 0}^{M \times N - 1} p (i),

p (i) = \{\begin{matrix} 1, if σ^{2} (i) &GreaterEqual; \underset{i}{median} [σ^{2} (i)] \\ 0, otherwise \end{matrix} .

所述对极性矢量和即将嵌入的水印信号进行异或运算将水印嵌入到检测密钥中，具体为：即将嵌入的二值图像水印信号为W＝{w(i，j)|w(i，j)∈{0，1}，i＝0，…，M-1，j＝0，…，N-1}，M、N分别为图像的宽度和长度，w(i，j)表示(i，j)点的水印信号象素值，进行异或运算具体为：

l＝(i-1)×N+j，其中：p(l)为极性矢量的元素，k(l)是检测密钥的元素，则检测密钥为：K＝{k(l)，l＝0，…，M×N-1}。

所述对极性矢量和水印检测密钥进行异或运算获得提取的水印信号，具体为：

l＝(i-1)×N+j，其中：w(i，j)表示(i，j)点的水印信号象素值，p(l)为极性矢量的元素，k(l)是检测密钥的元素。

与现有技术相比，本发明包括如下有益效果：本发明中原始音频载体、检测密钥以及相应的时间戳将被注册到认证中心以证明其对音频作品的版权。第一，本发明从根本上解决了鲁棒性和不可感知性之间的固有矛盾；第二，本发明避免了由于水印嵌入算法的存在所造成的可能的安全漏洞；第三，水印提取不需要原始音频信号的参与。

附图说明

图1是水印嵌入方法流程图；

图2是水印提取方法流程图；

图3是本发明方法的有效性测试结果图

其中：(a)原始音频载体信号，(b)原始水印图像，(c)提取的水印图像；

图4是本发明方法安全性测试结果图

其中：(a)嵌有水印的音频载体信号，(b)、(c)未嵌入水印的音频信号，(d)为从(a)中提取出的水印，(e)从(b)中提取出的水印，(f)从(c)中提取出的水印；

图5为本发明方法在各种操作下提取的水印图像

其中：图(a)为无信号处理、图(b)为Mp3压缩/解压缩、图(c)为低通滤波、图(d)为重新采样、图(e)为叠加噪声、图(f)为延时、图(g)为叠加回声、图(h)为幅度放大、图(i)为重新采样；

图6是对比文献的方法在各种攻击情况下的水印图像

其中：图(a)为No-attack、图(b)为Addbrumm100、图(c)为Addnoise100、图(d)为Addsinus、图(e)为Compressor、图(f)为Dynnoise、图(g)为Exchange、图(h)为Fft.real.reverse、图(i)为Normalize、图(j)为Rc-lowpass、图(k)为Smooth、图(l)为Smooth2、图(m)为Stat1、图(n)为Stat2、图(o)为Zerocross；

图7是本实施例方法在各种攻击情况下的水印图像

其中：图(a)为No-attack、图(b)为Addbrumm100、图(c)为Addnoise100、图(d)为Addsinus、图(e)为Compressor、图(f)为Dynnoise、图(g)为Exchange、图(h)为Fft.real.reverse、图(i)为Normalize、图(j)为Rc-lowpass、图(k)为Smooth、图(l)为Smooth2、图(m)为Stat1、图(n)为Stat2、图(o)为Zerocross。

具体实施方式

下面结合附图对本发明的实施例作详细说明：本实施例在以本发明技术方案为前提下进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

本实施例中使用的原始音频载体为44.1kHz，分辨率为16比特，长度为17.24秒的单声道数字音频信号，其波形如图3(a)所示。数字水印采用的是尺寸为66×90的二值图像(见3(b))。小波变换采用了常见的Haar小波基。小波变换的级数为H＝4，码本的尺寸为8，帧长为128个采样点。则在没有任何攻击的情况下提取的水印图像如图3(c)所示。

本实施例包括：水印嵌入过程和水印提取过程两部分。

如图1所示，水印嵌入过程具体如下：

原始音频载体信号为A＝{a(n)|n＝0，…，760279}，其中，a(n)为第n个采样值，原始音频载体包含的760280个采样值，即将嵌入的二值图像水印信号为W＝{w(i，j)|w(i，j)∈{0，1}，i＝0，…，65，j＝0，…，89}。

步骤一：将原始音频载体信号A分割成长度相等的5940帧，表示为{F_i|i＝0，…，5939}，每一帧含有128个采样点；

步骤二：对每一帧音频数据F_i进行4级小波变换，得到小波系数A_i ⁴，D_i ⁴，D_i ³，D²，D_i ¹。其中A_i ⁴为第i帧F_i小波变换的第4级近似分量，D_i ⁴，D_i ³，D²，D_i ¹分别F_i小波变换的第4～1级细节分量；

步骤三：考虑到小波域的近似分量能够有效抵御各种干扰，这里选择4级小波变换的近似分量A_i ⁴进行DCT，即A_i ^4C＝DCT(A_i ⁴)；

步骤四：首先，对每一帧的DWT-DCT系数进行矢量量化(VQ)，所用的码本是由每一帧的DWT-DCT系数构成的训练集通过LBG模型获得的，并根据所得的索引值构成向量

，即

\overset{&RightArrow;}{Y} = \cup_{i = 0}^{5939} VQ ({A_{i}}^{4 C}) = \cup_{i = 0}^{5939} y (i);

步骤五：根据下式计算第i帧的索引值与其相邻两帧的索引值的方差σ²(i)，

即

σ^{2} (i) = \frac{1}{3} Σ_{m = i - 1}^{m = i + 1} y^{2} (m) - {[\frac{1}{3} Σ_{m = i - 1}^{m = i + 1} y (m)]}^{2};

最后，根据σ²(i)由以下两式得到极性矢量P：

P = \cup_{i = 0}^{M \times N - 1} p (i),

p (i) = \{\begin{matrix} 1, if σ^{2} (i) &GreaterEqual; \underset{i}{median} [σ^{2} (i)] \\ 0, otherwise \end{matrix} .

步骤六：对极性矢量和即将嵌入的水印信号进行异或运算得到检测密钥K＝{k(l)，l＝0，…，5939}，即

k (l) = w (i, j) &CirclePlus; p (l)

l＝(i-1)×90+j。

最后，将原始音频载体和检测密钥，以及相应的时间戳注册到认证中心以证明其对音频作品的版权。

如图2所示，所述水印提取，过程具体为：

步骤一：将待检测的音频信号

分割成长度相等5940帧，记为

{{\tilde{F}}_{i} | i = 0, \cdot \cdot \cdot, 5939};

步骤二：对每一帧进行4级DWT，得到小波系数

步骤三：对近似分量

做DCT变换，即

步骤四：对每个

进行矢量量化(用与嵌入过程相同的码本)，从而获得索引值向量

，即

步骤五：计算第i帧的索引值与其相邻两帧的索引值的方差，即

并根据

由以下两式得到极性矢量

\tilde{P} = \cup_{i = 0}^{M \times N - 1} \tilde{p} (i),

\tilde{p} (i) = \{\begin{matrix} 1, if {\tilde{σ}}^{2} (i) &GreaterEqual; \underset{i}{median} [{\tilde{σ}}^{2} (i)] \\ 0, otherwise \end{matrix} .

步骤六：对极性矢量

和检测密钥K进行异或运算得到估计水印

，即

\begin{matrix} \tilde{w} (i, j) = k (l) &CirclePlus; \tilde{p} (l) & l = (i - 1) \times 90 + j . \end{matrix}.

实验验证

首先，验证本实施例方法的检测可靠性，即尝试从其它不含水印的音频信号中检测水印信号。利用嵌有水印的音频信号的检测密钥和码本去检测其它没有嵌过水印的音频信号。除了原始音频载体(如图4(a)所示)，还对另外两段音频进行了测试(如图4(b)、(c)所示)。对应的提取出的水印图像如图4(d)-(f)所示。很明显，本实施例方法可以从匹配的音频载体和检测密钥中提取出正确的水印，而从不匹配的音频载体中提取的是乱码。这充分证明了本实施例方法的检测可靠性。

为了验证本实施例方法抵抗信道中可能遇到的正常的音频信号处理操作的能力，对嵌入水印的音频信号分别进行了如下操作：

①有损压缩：先对信号进行了速率为32Kbps的Mp3压缩，再进行解压缩；

②低通滤波：用截至频率为22.05KHz的低通滤波器对载体信号进行滤波；

③从新量化：先将音频信号从16比特量化为8比特，再量化为16比特；

④叠加噪声：对音频载体在时域中加入信噪比为40dB的高斯白噪声；

⑤延时：对载体信号在时域进行了500ms，10％的延时；

⑥叠加回声：在载体音频的时域中叠加了延时为500毫秒，衰减为10％的回声。

⑦幅值增大：对载体音频的幅值进行了0.5dB的放大；

⑧重新采样：将载体音频的采样率下降为22.05kHz，再还原为44.1kHz。

表1给出了本实施例方法在各种操作下提取水印的能力(误比特率BER以及数字音频的信噪比)。

表1数字水印对常规音频信号处理的抵御能力

如图5所示，为在各种操作下提取的水印图像，图(a)为无信号处理、图(b)为Mp3压缩/解压缩、图(c)为低通滤波、图(d)为重新采样、图(e)为叠加噪声、图(f)为延时、图(g)为叠加回声、图(h)为幅度放大、图(i)为重新采样，其中图(h)、(i)的图像稍有杂质，其余的图像都很清晰。

另外，还用测试音频水印鲁棒性的专用软件Stirmark for audio v0.2(一种常用的专业音频水印性能测试工具)对本实施例的方法和参考文献提出的方法进行了攻击，两种方法对各种攻击的鲁棒性对比。

图6是对比文献的方法在各种攻击情况下的水印图像，其中：图(a)为No-attack(无任何攻击)、图(b)为Addbrumm100(叠加“brumm”噪声)、图(c)为Addnoise100(叠加噪声)、图(d)为Addsinus(叠加”sinus”噪声)、图(e)为Compressor(压缩)、图(f)为Dynnoise(去噪声)、图(g)为Exchange(替换)、图(h)为Fft.real.reverse(基于傅立叶变换的实部交换)、图(i)为Normalize(归一化)、图(j)为Rc-lowpass(RC-低通滤波)、图(k)为Smooth(平滑处理)、图(l)为Smooth2(平滑处理2)、图(m)为Stat1(统计攻击1)、图(n)为Stat2(统计攻击2)、图(o)为Zerocross(过零攻击)。

图7是本实施例方法在各种攻击情况下的水印图像，图(a)为No-attack、图(b)为Addbrumm100、图(c)为Addnoise100、图(d)为Addsinus、图(e)为Compressor、图(f)为Dynnoise、图(g)为Exchange、图(h)为Fft.real.reverse、图(i)为Normalize、图(j)为Rc-lowpass、图(k)为Smooth、图(l)为Smooth2、图(m)为Stat1、图(n)为Stat2、图(o)为Zerocross。

由图6和图7的对比可知，本实施例方法得到的水印图像比对比文献的方法得到的水印图像更为清楚。

本实施例的方法和参考文献提出的方法进行了攻击后的归一化互相关系数、误比特率、信噪比数值，如表2所示。

表2.水印方法抗恶意攻击的能力的比较

Claims

1.一种基于混合域系数矢量量化的音频零水印嵌入和提取方法，其特征在于，包括水印嵌入和水印提取两部分，其中：

水印嵌入部分包括如下步骤：

第一步，将原始音频信号进行分帧处理；

第二步，对每一帧音频进行离散小波变换以提取其小波近似分量；

第三步，对第二步中获得的小波近似分量进行离散余弦变换以进行能量压缩；

第五步，根据矢量量化的索引值的统计特性构造极性矢量；

水印提取部分包括如下步骤：

然后，对从待测音频信号中获得的极性矢量和水印检测密钥进行异或运算获得提取的水印信号；

所述将原始音频信号进行分帧处理，具体为：将原始音频载体信号A分割成长度相等的M×N帧，表示为{ F _i |i＝0，…，M×N-1}，每一帧含有L_F个采样点，其中：L_F＝L_A/(M×N)，A＝{a(n)|n＝0，…，L_A-1}，a(n)为第n个采样值，L_A为原始音频载体包含的采样个数；

所述根据矢量量化的索引值的统计特性构造极性矢量，具体为：

首先，计算第i帧的索引值与其相邻两帧的索引值的方差σ²(i)，公式如下：

其中：y(m)为第m帧的索引值；

然后，根据σ²(i)由以下两式得到极性矢量P：

其中：M、N分别为即将嵌入的原始水印信号图像的宽度和长度。

2.根据权利要求1所述的基于混合域系数矢量量化的音频零水印嵌入和提取方法，其特征是，所述对每一帧音频进行离散小波变换提取其小波近似分量，具体为：对第i帧音频数据F _i进行H级小波变换，得到小波分量A _i ^H，D _i ^H，D _i ^H-1，…，D _i ¹，其中A _i ^H为第i帧音频数据F _i小波变换的第H级小波近似分量，D _i ^H，D _i ^H-1，…，D _i ¹分别F _i小波变换的第H至第1级细节分量。

3.根据权利要求2所述的基于混合域系数矢量量化的音频零水印嵌入和提取方法，其特征是，所述对第三步中经过离散余弦变换的小波近似分量进行矢量量化，具体为：对每一帧的DWT-DCT系数进行矢量量化VQ，并根据所得的索引值构成向量Y，即Y＝{y(i)|i＝0，…，M×N-1}，y(i)为第i帧的索引值，矢量量化所用的码本是由每一帧的DWT-DCT系数构成的训练集通过LBG模型获得的，公式如下：

A _i ^HC＝DCT(A _i ^H)，A _i ^H为第i帧音频数据F _i小波变换的第H级小波近似分量。

4.根据权利要求1所述的基于混合域系数矢量量化的音频零水印嵌入和提取方法，其特征是，所述对极性矢量和即将嵌入的原始水印信号进行异或运算将水印嵌入到检测密钥中，具体为：即将嵌入的原始二值图像水印信号为W＝{w(e，f)|w(e，f)∈{0，1}，e＝0，…，M-1，f＝0，…，N-1}，w(e，f)表示(e，f)点的水印信号像素值，进行异或运算具体为：k(i)＝w(e，f)⊕p(i) i＝(e-1)×N+f，其中：p(i)为极性矢量的元素，k(i)是检测密钥的元素，则检测密钥为：K＝{k(i)，i＝0，…，M×N-1}。

5.根据权利要求4所述的基于混合域系数矢量量化的音频零水印嵌入和提取方法，其特征是，所述对从待测音频信号中获得的极性矢量和水印检测密钥进行异或运算获得提取的水印信号，具体为：

其中：k(i)是检测密钥的元素，k(i)＝w(e，f)⊕p(i)，

为(e，f)点的提取的水印信号像素值，为从待测音频信号中获得的极性矢量的元素，则提取的水印信号为