发明内容
本发明的目的在于针对上述现有技术的不足,提出一种基于混合域系数矢量量化的音频零水印嵌入和提取方法,与传统的音频水印方法不同,该方法并没有把水印真正嵌入到音频载体中,而是通过提取载体音频的重要特征构造水印信号,并利用这些重要特征实现水印的盲检测。该方法不仅从根本上解决了音频水印中鲁棒性和不可感知性之间的固有矛盾,同时弥补了由于嵌入算法的存在所造成的可能安全漏洞。
本发明是通过以下技术方案实现的,本发明包括水印嵌入和水印提取两部分,
水印嵌入部分包括如下步骤:
第一步,将原始音频信号进行分段处理;
第二步,对每一段音频进行离散小波变换(DWT)以提取其小波近似分量;
第三步,对第二步中获得的小波近似分量进行离散余弦变换(DCT)以进行能量压缩;
第四步,对第三步中经过离散余弦变换的小波近似分量进行矢量量化;
第五步,根据矢量量化的索引值的统计特性构造极性矢量;
第六步,通过对极性矢量和即将嵌入的原始水印信号进行异或运算将水印嵌入到检测密钥中去,并在认证中心申请检测密钥的时间戳;
水印提取部分包括如下步骤:
首先,采用与水印嵌入部分中第一步到第五步相同的方法从待测音频信号中获得极性矢量;
然后,对极性矢量和水印检测密钥进行异或运算获得提取的水印信号。
所述将原始音频信号进行分段处理,具体为:将原始音频载体信号A分割成长度相等的M×N帧,表示为{Fi|i=0,…,M×N-1},每一帧含有LF个采样点,其中:LF=LA/(M×N),A={a(n)|n=0,…,LA-1},a(n)为第n个采样值,LA为原始音频载体包含的采样个数。
所述对每一段音频进行离散小波变换提取其小波近似分量,具体为:对每一帧音频数据Fi进行H级小波变换,得到小波分量Ai H,Di H,Di H-1,…,Di 1,其中Ai H为第i帧Fi小波变换的第H级小波近似分量,Di H,Di H-1,…,Di 1分别Fi小波变换的第H~1级细节分量。
所述对小波近似分量进行离散余弦变换,具体为:考虑到小波近似分量能够有效抵御各种干扰,因此选择H级小波变换的近似分量Ai H进行离散余弦变换,即:Ai HC=DCT(Ai H)。
所述对第三步中经过离散余弦变换的小波近似分量进行矢量量化,具体为:对每一帧的DWT-DCT系数进行矢量量化(VQ),并根据所得的索引值构成向量
,即
,矢量量化所用的码本是由每一帧的DWT-DCT系数构成的训练集通过LBG(一种矢量量化码本训练方法)模型获得的,公式如下:
所述根据矢量量化的索引值的统计特性构造极性矢量,具体为:首先,计算第i帧的索引值与其相邻两帧的索引值的方差σ2(i),公式如下:
然后,根据σ2(i)由以下两式得到极性矢量P:
所述对极性矢量和即将嵌入的水印信号进行异或运算将水印嵌入到检测密钥中,具体为:即将嵌入的二值图像水印信号为W={w(i,j)|w(i,j)∈{0,1},i=0,…,M-1,j=0,…,N-1},M、N分别为图像的宽度和长度,w(i,j)表示(i,j)点的水印信号象素值,进行异或运算具体为:
l=(i-1)×N+j,其中:p(l)为极性矢量的元素,k(l)是检测密钥的元素,则检测密钥为:K={k(l),l=0,…,M×N-1}。
所述对极性矢量和水印检测密钥进行异或运算获得提取的水印信号,具体为:
l=(i-1)×N+j,其中:w(i,j)表示(i,j)点的水印信号象素值,p(l)为极性矢量的元素,k(l)是检测密钥的元素。
与现有技术相比,本发明包括如下有益效果:本发明中原始音频载体、检测密钥以及相应的时间戳将被注册到认证中心以证明其对音频作品的版权。第一,本发明从根本上解决了鲁棒性和不可感知性之间的固有矛盾;第二,本发明避免了由于水印嵌入算法的存在所造成的可能的安全漏洞;第三,水印提取不需要原始音频信号的参与。
具体实施方式
下面结合附图对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
本实施例中使用的原始音频载体为44.1kHz,分辨率为16比特,长度为17.24秒的单声道数字音频信号,其波形如图3(a)所示。数字水印采用的是尺寸为66×90的二值图像(见3(b))。小波变换采用了常见的Haar小波基。小波变换的级数为H=4,码本的尺寸为8,帧长为128个采样点。则在没有任何攻击的情况下提取的水印图像如图3(c)所示。
本实施例包括:水印嵌入过程和水印提取过程两部分。
如图1所示,水印嵌入过程具体如下:
原始音频载体信号为A={a(n)|n=0,…,760279},其中,a(n)为第n个采样值,原始音频载体包含的760280个采样值,即将嵌入的二值图像水印信号为W={w(i,j)|w(i,j)∈{0,1},i=0,…,65,j=0,…,89}。
步骤一:将原始音频载体信号A分割成长度相等的5940帧,表示为{Fi|i=0,…,5939},每一帧含有128个采样点;
步骤二:对每一帧音频数据Fi进行4级小波变换,得到小波系数Ai 4,Di 4,Di 3,D2,Di 1。其中Ai 4为第i帧Fi小波变换的第4级近似分量,Di 4,Di 3,D2,Di 1分别Fi小波变换的第4~1级细节分量;
步骤三:考虑到小波域的近似分量能够有效抵御各种干扰,这里选择4级小波变换的近似分量Ai 4进行DCT,即Ai 4C=DCT(Ai 4);
步骤四:首先,对每一帧的DWT-DCT系数进行矢量量化(VQ),所用的码本是由每一帧的DWT-DCT系数构成的训练集通过LBG模型获得的,并根据所得的索引值构成向量
,即
步骤五:根据下式计算第i帧的索引值与其相邻两帧的索引值的方差σ2(i),
即
最后,根据σ2(i)由以下两式得到极性矢量P:
步骤六:对极性矢量和即将嵌入的水印信号进行异或运算得到检测密钥K={k(l),l=0,…,5939},即
l=(i-1)×90+j。
最后,将原始音频载体和检测密钥,以及相应的时间戳注册到认证中心以证明其对音频作品的版权。
如图2所示,所述水印提取,过程具体为:
步骤一:将待检测的音频信号
分割成长度相等5940帧,记为
步骤四:对每个
进行矢量量化(用与嵌入过程相同的码本),从而获得索引值向量
,即
步骤五:计算第i帧的索引值与其相邻两帧的索引值的方差
,即
并根据
由以下两式得到极性矢量
步骤六:对极性矢量
和检测密钥K进行异或运算得到估计水印
,即
实验验证
首先,验证本实施例方法的检测可靠性,即尝试从其它不含水印的音频信号中检测水印信号。利用嵌有水印的音频信号的检测密钥和码本去检测其它没有嵌过水印的音频信号。除了原始音频载体(如图4(a)所示),还对另外两段音频进行了测试(如图4(b)、(c)所示)。对应的提取出的水印图像如图4(d)-(f)所示。很明显,本实施例方法可以从匹配的音频载体和检测密钥中提取出正确的水印,而从不匹配的音频载体中提取的是乱码。这充分证明了本实施例方法的检测可靠性。
为了验证本实施例方法抵抗信道中可能遇到的正常的音频信号处理操作的能力,对嵌入水印的音频信号分别进行了如下操作:
①有损压缩:先对信号进行了速率为32Kbps的Mp3压缩,再进行解压缩;
②低通滤波:用截至频率为22.05KHz的低通滤波器对载体信号进行滤波;
③从新量化:先将音频信号从16比特量化为8比特,再量化为16比特;
④叠加噪声:对音频载体在时域中加入信噪比为40dB的高斯白噪声;
⑤延时:对载体信号在时域进行了500ms,10%的延时;
⑥叠加回声:在载体音频的时域中叠加了延时为500毫秒,衰减为10%的回声。
⑦幅值增大:对载体音频的幅值进行了0.5dB的放大;
⑧重新采样:将载体音频的采样率下降为22.05kHz,再还原为44.1kHz。
表1给出了本实施例方法在各种操作下提取水印的能力(误比特率BER以及数字音频的信噪比)。
表1数字水印对常规音频信号处理的抵御能力
如图5所示,为在各种操作下提取的水印图像,图(a)为无信号处理、图(b)为Mp3压缩/解压缩、图(c)为低通滤波、图(d)为重新采样、图(e)为叠加噪声、图(f)为延时、图(g)为叠加回声、图(h)为幅度放大、图(i)为重新采样,其中图(h)、(i)的图像稍有杂质,其余的图像都很清晰。
另外,还用测试音频水印鲁棒性的专用软件Stirmark for audio v0.2(一种常用的专业音频水印性能测试工具)对本实施例的方法和参考文献提出的方法进行了攻击,两种方法对各种攻击的鲁棒性对比。
图6是对比文献的方法在各种攻击情况下的水印图像,其中:图(a)为No-attack(无任何攻击)、图(b)为Addbrumm100(叠加“brumm”噪声)、图(c)为Addnoise100(叠加噪声)、图(d)为Addsinus(叠加”sinus”噪声)、图(e)为Compressor(压缩)、图(f)为Dynnoise(去噪声)、图(g)为Exchange(替换)、图(h)为Fft.real.reverse(基于傅立叶变换的实部交换)、图(i)为Normalize(归一化)、图(j)为Rc-lowpass(RC-低通滤波)、图(k)为Smooth(平滑处理)、图(l)为Smooth2(平滑处理2)、图(m)为Stat1(统计攻击1)、图(n)为Stat2(统计攻击2)、图(o)为Zerocross(过零攻击)。
图7是本实施例方法在各种攻击情况下的水印图像,图(a)为No-attack、图(b)为Addbrumm100、图(c)为Addnoise100、图(d)为Addsinus、图(e)为Compressor、图(f)为Dynnoise、图(g)为Exchange、图(h)为Fft.real.reverse、图(i)为Normalize、图(j)为Rc-lowpass、图(k)为Smooth、图(l)为Smooth2、图(m)为Stat1、图(n)为Stat2、图(o)为Zerocross。
由图6和图7的对比可知,本实施例方法得到的水印图像比对比文献的方法得到的水印图像更为清楚。
本实施例的方法和参考文献提出的方法进行了攻击后的归一化互相关系数、误比特率、信噪比数值,如表2所示。
表2.水印方法抗恶意攻击的能力的比较