CN102157154A

CN102157154A - 基于音频内容的非均匀离散余弦变换音频可靠性认证方法

Info

Publication number: CN102157154A
Application number: CN2011100359472A
Authority: CN
Inventors: 黄雄华; 崔更申; 周巍; 李宏周; 刘达见
Original assignee: Guilin University of Electronic Technology
Current assignee: Guilin University of Electronic Technology
Priority date: 2011-01-28
Filing date: 2011-01-28
Publication date: 2011-08-17
Anticipated expiration: 2031-01-28
Also published as: CN102157154B

Abstract

本发明提出一种基于音频内容生成水印的非均匀余弦变换NDCT的音频可靠性认证方法。水印嵌入过程首先对原始音频A分帧，然后对每帧A_i作三级小波变换3DWT，量化三级小波近似系数cA3的均值m_i生成水印w_i，量化长为

同时修改cA3各系数使其均值位于量化区间的中点并作NDCT变换，并量化

嵌入水印w_i，量化长为

最后每帧作逆NDCT和逆3DWT并连接所有含水印帧

和不含水印的音频部分

完成水印的嵌入。音频认证首先对待认证音频A^*分帧，对每帧作3DWT，以

为量化长量化三级小波近似系数cA3^*的均值重构水印

然后对cA3^*作NDCT变换，并以为量化长量化

提取水印

计算

和

的归一化值认证音频的完整性。与需满足

(N是NDCT矩阵维数，S是其第二列元素的和)。本发明适合于对数据可靠性要求很高的领域数据完整性的认证。

Description

基于音频内容的非均匀离散余弦变换音频可靠性认证方法

技术领域

本发明是一种基于音频内容生成水印的音频可靠性认证方法，适合于数字音频传输和存储中可靠性和完整性认证，并能定位非同步攻击下被恶意篡改的音频位置。

技术背景

在计算机技术和网络技术迅速发展的今天，随着音频压缩技术和计算机应用软件技术的不断发展，数字音频的传输、复制、存储、修改越来越方便、快捷，随之造成的盗版、侵权、篡改等问题也凸现出来；并且，由于传输线路的安全性因素，音频在传输中也可能发生误码，丢包等问题，因此迫切需要数字音频的认证技术来鉴别知识产权的归属性和传输内容的可靠性。目前，解决该问题的数字水印技术成为国内外学者研究的热点。根据应用目的的不同，数字音频水印可分为鲁棒水印、脆弱水印和半脆弱水印。鲁棒水印主要用于电子作品的版权保护，载体音频在受到一定的扰动后，水印仍能被检测出来；半脆弱水印对常规的信号处理操作有一定的抵抗力，对恶意的篡改无法容忍，但能定位篡改位置，一般适用于非重要的音频数据的检测认证；在数据的可靠性要求很高的场合中，一般通过脆弱音频水印方案来认证信号的可靠性与完整性，脆弱水印是一种对篡改十分敏感的水印技术。这些水印方法中几乎都采用了外部的比特信息作为水印，或者随机数比特序列，或者M序列，或者混沌序列，或者二值图像，或者灰度图像或者彩色图像。王宏霞教授的论文《基于质心的混合域半脆弱音频水印算法》(中国科学：信息科学，2010，40(2)：313～326.)和范明泉博士的论文《基于音频内容的混合域脆弱水印算法》(铁道学报，2010，32(1)：118～122)均指出已有采用二值图像作为水印的脆弱音频水印算法，会带来因传输过程中二值图像被篡改引起的虚警和认证无法判别的问题。灰度图像和彩色图像也存在同样的问题。由密钥方式产生水印序列的随机数方式、M序列方式、混沌序列方式，其本质都是一比特水印方法，无法对篡改进行定位，同时，也因其存在虚警问题，不能满足一些场合鉴定认证等的需要。目前，已有学者开始探索基于音频内容的局部化水印方法。因此，研究基于音频内容的水印生成技术和认证方法具有重要的现实意义。

发明内容

目前已有的以脆弱水印技术为基础的音频认证方法，其水印一般来自外部的图像或者比特序列，与音频的内容缺少直接的联系，要么篡改定位困难，要么存在虚警和认证无法判别的问题，本发明提供一种基于音频内容生成多比特水印的音频可靠性认证方法。先对音频分帧，对每帧作三级离散小波变换(3DWT)，量化三级小波近似系数cA3的均值m_i生成水印；同时，修改cA3各系数，使其均值位于相应量化区间的中点，然后对其作非均匀离散余弦变换(NDCT)，并量化变换第一个交流系数

嵌入水印。音频的认证首先对待认证的信号分帧，对每帧作3DWT并计算cA3^*的均值

通过量化的方法提取水印

同时，对每帧cA3^*作NDCT变换，量化其第一个交流系数

重构水印

通过计算和

的归一化相关值对音频作完整性认证，通过

和

的积运算定位篡改位置。

为保证认证的安全性和可靠性，防止认证的安全性攻击，NDCT的参数α_i由密钥控制的混沌序列通过线性映射获得。

为实现这样的目的，本发明设计的音频认证方案中，包括4个部分：1、水印的生成部分；2、NDCT矩阵的构造部分；3、水印的嵌入部分；4、音频的认证部分。每个部分说明如下：

1、水印的生成

首先对原始音频信号A分帧，帧长为l_f，帧数即水印长l_w；然后对每帧作3DWT，并计算每帧cA3的均值m_i；最后量化m_i，量化长度为

生成水印序列w_i(w_i∈{1，-1})，并对m_i作如下处理：

表示向下取整函数，式(1)的实质是计算m_i相应量化区间的中值。并按下式修改cA3

{cA 3}^{T} (i, j) = cA 3 (i, j) - m_{i} + m_{i}^{T} - - - (2)

其中i是帧序号，j是帧中系数的序号，式(2)的实质是修改均值使其位于相应量化区间的中点。

2、NDCT矩阵的构造

NDCT矩阵如式(3)所示：

N表示矩阵维数。构造NDCT矩阵就是生成相应的α_i。本发明α_i由式(4)生成

a_i＝i+x_i-0.5 (4)

其中i自然数，x_i是密钥控制的Logistic映射序列，具体由公式(5)产生

x_i+1＝u·x_i·(1-x_i) (5)

公式(5)中0.3699456＜u≤4，x_i∈(0，1)，u和初值x₁是非公开的已知密钥K。

在NDCT矩阵Λ产生后，计算其逆阵Λ^-1。

3、水印的嵌入部分

对步骤1中的cA3^T(i，j)作NDCT变换，变换矩阵为Λ，变换后系数为

量化

(第二个系数)嵌入水印，量化长度取

量化后的系数记作

并对作逆NDCT变换，变换矩阵为Λ^-1，再作逆3DWT得到含水印的各帧

依次连接

及没嵌入水印的音频部分

完成水印的嵌入过程。

4、音频的认证部分

先将待认证音频A^*分帧，并对每帧作3DWT，量化cA3的均值

重构水印序列

然后对cA3作NDCT变换，变换矩阵为Λ，变换系数为以长

量化

(第二个系数)提取水印

然后计算和

的归一化相关值判断认证音频的完整性。如受到非同步攻击的恶意篡改，计算和

的积定位篡改的位置。

本发明充分利用了音频内容自身的特点生成水印，水印的嵌入过程和音频的认证使用混沌产生NDCT变换矩阵参数a_i，加强了安全性。因为水印与音频内容紧密相关，音频遭受篡改，生成的水印和重构的水印都会发生大的变动，可以方便的检测到篡改并能定位非同步攻击的篡改位置。

附图说明

图1为水印的生成过程图。

图2为NDCT矩阵的生成过程图。

图3水印的嵌入过程图。

图4音频的认证过程图。

图5认证实例。其中5(a)为一原始音频波形；5(b)为嵌入水印的波形；5(c)为篡改部分内容后的波形；5(d)为篡改定位结果。

具体实施方式

以下结合附图和实施例对本发明的技术方案作进一步描述。

1、水印的生成。

由如图1的流程生成水印。音频用A＝{a_i|a_i，1≤i≤l_a}表示，l_a是音频的长度。帧长l_f为已知，本发明的实例中l_f＝256。帧数即水印长度为

表示向下取整函数，分帧后各音频帧用A_i表示。对A_i作3DWT，用cA3(i，j)表示三级小波分解后近似分量的系数，i表示帧号，j表示该帧第j个小波系数，然后计算各帧三级小波系数近似分量cA3的均值m_i，并根据奇偶量化原理，按式(6)量化m_i生成水印比特序列w_i，其中

是量化步长，mod(·)表示取模运算。

\{\begin{matrix} \mod (m_{i} / l_{1}^{q}, 2) \leq 1, & w_{i} = + 1 \\ \mod (m_{i} / l_{1}^{q}, 2) > 1, & w_{i} = - 1 \end{matrix} - - - (6)

2、NDCT矩阵的构造。

NDCT矩阵的构造如图2所示。首先设置Logistical映射的初值x₁和参数u(0.3699456＜u≤4)作为密钥K，按x_i+1＝u·x_i·(1-x_i)生成混沌序列x_i，x_i∈(0，1)，并由a_i＝i+x_i-0.5映射生成a_i(i是自然数)，由a_i确定的NDCT矩阵如下所示：

在Λ矩阵产生后，判断其逆矩阵是否存在，如果存在，计算其逆阵Λ^-1，如果逆矩阵不存在需重新设置初值x₁，本发明中用随机数发生器产生的随机数作初值作了1万次实验，所得Λ矩阵均可逆。矩阵的维数N＝l_f/2³。本发明中具体实施例中u＝3.85，x₁＝0.6。

3、水印的嵌入过程

水印嵌入过程如图3的流程所示。对音频A分帧，帧长为l_f，帧数即水印长l_w，每帧记为A_i，对A_i作3DWT变换，并按关系式

修改变换后的系数cA3(i，j)。其中，

m_i是三级小波近似系数均值，

是向下取整函数。

对修改后的三级小波近似系数cA3^T(i，j)作NDCT变换，变换矩阵为Λ，变换后系数为通过量化第一个交流系数

嵌入水印w_i，量化长度为

水印嵌入后再作逆NDCT变换和逆3DWT并连接各含水印音频帧

和不含水印的音频部分

获得含水印音频。

本发明的具体实施例中，随机截取了名为“going home.wav”歌曲的一段波形，如图5(a)所示，嵌入水印的音频波形如图5(b)所示，从波形上难以觉察到差别，客观的信噪比SNR＝41.83dB。一般地，SNR＞22dB就难以感觉听觉上的差异，因此客观的SNR值也证明了水印的不可听性。

为保证本发明所要达到的完整性认证的目的，两次的量化长度

和

需要满足合适的数学关系式。具体说明如下：

假设水印嵌入过程中量化误差是e，那么在NDCT逆变换每个系数发生的变化量为e×c_r，1，c_r，1是Λ^-1的第2列的第r个元素。那么cA3均值的变化量

N是Λ^-1的维数。根据量化原理，在音频无信号处理和其它攻击情况下能准确检测到水印的条件是：

| Δ | \leq l_{1}^{q} / 2 - - - (7)

即

| e \times (\underset{r}{Σ} c_{r, 1}) / N | \leq l_{1}^{q} / 2 - - - (8)

标记

那么(8)可写为

| e | \leq \frac{N \times l_{1}^{q}}{2 | S |} - - - (9)

根据量化原理

联立(9)(10)及水印能检测原则极限

l_{2}^{q} \times | S | \times \frac{2}{N} \leq l_{1}^{q} - - - (11)

(11)表明了水印能实现无虚警检测量化长度

满足的数学关系式。

对DCT而言，S＝0，本发明NDCT的构造约束α_i在i附近波动，S值较小，在实际选择

时，首先选择再根据(11)，确定

一般地，使

并保持二者在同一数量级。本发明的实例中

选择0.01，

选择0.005。

4、音频的认证过程。

音频的认证过程如图4所示。首先将待认证的音频A^*以帧长l_f分帧，然后将各帧

作三级小波变换，cA3^*(i，j)为其三级小波近似系数，其中i是帧号，j是帧中系数序号。计算各帧cA3^*(i，j)统计均值

并以量化长度

量化

重构水印w^*(i)；同时，对各帧cA3^*(i，j)作NDCT变换，变换矩阵为Λ。对NDCT变换后的第一个交流系数

进行量化提取水印w^**(i)。然后按式(12)计算w^*(i)和w^**(i)的归一化相关值以认证音频的完整性。

ρ = \frac{1}{l_{w}} \underset{j}{Σ} w^{*} (j) \times w^{* *} (j) - - - (12)

公式(12)用来表示两个信号的相似程度，其值在[0，1]间，如果值为0，表示两个信号无关，如果值为1，表示两个信号完全相同。值越大表示两个信号越接近，因此可用于信号的完整性认证。在完整性认证中ρ大于设定的门限表示音频是完整的，否则音频不是完整的。同时，按式(13)定位音频篡改位置。

x(j)＝w^*(j)×w^**(j) (13)

因为w^*(j)、w^**(j)∈{-1，+1}，所以x(j)＝-1表示所在的帧被篡改。

本发明的实例中图5(c)为恶意篡改后的水印音频波形，图5(d)为篡改定位的结果，其中值为-1的部分表示被篡改的音频位置。

Claims

1.基于音频内容的非均匀离散余弦变换的音频可靠性认证方法，其特征在于含有下述步骤：

(1)通过量化音频帧三级小波近似系数cA3均值m_i生成水印序列w(i)；

(2)通过量化非均匀离散余弦变换的第一个交流系数嵌入水印，非均匀离散余弦变换矩阵Λ的参数a_i由Logistical混沌映射和线性映射生成；

(3)待认证的音频，通过重构水印比特w^*(i)和提取水印比特w^**(i)的归一化相关值ρ进行完整性认证，通过计算其积定位篡改位置。

2.如权利要求1所述的基于音频内容的非均匀离散余弦变换的音频可靠性认证方法，其特征在于：水印w(i)由音频帧的三级小波近似系数cA3量化而成，水印与音频内容相关联，音频内容受到篡改，水印序列也发生变化。

3.如权利要求1所述的基于音频内容的非均匀离散余弦变换的音频可靠性认证方法，其特征在于：步骤(2)中非均匀离散余弦变换矩阵Λ的参数a_i由密钥控制的混沌序列经过映射生成。具体为：a_i＝i+x_i-0.5；其中i是自然数，x_i是由Logistical映射产生的混沌序列，即x_i+1＝u·x_i·(1-x_i)，其中0.3699456＜u≤4，x_i∈(0，1)；由u和初值x₁组成密钥K控制混沌序列。生成的Λ矩阵如(1)所示：

其中N是矩阵维数。

4.如权利要求1所述的基于音频内容的非均匀离散余弦变换的音频可靠性认证方法，其特征在于：步骤(1)中量化长度

和步骤(2)中量化长度

满足关系

式(2)：

l_{2}^{q} \times | S | \times 2 / N \leq l_{1}^{q} - - - (2)

其中N是Λ矩阵维数，S是Λ的逆阵Λ^-1的第二列系数的和。