CN103413552A

CN103413552A - 一种音频水印嵌入和提取方法及装置

Info

Publication number: CN103413552A
Application number: CN2013103845170A
Authority: CN
Inventors: 彭德中; 章毅; 吕建成; 张蕾; 张海仙; 桑永胜; 郭际香; 陈睿; 魏昕
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2013-08-29
Filing date: 2013-08-29
Publication date: 2013-11-27

Abstract

本申请提供了一种音频水印嵌入和提取方法及装置，嵌入方法包括：获取音频信号并对音频信号均匀分段，获取伪噪声序列，确定与伪噪声序列对应的回声核，利用回声核和回声隐藏模型将水印位嵌入音频信号段中，得到与每个音频信号段对应的水印音频信号，将与每个音频信号段对应的水印音频信号进行组合，得到与音频信号对应的水印音频信号。本申请使用的伪噪声序列q(n)与现有的序列p(n)相比，在人耳敏感区域能量更小，这使得水印信息的不可感知性大大增加。并且，针对水印嵌入方法中所使用的伪噪声序列q(n)的特性，本申请还提供了新的解码函数，用于从水印音频信号中提取水印，基于该解码函数的音频水印提取方法具有较高的鲁棒性。

Description

一种音频水印嵌入和提取方法及装置

技术领域

本发明属于计算机安全技术领域，尤其涉及一种音频水印嵌入和提取方法及装置。

背景技术

随着信息时代的快速发展，人们可以很方便的通过网络传播、复制和操作各种数字媒体文件，因此，对各种数字媒体文件的知识产权保护也越来越重要。数字水印是可以解决这一问题的有效途径之一。数字水印是将一些水印标记嵌入到媒体文件中，文件所有者可以很方便的提取出这些信息以保护其版权。

声音信号通常是一维数据，在不降低声音质量的情况下很难嵌入额外的信息，同时人的听力系统也非常敏感，能够识别出声音细微的差别，因此，声音信号嵌入数字水印比其它媒体要困难很多。声音数字水印有三大要素：不可感知性、鲁棒性和安全性。不可感知性是指嵌入的水印人耳不能感觉出来；鲁棒性是指数字水印要有一定的健壮性，在任何环境下都能恢复出水印信息；安全性则是有密钥才能恢复出水印，没有密钥或未经授权则不能提取水印信息。

现有技术中存在基于回声隐藏技术的数字水印方案，该方案中回声隐藏模型的一般表达式为：y(n)=h(n)*x(n)，其中，x(n)为声音信号片段，h(n)为回声核，y(n)是水印信号片段，*代表卷积运算。回声核h(n)的表达式为：

h (n) = δ (n) + α \cdot p (n - n_{0})

= δ (n) + α \cdot {p (0) δ (n - n_{0}) + p (1) δ (n - n_{0} - 1)

+ . . . + p (L - 1) δ (n - n_{0} - L + 1)} - - - (1)

= δ (n) + α Σ_{i = 0}^{L - 1} p (i) δ (n - n_{0} - i)

其中，δ(n)是狄拉克函数，p(n)是长度为L的原始PN序列(伪随机序列)，α是一个很小的正加权因子，n₀是回声延迟。PN序列p(n)由+1和-1组成，即：

p (i) = \{\begin{matrix} {+ 1, - 1}, & (0 \leq i \leq L - 1) \\ 0, & (i < 0) \end{matrix} - - - (2)

图1是回声核的一个输出样例。数字水印中的位“0”和“1”通过设置n₀为一个固定正数值来嵌入到声音信号中，显然，n₀只能有两个不同的值：n₁和n₂。在解码端可以根据n₀的不同值提取出嵌入的数字水印。

PN序列p(n)是由Golomb随机性假设生成，p(n)序列由+1和-1组成，可以将整个PN序列分解成由多个+1或-1组成的小段数据的组合(AEVE，adjoiningequal-value elements)，每个AEVE段只包括+1或只包括-1。每个PN序列至少有1/4的AEVE段长度为2，如{+1,+1}，{-1,-1}，至少有1/8的AEVE段长度为3，如{+1,+1,+1}，{-1,-1,-1}，而这一属性使p(n)在人耳敏感区域的能量宽度范围内有较大的能量，从而使不可感知性很差，图2示出了回声核的能量波动图。

发明内容

有鉴于此，本发明提供了一种音频水印嵌入和提取方法及装置，用以解决现有的基于回声隐藏技术的数字水印方案中，p(n)在人耳敏感区域的能量宽度范围内有较大能量波动导致水印的不可感知性较差的问题，其技术方案如下：

第一方面，一种音频水印嵌入方法，包括：

获取音频信号并对所述音频信号均匀分段；

获取伪噪声序列，确定与所述伪噪声序列对应的回声核，其中，所述伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列：

y (n) = fix (\frac{q (n - 1) + p (n - 1) + p (n) + p (n + 1)}{4});

利用所述回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中，得到与每个音频信号段对应的水印音频信号，其中，每个音频信号段中嵌入水印信息的一个水印位；

将与每个音频信号段对应的水印音频信号进行组合，得到与所述音频信号对应的水印音频信号。

其中，所述确定与所述伪噪声序列对应的回声核包括：

通过下式确定与所述伪噪声序列q(n)对应的回声核h′(n)：

h' (n) = δ (n) + α Σ_{i = 0}^{L - 1} q (i) δ (n - n_{0} - i)

其中，δ(n)为狄拉克函数，α为正加权因子，n₀为回声延迟。

其中，所述回声隐藏模型为：

y(n)=h′(n)*x(n)

=h′(0)x(n)+h′(1)x(n-1)+...+h′(n₀)x(n-n₀-1)+

...+h′(L-1)x(n-L+1)

利用所述回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中，得到与每个音频信号段对应的水印音频信号包括：

通过下式计算h′(0)、h′(1)...h′(L-1)：

h' (n) = δ (n) + α Σ_{i = 0}^{L - 1} q (i) δ (n - n_{0} - i)

通过确定出的h′(0)、h′(1)...h′(L-1)利用所述回声隐藏模型将水印位嵌入音频信号段中，得到与每个音频信号段对应的水印音频信号。

第二方面，一种音频水印提取方法，包括：

对水印音频信号依据嵌入水印时音频信号的分段方式进行分段；

通过伪噪声序列的回声核和回声隐藏模型确定与每个水印音频信号段对应的音频信号段的倒谱分量，并确定所述伪噪声序列的自相关函数，所述伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列：

y (n) = fix (\frac{q (n - 1) + p (n - 1) + p (n) + p (n + 1)}{4});

通过所述音频信号段的倒谱分量和所述伪噪声序列的自相关函数确定解码函数；

通过所述解码函数从每个水印音频信号段中提取水印位；

将提取出的水印位进行组合，得到嵌入所述音频信号中的水印信息。

其中，所述解码函数

为：

{\overset{&OverBar;}{c}}_{y} (τ) = {{\tilde{d}}_{x} (τ) - 0.5 \cdot ({\tilde{d}}_{x} (τ - 1) + {\tilde{d}}_{x} (τ + 1))} + \frac{α}{2} {r_{qq} (τ) - 0.5 \cdot {r_{qq} (τ - 1) + r_{qq} (τ + 1)}}

其中，

{\tilde{d}}_{x} (τ) = E (d_{x} (n) q (n - τ)),

d_{x} (n) = c_{x} (n) + \frac{α}{2} q (- n + n_{0}),

c_{x} (n) = F^{- 1} {\log | X (ω) |},

r_{qq} (τ) = E (q (n - n_{0}) q (n - τ)),

d_x(n)为中间变量，c_x(n)为所述音频信号段的倒谱分量，r_qq(τ)为伪随机序列的自相关函数，E(·)表示数学期望，F^-1{·}表示傅里叶逆变换。

其中，所述通过所述解码函数从每个水印音频信号段中提取水印位包括：

计算

和其中，n₁代表1，n₂代表0；

如果

大于

则嵌入水印音频段的水印位为1，否则，嵌入水印音频段的水印位为0。

第三方面，一种音频水印嵌入装置，包括：

第一处理单元，用于获取音频信号并对所述音频信号均匀分段；

第一确定单元，用于获取伪噪声序列，确定与所述伪噪声序列对应的回声核，其中，所述伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列：

y (n) = fix (\frac{q (n - 1) + p (n - 1) + p (n) + p (n + 1)}{4});

第二确定单元，用于利用所述回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中，得到与每个音频信号段对应的水印音频信号，其中，每个音频信号段中嵌入水印信息的一个水印位；

第二处理单元，用于将与每个音频信号段对应的水印音频信号进行组合，得到与所述音频信号对应的水印音频信号。

第四方面，一种音频水印提取装置，包括：

第三处理单元，用于对水印音频信号依据嵌入水印时音频信号的分段方式进行分段；

第三确定单元，用于通过伪噪声序列的回声核和回声隐藏模型确定与每个水印音频信号段对应的音频信号段的倒谱分量，并确定所述伪噪声序列的自相关函数，所述伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列：

y (n) = fix (\frac{q (n - 1) + p (n - 1) + p (n) + p (n + 1)}{4});

第四确定单元，用于通过所述音频信号段的倒谱分量和所述伪噪声序列的自相关函数确定解码函数；

水印提取单元，用于通过所述解码函数从每个水印音频信号段中提取水印位；

水印处理单元，用于将提取出的水印位进行组合，得到嵌入所述音频信号中的水印信息。

上述技术方案具有如下有益效果：

由于本发明实施例提供的音频水印嵌入方法中所使用的伪噪声序列q(n)与现有技术中的序列p(n)相比，能量更高，在人耳敏感区域能量很小，因此，伪噪声序列q(n)的使用，使得水印信息的不可感知性大大增加。并且，针对水印嵌入方法中伪噪声序列q(n)的使用，以及伪噪声序列q(n)的特性，本发明还提供了新的解码函数，用于从含水印的音频信号中提取水印，基于该解码函数的音频水印提取方法具有较高的鲁棒性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为现有技术PN序列p(n)的回声核的一个输出样例示意图；

图2为现有技术中PN序列p(n)的回声核的幅频响应图；

图3为本发明实施例提供的一种音频水印嵌入方法的流程示意图；

图4为本发明实施例提供的伪噪声序列q(n)的回声核的幅频响应图；

图5为本发明实施例提供的一种音频水印提取方法的流程示意图；

图6为本发明实施例中L=1023和n₀=144时τ的取值与r_qq(τ)的关系图；

图7为本发明以及现有技术中水印嵌入方法的听力测试结果曲线；

图8为本发明实施例提供的一种音频水印嵌入装置的结构示意图；

图9为本发明实施例提供的一种音频水印提取装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图3，为本发明实施例提供的一种音频水印嵌入方法的流程示意图，该方法可以包括：

步骤S101：获取音频信号，并对音频信号均匀分段。

步骤S102：获取伪噪声序列q(n)，确定与伪噪声序列q(n)对应的回声核。

其中，伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列，q(n)具体为：

y (n) = fix (\frac{q (n - 1) + p (n - 1) + p (n) + p (n + 1)}{4}) - - - (4)

上式中，fix(x)的功能是取x附近且朝向0的整数。如fix(1.4)=1，fix(-3.6)=-3。

本实施例中的伪噪声序列q(n)排除掉长度超过2的AEVE段，因为长度超过2的AEVE段会产生低频分量的能量波动，影响不可感知特性，而长度小于或等于2的PN序列变化更为频繁，能量更高，在人耳敏感区域能量波动很小，不可感知性大大增加。图4示出了本实施例提供的伪噪声序列q(n)回声核的能量波动图。

其中，确定与伪噪声序列q(n)对应的回声核具体为：通过式(5)确定与伪噪声序列q(n)对应的回声核h′(n)：

h' (n) = δ (n) + α Σ_{i = 0}^{L - 1} q (i) δ (n - n_{0} - i) - - - (5)

步骤S103：利用回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中，得到与每个音频信号段对应的水印音频信号，其中，每个音频信号段中嵌入水印信息的一个水印位。

根据回声隐藏模型，对于音频信号段x(n)有：

y(n)=h′(n)*x(n)

=h′(0)x(n)+h′(1)x(n-1)+...+h′(n₀)x(n-n₀-1)+ (6)

...+h′(L-1)x(n-L+1)

计算h′(0)、h′(1)...h′(L-1)，具体的：

h′(0)=δ(0)+α·{q(0)δ(-n₀)+q(1)δ(-n₀-1)

+...+q(L-1)δ(-n₀-L+1)}

=1+α·{0+0+...+0}

=1

h′(1)=δ(1)+α·{q(0)δ(1-n₀)+q(1)δ(1-n₀-1)

+...+q(L-1)δ(1-n₀-L+1)}

=0+α·{0+0+...+0}

=0

…

h′(n₀-1)=δ(n₀-1)+α·{q(0)δ(-1)+q(1)δ(-2)

+...+q(L-1)δ(-L)}

=0+α·{0+0+...+0}

=0

h′(n₀)=δ(n₀)+α·{q(0)δ(0)+q(1)δ(-1)

+...+q(L-1)δ(-L+1)}

=0+α·{q(0)+0+...+0}

=α·q(0)

…

h′(L-1)=δ(L-1)+α·{q(0)δ(L-1-n₀)+q(1)δ(L-1-n₀-1)

+...+q(L-1)δ(0)}

=0+α·{0+0+...+q(L-1)}

=α·q(L-1)

将计算得到的h′(0)、h′(1)...h′(L-1)代入式(5)的回声隐藏模型有：

y(n)=h′(n)*x(n)

=x(n)+αq(0)x(n-n₀-1)+...+αq(L-1)x(n-L+1) (7)

根据水印位设置n₀的值为n₁、n₂，n₁、n₂分别代表水印位的“1”和“0”，利用式(7)可确定出与音频信号段x(n)对应的水印音频信号y(n)，水印音频信号y(n)即为在音频信号段x(n)中嵌入水印位后得到的信号。

步骤S104：将与每个音频信号段对应的水印音频信号进行组合，得到与音频信号对应的水印音频信号。

请参阅图5，为本发明实施例提供的一种音频水印提取方法的流程示意图，该方法与上述音频水印嵌入方法相对应，该方法可以包括：

步骤S201：对水印音频信号依据嵌入水印时音频信号的分段方式进行分段。

步骤S202：通过伪噪声序列的回声核和回声隐藏模型确定与每个水印音频信号段对应的音频信号段的倒谱分量，并确定伪随机噪声序列的自相关函数，伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列，q(n)具体为：

y (n) = fix (\frac{q (n - 1) + p (n - 1) + p (n) + p (n + 1)}{4}) .

步骤S203：通过音频信号段的倒谱分量和伪噪声序列的自相关函数确定解码函数。

步骤S204：通过解码函数从每个水印音频信号段中提取水印位。

步骤S205：将提取出的水印位进行组合，得到嵌入音频信号中的水印信息。

在上述本发明实施例的基础上，以一个音频信号段y(n)为例给出确定解码函数的具体过程：

根据上式(5)的回声核和上式(6)的回声隐藏模型，对于音频小段y(n)有：

y(n)=h′(n)*x(n)

对上式进行傅立叶变换，得到其频域的对应式为:

Y(ω)=H′(ω)X(ω) (8)

通过式(8)可进一步得到：

log|Y(ω)|=log|H′(ω)|+log|X(ω)| (9)

将式(9)两端再进行傅立叶逆变换可得：

c_y(n)=c_h′(n)+c_x(n) (10)

其中，c_y(n)=F^-1{log|Y(ω)|}，c_h′(n)=F^-1{log|H′(ω)|}，c_x(n)=F^-1{log|X(ω)|}分别为y(n),h′(n),x(n)的倒谱分量。

h′(n)的倒谱分量c_h′(n)可表示为：

c_{h'} (n) \approx \frac{α}{2} [q (n - n_{0}) + q (- n + n_{0})] - - - (11)

通过式(10)和式(11)可以得到：

c_{y} (n) = d_{x} (n) + \frac{α}{2} q (n - n_{0}) - - - (12)

其中，

d_{x} (n) = c_{x} (n) + \frac{α}{2} q (- n + n_{0}) .

定义

表示τ在时域的平均变化量(数学期望)如下：

{\tilde{c}}_{y} (τ) = E (c_{y} (n) q (n - τ)) - - - (13)

通过式(12)和式(13)可以得到：

{\tilde{c}}_{y} (τ) = E (c_{y} (n) q (n - τ))

= E [(d_{x} (n) + \frac{α}{2} q (n - n_{0})) q (n - τ)]

= E (d_{x} (n) q (n - τ) + \frac{α}{2} q (n - n_{0}) q (n - τ)) - - - (14)

= E (d_{x} (n) q (n - τ)) + \frac{α}{2} E (q (n - n_{0}) q (n - τ))

= {\tilde{d}}_{x} (τ) + \frac{α}{2} r_{qq} (τ)

其中，

r_qq(τ)为伪噪声序列q(n)的自相关函数，r_qq(τ)=E(q(n-n₀)q(n-τ))。

本实施例中的伪噪声序列q(n)有以下不等式成立：

P{q(n)≠p(n)}≥0.125

E{q(n)q(n+1)}≤-0.5

E{q(n)q(n-1)}≤-0.5

其中，0<n<L-1，P表示概率，E表示数学期望。

根据上述不等式和r_qq(τ)=E(q(n-n₀)q(n-τ))可知，r_qq(τ)在τ=n₀时有一个正的最大峰值，在τ=n₀+1和τ=n₀-1还有两个负的最大峰值。图6示出了L=1023和n₀=144时τ的取值与r_qq(τ)的关系。

由于r_qq(τ)有三个峰值，基于此，结合式(14)提出本实施例中的编码函数

{\overset{&OverBar;}{c}}_{y} (τ) = {\tilde{c}}_{y} (τ) - 0.5 \cdot ({\tilde{c}}_{y} (τ - 1) + {\tilde{c}}_{y} (τ + 1)) - - - (15)

将式(13)代入(14)得到：

{\overset{&OverBar;}{c}}_{y} (τ) = {{\tilde{d}}_{x} (τ) - 0.5 \cdot ({\tilde{d}}_{x} (τ - 1) + {\tilde{d}}_{x} (τ + 1))}

+ \frac{α}{2} {r_{qq} (τ) - 0.5 \cdot {r_{qq} (τ - 1) + r_{qq} (τ + 1)}}

= {\overset{&OverBar;}{d}}_{x} (τ) + \frac{α}{2} {\overset{&OverBar;}{r}}_{qq} (τ)

通过上述过程可确定每段水印音频信号的编码函数。在确定出每段水印音频信号的编码函数后，通过编码函数从水印音频信号中提取水印位。通过编码函数从水印音频信号中提取水印位具体过程为：计算

和

其中，n₁代表“1”，n₂代表“0”；如果

大于

则嵌入水印音频段的水印位为“1”，否则，嵌入水印音频段的水印位为“0”。将从每段水印音频信号中提出的水印位进行组合，得到水印信息。

使用250个属于五个不同组的音频剪辑作为宿主的音频信号对上述本发明实施例提供的方法进行实验：

第1组：共50组，印度和斯里兰卡的古典音乐；

第2组：共50组，包含俄罗斯，印度和西方民间音乐；

第3组：共50组包含英语和斯里兰卡乡村音乐；

第4组：共50组，包含男性和女性的讲话；

第5组：共50组，包含混合的鸟、动物、风、海浪和雨水的声音。

所有这些音频剪辑都是单通道，持续时间为20秒。采样的频率为44.1kHz，量化为16位，然后分割。每个段包含44100样品，所有音频都用在计算离散傅立叶变换（DFT）。每一个音频剪辑嵌入不同的PN序列，每个PN序列的长度接近1023。

不可感知性测试：不可感知性使用了听力测试和量化测量。

(1)听力测试

进行听力测试，两个音频信号作为宿主信号，对象选择五个男生和两个女生、年龄在20至30岁之间且听力正常者来参加听力测试。AXB样例用于检查宿主信号和水印音频信号的声音质量差异。A和B都可以是一个宿主信号或水印音频信号，但它们彼此不相同。将X随机设置为A或B，测试者被要求判断X与A、B中的哪个是相同的。显然，测试者对不可感知性低的水印信号能更容易将其和宿主信号区别开。

图7示出了本发明以及现有技术中的方法使用两个音频信号作为宿主信号进行测试得到的听力测试结果曲线。设定正确的响应率鉴别阈值为75％，从图5可以看出，本发明提供的方法无论PN序列的振幅α如何，都有更低的正确响应率，这意味着本发明实施例提供的方法比其它两种方法有更好的不可感知性。另外，由于本发明实施例提供的方法的正确响应率总是低于75％的阈值，因此人耳很难区分出宿主信号和水印信号。需要说明的是，现有技术中的方法一为：考虑在原始回声核基础上，声音在一个真实的房间中产生回声的情况，由于房间的每个物体都会共振产生回声，因此，载体音频信号应该是与多个回声信号共存的，伪随机序列PN在时域上扩散回声来提高安全性，同时伪随机序列还可以作为提取秘密信息的私钥，私钥的运用进一步提高了检测回声的权限要求；现有技术中的方法二为：建立在时扩回声隐藏上，目标是提高水印检测效率，主要通过把解码器上的宿主音频信号效果转换成在编码阶段的水印信号来实现。

(2)定量测量：将信号噪声比（SNR）作为性能指标：

SNR (dB) = 10 \times \log_{10} (\frac{\underset{n}{Σ} x {(n)}^{2}}{\underset{n}{Σ} {(y {(n)}^{2} - x (n))}^{2}})

新的PN序列的回声核在感知敏感区域有更小的幅频，这有助于不可感知性。更小幅度的区域中，其占统治的宿主信号有更高的SNR，在本实施例中这些区域相互重叠，因此SNR指数可用来间接测量不可感知性。

表1给出了本发明和现有技术提供的水印嵌入方法的平均信噪比，总共使用了200个音频片段。从表1可以看出，本发明实施例提供的发明的平均信噪比明显高于现有技术中的方法，这表明本实施例提供的方法不可感知性更好。

表1

鲁棒性测试：

对水印提取方法进行鲁棒性测试，鲁棒性测试由检测率（DR）衡量：

DR=[1-(不正确水印数目/总水印数目)]×100%

嵌入的水印可以是“1”或“0”，所以水印提取的机会水平是50％。以下是常见的在鲁棒性评价中使用的攻击方法：闭环攻击，提取的水印来自于没受任何攻击的水印信号；重复量化攻击，每个样品的水印的信号重新量化为8位；噪声攻击，在水印信号中加入随机噪声；振幅攻击，振幅攻击的水印信号的振幅皆增加1.8倍；MP3攻击，添加水印后的音频信号的MP3压缩；AAC攻击，水印的音频信号进行MPEG-4音频编码的压缩；间距缩放攻击，水印信号的间距增加10％。

比较三种方法的鲁棒性，假定现有方法一和方法二的SNR减少至22dB，提出的方法的SNR保持为28dB，即本实施例提供方法的感知质量大于其它方法6dB。表3显示了这些方法在各种攻击下的DR值。从3可以看出，本实施例提供的方法的鲁棒性最好。

表2

由于本发明实施例提供的音频水印嵌入方法中所使用的伪噪声序列q(n)与现有技术中的序列p(n)相比，能量更高，在人耳敏感区域能量更小，因此，伪噪声序列q(n)的使用，使得水印信息的不可感知性大大增加。并且，针对水印嵌入方法中伪噪声序列q(n)的使用，以及伪噪声序列q(n)的特性，本发明还提供了新的解码函数，用于从含水印的音频信号中提取水印，基于该解码函数的音频水印提取方法具有较高的鲁棒性。

与上述的音频水印嵌入方法相对应，本发明实施例还提供了一种音频水印嵌入装置，请参阅图8，为该装置的结构示意图，该装置可以包括：第一处理单元101、第一确定单元102、第二确定单元103和第二处理单元104。其中：

第一处理单元101，用于获取音频信号并对音频信号均匀分段。

第一确定单元102，用于获取伪噪声序列，确定与伪噪声序列对应的回声核，其中，伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列，q(n)具体为：

y (n) = fix (\frac{q (n - 1) + p (n - 1) + p (n) + p (n + 1)}{4}) .

第二确定单元103，用于利用回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中，得到与每个音频信号段对应的水印音频信号，其中，每个音频信号段中嵌入水印信息的一个水印位。

第二处理单元104，用于将与每个音频信号段对应的水印音频信号进行组合，得到与音频信号对应的水印音频信号。

与上述的音频水印提取方法相对应，本发明实施例还提供了一种音频水印提取装置，请参阅图9，为该装置的结构示意图，该装置可以包括：第三处理单元201、第三确定单元202、第四确定单元203、水印提取单元204和水印处理单元205。其中：

第三处理单元201，用于对水印音频信号依据嵌入水印时音频信号的分段方式进行分段。

第三确定单元202，用于通过伪噪声序列的回声核和回声隐藏模型确定与每个水印音频信号段对应的音频信号段的倒谱分量，并确定伪噪声序列的自相关函数，伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列，q(n)具体为：

y (n) = fix (\frac{q (n - 1) + p (n - 1) + p (n) + p (n + 1)}{4}) .

第四确定单元203，用于通过音频信号段的倒谱分量和伪噪声序列的自相关函数确定解码函数。

水印提取单元204，用于通过解码函数从每个水印音频信号段中提取水印位。

水印处理单元205，用于将提取出的水印位进行组合，得到嵌入音频信号中的水印信息。

由于本发明实施例提供的音频水印嵌入装置使用的伪噪声序列q(n)与现有技术中的序列p(n)相比，能量更高，在人耳敏感区域能量更小，因此，伪噪声序列q(n)的使用，使得水印信息的不可感知性大大增加。并且，基于伪噪声序列q(n)的使用，以及伪噪声序列q(n)的特性，本发明实施例提供的音频水印提取装置使用了新的解码函数从含水印的音频信号中提取水印，提高了音频水印的鲁棒性。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种音频水印嵌入方法，其特征在于，包括：

获取音频信号并对所述音频信号均匀分段；

y (n) = fix (\frac{q (n - 1) + p (n - 1) + p (n) + p (n + 1)}{4});

2.根据权利要求1所述的方法，其特征在于，所述确定与所述伪噪声序列对应的回声核包括：

通过下式确定与所述伪噪声序列q(n)对应的回声核h′(n)：

h' (n) = δ (n) + α Σ_{i = 0}^{L - 1} q (i) δ (n - n_{0} - i)

3.根据权利要求2所述的方法，其特征在于，所述回声隐藏模型为：

y(n)=h′(n)*x(n)

=h′(0)x(n)+h′(1)x(n-1)+...+h′(n₀)x(n-n₀-1)+

...+h′(L-1)x(n-L+1)

通过下式计算h′(0)、h′(1)...h′(L-1)：

h' (n) = δ (n) + α Σ_{i = 0}^{L - 1} q (i) δ (n - n_{0} - i)

4.一种音频水印提取方法，其特征在于，包括：

y (n) = fix (\frac{q (n - 1) + p (n - 1) + p (n) + p (n + 1)}{4});

通过所述解码函数从每个水印音频信号段中提取水印位；

5.根据权利要求2所述的方法，其特征在于，所述解码函数

为：

{\overset{&OverBar;}{c}}_{y} (τ) = {{\tilde{d}}_{x} (τ) - 0.5 \cdot ({\tilde{d}}_{x} (τ - 1) + {\tilde{d}}_{x} (τ + 1))} + \frac{α}{2} {r_{qq} (τ) - 0.5 \cdot {r_{qq} (τ - 1) + r_{qq} (τ + 1)}}

其中，

{\tilde{d}}_{x} (τ) = E (d_{x} (n) q (n - τ)),

d_{x} (n) = c_{x} (n) + \frac{α}{2} q (- n + n_{0}),

c_{x} (n) = F^{- 1} {\log | X (ω) |},

r_{qq} (τ) = E (q (n - n_{0}) q (n - τ)),

6.根据权利要求5所述的方法，其特征在于，所述通过所述解码函数从每个水印音频信号段中提取水印位包括：

计算

和

其中，n₁代表1，n₂代表0；

如果大于

7.一种音频水印嵌入装置，其特征在于，包括：

y (n) = fix (\frac{q (n - 1) + p (n - 1) + p (n) + p (n + 1)}{4});

8.一种音频水印提取装置，其特征在于，包括：

y (n) = fix (\frac{q (n - 1) + p (n - 1) + p (n) + p (n + 1)}{4});