CN103413552A - 一种音频水印嵌入和提取方法及装置 - Google Patents

一种音频水印嵌入和提取方法及装置 Download PDF

Info

Publication number
CN103413552A
CN103413552A CN2013103845170A CN201310384517A CN103413552A CN 103413552 A CN103413552 A CN 103413552A CN 2013103845170 A CN2013103845170 A CN 2013103845170A CN 201310384517 A CN201310384517 A CN 201310384517A CN 103413552 A CN103413552 A CN 103413552A
Authority
CN
China
Prior art keywords
watermark
audio signal
pseudo noise
noise sequence
echo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013103845170A
Other languages
English (en)
Inventor
彭德中
章毅
吕建成
张蕾
张海仙
桑永胜
郭际香
陈睿
魏昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN2013103845170A priority Critical patent/CN103413552A/zh
Publication of CN103413552A publication Critical patent/CN103413552A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)

Abstract

本申请提供了一种音频水印嵌入和提取方法及装置,嵌入方法包括:获取音频信号并对音频信号均匀分段,获取伪噪声序列,确定与伪噪声序列对应的回声核,利用回声核和回声隐藏模型将水印位嵌入音频信号段中,得到与每个音频信号段对应的水印音频信号,将与每个音频信号段对应的水印音频信号进行组合,得到与音频信号对应的水印音频信号。本申请使用的伪噪声序列q(n)与现有的序列p(n)相比,在人耳敏感区域能量更小,这使得水印信息的不可感知性大大增加。并且,针对水印嵌入方法中所使用的伪噪声序列q(n)的特性,本申请还提供了新的解码函数,用于从水印音频信号中提取水印,基于该解码函数的音频水印提取方法具有较高的鲁棒性。

Description

一种音频水印嵌入和提取方法及装置
技术领域
本发明属于计算机安全技术领域,尤其涉及一种音频水印嵌入和提取方法及装置。
背景技术
随着信息时代的快速发展,人们可以很方便的通过网络传播、复制和操作各种数字媒体文件,因此,对各种数字媒体文件的知识产权保护也越来越重要。数字水印是可以解决这一问题的有效途径之一。数字水印是将一些水印标记嵌入到媒体文件中,文件所有者可以很方便的提取出这些信息以保护其版权。
声音信号通常是一维数据,在不降低声音质量的情况下很难嵌入额外的信息,同时人的听力系统也非常敏感,能够识别出声音细微的差别,因此,声音信号嵌入数字水印比其它媒体要困难很多。声音数字水印有三大要素:不可感知性、鲁棒性和安全性。不可感知性是指嵌入的水印人耳不能感觉出来;鲁棒性是指数字水印要有一定的健壮性,在任何环境下都能恢复出水印信息;安全性则是有密钥才能恢复出水印,没有密钥或未经授权则不能提取水印信息。
现有技术中存在基于回声隐藏技术的数字水印方案,该方案中回声隐藏模型的一般表达式为:y(n)=h(n)*x(n),其中,x(n)为声音信号片段,h(n)为回声核,y(n)是水印信号片段,*代表卷积运算。回声核h(n)的表达式为:
h ( n ) = δ ( n ) + α · p ( n - n 0 )
= δ ( n ) + α · { p ( 0 ) δ ( n - n 0 ) + p ( 1 ) δ ( n - n 0 - 1 )
+ . . . + p ( L - 1 ) δ ( n - n 0 - L + 1 ) } - - - ( 1 )
= δ ( n ) + α Σ i = 0 L - 1 p ( i ) δ ( n - n 0 - i )
其中,δ(n)是狄拉克函数,p(n)是长度为L的原始PN序列(伪随机序列),α是一个很小的正加权因子,n0是回声延迟。PN序列p(n)由+1和-1组成,即:
p ( i ) = { + 1 , - 1 } , ( 0 &le; i &le; L - 1 ) 0 , ( i < 0 ) - - - ( 2 )
图1是回声核的一个输出样例。数字水印中的位“0”和“1”通过设置n0为一个固定正数值来嵌入到声音信号中,显然,n0只能有两个不同的值:n1和n2。在解码端可以根据n0的不同值提取出嵌入的数字水印。
PN序列p(n)是由Golomb随机性假设生成,p(n)序列由+1和-1组成,可以将整个PN序列分解成由多个+1或-1组成的小段数据的组合(AEVE,adjoiningequal-value elements),每个AEVE段只包括+1或只包括-1。每个PN序列至少有1/4的AEVE段长度为2,如{+1,+1},{-1,-1},至少有1/8的AEVE段长度为3,如{+1,+1,+1},{-1,-1,-1},而这一属性使p(n)在人耳敏感区域的能量宽度范围内有较大的能量,从而使不可感知性很差,图2示出了回声核的能量波动图。
发明内容
有鉴于此,本发明提供了一种音频水印嵌入和提取方法及装置,用以解决现有的基于回声隐藏技术的数字水印方案中,p(n)在人耳敏感区域的能量宽度范围内有较大能量波动导致水印的不可感知性较差的问题,其技术方案如下:
第一方面,一种音频水印嵌入方法,包括:
获取音频信号并对所述音频信号均匀分段;
获取伪噪声序列,确定与所述伪噪声序列对应的回声核,其中,所述伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列:
Figure BDA00003742118500022
y ( n ) = fix ( q ( n - 1 ) + p ( n - 1 ) + p ( n ) + p ( n + 1 ) 4 ) ;
利用所述回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中,得到与每个音频信号段对应的水印音频信号,其中,每个音频信号段中嵌入水印信息的一个水印位;
将与每个音频信号段对应的水印音频信号进行组合,得到与所述音频信号对应的水印音频信号。
其中,所述确定与所述伪噪声序列对应的回声核包括:
通过下式确定与所述伪噪声序列q(n)对应的回声核h′(n):
h &prime; ( n ) = &delta; ( n ) + &alpha; &Sigma; i = 0 L - 1 q ( i ) &delta; ( n - n 0 - i )
其中,δ(n)为狄拉克函数,α为正加权因子,n0为回声延迟。
其中,所述回声隐藏模型为:
y(n)=h′(n)*x(n)
=h′(0)x(n)+h′(1)x(n-1)+...+h′(n0)x(n-n0-1)+
...+h′(L-1)x(n-L+1)
利用所述回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中,得到与每个音频信号段对应的水印音频信号包括:
通过下式计算h′(0)、h′(1)...h′(L-1):
h &prime; ( n ) = &delta; ( n ) + &alpha; &Sigma; i = 0 L - 1 q ( i ) &delta; ( n - n 0 - i )
通过确定出的h′(0)、h′(1)...h′(L-1)利用所述回声隐藏模型将水印位嵌入音频信号段中,得到与每个音频信号段对应的水印音频信号。
第二方面,一种音频水印提取方法,包括:
对水印音频信号依据嵌入水印时音频信号的分段方式进行分段;
通过伪噪声序列的回声核和回声隐藏模型确定与每个水印音频信号段对应的音频信号段的倒谱分量,并确定所述伪噪声序列的自相关函数,所述伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列:
Figure BDA00003742118500033
y ( n ) = fix ( q ( n - 1 ) + p ( n - 1 ) + p ( n ) + p ( n + 1 ) 4 ) ;
通过所述音频信号段的倒谱分量和所述伪噪声序列的自相关函数确定解码函数;
通过所述解码函数从每个水印音频信号段中提取水印位;
将提取出的水印位进行组合,得到嵌入所述音频信号中的水印信息。
其中,所述解码函数
Figure BDA00003742118500041
为:
c &OverBar; y ( &tau; ) = { d ~ x ( &tau; ) - 0.5 &CenterDot; ( d ~ x ( &tau; - 1 ) + d ~ x ( &tau; + 1 ) ) } + &alpha; 2 { r qq ( &tau; ) - 0.5 &CenterDot; { r qq ( &tau; - 1 ) + r qq ( &tau; + 1 ) } }
其中, d ~ x ( &tau; ) = E ( d x ( n ) q ( n - &tau; ) ) , d x ( n ) = c x ( n ) + &alpha; 2 q ( - n + n 0 ) ,
c x ( n ) = F - 1 { log | X ( &omega; ) | } , r qq ( &tau; ) = E ( q ( n - n 0 ) q ( n - &tau; ) ) ,
dx(n)为中间变量,cx(n)为所述音频信号段的倒谱分量,rqq(τ)为伪随机序列的自相关函数,E(·)表示数学期望,F-1{·}表示傅里叶逆变换。
其中,所述通过所述解码函数从每个水印音频信号段中提取水印位包括:
计算
Figure BDA00003742118500047
其中,n1代表1,n2代表0;
如果
Figure BDA00003742118500049
大于
Figure BDA000037421185000410
则嵌入水印音频段的水印位为1,否则,嵌入水印音频段的水印位为0。
第三方面,一种音频水印嵌入装置,包括:
第一处理单元,用于获取音频信号并对所述音频信号均匀分段;
第一确定单元,用于获取伪噪声序列,确定与所述伪噪声序列对应的回声核,其中,所述伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列:
Figure BDA000037421185000411
y ( n ) = fix ( q ( n - 1 ) + p ( n - 1 ) + p ( n ) + p ( n + 1 ) 4 ) ;
第二确定单元,用于利用所述回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中,得到与每个音频信号段对应的水印音频信号,其中,每个音频信号段中嵌入水印信息的一个水印位;
第二处理单元,用于将与每个音频信号段对应的水印音频信号进行组合,得到与所述音频信号对应的水印音频信号。
第四方面,一种音频水印提取装置,包括:
第三处理单元,用于对水印音频信号依据嵌入水印时音频信号的分段方式进行分段;
第三确定单元,用于通过伪噪声序列的回声核和回声隐藏模型确定与每个水印音频信号段对应的音频信号段的倒谱分量,并确定所述伪噪声序列的自相关函数,所述伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列:
Figure BDA00003742118500051
y ( n ) = fix ( q ( n - 1 ) + p ( n - 1 ) + p ( n ) + p ( n + 1 ) 4 ) ;
第四确定单元,用于通过所述音频信号段的倒谱分量和所述伪噪声序列的自相关函数确定解码函数;
水印提取单元,用于通过所述解码函数从每个水印音频信号段中提取水印位;
水印处理单元,用于将提取出的水印位进行组合,得到嵌入所述音频信号中的水印信息。
上述技术方案具有如下有益效果:
由于本发明实施例提供的音频水印嵌入方法中所使用的伪噪声序列q(n)与现有技术中的序列p(n)相比,能量更高,在人耳敏感区域能量很小,因此,伪噪声序列q(n)的使用,使得水印信息的不可感知性大大增加。并且,针对水印嵌入方法中伪噪声序列q(n)的使用,以及伪噪声序列q(n)的特性,本发明还提供了新的解码函数,用于从含水印的音频信号中提取水印,基于该解码函数的音频水印提取方法具有较高的鲁棒性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术PN序列p(n)的回声核的一个输出样例示意图;
图2为现有技术中PN序列p(n)的回声核的幅频响应图;
图3为本发明实施例提供的一种音频水印嵌入方法的流程示意图;
图4为本发明实施例提供的伪噪声序列q(n)的回声核的幅频响应图;
图5为本发明实施例提供的一种音频水印提取方法的流程示意图;
图6为本发明实施例中L=1023和n0=144时τ的取值与rqq(τ)的关系图;
图7为本发明以及现有技术中水印嵌入方法的听力测试结果曲线;
图8为本发明实施例提供的一种音频水印嵌入装置的结构示意图;
图9为本发明实施例提供的一种音频水印提取装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图3,为本发明实施例提供的一种音频水印嵌入方法的流程示意图,该方法可以包括:
步骤S101:获取音频信号,并对音频信号均匀分段。
步骤S102:获取伪噪声序列q(n),确定与伪噪声序列q(n)对应的回声核。
其中,伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列,q(n)具体为:
Figure BDA00003742118500074
y ( n ) = fix ( q ( n - 1 ) + p ( n - 1 ) + p ( n ) + p ( n + 1 ) 4 ) - - - ( 4 )
上式中,fix(x)的功能是取x附近且朝向0的整数。如fix(1.4)=1,fix(-3.6)=-3。
本实施例中的伪噪声序列q(n)排除掉长度超过2的AEVE段,因为长度超过2的AEVE段会产生低频分量的能量波动,影响不可感知特性,而长度小于或等于2的PN序列变化更为频繁,能量更高,在人耳敏感区域能量波动很小,不可感知性大大增加。图4示出了本实施例提供的伪噪声序列q(n)回声核的能量波动图。
其中,确定与伪噪声序列q(n)对应的回声核具体为:通过式(5)确定与伪噪声序列q(n)对应的回声核h′(n):
h &prime; ( n ) = &delta; ( n ) + &alpha; &Sigma; i = 0 L - 1 q ( i ) &delta; ( n - n 0 - i ) - - - ( 5 )
步骤S103:利用回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中,得到与每个音频信号段对应的水印音频信号,其中,每个音频信号段中嵌入水印信息的一个水印位。
根据回声隐藏模型,对于音频信号段x(n)有:
y(n)=h′(n)*x(n)
=h′(0)x(n)+h′(1)x(n-1)+...+h′(n0)x(n-n0-1)+   (6)
...+h′(L-1)x(n-L+1)
计算h′(0)、h′(1)...h′(L-1),具体的:
h′(0)=δ(0)+α·{q(0)δ(-n0)+q(1)δ(-n0-1)
+...+q(L-1)δ(-n0-L+1)}
=1+α·{0+0+...+0}
=1
h′(1)=δ(1)+α·{q(0)δ(1-n0)+q(1)δ(1-n0-1)
+...+q(L-1)δ(1-n0-L+1)}
=0+α·{0+0+...+0}
=0
h′(n0-1)=δ(n0-1)+α·{q(0)δ(-1)+q(1)δ(-2)
+...+q(L-1)δ(-L)}
=0+α·{0+0+...+0}
=0
h′(n0)=δ(n0)+α·{q(0)δ(0)+q(1)δ(-1)
+...+q(L-1)δ(-L+1)}
=0+α·{q(0)+0+...+0}
=α·q(0)
h′(L-1)=δ(L-1)+α·{q(0)δ(L-1-n0)+q(1)δ(L-1-n0-1)
+...+q(L-1)δ(0)}
=0+α·{0+0+...+q(L-1)}
=α·q(L-1)
将计算得到的h′(0)、h′(1)...h′(L-1)代入式(5)的回声隐藏模型有:
y(n)=h′(n)*x(n)
=x(n)+αq(0)x(n-n0-1)+...+αq(L-1)x(n-L+1)   (7)
根据水印位设置n0的值为n1、n2,n1、n2分别代表水印位的“1”和“0”,利用式(7)可确定出与音频信号段x(n)对应的水印音频信号y(n),水印音频信号y(n)即为在音频信号段x(n)中嵌入水印位后得到的信号。
步骤S104:将与每个音频信号段对应的水印音频信号进行组合,得到与音频信号对应的水印音频信号。
请参阅图5,为本发明实施例提供的一种音频水印提取方法的流程示意图,该方法与上述音频水印嵌入方法相对应,该方法可以包括:
步骤S201:对水印音频信号依据嵌入水印时音频信号的分段方式进行分段。
步骤S202:通过伪噪声序列的回声核和回声隐藏模型确定与每个水印音频信号段对应的音频信号段的倒谱分量,并确定伪随机噪声序列的自相关函数,伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列,q(n)具体为:
Figure BDA00003742118500091
y ( n ) = fix ( q ( n - 1 ) + p ( n - 1 ) + p ( n ) + p ( n + 1 ) 4 ) .
步骤S203:通过音频信号段的倒谱分量和伪噪声序列的自相关函数确定解码函数。
步骤S204:通过解码函数从每个水印音频信号段中提取水印位。
步骤S205:将提取出的水印位进行组合,得到嵌入音频信号中的水印信息。
在上述本发明实施例的基础上,以一个音频信号段y(n)为例给出确定解码函数的具体过程:
根据上式(5)的回声核和上式(6)的回声隐藏模型,对于音频小段y(n)有:
y(n)=h′(n)*x(n)
对上式进行傅立叶变换,得到其频域的对应式为:
Y(ω)=H′(ω)X(ω)   (8)
通过式(8)可进一步得到:
log|Y(ω)|=log|H′(ω)|+log|X(ω)|   (9)
将式(9)两端再进行傅立叶逆变换可得:
cy(n)=ch′(n)+cx(n)   (10)
其中,cy(n)=F-1{log|Y(ω)|},ch′(n)=F-1{log|H′(ω)|},cx(n)=F-1{log|X(ω)|}分别为y(n),h′(n),x(n)的倒谱分量。
h′(n)的倒谱分量ch′(n)可表示为:
c h &prime; ( n ) &ap; &alpha; 2 [ q ( n - n 0 ) + q ( - n + n 0 ) ] - - - ( 11 )
通过式(10)和式(11)可以得到:
c y ( n ) = d x ( n ) + &alpha; 2 q ( n - n 0 ) - - - ( 12 )
其中, d x ( n ) = c x ( n ) + &alpha; 2 q ( - n + n 0 ) .
定义
Figure BDA00003742118500103
表示τ在时域的平均变化量(数学期望)如下:
c ~ y ( &tau; ) = E ( c y ( n ) q ( n - &tau; ) ) - - - ( 13 )
通过式(12)和式(13)可以得到:
c ~ y ( &tau; ) = E ( c y ( n ) q ( n - &tau; ) )
= E [ ( d x ( n ) + &alpha; 2 q ( n - n 0 ) ) q ( n - &tau; ) ]
= E ( d x ( n ) q ( n - &tau; ) + &alpha; 2 q ( n - n 0 ) q ( n - &tau; ) ) - - - ( 14 )
= E ( d x ( n ) q ( n - &tau; ) ) + &alpha; 2 E ( q ( n - n 0 ) q ( n - &tau; ) )
= d ~ x ( &tau; ) + &alpha; 2 r qq ( &tau; )
其中,
Figure BDA000037421185001010
rqq(τ)为伪噪声序列q(n)的自相关函数,rqq(τ)=E(q(n-n0)q(n-τ))。
本实施例中的伪噪声序列q(n)有以下不等式成立:
P{q(n)≠p(n)}≥0.125
E{q(n)q(n+1)}≤-0.5
E{q(n)q(n-1)}≤-0.5
其中,0<n<L-1,P表示概率,E表示数学期望。
根据上述不等式和rqq(τ)=E(q(n-n0)q(n-τ))可知,rqq(τ)在τ=n0时有一个正的最大峰值,在τ=n0+1和τ=n0-1还有两个负的最大峰值。图6示出了L=1023和n0=144时τ的取值与rqq(τ)的关系。
由于rqq(τ)有三个峰值,基于此,结合式(14)提出本实施例中的编码函数
Figure BDA000037421185001011
c &OverBar; y ( &tau; ) = c ~ y ( &tau; ) - 0.5 &CenterDot; ( c ~ y ( &tau; - 1 ) + c ~ y ( &tau; + 1 ) ) - - - ( 15 )
将式(13)代入(14)得到:
c &OverBar; y ( &tau; ) = { d ~ x ( &tau; ) - 0.5 &CenterDot; ( d ~ x ( &tau; - 1 ) + d ~ x ( &tau; + 1 ) ) }
+ &alpha; 2 { r qq ( &tau; ) - 0.5 &CenterDot; { r qq ( &tau; - 1 ) + r qq ( &tau; + 1 ) } }
= d &OverBar; x ( &tau; ) + &alpha; 2 r &OverBar; qq ( &tau; )
通过上述过程可确定每段水印音频信号的编码函数。在确定出每段水印音频信号的编码函数后,通过编码函数从水印音频信号中提取水印位。通过编码函数从水印音频信号中提取水印位具体过程为:计算
Figure BDA00003742118500114
Figure BDA00003742118500115
其中,n1代表“1”,n2代表“0”;如果
Figure BDA00003742118500116
大于
Figure BDA00003742118500117
则嵌入水印音频段的水印位为“1”,否则,嵌入水印音频段的水印位为“0”。将从每段水印音频信号中提出的水印位进行组合,得到水印信息。
使用250个属于五个不同组的音频剪辑作为宿主的音频信号对上述本发明实施例提供的方法进行实验:
第1组:共50组,印度和斯里兰卡的古典音乐;
第2组:共50组,包含俄罗斯,印度和西方民间音乐;
第3组:共50组包含英语和斯里兰卡乡村音乐;
第4组:共50组,包含男性和女性的讲话;
第5组:共50组,包含混合的鸟、动物、风、海浪和雨水的声音。
所有这些音频剪辑都是单通道,持续时间为20秒。采样的频率为44.1kHz,量化为16位,然后分割。每个段包含44100样品,所有音频都用在计算离散傅立叶变换(DFT)。每一个音频剪辑嵌入不同的PN序列,每个PN序列的长度接近1023。
不可感知性测试:不可感知性使用了听力测试和量化测量。
(1)听力测试
进行听力测试,两个音频信号作为宿主信号,对象选择五个男生和两个女生、年龄在20至30岁之间且听力正常者来参加听力测试。AXB样例用于检查宿主信号和水印音频信号的声音质量差异。A和B都可以是一个宿主信号或水印音频信号,但它们彼此不相同。将X随机设置为A或B,测试者被要求判断X与A、B中的哪个是相同的。显然,测试者对不可感知性低的水印信号能更容易将其和宿主信号区别开。
图7示出了本发明以及现有技术中的方法使用两个音频信号作为宿主信号进行测试得到的听力测试结果曲线。设定正确的响应率鉴别阈值为75%,从图5可以看出,本发明提供的方法无论PN序列的振幅α如何,都有更低的正确响应率,这意味着本发明实施例提供的方法比其它两种方法有更好的不可感知性。另外,由于本发明实施例提供的方法的正确响应率总是低于75%的阈值,因此人耳很难区分出宿主信号和水印信号。需要说明的是,现有技术中的方法一为:考虑在原始回声核基础上,声音在一个真实的房间中产生回声的情况,由于房间的每个物体都会共振产生回声,因此,载体音频信号应该是与多个回声信号共存的,伪随机序列PN在时域上扩散回声来提高安全性,同时伪随机序列还可以作为提取秘密信息的私钥,私钥的运用进一步提高了检测回声的权限要求;现有技术中的方法二为:建立在时扩回声隐藏上,目标是提高水印检测效率,主要通过把解码器上的宿主音频信号效果转换成在编码阶段的水印信号来实现。
(2)定量测量:将信号噪声比(SNR)作为性能指标:
SNR ( dB ) = 10 &times; log 10 ( &Sigma; n x ( n ) 2 &Sigma; n ( y ( n ) 2 - x ( n ) ) 2 )
新的PN序列的回声核在感知敏感区域有更小的幅频,这有助于不可感知性。更小幅度的区域中,其占统治的宿主信号有更高的SNR,在本实施例中这些区域相互重叠,因此SNR指数可用来间接测量不可感知性。
表1给出了本发明和现有技术提供的水印嵌入方法的平均信噪比,总共使用了200个音频片段。从表1可以看出,本发明实施例提供的发明的平均信噪比明显高于现有技术中的方法,这表明本实施例提供的方法不可感知性更好。
表1
Figure BDA00003742118500131
鲁棒性测试:
对水印提取方法进行鲁棒性测试,鲁棒性测试由检测率(DR)衡量:
DR=[1-(不正确水印数目/总水印数目)]×100%
嵌入的水印可以是“1”或“0”,所以水印提取的机会水平是50%。以下是常见的在鲁棒性评价中使用的攻击方法:闭环攻击,提取的水印来自于没受任何攻击的水印信号;重复量化攻击,每个样品的水印的信号重新量化为8位;噪声攻击,在水印信号中加入随机噪声;振幅攻击,振幅攻击的水印信号的振幅皆增加1.8倍;MP3攻击,添加水印后的音频信号的MP3压缩;AAC攻击,水印的音频信号进行MPEG-4音频编码的压缩;间距缩放攻击,水印信号的间距增加10%。
比较三种方法的鲁棒性,假定现有方法一和方法二的SNR减少至22dB,提出的方法的SNR保持为28dB,即本实施例提供方法的感知质量大于其它方法6dB。表3显示了这些方法在各种攻击下的DR值。从3可以看出,本实施例提供的方法的鲁棒性最好。
表2
Figure BDA00003742118500132
Figure BDA00003742118500141
由于本发明实施例提供的音频水印嵌入方法中所使用的伪噪声序列q(n)与现有技术中的序列p(n)相比,能量更高,在人耳敏感区域能量更小,因此,伪噪声序列q(n)的使用,使得水印信息的不可感知性大大增加。并且,针对水印嵌入方法中伪噪声序列q(n)的使用,以及伪噪声序列q(n)的特性,本发明还提供了新的解码函数,用于从含水印的音频信号中提取水印,基于该解码函数的音频水印提取方法具有较高的鲁棒性。
与上述的音频水印嵌入方法相对应,本发明实施例还提供了一种音频水印嵌入装置,请参阅图8,为该装置的结构示意图,该装置可以包括:第一处理单元101、第一确定单元102、第二确定单元103和第二处理单元104。其中:
第一处理单元101,用于获取音频信号并对音频信号均匀分段。
第一确定单元102,用于获取伪噪声序列,确定与伪噪声序列对应的回声核,其中,伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列,q(n)具体为:
Figure BDA00003742118500151
y ( n ) = fix ( q ( n - 1 ) + p ( n - 1 ) + p ( n ) + p ( n + 1 ) 4 ) .
第二确定单元103,用于利用回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中,得到与每个音频信号段对应的水印音频信号,其中,每个音频信号段中嵌入水印信息的一个水印位。
第二处理单元104,用于将与每个音频信号段对应的水印音频信号进行组合,得到与音频信号对应的水印音频信号。
与上述的音频水印提取方法相对应,本发明实施例还提供了一种音频水印提取装置,请参阅图9,为该装置的结构示意图,该装置可以包括:第三处理单元201、第三确定单元202、第四确定单元203、水印提取单元204和水印处理单元205。其中:
第三处理单元201,用于对水印音频信号依据嵌入水印时音频信号的分段方式进行分段。
第三确定单元202,用于通过伪噪声序列的回声核和回声隐藏模型确定与每个水印音频信号段对应的音频信号段的倒谱分量,并确定伪噪声序列的自相关函数,伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列,q(n)具体为:
Figure BDA00003742118500161
y ( n ) = fix ( q ( n - 1 ) + p ( n - 1 ) + p ( n ) + p ( n + 1 ) 4 ) .
第四确定单元203,用于通过音频信号段的倒谱分量和伪噪声序列的自相关函数确定解码函数。
水印提取单元204,用于通过解码函数从每个水印音频信号段中提取水印位。
水印处理单元205,用于将提取出的水印位进行组合,得到嵌入音频信号中的水印信息。
由于本发明实施例提供的音频水印嵌入装置使用的伪噪声序列q(n)与现有技术中的序列p(n)相比,能量更高,在人耳敏感区域能量更小,因此,伪噪声序列q(n)的使用,使得水印信息的不可感知性大大增加。并且,基于伪噪声序列q(n)的使用,以及伪噪声序列q(n)的特性,本发明实施例提供的音频水印提取装置使用了新的解码函数从含水印的音频信号中提取水印,提高了音频水印的鲁棒性。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种音频水印嵌入方法,其特征在于,包括:
获取音频信号并对所述音频信号均匀分段;
获取伪噪声序列,确定与所述伪噪声序列对应的回声核,其中,所述伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列:
Figure FDA00003742118400011
y ( n ) = fix ( q ( n - 1 ) + p ( n - 1 ) + p ( n ) + p ( n + 1 ) 4 ) ;
利用所述回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中,得到与每个音频信号段对应的水印音频信号,其中,每个音频信号段中嵌入水印信息的一个水印位;
将与每个音频信号段对应的水印音频信号进行组合,得到与所述音频信号对应的水印音频信号。
2.根据权利要求1所述的方法,其特征在于,所述确定与所述伪噪声序列对应的回声核包括:
通过下式确定与所述伪噪声序列q(n)对应的回声核h′(n):
h &prime; ( n ) = &delta; ( n ) + &alpha; &Sigma; i = 0 L - 1 q ( i ) &delta; ( n - n 0 - i )
其中,δ(n)为狄拉克函数,α为正加权因子,n0为回声延迟。
3.根据权利要求2所述的方法,其特征在于,所述回声隐藏模型为:
y(n)=h′(n)*x(n)
=h′(0)x(n)+h′(1)x(n-1)+...+h′(n0)x(n-n0-1)+
...+h′(L-1)x(n-L+1)
利用所述回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中,得到与每个音频信号段对应的水印音频信号包括:
通过下式计算h′(0)、h′(1)...h′(L-1):
h &prime; ( n ) = &delta; ( n ) + &alpha; &Sigma; i = 0 L - 1 q ( i ) &delta; ( n - n 0 - i )
通过确定出的h′(0)、h′(1)...h′(L-1)利用所述回声隐藏模型将水印位嵌入音频信号段中,得到与每个音频信号段对应的水印音频信号。
4.一种音频水印提取方法,其特征在于,包括:
对水印音频信号依据嵌入水印时音频信号的分段方式进行分段;
通过伪噪声序列的回声核和回声隐藏模型确定与每个水印音频信号段对应的音频信号段的倒谱分量,并确定所述伪噪声序列的自相关函数,所述伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列:
Figure FDA00003742118400021
y ( n ) = fix ( q ( n - 1 ) + p ( n - 1 ) + p ( n ) + p ( n + 1 ) 4 ) ;
通过所述音频信号段的倒谱分量和所述伪噪声序列的自相关函数确定解码函数;
通过所述解码函数从每个水印音频信号段中提取水印位;
将提取出的水印位进行组合,得到嵌入所述音频信号中的水印信息。
5.根据权利要求2所述的方法,其特征在于,所述解码函数
Figure FDA00003742118400023
为:
c &OverBar; y ( &tau; ) = { d ~ x ( &tau; ) - 0.5 &CenterDot; ( d ~ x ( &tau; - 1 ) + d ~ x ( &tau; + 1 ) ) } + &alpha; 2 { r qq ( &tau; ) - 0.5 &CenterDot; { r qq ( &tau; - 1 ) + r qq ( &tau; + 1 ) } }
其中, d ~ x ( &tau; ) = E ( d x ( n ) q ( n - &tau; ) ) , d x ( n ) = c x ( n ) + &alpha; 2 q ( - n + n 0 ) ,
c x ( n ) = F - 1 { log | X ( &omega; ) | } , r qq ( &tau; ) = E ( q ( n - n 0 ) q ( n - &tau; ) ) ,
dx(n)为中间变量,cx(n)为所述音频信号段的倒谱分量,rqq(τ)为伪随机序列的自相关函数,E(·)表示数学期望,F-1{·}表示傅里叶逆变换。
6.根据权利要求5所述的方法,其特征在于,所述通过所述解码函数从每个水印音频信号段中提取水印位包括:
计算
Figure FDA00003742118400029
Figure FDA000037421184000210
其中,n1代表1,n2代表0;
如果大于
Figure FDA000037421184000212
则嵌入水印音频段的水印位为1,否则,嵌入水印音频段的水印位为0。
7.一种音频水印嵌入装置,其特征在于,包括:
第一处理单元,用于获取音频信号并对所述音频信号均匀分段;
第一确定单元,用于获取伪噪声序列,确定与所述伪噪声序列对应的回声核,其中,所述伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列:
y ( n ) = fix ( q ( n - 1 ) + p ( n - 1 ) + p ( n ) + p ( n + 1 ) 4 ) ;
第二确定单元,用于利用所述回声核和回声隐藏模型将水印信息的水印位嵌入音频信号段中,得到与每个音频信号段对应的水印音频信号,其中,每个音频信号段中嵌入水印信息的一个水印位;
第二处理单元,用于将与每个音频信号段对应的水印音频信号进行组合,得到与所述音频信号对应的水印音频信号。
8.一种音频水印提取装置,其特征在于,包括:
第三处理单元,用于对水印音频信号依据嵌入水印时音频信号的分段方式进行分段;
第三确定单元,用于通过伪噪声序列的回声核和回声隐藏模型确定与每个水印音频信号段对应的音频信号段的倒谱分量,并确定所述伪噪声序列的自相关函数,所述伪噪声序列q(n)为基于Golomb随机假设生成的与时间无关的伪噪声序列:
y ( n ) = fix ( q ( n - 1 ) + p ( n - 1 ) + p ( n ) + p ( n + 1 ) 4 ) ;
第四确定单元,用于通过所述音频信号段的倒谱分量和所述伪噪声序列的自相关函数确定解码函数;
水印提取单元,用于通过所述解码函数从每个水印音频信号段中提取水印位;
水印处理单元,用于将提取出的水印位进行组合,得到嵌入所述音频信号中的水印信息。
CN2013103845170A 2013-08-29 2013-08-29 一种音频水印嵌入和提取方法及装置 Pending CN103413552A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013103845170A CN103413552A (zh) 2013-08-29 2013-08-29 一种音频水印嵌入和提取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013103845170A CN103413552A (zh) 2013-08-29 2013-08-29 一种音频水印嵌入和提取方法及装置

Publications (1)

Publication Number Publication Date
CN103413552A true CN103413552A (zh) 2013-11-27

Family

ID=49606555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013103845170A Pending CN103413552A (zh) 2013-08-29 2013-08-29 一种音频水印嵌入和提取方法及装置

Country Status (1)

Country Link
CN (1) CN103413552A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217725A (zh) * 2014-09-29 2014-12-17 北京理工大学 一种基于多回声核的音频水印方法
CN105244033A (zh) * 2014-07-09 2016-01-13 意法半导体亚太私人有限公司 用于数字水印的系统和方法
CN105681891A (zh) * 2016-01-28 2016-06-15 杭州秀娱科技有限公司 移动端为用户视频嵌套场景的方法
CN106331743A (zh) * 2015-07-03 2017-01-11 上海尚恩华科网络科技股份有限公司 一种基于音频水印的视频交互的系统及方法
CN108877819A (zh) * 2018-07-06 2018-11-23 信阳师范学院 一种基于系数自相关度的语音内容取证方法
CN109036442A (zh) * 2018-07-27 2018-12-18 北京感动无限科技有限公司 用于播放内容的水印识别方法及装置
WO2019231912A1 (en) * 2018-05-31 2019-12-05 The Nielsen Company (Us), Llc Methods and apparatus to identify media based on watermarks across different audio streams and/or different watermarking techniques
CN114168908A (zh) * 2020-09-11 2022-03-11 四川大学 基于音视频分析的版权保护技术

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080215333A1 (en) * 1996-08-30 2008-09-04 Ahmed Tewfik Embedding Data in Audio and Detecting Embedded Data in Audio
CN101266794A (zh) * 2008-03-27 2008-09-17 上海交通大学 基于回声隐藏的多重水印嵌入和提取方法
CN102148034A (zh) * 2011-04-07 2011-08-10 南京邮电大学 基于回声隐藏的水印嵌入和提取方法
CN102237093A (zh) * 2011-05-23 2011-11-09 南京邮电大学 一种基于前后向回声核的回声隐藏方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080215333A1 (en) * 1996-08-30 2008-09-04 Ahmed Tewfik Embedding Data in Audio and Detecting Embedded Data in Audio
CN101266794A (zh) * 2008-03-27 2008-09-17 上海交通大学 基于回声隐藏的多重水印嵌入和提取方法
CN102148034A (zh) * 2011-04-07 2011-08-10 南京邮电大学 基于回声隐藏的水印嵌入和提取方法
CN102237093A (zh) * 2011-05-23 2011-11-09 南京邮电大学 一种基于前后向回声核的回声隐藏方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YONG XIANG等: "Effective Pseudonoise Sequence and Decoding Function for Imperceptibility and Robustness Enhancement in Time-Spread Echo-Based Audio Watermarking", 《IEEE TRANSACTIONS ON MULTIMEDIA》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105244033A (zh) * 2014-07-09 2016-01-13 意法半导体亚太私人有限公司 用于数字水印的系统和方法
CN104217725A (zh) * 2014-09-29 2014-12-17 北京理工大学 一种基于多回声核的音频水印方法
CN106331743A (zh) * 2015-07-03 2017-01-11 上海尚恩华科网络科技股份有限公司 一种基于音频水印的视频交互的系统及方法
CN105681891A (zh) * 2016-01-28 2016-06-15 杭州秀娱科技有限公司 移动端为用户视频嵌套场景的方法
WO2019231912A1 (en) * 2018-05-31 2019-12-05 The Nielsen Company (Us), Llc Methods and apparatus to identify media based on watermarks across different audio streams and/or different watermarking techniques
US10694243B2 (en) 2018-05-31 2020-06-23 The Nielsen Company (Us), Llc Methods and apparatus to identify media based on watermarks across different audio streams and/or different watermarking techniques
US11330328B2 (en) 2018-05-31 2022-05-10 The Nielsen Company (Us), Llc Methods and apparatus to identify media based on watermarks across different audio streams and/or different watermarking techniques
US11716502B2 (en) 2018-05-31 2023-08-01 The Nielsen Company (Us), Llc Methods and apparatus to identify media based on watermarks across different audio streams and/or different watermarking techniques
CN108877819A (zh) * 2018-07-06 2018-11-23 信阳师范学院 一种基于系数自相关度的语音内容取证方法
CN109036442A (zh) * 2018-07-27 2018-12-18 北京感动无限科技有限公司 用于播放内容的水印识别方法及装置
CN114168908A (zh) * 2020-09-11 2022-03-11 四川大学 基于音视频分析的版权保护技术

Similar Documents

Publication Publication Date Title
CN103413552A (zh) 一种音频水印嵌入和提取方法及装置
Wang et al. Centroid-based semi-fragile audio watermarking in hybrid domain
CN100527662C (zh) 一种基于非均匀离散傅立叶变换的鲁棒音频数字水印方法
CN103730128A (zh) 一种基于频谱sift特征描述子的音频片段认证方法
Sheikhan et al. Improvement of embedding capacity and quality of DWT-based audio steganography systems
Wang et al. Multi-subspace echo hiding based on time-frequency similarities of audio signals
CN102237093B (zh) 一种基于前后向回声核的回声隐藏方法
Nishimura Audio watermarking based on subband amplitude modulation
CN102509551A (zh) 基于倒谱和差分方差的音频隐写分析算法
Djebbar et al. Controlled distortion for high capacity data-in-speech spectrum steganography
CN101609675B (zh) 一种基于质心的脆弱音频水印方法
Guo et al. An audio digital watermarking algorithm against A/D and D/A conversions based on DCT domain
Ngo et al. Robust and reliable audio watermarking based on phase coding
CN104091104B (zh) 多格式音频感知哈希认证的特征值提取及认证方法
CN105374360A (zh) 交叉加性扩频音频水印嵌入方法、检测方法及系统
Lin et al. Audio watermarking techniques
Rodríguez et al. Analysis of audio watermarking schemes
Cao et al. Researches on echo kernels of audio digital watermarking technology based on echo hiding
CN103745725B (zh) 一种基于常数q变换的音频水印嵌入方法
Dhar et al. An audio watermarking scheme using discrete fourier transformation and singular value decomposition
Trivedi et al. An algorithmic digital audio watermarking in perceptual domain using direct sequence spread spectrum
WO2011160966A1 (en) Audio watermarking
Wang et al. A Robust Speech Watermarking Based On Quantization Index Modulation And Double Discrete Cosine Transform
Liu et al. Speech watermarking robust against recapturing and de-synchronization attacks
Chowdhury et al. A tutorial for audio watermarking in the cepstrum domain

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20131127