CN100505061C - 生成、嵌入和检测水印信号的方法和设备 - Google Patents
生成、嵌入和检测水印信号的方法和设备 Download PDFInfo
- Publication number
- CN100505061C CN100505061C CNB038071959A CN03807195A CN100505061C CN 100505061 C CN100505061 C CN 100505061C CN B038071959 A CNB038071959 A CN B038071959A CN 03807195 A CN03807195 A CN 03807195A CN 100505061 C CN100505061 C CN 100505061C
- Authority
- CN
- China
- Prior art keywords
- signal
- watermark
- sequence
- media signal
- media
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00086—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
- G11B20/00884—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
- G11B20/00891—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00086—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
Abstract
描述了用于生成水印信号、把水印信号嵌入到多媒体信号内以及随后检测水印信号的方法。水印信号是两个数值序列的和,第二序列数值是第一序列的环形移位的版本。
Description
技术领域
本发明涉及用于编码和译码在诸如音频、视频、或数据信号的多媒体信号中的信息的设备和方法。
背景技术
多媒体信号的加水印是一种用于连同多媒体信号一起传输附加数据的技术。例如,加水印技术可被使用来把版权和拷贝控制信息嵌入到音频信号中。
加水印方案的主要要求是:水印是不可被观察到的(即在音频信号的情况下,水印是不可被听到的),同时,对于要将水印从信号中去除的攻击而言,水印是坚固的(例如,去除水印会损坏信号)。将会看到,水印的坚固性通常是对其中嵌入水印的信号的质量的一种折衷。例如,如果水印被牢固地嵌入音频信号(因此水印很难被去除),则音频信号的质量很可能会降低。
已经提出了各种类型的音频加水印方案,每种方案具有它自己的优点和缺点。例如,一种类型的音频加水印方案是使用时间相关技术把想要的数据(例如,版权信息)嵌入到音频信号中。这种技术实际上是回声(echo)隐藏算法,其中通过求解二次方程来确定回声的强度。该二次方程是由在两个位置处的自相关值生成的:一个位置在等于τ的延时处,另一个在等于0的延时处。在这样的方案中,由于音频信号的回声被加到原始音频信号,最终得到的信号实际上是原始音频信号的幅度和相位调制的版本。在检测器处,通过确定在两个延时的位置处的自相关函数的比值来提取水印。
这种相关技术具有多个缺点.例如,只可能在最终得到的二次方程具有实根的地方嵌入水印,因此,这降低对于给定的音频质量的坚固性(水印抵抗攻击的能力)。而且,该相关算法的性能依赖于延时τ的数值和原始信号的特性。这是重大的缺点。
基于DFT(离散傅立叶变换)系数的调幅的加水印方案也是已知的.由于这样的方案需要在编码器和译码器处计算DFT,最终得到的用于实施这样的DFT方案的硬件往往比较复杂,所以,该方案往往执行得很慢并且成本较高。再者,无法令人满意地将水印嵌入具有稀疏频率特性的音频分段,所以,DFT方案对于特定的类型的音乐不能很好地工作。
W0 00/00969描述用于把辅助信号(诸如版权信息)嵌入或编码到多媒体主信号或覆盖信号中的替换的技术。在特定的域(时间、频率或空间)中的覆盖信号或覆盖信号的一部分的复制,是按照规定覆盖信号的参数的修正值的隐秘(stego)密钥被生成的。复制信号随后被相应于要被嵌入的信息的辅助信号修正,并被插回到覆盖信号中,以便形成隐秘信号。
在译码器处,为了提取原始辅助数据,以与原始覆盖信号的复制相同的方式生成隐秘信号的复制,这需要使用相同的隐秘密钥.最终得到的复制随后被与所接收的隐秘信号进行相关,以便提取辅助信号。因此,辅助信号的提取是比较复杂的,并且在编码器(或嵌入器)和译码器(或检测器)处都需要隐秘密钥。另外,在检测器处需要强力搜索来同步到辅助信号。
再者,有效载荷提取的性能取决于辅助信号被估计得有多好。在对辅助信号中的有效载荷比特有较高的预测错误率的系统中,这是非常难达到的。所述解决方案将导致非常复杂的纠错方法或大大地限制信息容量。
发明内容
本发明的一个目的是提供一种基本上解决现有技术的至少一个问题的加水印方案。
一方面,本发明提供一种生成用于嵌入到多媒体信号中的水印信号的方法,该方法包括以下步骤:(a)生成两个数值序列,第二序列是第一序列的环形移位的版本;以及(b)通过把第一序列的数值加到在第二序列的相应的位置处的各个数值上而生成水印信号。
优选地,第一和第二序列的每个数值用优选宽度Ts的脉冲来代表,以便形成矩形波信号。
优选地,在步骤(a)一个窗形函数被应用来把每个矩形信号变换成相应的平滑变化的信号,最终得到的平滑变化的信号在步骤(b)被加上,以便形成水印信号。
优选地,将所述每个数值序列与一个宽度至少为Ts的窗形函数进行卷积,以便生成两个平滑变化的信号,这两个平滑变化的信号在步骤(b)被相加在一起,以便形成水印信号。
优选地,所述窗形函数具有频带有限的频率特性和平滑的时间特性。
优选地,所述窗形函数具有对称或反对称的时间特性。
优选地,所述窗形函数包括升余弦函数和双相位函数中的至少一个函数。
优选地,水印信号是通过将具有相对延时Tr的两个平滑变化的信号相加而生成的,其中Tr<Ts。
优选地,Tr被选择为使得第一平滑变化信号的最大幅度点与第二平滑变化信号的过零点一致。
优选地,所述水印信号具有被编码在所述两个数值序列的组合中的有效载荷。
另一方面,本发明提供被安排成生成用于嵌入在多媒体信号中的水印信号的设备,该设备包括:(a)序列生成器,它被安排成使用第一数值序列生成第二数值序列,第二序列是第一序列的环形移位的版本;以及(b)信号生成器,它被安排成通过把第一序列的数值加到在第二序列的相应位置处的相应数值上而生成水印信号。
优选地,该设备还包括信号调节器,它被安排成把每个数值序列变换成平滑变化的信号。
优选地,该设备被安排成通过环形移位一个基本(primary)数值序列而生成所述第一数值序列。
再一方面,本发明提供一种将水印嵌入到多媒体信号中的方法,该方法包括以下步骤:(a)生成等于两个数值序列的和的水印信号,第二序列是第一数值序列的环形移位的版本;(b)生成作为水印信号与多媒体信号的乘积的主修正多媒体信号;(c)通过把所述主修正多媒体信号的经缩放的版本加到多媒体信号而生成加水印的多媒体信号。
优选地,主修正多媒体信号的所述经缩放的版本是通过由预定的成本函数控制缩放因子而生成的。
优选地,所述成本函数包括多个缩放因子,每个缩放因子被分开地定义,以用于多媒体信号中的一个或多个频带.
优选地,所述频带是按照人的听觉和/或视觉系统的模型被确定的。
优选地,在步骤(b)中,所述主修正多媒体信号是通过把所述水印信号与多媒体信号的被提取的部分相乘而被生成的。
优选地,多媒体信号的所述被提取的部分是通过相对于频率、空间和时间的至少一项对多媒体信号的至少一部分进行滤波而得到的。
该方法优选地还包括以下步骤:(d)生成等于第三和第四数值序列的和的水印信号,第四序列是第三数值序列的环形移位的版本;(e)提取多媒体信号的第二部分,该第二部分被滤波,以使得它不与所述第一部分重叠;(f)通过把第二水印信号与多媒体信号的第二提取部分的乘积加到所述加水印的多媒体信号而生成加水印的多媒体信号。
另一方面,本发明提供被安排成把水印信号嵌入到多媒体信号中的设备,该设备包括:(a)水印生成器,它被安排成生成等于两个数值序列的和的信号,第二序列是第一数值序列的环形移位的版本;(b)输出信号生成器,它被安排成通过把水印信号与多媒体信号的乘积加到多媒体信号而生成加水印的多媒体信号。
优选地,该设备还包括信号提取器,它被安排成提取多媒体信号的第一部分。
再一方面,本发明提供包括水印的多媒体信号,其中原始多媒体信号是通过借助水印来修正原始信号的时间包络而被加水印的,该水印包括第一和第二数值序列的和,该第二序列是第一序列的环形移位的版本。
另一方面,本发明提供一种检测被嵌入在多媒体信号中的水印信号的方法,该方法包括以下步骤:(a)接收一个多媒体信号,该多媒体信号可能是由一个用于修正主多媒体信号的时间包络的水印信号来加水印的;(b)从所述接收信号中提取水印的估计;以及(c)把水印估计与水印的基准版本进行相关,以便确定所接收信号是否是加水印的。
优选地,水印信号具有有效载荷,并且该方法还包括确定水印的有效载荷的步骤。
再一方面,本发明提供被安排成检测水印信号是否被嵌入在多媒体信号内的水印检测器设备,该水印检测器包括:(a)接收机,它被安排成接收一个多媒体信号,该多媒体信号可能是由一个用于修正主多媒体信号的时间包络的水印信号来加水印的;(b)提取器,它被安排成从所述接收信号中提取水印的估计;以及(c)相关器,它被安排成把水印估计与水印的基准版本进行相关,以便确定所接收信号是否是加水印的。
优选地,该设备还包括有效载荷检测器,它被安排成确定在所述水印内是否存在有效载荷以及确定所述有效载荷的数值.
附图说明
为了更好地了解本发明和显示如何实施本发明的实施例,现在作为例子参考附图,其中:
图1是显示按照本发明一个实施例的水印嵌入设备的图;
图2显示在一个优选实施例中使用的信号部分提取滤波器H;
图3a和3b分别显示作为在图2中使用的滤波器H的频率的函数的典型的幅度和相位响应;
图4显示有效载荷嵌入和水印调节级;
图5是显示图4的水印调节设备Hc的细节的图,包括在每级处的相关信号的图表;
图6a和6b分别以升余弦函数和双相位函数的形式显示两个优选的替换窗形函数s(n);
图7a和7b分别显示用升余弦和双相位形窗函数调节的水印序列的频谱。
图8是显示按照本发明一个实施例的水印检测器的图;
图9示意地显示结合升余弦形窗函数使用的、图8的白化滤波器Hw;
图10示意地显示结合双相位形窗函数使用的、图8的白化滤波器Hw;以及
图11显示从图8所示的水印检测器的相关器输出的相关函数的典型的形状。
具体实施方式
图1显示按照本发明的优选实施例的、对于执行用于把多比特有效载荷水印wc嵌入到主信号x中的数字信号处理所需要的设备的方框图。
主信号x被提供在设备的输入端12.主信号x经由加法器22沿输出端14的方向被传送。然而,主信号x的复制(输入8)被分裂到乘法器18的方向,用于载送水印信息。
水印信号wc是从有效载荷嵌入器和水印调节设备6得到的,并且是从被输入到有效载荷嵌入器和水印调节设备的水印随机序列ws(输入4)得出的。乘法器18被利用来计算水印信号wc与复制音频信号x的乘积。最终得到的乘积wcx随后经由增益控制器24被传送到加法器22。增益控制器24被使用来以一个增益因子α放大或衰减信号。
增益因子α控制水印的可听见性与坚固性之间的折衷。它可以是在时间、频率和空间的至少一项中的常量或变量。图1上的设备显示,当α是可变时,它可以根据主信号x的属性经由信号分析单元26自动地被适配。优选地,增益α按照适当地选择的感知度成本函数(诸如人类听觉系统(HAS)的心理声学模型)被自动适配,以便最小化对于信号质量的影响。这样的模型例如在E.Zwicker的文章中描述:“AudioEngineering and Psychoacoustics:Matching signals to the finalreceiver,the Human Auditory System(音频工程和心理声学:使信号匹配于最后的接收机,人的听觉系统)”,Journal of the AudioEngineering Society,Vol.39,pp.vol.115-126,March 1991。
在下面,音频水印仅仅作为例子被利用来描述本发明的这个实施例。
通过把wc与x的乘积的适当地缩放的版本与主信号相加,在嵌入设备10的输出端14处得到最终的水印音频信号y:
y[n]=x[n]+awc[n]x[n]. (1)
优选地,水印wc被选择成使得当与x相乘时它主要地修正x的短时间包络。
图2显示一个优选实施例,其中通过使用滤波单元15中的滤波器H滤波主信号x的复制而得到加到图1的乘法器18的输入8。如果滤波器输出用xb表示,则按照这个优选实施例,通过把xb与水印wc的乘积的适当缩放的版本与主信号x相加而生成加水印的信号。
令xb被定义为xb=x-xb,以及yb被定义为y=yb+xb,则加水印的信号y可被写为:
y[n]=(1+wc[n])xb[n]+xb[n]. (2)
以及加水印的信号y的经包络调制的部分yb可被给出为:
yb[n]=(1+wc[n])xb[n] (3)
优选地,如图3所示,滤波器H是以它的下部截止频率fL和上部截止频率fH和为表征的线性相位带通滤波器。正如可以从图3b看到的,滤波器H在通带(BW)内具有相对于频率的线性相位响应。因此,当H是带通滤波器时,xb和xb分别是主信号的带内和带外分量.为了最佳的性能,优选地,信号xb和xb是同相的。这是通过适当地补偿由滤波器H产生的相位失真而达到的。
在图4上,显示有效载荷嵌入器和水印调节单元6的细节.在这个单元中,水印种子信号ws被变换成多比特水印信号wc。
首先,通过使用具有初始种子S的随机数生成器生成有限长度的、优选地为零中值和均匀分布的随机序列ws。正如后面将会看到的,优选地,这个初始种子S对于嵌入器和检测器是已知的,这样,可以在检测器处生成水印信号的拷贝,以用于比较的目的。这导致长度Lw的序列:
ws[k]∈[-1,1],for k=0,1,2,...,Lw-1 (4)
然后,通过使用环形移位单元30将序列wS环形移位数量d1和d2而分别得到随机序列wd1和wd2。将会看到,这两个序列(wd1和wd2)实际上是第一序列和第二序列,第二序列相对于第一序列被环形移位。每个序列wdi(i=1,2)随后在乘法单元40中与相应的符号比特ri相乘,其中ri=+1或-1。r1和r2的各个值保持为恒定的,并且只在水印的有效载荷改变时才改变。每个序列随后由图4所示的水印调节单元20变换成长度为LwTs的周期性的、缓慢变化的窄带信号w1。最后,使缓慢变化的窄带信号w1和w2以相对延时Tr相加(其中Tr<Ts),以给出多比特有效载荷水印信号wc。这是通过首先使用延时单元45把信号w2延时数量Tr、随后用相加单元50把它加到w1而实现的.
图5更详细地显示在有效载荷嵌入器和水印调节设备6中使用的水印调节设备20.水印随机序列ws被输入到调节设备20.
为了方便起见,在图5上只显示一个序列wd1的修正,但将会看到,每个序列以类似的方式被修正,其结果被相加,以得到水印信号wc。
如图5所示,每个水印信号序列wd1[k](i=1,2)被加到样本重发器(repeater)180的输入端。图181显示一个作为在+1和-1之间的随机数的数值序列的可能的序列wdi,该序列长度是Lw。样本重发器180将水印随机序列内的每个数值重复Ts次,以便生成具有矩形形状的脉冲串信号。Ts被称为水印符号周期,它代表音频信号中水印符号的跨距。图183显示一旦在曲线图181上显示的信号通过样本重发器180后的结果。
诸如升余弦窗那样的窗形函数s[n]随后被应用来把从wd1和wd2得到的矩形脉冲信号分别变换成缓慢变化的信号w1[n]和w2[n]。
图184显示典型的升余弦窗形函数,它也具有周期Ts。
所生成的信号w1[n]和w2[n]随后被以相对延时Tr相加(其中Tr<Ts),以给出多比特有效载荷水印信号wc[n],即,
wc[n]=w1[n]+w2[n-Tr] (5)
Tr的数值被选择为使得w1的过零点匹配w2的最大幅度点,反之亦然。因此,对于升余弦窗形函数有Tr=Ts/2,而对于双相位窗形函数则有Tr=Ts/4.对于其他窗形函数,其他的Tr数值是可能的。
正如从下面说明将会看到的,在检测期间,载送wc[n]的加水印的信号将生成相隔为pL的两个相关值峰值(正如可在图11看到的).数值pL是有效载荷的一部分,并被定义为:
除了pL以外,通过改变所嵌入的水印的相对符号,可以编码额外的信息。
在检测器中,这被看作为在相关值峰值之间的相对符号rsign.将会看到,rsign可以取四个可能的数值,它可被定义为:
其中ρ1=sign(cL1)和ρ2=sign(cL2)分别是图4的符号比特r1(输入80)和r2(输入90),而cL1和cL2分别是相应于wd1和wd2的相关值峰值的数值.总的水印有效载荷pLw随后被给定为rsign和pL的组合:
pLw=〈rsign,pL〉.(8)
可被长度为Lw的水印序列载送的最大信息(Imax)的比特数因此由下式给出:
在这样的方案中,有效载荷可避免在嵌入器与检测器之间的相对偏差,并且也可避免可能的时间尺度修正.窗形函数已被确定为控制本加水印方案的坚固性和可听见性的性能的主要参数之一.如图6a和6b所示,本文描述了可能的窗形函数的两个例子:升余弦函数和双相位函数.
优选地是使用双相位窗函数而不用升余弦窗函数,以便得到准无DC的水印信号.这被显示于图7a和7b,图上显示了分别相应于用升余弦和双相位窗形函数调节的水印序列(在这种情形下是wdi[k]=(1,1,-1,1,-1,-1,}的序列)的频谱.正如可以看到的,用升余弦调节的水印序列的频谱在频率f=0处具有最大值,而双相位成形的水印序列的频谱在频率f=0处具有最小值,即,它具有非常小的DC分量.
有用的信息只被包含在水印的非DC分量中.因此,对于相同的所加上的水印能量,用双相位窗调节的水印比起用升余弦窗调节的水印会载送更多的有用信息.结果,双相位窗对于相同的坚固性提供更为优越的可听见性质量,或相反地,它对于相同的可听见性质量允许更好的坚固性.
这样的双相位函数也可被用作为用于其他水印方案的窗形函数.换句话说,可以应用双相位函数来减小要被合并到另一个信号中的信号(诸如水印)的DC分量.
图8显示水印检测器(200,300,400)的方框图.该检测器包含三个主要级:(a)水印符号提取级(200),(b)缓存和内插级(300),以及(c)相关和判决级(400).
在符号提取级(200)中,所接收的加水印的信号y’[n]被处理,以生成加水印的序列的多个(Nb)估计,它们被多路复用进信号wo[m]。需要水印序列的这些估计来消除在嵌入器与检测器之间可能存在的任何时间偏移,这样,水印检测器可以同步到被插入在主信号中的水印序列.
在缓存和内插级(300)中,这些估计被多路分解到Nb个分开的缓存器.随后把内插施加到每个缓存器,以消除可能已发生的可能的时间尺度修正.例如,采样(时钟)频率的漂移可能导致时域信号的伸长或缩短(即,水印可能已被伸长或缩短).
在校正和判决级(400)中,将每个缓存器的内容与基准水印进行相关,并将最大相关值峰值与阈值进行比较,以确定水印是否确实被嵌入在接收信号y’[n]内的或然率.
为了使得水印检测的精确度最大化,水印检测过程典型地是对于3到4倍于水印序列长度的接收信号y’[n]的长度实行的.因此,通过取几个符号的平均,可以构建要被检测的每个水印符号.这个平均的过程被称为平滑,而进行平均的次数被称为平滑因子sf.因此,检测窗长度LD是音频分段的长度(以样本数计),通过这个长度报告水印检测真值.因此,LD=sfLwTs,其中Ts是符号周期而Lw是水印序列内的符号数。典型地,在缓存与内插级内的每个缓存器320的长度(Lb)是Lb=sfLw.
在图8所示的水印符号提取级200中,输入水印信号y’[n]被输入到信号调节滤波器Hb(210).这个滤波器210典型地是带通滤波器,并且具有与图2所示的相应的滤波器H(15)相同的性能.滤波器Hb的输出是y’b[n],假设在传输信道内是线性的,则它可从公式(2)和(3)得到:
y′b[n]≈yb[n]=(1+awe[n])xb[n] (10)
应当指出,当在嵌入器中没有使用滤波器时(即,当H=1时),在检测器中的Hb也可被省略,或仍旧可以包括它,以改进检测性能.如果Hb被忽略,则公式(10)中的yb用y替代.该处理的其余部分是相同的.
为了简化起见,假设在嵌入器与检测器之间有完美的同步(即,在时间尺度上没有偏差且没有改变),以及音频信号被划分成长度为Ts的帧,以及y’b,m[n]是经滤波的信号y’b[n]的第m个帧的第n个样本.应当指出,如果在嵌入器与检测器之间没有完美的同步,则可以在缓存与内插级300内通过利用本领域技术人员已知的技术来补偿任何偏差,例如迭代搜索所有可能的尺度和偏移修正,直至达到最好的匹配为止.;
相应于y’b,m[n]帧的能量E[m]是:
其中S[n]是在图5的水印调节电路中使用的相同的窗形函数.本领域技术人员将会看到,公式11代表匹配滤波接收机,并且当符号周期完全同步时,它是最佳接收机.在此情况下,从现在起,我们设置S[n]=1,以便简化以后的说明.
把这个公式11与公式10相组合,得到:
其中we[m]是第m个提取的水印符号,并且包含所嵌入的水印序列的Nb个时间多路复用的估计.求解方程12中的wo[m],并忽略α的更高阶项,给出以下的近似:
在图8所示的水印提取级200中,滤波器Hb的输出y’b[n]作为输入被提供到帧划分器220,它把音频信号划分成长度为Ts的帧,即划分成y’b,m[n],然后能量计算单元230被使用来按公式(11)计算相应于每个成帧的信号的能量.这个能量计算单元230的输出随后作为输入被提供到白化级Hw(240),它执行公式13所示的函数,以便提供输出wo[m].这个白化级的替换实施方案(240A,240B)被显示于图9和10.
将会看到,公式13的分母包含需要主(原始)信号x的知识的项.由于信号x对于检测器是不可得的,这意味着,为了计算wo[m]必须估计公式13的分母.
下面描述对于两个所述的窗形函数(升余弦窗形函数和双相位窗形函数)如何得到这样的估计,但同样将会看到,所述教导可以被扩展到其他窗形函数.
关于图6a所示的升余弦窗形函数,已经认识到,由水印引起的音频包络对能量函数E[m]的噪声部分产生主要影响.缓慢变化的部分(即低频分量)则主要是由于原始音频信号x的包络的贡献.因此,公式13可被近似为:
其中“lowpass(.)”是低通滤波器函数.因此,将会看到,用于函数中的升余弦窗形状的白化滤波器Hw可以如图9所示被实现.
正如可以看到的,这样的白化滤波器Hw(240)包括用于接收信号E[m]的输入端242A.这个信号的一部分随后被通过低通滤波器247A,以产生经低通滤波的能量信号ELP[m],它又作为输入连同函数E[m]一起被提供到计算级248A.计算级248A随后把E[m]除以ELP[m],以计算所提取的水印符号wo[m].
当在嵌入器的水印调节级中使用双相位窗函数时,应当利用不同的方法来估计原始音频的包络,并从而计算wo[m].
通过查看图6b所示的双相位窗函数将会看到,当用这样的窗函数调制音频帧的包络时,第一和第二半帧以相反的方向被缩放.在检测器中,这个属性被利用来估计主信号x的包络能量.
因此,在检测器内,音频帧首先被再划分成两半.相应于第一和第二个半帧的能量函数因此分别被给出为:
和
由于原始音频的包络在两个子帧内以相反的方向被调制,原始音频包络可被近似为E1[m]和E2[m]的中值.
再者,瞬时调制值可被取为这两个函数之间的差.因此,对于第一双相位窗函数,水印wo[m]可被近似为:
因此,用于双相位窗形函数的白化滤波器Hw 240B可以如如图10所示被实现.输入端242B和243B分别接收第一和第二半帧E1[m]和E2[m]的能量函数.每个能量函数随后被分裂成两部分,并被提供到分别计算E1[m]-E2[m]和E1[m]+E2[m]的加法器245B和246B.这两个所计算出的函数随后被传送到计算单元248B,它把来自加法器245B的数值除以来自246B的数值,以便按照公式17计算水印wo[m].
这个输出we[m]随后被传送到缓存和内插级300,在其中信号被多路分解器310多路分解,并在长度为Lb的缓存器320中被缓存,以便消除在嵌入器与检测器之间的任何同步缺乏问题,并且在内插单元330内对信号进行内插,以便补偿在嵌入器与检测器之间的任何时间尺度修正.这样的补偿可以利用已知的技术,因此在本说明书内不再详细地描述.
如图8所示,来自缓存级的输出(wD1,wD2,...,wDNb)被传送到内插级,在内插后,相应于被正确地重新缩放的信号的不同估计的、此级的输出(w11,w12,...,wINb)被传送到相关与判决级.如果相信不需要时间缩放补偿,则数值(wD1,wD2,...,wDNb)被直接传送到相关与判决级400,即内插级330可以从该设备被省略.
相关器410计算每个估计wij(j=1,...,Nb)与基准水印序列ws[k]的相关值.相应于每个估计的每个相应的相关值输出随后被加到最大检测单元420,该检测单元确定哪两个估计最符合基准水印的环形移位的版本wd1和wd2.这些估计序列的相关值数值(峰值幅度和位置)被传送到阈值检测器和有效载荷提取器单元430.
如果内插级被省略,则替换地,相关器410计算每个估计wDj(j=1,...,Nb)与基准水印序列ws[k]的相关,正如在以上的段落中强调的,结果被传送到单元420和430以用于以后的处理.
阈值检测器和有效载荷提取器单元430可被利用来从所检测的水印信号提取有效载荷(例如信息内容).一旦该单元估计出超过检测阈值的两个相关峰cL1和cL2,峰值之间的距离pL(如由公式(6)定义的)就被测量.接着,确定相关峰的符号ρ1和ρ2,并从而从公式(7)计算rsign.然后可以通过使用公式(8)计算总的水印有效载荷.
例如,在图11上可以看到,pL是在两个峰值之间的相对距离.两个峰值都是正的,即ρ1=+1且ρ2=+1.从公式(7),rsign=3.因此,有效载荷pLw=<3,pL>.
在检测器内使用的基准水印序列ws(原始水印序列的可能的环形移位的版本)相应于被加到主信号的原始水印序列.例如,如果通过在嵌入器内使用具有种子S的随机数生成器来计算水印信号,则同样地检测器可以通过使用相同的随机数生成算法和相同的初始种子来计算相同的随机数序列,以便确定水印信号.替换地,原先在嵌入器中所应用的并被检测器作为基准而利用的水印信号可以简单地是任何预定的序列.
图11显示如从相关器410输出的相关函数的典型的形状.水平尺度显示相关延时(以序列样本点(sequence bins)计).在左手侧的垂直尺度(被称为信任度水平cL)代表相对于(典型地正态分布的)相关函数的标准差归一化的相关峰值的数值.
正如可以看到的,典型的相关值相对于cL是相对较平坦的,并以cL=0为中心.然而,该函数包含两个峰值,这两个峰值间隔距离为pL(见公式6),并且当存在水印时向上延伸到大于检测阈值的cL值.当相关峰值是负值时,以上的陈述适用于它们的绝对值.
水平线(在图上被显示为设置在cL=8.7)代表检测阈值.检测阈值的数值控制虚警率.
存在有两种虚警:假阳性率,被定义为在非加水印的项中检测到水印的概率;和假阴性率,被定义为在加水印的项中没有检测到水印的概率.一般地,假阳性告警的要求比起假阴性告警是更严格的.图11的右面的刻度显示假阳性告警的概率p.正如在所示的例子中看到的,假阳性概率p=10-12等价于阈值cL=8.7,而p=10-83等价于阈值cL=20.
在每个检测间隔后,检测器确定原始水印是否存在或它是否不存在,并在这个基础上输出“是”或“否”的判决.如果想要的话,为了改进这个做出判决的过程,可以考虑多个检测窗.在这种情形下,假阳性概率是取决于想要的准则的、对于所考虑的每个检测窗的各个概率的组合.例如,可以确定,如果相关函数在三个检测间隔中任意两个检测间隔上具有大于cL=7的阈值的两个峰值,则认为存在水印.显然,这样的检测准则可以根据水印信号的想要的使用而被改变并考虑诸如主信号的原始质量以及在正常传输期间信号可能被破坏得多严重之类的因素.
本领域技术人员将会看到,没有具体描述的各种实施方式将被理解为属于本发明的范围.例如,虽然只描述嵌入和检测设备的功能,但将会看到,该设备可被实现为数字电路、模拟电路、计算机程序或它们的组合.
同样地,虽然以上的实施例是参照音频信号描述的,但将会看到,本发明可被应用于其他类型的信号,例如视频和数据信号.
在说明书内将会看到,单字“包括”并不排除其他元件或步骤,“一个”并不排除多个,以及单个信号处理器或其他单元可以完成在权利要求书中阐述的几个装置的功能.
Claims (25)
1.一种生成用于嵌入到多媒体信号中的水印信号的方法,该方法包括以下步骤:
(a)生成两个数值序列,第二序列是第一序列的环形移位的版本;以及
(b)通过在所述第一序列和第二序列上使用窗形函数来生成两个平滑变化的信号且使最终得到的两个平滑变化的信号相加,而生成水印信号,使得该水印信号变为一个平滑变化的信号。
2.如权利要求1中要求的方法,其中第一和第二序列的每个数值用宽度为Ts的脉冲来代表,以便形成矩形脉冲串信号。
3.如权利要求2中要求的方法,其中在步骤(b),该窗形函数被应用来把每个矩形脉冲串信号变换成相应的平滑变化的信号。
4.如权利要求1中要求的方法,其中在步骤(b)中将每个所述数值序列与一个宽度至少为Ts的窗形函数进行卷积,以便生成两个平滑变化的信号。
5.如权利要求4中要求的方法,其中所述窗形函数具有频带有限的频率特性和平滑的时间特性。
6.如权利要求5中要求的方法,其中所述窗形函数具有对称或反对称时间特性。
7.如权利要求4中要求的方法,其中所述窗形函数包括升余弦函数和双相位函数中的至少一个函数。
8.如权利要求4中要求的方法,其中水印信号是通过将具有相对延时Tr的两个平滑变化的信号相加而生成的,其中Tr<Ts。
9.如权利要求8中要求的方法,其中Tr被选择为使得第一平滑变化信号的最大幅度点与第二平滑变化信号的过零点一致,反之亦然。
10.如权利要求1中要求的方法,其中所述水印信号具有被编码在所述两个数值序列的组合中的有效载荷。
11.一种被安排成生成用于嵌入在多媒体信号中的水印信号的设备,该设备包括:(a)序列生成器,它被安排成使用第一数值序列生成第二数值序列,第二序列是第一序列的环形移位的版本;(b)信号调节器,它在其第一数值序列和第二数值序列上使用窗形函数,以将每个数值序列变换成平滑变化信号,以及(c)信号生成器,它被安排成通过把最终得到的平滑变化信号相加而生成水印信号,使得该水印信号变为一个平滑变化信号。
12.如权利要求11中要求的设备,其中该设备被安排成通过环形移位一个基本数值序列而生成所述第一数值序列。
13.一种将水印嵌入到多媒体信号中的方法,该方法包括以下步骤:(a)生成等于两个数值序列的和的水印信号,第二序列是第一数值序列的环形移位的版本;(b)生成作为水印信号与多媒体信号的乘积的主修正多媒体信号;(c)通过把所述主修正多媒体信号的经缩放的版本加到多媒体信号而生成加水印的多媒体信号。
14.如权利要求13中要求的方法,其中主修正多媒体信号的所述经缩放的版本是通过由预定的成本函数控制缩放因子而生成的。
15.如权利要求14中要求的方法,其中所述成本函数包括多个缩放因子,每个缩放因子被分开地定义,以用于多媒体信号的多个频带中的一个或多个频带。
16.如权利要求15中要求的方法,其中所述频带是按照人的听觉和/或视觉系统的模型被确定的。
17.如权利要求13中要求的方法,其中在步骤(b)中,所述主修正多媒体信号是通过把所述水印信号与多媒体信号的被提取的部分相乘而被生成的。
18.如权利要求17中要求的方法,其中多媒体信号的所述被提取的部分是通过相对于频率、空间和时间的至少一项对多媒体信号的至少一部分进行滤波而得到的。
19.一种被安排成把水印信号嵌入到多媒体信号中的设备,该设备包括:(a)水印生成器,它被安排成生成等于两个数值序列的和的信号,第二序列是第一数值序列的环形移位的版本;(b)输出信号生成器,它被安排成通过把水印信号与多媒体信号的乘积加到多媒体信号而生成加水印的多媒体信号。
20.如权利要求19中要求的设备,其中该设备还包括信号提取器,它被安排成提取多媒体信号的第一部分。
21.一种检测被嵌入在多媒体信号中的水印信号的方法,该方法包括以下步骤:(a)接收一个多媒体信号,该多媒体信号可能是由一个用于修正主多媒体信号的时间包络的水印信号来加水印的;(b)从所述接收信号中提取水印的估计;以及(c)把水印估计与水印的基准版本进行相关,以便确定所接收信号是否是加水印的。
22.如权利要求21中要求的方法,还包括把窗形函数施加到所述接收信号的步骤。
23.如权利要求21中要求的方法,其中水印信号具有有效载荷,并且该方法还包括确定水印的有效载荷的步骤。
24.一种被安排成检测水印信号是否被嵌入在多媒体信号内的水印检测器设备,该水印检测器包括:(a)接收机,它被安排成接收一个多媒体信号,该多媒体信号可能是由一个用于修正主多媒体信号的时间包络的水印信号来加水印的;(b)提取器,它被安排成从所述接收信号提取水印的估计;以及(c)相关器,它被安排成把水印估计与水印的基准版本进行相关,以便确定所接收信号是否是加水印的。
25.如权利要求24中要求的设备,其中该设备还包括一个检测器,它被安排成确定在所述水印内是否存在有效载荷以及确定所述有效载荷的数值。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02076205 | 2002-03-28 | ||
EP02076205.0 | 2002-03-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1647186A CN1647186A (zh) | 2005-07-27 |
CN100505061C true CN100505061C (zh) | 2009-06-24 |
Family
ID=28459517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB038071959A Expired - Fee Related CN100505061C (zh) | 2002-03-28 | 2003-02-26 | 生成、嵌入和检测水印信号的方法和设备 |
Country Status (9)
Country | Link |
---|---|
US (1) | US7546467B2 (zh) |
EP (1) | EP1493154B1 (zh) |
JP (1) | JP2005521908A (zh) |
KR (1) | KR20040095323A (zh) |
CN (1) | CN100505061C (zh) |
AT (1) | ATE393446T1 (zh) |
AU (1) | AU2003206084A1 (zh) |
DE (1) | DE60320546T2 (zh) |
WO (1) | WO2003083858A1 (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003214489A1 (en) * | 2002-03-28 | 2003-10-13 | Koninklijke Philips Electronics N.V. | Watermark time scale searching |
US20050220322A1 (en) * | 2004-01-13 | 2005-10-06 | Interdigital Technology Corporation | Watermarks/signatures for wireless communications |
CN101258753B (zh) * | 2005-09-09 | 2011-04-20 | 汤姆森许可贸易公司 | 视频水印检测 |
CN101258752B (zh) * | 2005-09-09 | 2011-04-13 | 汤姆森许可贸易公司 | 视频水印的系数选择 |
US8958408B1 (en) | 2008-06-05 | 2015-02-17 | The Boeing Company | Coded aperture scanning |
US8509205B2 (en) * | 2008-06-05 | 2013-08-13 | The Boeing Company | Multicode aperture transmitter/receiver |
US9002487B2 (en) * | 2008-08-14 | 2015-04-07 | Sk Telecom Co., Ltd. | System and method for data reception and transmission in audible frequency band |
US8588461B2 (en) * | 2010-03-22 | 2013-11-19 | Brigham Young University | Robust watermarking for digital media |
GB201206564D0 (en) * | 2012-04-13 | 2012-05-30 | Intrasonics Sarl | Event engine synchronisation |
US9269363B2 (en) | 2012-11-02 | 2016-02-23 | Dolby Laboratories Licensing Corporation | Audio data hiding based on perceptual masking and detection based on code multiplexing |
GB2511479A (en) * | 2012-12-17 | 2014-09-10 | Librae Ltd | Interacting toys |
WO2015068310A1 (ja) * | 2013-11-11 | 2015-05-14 | 株式会社東芝 | 電子透かし検出装置、方法及びプログラム |
CN107864398B (zh) * | 2017-11-08 | 2020-03-20 | 司马大大(北京)智能系统有限公司 | 音频与视频的合并方法及装置 |
CN108091328B (zh) * | 2017-11-20 | 2021-04-16 | 北京百度网讯科技有限公司 | 基于人工智能的语音识别纠错方法、装置及可读介质 |
CN108052499B (zh) * | 2017-11-20 | 2021-06-11 | 北京百度网讯科技有限公司 | 基于人工智能的文本纠错方法、装置及计算机可读介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2679689B1 (fr) * | 1991-07-26 | 1994-02-25 | Etat Francais | Procede de synthese de sons. |
US6427012B1 (en) | 1997-05-19 | 2002-07-30 | Verance Corporation | Apparatus and method for embedding and extracting information in analog signals using replica modulation |
US6209094B1 (en) * | 1998-10-14 | 2001-03-27 | Liquid Audio Inc. | Robust watermark method and apparatus for digital signals |
KR100375822B1 (ko) * | 2000-12-18 | 2003-03-15 | 한국전자통신연구원 | 디지털 오디오의 워터마크 삽입/추출 장치 및 방법 |
-
2003
- 2003-02-26 WO PCT/IB2003/000785 patent/WO2003083858A1/en active IP Right Grant
- 2003-02-26 CN CNB038071959A patent/CN100505061C/zh not_active Expired - Fee Related
- 2003-02-26 US US10/509,548 patent/US7546467B2/en not_active Expired - Fee Related
- 2003-02-26 AT AT03702968T patent/ATE393446T1/de not_active IP Right Cessation
- 2003-02-26 AU AU2003206084A patent/AU2003206084A1/en not_active Abandoned
- 2003-02-26 KR KR10-2004-7015232A patent/KR20040095323A/ko not_active Application Discontinuation
- 2003-02-26 DE DE60320546T patent/DE60320546T2/de not_active Expired - Fee Related
- 2003-02-26 JP JP2003581192A patent/JP2005521908A/ja active Pending
- 2003-02-26 EP EP03702968A patent/EP1493154B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
CN1647186A (zh) | 2005-07-27 |
US20050152549A1 (en) | 2005-07-14 |
JP2005521908A (ja) | 2005-07-21 |
DE60320546D1 (de) | 2008-06-05 |
WO2003083858A1 (en) | 2003-10-09 |
EP1493154B1 (en) | 2008-04-23 |
DE60320546T2 (de) | 2008-11-13 |
ATE393446T1 (de) | 2008-05-15 |
KR20040095323A (ko) | 2004-11-12 |
AU2003206084A1 (en) | 2003-10-13 |
US7546467B2 (en) | 2009-06-09 |
EP1493154A1 (en) | 2005-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100505061C (zh) | 生成、嵌入和检测水印信号的方法和设备 | |
US20200372921A1 (en) | Methods and apparatus for performing variable block length watermarking of media | |
KR100341197B1 (ko) | 오디오 데이터로 부가 정보를 매립하는 방법 및 시스템 | |
Kirovski et al. | Spread-spectrum watermarking of audio signals | |
CN1975859B (zh) | 音频处理方法和装置 | |
EP1514268B1 (en) | Re-embedding of watermarks in multimedia signals | |
CN100354931C (zh) | 补偿在所接收信号中的线性时间尺度改变的方法和设备 | |
RU2586844C2 (ru) | Генератор водяного знака, декодер водяного знака, способ генерации сигнала водяного знака на основе данных двоичного сообщения, способ формирования данных двоичного сообщения на основе сигнала с водяным знаком и компьютерная программа с использованием дифференциального кодирования | |
CN100385548C (zh) | 用于多媒体信号的水印处理的窗口整形函数 | |
CN100399827C (zh) | 嵌入辅助信息或重现媒体信号中的数据的方法和设备 | |
CN100359914C (zh) | 独立信道内的水印编码和解码 | |
CN100401408C (zh) | 水印信息信号的解码 | |
CN101292285B (zh) | 编码和解码多声道音频信号的方法及其装置 | |
JP2010039439A (ja) | 電子透かし情報の埋め込みおよび抽出を行う装置、方法およびプログラム | |
Abdolrazzagh-Nezhad et al. | A Generalized Spread Spectrum-Based Audio Watermarking Method with Adaptive Synchronization | |
Yamamoto et al. | Robust audio watermarking with time and frequency division | |
Bae et al. | A Study on Enhancement of Speech Signal Using Separated Bandwidth and Non-uniform Sampling | |
JPS62270000A (ja) | 音声のピツチ周波数検出方法 | |
JP2001265366A (ja) | オーディオ信号の符号化方法、オーディオ信号の符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090624 Termination date: 20100226 |