CN1643592A - 水印信息信号的解码 - Google Patents

水印信息信号的解码 Download PDF

Info

Publication number
CN1643592A
CN1643592A CNA038071495A CN03807149A CN1643592A CN 1643592 A CN1643592 A CN 1643592A CN A038071495 A CNA038071495 A CN A038071495A CN 03807149 A CN03807149 A CN 03807149A CN 1643592 A CN1643592 A CN 1643592A
Authority
CN
China
Prior art keywords
signal
sequence
watermark
frame
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038071495A
Other languages
English (en)
Other versions
CN100401408C (zh
Inventor
A·N·勒姆马
J·F·阿普里
L·M·范德柯克霍夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1643592A publication Critical patent/CN1643592A/zh
Application granted granted Critical
Publication of CN100401408C publication Critical patent/CN100401408C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00884Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
    • G11B20/00891Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing

Abstract

描述用于补偿所接收的信号中的时间偏差的方法和装置,以便正确地将所接收的信号的帧序列与传输符号的序列对准。每个符号在Ts信号样本上延伸。首先将所接收的信号划分成长度的Ts的帧序列,然后将每个帧划分成多个Nb子帧。随后,形成Nb个值序列,其中,由每个连续帧内的相应子帧导出每个序列中的每个连续值。Nb序列的每一个是用于所传送的符号的正确对准序列的估计值。

Description

水印信息信号的解码
本发明涉及用于解码已经嵌入到诸如音频、视频或数据信号的信息信号中的信息的装置和方法。
水印信息信号是用于将信息信号与另外的数据一起传输的技术。例如,水印技术能用来将版权和拷贝控制信息嵌入音频信号中。
水印方案的主要要求在于它不可观测性(即,在音频信号的情况下,它是听不见的),同时难以受从信号去除水印的攻击(例如去除水印将损坏信号)。应意识到水印的鲁棒性通常是相对于嵌入水印的信号质量的折衷。例如,如果水印被牢固地嵌入音频信号中(并且由此难以移除),那么很可能将降低音频信号的质量。
已经提出了各种音频水印方案,每种方案具有其自己的优点和缺点。例如,一种音频水印方案是使用时间关联技术来将所需数据(例如版权信息)嵌入音频信号中。这一技术实际上是回波隐藏算法,其中通过解答二次方程确定回波强度。由在两个位置:一个在延迟时等于7,以及一个在延迟时等于0处的自相关值生成二次方程。通过检测器,通过确定在两个延迟位置处的自相关函数的比率,提取水印。
WO00/00969,名为“Aris Technologies”中描述了用于将辅助信号嵌入或编码到信息主机或掩饰信号中。根据指定掩饰信号的参数的修改值的隐秘密钥,生成在特定域(时间、频率或空间)中的掩饰信号的拷贝,或掩饰信号的一部分。然后,由对应于将嵌入的信息的辅助信号修改拷贝信号,以及插回到掩饰信号中以便形成隐秘信号。
通过检测器,为提取原始辅助数据,用与原始掩饰信号的拷贝相同的方式生成隐秘信号的拷贝,以及要求使用相同的隐秘密钥。然后,将最终的拷贝与所接收的隐秘信号关联,以便提取辅助信号。提取辅助信号相对复杂,要求在编码器(或嵌入器)和解码器(检测器)都具备该隐秘密钥。另外,要求盲目搜寻法以便在检测器处使辅助信号同步。
另外,有效负载提取的性能取决于所能估计的辅助信号的好坏程度。在具有辅助信号中的有效负载位的高预期错误率的系统中,这很难实现。解决方案将导致非常复杂的错误校正方法,或显著地限制了信息性能。
本发明的目的是提供用于水印解码方案的时间偏差的补偿,基本上解决现有技术的至少一个问题。
在第一方面中,本发明提供一种补偿所接收的信号中的偏差的方法,通过符号序列改变该信号,每个符号在Ts信号样本上延伸,该方法包括步骤:(a)将所接收的信号分解成预定长度Ts的帧;(b)将每个帧分解成多个Nb子帧;(c)形成Nb个值序列,该值由每个帧内的相应子帧导出;以及(d)将所述Nb序列用作与符号序列正确对准(无偏差)的帧序列的连续估计值。
最好,每个帧与相邻帧重叠。
最好,每个子帧与相邻子帧重叠。
最好,Nb在2到8的范围内。
最好,符号序列包括Lw符号,所接收的信号划分成LF帧,其中LF是Ts·Lw的整数倍。
最好,所述序列的每个符号在Ts样本上延伸。
最好,通过窗口整形函数整形所述符号序列,该窗口整形函数具有限带频行为,以及在通带内,具有平滑(适度)时间行为。另外,窗口整形函数最好具有对称和反对称时间行为。
最好,所述符号序列是上升余弦函数或双相位函数的一个。
最好,所述偏差为所接收和所传送的信号间的时间偏差。
最好,该方法进一步包括处理在步骤(d)中生成的每个估计值,就象它是正确排列的帧序列一样,以便确定哪个估计值是最佳估计值。
该方法最好进一步包括将所述估计值的每一个与对应于所述符号序列的基准相关的步骤;以及将具有最大相关峰值的估计值用作最佳估计值的步骤。
最好,假定最佳估计值是当处理时,超出一个或多个预定条件的第一估计值。最好,只要确定工作估计值,则停止估计值的处理。
最好,只要确定工作估计值用于第一信号或信号的一部分,对另外接收的信号或部分信号重复该方法,来自按顺序正处理的所述另外的信号的估计值由所述第一最佳估计值而定。因此,该方法能自适应地校正偏差。
在另一方面中,本发明提供用来执行上述方法的计算机程序。
在另一方面中,本发明提供包括上述计算机程序的记录载体。
在另一方面中,本发明提供可用来下载计算机程序的方法。
在另一方面中,本发明提供一种装置,用来补偿所接收的信号中的偏差,通过符号序列改变该信号,每个符号在Ts信号样本上延伸,该装置包括:将所接收的信号划分成最可取的长度Ts的帧的划分器;将每个帧划分成多个Nb子帧的划分器;以及处理器,用来形成Nb个值序列,该值由每个帧内的相应子帧导出;以及将所述Nb序列用作与符号序列正确排列(无偏差)的帧序列的连续估计值。
为更好地理解本发明,以及显示如何实施本发明的实施例,现在通过例子参考附图对本发明进行说明,其中:
图1是示例说明水印嵌入装置的图;
图2图示了信号部分提取滤波器H;
图3a和3b分别将典型的振幅和相位响应表示为图2中所示的滤波器H的频率的函数;
图4图示了图1所示的装置的有效负载嵌入和水印调节阶段;
图5是示例说明图4的水印调节装置Hc的细节的图,包括在每个阶段的相应信号的图;
图6a和6b分别以上升余弦函数和双相位函数的形式,表示两个优选的另外的窗口整形函数;
图7a和7b分别表示用于通过上升余弦和双相位整形窗口函数调节的水印序列的频谱;
图8是示例说明根据本发明的实施例的水印检测器的图;
图9图示表示用于结合上升余弦整形窗口函数使用的图8的白化滤波器Hw
图10图示表示用于结合双相位窗口整形函数使用的图8的白化滤波器Hw
图11表示根据本发明的实施例,水印符号提取和缓冲处理的详细情况;
图12表示从图8所示的水印检测器的相关器输出的相关函数的典型形状;以及
图13表示符号提取和缓冲阶段的一个优选实现的例子。
具体实施方式
图1图示了执行用于将多位有效负载水印w嵌入主机信号x的数字信号处理所需的装置的框图。
在装置的输入12输入主机信号x。经加法器22,在输出14的方向中传递主机信号x。然而,在多路乘法器18的方向中分离主机信号(x)的拷贝(输入8),以携带水印信息。
从有效负载嵌入器和水印调节装置6获得,以及从输入到有效负载嵌入器和水印调节装置的基准有限长度随机序列Ws导出水印信号Wc。利用乘法器18来计算水印信号Wc和复制的音频信号x的乘积。然后经增益控制器24将最终乘积Wcx传递到加法器22。使用增益控制器24来按增益因子α放大或减小信号。
增益因子α控制水印的可听性和鲁棒性间的折衷。它可以是时间、频率和空间的至少一个中的常数,或变量。图1中的装置表示当α可变时,基于主机信号x的属性,能经信号分析单元26自动地匹配它。最好,根据适当选择的可感知成本函数,诸如在音频信号的情况下的人听觉系统(HAS)的音质模型,自动匹配增益α,以便对信号质量的影响降到最低程度。例如,这种模型在E.Zwicker的论文“AudioEngineering and Psychoacoustics:Matching signals to the finalreceiver,the Human Auditory System”,音频工程协会期刊,Vol.39,pp.Vol.115-126,1991年3月描述过。
在下文中,仅通过例子,利用音频水印来描述本发明的这一实施例。
通过将Wc和x的乘积的适当的比例版本增加到主机信号上,在嵌入装置10的输出14处获得最终水印音频信号y。
y[n]=x[n]+αwc[n]x[n]                            (1)
最好,选择水印wc以便当与x相乘时,显著地改变x的瞬间包络线。
图2表示使用滤波单元15中的滤波器H,过滤主机信号x的拷贝,获得到图1中的乘法器18的输入8的一个优选实施例。如果用xb表示滤波器输出,那么根据这一优选实施例,通过将xb和水印wc的乘积增加到主机信号x上,生成水印信号:
y[n]=x+αwc[n]xb[n]                              (2)
假定
Figure A0380714900081
定义成 x b ‾ = x - x b , 以及yb定义成 y = yb + x b ‾ , 那么水印信号y的包络调制部分yb给出为yb[n]=(1+wc[n])xb[n](3)
最好,如图3所示,滤波器H是具有较低截止频率fL和较高截止频率fH的线性相位带通滤波器。从图3(b)可以看出,滤波器H相对于带通(BW)内的频率f,具有线性相位响应。因此,当H是带通滤波器时,xb分别是主机信号的带内和带外分量。对最佳性能来说,最好,信号xb
Figure A0380714900085
同相。这是通过适当地补偿由滤波器H产生的相位失真来实现的。在线性相位滤波器的情况下,失真是简单的时间延迟。
在图4中,示出了有效负载嵌入器和水印调节单元6的详细情况。在这一单元中,将初始基准随机序列ws转换成多位水印信号wc
使用具有初始种子S的随机数发生器,生成最好是零平均值的有限长度以及从现在开始也称为水印种子信号的均匀分布的随机序列ws。如下面将意识到的,最好这一初始种子S对嵌入器和检测器已知,以便为比较目的,在检测器处能生成水印信号的拷贝。这产生长度Lw的序列
ws[k]∈[-1,1],k=0,1,2...Lw-1                    (4)
应注意到在一些应用中,经交替信道能将种子传送到检测器,或能使用一些预定的协议,由接收信号导出。
然后,使用循环移位单元30,按量d1和d2循环移位序列ws以便分别获得随机序列wd1和wd2。将意识到这两个序列(wd1和wd2)实际上是第一序列和第二序列,相对于第一序列循环地移位第二序列。在乘法单元40中,每个序列wdi,i=1,2顺序地乘以各自的符号位ri,其中ri=+1或-1。r1和r2的各个值保持恒定,以及仅当改变水印的有效负载时才改变。然后,通过图4中所示的水印调节电路20,将每个序列转换成长度LwTs的定期、缓慢改变的窄带信号wi。最后,将缓慢改变的窄带信号w1和w2与相对延迟Tr(其中Tr<Ts)相加以便提供多位有效负载水印信号wc。这是通过使用延迟单元45首先延迟信号w2量Tr,然后通过加法单元50,将其增加到w1上来实现的。
图5更详细地表示用在有效负载嵌入器和水印调节装置6中的水印调节装置20。水印种子信号ws被输入到调节装置20。
为方便起见,在图5中仅示出了一个序列Wdi的修改,但将意识到每个序列都用类似的方式修改,从而相加以获得水印信号Wc
如图5所示,将每个水印信号序列Wdi[k],i=1,2应用于采样中继器180的输入。图181将一个序列Wdi示例说明为+1和-1间的随机数值的序列,该序列具有长度Lw。采样中继器重复水印种子信号序列Ts时间内的每个值,以便产生矩形脉冲修正信号。Ts称为水印符号周期并表示音频信号中的水印符号的取值范围。图183图示了一旦通过采样中继器180,在图181中示例说明中的信号的结果。
然后应用窗口整形函数s[n],诸如上升余弦窗口以便将由wd1和wd2导出的矩形脉冲函数分别转换成缓慢变化水印序列函数w1[n]和w2[n]。
图184图示了典型的上升余弦窗口整形函数,其跨度也为Ts
然后,将所生成的水印序列w1[n]和w2[n]与相对延迟Tr合计(其中Tr<Ts)以便给出多位有效负载水印信号wc[n],即
wc[n]=w1[n]+w2[n-Tr]                           (5)
选择Tr的值以便w1的零相交与w2的最大振幅点匹配,以及反之亦然。因此,对上升余弦窗口整形函数Tr=Ts/2以及对双相位窗口整形函数Tr=T2/4。对其他窗口整形函数,Tr的其他值也是可能的。
从下述描述将意识到,在检测期间,wc[n]的相关将生成由pL’(如能从图12所见)分隔的两个相关峰值。pL’是wd1和wd2间的循环移位pL的估计值,其是有效负载的一部分,并定义为
除pL外,通过改变嵌入水印的相对符号,能编码额外信息。
在检测器中,这能看作相关峰值间的相对符号rsign。它可以定义为
r sign = 2 · ρ 1 + ρ 2 + 3 2 ∈ { 0,1,2,3 } - - - ( 7 )
其中ρ1=sign(cL1)以及分别是图4的符号位r1(输入80)和r2(输入90)的估计值,以cL1和cL2分别是对应于wd1和wd2的相关峰值的值。然后将用于免误差检测的整个水印有效负载pLw指定为rsign和pL的组合:
pLw=(rsign,pL)                                 (8)
由此,通过下述等式给出能由长度Lw的水印序列执行的位数方面的最大信息(Imax),等式如下:。
在这一方案中,有效负载不受嵌入器和检测器间的相对偏差影响,以及还不受可能的时标修改影响。
窗口整形函数可以识别为控制本水印方案的鲁棒性和可听性行为的一个主要参数。如图6a和6b所示,在此描述两个可能的窗口整形函数的例子-上升余弦函数和双相位函数。
最好使用双相位窗口函数而不是上升余弦窗口函数,以便获得准免DC水印信号。这在图7a和7b中示例说明,图示了对应于分别通过上升余弦和双相位整形函数调节的水印序列的频谱(在这一情况下,wdi[k]={1,1,-1,1,-1,-1})。不难看出,用于上升余弦调节水印序列的频谱在频率f=0时具有最大值,而用于双相位整形水印序列的频率在f=0时具有最小值,即,它具有非常小的DC分量。
有用信息仅包含在水印的非DC分量中。因此,对增加相同的水印能量,用双相位窗口调节的水印将具有比通过上升余弦窗口调节的水印更多的有用信息。因此,在相同的鲁棒性下,双相位窗口提供较高的可听性性能,或相反,在相同的可听性质量的情况下,则其具有更好的鲁棒性。
这种双相位函数能用于其他水印方案的窗口整形函数中。换句话说,能应用双相位函数来减少包含在另一信号中的信号(诸如水印)的DC分量。
图8表示水印检测器的框图(200,300,400)。检测器包括三个主要阶段:(a)水印符号提取阶段(200),(b)缓冲和内插阶段(300)以及(c)相关和判定阶段(400)。
在符号提取阶段(200)中,处理所接收的水印符号y’[n]以便产生水印序列的多个(Nb)估计值。要求这些水印序列的估计值来解决可能存在于嵌入器和检测器间的时间偏差,以便水印检测器能与插入主机信号中的水印序列同步。
在缓冲和内插阶段(300),将这些估计值信号分离成Nb个单独的缓冲器,以及将内插应用于每个缓冲器以便解决可能出现的时标修改,例如采样(时钟)频率中的漂移会导致时域信号中的拉伸或收缩(即,可以拉伸或收缩水印)。
在相关和判定阶段(400),将每个缓冲器的内容与基准水印关联以及将最大相关峰值与阈值进行比较以便确定水印是否的确已经嵌入所接收的信号y’[n]中的可能性。
为使水印检测的精确度达到最大化,通过在为水印序列长度的3至4倍的所接收的信号y’[n]的长度上执行水印检测过程。由此,通过取所述符号的几个估计值的平均值,构成将检测的每个水印符号。这一平均过程称为平滑,以及执行平均的倍数称为平滑因子sf。假定LD是检测窗口长度,定义为报告检测真值上的音频段的长度(按采样数)。然后,LD=sfLwTs,其中Ts是符号周期以及Lw是水印序列中的符号的数量。在符号提取期间,在能源计算阶段进行因子Ts提取。因此,缓冲和内插阶段内的每个缓冲器320的长度(Lb)是Lb=sfLw
在图8所示的水印符号提取阶段200中,将输入水印信号y’[n]输入到可选信号调节滤波器Hb(210)。这一滤波器210通常是带通滤波器并且具有与图2中所示的相应的滤波器(H,15)相同的特性。滤波器Hb的输出是y’b[n],以及假定传输介质内的线性,其遵循下述方程式(1)和(3):
y′b[n]≈yb[n]=(1+αw[n])xb[n]               (10)
注意在上述表达式中,隐含忽略嵌入器和检测器间的可能的时间偏差。为易于说明一般水印方案原理,从现在开始,假定嵌入器和检测器间之间完全同步(即,没有偏差)。参考图11,下面对如何根据本发明补偿时间偏差进行说明。
注意当嵌入器没有采用滤波器(即,当H=1)时,那么,也能忽略检测器中的Hb,或仍然能包括以改进检测性能。如果忽略Hb,那么方程式(10)中的yb用y代替。其余部分的处理是相同的。
假定音频信号分成长度Ts的帧,以及y’b,m[n]是第m滤波帧信号的第n采样,对应于第m帧的能量E[m]如下:
E [ m ] = Σ n = 0 Ts - 1 | y ′ b , m [ n ] | 2 - - - ( 11 )
将上式与方程式10组合,得出:
E ( m ) ≈ Σ n = 0 T s - 1 | y b , m [ n ] | 2 = Σ n = 0 T x - 1 | ( 1 + α w e [ m ] ) x b , m [ n ] | 2 - - - ( 12 )
其中,we[m]是第m个被抽取的水印符号以及包含嵌入水印序列的Nb倍多个估计值。求解方程式12中的we[m]以及忽略α的高阶项给出下述近似:
w e [ m ] ≈ 1 2 α ( Σ n = 0 T x - 1 | y b , m [ n ] | 2 Σ n = 0 T x - 1 | x b , m [ n ] | 2 - 1 ) - - - ( 13 )
在图8所示的水印抽取阶段200中,滤波器hb的输出y’b[n]提供为帧分频器200的输入,帧分频器200将音频信号分成长度Ts的帧,即,分成具有能量计算单元230的y’b,m[n],然后用来根据每个方程式(12),计算对应于每个帧信号的能量。然后,这一能量计算单元230的输出提供为执行方程式13中所示的函数的变白阶段Hw(240)的输入,以便提供输出we[m]。这一变白阶段的另外的实现(240A,240B)在图9和10中示例说明。
可以认识到方程式13的分母包含需要主机(原始)信号x的知识的项。当由于信号x对检测器来说不可用的,这意味着为了计算we[m],必须估计方程式13的分母。
下面描述对两个所述的窗口整形函数(升余弦窗口整形函数和双相位窗口函数),如何能实现这种估计,但将同样意识到教导能延伸到其他窗口整形函数。
关于图6a所示的上升余弦窗口整形函数,已经认识到由水印感应的音频包络仅有助于能量函数E[m]的噪声部分。缓慢变化部分(即低频分量)主要由于原始音频信号x的包络的影响。由此,方程式13可以通过下述方程式近似表示:
w e [ m ] ≈ 1 2 α ( E [ m ] lowpass ( E [ m ] ) - 1 ) - - - ( 14 )
其中“lowpass(.)”是低通滤波器函数。由此,将意识到在函数中用于上升余弦窗口整形的变白滤波器Hw能如图9所示实现。
可以看出,这种变白滤波器Hw(240A)包括用于接收信号E[m]的输入242A。然后,通过低通滤波器247A,处理这一信号的一部分以便产生低通滤波能量信号ELP[m],依次将其提供为计算阶段248A的输入,连同函数E[m]。然后,计算阶段248A将E[m]除以ELP[m]以便计算所提取的水印符号We[m]。
当在嵌入器的水印调节阶段中采用双相位窗口函数时,应当采用不同方法来估计原始音频的包络,因此,计算we[m]。
通过检查图6b所示的双相位窗口函数将看到当通过这种窗口函数调制音频包络时,在相反方向中缩放帧的第一和第二半部分。在检测器中,利用这一属性来估计主机信号x的包络能量。
因此,在检测器内,每个音频帧首先被细分成两个半部分。因此,分别通过下述给出对应于第一和第二半帧的能量函数
E 1 [ m ] = Σ n = 0 T x / 2 - 1 | y ′ b , m [ n ] | 2 - - - ( 15 )
以及
E 2 [ m ] = Σ n = T x / 2 T x - 1 | y ′ b , m [ n ] | 2 - - - ( 16 )
在两个子帧内,在相反方向中调制原始音频的包络,能将原始音频包络近似为E1[m]和E2[m]的平均值。
另外,能将瞬时调制值取为这两个函数的差值。因此,对双相位窗口函数,水印能通过下述等式近似给出:
w e [ m ] = 1 2 α ( E 1 [ m ] - E 2 [ m ] E 1 [ m ] + E 2 [ m ] - 1 ) - - - ( 17 )
因此,如图10所示,能实现用于双相位窗口整形函数的图8中的变白滤波器Hw(240B)。输入242B和243B分别接收第一和第二半帧E1[m]和E2[m]的能量函数。然后,将每个能量函数分成两个,以及提供到分别计算E1[m]-E2[m]以及E1[m]+E2[m]的加法器245B和246B。然后根据方程式17,将这些计算函数均传递到将来自加法器245B的值除以来自246B的值以便计算we[m]的计算单元24B,包含嵌入水印序列的Nb倍多个估计值。
然后将这一输出we[m]传递到缓冲和内插阶段300,其中,通过信号分离器310信号分离该信号,在长度Lb的缓冲器320中缓冲,以便解决嵌入器和检测器间不同步问题,以及内插在内插单元330中以便补偿嵌入器和检测器间的时标修改。
为使可能达到的鲁棒性最大化,确保水印系统不受嵌入器和检测器间的时间偏差的影响很重要。换句话说,水印检测器必须能与插入主机信号中的水印序列同步。
图11示例说明通过缓冲和内插阶段300执行的以便解决偏差问题的过程。所述的例子示例说明用于解决当在水印嵌入过程中利用上升余弦整形函数时的偏差。然而,原则上,当使用双相位窗口整形函数时,采用相同的技术是可行的。
参考图11,在通过滤波器Hb210滤波后,通过帧分频器220,将输入音频信号流y’b[n]最好分成有效长度Ts的重叠帧302。
最好,为解决嵌入器和检测器间的可能偏差,将每个帧分成Nb个子帧(304a,304b,...,304x),以及在子帧基础上,应用上述计算(方程式(12)至(17))。
最好,用相邻的子帧覆盖每个子帧。在所示的例子中,能看出用长度2Ts/Nb的每个子帧50%覆盖(Ts/Nb)每个子帧(304a,304b,...,304x)。当考虑到覆盖子帧时,主帧最好长于符号周期Ts以便允许帧间覆盖,如图11所示。
然后,通过变白阶段240,计算用于每个子帧的音频的能量,以及通过信号分离器310,将最终值信号分离成Nb缓冲器320。缓冲器320的每个连续的其中之一(B1,B2,...,BNb)包含一系列值,第一缓冲器B1包含对应于每帧内的第一子帧的一系列值,第二缓冲器B2包含对应于每帧内的第二子帧的一系列值等等。
如果wDi是第i缓冲器的容量,那么能显示出:
wDi[k]=wc[k·Nb+i],k∈{0,...Lb-1}                 (18)
其中,Lb是缓冲器长度。
对于上升余弦窗口整形函数,在帧中心集中嵌入水印的能量,以便与帧中心最佳对齐的子帧将导致比所有其他子帧显然更好的对嵌入水印符号的估计。实际上,每个缓冲器包含符号序列的估计,该估计对应于具有不同时间偏差的序列。
通过将每个缓冲器的容量与基准水印序列关联,确定与帧中心最佳对齐的子帧(即正确对齐的帧的最佳估计)。将具有最大关联峰值的序列选择为正确对齐帧的最佳估计。如下所述的相应的置信度用来确定检测的真值。最好,一旦已经找出具有超出所限定的阈值的相关峰值的估计水印序列,就停止关联过程。
通常,每个缓冲器的长度在水印序列长度Lw的3至4倍之间,由此通常为2048和8192符号间的长度,以及Nb通常在2至8范围内。
缓冲器通常是水印序列的3至4倍,以便能通过取所述符号的几个估计值的平均值构成每个水印符号。这一平均过程称为平滑,以及执行平均的倍数称为平滑因子sf。因此,假定缓冲器长度Lb以及水印序列长度Lw,平滑因子sf是:
Lb=sfLw                                   (19)
在另一优选实施例中,检测器基于先前搜索步骤的结果,改进用在偏差搜索中的参数。例如,如果第一估计系列显示存储在缓冲器B3中的结果提供信息信号的最佳估计值,那么,通过使子帧的位置移向最佳估计子帧的位置,来改进(相同搜索信号上,或在下一检测窗口期间接收的信号上)下一偏差搜索。由此反复改进具有0偏差的序列的估计值。
如图8所示,将来自缓冲阶段的输出(WD1,WD2,...WDNb)的输出传递到内插阶段以及在内插后,将解决水印信号中的可能的时标改进所需的这一阶段的输出(wI1,wI2,....wINb)传递到相关和判定阶段。将对应于不同可能偏差值的水印的所有估计值(wI1,wI2,....wINb)传递到相关和判定阶段400。
相关器410相对于基准水印序列wc[k],计算每个估计值wIj,j=1,....Nb的相关性。然后将对应于每个估计值的每个各自的相关输出施加到确定哪两个估计值提供最大相关峰值的最大检测单元420。将这些估计值选择为最匹配基准水印的循环移位版本wd1和wd2的两个估计值。将用于这些估计序列的相关值传递到阈值检测器和有效负载抽取器单元430。
在检测器内使用的基准水印序列ws对应于施加到主机信号上的原始水印序列(的可能循环移位版本)。例如,如果在嵌入器内使用具有种子S的随机数生成器,计算水印信号,那么同样地,检测器能使用相同的随机数生成算法和相同的初始种子S,计算相同的随机数序列,以便确定水印信号。另外,在嵌入器内初始施加的并由检测器用作基准的水印信号可以简单的是任何预定序列。
图12图示了作为来自相关器410的输出的相关函数的典型形状。横坐标表示相关延迟(根据序列样本)。左手侧上的纵坐标(称为置信度cL)表示相对于正常分布的相关函数规格化的标准偏差的相关峰值。
如所看到的,相对于cL,通常相关是相对较平,以及以cL=0为中心。然而,函数包含两个峰值,由pL分隔(见方程式6)以及当水印存在时,向上延伸到高于检测阈值的cL值。当相关峰值为负时,上述陈述采用它们的绝对值。
水平线(如图所示,并设置为cL=8.7)表示检测阈值。检测阈值控制错误报警率。
存在两种错误报警:错误正率,定义为检测非水印项中的水印的概率,以及错误负率,定义为未检测水印项中的水印的概率。通常,错误正报警的需求比错误负更迫切。图11的右手侧上的比例示例说明错误正报警b的概率。如在所示例子中所看到的,错误正的概率b=10-12等价于阈值cL=8.7,而b=10-83等价于cL=20。
在每个检测间隔后,检测器确定原始水印是否存在或是否不存在,以及在此基础上,输出“是”或“否”判定。如果需要的话,为改进这一判定进行过程,可以考虑采用多个检测窗口。在这种例子中,错误正概率是用于所考虑的每个检测窗口的各个概率的组合,由所需规则而定。例如,确定如果在三个判定间隔的任何两个输出上,相关函数具有超出阈值cL=7的两个峰值,那么认为水印确实存在。这种检测规则取决于水印信号的所需用途,以及考虑诸如主机信号的原始质量以及在正常传输期间,信号破坏所能达到的最坏程度的因素。
可以顺序地利用有效负载提取单元430来从所检测的水印信号提取有效负载(例如信息内容)。只要单元估计到超出检测阈值的两个相关峰值cL1和cL2,将循环移位的估计值cL’(在方程式(6)中定义)导出为峰值间的距离。接着,确定相关峰值的符号ρ1和ρ2,因此,可由方程式(7)计算rsign。然后使用方程式(8)计算整个水印有效负载。
例如,在图12中能看出pL是两个峰值间的相对距离。两个峰值为正,即ρ1=+1,以及ρ2=+1。从方程式(7),rsign=3。因此,有效负载pLw=<3,pL>。
通过图13所示的装置500,能有效地实现图8所述的符号提取和缓冲阶段。在这里,偏差补偿的实现,无需任何额外的计算。还可以看出通过简单的延迟和抽取模块,能实现信号分离。
首先,将输入帧信号yb,m细分成Nb个长度Ts/Nb的非重叠子帧,以及使用能量计算单元230计算每个子帧的能量。其次,在变白单元240中应用变白滤波器Hw。延迟单元510和相加单元520的组合有效地实现相邻子帧间的50%重叠。在加法器单元520的输出处生成水印符号序列we[m]后,使用延迟集512和下采样集530的组合,在Nb缓冲单元320上顺序地分布。完成此操作以便每个缓冲器获得用于we[k]的将来样本中的每个Nb的一个值。例如,如果第一样本转到wD1,第二样本转到wD2,第三转到wD3,...,第Nb转到wDNb上,因此,第(Nb+1)转回到wD1等等直到填满缓冲器为止。由此,第i缓冲器入口wDi[k]表示为
wDi[k]=we[Nbk+i]                             (20)
可以看出wDi[k]的采样频率为we[m]的1/Nb倍。经图13中的提取集532实现这一提取。
由于在能量计算单元230中考虑采用非重叠帧,生成Nb序列所需的全部计算与仅在整个帧上延伸的具有符号的一个序列所需的计算相同。
本领域的技术人员将意识到未经特定描述的各种实现,理解为落在本发明的范围内。例如,虽然仅描述了检测装置的功能性,将意识到装置能实现为数字电路、模拟电路、计算机程序或其组合。
同样地,虽然上述实施例的描述参考了音频信号,将意识到能应用本发明以便将信息增加到其他类型的信号上,例如信息或多媒体信号,诸如视频和数据信号。
另外,将意识到本发明能应用于仅包含一个水印序列的水印方案(即,1位方案),或包含多个水印序列的水印方案。将这些多个序列同时或连续地嵌入主机信号中。
同样地,虽然通过相关的每个估计值描述水印的上述检测,将意识到能将相关过程设置成一旦作出水印的正检测,即告停止。这减少了偏差确定时间。另外,能将解码器设置成通过重新排序缓冲器(或相关缓冲器的顺序)自适应地补偿时间偏差,以便当前检测窗口中的最佳对准缓冲器是将在下一检测窗口中相关的第一缓冲器。
在说明书内,将意识到词“组成”不排除其他元件或步骤,“a”或“and”不排除多个,以及单个处理器或其他单元可以实现在权利要求中引用的几个装置的功能。

Claims (20)

1.一种对所接收的信号中的偏差进行补偿的方法,通过符号序列改变该信号,每个符号在Ts信号样本上延伸,该方法包括步骤:
(a)将所接收的信号划分成帧;
(b)将每个帧划分成多个Nb子帧;
(c)形成Nb个值序列,该值由每个帧内的相应子帧导出;以及
(d)将所述Nb序列用作与符号序列的正确对准的帧序列的连续估计值。
2.如权利要求1所述的方法,其特征在于,每个帧为预定长度Ts
3.如权利要求1所述的方法,其特征在于,存在帧间重叠。
4.如权利要求1所述的方法,其特征在于,每个子帧与相邻子帧重叠。
5.如权利要求1所述的方法,其特征在于,Nb位于范围2至8中。
6.如权利要求1所述的方法,其特征在于,符号序列包括Lw符号,所接收的信号划分成LF帧,其中LF是Lw的整数倍。
7.如权利要求1所述的方法,其特征在于,所述符号序列包括通过窗口整形函数卷积的值序列,该窗口整形函数具有限带频特性和平滑时间特性。
8.如权利要求7所述的方法,其特征在于,所述窗口整形函数具有对称和反对称时间特性。
9.如权利要求1所述的方法,其特征在于,所述符号序列包括上升余弦函数或双相位函数的至少一个的序列。
10.如权利要求1所述的方法,其特征在于,所述偏差为时间偏差。
11.如权利要求1所述的方法,该方法进一步包括处理每个估计值,就象它是正确对准的帧序列一样,以便确定哪个估计值是最佳估计值。
12.如权利要求11所述的方法,其特征在于,假定最佳估计值为当处理时,超出一个或多个预定条件的第一估计值,一旦确定最佳估计值,就停止所述估计值的处理。
13.如权利要求1所述的方法,该方法进一步包括将所述估计值的每一个与对应于所述符号序列的基准相关;以及
将具有最大相关峰值的估计值用作最佳估计值的步骤。
14.如权利要求11、12或13的任何一个所述的方法,其特征在于,只要确定第一最佳估计值用于第一信号或信号的一部分,对另外接收的信号或部分信号重复该方法,来自按顺序正处理的所述另外的信号的估计值由所述第一最佳估计值而定。
15.一种用来执行如权利要求1所述的方法的计算机程序。
16.一种记录载波,包括如权利要求15所述的计算机程序。
17.一种方法,可用来下载如权利要求15所述的计算机程序。
18.一种装置,用来补偿所接收的信号中的偏差,通过符号序列改变该信号,每个符号在Ts信号样本上延伸,该装置包括:
将所接收的信号划分成帧的划分器;
将每个帧划分成多个Nb子帧的划分器;以及
处理器,用来形成Nb个值序列,该值由每个帧内的相应子帧导出;以及将所述Nb序列用作与符号序列正确对准的帧序列的连续估计值。
19.如权利要求18所述的装置,所述装置进一步包括用来存储所述Nb序列的缓冲器。
20.一种解码器,包括如权利要求18所述的装置。
CNB038071495A 2002-03-28 2003-02-26 水印信息信号的解码 Expired - Fee Related CN100401408C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02076203 2002-03-28
EP02076203.5 2002-03-28

Publications (2)

Publication Number Publication Date
CN1643592A true CN1643592A (zh) 2005-07-20
CN100401408C CN100401408C (zh) 2008-07-09

Family

ID=28459515

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038071495A Expired - Fee Related CN100401408C (zh) 2002-03-28 2003-02-26 水印信息信号的解码

Country Status (7)

Country Link
US (1) US7546466B2 (zh)
EP (1) EP1493153A1 (zh)
JP (1) JP4290014B2 (zh)
KR (1) KR20040101365A (zh)
CN (1) CN100401408C (zh)
AU (1) AU2003206082A1 (zh)
WO (1) WO2003083857A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101494756B (zh) * 2009-02-11 2011-01-05 北京航空航天大学 一种可逆视频水印无损漂移补偿方法
CN1975859B (zh) * 2005-10-28 2012-06-20 索尼欧洲有限公司 音频处理方法和装置
CN101494052B (zh) * 2008-01-24 2012-07-04 汤姆森许可贸易公司 确定并使用采样频率对水印信息进行解码的方法和设备

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040095325A (ko) * 2002-03-28 2004-11-12 코닌클리케 필립스 일렉트로닉스 엔.브이. 다매체 신호들의 워터마킹을 위한 윈도우 셰이핑 함수들
AU2003214489A1 (en) * 2002-03-28 2003-10-13 Koninklijke Philips Electronics N.V. Watermark time scale searching
US8116514B2 (en) * 2007-04-17 2012-02-14 Alex Radzishevsky Water mark embedding and extraction
US8838954B2 (en) * 2010-02-02 2014-09-16 Futurewei Technologies, Inc. Media processing devices for adaptive delivery of on-demand media, and methods thereof

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6078664A (en) * 1996-12-20 2000-06-20 Moskowitz; Scott A. Z-transform implementation of digital watermarks
WO1998033176A2 (en) * 1997-01-27 1998-07-30 Koninklijke Philips Electronics N.V. System for copy protection of recorded signals
JP3986150B2 (ja) * 1998-01-27 2007-10-03 興和株式会社 一次元データへの電子透かし
US6330673B1 (en) * 1998-10-14 2001-12-11 Liquid Audio, Inc. Determination of a best offset to detect an embedded pattern
US6564322B1 (en) * 1999-01-26 2003-05-13 International Business Machines Corporation Method and apparatus for watermarking with no perceptible trace
US6952774B1 (en) * 1999-05-22 2005-10-04 Microsoft Corporation Audio watermarking with dual watermarks
US7020285B1 (en) * 1999-07-13 2006-03-28 Microsoft Corporation Stealthy audio watermarking
JP3507743B2 (ja) * 1999-12-22 2004-03-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 圧縮オーディオデータへの電子透かし方法およびそのシステム
WO2001057868A1 (en) * 2000-02-01 2001-08-09 Koninklijke Philips Electronics N.V. Embedding a watermark in an information signal
US6674876B1 (en) * 2000-09-14 2004-01-06 Digimarc Corporation Watermarking in the time-frequency domain
JP3682222B2 (ja) * 2000-12-11 2005-08-10 株式会社東芝 電子透かし検出装置、電子透かし検出方法及び記録媒体
US7131007B1 (en) * 2001-06-04 2006-10-31 At & T Corp. System and method of retrieving a watermark within a signal
US7114071B1 (en) * 2001-09-13 2006-09-26 Dts Canada, Ulc Method and apparatus for embedding digital watermarking into compressed multimedia signals

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1975859B (zh) * 2005-10-28 2012-06-20 索尼欧洲有限公司 音频处理方法和装置
CN101494052B (zh) * 2008-01-24 2012-07-04 汤姆森许可贸易公司 确定并使用采样频率对水印信息进行解码的方法和设备
CN101494756B (zh) * 2009-02-11 2011-01-05 北京航空航天大学 一种可逆视频水印无损漂移补偿方法

Also Published As

Publication number Publication date
CN100401408C (zh) 2008-07-09
US20050166068A1 (en) 2005-07-28
US7546466B2 (en) 2009-06-09
JP2005522079A (ja) 2005-07-21
EP1493153A1 (en) 2005-01-05
AU2003206082A1 (en) 2003-10-13
KR20040101365A (ko) 2004-12-02
JP4290014B2 (ja) 2009-07-01
WO2003083857A1 (en) 2003-10-09

Similar Documents

Publication Publication Date Title
CN1975859A (zh) 音频处理
CN1096148C (zh) 信号编码方法和装置
CN1659652A (zh) 在多媒体信号内重新嵌入水印
CN1477872A (zh) 多声道数字音频信号的压缩编码和解码设备及其方法
CN1601912A (zh) 用于提供数字音频信号的高质量扩展和压缩的系统和方法
BR0304541A (pt) Método e arranjo para sintetizar um primeiro e um segundo sinal de saìda a partir de um sinal de entrada, aparelho para prover um sinal de áudio decodificado, sinal de multicanal decodificado, e, meio de armazenamento
CN1647186A (zh) 多媒体信号的时域加水印
CN1658283A (zh) 分离声源信号的方法和装置及用来检测间距的方法和装置
CN1511311A (zh) 使用基于听觉事件的特征化的时间对准音频信号的方法
CN1643574A (zh) 水印时间尺度搜索
CN1643593A (zh) 用于媒体信号的水印处理的窗口整形函数
CN1643592A (zh) 水印信息信号的解码
CN1856822A (zh) 多媒体信号的水印标记
CN1967594A (zh) 一种自适应的扩展变换抖动调制水印方法
CN1659855A (zh) 独立信道内的水印编码和解码
CN1894741A (zh) 用于检测信号中的水印的方法和设备
JP5051051B2 (ja) 電子透かし情報の埋め込みおよび抽出を行う装置、方法およびプログラム
CN1497879A (zh) 广播编码的系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080709

Termination date: 20100226