CN1585971A - 在信息信号中嵌入辅助数据 - Google Patents
在信息信号中嵌入辅助数据 Download PDFInfo
- Publication number
- CN1585971A CN1585971A CNA028226208A CN02822620A CN1585971A CN 1585971 A CN1585971 A CN 1585971A CN A028226208 A CNA028226208 A CN A028226208A CN 02822620 A CN02822620 A CN 02822620A CN 1585971 A CN1585971 A CN 1585971A
- Authority
- CN
- China
- Prior art keywords
- signal
- auxiliary data
- data signal
- delay
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 40
- 230000001105 regulatory effect Effects 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 11
- 230000001143 conditioned effect Effects 0.000 claims description 3
- 230000003750 conditioning effect Effects 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 230000005236 sound signal Effects 0.000 abstract description 22
- 230000006870 function Effects 0.000 description 64
- 230000008859 change Effects 0.000 description 10
- 230000002123 temporal effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000003111 delayed effect Effects 0.000 description 7
- 230000005764 inhibitory process Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000035807 sensation Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000005294 ferromagnetic effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00086—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
- G11B20/00884—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
- G11B20/00891—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
- Traffic Control Systems (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
揭示了一种调节要被嵌入到信息信号(x(n)),例如音频信号,的辅助数据信号(wm(n))的方法。方法包括以下步骤:确定(107)在预定的尺寸的范围上平均的、信息信号的第一特性函数(Mx (n))与在所述范围上平均的、辅助数据信号的第二特性函数(Mwm (n))的相对大小(g(n));以及根据确定的相对大小,调节(407)辅助数据信号。
Description
本发明涉及在信息信号中嵌入辅助数据,更具体地,涉及调节要被嵌入到信息信号中的辅助数据信号。
近年来,越来越多的使用和分配数字多媒体数据的趋势导致了对于这样的数据的适当的复制保护、版权保护、和所有权验证的不断增长的需要。
加数字水印是一种脱颖而出的技术,该技术可被使用于各种用途,诸如版权所有权的证明、追踪盗版物、控制复制控制设备、广播监视、真实性验证、把辅助信息加到多媒体信号等等。
水印包括辅助数据,该辅助数据通过稍微修正信号样本而被嵌入到信息信号中。优选地,加水印方案应当被设计成使得水印是不可觉察的,即,它对于信息信号的质量没有重大的影响。
在对音频信号加水印的领域内,已知多种嵌入算法。例如,在基于变换的算法中,数字音频信号的系数从时域变换到频域,被变换的信号的系数相应于辅助数据信号而被修正,然后修正的系数被变换回时域。已知方法的通常问题是它们缺乏时域上的分辨率。因此,辅助数据信号可能在时间上扩散,以及可能引入可感觉的失真。
在M.D.Swanson等的“Robust audio watermarking usingperceptual masking(通过使用感性掩蔽的增强的音频水印)”(SignalProcessing 66(1998)337-355)中,揭示了一种方法,其中通过对于主音频信号的包络进行建模而计算时间增益函数。估计的音频信号包络随音频信号增加,然后指数地衰减。在辅助数据信号嵌入之前,把估计的包络与辅助数据信号相乘,由此,形成音频分段的辅助数据信号。
然而,以上的现有技术方法牵涉到这样的问题:它会导致嵌入的数据的能量的不必要的减小。
以上问题可通过一种调节要被嵌入到信息信号的辅助数据信号的方法而被解决,该方法包括以下步骤:
-确定在预定的尺寸的范围上平均的、信息信号的第一特性函数与在所述范围上平均的、辅助数据信号的第二特性函数的相对大小(magnitude);
-根据确定的相对大小,调节辅助数据信号。
因此,辅助数据信号的调节的程度由主信号和辅助数据信号的本地特性确定,由此,允许辅助数据信号在音频信号比起辅助数据信号更弱的情形下被衰减,以及在音频信号是相对较强的情形下被放大。因此,达到辅助数据信号的自适应衰减,这提供很高的嵌入的水印能量,而同时保持最终的信号的感觉的质量。
本发明的另一个优点在于,它提供一种灵活的和计算上有效的调节辅助数据信号的方法。
按照本发明的优选实施例,第一特性函数是信息信号的本地能量函数,以及第二特性函数是辅助数据信号的本地能量函数。因此,音频信号和辅助数据信号的本地能量被计算和被直接比较。辅助数据信号在它的能量超过信息信号的能量的情形下被衰减,否则,它被放大。所以,可以嵌入很高的水印能量,由此就检测结果与感觉质量的比较而言,导致改进的性能。
当第一特性函数是信息信号的本地大小以及第二特性函数是辅助数据信号的本地大小时,得到一种在计算上节省的调节辅助数据信号的方法,它避免计算上昂贵的运算,诸如进行平方和计算平方根。
在某些情形下,所确定的相对大小可能具有不想要的特性,例如,它可能变得非常大,可能在幅度上快速改变等等。当根据所确定的相对大小调节辅助数据信号的步骤还包括调整所确定的相对大小的步骤时,时间增益函数的不想要的影响可被减小。
当调整步骤包括把相对大小的幅度限制到一个预定的最大值的步骤时,可以避免辅助数据信号的不想要的强的放大。
当调整步骤包括对所确定的相对大小施加低通滤波的步骤时,可以减小幅度的快速改变。
当平均的特性函数的相对大小的改变比起该信号被延迟时,可能出现不想要的影响,特别是在信息信号快速改变的过渡区域中。为了避免这些影响,按照本发明的优选实施例,根据所确定的相对大小来调节辅助数据信号的步骤包括以下步骤:
-把辅助数据信号延迟一个预定的延时;以及
-根据所确定的相对大小调节延时的辅助数据信号。
因此,计算的相对大小的延时被补偿。
当预定的延时相应于该范围大小时,达到对前回声(pre-echo)失真的改进的抑制。由于人的听觉系统(HAS)对于前回声比起后回声(post-echo)更为灵敏,对前回声失真的抑制可以产生最终信号的感觉的质量的改进。
在另一个优选实施例中,根据所确定的相对大小调节辅助数据信号的步骤包括以下步骤:
-把辅助数据信号延迟一个相应于所述范围大小的延时,产生延时的信号;
-根据所确定的相对大小调节延时的信号,产生出第一延时的调节的信号;
-根据所确定的相对大小调节辅助数据信号,产生出调节的信号;
-把调节的信号延迟一个相应于该范围大小的延时,产生出第二延时的调节的信号;以及
-组合第一和第二延时的调节的信号。
因此,得到对前回声和后回声失真的改进的抑制。
在本发明的再一个优选实施例中,确定相对大小的步骤还包括以下步骤:
-计算第三特性函数;
-延时第三特性函数,以得到延时的特性函数;以及
-把第三特性函数与延时的特性函数相组合,以得到第二特性函数。
因此,得到对这些影响的进一步改进的抑制,这些影响是通过平均的特性函数的相对大小的改变相对于信号的延时而造成的,特别是在信息信号快速改变的过渡区域中。
本发明还涉及用于调节要被嵌入到信息信号中的辅助数据信号的设备,该设备包括:
-用于确定在预定的尺寸的范围上平均的、信息信号的第一特性函数与在所述范围上平均的、辅助数据信号的第二特性函数的相对大小的装置;以及
-用于根据所确定的相对大小来调节辅助数据信号的装置。
本发明还涉及用于把辅助数据信号嵌入到信息信号的设备,该设备包括用于调节要被嵌入到信息信号中的辅助数据信号的设备,该调节设备包括:
-用于确定在预定的尺寸的范围上平均的、信息信号的第一特性函数与在所述范围上平均的、辅助数据信号的第二特性函数的相对大小的装置;以及
-用于根据所确定的相对大小来调节辅助数据信号的装置。
本发明还涉及一个在其中嵌入辅助数据信号的信息信号,其中辅助数据信号通过一种包括以下步骤的方法而被调节:
-确定在预定的尺寸的范围上平均的、信息信号的第一特性函数与在所述范围上平均的、辅助数据信号的第二特性函数的相对大小;以及
-根据所确定的相对大小来调节辅助数据信号。
信息信号可以体现为在诸如内部网、外部网、互联网、局域网、无线或有线网络等等的通信网中的通信信号。
信息信号还可被存储在存储媒体中。术语存储媒体可包括磁带、光盘、数字视盘(DVD)、小型盘(CD或CD-ROM)、迷你盘、硬盘、软盘、铁电存储器、电可擦可编程只读存储器(EEPROM)、快闪存储器、EPROM、只读存储器(ROM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(SDRAM)、铁磁存储器、光存储器、电荷耦合器件、智能卡、PCMCIA卡等等。
通过参考实施例和参考附图将明白和阐述本发明的这些和其他方面,其中:
图1显示按照本发明的实施例的、用于把水印嵌入信息信号的设备的示意图;
图2a-b显示在辅助数据信号被嵌入到具有强的和突然的幅度改变的主音频信号时前回声和后回声失真的影响;
图3显示按照本发明的实施例的方法的流程图;
图4显示按照本发明的实施例的调节辅助数据信号的设备的示意图;
图5a-d显示按照本发明的实施例的延时辅助数据信号的影响;
图6显示按照本发明的另一个实施例的调节辅助数据信号的设备的示意图;以及
图7a-b显示按照本发明的用于实施滤波函数E(n)的设备的两个
实施例。
图1显示按照本发明的实施例的、用于把水印嵌入信息信号的设备的示意图。该设备包括电路101,用来把主音频信号x(n)分段成帧xi(n);以及电路102,用来例如通过施加快速付立叶变换(FFT)把帧变换到付立叶(Fourier)域,产生付立叶系数Xi(k)。该设备还包括乘法器电路103,用来按照水印序列W(k)稍微修正每个帧的付立叶系数Xi(k),产生水印样本Xi(k).W(k)。水印序列W(k)可以是伪随机序列,例如具有零中值和单位标准偏差的正态分布伪随机序列。该设备还包括电路104,用来例如通过施加逆快速付立叶变换(IFFT)把水印样本Xi(k).W(k)变换到时域。随后,水印分段被电路105级联在一起,得到重建的水印信号wm(n),并由乘法器电路106把它与总的嵌入强度s相乘。该设备还包括电路107,用来计算时间增益函数g(n),并由乘法器电路108把它与经过定标的水印信号s.wm(n)相乘。最后,经过定标的水印信号s.g(n).wm(n)通过加法器109被添加到主音频信号x(n),产生水印音频信号y(n)=x(n)+s.g(n).wm(n)。
应当指出,在频域中的乘法,W(k).Xi(k),相应于在时域中的循环卷积。所以,在任何给定的帧i中的水印信号可被表示为wmi(n)=w(n)xi(n),其中w(n)是在时域中的相应的水印信号。
然而,在由电路104把一个水印帧变换回时域的步骤期间,水印能量可被扩散在整个帧上。这个效果会造成可觉察的失真,特别是在存在强的和突然的幅度改变时,正如结合图2a-b显示的。通过把加水印的信号与适当选择的增益函数g(n)相乘,音频水印的时间特性可被改进。下面将描述按照本发明的、计算这样的增益函数的方法。
应当看到,可以不用快速付立叶变换而采用其他类型的数学变换。这样的变换的例子包括离散付立叶变换(DFT)、离散余弦变换(DCT)、小波变换等。
还应当看到,可以采用其他的嵌入方案。例如,用于计算线性卷积的FIR水印过滤器可被使用来计算加水印的音频信号。与基于变换的算法不同,线性卷积的计算不包括对主信号x(n)的分段。按照这个实施例,加水印的音频信号按照公式
进行计算,其中符号
表示线性卷积,即,
与以上描述的基于变换的算法类似,基于线性卷积的嵌入方法可能受到限制的时间分辨率和可觉察的失真。
图2a-b显示在辅助数据信号被嵌入到具有强的和突然的幅度改变的主音频信号时前回声和后回声失真的影响。图2a显示主音频信号的例子,其中归一化的幅度A被显示为时间t的函数。在图2a的例子中的音频信号代表用响板选录的短的音频段,它包括强的和突然的幅度改变201和202。这样的幅度改变也称为“打击(attacks)”或“瞬变”。
图2b显示按照结合图1描述的方法从图2a的主信号计算的水印信号,但没有使用时间增益函数。如图2b所示,分别围绕打击201和202的位置207和208,水印信号在相应于一个分析帧的一个宽度上被弄模糊。分析窗的宽度分别由对于打击位置207的水平线209-210和对于打击位置208的水平线211-212表示。图2b还显示,在打击位置前被引入的失真,即,分别在区域203与205,和在打击位置后被引入的失真,即,分别在区域210与212。这些失真分别引起可觉察的前回声和后回声失真。因此,从图2a-b可以看到,由水印信号引入的可觉察的失真在存在打击时被突显出来。
本发明的优点在于,它提供一种消除在强的和突然的幅度改变时的可觉察的失真的、快速的和计算上节省的方法,而不需要确定这样的改变的位置。因此,由检测打击的失败引起的可能的失真被减小。
图3显示按照本发明的实施例的、计算用于调节水印信号的时间增益函数的方法的流程图。按照这个实施例,假设时域水印信号wm(n)是根据主音频信号x(n),例如按照结合图1描述的方法之一而生成的。在步骤301,按照下式计算辅助数据信号的移动的能量:
这里,E(n)是具有幅度1和长度N的矩形窗口函数,即,E(n)=1,对于0≤n<N,以及E(n)=0,其它情形。优选地,N被选择为大大地小于帧的长度,在基于帧的嵌入方案中;或大大地小于滤波器的尺寸,在基于FIR的方案中,正如参照图1描述的。如果N被选择为非常小,增益函数将很大地起伏,由此,在信号中感应噪声。如果N被选择为大的,即,帧的长度的量级,则时间增益函数仅仅很慢地变化,由此,减小在强的和突然的幅度改变时抑制失真的效率。在本发明的一个实施例中,N可被选择为相应于约7毫秒。在具有长度为2048样本的水印滤波器的44.1kHz音频的例子中,这相应于约301个样本。然而,应当指出,这只是一个例子,也可以使用从1-20毫秒的范围内的其他数值,或甚至更大的数值。
同样地,在步骤302,辅助数据信号的动能按照下式进行计算:
在步骤303,增益函数作为计算的能量信号的比值被计算:
这里,为了防止可能的被零除的除法,把一个小参数ε加到分母上。优选地,ε被选择为小的正数,即,0<ε<<1。例如,ε可以在0.001和0.1之间进行选择。然而,其他数值也是可能的。
q(n)的数值表示被嵌入的水印信号比起主信号有多强。小于1的q(n)的数值表示水印的本地能量超过主信号的本地能量。因此,通过将水印信号乘以q(n),水印信号在这些位置处被衰减。大于1的q(n)的数值表示水印能量小于主信号。因此,在这些位置处,水印信号通过把它乘以q(n)而被放大,而同时保持觉察的质量。
还应当指出,在上式中的因子1/N在计算Mx(n)和Mwm(n)时可被忽略。当计算Mx(n)和Mwm(n)的比值时,这样的因子几乎抵销,它们对于结果没有任何重大的影响。
应当指出,步骤301和302不必按所表示的次序执行。替换地,步骤301可以在步骤301之前执行,或优选地,步骤301和302可以平行地执行。
还应当指出,代替信号能量,可以使用测量信号的本地特性的其他特性函数。例如,可以使用能量的单值函数,例如,能量的幂函数,诸如能量的平方根,相应于使用数量[Mx(n)]p和[Mwm(n)]p,p>0,例如p=1/2。按照本发明的另一个实施例,可以分别使用信号x(n)和wm(n)的绝对值。因此,代替使用Mx(n)和Mwm(n),可以计算以下函数:
这个实施例的优点在于,它只需要很少的计算资源,因为它不涉及到平方运算。
与上面同样地,替换地,可以使用以上的量M′x(n)和M′wm(n)的单值函数,例如,通过忽略因子1/N,将这些量进行平方,取平方根等等。
还应当指出,在计算以上的平均值中代替选择矩形窗口,可以使用相应于加权平均值的其他窗口函数,其中例如较新近的信号值比起遥远的信号值逐渐更强地被加权。
最后,应该指出,代替以上比值可以使用其它函数,该函数指示以上本地能量的相对大小,例如,以上比值的任何单值函数,或者结合图4将要描述的已调整的比值。
图4显示按照本发明的实施例的、用于调节水印信号的设备的示意图。在图4上,假设时域水印信号wm(n)是根据主音频信号x(n),例如按照结合图1描述的方法之一而生成的。该设备包括电路107,用来计算时间增益函数。按照本发明的这个实施例,电路107包括电路401-402,用来分别计算水印信号的动能Mwm(n)和主信号的动能Mx(n),正如以上结合图3描述的。在电路403中,初始增益函数q(n)是作为主信号的能量和水印能量的比值被计算,正如以上结合图3描述的。该设备还可包括调整电路404,它保证时间增益函数不超过预定的阈值gmax,即,调整电路404执行以下运算:
这产生调整的增益函数g(n)。阈值例如可被选择为1,如果不希望放大水印信号的话。数值gmax>1相应于最大允许的信号放大量。
替换地或附加地,电路404可用来执行其他调整运算,以便保证时间增益函数满足某些条件。作为例子,应用低通滤波器保证时间增益函数的幅度不快速起伏。
应当指出,以上结合图3讨论的参数ε也可对于函数q(n)的最大幅度加上某个约束条件。
该设备还可包括延时电路405,用来将水印信号wm(n)延迟一个预定的延时值,以便补偿由在电路401-402中进行动能的计算引入的延时。下面将结合图5a-d讨论延时值的优选的选择。水印的总的加权可通过由电路406将水印信号wm(n)乘以全局嵌入强度s而被确定,正如以上结合图1描述的。调整的增益函数通过乘法电路407与延时的和经过定标的水印信号相乘。最后,水印信号通过相加电路409被加到主信号x(n),产生加水印的信号y(n)。该设备还包括延时电路408,用来在相加电路409之前延时主信号,相应于由延时电路405和g(n)的计算引入的延时。
图5a-d显示延时单元405对于时间增益函数的特性的影响。通常,具有N个系数的线性相位FIR滤波器引入相应于(N-1)/2的延时,其中N假设是奇数。因此,动能的计算引入相应的延时。这在图5a-d上示出,图上显示了水印信号的简化的例子。点线502表示简化的水印信号的能量的包络,它在图5a-d上假设是由于在位置c处具有强的打击的音频主信号造成的。在图5a-d的例子中,合成的音频主信号假设为在位置c处包括Δ峰值501,这造成矩形水印信号502。在图5a上,相应的计算的水印能量信号Mwm(n)被显示为实线503。正如从图5a看到的,平均的能量信号在位置a和b之间的间隔(相应于在其上进行能量平均的、N个信号样本的间隔)上逐渐增加。相应地,平均的信号能量信号在位置d和e之间的间隔上减小。在图5a上,假设延时单元505没有引入延时。因此,实线503的特性相应于本地平均函数Mwm(n)的特性,该本地平均函数Mwm(n)是相对于输入信号wm(n)被延时的。这个延时可能在点a和b之间的过渡区域中(其中水印信号的包络与Mwm(n)同时突然地增加)导致不想要的特性。因此,最后得到的增益函数q(n)在a与b之间的间隔中只逐渐减小,由此,导致前回声信号的不充分的抑制。另一方面,后回声信号也在d和e之间的过渡区域中被充分抑制。
图5b显示当水印信号wm(n)502被延迟一个延时(N-1)/2(即,相应于平均间隔的长度的一半)时增益函数q(n)的影响。从图5b可以看到,这个延时导致前回声失真的改进的抑制,而现在在d与e之间的区域中的后回声失真只部分地被抑制。
在图5c上,水印信号被延迟(N-1)个样本,相应于平均窗口的长度。这个延时保证前回声失真在b与c之间的整个区域中被抵销。按照这个实施例,后回声失真在d与e之间的区域中没有有效地抑制。然而,这可能没有显著地降低信号的感觉的质量,因为HAS对于前回声比起后回声敏感得多(例如,见E.Zwicker和H.Fastl,“Psychoacoustics,Facts and Models(心理声学、事实和模型)”,Springer,Berlin,Heidelberg,1990)。因此,选择相应于平均窗口的长度的延时,导致在检测结果对感觉质量方面的改进的性能,而没有附加的计算复杂性。
按照图5c的实施例的、缺乏完全后回声抑制可以通过图5a和5c所示的方法的组合而被解决。这个实施例显示于图5d,其中前回声和后回声都被抑制。在本发明的一个实施例中,这个组合可以由图6所示的设备达到。
应当指出,可以使用不同于以上讨论的例子的其他的延时值,例如在(N-1)/2与(N-1)之间的延时值。例如不用(N-1),可以使用等于或稍偏离于被使用于平均的间隔的长度N的另一个延时值。作为例子,不用(N-1),可以使用N+1、N-3、N+3、N-5、N+5等等的延时值。然而,如果延时被选择为显著地大于N,则后回声影响变得越来越可听见的,而不会进一步改进前回声抑制。类似的考虑可应用到延时(N-1)/2。而且,本领域技术人员将会看到,如果N是偶数,以上的延时(N-1)/2和(N-1)可以分别用N/2和N代替。
图6显示按照本发明的实施例的设备的示意图,该设备实施结合图5d描述的组合的延时。该设备包括单元107,用来计算结合图3和4描述的时间增益函数。设备还包括电路405,用于把辅助数据信号与全局定标因子s相乘,延时单元408和相加电路409,用于组合信息信号与经过定标的水印信号,正如结合图4描述的。按照本发明的这个实施例,由电路107计算的时间增益函数g(n)通过乘法器603与经过定标的、未延时的辅助数据信号相乘。设备还包括延时单元605,它将经过定标的辅助数据信号优选地延迟一个相应于平均窗口的大小的延时,正如结合图5c描述的。延时的信号通过乘法器604与增益函数g(n)相乘。而且,乘法器603的输出被延时单元606延时,相应于由延时单元605引入的延时。设备还包括电路607,用来生成相应于乘法器607的输出与延时单元606的输出的最小值的输出。最后,单元607的输出通过电路409与延时的信息信号相组合。因此,单元607的输出相应于按照结合图5d描述的方法被调节的辅助数据信号,由此,产生前回声和后回声失真的抑制。
替换地,可以使用实施组合的延时的其他的方法。例如,从实施方案观点看来,计算的效率可以通过按照电路107里面的电路607执行比较而被提高。因此,按照另一个实施例,在电路401中被计算的信号Mwm(n)可被分割,分割的信号可以互相相对地延时。延时的版本可以按照逐个样本的原则互相比较,以及最大值可被用作为Mwm的最后版本。
图7a-b显示按照本发明的、用于实施滤波函数E(n)的设备的两个实施例。图7a显示实施前向结构的实施例。首先应当指出,在图3和4的实施例中滤波函数E(n)的特别的形状相应于转移函数:
因此,这个滤波器可以通过图7a所示的前向结构被实施。在图7a上,显示了对于N=5的例子的结构。在图7a上的设备包括4个延时单元701和4个加法器702。因此,在一般的情形下,按照图7a所示的结构的实施方案需要N-1个加法器和N-1个延时单元。
以上的设备的复杂性可以通过按递归结构实施按照下式的转移函数而被大大地减小。
这个结构可以按照所谓的“直接形式2”被实施(例如见Alan V.Oppenheim和Ronald W.Schafer,”Discrete-Time SignalProcessing(离散时间信号处理)”,Prentice Hall,1999),正如图7b所示的,再次是对于N=5的例子。正如可以看到的,这个实施方案需要5个延时单元701,而加法器702的数目被减小到2。单元703包括乘以因子(-1)的乘法,即,改变正负号。因此,对于N的所有的选择,这个实施方案把加法器的数目减小到2,而延时单元的数目比起图7a的前向结构来说,则增加1。所以,特别是对于较大的N值,达到复杂性的显著的减小。
应当指出,也可以使用其他替换的实施方案。例如,所谓的“直接形式1”结构(例如见Alan V.Oppenheim和Ronald W.Schafer,“Discrete-Time Signal Processing(离散时间信号处理)”,Prentice Hall,1999),需要N+1个延时单元和2个加法器。
应当看到,在本文件中描述的设备可以通过任何处理单元(例如,可编程微处理器、专用集成电路、或另一个集成电路、智能卡等等)被实施。
还应当指出,本发明是在音频信号加水印的领域中本发明的实施例方面被描述的。然而,应当看到,本方法也可被应用于把其他辅助数据嵌入到其他类型的主信号,诸如多媒体信号、视频信号、动画、图形、静止图象等等。在某些实施例中,主信号可被表示在不同于时域的其他域,诸如在图象方面的空间域,以及幅度的观念可以用其他量代替,诸如亮度、强度等等。
还应当指出,本发明可被应用于其中辅助数据信号被嵌入到信息信号的各种应用。例如,在加水印领域中,辅助数据信号可被嵌入作为版权所有权的证明、对非法盗版的追踪、控制复制控制设备、广播监视、真实性验证、将辅助信息加到多媒体信号等等。作为例子,音频水印可以在音频信号分配之前,通过记录器或其他设备被嵌入到音频信号,例如作为通信信号,被存储在存储媒体等等。
应当指出,上述的实施例是显示而不是限制本发明,以及本领域技术人员能够设计许多替换的实施例,而不背离附属权利要求的范围。在权利要求中,被放置在括号之间的任何参考符号不应当看作为限制权利要求。单词“包括”并不排除存在除权利要求中所列出的以外的其他单元或步骤。本发明可藉助于包括几个不同的单元的硬件和藉助于适当地编程的计算机实施。在枚举几个装置的设备权利要求中,几个这些装置可以通过同一个硬件项来体现。某些措施在互相不同的从属权利要求中被列举的仅仅的事实并不表示这些措施的组合不能被用来获益。
Claims (15)
1.一种调节要被嵌入到信息信号(x(n))的辅助数据信号(wm(n))的方法,该方法包括以下步骤:
-确定在预定的尺寸(N)的范围上平均的、信息信号的第一特性函数(Mx(n))与在所述范围上平均的、辅助数据信号(Mwm(n))的第二特性函数的相对大小(g(n));
-根据所确定的相对大小,调节辅助数据信号。
2.按照权利要求1的方法,其中第一特性函数是信息信号的本地能量函数,以及第二特性函数是辅助数据信号的本地能量函数。
3.按照权利要求1的方法,其中第一特性函数是信息信号的本地大小,以及第二特性函数是辅助数据信号的本地大小。
4.按照权利要求1的方法,其中根据所确定的相对大小来调节辅助数据信号的步骤还包括调整所确定的相对大小的步骤。
5.按照权利要求4的方法,其中调整的步骤包括把相对大小的幅度限制到一个预定的最大值的步骤。
6.按照权利要求4的方法,其中调整的步骤包括对所确定的相对大小施加低通滤波的步骤。
7.按照权利要求1的方法,其中根据所确定的相对大小来调节辅助数据信号的步骤包括以下步骤:
-把辅助数据信号延迟一个预定的延时;以及
-根据所确定的相对大小调节延时的辅助数据信号。
8.按照权利要求7的方法,其中预定的延时相应于范围大小。
9.按照权利要求1的方法,其中根据所确定的相对大小来调节辅助数据信号的步骤包括以下步骤:
-把辅助数据信号延迟一个相应于该范围大小的延时,产生延时的信号;
-根据所确定的相对大小调节延时的信号,产生第一延时的调节的信号;
-根据所确定的相对大小调节辅助数据信号,产生调节的信号;
-把调节的信号延迟一个相应于该范围大小的延时,产生第二延时的调节的信号;以及
-组合第一和第二延时的调节的信号。
10.按照权利要求1的方法,其中确定相对大小(g(n))的步骤包括以下步骤:
-计算第三特性函数;
-延时第三特性函数,以得到延时的特性函数;以及
-把第三特性函数与延时的特性函数相组合,以得到第二特性函数。
11.按照权利要求1的方法,其中信息信号包括数字音频信号。
12.一种用于调节要被嵌入到信息信号(x(n))中的辅助数据信号(wm(n))的设备,该设备包括:
-用于确定在预定的尺寸(N)的范围上平均的、信息信号的第一特性函数(Mx(n))与在所述范围上平均的、辅助数据信号(Mwm(n))的第二特性函数的相对大小(g(n))的装置(107);
-用于根据所确定的相对大小来调节辅助数据信号的装置(407)。
13.一种用于把辅助数据信号(wm(n))嵌入到信息信号(x(n))的设备,该设备包括用于调节要被嵌入到信息信号中的辅助数据信号的设备,该调节设备包括:
-用于确定在预定的尺寸(N)的范围上平均的、信息信号的第一特性函数(Mx(n))与在所述范围上平均的、辅助数据信号的第二特性函数(Mwm(n))的相对大小(g(n))的装置(107);
-用于根据所确定的相对大小来调节辅助数据信号的装置(407)。
14.一种其中嵌入辅助数据信号(wm(n))的信息信号(y(n)),其中该辅助数据信号通过包括以下步骤的方法被调节:
-确定在预定的尺寸(N)的范围上平均的、信息信号的第一特性函数(Mx(n))与在所述范围上平均的、辅助数据信号的第二特性函数(Mwm(n))的相对大小(g(n));
-根据所确定的相对大小来调节辅助数据信号。
15.一种其上记录按照权利要求14的信息信号的存储媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01204387 | 2001-11-16 | ||
EP01204387.3 | 2001-11-16 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1585971A true CN1585971A (zh) | 2005-02-23 |
CN1308912C CN1308912C (zh) | 2007-04-04 |
Family
ID=8181250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB028226208A Expired - Fee Related CN1308912C (zh) | 2001-11-16 | 2002-10-24 | 一种在信息信号中嵌入辅助数据的方法和设备 |
Country Status (10)
Country | Link |
---|---|
US (1) | US7561688B2 (zh) |
EP (1) | EP1449204B1 (zh) |
JP (1) | JP4474161B2 (zh) |
KR (1) | KR20040058289A (zh) |
CN (1) | CN1308912C (zh) |
AT (1) | ATE315822T1 (zh) |
BR (1) | BR0206444A (zh) |
DE (1) | DE60208706T2 (zh) |
ES (1) | ES2255626T3 (zh) |
WO (1) | WO2003042978A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2009634A1 (en) * | 2000-12-14 | 2008-12-31 | ECD Systems, Inc. | Systems and methods for optical media modification |
GB2431837A (en) * | 2005-10-28 | 2007-05-02 | Sony Uk Ltd | Audio processing |
US20130317817A1 (en) * | 2012-05-22 | 2013-11-28 | Nuance Communications, Inc. | Method and Apparatus for Applying Steganography in a Signed Model |
FR2992766A1 (fr) * | 2012-06-29 | 2014-01-03 | France Telecom | Attenuation efficace de pre-echos dans un signal audionumerique |
US9269363B2 (en) * | 2012-11-02 | 2016-02-23 | Dolby Laboratories Licensing Corporation | Audio data hiding based on perceptual masking and detection based on code multiplexing |
US9099080B2 (en) | 2013-02-06 | 2015-08-04 | Muzak Llc | System for targeting location-based communications |
US11244692B2 (en) * | 2018-10-04 | 2022-02-08 | Digital Voice Systems, Inc. | Audio watermarking via correlation modification using an amplitude and a magnitude modification based on watermark data and to reduce distortion |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5319735A (en) * | 1991-12-17 | 1994-06-07 | Bolt Beranek And Newman Inc. | Embedded signalling |
US5940429A (en) * | 1997-02-25 | 1999-08-17 | Solana Technology Development Corporation | Cross-term compensation power adjustment of embedded auxiliary data in a primary data signal |
-
2002
- 2002-10-24 KR KR10-2004-7007390A patent/KR20040058289A/ko not_active Application Discontinuation
- 2002-10-24 WO PCT/IB2002/004456 patent/WO2003042978A1/en active IP Right Grant
- 2002-10-24 JP JP2003544730A patent/JP4474161B2/ja not_active Expired - Lifetime
- 2002-10-24 DE DE60208706T patent/DE60208706T2/de not_active Expired - Lifetime
- 2002-10-24 US US10/495,537 patent/US7561688B2/en not_active Expired - Fee Related
- 2002-10-24 BR BR0206444-8A patent/BR0206444A/pt not_active IP Right Cessation
- 2002-10-24 AT AT02777654T patent/ATE315822T1/de not_active IP Right Cessation
- 2002-10-24 ES ES02777654T patent/ES2255626T3/es not_active Expired - Lifetime
- 2002-10-24 EP EP02777654A patent/EP1449204B1/en not_active Expired - Lifetime
- 2002-10-24 CN CNB028226208A patent/CN1308912C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
KR20040058289A (ko) | 2004-07-03 |
BR0206444A (pt) | 2003-12-30 |
US7561688B2 (en) | 2009-07-14 |
DE60208706T2 (de) | 2006-10-05 |
DE60208706D1 (de) | 2006-04-06 |
JP4474161B2 (ja) | 2010-06-02 |
EP1449204B1 (en) | 2006-01-11 |
US20050025314A1 (en) | 2005-02-03 |
WO2003042978A1 (en) | 2003-05-22 |
ES2255626T3 (es) | 2006-07-01 |
ATE315822T1 (de) | 2006-02-15 |
EP1449204A1 (en) | 2004-08-25 |
JP2005509907A (ja) | 2005-04-14 |
CN1308912C (zh) | 2007-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Highly robust, secure, and perceptual-quality echo hiding scheme | |
US20030172277A1 (en) | Digital watermark system | |
CN1308912C (zh) | 一种在信息信号中嵌入辅助数据的方法和设备 | |
JP4504681B2 (ja) | 補助データを情報信号に埋め込む方法及びデバイス | |
Cetinel et al. | Robust chaotic digital image watermarking scheme based on RDWT and SVD | |
CN1270314C (zh) | 嵌入和减去水印的方法和装置 | |
EP1393314B1 (en) | Watermarking | |
EP1639826B1 (en) | Raising detectability of additional data in a media signal having few frequency components | |
Lin et al. | DWT based on watermarking algorithm and its implementing with DSP | |
CN1894741A (zh) | 用于检测信号中的水印的方法和设备 | |
Lee et al. | Audio watermarking through modification of tonal maskers | |
CN1894743A (zh) | 水印嵌入 | |
KR100821349B1 (ko) | 디지털 워터마크 생성 방법 및 검출 방법 | |
Patil et al. | Audio watermarking: A way to copyright protection | |
Thompson et al. | Watermarking for multimedia security using complex wavelets | |
Wu et al. | An Echo Watermarking Method using an Analysis-by-synthesis Approach. | |
US20070106900A1 (en) | Estimation of quantisation step sizes for a watermark detector | |
Yigiun et al. | An audio zero-watermark algorithm combined DCT with zernike moments | |
Narangale et al. | Effective Prototype Algorithm for Noise Removal Through Gain and Range Change | |
Wu et al. | Analysis-by-synthesis echo watermarking | |
Godsill et al. | Summary and Future Research Directions | |
Thu et al. | Novel approach of watermarking in audio file | |
JP2009021662A (ja) | 画像電子透かし埋め込み装置およびそれに電子透かしを画像に埋め込む手順を実行させるプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070404 Termination date: 20121024 |