CN105103223A - 用于确定可包含回声、回响和/或噪声的接收到的音频信号中的水印符号的方法和设备 - Google Patents

用于确定可包含回声、回响和/或噪声的接收到的音频信号中的水印符号的方法和设备 Download PDF

Info

Publication number
CN105103223A
CN105103223A CN201480019607.2A CN201480019607A CN105103223A CN 105103223 A CN105103223 A CN 105103223A CN 201480019607 A CN201480019607 A CN 201480019607A CN 105103223 A CN105103223 A CN 105103223A
Authority
CN
China
Prior art keywords
value
probability
watermark symbol
candidate
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480019607.2A
Other languages
English (en)
Inventor
陈晓明
彼得·乔治·鲍姆
迈克尔·阿诺德
乌尔里希·格里斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN105103223A publication Critical patent/CN105103223A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00884Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00884Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
    • G11B20/00891Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/106Enforcing content protection by specific content processing
    • G06F21/1063Personalisation

Abstract

在通过引起回声、回响和/或噪声的声学路径发送了有水印的音频信号之后,水印检测相关结果峰值集中在主相关结果峰值附近的有限时间范围内,其中,有限时间范围比总相关长度小得多。水印检测基于:假设针对未标记内容的相关结果值的平均或预期概率分布中的np个相关结果峰值概率被计算为:在覆盖有限时间范围的窗口内,存在大于或等于这些峰值v的来自相关结果值集合的np个或更多个值。

Description

用于确定可包含回声、回响和/或噪声的接收到的音频信号中的水印符号的方法和设备
技术领域
本发明涉及用于确定可包含回声、回响和/或噪声的接收到的音频信号中的水印符号的方法和设备。
背景技术
音频水印嵌入是以不可听的方式将附加信息嵌入音频信号的处理。通过改变音频信号,例如通过添加伪随机噪声或回声,来执行嵌入。为了使嵌入不可听,通过对音频信号进行心理声学分析来控制嵌入的强度。WO2011/141292A1描述了在音频信号(例如由麦克风接收到的扬声器声音)中存在回声、回响和/或噪声的情况下的水印检测。这些回声导致与水印符号(即,参考信号)的长度N的相关结果值序列中的多个峰值,并用于提高水印检测的可靠性。这种统计检测器的基本步骤是:
-针对每个候选水印符号寻找相关结果序列中的峰值其中,并且np是被考虑的相关结果峰值的数目;
-递归地计算候选水印符号被嵌入的误检概率
-选择导致最低P(k)值的候选水印符号。
P(k)是错误地接受候选水印符号的概率。其描述了来自非水印嵌入的信号部分的k个或更多个相关结果值大于或等于被考虑的实际k个峰值的概率。
统计检测器解决了以下问题:
a)如何递归地评估概率P(k),其中,可以逐渐增加被考虑的峰值的数目k。
b)如何通过重新使用已经执行的计算来最小化计算复杂度。
该统计检测器使用若干相关结果峰值来提高检测性能。如果通过声学路径发送水印嵌入的音轨(这由于回声而导致多径检测),则这种提高尤其有利。用于计算P(k)的np个峰值来自于长度N的整个相关结果值序列。
发明内容
然而,这种类型的处理未以最佳方式反映物理真实性,这是因为相关结果值序列中的附加峰值起源于回响并从而在主峰值附近群组化。即,它们将相对于扬声器和检测装置的麦克风之间的直接路径但是仅在有限的时间段内被时间延迟。在水印检测装置通过与源相距距离ds(以样本s为单位测量的)的声学路径接收声音的情况下,传播距离是dm=dscT米,其中,cT是声音在一个采样间隔中传播的距离,T=1/f是采样率,并且c是声音的速度。
例如,如果针对直接路径并且针对间接路径则在直接路径的主峰值和由于反射造成的相邻峰值之间的以样本为单位的距离是个样本,其中,c≈343m/s且f≈48000样本/s。在典型的设置中,相关长度是N=16k个样本(其中1k=1024)。因此,将在主峰值或多个主峰值附近的大小例如为L≈1k个样本(即,L<<N)的窗口中搜索峰值,并且将计算相应的误检概率。由于主相关结果峰值位于N个相关结果值的当前集合中的某个位置,因此针对大小N的缓存器中的大小L的窗口的所有可能的N-L+1个移位来计算误检概率。
本发明将解决的问题在于比已知的统计水印检测器更好地考虑多路径接收的物理特性,并从而提高误检概率计算和水印检测性能。该问题由权利要求1所述的方法解决。使用该方法的设备如权利要求2中所公开的。
如上所述,在通过引起回声、回响和/或噪声的声学路径发送了水印嵌入的音频信号之后,水印检测相关结果峰值总体集中在有限时间范围(其最大大小被表示为L,比总相关长度N小得多)内的主相关结果峰值附近。用于水印检测的相关任务可以由下面的公式表示:
假设针对未标记的音频信号内容的相关结果值的平均或预期概率分布中的np个峰值如何计算概率PFP(np,L,v),即,在长度L的滑动窗口内,存在大于或等于这些峰值v的来自当前长度N的相关结果值集合的np个或更多个峰值?
测量已经示出针对未标记的内容的相关结果值的平均或预期的概率分布对应于或类似于高斯分布。
备注:当通过在当前输入音频信号部分上逐个样本地移位参考模式来执行相关时,该相关的N值结果可具有正峰值和负峰值,它们被一起表示为“峰量值”。
为了简化以下描述,介绍一些标记:
-表示在从N内的位置j开始的长度L的第j个滑动窗口内的L个相关结果值。
-cj≥v指示在针对未标记的内容的相关结果值的平均或预期的概率分布中,在矢量cj中存在大于或等于np个峰值v的np个或更多个当前相关结果值。
-意味着在针对未标记的内容的相关结果值的平均或预期的概率分布中,在矢量cj中存在大于或等于np个峰值v的少于np个当前相关结果值。
备注:是cj≥v的补集,即,其中,Pr表示概率。
设长度L的滑动窗口移位通过N个相关结果值。如上所述,要求的FP(误检)概率是这样的概率:在针对非水印嵌入音频信号内容的相关结果值的平均或预期概率分布中,滑动窗口一次或多次包括大于或等于np个峰值的np个或更多个相关结果量值。针对该FP概率的互补情况是:在针对非水印嵌入的音频信号内容的相关结果值的平均或预期概率分布中,没有滑动窗口包括大于或等于np个峰值的np个或更多个相关结果量值,即,结果,是针对误检概率 Pr { ∃ j ∈ ( 1 , ... , N - L + 1 ) , c j ≥ v } (通过j对一个或多个窗口编索引)的互补概率。
最终的FP概率计算可以被表示为(见下文的详细描述):
针对L=N(在此情况下c1≡c=(c1,c2,...,cN)),根据上文在定义中的备注,该一般公式简化为WO2011/141292统计检测器中的递归计算的情况:
在WO2011/141292中针对统计检测器描述了的计算:基于针对当前信号部分的相关结果值中的峰值,通过使用水印符号的类型的检测的误检概率的相关的值来检测候选符号中的哪个候选符号存在于当前信号部分中,其中,以递归方式计算误检概率,并且通过首先使用针对较少数目的相关结果峰值的误检概率,并通过根据要求的检测可靠度逐渐增加考虑的相关结果峰值的数目,来评估给定数目的相关结果峰值的总误检概率。
因此,在以下描述中,将误检概率的计算映射为计算的问题:对于给定数目(np个)的峰值,可以根据针对从峰值i=1、2开始的np-1个峰值的概率来递归地计算该概率(参考实施例部分的描述)。
在本发明通过显著减少误检检测决定来提高了WO2011/141292统计水印检测处理的检测性能的同时,本发明还保留了WO2011/141292水印检测的全部优点。
有益地,本发明可用于用户观看TV并经由水印嵌入的TV声音得到水印信息的第二屏幕场景,例如,用于使用水印信息来基本同步地下载和呈现与当前TV节目相关的附加信息的平板计算机。
原理上,本发明方法适合于确定可包括回声、回响和/或噪声的接收到的音频信号中的水印符号,所述方法包括如下步骤:
-将接收到的音频信号的当前部分与关于相应的不同候选水印符号is的至少两个不同候选参考模式信号进行相关,以在每个情况下产生针对每个候选水印符号is的N个当前相关结果值cis
-针对每个候选水印符号is,确定所述相关结果值cis内的M个峰值:
-针对所述接收到的音频信号的所述当前部分来确定根据针对每个候选水印符号is的所述M个相关结果峰值得出的所述候选水印符号is中的水印符号,或者确定没有检测到水印符号,其中,所述水印符号确定包括以下步骤:
-针对由所述M个峰值表示的全局峰值中的每一个以及针对每个候选水印符号is,根据当前相关结果值cis确定M个长度L的窗口中的每一个内的np个峰值的相应矢量其中,每个长度L的窗口包括所述M个全局峰值之一并且所有长度L的窗口的总和长度小于N,其中,k=1,...,M;
-针对所述M个长度L的窗口中的每一个,根据当前相关结果值cis计算误检概率其中,误检概率对应于这样的概率:在针对非水印嵌入的音频信号的相关结果值的平均或预期概率分布中,这样的长度L的窗口一次或多次包括大于或等于np个峰值的np个或更多个相关结果值;
-针对所述接收到的音频信号的当前部分,选择候选水印符号is作为检测到的具有最小误检概率值的水印符号。
原理上,本发明设备适合于确定可包括回声、回响和/或噪声的接收到的音频信号中的水印符号,所述设备包括:
-适用于将接收到的音频信号的当前部分与关于相应的不同候选水印符号is的至少两个不同候选参考模式信号进行相关,以在每个情况下产生针对每个候选水印符号is的N个当前相关结果值cis的装置;
-适用于针对每个候选水印符号is,确定所述相关结果值cis内的M个峰值,并且针对所述接收到的音频信号的所述当前部分,确定根据针对每个候选水印符号is的所述M个相关结果峰值得出的所述候选水印符号is中的水印符号,或者确定没有检测到水印符号的装置:
其中,针对由所述M个峰值表示的全局峰值中的每一个以及针对每个候选水印符号is,根据当前相关结果值cis确定M个长度L的窗口中的每一个内的np个峰值的相应矢量其中,每个长度L的窗口包括所述M个全局峰值之一并且所有长度L的窗口的总和长度小于N,其中,k=1,...,M,
并且其中,针对所述M个长度L的窗口中的每一个,根据当前相关结果值cis计算误检概率值其中,误检概率对应于这样的概率:在针对非水印嵌入的音频信号的相关结果值的平均或预期概率分布中,这样的长度L的窗口一次或多次包括大于或等于np个峰值的np个或更多个相关结果值;
并且其中,针对所述接收到的音频信号的当前部分,选择候选水印符号is作为检测到的具有最小误检概率值的水印符号。
在各个从属权利要求中公开了本发明的有益附加实施例。
附图说明
参照附图描述了本发明的示例性实施例,附图示出了:
图1三个或更多个相关值大于或等于三个相关结果峰值v3、v2、v1的不相交(disjoint)可能性;
图2具有两个≥v的值的不相交可能性,其中,相应代表矢量为[0,1,1],[0,0,2],[m≥2,0],[m≥1,1,0],[m≥1,0,1]且零补偿代表矢量为[[0,1,1]],[[0,1,1]],[[1,m≥1,0]],[[m≥1,0],[[m≥1,0,1]];
图3针对′m≥′情况的一般值分布;
图4针对本发明处理的框图;
图5针对本发明处理的流程图;
图6示出了三个长度L的窗口的示例相关结果。
具体实施方式
A.误检(FP)概率的定义
在基于互相关的水印检测中使用单个相关结果峰值来确定嵌入的水印信息是公知的。然而,在本发明中,描述了采用多个相关结果峰量值的最佳水印检测。为了评估FP概率,假设:
-任何未标记的信号部分内容和参考模式或水印符号之间的相关值是独立的等同分布的随机变量;
-对于特定的相关结果峰值v,已知如何计算相应的概率分布尾概率其中,c表示服从如高斯等的特定分布的相关值。
对于长度N的当前相关结果中的单个峰值v,FP概率是这样的概率:在针对未标记的内容的相关结果值的平均或预期的概率分布中,在N个相关值中存在不小于该峰值v的一个或多个值。类似地,对于np个峰值误检概率被定义为这样的概率:在针对未标记的内容的相关结果值的平均或预期的概率分布中,存在大于或等于这些峰值的np个或更多个相关结果值,其中,相应的尾概率被定义为 p i = Δ Pr { c ≥ v i } , 1 ≤ i ≤ n p .
假设在排序之后的特定的相关结果矢量样本(表示收集从n1到n2编索引的序列值x的矢量),即,c1≥c2≥…≥cL,则可以确定其是否具有大于或等于的np个或更多个值:
nGT=0;
fori=1:np
ifci>=vi
nGT=nGT+1;
end
end
如果nGT=np,则具有大于或等于的np个或更多个值,其在结果中被表示为针对的情况被划分为不相交事件。最终的FP概率是单独发生的事件的概率的总和。
A.1相关值分布、与多个峰值的比较
为了将相关结果值与多个峰值进行比较,相关结果量值的整个范围被划分为np+1个区间:
[ - ∞ , v n p ) , [ v n p , v n p - 1 ) , [ v n p - 1 , v n p - 2 ) , ... , [ v 1 , + ∞ ) .
然后通过对有多少相关结果量值位于单独区间内进行计数来执行相关值分布,这可以由代表矢量来描述。由于有时某些区间中的值的数目与FP概率评估无关,因此代表矢量可具有不同长度。因此,在本描述中,代表矢量的最右侧元素始终对应于区间[v1,+∞),而其最左侧元素被称为其第一元素。
图1示出了针对不同情况的相关值分布,其中,np=3个或更多个相关结果值大于或等于三个峰值v3≤v2≤v1。情况P1可以由代表矢量[m≥3]描述,其指示在区间[v1,∞)中存在3个或更多个相关结果值并且其他L-m个相关结果值小于峰值v1。另一方面,不论在区间[v3,v2)或[v2,v1)中存在多少个值,这些情况均包括在存在L-m个小于v1的相关结果值的条件中。另一方面,为了与三个峰值进行比较,方便的是检查有多少个相关结果值位于特定区间[v3,v2),[v2,v1),[v1,∞)中。对于代表矢量[m≥3]而言,最坏的情况是在区间[v3,v2)和区间[v2,v1)中均不存在相关结果值,这与代表矢量[0,0,m≥3]相对应。
对于这种情况,由于v1≥v2,v1≥v3,因此仍然存在≥v1的至少一个值,≥v2的一个值和≥v3的一个值。这可以被解释为与区间[v3,v2)和[v2,v1)相关联的两个零被区间[v1,∞)中的m≥3补偿。为了简单起见,被表示为[[...]]的“零补偿代表矢量”在此情况下可被定义为根据原始代表矢量m≥3得出的[[1,1,m≥1]]。如果没有另外声明,则将具有长度np的零补偿代表矢量用于区间
例如,在情况P2中,在区间[v1,∞)中存在两个相关结果值,在区间[v2,v1)中存在零个相关结果值,在区间[v3,v2)中存在m≥1个相关结果值,并且L-2-m个相关结果值小于v3
假设代表矢量a=[an,…,a2,a1],其相应零补偿对应部分通过以下步骤得出:
-通过添加np-n个零而将矢量a扩展到长度np a ′ = [ 0 n p - n , a ] ;
-寻找a′中的大于′1′的元素,如
-对于t=1,2,...,T,执行零补偿:如果在的左手侧存在零,则可以从右向左补偿最多个零。在零补偿期间,顺序地更新零元素和相应的每当补偿′0′时,其在a′中的值被改变为′1′,并且a′中的减小1。
产生的矢量a′是针对a的零补偿代表矢量。应注意,可仅通过用k替换np来类似地获得针对任何区间[vk,+∞)(其中,k≥n)的零补偿代表矢量。
例如,针对在图1中列出的情况的代表矢量和它们的零补偿代表矢量分别是[m≥3],[m≥1,0,2],[m≥1,2],[m≥2,1],[m≥1,1,1]和[[1,1,m≥1]],[[m≥1,1,1]],[[1,m≥1,1]],[[1,m≥1,1],[[m≥1,1,1]]。明显的是,从代表矢量到相应的零补偿代表矢量的映射是唯一的,而在反向映射中可能不是这样。
有利地,在引入这种零补偿代表矢量的情况下,比较包括多个峰值的相关结果值变得更容易。具体地说,如果在零补偿代表矢量中不存在零元素,则可以假设收集N个相关值的相关矢量(被表示为大于或等于np个峰值,其被简明地表示为此外,如果在零补偿代表矢量中存在k个零,则可以说明正好具有np-k个的值。
根据图1中示出的值分布,针对单独事件的概率被计算为:
P 1 = Σ m = 3 L L m p 1 m ( 1 - p 1 ) L - m
P 2 = L 2 p 1 2 Σ m = 1 L - 2 L - 2 m ( p 3 - p 2 ) m ( 1 - p 3 ) L - 2 - m
P 3 = L 2 p 1 2 Σ m = 1 L - 2 L - 2 m ( p 2 - p 1 ) m ( 1 - p 2 ) L - 2 - m
P 4 = L 1 p 1 Σ m = 2 L - 1 L - 1 m ( p 2 - p 1 ) m ( 1 - p 2 ) L - 2 - m
P 5 = L 1 p 1 L - 1 1 ( p 2 - p 1 ) Σ m = 1 L - 2 ( p 3 - p 2 ) m ( 1 - p 3 ) L - 2 - m ,
并且最终FP概率是PFP=P1+P2+P3+P4+P5。因子(pi-Pi-1)是获得具有范围[vi,vi-1]中的值的相关结果峰值的概率,而(1-pi)是得到范围(-∞,vi]中的峰值的概率。
B.针对有限范围内的相关结果峰值的FP概率
如上所述,对于声学路径上的信号传输,相关结果峰量值通常集中在最大大小L的有限时间范围内,其中,L比相关长度N小得多。
因此,对于在N个相关结果值中的长度L的当前窗口内的np个峰量值,概率被计算为:在针对未标记的内容的相关结果值的平均或预期概率分布中,在该当前长度L窗口中存在大于或等于np个峰量值的np或更多个相关结果量值。
B.1本发明的FP概率计算处理
以上给出了 c i = Δ ( c j , c j + 1 , ... , c j + L - 1 ) , cj≥v和的定义。
对于包括一次或多次大于或等于np个预期峰值的np个或更多个值的滑动窗口的补偿情况是不存在包括大于或等于np个预期峰值的np个或更多个值的滑动窗口,即,结果,针对FP概率的补偿概率是
使用链式法则,联合概率可以通过条件概率的方式来计算:
对于相关矢量cj,在条件概率中仅最后一个前导cj-1是相关的,这是因为它包含cj的除了一个之外的所有新元素:
因此,联合概率可被写作
此外,L个相关样本的子集已经代表了所有N个样本的代表集合,这是因为L足够大,导致以下恒等式
其被应用于方程(2):
因为已知如何评估因此FP概率计算简化为对条件概率的评估。
B.2条件概率评估
可以使用条件概率的定义来重新用公式表示条件概率假设两个事件A和B(其中,P(B)>0),假设B的情况下的A的条件概率被定义为 P ( A | B ) = Δ P ( A ∩ B ) P ( B ) - - - ( 4 )
因此,可被写作:
结果,FP概率可被评估为
该一般公式针对L=N简化为WO2011/141292的统计水印检测处理中的递归计算的情况(在此情况下):
为了在L≠N的情况下计算方程(6),执行在下面的章节中解释的拆分。
B.3基于相关值分布的联合概率评估
联合概率可被表达为
再次将具有正好(np-1)个≥v的值的情况划分为两个不相交组:
·在区间中,具有正好(np-1)个的值,而在区间中不具有值。针对这种情况,针对区间的相应零补偿代表矢量将不具有零元素,并同时只具有′1′元素。否则,区间中的零将被补偿,这与具有正好(np-1)个≥v的值的约束矛盾。
·在区间中,具有正好(np-2)个的值,而在区间中具有正好(np-1)个≥v的值,这对应于针对值分布的一些区间中的′m≥b′的情况。从下面的示例中这将清楚。在np=3的情况下,在区间[v2,+∞)中,具有正好np-2=1个的值。这意味着针对区间[v2,+∞)的所有零补偿代表矢量具有一个零元素。更具体地说,[[0,1]]和[[m≥1,0]]是针对np=3的相应零补偿代表矢量。
·对于[[0,1]],为了使在区间[v3,+∞)中,具有正好(np-1)=2个≥v的值,在区间[v3,v2)中必须具有一个或多个值。结果,针对区间[v3,+∞)的零补偿代表矢量变为[[m≥1,0,1]],这意味着在区间[v3,v2)中存在m≥1个值。
·对于[[m≥1,0]],其可被进一步区分为[[1,0]]或[[m≥2,0]]。对于[[1,0]],零补偿代表矢量必须是[[m≥1,1,0]],从而在区间[v3,+∞)中具有正好(np-1)=2个≥v的值。对于[[m≥2,0]],相应代表矢量是[m≥2,0],同时对区间[v3,v2)中的值的数量没有用于满足具有正好(np-1)=2个≥v的值这一条件所必须的要求。
图2列出了具有正好2个≥v的值的情况。P1和P2对应于在区间[v3,v2]中不具有值的情况。情况P3、P4和P5在一个区间中具有′m≥b′。对于图2的五种情况,所有零补偿代表矢量均只具有单个零元素。因此可以直接选择针对cL+1和c1的值范围,使得将将cL+1添加到得到c2≥v,以及将c1添加到得到
例如,P2对应于零补偿代表矢量[[0,1,1]]。如果c1<v3,则将c1添加到将导致另一方面,如果cL+1≥v3,则将cL+1添加到将导致
因此,单独的概率被计算为:
P 1 = ( L - 1 1 p 1 L - 2 1 ( p 2 - p 1 ) ( 1 - p 3 ) L - 3 ) p 3 ( 1 - p 3 )
P 2 = ( L - 1 1 p 1 2 ( 1 - p 3 ) L - 3 ) p 3 ( 1 - p 3 )
P 3 ( Σ m = 2 L - 1 L - 1 m ( p 2 - p 1 ) m ( 1 - p 2 ) L - 2 - m ) p 1 ( 1 - p 1 )
P 4 ( L - 1 1 ( p 2 - p 1 ) Σ m = 1 L - 2 L - 2 m ( p 3 - p 2 ) m ( 1 - p 3 ) L - 2 - m ) p 1 ( 1 - p 1 )
P 5 ( L - 1 1 p 1 Σ m = 1 L - 2 L - 2 m ( p 3 - p 2 ) m ( 1 - p 3 ) L - 2 - m ) p 2 ( 1 - p 2 )
一般而言,可通过采用二项式定理来重新用公式表示对概率P3、P4、P5的求和项的计算:
Σ m = n 1 n 2 n 2 m ( p i + 1 - p i ) m ( 1 - p i + 1 ) n 2 - m Σ m = 0 n 2 n 2 m ( p i + 1 - p i ) m ( 1 - p i + 1 ) n 2 - m - Σ m = 0 n 1 - 1 n 2 m ( p i + 1 - p i ) m ( 1 - p i + 1 ) n 2 - m = ( p i + 1 - p i + 1 - p i + 1 ) n 2 - Σ m = 0 n 1 - 1 n 2 m ( p i + 1 - p i ) m ( 1 - p i + 1 ) n 2 - m = ( 1 - p i ) n 2 - Σ m = 0 n 1 - 1 n 2 m ( p i + 1 - p i ) m ( 1 - p i + 1 ) n 2 - m ,
如果n1<<n2-n1,则其显著地减少了计算复杂度。
此外,对于诸如图2中所示的P3、P4、P5等的′m≥b′的情况,构建用于求和的查找表以便减少计算复杂度。
图3示出了针对′m≥b′情况的总体值分布。区间[vq,∞)中的值的数量被表示为s,并且在区间[vq+1,vq)中存在m个值。因此,1≤q≤np-1,0≤s≤np-2并且b=np-1-s。假设峰值的数目是np,则取决于q和s的查找表可被如下构建:
P b [ q ] [ s ] = Δ Σ m = b = n p - 1 - s L - 1 - s L - 1 - s m ( p q + 1 - p q ) m ( 1 - p q + 1 ) L - 1 - s - m = ( 1 - p q ) L - 1 - s - Σ m = 0 n p - 2 - s L - 1 - s m ( p q + 1 - p q ) m ( 1 - p q + 1 ) L - 1 - s - m
在具有针对具有正好(np-1)个≥v的值的所有不相交情况的代表矢量的情况下,可以直接评估FP概率。
B.4递归代表矢量构建
代表矢量和零补偿矢量用于计算误检概率如果这些矢量已知,则可以用公式表示概率P1至P5,见图2的描述中的示例。因此,的计算被映射到构建针对给定数目(np)的峰值所有矢量的问题。
在下文中,解释了如何递归地获得这些代表矢量。如之前所讨论的,图2中的所有情况可由相应的代表矢量:[0,1,1],[0,0,2],[m≥2,0],[m≥1,1,0],[m≥1,0,1]表示。前两个矢量可被递归地确定,见上文。关于递归地构建后三个矢量,针对后三个矢量的两个属性是:
-′m≥b′元素始终是第一元素;
-所有元素的和变为m≥2。
换言之,假设代表矢量中的剩余元素不包括′m≥b′元素,则可以推导出′m≥b′元素:参照图3,其中,假设s、b=np-1-s。因此,针对图2中的P3、P4、P5情况的代表矢量简化为[0],[1,0],[0,1]。此外,问题变为如何寻找这些针对np个峰值的简化的代表矢量。
由图3启发,这些代表矢量根据s∈{0,1,…,np-2}个值被划分为不同集合。假设针对s的代表矢量,则可以通过扩展和添加单位矢量来构建针对s+1的相应代表矢量。
B.4.1初始化:
对于s=0,代表矢量的集合是{[0]},对于s=1,代表矢量的集合是{[0,1],[1,0]}。
B.4.1针对1≤s≤np-3的更新:
根据在针对s的集合中的单独代表矢量的长度lj,针对s+1的当前递归的代表矢量被区别地构建:
·如果长度lj<s+1,则寻找代表矢量中的第一个非零元素。假设i是第一个非零元素的位置。将单位矢量e1,…,ei添加到代表矢量以得到新的代表矢量。示例单位矢量是ei=(0,…,0,1,0,...,0),其中,第一个零具有位置′1′,第二个零具有位置′i-1′,′1′具有位置′i′,第三个零具有位置′i+1′,并且最后一个零具有位置′lj′。
·如果长度lj=s+1,则通过在开始添加一个零来扩展代表矢量。寻找扩展的代表矢量中的第一个非零元素并添加单位矢量。
然而,如果针对代表矢量的零补偿代表矢量中的′0′元素在代表矢量中的第一个非零元素的右手侧,则在不扩展的情况下针对该代表矢量执行寻找和添加过程。
B.4.3示例1
针对s=1的更新:两个代表矢量[1,0]和[0,1]均具有长度lj=s+1=2。对于矢量[0,1],在第一个非零元素之后不存在零元素。因此新的代表矢量被获得为[0,0,2]、[0,1,1]、[1,0,1]。另一方面,对于矢量[1,0],在其第一个非零元素之后存在一个零元素,因此在零补偿之后剩下了一个零。因此,新的代表矢量是扩展和添加的单位矢量:[0,2,0]、[1,1,0]以及没有扩展的添加的单位矢量:[2,0]。
B.4.4示例2
针对s=2的更新,其中代表矢量集合为{[0,0,2],[0,1,1],[1,0,1],[0,2,0],[1,1,0],[2,0]}。根据以上描述,针对s=3的代表矢量被获得为:
[0,0,2]→[0,0,0,3],[0,0,1,2],[0,1,0,2],[1,0,0,2]
[0,1,1]→[0,0,2,1],[0,1,1,1],[1,0,1,1]
[1,0,1]→[0,2,0,1],[1,1,0,1],[2,0,1]
[0,2,0]→[0,0,3,0],[0,1,2,0],[1,0,2,0],[0,3,0],[1,2,0]
[1,1,0]→[0,2,1,0],[1,1,1,0],[2,1,0]
[2,0]→[3,0]
针对具有[0,1,1,1]作为其零补偿代表矢量的[0,1,0,2],在零补偿之后在其第一个非零元素的右手侧不存在零,而针对具有[1,0,1,1]作为其零补偿代表矢量的[1,0,0,2],即使在零补偿之后在其第一个非零元素的右手侧也剩余一个零。因此,针对[0,1,0,2]和[1,0,0,2]将执行不同的更新过程以得到针对s=4的代表矢量。
在图4的本发明的水印解码器的框图中,接收到的音频信号在获取或接收部分步骤或阶段41被采样,之后通过预处理步骤或阶段42(其可执行例如谱白化)到达相关步骤或阶段43,在相关步骤或阶段43中,接收到的音频信号的当前部分与来自参考模式信号产生步骤或阶段46且与相应的不同水印符号有关的至少两个不同候选参考模式信号is相关,以在每个情况中产生针对每个候选水印符号is的N个当前相关结果值cis。不同候选参考模式信号is的总数目为nSymbols,例如,nSymbols=2。在随机相位产生步骤或阶段45使用密钥来产生相应的伪随机相位信号,伪随机相位信号控制在步骤/阶段46中的参考模式信号产生。在步骤/阶段43中的相关之后的水印符号检测步骤或阶段44中,在当前N个相关结果值cis的M个主相关结果峰值附近检查长度L的窗口,并执行以上结合图5描述的处理,以便确定和输出相应的检测到的水印符号。
在图5的流程图中,针对利用步骤50接收到的输入相关块cis,参数is被设置为′1′。例如,is=1对应于候选水印符号′0′,is=2对应于候选水印符号′1′。对于每个候选水印符号is,相应的相关结果值的集合cis在步骤51中根据它们的大小被排序,从而确定M个最大量值(即,全局峰量值),例如,M=3且k=1,2,3。在步骤52中,针对每个全局峰量值k=1,...,M且针对当前候选水印符号is,确定每个全局峰值附近(即包括每个全局峰值)的原始相关结果值的±L/2范围内(即在长度L的窗口内)的np个峰量值的相应矢量由比较步骤53控制,参数is在相应的循环中从′1′递增到′nsymbols′。
由于L显著小于N,因此全部的长度L的窗口的总和长度小于长度N。实际上,L<<N,使得L在大小上至少比N小一个量级(即,N/L>10)。例如,N=16k且L=1k。
然后,进入从is=1递增到nSymbols的外循环和从k=1递增到M的内循环,它们分别由比较步骤57和56控制。在内循环中,在步骤54中根据当前相关结果值计算误检概率之后进行比较步骤55,k递增,进行比较步骤56,并且在外循环中,is递增并且进行比较步骤57。误检概率值对应于这样的概率:在针对非水印嵌入的音频信号的相关结果量值的平均或预期概率分布中,这样的长度L的窗口一次或多次包括大于或等于np个峰值的np个或更多个相关结果量值。在比较步骤57之后,在步骤58中确定候选水印符号is,其中,针对该候选水印符号is,最终误检概率fp是步骤59通过将fp值与另一阈值Tmax比较以检查是否检测到水印符号。如果是,则输出检测到的水印符号。如果不是,则没有检测到水印符号。
在比较步骤55,如果小于预定阈值Tmin,则认为已经找到正确的候选水印符号is,离开两个循环以便节省计算时间,并且输出该水印符号。
图6示出了长度N的示例相关结果以及用k=1,2,3示出的三个长度L的窗口。每个长度L的窗口被布置在N个相关结果值中的峰值附近。在N内的第一个可能的长度L的窗口位置是j=1,并且最后一个可能的长度L的窗口位置是j=N-L+1。
本发明处理可以由单个处理器或电子电路执行,或者由并行操作和/或在本发明处理的不同部分上操作的若干处理器或电子电路执行。

Claims (8)

1.一种用于确定能够包括回声、回响和/或噪声的接收到的音频信号中的水印符号的方法,所述方法包括如下步骤:
-将接收到的音频信号的一部分与关于相应的不同候选水印符号is的至少两个不同的候选参考模式信号(46)进行相关(43),以在每个情况下产生针对每个候选水印符号is的N个相关结果值cis
-针对每个候选水印符号is,确定(51)所述相关结果值cis内的M个峰值,其中,所述水印符号确定(44、58、59)的特征在于:
-针对由所述M个峰值表示的全局峰值中的每一个以及针对每个候选水印符号is,根据相关结果值cis确定(52)M个长度L的窗口中的每一个内的np个峰值的相应矢量其中,每个长度L的窗口包括所述M个全局峰值之一并且所有长度L的窗口的总和长度小于N,其中,k=1,...,M;
-针对所述M个长度L的窗口中的每一个,基于峰值的矢量以及针对非水印嵌入的音频信号的相关结果值的平均或预期概率分布,计算(54)误检概率值其中,误检概率被定义为这样的概率:在针对非水印嵌入的音频信号内容的相关值的平均或预期概率分布中,这样的长度L的窗口一次或多次包括大于或等于np个峰值的np个或更多个相关结果绝对值;
-如果最小误检概率值小于预定阈值(Tmax),则针对所述接收到的音频信号的所述部分选择(58)候选水印符号is作为检测到的具有所述最小误检概率值的水印符号,
否则,认为没有检测到水印符号。
2.根据权利要求1所述的方法,其中,如果在所述误检概率值的所述计算(54)中,所述值小于另一预定阈值(Tmin),则认为(55)已经找到正确的候选水印符号is,并省略进一步的处理,并且所述预定阈值(Tmax)大于所述另一预定阈值(Tmin)。
3.根据权利要求1或2所述的方法,其中,M=3。
4.根据权利要求1至3之一所述的方法,其中,存在两个不同的候选水印符号。
5.一种用于确定能够包括回声、回响和/或噪声的接收到的音频信号中的水印符号的设备,所述设备包括:
-适用于将接收到的音频信号的一部分与关于相应的不同候选水印符号is的至少两个不同候选参考模式信号(46)进行相关,以在每个情况下产生针对每个候选水印符号is的N个相关结果值cis的装置(43);
-适用于针对每个候选水印符号is,确定所述相关结果值cis内的M个峰值并且针对所述接收到的音频信号的所述部分,确定根据针对每个候选水印符号is的所述M个相关结果峰值得出的所述候选水印符号is中的水印符号的装置(44、51、52、54、58、59):
其中,针对由所述M个峰值表示的全局峰值中的每一个以及针对每个候选水印符号is,根据相关结果值cis确定(52)M个长度L的窗口中的每一个内的np个峰值的相应矢量其中,每个长度L的窗口包括所述M个全局峰值之一并且所有长度L的窗口的总和长度小于N,其中,k=1,...,M,
并且,针对所述M个长度L的窗口中的每一个,基于峰值的矢量以及针对非水印嵌入的音频信号的相关结果值的平均或预期概率分布来计算(54)误检概率值其中,误检概率被定义为这样的概率:在针对非水印嵌入的音频信号内容的相关值的平均或预期概率分布中,这样的长度L的窗口一次或多次包括大于或等于np个峰值的np个或更多个相关结果绝对值;
并且,如果最小误检概率值小于预定阈值(Tmax),则针对所述接收到的音频信号的所述部分,选择(58)候选水印符号is作为检测到的具有所述最小误检概率值的水印符号,
否则,认为没有检测到水印符号。
6.根据权利要求5所述的设备,其中,如果在所述误检概率值的所述计算(54)中,所述值小于另一预定阈值(Tmin),则认为(55)已经找到正确的候选水印符号is,并省略进一步的处理,并且所述预定阈值(Tmax)大于所述另一预定阈值(Tmin)。
7.根据权利要求5或6所述的设备,其中,M=3。
8.根据权利要求5至7之一所述的设备,其中,存在两个不同的候选水印符号。
CN201480019607.2A 2013-04-02 2014-03-28 用于确定可包含回声、回响和/或噪声的接收到的音频信号中的水印符号的方法和设备 Pending CN105103223A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP13305425.4A EP2787504A1 (en) 2013-04-02 2013-04-02 Method and Apparatus for determining watermark symbols in a received audio signal that can contain echoes, reverberation and/or noise
EP13305425.4 2013-04-02
PCT/EP2014/056304 WO2014161785A1 (en) 2013-04-02 2014-03-28 Method and apparatus for determining watermark symbols in a received audio signal that can contain echoes, reverberation and/or noise

Publications (1)

Publication Number Publication Date
CN105103223A true CN105103223A (zh) 2015-11-25

Family

ID=48141876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480019607.2A Pending CN105103223A (zh) 2013-04-02 2014-03-28 用于确定可包含回声、回响和/或噪声的接收到的音频信号中的水印符号的方法和设备

Country Status (8)

Country Link
US (1) US9607623B2 (zh)
EP (2) EP2787504A1 (zh)
JP (1) JP2016515721A (zh)
KR (1) KR20150136491A (zh)
CN (1) CN105103223A (zh)
CA (1) CA2902840A1 (zh)
TW (1) TW201501118A (zh)
WO (1) WO2014161785A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102403194B1 (ko) * 2015-06-26 2022-05-27 삼성디스플레이 주식회사 표시 장치
CN106601261A (zh) * 2015-10-15 2017-04-26 中国电信股份有限公司 基于数字水印的回声抑制方法和系统
US10236031B1 (en) * 2016-04-05 2019-03-19 Digimarc Corporation Timeline reconstruction using dynamic path estimation from detections in audio-video signals
JP7013093B2 (ja) * 2018-05-01 2022-01-31 アルパイン株式会社 故障検出装置、移動体搭載装置、故障検出方法
US11170793B2 (en) * 2020-02-13 2021-11-09 Adobe Inc. Secure audio watermarking based on neural networks

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1246239A (zh) * 1997-09-02 2000-03-01 皇家菲利浦电子有限公司 检测水印的方法和设备
CN101494053A (zh) * 2008-01-21 2009-07-29 汤姆森许可贸易公司 确定添加了水印的信号中是否存在参考图案的方法和设备
CN101689290A (zh) * 2007-06-14 2010-03-31 汤姆森许可贸易公司 用于在给定期望错误概率的情况下设置检测阈值的方法和设备
CN101751927A (zh) * 2008-10-10 2010-06-23 汤姆森许可贸易公司 重获原始信号中的水印数据的方法和设备
EP2387033A1 (en) * 2010-05-11 2011-11-16 Thomson Licensing Method and apparatus for detecting which one of symbols of watermark data is embedded in a received signal

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0403331D0 (en) * 2004-02-14 2004-03-17 Koninkl Philips Electronics Nv Watermark detection
EP1837875A1 (en) * 2006-03-22 2007-09-26 Deutsche Thomson-Brandt Gmbh Method and apparatus for correlating two data sections

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1246239A (zh) * 1997-09-02 2000-03-01 皇家菲利浦电子有限公司 检测水印的方法和设备
CN101689290A (zh) * 2007-06-14 2010-03-31 汤姆森许可贸易公司 用于在给定期望错误概率的情况下设置检测阈值的方法和设备
CN101494053A (zh) * 2008-01-21 2009-07-29 汤姆森许可贸易公司 确定添加了水印的信号中是否存在参考图案的方法和设备
CN101751927A (zh) * 2008-10-10 2010-06-23 汤姆森许可贸易公司 重获原始信号中的水印数据的方法和设备
EP2387033A1 (en) * 2010-05-11 2011-11-16 Thomson Licensing Method and apparatus for detecting which one of symbols of watermark data is embedded in a received signal

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MICHAEL ARNOLD ET AL: "Robust Detection Of Audio Watermarks After Acoustic Path Transmission", 《PROCEEDINGS OF THE 12TH ACM WORKSHOP ON MULTIMEDIA AND SECURITY》 *

Also Published As

Publication number Publication date
WO2014161785A1 (en) 2014-10-09
US20160049154A1 (en) 2016-02-18
EP2981957A1 (en) 2016-02-10
US9607623B2 (en) 2017-03-28
TW201501118A (zh) 2015-01-01
EP2787504A1 (en) 2014-10-08
JP2016515721A (ja) 2016-05-30
KR20150136491A (ko) 2015-12-07
CA2902840A1 (en) 2014-10-09

Similar Documents

Publication Publication Date Title
CN105103223A (zh) 用于确定可包含回声、回响和/或噪声的接收到的音频信号中的水印符号的方法和设备
US9147402B2 (en) Method and apparatus for detecting which one of symbols of watermark data is embedded in a received signal
KR100893671B1 (ko) 멀티미디어 콘텐트의 해시들의 생성 및 매칭
CN103051921B (zh) 一种精确检测视音频处理系统视频、音频同步误差的方法
KR20080102218A (ko) 두 개의 데이터 섹션을 상관시키는 방법 및 장치
WO2009023044A3 (en) Method and system for fast dense stereoscopic ranging
CN108108457A (zh) 从音乐节拍点中提取大节拍信息的方法、存储介质和终端
CN103262158A (zh) 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
CN103915101A (zh) 信号处理装置及其操作方法
Suguna et al. An SoC architecture for energy detection based spectrum sensing using Low Latency Column Bit Compressed (LLCBC) MAC in cognitive radio wireless sensor networks
WO2023049601A1 (en) Domain adaptation for wireless sensing
Grais et al. Referenceless performance evaluation of audio source separation using deep neural networks
KR102132896B1 (ko) Jtdls 항재밍 단말의 간섭신호 제거 장치 및 그 방법
Hennessy et al. Design and implementation of a digital secure code-shifted reference UWB transmitter and receiver
JP2010246122A (ja) フレーム同期のためのシステム及び方法
KR101508522B1 (ko) 동기 오차 산출 장치 및 방법
CN111161757B (zh) 声源定位方法、装置、可读存储介质及电子设备
CN109861808B (zh) 前径搜索方法及装置
KR102138444B1 (ko) Dab 수신기 및 그 프레임 동기 방법
CN100426847C (zh) 以语音特征为基础的精采片段检测电路及其相关方法
US11620985B2 (en) Pattern recognition robust to influence of a transfer path
JPH08251078A (ja) フレーム同期回路
EP3001415A1 (en) Method and apparatus for determining whether a specific watermark symbol out of one or more candidate watermark symbols is embedded in a current section of a received audio signal
TWI474634B (zh) 碼相位擷取裝置及方法
CN113377331A (zh) 一种音频数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151125