JP2016515721A - エコー、残響および/またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別する方法および装置 - Google Patents
エコー、残響および/またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別する方法および装置 Download PDFInfo
- Publication number
- JP2016515721A JP2016515721A JP2016505773A JP2016505773A JP2016515721A JP 2016515721 A JP2016515721 A JP 2016515721A JP 2016505773 A JP2016505773 A JP 2016505773A JP 2016505773 A JP2016505773 A JP 2016505773A JP 2016515721 A JP2016515721 A JP 2016515721A
- Authority
- JP
- Japan
- Prior art keywords
- value
- values
- correlation result
- probability
- length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims description 17
- 238000009826 distribution Methods 0.000 claims abstract description 28
- 239000013598 vector Substances 0.000 claims description 89
- 238000012545 processing Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 abstract description 19
- 230000002123 temporal effect Effects 0.000 abstract description 3
- 230000005540 biological transmission Effects 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 23
- 230000000295 complement effect Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 239000007943 implant Substances 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00086—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
- G11B20/00884—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00086—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
- G11B20/00884—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
- G11B20/00891—Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
- G06F21/106—Enforcing content protection by specific content processing
- G06F21/1063—Personalisation
Abstract
エコー、残響および/またはノイズを引き起こす音響経路を通じた透かし入れされたオーディオ信号の伝送後は、透かし検出相関結果ピーク値は、主たる相関結果ピークのまわりの限られた時間的範囲内に集中し、該限られた時間的範囲は全相関長Nよりずっと小さい。透かし検出は下記に基づく。マークされていないコンテンツについての相関結果値についての平均的なまたは期待される確率分布においてnp個の相関結果ピーク値v=(v1,v2,…,vnp)が与えられたとき、前記限られた時間的範囲をカバーする窓内で、これらのピークvより大きいかそれに等しい、Nの相関結果値集合からのnp個以上の値がある確率が計算される。
Description
本発明は、エコー、残響および/またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別する方法および装置に関する。
オーディオ透かし入れは、耳に聞こえない仕方で追加的情報をオーディオ信号中に埋め込むプロセスである。埋め込みは、たとえば擬似ランダムなノイズまたはエコーを加えることによってオーディオ信号を変化させることによって実行される。埋め込みを耳に聞こえないようにするために、埋め込みの強度は、オーディオ信号の音響心理学的解析によって制御される。特許文献1は、オーディオ信号、たとえばマイクロフォンによって受領されたラウドスピーカー音におけるエコー、残響および/またはノイズの存在時の透かし検出を記載している。これらのエコーは、透かしシンボル(すなわち参照信号)との長さNの相関結果値シーケンス内の複数のピークを与え、透かし検出の信頼性を改善するために使われる。この統計的検出器の基本的段階は次のようなものである。
・各候補透かしシンボルについて前記相関結果シーケンスにおけるピーク値v=(v1,v2,…,vnp)を見出す。ここで、v1≧…≧vnpであり、npは考慮に入れられる相関結果ピーク値の数である。
・前記候補透かしシンボルが埋め込まれている偽陽性確率P(k)、k=1,…,npを再帰的に計算する。
・最低のP(k)値を与える候補透かしシンボルを選択する。
・各候補透かしシンボルについて前記相関結果シーケンスにおけるピーク値v=(v1,v2,…,vnp)を見出す。ここで、v1≧…≧vnpであり、npは考慮に入れられる相関結果ピーク値の数である。
・前記候補透かしシンボルが埋め込まれている偽陽性確率P(k)、k=1,…,npを再帰的に計算する。
・最低のP(k)値を与える候補透かしシンボルを選択する。
P(k)は、候補透かしシンボルを誤って受け入れる確率である。これは、透かしが入っていない信号セクションからのk個以上の相関結果値が考慮対象の実際のk個のピーク値以上である確率を記述する。
この統計的検出器は次の問題を解決する。
a)いかにして確率P(k)を再帰的に評価するか。ここで、考慮されるピーク値の数kが徐々に増大させられることができる。
b)すでに実行された計算を再利用することによりいかにして計算量を最小化するか。
a)いかにして確率P(k)を再帰的に評価するか。ここで、考慮されるピーク値の数kが徐々に増大させられることができる。
b)すでに実行された計算を再利用することによりいかにして計算量を最小化するか。
この統計的検出器は、検出パフォーマンスを改善するためにいくつかの相関結果ピークを使う。特に、この改善は、透かし入れされたトラックが、エコーに起因するマルチパス検出につながる音響経路を通じて伝送される場合に有利である。P(k)を計算するために使われるnp個のピークv1≧…≧vnpは、長さNの相関結果値シーケンス全体から取られる。
しかしながら、この種の処理は、物理的な現実を最適な仕方で反映するものではない。相関結果値シーケンスにおける追加的なピーク値が残響から生じ、よって主ピークのまわりに近接してグループ化されるからである。すなわち、これらの追加的なピーク値は、ラウドスピーカーと検出装置のマイクロフォンとの間の直接経路に対して時間遅延される。ただし、限られた時間期間内のみである。透かし入れ検出装置が源からの距離ds(サンプルs単位で測る)をもつ音響経路を通じて音を受領するとき、伝搬距離はdm=dscTメートルである。ここで、cTは一サンプリング区間内に音が伝搬する距離であり、T=1/fはサンプリング・レートであり、cは音速である。
たとえば、直接(direct)経路についてdm d=4mであり、間接(indirect)経路についてdm i=2dm d=8mである場合、直接経路の主ピークと反射に起因する近隣ピークとの間のサンプル単位での距離は次のようになる。
本発明によって解決されるべき課題は、既知の統計的透かし検出器よりよく、マルチパス受信の物理を考慮に入れ、それにより偽陽性確率計算および透かし検出のパフォーマンスを改善することである。
この課題は、請求項1に開示される方法によって解決される。この方法を利用する装置は請求項2において開示される。
上述したように、エコー、残響および/またはノイズを引き起こす音響経路を通じた透かし入れされたオーディオ信号の伝送後は、透かし検出相関結果ピーク値は一般に、限られた時間的範囲内で主たる相関結果ピークのまわりに集中し、Lと表わす該時間的範囲の最大サイズは全相関長Nよりずっと小さい。透かし検出のための関係したタスクは、次のように定式化できる。
マークされていないオーディオ信号コンテンツについて相関結果値についての平均的なまたは期待される確率分布において、np個のピーク値v=(v1,v2,…,vnp)が与えられたとき、これらのピークvより大きいかそれに等しい、現在の長さNの相関結果値集合からの長さLのスライディング窓内のnp個以上のピーク値がある確率PFP(np,L,v)をいかにして計算するか。
測定により、マークされていないコンテンツについての相関結果値についてのそのような平均または期待される確率分布がガウス分布に対応するまたはガウス分布と同様であることが示されている。
コメント:一サンプルずつ参照パターンを現在の入力オーディオ信号セクションを通じてシフトさせていくことにより相関を実行するとき、この相関のN値結果は正のピーク値のほか負のピーク値をもつことがあり、これらは一緒にして「ピーク量値」と表わされる。
以下の記述を簡単にするために、いくつかの記法を導入しておく。
コメント:Prが確率を表わすとして、
長さLのスライディング窓をN個の相関結果値を通じてシフトさせる。上述したように、求められるFP(false positive[偽陽性])確率は、一回または複数回、スライディング窓が、透かし入れされていないオーディオ信号コンテンツについての相関結果値についての平均または期待される確率分布において前記np個のピーク値より大きいまたはそれに等しいnp個以上の相関結果量値を含む確率である。このFP確率についての相補的な場合は、透かし入れされていないオーディオ信号コンテンツについての相関結果値についての平均または期待される確率分布においてnp個のピーク値より大きいまたはそれに等しいnp個以上の相関結果量値を含むスライディング窓がない、つまり
最終的なFP確率計算は次のように表現できる(詳細は後述)。
したがって、以下の記述における偽陽性確率の計算は
本発明は、偽陽性検出判断を有意に低減することによって特許文献1の統計的透かし検出処理の検出パフォーマンスを改善するが、本発明は特許文献1の透かし検出のすべての利点を保持する。
有利なことに、本発明は、ユーザーがテレビを視聴し、透かし入れされたテレビ音を介して透かし情報を得るというセカンドスクリーンのシナリオにおいて使用されることができる。ここで、前記透かし情報はたとえば、該透かし情報を使って現在のテレビ番組に関係した追加的情報をダウンロードして基本的に同期して呈示するタブレット・コンピュータのためである。
原理的には、本発明の方法は、エコー、残響および/またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別するために好適であり、本方法は、
・受領されたオーディオ信号の現在セクションの、対応する異なる候補透かしシンボルisに関係した少なくとも二つの異なる候補参照パターン信号との相関を調べ、各候補透かしシンボルisについてそれぞれの場合にN個の現在の相関結果値cisを生成するステップと、
・各候補透かしシンボルisについて、前記相関結果値cis内のM個のピーク値を決定するステップと、
・各候補透かしシンボルisについての前記M個の相関結果ピーク値から導出されて、前記受領オーディオ信号の前記現在セクションについて、前記候補透かしシンボルisのうちの透かしシンボルを決定するまたは透かしシンボルが検出されなかったと判定するステップとを含み、前記透かしシンボルの決定はさらに、
・グローバル・ピーク値と記される前記M個のピーク値のそれぞれについておよび各候補透かしシンボルisについて、現在の相関結果値cisから、長さLのM個の窓のそれぞれの中のnp個のピーク値の対応するベクトル
・受領されたオーディオ信号の現在セクションの、対応する異なる候補透かしシンボルisに関係した少なくとも二つの異なる候補参照パターン信号との相関を調べ、各候補透かしシンボルisについてそれぞれの場合にN個の現在の相関結果値cisを生成するステップと、
・各候補透かしシンボルisについて、前記相関結果値cis内のM個のピーク値を決定するステップと、
・各候補透かしシンボルisについての前記M個の相関結果ピーク値から導出されて、前記受領オーディオ信号の前記現在セクションについて、前記候補透かしシンボルisのうちの透かしシンボルを決定するまたは透かしシンボルが検出されなかったと判定するステップとを含み、前記透かしシンボルの決定はさらに、
・グローバル・ピーク値と記される前記M個のピーク値のそれぞれについておよび各候補透かしシンボルisについて、現在の相関結果値cisから、長さLのM個の窓のそれぞれの中のnp個のピーク値の対応するベクトル
・長さLの前記M個の窓のそれぞれについて、現在の相関結果値cisから、一回または複数回、そのような長さLの窓が、透かし入れされていないオーディオ信号についての相関結果値についての平均または期待される確率分布においてnp個のピーク値より大きいまたはそれに等しいnp個以上の相関結果値を含むを含む確率に対応する偽陽性確率
原理的には、本発明の装置は、エコー、残響および/またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別するために好適であり、本装置は、
・受領されたオーディオ信号の現在セクションの、対応する異なる候補透かしシンボルisに関係した少なくとも二つの異なる候補参照パターン信号との相関を調べ、各候補透かしシンボルisについてそれぞれの場合にN個の現在の相関結果値cisを生成するよう適応された手段と、
・各候補透かしシンボルisについて、前記相関結果値cis内のM個のピーク値を決定し、各候補透かしシンボルisについての前記M個の相関結果ピーク値から導出されて、前記受領オーディオ信号の前記現在セクションについて、前記候補透かしシンボルisのうちの透かしシンボルを決定するまたは透かしシンボルが検出されなかったと判定するよう適応された手段とを含み、
グローバル・ピーク値と記される前記M個のピーク値のそれぞれについておよび各候補透かしシンボルisについて、現在の相関結果値cisから、長さLのM個の窓のそれぞれの中のnp個のピーク値の対応するベクトル
・受領されたオーディオ信号の現在セクションの、対応する異なる候補透かしシンボルisに関係した少なくとも二つの異なる候補参照パターン信号との相関を調べ、各候補透かしシンボルisについてそれぞれの場合にN個の現在の相関結果値cisを生成するよう適応された手段と、
・各候補透かしシンボルisについて、前記相関結果値cis内のM個のピーク値を決定し、各候補透かしシンボルisについての前記M個の相関結果ピーク値から導出されて、前記受領オーディオ信号の前記現在セクションについて、前記候補透かしシンボルisのうちの透かしシンボルを決定するまたは透かしシンボルが検出されなかったと判定するよう適応された手段とを含み、
グローバル・ピーク値と記される前記M個のピーク値のそれぞれについておよび各候補透かしシンボルisについて、現在の相関結果値cisから、長さLのM個の窓のそれぞれの中のnp個のピーク値の対応するベクトル
長さLの前記M個の窓のそれぞれについて、現在の相関結果値cisから、一回または複数回、そのような長さLの窓が、透かし入れされていないオーディオ信号についての相関結果値についての平均または期待される確率分布においてnp個のピーク値より大きいまたはそれに等しいnp個以上の相関結果値を含むを含む確率に対応する偽陽性確率
本発明の有利な追加的実施形態はそれぞれの従属請求項において開示される。
本発明の例示的な実施形態が付属の図面を参照して記述される。
三つの相関結果ピーク値v3,v2,v1より大きいまたはそれに等しい三つ以上の相関値の分離した〔重なりのない〕可能性を示す図である。
c2 Lが≧vである二つの値をもつ分離した可能性を、対応する代表ベクトル[0,1,1],[0,0,2],[m≧2,0],[m≧1,1,0],[m≧1,0,1]および零補償された代表ベクトル[[0,1,1]],[[0,1,1]],[[1,m≧1,0]],[m≧1,0],[m≧1,0,1]とともに示す図である。
「m≧」の場合についての一般的な値分布を示す図である。
本発明の処理についてのブロック図である。
本発明の処理についての流れ図である。
三つの長さLの窓が描かれている例示的な相関結果を示す図である。
〈A.偽陽性(FP)確率の定義〉
相互相関に基づく透かし検出において、埋め込まれた透かし情報を判別するために単一の相関結果ピーク値を使うことはよく知られている。しかしながら、本発明では、複数の相関結果ピーク量値を用いる最適な透かし検出が記述される。FP確率を評価するために、次のことが想定される。
・任意のマークされていない信号セクション・コンテンツと参照パターンまたは透かし〔ウォーターマーク〕シンボルとの間の相関値が独立同分布のランダム変数であること、および
・特定の相関結果ピーク値vについて、対応する確率分布尾部確率
相互相関に基づく透かし検出において、埋め込まれた透かし情報を判別するために単一の相関結果ピーク値を使うことはよく知られている。しかしながら、本発明では、複数の相関結果ピーク量値を用いる最適な透かし検出が記述される。FP確率を評価するために、次のことが想定される。
・任意のマークされていない信号セクション・コンテンツと参照パターンまたは透かし〔ウォーターマーク〕シンボルとの間の相関値が独立同分布のランダム変数であること、および
・特定の相関結果ピーク値vについて、対応する確率分布尾部確率
長さNの現在の相関結果における単一のピーク値vについては、FP確率は、マークされていないコンテンツについての相関結果値についての平均または期待される確率分布において、N個の相関値のうちそのピーク値vより小さくない一つまたは複数の値がある確率である。同様に、np個のピーク値v1≧v2≧…≧vnpについては、偽陽性確率は、マークされていないコンテンツについての相関結果値についての平均または期待される確率分布において、これらのピークv1,v2,…,vnpより大きいまたはそれに等しいnp個以上の相関結果値がある確率として定義される。ここで、対応する尾部確率は
ソート後の特定の相関結果ベクトル・サンプル
nGT=0;
for i=1:np
if ci≧vi
nGT=nGT+1;
end
end
。
for i=1:np
if ci≧vi
nGT=nGT+1;
end
end
。
nGT=npであれば、c1 Lはv1 npより大きいまたはそれに等しいnp個以上の値をもつ。そのことは、以下では
〈A1.相関値分布、複数ピークとの比較〉
相関結果値を複数のピーク値と比較するために、相関結果量値の完全な範囲がnp+1個の区間
[−∞,vnp),[vnp,vnp-1),[vnp-1,vnp-2),…,[v1,+∞)
に分割される。
相関結果値を複数のピーク値と比較するために、相関結果量値の完全な範囲がnp+1個の区間
[−∞,vnp),[vnp,vnp-1),[vnp-1,vnp-2),…,[v1,+∞)
に分割される。
次いで、相関値分布は、個々の区間内に何個の相関結果量値が位置しているかを数えることによって実行される。それは代表ベクトルによって記述できる。時によっていくつかの区間内のいくつかの値がFP確率評価にとっては重要でないので、代表ベクトルは異なる値をもつことがある。したがって、本稿では、代表ベクトルの最も右の要素が常に区間[v1,+∞)に対応し、一方、最も左の要素は第一の要素と称される。
図1は、np=3個以上の相関結果値が三つのピーク値v3≦v2≦v1より大きいまたはそれに等しくなる種々の場合についての相関値分布を示している。場合P1は、代表ベクトル[m≧3]によって記述できる。これは、区間[v1,+∞)内に3個以上の相関結果値があり、残りのL−m個の相関結果値はピーク値v1未満であることを示す。一方では、区間[v3,v2)や[v2,v1)に何個の値があるかに関わりなく、これらの場合はみな、v1未満のL−m個の相関結果値があるという条件に含まれる。他方では、三つのピークとの比較のために、個々の区間[v3,v2),[v2,v1),[v1,+∞)内に何個の相関結果値があるかを検査することが便利である。代表ベクトル[m≧3]については、最悪ケースは、区間[v3,v2)にも区間[v2,v1)にも相関結果値がないというものであり、代表ベクトル[0,0,m≧3]に対応する。
そのような場合、v1≧v2、v1≧v3のため、それでも、少なくとも、≧v1である一つの値、≧v2である一つの値および≧v3である一つの値がある。これは、区間[v3,v2)および[v2,v1)に関連付けられた二つの0が区間[v1,+∞)におけるm≧3によって補償されていると解釈されることができる。簡単のため、[[…]]と記される「零補償された代表ベクトル」がこの場合、もとの代表ベクトル[m≧3]から導出されて、[[1,1,m≧1]]として定義できる。特に断わりのない限り、長さnpをもつ零補償された代表ベクトルが区間[vnp,+∞)について使われる。
たとえば、場合P2では、区間[v1,+∞)内に二つの相関結果値、区間[v2,v1)内に0個の相関結果値、区間[v3,v2)内にm≧1個の相関結果値があり、L−2−m個の相関結果値はv3未満である。
代表ベクトルa=[an,…,a2,a1]を与えられたとき、その対応する零補償されたものは次のように導出される。
・np−n個の0を加えることによってベクトルaを長さnpに拡張する
・np−n個の0を加えることによってベクトルaを長さnpに拡張する
・t=1,2,…,Tについて、零補償を実行する。aj(t)の左側に0があれば、右から左に、最大でaj(t)−1個の0が補償できる。零補償の間、0の要素および対応するaj(t)は逐次的に更新される。「0」が補償されるたびに、a'におけるその値が「1」に変更され、a'におけるaj(t)は1減らされる。
結果として得られるベクトルa'は、aについての零補償された代表ベクトルである。k≧nとして任意の区間[vk,+∞)についての零補償された代表ベクトルが、npをkで置き換えることによって同様に得ることができることを注意しておく。
たとえば、図1に挙げた場合についての代表ベクトルおよびそれらの零補償された代表ベクトルはそれぞれ、[m≧3],[m≧1,0,2],[m≧1,2],[m≧2,1],[m≧1,1,1]および[[1,1,m≧1]],[[m≧1,1,1]],[[1,m≧1,1]],[[1,m≧1,1]][[m≧1,1,1]]である。明らかに、代表ベクトルから対応する零補償された代表ベクトルへのマッピングは一意的である。一方、逆マッピングについてはこれは成り立たない可能性がある。
有利なことに、そのような零補償された代表ベクトルの導入により、複数のピークを含む相関結果値を比較することがずっと簡単になる。具体的には、零補償された代表ベクトルに0の値がなければ、
〈B.限られた範囲内での相関結果ピーク値についてのFP確率〉
上述したように、音響経路を通じた信号伝送については、相関結果ピーク量値は一般に、相関長Nよりずっと小さい最大サイズLの限られた時間的範囲内に集中する。よって、N個の相関結果値のうちの長さLの現在の窓内のnp個のピーク量値について、マークされないコンテンツついての相関結果ピーク値についての平均または期待される確率分布において、この現在の長さLの窓内でnp個のピーク量値より大きいまたはそれに等しいnp個以上の相関結果量値がある確率が計算される。
上述したように、音響経路を通じた信号伝送については、相関結果ピーク量値は一般に、相関長Nよりずっと小さい最大サイズLの限られた時間的範囲内に集中する。よって、N個の相関結果値のうちの長さLの現在の窓内のnp個のピーク量値について、マークされないコンテンツついての相関結果ピーク値についての平均または期待される確率分布において、この現在の長さLの窓内でnp個のピーク量値より大きいまたはそれに等しいnp個以上の相関結果量値がある確率が計算される。
〈B.1 発明のFP確率計算処理〉
スライディング窓が一回または複数回、np個の期待されるピーク量値より大きいまたはそれに等しいnp個以上の値を含むことの相補的な場合は、np個の期待されるピーク量値より大きいまたはそれに等しいnp個以上の値を含むスライディング窓がない、すなわち
〈B.2 条件付き確率の評価〉
条件付き確率
条件付き確率
〈B.3 相関値分布に基づく同時確率評価〉
同時確率
同時確率
・c2 Lがちょうど(np−1)個の≧v1 np-1である値を区間[vnp-1,+∞)にもち、区間[vnp,vnp-1)には値をもたない。この場合、区間[vnp-1,+∞)についての対応する零補償された代表ベクトルは0の要素をもたず、同時に「1」の要素のみをもつ。さもなければ、区間[vnp,vnp-1)における0が補償され、c2 Lがちょうど(np−1)個の≧vである値をもつという制約条件に矛盾する。
・c2 Lがちょうど(np−2)個の≧v1 np-1である値を区間[vnp-1,+∞)にもち、ちょうど(np−1)個の≧vである値を区間[vnp,+∞)にもつ。これは、値分布についての何らかの区間における「m≧b」の場合に対応する。このことは次の例から明白である。
np=3の場合、c2 Lはちょうどnp−2=1個の≧v1 np-1である値を区間[v2,+∞)にもつ。これは、区間[v2,+∞)についてのすべての零補償された代表ベクトルが一つの0要素をもつことを意味する。より具体的には、[[0,1]]および[[m≧1,0]]がnp=3についての対応する零補償された代表ベクトルである。
・[[0,1]]については、c2 Lがちょうど(np−1)=2個の≧vである値を区間[v3,+∞)にもつためには、区間[v3,v2)内に一つまたは複数の値がある必要がある。よって、区間[v3,+∞)についての零補償された代表ベクトルは[[m≧1,0,1]]となる。つまり、区間[v3,v2)においてm≧1個の値がある。
・[[m≧1,0]]については、[[1,0]]または[[m≧2,0]]にさらに区別できる。[[1,0]]については、c2 Lがちょうど(np−1)=2個の≧vである値を区間[v3,+∞)にもつよう、零補償された代表ベクトルは[[m≧1,1,0]]である必要がある。[[m≧2,0]]については、対応する代表ベクトルは[m≧2,0]であり、一方、c2 Lがちょうど(np−1)=2個の≧vである値をもつという条件を満たすために区間[v3,v2)内の値の数に対するさらなる要件は必要ない。
図2は、c2 Lはちょうど二つの、≧vである値をもつ場合を列挙している。P1およびP2は区間[v3,v2]においてc2 Lが値をもたない場合に対応する。場合P3、P4およびP5は一つの区間において「m≧b」をもつ。図2の五つの場合について、すべての零補償された代表ベクトルは単一の0要素のみを含む。よって、cL+1をc2 Lに加えるとc2≧vとなり、c1をc2 Lに加えると
たとえば、P2は零補償された代表ベクトル[[0,1,1]]に対応する。c1<v3であれば、c1をc2 Lに加えると
よって、個々の確率は次のように計算される。
さらに、図2に示したP3、P4、P5のような「m≧b」の場合について、計算量を軽減するために、和についてのルックアップテーブルが構築されることができる。
図3は、「m≧b」の場合についての一般的な値分布を示している。区間[vq,∞)における値の数はsで表わされ、区間[vq+1,vq)にはm個の値がある。よって、1≦q≦np−1かつ0≦s≦np−2かつb=np−1−sである。ピークの数npが与えられると、qおよびsに依存するルックアップテーブルは次のように構築される。
〈B.4 再帰的な代表ベクトル構築〉
代表ベクトルおよび零補償されたベクトルは、偽陽性確率
代表ベクトルおよび零補償されたベクトルは、偽陽性確率
以下では、これらの代表ベクトルをいかにして再帰的に得るかを説明する。先に論じたように、図2におけるすべての場合は、対応する代表ベクトル[0,1,1],[0,0,2],[m≧2,0],[m≧1,1,0],[m≧1,0,1]によって表わせる。最初の二つのベクトルは再帰的に決定できる(上記参照)。最後の三つのベクトルの再帰的構築に関し、最後の三つのベクトルについての二つの属性は次のようなものである。
・「m≧b」の要素が常に第一の要素である。
・すべての要素の和がm≧2になる。
・「m≧b」の要素が常に第一の要素である。
・すべての要素の和がm≧2になる。
換言すれば、代表ベクトルにおける「m≧b」要素を除いた残りの要素を与えられると、「m≧b」要素が推定できる。図3を参照するに、sが与えられると、b=np−1−sである。よって、図2におけるP3、P4、P5の場合についての代表ベクトルは[0],[1,0],[0,1]に帰着する。そして問題は、np個のピークについていかにしてこれらの簡略化された代表ベクトルを見出すことに変えられる。
図3に動機付けられて、これらの代表ベクトルはs∈{0,1,…,np−2}の値に従って異なる集合に分割される。sについて諸代表ベクトルが与えられると、s+1についての対応する代表ベクトルは、拡張し、単位ベクトルを加えることによって構築できる。
〈B.4.1 初期化〉
s=0については代表ベクトルの集合は{[0]}であり、s=1については代表ベクトルの集合は{[1,0],[1,0]}である。
s=0については代表ベクトルの集合は{[0]}であり、s=1については代表ベクトルの集合は{[1,0],[1,0]}である。
〈B.4.2 1≦s≦n p −3についての更新〉
sについての集合における個々の代表ベクトルの長さljに依存して、s+1についての現在の再帰の代表ベクトルは異なる仕方で構築される。
sについての集合における個々の代表ベクトルの長さljに依存して、s+1についての現在の再帰の代表ベクトルは異なる仕方で構築される。
・長さlj≦s+1であれば、代表ベクトル中の最初の零でない要素を見出す。iが最初の零でない要素の位置であるとする。代表ベクトルに単位ベクトル
・長さlj=s+1であれば、先頭に一つの0を加えることによって代表ベクトルを拡張する。拡張された代表ベクトルにおいて最初の零でない値を見出し、単位ベクトルを加える。
しかしながら、ある代表ベクトルについての零補償された代表ベクトルにおける「0」要素がその代表ベクトルにおける最初の零でない要素の右側にある場合には、拡張することなく、この代表ベクトルについて、上記の見出し、加える手順を実行する。
〈B.4.3 例1〉
s=1についていずれも長さlj=s+1=2をもつ二つの代表ベクトル[1,0]および[0,1]を更新。ベクトル[0,1]については、最初の零でない要素の後には0要素はない。よって、新しい代表ベクトルは
s=1についていずれも長さlj=s+1=2をもつ二つの代表ベクトル[1,0]および[0,1]を更新。ベクトル[0,1]については、最初の零でない要素の後には0要素はない。よって、新しい代表ベクトルは
〈B.4.4 例2〉
s=2について代表ベクトル集合{[0,0,2],[0,1,1],[1,0,1],[0,2,0],[1,1,0],[2,0]}に関して更新。上記に従って、s=3についての代表ベクトルは次のように得られる。
s=2について代表ベクトル集合{[0,0,2],[0,1,1],[1,0,1],[0,2,0],[1,1,0],[2,0]}に関して更新。上記に従って、s=3についての代表ベクトルは次のように得られる。
図4における本発明の透かしデコーダのブロック図において、受領されたオーディオ信号は、取得または受領セクション・ステップまたはステージ41においてサンプリングされ、その後、前処理ステップまたはステージ42(これはたとえばスペクトル白色化を実行できる)を通過して、相関ステップまたはステージ43に至り、ここで受領されたオーディオ信号の現在セクションが、参照パターン信号生成ステップまたはステージ46からの、対応する異なる透かしシンボルに関係した、少なくとも二つの異なる候補参照パターン信号isと相関付けられ、それによりそれぞれの場合において、各候補透かしシンボルisについてN個の現在の相関結果値cisを生成する。合計nSymbols個の異なる候補参照パターン信号isがあり、たとえばnSymbols=2である。秘密鍵を使って、ランダム位相生成ステップまたはステージ45において対応する擬似ランダムな位相信号を生成し、その擬似ランダムな位相信号がステップ/ステージ46において参照パターン信号生成を制御する。ステップ/ステージ43における相関付けに続く透かしシンボル検出ステップまたはステージ44では、対応する検出された透かしシンボルを決定し、出力するために、現在のN個の相関結果値cisのM個の主相関結果ピークのまわりで長さLの窓が検査され、上記および図5との関連で記述されるような処理が実行される。
図5の流れ図では、ステップ50で受領される入力相関ブロックcisについて、パラメータisが「1」に設定される。たとえば、is=1は候補透かしシンボル「0」に対応し、is=2は候補透かしシンボル「1」に対応する。各候補透かしシンボルisについて、対応する相関結果値の集合cisがステップ51においてその大きさに従ってソートされ、最大のM個の量値cis k(すなわち、グローバル・ピーク量値)が決定される。たとえば、M=3、k=1,2,3である。ステップ52では、各グローバル・ピーク量値k=1,…,Mについておよび現在の候補透かしシンボルisについて、各グローバル・ピークのまわりの(すなわち、各グローバル・ピークを含む)もとの相関結果値の±L/2の範囲内(すなわち長さLの窓内)のnp個のピーク量値の対応するベクトルvis kが決定される。比較ステップ53によって制御されて、パラメータisは対応するループにおいて「1」から「nSymbols」まで走る。
LはNより著しく小さいので、すべての長さLの窓の合計長さは長さNより小さい。実際上、L≪Nであり、LはNより少なくとも一桁小さい。すなわち、N/L>10である。たとえば、N=16kであり、L=1kである。
その後、is=1からnSymbolsまで走る外側ループおよびk=1からMまで走る内側ループにはいり、それぞれ比較ステップ57および56によって制御される。内側ループでは、偽陽性確率FP(vis k)がステップ54において現在の相関結果値から計算され、それに比較ステップ55、kのインクリメント、比較ステップ56および外側ループでのisのインクリメントおよび比較ステップ57が続く。偽陽性確率FP(vis k)値は、一回または複数回、そのような長さLの窓が、透かし入れされていないオーディオ信号についての相関結果量値についての平均または期待される確率分布においてnp個のピーク値より大きいまたはそれに等しいnp個以上の相関結果量値を含む確率に対応する。比較ステップ57に続いて、候補透かしシンボルisがステップ58において決定される。その候補透かしシンボルについて、最終的な偽陽性確率fpはminis(mink(FP(is k)))である。ステップ59は、そのfp値をさらなる閾値Tmaxと比較することによって、透かしシンボルが検出されたかどうかを検査する。それが真であれば、検出された透かしシンボルが出力される。真でなければ、透かしシンボルは検出されなかったことになる。
比較ステップ55において、FP(vis k)が所定の閾値Tminより小さければ、正しい候補透かしシンボルisがみつかったと想定され、計算時間節約のために両方のループを抜け、その透かしシンボルが出力される。
図6は、長さNの例示的な相関結果および描かれているk=1,2,3の三つの長さLの窓を示している。それぞれの長さLの窓はN個の相関結果値におけるピークのまわりに配置されている。N内の最初の可能な長さLの窓の位置はj=1であり、最後の可能な長さLの窓の位置はj=N−L+1である。
本発明の処理は、単一のプロセッサまたは電子回路によって、あるいは並列して動作するおよび/または本発明の異なる部分に対して動作するいくつかのプロセッサまたは電子回路によって実行されることができる。
Claims (8)
- エコー、残響および/またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別する方法であって、
・前記受領オーディオ信号のセクションの、対応する異なる候補透かしシンボルisに関係した少なくとも二つの異なる候補参照パターン信号との相関を調べ、各候補透かしシンボルisについてそれぞれの場合にN個の相関結果値
・各候補透かしシンボルisについて、前記相関結果値cis内のM個のピーク値を決定するステップとを含んでおり、
・グローバル・ピーク値と記される前記M個のピーク値のそれぞれについておよび各候補透かしシンボルisについて、前記相関結果値cisから、長さLのM個の窓のそれぞれの中のnp個のピーク値の対応するベクトル
・長さLの前記M個の窓のそれぞれについて、ピーク値の前記ベクトルvis kおよび透かし入れされていないオーディオ信号についての相関結果値についての平均のまたは期待される確率分布に基づいて、偽陽性確率値
・前記受領オーディオ信号の前記セクションについて、最小の偽陽性確率値minis(mink(FP(vis k)))をもつ候補透かしシンボルisを、該最小の偽陽性確率値minis(mink(FP(vis k)))が所定の閾値(Tmax)より小さい場合には、検出された透かしシンボルとして選択し、そうでない場合には透かしシンボルが検出されなかったと想定するステップとを特徴とする、
方法。 - 前記偽陽性確率FP(vis k)値の前記計算において、その値がさらなる所定の閾値(Tmin)より小さい場合には、正しい候補透かしシンボルisが見つかったと想定され、前記のさらなる処理が省略され、前記所定の閾値(Tmax)は前記さらなる所定の閾値(Tmin)より大きい、請求項1記載の方法。
- M=3である、請求項1または2記載の方法。
- 二つの異なる候補透かしシンボルがある、請求項1ないし3のうちいずれか一項記載の方法。
- エコー、残響および/またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別する装置であって、
・前記受領オーディオ信号のセクションの、対応する異なる候補透かしシンボルisに関係した少なくとも二つの異なる候補参照パターン信号との相関を調べ、各候補透かしシンボルisについてそれぞれの場合にN個の相関結果値
・各候補透かしシンボルisについて、前記相関結果値cis内のM個のピーク値を決定し、各候補透かしシンボルisについての前記M個の相関結果ピーク値から導出されて、前記受領オーディオ信号の前記セクションについて、前記候補透かしシンボルisのうちの透かしシンボルを決定するよう適応された手段とを含んでおり、
グローバル・ピーク値と記される前記M個のピーク値のそれぞれについておよび各候補透かしシンボルisについて、前記相関結果値cisから、長さLのM個の窓のそれぞれの中のnp個のピーク値の対応するベクトル
長さLの前記M個の窓のそれぞれについて、ピーク値の前記ベクトルvis kおよび透かし入れされていないオーディオ信号についての相関結果値についての平均のまたは期待される確率分布に基づいて、偽陽性確率値
前記受領オーディオ信号の前記セクションについて、最小の偽陽性確率値minis(mink(FP(vis k)))をもつ候補透かしシンボルisが、該最小の偽陽性確率値minis(mink(FP(vis k)))が所定の閾値(Tmax)より小さい場合には、検出された透かしシンボルとして選択され、
そうでない場合には透かしシンボルが検出されなかったと想定される、
装置。 - 前記偽陽性確率FP(vis k)値の前記計算において、その値がさらなる所定の閾値(Tmin)より小さい場合には、正しい候補透かしシンボルisが見つかったと想定され、前記のさらなる処理が省略され、前記所定の閾値(Tmax)は前記さらなる所定の閾値(Tmin)より大きい、請求項5記載の装置。
- M=3である、請求項5または6記載の装置。
- 二つの異なる候補透かしシンボルがある、請求項5ないし7のうちいずれか一項記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13305425.4 | 2013-04-02 | ||
EP13305425.4A EP2787504A1 (en) | 2013-04-02 | 2013-04-02 | Method and Apparatus for determining watermark symbols in a received audio signal that can contain echoes, reverberation and/or noise |
PCT/EP2014/056304 WO2014161785A1 (en) | 2013-04-02 | 2014-03-28 | Method and apparatus for determining watermark symbols in a received audio signal that can contain echoes, reverberation and/or noise |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016515721A true JP2016515721A (ja) | 2016-05-30 |
Family
ID=48141876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016505773A Pending JP2016515721A (ja) | 2013-04-02 | 2014-03-28 | エコー、残響および/またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別する方法および装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US9607623B2 (ja) |
EP (2) | EP2787504A1 (ja) |
JP (1) | JP2016515721A (ja) |
KR (1) | KR20150136491A (ja) |
CN (1) | CN105103223A (ja) |
CA (1) | CA2902840A1 (ja) |
TW (1) | TW201501118A (ja) |
WO (1) | WO2014161785A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102403194B1 (ko) * | 2015-06-26 | 2022-05-27 | 삼성디스플레이 주식회사 | 표시 장치 |
CN106601261A (zh) * | 2015-10-15 | 2017-04-26 | 中国电信股份有限公司 | 基于数字水印的回声抑制方法和系统 |
US10236031B1 (en) * | 2016-04-05 | 2019-03-19 | Digimarc Corporation | Timeline reconstruction using dynamic path estimation from detections in audio-video signals |
JP7013093B2 (ja) * | 2018-05-01 | 2022-01-31 | アルパイン株式会社 | 故障検出装置、移動体搭載装置、故障検出方法 |
US11170793B2 (en) * | 2020-02-13 | 2021-11-09 | Adobe Inc. | Secure audio watermarking based on neural networks |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0941605B1 (en) * | 1997-09-02 | 2004-12-15 | Koninklijke Philips Electronics N.V. | Method and arrangement for detecting a watermark |
GB0403331D0 (en) * | 2004-02-14 | 2004-03-17 | Koninkl Philips Electronics Nv | Watermark detection |
EP1837875A1 (en) * | 2006-03-22 | 2007-09-26 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for correlating two data sections |
BRPI0721733A2 (pt) * | 2007-06-14 | 2013-02-13 | Thomson Licensing | mÉtodo e aparelho para definir um limite de detecÇço dada uma probabilidade falsa desejada |
EP2081187A1 (en) * | 2008-01-21 | 2009-07-22 | Deutsche Thomson OHG | Method and apparatus for determining whether or not a reference pattern is present in a received and possibly water-marked signal |
EP2175443A1 (en) * | 2008-10-10 | 2010-04-14 | Thomson Licensing | Method and apparatus for for regaining watermark data that were embedded in an original signal by modifying sections of said original signal in relation to at least two different reference data sequences |
EP2387033A1 (en) | 2010-05-11 | 2011-11-16 | Thomson Licensing | Method and apparatus for detecting which one of symbols of watermark data is embedded in a received signal |
-
2013
- 2013-04-02 EP EP13305425.4A patent/EP2787504A1/en not_active Withdrawn
-
2014
- 2014-03-28 WO PCT/EP2014/056304 patent/WO2014161785A1/en active Application Filing
- 2014-03-28 TW TW103111573A patent/TW201501118A/zh unknown
- 2014-03-28 CA CA2902840A patent/CA2902840A1/en not_active Abandoned
- 2014-03-28 CN CN201480019607.2A patent/CN105103223A/zh active Pending
- 2014-03-28 KR KR1020157027173A patent/KR20150136491A/ko not_active Application Discontinuation
- 2014-03-28 JP JP2016505773A patent/JP2016515721A/ja active Pending
- 2014-03-28 EP EP14713840.8A patent/EP2981957A1/en not_active Withdrawn
- 2014-03-28 US US14/781,960 patent/US9607623B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2014161785A1 (en) | 2014-10-09 |
CN105103223A (zh) | 2015-11-25 |
CA2902840A1 (en) | 2014-10-09 |
TW201501118A (zh) | 2015-01-01 |
EP2981957A1 (en) | 2016-02-10 |
US9607623B2 (en) | 2017-03-28 |
US20160049154A1 (en) | 2016-02-18 |
EP2787504A1 (en) | 2014-10-08 |
KR20150136491A (ko) | 2015-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hubbell et al. | Modeled reductions in late-stage cancer with a multi-cancer early detection test | |
JP2016515721A (ja) | エコー、残響および/またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別する方法および装置 | |
Liu et al. | An analytical framework for evaluating the error characteristics of approximate adders | |
WO2011141292A1 (en) | Method and apparatus for detecting which one of symbols of watermark data is embedded in a received signal | |
US11361757B2 (en) | Method and apparatus with speech recognition | |
JP4324222B2 (ja) | 相関最大点を決定するための装置および方法 | |
EP2081188A1 (en) | Method and apparatus for determining whether or not a reference pattern is present in a received and possibly watermarked signal | |
US20240086707A1 (en) | Device, method, program, and system for detecting unidentified water | |
CN105940380B (zh) | 跨缺失数据的正弦内插 | |
JP2008261720A (ja) | アンビギュイティ処理装置 | |
JP2008523749A (ja) | 受信シーケンスの到着時間を決定するための装置および方法 | |
Grais et al. | Referenceless performance evaluation of audio source separation using deep neural networks | |
US20070160241A1 (en) | Determination of the adequate measurement window for sound source localization in echoic environments | |
JP4718334B2 (ja) | 信号分析装置 | |
JP2013225859A (ja) | 情報信号の有/無の検出 | |
Hua et al. | Synchronisation of self-encoded spread spectrum system | |
JP2010246122A (ja) | フレーム同期のためのシステム及び方法 | |
EP2709102A1 (en) | Method and apparatus for determining an optimum frequency range within a full frequency range of a watermarked input signal | |
EP2122620A1 (en) | Method and apparatus for sinusoidal audio coding | |
JP2009053088A (ja) | 信号分離装置 | |
JP2009266044A (ja) | ソフトウェア処理時間推定システム及びソフトウェア処理時間推定方法 | |
US11620985B2 (en) | Pattern recognition robust to influence of a transfer path | |
WO2017154724A1 (ja) | 収録データ処理方法および収録データ処理装置 | |
JP4037343B2 (ja) | 電子透かしの誤り率推定装置及び方法並びにプログラム | |
Zhang | Match filter application in beat tracking by specific instrument sound in drum set music sequence |