JP2016515721A

JP2016515721A - エコー、残響および／またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別する方法および装置

Info

Publication number: JP2016515721A
Application number: JP2016505773A
Authority: JP
Inventors: チェン，シァオミン; ジョージバウム，ペーター; アルノルド，ミヒャエル; グリース，ウーリッヒ
Original assignee: Thomson Licensing SAS
Current assignee: Thomson Licensing SAS
Priority date: 2013-04-02
Filing date: 2014-03-28
Publication date: 2016-05-30
Also published as: WO2014161785A1; CN105103223A; CA2902840A1; TW201501118A; EP2981957A1; US9607623B2; US20160049154A1; EP2787504A1; KR20150136491A

Abstract

エコー、残響および／またはノイズを引き起こす音響経路を通じた透かし入れされたオーディオ信号の伝送後は、透かし検出相関結果ピーク値は、主たる相関結果ピークのまわりの限られた時間的範囲内に集中し、該限られた時間的範囲は全相関長Nよりずっと小さい。透かし検出は下記に基づく。マークされていないコンテンツについての相関結果値についての平均的なまたは期待される確率分布においてn_p個の相関結果ピーク値v＝(v₁,v₂,…,v_np)が与えられたとき、前記限られた時間的範囲をカバーする窓内で、これらのピークvより大きいかそれに等しい、Nの相関結果値集合からのn_p個以上の値がある確率が計算される。

Description

本発明は、エコー、残響および／またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別する方法および装置に関する。

オーディオ透かし入れは、耳に聞こえない仕方で追加的情報をオーディオ信号中に埋め込むプロセスである。埋め込みは、たとえば擬似ランダムなノイズまたはエコーを加えることによってオーディオ信号を変化させることによって実行される。埋め込みを耳に聞こえないようにするために、埋め込みの強度は、オーディオ信号の音響心理学的解析によって制御される。特許文献１は、オーディオ信号、たとえばマイクロフォンによって受領されたラウドスピーカー音におけるエコー、残響および／またはノイズの存在時の透かし検出を記載している。これらのエコーは、透かしシンボル（すなわち参照信号）との長さNの相関結果値シーケンス内の複数のピークを与え、透かし検出の信頼性を改善するために使われる。この統計的検出器の基本的段階は次のようなものである。
・各候補透かしシンボルについて前記相関結果シーケンスにおけるピーク値v＝(v₁,v₂,…,v_np)を見出す。ここで、v₁≧…≧v_npであり、n_pは考慮に入れられる相関結果ピーク値の数である。
・前記候補透かしシンボルが埋め込まれている偽陽性確率P(k)、k＝1,…,n_pを再帰的に計算する。
・最低のP(k)値を与える候補透かしシンボルを選択する。

P(k)は、候補透かしシンボルを誤って受け入れる確率である。これは、透かしが入っていない信号セクションからのk個以上の相関結果値が考慮対象の実際のk個のピーク値以上である確率を記述する。

この統計的検出器は次の問題を解決する。
ａ）いかにして確率P(k)を再帰的に評価するか。ここで、考慮されるピーク値の数kが徐々に増大させられることができる。
ｂ）すでに実行された計算を再利用することによりいかにして計算量を最小化するか。

この統計的検出器は、検出パフォーマンスを改善するためにいくつかの相関結果ピークを使う。特に、この改善は、透かし入れされたトラックが、エコーに起因するマルチパス検出につながる音響経路を通じて伝送される場合に有利である。P(k)を計算するために使われるn_p個のピークv₁≧…≧v_npは、長さNの相関結果値シーケンス全体から取られる。

国際公開第2011/141292号

しかしながら、この種の処理は、物理的な現実を最適な仕方で反映するものではない。相関結果値シーケンスにおける追加的なピーク値が残響から生じ、よって主ピークのまわりに近接してグループ化されるからである。すなわち、これらの追加的なピーク値は、ラウドスピーカーと検出装置のマイクロフォンとの間の直接経路に対して時間遅延される。ただし、限られた時間期間内のみである。透かし入れ検出装置が源からの距離d_s（サンプルs単位で測る）をもつ音響経路を通じて音を受領するとき、伝搬距離はd_m＝d_scTメートルである。ここで、cTは一サンプリング区間内に音が伝搬する距離であり、T＝1/fはサンプリング・レートであり、cは音速である。

たとえば、直接（direct）経路についてd_m ^d＝4mであり、間接（indirect）経路についてd_m ⁱ＝2d_m ^d＝8mである場合、直接経路の主ピークと反射に起因する近隣ピークとの間のサンプル単位での距離は次のようになる。

典型的にはセッティングでは、相関長はN＝16kサンプルである（1k≡1024）。したがって、ピークは、主ピーク値または複数のピーク値のまわりの、たとえば

サンプルのサイズ（たとえばL≪N）の窓において探索され、対応する偽陽性確率が計算されることになる。主相関結果ピーク値はN個の相関結果値の現在の集合におけるどこかに位置するので、偽陽性確率は、サイズNのバッファ内のサイズLの窓のあらゆる可能なN−L＋1通りのシフトについて計算される。

本発明によって解決されるべき課題は、既知の統計的透かし検出器よりよく、マルチパス受信の物理を考慮に入れ、それにより偽陽性確率計算および透かし検出のパフォーマンスを改善することである。

この課題は、請求項１に開示される方法によって解決される。この方法を利用する装置は請求項２において開示される。

上述したように、エコー、残響および／またはノイズを引き起こす音響経路を通じた透かし入れされたオーディオ信号の伝送後は、透かし検出相関結果ピーク値は一般に、限られた時間的範囲内で主たる相関結果ピークのまわりに集中し、Lと表わす該時間的範囲の最大サイズは全相関長Nよりずっと小さい。透かし検出のための関係したタスクは、次のように定式化できる。

マークされていないオーディオ信号コンテンツについて相関結果値についての平均的なまたは期待される確率分布において、n_p個のピーク値v＝(v₁,v₂,…,v_np)が与えられたとき、これらのピークvより大きいかそれに等しい、現在の長さNの相関結果値集合からの長さLのスライディング窓内のn_p個以上のピーク値がある確率P_FP(n_p,L,v)をいかにして計算するか。

測定により、マークされていないコンテンツについての相関結果値についてのそのような平均または期待される確率分布がガウス分布に対応するまたはガウス分布と同様であることが示されている。

コメント：一サンプルずつ参照パターンを現在の入力オーディオ信号セクションを通じてシフトさせていくことにより相関を実行するとき、この相関のN値結果は正のピーク値のほか負のピーク値をもつことがあり、これらは一緒にして「ピーク量値」と表わされる。

以下の記述を簡単にするために、いくつかの記法を導入しておく。

は、N内の位置jで始まる長さLのj番目のスライディング窓内のL個の相関結果値を表わす。

は、ベクトルc_jにおいて、マークされていないコンテンツについての相関結果値についての平均または期待される確率分布において前記n_p個のピーク値vより大きいまたはそれに等しいn_p個以上の現在の相関結果値があることを示す。

は、ベクトルc_jにおいて、マークされていないコンテンツについての相関結果値についての平均または期待される確率分布において前記n_p個のピーク値vより大きいまたはそれに等しい現在の相関結果値がn_p個未満であることを意味する。

コメント：Prが確率を表わすとして、

という点で、

は

と相補的である。

長さLのスライディング窓をN個の相関結果値を通じてシフトさせる。上述したように、求められるFP（false positive［偽陽性］）確率は、一回または複数回、スライディング窓が、透かし入れされていないオーディオ信号コンテンツについての相関結果値についての平均または期待される確率分布において前記n_p個のピーク値より大きいまたはそれに等しいn_p個以上の相関結果量値を含む確率である。このFP確率についての相補的な場合は、透かし入れされていないオーディオ信号コンテンツについての相関結果値についての平均または期待される確率分布においてn_p個のピーク値より大きいまたはそれに等しいn_p個以上の相関結果量値を含むスライディング窓がない、つまり

というものである。よって、

は偽陽性確率

（一つまたは複数の窓がjによってインデックス付けされる）についての相補的確率である。

最終的なFP確率計算は次のように表現できる（詳細は後述）。

L＝Nについては（この場合、

である）、

の定義における上記のコメントに鑑み、この一般的な公式は、特許文献１の統計的検出器における再帰的計算の場合

に帰着する。

の計算を、特許文献１の統計的検出器について記述しておく。現在の信号セクションについての相関結果値におけるピーク値に基づいて、候補シンボルのどれが現在の信号セクションに存在するかが、透かしシンボルのその種類の検出の偽陽性確率の関係した値を使って、検出される。ここで、偽陽性確率は再帰的な仕方で計算され、所与の数の相関結果ピーク値についての全偽陽性確率が、初期にはより少数の相関結果ピーク値についての偽陽性確率を使い、要求される検出信頼度に従って徐々に考慮される相関結果ピーク値の数を増していくことによって、評価される。

したがって、以下の記述における偽陽性確率の計算は

を計算する問題にマッピングされる。所与の数n_pのピーク値について、この確率は、ピークi＝1,2で始めてn_p−1個のピーク値についての確率から再帰的に計算されることができる（「発明を実施するための形態」の節参照）。

本発明は、偽陽性検出判断を有意に低減することによって特許文献１の統計的透かし検出処理の検出パフォーマンスを改善するが、本発明は特許文献１の透かし検出のすべての利点を保持する。

有利なことに、本発明は、ユーザーがテレビを視聴し、透かし入れされたテレビ音を介して透かし情報を得るというセカンドスクリーンのシナリオにおいて使用されることができる。ここで、前記透かし情報はたとえば、該透かし情報を使って現在のテレビ番組に関係した追加的情報をダウンロードして基本的に同期して呈示するタブレット・コンピュータのためである。

原理的には、本発明の方法は、エコー、残響および／またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別するために好適であり、本方法は、
・受領されたオーディオ信号の現在セクションの、対応する異なる候補透かしシンボルisに関係した少なくとも二つの異なる候補参照パターン信号との相関を調べ、各候補透かしシンボルisについてそれぞれの場合にN個の現在の相関結果値c_isを生成するステップと、
・各候補透かしシンボルisについて、前記相関結果値c_is内のM個のピーク値を決定するステップと、
・各候補透かしシンボルisについての前記M個の相関結果ピーク値から導出されて、前記受領オーディオ信号の前記現在セクションについて、前記候補透かしシンボルisのうちの透かしシンボルを決定するまたは透かしシンボルが検出されなかったと判定するステップとを含み、前記透かしシンボルの決定はさらに、
・グローバル・ピーク値と記される前記M個のピーク値のそれぞれについておよび各候補透かしシンボルisについて、現在の相関結果値c_isから、長さLのM個の窓のそれぞれの中のn_p個のピーク値の対応するベクトル

を決定するステップであって、各長さLの窓は前記M個のグローバル・ピーク値のうちの一つを含み、長さLの窓全部の合計長さはNより小さく、k＝1,…,Mである、ステップと、
・長さLの前記M個の窓のそれぞれについて、現在の相関結果値c_isから、一回または複数回、そのような長さLの窓が、透かし入れされていないオーディオ信号についての相関結果値についての平均または期待される確率分布においてn_p個のピーク値より大きいまたはそれに等しいn_p個以上の相関結果値を含むを含む確率に対応する偽陽性確率

の値を計算するステップと、
・前記受領オーディオ信号の現在セクションについて、最小の偽陽性確率値

をもつ候補透かしシンボルisを、検出された透かしシンボルとして選択するステップとを含む。

原理的には、本発明の装置は、エコー、残響および／またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別するために好適であり、本装置は、
・受領されたオーディオ信号の現在セクションの、対応する異なる候補透かしシンボルisに関係した少なくとも二つの異なる候補参照パターン信号との相関を調べ、各候補透かしシンボルisについてそれぞれの場合にN個の現在の相関結果値c_isを生成するよう適応された手段と、
・各候補透かしシンボルisについて、前記相関結果値c_is内のM個のピーク値を決定し、各候補透かしシンボルisについての前記M個の相関結果ピーク値から導出されて、前記受領オーディオ信号の前記現在セクションについて、前記候補透かしシンボルisのうちの透かしシンボルを決定するまたは透かしシンボルが検出されなかったと判定するよう適応された手段とを含み、
グローバル・ピーク値と記される前記M個のピーク値のそれぞれについておよび各候補透かしシンボルisについて、現在の相関結果値c_isから、長さLのM個の窓のそれぞれの中のn_p個のピーク値の対応するベクトル

が決定され、各長さLの窓は前記M個のグローバル・ピーク値のうちの一つを含み、長さLの窓全部の合計長さはNより小さく、k＝1,…,Mであり、
長さLの前記M個の窓のそれぞれについて、現在の相関結果値c_isから、一回または複数回、そのような長さLの窓が、透かし入れされていないオーディオ信号についての相関結果値についての平均または期待される確率分布においてn_p個のピーク値より大きいまたはそれに等しいn_p個以上の相関結果値を含むを含む確率に対応する偽陽性確率

の値が計算され、
前記受領オーディオ信号の現在セクションについて、最小の偽陽性確率値

をもつ候補透かしシンボルisが検出された透かしシンボルとして選択される。

本発明の有利な追加的実施形態はそれぞれの従属請求項において開示される。

本発明の例示的な実施形態が付属の図面を参照して記述される。
三つの相関結果ピーク値v₃,v₂,v₁より大きいまたはそれに等しい三つ以上の相関値の分離した〔重なりのない〕可能性を示す図である。 c₂ ^Lが≧vである二つの値をもつ分離した可能性を、対応する代表ベクトル[0,1,1],[0,0,2],[m≧2,0],[m≧1,1,0],[m≧1,0,1]および零補償された代表ベクトル[[0,1,1]],[[0,1,1]],[[1,m≧1,0]],[m≧1,0],[m≧1,0,1]とともに示す図である。「m≧」の場合についての一般的な値分布を示す図である。本発明の処理についてのブロック図である。本発明の処理についての流れ図である。三つの長さLの窓が描かれている例示的な相関結果を示す図である。

〈Ａ．偽陽性（FP）確率の定義〉
相互相関に基づく透かし検出において、埋め込まれた透かし情報を判別するために単一の相関結果ピーク値を使うことはよく知られている。しかしながら、本発明では、複数の相関結果ピーク量値を用いる最適な透かし検出が記述される。FP確率を評価するために、次のことが想定される。
・任意のマークされていない信号セクション・コンテンツと参照パターンまたは透かし〔ウォーターマーク〕シンボルとの間の相関値が独立同分布のランダム変数であること、および
・特定の相関結果ピーク値vについて、対応する確率分布尾部確率

をいかにして計算するかは知られていること。ここで、cはガウシアンなど特定の分布に従う相関値を表わす。

長さNの現在の相関結果における単一のピーク値vについては、FP確率は、マークされていないコンテンツについての相関結果値についての平均または期待される確率分布において、N個の相関値のうちそのピーク値vより小さくない一つまたは複数の値がある確率である。同様に、n_p個のピーク値v₁≧v₂≧…≧v_npについては、偽陽性確率は、マークされていないコンテンツについての相関結果値についての平均または期待される確率分布において、これらのピークv₁,v₂,…,v_npより大きいまたはそれに等しいn_p個以上の相関結果値がある確率として定義される。ここで、対応する尾部確率は

として定義される。

ソート後の特定の相関結果ベクトル・サンプル

（下付のn₁および上付きのn₂を付けたxはn₁からn₂のインデックスを付けられたシーケンス値xを集めたベクトルを表わす）、すなわち、c₁≧c₂≧…≧c_Lが与えられると、それが

より大きいまたはそれに等しいn_p個以上の値をもつかどうかを決定できる。

nGT＝0;
for i＝1:np
if ci≧vi
nGT＝nGT＋1;
end
end
。

nGT＝npであれば、c₁ ^Lはv₁ ^npより大きいまたはそれに等しいn_p個以上の値をもつ。そのことは、以下では

〔またはc₁ ^L≧v₁ ^np〕と記される。c₁ ^L≧v₁ ^npとなる場合は分離した〔重なりのない〕イベントに分割される。最終的なFP確率は、個々に生起するイベントの確率の和である。

〈Ａ１．相関値分布、複数ピークとの比較〉
相関結果値を複数のピーク値と比較するために、相関結果量値の完全な範囲がn_p＋1個の区間
[−∞,v_np)，[v_np,v_np-1)，[v_np-1,v_np-2)，…,[v₁,＋∞)
に分割される。

次いで、相関値分布は、個々の区間内に何個の相関結果量値が位置しているかを数えることによって実行される。それは代表ベクトルによって記述できる。時によっていくつかの区間内のいくつかの値がFP確率評価にとっては重要でないので、代表ベクトルは異なる値をもつことがある。したがって、本稿では、代表ベクトルの最も右の要素が常に区間[v₁,＋∞)に対応し、一方、最も左の要素は第一の要素と称される。

図１は、n_p＝3個以上の相関結果値が三つのピーク値v₃≦v₂≦v₁より大きいまたはそれに等しくなる種々の場合についての相関値分布を示している。場合P₁は、代表ベクトル[m≧3]によって記述できる。これは、区間[v₁,＋∞)内に3個以上の相関結果値があり、残りのL−m個の相関結果値はピーク値v₁未満であることを示す。一方では、区間[v₃,v₂)や[v₂,v₁)に何個の値があるかに関わりなく、これらの場合はみな、v₁未満のL−m個の相関結果値があるという条件に含まれる。他方では、三つのピークとの比較のために、個々の区間[v₃,v₂)，[v₂,v₁)，[v₁,＋∞)内に何個の相関結果値があるかを検査することが便利である。代表ベクトル[m≧3]については、最悪ケースは、区間[v₃,v₂)にも区間[v₂,v₁)にも相関結果値がないというものであり、代表ベクトル[0,0,m≧3]に対応する。

そのような場合、v₁≧v₂、v₁≧v₃のため、それでも、少なくとも、≧v₁である一つの値、≧v₂である一つの値および≧v₃である一つの値がある。これは、区間[v₃,v₂)および[v₂,v₁)に関連付けられた二つの0が区間[v₁,＋∞)におけるm≧3によって補償されていると解釈されることができる。簡単のため、[[…]]と記される「零補償された代表ベクトル」がこの場合、もとの代表ベクトル[m≧3]から導出されて、[[1,1,m≧1]]として定義できる。特に断わりのない限り、長さn_pをもつ零補償された代表ベクトルが区間[v_np,＋∞)について使われる。

たとえば、場合P₂では、区間[v₁,＋∞)内に二つの相関結果値、区間[v₂,v₁)内に0個の相関結果値、区間[v₃,v₂)内にm≧1個の相関結果値があり、L−2−m個の相関結果値はv₃未満である。

代表ベクトルa＝[a_n,…,a₂,a₁]を与えられたとき、その対応する零補償されたものは次のように導出される。
・n_p−n個の0を加えることによってベクトルaを長さn_pに拡張する

・{a_j(t),1≦t≦T}として、a'内の「1」より大きな要素を見出す。
・t＝1,2,…,Tについて、零補償を実行する。a_j(t)の左側に0があれば、右から左に、最大でa_j(t)−1個の0が補償できる。零補償の間、0の要素および対応するa_j(t)は逐次的に更新される。「0」が補償されるたびに、a'におけるその値が「1」に変更され、a'におけるa_j(t)は1減らされる。

結果として得られるベクトルa'は、aについての零補償された代表ベクトルである。k≧nとして任意の区間[v_k,＋∞)についての零補償された代表ベクトルが、n_pをkで置き換えることによって同様に得ることができることを注意しておく。

たとえば、図１に挙げた場合についての代表ベクトルおよびそれらの零補償された代表ベクトルはそれぞれ、[m≧3]，[m≧1,0,2]，[m≧1,2]，[m≧2,1]，[m≧1,1,1]および[[1,1,m≧1]]，[[m≧1,1,1]]，[[1,m≧1,1]]，[[1,m≧1,1]][[m≧1,1,1]]である。明らかに、代表ベクトルから対応する零補償された代表ベクトルへのマッピングは一意的である。一方、逆マッピングについてはこれは成り立たない可能性がある。

有利なことに、そのような零補償された代表ベクトルの導入により、複数のピークを含む相関結果値を比較することがずっと簡単になる。具体的には、零補償された代表ベクトルに0の値がなければ、

と記されるN個の相関値を集めた相関ベクトルがn_p個のピークより大きいまたはそれに等しいと想定できる。このことは、簡潔に

〔またはc₁ ^N≧v₁ ^np〕と記される。さらに、零補償された代表ベクトルにk個の0があれば、c₁ ^Nはちょうどn_p−k個の、≧v₁ ^npである値をもつと述べることができる。図１に示した値分布によれば、個々のイベントについての確率は次のように計算される。

最終的なFP確率はP_FP＝P₁＋P₂＋P₃＋P₄＋P₅である。因子(p_i−p_i-1)は、範囲[v_i,v_i-1]内の値をもつ相関結果ピークを得る確率であり、一方、因子(1−p_i)は、範囲(−∞,v_i]内にピークを得る確率である。

〈Ｂ．限られた範囲内での相関結果ピーク値についてのFP確率〉
上述したように、音響経路を通じた信号伝送については、相関結果ピーク量値は一般に、相関長Nよりずっと小さい最大サイズLの限られた時間的範囲内に集中する。よって、N個の相関結果値のうちの長さLの現在の窓内のn_p個のピーク量値について、マークされないコンテンツついての相関結果ピーク値についての平均または期待される確率分布において、この現在の長さLの窓内でn_p個のピーク量値より大きいまたはそれに等しいn_p個以上の相関結果量値がある確率が計算される。

〈Ｂ．１発明のFP確率計算処理〉

についての定義は上記で与えてある。

スライディング窓が一回または複数回、n_p個の期待されるピーク量値より大きいまたはそれに等しいn_p個以上の値を含むことの相補的な場合は、n_p個の期待されるピーク量値より大きいまたはそれに等しいn_p個以上の値を含むスライディング窓がない、すなわち

ということである。よって、FP確率についての相補的な確率は次のようになる。

連鎖律を使って、同時確率

は、条件付き確率によって計算できる。

相関ベクトルc_jについては、直前のものc_j-1のみが条件付き確率

において有意である。該直前のものが、c_jの一つの新たな要素を除いてすべての要素を含んでいるからである。

したがって、同時確率

は次のように書ける。

さらに、Lが十分大きく、恒等式

が成り立つので、L個の相関サンプルの部分集合がすでにN個のサンプル全部の代表的な集合を表わす。上記の恒等式が式(2)に用いられる。

いかにして

を評価するかは知られているので、FP確率計算は条件付き確率

の評価に帰着する。

〈Ｂ．２条件付き確率の評価〉
条件付き確率

は、条件付き確率の定義を使って再定式化できる。二つのイベントAおよびBが与えられ、P(B)＞0とすると、Bが与えられたときのAの条件付き確率は次のように定義される。

したがって、

は次のように書くことができる。

よって、FP確率は次のように評価できる。

この一般的な公式は、L＝Nについては、特許文献１の統計的透かし検出処理における再帰的計算の場合（その場合、

である）に帰着する。

L≠Nの場合について式(6)を計算するために、次節で説明するように分割が実行される。

〈Ｂ．３相関値分布に基づく同時確率評価〉
同時確率

は次のように表現できる。

c₂ ^Lがちょうど(n_p−1)個の≧vである値をもつ場合は、ここでもまた二つの分離した群に分割される。

・c₂ ^Lがちょうど(n_p−1)個の≧v₁ ^np-1である値を区間[v_np-1,＋∞)にもち、区間[v_np,v_np-1)には値をもたない。この場合、区間[v_np-1,＋∞)についての対応する零補償された代表ベクトルは0の要素をもたず、同時に「1」の要素のみをもつ。さもなければ、区間[v_np,v_np-1)における0が補償され、c₂ ^Lがちょうど(n_p−1)個の≧vである値をもつという制約条件に矛盾する。

・c₂ ^Lがちょうど(n_p−2)個の≧v₁ ^np-1である値を区間[v_np-1,＋∞)にもち、ちょうど(n_p−1)個の≧vである値を区間[v_np,＋∞)にもつ。これは、値分布についての何らかの区間における「m≧b」の場合に対応する。このことは次の例から明白である。

n_p＝3の場合、c₂ ^Lはちょうどn_p−2＝1個の≧v₁ ^np-1である値を区間[v₂,＋∞)にもつ。これは、区間[v₂,＋∞)についてのすべての零補償された代表ベクトルが一つの0要素をもつことを意味する。より具体的には、[[0,1]]および[[m≧1,0]]がn_p＝3についての対応する零補償された代表ベクトルである。

・[[0,1]]については、c₂ ^Lがちょうど(n_p−1)＝2個の≧vである値を区間[v₃,＋∞)にもつためには、区間[v₃,v₂)内に一つまたは複数の値がある必要がある。よって、区間[v₃,＋∞)についての零補償された代表ベクトルは[[m≧1,0,1]]となる。つまり、区間[v₃,v₂)においてm≧1個の値がある。

・[[m≧1,0]]については、[[1,0]]または[[m≧2,0]]にさらに区別できる。[[1,0]]については、c₂ ^Lがちょうど(n_p−1)＝2個の≧vである値を区間[v₃,＋∞)にもつよう、零補償された代表ベクトルは[[m≧1,1,0]]である必要がある。[[m≧2,0]]については、対応する代表ベクトルは[m≧2,0]であり、一方、c₂ ^Lがちょうど(n_p−1)＝2個の≧vである値をもつという条件を満たすために区間[v₃,v₂)内の値の数に対するさらなる要件は必要ない。

図２は、c₂ ^Lはちょうど二つの、≧vである値をもつ場合を列挙している。P₁およびP₂は区間[v₃,v₂]においてc₂ ^Lが値をもたない場合に対応する。場合P₃、P₄およびP₅は一つの区間において「m≧b」をもつ。図２の五つの場合について、すべての零補償された代表ベクトルは単一の0要素のみを含む。よって、c_L+1をc₂ ^Lに加えるとc₂≧vとなり、c₁をc₂ ^Lに加えると

となるようc_L+1およびc₁についての値範囲を選ぶことはストレートにできる。

たとえば、P2は零補償された代表ベクトル[[0,1,1]]に対応する。c₁＜v₃であれば、c₁をc₂ ^Lに加えると

となる。他方、c_L+1≧v₃であれば、c_L+1をc₂ ^Lに加えるとc₂ ^L+1≧v₁ ³となる。

よって、個々の確率は次のように計算される。

一般に、P₃、P₄、P₅確率についての和の項を計算することは、二項定理を用いることによって再定式化できる。

これはn₁≪n₂−n₁であれば計算量の有意に軽減する。

さらに、図２に示したP₃、P₄、P₅のような「m≧b」の場合について、計算量を軽減するために、和についてのルックアップテーブルが構築されることができる。

図３は、「m≧b」の場合についての一般的な値分布を示している。区間[v_q,∞)における値の数はsで表わされ、区間[v_q+1,v_q)にはm個の値がある。よって、1≦q≦n_p−1かつ0≦s≦n_p−2かつb＝n_p−1−sである。ピークの数n_pが与えられると、qおよびsに依存するルックアップテーブルは次のように構築される。

c₂ ^Lがちょうど(n_p−1)個の≧vである値をもつすべての分離した場合について代表ベクトルを有すると、FP確率を評価することはストレートにできる。

〈Ｂ．４再帰的な代表ベクトル構築〉
代表ベクトルおよび零補償されたベクトルは、偽陽性確率

を計算するために使われる。これらのベクトルが既知であれば、確率P₁ないしP₅についての式が定式化されることができる。図２についての記述における例を参照。このように、FP(v_is ^k)の計算は、所与のピーク数n_pについてすべてのベクトルを構築する問題にマッピングされる。

以下では、これらの代表ベクトルをいかにして再帰的に得るかを説明する。先に論じたように、図２におけるすべての場合は、対応する代表ベクトル[0,1,1]，[0,0,2]，[m≧2,0]，[m≧1,1,0]，[m≧1,0,1]によって表わせる。最初の二つのベクトルは再帰的に決定できる（上記参照）。最後の三つのベクトルの再帰的構築に関し、最後の三つのベクトルについての二つの属性は次のようなものである。
・「m≧b」の要素が常に第一の要素である。
・すべての要素の和がm≧2になる。

換言すれば、代表ベクトルにおける「m≧b」要素を除いた残りの要素を与えられると、「m≧b」要素が推定できる。図３を参照するに、sが与えられると、b＝n_p−1−sである。よって、図２におけるP₃、P₄、P₅の場合についての代表ベクトルは[0]，[1,0]，[0,1]に帰着する。そして問題は、n_p個のピークについていかにしてこれらの簡略化された代表ベクトルを見出すことに変えられる。

図３に動機付けられて、これらの代表ベクトルはs∈{0,1,…,n_p−2}の値に従って異なる集合に分割される。sについて諸代表ベクトルが与えられると、s＋1についての対応する代表ベクトルは、拡張し、単位ベクトルを加えることによって構築できる。

〈Ｂ．４．１初期化〉
s＝0については代表ベクトルの集合は{[0]}であり、s＝1については代表ベクトルの集合は{[1,0],[1,0]}である。

〈Ｂ．４．２ 1≦s≦n _p −3についての更新〉
sについての集合における個々の代表ベクトルの長さljに依存して、s＋1についての現在の再帰の代表ベクトルは異なる仕方で構築される。

・長さlj≦s＋1であれば、代表ベクトル中の最初の零でない要素を見出す。iが最初の零でない要素の位置であるとする。代表ベクトルに単位ベクトル

を加えて新しい代表ベクトルを得る。例示的な単位ベクトルはe_i＝(0,…,0,1,0,…,0)である。ここで、最初の0は位置「1」をもち、二番目の0は位置「i−1」をもち、「1」は位置「i」をもち、三番目の0は位置「i＋1」をもち、最後の0は位置「lj」をもつ。

・長さlj＝s＋1であれば、先頭に一つの0を加えることによって代表ベクトルを拡張する。拡張された代表ベクトルにおいて最初の零でない値を見出し、単位ベクトルを加える。

しかしながら、ある代表ベクトルについての零補償された代表ベクトルにおける「0」要素がその代表ベクトルにおける最初の零でない要素の右側にある場合には、拡張することなく、この代表ベクトルについて、上記の見出し、加える手順を実行する。

〈Ｂ．４．３例１〉
s＝1についていずれも長さlj＝s＋1＝2をもつ二つの代表ベクトル[1,0]および[0,1]を更新。ベクトル[0,1]については、最初の零でない要素の後には0要素はない。よって、新しい代表ベクトルは

として得られる。他方、ベクトル[1,0]については、その最初の零でない要素の後に一つの0要素があり、零補償後に一つの0が残る。よって、新しい代表ベクトルは、拡張なしでの単位ベクトルを加える

のほかに拡張して単位ベクトルを加える

がある。

〈Ｂ．４．４例２〉
s＝2について代表ベクトル集合{[0,0,2]，[0,1,1]，[1,0,1]，[0,2,0]，[1,1,0]，[2,0]}に関して更新。上記に従って、s＝3についての代表ベクトルは次のように得られる。

[0,1,0,2]については、これは[[0,1,1,1]]をその零補償された代表ベクトルとしており、零補償後はその最初の零でない要素の右側に0はない。一方、[1,0,0,2]についてはその零補償された代表ベクトルは[[1,0,1,1]]であり、零補償後でもその最初の零でない要素の右側に一つ0が残っている。よって、s＝4についての代表ベクトルを得るためには、[0,1,0,2]と[1,0,0,2]について異なる更新手順が実行される。

図４における本発明の透かしデコーダのブロック図において、受領されたオーディオ信号は、取得または受領セクション・ステップまたはステージ４１においてサンプリングされ、その後、前処理ステップまたはステージ４２（これはたとえばスペクトル白色化を実行できる）を通過して、相関ステップまたはステージ４３に至り、ここで受領されたオーディオ信号の現在セクションが、参照パターン信号生成ステップまたはステージ４６からの、対応する異なる透かしシンボルに関係した、少なくとも二つの異なる候補参照パターン信号isと相関付けられ、それによりそれぞれの場合において、各候補透かしシンボルisについてN個の現在の相関結果値c_isを生成する。合計nSymbols個の異なる候補参照パターン信号isがあり、たとえばnSymbols＝2である。秘密鍵を使って、ランダム位相生成ステップまたはステージ４５において対応する擬似ランダムな位相信号を生成し、その擬似ランダムな位相信号がステップ／ステージ４６において参照パターン信号生成を制御する。ステップ／ステージ４３における相関付けに続く透かしシンボル検出ステップまたはステージ４４では、対応する検出された透かしシンボルを決定し、出力するために、現在のN個の相関結果値c_isのM個の主相関結果ピークのまわりで長さLの窓が検査され、上記および図５との関連で記述されるような処理が実行される。

図５の流れ図では、ステップ５０で受領される入力相関ブロックc_isについて、パラメータisが「1」に設定される。たとえば、is＝1は候補透かしシンボル「0」に対応し、is＝2は候補透かしシンボル「1」に対応する。各候補透かしシンボルisについて、対応する相関結果値の集合c_isがステップ５１においてその大きさに従ってソートされ、最大のM個の量値c_is ^k（すなわち、グローバル・ピーク量値）が決定される。たとえば、M＝3、k＝1,2,3である。ステップ５２では、各グローバル・ピーク量値k＝1,…,Mについておよび現在の候補透かしシンボルisについて、各グローバル・ピークのまわりの（すなわち、各グローバル・ピークを含む）もとの相関結果値の±L/2の範囲内（すなわち長さLの窓内）のn_p個のピーク量値の対応するベクトルv_is ^kが決定される。比較ステップ５３によって制御されて、パラメータisは対応するループにおいて「1」から「nSymbols」まで走る。

LはNより著しく小さいので、すべての長さLの窓の合計長さは長さNより小さい。実際上、L≪Nであり、LはNより少なくとも一桁小さい。すなわち、N/L＞10である。たとえば、N＝16kであり、L＝1kである。

その後、is＝1からnSymbolsまで走る外側ループおよびk＝1からMまで走る内側ループにはいり、それぞれ比較ステップ５７および５６によって制御される。内側ループでは、偽陽性確率FP(v_is ^k)がステップ５４において現在の相関結果値から計算され、それに比較ステップ５５、kのインクリメント、比較ステップ５６および外側ループでのisのインクリメントおよび比較ステップ５７が続く。偽陽性確率FP(v_is ^k)値は、一回または複数回、そのような長さLの窓が、透かし入れされていないオーディオ信号についての相関結果量値についての平均または期待される確率分布においてn_p個のピーク値より大きいまたはそれに等しいn_p個以上の相関結果量値を含む確率に対応する。比較ステップ５７に続いて、候補透かしシンボルisがステップ５８において決定される。その候補透かしシンボルについて、最終的な偽陽性確率fpはmin_is(min_k(FP(_is ^k)))である。ステップ５９は、そのfp値をさらなる閾値T_maxと比較することによって、透かしシンボルが検出されたかどうかを検査する。それが真であれば、検出された透かしシンボルが出力される。真でなければ、透かしシンボルは検出されなかったことになる。

比較ステップ５５において、FP(v_is ^k)が所定の閾値T_minより小さければ、正しい候補透かしシンボルisがみつかったと想定され、計算時間節約のために両方のループを抜け、その透かしシンボルが出力される。

図６は、長さNの例示的な相関結果および描かれているk＝1,2,3の三つの長さLの窓を示している。それぞれの長さLの窓はN個の相関結果値におけるピークのまわりに配置されている。N内の最初の可能な長さLの窓の位置はj＝1であり、最後の可能な長さLの窓の位置はj＝N−L＋1である。

本発明の処理は、単一のプロセッサまたは電子回路によって、あるいは並列して動作するおよび／または本発明の異なる部分に対して動作するいくつかのプロセッサまたは電子回路によって実行されることができる。

Claims

エコー、残響および／またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別する方法であって、
・前記受領オーディオ信号のセクションの、対応する異なる候補透かしシンボルisに関係した少なくとも二つの異なる候補参照パターン信号との相関を調べ、各候補透かしシンボルisについてそれぞれの場合にN個の相関結果値

を生成するステップと、
・各候補透かしシンボルisについて、前記相関結果値c_is内のM個のピーク値を決定するステップとを含んでおり、
・グローバル・ピーク値と記される前記M個のピーク値のそれぞれについておよび各候補透かしシンボルisについて、前記相関結果値c_isから、長さLのM個の窓のそれぞれの中のn_p個のピーク値の対応するベクトル

を決定するステップであって、各長さLの窓は前記M個のグローバル・ピーク値のうちの一つを含み、長さLの窓全部の合計長さはNより小さく、k＝1,…,Mである、ステップと、
・長さLの前記M個の窓のそれぞれについて、ピーク値の前記ベクトルv_is ^kおよび透かし入れされていないオーディオ信号についての相関結果値についての平均のまたは期待される確率分布に基づいて、偽陽性確率値

を計算するステップであって、前記偽陽性確率FP(v_isk)は、一回または複数回、そのような長さLの窓が、透かし入れされていないオーディオ信号コンテンツについての相関値についての平均または期待される確率分布において前記n_p個のピーク値より大きいまたはそれに等しいn_p個以上の相関結果絶対値を含むを含む確率として定義される、ステップと、
・前記受領オーディオ信号の前記セクションについて、最小の偽陽性確率値min_is(min_k(FP(v_is ^k)))をもつ候補透かしシンボルisを、該最小の偽陽性確率値min_is(min_k(FP(v_is ^k)))が所定の閾値（T_max）より小さい場合には、検出された透かしシンボルとして選択し、そうでない場合には透かしシンボルが検出されなかったと想定するステップとを特徴とする、
方法。
前記偽陽性確率FP(v_is ^k)値の前記計算において、その値がさらなる所定の閾値（T_min）より小さい場合には、正しい候補透かしシンボルisが見つかったと想定され、前記のさらなる処理が省略され、前記所定の閾値（T_max）は前記さらなる所定の閾値（T_min）より大きい、請求項１記載の方法。
M＝3である、請求項１または２記載の方法。
二つの異なる候補透かしシンボルがある、請求項１ないし３のうちいずれか一項記載の方法。
エコー、残響および／またはノイズを含みうる受領オーディオ信号中の透かしシンボルを判別する装置であって、
・前記受領オーディオ信号のセクションの、対応する異なる候補透かしシンボルisに関係した少なくとも二つの異なる候補参照パターン信号との相関を調べ、各候補透かしシンボルisについてそれぞれの場合にN個の相関結果値

を生成するよう適応された手段と、
・各候補透かしシンボルisについて、前記相関結果値c_is内のM個のピーク値を決定し、各候補透かしシンボルisについての前記M個の相関結果ピーク値から導出されて、前記受領オーディオ信号の前記セクションについて、前記候補透かしシンボルisのうちの透かしシンボルを決定するよう適応された手段とを含んでおり、
グローバル・ピーク値と記される前記M個のピーク値のそれぞれについておよび各候補透かしシンボルisについて、前記相関結果値c_isから、長さLのM個の窓のそれぞれの中のn_p個のピーク値の対応するベクトル

が決定され、各長さLの窓は前記M個のグローバル・ピーク値のうちの一つを含み、長さLの窓全部の合計長さはNより小さく、k＝1,…,Mであり、
長さLの前記M個の窓のそれぞれについて、ピーク値の前記ベクトルv_is ^kおよび透かし入れされていないオーディオ信号についての相関結果値についての平均のまたは期待される確率分布に基づいて、偽陽性確率値

が計算され、ここで、前記偽陽性確率FP(v_isk)は、一回または複数回、そのような長さLの窓が、透かし入れされていないオーディオ信号コンテンツについての相関値についての平均または期待される確率分布において前記n_p個のピーク値より大きいまたはそれに等しいn_p個以上の相関結果絶対値を含むを含む確率として定義され、
前記受領オーディオ信号の前記セクションについて、最小の偽陽性確率値min_is(min_k(FP(v_is ^k)))をもつ候補透かしシンボルisが、該最小の偽陽性確率値min_is(min_k(FP(v_is ^k)))が所定の閾値（T_max）より小さい場合には、検出された透かしシンボルとして選択され、
そうでない場合には透かしシンボルが検出されなかったと想定される、
装置。
前記偽陽性確率FP(v_is ^k)値の前記計算において、その値がさらなる所定の閾値（T_min）より小さい場合には、正しい候補透かしシンボルisが見つかったと想定され、前記のさらなる処理が省略され、前記所定の閾値（T_max）は前記さらなる所定の閾値（T_min）より大きい、請求項５記載の装置。
M＝3である、請求項５または６記載の装置。
二つの異なる候補透かしシンボルがある、請求項５ないし７のうちいずれか一項記載の装置。