JP5665886B2 - バイナリーメッセージデータを提供するウォーターマーク復号器および方法 - Google Patents
バイナリーメッセージデータを提供するウォーターマーク復号器および方法 Download PDFInfo
- Publication number
- JP5665886B2 JP5665886B2 JP2012554326A JP2012554326A JP5665886B2 JP 5665886 B2 JP5665886 B2 JP 5665886B2 JP 2012554326 A JP2012554326 A JP 2012554326A JP 2012554326 A JP2012554326 A JP 2012554326A JP 5665886 B2 JP5665886 B2 JP 5665886B2
- Authority
- JP
- Japan
- Prior art keywords
- time
- frequency
- synchronization
- watermarked signal
- domain representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 75
- 230000002123 temporal effect Effects 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 description 53
- 230000007480 spreading Effects 0.000 description 32
- 238000004458 analytical method Methods 0.000 description 24
- 238000012545 processing Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 20
- 230000000873 masking effect Effects 0.000 description 18
- 238000007493 shaping process Methods 0.000 description 16
- 230000001360 synchronised effect Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 10
- 101100368149 Mus musculus Sync gene Proteins 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 9
- 238000010606 normalization Methods 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000005311 autocorrelation function Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000009499 grossing Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000009792 diffusion process Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012806 monitoring device Methods 0.000 description 2
- 230000010363 phase shift Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 101100289792 Squirrel monkey polyomavirus large T gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Editing Of Facsimile Originals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
図24は、本発明の一実施形態に従い、ウォーターマーク済み信号2402に基づいてバイナリーメッセージデータ2442を提供するウォーターマーク復号器2400のブロック図を示す。このウォーターマーク復号器2400は、時間−周波数−ドメイン表現提供器2410と、メモリーユニット2420と、同期決定器2430と、ウォーターマーク抽出器2440とを含む。時間−周波数−ドメイン表現提供器2410は、同期決定器2430とメモリーユニット2420とに接続されている。さらに、同期決定器2430とメモリーユニット2420とは、ウォーターマーク抽出器2440に接続されている。時間−周波数−ドメイン表現提供器2410は、複数の時間ブロックについてウォーターマーク済み信号2402の周波数−ドメイン表現2412を提供する。メモリーユニット2420は、複数の時間ブロックについてのウォーターマーク済み信号2402の周波数−ドメイン表現2412を記憶する。更に、同期決定器2430は、複数の時間ブロックについてのウォーターマーク済み信号2402の周波数−ドメイン表現2412に基づいて、整列時間ブロック2432を識別する。ウォーターマーク抽出器2440は、識別された整列時間ブロック2432よりも時間的に先行する時間ブロックのウォーターマーク済み信号2402の記憶された周波数−ドメイン表現2422に基づいて、識別された整列時間ブロック2432までの距離を考慮して、バイナリーメッセージデータ2442を提供する。
図25は、本発明の一実施形態に従うウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法2500のフローチャートを示す。この方法2500は、ウォーターマーク済み信号の複数の時間ブロックについての周波数−ドメイン表現を提供するステップ2510と、そのウォーターマーク済み信号の複数の時間ブロックについての周波数−ドメイン表現を記憶するステップ2520と、を含む。更に、この方法2500は、ウォーターマーク済み信号の複数の時間ブロックについての周波数−ドメイン表現に基づいて整列時間ブロックを識別するステップ2530と、その識別された整列時間ブロックよりも時間的に先行する時間ブロックのウォーターマーク済み信号の記憶された周波数−ドメイン表現に基づいて、その識別された整列時間ブロックへの距離を考慮しながら、バイナリーメッセージデータを提供するステップ2540とを含む。
以下に、ウォーターマーク挿入器とウォーターマーク復号器とを含む、ウォーターマーク伝送のためのシステムについて説明する。当然ながら、ウォーターマーク挿入器とウォーターマーク復号器とは、互いに独立して使用されても良い。
図3はウォーターマーク生成器101の詳細を示す。オーディオ信号106の中に隠されるべき(±1として示される)バイナリーデータ101aが、ウォーターマーク生成器101へと入力される。ブロック301はデータ101aを同一長Mpを持つパケットに整える。信号化の目的で、各パケットに対してオーバーヘッド・ビットが(例えば付加される状態で)加えられる。ここでは、Msがそれらオーバーヘッド・ビットの数を示すことにする。それらの使用方法は第3.5章において詳細に説明する。以下の説明においては、ペイロード・ビットの各パケット及び信号オーバーヘッド・ビットが、ここで云うメッセージであることに留意されたい。
結合済み情報同期表現Cと考えられても良いブロック304の出力304aは、
となり、ここで、〇はシュール要素毎の積(Schur element-wise product)を示し、
となる。
となり、ここで、◇と上付き文字Tとは、クロネッカーの積(Kronecker product)と転値(transpose)とをそれぞれ示す。バイナリーデータは±1として表現されることを思い出して頂きたい。
ここで、γ(i;j)は聴覚心理処理ユニット102によって提供される重み付けファクタであり、Tbはビットの時間区間であり、gi(t)はi番目のサブバンドについてのビット形成関数である。ビット形成関数は、次式のコサインを用いて周波数変調されたベースバンド関数gi T(t)から得られたものであり、
ここで、fiはi番目のサブバンドの中央周波数であり、上付き文字Tは送信機を表している。ベースバンド関数は各サブバンドについて異なっていても良い。もし同一であると選択された場合には、復号器においてより効果的な構成が可能となる。詳細については、第3.3章を参照されたい。
図5に示すように、聴覚心理処理モジュール102は3つの部分から成る。第1のステップは分析モジュール501であり、時間オーディオ信号を時間/周波数ドメインへと変換する。この分析モジュールは、異なる時間/周波数分解能で並行分析を実行しても良い。この分析モジュールの次に、時間/周波数データは聴覚心理モデル(PAM)502へと送られる。ここでは、ウォーターマーク信号のためのマスキング閾値が聴覚心理的な考察(非特許文献1を参照)に従って計算される。そのマスキング閾値は、各サブバンド及び時間ブロックのためのオーディオ信号の中に隠すことができるエネルギーの量を示す。聴覚心理処理モジュール102の最後のブロックは、振幅計算モジュール503である。このモジュールは、マスキング閾値が満足されるように、即ち埋め込まれたエネルギーがマスキング閾値によって定義されるエネルギー以下になるように、ウォーターマーク信号の生成に使用されるべき振幅ゲインを決定する。
ブロック501は、オーディオ信号の時間/周波数変換をラップされた変換を用いて実行する。多数の時間/周波数分解能が実行されたときに、最高のオーディオ品質が達成される。ラップされた変換の1つの効果的な実施例は短時間フーリエ変換(STFT)であり、これは窓処理された時間ブロックの高速フーリエ変換(FFT)に基づくものである。窓の長さは時間/周波数分解能を決定し、長い窓は低い時間分解能及び高い周波数分解能をもたらし、短い窓は高い時間分解能及び低い周波数分解能をもたらす。他方、窓の形状は周波数漏れなどを決定する。
聴覚心理モデル502は、マスキング閾値を決定するという役割を持つ。即ち、ウォーターマーク済みのオーディオ信号が元の信号から区別できないように維持しながら、各サブバンド及び時間ブロックのためのオーディオ信号の中に隠すことができる、エネルギーの量を決定する。
図9を参照しながら説明する。ブロック503への入力は、聴覚心理に基づく全ての計算を実行する聴覚心理モデル502から出力された閾値505である。この振幅計算器503においては、その閾値を用いた追加的な計算が実行される。第1に、振幅マッピング901が行われる。このブロックは、(通常はエネルギーとして表現される)マスキング閾値を単に振幅へと変換するだけであり、その振幅は、第3.1章で定義したビット成形関数をスケールするために使用できるものである。その後、振幅適応ブロック902が使用される。このブロックは、ウォーターマーク生成器101の中でビット成形関数を乗算するために使用される振幅γ(i,j)を、マスキング閾値が確実に満たされるように繰り返し適応させる。事実、上述したように、ビット成形関数は、通常はTbよりも長い時間区間に亘って延びる。従って、点 i,j においてマスキング閾値を満たす正確な振幅γ(i,j)を乗算することが、点 i, j−1 において必ずしも条件を満たすことにはならない。この点は、前エコーが可聴になるため、強いオンセットにおいては特に重大である。回避すべきもう一つの状況は、異なるビットの尾部が不運にも重畳し、可聴のウォーターマークをもたらすことである。そのため、ブロック902はウォーターマーク生成器によって生成された信号を分析し、閾値が満たされたかどうかをチェックする。もし満たされていない場合には、振幅γ(i,j)を適切に修正する。
分析モジュール203はウォーターマーク抽出処理の最初のステップ(又はブロック)である。その目的は、ウォーターマーク済みのオーディオ信号200aを、(符号204でも示される)Nf 個のビットストリーム
(各スペクトルサブバンドiについて1個ずつ)へと戻し変換することである。これらには、同期モジュール201及びウォーターマーク抽出器202により、第3.4章及び第3.5章でそれぞれ説明するように、更なる処理が施される。
はソフト・ビットストリームであり、即ち、それらは例えばいかなる実数値をとることもでき、ビットに関する硬判定(hard decision)が未だ行なわれていないことに注意すべきである。
ウォーターマーク済みのオーディオ信号は、図10aにその詳細を示す分析フィルタバンク1600によって、時間−周波数−ドメインへと変換される。このフィルタバンクの入力は、受信されたウォーターマーク済みのオーディオ信号r(t)である。その出力は、時刻jにおけるi番目の分枝又はサブバンドのための複素係数bi AFB(j)である。これらの値は、中央周波数fi及び時刻j・Tbにおける信号の振幅と位相についての情報を含む。
ここで、*は畳み込みを示し、gi R(t)はサブバンドiの受信器低域通過フィルタのインパルス応答を示す。通常は、マッチされたフィルタ条件を満たすために、gi R(t)i(t)は変調器307内のサブバンドiのベースバンドビット形成関数gi T(t)に等しいが、他のインパルス応答も可能である。
一般化を損なわずかつ説明を簡素化する目的で、以下においてはビット同期が既知でありかつNos=1であると仮定する。つまり、正規化ブロック1604の入力においては複素の係数bi AFB(j)を持つ。受信器においてはチャネル状態の情報が何もない(即ち伝播チャネルが既知でない)ために、等利得合成(equal gain combining: EGC)スキームが使用される。時間および周波数の分散的なチャネルに起因して、送られたビットbi(j)のエネルギーは、中央周波数fi及び時刻jの周囲だけではなく、隣接する周波数および時刻においても見つけられる。従って、より精確な重み付けのために、周波数fi±nΔf における追加的な係数が計算され、係数bi AFB(j)の正規化のために使用される。もしn=1であるならば、例えば次式となる。
差分符号化ブロック1608には、周波数fi及び時刻jにおける信号要素の位相についての情報を含む、振幅正規化された複素係数bi norm(j)が入力される。ビットは送信機において差分符号化されているため、ここでは逆の操作が実行されなければならない。ソフトビット
は、まず2つの連続する係数の位相における差異を計算し、次に、その実数部分を取ることで得られる。
同期モジュールの役割は、ウォーターマークの時間的同期を見つけることである。符号化済みのデータに対して復号器を同期化する問題は、2つのステップで構成される。第1のステップでは、分析フィルタバンクは符号化済みのデータに対して整列しなければならない。即ち、変調器の中で合成に使用されるビット成形関数gi T(t)は、分析のために使用されたフィルタgi R(t)と整列しなければならない。この問題は図12aに示す。ここでは、分析フィルタは合成フィルタと同一である。図の上方において、3個のビットを示す。簡素化する目的で、これら全3個のビットのための波形はスケールされていない。異なるビットの間の時間的オフセットはTbである。図の下方は、復号器における同期の問題を表している。即ち、フィルタは異なる時刻で適用可能であるが、しかし、太線(曲線1299a)で示された位置だけが正確であり、第1のビットを最高の信号対雑音比SNRと信号対干渉比SIRとを用いて抽出することが可能となる。事実、不正確な整列はSNRとSIRとの両方を低下させるおそれがある。ここでは、この第1の整列を「ビット同期」と呼ぶ。一旦ビット整列が達成されたならば、ビットは最適に抽出される。しかし、メッセージを正確に復号化するためには、どのビットにおいて新たなメッセージがスタートするかについて知ることが必要となる。この問題については図12bにおいて示し、メッセージ同期と呼ぶ。復号化されたビットのストリームの中では、太い矢印(位置1299b)で示されたスタート位置だけが正確であり、k番目のメッセージを復号化することが可能である。
Nsbl個の同期位置の候補の各々について、同期署名コリレータが尤度を計算する。その尤度が大きければ大きい程、(ビット同期と部分又は全体メッセージ同期との両方の)時間的整列が見つかった可能性が高くなる。この処理ステップを図12gで示す。
このブロックは同期署名コリレータの出力を分析し、同期位置がどこにあるのかを決定する。このシステムがTb/4までのミス整列に対して相当にロバストであり、Tbが通常は約40ミリ秒であることから、ブロック1201の出力を時間に亘って積分し、より安定的な同期を達成することが可能である。この実施例として可能性のあるものは、時間に沿って適用され、インパルス応答を指数関数的に減衰させる、IIR(無限インパルス応答)フィルタである。代替的に、伝統的なFIR移動平均フィルタも使用できる。平均化が一旦実行されると、異なるNt・Nsに沿った第2のコリレーション(「異なる選択位置」)が実行される。実際には、同期関数の自己相関関数が既知であるという情報を活用する。これが、最尤推定量(Maximun Likelihood estimator)に対応する。この考え方を図13cに示す。この曲線は、時間積分後のブロック1201の出力を示す。同期ヒットを決定するための1つの可能性のある方法は、この関数の最大値を見つけることである。図13dには、図13cと同じ関数を細線で示し、同期署名の自己相関関数でフィルタ処理された関数を太線で示す。この場合、最大値がより明確化され、同期ヒットの位置が明確になる。2つの方法の結果は高いSNRの状況下では相当に類似しているが、低いSNRの状況下では第2の方法が格段に良好である。同期ヒットが発見された後は、ウォーターマーク抽出器202へと送られ、そこでデータが復号化される。
ウォーターマーク抽出器202を構成する部分について図14を参照しながら説明する。この抽出器は2つの入力、即ちブロック203からの入力204とブロック201からの入力205とを持つ。同期モジュール201(第3.4章を参照)は同期タイムスタンプ、即ち候補メッセージがスタートする時間ドメインの位置を提供する。この点については、第3.4章でより詳細に説明している。他方、分析フィルタバンク・ブロック203は、復号化される準備が整ったデータを時間/周波数ドメインで提供する。
ペイロードを符号化するために、例えばビタビ・アルゴリズムを使用しても良い。図18aは、ペイロード1810と、ビタビ終端シーケンス1820と、ビタビ符号化済みペイロード1830と、ビタビ符号化済みペイロードの反復符号化されたバージョン1840とを図式的に示す。例えば、ペイロード長は34ビットであり、ビタビ終端シーケンスは6ビットを含んでも良い。もし、例えば1/7のビタビ符号レートを使用した場合、ビタビ符号化済みペイロードは(34+6)*7=280個のビットを含むことになる。更に、1/2の反復符号化を使用すれば、ビタビ符号化済みペイロード1830の反復符号化されたバージョン1840は、280*2=560個のビットを含むことになる。この例では、42.66ミリ秒のビット時間区間を考慮すれば、メッセージ長は23.9秒となる。この信号は、図18bに示す周波数スペクトルによって表されるような、例えば1.5〜6kHzの(例えば臨界帯域に従って配置された)9個のサブキャリアを用いて埋め込んでも良い。代替的に、0〜20kHzの周波数範囲内の他の個数(例えば4,6,12,15又は2〜20の間の数)のサブキャリアが使用されても良い。
以下に、上述したシステムの幾つかの態様であって革新的であると考えられるものについて説明する。また、それらの態様と現状の技術との関係についても説明する。
幾つかの実施形態は連続的な同期を可能にする。ここでは同期署名とも呼ぶ同期信号は、伝送及び受信側の両方にとって既知である(同期拡散シーケンスとも呼ばれる)シーケンスとの乗算によって、連続的かつデータに並行して埋め込まれる。
本発明が提案するシステムの幾つかの実施形態では、時間と周波数との両方のドメインにおける拡散、即ち2次元拡散(略称は2D拡散)を実行する。この方法は、例えば時間ドメインにおいて冗長性を追加することでビット誤差レートを更に減少できるために、1Dシステムよりも有利であることが分かってきた。
本発明に従う幾つかの実施形態では、移動又はローカルな発振器の周波数ミスマッチに対する(従来システムと比べた場合の)ロバスト性が、差分変調によってもたらされる。事実、ドップラー効果(移動)及び周波数のミスマッチは、BPSK(バイナリー位相シフト・キーイング)信号空間(constellation)(換言すればビットの複素平面における回転)をもたらす。幾つかの実施形態においては、そのようなBPSK信号空間(又は他の適切な変調信号空間)の回転の有害な影響は、差分符号化または差分復号化を用いて防止される。
本発明の幾つかの実施形態においては、ビット成形によってシステム性能が有意に向上する。なぜなら、ビット成形に適応したフィルタを使用することで、検出の信頼性が向上するからである。
本発明の幾つかの実施形態においては、ビットに乗算される振幅を微調整するために、聴覚心理モデルと変調器とが相互に作用する。
幾つかの実施形態においては、所謂「ルックバック」及び「ルックアヘッド」の手法が適用される。
本発明の幾つかの実施形態においては、ロバストな同期信号を得るために、短い同期署名を用いた部分メッセージ同期モードで同期が実行される。そのため、多くの復号化が実行されなければならなくなり、また偽陽性のメッセージ検出を冒すリスクが高まってしまう。これを防止するため、本発明の幾つかの実施形態では、より低いビットレートを持つメッセージの中に信号化シーケンスを挿入しても良い。
以下に、背景技術との比較における、上述したシステムの他の一般的な優位点について説明する。
1. 計算上の低い複雑度
2. 良好な聴覚心理モデルに基づく良好なオーディオ品質
3. 狭帯域マルチキャリア信号に基づいた残響環境における良好なロバスト性
4. SNR推定が省略される実施形態もある。この場合、特に低いSNR環境においてより良好なロバスト性が得られる。
1. 8Hzの帯域(又は同様の非常に狭い帯域)は非常に長い時間シンボルを必要とする。なぜなら、聴覚心理モデルはシンボルを非可聴とするためのエネルギーを非常に僅かしか許可しないからである。
2. 8Hz(又は同様の非常に狭い帯域)は、経時的に変化するドップラースペクトルに対してシンボルを敏感にする。従って、そのような狭帯域システムは、例えば腕時計の中などに実装された場合に、一般的に十分良好とは云えない。
1. エコーを導入する技術は、残響室の中では完全に失敗となる。反対に、本発明の幾つかの実施形態では、エコーの導入を防止できる。
2. 例えば時間と周波数との両方における2次元拡散が使用されるような、上述した本発明のシステムの実施形態と比較すれば、時間拡散だけを使用する技術では、メッセージ持続時間が長くなる。
・ 特許文献1に従う復号器の複雑度は非常に高く、長さ2Nで、N=128であるフィルタが使用されている。
・ 特許文献1に従うシステムは、長いメッセージ持続時間を持つ。
・ 特許文献1に従うシステムでは、比較的高い拡散ゲイン(例えば128)を用いた時間ドメインでの拡散だけである。
・ 特許文献1に従うシステムでは、信号は時間ドメインで生成され、スペクトルドメインへと変換され、重み付けされ、時間ドメインへと逆変換され、オーディオへと重畳される。そのため、システムが非常に複雑となる。
本発明は、デジタルデータを隠すためにオーディオ信号を修正する方法と、この情報を回復できる対応する復号器とを含み、修正されたオーディオ信号の知覚品質が、元のオーディオ信号の知覚品質と区別できないものである。
1. 放送モニタリング: 例えばステーションや時間に関する情報を含むウォーターマークが、ラジオ番組やテレビ番組のオーディオ信号の中に隠されている。テスト被験者が身につけた小型装置の中に組み込まれた復号器が、そのウォーターマークを回復することができる。このようにして、広告業者にとって価値のある情報、即ち誰がどの番組をいつ見たのかという情報を収集する。
2. 監査(Auditing):ウォーターマークが例えば広告などに隠される。所定のステーションの伝送状況を自動的にモニターすることで、いつその広告が放送されたかを正確に知ることができる。同様の方法で、異なるラジオの番組スケジュールについての統計的情報、例えば所定の楽曲がどのくらいの頻度で演奏されたかなどの情報を取り出すことができる。
3. メタデータの埋め込み:本発明が提案する方法は、楽曲又は番組についてのデジタル情報、例えば楽曲の名前や作者または番組の持続時間などを隠すために使用できる。
本発明の幾つかの態様を装置の文脈において説明してきたが、これらの態様は対応する方法の説明をも表すものであり、そこではブロックまたは装置が、方法の各段階または方法の各段階の特徴に相当することが明らかである。同様に、方法の各段階の文脈において説明した態様は、対応する装置の対応するブロック若しくは項目又は特徴の説明をも表すものである。上述した方法ステップの幾つか又は全ては、例えばマイクロプロセッサ、プログラム可能なコンピュータ又は電子的回路のような、ハードウエア装置(又はその使用)によって実行されても良い。幾つかの実施形態では、重要な方法ステップの1つ又は複数がそのような装置によって実行されても良い。
Claims (12)
- ウォーターマーク済み信号(2402)に基づいてバイナリーメッセージデータ(2442)を提供するウォーターマーク復号器(2400)であって、
前記ウォーターマーク済み信号(2402)の複数の時間ブロックについての周波数−ドメイン表現(2412)を提供する時間−周波数−ドメイン表現提供器(2410)と、
前記ウォーターマーク済み信号(2402)の複数の時間ブロックについての周波数−ドメイン表現(2412)を記憶するメモリーユニット(2420)と、
前記ウォーターマーク済み信号(2402)の複数の時間ブロックについての周波数−ドメイン表現(2412)に基づいて整列時間ブロック(2432)を識別する同期決定器(2430)と、
識別された前記整列時間ブロック(2432)よりも時間的に先行する時間ブロックの前記ウォーターマーク済み信号(2402)の記憶された周波数−ドメイン表現(2422)に基づいて、前記識別された整列時間ブロック(2432)への時間的距離又は時間ブロックの数を考慮して、バイナリーメッセージデータ(2442)を提供するウォーターマーク抽出器(2440)と、
を含むウォーターマーク復号器。 - 前記識別された整列時間ブロック(2432)を含むメッセージよりも時間的に先行する前記ウォーターマーク済み信号(2402)の不完全なメッセージのバイナリーメッセージデータ(2442)を、前記不完全なメッセージの冗長なデータを使用して提供する冗長性復号器を含む、請求項1に記載のウォーターマーク復号器。
- 前記同期決定器(2430)は、複数の所定の同期シーケンスに基づき、かつ前記ウォーターマーク済み信号(2402)のメッセージのバイナリーメッセージデータに基づいて、前記整列時間ブロック(2432)を識別するものであり、前記ウォーターマーク済み信号(2402)の前記メッセージに含まれた時間ブロックの数が前記複数の所定の同期シーケンスに含まれた異なる所定の同期シーケンスの数よりも大きいことを特徴とする、請求項1又は2に記載のウォーターマーク復号器。
- 前記同期シーケンスの1つは、前記ウォーターマーク済み信号(2402)の周波数−ドメイン表現(2412)の各周波数帯域係数について1つの同期ビットを含むことを特徴とする、請求項3に記載のウォーターマーク復号器。
- 提供された前記バイナリーメッセージデータ(2442)は、前記整列時間ブロック(2432)を含むメッセージよりも時間的に先行する前記ウォーターマーク済み信号(2402)のメッセージのコンテンツを表現することを特徴とする、請求項1乃至4のいずれか1項に記載のウォーターマーク復号器。
- 前記ウォーターマーク抽出器(2440)は、前記識別された整列時間ブロック(2432)に時間的に後続する時間ブロックの前記ウォーターマーク済み信号(2402)の周波数−ドメイン表現(2412)に基づいて、前記識別された整列時間ブロック(2432)への時間的距離又は時間ブロックの数を考慮しながら、更なるバイナリーメッセージデータを提供することを特徴とする、請求項1乃至5のいずれか1項に記載のウォーターマーク復号器。
- 前記メモリーユニット(2420)は、所定の記憶時間後に、消去または上書きのために、前記ウォーターマーク済み信号(2402)の記憶された周波数−ドメイン表現を含むメモリースペースを解放することを特徴とする、請求項1乃至6のいずれか1項に記載のウォーターマーク復号器。
- 前記メモリーユニット(2420)は、前記ウォーターマーク済み信号(2402)の記憶された周波数−ドメイン表現から前記ウォーターマーク抽出器(2440)がバイナリーメッセージデータを取得した後に、消去または上書きのために、前記ウォーターマーク済み信号(2402)の記憶された周波数−ドメイン表現を含むメモリースペースを解放することを特徴とする、請求項1乃至7のいずれか1項に記載のウォーターマーク復号器。
- ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法(2500)であって、
前記ウォーターマーク済み信号の複数の時間ブロックについての周波数−ドメイン表現を提供するステップ(2510)と、
前記ウォーターマーク済み信号の複数の時間ブロックについての周波数−ドメイン表現を記憶するステップ(2520)と、
前記ウォーターマーク済み信号の複数の時間ブロックについての周波数−ドメイン表現に基づいて整列時間ブロックを識別するステップ(2530)と、
識別された前記整列時間ブロックよりも時間的に先行する時間ブロックの前記ウォーターマーク済み信号の記憶された周波数−ドメイン表現に基づいて、前記識別された整列時間ブロックへの時間的距離又は時間ブロックの数を考慮しながら、バイナリーメッセージデータを提供するステップ(2540)と、
を含む方法。 - コンピュータ上で作動したときに、請求項9に記載の方法を実行させるためのコンピュータプログラム。
- ウォーターマーク済み信号(2402)に基づいてバイナリーメッセージデータ(2442)を提供するウォーターマーク復号器(2400)であって、
前記ウォーターマーク済み信号(2402)の複数の時間ブロックについての周波数−ドメイン表現(2412)を提供する時間−周波数−ドメイン表現提供器(2410)と、
前記ウォーターマーク済み信号(2402)の複数の時間ブロックについての前記周波数−ドメイン表現(2412)を記憶するメモリーユニット(2420)と、
前記ウォーターマーク済み信号(2402)の複数の時間ブロックについての前記周波数−ドメイン表現(2412)に基づいて、整列時間ブロック(2432)を識別する同期決定器(2430)と、
識別された前記整列時間ブロック(2432)よりも時間的に先行する時間ブロックの前記ウォーターマーク済み信号(2402)の記憶された周波数−ドメイン表現(2422)に基づいて、識別された前記整列時間ブロック(2432)までの時間的距離又は時間ブロックの数を考慮しながら、バイナリーメッセージデータ(2442)を提供し、前記整列時間ブロック(2432)の識別による同期が有効となる前に受け取られたメッセージのバイナリーメッセージデータを利用する、ウォーターマーク抽出器(2440)と、
を含むウォーターマーク復号器。 - ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法(2500)であって、
前記ウォーターマーク済み信号の複数の時間ブロックについての周波数−ドメイン表現を提供するステップ(2510)と、
前記ウォーターマーク済み信号の複数の時間ブロックについての前記周波数−ドメイン表現を記憶するステップ(2520)と、
前記ウォーターマーク済み信号の複数の時間ブロックについての前記周波数−ドメイン表現に基づいて、整列時間ブロックを識別するステップ(2530)と、
識別された前記整列時間ブロックよりも時間的に先行する時間ブロックの前記ウォーターマーク済み信号の記憶された周波数−ドメイン表現に基づいて、識別された前記整列時間ブロックまでの時間的距離又は時間ブロックの数を考慮しながら、バイナリーメッセージデータを提供するステップ(2540)であり、前記整列時間ブロックの識別による同期が有効となる前に受け取られたメッセージのバイナリーメッセージデータを利用するステップと、
を含む方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP10154951A EP2362383A1 (en) | 2010-02-26 | 2010-02-26 | Watermark decoder and method for providing binary message data |
EP10154951.7 | 2010-02-26 | ||
PCT/EP2011/052627 WO2011104246A1 (en) | 2010-02-26 | 2011-02-22 | Watermark decoder and method for providing binary message data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013529311A JP2013529311A (ja) | 2013-07-18 |
JP5665886B2 true JP5665886B2 (ja) | 2015-02-04 |
Family
ID=42315855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012554326A Active JP5665886B2 (ja) | 2010-02-26 | 2011-02-22 | バイナリーメッセージデータを提供するウォーターマーク復号器および方法 |
Country Status (17)
Country | Link |
---|---|
US (1) | US9299356B2 (ja) |
EP (2) | EP2362383A1 (ja) |
JP (1) | JP5665886B2 (ja) |
KR (1) | KR101411657B1 (ja) |
CN (1) | CN102959621B (ja) |
AU (1) | AU2011219842B2 (ja) |
BR (1) | BR112012021542B8 (ja) |
CA (1) | CA2790969C (ja) |
ES (1) | ES2440970T3 (ja) |
HK (1) | HK1177651A1 (ja) |
MX (1) | MX2012009856A (ja) |
MY (1) | MY152218A (ja) |
PL (1) | PL2524373T3 (ja) |
RU (1) | RU2586845C2 (ja) |
SG (1) | SG183465A1 (ja) |
WO (1) | WO2011104246A1 (ja) |
ZA (1) | ZA201207152B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2565667A1 (en) | 2011-08-31 | 2013-03-06 | Friedrich-Alexander-Universität Erlangen-Nürnberg | Direction of arrival estimation using watermarked audio signals and microphone arrays |
JP6574551B2 (ja) | 2014-03-31 | 2019-09-11 | 培雄 唐沢 | 音響を用いた任意信号の伝達方法 |
CN106409301A (zh) * | 2015-07-27 | 2017-02-15 | 北京音图数码科技有限公司 | 数字音频信号处理的方法 |
KR102637177B1 (ko) * | 2018-05-23 | 2024-02-14 | 세종대학교산학협력단 | 워터마크 기반의 이미지 무결성 검증 방법 및 장치 |
US11397241B2 (en) * | 2019-10-21 | 2022-07-26 | Hossein Ghaffari Nik | Radio frequency life detection radar system |
RU2767962C2 (ru) | 2020-04-13 | 2022-03-22 | Общество С Ограниченной Ответственностью «Яндекс» | Способ и система для распознавания воспроизведенного речевого фрагмента |
US11915711B2 (en) * | 2021-07-20 | 2024-02-27 | Direct Cursus Technology L.L.C | Method and system for augmenting audio signals |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02206233A (ja) * | 1989-02-03 | 1990-08-16 | Fujitsu Ltd | 移動端末データモニタ方式 |
FR2681997A1 (fr) | 1991-09-30 | 1993-04-02 | Arbitron Cy | Procede et dispositif d'identification automatique d'un programme comportant un signal sonore. |
EP0688487B1 (en) | 1992-11-16 | 2004-10-13 | Arbitron Inc. | Method and apparatus for encoding/decoding broadcast or recorded segments and monitoring audience exposure thereto |
US7316025B1 (en) | 1992-11-16 | 2008-01-01 | Arbitron Inc. | Method and apparatus for encoding/decoding broadcast or recorded segments and monitoring audience exposure thereto |
HU219667B (hu) | 1994-03-31 | 2001-06-28 | The Arbitron Company | Berendezés és eljárás kód-frekvenciaösszetevőkkel rendelkező kódnak audiojel-frekvenciaösszetevőkkel rendelkező audiojelbe való beillesztésére |
US5450490A (en) | 1994-03-31 | 1995-09-12 | The Arbitron Company | Apparatus and methods for including codes in audio signals and decoding |
DE19640825C2 (de) | 1996-03-07 | 1998-07-23 | Fraunhofer Ges Forschung | Codierer zur Einbringung eines nicht hörbaren Datensignals in ein Audiosignal und Decodierer zum decodieren eines nicht hörbar in einem Audiosignal enthaltenen Datensignals |
EP0875107B1 (de) | 1996-03-07 | 1999-09-01 | Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer |
US20050147248A1 (en) | 2002-03-28 | 2005-07-07 | Koninklijke Philips Electronics N.V. | Window shaping functions for watermarking of multimedia signals |
JP4070742B2 (ja) * | 2003-04-17 | 2008-04-02 | マークテック・インコーポレイテッド | オーディオファイルとテキストを同期化させる同期信号の埋込/検出方法及び装置 |
EP1898396A1 (en) | 2006-09-07 | 2008-03-12 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for encoding/decoding symbols carrying payload data for watermarking of an audio or video signal |
DE102008014311A1 (de) * | 2008-03-14 | 2009-09-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Einbetter zum Einbetten eines Wasserzeichens in eine Informationsdarstellung, Detektor zum Detektieren eines Wasserzeichens in einer Informationsdarstellung, Verfahren, Computerprogramm und Informationssignal |
JP5338170B2 (ja) * | 2008-07-18 | 2013-11-13 | ヤマハ株式会社 | 電子透かし情報の埋め込みおよび抽出を行う装置、方法およびプログラム |
-
2010
- 2010-02-26 EP EP10154951A patent/EP2362383A1/en not_active Withdrawn
-
2011
- 2011-02-22 BR BR112012021542A patent/BR112012021542B8/pt not_active IP Right Cessation
- 2011-02-22 CN CN201180020595.1A patent/CN102959621B/zh active Active
- 2011-02-22 SG SG2012062600A patent/SG183465A1/en unknown
- 2011-02-22 ES ES11704464.4T patent/ES2440970T3/es active Active
- 2011-02-22 PL PL11704464T patent/PL2524373T3/pl unknown
- 2011-02-22 RU RU2012140756/08A patent/RU2586845C2/ru active
- 2011-02-22 MY MYPI2012003790 patent/MY152218A/en unknown
- 2011-02-22 MX MX2012009856A patent/MX2012009856A/es active IP Right Grant
- 2011-02-22 WO PCT/EP2011/052627 patent/WO2011104246A1/en active Application Filing
- 2011-02-22 EP EP11704464.4A patent/EP2524373B1/en active Active
- 2011-02-22 JP JP2012554326A patent/JP5665886B2/ja active Active
- 2011-02-22 KR KR1020127024979A patent/KR101411657B1/ko active IP Right Grant
- 2011-02-22 AU AU2011219842A patent/AU2011219842B2/en not_active Ceased
- 2011-02-22 CA CA2790969A patent/CA2790969C/en active Active
-
2012
- 2012-08-20 US US13/589,696 patent/US9299356B2/en active Active
- 2012-09-25 ZA ZA2012/07152A patent/ZA201207152B/en unknown
-
2013
- 2013-05-08 HK HK13105508.9A patent/HK1177651A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
JP2013529311A (ja) | 2013-07-18 |
MY152218A (en) | 2014-08-29 |
KR101411657B1 (ko) | 2014-06-25 |
BR112012021542A2 (pt) | 2017-07-04 |
ES2440970T3 (es) | 2014-01-31 |
AU2011219842A1 (en) | 2012-10-11 |
CA2790969A1 (en) | 2011-09-01 |
CA2790969C (en) | 2018-01-02 |
EP2362383A1 (en) | 2011-08-31 |
US9299356B2 (en) | 2016-03-29 |
CN102959621A (zh) | 2013-03-06 |
PL2524373T3 (pl) | 2014-05-30 |
BR112012021542B8 (pt) | 2022-03-15 |
EP2524373A1 (en) | 2012-11-21 |
RU2012140756A (ru) | 2014-04-10 |
CN102959621B (zh) | 2014-11-05 |
RU2586845C2 (ru) | 2016-06-10 |
ZA201207152B (en) | 2013-06-26 |
EP2524373B1 (en) | 2013-12-11 |
MX2012009856A (es) | 2012-09-12 |
BR112012021542B1 (pt) | 2020-12-15 |
US20130218313A1 (en) | 2013-08-22 |
KR20120112884A (ko) | 2012-10-11 |
SG183465A1 (en) | 2012-09-27 |
HK1177651A1 (en) | 2013-08-23 |
AU2011219842B2 (en) | 2014-08-14 |
WO2011104246A1 (en) | 2011-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5665887B2 (ja) | 改善された同期の概念を使用するウォーターマーク生成器、ウォーターマーク復号器、ウォーターマーク信号を提供する方法、ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法及びコンピュータプログラム | |
KR101411101B1 (ko) | 워터마크 신호 제공 및 워터마크 임베딩 | |
KR101401174B1 (ko) | 워터마크 신호 제공기 및 워터마크 신호 제공 방법 | |
JP5567150B2 (ja) | 差分符号化を用いたウォーターマーク生成器、ウォーターマーク復号器、バイナリーメッセージデータに基づいてウォーターマーク信号を提供する方法、ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法及びコンピュータプログラム | |
JP5665885B2 (ja) | 二次元ビット拡散を用いたウォーターマーク生成器、ウォーターマーク復号器、バイナリーメッセージデータに基づいてウォーターマーク信号を提供する方法、ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法及びコンピュータプログラム | |
JP5665886B2 (ja) | バイナリーメッセージデータを提供するウォーターマーク復号器および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131203 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20140224 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20140303 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5665886 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |