JP2013520693A

JP2013520693A - 透かし信号の供給および透かし埋め込み

Info

Publication number: JP2013520693A
Application number: JP2012554322A
Authority: JP
Inventors: シュテファンヴァブニック; イェルクピッケル; ベルトグレーフェンボッシュ; ベルンハルトグリル; エルンストエーバーライン; ガルドジョヴァンニデル; シュテファンクレーゲロウ; ラインハルトツィツマン; トビアスブリエム; マルコブライリング; ユリアーネボーサム
Original assignee: フラウンホッファー−ゲゼルシャフトツァフェルダールングデァアンゲヴァンテンフォアシュンクエー．ファオ
Priority date: 2010-02-26
Filing date: 2011-02-22
Publication date: 2013-06-06
Anticipated expiration: 2031-02-22
Also published as: EP2539890B1; HK1180446A1; MY152708A; EP2362385A1; ES2443878T3; EP2539890A1; SG183485A1; RU2624549C2; MX2012009778A; KR101411101B1; ZA201207154B; US20130218314A1; AU2011219829A1; KR20120128148A; US8965547B2; JP5548278B2; AU2011219829B2; CN102959622B; CA2791046A1; CN102959622A

Abstract

透かし信号が透かしデータ（２４５０）を示すように、透かし信号がオーディオ信号に付加されるときに、オーディオ信号（２４３０）に隠されることに適している透かし信号（２４４０）を供給するための透かし信号供給装置（２４００）が説明される。透かし信号供給装置は、オーディオ信号のマスキング閾値を決定するための音響心理学的処理装置（２４１０）と、透かしデータの時間離散的表現のサンプル時間間隔（Ｔ_b）で互いに間隔を置かれたサンプル波形整形関数の重ね合わせから透かし信号を生成するための変調装置（２４２０）であって、各サンプル波形整形関数は、マスキング閾値に依存する各振幅重みによって乗算された、時間離散的表現の各サンプルによって振幅重み付けされる変調装置であって、変調装置は、サンプル時間間隔が、サンプル波形整形関数の時間範囲より短く、各振幅重みも、時間において各サンプルに隣接している時間離散的表現のサンプルに依存するように構成される変調装置とを含む。
【選択図】図２４

Description

本発明は、透かし信号を供給し、その透かし信号を使用して透かしを埋め込むための透かし信号供給装置に関する。

多くの技術的応用において、例えば、オーディオ信号、ビデオ信号、グラフィックス、測定量などのような有用なデータまたは「主データ（ｍａｉｎｄａｔａ）」を示している情報または信号に追加の情報を含むことが望ましい。多くの場合、追加の情報がそれが前記データのユーザによって知覚できない方法で主データ（例えばオーディオデータ、表示データ、静止画データ、測定データ、テキストデータ、その他）に密接に結びつくように、追加の情報を含むことが望ましい。また、場合によっては、追加のデータが主データ（例えばオーディオデータ、表示データ、静止画データ、測定データ、その他）から容易に取り除くことができないように、追加のデータを含むことが望ましい。

これは、特にデジタル権利管理を実行することが望まれるアプリケーションにおいてあてはまる。しかしながら、時には、単に有用なデータに実質的に感知できない補助情報を付け加えることが望まれるだけである。例えば、ある場合には、補助情報が、オーディオデータのソース、オーディオデータの内容、オーディオデータに関連した権利などに関する情報を供給するように、オーディオデータに補助情報を付け加えることは、望ましい。

有用なデータまたは「主データ」に追加のデータを埋め込むために、「透かし（ｗａｔｅｒｍａｒｋｉｎｇ）」と呼ばれる構想が使用されうる。透かし構想は、オーディオデータ、静止画データ、表示データ、テキストデータなどのような多くの異なる種類の有用なデータのための文献で述べられている。

以下では、透かし構想が述べられるいくつかの参考文献が与えられる。しかし、更なる詳細のために、透かしに関連した広い分野のテキストブックおよび刊行物についても読み手の注意を引く。

独国特許第１９６４０８１４Ｃ２は、非可聴データ信号をオーディオ信号に取り入れるための符号化方法、および、非可聴形式でオーディオ信号に含まれるデータ信号を復号する方法を示す。非可聴データ信号をオーディオ信号に取り入れるための符号化方法は、オーディオ信号をスペクトル領域に変換することを含む。符号化方法はまた、オーディオ信号のマスキング閾値を決定すること、および疑似雑音信号の供給を含む。符号化方法はまた、周波数拡散データ信号を得るために、データ信号を供給すること、および疑似雑音信号にそのデータ信号を乗算することを含む。符号化方法はまた、拡散データ信号にマスキング閾値で重み付けすること、および、オーディオ信号と重み付けされたデータ信号を重ねることを含む。

加えて、国際公開９３／０７６８９は、非可聴の符号化されたメッセージであり、そのメッセージが放送チャンネルまたは局、番組、および／または正確な日付を識別するメッセージを、番組の音響信号に追加することによって、ラジオ局またはテレビチャンネルにより放送された、または媒体に記録された番組を自動的に識別するための方法および装置を示す。前記文書で述べられた実施形態において、音響信号は、周波数成分を分割することを可能にし、符号化された識別メッセージを形成するために、所定の方法で周波数成分のいくつかのエネルギーを変えることを可能にしているデータ処理装置に、アナログ−デジタル変換器を介して送信される。データ処理装置の出力は、デジタル−アナログ変換器を介して、音響信号を放送するまたは記録するためのオーディオ出力に接続される。前記文書で述べられた他の実施形態において、分離されたバンドのエネルギーがこのように音響信号を符号化するために変えられることができるように、アナログバンドパスは、周波数のバンドを音響信号から分離するために使用される。

米国特許５，４５０，４９０は、オーディオ信号に少なくとも一つの符号周波数成分を有する符号を含むための装置および方法を示す。人間のヒアリングに対して符号周波数成分をマスクするためにオーディオ信号のさまざまな周波数成分の能力は評価され、これらの評価に基づいて、振幅は符号周波数成分に割り当てられる。符号化されたオーディオ信号の符号を検出するための方法と装置も説明される。符号化されたオーディオ信号の符号周波数成分は、予想される符号振幅に基づいて、または、符号成分の周波数を含んでいる可聴周波数の範囲内のノイズ振幅に基づいて検出される。

国際公開９４／１１９８９は、放送または記録されたセグメントを符号化／復号して、それに加えて視聴者公開をモニターするための方法と装置を説明する。放送または記録されたセグメント信号の情報を符号化および復号するための方法と装置が説明される。その文書において説明された実施形態において、視聴者モニタリングシステムは、スペクトラム拡散符号化を使用して、放送または記録されたセグメントのオーディオ信号部分の識別情報を符号化する。モニタリングデバイスは、マイクロホンを介して放送または記録された信号の音響的に再生されたバージョンを受信して、有意な環境ノイズにもかかわらずオーディオ信号部から識別情報を復号して、この情報を格納する。そして、自動的に視聴者のためのダイアリーを供給して、それは中央化された施設に後にアップロードされる。別のモニタリングデバイスは、放送信号の付加情報を復号し、それは中央設備で視聴者ダイアリー情報と整合される。このモニターは、ダイヤルアップ電話線を使用して中央化された施設にデータを同時に送信することができて、スペクトラム拡散技術を使用して符号化されて、第三者から放送信号によって変調された信号を介して、中央化された施設からデータを受信する。

国際公開９５／２７３４９は、オーディオ信号の符号を含み、復号するための装置および方法を説明する。オーディオ信号に少なくとも一つの符号周波数成分を有するコードを含むための装置および方法が説明される。人間のヒアリングに対して符号周波数成分をマスクするためにオーディオ信号のさまざまな周波数成分の能力は評価され、これらの評価に基づいて、振幅は符号周波数成分に割り当てられる。符号化されたオーディオ信号の符号を検出するための方法と装置も説明される。符号化されたオーディオ信号の符号周波数成分は、予想される符号振幅に基づいて、または、符号成分の周波数を含んでいる可聴周波数の範囲内のノイズ振幅に基づいて検出される。

しかしながら、透かし情報をオーディオ信号の時間／周波数スペクトルに挿入するとき、マスキング閾値の下に透かし情報を隠すこと、あるいは、透かし情報にできるだけ多くのエネルギーを割り当てること、しかるに復号側での抽出量を増加させることと、透かしを入れたオーディオ信号を再生するときに埋め込まれている透かし情報を非可聴に保つこととの間の最適トレードオフを見つけることは困難である。

独国特許第１９６４０８１４Ｃ２国際公開９３／０７６８９米国特許５，４５０，４９０国際公開９４／１１９８９国際公開９５／２７３４９

この状況を考慮して、透かし信号の抽出量と非可聴性とのより良いトレードオフを可能にする、透かし信号を供給するための方式とその透かし信号を使用して透かしを埋め込むための方式を提供することが、本発明の目的である。

この目的は、請求項１に記載の透かし信号供給装置、請求項８に記載の透かし埋め込み装置、請求項９または請求項１０に記載の方法、および請求項１１に記載のコンピュータプログラムによって達成される。

本発明の一実施形態によれば、透かし信号が透かしデータを示すように、透かし信号がオーディオ信号に付加されるとき、オーディオ信号に隠されるのに適している透かし信号を供給するための透かし信号供給装置は、オーディオ信号のマスキング閾値を決定するための音響心理学的処理装置と、透かしデータの時間離散的表現のサンプル時間間隔で、互いに間隔をあけたサンプル波形整形関数（ｓａｍｐｌｅ−ｓｈａｐｉｎｇｆｕｎｃｔｉｏｎ）の重ね合わせから透かし信号を生成するための変調装置を含み、そのサンプル波形整形関数は、マスキング閾値に依存する各振幅重みにより乗算された時間離散表現の各サンプルで振幅重み付けされ、その変調装置は、サンプル時間間隔がサンプル波形整形関数の時間範囲（ｔｉｍｅｅｘｔｅｎｓｉｏｎ）より短くなるように、そして、各振幅重みが、時間において各サンプルに隣接している時間離散的表現のサンプルにも依存するように、構成される。

本発明は、透かし信号の抽出量と非可聴性との間のより良いトレードオフが、マスキング閾値に依存するだけでなく、各サンプルに隣接している透かしデータの時間離散的表現のサンプルにも依存する、透かし信号を重ね合わせで形成するサンプル波形整形関数を振幅重み付けするための振幅重みを選択することによって達成されるという発見に基づく。このようにして、隣接したサンプル位置のサンプル波形整形関数は重なり合うことができる、すなわち、サンプル時間間隔は、サンプル波形整形関数の時間範囲より短くてもよく、これにもかかわらず、この種の隣接したサンプル波形整形関数間の干渉は、振幅重みを設定するときに、現在重み付けされたサンプルと隣接する時間離散的表現のサンプルを考慮に入れることによって補償されることができる。更に、サンプル波形整形関数がより大きい時間範囲を有することが可能となるので、それらの周波数応答は、より狭くされることができ、それによって、すなわち、透かしを入れたオーディオ信号が反響する環境において再生されるときに、透かし信号の抽出量を残響に対してより強くする。換言すれば、マスキング閾値だけでなく、各サンプルと隣接する透かしデータの時間的離散表現のサンプルに対する各振幅重みの依存は、隣接するサンプル波形整形関数間の聞き取れる干渉を補償することを可能にし、それがなければマスキング閾値の違反につながりうる。

本発明による実施形態は、同封の図を参照して、以下で説明される。

図１は、本発明の一実施形態の透かし挿入器のブロック略図を示す。図２は、本発明の一実施形態の透かし復号器のブロック略図を示す。図３は、本発明の一実施形態の透かしジェネレータの詳細なブロック略図を示す。図４は、本発明の一実施形態に使用するための変調装置の詳細なブロック略図を示す。図５は、本発明の一実施形態に使用するための音響心理学的な処理モジュールの詳細なブロック略図を示す。図６は、本発明の一実施形態に使用するための音響心理学的モデル処理装置のブロック略図を示す。図７は、周波数に関するブロック８０１によって、オーディオ信号出力のパワースペクトルのグラフ表示を示す。図８は、周波数に関するブロック８０２によって、オーディオ信号出力のパワースペクトルのグラフ表示を示す。図９は、振幅計算のブロック略図を示す。図１０ａは、変調装置のブロック略図を示す。図１０ｂは、時間周波数要求に関する係数の位置の図を示す。図１１ａは、同期モジュールの実施態様の変形例のブロック略図を示す。図１１ｂは、同期モジュールの実施態様の変形例のブロック略図を示す。図１２ａは、透かしの時間的整合を見つける課題の図を示す。図１２ｂは、メッセージ開始を確認する課題の図を示す。図１２ｃは、全メッセージ同期モードの同期シーケンスの時間的整合の図を示す。図１２ｄは、部分的メッセージ同期モードの同期シーケンスの時間的整合の図を示す。図１２ｅは、同期モジュールの入力データの図を示す。図１２ｆは、同期ヒットを確認する構想の図を示す。図１２ｇは、同期シグネチャ相関器のブロック略図を示す。図１３ａは、時間的逆拡散のための一例の図を示す。図１３ｂは、ビットと拡散シーケンスとの間の要素ごとの乗算のための一例の図を示す。図１３ｃは、時間的加算平均の後の同期シグネチャ相関器の出力の図を示す。図１３ｄは、同期シグネチャの自己相関関数によって平滑された同期シグネチャ相関器の出力の図を示す。図１４は、本発明の一実施形態の透かし抽出器のブロック略図を示す。図１５は、候補メッセージとして時間周波数領域表現の一部の選択の略図を示す。図１６は、解析モジュールのブロック略図を示す。図１７ａは、同期相関器の出力の図示を示す。図１７ｂは、復号化メッセージの図示を示す。図１７ｃは、透かしを入れた信号から抽出される同期位置の図を示す。図１８ａは、ペイロード、ビタビ終了シーケンスを有するペイロード、ビタビを符号化されたペイロードおよびビタビ・コード化されたペイロードの繰り返しコード化バージョンの図示を示す。図１８ｂは、透かしを入れた信号を埋め込むために使用される副搬送波の図を示す。図１９は、符号化されていないメッセージ、符号化メッセージ、同期メッセージ、および、同期シーケンスがメッセージに適合される透かし信号の図を示す。図２０は、いわゆる「ＡＢＣ同期」構想の第１ステップの図を示す。図２１は、いわゆる「ＡＢＣ同期」構想の第２ステップの図を示す。図２２は、いわゆる「ＡＢＣ同期」構想の第３ステップの図を示す。図２３は、ペイロードおよびＣＲＣ部分を含んでいるメッセージの図を示す。図２４は、本発明の一実施形態による透かし信号供給装置のブロック略図を示す。図２５は、本発明の一実施形態による透かし埋め込み装置のブロック略図を示す。

１．透かし信号供給
以下では、透かし信号供給装置２４００について、図２４を参照して説明する。透かし信号供給装置２４００は、音響心理学的処理装置２４１０と変調装置２４２０とを含む。音響心理学的処理装置２４１０は、透かし信号供給装置２４００が透かし信号２４４０を供給することになるオーディオ信号２４３０を受信するように構成される。次に、変調装置２４２０は、透かし信号２４４０を生成するために音響心理学的処理装置２４１０によって供給されるマスキング閾値を使用するように構成される。特に、変調装置２４２０は、透かし信号２４４０によって示される透かしデータ２４５０の時間離散的表現のサンプル時間間隔で互いに間隔を置かれたサンプル波形整形関数の重ね合わせから透かし信号２４４０を生成するように構成される。特に、変調装置２４２０は、透かしを入れたオーディオ信号を得るために、透かし信号２４４０がオーディオ信号２４３０に付加されるとき、透かし信号２４４０がオーディオ信号２４３０に隠されることに適しているように透かし信号２４４０を生成するときにマスキング閾値を使用する。

下でより詳細に説明されるように、透かしデータの時間離散的表現は、実際に、時間／周波数離散的表現でありえ、時間領域および／または周波数領域の拡散を用いて透かしデータ２４５０から得うる。時間離散的表現のサンプルが割り当てられるグリッド位置の時間または時間／周波数グリッドは、時間に関して固定され、特に、オーディオ信号２４３０から独立しうる。次に、重ね合わせは、先ほど言及されたグリッドのグリッド位置に配置されたそのサンプルを有する時間／離散的表現の畳み込みと解釈されることができ、そのサンプルは、次に、マスキング閾値だけでなく、時間において隣接する時間離散表現のサンプルにも依存する振幅重みによって重み付けされる。

マスキング閾値の振幅重みの依存は、以下の通りでありえる。特定の時間ブロックで時間離散的表現の特定のサンプルによって乗算されるためにある振幅重みは、次に、その時間および周波数に依存するマスキング閾値の各時間ブロックから得られる。このように、透かしデータの時間／周波数離散的表現の場合には、各サンプルは、その透かし表現サンプルの各時間／周波数グリッド位置でサンプリングされたマスキング閾値に対応する振幅重みで乗算される。

さらにまた、透かしデータ２４５０から時間離散的表現を取り出すための時間差分符号化（ｔｉｍｅ−ｄｉｆｆｅｒｅｎｔｉａｌｃｏｄｉｎｇ）を使用することは、可能である。具体的な実施形態に関する詳細について、以下で説明する。

変調装置２４２０は、各サンプル波形整形関数が音響心理学的処理装置２４１０で決定されたマスキング閾値に依存する各振幅重みによって乗算された時間離散的表現の各サンプルによって振幅重み付けされるように、サンプル波形整形関数の重ね合わせから透かし信号２４４０を生成するように構成される。特に、変調装置２４２０は、サンプル時間間隔がサンプル波形整形関数の時間範囲より短いように、そして、各振幅重みも、各サンプルに隣接する時間離散的表現のサンプルに依存するように、構成される。

下でより詳細に概説されるように、サンプル時間間隔がサンプル波形整形関数の時間範囲より短いことは、時間において隣接するサンプル波形整形関数間の干渉をもたらし、それによって、思いがけなくマスキング閾値を違反する危険性を増加させる。しかしながら、マスキング閾値のこの種の違反は、振幅重みを、現在のサンプルに隣接する時間離散的表現のサンプルにも依存させることによって補償される。

下で概説される透かしシステムのための実施形態において、先ほど言及された依存は、振幅重みの反復的な設定によって実現される。特に、音響心理学的処理装置２４１０は、透かしデータから独立して、マスキング閾値を決定することができ、その一方で、変調装置２４２０は、透かしデータから独立しているマスキング閾値に基づいて、振幅重みを予備的に決定することによって、振幅重みを反復的に設定するように構成されることができる。変調装置２４２０は、予備的に決定された振幅重みで乗算された透かし表現のサンプルによって振幅重み付けされるようなサンプル波形整形関数の重ね合わせが、そのマスキング閾値を違反するかどうかに関してチェックするように構成されることができる。違反する場合は、変調装置２４２０は、更なる重ね合わせを得るために、予備的に決定された振幅重みを変化させることができる。変調装置２４２０は、振幅重みが特定の分散閾値の範囲内の値を維持しているなど各ブレーク条件が満たされるまで、その後の重ね合わせに関するチェックおよび変化を含むこれらの反復を繰り返すことができる。上述のチェックにおいて、時間離散的表現の隣接したサンプルが、重ね合わせおよびサンプル時間間隔を上回っているサンプル波形整形関数の時間範囲のため、互いに影響を及ぼしあう／干渉しあうので、生成するためのホール反復プロセスは、透かしデータ表現のこれらの隣接するサンプルに依存している。

下で概説される実施形態において、時間領域における透かしデータの拡散は、先ほど言及された時間離散的表現を明らかにするために使用される点に留意する必要がある。しかし、この種の時間拡散は、離したままにされうる。同じことは、下で概説される実施形態において使用される周波数拡散にもあてはまる。

２．透かし埋め込み装置
図２５は、図２４の透かし信号供給装置２４００を使用している透かし埋め込み装置を示す。特に、図２５の透かし埋め込み装置は、通常、参照番号２５００によって示され、透かし信号供給装置２４００の他に、透かしを入れたオーディオ信号２５３０を得るために、透かし信号供給装置２４００による出力としての透かし信号２４４０とオーディオ信号２４３０を加算するためのアダー２５１０を含む。

３．システム説明
以下に、透かし挿入器および透かし復号器を含む透かし伝送のシステムについて説明される。当然であるが、透かし挿入器および透かし復号器は、互いに独立して使用することができる。

システムの説明のために、トップダウンアプローチが、ここでは選択される。まず、それは、符号器と復号器との間で区別される。次に、セクション３．１〜セクション３．５において、各処理ブロックについて詳述する。

システムの基本構造は、図１および図２に見ることができ、それぞれ、符号器および復号器側を表す。図１は、透かし挿入器１００のブロック略図を示す。符号器側で、透かし信号１０１ｂは、バイナリデータ１０１ａから、そして、音響心理学的な処理モジュール１０２と交換される情報１０４、１０５に基づいて、処理ブロック１０１（透かしジェネレータとも呼ばれる）において生成される。一般的にブロック１０２から供給された情報は、透かしが聞こえないことを保証する。透かしジェネレータ１０１によって生成された透かしは、次にオーディオ信号１０６に付加される。透かしを入れた信号１０７は、次に送信されうる、格納されうる、または、更に処理されうる。マルチメディアファイル、例えばオーディオビデオファイルの場合には、適当な遅延が、オーディオビデオ同時発生を失わないためにビデオストリームに付加されることを必要とする。多重チャネルオーディオ信号の場合には、各チャネルは、この文書で説明されたように別々に処理される。処理ブロック１０１（透かしジェネレータ）および１０２（音響心理学的処理モジュール）は、それぞれ、セクション３．１および３．２において詳細に説明される。

復号器側は、図２において示され、それは透かし検出器２００のブロック略図を示す。例えばマイクロホンによって記録された、透かしを入れたオーディオ信号２００ａは、システム２００に利用できるようになる。解析モジュールとも呼ばれる第１のブロック２０３は、時間／周波数領域において、そのデータ（例えば透かしを入れたオーディオ信号）を復調し、変換し、（これによって、透かしを入れたオーディオ信号２００ａの時間周波数領域表現２０４を得て、）それを、入力信号２０４を解析して、時間的同期を実行する、すなわち、（例えば時間周波数領域表現に関連して、符号化された透かしデータの）符号化されたデータの時間的整合を決定する同期モジュール２０１に渡す。この情報（例えば結果として生じる同期情報２０５）は、そのデータを復号する（そして、結果的に、透かしを入れたオーディオ信号２００ａのデータ内容を示すバイナリデータ２０２ａを供給する）透かし抽出器２０２に伝えられる。

３．１透かしジェネレータ１０１
透かしジェネレータ１０１は、図３に詳細に示される。オーディオ信号１０６に隠される（±１として表される）バイナリデータが、透かしジェネレータ１０１に与えられる。ブロック３０１は、等長Ｍ_pのパケットでデータ１０１ａをオーガナイズする。付加ビットは、各パケットに信号送信する目的のために付加される（例えば追加される）。Ｍ_sがそれらの数を示すとする。それらの使用は、セクション３．５において詳細に説明される。なお、以下では、信号付加ビットとペイロードビットの各パケットは、メッセージを示す。

長さＮ_m＝Ｍ_s＋Ｍ_pの各メッセージ３０１ａは、エラーに対する保護のためにビットを符号化する役割を果たす処理ブロック３０２、チャネル符号器に渡される。このモジュールの可能な実施形態は、インターリーバと共に畳み込み符号器から構成される。畳み込み符号器の比率は、透かしを入れるシステムのエラーに対する保護の全体の度合いに多大に影響する。他方、インターリーバは、ノイズバーストに対する保護をもたらす。インターリーバの演算の範囲は、１つのメッセージに限定することができるが、それは、より多くのメッセージまで拡張することもできる。Ｒ_cは、符号比率、例えば１／４を示すものとする。メッセージごとの符号化されたビットの数は、Ｎ_m／Ｒ_cである。チャネル符号器は、例えば、符号化されたバイナリメッセージ３０２ａを供給する。

次の処理ブロック（３０３）は、周波数領域における拡散を実行する。充分なＳＮ比を達成するために、情報（例えばバイナリメッセージ３０２ａの情報）は、Ｎ_fの慎重に選択されたサブバンドにおいて拡散されて、送信される。周波数におけるそれらの正確な位置は、演繹的に決定されて、符号器および復号器の両方に知られている。この重要なシステムパラメータの選択についての詳細は、セクション３．２．２．において与えられる。周波数における拡散は、サイズＮ_f×１の拡散シーケンスｃ_fで決定される。ブロック３０３の出力３０３ａは、Ｎ_fのビットストリームから構成され、サブバンドごとに１つのビットストリームである。ｉ番目のビットストリームは、拡散シーケンスｃ_fのｉ番目の成分を入力ビットに乗算することによって得られる。最もシンプルな拡散は、各出力ストリームにビットストリームをコピーすることからなる、すなわち１つの拡散シーケンスを使用する。

同期方式挿入器とも示されるブロック３０４は、ビットストリームに同期信号を付加する。復号器がビットまたはデータ構造のいずれの時間的整合も知らないとき、すなわち、各メッセージが始まるときに、ロバストな同期は重要である。同期信号は、各々Ｎ_fビットのＮ_sのシーケンスから成る。そのシーケンスは、ビットストリーム（またはビットストリーム３０３ａ）に、要素ごと、かつ、周期的に乗算される。例えば、ａ、ｂおよびｃは、Ｎ_s＝３の同期シーケンス（同期拡散シーケンスとも呼ばれる）とされる。ブロック３０４は、ａに第１の拡散ビット、ｂに第２の拡散ビット、ｃに第３の拡散ビットを乗算する。続くビットのために、その処理は周期的に、すなわち、ａに第４のビット、ｂに第５のビットなど繰り返される。したがって、複合情報―同期情報３０４ａが得られる。同期シーケンス（同期拡散シーケンスとも呼ばれる）は、誤った同期のリスクを最小化するために慎重に選ばれる。より詳細については、セクション３．４において与えられる。また、シーケンスａ、ｂ、ｃ、…が一連の同期拡散シーケンスとみなされうることに留意する必要がある。

ブロック３０５は、時間領域における拡散を実行する。入力での各拡散ビット、すなわち、長さＮ_fのベクトルは、時間領域においてＮ_t回繰り返される。周波数における拡散と同様に、我々は、サイズＮ_t×１の拡散シーケンスｃ_tを定める。ｉ番目の時間的繰り返しは、ｃ_tのｉ番目の成分で乗算される。

ストリームの始め、すなわちｊ＝０で、ｂ_diff（ｉ，ｊ−１）は、１にセットされる。

ビットごとのビット波形整形は、音響心理学的な処理モジュール（１０２）によって制御された反復処理において繰り返される。それを聞こえなく保つと共に、透かしにできるだけ多くのエネルギーを割り当てるために、重みγ（ｉ，ｊ）を微調整するには反復が必要である。より詳細については、セクション３．２において与えられる。

３．２音響心理学的な処理モジュール１０２
図５に示したように、音響心理学的な処理モジュール１０２は、３つの部分から成る。第１のステップは、時間オーディオ信号を時間／周波数領域に変換する解析モジュール５０１である。この解析モジュールは、異なる時間／周波数分解能で並列解析を行うことができる。解析モジュールの後、時間／周波数データは、音響心理学的なモデル（ＰＡＭ）５０２に移される。そこにおいて、透かし信号のためのマスキング閾値は、音響心理学的な考慮に従って算出される（Ｅ．ツビッカー、Ｈ．ファストル著の「心理音響事実およびモデル」を参照のこと）。マスキング閾値は、サブバンドおよび時間ブロックごとにオーディオ信号において隠されることができるエネルギー量を示す。音響心理学的な処理モジュール１０２の最後のブロックは、振幅計算モジュール５０３を表す。マスキング閾値が条件を満たす、すなわち、埋め込みエネルギーがマスキング閾値によって定められたエネルギー以下であるように、このモジュールは、透かし信号の生成において使用される振幅ゲインを決定する。

３．２．１時間／周波数解析５０１
ブロック５０１は、ラップド変換（ｌａｐｐｅｄｔｒａｎｓｆｏｒｍ）によってオーディオ信号の時間／周波数変換を行う。複数の時間／周波数分解能が実行されるときに、最高のオーディオ品質を得ることができる。ラップド変換の１つの効率的な実施形態は、窓を掛けた時間ブロックの高速フーリエ変換（ＦＦＴ）に基づく短時間フーリエ変換（ＳＴＦＴ）である。窓の長さは時間／周波数分解能を決定し、その結果、より長い窓は、より低い時間分解能およびより高い周波数分解能を産生し、一方、より短い窓は、その逆を行なう。他方、窓の形状は、とりわけ、周波数漏洩を決定する。

提案されたシステムのために、我々は、２つの異なる分解能を有するデータを解析することによって、聞こえない透かしを達成する。第１のフィルタバンクは、Ｔ_b、すなわちビット長のホップサイズによって特徴づけられる。ホップサイズは、２つの隣接する時間ブロック間の時間間隔である。窓長は、およそＴ_bである。窓形状が、ビット波形整形のために使用されたものと同じである必要はなく、通常、人間のヒアリングシステムをモデル化するべきであることに留意されたい。多数の刊行物は、この課題を検討する。

第２のフィルタバンクは、より短い窓を適用する。達成されるより高い時間分解能は、音声に透かしを埋め込むとき、その時間的構造がＴ_bより一般に微細であるので、特に重要である。

入力オーディオ信号のサンプリングレートは、それがエイリアシングのない透かし信号を示すのに十分大きい限り、重要でない。例えば、透かし信号に含まれた最大周波数成分が６ｋＨｚである場合、時間信号のサンプリングレートは少なくとも１２ｋＨｚでなければならない。

３．２．２音響心理学的なモデル５０２
音響心理学的なモデル５０２は、透かしを入れたオーディオ信号をオリジナルから区別できないままにして、マスキング閾値、すなわち、サブバンドおよび時間ブロックごとにオーディオ信号において隠されることができるエネルギー量を決定するタスクを有する。

続く処理ステップは、サブバンドおよび時間ブロックごとに各時間／周波数分解能に関して別々に実行される。処理ステップ８０１は、スペクトルスムージングを実行する。実際に、音の要素は、パワースペクトルのノッチと同様に、滑らかにされることを必要とする。これは、いくつかの方法で実行されうる。調性測度（ｔｏｎａｌｉｔｙｍｅａｓｕｒｅ）は、算出されることができて、適応平滑フィルタを駆動するために使用される。あるいは、このブロックのより単純な実施態様において、メディアンライクフィルタ（ｍｅｄｉａｎ−ｌｉｋｅｆｉｌｔｅｒ）が使用されることができる。メジアンフィルタは、値のベクトルを考慮して、それらの中間値を出力する。メディアンライクフィルタにおいて、５０％より異なる変位値に対応する値は、選択されることができる。フィルタ幅は、Ｈｚで定義され、より低い周波数で始まる非線形移動平均として適用され、できる限り高い周波数で終わる。８０１の演算は、図７において示される。赤い曲線は、スムージング法の出力である。

一旦スムージングが実行されると、閾値は、周波数マスキングだけを考慮しているブロック８０２によって算出される。また、この場合、異なる可能性がある。１つの方法は、マスキング（ｍａｓｋｉｎｇ）エネルギーＥ_iを計算するためにサブバンドごとの最小値を使用することである。これは、効果的にマスキングを操作する信号の実効エネルギーである。この値から、我々は、マスクされたエネルギーＪ_iを得るために、特定のスケーリングファクタを単に乗算することができる。これらのファクタは、サブバンドおよび時間／周波数分解能ごとに異なり、経験的音響心理学的な実験を経て得られる。これらのステップは、図８において示される。

ブロック８０５において、時間的マスキングが考慮される。この場合、同じサブバンドのための異なる時間ブロックが解析される。マスクされたエネルギーＪ_iは、経験的に得られたポストマスキングプロファイルによって修正される。２つの隣接する時間ブロック、すなわち、ｋ−１およびｋについて考慮してみる。対応するマスクされたエネルギーは、Ｊ_i（ｋ−１）およびＪ_i（ｋ）である。ポストマスキングプロファイルは、例えば、マスキングエネルギーＥｉが時間ｋでエネルギーＪ_iを、そして、時間ｋ＋１でα・Ｊ_iをマスクすることができる。この場合、ブロック８０５は、Ｊ_i（ｋ）（現在の時間ブロックによってマスクされたエネルギー）およびα・Ｊ_i（ｋ＋１）（前の時間ブロックによってマスクされたエネルギー）を比較し、最大のものを選択する。ポストマスキングプロファイルは、文献において利用でき、経験的音響心理学的な実験を経て得られた。なお、大きなＴ_b、すなわち２０ｍｓより大きいＴ_bのために、ポストマスキングは、より短い時間窓を用いて、時間／周波数分解能だけに適用される。

まとめると、ブロック８０５の出力で、我々は、２つの異なる時間／周波数分解能のために得られた各サブバンドおよび時間ブロックごとにマスキング閾値を有する。その閾値は、周波数マスキングおよび時間マスキングの両方の事象を考慮することによって得られた。ブロック８０６において、異なる時間／周波数分解能のための閾値は、結合される。例えば、ありうる実施態様は、８０６がビットが割り当てられる時間および周波数間隔に対応するすべての閾値を考慮して、最小値を選択するということである。

３．２．３振幅計算ブロック５０３
図９を参照する。５０３の入力は、すべての音響心理学的に動機づけされた計算が実行される音響心理学的なモデル５０２からの閾値５０５である。振幅計算器５０３において、閾値を有する追加の計算が実行される。まず、振幅マッピング９０１が起こる。このブロックは、単にマスキング閾値（通常、エネルギーとして表される）をセクション３．１において定められたビット波形整形関数をスケールするために使用されることができる振幅に変換するだけである。その後、振幅適合ブロック９０２が実行される。このブロックは、反復して、マスキング閾値が実際条件が満たされるように、透かしジェネレータ１０１のビット波形整形関数を乗算するために使用される振幅γ（ｉ，ｊ）を適応させる。実際、すでに述べられるように、ビット波形整形関数は、通常、Ｔ_bより大きい時間間隔にわたっている。従って、点ｉ，ｊでのマスキング閾値の条件を満たす正しい振幅γ（ｉ，ｊ）を乗算することは、点ｉ，ｊ−１での要件を必ずしも満たすというわけではない。これは、プリエコーが聞こえるようになるので、顕著な立ち上がりで特に重要である。回避される必要がある他の状況は、聞き取れる透かしにつながりうる異なるビットの最後部の不運な重ね合わせである。従って、ブロック９０２は、閾値が条件を満たしていたどうか調べるために透かしジェネレータによって生成された信号を解析する。条件を満たしていない場合には、それに応じて振幅γ（ｉ，ｊ）を修正する。

これで符号器側を終了とする。続くセクションは、受信器（透かし復号器とも呼ばれる）で実行された処理ステップを扱う。

解析モジュールは、図１６において表される３つの部分から成る：解析フィルタバンク１６００、振幅規格化ブロック１６０４および差分復号化１６０８。

サブバンド周波数ｆ_iが特定の間隔Δｆの倍数として選択される場合、解析フィルタバンクは高速フーリエ変換（ＦＦＴ）を使用して能率的に実行されることができる。

我々は、最初にメッセージ同期についてだけ述べる。同期シグネチャは、セクション３．１で述べたように、連続的かつ周期的に透かしを埋めこまれる所定の命令のＮ_sのシーケンスから成る。同期モジュールは、同期シーケンスの時間的整合を読み出すことができる。サイズＮ_sに応じて、我々は、それぞれ図１２ｃおよび図１２ｄにおいて示される、２つの動作モードを区別することができる。

全メッセージ同期モード（図１２ｃ）において、我々は、Ｎ_s＝Ｎ_m／Ｒ_cを有する。図における説明を簡単にするため、我々は、Ｎ_s＝Ｎ_m／Ｒ_c＝６であり、時間拡散がない、すなわちＮ_t＝１であると仮定する。説明の便宜上、使用された同期シグネチャは、メッセージの下に示される。実際は、セクション３．１で述べたように、それらは、符号化ビットおよび周波数拡散シーケンスに応じて変調される。このモードにおいて、同期シグネチャの周期性は、メッセージの一つと同一である。従って、同期モジュールは、同期シグネチャの時間的整合を見つけることによって、各メッセージの始まりを確認することができる。我々は、新しい同期シグネチャが始まる時間的位置を同期ヒット（ｓｙｎｃｈｒｏｎｉｚａｔｉｏｎｈｉｔｓ）と呼ぶ。同期ヒットは、それから透かし抽出器２０２に引き継がれる。

第２の考えられるモード、部分的メッセージ同期モード（図１２ｄ）は、図１２ｄにおいて表される。この場合、我々は、Ｎ_s＜Ｎ_m＝Ｒ_cを有する。図において、我々はＮ_s＝３とした。その結果、３つの同期シーケンスがメッセージごとに２回繰り返される。メッセージの周期性が同期シグネチャの周期性の倍数である必要がない点に留意されたい。この動作モードにおいて、同期ヒットの全てが、メッセージの始まりに対応するというわけではない。同期モジュールは、ヒット間を区別する手段を有さず、このタスクは透かし抽出器２０２に与えられる。

同期モジュールの処理ブロックは、図１１ａおよび１１ｂにおいて表される。同期モジュールは、同期シグネチャ相関器１２０１の出力を解析することによって、すぐに、ビット同期およびメッセージ同期（全部または一部分のいずれか）を行う。時間／周波数領域２０４のデータは、解析モジュールによって供給される。ビット同期がまだ利用できないので、ブロック２０３は、セクション３．３に説明したように、係数Ｎ_osを有するデータをオーバーサンプリングする。入力データの図は、図１２ｅに与えられる。この例のために、我々は、Ｎ_os＝４、Ｎ_t＝２およびＮ_s＝３とした。換言すれば、同期シグネチャは、（ａ、ｂ、ｃで示される）３つのシーケンスから成る。この場合、拡散シーケンスｃ_t＝［１１］^Tを有する時間拡散は、時間領域において、単に２回各ビットを繰り返す。正確な同期ヒットは、矢印で示され、各同期シグネチャの始まりに対応する。同期シグネチャの周期は、Ｎ_t・Ｎ_os・Ｎ_s＝Ｎ_sblであり、それは例えば２・４・３＝２４である。同期シグネチャの周期性のため、同期シグネチャ相関器（１２０１）は、任意で、添字がサーチブロック長を表すサイズＮ_sblの、サーチブロックと呼ばれるブロックで時間軸を分ける。あらゆるサーチブロックは、図１２ｆに示されるように、１つの同期ヒットを含む（または一般的に含む）必要がある。Ｎ_sblビットの各々は、候補同期ヒット（ｃａｎｄｉｄａｔｅｓｙｎｃｈｒｏｎｉｚａｔｉｏｎｈｉｔ）である。ブロック１２０１のタスクは、各ブロックの候補ビットの各々のための尤度測度（ｌｉｋｅｌｉｈｏｏｄｍｅａｓｕｒｅ）を算出することである。この情報は、次に、同期ヒットを計算するブロック１２０４に渡される。

３．４．１同期シグネチャ相関器１２０１
Ｎ_sblの候補同期位置ごとに、同期シグネチャ相関器は、尤度測度を算出し、後者は、時間的整合（ビットおよび一部分または全部のメッセージ同期の両方）が見つけられた確率がより高いほど、大きい。処理ステップは、図１２ｇにおいて表される。

したがって、異なる位置的選択と関連した、尤度値のシーケンス１２０１ａを得ることができる。

ブロック１３０１は時間的逆拡散を実行する、すなわち、全てのＮ_tビットに時間的拡散シーケンスｃ_tを掛けて、それからそれらを合計する。これは、Ｎ_fの周波数サブバンドの各々のために実行される。図１３ａは、一例を示す。我々は、前のセクションで述べたように同じパラメータをとる、すなわち、Ｎ_os＝４、Ｎ_t＝２、Ｎ_s＝３である。候補同期位置がマークされる。Ｎ_osオフセットを用いて、そのビットから、Ｎ_t・Ｎ_sはブロック１３０１およびシーケンスｃ_tを有する時間逆拡散によってとられ、その結果、Ｎ_sビットが残される。

ブロック１３０２において、ビットは、Ｎ_sの拡散シーケンスで、要素ごとに乗算される（図１３ｂ参照）。

ブロック１３０３において、周波数逆拡散が実行される、すなわち、各ビットは、拡散シーケンスｃ_fで乗算され、その結果、周波数に沿って合計される。

この点で、同期位置が正しい場合には、我々はＮ_sの復号されたビットを有するだろう。そのビットが受信器に知られていないので、ブロック１３０４は、Ｎ_s値の絶対値および総計をとることによって尤度測度を計算する。

ブロック１３０４の出力は、原則として、同期シグネチャを探す非同期式相関器である。実際に、小さいＮ_s、すなわち、部分的メッセージ同期モードを選択するとき、相互に直交する同期シーケンス（例えばａ、ｂ、ｃ）を使用することは可能である。この際、相関器がシグネチャと正しく整合されないとき、その出力は、非常に小さい、理想的にはゼロであるだろう。全メッセージ同期モードを使用するとき、できる限り多くの直交同期シーケンスを使用し、それから慎重にそれらが使用される順番を選択することによって、シグネチャを生み出すことが助言される。この場合、より良い自己相関関数を有する拡散シーケンスを探すときと同じ理論が適用されることができる。相関器がわずかにきちんと並んでいないだけのとき、相関器の出力は、理想的な場合でさえゼロではないが、いずれにしろ、解析フィルタが最適に信号エネルギーを取り込むことができないように、完全な整合と比較してより小さいだろう。

３．４．２同期ヒット計算１２０４
このブロックは、同期位置がどこにあるかについて決定するために、同期シグネチャ相関器の出力を解析する。システムがＴ_b／４までのずれに対してかなりロバストであり、Ｔ_bが通常約４０ｍｓをとるので、より安定な同期を達成するために、時間に関して１２０１の出力を集積することは可能である。これの可能な実施態様は、インパルス応答を指数関数的に減少させるとともに、時間に沿って適用されたＩＩＲフィルタによって与える。あるいは、従来のＦＩＲ移動平均フィルタを適用することができる。一旦、加算平均が実行されると、異なるＮ_t・Ｎ_sに沿った第２の相関が実行される（「異なる位置選択」）。実際に、我々は、同期関数の自己相関関数が知られる情報を活用したい。これは最大尤度（ＭａｘｉｍｕｍＬｉｋｅｌｉｈｏｏｄ）推定量に対応する。考えは、図１３ｃに示される。曲線は、時間的統合化の後、ブロック１２０１の出力を示す。同期ヒットを決定する１つの可能性は、単にこの関数の最大値を見つけることである。図１３ｄにおいて、同期シグネチャの自己相関関数によって平滑された（黒の）同じ関数が見える。結果として生じる関数は、赤でプロットされる。この場合、最大値は、より明白で、我々に同期ヒットの位置を与える。２つの方法は、高いＳＮＲのためにかなり似ているが、第２の方法は、より低いＳＮＲ状況においてはるかに良く機能する。一旦同期ヒットが分かると、それらはデータを復号する透かし抽出器２０２に渡される。

いくつかの実施形態では、ロバストな同期信号を得るために、同期は、短い同期シグネチャを用いた部分的メッセージ同期モードで実行される。このため、多くの復号がなされる必要があり、誤検出メッセージ検出の危険性を増す。これを防止するために、いくつかの実施形態では、信号シーケンスは、結果として低いビットレートでメッセージに挿入されることができる。

このアプローチは、拡張された同期の上記説明においてすでに述べられたメッセージより短い同期シグネチャから生ずる問題の解決策である。この場合、復号器は、新しいメッセージがどこで始まるかを知らず、いくつかの同期点で復号することを試みる。本物のメッセージと誤検出とを区別するために、いくつかの実施形態では、信号語が使用される（すなわち、ペイロードは、周知の制御シーケンスを埋込むために犠牲となる）。いくつかの実施形態では、信頼性チェックは、本物のメッセージと誤検出とを区別するために、（代わりに、または、加えて）使用される。

３．５透かし抽出器２０２
透かし抽出器２０２を構成している部分は、図１４において表される。これは、２つの入力、すなわち、それぞれ、ブロック２０３および２０１からの２０４および２０５を有する。同期モジュール２０１（セクション３．４参照）は、同期タイムスタンプ、すなわち、候補メッセージが始まる時間領域の位置を供給する。この事項に関するより詳細については、セクション３．４で与えられる。他方、解析フィルタバンクブロック２０３は、復号される用意ができている時間／周波数領域にデータを供給する。

第１の処理ステップ、データ選択ブロック１５０１は、復号される候補メッセージと確認された部分を入力２０４から選択する。図１５は、視覚的にこのプロシージャを示す。入力２０４は、実数値のＮ_fのストリームから成る。時間整合が演繹的に復号器に知られていないので、解析ブロック２０３は、１／Ｔ_bＨｚより高いレートで周波数解析を行う（オーバーサンプリング）。図１５において、４のオーバーサンプリング係数を使用した、すなわち、サイズＮ_f×１の４つのベクトルが、Ｔ_b秒ごとに出力される。同期ブロック２０１が候補メッセージを確認するときに、それは候補メッセージの開始点を示しているタイムスタンプ２０５を分配する。選択ブロック１５０１は、復号のために必要とされた情報、すなわち、サイズＮ_f×Ｎ_m／Ｒ_cのマトリクスを選択する。このマトリクス１５０１ａは、更なる処理のためのブロック１５０２に与えられる。

ブロック１５０２、１５０３および１５０４は、セクション３．４において説明したブロック１３０１、１３０２および１３０３の同じ演算を行う。

本発明の別の実施形態は、同期モジュールに、復号されるデータも分配させることによって、１５０２〜１５０４においてなされた計算を回避することにある。概念的には、それは詳細である。実施態様の観点から、それは、ちょうどバッファがどのように実現されるかの問題である。一般に、計算の再実行は、我々がより小さいバッファを有することを可能にする。チャネル復号器１５０５は、ブロック３０２の逆演算を実行する。

チャネル符号器が、このモジュールの可能な実施形態において、インターリーバと共に畳み込み符号器から成る場合、チャネル復号器は、例えばよく知られたビタビ・アルゴリズムによって、デインターリーブすることと畳み込み復号化を実行するだろう。このブロックの出力で、我々は、Ｎ_mビット、すなわち候補メッセージを有する。

ブロック１５０６、信号送信および信頼性ブロックは、入力候補メッセージが本当にメッセージであるか否かを決める。そうするために、種々の方式が可能である。

基本概念は、真のメッセージと偽のメッセージとを区別するために（ＣＲＣシーケンスのような）信号語を使用することである。しかし、これはペイロードとして利用できるビットの数を減少させる。代わりに、我々は、信頼性チェックを使用することができる。メッセージが例えばタイムスタンプを含む場合、連続したメッセージは連続したタイムスタンプを有しなければならない。復号化メッセージが正しい命令でないタイムスタンプを所有する場合、我々はそれを廃棄することができる。

メッセージが正しく検出されるときに、システムはルックアヘッド（ｌｏｏｋａｈｅａｄ）および／またはルックバック（ｌｏｏｋｂａｃｋ）機構を適用して選択することができる。我々は、ビットおよびメッセージ同期が成し遂げられたと仮定する。ユーザが切替えていないと仮定するならば、システムは、適時に「ルックバック」して、（すでに復号されていない場合）同じ同期点を使用している過去のメッセージを復号することを試みる（ルックバックアプローチ）。これは、特にシステムが動き出すときに役立つ。さらに、悪い状況で、同期を成し遂げるために２つのメッセージをとることもあるだろう。この場合、第１のメッセージには、機会がない。ルックバックオプションについては、我々は、バック同期のみによって、受信されなかった「より良い」メッセージを保存することができる。ルックアヘッドは、同じあるが、将来にも機能する。我々が現在メッセージを受け取る場合、我々は次のメッセージがどこになければならないかについて知っており、我々はどうにかそれを復号することを試みることができる。

３．６．同期の詳細
ペイロードの符号化のために、例えば、ビタビ・アルゴリズムが使用されることができる。図１８ａは、ペイロード１８１０、ビタビ終了シーケンス１８２０、ビタビ符号化ペイロード１８３０およびビタビ符号化ペイロードの繰り返し符号化されたバージョン１８４０の図を示す。例えば、ペイロード長は、３４ビットでありえ、ビタビ終了シーケンスは、６ビットを含みうる。例えば１／７のビタビ符号レートが使用される場合、ビタビ符号化されたペイロードは、（３４＋６）＊７＝２８０ビットを含むことができる。更に、１／２の繰り返し符号化を使用することにより、ビタビ符号化されたペイロード１８３０の繰り返し符号化されたバージョン１８４０は、２８０＊２＝５６０ビットを含むことができる。この例において、４２．６６ｍｓのビット時間間隔を考慮して、メッセージ長さは、２３．９ｓである。信号は、例えば、図１８ｂに示される周波数スペクトルによって示されるように、１．５ｋＨｚから６ｋＨｚまで（例えば、臨界帯域に従って位置付けられた）９つの副搬送波によって埋込まれることができる。あるいは、また、０ｋＨｚと２０ｋＨｚとの間の周波数範囲内の他の数（例えば４、６、１２、１５または２と２０との間の数）の副搬送波が、おそらく使用される。

図１９は、ＡＢＣ同期とも呼ばれている同期ための基本的概念１９００の略図を示す。それは、互いに続くいくつかのメッセージ１９２０への同期の適用と同様に、符号化されていないメッセージ１９１０、符号化メッセージ１９２０、および同期シーケンス１９３０の略図を示す。

この同期構想（図１９〜２３に示される）の説明と関連して言及される同期シーケンスまたは同期シーケンスは、前に述べた同期シグネチャに等しくてもよい。

更に、図２０は、同期シーケンスと相関することによって見つけられた同期の略図を示す。同期シーケンス１９３０がメッセージより短い場合、２つ以上の同期点１９４０（または整合時間ブロック）は１つのメッセージの範囲内に見つけられうる。図２０に示された例において、４つの同期点は、各メッセージの範囲内に見つけられる。従って、見つけられた同期ごとに、ビタビ復号器（ビタビ復号シーケンス）を始めることができる。このようにして、同期点１９４０ごとに、図２１に示すように、メッセージ２１１０を得ることができる。

これらのメッセージに基づいて、図２２に示すように、真のメッセージ２２１０は、ＣＲＣシーケンス（巡回冗長検査シーケンス）および／または信頼性チェックによって確認されることができる。

ＣＲＣ検出（巡回冗長検査検出）は、誤検出から真のメッセージを確認するために、周知のシーケンスを使用することができる。図２３は、ペイロードの終わりに付加されたＣＲＣシーケンスのための一例を示す。

誤検出（間違った同期点に基づいて生成されたメッセージ）の確率は、ＣＲＣシーケンスの長さおよび始められたビタビ復号器の数（１つのメッセージ範囲内の同期点の数）に依存しうる。誤検出の確率を増加させずにペイロードの長さを増加させるために、信頼性は、利用されうる（信頼性試験）、または、同期シーケンス（同期シグネチャ）の長さは、増加することができる。

４．構想および利点
以下では、革新的であることと思われる、上で述べられたシステムのいくつかの態様について説明する。また、最高水準の技術とのそれらの態様の関係について述べる。

４．１．連続同期
いくつかの実施形態は、連続同期を可能にする。我々が同期シグネチャとして示す同期信号は、送信および受信側の両方に知られたシーケンス（同期拡散シーケンスとも呼ばれる）との乗算によって、連続的にかつデータと並列に埋込まれる。

いくつかの従来システムが（データのために使用されるもの以外の）特殊記号を使用する一方で、本発明によるいくつかの実施形態は、このような特殊記号を使用しない。他の典型的な方法は、データで時間多重されたビット（プリアンブル）の周知のシーケンスを埋め込むこと、または、データで周波数多重された信号を埋め込むことからなる。

しかし、チャネルがそれらの周波数でノッチを有するかもしれず、同期を信頼できなくするので、同期の間の専用のサブバンドを使用することが不必要であることが分かっている。プリアンブルまたは特殊記号がデータと時間多重される他の方法と比較して、本願明細書において説明された方法が連続的に（例えば動きに起因する）同期の変化を追従することを可能にするので、本願明細書において説明される方法はより有利である。

さらにまた、透かし信号のエネルギーは、（例えば拡散情報表現への透かしの乗法の導入によって）不変であり、そして、同期は、音響心理学的なモデルおよびデータ転送速度から独立して設計されることができる。（同期のロバスト性を決定する）同期シグネチャの時間の長さは、任意に、完全にデータ転送速度から独立して設計されることができる。

他の典型的方法は、データに符号多重化された同期シーケンスを埋込むことから成る。この典型的方法と比べて、本願明細書において説明された方法の利点は、データのエネルギーが相関の計算における干渉する要因を示さず、より多くのロバスト性をもたらすことである。さらに、符号多重化を使用するときに、同期に利用できる直交シーケンスの数は、いくつかがデータのために必要であるので、減少する。

要約すると、本願明細書において説明した連続同期アプローチは、従来の構想に勝る多数の利点をもたらす。

しかしながら、本発明によるいくつかの実施形態において、異なる同期構想が適用されうる。

４．２．２Ｄ拡散
提案されたシステムのいくつかの実施形態は、時間および周波数領域両方における拡散、すなわち２次元拡散（簡潔に２Ｄ拡散とも呼ばれる）を実行する。これは、ビット誤り率が例えば時間領域において冗長を付加することによって更に減じられることがありえるので、１Ｄシステムに対して利点がある。

しかしながら、本発明によるいくつかの実施形態において、異なる拡散構想が適用されうる。

４．３．差分符号化および差分復号化
本発明によるいくつかの実施形態において、（従来システムと比べて）局部発振器の動きおよび周波数不一致に対する増加したロバスト性は、差分変調によってもたらされる。実際に、ドップラー効果（動き）および周波数不一致がＢＰＳＫ配置点の回転（換言すれば、ビットの複素平面上の回転）につながることが分かっている。いくつかの実施形態において、ＢＰＳＫ配置点（または他のいかなる適当な変調配置点）のこの種の回転の不利益な効果は、差分符号化または差分復号化を用いて回避される。

しかし、本発明によるいくつかの実施形態において、異なる符号化構想または復号化構想は、適用されうる。また、場合によっては、差分符号化は、省略されることができる。

４．４．ビット波形整形
本発明によるいくつかの実施形態において、ビット波形整形は、検出の信頼性がビット波形整形に適合されたフィルタを使用して、増加することができるので、システム性能の重要な改善をもたらす。

いくつかの実施形態によれば、透かしを入れることに関してビット波形整形の使用は、透かしを入れる処理の改善された信頼性をもたらす。ビット波形整形関数がビット間隔より長い場合、特に良い結果を得ることができることが分かっている。

しかしながら、本発明によるいくつかの実施形態において、異なるビット波形整形構想は、適用されることができる。また、場合によっては、ビット波形整形は、省略されることができる。

４．５．音響心理学モデル（ＰＡＭ）とフィルタバンク（ＦＢ）合成との間の双方向性
いくつかの実施形態において、音響心理学的なモデルは、ビットを掛ける振幅を微調整するために、変調装置と対話する。

しかし、いくつかの他の実施形態において、この相互関係は、省略されることができる。

４．６．ルックアヘッドおよびルックバック機能
いくつかの実施形態において、いわゆる「ルックバック」および「ルックアヘッド」アプローチが適用される。

以下では、これらの構想について、簡潔にまとめられる。メッセージが正しく復号されるときに、同期が達成されたと仮定される。ユーザが切替えていないと仮定すると、いくつかの実施形態において、時間におけるルックバックが実行され、同じ同期点を使用して、過去のメッセージ（すでに復号されていない場合）を復号することが試みられる（ルックバックアプローチ）。これは、特に、システムが動き出すときに役立つ。

悪い状況では、同期を達成するのに２つのメッセージをとるかもしれない。この場合、第１のメッセージには、従来システムのチャンスがない。（本発明のいくつかの実施形態において使用される）ルックバックオプションについては、バック同期だけのため受信されなかった「良い」メッセージを保存する（または復号する）ことは、可能である。

ルックアヘッドは、同じことであるが、将来に機能する。私がここでメッセージを受信する場合、私は私の次のメッセージがどこになければならないかについて知っており、私はどうにかそれを復号しようとすることができる。したがって、重なっているメッセージは、復号されることができる。

しかし、本発明によるいくつかの実施形態において、ルックアヘッド機能および／またはルックバック機能は、省略されることができる。

４．７．増加した同期ロバスト性
いくつかの実施形態において、ロバストな同期信号を得るために、同期は、短い同期シグネチャを用いて部分的メッセージ同期モードにおいて実行される。このために、多くの復号化がなされなければならず、誤検出メッセージ検出の危険性を増す。これを防ぐために、いくつかの実施形態において、信号シーケンスは、結果としてより低いビットレートでメッセージに挿入されることができる。

しかし、本発明によるいくつかの実施形態において、同期ロバスト性を改善するための異なる構想は、適用されることができる。また、場合によっては、同期ロバスト性を増加させるためのいかなる構想の使用も、省略されることができる。

４．８．他の拡張
以下では、背景技術に関して上記システムのいくつかの他の一般的な拡張は、提案されて、論じられる。
１．より低い計算量
２．より良い音響心理学的なモデルによるより良いオーディオ品質
３．狭帯域マルチキャリア信号による反響する環境におけるロバスト性
４．ＳＮＲ算定は、いくつかの実施形態において回避される。これは、特に低いＳＮＲ状況において、より良いロバスト性を可能にする。

本発明によるいくつかの実施形態は、従来システムより良い。そして、それは、以下の理由のため、例えば８Ｈｚの非常に狭い帯域幅を使用する。
１．音響心理学的なモデルがごくわずかなエネルギーしかそれを聞こえなくするのを可能にしないので、８Ｈｚの帯域幅（または同様の非常に狭い帯域幅）は非常に長い時間シンボルを必要とする。
２．８Ｈｚ（または同様の非常に狭い帯域幅）は、時間変動するドップラースペクトルを変化させて、それの感度を高くする。したがって、例えば、腕時計において実行される場合、この種の狭いバンドシステムは一般的に十分により良くない。

本発明によるいくつかの実施形態は、以下の理由のため、他の技術より良い。
１．エコーを入力するテクニックは、完全に反響する部屋では失敗する。対照的に、本発明のいくつかの実施形態において、エコーの導入は、回避される。
２．時間拡散だけを使用するテクニックは、例えば時間および周波数の両方における二次元拡散が使用される上記システムの比較実施形態におけるより長いメッセージ時間を有する。

本発明によるいくつかの実施形態は、独国特許第１９６４０８１４において説明されたシステムより良い。なぜなら、前記文書によるシステムの以下の不利な点のより多くの続いている不利な点のうちの１つ以上が克服されるからである。
●独国特許第１９６４０８１４による復号器の煩雑性は非常に高く、Ｎ＝１２８での長さ２Ｎのフィルタが使用される。
●独国特許第１９６４０８１４によるシステムは、長いメッセージ時間を含む。
●独国特許第１９６４０８１４によるシステムにおいて、比較的高い拡散利得（例えば１２８）を有する時間領域だけにおける拡散
●独国特許第１９６４０８１４によるシステムにおいて、信号は時間領域において生成され、スペクトル領域に変換され、重み付けされ、時間領域に変換され、オーディオに重ね合わせられる。それはシステムを非常に複雑にする。

５．アプリケーション
本発明は、デジタルデータを隠すためにオーディオ信号を修正する方法と、修正されたオーディオ信号の知覚される品質が、オリジナルのものと区別できないままであると共に、この情報を取り出すことができる、対応する復号器とを含む。

本発明のありうる使用の例は、以下において挙げられる。
１．放送モニタリング：例えばその局および時間に関する情報を含んでいる透かしは、ラジオまたはテレビ番組のオーディオ信号に隠される。被験者により着用された小さいデバイスに取り入れられた復号器は、透かしを取り出すことができ、しかるに広告代理店のために有益な情報、すなわち誰がどの番組をいつ見たかの情報を集める。
２．監査：例えば、透かしは、広告に隠すことができる。自動的に特定の局の送信をモニターすることによって、正確にいつ広告が放送されたかを知ることが可能である。同じようにして、種々のラジオの番組スケジュール、例えば特定の曲がどれくらい演奏されるかなどについての統計情報を取り出すことが可能である。
３．メタデータ埋め込み：提案された方法は、曲または番組、例えばその曲の名前および作成者または番組の時間などについてのデジタル情報を隠すために使用されることができる。

特に、音響心理学的処理装置は、透かしデータ２４５０から独立してマスキング閾値を決定するように構成され、変調装置は、透かしデータから独立しているマスキング閾値に基づいて、予備的振幅重みγ（ｉ；ｊ）を予備的に決定して、各振幅重みとして予備的振幅重みを使用したサンプル波形整形関数の重ね合わせがマスキング閾値に違反することによって、反復的に透かし信号を生成するように構成されうる。その場合、それから予備振幅重みは、各振幅重みとして変化した振幅重みを使用して、サンプル波形整形関数の重ね合わせを得るために変化する。すでに上で概説されたように、チェックにおいて、時間離散的表現の隣接したサンプルが、重ね合わせおよびサンプル時間間隔を上回っているサンプル波形整形関数の時間範囲のため、互いに影響を及ぼし／干渉するので、透かし信号２４４０を生成するためのホール反復プロセス、および最後に使用された振幅重み付けが、透かしデータ表現のこれらの隣接したサンプルに依存する。換言すれば、そのチェックは、サンプルｂ_diff（ｉ，ｊ±１）から最後に使用された振幅重みγ（ｉ；ｊ）の依存性を誘発し、透かし抽出量と透かし信号の聴き取り難さの間のより良いトレードオフを可能にする。もちろん、チェックする、重ね合わせる、そして変動するプロシージャは、反復的に繰り返されうる。

透かしデータ表現の隣接したサンプルへの上述した依存性は、代わりに、振幅重みを非反復的に設定することによって実行されることができる。例えば、変調装置は、（ｉ，ｊ）でのマスキング閾値並びに隣接した透かしサンプルｂ_diff（ｉ，ｊ±１）の両方に基づいて、振幅重みγ（ｉ；ｊ）を解析的に決定することができる。

時間拡散３０５は、時間離散的表現を得るために、時間において透かしデータを拡散するために使用されうる。更に、周波数拡散３０３は、時間離散的表現を得るために、周波数領域において透かしデータを拡散するために使用されうる。時間／周波数解析器５０１は、おおよそのサンプル時間間隔の第１の窓長を使用したラップド変換によってオーディオ信号を時間領域から周波数領域に変換するために使用されうる。時間／周波数解析器は、また、第１の窓長より短い第２の窓長を使用したラップド変換によって時間領域から周波数領域へオーディオ信号を変換するように構成されうる。

更に、前記実施形態は、透かし信号供給装置２４００および透かしを入れたオーディオ信号を得るために透かし信号とオーディオ信号を加算するためのアダー２５１０を含む透かし埋め込み装置２５００；１００を示した。

６．実施態様変形例
いくつかの態様が装置に関連して説明されたが、これらの態様はまた、対応する方法の説明を示すことは明らかである。ここで、ブロックまたはデバイスは方法ステップまたは方法ステップの機能に対応する。類似して、方法ステップに関連して説明された態様は、対応するブロックまたは項目の記載または対応する装置の機能を示す。方法ステップのいくつかまたは全ては、例えば、マイクロプロセッサ、プログラミング可能なコンピュータ、または電子回路のようなハードウェア装置によって（または使用して）実行されることができる。いくつかの実施形態では、最も重要な方法ステップの一つ以上のいくつかは、この種の装置によって実行されることができる。

本発明の符号化された透かし信号または透かし信号が埋め込まれたオーディオ信号は、デジタル記憶媒体に格納されることができ、または、無線伝送媒体などの伝送媒体またはインターネットなどの有線伝送媒体で送信することができる。

特定の実現要求に応じて、本発明の実施形態は、ハードウェアにおいて、または、ソフトウェアにおいて実行されることができる。実施態様は、各方法が実行されるように、プログラミング可能な計算機システムと協動する（または協動することができる）、その上に格納される電子的に読み込み可能な制御信号を有するデジタル記憶媒体、例えばフロッピー（登録商標）ディスク、ＤＶＤ、ブルーレイ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはＦＬＡＳＨメモリを使用して実行されることができる。従って、デジタル記憶媒体は、計算機可読でもよい。

本発明によるいくつかの実施形態は、本願明細書において説明された方法のうちの１つが実行されるように、プログラミング可能な計算機システムと協動することができる電子的に読み込み可能な制御信号を有するデータキャリアを含む。

通常、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実行されることができ、コンピュータプログラム製品がコンピュータ上で動作するとき、そのプログラムコードは、方法のうちの１つを実行するために働く。プログラムコードは、例えば機械読み取り可読キャリアに格納されることができる。

他の実施形態は、機械読み取り可読キャリアに格納された、本願明細書において説明された方法のうちの１つを実行するためのコンピュータプログラムを含む。

換言すれば、本発明の方法の実施形態は、コンピュータプログラムはコンピュータ上で動作するとき、本願明細書において説明される方法のうちの１つを実行するためのプログラムコードを有するコンピュータプログラムである。

従って、本発明の方法の更なる実施形態は、その上に記録された、本願明細書において説明された方法のうちの１つを実行するためのコンピュータプログラムを含んでいるデータキャリア（またはデジタル記憶媒体またはコンピュータ可読媒体）である。

本発明の方法の更なる実施形態は、本願明細書において説明された方法のうちの１つを実行するためのコンピュータプログラムを示しているデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、データ通信接続を介して、例えばインターネットを介して転送されるように例えば構成されることができる。

更なる実施形態は、本願明細書において説明された方法のうちの１つを実行するために構成された又は適合された、処理手段、例えばコンピュータまたはプログラム可能な論理回路を含む。

更なる実施形態は、本願明細書において説明された方法のうちの１つを実行するためのコンピュータプログラムをインストールしたコンピュータを含む。

いくつかの実施形態において、プログラム可能な論理回路（例えば論理プログラミング可能デバイス）は、本願明細書において説明された方法の機能のいくつかまたは全てを実行するために使用されることができる。いくつかの実施形態において、論理プログラミング可能デバイスは、本願明細書において説明された方法のうちの１つを実行するために、マイクロプロセッサと協動することができる。通常、その方法は、好ましくは、いかなるハードウェア装置によっても実行される。

上記実施形態は、本発明の原理のために、単に図示しているだけである。本願明細書において説明された装置およびその詳細の修正および変更が他の当業者にとって明らかであるものと理解される。従って、間近に迫った特許クレームの範囲だけによって制限され、本願明細書の実施形態の記載および説明として示された具体的な詳細によっては制限されないという意図である。

Claims

透かし信号が透かしデータ（２４５０；１０１ａ）を示すように、前記透かし信号がオーディオ信号に付加されるときに、前記オーディオ信号（２４３０；１０６）に隠されることに適している前記透かし信号（２４４０；１０１ｂ）を供給するための透かし信号供給装置（２４００）であって、前記透かし信号供給装置は、
前記オーディオ信号のマスキング閾値を決定するための音響心理学的処理装置（２４１０；１０２）と、
前記透かしデータの時間離散的表現の、サンプル時間間隔（Ｔ_b）で互いに間隔を置かれたサンプル波形整形関数の重ね合わせから前記透かし信号を生成するための変調装置（２４２０；３０７）であって、各サンプル波形整形関数は、前記マスキング閾値に依存する各振幅重みによって乗算された、前記時間離散的表現の各サンプルによって振幅重み付けされ、前記変調装置は、
前記サンプル時間間隔が、前記サンプル波形整形関数の時間範囲より短く、
前記各振幅重みも、時間において前記各サンプルに隣接している前記時間離散的表現のサンプルに依存するように、
構成される、前記変調装置とを含むことを特徴とする、前記透かし信号供給装置。
前記音響心理学的処理装置は、前記透かしデータから独立して前記マスキング閾値を決定するように構成され、前記変調装置は、
前記透かしデータから独立している前記マスキング閾値に基づいて、予備的振幅重みを予備的に決定することと、
前記各振幅重みとして前記予備的振幅重みを使用した前記サンプル波形整形関数の重ね合わせが、前記マスキング閾値を違反するかどうかに関してチェックすることと、
前記各振幅重みとして前記予備的振幅重みを使用した前記サンプル波形整形関数の前記重ね合わせが前記マスキング閾値を違反する場合、前記各振幅重みとして、変化させた振幅重みを使用した前記サンプル波形整形関数の重ね合わせを得るために、前記予備的振幅重みを変化させることと
によって、反復的に前記透かし信号を生成するように構成されることを特徴とする、請求項１に記載の透かし信号供給装置。
前記時間離散的表現を得るために、時間において前記透かしデータを拡散するための時間スプレッダー（３０５）を更に含むことを特徴とする、請求項１又は請求項２に記載の透かし信号供給装置。
前記時間離散的表現を得るために、周波数領域において前記透かしデータを拡散するための周波数スプレッダー（３０３）を更に含むことを特徴とする、請求項１〜請求項３のいずれかに記載の透かし信号供給装置。
前記音響心理学的処理装置は、およそ前記サンプル時間間隔の第１の窓長さを使用したラップド変換によって前記時間領域から周波数領域へ前記オーディオ信号を変換する時間／周波数解析器（５０１）を含むことを特徴とする、請求項１〜請求項４のいずれかに記載の透かし信号供給装置。
前記時間／周波数解析器は、前記第１の窓長さより短い第２の窓長さを使用した前記ラップド変換によっても前記時間領域から前記周波数領域へ前記オーディオ信号を変換するように構成されることを特徴とする、請求項５に記載の透かし信号供給装置。
前記時間離散的表現は、時間離散的サブバンドから成り、前記変調装置は、前記サンプル時間間隔で間隔を置かれたサンプル波形整形関数の重ね合わせから、時間離散的サブバンドごとに、前記透かし信号を生成するように構成され、各サンプル波形整形関数は、前記マスキング閾値に依存する各振幅重みで乗算された前記各時間離散的サブバンドの各サンプルで振幅重み付けされ、各時間離散的サブバンドのための前記重ね合わせの前記サンプル波形整形関数は、前記各時間離散的サブバンドの中心周波数に搬送周波数を含むことを特徴とする、請求項１〜請求項６のいずれかに記載の透かし信号供給装置。
透かし信号が透かしデータを示すように、前記透かし信号がオーディオ信号に付加されるときに、前記オーディオ信号に隠されることに適している前記透かし信号を供給するための、請求項１〜請求項７のいずれかに記載の透かし信号供給装置と、
透かしを入れたオーディオ信号を得るために、前記透かし信号および前記オーディオ信号を加算するためのアダーとを含むことを特徴とする、透かし埋め込み装置。
透かし信号が透かしデータ（１０１ａ）を示すように、前記透かし信号がオーディオ信号に付加されるときに、前記オーディオ信号（１０６）に隠されることに適している前記透かし信号（１０１ｂ）を供給するための方法であって、前記方法は、
前記オーディオ信号のマスキング閾値を決定するステップと、
前記透かしデータの時間離散的表現の、サンプル時間間隔（Ｔ_b）で互いに間隔を置かれたサンプル波形整形関数の重ね合わせから前記透かし信号を生成するステップであって、各サンプル波形整形関数は、前記マスキング閾値に依存する各振幅重みによって乗算された、前記時間離散的表現の各サンプルによって振幅重み付けされるステップであって、前記生成は、
前記サンプル時間間隔が、前記サンプル波形整形関数の時間範囲より短く、
前記各振幅重みも、時間において前記各サンプルに隣接している前記時間離散的表現のサンプルに依存するように実行される、ステップとを含むことを特徴とする、方法。
透かし埋め込み方法は、
請求項９に記載の、透かし信号が透かしデータを示すように、前記透かし信号がオーディオ信号に付加されるときに、前記オーディオ信号に隠されることに適している前記透かし信号を供給するステップと、
透かしを入れたオーディオ信号を得るために、前記透かし信号および前記オーディオ信号を加算するステップとを含むことを特徴とする、前記透かし埋め込み方法。
コンピュータ上で動作するとき、請求項９又は請求項１０に記載の方法を実行するためにそこに格納された命令を有するコンピュータプログラム。