JP2013520693A - 透かし信号の供給および透かし埋め込み - Google Patents

透かし信号の供給および透かし埋め込み Download PDF

Info

Publication number
JP2013520693A
JP2013520693A JP2012554322A JP2012554322A JP2013520693A JP 2013520693 A JP2013520693 A JP 2013520693A JP 2012554322 A JP2012554322 A JP 2012554322A JP 2012554322 A JP2012554322 A JP 2012554322A JP 2013520693 A JP2013520693 A JP 2013520693A
Authority
JP
Japan
Prior art keywords
watermark
time
signal
sample
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012554322A
Other languages
English (en)
Other versions
JP5548278B2 (ja
Inventor
シュテファン ヴァブニック
イェルク ピッケル
ベルト グレーフェンボッシュ
ベルンハルト グリル
エルンスト エーバーライン
ガルド ジョヴァンニ デル
シュテファン クレーゲロウ
ラインハルト ツィツマン
トビアス ブリエム
マルコ ブライリング
ユリアーネ ボーサム
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2013520693A publication Critical patent/JP2013520693A/ja
Application granted granted Critical
Publication of JP5548278B2 publication Critical patent/JP5548278B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/12Arrangements for observation, testing or troubleshooting
    • H04H20/14Arrangements for observation, testing or troubleshooting for monitoring programmes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/29Arrangements for monitoring broadcast services or broadcast-related services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/29Arrangements for monitoring broadcast services or broadcast-related services
    • H04H60/33Arrangements for monitoring the users' behaviour or opinions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

透かし信号が透かしデータ(2450)を示すように、透かし信号がオーディオ信号に付加されるときに、オーディオ信号(2430)に隠されることに適している透かし信号(2440)を供給するための透かし信号供給装置(2400)が説明される。透かし信号供給装置は、オーディオ信号のマスキング閾値を決定するための音響心理学的処理装置(2410)と、透かしデータの時間離散的表現のサンプル時間間隔(Tb)で互いに間隔を置かれたサンプル波形整形関数の重ね合わせから透かし信号を生成するための変調装置(2420)であって、各サンプル波形整形関数は、マスキング閾値に依存する各振幅重みによって乗算された、時間離散的表現の各サンプルによって振幅重み付けされる変調装置であって、変調装置は、サンプル時間間隔が、サンプル波形整形関数の時間範囲より短く、各振幅重みも、時間において各サンプルに隣接している時間離散的表現のサンプルに依存するように構成される変調装置とを含む。
【選択図】図24

Description

本発明は、透かし信号を供給し、その透かし信号を使用して透かしを埋め込むための透かし信号供給装置に関する。
多くの技術的応用において、例えば、オーディオ信号、ビデオ信号、グラフィックス、測定量などのような有用なデータまたは「主データ(main data)」を示している情報または信号に追加の情報を含むことが望ましい。多くの場合、追加の情報がそれが前記データのユーザによって知覚できない方法で主データ(例えばオーディオデータ、表示データ、静止画データ、測定データ、テキストデータ、その他)に密接に結びつくように、追加の情報を含むことが望ましい。また、場合によっては、追加のデータが主データ(例えばオーディオデータ、表示データ、静止画データ、測定データ、その他)から容易に取り除くことができないように、追加のデータを含むことが望ましい。
これは、特にデジタル権利管理を実行することが望まれるアプリケーションにおいてあてはまる。しかしながら、時には、単に有用なデータに実質的に感知できない補助情報を付け加えることが望まれるだけである。例えば、ある場合には、補助情報が、オーディオデータのソース、オーディオデータの内容、オーディオデータに関連した権利などに関する情報を供給するように、オーディオデータに補助情報を付け加えることは、望ましい。
有用なデータまたは「主データ」に追加のデータを埋め込むために、「透かし(watermarking)」と呼ばれる構想が使用されうる。透かし構想は、オーディオデータ、静止画データ、表示データ、テキストデータなどのような多くの異なる種類の有用なデータのための文献で述べられている。
以下では、透かし構想が述べられるいくつかの参考文献が与えられる。しかし、更なる詳細のために、透かしに関連した広い分野のテキストブックおよび刊行物についても読み手の注意を引く。
独国特許第19640814C2は、非可聴データ信号をオーディオ信号に取り入れるための符号化方法、および、非可聴形式でオーディオ信号に含まれるデータ信号を復号する方法を示す。非可聴データ信号をオーディオ信号に取り入れるための符号化方法は、オーディオ信号をスペクトル領域に変換することを含む。符号化方法はまた、オーディオ信号のマスキング閾値を決定すること、および疑似雑音信号の供給を含む。符号化方法はまた、周波数拡散データ信号を得るために、データ信号を供給すること、および疑似雑音信号にそのデータ信号を乗算することを含む。符号化方法はまた、拡散データ信号にマスキング閾値で重み付けすること、および、オーディオ信号と重み付けされたデータ信号を重ねることを含む。
加えて、国際公開93/07689は、非可聴の符号化されたメッセージであり、そのメッセージが放送チャンネルまたは局、番組、および/または正確な日付を識別するメッセージを、番組の音響信号に追加することによって、ラジオ局またはテレビチャンネルにより放送された、または媒体に記録された番組を自動的に識別するための方法および装置を示す。前記文書で述べられた実施形態において、音響信号は、周波数成分を分割することを可能にし、符号化された識別メッセージを形成するために、所定の方法で周波数成分のいくつかのエネルギーを変えることを可能にしているデータ処理装置に、アナログ−デジタル変換器を介して送信される。データ処理装置の出力は、デジタル−アナログ変換器を介して、音響信号を放送するまたは記録するためのオーディオ出力に接続される。前記文書で述べられた他の実施形態において、分離されたバンドのエネルギーがこのように音響信号を符号化するために変えられることができるように、アナログバンドパスは、周波数のバンドを音響信号から分離するために使用される。
米国特許5,450,490は、オーディオ信号に少なくとも一つの符号周波数成分を有する符号を含むための装置および方法を示す。人間のヒアリングに対して符号周波数成分をマスクするためにオーディオ信号のさまざまな周波数成分の能力は評価され、これらの評価に基づいて、振幅は符号周波数成分に割り当てられる。符号化されたオーディオ信号の符号を検出するための方法と装置も説明される。符号化されたオーディオ信号の符号周波数成分は、予想される符号振幅に基づいて、または、符号成分の周波数を含んでいる可聴周波数の範囲内のノイズ振幅に基づいて検出される。
国際公開94/11989は、放送または記録されたセグメントを符号化/復号して、それに加えて視聴者公開をモニターするための方法と装置を説明する。放送または記録されたセグメント信号の情報を符号化および復号するための方法と装置が説明される。その文書において説明された実施形態において、視聴者モニタリングシステムは、スペクトラム拡散符号化を使用して、放送または記録されたセグメントのオーディオ信号部分の識別情報を符号化する。モニタリングデバイスは、マイクロホンを介して放送または記録された信号の音響的に再生されたバージョンを受信して、有意な環境ノイズにもかかわらずオーディオ信号部から識別情報を復号して、この情報を格納する。そして、自動的に視聴者のためのダイアリーを供給して、それは中央化された施設に後にアップロードされる。別のモニタリングデバイスは、放送信号の付加情報を復号し、それは中央設備で視聴者ダイアリー情報と整合される。このモニターは、ダイヤルアップ電話線を使用して中央化された施設にデータを同時に送信することができて、スペクトラム拡散技術を使用して符号化されて、第三者から放送信号によって変調された信号を介して、中央化された施設からデータを受信する。
国際公開95/27349は、オーディオ信号の符号を含み、復号するための装置および方法を説明する。オーディオ信号に少なくとも一つの符号周波数成分を有するコードを含むための装置および方法が説明される。人間のヒアリングに対して符号周波数成分をマスクするためにオーディオ信号のさまざまな周波数成分の能力は評価され、これらの評価に基づいて、振幅は符号周波数成分に割り当てられる。符号化されたオーディオ信号の符号を検出するための方法と装置も説明される。符号化されたオーディオ信号の符号周波数成分は、予想される符号振幅に基づいて、または、符号成分の周波数を含んでいる可聴周波数の範囲内のノイズ振幅に基づいて検出される。
しかしながら、透かし情報をオーディオ信号の時間/周波数スペクトルに挿入するとき、マスキング閾値の下に透かし情報を隠すこと、あるいは、透かし情報にできるだけ多くのエネルギーを割り当てること、しかるに復号側での抽出量を増加させることと、透かしを入れたオーディオ信号を再生するときに埋め込まれている透かし情報を非可聴に保つこととの間の最適トレードオフを見つけることは困難である。
独国特許第19640814C2 国際公開93/07689 米国特許5,450,490 国際公開94/11989 国際公開95/27349
この状況を考慮して、透かし信号の抽出量と非可聴性とのより良いトレードオフを可能にする、透かし信号を供給するための方式とその透かし信号を使用して透かしを埋め込むための方式を提供することが、本発明の目的である。
この目的は、請求項1に記載の透かし信号供給装置、請求項8に記載の透かし埋め込み装置、請求項9または請求項10に記載の方法、および請求項11に記載のコンピュータプログラムによって達成される。
本発明の一実施形態によれば、透かし信号が透かしデータを示すように、透かし信号がオーディオ信号に付加されるとき、オーディオ信号に隠されるのに適している透かし信号を供給するための透かし信号供給装置は、オーディオ信号のマスキング閾値を決定するための音響心理学的処理装置と、透かしデータの時間離散的表現のサンプル時間間隔で、互いに間隔をあけたサンプル波形整形関数(sample−shaping function)の重ね合わせから透かし信号を生成するための変調装置を含み、そのサンプル波形整形関数は、マスキング閾値に依存する各振幅重みにより乗算された時間離散表現の各サンプルで振幅重み付けされ、その変調装置は、サンプル時間間隔がサンプル波形整形関数の時間範囲(time extension)より短くなるように、そして、各振幅重みが、時間において各サンプルに隣接している時間離散的表現のサンプルにも依存するように、構成される。
本発明は、透かし信号の抽出量と非可聴性との間のより良いトレードオフが、マスキング閾値に依存するだけでなく、各サンプルに隣接している透かしデータの時間離散的表現のサンプルにも依存する、透かし信号を重ね合わせで形成するサンプル波形整形関数を振幅重み付けするための振幅重みを選択することによって達成されるという発見に基づく。このようにして、隣接したサンプル位置のサンプル波形整形関数は重なり合うことができる、すなわち、サンプル時間間隔は、サンプル波形整形関数の時間範囲より短くてもよく、これにもかかわらず、この種の隣接したサンプル波形整形関数間の干渉は、振幅重みを設定するときに、現在重み付けされたサンプルと隣接する時間離散的表現のサンプルを考慮に入れることによって補償されることができる。更に、サンプル波形整形関数がより大きい時間範囲を有することが可能となるので、それらの周波数応答は、より狭くされることができ、それによって、すなわち、透かしを入れたオーディオ信号が反響する環境において再生されるときに、透かし信号の抽出量を残響に対してより強くする。換言すれば、マスキング閾値だけでなく、各サンプルと隣接する透かしデータの時間的離散表現のサンプルに対する各振幅重みの依存は、隣接するサンプル波形整形関数間の聞き取れる干渉を補償することを可能にし、それがなければマスキング閾値の違反につながりうる。
本発明による実施形態は、同封の図を参照して、以下で説明される。
図1は、本発明の一実施形態の透かし挿入器のブロック略図を示す。 図2は、本発明の一実施形態の透かし復号器のブロック略図を示す。 図3は、本発明の一実施形態の透かしジェネレータの詳細なブロック略図を示す。 図4は、本発明の一実施形態に使用するための変調装置の詳細なブロック略図を示す。 図5は、本発明の一実施形態に使用するための音響心理学的な処理モジュールの詳細なブロック略図を示す。 図6は、本発明の一実施形態に使用するための音響心理学的モデル処理装置のブロック略図を示す。 図7は、周波数に関するブロック801によって、オーディオ信号出力のパワースペクトルのグラフ表示を示す。 図8は、周波数に関するブロック802によって、オーディオ信号出力のパワースペクトルのグラフ表示を示す。 図9は、振幅計算のブロック略図を示す。 図10aは、変調装置のブロック略図を示す。 図10bは、時間周波数要求に関する係数の位置の図を示す。 図11aは、同期モジュールの実施態様の変形例のブロック略図を示す。 図11bは、同期モジュールの実施態様の変形例のブロック略図を示す。 図12aは、透かしの時間的整合を見つける課題の図を示す。 図12bは、メッセージ開始を確認する課題の図を示す。 図12cは、全メッセージ同期モードの同期シーケンスの時間的整合の図を示す。 図12dは、部分的メッセージ同期モードの同期シーケンスの時間的整合の図を示す。 図12eは、同期モジュールの入力データの図を示す。 図12fは、同期ヒットを確認する構想の図を示す。 図12gは、同期シグネチャ相関器のブロック略図を示す。 図13aは、時間的逆拡散のための一例の図を示す。 図13bは、ビットと拡散シーケンスとの間の要素ごとの乗算のための一例の図を示す。 図13cは、時間的加算平均の後の同期シグネチャ相関器の出力の図を示す。 図13dは、同期シグネチャの自己相関関数によって平滑された同期シグネチャ相関器の出力の図を示す。 図14は、本発明の一実施形態の透かし抽出器のブロック略図を示す。 図15は、候補メッセージとして時間周波数領域表現の一部の選択の略図を示す。 図16は、解析モジュールのブロック略図を示す。 図17aは、同期相関器の出力の図示を示す。 図17bは、復号化メッセージの図示を示す。 図17cは、透かしを入れた信号から抽出される同期位置の図を示す。 図18aは、ペイロード、ビタビ終了シーケンスを有するペイロード、ビタビを符号化されたペイロードおよびビタビ・コード化されたペイロードの繰り返しコード化バージョンの図示を示す。 図18bは、透かしを入れた信号を埋め込むために使用される副搬送波の図を示す。 図19は、符号化されていないメッセージ、符号化メッセージ、同期メッセージ、および、同期シーケンスがメッセージに適合される透かし信号の図を示す。 図20は、いわゆる「ABC同期」構想の第1ステップの図を示す。 図21は、いわゆる「ABC同期」構想の第2ステップの図を示す。 図22は、いわゆる「ABC同期」構想の第3ステップの図を示す。 図23は、ペイロードおよびCRC部分を含んでいるメッセージの図を示す。 図24は、本発明の一実施形態による透かし信号供給装置のブロック略図を示す。 図25は、本発明の一実施形態による透かし埋め込み装置のブロック略図を示す。
1. 透かし信号供給
以下では、透かし信号供給装置2400について、図24を参照して説明する。透かし信号供給装置2400は、音響心理学的処理装置2410と変調装置2420とを含む。音響心理学的処理装置2410は、透かし信号供給装置2400が透かし信号2440を供給することになるオーディオ信号2430を受信するように構成される。次に、変調装置2420は、透かし信号2440を生成するために音響心理学的処理装置2410によって供給されるマスキング閾値を使用するように構成される。特に、変調装置2420は、透かし信号2440によって示される透かしデータ2450の時間離散的表現のサンプル時間間隔で互いに間隔を置かれたサンプル波形整形関数の重ね合わせから透かし信号2440を生成するように構成される。特に、変調装置2420は、透かしを入れたオーディオ信号を得るために、透かし信号2440がオーディオ信号2430に付加されるとき、透かし信号2440がオーディオ信号2430に隠されることに適しているように透かし信号2440を生成するときにマスキング閾値を使用する。
下でより詳細に説明されるように、透かしデータの時間離散的表現は、実際に、時間/周波数離散的表現でありえ、時間領域および/または周波数領域の拡散を用いて透かしデータ2450から得うる。時間離散的表現のサンプルが割り当てられるグリッド位置の時間または時間/周波数グリッドは、時間に関して固定され、特に、オーディオ信号2430から独立しうる。次に、重ね合わせは、先ほど言及されたグリッドのグリッド位置に配置されたそのサンプルを有する時間/離散的表現の畳み込みと解釈されることができ、そのサンプルは、次に、マスキング閾値だけでなく、時間において隣接する時間離散表現のサンプルにも依存する振幅重みによって重み付けされる。
マスキング閾値の振幅重みの依存は、以下の通りでありえる。特定の時間ブロックで時間離散的表現の特定のサンプルによって乗算されるためにある振幅重みは、次に、その時間および周波数に依存するマスキング閾値の各時間ブロックから得られる。このように、透かしデータの時間/周波数離散的表現の場合には、各サンプルは、その透かし表現サンプルの各時間/周波数グリッド位置でサンプリングされたマスキング閾値に対応する振幅重みで乗算される。
さらにまた、透かしデータ2450から時間離散的表現を取り出すための時間差分符号化(time−differential coding)を使用することは、可能である。具体的な実施形態に関する詳細について、以下で説明する。
変調装置2420は、各サンプル波形整形関数が音響心理学的処理装置2410で決定されたマスキング閾値に依存する各振幅重みによって乗算された時間離散的表現の各サンプルによって振幅重み付けされるように、サンプル波形整形関数の重ね合わせから透かし信号2440を生成するように構成される。特に、変調装置2420は、サンプル時間間隔がサンプル波形整形関数の時間範囲より短いように、そして、各振幅重みも、各サンプルに隣接する時間離散的表現のサンプルに依存するように、構成される。
下でより詳細に概説されるように、サンプル時間間隔がサンプル波形整形関数の時間範囲より短いことは、時間において隣接するサンプル波形整形関数間の干渉をもたらし、それによって、思いがけなくマスキング閾値を違反する危険性を増加させる。しかしながら、マスキング閾値のこの種の違反は、振幅重みを、現在のサンプルに隣接する時間離散的表現のサンプルにも依存させることによって補償される。
下で概説される透かしシステムのための実施形態において、先ほど言及された依存は、振幅重みの反復的な設定によって実現される。特に、音響心理学的処理装置2410は、透かしデータから独立して、マスキング閾値を決定することができ、その一方で、変調装置2420は、透かしデータから独立しているマスキング閾値に基づいて、振幅重みを予備的に決定することによって、振幅重みを反復的に設定するように構成されることができる。変調装置2420は、予備的に決定された振幅重みで乗算された透かし表現のサンプルによって振幅重み付けされるようなサンプル波形整形関数の重ね合わせが、そのマスキング閾値を違反するかどうかに関してチェックするように構成されることができる。違反する場合は、変調装置2420は、更なる重ね合わせを得るために、予備的に決定された振幅重みを変化させることができる。変調装置2420は、振幅重みが特定の分散閾値の範囲内の値を維持しているなど各ブレーク条件が満たされるまで、その後の重ね合わせに関するチェックおよび変化を含むこれらの反復を繰り返すことができる。上述のチェックにおいて、時間離散的表現の隣接したサンプルが、重ね合わせおよびサンプル時間間隔を上回っているサンプル波形整形関数の時間範囲のため、互いに影響を及ぼしあう/干渉しあうので、生成するためのホール反復プロセスは、透かしデータ表現のこれらの隣接するサンプルに依存している。
下で概説される実施形態において、時間領域における透かしデータの拡散は、先ほど言及された時間離散的表現を明らかにするために使用される点に留意する必要がある。しかし、この種の時間拡散は、離したままにされうる。同じことは、下で概説される実施形態において使用される周波数拡散にもあてはまる。
2. 透かし埋め込み装置
図25は、図24の透かし信号供給装置2400を使用している透かし埋め込み装置を示す。特に、図25の透かし埋め込み装置は、通常、参照番号2500によって示され、透かし信号供給装置2400の他に、透かしを入れたオーディオ信号2530を得るために、透かし信号供給装置2400による出力としての透かし信号2440とオーディオ信号2430を加算するためのアダー2510を含む。
3. システム説明
以下に、透かし挿入器および透かし復号器を含む透かし伝送のシステムについて説明される。当然であるが、透かし挿入器および透かし復号器は、互いに独立して使用することができる。
システムの説明のために、トップダウンアプローチが、ここでは選択される。まず、それは、符号器と復号器との間で区別される。次に、セクション3.1〜セクション3.5において、各処理ブロックについて詳述する。
システムの基本構造は、図1および図2に見ることができ、それぞれ、符号器および復号器側を表す。図1は、透かし挿入器100のブロック略図を示す。符号器側で、透かし信号101bは、バイナリデータ101aから、そして、音響心理学的な処理モジュール102と交換される情報104、105に基づいて、処理ブロック101(透かしジェネレータとも呼ばれる)において生成される。一般的にブロック102から供給された情報は、透かしが聞こえないことを保証する。透かしジェネレータ101によって生成された透かしは、次にオーディオ信号106に付加される。透かしを入れた信号107は、次に送信されうる、格納されうる、または、更に処理されうる。マルチメディアファイル、例えばオーディオビデオファイルの場合には、適当な遅延が、オーディオビデオ同時発生を失わないためにビデオストリームに付加されることを必要とする。多重チャネルオーディオ信号の場合には、各チャネルは、この文書で説明されたように別々に処理される。処理ブロック101(透かしジェネレータ)および102(音響心理学的処理モジュール)は、それぞれ、セクション3.1および3.2において詳細に説明される。
復号器側は、図2において示され、それは透かし検出器200のブロック略図を示す。例えばマイクロホンによって記録された、透かしを入れたオーディオ信号200aは、システム200に利用できるようになる。解析モジュールとも呼ばれる第1のブロック203は、時間/周波数領域において、そのデータ(例えば透かしを入れたオーディオ信号)を復調し、変換し、(これによって、透かしを入れたオーディオ信号200aの時間周波数領域表現204を得て、)それを、入力信号204を解析して、時間的同期を実行する、すなわち、(例えば時間周波数領域表現に関連して、符号化された透かしデータの)符号化されたデータの時間的整合を決定する同期モジュール201に渡す。この情報(例えば結果として生じる同期情報205)は、そのデータを復号する(そして、結果的に、透かしを入れたオーディオ信号200aのデータ内容を示すバイナリデータ202aを供給する)透かし抽出器202に伝えられる。
3.1 透かしジェネレータ101
透かしジェネレータ101は、図3に詳細に示される。オーディオ信号106に隠される(±1として表される)バイナリデータが、透かしジェネレータ101に与えられる。ブロック301は、等長Mpのパケットでデータ101aをオーガナイズする。付加ビットは、各パケットに信号送信する目的のために付加される(例えば追加される)。Msがそれらの数を示すとする。それらの使用は、セクション3.5において詳細に説明される。なお、以下では、信号付加ビットとペイロードビットの各パケットは、メッセージを示す。
長さNm=Ms+Mpの各メッセージ301aは、エラーに対する保護のためにビットを符号化する役割を果たす処理ブロック302、チャネル符号器に渡される。このモジュールの可能な実施形態は、インターリーバと共に畳み込み符号器から構成される。畳み込み符号器の比率は、透かしを入れるシステムのエラーに対する保護の全体の度合いに多大に影響する。他方、インターリーバは、ノイズバーストに対する保護をもたらす。インターリーバの演算の範囲は、1つのメッセージに限定することができるが、それは、より多くのメッセージまで拡張することもできる。Rcは、符号比率、例えば1/4を示すものとする。メッセージごとの符号化されたビットの数は、Nm/Rcである。チャネル符号器は、例えば、符号化されたバイナリメッセージ302aを供給する。
次の処理ブロック(303)は、周波数領域における拡散を実行する。充分なSN比を達成するために、情報(例えばバイナリメッセージ302aの情報)は、Nfの慎重に選択されたサブバンドにおいて拡散されて、送信される。周波数におけるそれらの正確な位置は、演繹的に決定されて、符号器および復号器の両方に知られている。この重要なシステムパラメータの選択についての詳細は、セクション3.2.2.において与えられる。周波数における拡散は、サイズNf×1の拡散シーケンスcfで決定される。ブロック303の出力303aは、Nfのビットストリームから構成され、サブバンドごとに1つのビットストリームである。i番目のビットストリームは、拡散シーケンスcfのi番目の成分を入力ビットに乗算することによって得られる。最もシンプルな拡散は、各出力ストリームにビットストリームをコピーすることからなる、すなわち1つの拡散シーケンスを使用する。
同期方式挿入器とも示されるブロック304は、ビットストリームに同期信号を付加する。復号器がビットまたはデータ構造のいずれの時間的整合も知らないとき、すなわち、各メッセージが始まるときに、ロバストな同期は重要である。同期信号は、各々NfビットのNsのシーケンスから成る。そのシーケンスは、ビットストリーム(またはビットストリーム303a)に、要素ごと、かつ、周期的に乗算される。例えば、a、bおよびcは、Ns=3の同期シーケンス(同期拡散シーケンスとも呼ばれる)とされる。ブロック304は、aに第1の拡散ビット、bに第2の拡散ビット、cに第3の拡散ビットを乗算する。続くビットのために、その処理は周期的に、すなわち、aに第4のビット、bに第5のビットなど繰り返される。したがって、複合情報―同期情報304aが得られる。同期シーケンス(同期拡散シーケンスとも呼ばれる)は、誤った同期のリスクを最小化するために慎重に選ばれる。より詳細については、セクション3.4において与えられる。また、シーケンス a、b、c、…が一連の同期拡散シーケンスとみなされうることに留意する必要がある。
ブロック305は、時間領域における拡散を実行する。入力での各拡散ビット、すなわち、長さNfのベクトルは、時間領域においてNt回繰り返される。周波数における拡散と同様に、我々は、サイズNt×1の拡散シーケンスctを定める。i番目の時間的繰り返しは、ctのi番目の成分で乗算される。
ストリームの始め、すなわちj=0で、bdiff(i,j−1)は、1にセットされる。
ビットごとのビット波形整形は、音響心理学的な処理モジュール(102)によって制御された反復処理において繰り返される。それを聞こえなく保つと共に、透かしにできるだけ多くのエネルギーを割り当てるために、重みγ(i,j)を微調整するには反復が必要である。より詳細については、セクション3.2において与えられる。
3.2 音響心理学的な処理モジュール102
図5に示したように、音響心理学的な処理モジュール102は、3つの部分から成る。第1のステップは、時間オーディオ信号を時間/周波数領域に変換する解析モジュール501である。この解析モジュールは、異なる時間/周波数分解能で並列解析を行うことができる。解析モジュールの後、時間/周波数データは、音響心理学的なモデル(PAM)502に移される。そこにおいて、透かし信号のためのマスキング閾値は、音響心理学的な考慮に従って算出される(E.ツビッカー、H.ファストル著の「心理音響事実およびモデル」を参照のこと)。マスキング閾値は、サブバンドおよび時間ブロックごとにオーディオ信号において隠されることができるエネルギー量を示す。音響心理学的な処理モジュール102の最後のブロックは、振幅計算モジュール503を表す。マスキング閾値が条件を満たす、すなわち、埋め込みエネルギーがマスキング閾値によって定められたエネルギー以下であるように、このモジュールは、透かし信号の生成において使用される振幅ゲインを決定する。
3.2.1 時間/周波数解析501
ブロック501は、ラップド変換(lapped transform)によってオーディオ信号の時間/周波数変換を行う。複数の時間/周波数分解能が実行されるときに、最高のオーディオ品質を得ることができる。ラップド変換の1つの効率的な実施形態は、窓を掛けた時間ブロックの高速フーリエ変換(FFT)に基づく短時間フーリエ変換(STFT)である。窓の長さは時間/周波数分解能を決定し、その結果、より長い窓は、より低い時間分解能およびより高い周波数分解能を産生し、一方、より短い窓は、その逆を行なう。他方、窓の形状は、とりわけ、周波数漏洩を決定する。
提案されたシステムのために、我々は、2つの異なる分解能を有するデータを解析することによって、聞こえない透かしを達成する。第1のフィルタバンクは、Tb、すなわちビット長のホップサイズによって特徴づけられる。ホップサイズは、2つの隣接する時間ブロック間の時間間隔である。窓長は、およそTbである。窓形状が、ビット波形整形のために使用されたものと同じである必要はなく、通常、人間のヒアリングシステムをモデル化するべきであることに留意されたい。多数の刊行物は、この課題を検討する。
第2のフィルタバンクは、より短い窓を適用する。達成されるより高い時間分解能は、音声に透かしを埋め込むとき、その時間的構造がTbより一般に微細であるので、特に重要である。
入力オーディオ信号のサンプリングレートは、それがエイリアシングのない透かし信号を示すのに十分大きい限り、重要でない。例えば、透かし信号に含まれた最大周波数成分が6kHzである場合、時間信号のサンプリングレートは少なくとも12kHzでなければならない。
3.2.2 音響心理学的なモデル502
音響心理学的なモデル502は、透かしを入れたオーディオ信号をオリジナルから区別できないままにして、マスキング閾値、すなわち、サブバンドおよび時間ブロックごとにオーディオ信号において隠されることができるエネルギー量を決定するタスクを有する。
続く処理ステップは、サブバンドおよび時間ブロックごとに各時間/周波数分解能に関して別々に実行される。処理ステップ801は、スペクトルスムージングを実行する。実際に、音の要素は、パワースペクトルのノッチと同様に、滑らかにされることを必要とする。これは、いくつかの方法で実行されうる。調性測度(tonality measure)は、算出されることができて、適応平滑フィルタを駆動するために使用される。あるいは、このブロックのより単純な実施態様において、メディアンライクフィルタ(median−like filter)が使用されることができる。メジアンフィルタは、値のベクトルを考慮して、それらの中間値を出力する。メディアンライクフィルタにおいて、50%より異なる変位値に対応する値は、選択されることができる。フィルタ幅は、Hzで定義され、より低い周波数で始まる非線形移動平均として適用され、できる限り高い周波数で終わる。801の演算は、図7において示される。赤い曲線は、スムージング法の出力である。
一旦スムージングが実行されると、閾値は、周波数マスキングだけを考慮しているブロック802によって算出される。また、この場合、異なる可能性がある。1つの方法は、マスキング(masking)エネルギーEiを計算するためにサブバンドごとの最小値を使用することである。これは、効果的にマスキングを操作する信号の実効エネルギーである。この値から、我々は、マスクされたエネルギーJiを得るために、特定のスケーリングファクタを単に乗算することができる。これらのファクタは、サブバンドおよび時間/周波数分解能ごとに異なり、経験的音響心理学的な実験を経て得られる。これらのステップは、図8において示される。
ブロック805において、時間的マスキングが考慮される。この場合、同じサブバンドのための異なる時間ブロックが解析される。マスクされたエネルギーJiは、経験的に得られたポストマスキングプロファイルによって修正される。2つの隣接する時間ブロック、すなわち、k−1およびkについて考慮してみる。対応するマスクされたエネルギーは、Ji(k−1)およびJi(k)である。ポストマスキングプロファイルは、例えば、マスキングエネルギーEiが時間kでエネルギーJiを、そして、時間k+1でα・Jiをマスクすることができる。この場合、ブロック805は、Ji(k)(現在の時間ブロックによってマスクされたエネルギー)およびα・Ji(k+1)(前の時間ブロックによってマスクされたエネルギー)を比較し、最大のものを選択する。ポストマスキングプロファイルは、文献において利用でき、経験的音響心理学的な実験を経て得られた。なお、大きなTb、すなわち20msより大きいTbのために、ポストマスキングは、より短い時間窓を用いて、時間/周波数分解能だけに適用される。
まとめると、ブロック805の出力で、我々は、2つの異なる時間/周波数分解能のために得られた各サブバンドおよび時間ブロックごとにマスキング閾値を有する。その閾値は、周波数マスキングおよび時間マスキングの両方の事象を考慮することによって得られた。ブロック806において、異なる時間/周波数分解能のための閾値は、結合される。例えば、ありうる実施態様は、806がビットが割り当てられる時間および周波数間隔に対応するすべての閾値を考慮して、最小値を選択するということである。
3.2.3 振幅計算ブロック503
図9を参照する。503の入力は、すべての音響心理学的に動機づけされた計算が実行される音響心理学的なモデル502からの閾値505である。振幅計算器503において、閾値を有する追加の計算が実行される。まず、振幅マッピング901が起こる。このブロックは、単にマスキング閾値(通常、エネルギーとして表される)をセクション3.1において定められたビット波形整形関数をスケールするために使用されることができる振幅に変換するだけである。その後、振幅適合ブロック902が実行される。このブロックは、反復して、マスキング閾値が実際条件が満たされるように、透かしジェネレータ101のビット波形整形関数を乗算するために使用される振幅γ(i,j)を適応させる。実際、すでに述べられるように、ビット波形整形関数は、通常、Tbより大きい時間間隔にわたっている。従って、点i,jでのマスキング閾値の条件を満たす正しい振幅γ(i,j)を乗算することは、点i,j−1での要件を必ずしも満たすというわけではない。これは、プリエコーが聞こえるようになるので、顕著な立ち上がりで特に重要である。回避される必要がある他の状況は、聞き取れる透かしにつながりうる異なるビットの最後部の不運な重ね合わせである。従って、ブロック902は、閾値が条件を満たしていたどうか調べるために透かしジェネレータによって生成された信号を解析する。条件を満たしていない場合には、それに応じて振幅γ(i,j)を修正する。
これで符号器側を終了とする。続くセクションは、受信器(透かし復号器とも呼ばれる)で実行された処理ステップを扱う。
解析モジュールは、図16において表される3つの部分から成る:解析フィルタバンク1600、振幅規格化ブロック1604および差分復号化1608。
サブバンド周波数fiが特定の間隔Δfの倍数として選択される場合、解析フィルタバンクは高速フーリエ変換(FFT)を使用して能率的に実行されることができる。
我々は、最初にメッセージ同期についてだけ述べる。同期シグネチャは、セクション3.1で述べたように、連続的かつ周期的に透かしを埋めこまれる所定の命令のNsのシーケンスから成る。同期モジュールは、同期シーケンスの時間的整合を読み出すことができる。サイズNsに応じて、我々は、それぞれ図12cおよび図12dにおいて示される、2つの動作モードを区別することができる。
全メッセージ同期モード(図12c)において、我々は、Ns=Nm/Rcを有する。図における説明を簡単にするため、我々は、Ns=Nm/Rc=6であり、時間拡散がない、すなわちNt=1であると仮定する。説明の便宜上、使用された同期シグネチャは、メッセージの下に示される。実際は、セクション3.1で述べたように、それらは、符号化ビットおよび周波数拡散シーケンスに応じて変調される。このモードにおいて、同期シグネチャの周期性は、メッセージの一つと同一である。従って、同期モジュールは、同期シグネチャの時間的整合を見つけることによって、各メッセージの始まりを確認することができる。我々は、新しい同期シグネチャが始まる時間的位置を同期ヒット(synchronization hits)と呼ぶ。同期ヒットは、それから透かし抽出器202に引き継がれる。
第2の考えられるモード、部分的メッセージ同期モード(図12d)は、図12dにおいて表される。この場合、我々は、Ns<Nm=Rcを有する。図において、我々はNs=3とした。その結果、3つの同期シーケンスがメッセージごとに2回繰り返される。メッセージの周期性が同期シグネチャの周期性の倍数である必要がない点に留意されたい。この動作モードにおいて、同期ヒットの全てが、メッセージの始まりに対応するというわけではない。同期モジュールは、ヒット間を区別する手段を有さず、このタスクは透かし抽出器202に与えられる。
同期モジュールの処理ブロックは、図11aおよび11bにおいて表される。同期モジュールは、同期シグネチャ相関器1201の出力を解析することによって、すぐに、ビット同期およびメッセージ同期(全部または一部分のいずれか)を行う。時間/周波数領域204のデータは、解析モジュールによって供給される。ビット同期がまだ利用できないので、ブロック203は、セクション3.3に説明したように、係数Nosを有するデータをオーバーサンプリングする。入力データの図は、図12eに与えられる。この例のために、我々は、Nos=4、Nt=2およびNs=3とした。換言すれば、同期シグネチャは、(a、b、cで示される)3つのシーケンスから成る。この場合、拡散シーケンスct=[1 1]Tを有する時間拡散は、時間領域において、単に2回各ビットを繰り返す。正確な同期ヒットは、矢印で示され、各同期シグネチャの始まりに対応する。同期シグネチャの周期は、Nt・Nos・Ns=Nsblであり、それは例えば2・4・3=24である。同期シグネチャの周期性のため、同期シグネチャ相関器(1201)は、任意で、添字がサーチブロック長を表すサイズNsblの、サーチブロックと呼ばれるブロックで時間軸を分ける。あらゆるサーチブロックは、図12fに示されるように、1つの同期ヒットを含む(または一般的に含む)必要がある。Nsblビットの各々は、候補同期ヒット(candidate synchronization hit)である。ブロック1201のタスクは、各ブロックの候補ビットの各々のための尤度測度(likelihood measure)を算出することである。この情報は、次に、同期ヒットを計算するブロック1204に渡される。
3.4.1 同期シグネチャ相関器1201
sblの候補同期位置ごとに、同期シグネチャ相関器は、尤度測度を算出し、後者は、時間的整合(ビットおよび一部分または全部のメッセージ同期の両方)が見つけられた確率がより高いほど、大きい。処理ステップは、図12gにおいて表される。
したがって、異なる位置的選択と関連した、尤度値のシーケンス1201aを得ることができる。
ブロック1301は時間的逆拡散を実行する、すなわち、全てのNtビットに時間的拡散シーケンスctを掛けて、それからそれらを合計する。これは、Nfの周波数サブバンドの各々のために実行される。図13aは、一例を示す。我々は、前のセクションで述べたように同じパラメータをとる、すなわち、Nos=4、Nt=2、Ns=3である。候補同期位置がマークされる。Nosオフセットを用いて、そのビットから、Nt・Nsはブロック1301およびシーケンスctを有する時間逆拡散によってとられ、その結果、Nsビットが残される。
ブロック1302において、ビットは、Nsの拡散シーケンスで、要素ごとに乗算される(図13b参照)。
ブロック1303において、周波数逆拡散が実行される、すなわち、各ビットは、拡散シーケンスcfで乗算され、その結果、周波数に沿って合計される。
この点で、同期位置が正しい場合には、我々はNsの復号されたビットを有するだろう。そのビットが受信器に知られていないので、ブロック1304は、Ns値の絶対値および総計をとることによって尤度測度を計算する。
ブロック1304の出力は、原則として、同期シグネチャを探す非同期式相関器である。実際に、小さいNs、すなわち、部分的メッセージ同期モードを選択するとき、相互に直交する同期シーケンス(例えばa、b、c)を使用することは可能である。この際、相関器がシグネチャと正しく整合されないとき、その出力は、非常に小さい、理想的にはゼロであるだろう。全メッセージ同期モードを使用するとき、できる限り多くの直交同期シーケンスを使用し、それから慎重にそれらが使用される順番を選択することによって、シグネチャを生み出すことが助言される。この場合、より良い自己相関関数を有する拡散シーケンスを探すときと同じ理論が適用されることができる。相関器がわずかにきちんと並んでいないだけのとき、相関器の出力は、理想的な場合でさえゼロではないが、いずれにしろ、解析フィルタが最適に信号エネルギーを取り込むことができないように、完全な整合と比較してより小さいだろう。
3.4.2 同期ヒット計算1204
このブロックは、同期位置がどこにあるかについて決定するために、同期シグネチャ相関器の出力を解析する。システムがTb/4までのずれに対してかなりロバストであり、Tbが通常約40msをとるので、より安定な同期を達成するために、時間に関して1201の出力を集積することは可能である。これの可能な実施態様は、インパルス応答を指数関数的に減少させるとともに、時間に沿って適用されたIIRフィルタによって与える。あるいは、従来のFIR移動平均フィルタを適用することができる。一旦、加算平均が実行されると、異なるNt・Nsに沿った第2の相関が実行される(「異なる位置選択」)。実際に、我々は、同期関数の自己相関関数が知られる情報を活用したい。これは最大尤度(Maximum Likelihood)推定量に対応する。考えは、図13cに示される。曲線は、時間的統合化の後、ブロック1201の出力を示す。同期ヒットを決定する1つの可能性は、単にこの関数の最大値を見つけることである。図13dにおいて、同期シグネチャの自己相関関数によって平滑された(黒の)同じ関数が見える。結果として生じる関数は、赤でプロットされる。この場合、最大値は、より明白で、我々に同期ヒットの位置を与える。2つの方法は、高いSNRのためにかなり似ているが、第2の方法は、より低いSNR状況においてはるかに良く機能する。一旦同期ヒットが分かると、それらはデータを復号する透かし抽出器202に渡される。
いくつかの実施形態では、ロバストな同期信号を得るために、同期は、短い同期シグネチャを用いた部分的メッセージ同期モードで実行される。このため、多くの復号がなされる必要があり、誤検出メッセージ検出の危険性を増す。これを防止するために、いくつかの実施形態では、信号シーケンスは、結果として低いビットレートでメッセージに挿入されることができる。
このアプローチは、拡張された同期の上記説明においてすでに述べられたメッセージより短い同期シグネチャから生ずる問題の解決策である。この場合、復号器は、新しいメッセージがどこで始まるかを知らず、いくつかの同期点で復号することを試みる。本物のメッセージと誤検出とを区別するために、いくつかの実施形態では、信号語が使用される(すなわち、ペイロードは、周知の制御シーケンスを埋込むために犠牲となる)。いくつかの実施形態では、信頼性チェックは、本物のメッセージと誤検出とを区別するために、(代わりに、または、加えて)使用される。
3.5 透かし抽出器202
透かし抽出器202を構成している部分は、図14において表される。これは、2つの入力、すなわち、それぞれ、ブロック203および201からの204および205を有する。同期モジュール201(セクション3.4参照)は、同期タイムスタンプ、すなわち、候補メッセージが始まる時間領域の位置を供給する。この事項に関するより詳細については、セクション3.4で与えられる。他方、解析フィルタバンクブロック203は、復号される用意ができている時間/周波数領域にデータを供給する。
第1の処理ステップ、データ選択ブロック1501は、復号される候補メッセージと確認された部分を入力204から選択する。図15は、視覚的にこのプロシージャを示す。入力204は、実数値のNfのストリームから成る。時間整合が演繹的に復号器に知られていないので、解析ブロック203は、1/TbHzより高いレートで周波数解析を行う(オーバーサンプリング)。図15において、4のオーバーサンプリング係数を使用した、すなわち、サイズNf×1の4つのベクトルが、Tb秒ごとに出力される。同期ブロック201が候補メッセージを確認するときに、それは候補メッセージの開始点を示しているタイムスタンプ205を分配する。選択ブロック1501は、復号のために必要とされた情報、すなわち、サイズNf×Nm/Rcのマトリクスを選択する。このマトリクス1501aは、更なる処理のためのブロック1502に与えられる。
ブロック1502、1503および1504は、セクション3.4において説明したブロック1301、1302および1303の同じ演算を行う。
本発明の別の実施形態は、同期モジュールに、復号されるデータも分配させることによって、1502〜1504においてなされた計算を回避することにある。概念的には、それは詳細である。実施態様の観点から、それは、ちょうどバッファがどのように実現されるかの問題である。一般に、計算の再実行は、我々がより小さいバッファを有することを可能にする。チャネル復号器1505は、ブロック302の逆演算を実行する。
チャネル符号器が、このモジュールの可能な実施形態において、インターリーバと共に畳み込み符号器から成る場合、チャネル復号器は、例えばよく知られたビタビ・アルゴリズムによって、デインターリーブすることと畳み込み復号化を実行するだろう。このブロックの出力で、我々は、Nmビット、すなわち候補メッセージを有する。
ブロック1506、信号送信および信頼性ブロックは、入力候補メッセージが本当にメッセージであるか否かを決める。そうするために、種々の方式が可能である。
基本概念は、真のメッセージと偽のメッセージとを区別するために(CRCシーケンスのような)信号語を使用することである。しかし、これはペイロードとして利用できるビットの数を減少させる。代わりに、我々は、信頼性チェックを使用することができる。メッセージが例えばタイムスタンプを含む場合、連続したメッセージは連続したタイムスタンプを有しなければならない。復号化メッセージが正しい命令でないタイムスタンプを所有する場合、我々はそれを廃棄することができる。
メッセージが正しく検出されるときに、システムはルックアヘッド(look ahead)および/またはルックバック(look back)機構を適用して選択することができる。我々は、ビットおよびメッセージ同期が成し遂げられたと仮定する。ユーザが切替えていないと仮定するならば、システムは、適時に「ルックバック」して、(すでに復号されていない場合)同じ同期点を使用している過去のメッセージを復号することを試みる(ルックバックアプローチ)。これは、特にシステムが動き出すときに役立つ。さらに、悪い状況で、同期を成し遂げるために2つのメッセージをとることもあるだろう。この場合、第1のメッセージには、機会がない。ルックバックオプションについては、我々は、バック同期のみによって、受信されなかった「より良い」メッセージを保存することができる。ルックアヘッドは、同じあるが、将来にも機能する。我々が現在メッセージを受け取る場合、我々は次のメッセージがどこになければならないかについて知っており、我々はどうにかそれを復号することを試みることができる。
3.6. 同期の詳細
ペイロードの符号化のために、例えば、ビタビ・アルゴリズムが使用されることができる。図18aは、ペイロード1810、ビタビ終了シーケンス1820、ビタビ符号化ペイロード1830およびビタビ符号化ペイロードの繰り返し符号化されたバージョン1840の図を示す。例えば、ペイロード長は、34ビットでありえ、ビタビ終了シーケンスは、6ビットを含みうる。例えば1/7のビタビ符号レートが使用される場合、ビタビ符号化されたペイロードは、(34+6)*7=280ビットを含むことができる。更に、1/2の繰り返し符号化を使用することにより、ビタビ符号化されたペイロード1830の繰り返し符号化されたバージョン1840は、280*2=560ビットを含むことができる。この例において、42.66msのビット時間間隔を考慮して、メッセージ長さは、23.9sである。信号は、例えば、図18bに示される周波数スペクトルによって示されるように、1.5kHzから6kHzまで(例えば、臨界帯域に従って位置付けられた)9つの副搬送波によって埋込まれることができる。あるいは、また、0kHzと20kHzとの間の周波数範囲内の他の数(例えば4、6、12、15または2と20との間の数)の副搬送波が、おそらく使用される。
図19は、ABC同期とも呼ばれている同期ための基本的概念1900の略図を示す。それは、互いに続くいくつかのメッセージ1920への同期の適用と同様に、符号化されていないメッセージ1910、符号化メッセージ1920、および同期シーケンス1930の略図を示す。
この同期構想(図19〜23に示される)の説明と関連して言及される同期シーケンスまたは同期シーケンスは、前に述べた同期シグネチャに等しくてもよい。
更に、図20は、同期シーケンスと相関することによって見つけられた同期の略図を示す。同期シーケンス1930がメッセージより短い場合、2つ以上の同期点1940(または整合時間ブロック)は1つのメッセージの範囲内に見つけられうる。図20に示された例において、4つの同期点は、各メッセージの範囲内に見つけられる。従って、見つけられた同期ごとに、ビタビ復号器(ビタビ復号シーケンス)を始めることができる。このようにして、同期点1940ごとに、図21に示すように、メッセージ2110を得ることができる。
これらのメッセージに基づいて、図22に示すように、真のメッセージ2210は、CRCシーケンス(巡回冗長検査シーケンス)および/または信頼性チェックによって確認されることができる。
CRC検出(巡回冗長検査検出)は、誤検出から真のメッセージを確認するために、周知のシーケンスを使用することができる。図23は、ペイロードの終わりに付加されたCRCシーケンスのための一例を示す。
誤検出(間違った同期点に基づいて生成されたメッセージ)の確率は、CRCシーケンスの長さおよび始められたビタビ復号器の数(1つのメッセージ範囲内の同期点の数)に依存しうる。誤検出の確率を増加させずにペイロードの長さを増加させるために、信頼性は、利用されうる(信頼性試験)、または、同期シーケンス(同期シグネチャ)の長さは、増加することができる。
4. 構想および利点
以下では、革新的であることと思われる、上で述べられたシステムのいくつかの態様について説明する。また、最高水準の技術とのそれらの態様の関係について述べる。
4.1. 連続同期
いくつかの実施形態は、連続同期を可能にする。我々が同期シグネチャとして示す同期信号は、送信および受信側の両方に知られたシーケンス(同期拡散シーケンスとも呼ばれる)との乗算によって、連続的にかつデータと並列に埋込まれる。
いくつかの従来システムが(データのために使用されるもの以外の)特殊記号を使用する一方で、本発明によるいくつかの実施形態は、このような特殊記号を使用しない。他の典型的な方法は、データで時間多重されたビット(プリアンブル)の周知のシーケンスを埋め込むこと、または、データで周波数多重された信号を埋め込むことからなる。
しかし、チャネルがそれらの周波数でノッチを有するかもしれず、同期を信頼できなくするので、同期の間の専用のサブバンドを使用することが不必要であることが分かっている。プリアンブルまたは特殊記号がデータと時間多重される他の方法と比較して、本願明細書において説明された方法が連続的に(例えば動きに起因する)同期の変化を追従することを可能にするので、本願明細書において説明される方法はより有利である。
さらにまた、透かし信号のエネルギーは、(例えば拡散情報表現への透かしの乗法の導入によって)不変であり、そして、同期は、音響心理学的なモデルおよびデータ転送速度から独立して設計されることができる。(同期のロバスト性を決定する)同期シグネチャの時間の長さは、任意に、完全にデータ転送速度から独立して設計されることができる。
他の典型的方法は、データに符号多重化された同期シーケンスを埋込むことから成る。この典型的方法と比べて、本願明細書において説明された方法の利点は、データのエネルギーが相関の計算における干渉する要因を示さず、より多くのロバスト性をもたらすことである。さらに、符号多重化を使用するときに、同期に利用できる直交シーケンスの数は、いくつかがデータのために必要であるので、減少する。
要約すると、本願明細書において説明した連続同期アプローチは、従来の構想に勝る多数の利点をもたらす。
しかしながら、本発明によるいくつかの実施形態において、異なる同期構想が適用されうる。
4.2. 2D拡散
提案されたシステムのいくつかの実施形態は、時間および周波数領域両方における拡散、すなわち2次元拡散(簡潔に2D拡散とも呼ばれる)を実行する。これは、ビット誤り率が例えば時間領域において冗長を付加することによって更に減じられることがありえるので、1Dシステムに対して利点がある。
しかしながら、本発明によるいくつかの実施形態において、異なる拡散構想が適用されうる。
4.3. 差分符号化および差分復号化
本発明によるいくつかの実施形態において、(従来システムと比べて)局部発振器の動きおよび周波数不一致に対する増加したロバスト性は、差分変調によってもたらされる。実際に、ドップラー効果(動き)および周波数不一致がBPSK配置点の回転(換言すれば、ビットの複素平面上の回転)につながることが分かっている。いくつかの実施形態において、BPSK配置点(または他のいかなる適当な変調配置点)のこの種の回転の不利益な効果は、差分符号化または差分復号化を用いて回避される。
しかし、本発明によるいくつかの実施形態において、異なる符号化構想または復号化構想は、適用されうる。また、場合によっては、差分符号化は、省略されることができる。
4.4. ビット波形整形
本発明によるいくつかの実施形態において、ビット波形整形は、検出の信頼性がビット波形整形に適合されたフィルタを使用して、増加することができるので、システム性能の重要な改善をもたらす。
いくつかの実施形態によれば、透かしを入れることに関してビット波形整形の使用は、透かしを入れる処理の改善された信頼性をもたらす。ビット波形整形関数がビット間隔より長い場合、特に良い結果を得ることができることが分かっている。
しかしながら、本発明によるいくつかの実施形態において、異なるビット波形整形構想は、適用されることができる。また、場合によっては、ビット波形整形は、省略されることができる。
4.5. 音響心理学モデル(PAM)とフィルタバンク(FB)合成との間の双方向性
いくつかの実施形態において、音響心理学的なモデルは、ビットを掛ける振幅を微調整するために、変調装置と対話する。
しかし、いくつかの他の実施形態において、この相互関係は、省略されることができる。
4.6. ルックアヘッドおよびルックバック機能
いくつかの実施形態において、いわゆる「ルックバック」および「ルックアヘッド」アプローチが適用される。
以下では、これらの構想について、簡潔にまとめられる。メッセージが正しく復号されるときに、同期が達成されたと仮定される。ユーザが切替えていないと仮定すると、いくつかの実施形態において、時間におけるルックバックが実行され、同じ同期点を使用して、過去のメッセージ(すでに復号されていない場合)を復号することが試みられる(ルックバックアプローチ)。これは、特に、システムが動き出すときに役立つ。
悪い状況では、同期を達成するのに2つのメッセージをとるかもしれない。この場合、第1のメッセージには、従来システムのチャンスがない。(本発明のいくつかの実施形態において使用される)ルックバックオプションについては、バック同期だけのため受信されなかった「良い」メッセージを保存する(または復号する)ことは、可能である。
ルックアヘッドは、同じことであるが、将来に機能する。私がここでメッセージを受信する場合、私は私の次のメッセージがどこになければならないかについて知っており、私はどうにかそれを復号しようとすることができる。したがって、重なっているメッセージは、復号されることができる。
しかし、本発明によるいくつかの実施形態において、ルックアヘッド機能および/またはルックバック機能は、省略されることができる。
4.7. 増加した同期ロバスト性
いくつかの実施形態において、ロバストな同期信号を得るために、同期は、短い同期シグネチャを用いて部分的メッセージ同期モードにおいて実行される。このために、多くの復号化がなされなければならず、誤検出メッセージ検出の危険性を増す。これを防ぐために、いくつかの実施形態において、信号シーケンスは、結果としてより低いビットレートでメッセージに挿入されることができる。
しかし、本発明によるいくつかの実施形態において、同期ロバスト性を改善するための異なる構想は、適用されることができる。また、場合によっては、同期ロバスト性を増加させるためのいかなる構想の使用も、省略されることができる。
4.8. 他の拡張
以下では、背景技術に関して上記システムのいくつかの他の一般的な拡張は、提案されて、論じられる。
1. より低い計算量
2. より良い音響心理学的なモデルによるより良いオーディオ品質
3. 狭帯域マルチキャリア信号による反響する環境におけるロバスト性
4. SNR算定は、いくつかの実施形態において回避される。これは、特に低いSNR状況において、より良いロバスト性を可能にする。
本発明によるいくつかの実施形態は、従来システムより良い。そして、それは、以下の理由のため、例えば8Hzの非常に狭い帯域幅を使用する。
1. 音響心理学的なモデルがごくわずかなエネルギーしかそれを聞こえなくするのを可能にしないので、8Hzの帯域幅(または同様の非常に狭い帯域幅)は非常に長い時間シンボルを必要とする。
2. 8Hz(または同様の非常に狭い帯域幅)は、時間変動するドップラースペクトルを変化させて、それの感度を高くする。したがって、例えば、腕時計において実行される場合、この種の狭いバンドシステムは一般的に十分により良くない。
本発明によるいくつかの実施形態は、以下の理由のため、他の技術より良い。
1. エコーを入力するテクニックは、完全に反響する部屋では失敗する。対照的に、本発明のいくつかの実施形態において、エコーの導入は、回避される。
2. 時間拡散だけを使用するテクニックは、例えば時間および周波数の両方における二次元拡散が使用される上記システムの比較実施形態におけるより長いメッセージ時間を有する。
本発明によるいくつかの実施形態は、独国特許第19640814において説明されたシステムより良い。なぜなら、前記文書によるシステムの以下の不利な点のより多くの続いている不利な点のうちの1つ以上が克服されるからである。
●独国特許第19640814による復号器の煩雑性は非常に高く、N=128での長さ2Nのフィルタが使用される。
●独国特許第19640814によるシステムは、長いメッセージ時間を含む。
●独国特許第19640814によるシステムにおいて、比較的高い拡散利得(例えば128)を有する時間領域だけにおける拡散
●独国特許第19640814によるシステムにおいて、信号は時間領域において生成され、スペクトル領域に変換され、重み付けされ、時間領域に変換され、オーディオに重ね合わせられる。それはシステムを非常に複雑にする。
5. アプリケーション
本発明は、デジタルデータを隠すためにオーディオ信号を修正する方法と、修正されたオーディオ信号の知覚される品質が、オリジナルのものと区別できないままであると共に、この情報を取り出すことができる、対応する復号器とを含む。
本発明のありうる使用の例は、以下において挙げられる。
1. 放送モニタリング:例えばその局および時間に関する情報を含んでいる透かしは、ラジオまたはテレビ番組のオーディオ信号に隠される。被験者により着用された小さいデバイスに取り入れられた復号器は、透かしを取り出すことができ、しかるに広告代理店のために有益な情報、すなわち誰がどの番組をいつ見たかの情報を集める。
2. 監査:例えば、透かしは、広告に隠すことができる。自動的に特定の局の送信をモニターすることによって、正確にいつ広告が放送されたかを知ることが可能である。同じようにして、種々のラジオの番組スケジュール、例えば特定の曲がどれくらい演奏されるかなどについての統計情報を取り出すことが可能である。
3. メタデータ埋め込み:提案された方法は、曲または番組、例えばその曲の名前および作成者または番組の時間などについてのデジタル情報を隠すために使用されることができる。
特に、音響心理学的処理装置は、透かしデータ2450から独立してマスキング閾値を決定するように構成され、変調装置は、透かしデータから独立しているマスキング閾値に基づいて、予備的振幅重みγ(i;j)を予備的に決定して、各振幅重みとして予備的振幅重みを使用したサンプル波形整形関数の重ね合わせがマスキング閾値に違反することによって、反復的に透かし信号を生成するように構成されうる。その場合、それから予備振幅重みは、各振幅重みとして変化した振幅重みを使用して、サンプル波形整形関数の重ね合わせを得るために変化する。すでに上で概説されたように、チェックにおいて、時間離散的表現の隣接したサンプルが、重ね合わせおよびサンプル時間間隔を上回っているサンプル波形整形関数の時間範囲のため、互いに影響を及ぼし/干渉するので、透かし信号2440を生成するためのホール反復プロセス、および最後に使用された振幅重み付けが、透かしデータ表現のこれらの隣接したサンプルに依存する。換言すれば、そのチェックは、サンプルbdiff(i,j±1)から最後に使用された振幅重みγ(i;j)の依存性を誘発し、透かし抽出量と透かし信号の聴き取り難さの間のより良いトレードオフを可能にする。もちろん、チェックする、重ね合わせる、そして変動するプロシージャは、反復的に繰り返されうる。
透かしデータ表現の隣接したサンプルへの上述した依存性は、代わりに、振幅重みを非反復的に設定することによって実行されることができる。例えば、変調装置は、(i,j)でのマスキング閾値並びに隣接した透かしサンプルbdiff(i,j±1)の両方に基づいて、振幅重みγ(i;j)を解析的に決定することができる。
時間拡散305は、時間離散的表現を得るために、時間において透かしデータを拡散するために使用されうる。更に、周波数拡散303は、時間離散的表現を得るために、周波数領域において透かしデータを拡散するために使用されうる。時間/周波数解析器501は、おおよそのサンプル時間間隔の第1の窓長を使用したラップド変換によってオーディオ信号を時間領域から周波数領域に変換するために使用されうる。時間/周波数解析器は、また、第1の窓長より短い第2の窓長を使用したラップド変換によって時間領域から周波数領域へオーディオ信号を変換するように構成されうる。
更に、前記実施形態は、透かし信号供給装置2400および透かしを入れたオーディオ信号を得るために透かし信号とオーディオ信号を加算するためのアダー2510を含む透かし埋め込み装置2500;100を示した。
6. 実施態様変形例
いくつかの態様が装置に関連して説明されたが、これらの態様はまた、対応する方法の説明を示すことは明らかである。ここで、ブロックまたはデバイスは方法ステップまたは方法ステップの機能に対応する。類似して、方法ステップに関連して説明された態様は、対応するブロックまたは項目の記載または対応する装置の機能を示す。方法ステップのいくつかまたは全ては、例えば、マイクロプロセッサ、プログラミング可能なコンピュータ、または電子回路のようなハードウェア装置によって(または使用して)実行されることができる。いくつかの実施形態では、最も重要な方法ステップの一つ以上のいくつかは、この種の装置によって実行されることができる。
本発明の符号化された透かし信号または透かし信号が埋め込まれたオーディオ信号は、デジタル記憶媒体に格納されることができ、または、無線伝送媒体などの伝送媒体またはインターネットなどの有線伝送媒体で送信することができる。
特定の実現要求に応じて、本発明の実施形態は、ハードウェアにおいて、または、ソフトウェアにおいて実行されることができる。実施態様は、各方法が実行されるように、プログラミング可能な計算機システムと協動する(または協動することができる)、その上に格納される電子的に読み込み可能な制御信号を有するデジタル記憶媒体、例えばフロッピー(登録商標)ディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROMまたはFLASHメモリを使用して実行されることができる。従って、デジタル記憶媒体は、計算機可読でもよい。
本発明によるいくつかの実施形態は、本願明細書において説明された方法のうちの1つが実行されるように、プログラミング可能な計算機システムと協動することができる電子的に読み込み可能な制御信号を有するデータキャリアを含む。
通常、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実行されることができ、コンピュータプログラム製品がコンピュータ上で動作するとき、そのプログラムコードは、方法のうちの1つを実行するために働く。プログラムコードは、例えば機械読み取り可読キャリアに格納されることができる。
他の実施形態は、機械読み取り可読キャリアに格納された、本願明細書において説明された方法のうちの1つを実行するためのコンピュータプログラムを含む。
換言すれば、本発明の方法の実施形態は、コンピュータプログラムはコンピュータ上で動作するとき、本願明細書において説明される方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
従って、本発明の方法の更なる実施形態は、その上に記録された、本願明細書において説明された方法のうちの1つを実行するためのコンピュータプログラムを含んでいるデータキャリア(またはデジタル記憶媒体またはコンピュータ可読媒体)である。
本発明の方法の更なる実施形態は、本願明細書において説明された方法のうちの1つを実行するためのコンピュータプログラムを示しているデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、データ通信接続を介して、例えばインターネットを介して転送されるように例えば構成されることができる。
更なる実施形態は、本願明細書において説明された方法のうちの1つを実行するために構成された又は適合された、処理手段、例えばコンピュータまたはプログラム可能な論理回路を含む。
更なる実施形態は、本願明細書において説明された方法のうちの1つを実行するためのコンピュータプログラムをインストールしたコンピュータを含む。
いくつかの実施形態において、プログラム可能な論理回路(例えば論理プログラミング可能デバイス)は、本願明細書において説明された方法の機能のいくつかまたは全てを実行するために使用されることができる。いくつかの実施形態において、論理プログラミング可能デバイスは、本願明細書において説明された方法のうちの1つを実行するために、マイクロプロセッサと協動することができる。通常、その方法は、好ましくは、いかなるハードウェア装置によっても実行される。
上記実施形態は、本発明の原理のために、単に図示しているだけである。本願明細書において説明された装置およびその詳細の修正および変更が他の当業者にとって明らかであるものと理解される。従って、間近に迫った特許クレームの範囲だけによって制限され、本願明細書の実施形態の記載および説明として示された具体的な詳細によっては制限されないという意図である。

Claims (11)

  1. 透かし信号が透かしデータ(2450;101a)を示すように、前記透かし信号がオーディオ信号に付加されるときに、前記オーディオ信号(2430;106)に隠されることに適している前記透かし信号(2440;101b)を供給するための透かし信号供給装置(2400)であって、前記透かし信号供給装置は、
    前記オーディオ信号のマスキング閾値を決定するための音響心理学的処理装置(2410;102)と、
    前記透かしデータの時間離散的表現の、サンプル時間間隔(Tb)で互いに間隔を置かれたサンプル波形整形関数の重ね合わせから前記透かし信号を生成するための変調装置(2420;307)であって、各サンプル波形整形関数は、前記マスキング閾値に依存する各振幅重みによって乗算された、前記時間離散的表現の各サンプルによって振幅重み付けされ、前記変調装置は、
    前記サンプル時間間隔が、前記サンプル波形整形関数の時間範囲より短く、
    前記各振幅重みも、時間において前記各サンプルに隣接している前記時間離散的表現のサンプルに依存するように、
    構成される、前記変調装置とを含むことを特徴とする、前記透かし信号供給装置。
  2. 前記音響心理学的処理装置は、前記透かしデータから独立して前記マスキング閾値を決定するように構成され、前記変調装置は、
    前記透かしデータから独立している前記マスキング閾値に基づいて、予備的振幅重みを予備的に決定することと、
    前記各振幅重みとして前記予備的振幅重みを使用した前記サンプル波形整形関数の重ね合わせが、前記マスキング閾値を違反するかどうかに関してチェックすることと、
    前記各振幅重みとして前記予備的振幅重みを使用した前記サンプル波形整形関数の前記重ね合わせが前記マスキング閾値を違反する場合、前記各振幅重みとして、変化させた振幅重みを使用した前記サンプル波形整形関数の重ね合わせを得るために、前記予備的振幅重みを変化させることと
    によって、反復的に前記透かし信号を生成するように構成されることを特徴とする、請求項1に記載の透かし信号供給装置。
  3. 前記時間離散的表現を得るために、時間において前記透かしデータを拡散するための時間スプレッダー(305)を更に含むことを特徴とする、請求項1又は請求項2に記載の透かし信号供給装置。
  4. 前記時間離散的表現を得るために、周波数領域において前記透かしデータを拡散するための周波数スプレッダー(303)を更に含むことを特徴とする、請求項1〜請求項3のいずれかに記載の透かし信号供給装置。
  5. 前記音響心理学的処理装置は、およそ前記サンプル時間間隔の第1の窓長さを使用したラップド変換によって前記時間領域から周波数領域へ前記オーディオ信号を変換する時間/周波数解析器(501)を含むことを特徴とする、請求項1〜請求項4のいずれかに記載の透かし信号供給装置。
  6. 前記時間/周波数解析器は、前記第1の窓長さより短い第2の窓長さを使用した前記ラップド変換によっても前記時間領域から前記周波数領域へ前記オーディオ信号を変換するように構成されることを特徴とする、請求項5に記載の透かし信号供給装置。
  7. 前記時間離散的表現は、時間離散的サブバンドから成り、前記変調装置は、前記サンプル時間間隔で間隔を置かれたサンプル波形整形関数の重ね合わせから、時間離散的サブバンドごとに、前記透かし信号を生成するように構成され、各サンプル波形整形関数は、前記マスキング閾値に依存する各振幅重みで乗算された前記各時間離散的サブバンドの各サンプルで振幅重み付けされ、各時間離散的サブバンドのための前記重ね合わせの前記サンプル波形整形関数は、前記各時間離散的サブバンドの中心周波数に搬送周波数を含むことを特徴とする、請求項1〜請求項6のいずれかに記載の透かし信号供給装置。
  8. 透かし信号が透かしデータを示すように、前記透かし信号がオーディオ信号に付加されるときに、前記オーディオ信号に隠されることに適している前記透かし信号を供給するための、請求項1〜請求項7のいずれかに記載の透かし信号供給装置と、
    透かしを入れたオーディオ信号を得るために、前記透かし信号および前記オーディオ信号を加算するためのアダーとを含むことを特徴とする、透かし埋め込み装置。
  9. 透かし信号が透かしデータ(101a)を示すように、前記透かし信号がオーディオ信号に付加されるときに、前記オーディオ信号(106)に隠されることに適している前記透かし信号(101b)を供給するための方法であって、前記方法は、
    前記オーディオ信号のマスキング閾値を決定するステップと、
    前記透かしデータの時間離散的表現の、サンプル時間間隔(Tb)で互いに間隔を置かれたサンプル波形整形関数の重ね合わせから前記透かし信号を生成するステップであって、各サンプル波形整形関数は、前記マスキング閾値に依存する各振幅重みによって乗算された、前記時間離散的表現の各サンプルによって振幅重み付けされるステップであって、前記生成は、
    前記サンプル時間間隔が、前記サンプル波形整形関数の時間範囲より短く、
    前記各振幅重みも、時間において前記各サンプルに隣接している前記時間離散的表現のサンプルに依存するように実行される、ステップとを含むことを特徴とする、方法。
  10. 透かし埋め込み方法は、
    請求項9に記載の、透かし信号が透かしデータを示すように、前記透かし信号がオーディオ信号に付加されるときに、前記オーディオ信号に隠されることに適している前記透かし信号を供給するステップと、
    透かしを入れたオーディオ信号を得るために、前記透かし信号および前記オーディオ信号を加算するステップとを含むことを特徴とする、前記透かし埋め込み方法。
  11. コンピュータ上で動作するとき、請求項9又は請求項10に記載の方法を実行するためにそこに格納された命令を有するコンピュータプログラム。
JP2012554322A 2010-02-26 2011-02-22 透かし信号の供給および透かし埋め込み Active JP5548278B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP10154956A EP2362385A1 (en) 2010-02-26 2010-02-26 Watermark signal provision and watermark embedding
EP10154956.6 2010-02-26
PCT/EP2011/052605 WO2011104233A1 (en) 2010-02-26 2011-02-22 Watermark signal provision and watermark embedding

Publications (2)

Publication Number Publication Date
JP2013520693A true JP2013520693A (ja) 2013-06-06
JP5548278B2 JP5548278B2 (ja) 2014-07-16

Family

ID=42320982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012554322A Active JP5548278B2 (ja) 2010-02-26 2011-02-22 透かし信号の供給および透かし埋め込み

Country Status (16)

Country Link
US (1) US8965547B2 (ja)
EP (2) EP2362385A1 (ja)
JP (1) JP5548278B2 (ja)
KR (1) KR101411101B1 (ja)
CN (1) CN102959622B (ja)
AU (1) AU2011219829B2 (ja)
CA (1) CA2791046C (ja)
ES (1) ES2443878T3 (ja)
HK (1) HK1180446A1 (ja)
MX (1) MX2012009778A (ja)
MY (1) MY152708A (ja)
PL (1) PL2539890T3 (ja)
RU (1) RU2624549C2 (ja)
SG (1) SG183485A1 (ja)
WO (1) WO2011104233A1 (ja)
ZA (1) ZA201207154B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019169949A (ja) * 2019-04-24 2019-10-03 ヤマハ株式会社 音声処理システムおよび音声処理方法
US10691400B2 (en) 2014-07-29 2020-06-23 Yamaha Corporation Information management system and information management method
US10733386B2 (en) 2014-07-29 2020-08-04 Yamaha Corporation Terminal device, information providing system, information presentation method, and information providing method

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2565667A1 (en) 2011-08-31 2013-03-06 Friedrich-Alexander-Universität Erlangen-Nürnberg Direction of arrival estimation using watermarked audio signals and microphone arrays
US9305559B2 (en) * 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
US20140111701A1 (en) * 2012-10-23 2014-04-24 Dolby Laboratories Licensing Corporation Audio Data Spread Spectrum Embedding and Detection
WO2014120685A1 (en) 2013-02-04 2014-08-07 Dolby Laboratories Licensing Corporation Systems and methods for detecting a synchronization code word
FR3004876A1 (fr) * 2013-04-18 2014-10-24 France Telecom Correction de perte de trame par injection de bruit pondere.
CN105556598B (zh) 2013-09-12 2019-05-17 Oppo广东移动通信有限公司 多通道音频的通道的选择性加水印
EP2905775A1 (en) 2014-02-06 2015-08-12 Thomson Licensing Method and Apparatus for watermarking successive sections of an audio signal
US9990928B2 (en) * 2014-05-01 2018-06-05 Digital Voice Systems, Inc. Audio watermarking via phase modification
CN104505096B (zh) * 2014-05-30 2018-02-27 华南理工大学 一种用音乐传输隐藏信息的方法及装置
CN105244033B (zh) * 2014-07-09 2019-07-16 意法半导体亚太私人有限公司 用于数字水印的系统和方法
WO2016115483A2 (en) * 2015-01-15 2016-07-21 Hardwick John C Audio watermarking via phase modification
US20160294484A1 (en) * 2015-03-31 2016-10-06 Qualcomm Technologies International, Ltd. Embedding codes in an audio signal
WO2016171002A1 (ja) 2015-04-24 2016-10-27 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US10043527B1 (en) * 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
KR102393798B1 (ko) * 2015-07-17 2022-05-04 삼성전자주식회사 오디오 신호 처리 방법 및 장치
CN106409301A (zh) * 2015-07-27 2017-02-15 北京音图数码科技有限公司 数字音频信号处理的方法
US10692496B2 (en) * 2018-05-22 2020-06-23 Google Llc Hotword suppression
KR102637177B1 (ko) * 2018-05-23 2024-02-14 세종대학교산학협력단 워터마크 기반의 이미지 무결성 검증 방법 및 장치
US11244692B2 (en) 2018-10-04 2022-02-08 Digital Voice Systems, Inc. Audio watermarking via correlation modification using an amplitude and a magnitude modification based on watermark data and to reduce distortion
CN113128537A (zh) * 2019-12-31 2021-07-16 华为技术有限公司 样本处理方法和相关装置及存储介质
CN111292756B (zh) * 2020-01-19 2023-05-26 成都潜在人工智能科技有限公司 一种抗压缩音频无声水印嵌入和提取方法及系统
CN111341329B (zh) * 2020-02-04 2022-01-21 北京达佳互联信息技术有限公司 水印信息添加方法、提取方法、装置、设备及介质
RU2746708C1 (ru) * 2020-07-29 2021-04-19 Закрытое акционерное общество "Перспективный мониторинг" Способ и устройство ввода водяного знака в аудиосигнал
KR102579261B1 (ko) * 2021-01-06 2023-09-15 스냅태그 주식회사 워터마크 데이터의 임베딩 및 추출 방법
US12067994B2 (en) 2022-07-27 2024-08-20 Cerence Operating Company Tamper-robust watermarking of speech signals

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10500263A (ja) * 1994-03-31 1998-01-06 セリディアン コーポレイション 音声信号にコードを含めると共に復号化する装置及び方法
JP2001022366A (ja) * 1999-07-12 2001-01-26 Roland Corp 波形データへの電子透かし埋込み方法および装置
JP2006251676A (ja) * 2005-03-14 2006-09-21 Akira Nishimura 振幅変調を用いた音響信号への電子透かしデータの埋め込み・検出装置
JP2010044147A (ja) * 2008-08-11 2010-02-25 Yamaha Corp 電子透かし情報の埋め込みおよび抽出を行う装置、方法およびプログラム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02206233A (ja) 1989-02-03 1990-08-16 Fujitsu Ltd 移動端末データモニタ方式
FR2681997A1 (fr) 1991-09-30 1993-04-02 Arbitron Cy Procede et dispositif d'identification automatique d'un programme comportant un signal sonore.
DE69333661T2 (de) 1992-11-16 2006-02-23 Arbitron Inc. Verfahren und vorrichtung zur kodierung/dekodierung von gesendeten oder aufgezeichneten ausschnitten und überwachung der zuhörerreaktion darauf
US7316025B1 (en) 1992-11-16 2008-01-01 Arbitron Inc. Method and apparatus for encoding/decoding broadcast or recorded segments and monitoring audience exposure thereto
US5450490A (en) 1994-03-31 1995-09-12 The Arbitron Company Apparatus and methods for including codes in audio signals and decoding
ATE184140T1 (de) 1996-03-07 1999-09-15 Fraunhofer Ges Forschung Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer
DE19640814C2 (de) 1996-03-07 1998-07-23 Fraunhofer Ges Forschung Codierverfahren zur Einbringung eines nicht hörbaren Datensignals in ein Audiosignal und Verfahren zum Decodieren eines nicht hörbar in einem Audiosignal enthaltenen Datensignals
CA2269651A1 (en) * 1998-05-12 1999-11-12 Lucent Technologies, Inc. Transform domain image watermarking method and system
KR100611094B1 (ko) * 2000-06-15 2006-08-09 주식회사 케이티 통계적 모델에 기반한 워터마크 삽입/검출 장치 및 그 방법
WO2003083860A1 (en) 2002-03-28 2003-10-09 Koninklijke Philips Electronics N.V. Window shaping functions for watermarking of multimedia signals
KR20060027351A (ko) * 2003-06-19 2006-03-27 코닌클리케 필립스 일렉트로닉스 엔.브이. 적은 주파수 성분들을 갖는 미디어 신호 내의 부가적데이터의 검출 가능성을 증가시키는 방법
EP1729285A1 (en) * 2005-06-02 2006-12-06 Deutsche Thomson-Brandt Gmbh Method and apparatus for watermarking an audio or video signal with watermark data using a spread spectrum
EP1764780A1 (en) * 2005-09-16 2007-03-21 Deutsche Thomson-Brandt Gmbh Blind watermarking of audio signals by using phase modifications
EP1898396A1 (en) 2006-09-07 2008-03-12 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding/decoding symbols carrying payload data for watermarking of an audio or video signal
DE102008014311A1 (de) 2008-03-14 2009-09-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Einbetter zum Einbetten eines Wasserzeichens in eine Informationsdarstellung, Detektor zum Detektieren eines Wasserzeichens in einer Informationsdarstellung, Verfahren, Computerprogramm und Informationssignal
JP5338170B2 (ja) 2008-07-18 2013-11-13 ヤマハ株式会社 電子透かし情報の埋め込みおよび抽出を行う装置、方法およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10500263A (ja) * 1994-03-31 1998-01-06 セリディアン コーポレイション 音声信号にコードを含めると共に復号化する装置及び方法
JP2006154851A (ja) * 1994-03-31 2006-06-15 Arbitron Inc 音声信号にコードを含める共に復号化する装置及び方法
JP2001022366A (ja) * 1999-07-12 2001-01-26 Roland Corp 波形データへの電子透かし埋込み方法および装置
JP2006251676A (ja) * 2005-03-14 2006-09-21 Akira Nishimura 振幅変調を用いた音響信号への電子透かしデータの埋め込み・検出装置
JP2010044147A (ja) * 2008-08-11 2010-02-25 Yamaha Corp 電子透かし情報の埋め込みおよび抽出を行う装置、方法およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10691400B2 (en) 2014-07-29 2020-06-23 Yamaha Corporation Information management system and information management method
US10733386B2 (en) 2014-07-29 2020-08-04 Yamaha Corporation Terminal device, information providing system, information presentation method, and information providing method
JP2019169949A (ja) * 2019-04-24 2019-10-03 ヤマハ株式会社 音声処理システムおよび音声処理方法

Also Published As

Publication number Publication date
EP2539890B1 (en) 2014-01-01
HK1180446A1 (en) 2013-10-18
MY152708A (en) 2014-11-28
EP2362385A1 (en) 2011-08-31
ES2443878T3 (es) 2014-02-20
EP2539890A1 (en) 2013-01-02
SG183485A1 (en) 2012-10-30
RU2624549C2 (ru) 2017-07-04
MX2012009778A (es) 2012-11-22
KR101411101B1 (ko) 2014-06-27
ZA201207154B (en) 2013-05-29
US20130218314A1 (en) 2013-08-22
AU2011219829A1 (en) 2012-09-27
KR20120128148A (ko) 2012-11-26
US8965547B2 (en) 2015-02-24
JP5548278B2 (ja) 2014-07-16
AU2011219829B2 (en) 2014-08-21
CN102959622B (zh) 2014-11-05
CA2791046A1 (en) 2011-09-01
CN102959622A (zh) 2013-03-06
WO2011104233A1 (en) 2011-09-01
RU2012140842A (ru) 2014-04-10
PL2539890T3 (pl) 2014-06-30
CA2791046C (en) 2016-05-17

Similar Documents

Publication Publication Date Title
JP5548278B2 (ja) 透かし信号の供給および透かし埋め込み
JP5426781B2 (ja) 透かし信号の供給装置および透かし信号を供給するための方法
KR101419164B1 (ko) 개선된 동기화 개념을 이용한 워터마크 생성기, 워터마크 디코더, 워터마크 신호를 제공하는 방법, 워터마킹된 신호에 기초하여 이진 메시지 데이터를 제공하는 방법 및 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 저장 매체
JP5567150B2 (ja) 差分符号化を用いたウォーターマーク生成器、ウォーターマーク復号器、バイナリーメッセージデータに基づいてウォーターマーク信号を提供する方法、ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法及びコンピュータプログラム
JP5665885B2 (ja) 二次元ビット拡散を用いたウォーターマーク生成器、ウォーターマーク復号器、バイナリーメッセージデータに基づいてウォーターマーク信号を提供する方法、ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法及びコンピュータプログラム
US9299356B2 (en) Watermark decoder and method for providing binary message data

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130925

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131212

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140516

R150 Certificate of patent or registration of utility model

Ref document number: 5548278

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250