JP2007535699A - 透かし埋め込み - Google Patents

透かし埋め込み Download PDF

Info

Publication number
JP2007535699A
JP2007535699A JP2007509900A JP2007509900A JP2007535699A JP 2007535699 A JP2007535699 A JP 2007535699A JP 2007509900 A JP2007509900 A JP 2007509900A JP 2007509900 A JP2007509900 A JP 2007509900A JP 2007535699 A JP2007535699 A JP 2007535699A
Authority
JP
Japan
Prior art keywords
spectral
sequence
values
representation
information signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007509900A
Other languages
English (en)
Other versions
JP5048478B2 (ja
Inventor
ユールゲン ヘレ
レイフ クレッサ
サッシャ ディスヒ
カルステン リンツマイアー
クリスティアン ノイバウアー
フランク ズィーベンハール
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2007535699A publication Critical patent/JP2007535699A/ja
Application granted granted Critical
Publication of JP5048478B2 publication Critical patent/JP5048478B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/28Arrangements for simultaneous broadcast of plural pieces of information
    • H04H20/30Arrangements for simultaneous broadcast of plural pieces of information by a single channel
    • H04H20/31Arrangements for simultaneous broadcast of plural pieces of information by a single channel using in-band signals, e.g. subsonic or cue signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Image Processing (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Compositions Of Macromolecular Compounds (AREA)
  • Paper (AREA)

Abstract

情報信号中に透かしを導入するための新発明スキームによれば、情報信号(12)は、まず、時間表現(22)からスペクトル/変調スペクトル表現(30)に変換される。次いで、情報信号は、スペクトル/変調スペクトル表現(30)において、取り入れ対象の透かし(14)に基づく操作が加えられ、変形されたスペクトル/変調スペクトル表現が得られ、続いて、該変形スペクトル/変調スペクトル表現に基づいて、透かしが付加された情報信号(16)が形成される。利点は、スペクトル/変調スペクトル表現又はレンジにおいて透かし(14)の埋め込み及び/又は取出しが行われるので、スプレッドバンド変調に基づく透かし技法で使われる従来型のコリレーションアタックが容易には成功しないことである。
【選択図】図1

Description

本発明は、例えば音声信号などの情報信号に、透かしを導入するためのスキームに関する。
インターネットの普及拡大とともに、音楽の著作権侵害も格段に増加した。音楽作品又は一般的音声信号が、多くのサイトからダウンロード用に提供されている。こういった所では、著作権が順守されているのはごく限られた例である。具体的に言うと、著作者が、自分の作品を利用するための許可を求められることはほとんどない。合法的コピーの対価としての著作者への使用料支払いにいたってはさらに稀有である。加えて、作品は無統制なやり方でコピーされ、ほとんどの場合、これも著作権を守らずに行われている。
音楽作品が、音楽作品プロバイダによってインターネットを介して合法的に購入される場合、通常、プロバイダはヘッダ又はデータブロックを生成して音楽作品に付け加え、その中に、例えば顧客番号のような著作権情報を取り入れ、該番号によって現下の購入者を明確に識別する。また、例えば、対象作品のコピーを全く禁止するとか、対象作品のコピーを一回だけ認めるとか、対象作品のコピーを完全に自由にするとかいったもっと別の種類の版権を示すコピー許可情報をこのヘッダに導入するやり方が知られている。顧客は、ヘッダを読み取って、例えば一回だけコピーを可能とし、それ以上のコピーはさせないといった許可された行為を守って処置をするデコーダ又は管理ソフトウエアを持っている。
しかしながら、この著作権順守についての考え方は、合法的に行動する顧客に対してだけ機能することになる。通常、非合法的な顧客は、ヘッダを有する音楽作品を「クラッキング」する相当な独創的能力を持っている。このような場合、前述の著作権保護手順の不利点は明らかである。こういったヘッダは簡単に除去することができる。また、非合法なユーザは、ヘッダの中の個別の入力情報を変更し、「コピー禁止」という入力情報を「コピーは完全に自由」という入力情報に変換するかもしれない。また、非合法顧客が、ヘッダから自分の顧客番号を消去し、インターネット上の自分の又は別人のホームページで、当該音楽作品を提供することも実行可能である。この時点以降は、非合法顧客を特定することはもはや不可能である。なぜなら該顧客の番号が消去されてしまっているからである。
不可聴なデータ信号を音声信号に導入するためのコーディング方法は、国際公開第97/33391号により知られている。これによれば、ここでは透かしという不可聴なデータ信号を導入する音声信号を周波数領域に変換し、心理音響学的モデルを使って音声信号のマスキング閾値を決定する。音声信号に取り入れられるデータ信号は、擬似ノイズ信号により変調され、周波数拡散データ信号を生成する。次に、周波数拡散データ信号は、周波数拡散データ信号のエネルギーが常にマスキング閾値を下回るように、心理音響学的マスキング閾値によって重み付けされる。最後に、重み付けされたデータ信号は音声信号に重ね合わされ、これが、聞こえないようにデータ信号を取り入れた音声信号を生成する方法である。一方では、データ信号を使って著作者情報を音声信号に加えることができ、あるいは、データ信号を使って音声信号を特徴付け、例えば、コンパクトディスクの形のようなあらゆる音声キャリアに、製造時に個別タグを組み込んでおけば、起こりえる著作権侵害コピーを容易に識別できるようになる。
また、まだ時間領域又は時間領域表現にある、未圧縮の音声信号への透かしの埋め込みが、C.Neubauer(ノイバウェル)、J.Herre(ヘーレ)「電子透かし及びその音声品質への影響(Digital Watermarking and Influence on Audio Quality)」第105回AESコンベンション、1998年サンフランシスコ、発表抄録4823中及び独国特許出願公開第19640814号中に記載されている。
しかしながら、多くの場合、音声信号は、既に圧縮され、例えば、MPEG音声技法の一つによって処理をされた音声信号ストリームとして存在する。前述の透かし埋め込み方法の一つを使って、顧客に配布する前に音楽作品に透かしを付加したとすれば、透かしを導入する前にこれらを完全に解凍し、再度、時間領域のオーディオ値のシーケンスを得なければないことになろう。一方、透かしを埋め込む前に余分なデコーディングをするため、これによって、計算が非常に複雑になるだけでなく、これらの透かしが付加された音声信号を再びコード化する際に、再コーディング時にタンデム・コーディングの影響が生じる危険性がある。
このため、既に圧縮済みの音声信号又は圧縮される音声ビットストリーム中に透かしを埋め込むためのスキームが開発されてきた。これには、何よりも、低レベルの計算複雑性しか必要ないという利点がある、というのは、透かしを付加される音声ビットストリームを完全にはデコードする必要がなく、すなわち、具体的には、音声信号を分析及び合成用フィルタバンクに通すことを省略できるからである。これらの、圧縮音声信号に適用可能な方法のさらなる利点として、量子化ノイズと透かしノイズとを相互に正確に同調可能なため高い音声品質が得られること、透かしが引き続く音声コーダによって「弱められない」ことによって高いロバスト性が得られること、及び、PCM(パルス符号変調)透かし技法、又は未圧縮の音声信号を操作する埋め込みスキームとの互換性が達成できるようにスプレッドバンド・パラメータを適切に選定することが可能である。既に圧縮された音声信号中に透かしを埋め込むためのスキームの概要が、C.ノイバウエル(Neubauer)、J.ヘーレ(Herre)の「MPEG−2 AAC ビットストリームの音声ウォーターマーキング(Audio Watermarking of MPEG−2 AAC Bit Stream)第108回AESコンベンション、2000年パリ、発表抄録5101中及びさらに独国特許第10129239号中に記載されている。
透かしを音声信号に導入する別の改良されたやり方は、まだ圧縮されていない音声信号を圧縮しながら埋め込みを行うスキームに関するものである。この種の埋め込みスキームは、とりわけ、計算複雑性が低レベルである利点を持つ、というのは、透かし埋め込みとコーディングとをまとめることによって、例えば、マスキング・モデルの計算及び音声信号をスペクトルレンジに変換するといった特定の操作を一度実施するだけでよいからである。さらなる利点として、量子化ノイズと透かしノイズとを相互に正確に同調させることができることによる音声品質の向上、透かしが引き続く音声コーダによって「弱められない」ことによる高いロバスト性、およびPCM透かし技法との互換性を実現するためのスプレッドバンドパラメータの適切な選定の可能性などが挙げられる。圧縮された透かし埋め込み/コーディングの概要が、例えば、シーベンハール(Siebenhaar)、フランク(Frank);ノイバウエル(Neubauer)、クリスチャン(Christian);ヘーレ(Herre)、ユルゲン(Jurgen)の「音声信号のための圧縮/ウォーターマーキング組合せ(Combined Compression/Watermarking for Audio Signals)」第110回AESコンベンション、アムステルダム、発表抄録5344、及び、C.ノイバウエル(Neubauer)、R.クレッサ(Kulessa)及びJ.ヘーレ(Herre)の「MPEG−音声のためのビットストリーム・ウォーターマーキングシステムの互換性ファミリー(A Compatible Family of Bitstream Watermarking Systems for Audio Signals)」第110回AESコンベンション、2000年5月アムステルダム、発表抄録5346中及び独国特許出願公開第19947877号中に記載されている。
要するに、コード化済み及び未コード化の音声信号に対する透かしのいろいろな変形が知られている。透かしを使って、ロバストで不可聴なやり方で追加情報を音声信号内に入れて転送することができる。現在では、前記に示したように、例えば、時間領域、周波数領域などといった領域の異なるいろいろな透かし埋め込み方法、及び、例えば、量子化、個別値消去などといったいろいろな埋め込みの型がある。既存の方法の要約説明が、M.ファン・デル・ヴェーン(van der Veen)、F.ブルッカース(Brukers)らの「ロバスト、多機能及び高品質の音声透かし技術(Robust, Multi−Functional and High−Quality Audio Watermarking Technology)」第110回AESコンベンション、2002年5月アムステルダム、発表抄録5345、及び、ヤープ・ジャイツマ(Jaap Haitsma)、ミシェル・ファン・デル・ヴェーン(Michiel van der Veen)、トン・カルカー(Ton Kalker)およびフォン・ブルッカース(Fons Brukers)の「監視及びコピー防止のための音声透かし(Audio Watermarking for Monitoring and Copy Protection)」ACMワークショップ2000、ロサンゼルス、及び前記の独国特許出願第19640814号中に記載されている。
前に簡単に説明した、透かしを音声信号中に埋め込むスキームのタイプは、既に大きく進展しているが、これら既存の透かし技法には不利点があり、高い取り込み速度及び高いロバスト性で、透かしを不可聴に元の音声信号に埋め込むという目標、すなわち、信号を変形した後においてもうまく使える透かし特性を持たせるという目標に、ほぼ全力がつぎ込まれている。しかして、大方の用途分野では、焦点はロバスト性となっている。前記の国際公開第97/33391号に典型的に示されているような、最も普及している、音声信号に透かしを付加する方法(すなわち、スプレッドバンド変調)は、非常にロバストで安全であるといわれている。
この普及度の高さと、スプレッドバンド変調に基づく透かし方法の原理がよく知られている事実とのため、逆に、これらの方法によって透かしを付加された音声信号の透かしを破壊する方法が知られてくる危険がある。このため、新しい高品質のスプレッドバンド変調の代わりとして使える新しい高品質の方法の開発が非常に重要である。
国際公開第97/33391号公報 独国特許出願公開第19640814号公報 独国特許第10129239号公報 独国特許出願公開第19947877号公報 C.Neubauer(ノイバウェル)、J.Herre(ヘーレ)「電子透かし及びその音声品質への影響(Digital Watermarking and Influence on Audio Quality)」第105回AESコンベンション、1998年サンフランシスコ、発表抄録4823 C.ノイバウエル(Neubauer)、J.ヘーレ(Herre)の「MPEG−2 AAC ビットストリームの音声ウォーターマーキング(Audio Watermarking of MPEG−2 AAC Bit Stream)第108回AESコンベンション、2000年パリ、発表抄録5101 シーベンハール(Siebenhaar)、フランク(Frank);ノイバウエル(Neubauer)、クリスチャン(Christian);ヘーレ(Herre)、ユルゲン(Jurgen)の「音声信号のための圧縮/ウォーターマーキング組合せ(Combined Compression/Watermarking for Audio Signals)」第110回AESコンベンション、アムステルダム、発表抄録5344 C.ノイバウエル(Neubauer)、R.クレッサ(Kulessa)及びJ.ヘーレ(Herre)の「MPEG−音声のためのビットストリーム・ウォーターマーキングシステムの互換性ファミリー(A Compatible Family of Bitstream Watermarking Systems for Audio Signals)」第110回AESコンベンション、2000年5月アムステルダム、発表抄録5346 M.ファン・デル・ヴェーン(van der Veen)、F.ブルッカース(Brukers)らの「ロバスト、多機能及び高品質の音声透かし技術(Robust, Multi−Functional and High−Quality Audio Watermarking Technology)」第110回AESコンベンション、2002年5月アムステルダム、発表抄録5345 ヤープ・ジャイツマ(Jaap Haitsma)、ミシェル・ファン・デル・ヴェーン(Michiel van der Veen)、トン・カルカー(Ton Kalker)およびフォン・ブルッカース(Fons Brukers)の「監視及びコピー防止のための音声透かし(Audio Watermarking for Monitoring and Copy Protection)」ACMワークショップ2000、ロサンゼルス
従って、透かしを情報信号に導入するための、完全に新規性があって安全性もあるスキームを提供することが本発明の目的である。
この目的は、請求項1又は22による装置、及び請求項23又は24による方法によって達成される。
透かしを情報信号に導入するための独創的なスキームによれば、情報信号は、まず、時間表現からスペクトル/変調スペクトル表現に変換される。次いで、情報信号は、スペクトル/変調スペクトル表現において、取り込み対象の透かしに基づいて操作され、変形されたスペクトル/変調スペクトル表現が得られ、続いて、変形されたスペクトル/変調スペクトルに基づいて透かしを付加された情報信号が生成される。
透かしを付加された情報信号から透かしを抽出する独創的なスキームによれば、透かし付加情報信号は、同様に、時間表現からスペクトル/変調スペクトル表現に変換され、続いて、該スペクトル/変調スペクトル表現に基づいて透かしが導き出される。
本発明では、本発明による透かしがスペクトル/変調スペクトル表現及びレンジにおいて埋め込み、取り出しが行われるため、スプレッドバンド変調に基づいた透かし技法で使われるような、従来型のコリレーション・アタックは簡単には成功しないという利点がある。これは、スペクトル/変調スペクトルレンジにおける信号の分析が、潜んでいるアタッカーに対してまだ新しい領域であることのプラス効果でもある。
さらに、本発明は、スペクトル/変調スペクトルレンジ又は2次元の変調スペクトル/スペクトル・レベルにおける透かしの埋め込みによって、例えば、このレベルの埋め込みをどの「位置」にローカライズするかといった、従来の技術よりかなり多くの埋め込みパラメータ変化量を提供する。また、時間変化とともに対応位置の選択を行うこともできる。
情報信号が音声信号である場合、さらに、スペクトル/変調スペクトル・レンジにおいて透かしを埋め込むことによって、従来型の、例えば、聴取閾値といったような心理音響学的パラメータの複雑な計算をせずに、不可聴に透かしを埋め込むことができ、かくて、ほとんど複雑になることなく、なお透かしの不可聴性を確実にすることができる。ここでの変調値の変形を、例えば、変調スペクトルレンジにおけるマスキング効果を利用して実施することができる。
以降では、添付の図を参照しながら本発明の好適な実施形態について説明する。
引き続いて、図1−3を参照しながら、透かしを音声信号中に埋め込むためのスキームを説明する。このスキームにおいて、最初に、着信音声信号、あるいは、時間領域又は時間表現にある音声入力はブロック単位で時間/周波数表現に変換され、それから周波数/変調周波数表現に変換される。次に、透かしに応じて周波数/変調周波数領域表現の変調値を変形することによって、このような表現形式の音声信号中に透かしが取り入れられる。このように変形された音声信号は、次に、再度、時間/周波数領域に、これからさらに時間領域に変換されることになる。
図1−3のスキームによる透かしの埋め込みは、以降透かし埋め込み装置といい参照番号を10で示す図1による装置により実行される。埋め込み装置10は、透かしを中に導入する音声入力信号を受信するための入力部12を含む。埋め込み装置10は、例えば、顧客番号のような透かしを入力部14で受信する。埋め込み装置10は、入力部12及び14とは別に、透かしを付加された出力信号を出力するための出力部16を含む。
埋め込み装置10は、その内部に窓処理手段18及び第1フィルタバンク20を含み、これらは入力部12の後に直列に接続されていて、入力部12の音声信号を、ブロック単位の処理によって時間領域22から時間/周波数領域24に変換する役割を持つ。フィルタバンク20の出力の後には振幅/位相検出手段26が続き、音声信号の時間/周波数領域表現を振幅と位相とに分割する。第2フィルタバンク28は、検出手段26に接続されており、時間/周波数領域表現の振幅の部分を取得して、該振幅部分を周波数/変調周波数領域30に変換し、このようにして音声信号12の周波数/変調周波数表現を生成する。ブロック18、20、26、28は、かくて、音声信号の周波数/変調周波数表現への変換を実施する、埋め込み装置10の分析部分を示している。
透かし埋め込み手段32は、第2フィルタバンク28に接続され、これから音声信号12の周波数/変調周波数表現を受信する。透かし埋め込み手段32の別の入力端は埋め込み装置10の入力部14に接続されている。透かし埋め込み手段32は、変形された周波数/変調周波数表現を生成する。
透かし埋め込み手段32の出力端は、第2フィルタバンク28とは逆のフィルタバンク34の入力端に接続されており、フィルタバンク34は、時間/周波数領域24への再変換の役割を担っている。位相処理手段36は検出手段26に接続されており、音声信号の時間/周波数領域表現24の位相部分を取得し、後記するように、それに操作を加えた形態で再合成手段38に転送する。該再合成手段は、さらに逆フィルタバンク34の出力端に接続されており、音声信号の時間/周波数表現の変形された振幅部分を取得する。再合成手段38は、位相処理手段36によって変形された位相部分と、透かしによって変形された音声信号の時間/周波数領域表現の振幅部分とを結合させ、その結果、すなわち、透かしを付加された音声信号の時間/周波数表現を、第1フィルタバンク20と逆のフィルタバンク40に出力する。窓処理手段42は、逆フィルタバンク40の出力端と出力部16との間に接続されている。構成要素34、38、40、42による部分を、埋め込み装置10の合成部分と見なすことができる、というのはこの部分は変形された周波数/変調周波数表現から、透かしを付加された時間表現における音声信号を生成する役割を果たしているからである。
前述した埋め込み装置10のセットアップについて、その機能モードを以下に説明する。
埋め込みは、入力部12の音声信号を、手段18及び20によって時間表現から時間/周波数表現に変換することから開始され、入力部12の入力音声信号は、所定のサンプル周波数でサンプルされた形、すなわち、サンプル又はオーディオ値のシーケンスであると想定されている。音声信号が、まだそのようなサンプル形態にされていない場合には、サンプリング手段として対応A/Dコンバータをここに使用することができる。
窓処理手段18は音声信号を受信し、そこからオーディオ値のブロックのシーケンスを抽出する。このため、窓処理手段18は、入力部12で音声信号の所定数の連続するオーディオ値を結合し、その各々が時間ブロックを形成し、音声信号12から時間窓を表すこれらの時間ブロックを、例えば、サイン窓、KBD窓などといった窓関数又は重み付け関数によって、乗算又は窓処理する。このプロセスを窓処理といい、典型的には、個々の時間ブロックが、例えば、半分ずつ重なり合う音声信号の時間セクションを参照して、各々のオーディオ値が2つの時間ブロックに割り当てられるようにして実行される。
手段18による典型的窓処理のさらなる詳細プロセスを、50%のオーバーラップを例として図2に示す。図2には、矢印50によって、どのようにしてオーディオ値が入力部12に到着したのかについての時間シーケンスにおけるオーディオ値のシーケンスが示されている。これらは時間領域22における音声信号12を表している。図2の指数nは、矢印の方向に増えてゆくオーディオ値の指数を表す。52は、窓処理手段18が時間ブロックに適用する窓関数を示す。最初の2つの時間ブロックに対する最初の2つの窓関数を、それぞれ2m及び2m+1の指数で示す。見れば分かるように、時間ブロック2m及び次の時間ブロック2m+1は、半分すなわち50%ずつオーバーラップし、各々はそのオーディオ値の半分を共有している。手段18によって生成され、フィルタバンク20に転送されたブロックは、窓処理関数52による、時間ブロックに含まれるオーディオ値の重み付け、又はそれらへの乗算処理に対応している。
フィルタバンク20は、図2の矢印54で示されているように、時間ブロックまたは窓処理されたオーディオ値のブロックを受信し、それらをブロック単位で、時間/周波数変換によってスペクトル表現に変換する。かくて、フィルタバンクは、設計に従って、スペクトルレンジを所定の周波数バンド又はスペクトル成分に所定どおり分割する。該スペクトル表現は、典型例として、周波数ゼロから該音声信号がベースとする最大の音声周波数、例として44.1kHz、までの相互に隣り合った周波数を持つスペクトル値を含む。図2は、例として、10のサブバンドへの分割のケースを表す。
ブロックごとの変換が図2に複数の矢印58で示されている。各々の矢印は、一つの時間ブロックの周波数領域への変換に対応している。例として図2のボックスの列で示すように、時間ブロック2mはスペクトル値62のブロック60に変換される。スペクトル値の各々は、それぞれ異なった周波数成分又は異なった周波数バンドを表し、図2では、これらに沿って、軸64によって周波数kが示されている。前述したように、10個だけのスペクトル成分を想定しているが、この数字は例示的なものであって、実際はおそらくもっと多くの数となろう。
フィルタバンク20は、時間ブロック単位でスペクトル値62の1ブロック60を生成するので、時間経過とともに、いくつものスペクトル値62のシーケンス、すなわち、スペクトル成分k又はサブバンドkごとに1つのシーケンスが得られる。図2では、これらの時間シーケンスは、矢印66が示すラインの方向に進む。かくて、矢印66は時間/周波数表現の時間軸を表し、矢印64は、この表現の周波数軸を表す。「サンプル周波数」、又は個別サブバンド内のスペクトル値の繰り返し距離は、音声信号からの時間ブロックの周波数又は繰り返し距離に対応する。次に、該時間ブロック繰り返し周波数は、音声信号のサンプル周波数を、時間ブロックごとのオーディオ値の数で除した数の2倍に対応する。このように、矢印66は、それが時間ブロックの時間シーケンスの特徴を表す限りにおいて、時間ディメンションに対応する。
図から分かるように、これら時間ブロックの継続中、いくつかの数、ここでの例では8個の連続した時間ブロックによって、音声信号の時間/周波数領域表現24を表すスペクトル値62のマトリックス68が形成される。
フィルタバンク20によって、時間ブロックに対しブロック単位で行われる時間/周波数変換56は、例えば、DFT、DCT、MDCTなどである。変換によっては、ブロック60内の個々のスペクトル値は、いくつかのサブバンドに分けられる。各サブバンドに対して、各ブロック60は1つ以上のスペクトル値62を含むことができる。全体として見れば、時間ブロックの間、それぞれのサブバンドの時間形態を表すスペクトル値のシーケンスが得られ、図2ではサブバンド又はスペクトル成分ごとにライン84の方向に流れる。
フィルタバンク20は、スペクトル値62のブロック60を、ブロック単位で振幅/位相検出手段26に転送する。後者は、複素スペクトル値を処理し、その振幅だけをフィルタバンク28に転送することになる。しかしながら、スペクトル値62の位相は位相処理手段36に転送される。
フィルタバンク28は、フィルタバンク20と同様に、サブバンドごとのスペクトル値62の振幅のシーケンス70を処理し、つまり、これらのシーケンスを、ブロック単位で、望ましくは同様に窓処理されオーバーラップされたブロックを使って、スペクトル表現又は変調周波数表現に変換する。ここで、すべてのサブバンドの基本ブロックは、望ましくは、相互に等しく時間合わせされている。別の言い方をすると、フィルタバンク28はスペクトル値の振幅のN個のスペクトルブロック60の各々を同時に又はまとめて処理する。スペクトル値振幅のN個のスペクトルブロック60は、スペクトル値振幅のマトリックス68を形成する。例えば、M個のサブバンドがある場合には、フィルタバンク28は各々がN*Mのスペクトル値振幅のマトリックス中のスペクトル値振幅を処理することになる。図3は、M=Nの例示的ケースを想定しており、図2では例として、N=10、M=8を想定している。スペクトル値の振幅68のこのようなマトリックス68の振幅部分のフィルタバンク28への転送が、図2中の矢印72によって示されている。
次のスペクトルブロック又はマトリックス68の振幅部分Nを受信した後、フィルタバンク28は、各サブバンド別々に、それぞれのサブバンドのスペクトル値の振幅のブロック、すなわちマトリックス58中の行を、時間領域66から周波数表現に変換することになり、前述したように、ここで、スペクトル値の振幅を窓処理してエイリアシング影響を回避することができる。言い換えれば、フィルタバンク28は、これらのスペクトル値振幅ブロックの各々を、それぞれのサブバンドの時間形態を表すシーケンス70からスペクトル表現に変換し、これにより、サブバンドごとの変調値の1ブロックを生成することになり、これは図2中の74によって示されている。各ブロック74は、図2に示されていないいくつかの変調値を包含する。ブロック74内のこれらの変調値の各々は、異なった変調周波数に関連しており、図2中では軸76に沿って示され、かくて該軸は周波数/変調周波数表現の変調周波数軸を表している。軸78沿いのサブバンド周波数に従ってブロック74を整列させることによって、変調値のマトリックス80は、マトリックス68における時間セクションの中の、入力部12で音声信号の周波数/変調周波数領域表現を表す形となる。
前述したように、アーチファクトを回避するため、フィルタバンク28又は手段26には、フィルタバンク28によるそれぞれの変調周波数領域30への時間/変調周波数変換80によってブロック74を得る前に、スペクトル値の変換ブロックすなわちマトリックス68の行を、サブバンドごとに窓関数82によって窓処理するための内部窓処理手段(図示せず)を含めることができる。
前述の50%オーバーラップ窓処理の典型例において、時間的に50%オーバーラップされたマトリックス80のシーケンスは、前述のやり方で処理されることを再度明確にしておく。言い換えると、フィルタバンク28は、図2中の、次のマトリックスに対する窓処理を表わす半弧の窓関数84によって例示するように、マトリックス80の各々が、N個の、半分ずつオーバーラップした時間ブロックに対応するようにして、一連のN個の時間ブロックに対するマトリックス80を形成する。
フィルタバンク28から出力される周波数/変調周波数領域表現30の変調値は、透かし埋め込み手段32に着信する。透かし埋め込み手段32は、このとき、音声信号12の変調マトリックス80、又は変調マトリックス80の個別の又はいくつかの変調値を変形する。手段32による変形については、例えば、変調サブバンド・スペクトルの個々の変調周波数/周波数セグメント又は周波数/変調周波数領域表現の相乗重み付け、すなわち、軸76と78とによって展開される周波数/変調周波数空間の特定領域内の変調値を重み付けすることによって実施することができる。また、該変形には、個別のセグメント又は変調値を、特定の値に設定することを含めることもできよう。
相乗重み付け又は特定値は、入力部14において所定の方法で得られる透かしに基づくものとなる。したがって、個別の変調値又は変調値セグメントの特定値への設定は、信号適応的なやり方で、すなわち、音声信号それ自体にさらに依存して行われることになる。
二次元変調サブバンドスペクトルの個別セグメントは、一方では、音響周波数軸78を周波数グループに再分割して得ることができ、他方では、変調周波数軸76を変調周波数グループに再分割することによって、さらなる区分けを行うことができる。図1において、周波数軸を5つのグループに、変調周波数軸を4つのグループに区分し20のセグメントを得る例が示されている。黒色のセグメントは、例として、手段32が変調マトリックス80を変形した位置を示しており、前述したように、変形に使用する位置を時間とともに変えることができる。望ましくは、該位置は、変形の影響がマスキングされることによって、周波数/変調周波数表現における音声信号中の変化が不可聴又はほとんど不可聴なように選定される。
手段32が変調マトリックス80を変形した後、該手段は変調マトリックス80の変形された変調値を、逆フィルタバンク34に送信し、該フィルタバンクは、フィルタバンク28とは逆向きに変換する方法、例えば、IDFT、IFFT、IDCT、IMDCTなどによって、変調マトリックス80を、変調周波数軸76に沿って、ブロック74単位ですなわちサブバンドごとに分けて、時間/周波数領域表現24に再変換し、これによりスペクトル値の変形された振幅部分を得る。言い換えれば、逆フィルタバンク34は、ある特定のサブバンドに属する変形された変調値74の各ブロックを、変換86とは逆向きの変換によって、サブバンドごとの振幅部分スペクトル値のシーケンスに変換し、前記の実施形態によれば、N×M個の振幅部分スペクトル値を得る。
逆フィルタバンク34からの振幅部分スペクトル値は、当然ながら透かしで変形された形態ではあるが、スペクトル値のシーケンス・ストリームからの二次元ブロック又はマトリックスに必ず関連している。例示の実施形態では、これらの各ブロックは50%ずつオーバーラップしている。例示の手段34内に具わっている手段(図示せず)は、そこで、この例の50%オーバーラップしているケースにおいては、連続する変調マトリックスの再変換で得られたスペクトル値の連続するマトリックスの再結合されたスペクトル値にオーバーラップ部を加えることによって窓処理を補正する。ここにおいて、変形されたスペクトル値のストリーム又はシーケンスが、変形スペクトル値の個々のマトリックスから、サブバンドごとに一組再形成される。これらのシーケンスは、手段20によって出力されたスペクトル値の変形前のシーケンス70の振幅部分だけに対応している。
再合成手段38は、逆フィルタバンク34の振幅部分スペクトル値と、第1フィルタバンク20による変換56の直ぐ後で検出手段26によって分離されたスペクトル値62の位相部分とを組み合わせ合成して、サブバンドのストリームを形成するが、位相は位相処理36によって変形された形態になっている。位相処理手段36は、手段32による透かし埋め込みとは別なやり方で位相部分を変形するが、検出装置又はデコーダ・システム(これについては後記で図3を参照しながら説明する)の透かし検出能が、出力部16から出力される透かしを含む出力信号中の透かし信号をよりよく検出及び/又は音響的にマスキングし、これにより透かしの不可聴性を向上させるように、手段32の埋め込みに依存することがある。再合成手段38は、サブバンドごとの変形された振幅部分スペクトル値のシーケンスに対し、マトリックス68単位で又は連続的に再合成することができる。入力部12の音声信号の時間/周波数表現の位相部分の取り扱いに関する、操作手段32による周波数/変調周波数表現への選択的な依存を、図1中の破線で示した矢印88によって示す。該再合成は、例えば、スペクトル値の位相を、フィルタバンク34から出力される、対応する変形されたスペクトル値の位相部分に加えることによって行うことができる。
このようなやり方で、手段38は、変形前の音声信号についてフィルタバンク20の直後で得られるような、サブバンドごとのスペクトル値のシーケンス、すなわち透かしによって変形されたシーケンス70を生成し、手段38によって再合成、出力され、振幅部分に関して変形されたスペクトル値が、透かしを付加された音声信号の時間/周波数表現を表すようにする。
こうして、逆フィルタバンク40は、再び、変形されたスペクトル値のシーケンス、すなわちサブバンドごとに1つのシーケンスを得る。言い換えれば、逆フィルタバンク40は、サイクルごとに変形スペクトル値の1ブロック、すなわち、1つの時間セクションに関する透かし付加音声信号の1つの周波数表現を得る。これに対応して、フィルタバンク40は、このようなスペクトル値のブロックの各々すなわち周波数軸70に沿って整列されたスペクトル値に対して、フィルタバンク20による変換56とは逆向きの変換を行い、結果として、変形され窓処理された時間ブロック、又は窓処理された変形されたオーディオ値の時間ブロックを得る。その次の窓処理手段42は、窓処理手段18によって加えられた窓処理を、オーバーラップ域の相互に一致するオーディオ値を加えることによって補正し、その結果は、出力部16での時間領域表現22における透かし付加出力信号となる。
前述した図1−2の実施形態による埋め込みに続いて、図3を参照しながら、埋め込み装置10によって生成された、透かしを付加された出力信号をうまく分析し、透かし付加出力信号中に有用な音声情報とともに包含されている透かしを、該信号から、望ましくは人間の耳には不可聴なやり方で再構築又は再検出するのに適した装置について引き続き説明する。
図3に、全体を100として示されている透かしデコーダは、透かし付加音声信号を受信するための音声信号入力部112、及び透かしを付加された音声信号から抽出された透かしを出力するための出力部114を含む。入力部112の後に、以下に記載する順序で直列に、窓処理手段118、フィルタバンク120、振幅/位相検出手段126、及び第2フィルタバンク128が接続され、これらの機能及び動作モードは、埋め込み装置10のブロック18、20、26及び28のものに対応する。このことは、入力部112の透かし付加音声信号は、窓処理手段118及びフィルタバンク120によって時間領域122から時間周波数領域124に変換され、次いで、検出手段126及び第2フィルタバンク128によって入力部112における音声信号の周波数/変調周波数領域130への変換が行われる、ということである。透かしを付加された音声信号は、次に、元の音声信号に関し図2を参照して説明したような、手段118、120、126及び128による処理と同じ処理を受ける。但し、その結果得られる変調マトリックスは、埋め込み装置10の透かし埋め込み手段32によって出力されたものとは完全には一致しない、というのは、再合成手段38の位相再合成によって、変形された変調マトリックスの一部の変調部分が、手段32から出力された状態から変形されており、これにより、透かし付加出力信号がいくらか変化した形で表現されているからである。また、デコーダ100において、逆窓処理又はOLAも、変調部分を変化させ、変調スペクトル分析を更新する。
フィルタバンク128に接続された、透かし付加入力信号の周波数/変調周波数領域表現又は変調マトリックスを得るための透かしデコーディング手段132は、この表現から当初埋め込み装置10によって取り込まれた透かしを抽出し、これを出力部114に出力するよう構成されている。埋め込み装置10が埋め込みに使った位置に相当する変調マトリックスの所定位置で抽出が行われる。この位置選定の整合については、例えば、対応する標準化によって確実にする。
埋め込み装置10の手段32で生成された変調マトリックスと比べて、透かしデコーディング手段132に供給される変調マトリックスに生じる変化は、透かし付加入力信号が、その生成時又は出力部16からの出力時と、検出装置100又は入力部112における受信時との間で何らかの形で、例えば、オーディオ値等の粗すぎる量子化などによって劣化することによっても生じる。
透かしを音声信号に埋め込むスキームの別の実施形態、これは、図1から3までを参照して説明したスキームとは、音声信号の時間領域から周波数/変調周波数領域への変換の型とやり方とが異なるだけのスキームであり、これを図4及び5を参照しながら説明するが、その前に、前記で説明した埋め込みスキームを有効に活用する典型的用途分野又は方法について引き続き説明する。以下の例は、これに沿って、放送モニタリング、及び、例えば従来型のWM(透かし)システムのようなDRMシステムにおける用途分野の典型例を挙げたものである。しかしながら、後記の用途可能性は、以下に説明する図4及び5の実施形態だけには適用されない。
一つの用途として、前述の音声信号中への透かしの埋め込みの実施形態を使って著作者を証明することができる。入力部12に着信する元の音声信号は、例として音楽作品である。音楽作品を提供しながら、埋め込み装置10によって著作者情報を透かしの形で音声信号に導入することができ、その結果を透かし付加音声信号として出力部16から出力できる。第三者が、対象となる音楽作品又はミュージックタイトルの著作者であると主張する場合、透かしを使って実際の著作権を証明することができ、該透かしは、検出装置100を使って、通常の再生では不可聴な透かし付加音声信号などから抽出することができる。
前記で説明した透かし埋め込みの別の可能な使い方として、TV及びラジオ放送局の放送番組での使用記録に透かしを用いることがある。多くの場合、放送番組は、例えば、個別ミュージックタイトル、ラジオドラマ、コマーシャルなどのいろいろな部分に分けられている。音声信号の著作者、あるいは、少なくともあるミュージックタイトル又はコマーシャルで利益を得ることを許され、そう望む人は、埋め込み装置10によって自分の音声信号に透かしを付加し、該透かし付加音声信号を放送運営者の使用に供することができる。このようなやり方でミュージックタイトルやコマーシャルにそれぞれ明白な透かしを付加することができる。例えば、放送番組での使用記録をとるために、コンピュータで放送信号中の透かしをチェックし、検知された透かしを使うことができる。検出された透かしのリストを使って、対象放送局の放送リストを簡単に作成することができ、会計及び請求処理が容易になる。
別の用途分野には、透かしを不法なコピーの判定に使用することがある。この面では、特に、インターネットによる音楽配信に対する透かしの使用は効果がある。顧客が音楽作品を購入すると、音楽データを顧客に送信するに際し、透かしを使って明瞭な顧客番号がデータ中に埋め込まれる。これによりミュージックタイトルには、不可聴に透かしが埋め込まれる。後の時点において、例えば、交換サイトのような、承認を受けていないインターネットサイトにおいて音楽作品が検知された場合、図3によるデコーダを使って、この作品の透かしをチェックすることができ、透かしを使って当初の顧客を識別することができる。また、後者の用途は、現在のDRM(デジタル著作権管理)対処策として重要な役割を果たすかもしれない。ここでは、透かし付加音声信号中の透かしを一種の「第2の防衛線」として役立たせることができ、これにより、透かし付加音声信号の暗号保護が回避された場合にも、当初の顧客を追跡することができる。
さらなる透かしの用途が、例えば、Chr. ノイバウエル(Neubauer)、J. ヘーレ(Herre)の論文「改良型透かし及びその応用(Advanced Watermarking and its Application)」第109回Audio Engineering Societyコンベンション、ロサンジェルス、2000年9月発表抄録5176に記載されている。
引き続いて、図1−3の実施形態とは別の、音声信号の時間領域から周波数/変調周波数領域への変換法を使った埋め込みスキームの実施形態を参照しながら、埋め込み装置及び透かしデコーダを説明する。以下の説明において、図1及び3のものと同一又は同じ目的を持つ図中の要素には、図1及び3に示したのと同一の参照番号を付与し、これら要素については、機能のモード及び目的のさらなる詳細説明のため図1−3の説明に追加する説明を行うだけとし重複を避ける。
全体を210で示されている図4の埋め込み装置は、図1の埋め込み装置と同様に、音声信号入力12、透かし入力部14、及び透かし付加音声信号を出力するための出力部16を含む。入力部12に続いて窓処理手段18及び第1フィルタバンク20があり、音声信号をブロック単位でスペクトル値62のブロック60に変換し(図2)、これによってフィルタバンク20の出力端に形成されるスペクトル値ブロックのシーケンスは音声信号の時間/周波数領域表現24を表す。但し、図1の埋め込み装置10とは対照的に、複素スペクトル値62は、振幅と位相とに分離されず、複素スペクトル値はそのまま処理され、音声信号から周波数/変調周波数領域に変換される。かくて、サブバンドの一連のスペクトル値のシーケンス70は、振幅と位相とを取り入れたスペクトル表現にブロック単位で変換される。但し、各サブバンドのスペクトル値シーケンス70を復調にかける前である。ミキサ212は、各シーケンス70、すなわち、連続する時間ブロックを特定のサブバンドに対するスペクトルレンジに変換して得たスペクトル値のシーケンスに対し、搬送周波数測定手段214が、スペクトル値から、具体的には音声信号の時間/周波数領域表現のこれらのスペクトル値の位相部分から測定した変調搬送波成分の共役複素数を乗じる。手段212及び214は、時間ブロックの繰り返し距離は、必ずしも、音声信号の搬送周波数成分、すなわち平均として音声信号の搬送周波数を表す可聴周波数の周期時間と同調していないという事実に対し補正を行う機能を持つ。同調差が生じた場合には、一連の時間ブロックは、異なる位相オフセットによって音声信号の搬送周波数へとシフトされる。このことは、フィルタバンク20から出力されるスペクトル値の各ブロック60は、搬送周波数の位相部分に対するそれぞれの時間ブロックの位相オフセットに応じ、個別時間ブロックの位相オフセットにトレースバック可能な、すなわち勾配及び軸部分が位相オフセットによって決まる、リニアな位相増加を含む、という結果をもたらす。連続する時間ブロックの間の位相オフセットは、最初は常に増加することになるので、スペクトル値62の各ブロック60に対する位相オフセットに帰還される位相増加の勾配もまた、位相オフセットが再度ゼロになるまで増加することになる。
前記の説明は、スペクトル値の個別のブロック60だけについて述べたものである。しかしながら、前記の説明から、同一のサブバンドに対する連続する時間ブロックで得られるスペクトル値に対しても、リニア位相増加、すなわち図2のマトリックス68中のライン沿いの位相増加が検出できることは明白である。この位相増加もまたトレースバックすることができ、これは連続する時間ブロックの位相オフセットにより決まる。全体的に見れば、マトリックス68中のスペクトル値は、引き続く時間ブロックの時間オフセットによって、軸66と64とで展開されるスペースに平面として示される累積位相変化をたどることになる。
しかして、搬送周波数測定手段214は、例えば、誤差最小二乗アルゴリズムのような妥当な方法によって、マトリックス60のスペクトル値62のアンラップ位相、又は位相アンラップによる位相、又は位相展開、又は位相部分のラインアップに平面を当てはめ、これから、マトリックス68内の個々のサブバンドのスペクトル値のシーケンス70内に生ずる時間ブロックの位相オフセットに帰還する位相増加を推定する。全体として、サブバンドごとの結果は、求める変調搬送波成分に対応する推定位相増加となる。手段214はこれをミキサ212に転送し、該ミキサは、そのスペクトル値のそれぞれのシーケンス70に、共役複素数又はexp{−j(w*m +φ)}を乗じる。ここで、wは所定の搬送波を表し、mはスペクトル値に対する指数であり、φは、対象となるN個の時間ブロックの時間セクションにおける所定搬送波の位相オフセットである。当然ながら、搬送周波数測定手段214は、マトリックス68内のスペクトル値62の個別シーケンス70の位相形態に直接的に一次元当てはめを実施して、時間ブロックの位相オフセットに戻る個々の位相増加分を得ることもできる。ミキサ212による復調の後、マトリックス68のスペクトル値の位相部分はこのように「水平化」されて、位相ゼロの周辺を、音声信号自体の形状によって変動するだけとなる。
ミキサ212は、このように変形されたスペクトル値62をフィルタバンク28に転送し、該フィルタバンクは、これをマトリックス(図2中のマトリックス68)ごとに周波数/変調周波数領域に変換する。図1−3の実施形態と同様に、結果は変調値のマトリックスとなるが、但し、今回は、この時間/周波数領域表現24では、移送及び振幅双方が検討されている。図1の例と同様に、50%オーバーラップ等の窓処理が行われる。
このようなやり方で生成された連続変調マトリックスは、透かし埋め込み手段216に転送され、該手段は別の入力部から透かし14を受信する。透かし埋め込み手段216は、典型的には、図1の埋め込み装置10の埋め込み手段32が行ったのと同様に動作する。但し、周波数/変調周波数領域表現30内の埋め込み位置は、必要に応じ、埋め込み手段32の場合と違ったマスキング効果を考慮したルールを使って選定される。手段32と同様に、埋め込み位置は、変形された変調値が、後に、埋め込み装置210の出力部から出力される透かし付加音声信号に対して可聴な影響を与えないように選定すべきである。
変更された変調値、もしくは変更又は変形された変調マトリックスは逆フィルタバンク34に転送され、これは、変形された変調マトリックスから変形されたスペクトル値のマトリックスを形成するようにされている。これらの変形されたスペクトル値について、ミキサ212による復調によって生じた位相補正も反転される。このことが、ミキサ218を使って、サブバンドごとに逆フィルタバンク34によって出力された変形されたスペクトル値のブロックと復調搬送波成分との混合又は相乗を行う理由であって、該成分は、復調のため周波数/変調周波数領域に変換する前に、当該サブバンドに対しミキサ212が用いた共役複素数であり、これは、これらブロックに対しexp{j(w*m +φ)}を乗ずることである。ここで、wは、前記同様、それぞれのサブバンドに対する所定搬送波を示し、mは変形スペクトル値に対する指数であり、φはそれぞれの対象サブバンドに対するN個の時間ブロックによる時間セクションにおける所定搬送波の位相オフセットである。それぞれのサブバンドに対するそれぞれのモジュレータは、所定のサブバンド・ブロックの成分に関し、又はブロック分割の後、変調212、214によって用いられたものであり、次のブロック併合の前に再度反転される。
このようにして得られたスペクトル値は、まだブロック形状、すなわちサブバンドごとに一つの変形スペクトル値のブロック形状であり、必要に応じ、例えば、図1の34に関して説明したようなやり方で、逆変換窓処理のためにOLA又は併合操作が行われる。このようにして得られた窓処理解除されたスペクトル値は、このときサブバンドごとの変形スペクトル値のストリームとして利用可能となり、透かしを付加された音声信号の時間/周波数領域表現を表している。ミキサ218からの出力の後に続くのは、逆フィルタバンク40及び窓処理手段42であり、これらは透かし付加音声信号の時間/周波数領域表現を時間領域22へ変換し、その結果は、出力部16における、透かし付加音声信号を表すオーディオ値のシーケンスとなる。
図4によるプロシージャの、図1のプロシージャと比べての利点は、位相及び振幅を一緒に用いて周波数/変調周波数領域への変換が行われるため、位相と変形された振幅部分を再合成する際の変調部分の再取り込みが必要ないということである。
埋め込み装置210から出力される透かし付加音声信号を処理して、これから透かしを抽出するために適切な透かしデコーダを図5に示す。全体を310で示したデコーダ310は、透かし付加音声信号を受信するための入力部312、及び抽出した透かしを出力するための出力部314を含む。デコーダ310の入力部312に続くのは、以下の記載順序で直列に連結された、窓処理手段318、フィルタバンク320、ミキサ412、及びフィルタバンク328であり、ミキサ412の別の入力端は、フィルタバンク320の出力端につながる入力端を具えた搬送周波数測定手段440の出力端に接続されている。構成要素318、320、412、328、及び414は、埋め込み装置210の構成要素18、20、212、28、及び214が行うのと同じ目的のために同じやり方で機能する。このように、透かし付加入力信号は、デコーダ310において、時間領域322から、時間周波数領域324を介して周波数/変調周波数領域表現に変換され、透かしデコーディング手段332は、透かし付加音声信号の周波数/変調周波数領域表現を受信、処理して透かしを抽出し、これをデコーダ310の出力部314に出力する。前に述べたように、デコーダ310中のデコーディング手段332に供給される変調マトリックスは、図1−3の実施形態中のデコーディング手段132に供給されるマトリックスと埋め込み手段216に供給されるマトリックスとの差よりも違いが少ない、というのは、図4の埋め込み装置システムにおいては、位相部分と変形された振幅部分との間での再合成がないからである。
以上のように、前記の実施形態は、今までに知られていない主題分野、「サブバンド変調スペクトル分析」と「電子透かし」との関係に関しており、一方には透かしを導入する埋め込み装置システム、他方には検出装置システムによって全体的システム形成する。埋め込み装置システムは透かしを導入する役割を果たす。該システムは、サブバンド変調スペクトル分析、分析で得られた信号表現の変調を行う埋め込み作業ステージ、及び変調された表現の信号の合成で構成される。これと対照的に、検出装置システムは、透かしを付加された音声信号に存在する透かしを認識する機能を持つ。このシステムは、サブバンド変調スペクトル分析、及び分析から得られた信号表現を使って透かしを認知し判断する検出ステージで構成されている。
なお、透かしの埋め込み又は抽出のために使用する周波数/変調周波数領域中の位置、又は周波数/変調周波数領域中の変調値の選定に関しては、この選定を心理音響学的に行って、透かし付加音声信号を再生するときに透かしが不可聴であることを確実にすべきである。適切な選定のために、変調スペクトルレンジにおけるマスキング効果を使うこともできよう。これについては、例えば、T.ハウトガスト(Houtgast)の「振幅変調検出における周波数選択性(Frequency Selectivity in Amplitude Modulation Detection)」J.Acoust.Soc.Am.、Vol.85、No.4、1989年4月を参照でき、この論文は、周波数/変調周波数領域における変形対象変調値の不可聴な選定に関して、本明細書に組み込まれる。
変調スペクトル分析について全体的な理解を高めるために、変調変換を用いた音声コーディングを記載した下記の発表を参照する。これらの発表では、信号は、変換されて周波数バンドに分割され、続いて振幅と位相に分離され、次に、位相はそれ以上処理されないが、各サブバンドの振幅は、いくつかの変換ブロックを介する第2変換において再度変換される。結果は、それぞれのサブバンドの時間エンベロープの「変調係数」への周波数分割となる。こういった一連の文書には以下が含まれる:M.ビントン(Vinton)及びL.アトラス(Atlas)の論文「拡張及び発展型音声コーデック(A Scalable and Progressive Audio Codec)」2001 IEEE ICASSPの発表予稿、2001年5月7−11日、ソルトレークシティ;Atlasらによる米国公開出願第2002/0176353号、名称「拡張型及び知覚的分類による信号コーディング及びデコーディング(Scalable And Perceptually Ranked Signal Coding and Decoding)」;J.トムソン(Thompson)及びL.アトラス(Atlas)の論文「時間分解能増大による、音声コーディングのための不均一変調変換(A Non−uniform Modulation Transform for Audio Coding with Increased Time Resolution)」2003 IEEE ICASSPの発表予稿、2003年4月6−10日、香港;及びL.アトラス(Atlas)の論文「ジョイント音響及び変調周波数(joint Acoustic And Modulation Frequency)」Journal on Applied Signal Processing 7 EURASIP、668−675頁、2003年。
前記の実施形態は、音声レコーディングに、操作に対して頑強で不可聴な追加情報を付加できるようにし、これにより、いわゆるサブバンド変調スペクトルレンジにおいて透かしを取り入れ、サブバンド変調スペクトルレンジにおいて検出を行うための典型的やり方だけを表している。しかしながら、これら実施形態の各種の変形を作ることができる。前に述べた窓処理手段にブロック形成だけをさせる、すなわち、乗算又は重み付けを省略することもできよう。さらに、前述した三角関数の振幅以外の窓関数を使うこともできよう。また、50%のブロック・オーバーラッッピングを省略するか又は違ったやり方で実施することもできよう。同様に、合成の側でのブロック・オーバーラッッピングについても、次に続く時間ブロック中のオーディオ値との整合作業の追加と違った作業を含めることができよう。さらに、第2変換ステージにおける窓処理作業も同様に変えることができよう。
さらに、必ずしも、音声信号の取入れを時間領域から周波数/変調周波数領域表現に行う必要はなく、また、これから再度逆に時間領域表現に変換する必要はないこともある。さらに、前に述べた2つの実施形態を変形し、再合成手段38又はミキサ218から出力される値を結合し、時間/周波数領域におけるビットストリーム中の透かし付与音声信号として形成することも可能であろう。
さらに、第2実施形態中で用いた復調を、例えば、マトリックス68内のスペクトル値ブロックの位相形態を一定の複素搬送波と単なる相乗以外の手段によって変化させるといった、異なった設計にすることもできよう。
図3及び5を参照して説明した、実施可能なデコーダについての前記の実施形態に関して、その透かし・デコーダ手段と関連埋め込み装置からの対応入力の入力部との間に配列されたブロックは同じものなので、埋め込み装置のこれらの手段に関連して前述したすべての変形可能性は、図3及び5の透かしデコーダにも同様に適用されることを指摘しておく。
また、前述の実施形態については、音声信号への透かし埋め込みだけに関連させてきたが、本透かし埋め込みスキームを、例えば、制御信号、測定信号、映像信号などといった異なる情報信号に用いて、例えばその信憑性についてこれらをチェックできることも指摘しておく。これらすべてのケースにおいて、本明細書で提案するスキームによって、例えば、測定結果の解析又は映像の光学的効果などの透かしを付加された形の情報信号を普通に使用することを妨げないようにして、情報埋め込みを実施することは可能であり、このことが、こういったケースにおいても、埋め込まれる追加データが電子透かしと呼ばれる理由である。
なお、状況に応じ、本発明のスキームをソフトウエアに搭載することができる。このような搭載は、デジタル記憶媒体、具体的には電子的に読み出しができて制御信号を具えたディスク又はCDに行うことができ、これとプログラム可能なコンピュータシステムとを共用して対応方法を実行することができる。また、通常、本発明を、このようにマシン可読媒体に格納したプログラムコードを具えたコンピュータプログラム製品中に入れ、該コンピュータプログラム製品をコンピュータに実行させて本発明の方法を実施する。すなわち、本発明を、このようにプログラムコードを具えたコンピュータプログラムとして実現し、コンピュータプログラムをコンピュータに実行させて本方法を実施することもできる。
図1は、本発明の実施形態による、音声信号中に透かしを埋め込むための装置のブロック図である。 図2は、図1の装置がこれに基づくものであり、音声信号から周波数/変調周波数領域への変換を示すための図解図である。 図3は、図1の装置によって埋め込まれた透かしを、透かしを付加された音声信号から抽出するための装置のブロック図である。 図4は、本発明の別の実施形態による、透かしを音声信号中に埋め込むための装置のブロック回路図である。 図5は、図4の装置によって埋め込まれた透かしを、透かしを付加された音声信号から抽出するための装置のブロック図である。進歩的な符号器の好ましい一実施形態のブロック図である。

Claims (25)

  1. 透かしを情報信号中に導入するための装置であって、
    前記情報信号を時間表現(22)からスペクトル/変調スペクトル表現(30)に変換するための手段(18、20、26、28;18、20、212、214、28)と、
    導入される透かしに応じ、前記スペクトル/変調スペクトル表現における前記情報信号を変形して変形されたスペクトル/変調スペクトル表現を得るための手段(32;216)と、
    変形されたスペクトル/変調スペクトル表現に基づいて透かしを付加された情報信号を形成するための手段(34、38、40、42;34、218、40、42)とを含む、装置。
  2. 前記スペクトル/変調スペクトル表現に変換するための手段は、
    前記情報信号をブロック単位で変換することによって、前記情報信号を時間/スペクトル表現に変換するための手段(18、20)と、
    前記情報信号を前記時間/スペクトル表現から前記スペクトル/変調スペクトル表現に変換するための手段(26、28;212、214、28)とを含む、請求項1に記載の装置。
  3. 前記情報信号を時間/スペクトル表現に変換するための手段(18、20)は、前記時間/スペクトル表現を複数のスペクトル成分に分割してスペクトル成分ごとにスペクトル値のシーケンスを取得し、また、前記情報信号を前記時間/スペクトル表現から前記スペクトル/変調スペクトル表現に変換するための前記手段(26、28;212、214、28)は、スペクトル値のシーケンスを、所定のスペクトル成分ごとに、ブロック単位でスペクトル的に分割して、前記スペクトル/変調スペクトル表現の一部を得るための手段(26、28;212、214、28)を含む、請求項2に記載の装置。
  4. スペクトル値のシーケンスを所定スペクトル成分ごとにブロック単位でスペクトル的に分割するための手段(212、214、28)は、まず、スペクトル値のシーケンスにブロック単位で複素搬送波を乗じ(212)、スペクトル値のシーケンスの位相形態の平均勾配の大きさを低減させてスペクトル値の復調されたブロックを取得し、次いで、スペクトル値の復調ブロックを、ブロック単位でスペクトル的に分割(28)して変形されたスペクトル/変調スペクトル表現の一部を得るように形成されている、請求項3に記載の装置。
  5. スペクトル値のシーケンスを所定スペクトル成分ごとにブロック単位でスペクトル的に分割するための手段(212、214、28)は、前記情報信号の時間/スペクトル表現に応じ、スペクトル値のシーケンスに乗じられる前記複素搬送波をブロック単位で変化させるための手段(214)を含む、請求項4に記載の装置。
  6. 前記変化手段(214)は、前記複素搬送波をブロック単位で変化させるため、スペクトル値のシーケンスにおけるスペクトル値の位相をブロック単位でアンラップして位相形態を取得し、前記位相形態の平均勾配を測定し、前記平均勾配に基づいて前記複素搬送波を測定するように形成されている、請求項5に記載の装置。
  7. 前記変化手段(214)は、前記位相形態から前記位相形態の軸部分を測定し、さらに前記軸部分に基づいて前記複素搬送波を測定するように形成されている、請求項6に記載の装置。
  8. 前記透かし付加情報信号を形成するための手段(34、218、40、42)は、
    前記情報信号を、変形されたスペクトル/変調スペクトル表現から変形された時間/スペクトル表現に再変換し、前記所定スペクトル成分に対するスペクトル値の変形された復調ブロックを得るための手段(34)と、
    スペクトル値の変形された復調ブロックに、前記複素搬送波に対して複素共役な搬送波をブロック単位で乗じ、スペクトル値の変形されたブロックを得るための手段(218)と、
    スペクトル値の変形された復調ブロックを結合し、スペクトル値の変形されたシーケンスを形成して、透かし付加情報信号の時間/スペクトル表現の一部を得るための手段とを含む、請求項4ないし請求項7のいずれかに記載の装置。
  9. 前記形成手段は、
    前記透かし付加情報信号を、前記時間/スペクトル表現から前記時間表現に再変換するための手段をさらに含む、請求項8に記載の装置。
  10. スペクトル値のシーケンスを所定スペクトル成分ごとにブロック単位でスペクトル的に分割するための手段(26、28)は、まず、スペクトル値のシーケンスに対し振幅計算(26)を実施してスペクトル値の振幅のシーケンスを取得し、次いで、スペクトル値の振幅のシーケンスをブロック単位で変調スペクトル表現(28)に変換して、前記スペクトル/変調スペクトル表現の一部を得るように形成されている、請求項3に記載の装置。
  11. 前記透かし付加情報信号を形成するための手段(34、218、40、42)は、
    前記情報信号を変形されたスペクトル/変調スペクトル表現から変形された時間/スペクトル表現に再変換して所定のスペクトル成分に対するスペクトル値の変形されたシーケンスを得るための手段(34)と、
    スペクトル値の変形されたシーケンスを、スペクトル値のシーケンスの位相に基づいた位相と再結合して、前記透かし付加情報信号の時間/スペクトル表現の一部を得るための手段(38)とを含む、請求項10に記載の装置。
  12. 前記情報信号を時間表現からスペクトル/変調スペクトル表現に変換する手段(18、20)は、
    前記情報信号からの情報値のブロックのシーケンスを形成するためのブロック形成手段(18)と、
    情報値のブロックのシーケンスの各々をスペクトル的に分割してスペクトル値ブロックのシーケンスを得るための手段であって、各スペクトル値ブロックは、複数の所定スペクトル成分の各々に対するスペクトル値を含み、スペクトル値ブロックのシーケンスがスペクトル成分ごとのスペクトル値のシーケンスを形成するようにする手段(20)と、
    シーケンスの中の所定シーケンスをスペクトル的に分割して変調値のブロックを得るための手段(26、28;212、214、28)とを含み、
    前記変形手段(32、216)は、導入される前記透かしに応じて変調値のブロックを変形して変調値の変形されたブロックを取得し、前記形成手段(34、38、40、42;34、218、40、42)は、変調値の変形されたブロックに基づいて前記透かし付加情報信号を形成するように形成されている、請求項1に記載の装置。
  13. 前記形成手段(34、38、40、42;34、218、40、42)は、変調値の変形されたブロックをスペクトル分割(34、38;34、218)から再変換してスペクトル値の変形されたシーケンスを取得し、スペクトル値の変形されたシーケンスに基づく変形されたスペクトル・ブロックのシーケンスを再変換(40)して情報値の変形されたブロックのシーケンスを取得し、情報値の変形されたブロックを結合(42)して前記透かし付加情報信号を得るように形成されている、請求項12に記載の装置。
  14. 前記ブロック形成手段(18)は、情報値のブロックが、相互に半分ずつオーバーラップする前記情報信号の連続する時間セクションに対応するように、前記情報信号から情報値のブロックを抽出するように形成されており、前記形成手段(42)は、結合するときに、変形された時間ブロックを相互に半分ずつオーバーラップさせて、隣接する情報ブロックの情報値を整列させて合せるように形成されている、請求項12または請求項13に記載の装置。
  15. 情報値のブロックのシーケンスの各々をスペクトル的に分割するための手段(20)は、スペクトル的に分割するとき、スペクトル成分ごとに複素スペクトル値のシーケンスを供給するように形成され、スペクトル値のシーケンスの中の所定シーケンスをスペクトル的に分割するための手段(26、28)は、前記複素スペクトル値の振幅だけをスペクトル的に分割(28)して変調値のブロックを得るように形成されている、請求項12ないし請求項14のいずれかに記載の装置。
  16. 前記形成手段は、変調値の変形されたブロックをスペクトル分割から再変換(34)してスペクトル値の変形されたシーケンスを取得し、前記変形手段が行った変形に基づいて複素スペクトル値のシーケンスの位相を調整(36)して調整された位相値のシーケンスを取得し、調整された位相値のシーケンスをスペクトル値の変形されたシーケンスと再結合(38)してスペクトル値の再結合変形シーケンスを取得し、スペクトル値の前記再結合変形シーケンスに基づいた変形されたスペクトル値ブロックのシーケンスを再変換(40)して情報値の変形されたブロックを得るように形成されている、請求項15に記載の装置。
  17. 情報値のブロックのシーケンスの各々をスペクトル的に分割するための手段(20)は、スペクトル的に分割を行うとき、スペクトル成分ごとに複素スペクトル値のシーケンスを供給するように形成されており、スペクトル値のシーケンスの中の所定シーケンスを前記スペクトル/変調スペクトル表現に変換する手段(212、214、28)は、まず、スペクトル値のシーケンスに操作(212)を加え、スペクトル値の少なくとも一つのシーケンスのスペクトル値の位相を、シーケンスとともに連続的に増加又は減少するようなレベルで増加又は減少させてスペクトル値の位相操作されたシーケンスを取得し、次いで、スペクトル値の位相操作シーケンスをスペクトル的に分割(28)して変調値の少なくとも一つのブロックを得るよう形成されており、前記形成手段は(34、218、40、42)は、変調値の変形されたブロックをスペクトル分割から再変換してスペクトル値の変形されたシーケンスを取得し、スペクトル値のシーケンスの中の所定シーケンスをスペクトル的に分割して、スペクトル値の少なくとも一つのシーケンスのスペクトル値の位相をシーケンスとともに連続的に増加又は減少するようなレベルで増加又は減少させてスペクトル値の操作シーケンスを得るための手段(212)とは逆向きにスペクトル値のシーケンスを操作(218)し、スペクトル値の変形されたシーケンスに基づく変形されたスペクトル・ブロックのシーケンスを再変換(40)して情報値の変形されたブロックのシーケンスを取得し、情報値の変形されたブロックを結合(42)して前記透かし付加情報信号を得るように形成されている、請求項12に記載の装置。
  18. 前記変形手段(32;216)は、時間によって変化する前記スペクトル/変調スペクトル表現の位置で変調を実行するように調整されている、請求項1ないし請求項17のいずれかに記載の装置。
  19. 前記変形手段(32;216)は、前記情報信号に合わせて変調を実行するよう調整されている、請求項1ないし請求項18のいずれかに記載の装置。
  20. 前記変形手段(32;216)は、心理音響学的マスキング効果によって、変調により前記透かし付加情報信号が可聴な変形を生じないように変調を実行するように調整されている、請求項1ないし請求項19のいずれかに記載の装置。
  21. 前記透かしは著作者情報、前記情報信号を特定する識別番号、又は顧客番号を表す、請求項1ないし請求項20のいずれかに記載の装置。
  22. 透かしを付加された情報信号から透かしを抽出する装置であって、
    前記透かし付加情報信号を時間表現からスペクトル/変調スペクトル表現に変換するための手段(118、120、126、128;318、320、414、412、328)と、
    前記スペクトル/変調スペクトル表現に基づいて前記透かしを導き出すための手段(132;332)とを含む、装置。
  23. 情報信号に透かしを導入するための方法であって、
    前記情報信号を時間表現(22)からスペクトル/変調スペクトル表現(30)に変換する工程(18、20、26、28;18、20、212、214、28)と、
    導入される前記透かしに応じ、前記スペクトル/変調スペクトル表現における前記情報信号を変形して変形されたスペクトル/変調スペクトル表現を得る工程(32;216)と、
    変形されたスペクトル/変調スペクトル表現に基づいて透かしを付加された情報信号を形成する工程(34、38、40、42;34、218、40、42)とを含む、方法。
  24. 透かしを付加された情報信号から透かしを抽出する方法であって、
    前記透かし付加情報信号を時間表現からスペクトル/変調スペクトル表現に変換する工程(118、120、126、128;318、320、414、412、328)と、
    前記スペクトル/変調スペクトル表現に基づいて前記透かしを導き出す工程(132;332)とを含む、方法。
  25. コンピュータでコンピュータプログラムを実行して、請求項23又は24による前記方法を実行するためのプログラムコードを具えた、コンピュータプログラム。
JP2007509900A 2004-04-30 2005-03-11 透かし埋め込み Active JP5048478B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102004021404.2 2004-04-30
DE102004021404A DE102004021404B4 (de) 2004-04-30 2004-04-30 Wasserzeicheneinbettung
PCT/EP2005/002636 WO2005109702A1 (de) 2004-04-30 2005-03-11 Wasserzeicheneinbettung

Publications (2)

Publication Number Publication Date
JP2007535699A true JP2007535699A (ja) 2007-12-06
JP5048478B2 JP5048478B2 (ja) 2012-10-17

Family

ID=34961950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007509900A Active JP5048478B2 (ja) 2004-04-30 2005-03-11 透かし埋め込み

Country Status (17)

Country Link
US (1) US7676336B2 (ja)
EP (1) EP1741215B1 (ja)
JP (1) JP5048478B2 (ja)
KR (3) KR20080081098A (ja)
CN (1) CN1969487B (ja)
AU (1) AU2005241609B2 (ja)
BR (1) BRPI0509819B1 (ja)
CA (1) CA2564981C (ja)
DE (1) DE102004021404B4 (ja)
ES (1) ES2449043T3 (ja)
HK (1) HK1103320A1 (ja)
IL (1) IL178929A (ja)
MX (1) MXPA06012550A (ja)
NO (1) NO338923B1 (ja)
PL (1) PL1741215T3 (ja)
RU (1) RU2376708C2 (ja)
WO (1) WO2005109702A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026242A (ja) * 2008-07-18 2010-02-04 Yamaha Corp 電子透かし情報の埋め込みおよび抽出を行う装置、方法およびプログラム
JP2011247956A (ja) * 2010-05-24 2011-12-08 Yamaha Corp 音声信号に埋め込まれた電子透かし情報を除去する装置、および音声信号に電子透かし情報を埋め込む装置
JP2013520696A (ja) * 2010-02-26 2013-06-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 透かし信号の供給装置および透かし信号を供給するための方法
JP2013545121A (ja) * 2010-09-21 2013-12-19 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 透かし生成器、透かしデコーダ、離散値のデータに基づき透かし付信号を付与するための方法および透かし付信号に依存して離散値のデータを付与する方法

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8306811B2 (en) * 1996-08-30 2012-11-06 Digimarc Corporation Embedding data in audio and detecting embedded data in audio
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
DE102004023436B4 (de) * 2004-05-10 2006-06-14 M2Any Gmbh Vorrichtung und Verfahren zum Analysieren eines Informationssignals
CN101185122A (zh) * 2005-06-03 2008-05-21 皇家飞利浦电子股份有限公司 用于安全水印的同态加密
EP1764780A1 (en) * 2005-09-16 2007-03-21 Deutsche Thomson-Brandt Gmbh Blind watermarking of audio signals by using phase modifications
WO2008028200A2 (en) * 2006-08-29 2008-03-06 Benjamin Filmalter Grobler Digital data licensing system
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
US8099285B2 (en) * 2007-12-13 2012-01-17 Dts, Inc. Temporally accurate watermarking system and method of operation
US20090265366A1 (en) * 2008-04-22 2009-10-22 Qualcomm Incorporated Opportunistic opinion score collection on a mobile device
CN101271690B (zh) * 2008-05-09 2010-12-22 中国人民解放军重庆通信学院 保护音频数据的音频扩频水印处理方法
JP5582508B2 (ja) * 2008-08-14 2014-09-03 エスケーテレコム株式会社 データ送信装置、データ受信装置、データ送信方法、及びデータ受信方法
JP2011145541A (ja) * 2010-01-15 2011-07-28 Yamaha Corp 再生装置、楽音信号出力装置、再生システム及びプログラム
EP2362386A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark generator, watermark decoder, method for providing a watermark signal in dependence on binary message data, method for providing binary message data in dependence on a watermarked signal and computer program using a two-dimensional bit spreading
EP2362387A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark generator, watermark decoder, method for providing a watermark signal in dependence on binary message data, method for providing binary message data in dependence on a watermarked signal and computer program using a differential encoding
EP2565667A1 (en) 2011-08-31 2013-03-06 Friedrich-Alexander-Universität Erlangen-Nürnberg Direction of arrival estimation using watermarked audio signals and microphone arrays
TWI457852B (zh) * 2011-11-22 2014-10-21 Univ Nat Taiwan Normal 文件複印後呈現內容意義改變之浮水印製作方法
US9401153B2 (en) 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
US9305559B2 (en) 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
US9380383B2 (en) 2013-09-06 2016-06-28 Gracenote, Inc. Modifying playback of content using pre-processed profile information
US9990928B2 (en) * 2014-05-01 2018-06-05 Digital Voice Systems, Inc. Audio watermarking via phase modification
EP2963649A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
US10262118B2 (en) * 2015-01-06 2019-04-16 Robert Antonius Adrianus Van Overbruggen Systems and methods for authenticating digital content
WO2016115483A2 (en) * 2015-01-15 2016-07-21 Hardwick John C Audio watermarking via phase modification
EP3534618A4 (en) * 2016-10-27 2020-06-03 Evixar Inc. CONTENT REPRODUCING PROGRAM AND CONTENT REPRODUCING APPARATUS
CN107375810A (zh) * 2017-08-03 2017-11-24 广河县盛和中医医院 一种专治男科阳痿早泄的组合物
CN109166570B (zh) * 2018-07-24 2019-11-26 百度在线网络技术(北京)有限公司 一种语音切分的方法、装置、设备和计算机存储介质
US11244692B2 (en) 2018-10-04 2022-02-08 Digital Voice Systems, Inc. Audio watermarking via correlation modification using an amplitude and a magnitude modification based on watermark data and to reduce distortion
CN111341329B (zh) * 2020-02-04 2022-01-21 北京达佳互联信息技术有限公司 水印信息添加方法、提取方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0519782A (ja) * 1991-05-02 1993-01-29 Ricoh Co Ltd 音声特徴抽出装置
WO2002011326A2 (en) * 2000-07-27 2002-02-07 Activated Content Corporation, Inc. Stegotext encoder and decoder
JP2002044408A (ja) * 2000-06-29 2002-02-08 Internatl Business Mach Corp <Ibm> 電子透かし方法およびそのシステム
US20020176353A1 (en) * 2001-05-03 2002-11-28 University Of Washington Scalable and perceptually ranked signal coding and decoding
JP2003044067A (ja) * 2001-08-03 2003-02-14 Univ Tohoku 位相の周期偏移によるディジタルデータの埋めこみ・検出装置
WO2003056455A1 (fr) * 2001-12-27 2003-07-10 France Telecom Procede de caracterisation d'un signal sonore

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5173923A (en) * 1991-11-22 1992-12-22 Bell Communications Research, Inc. Spread-time code division multiple access technique with arbitrary spectral shaping
US5321497A (en) * 1992-03-09 1994-06-14 Wyko Corporation Interferometric integration technique and apparatus to confine 2π discontinuity
US5671168A (en) 1995-07-06 1997-09-23 Technion Research & Development Foundation Ltd. Digital frequency-domain implementation of arrays
EP0766468B1 (en) 1995-09-28 2006-05-03 Nec Corporation Method and system for inserting a spread spectrum watermark into multimedia data
US6584138B1 (en) 1996-03-07 2003-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Coding process for inserting an inaudible data signal into an audio signal, decoding process, coder and decoder
DE19640825C2 (de) * 1996-03-07 1998-07-23 Fraunhofer Ges Forschung Codierer zur Einbringung eines nicht hörbaren Datensignals in ein Audiosignal und Decodierer zum decodieren eines nicht hörbar in einem Audiosignal enthaltenen Datensignals
US5724270A (en) 1996-08-26 1998-03-03 He Holdings, Inc. Wave-number-frequency adaptive beamforming
US5915027A (en) * 1996-11-05 1999-06-22 Nec Research Institute Digital watermarking
PT1020077E (pt) 1997-10-08 2002-12-31 Digimarc Corp Processo e aparelho para uma marca de agua de copia unica para uma gravacao de video
US6330672B1 (en) * 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
TW440819B (en) * 1998-03-18 2001-06-16 Koninkl Philips Electronics Nv Copy protection schemes for copy protected digital material
US6064764A (en) 1998-03-30 2000-05-16 Seiko Epson Corporation Fragile watermarks for detecting tampering in images
CN1178511C (zh) 1998-05-20 2004-12-01 麦克罗维西恩公司 用于特殊定标和任意移动的水印检测方法及装置
US6073153A (en) * 1998-06-03 2000-06-06 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6725371B1 (en) * 1999-06-30 2004-04-20 Intel Corporation Secure packet processor
BR0006884A (pt) * 1999-07-02 2001-10-30 Koninkl Philips Electronics Nv Processo e sistema para embutir dadossuplementares em um sinal codificado e gravardito sinal codificado em um portador de gravação,portador de gravação e sistema para reproduzirdados gravados em um portador de gravação
DE19947877C2 (de) 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
US6725372B1 (en) 1999-12-02 2004-04-20 Verizon Laboratories Inc. Digital watermarking
JP3507743B2 (ja) * 1999-12-22 2004-03-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 圧縮オーディオデータへの電子透かし方法およびそのシステム
WO2001054053A1 (en) 2000-01-24 2001-07-26 Ecole Polytechnique Federale De Lausanne Transform domain allocation for multimedia watermarking
CA2418722C (en) * 2000-08-16 2012-02-07 Dolby Laboratories Licensing Corporation Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
US20020168082A1 (en) * 2001-03-07 2002-11-14 Ravi Razdan Real-time, distributed, transactional, hybrid watermarking method to provide trace-ability and copyright protection of digital content in peer-to-peer networks
US7006452B2 (en) 2001-05-22 2006-02-28 Intel Corporation Matching DSL data link layer protocol detection
DE10129239C1 (de) * 2001-06-18 2002-10-31 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
US7243060B2 (en) 2002-04-02 2007-07-10 University Of Washington Single channel sound separation
US20050177738A1 (en) 2002-05-10 2005-08-11 Koninklijke Philips Electronics N.V. Watermark embedding and retrieval
US7254500B2 (en) 2003-03-31 2007-08-07 The Salk Institute For Biological Studies Monitoring and representing complex signals

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0519782A (ja) * 1991-05-02 1993-01-29 Ricoh Co Ltd 音声特徴抽出装置
JP2002044408A (ja) * 2000-06-29 2002-02-08 Internatl Business Mach Corp <Ibm> 電子透かし方法およびそのシステム
WO2002011326A2 (en) * 2000-07-27 2002-02-07 Activated Content Corporation, Inc. Stegotext encoder and decoder
US20020176353A1 (en) * 2001-05-03 2002-11-28 University Of Washington Scalable and perceptually ranked signal coding and decoding
JP2003044067A (ja) * 2001-08-03 2003-02-14 Univ Tohoku 位相の周期偏移によるディジタルデータの埋めこみ・検出装置
WO2003056455A1 (fr) * 2001-12-27 2003-07-10 France Telecom Procede de caracterisation d'un signal sonore

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026242A (ja) * 2008-07-18 2010-02-04 Yamaha Corp 電子透かし情報の埋め込みおよび抽出を行う装置、方法およびプログラム
JP2013520696A (ja) * 2010-02-26 2013-06-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 透かし信号の供給装置および透かし信号を供給するための方法
JP2011247956A (ja) * 2010-05-24 2011-12-08 Yamaha Corp 音声信号に埋め込まれた電子透かし情報を除去する装置、および音声信号に電子透かし情報を埋め込む装置
JP2013545121A (ja) * 2010-09-21 2013-12-19 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 透かし生成器、透かしデコーダ、離散値のデータに基づき透かし付信号を付与するための方法および透かし付信号に依存して離散値のデータを付与する方法
US9514500B2 (en) 2010-09-21 2016-12-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Watermark generator, watermark decoder, method for providing a watermarked signal based on discrete valued data and method for providing discrete valued data in dependence on a watermarked signal
US9917978B2 (en) 2010-09-21 2018-03-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Watermark generator, watermark decoder, method for providing a watermarked signal based on discrete valued data and method for providing discrete valued data in dependence on a watermarked signal

Also Published As

Publication number Publication date
AU2005241609A1 (en) 2005-11-17
DE102004021404A1 (de) 2005-11-24
EP1741215B1 (de) 2013-12-25
BRPI0509819B1 (pt) 2023-10-03
ES2449043T3 (es) 2014-03-18
PL1741215T3 (pl) 2014-05-30
AU2005241609B2 (en) 2008-01-10
KR20080094851A (ko) 2008-10-24
NO20065424L (no) 2007-01-31
HK1103320A1 (en) 2007-12-14
RU2376708C2 (ru) 2009-12-20
CN1969487A (zh) 2007-05-23
IL178929A0 (en) 2007-03-08
WO2005109702A1 (de) 2005-11-17
NO338923B1 (no) 2016-10-31
US20080027729A1 (en) 2008-01-31
KR100902910B1 (ko) 2009-06-15
CA2564981A1 (en) 2005-11-17
DE102004021404B4 (de) 2007-05-10
KR20070015182A (ko) 2007-02-01
RU2006142304A (ru) 2008-06-10
JP5048478B2 (ja) 2012-10-17
CN1969487B (zh) 2011-08-17
MXPA06012550A (es) 2006-12-15
CA2564981C (en) 2011-12-06
BRPI0509819A (pt) 2007-09-18
EP1741215A1 (de) 2007-01-10
IL178929A (en) 2011-03-31
US7676336B2 (en) 2010-03-09
KR20080081098A (ko) 2008-09-05

Similar Documents

Publication Publication Date Title
JP5048478B2 (ja) 透かし埋め込み
US8799659B2 (en) Advanced multi-channel watermarking system and method
US6330672B1 (en) Method and apparatus for watermarking digital bitstreams
Wu et al. Robust and efficient digital audio watermarking using audio content analysis
Al-Haj An imperceptible and robust audio watermarking algorithm
US20040059918A1 (en) Method and system of digital watermarking for compressed audio
EP1189372A2 (en) Audio signal processor comprising a means for embedding an audible watermark in an audio signal, audio player comprising a means for removing the audible watermark and audio distribution system and method using the audio signal processor and the audio player
US20090192805A1 (en) Methods and apparatus for performing variable black length watermarking of media
US20080263359A1 (en) Water mark embedding and extraction
CN101290773B (zh) 自适应的mp3数字水印嵌入和提取方法
Hu et al. Effective blind speech watermarking via adaptive mean modulation and package synchronization in DWT domain
Wang et al. A new audio watermarking based on modified discrete cosine transform of MPEG/audio layer III
He Watermarking in audio: key techniques and technologies
KR20060027351A (ko) 적은 주파수 성분들을 갖는 미디어 신호 내의 부가적데이터의 검출 가능성을 증가시키는 방법
Trivedi et al. An algorithmic digital audio watermarking in perceptual domain using direct sequence spread spectrum
Kirbiz et al. Decode-time forensic watermarking of AAC bitstreams
Blackledge et al. Audio data verification and authentication using frequency modulation based watermarking
Horvatic et al. Robust audio watermarking: based on secure spread spectrum and auditory perception model
Cvejic et al. Audio watermarking: Requirements, algorithms, and benchmarking
Chen et al. An adaptive watermarking algorithm for MP3 compressed audio signals
Gurijala et al. Digital Watermarking Techniques for Audio and Speech Signals
Neubauer et al. Robustness evaluation of transactional audio watermarking systems
Krishnan et al. Time-frequency analysis of digital audio watermarking
Gurijala Digital Watermarking of Speech Signals
Ramesh et al. Novel Hybrid Inaudible Audio Watermarking with Binary Image as Watermark using DWT

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100416

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100907

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101206

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101213

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110105

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110113

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110204

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110214

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111012

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120719

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150727

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5048478

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250