JP2008546292A - 拡散スペクトルを用いて透かしデータでオーディオまたはビデオ信号に透かしを入れる方法及び装置 - Google Patents

拡散スペクトルを用いて透かしデータでオーディオまたはビデオ信号に透かしを入れる方法及び装置 Download PDF

Info

Publication number
JP2008546292A
JP2008546292A JP2008514051A JP2008514051A JP2008546292A JP 2008546292 A JP2008546292 A JP 2008546292A JP 2008514051 A JP2008514051 A JP 2008514051A JP 2008514051 A JP2008514051 A JP 2008514051A JP 2008546292 A JP2008546292 A JP 2008546292A
Authority
JP
Japan
Prior art keywords
audio
signal
watermark
video signal
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008514051A
Other languages
English (en)
Other versions
JP2008546292A5 (ja
Inventor
ゲオルク バオム,ペーター
フェーシング,ヴァルター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2008546292A publication Critical patent/JP2008546292A/ja
Publication of JP2008546292A5 publication Critical patent/JP2008546292A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/0028Adaptive watermarking, e.g. Human Visual System [HVS]-based watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/005Robust watermarking, e.g. average attack or collusion attack resistant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0065Extraction of an embedded watermark; Reliable detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0202Image watermarking whereby the quality of watermarked images is measured; Measuring quality or performance of watermarking methods; Balancing between quality and robustness

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Television Systems (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

透かし情報(WMと呼ぶ)はいくつかのシンボルよりなり、拡散スペクトルを用いてオーディオまたはビデオ信号に連続的に組み込まれる。デコーダ側で、受信信号のmシーケンスとの相関を用いてWMを再生する。本発明により、透かしをオーディオまたはビデオ信号のレベルに応じて変えるだけでなく、透かしに使用する拡散シーケンスもオーディオまたはビデオ信号のレベルに応じて変える。これは同一のWMシンボルを相異なるいくつかの拡散シーケンス(NSS)でエンコードすることを意味する。エンコーダは、どのWMシンボルまたはシーケンスがデコーダで最もよく読み出せるかテストして(DEC)、透かしを入れるべきオーディオまたはビデオ信号にその選択した拡散シーケンスのWMを組み込む。デコーダ側では、候補のWM拡散シーケンスのすべてについて受信信号との相関をとって、最もよくマッチ(match)する拡散シーケンスを正しいものとして選択する。
図8

Description

本発明は、拡散スペクトルと2つ以上の拡散シーケンスとを用いて透かしデータでオーディオまたはビデオ信号に透かしを入れる方法と装置とに関する。
透かし情報(WMで示す)は、(符号化された)オーディオまたはビデオ信号等のキャリアコンテンツ(carrier content)に連続的に組み込まれたシンボルよりなり、例えばその信号の作者を識別するためのものである。拡散スペクトルを基礎技術として使用している場合、デコーダ側では、例えば受信信号の既知の拡散シーケンスとの相関を用いてWMを再生する。一部の透かし技術では、透かし情報は非同期で送信される。すなわち、オーディオまたはビデオ信号にWM(透かし情報)を気づかれないように組み込めるかどうかを連続的にテストする。気づかれない場合にのみWMフレームを送信する。しかし、WMフレームは数十のシンボルよりなり、各シンボルは1ビット以上であり、同期して送信される。ということは、WMを組み込める期間がフレーム長より短い場合、レシーバ側で再生できないシンボルがでてくる。
そのため、ほとんどのWM技術では、エラー訂正のための冗長ビットを送信する。しかし、かかるエラー訂正の能力には限度がある。エラー訂正により、レシーバ側で1つまたはそれ以上のシンボルが直接再生できなくても、いくつかのシンボルは訂正できる。しかし、エラー訂正の能力を超えると、WMを再生できなくなる。
第2に、追加される冗長ビットによりWMフレームの長さが長くなり、WMフレームを送信できる信号長またはセクションよりもフレームが長くなる確率が高くなる。第3に、エラー訂正は透かしを入れる信号とはほぼ独立であるから、パリティビットが必要なため、「良い」信号に必要な正味ビットレートより低くなり、「悪い」信号をエラー訂正するにはまだ足りないこととなる。「良い」信号とはデコーダ側で再生できる信号であり、「悪い」信号とはデコーダ側で再生できない信号である。
特許文献1には、エネルギーレベルに依存する、透かしデータの挿入が記載されている。
特許文献2は、相異なる透かし信号をマルチメディア信号の独立なチャンネルと組み合わせるシステムを記載している。
国際特許出願第WO−A−01/06755号公報 国際特許出願第WO−A−03/103273号公報
オーディオコンテンツの透かし入れ(watermarking)は、オーディオ信号にスペクトル的に加工した(spectrally shaped)拡散スペクトル信号を加えることにより、容易になる。問題は、一部のオーディオ信号では、WM組み込み器(embedder)とWM検出器(detector)間で攻撃(attack)が無くても、拡散スペクトルを読み出してデコードできないことである。エンコーダ側で、重要な(critical)音声信号(例えば、スピーチ信号における静寂期間やポーズ、またはビデオ信号における明るさレベルが一様な領域)であるため現在のWMをデコーダ側でデコードできないことがはっきりした場合、WMのレベルを高くすることもできるが、かかる場合にはWM信号が聞こえたり見えたりするようになる。
本発明が解決しようとする問題は、透かし入れの信頼性を高くしつつ、それが聞こえたり見えたりしないようにし、デコーダ側における透かし信号のエラー訂正に依存しないようにすることである。この問題は、請求項1と2に開示した方法により解決される。この方法を利用する装置を請求項3と4に開示した。
本発明により、透かしをオーディオまたはビデオ信号のレベルに応じて変えるだけでなく、透かしに使用する拡散シーケンスもオーディオまたはビデオ信号のレベルに応じて変える。これは基本的に同一のWMシンボルを相異なるいくつかの拡散シーケンスでエンコードすることを意味する。エンコーダは、どのWMシンボルまたはシーケンスがデコーダで最もよく読み出せるかテストして、透かしを入れるべきオーディオまたはビデオ信号にその選択した拡散シーケンスのWMを組み込む。デコーダ側では、候補のWM拡散シーケンスのすべてについて受信信号との相関をとって、最もよくマッチ(match)する拡散シーケンスを正しいものとして選択する。
本発明により重要な(critical)音声または画像の信号の透かしをより一層ロバスト(robust)にすることができる。これによりWM信号を受信できるか全く受信できないかという違いが生じる。エンコーダにおいて行われる上記のテストにはより大きな処理パワーが必要とされる。複数の相関を計算しなければならないからである。しかし、有利にも、デコーダ側ではこれにより処理が複雑になったりより大きな処理パワーが必要になることは必ずしもない。
本発明は拡散スペクトル技術の使用には限定されない。例えば、キャリアベース技術(carrier based technology)やエコー隠蔽技術(echo hiding technology)を透かしのコーディングとデコーディングに使用できる。
原理的に、本発明による方法は、拡散スペクトルを用いて透かしデータでオーディオまたはビデオ信号に透かしを入れることに好適である。該方法は以下の段階を含む:
a)透かしデータビットにより第1の候補エンコーダ拡散シーケンスを変調して変調透かし信号を求める段階と、
b)前記オーディオまたはビデオ信号の現在のマスクレベルを決定し、前記変調透かし信号の音響心理学的または視覚心理学的な対応する加工を行う段階と、
c)前記オーディオまたはビデオ信号に前記音響心理学的または視覚心理学的加工をした透かし信号を組み込む段階と、
d)前記組み込まれた透かし信号を含めて前記オーディオまたはビデオ信号をスペクトル的にホワイトニングする段階と、
e)相関を用いて前記組み込まれた透かし信号を含めてスペクトル的にホワイトニングされたオーディオまたはビデオ信号を逆拡散し復調して第1の候補透かし信号を求める段階と、
− 相異なる候補エンコーダ拡散シーケンスを用いて1回以上段階a)からe)を繰り返す段階と、
− どの相関結果が最もよくマッチするか決定して、対応する候補エンコーダ拡散シーケンスで透かしを入れられた透かし入りオーディオ信号を出力する段階。
また、本発明による方法は、拡散スペクトルを用いて透かしデータでオーディオまたはビデオ信号に透かしを入れることに好適である。該方法は次の段階を含む:
− 透かしデータビットにより第1及び少なくとも第2の候補エンコーダ拡散シーケンスを変調して対応する変調透かし信号を求める段階と、
− 前記オーディオまたはビデオ信号の現在のマスクレベルを決定し、前記変調透かし信号の音響心理学的または視覚心理学的な対応する加工を行う段階と、
− 前記オーディオまたはビデオ信号に前記音響心理学的または視覚心理学的加工をした透かし信号を組み込み対応する数のオーディオまたはビデオ信号を求める段階と、
− 前記対応する組み込まれた透かし信号を含めて前記オーディオまたはビデオ信号をスペクトル的にホワイトニングする段階と、
− 相関を用いて前記対応する組み込まれた透かし信号を含めてスペクトル的にホワイトニングされたオーディオまたはビデオ信号を逆拡散し復調して第1と少なくとも第2の候補透かし信号を求める段階と、
− どの相関結果が最もよくマッチするか決定して、対応する候補エンコーダ拡散シーケンスで透かしを入れられた透かし入りオーディオ信号を出力する段階。
原理的に、本発明による装置は、拡散スペクトルを用いて透かしデータでオーディオまたはビデオ信号に透かしを入れることに好適である。該装置は以下の手段を含む:
a)透かしデータビットにより第1の候補エンコーダ拡散シーケンスを変調して変調透かし信号を求める手段と、
b)前記オーディオまたはビデオ信号の現在のマスクレベルを決定し、前記変調透かし信号の音響心理学的または視覚心理学的な対応する加工を行う手段と、
c)前記オーディオまたはビデオ信号に前記音響心理学的または視覚心理学的加工をした透かし信号を組み込む手段と、
d)前記組み込まれた透かし信号を含めて前記オーディオまたはビデオ信号をスペクトル的にホワイトニングする手段と、
e)相関を用いて前記組み込まれた透かし信号を含めてスペクトル的にホワイトニングされたオーディオまたはビデオ信号を逆拡散し復調して第1の候補透かし信号を求める手段と、
ここで、手段a)からe)は、相異なる候補エンコーダ拡散シーケンスを用いて1回以上処理を繰り返し、
− どの相関結果が最もよくマッチするか決定して、対応する候補エンコーダ拡散シーケンスで透かしを入れられた透かし入りオーディオまたはビデオ信号を出力する手段。
また、本発明による装置は拡散スペクトルを用いて透かしデータでオーディオまたはビデオ信号に透かしを入れることに好適である。該装置は次の手段を含む:
− 透かしデータビットにより第1及び少なくとも第2の候補エンコーダ拡散シーケンスを変調して対応する変調透かし信号を求める手段と、
− 前記オーディオまたはビデオ信号の現在のマスクレベルを決定し、前記変調透かし信号の音響心理学的または視覚心理学的な対応する加工を行う手段と、
− 前記オーディオまたはビデオ信号に前記音響心理学的または視覚心理学的加工をした透かし信号を組み込み対応する数のオーディオまたはビデオ信号を求める手段と、
− 前記対応する組み込まれた透かし信号を含めて前記オーディオまたはビデオ信号をスペクトル的にホワイトニングする手段と、
− 相関を用いて前記対応する組み込まれた透かし信号を含めてスペクトル的にホワイトニングされたオーディオまたはビデオ信号を逆拡散し復調して第1と少なくとも第2の候補透かし信号を求める手段と、
− どの相関結果が最もよくマッチするか決定して、対応する候補エンコーダ拡散シーケンスで透かしを入れられた透かし入りオーディオまたはビデオ信号を出力する手段。
本発明のこれ以外の有利な実施形態は、それぞれの従属項に開示されている。
添付した図面を参照して、本発明の実施形態を例として説明する。
自己完結する透かしの最小単位はフレームと呼ばれる。図3は連続する3つのフレームFRn−1、FR、FRn+1を示している。1つのフレームは、デコーダ側でフレームの始まりを検出するために必要とされるいくつか(少なくとも1つ)の同期ブロックSYNBLと、実際の情報を担ういくつか(少なくとも1つ)のペイロードブロック(payload blocks)PLBLとよりなる。フレームは使用する技術に応じてオーディオまたはビデオストリームに同期または非同期で挿入される。ペイロードブロックは連続して、すなわちSYNBLブロックの後に同期して挿入される。各ペイロードブロックには情報のビットが含まれている。そのため、ペイロードブロックはシンボルとも呼ばれる。ペイロードシンボルはWM信号に挿入すべき情報を含み、任意的に、エラー訂正に使用される冗長情報を含む。典型的な設定では、例えば、1フレームにつき5つの同期ブロックと36のペイロードブロックであり、各ペイロードブロックは2ビットであり、これらの72ビットのうち24ビットをエラー訂正に使用し、1フレームあたりの正味ペイロード(net payload)は48ビットとなる。
図1の透かしエンコーダでは、ペイロードデータPLDは、オーディオ(またはビデオ)信号ASに透かしを入れるために使用されるものであり、エラー訂正・検出エンコーディング段階(error correction and/or detection encoding stage)ECDEに入力される。エラー訂正・検出エンコーディング段階ECDEは、デコーダにおいて間違って検出されたシンボルからの回復を容易にする冗長ビットを付加する。ダウンストリーム変調・スペクトル拡散段階(downstream modulation and specturm spreading stage)MSにおいて、変調と拡散が行われる。段階MSの出力信号は音響心理学加工段階PASに入力される。この段階PASはWS信号を加工して、WMがオーディオ信号ASの現在のレベルで聞こえないようにし、出力信号を信号加算・決定段階(signal adder and decision stage)SADと検出段階(decoder stage)DECとに入力する。透かしは音響心理学的原理(psycho-acoustic principles)にしたがって段階PASにおいてブロックごとに加工(shaped)される。すなわち、透かしとオーディオのエネルギーをシンボルごとに変化させる。この加工(shaping)は透かし信号にオーディオ信号のマスクレベルをかけることを表す。
検出段階(decoder stage)DECは図2に示したデコーダを実施する。各段階PASとSADはオーディオ(またはビデオ)ストリーム信号を受け取り、シンボルごとにWMフレームを処理する。段階SADは、現在のWMフレームFRnにおいて、ペイロードデータPLDがデコーダDECにおいて正しくデコードされたか決定する。正しくデコードされていれば、音響心理学的に加工されたWMシンボルを現在のフレームに付加する。正しくデコードされていなければ、現在のフレームFRn中のシンボルは飛ばす。そして、現在のシンボルに続く次にシンボルを処理する。WMフレームの処理が完了すると、オーディオ信号に組み込まれた、対応する透かしが入ったフレームWASが出力される。そして、現在のフレームに続くフレームFRn+1を続けて処理する。
図2の透かし入れデコーダ(watermarking decoder)において、オーディオ(またはビデオ)信号の透かしが入ったフレームWASは、スペクトルホワイトニング段階(spectral whitening stage)SPWと、逆拡散・復調段階(de-spreading and demodulation stage)DSPDMとを通る。この逆拡散・復調段階DSPDMでは信号WASから組み込まれたWMシンボルデータが読み出される。WMシンボルはエラー訂正・検出・デコード段階(error correction and/or detection and decoding stage)ECDDに送られる。段階ECDDは有効ペイロードデータPLDを出力する。
本発明の基本的原理を、2つの透かしシーケンスを使用する例で説明する。一方は他方を正確にネガティブにしたもの(negative version)である。エンコーダの出力信号rはオーディオ信号aと任意的に加工された透かし拡散シーケンスwとの(ベクトル)和である:
r = a + w。
この加算は通常は時間領域で行われるが、周波数領域での加算と数学的には等価である。
r = F-1(F(a) + F(w))、
ここで、F()はフーリエ変換であり、F−1()はフーリエ逆変換である。
デコーダ側では、ホワイトニングされたエンコーダ出力信号(whitened encoder output signal)(これは差しあたり雑音や攻撃により改変されているかも知れない)を既知の拡散シーケンスと相関させて透かしを読み出す。エンコーダ出力信号が拡散シーケンスと同一であれば、完全な相関結果が得られる。
図4は、虚数方向IMと実数方向REとを有する周波数領域において、エンコーダ側において、透かし信号ベクトルWMのオーディオ(またはビデオ)信号との加算により単一のスペクトルライン(spectral line)を求めるところを示す。エンコーダ出力信号EOSはオーディオ信号ASとほぼ同じ角度αを有する。オーディオ信号の振幅は透かし信号よりも非常に大きいからである。図では透かし信号WMを非常に誇張して示した。段階PASの音響心理学的加工の結果の透かし信号の実際の大きさは、オーディオ信号よりも約20dB乃至70dB低い。
図5は周波数領域における単一スペクトル線のデコード(decoding)を示している。デコーダ側において、「結果として得られる信号(resulting signal)」が入力信号として受け取られる。「ホワイトニング(whitening)」や逆音響心理学的加工(reverse psycho-acoustic shaping)により、その信号を適当な大きさに規格化(normalised)する。「ホワイトニング」とは、受け取ったオーディオフレームのスペクトル値のそれぞれの大きさを乗算すなわち増幅して、1フレームにおいて(透かし信号が組み込まれている)すべてのオーディオ信号の振幅を同じ値にすることである。それにより、オーディオ信号自体は非常に歪められるが、その結果得られる効果として、透かし信号のスペクトル値の大きさが基本的に元の大きさのレベルに対応した値となる。
この例では、受け取ったデコーダ入力信号の大きさを小さくする。しかし、組み込まれた透かし信号部分はオーディオ信号部分より非常に小さいので、逆加工(reverse shaping)すなわちホワイトニングは実際にはオーディオ信号の大きさにのみ依存する。すなわち、ホワイトニングすなわち逆音響心理学的加工後の「入力信号」の大きさのみに依存する。透かし信号の大きさには依存しない。
ホワイトニングされたエンコーダ出力信号WEOSと透かし信号ベクトルWMとの間の角度βはほぼ「π」であり、すなわち「0」よりも「π」に近いので、デコーダにおける相関は、このラインの場合、実際には正の拡散シーケンスをエンコーダで使用したにもかかわらず、負の(すなわち否定した(negated))拡散シーケンスをエンコーダで挿入したことを示す。
図6は、単一スペクトル線の場合のエンコーダ側におけるオーディオ(またはビデオ)信号ASへの透かし信号WMの組み込みを再度示している。
図7は周波数領域における単一スペクトル線のデコード(decoding)を再度示している。ホワイトニングされた(whitened)エンコーダ出力信号WEOSと透かし信号ベクトルWMとの間の角度βは「π」ではなく「0」に近いので、デコーダにおいて相関を取ると、この場合には正しく負の(すなわち否定した(nagated))透かし信号値を示す。
本発明のエンコーダは信号適応的拡散シーケンス(signal adaptive spreading sequences)を使用する。図8の本発明のエンコーダのフローチャートにおいて、オーディオまたはビデオ信号ASの透かし入れ(watermarking)に使用されるペイロードデータPLDをエラー訂正・検出エンコーディング段階(error correction and/or detection encoding stage)ECDEに入力する。ダウンストリーム変調・スペクトル拡散段階(downstream modulation and specturm spreading stage)MSにおいて、変調と拡散を行う。段階MSの出力信号は音響心理学(または視覚心理学)加工段階PASに入力される。この段階PASはMS出力信号を加工して、WMがオーディオ(またはビデオ)信号ASの現在のレベルで聞こえない(または見えない)ようにし、出力信号を信号加算段階(signal adder stage)SAに入力する。透かしは音響心理学(または視覚心理学)的原理(psycho-acoustic, or psycho-visual, principles)にしたがって段階PASにおいてブロックごとに加工(shaped)される。すなわち、透かしとオーディオのエネルギーをシンボルごとに変化させる。この加工(shaping)は透かし信号にオーディオまたはビデオ信号のマスクレベル(masking level)をかけることを表す。各段階PASとSADはオーディオ(またはビデオ)ストリーム信号を受け取り、シンボルごとにWMフレームFRnを処理する。
透かしを入れたオーディオまたはビデオ信号は、次の段階を用いて、正しくデコードできるか(correct decodability)をテストする。オーディオ(またはビデオ)信号の透かしが入った候補フレーム(candidate watermarked frame)CWASは、スペクトルホワイトニング段階(spectral whitening stage)SPW(この段階は段階PASで行われた加工を元に戻す)と、逆拡散・復調段階(de-spreading and demodulation stage)DSPDEMとを通る。この逆拡散・復調段階DSPDEMでは信号CWASから組み込まれた候補WMシンボルデータ(embedded candidate WM symbol data)が読み出される。候補WMシンボルを決定段階DECに送る。この段階は、次の拡散シーケンスNSSを用いて、段階MSからDSPDEMまでの処理の繰り返しを制御する。あるいは、段階MSからDSPDEMと並行して候補拡散シーケンスを使用・処理することもできる。すべての候補拡散シーケンスを現在のフレーム(current frame)に適用した後、段階DECにおいて、デコーダにおいてどの拡散シーケンスが最もよくすなわち正しく回復できるか決定する。すなわち、相関においてどれがはっきりしたピークを示すか決定する。最後に、段階DECから対応して選択された有効な透かしオーディオまたはビデオ信号フレームWASが出力される。
他の例も示して本発明を説明する。オーディオ信号の位相は反射(reverberation)や意図的な攻撃により容易に変わるので、WM信号のBPSK変調はあまりロバスト(robust)ではない。もっと良い方法は、例えば、相異なる2つのmシーケンスを使用することである。一方(m_0)は2進数0のエンコーディングに使用し、他方(n_0)は2進数1のエンコーディングに使用する。WMデコーダは受け取ったオーディオの両方のmシーケンスとの相関をとって、相関結果が一番よくマッチ(match)する2進数値を選択する。
本発明のエンコーダはこの場合、例えば相異なる4つのシーケンスを使用する。2つ(m_0とm_1)は2進数0をエンコーディングし、もう2つ(n_0とn_1)は2進数1をエンコーディングする。一実施形態では、相異なる2つのmシーケンス(m-sequences)(m_0とn_0)を使用し、位相シフトにより残りのシーケンスすなわちn_1=(−1)×n_0とm_1=(−1)×m_0とを生成する。他の実施形態では、相異なる4つのmシーケンス(m-sequences)を使用する。
例えば、2進数0をエンコードするとき、既知のエンコーダはm_0のみを使用する。
しかし、本発明のエンコーダは、オーディオ信号にm_0を加工したもの(shaped version)を加え、合計をm_0と相関させ、相関結果を記憶する。また、オーディオ信号にm_1を加工したもの(shaped version)を加え、合計をm_1と相関させ、相関結果を記憶する。決定アルゴリズムにより相関結果が最も良いシーケンスを選択する。最後にこのmシーケンスを使用して、現在の透かし信号フレームをエンコード(encode)する。
有利にも、1つの値当たり2つのシーケンスのみを使用し、一方のシーケンスは他方のシーケンスを負にしたまたは否定したもの(negative or negated version)である場合、透かしを改良してもデコーダを変更する必要はない。相関は、同一の2進数値に対して、場合によって負のピークを示したり正のピークを示したりする。それゆえ、相関の絶対値のみを考慮すればよい。
そうでなければ、デコーダはすべてのmシーケンスを受け取った透かし入りオーディオ信号と相関させる。m_kシーケンスの1つが最もよくマッチ(match)するとき、2進数0を検出し、そうでなければ2進数1を検出する。
本発明により透かしがより一層ロバストになり、まったく透かしを受信しないか、透かしを受信するかの違いとなる。テストの結果、本発明を使用すると、1つの2進数値につき相異なる2つのmシーケンスを使用すると、相関の信頼のピーク(peak confidence)は32%から48%となり、50%向上することが分かった(0%は相関にピークがないことを意味し、100%は完全にマッチすることを意味する)。
コストとしては必要な処理能力が大きくなることである。エンコーダがいくつかのシーケンスを加工(shape)して、どれが最もよいか決定するために相関を取らなければならない。しかし、同じオーディオ信号を相異なるWMペイロードで何回か透かしを入れ、例えば透かし入れアカデミースクリーナー(watermarking Academy Screeners)のようにすれば、一度どのシーケンスを使用するか決定して、その後のエンコーディングに使用するように記憶することができる。
1つの2進数値につき2つのシーケンスのみを使用する場合、デコーダを変更する必要はまったくない。そうでなければ、デコーダはより多くの相関を計算する必要がある。アカデミースクリーナーのシナリオでは、そうはならない。デコーディングは非常にまれにしか行わないし、リアルタイムではないからである。
既知の透かしエンコーダを示す図である。 透かしエンコーダを示す図である。 フレーム構成を示す図である。 エンコーダにおける第1の拡散シーケンスを用いて周波数領域の単一ラインの場合の既知のWMの組み込みを示す図である。 ホワイトニングされたエンコーダ出力信号と、第1の拡散シーケンスの既知の適用によるデコーダにおけるデコードされた透かしとを示す図である。 エンコーダにおける第2の拡散シーケンスを用いた周波数領域における単一ラインの場合の透かしの組み込みを示す図である。 ホワイトニングされたエンコーダ出力信号と、第2の拡散シーケンスの適用により求めたデコーダにおけるデコードされた透かしを示す図である。 本発明による透かしエンコーダを示す図である。

Claims (8)

  1. 拡散スペクトルを用いて透かしデータ(PLD)でオーディオまたはビデオ信号(AS)に透かしを入れる方法であって、
    a) 透かしデータビットにより第1の候補エンコーダ拡散シーケンスを変調(MS)して変調透かし信号を求める段階と、
    b) 前記オーディオまたはビデオ信号の現在のマスクレベルを決定し、前記変調透かし信号の音響心理学的または視覚心理学的な対応する加工(PAS)を行う段階と、
    c) 前記オーディオまたはビデオ信号に前記音響心理学的または視覚心理学的加工をした透かし信号を組み込む(SA)段階とを有し、
    前記方法は、
    d) 前記組み込まれた透かし信号を含めて前記オーディオまたはビデオ信号をスペクトル的にホワイトニングする(SPW)段階と、
    e) 相関を用いて前記組み込まれた透かし信号を含めてスペクトル的にホワイトニングされたオーディオまたはビデオ信号を逆拡散し復調して(ESPDEM)第1の候補透かし信号を求める段階と、
    - 相異なる候補エンコーダ拡散シーケンスを用いて1回以上段階a)からe)を繰り返す段階と、
    - どの相関結果が最もよくマッチするか決定して、対応する候補エンコーダ拡散シーケンスで透かしを入れられた透かし入りオーディオ信号(WAS)を出力する段階とを有する方法。
  2. 拡散スペクトルを用いて透かしデータ(PLD)でオーディオまたはビデオ信号(AS)に透かしを入れる方法であって、
    - 透かしデータビットにより第1及び少なくとも第2の候補エンコーダ拡散シーケンスを変調(MS)して対応する変調透かし信号を求める段階と、
    - 前記オーディオまたはビデオ信号の現在のマスクレベルを決定し、前記変調透かし信号の音響心理学的または視覚心理学的な対応する加工を行う段階と、
    - 前記オーディオまたはビデオ信号に前記音響心理学的または視覚心理学的加工をした透かし信号を組み込み対応する数のオーディオまたはビデオ信号を求める段階と、
    - 前記対応する組み込まれた透かし信号を含めて前記オーディオまたはビデオ信号をスペクトル的にホワイトニングする段階と、
    - 相関を用いて前記対応する組み込まれた透かし信号を含めてスペクトル的にホワイトニングされたオーディオまたはビデオ信号を逆拡散し復調して(ESPDEM)第1と少なくとも第2の候補透かし信号を求める段階と、
    - どの相関結果が最もよくマッチするか決定して、対応する候補エンコーダ拡散シーケンスで透かしを入れられた透かし入りオーディオ信号(WAS)を出力する段階とを有する方法。
  3. 拡散スペクトルを用いて透かしデータ(PLD)でオーディオまたはビデオ信号(AS)に透かしを入れる装置であって、
    a) 透かしデータビットにより第1の候補エンコーダ拡散シーケンスを変調して変調透かし信号を求めるように構成されて手段(MS)と、
    b) 前記オーディオまたはビデオ信号の現在のマスクレベルを決定し、前記変調透かし信号の音響心理学的または視覚心理学的な対応する加工を行うように構成された手段(PAS)と、
    c) 前記オーディオまたはビデオ信号に前記音響心理学的または視覚心理学的加工をした透かし信号を組み込むように構成された手段(SA)とを有し、
    前記装置は、
    d) 前記組み込まれた透かし信号を含めて前記オーディオまたはビデオ信号をスペクトル的にホワイトニングする手段(SPW)と、
    e) 相関を用いて前記組み込まれた透かし信号を含めてスペクトル的にホワイトニングされたオーディオまたはビデオ信号を逆拡散し復調して第1の候補透かし信号を求めるように構成された手段(ESPDEM)と、
    手段a)からe)は、相異なる候補エンコーダ拡散シーケンスを用いて1回以上処理を繰り返し、
    - どの相関結果が最もよくマッチするか決定して、対応する候補エンコーダ拡散シーケンスで透かしを入れられた透かし入りオーディオまたはビデオ信号(WAS)を出力するように構成された手段(DEC)とを有する装置。
  4. 拡散スペクトルを用いて透かしデータ(PLD)でオーディオまたはビデオ信号(AS)に透かしを入れる装置であって、
    - 透かしデータビットにより第1及び少なくとも第2の候補エンコーダ拡散シーケンスを変調して対応する変調透かし信号を求めるように構成された手段(MS)と、
    - 前記オーディオまたはビデオ信号の現在のマスクレベルを決定し、前記変調透かし信号の音響心理学的または視覚心理学的な対応する加工を行うように構成された手段(PAS)と、
    - 前記オーディオまたはビデオ信号に前記音響心理学的または視覚心理学的加工をした透かし信号を組み込み対応する数のオーディオまたはビデオ信号を求めるように構成された手段(SA)と、
    - 前記対応する組み込まれた透かし信号を含めて前記オーディオまたはビデオ信号をスペクトル的にホワイトニングする手段(SPW)と、
    - 相関を用いて前記対応する組み込まれた透かし信号を含めてスペクトル的にホワイトニングされたオーディオまたはビデオ信号を逆拡散し復調して第1と少なくとも第2の候補透かし信号を求めるように構成された手段(ESPDEM)と、
    - どの相関結果が最もよくマッチするか決定して、対応する候補エンコーダ拡散シーケンスで透かしを入れられた透かし入りオーディオまたはビデオ信号(WAS)を出力するように構成された手段(DEC)とを有する装置。
  5. 前記ペイロードデータ(PLD)に対してエラー訂正及び/または検出エンコーディング(ECDE)を実行してから前記変調(MS)を行う、請求項1または2に記載の方法、または請求項3または4に記載の装置。
  6. 請求項1、2及び5のうちいずれか一項に記載の方法、または請求項3乃至5いずれか一項に記載の装置であって、
    前記変調(MS)と前記逆拡散及び復調(DSPDEM)において、それぞれ相異なる2つの候補エンコーダ拡散シーケンスを使用し、候補エンコーダ拡散シーケンスの一方は他方の負または否定したものであり、
    前記逆拡散及び復調(DSPDEM)及び任意的に対応する透かし信号デコーダにおいて、相関結果のみの大きさを評価する方法または装置。
  7. 請求項1、2、5及び6いずれか一項に記載の方法でエンコードされたオーディオまたはビデオ信号(AS)。
  8. 請求項1、2、5及び6いずれか一項に記載の方法でエンコードされたオーディオまたはビデオ信号(AS)を含む、または記録した記憶媒体。
JP2008514051A 2005-06-02 2006-05-03 拡散スペクトルを用いて透かしデータでオーディオまたはビデオ信号に透かしを入れる方法及び装置 Pending JP2008546292A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP05090175A EP1729285A1 (en) 2005-06-02 2005-06-02 Method and apparatus for watermarking an audio or video signal with watermark data using a spread spectrum
PCT/EP2006/062001 WO2006128769A2 (en) 2005-06-02 2006-05-03 Method and apparatus for watermarking an audio or video signal with watermark data using a spread spectrum

Publications (2)

Publication Number Publication Date
JP2008546292A true JP2008546292A (ja) 2008-12-18
JP2008546292A5 JP2008546292A5 (ja) 2009-05-28

Family

ID=35094605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008514051A Pending JP2008546292A (ja) 2005-06-02 2006-05-03 拡散スペクトルを用いて透かしデータでオーディオまたはビデオ信号に透かしを入れる方法及び装置

Country Status (7)

Country Link
US (1) US20090235079A1 (ja)
EP (2) EP1729285A1 (ja)
JP (1) JP2008546292A (ja)
CN (1) CN101185121B (ja)
DE (1) DE602006001749D1 (ja)
TW (1) TW200644457A (ja)
WO (1) WO2006128769A2 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2081187A1 (en) * 2008-01-21 2009-07-22 Deutsche Thomson OHG Method and apparatus for determining whether or not a reference pattern is present in a received and possibly water-marked signal
EP2083418A1 (en) * 2008-01-24 2009-07-29 Deutsche Thomson OHG Method and Apparatus for determining and using the sampling frequency for decoding watermark information embedded in a received signal sampled with an original sampling frequency at encoder side
DE102008014409A1 (de) * 2008-03-14 2009-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Einbetter zum Einbetten eines Wasserzeichens in eine Informationsdarstellung, Detektor zum Detektieren eines Wasserzeichens in einer Informationsdarstellung, Verfahren und Computerprogramm
GB2460306B (en) * 2008-05-29 2013-02-13 Intrasonics Sarl Data embedding system
EP2362384A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark generator, watermark decoder, method for providing a watermark signal, method for providing binary message data in dependence on a watermarked signal and a computer program using improved synchronization concept
EP2362386A1 (en) 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark generator, watermark decoder, method for providing a watermark signal in dependence on binary message data, method for providing binary message data in dependence on a watermarked signal and computer program using a two-dimensional bit spreading
EP2362385A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark signal provision and watermark embedding
EP2416317A1 (en) * 2010-08-03 2012-02-08 Irdeto B.V. Detection of watermarks in signals
CN102074240B (zh) * 2010-12-24 2012-03-14 中国科学院声学研究所 一种用于版权管理的数字音频水印算法
EP2544179A1 (en) 2011-07-08 2013-01-09 Thomson Licensing Method and apparatus for quantisation index modulation for watermarking an input signal
US8586847B2 (en) * 2011-12-02 2013-11-19 The Echo Nest Corporation Musical fingerprinting based on onset intervals
CN104505096B (zh) * 2014-05-30 2018-02-27 华南理工大学 一种用音乐传输隐藏信息的方法及装置
CN104658542B (zh) * 2015-03-16 2018-01-12 武汉大学 基于正交的加性扩频音频水印嵌入方法、检测方法及系统
CN105374360B (zh) * 2015-11-25 2018-12-14 武汉大学 交叉加性扩频音频水印嵌入方法、检测方法及系统
CN106886693A (zh) * 2015-12-15 2017-06-23 中国移动通信集团公司 一种软件敏感数据隐藏、提取方法及装置
CN106409302B (zh) * 2016-06-22 2019-07-09 华中师范大学 基于嵌入区域选择的音频水印方法及系统
CN109300078B (zh) * 2018-08-31 2022-12-30 太原理工大学 一种具有自适应嵌入强度的图像扩频水印嵌入方法
CN109584890A (zh) * 2018-12-18 2019-04-05 中央电视台 音频水印嵌入、提取、电视节目互动方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000101980A (ja) * 1998-09-22 2000-04-07 Sony Corp 映像信号伝送システム、映像信号出力装置、映像信号処理装置および映像信号伝送方法
JP2000172282A (ja) * 1998-09-29 2000-06-23 Internatl Business Mach Corp <Ibm> オ―ディオデ―タへ付加情報を埋め込む方法およびシステム
JP2000510980A (ja) * 1996-07-16 2000-08-22 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 情報信号に埋め込まれた透かし情報の検出方法
JP2002271756A (ja) * 2001-03-08 2002-09-20 Sony Corp データ処理装置、およびデータ処理方法、並びにプログラム
JP2003143388A (ja) * 2001-10-31 2003-05-16 Toppan Printing Co Ltd 画像処理方法およびその装置ならびに印刷物
JP2004221715A (ja) * 2003-01-10 2004-08-05 Sanyo Electric Co Ltd 電子透かし埋め込み方法およびその方法を利用可能な符号化装置と復号装置
JP2005025818A (ja) * 2003-06-30 2005-01-27 Sony Corp 信号処理装置およびその方法とコンピュータ
JP2005051785A (ja) * 2003-07-29 2005-02-24 Sony Corp デジタルデータへの透かし埋込み及びその検知方法及び装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7113615B2 (en) * 1993-11-18 2006-09-26 Digimarc Corporation Watermark embedder and reader
US7543148B1 (en) 1999-07-13 2009-06-02 Microsoft Corporation Audio watermarking with covert channel and permutations
JP4891508B2 (ja) * 1999-11-23 2012-03-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ウォーターマーク埋込み及び検出
US6674876B1 (en) * 2000-09-14 2004-01-06 Digimarc Corporation Watermarking in the time-frequency domain
US20040059918A1 (en) * 2000-12-15 2004-03-25 Changsheng Xu Method and system of digital watermarking for compressed audio
AU2003214489A1 (en) * 2002-03-28 2003-10-13 Koninklijke Philips Electronics N.V. Watermark time scale searching
KR20050005531A (ko) 2002-06-03 2005-01-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 독립 채널들에서의 워터마크들의 엔코딩 및 디코딩
KR100449803B1 (ko) * 2002-06-28 2004-09-22 한국전자통신연구원 위너 공격과 백색화 필터 검출을 고려한 워터마크 설계방법

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000510980A (ja) * 1996-07-16 2000-08-22 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 情報信号に埋め込まれた透かし情報の検出方法
JP2000101980A (ja) * 1998-09-22 2000-04-07 Sony Corp 映像信号伝送システム、映像信号出力装置、映像信号処理装置および映像信号伝送方法
JP2000172282A (ja) * 1998-09-29 2000-06-23 Internatl Business Mach Corp <Ibm> オ―ディオデ―タへ付加情報を埋め込む方法およびシステム
JP2002271756A (ja) * 2001-03-08 2002-09-20 Sony Corp データ処理装置、およびデータ処理方法、並びにプログラム
JP2003143388A (ja) * 2001-10-31 2003-05-16 Toppan Printing Co Ltd 画像処理方法およびその装置ならびに印刷物
JP2004221715A (ja) * 2003-01-10 2004-08-05 Sanyo Electric Co Ltd 電子透かし埋め込み方法およびその方法を利用可能な符号化装置と復号装置
JP2005025818A (ja) * 2003-06-30 2005-01-27 Sony Corp 信号処理装置およびその方法とコンピュータ
JP2005051785A (ja) * 2003-07-29 2005-02-24 Sony Corp デジタルデータへの透かし埋込み及びその検知方法及び装置

Also Published As

Publication number Publication date
WO2006128769A3 (en) 2007-03-01
EP1886305A2 (en) 2008-02-13
CN101185121B (zh) 2011-05-11
CN101185121A (zh) 2008-05-21
US20090235079A1 (en) 2009-09-17
WO2006128769A2 (en) 2006-12-07
EP1886305B1 (en) 2008-07-09
DE602006001749D1 (de) 2008-08-21
EP1729285A1 (en) 2006-12-06
TW200644457A (en) 2006-12-16

Similar Documents

Publication Publication Date Title
JP2008546292A (ja) 拡散スペクトルを用いて透かしデータでオーディオまたはビデオ信号に透かしを入れる方法及び装置
JP5211036B2 (ja) 二つのデータ区域を相関させる方法及び装置
TWI403974B (zh) 帶有酬載資料藉以對聲頻或視頻訊號加以水印之符號編碼及解碼方法和裝置
CN101512638B (zh) 对承载用于对音频或视频信号添加水印的有效载荷数据的符号进行编码/解码的方法及设备
US6792542B1 (en) Digital system for embedding a pseudo-randomly modulated auxiliary data sequence in digital samples
US7886152B2 (en) Method and device for embedding watermark information and method and device for extracting embedded watermark information
JP2008058953A (ja) 音声透かしをベースとするメディア・プログラムの識別方法及び装置
EP2619757B1 (en) Watermark generator, watermark decoder, method for providing a watermarked signal based on discrete valued data and method for providing discrete valued data in dependence on a watermarked signal
JP2008546292A5 (ja)
He et al. A high capacity watermarking technique for stereo audio
Silvestre et al. Informed audio watermarking scheme using digital chaotic signals
EP1703461B1 (en) Method and apparatus for encoding and decoding symbols carrying payload data for watermarking an audio or video signal
Erfani et al. A new embedding method for robust ISS—watermarking
Brickman Method to Improve Watermark Reliability
EP1080545A1 (en) Digital hidden data transport (dhdt)
Hakeem et al. Magic Random Bits LSB Audio Steganography

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090409

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090409

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110608

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110705