JP2008502194A - 補助情報をメディア信号に埋め込む方法及び装置 - Google Patents

補助情報をメディア信号に埋め込む方法及び装置 Download PDF

Info

Publication number
JP2008502194A
JP2008502194A JP2007514301A JP2007514301A JP2008502194A JP 2008502194 A JP2008502194 A JP 2008502194A JP 2007514301 A JP2007514301 A JP 2007514301A JP 2007514301 A JP2007514301 A JP 2007514301A JP 2008502194 A JP2008502194 A JP 2008502194A
Authority
JP
Japan
Prior art keywords
signal
perceptual
distortion
generating
media signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007514301A
Other languages
English (en)
Inventor
セー オーストフェーン,ヨブ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008502194A publication Critical patent/JP2008502194A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本発明は、オーディオビジュアル信号などのメディア信号に補助情報を埋め込むシステムに関する。装置は、メディア信号の量子化インデックス変調によって変更された信号を生成する量子化インデックス変調装置を有する。変更された信号は、補助情報に応じたメディア信号に対する歪みを有する。装置はさらに、歪みに対するメディア信号の知覚感度を示す知覚特性を生成する知覚プロセッサを有する。量子化インデックス変調装置及び知覚プロセッサは、知覚特性に応答して変更された信号の歪みの強度を変更することによって、出力信号を生成する補償プロセッサに接続される。本発明は、透かし知覚不可能性と検出信頼性との間のトレードオフを向上させるため、知覚モデルと量子化インデックス変調透かし処理とを組み合わせる。

Description

本発明は、補助情報をメディア信号に埋め込む方法及び装置に関し、より詳細には、量子化インデックス変調を利用して補助情報をメディア信号に埋め込む方法及び装置に関する。
デジタル透かし処理は、オーディオビジュアルオブジェクトに補助情報を埋め込むことに関する。デジタル透かし処理は、複製(著作権)保護、ロイヤリティ追跡、商業的認証、付加価値コンテンツ、インタラクティブトイ及びさらに多くのものを含む多数のアプリケーションを有する。デジタル透かし処理に対する従来のアプローチは、本質的には制御されたノイズ付加であり、これにより、既知のノイズ類似信号がもとの信号に追加される。このような技術の一例は、拡散スペクトル透かし処理として知られている。追加的な透かしのための透かし検出は、一般に受信信号と基準透かしとの間の相関に基づく。結果として得られる相関値は、所望のタームと干渉タームから構成される。干渉タームは、ノイズ付加に基づく透かし技術が最適なパフォーマンス以下しか取得できない主たる理由となっている。
透かし処理の文献では、ますます多くの注目が、ホスト信号を透かし埋め込み装置のサイド情報として扱う透かし処理スキームに対して向けられている。
例えば、最近の刊行物は、特定の攻撃モデルを仮定すると、最適な透かし処理は量子化により実現可能であるということを示している。要約すると、量子化透かし処理は以下の通りである。ホスト信号sの空間Sにおいて、コードポイントCのN個のセットが選択される。ただし、Nは埋め込まれるメッセージの個数に等しい(透かしのペイロード)。ホスト信号sを信号
Figure 2008502194
に変更することは、sと
Figure 2008502194
が近接し、
Figure 2008502194
がCのある点cに、その他のコードセットC(nは、mとは異なる)の何れかの他の任意の点より近接するように、メッセージmを埋め込む。透かしの復号化は、コードポイントセットの和集合において最も近接した点cを検出し、メッセージmに応答して、当該点cがコードセットcの要素である場合、かつその場合に限って決定することとなる。このタイプの透かし処理は、通常は量子化インデックス変調(QIM)と呼ばれている。
QIMのさらなる詳細は、例えば、Chen,B.及びWornell,G.W.による“Quantization index modulation:a class of provably good methods for digital watermarking and information embedding”(Transactions on Information Theory,IEEE,Volume:47 Issue:4,May 2001,Pages:1423−1443)と、Chou,J.、Ramchandran,K.及びOrtega,A.による“Next generation techniques for robust and imperceptible audio data hiding”(IEEE International Conference on Acoustics,Speech,and Signal Processing,Proceedings,2001 Volume:3,Pages:1349−1352)に見つけることができるかもしれない。
通常、このアプローチから生じる実際的なスキームは、(ディザ)ベクトル量子化及び歪み補償に基づく。これら2つの技術の組み合わせは、多くの情報量の埋め込みを可能にする。これらの技術を利用したスキームは、通常、歪み補償量子化インデックス変調透かし処理(DC−QIM)と呼ばれている。
DC−QIMスキームによる問題は、ローカルな画像特性に適応することが比較的困難であるということである。特に、透かしの視認性を制御することが困難である。QIM透かしをローカルな信号特性に適応させる1つのアプローチは、特許協力条約(PCT)WO03/053064から知られている。WO03/053064は、透かしの視認性及びロウバスト性との間のトレードオフを向上させるための方法として、量子化ステップサイズのローカルな適応化を開示している。
QIM透かしの知覚性及び検出信頼性を制御する現在のアプローチは、単純なモデルを使用しており、特にホスト信号と透かしとの間のノイズレシオに対する信号の評価に基づく。このモデルは解析のため大変有用なものであるが、それは透かしの検出信頼性と知覚不能性との間の次善的なトレードオフをもたらす傾向がある。
従って、補助情報をメディア信号に埋め込む改良されたシステムが効果的であり、特に検出信頼性の向上、フレキシビリティの向上、実現容易性、知覚不能性の向上及び/又はパフォーマンス向上を可能にするシステムが効果的である。
従って、本発明は、好ましくは、上述した問題点の1以上を単独で又は何れかの組み合わせにより緩和、軽減又は解消しようとするものである。
本発明の第1の特徴によると、補助情報をメディア信号に埋め込む装置であって、前記メディア信号の量子化インデックス変調によって、前記補助情報に応じた前記メディア信号に対する歪みを有する変更された信号を生成する手段と、前記歪みに対する前記メディア信号の知覚感度を示す知覚特性を生成する手段と、前記知覚特性に応答して、前記変更された信号の歪みの強度を変更することによって出力信号を生成する手段とを有することを特徴とする装置が提供される。
本発明の発明者は、知覚特性に応答して量子化インデックス変調によって導入された歪みの強度を変更することによって、量子化インデックス変調のパフォーマンスの向上が実現可能であることを理解していた。パフォーマンスの向上が実現され、特に、歪みの知覚可能性が低減され、及び/又は補助情報の検出信頼性が増大されるかもしれない。
メディア信号は、例えば、音声及び/又は映像信号であってもよい。メディア信号は、例えば、ストリーミング信号であってもよいし、あるいはデジタルデータを有するファイルであってもよい。補助情報は、特にデジタル透かしであってもよい。知覚特性は、メディア信号と変更された信号との間のユーザに対する知覚的な相違を示す特性であってもよい。
本発明の好適な特徴によると、歪みの強度は、歪み補償パラメータを変更することによって強度を変更するよう動作可能である。これは、特に効果的なパフォーマンスを提供する。あるいは、又は加えて、歪みの強度を変更するシンプル、効率的及び/又はフレキシブルな手段が実現されるとき、実現が容易になるかもしれない。特に、この特徴は量子化インデックス変調の既存の方法に適したものとなるかもしれない。
本発明の好適な特徴によると、歪みの強度を変更する手段は、歪みにローカルなメディア信号のローカルな知覚感度に応答して、歪みの強度を動的に調整するよう動作可能である。
この強度は、好ましくは、現在変更されたメディア信号の一部の具体的に状態を反映するよう動的に制御される。従って、知覚不能性と検出信頼性との間のトレードオフは、信号の変化する特性を反映するよう動的に最適化されるようにしてもよい。
本発明の好適な特徴によると、出力信号を生成する手段は、知覚特性に応答して、歪みをスケーリングするよう動作可能である。これは、強度を変更する効果的な方法を提供し、シンプルかつ実際的な実現を可能にするかもしれない。
本発明の好適な特徴によると、出力信号を生成する手段は、減少する知覚感度に対して強度を増大させるよう動作可能である。これは、歪みの知覚不能性と補助情報の検出信頼性との間のトレードオフを向上させる。特に、強度は、歪みを結果として得られる信号のユーザに対する知覚性を可能にすることなく、可能な限り大きく増大されるかもしれない。
本発明の好適な特徴によると、変更された信号を生成する手段は、歪みwを実質的に
Figure 2008502194
(ただし、sは前記メディア信号のサンプルjであり、Dは量子化間隔であり、vはサンプルjに対するディザ値であり、bは前記補助情報のビットjである)として決定するよう動作可能である。これは、高性能による複雑さの低い実現を提供する。
本発明の好適な特徴によると、出力信号を生成する手段は、信号を有する出力信号sout,jを実質的に
Figure 2008502194
(ただし、sはメディア信号のサンプルjであり、wはメディア信号の量子化インデックス変調によって決定されるサンプルjに対する歪みであり、αは歪み補償パラメータである)として決定するよう動作可能であり、出力信号を生成する手段は、知覚特性に応答して、歪み補償パラメータαを変更するよう動作可能である。
これは、歪みの強度を実現、解析及び/又は制御するための特にシンプルな技術を提供する。
本発明の好適な特徴によると、メディア信号は視覚信号であり、知覚特性は、画像領域のテクスチャレベルの指標である。視覚信号は、例えば、映像信号又は画像ファイルなどであるかもしれない。好ましくは、テクスチャレベルの増大に対して、強度は増大される。メディア信号に対する歪みの知覚性は、典型的には、テクスチャレベルの増大に対して向上し、当該特徴は、これが知覚不能性と検出パフォーマンスとの間のトレードオフを向上するのに利用することを可能にする。
本発明の好適な特徴によると、メディア信号は音声信号であり、知覚特性は、音声セグメントの音声レベルの指標である。音声信号は、例えば、デジタル符号化音楽信号などであるかもしれない。好ましくは、強度は、音声レベルの増大に対して向上するであろう。音声メディア信号に対する歪みの知覚性は、典型的には、音声レベルの増大に対して向上し、当該特徴は、これが知覚不能性と検出パフォーマンスとの間のトレードオフを向上するのに利用することを可能にする。
本発明の好適な特徴によると、知覚特性を生成する手段は、ラプラシアンフィルタを有する知覚モデルに応答して、知覚特性を生成するよう動作可能である。これは、多数のタイプのメディア信号に対する歪みの強度を制御するのに有用な知覚特性を決定する適切な方法を提供する。
本発明の好適な特徴によると、知覚特性を生成する手段は、GirodのWモデルを有する知覚モデルに応答して、知覚特性を生成するよう動作可能である。これは、多数のタイプのメディア信号に対する歪みの強度を制御するのに有用な知覚特性を決定する適切な方法を提供する。
本発明の第2の特徴によると、補助情報をメディア信号に埋め込む方法であって、前記メディア信号の量子化インデックス変調によって、前記補助情報に応じた前記メディア信号に対する歪みを有する変更された信号を生成するステップと、前記歪みに対する前記メディア信号の知覚感度を示す知覚特性を生成するステップと、前記知覚特性に応答して、前記変更された信号の歪みの強度を変更することによって出力信号を生成するステップとを有することを特徴とする方法が提供される。
本発明の上記及び他の特徴及び効果は、以下に記載される実施例を参照して明らかとなるであろう。
以下の記載は、デジタル透かしをデジタル符号化されたオーディオビジュアル信号に埋め込むことに適用可能な本発明の実施例に着目している。
図1は、本発明の実施例による透かしを埋め込むための装置のブロック図である。
本例では、当該装置は、メディア信号を生成するローカル信号ソース101を有する。メディア信号は、例えば、デジタル符号化されたビデオ及び/又はオーディオクリップからなるデータファイルであってもよい。他の実施例では、メディア信号は、外部ソースなどの他のソースから受信されてもよいということは理解されるであろう。また、メディア信号は、何れか適切な形式を有し、例えば、ストリーミング信号であってもよいということは理解されるであろう。
ローカル信号ソース101は、メディア信号が供給される量子化インデックス変調装置103に接続されている。特に、量子化インデックス変調装置103には、以降においてs(jは、サンプル番号を示す)により示されるいくつかのサンプルとしてメディア信号が供給される。
量子化インデックス変調装置103は、補助情報のサンプルbを埋め込み、これにより、メディア信号の量子化インデックス変調により変更された信号を生成するよう動作可能である。従って、メディア信号に対して歪みを有する変更された信号
Figure 2008502194
が、生成される。この湯が意味は、補助情報に依存するであろう。しかしながら、ノイズ付加的透かし技術と対照的に、歪みは補助情報には直接的には対応しないが、補助情報はメディア信号に適応される量子化と、従って、信号と歪みの組み合わせにより構成される。
より詳細には、例えば、量子化インデックス変調は、信号サンプル値のスカラー量子化を検討することによって最も容易に理解されうる。量子化インターバルDが選択され、以下のように2つのコードセットC及びCを構成するのに利用される。セットCは、Dのすべての偶数の倍数から構成され、セットCは、Dのすべての奇数の倍数から構成される。それの最もシンプルな形式では、長さkの信号s=(s,s,...,s)を長さkのビット文字列(透かし)b=(b,b,...,b)により透かし処理することは、各jに対して、b=0であるときは、sを最も近い偶数の倍数に丸め込み、b=1であるときは、sを最も近い奇数の倍数に丸め込むことによって実現される。従って、量子化インデックス変調は、入力サンプルsを透かしビットbに依存する変更された出力サンプル
Figure 2008502194
に変換する。
ビット文字列bは、結果として得られる信号をDによるグリッドに丸め込み、この丸め込みによりDの偶数の倍数の値が生じる場合にはビット値を0に設定し、丸め込みによりDの偶数の倍数の値が生じる場合にはビット値を1に設定することによって復元することが可能である。
多くの実際的なシステムでは、信号サンプルは、セキュリティを向上させ、導入された量子化ノイズを拡散及びランダム化するため、ディザ値vを各サンプルに加えることによってディザ処理される。ディザ値vは、好ましくは実数である。これは、サンプル
Figure 2008502194
が常にDによるグリッド上に存在することを妨げ、これにより、透かしの有無が不明りょうとなる。
具体的には、量子化インデックス変調装置103は、「ディザ処理一様スカラー量子化」として知られる以下の処理を実行するようにしてもよい。
ディザ値vは、量子化ステップの分数値として表され、特に−1<v<1とされる。与えられたオフセットvに対して、出力サンプル
Figure 2008502194
が想定可能な離散レベルは、
Figure 2008502194
である。ただし、mは整数値である。
出力値
Figure 2008502194
は、入力値sに対して可能な限り近接している必要がある。これは、
Figure 2008502194
として表すことができる。この条件は、
Figure 2008502194
を設定することによって満たされる。(1)に(5)を代入すると、
Figure 2008502194
が得られる。
式6は、以下のように解釈されるかもしれない。まず、サンプル値sに対して、「量子化インデックス」s/Dが計算される。次に、この量子化インデックスは、bが0か1かに応じて、偶数又は奇数の整数値のセット(vによりオフセットされた)に対応するシフトされたものに丸め込まれる。従って、bの値に応じて、量子化インデックス変調信号は、2つの異なるサブセット上に存在することとなる。最後に、この結果は、サンプル値sのもとのスケールを復元するため、Dと乗算される。
従って、説明された実施例では、量子化インデックス変調装置103は、変更された信号
Figure 2008502194
を生成する。この変更された信号は、
Figure 2008502194
により与えられるもとの信号sに関する歪みwを有する。
従って、この歪みは、透かしデータに依存する。しかしながら、典型的なノイズ付加的透かし処理と対照的に、この歪みは、直接的には透かしと相関するものでない。むしろ、透かし情報は、信号と歪みの組み合わせにより構成される。
量子化インデックス変調は、必ずしもバイナリデータシンボルに限定されるものではなく、より高いオーダのデータシンボルに適用可能であるということは理解されるであろう。
当該技術分野では周知のように、量子化インデックス変調により埋め込まれる情報の検出は、量子化インデックスを計算し、ディザ値を考慮し、量子化インデックスのパリティをチェックすることによって実行されてもよい。バイナリのケースでは、透かし検出装置は、透かしのビット値
Figure 2008502194
Figure 2008502194
から単に計算するようにしてもよい。
変更されたメディア信号に与えられるユーザに対する透かしの影響及び知覚性を変えるため、歪み補償が適用されるようにしてもよい。従って、図1の装置は、変更された信号の歪みの強さを変更することによって、出力信号を生成する補償プロセッサ105を有する。
特に、補償プロセッサ105は、
Figure 2008502194
によって与えられる出力信号soutを生成する。ここで、sはメディア信号のサンプルjであり、wは量子化インデックス変調装置103によって決定されるサンプルjに対する歪みである。従って説明される実施例では、歪みwは、歪み補償パラメータαによってスケーリングされる。
従って、量子化インデックス変調装置103によって導入される歪みwは、もとのサンプルと透かし処理されたサンプルとの間の差分とみなすことができ、wは、量子化インデックス変調装置103によって導入されるエラー又は変更として解釈することが可能である。歪み補償パラメータαの追加的パラメータは、変更の大きさ又は強度を制御するのに利用されてもよい。α=1の歪みパラメータ値は、もとの量子化インデックス変調に対応し、α=0に対して、もとのメディア信号に対する変更はなされない。
図1の実施例では、補償プロセッサ105は、信号ソース101からもとの信号sを、量子化インデックス変調装置103から変更された信号
Figure 2008502194
を受け付ける。その後、それは各サンプルに対して歪みwを計算し、この歪みと歪み補償パラメータαとを乗算し、この結果をもとの信号sに加える。従って、補償プロセッサ105は、
Figure 2008502194
の演算を実行することによって、変更された信号の歪みの強さを変更することによって、出力信号を生成する。
歪み補償が異なる透かし検出アルゴリズムを要求せず、同一の検出装置が歪み補償パラメータαの値とは独立に利用可能であるということが理解されるであろう。
説明された実施例によると、図1の装置はさらに、知覚プロセッサ107を有する。知覚プロセッサ107は、歪みに対するメディア信号の知覚的影響を示す知覚特性を生成する。特に、知覚プロセッサ107は、もとのメディア信号に対する歪み又は変更がどの程度顕著なものであるかユーザに示す知覚特性を決定するようにしてもよい。例えば、映像信号については、知覚特性は、視覚的に顕著にある歪みに対してメディア信号がどの程度影響を受けるか示すものであってもよい。
図1の装置では、知覚プロセッサ107は、補償プロセッサ105に接続され、歪み補償パラメータαを制御するよう動作可能である。従って、変更された信号の歪みの強さは、知覚特性に応答して制御される。
これは、歪みが信号特性に対して最適化されることを可能にし、特に、歪みの知覚不能性と埋め込まれた透かしの検出信頼性との間のトレードオフを向上させる。
好ましくは、歪みの強さは、知覚感度の低下に対して増大される。従って、歪みがあまり顕著でないとき、歪み補償パラメータαは増大され、透かし埋め込みが許容されない品質劣化を生じさせないことを保証しながら、検出信頼性を向上させる。知覚感度が増大すると、より小さな歪みでも顕著なものとなる可能性があり、従って、歪み補償パラメータαは低下し、これにより、品質劣化が許容できないものとはならないことが保証される。
説明された実施例では、知覚プロセッサ107は、知覚特性を決定するため、メディア信号を処理する知覚モデルを実現する。この知覚モデルは、好ましくはローカルな知覚感度を示すローカルな知覚特性を生成する。特に、各サンプルに対して、当該サンプルの周囲のサンプルグループの特性に基づき、知覚特性が生成されるようにしてもよい。
映像アプリケーションに対する具体例として、知覚プロセッサ107は、ラプラシアンフィルタから構成される知覚モデルを実現するものであってもよい。ラプラシアンフィルタは、画像又は映像フレーム内のある領域がフラットであるか、又はテクスチャ化されているか示す信号を生成するハイパスフィルタである。小さな歪みでさえ容易に視認できるフラット領域では、フィルタは弱いレスポンスを有するであろう。歪みがあまり視認されないテクスチャ化された領域では、フィルタは強いレスポンスを有する。従って、ラプラシアンフィルタの出力は、知覚感度を示し。歪み補償パラメータαを制御するのに利用可能である。
従って、説明された実施例は、高性能な透かし処理アルゴリズムの量子化インデックス変調の利用と知覚評価を組み合わせる方法を提供する。知覚モデルの結果に基づき、歪み補償パラメータαは、デフォルト値に対して増大されたり(知覚モデルが、比較的大きな変更が知覚不能であることを示すとき)、減少される(知覚モデルが、知覚不能性を保証するため小さな変更が必要とされることを示すとき)。
数学用語では、sを透かし処理される信号サンプルとし、(si−N,...,si+M)をsの環境におけるサンプルとする。視覚的モデルが、大きな歪みが依然として知覚不能であるときには大きな値を返し、歪みが知覚不能となるよう小さなものでなければならないときには小さな値を返すと仮定する。P(sk−N,...,sk+M)を知覚モデルとし、g()を区間[0,1]の値をとる適切に選択された単調増加関数とする。このとき、知覚適応的埋め込みは、
Figure 2008502194
となるかもしれず、wは式(7)と同様に定義される。
知覚モデルPとしてラプラシアンフィルタと以下の項のリニア関数g(z)=γz+bを利用したグレイスケール画像の透かし処理の具体例が、歪み補償パラメータar,cを決定するのに利用可能である。
Figure 2008502194
知覚特性を決定する他の手段が利用可能であり、特に他の知覚モデルが代わりに、又は追加的に利用可能であるということは理解されるであろう。
例えば、知覚プロセッサ107は、GirodのWモデルから構成される知覚モデルに応答して、知覚特性を生成するようにしてもよい。
このモデルは、(一様な)バックグラウンド輝度の関数として“just−not−noticeable”ノイズの量を推定する。それは、2つの刺激の間の最小の知覚可能な相違がこれらの刺激の強さに比例することを述べるWeberの法則の適応化である。GirodのWモデルに関するさらなる情報は、例えば、Bernd Girodによる“Human vision,Visual processing and digital display”(Proceedings of SPIE(光学技術者のための国際学会),volume 1077,pages178−187,1989)の“The information theoretical significance of spatial and temporal masking in video signals”に見つけることができる。
また、本発明はビジュアル信号に限定されるものでなく、多数の異なるタイプのメディア信号に適用可能であるということが理解されるであろう。例えば、メディア信号は、デジタルサンプリング及びPCM(Pulse Code Modulation)符号化オーディオクリップなどの音声信号であってもよい。この例では、知覚特性は、音声の音声レベルの指標であってもよく、歪み補償パラメータαは、歪みがリスナーに顕著にならないより高い信号値に音声レベルが対応するため、音声レベルの増大に対して増大されてもよい。
本発明は、ハードウェア、ソフトウェア、ファームウェア又は上記の何れかの組み合わせを含む何れか適切な形式により実現可能である。しかしながら、好ましくは、本発明は、1以上のデータプロセッサ及び/又はデジタル信号プロセッサ上で実行されるコンピュータソフトウェアとして実現される。本発明の実施例の要素及びコンポーネントは、何れか適切な方法により物理的、機能的及び論理的に実現されてもよい。実際、当該機能は、単一のユニットにより、複数のユニットにより又は他の機能ユニットの一部として実現されてもよい。また、本発明は、単一のユニットにより実現されてもよく、あるいは、異なるユニットとプロセッサの間に物理的及び機能的に分散化されてもよい。
本発明が好適な実施例に関して説明されたが、それはここで与えられた具体的形式に限定されることを意図するものではない。むしろ、本発明の範囲は、添付した請求項によってのみ限定されるものである。請求項では、「有する」という用語は、他の要素又はステップの存在を排除するものではない。さらに、個別に列挙されるが、複数の手段、要素又は方法ステップは、単一のユニット又はプロセッサなどによって実現されてもよい。さらに、各特徴は異なる請求項に含まれてもよいが、これらはおそらく効果的に組み合わされてもよく、異なる請求項に包含することは、特徴の組み合わせが実現可能及び/又は効果的でないことを意味するものではない。さらに、単数形による表現は複数を排除するものではない。従って、「ある」、「第1の」、「第2の」などの表現は、複数を排除するものではない。請求項における参照符号は、単に明示的な例として与えられているものであり、請求項の範囲を何れかの方法により限定するものとして解釈されるべきでない。
図1は、本発明の実施例による透かしを埋め込む装置のブロック図である。

Claims (14)

  1. 補助情報をメディア信号に埋め込む装置であって、
    前記メディア信号の量子化インデックス変調によって、前記補助情報に応じた前記メディア信号に対する歪みを有する変更された信号を生成する手段と、
    前記歪みに対する前記メディア信号の知覚感度を示す知覚特性を生成する手段と、
    前記知覚特性に応答して、前記変更された信号の歪みの強度を変更することによって出力信号を生成する手段と、
    を有することを特徴とする装置。
  2. 請求項1記載の装置であって、
    前記出力信号を生成する手段は、歪み補償パラメータを変更することによって、前記強度を変更するよう動作可能であることを特徴とする装置。
  3. 請求項1記載の装置であって、
    前記出力信号を生成する手段は、歪みに対するローカルな前記メディア信号のローカルな知覚感度に応答して、前記歪みの強度を動的に調整するよう動作可能であることを特徴とする装置。
  4. 請求項1記載の装置であって、
    前記出力信号を生成する手段は、前記知覚特性に応答して、前記歪みをスケーリングするよう動作可能であることを特徴とする装置。
  5. 請求項1記載の装置であって、
    前記出力信号を生成する手段は、減少する知覚感度に対して前記強度を増大させるよう動作可能であることを特徴とする装置。
  6. 請求項1記載の装置であって、
    前記変更された信号を精製する手段は、前記歪みwを実質的に
    Figure 2008502194
    (ただし、sは前記メディア信号のサンプルjであり、Dは量子化間隔であり、vはサンプルjに対するディザ値であり、bは前記補助情報のビットjである)として決定するよう動作可能であることを特徴とする装置。
  7. 請求項1記載の装置であって、
    前記出力信号を生成する手段は、前記信号を有する前記出力信号sout,jを実質的に
    Figure 2008502194
    (ただし、sは前記メディア信号のサンプルjであり、wは前記メディア信号の量子化インデックス変調によって決定されるサンプルjに対する歪みであり、αは歪み補償パラメータである)として決定するよう動作可能であり、
    前記出力信号を生成する手段は、前記知覚特性に応答して、前記歪み補償パラメータαを変更するよう動作可能である、
    ことを特徴とする装置。
  8. 請求項1記載の装置であって、
    前記メディア信号は、視覚信号であり、
    前記知覚特性は、画像領域のテクスチャレベルの指標である、
    ことを特徴とする装置。
  9. 請求項1記載の装置であって、
    前記メディア信号は、音声信号であり、
    前記知覚特性は、音声セグメントの音声レベルの指標である、
    ことを特徴とする装置。
  10. 請求項1記載の装置であって、
    前記知覚特性を生成する手段は、ラプラシアンフィルタを有する知覚モデルに応答して、前記知覚特性を生成するよう動作可能であることを特徴とする装置。
  11. 請求項1記載の装置であって、
    前記知覚特性を生成する手段は、GirodのWモデルを有する知覚モデルに応答して、前記知覚特性を生成するよう動作可能であることを特徴とする装置。
  12. 補助情報をメディア信号に埋め込む方法であって、
    前記メディア信号の量子化インデックス変調によって、前記補助情報に応じた前記メディア信号に対する歪みを有する変更された信号を生成するステップと、
    前記歪みに対する前記メディア信号の知覚感度を示す知覚特性を生成するステップと、
    前記知覚特性に応答して、前記変更された信号の歪みの強度を変更することによって出力信号を生成するステップと、
    を有することを特徴とする方法。
  13. 請求項12記載の方法を実行可能なコンピュータプログラム。
  14. 請求項13記載のコンピュータプログラムを有する記録キャリア。
JP2007514301A 2004-06-02 2005-05-30 補助情報をメディア信号に埋め込む方法及び装置 Withdrawn JP2008502194A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04102448 2004-06-02
PCT/IB2005/051754 WO2005119655A1 (en) 2004-06-02 2005-05-30 Method and apparatus for embedding auxiliary information in a media signal

Publications (1)

Publication Number Publication Date
JP2008502194A true JP2008502194A (ja) 2008-01-24

Family

ID=34969887

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007514301A Withdrawn JP2008502194A (ja) 2004-06-02 2005-05-30 補助情報をメディア信号に埋め込む方法及び装置

Country Status (8)

Country Link
US (1) US20080267412A1 (ja)
EP (1) EP1756805B1 (ja)
JP (1) JP2008502194A (ja)
CN (1) CN1961352A (ja)
AT (1) ATE403216T1 (ja)
DE (1) DE602005008594D1 (ja)
TW (1) TW200609903A (ja)
WO (1) WO2005119655A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014521112A (ja) * 2011-07-08 2014-08-25 トムソン ライセンシング 入力信号に透かし入れするための量子化インデックス変調の方法および装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1837875A1 (en) * 2006-03-22 2007-09-26 Deutsche Thomson-Brandt Gmbh Method and apparatus for correlating two data sections
JP5300741B2 (ja) * 2007-01-12 2013-09-25 シフォルーション ベー フェー ビデオ透かし入れのための方法および装置
GB2452021B (en) 2007-07-19 2012-03-14 Vodafone Plc identifying callers in telecommunication networks
CN104781876B (zh) * 2012-11-15 2017-07-21 株式会社Ntt都科摩 音频编码装置、音频编码方法以及音频解码装置、音频解码方法
GB2524784B (en) * 2014-04-02 2018-01-03 Law Malcolm Transparent lossless audio watermarking
KR102444017B1 (ko) 2016-03-31 2022-09-19 다우 글로벌 테크놀로지스 엘엘씨 Pvc-없는 마모층용 결정성 블록 복합체를 포함한 폴리올레핀 블렌드
WO2021056183A1 (en) * 2019-09-24 2021-04-01 Citrix Systems, Inc. Watermarks for text content

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6614914B1 (en) * 1995-05-08 2003-09-02 Digimarc Corporation Watermark embedder and reader
US6901514B1 (en) * 1999-06-01 2005-05-31 Digital Video Express, L.P. Secure oblivious watermarking using key-dependent mapping functions
US7035473B1 (en) * 2000-03-01 2006-04-25 Sharp Laboratories Of America, Inc. Distortion-adaptive visual frequency weighting
US20020146149A1 (en) * 2000-12-18 2002-10-10 Brunk Hugh L. Space filling quantizers for digital watermarking
US7376242B2 (en) * 2001-03-22 2008-05-20 Digimarc Corporation Quantization-based data embedding in mapped data
KR20040066165A (ko) * 2001-12-14 2004-07-23 코닌클리케 필립스 일렉트로닉스 엔.브이. 멀티미디어 신호들의 양자화 인덱스 변조(큐아이엠)디지털 워터마킹
GB0211488D0 (en) * 2002-05-18 2002-06-26 Univ Aston Information embedding method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014521112A (ja) * 2011-07-08 2014-08-25 トムソン ライセンシング 入力信号に透かし入れするための量子化インデックス変調の方法および装置
US10019997B2 (en) 2011-07-08 2018-07-10 Thomson Licensing Method and apparatus for quantisation index modulation for watermarking an input signal

Also Published As

Publication number Publication date
EP1756805B1 (en) 2008-07-30
WO2005119655A1 (en) 2005-12-15
EP1756805A1 (en) 2007-02-28
TW200609903A (en) 2006-03-16
US20080267412A1 (en) 2008-10-30
CN1961352A (zh) 2007-05-09
DE602005008594D1 (de) 2008-09-11
ATE403216T1 (de) 2008-08-15

Similar Documents

Publication Publication Date Title
JP2008502194A (ja) 補助情報をメディア信号に埋め込む方法及び装置
CN100431355C (zh) 响应补充信息修改音频或视频感知编码系统的一个或多个参数
US8363889B2 (en) Image data processing systems for hiding secret information and data hiding methods using the same
Li et al. Using perceptual models to improve fidelity and provide resistance to valumetric scaling for quantization index modulation watermarking
JP5047971B2 (ja) 位相修正を用いることによるオーディオ信号の現物参照なし透かし
Bhat K et al. An audio watermarking scheme using singular value decomposition and dither-modulation quantization
US6674876B1 (en) Watermarking in the time-frequency domain
Menendez-Ortiz et al. A survey on reversible watermarking for multimedia content: A robustness overview
US7792322B2 (en) Encoding apparatus and method
Bhat K et al. A new audio watermarking scheme based on singular value decomposition and quantization
US20090235079A1 (en) Method and apparatus for watermarking an audio or video signal with watermark data using a spread spectrum
JP5749804B2 (ja) 透かし生成器、透かしデコーダ、離散値のデータに基づき透かし付信号を付与するための方法および透かし付信号に依存して離散値のデータを付与する方法
JP2005528649A (ja) マルチメディア信号中の電子透かしの再埋め込み
TW201110700A (en) Systems for hiding secret data in halftone images and data hiding method using the same
EP1875470B1 (en) Modified DCT transform to phase modulate an MP3 data bitstream in baseband, and watermarking.
Li et al. Improved spread transform dither modulation using a perceptual model: robustness to amplitude scaling and JPEG compression
CN101151637A (zh) 量化水印的方法
KR20040095325A (ko) 다매체 신호들의 워터마킹을 위한 윈도우 셰이핑 함수들
CN111292756A (zh) 一种抗压缩音频无声水印嵌入和提取方法及系统
Li et al. Rational dither modulation watermarking using a perceptual model
US20070104349A1 (en) Tally image generating method and device, tally image generating program, and confidential image decoding method
KR20060112667A (ko) 워터마크 임베딩
KR20070031313A (ko) 매체 신호에 보조 정보를 매립하기 위한 방법 및 장치
Chou et al. Color image watermarking based on a color visual model
Li et al. Improve Spread Transform Dither Modulation by Using a Perceptual Model to Provide Resistance to Amplitude Scaling and JPEG Compression

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080528

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090723