JP2008502194A

JP2008502194A - 補助情報をメディア信号に埋め込む方法及び装置

Info

Publication number: JP2008502194A
Application number: JP2007514301A
Authority: JP
Inventors: セーオーストフェーン，ヨブ
Original assignee: Koninklijke Philips NV; Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2004-06-02
Filing date: 2005-05-30
Publication date: 2008-01-24
Also published as: WO2005119655A1; ATE403216T1; DE602005008594D1; US20080267412A1; CN1961352A; EP1756805B1; TW200609903A; EP1756805A1

Abstract

本発明は、オーディオビジュアル信号などのメディア信号に補助情報を埋め込むシステムに関する。装置は、メディア信号の量子化インデックス変調によって変更された信号を生成する量子化インデックス変調装置を有する。変更された信号は、補助情報に応じたメディア信号に対する歪みを有する。装置はさらに、歪みに対するメディア信号の知覚感度を示す知覚特性を生成する知覚プロセッサを有する。量子化インデックス変調装置及び知覚プロセッサは、知覚特性に応答して変更された信号の歪みの強度を変更することによって、出力信号を生成する補償プロセッサに接続される。本発明は、透かし知覚不可能性と検出信頼性との間のトレードオフを向上させるため、知覚モデルと量子化インデックス変調透かし処理とを組み合わせる。

Description

本発明は、補助情報をメディア信号に埋め込む方法及び装置に関し、より詳細には、量子化インデックス変調を利用して補助情報をメディア信号に埋め込む方法及び装置に関する。

デジタル透かし処理は、オーディオビジュアルオブジェクトに補助情報を埋め込むことに関する。デジタル透かし処理は、複製（著作権）保護、ロイヤリティ追跡、商業的認証、付加価値コンテンツ、インタラクティブトイ及びさらに多くのものを含む多数のアプリケーションを有する。デジタル透かし処理に対する従来のアプローチは、本質的には制御されたノイズ付加であり、これにより、既知のノイズ類似信号がもとの信号に追加される。このような技術の一例は、拡散スペクトル透かし処理として知られている。追加的な透かしのための透かし検出は、一般に受信信号と基準透かしとの間の相関に基づく。結果として得られる相関値は、所望のタームと干渉タームから構成される。干渉タームは、ノイズ付加に基づく透かし技術が最適なパフォーマンス以下しか取得できない主たる理由となっている。

透かし処理の文献では、ますます多くの注目が、ホスト信号を透かし埋め込み装置のサイド情報として扱う透かし処理スキームに対して向けられている。

例えば、最近の刊行物は、特定の攻撃モデルを仮定すると、最適な透かし処理は量子化により実現可能であるということを示している。要約すると、量子化透かし処理は以下の通りである。ホスト信号ｓの空間Ｓにおいて、コードポイントＣ_ｎのＮ個のセットが選択される。ただし、Ｎは埋め込まれるメッセージの個数に等しい（透かしのペイロード）。ホスト信号ｓを信号

に変更することは、ｓと

が近接し、

がＣ_ｍのある点ｃに、その他のコードセットＣ_ｎ（ｎは、ｍとは異なる）の何れかの他の任意の点より近接するように、メッセージｍを埋め込む。透かしの復号化は、コードポイントセットの和集合において最も近接した点ｃを検出し、メッセージｍに応答して、当該点ｃがコードセットｃ_ｍの要素である場合、かつその場合に限って決定することとなる。このタイプの透かし処理は、通常は量子化インデックス変調（ＱＩＭ）と呼ばれている。

ＱＩＭのさらなる詳細は、例えば、Ｃｈｅｎ，Ｂ．及びＷｏｒｎｅｌｌ，Ｇ．Ｗ．による“Ｑｕａｎｔｉｚａｔｉｏｎｉｎｄｅｘｍｏｄｕｌａｔｉｏｎ：ａｃｌａｓｓｏｆｐｒｏｖａｂｌｙｇｏｏｄｍｅｔｈｏｄｓｆｏｒｄｉｇｉｔａｌｗａｔｅｒｍａｒｋｉｎｇａｎｄｉｎｆｏｒｍａｔｉｏｎｅｍｂｅｄｄｉｎｇ”（ＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｆｏｒｍａｔｉｏｎＴｈｅｏｒｙ，ＩＥＥＥ，Ｖｏｌｕｍｅ：４７Ｉｓｓｕｅ：４，Ｍａｙ２００１，Ｐａｇｅｓ：１４２３−１４４３）と、Ｃｈｏｕ，Ｊ．、Ｒａｍｃｈａｎｄｒａｎ，Ｋ．及びＯｒｔｅｇａ，Ａ．による“Ｎｅｘｔｇｅｎｅｒａｔｉｏｎｔｅｃｈｎｉｑｕｅｓｆｏｒｒｏｂｕｓｔａｎｄｉｍｐｅｒｃｅｐｔｉｂｌｅａｕｄｉｏｄａｔａｈｉｄｉｎｇ”（ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，Ｐｒｏｃｅｅｄｉｎｇｓ，２００１Ｖｏｌｕｍｅ：３，Ｐａｇｅｓ：１３４９−１３５２）に見つけることができるかもしれない。

通常、このアプローチから生じる実際的なスキームは、（ディザ）ベクトル量子化及び歪み補償に基づく。これら２つの技術の組み合わせは、多くの情報量の埋め込みを可能にする。これらの技術を利用したスキームは、通常、歪み補償量子化インデックス変調透かし処理（ＤＣ−ＱＩＭ）と呼ばれている。

ＤＣ−ＱＩＭスキームによる問題は、ローカルな画像特性に適応することが比較的困難であるということである。特に、透かしの視認性を制御することが困難である。ＱＩＭ透かしをローカルな信号特性に適応させる１つのアプローチは、特許協力条約（ＰＣＴ）ＷＯ０３／０５３０６４から知られている。ＷＯ０３／０５３０６４は、透かしの視認性及びロウバスト性との間のトレードオフを向上させるための方法として、量子化ステップサイズのローカルな適応化を開示している。

ＱＩＭ透かしの知覚性及び検出信頼性を制御する現在のアプローチは、単純なモデルを使用しており、特にホスト信号と透かしとの間のノイズレシオに対する信号の評価に基づく。このモデルは解析のため大変有用なものであるが、それは透かしの検出信頼性と知覚不能性との間の次善的なトレードオフをもたらす傾向がある。

従って、補助情報をメディア信号に埋め込む改良されたシステムが効果的であり、特に検出信頼性の向上、フレキシビリティの向上、実現容易性、知覚不能性の向上及び／又はパフォーマンス向上を可能にするシステムが効果的である。

従って、本発明は、好ましくは、上述した問題点の１以上を単独で又は何れかの組み合わせにより緩和、軽減又は解消しようとするものである。

本発明の第１の特徴によると、補助情報をメディア信号に埋め込む装置であって、前記メディア信号の量子化インデックス変調によって、前記補助情報に応じた前記メディア信号に対する歪みを有する変更された信号を生成する手段と、前記歪みに対する前記メディア信号の知覚感度を示す知覚特性を生成する手段と、前記知覚特性に応答して、前記変更された信号の歪みの強度を変更することによって出力信号を生成する手段とを有することを特徴とする装置が提供される。

本発明の発明者は、知覚特性に応答して量子化インデックス変調によって導入された歪みの強度を変更することによって、量子化インデックス変調のパフォーマンスの向上が実現可能であることを理解していた。パフォーマンスの向上が実現され、特に、歪みの知覚可能性が低減され、及び／又は補助情報の検出信頼性が増大されるかもしれない。

メディア信号は、例えば、音声及び／又は映像信号であってもよい。メディア信号は、例えば、ストリーミング信号であってもよいし、あるいはデジタルデータを有するファイルであってもよい。補助情報は、特にデジタル透かしであってもよい。知覚特性は、メディア信号と変更された信号との間のユーザに対する知覚的な相違を示す特性であってもよい。

本発明の好適な特徴によると、歪みの強度は、歪み補償パラメータを変更することによって強度を変更するよう動作可能である。これは、特に効果的なパフォーマンスを提供する。あるいは、又は加えて、歪みの強度を変更するシンプル、効率的及び／又はフレキシブルな手段が実現されるとき、実現が容易になるかもしれない。特に、この特徴は量子化インデックス変調の既存の方法に適したものとなるかもしれない。

本発明の好適な特徴によると、歪みの強度を変更する手段は、歪みにローカルなメディア信号のローカルな知覚感度に応答して、歪みの強度を動的に調整するよう動作可能である。

この強度は、好ましくは、現在変更されたメディア信号の一部の具体的に状態を反映するよう動的に制御される。従って、知覚不能性と検出信頼性との間のトレードオフは、信号の変化する特性を反映するよう動的に最適化されるようにしてもよい。

本発明の好適な特徴によると、出力信号を生成する手段は、知覚特性に応答して、歪みをスケーリングするよう動作可能である。これは、強度を変更する効果的な方法を提供し、シンプルかつ実際的な実現を可能にするかもしれない。

本発明の好適な特徴によると、出力信号を生成する手段は、減少する知覚感度に対して強度を増大させるよう動作可能である。これは、歪みの知覚不能性と補助情報の検出信頼性との間のトレードオフを向上させる。特に、強度は、歪みを結果として得られる信号のユーザに対する知覚性を可能にすることなく、可能な限り大きく増大されるかもしれない。

本発明の好適な特徴によると、変更された信号を生成する手段は、歪みｗ_ｊを実質的に

（ただし、ｓ_ｊは前記メディア信号のサンプルｊであり、Ｄは量子化間隔であり、ｖ_ｊはサンプルｊに対するディザ値であり、ｂ_ｊは前記補助情報のビットｊである）として決定するよう動作可能である。これは、高性能による複雑さの低い実現を提供する。

本発明の好適な特徴によると、出力信号を生成する手段は、信号を有する出力信号ｓ_{ｏｕｔ，ｊ}を実質的に

（ただし、ｓ_ｊはメディア信号のサンプルｊであり、ｗ_ｊはメディア信号の量子化インデックス変調によって決定されるサンプルｊに対する歪みであり、αは歪み補償パラメータである）として決定するよう動作可能であり、出力信号を生成する手段は、知覚特性に応答して、歪み補償パラメータαを変更するよう動作可能である。

これは、歪みの強度を実現、解析及び／又は制御するための特にシンプルな技術を提供する。

本発明の好適な特徴によると、メディア信号は視覚信号であり、知覚特性は、画像領域のテクスチャレベルの指標である。視覚信号は、例えば、映像信号又は画像ファイルなどであるかもしれない。好ましくは、テクスチャレベルの増大に対して、強度は増大される。メディア信号に対する歪みの知覚性は、典型的には、テクスチャレベルの増大に対して向上し、当該特徴は、これが知覚不能性と検出パフォーマンスとの間のトレードオフを向上するのに利用することを可能にする。

本発明の好適な特徴によると、メディア信号は音声信号であり、知覚特性は、音声セグメントの音声レベルの指標である。音声信号は、例えば、デジタル符号化音楽信号などであるかもしれない。好ましくは、強度は、音声レベルの増大に対して向上するであろう。音声メディア信号に対する歪みの知覚性は、典型的には、音声レベルの増大に対して向上し、当該特徴は、これが知覚不能性と検出パフォーマンスとの間のトレードオフを向上するのに利用することを可能にする。

本発明の好適な特徴によると、知覚特性を生成する手段は、ラプラシアンフィルタを有する知覚モデルに応答して、知覚特性を生成するよう動作可能である。これは、多数のタイプのメディア信号に対する歪みの強度を制御するのに有用な知覚特性を決定する適切な方法を提供する。

本発明の好適な特徴によると、知覚特性を生成する手段は、ＧｉｒｏｄのＷモデルを有する知覚モデルに応答して、知覚特性を生成するよう動作可能である。これは、多数のタイプのメディア信号に対する歪みの強度を制御するのに有用な知覚特性を決定する適切な方法を提供する。

本発明の第２の特徴によると、補助情報をメディア信号に埋め込む方法であって、前記メディア信号の量子化インデックス変調によって、前記補助情報に応じた前記メディア信号に対する歪みを有する変更された信号を生成するステップと、前記歪みに対する前記メディア信号の知覚感度を示す知覚特性を生成するステップと、前記知覚特性に応答して、前記変更された信号の歪みの強度を変更することによって出力信号を生成するステップとを有することを特徴とする方法が提供される。

本発明の上記及び他の特徴及び効果は、以下に記載される実施例を参照して明らかとなるであろう。

以下の記載は、デジタル透かしをデジタル符号化されたオーディオビジュアル信号に埋め込むことに適用可能な本発明の実施例に着目している。

図１は、本発明の実施例による透かしを埋め込むための装置のブロック図である。

本例では、当該装置は、メディア信号を生成するローカル信号ソース１０１を有する。メディア信号は、例えば、デジタル符号化されたビデオ及び／又はオーディオクリップからなるデータファイルであってもよい。他の実施例では、メディア信号は、外部ソースなどの他のソースから受信されてもよいということは理解されるであろう。また、メディア信号は、何れか適切な形式を有し、例えば、ストリーミング信号であってもよいということは理解されるであろう。

ローカル信号ソース１０１は、メディア信号が供給される量子化インデックス変調装置１０３に接続されている。特に、量子化インデックス変調装置１０３には、以降においてｓ_ｊ（ｊは、サンプル番号を示す）により示されるいくつかのサンプルとしてメディア信号が供給される。

量子化インデックス変調装置１０３は、補助情報のサンプルｂ_ｊを埋め込み、これにより、メディア信号の量子化インデックス変調により変更された信号を生成するよう動作可能である。従って、メディア信号に対して歪みを有する変更された信号

が、生成される。この湯が意味は、補助情報に依存するであろう。しかしながら、ノイズ付加的透かし技術と対照的に、歪みは補助情報には直接的には対応しないが、補助情報はメディア信号に適応される量子化と、従って、信号と歪みの組み合わせにより構成される。

より詳細には、例えば、量子化インデックス変調は、信号サンプル値のスカラー量子化を検討することによって最も容易に理解されうる。量子化インターバルＤが選択され、以下のように２つのコードセットＣ_０及びＣ_１を構成するのに利用される。セットＣ_０は、Ｄのすべての偶数の倍数から構成され、セットＣ_１は、Ｄのすべての奇数の倍数から構成される。それの最もシンプルな形式では、長さｋの信号ｓ＝（ｓ_１，ｓ_２，．．．，ｓ_ｋ）を長さｋのビット文字列（透かし）ｂ＝（ｂ_１，ｂ_２，．．．，ｂ_ｋ）により透かし処理することは、各ｊに対して、ｂ_ｊ＝０であるときは、ｓ_ｊを最も近い偶数の倍数に丸め込み、ｂ_ｊ＝１であるときは、ｓ_ｊを最も近い奇数の倍数に丸め込むことによって実現される。従って、量子化インデックス変調は、入力サンプルｓ_ｊを透かしビットｂ_ｊに依存する変更された出力サンプル

に変換する。

ビット文字列ｂは、結果として得られる信号をＤによるグリッドに丸め込み、この丸め込みによりＤの偶数の倍数の値が生じる場合にはビット値を０に設定し、丸め込みによりＤの偶数の倍数の値が生じる場合にはビット値を１に設定することによって復元することが可能である。

多くの実際的なシステムでは、信号サンプルは、セキュリティを向上させ、導入された量子化ノイズを拡散及びランダム化するため、ディザ値ｖ_ｊを各サンプルに加えることによってディザ処理される。ディザ値ｖ_ｊは、好ましくは実数である。これは、サンプル

が常にＤによるグリッド上に存在することを妨げ、これにより、透かしの有無が不明りょうとなる。

具体的には、量子化インデックス変調装置１０３は、「ディザ処理一様スカラー量子化」として知られる以下の処理を実行するようにしてもよい。

ディザ値ｖ_ｊは、量子化ステップの分数値として表され、特に−１＜ｖ_ｊ＜１とされる。与えられたオフセットｖ_ｊに対して、出力サンプル

が想定可能な離散レベルは、

である。ただし、ｍは整数値である。

出力値

は、入力値ｓ_ｊに対して可能な限り近接している必要がある。これは、

として表すことができる。この条件は、

を設定することによって満たされる。（１）に（５）を代入すると、

が得られる。

式６は、以下のように解釈されるかもしれない。まず、サンプル値ｓ_ｊに対して、「量子化インデックス」ｓ_ｊ／Ｄが計算される。次に、この量子化インデックスは、ｂ_ｊが０か１かに応じて、偶数又は奇数の整数値のセット（ｖ_ｊによりオフセットされた）に対応するシフトされたものに丸め込まれる。従って、ｂ_ｊの値に応じて、量子化インデックス変調信号は、２つの異なるサブセット上に存在することとなる。最後に、この結果は、サンプル値ｓ_ｊのもとのスケールを復元するため、Ｄと乗算される。

従って、説明された実施例では、量子化インデックス変調装置１０３は、変更された信号

を生成する。この変更された信号は、

により与えられるもとの信号ｓ_ｊに関する歪みｗ_ｊを有する。

従って、この歪みは、透かしデータに依存する。しかしながら、典型的なノイズ付加的透かし処理と対照的に、この歪みは、直接的には透かしと相関するものでない。むしろ、透かし情報は、信号と歪みの組み合わせにより構成される。

量子化インデックス変調は、必ずしもバイナリデータシンボルに限定されるものではなく、より高いオーダのデータシンボルに適用可能であるということは理解されるであろう。

当該技術分野では周知のように、量子化インデックス変調により埋め込まれる情報の検出は、量子化インデックスを計算し、ディザ値を考慮し、量子化インデックスのパリティをチェックすることによって実行されてもよい。バイナリのケースでは、透かし検出装置は、透かしのビット値

を

から単に計算するようにしてもよい。

変更されたメディア信号に与えられるユーザに対する透かしの影響及び知覚性を変えるため、歪み補償が適用されるようにしてもよい。従って、図１の装置は、変更された信号の歪みの強さを変更することによって、出力信号を生成する補償プロセッサ１０５を有する。

特に、補償プロセッサ１０５は、

によって与えられる出力信号ｓ_ｏｕｔを生成する。ここで、ｓ_ｊはメディア信号のサンプルｊであり、ｗ_ｊは量子化インデックス変調装置１０３によって決定されるサンプルｊに対する歪みである。従って説明される実施例では、歪みｗは、歪み補償パラメータαによってスケーリングされる。

従って、量子化インデックス変調装置１０３によって導入される歪みｗは、もとのサンプルと透かし処理されたサンプルとの間の差分とみなすことができ、ｗは、量子化インデックス変調装置１０３によって導入されるエラー又は変更として解釈することが可能である。歪み補償パラメータαの追加的パラメータは、変更の大きさ又は強度を制御するのに利用されてもよい。α＝１の歪みパラメータ値は、もとの量子化インデックス変調に対応し、α＝０に対して、もとのメディア信号に対する変更はなされない。

図１の実施例では、補償プロセッサ１０５は、信号ソース１０１からもとの信号ｓ_ｊを、量子化インデックス変調装置１０３から変更された信号

を受け付ける。その後、それは各サンプルに対して歪みｗ_ｊを計算し、この歪みと歪み補償パラメータαとを乗算し、この結果をもとの信号ｓ_ｊに加える。従って、補償プロセッサ１０５は、

の演算を実行することによって、変更された信号の歪みの強さを変更することによって、出力信号を生成する。

歪み補償が異なる透かし検出アルゴリズムを要求せず、同一の検出装置が歪み補償パラメータαの値とは独立に利用可能であるということが理解されるであろう。

説明された実施例によると、図１の装置はさらに、知覚プロセッサ１０７を有する。知覚プロセッサ１０７は、歪みに対するメディア信号の知覚的影響を示す知覚特性を生成する。特に、知覚プロセッサ１０７は、もとのメディア信号に対する歪み又は変更がどの程度顕著なものであるかユーザに示す知覚特性を決定するようにしてもよい。例えば、映像信号については、知覚特性は、視覚的に顕著にある歪みに対してメディア信号がどの程度影響を受けるか示すものであってもよい。

図１の装置では、知覚プロセッサ１０７は、補償プロセッサ１０５に接続され、歪み補償パラメータαを制御するよう動作可能である。従って、変更された信号の歪みの強さは、知覚特性に応答して制御される。

これは、歪みが信号特性に対して最適化されることを可能にし、特に、歪みの知覚不能性と埋め込まれた透かしの検出信頼性との間のトレードオフを向上させる。

好ましくは、歪みの強さは、知覚感度の低下に対して増大される。従って、歪みがあまり顕著でないとき、歪み補償パラメータαは増大され、透かし埋め込みが許容されない品質劣化を生じさせないことを保証しながら、検出信頼性を向上させる。知覚感度が増大すると、より小さな歪みでも顕著なものとなる可能性があり、従って、歪み補償パラメータαは低下し、これにより、品質劣化が許容できないものとはならないことが保証される。

説明された実施例では、知覚プロセッサ１０７は、知覚特性を決定するため、メディア信号を処理する知覚モデルを実現する。この知覚モデルは、好ましくはローカルな知覚感度を示すローカルな知覚特性を生成する。特に、各サンプルに対して、当該サンプルの周囲のサンプルグループの特性に基づき、知覚特性が生成されるようにしてもよい。

映像アプリケーションに対する具体例として、知覚プロセッサ１０７は、ラプラシアンフィルタから構成される知覚モデルを実現するものであってもよい。ラプラシアンフィルタは、画像又は映像フレーム内のある領域がフラットであるか、又はテクスチャ化されているか示す信号を生成するハイパスフィルタである。小さな歪みでさえ容易に視認できるフラット領域では、フィルタは弱いレスポンスを有するであろう。歪みがあまり視認されないテクスチャ化された領域では、フィルタは強いレスポンスを有する。従って、ラプラシアンフィルタの出力は、知覚感度を示し。歪み補償パラメータαを制御するのに利用可能である。

従って、説明された実施例は、高性能な透かし処理アルゴリズムの量子化インデックス変調の利用と知覚評価を組み合わせる方法を提供する。知覚モデルの結果に基づき、歪み補償パラメータαは、デフォルト値に対して増大されたり（知覚モデルが、比較的大きな変更が知覚不能であることを示すとき）、減少される（知覚モデルが、知覚不能性を保証するため小さな変更が必要とされることを示すとき）。

数学用語では、ｓ_ｉを透かし処理される信号サンプルとし、（ｓ_ｉ−Ｎ，．．．，ｓ_ｉ＋Ｍ）をｓ_ｉの環境におけるサンプルとする。視覚的モデルが、大きな歪みが依然として知覚不能であるときには大きな値を返し、歪みが知覚不能となるよう小さなものでなければならないときには小さな値を返すと仮定する。Ｐ（ｓ_ｋ−Ｎ，．．．，ｓ_ｋ＋Ｍ）を知覚モデルとし、ｇ（）を区間［０，１］の値をとる適切に選択された単調増加関数とする。このとき、知覚適応的埋め込みは、

となるかもしれず、ｗ_ｉは式（７）と同様に定義される。

知覚モデルＰとしてラプラシアンフィルタと以下の項のリニア関数ｇ（ｚ）＝γｚ＋ｂを利用したグレイスケール画像の透かし処理の具体例が、歪み補償パラメータａ_ｒ，ｃを決定するのに利用可能である。

知覚特性を決定する他の手段が利用可能であり、特に他の知覚モデルが代わりに、又は追加的に利用可能であるということは理解されるであろう。

例えば、知覚プロセッサ１０７は、ＧｉｒｏｄのＷモデルから構成される知覚モデルに応答して、知覚特性を生成するようにしてもよい。

このモデルは、（一様な）バックグラウンド輝度の関数として“ｊｕｓｔ−ｎｏｔ−ｎｏｔｉｃｅａｂｌｅ”ノイズの量を推定する。それは、２つの刺激の間の最小の知覚可能な相違がこれらの刺激の強さに比例することを述べるＷｅｂｅｒの法則の適応化である。ＧｉｒｏｄのＷモデルに関するさらなる情報は、例えば、ＢｅｒｎｄＧｉｒｏｄによる“Ｈｕｍａｎｖｉｓｉｏｎ，Ｖｉｓｕａｌｐｒｏｃｅｓｓｉｎｇａｎｄｄｉｇｉｔａｌｄｉｓｐｌａｙ”（ＰｒｏｃｅｅｄｉｎｇｓｏｆＳＰＩＥ（光学技術者のための国際学会），ｖｏｌｕｍｅ１０７７，ｐａｇｅｓ１７８−１８７，１９８９）の“Ｔｈｅｉｎｆｏｒｍａｔｉｏｎｔｈｅｏｒｅｔｉｃａｌｓｉｇｎｉｆｉｃａｎｃｅｏｆｓｐａｔｉａｌａｎｄｔｅｍｐｏｒａｌｍａｓｋｉｎｇｉｎｖｉｄｅｏｓｉｇｎａｌｓ”に見つけることができる。

また、本発明はビジュアル信号に限定されるものでなく、多数の異なるタイプのメディア信号に適用可能であるということが理解されるであろう。例えば、メディア信号は、デジタルサンプリング及びＰＣＭ（ＰｕｌｓｅＣｏｄｅＭｏｄｕｌａｔｉｏｎ）符号化オーディオクリップなどの音声信号であってもよい。この例では、知覚特性は、音声の音声レベルの指標であってもよく、歪み補償パラメータαは、歪みがリスナーに顕著にならないより高い信号値に音声レベルが対応するため、音声レベルの増大に対して増大されてもよい。

本発明は、ハードウェア、ソフトウェア、ファームウェア又は上記の何れかの組み合わせを含む何れか適切な形式により実現可能である。しかしながら、好ましくは、本発明は、１以上のデータプロセッサ及び／又はデジタル信号プロセッサ上で実行されるコンピュータソフトウェアとして実現される。本発明の実施例の要素及びコンポーネントは、何れか適切な方法により物理的、機能的及び論理的に実現されてもよい。実際、当該機能は、単一のユニットにより、複数のユニットにより又は他の機能ユニットの一部として実現されてもよい。また、本発明は、単一のユニットにより実現されてもよく、あるいは、異なるユニットとプロセッサの間に物理的及び機能的に分散化されてもよい。

本発明が好適な実施例に関して説明されたが、それはここで与えられた具体的形式に限定されることを意図するものではない。むしろ、本発明の範囲は、添付した請求項によってのみ限定されるものである。請求項では、「有する」という用語は、他の要素又はステップの存在を排除するものではない。さらに、個別に列挙されるが、複数の手段、要素又は方法ステップは、単一のユニット又はプロセッサなどによって実現されてもよい。さらに、各特徴は異なる請求項に含まれてもよいが、これらはおそらく効果的に組み合わされてもよく、異なる請求項に包含することは、特徴の組み合わせが実現可能及び／又は効果的でないことを意味するものではない。さらに、単数形による表現は複数を排除するものではない。従って、「ある」、「第１の」、「第２の」などの表現は、複数を排除するものではない。請求項における参照符号は、単に明示的な例として与えられているものであり、請求項の範囲を何れかの方法により限定するものとして解釈されるべきでない。

図１は、本発明の実施例による透かしを埋め込む装置のブロック図である。

Claims

補助情報をメディア信号に埋め込む装置であって、
前記メディア信号の量子化インデックス変調によって、前記補助情報に応じた前記メディア信号に対する歪みを有する変更された信号を生成する手段と、
前記歪みに対する前記メディア信号の知覚感度を示す知覚特性を生成する手段と、
前記知覚特性に応答して、前記変更された信号の歪みの強度を変更することによって出力信号を生成する手段と、
を有することを特徴とする装置。
請求項１記載の装置であって、
前記出力信号を生成する手段は、歪み補償パラメータを変更することによって、前記強度を変更するよう動作可能であることを特徴とする装置。
請求項１記載の装置であって、
前記出力信号を生成する手段は、歪みに対するローカルな前記メディア信号のローカルな知覚感度に応答して、前記歪みの強度を動的に調整するよう動作可能であることを特徴とする装置。
請求項１記載の装置であって、
前記出力信号を生成する手段は、前記知覚特性に応答して、前記歪みをスケーリングするよう動作可能であることを特徴とする装置。
請求項１記載の装置であって、
前記出力信号を生成する手段は、減少する知覚感度に対して前記強度を増大させるよう動作可能であることを特徴とする装置。
請求項１記載の装置であって、
前記変更された信号を精製する手段は、前記歪みｗ_ｊを実質的に

（ただし、ｓ_ｊは前記メディア信号のサンプルｊであり、Ｄは量子化間隔であり、ｖ_ｊはサンプルｊに対するディザ値であり、ｂ_ｊは前記補助情報のビットｊである）として決定するよう動作可能であることを特徴とする装置。
請求項１記載の装置であって、
前記出力信号を生成する手段は、前記信号を有する前記出力信号ｓ_{ｏｕｔ，ｊ}を実質的に

（ただし、ｓ_ｊは前記メディア信号のサンプルｊであり、ｗ_ｊは前記メディア信号の量子化インデックス変調によって決定されるサンプルｊに対する歪みであり、αは歪み補償パラメータである）として決定するよう動作可能であり、
前記出力信号を生成する手段は、前記知覚特性に応答して、前記歪み補償パラメータαを変更するよう動作可能である、
ことを特徴とする装置。
請求項１記載の装置であって、
前記メディア信号は、視覚信号であり、
前記知覚特性は、画像領域のテクスチャレベルの指標である、
ことを特徴とする装置。
請求項１記載の装置であって、
前記メディア信号は、音声信号であり、
前記知覚特性は、音声セグメントの音声レベルの指標である、
ことを特徴とする装置。
請求項１記載の装置であって、
前記知覚特性を生成する手段は、ラプラシアンフィルタを有する知覚モデルに応答して、前記知覚特性を生成するよう動作可能であることを特徴とする装置。
請求項１記載の装置であって、
前記知覚特性を生成する手段は、ＧｉｒｏｄのＷモデルを有する知覚モデルに応答して、前記知覚特性を生成するよう動作可能であることを特徴とする装置。
補助情報をメディア信号に埋め込む方法であって、
前記メディア信号の量子化インデックス変調によって、前記補助情報に応じた前記メディア信号に対する歪みを有する変更された信号を生成するステップと、
前記歪みに対する前記メディア信号の知覚感度を示す知覚特性を生成するステップと、
前記知覚特性に応答して、前記変更された信号の歪みの強度を変更することによって出力信号を生成するステップと、
を有することを特徴とする方法。
請求項１２記載の方法を実行可能なコンピュータプログラム。
請求項１３記載のコンピュータプログラムを有する記録キャリア。