JP2008502194A - 補助情報をメディア信号に埋め込む方法及び装置 - Google Patents
補助情報をメディア信号に埋め込む方法及び装置 Download PDFInfo
- Publication number
- JP2008502194A JP2008502194A JP2007514301A JP2007514301A JP2008502194A JP 2008502194 A JP2008502194 A JP 2008502194A JP 2007514301 A JP2007514301 A JP 2007514301A JP 2007514301 A JP2007514301 A JP 2007514301A JP 2008502194 A JP2008502194 A JP 2008502194A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- perceptual
- distortion
- generating
- media signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims description 18
- 238000013139 quantization Methods 0.000 claims abstract description 43
- 230000004044 response Effects 0.000 claims abstract description 21
- 230000008825 perceptual sensitivity Effects 0.000 claims abstract description 13
- 230000000007 visual effect Effects 0.000 claims abstract description 7
- 230000008859 change Effects 0.000 claims description 10
- 230000005236 sound signal Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims 2
- 238000007670 refining Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 15
- 230000008447 perception Effects 0.000 abstract 2
- 230000001419 dependent effect Effects 0.000 abstract 1
- 238000013459 approach Methods 0.000 description 4
- 230000001276 controlling effect Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本発明は、オーディオビジュアル信号などのメディア信号に補助情報を埋め込むシステムに関する。装置は、メディア信号の量子化インデックス変調によって変更された信号を生成する量子化インデックス変調装置を有する。変更された信号は、補助情報に応じたメディア信号に対する歪みを有する。装置はさらに、歪みに対するメディア信号の知覚感度を示す知覚特性を生成する知覚プロセッサを有する。量子化インデックス変調装置及び知覚プロセッサは、知覚特性に応答して変更された信号の歪みの強度を変更することによって、出力信号を生成する補償プロセッサに接続される。本発明は、透かし知覚不可能性と検出信頼性との間のトレードオフを向上させるため、知覚モデルと量子化インデックス変調透かし処理とを組み合わせる。
Description
本発明は、補助情報をメディア信号に埋め込む方法及び装置に関し、より詳細には、量子化インデックス変調を利用して補助情報をメディア信号に埋め込む方法及び装置に関する。
デジタル透かし処理は、オーディオビジュアルオブジェクトに補助情報を埋め込むことに関する。デジタル透かし処理は、複製(著作権)保護、ロイヤリティ追跡、商業的認証、付加価値コンテンツ、インタラクティブトイ及びさらに多くのものを含む多数のアプリケーションを有する。デジタル透かし処理に対する従来のアプローチは、本質的には制御されたノイズ付加であり、これにより、既知のノイズ類似信号がもとの信号に追加される。このような技術の一例は、拡散スペクトル透かし処理として知られている。追加的な透かしのための透かし検出は、一般に受信信号と基準透かしとの間の相関に基づく。結果として得られる相関値は、所望のタームと干渉タームから構成される。干渉タームは、ノイズ付加に基づく透かし技術が最適なパフォーマンス以下しか取得できない主たる理由となっている。
透かし処理の文献では、ますます多くの注目が、ホスト信号を透かし埋め込み装置のサイド情報として扱う透かし処理スキームに対して向けられている。
例えば、最近の刊行物は、特定の攻撃モデルを仮定すると、最適な透かし処理は量子化により実現可能であるということを示している。要約すると、量子化透かし処理は以下の通りである。ホスト信号sの空間Sにおいて、コードポイントCnのN個のセットが選択される。ただし、Nは埋め込まれるメッセージの個数に等しい(透かしのペイロード)。ホスト信号sを信号
QIMのさらなる詳細は、例えば、Chen,B.及びWornell,G.W.による“Quantization index modulation:a class of provably good methods for digital watermarking and information embedding”(Transactions on Information Theory,IEEE,Volume:47 Issue:4,May 2001,Pages:1423−1443)と、Chou,J.、Ramchandran,K.及びOrtega,A.による“Next generation techniques for robust and imperceptible audio data hiding”(IEEE International Conference on Acoustics,Speech,and Signal Processing,Proceedings,2001 Volume:3,Pages:1349−1352)に見つけることができるかもしれない。
通常、このアプローチから生じる実際的なスキームは、(ディザ)ベクトル量子化及び歪み補償に基づく。これら2つの技術の組み合わせは、多くの情報量の埋め込みを可能にする。これらの技術を利用したスキームは、通常、歪み補償量子化インデックス変調透かし処理(DC−QIM)と呼ばれている。
DC−QIMスキームによる問題は、ローカルな画像特性に適応することが比較的困難であるということである。特に、透かしの視認性を制御することが困難である。QIM透かしをローカルな信号特性に適応させる1つのアプローチは、特許協力条約(PCT)WO03/053064から知られている。WO03/053064は、透かしの視認性及びロウバスト性との間のトレードオフを向上させるための方法として、量子化ステップサイズのローカルな適応化を開示している。
QIM透かしの知覚性及び検出信頼性を制御する現在のアプローチは、単純なモデルを使用しており、特にホスト信号と透かしとの間のノイズレシオに対する信号の評価に基づく。このモデルは解析のため大変有用なものであるが、それは透かしの検出信頼性と知覚不能性との間の次善的なトレードオフをもたらす傾向がある。
従って、補助情報をメディア信号に埋め込む改良されたシステムが効果的であり、特に検出信頼性の向上、フレキシビリティの向上、実現容易性、知覚不能性の向上及び/又はパフォーマンス向上を可能にするシステムが効果的である。
従って、本発明は、好ましくは、上述した問題点の1以上を単独で又は何れかの組み合わせにより緩和、軽減又は解消しようとするものである。
本発明の第1の特徴によると、補助情報をメディア信号に埋め込む装置であって、前記メディア信号の量子化インデックス変調によって、前記補助情報に応じた前記メディア信号に対する歪みを有する変更された信号を生成する手段と、前記歪みに対する前記メディア信号の知覚感度を示す知覚特性を生成する手段と、前記知覚特性に応答して、前記変更された信号の歪みの強度を変更することによって出力信号を生成する手段とを有することを特徴とする装置が提供される。
本発明の発明者は、知覚特性に応答して量子化インデックス変調によって導入された歪みの強度を変更することによって、量子化インデックス変調のパフォーマンスの向上が実現可能であることを理解していた。パフォーマンスの向上が実現され、特に、歪みの知覚可能性が低減され、及び/又は補助情報の検出信頼性が増大されるかもしれない。
メディア信号は、例えば、音声及び/又は映像信号であってもよい。メディア信号は、例えば、ストリーミング信号であってもよいし、あるいはデジタルデータを有するファイルであってもよい。補助情報は、特にデジタル透かしであってもよい。知覚特性は、メディア信号と変更された信号との間のユーザに対する知覚的な相違を示す特性であってもよい。
本発明の好適な特徴によると、歪みの強度は、歪み補償パラメータを変更することによって強度を変更するよう動作可能である。これは、特に効果的なパフォーマンスを提供する。あるいは、又は加えて、歪みの強度を変更するシンプル、効率的及び/又はフレキシブルな手段が実現されるとき、実現が容易になるかもしれない。特に、この特徴は量子化インデックス変調の既存の方法に適したものとなるかもしれない。
本発明の好適な特徴によると、歪みの強度を変更する手段は、歪みにローカルなメディア信号のローカルな知覚感度に応答して、歪みの強度を動的に調整するよう動作可能である。
この強度は、好ましくは、現在変更されたメディア信号の一部の具体的に状態を反映するよう動的に制御される。従って、知覚不能性と検出信頼性との間のトレードオフは、信号の変化する特性を反映するよう動的に最適化されるようにしてもよい。
本発明の好適な特徴によると、出力信号を生成する手段は、知覚特性に応答して、歪みをスケーリングするよう動作可能である。これは、強度を変更する効果的な方法を提供し、シンプルかつ実際的な実現を可能にするかもしれない。
本発明の好適な特徴によると、出力信号を生成する手段は、減少する知覚感度に対して強度を増大させるよう動作可能である。これは、歪みの知覚不能性と補助情報の検出信頼性との間のトレードオフを向上させる。特に、強度は、歪みを結果として得られる信号のユーザに対する知覚性を可能にすることなく、可能な限り大きく増大されるかもしれない。
本発明の好適な特徴によると、変更された信号を生成する手段は、歪みwjを実質的に
本発明の好適な特徴によると、出力信号を生成する手段は、信号を有する出力信号sout,jを実質的に
これは、歪みの強度を実現、解析及び/又は制御するための特にシンプルな技術を提供する。
本発明の好適な特徴によると、メディア信号は視覚信号であり、知覚特性は、画像領域のテクスチャレベルの指標である。視覚信号は、例えば、映像信号又は画像ファイルなどであるかもしれない。好ましくは、テクスチャレベルの増大に対して、強度は増大される。メディア信号に対する歪みの知覚性は、典型的には、テクスチャレベルの増大に対して向上し、当該特徴は、これが知覚不能性と検出パフォーマンスとの間のトレードオフを向上するのに利用することを可能にする。
本発明の好適な特徴によると、メディア信号は音声信号であり、知覚特性は、音声セグメントの音声レベルの指標である。音声信号は、例えば、デジタル符号化音楽信号などであるかもしれない。好ましくは、強度は、音声レベルの増大に対して向上するであろう。音声メディア信号に対する歪みの知覚性は、典型的には、音声レベルの増大に対して向上し、当該特徴は、これが知覚不能性と検出パフォーマンスとの間のトレードオフを向上するのに利用することを可能にする。
本発明の好適な特徴によると、知覚特性を生成する手段は、ラプラシアンフィルタを有する知覚モデルに応答して、知覚特性を生成するよう動作可能である。これは、多数のタイプのメディア信号に対する歪みの強度を制御するのに有用な知覚特性を決定する適切な方法を提供する。
本発明の好適な特徴によると、知覚特性を生成する手段は、GirodのWモデルを有する知覚モデルに応答して、知覚特性を生成するよう動作可能である。これは、多数のタイプのメディア信号に対する歪みの強度を制御するのに有用な知覚特性を決定する適切な方法を提供する。
本発明の第2の特徴によると、補助情報をメディア信号に埋め込む方法であって、前記メディア信号の量子化インデックス変調によって、前記補助情報に応じた前記メディア信号に対する歪みを有する変更された信号を生成するステップと、前記歪みに対する前記メディア信号の知覚感度を示す知覚特性を生成するステップと、前記知覚特性に応答して、前記変更された信号の歪みの強度を変更することによって出力信号を生成するステップとを有することを特徴とする方法が提供される。
本発明の上記及び他の特徴及び効果は、以下に記載される実施例を参照して明らかとなるであろう。
以下の記載は、デジタル透かしをデジタル符号化されたオーディオビジュアル信号に埋め込むことに適用可能な本発明の実施例に着目している。
図1は、本発明の実施例による透かしを埋め込むための装置のブロック図である。
本例では、当該装置は、メディア信号を生成するローカル信号ソース101を有する。メディア信号は、例えば、デジタル符号化されたビデオ及び/又はオーディオクリップからなるデータファイルであってもよい。他の実施例では、メディア信号は、外部ソースなどの他のソースから受信されてもよいということは理解されるであろう。また、メディア信号は、何れか適切な形式を有し、例えば、ストリーミング信号であってもよいということは理解されるであろう。
ローカル信号ソース101は、メディア信号が供給される量子化インデックス変調装置103に接続されている。特に、量子化インデックス変調装置103には、以降においてsj(jは、サンプル番号を示す)により示されるいくつかのサンプルとしてメディア信号が供給される。
量子化インデックス変調装置103は、補助情報のサンプルbjを埋め込み、これにより、メディア信号の量子化インデックス変調により変更された信号を生成するよう動作可能である。従って、メディア信号に対して歪みを有する変更された信号
より詳細には、例えば、量子化インデックス変調は、信号サンプル値のスカラー量子化を検討することによって最も容易に理解されうる。量子化インターバルDが選択され、以下のように2つのコードセットC0及びC1を構成するのに利用される。セットC0は、Dのすべての偶数の倍数から構成され、セットC1は、Dのすべての奇数の倍数から構成される。それの最もシンプルな形式では、長さkの信号s=(s1,s2,...,sk)を長さkのビット文字列(透かし)b=(b1,b2,...,bk)により透かし処理することは、各jに対して、bj=0であるときは、sjを最も近い偶数の倍数に丸め込み、bj=1であるときは、sjを最も近い奇数の倍数に丸め込むことによって実現される。従って、量子化インデックス変調は、入力サンプルsjを透かしビットbjに依存する変更された出力サンプル
ビット文字列bは、結果として得られる信号をDによるグリッドに丸め込み、この丸め込みによりDの偶数の倍数の値が生じる場合にはビット値を0に設定し、丸め込みによりDの偶数の倍数の値が生じる場合にはビット値を1に設定することによって復元することが可能である。
多くの実際的なシステムでは、信号サンプルは、セキュリティを向上させ、導入された量子化ノイズを拡散及びランダム化するため、ディザ値vjを各サンプルに加えることによってディザ処理される。ディザ値vjは、好ましくは実数である。これは、サンプル
具体的には、量子化インデックス変調装置103は、「ディザ処理一様スカラー量子化」として知られる以下の処理を実行するようにしてもよい。
ディザ値vjは、量子化ステップの分数値として表され、特に−1<vj<1とされる。与えられたオフセットvjに対して、出力サンプル
出力値
式6は、以下のように解釈されるかもしれない。まず、サンプル値sjに対して、「量子化インデックス」sj/Dが計算される。次に、この量子化インデックスは、bjが0か1かに応じて、偶数又は奇数の整数値のセット(vjによりオフセットされた)に対応するシフトされたものに丸め込まれる。従って、bjの値に応じて、量子化インデックス変調信号は、2つの異なるサブセット上に存在することとなる。最後に、この結果は、サンプル値sjのもとのスケールを復元するため、Dと乗算される。
従って、説明された実施例では、量子化インデックス変調装置103は、変更された信号
従って、この歪みは、透かしデータに依存する。しかしながら、典型的なノイズ付加的透かし処理と対照的に、この歪みは、直接的には透かしと相関するものでない。むしろ、透かし情報は、信号と歪みの組み合わせにより構成される。
量子化インデックス変調は、必ずしもバイナリデータシンボルに限定されるものではなく、より高いオーダのデータシンボルに適用可能であるということは理解されるであろう。
当該技術分野では周知のように、量子化インデックス変調により埋め込まれる情報の検出は、量子化インデックスを計算し、ディザ値を考慮し、量子化インデックスのパリティをチェックすることによって実行されてもよい。バイナリのケースでは、透かし検出装置は、透かしのビット値
変更されたメディア信号に与えられるユーザに対する透かしの影響及び知覚性を変えるため、歪み補償が適用されるようにしてもよい。従って、図1の装置は、変更された信号の歪みの強さを変更することによって、出力信号を生成する補償プロセッサ105を有する。
特に、補償プロセッサ105は、
従って、量子化インデックス変調装置103によって導入される歪みwは、もとのサンプルと透かし処理されたサンプルとの間の差分とみなすことができ、wは、量子化インデックス変調装置103によって導入されるエラー又は変更として解釈することが可能である。歪み補償パラメータαの追加的パラメータは、変更の大きさ又は強度を制御するのに利用されてもよい。α=1の歪みパラメータ値は、もとの量子化インデックス変調に対応し、α=0に対して、もとのメディア信号に対する変更はなされない。
図1の実施例では、補償プロセッサ105は、信号ソース101からもとの信号sjを、量子化インデックス変調装置103から変更された信号
歪み補償が異なる透かし検出アルゴリズムを要求せず、同一の検出装置が歪み補償パラメータαの値とは独立に利用可能であるということが理解されるであろう。
説明された実施例によると、図1の装置はさらに、知覚プロセッサ107を有する。知覚プロセッサ107は、歪みに対するメディア信号の知覚的影響を示す知覚特性を生成する。特に、知覚プロセッサ107は、もとのメディア信号に対する歪み又は変更がどの程度顕著なものであるかユーザに示す知覚特性を決定するようにしてもよい。例えば、映像信号については、知覚特性は、視覚的に顕著にある歪みに対してメディア信号がどの程度影響を受けるか示すものであってもよい。
図1の装置では、知覚プロセッサ107は、補償プロセッサ105に接続され、歪み補償パラメータαを制御するよう動作可能である。従って、変更された信号の歪みの強さは、知覚特性に応答して制御される。
これは、歪みが信号特性に対して最適化されることを可能にし、特に、歪みの知覚不能性と埋め込まれた透かしの検出信頼性との間のトレードオフを向上させる。
好ましくは、歪みの強さは、知覚感度の低下に対して増大される。従って、歪みがあまり顕著でないとき、歪み補償パラメータαは増大され、透かし埋め込みが許容されない品質劣化を生じさせないことを保証しながら、検出信頼性を向上させる。知覚感度が増大すると、より小さな歪みでも顕著なものとなる可能性があり、従って、歪み補償パラメータαは低下し、これにより、品質劣化が許容できないものとはならないことが保証される。
説明された実施例では、知覚プロセッサ107は、知覚特性を決定するため、メディア信号を処理する知覚モデルを実現する。この知覚モデルは、好ましくはローカルな知覚感度を示すローカルな知覚特性を生成する。特に、各サンプルに対して、当該サンプルの周囲のサンプルグループの特性に基づき、知覚特性が生成されるようにしてもよい。
映像アプリケーションに対する具体例として、知覚プロセッサ107は、ラプラシアンフィルタから構成される知覚モデルを実現するものであってもよい。ラプラシアンフィルタは、画像又は映像フレーム内のある領域がフラットであるか、又はテクスチャ化されているか示す信号を生成するハイパスフィルタである。小さな歪みでさえ容易に視認できるフラット領域では、フィルタは弱いレスポンスを有するであろう。歪みがあまり視認されないテクスチャ化された領域では、フィルタは強いレスポンスを有する。従って、ラプラシアンフィルタの出力は、知覚感度を示し。歪み補償パラメータαを制御するのに利用可能である。
従って、説明された実施例は、高性能な透かし処理アルゴリズムの量子化インデックス変調の利用と知覚評価を組み合わせる方法を提供する。知覚モデルの結果に基づき、歪み補償パラメータαは、デフォルト値に対して増大されたり(知覚モデルが、比較的大きな変更が知覚不能であることを示すとき)、減少される(知覚モデルが、知覚不能性を保証するため小さな変更が必要とされることを示すとき)。
数学用語では、siを透かし処理される信号サンプルとし、(si−N,...,si+M)をsiの環境におけるサンプルとする。視覚的モデルが、大きな歪みが依然として知覚不能であるときには大きな値を返し、歪みが知覚不能となるよう小さなものでなければならないときには小さな値を返すと仮定する。P(sk−N,...,sk+M)を知覚モデルとし、g()を区間[0,1]の値をとる適切に選択された単調増加関数とする。このとき、知覚適応的埋め込みは、
知覚モデルPとしてラプラシアンフィルタと以下の項のリニア関数g(z)=γz+bを利用したグレイスケール画像の透かし処理の具体例が、歪み補償パラメータar,cを決定するのに利用可能である。
例えば、知覚プロセッサ107は、GirodのWモデルから構成される知覚モデルに応答して、知覚特性を生成するようにしてもよい。
このモデルは、(一様な)バックグラウンド輝度の関数として“just−not−noticeable”ノイズの量を推定する。それは、2つの刺激の間の最小の知覚可能な相違がこれらの刺激の強さに比例することを述べるWeberの法則の適応化である。GirodのWモデルに関するさらなる情報は、例えば、Bernd Girodによる“Human vision,Visual processing and digital display”(Proceedings of SPIE(光学技術者のための国際学会),volume 1077,pages178−187,1989)の“The information theoretical significance of spatial and temporal masking in video signals”に見つけることができる。
また、本発明はビジュアル信号に限定されるものでなく、多数の異なるタイプのメディア信号に適用可能であるということが理解されるであろう。例えば、メディア信号は、デジタルサンプリング及びPCM(Pulse Code Modulation)符号化オーディオクリップなどの音声信号であってもよい。この例では、知覚特性は、音声の音声レベルの指標であってもよく、歪み補償パラメータαは、歪みがリスナーに顕著にならないより高い信号値に音声レベルが対応するため、音声レベルの増大に対して増大されてもよい。
本発明は、ハードウェア、ソフトウェア、ファームウェア又は上記の何れかの組み合わせを含む何れか適切な形式により実現可能である。しかしながら、好ましくは、本発明は、1以上のデータプロセッサ及び/又はデジタル信号プロセッサ上で実行されるコンピュータソフトウェアとして実現される。本発明の実施例の要素及びコンポーネントは、何れか適切な方法により物理的、機能的及び論理的に実現されてもよい。実際、当該機能は、単一のユニットにより、複数のユニットにより又は他の機能ユニットの一部として実現されてもよい。また、本発明は、単一のユニットにより実現されてもよく、あるいは、異なるユニットとプロセッサの間に物理的及び機能的に分散化されてもよい。
本発明が好適な実施例に関して説明されたが、それはここで与えられた具体的形式に限定されることを意図するものではない。むしろ、本発明の範囲は、添付した請求項によってのみ限定されるものである。請求項では、「有する」という用語は、他の要素又はステップの存在を排除するものではない。さらに、個別に列挙されるが、複数の手段、要素又は方法ステップは、単一のユニット又はプロセッサなどによって実現されてもよい。さらに、各特徴は異なる請求項に含まれてもよいが、これらはおそらく効果的に組み合わされてもよく、異なる請求項に包含することは、特徴の組み合わせが実現可能及び/又は効果的でないことを意味するものではない。さらに、単数形による表現は複数を排除するものではない。従って、「ある」、「第1の」、「第2の」などの表現は、複数を排除するものではない。請求項における参照符号は、単に明示的な例として与えられているものであり、請求項の範囲を何れかの方法により限定するものとして解釈されるべきでない。
Claims (14)
- 補助情報をメディア信号に埋め込む装置であって、
前記メディア信号の量子化インデックス変調によって、前記補助情報に応じた前記メディア信号に対する歪みを有する変更された信号を生成する手段と、
前記歪みに対する前記メディア信号の知覚感度を示す知覚特性を生成する手段と、
前記知覚特性に応答して、前記変更された信号の歪みの強度を変更することによって出力信号を生成する手段と、
を有することを特徴とする装置。 - 請求項1記載の装置であって、
前記出力信号を生成する手段は、歪み補償パラメータを変更することによって、前記強度を変更するよう動作可能であることを特徴とする装置。 - 請求項1記載の装置であって、
前記出力信号を生成する手段は、歪みに対するローカルな前記メディア信号のローカルな知覚感度に応答して、前記歪みの強度を動的に調整するよう動作可能であることを特徴とする装置。 - 請求項1記載の装置であって、
前記出力信号を生成する手段は、前記知覚特性に応答して、前記歪みをスケーリングするよう動作可能であることを特徴とする装置。 - 請求項1記載の装置であって、
前記出力信号を生成する手段は、減少する知覚感度に対して前記強度を増大させるよう動作可能であることを特徴とする装置。 - 請求項1記載の装置であって、
前記メディア信号は、視覚信号であり、
前記知覚特性は、画像領域のテクスチャレベルの指標である、
ことを特徴とする装置。 - 請求項1記載の装置であって、
前記メディア信号は、音声信号であり、
前記知覚特性は、音声セグメントの音声レベルの指標である、
ことを特徴とする装置。 - 請求項1記載の装置であって、
前記知覚特性を生成する手段は、ラプラシアンフィルタを有する知覚モデルに応答して、前記知覚特性を生成するよう動作可能であることを特徴とする装置。 - 請求項1記載の装置であって、
前記知覚特性を生成する手段は、GirodのWモデルを有する知覚モデルに応答して、前記知覚特性を生成するよう動作可能であることを特徴とする装置。 - 補助情報をメディア信号に埋め込む方法であって、
前記メディア信号の量子化インデックス変調によって、前記補助情報に応じた前記メディア信号に対する歪みを有する変更された信号を生成するステップと、
前記歪みに対する前記メディア信号の知覚感度を示す知覚特性を生成するステップと、
前記知覚特性に応答して、前記変更された信号の歪みの強度を変更することによって出力信号を生成するステップと、
を有することを特徴とする方法。 - 請求項12記載の方法を実行可能なコンピュータプログラム。
- 請求項13記載のコンピュータプログラムを有する記録キャリア。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04102448 | 2004-06-02 | ||
PCT/IB2005/051754 WO2005119655A1 (en) | 2004-06-02 | 2005-05-30 | Method and apparatus for embedding auxiliary information in a media signal |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008502194A true JP2008502194A (ja) | 2008-01-24 |
Family
ID=34969887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007514301A Withdrawn JP2008502194A (ja) | 2004-06-02 | 2005-05-30 | 補助情報をメディア信号に埋め込む方法及び装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20080267412A1 (ja) |
EP (1) | EP1756805B1 (ja) |
JP (1) | JP2008502194A (ja) |
CN (1) | CN1961352A (ja) |
AT (1) | ATE403216T1 (ja) |
DE (1) | DE602005008594D1 (ja) |
TW (1) | TW200609903A (ja) |
WO (1) | WO2005119655A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014521112A (ja) * | 2011-07-08 | 2014-08-25 | トムソン ライセンシング | 入力信号に透かし入れするための量子化インデックス変調の方法および装置 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1837875A1 (en) * | 2006-03-22 | 2007-09-26 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for correlating two data sections |
JP5300741B2 (ja) * | 2007-01-12 | 2013-09-25 | シフォルーション ベー フェー | ビデオ透かし入れのための方法および装置 |
GB2452021B (en) | 2007-07-19 | 2012-03-14 | Vodafone Plc | identifying callers in telecommunication networks |
CN104781876B (zh) * | 2012-11-15 | 2017-07-21 | 株式会社Ntt都科摩 | 音频编码装置、音频编码方法以及音频解码装置、音频解码方法 |
GB2524784B (en) * | 2014-04-02 | 2018-01-03 | Law Malcolm | Transparent lossless audio watermarking |
KR102444017B1 (ko) | 2016-03-31 | 2022-09-19 | 다우 글로벌 테크놀로지스 엘엘씨 | Pvc-없는 마모층용 결정성 블록 복합체를 포함한 폴리올레핀 블렌드 |
WO2021056183A1 (en) * | 2019-09-24 | 2021-04-01 | Citrix Systems, Inc. | Watermarks for text content |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6614914B1 (en) * | 1995-05-08 | 2003-09-02 | Digimarc Corporation | Watermark embedder and reader |
US6901514B1 (en) * | 1999-06-01 | 2005-05-31 | Digital Video Express, L.P. | Secure oblivious watermarking using key-dependent mapping functions |
US7035473B1 (en) * | 2000-03-01 | 2006-04-25 | Sharp Laboratories Of America, Inc. | Distortion-adaptive visual frequency weighting |
US20020146149A1 (en) * | 2000-12-18 | 2002-10-10 | Brunk Hugh L. | Space filling quantizers for digital watermarking |
US7376242B2 (en) * | 2001-03-22 | 2008-05-20 | Digimarc Corporation | Quantization-based data embedding in mapped data |
KR20040066165A (ko) * | 2001-12-14 | 2004-07-23 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 멀티미디어 신호들의 양자화 인덱스 변조(큐아이엠)디지털 워터마킹 |
GB0211488D0 (en) * | 2002-05-18 | 2002-06-26 | Univ Aston | Information embedding method |
-
2005
- 2005-05-30 AT AT05748069T patent/ATE403216T1/de not_active IP Right Cessation
- 2005-05-30 DE DE602005008594T patent/DE602005008594D1/de not_active Expired - Fee Related
- 2005-05-30 US US11/569,972 patent/US20080267412A1/en not_active Abandoned
- 2005-05-30 JP JP2007514301A patent/JP2008502194A/ja not_active Withdrawn
- 2005-05-30 EP EP05748069A patent/EP1756805B1/en not_active Not-in-force
- 2005-05-30 WO PCT/IB2005/051754 patent/WO2005119655A1/en active IP Right Grant
- 2005-05-30 CN CNA2005800177829A patent/CN1961352A/zh active Pending
- 2005-05-31 TW TW094117890A patent/TW200609903A/zh unknown
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014521112A (ja) * | 2011-07-08 | 2014-08-25 | トムソン ライセンシング | 入力信号に透かし入れするための量子化インデックス変調の方法および装置 |
US10019997B2 (en) | 2011-07-08 | 2018-07-10 | Thomson Licensing | Method and apparatus for quantisation index modulation for watermarking an input signal |
Also Published As
Publication number | Publication date |
---|---|
EP1756805B1 (en) | 2008-07-30 |
WO2005119655A1 (en) | 2005-12-15 |
EP1756805A1 (en) | 2007-02-28 |
TW200609903A (en) | 2006-03-16 |
US20080267412A1 (en) | 2008-10-30 |
CN1961352A (zh) | 2007-05-09 |
DE602005008594D1 (de) | 2008-09-11 |
ATE403216T1 (de) | 2008-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008502194A (ja) | 補助情報をメディア信号に埋め込む方法及び装置 | |
CN100431355C (zh) | 响应补充信息修改音频或视频感知编码系统的一个或多个参数 | |
US8363889B2 (en) | Image data processing systems for hiding secret information and data hiding methods using the same | |
Li et al. | Using perceptual models to improve fidelity and provide resistance to valumetric scaling for quantization index modulation watermarking | |
JP5047971B2 (ja) | 位相修正を用いることによるオーディオ信号の現物参照なし透かし | |
Bhat K et al. | An audio watermarking scheme using singular value decomposition and dither-modulation quantization | |
US6674876B1 (en) | Watermarking in the time-frequency domain | |
Menendez-Ortiz et al. | A survey on reversible watermarking for multimedia content: A robustness overview | |
US7792322B2 (en) | Encoding apparatus and method | |
Bhat K et al. | A new audio watermarking scheme based on singular value decomposition and quantization | |
US20090235079A1 (en) | Method and apparatus for watermarking an audio or video signal with watermark data using a spread spectrum | |
JP5749804B2 (ja) | 透かし生成器、透かしデコーダ、離散値のデータに基づき透かし付信号を付与するための方法および透かし付信号に依存して離散値のデータを付与する方法 | |
JP2005528649A (ja) | マルチメディア信号中の電子透かしの再埋め込み | |
TW201110700A (en) | Systems for hiding secret data in halftone images and data hiding method using the same | |
EP1875470B1 (en) | Modified DCT transform to phase modulate an MP3 data bitstream in baseband, and watermarking. | |
Li et al. | Improved spread transform dither modulation using a perceptual model: robustness to amplitude scaling and JPEG compression | |
CN101151637A (zh) | 量化水印的方法 | |
KR20040095325A (ko) | 다매체 신호들의 워터마킹을 위한 윈도우 셰이핑 함수들 | |
CN111292756A (zh) | 一种抗压缩音频无声水印嵌入和提取方法及系统 | |
Li et al. | Rational dither modulation watermarking using a perceptual model | |
US20070104349A1 (en) | Tally image generating method and device, tally image generating program, and confidential image decoding method | |
KR20060112667A (ko) | 워터마크 임베딩 | |
KR20070031313A (ko) | 매체 신호에 보조 정보를 매립하기 위한 방법 및 장치 | |
Chou et al. | Color image watermarking based on a color visual model | |
Li et al. | Improve Spread Transform Dither Modulation by Using a Perceptual Model to Provide Resistance to Amplitude Scaling and JPEG Compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080528 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20090723 |