JP2009508392A - ビデオ透かし挿入のための係数選択 - Google Patents

ビデオ透かし挿入のための係数選択 Download PDF

Info

Publication number
JP2009508392A
JP2009508392A JP2008529969A JP2008529969A JP2009508392A JP 2009508392 A JP2009508392 A JP 2009508392A JP 2008529969 A JP2008529969 A JP 2008529969A JP 2008529969 A JP2008529969 A JP 2008529969A JP 2009508392 A JP2009508392 A JP 2009508392A
Authority
JP
Japan
Prior art keywords
frame
coefficient
coefficients
watermark
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008529969A
Other languages
English (en)
Inventor
ピカード,ジヤステイン
ツアオ,ジアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2009508392A publication Critical patent/JP2009508392A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/0028Adaptive watermarking, e.g. Human Visual System [HVS]-based watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32154Transform domain methods
    • H04N1/3217Transform domain methods using wavelet transforms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32154Transform domain methods
    • H04N1/32187Transform domain methods with selective or adaptive application of the additional information, e.g. in selected frequency coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32267Methods relating to embedding, encoding, decoding, detection or retrieval operations combined with processing of the image
    • H04N1/32277Compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32309Methods relating to embedding, encoding, decoding, detection or retrieval operations in colour image data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0051Embedding of the watermark in the spatial domain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0052Embedding of the watermark in the frequency domain
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0061Embedding of the watermark in each block of the image, e.g. segmented watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0083Image watermarking whereby only watermarked image required at decoder, e.g. source-based, blind, oblivious
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0202Image watermarking whereby the quality of watermarked images is measured; Measuring quality or performance of watermarking methods; Balancing between quality and robustness

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)

Abstract

係数集合を選択することと、ビデオのボリューム内の選択された係数集合の属性値の間に関係を強制することによってビデオ画像に透かしを施すための方法およびシステム。

Description

本発明は、ビデオ・コンテンツの透かし挿入に関し、より詳細には、ディジタル・シネマ・アプリケーションにおける透かしの埋め込みおよび検出に関する。
ビデオは、空間軸と時間軸の両方を含む。画像(同様にビデオ・フレーム)は、空間領域または変換領域で表現することができる。「ベースバンド」領域とも呼ばれる空間領域では、画像は、ピクセル値のグリッドとして表現される。ピクセル化(すなわち離散)画像の変換領域表現は、空間領域画像の数学的変換から計算することができる。一般に、この変換は、完全に可逆的であるか、または少なくとも情報の重大な喪失がない程度に可逆的である。いくつかの変換領域が存在し、最もよく知られたものは、JPEG圧縮アルゴリズムで使用される、FFT(高速フーリエ変換)、DCT(離散コサイン変換)と、JPEG2000圧縮アルゴリズムで使用される、DWT(離散ウェーブレット変換)である。変換領域でコンテンツを表現する1つの利点は、知覚品質が同程度ならば、変換領域表現はベースバンド表現よりも一般にコンパクトなことである。ベースバンド領域で透かしを埋め込むための透かし挿入方法と、変換領域で透かしを埋め込むための透かし挿入方法が存在する。
ビデオまたはビデオ画像は、様々な透かし挿入手法に向いている。ビデオ透かし挿入のためのこれらの手法は、透かし挿入のためにビデオの空間的構造を選択するか、時間的構造を選択するか、それとも全体的な3次元構造を選択するかに基づいて、3つのカテゴリに分類することができる。
空間的ビデオ透かし挿入アルゴリズムは、既存の画像透かし挿入アルゴリズムを用いたフレーム単位の透かしの埋め込みによって、静止画透かし挿入をビデオ透かし挿入に拡張したものである。従来技術では、フレーム単位の透かしが、一定の間隔で各フレームにおいて繰り返されるが、その間隔は恣意的であり、数フレームから動画全体にわたる。検出器側では、多くの連続フレームで同じ透かしパターンが繰り返されたほうが、電力信号対雑音比(PSNR:Power Signal−to−Noise Ratio)にとって有利である。しかし、すべてのフレームが同じ透かしパターンを有する場合、可能なフレーム結託攻撃(frame collusion attack)に対して脆弱とならないように、特別な配慮が払われなければならない。他方、透かしがすべてのフレーム毎に変化する場合、検出がより困難になるばかりか、ちらつきアーチファクトを引き起こし、ビデオの安定エリアでは、依然として結託攻撃に対して脆弱である。
改良として、すべてのフレームに透かしを施す必要はない。従来技術では、自動的に選択された「キー・フレーム」(およびキー・フレーム周辺の数フレーム)のみが、透かしを施される。キー・フレームは、2つの境界ショット・フレーム(boundary shots frame)の間に見出される安定フレームであり、フレーム・レートの変化後であっても、再び容易に見出すことができる。キー・フレームのみの透かし挿入は、忠実度制約(fidelity constraint)に加わる重圧を軽減するばかりでなく、より高い安全性とより低い計算集約性ももたらす。
空間領域透かしは、例えば、幾何学的にインバリアント(不変)な透かしを使用する、またはタイル状パターンに透かしを反復する、もしくはフーリエ領域においてテンプレートを使用する、幾何学的変形に対して堅牢な静止画透かし挿入技法から利益を得るが、とりわけ、スクリーン湾曲と、映写映画のカムコーダ記録中に生じる幾何学的変形のせいで、逆変換を行うことが困難である。さらに、これら2つの手法は、信号処理攻撃(signal processing attack)に対して安全ではなく、例えば、フーリエ領域におけるテンプレートは、容易に除去することができる。従って、空間領域透かしは、位置合わせのためにオリジナル・コンテンツが使用される場合に、より容易且つ安全に検出することができる。従来技術では、オリジナル・フレーム内の特徴点を抽出フレーム内の特徴点に一致させる、半自動位置合わせ方法が使用される。フラット・スクリーン上への映写の場合、逆向きの変形を施すためには、最低でも4つの参照点が一致しなければならない。オペレータは、事前計算された特徴点の集合から、少なくとも4つの特徴点を手動で選択する。2レベル位置合わせが、最初は時間領域で、次に空間領域で、完全に自動的に実行される。抽出キー・フレームを対応するオリジナル・フレームに一致させるため、フレーム・シグネチャ(フィンガプリント、ソフト・ハッシュ、またはメッセージ・ダイジェストとも呼ばれる)のデータベースが、透かし検出器によってアクセスされる。その後、オリジナル・フレームは、テスト・フレームの自動空間位置合わせのために使用される。
しかし、キー・フレームの選択用の計算は、リアルタイム・アプリケーションの場合は透かし埋め込み時に利用可能でない、これから来るフレームを必要とすることに留意されたい。代替方法は、フレーム処理と再生の間に一定時間の遅延を維持するものである。
従来技術の時間的透かし挿入方式は、各フレームにおける全体的輝度を変化させることによって、透かしを挿入するために時間軸のみを利用する。これは、透かしを幾何学的歪みに対して本質的に堅牢にするとともに、カムコーダ攻撃後の透かし読み取りを簡単にする。(一般にカムコーダ撮影されたビデオのちらつきを抑制するときに適用される)時間ローパス・フィルタリングに対する透かしの堅牢性は、当技術分野で知られたその他の方法を用いて改善することができる。しかし、透かしは、(特にフレーム編集後の)時間同期外しに対して脆弱である。しかし、同期は、同期を外されたビデオとオリジナル・ビデオの間でキー・フレームを一致させることによって、やはり回復することができる。
先の2つの手法(空間的透かし挿入または時間的透かし挿入)は、透かし挿入のために、3つの利用可能な次元のうちの1つまたは2つを使用する。ビデオ内の3つの利用可能な次元のうちの1つまたは2つにおける透かし構造の不在は、透かしのために利用可能な空間の準最適な使用をもたらす。ブルーム(Bloom)他の米国特許第6885757号、「Method and Apparatus for Providing an Asymmetric Watermark Carrier」に記載の方法は、ビデオの構造を完全に使用する。スペクトル拡散方法では、技法は、明らかに堅牢且つ安全であるが、検出器は、検出に先立って、テスト・ビデオをオリジナル・ビデオと同期させなければならない。
本発明の態様は、連続したフレームにわたって、または単一のフレーム内に、ある係数の属性値の2つまたは3つ以上の間の制約ベースの関係を擬似ランダム的に挿入することを含む。これらの関係が透かし情報を符号化する。
「係数(coefficients)」は、ビデオ、画像、またはオーディオ・データを含む、データ要素の集合として表される。「コンテンツ(content)」という用語は、データ要素の任意の集合を示す総称的な用語として使用される。コンテンツがベースバンド領域にある場合、係数は「ベースバンド係数」と呼ばれる。コンテンツが変換領域にある場合、係数は「変換係数」と呼ばれる。例えば、画像、またはビデオの各フレームが、空間領域で表現される場合、ピクセルが画像係数である。画像フレームが変換領域で表現される場合、変換画像の値が画像係数である。
本発明は特に、ディジタル・シネマ・アプリケーションにおけるJPEG2000画像のためのDWTを扱う。ピクセル化画像のDWTは、垂直および水平、ローパスおよびハイパス・フィルタの画像ピクセルへの連続適用によって計算され、結果の値は、「ウェーブレット係数(wavelet coefficient)」と呼ばれる。ウェーブレットは、1周期または数周期のみ持続する振動波形である。各反復において、直前の反復でローパス・フィルタリングのみを施されたウェーブレット係数が引き抜かれ(decimate)、その後、ローパス垂直フィルタおよびハイパス垂直フィルタを通過し、この処理の結果が、ローパス水平フィルタおよびハイパス水平フィルタに通される。結果の係数集合は、4つの「サブバンド」、すなわちLL、LH、HL、およびHHサブバンドにグループ化される。
言い換えると、LL、LH、HL、およびHH係数は、それぞれ、ローパス垂直/ローパス水平フィルタ、ローパス垂直/ハイパス水平フィルタ、ハイパス垂直/ローパス水平フィルタ、ハイパス垂直/ハイパス水平フィルタの画像への連続適用から生じる係数である。
画像は、異なるネイティブ・カラーに対応する複数のチャネル(または成分)を有する。画像は、グレースケール画像である場合、輝度成分を表すただ1つのチャネルを有する。一般に、画像はカラー画像であり、その場合は、異なるカラー成分を表すために、一般に3つのチャネルが使用される(しかし、時には異なる数のチャネルが使用される)。3つのチャネルは、それぞれ、赤、緑、および青成分を表すことができ、その場合、画像はRGB色空間で表されるが、その他の多くの色空間も使用することができる。画像が複数のチャネルを有する場合、一般に各カラー・チャネル上で別々にDWTが計算される。
各反復は、ある「レイヤ(層)」または「レベル」の係数に対応する。第1レイヤの係数は、最も高い解像度レベルの画像に対応し、最終レイヤは、最も低い解像度レベルの画像に対応する。図1は、5レベル・ウェーブレット変換の1つの成分におけるビデオ表現である。ユニット105〜120は、ビデオのフレームである。ユニット125は、最も低い解像度におけるLLサブバンド係数を示している。ユニット125aは、フレームf=0、チャネルc=0、サブバンドb=0、解像度レベルl=0、位置xおよびy=0である(f,c,l,b,x,y)における係数を示している。
ビデオの3D構造を最もよく利用するため、本発明は、時間軸と空間軸の両方を使用する。空間位置合わせは、映写したものを記録した映画の場合、達成が難しいので、本発明は、空間位置合わせに関して幾何学的歪みにあまり敏感でない、非常に低い空間周波数、または低い空間周波数の大域的属性を使用する。攻撃中に生じる大部分の変形は時間的に線形であるので、時間周波数はより容易に回復される。
本発明では、ビデオの低解像度ウェーブレット係数に直接的に透かしを施す。フレーム内のピクセルの数は、低解像度ウェーブレット係数の数よりも1000倍大きいオーダにあるので、本発明では、演算の数は潜在的にはるかに小さくなる。
透かしを生成することと、ビデオのボリューム内の選択された係数集合の属性値の間に関係を強制することによって生成された透かしをビデオ画像に埋め込むこととを含む、ビデオ画像に透かしを施すための方法およびシステムが説明される。それによって、透かしは、ビデオのボリュームに適応的に埋め込まれる。係数集合を選択することと、ビデオのボリューム内の選択された係数集合の属性値の間に関係を強制することとを含む、ビデオ画像に透かしを施すための方法およびシステムも説明される。ペイロードを生成することと、係数集合を選択することと、係数を変更することと、ビデオのボリューム内の選択された係数集合の属性値の間に関係を強制することによって透かしを埋め込むこととを含む、ビデオ画像に透かしを施すための方法およびシステムも説明される。変更された係数が、選択された係数集合を置き換える。
信号を準備することと、属性値を抽出および計算することと、ビット値を検出することと、ペイロードを復号することとを含み、ペイロードが、ビデオのボリューム内の属性値の間に関係を強制することによって生成され、埋め込まれるビット系列である、ビデオ画像内の透かしを検出するための方法およびシステムが説明される。信号を準備することと、ペイロードを復号することとを含み、ペイロードが、ビデオのボリューム内の属性値の間に関係を強制することによって生成され、埋め込まれるビット系列である、ビデオ画像内の透かしを検出するための方法およびシステムも説明される。信号を準備することと、属性値を抽出および計算することと、ビット値を検出することとを含む、ビデオのボリューム内の透かしを検出するための方法およびシステムも説明される。
本発明は、ハードウェア、ファームウェア、FPGA、またはASICなどで実装してもよいが、サーバ、モバイル装置、またはそれらの任意の均等物とすることができるコンピュータまたは処理装置内に存在するソフトウェアで実施するのが最良である。本発明の方法は、そのステップをプログラミングし、そのプログラムをコンピュータ可読媒体に保存することによって実施/実行するのが最良である。リアルタイム処理に必要とされる速度が、ステップの1つまたは複数のシーケンスのためにハードウェアを要求する場合、一般性を失うことなく、本明細書で説明されるプロセスおよび方法のすべてまたは任意の部分に対するハードウェア・ソリューションが、容易に実施される。その場合、ハードウェア・ソリューションは、サーバまたはモバイル装置などの、しかしそれらに限定されない、コンピュータまたは処理装置に埋め込まれる。ディジタル・シネマ・アプリケーション用のJPEG2000画像にリアルタイムに透かしを施す実施の一例では、ディジタル・シネマ・サーバまたはプロジェクタ内のJPEG2000復号器が、各フレームの最も低い解像度レベルの係数を、透かし埋め込みモジュールに送付する。埋め込みモジュールは、受け取った係数を修正し、さらなる復号のために、それらを復号器に返却する。係数の送付、透かし挿入、および返却は、リアルタイムに実行される。
本発明は、以下の「発明を実施するための最良の形態」を添付の図面と併せて読むことで最もよく理解される。図面は、「図面の簡単な説明」で簡潔に説明される図を含み、図中の同じ番号は類似の要素を表す。
多くのアプリケーションが、セットトップ・ボックス用およびディジタル・シネマ・サーバ(メディア・ブロックとも呼ばれる)またはプロジェクタ用のセッション・ベースの透かし埋め込みなど、リアルタイム透かし埋め込みを必要とする。ほとんど明白なことだが、このことが、与えられた時点において時間的に後に到来するフレームを利用する透かし挿入方法の適用を難しくしていることを述べておいても無駄ではなかろう。(例えば、透かしの位置および強度の)オフライン事前計算は、好ましくは避けるべきである。それにはいくつかの理由があるが、2つの最も重要な理由は、潜在的なセキュリティ漏洩(現行世代の透かし挿入アルゴリズムは一般に、攻撃者が埋め込みアルゴリズムの完全な詳細を知っている場合、あまり安全ではない)と、非実用性である。
ほとんどのアプリケーションでは、ディジタル的に透かしを施されるコンテンツのユニットは、埋め込まれる時間と検出される時間の間に何らかの変更を受ける。これらの変更は、一般に透かしを劣化させ、その検出をより難しくするので、「攻撃(attack)」と呼ばれる。アプリケーションの最中に攻撃が自然に生じることが予想される場合、その攻撃は、「非意図的(non−intentional)」と見なされる。非意図的攻撃の例は、(1)クロッピング、スケーリング、JPEG圧縮、フィルタリングなどが施された透かし挿入画像、(2)テレビ・ディスプレイ上に表示するためのNTSC/PAL SECAMへの変換、MPEGまたはDIVX圧縮、リサンプリングなどが施された透かし挿入画像である。他方、攻撃が、透かしを除去する意図またはその検出を妨害する意図(すなわち、透かしは依然としてコンテンツ内に存在するが、検出器によって取り出すことができない)をもって故意に実行される場合、その攻撃は、「意図的(intentional)」であり、その攻撃を実行する者たちは、「著作権侵害者(pirate)」である。意図的攻撃は一般に、コンテンツの知覚的損傷を最小限に抑えながら、透かしを読み取れなくする可能性を最大化するという目的をもち、攻撃の例は、検出器との同期を非常に難しくするためにコンテンツに適用される(大多数の透かし検出器は同期外しに敏感である)、わずかな知覚不能なライン除去/追加および/または局所的回転/スケーリングの組み合わせである。例えばスターマーク(Stirmark)など、上記の攻撃を目的としたツールが、インターネット上に存在する(http://www.petitcolas.net/fabien/watermarking/stirmark/)。
映画館で上映中の映画を不法に記録する人によって実行される、いわゆる「カムコーダ(ビデオカメラ)攻撃」の場合、人が不法行為を実行しているにも関わらず、その攻撃は非意図的と見なされる。実際、映画の記録は、透かしの除去を意図して実行されない。しかし、記録後に、コンテンツ内で透かしがもはや検出できないことを保証するために、記録されたビデオにさらなる処理を実行することがある。その場合、これら後者の攻撃は、意図的と見なされる。
例えば、ディジタル・シネマ用のセッション・ベースの透かしは、以下の攻撃、すなわち、リサイジング、レターボックス化、絞り制御、ローパス・フィルタリングおよびアンチ・エイリアシング、ブリック・ウォール・フィルタリング、ディジタル・ビデオ・ノイズ・リダクション・フィルタリング、フレーム・スワッピング、圧縮、スケーリング、クロッピング、上書き、ノイズ追加、およびその他の変形を耐えなければならない。
カムコーダ攻撃は、以下の攻撃、すなわち、カムコーダ記録、デインタレーシング、クロッピング、ちらつき抑制、および圧縮をこの順序で含む。留意すべきことに、カムコーダ記録は、重大な空間的歪みを導入する。カムコーダ攻撃を耐えた透かしは、例えば、スクリーナ・コピー、テレシネなど、その他の大部分の非意図的攻撃にも耐えると一般に理解されているので、本発明は、カムコーダ攻撃に重点を置く。しかし、透かしがその他の攻撃にも同様に耐えることが重要である。ビデオのフレームは、NTSCまたはPAL SECAM準拠のシステム上で再生するために一般にインタレースされる。デインタレーシングは、実際には検出性能に影響を与えないが、記録されたビデオの品質を改善するために著作権侵害者によって使用される標準的プロセスである。アスペクト比2.39のビデオは、約4:3のアスペクト比を用いて完全に記録され、ビデオの上部および下部エリアは、おおよそクロッピングされる。記録されたビデオは、煩わしいちらつきを一般に示すが、それは、時間領域におけるエイリアシング効果に起因する。ちらつきは、輝度の素早い変化に対応し、フィルタで除去することができる。そのようなちらつき効果を除去するために、ちらつき抑制フィルタが著作権侵害者によってしばしば使用される。ちらつき抑制フィルタは、各フレームにローパス・フィルタリングを強く施すので、透かしを消去する意図で使用されない場合でも、透かしの時間的構造に非常な損傷を与える。最後に、記録された映画は、例えばDIVXまたはその他の非可逆ビデオ・フォーマットなど、利用可能な配布帯域幅/媒体/フォーマットに適合するように圧縮される。例えば、P2Pネットワーク上で見出される映画は、100分の映画全体を700MバイトCDに保存することを可能にするファイル・サイズをしばしば有する。これは、約934kbpsのトータル・ビット・レート、または128kbpsがオーディオ・トラック用に確保されている場合は約800kbpsに対応する。
攻撃のこのシーケンスは、ピア・ツー・ピア(P2P)ネットワーク上で見出される著作権侵害ビデオのライフタイム中に生じる最も重大なプロセスに対応する。それは、明示的または暗黙的に、透かしが耐えなければならない上述の攻撃の大部分も含む。カムコーダ攻撃に加えて、本発明の透かし挿入方法および装置は、フレーム編集(除去および/または追加)攻撃にも耐えなければならない。
透かし検出システムは、検出器がオリジナル・コンテンツにアクセスする必要がない(必要がある)場合、「ブラインド」(またはノンブラインド)と呼ばれる。オリジナル・コンテンツから導出されたデータのみにアクセスする必要がある、いわゆるセミブラインド・システムも存在する。ディジタル・シネマ用のセッション・ベースの透かしに関する、フォレンシック追跡(forensic tracking)などのいくつかのアプリケーションは、一般に検出がオフラインで行われるので、ブラインド透かしソリューションを明示的に必要とせず、オリジナル・コンテンツへのアクセスが可能である。本発明は、ブラインド検出器を使用するが、コンテンツを検出器で同期させるために同期ビットを挿入する。セミブラインド検出器も、本発明と共に使用することができる。セミブラインド検出器が使用される場合、オリジナル・コンテンツから導出されたデータを使用して、最終的に同期が実行される。この場合、同期ビットは必要でなく、透かしチップ(watermark chip)とも呼ばれる透かしのサイズは減少する。
ディジタル・シネマ・アプリケーションの具体的な一例では、35ビットの最小ペイロードが、コンテンツ内に埋め込まれる必要がある。このペイロードは、16ビットのタイムスタンプを含むべきである。1年を366日、1日を24時間として、タイムスタンプが15分おきに(1時間当たり4個)生成され、それが1年毎に繰り返される場合、35136個のタイムスタンプが必要とされ、これは16ビットを用いて表すことができる。その他の19ビットは、全部で524000個の可能な位置/シリアル番号の中の位置またはシリアル番号を表すために使用することができる。
加えて、5分間のセグメントから検出可能であるためには、35ビットすべてが必要とされる。言い換えると、フォレンシック・マークを抽出するために、たかだか5分間のビデオが必要とされるべきである。一実施形態では、本発明は、64ビットの透かしを使用し、透かしチップは、3:03分毎に繰り返される。1埋め込みビット毎フレームである場合、24フレーム毎秒の3:03分間のビデオに埋め込まれるビデオ透かしチップは、4392ビットを有する(183秒×24フレーム毎秒=4392フレーム=1ビット毎フレームで4392ビット)。
本発明のビデオ透かし挿入方法は、コンテンツの異なる属性の間の関係を変更することに基づいている。具体的には、情報のビットを符号化するため、画像/ビデオのある係数が選択され、異なる集合に割り当てられ、異なる集合の属性値の間に関係を導入するために最小限の操作を施される。係数集合は、異なる属性値を有し、属性値は一般に、ビデオの異なる空間−時間領域で異なり、またはコンテンツを処理した後に変更される。一般に、本発明は、単調に変化する属性値を使用し、その場合、堅牢な関係を保証することがより容易であるので、攻撃は予測可能な影響を有する。そのような属性は「インバリアント(不変)」と呼ばれる。本発明は、インバリアント属性を使用して最もよく実施されるが、そのように限定されることはなく、インバリアントではない属性を使用して実施することも可能である。例えば、フレームの平均輝度値は、時間に関して「インバリアント(不変)」であると考えられ、(境界ショットを除き)一般にゆっくりと単調に変化し、さらに、コントラスト強化などの攻撃は一般に、各フレームの輝度値の相対的順序を妨げない。
ビデオ・コンテンツは一般に、RGB(赤/緑/青、コンピュータ・グラフィックスおよびカラー・テレビで広く使用される)、YIQ、YUV、YCrCb(放送およびテレビで使用される)など、複数の別個の成分(またはチャネル)を用いて表される。YCrCbは、2つの主要成分、すなわち、輝度(Y)および色差(CrCb、またはUVとしても知られる)からなる。ビデオ・コンテンツの輝度すなわちY成分の量は、明るさを示す。色差(またはクロマ)は、色相および彩度情報を含む、ビデオ・コンテンツの色部分を示す。色相は、画像の色合いを示す。彩度は、入力パラメータの変化にも関わらず出力色が一定となる条件を示す。YCrCbの色差成分は、色の赤色(Cr)成分および青色(Cb)を含む。本発明は、サイズがW×H×N(WおよびHは、それぞれ、ベースバンド領域または変換領域におけるフレームの幅および高さ、Nは、ビデオのフレーム数)である、係数からなる複数の3次元ボリュームとして、ビデオ・コンテンツを考える。各3Dボリュームは、ビデオ・コンテンツの1つの成分表現に対応する。透かし情報は、1つまたは複数のボリューム内の係数からなる選択された集合のある属性値の間に制約ベースの関係を強制することによって、挿入される。しかし、人間の目は、色(色差)変化に比べて、全体的な強度(輝度)変化にははるかに敏感でないので、透かしは、好ましくは、ビデオ・コンテンツの輝度成分を表す3Dビデオ・ボリューム内に埋め込まれる。輝度の別の利点は、ビデオの変換に対してよりインバリアントなことである。これ以降、別途指摘がない限り、3Dビデオ・ボリュームは、輝度成分を表すものとするが、任意の成分を表すこともできる。
本発明では、係数集合は、コンテンツの恣意的な場所から取得された任意の数の係数(1個からW×H×N個)を含むことができる。各係数は値を有する。従って、異なる属性値が、係数集合から計算でき、いくつかの例が、以下で与えられる。透かし情報を挿入するため、係数からなる多くの集合における係数値を変化させることによって、多くの関係が強制できる。関係は、係数からなる1つまたは複数の集合の1つまたは複数の属性値が満たさなければならない1つまたは1組の条件として理解されるが、それに限定されない。
様々なタイプの属性が、係数からなる各集合のために定義できる。属性は、好ましくは、ベースバンド領域(明るさ、コントラスト、輝度、エッジ、カラー・ヒストグラムなど)において、または変換領域(周波数帯のエネルギー)において計算される。輝度の場合のように、いくつかの属性値は、ベースバンドおよび変換領域において等しく計算することができる。
1ビットの情報を埋め込むのに適した1つの方法は、2つ係数集合を選択し、それらの属性値の間に事前定義された関係を強制することである。例えば、関係は、第1の係数集合の1つの属性値が第2の係数集合の対応する属性値より大きいこととすることができる。しかし、ビットの情報を埋め込むための方法には、いくつかの変形が存在することに留意されたい。2つの選択された係数集合に2ビット以上の情報を埋め込むための1つの方法は、2つの係数集合の2つ以上の属性値の間に関係を強制することである。
1つの係数集合のみを使用し、この係数集合の属性値の関係を強制することによって、1ビットの情報を埋め込むことも可能である。例えば、属性値は、事前定義またはコンテンツから適応的に計算することができるある値よりも大きく設定される。4つの排他的区間を定義し、属性値がある区間に存在する条件を強制することによって、1つの係数集合を使用して、2ビット以上の情報を埋め込むことも可能である。2ビット以上を埋め込むためのその他の方法は、2つ以上の属性値を使用し、属性値の各々についての関係を強制することを含む。
一般に、基本方式は、恣意的な数の係数集合、恣意的な数の属性値、および恣意的な数の強制関係に一般化することができる。これはより大量の情報を埋め込むためには有利であるが、知覚的変化を最小に抑えながら様々な関係が同時に強制されることを保証するために、線形プログラミングなどの特定の技法が使用されなければならないこともある。上で述べたように、インバリアント属性値が使用される場合、より容易に関係を強制することができる。
3Dビデオ・ボリューム(および係数集合)の多くの属性は、空間的−時間的方法において、および/またはコンテンツ処理の前/後において、相対的にインバリアントである。インバリアント属性の例は、以下のものを含む。
・連続フレームにおける、または同一フレームの異なるサブバンドにおける係数(例えば、ウェーブレット係数)。
・連続フレームにおける平均輝度値。
・連続フレームにおける平均テクスチャ特徴値。
・連続フレームにおける平均エッジ測定。
・連続フレームにおける平均カラーまたは輝度ヒストグラム分布。
・ある周波数範囲におけるエネルギー。
・抽出特徴点によって定義されるエリア内における上記のインバリアント属性の何れか。
透かしアルゴリズムは一般に、埋め込み器および検出器のみに知られた、「秘密」鍵を用いて動作する。秘密鍵の使用は、暗号システムにおけるのと同様な利点をもたらし、例えば、一般に透かしシステムの詳細が知られても、システムのセキュリティを危険にさらすことはなく、従って、同業者の検討および可能な改良のためにアルゴリズムが開示できる。さらに、透かしシステムの秘密は、鍵の中に保持され、すなわち、鍵が知られた場合でも、透かしの埋め込みおよび/または検出のみを行えるに過ぎない。鍵は、そのコンパクトなサイズ(典型的には128ビット)のため、より容易に隠蔽し、送信することができる。アルゴリズムのある局面を擬似ランダム化するために、対称鍵が使用される。一般に、鍵は、ペイロードが誤り訂正および検出用に符号化され、コンテンツに適合するように拡張された後、(例えば、DESなどの標準暗号アルゴリズムを使用して)ペイロードを暗号化するために使用される。本発明の方法の場合、鍵は、2つの異なる係数集合の属性値の間に挿入される関係を設定するためにも使用される。従って、これらの関係は、与えられた秘密鍵に対して固定されるので、「事前定義」されていると見なされる。透かしを埋め込むための2つ以上の事前定義関係が存在する場合、鍵は、情報の与えられたビットおよび与えられた係数集合にとって的確な関係をランダムに選択するためにも使用することができる。
選択された係数集合は一般に、「領域」に対応し、領域は、コンテンツの同じエリアに配置される係数集合として理解される。係数の領域は、ベースバンド係数およびウェーブレット係数の場合には、コンテンツの空間的−時間的領域に対応するが、必ずしもそうである必要はない。例えば、コンテンツの3Dフーリエ変換係数は、空間的領域にも時間的領域にも対応せず、同様の周波数の領域に対応する。
例えば、係数集合は、1つのフレームのある空間的エリア内のすべての係数から作られる領域に対応することができる。1ビットの情報を符号化するため、2つの連続フレームの中の2つの領域が選択され、対応する係数値が、これら2つの領域のある属性の間に関係を強制するために変更される。以下でさらに詳しく説明されるように、所望の関係がすでに存在している場合は、係数値を変更する必要がないことに留意されたい。
ウェーブレット変換を用いるさらに別の例では、各フレームの各解像度レベルにおける各位置および各成分(チャネル)毎に、4つのサブバンドに対応する4つのウェーブレット係数(LL、LH、HL、およびHH)が存在する。係数集合は、4つのサブバンドの1つにおける1つの係数を含むだけでもよい。C1、C2、C3、C4が、位置、チャネル、および解像度レベルが同じ、4つのサブバンドにおける4つの係数であると仮定する。透かしを埋め込むための1つの方法は、HLおよびLHサブバンド内の係数にそれぞれ対応するC2とC3の間に関係を強制することである。関係の一例は、C2がC3より大きいことである。透かしを埋め込むための別の方法は、1つのフレーム内のC1〜C4と連続するフレーム内の対応する係数の間に関係を強制することである。この原理の変形は、ただ1つのタイプの係数についての関係を挿入するものであり、係数は事前計算された値よりも大きくなければならない。例えば、ある解像度レベルにおけるフレーム内のすべての位置について、係数LLの値が事前計算された値よりも大きいという制約を強制することが可能である。上記の例では、属性値は、ウェーブレット係数自体の値である。
検出側で、透かし挿入側と同一またはほぼ同一の係数集合を識別できることが必須である。さもなければ、誤った係数が選択され、測定された属性値は誤ったものになる。検出前にコンテンツが穏やかに処理される場合、係数の位置は(空間領域でも変換領域でも)変化せず、正しい係数の識別は、通常は問題とならない。しかし、カムコーダ攻撃が一般にそうであるように、処理がコンテンツの幾何学的または時間的構造を変化させる場合、係数が位置を変化させる可能性が高い。
コンテンツの時間的構造に変化がある場合、コンテンツを再同期させるために、ノンブラインドまたはセミブラインド方式を使用することができる。従来技術では、この目的で異なる方法が利用可能である。検出がブラインドに(すなわち、オリジナル・コンテンツから導出されるどのようなデータへのアクセスも伴わずに)行われなければならない場合、予測可能値を有する同期ビットをコンテンツ内に挿入することが可能であり、同期ビットは、コンテンツを再同期させるために、検出器によって使用される。そのような方式は、以下でさらに詳しく説明される。
コンテンツの幾何学的構造における変化に対する堅牢性を保証するため、変更されたコンテンツ内の位置をオリジナル・コンテンツ内の対応する位置と一致させることによって、変更されたコンテンツを回復する、従来技術で知られた、同期/位置合わせ方法が使用される。オリジナル・コンテンツ、またはそれから導出される何らかのデータ(例えば、オリジナル・コンテンツのサムネイルもしくは何らかの特徴的な情報)が利用可能である場合、コンテンツの幾何学的構造における変化は、例えば、コンテンツの回転、スケーリング、および/またはクロッピング後に生じる。
ブラインド検出の場合、1つの可能性は、非常に低い空間周波数を使用することである。ビデオ・フレームまたは画像に関して、係数の1つの領域は、ビデオ・フレーム全体、フレームの半分、またはフレームの4分の1に対応することができる。この場合、係数の大部分(領域がビデオ・フレーム全体に対応する場合はすべての係数)が正しく選択され、いくつかの係数が誤った集合に割り当てられたとしても、検出は全体として堅牢である。
幾何学的構造における変化に対して本質的に堅牢な別の方法は、実際にはただ1つの係数を含む領域を使用し、1つのフレーム内の1つの係数と次のフレーム内の対応する位置にある1つの係数との間に関係を強制することである。2つのフレーム内のすべての係数に対して同じ関係が強制される場合、幾何学的歪みに対して検出が本質的に堅牢であることは容易に分かる。幾何学的構造における変化に対して堅牢性を保証するための関連方法は、異なるサブバンド内の与えられた位置にある異なるウェーブレット係数の間に関係を生成することである。例えば、ウェーブレット変換では、各解像度レベル、各位置、および各成分(チャネル)毎に、4つのサブバンド(LL、LH、HL、HH)に対応する4つの係数が存在する。透かしの堅牢性を強化する透かしビットを埋め込むために、フレーム内のすべての位置に関する2つの係数の間の同じ関係が、ある解像度レベルで強制されてよい。検出側では、関係が観測される回数が、どのビットが埋め込まれたかについての指標になる。
幾何学的構造における変化に対して堅牢性を保証するためのさらに別の方法は、幾何学的構造における変化に対してインバリアントな特徴点を使用することである。ここで、インバリアントとは、ビデオまたは画像の特徴点を抽出するためのあるアルゴリズムを使用して、オリジナル・コンテンツ上と変更コンテンツ上とで同じ点が見出される場合を意味する。従来技術では、この目的で異なる方法が知られている。それらの特徴点は、ベースバンド領域および/または変換領域において係数の領域を区切るために使用することができる。例えば、3つの隣接する特徴点は、係数集合に対応し得る内部領域を区切る。また、3つの隣接する特徴点は、サブ領域を定義するために使用することができ、各サブ領域は、係数集合に対応する。
幾何学的構造における変化に対して本質的に堅牢なさらに別の方法は、1つのフレーム内のすべての係数の大域的属性の値と第2のフレーム内のすべての係数の同じ大域的属性の値との間に関係を強制することである。そのような大域的属性は、幾何学的構造における変化に対してインバリアントであることが仮定される。そのような大域的属性の一例は、1つの画像フレームの平均輝度値である。
ビデオの2つの連続フレームの属性値の間に制約を強制することによってビットを埋め込む非限定的な例示的アルゴリズムは、以下のようなものである。
ビデオのフレーム系列F1、F2、...Fn内のJPEG2000圧縮画像である各フレームについて、
a)解像度レベルLにおけるN個の係数からなる領域を選択する。係数は、LL、LH、HL、HHなど、1つまたは複数のサブバンドに属することができる。領域は、幾何学的攻撃に直面したときの領域のさらなる安定性のために例えば特徴点を使用して、恣意的だが固定の形状(例えば、長方形形状)を取ることができ、または上で説明したように、オリジナル画像コンテンツに応じて変化することもできる。
b)領域のための関連する大域的属性を決定する。大域的属性は、領域の平均輝度値、平均テクスチャ特徴測定、平均エッジ測定、または平均ヒストグラム分布とすることができる。Pはそのような大域的属性の値である。
ビット系列{b1,b2,...bm}を埋め込むため、
a)bi(1<i<m)が0ならば、P(F2×i+1)>P(F2×i)となるように、(必要な場合に限って)最小限の変更をF2×iおよびF2×i+1に施す。
b)bi(1<i<m)が1ならば、P(F2×i+1)<P(F2×i)となるように、(必要な場合に限って)最小限の変更をF2×iおよびF2×i+1に施す。
このアルゴリズムは、2つのフレームの複数の属性値の間に関係を挿入することによって、フレーム当たり複数のビットを埋め込むように拡張することができる。
透かし検出のため、
a)記録されたビデオを時間領域で同期させる。これは、同期ビット、ノンブラインド方式、またはセミブラインド方式を使用して行うことができる。
b)レベルLにおけるN個の係数からなる領域を選択する。埋め込みと同様に、領域は固定形状を取ることができる。
c)領域のための関連する大域的属性を計算する。P’は領域の大域的属性の値である。
d)P’(F2×i+1)>P’(F2×i)ならば、ビット0が検出される。
e)P’(F2×i+1)<P’(F2×i)ならば、ビット1が検出される。
本発明の透かし挿入は、3つのステップ、すなわち、ペイロード生成と、係数選択と、係数変更とに分けられる。3つのステップは、本発明の例示的な実施形態として、以下で詳細に説明される。これらのステップの各々について多くの変形が可能であり、ステップおよび説明は限定的であることを意図していないことに留意されたい。
ここで図2を参照すると、図2は、透かし挿入のうちのペイロード生成ステップを示すフローチャートであり、ステップ205で、秘密鍵が取り出され、または受け取られる。ステップ210で、タイムスタンプと装置のロケーションまたはシリアル番号を識別する番号とを含む情報が取り出され、または受け取られる。ステップ215で、ペイロードが生成される。ディジタル・シネマ・アプリケーション用のペイロードは、最小で35ビットであり、本発明の好ましい一実施形態では64ビットである。その後、ステップ220で、ペイロードは、例えばBCH符号を使用して、誤り訂正および検出のために符号化される。ステップ225で、符号化ペイロードは随意に反復される。その後、随意的にステップ230で、同期ビットが鍵に基づいて生成される。同期ビットは、ブラインド検出を使用する場合に、生成され、使用される。同期ビットは、セミブラインドおよびノンブラインド検出方式を使用する場合も、生成され、使用されてよい。同期ビットが生成された場合、ステップ235で、同期ビットは系列に組み立てられる。ステップ240で、系列はペイロードに挿入され、ステップ245で、ペイロード全体が暗号化される。
ペイロード生成は、埋め込まれる具体的な情報を、「ペイロード(payload)」と呼ぶビット系列に変換することを含む。その後、埋め込まれるペイロードは、誤り訂正および検出機能、同期系列、暗号、ならびに利用可能な空き領域に応じた可能な反復を通して拡張される。ペイロード生成のための操作の例示的なシーケンスは、以下の通りである。
1.埋め込まれる「情報」を「オリジナル・ペイロード」に変換する。情報(タイムスタンプ、プロジェクタIDなど)をペイロードに変換する。一例は、ディジタル・シネマ・アプリケーション用の35ビット・ペイロードの生成に関して上で与えられた。本発明の例示的な一実施形態では、ペイロードは64ビットである。オリジナル・ペイロードから「符号化」ペイロードを計算し、符号化ペイロードは、誤り訂正および検出機能を含む。様々な誤り訂正符号/方法/方式が使用できる。例えば、BCH符号化である。BCH符号(64、127)は、受信ビット・ストリーム内の誤りを10個まで訂正することができる(すなわち、約7.87%の誤り訂正率)。しかし、符号化ペイロードが何回も繰り返される場合、冗長性のおかげで、より多くの誤りが訂正できる。本発明の例示的な一実施形態では、127ビットの繰り返し符号化ペイロードが12回繰り返される場合、各フレームに埋め込まれる個々のビットの誤りの30%までを訂正することが可能である。
2.利用可能な空き領域に応じて、符号化ペイロードを反復して、「反復符号化ペイロード」を獲得する。本発明では、符号化ビットの各々を12回反復して、全体で127(BCH符号化)×12=1524ビットを得る。
3.鍵を使用して、反復符号化ペイロードを暗号化して、「暗号化ペイロード」を獲得し、暗号化ペイロードは一般に、反復符号化ペイロードと同じサイズである。
4.(随意的に、暗号化に先立って)同期ビットを生成し、反復符号化ペイロード内の様々な場所に挿入し、結果の系列がビデオ透かしペイロードになる。例えば、2868ビットの固定の同期系列を計算する。この系列は、(透かしチップのヘッダとして)1個の996ビットの大域的同期ユニットと、(各ペイロードのヘッダとして)12個の156ビットの局所的同期ユニットとに分割される。この例では、多数のビットが、同期ビットとして使用される。検出器で(テスト・コンテンツを時間的に同期させるためにオリジナル・コンテンツが使用される)ノンブラインド方法を使用するならば、同期ビットの量を著しく減少させることが可能であるが、局所的に位置合わせを調整するために、同期ビットは依然として非常に有用である。言い換えると、同期ビットは、それとは別に情報のさらなる冗長化のために使用でき、それによって、個々のビット誤りに対する堅牢性を高めることができた空き領域を利用する。しかし、同期ビットは、抽出される情報の精度および品質を高め、そのことが、個々のビット誤りをより少なくする。従って、挿入される同期ビットの数は、127個の符号化ビット内で誤りの数を最小にする最善の歩み寄りとして設定される。
5.以下のビットを順番に連結することによって、透かしチップを組み立てる。
・大域的同期(996ビット)同期ユニット。
・第1の127ビットの暗号化ペイロード、その次に、第1の局所的同期ユニット(156ビット)。
・第2の127ビットの暗号化ペイロード、その次に、第2の局所的同期ユニット(156ビット)。
・...
・最後の127ビットの暗号化ペイロード、その次に、最後の局所的同期ユニット(156ビット)。
透かしチップ(例えば、4329ビット)は一般に、オリジナル・ペイロード(例えば、64ビット)よりも数桁オーダが大きい。このことが、雑音の多いチャネル上での伝送中に生じる誤りからの回復を可能にする。
ここで図3を参照すると、図3は、透かし挿入のための係数の選択を示すフローチャートであり、ステップ305で、鍵が取り出され、または受け取られる。ステップ310で、(符号化、反復化、同期化、および暗号化された)ペイロードが取り出される。その後、ステップ315で、鍵に基づいて、係数が互いに素の集合に分割される。ステップ320で、ペイロード・ビットおよび鍵に基づいて、属性値の間の制約が決定される。
係数の選択は、ベースバンド領域または変換領域において行うことができる。変換領域における係数が選択され、2つの互いに素の集合C1およびC2にグループ化される。係数選択をランダム化するために、鍵が使用される。2つの集合の各々についての属性値P(C1)およびP(C2)が、C1およびC2に関して一般にインバリアントとなるように識別される。例えば、平均値(例えば輝度)、最大値、およびエントロピなど、様々なそのような属性が識別できる。
C1およびC2の属性値の間の関係、例えば、P(C1)>P(C2)を確立するために、鍵および挿入されるビットが使用される。これは、制約決定と呼ばれる。さらなる堅牢性のため、P(C1)>P(C2)+rとなるように、正の値「r」が使用できる。関係がすでに存在することもあり、その場合は、係数は変更される必要がない。最悪の場合、例えば、tが所定の値か、または知覚モデルに従って決定されるとし、P(C2)がすでにP(C1)+tよりも大きい場合など、P(C2)がP(C1)よりも著しく大きいことがあり、その場合、知覚的損傷が導入されるので、係数を変更しても無駄である。しかし、ほとんどの場合、P’1>P’2+rとなるように、P(C1)はP’1=P(C1)+p1とし、P(C2)はP’2=P(C2)−p2とする(p1およびp2は正の数)。
ここで図4を参照すると、図4は、透かし挿入のための係数変更ステップを示すフローチャートであり、ステップ405で、互いに素の係数集合が受け取られ、または取り出される。ステップ410で、互いに素の係数集合の属性値が測定される。ステップ415で、堅牢性の尺度となる属性値の間の距離を決定するために、属性値がテストされる。属性値が閾値距離tの範囲内にある場合、係数変更は必要でないので、プロセスはステップ420に進む。属性値が閾値距離tよりも大きい場合、係数変更を実行するために許容された一定の最大距離内に属性値があるかどうかを決定するため、ステップ425で、さらなるテストが実行される。属性値が最大距離内にある場合、ステップ435で、制約関係を満たすように係数が変更される。属性値が最大距離内にない場合、ステップ430によって規定されるように、係数は変更されない。
本発明の透かし挿入方法は、ビット値が正しく検出されることを保証しながらも、コンテンツに施す変更は最小限のものなので、オリジナル・コンテンツに対して「適応的」である。スペクトル拡散透かし挿入方法も、オリジナル・コンテンツに対して適応的とすることができるが、方法は異なる。スペクトル拡散透かし挿入方法は、変更が知覚可能な損傷をもたらさないように変更を加減するため、オリジナル・コンテンツを考慮する。これは、本発明の方法と概念的に異なっており、本発明は、変更が知覚可能なためではなく、所望の関係がすでに存在するため、またはコンテンツを著しく劣化させることなく、所望の関係が設定できないため、コンテンツのあるエリアにはどのような変更もまったく挿入しないことを決定することがある。しかし、上で見たように、本発明の方法は、ビットが正しく復号されることと、知覚可能な損傷を最小化することとを共に保証するために、適応的にすることができる。
本発明の方法は、ビットが堅牢に埋め込まれることを保証するように最小限の量の歪みしか導入せず、歪みがあまりにも深刻な場合は断念するため、歪みおよびビット・レートが同じならば、スペクトル拡散方法よりも高い堅牢性をもたらす。
ベースバンド領域では、本発明の一実施形態は、各フレーム内のピクセルを、上部パートと下部パートに分類する。上部/下部パートの輝度は、埋め込まれるビットに応じて、増加または減少する。各フレームは、空間領域において、中央点から4つの長方形に分割される。フレームの4つの長方形への分割は、フレーム当たり最大4ビットの記憶を可能にする。方法は、
・ピクセル値をフレームの上部パートとフレームの下部パートにグループ化して、2つの係数集合C1およびC2を形成する。
・輝度を測定し、すなわち、P(C1)はC1内のすべての係数の平均値であり、C2についても同様である。
・例えば、一般にrを正の値とし、P(C1)>P(C2)+rなどの制約を設定するために、必要な場合に限って、ピクセル値に最小限の変更を施す。
本発明のこの実施形態では、透かし埋め込みモジュールは、画像のウェーブレット変換の最も低い解像度の係数だけにアクセスする。ピクセル・サイズが2048(幅)×856(高さ)ピクセルのビデオ・フレームの場合、解像度レベル5の各サブバンド(すなわち、LL、LH、HL、HH)毎に、64×28=1728個、すなわち1728×4=6912個の係数が存在する。これらの係数、またはこれらの係数の部分集合だけが、ビデオ透かし埋め込みのために使用される。フレーム内で選択された係数のグループを使用する、2つの非限定的な方法が、以下で説明される。
第1の方法では、LL係数(近似係数とも呼ばれる)だけが、ビデオ透かし埋め込みのために使用される。LL係数行列(64×28)は、中央点から4つのタイル/パートに分割される。その各々が、32×14のC1、C2、C3、およびC4である。ある関係が満たされるように各パートの係数を増加/減少させることによって、ある関係が、埋め込まれるビットおよび鍵に応じて、4つの各パートLLa(上左領域)、LLb(上右)、LLc(下右)、およびLLd(下左)の係数の間に生成される。4つの長方形タイル/パートの各々は、3つのカラー・チャネルの各々について、286個から1728個までの係数をもつことができる。領域LLaとLLdの間の移行部において透かしを平滑化(し、その可視性を制限)するため、移行領域は、透かしを施さないでおくことができ、またはより低い強度で透かしを施すことができる。
制約の一例は、P(C1)+P(C2)>P(C3)+P(C4)である。平均輝度などの線形属性の場合、この式は、4個の代わりに2個の領域だけが存在する、P(C1とC2の和集合)>P(C3とC4の和集合)と書くことができるが、すべての係数の最大値などの非線形属性の場合、一般にこれは成り立たないことに留意されたい。埋め込まれるビットと使用される鍵に応じて、いくつかの異なる可能な制約が存在する。
係数を4つのタイルに分割する1つの利点は、制約の導入を可能にすることに加え、それが非常に低い空間周波数の使用も可能にすることである。上で説明したように、これらの周波数は、幾何学的攻撃に対して堅牢でありながら、フレームの大域的属性だけを考慮する方法よりも、より多くのビットを記憶することを可能にする。
第2の方法では、係数LHおよびHLが、ビデオ透かし埋め込みのために使用される。制約を挿入するためにこれらの係数を操作する様々な方法がある。最も低いレベルの解像度における係数LHおよびHLの間に制約を挿入することによって、ビットが埋め込まれる。例えば、制約は、フレームf内のすべてのx、yについて、係数がLH(x,y,f)>HL(x,y,f)であることとすることができる。そのような制約は、実際に文字通りに適用するにはしばしば強すぎるので、係数は、関係が全体として当てはまるように操作することができる。例えば、
Sum(x,y)LH(x,y,f)>Sum(x,y)HL(x,y,f)
または
Sum(x,y)(LH(x,y,f)>HL(x,y,f))
のようにすることができる。
第2の関係は線形でなく、より精細な粒度を可能にするが、係数の挿入をより複雑にすることに留意されたい。これは、変更により敏感なエリアは、変更されるにしても大きく変更されないように、係数に対する変更を配分することを可能にする。
この方法では、ピクセル値を変更する代わりに、相対的に少数の係数(64×28個のLL係数)が、フレームの輝度を変えるために変更されることに留意されたい。これは、透かし埋め込みにとって、特に限られた計算用リソースしかもたず、コスト対効果の優れたリアルタイム透かし挿入機能を必要とするアプリケーションにおいて、大きな利点となる。
1つのフレーム内の係数だけを使用できる、または連続フレーム内の係数を使用できる係数集合、測定される属性、強制される関係のタイプなどに応じて、いくつかのさらなる方法が考えられる。一般に、最も実用的な方法は、属性値の順序がコンテンツに対する変更後も概して保存されるという意味で、ほぼインバリアントな属性を有する係数集合を使用する。
係数変更に関して、一実施形態の本発明は、2つの係数集合C1={c11,..,c1N}およびC2={c21,..,c2N}を使用し、それらの値を変更する。係数cijの値は、変更の前および後で、それぞれv(cij)およびv’(cij)と表される。
上で説明したように、より複雑な関係のために、3つ以上の係数集合が使用できる。ただ1つの係数集合を使用することも可能である。一般性を失うことなく、rを関係の堅牢性を調整する任意の値として、P(C1)>P(C2)+rという関係を設定することが望ましい。
関数Pが例えば最大値である場合、変更を最小限に抑えるため、以下のように、C1およびC2の最も強い係数だけを操作する。
・c1i=max{c11,..,c1N}の場合、v’(c1i)=v(c1i)+a1、それ以外の場合、v’(c1i)=v(c1i)
・c2j=max{c21,..,c2N}の場合、v’(c2j)=v(c2j)+a2、それ以外の場合、v’(c2j)=v(c2j)
・a1およびa2は、v’(c1i)>v’(c2j)+rとなるようなものを用いる。
上記の関数Pは、強く非線形であり、すなわち、属性は、係数値の関数として平滑に変化しない。この方法は、(変化が強くなければならなくても)集合当たりただ1つの係数を変更することによって、ビットの埋め込みを可能にするので有利である。
方法をより堅牢なものにできるこの「最大値」方法の拡張は、コンテンツに対する操作後に関係が正しく復号される可能性を最大化するため、最大値ばかりでなく、N個(Nは一般に係数集合のサイズよりも著しく小さい)の最強値も変化させる。この技法に対するその他のいくつかの変形が可能であることは理解されよう。
他方、関数Pが係数の属性に関して線形である場合(例えば平均値)、変更は、各集合内のすべての係数に恣意的に配分することができる。例えば、関係を設定するため、係数の平均値を
avg{v’(c11),..,v’(c1N)}>avg{v’(c21),..,v’(c2N)}+r
となるように変更することが望ましいと仮定し、変更が各係数に等しく配分できるならば(C1に属する係数については正の数、C2に属する係数については負の数)、
v’(c1i)=v(c1i)+(r+avg{v(c21),..,v(c2N)}−avg{v(c11),..,v(c1N)})/N
となり、c2jについても同様である。関係がすでに成り立っている場合、(r+avg{v(c21),..,v(c2N)}−avg{v(c11),..,v(c1N)})<0であり、その場合、係数は変更する必要がない。
上で説明したように、基本方法は、異なる属性を使用することによって、より多くの関係を含むように拡張することができる。例えば、「最大値」および「平均値」方法を一緒にして、2つの集合の間に関係の4つの組み合わせをもち、2ビットを符号化することを可能にすることを考える。その場合、以下の関係が強制される。
max(C1)>max(C2)およびavg(C1)<avg(C2)
また、上で説明したように、ただ1つの係数集合を使用しなければならない場合、関係は、固定または所定の値に対して設定される。例えば、関係は、C1の最大値または平均値が一定の値より大きくなるように強制される。別の場合では、「最大値」または「平均値」のどちらを強制するかを、鍵に応じて擬似ランダムに選択するため、鍵が使用され、鍵はアルゴリズムのセキュリティを著しく高める。
上述の手法は、マスキング(知覚的)モデルを含むことができ、マスキング・モデルは、画像の各領域内の透かしの強度を分散させることを可能にし、透かしの知覚的影響を最小限に抑える。そのようなモデルは、知覚的損傷を伴わずに関係を強制するための操作が可能であるかどうかも決定することができる。以下では、ディジタル・シネマ・プロジェクタにおけるリアルタイム透かし挿入の文脈で、ビデオ・コンテンツ用のマスキング・モデルを組み込むための非限定的な方法について説明する。
画像に対する2つの主要なマスキング効果、すなわち、テクスチャ・マスキングおよび明るさマスキングが存在する。さらに、ビデオは、第3のマスキング効果、すなわち、時間的マスキングからも利益を得る。
計算用リソースが限られているが、リアルタイム透かし挿入を必要とするディジタル・シネマなどのいくつかのアプリケーションでは、例えば解像度レベル5など、最も低い解像度レベルのLL、LH、HL、およびHHサブバンド係数だけを利用することが望ましい。係数の最後の3つのタイプは、テクスチャの潜在的指標であり、LLは明るさの指標である。しかし、対応する解像度は低く、この解像度では、テクスチャ・マスキング効果は大きくない。これを説明するため、フル解像度のビデオ・フレームと解像度レベル5の係数から再構成された同じビデオ・フレームを比較する。図5を参照されたい。この解像度ではテクスチャの大部分は失われているように見える。従って、レベル5のLH、HL、およびHHサブバンド係数は、テクスチャの貧弱な指標であり、テクスチャ・マスキングを測定するために使用されない。
しかし、動きは一般に、ビデオのかなり大きな、従って低周波数のエリアに割り当てられるので、時間的マスキングは、かなり良い精度で推定することができる。時間的マスキングは、現在のフレームの係数から直前のフレームの係数を減算することによって測定することができる。C(f,c,l,b,x,y)は、フレームf、チャネル(すなわちカラー成分)c、解像度レベルl、サブバンドb(係数LL、LH、HL、HHに対してb=0から3)、位置x、yの係数を表す。従って、2つの連続フレーム上の同じタイプの係数の間の差の絶対値の総和は、時間的変化の有効な尺度である。
T(f,c,l,b,x,y)=avg(c=1....3)sum(b=0..3)(abs(C(f,c,l,b,x,y)−C(f−1,c,l,b,x,y))
与えられたフレームf、解像度レベルl=5に対して、T(f,c,l,b,x,y)が、すべての位置(x,y)、各カラー・チャネル(典型的には3つのカラー・チャネル/成分が存在する)について測定される。複数のチャネルが存在する場合、すべてのチャネルにわたるT(f,c,l,b,x,y)の平均値を取ると有利である。その後、各位置(x,y)毎に、T(f,c,l,b,x,y)の値が閾値tと比較され、その値がtよりも大きい場合、この位置における係数が変更される。実験的に、tとして良好な値は30である。係数が変更される場合、変更量は、従来技術で知られているように、輝度の関数とすることができる。
図6は、Dシネマ・サーバ(メディア・ブロック)における透かし挿入のブロック図である。メディア・ブロック600は、少なくとも透かし生成および透かし埋め込みを含む透かし挿入を実行するために、ハードウェア、ソフトウェア、ファームウェアなどとして実装されるモジュールを有する。モジュール605は、ペイロード生成を含む透かし生成を実行する。その後、符号化透かし610は、透かし埋め込みモジュール615に転送され、モジュール615は、J2K復号器625から画像の係数を受け取り、ウェーブレット係数620を選択および変更し、最終的に変更された係数をJ2K復号器625に返す。
上で説明したように、透かし生成モジュールは、ペイロードを生成し、ペイロードは、直接埋め込まれるビット系列である。透かし埋め込みモジュールは、入力としてペイロードを取得し、J2K復号器から画像のウェーブレット係数を受け取り、係数を選択および変更し、最終的に変更された係数をJ2K復号器に返す。J2K復号器は、J2K画像の復号を続け、伸張された画像を出力する。代替設計として、透かし生成モジュールおよび/または透かし埋め込みモジュールは、J2K復号器に統合することができる。
透かし生成モジュールは、ペイロード内のタイムスタンプを更新するために、定期的(例えば5分毎)に呼び出すことができる。従って、それは「オフライン」と呼ぶことができ、すなわち、透かしペイロードは、Dシネマ・サーバにおいて事前に生成しておくことができる。何れにしても、その計算要件は相対的に低い。しかし、透かし埋め込みは、リアルタイムで実行されなければならず、そのパフォーマンスはきわめて重要である。
ビデオ透かし埋め込みは、オリジナル・コンテンツが考慮される仕方について様々なレベルの複雑さで実行することができる。より複雑であることは、与えられた忠実度レベルでのさらなる堅牢性、または同じ堅牢性レベルでのさらなる忠実度を意味する。しかし、それは、計算量に関してさらなるコストを伴う。
ビデオ透かし埋め込みのために必要とされる演算の数を推定する前に、以下の基本的コンピュータ・ステップのどれもが、1つの演算と見なされることに留意されたい。
・係数のビット・シフト
・2つの係数の加算または減算
・2つの整数の乗算
・2つの係数の比較
・検索表内の値へのアクセス
以下の例では、C(f,c,l,b,x,y)およびC’(f,c,l,b,x,y)は、それぞれ、フレームf、カラー・チャネルc、ウェーブレット変換レベルl、周波数帯b(0:LL、1:LH、2:HL、3:HH)、位置x(幅)、y(高さ)における、オリジナル係数および透かし挿入済係数である。さらに、Nは、変更される必要がある、最も低い解像度レベルにおける係数の数であると仮定する。
簡潔にするため、以下では、ビデオ透かし埋め込み処理中、係数値は増加すると仮定する。しかし、式中、加算は減算によって等価的に置き換えられることに留意されたい。
各係数が同量だけ変更される場合、その結果、係数当たりただ1つの演算が存在し、
C’(f,c,l,b,x,y)=C(f,c,l,b,x,y)+a
ここで、値aは定数である。変更された係数のオーバーフローをチェックするために、さらに1つの比較演算が必要とされてよい。従って、総計算要件は、2×Nである。
しかし、上記のものは、効果的な方法ではない。実際、定数値aがあまりにも大きい場合、透かしは可視となる。従って、値aは、小さめの値でなければならず、すなわち、透かしが可視的アーチファクトを決して生じさせないだけ十分に小さくなければならないが、他方、ビデオ透かしがあまりにも小さめな場合、深刻な攻撃に耐えることができない。LLサブバンド係数は、局所的輝度に対応し、LH、HL、およびHH係数は、画像変化または「エネルギー」に対応する。人間の目は、明るいエリア(より強いLL係数)における輝度の変化にはあまり敏感でないことがよく知られている。人間の目は、変化の方向に応じて係数LH、HL、およびHHに依存する強い変化を有するエリア内の変化にもあまり敏感でない。しかし、これは慎重に考えるべきであり、LHおよびHL係数は、注意深く操作しなければならないエッジなどの知覚的に重要な変化に対応する。
それにも関わらず、少なくとも係数LLおよびHHについては、係数に比例する変更を行うのが有利である。単純な比例的変更は、オリジナル係数をコピーし、コピーした係数をビット・シフトし、ビット・シフトした係数を加算または減算することなどによって行うことができる。
C’(f,c,l,b,x,y)=C(f,c,l,b,x,y)+bitshift(C,n)
nの典型的な値は、7または8である。n=7または8である場合、係数は、オリジナル振幅の1/128または1/256だけ変更される。例えば、0から255までのスケール上で128の平均輝度を有する画像の場合、係数変更の影響は、1の輝度変化である。そのような変化は一般に、可視的アーチファクトを生成しない。
係数当たり2つの演算が存在する。可能なオーバーフロー・チェックを伴う場合、総計算要件は、3×Nであり、Nは操作される係数の数である。
非常に低い輝度を有するフレームの場合、透かしが十分に強く埋め込まれることを確実にするため、最小変化aを課すことが可能であることも留意されたい。この場合、C’(f,c,l,b,x,y)=C(f,c,l,b,x,y)+max(bitshift(C,n),a)となり、係数当たり3つの演算が存在する
加えて、係数に適応的変更を施すため、以下の知覚的特徴が使用できる。
・時間コンテキスト。時間的マスキングは、先行、現在、および後続フレーム内の係数を使用することによって最もよく推定される、時間的アクティビティに関係する。本発明は、時間的アクティビティを測定するため、先行および現在フレームの係数だけを使用する。高い時間的アクティビティは、より強い透かしを可能にする。時間的モデリングのための推定計算量は約4である。
・テクスチャ・コンテキスト。各係数C(f,c,b,l,x,y)毎に、テクスチャおよびフラットネスをモデル化するために、その他のサブバンド内のさらなるK個の対応する係数が使用でき、推定計算量は4K回の演算である。
・輝度コンテキスト。係数C(f,c,b,l,x,y)における輝度に従って重みを決定するために、検索表が使用できる。推定演算はBであり、Bは輝度値を表すビットの数である。
すべての知覚的特徴は、係数の変更を決定するために、加重化および均等化を施すことができ、
C(f,c,b,l,x,y)’=C(f,c,b,l,x,y)×(1+W)
ここで、Wはすべての知覚的特徴を組み合わせた重みである。
透かし埋め込みの複雑さの粗い推定は、便宜上、上で説明したような演算の回数に換算して推定される。演算の回数は、演算が定義される正確な方法、実装される透かし挿入、およびマスキング手続きなどに従って変化することに留意されたい。それにも関わらず、本発明の方法によってアクセスする必要のある相対的に少数の係数(画像サイズの1/1000のオーダ)と、係数当たり相対的に少数の演算を与えた場合、本発明の方法は堅牢であり、計算的に実現可能であると結論付けることができる。
ここで図7を参照すると、透かし検出は、全体として4つのステップ、すなわち、ビデオ準備705と、属性値の抽出および計算710と、ビット値の検出715と、埋め込み(透かし)情報の復号720とからなる。725で、透かし情報が正常に復号されたかどうかを決定するテストが実行される。透かし情報が正常に復号された場合、プロセスは完了する。透かし情報が正常に復号されなかった場合、上記のプロセスが繰り返される。
ビデオ準備自体は、ビデオ・コンテンツのスケーリングまたはリサンプリングと、ビデオ・コンテンツの同期化と、フィルタリングとを含む。
・埋め込みと検出とでフレーム・レートが異なる場合、変形(歪み)ビデオのリサンプリングを行わなければならないことがある。埋め込みのフレーム・レートが24であり、検出においては、例えば、25(PAL SECAM)または29.97(NTSC)である場合など、こうしたことはしばしばある。リサンプリングは、線形補間を使用して実行される。出力はリサンプリング・ビデオである。
・カバー・コンテンツに起因する雑音を低減し、透かしを強調するため、典型的にはハイパス時間フィルタを用いて、リサンプリング・ビデオをフィルタリングする。出力はフィルタリング・ビデオである。
・フィルタリング・ビデオの同期化は、オリジナル・コンテンツを用いる上で説明した様々な方法を使用して、または同期ビットがビデオ・コンテンツに埋め込まれている場合は同期ビットを用いた相互相関によって、行うことができる。一般に、非常に低い空間周波数が使用される場合、時間的位置合わせだけが、行われなければならない。大域的同期ユニットは、随意的に局所的同期ユニットと一緒に組み合わされて、透かし系列の開始点を決定するために使用される。フィルタリング・ビデオと既知の同期ビットの間で、相互相関が実行される。一般に、ビデオの一致するシフトに対して、相互相関関数内に強いピークが存在する。ここで図8を参照すると、805において、局所的同期プロセスは、次の局所的同期系列/ユニットを取り出す。810において、次の透かしチップに対応するビデオ部分が取り出される。815において、ビデオ部分と局所的同期系列/ユニットの相互相関が取られる。820において、相互相関属性値P1のピーク値が見出され、825において、属性値P2のピーク値が見出される。830において、属性値P1が属性値P2プラス所定の値より大きいか、それとも属性値P1が属性値P2プラス所定の値より小さいかを決定するために、テストが行われる。テスト結果が否定的である場合、835において、ビデオ部分は拒否される。テスト結果が肯定的である場合、840において、ビデオ部分は保持される。845において、ビデオの終わりに達したかどうかを決定するために、さらなるテストが行われる。ビデオの終わりに達した場合、局所的同期プロセスは完了する。ビデオの終わりに達していない場合、局所的同期プロセスが繰り返される。図9は、2つの連続する透かしチップの開始点を示す2つのピークをもつ、相互相関関数(実際には振幅のローパス・フィルタリング形)を示している。透かしチップの開始点が発見されると、各ペイロードの先頭に配置された局所的同期ユニットが、ビデオのわずかな再調整のために規則的な間隔で使用される。次に、12個の局所的同期ユニットの各々が、予想位置の周囲の小さな窓の中で、フィルタリング・ビデオと相互相関させられる。(最も高いピークと2番目に高いピークの間の差によって測定される)比較的強い相関ピークが見出された場合、隣接するフィルタリング・ビデオは、次のステップのために保持され、それ以外の場合、廃棄される。理論的根拠は、より強い相関ピークはフィルタリング・ビデオがより正確に同期していることの指標となることである。このステップの出力は同期化ビデオである。
ビデオ準備の3つのステップの出力は、以下では「処理済ビデオ」と呼ばれる。処理済ビデオは、透かし検出の次のステップである属性値の抽出/計算を容易にするように、受け取ったビデオから計算されたデータの集合である。
先に説明した透かし埋め込みの一実施形態では、4つの象限の各々の平均輝度が、各フレーム毎に計算される。属性値は、フレーム数×4のベクトルを形成する。LLサブバンド透かし挿入を使用するウェーブレット透かし埋め込みの場合、属性値は、受け取ったビデオのウェーブレットまたはベースバンド表現から抽出することができる。どちらの場合も、サイズがフレーム数×4の処理済ビデオが獲得される。上記の方式の両方で、フレームは、中央点から4つのパート/タイルに分割される。この中央点は、フレームの中心点に自動的に設定することができるが、オリジナル・ビデオ内にあるので、カムコーダ記録ビデオ内では、当然いくらかのオフセットを有する。
LHおよびHLサブバンドを使用するウェーブレット透かし埋め込みのための属性値の抽出および計算は、わずかに異なる動作を行う。LH係数の変更は、どのような攻撃も受けない前に少なくとも透かし挿入ビデオにおいて、正確に決定できる周波数でストライプ(ストライプはベースバンド・ビデオ内の等間隔の水平線である)を生成する。ストライプは、上で説明したようにマスキング・モデルを使用して透かしのエネルギーが調整される場合、可視とはならない。従って、(例えばフーリエ変換を使用して)その周波数においてエネルギーを測定することによって、変換ビデオを計算することができる。しかし、カムコーダ攻撃および後続のビデオのクロッピング中、関連周波数はシフトされ、そのエネルギーは近隣周波数上に拡散する。従って、すべてのフレームのエネルギー信号は、関連周波数の周囲の5×5の窓内に集められる。これら25個の信号の各々は、同期ビット系列との相互相関のピークに関してテストされ、最も高いピークをもつ信号が、属性値として出力される。
透かし検出フェーズにおいて、透かしがどのように埋め込まれているかに対応して、属性値が計算される。透かしは、
・連続するフレームの属性値、
・フレームの領域の1つの属性値と所定の値、
・フレームの1つの領域と同じフレームの別の領域の属性値、
・フレームの1つの領域と連続するフレームの対応する領域の属性値
の2つおよび/または3つ以上の間に、少なくとも以下の関係を強制することによって埋め込むことができる。
属性値は係数値自体でもあることができるので、透かしは、
・ビデオ・ボリューム内の1つの係数値と所定の値、
・フレームの1つのサブバンド内の1つの係数値と連続するフレームの対応する位置およびサブバンドにあるその他の係数値、
・フレームの1つのサブバンド内の1つの係数値と同じフレームの別のサブバンドにある別の係数値
の2つおよび/または3つ以上の間に、少なくとも以下の関係を強制することによって埋め込むことができる。属性値は、ベースバンドおよび/または変換領域において計算することができる。透かし埋め込みと類似して、複数の属性値の2つおよび/または3つ以上の間の複数の関係から、複数のビットが検出できる。
透かし検出の第1のステップと第2のステップは、順序に関して交換することができる。便宜上、可能ならば、属性値を最初に計算するほうが有利であり、それは、透かしがより容易に読み取れる形式に適合したデータのコンパクト化をもたらす(すなわち、各フレームの全画像データをフレーム当たり数個の値に低減する)からである。しかし、ビデオの深刻な歪み、特に幾何学的歪みのため、属性値の計算を最初に実行することが常に可能であるとは限らない。
第3のステップは、入力として属性値を受け取り、127個の符号化ビットの各々について最も可能性の高いビット値を出力する。属性値は、符号化された127ビットの各々の複数の挿入に対応する。各ビットが12の異なる位置に挿入される本発明の原理による一例では、最大で12の挿入が行われるが、不良な局所的同期のために、あるペイロード・ユニットが廃棄された場合はより少ない。
ここで図10を参照すると、1005において、次の符号化ビットのために、互いに素の係数集合が取り出される。1010において、互いに素の係数集合について、関連属性値が計算される。1015において、計算された属性値から、最も可能性の高いビット値が決定される。1020において、さらなる符号化ビットが存在するかどうかを決定するため、テストが実行される。さらなる符号化ビットが存在する場合、上記のプロセスが繰り返される。例示的な蓄積信号が、図11に示されている。
符号化ペイロードの各ビットは、拡張され、暗号化され、コンテンツ内の複数の位置に挿入される。拡張されたビットの各々について、上で説明したように、挿入は一般に、2つの係数集合C1およびC2の属性値の間に、例えば、P(C1)>P(C2)などの制約を設定することによって行われる。N個のそのような拡張されたビット、従って、N個のそのような挿入される制約が存在すると仮定すると、
1≦i≦Nである各iについて、P(C1i)>P(C2i)ならば、ビット=1、
1≦i≦Nである各iについて、P(C1i)<P(C2i)ならば、ビット=0
である。
一般に、チャネル雑音または関係確立の初期不可能性のため、すべての関係が、挿入ビットと一致するとは限らない。この問題を解決するための最も簡単な手法は、「多数決」を利用することである。すなわち、係数間の対応する関係が最も頻繁に観測されるビットを選択する。
P(C1i)<P(C2i)(1≦i≦N)である場合の数がN/2よりも多いならば、ビット=1、
それ以外は、ビット=0。
この手法は、Nが偶数の場合と、ビット=1およびビット=0の関係の数が等しい場合は解決に役立たない。さらに、この手法は、P(C1)、P(C2)の情報、およびおそらくは関係を正しく決定する可能性を高めることができるその他の情報を十分に利用しない。より精細な手法は、属性値P(C1i)およびP(C2i)の観測値を与えられて、挿入ビット値が1である確率、0である確率をそれぞれ推定することからなる。個別に推定された確率は、確率的手法を使用して組み合わされ、最もありそうなビットが選択される最尤(ML)基準に基づいて決定が行われる。ネイマン−ピアソンの規則など、その他の基準も可能である。
最もありそうなビットが選択されるML規則を使用する場合、決定は属性値だけに基づいている。その場合、ML規則は、
Prob(bit=1;P(C11),P(C21),...,P(C1N),P(C2N))>Prob(bit=0;P(C11),P(C21),...,P(C1N),P(C2N))ならば、ビット=1
と表される。ベイズの規則を使用し、各ビット値が等確率であると仮定すると、これは、
Prob(P(C11),P(C21),...,P(C1N),P(C2N);bit=1)>Prob(P(C11),P(C21),...,P(C1N),P(C2N);bit=0)
と書き直すことができる。
ビットはコンテンツ内の異なる擬似ランダム位置で拡張されるので、属性値は相対的に独立であると仮定することができる。すなわち、
i=1,..,Nについて、Prob(P(C1i),P(C2i);bit=1)/Prob(P(C1i),P(C2i);bit=0)>1
対数を取ると、
Sum i=1,..,N(log(Prob(P(C1i),P(C2i);bit=1)−log(Prob(P(C1i),P(C2i);bit=0)))>0
この式を実施するため、式Prob(P(C1i),P(C2i);bit=1)およびProb(P(C1i),P(C2i);bit=0)を導く必要がある。これらの式は、チャネルの属性に依存する。一般的な技法は、この関数を推定するために十分なデータを収集することからなる。確率モデルについてのいくつかの事前知識または仮定(例えば、係数または雑音はガウス分布に従う)が使用できる。
確率の対数がP(C1i)とP(C2i)の間の差に比例し、ビット1とビット0が対称的である、非常に特殊な場合を考えると、
Log(a1×Prob(P(C1i),P(C2i);bit=1))=a2×(P(C1i)−P(C2i))
Log(a1×Prob(P(C1i),P(C2i);bit=0))=−a2×(P(C1i)−P(C2i))
となる。その場合、規則は、
Sum i=1,..,N 2×a2((P(C1i)−P(C2i)))>0
または
Sum i=1,..,N P(C1i)>Sum i=1,..,N P(C2i)
となる。
この特殊な場合について導かれた規則は、単純相関に対応し、同様にスペクトル拡散システムで使用されるものに対応する。しかし、一般に確率は差に対して対数的に変化しないので、この規則は準最適である。これは、本発明の方法がスペクトル拡散ベースの方法よりも汎用的且つ効果的に見える1つの理由である。
実際に、制約が挿入される特殊な方法、すなわち、オリジナル・コンテンツ値に依存する特殊な方法のため、確率は一般に単調増加関数でないことが分かる。それを説明するため、それぞれ本発明の関係ベースの手法と従来のスペクトル拡散手法について、受け取った信号の観測値に基づいてビット値の推定が比較された、以下のシミュレーションが実行された。
オリジナル・コンテンツのガウス雑音Xが生成された。バイナリ透かしWが、[−1,+1]内で値を取るこの信号に追加された。バイナリ透かしは、最初に制約ベースの概念に従って、以下のように追加された。
X>a1ならば、Y=X
X<a2ならば、Y=X
それ以外ならば、Y1=X+r×W
a1=0.5、a2=−0.5、r=0.3という値が選択された。これは−15dBのPSNRをもたらした。
次に、スペクトル拡散透かしが、生成された信号に以下のように追加された。
Y2=X+a×W
パラメータ「a」は、同じ−15dBのPSNRをもたらすように調整された。
同じ雑音ベクトルNが、2つの信号Y1およびY2に追加されて、2つの受信信号R1=Y1+NおよびR2=Y2+Nを得た。雑音も、オリジナル・コンテンツに関して−10dBのPSNRを有した。2つの受信コンテンツR1およびR2について、受信信号値を与えた場合に埋め込みビットが「1」である確率が推定された。図12に示されたグラフに結果がプロットされている。相違は予想通り顕著であり、スペクトル拡散埋め込みの場合、ビットが1である推定確率は、受信信号値と共に線形に増加している。しかし、本発明の関係ベースの手法の場合、推定確率は、最小を通過し、次に最大を通過する、非常に特殊な形状を有している。この形状は、以下のように説明することができる。
・カバー・コンテンツが高い値または低い値を有する場合、それは埋め込みのために使用されていない可能性が非常に高く、従って、受信信号がビットと無相関であるのは論理にかなっている。
・推定は−0.5および+0.5において最も信頼性が高く、そこは透かしが埋め込まれた最小値/最大値である。
従って、本発明の方法が適切に機能するには、確率の正しい推定がきわめて重要であると結論付けることができる。
最終ステップにおいて、符号化ペイロードの127個のビット値が推定されると、64ビット・ペイロードは、BCH復号器を使用して復号することができる。そのような符号を用いた場合、最大10個までの誤りが、推定された符号化ペイロードから検出できる。上で説明したように、このペイロードは、ディジタル・シネマ・アプリケーションにおけるロケーション/プロジェクタ識別子およびタイムスタンプなど、フォレンシック追跡用の様々な情報を含む。この情報は、復号ペイロードから抽出され、発生した潜在的不正のフォレンシック追跡など、広範な使用を可能にする。
最終ステップにおいて失敗した(すなわち、有効な透かし情報が復号されない)場合、透かし情報が正常に復号されるか、またはそのような試みの最大回数に達するまで、上記の4つのステップが、各ステップ毎に異なる戦略(例えば、第1のステップにおけるビデオの最適同期および位置合わせ)を用いて繰り返される。
本発明は、例えばサーバまたはモバイル装置内で、ハードウェア(例えばASICチップ)、ソフトウェア、ファームウェア、専用プロセッサ、またはそれらの組み合わせなど、様々な形態で実装することができることを理解されたい。好ましくは、本発明は、ハードウェアとソフトウェアの組み合わせとして実装される。さらに、ソフトウェアは好ましくは、プログラム記憶装置上に有形に具現されたアプリケーション・プログラムとして実施される。アプリケーション・プログラムは、適切なアーキテクチャを備えるマシンにアップロードされ、マシンによって実行される。好ましくは、マシンは、1つまたは複数の中央処理装置(CPU)、ランダム・アクセス・メモリ(RAM)、および入力/出力(I/O)インタフェースなどのハードウェアを有するコンピュータ・プラットフォーム上で実施される。コンピュータ・プラットフォームは、オペレーティング・システムおよびマイクロ命令コードも含む。本明細書で説明した様々なプロセスおよび機能は、マイクロ命令コードの一部、またはオペレーティング・システムを介して実行されるアプリケーション・プログラムの一部(またはそれらの組み合わせ)であってよい。さらに、追加のデータ記憶装置およびプリンタ装置など、その他の様々な周辺装置が、コンピュータ・プラットフォームに接続できる。
添付の図面に示された構成システム・コンポーネントおよび方法ステップのいくつかは、好ましくはソフトウェアで実施されるので、システム・コンポーネント(またはプロセス・ステップ)間の実際の接続は、本発明がプログラムされる仕方に応じて異なることをさらに理解されたい。本明細書の教示を与えることで、当業者であれば、本発明の上記および類似の実装または構成を企図することができよう。
5レベル・ウェーブレット変換の1つの成分におけるビデオ表現の図である。 透かし挿入のうちのペイロード生成ステップを示すフローチャートである。 透かし挿入のうちの係数選択ステップを示すフローチャートである。 透かし挿入のうちの係数変更ステップを示すフローチャートである。 フル解像度のビデオ・フレームと解像度レベル5における係数から再構成されたビデオ・フレームとを示す図である。 Dシネマ・サーバ(メディア・ブロック)における透かし挿入のブロック図である。 ビデオ透かし検出を示すフローチャートである。 ビデオ透かし検出のための信号準備を示すフローチャートである。 相互相関関数を示す図である。 ビデオ透かし検出におけるビット値の検出を示すフローチャートである。 蓄積信号を示す図である。 スペクトル拡散埋め込みと本発明の関係ベースの手法の推定確率を示す図である。

Claims (38)

  1. ビデオのボリューム内の選択された係数集合の属性値の間に関係を強制することによって透かしを埋め込むために係数集合を選択するための方法。
  2. 前記属性値が、前記選択された係数集合に関して相対的にインバリアントである、請求項1に記載の方法。
  3. 前記選択された係数集合が、前記ビデオのボリュームの空間領域および変換領域の一方から選択される、請求項1に記載の方法。
  4. 少なくとも1つの所定の値と前記選択された係数集合の1つとが、前記透かしの1ビットを埋め込むために選択される、請求項1に記載の方法。
  5. 少なくとも2つの係数集合が、前記透かしの1ビットを埋め込むために選択される、請求項1に記載の方法。
  6. 前記ビデオのボリュームの第1のフレームの第1の領域から第1の係数集合を選択するステップと、
    前記第1の係数集合のための少なくとも1つの関連する大域的属性を決定するステップと、
    を含む、請求項1に記載の方法。
  7. 前記ビデオのボリュームの第2のフレームの領域から第2の係数集合を選択するステップと、
    前記第2の係数集合のための少なくとも1つの関連する大域的属性を決定するステップと、
    を含む、請求項6に記載の方法。
  8. 前記ビデオのボリュームの前記第1のフレームの第2の領域から第2の係数集合を選択するステップと、
    前記第2の係数集合のための少なくとも1つの関連する大域的属性を決定するステップと、
    を含む、請求項6に記載の方法。
  9. 前記第2のフレームが、前記第1のフレームに連続するフレームであり、前記第1の係数集合および前記第2の係数集合が、それぞれ前記第1のフレームおよび前記第2のフレームから同じ方法で選択される、請求項7に記載の方法。
  10. 前記第1の係数集合が、前記第1のフレームの上部領域の係数を含み、前記第2の係数集合が、前記第1のフレームの下部領域の係数を含む、請求項8に記載の方法。
  11. 前記第1の係数集合が、前記第1のフレームの上部領域の係数を含み、前記第2の係数集合が、前記第2のフレームの上部領域の係数を含む、請求項7に記載の方法。
  12. 前記ビデオのボリュームの前記第1のフレームが、前記第1のフレームの中心点から4つのタイルに分割される、請求項8に記載の方法。
  13. 前記第1の係数集合が、前記4つのタイルの1つの係数を含み、前記第2の係数集合が、前記4つのタイルの第2のタイルの係数を含む、請求項12に記載の方法。
  14. 前記ビデオのボリュームの前記第1のフレームが、前記第1のフレームの中心点から4つのタイルに分割され、それに対応して、前記ビデオのボリュームの前記第2のフレームが、前記第2のフレームの中心点から4つのタイルに分割される、請求項7に記載の方法。
  15. 前記第1の係数集合が、前記第1のフレームの前記4つのタイルの1つの係数を含み、前記第2の係数集合が、前記第2のフレームの前記4つのタイルの対応する1つの係数を含む、請求項14に記載の方法。
  16. 鍵に基づいて前記係数選択をランダム化するステップと、
    前記ランダム化された選択係数を変換領域において2つの互いに素の係数集合にグループ化するステップと、
    前記ランダム化された選択係数集合の各々のために少なくとも1つの関連する大域的属性を識別するステップと、
    を含む、請求項1に記載の方法。
  17. 前記関連する大域的属性が、前記互いに素の係数集合の間でインバリアントである、請求項16に記載の方法。
  18. 前記係数が、所定のレベルLにおける所定の数Nのウェーブレット係数からなる、請求項1に記載の方法。
  19. 前記透かしが、ビット系列である、請求項1に記載の方法。
  20. ビデオのボリューム内の選択された係数集合の属性値の間に関係を強制することによって透かしを埋め込むために係数集合を選択するためのシステム。
  21. 前記属性値が、前記選択された係数集合に関して相対的にインバリアントである、請求項20に記載のシステム。
  22. 前記選択された係数集合が、前記ビデオのボリュームの空間領域および変換領域の一方から選択される、請求項20に記載のシステム。
  23. 少なくとも1つの所定の値と前記選択された係数集合の1つとが、前記透かしの1ビットを埋め込むために選択される、請求項20に記載のシステム。
  24. 少なくとも2つの係数集合が、前記透かしの1ビットを埋め込むために選択される、請求項20に記載のシステム。
  25. 前記ビデオのボリュームの第1のフレームの第1の領域から第1の係数集合を選択する手段と、
    前記第1の係数集合のための少なくとも1つの関連する大域的属性を決定する手段と、
    を含む、請求項20に記載のシステム。
  26. 前記ビデオのボリュームの第2のフレームの領域から第2の係数集合を選択する手段と、
    前記第2の係数集合のための少なくとも1つの関連する大域的属性を決定する手段と、
    を含む、請求項25に記載のシステム。
  27. 前記ビデオのボリュームの前記第1のフレームの第2の領域から第2の係数集合を選択する手段と、
    前記第2の係数集合のための少なくとも1つの関連する大域的属性を決定する手段と、
    を含む、請求項25に記載のシステム。
  28. 前記第2のフレームが、前記第1のフレームに連続するフレームであり、前記第1の係数集合および前記第2の係数集合が、それぞれ前記第1のフレームおよび前記第2のフレームから同じ方法で選択される、請求項26に記載のシステム。
  29. 前記第1の係数集合が、前記第1のフレームの上部領域の係数を含み、前記第2の係数集合が、前記第1のフレームの下部領域の係数を含む、請求項27に記載のシステム。
  30. 前記第1の係数集合が、前記第1のフレームの上部領域の係数を含み、前記第2の係数集合が、前記第2のフレームの上部領域の係数を含む、請求項26に記載のシステム。
  31. 前記ビデオのボリュームの前記第1のフレームが、前記第1のフレームの中心点から4つのタイルに分割される、請求項27に記載のシステム。
  32. 前記第1の係数集合が、前記4つのタイルの1つの係数を含み、前記第2の係数集合が、前記4つのタイルの第2のタイルの係数を含む、請求項31に記載のシステム。
  33. 前記ビデオのボリュームの前記第1のフレームが、前記第1のフレームの中心点から4つのタイルに分割され、それに対応して、前記ビデオのボリュームの前記第2のフレームが、前記第2のフレームの中心点から4つのタイルに分割される、請求項26に記載のシステム。
  34. 前記第1の係数集合が、前記第1のフレームの前記4つのタイルの1つの係数を含み、前記第2の係数集合が、前記第2のフレームの前記4つのタイルの対応する1つの係数を含む、請求項33に記載のシステム。
  35. 鍵に基づいて前記係数選択をランダム化する手段と、
    前記ランダム化された選択係数を変換領域において2つの互いに素の係数集合にグループ化する手段と、
    前記ランダム化された選択係数集合の各々のために少なくとも1つの関連する大域的属性を識別する手段と、
    を含む、請求項20に記載のシステム。
  36. 前記関連する大域的属性が、前記互いに素の係数集合の間でインバリアントである、請求項35に記載のシステム。
  37. 前記係数が、所定のレベルLにおける所定の数Nのウェーブレット係数からなる、請求項20に記載のシステム。
  38. 前記透かしが、ビット系列である、請求項20に記載のシステム。
JP2008529969A 2005-09-09 2005-09-09 ビデオ透かし挿入のための係数選択 Pending JP2009508392A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2005/032252 WO2007032753A1 (en) 2005-09-09 2005-09-09 Coefficient selection for video watermarking

Publications (1)

Publication Number Publication Date
JP2009508392A true JP2009508392A (ja) 2009-02-26

Family

ID=36295110

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008529969A Pending JP2009508392A (ja) 2005-09-09 2005-09-09 ビデオ透かし挿入のための係数選択

Country Status (6)

Country Link
US (1) US20090136083A1 (ja)
EP (1) EP1932359A1 (ja)
JP (1) JP2009508392A (ja)
CN (1) CN101258752B (ja)
BR (1) BRPI0520527A2 (ja)
WO (1) WO2007032753A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007032760A1 (en) * 2005-09-09 2007-03-22 Thomson Licensing Coefficient modification for video watermarking
EP1932360A1 (en) * 2005-09-09 2008-06-18 Thomson Licensing Video watermark detection
JP2009508393A (ja) * 2005-09-09 2009-02-26 トムソン ライセンシング ビデオ透かし挿入
JP2008131282A (ja) * 2006-11-20 2008-06-05 Sony Corp 映像伝送方法、映像伝送システム及び映像処理装置
WO2010021694A1 (en) * 2008-08-20 2010-02-25 Thomson Licensing Selection of watermarks for the watermarking of compressed video
US8913779B2 (en) 2010-02-02 2014-12-16 Futurewei Technologies, Inc. System and method for securing media content
US8542869B2 (en) * 2010-06-02 2013-09-24 Dolby Laboratories Licensing Corporation Projection based hashing that balances robustness and sensitivity of media fingerprints
FR2965444B1 (fr) * 2010-09-24 2012-10-05 St Microelectronics Grenoble 2 Transmission de video 3d sur une infrastructure de transport historique
US9836433B1 (en) * 2012-04-02 2017-12-05 Rockwell Collins, Inc. Image processing using multiprocessor discrete wavelet transform
US8874924B2 (en) * 2012-11-07 2014-10-28 The Nielsen Company (Us), Llc Methods and apparatus to identify media
AU2014250673B2 (en) * 2012-11-07 2016-05-19 The Nielsen Company (Us), Llc Methods and apparatus to identify media
US9313360B2 (en) * 2014-07-30 2016-04-12 Hewlett-Packard Development Company, L.P. Encoding data in an image
US10062134B2 (en) * 2016-06-24 2018-08-28 The Nielsen Company (Us), Llc Methods and apparatus to perform symbol-based watermark detection
US20210360236A1 (en) * 2019-01-30 2021-11-18 Omnivor, Inc. System and method for encoding a block-based volumetric video having a plurality of video frames of a 3d object into a 2d video format
CN112559985B (zh) * 2020-12-22 2024-02-20 深圳昂楷科技有限公司 一种水印嵌入及提取方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001313814A (ja) * 2000-04-28 2001-11-09 Canon Inc 画像処理装置及び画像処理方法並びに記憶媒体
JP2002325170A (ja) * 2001-04-24 2002-11-08 Canon Inc 画像処理装置及びその方法並びにプログラムコード、記憶媒体
JP2005012405A (ja) * 2003-06-18 2005-01-13 Mitsubishi Electric Corp 電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、電子透かし検出プログラム

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2252468B (en) * 1991-02-04 1994-10-19 Sony Broadcast & Communication Television standards converters
US7720249B2 (en) * 1993-11-18 2010-05-18 Digimarc Corporation Watermark embedder and reader
US6590996B1 (en) * 2000-02-14 2003-07-08 Digimarc Corporation Color adaptive watermarking
CA2184949C (en) * 1995-09-28 2000-05-30 Ingemar J. Cox Secure spread spectrum watermarking for multimedia data
EP0901274B1 (en) * 1997-09-03 2004-04-07 Hitachi, Ltd. Method and system for embedding information into contents
AU729762B2 (en) * 1997-10-08 2001-02-08 Digimarc Corporation Method and apparatus for a copy-once watermark for video recording
US6594629B1 (en) * 1999-08-06 2003-07-15 International Business Machines Corporation Methods and apparatus for audio-visual speech detection and recognition
US6456726B1 (en) * 1999-10-26 2002-09-24 Matsushita Electric Industrial Co., Ltd. Methods and apparatus for multi-layer data hiding
EP1118961B1 (en) * 1999-11-25 2007-08-29 Matsushita Electric Industrial Co., Ltd. Apparatus and method for embedding information for tamper detection
US6741758B2 (en) * 2000-04-07 2004-05-25 Canon Kabushiki Kaisha Image processor and image processing method
US7346776B2 (en) * 2000-09-11 2008-03-18 Digimarc Corporation Authenticating media signals by adjusting frequency characteristics to reference values
JP3431593B2 (ja) * 2000-10-31 2003-07-28 株式会社東芝 コンテンツ生成装置、電子透かし検出装置、コンテンツ生成方法、電子透かし検出方法及び記録媒体
US6785401B2 (en) * 2001-04-09 2004-08-31 Tektronix, Inc. Temporal synchronization of video watermark decoding
EP1384376A4 (en) * 2001-04-11 2010-08-25 Nice Systems Ltd DIGITAL VIDEO PROTECTION FOR AUTHENTICITY VERIFICATION
KR100378222B1 (ko) * 2001-04-21 2003-03-29 주식회사 마크애니 디지털 워터마크의 삽입 및 검출방법과 이를 이용한워터마크 삽입/검출 장치
CN1305312C (zh) * 2001-06-21 2007-03-14 皇家菲利浦电子有限公司 在运动图像信号中嵌入和检测水印的方法和设备
US7068809B2 (en) * 2001-08-27 2006-06-27 Digimarc Corporation Segmentation in digital watermarking
US7020304B2 (en) * 2002-01-22 2006-03-28 Digimarc Corporation Digital watermarking and fingerprinting including synchronization, layering, version control, and compressed embedding
US7546467B2 (en) * 2002-03-28 2009-06-09 Koninklijke Philips Electronics N.V. Time domain watermarking of multimedia signals
DE10216261A1 (de) * 2002-04-12 2003-11-06 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbetten von Wasserzeicheninformationen und Verfahren und Vorrichtung zum Extrahieren von eingebetteten Wasserzeicheninformationen
US6885757B2 (en) * 2002-04-18 2005-04-26 Sarnoff Corporation Method and apparatus for providing an asymmetric watermark carrier
US6782116B1 (en) * 2002-11-04 2004-08-24 Mediasec Technologies, Gmbh Apparatus and methods for improving detection of watermarks in content that has undergone a lossy transformation
JP3960959B2 (ja) * 2002-11-08 2007-08-15 三洋電機株式会社 電子透かし埋め込み装置と方法ならびに電子透かし抽出装置と方法
JP3960597B2 (ja) * 2002-11-11 2007-08-15 株式会社リコー 符号生成装置、画像処理装置、符号生成プログラム、画像処理プログラムおよび記憶媒体
EP1588556B1 (en) * 2003-01-20 2006-09-27 Koninklijke Philips Electronics N.V. Watermark embedding and detection of a motion image signal
JP4726141B2 (ja) * 2003-06-25 2011-07-20 トムソン ライセンシング 圧縮されたビデオ・ビットストリームにおける電子透かしの挿入のための符号化方法および装置
JP4167590B2 (ja) * 2003-12-22 2008-10-15 株式会社東芝 画像処理方法
TWI288873B (en) * 2004-02-17 2007-10-21 Mitsubishi Electric Corp Method for burying watermarks, method and device for inspecting watermarks
GB2421136A (en) * 2004-12-09 2006-06-14 Sony Uk Ltd Detection of code word coefficients in a watermarked image
GB2421133A (en) * 2004-12-09 2006-06-14 Sony Uk Ltd Registering a water marked image by calculating distortion vector estimates
US20060195704A1 (en) * 2005-01-27 2006-08-31 Hewlett-Packard Development Company, L.P. Disk array encryption element
US7761702B2 (en) * 2005-04-15 2010-07-20 Cisco Technology, Inc. Method and apparatus for distributing group data in a tunneled encrypted virtual private network
US20060239500A1 (en) * 2005-04-20 2006-10-26 Meyer Thomas W Method of and apparatus for reversibly adding watermarking data to compressed digital media files
WO2007032760A1 (en) * 2005-09-09 2007-03-22 Thomson Licensing Coefficient modification for video watermarking
EP1932360A1 (en) * 2005-09-09 2008-06-18 Thomson Licensing Video watermark detection

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001313814A (ja) * 2000-04-28 2001-11-09 Canon Inc 画像処理装置及び画像処理方法並びに記憶媒体
JP2002325170A (ja) * 2001-04-24 2002-11-08 Canon Inc 画像処理装置及びその方法並びにプログラムコード、記憶媒体
JP2005012405A (ja) * 2003-06-18 2005-01-13 Mitsubishi Electric Corp 電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、電子透かし検出プログラム

Also Published As

Publication number Publication date
CN101258752B (zh) 2011-04-13
US20090136083A1 (en) 2009-05-28
CN101258752A (zh) 2008-09-03
WO2007032753A1 (en) 2007-03-22
EP1932359A1 (en) 2008-06-18
BRPI0520527A2 (pt) 2009-05-12

Similar Documents

Publication Publication Date Title
JP2009508393A (ja) ビデオ透かし挿入
JP2009508391A (ja) ビデオ透かし検出
JP2009508392A (ja) ビデオ透かし挿入のための係数選択
JP2009508395A (ja) ビデオ透かし挿入のための係数修正
Caldelli et al. Reversible watermarking techniques: An overview and a classification
KR101125351B1 (ko) 디지털 이미지 처리 방법 및 시스템
US9773290B2 (en) Content watermarking
Al-Qershi et al. Two-dimensional difference expansion (2D-DE) scheme with a characteristics-based threshold
Sherly et al. A compressed video steganography using TPVD
KR19980042061A (ko) 디지탈 워터마크 삽입 및 추출 방법
JP2000138818A (ja) ロバストなデジタル電子透かし入れ信号の挿入方法および電子透かし検出方法
CN110232650B (zh) 一种彩色图像水印嵌入方法、检测方法及系统
JP2009514305A (ja) 情報信号にデータを埋め込む方法
Tappe et al. An improved image steganography technique based on LSB
KR100973302B1 (ko) 모바일단말의 워터마킹 방법
CN113497908B (zh) 数据处理方法、装置、电子设备及存储设备
KR20080045163A (ko) 비디오 워터마킹
KR20080043320A (ko) 비디오 워터마크 검출
WO2007032754A1 (en) Detection of bit values of a watermark
KR20080043323A (ko) 비디오 워터마킹을 위한 계수 변경
KR20080043321A (ko) 비디오 워터마킹을 위한 계수 선택
KR101025311B1 (ko) 복합적 왜곡에 강인한 자기 동기화 신호 기반의 고화질 동영상 워터마킹 시스템
Liang et al. Adaptive Video Dual Domain Watermarking Scheme Based on PHT Moment and Optimized Spread Transform Dither Modulation
Huang et al. Video Watermarking Algorithm Based on Pseudo 3D DCT and Quantization Index Modulation.
Kumari et al. Watermarking using modulo algorithms for gray images

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110601

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110826

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111130

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120606