JP2005122694A - データコンテンツの識別 - Google Patents

データコンテンツの識別 Download PDF

Info

Publication number
JP2005122694A
JP2005122694A JP2004216238A JP2004216238A JP2005122694A JP 2005122694 A JP2005122694 A JP 2005122694A JP 2004216238 A JP2004216238 A JP 2004216238A JP 2004216238 A JP2004216238 A JP 2004216238A JP 2005122694 A JP2005122694 A JP 2005122694A
Authority
JP
Japan
Prior art keywords
identification data
content
instances
version
segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004216238A
Other languages
English (en)
Inventor
Jason Charles Pelly
ペリー ジェイソン チャールズ
Daniel Warren Tapson
タプソン、ダニエル ワレン
Mark Julian Russell
マーク ラッセル、ジュリアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Europe BV United Kingdom Branch
Original Assignee
Sony United Kingdom Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony United Kingdom Ltd filed Critical Sony United Kingdom Ltd
Publication of JP2005122694A publication Critical patent/JP2005122694A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/005Robust watermarking, e.g. average attack or collusion attack resistant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/0085Time domain based watermarking, e.g. watermarks spread over several images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00094Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving measures which result in a restriction to authorised record carriers
    • G11B20/00123Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving measures which result in a restriction to authorised record carriers the record carrier being identified by recognising some of its unique characteristics, e.g. a unique defect pattern serving as a physical signature of the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00166Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving measures which result in a restriction to authorised contents recorded on or reproduced from a record carrier, e.g. music or software
    • G11B20/00173Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving measures which result in a restriction to authorised contents recorded on or reproduced from a record carrier, e.g. music or software wherein the origin of the content is checked, e.g. determining whether the content has originally been retrieved from a legal disc copy or another trusted source
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8358Generation of protective data, e.g. certificates involving watermark
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0063Image watermarking in relation to collusion attacks, e.g. collusion attack resistant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0065Extraction of an embedded watermark; Reliable detection
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Storage Device Security (AREA)

Abstract

【課題】ユーザのデータコンテンツのバージョンが不正なコピーのソースであることを検出する方法を提供する。
【解決手段】データコンテンツは、セグメント化パターンに基づく2以上のセグメントとして配列され、データコンテンツのバージョンは、セグメントの少なくとも一部が各識別データを含むことによる対応する識別データパターンによって識別可能であり、検出方法は、(1)入力されたデータコンテンツのセグメントに関する識別データを検出するステップと、(2)検出された識別データと、データコンテンツの異なるバージョンに対応する識別データパターンとを比較するステップと、(3)検出された識別データとあるバージョンに関する識別データパターンとの間から得られる一致の合計が閾値を超えたとき、入力コンテンツコンテンツが少なくともデータコンテンツのあるバージョンからの貢献含むことを検出するステップとを有する。
【選択図】図8

Description

本発明は、データコンテンツの識別に関する。このようなコンテンツとしては、例えば、オーディオビジュアルコンテンツなど、ビデオコンテンツ、オーディオコンテンツ、メタデータコンテンツ、テキストコンテンツ、イメージコンテンツなどの1つ以上が含まれる。
演算パワーが強化されたデジタル機器及び高速ネットワークを含む新たなデジタルインフラストラクチャの成長により、コンテンツの作成、処理及び配布が簡単で高速に行えるようになった。これはコンテンツの合法的な使用にも大いに役立つが、このようなコンテンツ(特に、著作権コンテンツ)を権限なく使用したり「剽窃」したりする行為、例えば、権限のない再生又は配布もより容易に行うことができるようになり、コンテンツの所有者の被害も大きくなっている。
例えば、専門家によるコンテンツのレビュー(professional review of the content)の一部として、又はユーザがコンテンツを使用する権利を所有者から購入する前に、商業目的で、コンテンツの所有者が潜在的ユーザにコンテンツの視聴又は使用を試させる場合があり、このことが状況をより複雑にしている。例えば映画フィルムの場合、非常に多くのコピーが上述のような目的で出回ることがある。
コンテンツに識別データを付与するための所謂「フィンガプリント(fingerprinting)」法が提案されている。この手法では、権限のないコピーを防止することはできないが、これにより権限のないコピーの出所を検出することができる。ビデオ信号に適用されるフィンガプリント法の実施例は、英国特許公開公報第GB−A−2383221号や米国特許公報第A−5664018号に開示されている。
しかしながら、この技術は、実行するのに時間がかかる。本出願の優先日現在の技術では、映画フィルムの全編にフィンガプリント処理を適用するのに10時間もかかる場合がある。
本発明に係る検出方法は、複数の異なるバージョンが存在する入力データコンテンツのバージョンを検出する検出方法であって、データコンテンツは、セグメント化パターンに基づく2以上のセグメントとして配列され、データコンテンツのバージョンは、セグメントの少なくとも一部が各識別データを含むことによる対応する識別データパターンによって識別可能であり、検出方法は、(1)入力されたデータコンテンツのセグメントに関する識別データを検出するステップと、(2)検出された識別データと、データコンテンツの異なるバージョンに対応する識別データパターンとを比較するステップと、(3)検出された識別データとあるバージョンに関する識別データパターンとの間から得られる一致の合計が閾値を超えたとき、入力コンテンツコンテンツが少なくともデータコンテンツのあるバージョンからの貢献含むことを検出するステップとを有する。
本発明は、少なくとも一部がフィンガプリントデータを含むコンテンツの複数のマスタコピーのセクション又は「セグメント」を結合することによって、フィンガプリントが付されたコンテンツを生成する新規な手法を提案する(ここで、「フィンガプリント」という用語は、理想的には、その存在が実質的にユーザによっては知覚されないように、識別データをコンテンツに安全に付加することを意味する)。セグメントは、そのコンテンツのコピーの特定のユーザに固有又は擬似固有であるセグメント化パターンに基づいて結合される。この新規な提案の利点は、個々のコピーのそれぞれに完全なフィンガプリント処理を施す場合に必要となる時間に比べて非常に短い時間で固有のフィンガプリントが付されたコンテンツのコピーを生成できるという点である。
コンテンツの海賊版コピーが発見された場合、海賊バージョンがコピーされたコンテンツのソースを特定できれば有用である。これにより、海賊版コピーの作成者又は他社によって海賊版コピーが作成されることを許した安全義務違反のユーザを特定することができる。この新規な提案においては、この特定は、各セグメントについて検出されたフィンガプリントが付されたデータと、ユーザに発行されたバージョン内の各セグメントに用いられていることが既知のフィンガプリントが付されたデータとの間の100%の一致の検出によって行ってもよい。
しかしながら、この基本的な手法は、1以上のフィンガプリントが付されたセグメントに関して、フィンガプリントの検出に失敗した場合を考慮していない。このような失敗は、コンテンツに対し、例えば映画フィルムの場合、所謂「カムコーダによる海賊行為」等のある種の処理が施された場合に起こり得る。また、この基本的な検出法は、フィンガプリントデータを削除又はその効果を弱めるために、海賊版コピーを複数の正当なコピーから作成する所謂「コルージョンアタック」を考慮していない。
本発明は、ユーザのバージョンが不正なコピーのソースであることを検出するために、検出された識別データと、ユーザのバージョンに対する識別データパターンとの間の一致の和を閾値と比較することによって、これらの問題のうち、少なくとも幾つかを解決する。
特に、個々のセグメントから複数の識別データが導出されるような所謂コルージョンアタックがある場合、誤検出確率を所望の確率に抑えるために、入力データコンテンツのセグメントに関して検出された識別データから閾値を導出することが望ましい。具体的には、閾値は、入力データコンテンツの各セグメントから幾つの識別データのインスタンスが検出されるかに応じて決定することが望ましい。好ましくは、閾値は、入力データコンテンツの各セグメントに関して検出される識別データのインスタンスの数に対して、入力データコンテンツがあるバージョンとして誤検出される統計的可能性が閾値可能性より低くなるように設定する。
これに代えて又はこれに加えて、検出方法は、入力データコンテンツのセグメントに関して識別データの幾つのインスタンスが検出されたかに応じて入力データコンテンツのセグメントの1つに関して検出された識別データ間の一致を重み付けするステップを有し、一致の和は一致の加重和である。
この重み付けは、識別データの複数のインスタンスが検出されたセグメントが、識別データの単一のインスタンスが検出されたセグメントより弱く一致の加重和に貢献するように行うと、より信頼度が高い結果が得られると予想される。しかしながら、直感とは異なり、幾つかの実際の試験では、この重み付けについて、識別データの複数のインスタンスが検出されたセグメントが、識別データの単一のインスタンスが検出されたセグメントより弱く一致の加重和に貢献するように行った方がよりよい結果が得られた。
識別データが導出された幾つかのセグメントがある場合には、入力データコンテンツの2以上のセグメントに関して識別データが検出されなかったとき、これらのセグメントを2以上のセグメントのグループとして併合し、セグメントの併合されたグループに関して識別データを検出するとよい。この処理は、繰り返し行うことが望ましい。
好ましくは、この閾値は、セグメントの総数より小さいセグメントの数を表し、及び/又は識別データパターンの1つに基づく各識別データを有するセグメントの総数より小さいセグメントの数を表す。
幾つかのセグメントのみが識別データを含むような識別パターンを用いてもよいが、データコンテンツのバージョンは、実質的に全てのセグメントがそれぞれの識別データを有する対応する識別パターンによって識別可能であることがより好ましい。
更に、本発明に係る識別データ適用方法は、入力データコンテンツに識別データを適用する識別データ適用方法において、(1)少なくとも1つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む入力データコンテンツのn個のインスタンスを生成するステップと、(2)入力データコンテンツの各バージョンが関連する識別データパターンに基づいてインスタンスからの識別データを含むようにn個のインスタンスからセグメントを選択することによって入力データコンテンツのバージョンを生成するステップと、(3)mを1以上の数とし、各インスタンスが他の全てのインスタンスに対して固有のそれぞれの識別データを含む入力データコンテンツのm個の更なるインスタンスを生成するステップと、(4)入力データコンテンツの各バージョンが関連する識別データパターンに基づいてインスタンスからの識別データを含むように、m個のインスタンス、m個のインスタンスを含むインスタンスの組、又は生成された全てのインスタンスからセグメントを選択することによって、入力データコンテンツの更なるバージョンを生成するステップと、(3)のステップ及び(4)のステップを1回以上繰り返すステップとを有する。
海賊版コピーの出所をより確実に検出するためには、(1)のステップにおいて、全てのインスタンスがそれぞれ他のインスタンスに対して固有の識別データを含むようにするとよい。
更に、本発明に係る識別データ適用方法は、入力データコンテンツに識別データを適用する識別データ適用方法において、(1)少なくとも1つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む入力データコンテンツのn個のインスタンスを生成するステップと、(2)入力データコンテンツの各バージョンが関連する識別データパターンに基づくインスタンスからの識別データを含むように所定のセグメント化パターンによりn個のインスタンスからセグメントを選択することによって、入力データコンテンツのバージョンを生成するステップとを有し、セグメント化パターンは、少なくとも1つのセグメントが入力データコンテンツ内において不連続となるようなパターンであることを特徴とする。
本発明のこの側面により、フィンガプリントが付された複数のコピーを結合する所謂コルージョンアタックを防ぐことができる。すなわち、不連続なセグメントを用いることにより、コルージョンアタックを行おうとするグループがセグメント境界を特定することが困難になる。
本発明は、特に、複数の連続する画像を含むビデオコンテンツに好適に適用される。好ましくは、識別データは、例えば少なくとも幾つかの画像の空間周波数成分のサブセット内等、少なくとも幾つかの画像を表すデータ内に符号化するとよい。
更に、本発明に係る検出装置は、複数の異なるバージョンが存在する入力データコンテンツのバージョンを検出する検出装置であって、データコンテンツは、セグメント化パターンに基づく2以上のセグメントとして配列され、データコンテンツのバージョンは、セグメントの少なくとも一部が各識別データを含むことによる対応する識別データパターンによって識別可能であり、検出装置は、入力されたデータコンテンツのセグメントに関する識別データを検出する識別データ検出器と、検出された識別データと、データコンテンツの異なるバージョンに対応する識別データパターンとを比較する比較器と、検出された識別データとあるバージョンに関する識別データパターンとの間から得られる一致の合計が閾値を超えたとき、入力コンテンツコンテンツが少なくともデータコンテンツのあるバージョンからの貢献含むことを検出する貢献検出器とを備える。
更に、本発明に係る識別データ適用装置は、入力データコンテンツに識別データを適用する識別データ適用装置において、(1)少なくとも1つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む入力データコンテンツのn個のインスタンスを生成するインスタンス生成器と、(2)入力データコンテンツの各バージョンが関連する識別データパターンに基づいてインスタンスからの識別データを含むようにn個のインスタンスからセグメントを選択することによって入力データコンテンツのバージョンを生成するバージョン生成器と、(3)mを1以上の数とし、各インスタンスが他の全てのインスタンスに対して固有のそれぞれの識別データを含む入力データコンテンツのm個の更なるインスタンスを生成するインスタンス生成コントローラと、(4)入力データコンテンツの各バージョンが関連する識別データパターンに基づいてインスタンスからの識別データを含むように、m個のインスタンス、m個のインスタンスを含むインスタンスの組、又は生成された全てのインスタンスからセグメントを選択することによって、入力データコンテンツの更なるバージョンを生成するバージョン生成コントローラとを備える。
更に、本発明に係る識別データ適用装置は、入力データコンテンツに識別データを適用する識別データ適用装置において、(1)少なくとも1つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む入力データコンテンツのn個のインスタンスを生成する生成器と、(2)入力データコンテンツの各バージョンが関連する識別データパターンに基づくインスタンスからの識別データを含むように所定のセグメント化パターンによりn個のインスタンスからセグメントを選択することによって、入力データコンテンツのバージョンを生成するバージョン生成器とを備え、セグメント化パターンは、少なくとも1つのセグメントが入力データコンテンツ内において不連続となるようなパターンであることを特徴とする。
本発明の更なる側面及び特徴は、添付の請求の範囲において定義されている。
本発明が提案する技術により、コンテンツ(又は少なくともコンテンツのコピーの一部)を固有に特定し、後に訴訟の証拠となるように、コンテンツにマークを付すことができる。この技術は、ビデオ及びオーディオのエレメンタリデータ又は多重化されたストリームなどのいかなるパケット化可能なデータにも適用できる。これは、データが正式にパケット化された形式でなくてはならないことを意味するものではなく、データは、マークが付されるデータの全体的な量のサブセットを表すセグメント又は部分として取り扱うことができればよい。この手法は、パッケージ化された媒体(光ディスクなどの記憶媒体の上に保存されたコンテンツなど)、インターネット(所謂、コンテンツ「プル」システム)からダウンロードされたコンテンツ、例えばデジタルテレビジョンサービス(所謂、コンテンツ「プッシュ」システム)を介して放送されたコンテンツ、又は他のコンテンツ配信フォーマットに適用できる。
フィンガプリントが付されたコンテンツを作成する処理は、2以上の(包括的にm個の)マスタコピーMを作成する処理を含む。個々のマスタには、フィンガプリント技術を用いて、それぞれ固有のマークを付すことができ、又は、元のコンテンツ(original)には、マークを付さないままにすることもできる。ビデオコンテンツの場合、上述した参考文献に開示されている手法によって、コンテンツに識別データを付すことができ、この識別データの存在は、視聴者には実質的に不可視であり、識別データは、コンテンツの短い部分(又はビデオにおける数秒程度のデータ)から後に復号でき、識別データは、例えばサイズ変更、データ圧縮、又はカムコーダによる海賊行為(コンテンツが映写されたスクリーンをビデオカメラで撮影する行為)等の処理に対して、実質的にロバストである。
マスタは、等しくn個のパート(セグメント又は部分)に分割される。基本的な方式では、この分割は、単純な時分割であり、セグメント1はコンテンツの最初の期間であり、セグメント2はセグメント1の次の期間であり、セグメント3はセグメント2の次の期間である。各セグメントの長さはそれぞれ等しくても異なっていてもよい。
より高度な構成では、各セグメントは、複数の非連続的な時点に対応することができる。この構成は、所謂「コルージョンアタック(collusion attack)」に対する防御に有効であり、これについては、後に図4を用いて更に詳細に説明する。
更なる可能性(上述した2つの可能性のいずれかと組み合わせてもよい)として、ビデオコンテンツを空間分割してセグメントを構成し、例えば、ピクチャの上部がピクチャの下部とは異なるセグメントを表すようにしてもよい。
m個のマスタからのn個のセグメントの組合せの擬似ランダム生成に基づき、同じn個のセグメントを含むコンテンツのバージョンが生成されるが、これらのセグメントに適用される識別データは擬似ランダム的に結合される。配信すべきバージョンの数に十分に対応できる順列(permutations)の組を提供できる十分な数のマスタ及びセグメントを用いている限り、2つのバージョンが同じセグメント識別データの順列を有することはない。これは、各バージョンが固有のフィンガプリントを有することを意味し、したがって、このようなバージョンを作成するために専用のフィンガプリントを生成するような時間がかかる処理を行う必要がなくなる。
図1は、この手法を用いたフィンガプリント符号化装置の構成を示すブロック図である。
図1では、マークが付されていない(フィンガプリントが付されていない)ビデオファイル10を2つのフィンガプリントエンコーダ20、30に供給する。ビデオファイル10は、2つの異なるフィンガプリントデータの組を用いてフィンガプリント符号化され、これにより2個のマスタM、Mが生成される。なお、実際には、1つのマスタは、フィンガプリントを付さないままにしてもよく、更に、フィンガプリント符号化処理は、図1に示すような並列処理ではなく、直列処理として行ってもよい。更に、マスタの数は2以上であってもよい。
2つのマスタは、エンコーダ40、50によってMPEG−2符号化され、マルチプレクサ60、70は、AC3音声データなどの圧縮された音声データをこのデータに多重化する。これにより、2個の所謂DVD画像、すなわち、DVDディスクに記録することができる形式のビデオデータが生成される。各画像は、マスタMかマスタMに対応するフィンガプリントを含んでいる。
2つの画像セグメント結合器80、90は、ユーザデータベース100から識別ベクトルを受け取り、この識別ベクトルに基づいて、2つのマスタDVD画像M、Mのセグメントを結合する。生成すべき必要なバージョンの数について、識別ベクトルの母集団が十分大きくなるようなマスタの数及びセグメント変更(segment alteration)の数を選択すれば、識別ベクトルは、固有(又は少なくとも擬似固有的(least quasi-unique))であるとみなされる。それぞれの結合器の出力は、それぞれのDVDライタ(所謂「バーナ(burner)」)110、120に供給され、各DVDディスク130、140に書き込みが行われる。各バーナにおいて、更なるDVDディスクを作成するために、新しい識別ベクトルがデータベースから供給され、2つのマスタDVD画像M、Mのセグメントの組合せが生成される。
図1は、同じ数(すなわち、それぞれの2個)のマスタ、結合器及びバーナを示しているが、これは、図面を明瞭にするために単純化した実施例を示しているに過ぎず、マスタと同数の結合器とバーナを設けなくてはならないといういかなる技術的理由もない。
各ディスクをデータベース100に格納されている(秘密の)識別ベクトルにリンクする非秘密コード(non-secret code)をディスクに書き込んでもよく、目に見えるようにディスク上に印刷してもよくこの両方を行ってもよい。これは、技術的な特徴ではないが、正しいユーザにディスクを配布するために役立つ。実際には、ユーザの名前をデータベース100に格納してもよく、各DVDディスクの表面に印刷してもよい。
例えば、3つのマスタがり、各マスタが5つのセグメントに分割されるとする。この構成を図2に示す。各バージョンは、「13213」や「22131」などの5桁の「識別ベクトル」によって定義される。これは、事前に定義されたセグメント順に、どのマスタがそのバージョンの各セグメントを提供するのに使用されたかを示している。図2に示す実施例では、図面の下部の4つの例示的なバージョン(a〜d)に使用されるIDベクトルは以下の通りである。
バージョンa: 32212
バージョンb: 11332
バージョンc: 13222
バージョンd: 23221
(フィンガプリントが実質的に知覚されないように付加されたと仮定すると)再生時には、ユーザによって享受されるオーディオ/ビデオマテリアルのバージョンの間には、全く違いがない。すなわち、バージョンの唯一の違いは、フィンガプリントデータである。
データベースには、そのバージョンを受け取ったユーザにリンクされるように識別ベクトルを保存できる。
個々のフィンガプリントの可能な組合せは、以下の3つの要素に依存する。
1)マスタの数m
2)セグメントの数n
3)交換できるセグメントの最大数k
単一のマスタから区別される組合せの数(c)を算出する式は以下の通りである。
1)全てのn個のセグメントが交換可能である場合、この数は以下の通りとなる。
c=m−1
2)n個のうち最大k個のセグメントが交換可能である場合、この数は以下の通りとなる。
Figure 2005122694
例えば、60(=n)個のセグメントに分割された120分の映画について2(=m)個のマスタが使用され、60個のセグメントのうち20個(=k)だけが交換可能である場合、単一のマスタから区別される組合せの数は、7×1015通り以上である。より単純な構成として、m=2、n=20とし、20個全てのセグメントが交換可能であると仮定すると、単一のマスタから区別できる組合せの数は、1048575通りである。以下の表は、マスタの数とセグメントの数により、単一のマスタから区別できる組合せの数が幾つになるかを示している。
Figure 2005122694
図3は、DVDにおけるビデオオブジェクトユニット(Video OBject Unit:以下、VOBUという。)の境界に沿って本発明の手法を適用する具体例を図式的に示している。
VOBU(ビデオオブジェクトユニット)は、DVDに記録されたビデオ(及び関連するオーディオ)の小さい(通常、数秒の)連続するシーケンスを表している。VOBUは、DVDプレーヤのMPEGデコーダによって解釈できる1以上の「グループオブピクチャ」(GOP)を含んでいる必要がある。デコーダによる再処理が必要ないように、及びジャンプされた位置が常に有効なMPEGストリームの開始点となるように、再生時における検索、ジャンプ等は全てVOBU境界で行われるように保証されている。VOBUは、VOBUグループに組織化され、VOBUグループは、ビデオオブジェクト(Video OBject)を構成する。各VOBUグループは、独立した(standalone)多重化された単位であり、前の又は後の単位に対して依存していない。VOBUグループは、必要な又は適切な数のVOBUを含むことができる。
図面を簡潔にするために、図3では、2つのマスタM、Mのみを示している。これらは、個別にフィンガプリントを付与してもよく、或いは一方にはフィンガプリントを付与せず、他方にフィンガプリントを付与してもよい。2つのマスタはMPEG−2符号化され、VOBU及びVOBUグループに予備的に多重化(pre-multiplexed)される。マスタは、本発明の手法を適用するために、VOBUグループ境界に沿ってセグメント化される。
そして、上述した擬似固有識別ベクトルに基づいてセグメントを擬似ランダム的に結合し、固有のDVD記録情報を作成し、これを(例えば)書込可能なDVD(DVD−R)に記録することができる。この処理では、フィンガプリントの付与は、マスタのみに対して行えばよく、これらのマスタが予備的に多重化されるため、専用のフィンガプリントが付されたDVD−Rを準備する処理程時間がかからない。各バージョンに関する個別化の処理は、単にデータセグメントを連結するだけで済む。
一旦VOBUグループが結合されると、新たに生成されたVOB内の各VOBUに関するオフセットを算出するIFO生成処理が行われる。(DVDビデオディスク符号化では、IFOは情報(InFOrmation)を含むDVDディスク上に記録されたファイルである。VOBファイルは、MEPG−2符号化オーディオ、ビデオ及びサブタイトルストリームを含むDVDのメインコンポーネントを表現し、一方、IFOファイルは、DVDの章がどこで始まり、所定のオーディオトラックがどこに設けられているか等の情報をDVDプレイヤに提供する。)DVDプレーヤにとって、VOBは、適切に符号化されたDVDデータと同様に、完全に自己矛盾がない(self-consistent)データに見えるが、VOBは、内部的には、2以上の異なるDVD符号化に由来するVOBUグループの組合せである。VOBは、DVD仕様書の制約に従う。
これらのDVDの1つに対する海賊行為が行われた場合、例えば、直接のコピー(所謂「リッピング(ripping)」)又は例えば、所謂DiVx又はXvidフォーマットでの再符号化が行われた場合、海賊版コピーのソース、すなわち海賊版コピーが作成されたバージョンの所有者を特定できる必要がある。この目的で、海賊版コピーのビデオストリームを解析する。この解析では、セグメント境界を特定し、各セグメントに付与されているフィンガプリントによって表されている識別データを復号する。これにより、識別ベクトルが生成され、この識別ベクトルをディスクへの記録が行われた際に作成されたデータベースに格納されている識別ベクトルと比較する各ディスクは、擬似固有識別ベクトルを有しているので、これにより、ソースを識別することができる。
図4は、不連続なセグメントを用いる構成を説明する図である。ここでは、セグメントは、1、2、3、4、5・・・といった番号が付され、ビデオマテリアルの時間軸に沿って(図面の左側から右側に)各セグメントが2以上の不連続な部分に分割されている。これにより、後述するように、所謂コルージョンアタック(collusion attack)を防ぐことができる。
この手法は、個々のコンテンツパッケージが各ユーザ又はユーザグループに配信されるインターネットダウンロード、ビデオオンデマンド装置又はこの他のコンテンツ配信メカニズムにも適用できる。
図5は、本発明を適用したビデオオンデマンド(video-on-demand:以下、VODという。)送信を図式的に示す図である。この実施例では、結合器80’が、データベース100’から受け取った識別ベクトルに基づき、セグメントに分割された2つのマスタM、M(図面を簡潔にするために、連続的なセグメントとして示している)を結合する。結合されたビデオストリームは、VODサーバ200によって処理され、ケーブルネットワークにより、ユーザのVODセットトップボックス210に送信される。ユーザは、テレビジョンセット220によってファイルを視聴する。
同様に、図6に示す具体例では、データベース100”は、2個のマスタコピーM、Mを結合するために、識別ベクトルを結合器80”に供給する。結合されたファイルは、ウェブサーバ230によって、インターネット接続を介して、クライアントパーソナルコンピュータ(PC)240に送信される。
なお、VODサーバ200及びその後の処理に関する限り、並びにウェブサーバ230及びその後の処理に関する限り、保護されたファイルは、他のあらゆるファイルと同様に処理される。フィンガプリントが付されたマスタを結合することにって得られる安全性は、VODサーバ200又はウェブサーバ230にも、ユーザによるコンテンツの享受にも関連性がない。
基底に存在するフィンガプリント技術において認められているロバスト性及び低い誤検出確率にもかかわらず、この技術を不適切に用いたセグメント化方式では、誤検出確率が高まり、コルージョンアタックに対するロバスト性が劣化する虞もある。これらの問題の少なくとも一部は、適切な復号法を用いることによって解決できる。
フィンガプリント検出装置の構成を図7に示す。
図7に示すフィンガプリント検出装置は、ディスプレイ310、キーボード320、例えばマウス330などのユーザ入力装置を有するパーソナルコンピュータ300を備える。パーソナルコンピュータ300は、中央演算処理装置340と、読出専用メモリ350と、ランダムアクセスメモリ360と、ディスクストレージ装置370と、インターネット390などのネットワークに接続することができるネットワークインタフェース380と、例えば、DVDディスク410からデータを読み出し及び/又はDVDディスク410にデータを書き込むための入出力装置400とを備える。本発明の手法をパーソナルコンピュータにおいて実現するソフトウェア(及びここに説明するバージョン生成法を実際に制御するソフトウェア)は、例えばディスクストレージ装置370等のストレージ媒体又はオプティカルディスク410等のリムーバブル媒体、及び/又はネットワークインタフェース380を介して接続されるネットワーク又はインターネット等から提供してもよい。
図7に示すフィンガプリント検出装置の動作を図8を用いて説明する。
図8に示す実施例では、保護されたコンテンツについて、海賊版の疑いがある海賊コピーは、DVDディスク500から読まれる。ブロック510において、コンテンツを所定の(秘密の)セグメント化パターンに基づいて分割し、セグメントのフィンガプリントデータを解析する。ブロック520において、この解析から閾値量を導出する。閾値を導出する手法については以下に述べるが、基本的には、この処理は、識別データをセグメント間に分布させた際に、要求される又は望ましい誤検出確率(すなわち、要求される、最終的な結果が有効である保証)を実現するための統計的演算である。
ブロック530では、データベース100のコピーから読み出されたユーザ識別ベクトルに対してセグメント識別情報を検査する。これにより、一致する識別データが検出される。
そして、ブロック550において、ブロック530で実行された検査の結果に閾値を適用する。閾値を超える検査スコアに十分一致する識別ベクトルに対応するユーザは、海賊版コピーのソースであると判定される。
上述のように、基本レベルでは、デコーダは、海賊コピーの各セグメントから識別データを復号し、復号された識別ベクトルを生成し、この復号された識別ベクトルと、事前に各ユーザについて保存している識別ベクトルとの照合を試みる。ここで、(例えば、セグメントの処理が厳しすぎ、又はコンテンツ全体からセグメントが削除されている場合等の理由により)セグメントからの識別データの復号が失敗する可能性を低くするためには、デコーダが個々の全てのセグメントについて識別データの一致を求めないことが重要である。これに代えて、望ましい復号法は、十分に多くのセグメントについて識別データの一致が確認されることを検査するという手法である。実際に幾つの一致があれば十分であると判定するかは、望まれる誤検出確率に依存する。すなわち、この閾値が小さすぎると、無実のユーザのランダム識別ベクトルが復号された識別ベクトルに一致すると判定される可能性が高くなる。
コルージョンアタックがある場合、(コルージョンアタックがどのように行われるかによって)基底に存在するフィンガプリントデコーダにより各セグメントについて複数の識別データを復号してもよい。
このような状況でも、好適な復号法は、ユーザの識別ベクトルと復号された識別ベクトルに十分多くの一致があるかを検査することである。しかしながら、上述のように、復号された識別ベクトルは、セグメント毎に複数の識別データを有している場合もある。このため、無実のユーザの擬似ランダム識別ベクトルが偶然復号された識別ベクトルに一致し、この無実のユーザが海賊版コピーのソースであると疑われてしまう可能性が高くなる。したがって、一致するセグメントの数に関する閾値は、このような問題を回避できるように設定する必要がある。なお、実際の閾値は、セグメント毎に幾つの識別データを復号するかに依存し、これ自体は、コルージョンアタックがどのように為されたかに依存する。
ここで、復号された識別ベクトルにおいて、セグメントから復号された情報データの数をセグメントの重みwとする。更に、m個のマスタがあるとすると、各セグメントについて、0≦w≦mとなる。重みが0のセグメントは、一致の可能性がゼロであるため、照合処理においては情報を提供しない。同様に、重みがmのセグメントは、常に一致が検出されるため、これも照合処理においては情報を提供しない。
好ましい復号法は、各ユーザ(recipient)に関して、重みが1≦w<mのセグメントについてのみユーザの識別ベクトルと復号された識別ベクトルとの間の一致数をカウントすることである。特定のユーザの識別ベクトルに関する一致数が、閾値tに等しいか又はこれ以上である場合、このユーザは、海賊行為に協力したと判定される。以下では、特定の誤検出確率pを保証する閾値tの算出法について説明する。
重みが1≦w<mのセグメントについて、復号された識別ベクトル内の重みwのセグメントの数、すなわちw個の識別データが復号されたセグメントの数をcとする。
これにより、重みが1≦w<mのセグメントの数lは、以下の式により表される。
Figure 2005122694
また、1≦w<mについて、B〜Bin(cw,w/m)とする。復号された識別ベクトル内の重みがwの全てのセグメントについて、独立したランダム識別ベクトル内の対応するセグメントが一致する確率は、w/mである。復号された識別ベクトル内には、このようなセグメントがc個あるため、Bは、重みがwのセグメントのみを考慮した場合における復号された識別ベクトルと、独立したランダム識別ベクトルとの間の一致数の二項確率分布を表している。
全てのランダム識別ベクトルについて(復号された識別ベクトルから独立して)、復号された識別ベクトル内の重みがwのセグメントのみを考慮した場合におけるランダム識別ベクトルと復号された識別ベクトルとの間の一致数を表すランダム変数をAとすると、次のような式が成り立つ。
Figure 2005122694
母集団のサイズをyとすると、誤検出確率をpとして、
Figure 2005122694
となる最も小さい正の整数を閾値tとすることができる。
この他の可能なアルゴリズムについて説明する。
ある重みを有するセグメントの一致を他の重みを有するセグメントの一致より重要であるとみなすことが有益である場合もある。したがって、一致数を算出するために、加重和(weighted sum)を算出することが望ましい場合もある。1≦w<mについて、αwを正の整数とする。
全ての識別ベクトルVについて、このV(1≦w<mについて)内の対応するセグメントに一致する復号された識別ベクトル内の重みがwのセグメントの数をcw,vとする。更に、一致数を算出するための加重和を以下の通りとする。
Figure 2005122694
なお、この値は、1≦w<mについてαw=1のとき、先の手法の値と一致する。
全てのランダム識別ベクトルについて(復号された識別ベクトルから独立して)、復号された識別ベクトル内の重みがwのセグメントのみを考慮した場合におけるランダム識別ベクトルと復号された識別ベクトルとの間の一致数の加重和を表すランダム変数をAとすると、次のような式が成り立つ。
Figure 2005122694
母集団のサイズをyとすると、誤検出確率をpとして、
Figure 2005122694
となる最も小さい正の整数を閾値tとすることができる。
検査の結果、重み付けされていない一致数を用いた場合に比べて、一致数に加重和を用いた方が僅かに良好な結果が得られることもあれば、結果が悪くなることもあることがわかった。勿論、重付けされていない和及び複数の加重和を用いて多くの検査を行うこともできる。この場合、各検査について、全ての検査からの全ての組み合わされた誤検出確率が十分低くなるように、誤検出確率pを低減する必要がある。
これらの検査の結果から、1≦w<mについて、
Figure 2005122694
上のような重み付けは、良好に機能することがわかった。
コルージョンアタックがない場合、重み付けを行う復号法と重み付けを行わない復号法は等価であり、どちらも良好に機能する。例えば、(1)2個のみのマスタと、(2)10000人のユーザと(3)120個のセグメント(例えば、2時間の映画の場合、1セグメントあたり1分)と、(4)10−8の誤検出確率との条件では、40個のセグメントからセグメント識別データを導出するだけで海賊版コピーのソースを特定できる。マスタが4個あれば、20個のセグメントから識別データを導出するだけで海賊版コピーのソースを特定することができる。
しかしながら、コルージョンアタックがあると、状況はより厳しくなる。コルージョンアタックを行う複数の者に適合する最良のコルージョン対策を決定することは困難である。基底に存在するフィンガプリント技術のコルージョンアタックに対する応答を無視すれば、コルージョン対策の一手法は、セグメント毎に最大でも1つのみの識別ベクトルを生成することである。セグメント化パターンが既知(又は判別可能)であれば、コルージョンアタックを行う者は、入手可能なコピーから異なるセグメントを選択するだけで、不正なコピーを作成することができる(例えば、コルージョンアタックを行う者がz人いた場合、コルージョンアタックを行うそれぞれから、不正なバージョンにおける1/zのセグメントが得られる)。
したがって、不正を行う者が、映画のどの部分がセグメントを構成しているかを判定できないようにすることが重要である。したがって、符号化では、(1)膨大な数のセグメントを用い、(2)(上述した図4のように)より小さなセクションからの各セグメントを映画全体に亘って擬似ランダム的に分布させることが望ましい。これにより、不正を行おうとする者が個々のセグメントを分離することが不可能又は著しく困難となり、これは、各セグメントが、あらゆる尤度で、2以上の識別データを生成することを意味する。
コルージョンアタックを行おうとする者は、上述したアタックに代えて、例えば、フレームを互いに平均化する等、より効率的なコルージョンアタックを画策する。このような場合、基底に存在するフィンガプリント技術のコルージョンに対する応答が重要となる。所定のセグメントについて、フィンガプリント検出器は、セグメント識別データの幾つか又は全てを検出することが望ましい。海賊版コピーのソースであるユーザの検出は、セグメント識別データの数が増えるほど容易になる。しかしながら、コルージョンアタックを行う者が十分に多い場合、このようなアタックにより、検出器は、セグメントの期間に亘っていかなる識別データも検出できなくなる。したがって、予期されるアタック(例えばコルージョン又は圧縮やサイズ変更等のより包括的な処理)に対抗できるようにセグメントを十分に長くする必要がある。
ここでは、(1)フィンガプリント検出器がセグメント識別データを検出できるよう、セグメントを十分長くすることと、(2)セグメント化パターンを推定することが可能な限り困難となるように、できるだけ多くのセグメントを設けることとの間のバランスを調整しなくてはならない。
また、母集団のサイズを小さくすることも復号の向上に貢献する。一組のフィンガプリントが付与されたマスタを作成すると、セグメント多重化により、配布のためのフィンガプリントが付与されたコピーの生成を開始することができる。この間、バックグランド処理として、フィンガプリントが付与されたマスタの新しい組を生成することもできる。新しいマスタの組が生成されると、これらのマスタを先のマスタに代えて使用することができる。これにより、各マスタの組の母集団のサイズを基本的に減らすことができる。これに代えて、先のマスタに加えて新たなマスタを使用してもよく、これにより、将来のコピーのためのマスタの数を増加させることもできる。この処理については、図10を用いて後に説明する。
例えばコンテンツに対する処理又はカムコーダによる海賊行為が適用されたこと等に起因して、全てのセグメントからは識別データを導出できない場合、併合されたセグメント(coalesced segments)を用いて、これらのセグメントからの識別データの導出を試みる。勿論、この処理では、セグメントに識別データが含まれていることを仮定している。セグメント化のパターン又はマスタの性質(例えば、マスタの1つがフィンガプリントが付されていないファイルであるか否か)から、各セグメントに識別データを期待できるか否かを知ることができる。これは、(マークが付されていないフィンガプリントマスタではなく)フィンガプリントが付与された全てのマスタを用いることにより、全てのセグメントがある種の識別データを含むことが期待されるという利点を示している。
図9を用いて説明すると、ステップ600において、セグメントの識別データを解析する。ステップ610において、全てのセグメントが少なくとも1つの識別データを有しているか否かを判定する。全てのセグメントが少なくとも1つの識別データを有している場合、(セグメントの処理に関する)処理は終了する。全てのセグメントが少なくとも1つの識別データを有していない場合、処理はステップ620に進む。
ステップ620において、識別データが期待されるが識別データを導出することができなかったセグメントが併合可能であるか否かを判定する。基本的には、この判定は、期待された識別データが導出されなかったセグメントが2個以上あるか否かに基づいて行うことができる。
併合ができない場合、すなわち、このようなセグメントが1つしかない場合、処理は終了する。一方、併合が可能な場合、処理はステップ630に進み、このステップ630において、復号がうまくいかなかったセグメントを併合する。
セグメントを併合する処理は、幾つかの段階で行うことができる。例えば、幾つかのセグメントが識別データを含むと期待されたが、復号によってこのような識別データを導出できなかった場合、セグメントを任意にグループ化された対として併合してもよい(例えば、復号に失敗した、時間的に隣接するセグメントを併合してもよい)。このようなセグメントが奇数個の場合、2つのセグメントの対に代えて、3個のセグメントを一組としてグループ化してもよい。併合されたセグメントは、再びステップ600に戻され、ここで識別データを検出するための解析を繰り返す。
勿論、併合されたセグメントを構成する復号に失敗したセグメントが偶然同じ識別データを含んでいる場合もある。この場合、セグメントの併合により、デコーダが識別データを検出する可能性が高まる(一般的に、フィンガプリントが付されたビデオマテリアルが長い程、デコーダが識別データを検出できる可能性が高くなる)。一方、セグメントが同じ識別データを含んでいない場合でも、これらの併合されたセグメントを更に併合することが復号に貢献する可能性があり、すなわち、併合されたセグメントを構成する初期のセグメントのグループが増えると、2つ以上の初期のセグメントが同じ識別データを含んでいる可能性が高まる。
したがって、セグメントを併合する1つの段階の後、2以上の復号されなかった(併合された)セグメントが残っている場合、更なる併合の段階を行ってもよい。このような処理は、併合され、復号されなかったセグメントが残り1つになるまで、繰り返し行ってもよい。
図10は、マスタ生成処理の変形例を示している。この実施例では、エンコーダ1、2、3として示す3個の並列のフィンガプリントエンコーダを用いる。図10は、4個の欄に分割され、このうち、左側の3個の欄は、それぞれエンコーダ1、2、3の動作を表し、一番右側の欄は、結合器/記録装置(80、110又は90、120)の動作を表す。
符号化の最初の段階では、エンコーダは、3個のマスタM、M、Mを生成する。これらは、結合され、これら3個のマスタM、M、MからDVDが作成される。
3個のマスタが作成されると、エンコーダはこのための処理から解放され、更なるマスタM、M、Mを作成する。これらの更なるマスタが準備されている間、結合器/記録装置は、マスタM〜Mのみに基づいてDVDを作成する。ここで、更なるマスタM〜Mが利用可能な状態となると、結合器/記録装置は、次のうちのいずれかのマスタに基づいてバージョンを作成することができるようになる。
・マスタM〜Mのみ
・マスタM〜Mの全て
・マスタM〜Mの任意の組合せ
このような処理を繰り返し行ってもよい。通常、従来の手法では、結合及び単一の出力バージョンの書込によってフィンガプリントが付されたマスタを作成するには、この手法の10倍の時間が必要であると考えられる。
添付の図面を用いて本発明の実施例を詳細に説明したが、本発明はこれらの詳細な実施例に限定されるものではなく、当業者は、添付の特許請求の範囲に定義された本発明の範囲及び思想から逸脱することなく、ここに説明した実施例を様々に変形及び変更することができる。
フィンガプリント符号化装置のブロック図である。 複数のマスタコピーのセグメントを用いてフィンガプリントが付されたコンテンツのコピーを生成する手法を説明する図である。 DVDにおけるVOBU境界に沿って本発明を適用する手法を説明する図である。 不連続なセグメントを示す図である。 ビデオオンデマンド伝送への適用例を示す図である。 インターネットダウンロードファイルへの適用例を示す図である。 フィンガプリント検出装置の構成を示す図である。 図7に示す装置の動作を示す図である。 セグメント解析処理のフローチャートである。 マスタ生成処理を説明する図である。

Claims (45)

  1. 複数の異なるバージョンが存在する入力データコンテンツのバージョンを検出する検出方法であって、
    上記データコンテンツは、セグメント化パターンに基づく2以上のセグメントとして配列され、
    上記データコンテンツのバージョンは、上記セグメントの少なくとも一部が各識別データを含むことによる対応する識別データパターンによって識別可能であり、
    当該検出方法は、
    (1)上記入力されたデータコンテンツの上記セグメントに関する上記識別データを検出するステップと、
    (2)上記検出された識別データと、上記データコンテンツの異なるバージョンに対応する上記識別データパターンとを比較するステップと、
    (3)上記検出された識別データとあるバージョンに関する上記識別データパターンとの間から得られる一致の合計が閾値を超えたとき、上記入力コンテンツコンテンツが少なくとも該データコンテンツのあるバージョンからの貢献含むことを検出するステップとを有する検出方法。
  2. 上記入力データコンテンツのセグメントに関して検出された識別データから上記閾値を導出するステップを更に有する請求項1記載の検出方法。
  3. 上記閾値は、上記入力データコンテンツの各セグメントに関して上記識別データのインスタンスが幾つ検出されたかに基づいて決定されることを特徴とする請求項2記載の検出方法。
  4. 上記閾値は、上記入力データコンテンツの各セグメントに関して検出される識別データのインスタンスの数に対して、上記入力データコンテンツがあるバージョンとして誤検出される統計的可能性が閾値可能性より低くなるように設定されることを特徴とする請求項3記載の検出方法。
  5. 上記入力データコンテンツのセグメントに関して上記識別データの幾つのインスタンスが検出されたかに応じて上記入力データコンテンツの上記セグメントの1つに関して検出された上記識別データ間の一致を重み付けするステップを有し、上記一致の和は一致の加重和であることを特徴とする請求項1記載の検出方法。
  6. 上記重み付けするステップは、上記識別データの複数のインスタンスが検出されたセグメントが、上記識別データの単一のインスタンスが検出されたセグメントより強く上記一致の加重和に貢献するように行われることを特徴とする請求項5記載の検出方法。
  7. 上記重み付けするステップは、上記識別データの複数のインスタンスが検出されたセグメントが、上記識別データの単一のインスタンスが検出されたセグメントより弱く上記一致の加重和に貢献するように行われることを特徴とする請求項5記載の検出方法。
  8. 上記入力データコンテンツの2以上のセグメントに関して上記識別データが検出されなかったとき、これらのセグメントを該2以上のセグメントのグループとして併合し、該セグメントの併合されたグループに関して上記識別データを検出するステップを更に有する請求項1記載の検出方法。
  9. 上記入力データコンテンツの2以上のセグメントのグループに関して上記識別データが検出されなかったとき、上記セグメントのグループを上記セグメントのより大きなグループに繰り返し併合し、該セグメントのより大きなグループに関して、上記識別データを検出するステップを更に有する請求項8記載の検出方法。
  10. 上記閾値は、上記セグメントの総数より小さい上記セグメントの数を表していることを特徴とする請求項1記載の検出方法。
  11. 上記閾値は、上記識別データパターンの1つに基づく上記各識別データを有する上記セグメントの総数より小さい上記セグメントの数を表すことを特徴とする請求項10記載の検出方法。
  12. 上記データコンテンツのバージョンは、実質的に全てのセグメントが上記それぞれの識別データを有する上記対応する識別パターンによって識別可能である請求項1記載の検出方法。
  13. 入力データコンテンツに識別データを適用する識別データ適用方法において、
    (1)少なくとも1つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む上記入力データコンテンツのn個のインスタンスを生成するステップと、
    (2)上記入力データコンテンツの各バージョンが関連する識別データパターンに基づいて上記インスタンスからの識別データを含むように上記n個のインスタンスからセグメントを選択することによって上記入力データコンテンツのバージョンを生成するステップと、
    (3)mを1以上の数とし、各インスタンスが他の全てのインスタンスに対して固有のそれぞれの識別データを含む上記入力データコンテンツのm個の更なるインスタンスを生成するステップと、
    (4)上記入力データコンテンツの各バージョンが関連する識別データパターンに基づいて上記インスタンスからの識別データを含むように、上記m個のインスタンス、上記m個のインスタンスを含む上記インスタンスの組、又は上記生成された全てのインスタンスからセグメントを選択することによって、上記入力データコンテンツの更なるバージョンを生成するステップと、
    上記(3)のステップ及び(4)のステップを1回以上繰り返すステップとを有する識別データ適用方法。
  14. 上記(1)のステップにおいて、上記全てのインスタンスがそれぞれ他のインスタンスに対して固有の識別データを含むことを特徴とする請求項13記載の識別データ適用方法。
  15. 上記(4)のステップは、上記m個のインスタンスからセグメントを選択することによって、上記入力データコンテンツの更なるバージョンを生成するステップを有することを特徴とする請求項13記載の識別データ適用方法。
  16. 上記(4)のステップは、上記m個のインスタンスを含むインスタンスの組からセグメントを選択することによって、上記入力データコンテンツの更なるバージョンを生成するステップを有することを特徴とする請求項13記載の識別データ適用方法。
  17. 上記(4)のステップは、上記生成した全てのセグメントを選択することによって、上記入力データコンテンツの更なるバージョンを生成するステップを有することを特徴とする請求項16記載の識別データ適用方法。
  18. 入力データコンテンツに識別データを適用する識別データ適用方法において、
    (1)少なくとも1つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む上記入力データコンテンツのn個のインスタンスを生成するステップと、
    (2)上記入力データコンテンツの各バージョンが関連する識別データパターンに基づく上記インスタンスからの識別データを含むように所定のセグメント化パターンにより上記n個のインスタンスからセグメントを選択することによって、上記入力データコンテンツのバージョンを生成するステップとを有し、
    上記セグメント化パターンは、少なくとも1つの上記セグメントが上記入力データコンテンツ内において不連続となるようなパターンであることを特徴とする識別データ適用方法。
  19. 上記セグメントの大部分は、2以上の不連続なサブセグメントを含むことを特徴とする請求項18記載の識別データ適用方法。
  20. 上記データコンテンツは、複数の連続する画像を含むビデオコンテンツであることを特徴とする請求項1記載の検出方法。
  21. 上記識別データは、少なくとも幾つかの上記画像を表すデータ内に符号化されていることを特徴とする請求項20記載の検出方法。
  22. 上記識別データは、少なくとも幾つかの上記画像の空間周波数成分のサブセット内に符号化されていることを特徴とする請求項21記載の検出方法。
  23. 上記データコンテンツは、複数の連続する画像を含むビデオコンテンツであることを特徴とする請求項13記載の識別データ適用方法。
  24. 上記識別データは、少なくとも幾つかの上記画像を表すデータ内に符号化されていることを特徴とする請求項23記載の識別データ適用方法。
  25. 上記識別データは、少なくとも幾つかの上記画像の空間周波数成分のサブセット内に符号化されていることを特徴とする請求項24記載の検出方法。
  26. 上記データコンテンツは、複数の連続する画像を含むビデオコンテンツであることを特徴とする請求項18記載の識別データ適用方法。
  27. 上記識別データは、少なくとも幾つかの上記画像を表すデータ内に符号化されていることを特徴とする請求項26記載の識別データ適用方法。
  28. 上記識別データは、少なくとも幾つかの上記画像の空間周波数成分のサブセット内に符号化されていることを特徴とする請求項27記載の検出方法。
  29. 請求項1記載の検出方法を実行するためのプログラムコードを含むコンピュータソフトウェア。
  30. 請求項29記載のソフトウェアを提供する媒体。
  31. 当該媒体はストレージ媒体であることを特徴とする請求項30記載の媒体。
  32. 当該媒体は、伝送媒体であることを特徴とする請求項30記載の媒体。
  33. 請求項13記載の識別データ適用方法を実行するためのプログラムコードを含むコンピュータソフトウェア。
  34. 請求項33記載のソフトウェアを提供する媒体。
  35. 当該媒体はストレージ媒体であることを特徴とする請求項34記載の媒体。
  36. 当該媒体は、伝送媒体であることを特徴とする請求項34記載の媒体。
  37. 請求項18記載の識別データ適用方法を実行するためのプログラムコードを含むコンピュータソフトウェア。
  38. 請求項37記載のソフトウェアを提供する媒体。
  39. 当該媒体はストレージ媒体であることを特徴とする請求項38記載の媒体。
  40. 当該媒体は、伝送媒体であることを特徴とする請求項38記載の媒体。
  41. 複数の異なるバージョンが存在する入力データコンテンツのバージョンを検出する検出装置であって、
    上記データコンテンツは、セグメント化パターンに基づく2以上のセグメントとして配列され、
    上記データコンテンツのバージョンは、上記セグメントの少なくとも一部が各識別データを含むことによる対応する識別データパターンによって識別可能であり、
    当該検出装置は、
    上記入力されたデータコンテンツの上記セグメントに関する上記識別データを検出する識別データ検出器と、
    上記検出された識別データと、上記データコンテンツの異なるバージョンに対応する上記識別データパターンとを比較する比較器と、
    上記検出された識別データとあるバージョンに関する上記識別データパターンとの間から得られる一致の合計が閾値を超えたとき、上記入力コンテンツコンテンツが少なくとも該データコンテンツのあるバージョンからの貢献含むことを検出する貢献検出器とを備える検出装置。
  42. 入力データコンテンツに識別データを適用する識別データ適用装置において、
    (1)少なくとも1つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む上記入力データコンテンツのn個のインスタンスを生成するインスタンス生成器と、
    (2)上記入力データコンテンツの各バージョンが関連する識別データパターンに基づいて上記インスタンスからの識別データを含むように上記n個のインスタンスからセグメントを選択することによって上記入力データコンテンツのバージョンを生成するバージョン生成器と、
    (3)mを1以上の数とし、各インスタンスが他の全てのインスタンスに対して固有のそれぞれの識別データを含む上記入力データコンテンツのm個の更なるインスタンスを生成するインスタンス生成コントローラと、
    (4)上記入力データコンテンツの各バージョンが関連する識別データパターンに基づいて上記インスタンスからの識別データを含むように、上記m個のインスタンス、上記m個のインスタンスを含む上記インスタンスの組、又は上記生成された全てのインスタンスからセグメントを選択することによって、上記入力データコンテンツの更なるバージョンを生成するバージョン生成コントローラとを備える識別データ適用装置。
  43. 入力データコンテンツに識別データを適用する識別データ適用装置において、
    (1)少なくとも1つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む上記入力データコンテンツのn個のインスタンスを生成する生成器と、
    (2)上記入力データコンテンツの各バージョンが関連する識別データパターンに基づく上記インスタンスからの識別データを含むように所定のセグメント化パターンにより上記n個のインスタンスからセグメントを選択することによって、上記入力データコンテンツのバージョンを生成するバージョン生成器とを備え、
    上記セグメント化パターンは、少なくとも1つの上記セグメントが上記入力データコンテンツ内において不連続となるようなパターンであることを特徴とする識別データ適用装置。
  44. 入力データコンテンツ内において少なくとも1つのセグメントが不連続となるような関連する識別データパターンに基づく識別データをそれぞれ含む所定のセグメント化パターンに基づくセグメントを含み、識別データに関連付けられたデータコンテンツを格納するストレージ媒体。
  45. 請求項36記載のストレージ媒体の組であって、当該ストレージ媒体の組内の各ストレージ媒体は、上記所定のセグメント化パターンに基づく同じデータコンテンツを格納し、上記識別データパターンは、当該ストレージ媒体の組内の各ストレージ媒体間で異なるストレージ媒体の組。
JP2004216238A 2003-07-23 2004-07-23 データコンテンツの識別 Withdrawn JP2005122694A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
GB0317247A GB2404296A (en) 2003-07-23 2003-07-23 Data content identification using watermarks as distinct codes

Publications (1)

Publication Number Publication Date
JP2005122694A true JP2005122694A (ja) 2005-05-12

Family

ID=27772523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004216238A Withdrawn JP2005122694A (ja) 2003-07-23 2004-07-23 データコンテンツの識別

Country Status (4)

Country Link
US (1) US7899205B2 (ja)
EP (1) EP1501047A3 (ja)
JP (1) JP2005122694A (ja)
GB (1) GB2404296A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005124148A (ja) * 2003-07-31 2005-05-12 Sony United Kingdom Ltd デジタルコンテンツのためのアクセス制御

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4552540B2 (ja) * 2004-07-09 2010-09-29 ソニー株式会社 コンテンツ記録装置、コンテンツ再生装置、コンテンツ記録方法、コンテンツ再生方法及びプログラム
US7801125B2 (en) 2004-10-22 2010-09-21 Cisco Technology, Inc. Forwarding table reduction and multipath network forwarding
DE102005054978A1 (de) 2005-11-16 2007-05-24 Deutsche Thomson-Brandt Gmbh Verfahren zum Aktualisieren eines Datensatzes sowie Vorrichtung zur Durchführung des Verfahrens
US7874015B2 (en) 2006-05-12 2011-01-18 At&T Intellectual Property I, L.P. Methods, systems, and computer program products for controlling distribution of digital content in a file sharing system using license-based verification, encoded tagging, and time-limited fragment validity
US9177209B2 (en) * 2007-12-17 2015-11-03 Sinoeast Concept Limited Temporal segment based extraction and robust matching of video fingerprints
US8312023B2 (en) 2007-12-21 2012-11-13 Georgetown University Automated forensic document signatures
US8280905B2 (en) * 2007-12-21 2012-10-02 Georgetown University Automated forensic document signatures
US8108928B2 (en) * 2008-06-20 2012-01-31 International Business Machines Corporation Adaptive traitor tracing
US8122501B2 (en) * 2008-06-20 2012-02-21 International Business Machines Corporation Traitor detection for multilevel assignment
WO2009156973A1 (en) * 2008-06-27 2009-12-30 France Telecom Fingerprinting method and system
US8793498B2 (en) * 2008-08-11 2014-07-29 Nbcuniversal Media, Llc System and method for forensic analysis of media works
US8422684B2 (en) * 2008-08-15 2013-04-16 International Business Machines Corporation Security classes in a media key block
US8571209B2 (en) 2009-01-19 2013-10-29 International Business Machines Recording keys in a broadcast-encryption-based system
JP5368637B1 (ja) * 2011-11-01 2013-12-18 株式会社野村総合研究所 時刻認証システムおよび時刻認証プログラム
TWI528219B (zh) * 2014-10-01 2016-04-01 財團法人資訊工業策進會 辨識機敏資料之方法、電子裝置及電腦可讀取記錄媒體
US9973521B2 (en) 2015-12-28 2018-05-15 International Business Machines Corporation System and method for field extraction of data contained within a log stream
US11176452B2 (en) 2017-02-28 2021-11-16 Cisco Technology, Inc. Method and system for piracy detection

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5664018A (en) * 1996-03-12 1997-09-02 Leighton; Frank Thomson Watermarking process resilient to collusion attacks
US6108434A (en) * 1997-09-12 2000-08-22 Signafy, Inc. Counteracting geometric distortions for DCT based watermarking
US6373974B2 (en) * 1998-03-16 2002-04-16 Sharp Laboratories Of America, Inc. Method for extracting multiresolution watermark images to determine rightful ownership
US6285774B1 (en) * 1998-06-08 2001-09-04 Digital Video Express, L.P. System and methodology for tracing to a source of unauthorized copying of prerecorded proprietary material, such as movies
GB2386495B (en) * 1999-03-18 2003-10-29 British Broadcasting Corp Watermarking
US7031491B1 (en) * 1999-04-09 2006-04-18 Canon Kabushiki Kaisha Method for determining a partition in order to insert a watermark, and associated insertion and decoding methods
JP3373811B2 (ja) * 1999-08-06 2003-02-04 インターナショナル・ビジネス・マシーンズ・コーポレーション 白黒2値文書画像への透かし情報埋め込み・検出方法及びその装置
US6915481B1 (en) * 2000-01-11 2005-07-05 Cognicity, Inc. Transactional watermarking
US8355525B2 (en) * 2000-02-14 2013-01-15 Digimarc Corporation Parallel processing of digital watermarking operations
US20040064416A1 (en) * 2000-10-03 2004-04-01 Ariel Peled Secure distribution of digital content
US7068809B2 (en) * 2001-08-27 2006-06-27 Digimarc Corporation Segmentation in digital watermarking
US7398395B2 (en) * 2001-09-20 2008-07-08 Koninklijke Philips Electronics N.V. Using multiple watermarks to protect content material
GB2383221A (en) * 2001-12-13 2003-06-18 Sony Uk Ltd Method of identifying a codeword used as a watermark
US7533027B2 (en) * 2002-04-02 2009-05-12 Warner Bros. Entertainment Inc. Methods and apparatus for uniquely identifying a large number of film prints
EP1636733B1 (en) * 2003-06-23 2018-01-24 Sony Pictures Entertainment Inc. Fingerprinting of data

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005124148A (ja) * 2003-07-31 2005-05-12 Sony United Kingdom Ltd デジタルコンテンツのためのアクセス制御
JP4679851B2 (ja) * 2003-07-31 2011-05-11 ソニー ヨーロッパ リミテッド デジタルコンテンツのためのアクセス制御

Also Published As

Publication number Publication date
US7899205B2 (en) 2011-03-01
US20050021568A1 (en) 2005-01-27
GB2404296A (en) 2005-01-26
EP1501047A3 (en) 2005-07-27
GB0317247D0 (en) 2003-08-27
EP1501047A2 (en) 2005-01-26

Similar Documents

Publication Publication Date Title
US10970803B2 (en) Fingerprinting of data
JP2005122694A (ja) データコンテンツの識別
US9323902B2 (en) Conditional access using embedded watermarks
US9547753B2 (en) Coordinated watermarking
US20130151855A1 (en) Watermark embedding workflow improvements
US7730313B2 (en) Tracing content usage
US8171294B2 (en) Additional-information detection processing apparatus and method, content playback processing apparatus and method, and computer program
JP2005227756A (ja) デジタルマルチメディアデータのための非同期化フィンガープリンティングの方法およびシステム。
KR20070057917A (ko) 디스플레이 또는 비디오 구동 유닛 내에 보호받는 컨텐츠자료의 검출 및 이에 대한 반작용
CN1332354C (zh) 数据内容识别
CA2724139C (en) Method and system for identifying a source of media

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070525

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080418

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080423

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090310