JP2005122694A

JP2005122694A - データコンテンツの識別

Info

Publication number: JP2005122694A
Application number: JP2004216238A
Authority: JP
Inventors: Jason Charles Pelly; ペリー　ジェイソン　チャールズ; Daniel Warren Tapson; タプソン、ダニエル　ワレン; Mark Julian Russell; マークラッセル、ジュリアン
Original assignee: Sony United Kingdom Ltd
Current assignee: Sony Europe BV United Kingdom Branch
Priority date: 2003-07-23
Filing date: 2004-07-23
Publication date: 2005-05-12
Also published as: US7899205B2; US20050021568A1; GB2404296A; EP1501047A3; GB0317247D0; EP1501047A2

Abstract

【課題】ユーザのデータコンテンツのバージョンが不正なコピーのソースであることを検出する方法を提供する。
【解決手段】データコンテンツは、セグメント化パターンに基づく２以上のセグメントとして配列され、データコンテンツのバージョンは、セグメントの少なくとも一部が各識別データを含むことによる対応する識別データパターンによって識別可能であり、検出方法は、（１）入力されたデータコンテンツのセグメントに関する識別データを検出するステップと、（２）検出された識別データと、データコンテンツの異なるバージョンに対応する識別データパターンとを比較するステップと、（３）検出された識別データとあるバージョンに関する識別データパターンとの間から得られる一致の合計が閾値を超えたとき、入力コンテンツコンテンツが少なくともデータコンテンツのあるバージョンからの貢献含むことを検出するステップとを有する。
【選択図】図８

Description

本発明は、データコンテンツの識別に関する。このようなコンテンツとしては、例えば、オーディオビジュアルコンテンツなど、ビデオコンテンツ、オーディオコンテンツ、メタデータコンテンツ、テキストコンテンツ、イメージコンテンツなどの１つ以上が含まれる。

演算パワーが強化されたデジタル機器及び高速ネットワークを含む新たなデジタルインフラストラクチャの成長により、コンテンツの作成、処理及び配布が簡単で高速に行えるようになった。これはコンテンツの合法的な使用にも大いに役立つが、このようなコンテンツ（特に、著作権コンテンツ）を権限なく使用したり「剽窃」したりする行為、例えば、権限のない再生又は配布もより容易に行うことができるようになり、コンテンツの所有者の被害も大きくなっている。

例えば、専門家によるコンテンツのレビュー（professional review of the content）の一部として、又はユーザがコンテンツを使用する権利を所有者から購入する前に、商業目的で、コンテンツの所有者が潜在的ユーザにコンテンツの視聴又は使用を試させる場合があり、このことが状況をより複雑にしている。例えば映画フィルムの場合、非常に多くのコピーが上述のような目的で出回ることがある。

コンテンツに識別データを付与するための所謂「フィンガプリント（fingerprinting）」法が提案されている。この手法では、権限のないコピーを防止することはできないが、これにより権限のないコピーの出所を検出することができる。ビデオ信号に適用されるフィンガプリント法の実施例は、英国特許公開公報第ＧＢ−Ａ−２３８３２２１号や米国特許公報第Ａ−５６６４０１８号に開示されている。

しかしながら、この技術は、実行するのに時間がかかる。本出願の優先日現在の技術では、映画フィルムの全編にフィンガプリント処理を適用するのに１０時間もかかる場合がある。

本発明に係る検出方法は、複数の異なるバージョンが存在する入力データコンテンツのバージョンを検出する検出方法であって、データコンテンツは、セグメント化パターンに基づく２以上のセグメントとして配列され、データコンテンツのバージョンは、セグメントの少なくとも一部が各識別データを含むことによる対応する識別データパターンによって識別可能であり、検出方法は、（１）入力されたデータコンテンツのセグメントに関する識別データを検出するステップと、（２）検出された識別データと、データコンテンツの異なるバージョンに対応する識別データパターンとを比較するステップと、（３）検出された識別データとあるバージョンに関する識別データパターンとの間から得られる一致の合計が閾値を超えたとき、入力コンテンツコンテンツが少なくともデータコンテンツのあるバージョンからの貢献含むことを検出するステップとを有する。

本発明は、少なくとも一部がフィンガプリントデータを含むコンテンツの複数のマスタコピーのセクション又は「セグメント」を結合することによって、フィンガプリントが付されたコンテンツを生成する新規な手法を提案する（ここで、「フィンガプリント」という用語は、理想的には、その存在が実質的にユーザによっては知覚されないように、識別データをコンテンツに安全に付加することを意味する）。セグメントは、そのコンテンツのコピーの特定のユーザに固有又は擬似固有であるセグメント化パターンに基づいて結合される。この新規な提案の利点は、個々のコピーのそれぞれに完全なフィンガプリント処理を施す場合に必要となる時間に比べて非常に短い時間で固有のフィンガプリントが付されたコンテンツのコピーを生成できるという点である。

コンテンツの海賊版コピーが発見された場合、海賊バージョンがコピーされたコンテンツのソースを特定できれば有用である。これにより、海賊版コピーの作成者又は他社によって海賊版コピーが作成されることを許した安全義務違反のユーザを特定することができる。この新規な提案においては、この特定は、各セグメントについて検出されたフィンガプリントが付されたデータと、ユーザに発行されたバージョン内の各セグメントに用いられていることが既知のフィンガプリントが付されたデータとの間の１００％の一致の検出によって行ってもよい。

しかしながら、この基本的な手法は、１以上のフィンガプリントが付されたセグメントに関して、フィンガプリントの検出に失敗した場合を考慮していない。このような失敗は、コンテンツに対し、例えば映画フィルムの場合、所謂「カムコーダによる海賊行為」等のある種の処理が施された場合に起こり得る。また、この基本的な検出法は、フィンガプリントデータを削除又はその効果を弱めるために、海賊版コピーを複数の正当なコピーから作成する所謂「コルージョンアタック」を考慮していない。

本発明は、ユーザのバージョンが不正なコピーのソースであることを検出するために、検出された識別データと、ユーザのバージョンに対する識別データパターンとの間の一致の和を閾値と比較することによって、これらの問題のうち、少なくとも幾つかを解決する。

特に、個々のセグメントから複数の識別データが導出されるような所謂コルージョンアタックがある場合、誤検出確率を所望の確率に抑えるために、入力データコンテンツのセグメントに関して検出された識別データから閾値を導出することが望ましい。具体的には、閾値は、入力データコンテンツの各セグメントから幾つの識別データのインスタンスが検出されるかに応じて決定することが望ましい。好ましくは、閾値は、入力データコンテンツの各セグメントに関して検出される識別データのインスタンスの数に対して、入力データコンテンツがあるバージョンとして誤検出される統計的可能性が閾値可能性より低くなるように設定する。

これに代えて又はこれに加えて、検出方法は、入力データコンテンツのセグメントに関して識別データの幾つのインスタンスが検出されたかに応じて入力データコンテンツのセグメントの１つに関して検出された識別データ間の一致を重み付けするステップを有し、一致の和は一致の加重和である。

この重み付けは、識別データの複数のインスタンスが検出されたセグメントが、識別データの単一のインスタンスが検出されたセグメントより弱く一致の加重和に貢献するように行うと、より信頼度が高い結果が得られると予想される。しかしながら、直感とは異なり、幾つかの実際の試験では、この重み付けについて、識別データの複数のインスタンスが検出されたセグメントが、識別データの単一のインスタンスが検出されたセグメントより弱く一致の加重和に貢献するように行った方がよりよい結果が得られた。

識別データが導出された幾つかのセグメントがある場合には、入力データコンテンツの２以上のセグメントに関して識別データが検出されなかったとき、これらのセグメントを２以上のセグメントのグループとして併合し、セグメントの併合されたグループに関して識別データを検出するとよい。この処理は、繰り返し行うことが望ましい。

好ましくは、この閾値は、セグメントの総数より小さいセグメントの数を表し、及び／又は識別データパターンの１つに基づく各識別データを有するセグメントの総数より小さいセグメントの数を表す。

幾つかのセグメントのみが識別データを含むような識別パターンを用いてもよいが、データコンテンツのバージョンは、実質的に全てのセグメントがそれぞれの識別データを有する対応する識別パターンによって識別可能であることがより好ましい。

更に、本発明に係る識別データ適用方法は、入力データコンテンツに識別データを適用する識別データ適用方法において、（１）少なくとも１つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む入力データコンテンツのｎ個のインスタンスを生成するステップと、（２）入力データコンテンツの各バージョンが関連する識別データパターンに基づいてインスタンスからの識別データを含むようにｎ個のインスタンスからセグメントを選択することによって入力データコンテンツのバージョンを生成するステップと、（３）ｍを１以上の数とし、各インスタンスが他の全てのインスタンスに対して固有のそれぞれの識別データを含む入力データコンテンツのｍ個の更なるインスタンスを生成するステップと、（４）入力データコンテンツの各バージョンが関連する識別データパターンに基づいてインスタンスからの識別データを含むように、ｍ個のインスタンス、ｍ個のインスタンスを含むインスタンスの組、又は生成された全てのインスタンスからセグメントを選択することによって、入力データコンテンツの更なるバージョンを生成するステップと、（３）のステップ及び（４）のステップを１回以上繰り返すステップとを有する。

海賊版コピーの出所をより確実に検出するためには、（１）のステップにおいて、全てのインスタンスがそれぞれ他のインスタンスに対して固有の識別データを含むようにするとよい。

更に、本発明に係る識別データ適用方法は、入力データコンテンツに識別データを適用する識別データ適用方法において、（１）少なくとも１つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む入力データコンテンツのｎ個のインスタンスを生成するステップと、（２）入力データコンテンツの各バージョンが関連する識別データパターンに基づくインスタンスからの識別データを含むように所定のセグメント化パターンによりｎ個のインスタンスからセグメントを選択することによって、入力データコンテンツのバージョンを生成するステップとを有し、セグメント化パターンは、少なくとも１つのセグメントが入力データコンテンツ内において不連続となるようなパターンであることを特徴とする。

本発明のこの側面により、フィンガプリントが付された複数のコピーを結合する所謂コルージョンアタックを防ぐことができる。すなわち、不連続なセグメントを用いることにより、コルージョンアタックを行おうとするグループがセグメント境界を特定することが困難になる。

本発明は、特に、複数の連続する画像を含むビデオコンテンツに好適に適用される。好ましくは、識別データは、例えば少なくとも幾つかの画像の空間周波数成分のサブセット内等、少なくとも幾つかの画像を表すデータ内に符号化するとよい。

更に、本発明に係る検出装置は、複数の異なるバージョンが存在する入力データコンテンツのバージョンを検出する検出装置であって、データコンテンツは、セグメント化パターンに基づく２以上のセグメントとして配列され、データコンテンツのバージョンは、セグメントの少なくとも一部が各識別データを含むことによる対応する識別データパターンによって識別可能であり、検出装置は、入力されたデータコンテンツのセグメントに関する識別データを検出する識別データ検出器と、検出された識別データと、データコンテンツの異なるバージョンに対応する識別データパターンとを比較する比較器と、検出された識別データとあるバージョンに関する識別データパターンとの間から得られる一致の合計が閾値を超えたとき、入力コンテンツコンテンツが少なくともデータコンテンツのあるバージョンからの貢献含むことを検出する貢献検出器とを備える。

更に、本発明に係る識別データ適用装置は、入力データコンテンツに識別データを適用する識別データ適用装置において、（１）少なくとも１つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む入力データコンテンツのｎ個のインスタンスを生成するインスタンス生成器と、（２）入力データコンテンツの各バージョンが関連する識別データパターンに基づいてインスタンスからの識別データを含むようにｎ個のインスタンスからセグメントを選択することによって入力データコンテンツのバージョンを生成するバージョン生成器と、（３）ｍを１以上の数とし、各インスタンスが他の全てのインスタンスに対して固有のそれぞれの識別データを含む入力データコンテンツのｍ個の更なるインスタンスを生成するインスタンス生成コントローラと、（４）入力データコンテンツの各バージョンが関連する識別データパターンに基づいてインスタンスからの識別データを含むように、ｍ個のインスタンス、ｍ個のインスタンスを含むインスタンスの組、又は生成された全てのインスタンスからセグメントを選択することによって、入力データコンテンツの更なるバージョンを生成するバージョン生成コントローラとを備える。

更に、本発明に係る識別データ適用装置は、入力データコンテンツに識別データを適用する識別データ適用装置において、（１）少なくとも１つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む入力データコンテンツのｎ個のインスタンスを生成する生成器と、（２）入力データコンテンツの各バージョンが関連する識別データパターンに基づくインスタンスからの識別データを含むように所定のセグメント化パターンによりｎ個のインスタンスからセグメントを選択することによって、入力データコンテンツのバージョンを生成するバージョン生成器とを備え、セグメント化パターンは、少なくとも１つのセグメントが入力データコンテンツ内において不連続となるようなパターンであることを特徴とする。

本発明の更なる側面及び特徴は、添付の請求の範囲において定義されている。

本発明が提案する技術により、コンテンツ（又は少なくともコンテンツのコピーの一部）を固有に特定し、後に訴訟の証拠となるように、コンテンツにマークを付すことができる。この技術は、ビデオ及びオーディオのエレメンタリデータ又は多重化されたストリームなどのいかなるパケット化可能なデータにも適用できる。これは、データが正式にパケット化された形式でなくてはならないことを意味するものではなく、データは、マークが付されるデータの全体的な量のサブセットを表すセグメント又は部分として取り扱うことができればよい。この手法は、パッケージ化された媒体（光ディスクなどの記憶媒体の上に保存されたコンテンツなど）、インターネット（所謂、コンテンツ「プル」システム）からダウンロードされたコンテンツ、例えばデジタルテレビジョンサービス（所謂、コンテンツ「プッシュ」システム）を介して放送されたコンテンツ、又は他のコンテンツ配信フォーマットに適用できる。

フィンガプリントが付されたコンテンツを作成する処理は、２以上の（包括的にｍ個の）マスタコピーＭ_ｉを作成する処理を含む。個々のマスタには、フィンガプリント技術を用いて、それぞれ固有のマークを付すことができ、又は、元のコンテンツ（original）には、マークを付さないままにすることもできる。ビデオコンテンツの場合、上述した参考文献に開示されている手法によって、コンテンツに識別データを付すことができ、この識別データの存在は、視聴者には実質的に不可視であり、識別データは、コンテンツの短い部分（又はビデオにおける数秒程度のデータ）から後に復号でき、識別データは、例えばサイズ変更、データ圧縮、又はカムコーダによる海賊行為（コンテンツが映写されたスクリーンをビデオカメラで撮影する行為）等の処理に対して、実質的にロバストである。

マスタは、等しくｎ個のパート（セグメント又は部分）に分割される。基本的な方式では、この分割は、単純な時分割であり、セグメント１はコンテンツの最初の期間であり、セグメント２はセグメント１の次の期間であり、セグメント３はセグメント２の次の期間である。各セグメントの長さはそれぞれ等しくても異なっていてもよい。

より高度な構成では、各セグメントは、複数の非連続的な時点に対応することができる。この構成は、所謂「コルージョンアタック（collusion attack）」に対する防御に有効であり、これについては、後に図４を用いて更に詳細に説明する。

更なる可能性（上述した２つの可能性のいずれかと組み合わせてもよい）として、ビデオコンテンツを空間分割してセグメントを構成し、例えば、ピクチャの上部がピクチャの下部とは異なるセグメントを表すようにしてもよい。

ｍ個のマスタからのｎ個のセグメントの組合せの擬似ランダム生成に基づき、同じｎ個のセグメントを含むコンテンツのバージョンが生成されるが、これらのセグメントに適用される識別データは擬似ランダム的に結合される。配信すべきバージョンの数に十分に対応できる順列（permutations）の組を提供できる十分な数のマスタ及びセグメントを用いている限り、２つのバージョンが同じセグメント識別データの順列を有することはない。これは、各バージョンが固有のフィンガプリントを有することを意味し、したがって、このようなバージョンを作成するために専用のフィンガプリントを生成するような時間がかかる処理を行う必要がなくなる。

図１は、この手法を用いたフィンガプリント符号化装置の構成を示すブロック図である。

図１では、マークが付されていない（フィンガプリントが付されていない）ビデオファイル１０を２つのフィンガプリントエンコーダ２０、３０に供給する。ビデオファイル１０は、２つの異なるフィンガプリントデータの組を用いてフィンガプリント符号化され、これにより２個のマスタＭ_１、Ｍ_２が生成される。なお、実際には、１つのマスタは、フィンガプリントを付さないままにしてもよく、更に、フィンガプリント符号化処理は、図１に示すような並列処理ではなく、直列処理として行ってもよい。更に、マスタの数は２以上であってもよい。

２つのマスタは、エンコーダ４０、５０によってＭＰＥＧ−２符号化され、マルチプレクサ６０、７０は、ＡＣ３音声データなどの圧縮された音声データをこのデータに多重化する。これにより、２個の所謂ＤＶＤ画像、すなわち、ＤＶＤディスクに記録することができる形式のビデオデータが生成される。各画像は、マスタＭ_１かマスタＭ_２に対応するフィンガプリントを含んでいる。

２つの画像セグメント結合器８０、９０は、ユーザデータベース１００から識別ベクトルを受け取り、この識別ベクトルに基づいて、２つのマスタＤＶＤ画像Ｍ_１、Ｍ_２のセグメントを結合する。生成すべき必要なバージョンの数について、識別ベクトルの母集団が十分大きくなるようなマスタの数及びセグメント変更（segment alteration）の数を選択すれば、識別ベクトルは、固有（又は少なくとも擬似固有的（least quasi-unique））であるとみなされる。それぞれの結合器の出力は、それぞれのＤＶＤライタ（所謂「バーナ（burner）」）１１０、１２０に供給され、各ＤＶＤディスク１３０、１４０に書き込みが行われる。各バーナにおいて、更なるＤＶＤディスクを作成するために、新しい識別ベクトルがデータベースから供給され、２つのマスタＤＶＤ画像Ｍ_１、Ｍ_２のセグメントの組合せが生成される。

図１は、同じ数（すなわち、それぞれの２個）のマスタ、結合器及びバーナを示しているが、これは、図面を明瞭にするために単純化した実施例を示しているに過ぎず、マスタと同数の結合器とバーナを設けなくてはならないといういかなる技術的理由もない。

各ディスクをデータベース１００に格納されている（秘密の）識別ベクトルにリンクする非秘密コード（non-secret code）をディスクに書き込んでもよく、目に見えるようにディスク上に印刷してもよくこの両方を行ってもよい。これは、技術的な特徴ではないが、正しいユーザにディスクを配布するために役立つ。実際には、ユーザの名前をデータベース１００に格納してもよく、各ＤＶＤディスクの表面に印刷してもよい。

例えば、３つのマスタがり、各マスタが５つのセグメントに分割されるとする。この構成を図２に示す。各バージョンは、「１３２１３」や「２２１３１」などの５桁の「識別ベクトル」によって定義される。これは、事前に定義されたセグメント順に、どのマスタがそのバージョンの各セグメントを提供するのに使用されたかを示している。図２に示す実施例では、図面の下部の４つの例示的なバージョン（ａ〜ｄ）に使用されるＩＤベクトルは以下の通りである。
バージョンａ：３２２１２
バージョンｂ：１１３３２
バージョンｃ：１３２２２
バージョンｄ：２３２２１
（フィンガプリントが実質的に知覚されないように付加されたと仮定すると）再生時には、ユーザによって享受されるオーディオ／ビデオマテリアルのバージョンの間には、全く違いがない。すなわち、バージョンの唯一の違いは、フィンガプリントデータである。

データベースには、そのバージョンを受け取ったユーザにリンクされるように識別ベクトルを保存できる。

個々のフィンガプリントの可能な組合せは、以下の３つの要素に依存する。
１）マスタの数ｍ
２）セグメントの数ｎ
３）交換できるセグメントの最大数ｋ
単一のマスタから区別される組合せの数（ｃ）を算出する式は以下の通りである。
１）全てのｎ個のセグメントが交換可能である場合、この数は以下の通りとなる。
ｃ＝ｍ^ｎ−１
２）ｎ個のうち最大ｋ個のセグメントが交換可能である場合、この数は以下の通りとなる。

例えば、６０（＝ｎ）個のセグメントに分割された１２０分の映画について２（＝ｍ）個のマスタが使用され、６０個のセグメントのうち２０個（＝ｋ）だけが交換可能である場合、単一のマスタから区別される組合せの数は、７×１０^１５通り以上である。より単純な構成として、ｍ＝２、ｎ＝２０とし、２０個全てのセグメントが交換可能であると仮定すると、単一のマスタから区別できる組合せの数は、１０４８５７５通りである。以下の表は、マスタの数とセグメントの数により、単一のマスタから区別できる組合せの数が幾つになるかを示している。

図３は、ＤＶＤにおけるビデオオブジェクトユニット（Video OBject Unit：以下、ＶＯＢＵという。）の境界に沿って本発明の手法を適用する具体例を図式的に示している。

ＶＯＢＵ（ビデオオブジェクトユニット）は、ＤＶＤに記録されたビデオ（及び関連するオーディオ）の小さい（通常、数秒の）連続するシーケンスを表している。ＶＯＢＵは、ＤＶＤプレーヤのＭＰＥＧデコーダによって解釈できる１以上の「グループオブピクチャ」（ＧＯＰ）を含んでいる必要がある。デコーダによる再処理が必要ないように、及びジャンプされた位置が常に有効なＭＰＥＧストリームの開始点となるように、再生時における検索、ジャンプ等は全てＶＯＢＵ境界で行われるように保証されている。ＶＯＢＵは、ＶＯＢＵグループに組織化され、ＶＯＢＵグループは、ビデオオブジェクト（Video OBject）を構成する。各ＶＯＢＵグループは、独立した（standalone）多重化された単位であり、前の又は後の単位に対して依存していない。ＶＯＢＵグループは、必要な又は適切な数のＶＯＢＵを含むことができる。

図面を簡潔にするために、図３では、２つのマスタＭ_１、Ｍ_２のみを示している。これらは、個別にフィンガプリントを付与してもよく、或いは一方にはフィンガプリントを付与せず、他方にフィンガプリントを付与してもよい。２つのマスタはＭＰＥＧ−２符号化され、ＶＯＢＵ及びＶＯＢＵグループに予備的に多重化（pre-multiplexed）される。マスタは、本発明の手法を適用するために、ＶＯＢＵグループ境界に沿ってセグメント化される。

そして、上述した擬似固有識別ベクトルに基づいてセグメントを擬似ランダム的に結合し、固有のＤＶＤ記録情報を作成し、これを（例えば）書込可能なＤＶＤ（ＤＶＤ−Ｒ）に記録することができる。この処理では、フィンガプリントの付与は、マスタのみに対して行えばよく、これらのマスタが予備的に多重化されるため、専用のフィンガプリントが付されたＤＶＤ−Ｒを準備する処理程時間がかからない。各バージョンに関する個別化の処理は、単にデータセグメントを連結するだけで済む。

一旦ＶＯＢＵグループが結合されると、新たに生成されたＶＯＢ内の各ＶＯＢＵに関するオフセットを算出するＩＦＯ生成処理が行われる。（ＤＶＤビデオディスク符号化では、ＩＦＯは情報（InFOrmation）を含むＤＶＤディスク上に記録されたファイルである。ＶＯＢファイルは、ＭＥＰＧ−２符号化オーディオ、ビデオ及びサブタイトルストリームを含むＤＶＤのメインコンポーネントを表現し、一方、ＩＦＯファイルは、ＤＶＤの章がどこで始まり、所定のオーディオトラックがどこに設けられているか等の情報をＤＶＤプレイヤに提供する。）ＤＶＤプレーヤにとって、ＶＯＢは、適切に符号化されたＤＶＤデータと同様に、完全に自己矛盾がない（self-consistent）データに見えるが、ＶＯＢは、内部的には、２以上の異なるＤＶＤ符号化に由来するＶＯＢＵグループの組合せである。ＶＯＢは、ＤＶＤ仕様書の制約に従う。

これらのＤＶＤの１つに対する海賊行為が行われた場合、例えば、直接のコピー（所謂「リッピング（ripping）」）又は例えば、所謂ＤｉＶｘ又はＸｖｉｄフォーマットでの再符号化が行われた場合、海賊版コピーのソース、すなわち海賊版コピーが作成されたバージョンの所有者を特定できる必要がある。この目的で、海賊版コピーのビデオストリームを解析する。この解析では、セグメント境界を特定し、各セグメントに付与されているフィンガプリントによって表されている識別データを復号する。これにより、識別ベクトルが生成され、この識別ベクトルをディスクへの記録が行われた際に作成されたデータベースに格納されている識別ベクトルと比較する各ディスクは、擬似固有識別ベクトルを有しているので、これにより、ソースを識別することができる。

図４は、不連続なセグメントを用いる構成を説明する図である。ここでは、セグメントは、１、２、３、４、５・・・といった番号が付され、ビデオマテリアルの時間軸に沿って（図面の左側から右側に）各セグメントが２以上の不連続な部分に分割されている。これにより、後述するように、所謂コルージョンアタック（collusion attack）を防ぐことができる。

この手法は、個々のコンテンツパッケージが各ユーザ又はユーザグループに配信されるインターネットダウンロード、ビデオオンデマンド装置又はこの他のコンテンツ配信メカニズムにも適用できる。

図５は、本発明を適用したビデオオンデマンド（video-on-demand：以下、ＶＯＤという。）送信を図式的に示す図である。この実施例では、結合器８０’が、データベース１００’から受け取った識別ベクトルに基づき、セグメントに分割された２つのマスタＭ_１、Ｍ_２（図面を簡潔にするために、連続的なセグメントとして示している）を結合する。結合されたビデオストリームは、ＶＯＤサーバ２００によって処理され、ケーブルネットワークにより、ユーザのＶＯＤセットトップボックス２１０に送信される。ユーザは、テレビジョンセット２２０によってファイルを視聴する。

同様に、図６に示す具体例では、データベース１００”は、２個のマスタコピーＭ_１、Ｍ_２を結合するために、識別ベクトルを結合器８０”に供給する。結合されたファイルは、ウェブサーバ２３０によって、インターネット接続を介して、クライアントパーソナルコンピュータ（ＰＣ）２４０に送信される。

なお、ＶＯＤサーバ２００及びその後の処理に関する限り、並びにウェブサーバ２３０及びその後の処理に関する限り、保護されたファイルは、他のあらゆるファイルと同様に処理される。フィンガプリントが付されたマスタを結合することにって得られる安全性は、ＶＯＤサーバ２００又はウェブサーバ２３０にも、ユーザによるコンテンツの享受にも関連性がない。

基底に存在するフィンガプリント技術において認められているロバスト性及び低い誤検出確率にもかかわらず、この技術を不適切に用いたセグメント化方式では、誤検出確率が高まり、コルージョンアタックに対するロバスト性が劣化する虞もある。これらの問題の少なくとも一部は、適切な復号法を用いることによって解決できる。

フィンガプリント検出装置の構成を図７に示す。

図７に示すフィンガプリント検出装置は、ディスプレイ３１０、キーボード３２０、例えばマウス３３０などのユーザ入力装置を有するパーソナルコンピュータ３００を備える。パーソナルコンピュータ３００は、中央演算処理装置３４０と、読出専用メモリ３５０と、ランダムアクセスメモリ３６０と、ディスクストレージ装置３７０と、インターネット３９０などのネットワークに接続することができるネットワークインタフェース３８０と、例えば、ＤＶＤディスク４１０からデータを読み出し及び／又はＤＶＤディスク４１０にデータを書き込むための入出力装置４００とを備える。本発明の手法をパーソナルコンピュータにおいて実現するソフトウェア（及びここに説明するバージョン生成法を実際に制御するソフトウェア）は、例えばディスクストレージ装置３７０等のストレージ媒体又はオプティカルディスク４１０等のリムーバブル媒体、及び／又はネットワークインタフェース３８０を介して接続されるネットワーク又はインターネット等から提供してもよい。

図７に示すフィンガプリント検出装置の動作を図８を用いて説明する。

図８に示す実施例では、保護されたコンテンツについて、海賊版の疑いがある海賊コピーは、ＤＶＤディスク５００から読まれる。ブロック５１０において、コンテンツを所定の（秘密の）セグメント化パターンに基づいて分割し、セグメントのフィンガプリントデータを解析する。ブロック５２０において、この解析から閾値量を導出する。閾値を導出する手法については以下に述べるが、基本的には、この処理は、識別データをセグメント間に分布させた際に、要求される又は望ましい誤検出確率（すなわち、要求される、最終的な結果が有効である保証）を実現するための統計的演算である。

ブロック５３０では、データベース１００のコピーから読み出されたユーザ識別ベクトルに対してセグメント識別情報を検査する。これにより、一致する識別データが検出される。

そして、ブロック５５０において、ブロック５３０で実行された検査の結果に閾値を適用する。閾値を超える検査スコアに十分一致する識別ベクトルに対応するユーザは、海賊版コピーのソースであると判定される。

上述のように、基本レベルでは、デコーダは、海賊コピーの各セグメントから識別データを復号し、復号された識別ベクトルを生成し、この復号された識別ベクトルと、事前に各ユーザについて保存している識別ベクトルとの照合を試みる。ここで、（例えば、セグメントの処理が厳しすぎ、又はコンテンツ全体からセグメントが削除されている場合等の理由により）セグメントからの識別データの復号が失敗する可能性を低くするためには、デコーダが個々の全てのセグメントについて識別データの一致を求めないことが重要である。これに代えて、望ましい復号法は、十分に多くのセグメントについて識別データの一致が確認されることを検査するという手法である。実際に幾つの一致があれば十分であると判定するかは、望まれる誤検出確率に依存する。すなわち、この閾値が小さすぎると、無実のユーザのランダム識別ベクトルが復号された識別ベクトルに一致すると判定される可能性が高くなる。

コルージョンアタックがある場合、（コルージョンアタックがどのように行われるかによって）基底に存在するフィンガプリントデコーダにより各セグメントについて複数の識別データを復号してもよい。

このような状況でも、好適な復号法は、ユーザの識別ベクトルと復号された識別ベクトルに十分多くの一致があるかを検査することである。しかしながら、上述のように、復号された識別ベクトルは、セグメント毎に複数の識別データを有している場合もある。このため、無実のユーザの擬似ランダム識別ベクトルが偶然復号された識別ベクトルに一致し、この無実のユーザが海賊版コピーのソースであると疑われてしまう可能性が高くなる。したがって、一致するセグメントの数に関する閾値は、このような問題を回避できるように設定する必要がある。なお、実際の閾値は、セグメント毎に幾つの識別データを復号するかに依存し、これ自体は、コルージョンアタックがどのように為されたかに依存する。

ここで、復号された識別ベクトルにおいて、セグメントから復号された情報データの数をセグメントの重みｗとする。更に、ｍ個のマスタがあるとすると、各セグメントについて、０≦ｗ≦ｍとなる。重みが０のセグメントは、一致の可能性がゼロであるため、照合処理においては情報を提供しない。同様に、重みがｍのセグメントは、常に一致が検出されるため、これも照合処理においては情報を提供しない。

好ましい復号法は、各ユーザ（recipient）に関して、重みが１≦ｗ＜ｍのセグメントについてのみユーザの識別ベクトルと復号された識別ベクトルとの間の一致数をカウントすることである。特定のユーザの識別ベクトルに関する一致数が、閾値ｔに等しいか又はこれ以上である場合、このユーザは、海賊行為に協力したと判定される。以下では、特定の誤検出確率ｐを保証する閾値ｔの算出法について説明する。

重みが１≦ｗ＜ｍのセグメントについて、復号された識別ベクトル内の重みｗのセグメントの数、すなわちｗ個の識別データが復号されたセグメントの数をｃ_ｗとする。

これにより、重みが１≦ｗ＜ｍのセグメントの数ｌは、以下の式により表される。

また、１≦ｗ＜ｍについて、Ｂ_ｗ〜Ｂｉｎ（ｃ_{ｗ，ｗ／ｍ}）とする。復号された識別ベクトル内の重みがｗの全てのセグメントについて、独立したランダム識別ベクトル内の対応するセグメントが一致する確率は、ｗ／ｍである。復号された識別ベクトル内には、このようなセグメントがｃ_ｗ個あるため、Ｂ_ｗは、重みがｗのセグメントのみを考慮した場合における復号された識別ベクトルと、独立したランダム識別ベクトルとの間の一致数の二項確率分布を表している。

全てのランダム識別ベクトルについて（復号された識別ベクトルから独立して）、復号された識別ベクトル内の重みがｗのセグメントのみを考慮した場合におけるランダム識別ベクトルと復号された識別ベクトルとの間の一致数を表すランダム変数をＡとすると、次のような式が成り立つ。

母集団のサイズをｙとすると、誤検出確率をｐとして、

となる最も小さい正の整数を閾値ｔとすることができる。

この他の可能なアルゴリズムについて説明する。

ある重みを有するセグメントの一致を他の重みを有するセグメントの一致より重要であるとみなすことが有益である場合もある。したがって、一致数を算出するために、加重和（weighted sum）を算出することが望ましい場合もある。１≦ｗ＜ｍについて、αｗを正の整数とする。

全ての識別ベクトルＶについて、このＶ（１≦ｗ＜ｍについて）内の対応するセグメントに一致する復号された識別ベクトル内の重みがｗのセグメントの数をｃ_ｗ，ｖとする。更に、一致数を算出するための加重和を以下の通りとする。

なお、この値は、１≦ｗ＜ｍについてαｗ＝１のとき、先の手法の値と一致する。

全てのランダム識別ベクトルについて（復号された識別ベクトルから独立して）、復号された識別ベクトル内の重みがｗのセグメントのみを考慮した場合におけるランダム識別ベクトルと復号された識別ベクトルとの間の一致数の加重和を表すランダム変数をＡとすると、次のような式が成り立つ。

母集団のサイズをｙとすると、誤検出確率をｐとして、

となる最も小さい正の整数を閾値ｔとすることができる。

検査の結果、重み付けされていない一致数を用いた場合に比べて、一致数に加重和を用いた方が僅かに良好な結果が得られることもあれば、結果が悪くなることもあることがわかった。勿論、重付けされていない和及び複数の加重和を用いて多くの検査を行うこともできる。この場合、各検査について、全ての検査からの全ての組み合わされた誤検出確率が十分低くなるように、誤検出確率ｐを低減する必要がある。

これらの検査の結果から、１≦ｗ＜ｍについて、

上のような重み付けは、良好に機能することがわかった。

コルージョンアタックがない場合、重み付けを行う復号法と重み付けを行わない復号法は等価であり、どちらも良好に機能する。例えば、（１）２個のみのマスタと、（２）１００００人のユーザと（３）１２０個のセグメント（例えば、２時間の映画の場合、１セグメントあたり１分）と、（４）１０^−８の誤検出確率との条件では、４０個のセグメントからセグメント識別データを導出するだけで海賊版コピーのソースを特定できる。マスタが４個あれば、２０個のセグメントから識別データを導出するだけで海賊版コピーのソースを特定することができる。

しかしながら、コルージョンアタックがあると、状況はより厳しくなる。コルージョンアタックを行う複数の者に適合する最良のコルージョン対策を決定することは困難である。基底に存在するフィンガプリント技術のコルージョンアタックに対する応答を無視すれば、コルージョン対策の一手法は、セグメント毎に最大でも１つのみの識別ベクトルを生成することである。セグメント化パターンが既知（又は判別可能）であれば、コルージョンアタックを行う者は、入手可能なコピーから異なるセグメントを選択するだけで、不正なコピーを作成することができる（例えば、コルージョンアタックを行う者がｚ人いた場合、コルージョンアタックを行うそれぞれから、不正なバージョンにおける１／ｚのセグメントが得られる）。

したがって、不正を行う者が、映画のどの部分がセグメントを構成しているかを判定できないようにすることが重要である。したがって、符号化では、（１）膨大な数のセグメントを用い、（２）（上述した図４のように）より小さなセクションからの各セグメントを映画全体に亘って擬似ランダム的に分布させることが望ましい。これにより、不正を行おうとする者が個々のセグメントを分離することが不可能又は著しく困難となり、これは、各セグメントが、あらゆる尤度で、２以上の識別データを生成することを意味する。

コルージョンアタックを行おうとする者は、上述したアタックに代えて、例えば、フレームを互いに平均化する等、より効率的なコルージョンアタックを画策する。このような場合、基底に存在するフィンガプリント技術のコルージョンに対する応答が重要となる。所定のセグメントについて、フィンガプリント検出器は、セグメント識別データの幾つか又は全てを検出することが望ましい。海賊版コピーのソースであるユーザの検出は、セグメント識別データの数が増えるほど容易になる。しかしながら、コルージョンアタックを行う者が十分に多い場合、このようなアタックにより、検出器は、セグメントの期間に亘っていかなる識別データも検出できなくなる。したがって、予期されるアタック（例えばコルージョン又は圧縮やサイズ変更等のより包括的な処理）に対抗できるようにセグメントを十分に長くする必要がある。

ここでは、（１）フィンガプリント検出器がセグメント識別データを検出できるよう、セグメントを十分長くすることと、（２）セグメント化パターンを推定することが可能な限り困難となるように、できるだけ多くのセグメントを設けることとの間のバランスを調整しなくてはならない。

また、母集団のサイズを小さくすることも復号の向上に貢献する。一組のフィンガプリントが付与されたマスタを作成すると、セグメント多重化により、配布のためのフィンガプリントが付与されたコピーの生成を開始することができる。この間、バックグランド処理として、フィンガプリントが付与されたマスタの新しい組を生成することもできる。新しいマスタの組が生成されると、これらのマスタを先のマスタに代えて使用することができる。これにより、各マスタの組の母集団のサイズを基本的に減らすことができる。これに代えて、先のマスタに加えて新たなマスタを使用してもよく、これにより、将来のコピーのためのマスタの数を増加させることもできる。この処理については、図１０を用いて後に説明する。

例えばコンテンツに対する処理又はカムコーダによる海賊行為が適用されたこと等に起因して、全てのセグメントからは識別データを導出できない場合、併合されたセグメント（coalesced segments）を用いて、これらのセグメントからの識別データの導出を試みる。勿論、この処理では、セグメントに識別データが含まれていることを仮定している。セグメント化のパターン又はマスタの性質（例えば、マスタの１つがフィンガプリントが付されていないファイルであるか否か）から、各セグメントに識別データを期待できるか否かを知ることができる。これは、（マークが付されていないフィンガプリントマスタではなく）フィンガプリントが付与された全てのマスタを用いることにより、全てのセグメントがある種の識別データを含むことが期待されるという利点を示している。

図９を用いて説明すると、ステップ６００において、セグメントの識別データを解析する。ステップ６１０において、全てのセグメントが少なくとも１つの識別データを有しているか否かを判定する。全てのセグメントが少なくとも１つの識別データを有している場合、（セグメントの処理に関する）処理は終了する。全てのセグメントが少なくとも１つの識別データを有していない場合、処理はステップ６２０に進む。

ステップ６２０において、識別データが期待されるが識別データを導出することができなかったセグメントが併合可能であるか否かを判定する。基本的には、この判定は、期待された識別データが導出されなかったセグメントが２個以上あるか否かに基づいて行うことができる。

併合ができない場合、すなわち、このようなセグメントが１つしかない場合、処理は終了する。一方、併合が可能な場合、処理はステップ６３０に進み、このステップ６３０において、復号がうまくいかなかったセグメントを併合する。

セグメントを併合する処理は、幾つかの段階で行うことができる。例えば、幾つかのセグメントが識別データを含むと期待されたが、復号によってこのような識別データを導出できなかった場合、セグメントを任意にグループ化された対として併合してもよい（例えば、復号に失敗した、時間的に隣接するセグメントを併合してもよい）。このようなセグメントが奇数個の場合、２つのセグメントの対に代えて、３個のセグメントを一組としてグループ化してもよい。併合されたセグメントは、再びステップ６００に戻され、ここで識別データを検出するための解析を繰り返す。

勿論、併合されたセグメントを構成する復号に失敗したセグメントが偶然同じ識別データを含んでいる場合もある。この場合、セグメントの併合により、デコーダが識別データを検出する可能性が高まる（一般的に、フィンガプリントが付されたビデオマテリアルが長い程、デコーダが識別データを検出できる可能性が高くなる）。一方、セグメントが同じ識別データを含んでいない場合でも、これらの併合されたセグメントを更に併合することが復号に貢献する可能性があり、すなわち、併合されたセグメントを構成する初期のセグメントのグループが増えると、２つ以上の初期のセグメントが同じ識別データを含んでいる可能性が高まる。

したがって、セグメントを併合する１つの段階の後、２以上の復号されなかった（併合された）セグメントが残っている場合、更なる併合の段階を行ってもよい。このような処理は、併合され、復号されなかったセグメントが残り１つになるまで、繰り返し行ってもよい。

図１０は、マスタ生成処理の変形例を示している。この実施例では、エンコーダ１、２、３として示す３個の並列のフィンガプリントエンコーダを用いる。図１０は、４個の欄に分割され、このうち、左側の３個の欄は、それぞれエンコーダ１、２、３の動作を表し、一番右側の欄は、結合器／記録装置（８０、１１０又は９０、１２０）の動作を表す。

符号化の最初の段階では、エンコーダは、３個のマスタＭ_１、Ｍ_２、Ｍ_３を生成する。これらは、結合され、これら３個のマスタＭ_１、Ｍ_２、Ｍ_３からＤＶＤが作成される。

３個のマスタが作成されると、エンコーダはこのための処理から解放され、更なるマスタＭ_４、Ｍ_５、Ｍ_６を作成する。これらの更なるマスタが準備されている間、結合器／記録装置は、マスタＭ_１〜Ｍ_３のみに基づいてＤＶＤを作成する。ここで、更なるマスタＭ_４〜Ｍ_６が利用可能な状態となると、結合器／記録装置は、次のうちのいずれかのマスタに基づいてバージョンを作成することができるようになる。
・マスタＭ_４〜Ｍ_６のみ
・マスタＭ_１〜Ｍ_６の全て
・マスタＭ_１〜Ｍ_６の任意の組合せ
このような処理を繰り返し行ってもよい。通常、従来の手法では、結合及び単一の出力バージョンの書込によってフィンガプリントが付されたマスタを作成するには、この手法の１０倍の時間が必要であると考えられる。

添付の図面を用いて本発明の実施例を詳細に説明したが、本発明はこれらの詳細な実施例に限定されるものではなく、当業者は、添付の特許請求の範囲に定義された本発明の範囲及び思想から逸脱することなく、ここに説明した実施例を様々に変形及び変更することができる。

フィンガプリント符号化装置のブロック図である。複数のマスタコピーのセグメントを用いてフィンガプリントが付されたコンテンツのコピーを生成する手法を説明する図である。ＤＶＤにおけるＶＯＢＵ境界に沿って本発明を適用する手法を説明する図である。不連続なセグメントを示す図である。ビデオオンデマンド伝送への適用例を示す図である。インターネットダウンロードファイルへの適用例を示す図である。フィンガプリント検出装置の構成を示す図である。図７に示す装置の動作を示す図である。セグメント解析処理のフローチャートである。マスタ生成処理を説明する図である。

Claims

複数の異なるバージョンが存在する入力データコンテンツのバージョンを検出する検出方法であって、
上記データコンテンツは、セグメント化パターンに基づく２以上のセグメントとして配列され、
上記データコンテンツのバージョンは、上記セグメントの少なくとも一部が各識別データを含むことによる対応する識別データパターンによって識別可能であり、
当該検出方法は、
（１）上記入力されたデータコンテンツの上記セグメントに関する上記識別データを検出するステップと、
（２）上記検出された識別データと、上記データコンテンツの異なるバージョンに対応する上記識別データパターンとを比較するステップと、
（３）上記検出された識別データとあるバージョンに関する上記識別データパターンとの間から得られる一致の合計が閾値を超えたとき、上記入力コンテンツコンテンツが少なくとも該データコンテンツのあるバージョンからの貢献含むことを検出するステップとを有する検出方法。
上記入力データコンテンツのセグメントに関して検出された識別データから上記閾値を導出するステップを更に有する請求項１記載の検出方法。
上記閾値は、上記入力データコンテンツの各セグメントに関して上記識別データのインスタンスが幾つ検出されたかに基づいて決定されることを特徴とする請求項２記載の検出方法。
上記閾値は、上記入力データコンテンツの各セグメントに関して検出される識別データのインスタンスの数に対して、上記入力データコンテンツがあるバージョンとして誤検出される統計的可能性が閾値可能性より低くなるように設定されることを特徴とする請求項３記載の検出方法。
上記入力データコンテンツのセグメントに関して上記識別データの幾つのインスタンスが検出されたかに応じて上記入力データコンテンツの上記セグメントの１つに関して検出された上記識別データ間の一致を重み付けするステップを有し、上記一致の和は一致の加重和であることを特徴とする請求項１記載の検出方法。
上記重み付けするステップは、上記識別データの複数のインスタンスが検出されたセグメントが、上記識別データの単一のインスタンスが検出されたセグメントより強く上記一致の加重和に貢献するように行われることを特徴とする請求項５記載の検出方法。
上記重み付けするステップは、上記識別データの複数のインスタンスが検出されたセグメントが、上記識別データの単一のインスタンスが検出されたセグメントより弱く上記一致の加重和に貢献するように行われることを特徴とする請求項５記載の検出方法。
上記入力データコンテンツの２以上のセグメントに関して上記識別データが検出されなかったとき、これらのセグメントを該２以上のセグメントのグループとして併合し、該セグメントの併合されたグループに関して上記識別データを検出するステップを更に有する請求項１記載の検出方法。
上記入力データコンテンツの２以上のセグメントのグループに関して上記識別データが検出されなかったとき、上記セグメントのグループを上記セグメントのより大きなグループに繰り返し併合し、該セグメントのより大きなグループに関して、上記識別データを検出するステップを更に有する請求項８記載の検出方法。
上記閾値は、上記セグメントの総数より小さい上記セグメントの数を表していることを特徴とする請求項１記載の検出方法。
上記閾値は、上記識別データパターンの１つに基づく上記各識別データを有する上記セグメントの総数より小さい上記セグメントの数を表すことを特徴とする請求項１０記載の検出方法。
上記データコンテンツのバージョンは、実質的に全てのセグメントが上記それぞれの識別データを有する上記対応する識別パターンによって識別可能である請求項１記載の検出方法。
入力データコンテンツに識別データを適用する識別データ適用方法において、
（１）少なくとも１つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む上記入力データコンテンツのｎ個のインスタンスを生成するステップと、
（２）上記入力データコンテンツの各バージョンが関連する識別データパターンに基づいて上記インスタンスからの識別データを含むように上記ｎ個のインスタンスからセグメントを選択することによって上記入力データコンテンツのバージョンを生成するステップと、
（３）ｍを１以上の数とし、各インスタンスが他の全てのインスタンスに対して固有のそれぞれの識別データを含む上記入力データコンテンツのｍ個の更なるインスタンスを生成するステップと、
（４）上記入力データコンテンツの各バージョンが関連する識別データパターンに基づいて上記インスタンスからの識別データを含むように、上記ｍ個のインスタンス、上記ｍ個のインスタンスを含む上記インスタンスの組、又は上記生成された全てのインスタンスからセグメントを選択することによって、上記入力データコンテンツの更なるバージョンを生成するステップと、
上記（３）のステップ及び（４）のステップを１回以上繰り返すステップとを有する識別データ適用方法。
上記（１）のステップにおいて、上記全てのインスタンスがそれぞれ他のインスタンスに対して固有の識別データを含むことを特徴とする請求項１３記載の識別データ適用方法。
上記（４）のステップは、上記ｍ個のインスタンスからセグメントを選択することによって、上記入力データコンテンツの更なるバージョンを生成するステップを有することを特徴とする請求項１３記載の識別データ適用方法。
上記（４）のステップは、上記ｍ個のインスタンスを含むインスタンスの組からセグメントを選択することによって、上記入力データコンテンツの更なるバージョンを生成するステップを有することを特徴とする請求項１３記載の識別データ適用方法。
上記（４）のステップは、上記生成した全てのセグメントを選択することによって、上記入力データコンテンツの更なるバージョンを生成するステップを有することを特徴とする請求項１６記載の識別データ適用方法。
入力データコンテンツに識別データを適用する識別データ適用方法において、
（１）少なくとも１つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む上記入力データコンテンツのｎ個のインスタンスを生成するステップと、
（２）上記入力データコンテンツの各バージョンが関連する識別データパターンに基づく上記インスタンスからの識別データを含むように所定のセグメント化パターンにより上記ｎ個のインスタンスからセグメントを選択することによって、上記入力データコンテンツのバージョンを生成するステップとを有し、
上記セグメント化パターンは、少なくとも１つの上記セグメントが上記入力データコンテンツ内において不連続となるようなパターンであることを特徴とする識別データ適用方法。
上記セグメントの大部分は、２以上の不連続なサブセグメントを含むことを特徴とする請求項１８記載の識別データ適用方法。
上記データコンテンツは、複数の連続する画像を含むビデオコンテンツであることを特徴とする請求項１記載の検出方法。
上記識別データは、少なくとも幾つかの上記画像を表すデータ内に符号化されていることを特徴とする請求項２０記載の検出方法。
上記識別データは、少なくとも幾つかの上記画像の空間周波数成分のサブセット内に符号化されていることを特徴とする請求項２１記載の検出方法。
上記データコンテンツは、複数の連続する画像を含むビデオコンテンツであることを特徴とする請求項１３記載の識別データ適用方法。
上記識別データは、少なくとも幾つかの上記画像を表すデータ内に符号化されていることを特徴とする請求項２３記載の識別データ適用方法。
上記識別データは、少なくとも幾つかの上記画像の空間周波数成分のサブセット内に符号化されていることを特徴とする請求項２４記載の検出方法。
上記データコンテンツは、複数の連続する画像を含むビデオコンテンツであることを特徴とする請求項１８記載の識別データ適用方法。
上記識別データは、少なくとも幾つかの上記画像を表すデータ内に符号化されていることを特徴とする請求項２６記載の識別データ適用方法。
上記識別データは、少なくとも幾つかの上記画像の空間周波数成分のサブセット内に符号化されていることを特徴とする請求項２７記載の検出方法。
請求項１記載の検出方法を実行するためのプログラムコードを含むコンピュータソフトウェア。
請求項２９記載のソフトウェアを提供する媒体。
当該媒体はストレージ媒体であることを特徴とする請求項３０記載の媒体。
当該媒体は、伝送媒体であることを特徴とする請求項３０記載の媒体。
請求項１３記載の識別データ適用方法を実行するためのプログラムコードを含むコンピュータソフトウェア。
請求項３３記載のソフトウェアを提供する媒体。
当該媒体はストレージ媒体であることを特徴とする請求項３４記載の媒体。
当該媒体は、伝送媒体であることを特徴とする請求項３４記載の媒体。
請求項１８記載の識別データ適用方法を実行するためのプログラムコードを含むコンピュータソフトウェア。
請求項３７記載のソフトウェアを提供する媒体。
当該媒体はストレージ媒体であることを特徴とする請求項３８記載の媒体。
当該媒体は、伝送媒体であることを特徴とする請求項３８記載の媒体。
複数の異なるバージョンが存在する入力データコンテンツのバージョンを検出する検出装置であって、
上記データコンテンツは、セグメント化パターンに基づく２以上のセグメントとして配列され、
上記データコンテンツのバージョンは、上記セグメントの少なくとも一部が各識別データを含むことによる対応する識別データパターンによって識別可能であり、
当該検出装置は、
上記入力されたデータコンテンツの上記セグメントに関する上記識別データを検出する識別データ検出器と、
上記検出された識別データと、上記データコンテンツの異なるバージョンに対応する上記識別データパターンとを比較する比較器と、
上記検出された識別データとあるバージョンに関する上記識別データパターンとの間から得られる一致の合計が閾値を超えたとき、上記入力コンテンツコンテンツが少なくとも該データコンテンツのあるバージョンからの貢献含むことを検出する貢献検出器とを備える検出装置。
入力データコンテンツに識別データを適用する識別データ適用装置において、
（１）少なくとも１つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む上記入力データコンテンツのｎ個のインスタンスを生成するインスタンス生成器と、
（２）上記入力データコンテンツの各バージョンが関連する識別データパターンに基づいて上記インスタンスからの識別データを含むように上記ｎ個のインスタンスからセグメントを選択することによって上記入力データコンテンツのバージョンを生成するバージョン生成器と、
（３）ｍを１以上の数とし、各インスタンスが他の全てのインスタンスに対して固有のそれぞれの識別データを含む上記入力データコンテンツのｍ個の更なるインスタンスを生成するインスタンス生成コントローラと、
（４）上記入力データコンテンツの各バージョンが関連する識別データパターンに基づいて上記インスタンスからの識別データを含むように、上記ｍ個のインスタンス、上記ｍ個のインスタンスを含む上記インスタンスの組、又は上記生成された全てのインスタンスからセグメントを選択することによって、上記入力データコンテンツの更なるバージョンを生成するバージョン生成コントローラとを備える識別データ適用装置。
入力データコンテンツに識別データを適用する識別データ適用装置において、
（１）少なくとも１つを除く全てのインスタンスがそれぞれ他のインスタンスに含まれている各識別データに対して固有である識別データを含む上記入力データコンテンツのｎ個のインスタンスを生成する生成器と、
（２）上記入力データコンテンツの各バージョンが関連する識別データパターンに基づく上記インスタンスからの識別データを含むように所定のセグメント化パターンにより上記ｎ個のインスタンスからセグメントを選択することによって、上記入力データコンテンツのバージョンを生成するバージョン生成器とを備え、
上記セグメント化パターンは、少なくとも１つの上記セグメントが上記入力データコンテンツ内において不連続となるようなパターンであることを特徴とする識別データ適用装置。
入力データコンテンツ内において少なくとも１つのセグメントが不連続となるような関連する識別データパターンに基づく識別データをそれぞれ含む所定のセグメント化パターンに基づくセグメントを含み、識別データに関連付けられたデータコンテンツを格納するストレージ媒体。
請求項３６記載のストレージ媒体の組であって、当該ストレージ媒体の組内の各ストレージ媒体は、上記所定のセグメント化パターンに基づく同じデータコンテンツを格納し、上記識別データパターンは、当該ストレージ媒体の組内の各ストレージ媒体間で異なるストレージ媒体の組。