JP2005020742A - ビデオコピーの検出方法及び装置 - Google Patents

ビデオコピーの検出方法及び装置 Download PDF

Info

Publication number
JP2005020742A
JP2005020742A JP2004184917A JP2004184917A JP2005020742A JP 2005020742 A JP2005020742 A JP 2005020742A JP 2004184917 A JP2004184917 A JP 2004184917A JP 2004184917 A JP2004184917 A JP 2004184917A JP 2005020742 A JP2005020742 A JP 2005020742A
Authority
JP
Japan
Prior art keywords
frame
video
target video
value
program instructions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004184917A
Other languages
English (en)
Inventor
Changick Kim
キム チャンギック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Publication of JP2005020742A publication Critical patent/JP2005020742A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • EFIXED CONSTRUCTIONS
    • E06DOORS, WINDOWS, SHUTTERS, OR ROLLER BLINDS IN GENERAL; LADDERS
    • E06BFIXED OR MOVABLE CLOSURES FOR OPENINGS IN BUILDINGS, VEHICLES, FENCES OR LIKE ENCLOSURES IN GENERAL, e.g. DOORS, WINDOWS, BLINDS, GATES
    • E06B3/00Window sashes, door leaves, or like elements for closing wall or like openings; Layout of fixed or moving closures, e.g. windows in wall or like openings; Features of rigidly-mounted outer frames relating to the mounting of wing frames
    • E06B3/66Units comprising two or more parallel glass or like panes permanently secured together
    • E06B3/663Elements for spacing panes
    • E06B3/667Connectors therefor
    • EFIXED CONSTRUCTIONS
    • E06DOORS, WINDOWS, SHUTTERS, OR ROLLER BLINDS IN GENERAL; LADDERS
    • E06BFIXED OR MOVABLE CLOSURES FOR OPENINGS IN BUILDINGS, VEHICLES, FENCES OR LIKE ENCLOSURES IN GENERAL, e.g. DOORS, WINDOWS, BLINDS, GATES
    • E06B3/00Window sashes, door leaves, or like elements for closing wall or like openings; Layout of fixed or moving closures, e.g. windows in wall or like openings; Features of rigidly-mounted outer frames relating to the mounting of wing frames
    • E06B3/66Units comprising two or more parallel glass or like panes permanently secured together
    • E06B3/6604Units comprising two or more parallel glass or like panes permanently secured together comprising false glazing bars or similar decorations between the panes
    • EFIXED CONSTRUCTIONS
    • E06DOORS, WINDOWS, SHUTTERS, OR ROLLER BLINDS IN GENERAL; LADDERS
    • E06BFIXED OR MOVABLE CLOSURES FOR OPENINGS IN BUILDINGS, VEHICLES, FENCES OR LIKE ENCLOSURES IN GENERAL, e.g. DOORS, WINDOWS, BLINDS, GATES
    • E06B3/00Window sashes, door leaves, or like elements for closing wall or like openings; Layout of fixed or moving closures, e.g. windows in wall or like openings; Features of rigidly-mounted outer frames relating to the mounting of wing frames
    • E06B3/68Window bars
    • E06B3/685False glazing bars

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Structural Engineering (AREA)
  • Civil Engineering (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

【課題】ビデオコピー検出の方法及び装置。
【解決手段】ビデオクリップのコピーを検出するためのマッチング技法の方法を提供する。この方法は、ビデオクリップフレームとターゲットビデオフレームとの濃度分布の時間的軌跡を比較することを含んでいる。ビデオコピー検出のためのコンピュータ可読媒体、コンピュータシステム、集積回路も提供する。
【選択図】 図13

Description

本発明は一般的にはデジタルビデオ技術に関し、より具体的にはビデオデータの時空間コンテンツに基づいて無許可のビデオデータコピーを検出するための方法及び装置に関する発明である。
インターネットの成功と費用対効果の高いデジタル記憶装置が広く使用できるようになったことで、デジタルコンテンツを労なく複製、伝送、配信できるようになった。そのため、特にデジタル画像の著作権に関して、知的所有権(IPR)の保護が重要な法的課題になっている。とりわけ、デジタルメディア(画像、音声、映像)のコピー検出は、著作権違反を調査している者にとって基本的な必要条件である。使用されている2つのコピー検出適用アプリケーションには、使用の追跡と著作権違反に対する法的強制執行がある。
現在、2つの手法がデジタル画像の著作権の保護に広く採用されている。ウォーターマークとコンテンツベースのコピー検出である。一般的に知られているように、ウォーターマークは、配信する前に、情報を画像の中に埋め込むものである。よって、マーク付きコンテンツの全てのコピーに所有権を証明するウォーターマークが入っており、ウォーターマークは抽出可能である。コンテンツベースのコピー検出は、画像そのものがあれば、それ以外の追加情報は要らない。一般的に、画像や映像には、コピー、それもとりわけ違法に配信されたコピーを検出するのに用いることのできる固有情報が十分含まれている。例えば、画像や映像の所有権者がインターネットで画像が違法に配信されているのではないかと疑わしく思ったら、所有権者はコピー検出システムに疑問を呈することができる。言うまでもなく、コンテンツベースのコピー検出はウォーターマークに対する補足的手法にもなり得る。コピー検出者がクリエーターやディストリビューターに容疑者リストを提供した後、メディアの実際の所有権者はウォーターマークやその他の正当性証明技法を用いて所有権を証明することができる。
コンテンツベースのコピー検出スキームは原画像からシグネチャを抽出する。テスト画像から抽出された同じシグネチャを原画像に比較してテスト画像が原画像のコピーかどうかを判定する。ウォーターマークと比べてコンテンツベースのコピー検出が優れている主要な長所は、画像が配信される前にシグネチャ抽出を行なわなくてもよいということである。しかしながら、原画像と同じでないコピー、つまり、かすかに変更が加えられているコピーは検出できないことがある。例えば、第三者が様々な変更版を生成してコピー検出を回避したり画像品質を向上させようとすると、そうした変更によってコンテンツベースのコピー検出システムはコピーを検出できないことがある。
コンテンツベースの画像/映像検索システムでは、共通ヒストグラム方法(histogram intersection method)などの、カラーヒストグラムベースの方法が使用されてきた。しかしながら、カラーヒストグラムは色の空間分布についての情報を保存しないので、これらの方法はコピー検出システムには向かない。画素位置を考察することのできる別の方法は分割(partition)ベースの手法である。この方法では、画像が部分画像に分割される。そうした方法の一つでは、局所カラーヒストグラムによって各区画のカラー情報が取得される。2個の画像の相似性が、それらの局所カラーヒストグラムを比較し、全ての部分画像の相似性を考察することによって、測定される。しかしながら、この方法は計算費用が高くなるし所要の検索時間が長くなる。さらに、この方法は、空間的アウトレイ(outlay)が変更された画像を検出することはできない。
伝統的なビデオマッチング技法は圧倒的に画像対応に依存している。対応するフレームの非相似性を結合して2個のビデオシーケンス間の距離が計算される。ビデオマッチングの一つの課題は、デジタル化及び符号化のプロセスが異なると、明度が変わり、色相がずれ、彩度が変わり、ブロック状のアーティファクトが色々と異なるといったように、いくつかの歪みを生じさせることである。すなわち、現在使用可能な技法のほとんどが、導入されたかすかな色の歪みを色々と異なる符号化パラメータによって対応することを中心にしている。しかしながら、アスペクト比の変換に対応するための技法を考えなければならない。というのは、これらの変換は実際にはいろいろ異なるディスプレイに適合するようになっていることが多いからである。例えば、ビデオストリームは4:3や16:9のアスペクト比で表示されるかもしれない。伝統的なビデオマッチング技法は、アスペクト比が異なるコピーを識別するようにアスペクト比の変更に対応できる機能を有していない。図1A及び図1Bは、ビデオデータのアスペクト比を変えるのに用いられる一般的な技法を説明した図である。図1Aのビデオフレーム100は、「レターボックス」手法を用いてビデオのアスペクト比を縮小したビデオフレーム100である。図1Bは、「ピラーボックス」を用いてビデオのアスペクト比を変えたビデオフレーム102である。例えば、キーフレームベースの手法、相関ベースの方法、順序測定技法などの、伝統的なビデオマッチング技法は、アスペクト比の変更に対応できない上に、ビデオストリームの時間アスペクトを考察することができない。ビデオの時間的変異に気付かないとコピーの誤った検出になることが多い。
米国特許出願公開第2001/0020954号明細書 米国再発行特許発明第6,408,301号明細書
そこで、アスペクト比が変更されているコピーのロバスト且つ効率的なビデオコピー検出の方法及び装置を提供するために先行技術のもつ問題を解決する必要がある。
おおまかに言えば、本発明は、ビデオストリームの時間アスペクトを考慮して、コンテンツのアスペクト比の変更又はかすかな歪みに影響されないビデオコピー検出の方法やシステムを提供することによってこれらのニーズに応えるものである。言うまでもなく、本発明は、方法、システム、コンピュータ可読メディア又は装置など、色々な方法で実現できる。本発明のいくつかの実施例を以下に説明する。
本発明は、ビデオデータがターゲットビデオの中に現われるかどうか検出するための方法を提供する。この方法は、ビデオデータ及びターゲットビデオと関連付けられる2個の空間シグネチャ間の空間距離を計算することから始まる。この方法では、ビデオデータ及びターゲットビデオと関連付けられる2個の時間シグネチャ間の時間距離も計算される。その次に、空間距離と時間距離が結合される。そして、ビデオデータがターゲットビデオの中に現われるかどうか判定され、判定結果は結合距離に基づく。空間距離及び時間距離は、以下に説明する、対応する空間シグネチャ値及び時間シグネチャ値から計算される。
また本発明は、ビデオクリップのコピーを検出するための方法を提供する。この方法は、ターゲットビデオと関連付けられるアスペクト比が変わったときターゲットビデオと関連付けれる順序測度(ordinal measure)が変わらないように、ビデオクリップのフレーム並びにターゲットビデオのフレームを共に分割することから始まる。この方法では、ビデオクリップフレームとターゲットビデオフレームとの非相似性値も判定される。
また本発明は、ビデオクリップのコピーを検出するマッチング技法のための方法を提供する。この方法は、ビデオクリップフレームとターゲットビデオフレームとの濃度分布の時間的軌跡(temporal trails)を比較することから始まる。
さらにまた本発明は、ビデオデータがターゲットビデオの中に現われるかどうか検出するプログラム命令を有するコンピュータ可読媒体を提供する。このコンピュータ可読媒体は、ビデオデータ及びターゲットデータと関連付けられる空間シグネチャ値を計算するためのプログラム命令と、ビデオデータ及びターゲットデータと関連付けられる時間シグネチャ値を計算するためのプログラム命令とを含んでいる。空間シグネチャ値及び時間シグネチャ値を結合するためのプログラム命令を提供する。この結合された値に基づいてビデオデータがターゲットビデオの中に現われるかどうか判定するためのプログラム命令を提供する。
また本発明は、ビデオクリップのコピーを検出するプログラム命令を有するコンピュータ可読媒体を提供する。このコンピュータ可読媒体は、ターゲットビデオと関連付けられるアスペクト比が変わったときターゲットビデオと関連付けられる順序測度は変わらないように、ビデオクリップのフレームとターゲットビデオのフレームを分割するためのプログラム命令を含んでいる。ビデオクリップのフレームとターゲットビデオのフレームとの非相似性値を判定するためのプログラム命令を含んでいる。
また本発明は、ビデオクリップのコピーを検出するマッチング技法を実行するプログラム命令を有するコンピュータ可読媒体を提供する。このコンピュータ可読媒体は、ビデオクリップとターゲットビデオとの濃度分布の時間的軌跡を比較するプログラム命令を含んでいる。
また本発明は、コンピュータを提供する。このコンピュータは中央処理ユニット(CPU)とメモリを有する。ビデオクリップのコピーを検出するように構成されたビデオコピー検出ロジックを有する。このビデオコピー検出ロジックは、ビデオクリップのフレームとターゲットビデオのフレームを分割するためのロジック、及びビデオクリップのフレームと関連付けられる順位行列(rank matrix)とターゲットビデオのフレームと関連付けられる順位行列との空間非相似性を判定するためのロジックを含む。ビデオクリップのシーケンシャルフレームとターゲットビデオのそれぞれのシーケンシャルフレームとの対応する区画間の濃度分布の方向を判定するためのロジックもビデオコピー検出ロジックの一部である。CPU、メモリ、ビデオ検出ロジックを相互接続するバスを含む。
また本発明は、集積回路を提供する。この集積回路はターゲットビデオフレームの区画と照会ビデオフレームの対応区画との間に定義された空間距離値と、ターゲットビデオフレームの区画並びに照会ビデオフレームの対応区画と関連付けられた時間距離値とを結合して非相似性値を定義するためのロジックを含む。非相似性値が局所最小値かどうか判定するためのロジックも有する。
発明のその他の態様並びに作用効果は、発明の原理を例として説明している添付の図面と共に、以下に詳細に述べる説明から明白になる。
以下、本発明の実施形態を図面に基づいて説明する。
本発明を無許可のビデオコピーを検出するためのシステム、装置、方法として説明する。しかしながら、当業者であれば、下記に照らして、これらの具体的な詳細を部分的又は全く知らなくても本発明を実施できることは明白である。他の場合には、公知のプロセス操作については本発明を不要に曖昧にしないために詳細な説明は省いた。図1A及び図1Bについては「背景技術」の項で説明した。
本発明の実施例は、ビデオデータのコピーを効率よく検出するアルゴリズムを活用するシステムを提供する。以下にもっと詳説するように、色や視的様相だけでなく、空間構成(例えば、アスペクト比)が変更されたコピーは日常的な技術で識別できる。ステレオ画像マッチングに順序測度を使用する場合には、学校の成績のように、離散的順序集合から順序変数が引き出されることがある。この場合、2個の測定値間の割合は重要でなく、相対的順序だけが直接関係がある。測定値間の相対的順序はその順位(rank)によって表わすことができる。測定値を昇順に整列させ、整数[1,2,3,…,N]を用いてラベルを付けることによって順位置換(rank permutation)を得る。Nは測定値の個数である。
図2A〜2Cは、コピー検出に順序測度を使用した場合のグラフ表現である。図2Aは、m×n(3×3)個の等しい大きさのブロックに分割された画像104を表わす。画像をm×n個の同じサイズのブロックに分割すると、システムが入力画像の大きさに影響されないようになることを理解すべきである。図2Bのm×n個の部分画像106は、図2Aの画像104の対応する各ブロックの平均値(average value)をとって計算される。この配列は図2Cに示した順位行列108に変換される。図2Bの部分画像106の濃度値は各々、コピー画像において10増えるので、部分画像は値{{74, 71, 56}, {145, 156, 126}, {195, 184, 155}}を有すると仮定しよう。とは言え、増えた値を有する部分画像の順位行列は図2Cに表示した順位行列と同一だから、原画像との完全なマッチングを達成できる。
しかしながら、上に説明した順序測度を使用すると、それもとりわけ画像の空間アウトレイが変更されている場合、非正則なやり方で変更が加えられているコピーを検出できない。図3A−2から図3B−3は、画像が異なった分割になっている場合の画像3A−1の濃度分布を説明している。図3A−1は原画像110aで、図3A−2は画像110aの2×2分割の濃度分布112を表わしている。図3A−3は画像110aの3×3分割の濃度分布114を説明している。図3B−1は、図3A−1の画像110aが空間的に変更された画像110bである。この例において、図3A−1の4×3ビデオフォーマットはレターボックスフォーマットに変更されている。図3A−2と図3B−2を比較すると分かるように、分割が2×2のときには、分割値が対称だから、濃度分布、つまり順序測度は不変である。例えば、濃度分布112及び116は、濃度分布がアスペクト比の変化によって同じように影響されるから、つまり区画は各々平等に濃くなるから、濃度分布112及び116の順序測度は同じままである。しかしながら、区画数が2×2よりも大きくなると、濃度分布の程度を表わしている図3A−3及び図3B−3の区画の陰影を比較すると分かるように非対称的変化により順序測度の変化が起きる。例えば、濃度分布114及び118は、濃度分布が別々に影響される、つまり非対称だから、順序測度が変わる。レターボックスフォーマットでは基本的に上下の区画が濃くなり中間の区画は影響を受けない。従って、効率的なビデオコピー検出器を設計する際の大きな課題の一つはアスペクト比の変更の影響を考慮することである。当業者であれば、上記の分析はピラーボックスフォーマットの変更又はその他の任意の適したアスペクト比の変更に適用可能なことが明白である。以下にさらに詳細に説明するように、2×2分割の画像フレームの順序測度に基づいたマッチング方法を提供する。ここで、このマッチング方法の順序測度はビデオデータのアスペクト比の変化に対して不変である。
当業者であれば、コピー検出技法の性能に関して2つの課題、つまりロバスト性及び判別可能性があることを理解するだろう。システムがミスマッチを発生するまでに至らずに許容可能なデータの矛盾性の量はロバスト性によって決まるが、判別可能性は誤った検出が起きないように直接関係のないデータを拒絶する技法の能力に関係する。これらの相反する課題間でバランスをとる決定的な要因は分割の数である。予想通り、このシステムは分割数が減るとそれだけロバストになる。対照して、分割数が増えるとそれだけ判別可能性が高くなる。従って、以前の技法は、容認できる程度のロバスト性を維持しつつ判別可能性を高めるために、2×2を超える分割を活用していた。小さな分割数、例えば、2×2を採用しているために、判別可能性が低いかもしれないから、本明細書で説明する実施例はビデオデータの順序シグネチャだけでなく、判別可能性を向上させる時間シグネチャも利用する。
伝統的なビデオマッチング技法は、ほとんどの場合、画像の対応に依存している。2つのビデオシーケンス間の距離が対応するフレームの非相似性を結合することによって計算される。しかしながら、ビデオの時間的変異に気付かないと、それがコピーの誤った検出につながることが多い。図4A及び図4Bは、本発明の一実施例により、原画像フレームを分割することから得た2つの部分画像シーケンスを説明している。2つの部分画像シーケンスには、図4Aにおいてフレーム120a〜120dで表わされるシーケンス1と、図4Bにおいて122a〜122dで表わされるシーケンス2とがある。しかしながら、対応する部分画像間で順序シグネチャは同一である。伝統的な画像フレームマッチングをベースにした方法は、時間情報を考慮に入れていないので、これらの直接関係のないビデオを拒絶することができないことを理解すべきである。以下に説明するように、順序シグネチャのシーケンスと共に、ビデオデータの時間情報を考慮することによって、もっと効
率的なビデオマッチングのやり方を提供する。

当業者であれば、この測度は2×2分割のマッチングアルゴリズムとみることができることを理解するだろう。
画像の相似点の結合に基づいてビデオマッチングを判定すると、ビデオの時間特性が除外される。ビデオは時間をかけて起きるプロセスだから、濃度分布の時間的軌跡を画像の相似性測度と結合しなければならないことを理解すべきである。図5Aは、本発明の一実施例による、フレーム及びその区画の濃度分布の平均値(mean value)の時間的変異を説明するグラフである。この例で、ビデオフレームのシーケンスは2×2構成に分割されている。図で示しているように、区画の濃度分布の平均値はフレーム全体と比べもっとばらつきがある。すなわち、区画124a−1〜124d−1にそれぞれ対応する線124a〜124dは、フレーム全体の濃度分布を表わす線126よりも変動の程度が高いことを示している。
図5Bは、本発明の一実施例において、ヒストグラム平坦化が適用されたフレーム及びその区画の濃度分布の平均値の時間的変異を示すグラフである。ヒストグラム平坦化の目指すところであるように、線130で示したフレーム全体の平均値は、各フレームがヒストグラム平坦化で処理されると区別不能になるので、そのフレームの平均は常にグレースケールの中間値に調整される。とは言え、4個の区画128a−1〜128d−1の濃度分布の平均値は、対応する軌跡128a〜128dによって示されているように未だ判別可能な動作をしていることが観察された。
と定義される。
2個のビデオ間の非相似性を測定するための提案しているメソドロジーは、次の方程式(6)、

図7は、本発明の一実施例において、照会ビデオクリップとターゲットビデオとの一致を判定するためのプロセスの概要をビジュアルに示す簡約概略図である。ビデオクリップフレーム143(照会ビデオと称することもある)を用いてそのビデオクリップの何らかのコピーがターゲットビデオフレーム142の中に含まれているかどうか判定する。例として、ビデオクリップフレーム143には5フレームが入っているものとして説明する。しかしながら、照会ビデオクリップは1より大きな適した任意のフレーム数が入っていて構わないし、また或る特定のフレーム数に限定されるものではない。よって、上に説明した空間及び時間距離はターゲットビデオフレーム142の5フレームビデオクリップごとに計算及び結合される。この距離を図7のグラフに示す。空間及び時間距離(D)を線145で追い、先に説明した方程式6によって計算する。点146aと146bに局所最小値がある。局所最小値が線144で表わされたしきい値εよりも小さければ、局所最小値と関連付けられたフレームとその前の4フレームは照会ビデオクリップの5フレームのコピーと識別される。ターゲットビデオには一つ以上の照会ビデオクリップのコピーが入っているかもしれないことを理解すべである。例えば、ターゲットビデオがテレビ番組で照会ビデオクリップが番組中に流されたコマーシャルだとすれば、コマーシャルは番組中何回も繰り返して流されたかもしれない。図7は先に操作1〜4で説明したプロセスを絵で説明していることを理解すべきである。
図8は、本発明の一実施例において、本明細書で説明しているビデオコピー検出器実現の模式的なグラフィカルユーザインタフェース(GUI)を説明した図である。テストビデオは120,000個を超えるフレームを有し、MPEG1フォーマットに符号化されている。テストビデオ、つまりターゲットビデオには、スポーツ、風景、ホームビデオなど、色々なタイプのシーケンスが入っている。GUI147の領域149は、マッチング技法が適用されていることを示している。ハイライトされた技法はα値0.5及び(1−α)値0.5を含む。この例で、αはSで表現され、1−αはTで表現されている。ボタン148a−cは、汎用ナビゲーションボタン148c、問合せ生成ボタン148b、マッチングボタン148aを含む。一例として、問合せ生成ボタン148bにより照会画像を生成及び分割する機能が始動する。マッチングボタン148cによりターゲットビデオクリップ内で照会ビデオクリップの一致を探す機能が始動する。ターゲットビデオクリップは領域151内に表示されても構わない。局所最小値の決定に適用されたしきい値は領域153に表示されているように0.1であった。領域149に見えるように、本明細書で説明しているアルゴリズムは5個の異なるα値(0.0, 0.3, 0.5, 0.7, 1.0)を用いてテストされた。αの値が低いとアルゴリズムは時間マッチングが中心になりがちで、α=0.5では空間及び時間マッチング間にバランスのとれたマッチングが可能になり、αが1に近いと空間マッチングが中心になる傾向がある。従って、αによって、このアルゴリズムは様々な空時間の重み付けに適応できる。
図9は、本発明の一実施例において、受信器動作特性(ROC)曲線を用いる提案しているアルゴリズムの性能を説明するグラフである。当業者であれば、これは、偽の正レート(FPR)対偽の負レート(FNR)のプロットであることを解るであろう。NTはマッチテストが行なわれているフレームの総数で、τは正規化されたしきい値であると仮定しよう。FNを偽の負数の数(検出されなかったコピーのクリップ数)とし、FPを偽の正数の数(検出されたコピーでないクリップ数)とすると、偽の負レート(FNR)及び偽の正レート(FPR)は次のように与えられる。
これらのレートを表わす点が図8の2次元グラフ150に線154a〜eで描かれているようにしきい値が変化してプロットされている。理想曲線は(0,0)、つまりゼロFNR及びゼロFPRを通る。図8に表示されているように、提案しているアルゴリズムの判別可能性はα=0.5のときに最も高い(線154e)。これは、提案しているアルゴリズムの性能は、時空間一致点(Spatio- and temporal matches)が均等にバランスがとれているときに最も優れていることを意味する。テストで、20個の照会クリップをテストシーケンスからサンプリングした。どのクリップも50個のフレームを有し、画素レベルブースと、ヒストグラム平坦化、レターボックス及びピラーボックススタイルへのフォーマット変更といった修正を用いて各問い合わせから5個のコピークリップが生成される。
図10A及び図10Bは、本発明の一実施例において、正規化されたしきい値に対する精度(precision rate)及び再現率(recall rate)それぞれのグラフである。当業者であれば、適切なしきい値を決めるには、これらのレートを考慮すべきことを理解するだろう。ある特定のしきい値で、精度及び再現率は次のように定義される:
ここで、τは正規化されたしきい値。一致したクリップはコピーとして検出されたクリップ(偽の正数を含んでいるかもしれない)のことであることが分かるはずである。一致したコピークリップ(検出コピークリップとも呼ばれる)は、コピーとして検出されたクリップの中で、本当のコピークリップ、つまり、偽の正数を無視して一致した実際のコピーを意味する。コピークリップ総数はターゲットビデオ中に存在している本物のコピークリップ数を示している。図10A及び10Bにおいて、望ましい結果がτ=0.1で得られることを示しており、レートが共に高い。図10Aのグラフ156で、線158a〜eを比較すると、線158eが精度が最も優れている。図10Bのグラフ160で、線162a〜eを比較すると、線162eが再現度が最も優れている。よって、両方ともα=0.7である。
図11は、本発明の一実施例において、τが0.1のときの精度及び再現率を説明する棒グラフである。コピーの見落とし数を最小にするには、再現率を高くすることが重要であることに注目。図11に示すように、α=0.7のとき、このアルゴリズムは再現率が最も高くなる。しかしながら、α=0.7のとき精度は低い。これはあまりにも多くの誤検出が存在するということである。そこで、システムパラメータをα=0.5及びτ=0.1に決めた。これらのパラメータは発明の機能をさらに定義するために提示した具体的な説明上の模式的な例であることを理解すべきである。よって、具体的なアプリケーションいかんにより、最適パラメータは上述の模式的パラメータとは異なる。
図12は、本発明の一実施例において、ビデオコピー検出システムを説明する簡略図である。ビデオコピー検出システム166は、中央処理ユニット(CPU)174、メモリ172、ビデオコピー検出ロジック168を有し、これらは全てバス170で相互接続されている。ビデオコピー検出ロジック168は、上述のごとく、ビデオクリップのフレーム及びターゲットビデオのフレームを分割するためのロジックを含んでいることを理解すべきである。例えば、図2において、各フレームを分割するためのロジックは各フレームを2×2の行列に分割するように構成されている。ビデオコピー検出ロジック168には、ビデオクリップのフレームと関連付けられた順位行列とターゲットビデオのフレームと関連付けられた順位行列との空間非相似性を判定するためのロジックも入っている。上述のごとく、2つのシーケンス間の空間非相似性は2個の画像フレーム間の空間距離を計算(calculate)することによって計算(compute)される。ビデオコピー検出ロジック168はさらに、ビデオクリップのシーケンシャルフレームとターゲットビデオのそれぞれのシーケンシャルフレームとの対応する区画間の濃度分布の方向を判定するためのロジックを有する。この例で、ビデオは時間をかけて発生するので時間的変異を考慮するために、濃度分布の方向から時間的軌跡が生まれる。
図6及び図7で説明したように、対応する区画について、空間非相似性を表わす値と濃度分布の方向を表わす対応する値とが結合されて、その結果として一列の値を生じる。一例として、第1列はビデオクリップの逐次区画の時間的濃度分布と関連付けられるのに対し、第2列の値はターゲットビデオに対応する時間的濃度変化と関連付けられる。次に、第1列の値と第2列の値とを比較して、値が、図6に関して説明したと同じように、類似した方向に変わっているかどうか判定される。当業者であれば、ビデオコピー検出ロジック168はハードウェア、ソフトウェア、又はその両方の何らかの組合せとして実施できることが分かるだろう。ハードウェア構成には本明細書で説明している機能を実行するように構成された回路機構を含む集積回路を取り入れることができる。言うまでもなく、集積回路はプラグインボード又はアダプタカードに装備されていて構わない。
図13は、本発明の一実施例において、ビデオデータがターゲットビデオに出現するかどうか検出するための方法操作を説明したフローチャートである。この方法は、ビデオクリップのフレーム及びターゲットビデオのフレームが共に分割される操作180から始まる。上述のごとく、ターゲットビデオと関連付けられたアスペクト比が変わったときターゲットビデオと関連付けられた順序測度は変わらないように、ビデオクリップのフレーム及びターゲットビデオのフレームは共に2×2行列に分割される。例えば、ターゲットビデオのアスペクト比がピラーボックス又はレターボックス構成に変わっている場合、2×2構成はこうした変化に対応できるのでターゲットビデオと関連付けられた順序測度が影響を受けない。この方法は次に操作182に進み、ビデオデータ及びターゲットビデオと関連付けられる空間シグネチャ値が計算される。上述のごとく、空間シグネチャ値は2個の画像フレーム間の空間距離を表わしている。例えば、空間距離を上述のごとく2つの順位行列間の正規化された距離として表わしても構わない。
図13の方法は次に操作184に進み、ビデオデータ及びターゲットビデオと関連付けられる時間シグネチャ値が計算される。時間シグネチャ値は正規化された距離によって表わされた時間距離計量値を表わすことを理解すべきである。言い換えれば、時間シグネチャ値は、図6で説明したように、不一致の程度の推定値、つまり、時間的変異が同じ方向でない対応する対の数の推定値を含んでいる。この方法は次に操作186に進み、空間シグネチャ値及び時間シグネチャ値が結合される。この例で、空間シグネチャ値及び時間シグネチャ値は、方程式6に関して説明したように結合されて構わない。そこで説明しているように、時間距離と空間距離とのトレードオフ値を提供する。
操作188で、1列のフレームに対して区画ごとに空間シグネチャ値及び時間シグネチャ値が結合されて、その結果として空間シグネチャ値と対応する時間シグネチャ値とが結合されたシーケンスが生じる。操作190で、操作188で確立されたシーケンスの最小値が判定される。その後、決定の操作192で、操作190から生じた最小値がしきい値よりも小さいかどうか判定される。ここで、図7において説明したように、一つ以上の局所最小値を見出しても構わない。局所最小値がしきい値よりも小さければ、ターゲットビデオはビデオデータのコピーを含んでおり、そのようにマークが付けられる。決定の操作192で最小値がしきい値より大きければ、操作196に表わされているように、ターゲットビデオはビデオデータのコピーを含んでいない。
要約すれば、上述の発明は無許可のビデオクリップのコピーを検出する。空間及び時間因子を用いることによって、照会及びターゲットビデオデータに対して2×2分割の画像が用いられる。分割数が少ないために空間因子は低判別可能性と関連付けられるから、分割構成の犠牲になる判別可能性を向上させるために時間間因子が組み込まれている。上述のごとく、分割構成はターゲットビデオに加えられたアスペクト比の変更を評価することができる。その上に、上述の実施例と関連付けられたシグネチャを保持/索引付けするのに要するメモリはフレームにつき4バイトである。これは、空間マッチングだけに基づくビデオコピー検出に要するメモリと比べて、比較的に少量である。
さらに、本書で説明した実施例はマルチメディアのサーチエンジンに組み込むことができる。こうしたエンジンは、例えば、検索結果の中にいくつかのコピーが存在するなど、多数のコピーがごった返しになっているので、ユーザは素早くブラウジングできない。従って、コピーを予防するのに、先に説明したように表示する前に検索結果からコピーを検出して削除するスキームを活用することができる。さらに、コンテンツベースのビデオコピー検出スキームはメディアトラッキングにも役立つ。メディアトラッキングとは、或る特定の公知のメディアがいつ、どこで使われたか記録することである。例えば、市場調査のためにある特定のTVコマーシャルをモニタするのはメディアトラッキングの具体的な適用業務である。詳細に言えば、いつ、何回、どのチャンネルで、競合他社のコマーシャルが放送されたか知りたいかもしれない。そうすることによって、競合他社のマーケティング戦略を理解することができる。メディアトラッキングは、所有権の管理及びロイヤリティの支払いに関しても役立つ。
上記の実施例に照らせば、発明は、コンピュータで実現される、コンピュータシステムに保持されたデータを伴う様々な操作を採用するかもしれないことを理解すべきである。これらの操作は物理的数量の物理的操作を要する操作を含んでいる。必ずしてもそうであるとは限らないが、普通、こうした数量は保持、転送、結合、比較、及びその他の操作が可能な電気又は磁気信号の形式をとる。さらに、実行される操作は、生成、識別、判定、又は比較といった表現で呼ばれることが多い。
上記の発明は、ハンドヘルドデバイス、マイクロプロセッサシステム、マイクロプロセッサベースの又はプログラミング可能な消費者エレクトロニクス、ミニコンピュータ、メインフレームコンピュータなどを含んだ他のコンピュータシステム構成と共に実施されても構わない。発明はまた、通信ネットワークでリンクされた遠隔処理デバイスによってタスクが実行される分散型コンピューティング環境で実施してもよい。
発明は、コンピュータ可読媒体にコンピュータ可読コードとして実施されることもできる。コンピュータ可読媒体は、コンピュータシステムが後から読み出せるデータを保持することができる任意のデータ記憶装置である。コンピュータコードが実装された電磁搬送波もコンピュータ可読媒体の一つである。コンピュータ可読媒体の例としては、ハードドライブ、ネットワーク接続型記憶装置(NAS)、読み取り専用メモリ、ランダムアクセスメモリ、CD−ROM、CD−R、CD−RW、磁気テープ、その他の光学式及び非光学式データ記憶装置などがある。コンピュータ可読媒体は、コンピュータ可読コードを分散して保持及び実行できるように、ネットワーク結合コンピュータシステムで分散されることもできる。
はっきりと理解できるように、上記の発明をある程度詳細に説明してきたが、添付の特許請求の範囲内で一定の変更及び修正が可能なことは明白であろう。従って、本願の実施例は説明のためで限定のためではないと考えるべきで、発明は本明細書で述べた細部に限定されるものではなく、添付の特許請求の範囲及び同等の範囲内で修正可能である。特許請求の範囲において、要素及び/又はステップは、明確に記載されていない限り、操作の特定の順番を暗に示しているものではない。
ビデオデータのアスペクト比を変える一般的な技法を説明した図。 コピー検出のための順序測度を使用したグラフ表現。 画像を異なる分割にした場合の画像の濃度分布を説明した図。 本発明の、原画像フレームを分割することから得た2つの部分画像シーケンスを説明する図。 本発明の、フレーム及びその区画の濃度分布の平均値(mean value)の時間的変異を説明したグラフ。 ヒストグラム平坦化を適用した場合の、フレーム及びその区画の濃度分布の平均値(mean value)の時間的変異を説明したグラフ。 本発明のdTqt)(2区画間の距離)を計算するための手段の図形表現。 本発明の照会ビデオクリップとターゲットビデオとの一致を判定するプロセスの概要を視覚的に示した概略図。 本発明のビデオコピー検出器実現の模式的グラフィカルユーザインタフェース(GUI)を説明した図。 本発明の受信器動作特性(ROC)曲線を用いる提案しているアルゴリズムの性能を説明するグラフ。 本発明の正規化されたしきい値に対しての精度及び再現率それぞれを説明するグラフ。 本発明のτが0.1のときの精度及び再現率を説明する棒グラフ。 本発明のビデオコピー検出システムを説明する簡素化された図。 本発明のターゲットビデオデータの中にビデオデータが現われるかどうか検出するための方法操作を説明したフローチャート。
符号の説明
100、102、104 ビデオフレーム
106 部分画像
108 順位行列
110 画像
142 ターゲットビデオフレーム
143 ビデオクリップフレーム
148 ボタン
166 ビデオコピー検出システム
168 ビデオコピー検出ロジック
170 バス
172 メモリ
174 CPU

Claims (43)

  1. ビデオデータがターゲットビデオに現われるかどうか検出するための方法であって、
    前記ビデオデータ及び前記ターゲットビデオと関連付けられる2つの空間シグネチャ間の空間距離を計算する操作と、
    前記ビデオデータ及び前記ターゲットビデオと関連付けられる2つの時間シグネチャ間の時間距離を計算する操作と、
    前記空間距離及び前記時間距離を結合する操作と、
    前記結合された空間距離と時間距離とに基づいて前記ビデオデータが前記ターゲットビデオの中に現われるかどうか判定する操作とを有することを特徴とする検出方法。
  2. 請求項1において、
    前記ビデオデータ及び前記ターゲットビデオと関連付けられる空間シグネチャ値を計算し、
    前記ビデオデータ及び前記ターゲットビデオと関連付けられる時間シグネチャ値を計算し、
    前記ビデオデータのフレームと前記ターゲットビデオの対応フレームとを、前記ターゲットビデオの対応フレームのアスペクト比の変更を補償する構成に分割することを有することを特徴とする方法。
  3. 請求項1において、前記ビデオデータ及び前記ターゲットビデオと関連付けられる空間シグネチャ値を計算する方法操作は、
    前記ビデオデータのフレームの第1順序測度(ordinal measure)と前記ターゲットビデオのフレームの第2順序測度とを共に判定し、
    前記第1順序測度及び前記第2順序測度間の空間距離を計算することを特徴とする方法。
  4. 請求項1において、前記ビデオデータ及び前記ターゲットビデオと関連付けられる時間シグネチャ値を計算する方法操作は、
    前記ビデオデータのシーケンシャルフレームと前記ターゲットビデオのそれぞれのシーケンシャルフレームとの対応する区画間の時間的濃度分布の方向を判定することを特徴とする方法。
  5. 請求項1において、前記空間距離及び前記時間距離を結合する方法操作は、
    前記空間距離を値だけ調整し、
    前記時間距離を1から前記値を引いた分だけ調整し、前記値は0と1の間の数であることを特徴とする方法。
  6. ビデオクリップのコピーを検出するための方法であって、
    前記ビデオクリップのフレーム及びターゲットビデオのフレームを、前記ターゲットビデオと関連付けられたアスペクト比が変わったときに前記ターゲットビデオと関連付けられた順序測度は変わらないように分割する操作と、
    前記ビデオクリップフレーム及び前記ターゲットビデオフレーム間の非相似性値を判定する操作と、を有することを特徴とする検出方法。
  7. 請求項6において、前記ビデオクリップのフレーム並びにターゲットビデオのフレームを共に分割する方法操作は、
    前記ビデオクリップのフレーム及び前記ターゲットビデオのフレームを共に4個の領域に細分することを特徴とする方法。
  8. 請求項6において、前記ビデオクリップフレーム及び前記ターゲットビデオフレーム間の非相似性値を判定する方法操作は、
    前記ビデオクリップフレームの順位行列と前記ターゲットビデオフレームの順位行列との差に基づいて空間非相似性値を計算し、
    前記ビデオクリップのシーケンシャルフレームと前記ターゲットビデオのそれぞれのシーケンシャルフレームとの対応する区画間の濃度分布の方向に基づいて時間距離計量値を計算し、
    前記空間非相似性値を前記時間距離計量値と結合することを特徴とする方法。
  9. 請求項6において、さらに
    分割及び決定を繰り返し、
    一列の非相似性値を生成し、
    前記一列の非相似性値の中の最小値を識別することを特徴とする方法。
  10. 請求項9において、前記一列の非相似性値の中の最小値を識別する方法操作は、
    最小値がしきい値よりも小さいかどうか判定し、
    もし最小値がしきい値よりも小さければ、前記方法は、
    最小値と関連付けられたターゲットビデオのフレームを、前記ビデオクリップの対応フレームのコピーとして識別することを特徴とする方法。
  11. ビデオクリップのコピーを検出するマッチング技法であって、
    前記ビデオクリップのフレーム及びターゲットビデオのフレーム間の濃度分布の時間的軌跡(temporal trails)を比較する操作を有することを特徴とするマッチング技法。
  12. 請求項11において、さらに
    前記ビデオクリップフレーム及び前記ターゲットビデオフレームを、前記ターゲットビデオフレームと関連付けられるアスペクト比が変わったとき前記ターゲットビデオフレームと関連付けられた順序測度は変わらない構成に、分割することを特徴とするマッチング技法。
  13. 請求項11において、さらに
    前記ビデオクリップのフレーム及びターゲットビデオのフレーム間の空間シグネチャを比較し、
    前記時間的軌跡の比較及び前記空間シグネチャの比較から生じた結果を結合することを特徴とするマッチング技法。
  14. 請求項13において、さらに
    しきい値を確立し、
    結合された結果を検査し、
    結合された結果の最小値を判定し、
    最小値をしきい値と比較し、
    最小値がしきい値よりも小さければ、最小値と関連付けられたターゲットビデオのフレームをコピーとして識別することを特徴とするマッチング技法。
  15. 請求項11において、前記ビデオクリップのフレーム及びターゲットビデオのフレーム間の濃度分布の時間的軌跡を比較する方法操作は、
    前記ビデオデータのシーケンシャルフレームと前記ターゲットビデオのそれぞれのシーケンシャルフレームとの対応する区画間の濃度分布の方向を識別することを特徴とするマッチング技法。
  16. 請求項15において、前記ビデオデータのシーケンシャルフレームと前記ターゲットビデオのそれぞれのシーケンシャルフレームとの対応する区画間の濃度分布の方向を識別する方法操作は、
    前記ビデオデータのシーケンシャルフレームの逐次区画の濃度に対応する第1集合の値を割り当て、
    前記ターゲットビデオのシーケンシャルフレームの逐次区画の濃度に対応する第2集合の値を割り当てることを特徴とするマッチング技法。
  17. 請求項16において、さらに
    前記ビデオデータのシーケンシャルフレームの逐次区画の時間的濃度変化を示す第1列の値を生成し、
    前記ターゲットビデオのシーケンシャルフレームの逐次区画の時間的濃度変化を示す第2列の値を生成し、
    前記第1列の値と前記第2列の値を比較して前記ビデオデータの時間的濃度変化と前記ターゲットビデオの時間的濃度変化が同じ方向かどうか判定することを特徴とするマッチング技法。
  18. ビデオデータがターゲットビデオに現われるかどうか検出するためのプログラム命令を有するコンピュータ可読媒体であって、
    前記ビデオデータ及び前記ターゲットビデオと関連付けられる2つの空間シグネチャ間の空間距離を計算するためのプログラム命令と、
    前記ビデオデータ及び前記ターゲットビデオと関連付けられる2つの時間シグネチャ間の時間距離を計算するためのプログラム命令と、
    前記空間距離及び前記時間距離を結合するためのプログラム命令と、
    前記結合された空間距離及び時間距離を表わす値に基づいて前記ビデオデータが前記ターゲットビデオに現われるかどうか判定するためのプログラム命令とを有することを特徴とするコンピュータ可読媒体。
  19. 請求項18において、さらに
    前記ビデオデータ及び前記ターゲットビデオと関連付けられた空間シグネチャ値を計算するためのプログラム命令と、
    前記ビデオデータ及び前記ターゲットビデオと関連付けられた時間シグネチャ値を計算するためのプログラム命令と、
    前記ビデオデータのフレーム及び前記ターゲットビデオの対応フレームを、前記ターゲットビデオの対応フレームのアスペクト比の変更を補償する構成に分割するためのプログラム命令とを有することを特徴とするコンピュータ可読媒体。
  20. 請求項19において、前記ビデオデータ及び前記ターゲットビデオと関連付けられた空間シグネチャ値を計算するためのプログラム命令は、
    前記ビデオデータのフレームの第1順序測度並びに前記ターゲットビデオのフレームの第2順序測度を共に判定するためのプログラム命令と、
    前記第1順序測度及び前記第2順序測度間の空間距離を計算するためのプログラム命令とを有することを特徴とするコンピュータ可読媒体。
  21. 請求項19において、前記ビデオデータ及び前記ターゲットビデオと関連付けられた時間シグネチャ値を計算するプログラム命令は
    前記ビデオデータのシーケンシャルフレームと前記ターゲットビデオのそれぞれのシーケンシャルとの対応する区画間の時間的濃度分布の方向を判定することを特徴とするコンピュータ可読媒体。
  22. ビデオクリップのコピーを検出するためのプログラム命令を有するコンピュータ可読媒体であって、
    前記ビデオクリップのフレーム及びターゲットビデオのフレームを、前記ターゲットビデオと関連付けられたアスペクト比が変わったときに前記ターゲットビデオと関連付けられた順序測度は変わらないように、分割するためのプログラム命令と、
    前記ビデオクリップフレーム及び前記ターゲットビデオフレーム間の非相似性値を判定するためのプログラム命令とを有することを特徴とするコンピュータ可読媒体。
  23. 請求項22において、前記ビデオクリップのフレーム並びにターゲットビデオのフレームを共に分割するためのプログラム命令は、
    前記ビデオクリップフレーム並びに前記ターゲットビデオフレームを共に4個の領域に細分するためのプログラム命令を含むことを特徴とするコンピュータ可読媒体。
  24. 請求項22に記載において、前記ビデオクリップフレーム及び前記ターゲットビデオフレーム間の非相似性値を判定するためのプログラム命令は、
    前記ビデオクリップフレームの順位行列と前記ターゲットビデオフレームの順位行列との差に基づいて空間非相似性値を判定するためのプログラム命令と、
    前記ビデオクリップのシーケンシャルフレームと前記ターゲットビデオのそれぞれのシーケンシャルフレームとの対応する区画間の濃度分布の方向に基づいて時間距離計量値を計算するためのプログラム命令と、
    前記空間非相似性値を前記時間距離計量値と結合するためのプログラム命令とを有することを特徴とするコンピュータ可読媒体。
  25. 請求項22において、さらに
    分割及び判定を繰り返すためのプログラム命令と、
    一列の非相似性値を生成するためのプログラム命令と、
    前記一列の非相似性値の中の最小値を識別するためのプログラム命令とを有することを特徴とするコンピュータ可読媒体。
  26. 請求項25において、前記一列の非相似性値の中の最小値を識別するためのプログラム命令は、
    最小値がしきい値よりも小さいかどうか判定するためのプログラム命令を含み、
    最小値がしきい値よりも小さければ、前記プログラム命令は、
    最小値と関連付けられた前記ターゲットビデオのフレームを前記ビデオクリップの対応フレームのコピーとして識別するためのプログラム命令を有することを特徴とするコンピュータ可読媒体。
  27. ビデオクリップのコピーを検出するためのマッチング技法を実行するためのプログラム命令を有するコンピュータ可読媒体であって、
    前記ビデオクリップ及びターゲットビデオ間で濃度分布の時間的軌跡を比較するためのプログラム命令を有することを特徴とするコンピュータ可読媒体。
  28. 請求項27において、さらに
    前記ビデオクリップのフレーム及び前記ターゲットビデオのフレームを、前記ターゲットビデオのフレームと関連付けられたアスペクト比が変わったとき前記ターゲットビデオのフレームと関連付けられた順序測度は変わらない構成に、分割するためのプログラム命令を有することを特徴とするコンピュータ可読媒体。
  29. 請求項27において、さらに
    前記ビデオクリップのフレーム及びターゲットビデオのフレーム間で空間シグネチャを比較するためのプログラム命令と、
    前記時間的軌跡の比較及び前記空間シグネチャの比較から生じた結果を結合するためのプログラム命令とを有することを特徴とするコンピュータ可読媒体。
  30. 請求項29において、
    しきい値を確立するためのプログラム命令と、
    結合された結果を調べるためのプログラム命令と、
    結合された結果の最小値を判定するためのプログラム命令と、
    最小値をしきい値と比較するためのプログラム命令と、
    最小値がしきい値よりも小さければ、前記ターゲットビデオで最小値と関連付けられたフレームをコピーとして識別するためのプログラム命令とをさらに有することを特徴とするコンピュータ可読媒体。
  31. 請求項27において、前記ビデオクリップのフレーム及びターゲットビデオのフレーム間の濃度分布の時間的軌跡を比較するためのプログラム命令は、
    前記ビデオデータのシーケンシャルフレームと前記ターゲットビデオのそれぞれのシーケンシャルフレームとで対応する区画間の時間的濃度分布の方向を識別するプログラム命令を含むことを特徴とするコンピュータ可読媒体。
  32. 請求項31において、前記ビデオデータのシーケンシャルフレームと前記ターゲットビデオのそれぞれのシーケンシャルフレームとの対応する区画間の時間的濃度分布の方向を識別するプログラム命令は、
    前記ビデオデータのシーケンシャルフレームの逐次区画の濃度に対応する第1集合の値を割り当てるためのプログラム命令と、
    前記ターゲットビデオのシーケンシャルフレームの逐次区画の濃度に対応する第2集合の値を割り当てるためのプログラム命令とを含むことを特徴とするコンピュータ可読媒体。
  33. 前記ビデオデータのシーケンシャルフレームの逐次区画の時間的濃度変化を示す第1列の値を生成するためのプログラム命令と、
    前記ターゲットビデオのシーケンシャルフレームの逐次区画の時間的濃度変化を示す第2列の値を生成するためのプログラム命令と、
    前記第1列の値及び前記第2列の値を比較して前記ビデオデータの時間的濃度変化と前記ターゲットビデオの時間的濃度変化とが同じ方向かどうかを判定するためのプログラム命令とをさらに有することを特徴とするコンピュータ可読媒体。
  34. コンピュータであって、
    中央処理ユニット(CPU)と、
    メモリと、
    ビデオクリップのコピーを検出するように構成されたビデオコピー検出ロジックとを備え、前記ビデオコピー検出ロジックは、
    前記ビデオクリップのフレーム及びターゲットビデオのフレームを分割するためのロジックと、
    前記ビデオクリップのフレームと関連付けられた順位行列と前記ターゲットビデオのフレームと関連付けられた順位行列との空間非相似性を判定するためのロジックと、
    前記ビデオクリップのシーケンシャルフレームと前記ターゲットビデオのそれぞれのシーケンシャルフレームとで対応する区画間の濃度分布の方向を判定するためのロジックとを含み、さらに、
    前記CPU、前記メモリ、及び前記ビデオコピー検出ロジックを相互接続するバスを備えることを特徴とするコンピュータ。
  35. 請求項34において、前記ビデオコピー検出ロジックはさらに、
    対応する区画について空間非相似性を表わす値と濃度分布の方向を表わす値とを結合するためのロジックを含むことを特徴とするコンピュータ。
  36. 請求項34において、前記ビデオコピー検出ロジックはさらに、
    前記ビデオクリップのシーケンシャルフレームの逐次区画の時間的濃度変化を示す第1列の値を生成するためのロジックと、
    前記ターゲットビデオのシーケンシャルフレームの逐次区画の時間的濃度変化を示す第2列の値を生成するためのロジックと、
    前記第1列の値と前記第2列の値とが同じ方向に変化しているかどうか判定するためのロジックとを含むことを特徴とするコンピュータ。
  37. 請求項34において、前記ビデオクリップのフレーム及び前記ターゲットビデオのフレームを分割するためのロジックは、各フレームを2×2フォーマットに分割することを特徴とするコンピュータ。
  38. 請求項34において、各ロジック素子は、ハードウェアか、ソフトウェアか、又はハードウェアとソフトウェアとの組合せかであることを特徴とするコンピュータ。
  39. 集積回路であって、
    ターゲットビデオフレームの区画と照会ビデオフレームで対応する区画との間に定義された空間距離値を、前記ターゲットビデオフレームの区画及び前記照会ビデオフレームの対応区画と関連付けられた時間距離値と結合して非相似性値を定義するためのロジックと、
    非相似性値が局所最小値かどうか判定するためのロジックとを備えることを特徴とする集積回路。
  40. 請求項39において、前記区画と関連付けられた順序測度に基づいて空間距離値を計算するためのロジックをさらに備えることを特徴とする集積回路。
  41. 請求項39において、ターゲットビデオと照会ビデオとの対応している逐次ビデオフレーム間の濃度分布の変化の方向に基づいて時間距離値を計算するためのロジックをさらに備えることを特徴とする集積回路。
  42. 請求項39において、前記ターゲットビデオフレーム及び前記照会ビデオフレームを共に2×2行列に分割するためのロジックをさらに備えることを特徴とする集積回路。
  43. 請求項39において、前記非相似性値が局所最小値かどうか判定するためのロジックは、
    非相似性値をしきい値と比較するためのロジックと、
    非相似性値がしきい値よりも小さければ、非相似性値を局所最小値として識別するためのロジックとを含むことを特徴とする集積回路。
JP2004184917A 2003-06-23 2004-06-23 ビデオコピーの検出方法及び装置 Withdrawn JP2005020742A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US48075803P 2003-06-23 2003-06-23
US10/778,464 US7532804B2 (en) 2003-06-23 2004-02-13 Method and apparatus for video copy detection

Publications (1)

Publication Number Publication Date
JP2005020742A true JP2005020742A (ja) 2005-01-20

Family

ID=33436770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004184917A Withdrawn JP2005020742A (ja) 2003-06-23 2004-06-23 ビデオコピーの検出方法及び装置

Country Status (5)

Country Link
US (1) US7532804B2 (ja)
EP (1) EP1494135A3 (ja)
JP (1) JP2005020742A (ja)
KR (2) KR100671772B1 (ja)
CN (1) CN1574019A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014506366A (ja) * 2011-01-07 2014-03-13 アルカテル−ルーセント 映像を比較する方法および装置
JP2018067809A (ja) * 2016-10-19 2018-04-26 日本電信電話株式会社 映像検出装置、方法、及びプログラム

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7930546B2 (en) * 1996-05-16 2011-04-19 Digimarc Corporation Methods, systems, and sub-combinations useful in media identification
US7167574B2 (en) * 2002-03-14 2007-01-23 Seiko Epson Corporation Method and apparatus for content-based image copy detection
US7532804B2 (en) 2003-06-23 2009-05-12 Seiko Epson Corporation Method and apparatus for video copy detection
US7486827B2 (en) * 2005-01-21 2009-02-03 Seiko Epson Corporation Efficient and robust algorithm for video sequence matching
US20060277609A1 (en) * 2005-06-07 2006-12-07 Marc Brandon Method and apparatus for tracking pirated media
US20090019149A1 (en) * 2005-08-02 2009-01-15 Mobixell Networks Content distribution and tracking
EP1755067A1 (en) * 2005-08-15 2007-02-21 Mitsubishi Electric Information Technology Centre Europe B.V. Mutual-rank similarity-space for navigating, visualising and clustering in image databases
US8145656B2 (en) * 2006-02-07 2012-03-27 Mobixell Networks Ltd. Matching of modified visual and audio media
WO2007142639A1 (en) * 2006-06-06 2007-12-13 Warner Bros. Entertainment Inc. Method and apparatus for tracking pirated media
JP4763525B2 (ja) * 2006-06-21 2011-08-31 日本電信電話株式会社 映像整合方法
US8738749B2 (en) * 2006-08-29 2014-05-27 Digimarc Corporation Content monitoring and host compliance evaluation
US9105306B2 (en) * 2006-12-27 2015-08-11 Nec Corporation Identifying objects in images using object identity probabilities based on interframe distances
DE602008004340D1 (de) * 2007-05-17 2011-02-17 Dolby Lab Licensing Corp Ableitung von gegen bildbearbeitung und rahmenratenumwandlung unempfindlichen videosignaturen
JP5322416B2 (ja) * 2007-09-12 2013-10-23 株式会社メガチップス ブロックマッチング回路及びデータ更新方法
US8380045B2 (en) * 2007-10-09 2013-02-19 Matthew G. BERRY Systems and methods for robust video signature with area augmented matching
US8793498B2 (en) 2008-08-11 2014-07-29 Nbcuniversal Media, Llc System and method for forensic analysis of media works
US8224157B2 (en) * 2009-03-30 2012-07-17 Electronics And Telecommunications Research Institute Method and apparatus for extracting spatio-temporal feature and detecting video copy based on the same in broadcasting communication system
CN101888479B (zh) * 2009-05-14 2012-05-02 汉王科技股份有限公司 检测和跟踪目标图像的方法及装置
US9087125B2 (en) * 2009-08-10 2015-07-21 Pixel Forensics, Inc. Robust video retrieval utilizing video data
US8295611B2 (en) * 2009-08-10 2012-10-23 Pixel Forensics, Inc. Robust video retrieval utilizing audio and video data
US8515933B2 (en) * 2009-08-18 2013-08-20 Industrial Technology Research Institute Video search method, video search system, and method thereof for establishing video database
US8671109B2 (en) * 2009-10-01 2014-03-11 Crim (Centre De Recherche Informatique De Montreal) Content-based video copy detection
CA2716266C (en) 2009-10-01 2016-08-16 Crim (Centre De Recherche Informatique De Montreal) Content based audio copy detection
US20110191320A1 (en) * 2010-02-02 2011-08-04 Game Plan Technologies, Inc. Digital asset management system
CN101937506B (zh) * 2010-05-06 2012-10-17 复旦大学 近拷贝视频检测方法
US8731292B2 (en) * 2011-01-07 2014-05-20 Alcatel Lucent Method and apparatus for comparing videos
US8913851B1 (en) 2011-04-29 2014-12-16 Google Inc. Fingerprinting image using points of interest for robust image identification
CN102393900B (zh) * 2011-07-02 2013-05-29 山东大学 基于鲁棒哈希的视频拷贝检测方法
GB2501224B (en) 2012-01-10 2016-03-09 Qatar Foundation Detecting video copies
AU2013225800B2 (en) 2012-03-01 2015-04-09 Sys-Tech Solutions, Inc. Unique identification information from marked features
US20150379321A1 (en) 2012-03-01 2015-12-31 Sys-Tech Solutions, Inc. Methods and a system for verifying the authenticity of a mark
US20150169928A1 (en) 2012-03-01 2015-06-18 Sys-Tech Solutions, Inc. Methods and a system for verifying the identity of a printed item
US9626567B2 (en) * 2013-03-13 2017-04-18 Visible Measures Corp. Automated video campaign building
MY179087A (en) * 2014-02-28 2020-10-27 Sys Tech Solutions Inc Methods and a system for verifying the identity of a printed item
CN104408092B (zh) * 2014-11-14 2018-01-09 中国科学院计算技术研究所 基于排序测度特征的图像检索方法及系统
US9674475B2 (en) 2015-04-01 2017-06-06 Tribune Broadcasting Company, Llc Using closed-captioning data to output an alert indicating a functional state of a back-up video-broadcast system
US9264744B1 (en) 2015-04-01 2016-02-16 Tribune Broadcasting Company, Llc Using black-frame/non-black-frame transitions to output an alert indicating a functional state of a back-up video-broadcast system
US9582244B2 (en) 2015-04-01 2017-02-28 Tribune Broadcasting Company, Llc Using mute/non-mute transitions to output an alert indicating a functional state of a back-up audio-broadcast system
US9531488B2 (en) 2015-04-01 2016-12-27 Tribune Broadcasting Company, Llc Using single-channel/multi-channel transitions to output an alert indicating a functional state of a back-up audio-broadcast system
US9420348B1 (en) 2015-04-01 2016-08-16 Tribune Broadcasting Company, Llc Using aspect-ratio transitions to output an alert indicating a functional state of a back up video-broadcast system
US9420277B1 (en) 2015-04-01 2016-08-16 Tribune Broadcasting Company, Llc Using scene-change transitions to output an alert indicating a functional state of a back-up video-broadcast system
US9621935B2 (en) 2015-04-01 2017-04-11 Tribune Broadcasting Company, Llc Using bitrate data to output an alert indicating a functional state of back-up media-broadcast system
CN105072455A (zh) * 2015-08-11 2015-11-18 精硕世纪科技(北京)有限公司 视频匹配方法和装置
EP3239896B1 (en) 2016-04-28 2018-11-28 Joanneum Research Forschungsgesellschaft mbH Data structure for describing an image sequence, and methods for extracting and matching these data structures
CN105959686B (zh) * 2016-06-22 2018-11-09 腾讯科技(深圳)有限公司 一种视频特征提取方法、视频匹配方法及装置
CN111277902B (zh) * 2020-02-17 2022-03-25 北京达佳互联信息技术有限公司 一种视频匹配方法和装置及设备
CN113395583B (zh) * 2020-09-29 2023-06-27 腾讯科技(深圳)有限公司 水印检测方法、装置、计算机设备及存储介质
WO2022124679A1 (ko) * 2020-12-07 2022-06-16 삼성전자 주식회사 복제 비디오를 검출하는 장치 및 방법

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2267598B (en) 1992-06-01 1995-09-13 Macrovision Uk Limited Improvements in or relating to detecting copied video recordings
JP3372611B2 (ja) * 1993-10-18 2003-02-04 キヤノン株式会社 映像伝送システム、映像処理装置及び映像処理方法
JP3340532B2 (ja) * 1993-10-20 2002-11-05 株式会社日立製作所 ビデオの検索方法および装置
KR0152788B1 (ko) * 1994-11-26 1998-10-15 이헌조 디지탈 영상 시스템의 복사 방지 방법 및 장치
US6381367B1 (en) * 1997-05-29 2002-04-30 Macrovision Corp. Method and apparatus for compression compatible video fingerprinting
US5960081A (en) * 1997-06-05 1999-09-28 Cray Research, Inc. Embedding a digital signature in a video sequence
US5987456A (en) * 1997-10-28 1999-11-16 University Of Masschusetts Image retrieval by syntactic characterization of appearance
US6332030B1 (en) * 1998-01-15 2001-12-18 The Regents Of The University Of California Method for embedding and extracting digital data in images and video
US6141464A (en) * 1998-03-30 2000-10-31 Xerox Corporation Robust method for finding registration marker positions
US6240423B1 (en) * 1998-04-22 2001-05-29 Nec Usa Inc. Method and system for image querying using region based and boundary based image matching
US6070171A (en) * 1998-05-15 2000-05-30 Palantir Software, Inc. Method and system for copy-tracking distributed software featuring tokens containing a key field and a usage field
US6285774B1 (en) * 1998-06-08 2001-09-04 Digital Video Express, L.P. System and methodology for tracing to a source of unauthorized copying of prerecorded proprietary material, such as movies
US6285995B1 (en) * 1998-06-22 2001-09-04 U.S. Philips Corporation Image retrieval system using a query image
US6266429B1 (en) * 1998-09-23 2001-07-24 Philips Electronics North America Corporation Method for confirming the integrity of an image transmitted with a loss
US6373979B1 (en) * 1999-01-29 2002-04-16 Lg Electronics, Inc. System and method for determining a level of similarity among more than one image and a segmented data structure for enabling such determination
US6404925B1 (en) * 1999-03-11 2002-06-11 Fuji Xerox Co., Ltd. Methods and apparatuses for segmenting an audio-visual recording using image similarity searching and audio speaker recognition
US6487311B1 (en) * 1999-05-04 2002-11-26 International Business Machines Corporation OCR-based image compression
US6389417B1 (en) * 1999-06-29 2002-05-14 Samsung Electronics Co., Ltd. Method and apparatus for searching a digital image
EP1835421A3 (en) 1999-06-30 2009-04-22 Sharp Kabushiki Kaisha Motion picture retrieval information storage apparatus and motion picture retrieving apparatus
US6751363B1 (en) * 1999-08-10 2004-06-15 Lucent Technologies Inc. Methods of imaging based on wavelet retrieval of scenes
US6577766B1 (en) * 1999-11-10 2003-06-10 Logitech, Inc. Method and apparatus for motion detection in the discrete cosine transform domain
TW510114B (en) * 1999-11-15 2002-11-11 Canon Kk Information processing apparatus and processing method therefor
US6675174B1 (en) * 2000-02-02 2004-01-06 International Business Machines Corp. System and method for measuring similarity between a set of known temporal media segments and a one or more temporal media streams
US6865302B2 (en) * 2000-03-16 2005-03-08 The Regents Of The University Of California Perception-based image retrieval
EP1225756A1 (en) * 2001-01-03 2002-07-24 Synoptics Limited Method of obtaining an image
KR100450793B1 (ko) * 2001-01-20 2004-10-01 삼성전자주식회사 영역 분할된 영상의 영역 특징치 정합에 기초한객체추출장치 및 그 방법
US6892193B2 (en) * 2001-05-10 2005-05-10 International Business Machines Corporation Method and apparatus for inducing classifiers for multimedia based on unified representation of features reflecting disparate modalities
US7127106B1 (en) * 2001-10-29 2006-10-24 George Mason Intellectual Properties, Inc. Fingerprinting and recognition of data
US20040013302A1 (en) * 2001-12-04 2004-01-22 Yue Ma Document classification and labeling using layout graph matching
US7167574B2 (en) * 2002-03-14 2007-01-23 Seiko Epson Corporation Method and apparatus for content-based image copy detection
JP2004007552A (ja) 2002-04-12 2004-01-08 Seiko Epson Corp コンテントベースのイメージコピー検出の方法並びに装置
US7532804B2 (en) 2003-06-23 2009-05-12 Seiko Epson Corporation Method and apparatus for video copy detection

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014506366A (ja) * 2011-01-07 2014-03-13 アルカテル−ルーセント 映像を比較する方法および装置
JP2018067809A (ja) * 2016-10-19 2018-04-26 日本電信電話株式会社 映像検出装置、方法、及びプログラム

Also Published As

Publication number Publication date
EP1494135A2 (en) 2005-01-05
CN1574019A (zh) 2005-02-02
KR20060117890A (ko) 2006-11-17
KR20050000307A (ko) 2005-01-03
US7532804B2 (en) 2009-05-12
EP1494135A3 (en) 2006-02-08
US20040258397A1 (en) 2004-12-23
KR100671772B1 (ko) 2007-01-19

Similar Documents

Publication Publication Date Title
JP2005020742A (ja) ビデオコピーの検出方法及び装置
AU2010201199B2 (en) Desynchronized fingerprinting method and system for digital multimedia data
JP5341095B2 (ja) メディア・コンテンツに信頼性よく対応するメディア・フィンガープリント
US8385644B2 (en) Digital video fingerprinting based on resultant weighted gradient orientation computation
Zhang et al. Efficient video frame insertion and deletion detection based on inconsistency of correlations between local binary pattern coded frames
AU2007327388B2 (en) Video fingerprinting
US20130039587A1 (en) Method and apparatus for comparing videos
KR101968921B1 (ko) 강건한 낮은 복잡도 비디오 핑거프린팅을 위한 장치 및 방법
Singh et al. Detection of frame duplication type of forgery in digital video using sub-block based features
Lian et al. Content-based video copy detection–a survey
Roopalakshmi et al. A novel spatio-temporal registration framework for video copy localization based on multimodal features
CN112788342A (zh) 一种水印信息嵌入方法以及装置
Liu et al. Detection of JPEG double compression and identification of smartphone image source and post-capture manipulation
US8180098B2 (en) Method of extracting a watermark
Wang et al. Robust image watermarking via perceptual structural regularity-based JND model
RU2352992C2 (ru) Обнаружение водяного знака
KR101033296B1 (ko) 방송통신시스템에서 시공간적 특징정보 추출 및 비교판별 장치 및 방법
Karaküçük et al. PRNU based source camera attribution for image sets anonymized with patch-match algorithm
Panchal et al. Multiple forgery detection in digital video based on inconsistency in video quality assessment attributes
WO2008060022A1 (en) System and method for evaluating and certifying image identifier
Wang et al. Detection of shifted double JPEG compression by an adaptive DCT coefficient model
Jang et al. The Original Similarity Extraction Mechanism for Digital Content Copyright Protection in UCC Service Environment
JP2004007552A (ja) コンテントベースのイメージコピー検出の方法並びに装置
Bouarfa Research Assignment on
Penkov et al. Estimation of Video Authenticity through Collaborative Use of Available Video Signals

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070403

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070904