JP2014239495A - フレームに基づくビデオマッチング - Google Patents

フレームに基づくビデオマッチング Download PDF

Info

Publication number
JP2014239495A
JP2014239495A JP2014152440A JP2014152440A JP2014239495A JP 2014239495 A JP2014239495 A JP 2014239495A JP 2014152440 A JP2014152440 A JP 2014152440A JP 2014152440 A JP2014152440 A JP 2014152440A JP 2014239495 A JP2014239495 A JP 2014239495A
Authority
JP
Japan
Prior art keywords
video
frame
matching
frames
videos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014152440A
Other languages
English (en)
Inventor
ウィンター アレキサンダー,
Winter Alexandre
ウィンター アレキサンダー,
シモン ドリョ,
Dolle Simon
シモン ドリョ,
ヴァンセン ジャラ,
Jahard Vincennes
ヴァンセン ジャラ,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHRISTIAN WEBGERT
Webgert Christian
LTU Technologies SAS
Original Assignee
CHRISTIAN WEBGERT
Webgert Christian
LTU Technologies SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHRISTIAN WEBGERT, Webgert Christian, LTU Technologies SAS filed Critical CHRISTIAN WEBGERT
Publication of JP2014239495A publication Critical patent/JP2014239495A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches

Abstract

【課題】改良されたビデオ解析のシステムおよび方法を提供する。
【解決手段】プロセッサによって、参照ビデオのデータベースの範囲内のビデオの各々に関し、フレーム単位で索引を付けて、索引に従い特定される1以上のフレームをサブセットとして特定し、サブセットのフレーム毎の視覚的な特徴を決定するステップと、プロセッサによって、少なくとも一つの照会ビデオの各々に関し、フレーム毎の視覚的な特徴を決定するステップと、プロセッサによって、参照ビデオのデータベースの範囲内のビデオの各々に関し決定した前記サブセットのフレーム毎の視覚的な特徴の各々と、少なくとも一つの照会ビデオの各々に関し決定したフレーム毎の視覚的な特徴の各々とを比較するステップと、比較の結果に基づき、参照ビデオのデータベースの範囲内のビデオの中から少なくとも一つの照会ビデオにマッチするビデオを特定するステップと、を備える。
【選択図】図3

Description

本発明は、広くは、ビデオ解析のシステムおよび方法に関し、より狭くは、フレームの視覚的な特徴もしくは特性の表示(以下、「ビデオの内容DNA」もしくは「内容DNA」として言及される)に基づいて、ビデオストリームの範囲内において当該フレームを比較しマッチングするためのシステムおよび方法に関する。
一般的に言って、ビデオファイルの範囲内において内容を比較しマッチングする従来の方法においては、例えば、画像マッチングのアプローチを用いて、ビデオの一連のフレームの範囲内において各々のフレームの比較が行われる。そのため、従来のフレーム毎のビデオの解析は、コンピュータに多大な負担を与える傾向がある。ビデオのフレームの時間的および空間的なマッチングによりビデオの範囲内における内容を比較しマッチングすることによって、計算に要する負担を減少させようとする試みがなされてきた。しかしながら、ビデオの解析およびマッチングが実行される場合の効率および計算スピードの改善に対する必要性は未だに存在する。
本発明者たちは、ビデオのフレームに対して画像マッチングの技術を採用する精度が、マッチングするビデオを見つけるための信頼のおける解を提供するために、十分に正確なものでありかつ十分に低い誤判定率を持っている、という条件の上に成り立つあるアプローチを発見した。さらに、本発明者たちは、対象となるビデオの範囲内において選択されたフレームを比較しマッチングすることが、計算の効率およびスピードにおける改良をもたらす、ということを発見した。また同時に一方で、本発明者たちは、それが、ビデオのマッチングの成功をもたらすために、当該ビデオの共通する部分もしくはセクションを探知することを可能にする、ということを発見した。
本発明は、参照ビデオのデータベースの範囲内において、少なくとも一つの照会ビデオとマッチングする複数のビデオを特定するための方法を提供することを目的とする。
当該方法は、参照ビデオのデータベースを提供するステップと、入力検索基準を受け取るステップとを含む。当該基準は、少なくとも一つの照会ビデオ、望ましい検索モードを表わすパラメータ、および望ましいマッチングモードを表すパラメータを含む。当該方法は、当該基準が受け取られた後、フレーム毎に参照ビデオのデータベースの中の各々のビデオに索引を付けるステップと、参照ビデオの範囲内の全てのフレームもしくは参照ビデオの範囲内のフレームのサブセットのうちの少なくとも一つの視覚的な特徴に基づいて、当該参照ビデオの各々に対する視覚的な特徴を決定するステップを含む。当該方法は、参照ビデオの各々に対する特徴が決定された場合に、照会ビデオの視覚的な特徴を決定するステップと、参照ビデオのデータベースの範囲内における各々のビデオの視覚的な特徴を少なくとも一つの照会ビデオの視覚的な特徴と比較するステップと、参照ビデオのデータベースの範囲内において少なくとも一つの照会ビデオとマッチするビデオを特定するステップとを含む。
一つの具体例において、参照ビデオの各々に索引を付けるステップは、フレーム毎に各々のビデオを読み取るステップと、一つのフレームを次のフレームと比較するステップと、各々のビデオの範囲内において、アンカーフレーム、ハートビートフレーム、およびキーフレームを含むフレームのサブセットを決定するステップとを含む。一つの具体例において、各々の参照ビデオに対して定められる第1の視覚的な特徴は、当該参照ビデオの範囲内の全てのフレームの視覚的な特徴に基づいて定められる。別の具体例において、各々の参照ビデオに対して定められる第2の視覚的な特徴は、当該参照ビデオの範囲内のフレームのサブセットのうちの少なくとも一つの視覚的な特徴に基づいて定められる。一つの具体例において、各々の参照ビデオの視覚的な特徴を照会ビデオの視覚的な特徴と比較するステップは、先ずマッチを特定するために第2の視覚的な特徴を比較するステップと、もし満足のいくマッチングの結果が得られない場合には、その時だけ各々の参照ビデオに対する第1の視覚的な特徴を決定し、当該第1の視覚的な特徴を照会ビデオの視覚的な特徴と比較するステップとを含む。
本発明の特徴および利点は、以下の好ましい具体例の詳細な説明が図面と一緒に考慮される場合に、よりよく理解されるだろう。
図1は、複数のフレーム(F1−FX)を含むビデオの単純化された描写を表す図である。 図2は、参照ビデオ(R1−RN)のデータベースおよび複数の照会ビデオ(Q1−QM)の単純化された描写を表す図である。 図3は、本発明の一具体例にかかる、照会ビデオの範囲内の1以上のフレームにマッチするフレームを有するデータベースの範囲内のビデオを特定する、フレームに基づくビデオマッチングシステムを表す図である。 図4は、本発明の一具体例にかかる、フレームに基づくビデオマッチングプロセスにおけるビデオを解析するためのステップを描写する、プロセスの流れを表す図である。 図5は、本発明の一具体例にかかる、ビデオのファイルに索引を付けるためのステップを描写するプロセスの流れを表す図である。
これらの図において、同じ構成要素には同じ参照番号が付されているが、全ての図の描写においてその参照番号が省略されている場合がある。
図1に示されるように、ビデオ10は、複数の、もしくは一連のフレーム12(F1−FX)を有する。各々のフレームもしくは選択された数のフレームは、画像解析のルーチンが、予め決められた基準、参照ビデオもしくは参照ビデオの一部分にマッチするビデオもしくはそのようなビデオの一部分を発見する際に、別々の画像として扱われる。マッチングは、以下に説明されるように、ビデオもしくはその一部分の範囲内において内容の類似性の程度を特定することを意味する、ということは十分に理解されるべきである。類似性は、フレームの視覚的な特徴もしくは特性の表示(例えば、上述したビデオの内容DNA)の比較に基づいている。同一出願人による特許出願(出願番号:12/432,119、出願日:2009年4月29日)において説明されているように、内容DNAは、画像およびその中のオブジェクトの目に見える特性を表わす複数の視覚的記述子および特徴を有している。1以上のフレームF1−FXの内容DNA14(DNAF1−DNAFX)を用いることによって、ビデオ10に対する内容DNA16が提供される。
例えば、図2は、典型的なマッチングのアプローチを示している。そこでは、参照ビデオR1−RNのデータベース20および照会ビデオQ1−QMのセット30が、マッチを開始する人によって提供される。そのマッチングアプローチは、以下に示されるように、参照ビデオR1−RNのデータベース20の範囲内において、照会ビデオQ1−QMのセット30の各々に対して共通もしくはマッチするセクションを有するビデオを特定するステップを含む。以下に説明されるように、参照ビデオR1−RNには索引が付けられ、参照ビデオR1−RNの各々に対して内容DNAを提供するために視覚的な特徴が算出される。図3に示されるように、本発明は、マッチを開始する人にとってデータベース20の範囲内において関心のある可視化情報を特定するために実行される、フレームに基づいたビデオマッチングシステム100を提供する。ビデオマッチングシステム100は、参照ビデオR1−RNの範囲内においてフレームの目に見える内容の描写を生み出すための複数のアルゴリズム(以下に説明する)を実行するプロセッサ140を含む。以下に説明されるように、ビデオマッチングシステム100は、従来のビデオ検索・マッチシステムにおいて得られるよりも効率的で効果的なマッチングの結果を提供するために、内容DNAを採用する。
プロセッサ140が、そこに蓄積されるアルゴリズムを有するコンピュータで読み取り可能な媒体もしくはメモリ142、およびネットワーク上におけるコミュニケーションを容易にするための入出力装置を有するということは、十分に理解されるべきである。当該ネットワークは、一般的に150という参照番号によって示される。それは、例えば、インターネット、イントラネット、エクストラネット、もしくはビデオデータ20および30を受け取って処理するための有線およびもしくは無線の計算装置に接続されている分散型のコミュニケーションプラットフォーム、などである。プロセッサ140は、例えば、データストア170に操作可能な状態で接続されている。データストア170は、例えば、マッチングの結果に加え、参照ビデオR1−RNおよび照会ビデオQ1−QMの内容DNA等のような、システム100によって用いられる情報172を蓄積する。一つの具体例において、プロセッサ140は、マッチングの結果を表示するためのディスプレイ装置等のような出力装置180と接続されている。一つの具体例において、プロセッサ140は、例えば、スタンドアローン型もしくはネットワークに接続されたパーソナルコンピュータ(PC)、ワークステーション、ラップトップ、タブレット型のコンピュータ、携帯型情報端末、ポケットPC、インターネットに接続可能なモバイル型の無線電話機、ペイジャー、もしくはそれらと同様なビデオおよび画像を処理するための適切な処理能力を有している携帯型の計算装置などである。
図3において示されるように、プロセッサ140は、ビデオの認識およびマッチングの動作を実行するために、アプリケーションステップを実行する分散可能なアルゴリズムのセット144を有している。最初に,処理の対象となる参照ビデオR1−RNのデータベース20および照会ビデオQ1−QMのセット30が特定される。マッチングのプロセスの間において、照会ビデオQ1−QMの各々が、参照ビデオR1−RNのデータベース20と比較される。以下に説明されるフレームに基づくビデオマッチングシステム100の一つの目標は、照会ビデオQ1−QMの各々に関して、当該照会ビデオQ1−QMの各々と共通する部分を有するビデオを、参照ビデオR1−RNのデータベース20の中から見つけることである。一つの具体例において、マッチングのプロセスは、1以上のパラメータ160に基づいて実行される。マッチングシステム100のパラメータ160の一例としては、参照ビデオR1−RNのデータベース20に含まれるビデオのうち照会ビデオQ1−QMの中から選ばれた一つのビデオにマッチする全てのビデオが見つけられるべきか、それとも一つのマッチによりその検索が終了されるのか、ということを識別するものである。もし、参照ビデオR1−RNのデータベース20の範囲内のビデオのうち、照会ビデオQ1−QMの中から選ばれた一つのビデオにマッチする全てのビデオを見つけることが必要であるとすれば、マッチングの方法は、「広範検索」もしくは「包括的検索」のシナリオもしくはモードにおいて処理が行われることになる。もし、参照ビデオR1−RNのデータベース20の範囲内において、ただ一つのマッチングビデオを見つけることが要求されるとするならば、マッチングのプロセスは、「機敏探知」のシナリオもしくはモードにおいて処理が行われることになる。
フレームに基づくビデオマッチングプロセスのもう一つのパラメータ160は、データベース20の中の1以上の参照ビデオR1−RNもしくはそれらの一部分とマッチする、照会ビデオQ1−QMの中から選ばれた一つのビデオのセクション(例えば、一連の1以上のフレーム)を検索するか否かを決定する。当該セクションを検索する場合には、マッチングは「シークエンスマッチング」のシナリオもしくはマッチングモードにおいて処理が行われることになる。もし、参照ビデオR1−RNのデータベース20の中において照会ビデオの全体が探されなければならないとすれば、そのマッチングは「グローバルマッチング」のシナリオもしくはマッチングモードにおいて処理が行われる。シークエンスマッチングのモードの場合においては、付加的なパラメータにより、探知されるべきシークエンスの最小継続時間(例えば、時間もしくはフレームの数)が示される。このパラメータは、「粒度」gとして言及される。参照ビデオR1−RNのデータベース20の一つのビデオの中に、照会ビデオQ1−QMの中から選ばれた一つのビデオの中のシークエンスが存在しても、その継続時間が粒度のパラメータgよりも小さければ、それらは探知されないかもしれない。一方、参照ビデオR1−RNの中の一つのビデオと等しい特性を有するいかなる照会ビデオQ1−QMの中から選ばれた一つのビデオの中のシークエンスは、その継続時間が粒度のパラメータgよりも大きければ探知される。
本発明にかかるフレームに基づくビデオマッチングプロセス200の一具体例が、図4に示されている。図4に示されるように、フレームに基づくビデオマッチングプロセス200は、ブロック210において開始される。ブロック210においては、参照ビデオR1−RNのデータベース20、照会ビデオQ1−QMのセット30、およびマッチングプロセスのパラメータ160が、例えばマッチングプロセス200を開始する人によって、プロセッサ140に提供される。ブロック220においては、参照ビデオR1−RNのデータベース20に索引が付けられる。本発明の一つの側面においては、以下により詳細に議論されるように、索引を付けるステップは、参照ビデオR1−RNの各々の範囲内において、各々の参照ビデオR1−RNの視覚的な特徴(ビデオの内容DNA)をそれから生成し、マッチングに対して用いられるフレームのサブセットを特定するステップを含む。索引が付けられると、ブロック230において、参照ビデオR1−RNのフレームの各々、もしくはそのフレームのサブセットに基づき、参照ビデオR1−RNの各々に対して内容DNAが決定される。ブロック240においては、照会ビデオQ1−QMの中から選ばれた一つのビデオの1以上のフレームが処理される。一つの具体例においては、照会ビデオQ1−QMの中から選ばれた一つのビデオの範囲内において、予め決められた範囲のフレームが、マッチングの目的に対して抽出される。例えば、照会ビデオQ1−QMの中から選ばれた一つのビデオにおいて一定の間隔で配置されたフレームが抽出される。一つの具体例において、フレームの間隔は粒度のパラメータgに基づいている。その結果として、例えば、粒度のパラメータの半分の間隔によって配置されたフレームが抽出される。フレームが抽出されると、ブロック250において、抽出されたフレームに基づき照会ビデオQ1−QMの中から選ばれた一つのビデオに対して内容DNAが決定される。
ブロック260においては、照会ビデオQ1−QMの中から選ばれた一つのビデオの内容DNAが、参照ビデオR1−RNの各々に対する内容DNAと比較される。当該比較の間において、照会ビデオが参照ビデオR1−RNの中の各々の別個のビデオと共通に有している全てのフレームのカウントが維持される。ブロック270においては、当該カウントは、予め決められたマッチングの閾値と比較される。もし、照会ビデオQ1−QMの中から選ばれた一つのビデオが、予め決められたマッチングの閾値よりも多くのフレームを、参照ビデオR1−RNの中の対象となる一つのビデオと共通に有しているならば、参照ビデオR1−RNの中の対象となる一つのビデオが、選ばれた照会ビデオとマッチしたことが宣言される。ブロック280においては、参照ビデオR1−RNの中のマッチングした一つのビデオに対し、例えば、結果リスト、ファイル、もしくはデータセットの中においてそのマッチを記録することによって、マッチングしたという標識が付与される。ブロック290においては、パラメータ160が評価されて、プロセス200の現在実行中のマッチングモードの特定が行われる。すなわち、プロセス200が、広範探索もしくは包括的探索のマッチングモードにおいて実行されているか、それとも機敏探知のモードで実行されているか、が特定される。もし、その実行が機敏探知のモードにおいて行われているならば、制御は「イエス」のパスに沿って進み、一連の処理は終了する。もし、その実行が広範探索もしくは包括的探索のマッチングモードにおいて行われているならば、制御は「ノー」のパスに沿ってブロック290から進んで、当該実行がブロック300に続く。ブロック300においては、照会ビデオQ1−QMの中の次の一つのビデオが選ばれる。ブロック310において、もしそれ以上選ばれる照会ビデオQ1−QMが存在しなければ、制御は「ノー」のパスに沿って進み、一連の処理は終了する。そうでない場合、制御は、ブロック310から「イエス」のパスに沿って進み、ブロック240に戻る。そして、ブロック240から290までの動作を再び行うことによって、処理が継続される。
本発明者たちは、本発明にかかるフレームに基づくビデオマッチングプロセス200における認知される価値のうちの少なくともいくつかは、従来のマッチングプロセスと比較した上で、その発明にかかるプロセスの単純さ、もしくは複雑さの少なさにある、ということを見出した。例えば、本発明にかかるフレームに基づくビデオマッチングプロセス200は、効率的かつ低い誤判定率を有するフレームマッチングプロセスである。
上述したように、本発明の一つの側面においては、参照ビデオに対するビデオの内容DNAの発生(ブロック230において)に先立って、参照ビデオR1−RNの各々に索引が付けられる(ブロック220において)。一つの具体例においては、索引付けの間において参照ビデオR1−RNの各々の範囲内におけるフレームのサブセットが特定され、特定されたフレームのサブセットを用いて参照画像に対する視覚的な特徴(ビデオの内容DNA)が生成される。したがって、第1の内容DNA(対象となるビデオの範囲内における全てのフレームに基づく)および第2の内容DNA(対象となるビデオの範囲内におけるフレームのサブセットに基づく)の少なくとも一つもしくは両方を採用することも、本発明の技術的思想の範囲内にある。例えば、第1の内容DNAと第2の内容DNAとの間の違いを示すために、以下に説明される内容DNAが上述した同一出願人による米国特許出願(出願番号:12/432,119、出願日:2009年4月29日)に従って生成される局所的なマッチングDNAである、ということが理解されるべきである。当該出願において、当該内容DNAは、画像およびその画像の中のオブジェクトの視覚的な特性を表す複数の視覚的記述子および特徴を有する。局所的なマッチングDNAを採用することでもたらされる影響の一つとして、結果として生じる処理がCPUに負担をかける、ということである。それゆえ、評価されるフレームの数を減らすことによって、CPUの処理量が減らされる。さらに、本発明者たちは、多くのビデオの範囲内において、マッチングフレームは共通のものでありビデオの全体を一意に特定することの助けにはならない、ということを発見した。したがって、本発明者たちは、対象となるビデオの範囲内において、マッチングのプロセスのための内容DNAを決定するためにより望ましいフレームのサブセットを特定する索引付けのプロセスを見出した。十分理解されるように、内容DNAをフレームのサブセットのためにのみ発生させることによって、CPUの処理は減らされる。
図5は、フレームに基づくビデオマッチングプロセス200(図4)の索引付けのステップ220のための本発明にかかる索引付けのプロセス400の一具体例を表している。図5において示されるように、索引付けのプロセス400は、ブロック410において開始される。ブロック410において、プロセッサ140によってビデオファイル(例えば、参照ビデオR1−RN)が開かれる。ブロック420において、プロセッサ140は当該ビデオファイルの最初のフレームを読み出す。ブロック430において、当該最初のフレームが、アンカーフレームおよび現在のフレームとして割り当てられる。一つの具体例においては、アンカーフレームのリスト、記録、もしくはファイル432が保持される。また、一つの具体例において、ファイル432は、プロセッサ140のメモリ142もしくはプロセッサ140に接続されているデータストア170の中に蓄積される。ブロック440において、現在のフレームがアンカーフレームと比較される。一つの具体例において、当該比較は、視覚的に一貫したオブジェクトもしくは領域を特定し、それらを比較する従来の画像マッチングの技術によって行われる。ブロック450においては、当該比較の結果が評価される。アンカーフレームおよび現在のフレームの両方がビデオの最初のフレームである索引付けのプロセス400の最初の実行においては、それらのフレームはマッチして、制御は「イエス」のパスに沿ってブロック450からブロック460へと進む。ブロック460においては、予め決められた継続時間のパラメータが評価される。一つの具体例において、継続時間のパラメータは、さらなる実行のトリガーを引く前にマッチすることが許容される連続的なフレームの数の指定もしくはその閾値を含んでいる。一つのフレームのみ(例えば、最初のフレーム)が評価された場合、制御は「ノー」のパスに沿ってブロック460からブロック490へと進む。ブロック490において、プロセッサ140はビデオファイルから次のフレームを読み出す。ブロック500においては、ブロック490における読み出しの動作の結果が評価される。もし、ビデオのファイルの終わりの部分に達していて次のフレームを読み出すことができなければ、プロセス400の実行は終了する。そうでない場合、すなわち次のフレームの読み出しが成功した場合、制御は、「ノー」のパスに沿ってブロック500からブロック510へと進む。ブロック510においては、次のフレームが現在のフレームとして割り当てられて、プロセス400はブロック440へと続き、現在のフレームがアンカーフレームと比較される。
プロセス400は、ビデオファイルの終わりに到達するまで(ブロック500において決定される)、継続時間のパラメータに到達するまで(ブロック460において決定される)、もしくはブロック450においてマッチングしないフレームが探知されるまで、上述したように継続的に実行される。現在のフレームがアンカーフレームにマッチし続け、継続時間が終了した場合には(ブロック460)、制御は、「イエス」のパスに沿ってブロック460からブロック470へと進む。ブロック470において、現在のフレームがハートビートフレームとして割り当てられる。一つの具体例において、ハートビートフレームのリスト、記録、もしくはファイル472が保持される。また、一つの具体例において、ファイル472が、プロセッサ140のメモリ142もしくはデータストア170に蓄積される。ブロック480において、現在のフレームが新しいアンカーフレームとして割り当てられ、アンカーフレーム432は現在のフレームを含むようにアップデートされて、制御はブロック490へと進む。ブロック490において、新しいフレームが読み出され、ブロック500の動作が実行される。
ブロック450に再度戻って、現在のフレームがアンカーフレームとマッチしないことが判明した場合には、制御は、「ノー」のパスに沿ってブロック450からブロック520へと進む。ブロック520において、現在のフレームがキーフレームとして割り当てられる。一つの具体例において、キーフレームのリスト、記録、もしくはファイル522が保持される。また、一つの具体例において、ファイル522が、プロセッサ140のメモリ142もしくはデータストア170の中に蓄積される。ブロック530において、現在のフレームが新しいアンカーフレームとして割り当てられ、アンカーフレーム432が再びアップデートされて、制御はブロック490へと進む。ブロック490において、次のフレームが読み出され、ブロック500の動作が実行される。
上述したように、索引付けのプロセス400は、ビデオファイル(例えば、参照ビデオR1−RNの中の一つ)の全てのフレームが評価されるまで続く。各々のビデオファイルに対する索引付けのプロセス400の結果、ビデオファイルの各々のフレームが評価され、当該フレームの3つのサブセットが決定される。例えば、ファイル432の中に蓄積されるアンカーフレーム、ファイル472の中に蓄積されるハートビートフレーム、およびファイル522の中に蓄積されるキーフレームが決定される。一つの具体例において、ビデオに対する第1のDNAは、例えば参照ビデオR1−RNの中の対象となる一つのビデオの各々のフレームといった、ビデオファイルの範囲内の各々のフレームに対して決定されるDNAに基づく局所的なマッチングDNAである。一つの具体例において、ビデオに対する第2のDNAは、ビデオファイルの範囲内において決定されるフレームのサブセットに対して決定されるDNAに基づく局所的なマッチングDNAである。例えば、第2のDNAは、アンカーフレーム、ハートビートフレーム、およびキーフレームのうちの1以上の範囲内における各々のフレームに対して決定されるDNAに基づく局所的なマッチングDNAである。もし、第2のDNAが3つのサブセット、すなわちアンカーフレーム、ハートビートフレーム、およびキーフレームから決定されるならば、ビデオファイルの範囲内における全ての連続的な同一もしくはマッチングするフレームのほとんどは、DNAの決定から消去されて、CPUの処理時間が節約される、ということは十分に理解されるべきである。もし、第2のDNAがフレームの一つのサブセットから、例えばキーフレームのみから決定されるならば、さらにより少ないフレームがDNAの決定のステップの中に含まれ、それゆえ、より多くのCPUの処理時間が節約される、ということもまた十分に理解されるべきである。
したがって、発明者たちは、第1のDNAよりもむしろ第2のDNAがブロック230において決定される場合、および第2のDNAがマッチングプロセス200において用いられる場合に、フレームに基づくビデオマッチングプロセス200の改良された計算上の性能が得られる、ということを発見した。すなわち、第2のDNAの特性として、例えば、(1)第1のDNAと比較して非常に速く計算することができ、そして(2)第2のDNAのマッチングは第1のDNAとのマッチという意味を含む、ということが挙げられる。
一つの具体例において、第2のDNAが、最初に、照会ビデオおよび参照ビデオの間においてマッチするビデオフレームを探知するために用いられる。しかしながら、もし第2のDNAを用いてマッチが見つからないならば、計算上より複雑な第1のDNAが計算され、ブロック260において実行されるマッチングのステップにおいて用いられる。発明者たちは、第2のDNAを使用することにより、ビデオに索引付けする際、平均的に約20個の要素によりCPUの処理時間が短縮される、ということを発見した。
一つの具体例において、フレームに基づくビデオマッチングシステム100は、例えば実行可能なプログラムおよびライブラリー参照から生成された、ビデオに索引付けするためのプログラムのキットを有している。当該プログラムは、ビデオに索引を付ける。当該プログラムは、ビデオファイルを入力し、そのビデオファイルのキーフレームを抽出し、それらを例えばファイルの中に保存する。
当該プログラムのパラメータは、例えば以下のものを含む。
・ビデオファイル。
・各々のフレームに対して、バイナリーフォーマットの内容DNA、一意の識別名、および元々のフレームの時間コードを含む必要に応じて付加される情報、を典型的に含む出力ファイル。
・DNAのタイプ(例えば、DNAの計算において採用される記述子)。
・もしビデオの一部分にのみ索引付けが行われる場合には、スタートインおよびアウトエンドのコード。
・(必要に応じて)フレーム分割機。すなわち、X個のフレームから一つのフレームを取り出すもの。このXは、最適化のために設定され、調整可能である。一つの具体例において、デフォルトの値は5であり、それは5つのフレーム毎に一つを取り出すための指示を表している。
・第2のDNAのタイプ(上述の説明参照)
別の具体例において、本発明にかかるフレームに基づくビデオマッチングシステムは、ビデオの検索およびマッチングのためのプログラムのキットを含んでいる。当該キットは、例えば次のものを含む。
ビデオ(例えば、上述の照会ビデオのセットQ1−QMを含んでいる)を含むフォルダを参照データベース(例えば、上述の参照ビデオのデータベースR1−RNを含んでいる)とマッチさせるプログラム。一つの具体例において、プログラムは、2つのフォルダを入力として持っている。すなわち、一つは、参照ビデオのデータベースR1−RNを構成するファイルを含んでおり、もう一つは、照会ビデオのセットQ1−QMを構成するビデオファイルを含んでいる。その他に入力するものは、粒度のパラメータ、検索モード(例えば、「広範検索」もしくは「機敏探知」のモード)の表示を提供するパラメータ、およびマッチングモード(例えば、「シークエンスマッチング」もしくは「グローバルマッチング」のモード)の表示を提供するパラメータである。実行の出力は、探知されたマッチを含むファイルを含んでいる。
必要に応じて、プログラムは、マッチングする2つのビデオの探索を高い精度で行うために提供され、マッチの確認を行う。上で概説したもの(プロセス200)と同じマッチングプロセスを用いて2つのビデオの正確な比較の実行を行うことが可能だが、マッチの内容を詳細に検討するために、マッチングしたフレームはディスクもしくはその他の記憶場所に書き込まれる必要がある。一つの具体例において、プログラムの入力は、2つのビデオファイル、例えば照会ビデオのセットQおよび参照ビデオのデータベースRを含んでいる。一つの具体例において、当該プログラムの出力は、例えば出力フォルダの中に生成されるファイルおよびフレームのセットである。
必要に応じて、予め決められた「グランドトゥルース」に基づいて、マッチングプロセス200の出力に関する統計を計算するためのプログラムが提供される。当該グランドトゥルースは、マッチプロセス200を開始する人によってマッチングすることを宣言される1組のビデオである。当該統計は、マッチするビデオのセットの特定における計算性能および質の向上に貢献する。
好ましい具体例の内容について説明してきたが、それらの教示に対して数多くの修正が行われ得ることが、当業者によって十分に理解されるべきである。したがって、本発明の技術的思想の範囲内において、形態および詳細に関する変形が行われ得ることが、当業者によって十分に理解されるだろう。
[著作権表示]
本出願書類に開示されるものの一部は、著作権保護に関わる題材を含んでいる。著作権者は、出願書類もしくはそれによって開示されるものがいかなる人間によって複写されることにも反対していない。それは、米国特許商標庁のファイルもしくは記録に含まれるものである。しかし、さもなければ、いかなる場合であっても著作権者が全ての著作権を所有するものとする。
10…ビデオ、12…フレーム、14…内容DNA、16…ビデオの内容DNA、20…参照ビデオのデータベース、30…照会ビデオのセット、100…ビデオマッチングシステム、140…プロセッサ、142…メモリ、144…アルゴリズムセット、150…ネットワーク、160…パラメータ、170…データストア、180…出力装置、200…ビデオマッチングプロセス、400…索引付けのプロセス

Claims (1)

  1. 参照ビデオのデータベースの範囲内において少なくとも一つの照会ビデオにマッチングする複数のビデオを特定するための方法であって、
    前記参照ビデオのデータベースを提供するステップと、
    プロセッサによって、前記参照ビデオのデータベースの範囲内のビデオの各々に関し、フレーム単位で索引を付けて、前記索引に従い特定される1以上のフレームをサブセットとして特定し、前記サブセットのフレーム毎の視覚的な特徴を決定するステップと、
    前記プロセッサによって、前記少なくとも一つの照会ビデオの各々に関し、フレーム毎の視覚的な特徴を決定するステップと、
    前記プロセッサによって、前記参照ビデオのデータベースの範囲内のビデオの各々に関し決定した前記サブセットのフレーム毎の視覚的な特徴の各々と、前記少なくとも一つの照会ビデオの各々に関し決定したフレーム毎の視覚的な特徴の各々とを比較するステップと、
    前記プロセッサによって、前記比較の結果に基づき、前記参照ビデオのデータベースの範囲内のビデオの中から前記少なくとも一つの照会ビデオにマッチするビデオを特定するステップと
    を備え、
    前記索引に従い特定される1以上のフレームは、ビデオのフレームの中から所定の規則に従い選択されたフレームであるアンカーフレームと前記アンカーフレームに続く所定数のフレームの各々とを順次比較し、当該所定数のフレームのうち最初に前記アンカーフレームとマッチしなかったフレームであるキーフレームを含む
    方法。
JP2014152440A 2008-07-23 2014-07-25 フレームに基づくビデオマッチング Pending JP2014239495A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US8296108P 2008-07-23 2008-07-23
US61/082,961 2008-07-23

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011520047A Division JP2011529293A (ja) 2008-07-23 2009-07-23 フレームに基づくビデオマッチング

Publications (1)

Publication Number Publication Date
JP2014239495A true JP2014239495A (ja) 2014-12-18

Family

ID=41570547

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011520047A Pending JP2011529293A (ja) 2008-07-23 2009-07-23 フレームに基づくビデオマッチング
JP2014152440A Pending JP2014239495A (ja) 2008-07-23 2014-07-25 フレームに基づくビデオマッチング

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2011520047A Pending JP2011529293A (ja) 2008-07-23 2009-07-23 フレームに基づくビデオマッチング

Country Status (4)

Country Link
US (1) US20100085481A1 (ja)
EP (1) EP2304649B1 (ja)
JP (2) JP2011529293A (ja)
WO (1) WO2010011344A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019509577A (ja) * 2016-03-21 2019-04-04 フェイスブック,インク. マッチングコンテンツを特定するためのシステムおよび方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9773098B1 (en) 2007-12-19 2017-09-26 Google Inc. Media content feed format for management of content in a content hosting website
US8671109B2 (en) * 2009-10-01 2014-03-11 Crim (Centre De Recherche Informatique De Montreal) Content-based video copy detection
CA2716266C (en) 2009-10-01 2016-08-16 Crim (Centre De Recherche Informatique De Montreal) Content based audio copy detection
WO2012132532A1 (ja) * 2011-03-25 2012-10-04 日本電気株式会社 映像処理システム、映像コンテンツ監視方法、映像処理装置及びその制御方法と制御プログラムを格納した記憶媒体
US8892572B2 (en) * 2011-12-30 2014-11-18 Cellco Partnership Video search system and method of use
US10595086B2 (en) 2015-06-10 2020-03-17 International Business Machines Corporation Selection and display of differentiating key frames for similar videos
WO2017075493A1 (en) * 2015-10-28 2017-05-04 Ustudio, Inc. Video frame difference engine
US10321167B1 (en) 2016-01-21 2019-06-11 GrayMeta, Inc. Method and system for determining media file identifiers and likelihood of media file relationships
US9996769B2 (en) 2016-06-08 2018-06-12 International Business Machines Corporation Detecting usage of copyrighted video content using object recognition
CN106557545B (zh) * 2016-10-19 2020-08-07 北京小度互娱科技有限公司 视频检索方法和装置
US10719492B1 (en) 2016-12-07 2020-07-21 GrayMeta, Inc. Automatic reconciliation and consolidation of disparate repositories
US10671852B1 (en) * 2017-03-01 2020-06-02 Matroid, Inc. Machine learning in video classification
CN110222594B (zh) * 2019-05-20 2021-11-16 厦门能见易判信息科技有限公司 盗版视频识别方法及系统
CN111522996B (zh) * 2020-04-09 2023-09-08 北京百度网讯科技有限公司 视频片段的检索方法和装置
CN112307883B (zh) * 2020-07-31 2023-11-07 北京京东尚科信息技术有限公司 训练方法、装置、电子设备以及计算机可读存储介质
CN114979715B (zh) * 2022-05-16 2024-02-23 山东浪潮超高清视频产业有限公司 一种基于视频基因实现的cdn防盗链生成方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10320400A (ja) * 1997-05-16 1998-12-04 Hitachi Ltd 映像の検索方法および装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11154163A (ja) * 1997-11-20 1999-06-08 Matsushita Electric Ind Co Ltd 動画一致判定装置
US6473095B1 (en) * 1998-07-16 2002-10-29 Koninklijke Philips Electronics N.V. Histogram method for characterizing video content
JP2000287166A (ja) * 1999-01-29 2000-10-13 Sony Corp データ記述方法及びデータ処理装置
WO2002008948A2 (en) * 2000-07-24 2002-01-31 Vivcom, Inc. System and method for indexing, searching, identifying, and editing portions of electronic multimedia files
SE520533C2 (sv) * 2001-03-13 2003-07-22 Picsearch Ab Metod, datorprogram och system för indexering av digitaliserade enheter
JP2003216954A (ja) * 2002-01-25 2003-07-31 Satake Corp 動画像検索手法及びその装置
JP3844446B2 (ja) * 2002-04-19 2006-11-15 日本電信電話株式会社 映像管理方法、装置、映像管理プログラム、および同プログラムを記録した記録媒体
JP4010179B2 (ja) * 2002-05-02 2007-11-21 日本電信電話株式会社 データ識別装置及びプログラム及びコンピュータ読み取り可能な記録媒体
GB0314161D0 (en) * 2003-06-18 2003-07-23 British Telecomm Edge analysis in video quality assessment
JP4359085B2 (ja) * 2003-06-30 2009-11-04 日本放送協会 コンテンツ特徴量抽出装置
US7606303B2 (en) * 2004-09-28 2009-10-20 General Instrument Corporation Method and apparatus to detect anchor frames from digital video streams
KR100652703B1 (ko) * 2004-12-08 2006-12-01 엘지전자 주식회사 휴대단말기의 동영상 검색장치 및 방법
US8145656B2 (en) * 2006-02-07 2012-03-27 Mobixell Networks Ltd. Matching of modified visual and audio media
US20080059991A1 (en) * 2006-08-31 2008-03-06 Nissim Romano System and a method for detecting duplications in digital content
WO2008049851A2 (en) 2006-10-24 2008-05-02 Thomson Licensing Method for comparing groups of images
US8351513B2 (en) * 2006-12-19 2013-01-08 Allot Communications Ltd. Intelligent video signal encoding utilizing regions of interest information
US8559516B2 (en) * 2007-06-14 2013-10-15 Sony Corporation Video sequence ID by decimated scene signature

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10320400A (ja) * 1997-05-16 1998-12-04 Hitachi Ltd 映像の検索方法および装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019509577A (ja) * 2016-03-21 2019-04-04 フェイスブック,インク. マッチングコンテンツを特定するためのシステムおよび方法

Also Published As

Publication number Publication date
EP2304649A4 (en) 2014-12-03
JP2011529293A (ja) 2011-12-01
US20100085481A1 (en) 2010-04-08
WO2010011344A1 (en) 2010-01-28
EP2304649A1 (en) 2011-04-06
EP2304649B1 (en) 2017-05-10

Similar Documents

Publication Publication Date Title
JP2014239495A (ja) フレームに基づくビデオマッチング
US10970328B1 (en) Method to differentiate and classify fingerprints using fingerprint neighborhood analysis
CN110175549B (zh) 人脸图像处理方法、装置、设备及存储介质
US9852297B1 (en) Methods and apparatus for detecting malware samples with similar image sets
US9135674B1 (en) Endpoint based video fingerprinting
JP5479340B2 (ja) 時間ベースのメディア間のマッチの検出と分類
EP2742442B1 (en) A method for detecting a copy of a reference video, corresponding apparatus for extracting a spatio-temporal signature from video data and corresponding computer readable storage medium
Güera et al. We need no pixels: Video manipulation detection using stream descriptors
JPH06250861A (ja) コンピュータ・ウィルスおよび他の望ましくないソフトウェア実在物のシグネチャを評価し抽出するための方法および装置
EP2657884A2 (en) Identifying multimedia objects based on multimedia fingerprint
US11163877B2 (en) Method, server, and computer storage medium for identifying virus-containing files
JP4940220B2 (ja) 異常動作検出装置及びプログラム
Du et al. Methodology for the automated metadata-based classification of incriminating digital forensic artefacts
JP5634075B2 (ja) 画像のシーケンスを処理する方法および装置、画像データを処理する装置、ならびにコンピュータプログラム製品
Gladyshev et al. Decision-theoretic file carving
Zhang et al. Effective real-scenario video copy detection
Sari et al. A review of graph theoretic and weightage techniques in file carving
CN111666258B (zh) 信息处理方法和装置、信息查询方法和装置
US20240004964A1 (en) Method for reducing false-positives for identification of digital content
Pahade et al. A survey on multimedia file carving
KR101373176B1 (ko) 복제 동영상정보 검출방법 및 장치, 저장매체
US8265428B2 (en) Method and apparatus for detection of data in a data store
KR20210024748A (ko) Gan을 이용한 문서형 악성코드 탐지 장치 및 방법
CN112183328A (zh) 视频识别方法、装置、设备和存储介质
CN112116018B (zh) 样本分类方法、装置、计算机设备、介质和程序产品

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151208

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20160115

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20160115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160712