JP2010537585A5 - 時間ベースのメディア間のマッチの検出と分類 - Google Patents
時間ベースのメディア間のマッチの検出と分類 Download PDFInfo
- Publication number
- JP2010537585A5 JP2010537585A5 JP2010522089A JP2010522089A JP2010537585A5 JP 2010537585 A5 JP2010537585 A5 JP 2010537585A5 JP 2010522089 A JP2010522089 A JP 2010522089A JP 2010522089 A JP2010522089 A JP 2010522089A JP 2010537585 A5 JP2010537585 A5 JP 2010537585A5
- Authority
- JP
- Japan
- Prior art keywords
- video
- candidate
- fingerprint
- match
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Description
本発明は、一般に、ビデオ処理に関し、より詳細には、マッチするビデオコンテンツの検出に関する。
上記問題の観点から、ビデオを重複ビデオコンテンツと自動的に比較し、マッチングするための技法が必要とされている。
本システムおよび方法により複製ビデオコンテンツが検出される。マッチングモジュールが、入力ビデオを表す入力ビデオフィンガープリントを受け取る。マッチングモジュールは、参照ビデオセットから候補セグメントのリストを生成する。各候補セグメントは、参照ビデオセット内の参照ビデオ中の時間的にローカライズした部分(局所化若しくは部分限定した箇所)を含む。分類手段は、各候補セグメントに適用されてそのセグメントをマッチするセグメントまたはマッチしないセグメントとして分類する。次いで、マッチするものとして分類されたセグメントに基づいて、参照ビデオセットから参照ビデオのマッチする部分を識別したという結果が生成される。
一実施形態では、候補セグメントは、参照ビデオセット内の参照ビデオを表す参照フィンガープリントを取得し、入力フィンガープリントと参照フィンガープリントとの間の部分的マッチを識別することにより決定される。次いで、最初の候補の参照ビデオセットを、識別された部分的マッチに基づいて決定する。最初の候補の参照ビデオを分析して、入力ビデオセグメントと参照ビデオセグメントとの間の時間的に連続するマッチを決定する。次いで、候補セグメントを時間的に連続するマッチに基づいて選択する。
入力メディアファイル(例えば、ビデオ、オーディオまたはその両方)が参照メディアファイルセット(例えば、ビデオおよび/またはオーディオクリップのデータベース)内の参照メディアファイルとマッチするかどうか、または部分的にマッチするかどうかを判定するシステムおよび方法について説明する。マッチ検出処理は、一メディアファイル(例えば、20秒のクリップ)の一部同士のマッチを、そのメディアファイルが同一の開始および終了ポイントを持っていなくても、あるいはマッチする部分の前後のコンテンツが異なる場合でも、検出することができる。更に、低品質のコード変換で生じる標準的な劣化に十分耐えるだけのロバスト性を有するとともに、ある程度の時間尺度の改変(例えば、ビデオを高速または低速で再生)に対するロバスト性を有する。この処理は、「正常検出(True Positive)」(一つ以上のマッチするメディアファイルがデータベース内にある)と、「正常非検出(True Negative)」(データベース内に対応するマッチがない)の両方を正確に分類することができる。時には、この処理は、厳しい時間的制約がある状況(アップロードトラフィックレートを扱うため)、および/または限られたメモリ量を用いる状況でもマッチを検出できる。
時間ベースメディア間のマッチを検出するシステムの実施形態を図1に示す。ビデオコンテンツマッチングの文脈で特定の実施例について説明するが、説明するシステムおよび方法は、オーディオ、画像等の他の種類のメディアコンテンツのマッチングに使用できるという点に留意されたい。取込みサーバ104は、ビデオソースから入力ビデオ102を受け取る。ビデオソースは、例えば、ネットワークを通じて取込みサーバ104と通信するクライアントコンピュータとすることができる。代替として、ビデオソースは、取込みサーバ104に接続して通信するデータベースまたは他の格納装置とすることもできる。例えば、ビデオソースは、DVD、CD−ROM、デジタルビデオレコーダ(DVR)、ハードディスク、フラッシュメモリ、または他のメモリ等の、ビデオ格納メディアとすることができる。取込みサーバ104は、ビデオカメラ等のビデオキャプチャシステムと接続して通信し、ライブビデオコンテンツを受信することもできる。
マッチングモジュール108は、入力ビデオ102のフィンガープリントを、参照ビデオのセットを表す参照フィンガープリントのいくつかのセットと比較する。参照フィンガープリントは、利用可能な全ての参照ビデオのためのものであってよく、またはそのサブセットのためのものであってもよい。場合によって、フィンガープリントは、フィンガープリントの基になる最初の参照ビデオが提供されずに、フィンガープリントソースから提供される。マッチングモジュール108は、入力ビデオ102の少なくとも一部とマッチする一つ以上の参照ビデオ(または、参照ビデオの一部)を識別するマッチ結果112を出力する。マッチを判定する方法について図3を参照して更に詳述する。
一実施形態では、幾つかの参照ビデオに対するフィンガープリントは、フィンガープリントリポジトリ122内で、参照ビデオが「プレミアムコンテンツ」を含むという指示等の、追加メタデータによりマークされてもよい。「プレミアムコンテンツ」としてマークされたビデオは、保護レベルを上げる価値があるビデオであり、後述するようにマッチング処理の間に特別な考慮が払われる。プレミアムコンテンツの指定は、幾つかの異なる因子により決定できる。一実施形態では、どのコンテンツをプレミアムコンテンツとして指定するかはコンテンツ所有者が決定する。例えば、メディア企業は、彼らが所有するビデオの中からある数の「トップ」ビデオを最も関心があるビデオとして選定してもよい。別の実施形態では、プレミアムコンテンツの指定を以前のマッチ履歴に基づいて決定することができる。例えば、それ以降アップロードされた入力ビデオとマッチするコンテンツを有すると以前に決定されたことがある参照ビデオを、プレミアムコンテンツとして自動的に指定してもよい。別の実施形態では、参照ビデオが参照リポジトリ内にあった時間の長さに基づいて、プレミアムコンテンツを指定する。例えば、データベース内にある最初の一ヶ月間だけ、参照をプレミアムとして取り扱うことができ、その後、プレミアムコンテンツの指定をオプションで削除することができる。更に、プレミアムコンテンツの指定は複数のレベルでなされ得る。例えば、様々な分析レベルと対応させて、様々なプレ
代替の実施形態では、LSHバンドは、説明したような連続値ではなく、離散した(隣接していない)値のサブセットを含む。LSHバンドへの値のグループ化は、特定アプリケーションの制約に依存する。別の代替の手法は、完全なサブフィンガープリントから導かれるLSHキーを用いる。例えば、サブフィンガープリントに対するLSHキーは、ランダムではあるがメモリに格納されている分割面(random-but-memorized dividing planes)上への多数の投影からの符号ビットコード、またはサブフィンガープリントの短いシーケンスからの符号ビットコード、または短いサポートウィンドウ内部のサブフィンガープリント入力値の頻度ヒストグラム等の符号ビットコードを計算することにより決定できる。頻度ヒストグラム手法は、キーとして固定ビン頻度カウントを用いることができ、あるいはキーとしてその時間間隔内で最も頻度が高い署名値の値を用いることができる。
この実施形態では、マッチング処理で使用されるメモリ量および計算量を制御するために、逆引きインデックステーブル124を共通LSHキーに対して選択的に修正する。特に、このテーブルは、サブフィンガープリント間を弁別するのに有用な縮小尤度(reduced likelihood)を有するLSHキーをマークする構造となっている。この状態は、参照フィンガープリント内部の各LSHキーの頻度および/または分布についての各種の試験により決定される。
第1レベルブラックリストの基準を満たしていないが、所与のLSHキーを含むサブフィンガープリントの合計数がまだ或る閾値を超えている場合、そのLSHキーを逆引きインデックステーブル124内で「第2レベルブラックリスト」キーとしてマークし区別する。例えば、10,000を超える参照サブフィンガープリントがキー(00 00 00 OB+2)を含むが、これら10,000の参照サブフィンガープリントが全て参照ビデオの1%以内にしか含まれない場合、「第2レベルブラックリスト」を示す特別な識別子がキーと関係付けられて格納される。一実施形態では、第2レベルブラックリストキーを含むサブフィンガープリント識別子の全リストは格納されない。代わりに、LSHテーブル124は、ビデオ識別子のリストだけを格納するが、オフセットインデックスは格納しない(すなわち、特定のセグメントを識別しない)。更に、テーブルには、マッチするキーを含む各ビデオ内のサブフィンガープリントのカウント数を格納してもよい。例えば、テーブル124内で、キー(00 00 00 OB+2)が第2レベルブラックリストキーとして識別され、「BL2」等の特別な識別子コードがキーと関係付けられて格納される。ビデオ「G」に対するフィンガープリントが、マッチするキー(00 00 00 OB+2)を含む26の異なるサブフィンガープリントを有することを示すコード(G、6)も、そのキーと関係付けられて格納される。マッチするキーを含むサブフィンガープリントに対する個々のサブフィンガープリント識別子は、個々に格納されない。
ブラックリストを作成せずに追加のLSHテーブルを用いて、プレミアムコンテンツとしてマークされた参照ビデオのための追加のインデックス化を提供してもよい。これらのテーブルは、主LSHテーブル内において幾つかのレベルでブラックリスト化されているLSHキーのみを含み、また、プレミアムコンテンツとしてマークされた参照ビデオのみを含む。更に、これらのテーブルは、そうしなければブラックリスト化により逆引きインデックスから完全に無くなってしまうことになる参照ビデオセグメントに対するスパース(sparse: まばらな)インデックスを含むこともある。一実施形態では、スパースインデックスは、全ての参照ビデオが、臨界的時間間隔(例えば、20秒以下の間隔)あたり少なくとも一回の割りで、非ブラックリスト化された逆引きインデックスエントリを行うことを保証する。これらのテーブルからのエントリが、あたかもLSHテーブルの主セットから来ているかのように、後述のマッチング処理に追加される。
フィンガープリントマッチング
フィンガープリントマッチング
マッチング処理のために入力ビデオ102を受け取ると(例えば、アップロードコンテンツまたは既存のビデオデータベースから)、入力ビデオ102は、参照ビデオに適用されるのと同一の処理に従ってフィンガープリント処理される。次いで、マッチングモジュール108は、入力ビデオ102のどの部分が(もしあれば)、参照データベース120内の参照ビデオの一部に対してマッチするかを判定する。一実施形態では、マッチングモジュール108は、図3に示すように、3つのステージの処理に従ってマッチを判定する。ステージ1では、マッチングモジュール108は、入力ビデオ102に対してマッチする候補の候補リストを参照セットから生成する(302)。候補リスト内の各エントリは:(1)候補とマッチする可能性がある入力ビデオの部分;(2)候補の参照マッチに対するビデオ識別子;および(3)入力ビデオとマッチする可能性がある参照ビデオの部分、を示す。例えば、候補リストには、下記の表に示される項目のような結果を含めることができる。
第2ステージでは、候補リスト内の各候補エントリを、更に評価して(304)、このマッチが正しいか、間違っているかを示すローカルの分類を提供する。この判定は、候補リスト内に示されるマッチする部分内部からの証拠に基づく。
第3ステージでは、残りのマッチ候補を結合し、不要部分を削除して、時間全体、およびオプションのチャンネル(例えば、オーディオとビデオ)全体でマッチするものを決定して(306)、最終的な結果セットを提供する。三つのステージのマッチング処理の各ステージについて詳述する。
このステージは、一層考察を深めるために、参照セットから参照セグメントの短いリストを作成する。このステップは、計算量とメモリ使用量を管理する際に有用であり、マッチング処理を合計データベースサイズから切り離す方法を提供するが、その代わり、真にマッチするエントリの最大予測数(例えば、30〜60エントリ)と同じ速さ以上にはならない。図4でステージ1の例示の処理を説明する。
次に、考察を続けるために最初の候補ビデオのリストを決定する(404)。一実施形態では、既述の複製自由リスト504内のサブフィンガープリントの全般的な時間配置を計画し、ビデオの各部分と関係付けられるLSHキーのカウント数を維持することにより、最初の候補ビデオのリストを作成する。次に、参照ビデオサブフィンガープリントキーと、入力ビデオサブフィンガープリントキーとの間のマッチ頻度を、各参照ビデオの異なる時間ウィンドウの時間経過中に記録できるように、各参照ビデオについての時間依存マッチカウントを作成できる。例として、図6に参照ビデオDのヒストグラムを示す(もちろん、実際には時間依存マッチカウントはメモリ内に格納されるに過ぎず、表示しなくてもよいし、何らかの別の方法で提示しなくてもよい)。説明した実施例では、マッチカウント機能は粗く定量化されている(例えば、分解能5秒)。従って、マッチカウント機能は、参照ビデオの5秒毎のウィンドウ内に発生する参照ビデオと入力ビデオとの間のマッチするキーのカウント数を維持する。例えば、0〜5秒間の時間ウィンドウ内に、入力ビデオからのキーからなる複製自由リスト504内のキーとマッチする参照ビデオDからのサブフィンガープリントキーの5例がある。参照ビデオの5〜10秒間の時間ウィンドウ内に3つのマッチ例があり、10〜15秒間の時間ウィンドウ内に一例があり、等々である。
次いで、マッチカウント数に基づいて参照ビデオ毎に性能指数を求める。次に、プロセスは、この性能指数順のリストの上位から幾つかのビデオを選択して、将来の処理で検討するものだけとする。一実施形態では、性能指数は、入力ビデオの長さ全体のマッチカウント数を合計することにより得られ、開始と終了ポイントは性能指数を最大化するよう選択する。例えば、参照ビデオDでは、マッチするものの合計数は、0〜45秒間の入力ビデオの長さ全体(45秒)で合計して性能指数15を得る。これはマッチ分布と入力ビデオの長さとの畳み込み積分、それに続く最大値選択:
として実装することができ、ここで、Lは入力ビデオの長さ(例えば45秒)、h(t)は全体時間でのマッチカウントである。代替として、性能指数に寄与する前に、参照ビデオの各分割した(quantized)ウィンドウ(例えば、5秒のウィンドウ)が少なくとも幾つかのマッチの閾値を持つことを保証し、少なくとも複数のセクション(例えば、3つの5分間のセクション)が非ゼロの寄与をするよう計算を修正する。別の実施形態では、各参照ビデオの第2レベルブラックリストに対する発生率もカウントする。第2レベルブラックリストを持つこれら参照の、削除されたオフセット識別子のカウント数は、非ブラックリスト化され、スキャンされたLSHリスト内に発生するインデックス範囲全体にわたって一様に拡散しているとみることができる。これは実質的に、これらエントリに対する前記閾値を下げて、非ゼロの寄与を提供できるようになるであろう。更に別の実施形態では、プレミアムコンテンツを含むとしてマークされている参照ビデオに何らかの追加の優先権が与えられる。例えば、これらのエントリを最初の候補ビデオリストに加えるための前記閾値を下げることができる(プレミアムとしての指定に基づいて)。
最初の候補ビデオのリストを作成する際の別の代替の手法は、以前に検査されたチャンネル(例えば、別のオーディオトラック)でマッチしたことを既に観察されている参照に、追加の優先権を与えることである。例えば、プロセスが、入力メディアファイルに対するオーディオチャンネルマッチングステップを通るパスを既に完了して、今はビデオチャンネルを検査している場合、そのプロセスは、同一の参照をビデオチャンネル候補リストへ容易に加えることができる。オーディオとビデオチャンネルは対になることが多い(または、一方の小さなグループから少なくとも選択される)ので、オーディオチャンネルが所与の参照とマッチするという仮定に合理性がある場合、ビデオチャンネルもマッチするという可能性を一層緊密に検査するようプロセスを構成することができる。このチャンネルをまたぐ強化策のために使用される論理は、マッチングプロセスの制約に依存する。制約があまり厳しくない場合、別のチャンネルでマッチした全ての参照を、最初の候補ビデオリストに加えるだけとすることができる。制約によりその簡単な手法が不可能な場合、以前にマッチしたものを用いて、最初の候補ビデオリストを作成する際に使用される閾値を下げることができる。以前にマッチしたエントリの全期間にわたってこれらの閾値を下げることができ、または現在のトラックの同期部分だけ下げることができる。
後続する全ての処理は、最初の候補の参照ビデオリストの一部となる参照ビデオを検討するだけである。次に、入力ビデオを時間的にローカライズしたブロックに分割する(406)。一実施形態では、ブロックの長さは、検出しなければならない最短予測の真のマッチの長さの半分である。例えば、20秒の長さの短いマッチを検出するには、10秒以下のブロックとすることになる。これらのブロックは、オーバーラップのない10秒ブロックに入力ビデオを任意に切断して、またはオーバーラップさせた10秒ブロックに入力ビデオを切断して形成することができる(例えば、入力ビデオの全長にわたって10秒ウィンドウをスライドさせることによる)。代替として、ブロックは、ビデオまたはオーディオ分析を用いて決定された境界から形成することができる(例えば、カット境界、または分析ベースの境界が広く拡散しすぎている場合に均一な間隔をもつ境界で埋まっている動きの早い境界)。説明を簡単にするために、提示の実施例は、任意に切断されたオーバーラップのない10秒ブロックを用いている。
入力ビデオの各ブロックは、下記のように別々に処理する。一実施形態では、入力ビデオの現在処理しているブロックの複数のサブフィンガープリントをソートして、どのサブフィンガープリントを最初に処理するかを決定する。一実施形態では、現在のブロック内のサブフィンガープリントのリストが最大の差異を持つものから最小の差異を持つものまで順位付ける(408)ように、複数のサブフィンガープリントをソートする。この実施形態では、各入力ビデオサブフィンガープリントとマッチするキーを有する最初の候補ビデオリストから参照サブフィンガープリントの合計数がカウントされる。マッチ数が最小のサブフィンガープリントが最初にリストアップされる。例えば、図7は、現在処理されている入力ビデオブロックからの一セットのサブフィンガープリントを示す。マッチの数を各入力サブフィンガープリント内のLSHキー毎に示す。例えば、LSHキー1C865002+0は、最初の候補ビデオリスト内のビデオから参照サブフィンガープリントとのマッチを4つ有する。マッチ数を入力サブフィンガープリント毎に合計する。その合計を用いて、最小のマッチ数(最大の差異)から最大のマッチ数(最小の差異)まで入力サブフィンガープリントを順位付ける。
入力サブフィンガープリント内の一つ以上のLSHキーが第2レベルブラックリストとされた場合、サブフィンガープリントに対してマッチする候補の合計数(LSHキーリスト内のビデオ全体で合計、または代替として、候補ビデオ全体で合計)をサブフィンガープリントのその部分に対して使用する。サブフィンガープリント内の一つ以上のLSHキーが第1レベルブラックリストとされた場合、入力サブフィンガープリントが関係している候補の参照サブフィンガープリントの数に対して、何らかの大きな値を使用する(例えば、100・第2レベルブラックリストの閾値)。
入力ビデオのサブフィンガープリントセットを現在のブロックに対して順位付けると、そのサブフィンガープリントは、最大の差異を持つサブフィンガープリント(最小マッチ)で開始されるよう処理される。各サブフィンガープリントの処理は、最初の候補ビデオをマップの上位に予め常駐させる場合を除いて、空の候補マップから開始される。各サブフィンガープリント内では、サブフィンガープリント順位付けに対して行われた上記のことと同じように、LSHキーも、最大〜最小の差異を持つ並びで順位付けられる(410)。例えば、図8に示すように、マッチする参照サブフィンガープリント候補の数は、サブフィンガープリント内の各LSHキー毎に決定される。次に、最小マッチ(最大の差異)を有するキーで開始される順位でキーが処理される。次に、最小マッチ(最大の差異)を有するキーで開始される順位でキーが処理される。LSHキーのこの順位を用いて、プロセスは第1LSHキーで開始され、マッチするキーを有する参照サブフィンガープリント候補を候補マップへ追加する。例えば、図9に示すように、順位付けした入力ビデオサブフィンガープリントにLSHルックアップを実行する(各サブフィンガープリント内のLSHキーの順位で)。各ルックアップが実行されると、得られたサブフィンガープリント識別子が格納される。一実施形態では、候補(参照サブフィンガープリントと対応する)は、以下の制約に従って候補マップに追加される。
(1)該候補は、前記最初の候補ビデオリストからのものである。このチェックは、マップを予め常駐させる上記のステップにより明示的に行われる。予め常駐するマップ内にビデオ識別子がある場合、そのビデオ識別子は最初の候補リスト内にあり、プロセスを進めることができる。その場所がマップ内にない場合、該候補のマッチは記録されない。
(3)少なくとも(t−1)の残っている(このサブフィンガープリントからは見えない)許容されるべき新規候補に対するLSHブロックがあり、ここで、tはLSHサブフィンガープリント閾値である(後述)。この残っているLSHブロックカウントは、第2レベルブラックリストとされたLSHブロックを含むが、第1レベルブラックリストのブロックは含まない。
得られる候補マップは、最初の候補ビデオリストからの参照サブフィンガープリント識別子と、現在の入力サブフィンガープリントにマッチするオフセットとからなる限定リストを有する。次のステップは、入力ビデオのサブフィンガープリント全体の候補を組み合せて、どの参照とオフセット候補とが入力サブフィンガープリントにより支持されるかを決定する。入力ビデオのサブフィンガープリントと参照サブフィンガープリントの候補との間のマッチはそれぞれ、入力ビデオと参照ビデオとの間のマッチの特定開始位置を「投票して決める」。開始位置は、入力ビデオへのオフセットを参照ビデオ内のマッチしている位置から減じることにより決定する。例えば、図10に示すように、オフセット(2)での入力ビデオサブフィンガープリントは、参照サブフィンガープリントD@(3)とマッチする。これは開始位置D@(2)に対する「投票」を生成する。同様に、入力ビデオのオフセット(3)でのサブフィンガープリントは、参照サブフィンガープリントD@(4)とマッチする。このマッチも開始位置D@(2)に対する投票である。一般に、入力ビデオ内のオフセットXでのサブフィンガープリントが参照ビデオ内のオフセットYとマッチする場合、これにより、入力ビデオの開始が、Y−X+1とした参照ビデオの位置とマッチするという推定が支持される。投票は、参照ビデオ毎にサブフィンガープリント全体にわたって蓄積される。この結果は実質的に、単位傾斜線(unit-slope line)に対するハフ変換であり、入力ビデオと参照がマッチする可能性のあるタイミングが得られる。
投票は、入力ビデオ内のサブフィンガープリント毎に、同様に処理される。一実施形態では、開始位置に対して少なくともtの投票を有する参照オフセットは、現在の入力ビデオブロックに対する候補支持を保持する新規候補マップに転送される。この閾値は、プレミアムコンテンツに対しては選択的に低下させることができる。例えば、プレミアムコンテンツに関わる候補は、非プレミアムコンテンツより低い支持レベルであるとしても、新規の候補マップへ転送できる。この閾値は、t以上の投票の支持を有する参照候補を余りに多く生成した入力サブフィンガープリントに対しては、より高くなる。各入力サブフィンガープリントに関して、合格するそのサブフィンガープリントからの候補数が所定数未満となるまで、閾値が上方に調整される。例えば、一実施形態では、400,000対の候補が、各候補対が入力ビデオの10秒毎にユニークなマッチ参照または開始オフセットに対応している状態で、許容される。但し、使用される特定の最大候補数は、本システムの計算の制約とタイミングの制約に大きく依存する。合格する候補は、それらに対する支持を以前の支持に加える(現在の入力ビデオブロック内の以前検討した入力サブフィンガープリントから)ことにより、現在の入力ビデオブロックに対する新規候補マップ内へ転送される。
現在のブロックに対する全てのサブフィンガープリントの検査が終了すると、現在の、以前の、および次のブロックのマップがともに追加され、現在のブロックのマップからの証拠に最大の重み付けが与えられるが、他の2つのブロックのマップは候補を追加でき、または既存の候補に対する支持を増加させることができる。この組合せマップから、処理は、そのマップ上で不鮮明ピーク抽出法(smeared peak picking)(および非極大値抑圧法)を用いて、第2ステージで検討される(ビデオ、オフセット)候補のリストを作成する。不鮮明ピーク抽出法は、単一の候補内の開始時間に対するオフセット全体の単純な畳み込み積分である。例示の実施形態は、可能性のある再生速度変更に対する最大予測時間分散の2倍となる三角幅を持つ三角窓により畳み込むステップを含む。例えば、10秒のブロックサイズを持つビデオ再生の際に、10%の速度増加、または速度低下までサポートするには、全三角幅は2秒となる。畳み込みプロセスは、近傍の開始時間オフセットに対する支持があるピークの高さを増大させる。非極大値抑圧法は、このステージの最終候補として選択されたピークを強めて、この不鮮明な時間信号の特徴的な極大値に属させるプロセスである。このプロセスは、信号内の最大極値を探し、その場所(および値)を記録することにより開始される。そして、プロセスは、その最大値までの特定の時間間隔より近い値をゼロに設定する(例えば、10秒ブロックを用いる場合、5秒分離)。ゼロ設定プロセスは、元の(不鮮明な)関数が単調に減少する限り、時間的に外側、前方および後方へと継続される。不鮮明ピーク抽出法/非極大値抑圧法を用いると、二次元変換が要求するような特別なメモリがなくても、より一般的な傾斜および遮断(slope-and-intercept)のハフ変換の機能性が提供される。ステージ1の出力は、入力ビデオと参照ビデオとの間のマッチする部分を決定するように更に検討される候補ビデオセグメント(それぞれ参照サブフィンガープリントと対応する)の限定リストである。これに対する極限セットも高いシステム依存性を持つが、10秒間の入力ブロックあたり1000候補マッチをはるかに下回るようにできるのが普通である。
ステージ2:候補評価
ステージ2:候補評価
第2ステージ処理は、第1ステージで見つかった候補ビデオセグメントを検討し、マッチの一部が正当か、全てが正当か、またはどれも正当でないかを判定する。プロセスは、参照セット内のコピー(全体または一部)の可能性を許容するので、より一般的な説明を提供する(プローブブロックあたりの単一のYes/Noマッチ判定の代わりに)。第2ステージ処理は、多くの様々なファイルとの間違ったマッチがある非記述部分から、時間が僅かにシフトすると同一の参照素材にすらマッチが乏しいタイミング依存部分まで、広い範囲のメディアを扱うことができる。
このタスクと、素材のこの範囲とを取り扱うために、候補ビデオセグメント毎にマッチ品質尺度を作成することにより分類プロセスが開始される。一実施形態では、動的時間ワープ法(DTW)が、現在の入力ビデオブロックと参照ビデオとの間の時間をまたいで最良の配置を決定する(1102)。DTWのパラメータは、アプリケーションがサポートしなければならないマッチしているメディア内の時間歪み量により決定される(例えば、多くのアプリケーションでは、約15%の高速化または低速化)。DTWの出力から、入力ビデオの個々のサブフィンガープリントと、参照サブフィンガープリントとの間で対となる組合せが決定される。対のセットが評価されて、入力ビデオと参照ビデオとの間のマッチベクトルの記述を生成する(1104)。このマッチベクトルに記入する可能性がある例は以下のようになる:
1)対となるサブフィンガープリントベクトル間の累積ハミング距離。
2)対となるベクトルの少なくとも80%がマッチするサブフィンガープリントの割合。
3)対となるベクトルの少なくとも60%がマッチするサブフィンガープリントの割合。
4)対となるベクトルの少なくとも40%がマッチするサブフィンガープリントの割合。
5)対となるベクトルの少なくとも20%がマッチするサブフィンガープリントの割合。
6)復号パスと最小二乗誤差(LSE)適合直線復号パスとの間の平均二乗誤差(MSE)。
7)LSE適合直線復号パスの傾斜。
8)正当なサブフィンガープリントと対になった正当サブフィンガープリントの数、および少なくとも10%の対となるベクトルのマッチング。ここで、正当/不当は、フロントエンドのフィンガープリントプロセスの間で使用するある尺度を用いて決定される(例えば、非ブランクまたは非サイレント)。
9)不当なサブフィンガープリントと対になった不当サブフィンガープリントの数。
10)正当なサブフィンガープリントと対になった不当サブフィンガープリントの数。
11)第1ステージの候補リスト内でリストに挙げた同一ビデオと、近似的に同一オフセットを持つ近傍プローブブロックの数。
12)この対が第1ステージの証拠の収集中に受け取った投票の数。
13)以前検査されたチャンネル上での、この参照とのマッチの存在、マッチの信頼性、およびマッチのタイミングとオフセットの類似性。
14)プレミアムとして参照を指定。
15)このプローブを生成したユーザーのアップロード履歴(例えば、参照セットから以前アップロードしたコンテンツを有する)。
16)メタデータがプローブと参照コンテンツの両方について利用可能な場合、これらの記述間の類似性(例えば、アンカーテキスト)。
1)対となるサブフィンガープリントベクトル間の累積ハミング距離。
2)対となるベクトルの少なくとも80%がマッチするサブフィンガープリントの割合。
3)対となるベクトルの少なくとも60%がマッチするサブフィンガープリントの割合。
4)対となるベクトルの少なくとも40%がマッチするサブフィンガープリントの割合。
5)対となるベクトルの少なくとも20%がマッチするサブフィンガープリントの割合。
6)復号パスと最小二乗誤差(LSE)適合直線復号パスとの間の平均二乗誤差(MSE)。
7)LSE適合直線復号パスの傾斜。
8)正当なサブフィンガープリントと対になった正当サブフィンガープリントの数、および少なくとも10%の対となるベクトルのマッチング。ここで、正当/不当は、フロントエンドのフィンガープリントプロセスの間で使用するある尺度を用いて決定される(例えば、非ブランクまたは非サイレント)。
9)不当なサブフィンガープリントと対になった不当サブフィンガープリントの数。
10)正当なサブフィンガープリントと対になった不当サブフィンガープリントの数。
11)第1ステージの候補リスト内でリストに挙げた同一ビデオと、近似的に同一オフセットを持つ近傍プローブブロックの数。
12)この対が第1ステージの証拠の収集中に受け取った投票の数。
13)以前検査されたチャンネル上での、この参照とのマッチの存在、マッチの信頼性、およびマッチのタイミングとオフセットの類似性。
14)プレミアムとして参照を指定。
15)このプローブを生成したユーザーのアップロード履歴(例えば、参照セットから以前アップロードしたコンテンツを有する)。
16)メタデータがプローブと参照コンテンツの両方について利用可能な場合、これらの記述間の類似性(例えば、アンカーテキスト)。
このベクトル記述から品質尺度を決定する(1106)。品質尺度の一実施例では、真のマッチのためのモデルと偽のマッチのためのモデルとの間の尤度比を用いる。適切モデルは、なかでも、全共分散ガウスモデルまたは対角線分散ガウス混合モデルであろう。代替として、この品質尺度ステップ(1106)は、全ての品質尺度をゼロに設定するだけでバイパスさせることができる。
オプションで、現在のブロックに対する全ての第1ステージ候補に対して品質尺度を計算すると、このセットに母集団統計を用いて、非記述セグメントと時間オフセット依存セグメントとの間の区別に役立てることができる。第1ステージ候補リストからの品質尺度の広がりがこれら2つの間で異なると仮定することにより、これを実行できる。例えば、それは、典型的な時間依存コンテンツは幾つかの軸(例えば、復号パスの直線性)上で良くマッチするが、他の軸上ではマッチしない単一の候補対しか持たないけれども、非記述コンテンツは、ある範囲(閾値超)にマッチする多くの候補対を有するということかもしれない。この種の区別には、母集団正規化エントリを持つマッチ対の記述を拡張することにより、ある程度の支持を提供できる。これらには以下が含まれる:
1)対に対する品質尺度(正規化せずに)。
2)対の順位、ここで、順位付けには該プローブブロックについての複数候補マッチの品質尺度を用いる。
3)該プローブブロックについての複数候補マッチの平均品質尺度。
4)該プローブブロックについての複数候補マッチの標準偏差。
5)該プローブブロックについての複数候補マッチの逆標準偏差。
6)該プローブブロックについての複数候補に関する品質尺度の平均値と標準偏差により正規化された対の品質尺度。
7)該プローブブロックについての候補に関する品質尺度の平均値と標準偏差により正規化された対の順位。
このステップも追加エントリをゼロに設定することにより省略できる。
1)対に対する品質尺度(正規化せずに)。
2)対の順位、ここで、順位付けには該プローブブロックについての複数候補マッチの品質尺度を用いる。
3)該プローブブロックについての複数候補マッチの平均品質尺度。
4)該プローブブロックについての複数候補マッチの標準偏差。
5)該プローブブロックについての複数候補マッチの逆標準偏差。
6)該プローブブロックについての複数候補に関する品質尺度の平均値と標準偏差により正規化された対の品質尺度。
7)該プローブブロックについての候補に関する品質尺度の平均値と標準偏差により正規化された対の順位。
このステップも追加エントリをゼロに設定することにより省略できる。
次いで、この拡張されたマッチ対記述が、真/偽マッチ対の分類手段への入力として提供される。分類手段を用いて(1108)、正当または不当なマッチとして候補を分類し、該マッチに対する信頼点数を提供する。分類手段は、ニューラルネットワーク様の構造に基づくか、または線形分類手段に基づく任意の多様な形式とすることができる。分類手段がその対の受け入れを示す場合、それは、信頼点数とともに第3ステージに提供されるリスト内に含まれる。さもなければ削除される。このステージの出力は、正当なマッチしている候補のリストである。
ステージ3:候補組合せおよび剪定
ステージ3:候補組合せおよび剪定
これは、様々な入力ビデオブロックにマッチする参照ビデオ部分を収集し、これらのコンポーネントを単一の組合せマッチに組み込むことにより実施される。例えば、図12に示すように、入力ビデオと参照ビデオとの間の複数のコンポーネントマッチ(ブロック1、ブロック2、ブロック3)は、1つの組合せマッチに組み込まれる。剪定ステージに合格するには、例えば、以下のような制約が課される:
1)少なくとも2つの異なる入力ビデオのブロックが、一つの組合せマッチに支持を提供する(ここで入力ビデオブロックと参照ビデオの一部との間の任意の信号対は、一つの組合せマッチしか支持できない)。
2)該組合せマッチの平均マッチ品質が、ある閾値を超える。
3)入力ビデオと、組合せを支持するブロック全体の参照部分との間の分散が、ある閾値未満である。
1)少なくとも2つの異なる入力ビデオのブロックが、一つの組合せマッチに支持を提供する(ここで入力ビデオブロックと参照ビデオの一部との間の任意の信号対は、一つの組合せマッチしか支持できない)。
2)該組合せマッチの平均マッチ品質が、ある閾値を超える。
3)入力ビデオと、組合せを支持するブロック全体の参照部分との間の分散が、ある閾値未満である。
このマッチグループ化プロセスを実行する一手法は、特定の時間−場所制限内にある全コンポーネントマッチが支持リスト内に置かれる欲張りアルゴリズムである。その全長さのリストが、入力ビデオとコンポーネントブロックを横断する参照ビデオとの間のオフセットの分散が多すぎることを示す場合、異常値(オフセット内の)がそのマッチから削除され、セットが長さ2未満となるか、または組合せマッチがその試験に合格するまで、そのセットは再考される。組合せマッチがその試験に合格した場合、その組合せマッチに支持を提供する全てのコンポーネントマッチには、マッチしているコンテンツとしてフラグが立てられる。更に、マッチしているコンテンツを含むよう組合せマッチの「影」にある他のマッチを決定する。組合せマッチの影は、入力ビデオと同一参照ビデオとの間の類似時間支持を有し、二つの間の類似時間オフセットを有するこれらのマッチする部分である。組合せマッチがその試験に合格しない場合、提案された組合せマッチのシードとして使用されたコンポーネントマッチが削除される。次いで、そのリストが空になるまで、縮小され要求されないリスト上で、組合せプロセスが繰り返される。
最終ステージプロセスの一実施形態は、類似形式の一般的な低速運動のシーケンスとマッチするのを避けるよう構成される。この問題の例は、「アナウンサの顔(talking head)」のビデオである。ビデオトラックは明るく、かつ鮮明であることが多いが、多くの従来のフィンガープリント法は、暗い背景、暗いスーツのビデオコンテンツを中央寄りの明るい色の顔と区別することができない。例えば、第1対象「ジョージ」の記者会見のビデオトラックは、ジョ−ジによる全ての他の記者会見と類似している(多くのフィンガープリント生成プロセスで使用する詳細レベルまで)ように見え、第2対象「ビル」の何れかの記者会見と酷似させることが容易にできる。従って、従来のフィンガープリントは、残念ながらこれらのビデオ間のマッチを示すことができない。ビデオチャンネルのこれらの不正マッチは、多くの疑念のあるマッチを生成しがちであり、オーディオチャンネル間の対応するマッチでは起きない。従って、両チャンネルをカバーせず、疑念のあるマッチと支持されるマッチとのある比率の閾値を超えるこれらのマッチについての、これらの不正マッチの報告を避けるために、プロセスは、そのマッチの信頼性を低下させるか、または信頼性が余りに低ければ、そのマッチを完全に削除する。こうして、多数のブロック支持を持つ僅かな数のマッチだけが作成され、全プロセスから戻される。
マッチ結果
マッチ結果
最終出力は、入力ビデオ(または、入力ビデオの一部)とマッチすると決定された参照ビデオ(または参照ビデオの識別した部分)のリストを提供する。この決定は幾つかの目的のために使用できる。第1に、アップロードされた入力ビデオ102が、既に参照ビデオセット内のビデオの複製であるとマッチングモジュール108が決定した場合、アップロードされた入力ビデオ102を、格納空間の節約を目的に廃棄できる。第2に、入力ビデオ102を用いて、例えば、著作権保護されたビデオコンテンツを探して、参照ビデオを調べることができる。次いで、これらのビデオにフラグを立てたり、または参照ビデオセットから削除したりすることができる。利点としては、説明したシステムおよび方法は、時間的に厳しい制約があっても、および/または限られたメモリ量を用いたとしても、効率的かつ正確にマッチを検出できる。
Claims (3)
- 複製ビデオコンテンツを検出するためにコンピュータによって実行される方法であって、
入力ビデオを表す入力フィンガープリントを受け取るステップと、
参照ビデオセットから候補セグメントリストを生成するステップであって、前記候補セグメントリストは、前記参照ビデオセット内の参照ビデオ中の時間的にローカライズされたセグメントを含み、かつ、前記候補セグメントリスト内の各候補セグメントは、前記入力フィンガープリントに少なくとも部分的に一致する参照フィンガープリントを含む、前記ステップと、
分類要素を用いて、一致候補セグメントまたは不一致候補セグメントの何れかとして、前記候補セグメントリストからの候補セグメントを分類するステップと、
前記候補セグメントの前記分類に基づいて、前記参照ビデオセットから参照ビデオの一致部分を識別する結果を生成するステップと
を具備する方法。 - 複製ビデオコンテンツを検出するためのコンピュータプログラムを記憶するコンピュータ読取り可能な記憶媒体であって、コンピュータに、
入力ビデオを表す入力フィンガープリントを受け取る手順と、
参照ビデオセットから候補セグメントリストを生成する手順と、ここで、前記候補セグメントリストは、前記参照ビデオセット内の参照ビデオ中の時間的にローカライズされたセグメントを含み、かつ、前記候補セグメントリスト内の各候補セグメントは、前記入力フィンガープリントに少なくとも部分的に一致する参照フィンガープリントを含み、
分類要素を用いて、一致候補セグメントまたは不一致候補セグメントの何れかとして、前記候補セグメントリストからの候補セグメントを分類する手順と、
前記候補セグメントの前記分類に基づいて、前記参照ビデオセットから参照ビデオ中の一致部分を識別する結果を生成する手順と
を実行させるためのコンピュータプログラムを記憶したコンピュータ読取り可能な記憶媒体。 - 複製ビデオコンテンツを検出するシステムであって、
入力ビデオを受け取る取込みサーバと、
前記入力ビデオを表す入力フィンガープリントを生成するフィンガープリントモジュールと、
参照ビデオセットを表す参照フィンガープリントを格納する参照データベースと、
前記フィンガープリントモジュールおよび前記参照データベースに接続される一致モジュールであって、前記入力フィンガープリントに基づいて、前記参照ビデオセットから候補セグメントリストを生成し、ここで、前記候補セグメントリスト内の各候補セグメントは前記入力フィンガープリントに少なくとも部分的に一致する参照フィンガープリントを含んでおり、一致セグメントまたは不一致セグメントとして前記候補セグメントを分類し、前記候補セグメントの前記分類に基づいて、前記参照ビデオセットから参照ビデオの一致部分を識別する結果を生成する、前記一致モジュールと
を備えるシステム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US95744607P | 2007-08-22 | 2007-08-22 | |
US60/957,446 | 2007-08-22 | ||
US12/174,366 | 2008-07-16 | ||
US12/174,366 US8238669B2 (en) | 2007-08-22 | 2008-07-16 | Detection and classification of matches between time-based media |
PCT/US2008/074105 WO2009026564A1 (en) | 2007-08-22 | 2008-08-22 | Detection and classification of matches between time-based media |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010537585A JP2010537585A (ja) | 2010-12-02 |
JP2010537585A5 true JP2010537585A5 (ja) | 2013-08-29 |
JP5479340B2 JP5479340B2 (ja) | 2014-04-23 |
Family
ID=40378706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010522089A Active JP5479340B2 (ja) | 2007-08-22 | 2008-08-22 | 時間ベースのメディア間のマッチの検出と分類 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8238669B2 (ja) |
EP (1) | EP2191400B1 (ja) |
JP (1) | JP5479340B2 (ja) |
CN (1) | CN101821734B (ja) |
AU (1) | AU2008288797B2 (ja) |
CA (1) | CA2696890C (ja) |
WO (1) | WO2009026564A1 (ja) |
Families Citing this family (135)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8205237B2 (en) | 2000-09-14 | 2012-06-19 | Cox Ingemar J | Identifying works, using a sub-linear time search, such as an approximate nearest neighbor search, for initiating a work-based action, such as an action on the internet |
US20070162761A1 (en) | 2005-12-23 | 2007-07-12 | Davis Bruce L | Methods and Systems to Help Detect Identity Fraud |
US8738749B2 (en) | 2006-08-29 | 2014-05-27 | Digimarc Corporation | Content monitoring and host compliance evaluation |
US8010511B2 (en) | 2006-08-29 | 2011-08-30 | Attributor Corporation | Content monitoring and compliance enforcement |
US8707459B2 (en) | 2007-01-19 | 2014-04-22 | Digimarc Corporation | Determination of originality of content |
US7707224B2 (en) | 2006-11-03 | 2010-04-27 | Google Inc. | Blocking of unlicensed audio content in video files on a video hosting website |
US10242415B2 (en) * | 2006-12-20 | 2019-03-26 | Digimarc Corporation | Method and system for determining content treatment |
US9179200B2 (en) | 2007-03-14 | 2015-11-03 | Digimarc Corporation | Method and system for determining content treatment |
US9177209B2 (en) * | 2007-12-17 | 2015-11-03 | Sinoeast Concept Limited | Temporal segment based extraction and robust matching of video fingerprints |
GB2457694B (en) | 2008-02-21 | 2012-09-26 | Snell Ltd | Method of Deriving an Audio-Visual Signature |
GB2487499B (en) * | 2008-02-21 | 2013-02-27 | Snell Ltd | Method of comparing audio data |
US8184953B1 (en) | 2008-02-22 | 2012-05-22 | Google Inc. | Selection of hash lookup keys for efficient retrieval |
US8069176B1 (en) * | 2008-09-25 | 2011-11-29 | Google Inc. | LSH-based retrieval using sub-sampling |
US10567823B2 (en) | 2008-11-26 | 2020-02-18 | Free Stream Media Corp. | Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device |
US9026668B2 (en) | 2012-05-26 | 2015-05-05 | Free Stream Media Corp. | Real-time and retargeted advertising on multiple screens of a user watching television |
US9961388B2 (en) | 2008-11-26 | 2018-05-01 | David Harrison | Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements |
US9519772B2 (en) | 2008-11-26 | 2016-12-13 | Free Stream Media Corp. | Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device |
US9154942B2 (en) | 2008-11-26 | 2015-10-06 | Free Stream Media Corp. | Zero configuration communication between a browser and a networked media device |
US10977693B2 (en) | 2008-11-26 | 2021-04-13 | Free Stream Media Corp. | Association of content identifier of audio-visual data with additional data through capture infrastructure |
US10334324B2 (en) | 2008-11-26 | 2019-06-25 | Free Stream Media Corp. | Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device |
US9986279B2 (en) | 2008-11-26 | 2018-05-29 | Free Stream Media Corp. | Discovery, access control, and communication with networked services |
US8180891B1 (en) | 2008-11-26 | 2012-05-15 | Free Stream Media Corp. | Discovery, access control, and communication with networked services from within a security sandbox |
US10419541B2 (en) | 2008-11-26 | 2019-09-17 | Free Stream Media Corp. | Remotely control devices over a network without authentication or registration |
US10631068B2 (en) | 2008-11-26 | 2020-04-21 | Free Stream Media Corp. | Content exposure attribution based on renderings of related content across multiple devices |
US10880340B2 (en) | 2008-11-26 | 2020-12-29 | Free Stream Media Corp. | Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device |
US9386356B2 (en) | 2008-11-26 | 2016-07-05 | Free Stream Media Corp. | Targeting with television audience data across multiple screens |
US20100165123A1 (en) * | 2008-12-29 | 2010-07-01 | Microsoft Corporation | Data-Driven Video Stabilization |
US20100262488A1 (en) * | 2009-04-08 | 2010-10-14 | Google Inc. | Policy-based media syndication and monetization |
US9633014B2 (en) * | 2009-04-08 | 2017-04-25 | Google Inc. | Policy based video content syndication |
US9071868B2 (en) | 2009-05-29 | 2015-06-30 | Cognitive Networks, Inc. | Systems and methods for improving server and client performance in fingerprint ACR systems |
US10375451B2 (en) | 2009-05-29 | 2019-08-06 | Inscape Data, Inc. | Detection of common media segments |
US10949458B2 (en) | 2009-05-29 | 2021-03-16 | Inscape Data, Inc. | System and method for improving work load management in ACR television monitoring system |
US8769584B2 (en) | 2009-05-29 | 2014-07-01 | TVI Interactive Systems, Inc. | Methods for displaying contextually targeted content on a connected television |
US9449090B2 (en) | 2009-05-29 | 2016-09-20 | Vizio Inscape Technologies, Llc | Systems and methods for addressing a media database using distance associative hashing |
US10116972B2 (en) | 2009-05-29 | 2018-10-30 | Inscape Data, Inc. | Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device |
WO2010140003A2 (en) * | 2009-06-04 | 2010-12-09 | Bae Systems Plc | System and method of analysing transfer of data over at least one network |
US8713068B2 (en) * | 2009-06-11 | 2014-04-29 | Yahoo! Inc. | Media identification system with fingerprint database balanced according to search loads |
US8229219B1 (en) * | 2009-08-06 | 2012-07-24 | Google Inc. | Full-length video fingerprinting |
US8290918B1 (en) | 2009-09-29 | 2012-10-16 | Google Inc. | Robust hashing of digital media data |
EP2541963B1 (en) * | 2009-12-29 | 2021-03-17 | Inscape Data, Inc. | Method for identifying video segments and displaying contextually targeted content on a connected television |
US8886531B2 (en) * | 2010-01-13 | 2014-11-11 | Rovi Technologies Corporation | Apparatus and method for generating an audio fingerprint and using a two-stage query |
US20110173185A1 (en) * | 2010-01-13 | 2011-07-14 | Rovi Technologies Corporation | Multi-stage lookup for rolling audio recognition |
US8625033B1 (en) * | 2010-02-01 | 2014-01-07 | Google Inc. | Large-scale matching of audio and video |
US9838753B2 (en) | 2013-12-23 | 2017-12-05 | Inscape Data, Inc. | Monitoring individual viewing of television events using tracking pixels and cookies |
US10192138B2 (en) | 2010-05-27 | 2019-01-29 | Inscape Data, Inc. | Systems and methods for reducing data density in large datasets |
US8374386B2 (en) * | 2011-01-27 | 2013-02-12 | Polytechnic Institute Of New York University | Sensor fingerprint matching in large image and video databases |
US10127578B2 (en) * | 2011-05-09 | 2018-11-13 | Capital One Services, Llc | Method and system for matching purchase transaction history to real-time location information |
US8917823B1 (en) | 2011-05-26 | 2014-12-23 | Google Inc. | Transcribing and navigating a response system |
US9092520B2 (en) * | 2011-06-20 | 2015-07-28 | Microsoft Technology Licensing, Llc | Near-duplicate video retrieval |
US9026540B1 (en) * | 2012-01-31 | 2015-05-05 | Google Inc. | Systems and methods for information match scoring |
US9165124B1 (en) | 2012-02-01 | 2015-10-20 | Convertro, Inc. | Systems and methods for identifying a returning web client |
US8838609B1 (en) | 2012-10-10 | 2014-09-16 | Google Inc. | IDF weighting of LSH bands for live reference ingestion |
US9684715B1 (en) * | 2012-03-08 | 2017-06-20 | Google Inc. | Audio identification using ordinal transformation |
US8990951B1 (en) * | 2012-03-30 | 2015-03-24 | Google Inc. | Claiming delayed live reference streams |
US20140101551A1 (en) * | 2012-10-05 | 2014-04-10 | Google Inc. | Stitching videos into an aggregate video |
CN103020140B (zh) * | 2012-11-21 | 2016-01-20 | 合一网络技术(北京)有限公司 | 一种对互联网用户评论内容自动过滤的方法和装置 |
US9146990B2 (en) * | 2013-01-07 | 2015-09-29 | Gracenote, Inc. | Search and identification of video content |
US9792350B2 (en) * | 2013-01-10 | 2017-10-17 | International Business Machines Corporation | Real-time classification of data into data compression domains |
US9053121B2 (en) | 2013-01-10 | 2015-06-09 | International Business Machines Corporation | Real-time identification of data candidates for classification based compression |
US9564918B2 (en) | 2013-01-10 | 2017-02-07 | International Business Machines Corporation | Real-time reduction of CPU overhead for data compression |
KR101456926B1 (ko) * | 2013-06-14 | 2014-10-31 | (주)엔써즈 | 핑거프린트에 기반한 광고 검출 시스템 및 방법 |
US9236056B1 (en) * | 2013-08-13 | 2016-01-12 | Google Inc. | Variable length local sensitivity hash index |
EP3066586B1 (en) | 2013-11-08 | 2021-03-24 | Friend For Media Limited | Identifying media components |
US9955192B2 (en) | 2013-12-23 | 2018-04-24 | Inscape Data, Inc. | Monitoring individual viewing of television events using tracking pixels and cookies |
US9529840B1 (en) * | 2014-01-14 | 2016-12-27 | Google Inc. | Real-time duplicate detection of videos in a massive video sharing system |
US9619854B1 (en) * | 2014-01-21 | 2017-04-11 | Google Inc. | Fingerprint matching for recommending media content within a viewing session |
US9471663B1 (en) | 2014-01-22 | 2016-10-18 | Google Inc. | Classification of media in a media sharing system |
GB2523311B (en) * | 2014-02-17 | 2021-07-14 | Grass Valley Ltd | Method and apparatus for managing audio visual, audio or visual content |
WO2015134452A1 (en) * | 2014-03-04 | 2015-09-11 | Interactive Intelligence Group, Inc. | Optimization of audio fingerprint search |
US10318543B1 (en) | 2014-03-20 | 2019-06-11 | Google Llc | Obtaining and enhancing metadata for content items |
NL2012567B1 (en) * | 2014-04-04 | 2016-03-08 | Teletrax B V | Method and device for generating improved fingerprints. |
US9930375B2 (en) * | 2014-06-16 | 2018-03-27 | Nexidia Inc. | Media asset management |
US9881083B2 (en) | 2014-08-14 | 2018-01-30 | Yandex Europe Ag | Method of and a system for indexing audio tracks using chromaprints |
US9558272B2 (en) | 2014-08-14 | 2017-01-31 | Yandex Europe Ag | Method of and a system for matching audio tracks using chromaprints with a fast candidate selection routine |
KR20160044954A (ko) * | 2014-10-16 | 2016-04-26 | 삼성전자주식회사 | 정보 제공 방법 및 이를 구현하는 전자 장치 |
US9805099B2 (en) * | 2014-10-30 | 2017-10-31 | The Johns Hopkins University | Apparatus and method for efficient identification of code similarity |
CN108337925B (zh) | 2015-01-30 | 2024-02-27 | 构造数据有限责任公司 | 用于识别视频片段以及显示从替代源和/或在替代设备上观看的选项的方法 |
US9392324B1 (en) * | 2015-03-30 | 2016-07-12 | Rovi Guides, Inc. | Systems and methods for identifying and storing a portion of a media asset |
CA2982797C (en) | 2015-04-17 | 2023-03-14 | Inscape Data, Inc. | Systems and methods for reducing data density in large datasets |
EP3323055A1 (en) | 2015-07-16 | 2018-05-23 | Inscape Data, Inc. | Systems and methods for partitioning search indexes for improved efficiency in identifying media segments |
US10080062B2 (en) | 2015-07-16 | 2018-09-18 | Inscape Data, Inc. | Optimizing media fingerprint retention to improve system resource utilization |
CN108337912A (zh) | 2015-07-16 | 2018-07-27 | 构造数据有限责任公司 | 对视频段的未来收看的预测以优化系统资源利用 |
JP6903653B2 (ja) | 2015-07-16 | 2021-07-14 | インスケイプ データ インコーポレイテッド | 共通メディアセグメントの検出 |
CN105279489B (zh) * | 2015-10-13 | 2018-07-13 | 成都纽捷那科技有限公司 | 一种基于稀疏编码的视频指纹提取方法 |
WO2017075493A1 (en) | 2015-10-28 | 2017-05-04 | Ustudio, Inc. | Video frame difference engine |
KR102560635B1 (ko) * | 2015-12-28 | 2023-07-28 | 삼성전자주식회사 | 컨텐트 인식 장치 및 그 동작 방법 |
US9723344B1 (en) * | 2015-12-29 | 2017-08-01 | Google Inc. | Early detection of policy violating media |
US20170357654A1 (en) * | 2016-06-10 | 2017-12-14 | Google Inc. | Using audio and video matching to determine age of content |
US10936651B2 (en) * | 2016-06-22 | 2021-03-02 | Gracenote, Inc. | Matching audio fingerprints |
US10013614B2 (en) * | 2016-06-29 | 2018-07-03 | Google Llc | Using an image matching system to improve the quality of service of a video matching system |
RU2634211C1 (ru) | 2016-07-06 | 2017-10-24 | Общество с ограниченной ответственностью "Траст" | Способ и система анализа протоколов взаимодействия вредоносных программ с центрами управления и выявления компьютерных атак |
RU2649793C2 (ru) | 2016-08-03 | 2018-04-04 | ООО "Группа АйБи" | Способ и система выявления удаленного подключения при работе на страницах веб-ресурса |
RU2634209C1 (ru) | 2016-09-19 | 2017-10-24 | Общество с ограниченной ответственностью "Группа АйБи ТДС" | Система и способ автогенерации решающих правил для систем обнаружения вторжений с обратной связью |
US10789623B1 (en) | 2016-09-23 | 2020-09-29 | Zeta Global Corp. | Ad collision reduction |
US10061987B2 (en) * | 2016-11-11 | 2018-08-28 | Google Llc | Differential scoring: a high-precision scoring method for video matching |
RU2671991C2 (ru) | 2016-12-29 | 2018-11-08 | Общество с ограниченной ответственностью "Траст" | Система и способ сбора информации для обнаружения фишинга |
RU2637477C1 (ru) | 2016-12-29 | 2017-12-04 | Общество с ограниченной ответственностью "Траст" | Система и способ обнаружения фишинговых веб-страниц |
US10909161B2 (en) | 2016-12-29 | 2021-02-02 | Arris Enterprises Llc | System to build advertisement database from unreliable sources |
US10754514B1 (en) | 2017-03-01 | 2020-08-25 | Matroid, Inc. | Machine learning in video classification with schedule highlighting |
WO2018187592A1 (en) | 2017-04-06 | 2018-10-11 | Inscape Data, Inc. | Systems and methods for improving accuracy of device maps using media viewing data |
US11074290B2 (en) * | 2017-05-03 | 2021-07-27 | Rovi Guides, Inc. | Media application for correcting names of media assets |
US9936230B1 (en) * | 2017-05-10 | 2018-04-03 | Google Llc | Methods, systems, and media for transforming fingerprints to detect unauthorized media content items |
US20180359539A1 (en) * | 2017-06-08 | 2018-12-13 | Qualcomm Incorporated | Smooth transition for content type changes in streaming content |
US10972203B2 (en) * | 2017-06-12 | 2021-04-06 | Gracenote, Inc. | Detecting and responding to rendering of interactive video content |
US10440413B2 (en) * | 2017-07-31 | 2019-10-08 | The Nielsen Company (Us), Llc | Methods and apparatus to perform media device asset qualification |
RU2689816C2 (ru) | 2017-11-21 | 2019-05-29 | ООО "Группа АйБи" | Способ для классифицирования последовательности действий пользователя (варианты) |
RU2677368C1 (ru) | 2018-01-17 | 2019-01-16 | Общество С Ограниченной Ответственностью "Группа Айби" | Способ и система для автоматического определения нечетких дубликатов видеоконтента |
RU2677361C1 (ru) | 2018-01-17 | 2019-01-16 | Общество с ограниченной ответственностью "Траст" | Способ и система децентрализованной идентификации вредоносных программ |
RU2676247C1 (ru) | 2018-01-17 | 2018-12-26 | Общество С Ограниченной Ответственностью "Группа Айби" | Способ и компьютерное устройство для кластеризации веб-ресурсов |
RU2680736C1 (ru) | 2018-01-17 | 2019-02-26 | Общество с ограниченной ответственностью "Группа АйБи ТДС" | Сервер и способ для определения вредоносных файлов в сетевом трафике |
RU2668710C1 (ru) | 2018-01-17 | 2018-10-02 | Общество с ограниченной ответственностью "Группа АйБи ТДС" | Вычислительное устройство и способ для обнаружения вредоносных доменных имен в сетевом трафике |
RU2681699C1 (ru) | 2018-02-13 | 2019-03-12 | Общество с ограниченной ответственностью "Траст" | Способ и сервер для поиска связанных сетевых ресурсов |
US10713495B2 (en) | 2018-03-13 | 2020-07-14 | Adobe Inc. | Video signatures based on image feature extraction |
CN109189991B (zh) * | 2018-08-17 | 2021-06-08 | 百度在线网络技术(北京)有限公司 | 重复视频识别方法、装置、终端及计算机可读存储介质 |
RU2708508C1 (ru) | 2018-12-17 | 2019-12-09 | Общество с ограниченной ответственностью "Траст" | Способ и вычислительное устройство для выявления подозрительных пользователей в системах обмена сообщениями |
RU2701040C1 (ru) | 2018-12-28 | 2019-09-24 | Общество с ограниченной ответственностью "Траст" | Способ и вычислительное устройство для информирования о вредоносных веб-ресурсах |
WO2020176005A1 (ru) | 2019-02-27 | 2020-09-03 | Общество С Ограниченной Ответственностью "Группа Айби" | Способ и система идентификации пользователя по клавиатурному почерку |
US11325044B2 (en) * | 2019-03-07 | 2022-05-10 | Sony Interactive Entertainment LLC | Video game guidance system |
CN110099302B (zh) | 2019-04-29 | 2020-11-24 | 北京达佳互联信息技术有限公司 | 视频分级方法、装置、设备及存储介质 |
US10997459B2 (en) * | 2019-05-23 | 2021-05-04 | Webkontrol, Inc. | Video content indexing and searching |
RU2728498C1 (ru) | 2019-12-05 | 2020-07-29 | Общество с ограниченной ответственностью "Группа АйБи ТДС" | Способ и система определения принадлежности программного обеспечения по его исходному коду |
RU2728497C1 (ru) | 2019-12-05 | 2020-07-29 | Общество с ограниченной ответственностью "Группа АйБи ТДС" | Способ и система определения принадлежности программного обеспечения по его машинному коду |
RU2743974C1 (ru) | 2019-12-19 | 2021-03-01 | Общество с ограниченной ответственностью "Группа АйБи ТДС" | Система и способ сканирования защищенности элементов сетевой архитектуры |
CN111339356B (zh) * | 2020-02-21 | 2023-07-18 | 北京字节跳动网络技术有限公司 | 视频检索中防误判方法、装置及电子设备 |
CN111353301B (zh) * | 2020-02-24 | 2023-07-21 | 成都网安科技发展有限公司 | 辅助定密方法及装置 |
SG10202001963TA (en) | 2020-03-04 | 2021-10-28 | Group Ib Global Private Ltd | System and method for brand protection based on the search results |
US11475090B2 (en) | 2020-07-15 | 2022-10-18 | Group-Ib Global Private Limited | Method and system for identifying clusters of affiliated web resources |
RU2743619C1 (ru) | 2020-08-06 | 2021-02-20 | Общество с ограниченной ответственностью "Группа АйБи ТДС" | Способ и система генерации списка индикаторов компрометации |
US11798577B2 (en) * | 2021-03-04 | 2023-10-24 | Gracenote, Inc. | Methods and apparatus to fingerprint an audio signal |
US11947572B2 (en) | 2021-03-29 | 2024-04-02 | Group IB TDS, Ltd | Method and system for clustering executable files |
US11860977B1 (en) * | 2021-05-04 | 2024-01-02 | Amazon Technologies, Inc. | Hierarchical graph neural networks for visual clustering |
NL2030861B1 (en) | 2021-06-01 | 2023-03-14 | Trust Ltd | System and method for external monitoring a cyberattack surface |
CN113421241B (zh) * | 2021-06-23 | 2023-08-18 | 平安国际智慧城市科技股份有限公司 | 异常事件上报方法、装置、计算机设备及存储介质 |
US11417099B1 (en) * | 2021-11-08 | 2022-08-16 | 9219-1568 Quebec Inc. | System and method for digital fingerprinting of media content |
US11599856B1 (en) | 2022-01-24 | 2023-03-07 | My Job Matcher, Inc. | Apparatuses and methods for parsing and comparing video resume duplications |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03291752A (ja) * | 1990-04-10 | 1991-12-20 | Matsushita Electric Ind Co Ltd | データ検索装置 |
US5903454A (en) * | 1991-12-23 | 1999-05-11 | Hoffberg; Linda Irene | Human-factored interface corporating adaptive pattern recognition based controller apparatus |
US5973723A (en) * | 1997-12-12 | 1999-10-26 | Deluca; Michael Joseph | Selective commercial detector and eliminator apparatus and method |
US6990453B2 (en) * | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
US7043473B1 (en) * | 2000-11-22 | 2006-05-09 | Widevine Technologies, Inc. | Media tracking system and method |
AU2003280513A1 (en) * | 2002-07-01 | 2004-01-19 | Microsoft Corporation | A system and method for providing user control over repeating objects embedded in a stream |
US20070071330A1 (en) * | 2003-11-18 | 2007-03-29 | Koninklijke Phillips Electronics N.V. | Matching data objects by matching derived fingerprints |
CN1998168B (zh) * | 2004-02-19 | 2011-04-06 | 兰德马克数字服务有限责任公司 | 用于广播源辨识的方法与装置 |
US20050198006A1 (en) * | 2004-02-24 | 2005-09-08 | Dna13 Inc. | System and method for real-time media searching and alerting |
US20080270373A1 (en) * | 2004-05-28 | 2008-10-30 | Koninklijke Philips Electronics, N.V. | Method and Apparatus for Content Item Signature Matching |
CN1842151A (zh) * | 2005-03-30 | 2006-10-04 | 株式会社东芝 | 信息处理装置和方法 |
US20060271947A1 (en) * | 2005-05-23 | 2006-11-30 | Lienhart Rainer W | Creating fingerprints |
CN100485780C (zh) * | 2005-10-31 | 2009-05-06 | 浙江大学 | 基于基音频率的快速音频分割方法 |
US7991770B2 (en) * | 2005-11-29 | 2011-08-02 | Google Inc. | Detecting repeating content in broadcast media |
-
2008
- 2008-07-16 US US12/174,366 patent/US8238669B2/en active Active
- 2008-08-22 AU AU2008288797A patent/AU2008288797B2/en active Active
- 2008-08-22 JP JP2010522089A patent/JP5479340B2/ja active Active
- 2008-08-22 EP EP08798558.6A patent/EP2191400B1/en active Active
- 2008-08-22 WO PCT/US2008/074105 patent/WO2009026564A1/en active Application Filing
- 2008-08-22 CA CA2696890A patent/CA2696890C/en active Active
- 2008-08-22 CN CN2008801105573A patent/CN101821734B/zh active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010537585A5 (ja) | 時間ベースのメディア間のマッチの検出と分類 | |
JP5479340B2 (ja) | 時間ベースのメディア間のマッチの検出と分類 | |
US8358837B2 (en) | Apparatus and methods for detecting adult videos | |
US8316301B2 (en) | Apparatus, medium, and method segmenting video sequences based on topic | |
US7336890B2 (en) | Automatic detection and segmentation of music videos in an audio/video stream | |
US8849044B2 (en) | Method and apparatus for comparing videos | |
US6606409B2 (en) | Fade-in and fade-out temporal segments | |
KR100737176B1 (ko) | 신호 처리 방법 및 영상 음성 처리 장치 | |
US8731292B2 (en) | Method and apparatus for comparing videos | |
US20120148149A1 (en) | Video key frame extraction using sparse representation | |
US20130177252A1 (en) | Detecting Video Copies | |
JP5685324B2 (ja) | 映像を比較する方法および装置 | |
Chasanis et al. | Simultaneous detection of abrupt cuts and dissolves in videos using support vector machines | |
KR100779074B1 (ko) | 시간별 특징값을 이용한 유해 동영상 판별 방법 및 그 장치 | |
CN113987243A (zh) | 一种图像聚档方法、图像聚档装置和计算机可读存储介质 | |
Harvey et al. | Spatio-temporal video copy detection | |
Chan et al. | Shot boundary detection using genetic algorithm optimization | |
KR100656373B1 (ko) | 시간구간별 우선순위와 판별정책을 적용하는 유해 동영상판별 방법 및 그 장치 | |
Flexer et al. | Using mutual proximity for novelty detection in audio music similarity | |
Nhat et al. | Adaptive line fitting for staff detection in handwritten music score images | |
Chavan et al. | An efficient method for fade and dissolve detection in presence of camera motion & illumination | |
Cernekova et al. | Temporal video segmentation by graph partitioning | |
Guder et al. | Dichotomic decision cascading for video shot boundary detection | |
Zhu et al. | Scene segmentation and semantic representation for high-level retrieval | |
Zwicklbauer et al. | Improving scene detection algorithms using new similarity measures |