JP5297297B2 - 動画コンテンツ検出装置 - Google Patents

動画コンテンツ検出装置 Download PDF

Info

Publication number
JP5297297B2
JP5297297B2 JP2009186566A JP2009186566A JP5297297B2 JP 5297297 B2 JP5297297 B2 JP 5297297B2 JP 2009186566 A JP2009186566 A JP 2009186566A JP 2009186566 A JP2009186566 A JP 2009186566A JP 5297297 B2 JP5297297 B2 JP 5297297B2
Authority
JP
Japan
Prior art keywords
shot boundary
feature amount
shot
content
moving image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009186566A
Other languages
English (en)
Other versions
JP2011039776A (ja
Inventor
祐介 内田
真幸 橋本
暁夫 米山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2009186566A priority Critical patent/JP5297297B2/ja
Publication of JP2011039776A publication Critical patent/JP2011039776A/ja
Application granted granted Critical
Publication of JP5297297B2 publication Critical patent/JP5297297B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、動画コンテンツ検出装置に関する。
近年のブロードバンドの普及、およびHDD(Hard Disk Drive)、DVD(Digital Versatile Disk)、Blu-ray disc等のストレージの大容量化に伴って、デジタルコンテンツを著作権者やコンテンツプロバイダ(以下、「著作権者等」という)の許諾を得ずに、ネットワークを介して共有・公開することが容易になってきており、このような不正な共有・公開が問題となっている。このような問題に対して、デジタルコンテンツの指紋(特徴量)を利用して、複数のデジタルコンテンツの中から、著作権者等が自由配布を許諾していない特定のコンテンツを自動的に検出する技術が提案されている(特許文献1、2、非特許文献1参照)。
特許文献1では、三次元周波数解析と主成分分析を用いて、コンテンツの特徴量を記述し、特定のコンテンツを検出している。この手法では、空間周波数解析(DCT)で得られた係数に時間軸方向への周波数解析(FFT)を加えた三次元周波数解析を行ない、さらに主成分分析により三次元周波数解析で得られた係数から特徴量を抽出している。特許文献2では、特許文献1で利用されている特徴量を用いて、流通コンテンツと類似している特定コンテンツを絞り込み、絞り込めない場合には、位相限定相関法を用いて流通コンテンツと最も類似している特定コンテンツを決定し、閾値によって同一コンテンツであるか否かを判定している。
また、非特許文献1ではまず、映像から隣接フレームの輝度値の平均絶対誤差(Motion intensity)を求め、その平均絶対誤差が極値を取るフレームをキーフレームとする。次に各キーフレームからHarris detectorによってコーナーと呼ばれる特徴点を検出し、その周辺からGaussian derivativeを用いて特徴量を抽出する。その後、各特徴量とデータベースとのマッチング・投票を行い、投票数が多いコンテンツを不正流通コンテンツとして検出している。この手法では映像に時間的な編集が行なわれた場合であっても、不正流通コンテンツを検出できるようにしている。
特開2005−18675号公報 特開2006−285907号公報
J.Law-To et al.,“Video Copy Detection:A Comparative Study,”in Proc.ACM CIVR’07,pp.371-378,2007.
しかしながら、特許文献1および2で開示されている手法では、動画コンテンツ1つから1つの特徴量を抽出するため、例えば、動画コンテンツを分割する等の時間軸方向の編集が行われると検出ができなくなるという問題がある。一方、非特許文献1で開示されている手法では、下記の問題がある。まず、Motion intensityによってキーフレームを選択しているが、Motion intensityの極値がノイズに対して不安定であり、キーフレームがずれることによって精度が低下するという問題がある。また、Motion intensityによって抽出されるキーフレームの数がシーンによって異なり、冗長なキーフレームが抽出されることにより処理時間が増加するという問題がある。さらに、抽出されるGaussian derivative特徴量は圧縮ノイズ等に比較的敏感であるため、このようなノイズが付加された場合には精度が低下するという問題がある。
本発明は、このような事情に鑑みてなされたものであり、著作権者等が自由配布を許諾していないコンテンツの一部分を切り出すなど時間軸方向の編集が行われた不正流通コンテンツや、全体が圧縮ノイズなどによって劣化した不正流通コンテンツであっても、精度よくかつ高速に検出することができる技術を提供することを目的とする。
上記問題を解決するために、本発明の一態様である動画コンテンツ検出装置は、動画コンテンツのショット境界を検出するショット境界検出部と、前記ショット境界検出部によって検出されたショット境界の前後のフレームから特徴量を抽出するショット境界特徴量抽出部と、一の動画コンテンツに係る特徴量であって前記ショット境界特徴量抽出部によって抽出されたショット境界特徴量を、記憶部に記憶されている複数の動画コンテンツに係る前記ショット境界特徴量と照合する特徴量照合部とを備え、前記ショット境界検出部は、動画コンテンツを構成するフレームであって一定間隔毎に存在する所定のフレームの情報を用いて一定間隔内に前記ショット境界が存在するか否かを判定し、前記ショット境界が存在すると判定した一定間隔内の各フレーム間がショット境界であるか否かを判定して、動画コンテンツのショット境界を検出し、前記ショット境界特徴量抽出部は、前記ショット境界の前後のフレームの相関を基に前記ショット境界特徴量を抽出することを特徴とする。
上記問題を解決するために、本発明の他の態様である動画コンテンツ検出装置は、動画コンテンツのショット境界を検出するショット境界検出部と、前記ショット境界検出部によって検出されたショット境界の前後のフレームから特徴量を抽出するショット境界特徴量抽出部と、一の動画コンテンツに係る特徴量であって前記ショット境界特徴量抽出部によって抽出されたショット境界特徴量を、記憶部に記憶されている複数の動画コンテンツに係る前記ショット境界特徴量と照合する特徴量照合部とを備え、前記ショット境界検出部は、動画コンテンツを構成するフレームであって一定間隔毎に存在する所定のフレームの情報を用いて一定間隔内に前記ショット境界が存在するか否かを判定し、前記ショット境界が存在すると判定した一定間隔内の各フレーム間がショット境界であるか否かを判定して、動画コンテンツのショット境界を検出し、前記ショット境界特徴量抽出部は、前記ショット境界の前後のフレームをそれぞれ複数のブロックに分割し、これら複数のブロックから一定個数のブロックの組を作成し、それらブロックの組の相関を基に前記ショット境界特徴量を抽出することを特徴とする。
上記問題を解決するために、本発明の他の態様である動画コンテンツ検出装置は、動画コンテンツのショット境界を検出するショット境界検出部と、前記ショット境界検出部によって検出されたショット境界の前後のフレームから特徴量を抽出するショット境界特徴量抽出部と、一の動画コンテンツに係る特徴量であって前記ショット境界特徴量抽出部によって抽出されたショット境界特徴量を、記憶部に記憶されている複数の動画コンテンツに係る前記ショット境界特徴量と照合する特徴量照合部とを備え、前記ショット境界検出部は、動画コンテンツを構成するフレームであって一定間隔毎に存在する所定のフレームの情報を用いて一定間隔内に前記ショット境界が存在するか否かを判定し、前記ショット境界が存在すると判定した一定間隔内の各フレーム間がショット境界であるか否かを判定して、動画コンテンツのショット境界を検出し、前記ショット境界特徴量抽出部は、前記ショット境界の前後のフレームをそれぞれ複数のブロックに分割し、これら複数のブロックから一定個数のブロックの組を作成し、ブロックの組の平均輝度の大小関係、動き強度の大小関係、エッジ量の大小関係の少なくとも1つを基に前記ショット境界特徴量を抽出することを特徴とする。
上記問題を解決するために、本発明の他の態様である動画コンテンツ検出装置は、動画コンテンツのショット境界を検出するショット境界検出部と、前記ショット境界検出部によって検出されたショット境界の前後のフレームから特徴量を抽出するショット境界特徴量抽出部と、一の動画コンテンツに係る特徴量であって前記ショット境界特徴量抽出部によって抽出されたショット境界特徴量を、記憶部に記憶されている複数の動画コンテンツに係る前記ショット境界特徴量と照合する特徴量照合部とを備え、前記ショット境界の前後のフレームは、それぞれ複数のブロックに分割されるものであり、前記ショット境界検出部は、動画コンテンツを構成するフレームであって一定間隔毎に存在する所定のフレームの情報を用いて一定間隔内に前記ショット境界が存在するか否かを判定し、前記ショット境界が存在すると判定した一定間隔内の各フレーム間がショット境界であるか否かを判定して、動画コンテンツのショット境界を検出し、前記特徴量照合部は、前記一の動画コンテンツに係る前記ショット境界特徴量と前記記憶部に記憶されている動画コンテンツに係る前記ショット境界特徴量との距離を算出し、当該距離に基づいて前記一の動画コンテンツと前記記憶部に記憶されている動画コンテンツとを照合し、前記距離算出において、前記複数のブロックから得られる一定個数のブロックの組のうち、平均輝度、動き強度、エッジ量が近いブロックの組の大小関係は利用しないことを特徴とする。
上記動画コンテンツ検出装置において、前記所定のフレームは、圧縮後の動画コンテンツを構成するフレームのうち他のフレームを参照することなくデコードできるフレームであってもよい。
本発明によれば、著作権者等が自由配布を許諾していないコンテンツの一部分を切り出すなど時間軸方向の編集が行われた不正流通コンテンツや、全体が圧縮ノイズなどによって劣化した不正流通コンテンツであっても、精度よくかつ高速に検出することができるようになる。
本発明の一実施形態による動画コンテンツ検出装置1の機能ブロック図である。 ショット境界検出部10の動作の一例を示すフローチャートである。 ショット境界検出部10の動作を説明する説明図である。 ショット境界特徴量抽出部20の動作を説明する説明図である。 特徴量照合部40の動作を説明する説明図である。
以下、本発明の一実施形態について図面を参照して説明する。本発明の一実施形態による動画コンテンツ検出装置1は、検査対象の動画コンテンツ(クエリコンテンツ)の特徴量と、著作権者等が自由配布を許諾していない特定のコンテンツ(以下、「リファレンスコンテンツ」という)の特徴量とを用いて、不正流通コンテンツと推測されるクエリコンテンツを検出する。動画コンテンツ検出装置1は、図1(a)に示すように、ショット境界検出部10、ショット境界特徴量抽出部20、特徴量登録部30、特徴量照合部40およびデータベース(記憶部)50を備える。
ショット境界検出部10は、動画コンテンツ(リファレンスコンテンツおよびクエリコンテンツ)のショット境界を検出する。具体的には、まず、ショット境界検出部10は、動画コンテンツを構成するフレームであって一定間隔毎に存在する所定のフレームの情報を用いて一定間隔内にショット境界が存在するか否かを判定する。所定のフレームは、例えば、圧縮された動画コンテンツを構成するフレームのうち他のフレームを参照することなくデコードできるフレーム、即ち、該フレーム単独でデコードできるフレームである。GOP(Group of Picture)におけるIフレーム(Intra Picture)は、上記所定のフレームに相当する。
続いて、ショット境界検出部10は、ある一定間隔内にショット境界が存在すると判定した場合、当該一定間隔内の各フレーム間について、各フレーム間がショット境界に該当するか否かを更に判定する。一方、ショット境界検出部10は、ショット境界が存在しないと判定した一定間隔内の各フレーム間については、各フレーム間がショット境界に該当するか否かを更に判定しない。即ち、ショット境界検出部10は、所定のフレームの情報を用いて各一定間隔のショット境界の存否を判定し、ショット境界が存在すると判定した一定間隔内からのみショット境界を検出する。
ショット境界を検出したショット境界検出部10は、ショット境界の前後2枚のフレームをキーフレームとして抽出する。以下、キーフレームとして抽出した前後2枚のフレームをキーフレームペアともいう。キーフレームペアを抽出したショット境界検出部10は、抽出したキーフレームペアをショット境界特徴量抽出部20に供給する。
以下、図2乃至図4を用いてショット境界検出部10の動作を詳細に説明する。なお、ショット境界検出部10において利用する特徴量は、例えば、下記参考文献1に記載の特徴量としてもよいが、高速化のために単体で最も精度が高いとされる色ヒストグラム間のカイ二乗値とする。
(参考文献1)K.Matsumoto,M.Naito,K.Hoashi,and F.Sugaya,“SVM-Based Shot Boundary Detection With a Novel Feature,”in Proc.of ICME’06, pp.1837-1840,2006.
図2のフローチャートに示すように、ショット境界検出部10は、まず、動画コンテンツ(リファレンスコンテンツおよびクエリコンテンツ)内のあるGOPに係るIフレームを抽出する(ステップS10)。例えば、ショット境界検出部10は、本処理を実行する毎に、動画コンテンツの先頭から順にIフレームを抽出する。
ショット境界検出部10は、当該Iフレームを含むGOP内にショット境界が存在するか否かを判定する(ステップS20)。以下、あるGOP内にショット境界が存在するか否かを判定する処理をGOPレベルショット境界検出処理という。
図3(a)は、GOPレベルショット境界判定処理に利用する特徴量の抽出法を示す概念図である。ショット境界検出部10は、例えば、GOPレベルショット境界判定処理の判定対象となるGOP、即ち当該Iフレームを含むGOPの前後各N個のIフレームから特徴量を抽出する。
具体的には、まず、ショット境界検出部10は、各IフレームをX×Y個の領域に等分割し、等分割後の各領域から色ヒストグラムを抽出する。なお、上記参考文献1では、Ohtaの色空間でのヒストグラムを利用しているが、色空間の変換に必要な計算量を省くためYCbCr色空間でのヒストグラムを利用する。次に、ショット境界検出部10は、隣接するIフレームの同一の領域のヒストグラム間距離として、下記式(1)を用いてカイ二乗値dを算出する。
Figure 0005297297
次に、ショット境界検出部10は、SVM判別に利用する特徴量として、下記式(2)を用いて、全ての隣接Iフレーム間の全ての領域に対するカイ二乗値dであるVinterを算出する。
Figure 0005297297
ショット境界検出部10は、上記特徴量を利用し、予めショット境界のラベリングを行ったコンテンツを利用し、当該Iフレームを含むGOP内にショット境界が存在する特徴を正例、それ以外の特徴を負例として学習しておくことでGOPレベルショット境界判定処理を実現する。
ショット境界検出部10は、GOPレベルショット境界検出処理の結果、当該Iフレームを含むGOP内にショット境界が存在すると判定した場合(ステップS20:Yes)、当該GOP内のあるフレーム間がショット境界に該当するか否かを判定する(ステップS30)。例えば、ショット境界検出部10は、本処理を実行する毎に、当該GOPの先頭のフレーム間から順に、ショット境界に該当するか否かを判定する。以下、あるフレーム間がショット境界に該当するか否かを判定する処理をフレームレベルショット境界検出処理という。即ち、ショット境界検出部10は、GOPレベルショット境界検出処理においてGOP内にショット境界が存在すると判定されたGOPについて、フレームレベルショット境界検出処理を実行する。
図3(b)は、フレームレベルショット境界判定処理に利用する特徴量の抽出法を示す概念図である。フレームレベルショット境界判定処理において利用する特徴量は、図3(b)に示す通り、GOPレベル境界検出処理で利用した特徴量とほぼ同じである。但し、特徴量を抽出するフレームが、判定対象のGOP外に存在する場合は、不要なデコード処理の発生を防ぐため、判定対象のGOP外に存在するフレームとの間のカイ二乗値dを実際には求めずにショット境界でないフレーム間のカイ二乗値の平均値を利用する。
ショット境界検出部10は、フレームレベルショット境界検出処理の結果、当該GOP内の当該フレーム間がショット境界に該当すると判定した場合(ステップS30:Yes)、当該フレーム間の前後のキーフレームペアを抽出する(ステップS40)。なお、キーフレームペアを抽出したショット境界検出部10は、ショット境界に該当すると判定した当該フレーム間の時刻(例えば、コンテンツの先頭からの時刻。以下、「ショット境界時刻」という)に対応付けて当該キーフレームペアを一時記憶する。
ショット境界検出部10は、当該GOP内の当該フレーム間がショット境界に該当しないと判定した場合(ステップS30:No)、または、キーフレームペアを抽出した場合(ステップS40)、当該GOP内の全フレーム間を対象にフレームレベルショット境界判定処理を実施したか否かを判断する(ステップS50)。ショット境界検出部10は、当該GOP内の全フレーム間を対象にフレームレベルショット境界判定処理を実施していないと判断した場合(ステップS50:No)、ステップS30に戻って、当該GOP内の次のフレーム間がショット境界に該当するか否かを判定する(ステップS30)。
ショット境界検出部10は、当該Iフレームを含むGOP内にショット境界が存在しないと判定した場合(ステップS20:No)、または、当該GOP内の全フレーム間を対象にフレームレベルショット境界判定処理を実施したと判断した場合(ステップS50:Yes)、当該コンテンツ内の全GOPを対象にGOPレベルショット境界判定処理を実施したか否かを判断する(ステップS60)。ショット境界検出部10は、当該コンテンツ内の全GOPを対象にGOPレベルショット境界判定処理を実施していないと判断した場合(ステップS60:No)、ステップS10に戻って、当該コンテンツ内の次のGOPに係るIフレームを抽出する(ステップS10)。
ショット境界検出部10は、当該コンテンツ内の全GOPを対象にGOPレベルショット境界判定処理を実施したと判断した場合(ステップS60:Yes)、コンテンツを識別するコンテンツIDとともに、一時記憶しているショット境界時刻とキーフレームペアとをショット境界特徴量抽出部20に供給し、本フローチャートは終了する。
以上説明した様に、ショット境界検出においては、圧縮されたコンテンツの基本構造であるGOPに着目し、フレームレベルショット境界判定処理に先立ってGOPレベルショット境界検出処理を実行している。従って、デコード等の処理時間が削減され、ショット境界の検出処理が高速化する。なお、動画コンテンツの符号化情報を利用することによって、全フレームをデコードすることなく、ショット境界を高速に検出する手法が存在するが、当該方法は、特定のコーデックに依存した符号化情報を利用するため、特定のコーデックで圧縮された動画コンテンツのみにしか適用できず、汎用的ではない。
ショット境界特徴量抽出部20は、ショット境界検出部10から、コンテンツIDとショット境界時刻とキーフレームペアとを取得する。ショット境界特徴量抽出部20は、ショット境界検出部10から取得したキーフレームペアから特徴量(以下、「ショット境界特徴量」という)を抽出する。
具体的には、ショット境界特徴量抽出部20は、各キーフレームの相関を基にショット境界特徴量を抽出する。例えば、ショット境界特徴量抽出部20は、各キーフレームをそれぞれ複数のブロックに分割し、これら複数のブロックから一定個数のブロックの組を作成し、それらブロックの組の相関を基にショット境界特徴量を抽出する。例えば、ショット境界特徴量抽出部20は、ブロックの組の平均輝度、動き強度、エッジ量の大小関係の少なくとも1つを基にショット境界特徴量を抽出する。
リファレンスコンテンツのショット境界特徴量を抽出したショット境界特徴量抽出部20は、当該リファレンスコンテンツに係るショット情報(コンテンツID、ショット境界時刻、ショット境界特徴量)を特徴量登録部30に供給する。クエリコンテンツのショット境界特徴量を抽出したショット境界特徴量抽出部20は、当該クエリコンテンツに係るショット情報(コンテンツID、ショット境界時刻、ショット境界特徴量)を特徴量照合部40に供給する。なお、ショット境界特徴量抽出部20は、例えば、ユーザからの入力に基づいて、当該コンテンツがリファレンスコンテンツであるかクエリコンテンツであるかを判断してもよい。例えば、動画コンテンツ検出装置はユーザからのモード選択を受け付けるモード選択受付部(非図示)を備え、モード選択受付部を介してリファレンスコンテンツのショット境界特徴量をデータベース50に登録する登録モードを受け付けた場合には、ショット境界特徴量抽出部20は当該コンテンツがリファレンスコンテンツであると判断し、クエリコンテンツとリファレンスコンテンツとを照合する照合モードを受け付けた場合には、ショット境界特徴量抽出部20は当該コンテンツがクエリコンテンツであると判断する。
以下、ショット境界特徴量抽出部20がブロックの組のエッジ量の大小関係を基にショット境界特徴量を抽出する例を説明する。まず、ショット境界特徴量抽出部20は、各キーフレームをそれぞれN×M個の領域に分割する。次に、ショット境界特徴量抽出部20は、下記式(3)または下記式(4)を用いて、分割後の各領域のエッジ量E(i,j)を算出する。
Figure 0005297297
次に、ショット境界特徴量抽出部20は、図4に示すように、下記式(5)(6)にて表されるN×Mビットのショット境界特徴量B(i,j)を算出する。但し、エッジ量E(i,j)はショット境界の前のキーフレーム、エッジ量E(i,j)はショット境界の後のキーフレームである。
Figure 0005297297
以上説明した様に、ショット境界特徴量の抽出においては、ビット表現されるショット境界特徴量を生成するため、XORによる高速な特徴量間の距離計算が可能になる。また、データベース50の登録(蓄積)コストの削減が可能になる。なお、画像をビット列表現する手法は複数存在するが、それらの主な課題はロバスト性である。ロバスト性とは、画像に何らかの改変が加えられた際に、特徴量がなるべく変化しない特性のことである。従来の手法は、主にロゴやキャプション等のパターンが挿入された際に、大きく特徴量が変化してしまうという課題があった。本実施形態の手法では、1枚のフレームから特徴量を抽出するのではなく、キーフレームペア、すなわち2枚のキーフレームの相関情報を利用して特徴量を抽出するため、パターン挿入を含む様々な改変にロバストな特徴量を抽出することができる。
なお、具体例として、ショット境界特徴量抽出部20がブロックの組のエッジ量の大小関係を基にショット境界特徴量を抽出する例を説明したが、平均輝度、動き強度の大小関係を基に境界特徴量を抽出する場合も同様である。
特徴量登録部30は、ショット境界特徴量抽出部20から、リファレンスコンテンツに係るショット情報(コンテンツID、ショット境界時刻、ショット境界特徴量)を取得する。リファレンスコンテンツに係るショット情報を取得した特徴量登録部30は、当該リファレンスコンテンツに係るショット情報をデータベース50に登録(記憶)する。なお、特徴量登録部30は、ショット境界特徴量のハッシュ値を算出し、当該ハッシュ値をハッシュキーとして、各ショット情報を複数のハッシュテーブルに記憶する。なお、ハッシングは、例えば、下記参考文献2に記載のLocal Sensitive Hashingを利用してもよい。
(参考文献2)Datar,M.,N.Immorlica,P.Indyk and V.Mirrokni,“Locality-Sensitive Hashing Scheme Based on p-Stable Distributions,” Proceedings of the 20th Symposium on Computational Geometry,pp.253-262,2004.
以上説明した様に、特徴量の登録においては、各ショット情報は、ショット境界特徴量を基に、例えばLocal Sensitive Hashingによって複数のハッシュテーブルに登録されるため、探索処理が高速化する。
データベース50は、リファレンスコンテンツに係るショット情報(コンテンツID、ショット境界の時刻、ショット境界特徴量)が登録(記憶)されている。なお、上述の如く、各ショット情報は、ショット境界特徴量をハッシュキーとして、複数のハッシュテーブルに登録されている。
特徴量照合部40は、ショット境界特徴量抽出部20から、クエリコンテンツに係るショット情報(コンテンツID、ショット境界時刻、ショット境界特徴量)を取得する。クエリコンテンツに係るショット情報を取得した特徴量照合部40は、当該クエリコンテンツに係るショット境界特徴量を、データベース50に記憶されている複数のリファレンスコンテンツに係るショット境界特徴量と照合する。即ち、特徴量照合部40は、クエリコンテンツのショット境界特徴量を取得した場合、リファレンスコンテンツのショット境界特徴量を予め登録しているデータベース50を参照し、クエリコンテンツがリファレンスコンテンツの少なくとも一部をコピーしたものに該当するか否かを照合する。
具体的には、まず、特徴量照合部40は、クエリコンテンツの各ショット境界のショット情報(ショット境界の時刻、ショット境界特徴量)を基に、クエリコンテンツと最も類似するリファレンスコンテンツの区間を推定し、当該区間の類似度と閾値とを利用してクエリコンテンツがリファレンスコンテンツのコピーであるか否かを判定する。類似するリファレンス区間の推定は、クエリコンテンツとリファレンスコンテンツのショット境界同士のマッチングを投票によって纏めることで実現する。また、当該区間の類似度は、当該区間の投票数に基づいて算出する。
以下、図5を用いて特徴量照合部40の動作を具体的に説明する。なお、データベース50には、複数のリファレンスコンテンツに係るショット情報(コンテンツID、ショット境界時刻、ショット境界特徴量)が登録されているものとする。
特徴量照合部40は、ショット境界特徴量抽出部20から、図5(a)に示すクエリコンテンツQに係るショット情報(コンテンツID、ショット境界時刻、ショット境界特徴量)を取得する。なお、ショット境界時刻tはショット境界Qのショット境界時刻、ショット境界時刻tはショット境界Qのショット境界時刻、ショット境界時刻tはショット境界Qのショット境界時刻であるものとする。
クエリコンテンツQに係るショット情報を取得した特徴量照合部40は、クエリコンテンツQの各ショット境界Q、Q、Qの各ショット特徴量と類似するショット特徴量を有するリファレンスコンテンツに係るショット境界をマッチングによってデータベース50から検索する。具体的には、特徴量照合部40は、クエリコンテンツとリファレンスコンテンツのショット特徴量同士の距離(類似度)が一定以下になるショット境界、または、当該ショット特徴量同士の距離が近い方から所定の個数のショット境界の何れかを類似するショット境界として検索する。
具体的には、特徴量照合部40は、上述のショット特徴量同士の距離は、例えば、クエリコンテンツに係るショット境界特徴量であるN×Mビット、リファレンスコンテンツに係るショット境界特徴量であるN×Mビットの同士のハミング距離として単純なビット操作によって高速に算出可能である。例えば、N×Mビットのクエリコンテンツに係るショット境界特徴量Bが下記式(7)、N×Mビットのリファレンスコンテンツに係るショット境界特徴量B’が下記式(8)によって表される場合、特徴量照合部40は、N×Mビットのビット列(B XOR B’)を生成し、当該ビット列(B XOR B’)に含まれる1の個数をBとB’のハミング距離として算出する。
Figure 0005297297
但し、特徴量照合部40は、平均輝度、動き強度、エッジ量が近いブロックの組の大小関係については、上記距離の算出対象から除外してもよい。例えば、エッジ量が近いブロックの組の大小関係を上記距離の算出対象から除外する場合、クエリコンテンツのショット境界の前後の各キーフレームのブロック(i,j)のエッジ量をE(i,j)およびE(i,j)とするとき、|E(i,j)−E(i,j)|が小さい方から一定個のブロックに相当するビットに関しては距離算出に利用しないようにしてもよい。カイ二乗値d(i,j)が小さいブロックは、E(i,j)とE(i,j)の大小関係が変わりやすいためビットの値の信頼性が低いためである。
なお、距離の算出に|E(i,j)−E(i,j)|が小さい方から一定個のブロックに相当するビットを利用しないときは、まず、特徴量照合部40は、下記式(9)によって表されるマスク特徴量H(i,j)を作成する。そして、特徴量照合部40は、上述のビット列(B XOR B’)に代えて、下記式(10)によって表されるN×Mビットのビット列Hを利用して、ビット列((B XOR B’) AND H)を生成し、生成したビット列((B XOR B’) AND H)に含まれる1の個数をBとB’のハミング距離として算出する。
Figure 0005297297
以上にようにして、特徴量照合部40は、例えば、図5(b)に示すように、リファレンスコンテンツAの各ショット境界A、A、A、A、A、リファレンスコンテンツBの各ショット境界B、B、Bを検索する。
リファレンスコンテンツに係るショット境界を検索した特徴量照合部40は、マッチングを行った全てのショット境界のペアに関して、(リファレンスコンテンツに係るショット境界の時刻−クエリコンテンツに係るショット境界の時刻)に投票を行う。当該投票は、コピー区間の先頭の推定である。即ち、当該投票は、図5(c)に示すように、マッチングが正しければ、実際のコピー区間の先頭と推定される時刻に集中し、マッチングが正しくなければ、分散する。従って、特徴量照合部40は、最も多くの投票が集中する時刻への投票数が閾値以上であるか否かを判定し、閾値以上であれば、当該時刻はコピー区間の先頭であると推定する。なお、最も多くの投票が集中する時刻はコピー区間の先頭であると推定した特徴量照合部40は、当該クエリコンテンツは不正流通コンテンツであると推測した旨の情報を外部に出力する。また、特徴量照合部40は、当該クエリコンテンツは不正流通コンテンツであると推測した旨の情報に代えてまたは加えて、例えば、クエリコンテンツおよびリファレンスコンテンツに係るショット情報、並びに、コピー区間の先頭位置を示す情報などを外部に出力してもよい。
以上説明したように、動画コンテンツ検出装置1は、クエリコンテンツの特徴量とリファレンスコンテンツの特徴量とを用いて、不正流通コンテンツと推測されるクエリコンテンツを検出する。動画コンテンツ検出装置1は、クエリコンテンツがリファレンスコンテンツの少なくとも一部を含む不正流通コンテンツであるか否かを判定する。
動画コンテンツ検出装置1では、ショット境界からキーフレームを抽出するため、ノイズにロバストかつ冗長でないキーフレームが抽出される。また、ショット境界の前後2枚のキーフレームの相関を基に算出した特徴量を利用するため、コンテンツの変容(例えば、編集、改変、ノイズ)に対してロバストなマッチングが可能になる。また、コンテンツ内の全フレームのデコードを要しないため、高速に検出することができる。即ち、動画コンテンツ検出装置1によれば、著作権者等が自由配布を許諾していないコンテンツの一部分を切り出すなど時間軸方向の編集が行われた不正流通コンテンツや、全体が圧縮ノイズなどによって劣化した不正流通コンテンツであっても、精度よくかつ高速に検出することができるようになる。
なお、動画コンテンツ検出装置1は、図1(a)に示すように、ショット境界検出部10、ショット境界特徴量抽出部20および特徴量照合部40に加え、特徴量登録部30およびデータベース50を備える例を説明したが、当該構成に限定されない。例えば、動画コンテンツ検出装置1は、図1(b)に示すように、ショット境界検出部10、ショット境界特徴量抽出部20および特徴量照合部40のみを備えてもよい。動画コンテンツ検出装置1は、図1(b)に示す構成の場合、上述のショット境界検出部10、ショット境界特徴量抽出部20および特徴量登録部30を備える外部の装置によってリファレンスコンテンツに係るショット情報が登録されている外部のデータベース50を参照し、不正流通コンテンツと推測されるクエリコンテンツを検出する。
なお、本発明の一実施形態による動画コンテンツ検出装置1の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、本発明の一実施形態による動画コンテンツ検出装置1の各処理に係る上述した種々の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
1 動画コンテンツ検出装置 10 ショット境界検出部 20 ショット境界特徴量抽出部 30 特徴量登録部 40 特徴量照合部 50 データベース(記憶部)

Claims (5)

  1. 動画コンテンツのショット境界を検出するショット境界検出部と、
    前記ショット境界検出部によって検出されたショット境界の前後のフレームから特徴量を抽出するショット境界特徴量抽出部と、
    一の動画コンテンツに係る特徴量であって前記ショット境界特徴量抽出部によって抽出されたショット境界特徴量を、記憶部に記憶されている複数の動画コンテンツに係る前記ショット境界特徴量と照合する特徴量照合部と
    を備え、
    前記ショット境界検出部は、
    動画コンテンツを構成するフレームであって一定間隔毎に存在する所定のフレームの情報を用いて一定間隔内に前記ショット境界が存在するか否かを判定し、前記ショット境界が存在すると判定した一定間隔内の各フレーム間がショット境界であるか否かを判定して、動画コンテンツのショット境界を検出し、
    前記ショット境界特徴量抽出部は、
    前記ショット境界の前後のフレームの相関を基に前記ショット境界特徴量を抽出する
    ことを特徴とする動画コンテンツ検出装置。
  2. 動画コンテンツのショット境界を検出するショット境界検出部と、
    前記ショット境界検出部によって検出されたショット境界の前後のフレームから特徴量を抽出するショット境界特徴量抽出部と、
    一の動画コンテンツに係る特徴量であって前記ショット境界特徴量抽出部によって抽出されたショット境界特徴量を、記憶部に記憶されている複数の動画コンテンツに係る前記ショット境界特徴量と照合する特徴量照合部と
    を備え、
    前記ショット境界検出部は、
    動画コンテンツを構成するフレームであって一定間隔毎に存在する所定のフレームの情報を用いて一定間隔内に前記ショット境界が存在するか否かを判定し、前記ショット境界が存在すると判定した一定間隔内の各フレーム間がショット境界であるか否かを判定して、動画コンテンツのショット境界を検出し、
    前記ショット境界特徴量抽出部は、
    前記ショット境界の前後のフレームをそれぞれ複数のブロックに分割し、これら複数のブロックから一定個数のブロックの組を作成し、それらブロックの組の相関を基に前記ショット境界特徴量を抽出する
    ことを特徴とする動画コンテンツ検出装置。
  3. 動画コンテンツのショット境界を検出するショット境界検出部と、
    前記ショット境界検出部によって検出されたショット境界の前後のフレームから特徴量を抽出するショット境界特徴量抽出部と、
    一の動画コンテンツに係る特徴量であって前記ショット境界特徴量抽出部によって抽出されたショット境界特徴量を、記憶部に記憶されている複数の動画コンテンツに係る前記ショット境界特徴量と照合する特徴量照合部と
    を備え、
    前記ショット境界検出部は、
    動画コンテンツを構成するフレームであって一定間隔毎に存在する所定のフレームの情報を用いて一定間隔内に前記ショット境界が存在するか否かを判定し、前記ショット境界が存在すると判定した一定間隔内の各フレーム間がショット境界であるか否かを判定して、動画コンテンツのショット境界を検出し、
    前記ショット境界特徴量抽出部は、
    前記ショット境界の前後のフレームをそれぞれ複数のブロックに分割し、これら複数のブロックから一定個数のブロックの組を作成し、ブロックの組の平均輝度の大小関係、動き強度の大小関係、エッジ量の大小関係の少なくとも1つを基に前記ショット境界特徴量を抽出する
    ことを特徴とする動画コンテンツ検出装置。
  4. 動画コンテンツのショット境界を検出するショット境界検出部と、
    前記ショット境界検出部によって検出されたショット境界の前後のフレームから特徴量を抽出するショット境界特徴量抽出部と、
    一の動画コンテンツに係る特徴量であって前記ショット境界特徴量抽出部によって抽出されたショット境界特徴量を、記憶部に記憶されている複数の動画コンテンツに係る前記ショット境界特徴量と照合する特徴量照合部と
    を備え、
    前記ショット境界の前後のフレームは、それぞれ複数のブロックに分割されるものであり、
    前記ショット境界検出部は、
    動画コンテンツを構成するフレームであって一定間隔毎に存在する所定のフレームの情報を用いて一定間隔内に前記ショット境界が存在するか否かを判定し、前記ショット境界が存在すると判定した一定間隔内の各フレーム間がショット境界であるか否かを判定して、動画コンテンツのショット境界を検出し、
    前記特徴量照合部は、
    前記一の動画コンテンツに係る前記ショット境界特徴量と前記記憶部に記憶されている動画コンテンツに係る前記ショット境界特徴量との距離を算出し、当該距離に基づいて前記一の動画コンテンツと前記記憶部に記憶されている動画コンテンツとを照合し、
    前記距離算出において、前記複数のブロックから得られる一定個数のブロックの組のうち、平均輝度、動き強度、エッジ量が近いブロックの組の大小関係は利用しない
    ことを特徴とする動画コンテンツ検出装置。
  5. 前記所定のフレームは、
    圧縮後の動画コンテンツを構成するフレームのうち他のフレームを参照することなくデコードできるフレームであることを特徴とする請求項1乃至請求項4の何れか1項に記載の動画コンテンツ検出装置。
JP2009186566A 2009-08-11 2009-08-11 動画コンテンツ検出装置 Expired - Fee Related JP5297297B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009186566A JP5297297B2 (ja) 2009-08-11 2009-08-11 動画コンテンツ検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009186566A JP5297297B2 (ja) 2009-08-11 2009-08-11 動画コンテンツ検出装置

Publications (2)

Publication Number Publication Date
JP2011039776A JP2011039776A (ja) 2011-02-24
JP5297297B2 true JP5297297B2 (ja) 2013-09-25

Family

ID=43767482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009186566A Expired - Fee Related JP5297297B2 (ja) 2009-08-11 2009-08-11 動画コンテンツ検出装置

Country Status (1)

Country Link
JP (1) JP5297297B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6340668B2 (ja) * 2012-02-29 2018-06-13 グローバル ファイル システムズ ホールディングス、エルエルシー ストリーム認識およびフィルタリング

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100698106B1 (ko) * 2000-03-07 2007-03-26 엘지전자 주식회사 엠펙(mpeg)압축 비디오 환경에서 계층적 혼합형장면 변화 검출 방법

Also Published As

Publication number Publication date
JP2011039776A (ja) 2011-02-24

Similar Documents

Publication Publication Date Title
US9177209B2 (en) Temporal segment based extraction and robust matching of video fingerprints
US9185338B2 (en) System and method for fingerprinting video
US8175413B1 (en) Video identification through detection of proprietary rights logos in media
JP4810096B2 (ja) デジタルマルチメディアデータのための非同期化フィンガープリンティングの方法およびシステム
US8051492B2 (en) System and method for tracing tardos fingerprint codes
JP5878238B2 (ja) 映像を比較するための方法および装置
EP3189469A1 (en) A method for selecting frames from video sequences based on incremental improvement
Lian et al. Content-based video copy detection–a survey
GB2464123A (en) Event-based temporal video fingerprinting
Küçüktunç et al. Video copy detection using multiple visual cues and MPEG-7 descriptors
KR101129328B1 (ko) 타겟 추적 장치 및 방법
Kim et al. Adaptive weighted fusion with new spatial and temporal fingerprints for improved video copy detection
Roopalakshmi et al. A novel spatio-temporal registration framework for video copy localization based on multimodal features
KR101803066B1 (ko) 불법 복제된 서적의 통합 식별 시스템 및 방법
Yeh et al. A compact, effective descriptor for video copy detection
KR101373176B1 (ko) 복제 동영상정보 검출방법 및 장치, 저장매체
JP2010186307A (ja) 動画コンテンツ識別装置および動画コンテンツ識別方法
JP5297297B2 (ja) 動画コンテンツ検出装置
Su et al. Efficient copy detection for compressed digital videos by spatial and temporal feature extraction
JP2010263327A (ja) 特徴量算出装置およびプログラム
KR101033296B1 (ko) 방송통신시스템에서 시공간적 특징정보 추출 및 비교판별 장치 및 방법
Steinebach et al. FaceHash: face detection and robust hashing
Kim et al. Multimedia file forensics system exploiting file similarity search
Bhaumik et al. Real-time storyboard generation in videos using a probability distribution based threshold
Chen et al. Copy-Move Forgery Detection in Homologous Video Sequences Based on Deviation Matrix

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120229

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20130311

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130614

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees