JP6089830B2 - 映像特徴生成システム、映像特徴生成方法、映像特徴生成プログラム、映像照合システム、映像照合方法、映像照合プログラム - Google Patents

映像特徴生成システム、映像特徴生成方法、映像特徴生成プログラム、映像照合システム、映像照合方法、映像照合プログラム Download PDF

Info

Publication number
JP6089830B2
JP6089830B2 JP2013054894A JP2013054894A JP6089830B2 JP 6089830 B2 JP6089830 B2 JP 6089830B2 JP 2013054894 A JP2013054894 A JP 2013054894A JP 2013054894 A JP2013054894 A JP 2013054894A JP 6089830 B2 JP6089830 B2 JP 6089830B2
Authority
JP
Japan
Prior art keywords
video
frame
frequency
feature
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013054894A
Other languages
English (en)
Other versions
JP2014182440A (ja
Inventor
昌平 中潟
昌平 中潟
阿南 泰三
泰三 阿南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013054894A priority Critical patent/JP6089830B2/ja
Priority to US14/075,268 priority patent/US9141861B2/en
Publication of JP2014182440A publication Critical patent/JP2014182440A/ja
Application granted granted Critical
Publication of JP6089830B2 publication Critical patent/JP6089830B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Description

本発明は、映像特徴生成システム、映像特徴生成方法、映像特徴生成プログラム、映像照合システム、映像照合方法、及び映像照合プログラムに関する。
投稿された映像を誰もがいつでも閲覧できる投稿サイトが知られている。投稿サイトには、例えば著作権を侵害する不正な映像(例えば、テレビ番組や映画など)が投稿されている場合がある。近年、投稿サイトには莫大な量の映像が投稿されている。このため、目視やキーワードを利用した検索結果により不正な映像であるか否かを見分けることは極めて困難である。したがって、映像の同一性を効率的に判断できる技術が求められている。
映像の同一性を判断する技術として、映像中のさまざまな部分領域間の輝度の大小関係を−1,0,1の3つの値で表した特徴量を映像毎に算出し、算出された特徴量同士を照合させて一致する度合いが閾値よりも大きい場合に同一の映像と判断する技術が知られている(例えば、特許文献1参照)。また、照合の際に周波数の位相を利用する技術も知られている(例えば、特許文献2及び特許文献3参照)
特開2011−118498号公報 特開2009−3889号公報 特開2001−109494号公報
しかしながら、上述した特許文献1では映像の部分領域を用いて特徴量を算出しているため、例えば映像の改変により映像の縦と横の比率が変更されたり、映像の端部が不要なために削除されたり(例えばクロッピング)すると、映像の同一性を判断する精度が下がる。また、上述した特許文献2は静止画を照合の対象にしており、特許文献3は音声を照合の対象にしている。
そこで、1つの側面では、本発明は、映像が改変されても、改変前後の映像照合に関し改変の影響を受けにくい映像特徴を生成する映像特徴生成システム、映像特徴生成方法、及び映像特徴生成プログラムを提供する。また、他の側面では、映像が改変されても、改変前後の映像照合に関し改変の影響を受けにくい照合を行える映像照合システム、映像照合方法、及び映像照合プログラムを提供する。
本明細書に開示の映像特徴生成システムは、入力された映像を構成する単位としてのフレームの画素値の平均値に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出手段と、少なくとも2つの周波数と前記抽出手段によって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成手段と、を有する映像特徴生成システムである。
また、本明細書に開示の映像特徴生成システムは、入力された映像を構成する単位としてのフレームの画素値の分散に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出手段と、少なくとも2つの周波数と前記抽出手段によって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成手段と、を有する映像特徴生成システムである。
本明細書に開示の映像特徴生成方法は、コンピュータが、入力された映像を構成する単位としてのフレームの画素値の平均値に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出ステップと、少なくとも2つの周波数と前記抽出ステップによって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成ステップと、を実行する映像特徴生成方法である。
また、本明細書に開示の映像特徴生成方法は、コンピュータが、入力された映像を構成する単位としてのフレームの画素値の分散に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出ステップと、少なくとも2つの周波数と前記抽出ステップによって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成ステップと、を実行する映像特徴生成方法である。
本明細書に開示の映像特徴生成プログラムは、入力された映像を構成する単位としてのフレームの画素値の平均値に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出ステップと、少なくとも2つの周波数と前記抽出ステップによって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成ステップと、をコンピュータに実行させるための映像特徴生成プログラムである。
また、本明細書に開示の映像特徴生成プログラムは、入力された映像を構成する単位としてのフレームの画素値の分散に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出ステップと、少なくとも2つの周波数と前記抽出ステップによって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成ステップと、をコンピュータに実行させるための映像特徴生成プログラムである。
本明細書に開示の映像照合システムは、入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値の平均値に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出手段と、少なくとも2つの周波数と前記抽出手段によって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成手段と、前記生成手段によって生成された第1の映像特徴と第2の映像特徴とを照合する照合手段と、を有する映像照合システムである。
また、本明細書に開示の映像照合システムは、入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値の分散に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出手段と、少なくとも2つの周波数と前記抽出手段によって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成手段と、前記生成手段によって生成された第1の映像特徴と第2の映像特徴とを照合する照合手段と、を有する映像照合システムである。
本明細書に開示の映像照合方法は、コンピュータが、入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値の平均値に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出ステップと、少なくとも2つの周波数と前記抽出ステップによって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成ステップと、前記生成ステップによって生成された第1の映像特徴と第2の映像特徴とを照合する照合ステップと、を実行する映像照合方法である。
また、本明細書に開示の映像照合方法は、コンピュータが、入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値の分散に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出ステップと、少なくとも2つの周波数と前記抽出ステップによって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成ステップと、前記生成ステップによって生成された第1の映像特徴と第2の映像特徴とを照合する照合ステップと、を実行する映像照合方法である。
本明細書に開示の映像照合プログラムは、入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値の平均値に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出ステップと、少なくとも2つの周波数と前記抽出ステップによって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成ステップと、前記生成ステップによって生成された第1の映像特徴と第2の映像特徴とを照合する照合ステップと、をコンピュータに実行させるための映像照合プログラムである。
また、本明細書に開示の映像照合プログラムは、入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値の分散に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出ステップと、少なくとも2つの周波数と前記抽出ステップによって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成ステップと、前記生成ステップによって生成された第1の映像特徴と第2の映像特徴とを照合する照合ステップと、をコンピュータに実行させるための映像照合プログラムである。
本明細書に開示の映像特徴生成システム、映像特徴生成方法、及び映像特徴生成プログラムによれば、映像が改変されても、改変前後の映像照合に関し改変の影響を受けにくい映像特徴が生成される。また、本明細書に開示の映像照合システム、映像照合方法、及び映像照合プログラムによれば、映像が改変されても、改変前後の映像照合に関し改変の影響を受けにくい照合が行える。
図1(a)は、映像特徴生成システム及び映像照合システムを例示するブロック図である。図1(b)は、映像特徴テーブルの一例である。 図2は、映像特徴生成システムのハードウェア構成の一例である。 図3は、第1実施形態における映像特徴生成システムで実行される処理ステップを例示するフローチャートである。 図4は、第1実施形態における映像特徴が生成される様子を例示する図である。 図5は、第1実施形態における映像照合システムで実行される処理ステップを例示するフローチャートである。 図6は、第1実施形態における映像照合の様子を例示する図である。 図7は、第2実施形態における映像特徴生成システムで実行される処理ステップを例示するフローチャートである。 図8は、第2実施形態における映像特徴が生成される様子を例示する図である。 図9は、第2実施形態における映像照合システムで実行される処理ステップを例示するフローチャートである。 図10は、第2実施形態における映像照合の様子を例示する図である。
以下、本発明を実施するための形態について図面を参照して説明する。
(第1実施形態)
図1(a)は、映像特徴生成システム100及び映像照合システム400を例示するブロック図である。図1(b)は、映像特徴テーブルの一例である。
映像特徴生成システム100は、図1(a)に示すように、フレーム特徴量抽出部101、第1の周波数選択部102、位相生成部103、及び位相登録部104を備えている。
映像照合システム400は、図1(a)に示すように、フレーム特徴量抽出部101、位相生成部103、第2の周波数選択部401、映像特徴照合部402を備えている。
このように、フレーム特徴量抽出部101及び位相生成部103は、映像特徴生成システム100でも映像照合システム400でも利用される。尚、映像特徴生成システム100と映像照合システム400を1つに纏めて映像検査装置や映像検査システムとしてもよい。また、映像特徴記憶部300は、映像特徴生成システム100及び映像照合システム400の外部に形成されているが、映像特徴生成システム100と映像照合システム400の少なくとも一方に含まれていてもよい。
まず、映像特徴生成システム100について説明する。
フレーム特徴量抽出部101は、入力された映像を構成する単位としてのフレームの画素値に基づいて、フレームを特徴付けるフレーム特徴量を抽出する。より詳しくは、フレーム特徴量抽出部101は、映像に含まれる複数のフレームにおけるそれぞれの画素値に基づいて、時系列のフレーム特徴量を抽出する。入力された映像としては、例えば映像が改変される前のオリジナル映像や映像が改変された後の映像がある。改変には、編集、改ざん、変化、変形、変換、伸縮、平行移動などが含まれる。改変された映像は、オリジナル映像との照合に用いられる画像である。映像は例えば動画とも呼ばれる。映像は連続した静止画を単位として構成される。この静止画がフレーム又はフレーム画像と呼ばれる。フレーム特徴量抽出部101は、フレームに含まれるすべての画素値に基づいて、フレーム特徴量を抽出する。この結果、例えば平均画素値や分散がフレーム特徴量として抽出される。映像に含まれる少なくとも1つのフレーム上の各位置における画素値がフレーム特徴量として抽出されてもよい。
第1の周波数選択部102は、フレーム特徴量抽出部101によって抽出されたフレーム特徴量に対するフーリエ変換の結果から少なくとも2つの周波数を選択する。フレーム特徴量抽出部101によって時系列のフレーム特徴量が抽出された場合には、時系列のフレーム特徴量に基づく周波数スペクトルから少なくとも2つの周波数が選択される。映像に含まれる少なくとも1つのフレーム上の各位置における画素値がフレーム特徴量として抽出された場合には、抽出されたフレーム特徴量に基づく周波数領域から水平方向成分と垂直方向成分とを含む少なくとも2つの周波数が選択される。例えば、周波数の強さを強い順位で並べて上位から少なくとも2つの周波数が選択されてもよい。また、初期設定又はデフォルトで少なくとも2つの周波数が予め定められていてもよい。初期設定又はデフォルトで予め定められた少なくとも3つの周波数から少なくとも2つの周波数が選択されてもよい。
位相生成部103は、少なくとも2つの周波数とフレーム特徴量抽出部101によって抽出されたフレーム特徴量と周波数及びフレーム特徴量に応じて周波数の位相を生成するための生成情報とに基づいて、周波数ごとの位相を映像特徴として生成する。映像特徴により映像は特徴付けられる。例えば、第1の周波数選択部102によって選択された少なくとも2つの周波数とフレーム特徴量抽出部101によって抽出された時系列のフレーム特徴量とに基づいて、周波数ごとの時系列の位相が映像特徴として生成される。また、映像に含まれる少なくとも1つのフレーム上の各位置における画素値がフレーム特徴量として抽出された場合には、第1の周波数選択部102によって選択された少なくとも2つの周波数とフレーム特徴量抽出部101によって抽出されたフレーム特徴量とに基づいて、周波数ごとの位相が映像特徴として生成される。
位相登録部104は、第1の周波数選択部102によって選択された少なくとも2つの周波数と位相生成部103によって生成された位相を含む映像特徴を映像特徴記憶部300に登録する。より詳しくは、位相登録部104は、位相とその位相を生成する際に利用した周波数とを関連付けて映像特徴IDを付与して映像特徴記憶部300に登録する。尚、映像特徴IDは、映像特徴を識別する識別情報である。
映像特徴記憶部300は、例えばハードディスクドライブを備えている。映像特徴記憶部300は、映像特徴テーブルを記憶する。映像特徴テーブルは、図1(b)に示すように、映像特徴ID、選択周波数、及び位相系列を映像特徴ID毎に含んでいる。1つの映像特徴IDには、少なくとも2つの周波数とそれぞれの周波数の位相系列が関連付けられる。一例を挙げると映像特徴ID「1」には、映像特徴として選択周波数「ω」、対応する位相系列「θ,θ,・・・,θ」、選択周波数「ω」、対応する位相系列「θ,θ,・・・,θ」が互いに関連付けられる。映像特徴IDは、例えば0以上の整数値で表される。少なくとも2つの周波数は、第1の周波数選択部102によって選択された周波数である。初期設定又はデフォルトで定められた少なくとも2つの周波数であってもよい。例えば、後述する第2実施形態にように、6つの周波数が選択された場合、映像特徴テーブルには6つの選択周波数とそれぞれの選択周波数の位相が含まれる。図1(b)に示すように、映像特徴ID「k」までの映像特徴が登録されている状態で、位相登録部104が新たな映像特徴を登録する場合、新たな映像特徴に映像特徴ID「k+1」を付与して登録する。このように、映像特徴記憶部300は、オリジナル映像の映像特徴が順次登録されていく。すなわち、オリジナル映像を特徴付ける映像特徴のデータベースが形成される。
次に、映像照合システム400について説明する。尚、フレーム特徴量抽出部101及び位相生成部103については既に説明したため、説明を省略する。
第2の周波数選択部401は、フレーム特徴量抽出部101によって抽出されたフレーム特徴量に対するフーリエ変換の結果から少なくとも2つの周波数を選択する。フレーム特徴量抽出部101によって時系列のフレーム特徴量が抽出された場合には、時系列のフレーム特徴量に基づく周波数スペクトルから少なくとも2つの周波数が選択される。映像に含まれる少なくとも1つのフレーム上の各位置における画素値がフレーム特徴量として抽出された場合には、抽出されたフレーム特徴量に基づく周波数領域から水平方向成分と垂直方向成分とを含む少なくとも2つの周波数が選択される。例えば、初期設定又はデフォルトで少なくとも2つの周波数が予め定められていてもよい。初期設定又はデフォルトで予め定められた少なくとも3つの周波数から少なくとも2つの周波数が選択されてもよい。一方、周波数の強さを強い順位で並べて上位から少なくとも2つの周波数が第1の周波数選択部102で選択されていた場合には、第2の周波数選択部401は、取りえるすべての周波数を周波数スペクトル又は周波数領域から選択する。
映像特徴照合部402は、位相生成部103によって生成された改変された映像の映像特徴とオリジナル映像の映像特徴とを照合する。具体的には、映像特徴照合部402は、まず第2の周波数選択部401によって選択された周波数と位相生成部103によって生成された改変された映像の位相に基づいて、改変された映像の映像特徴を生成する。次に、映像特徴照合部402は、映像特徴記憶部300に登録されたオリジナル映像の映像特徴を取得する。最後に、映像特徴照合部402は、改変された映像の映像特徴とオリジナル映像の映像特徴とを照合する。照合した結果、改変された映像の映像特徴と同一性を有すると判断されたオリジナル映像の映像特徴がある場合、その映像特徴に対応するオリジナル映像又はオリジナル映像に関連する情報を照合結果として出力する。一方、改変された映像の映像特徴と同一性を有すると判断されたオリジナル映像の映像特徴がない場合、照合失敗の旨を照合結果として出力する。尚、映像特徴照合部402は、位相登録部104からオリジナル映像の映像特徴を直接取得してもよい。
続いて、映像特徴生成システム100のハードウェア構成について図2を参照して説明する。
図2は、映像特徴生成システム100のハードウェア構成の一例である。
映像特徴生成システム100は、Central Processing Unit(CPU)100a、Random Access Memory(RAM)100b、Read Only Memory(ROM)100c、Hard Disc Drive(HDD)100dを含んでいる。映像特徴生成システム100は、入力Interface(I/F)100e、出力I/F100f、入出力I/F100gも含んでいる。映像特徴生成システム100は、ドライブ装置100h、通信インタフェース100iも含んでいる。これらの各機器100a〜100iは、バス100jによって互いに接続されている。少なくともCPU100aとRAM100bとが協働することによってコンピュータが実現される。
入力I/F100eには、入力装置510が接続される。入力装置としては、例えばキーボードやマウスなどがある。
出力I/F100fには、出力装置が接続される。出力装置としては、例えば表示装置520(例えば液晶ディスプレイ)や印刷装置530(例えばプリンタ)がある。
入出力I/F100gには、半導体メモリ540が接続される。半導体メモリ540としては、例えばUniversal Serial Bus(USB)メモリやフラッシュメモリなどがある。入出力I/F100gは、半導体メモリ540に記憶されたプログラムやデータを読み取る。
入力I/F100e、出力I/F100f、及び入出力I/F100gは、例えばUSBポートを備えている。
ドライブ装置100hには、可搬型記録媒体550が挿入される。可搬型記録媒体550としては、例えばCompact Disc(CD)−ROM、Digital Versatile Disc(DVD)といったリムーバブルディスクがある。ドライブ装置100hは、可搬型記録媒体550に記録されたプログラムやデータを読み込む。
通信I/F100iは、Local Area Network(LAN)インタフェース(例えばLANカード、ネットワークアダプタ)及びモデムを備えている。通信I/F100iには、ネットワーク560が接続される。ネットワーク560としては、例えばLAN、公衆回線網、インターネットがある。
上述したRAM100bは、ROM100cやHDD100d、半導体メモリ540に記憶された映像特徴生成プログラムを読み込む。RAM100bは、可搬型記録媒体550に記録された映像特徴生成プログラムを読み込む。読み込まれた映像特徴生成プログラムをCPU100aが実行することにより、映像特徴生成システム100の各機能101,・・・,104が実現される。また、映像特徴生成方法の各処理ステップも映像特徴生成システム100により実行される。映像特徴生成プログラムは、後述するフローチャートに応じたものとすればよい。
尚、映像照合システム400のハードウェア構成も基本的に映像特徴生成システム100のハードウェア構成と同様である。
次に、映像特徴生成システム100で実行される映像特徴生成方法について図3及び図4を参照して説明する。
図3は、第1実施形態における映像特徴生成システム100で実行される処理ステップを例示するフローチャートである。図4は、第1実施形態における映像特徴が生成される様子を例示する図である。
図3に示すように、フレーム特徴量抽出部101に映像が入力されると、フレーム特徴量抽出部101は入力された映像のフレーム特徴量をすべて抽出する(ステップS101)。映像は、オリジナル映像又は改変された映像である。図4(a)を参照して具体的に説明すると、映像には複数のフレームが含まれている。各フレームには、フレーム0,フレーム1,・・・,フレームn,・・・,フレームN−1といった連続するフレーム番号が割り当てられている。以上から、この映像はN枚の連続するフレームによって構成されていることが分かる。複数のフレームは、時系列に並んでいる。このような映像に基づいて、時系列のフレーム特徴量が抽出される。この結果、図4(b)に示すように、時系列のフレーム特徴量が得られる。
尚、フレーム特徴量には例えば画素平均値、分散などがある。
フレーム特徴量が画素平均値である場合には、以下の数式(1)によってフレーム特徴量F[n]が算出される。
Figure 0006089830
フレーム特徴量が分散である場合には、以下の数式(2)によってフレーム特徴量F[n]が算出される。
Figure 0006089830
ここで、G(x,y,n)は、フレーム番号nのフレームにおける位置(x,y)の画素値を示している。画素値には、例えば輝度値、RGB値、XYZ値(三刺激値)などがある。Wはフレームの水平方向のピクセル数を示している。Hはフレームの垂直方向のピクセル数を示している。したがって、このフレームはW×Hのサイズを有する。さらに、μ(n)は、すべての位置におけるG(x,y,n)を平均した平均値を示している。
フレーム特徴量抽出部101によってフレーム特徴量F[0],・・・,F[N−1]が抽出されると、次いで第1の周波数選択部102が周波数を選択する(ステップS102)。周波数は、少なくとも2つ(例えばM個)選択される。周波数は、周波数スペクトルから選択される。周波数スペクトルは、各フレーム特徴量F[0],・・・,F[N−1]に対する一次元フーリエ変換の結果である。以下、選択された周波数は、それぞれ周波数ω,ω,・・・,ω,・・・,ωM−1と示す。
第1の周波数選択部102によって周波数ω,ω,・・・,ω,・・・,ωM−1が選択されると、次いで位相生成部103が各周波数の位相系列を生成する(ステップS103)。
具体的には、図4(b)に示すように、時系列のフレーム特徴量に対し予め定めた幅Tを有する分析用窓(分析区間)が設定される。幅Tは、時系列のフレーム特徴量のサンプリング数を示している。例えばT=6である場合、F[0],・・・,F[5]がサンプリングされる。サンプリングされると、選択された周波数の位相が周波数毎に生成される。例えば、周波数ω,ωが選択されている場合、フレーム特徴量F[0],・・・,F[5]に対する位相θ[0],θ[0]が生成される。位相が周波数毎に1つ生成されると、分析用窓が1フレーム分ずれて新たな位相が周波数毎に生成される。この結果、フレーム特徴量F[1],・・・,F[6]に対する位相θ[1],θ[1]が生成される。以下、同様の手法により、位相θ[N−T],θ[N−T]が生成される。したがって、周波数ωに対してN−T+1個の位相θ[0],θ[1],・・・θ[N−T]が生成される。周波数ωに対してN−T+1個の位相θ[0],θ[1]・・・θ[N−T]が生成される。すなわち、時系列の位相が周波数毎に生成される。
尚、周波数ωの位相θ[n]は、以下の数式(3)及び(4)に基づいて算出される。まず、以下の数式(3)によってフレーム特徴量F[n]の周波数ωにおけるフーリエ係数C[n]が算出される。次いで、以下の数式(4)によってフーリエ係数C[n]における位相θ[n]が算出される。数式(3)及び(4)によって上述した生成情報が構成される。
Figure 0006089830
Figure 0006089830
ここで、数式(4)において、Re(C[n])は複素数C[n]の実数部を示している。Im(C[n])は複素数C[n]の虚数部を示している。
位相生成部103によって周波数ごとの位相系列が生成されると、位相登録部104は、選択された周波数と位相系列を含む映像特徴を映像特徴記憶部300に登録する(ステップS104)。映像特徴は、図4(c)に示すように、周波数ごとの時系列の位相を含んでいる。
次に、映像照合システム400で実行される映像照合方法について図5及び図6を参照して説明する。
図5は、第1実施形態における映像照合システム400で実行される処理ステップを例示するフローチャートである。図6は、第1実施形態における映像照合の様子を例示する図である。尚、後述するステップS111〜S113の処理ステップは、基本的に上述したステップS101〜S103と同様である。
フレーム特徴量抽出部101に改変された映像が入力されると、図5に示すように、改変された映像のフレーム特徴量をすべて抽出する(ステップS111)。フレーム特徴量抽出部101によって改変された映像のフレーム特徴量F[0],・・・,F[N−1]が抽出されると、次いで第2の周波数選択部401が周波数を選択する(ステップS112)。周波数は、少なくとも2つ(例えばL個)選択される。以下、選択された周波数は、それぞれ周波数ρ,ρ,・・・,ρ,・・・,ρL−1と示す。ここで、第1の周波数選択部102によって選択された周波数と同じ周波数を第2の周波数選択部401が選択する場合には、周波数ρ=ω,ρ=ω,・・・,ρ=ω,・・・,ρL−1=ωM−1となる。一方、周波数の強さを強い順位で並べて上位から少なくとも2つの周波数が第1の周波数選択部102によって選択された場合には、第2の周波数選択部401はすべての周波数ρ,ρ,・・・,ρ,・・・,ρL−1を選択する。
第2の周波数選択部401によって周波数(例えば周波数ρ(=ω),ρ(=ω))が選択されると、次いで位相生成部103が各周波数の位相系列を生成する(ステップS113)。この結果、周波数ρに対してN−T+1個の位相φ[0],φ[1],・・・φ[N−T]が生成される。周波数ρに対してN−T+1個の位相φ[0],φ[1]・・・φ[N−T]が生成される。すなわち、改変された映像について時系列の位相が周波数毎に生成される。すべての周波数が選択された場合には、すべての周波数について時系列の位相がそれぞれ生成される。
次いで、映像特徴照合部402は、映像特徴記憶部300に登録された映像特徴の1つと生成された位相系列を含む映像特徴とを相関値で照合する(ステップS114)。具体的には、映像特徴照合部402は、まず第2の周波数選択部401によって選択された周波数と位相生成部103によって生成された周波数毎の位相系列とを含む、改変された映像の映像特徴を生成する。次いで、映像特徴照合部402は第2の周波数選択部401によって選択された周波数と一致する周波数を有する映像特徴を映像特徴記憶部300から抽出する。例えば、周波数ρ,ρが選択されており、映像特徴記憶部300に周波数ω,ωの映像特徴及び周波数ω,ωの映像特徴が登録されている場合には、周波数ρ,ρと一致する周波数ω,ωの映像特徴が映像特徴記憶部300から抽出される。第2の周波数選択部401によって選択された周波数と一致する周波数を有する映像特徴が複数ある場合には、複数の映像特徴すべてが抽出される。ここで、周波数ω(例えば周波数ωやω)と一致する周波数ρ(例えばρやρ)を、説明の都合上新たに周波数ρ´とする。また、対応する位相をφ´[n]とする。次いで、映像特徴照合部402は、抽出した複数の映像特徴の中から1つの映像特徴を取得する。次いで、映像特徴照合部402は、図6に示すように、取得したオリジナル映像の映像特徴と改変された映像の映像特徴との相関値R[k]を算出して照合する。相関値R[k]は、2つの映像特徴の類似度を示している。相関値R[k]が大きな値になるほど、類似度は高い。相関値R[k]は一時的に保持される。
第1実施形態における相関値R[k]は、以下の数式(5)によって算出される。数式(5)に示すように、相関値R[k]は、各位相を複素平面上の半径1の円上に投影した点(例えば、位相がθであればexp(iθ))を時系列に並べた点群同士の内積により求められる。尚、exp(iφ´[n])は、その上に付された線により共役複素数であることを示す。
Figure 0006089830
上述した数式(5)で算出される相関値R[k]は、改変された映像の時間方向のずれに対して影響を受けない。改変された映像が時間方向にずれた場合、周波数ρ´,ρ´m+1の位相φ´[n],φ´m+1[n]はそれぞれ同じ値でずれる。このずれをδとして、時間方向にずれた改変された映像から得られる相関値をR´[k]とした場合、相関値R´[k]の右辺は以下に示す数式(6)のように書き換えられる。結果として、相関値R´[k]は相関値R[k]と同じ値となる。すなわち、改変された映像が時間方向のずれても、相関値R[k]は影響を受けない。
Figure 0006089830
映像特徴同士の照合処理が完了すると、次いで、映像特徴照合部402は抽出したすべての映像特徴と照合し終えたか否か判断する(ステップS115)。映像特徴照合部402は、抽出したすべての映像特徴と照合し終えていないと判断した場合(ステップS115:NO)、ステップS114の処理に戻る。そして、抽出した映像特徴の中から次の映像特徴を取得し、改変された映像の映像特徴との相関値R[k]を算出して照合する。算出した相関値R[k]が一時的に保持した直近の相関値R[k]より大きい場合、直近の相関値R[k]は、算出した相関値R[k]に更新される。この結果、常に最大の相関値R[k]が一時的に保持される。
抽出したすべての映像特徴と照合し終えたと判断された場合(ステップS115:YES)、映像特徴照合部402は、最大の相関値R[k]が閾値を超えるか否かを判断する(ステップS116)。閾値は、類似度が高いことを表す予め定められた値である。閾値は、例えば0.8以上1.0以下と定められる。閾値の下限は0.9以上でもよいし、0.95以上でもよい。
最大の相関値R[k]が閾値を超えると判断された場合(ステップS116:YES)、映像特徴照合部402は、最大の相関値R[k]に対応するオリジナル映像を出力する(ステップS117)。尚、オリジナル映像に代えてオリジナル映像に関連する情報が照合結果として出力されてもよい。一方、最大の相関値R[k]が閾値を超えないと判断された場合(ステップS116:NO)、映像特徴照合部402は、照合失敗の旨を照合結果として出力する(ステップS118)。
以上説明したように、第1実施形態で利用するフレーム特徴量は、各フレームに含まれる全ての画素値に基づいて抽出される。このため、映像の縦と横の比率が変更されたり、映像がクロッピングされたりしても、映像の同一性を判断する精度が下がらない。すなわち、映像が改変されても、改変前後の映像照合に関し改変の影響を受けにくい。例えば、テレビ番組や映画といったオリジナル映像をビデオカメラで撮影したものの、オリジナル映像に対し撮影された映像が斜めに傾いて変化していたような場合でも、映像の同一性を判断する精度が下がらない。
また、オリジナル映像のコントラストを変換したり、画素値ヒストグラムを伸縮したり平行移動したりしても映像の同一性を判断する精度が下がらない。このため、ビデオカメラを通じた映像の色味がオリジナル映像の色味から変わったような場合でも、映像の同一性を判断する精度が下がらない。
(第2実施形態)
続いて、第2実施形態について図7乃至図10を参照して説明する。第2実施形態は、フレーム特徴量の抽出方法及び映像特徴の形式が第1実施形態と相違する。
まず、映像特徴生成システム100で実行される映像特徴生成方法について図7及び図8を参照して説明する。
図7は、第2実施形態における映像特徴生成システム100で実行される処理ステップを例示するフローチャートである。図8は、第2実施形態における映像特徴が生成される様子を例示する図である。
フレーム特徴量抽出部101に映像(例えば、オリジナル映像又は改変された映像)が入力されると、図7に示すように、フレーム特徴量抽出部101は入力された映像のフレーム上の各位置における画素値をフレーム特徴量として抽出する(ステップS201)。具体的には、入力された映像に含まれる複数のフレームから、図8(a)に示すように1つのフレームが選択されて、選択されたフレーム上の各位置における画素値がフレーム特徴量として抽出される。例えば、位置(x,y)における画素値がフレーム特徴量F[x][y]となる。位置(xW−1,yH−1)における画素値がフレーム特徴量F[xW−1][yH−1]となる。すべての画素に対してフレーム特徴量F[x][y]が抽出される。尚、詳細は後述するが、入力された映像に含まれる複数のフレームから少なくとも2つのフレームが選択されてもよい。
次いで、第1の周波数選択部102は、水平方向成分と垂直方向成分を含む周波数を選択する(ステップS202)。周波数は、少なくとも2つ(例えばM個)選択される。周波数は、図8(b)に示すように周波数領域から選択される。周波数領域は、各フレーム特徴量F[x][y],・・・,F[xW−1][yH−1]に対する二次元フーリエ変換の結果である。図8(b)では、位置(x,y)における周波数(a,b)、位置(x,y)における周波数(am+1,bm+1)など全部で6つの周波数が選択されている。以下、選択された周波数は、それぞれ周波数(a,b),(a,b),・・・,(a,b),・・・,(aM−1,bM−1)と示す。
次いで、位相生成部103は、各周波数の位相を生成する(ステップS203)。周波数(a,b)の位相θは、以下の数式(7)及び(8)に基づいて算出される。まず、以下の数式(7)によってフレーム特徴量F[x][y]の周波数(a,b)におけるフーリエ係数Cが算出される。次いで、以下の数式(8)によってフーリエ係数Cにおける位相θが算出される。数式(7)及び(8)によっても上述した生成情報が構成される。
Figure 0006089830
Figure 0006089830
ここで、数式(8)において、Re(C)は複素数Cの実数部を示している。Im(C)は複素数Cの虚数部を示している。
この結果、各周波数の位相が生成される。図8(c)では、例えば周波数(a,b),・・・,(a,b)のそれぞれの位相θ,・・・,θが生成されている。各周波数の位相が1つに関連付けられて映像特徴が形成される。
次いで、位相登録部104は、周波数と位相を含む映像特徴を映像特徴記憶部300に登録する(ステップS204)。
尚、上述したように第2実施形態において入力された映像に含まれる複数のフレームから少なくとも2つフレームが選択された場合、ステップS203の位相生成処理を各フレームに適用すればよい。この結果、例えば周波数(a,b)の位相θ[0],θ[1],・・・θ[N−T]から、周波数(a,b)の位相θ[0],θ[1],・・・θ[N−T]までが生成される。すなわち、時系列の位相が周波数ごとに生成される。
次に、映像照合システム400で実行される映像照合方法について図9及び図10を参照して説明する。
図9は、第2実施形態における映像照合システム400で実行される処理ステップを例示するフローチャートである。図10は、第2実施形態における映像照合の様子を例示する図である。尚、後述するステップS211〜S213の処理ステップは、基本的に上述したステップS201〜S203と同様である。また、後述するステップS214〜S218の処理ステップは、基本的に第1実施形態で説明したステップS114〜S118と同様である。
フレーム特徴量抽出部101に改変された映像が入力されると、図9に示すように、フレーム特徴量抽出部101は改変された映像のフレーム上の各位置における画素値をフレーム特徴量として抽出する(ステップS211)。フレーム特徴量抽出部101によって改変された映像のフレーム特徴量F[x][y],・・・,F[xW−1][yH−1]が抽出されると、次いで第2の周波数選択部401が水平方向成分と垂直方向成分を含む周波数を選択する(ステップS212)。周波数は、少なくとも2つ(例えばL個)選択される。以下、選択された周波数は、それぞれ周波数(a,b),(a,b),・・・,(a,b),・・・,(aL−1,bL−1)と示す。ここで、第1の周波数選択部102によって選択された周波数と同じ周波数を第2の周波数選択部401が選択する場合には、周波数(a,b)=(a,b),・・・,(aL−1,bL−1)=(aM−1,bM−1)となる。一方、周波数の強さを強い順位で並べて上位から少なくとも2つの周波数が第1の周波数選択部102によって選択された場合には、第2の周波数選択部401はすべての周波数(a,b),(a,b),・・・,(a,b),・・・,(aL−1,bL−1)を選択する。
第2の周波数選択部401によって周波数(例えば周波数(a,b),・・・,(a,b))が選択されると、次いで位相生成部103が各周波数の位相を生成する(ステップS213)。例えば周波数(a,b),・・・,(a,b)のそれぞれの位相φ,・・・φが生成される。
次いで、映像特徴照合部402は、映像特徴記憶部300に登録された映像特徴の1つと生成された位相を含む映像特徴とを相関値で照合する(ステップS214)。具体的には、映像特徴照合部402は、まず第2の周波数選択部401によって選択された周波数と位相生成部103によって生成された周波数毎の位相とを含む、改変された映像の映像特徴を生成する。次いで、映像特徴照合部402は第2の周波数選択部401によって選択された周波数と一致する周波数を有する映像特徴を映像特徴記憶部300から抽出する。例えば、周波数(a,b),・・・,(a,b)が選択されており、映像特徴記憶部300に周波数(a,b),・・・,(a,b)の映像特徴及び周波数(a,b),・・・,(a,b)の映像特徴が登録されている場合には、周波数(a,b),・・・,(a,b)と一致する周波数(a,b),・・・,(a,b)の映像特徴が映像特徴記憶部300から抽出される。第2の周波数選択部401によって選択された周波数と一致する周波数を有する映像特徴が複数ある場合には、複数の映像特徴すべてが抽出される。ここで、周波数(a,b)(例えば周波数(a,b),・・・,(a,b))と一致する周波数(a,b)(例えば(a,b),・・・,(a,b))を、説明の都合上新たに周波数(a´,b´)とする。また、対応する位相をφ´とする。次いで、映像特徴照合部402は、抽出した複数の映像特徴の中から1つの映像特徴を取得する。次いで、映像特徴照合部402は、図10に示すように、取得したオリジナル映像の映像特徴と改変された映像の映像特徴との相関値R[k]を算出して照合する。相関値R[k]は一時的に保持される。
第2実施形態における相関値R[k]は、以下の数式(9)によって算出される。数式(9)に示すように、相関値R[k]は、各位相を複素平面上の半径1の円上に投影した点(例えば、位相がθであればexp(iθ))を時系列に並べた点群同士の内積により求められる。尚、exp(iφ´[n])は、その上に付された線により共役複素数であることを示す。
Figure 0006089830
また、上述したように第2実施形態において入力された映像に含まれる複数のフレームから少なくとも2つフレームが選択された場合、相関値R[k]は、以下の数式(10)によって算出される。
Figure 0006089830
映像特徴同士の照合処理が完了すると、次いで、映像特徴照合部402は抽出したすべての映像特徴と照合し終えたか否か判断する(ステップS215)。映像特徴照合部402は、抽出したすべての映像特徴と照合し終えていないと判断した場合(ステップS215:NO)、ステップS214の処理に戻る。そして、抽出した映像特徴の中から次の映像特徴を取得し、改変された映像の映像特徴との相関値R[k]を算出して照合する。算出した相関値R[k]が一時的に保持した直近の相関値R[k]より大きい場合、直近の相関値R[k]は、算出した相関値R[k]に更新される。この結果、常に最大の相関値R[k]が一時的に保持される。
抽出したすべての映像特徴と照合し終えたと判断された場合(ステップS215:YES)、映像特徴照合部402は、最大の相関値R[k]が閾値を超えるか否かを判断する(ステップS216)。最大の相関値R[k]が閾値を超えると判断された場合(ステップS216:YES)、映像特徴照合部402は、最大の相関値R[k]に対応するオリジナル映像を出力する(ステップS217)。一方、最大の相関値R[k]が閾値を超えないと判断された場合(ステップS216:NO)、映像特徴照合部402は、照合失敗の旨を照合結果として出力する(ステップS218)。
以上説明したように、第2実施形態では映像(動画)のみならず、1枚の静止画(1つのフレーム)にも適用可能である。静止画に適用の場合、画像の拡大もしくは縮小又は縦と横の比率の変更といった画像サイズの変更に対して影響を受けない。なぜならば、画像サイズが変更されると各周波数を求めるための計算範囲も変更される。このため、選択された周波数に基づいて得られる周波数の強さ及び位相は変わらない。さらに、空間方向の位置ずれ、映像の回転又は切り取りといった幾何変換がある場合には、想定される幾何変換に伴うずれを考慮して複数通りの相関値を求めて映像照合を行う必要がある。例えば、改変された映像がオリジナル映像から最大±10度で回転していると想定した場合、±5度の回転を考慮した相関値及び±10度の回転を考慮した相関値を求めておく必要がある。この結果、幾何変換に対しても影響を受けない。
また、上述したように第2実施形態において入力された映像に含まれる複数のフレームから少なくとも2つフレームが選択された場合、すなわち、動画に適用の場合、画像サイズの変更に影響を受けないばかりか、空間方向の位置ずれに対しても影響を受けない。例えば、オリジナル映像と改変された映像との間で映像の位置がずれていた場合、周波数(a´,b´),(a´m+1,b´m+1)の位相φ´[n],φ´m+1[n]はそれぞれ同じ値でずれる。このずれをδとして、位置ずれした改変された映像から得られる相関値をR´[k]とした場合、相関値R´[k]の右辺は以下に示す数式(11)のように書き換えられる。結果として、相関値R´[k]は相関値R[k]と同じ値となる。すなわち、改変された映像が空間方向のずれても、相関値R[k]は影響を受けない。
Figure 0006089830
以上、本発明の好ましい実施形態について詳述したが、本発明に係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
なお、以上の説明に関して更に以下の付記を開示する。
(付記1)入力された映像を構成する単位としてのフレームの画素値に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出手段と、少なくとも2つの周波数と前記抽出手段によって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成手段と、を有する映像特徴生成システム。
(付記2)前記抽出手段によって抽出されたフレーム特徴量に対するフーリエ変換の結果から前記少なくとも2つの周波数を選択する選択手段をさらに有することを特徴とする付記1に記載の映像特徴生成システム。
(付記3)前記抽出手段は、前記映像に含まれる複数のフレームにおけるそれぞれの画素値に基づいて、時系列のフレーム特徴量を抽出し、前記選択手段は、前記抽出手段によって抽出された時系列のフレーム特徴量に基づく周波数スペクトルから少なくとも2つの周波数を選択し、前記生成手段は、前記選択手段によって選択された少なくとも2つの周波数と前記抽出手段によって抽出された時系列のフレーム特徴量と前記生成情報とに基づいて、前記各周波数の時系列の位相を映像特徴として生成することを特徴とする付記2に記載の映像特徴生成システム。
(付記4)前記抽出手段は、前記フレームに含まれるすべての画素値に基づいて、前記フレーム特徴量を抽出することを特徴とする付記1から3のいずれか1項に記載の映像特徴生成システム。
(付記5)前記抽出手段は、前記フレームに含まれるすべての画素値の平均値に基づいて、前記フレーム特徴量を抽出することを特徴とする付記4に記載の映像特徴生成システム。
(付記6)前記抽出手段は、前記フレームに含まれるすべての画素値の分散に基づいて、前記フレーム特徴量を抽出することを特徴とする付記4に記載の映像特徴生成システム。
(付記7)前記抽出手段は、前記映像に含まれる少なくとも1つのフレーム上の各位置における画素値を前記フレーム特徴量として抽出し、前記選択手段は、前記抽出手段によって抽出されたフレーム特徴量に基づく周波数領域から水平方向成分と垂直方向成分とを含む少なくとも2つの周波数を選択し、前記生成手段は、前記選択手段によって選択された少なくとも2つの周波数と前記抽出手段によって抽出されたフレーム特徴量と前記生成情報とに基づいて、前記各周波数の位相を映像特徴として生成することを特徴とする付記2に記載の映像特徴生成システム。
(付記8)コンピュータが、入力された映像を構成する単位としてのフレームの画素値に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出ステップと、少なくとも2つの周波数と前記抽出ステップによって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成ステップと、を実行する映像特徴生成方法。
(付記9)前記抽出ステップによって抽出されたフレーム特徴量に対するフーリエ変換の結果から前記少なくとも2つの周波数を選択する選択ステップをさらに有することを特徴とする付記8に記載の映像特徴生成方法。
(付記10)前記抽出ステップは、前記映像に含まれる複数のフレームにおけるそれぞれの画素値に基づいて、時系列のフレーム特徴量を抽出し、前記選択ステップは、前記抽出ステップによって抽出された時系列のフレーム特徴量に基づく周波数スペクトルから少なくとも2つの周波数を選択し、前記生成ステップは、前記選択ステップによって選択された少なくとも2つの周波数と前記抽出ステップによって抽出された時系列のフレーム特徴量と前記生成情報とに基づいて、各周波数の時系列の位相を映像特徴として生成することを特徴とする付記9に記載の映像特徴生成方法。
(付記11)前記抽出ステップは、前記フレームに含まれるすべての画素値に基づいて、前記フレーム特徴量を抽出することを特徴とする付記8から10のいずれか1項に記載の映像特徴生成方法。
(付記12)前記抽出ステップは、前記フレームに含まれるすべての画素値の平均値に基づいて、前記フレーム特徴量を抽出することを特徴とする付記11に記載の映像特徴生成方法。
(付記13)前記抽出ステップは、前記フレームに含まれるすべての画素値の分散に基づいて、前記フレーム特徴量を抽出することを特徴とする付記11に記載の映像特徴生成方法。
(付記14)前記抽出ステップは、前記映像に含まれる少なくとも1つのフレーム上の各位置における画素値を前記フレーム特徴量として抽出し、前記選択ステップは、前記抽出ステップによって抽出されたフレーム特徴量に基づく周波数領域から水平方向成分と垂直方向成分とを含む少なくとも2つの周波数を選択し、前記生成ステップは、前記選択ステップによって選択された少なくとも2つの周波数と前記抽出ステップによって抽出されたフレーム特徴量と前記生成情報とに基づいて、各周波数の位相を映像特徴として生成することを特徴とする付記9に記載の映像特徴生成方法。
(付記15)入力された映像を構成する単位としてのフレームの画素値に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出ステップと、少なくとも2つの周波数と前記抽出ステップによって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成ステップと、をコンピュータに実行させるための映像特徴生成プログラム。
(付記16)前記抽出ステップによって抽出されたフレーム特徴量に対するフーリエ変換の結果から前記少なくとも2つの周波数を選択する選択ステップをさらに有することを特徴とする付記15に記載の映像特徴生成プログラム。
(付記17)前記抽出ステップは、前記映像に含まれる複数のフレームにおけるそれぞれの画素値に基づいて、時系列のフレーム特徴量を抽出し、前記選択ステップは、前記抽出ステップによって抽出された時系列のフレーム特徴量に基づく周波数スペクトルから少なくとも2つの周波数を選択し、前記生成ステップは、前記選択ステップによって選択された少なくとも2つの周波数と前記抽出ステップによって抽出された時系列のフレーム特徴量と前記生成情報とに基づいて、各周波数の時系列の位相を映像特徴として生成することを特徴とする付記16に記載の映像特徴生成プログラム。
(付記18)前記抽出ステップは、前記フレームに含まれるすべての画素値に基づいて、前記フレーム特徴量を抽出することを特徴とする付記15から17のいずれか1項に記載の映像特徴生成プログラム。
(付記19)前記抽出ステップは、前記フレームに含まれるすべての画素値の平均値に基づいて、前記フレーム特徴量を抽出することを特徴とする付記18に記載の映像特徴生成プログラム。
(付記20)前記抽出ステップは、前記フレームに含まれるすべての画素値の分散に基づいて、前記フレーム特徴量を抽出することを特徴とする付記18に記載の映像特徴生成方法。
(付記21)前記抽出ステップは、前記映像に含まれる少なくとも1つのフレーム上の各位置における画素値を前記フレーム特徴量として抽出し、前記選択ステップは、前記抽出ステップによって抽出されたフレーム特徴量に基づく周波数領域から水平方向成分と垂直方向成分とを含む少なくとも2つの周波数を選択し、前記生成ステップは、前記選択ステップによって選択された少なくとも2つの周波数と前記抽出ステップによって抽出されたフレーム特徴量と前記生成情報とに基づいて、各周波数の位相を映像特徴として生成することを特徴とする付記16に記載の映像特徴生成プログラム。
(付記22)入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出手段と、少なくとも2つの周波数と前記抽出手段によって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成手段と、前記生成手段によって生成された第1の映像特徴と第2の映像特徴とを照合する照合手段と、を有する映像照合システム。
(付記23)コンピュータが、入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出ステップと、少なくとも2つの周波数と前記抽出ステップによって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成ステップと、前記生成ステップによって生成された第1の映像特徴と第2の映像特徴とを照合する照合ステップと、を実行する映像照合方法。
(付記24)入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出ステップと、少なくとも2つの周波数と前記抽出ステップによって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成ステップと、前記生成ステップによって生成された第1の映像特徴と第2の映像特徴とを照合する照合ステップと、をコンピュータに実行させるための映像照合プログラム。
100 映像特徴生成システム
101 フレーム特徴量抽出部(抽出手段)
102 第1の周波数選択部(選択手段)
103 位相生成部(生成手段)
104 位相登録部
300 映像特徴記憶部
400 映像照合システム
401 第2の周波数選択部
402 映像特徴照合部(照合手段)

Claims (16)

  1. 入力された映像を構成する単位としてのフレームの画素値の平均値に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出手段と、
    少なくとも2つの周波数と前記抽出手段によって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成手段と、
    を有する映像特徴生成システム。
  2. 入力された映像を構成する単位としてのフレームの画素値の分散に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出手段と、
    少なくとも2つの周波数と前記抽出手段によって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成手段と、
    を有する映像特徴生成システム。
  3. 前記抽出手段によって抽出されたフレーム特徴量に対するフーリエ変換の結果から前記少なくとも2つの周波数を選択する選択手段をさらに有することを特徴とする請求項1又は2に記載の映像特徴生成システム。
  4. 前記抽出手段は、前記映像に含まれる複数のフレームにおけるそれぞれの画素値に基づいて、時系列のフレーム特徴量を抽出し、
    前記選択手段は、前記抽出手段によって抽出された時系列のフレーム特徴量に基づく周波数スペクトルから少なくとも2つの周波数を選択し、
    前記生成手段は、前記選択手段によって選択された少なくとも2つの周波数と前記抽出手段によって抽出された時系列のフレーム特徴量と前記生成情報とに基づいて、前記各周波数の時系列の位相を映像特徴として生成することを特徴とする請求項に記載の映像特徴生成システム。
  5. 前記抽出手段は、前記フレームに含まれるすべての画素値に基づいて、前記フレーム特徴量を抽出することを特徴とする請求項1からのいずれか1項に記載の映像特徴生成システム。
  6. 前記抽出手段は、前記映像に含まれる少なくとも1つのフレーム上の各位置における画素値を前記フレーム特徴量として抽出し、
    前記選択手段は、前記抽出手段によって抽出されたフレーム特徴量に基づく周波数領域から水平方向成分と垂直方向成分とを含む少なくとも2つの周波数を選択し、
    前記生成手段は、前記選択手段によって選択された少なくとも2つの周波数と前記抽出手段によって抽出されたフレーム特徴量と前記生成情報とに基づいて、前記各周波数の位相を映像特徴として生成することを特徴とする請求項に記載の映像特徴生成システム。
  7. コンピュータが、
    入力された映像を構成する単位としてのフレームの画素値の平均値に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出ステップと、
    少なくとも2つの周波数と前記抽出ステップによって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成ステップと、
    を実行する映像特徴生成方法。
  8. コンピュータが、
    入力された映像を構成する単位としてのフレームの画素値の分散に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出ステップと、
    少なくとも2つの周波数と前記抽出ステップによって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成ステップと、
    を実行する映像特徴生成方法。
  9. 入力された映像を構成する単位としてのフレームの画素値の平均値に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出ステップと、
    少なくとも2つの周波数と前記抽出ステップによって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成ステップと、
    をコンピュータに実行させるための映像特徴生成プログラム。
  10. 入力された映像を構成する単位としてのフレームの画素値の分散に基づいて、前記フレームを特徴付けるフレーム特徴量を抽出する抽出ステップと、
    少なくとも2つの周波数と前記抽出ステップによって抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、各周波数の位相を映像特徴として生成する生成ステップと、
    をコンピュータに実行させるための映像特徴生成プログラム。
  11. 入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値の平均値に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出手段と、
    少なくとも2つの周波数と前記抽出手段によって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成手段と、
    前記生成手段によって生成された第1の映像特徴と第2の映像特徴とを照合する照合手段と、
    を有する映像照合システム。
  12. 入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値の分散に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出手段と、
    少なくとも2つの周波数と前記抽出手段によって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成手段と、
    前記生成手段によって生成された第1の映像特徴と第2の映像特徴とを照合する照合手段と、
    を有する映像照合システム。
  13. コンピュータが、
    入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値の平均値に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出ステップと、
    少なくとも2つの周波数と前記抽出ステップによって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成ステップと、
    前記生成ステップによって生成された第1の映像特徴と第2の映像特徴とを照合する照合ステップと、
    を実行する映像照合方法。
  14. コンピュータが、
    入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値の分散に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出ステップと、
    少なくとも2つの周波数と前記抽出ステップによって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成ステップと、
    前記生成ステップによって生成された第1の映像特徴と第2の映像特徴とを照合する照合ステップと、
    を実行する映像照合方法。
  15. 入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値の平均値に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出ステップと、
    少なくとも2つの周波数と前記抽出ステップによって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成ステップと、
    前記生成ステップによって生成された第1の映像特徴と第2の映像特徴とを照合する照合ステップと、
    をコンピュータに実行させるための映像照合プログラム。
  16. 入力された第1及び第2の映像のそれぞれを構成する単位としてのフレームの画素値の分散に基づいて、前記フレームを特徴付けるフレーム特徴量を映像毎に抽出する抽出ステップと、
    少なくとも2つの周波数と前記抽出ステップによって映像毎に抽出されたフレーム特徴量と前記周波数及び前記フレーム特徴量に応じて前記周波数の位相を生成するための生成情報とに基づいて、前記第1及び第2の映像のそれぞれについて各周波数の位相を第1及び第2の映像特徴として生成する生成ステップと、
    前記生成ステップによって生成された第1の映像特徴と第2の映像特徴とを照合する照合ステップと、
    をコンピュータに実行させるための映像照合プログラム。
JP2013054894A 2013-03-18 2013-03-18 映像特徴生成システム、映像特徴生成方法、映像特徴生成プログラム、映像照合システム、映像照合方法、映像照合プログラム Expired - Fee Related JP6089830B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013054894A JP6089830B2 (ja) 2013-03-18 2013-03-18 映像特徴生成システム、映像特徴生成方法、映像特徴生成プログラム、映像照合システム、映像照合方法、映像照合プログラム
US14/075,268 US9141861B2 (en) 2013-03-18 2013-11-08 Video image feature generation system and video image feature generation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013054894A JP6089830B2 (ja) 2013-03-18 2013-03-18 映像特徴生成システム、映像特徴生成方法、映像特徴生成プログラム、映像照合システム、映像照合方法、映像照合プログラム

Publications (2)

Publication Number Publication Date
JP2014182440A JP2014182440A (ja) 2014-09-29
JP6089830B2 true JP6089830B2 (ja) 2017-03-08

Family

ID=51527331

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013054894A Expired - Fee Related JP6089830B2 (ja) 2013-03-18 2013-03-18 映像特徴生成システム、映像特徴生成方法、映像特徴生成プログラム、映像照合システム、映像照合方法、映像照合プログラム

Country Status (2)

Country Link
US (1) US9141861B2 (ja)
JP (1) JP6089830B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9501154B2 (en) * 2014-04-21 2016-11-22 Microsoft Technology Licensing, Llc Interactively stylizing camera motion
JP6432182B2 (ja) * 2014-07-02 2018-12-05 富士通株式会社 サービス提供装置、方法、及びプログラム
WO2020014495A1 (en) * 2018-07-13 2020-01-16 Irobot Corporation Mobile robot cleaning system
CN110969066B (zh) * 2018-09-30 2023-10-10 北京金山云网络技术有限公司 直播视频的识别方法、装置及电子设备
DE102019204318A1 (de) * 2019-03-28 2020-10-01 Conti Temic Microelectronic Gmbh Automatische Erkennung und Klassifizierung von Adversarial Attacks

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10134185A (ja) * 1996-10-30 1998-05-22 Yamatake Honeywell Co Ltd 操作者照合装置
JP4328423B2 (ja) 1999-10-04 2009-09-09 セコム株式会社 音声識別装置
US8224064B1 (en) * 2003-05-21 2012-07-17 University Of Kentucky Research Foundation, Inc. System and method for 3D imaging using structured light illumination
JP4664147B2 (ja) * 2005-07-29 2011-04-06 株式会社山武 虹彩認証装置
JP2009003889A (ja) 2007-06-25 2009-01-08 Fujitsu Microelectronics Ltd 認証方法、認証装置及びプログラム
JP5573131B2 (ja) 2009-12-01 2014-08-20 日本電気株式会社 映像識別子抽出装置および方法、映像識別子照合装置および方法、ならびにプログラム
WO2012026039A1 (ja) * 2010-08-27 2012-03-01 富士通株式会社 電子透かし埋め込み装置、電子透かし埋め込み方法及び電子透かし埋め込み用コンピュータプログラムならびに電子透かし検出装置

Also Published As

Publication number Publication date
JP2014182440A (ja) 2014-09-29
US20140270531A1 (en) 2014-09-18
US9141861B2 (en) 2015-09-22

Similar Documents

Publication Publication Date Title
JP6089830B2 (ja) 映像特徴生成システム、映像特徴生成方法、映像特徴生成プログラム、映像照合システム、映像照合方法、映像照合プログラム
JP5175854B2 (ja) 画像認識のための画像記述子
US9400939B2 (en) System and method for relating corresponding points in images with different viewing angles
Barnes et al. Patchtable: Efficient patch queries for large datasets and applications
Kwon et al. Learning jpeg compression artifacts for image manipulation detection and localization
JP5404644B2 (ja) 時間イベント・ベースの画紋法のためのコンピュータ・プログラム及び画像の著作権侵害を自動的に検出するための装置
US20140044361A1 (en) Device and method for analyzing the correlation between an image and another image or between an image and a video
JP5261493B2 (ja) 拡張画像識別
US10699156B2 (en) Method and a device for image matching
JP5414620B2 (ja) 画像処理装置、画像処理方法、プログラム、及び集積回路
Shang et al. Document forgery detection using distortion mutation of geometric parameters in characters
JP2002541598A (ja) フーリエ変換の相関による回転の修正および重複イメージの識別
KR101713197B1 (ko) 서버 컴퓨팅 장치 및 이를 이용한 콘텐츠 인식 기반의 영상 검색 시스템
US10339412B2 (en) Image processing apparatus, image processing method, and storage medium
US8891836B2 (en) Stripe pattern image analysis device, stripe pattern image analysis method, and program thereof
JP2018526754A (ja) 画像処理装置、画像処理方法及び記憶媒体
Sarma et al. A study on digital image forgery detection
JP6919758B2 (ja) 画像照合装置
JP2016012767A (ja) 画像処理装置
Sekhar et al. Review on image splicing forgery detection
JP6495219B2 (ja) 映像検出装置、方法、及びプログラム
Zheng et al. Exposing image forgery by detecting traces of feather operation
Ciptasari et al. Exploiting reference images for image splicing verification
JP2010263327A (ja) 特徴量算出装置およびプログラム
Vázquez-Padín et al. Exposing original and duplicated regions using SIFT features and resampling traces

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170123

R150 Certificate of patent or registration of utility model

Ref document number: 6089830

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees