JP4883226B2 - 映像記述子生成装置 - Google Patents
映像記述子生成装置 Download PDFInfo
- Publication number
- JP4883226B2 JP4883226B2 JP2010547432A JP2010547432A JP4883226B2 JP 4883226 B2 JP4883226 B2 JP 4883226B2 JP 2010547432 A JP2010547432 A JP 2010547432A JP 2010547432 A JP2010547432 A JP 2010547432A JP 4883226 B2 JP4883226 B2 JP 4883226B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- video
- feature quantity
- feature amount
- code string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/732—Query formulation
- G06F16/7328—Query by example, e.g. a complete video frame or video sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/421—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation by analysing segments intersecting the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
Description
本発明の目的は、黒帯領域やL字領域が映像に付加された場合であっても、検索精度を維持できる映像記述子生成装置、方法、およびプログラムを提供することにある。
Pictureという映像提示技法や、アナウンサーの後ろのスクリーンに映されている映像をカメラで撮影している場合なども、メインの映像の周りに枠が現れるため、この範疇に含めることができる。すなわち、Picture in Pictureで内側に表示された領域の外側や、スクリーンの枠の外側を黒帯領域と同様に扱うことで、本発明の方式を適用できる。
Dn=V'n-Vn
により、特徴量の各次元における差分値Dnを算出し、符号化する。特徴量の値が3値であるため、Dnとしてとりえる値は、Vnによって異なるが、3値である。すなわち、Vn=1のときは、Dn=0、-1、-2、Vn=0のときは、Dn=1、0、-1、Vn=-1のときはDn=2、1、0である。特徴量差分値符号化手段340では、Vn=1、0、-1のそれぞれの値に対して、Dnの生じる頻度を予め学習しておき、その結果に基づいてエントロピー符号化を行う。
20…特徴量テーブル作成手段
100…映像境界検知手段
120…視覚特徴量抽出手段
130…位置補正視覚特徴量抽出手段
140…特徴量統合手段
230…符号列多重化手段
240…特徴量統合手段
300…特徴量減算手段
310…符号化手段
320…符号化手段
330…符号列多重化手段
430…符号列多重化手段
440…特徴量差分符号化手段
520…符号列選択手段
530…符号列多重化手段
600…差分符号化インデックス決定手段
610…符号化手段
630…符号列多重化手段
640…特徴量差分符号化手段
660…特徴量差分符号化手段
720…符号列選択手段
730…符号列多重化手段
830…符号列多重化手段
930…符号列多重化手段
1000…特徴量復元手段
1010…特徴量復元手段
1020…特徴量照合手段
1030…特徴量照合手段
1040…特徴量照合手段
1050…特徴量照合手段
1060…選択手段
1100…符号列多重分離手段
1110…復号手段
1120…復号手段
1200…符号列多重分離手段
1230…特徴量差分復号手段
1240…特徴量加算手段
1300…符号列多重分離手段
1330…特徴量差分復号手段
1400…符号列多重分離手段
1410…復号手段
1430…特徴量差分復号手段
1440…切り替え手段
1450…切り替え手段
1500…符号列多重分離手段
1510…復号手段
1530…特徴量差分復号手段
1540…切り替え手段
1550…切り替え手段
1560…差分符号化インデックス決定手段
1600…符号列多重分離手段
1700…符号列多重分離手段
1730…特徴量差分復号手段
1740…切り替え手段
1750…切り替え手段
1800…符号列多重分離手段
Claims (41)
- 映像のフレームまたはフィールドであるピクチャ毎に第1の特徴量を抽出する、第1の抽出手段と、
前記ピクチャ内の境界で定まる位置より内側の領域内から第2の特徴量を抽出する、第2の抽出手段と、
前記第1の特徴量と前記第2の特徴量とを含む映像記述子を生成する特徴量統合手段と、
を有する映像記述子抽出装置。 - 前記第1の抽出手段が抽出する前記第1の特徴量と、前記第2の抽出手段が抽出する前記第2の特徴量は、同じ種類の特徴量である
請求項1に記載の映像記述子抽出装置。 - 前記ピクチャ内の境界は、黒帯領域付加、L字領域付加、あるいは画像内画像重畳表示(Picture in Picture)のうち少なくとも1つによって定まる画像の境界である請求項1または2に記載の映像記述子抽出装置。
- 前記特徴量統合手段は、
前記第1の特徴量を第1の特徴量符号列として符号化する第1の符号化手段と、
前記第2の特徴量を第2の特徴量符号列として符号化する第2の符号化手段と、
前記第1の特徴量符号列と前記第2の特徴量符号列とを含む前記映像記述子を生成する符号列多重化手段と、
を有する請求項1乃至3の何れか1項に記載の映像記述子抽出装置。 - 前記第1の抽出手段と前記第2の抽出手段は、
前記特徴量を構成する各次元にそれぞれ関連付けられる前記ピクチャ内の2つの部分領域から算出される領域特徴量の差分値に基づいて、前記特徴量を形成する
請求項1乃至4の何れか1項に記載の映像記述子抽出装置。 - 前記特徴量は、前記特徴量を構成する次元に関連付けられる前記ピクチャ内の2つの部分領域の形状の組み合わせと、当該2つの関連する部分領域の相対的な位置関係との双方が、他の少なくとも1つの次元に関連付けられる前記ピクチャ内の2つの部分領域と相違する1以上の次元を含む請求項5に記載の映像記述子抽出装置。
- 前記第1の抽出手段と前記第2の抽出手段は、前記次元に関連付けられる前記ピクチャ内の2つの部分領域の双方から領域特徴量を算出し、前記領域特徴量から前記特徴量の各次元の値を算出し、
前記特徴量統合手段は、前記特徴量の各次元の値の集合を前記特徴量とする
請求項5または6に記載の映像記述子抽出装置。 - 前記第1の抽出手段と前記第2の抽出手段は、前記領域特徴量の差分値を前記特徴量の各次元の値として量子化する請求項7に記載の映像記述子抽出装置。
- 前記第1の抽出手段と前記第2の抽出手段は、前記差分値を前記特徴量の各次元の値として3値に量子化し、
前記特徴量統合手段は、前記特徴量の各次元の値の5つ分を1バイトの情報に符号化することによって前記特徴量の表現を抽出する請求項8に記載の映像記述子抽出装置。 - 前記第1の抽出手段と前記第2の抽出手段は、各部分領域の平均輝度値を、当該部分領域の領域特徴量として算出する請求項5乃至9の何れか1項に記載の映像記述子抽出装置。
- 映像のフレームまたはフィールドであるピクチャ毎に第1の特徴量を抽出し、
前記ピクチャ内の境界で定まる位置より内側の領域内から第2の特徴量を抽出し、
前記第1の特徴量と前記第2の特徴量とを含む映像記述子を生成する
映像記述子抽出方法。 - 前記第1の特徴量と、前記第2の特徴量は、同じ種類の特徴量である
請求項11に記載の映像記述子抽出方法。 - 前記画像の境界は、黒帯領域付加、L字領域付加、あるいは画像内画像重畳表示(Picture in Picture)のうち少なくとも1つによって定まる画像の境界である請求項11または12に記載の映像記述子抽出方法。
- 前記映像記述子の生成では、
前記第1の特徴量を第1の特徴量符号列として符号化し、
前記第2の特徴量を第2の特徴量符号列として符号化し、
前記第1の特徴量符号列と前記第2の特徴量符号列とを含む前記映像記述子を生成する
請求項11乃至13の何れか1項に記載の映像記述子抽出方法。 - 前記特徴量の抽出では、
前記特徴量を構成する各次元にそれぞれ関連付けられる前記ピクチャ内の2つの部分領域から算出される領域特徴量の差分値に基づいて、前記特徴量を形成する
請求項11乃至14の何れか1項に記載の映像記述子抽出方法。 - 前記特徴量は、前記特徴量を構成する次元に関連付けられる前記ピクチャ内の2つの部分領域の形状の組み合わせと、当該2つの関連する部分領域の相対的な位置関係との双方が、他の少なくとも1つの次元に関連付けられる前記ピクチャ内の2つの部分領域と相違する1以上の次元を含む請求項15に記載の映像記述子抽出方法。
- 前記特徴量の抽出では、前記次元に関連付けられる前記ピクチャ内の2つの部分領域の双方から領域特徴量を算出し、前記領域特徴量から前記特徴量の各次元の値を算出し、
前記映像記述子の抽出では、前記特徴量の各次元の値の集合を前記特徴量とする
請求項15または16に記載の映像記述子抽出方法。 - 前記特徴量の抽出では、前記領域特徴量の差分値を前記特徴量の各次元の値として量子化する請求項17に記載の映像記述子抽出方法。
- 前記特徴量の抽出では、前記差分値を前記特徴量の各次元の値として3値に量子化し、
前記映像記述子の抽出では、前記特徴量の各次元の値の5つ分を1バイトの情報に符号化することによって前記特徴量の表現を抽出する請求項18に記載の映像記述子抽出方法。 - 前記特徴量の抽出では、各部分領域の平均輝度値を、当該部分領域の領域特徴量として算出する
ことを特徴とする請求項15乃至19の何れか1項に記載の映像記述子抽出方法。 - コンピュータを、
映像のフレームまたはフィールドであるピクチャ毎に第1の特徴量を抽出する、第1の抽出手段と、
前記ピクチャ内の画像の境界で定まる位置より内側の領域内から第2の特徴量を抽出する、第2の抽出手段と、
前記第1の特徴量と前記第2の特徴量とを含む映像記述子を生成する特徴量統合手段と、
として機能させるためのプログラム。 - 請求項1乃至10の何れかに記載の映像記述子抽出装置から生成された映像記述子を用いて検索を行うことを特徴とする検索装置。
- 請求項1乃至10の何れかに記載の映像記述子抽出装置から生成された映像記述子を用いて識別を行うことを特徴とする識別装置。
- 請求項11乃至20の何れかに記載の映像記述子抽出方法によって生成された映像記述子を用いて検索を行うことを特徴とする検索方法。
- 請求項11乃至20の何れかに記載の映像記述子抽出方法によって生成された映像記述子を用いて識別を行うことを特徴とする識別方法。
- 第1の映像の第1の映像記述子と第2の映像の第2の映像記述子との照合を行う動画像照合装置であって、
前記第1の映像記述子から、前記第1の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1の映像の第1の特徴量と、前記第1の映像の前記ピクチャ内の境界で定まる位置より内側の領域内から抽出された第1の映像の第2の特徴量とを復元する、第1の特徴量復元手段と、
前記第2の映像記述子から、前記第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第2の映像の第1の特徴量と、前記第2の映像の前記ピクチャ内の境界で定まる位置より内側の領域内から抽出された第2の映像の第2の特徴量とを復元する、第2の特徴量復元手段と、
前記第1の映像の第1の特徴量と、前記第2の映像の第1の特徴量とを照合し、第1の照合スコアを算出する第1の特徴量照合手段と、
前記第1の映像の第1の特徴量と、前記第2の映像の第2の特徴量とを照合し、第2の照合スコアを算出する第2の特徴量照合手段と、
前記第1の映像の第2の特徴量と、前記第2の映像の第1の特徴量とを照合し、第3の照合スコアを算出する第3の特徴量照合手段と、
前記第1の映像の第2の特徴量と、前記第2の映像の第2の特徴量とを照合し、第4の照合スコアを算出する第4の特徴量照合手段と、
前記第1から第4の照合スコアを比較し、最良の照合スコアを選択する選択手段と、
を有することを特徴とする動画像照合装置。 - 前記第1、第2の特徴量復元手段は、
前記第1または第2の映像記述子を多重分離して、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を符号化した第1の特徴量符号列と、前記第1または第2の映像の前記ピクチャ内の境界で定まる位置より内側の領域内から抽出された第1または第2の映像の第2の特徴量を符号化した第2の特徴量符号列とを生成する符号列多重分離手段と、
前記第1の特徴量符号列を復号し、前記第1または第2の映像の第1の特徴量を復元する第1の復号手段と、
前記第2の特徴量符号列を復号し、前記第1または第2の映像の第2の特徴量を復元する第2の復号手段と、
を有することを特徴とする請求項26に記載の動画像照合装置。 - 前記第1、第2の特徴量復元手段は、
前記第1または第2の映像記述子を多重分離して、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を符号化した第1の特徴量符号列と、前記第1または第2の映像の前記ピクチャ内の境界で定まる位置より内側の領域内から抽出された第1または第2の映像の第2の特徴量から、前記第1または第2の映像の第1の特徴量を差し引いた特徴量差分値を符号化した特徴量差分値符号列とを生成する符号列多重分離手段と、
前記第1の特徴量符号列を復号し、前記第1または第2の映像の前記第1の特徴量を復元する第1の復号手段と、
前記特徴量差分値符号列を復号し、前記特徴量差分値を復元する特徴量差分復号手段と、
前記特徴量差分値に前記第1の特徴量を加算して、前記第1または第2の映像の前記第2の特徴量を算出する加算手段と、
を有することを特徴とする請求項26に記載の動画像照合装置。 - 前記符号列多重分離手段は前記境界情報も多重分離し、
前記特徴量差分復号手段は、前記境界情報に基づいて前記特徴量差分値符号列を復号し、特徴量差分値を復元すること、
を特徴とする請求項28に記載の動画像照合装置。 - 前記第1、第2の特徴量復元手段は、
前記第1または第2の映像記述子を多重分離して、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を符号化した第1の特徴量符号列と、前記第1または第2の映像の前記ピクチャ内の境界で定まる位置より内側の領域内から抽出された第1または第2の映像の第2の特徴量を符号化した第2の特徴量符号列、および、前記第2の特徴量から、前記第1または第2の映像の第1の特徴量を差し引いた特徴量差分値を符号化した特徴量差分値符号列のうち、符号量の小さい方を含む第3の特徴量符号列と、前記第3の特徴量符号列に含まれる特徴量が前記特徴量差分値または前記第2の特徴量のいずれであるかを示すモード情報とを生成する符号列多重分離手段と、
前記第1の特徴量符号列を復号し、前記第1または第2の映像の前記第1の特徴量を復元する第1の復号手段と、
前記第3の特徴量符号列を入力し、その出力先を、前記モード情報に基づいて切り替える第1の切り替え手段と、
前記第1の切り替え手段から出力される前記第3の特徴量符号列を復号し、前記特徴量差分値を復元する特徴量差分復号手段と、
前記第1の切り替え手段から出力される前記第3の特徴量符号列を復号し、前記第2の特徴量を復元する第2の復号手段と、
前記特徴量差分値に前記第1の特徴量を加算して、前記第2の特徴量を算出する加算手段と、
前記加算手段から出力される前記第2の特徴量と前記第2の復号手段から出力される前記第2の特徴量とを、前記モード情報によって切り替えながら合成し、前記第1または第2の映像の前記第2の特徴量を出力する第2の切り替え手段と、
を有することを特徴とする請求項26に記載の動画像照合装置。 - 前記第1、第2の特徴量復元手段は、
前記第1または第2の映像記述子を多重分離して、前記境界情報、または前記境界情報から決定された情報であって特徴ベクトルの各要素のうち差分符号化する要素のインデックスを示す差分符号化インデックスのいずれか一方と、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を符号化した第1の特徴量符号列と、前記第1または第2の映像の前記ピクチャ内の境界で定まる位置より内側の領域内から抽出された第1または第2の映像の第2の特徴量を符号化した第2の特徴量符号列、および、前記第2の特徴量から、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を差し引いた特徴量差分値を符号化した特徴列差分値符号列のうち、前記境界情報または前記差分符号化インデックス情報で定まる方を含む第3の特徴量符号列とを出力する符号列多重分離手段と、
前記符号列多重分離手段が前記境界情報を出力する場合には、前記境界情報から特徴ベクトルの各要素のうち、差分符号化する要素のインデックスを決定し、前記差分符号化インデックス情報として出力する差分符号化インデックス決定手段と、
前記第1の特徴量符号列を復号し、前記第1または第2の映像の前記第1の特徴量を復元する第1の復号手段と、
前記第3の特徴量符号列を入力し、その出力先を、前記差分インデックス情報に基づいて切り替える第1の切り替え手段と、
前記第1の切り替え手段から出力される前記第3の特徴量符号列を復号し、前記特徴量差分値を復元する特徴量差分復号手段と、
前記第1の切り替え手段から出力される前記第3の特徴量符号列を復号し、前記第2の特徴量を復元する第2の復号手段と、
前記特徴量差分値に前記第1の特徴量を加算して、前記第2の特徴量を算出する加算手段と、
前記加算手段から出力される前記第2の特徴量と前記第2の復号手段から出力される前記第2の特徴量とを、前記差分符号化インデックス情報によって切り替えながら合成し、前記第1または第2の映像の前記第2の特徴量を出力する第2の切り替え手段と、
を有することを特徴とする請求項26に記載の動画像照合装置。 - 前記第1、第2の特徴量復元手段は、
前記第1または第2の映像記述子を多重分離して、前記境界情報、または前記境界情報から決定された情報であって特徴ベクトルの各要素のうち差分符号化する要素のインデックスを示す差分符号化インデックスのいずれか一方と、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を符号化した第1の特徴量符号列と、前記第1または第2の映像から検知された前記ピクチャ内の境界を示す境界情報を用いて定められた前記第1または第2の映像のピクチャの境界で定まる位置より内側の領域内から抽出された第1または第2の映像の第2の特徴量を符号化した第2の特徴量符号列、および、前記第2の特徴量から、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を差し引いた特徴量差分値を符号化した特徴列差分符号列のうち、前記差分符号化インデックス情報で指定されないインデックスの要素については前記第2の特徴量符号列を含み、前記差分符号化インデックス情報で指定されたインデックスの要素については符号量の小さい方を含む第3の特徴量符号列と、前記差分符号化インデックス情報で指定されたインデックスの要素について前記第2の特徴量符号列または前記特徴列差分符号列のうちのいずれを含むかを示すモード情報とを出力する符号列多重分離手段と、
前記符号列多重分離手段が前記境界情報を出力する場合には、前記境界情報から特徴ベクトルの各要素のうち、差分符号化する要素のインデックスを決定し、前記差分符号化インデックス情報として出力する差分符号化インデックス決定手段と、
前記第1の特徴量符号列を復号し、前記第1または第2の映像の前記第1の特徴量を復元する第1の復号手段と、
前記第3の特徴量符号列を入力し、その出力先を、前記差分符号化インデックス情報および前記モード情報に基づいて切り替える第1の切り替え手段と、
前記第1の切り替え手段から出力される前記第3の特徴量符号列を復号し、前記特徴量差分値を復元する特徴量差分復号手段と、
前記第1の切り替え手段から出力される前記第3の特徴量符号列を復号し、前記第2の特徴量を復元する第2の復号手段と、
前記特徴量差分値に前記第1の特徴量を加算して、前記第2の特徴量を算出する加算手段と、
前記加算手段から出力される前記第2の特徴量と前記第2の復号手段から出力される前記第2の特徴量とを、前記差分インデックス情報と前記モード情報とによって切り替えながら合成し、前記第1または第2の映像の前記第2の特徴量を出力する第2の切り替え手段と、
を有することを特徴とする請求項26に記載の動画像照合装置。 - 前記特徴量差分復号手段は、前記境界情報に基づいて前記特徴量差分値符号列を復号し、特徴量差分値を復元すること、
を特徴とする請求項31または32に記載の動画像照合装置。 - 第1の映像記述子から、第1の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1の映像の第1の特徴量と、前記第1の映像の前記ピクチャ内の境界で定まる位置より内側の領域内から抽出された第1の映像の第2の特徴量とを復元し、
第2の映像記述子から、第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第2の映像の第1の特徴量と、前記第2の映像の前記ピクチャ内の境界で定まる位置より内側の領域内から抽出された第2の映像の第2の特徴量とを復元し、
前記第1の映像の第1の特徴量と、前記第2の映像の第1の特徴量とを照合して、第1の照合スコアを算出し、
前記第1の映像の第1の特徴量と、前記第2の映像の第2の特徴量とを照合して、第2の照合スコアを算出し、
前記第1の映像の第2の特徴量と、前記第2の映像の第1の特徴量とを照合して、第3の照合スコアを算出し、
前記第1の映像の第2の特徴量と、前記第2の映像の第2の特徴量とを照合して、第4の照合スコアを算出し、
前記第1から第4の照合スコアを比較し、最良の照合スコアを選択する
ことを特徴とする動画像照合方法。 - 前記第1および第2の映像の第1および第2の特徴量の復元では、
前記第1または第2の映像記述子を多重分離して、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を符号化した第1の特徴量符号列と、前記第1または第2の映像の前記ピクチャ内の境界で定まる位置より内側の領域内から抽出された第1または第2の映像の第2の特徴量を符号化した第2の特徴量符号列とを生成し、
前記第1の特徴量符号列を復号し、前記第1または第2の映像の第1の特徴量を復元し、
前記第2の特徴量符号列を復号し、前記第1または第2の映像の第2の特徴量を復元する
ことを特徴とする請求項34に記載の動画像照合方法。 - 前記第1および第2の映像の第1および第2の特徴量の復元では、
前記第1または第2の映像記述子を多重分離して、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を符号化した第1の特徴量符号列と、前記第1または第2の映像の前記ピクチャ内の境界で定まる位置より内側の領域内から抽出された第1または第2の映像の第2の特徴量から、前記第1または第2の映像の第1の特徴量を差し引いた特徴量差分値を符号化した特徴量差分値符号列とを生成し、
前記第1の特徴量符号列を復号し、前記第1または第2の映像の前記第1の特徴量を復元し、
前記特徴量差分値符号列を復号し、前記特徴量差分値を復元し、
前記特徴量差分値に前記第1の特徴量を加算して、前記第1または第2の映像の前記第2の特徴量を算出する
ことを特徴とする請求項34に記載の動画像照合方法。 - 前記多重分離では、前記境界情報も多重分離し、
前記第2の特徴量符号列の復号では、前記境界情報に基づいて前記特徴量差分値符号列を復号し、特徴量差分値を復元する
ことを特徴とする請求項36に記載の動画像照合方法。 - 前記第1および第2の映像の第1および第2の特徴量の復元では、
前記第1または第2の映像記述子を多重分離して、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を符号化した第1の特徴量符号列と、前記第1または第2の映像の前記ピクチャ内の境界で定まる位置より内側の領域内から抽出された第1または第2の映像の第2の特徴量を符号化した第2の特徴量符号列、および、前記第2の特徴量から、前記第1または第2の映像の第1の特徴量を差し引いた特徴量差分値を符号化した特徴量差分値符号列のうち、符号量の小さい方を含む第3の特徴量符号列と、前記第3の特徴量符号列に含まれる特徴量が前記特徴量差分値または前記第2の特徴量のいずれであるかを示すモード情報とを生成し、
前記第1の特徴量符号列を復号し、前記第1または第2の映像の前記第1の特徴量を復元し、
前記第3の特徴量符号列を入力し、その出力先を、前記モード情報に基づいて切り替え、
前記出力される前記第3の特徴量符号列を復号し、前記特徴量差分値を復元し、
前記出力される前記第3の特徴量符号列を復号し、前記第2の特徴量を復元し、
前記特徴量差分値に前記第1の特徴量を加算して、前記第2の特徴量を算出し、
前記第3の特徴量符号列を復号して復元した前記第2の特徴量と、前記特徴量差分値に前記第1の特徴量を加算して算出した前記第2の特徴量とを、前記モード情報によって切り替えながら合成して、前記第1または第2の映像の前記第2の特徴量を出力する
ことを特徴とする請求項34に記載の動画像照合方法。 - 前記第1および第2の映像の第1および第2の特徴量の復元では、
前記第1または第2の映像記述子を多重分離して、前記境界情報、または前記境界情報から決定された情報であって特徴ベクトルの各要素のうち差分符号化する要素のインデックスを示す差分符号化インデックスのいずれか一方と、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を符号化した第1の特徴量符号列と、前記第1または第2の映像の前記ピクチャ内の境界で定まる位置より内側の領域内から抽出された第1または第2の映像の第2の特徴量を符号化した第2の特徴量符号列、および、前記第2の特徴量から、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を差し引いた特徴量差分値を符号化した特徴列差分値符号列のうち、前記境界情報または前記差分符号化インデックス情報で定まる方を含む第3の特徴量符号列とを出力し、
前記境界情報を出力する場合には、前記境界情報から特徴ベクトルの各要素のうち、差分符号化する要素のインデックスを決定し、前記差分符号化インデックス情報として出力し、
前記第1の特徴量符号列を復号して、前記第1または第2の映像の前記第1の特徴量を復元し、
前記第3の特徴量符号列を入力し、その出力先を、前記差分インデックス情報に基づいて切り替え、
前記出力される前記第3の特徴量符号列を復号して、前記特徴量差分値を復元し、
前記出力される前記第3の特徴量符号列を復号して、前記第2の特徴量を復元し、
前記特徴量差分値に前記第1の特徴量を加算して、前記第2の特徴量を算出し、
前記第3の特徴量符号列を復号して復元した前記第2の特徴量と、前記特徴量差分値に前記第1の特徴量を加算して算出した前記第2の特徴量とを、前記差分符号化インデックス情報によって切り替えながら合成し、前記第1または第2の映像の前記第2の特徴量を出力する
ことを特徴とする請求項34に記載の動画像照合方法。 - 前記第1および第2の映像の第1および第2の特徴量の復元では、
前記第1または第2の映像記述子を多重分離して、前記境界情報、または前記境界情報から決定された情報であって特徴ベクトルの各要素のうち差分符号化する要素のインデックスを示す差分符号化インデックスのいずれか一方と、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を符号化した第1の特徴量符号列と、前記第1または第2の映像から検知された前記ピクチャ内の境界を示す境界情報を用いて定められた前記第1または第2の映像のピクチャ内の境界で定まる位置より内側の領域内から抽出された第1または第2の映像の第2の特徴量を符号化した第2の特徴量符号列、および、前記第2の特徴量から、前記第1または第2の映像のフレームまたはフィールドであるピクチャ毎に抽出された第1または第2の映像の第1の特徴量を差し引いた特徴量差分値を符号化した特徴列差分符号列のうち、前記差分符号化インデックス情報で指定されないインデックスの要素については前記第2の特徴量符号列を含み、前記差分符号化インデックス情報で指定されたインデックスの要素については符号量の小さい方を含む第3の特徴量符号列と、前記差分符号化インデックス情報で指定されたインデックスの要素について前記第2の特徴量符号列または前記特徴列差分符号列のうちのいずれを含むかを示すモード情報とを出力し、
前記境界情報を出力する場合には、前記境界情報から特徴ベクトルの各要素のうち、差分符号化する要素のインデックスを決定し、前記差分符号化インデックス情報として出力し、
前記第1の特徴量符号列を復号して、前記第1または第2の映像の前記第1の特徴量を復元し、
前記第3の特徴量符号列を入力し、その出力先を、前記差分符号化インデックス情報および前記モード情報に基づいて切り替え、
前記出力される前記第3の特徴量符号列を復号し、前記特徴量差分値を復元し、
前記出力される前記第3の特徴量符号列を復号して、前記第2の特徴量を復元し、
前記特徴量差分値に前記第1の特徴量を加算して、前記第2の特徴量を算出し、
前記第3の特徴量符号列を復号して復元した前記第2の特徴量と、前記特徴量差分値に前記第1の特徴量を加算して算出した前記第2の特徴量とを、前記差分インデックス情報と前記モード情報とによって切り替えながら合成し、前記第1または第2の映像の前記第2の特徴量を出力する
ことを特徴とする請求項34に記載の動画像照合方法。 - 前記第3の特徴量符号列の復号による前記特徴量差分値の復元では、前記境界情報に基づいて前記特徴量差分値符号列を復号し、特徴量差分値を復元する
ことを特徴とする請求項39または40に記載の動画像照合方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010547432A JP4883226B2 (ja) | 2009-01-23 | 2010-01-20 | 映像記述子生成装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009012812 | 2009-01-23 | ||
JP2009012812 | 2009-01-23 | ||
PCT/JP2010/000276 WO2010084737A1 (ja) | 2009-01-23 | 2010-01-20 | 映像記述子生成装置 |
JP2010547432A JP4883226B2 (ja) | 2009-01-23 | 2010-01-20 | 映像記述子生成装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011262738A Division JP2012084164A (ja) | 2009-01-23 | 2011-11-30 | 映像記述子生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4883226B2 true JP4883226B2 (ja) | 2012-02-22 |
JPWO2010084737A1 JPWO2010084737A1 (ja) | 2012-07-12 |
Family
ID=42355795
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010547432A Expired - Fee Related JP4883226B2 (ja) | 2009-01-23 | 2010-01-20 | 映像記述子生成装置 |
JP2011262738A Pending JP2012084164A (ja) | 2009-01-23 | 2011-11-30 | 映像記述子生成装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011262738A Pending JP2012084164A (ja) | 2009-01-23 | 2011-11-30 | 映像記述子生成装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9367616B2 (ja) |
EP (2) | EP2434416B1 (ja) |
JP (2) | JP4883226B2 (ja) |
KR (1) | KR101289928B1 (ja) |
CN (2) | CN104537127B (ja) |
WO (1) | WO2010084737A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537127B (zh) | 2009-01-23 | 2018-04-10 | 日本电气株式会社 | 视频描述符生成装置 |
US9258564B2 (en) * | 2012-02-07 | 2016-02-09 | Stmicroelectronics S.R.L. | Visual search system architectures based on compressed or compact feature descriptors |
CN108197631B (zh) * | 2012-07-23 | 2022-06-28 | 苹果公司 | 提供图像特征描述符的方法 |
CN104142939B (zh) * | 2013-05-07 | 2019-07-02 | 杭州智棱科技有限公司 | 一种基于运动特征信息匹配特征码的方法与设备 |
CN104144520A (zh) | 2013-05-07 | 2014-11-12 | 李东舸 | 一种设备间建立连接的方法、装置与系统 |
EP3092796B1 (en) * | 2014-01-07 | 2020-06-17 | Canon Kabushiki Kaisha | Method, device, and computer program for encoding inter-layer dependencies |
WO2015171815A1 (en) * | 2014-05-06 | 2015-11-12 | Nant Holdings Ip, Llc | Image-based feature detection using edge vectors |
US9544621B2 (en) | 2014-09-17 | 2017-01-10 | Google Inc. | Identification of captured videos |
US10095786B2 (en) * | 2015-04-09 | 2018-10-09 | Oath Inc. | Topical based media content summarization system and method |
JP6409792B2 (ja) * | 2016-02-10 | 2018-10-24 | 三菱電機株式会社 | 画像特徴記述子符号化装置、画像特徴記述子復号装置、画像特徴記述子符号化方法及び画像特徴記述子復号方法 |
CN106028158B (zh) * | 2016-05-26 | 2019-04-16 | 成都掌中全景信息技术有限公司 | 一种基于多视频源的进度识别方法 |
JP6530002B2 (ja) * | 2017-04-12 | 2019-06-12 | 日本電信電話株式会社 | コンテンツ探索装置、コンテンツ探索方法、プログラム |
CN108876813B (zh) * | 2017-11-01 | 2021-01-26 | 北京旷视科技有限公司 | 用于视频中物体检测的图像处理方法、装置及设备 |
CN110758354B (zh) * | 2019-10-16 | 2020-07-17 | 安徽诺乐知识产权服务有限公司 | 基于大数据采集的车辆紧急制动执行系统 |
US11263261B2 (en) * | 2020-02-14 | 2022-03-01 | Alibaba Group Holding Limited | Method and system for characteristic-based video processing |
CN113810695A (zh) * | 2020-06-15 | 2021-12-17 | 中国电信股份有限公司 | 视频编码方法、装置及计算机可读存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003122758A (ja) * | 2001-10-11 | 2003-04-25 | Canon Inc | 画像検索方法及び装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3780623B2 (ja) | 1997-05-16 | 2006-05-31 | 株式会社日立製作所 | 動画像の記述方法 |
JP2002117037A (ja) * | 2000-10-06 | 2002-04-19 | Nec Corp | 画像検索装置、並びに画像検索方法及びこれが書き込まれた記録媒体 |
JP2003319177A (ja) * | 2002-04-22 | 2003-11-07 | Canon Inc | 量子化処理装置及び方法とそれを用いたインクジェット記録装置 |
US7321623B2 (en) * | 2002-10-01 | 2008-01-22 | Avocent Corporation | Video compression system |
JP3793142B2 (ja) | 2002-11-15 | 2006-07-05 | 株式会社東芝 | 動画像加工方法及び装置 |
US7657126B2 (en) * | 2005-05-09 | 2010-02-02 | Like.Com | System and method for search portions of objects in images and features thereof |
JP4920928B2 (ja) * | 2005-08-08 | 2012-04-18 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
WO2007091243A2 (en) * | 2006-02-07 | 2007-08-16 | Mobixell Networks Ltd. | Matching of modified visual and audio media |
WO2007148264A1 (en) * | 2006-06-20 | 2007-12-27 | Koninklijke Philips Electronics N.V. | Generating fingerprints of video signals |
US8676810B2 (en) * | 2006-07-31 | 2014-03-18 | Ricoh Co., Ltd. | Multiple index mixed media reality recognition using unequal priority indexes |
WO2008018398A1 (fr) * | 2006-08-10 | 2008-02-14 | Nec Corporation | dispositif d'extraction de région d'objet |
JP5060565B2 (ja) * | 2006-11-30 | 2012-10-31 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 信号の信頼できる識別をするためのビデオ及びオーディオ信号内容の特徴の抽出 |
JP2009012812A (ja) | 2007-07-05 | 2009-01-22 | Sekisui Film Kk | 合成樹脂フィルム |
US8498487B2 (en) * | 2008-08-20 | 2013-07-30 | Sri International | Content-based matching of videos using local spatio-temporal fingerprints |
CN104537127B (zh) | 2009-01-23 | 2018-04-10 | 日本电气株式会社 | 视频描述符生成装置 |
US8260055B2 (en) * | 2009-03-27 | 2012-09-04 | The Nielsen Company (Us), Llc | Methods and apparatus for identifying primary media content in a post-production media content presentation |
-
2010
- 2010-01-20 CN CN201510047532.5A patent/CN104537127B/zh not_active Expired - Fee Related
- 2010-01-20 WO PCT/JP2010/000276 patent/WO2010084737A1/ja active Application Filing
- 2010-01-20 CN CN201080005232.6A patent/CN102292979B/zh not_active Expired - Fee Related
- 2010-01-20 JP JP2010547432A patent/JP4883226B2/ja not_active Expired - Fee Related
- 2010-01-20 KR KR20117017376A patent/KR101289928B1/ko active IP Right Grant
- 2010-01-20 EP EP11189661.9A patent/EP2434416B1/en not_active Not-in-force
- 2010-01-20 EP EP10733345A patent/EP2391122A4/en not_active Ceased
- 2010-01-20 US US13/144,758 patent/US9367616B2/en active Active
-
2011
- 2011-11-30 JP JP2011262738A patent/JP2012084164A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003122758A (ja) * | 2001-10-11 | 2003-04-25 | Canon Inc | 画像検索方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
US9367616B2 (en) | 2016-06-14 |
KR101289928B1 (ko) | 2013-07-25 |
US20110274355A1 (en) | 2011-11-10 |
EP2434416A3 (en) | 2012-08-29 |
CN102292979A (zh) | 2011-12-21 |
JPWO2010084737A1 (ja) | 2012-07-12 |
CN104537127A (zh) | 2015-04-22 |
EP2434416B1 (en) | 2018-08-15 |
JP2012084164A (ja) | 2012-04-26 |
CN102292979B (zh) | 2015-02-04 |
EP2391122A4 (en) | 2012-09-05 |
KR20110106414A (ko) | 2011-09-28 |
CN104537127B (zh) | 2018-04-10 |
EP2434416A2 (en) | 2012-03-28 |
WO2010084737A1 (ja) | 2010-07-29 |
EP2391122A1 (en) | 2011-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4883226B2 (ja) | 映像記述子生成装置 | |
JP4725690B2 (ja) | 映像識別子抽出装置 | |
CN102187672B (zh) | 压缩视频中的语法元素的兼容cabac/avc的水印加注 | |
JP4301193B2 (ja) | 画像比較装置及び方法、画像検索装置及び方法、並びにプログラム及び記録媒体 | |
JP4687834B2 (ja) | 映像記述子生成装置 | |
TW201304554A (zh) | 影像編碼方法、影像解碼方法、影像編碼裝置、影像解碼裝置、影像編碼程式及影像解碼程式 | |
KR20140058643A (ko) | 강건한 낮은 복잡도 비디오 핑거프린팅을 위한 장치 및 방법 | |
US10445613B2 (en) | Method, apparatus, and computer readable device for encoding and decoding of images using pairs of descriptors and orientation histograms representing their respective points of interest | |
JP5644505B2 (ja) | 照合加重情報抽出装置 | |
CN111654706B (zh) | 一种视频压缩方法、装置、设备及介质 | |
KR20070025853A (ko) | 이진 영상 압축 장치 및 방법 | |
Lin et al. | Adaptive lossless compression of skeleton sequences | |
Zhou et al. | Saliency Detection With Features From Compressed HEVC | |
Yu et al. | RGB-D video content identification | |
JP2015041796A (ja) | 画像処理方法、画像処理装置、画像処理プログラム、およびデータ構造 | |
JP2005175943A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム及び記録媒体 | |
JP2007243512A (ja) | 画像処理装置および画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111108 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111121 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141216 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4883226 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |