JP6031566B1 - 特徴抽出装置、画像検索装置、方法、及びプログラム - Google Patents

特徴抽出装置、画像検索装置、方法、及びプログラム Download PDF

Info

Publication number
JP6031566B1
JP6031566B1 JP2015150784A JP2015150784A JP6031566B1 JP 6031566 B1 JP6031566 B1 JP 6031566B1 JP 2015150784 A JP2015150784 A JP 2015150784A JP 2015150784 A JP2015150784 A JP 2015150784A JP 6031566 B1 JP6031566 B1 JP 6031566B1
Authority
JP
Japan
Prior art keywords
interest
region
feature
regions
local
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015150784A
Other languages
English (en)
Other versions
JP2017033168A (ja
Inventor
森 稔
稔 森
薫 平松
薫 平松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015150784A priority Critical patent/JP6031566B1/ja
Application granted granted Critical
Publication of JP6031566B1 publication Critical patent/JP6031566B1/ja
Publication of JP2017033168A publication Critical patent/JP2017033168A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】精度良く画像を識別するための特徴を抽出することができる。【解決手段】入力された画像を分割することによって得られる複数の部分領域である各着目領域について、着目領域をN個の局所領域に分割し、N個の局所領域における輝度の順位付けを表す、Nを表現するための最小ビット数にNを乗算したビット数のビット表現を、着目領域の局所Ordinary特徴として抽出し、複数の着目領域の各々について抽出された局所Ordinary特徴を、画像の特徴量として抽出する。【選択図】図2

Description

本発明は、特徴抽出装置、画像検索装置、方法、及びプログラムに関する。
従来、フレーム画像を複数の局所矩形に分割し、各局所矩形内に含まれる画素の輝度値の平均値を、各フレーム画像のおおまかな概要として記述して、輝度特徴とする方法が知られている(図13参照)。
また、輝度特徴と同様に矩形分割及び平均輝度値の算出を行い、輝度値順にソーティングし、順序を特徴値として使用する方法が知られている(非特許文献1)。図14に示すように、順序の値を特徴として使用するため、フレーム全体で明るくなったり暗くなったりしても、絶対的な輝度値の変化にロバストとなる。
また、フレーム画像の各画素をソーティングして順序付けを行い、順序を複数のビンに分割し、図15に示すように、各局所矩形内でビンに投票し、投票値を特徴値として使用する方法が知られている(非特許文献2)。絶対的な輝度値の変化にロバストとなり、ビン分割により記述能力を向上させることができる。
しかしながら、従来技術では、画像や映像の明るさや色などが部分的に変化したり、調整されたりした場合や、キャプションなど一部に編集ノイズが入った場合には、特徴量の各値が変動してしまい、画像の識別精度が高くない、という問題がある。
本発明は、上記問題点を解決するために成されたものであり、精度良く画像を識別するための特徴を抽出することができる特徴抽出装置、方法、及びプログラムを提供することを目的とする。
また、精度よく画像を識別することができる画像検索装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明の特徴抽出装置は、入力された画像を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域をN個の局所領域に分割し、前記N個の局所領域における輝度の順位付けを表す、Nを表現するためのビット数にNを乗算したビット数のビット表現を、前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を、前記画像の特徴量として抽出する特徴量抽出部を含んで構成されている。
第2の発明の特徴抽出方法は、特徴量抽出部が、入力された画像を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域をN個の局所領域に分割し、前記N個の局所領域における輝度の順位付けを表す、Nを表現するためのビット数にNを乗算したビット数のビット表現を、前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を、前記画像の特徴量として抽出する。
第1の発明及び第2の発明によれば、着目領域について、N個の局所領域における輝度の順位付けを表す、Nを表現するためのビット数にNを乗算したビット数のビット表現を、着目領域の特徴として抽出することにより、精度良く画像を識別するための特徴を抽出することができる。
第3の発明に係る特徴抽出装置は、入力された画像を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域をN個の局所領域に分割し、前記N個の局所領域における輝度の順位付けを表す、Nの階乗で求まる数を表現するためのビット数のビット表現を、前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を、前記画像の特徴量として抽出する特徴量抽出部を含んで構成されている。
第3の発明によれば、着目領域について、N個の局所領域における輝度の順位付けを表す、Nの階乗で求まる数を表現するためのビット数のビット表現を、着目領域の特徴として抽出することにより、精度良く画像を識別するための特徴を抽出することができる。
第4の発明に係る特徴抽出装置は、入力された複数のフレーム画像の各々を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域を複数の局所領域に分割し、前記複数のフレーム画像にまたがって同じ位置から得られる前記着目領域における全局所領域での輝度の順位付けを、前記複数のフレーム画像における前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を、前記複数のフレーム画像の特徴量として抽出する特徴量抽出部を含んで構成されている。
第4の発明によれば、着目領域について、複数のフレーム画像にまたがって同じ位置から得られる着目領域における全局所領域における輝度の順位付けを、複数のフレーム画像における着目領域の特徴として抽出することにより、精度良く画像を識別するための特徴を抽出することができる。
第5の発明に係る特徴抽出装置は、入力された画像を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域を複数の局所領域に分割し、前記着目領域における各画素の輝度の順位付けに基づいて、前記複数の局所領域の各々に対し、前記局所領域内の画素の順位に基づくヒストグラムを作成し、前記複数の局所領域の各々に対して作成されたヒストグラムを前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を、前記画像の特徴量として抽出する特徴量抽出部を含んで構成されている。
第6の発明に係る特徴抽出方法は、特徴量抽出部が、入力された画像を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域を複数の局所領域に分割し、前記着目領域における各画素の輝度の順位付けに基づいて、前記複数の局所領域の各々に対し、前記局所領域内の画素の順位に基づくヒストグラムを作成し、前記複数の局所領域の各々に対して作成されたヒストグラムを前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を、前記画像の特徴量として抽出する。
第5の発明及び第6の発明によれば、着目領域について、着目領域における各画素の輝度の順位付けに基づいて、複数の局所領域の各々に対し、局所領域内の画素の順位に基づくヒストグラムを作成し、複数のフレーム画像における着目領域の特徴として抽出することにより、精度良く画像を識別するための特徴を抽出することができる。
第7の発明に係る特徴抽出装置は、入力された複数のフレーム画像の各々を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域を複数の局所領域に分割し、前記複数のフレーム画像にまたがって同じ位置から得られる前記着目領域における全画素での輝度の順位付けに基づいて、前記複数のフレーム画像の各々の前記着目領域における前記複数の局所領域の各々に対し、前記局所領域内の画素の順位に基づくヒストグラムを作成し、前記複数のフレーム画像の各々の前記着目領域における前記複数の局所領域の各々に対して作成されたヒストグラムを、前記複数のフレーム画像における前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を、前記複数のフレーム画像の特徴量として抽出する特徴量抽出部を含んで構成されている。
第7の発明によれば、着目領域について、複数のフレーム画像にまたがって同じ位置から得られる着目領域における全画素の輝度の順位付けに基づいて、複数のフレーム画像の各々の着目領域における複数の局所領域の各々に対し、局所領域内の画素の順位に基づくヒストグラムを作成し、複数のフレーム画像における着目領域の特徴として抽出することにより、精度良く画像を識別するための特徴を抽出することができる。
第8の発明に係る画像検索装置は、上記の特徴抽出装置と、クエリ画像について前記特徴抽出装置によって抽出された特徴量と、複数の参照画像について予め抽出された前記特徴量とに基づいて、前記クエリ画像に類似する参照画像を識別する識別処理部と、を含んで構成されている。
第8の発明によれば、精度よく画像を識別するための特徴を抽出して、クエリ画像に類似する参照画像を識別することにより、精度よく画像を識別することができる。
また、本発明のプログラムは、コンピュータを、上記の特徴抽出装置又は画像検索装置を構成する各部として機能させるためのプログラムである。
以上説明したように、特徴抽出装置、方法、及びプログラムによれば、精度良く画像を識別するための特徴を抽出することができる。
また、画像検索装置、方法、及びプログラムによれば、精度よく画像を識別することができる。
着目領域の一例を示す図である。 着目領域内の局所領域の一例を示す図である。 本発明の第1の実施の形態に係る画像検索装置の機能的構成を示すブロック図である。 本発明の実施の形態に係る画像検索装置における学習処理ルーチンを示すフローチャート図である。 本発明の実施の形態に係る画像検索装置における識別処理ルーチンを示すフローチャート図である。 着目フレーム画像と次のフレーム画像を示す図である。 複数のフレーム画像間における、3種類の特徴(XY平面、XT平面、YT平面)を説明するための図である。 着目領域内での順位付けを説明するための図である。 各局所領域で投票してヒストグラムを作成する方法を説明するための図である。 着目領域内の各局所領域のヒストグラムの一例を示す図である。 複数のフレーム画像間における着目領域内の各局所領域のヒストグラムの一例を示す図である。 複数のフレーム画像間における、3種類の特徴(XY平面、XT平面、YT平面)を説明するための図である。 従来技術における特徴を説明するための図である。 従来技術における特徴を説明するための図である。 従来技術における特徴を説明するための図である。
[第1の実施の形態]
以下、図面を参照して本発明の実施の形態を詳細に説明する。本実施の形態では、クエリ画像に類似するフレーム画像を検索する画像検索装置に本発明を適用した例について説明する。
<第1の実施の形態の概要>
上記非特許文献1に記載の手法では、画面全体を分割し、分割領域ごとに算出した平均輝度を算出し、順位付けを行って、特徴量としていた。これに対し、本実施の形態では、着目フレーム画像の一部である着目領域に区分けされた着目領域の各々を、さらに2以上の局所領域に分割し、当該着目領域内での局所領域の輝度の順位を付け、これを特徴とする(図1、図2参照)。この処理を着目フレーム画像内の他の着目領域に対しても行うことで、各着目領域の特徴を抽出する。本実施の形態では、着目領域を例えば4つの局所領域に分割し、当該着目領域内の局所領域の順位について各局所領域を2bitで表現することから、当該着目領域の特徴を、8bitで表現する。すなわち、着目領域をN個の局所領域に分割した場合、(Nを表現する最少ビット数)×N bitで、着目領域における順位付けを表現することができる。
このように、特徴に順序情報を使用することにより、輝度が変化しても順序さえ保たれていれば、輝度変化にロバストになる。また従来の画像全体ではなく、局所的に定義することにより、キャプションの挿入等、部分的に何か変動が起きても、それ以外の箇所には影響がない為、より安定した識別が可能になる。
<第1の実施の形態に係る画像検索装置の構成>
まず、本発明の第1の実施の形態に係る画像検索装置の構成について説明する。図3に示すように、本発明の実施の形態に係る画像検索装置100は、CPUと、RAMと、後述する学習処理ルーチン及び識別処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この画像検索装置100は、機能的には図1に示すように入力部10と、演算部12と、出力部50とを備えている。
入力部10は、複数の参照フレーム画像を受け付ける。また、入力部10は、クエリ画像を受け付ける。なお、入力部10は、ネットワーク等を介して外部から入力されたものを受け付けるようにしてもよい。
演算部12は、特徴記憶部20、学習部30、及び識別部40を含んで構成されている。
特徴記憶部20は、参照フレーム画像毎に、学習部30において抽出された特徴ベクトルを記憶している。
学習部30は、特徴抽出部32、及び特徴ベクトル作成部34を含んで構成されている。
特徴抽出部32は、入力部10において受け付けた、複数の参照フレーム画像の各々に対し、当該参照フレーム画像を分割した複数の着目領域の各々について、当該着目領域を更にN個の局所領域に分割し、N個の局所領域における輝度の順位付けを表す、Nを表現するためのビット数にNを乗算したビット数のビット表現を、当該着目領域の局所Ordinary特徴として抽出する。
具体的には、上記図2に示すように、当該参照フレーム画像を分割した複数の着目領域の各々について、当該着目領域を更に4個の局所領域に分割し、4個の局所領域における平均輝度の順位付けを表す、8bit表現(=2bit×4領域)を、当該着目領域の局所Ordinary特徴として抽出する。
特徴ベクトル作成部34は、複数の参照フレーム画像の各々に対し、特徴抽出部32において当該参照フレーム画像における複数の着目領域の各々について抽出された局所Ordinary特徴に基づいて、当該参照フレーム画像の特徴ベクトルを作成し、特徴記憶部20に記憶する。例えば、複数の着目領域の各々について抽出された8bit表現を連結して、特徴ベクトルを作成する。
識別部40は、特徴抽出部42、特徴ベクトル作成部44、及び識別処理部46を含んで構成されている。
特徴抽出部42は、入力部10において受け付けた、クエリ画像について、特徴抽出部32と同様に、クエリ画像を分割した複数の着目領域の各々の局所Ordinary特徴として、4個の局所領域における平均輝度の順位付けを表す、8bit表現(=2bit×4領域)を抽出する。
特徴ベクトル作成部44は、クエリ画像について、特徴ベクトル作成部34と同様に、複数の着目領域の各々について抽出された局所Ordinary特徴に基づいて、当該クエリ画像の特徴ベクトルを作成する。
識別処理部46は、特徴記憶部20に記憶されている参照フレーム画像毎に、特徴ベクトル作成部44においてクエリ画像について作成された特徴ベクトルと、特徴記憶部20に記憶されている当該参照フレーム画像の特徴ベクトルとに基づいて、クエリ画像と当該参照フレーム画像との類似値を算出する。
識別処理部46は、算出した参照フレーム画像毎の類似値に基づいて、最も類似値が高い参照フレーム画像を抽出し、抽出された参照フレーム画像を、クエリ画像に類似する画像の検索結果として出力部50に出力する。
<第1の実施の形態に係る画像検索装置の作用>
次に、第1の実施の形態に係る画像検索装置100の作用について説明する。まず、入力部10により、複数の参照フレーム画像が入力されると、画像検索装置100は、参照フレーム画像の各々について、図4に示す学習処理ルーチンを実行する。
ステップS100では、参照フレーム画像を受け付ける。
次に、ステップS102では、上記ステップS100で受け付けた参照フレーム画像における複数の着目領域のうち、対象の着目領域を選択する。
次に、ステップS104では、ステップS102で選択された対象の着目領域において、複数の局所領域における平均輝度の順位付けを表すビット表現を局所Ordinary特徴として抽出する。
そして、ステップS106では、全ての着目領域について、上記ステップS102〜S104の処理を実行したか否かを判定し、上記ステップS102〜S104の処理を実行していない着目領域が存在する場合には、上記ステップS102へ戻り、当該着目領域を、対象の着目領域として選択する。一方、全ての着目領域について、上記ステップS102〜S104の処理を実行した場合には、ステップS108へ進む。
ステップS108では、上記ステップS104で抽出された複数の着目領域の局所Ordinary特徴に基づいて、参照フレーム画像の特徴ベクトルを作成し、特徴記憶部20に記憶し、学習処理ルーチンを終了する。
次に、第1の実施の形態に係る画像検索装置100における識別処理ルーチンついて説明する。入力部10により、クエリ画像が入力されると、画像検索装置100は、図5に示す識別処理ルーチンを実行する。
まず、ステップS110では、入力部10により入力されたクエリ画像を受け付ける。
次に、ステップS112では、上記ステップS110で受け付けたクエリ画像における複数の着目領域のうち、対象の着目領域を選択する。
次に、ステップS114では、ステップS112で選択された対象の着目領域において、複数の局所領域における平均輝度の順位付けを表すビット表現を局所Ordinary特徴として抽出する。
そして、ステップS116では、全ての着目領域について、上記ステップS112〜S114の処理を実行したか否かを判定し、上記ステップS112〜S114の処理を実行していない着目領域が存在する場合には、上記ステップS112へ戻り、当該着目領域を、対象の着目領域として選択する。一方、全ての着目領域について、上記ステップS112〜S114の処理を実行した場合には、ステップS118へ進む。
ステップS118では、上記ステップS114で抽出された複数の着目領域の局所Ordinary特徴に基づいて、クエリ画像の特徴ベクトルを作成する。
次に、ステップS120では、対象となる参照フレーム画像を選択する。
次に、ステップS122では、ステップS120において選択された参照フレーム画像の特徴ベクトルと、ステップS118において作成した特徴ベクトルとに基づいて、当該参照フレーム画像との類似値を算出する。
次に、ステップS124では、全ての参照フレーム画像について処理を終了したか否かの判定を行う。全ての参照フレーム画像について処理を終了した場合には、ステップS126へ移行し、全ての参照フレーム画像について処理を終了していない場合には、上記ステップS120へ戻り、ステップS122〜ステップS124の処理を繰り返す。
次に、ステップS126では、ステップS122において算出した参照フレーム画像の各々との類似値に基づいて、類似値が最も高い参照フレーム画像を抽出し、クエリ画像と類似する画像の検索結果として、出力部50に出力して処理を終了する。
以上説明したように、第1の実施の形態に係る画像検索装置によれば、画像を分割した複数の着目領域について、N個の局所領域における輝度の順位付けを表す、Nを表現するための最小ビット数にNを乗算したビット数のビット表現を、着目領域の局所Ordinary特徴として抽出して、特徴ベクトルを作成することにより、精度良く画像を識別するための特徴を抽出することができる。
また、着目領域内の部分的な順位付けを利用することにより、部分的な非線形の輝度変化へ対応することができ、また、一部挿入による順序の変動を最小限に抑制することができる。これによって、よりロバストで、輝度変化や挿入に対して安定的な特徴を抽出することができる。
なお、上記の実施の形態では、着目領域内の各局所領域に対して、平均輝度による順位付けを行う場合を例に説明したが、これに限定されるものではなく、局所領域内から特定位置の画素をサンプリングし、その値を採用して、局所領域に対する順位付けを行うようにしてもよい。
[第2の実施の形態]
次に、第2の実施の形態に係る画像検索装置について説明する。なお、第2の実施の形態に係る画像検索装置は、第1の実施の形態と同様の構成となるため、同一符号を付して説明を省略する。
<第2の実施の形態の概要>
本実施の形態では、着目フレーム画像の一部である着目領域に区分けされた着目領域の各々を、例えば4つの局所領域に分割し、当該着目領域内での局所領域の輝度の順位を付け、これを特徴とする(上記図1、図2参照)。このとき、着目領域内の2×2の局所領域の順位の組み合わせは、4×3×2×1と表現でき、24通りあり、着目領域の特徴を5bitで表現する。すなわち、着目領域をN個の局所領域に分割した場合、Nの階乗で求まる数を表現する最少ビット数で順位付けを表現し、着目領域の特徴とする。これによって、上記第1の実施の形態に比べて少ない情報量で着目領域の特徴量を定めることができる。
<第2の実施の形態に係る画像検索装置の構成>
第2の実施の形態における特徴抽出部32は、入力部10において受け付けた、複数の参照フレーム画像の各々に対し、当該参照フレーム画像を分割した複数の着目領域の各々について、当該着目領域をN個の局所領域に分割し、N個の局所領域における輝度の順位付けを表す、Nの階乗で求まる数を表現するためのビット数のビット表現を、当該着目領域の局所Ordinary特徴として抽出する。
具体的には、上記図2に示すように、当該参照フレーム画像を分割した複数の着目領域の各々について、当該着目領域を4個の局所領域に分割し、4個の局所領域における平均輝度の順位の組み合わせを表す、5bit表現を、当該着目領域の局所Ordinary特徴として抽出する。
特徴抽出部42は、入力部10において受け付けた、クエリ画像について、特徴抽出部32と同様に、クエリ画像を分割した複数の着目領域の各々の局所Ordinary特徴として、4個の局所領域における平均輝度の順位付けを表す、5bit表現を抽出する。
なお、第2の実施の形態に係る画像検索装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第2の実施の形態に係る画像検索装置によれば、画像を分割した複数の着目領域について、N個の局所領域における輝度の順位付けを表す、Nの階乗で求まる数を表現するための最小ビット数のビット表現を、着目領域の局所Ordinary特徴として抽出して、特徴ベクトルを作成することにより、精度良く画像を識別するための特徴を抽出することができる。
[第3の実施の形態]
次に、第3の実施の形態に係る画像検索装置について説明する。なお、第3の実施の形態に係る画像検索装置の構成は、第1の実施の形態と同様の構成であるため、同一符号を付して説明を省略する。
本実施の形態では、クエリ映像に類似する参照映像を検索する画像検索装置に本発明を適用した例について説明する。
<第3の実施の形態の概要>
第3の実施の形態では、上記第1の実施の形態又は第2の実施の形態で説明した局所Ordinary特徴を、時系列方向へ拡張し、複数のフレーム画像を用いて、時系列方向での特徴抽出を行う。図6に示すように、複数のフレーム画像にまたがって同じ位置から得られる着目領域内の局所領域に対し、輝度の順位付けを行い、これを3次元局所Ordinary特徴とする。この処理を他の着目領域に対しても行うことで、各着目領域の3次元局所Ordinary特徴を抽出する。本実施の形態では、着目領域を例えば4つの局所領域に分割し、2つのフレーム画像にまたがって同じ位置から得られる当該着目領域内の局所領域の順位について各局所領域を3bitで表現することから、当該着目領域の3次元局所Ordinary特徴を、24bitで表現する。すなわち、フレーム数をMとし、着目領域をN個の局所領域に分割した場合、(M×Nを表現する最少ビット数)×M×N bitで、着目領域における順位付けを表現する。なお、複数のフレーム画像は、必ずしも前後に隣接するフレームでなくてもよい。
これにより、複数のフレーム画像からなる映像データに対し、フレーム間の変化も順序として定義されるため、ロバストな情報と時間変位を同時に抽出して、より安定した、時間情報の変位を含んだ表現が可能になる。
<第3の実施の形態に係る画像検索装置の構成>
本発明の第3の実施の形態に係る画像検索装置100の入力部10は、複数の参照フレーム画像からなる複数の参照映像を受け付ける。また、入力部10は、複数のフレーム画像からなるクエリ映像を受け付ける。なお、入力部10は、ネットワーク等を介して外部から入力されたものを受け付けるようにしてもよい。
特徴記憶部20は、参照映像毎に、学習部30において抽出された特徴ベクトルを記憶している。
特徴抽出部32は、入力部10において受け付けた、複数の参照映像毎に、当該参照映像内の最初の参照フレーム画像を着目フレーム画像として、参照フレーム画像を分割した複数の着目領域の各々について、当該着目フレーム画像及び次の参照フレーム画像の各々における当該着目領域をN個の局所領域に分割し、2×N個の局所領域における輝度の順位付けを表す、2×Nを表現するためのビット数に2×Nを乗算したビット数のビット表現を、当該着目領域の3次元局所Ordinary特徴として抽出する。
具体的には、上記図6に示すように、複数の着目領域の各々について、当該着目フレーム画像及び次の参照フレーム画像の各々における当該着目領域を4個の局所領域に分割し、2×4個の局所領域における平均輝度の順位付けを表す、24bit表現(=3bit×8領域)を、参照映像の当該着目領域の3次元局所Ordinary特徴として抽出する。
特徴ベクトル作成部34は、参照映像の各々に対し、特徴抽出部32において当該参照映像における複数の着目領域の各々について抽出された3次元局所Ordinary特徴に基づいて、当該参照映像の特徴ベクトルを作成し、特徴記憶部20に記憶する。例えば、複数の着目領域の各々について抽出された24bit表現を連結して、特徴ベクトルを作成する。
特徴抽出部42は、入力部10において受け付けた、クエリ映像について、最初のフレーム画像を着目フレーム画像とし、特徴抽出部32と同様に、着目領域の各々の3次元局所Ordinary特徴として、2×4個の局所領域における平均輝度の順位付けを表す、24bit表現(=3bit×8領域)を抽出する。
特徴ベクトル作成部44は、クエリ映像について、特徴ベクトル作成部34と同様に、複数の着目領域の各々について抽出された3次元局所Ordinary特徴に基づいて、当該クエリ映像の特徴ベクトルを作成する。
識別処理部46は、特徴記憶部20に記憶されている参照映像毎に、特徴ベクトル作成部44においてクエリ映像の着目フレーム画像について作成された特徴ベクトルと、特徴記憶部20に記憶されている当該参照映像の特徴ベクトルとに基づいて、クエリ映像と当該参照映像との類似値を算出する。
識別処理部46は、算出した参照映像毎の類似値に基づいて、最も類似値が高い参照映像を抽出し、抽出された参照映像を、クエリ映像に類似する映像の検索結果として出力部50に出力する。
なお、第3の実施の形態に係る画像検索装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第3の実施の形態に係る画像検索装置によれば、画像を分割した複数の着目領域について、複数のフレーム画像にまたがって同じ位置から得られる着目領域の複数の局所領域における輝度の順位付けを、映像における着目領域の3次元局所Ordinary特徴として抽出して、特徴ベクトルを作成することにより、精度良く映像を識別するための特徴を抽出することができる。
また、局所Ordinary特徴を時系列方向へ拡張し、着目領域のフレーム間で順序付けを行うことにより、ロバストな情報と時間変位とを同時に抽出することができる。
なお、3次元局所Ordinary特徴のビット表現として、第2の実施の形態で説明したビット表現を用いても良い。
また、図7に示すように、複数のフレーム画像間において、3種類の特徴(XY平面、XT平面、YT平面)を抽出するようにしてもよい。例えば、着目領域に応じて、着目フレーム画像及び次のフレーム画像における着目領域(XT平面の3次元、YT平面の3次元)から、3次元局所Ordinary特徴を抽出し、着目フレーム画像のみにおける着目領域(XY平面の2次元)から、局所Ordinary特徴を抽出するようにしてもよい。また、これに限定されるものではなく、時間要素を持つ平面(XT平面、YT平面)を少なくとも1つ含むように各着目領域の3次元局所Ordinary特徴又は局所Ordinary特徴を抽出するようにすればよい。
また、着目フレーム画像及び次のフレーム画像の着目領域において順位付けを行って3次元局所Ordinary特徴を抽出する場合を例に説明したが、これに限定されるものではなく、隣接しない複数のフレーム画像の着目領域において順位付けを行って3次元局所Ordinary特徴を抽出するようにしてもよい。また、着目フレーム画像及び前後のフレーム画像の着目領域において順位付けを行って3次元局所Ordinary特徴を抽出するようにしてもよい。
[第4の実施の形態]
次に、第4の実施の形態に係る画像検索装置について説明する。なお、第4の実施の形態に係る画像検索装置の構成は、第1の実施の形態と同様の構成であるため、同一符号を付して説明を省略する。
<第4の実施の形態の概要>
上記非特許文献2に記載の方法では画面全体の各画素に対して順序付けを行い、度数分布(ヒストグラム)を取っていた。これに対し、本実施の形態では、図8に示すように、着目領域内を、例えば4つの局所領域に分けると共に、着目領域内で局所的に画素の順位付けを行い、図9に示すように、局所領域毎に、局所領域内の画素に対する順位に基づくヒストグラムを作成する。図9の投票結果は、各局所領域におけるヒストグラムを示している。
図8、図9の例では、8×8画素領域を着目領域とし、64画素の輝度の順位付けとして、0位から63位を、各画素に付与し、着目領域内の各局所領域で、順位に関する各ビンの度数分布を表すヒストグラムを作成する。
このように、部分的な順位づけを行うことによって、一部挿入による順位の変動を最小限に抑制でき、よりロバストで安定的な特徴抽出を可能とする。
<第4の実施の形態に係る画像検索装置の構成>
第4の実施の形態における特徴抽出部32は、入力部10において受け付けた、複数の参照フレーム画像の各々に対し、当該参照フレーム画像を分割した複数の着目領域の各々について、当該着目領域を更にN個の局所領域に分割すると共に、当該着目領域内の各画素の順位付けを行い、N個の局所領域の各々について、当該局所領域内の各画素の順位に基づくヒストグラムを作成し、N個の局所領域の各々のヒストグラムを、当該着目領域の局所OSID特徴として抽出する。
具体的には、図10に示すように、当該参照フレーム画像における複数の着目領域の各々について、当該着目領域を4個の局所領域に分割し、4個の局所領域の各々について局所領域内の輝度の順位に基づくヒストグラムを作成し、局所領域内の輝度の順位に基づくヒストグラムを表すベクトルを連結して、当該着目領域の局所OSID特徴として抽出する。
特徴抽出部42は、入力部10において受け付けた、クエリ画像について、特徴抽出部32と同様に、クエリ画像を分割した複数の着目領域の各々の局所OSID特徴として、4個の局所領域の各々について局所領域内の輝度の順位に基づくヒストグラムを作成し、局所領域内の輝度の順位に基づくヒストグラムを表すベクトルを連結して抽出する。
なお、第4の実施の形態に係る画像検索装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第4の実施の形態に係る画像検索装置によれば、画像を分割した複数の着目領域について、着目領域における各画素の輝度の順位付けに基づいて、複数の局所領域の各々に対し、局所領域内の画素の順位に基づくヒストグラムを作成し、複数のフレーム画像における着目領域の局所OSID特徴として抽出して、特徴ベクトルを作成することにより、精度良く画像を識別するための特徴を抽出することができる。
また、着目領域内の部分的な順位付けを利用することにより、部分的な非線形の輝度変化へ対応することができ、また、一部挿入による順序の変動を最小限に抑制することができる。これによって、よりロバストで、輝度変化や挿入に対して安定的な特徴を抽出することができる。
[第5の実施の形態]
次に、第5の実施の形態に係る画像検索装置について説明する。なお、第5の実施の形態に係る画像検索装置の構成は、第1の実施の形態と同様の構成であるため、同一符号を付して説明を省略する。
本実施の形態では、クエリ映像に類似する参照映像を検索する画像検索装置に本発明を適用した例について説明する。
<第5の実施の形態の概要>
第5の実施の形態では、上記第4の実施の形態で説明した局所OSID特徴を、時系列方向へ拡張し、複数のフレーム画像を用いて、時系列方向での特徴抽出を行う。図11に示すように、複数のフレーム画像にまたがって同じ位置から得られる着目領域内の各画素の輝度の順位付けを行い、複数のフレーム画像における各局所領域のヒストグラムを3次元局所OSID特徴とする。この処理を他の着目領域に対しても行うことで、各着目領域の3次元局所OSID特徴を抽出する。本実施の形態では、着目領域を例えば4つの局所領域に分割し、当該着目領域について、2つのフレーム画像における8つの局所領域のヒストグラムを、3次元局所OSID特徴として抽出する。なお、複数のフレーム画像は、必ずしも前後に隣接するフレームでなくてもよい。
これにより、複数のフレーム画像からなる映像データに対し、フレーム間の変化も順序として定義されるため、ロバストな情報と時間変位を同時に抽出して、より安定した、時間情報の変位を含んだ表現が可能になる。
<第5の実施の形態に係る画像検索装置の構成>
本発明の第5の実施の形態に係る画像検索装置100の入力部10は、複数の参照フレーム画像からなる複数の参照映像を受け付ける。また、入力部10は、複数のフレーム画像からなるクエリ映像を受け付ける。なお、入力部10は、ネットワーク等を介して外部から入力されたものを受け付けるようにしてもよい。
特徴記憶部20は、複数の参照映像毎に、学習部30において抽出された特徴ベクトルを記憶している。
特徴抽出部32は、入力部10において受け付けた、複数の参照映像毎に、当該参照映像内の最初の参照フレーム画像を着目フレーム画像として、複数の着目領域の各々について、当該着目フレーム画像及び次の参照フレーム画像の各々における当該着目領域をN個の局所領域に分割すると共に、当該着目フレーム画像及び次の参照フレーム画像の各々における当該着目領域内で、輝度に応じた各画素の順位付けを行い、2×N個の局所領域について、各画素の輝度の順位に基づくヒストグラムを作成し、当該着目領域の3次元局所OSID特徴として抽出する。
具体的には、上記図11に示すように、複数の着目領域の各々について、当該着目フレーム画像及び次の参照フレーム画像の各々における当該着目領域を4個の局所領域に分割し、2×4個の局所領域について、画素の順位に基づくヒストグラムを作成し、作成したヒストグラムを表すベクトルを連結して、参照映像の当該着目領域の3次元局所OSID特徴として抽出する。
特徴ベクトル作成部34は、参照映像の各々に対し、特徴抽出部32において当該参照映像における複数の着目領域の各々について抽出された3次元局所OSID特徴に基づいて、当該参照映像の特徴ベクトルを作成し、特徴記憶部20に記憶する。例えば、複数の着目領域の各々について抽出された3次元局所OSID特徴を連結して、特徴ベクトルを作成する。
特徴抽出部42は、入力部10において受け付けた、クエリ映像について、最初のフレーム画像を着目フレーム画像とし、特徴抽出部32と同様に、着目領域の各々の3次元局所OSID特徴として、2×4個の局所領域についての各画素の輝度の順位に基づくヒストグラムを作成する。
特徴ベクトル作成部44は、クエリ映像について、特徴ベクトル作成部34と同様に、複数の着目領域の各々について抽出された3次元局所OSID特徴に基づいて、当該クエリ映像の特徴ベクトルを作成する。
識別処理部46は、特徴記憶部20に記憶されている参照映像毎に、特徴ベクトル作成部44においてクエリ映像について作成された特徴ベクトルと、特徴記憶部20に記憶されている当該参照映像の特徴ベクトルとに基づいて、クエリ映像と当該参照映像との類似値を算出する。
識別処理部46は、算出した参照映像毎の類似値に基づいて、最も類似値が高い参照映像を抽出し、抽出された参照映像を、クエリ映像に類似する映像の検索結果として出力部50に出力する。
なお、第5の実施の形態に係る画像検索装置の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第5の実施の形態に係る画像検索装置によれば、画像を分割した複数の着目領域について、複数のフレーム画像にまたがって同じ位置から得られる着目領域における各画素の輝度の順位付けに基づいて、複数のフレーム画像の各々の着目領域における複数の局所領域の各々に対し、局所領域内の画素の順位に基づくヒストグラムを作成し、映像における着目領域の3次元局所OSID特徴として抽出して、特徴ベクトルを作成することにより、精度良く映像を識別するための特徴を抽出することができる。
また、局所OSID特徴を時系列方向へ拡張し、着目領域のフレーム間で順序付けを行うことにより、ロバストな情報と時間変位とを同時に抽出することができる。
なお、3次元局所OSID特徴のビット表現として、第2の実施の形態で説明したビット表現を用いても良い。
また、図12に示すように、複数のフレーム画像間において、3種類の特徴(XY平面、XT平面、YT平面)を抽出するようにしてもよい。例えば、着目領域に応じて、着目フレーム画像及び次のフレーム画像における着目領域(XT平面の3次元、YT平面の3次元)から、3次元局所OSID特徴を抽出し、着目フレーム画像のみにおける着目領域(XY平面の2次元)から、局所OSID特徴を抽出するようにしてもよい。また、また、これに限定されるものではなく、時間要素を持つ平面(XT平面、YT平面)を少なくとも1つ含むように各着目領域の3次元局所OSID特徴又は局所OSID特徴を抽出するようにすればよい。
また、着目フレーム画像及び次のフレーム画像の着目領域において順位付けを行って3次元局所OSID特徴を抽出する場合を例に説明したが、これに限定されるものではなく、隣接しない複数のフレーム画像の着目領域において順位付けを行って3次元局所OSID特徴を抽出するようにしてもよい。また、着目フレーム画像及び前後のフレーム画像の着目領域において順位付けを行って3次元局所OSID特徴を抽出するようにしてもよい。
また、上記の実施の形態においては、学習部と識別部とを同一のコンピュータで構成する場合について説明したが、これに限定されるものではなく、別々のコンピュータで構成するようにしてもよい。
また、本実施の形態においては、プログラムが予めインストールされている実施の形態として説明したが、これに限定されるものではなく、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 入力部
12 演算部
20 特徴記憶部
30 学習部
32 特徴抽出部
34 特徴ベクトル作成部
40 識別部
42 特徴抽出部
44 特徴ベクトル作成部
46 識別処理部
50 出力部
100 画像検索装置

Claims (9)

  1. 入力された画像を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域をN個の局所領域に分割し、前記N個の局所領域における平均輝度の順位付けを表す、Nを表現するためのビット数にNを乗算したビット数のビット表現を、前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を連結して、前記画像の特徴量として抽出する特徴量抽出部
    を含む特徴抽出装置。
  2. 入力された画像を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域をN個の局所領域に分割し、前記N個の局所領域における平均輝度の順位付けを表す、Nの階乗で求まる数を表現するためのビット数のビット表現を、前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を連結して、前記画像の特徴として抽出する特徴量抽出部
    を含む特徴抽出装置。
  3. 入力された複数のフレーム画像の各々を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域を複数の局所領域に分割し、前記複数のフレーム画像にまたがって同じ位置から得られる前記着目領域における全局所領域での輝度の順位付けを、前記複数のフレーム画像における前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を、前記複数のフレーム画像の特徴量として抽出する特徴量抽出部
    を含む特徴抽出装置。
  4. 入力された画像を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域を複数の局所領域に分割し、前記着目領域における各画素の輝度の順位付けに基づいて、前記複数の局所領域の各々に対し、前記局所領域内の画素の順位に基づく、順位に関する各ビンの度数分布を表すヒストグラムを作成し、前記複数の局所領域の各々に対して作成されたヒストグラムを前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を、前記画像の特徴量として抽出する特徴量抽出部
    を含む特徴抽出装置。
  5. 入力された複数のフレーム画像の各々を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域を複数の局所領域に分割し、前記複数のフレーム画像にまたがって同じ位置から得られる前記着目領域における全画素での輝度の順位付けに基づいて、前記複数のフレーム画像の各々の前記着目領域における前記複数の局所領域の各々に対し、前記局所領域内の画素の順位に基づくヒストグラムを作成し、前記複数のフレーム画像の各々の前記着目領域における前記複数の局所領域の各々に対して作成されたヒストグラムを、前記複数のフレーム画像における前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を、前記複数のフレーム画像の特徴量として抽出する特徴量抽出部
    を含む特徴抽出装置。
  6. 請求項1〜請求項5の何れか1項記載の特徴抽出装置と、
    クエリ画像について前記特徴抽出装置によって抽出された特徴量と、複数の参照画像について予め抽出された前記特徴量とに基づいて、前記クエリ画像に類似する参照画像を識別する識別処理部と、
    を含む画像検索装置。
  7. 特徴量抽出部が、入力された画像を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域をN個の局所領域に分割し、前記N個の局所領域における平均輝度の順位付けを表す、Nを表現するためのビット数にNを乗算したビット数のビット表現を、前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を連結して、前記画像の特徴量として抽出する
    特徴抽出方法。
  8. 特徴量抽出部が、入力された画像を分割することによって得られる複数の部分領域である各着目領域について、前記着目領域を複数の局所領域に分割し、前記着目領域における各画素の輝度の順位付けに基づいて、前記複数の局所領域の各々に対し、前記局所領域内の画素の順位に基づく、順位に関する各ビンの度数分布を表すヒストグラムを作成し、前記複数の局所領域の各々に対して作成されたヒストグラムを前記着目領域の特徴として抽出し、前記着目領域の各々について抽出された特徴を、前記画像の特徴量として抽出する
    特徴抽出方法。
  9. コンピュータを、請求項1〜請求項5の何れか1項記載の特徴抽出装置、又は請求項6記載の画像検索装置を構成する各部として機能させるためのプログラム。
JP2015150784A 2015-07-30 2015-07-30 特徴抽出装置、画像検索装置、方法、及びプログラム Active JP6031566B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015150784A JP6031566B1 (ja) 2015-07-30 2015-07-30 特徴抽出装置、画像検索装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015150784A JP6031566B1 (ja) 2015-07-30 2015-07-30 特徴抽出装置、画像検索装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP6031566B1 true JP6031566B1 (ja) 2016-11-24
JP2017033168A JP2017033168A (ja) 2017-02-09

Family

ID=57358761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015150784A Active JP6031566B1 (ja) 2015-07-30 2015-07-30 特徴抽出装置、画像検索装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6031566B1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7224817B2 (ja) * 2018-09-06 2023-02-20 キヤノンメディカルシステムズ株式会社 信号データ処理装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018802A (ja) * 2000-07-21 2005-01-20 Lg Electronics Inc ヒストグラムの量子化方法
JP2006119723A (ja) * 2004-10-19 2006-05-11 Canon Inc 画像処理装置、画像処理方法
JP2007300191A (ja) * 2006-04-27 2007-11-15 Fujitsu Ltd 赤外線画像処理装置および赤外線画像処理方法
JP2009278181A (ja) * 2008-05-12 2009-11-26 Canon Inc 電子透かし情報埋め込み装置及び方法、並びに、電子透かし情報抽出装置及び方法
JP2012501011A (ja) * 2008-08-22 2012-01-12 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 画像解析方法及びシステム
JP2013069838A (ja) * 2011-09-22 2013-04-18 Nec Corp 回路基板の個体識別装置および個体識別方法
JPWO2013065220A1 (ja) * 2011-11-02 2015-04-02 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像認識装置、画像認識方法、及び集積回路

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018802A (ja) * 2000-07-21 2005-01-20 Lg Electronics Inc ヒストグラムの量子化方法
JP2006119723A (ja) * 2004-10-19 2006-05-11 Canon Inc 画像処理装置、画像処理方法
JP2007300191A (ja) * 2006-04-27 2007-11-15 Fujitsu Ltd 赤外線画像処理装置および赤外線画像処理方法
JP2009278181A (ja) * 2008-05-12 2009-11-26 Canon Inc 電子透かし情報埋め込み装置及び方法、並びに、電子透かし情報抽出装置及び方法
JP2012501011A (ja) * 2008-08-22 2012-01-12 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 画像解析方法及びシステム
JP2013069838A (ja) * 2011-09-22 2013-04-18 Nec Corp 回路基板の個体識別装置および個体識別方法
JPWO2013065220A1 (ja) * 2011-11-02 2015-04-02 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像認識装置、画像認識方法、及び集積回路

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6016026620; 流郷 達人: '標本化順位相関に基づくロバスト画像照合' 画像電子学会誌 第31巻 第3号 第31巻 第3号, 20020525, P.363-369, 画像電子学会 *

Also Published As

Publication number Publication date
JP2017033168A (ja) 2017-02-09

Similar Documents

Publication Publication Date Title
JP5229744B2 (ja) 画像分類装置および画像分類プログラム
US20090119583A1 (en) Image displaying apparatus, image display method, and image display system
JP2008257460A (ja) 情報処理装置、情報処理方法、およびプログラム
JP4374902B2 (ja) 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム
US9430718B1 (en) Efficient local feature descriptor filtering
JP2015011585A (ja) 画像処理装置、画像形成装置、画像形成システム、画像処理方法およびプログラム
KR20150112535A (ko) 비디오 대표 이미지 관리 장치 및 방법
US9549162B2 (en) Image processing apparatus, image processing method, and program
US8385656B2 (en) Image processing apparatus, image processing method and program
KR20180067909A (ko) 영상 분할 장치 및 방법
JP6387026B2 (ja) 書籍探索装置、方法及びプログラム
KR101833943B1 (ko) 동영상의 주요 장면을 추출 및 탐색하는 방법 및 시스템
JP2018201161A (ja) 移動体追跡装置、移動体追跡方法およびプログラム
JP6031566B1 (ja) 特徴抽出装置、画像検索装置、方法、及びプログラム
US9678991B2 (en) Apparatus and method for processing image
CN104504429B (zh) 二维码生成方法和装置
US20220414393A1 (en) Methods and Systems for Generating Composite Image Descriptors
JP6778625B2 (ja) 画像検索システム、画像検索方法及び画像検索プログラム
US20160162752A1 (en) Retrieval apparatus, retrieval method, and computer program product
JP6950376B2 (ja) 画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラム
JP6387028B2 (ja) 探索書籍表示装置、方法及びプログラム
JP6336827B2 (ja) 画像検索装置、画像検索方法および検索システム
JP2014225118A (ja) 画像処理装置及び画像処理プログラム
JP4205517B2 (ja) 奥行情報を含んだ画像の分類装置およびプログラム
JP6387027B2 (ja) 書籍探索装置、方法及びプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161024

R150 Certificate of patent or registration of utility model

Ref document number: 6031566

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150