JP6950376B2 - 画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラム - Google Patents

画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラム Download PDF

Info

Publication number
JP6950376B2
JP6950376B2 JP2017168919A JP2017168919A JP6950376B2 JP 6950376 B2 JP6950376 B2 JP 6950376B2 JP 2017168919 A JP2017168919 A JP 2017168919A JP 2017168919 A JP2017168919 A JP 2017168919A JP 6950376 B2 JP6950376 B2 JP 6950376B2
Authority
JP
Japan
Prior art keywords
image
training
image sequence
sequence
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017168919A
Other languages
English (en)
Other versions
JP2019046184A (ja
Inventor
周平 田良島
周平 田良島
之人 渡邉
之人 渡邉
隆行 黒住
隆行 黒住
杵渕 哲也
哲也 杵渕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017168919A priority Critical patent/JP6950376B2/ja
Publication of JP2019046184A publication Critical patent/JP2019046184A/ja
Application granted granted Critical
Publication of JP6950376B2 publication Critical patent/JP6950376B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラムに関し、特に、画像中の被写体を識別するための画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラムに関する。
画像をクエリとして、事前に構築された画像データベース(DB)からクエリに写る内容(コンテンツ)を識別したり、類似した内容を検索したりする被写体識別・検索技術は、視覚的な情報を手がかりとして、対象に関する情報取得や、撮影者自身の自己位置推定、対象の登録を実現するための必須技術である。
通常、被写体識別・検索技術の入力となる画像は、被写体から反射してきた光が、カメラやスマートフォン等撮像デバイス中のレンズで集光され、CCD/CMOS等撮像素子で結像し電気信号へと変換されることで生成(イメージング)される。
特開2015−201123号公報
T.Merten et al., Exposure Fusion: A Simple and Practical Alternative to High Dynamic Range Photography, COMPUTER GRAPHICS forum, 2009.
このとき、上記プロセスのいずれかの部分に生じた外乱、あるいは、被写体の(局所的な)反射特性ないしはそれに入射する光源の性質によっては、生成される画像が、ヒトが知覚するそれとは異なる見えの、いわゆる「不明瞭な」画像として出力されることが少なくない。
例えば、写り込んだ複数の被写体のうち一部のみが照明で照らされている場合、照明に近い被写体の全貌は概ね明瞭にイメージングされているものの、照明と離れた画像下部に写る被写体は全体的に暗く、その模様が黒つぶれしてしまう。
また、被写体の形状や材質によっては、特定の領域において光の鏡面反射成分が支配的となり、該当領域の模様が白飛びしてしまう。
これらのケースでは、被写体の全貌あるいはその一部が画像として明瞭に捉えられていないため、後段の認識・検索処理を、例えば特許文献1で開示されている技術を用いるなどして高度化しても、その性能を向上させることは難しい。
上記の課題を解決するアプローチの一つとして、同一空間を捉えた画像を撮像デバイスのパラメータを変化させながら複数枚撮影し、得られる画像シーケンスを合成して得られた画像を識別・検索処理の入力とする方法が考えられる。
一例として、撮像パラメータのうち露光(exposure)を変化させつつ複数枚の画像からなる画像シーケンスが取得できる。
複数の露光パターンで画像を取得することで、上述の例では黒つぶれしてしまっていた被写体の模様を、最も高い露光の画像で捉えられるようになり、これらを非特許文献1で開示されているような画像合成技術に適用することで、画像中の位置によらず明瞭な画像を生成することができる。
露光を変化させつつ同一空間の画像を複数枚取得する方法はexposure bracketingと呼ばれ、デジタルカメラやスマートフォンのカメラアプリから容易に利用できる。
また、画像シーケンスの中で変化させることが可能な撮像パラメータとしては、露光の他にフォーカス(焦点)も挙げられ、この撮像方法はfocus stackingと呼ばれる。
このように取得された画像シーケンスから、各画像に含まれる不明瞭性が除去されるよう合成された画像を入力とすることで、識別・検索の性能は向上すると見込まれる。
しかし一方で、非特許文献1に代表される画像合成処理の計算コストは膨大であることから、識別・検索全体の処理コストを大幅に増大させてしまうという問題がある。
この問題は、高いレスポンスが求められることの多いクエリ画像シーケンスを識別・検索する際に特に顕著となる。
計算コストの問題は、画像合成処理のパラメータを調整することや、シーケンス中の画像をあらかじめ低解像度化させておく等といった方法で緩和させることが可能なものの、このようにして得られた画像の質は総じて低く、その画像から抽出された画像特徴には多くのノイズが含まれてしまうという別の問題が生じてしまう。
すなわち、撮像パラメータを変化させて取得した画像シーケンスを合成して得られる画像を識別・検索するというアプローチをとると、画像合成処理の処理速度と出力画像の質のトレードオフの影響を、識別・検索処理が強く受けてしまう、という問題がある。
以上をまとめると、公知の技術には以下のような問題があった。
イメージングの過程で不明瞭性が伴なう画像には被写体の見えに関する情報が欠損してしまっているため、精度よく対象の識別・検索を行うことができない。
撮像デバイスのパラメータを変化させて取得される画像シーケンスを合成して得られた画像を識別・検索の入力とするというアプローチでは、高品質な画像合成処理に要する処理コストが一般的に高いため、処理速度と識別、検索性能を両立させることができない。
本発明は、この課題を鑑みてなされたものであり、画像シーケンスから適切な局所特徴を得ることができる画像処理装置及びプログラムを提供することを目的とする。
また、本発明は、精度よく被写体を識別するための訓練画像の局所特徴を得ることができる訓練画像処理装置、訓練画像処理方法、及びプログラムを提供することを目的とする。
また、本発明は、画像から、その中に写る被写体を精度良く識別することができる画像識別装置、画像識別方法、及びプログラムを提供することを目的とする。
本発明に係る画像処理装置は、入力された画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出する局所特徴抽出部と、前記画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質であるコンディションスコアを算出するコンディションスコア算出部と、前記画像シーケンスを構成する複数の画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択して、前記画像シーケンスの局所特徴とする特徴選択部とを含んで構成される。
本発明に係る画像処理装置によれば、局所特徴抽出部が、入力された画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出し、コンディションスコア算出部が、前記画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質であるコンディションスコアを算出する。
そして、特徴選択部が、前記画像シーケンスを構成する複数の画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択して、前記画像シーケンスの局所特徴とする。
このように、入力された画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出し、当該画像シーケンスを構成する複数の画像の各々について、当該画像を分割した各領域の撮像状態の質であるコンディションスコアを算出し、画像のコンディションスコアに基づいて、当該画像の局所特徴を選択して、当該画像シーケンスの局所特徴とすることにより、画像シーケンスから適切な局所特徴を得ることができる。
本発明に係る訓練画像処理装置は、入力された訓練画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出する局所特徴抽出部と、前記訓練画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質であるコンディションスコアを算出するコンディションスコア算出部と、前記訓練画像シーケンスを構成する複数の画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択して、前記訓練画像シーケンスの局所特徴とする特徴選択部と、を含んで構成される。
また、本発明に係る訓練画像処理方法は、局所特徴抽出部が、入力された訓練画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出し、コンディションスコア算出部が、前記訓練画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質であるコンディションスコアを算出し、特徴選択部が、前記訓練画像シーケンスを構成する複数の画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択して、前記訓練画像シーケンスの局所特徴とする。
本発明に係る訓練画像処理装置、及び訓練画像処理方法によれば、局所特徴抽出部が、入力された訓練画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出し、コンディションスコア算出部が、前記訓練画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質であるコンディションスコアを算出する。
そして、特徴選択部が、前記訓練画像シーケンスを構成する複数の画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択して、前記訓練画像シーケンスの局所特徴とする。
このように、入力された訓練画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出し、当該訓練画像シーケンスを構成する複数の画像の各々について、当該画像を分割した各領域の撮像状態の質であるコンディションスコアを算出し、画像のコンディションスコアに基づいて、当該画像の局所特徴を選択して、当該訓練画像シーケンスの局所特徴とすることにより、精度よく被写体を識別するための訓練画像の局所特徴を得ることができる。
また、本発明に係る訓練画像処理装置は、前記訓練画像シーケンスを構成する複数の画像の各々の位置合わせを行い、複数の画像の各々の位置合わせの結果に基づいて、各領域のコンディションスコアの座標変換、及び局所特徴の座標変換を行うデータアラインメント部を更に含み、前記特徴選択部は、前記訓練画像シーケンスを構成する複数の画像の各々について、前記画像の座標変換後のコンディションスコアに基づいて、前記画像の座標変換後の局所特徴を選択して、前記訓練画像シーケンスの局所特徴とすることができる。
また、本発明に係る訓練画像処理装置は、複数の訓練画像シーケンスの各々について、前記特徴選択部により得られた前記訓練画像シーケンスの局所特徴を、検索可能な形へ整形しデータベースへ格納するインデクシング部を更に含むことができる。
本発明に係る画像識別装置は、入力されたテスト画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出する局所特徴抽出部と、前記テスト画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質であるコンディションスコアを算出するコンディションスコア算出部と、前記テスト画像シーケンスを構成する画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択することにより、前記テスト画像シーケンスの局所特徴とする特徴選択部と、少なくとも1つ以上の訓練画像又は少なくとも1つ以上の訓練画像シーケンスの各々について局所特徴を記憶するデータベースの訓練画像又は訓練画像シーケンスの各々について、前記訓練画像又は前記訓練画像シーケンスの局所特徴と前記テスト画像シーケンスの局所特徴との類似度を示すスコアを算出するデータベース画像スコアリング部と、前記スコアが上位N個の前記訓練画像又は前記訓練画像シーケンスの各々について、前記訓練画像又は前記訓練画像シーケンスの局所特徴と、前記テスト画像シーケンスの局所特徴とに基づいて、前記訓練画像又は前記訓練画像シーケンスと前記テスト画像シーケンスとの同一性を検証することにより、前記テスト画像シーケンスの被写体を識別する被写体検証部とを含んで構成される。
また、本発明に係る画像識別方法は、局所特徴抽出部が、入力されたテスト画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出し、コンディションスコア算出部が、前記テスト画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質であるコンディションスコアを算出し、特徴選択部が、前記テスト画像シーケンスを構成する画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択することにより、前記テスト画像シーケンスの局所特徴とし、データベース画像スコアリング部が、少なくとも1つ以上の訓練画像又は少なくとも1つ以上の訓練画像シーケンスの各々について局所特徴を記憶するデータベースの訓練画像又は訓練画像シーケンスの各々について、前記訓練画像又は前記訓練画像シーケンスの局所特徴と前記テスト画像シーケンスの局所特徴との類似度を示すスコアを算出し、被写体検証部が、前記スコアが上位N個の前記訓練画像又は前記訓練画像シーケンスの各々について、前記訓練画像又は前記訓練画像シーケンスの局所特徴と、前記テスト画像シーケンスの局所特徴とに基づいて、前記訓練画像又は前記訓練画像シーケンスと前記テスト画像シーケンスとの同一性を検証することにより、前記テスト画像シーケンスの被写体を識別する。
本発明に係る画像識別装置、及び画像識別方法によれば、局所特徴抽出部が、入力されたテスト画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出し、コンディションスコア算出部が、前記テスト画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質であるコンディションスコアを算出し、特徴選択部が、前記テスト画像シーケンスを構成する画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択することにより、前記テスト画像シーケンスの局所特徴とする。
そして、データベース画像スコアリング部が、少なくとも1つ以上の訓練画像又は少なくとも1つ以上の訓練画像シーケンスの各々について局所特徴を記憶するデータベースの訓練画像又は訓練画像シーケンスの各々について、前記訓練画像又は前記訓練画像シーケンスの局所特徴と前記テスト画像シーケンスの局所特徴との類似度を示すスコアを算出し、被写体検証部が、前記スコアが上位N個の前記訓練画像又は前記訓練画像シーケンスの各々について、前記訓練画像又は前記訓練画像シーケンスの局所特徴と、前記テスト画像シーケンスの局所特徴とに基づいて、前記訓練画像又は前記訓練画像シーケンスと前記テスト画像シーケンスとの同一性を検証することにより、前記テスト画像シーケンスの被写体を識別する。
このように、入力されたテスト画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出し、当該テスト画像シーケンスを構成する複数の画像の各々について、当該画像を分割した各領域の撮像状態の質であるコンディションスコアを算出し、画像のコンディションスコアに基づいて、当該画像の局所特徴を選択することにより、テスト画像シーケンスの局所特徴とし、訓練画像又は訓練画像シーケンスの局所特徴と当該テスト画像シーケンスの局所特徴とに基づいて、当該テスト画像シーケンスの被写体を識別することにより、画像から、その中に写る被写体を精度良く識別することができる。
また、本発明に係る画像識別装置は、前記テスト画像シーケンスを構成する複数の画像の各々の位置合わせを行い、複数の画像の各々の位置合わせの結果に基づいて、各領域のコンディションスコアの座標変換、及び局所特徴の座標変換を行うデータアラインメント部を更に含み、前記特徴選択部は、前記テスト画像シーケンスを構成する複数の画像の各々について、前記画像の座標変換後のコンディションスコアに基づいて、前記画像の座標変換後の局所特徴を選択して、前記テスト画像シーケンスの局所特徴とすることができる。
本発明に係るプログラムは、上記の画像処理装置、訓練画像処理装置又は画像識別装置の各部として機能させるためのプログラムである。
本発明の画像処理装置及びプログラムによれば、画像シーケンスから適切な局所特徴を得ることができる。
また、本発明の訓練画像処理装置、訓練画像処理方法、及びプログラムによれば、精度よく被写体を識別するための訓練画像の局所特徴を得ることができる。
また、本発明の画像識別装置、画像識別方法、及びプログラムによれば、画像から、その中に写る被写体を精度良く識別することができる。
本発明の実施の形態に係る画像識別装置の構成を示す概略図である。 本発明の実施の形態に係る画像識別装置の特徴選択の例を示す図である。 本発明の実施の形態に係る画像識別装置の特徴選択の例を示す図である。 本発明の実施の形態に係る画像識別装置の特徴選択の例を示す図である。 本発明の実施の形態に係る画像識別装置の訓練画像処理ルーチンを示すフローチャートである。 本発明の実施の形態に係る画像識別装置の画像識別処理ルーチンを示すフローチャートである。 本発明の他の実施の形態の変形例1に係る画像識別装置の構成を示す概略図である。 本発明の他の実施の形態の変形例2に係る画像識別装置の構成を示す概略図である。 本発明の他の実施の形態の変形例3に係る画像識別装置の構成を示す概略図である。 本発明の他の実施の形態の変形例4に係る画像識別装置の構成を示す概略図である。 本発明の他の実施の形態の変形例5に係る画像識別装置の構成を示す概略図である。 本発明の他の実施の形態の変形例6に係る画像識別装置の構成を示す概略図である。 本発明の他の実施の形態の変形例7に係る画像識別装置の構成を示す概略図である。 本発明の他の実施の形態の変形例8に係る画像識別装置の構成を示す概略図である。
以下、本発明の実施の形態について図面を用いて説明する。
<本発明の実施の形態に係る画像識別装置の構成>
次に、本発明の実施の形態に係る画像識別装置の構成について説明する。図1は、本発明の実施の形態に係る画像識別装置の構成を示す概略図である。
本発明の実施の形態に係る画像識別装置10は、CPUと、RAMと、後述する訓練画像処理ルーチン、及び画像識別処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。
図1に示すように、画像識別装置10は、入力部100と、入力部110と、訓練画像処理部200と、データベース300と、画像識別部400と、出力部500とを備えて構成される。
入力部100及び入力部110は、既知のキーボード、記憶装置などの入力器により実現される。また、入力部100は、インターネット等のネットワークを介して観測データを入力するネットワークインターフェースでも良い。
出力部500は、ディスプレイ、プリンタ、磁気ディスクなどで実装される。
入力部100は、複数の訓練画像シーケンスの入力を受け付ける。訓練画像シーケンスには、当該訓練画像シーケンス中に存在する被写体を示すラベル情報が付与されている。
なお、ラベル情報は、予め与えられ、又は別途入力部100に入力される構成を取っても良い。
そして、入力部100は、入力された複数の訓練画像シーケンスを訓練画像処理部200へ渡す。
なお、訓練画像シーケンスにおいて、訓練画像シーケンスの長さ(すなわち、訓練画像シーケンスを構成する画像の枚数)は任意である。また、画像の枚数は、訓練画像シーケンス毎に異なっていてもよい。
訓練画像処理部200は、入力された複数の訓練画像シーケンスの各々について、局所特徴を抽出し、検索可能な形へ成形し、データベース300へ格納する。
具体的には、訓練画像処理部200は、前処理部210と、局所特徴抽出部220と、コンディションスコア算出部230と、データアラインメント部240と、特徴選択部250と、インデクシング部260とを含んで構成される。
前処理部210は、複数の訓練画像シーケンスの各々に対し、当該訓練画像シーケンスを構成する複数の画像の各々について、当該画像を所定のサイズに拡大縮小する。
具体的には、前処理部210は、入力部100に入力された複数の訓練画像シーケンスの各々における、当該訓練画像シーケンスを構成する複数の画像の各々について、当該画像を所定のサイズに拡大縮小する。
なお、この拡大縮小サイズは、後段の局所特徴抽出部220、コンディションスコア算出部230、局所特徴抽出部420、及びコンディションスコア算出部430ついて、それぞれ独立に設定することができる。
また、前処理部210では、この他にも例えば、画像ノイズを軽減するために平滑化処理や、γ補正等の画像全体の明るさを調整する処理を行ってもよい。
そして、前処理部210は、拡大縮小した複数の訓練画像シーケンスを、局所特徴抽出部220及びコンディションスコア算出部230に渡す。
局所特徴抽出部220は、複数の訓練画像シーケンスの各々について、当該訓練画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出する。
具体的には、局所特徴抽出部220は、前処理部210で得られた複数の訓練画像シーケンスの各々における、当該訓練画像シーケンスを構成する複数の画像において、当該画像から、局所特徴量、及び各局所特徴に対応する属性情報を抽出する。
抽出する局所特徴量は、任意の公知の技術を用いることが可能である。例えば、参考文献1で開示されているSIFTや、他にもSURF、BEIEF、BRISK、ORB、FREAK、AKAZE等を用いることができる。
また属性情報としては、参考文献1同様位置(x,y)、スケール、回転量の4つを取得してもよいし、参考文献2で開示されている方法を用いて位置(x,y)、スケール、回転(ロー、ピッチ、ヨー)の6つを取得してもよい。
[参考文献1]D. G. Lowe, Distinctive Image Features from Scale-Invariant Keypoints, IJCV, 2004.
[参考文献2]J. Morel et al., ASIFT: A New Framework for Fully Affine Invariant Image Comparison, SIAM Journal on Image Sciences, 2009.
コンディションスコア算出部230は、前処理部210で得られた複数の訓練画像シーケンスの各々における、当該訓練画像シーケンスを構成する複数の画像において、当該画像を分割した各領域の撮像状態の質であるコンディションスコアを算出する。
具体的には、コンディションスコア算出部230は、前処理部210で得られた複数の訓練画像シーケンスの各々における、当該訓練画像シーケンスを構成する複数の画像において、当該画像中の各領域における撮像状態の質(コンディション)を算出したコンディションマップを生成する。
画像中の各領域の撮像状態の質を評価する指標は任意のものを用いることが可能である。例えば、以下のように、(1)コントラスト、(2)彩度、(3)露光状態(カラー)、(4)露光状態(グレースケール)のうち少なくとも何れか1つを、コンディションの評価をする指標として用いることができる。
<<(1)コントラスト>>
画像シーケンスを構成する画像I(k:画像のインデックス)の各位置(i,j)におけるコントラストが高いほど、該当領域の撮像コンディションはよいと考えられる。
そこで、画像Iをグレースケール変換したものにラプラシアンフィルタを適用することで、コントラストの指標に対応するスコアCij,kを算出する。
<<(2)彩度>>
画像シーケンスを構成する画像Iの各位置(i,j)が鮮やかであるほど、該当領域の撮像コンディションはよいと考えられる。
そこで、画像Iの位置(i,j)におけるR、G、Bの輝度値の標準偏差として、彩度の指標に対応するスコアSij,kを算出する。
<<(3)露光状態(カラー)>>
画像シーケンスを構成する画像Iの各位置(i,j)が適切な露光状態で撮像されているほど、該当領域の撮像コンディションはよいと考えられる。
そこで、露光状態(カラー)の指標に対応するスコアEij,kを、下記の式(1)で算出する。
Figure 0006950376
ここで、
Figure 0006950376

は、画像Iの位置(i,j)におけるR、G、Bの輝度値、
Figure 0006950376

をパラメータとする。
<<(4)露光状態(グレースケール)>>
露光状態(カラー)のアプローチは、カラー画像をグレースケールに変換したものに適用することも可能である。
そこで、露光状態(グレースケール)の指標に対応するスコアGij,kを、下記の式(2)のように算出する。
Figure 0006950376
ここで、
Figure 0006950376

は、画像Iの位置(i,j)における輝度値とする。
上記4種類の指標は、画像が取得された照明状態の質に関連している。その他にも、例えば参考文献3で開示されているLocal Power Spectral Slope、Gradient Histogram Span、Maximum Saturation、Local Autocorrelation Congruencyといった指標を用いることで、画像中各領域のブレ状態に関するスコアを算出することができる。
[参考文献3]H. Jegou et al., Aggregating local descriptors into a compact image representation, in Proc. CVPR, 2010.
また、コンディションスコア算出部230では、画像各領域の撮像状態の質を評価する任意の指標一つ以上を組み合わせて用いることが可能である。
例えば、下記の式(3)のように、画像シーケンスを構成する画像Iの位置(i,j)における最終的な撮像コンディションスコアWij,kを計算すればよい。
Figure 0006950376
ここで、ω、ω、ω、ωは、パラメータである。
データアラインメント部240は、訓練画像シーケンスを構成する複数の画像の各々の位置合わせを行い、複数の画像の各々の位置合わせの結果に基づいて、各領域のコンディションスコアの座標変換、及び局所特徴の座標変換を行う。
具体的には、データアラインメント部240は、訓練画像シーケンスを構成する各画像の位置合わせを行う。訓練画像シーケンスを構成する各画像の位置合わせを行う方法は任意である。
例えば、訓練画像シーケンスを構成する最初の画像を基準として、最初の画像とそれ以外の各画像から局所特徴抽出部220で得られた局所特徴の対応付けを行い、その結果から画像間の座標変換パラメータ(例えばアフィン行列やホモグラフィ行列)を、RANSAC等のロバスト推定で求め、局所特徴及びコンディションマップの座標系を変換させるといった方法を用いることができる。
なお、exposure bracketingやfocus stacking等で得られた画像は、多くの場合シーケンス中の画像間でアラインメントが既に撮られているが多い。このような場合には、各画像の座標系をそのまま後段の処理で用いてもよい。
特徴選択部250は、複数の訓練画像シーケンスの各々について、当該訓練画像シーケンスを構成する複数の画像の各々について、当該画像の座標変換後のコンディションスコアに基づいて、当該画像の座標変換後の局所特徴を選択して、当該訓練画像シーケンスの局所特徴とする。
具体的には、特徴選択部250は、コンディションスコア算出部230で得られた各訓練画像シーケンスにおける、当該訓練画像シーケンスを構成する各画像から算出された座標変換後のコンディションマップに基づいて、各画像から抽出された座標変換後の局所特徴を選択し、当該訓練画像シーケンスから抽出された局所特徴とする。
コンディションマップに基づいて局所特徴を選択する方法は任意である。
例えば、図2に示すように、コンディションマップの各領域の値が所定の閾値以上の領域から抽出された局所特徴を選択する方法(方法1)、図3に示すように、同一シーケンス内のコンディションマップで同一領域を捉えた領域を比較し、最もスコアの高い領域から抽出された局所特徴を選択する方法(方法2)を用いることができる。
また、例えば、図4に示すように、各画像から選択された局所特徴を全て選択する方法(方法3)を用いてもよい。
インデクシング部260は、複数の訓練画像シーケンスの各々について、特徴選択部250により得られた当該訓練画像シーケンスの局所特徴を、検索可能な形へ整形し、データベース300へ格納する。
具体的には、インデクシング部260は、特徴選択部250で得られた訓練画像シーケンスに対応する局所特徴を、後述のDB画像スコアリング部460で検索可能な状態へと変換し、データベース300へ格納する。
局所特徴を検索可能な状態へと変換する方法は任意であり、例えば参考文献3のように、各局所特徴をまずコードブックへ割当て割り当てられたコードブックとの残渣を集計して一つのベクトルを生成する方法や、参考文献4のように、参考文献3と同様に抽出されたベクトルを二値化する方法を用いることができる。これにより、高速な識別が可能となる。
[参考文献4]特開2017−054438号公報
データベース300は、複数の訓練画像シーケンスの各々について、当該訓練画像シーケンスと、特徴選択部250で得られた当該訓練画像シーケンスの特徴量と、当該訓練画像シーケンスのラベルと、当該訓練画像シーケンスの局所特徴について、インデクシング部260で変換された検索可能な状態とを紐付けて記憶する。
入力部110は、テスト画像シーケンスの入力を受け付ける。
そして、入力部110は、入力されたテスト画像シーケンスを画像識別部400へ渡す。
なお、テスト画像シーケンスにおいて、テスト画像シーケンスの長さ(すなわち、テスト画像シーケンスを構成する画像の枚数)は任意である。また、テスト画像シーケンスを構成する画像の枚数は、入力部110に入力される度に異なっていてもよい。
画像識別部400は、入力されたテスト画像シーケンスの被写体を識別する。
具体的には、画像識別部400は、前処理部410と、局所特徴抽出部420と、コンディションスコア算出部430と、データアラインメント部440と、特徴選択部450と、インデクシング部260と、DB画像スコアリング部460と、被写体検証部470とを含んで構成される。
前処理部410は、テスト画像シーケンスを構成する複数の画像の各々について、当該画像を所定のサイズに拡大縮小する。
具体的には、前処理部410は、前処理部210と同様に、入力部110に入力されたテスト画像シーケンスを構成する複数の画像の各々について、当該画像を所定のサイズに拡大縮小する。
そして、前処理部210は、拡大縮小したテスト画像シーケンスを、局所特徴抽出部420及びコンディションスコア算出部430に渡す。
なお、テスト画像シーケンスには、複数の被写体が写り込んでいる場合があるため、前処理部410は、例えば参考文献5に示すような、画像中で被写体が写り込んでいそうな領域候補を抽出する方法を適用し、得られた各領域のシーケンスを後段の処理へ入力してもよい。
[参考文献5]M.-M. Cheng et al., BING: Binarized Normed Gradients for Objectness Estimation at 300fps,in Proc. CVPR, 2014.
局所特徴抽出部420は、入力されたテスト画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出する。
具体的には、局所特徴抽出部420は、局所特徴抽出部220と同様に、前処理部410で得られたテスト画像シーケンスを構成する複数の画像において、当該画像から、局所特徴量、及び各局所特徴に対応する属性情報を抽出する。
コンディションスコア算出部430は、テスト画像シーケンスを構成する複数の画像の各々について、当該画像を分割した各領域の撮像状態の質であるコンディションスコアを算出する
具体的には、コンディションスコア算出部430は、コンディションスコア算出部230と同様に、前処理部410で得られたテスト画像シーケンスを構成する複数の画像において、当該画像中の各領域における撮像状態の質を算出したコンディションマップを生成する。
データアラインメント部440は、テスト画像シーケンスを構成する複数の画像の各々の位置合わせを行い、複数の画像の各々の位置合わせの結果に基づいて、各領域のコンディションスコアの座標変換、及び局所特徴の座標変換を行う
具体的には、データアラインメント部440は、データアラインメント部240と同様に、テスト画像シーケンスを構成する各画像の位置合わせを行う。
特徴選択部450は、テスト画像シーケンスを構成する画像の各々について、当該画像の座標変換後のコンディションスコアに基づいて、当該画像の座標変換後の局所特徴を選択することにより、当該画像シーケンスの局所特徴とする。
具体的には、特徴選択部450は、特徴選択部250と同様に、コンディションスコア算出部430で得られたテスト画像シーケンスを構成する各画像から算出された座標変換後のコンディションマップに基づいて、各画像から抽出された座標変換後の局所特徴を選択し、テスト画像シーケンスから抽出された局所特徴とする。
なお、DB画像スコアリング部460で用いる、特徴選択部250から出力される訓練画像シーケンスの局所特徴と、被写体検証部470で用いる、特徴選択部450から出力されるテスト画像シーケンスの局所特徴とは、異なる方法で出力されたものであってもよい。
例えば、後述のインデクシング部260とDB画像スコアリング部460で用いる局所特徴は、図2のコンディションマップの各領域の値が所定の閾値以上の領域から抽出された局所特徴を選択する方法を用い、被写体検証部470で用いる局所特徴は、図4の各画像から選択された局所特徴を全て選択する方法を用いるなどすることができる。
なお、コンディションマップ中で領域を定義する方法は、コンディションマップ中の各ピクセルをそのまま用いる方法や、マップを所定の数の矩形領域へ等分割し、その中のスコア平均値を領域のコンディションスコアとする方法を用いることができる。
DB画像スコアリング部460は、データベース300が記憶している訓練画像シーケンスの各々について、訓練画像シーケンスの局所特徴とテスト画像シーケンスの局所特徴との類似度を示すスコアを算出する。
具体的には、DB画像スコアリング部460は、特徴選択部450で得られたテスト画像シーケンスに対応する局所特徴を、インデクシング部260と対応した方法で、検索可能な状態へと変換する。そして、データベース300に格納された各訓練画像シーケンスとの類似度、又は距離を示すスコアを算出し、得られたスコアに基づいて各訓練画像シーケンスをランキングする。
被写体検証部470は、スコアが上位N個の訓練画像シーケンスの各々について、当該訓練画像シーケンスの局所特徴と、テスト画像シーケンスの局所特徴とに基づいて、当該訓練画像シーケンスとテスト画像シーケンスとの同一性を検証することにより、前記テスト画像シーケンスの被写体を識別する。
具体的には、DB画像スコアリング部460で得られた各訓練画像シーケンスのスコアに基づいて、テスト画像シーケンスと特に類似している、又は関連していると考えられる所定数の訓練画像シーケンスの各々について、当該訓練画像シーケンスと、テスト画像シーケンスとの同一性を、特徴選択部250及び特徴選択部450で出力された各画像シーケンスの局所特徴を用いて検証する。
局所特徴集合から画像シーケンス間の同一性判定を行う方法は、任意の方法を用いてよい。例えば、特許文献1のように、画像シーケンス間の画像変換パラメータを、局所特徴に付随する属性空間への投票によって推定する方法を用いることができる。
そして、被写体検証部470は、テスト画像シーケンスに写り込んでいると考えられる被写体の識別結果を出力部500に渡す。
なお、識別結果と共に、又は識別結果の代わりに、テスト画像シーケンスと同一性のある訓練画像シーケンスに対応するラベルを出力部500に渡してもよい。
出力部500は、被写体検証部470から受け取った識別結果を、出力する。
<本発明の実施の形態に係る画像識別装置の作用>
次に、本発明の実施の形態に係る画像識別装置の作用について説明する。
図5及び図6は、それぞれ本発明の実施の形態に係る画像識別装置10の訓練画像処理ルーチン、及び画像識別処理ルーチンを示すフローチャートである。
まず、訓練画像処理ルーチンについて説明する。
入力部100に複数の訓練画像シーケンスが入力されると、訓練画像処理部200において、図5に示す訓練画像処理ルーチンが実行される。
まず、ステップS100において、前処理部210が、入力部100から、複数の訓練画像シーケンスを取得する。
そして、ステップS110において、前処理部210が、1番目の訓練画像シーケンスを選択し、選択された訓練画像シーケンスを構成する複数の画像の各々について、当該画像を所定のサイズに拡大縮小する。
ステップS120において、局所特徴抽出部220が、訓練画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出する。
ステップS130において、コンディションスコア算出部230が、前処理部210で得られた訓練画像シーケンスを構成する複数の画像において、当該画像を分割した各領域の撮像状態の質であるコンディションスコアを算出する。
ステップS140において、データアラインメント部240が、訓練画像シーケンスを構成する複数の画像の各々の位置合わせを行い、複数の画像の各々の位置合わせの結果に基づいて、各領域のコンディションスコアの座標変換、及び局所特徴の座標変換を行う。
ステップS150において、特徴選択部250が、訓練画像シーケンスを構成する複数の画像の各々について、当該画像の座標変換後のコンディションスコアに基づいて、当該画像の座標変換後の局所特徴を選択して、当該訓練画像シーケンスの局所特徴とする。
ステップS160において、インデクシング部260が、訓練画像シーケンスについて、特徴選択部250により得られた当該訓練画像シーケンスの局所特徴を、検索可能な形へ整形する。
ステップS170において、訓練画像処理部200が、全ての訓練画像シーケンスについて、訓練画像処理を行ったか否かを判断する。
未処理の訓練画像シーケンスがある場合(ステップS170のNO)、ステップS110に戻り、次の訓練画像シーケンスを選択して、ステップS110〜ステップS160の処理を行う。
全ての訓練画像シーケンスについて処理が終了している場合(ステップS170のYES)、ステップS180において、データベース300が、複数の訓練画像シーケンスの各々について、当該訓練画像シーケンスと、特徴選択部250で得られた当該訓練画像シーケンスの特徴量と、当該訓練画像シーケンスのラベルと、当該訓練画像シーケンスの局所特徴について、インデクシング部260で変換された検索可能な状態とを紐付けて記憶し、訓練画像処理ルーチンを終了する。
次に、画像識別処理ルーチンについて説明する。
入力部110にテスト画像シーケンスが入力されると、画像識別部400において、図6に示す画像識別処理ルーチンが実行される。
まず、ステップS200において、前処理部410が、入力部110から、テスト画像シーケンスを取得する。
そして、ステップS210において、前処理部410が、テスト画像シーケンスを構成する複数の画像の各々について、当該画像を所定のサイズに拡大縮小する。
ステップS220において、局所特徴抽出部420が、テスト画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出する。
ステップS230において、コンディションスコア算出部430が、前処理部210で得られたテスト画像シーケンスを構成する複数の画像において、当該画像を分割した各領域の撮像状態の質であるコンディションスコアを算出する。
ステップS240において、データアラインメント部440が、テスト画像シーケンスを構成する複数の画像の各々の位置合わせを行い、複数の画像の各々の位置合わせの結果に基づいて、各領域のコンディションスコアの座標変換、及び局所特徴の座標変換を行う。
ステップS250において、特徴選択部450が、テスト画像シーケンスを構成する複数の画像の各々について、当該画像の座標変換後のコンディションスコアに基づいて、当該画像の座標変換後の局所特徴を選択して、テスト画像シーケンスの局所特徴とする。
ステップS260において、DB画像スコアリング部460が、データベース300が記憶する訓練画像シーケンスの各々について、訓練画像シーケンスの局所特徴とテスト画像シーケンスの局所特徴との類似度を示すスコアを算出する。
ステップS270において、被写体検証部470が、スコアが上位N個の訓練画像シーケンスの各々について、当該訓練画像シーケンスの局所特徴と、テスト画像シーケンスの局所特徴とに基づいて、当該訓練画像シーケンスとテスト画像シーケンスとの同一性を検証することにより、前記テスト画像シーケンスの被写体を識別する。
ステップS280において、出力部500が、被写体検証部470から受け取った識別結果を、出力する。
以上説明したように、本実施形態に係る画像識別装置によれば、入力された訓練画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出し、当該訓練画像シーケンスを構成する複数の画像の各々について、当該画像を分割した各領域の撮像状態の質であるコンディションスコアを算出し、画像のコンディションスコアに基づいて、当該画像の局所特徴を選択して、当該訓練画像シーケンスの局所特徴とすることにより、精度よく被写体を識別するための訓練画像の局所特徴を得ることができる。
また、本実施形態に係る画像識別装置によれば、入力されたテスト画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出し、当該テスト画像シーケンスを構成する複数の画像の各々について、当該画像を分割した各領域の撮像状態の質であるコンディションスコアを算出し、画像のコンディションスコアに基づいて、当該画像の局所特徴を選択することにより、テスト画像シーケンスの局所特徴とし、訓練画像又は訓練画像シーケンスの局所特徴と当該テスト画像シーケンスの局所特徴とに基づいて、テスト画像シーケンスの被写体を識別することにより、画像から、その中に写る被写体を精度良く識別することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
本実施形態では、訓練画像処理部200と、画像識別部400とを同一の装置に実装した例で説明したが、別装置に実装してもよい。例えば、訓練画像処理部200を含む訓練画像処理装置と、画像識別部400を含む画像識別装置とに分けて実装してもよい。
また、訓練画像処理装置及び画像識別装置以外の画像処理装置に本発明を適用してもよい。
また、本発明の実施形態は、訓練画像処理部200及びお画像識別部400における入力がともに画像シーケンスであり、画像識別部400において、訓練画像シーケンスをランキングし、その上位についてテスト画像シーケンスとの同一性検証を実施する場合の構成となっている。
一方で、本発明の実施形態は、訓練画像処理部200と画像識別部400どちらか一方における入力が単画像(すなわち、シーケンスの長さが1)であってもよい。
また、本発明の実施形態として、最終的な出力はDB画像スコアリング部460の出力であるスコア付き訓練画像のリストでも、被写体検証部470の出力である識別結果/ラベルであってもよい。
図7〜図14に、入力データの形態/画像識別部400の出力形態が異なる本実施形態の変形例1〜8を示す。
<変形例1>
図7は、訓練画像処理部200に入力される訓練データのみ画像シーケンスであり、画像識別部400では、データベース300に登録されたデータの検索のみを行う場合の実施形態を示している。
この場合、画像識別部400の入力は画像1枚のみとなるため、画像識別部400では局所特徴抽出部420で出力された局所特徴を、DB画像スコアリング部460の入力とする。
そして、DB画像スコアリング部460は、算出したスコアの上位N個の訓練画像シーケンスを、スコア付きで、出力部500に渡す。
そして、出力部500は、スコア付き訓練画像のリストを出力する。
<変形例2>
図8は、訓練データのみ画像シーケンスであり、画像識別部400ではデータベース300に登録された全てのデータに対して、同一性の検証を行う場合の実施形態を示している。
この場合、画像識別部400の入力は画像1枚のみとなるため、画像識別部400では局所特徴抽出部420で出力された局所特徴を被写体検証部470の入力とすればよい。
<変形例3>
図9は、訓練データのみ画像シーケンスであり、画像識別部400ではデータベース300に登録されたデータの検索をまず行い、特に類似した訓練データとテストデータの同一性の検証を行う場合の実施形態を示している。
この場合、画像識別部400の入力は画像1枚のみとなるため、画像識別部400では局所特徴抽出部420で出力された局所特徴を、DB画像スコアリング部460部の入力とすればよい。
<変形例4>
図10は、テストデータのみ画像シーケンスであり、画像識別部400ではデータベース300に登録されたデータの検索のみを行う場合の実施形態を示している。
この場合、訓練画像処理部200の各入力は画像1枚のみとなるため、訓練画像処理部200では局所特徴抽出部220で出力された局所特徴集合をインデクシング部260の入力とすればよい。
<変形例5>
図11は、テストデータのみ画像シーケンスであり、画像識別部400ではデータベース300に登録された全てのデータに対して、同一性の検証を行う場合の実施形態を示している。
この場合、訓練画像処理部200の各入力は画像1枚のみとなるため、訓練画像処理部200では局所特徴抽出部220で出力された局所特徴を直接データベース300に登録すればよい。
<変形例6>
図12は、訓練データのみ画像シーケンスであり、画像識別部400ではデータベース300に登録されたデータの検索をまず行い、特に類似した訓練データとテストデータの検証を行う場合の実施形態を示している。
この場合、訓練画像処理部200の各入力は画像1枚のみとなるため、訓練画像処理部200では局所特徴抽出部220で出力された局所特徴をインデクシング部260の入力とすればよい。
<変形例7>
図13は、訓練データ、テストデータ共に画像シーケンスであり、画像識別部400ではデータベース300に登録されたデータの検索のみを行う場合の実施形態を示している。
<変形例8>
図14は、訓練データ、テストデータ共に画像シーケンスであり、画像識別部400ではデータベース300に登録された全てのデータに対して、同一性の検証を行う場合の実施形態を示している。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。
10 画像識別装置
100 入力部
110 入力部
200 訓練画像処理部
210 前処理部
220 局所特徴抽出部
230 コンディションスコア算出部
240 データアラインメント部
250 特徴選択部
260 インデクシング部
300 データベース
400 画像識別部
410 前処理部
420 局所特徴抽出部
430 コンディションスコア算出部
440 データアラインメント部
450 特徴選択部
460 画像スコアリング部
470 被写体検証部
500 出力部

Claims (8)

  1. 入力された画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出する局所特徴抽出部と、
    前記画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質を評価する指標として、彩度、カラーの露光状態、及びグレースケールの露光状態のうち少なくとも1つを用いて、前記質を示すコンディションスコアを算出するコンディションスコア算出部と、
    前記画像シーケンスを構成する複数の画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択して、前記画像シーケンスの局所特徴とする特徴選択部と、
    を含む画像処理装置。
  2. 入力された訓練画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出する局所特徴抽出部と、
    前記訓練画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質を評価する指標として、彩度、カラーの露光状態、及びグレースケールの露光状態のうち少なくとも1つを用いて、前記質を示すコンディションスコアを算出するコンディションスコア算出部と、
    前記訓練画像シーケンスを構成する複数の画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択して、前記訓練画像シーケンスの局所特徴とする特徴選択部と、
    を含む訓練画像処理装置。
  3. 前記訓練画像シーケンスを構成する複数の画像の各々の位置合わせを行い、複数の画像の各々の位置合わせの結果に基づいて、各領域のコンディションスコアの座標変換、及び局所特徴の座標変換を行うデータアラインメント部を更に含み、
    前記特徴選択部は、前記訓練画像シーケンスを構成する複数の画像の各々について、前記画像の座標変換後のコンディションスコアに基づいて、前記画像の座標変換後の局所特徴を選択して、前記訓練画像シーケンスの局所特徴とする請求項2記載の訓練画像処理装置。
  4. 入力されたテスト画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出する局所特徴抽出部と、
    前記テスト画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質を評価する指標として、彩度、カラーの露光状態、及びグレースケールの露光状態のうち少なくとも1つを用いて、前記質を示すコンディションスコアを算出するコンディションスコア算出部と、
    前記テスト画像シーケンスを構成する画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択することにより、前記テスト画像シーケンスの局所特徴とする特徴選択部と、
    少なくとも1つ以上の訓練画像又は少なくとも1つ以上の訓練画像シーケンスの各々について局所特徴を記憶するデータベースの訓練画像又は訓練画像シーケンスの各々について、前記訓練画像又は前記訓練画像シーケンスの局所特徴と前記テスト画像シーケンスの局所特徴との類似度を示すスコアを算出するデータベース画像スコアリング部と、
    前記スコアが上位N個の前記訓練画像又は前記訓練画像シーケンスの各々について、前記訓練画像又は前記訓練画像シーケンスの局所特徴と、前記テスト画像シーケンスの局所特徴とに基づいて、前記訓練画像又は前記訓練画像シーケンスと前記テスト画像シーケンスとの同一性を検証することにより、前記テスト画像シーケンスの被写体を識別する被写体検証部と
    を含む画像識別装置。
  5. 前記テスト画像シーケンスを構成する複数の画像の各々の位置合わせを行い、複数の画像の各々の位置合わせの結果に基づいて、各領域のコンディションスコアの座標変換、及び局所特徴の座標変換を行うデータアラインメント部を更に含み、
    前記特徴選択部は、前記テスト画像シーケンスを構成する複数の画像の各々について、前記画像の座標変換後のコンディションスコアに基づいて、前記画像の座標変換後の局所特徴を選択して、前記テスト画像シーケンスの局所特徴とする請求項4記載の画像識別装置。
  6. 局所特徴抽出部が、入力された訓練画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出し、
    コンディションスコア算出部が、前記訓練画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質を評価する指標として、彩度、カラーの露光状態、及びグレースケールの露光状態のうち少なくとも1つを用いて、前記質を示すコンディションスコアを算出し、
    特徴選択部が、前記訓練画像シーケンスを構成する複数の画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択して、前記訓練画像シーケンスの局所特徴とする
    訓練画像処理方法。
  7. 局所特徴抽出部が、入力されたテスト画像シーケンスを構成する複数の画像の各々から、局所特徴を抽出し、
    コンディションスコア算出部が、前記テスト画像シーケンスを構成する複数の画像の各々について、前記画像を分割した各領域の撮像状態の質を評価する指標として、彩度、カラーの露光状態、及びグレースケールの露光状態のうち少なくとも1つを用いて、前記質を示すコンディションスコアを算出し、
    特徴選択部が、前記テスト画像シーケンスを構成する画像の各々について、前記画像のコンディションスコアに基づいて、前記画像の局所特徴を選択することにより、前記テスト画像シーケンスの局所特徴とし、
    データベース画像スコアリング部が、少なくとも1つ以上の訓練画像又は少なくとも1つ以上の訓練画像シーケンスの各々について局所特徴を記憶するデータベースの訓練画像又は訓練画像シーケンスの各々について、前記訓練画像又は前記訓練画像シーケンスの局所特徴と前記テスト画像シーケンスの局所特徴との類似度を示すスコアを算出し、
    被写体検証部が、前記スコアが上位N個の前記訓練画像又は前記訓練画像シーケンスの各々について、前記訓練画像又は前記訓練画像シーケンスの局所特徴と、前記テスト画像シーケンスの局所特徴とに基づいて、前記訓練画像又は前記訓練画像シーケンスと前記テスト画像シーケンスとの同一性を検証することにより、前記テスト画像シーケンスの被写体を識別する
    画像識別方法。
  8. コンピュータを、請求項1記載の画像処理装置、請求項2若しくは3記載の訓練画像処理装置、又は請求項4若しくは請求項5記載の画像識別装置の各部として機能させるためのプログラム。
JP2017168919A 2017-09-01 2017-09-01 画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラム Active JP6950376B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017168919A JP6950376B2 (ja) 2017-09-01 2017-09-01 画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017168919A JP6950376B2 (ja) 2017-09-01 2017-09-01 画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2019046184A JP2019046184A (ja) 2019-03-22
JP6950376B2 true JP6950376B2 (ja) 2021-10-13

Family

ID=65814649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017168919A Active JP6950376B2 (ja) 2017-09-01 2017-09-01 画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6950376B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112241745A (zh) * 2020-10-29 2021-01-19 东北大学 一种基于光照不变颜色空间的特征点提取方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011257963A (ja) * 2010-06-08 2011-12-22 Canon Inc 画像処理装置、その処理方法及びプログラム
JP5519556B2 (ja) * 2011-03-09 2014-06-11 Kddi株式会社 解析対象画像の中から参照画像に基づく物体を認識する画像解析装置、サーバ、プログラム及び方法
JP6055435B2 (ja) * 2014-04-10 2016-12-27 日本電信電話株式会社 被写体認識装置、被写体認識方法及び被写体認識プログラム
JP6338274B2 (ja) * 2014-06-25 2018-06-06 Kddi株式会社 情報処理装置ならびにその特徴点選択方法、装置およびプログラム

Also Published As

Publication number Publication date
JP2019046184A (ja) 2019-03-22

Similar Documents

Publication Publication Date Title
JP4772839B2 (ja) 画像識別方法および撮像装置
US9036905B2 (en) Training classifiers for deblurring images
JP6544900B2 (ja) オブジェクト識別装置、オブジェクト識別方法及びプログラム
JP5549345B2 (ja) 画像収集装置に用いる天空検出装置及び方法
US9773193B2 (en) Image processing apparatus, image processing method, and program
US8213741B2 (en) Method to generate thumbnails for digital images
JP2005148900A (ja) 画像分類装置、画像分類方法、および、プログラム
US20180184012A1 (en) Image processing apparatus, control method, and storage medium
US10891740B2 (en) Moving object tracking apparatus, moving object tracking method, and computer program product
Olvera et al. A feature extraction using SIFT with a preprocessing by adding CLAHE algorithm to enhance image histograms
JP2013037539A (ja) 画像特徴量抽出装置およびそのプログラム
JP2013101423A (ja) 画像マッチング装置及び画像マッチングプログラム
JP6950376B2 (ja) 画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラム
JP5791361B2 (ja) パターン識別装置、パターン識別方法およびプログラム
CN111080683B (zh) 图像处理方法、装置、存储介质及电子设备
JP6855175B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP6265641B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
Noskov et al. Multi-focus image fusion based on cellular automata method
JP6717769B2 (ja) 情報処理装置及びプログラム
JP5463688B2 (ja) 合焦評価装置、カメラおよびプログラム
JP2016162421A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2012043397A (ja) 特徴量取得装置、特徴量取得方法、類似画像検索方法およびプログラム。
JP4994174B2 (ja) データ処理装置及びデータ処理方法
JP2013120504A (ja) オブジェクト抽出装置、オブジェクト抽出方法、及びプログラム
JP5582924B2 (ja) 画像処理装置、画像処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190827

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210906

R150 Certificate of patent or registration of utility model

Ref document number: 6950376

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150