JP2019514100A

JP2019514100A - イメージベースオブジェクト認識のための画像特徴組み合わせ

Info

Publication number: JP2019514100A
Application number: JP2018546693A
Authority: JP
Inventors: ソン，ビン; リン，リーウェン
Original assignee: ナントホールディングスアイピー，エルエルシー
Priority date: 2016-03-08
Filing date: 2017-03-07
Publication date: 2019-05-30
Also published as: CN109074369B; US11842458B2; US11551329B2; US20170263019A1; US20230123624A1; US20200394751A1; AU2017229500A1; TW201734953A; TWI656510B; EP3427165A4; EP3427165B1; CN109074369A; US10861129B2; CA3014670A1; US20240070802A1; WO2017156043A1; EP3427165A1; KR20180114232A

Abstract

画像認識検索を改善する方法、システム、および製品を開示する。実施形態において、既知オブジェクトの第１文書イメージを用いて、１以上の画像合成技術を適用することにより、同じオブジェクトの１以上の他文書イメージを生成する。合成画像は、クエリイメージ候補をキャプチャする可能性がある条件における変動に対応する。既知オブジェクトの初期画像から抽出した特徴と１以上の合成画像から抽出した特徴を、これらの位置とともに、既知オブジェクトの共通モデルの一部として格納する。他実施形態において、同じ既知オブジェクトの複数画像の特徴位置を共通座標系へ変換することにより、画像認識検索効率を改善する。これにより、例えば幾何的検証などを含む既存の画像検索／認識技術のある側面の精度を向上させることができる。【選択図】図３

Description

＜関連出願への相互参照＞
本願は、２０１６年３月８日に出願された米国仮特許出願第６２／３０５，５２５号の優先権を主張する。同文献の全内容は参照により本願に組み込まれる。

本開示は、イメージベースオブジェクト認識に関する。様々な特徴検出アルゴリズムが、イメージベースオブジェクト認識のために用いられている。最も基本的なレベルにおいて、特徴検出アルゴリズムは、イメージベースオブジェクト認識、検索、および取得のために画像の特徴（例：形状、オブジェクト、など）を特徴付け、要約し、インデックス化する手段を提供する記述子を生成する。イメージベースオブジェクト認識のための特徴検出アルゴリズムの１例は、スケール不変特徴変換（ＳＩＦＴ）特徴検出アルゴリズムであり、例えばＬｏｗｅの米国特許６，７１１，２９３号に記載されているものである。例えばＳＩＦＴ特徴検出アルゴリズムを画像に適用して、当該画像内の複数の特徴の記述表現を生成することができる。

マシンベースオブジェクト認識は一般に２つのステップを有する。第１に、特徴検出アルゴリズム（例：ＳＩＦＴ特徴検出アルゴリズム）を用いて既知オブジェクトのトレーニングイメージを分析するステップであり、これは画像データ内の特徴に対応する記述表現を生成する。異なるオブジェクトに対応する記述表現は、認識デバイス（例：スマートフォン）へ配信するために、認識ライブラリまたはデータベースとしてパッケージ化することができる。既知オブジェクトに対応する画像および／または記述表現データは、本明細書において“文書イメージ”と呼ぶ場合がある。これは単に任意の画像情報を参照するラベルであり、例えば既知オブジェクトに対応する特徴記述表現である。第２に、認識デバイスはオブジェクトの新たな“クエリ”画像をキャプチャする。認識デバイスはクエリイメージに対して同じ画像処理アルゴリズムを適用し、これによりクエリイメージ記述表現を生成する。デバイスは次に、クエリイメージ記述表現を認識ライブラリ内のトレーニングイメージ記述表現と比較する。十分合致すれば（通常は最も近接する合致）、クエリイメージは既知オブジェクトのうち数なくとも１つの記述表現を含んでいるとみなされる。

最良の認識アルゴリズムは、１以上の画像パラメータに対して不変であることを指向しているが、実際には計算した特徴記述表現は例えば照明、方向、その他要因に基づき変化する。これにより、正確で高速な認識は困難となる。特定のオブジェクトを含むクエリイメージは、画像特徴をオブジェクト認識データベースに格納する同じオブジェクトの画像とは異なる条件下でキャプチャされる場合があるからである。したがって同じ特徴記述表現は、異なる条件でキャプチャされた同じオブジェクトの別画像において、ある程度異なる値を有する場合がある。同じオブジェクト認識データベース内に同じ既知オブジェクトの複数の画像を格納することが知られている。この複数の画像は、異なる条件（例：照明、方向、など）でキャプチャされたものである。しかし本願発明者等は、同じオブジェクトの様々なキャプチャ条件を反映するオブジェクト認識データベースの利点を得るために、同じオブジェクトの複数のキャプチャ画像を有する必要はないことを見出した。本願発明者等は、画像キャプチャに対応する現実世界の条件変化に対応する変動を有する複数の画像を合成する既存技術を用いて、画像認識データベースのオブジェクトモデルを充填できることを見出した。

したがって本発明の実施形態は、既知オブジェクト（本明細書において文書イメージと呼ぶ場合もある）の第１画像を用いて、前記第１文書イメージから画像を合成する１以上の技術を適用することにより、同じオブジェクトの１以上の他文書イメージを生成する、方法、システム、製品を含む。前記１以上の合成した他文書イメージは、クエリイメージ候補がキャプチャされる条件の変動に対応する。この変動の例としては、照明条件（例えば時刻および／または天候変動）や撮影地点（すなわち、同じオブジェクトを異なる視点から撮影する）の変動が含まれるが、これらに限らない。変動の中には特定の文脈に固有のものもある。例えば医療画像の文脈において、組織密度の変動は同じ既知オブジェクトの異なる画像をもたらす。変動の例としては撮像機器（例：Ｘ線、ＭＲＩ、ＣＡＴスキャン、超音波、など）の変動も含まれる。既知オブジェクトの初期画像から抽出した特徴と１以上の合成画像から抽出した特徴を、既知オブジェクトの共通モデルの一部として、その場所とともに格納する。望ましい実施形態において、合成文書イメージ内の特徴の場所は、合成文書イメージを生成した初期文書イメージの特徴の場所と同じ座標系において表される。これにより座標変換を実施する必要がなくなる。

本願発明者等は、２以上の個別にキャプチャした同じ既知オブジェクトの文書イメージを利用できるとき、複数画像の特徴の場所を共通座標系へ変換することにより、画像認識検索効率を改善できることを見出した。したがって本発明の他実施形態において、複数のキャプチャ文書イメージから抽出した特徴の場所は、複数文書イメージのうちいずれかに対応する座標システムへ変換される。この共通座標系における抽出した特徴とその位置は、既知オブジェクトのモデルの一部として格納される。これにより、既存の画像検索／認識技術（例えば幾何的検証）のある側面の精度を向上させることができる。

本発明の他の側面は、以下の詳細説明と図面からより明らかになるであろう。図面において同様の符号は同様のコンポーネントを表している。

画像認識ネットワークの文脈における本発明の実施形態に係る特徴組み合わせデバイスを示す。

既知オブジェクトのキャプチャした第１文書イメージと合成した第２文書イメージを示す。

１以上の画像キャプチャデバイスおよびオブジェクト認識システムとともに動作する特徴組み合わせデバイスが実施する、本発明の実施形態に係るプロセスを示す。

本発明の実施形態にしたがって、同じ既知オブジェクトの個別にキャプチャされた（または個別に生成された）２つの画像からの特徴を組み合わせる、複数特徴組み合わせプロセスを概念的に示す。

本発明の実施形態に係るコンピュータプログラム製品を格納する命令コードを実行するために用いるコンピュータシステムの例を示す。

上記図面を参照して本発明を記載したが、これら図面は説明目的を意図しており、他実施形態も本発明の要旨に整合するとともに本発明の範囲内である。

以下に図面を参照しながら様々な実施形態を説明する。図面は本願の一部を形成し、本実施形態を実施する具体例を例示する。ただし本明細書は様々な形態で実施することができ、本明細書が記載する実施形態に限定して解釈すべきではない。むしろこれら実施形態は、本明細書が包括的かつ完全なものとなるように提供され、当業者に対して本発明の範囲を完全に伝えるものである。本明細書は方法またはデバイスとして実施することができる。したがって本明細書の様々な実施形態は、完全にハードウェア実装した形態、完全にソフトウェア実装した形態、またはソフトウェアとハードウェアを組み合わせた形態をとることができる。したがって以下の説明は、限定的に解釈すべきではない。

図１は、画像認識ネットワーク１０００の文脈における特徴組み合わせデバイス１１０を示す。文書イメージデータ１０３は、画像キャプチャデバイス１０１によって特徴組み合わせデバイス１１０に対して提供される。文書イメージデータ１０３は、既知オブジェクトのメタデータを含む画像データを有する。実施形態において文書イメージデータは、メタデータとともに表示可能画像ファイルを含む。ただし他実施形態において、画像データは表示可能デジタル画像から導出した画像データを含んでもよい。この導出画像データはそれ自体は画像表示のために用いることはできないものである。例えば画像認識検索において用いることができる１以上の特徴識別アルゴリズムに基づく画像特徴の記述表現である。

実施形態において、文書イメージデータ１０３に対応する文書イメージは、オブジェクトの２次元（２Ｄ）画像を表す。これは通常の写真、画像、ビデオフレームにおいて見られるものである。これに代えて対応する文書イメージは、非定型フィルタやレンズ（例：魚眼レンズ）を利用して生成した歪画像であってもよい。さらに文書イメージは、赤外（ＩＲ）フィルタ、Ｘ線、３６０度ビュー、などに基づくオブジェクトの機械ビューまたはロボットビューであってもよい。このように文書イメージデータ１０３に対応する文書イメージは、３次元オブジェクトの歪んでいないイメージ、赤外フィルタイメージ、Ｘ線イメージ、３６０度ビューイメージ、機械ビューイメージ、ビデオデータフレーム、画像レンダリング、および斜視ビューのうちいずれかであってよく、例えば画像キャプチャデバイス１０１などを介してビデオストリームのビデオフレームをキャプチャすることにより取得することができる。

実施形態において、画像キャプチャデバイス１０１のうちいずれかは、特徴組み合わせデバイス１１０の外部デバイス（図示している通り）または内部デバイスであってもよい。例えば画像キャプチャデバイス１０１は、通信ネットワークを介して特徴組み合わせデバイス１１０と接続されたリモートサーバ（例：ＰｌａｔｆｏｒｍａｓａＳｅｒｖｉｃｅ（ＰａａＳ）サーバ、ＩｎｆｒａｓｔｒｕｃｔｕｒｅａｓａＳｅｒｖｉｃｅ（ＩａａＳ）サーバ、ＳｏｆｔｗａｒｅａｓａＳｅｒｖｉｃｅ（ＳａａＳ）サーバ、クラウドベースサーバ）またはリモート画像データベースを備えていてもよい。他実施形態において画像キャプチャデバイス１０１は、画像および／またはビデオデータのフレームをキャプチャするように構成されたデジタル静止画像または映像カメラを備える。他実施形態において画像キャプチャデバイス１０１は、画像レンダリングエンジン（例：ゲームシステム、画像レンダリングソフトウェア、など）を備え、この場合における文書イメージはオブジェクトのキャプチャ画像ではなく生成した画像である。

画像特徴の記述表現は例えば、画像の１以上の識別可能特徴（例：形状、オブジェクト、など）に対応するベクトルである（表現上の効率のため、本命明細書における用語“画像特徴”は、表示可能画像に出現する特徴そのものではなく、画像特徴に対応する記述表現セットを暗黙的に指す場合がある）。画像特徴を検出して記述表現を生成する様々な方法が存在する。例えばスケール不変特徴変換（ＳＩＦＴ）は、画像特徴を検出して表現するために現在よく用いられている画像認識アルゴリズムである。ＳＩＦＴ記述子は１２８次元を有して識別性が高く（すなわち、マッチング目的のために識別可能である）、少なくとも部分的には変動に対して耐性を有する。ここでいう変動は例えば、照明、３次元（３Ｄ）視点、などである。例えばＳＩＦＴ記述子を生成することに関する１つの参考文献は、Ｄ．Ｌｏｗｅの“ＤｉｓｔｉｎｃｔｉｖｅＩｍａｇｅＦｅａｔｕｒｅｓｆｒｏｍＳｃａｌｅ−ＩｎｖａｒｉａｎｔＫｅｙｐｏｉｎｔｓ”，ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒＶｉｓｉｏｎ６０（２），ｐａｇｅｓ９１−１１０（２００４）である。ＳＩＦＴ記述子に加えて、代替記述子としては以下が挙げられる：ＦａｓｔＲｅｔｉｎａＫｅｙｐｏｉｎｔ（ＦＲＥＡＫ）記述子、ＨｉｓｔｏｇｒａｍｓｏｆＯｒｉｅｎｔｅｄＧｒａｄｉｅｎｔ（ＨＯＧ）記述子、ＳｐｅｅｄｅｄＵｐＲｏｂｕｓｔＦｅａｔｕｒｅｓ（ＳＵＲＦ）記述子、ＤＡＩＳＹ記述子、ＢｉｎａｒｙＲｏｂｕｓｔＩｎｖａｒｉａｎｔＳｃａｌａｂｌｅＫｅｙｐｏｉｎｔｓ（ＢＲＩＳＫ）記述子、ＦＡＳＴ記述子、ＢｉｎａｒｙＲｏｂｕｓｔＩｎｄｅｐｅｎｄｅｎｔＥｌｅｍｅｎｔａｒｙＦｅａｔｕｒｅｓ（ＢＲＩＥＦ）記述子、ＨａｒｒｉｓＣｏｒｎｅｒｓ記述子、Ｅｄｇｅｓ記述子、ＧｒａｄｉｅｎｔＬｏｃａｔｉｏｎａｎｄＯｒｉｅｎｔａｔｉｏｎＨｉｓｔｏｇｒａｍ（ＧＬＯＨ）記述子、ＥｎｅｒｇｙｏｆｉｍａｇｅＧｒａｄｉｅｎｔ（ＥＯＧ）記述子、ＴｒａｎｓｆｏｒｍＩｎｖａｒｉａｎｔＬｏｗ−ｒａｎｋＴｅｘｔｕｒｅｓ（ＴＩＬＴ）記述子。

特徴組み合わせデバイス１１０は、同じ既知オブジェクトの異なる画像からの特徴を組み合わせ、その組み合わせ特徴をそのオブジェクトの共通モデルの一部として格納する。実施形態において、特徴を導出する複数の文書イメージは、キャプチャした画像である第１画像と、キャプチャ画像から合成した１以上の第２画像とを含む。詳細は以下で説明する。他実施形態において、特徴を導出する複数の文書イメージは、第１キャプチャ画像と、同じ既知オブジェクトの別途キャプチャした１以上の第２画像とを含む。これら実施形態において、個別キャプチャした１以上の第２画像からの特徴の場所は、既知オブジェクトの３次元モデルを用いて、第１キャプチャ画像の座標系へ変換される。詳細は以下で説明する。同じオブジェクトの個別にキャプチャした複数画像からの特徴（より正確にはこれら特徴の記述表現）は、共通座標系（例：第１キャプチャ画像の座標系）を参照する特徴場所情報とともに、既知オブジェクトの共通モデルの一部として、オブジェクト認識システム１２０内のオブジェクト認識データベース１２１内の組み合わせ特徴データ１０６として格納される。

画像キャプチャデバイス１０２はクエリイメージをキャプチャし、クエリイメージデータ１０４をオブジェクト認識システム１２０へ送信する。オブジェクト認識システム１２０は、クエリイメージデータ１０２内のまたはクエリイメージデータ１０２から導き出した画像特徴記述子を用いてオブジェクト認識データベースを検索し、画像キャプチャデバイス１０２がキャプチャした画像における１以上のオブジェクトとの１以上の合致を識別することを試みる。１以上の合致が存在する場合、これは画像キャプチャデバイス１０２に対して検索結果１０７として戻される。代替実施例において、クエリイメージデータは画像をキャプチャするデバイス以外のデバイスから送信することもできる。

図２は、既知オブジェクト２００の第１キャプチャ画像２０１と第２合成画像２０２を示す。第２合成画像２０２は、画像２０１に対応するまたは画像２０１から導き出した画像データに対してアルゴリズムを適用することにより、第１画像２０１から生成したものである。選択するアルゴリズムは、画像をキャプチャする条件において予測される変動の効果を複製することを意図している。図２に示す例において、画像２０２は、別時刻において撮影したとすれば画像２０１がどのように見えるかの予測を表している。すなわち別時刻において予測される別の照明条件において撮影したときの予測である。別時刻に対応する修正画像を生成する既知のアルゴリズムは下記文献に記載されている：“ＤａｔａＤｒｉｖｅｎＨａｌｌｕｃｉｎａｔｉｏｎｏｆＤｉｆｆｅｒｅｎｔＴｉｍｅｓｏｆｄａｙｆｒｏｍａＳｉｎｇｌｅＯｕｔｄｏｏｒＰｈｏｔｏ”，ＹｉＣｈａｎｇＳｈｉｈ，ＳｙｌｖａｉｎＰａｒｉｓ，ＦｒｅｄｏＤｕｒａｎｄ，ａｎｄＷｉｌｌｉａｍＴ．Ｆｒｅｅｍａｎ，ｐｕｂｌｉｓｈｅｄｉｎＡＣＭＴｒａｎｓａｃｔｉｏｎｓｏｎＧｒａｐｈｉｃｓ（ＴＯＧ）−ＰｒｏｃｅｅｄｉｎｇｓｏｆＡＣＭＳＩＧＧＲＡＰＨＡｓｉａ２０１３，Ｖｏｌｕｍｅ３２Ｉｓｓｕｅ６，Ｎｏｖｅｍｂｅｒ２０１３，ＡｒｔｉｃｌｅＮｏ．２００。図２に示す例において、オブジェクト２００の画像２０２は、Ｓｈｉｈｅｔａｌ．のアルゴリズムなどを画像２０１に対して適用することにより取得される。

様々な既知のアルゴリズムを用いて、キャプチャ画像から合成画像を生成することができる。合成画像は、様々な画像キャプチャ条件の予測変動の効果を効果的に複製することができる。この変動の例としては以下が挙げられるがこれに限らない：照明条件の変動（例えば時刻変化および／または天候変化によるもの）と撮影地点の変動（すなわち、同じオブジェクトを異なる視点から撮影する）；撮影機器の変動（特に医療画像の文脈において関連するもの（例：Ｘ線、ＭＲＩ、ＣＡＴスキャン、超音波、など））。医療画像の文脈において、既知の技術により、第１撮影機器の画像から第２撮影機器の画像を合成することができる。例えば下記を参照：“Ｕｓｉｎｇｉｍａｇｅｓｙｎｔｈｅｓｉｓｆｏｒｍｕｌｔｉ−ｃｈａｎｎｅｌｒｅｇｉｓｔｒａｔｉｏｎｏｆｄｉｆｆｅｒｅｎｔｉｍａｇｅｍｏｄａｌｉｔｉｅｓ”，ＭｉｎＣｈｅｎｅｔａｌ．，ＰｒｏｃＳＰＩＥＩｎｔＳｏｃＯｐｔＥｎｇ．２０１５Ｆｅｂｒｕａｒｙ２１；“ＵｎｓｕｐｅｒｖｉｓｅｄＣｒｏｓｓ−ｍｏｄａｌＳｙｎｔｈｅｓｉｓｏｆＳｕｂｊｅｃｔ−ｓｐｅｃｉｆｉｃＳｃａｎｓ”，ＲａｖｉｔｅｊａＶｅｍｕｌａｐａｌｌｉｅｔａｌ．，２０１５ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ（ＩＣＣＶ）。

実施形態において、共通オブジェクトモデルの一部として組み合わせ特徴セットのサブセットを選択して格納してもよい。これは例えば、共通ピクセル位置を有する第１画像と１以上の第２合成画像（第１画像を用いて導き出したもの）から共通位置特徴を判定することにより、組み合わせ特徴のロバスト特徴を識別するステップ、および、識別したロバスト特徴のみを選択して格納し、コンピュータオブジェクト認識検索において用いるステップによる。ロバスト特徴を識別するステップはさらに、第１画像と１以上の第２合成画像から特徴を抽出する特徴検出アルゴリズムの多次元特徴空間において規定距離内にある特徴を共通位置特徴から選択することにより、高ロバスト特徴を識別するステップを有してもよい。この実施形態において、識別した高ロバスト特徴は、コンピュータオブジェクト識別検索において用いるために選択される。ロバスト特徴を識別し用いるより効率的な蓄積および検索については、以下に記載されている：米国特許出願１４／６９６，２０２号、２０１５年４月２４日出願、発明の名称“ＲＯＢＵＳＴＦＥＡＴＵＲＥＩＤＥＮＴＩＦＩＣＡＴＩＯＮＦＯＲＩＭＡＧＥ−ＢＡＳＥＤＯＢＪＥＣＴＲＥＣＯＧＮＩＴＩＯＮ”。同出願の全内容は参照により本願に組み込まれる。

図３は、１以上の画像キャプチャデバイス１０１とオブジェクト認識システム１２０とともに動作して特徴組み合わせデバイス１１０が実施するプロセス３００を示す。ステップ３０１において、第１文書イメージを受信する。これは実施形態において、既知オブジェクトのキャプチャ画像または上述のような既知オブジェクトのその他タイプの画像である。ステップ３０２において、第１文書イメージから１以上の合成画像を生成することにより、既知オブジェクトの１以上の第２文書イメージを生成する。１以上の第２イメージは、画像キャプチャ条件において予測される変動を複製するように合成される。ステップ３０３において、第１文書イメージ（例：キャプチャ画像）と１以上の第２合成画像から画像特徴を抽出する。ステップ３０４において、第１文書イメージからの特徴と１以上の合成画像からの特徴を、文書イメージの既知オブジェクトに対応する共通モデルの一部として格納する。

上述のように、既知オブジェクト画像が様々な条件下で撮影されていない場合であっても、この技術を用いて、画像認識データベース内のオブジェクトモデルに対してロバスト性を付与することができる。これは特定のアプリケーションにおいて特に有用である。医療画像において認識検索を実施する文脈については既に述べた。他例として、時間に対して繊細な活動および／または制御不能もしくは高速変化する文脈においても、本技術の利点を得ることができる。例えば探索／救助活動において、レスキュー隊は既知の人物または既知のオブジェクトの画像を有している場合があり、この画像は例えば特定の条件下でキャプチャされたものである。しかし、オブジェクトのリアルタイム画像は、全く異なる条件下でキャプチャされたものである場合があり、同じオブジェクトであることもあればそうでない場合もある。検索可能データベース内のオブジェクトモデルに格納するために用いる既知オブジェクトのキャプチャ画像を画像合成して、様々な条件下における既知オブジェクトの画像を複製する第２画像を生成することができる。例えば異なる照明条件、背景条件、天候条件、などである。オブジェクトに影響し得る他の要因も、１以上の合成画像生成プロセスを介して複製することができる。これは例えば、減衰、経年劣化、水分ダメージ、火ダメージ、酸化、その他オブジェクトに対する変化を複製するものである。１以上の合成画像からの特徴を用いて、既知オブジェクトのモデルをよりロバストにし、ユーザはクエリイメージが既知オブジェクトに対応するものであるか否かをより効率的に判定できる。

セキュリティ関連アプリケーションにおいて、様々なアルゴリズムを利用することができる。例えば、文書イメージ内のオブジェクトを、ビデオフレームにおいて見えるものと同様にぼかす（例：ガウシアンぼかし）、ぼかしフィルタを適用することができる。さらに文書イメージをダウンサンプリングして、粗画像効果をシミュレートすることができる。これら技術を救助関連アプリケーションにおいて用いて、移動車両や移動人物をトラッキングし、野生生物をトラッキングし、または移動中のその他物体をトラッキングすることができる。

このようなバリエーションにより、様々な文脈においてオブジェクト認識を向上させることができる。例えば家族写真分析、ソーシャルメディア認識、トラフィック分析である。またこの技術は、高ダイナミックレンジレンダリング（ＨＤＲ）の文脈において用いることができる。例えばＨＤＲを用いずにキャプチャした既知オブジェクト画像を合成して、様々な条件下におけるオブジェクトのＨＤＲ画像を模擬することができる。これを用いて、ＨＤＲクエリイメージを認識する際に用いるオブジェクトモデルを構築することができる。ＨＤＲクエリイメージは例えば、ビデオゲームなどにおいて生成されるものである。これとは反対に、既知オブジェクトのＨＤＲ画像を用いて、様々な条件下におけるオブジェクトの非ＨＤＲ画像を合成することができる。これを非ＨＤＲクエリイメージによって検索するデータベース内のオブジェクトモデルとして格納することができる。さらに、バリエーションの例としては、画像編集ソフトウェア（例：ＰｈｏｔｏＳｈｏｐ（登録商標）、ＧＩＭＰ、など）などにおける１以上の人工フィルタを文書イメージに対して適用して、合成画像を生成することが挙げられる。人工フィルタの例としては以下が挙げられる：テクスチャフィルタ（例：キャンバス効果、色糸効果、など）、ｃａｒｔｏｏｎ効果、キューブ化効果、印象派効果、ガラスタイル効果、油絵効果、フォトコピー効果、メディアタイプ効果（例：色鉛筆、パステル、水彩絵の具、など）、レリーフ効果、など。これら技術は、極限環境において撮影されるオブジェクトを認識しようとするとき有用である。例えばガラスタイルウインドウを介するときまたは極端に変更された著作権画像である。

図４は、２つの個別にキャプチャされた（または個別に生成された）既知オブジェクト４００（この例においてはエッフェル塔）の画像からの特徴を組み合わせる特徴組み合わせプロセスを概念的に示す。第１文書イメージ４１０は、第２文書イメージ４３０とは別にキャプチャされたものである。既存技術を適用して、各画像内の区別可能特徴を識別することができる。このような特徴は、オブジェクト４００の画像を他オブジェクトの画像から区別する際に有用であることが期待できる。説明目的のみのため、画像４１０においてそのような特徴を識別している。例えば特徴４１１、４１２、４１３、４１４である。画像４３０においてもそのような特徴を識別している。例えば特徴４３１、４３２、４３３である。先に述べた既存アルゴリズムを用いて、画像ベースオブジェクト認識検索のために特徴記述子を計算し、蓄積することができる。

画像内のこのような特徴の位置も、記述表現とともに格納することができる。この位置は、特定のピクセル座標を基準として格納することができる。個別にキャプチャした（または個別に生成した）画像は通常、個別のピクセル座標基準システムを有する。これを画像４１０の隣にＸＹ座標によって示し、画像４３０の隣にＶＷ座標によって示す。

本発明の実施形態において、既知オブジェクトの第２個別画像の特徴位置は、第１個別画像の特徴を表すために用いる同じ座標系において表している。両画像の特徴を組み合わせて、オブジェクトの共通モデルの一部として格納する。第２画像に配置されている特徴の第１画像座標系における適切な位置は、３Ｄモデルを用いた座標変換を介して取得される。図示する例において、３Ｄモデル４２０はオブジェクト４００（エッフェル塔）を３Ｄ座標ＡＢＣで表している。画像４３０において座標ＶＷで表している位置は、既存技術を用いて、座標ＡＢＣで表す３Ｄモデル４２０へ投影することができる。次に３Ｄモデル４２０において座標ＡＢＣを用いて表している位置は、既存技術を用いて、座標ＸＹで表す画像４１０内の位置へ投影することができる。例えば画像４３０において、特徴４３１は座標ＶＷにおいて（Ｖ１，Ｗ１）として表される位置Ｌ１を有する。位置Ｌ１を３Ｄモデル４２０へ投影すると、モデル上で位置Ｌ１’となり、これは座標ＡＢＣにおいて（Ａ１，Ｂ１，Ｃ１）として表すことができる。次に、３Ｄモデル４２０における位置Ｌ１’を画像４１０へ投影する。これは画像４１０において位置Ｌ’’を有し、座標ＸＹにおいて（Ｘ１，Ｙ１）として表すことができる。このように、同じ既知オブジェクトの複数の個別画像における特徴位置は、単一の座標系において表すことができる。この例においては画像４１０のＸＹ座標系である。よって、画像４３０における特徴４３１の記述子が計算されると、これを座標系ＸＹにおける位置（Ｘ１，Ｙ１）として格納できる。画像４１０と４３０からの特徴は、画像４１０の座標を用いてこのように格納され、これはオブジェクト認識システム１２０のオブジェクト認識データベース１２１内のオブジェクト４００の共通モデルの一部となる。オブジェクト４００の任意個数のその他個別画像における位置に対応する特徴位置は、以下の同様のプロセスにしたがって画像４１０のＸＹ座標へ変換することができる：（１）別画像の特徴位置をＡＢＣ座標で表される３Ｄモデル４２０の位置へ投影する；（２）モデル４２０におけるその３Ｄ位置を画像４１０のＸＹ座標で表される位置へ投影する。

図５は、１以上の画像キャプチャデバイス１０１とオブジェクト認識システム１２０とともに動作する特徴組み合わせデバイス１１０が実施するプロセス５００を示す。プロセス５００は、第２画像の座標系から第１画像の座標系で表される位置へ特徴位置を変換することにより、同じ既知オブジェクトの２以上の個別キャプチャした画像からの特徴を組み合わせるプロセスを実装している（図４で概念的に示したもの）。ステップ５０１において、同じ既知オブジェクトの２以上の個別キャプチャ画像または個別生成画像を受信する。ステップ５０２において、各画像の区別可能特徴（記述子を計算することができるもの）を識別する。各特徴の対応する位置も判定される。ステップ５０３において、既知オブジェクトの３Ｄモデルを用いて、第２個別画像における特徴位置を第１個別画像の座標系における位置へ変換する。例えば、同じ既知オブジェクトの第１画像、第２画像、第３画像が存在し、第１画像、第２画像、第３画像における特徴位置が第１座標系、第２座標系、第３座標系において表されている場合、第２画像における特徴位置は３Ｄモデルを用いて第１画像の座標系における位置へ変換される。同様に第３画像における特徴位置も、３Ｄモデルを用いて、第１画像の座標系における位置へ変換される。ステップ５０４において、複数の個別画像からの全ての特徴（より正確には、これら特徴から計算した記述子）を、（共通座標系において表される特徴位置とともに）既知オブジェクトの共通モデルの一部として格納する。この方法を適用して、同じ既知オブジェクトの任意個数の個別キャプチャ（または個別生成）画像からの特徴を組み合わせることができる。

図３の方法３００と図５の方法５００は、他方から独立して用いることができ、あるいは一緒に用いることができる。換言すると本発明の実施形態は、方法３００を用いて、第１画像からの特徴を１以上の第２画像の特徴と組み合わせ、１以上の第２画像は第１画像から合成することができる。本発明の他実施形態は、方法５００を用いて、特徴位置を共通座標系へ変換することにより、同じ既知オブジェクトの個別キャプチャ画像からの特徴を組み合わせることができる。他実施形態は、同じ既知オブジェクトの共通モデルを構築する際に両方法を用い、これを画像ベースオブジェクト認識において用いることができる。例えばモデルは、同じ既知オブジェクトの５つの画像（画像１、画像２、画像３、画像４、画像５）からの特徴記述子を含む。画像１、画像２、画像３は例えば個別キャプチャ（または個別生成）画像である。画像２と画像３からの特徴は、方法５００を用いてこれら画像の特徴位置を画像１に対応する座標系における座標として表される特徴位置へ変換することにより、画像１の特徴と組み合わせることができる。ただし、画像４と画像５は画像１から合成することができ、これら画像内の特徴位置は画像１の座標系によって既に表されていることになる。５画像からの特徴は、方法３００と方法５００の組み合わせを用いて、同じオブジェクトモデルの一部として格納することができる。第１アルゴリズムの次に第２アルゴリズムを適用することにより、必ずしもその反対順序で適用したときと同じ記述子セットが生成されるわけではないことを、理解されたい。したがって本発明の実施形態は、２以上のアルゴリズムを特定の順序で適用して画像を合成することも含んでいるといえる。

本明細書が記載するシステム、装置、および方法は、デジタル回路を用いて実装することができ、あるいは既知のコンピュータプロセッサ、メモリユニット、ストレージデバイス、コンピュータソフトウェア、その他コンポーネントを用いる１以上のコンピュータを用いて実装することができる。コンピュータは通常、命令を実行するプロセッサと、命令およびデータを格納する１以上のメモリを備える。コンピュータはさらに、１以上の大容量記憶デバイスを備えまたはこれと接続することができる。例えば１以上の磁気ディスク、内部ハードディスク、リムーバブルディスク、磁気光ディスク、光ディスク、などである。

本明細書が記載するシステム、装置、および方法は、クライアント−サーバ形式で動作するコンピュータを用いて実装することができる、このようなシステムにおいては通常、クライアントコンピュータはサーバコンピュータから離れて配置されており、ネットワークを介してやり取りする。クライアント−サーバ関係は、クライアントコンピュータとサーバコンピュータそれぞれで実行されるコンピュータプログラムによって定義され制御される。

本明細書が記載するシステム、装置、および方法は、情報搬送体に組み込まれたコンピュータプログラム製品を用いて実装することができる。情報搬送体は例えば、プログラム可能プロセッサが実行する非一時的機械読取可能記憶デバイスである。図３および／または図５の１以上のステップを含む本明細書が記載する方法は、プロセッサが実行する１以上のコンピュータプログラムを用いて実装することができる。コンピュータプログラムは、コンピュータにおいて直接または間接に用いることができるコンピュータプログラム命令セットであり、これにより特定の動作を実施しまたは特定の結果をもたらすものである。コンピュータプログラムは、任意形態のプログラミング言語で記述することができる。これはコンパイル言語でもよいしインタプリタ言語でもよい。コンピュータプログラムは、任意形態で配信することができる。例えばスタンドアロンプログラム、モジュール、コンポーネント、サブルーチン、その他コンピュータ環境において用いるのに適したユニットである。

図６は、コンピュータシステム６０００の例を示す（図１のネットワーク１０００のコンポーネントのうち１以上を提供する。すなわち、特徴組み合わせデバイス１１０、画像キャプチャデバイス１０１、画像キャプチャデバイス１０２、および／またはオブジェクト認識システム１２０を含む）。コンピュータシステム６０００を用いて、本発明の実施形態に係るコンピュータプログラム製品６０６０に含まれる命令コードを実行することができる。コンピュータプログラム製品６０６０は、電子的読取可能媒体内の実行可能コードを含む。実行可能コードは、コンピュータシステム６０００などの１以上のコンピュータに対して、本明細書の実施形態によって実施される方法ステップを実現する処理を実施するように指示することができる。電子的読取可能媒体は、情報を電子的に格納する任意の非一時的媒体であり、ローカルアクセスすることもできるし、例えばネットワーク接続を介してリモートアクセスすることもできる。代替実施形態において、この媒体は一時的媒体であってもよい。記憶媒体は、異なる場所および／または異なる時刻において実行可能コードの一部を格納するように構成された、複数の地理的に分散した媒体を含む。電子的読取可能媒体内の実行可能命令コードは、図示するコンピュータシステム６０００に対して、本明細書が記載する様々なタスクを実施するように指示する。本明細書が記載するタスクを実施するよう指示する実行可能コードは通常、ソフトウェアに実装されている。ただし、コンピュータその他電子デバイスは、ハードウェアに実装されたコードを利用して本発明から逸脱することなく全てのタスクを実施できることを、当業者は理解するであろう。実行可能コードの変形も本発明の要旨と範囲に含まれる方法を実装できることを、当業者は理解するであろう。

コンピュータプログラム製品６０６０に含まれるコードまたはそのコピーは、システム６０００に接続された１以上の永続記憶媒体（図示せず）に格納されて読み出され、永続記憶デバイス６０７０および／またはメモリ６０１０に格納されてプロセッサ６０２０が実行する。コンピュータシステム６０００は、Ｉ／Ｏサブシステム６０３０と周辺デバイス６０４０を備える。Ｉ／Ｏサブシステム６０３０、周辺デバイス６０４０、プロセッサ６０２０、メモリ６０１０、永続記憶デバイス６０６０は、バス６０５０を介して接続されている。永続記憶デバイス６０７０およびコンピュータプログラム製品６０６０を格納するその他永続ストレージと同様に、メモリ６０１０は非一時的媒体である（通常の揮発性コンピュータメモリデバイスとして実装されていたとしても）。さらに、本明細書が記載するプロセスを実施するためにコンピュータプログラム製品６０６０を格納することに加えて、メモリ６０１０および／または永続記憶デバイス６０６０は本明細書が記載する様々なデータ要素を格納するように構成できることを、当業者は理解するであろう。

コンピュータシステム６０００は、本発明の実施形態に係るコンピュータプログラム製品を実装するシステムの１例に過ぎないことを、当業者は理解するであろう。代替実施形態として、本発明の実施形態に係るコンピュータプログラム製品に含まれる命令の実行は、複数コンピュータにわたって分散してもよい。例えば分散コンピュータネットワークの各コンピュータである。

実際のコンピュータまたはコンピュータシステムの実装は、他の構造を有してもよいし他のコンポーネントを含んでもよく、図６は説明のためのコンピュータのコンポーネントのうち一部を高レベルに抽象化したものであることを、当業者は認識するであろう。

本明細書と特許請求範囲の全体にわたって、以下の用語は文脈上明らかに異なる意味を有する場合を除き、以下の意味を有する。

本明細書におけるフレーズ“実施形態において”は、必ずしも同じ実施形態を指しているものではないが、同じ実施形態であってもよい。よって以下に記載するように、本発明の様々な実施形態は、本発明の範囲と要旨から逸脱することなく、容易に組み合わせることができる。

本明細書において、用語“または”は包含的“ｏｒ”演算子であり、文脈上明らかに異なる意味である場合を除いて、“および／または”と等価である。

用語“基づき”は排他的なものではなく、文脈上明らかに異なる意味である場合を除いて、記載していない要素に基づくことも許される。

本明細書において、文脈上明らかに異なる意味である場合を除いて、用語“接続されている”は、直接接続（接続された２つの要素が互いに接触している）と間接接続（少なくとも１つの別要素が２つの要素間に配置されている）をともに含むことを意図している。したがって用語“へ接続されている”と“に接続されている”は、同義である。２以上のコンポーネントまたはデバイスがデータ交換することができるネットワーク環境の文脈において、用語“へ接続されている”と“に接続されている”は、１以上の中間デバイスを介して“通信可能に接続されている”ことを意味する。

本明細書全体にわたって、“ａ”、“ａｎ”、“ｔｈｅ”は複数のものを指す場合を含み、“内”の意味は“なか”と“上”を含む。

本明細書の様々な実施形態は発明要素の単一の組み合わせを構成するが、本発明は本明細書の全ての可能な組み合わせを包含することを、理解されたい。したがって、ある実施形態が要素ＡＢＣを備え、他実施形態が要素ＢＤを備える場合、本明細書において明示していないとしても、本発明はＡＢＣＤのその他組み合わせを含む。

本明細書と特許請求範囲において、システム、エンジン、サーバ、デバイス、モジュール、その他コンピュータ要素がメモリ内のデータに対して機能を実施するように構成されている場合、“構成されている”または“プログラムされている”の意味は、コンピュータ要素のメモリに格納されているソフトウェア命令セットによって、メモリ内の格納されているターゲットデータまたはデータオブジェクトに対して機能セットを実行するように、コンピュータ要素の１以上のプロセッサまたはコアがプログラムされていることである。

コンピュータに関連する任意の用語は、コンピュータデバイス、サーバ、インターフェース、システム、データベース、エージェント、ピア、エンジン、コントローラ、モジュール、その他タイプの個別動作または一括動作するコンピュータデバイス構造の任意の適当な組み合わせを含むように理解されたい。コンピュータデバイスは、非一時的コンピュータ読取可能記憶媒体（例：ハードドライブ、ＦＰＧＡ、ＰＬＡ、ソリッドステートドライブ、ＲＡＭ、フラッシュ、ＲＯＭ、など）に格納されたソフトウェア命令を実行するように構成されたプロセッサを備えることを、理解されたい。ソフトウェア命令は、本明細書の装置に関して説明する役割、責任、その他機能を提供するように、コンピュータデバイスを構成またはプログラムする。さらに本技術は、コンピュータベースのアルゴリズム、プロセス、方法、その他命令の実装に関する本技術のステップをプロセッサに実行させるソフトウェア命令を格納する非一時的コンピュータ読取可能媒体を含むコンピュータプログラム製品として実装できる。実施形態において、サーバ、システム、データベース、またはインターフェースは、標準プロトコルまたはアルゴリズムを用いてデータを交換する。例えば、ＨＴＴＰ、ＨＴＴＰＳ、ＡＥＳ、公開鍵交換、ｗｅｂサービスＡＰＩ、既知の金融取引プロトコル、その他電子情報交換方法に基づくものである。デバイス間のデータ交換は、パケット交換ネットワーク、インターネット、ＬＡＮ、ＷＡＮ、ＶＰＮ、その他タイプのパケット交換ネットワーク、回路スイッチネットワーク、セルスイッチネットワーク、その他タイプのネットワーク上で実施することができる。

本発明は、コンピュータデバイスが人間の能力を超えて大量のデジタルデータを処理できるようにするものである。実施形態においてデジタルデータは画像である場合があるが、デジタルデータは画像の１以上のデジタルモデルであってもよく、必ずしも画像そのものでなくともよいことを理解されたい。コンピュータデバイスのメモリ上でそのデジタルデータをインスタンス化することにより、コンピュータデバイスは、そのユーザがツールを有していないユーティリティを提要するように、デジタルデータまたはモデルを管理することができる。

デジタル画像ベースオブジェクト認識および取得技術の範囲、精度、小型性、効率、スピードを向上させる多くの有利な技術的効果を本技術が提供することを、理解されたい。本明細書は広範な概観として意図しているものではなく、明確性と簡潔性のために簡略化できることを理解されたい。

以上の説明は、説明と例示のためのものであり限定目的ではなく、本明細書が記載する本発明の範囲は本明細書から規定されるものではなく、特許法が許容する最大限の解釈にしたがって特許請求範囲から規定されることを理解されたい。本明細書が記載する実施形態は、本発明の原理を説明するためのみのものであり、当業者は本発明の範囲と要旨から逸脱することなく様々な変形をなすことができることを、理解されたい。当業者は、本発明の範囲と要旨から逸脱することなく、様々な組み合わせを実装することができる。

Claims

コンピュータ化オブジェクト認識システムにおいて用いるように構成されたコンピュータ化画像認識データベースに格納される画像特徴組み合わせを生成する方法であって、
１以上の生成コンピュータを用いて、オブジェクトの第１画像から前記オブジェクトの合成画像を生成するステップであって、前記合成画像は、前記オブジェクトの前記第１画像に対応する第１画像キャプチャ条件とは異なる第２画像キャプチャ条件の下で前記オブジェクトが有すると予測される外観を有する前記オブジェクトの画像に対応する、ステップ、
１以上の導出コンピュータを用いて、前記合成画像から特徴検出アルゴリズムを用いて第２画像特徴セットを導出するステップ、
特徴組み合わせデバイスにおいて、前記第１画像から導出した第１画像特徴セットを取得するステップ、
前記特徴組み合わせデバイスにおいて、前記第１画像特徴セットと前記第２画像特徴セットを有する組み合わせ特徴セットを指定するステップ、
コンピュータ化オブジェクト認識検索において用いるように構成された電子データベースに格納するために、前記オブジェクトを識別するメタデータと前記組み合わせ特徴セットを対応付けるステップ、
を有することを特徴とする方法。
前記第１画像キャプチャ条件は第１照明条件に対応し、前記第２画像キャプチャ条件は第２照明条件に対応する
ことを特徴とする請求項１記載の方法。
前記第１照明条件は前記オブジェクトの前記位置における第１時刻に対応し、前記第２照明条件は前記オブジェクトの前記位置における第２時刻において予測される照明条件に対応する
ことを特徴とする請求項２記載の方法。
前記第１画像キャプチャ条件は第１オブジェクト視野に対応し、前記第２キャプチャ条件は第２オブジェクト視野に対応する
ことを特徴とする請求項１記載の方法。
前記第１画像キャプチャ条件は第１撮像機器に対応し、前記第２画像キャプチャ条件は第２撮像機器に対応する
ことを特徴とする請求項１記載の方法。
前記第１撮像機器は、写真、赤外線画像、歪画像、フィルタリング後画像を含むグループから選択されており、
前記第２撮像機器は、前記第１撮像機器とは異なる
ことを特徴とする請求項５記載の方法。
前記第１撮像機器は、Ｘ線、磁気共鳴画像、ＣＡＴスキャン、超音波を含むグループから選択されており、
前記第２撮像機器は、前記第１撮像機器とは異なる
ことを特徴とする請求項５記載の方法。
前記第１画像特徴セットと前記第２画像特徴セットは、特徴検出アルゴリズムを用いて前記第１画像と前記合成画像からそれぞれ取得される
ことを特徴とする請求項１記載の方法。
前記特徴検出アルゴリズムは、
スケール不変特徴変換（ＳＩＦＴ）、ＦａｓｔＲｅｔｉｎａＫｅｙｐｏｉｎｔ（ＦＲＥＡＫ）、ＨｉｓｔｏｇｒａｍｓｏｆＯｒｉｅｎｔｅｄＧｒａｄｉｅｎｔ（ＨＯＧ）、ＳｐｅｅｄｅｄＵｐＲｏｂｕｓｔＦｅａｔｕｒｅｓ（ＳＵＲＦ）、ＤＡＩＳＹ、ＢｉｎａｒｙＲｏｂｕｓｔＩｎｖａｒｉａｎｔＳｃａｌａｂｌｅＫｅｙｐｏｉｎｔｓ（ＢＲＩＳＫ）、ＦＡＳＴ、ＢｉｎａｒｙＲｏｂｕｓｔＩｎｄｅｐｅｎｄｅｎｔＥｌｅｍｅｎｔａｒｙＦｅａｔｕｒｅｓ（ＢＲＩＥＦ）、ＨａｒｒｉｓＣｏｒｎｅｒｓ、Ｅｄｇｅｓ、ＧｒａｄｉｅｎｔＬｏｃａｔｉｏｎａｎｄＯｒｉｅｎｔａｔｉｏｎＨｉｓｔｏｇｒａｍ（ＧＬＯＨ）、ＥｎｅｒｇｙｏｆｉｍａｇｅＧｒａｄｉｅｎｔ（ＥＯＧ）、ＴｒａｎｓｆｏｒｍＩｎｖａｒｉａｎｔＬｏｗ−ｒａｎｋＴｅｘｔｕｒｅｓ（ＴＩＬＴ）、
のうち少なくともいずれかを含む
ことを特徴とする請求項８記載の方法。
前記方法はさらに、
共通ピクセル位置を有する共通位置特徴を前記第１画像と前記合成画像から判定することにより、前記組み合わせ特徴のロバスト特徴を識別するステップ、
前記コンピュータ化オブジェクト認識検索において用いるために前記識別したロバスト特徴のみを選択するステップ、
を有することを特徴とする請求項１記載の方法。
前記ロバスト特徴を識別するステップはさらに、前記第１デジタル画像と前記第２デジタル画像から特徴を抽出するために用いる特徴検出アルゴリズムの多次元特徴空間において規定距離以内にある特徴を前記共通位置特徴から選択することにより、高ロバスト特徴を識別するステップを有し、
前記コンピュータ化オブジェクト認識検索において用いるために、前記識別した高ロバスト特徴のみを選択する
ことを特徴とする請求項１０記載の方法。
前記特徴検出アルゴリズムは、
スケール不変特徴変換（ＳＩＦＴ）、ＦａｓｔＲｅｔｉｎａＫｅｙｐｏｉｎｔ（ＦＲＥＡＫ）、ＨｉｓｔｏｇｒａｍｓｏｆＯｒｉｅｎｔｅｄＧｒａｄｉｅｎｔ（ＨＯＧ）、ＳｐｅｅｄｅｄＵｐＲｏｂｕｓｔＦｅａｔｕｒｅｓ（ＳＵＲＦ）、ＤＡＩＳＹ、ＢｉｎａｒｙＲｏｂｕｓｔＩｎｖａｒｉａｎｔＳｃａｌａｂｌｅＫｅｙｐｏｉｎｔｓ（ＢＲＩＳＫ）、ＦＡＳＴ、ＢｉｎａｒｙＲｏｂｕｓｔＩｎｄｅｐｅｎｄｅｎｔＥｌｅｍｅｎｔａｒｙＦｅａｔｕｒｅｓ（ＢＲＩＥＦ）、ＨａｒｒｉｓＣｏｒｎｅｒｓ、Ｅｄｇｅｓ、ＧｒａｄｉｅｎｔＬｏｃａｔｉｏｎａｎｄＯｒｉｅｎｔａｔｉｏｎＨｉｓｔｏｇｒａｍ（ＧＬＯＨ）、ＥｎｅｒｇｙｏｆｉｍａｇｅＧｒａｄｉｅｎｔ（ＥＯＧ）、ＴｒａｎｓｆｏｒｍＩｎｖａｒｉａｎｔＬｏｗ−ｒａｎｋＴｅｘｔｕｒｅｓ（ＴＩＬＴ）、
のうち少なくともいずれかを含む
ことを特徴とする請求項１１記載の方法。
前記特徴組み合わせデバイスは、前記１以上の生成コンピュータと前記１以上の導出コンピュータを備える
ことを特徴とする請求項１記載の方法。
前記１以上の導出コンピュータ、前記１以上の生成コンピュータ、および前記特徴組み合わせデバイスは、単一のコンピュータとして構成されている
ことを特徴とする請求項１記載の方法。
コンピュータ化オブジェクト認識検索において用いるように構成されたコンピュータ化画像認識データベースに格納する組み合わせ画像特徴を生成する方法であって、
特徴組み合わせデバイスにおいて、第１画像特徴セットと第２画像特徴セットのうち少なくともいずれかに対して座標変換を実施して、前記第１画像特徴セットと前記第２画像特徴セットそれぞれの特徴に共通する共通座標系において表される特徴位置を取得するステップであって、前記第１画像特徴セットはオブジェクトの第１画像から導出され、前記第２画像特徴セットは前記オブジェクトの第２画像から導出され、前記第１画像は第１オブジェクト視野に対応し、前記第２画像は前記第１オブジェクト視野とは異なる第２オブジェクト視野に対応する、ステップ、
前記特徴組み合わせデバイスにおいて、前記共通座標系において表される特徴位置とともに前記第１画像特徴セットと前記第２画像特徴セットを有する組み合わせ特徴セットを指定するステップ、
前記コンピュータ化画像認識データベースに格納するために、前記組み合わせ特徴セットを前記オブジェクトのＩＤと対応付けるステップ、
を有することを特徴とする方法。
前記第１画像特徴セットと前記第２画像特徴セットは、特徴検出アルゴリズムを用いて前記第１画像と前記第２画像からそれぞれ取得される
ことを特徴とする請求項１５記載の方法。
前記特徴検出アルゴリズムは、
スケール不変特徴変換（ＳＩＦＴ）、ＦａｓｔＲｅｔｉｎａＫｅｙｐｏｉｎｔ（ＦＲＥＡＫ）、ＨｉｓｔｏｇｒａｍｓｏｆＯｒｉｅｎｔｅｄＧｒａｄｉｅｎｔ（ＨＯＧ）、ＳｐｅｅｄｅｄＵｐＲｏｂｕｓｔＦｅａｔｕｒｅｓ（ＳＵＲＦ）、ＤＡＩＳＹ、ＢｉｎａｒｙＲｏｂｕｓｔＩｎｖａｒｉａｎｔＳｃａｌａｂｌｅＫｅｙｐｏｉｎｔｓ（ＢＲＩＳＫ）、ＦＡＳＴ、ＢｉｎａｒｙＲｏｂｕｓｔＩｎｄｅｐｅｎｄｅｎｔＥｌｅｍｅｎｔａｒｙＦｅａｔｕｒｅｓ（ＢＲＩＥＦ）、ＨａｒｒｉｓＣｏｒｎｅｒｓ、Ｅｄｇｅｓ、ＧｒａｄｉｅｎｔＬｏｃａｔｉｏｎａｎｄＯｒｉｅｎｔａｔｉｏｎＨｉｓｔｏｇｒａｍ（ＧＬＯＨ）、ＥｎｅｒｇｙｏｆｉｍａｇｅＧｒａｄｉｅｎｔ（ＥＯＧ）、ＴｒａｎｓｆｏｒｍＩｎｖａｒｉａｎｔＬｏｗ−ｒａｎｋＴｅｘｔｕｒｅｓ（ＴＩＬＴ）、
のうち少なくともいずれかを含む
ことを特徴とする請求項１５記載の方法。
前記特徴組み合わせデバイスは、前記１以上の生成コンピュータと前記１以上の導出コンピュータを備える
ことを特徴とする請求項１５記載の方法。
前記１以上の導出コンピュータ、前記１以上の生成コンピュータ、および前記特徴組み合わせデバイスは、単一のコンピュータとして構成されている
ことを特徴とする請求項１５記載の方法。
コンピュータ化オブジェクト認識システムにおいて用いるように構成されたコンピュータ化画像認識データベースに格納される画像特徴組み合わせを生成するシステムであって、
オブジェクトの第１画像から前記オブジェクトの合成画像を生成するように構成された１以上の生成コンピュータであって、前記合成画像は、前記オブジェクトの前記第１画像に対応する第１画像キャプチャ条件とは異なる第２画像キャプチャ条件の下で前記オブジェクトが有すると予測される外観を有する前記オブジェクトの画像に対応する、生成コンピュータ、
前記合成画像から特徴検出アルゴリズムを用いて第２画像特徴セットを導出するように構成された１以上の導出コンピュータ、
前記第１画像から導出した第１画像特徴セットを取得するように構成されるとともに、前記第１画像特徴セットと前記第２画像特徴セットを有する組み合わせ特徴セットを指定するように構成された、特徴組み合わせデバイス、
コンピュータによるオブジェクト認識検索において用いるように構成された電子データベースに格納するために、前記オブジェクトを識別するメタデータと前記組み合わせ特徴セットを対応付ける、コンピュータ化オブジェクト認識システム、
を備えることを特徴とするシステム。
前記特徴組み合わせデバイスは、前記１以上の生成コンピュータと前記１以上の導出コンピュータを備える
ことを特徴とする請求項２０記載のシステム。
前記１以上の導出コンピュータ、前記１以上の生成コンピュータ、および前記特徴組み合わせデバイスは、単一のコンピュータとして構成されている
ことを特徴とする請求項２０記載の方法。