JP2018124798A - 画像探索装置および画像探索プログラム - Google Patents

画像探索装置および画像探索プログラム Download PDF

Info

Publication number
JP2018124798A
JP2018124798A JP2017016428A JP2017016428A JP2018124798A JP 2018124798 A JP2018124798 A JP 2018124798A JP 2017016428 A JP2017016428 A JP 2017016428A JP 2017016428 A JP2017016428 A JP 2017016428A JP 2018124798 A JP2018124798 A JP 2018124798A
Authority
JP
Japan
Prior art keywords
image
product
feature point
dictionary
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017016428A
Other languages
English (en)
Inventor
山本 直史
Tadashi Yamamoto
直史 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba TEC Corp
Original Assignee
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba TEC Corp filed Critical Toshiba TEC Corp
Priority to JP2017016428A priority Critical patent/JP2018124798A/ja
Publication of JP2018124798A publication Critical patent/JP2018124798A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 類似する画像を探索する画像探索処理を高速かつ高精度にできる画像探索装置および画像探索プログラムを提供する。【解決手段】 実施形態によれば、画像探索装置は、画像取得部とプロセッサとを有する。画像取得部は、入力画像を取得する。プロセッサは、前記入力画像から抽出する特徴点と辞書が記憶する各物体の画像の特徴点とを対応づけた複数の特徴点対を抽出し、前記複数の特徴点対のスケール比と方向の差の分布に基づく尤度に応じて確率的に選定する特徴点対により変換行列の候補を計算し、計算した変換行列の候補から座標変換行列を決定し、前記座標変換行列による前記抽出した各特徴点対に対する座標変換の結果に基づいて入力画像と前記辞書が記憶する各物体の画像との類似度を計算し、最大の類似度となる物体の画像を特定する。【選択図】図2

Description

本発明の実施形態は、画像探索装置および画像探索プログラムに関する。
従来、入力画像と同じ画像(同一種の画像)をデータベースから検索する処理を用いた画像認識技術には、一般物体認識(カテゴリー認識)と特定物体認識とがある。カテゴリー認識は、主に動物や植物などのように個体ごとの画像パターンや形状のばらつきがある物体を認識対象とする画像認識技術である。特定物体認識は、個体差がほとんど無い物体を認識対象とする画像認識技術である。例えば、特定物体認識は、商品のパッケージの画像から品種を認識する技術として適用される。
特定物体認識は、認識対象となる全種類の物体の画像情報及び特徴情報を記憶した辞書を用意する。特定物体認識は、物体を撮影した画像と辞書に登録されている各物体の画像との類似度に基づいて最も類似する画像を検索し、撮影した物体の種類を特定する。特定物体認識では、類似度の計算として、画像における局所特徴点を比較する特徴点比較方式が用いられることがある。特徴点比較方式では、入力画像から抽出する特徴点と辞書に登録されている各画像の特徴点との対(候補対)を選出し、候補対の類似度を判定する。特徴点比較方式は、画像の一部である特徴点の情報を用いて画像の類似度を判定するため、パタンマッチングなどの画像全体を比較する方式に比べて計算量が小さい。
しかしながら、特徴点比較方式では、正しい特徴点の対を選定するため、特徴点の候補対を試行錯誤の繰り返しで選定する必要がある。例えば、特徴点比較方式としては、従来、以下のような2つ方式が考えられている。
第1の従来方式は、候補対の1番目と2番目の距離比を用いて特徴量の近い特徴点が候補対に入ることを除く方法がある。しかし、第1の従来方式では、対応する特徴点の少ない画像だと距離比の閾値が上がってしまい、誤候補対を除く効果がなくなるという問題点がある。
第2の従来方式は、候補となる特徴点対のオリエンテーションの差とスケール比との分布のピークにより特徴点対を選定し、入力画像と辞書画像との座標変換行列を推定する。しかし、第2の従来方式では、特徴点のオリエンテーションやスケールが位置座標と比べて精度が低く、座標変換行列の推定値に大きな誤差が生じるという問題がある。
また、商品認識装置は、多数(例えば数千〜数万)の商品画像との比較を短時間(例えば1秒程度)で行う必要があり、判定精度も高精度(例えば95%程度以上)が要求される。従って、商品認識装置などに用いる画像探索処理(画像認識処理)は、従来方式よりも高速化および高精度化が要求される。
特開2007−140613号公報 特開2011−8507号公報
上記した課題を解決するために、類似する画像を探索する画像探索処理を高速かつ高精度にできる画像探索装置および画像探索プログラムを提供する。
実施形態によれば、画像探索装置は、画像取得部とプロセッサとを有する。画像取得部は、入力画像を取得する。プロセッサは、前記入力画像から抽出する特徴点と辞書が記憶する各物体の画像の特徴点とを対応づけた複数の特徴点対を抽出し、前記複数の特徴点対のスケール比と方向の差の分布に基づく尤度に応じて確率的に選定する特徴点対により変換行列の候補を計算し、計算した変換行列の候補から座標変換行列を決定し、前記座標変換行列による前記抽出した各特徴点対に対する座標変換の結果に基づいて入力画像と前記辞書が記憶する各物体の画像との類似度を計算し、最大の類似度となる物体の画像を特定する。
図1は、実施形態に係る画像探索装置としての認識装置の構成例を示す外観図である。 図2は、実施形態に係る画像探索装置としての認識装置の制御系の構成例を示すブロック図である。 図3は、実施形態に係る画像探索装置としての認識装置における画像探索処理を含む商品認識処理の流れを説明するためのフローチャートである。 図4は、実施形態に係る画像探索装置としての認識装置における画像探索処理を含む商品認識処理の流れを説明するためのフローチャートである。 図5は、実施形態に係る画像探索装置としての認識装置における画像認識処理に用いられる辞書の構成例を示す図である。 図6は、実施形態に係る画像探索装置としての認識装置における画像認識処理で計算される対数スケール差の分布の例を示す図である。 図7は、実施形態に係る画像探索装置としての認識装置における画像認識装置で計算されるオリエンテーションの差の分布の例を示す図である。 図8は、実施形態に係る画像探索装置としての認識装置における座標変換行列の計算処理を説明するためのフローチャートである。
以下、図面を参照しながら実施形態について説明する。
まず、本実施形態に係る画像探索装置としての認識装置を含む商品認識システムの構成について説明する。
図1は、商品認識システム10の構成例を示す図である。
図1に示す構成例において、商品認識システム10は、商品台101、照明装置102、カメラ103、及び、認識装置105を有する。商品台101は、認識対象とする商品を配置する台である。例えば、商品台101は、認識対象とする商品を入れたカゴを置くようにしても良い。また、商品台101に置くカゴには、1または複数の商品が置かれるものとする。
照明装置102は、商品台101に向けて光を発光するものである。照明装置102は、商品台101に配置された商品に対して上方から光を照射する。カメラ103は、商品台101を撮影範囲に含む画像を撮影する。カメラ103は、商品台101に配置された商品を含む領域の画像を撮影する。カメラ103は、撮像した画像を画像信号に変換して認識装置105へ送信する。照明装置102及びカメラ103は、撮影装置104を構成する。
認識装置105は、類似する画像を探索する画像探索処理を含む商品認識処理(画像認識処理)を行う。認識装置105は、カメラ103が撮影した画像に基づく商品認識処理などの処理を実行する。認識装置105は、一般的なノイマン型の計算機などのコンピュータで実現できる。認識装置105は、例えば、認識結果として商品コードなどの商品を示す情報を出力する。また、認識装置105は、商品のデータを記憶するデータベースを参照して商品の価格などの情報を出力するようにしても良い。なお、以下の実施形態では、認識装置105を画像探索装置として説明するが、撮影装置104と認識装置105とを含む構成を画像探索装置としても良い。
次に、画像探索装置としての認識装置105の構成について説明する。
図2は、実施形態に係る認識装置105の構成例を示すブロック図である。
図2に示すように、認識装置105は、プロセッサ201、メモリ202、不揮発性メモリ203、画像処理アクセラレータ204、入出力インターフェース(I/F)205、コンソール206、及び、NIC207などがシステムバス208を介して接続される。
プロセッサ201は、例えば、CPUである。プロセッサ201は、プログラムを実行することにより各種の処理機能を実現する。メモリ202は、作業用のデータを記憶するメモリである。不揮発性メモリ203は、書換え可能な不揮発性の記憶装置で構成する。例えば、不揮発性メモリ203は、HDD、SSDなどで実現される。また、不揮発性メモリ203は、ROMなどを含んでも良い。不揮発性メモリ203は、プログラムおよびデータなどを記憶する。
プロセッサ201は、不揮発性メモリ203が記憶するプログラム(プログラムコード)を実行する。プロセッサ201は、不揮発性メモリ203が記憶するプログラムコードをメモリ202に展開し、メモリ202に展開したプログラムコードを実行する。本実施形態において、後述する処理を実行するためのプログラムは、不揮発性メモリ203が記憶し、プロセッサ201により実行されるものとする。
また、不揮発性メモリ203は、認識対象となる全種類の商品に関する登録情報(辞書情報)を格納する辞書(データベース)209を有する。各商品に関する登録情報は、後述の商品認識処理(画像探索処理)に用いる辞書としての画像(商品画像)及び特徴情報などである。辞書209の構成例については、後で詳述する。また、不揮発性メモリ203は、辞書209に格納したデータの管理情報も記憶する。また、不揮発性メモリ203は、カメラ103から入力した画像(入力画像)、および、商品認識処理の結果などの情報も記憶する。
画像処理アクセラレータ204は、特定の画像処理を高速に実行する処理部である。入出力インターフェース(I/F)205は、カメラ103および照明102を含む撮影装置104を接続するインターフェースである。入力I/F205は、カメラ103が撮影した画像としての入力画像を取得するインターフェース(画像取得部)である。また、プロセッサ201は、入出力I/F205を介してカメラ103及び照明102へ制御指示を供給する。コンソール206は、管理者などのオペレータが操作指示を入力するものである。NIC207は、外部装置と通信するためのインターフェースである。NIC207は、例えば、ネットワークインターフェースであり、外部ネットワークを介して外部装置と通信する。
次に、本実施形態に係る商品認識システム1による商品認識処理の流れについて概略的に説明する。
本商品認識システム1が認識対象とする商品は、商品台101上に配置される。本実施形態においては、複数の商品がある場合、商品台101上には複数の商品が互いに重ならないように配置されるものとする。撮影装置104は、照明装置102により商品台101上に光を照射し、カメラ103により商品台101上を撮影領域に含む画像を撮影する。カメラ103は、撮影した画像を認識装置105へ供給する。
認識装置105は、カメラ103が撮影した画像を入力画像として取得する。認識装置105は、入力画像において個々の商品ごとの領域を切出す。認識装置105は、商品ごとの領域に切り出した画像(入力商品画像)から特徴点の抽出と特徴量の計算とを行う。認識装置105は、入力商品画像から抽出した特徴点の情報と辞書209に登録されている各商品画像の特徴点の情報とを比較して特徴点の情報が類似する画像を探す。
すなわち、認識装置105は、画像探索処理として、入力商品画像に対して類似する特徴を有する画像の商品を辞書209から検索する。本実施形態に係る認識装置105は、類似する画像であるかを局所特徴量方式で判定するものとする。局所特徴量方式は、対応する特徴点数の量により判定する。認識装置105は、すべての対象となる商品の画像について予め計算した特徴点の情報を商品情報と合わせて1つのデータセットとして辞書209に記憶しておく。なお、辞書209は、商品認識処理において、認識装置105のプロセッサ201がアクセスできるものであれば良い。例えば、辞書209は、NIC207を介して通信可能な外部装置に設けても良い。
特徴点は、画像において局所的に一意に特定できる点である。特徴点は、画像のコーナー部分や画像濃度の2次微分関数の極点(極大又は極小点)などの局所領域内で一意に定められる点である。特徴点の情報は、その位置を表す座標(x、y)の他に、大きさを示すスケール、方向を表すオリエンテーションなどの情報を含む。また、特徴点の特徴量は、例えば、特徴点近傍の濃度パターンに応じて定義される。具体例としては、特徴点の特徴量は、特徴点の近傍の濃度パターンを数10〜数100の低次元の情報量に圧縮した値である。
本実施形態においては、これらの情報を合わせて特徴点の属性(属性情報)とよぶことにする。また、属性は、例えば、特徴点の位置座標および特徴点の向きを表わすオリエンテーションとサイズを表すスケールである。特徴点の情報として、スケールとオリエンテーションとを有することにより、回転相似変換した画像間でも同じ特徴量で表現できる。
なお、特徴点の抽出方法や特徴量の計算方法としては、SIFT、SURF,ORBなどの方式がある。
また、上述したような1つの特徴点の情報は、一般に数100byteで表現できる。画像探索(認識)処理には、通常、100〜1000程度の特徴点を用いる。従って、局所特徴量方式では、画像当たりの情報量が10〜100Kbyte程度である。局所特徴量方式は、テンプレートマッチングなどのように画像全体の情報を用いる方法に比べ、辞書のデータサイズ、及び、処理における計算量を小さくすることができる。また、回転相似変換によっても特徴点の特徴量が不変であるため、任意の角度、距離から撮影した画像からも検索が可能である。
認識処理時に商品を撮影した画像と辞書作成時に商品を撮影した画像とでは、商品の位置、向き、撮影距離などが異なる。このため、認識処理時の入力商品画像と辞書作成時の商品画像(辞書の商品画像)とは、同一商品であっても、画像の座標系が異なる。これらの座標系は、平行移動、回転、拡大縮小の合成された相似変換の関係となる。また、座標系の相違以外にも、照明環境、撮像系のレンズ収差特性、画像信号への重畳ノイズ等が相違する。従って、同じ商品でも入力商品画像と辞書の商品画像とでは、全く同じ特徴点が抽出されることはない。さらに、商品の異なる位置に類似の特徴量や属性をもつ特徴点が存在することもある。
本実施形態に係る認識装置105は、商品認識処理(画像探索処理)において、入力商品画像と辞書の商品画像との座標系の関係である相似変換行列の候補を求める。認識装置105は、候補から妥当性のある変換行列を求め、算出した変換行例による座標変換をかけた上で対応する特徴点の数を求める。認識装置105は、辞書の特徴点数に対して対応する特徴点数の割合を類似度とする。認識装置105は、類似度が最大でかつ所定の閾値以上となる辞書の商品を入力商品画像と一致する認識(検索)結果とする。
次に、認識装置105による商品認識処理(画像探索処理)について詳細に説明する。
図3及び図4は、商品認識処理(画像探索処理)の流れを説明するためのフローチャートである。
カメラ103は、認識対象とする商品が載置される商品台101を含む撮影範囲の画像を撮影する。認識装置105は、入出力I/F205によりカメラ103が撮影した画像(入力画像)を取得する(ACT11)。認識装置105のプロセッサ201は、入出力I/F205によりカメラ103から取得した画像を入力画像として不揮発性メモリ203に記憶する。ここで、入力画像は、モノクロ明度信号、すなわち画像の画素の明度を0から255までの値で明るい方が大きい値で表現した画像信号であるものとする。ただし、入力画像は、モノクロ明度信号に限らず、例えば、RGB等のカラー画像信号であっても良い。
入力画像を取得すると、認識装置105のプロセッサ201は、入力画像から個々の商品の領域を抽出する(ACT12)。プロセッサ201は、カメラ103から入力した画像において個々の商品の領域を切出し、個々の商品の画像(入力商品画像)を抽出する。本実施形態では、入力商品画像は、個々の商品の領域を囲む最小の矩形領域であるものとし、入力商品画像の領域は、矩形の4つの頂点の座標値で表現するものとする。ただし、入力商品画像の表現は、矩形の4つの頂点の座標値で表現するものに限定されない。例えば、入力商品画像の表現は、別に画像領域に対応する2次元の配列を用意し、その配列の値によって商品の種別を表すような表現でもよい。
入力画像から入力商品画像を抽出すると、プロセッサ201は、変数iを初期化(i=0)とする(ACT13)。変数iを初期化すると、プロセッサ201は、変数iをインクリメント(i=i+1)とする(ACT14)。変数iをインクリメントすると、プロセッサ201は、入力画像から抽出したi番目の入力商品画像を選択する。i番目の入力商品画像を選択すると、プロセッサ201は、i番目の入力商品画像から特徴点を求める(ACT15)。特徴点は、上述しように、画像情報から局所的に特定できる点であり、濃度の2次微分の極値点などを用いる。このような点は、入力商品画像上には多数存在しうる。このため、プロセッサ201は、特徴点の強度を定義し、強度の大きい順に所定の個数の特徴点を抽出する。例えば、本実施形態において、1つの入力商品画像から抽出する特徴点の数は500点とする。また、本実施形態においては、ORB方式で標準的に使われているFAST方式を用いるものとする。
入力商品画像から特徴点を抽出すると、プロセッサ201は、抽出した各特徴点について特徴量を計算する(ACT16)。特徴量は、上述したように、特徴点の近傍の領域の濃淡のパターンを固定長の符号又は数値で表現したものである。特徴量としては、一般にはいくつかの方式があるが、本実施形態ではORB特徴量を用いるものとする。ORB特徴量は、256次元の2値情報で表され、パターンの形状が近いほど2つの256次元の特徴量のハミング距離が小さくなる。まったく同じパターンの場合、ハミング距離は、最小値の0となる。ハミング距離は、各bitの排他的論理和の256次元での総和となる。このため、ハミング距離は、ユークリッド距離(L2ノルム)やマンハッタン距離(L1ノルム)に比べて、高速に計算できる。
各特徴点の特徴量を算出すると、プロセッサ201は、変数kを初期化(k=0)する(ACT17)。変数kを初期化した後、プロセッサ201は、変数kをインクリメント(k=k+1)とする(ACT18)。変数kをインクリメントすると、プロセッサ201は、k番目の特徴点について、X座標、Y座標、スケール、オリエンテーション、及び特徴量を含む属性情報を特定する。これらの情報を特定すると、プロセッサ201は、k番目の特徴点に対する属性情報としてメモリ202に保持する。さらに、プロセッサ201は、スケールの対数を整数化した対数スケールも算出し、メモリ202に保持しておく。ここで、スケールと対数スケールとは、1対1に対応しており、冗長な情報である。
なお、上述した特徴点の属性情報は、後述する処理によって特徴点の数分だけ計算される。この結果として、メモリ202には、各特徴点の属性情報が配列として記憶される。また、入力商品画像から抽出する特徴点の総数をNkpとすると、本実施形態では、抽出する特徴点の数を500とするため、Nkp=500となる。
特徴点の情報(属性情報)をメモリ202に記憶すると、プロセッサ201は、辞書209に記憶されているk番目の商品の登録情報を読み出す(ACT19)。プロセッサ201は、辞書209が記憶する各商品の登録情報を順に読み出す。例えば、辞書209は、登録される各商品(認識対象となる各種の商品)に関する登録情報を配列テーブルの形で記憶するものとする。
図5は、辞書209の構成例を示す図である。
図5に示す例において、辞書209は、登録される商品の数(品種の数)のブロックにより構成される。図5に示す辞書209においては、各ブロックが、個々の商品に対する登録情報(辞書情報)である。図5に示す例では、登録商品の数をNiとし、Ni個のブロックを有する。図5に示す各ブロックは、商品の名称、商品コード(商品に一意に対応する識別情報)、商品画像における特徴点数、各特徴点の属性情報(特徴点のX及びY座標、スケール、オリエンテーション、特徴量)を記憶する。例えば、特徴量は、上述したように、32桁の16進数で表される256次元の2値情報である。
辞書のk番目の商品の情報を読出すと、プロセッサ201は、入力商品画像から算出した特徴点の情報とk番目の商品の特徴点の情報とを比較して類似の特徴点対群を選出する(ACT20)。類似の特徴点対としては、特徴量の近い特徴点の対が選出される。例えば、プロセッサ201は、入力商品画像の全特徴点と辞書のk番目の商品(ブロック)の全特徴点との総当たりでハミング距離Hdを計算する。プロセッサ201は、算出したハミング距離Hdが所定の閾値Thd(例えば、64程度)より小さい場合に、類似する特徴点とみなす。プロセッサ201は、ハミング距離Hdが所定閾値Thdよりも小さくなる特徴点の対をすべて求める。
類似の特徴点対群を選出すると、プロセッサ201は、選出した特徴点対のセットについて特徴点対のスケールの比とオリエンテーションの差の分布を計算する(ACT21、ACT22)。上述したように、各特徴点は、属性としてスケールとオリエンテーションとを有する。
プロセッサ201は、入力商品画像の特徴点のスケールをその対となる辞書の特徴点のスケールで除した値をスケール比として算出する。また、除算は、計算量が大きいので、スケールsclの代わりに対数スケールlsclを用いると計算量を減らすことができる。本実施形態において、スケールは、初期値scl0から1.2倍きざみでとっているのものとする。この場合、対数スケールを以下の式1で定義することにより、対数スケールは、整数で表すことができ、対数スケールの差も整数で表せる。また、対数をとることにより、スケールの比は、対数スケールの差で表すことができる。
lscl=(log(scl)−log(scl0))/log(1.2)…(式1)
図6は、対数スケール差のヒストグラムの例を示す図である。
また、プロセッサ201は、入力商品画像の特徴点のオリエンテーションからその対となる辞書の特徴点のオリエンテーションを減じた値をオリエンテーション差として算出する。ここで、オリエンテーションは角度であるので、2πを法とする剰余類で表す。すなわち、算出した差が0以下の場合は2πを加算して、0〜2πの間の範囲の数値で表す。
図7は、オリエンテーション差のヒストグラムの例である。ここで、オリエンテーションは角度なので図7の横軸は左端と右端がつながった構造となっている。
選出した特徴点対の対数スケール差及びオリエンテーション差の分布を算出すると、プロセッサ201は、各分布から特徴点対の尤度を求める(ACT23)。
仮に入力商品画像の商品と辞書のk番目の商品とが同一の商品であれば、対応する特徴点のスケール比とオリエンテーション差は、画像全体の倍率比と向きの差に近くなる。従って、これらの特徴点対の対数スケール差とオリエンテーション差とにピークが生じる。ただし、特徴点のスケールとオリエンテーションは精度が低いため、ばらつきが生じやすい。このため、ピークの中心から離れていても対応する特徴点の可能性があるが、ピークの中心から離れるほど対応する特徴点である確率が低くなる。
尤度は、対応する特徴点である確率に相当する値であり、ピークで1をとり、ピークから離れるほど低い値をとる。具体的には、ピークからr離れた場合の尤度Lは、以下の(式2)で計算される。
L=exp(−r2/σ)…(式2)
ここで、σは減衰係数であり、スケールやオリエンテーションのばらつきから適正な値が設定される。
また、尤度は、対数スケール差とオリエンテーション差との両方で定義される。本実施形態において、プロセッサ201は、対数スケール差の尤度とオリエンテーション差の尤度とを乗算した値を尤度とする。
特徴点対の尤度を算出すると、プロセッサ201は、尤度に応じて辞書の座標系と入力商品画像とを座標変換するための座標変換行列Aを計算する行列計算処理を実行する(ACT24)。すなわち、プロセッサ201は、特徴点対のセットとその尤度から入力商品画像と辞書のk番目の商品の画像との座標変換行列Aを計算する。特徴点の対応のように外れ値が正規分布に従わない場合のロバストな変換行列推定方法としては、RANSAC法を用いることができる。ここでは、特徴点対の尤度を利用したRANSACの変形方式を用いて、座標変換行列Aを求めるものとする。なお、座標変換行列の計算処理(行列計算処理)の例については、後で詳細に説明する。
座標変換行列Aを算出すると、プロセッサ201は、座標変換行列Aを用いて選出した全ての特徴点対を座標変換する。プロセッサ201は、座標変換した結果について変換誤差を算出する。プロセッサ201は、変換誤差が所定値以下となる特徴点対の数を計数する(ACT25)。
プロセッサ201は、計数した変換誤差が所定値以下となる特徴点対の数に基づいて入力商品画像と辞書のk番目の商品との類似度を算出する(ACT26)。例えば、プロセッサ201は、計数した特徴点対の数を辞書の特徴点の数で割算した値を辞書のk番目の商品に対する類似度として算出する。なお、プロセッサ201は、座標変換行列Aとオリエンテーション差や対数スケール差のピークと比較し、これらの関係がかけ離れているかを類似度として計算しても良い。
k番目の商品に対する類似度を算出すると、プロセッサ201は、変数kが辞書209に登録されている商品の総数(辞書の商品数)に達したかを判断する(ACT27)。変数kが辞書209の商品数に達していない場合、つまり、類似度を算出していない商品がある場合(ACT27、NO)、プロセッサ201は、ACT18へ戻り、辞書209にある次の商品(k=k+1番目の商品)に対する類似度を算出する。
変数kが辞書209に登録されている商品数に達した場合、つまり、全商品に対する類似度を算出したと判断した場合(ACT27、YES)、プロセッサ201は、各商品に対する類似度により商品の認識結果(画像探索結果)を判定する(ACT28)。例えば、プロセッサ201は、類似度が最大となった商品を特定する。プロセッサ201は、最大の類似度が所定値(同定用の閾値)以上であれば、当該商品を入力商品画像に対する商品の認識結果(画像の探索結果)とする。また、最大の類似度が所定値(同定用の閾値)よりも小さければ、入力商品画像に対して該当する商品(画像)無しとの結果とする。
また、プロセッサ201は、上記ACT14−28の処理を入力画像から抽出した全ての入力商品画像に対して実施する。この判断のため、プロセッサ201は、変数iが入力画像から抽出した入力商品画像の総数(商品領域数)に達したかを判断する(ACT29)。変数iが商品領域数に達していない場合、つまり、商品認識処理(画像探索処理)を実施していない入力商品画像がある場合(ACT29、NO)、プロセッサ201は、ACT14へ戻り、次の入力商品画像(i=i+1番目の入力商品画像)に対する商品認識処理を実行する。また、変数iが商品領域数に達した場合、つまり、全ての入力商品画像に対する商品認識処理(画像探索処理)が終了した場合(ACT29、YES)、プロセッサ201は、カメラ103から入力した入力画像に対する商品認識処理(画像探索処理)を終了する。
次に、上述した座標変換行列Aの計算処理(行列計算処理)について詳細に説明する。
図8は、本実施形態に係る認識装置105による行列計算処理の流れを説明するためのフローチャートである。
上述したように、プロセッサ201は、特徴点対の尤度を算出した後、座標変換行列Aを計算する処理(行列計算処理)を実行する。行列計算処理において、プロセッサ201は、まず、変数jを初期化(j=0)する。変数jを初期化した後、プロセッサ201は、変数jをインクリメント(j=j+1)する(ACT42)。変数jをインクリメントすると、プロセッサ201は、選出した特徴点対から尤度に応じて確率的にM個の特徴点対を選出する(ACT43)。ここで、プロセッサ201は、選出される確率が尤度Lに比例し、かつ、ランダムにM個の特徴点対を選出する。M個は、入力商品画像から抽出する特徴点の数Nkpに対して1/5〜1/10程度となるような個数とする。
M個の特徴点対を選出すると、プロセッサ201は、選定したM個の特徴点対の座標値を用いて辞書の座標系から入力商品画像の座標系への変換行列Ajを計算する(ACT44)。変換行列Ajは、確率的に選出したM個の特徴点対から得られる行列である。例えば、プロセッサ201は、最小2乗法を用いて変換行例Ajを計算する。変換行列Ajは、座標変換行列Aの候補となる行列である。
変換行列Ajを算出すると、プロセッサ201は、選出したM個以外の各特徴点対について、辞書209の特徴点の座標を変換行列Ajによって変換する(ACT45)。プロセッサ201は、変換行列Ajによって変換した辞書の座標と入力商品画像における対応する特徴点の座標との誤差(変換誤差)Eを計算する(ACT46)。各特徴点対に対して変換誤差Eを算出すると、プロセッサ201は、各変換誤差Eを所定の第1の閾値Eth1と比較する。プロセッサ201は、変換誤差Eが第1の閾値Eth1より小さくなる特徴点対の個数Bjをカウントする(ACT47)。
個数Bjを計数すると、プロセッサ201は、変数jが所定回数(jMax)であるかを判定する(ACT48)。変数jがjMaxでなければ(ACT48、NO)、プロセッサ201は、ACT42へ戻り、ACT42−47の処理を再度実行する。これにより、プロセッサ201は、ACT42−47の処理を所定回数(jMax回)実行する。上述したように、ACT43の処理では尤度に応じて確率的にM個の特徴点対が選出される。このため、プロセッサ201は、繰り返し実行するごとに異なるM個の特徴点類を選出する。
変数jがjMaxであれば(ACT48、YES)、プロセッサ201は、カウントした個数Bjが最も大きかった場合の変換行列Ajを暫定変換行列Atとする(ACT49)。暫定変換行列Atを決定すると、プロセッサ201は、全ての各特徴点対について辞書の特徴点の座標を暫定変換行列Atで変換する。プロセッサ201は、暫定変換行列Atで変換した座標と対応する入力商品画像の特徴点との変換誤差Eを計算する。暫定変換行列Atを用いて全特徴点対に対する変換誤差を算出すると、プロセッサ201は、算出した変換誤差EがE<Eth2となる特徴点対を抽出する(ACT50)。ここで、第2の閾値Eth2は、ACT47で用いた第1の閾値Eth1と同じでも良いし、第1の閾値Eth1よりも小さい値であっても良い。
変換誤差Eが第2の閾値Eth1未満となる特徴点対を抽出すると、プロセッサ201は、抽出した特徴点対に対して最小2乗法を用いて座標変換行列Aを計算する(ACT51)。これにより、プロセッサ201は、計算した座標変換行列Aを行列変換処理の結果とする。
上記のような行列計算処理では、ACT42−47の処理を繰り返し実行することにより、対応しない特徴点対の数が多くてもロバストに適正な座標変換行列を計算できる。また、対数スケール差やオリエンテーション差のピーク値を直接用いてないため、これらの値の若干の誤差に対してもロバストな結果が得られる。
以上のように、本実施形態に係る認識装置は、辞書の特徴量と入力画像の特徴量とを比較する場合、オリエンテーション差と対数スケール差の分布に応じて特徴点対の尤度を決める。認識装置は、尤度に応じて確率的に選定する特徴点対により複数の変換行列の候補を算出し、算出した候補から最適な座標変換行列を決定する。
これにより、実施形態によれば、明らかに対応しない特徴点対を除いて処理を高速化でき、計算誤差によって対応する特徴点対が除かれることを軽減して高精度化を図れる。この結果として、本実施形態に係る認識装置は、高速でかつ高精度な検索結果を得ることができる。例えば、本実施形態を適用した商品認識装置は、多種類の商品が辞書に登録されている場合でも、商品の種類を短時間でかつ高精度で判別することができる。
また、上記した実施形態によれば、オリエンテーションやスケール比が明らかに異なる特徴点対を除くことができ、高速かつ高精度に画像探索を行うことができる。
また、実施形態によれば、オリエンテーションやスケール比の誤差による変換行列の誤差も防ぐことができる。変換行列に誤差が生じると、例えば、画像周辺部の変換座標の計算誤差が大きくなる。本実施形態によれば、画像周辺部の特徴点対を考慮でき、類似度の精度ひいては検索精度を高くできる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
10…商品認識システム、103…カメラ、105…認識装置(画像探索装置)、201…プロセッサ、202…メモリ、203…不揮発性メモリ、205…入出力インターフェース(画像取得部)、209…辞書(データベース)。

Claims (5)

  1. 入力画像を取得する画像取得部と、
    前記入力画像から抽出する特徴点と辞書が記憶する各物体の画像の特徴点とを対応づけた複数の特徴点対を抽出し、
    前記複数の特徴点対のスケール比と方向の差の分布に基づく尤度に応じて確率的に選定する特徴点対により変換行列の候補を計算し、計算した変換行列の候補から座標変換行列を決定し、
    前記座標変換行列による前記抽出した各特徴点対に対する座標変換の結果に基づいて入力画像と前記辞書が記憶する各物体の画像との類似度を計算し、最大の類似度となる物体の画像を特定する、プロセッサと、
    を有する画像探索装置。
  2. 前記プロセッサは、前記候補として計算した各変換行列を用いて座標変換を実行し、変換誤差が所定値未満の個数が多い候補を座標変換行列として決定する、
    請求項1に記載の画像探索装置。
  3. 前記プロセッサは、選ばれる確率が前記尤度に比例し、かつ、ランダムによるように選出した特徴点対により変換行列の候補を計算する、
    請求項1又は2の何れか1項に記載の画像探索装置。
  4. 前記入力画像は商品を含む領域を撮影した画像から切出した入力商品画像であり、前記辞書は認識対象となる全種類の商品の画像に対する特徴点の情報を記憶し、
    前記プロセッサは、前記入力商品画像と前記辞書が記憶する商品の画像との類似度が最大となる商品を特定する、
    請求項1乃至3の何れか1項に記載の画像探索装置。
  5. コンピュータに、
    入力画像を取得する処理と、
    前記入力画像から抽出する特徴点と辞書が記憶する各物体の画像の特徴点とを対応づけた複数の特徴点対を抽出する処理と、
    前記複数の特徴点対のスケール比と方向の差の分布に基づく尤度に応じて確率的に選定する特徴点対により変換行列の候補を計算し、計算した変換行列の候補から座標変換行列を決定する処理と、
    前記座標変換行列による前記抽出した各特徴点対に対する座標変換の結果に基づいて入力画像と前記辞書が記憶する各物体の画像との類似度を計算し、最大の類似度となる物体の画像を特定する処理と、
    を実行させるための画像探索プログラム。
JP2017016428A 2017-02-01 2017-02-01 画像探索装置および画像探索プログラム Pending JP2018124798A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017016428A JP2018124798A (ja) 2017-02-01 2017-02-01 画像探索装置および画像探索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017016428A JP2018124798A (ja) 2017-02-01 2017-02-01 画像探索装置および画像探索プログラム

Publications (1)

Publication Number Publication Date
JP2018124798A true JP2018124798A (ja) 2018-08-09

Family

ID=63110365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017016428A Pending JP2018124798A (ja) 2017-02-01 2017-02-01 画像探索装置および画像探索プログラム

Country Status (1)

Country Link
JP (1) JP2018124798A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909193A (zh) * 2019-11-22 2020-03-24 携程计算机技术(上海)有限公司 图像排序展示方法、系统、设备和存储介质
JP2020106966A (ja) * 2018-12-26 2020-07-09 株式会社日立製作所 物体認識装置および物体認識方法
WO2021240795A1 (ja) * 2020-05-29 2021-12-02 日本電気株式会社 処理装置、前処理装置、処理方法及びプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008507A (ja) * 2009-06-25 2011-01-13 Kddi Corp 画像検索方法およびシステム
JP2011165007A (ja) * 2010-02-10 2011-08-25 Seiko Epson Corp 検査システム、その方法及びプログラム
WO2012032747A1 (ja) * 2010-09-06 2012-03-15 日本電気株式会社 特徴点選択システム、特徴点選択方法および特徴点選択プログラム
JP2015138413A (ja) * 2014-01-22 2015-07-30 富士通株式会社 画像照合方法、画像処理システム、及びプログラム
JP2016014914A (ja) * 2014-06-30 2016-01-28 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011008507A (ja) * 2009-06-25 2011-01-13 Kddi Corp 画像検索方法およびシステム
JP2011165007A (ja) * 2010-02-10 2011-08-25 Seiko Epson Corp 検査システム、その方法及びプログラム
WO2012032747A1 (ja) * 2010-09-06 2012-03-15 日本電気株式会社 特徴点選択システム、特徴点選択方法および特徴点選択プログラム
JP2015138413A (ja) * 2014-01-22 2015-07-30 富士通株式会社 画像照合方法、画像処理システム、及びプログラム
JP2016014914A (ja) * 2014-06-30 2016-01-28 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WANG WEI ET AL.: ""Image Matching for Geomorphic Measurement Based on SIFT and RANSAC Methods"", 2008 INTERNATIONAL CONFERENCE ON COMPUTER SCIENCE AND SOFTWARE ENGINEERING, JPN6021005808, 12 December 2008 (2008-12-12), US, pages 317 - 320, XP031377185, ISSN: 0004450567 *
石山 塁: ""塗装表面の物体指紋を用いた工業製品や産業機械の個品認証"", 映像情報インダストリアル, vol. 47, no. 3, JPN6021005807, 1 March 2015 (2015-03-01), JP, pages 74 - 77, ISSN: 0004450566 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020106966A (ja) * 2018-12-26 2020-07-09 株式会社日立製作所 物体認識装置および物体認識方法
JP7049983B2 (ja) 2018-12-26 2022-04-07 株式会社日立製作所 物体認識装置および物体認識方法
CN110909193A (zh) * 2019-11-22 2020-03-24 携程计算机技术(上海)有限公司 图像排序展示方法、系统、设备和存储介质
CN110909193B (zh) * 2019-11-22 2024-01-05 携程计算机技术(上海)有限公司 图像排序展示方法、系统、设备和存储介质
WO2021240795A1 (ja) * 2020-05-29 2021-12-02 日本電気株式会社 処理装置、前処理装置、処理方法及びプログラム
JP7380869B2 (ja) 2020-05-29 2023-11-15 日本電気株式会社 処理装置、前処理装置、処理方法、及び前処理方法

Similar Documents

Publication Publication Date Title
JP5916886B2 (ja) 画像特徴の類似性に基づく画像索引作成
CN107209853B (zh) 定位和地图构建方法
KR20140102038A (ko) 영상 정합 장치 및 영상 정합 방법
CN104615676B (zh) 一种基于最大相似度匹配的图片检索方法
JP6211407B2 (ja) 画像検索システム、画像検索装置、検索サーバ装置、画像検索方法、及び画像検索プログラム
US10713530B2 (en) Image processing apparatus, image processing method, and image processing program
CN113420640B (zh) 红树林高光谱图像分类方法、装置、电子设备及存储介质
JP6071002B2 (ja) 信頼度取得装置、信頼度取得方法および信頼度取得プログラム
EP1966760A2 (en) Automatic 3-d object detection
JP2018124798A (ja) 画像探索装置および画像探索プログラム
JPWO2014112346A1 (ja) 特徴点位置検出装置、特徴点位置検出方法および特徴点位置検出プログラム
WO2014024854A1 (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP5704909B2 (ja) 注目領域検出方法、注目領域検出装置、及びプログラム
JP4721829B2 (ja) 画像検索方法及び装置
WO2022001739A1 (zh) 标记点识别方法、装置、设备和存储介质
JP6403201B2 (ja) 画像特徴量登録装置、方法及びプログラム
CN116664585B (zh) 基于深度学习的头皮健康状况检测方法及相关装置
JP2019021100A (ja) 画像探索装置、商品認識装置および画像探索プログラム
JPWO2015068417A1 (ja) 画像照合システム、画像照合方法およびプログラム
Arjun et al. An efficient image retrieval system based on multi-scale shape features
US9189693B2 (en) Information processing apparatus and information processing method
WO2021197298A1 (en) Method for action recognition in video and electronic device
JP2014225168A (ja) 特徴点集合で表される画像間の類似度を算出するプログラム、装置及び方法
CN110287943B (zh) 图像的对象识别方法、装置、电子设备及存储介质
CN107341799B (zh) 诊断数据获取方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210415

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210511