JP2017215768A - パターン識別装置、方法、及びプログラム - Google Patents

パターン識別装置、方法、及びプログラム Download PDF

Info

Publication number
JP2017215768A
JP2017215768A JP2016109063A JP2016109063A JP2017215768A JP 2017215768 A JP2017215768 A JP 2017215768A JP 2016109063 A JP2016109063 A JP 2016109063A JP 2016109063 A JP2016109063 A JP 2016109063A JP 2017215768 A JP2017215768 A JP 2017215768A
Authority
JP
Japan
Prior art keywords
image
color
unit
input
color vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016109063A
Other languages
English (en)
Other versions
JP6427534B2 (ja
Inventor
慎吾 安藤
Shingo Ando
慎吾 安藤
杵渕 哲也
Tetsuya Kinebuchi
哲也 杵渕
勇 五十嵐
Isamu Igarashi
勇 五十嵐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016109063A priority Critical patent/JP6427534B2/ja
Publication of JP2017215768A publication Critical patent/JP2017215768A/ja
Application granted granted Critical
Publication of JP6427534B2 publication Critical patent/JP6427534B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

【課題】入力画像に背景が写りこんでしまう場合であっても、入力画像に含まれる特定の2次元パターン精度良く識別することができる。
【解決手段】画像入力部12が、入力画像を受け付ける。色類似度算出部30が、色ベクトル登録辞書を用いて、色ベクトル毎に、入力画像の画素の各々に対し、色ベクトル登録辞書に登録された色ベクトルとの類似度を算出し、色ベクトル毎に、類似度の各々を各画素とする色類似度画像を生成する。正規化マスク作成部32が、生成された色ベクトル毎の色類似度画像から正規化マスク画像を生成する。画像マスキング部34が、正規化マスク画像を用いて、入力画像をマスキングし、マスキングにより得られた画像をクエリ画像として生成する。識別部36が、クエリ画像の特徴量と、複数の参照画像の各々についての特徴量が予め登録されたインデクス登録辞書とを用いて、入力画像に含まれる特定の2次元パターンを識別する。
【選択図】図1

Description

本発明は、パターン識別装置、方法、及びプログラムに関する。
近年、スマートフォン等の携帯端末に内蔵されたカメラを用いて、撮影された物体が何であるかを自動的に識別し、その識別結果を基に該当物体に関連するさまざまなデータを提供するサービスが提案されている。
また、物体の識別だけでなく、その物体の位置・姿勢を推定して、端末ディスプレイにプレビュー表示された該当物体に付加情報を適切に重畳表示(一般にAugmented Realityと呼ばれる)することで、物体の局所位置に関連付けられた情報を人間に分かり易く提示できる技術も提案されている。
そこで利用されているのは、カメラにより入力された画像データに含まれる物体と、あらかじめ登録された複数画像データとの自動照合を行う手法と、それに付随して、両方の画像データから抽出された特徴点同士の対応付けを実現する手法である。具体的には例えば以下の特許文献1のような手法が提案されている。この手法により得られた識別情報と特徴点同士の対応付け結果から、入力画像上での物体の位置姿勢を高精度に推定することが可能となる。
特開2015−201123号公報
しかしながら、識別対象として商品パッケージなどに適用した場合、透過性の高いフィルム等に印刷されたパッケージのパターンはその内側の商品等のテクスチャと重畳され混合されてしまうため、あらかじめ登録した画像パターンとの差異を生じてしまい、結果として識別と特徴点の対応付けを誤りやすいという課題があった。
本発明は、上記問題点を解決するために成されたものであり、入力画像に背景が写りこんでしまう場合であっても、入力画像に含まれる特定の2次元パターンを精度良く識別することができるパターン識別装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明に係るパターン識別装置は、特定の2次元パターンを含む入力画像を受け付ける画像入力部と、登録用の2次元パターンを表す複数の参照画像について、前記参照画像に現れる色を表す色ベクトルが予め登録された色ベクトル登録辞書を用いて、前記色ベクトル毎に、前記入力画像の画素の各々に対し、前記色ベクトルとの類似度を算出し、前記色ベクトル毎に、前記類似度の各々を各画素とする色類似度画像を生成する色類似度算出部と、前記複数の参照画像の各々について、前記色類似度算出部によって生成された前記色ベクトル毎の前記色類似度画像から、各画素における、前記類似度の最大値を表すマスク画像を生成し、前記マスク画像に含まれる画素のうち最大の画素値と最小の画素値とに応じて、前記マスク画像を正規化した正規化マスク画像を生成する正規化マスク作成部と、前記複数の参照画像の各々について、前記正規化マスク作成部によって生成された前記正規化マスク画像を用いて、前記入力画像をマスキングし、マスキングにより得られた画像をクエリ画像として生成する画像マスキング部と、前記画像マスキング部によって前記複数の参照画像の各々について生成された前記クエリ画像の特徴量と、複数の前記参照画像の各々についての特徴量が予め登録されたインデクス登録辞書とを用いて、前記入力画像に含まれる前記特定の2次元パターンを識別する識別部と、を含んで構成されている。
第2の発明に係るパターン識別方法は、画像入力部が、特定の2次元パターンを含む入力画像を受け付け、色類似度算出部が、登録用の2次元パターンを表す複数の参照画像について、前記参照画像に現れる色を表す色ベクトルが予め登録された色ベクトル登録辞書を用いて、前記色ベクトル毎に、前記入力画像の画素の各々に対し、前記色ベクトルとの類似度を算出し、前記色ベクトル毎に、前記類似度の各々を各画素とする色類似度画像を生成し、正規化マスク作成部が、前記複数の参照画像の各々について、前記色類似度算出部によって生成された前記色ベクトル毎の前記色類似度画像から、各画素における、前記類似度の最大値を表すマスク画像を生成し、前記マスク画像に含まれる画素のうち最大の画素値と最小の画素値とに応じて、前記マスク画像を正規化した正規化マスク画像を生成し、画像マスキング部が、前記複数の参照画像の各々について、前記正規化マスク作成部によって生成された前記正規化マスク画像を用いて、前記入力画像をマスキングし、マスキングにより得られた画像をクエリ画像として生成し、識別部が、前記画像マスキング部によって前記複数の参照画像の各々について生成された前記クエリ画像の特徴量と、複数の前記参照画像の各々についての特徴量が予め登録されたインデクス登録辞書とを用いて、前記入力画像に含まれる前記特定の2次元パターンを識別する。
本発明に係るパターン識別装置は、複数の参照画像を受け付ける参照画像入力部と、前記参照画像入力部によって受け付けた複数の参照画像の各々について、前記参照画像に現れる色を表す色ベクトルを抽出し、抽出された前記色ベクトルを前記参照画像毎に色ベクトル登録辞書へ登録する色ベクトル抽出部と、前記参照画像入力部によって受け付けた複数の参照画像の各々について、前記参照画像から抽出される特徴量を、前記参照画像毎にインデクス登録辞書へ登録するインデクス登録部とを更に含むようにしてもよい、
前記色ベクトル抽出部は、前記参照画像入力部によって受け付けた複数の参照画像の各々について、前記色ベクトルを抽出し、前記複数の参照画像の各々について抽出された前記色ベクトルをクラスタリング又は量子化し、前記クラスタリング又は前記量子化の結果得られる前記色ベクトルを前記参照画像毎に色ベクトル登録辞書へ登録するようにしてもよい。
前記識別部は、前記画像マスキング部によって前記複数の参照画像の各々について生成された前記クエリ画像の特徴量と、前記インデクス登録辞書とを用いて、前記入力画像に含まれる特定の2次元パターンに対応する前記参照画像を識別すると共に、前記入力画像に含まれる特定の2次元パターンの特徴点と前記参照画像の特徴点との対応付けを行うようにしてもよい。
本発明に係るプログラムは、コンピュータを、上記のパターン識別装置の各部として機能させるためのプログラムである。
本発明のパターン装置、方法、及びプログラムによれば、複数の参照画像について参照画像に現れる色を表す色ベクトルが予め登録された色ベクトル登録辞書を用いて、色ベクトル毎に、入力画像の画素の各々に対し、色ベクトルとの類似度を算出し、類似度の各々を各画素とする色類似度画像を生成し、色ベクトル毎の色類似度画像から正規化マスク画像を生成し、正規化マスク画像を用いて入力画像をマスキングし、マスキングにより得られた画像をクエリ画像として生成し、クエリ画像の特徴量と複数の参照画像の各々についての特徴量が予め登録されたインデクス登録辞書とを用いて、入力画像に含まれる特定の2次元パターンを識別することより、入力画像に背景が写りこんでしまう場合であっても、入力画像に含まれる特定の2次元パターンを精度良く識別することができる、という効果が得られる。
本実施の形態に係るパターン識別装置の構成を示すブロック図である。 本実施の形態に係るパターン識別装置における登録処理ルーチンを示すフローチャートである。 本実施の形態に係るパターン識別装置におけるパターン識別処理ルーチンを示すフローチャートである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本発明の実施の形態の概要>
本発明の実施の形態は、入力画像が予め登録された参照画像の何れに対応するかの識別及び入力画像と入力画像に対応する参照画像との特徴点同士の対応付けを高精度に行う技術に関連する。
本発明の実施の形態では、一例として商品パッケージのロゴ部分に着目し、そのロゴパターンを構成する色情報を用いて、入力画像からロゴパターンを選択的に抽出し、それにより得られる画像を使って、参照画像の何れに対応するかの識別及び特徴点の対応付けを行う。
ロゴパターンを構成する色の種類は一般に少数種であることがほとんどなため、登録ロゴパターンにおいて使われている色の情報を用いれば、ロゴパターン成分と他のノイズ成分を分離することが比較的容易といえる。
しかし、色情報はカメラのホワイトバランスや露出によって変化しやすいため、登録した画像と異なる場所や時間で撮影した画像の場合、予め登録したロゴパターンの色情報とうまくマッチしない可能性がある。そのような問題に対処するため、一つの色情報をRGBの3次元ベクトルで表現し、登録された色ベクトルと入力画像の各画素の色ベクトルとの正規化相関に基づき類似度を求める。そして、類似度に比例して重みづけされたマスク画像を作成する。マスク画像に対し、各画素の最大値、最小値がそれぞれ100%、0%となるように線形変換で正規化を行い、正規化後のマスク画像を使って画像のマスキングを行うことで、登録ロゴパターンに該当する領域を選択的にフィルタリングできる。
色ベクトルの正規化相関により主にカメラの露出の差異が吸収され、マスク画像の正規化により主にカメラのホワイトバランスの差異が吸収されると考えられる。したがって、カメラ撮影時の光源環境の違いに対してもロバストに識別・特徴点対応付けが可能となる。
本実施形態では、複数の参照画像の各画素から色ベクトルを抽出して辞書へ登録すると共に、複数の参照画像の各画素から特徴量を抽出して辞書へ登録し、得られた各辞書を用いて、入力画像に対応する参照画像を識別するパターン識別装置に、本発明を適用した場合を例に説明する。
以下、本発明の実施の形態について図を用いて詳細に説明する。
<本実施の形態のパターン識別装置の構成>
本実施の形態に係るパターン識別装置の構成について説明する。本実施の形態に係るパターン識別装置100は、CPUと、RAMと、後述する登録処理ルーチン及びパターン識別処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。このパターン識別装置100は、機能的には図1に示すように参照画像入力部10と、画像入力部12と、演算部20と、結果出力部40とを備えている。
演算部20は、色ベクトル抽出部22と、色ベクトル登録辞書24と、インデクス登録部26と、インデクス登録辞書28と、色類似度算出部30と、正規化マスク作成部32と、画像マスキング部34と、識別部36とを備えている。
本実施の形態に係るパターン識別装置の処理の全体は、大きく2つの過程(パターン登録過程とパターン識別過程)に分けられる。まずは、パターン登録過程に関係する各部を説明する。
参照画像入力部10は、登録用の2次元パターンを表す複数の参照画像の入力を受け付ける。参照画像は、識別対象として登録したい2次元パターンのディジタルデータである。そして、参照画像入力部10は、複数の参照画像を、後述する演算部20へ出力する。
色ベクトル抽出部22は、参照画像入力部10によって受け付けた複数の参照画像の各々について、参照画像をラスタスキャンし当該参照画像に現れる色を表す色ベクトルを抽出する。そして、色ベクトル抽出部22は、参照画像毎に、当該参照画像について抽出された色ベクトルをインデクスとし、色ベクトル登録辞書24へ登録する。色ベクトル登録辞書24には参照画像ID毎に色ベクトルが格納される。
色ベクトル抽出部22の処理により、参照画像に現れる色の種類がRGB等の3次元色ベクトルとして色ベクトル登録辞書24に保存される。色ベクトル抽出部22は、ラスタスキャンの際、一つの参照画像に対し、新規に現れた色の種類のみをインデクスとして色ベクトル登録辞書24に追加していく。従って、色ベクトル抽出部22は、ラスタスキャンの際に同じ色が現れた場合には、無視して次の画素をスキャンする。
ただし、参照画像の非可逆圧縮等により真の色から微妙な差異が生じたために、冗長な色ベクトルが保存されてしまう可能性もある。そのような問題に対処するために、色ベクトル抽出部22は、参照画像入力部10によって受け付けた複数の参照画像の各々について色ベクトルを抽出した後、複数の参照画像の各々について抽出された色ベクトルをクラスタリング又は量子化し、クラスタリング又は量子化の結果得られる色ベクトルを参照画像毎に色ベクトル登録辞書24へ登録してもよい。
量子化の手法の一例としては、色ベクトルを表現するm色空間の量子化を行うことができる。また、クラスタリングの手法の一例として、K−means法などに代表される一般的なクラスタリング手法で色ベクトルのクラスタ化を行っても良い。
色ベクトル登録辞書24には、色ベクトル抽出部22によって抽出された色ベクトルが、参照画像毎に格納される。
インデクス登録部26は、参照画像入力部10によって受け付けた複数の参照画像の各々について、当該参照画像から特徴量を抽出する。そして、インデクス登録部26は、参照画像毎に、当該参照画像について抽出された特徴量をインデクスとして、インデクス登録辞書28へ登録する。
ここで、特徴量の抽出にはいろいろな手法が提案されているが、例えば特許文献1に示された方法では、画像から特徴点となる位置を複数箇所抽出し、その位置を中心とした局所領域での2次元濃淡パターンを局所特徴量とする。この場合は、抽出された特徴点の位置座標と、それに対応する局所特徴量とのセットが複数箇所登録されることになる。
インデクス登録辞書28には、インデクス登録部26によって抽出された特徴量が、参照画像毎に登録される。
次に、パターン識別過程に関係する各部を説明する。
画像入力部12は、特定の2次元パターンを含む入力画像を受け付ける。入力画像は、識別及び特徴点同士の対応付けをしたい画像である。入力画像は、例えば携帯端末のカメラ撮影等によりディジタルデータとして入力され、色類似度算出部30へ出力される。以下、ここで入力された入力画像をF(i,j)として説明する。
色類似度算出部30は、参照画像の各々について、色ベクトル登録辞書24を用いて、当該参照画像の色ベクトル毎に、画像入力部12により受け付けた入力画像の画素の各々に対し、色ベクトル登録辞書24に登録された色ベクトルとの類似度を算出する。そして、色類似度算出部30は、参照画像の各々について、色ベクトル毎に、算出された類似度の各々を各画素とする色類似度画像を生成する。
具体的には、色類似度算出部30は、色ベクトル登録辞書24に格納された参照画像毎の各色ベクトルに基づいて、以下の式(1)及び(2)に従って、類似度Kcn(i,j)を算出する。
Figure 2017215768
ここで、Rcnは色ベクトル登録辞書24に登録された色ベクトルを表し、cは登録された参照画像のID、nは登録された参照画像の色ベクトルの通し番号を表す。また、σはあらかじめ定数値を設定するパラメータを表す。上記式(1)及び(2)により、予め登録された色ベクトルに類似した色成分の画素は1に近く出力され、逆に類似していない画素は0に近く出力される。
正規化マスク作成部32は、複数の参照画像の各々について、色類似度算出部30によって生成された色ベクトル毎の色類似度画像から、各画素における、類似度の最大値を表す、当該参照画像に対するマスク画像を生成する。そして、正規化マスク作成部32は、複数の参照画像の各々について、当該参照画像のマスク画像に含まれる画素のうち最大の画素値と最小の画素値とに応じて、マスク画像を正規化した正規化マスク画像を生成する。正規化マスク画像は、参照画像ごとに生成される。
具体的には、正規化マスク作成部32は、色類似度算出部30によって参照画像の色ベクトル毎に生成された色類似度画像に基づいて、以下の式(3)に従って、マスク画像M(i,j)を得る。
Figure 2017215768
次に、正規化マスク作成部32は、参照画像毎に、当該参照画像のマスク画像M(i,j)の画素値を、最小値=0、最大値=1とするように線形変換することによって、マスク画像M(i,j)を引き延ばして、正規化マスク画像とする。そして、正規化マスク作成部32は、参照画像毎に生成された正規化マスク画像を、後述する画像マスキング部34へ出力する。
具体的には、正規化マスク作成部32は、以下の式(4)にて正規化マスク画像M’(i,j)を得る。
Figure 2017215768
画像マスキング部34は、複数の参照画像の各々について、正規化マスク作成部32によって生成された正規化マスク画像M’(i,j)を用いて、入力画像F(i,j)をマスキングし、マスキングにより得られた画像を、当該参照画像のクエリ画像として生成する。
具体的には、画像マスキング部34は、以下の式(5)を用いてマスキングを行い、マスキングにより得られたクエリ画像F’(i,j)を得る。なお参照画像のチャネルが複数ある場合は、以下の式(5)をチャネル数分だけ求めることになる。例えば、チャネルがRGBである場合、各色に対してマスキング後の画像が得られ、各色のマスキング画像をマージして当該参照画像のクエリ画像F’(i,j)を得る。
Figure 2017215768
クエリ画像F’(i,j)は、色ベクトル登録辞書24に登録されている参照画像の数cだけ生成され、後述する識別部36へ出力される。なお、登録された画像の背景が白(RGB24bit信号で表すと、(255,255,255))の場合は、以下の式(6)を上記式(5)の代わりに用いる。
Figure 2017215768
上記式(6)を用いれば、マスキング処理により、対象となる2次元パターンの構成画素以外の画素を白に近い画素値に変換することが期待できる。
識別部36は、画像マスキング部34によって複数の参照画像の各々について生成されたクエリ画像から抽出される特徴量と、インデクス登録辞書28とを用いて、入力画像に含まれる特定の2次元パターンに対応する参照画像を識別すると共に、入力画像に含まれる特定の2次元パターンの特徴点と当該参照画像の特徴点との対応付けを行う。
本実施の形態では、識別部36は、画像マスキング部34によってクエリ画像F’(i,j)を用いて、クエリ画像F’(i,j)に、何れの参照画像の2次元パターンが含まれているか識別する処理と、その識別対象である参照画像との特徴点同士の対応付け処理とを行う。この処理は、例えば、上記特許文献1の手法を用いれば、識別処理と特徴点対応付け処理との両方を一度に行うことが可能である。
ただし、クエリ画像F’(i,j)は複数存在する場合があるため、一つの画像F'(i,j)に対し、参照画像のIDであるcに対応する識別結果を表すスコア(信頼度)を算出することとする。最終的な識別結果としては、最も大きなスコアに対応する参照画像のIDを出力する。したがって、識別部36の出力は、識別における最大スコアとその参照画像のID、及び当該参照画像との特徴点対応付けの結果となる。
結果出力部40は、識別部36によって得られた識別結果(識別における最大スコアと参照画像のID)および該当する参照画像との対応点探索結果を出力する。なお、結果出力部40は、結果を出力する際、参照画像に紐づけられたWebのURL情報を同時に出力しても良い。この場合は、参照画像のIDとURLとを変換するテーブルをストレージに保存し、その都度そのテーブルを参照することになる。
<本実施の形態に係るパターン識別装置の作用>
次に、本発明の実施の形態に係るパターン識別装置100の作用について説明する。参照画像がパターン識別装置100に入力されると、パターン識別装置100は、図2に示す登録処理ルーチンを実行する。
まず、ステップS100で、参照画像入力部10は、入力された複数の参照画像を受け付ける。
ステップS102で、色ベクトル抽出部22は、上記ステップS100で受け付けた複数の参照画像の各々について、参照画像をラスタスキャンし当該参照画像に現れる色を表す色ベクトルを抽出する。そして、色ベクトル抽出部22は、参照画像毎に、当該参照画像について抽出された色ベクトルをインデクスとし、色ベクトル登録辞書24へ登録する。
ステップS104で、インデクス登録部26は、上記ステップS100で受け付けた複数の参照画像の各々について、当該参照画像から特徴量を抽出する。そして、インデクス登録部26は、参照画像毎に、当該参照画像について抽出された特徴量をインデクスとして、インデクス登録辞書28へ登録し処理を終了する。
次に、入力画像がパターン識別装置100に入力されると、パターン識別装置100は、図3に示すパターン識別処理ルーチンを実行する。
ステップS200で、画像入力部12は、入力画像を受け付ける。
ステップS201で、色類似度算出部30は、色ベクトル登録辞書24に格納された参照画像のうち、1つの参照画像を設定する。
ステップS202で、色類似度算出部30は、色ベクトル登録辞書24を用いて、上記ステップS201で設定された参照画像の色ベクトル毎に、入力画像の画素の各々に対し、当該色ベクトルとの類似度を算出する。そして、色類似度算出部30は、上記ステップS201で設定された参照画像の色ベクトル毎に、算出された類似度の各々を各画素とする色類似度画像を生成する。
ステップS204で、正規化マスク作成部32は、上記ステップS201で設定された参照画像について、上記ステップS202で生成された色ベクトル毎の色類似度画像から、各画素における、類似度の最大値を表すマスク画像を生成する。そして、正規化マスク作成部32は、上記ステップS201で設定された参照画像について、マスク画像に含まれる画素のうち最大の画素値と最小の画素値とに応じて、マスク画像を正規化した正規化マスク画像を生成する。
ステップS206で、画像マスキング部34は、上記ステップS201で設定された参照画像について、上記ステップS204で生成された正規化マスク画像を用いて、入力画像をマスキングし、マスキングにより得られた画像を、上記ステップS201で設定された参照画像のクエリ画像として生成する。
ステップS208で、色ベクトル登録辞書24に格納された全ての参照画像について、上記ステップS202〜ステップS206の処理を実行したか否かを判定する。色ベクトル登録辞書24に格納された全ての参照画像について、上記ステップS202〜ステップS206の処理を実行した場合には、ステップS210へ進む。一方、上記ステップS202〜ステップS206の処理を実行していない参照画像が存在する場合には、ステップS201へ戻る。
ステップS210で、識別部36は、上記ステップS206で複数の参照画像の各々について生成されたクエリ画像から抽出される特徴量と、インデクス登録辞書28とを用いて、入力画像に含まれる特定の2次元パターンに対応する参照画像を識別すると共に、入力画像に含まれる特定の2次元パターンの特徴点と当該参照画像の特徴点との対応付けを行う。
ステップS212で、結果出力部40は、上記ステップS210で得られた結果を出力し処理を終了する。
以上説明したように、本実施の形態に係るパターン識別装置によれば、複数の参照画像について参照画像に現れる色を表す色ベクトルが予め登録された色ベクトル登録辞書を用いて、色ベクトル毎に、入力画像の画素の各々に対し、色ベクトル登録辞書に登録された色ベクトルとの類似度を算出し、類似度の各々を各画素とする色類似度画像を生成し、色ベクトル毎の色類似度画像から正規化マスク画像を生成し、正規化マスク画像を用いて入力画像をマスキングし、マスキングにより得られた画像をクエリ画像として生成し、クエリ画像の特徴量と複数の参照画像の各々についての特徴量が予め登録されたインデクス登録辞書とを用いて、入力画像に含まれる特定の2次元パターンを識別することより、入力画像に背景が写りこんでしまう場合であっても、入力画像に含まれる特定の2次元パターンを精度良く識別することができる。
また、例えば、商品パッケージなど透過性の高いフィルム等に印刷されたパッケージのロゴパターンの識別および特徴点の対応付けにおいて、内側の商品等のテクスチャと重畳され混合されてしまうような状況にあっても精度良く識別と特徴点の対応付けを行うことができる。
また、光源環境の違い等でカメラのホワイトバランスや露出が登録した画像と異なっていてもロバストに識別および特徴点対応付けを実現できる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
また、上記実施の形態では、パターン識別装置が、色ベクトル登録辞書24及びインデクス登録辞書28を備えている場合について説明したが、これに限定されるものではない。例えば色ベクトル登録辞書24及びインデクス登録辞書28の少なくとも一方がパターン識別装置の外部装置に設けられ、パターン識別装置は、外部装置と通信手段を用いて通信することにより、色ベクトル登録辞書24及びインデクス登録辞書28の少なくとも一方を参照するようにしてもよい。
また、上記実施の形態では、登録処理とパターン識別処理とを1つの装置で行う場合を例に説明したが、別々の装置によって、登録処理とパターン識別処理とを行っても良い。
上述のパターン識別装置は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、実施の形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のCPU(MPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、実現できる。その場合、記憶媒体から読み出されたプログラムコード自体が上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体、例えばCD-ROM、DVD-ROM、CD-R、CD-RW、MO、HDD等は本発明を構成する。
10 参照画像入力部
12 画像入力部
20 演算部
22 色ベクトル抽出部
24 色ベクトル登録辞書
26 インデクス登録部
28 インデクス登録辞書
30 色類似度算出部
32 正規化マスク作成部
34 画像マスキング部
36 識別部
40 結果出力部
100 パターン識別装置

Claims (6)

  1. 特定の2次元パターンを含む入力画像を受け付ける画像入力部と、
    登録用の2次元パターンを表す複数の参照画像について、前記参照画像に現れる色を表す色ベクトルが予め登録された色ベクトル登録辞書を用いて、前記色ベクトル毎に、前記入力画像の画素の各々に対し、前記色ベクトルとの類似度を算出し、前記色ベクトル毎に、前記類似度の各々を各画素とする色類似度画像を生成する色類似度算出部と、
    前記複数の参照画像の各々について、前記色類似度算出部によって生成された前記色ベクトル毎の前記色類似度画像から、各画素における、前記類似度の最大値を表すマスク画像を生成し、前記マスク画像に含まれる画素のうち最大の画素値と最小の画素値とに応じて、前記マスク画像を正規化した正規化マスク画像を生成する正規化マスク作成部と、
    前記複数の参照画像の各々について、前記正規化マスク作成部によって生成された前記正規化マスク画像を用いて、前記入力画像をマスキングし、マスキングにより得られた画像をクエリ画像として生成する画像マスキング部と、
    前記画像マスキング部によって前記複数の参照画像の各々について生成された前記クエリ画像の特徴量と、複数の前記参照画像の各々についての特徴量が予め登録されたインデクス登録辞書とを用いて、前記入力画像に含まれる前記特定の2次元パターンを識別する識別部と、
    を含むパターン識別装置。
  2. 複数の参照画像を受け付ける参照画像入力部と、
    前記参照画像入力部によって受け付けた複数の参照画像の各々について、前記参照画像に現れる色を表す色ベクトルを抽出し、抽出された前記色ベクトルを前記参照画像毎に色ベクトル登録辞書へ登録する色ベクトル抽出部と、
    前記参照画像入力部によって受け付けた複数の参照画像の各々について、前記参照画像から抽出される特徴量を、前記参照画像毎にインデクス登録辞書へ登録するインデクス登録部と
    を更に含む請求項1に記載のパターン識別装置。
  3. 前記色ベクトル抽出部は、前記参照画像入力部によって受け付けた複数の参照画像の各々について、前記色ベクトルを抽出し、前記複数の参照画像の各々について抽出された前記色ベクトルをクラスタリング又は量子化し、前記クラスタリング又は前記量子化の結果得られる前記色ベクトルを前記参照画像毎に色ベクトル登録辞書へ登録する
    請求項2に記載のパターン識別装置。
  4. 前記識別部は、前記画像マスキング部によって前記複数の参照画像の各々について生成された前記クエリ画像の特徴量と、前記インデクス登録辞書とを用いて、前記入力画像に含まれる特定の2次元パターンに対応する前記参照画像を識別すると共に、前記入力画像に含まれる特定の2次元パターンの特徴点と前記参照画像の特徴点との対応付けを行う
    請求項1〜請求項3の何れか1項に記載のパターン識別装置。
  5. 画像入力部が、特定の2次元パターンを含む入力画像を受け付け、
    色類似度算出部が、登録用の2次元パターンを表す複数の参照画像について、前記参照画像に現れる色を表す色ベクトルが予め登録された色ベクトル登録辞書を用いて、前記色ベクトル毎に、前記入力画像の画素の各々に対し、前記色ベクトルとの類似度を算出し、前記色ベクトル毎に、前記類似度の各々を各画素とする色類似度画像を生成し、
    正規化マスク作成部が、前記複数の参照画像の各々について、前記色類似度算出部によって生成された前記色ベクトル毎の前記色類似度画像から、各画素における、前記類似度の最大値を表すマスク画像を生成し、前記マスク画像に含まれる画素のうち最大の画素値と最小の画素値とに応じて、前記マスク画像を正規化した正規化マスク画像を生成し、
    画像マスキング部が、前記複数の参照画像の各々について、前記正規化マスク作成部によって生成された前記正規化マスク画像を用いて、前記入力画像をマスキングし、マスキングにより得られた画像をクエリ画像として生成し、
    識別部が、前記画像マスキング部によって前記複数の参照画像の各々について生成された前記クエリ画像の特徴量と、複数の前記参照画像の各々についての特徴量が予め登録されたインデクス登録辞書とを用いて、前記入力画像に含まれる前記特定の2次元パターンを識別する、
    パターン識別方法。
  6. コンピュータを、請求項1〜請求項4の何れか1項に記載のパターン識別装置の各部として機能させるためのプログラム。
JP2016109063A 2016-05-31 2016-05-31 パターン識別装置、方法、及びプログラム Active JP6427534B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016109063A JP6427534B2 (ja) 2016-05-31 2016-05-31 パターン識別装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016109063A JP6427534B2 (ja) 2016-05-31 2016-05-31 パターン識別装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017215768A true JP2017215768A (ja) 2017-12-07
JP6427534B2 JP6427534B2 (ja) 2018-11-21

Family

ID=60575686

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016109063A Active JP6427534B2 (ja) 2016-05-31 2016-05-31 パターン識別装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6427534B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018176A (ja) * 2003-06-24 2005-01-20 Nippon Hoso Kyokai <Nhk> 文字領域抽出装置、文字領域抽出方法及び文字領域抽出プログラム
JP2005209137A (ja) * 2003-12-26 2005-08-04 Mitsubishi Heavy Ind Ltd 対象物認識方法及び対象物認識装置、並びに顔方向識別装置
JP2006252504A (ja) * 2005-02-14 2006-09-21 Nippon Telegr & Teleph Corp <Ntt> パターン認識装置、パターン認識方法、パターン認識プログラム、及びパターン認識プログラムの記録媒体
JP2009187204A (ja) * 2008-02-05 2009-08-20 Toyota Motor Corp 画像処理装置
JP2015201123A (ja) * 2014-04-10 2015-11-12 日本電信電話株式会社 被写体認識装置、被写体認識方法及び被写体認識プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018176A (ja) * 2003-06-24 2005-01-20 Nippon Hoso Kyokai <Nhk> 文字領域抽出装置、文字領域抽出方法及び文字領域抽出プログラム
JP2005209137A (ja) * 2003-12-26 2005-08-04 Mitsubishi Heavy Ind Ltd 対象物認識方法及び対象物認識装置、並びに顔方向識別装置
JP2006252504A (ja) * 2005-02-14 2006-09-21 Nippon Telegr & Teleph Corp <Ntt> パターン認識装置、パターン認識方法、パターン認識プログラム、及びパターン認識プログラムの記録媒体
JP2009187204A (ja) * 2008-02-05 2009-08-20 Toyota Motor Corp 画像処理装置
JP2015201123A (ja) * 2014-04-10 2015-11-12 日本電信電話株式会社 被写体認識装置、被写体認識方法及び被写体認識プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
後藤 雄飛、外2名: ""色の類似性に基づいた形状特徴量CS−HOGの提案"", SSII2012 第18回画像センシングシンポジウム 講演論文集, JPN6018040884, 6 June 2012 (2012-06-06), JP, pages 1 - 8, ISSN: 0003901584 *

Also Published As

Publication number Publication date
JP6427534B2 (ja) 2018-11-21

Similar Documents

Publication Publication Date Title
JP6354589B2 (ja) 物体識別装置、方法及びプログラム
US20150213328A1 (en) Object identification apparatus, object identification method, and program
US9679221B2 (en) Object identification apparatus, object identification method, and program
US10026197B2 (en) Signal processing method, signal processing apparatus, and storage medium
US10430457B2 (en) Image processing apparatus, image processing method, search apparatus, search method, and non-transitory computer-readable storage medium
US9542594B2 (en) Information processing apparatus, method for processing information, and program
US20100158375A1 (en) Signal processing apparatus, signal processing method, computer-readable medium and computer data signal
JP6810392B2 (ja) 個体識別装置
JPWO2019069617A1 (ja) 個体識別装置
US10891740B2 (en) Moving object tracking apparatus, moving object tracking method, and computer program product
JP6427534B2 (ja) パターン識別装置、方法、及びプログラム
JP2006252504A (ja) パターン認識装置、パターン認識方法、パターン認識プログラム、及びパターン認識プログラムの記録媒体
KR20150094108A (ko) 배경 영상의 위치를 이용한 관심맵 생성 방법 및 이를 기록한 기록 매체
JP6063911B2 (ja) 画像処理装置
JP6950376B2 (ja) 画像処理装置、訓練画像処理装置、画像識別装置、訓練画像処理方法、画像識別方法、及びプログラム
CN113544701A (zh) 关联对象的检测方法及装置
JP2017138743A (ja) 画像処理装置、画像処理方法及びプログラム
JP2021047653A (ja) 学習モデル生成装置、画像補正装置、学習モデル生成プログラム、及び画像補正プログラム
JP2008158626A (ja) テンプレート作成装置,テンプレート作成方法,その方法を実装したテンプレート作成プログラム,そのプログラムを格納した記憶媒体と、テンプレートマッチング装置,テンプレートマッチング方法,その方法を実装したテンプレートマッチングプログラム,そのプログラムを格納した記憶媒体
JP2015204571A (ja) 画像処理装置およびその方法
US20240037449A1 (en) Teaching device, teaching method, and computer program product
JP7369247B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP5275376B2 (ja) 情報処理装置及び情報処理プログラム
JP2004192310A (ja) オブジェクト学習装置、オブジェクト識別装置、これらの方法、これらのプログラムおよびこれらのプログラムを記録した媒体
JP2009157766A (ja) 顔認識装置、顔認識方法、顔認識プログラムおよびそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171005

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181012

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181023

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181029

R150 Certificate of patent or registration of utility model

Ref document number: 6427534

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150