JPWO2007004522A1 - 検索システム及び検索方法 - Google Patents
検索システム及び検索方法 Download PDFInfo
- Publication number
- JPWO2007004522A1 JPWO2007004522A1 JP2006553381A JP2006553381A JPWO2007004522A1 JP WO2007004522 A1 JPWO2007004522 A1 JP WO2007004522A1 JP 2006553381 A JP2006553381 A JP 2006553381A JP 2006553381 A JP2006553381 A JP 2006553381A JP WO2007004522 A1 JPWO2007004522 A1 JP WO2007004522A1
- Authority
- JP
- Japan
- Prior art keywords
- image
- template
- matching
- search
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
- G06V30/2504—Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Abstract
携帯アプリケーション(13)及びマッチング処理部(21)は、画像入力部(11)で入力した画像を基にして、階層管理されたテンプレートを用いて、TPデータ管理DB(22)から画像を検索する際、上位階層のテンプレート(例えば1次階層テンプレート2221)を用いたテンプレートマッチングに続いて、下位階層のテンプレート(例えば2次階層テンプレート2222)を用いたテンプレートマッチングを行って検索画像を絞り込み、その絞り込まれた検索結果の画像をディスプレイ(12)で出力する。
Description
本発明は、データベースから画像を検索する検索システム及び検索方法に関する。
従来より、入力された画像に対応する画像をデータベースから検索する手法として、テンプレートマッチングが広く知られている。これは、データベースに蓄積された各画像を予め所定の粗い解像度に落としたテンプレートを作成して、それらテンプレートをデータベースに登録しておき、同様の解像度に落とした入力画像とそれらテンプレートとのマッチングを取るというものである。
しかし、そのようなテンプレートマッチングでは、似た画像をミスマッチングしてしまう可能性がある。そこで、ミスマッチングを低減させるために、類似度テーブルによって、テンプレート間の類似度を管理し、類似した画像の登録を防止するなどの対応を行っている。しかしながら、登録テンプレート数が多くなればなるほど、ミスマッチングの可能性は増大してしまう。
また、類似度を決定する特徴量を特徴点の配置から決める方法も知られている。そして、そのような方法においては、例えば、特開2004−362186号公報に開示されているように、多数のマッチング用データベースを保持し参照する場合、マッチングサーバを並列化し、多数の参照データを分割してマッチングすることで時間短縮を図ろうとする手法が考えられている。
しかしながら、上記特開2004−362186号公報に開示されているようなマッチングの並列処理については、確率的に高速化する効果はあるものの、認識(成功)率を向上させる効果はないことが発明者らの実験で確認されている。
本発明は、上記の点に鑑みてなされたもので、高速化と認識率の向上をバランス良く達成できる検索システム及び検索方法を提供することを目的とする。
本発明の検索システムの一態様は、画像を入力する画像入力手段と、上記画像入力手段で入力した画像を基にして、階層管理されたテンプレートを用いて、データベースから画像を検索する手段であり、上位階層のテンプレートを用いたテンプレートマッチングに続いて、下位階層のテンプレートを用いたテンプレートマッチングを行って検索画像を絞り込む検索手段と、上記検索手段によって絞り込まれた検索結果の画像を出力する出力手段と、を具備することを特徴とする。
また、本発明の検索方法の一態様は、画像をデータベースから検索する方法であり、画像を入力し、入力した画像を基にして、階層管理されたテンプレートの上位階層のテンプレートを用いてテンプレートマッチングを行って、データベースから画像を検索し、さらに、下位階層のテンプレートを用いたテンプレートマッチングを行って検索画像を絞り込み、上記絞り込まれた検索結果の画像を出力する、ことを特徴とする。
以下、本発明を実施するための最良の形態を図面を参照して説明する。
図1に示すように、本発明の一実施例に係る検索システムは、カメラ付携帯電話機やカメラ付PDA等のカメラ付携帯端末10と検索手段とから構成される。カメラ付携帯端末10は、画像を入力する画像入力手段としての画像入力部(カメラ)11と、特定結果を出力する出力手段としてのディスプレイ12とを含む。検索手段は、階層管理されたテンプレートを用いて、上記画像入力部11で入力した画像を基にしてデータベースから画像を検索するものである。この検索手段は、カメラ付携帯端末10の携帯アプリケーション13と、上記カメラ付携帯端末10と通信可能なサーバ20に構成されたマッチング処理部21とによって実現される。
上記サーバ20は、更に、複数のテンプレートが登録され、それらを階層管理するテンプレート(TP)データ管理データベース(DB)22を有している。このTPデータ管理DB22に登録されるテンプレートは、デスクトップパブリッシング(DTP)30で、図2に示すように紙面40に配置した対象画像41から、TP作成部50によって作成されたものである。即ち、本一実施例に係る検索システムでは、予め、DTP30によって、図2に示すように紙面40に対象画像41を印刷する。それと共に、TP作成部50でその対象画像41のテンプレートを作成する。そして、その作成したテンプレートをサーバ20のTPデータ管理DB22に登録しておく。なお、登録する対象画像41が多数あれば、そのようなテンプレートの作成と登録を繰り返す。
検索を望むユーザは、紙面40からカメラ付携帯端末10等の画像入力部11を使って対象画像41を取り込む。すると、携帯アプリケーション13は、その入力画像から画像の特徴抽出を行い、抽出した特徴データをサーバ20のマッチング処理部21に送る。この特徴データを受けたマッチング処理部21は、TPデータ管理DB22に登録されているテンプレートとパターンマッチングを行う。この場合、上位階層のテンプレートを用いたテンプレートマッチングに続いて、下位階層のテンプレートを用いたテンプレートマッチングを行って検索画像を絞り込む。そして、パターンマッチング結果が取得されたならば、マッチング処理部21は、その結果情報をカメラ付携帯端末10の携帯アプリケーション13に送る。この結果情報を受信した携帯アプリケーション13は、その結果情報をディスプレイ12に表示する。
以下、各部の動作をより詳細に説明する。
まず、上記TP作成部50での階層テンプレート作成処理について、図3を参照して説明する。
即ち、TP作成部50においては、まず、ユーザが所望の、N次の階層テンプレートの各層で使用する対象画像41の領域分割レイアウトを定義する(ステップS11)。
図4及び図5に示すように、この領域分割レイアウト221とは、例えば、各階層のテンプレートの画像の切り出し位置を示すものである。あるいは、各階層のテンプレートの解像度を示すものであっても良い。
更には、図6及び図7に示すように、切り出し位置と解像度とを組み合わせたものであっても良い。即ち、図6に示す領域分割レイアウト221の例は、画像の全体領域を8×8セグメントに分割した1次階層テンプレート2221、画像の1/4の領域を8×8セグメントに分割した2次階層テンプレート2222、画像の1/8の領域を8×8セグメントに分割した3次階層テンプレート2223を、それらの右下を一致させるような切り出し位置に設定した例である。また、図7に示す領域分割レイアウト221の例は、上記3つのテンプレート2221,2222,2223の中心を一致させるような切り出し位置に設定した例である。なお、図4乃至図7の例はN=3場合を示しているが、それに限定されるものではないことは勿論である。
例えば、テンプレートマッチングでは、図8に示すような似た画像をミスマッチングしてしまう可能性がある。これに対して、図9に示すように、右下の領域のみ解像度の高いテンプレート(2次階層テンプレート2222)を使用すれば、ミスマッチングの可能性を減少させることができる。
なお、領域分割レイアウトを「定義する」とは、新たに「作成する」場合と既にあるものを「選択する」場合との何れをも含むものである。
而して、上記のような領域分割レイアウト221が定義されたならば、内部カウンタnを「1」にセットする(ステップS12)。そして、そのカウンタnの値がNよりも大きくなっているか否かを判別する(ステップS13)。
ここで、まだNよりも小さい場合には、上記定義した領域分割レイアウト221に従って、元画像を入力する(ステップS14)。この場合、入力される元画像は、対象画像41における上記領域分割レイアウト221により示される画像切り出し位置の画像データである。そして、上記定義した領域分割レイアウト221に従って、その入力された元画像から特徴データを作成、つまりn層(n次元)テンプレートを作成する(ステップS15)。次に、例えばテンプレートマッチングによってOKとなったときに出力すべき結果情報、例えば特定のWebサイトのURL等を入力する(ステップS16)。そして、それら特徴データ及び結果情報を、該TP作成部50内に構成した特徴データ/結果情報テーブル51に登録する(ステップS17)。
その後、カウンタnの値を「+1」した後(ステップS18)、上記ステップS13に戻り、上記ステップを繰り返し行う。こうして、カウンタnの値がNよりも大きくなったならば(ステップS13)、このTP作成処理を終了する。
次に、図10を参照して、上記サーバ20のTPデータ管理DB22でのTPデータ管理処理の詳細を説明する。
即ち、TPデータ管理DB22では、まず、TP作成部50から上記N次の階層テンプレートの各層で使用する対象画像41の領域分割レイアウト221を読み出す(ステップS21)。次に、その読み出した領域分割レイアウト221に対応する特徴データ/結果情報テーブル51の内容を読み出す(ステップS22)。そして、テンプレートレイアウト毎に設けられたデータベースに、上記読み出した領域分割レイアウト221に従って、上記読み出した特徴データ/結果情報テーブル51の内容を登録する(ステップS23)。この処理を、TP作成部50で作成した全てのテンプレートが終了するまで(ステップS24)、繰り返す。
次に、図11及び図12を参照して、上記カメラ付携帯端末10の携帯アプリケーション13での端末側動作処理、及び、上記サーバ20のマッチング処理部21でのマッチング処理の詳細を説明する。なお、図1では、携帯アプリケーション13は一つしか図示していないが、実際にはカメラ付携帯端末10には複数の携帯アプリケーション13が存在する。即ち、一つのテンプレートレイアウトに対して一つの携帯アプリケーション13が存在し、元の対象画像41の種類に応じて起動される携帯アプリケーション13が異なる。
ある対象画像41に対応する携帯アプリケーション13が起動されると、その携帯アプリケーション13は、まず、当該携帯アプリケーション13のテンプレートレイアウトによって決まるテンプレート最大階層数を、図示しない内部カウンタNにセットする(ステップS31)。そして、画像入力部11により紙面40上の対象画像41を撮影して得られた画像を入力する(ステップS32)。次に、階層番号をカウントする図示しない内部カウンタnを「1」にセットする(ステップS33)。
その後、当該携帯アプリケーション13のテンプレートレイアウトに従って、その画像に対し第n階層領域の特徴データ(n次特徴量)を抽出する(ステップS34)。ここで、特徴データ(特徴量)とは、例えば特徴点の分布や濃度などである。そして、その抽出したn次特徴量を、当該携帯アプリケーション13のテンプレートレイアウトを特定するためのTPレイアウト番号m及び現在の階層番号nと共に、サーバ20のマッチング処理部21に対して送信する(ステップS35)。その後、そのマッチング処理部21からの結果情報の受信待ちとなる(ステップS36)。
サーバ20のマッチング処理部21においては、まず、受信したTPレイアウト番号mに従って最大階層数を図示しない内部カウンタNにセットする(ステップS51)。また、マッチング対象の階層番号を図示しない内部カウンタnにセットする(ステップS52)。そして、受信したn次の特徴データ(特徴量)を取得する(ステップS53)。次に、上記TPデータ管理DB22の上記受信したTPレイアウト番号mで示されるデータベースに登録管理されているテンプレートと該取得した特徴データとのパターンマッチングを行う(ステップS54)。
そのパターンマッチングにより、対象データ候補が有ったならば(ステップS55)、更に、類似度チェックを行う(ステップS56)。そして、類似度が所定の閾値以上の対象データ候補が一つであるか否かを判別する(ステップS57)。
このステップS57において、対象データ候補が一つであると判別されたならば、その対象データ候補の特徴データに対応して特徴データ/結果情報テーブル51に登録されている結果情報を、上記カメラ付携帯端末10に対して返信する(ステップS58)。
携帯アプリケーション13は、上記サーバ20のマッチング処理部21から結果情報が返信されてきたならば(ステップS37)、それをディスプレイ12に表示する(ステップS38)。
これに対して、上記ステップS57において、類似度が所定の閾値以上の対象データ候補が複数あると判別された場合には、内部カウンタNの値が内部カウンタnの値よりも大きいか否かを判別する(ステップS59)。そして、大きくなければ、(n+1)次特徴データの送信を、上記カメラ付携帯端末10に対して要求する(ステップS60)。
携帯アプリケーション13は、上記サーバ20のマッチング処理部21から上記(n+1)次特徴データの送信要求があった場合には(ステップS37)、内部カウンタNの値が内部カウンタnの値よりも大きいか否かを判別する(ステップS39)。そして、大きくなければ、カウンタnの値を「+1」して(ステップS40)、上記ステップS34に戻り、上記の処理を繰り返す。これにより、n+1次の特徴データがサーバ20のマッチング処理部21に送信されることになる。
そして、サーバ20のマッチング処理部21においては、そのn+1次の特徴データに対して上述したような処理を実行する。但しこの場合、前回のパターンマッチング時に複数あった対象データ候補に対して優先的にパターンマッチングを行う。
こうして、一つのテンプレートにマッチングするまで、上記の処理が携帯アプリケーション13とマッチング処理部21で繰り返される。
なお、上記ステップS39において、内部カウンタNの値が内部カウンタnの値よりも大きいと判別された場合には、携帯アプリケーション13は、マッチングエラーとして、エラーメッセージ等をディスプレイ12に表示して(ステップS41)、処理を終了することになる。
以下、具体的な具体例を図面を参照して説明する。
[第1具体例]
本具体例は、カメラ付き携帯電話機を利用して、通販雑誌/カタログ誌にてスムーズな通販を進める場合の例である。
本具体例は、カメラ付き携帯電話機を利用して、通販雑誌/カタログ誌にてスムーズな通販を進める場合の例である。
通販雑誌/カタログ誌で商品とオプション品をセットで販売する場合、図13に示すように、紙面40には、メイン商品(カメラ)の画像が大きく、オプション品(交換レンズやフィルム)が小さく印刷されている場合がある。このような対象画像41の場合、類似度が接近して判別が難しくなる。
そこで、予め、対象画像41全体を第1階層テンプレート(1次階層テンプレート2221)として登録しておき、注目領域を第2階層テンプレート(2次階層テンプレート2222)として登録しておく。この結果、比較的粗い解像度で撮影した画像から特徴量を抽出(特徴点分布方式、テンプレート濃度方式のどちらでも)した場合であっても、第2階層のテンプレート(マッチングエンジン)を指定する意味のみであるので、誤認識率は小さく且つ、元画像が粗いので特徴量データ容量自体も小さい。
さらに、このときの第1階層テンプレート領域と第2階層テンプレート領域のレイアウト構成(領域分割レイアウト221)も登録しておく。
そして、対象画像41を入力し、携帯アプリケーション13で第1階層レイアウト範囲の特徴データを抽出し、サーバ20のマッチング処理部21では、その抽出された第1階層の特徴データに対してマッチング処理を行う。所定の閾値以上の演算結果が複数あった場合には、上記登録した第2階層テンプレート領域の特徴データを抽出し、パターンマッチングを行う。
第1階層におけるパターンマッチングと第2階層で行うパターンマッチングで用いる特徴データの構成サイズ(特徴の細かさ)を同じにすると、各階層での特徴抽出やパターンマッチング処理を共通化可能であるし、異なる特徴抽出を設定しておくことも有効である。更に、第1階層の特徴抽出において、例えば画像を9分割し、その任意のセグメントに対応する部分のみの特徴量抽出を進める事も可能であり、且つその指定を携帯電話機であれば、テンキーなどで指定することが有効である。例えば、右上のセグメントを「3」、中央を「5」等である。この後、第1階層のマッチングエンジン(及びデータベース)にて所定の第2階層データベースを指定され、決定マッチングがされる。しかもこの間の通信はおよそ大きく見積もってもVGAクラスで10kB以上を必要としない。言い換えると、それ以上の精細度、或いは特徴点の配置組み合わせ数を持っていても結果に影響しない事が判明している。これはテンプレート方式でも同様で、第1階層の役割から機能を設計すると、16×16セグメント(特徴量サイズ:256)でのテンプレート設定でも充分であり、その場合の特徴量はやはり2kB程度である。従って、通信されるべき特微量についても従来より極めて低く携帯回線上の通信容量に関しても10kB以下のデータであり、高速化の観点からも効果を発揮するものである。
[第2具体例]
WebページはURLがわかれば誰でも参照することができる。これに対して、写真集などの雑誌を買った人だけが接続できるWebページ(プレミアムコンテンツ)では、そのWebページの参照を制限する手段として、会員制にして、ユーザ名及びパスワードを入力する場合が多い。しかし、携帯電話機のWebサイトなどの場合、ユーザ名及びパスワードを端末から入力するのは非常に面倒であった。
WebページはURLがわかれば誰でも参照することができる。これに対して、写真集などの雑誌を買った人だけが接続できるWebページ(プレミアムコンテンツ)では、そのWebページの参照を制限する手段として、会員制にして、ユーザ名及びパスワードを入力する場合が多い。しかし、携帯電話機のWebサイトなどの場合、ユーザ名及びパスワードを端末から入力するのは非常に面倒であった。
そこで、本具体例は、紙面40の対象画像41を、携帯アプリケーション13を有するカメラ付携帯端末10で読み取った場合だけ、そのようなWebベージを参照できるようにするものである。
即ち、紙面40上の対象画像41に対して、第1階層テンプレート(1次階層テンプレート2221)と第2階層テンプレート(2次階層テンプレート2222)に分け、第1階層テンプレートをプレミアムIDに関連付けておく。そして、紙面40上の対象画像41を入力し、第1階層テンプレートと第2階層テンプレートそれぞれに対し、テンプレートマッチングを行う。サーバ20は、テンプレートマッチング結果として得られた結果情報であるURLが上記のようなプレミアサイトのときだけ、時間限定でWebページを動的に生成するように要求する。このため、紙面40から対象画像41を読み込んで、マッチした場合だけWebベージが生成され、この生成されたWebページを参照することができる。
なお、Webページを動的に生成するとあるが、図14に示すように、プレミアムサーバ60がプレミアムIDの認証処理を行うことにより、Webサーバ70に静的に用意されたWebページ71に対して動的にアクセス制御を行うことで、動的にWebページを生成していることと同等の効果を得られることは勿論である。
[第3具体例]
携帯電話機上やPDAなどのカメラ付携帯端末10でマッチングを行う場合、カメラ付携帯端末10側にTPデータ管理DB22を設けることは可能であるが、携帯端末10側で大量に参照特徴量データ(テンプレート)を管理するのは、メモリ容量、演算速度の面で不利な場合が多い。さらに、テンプレートは頻繁に更新されるため、テンプレートを携帯端末10がサーバ20から逐次ダウンロードする必要がある。従って、画像のマッチングを行う場合、マッチングをサーバ20側で行った方が、メモリ容量、演算速度の面では有利である。しかしながら、携帯端末10側で対象画像41を入力する毎に、特徴データをサーバ20に送信しなければならない。対象画像41の特徴点の配置関係で特徴量を定義する方式(Vipr)の場合、特徴量の演算に用いる対象画像41の撮影時の解像度が認識精度とマッチング速度を決める。解像度が高い、即ち撮影時の画素数が多くければ認識精度は向上するが、マッチング速度は演算回数が増大するため遅くなる。従って、階層化マッチングを行うには、同一対象画像41に対してその解像度が段階的に全て異なる各階層の特徴量を、TPデータ管理DB22で管理する構成が有効である。
携帯電話機上やPDAなどのカメラ付携帯端末10でマッチングを行う場合、カメラ付携帯端末10側にTPデータ管理DB22を設けることは可能であるが、携帯端末10側で大量に参照特徴量データ(テンプレート)を管理するのは、メモリ容量、演算速度の面で不利な場合が多い。さらに、テンプレートは頻繁に更新されるため、テンプレートを携帯端末10がサーバ20から逐次ダウンロードする必要がある。従って、画像のマッチングを行う場合、マッチングをサーバ20側で行った方が、メモリ容量、演算速度の面では有利である。しかしながら、携帯端末10側で対象画像41を入力する毎に、特徴データをサーバ20に送信しなければならない。対象画像41の特徴点の配置関係で特徴量を定義する方式(Vipr)の場合、特徴量の演算に用いる対象画像41の撮影時の解像度が認識精度とマッチング速度を決める。解像度が高い、即ち撮影時の画素数が多くければ認識精度は向上するが、マッチング速度は演算回数が増大するため遅くなる。従って、階層化マッチングを行うには、同一対象画像41に対してその解像度が段階的に全て異なる各階層の特徴量を、TPデータ管理DB22で管理する構成が有効である。
本具体例は、カメラ付携帯端末10としてカメラ付携帯電話機を使用する例であり、予め登録した画像を撮影することにより、その画像を認識し、所定の動作、例えば音声出力や所定のプログラムの起動、或いは所定のURLの表示をさせる場合に適用するものである。特に、予め登録した画像が極めて多数(1000以上)の場合に効果がある方式であり、また、類似性の高い画像がその中に含まれている場合にも効果を有する。
画像を認識する場合、いわゆる辞書データとして画像データを登録するが、画像をそのまま比較するのではなく、画像の特徴量を比較するのが効率が良く実際的である。本具体例では、画像の特徴点の配置関係をベクトル量の組み合わせとして算出し、その多数組を特徴量として定義する。そのとき、この特徴量は、特徴点の現れる数によってその精度が異なり、元の画像の精細度が高ければ特徴点が数多く検出可能であるため、同じ元画像に対し、なるべく高精細な条件で特徴量を算出する。このとき、同じ画像素材に対して精細度を低下させた画像を基に特徴量を算出すると、特徴点が比較的少なくなるため特徴量自体は小さい容量となる。容量が小さいことはマッチング精度には劣るものの、マッチング速度が高速であることや、携帯回線などでの通信速度が速い等のメリットがある。本具体例においてはここに着眼し、画像を参照データ(テンプレート)として登録する際、同じ画像素材を登録するにしても異なる複数の精細度から特徴量を算出し、それぞれの精細度に分割したデータベース(TPデータ管理DB22)を構成する。そのそれぞれのデータベースにはそれぞれに対応するマッチングサーバ(マッチング処理部21)が接続し、並列動作可能な配置とする。
例えば、図15に示すように、多数のマッチング処理部21とTPデータ管理DB22がクラスタ化されネットワーク内に大方等位に存在したとする。そのTPデータ管理DB22には同一対象画像41の特徴量が各階層で管理されている。但し、各TPデータ管理DB22では、特徴量を算出したときの元画像の解像度が異なる。例えば、QVGAレベル、VGAレベル、XGAレベル、SXGAレベル、…のように分けられている。
このようなマッチング処理系を準備した上で、携帯電話機の画像入力部(カメラ)11から、既に登録されている意匠を撮影し、携帯電話機上の携帯アプリケーション13により特徴点の配置関係から特徴量を算出する。このときのカメラ解像度が200万画素級であったとすれば、通信を介してマッチング処理部21にて検索する場合も200万画素級の解像度のTPデータ管理DB22からのデータでマッチングを行えば誤認識率が少ない。しかしながら、同時に動作する低解像度(例えばVGAクラスの解像度)のTPデータ管理DB22でのマッチングは高速に応答するため、先に携帯電話機に結果が送付される。このように、マッチング処理部21を元画像の解像度別に並列配置することは、速度的、認識精度的に有利である。
例えば、一万円札の画像をQVGAで入力し、その解像度レベルにおいて特徴量を算出し、マッチング処理部21クラスタに送られれば、当然QVGAレベルのテンプレートを蓄積したTPデータ管理DB22に対しマッチングを行うマッチング処理部21は最初にマッチし、所定の認識結果を返す。そして、それ以降のマッチング処理部21による結果も時間差はあるものの同様の結果が期待できる。
また、この一万円札の画像をSXGAの解像度で入力し、各マッチング処理部21にこの解像度での特徴量を送ったとすると、この場合も同様に、最初にQVGAレベルのマッチング処理部21からマッチング結果が返ってくることが予測される。しかしながら、その後、VGAレベル、XGAレベル、SXGAレベル、…の各マッチング処理部21からわずかな時差でマッチング結果が返ってきたとき、当初「一万円札」であると言う結果だったものが、解像度が上がった場合に「一万円札で、番号部分にXDA3248798PSPに相当する画像がある」という特定結果まで返してくることが可能となる。また、上述したとおり、高解像度マッチング処理部21においては特徴量自体の容量が大きく、XGAクラスの特徴量は40KB程度に肥大するが、予め低解像度マッチングによりおよそ10KB程度までに小さく成る。また、2次以降のマッチング処理部21及びTPデータ管理DB22においては、より低解像データベースとの差分のみを保持すれば、より小さいデータベース構成を実現し、それは認識処理の高速化につながる。
このように、一部又は全面の解像度を同画像より算出し、実質上の階層化を実現することは、複数のデータベースをクラスタ的にマッチングエンジンを分散処理する場合に比べて認識速度、認識精度の両面で効果がある。
また、この方式は、仮に当初の認識結果が誤認識(間違った認識結果)を返したとしても、後から返ってきた認識結果の方が確率的に正答で有る可能性が高いため、訂正が可能である。
なお、TPデータ管理DB22への登録については、高解像度の対象画像41の特徴量を計算した後、順次解像度を落として特徴量を再算出して次々に当該解像度のDBに登録して行くことで行われる。
また、高解像度で対象画像41を撮影してマッチングを行う場合には、上記TPデータ管理DB登録時とは逆に、カメラ付携帯端末10の携帯アプリケーション13において撮影画像をリサイズして特徴量を計算する。そして、当該解像度に対応するTPデータ管理DB22及びマッチング処理部21に送信。その後、更に解像度を上げて特徴量を再算出し、当該解像度に対応するTPデータ管理DB22及びマッチング処理部21に送信する。これを、撮影時の解像度に達するまで、繰り返す。
この方法の応用として、低解像度のTPデータ管理DB22及びマッチング処理部21でマッチングさせることにより、対象物を大まかに分無し、その分類に対応したTPデータ管理DB22及びマッチング処理部21に対してさらにマッチングを行うことも可能である。例えば、一万円札を対象画像41として入力した場合、低解像度では{本の表紙,新聞,図書券カード、チケット,札,ポスター}、順次解像度が上がると{図書券,カード,チケット,紙幣}、{日本紙幣,ドル紙幣,ユーロ紙幣.元,ウォン}、{千円紙幣札,2千円紙幣,5千円紙幣,1万円紙幣}、{新1万円紙幣、旧一万円紙幣}、…のように、各階層(各解像度)でのマッチング結果を使って、関連付けられたTPデータ管理DB22を優先的に検索することによって高速に検索を行うことが可能になる。さらに、高解像度の検索結果の方が、精度が高いため誤認識があっても訂正が可能となる。
[第4具体例]
携帯電話機上やPDAなどのカメラ付携帯端末10でマッチングを行う場合、カメラ付携帯端末10側にTPデータ管理DB22を設けることは可能であるが、携帯端末10側で大量に参照特徴量データ(テンプレート)を管理するのは、メモリ容量、演算速度の面で不利な場合が多い。さらに、テンプレートは頻繁に更新されるため、テンプレートを携帯端末10がサーバ20から逐次ダウンロードする必要がある。従って、画像のマッチングを行う場合、マッチングをサーバ20側で行った方が、メモリ容量、演算速度の面では有利である。しかしながら、携帯端末10側で対象画像41を入力する毎に、特徴データをサーバ20に送信しなければならない。
携帯電話機上やPDAなどのカメラ付携帯端末10でマッチングを行う場合、カメラ付携帯端末10側にTPデータ管理DB22を設けることは可能であるが、携帯端末10側で大量に参照特徴量データ(テンプレート)を管理するのは、メモリ容量、演算速度の面で不利な場合が多い。さらに、テンプレートは頻繁に更新されるため、テンプレートを携帯端末10がサーバ20から逐次ダウンロードする必要がある。従って、画像のマッチングを行う場合、マッチングをサーバ20側で行った方が、メモリ容量、演算速度の面では有利である。しかしながら、携帯端末10側で対象画像41を入力する毎に、特徴データをサーバ20に送信しなければならない。
特徴量を用いて画像認識を行う場合、TPデータ管理DB22で管理する特徴量データの数が増加すると、特徴量が接近したデータが増大する可能性があり、検索時間も増加する。このため不要な特徴量データは早急に削除することが望ましい。
また、特徴量を用いて画像を認識しようとして結果情報を取得したが、結果情報が古かったり、指定された先の情報が削除されていたりする場合がある。例えば、結果情報にURLが書かれていて、そのURLに接続したが、そのWebページが削除されていて、接続できない場合などである。携帯電話のWebサイトなどの場合、サイトに接続できなくても通信料金が発生する場合がある。
そこで、本具体例では、図16に示すように、認識対象画像41の画像領域を個別領域41AとID領域41Bとに分ける。そして、ID領域41Bの特徴量を有効期限に対応させ、1週間、1ヶ月、3ヶ月、6ヶ月、1年などの有効期限を用意しておく。
ID領域41Bの特徴量は数を少なくすることが可能であり、サイズを小さくできるので、カメラ付携帯端末10側にID領域TPデータ管理DB22Aを用意することが可能である。画像入力時にネットワーク等を経由して個別領域TPデータ管理DB22Bに検索に行く前に、このカメラ付携帯端末10内部に持ったID領域TPデータ管理DB22Aを高速に検索可能で、有効期限が切れているか否かをユーザに示すことが可能となる。
なお、認識対象画像41における個別領域41AとID領域41Bとの関係は、図17に示すように、互いに固定位置に配置されていても良いし、図18に示すように、相対位置に配置されていても構わない。
[第5具体例]
携帯電話機上やPDAなどのカメラ付携帯端末10でマッチングを行う場合、携帯端末10側にTPデータ管理DB22を設けることは可能であるが、携帯端末10側で大量に参照特徴量(テンプレート)を管理するのは、メモリ容量、演算速度の面で不利な場合が多い。さらに、テンプレートは頻繁に更新されるため、テンプレートを携帯端末10がサーバ20から逐次ダウンロードする必要がある。従って、画像のマッチングを行う場合、マッチングをサーバ20側で行った方が、メモリ容量、演算速度の面では有利である。しかしながら、携帯端末10側で対象画像41を入力する毎に、特徴データをサーバ20に送信しなければならない。
携帯電話機上やPDAなどのカメラ付携帯端末10でマッチングを行う場合、携帯端末10側にTPデータ管理DB22を設けることは可能であるが、携帯端末10側で大量に参照特徴量(テンプレート)を管理するのは、メモリ容量、演算速度の面で不利な場合が多い。さらに、テンプレートは頻繁に更新されるため、テンプレートを携帯端末10がサーバ20から逐次ダウンロードする必要がある。従って、画像のマッチングを行う場合、マッチングをサーバ20側で行った方が、メモリ容量、演算速度の面では有利である。しかしながら、携帯端末10側で対象画像41を入力する毎に、特徴データをサーバ20に送信しなければならない。
この場合、撮影画像1枚に対して特徴量抽出を行い、サーバ20に問い合わせる。このとき、1枚の画像に対して複数の対象画像41が含まれている場合がある。このような場合、以下のような方法が有効である。
・複数個マッチングしたとき、図19に示すように、全ての対象画像41の結果情報を表示する。
・複数個マッチングしたとき、マッチングしたそれぞれの結果情報のAND情報で関連付けされた情報を表示する。例えば、「チューリップ」と「さくら」を認識したら植物図鑑の情報を表示する。
・複数個マッチングしたとき、図20に示すように、どの情報を取得するかユーザに選択させる。
・複数個マッチングしたとき、図21に示すように、TPデータ管理DB22側の参照特徴量算出時に使用した元画像を表示させる。このとき、画像入力時に中心に最も近い位置の対象画像41から順に表示領域の一部(例えば下部)に表示させる。
・複数個マッチングしたとき、図22に示すように、中心に近い対象画像41にマッチする結果情報だけを表示する。
以上の方法を可能とすることにより、ユーザの意思(これを認識させたい)に近い操作性を実現することができる。
[第6具体例]
画像を認識したとき、すぐに結果情報を表示させると、入力画像中のどの対象画像41を認識したのかユーザが判別できなくなる虞がある。
画像を認識したとき、すぐに結果情報を表示させると、入力画像中のどの対象画像41を認識したのかユーザが判別できなくなる虞がある。
そこで、図23及び図24に示すように、入力画像中の対象画像41に対して特徴量を抽出した領域上に明示的に「Get」や「ハートマーク」などの文字列や意匠マーク表示させる。
こうすることにより、認識対象画像41をユーザに知らせ、ユーザの意思(ボタンの押下など)により結果情報を表示させることが可能となる。
[第7具体例]
本実施例に係る検索システムをカードゲームに適用した場合を次に説明する。
本実施例に係る検索システムをカードゲームに適用した場合を次に説明する。
本具体例では、カメラ付携帯端末10として、カメラ付携帯電話機、もしくは撮影装置と組み合わせて使用できる通信機能を持ったPDA等を用いて、カードゲームを行う。
即ち、フィールドに並べられたカードを対象画像41として撮影し、認識を行い、その認識結果に従って、様々な結果をユーザに提供するものである。
ここで、複数のカードが画面内に存在する場合、画面中央等、予め規定された基準点に近いものが選択される。
また、画面内に複数のカードを捉えた際には、それら複数のカードの組合せによって、表示する情報を切り替えることができる。この場合、カードの種類としての組合せのみならず、複数のカードの相対的な向き、また、1つのカードであっても、画面に対する向さや位置によって情報を切り替えることも当然可能である。
また、携帯端末10を画面上方へ動かすことで、カードに対する指示と認識することができる。これは、カードの意匠等を認識することによって、特定のカードであることを理解し、さらに、画面内の画像情報(オプティカルフローや、カードの意匠そのもの、また絵柄としての角やエッジなどによって表現される自然特徴点等)を利用して、画面内におけるカードの相対的な移動をトラッキングすることによって実現される。
また、携帯端末10の動作を画面内の情報からトラッキングすることによって、出力する情報、例えば認識したカードの情報を切り替えることも可能である。例えば、カードを捉えた後、携帯端末10を上方へ動かすときには、攻撃に関する情報や音声を提示したり、携帯端末10を回転させたときには、カードに記載されたキャラクタの進化情報が提示されることになる。
複数のカードを捉えた際の選択の基準となるのは、これらに限らず、例えば、登録時の姿勢に近いもの、つまり、正面の状態で登録したものについては、画面に対して縦横がほぼ一致し、天地も一致した状態になっているものが優先的に選択されても良い。
また、認識した複数のカードに対応する登録画像を画面の一部に帯状の列として表示し(タブのイメージ)、これらを選択させても良い。
また、認識した際には、「GET」等のテキストや、星印等の意匠が認識物上/周辺に(リアルタイム)に表示される。または、認識した領域を線等で囲むことにより、認識したことをユーザに提示する。認識した領域の輝度を変更することにより、光っているように提示しても良い。さらに、音・音声が利用できることは勿論である。また、画面下部(例えば右下)に認識した対象の登録画像や名称等の関連情報を対象を捉えたカメラの撮影画像上に重畳表示しても効果的なユーザへの提示となる。この際、画面を一時停止させる方法をとっても良い。つまり、認識した瞬間に規定の時間だけ画面の更新を止め、認識した状態をはっきりとユーザに提示することができる。規定の時間が経過した後には、画面は再度更新される状態になる。
[第8具体例]
本実施例に係る検索システムを、テーマパーク等のある限定された空間で利用する場合の例を次に説明する。
本実施例に係る検索システムを、テーマパーク等のある限定された空間で利用する場合の例を次に説明する。
この場合、入場時に、カメラ付携帯端末10によって、チケット、場内地図、ゲート付近の看板等に仕掛けられたシンボルを捉えることによって、テーマパーク内のコンテンツの全て、もしくは一部を予め携帯端末10内の記憶領域に保存することができる。この記憶領域は、内蔵メモリであっても良いし、メモリカードといった別媒体のものであっても良い。もちろん、コンテンツを記憶させた状態のメモリカードを配布しても良い。
そして、例えばマップの希望するアトラクションを画像入力部11で撮影することにより、結果情報として当該アトラクションに関連するコンテンツを取得できる。
アトラクション付近の看板もしくはアトラクション施設外観、ゲート等をコンテンツに対応する特徴領域として登録しておくことにより、コンテンツをダウンロードしたカメラ付携帯端末10で看板や施設外観、ゲート等を眺める、もしくは撮影するだけで、対応するコンテンツを楽しむことができる。例えば、待ち行列に並んだ際に施設のゲートを撮影すると、結果情報として送られてくる当該施設の説明をキャラクタのアニメーション等で見ることができる。また、施設内のアトラクションと連動したゲームで遊ぶことができ、そのゲームの結果、得点等が施設内の演出を変化させるパラメータとなっても良い。ゲームの結果、得点等は、ゲーム完了時に通信によりテーマパークに設置されたサーバ20等へ送信される。また、アトラクション開始時には再度ゲートを撮影することで、ログイン通知が完了する。
また、テーマパーク内の看板を対象とした場合、同種の看板、例えばフードコーナーを示すものやトイレを示すもの等があるが、カメラ付携帯端末10に装備された概略位置特定装置、例えばGPSや基地局間の電波強度を利用したもの等により、利用者の現在の概略位置から認識されるはずのものを制限することができる。例えば、Aゾーンの中央部にいる利用者がフードコーナーの看板を撮影した場合には、そもそものマッチング候補をその位置から見える可能性のあるレストランAとアトラクションB、C、D、お土産ショップE、Fだけに制限でき、マッチングの効率を飛躍的に向上させることが可能である。
また、利用者が集中する環境なので、必ずしも十分な通信帯域/速度を確保できないことが考えられる。こういった状況への対応として、撮影画像を送信する際には、粗い画像情報P0をまず送信し、続いて、より解像度の高い画像P1を構成するためのP0との差分情報dP1を送信する。サーバからはP0の検索結果、その後、P1の検索結果といった具合に、非同期に通信を行い結果を得る。非同期に行うことにより、ユーザの使用感を損なわずに、こういった多重情報のやりとりが可能となる。画像から抽出した特徴量を送信する際には、各特徴要素の重要度に応じて送信順位を変化させることになる。つまり、重要度の高い特徴要素から順に送信すれば良い。
また、多重情報に対応したマッチングサーバでは、低解像度の情報に関連付けする情報はグループ化された情報であっても良い。例えば、図25に示すように、施設の種類を示す看板の一部に具体的店舗情報がのっているような場合、低解像度では、店舗情報を判断することは困難である。よって、低解像度に対応するサーバ上の情報も施設の種類を関連付けするに留め、より高解像度な情報に対応するサーバ上で、具体的な店舗の情報を関連付けする。このように、基礎となる情報の解像度/情報量に応じてマッチングサーバ上の情報密度も変化させることによって、ユーザへ順次マッチング情報を送信する場合であっても、結果が段々と詳細になっていくことになり、良好な使用感を提供できる。
[第9具体例]
本実施例に係る検索システムを、通販及び現物商品のマーケティングに適用した場合を次に説明する。
本実施例に係る検索システムを、通販及び現物商品のマーケティングに適用した場合を次に説明する。
本具体例では、カメラ付携帯端末10として、カメラ付携帯電話機を用いるものとする。カメラ付携帯電話機には、予め本技術を含む携帯アプリケーション13をダウンロード或いは予め販売時点でインストールさせておく。
本具体例においては、携帯電話機側の携帯アプリケーション13は、撮影した画像をユーザが適宜選択できる所定のサーバへ送付する機能を有し、サーバからの回答を一旦表示し、携帯サイト接続に対してブラウザを起動する機能を有する。
図26に示すように、本検索システムは、主に3種のソフトウェア群から成る。即ち、携帯電話機にインストールされる携帯アプリケーション13、サーバ20に構成されたマッチング処理部21のソフトウェア、及び画像登録システム80である。
図27に示すように、携帯アプリケーション13は、上述の通り携帯電話機に導入されている画像入力部11であるカメラを起動し、ユーザの指示により対象物の撮影を行い(ステップS71)、通信を介してサーバ20のマッチング処理部21に画像を送付する(ステップS72)。この場合、カメラ付携帯端末10上で予備的な処理、例えば、画像圧縮、輪郭強調やコントラスト調整、或いは特徴点抽出や一部の特徴量評価などを行い、これらを元の画像と併せて及び/又は別途サーバ側に送るものである。この携帯アプリケーション13は、画像特徴量のマッチング機能を保有しても良い。しかしながら、画像を特徴点群のフォーメーションやその各点群の特徴の強弱などから特徴量として送信し、判別はサーバ側で処理する方が基本的に処理時間上有利であることが発明者らの実験で確かめられている。
マッチング処理部21については前述されているが、これは画像登録システム80により登録された参照画像群がその精細度に応じ或いは精細度を段階化したテンプレートとしてTPデータ管理DB22に格納されたものと、照合を図る機能が第一義である。
画像登録システム80は本技術において利用時の導入部となるもので、情報を提供するきっかけとしたい画像や検索対象にしたい画像を登録する機能を有する。本具体例では、この画像登録システム80がWebアプリケーションの形態で利用可能にするものを提供している。この形態にすることにより、画像の登録を希望する者がその登録する時間や場所の制限が極めて少なくなる。また、本検索システムの利用に対して画像の登録についての課金系を設定する場合に非常に課金システムを構築するのが容易となる利点もある。
更に、この画像登録システム80を携帯アプリケーション13の一つにすることも更に登録の利便性確保のために有効となる。携帯アプリケーション13の形で携帯電話機のカメラ(画像入力部11)を用い、そこで撮影した画像をそのカメラ付携帯端末10に特定或いはユーザ指定のデータベース(TPデータ管理DB22)に登録し、更にその画像に紐づけるべき情報を併せて登録できる。例えば、URLもその画像とWebサーバ70上のWebページ(コンテンツサイト)を紐づけるものであるし、テキストでキーワードを指定しておくことで更に一般的な検索エンジンにてサイト検索を掛けるように設定すること等も出来る。
携帯電話機のカメラから画像を登録する場合、携帯電話機からTPデータ管理DB22に登録画像を送信し(ステップS73)、それを第2階層テンプレート(2次階層テンプレート2222)として登録すると共に、その送信画像から精細度を下げた画像を再生成して第1階層テンプレート(1次階層テンプレート2221)を作成して登録する(ステップS74)。これは、携帯電話機上から同一画像を複数回送信することは時間的にも利用料金的にも不利であるためである。
このように、画像登録システム80と携帯アプリケーション13を、携帯電話機上で一体のソフトウェアとして構成することが好ましい。これは、両ソフトウェアが携帯電話機上で画像を撮影し、サーバへ画像を送付する機能がほぼ同一であるためである。このソフトウェアをここでは登録兼用携帯アプリケーションと呼称する。この登録兼用携帯アプリケーションでは、携帯電話機上で携帯アプリ13を立ち上げると、“登録”か“検索”かを画像撮影後に決定することが出来る。また、立ち上げ直後に特定のサーバ20のマッチング処理部21或いは特定のTPデータ管理DB22を指定することも出来る。この場合、“登録”か“検索”をこのタイミングで指定することも可能である。
“検索”を行う場合には、上記のようにステップS72で画像を送信する。これを受けたマッチング処理部21では、TPデータ管理DB22に登録された1次階層テンプレート2221による1次マッチングを実施し(ステップS75)、更に、2次階層テンプレート2222による2次マッチングを実施する(ステップS76)。そして、マッチングした画像に紐つく情報、例えばURL等のリンク先情報を返送する(ステップS77)。このリンク先情報を受けた携帯アプリケーション13は、携帯電話ブラウザを起動して、そのリンク先であるWebサーバ70のWebページを読み込んで(ステップS78)、表示する(ステップS79)。
本検索システムを通販雑誌/カタログ誌による所謂カタログ通販で利用した場合の追加機能例を記す。
カタログ通販では、ページ一面に個々の商品写真が列記された状態のページレイアウトと1枚の写真内に多種の商品を配置した場合とがある。前者の場合は、カメラ付携帯端末10で撮影した画像内に複数の商品写真が入ってしまうことがある。そのような場合、本検索システムでは、個々の商品写真に対応した特徴量の計算を行い、それぞれの商品名及び/またはURLを次の画面で表示する。この表示方法については主に2種の方式を採用している。一つは撮影された商品の配列に併せて列挙するものと、もう一つは撮影画像のより中心に捉えられた商品写真から順に前記リストを列挙するものとである。
また通販などに限らないが、携帯電話機では基地局情報やGPS信号を利用し、ユーザの存在位置を勘案してマッチング処理部21或いはTPデータ管理DB22を自動的に位置情報によりスイッチする事で同一の写真やポスター等から別の情報(その位置でより有用な情報)を呈示することなどが可能である。
[第10具体例]
上記第9具体例において画像登録システム80で画像を登録する際、すでに登録されている画像と非常に良く似た画像を登録しようとする場合がある。このような場合、類似度を評価し、閾値以上であれば登録を拒否するのが通常である。
上記第9具体例において画像登録システム80で画像を登録する際、すでに登録されている画像と非常に良く似た画像を登録しようとする場合がある。このような場合、類似度を評価し、閾値以上であれば登録を拒否するのが通常である。
しかしながら、自社の商品写真やロゴなどの似ている画像を登録しようとした場合など、少しだけ異なる写真だが結果情報は一緒であるとしたい場合、画像が登録できないと不便である。
そこで、自分たちが登録したグループの画像であれば類似度が接近していても自分たちの責任で登録を許可することが好ましい。
図28に示すように、ユーザnが画像を登録しようとした場合、画像登録システム80に対して、登録を望む画像を入力し(ステップS81)、また、その画像に紐つく情報である結果情報を入力する(ステップS82)。このような入力を受け付けた画像登録システム80は、TPデータ管理DB22の共有データ領域に登録済みの全画像に対して類似度のチェックを行う(ステップS83)。
即ち、図29に示すように、TPデータ管理DB22は、画像を検索する範囲及び類似度をチェックする範囲として、その全ての領域である共有データ領域223を対象とする。この共有データ領域223は、個別ユーザ領域224の集合である。個別ユーザ領域224に、ユーザ毎の画像及び結果情報を登録するものである。
共有データ領域223に類似画像が無ければ(ステップS84)、ユーザnの個別ユーザ領域224へ、入力された画像及び結果情報を登録して(ステップS85)、終了する。
これに対して、共有データ領域223に類似画像が有った場合には(ステップS84)、その類似画像が当該ユーザnの個別ユーザ領域224に登録されている画像であるのか否かを判別する(ステップS86)。
例えば、ユーザAが画像a−1,a−2,a−3,…,a−nを登録し、ユーザBが画像b−1,b−2,b−3,…,b−nを登録していたとする。ここで、ユーザCが画像c−mを登録しようとしたとき、その画像c−mと類似する画像b−iが既に登録されている。このような場合には、その登録は拒否され、図30に示すような登録拒否のメッセージを表示して(ステップS87)、終了する。
これに対して、例えば、ユーザBが画像b−mを登録しようとしたとき、類似する画像b−iが存在していたならば、同一ユーザであるので(ステップS86)、図31に示すような登録確認メッセージを表示して(ステップS88)、ユーザがそれを登録するか否か確認する(ステップS89)。そして、[Cancel]が選択されたならば、終了する。[OK]が選択されたならば、当該ユーザnの個別ユーザ領域224へ、入力された画像及び結果情報を登録して(ステップS85)、終了する。
以上のように、同じユーザが登録済みの画像に似ている場合、ユーザの責任で登録を可能にする。これにより、類似した複数の画像を登録することが可能になる。これは、立体物などを多方面から撮影した画像を登録する場合、つまり、複数の画像で一つまたは複数の結果情報を得る場合に有効である。
以上、具体的な具体例と共に説明したように、本実施例に係る検索システムによれば、類似商品のカタログ写真のような場合、テンプレート化すると類似度が接近してしまうが、テンプレートを階層化させることにより、各層のテンプレートをANDしてマッチングさせることが可能となり、ミスマッチングを低減可能となる。
また、従来、多数(例えば1万件以上)のマッチング用参照データを参照しようとすると、マッチングサーバを並列化し、多数の参照データを分割してマッチングすることで時間短縮を図ろうとするやり方が考えられているが、こういったマッチングの並列処理については確率的に高速化する効果はあるものの、認識(成功)率を向上させる効果は無いことが発明者らの実験で確認されている。これに対し、本実施例に係る検索システムのようなツリー構造の場合は、結果的に高速化と認識率の向上をバランス良く達成できる。
以上、一実施例に基づいて本発明を説明したが、本発明は上述した実施例に限定されるものではなく、本発明の要旨の範囲内で種々の変形や応用が可能なことは勿論である。
Claims (4)
- 画像を入力する画像入力手段(11)と、
上記画像入力手段で入力した画像を基にして、階層管理されたテンプレートを用いて、データベース(22)から画像を検索する手段であり、上位階層のテンプレート(2221)を用いたテンプレートマッチングに続いて、下位階層のテンプレート(2222)を用いたテンプレートマッチングを行って検索画像を絞り込む検索手段(13,21)と、
上記検索手段によって絞り込まれた検索結果の画像を出力する出力手段(12)と、
を具備することを特徴とする検索システム。 - 上記階層管理されたテンプレートにおいて、上位階層のテンプレート(2221)と下位階層のテンプレート(2222)は、画像の切り出し位置が異なることを特徴とする請求項1に記載の検索システム。
- 上記階層管理されたテンプレートにおいて、上位階層のテンプレート(2221)と下位階層のテンプレート(2222)は、解像度が異なることを特徴とする請求項1に記載の検索システム。
- 画像をデータベースから検索する方法であり、
画像(41)を入力し、
入力した画像を基にして、階層管理されたテンプレートの上位階層のテンプレート(2221)を用いてテンプレートマッチングを行って、データベース(22)から画像を検索し、さらに、下位階層のテンプレート(2222)を用いたテンプレートマッチングを行って検索画像を絞り込み、
上記絞り込まれた検索結果の画像を出力する、
ことを特徴とする検索方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005192810 | 2005-06-30 | ||
JP2005192810 | 2005-06-30 | ||
PCT/JP2006/313018 WO2007004522A1 (ja) | 2005-06-30 | 2006-06-29 | 検索システム及び検索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2007004522A1 true JPWO2007004522A1 (ja) | 2009-01-29 |
Family
ID=37604389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006553381A Pending JPWO2007004522A1 (ja) | 2005-06-30 | 2006-06-29 | 検索システム及び検索方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20080095448A1 (ja) |
EP (1) | EP1772823A4 (ja) |
JP (1) | JPWO2007004522A1 (ja) |
KR (1) | KR20070118155A (ja) |
CN (1) | CN101010693A (ja) |
WO (1) | WO2007004522A1 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080140472A1 (en) * | 2006-12-12 | 2008-06-12 | Dagan Gilat | Method and Computer Program Product for Modeling an Organization |
JP5139716B2 (ja) * | 2007-05-16 | 2013-02-06 | キヤノン株式会社 | 画像検索装置及び画像検索方法 |
JP5096841B2 (ja) * | 2007-08-29 | 2012-12-12 | 日本写真印刷株式会社 | 印刷画像を利用するコンテンツ配信システム |
JP5172323B2 (ja) * | 2007-12-25 | 2013-03-27 | 宏樹 東 | 動画配信装置および携帯端末 |
JP2009251763A (ja) * | 2008-04-02 | 2009-10-29 | Nec Corp | 画像検索システム、画像検索方法、及び画象検索装置用プログラム |
JP4565015B2 (ja) * | 2008-05-15 | 2010-10-20 | シャープ株式会社 | 画像処理装置、画像形成装置、画像処理システム、画像処理プログラムおよびその記録媒体 |
US20100042469A1 (en) * | 2008-08-18 | 2010-02-18 | Microsoft Corporation | Mobile device enhanced shopping experience |
US8738647B2 (en) * | 2009-02-18 | 2014-05-27 | A9.Com, Inc. | Method and system for image matching |
JP5351084B2 (ja) * | 2010-03-16 | 2013-11-27 | 株式会社デンソーアイティーラボラトリ | 画像認識装置及び画像認識方法 |
CN102073981B (zh) * | 2011-02-23 | 2012-11-14 | 中国测绘科学研究院 | 一种关联要素限制下的点群地理实体选取方法 |
JP2012203458A (ja) * | 2011-03-23 | 2012-10-22 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
JP5773737B2 (ja) * | 2011-05-10 | 2015-09-02 | アズビル株式会社 | 照合装置 |
JP5773739B2 (ja) * | 2011-05-10 | 2015-09-02 | アズビル株式会社 | 照合装置 |
US9208392B2 (en) | 2011-09-20 | 2015-12-08 | Qualcomm Incorporated | Methods and apparatus for progressive pattern matching in a mobile environment |
EP2766873A4 (en) * | 2011-10-12 | 2015-09-02 | Qualcomm Inc | DETECTION OF COUNTERFEIT PRINTING MATERIAL BY A COMPUTER DEVICE EQUIPPED WITH A CAMERA |
JP5946315B2 (ja) * | 2012-04-18 | 2016-07-06 | 説男 木村 | 画像検索システム |
US9147275B1 (en) | 2012-11-19 | 2015-09-29 | A9.Com, Inc. | Approaches to text editing |
US9043349B1 (en) | 2012-11-29 | 2015-05-26 | A9.Com, Inc. | Image-based character recognition |
CN103034714A (zh) * | 2012-12-11 | 2013-04-10 | 北京百度网讯科技有限公司 | 移动终端的照片分类管理方法、装置和移动终端 |
US9342930B1 (en) | 2013-01-25 | 2016-05-17 | A9.Com, Inc. | Information aggregation for recognized locations |
JP6360350B2 (ja) * | 2013-08-08 | 2018-07-18 | 東芝テック株式会社 | 情報処理装置、店舗システム及びプログラム |
US9424598B1 (en) | 2013-12-02 | 2016-08-23 | A9.Com, Inc. | Visual search in a controlled shopping environment |
US9536161B1 (en) | 2014-06-17 | 2017-01-03 | Amazon Technologies, Inc. | Visual and audio recognition for scene change events |
JP6422250B2 (ja) * | 2014-07-08 | 2018-11-14 | キヤノン株式会社 | 画像処理方法、画像処理装置、プログラム及び記録媒体 |
US10024667B2 (en) * | 2014-08-01 | 2018-07-17 | Toyota Motor Engineering & Manufacturing North America, Inc. | Wearable earpiece for providing social and environmental awareness |
US9569692B2 (en) * | 2014-10-31 | 2017-02-14 | The Nielsen Company (Us), Llc | Context-based image recognition for consumer market research |
GB2533284B (en) * | 2014-12-11 | 2017-04-12 | Imagination Tech Ltd | Performing object detection |
US11030450B2 (en) * | 2018-05-31 | 2021-06-08 | Vatbox, Ltd. | System and method for determining originality of computer-generated images |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63211474A (ja) * | 1987-02-27 | 1988-09-02 | Yaskawa Electric Mfg Co Ltd | 階層化構造的テンプレ−ト・マツチング方法 |
JPH1055433A (ja) * | 1996-05-06 | 1998-02-24 | Nec Corp | 画像検索方法及び画像検索装置 |
JPH11134346A (ja) * | 1997-10-27 | 1999-05-21 | Dainippon Printing Co Ltd | 画像検索装置及び記録媒体 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5077805A (en) * | 1990-05-07 | 1991-12-31 | Eastman Kodak Company | Hybrid feature-based and template matching optical character recognition system |
US6498861B1 (en) * | 1996-12-04 | 2002-12-24 | Activcard Ireland Limited | Biometric security encryption system |
US7043061B2 (en) * | 2001-06-27 | 2006-05-09 | Laurence Hamid | Swipe imager with multiple sensing arrays |
JP2004362186A (ja) | 2003-06-04 | 2004-12-24 | Juki Corp | テンプレートマッチング方法及び装置 |
-
2006
- 2006-06-29 JP JP2006553381A patent/JPWO2007004522A1/ja active Pending
- 2006-06-29 KR KR1020077025081A patent/KR20070118155A/ko not_active Application Discontinuation
- 2006-06-29 EP EP06767635A patent/EP1772823A4/en not_active Withdrawn
- 2006-06-29 US US11/661,644 patent/US20080095448A1/en not_active Abandoned
- 2006-06-29 CN CNA2006800007324A patent/CN101010693A/zh active Pending
- 2006-06-29 WO PCT/JP2006/313018 patent/WO2007004522A1/ja active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63211474A (ja) * | 1987-02-27 | 1988-09-02 | Yaskawa Electric Mfg Co Ltd | 階層化構造的テンプレ−ト・マツチング方法 |
JPH1055433A (ja) * | 1996-05-06 | 1998-02-24 | Nec Corp | 画像検索方法及び画像検索装置 |
JPH11134346A (ja) * | 1997-10-27 | 1999-05-21 | Dainippon Printing Co Ltd | 画像検索装置及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
WO2007004522A1 (ja) | 2007-01-11 |
EP1772823A1 (en) | 2007-04-11 |
EP1772823A4 (en) | 2007-09-19 |
CN101010693A (zh) | 2007-08-01 |
US20080095448A1 (en) | 2008-04-24 |
KR20070118155A (ko) | 2007-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPWO2007004522A1 (ja) | 検索システム及び検索方法 | |
KR100980748B1 (ko) | 혼합 미디어 환경을 생성 및 사용하는 시스템 및 방법 | |
CN101292258B (zh) | 混合介质环境的创建和使用的系统和方法 | |
KR101680044B1 (ko) | 콘텐트 처리를 위한 방법들 및 시스템들 | |
US20070159522A1 (en) | Image-based contextual advertisement method and branded barcodes | |
US7672543B2 (en) | Triggering applications based on a captured text in a mixed media environment | |
CN102822817B (zh) | 用于视觉查询的可采取动作的搜索结果 | |
US7920759B2 (en) | Triggering applications for distributed action execution and use of mixed media recognition as a control input | |
JP2014241151A (ja) | 画像から得られる情報のインターネットおよびその他の検索エンジンのための検索基準としての使用 | |
US20090319388A1 (en) | Image Capture for Purchases | |
WO2018150244A1 (en) | Registering, auto generating and accessing unique word(s) including unique geotags | |
CN107018486A (zh) | 处理视觉查询的方法和系统 | |
CN101010694A (zh) | 检索系统以及检索方法 | |
EP2482210A2 (en) | System and methods for creation and use of a mixed media environment | |
KR100925907B1 (ko) | 마커 특정 장치 및 마커 특정 방법 | |
US20220197500A1 (en) | Parsing Handwriting Into Online Events | |
KR101116261B1 (ko) | 영상 해석 장치를 이용한 컨텐츠 제공 시스템 및 방법 | |
KR20210094396A (ko) | 이미지 기반 검색 어플리케이션 및 그를 위한 검색 서버 | |
KR102533699B1 (ko) | 약국 관리 제공 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110125 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110712 |