JP6460926B2 - 撮影画像に写る物体を検索するシステム及び方法 - Google Patents

撮影画像に写る物体を検索するシステム及び方法 Download PDF

Info

Publication number
JP6460926B2
JP6460926B2 JP2015128145A JP2015128145A JP6460926B2 JP 6460926 B2 JP6460926 B2 JP 6460926B2 JP 2015128145 A JP2015128145 A JP 2015128145A JP 2015128145 A JP2015128145 A JP 2015128145A JP 6460926 B2 JP6460926 B2 JP 6460926B2
Authority
JP
Japan
Prior art keywords
object search
information
terminal
search server
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015128145A
Other languages
English (en)
Other versions
JP2017010468A (ja
Inventor
康平 松▲崎▼
康平 松▲崎▼
祐介 内田
祐介 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2015128145A priority Critical patent/JP6460926B2/ja
Publication of JP2017010468A publication Critical patent/JP2017010468A/ja
Application granted granted Critical
Publication of JP6460926B2 publication Critical patent/JP6460926B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、撮影画像に写る物体を検索する技術に関する。
従来、画像から抽出された局所特徴を用いて物体を検索する技術がある(例えば非特許文献1参照)。この技術によれば、物体をカメラで撮影し、その物体が写る撮影画像(質問(クエリ)画像)から局所特徴ベクトルを抽出する。そして、質問画像の局所特徴ベクトルと、予め登録された物体が写る画像(参照(リファレンス)画像)の局所特徴ベクトルとを比較することによって、物体を検索する。また、類似度が上位N件の参照画像と質問画像との間で、幾何検証 (geometric verification)を実行することによって、検索精度を高めている。そして、幾何検証における条件を満たした特徴点対応組(inlier)の数を、新たな画像間類似度とする。
これに対して、参照画像と質問画像との両方に同一の物体が含まれているか否かを、類似度に基づいて閾値で判定したい場合もある。画像間類似度の閾値が大きいほど、認識の適合率が高くなるためである。
図1は、従来技術における端末及び物体検索サーバの機能構成図である。
図1によれば、カメラ付き携帯端末を用いて、撮影画像に写る物体を検索するシステムである。携帯端末は、撮影画像から局所特徴ベクトルを抽出し、その局所特徴ベクトルを量子化する。一方で、物体検索サーバも、大量の参照画像か局所特徴ベクトルを抽出し、その局所特徴ベクトルを量子化し、その量子化ベクトルを画像ID毎に予め記憶する。携帯端末は、撮影画像の量子化ベクトルを含む質問情報を、ネットワークを介して物体検索サーバへ送信する。物体検索サーバは、その質問情報に最も類似する参照画像を検索し、その参照画像IDを携帯端末へ返信する。これによって、携帯端末は、その撮影画像に写る物体は、その参照画像IDに基づくものであると認識することができる。
このようなサービスをリアルタイムで実行するためには、端末からネットワークを介して検索サーバへ送信する質問情報のサイズが重要となる。データサイズが大きいほど、通信時間が長くなり、リアルタイム性が損なわれる。これに対し、検索に用いる局所特徴ベクトルのサイズを小さくすることによって、送信するデータサイズを削減する技術もある(例えば特許文献1参照)。
WO2013073622A1
Philbin. J, Chum. O, Isard. M, Sivic. J, and Zisserman. A, "Object retrieval with large vocabularies and fast spatial matching," In Computer Vision and Pattern Recognition, pp.1-8, 2007.
特許文献1に記載の技術によれば、局所特徴ベクトルのサイズを削減することによって、ネットワークを介して転送されるデータサイズを削減しようとしている。一般に、局所特徴ベクトルの削減は、物体の検索精度の低下につながると考えられる。これに対し、本願の発明者らは、物体の検索精度を低下させることなく、ネットワークを介して転送されるデータサイズを削減することができないか?と考えた。特に、局所特徴の「座標情報」に対するデータサイズを削減することができないか?と考えた。
そこで、本発明は、撮影画像に写る物体を検索する際に、物体の検索精度を低下させることなく、ネットワークを介して転送される局所特徴のデータサイズを削減することができるシステム及び方法を提供することを目的とする。
本発明によれば、端末及び物体検索サーバを有するシステムの物体検索方法であって、
物体検索サーバは、物体が写る参照画像を予め蓄積しており、
端末が、物体が写る質問画像における複数の特徴ベクトルを含む質問情報を、物体検索サーバへ送信する第1のステップと、
物体検索サーバが、質問情報の複数の特徴ベクトルと各参照画像との間の類似度を算出する第2のステップと、
物体検索サーバが、質問情報と複数の参照画像との間の類似度判定結果を、端末へ返信する第3のステップと、
端末が、受信した類似度判定結果に応じて、質問画像の座標情報を含む幾何情報を選択する第4のステップと、
端末が、選択された幾何情報を、物体検索サーバへ送信する第5のステップと、
物体検索サーバが、第2のステップで検索された複数の参照画像の中で、幾何情報の座標情報に所定閾値以上で類似する1つ以上の参照画像を検索する第6のステップと、
物体検索サーバが、第5のステップによって検索された各参照画像の参照画像IDを、端末へ返信する第7のステップと
を有することを特徴とする。
本発明の物体検索方法における他の実施形態によれば、
第1のステップについて、端末は、
物体が写る質問画像から、特徴ベクトル及び座標情報を含む局所特徴を抽出するステップと、
特徴ベクトルを量子化ベクトルに量子化するステップと、
複数の量子化ベクトルを含む質問情報を、物体検索サーバへ送信するステップと
を有し、
第2のステップについて、物体検索サーバは、
質問情報の複数の量子化ベクトルと各参照画像との間の類似度を算出する
ことも好ましい。
本発明の物体検索方法における他の実施形態によれば、
質問情報に含まれる量子化ベクトルは、Visual Word識別子であることも好ましい。
本発明の物体検索方法における他の実施形態によれば、
質問情報は、Visual Word識別子に対応付けて、方向及び/又はスケールを更に含むことも好ましい。
本発明の物体検索方法における他の実施形態によれば、
第3のステップについて、物体検索サーバが、類似度判定結果として、以下の3つのコマンドのいずれか1つを、端末へ返信し、
yes1:類似度が閾値TH1以上の参照画像が1つ以上ある
yes2:類似度が閾値TH1未満且つ閾値TH2以上の参照画像が1つ以上ある
no :全ての類似度がTH2未満である
閾値TH1:検索成功の可能性が極めて高い類似度の指標
閾値TH2:検索成功の可能性が比較的高い類似度の指標
第4のステップについて、端末が、類似度判定結果に応じて、物体検索サーバへ送信する幾何情報を以下のように制御する
yes1:幾何情報は、座標情報のみを含む
yes2:幾何情報は、座標情報及び特徴ベクトルを含む
no :検索失敗として、処理を終了する
ことも好ましい。
本発明の物体検索方法における他の実施形態によれば、
第3のステップについて、物体検索サーバが、類似度判定結果として、3つ以上の閾値によって4つ以上のコマンドのいずれか1つを、端末へ返信し、
第4のステップについて、端末が、類似度判定結果に基づく閾値が低いほど、長い特徴ベクトル(特徴ベクトルの上位ビットのみ->全体ビット)を幾何情報に含める
ことも好ましい。
本発明の物体検索方法における他の実施形態によれば、
第6のステップについて、物体検索サーバは、
幾何情報の座標情報と、各参照画像の座標情報との間で、幾何的な所定条件を満たす特徴点対応組を算出し、
特徴点対応組の数が最大又は所定数以上となる参照画像を検索する
ことも好ましい。
本発明によれば、端末及び物体検索サーバを有するシステムであって、
端末は、
物体が写る質問画像における複数の特徴ベクトルを含む質問情報を、物体検索サーバへ送信する質問情報送信手段と、
受信した類似度判定結果に応じて、質問画像の座標情報を含む幾何情報を選択する幾何情報選択手段と、
選択された幾何情報を、物体検索サーバへ送信する幾何情報送信手段と
を有し、
物体検索サーバは、物体が写る参照画像を予め蓄積しており、
質問情報の複数の特徴ベクトルと各参照画像との間の類似度を算出する類似度算出手段と、
質問情報と複数の参照画像との間の類似度判定結果を、端末へ返信する類似度判定送信手段と、
類似度判定結果によって類似すると判定された複数の参照画像の中で、幾何情報の座標情報に所定閾値以上で類似する1つ以上の参照画像を検索する幾何検証手段と、
幾何検証手段によって検索された各参照画像の参照画像IDを、端末へ返信する検索結果送信手段と
を有することを特徴とする。
本発明のシステム及び方法によれば、撮影画像に写る物体を検索する際に、物体の検索精度を低下させることなく、ネットワークを介して転送される局所特徴のデータサイズを削減することができる。
従来技術における端末及び物体検索サーバの機能構成図である。 本発明における端末及び物体検索サーバの機能構成図である。 本発明における端末及び物体検索サーバ間のシーケンス図である。 転置インデックスを表す説明図である。 質問画像と参照画像との間のマッチングを表す説明図である。 質問画像と参照画像との間におけるVWID(量子化ベクトル)の類似度を表す説明図である。 質問画像と参照画像との間における幾何的な特徴点対応組を表す説明図である。 本発明における他のシステム構成図である。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図2は、本発明における端末及び物体検索サーバの機能構成図である。
図3は、本発明における端末及び物体検索サーバ間のシーケンス図である。
本発明は、端末1及び物体検索サーバ2を有するシステムによって、撮影画像に写る物体を検索することができる。端末1は、例えばスマートフォンや携帯電話機であって、一般的にカメラを搭載したものである。カメラに対するユーザ操作に応じて、様々な物体が写る撮影画像を取得することができる。一方で、物体検索サーバ2は、物体が写る参照画像を予め蓄積している。そして、端末1は、ネットワークを介して物体検索サーバ2と通信することによって、その撮影画像に写り込む物体を識別することができる。
図2によれば、端末1は、局所特徴抽出部11と、量子化部12と、幾何情報蓄積部13と、質問情報送信部14と、幾何情報選択部15と、幾何情報送信部16とを有する。これら機能構成部は、端末に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
また、端末1と通信する物体検索サーバ2は、局所特徴抽出部21と、量子化部22と、幾何情報蓄積部23と、転置インデックス記憶部24と、類似度算出部25と、類似度判定送信部26と、幾何検証部27と、検索結果送信部28とを有する。これら機能構成部は、サーバに搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
以下では、図3のシーケンスに沿って、図2の各機能構成部について説明する。
従来技術によれば、質問画像に写る物体の検索は、図1のように1段階のシーケンスで実行される。これに対し、本発明は、2段階のシーケンスで実行される。1段階目では、質問画像に対して、特徴ベクトル的に類似する複数の参照画像を検索し、2段階目で、それら参照画像の中で、幾何的に類似する参照画像を更に検索する。
<S01>[端末1:局所特徴抽出部11]
局所特徴抽出部11は、カメラによる撮影画像を入力し、その画像における局所特徴を抽出する。局所特徴は、特徴点位置を、例えば以下の要素によって表す。
特徴ベクトル:f(例えば4byte)
座標:p=(x,y)(例えば4byte(x(2byte)y(2byte))
方向:θ
スケール:s
本発明によって抽出される局所特徴は、少なくとも特徴ベクトル及び座標情報を含む。
通常、1枚の画像から検出された局所特徴群は、配列上に格納され、その配列の添え字を「局所特徴ID」として識別する。また、局所特徴の特徴ベクトルfは、量子化部12へ出力される。
物体認識に用いる特徴ベクトルの抽出アルゴリズムとしては、例えばSIFTやSURF(Speeded Up Robust Features)、ORB(Oriented FAST and Rotated BRIEF)が用いられる。例えば、SIFTの場合、1枚の画像からは128次元の特徴ベクトルの集合が抽出される。SIFTとは、スケールスペースを用いて特徴的な局所領域を解析し、そのスケール変化及び回転に不変となる特徴ベクトルを記述する技術である。一方で、SURFの場合、SIFTよりも高速処理が可能であって、1枚の画像から64次元の特徴ベクトルの集合が抽出される。ORBによれば、1つのコンテンツから256ビットのバイナリ局所特徴ベクトルの集合が抽出される。
<S02>[端末1:量子化部12]
量子化部12は、局所特徴抽出部11から特徴ベクトルfを入力する。また、量子化部12は、Visual Word(VW)と称される複数の量子化ベクトルを予め記憶している。これら量子化ベクトルは、コードブックとして記憶されている。そして、量子化部12は、特徴ベクトルfに最も距離が近くなる(類似する)VWのID(VWID)へ量子化する。ここで、VWIDは、最も近い1個であってもよいし、距離が近い上位N件のものであってもよい。特徴ベクトルf毎にVWIDを抽出し、それらVWID群は、量子化結果として、質問情報送信部14へ出力される。
<S03>[端末1:幾何情報蓄積部13]
幾何情報蓄積部13は、局所特徴抽出部11から局所特徴群を入力する。そして、幾何情報蓄積部13は、局所特徴IDの順に、幾何情報をリスト構造で蓄積する。幾何情報は、座標情報pとマッチング情報とを結合したものである。マッチング情報は、VWIDであってもよいし、特徴ベクトルであってもよい(特徴ベクトルの全体、特徴ベクトルの一部、又は、符号化された特徴ベクトルであってもよい)。尚、幾何情報蓄積部13は、幾何情報の蓄積後、所定時間経過した際に、その幾何情報を破棄することも好ましい。
[物体検索サーバ2:局所特徴抽出部21]
局所特徴抽出部21は、物体が写る多数の参照画像を入力し、各参照画像における局所特徴を抽出する。その機能は、前述した端末1の局所特徴抽出部11と全く同様である。抽出した特徴ベクトルは、量子化部22へ出力される。
[物体検索サーバ2:量子化部22]
量子化部22は、局所特徴抽出部21から特徴ベクトルfを入力し、コードブックを用いて、VWIDへ量子化する。その機能は、前述した端末1の量子化部12と全く同様である。量子化結果としてのVWIDの群は、幾何情報蓄積部23及び転置インデックス記憶部24へ出力される。
[物体検索サーバ2:幾何情報蓄積部23]
幾何情報蓄積部23は、局所特徴抽出部21から局所特徴群を入力する。その機能は、前述した端末1の幾何情報蓄積部23と全く同様である。
[物体検索サーバ2:転置インデックス記憶部24]
転置インデックス記憶部24は、VWID(単語ID)毎に、参照画像ID及び局所特徴の情報を対応付けてリスト構造で記憶する。
図4は、転置インデックスを表す説明図である。
図4によれば、VWID毎に、参照画像ID及び局所特徴の情報が対応付けられている。局所特徴の情報として、特徴ベクトルf、座標情報p、方向θ、スケールsを含む。
図5は、質問画像と参照画像との間のマッチングを表す説明図である。
図5(a)は、参照画像に対して、質問画像の視点が異なっていることを表す。そのたに、質問画像に写る物体は、参照画像に写る物体に対して、幾何的に変換されている。
図5(b)は、質問画像及び参照画像から抽出された局所特徴が表されている。局所特徴としては、少なくとも特徴ベクトルf及び座標情報pがあり、更に方向θ及びスケールsがあってもよい。
図5(c)は、質問画像及び参照画像から抽出された特徴点同士のマッチングが表されている。マッチングする特徴点対応組が多いほど、幾何的な類似度が高い。
<S1>[端末1:質問情報送信部14]
質問情報送信部14は、物体が写る質問画像における複数の量子化ベクトル(特徴ベクトル)を含む質問情報を、物体検索サーバ2へ送信する。ここで、量子化ベクトルは、VWID(Visual Word識別子)であることが好ましい。質問情報は、量子化部12から出力されたVWIDを、局所特徴IDの順に並べた質問情報を生成する。即ち、質問情報は、VWIDの群となる。尚、Hamming embeddingやWeak geometry consistencyを用いる場合、質問情報は、Visual Word識別子に対応付けて、方向θ及び/又はスケールsを更に含むものであってもよい。
質問画像に写る物体の検索は、従来技術によれば、図1のように1段階のシーケンスで実行されるのに対し、本発明は、2段階のシーケンスで実行される。
1段階目:質問画像のVWID群に類似する複数の参照画像を検索する
(質問情報に座標情報を含まない。投票による類似度を算出)
2段階目:検索された参照画像の中で、質問情報の幾何情報に類似する参照画像を
更に検索する
(1段階目で類似度が閾値以上である場合にのみ、幾何検証を実行)
例えば、従来技術によれば、質問情報が特徴ベクトル+座標情報である場合、8byte必要となる。これに対し、本発明によれば、1段階目では、質問情報がVWIDのみであえるために、その半分の4byteしか必要とならない。即ち、質問情報のデータサイズを5割削減することができる。
また、1段階目のシーケンスの実行によって、類似する参照画像無しと判定された場合、2段階目のシーケンスを実行する必要がない。即ち、物体検索サービスを継続するほど、ネットワークを介して送受信されるデータサイズは、必然的に減少することとなる。
<S2>[サーバ2:類似度算出部25]
類似度算出部25は、転置インデックス記憶部24を用いて、質問情報の複数の量子化ベクトルと各参照画像との間の「類似度」を算出する。具体的には、多数の参照画像のVWID群と、受信した質問情報に含まれるVWID群とを比較して、類似度を算出する。
図6は、質問画像と参照画像との間におけるVWID(量子化ベクトル)の類似度を表す説明図である。
ここでは、質問情報に含まれる各VWIDに対応する、転置インデックスのリストに含まれる参照画像IDに対して、スコアを投票する(図4参照)。投票するスコアは、固定の大きさであってもよいし、何らかの重み付けをしてもよい。投票されたスコアが大きいほど、質問画像と参照画像との間の類似度が高いことを意味する。
転置インデックスは、参照画像毎に総VW数に差があるために、投票したスコア同士の大きさを比較することは難しい。そのため、参照画像毎の類似度スコアを、各参照画像のVWヒストグラムのLpノルムで除算することによって正規化することも好ましい。
VWIDiに対して、以下のように設定したとする。
xi:参照画像の局所特徴が割り当てられた個数
n:予め用意されたVWの個数
ここで、参照画像のVWヒストグラムは、以下のように表される。
ベクトルx=(x1,x2,・・・,xn
このとき、例えば参照画像のVWヒストグラムのノルムは、以下のように表される。
L1ノルム:Σi=1 n|xi
:参照画像のVWヒストグラムにおける、各VWに量子化された局所
特徴の個数の総和
L2ノルム:√(Σi=1 ni 2)
:各VWに量子化された局所特徴の個数の二乗和の平方根
参照画像ID毎に、L1ノルムの逆数、L2ノルムの逆数、又は、他の正規化係数を乗算することによって、類似度を正規化する。最終的に、全ての参照画像IDに対応する類似度を算出する。
<S3>[物体検索サーバ2:類似度判定送信部26]
類似度判定送信部26は、質問情報と複数の参照画像との間の類似度判定結果を、端末1へ返信する。類似度判定結果は、質問情報に対する全ての参照画像IDの類似度に対して、閾値で判定する。例えば、類似判定結果は、以下のように2つの閾値に対する3つのコマンドで表される。
(コマンド)
yes1:類似度が閾値TH1以上の参照画像が1つ以上ある
yes2:類似度が閾値TH1未満且つ閾値TH2以上の参照画像が1つ以上ある
no :全ての類似度がTH2未満である
閾値TH1:検索成功の可能性が極めて高い類似度の指標
閾値TH2:検索成功の可能性が比較的高い類似度の指標
コマンド「yes1」「yes2」の場合、類似度判定送信部26は、コマンドと共に、その判定条件を満たした参照画像IDも、端末1へ送信する。
また、コマンド「no」の場合、類似度判定送信部26は、検索失敗とみなして、そのコマンドのみを、端末1へ送信する。これによって、端末1は、2段階目のシーケンスを実行することなく、「検索失敗」として終了することができる。
尚、類似度判定結果として、3つ以上の閾値によって4つ以上のコマンドのいずれかを、端末へ返信するものであってもよい。また、参照画像IDの個数は、類似度が大きい順に所定N個であってもよいし、全てであってもよい。
<S4>[端末1:幾何情報選択部15]
幾何情報選択部15は、物体検索サーバ2から、類似度判定結果を受信する。そして、その類似度判定結果に応じて、質問画像の座標情報を含む幾何情報を選択する。具体的には、物体検索サーバ2へ送信する幾何情報を以下のように制御する。
(受信コマンド)
yes1:幾何情報は、座標情報のみを含む
yes2:幾何情報は、座標情報及び特徴ベクトルを含む
no :検索失敗として、処理を終了する
ここで、幾何情報選択部15は、類似度判定結果に基づく閾値が低いほど、長い特徴ベクトル(特徴ベクトルの上位ビットのみ->全体ビット)を幾何情報に含めることも好ましい。
(受信コマンド)
yes1(判定閾値が高い):幾何情報は、座標情報のみを含む
yes2 :幾何情報は、座標情報、及び特徴ベクトルの一部を含む
yes3(判定閾値が低い):幾何情報は、座標情報、及び特徴ベクトルの全部を含む
no :保持していた幾何情報を、時間tの経過後に破棄
<S5>[端末1:幾何情報送信部16]
幾何情報送信部16は、質問画像の座標情報を含む幾何情報を、物体検索サーバ2へ送信する。
<S6>[物体検索サーバ2:幾何検証部27]
幾何検証部27は、類似度判定結果によって類似すると判定された複数の参照画像の中で、幾何情報の座標情報に所定閾値以上で類似する1つ以上の参照画像を検索する(図4、図5(c)参照)。具体的には、幾何情報の座標情報と、各参照画像の座標情報との間で、幾何的な所定条件を満たす特徴点対応組(inlier)を算出する。そして、特徴点対応組の数が最大又は所定数以上となる参照画像を検索する。
最初に、座標マッチングによって、同一のVWIDに量子化された局所特徴の座標情報同士をマッチングさせた特徴点対応組を算出する。例えば、特徴ベクトルfの距離が最も近いもの同士をマッチングさせてもよい。
次に、マッチングされた特徴点対応組に対して、RANSAC(RANdom SAmple Consensus) アルゴリズム等のロバスト推定法を用いて、一方の座標系から他方の座標系へのHomography行列を算出する。
次に、Homography行列を用いて一方の特徴点の座標を射影し、対応している他方の特徴点の座標との距離がL以内であれば、その特徴点対応組をinlierと判定する。
そして、inlierの数が所定閾値以上となる参照画像のみを、「検索成功」として判定する。但し、inlierの数が所定閾値以上となる参照画像が無い場合、「検索失敗」と判定する。
尚、Homography行列に代えて、Affine行列や基礎行列など、幾何学的変換に基づく行列を用いてもよい。
図7は、質問画像と参照画像との間における幾何的な特徴点対応組を表す説明図である。
図7(a)は、質問画像と参照画像との間における特徴点対応組を表す。
図7(b)は、Homography行列に基づくinlier及びoutlierの画像対応を表す。outlierは、破線で表されている。
<S7>[物体検索サーバ2:検索結果送信部28]
検索結果送信部28は、幾何検証部27によって検索された各参照画像の参照画像IDを、端末1へ返信する。
図8は、本発明における他のシステム構成図である。
図8によれば、図2の物体検索サーバが、類似度判定サーバ及び幾何検証サーバとして個別に配置されたものである。このように別個のサーバに構築することによって、各サーバの処理負荷を軽減させることができる。
この場合、S3(物体検索サーバの類似度判定送信部)について、物体検索サーバ2は、類似度判定結果と共に、複数の参照画像IDも、端末1へ返信する。
次に、S5(端末の幾何情報送信部)について、端末1は、幾何情報と共に、先に受信した参照画像IDも送信する。
そして、S6(物体検索サーバの幾何検証部)について、物体検索サーバ2は、端末1から受信した複数の参照画像IDの中で、幾何検証の処理を実行すればよい。
以上、詳細に説明したように、本発明のシステム及び方法によれば、撮影画像に写る物体を検索する際に、物体の検索精度を低下させることなく、ネットワークを介して転送される局所特徴のデータサイズを削減することができる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 端末
11 局所特徴抽出部
12 量子化部
13 幾何情報蓄積部
14 質問情報送信部
15 幾何情報選択部
16 幾何情報送信部
2 物体検索サーバ
21 局所特徴抽出部
22 量子化部
23 幾何情報蓄積部
24 転置インデックス記憶部
25 類似度算出部
26 類似度判定送信部
27 幾何検証部
28 検索結果送信部

Claims (8)

  1. 端末及び物体検索サーバを有するシステムの物体検索方法であって、
    前記物体検索サーバは、物体が写る参照画像を予め蓄積しており、
    前記端末が、物体が写る質問画像における複数の特徴ベクトルを含む質問情報を、前記物体検索サーバへ送信する第1のステップと、
    前記物体検索サーバが、前記質問情報の複数の特徴ベクトルと各参照画像との間の類似度を算出する第2のステップと、
    前記物体検索サーバが、前記質問情報と複数の参照画像との間の類似度判定結果を、前記端末へ返信する第3のステップと、
    前記端末が、受信した前記類似度判定結果に応じて、前記質問画像の座標情報を含む幾何情報を選択する第4のステップと、
    前記端末が、選択された前記幾何情報を、前記物体検索サーバへ送信する第5のステップと、
    前記物体検索サーバが、第2のステップで検索された複数の参照画像の中で、前記幾何情報の座標情報に所定閾値以上で類似する1つ以上の参照画像を検索する第6のステップと、
    前記物体検索サーバが、第5のステップによって検索された各参照画像の参照画像IDを、前記端末へ返信する第7のステップと
    を有することを特徴とする物体検索方法。
  2. 第1のステップについて、前記端末は、
    物体が写る質問画像から、特徴ベクトル及び座標情報を含む局所特徴を抽出するステップと、
    前記特徴ベクトルを量子化ベクトルに量子化するステップと、
    複数の量子化ベクトルを含む質問情報を、前記物体検索サーバへ送信するステップと
    を有し、
    第2のステップについて、前記物体検索サーバは、
    前記質問情報の複数の量子化ベクトルと各参照画像との間の類似度を算出する
    ことを特徴とする請求項1に記載の物体検索方法。
  3. 前記質問情報に含まれる前記量子化ベクトルは、Visual Word識別子である
    ことを特徴とする請求項2に記載の物体検索方法。
  4. 前記質問情報は、Visual Word識別子に対応付けて、方向及び/又はスケールを更に含む
    ことを特徴とする請求項3に記載の物体検索方法。
  5. 第3のステップについて、前記物体検索サーバが、前記類似度判定結果として、以下の3つのコマンドのいずれか1つを、前記端末へ返信し、
    yes1:類似度が閾値TH1以上の参照画像が1つ以上ある
    yes2:類似度が閾値TH1未満且つ閾値TH2以上の参照画像が1つ以上ある
    no :全ての類似度がTH2未満である
    閾値TH1:検索成功の可能性が極めて高い類似度の指標
    閾値TH2:検索成功の可能性が比較的高い類似度の指標
    第4のステップについて、前記端末が、前記類似度判定結果に応じて、前記物体検索サーバへ送信する前記幾何情報を以下のように制御する
    yes1:幾何情報は、座標情報のみを含む
    yes2:幾何情報は、座標情報及び特徴ベクトルを含む
    no :検索失敗として、処理を終了する
    ことを特徴とする請求項2から4のいずれか1項に記載の物体検索方法。
  6. 第3のステップについて、前記物体検索サーバが、前記類似度判定結果として、3つ以上の閾値によって4つ以上のコマンドのいずれか1つを、前記端末へ返信し、
    第4のステップについて、前記端末が、類似度判定結果に基づく閾値が低いほど、長い特徴ベクトル(特徴ベクトルの上位ビットのみ->全体ビット)を前記幾何情報に含める
    ことを特徴とする請求項5に記載の物体検索方法。
  7. 第6のステップについて、前記物体検索サーバは、
    前記幾何情報の座標情報と、各参照画像の座標情報との間で、幾何的な所定条件を満たす特徴点対応組を算出し、
    前記特徴点対応組の数が最大又は所定数以上となる参照画像を検索する
    ことを特徴とする請求項1から6のいずれか1項に記載の物体検索方法。
  8. 端末及び物体検索サーバを有するシステムであって、
    前記端末は、
    物体が写る質問画像における複数の特徴ベクトルを含む質問情報を、前記物体検索サーバへ送信する質問情報送信手段と、
    受信した類似度判定結果に応じて、前記質問画像の座標情報を含む幾何情報を選択する幾何情報選択手段と、
    選択された前記幾何情報を、前記物体検索サーバへ送信する幾何情報送信手段と
    を有し、
    前記物体検索サーバは、物体が写る参照画像を予め蓄積しており、
    前記質問情報の複数の特徴ベクトルと各参照画像との間の類似度を算出する類似度算出手段と、
    前記質問情報と複数の参照画像との間の類似度判定結果を、前記端末へ返信する類似度判定送信手段と、
    前記類似度判定結果によって類似すると判定された複数の参照画像の中で、前記幾何情報の座標情報に所定閾値以上で類似する1つ以上の参照画像を検索する幾何検証手段と、
    前記幾何検証手段によって検索された各参照画像の参照画像IDを、前記端末へ返信する検索結果送信手段と
    を有することを特徴とするシステム。
JP2015128145A 2015-06-25 2015-06-25 撮影画像に写る物体を検索するシステム及び方法 Active JP6460926B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015128145A JP6460926B2 (ja) 2015-06-25 2015-06-25 撮影画像に写る物体を検索するシステム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015128145A JP6460926B2 (ja) 2015-06-25 2015-06-25 撮影画像に写る物体を検索するシステム及び方法

Publications (2)

Publication Number Publication Date
JP2017010468A JP2017010468A (ja) 2017-01-12
JP6460926B2 true JP6460926B2 (ja) 2019-01-30

Family

ID=57763708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015128145A Active JP6460926B2 (ja) 2015-06-25 2015-06-25 撮影画像に写る物体を検索するシステム及び方法

Country Status (1)

Country Link
JP (1) JP6460926B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7091055B2 (ja) * 2017-09-19 2022-06-27 ヤフー株式会社 検索装置、検索方法および検索プログラム
JP6974222B2 (ja) * 2018-03-15 2021-12-01 ヤフー株式会社 検索装置、検索方法および検索プログラム
AU2018427622B2 (en) 2018-06-13 2021-12-02 Fujitsu Limited Acquiring method, generating method acquiring program, generating program, and information processing apparatus
CN110929764A (zh) * 2019-10-31 2020-03-27 北京三快在线科技有限公司 图片审核方法和装置,电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004240751A (ja) * 2003-02-06 2004-08-26 Canon Inc 画像検索装置
JP5200015B2 (ja) * 2007-06-14 2013-05-15 パナソニック株式会社 画像認識装置及び画像認識方法
JP5231839B2 (ja) * 2008-03-11 2013-07-10 株式会社東芝 パターン認識装置及びその方法
JP2011221688A (ja) * 2010-04-07 2011-11-04 Sony Corp 認識装置、認識方法、およびプログラム
JP5862243B2 (ja) * 2011-11-30 2016-02-16 キヤノンマーケティングジャパン株式会社 情報処理装置、及びその制御方法、プログラム
JP5520353B2 (ja) * 2012-09-03 2014-06-11 ヤフー株式会社 BoF表現生成装置及びBoF表現生成方法

Also Published As

Publication number Publication date
JP2017010468A (ja) 2017-01-12

Similar Documents

Publication Publication Date Title
Melekhov et al. Siamese network features for image matching
Sykora et al. Comparison of SIFT and SURF methods for use on hand gesture recognition based on depth map
JP6041439B2 (ja) 画像に基づくバイナリ特徴ベクトルを用いた画像検索装置、システム、プログラム及び方法
US20190385001A1 (en) Data extraction using neural networks
CN109190470B (zh) 行人重识别方法及装置
JP6211407B2 (ja) 画像検索システム、画像検索装置、検索サーバ装置、画像検索方法、及び画像検索プログラム
JP5563494B2 (ja) 対応参照画像検索装置及び方法、コンテンツ重畳装置、システム、及び方法、並びにコンピュータプログラム
CN110147710B (zh) 人脸特征的处理方法、装置和存储介质
JP6460926B2 (ja) 撮影画像に写る物体を検索するシステム及び方法
JP6997369B2 (ja) プログラム、測距方法、及び測距装置
CN110598603A (zh) 人脸识别模型获取方法、装置、设备和介质
CN110163061B (zh) 用于提取视频指纹的方法、装置、设备和计算机可读介质
CN105183746B (zh) 从多相关图片中挖掘显著特征实现图像检索的方法
JP6042778B2 (ja) 画像に基づくバイナリ局所特徴ベクトルを用いた検索装置、システム、プログラム及び方法
KR20200020107A (ko) 기계학습을 이용한 획 기반 수기 서명 인증 방법 및 시스템
JP6338274B2 (ja) 情報処理装置ならびにその特徴点選択方法、装置およびプログラム
JP6035173B2 (ja) 画像検索システム及び画像検索方法
CN113254687B (zh) 图像检索、图像量化模型训练方法、装置和存储介质
JP6758250B2 (ja) 局所特徴表現学習装置、及び方法
CN111666965B (zh) 改进图像识别的多级别深度特征和多匹配器融合
EP3192010A1 (en) Image recognition using descriptor pruning
JP6601965B2 (ja) 探索木を用いて量子化するプログラム、装置及び方法
JP5959446B2 (ja) コンテンツをバイナリ特徴ベクトルの集合で表現することによって高速に検索する検索装置、プログラム及び方法
JP6482505B2 (ja) 検証装置、方法、及びプログラム
JP2014225168A (ja) 特徴点集合で表される画像間の類似度を算出するプログラム、装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181225

R150 Certificate of patent or registration of utility model

Ref document number: 6460926

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150