JP6403201B2 - 画像特徴量登録装置、方法及びプログラム - Google Patents
画像特徴量登録装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6403201B2 JP6403201B2 JP2014259155A JP2014259155A JP6403201B2 JP 6403201 B2 JP6403201 B2 JP 6403201B2 JP 2014259155 A JP2014259155 A JP 2014259155A JP 2014259155 A JP2014259155 A JP 2014259155A JP 6403201 B2 JP6403201 B2 JP 6403201B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- vwid
- image
- rkpid
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Description
変換画像作成部11は、参照画像の入力を受けて、参照画像を1つ以上の様々な距離や様々な方向から観察されたように、仮想的なスクリーンに透視投影された学習画像を作成し、特徴点検出部12に出力する。具体的には、参照画像の周囲に仮想的な視点を滞りなく配置し、視野角等の透視投影パラメータを所定の設定として射影変換行列を算出し、その射影変換行列を用いて参照画像を射影変換する。なお、この際算出された射影変換行列は、生成された学習画像のIDと共に変換行列記憶部15に記憶される。
特徴点検出部12は、参照画像及び当該参照画像より変換画像作成部11で作成された一連の学習画像を入力として受けて、当該入力画像のそれぞれから特徴点検出器を用いて特徴点を検出し、座標マッチング部13へ出力する。特徴点検出器には、一般的に知られているSIFTやSURF、FAST等といったアルゴリズムを利用することができる。なお、通常一枚の画像から検出された特徴点群は、プログラム上では配列に格納され、その配列の添え字を特徴点IDとして識別することができる。
座標マッチング部13では、特徴点検出部12により参照画像と学習画像の各々とからそれぞれ検出された特徴点と、変換行列記憶部15に記憶された当該学習画像に紐づく射影変換行列と、を入力として受けて、参照画像及び各学習画像における特徴点同士をマッチングし、当該マッチング結果を局所特徴量記述部14へと出力する。
局所特徴量記述部14は、学習画像と、特徴点検出部12で検出され座標マッチング部13にてマッチングされた当該学習画像における特徴点の座標と、を入力として受けて、特徴量抽出器を用いて当該特徴点位置における当該学習画像の局所的な特徴を局所特徴と呼ばれるベクトル形式で抽出し、量子化部21へと出力する。
変換行列記憶部15は、変換画像作成部11の前記出力を記憶し、座標マッチング部13における参照に供する。
量子化部21は、局所特徴量記述部14で記述された特徴ベクトルfおよびオリエンテーションθ,スケールsを入力として受け、予め用意された代表ベクトルのうち、特徴ベクトルfとの距離が最も近くなるもののID (vwID) を出力する。ここで、出力される特徴ベクトルのIDは特徴ベクトルfとの距離が最も近いもののみであってもよいし、距離の近い上位k件(kは所定数)であってもよい。
スコア算出部22は、学習特徴量記憶部26に記憶されたvwIDとrkpIDの一連のペア(以降、各ペアを(vwID, rkpID)と表記する)の入力を受け、vwIDとrkpIDの2次元ヒストグラムに投票を行う。すなわち、ペア(vwID, rkpID)が学習特徴量記憶部26に記憶されている個数を当該ペアの得票数として求め、当該得票数をペア(vwID, rkpID)の持つスコア値score(vwID, rkpID)として第一ソーティング部23へと出力する。
第一ソーティング部23は、ペア(vwID, rkpID)及びそれに紐づくスコア値score(vwID, rkpID)を1セットとする時、スコア算出部22の出力を一連のセットの入力として受け、同一のvwIDを持つセット群に対して、スコア値の大きい順にソーティングを行い、当該ソーティング結果を段階ID付与部24へと出力する。
段階ID付与部24は、第一ソーティング部23でソートされた、同一vwIDを持つセット群に対して,並び順の段階ID (以降、stepIDと表記する) を紐づけたうえで、第二ソーティング部25へと出力する。すなわち、あるvwID[i]を持つセットに関して大きい側からj(j=0, 1, 2, …)番目のスコア値を与えるrkpIDをrkpID[i,j]とすると、ペア(vwID[i], rkpID[i, j])及びそのスコアscore(vwID[i], rkpID[i, j])のセットにはstepIDとして「j」を紐付けることができる。(なお、jは最小値0から開始するものとしているが、1などその他の値を最小値としてもよい。)
第二ソーティング部25は、stepIDと(rkpID,vwID)のペア(以降、ペア(stepID, rkpID, vwID)と表記する)及びそれに紐づくスコア値score(stepID, rkpID, vwID)を1セットとすると、段階ID付与部24の出力を一連のセットの入力として受け、同一のstepIDを持つセット群に対して,スコア値の大きい順にソーティングを行う。当該ソーティング結果は、後述する図7のフローチャートにおける登録順序を決定するための情報として、データ登録部31及び特徴量平均化部32へと出力される。
学習特徴量記憶部26は、量子化部21の前記出力を記憶し、スコア算出部22及び特徴量平均化部32における参照に供する。
特徴量平均化部32は、vwIDとrkpIDのペアの入力を受け、学習特徴量記憶部26に蓄積された当該ペアに紐づく1つ以上の特徴ベクトルfおよびオリエンテーションθ,スケールsの平均値を算出する。平均として算出された特徴量fはさらに、量子化してvwIDを求めたうえで、ヒストグラムに登録することができる。オリエンテーションθ及びスケールsについては、ヒストグラムとは別途の情報として利用することができる。
データ登録部31は、vwIDとrkpIDのペアの入力を受け、そのままデータベースにデータを登録することができる。すなわち、ヒストグラムにおいて当該ペアにおけるvwIDの頻度を、当該rkpIDの寄与によって1だけインクリメントして登録することができる。vwIDとrkpIDのペアの入力を受ける順番は特徴量平均化部32におけるのと同様の順番とすることができ、その詳細は図7を参照して後述する。
Claims (10)
- 認識対象を撮影した参照画像と、当該認識対象を前記参照画像と異なる視点から撮影した一連の学習画像において、前記参照画像における認識対象から局所特徴が抽出される箇所に対応する箇所より抽出された局所特徴と、を入力とし、前記参照画像の特徴量としてのVW(ビジュアルワード)ヒストグラムを出力する画像特徴量登録装置であって、
前記入力された局所特徴における特徴ベクトルを代表ベクトルに量子化し、前記学習画像の特徴点に代表ベクトルのID(以下、vwIDとする。)を付与すると共に、当該vwIDに対応する前記参照画像の特徴点ID(以下、rkpIDとする。)を紐付けることでvwID及びrkpIDのペアを生成する量子化部と、
前記生成されたvwID及びrkpIDのペアの個数をカウントすることで、当該ペアのスコアを算出するスコア算出部と、を備え、
前記算出されたスコアが高いrkpIDを優先しながら、且つ、頻度をインクリメントされるvwIDが偏らないようにしながら、所定のデータサイズ制限に到達するまで順次、前記生成されたvwID及びrkpIDのペアを選択して対応するvwIDの頻度をインクリメントすることで、前記VWヒストグラムを構築することを特徴とする画像特徴量登録装置。 - 前記生成されたvwID及びrkpIDのペアを、vwIDが共通となるペアごとに、前記算出されたスコアの降順に並び替える第一ソーティング部と、
前記並び替えられた順番に従って前記vwID及びrkpIDのペアに段階IDを付与する段階ID付与部と、
前記vwID及びrkpIDのペアを、前記付与された段階IDが共通となるペアごとに、前記算出されたスコアの降順に並び替える第二ソーティング部と、をさらに備え、
前記VWヒストグラムを構築する際に前記生成されたvwID及びrkpIDのペアを選択する順番を、前記第二ソーティング部にて並び替えた結果に基づいて定めることを特徴とする請求項1に記載の画像特徴量登録装置。 - 前記選択する順番が、前記付与された段階IDが小さいペアを優先し、且つ、当該段階IDが共通となるペアにおいては、前記算出されたスコアが高いペアを優先することにより定められることを特徴とする請求項2に記載の画像特徴量登録装置。
- 前記生成されたvwID及びrkpIDのペアを選択してから、前記頻度がインクリメントされる対応するvwIDを決定する特徴量平均化部をさらに備え、
前記特徴量平均化部は、前記選択されたvwID及びrkpIDのペアに対応する一連の局所特徴を平均したうえで量子化することで、前記頻度がインクリメントされる対応するvwIDを求めることを特徴とする請求項1ないし3のいずれかに記載の画像特徴量登録装置。 - 前記特徴量平均化部は、前記局所特徴における特徴ベクトルを、次元ごとに平均値をとって並べることで平均特徴ベクトルを作成する、または、
前記局所特徴における特徴ベクトルはバイナリコードで表現されるものであり、前記特徴量平均化部は、当該バイナリコードで表現される特徴ベクトルを、次元ごとに平均値をとった上で四捨五入して並べることで平均特徴ベクトルを算出する、または、
前記特徴量平均化部は、前記局所特徴におけるオリエンテーションを、長さ1のベクトルで表現した上で当該ベクトルを合成し、合成されたベクトルを角度に変換することで平均オリエンテーションを算出する、または、
前記特徴量平均化部は、前記局所特徴におけるスケールの平均値を取り、予め定められた離散的なスケールの中で最も近いものに割り当てることで平均スケールを算出する、ことを特徴とする請求項4に記載の画像特徴量登録装置。 - 前記入力される局所特徴を記述するために、
前記参照画像を一連の仮想視点から撮影したようにそれぞれ変換することで一連の学習画像を作成する変換画像作成部と、
前記参照画像と前記学習画像の各々とより特徴点を検出する特徴点検出部と、
前記検出された特徴点に対して、前記変換の逆で前記参照画像における位置に前記参照画像より検出される特徴点があるか否かのマッチング判定を行い、当該マッチング判定をパスした特徴点のみを選別する座標マッチング部と、
前記選別された特徴点に対して、対応する前記学習画像を用いて局所特徴を記述する局所特徴量記述部と、をさらに備えることを特徴とする請求項1ないし5のいずれかに記載の画像特徴量登録装置。 - 前記座標マッチング部は、前記検出された特徴点に対して、前記変換の逆を施した際の座標位置と、前記参照画像より検出される特徴点の座標位置と、の距離が固定長以内である場合に、前記マッチング判定に成功したものと判断する、または、
前記座標マッチング部は、前記変換の逆によりマッチングすると判定された前記参照画像の特徴点が複数存在する場合、当該変換の逆による位置が最も近い特徴点にマッチングしているものと判断する、ことを特徴とする請求項6に記載の画像特徴量登録装置。 - 前記変換画像作成部がさらに、前記参照画像を一連の仮想視点から撮影したようにそれぞれ変換したうえでぼけ変換を施すことで、前記一連の学習画像を作成することを特徴とする請求項6または7に記載の画像特徴量登録装置。
- 認識対象を撮影した参照画像と、当該認識対象を前記参照画像と異なる視点から撮影した一連の学習画像において、前記参照画像における認識対象から局所特徴が抽出される箇所に対応する箇所より抽出された局所特徴と、を入力とし、前記参照画像の特徴量としてのVW(ビジュアルワード)ヒストグラムを出力する画像特徴量登録方法であって、
前記入力された局所特徴における特徴ベクトルを代表ベクトルに量子化し、前記学習画像の特徴点に代表ベクトルのID(以下、vwIDとする。)を付与すると共に、当該vwIDに対応する前記参照画像の特徴点ID(以下、rkpIDとする。)を紐付けることでvwID及びrkpIDのペアを生成する量子化段階と、
前記生成されたvwID及びrkpIDのペアの個数をカウントすることで、当該ペアのスコアを算出するスコア算出段階と、
前記算出されたスコアが高いrkpIDを優先しながら、且つ、頻度をインクリメントされるvwIDが偏らないようにしながら、所定のデータサイズ制限に到達するまで順次、前記生成されたvwID及びrkpIDのペアを選択して対応するvwIDの頻度をインクリメントすることで、前記VWヒストグラムを構築する段階と、を備える画像特徴量登録方法。 - コンピュータを請求項1ないし8のいずれかに記載の画像特徴量登録装置として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014259155A JP6403201B2 (ja) | 2014-12-22 | 2014-12-22 | 画像特徴量登録装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014259155A JP6403201B2 (ja) | 2014-12-22 | 2014-12-22 | 画像特徴量登録装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016118971A JP2016118971A (ja) | 2016-06-30 |
JP6403201B2 true JP6403201B2 (ja) | 2018-10-10 |
Family
ID=56244336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014259155A Active JP6403201B2 (ja) | 2014-12-22 | 2014-12-22 | 画像特徴量登録装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6403201B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6822929B2 (ja) | 2017-09-19 | 2021-01-27 | 株式会社東芝 | 情報処理装置、画像認識方法および画像認識プログラム |
KR102167771B1 (ko) * | 2019-03-28 | 2020-10-19 | 오스템임플란트 주식회사 | 스캔 모델 자동 융합방법 및 이를 수행하는 영상 처리장치 |
CN110347826A (zh) * | 2019-06-17 | 2019-10-18 | 昆明理工大学 | 一种基于字符提取老挝语词特征的方法 |
JP7088618B2 (ja) * | 2020-11-19 | 2022-06-21 | Kddi株式会社 | 情報処理装置及びプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5588165B2 (ja) * | 2009-12-24 | 2014-09-10 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
JP2013058174A (ja) * | 2011-09-09 | 2013-03-28 | Fujitsu Ltd | 画像処理プログラム、画像処理方法および画像処理装置 |
-
2014
- 2014-12-22 JP JP2014259155A patent/JP6403201B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016118971A (ja) | 2016-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2016054779A1 (en) | Spatial pyramid pooling networks for image processing | |
CN109871821B (zh) | 自适应网络的行人重识别方法、装置、设备及存储介质 | |
US20230070008A1 (en) | Generating three-dimensional object models from two-dimensional images | |
CN108875481B (zh) | 用于行人检测的方法、装置、系统及存储介质 | |
JP6211407B2 (ja) | 画像検索システム、画像検索装置、検索サーバ装置、画像検索方法、及び画像検索プログラム | |
JP2007128195A (ja) | 画像処理システム | |
JP2015506045A (ja) | 画像特徴の類似性に基づく画像索引作成 | |
JP6403201B2 (ja) | 画像特徴量登録装置、方法及びプログラム | |
US9842279B2 (en) | Data processing method for learning discriminator, and data processing apparatus therefor | |
CN109919971B (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
JP6997369B2 (ja) | プログラム、測距方法、及び測距装置 | |
WO2012046426A1 (ja) | 物体検出装置、物体検出方法および物体検出プログラム | |
CN109063776B (zh) | 图像再识别网络训练方法、装置和图像再识别方法及装置 | |
JP6338274B2 (ja) | 情報処理装置ならびにその特徴点選択方法、装置およびプログラム | |
CN111652054A (zh) | 关节点检测方法、姿态识别方法及装置 | |
KR20200020107A (ko) | 기계학습을 이용한 획 기반 수기 서명 인증 방법 및 시스템 | |
US20090219396A1 (en) | Calibration apparatus and method for imaging devices and computer program | |
JP6035173B2 (ja) | 画像検索システム及び画像検索方法 | |
CN110135428A (zh) | 图像分割处理方法和装置 | |
JPWO2015068417A1 (ja) | 画像照合システム、画像照合方法およびプログラム | |
CN108304838B (zh) | 一种图片信息识别方法及终端 | |
JP6778625B2 (ja) | 画像検索システム、画像検索方法及び画像検索プログラム | |
JP6399651B2 (ja) | 登録装置及び検索装置並びに方法及びプログラム | |
JP6717769B2 (ja) | 情報処理装置及びプログラム | |
JP7369247B2 (ja) | 情報処理装置、情報処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20160823 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170906 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180906 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6403201 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |