JP2013238953A - 特徴量生成装置及び特徴量生成方法 - Google Patents
特徴量生成装置及び特徴量生成方法 Download PDFInfo
- Publication number
- JP2013238953A JP2013238953A JP2012110372A JP2012110372A JP2013238953A JP 2013238953 A JP2013238953 A JP 2013238953A JP 2012110372 A JP2012110372 A JP 2012110372A JP 2012110372 A JP2012110372 A JP 2012110372A JP 2013238953 A JP2013238953 A JP 2013238953A
- Authority
- JP
- Japan
- Prior art keywords
- image
- cluster
- feature
- local feature
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000006243 chemical reaction Methods 0.000 claims abstract description 31
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 239000000284 extract Substances 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 22
- 230000008901 benefit Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 241000255969 Pieris brassicae Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】パラメータ調整部2は、学習画像を変換するための第1〜第nのパラメータ値を決定する。画像変換部3は、第1〜第nのパラメータ値を用いて学習画像を変換することによって、第1〜第nの変換画像を生成する。局所特徴量抽出部4は、第1〜第nの各変換画像における特徴領域を特定し、特徴領域から局所特徴量を抽出する。クラスタ生成部5は、局所特徴量をクラスタリングすることにより、認識用データとして利用可能なクラスタを生成する。
【選択図】図1
Description
(1)入力画像に画像変換を行い、変換画像を得る。
(2)入力画像と変換画像とのそれぞれから、特徴点(例えばオブジェクトのエッジやコーナにおける点)を求める。
(3)入力画像と変換画像との「対応位置」(つまり同じ位置)において取得された特徴点を対応特徴点とする。
(4)対応特徴点における局所特徴量を、画像認識あるいは検索に用いる。
画像認識に用いる認識用データを生成する特徴量生成装置において、
学習画像を変換するための第1〜第nのパラメータ値を決定するパラメータ調整部と、
前記第1〜第nのパラメータ値を用いて前記学習画像を変換することによって、第1〜第nの変換画像を生成する画像変換部と、
前記第1〜第nの各変換画像における特徴領域を特定し、前記特徴領域から局所特徴量を抽出する局所特徴量抽出部と、
前記局所特徴量をクラスタリングすることにより、前記認識用データとして利用可能なクラスタを生成するクラスタ生成部と、
を備えることを特徴とする、特徴量生成装置。
前記第1〜第nのパラメータ値は、パラメータとして取りうる値の最大値又は最小値である、項目1に記載の特徴量生成装置。
前記パラメータ調整部は、まず大きな変動幅のパラメータ値を生成し、その後、それよりも小さな変動幅のパラメータ値を生成する構成となっており、
前記クラスタ生成部は、前記小さな変動幅のパラメータ値に対応する前記変換画像における前記局所特徴量のクラスタリングの結果、新たなクラスタが生成されなかったことをもって、クラスタリング処理の終了を判定する構成となっている
項目1又は2に記載の特徴量生成装置。
複数の前記学習画像を格納するための画像DBと、
前記画像DBから前記学習画像を読み出すための画像読み出し部とを備えており、
前記画像変換部は、前記画像読み出し部から前記学習画像を取得する構成となっている
項目1〜3のいずれか1項に記載の特徴量生成装置。
前記クラスタ生成部は、
前記局所特徴量の空間における前記クラスタの重心をさらに生成することを特徴とする項目1〜4の特徴量生成装置。
前記クラスタ生成部は、
前記局所特徴量の空間における前記クラスタの半径をさらに生成することを特徴とする項目1〜4の特徴量生成装置。
画像認識に用いる認識用データを生成する特徴量生成方法において、
学習画像を変換するための第1〜第nのパラメータ値を決定するパラメータ調整ステップと、
前記第1〜第nのパラメータ値を用いて前記学習画像を変換することによって、第1〜第nの変換画像を生成する画像変換ステップと、
前記第1〜第nの各変換画像における特徴領域を特定し、前記特徴領域から局所特徴量を抽出する局所特徴量抽出ステップと、
前記局所特徴量をクラスタリングすることにより、前記認識用データとして利用可能なクラスタを生成するクラスタ生成ステップと、
を備えることを特徴とする、特徴量生成方法。
項目7に記載の各ステップをコンピュータに実行させるためのコンピュータプログラム。
本発明の一実施形態における特徴量生成装置の構成を、図1を参照しながら説明する。本実施形態の特徴量生成装置は、画像認識に用いる認識用データを生成するためのものである。より具体的には、本実施形態の特徴量生成装置は、画像認識のための局所特徴量DBを生成するためのものである。この局所特徴量DBは、クエリ画像を用いて、画像内に含まれる同一オブジェクトの認識あるいは類似画像の検索を行うために用いることができるものである。
以下、前記した本例の特徴量生成装置を用いた特徴量生成方法の一例を、図2〜図4をさらに参照しながら説明する。
まず、画像読出部1により、画像DB6から1枚の学習用の画像(学習画像)を選択して取り出す。もちろん、画像DB6から複数枚の画像を同時に取り出した後に、画像読出部1において1枚の画像を特定してもよい。いずれによせ、この段階では、画像読出部1が、処理対象となる1枚の学習画像を特定する。なお、以降の処理を、複数枚の学習画像を対象として並行して実施することは可能であるが、説明の煩雑を避けるため、学習画像は1枚であると仮定して説明する。そして、画像変換部3は、学習画像を変換するための一つの変換処理の内容を決定する。ここで、画像変換の種類に特に制約はないが、例えば、輝度変更、コントラスト変更、ぼかし、回転、ゆがみ、拡大、縮小のいずれか又は組み合わせである。なお、本例の説明では、説明の簡略化のため、一つの変換処理を特定しているが、複数の変換処理を特定して、並列して以下の動作を行うことは可能である。
ついで、パラメータ調整部2は、前記で特定された画像変換によって学習画像を変換するための第1〜第nのパラメータ値を決定する。本実施形態では、とりうるパラメータの変動量が最大であるとして、まずは二つのパラメータを決定する。例えば、取りうるパラメータ値が0〜100の間であるとすれば、パラメータ値は0又は100であると仮定する。これにより、第1及び第2のパラメータ値を決定することができる。なお、三つ以上のパラメータ値を決定することは可能であるが、説明の簡略化のため、この時点では二つのパラメータが決定されることとする。
ついで、画像変換部3は、第1〜第nのパラメータ値を用いて学習画像を変換することによって、第1〜第nの変換画像を生成する。前記の例では、第1及び第2のパラメータ値である0と100とをそれぞれ用いて、画像変換を行う。これにより、第1及び第2の変換画像を得ることができる。得られた変換画像の集合を、ここでは画像集合Sと称する(図1及び図2参照)。なお、図1の画像集合Sでは、異なる画像変換によってえられる変換画像も記載されているが、これは、本例の手順を繰り返すことによって順次生成されていくものである。通常、初期段階では、画像集合Sには、1種類の画像変換によって得られる変換画像が包含される。
ついで、後述のステップSB−4で生成されるクラスタ生成フラグがある場合は、システム側でそれをクリアする。ついで、局所特徴量抽出部4は、集合Sから1枚の変換画像を選択する。どの画像を選択するかはシステム側の任意でよいが、一般には、学習済みでない変換画像が選択される。
ついで、局所特徴量抽出部4は、選択した画像における特徴点(特徴領域に対応)の位置(つまり座標)と、その特徴点における局所特徴量とを抽出する。特徴点及び局所特徴量の抽出手法としては、既存のものを利用可能なので、これについての詳しい説明は省略する。
ついで、クラスタ生成部5は、抽出された局所特徴量を局所特徴量DB7から取り出してクラスタリングすることにより、認識用データとして利用可能なクラスタを生成する(図3参照)。クラスタ生成手法の詳細は後述する。図3においては、局所特徴量をクラスタに順次追加していく様子を示している。なお、このとき、局所特徴量と特徴点の座標とは紐付けられているものとする。これにより、後述する、「同じ特徴点に対応する特徴量のクラスタにより形成される集合」(すなわちクラスタ集合)の生成が可能になる。
ついで、局所特徴量抽出部4は、変換画像集合Sから別の1枚の変換画像を選択し、その変換画像について、特徴点及び対応する局所特徴量を抽出する。ここで、本実施形態では、別の1枚の変換画像として、同じ画像変換処理における異なるパラメータを用いたものを選ぶことができる。なお、ここで選ばれる変換画像は、前記した変換画像と同じ学習画像に対して同種の(しかしパラメータが異なる)変換処理が施されたものである。
ついで、クラスタ生成部5は、一つの特徴点及びそれに対応する特徴量を選択する。そして、クラスタ生成部5は、特徴点の座標が対応するクラスタ集合を決定する。この処理を、図4をさらに参照して説明する。まず、同じ学習画像から得られた二つの変換画像Im1及びIm2が存在すると仮定する(図4参照)。このとき、二つの画像Im1とIm2とには、同じ特徴点が存在する。同じ特徴点とは、同じ座標(画像変換により座標系が変更されるときは、マッピングによって一致する座標)における特徴点のことである。そして、同じ特徴点に対応する二つの局所特徴量についてそれぞれクラスタを生成した例を図4(a)に示す。この例では、同じ特徴点に対応しているにもかかわらず、二つの局所特徴量が異なるクラスタに属している。これは、クラスタ半径の設定にもよるが、十分ありうることである。もちろん、一方の局所特徴量が他方の局所特徴量のクラスタに属することもありうる。なお、クラスタ半径の設定は、通常は実験的に決定されるが、それは本実施形態において重要な要素ではないので、ここでは、適宜に決定されているものと仮定する。
ここで、クラスタ生成部5は、対応するクラスタ集合がない場合(つまり当該特徴点に対する最初の処理の場合)には、クラスタを新たに生成して、クラスタ生成フラグをシステム側にセットする。当該特徴点に対する初回の処理でなければ、対応するクラスタ集合は存在するので、次のステップSB−5に移行する。
ついで、クラスタ生成部5は、当該特徴量と、特定されたクラスタ集合に属する各クラスタの重心点との距離を算出する。各クラスタ重心点の距離の最小値が、閾値t(この値は通常は実験的に設定される)を超えたときは、ステップSB−4に移行して、新しいクラスタを追加する。そうでなければ次のステップSB−7に移行する。
前記において処理対象となっていた変換画像(同じ学習画像に対応する変換画像)に、他の局所特徴量があれば、ステップSB−2に戻り、処理を繰り返す。なければ次のステップSB−8に進む。
集合Sに、処理すべき他の変換画像があれば、ステップSB−1に戻り、処理を繰り返す。なければ次のステップSB−9に進む。
ステップSB−4にて説明したクラスタ生成フラグがシステム側にセットされているときは、ステップSA−3に戻り、パラメータの変動量を減らして、処理を繰り返す。変動量をどの程度減らすかは、例えば実験的に決定できる。クラスタ生成フラグがセットされていない場合は、パラメータの変動量をこれ以上減らしても新たなクラスタに寄与しない(つまり局所特徴量の多様化に寄与しない)と考えられるため、ステップSB−11に進む。このように本実施形態では、画像認識に有効な局所特徴量を効率的に高速で生成できるという利点がある。
未だ前記手順の対象となっていない他の変換画像があれば、ステップSA−1に戻り、なければ、当該学習画像についての処理を終了する。このようにして、多様な局所特徴量を有する局所特徴量DBを効率的に生成することができる。他の学習画像がある場合は、最初の手順に戻って処理を繰り返す。
1 画像読出部
2 パラメータ調整部
3 画像変換部
4 局所特徴量抽出部
5 クラスタ生成部
6 画像DB
7 局所特徴量DB
Claims (8)
- 画像認識に用いる認識用データを生成する特徴量生成装置において、
学習画像を変換するための第1〜第nのパラメータ値を決定するパラメータ調整部と、
前記第1〜第nのパラメータ値を用いて前記学習画像を変換することによって、第1〜第nの変換画像を生成する画像変換部と、
前記第1〜第nの各変換画像における特徴領域を特定し、前記特徴領域から局所特徴量を抽出する局所特徴量抽出部と、
前記局所特徴量をクラスタリングすることにより、前記認識用データとして利用可能なクラスタを生成するクラスタ生成部と、
を備えることを特徴とする、特徴量生成装置。 - 前記第1〜第nのパラメータ値は、パラメータとして取りうる値の最大値又は最小値である、請求項1に記載の特徴量生成装置。
- 前記パラメータ調整部は、まず大きな変動幅のパラメータ値を生成し、その後、それよりも小さな変動幅のパラメータ値を生成する構成となっており、
前記クラスタ生成部は、前記小さな変動幅のパラメータ値に対応する前記変換画像における前記局所特徴量のクラスタリングの結果、新たなクラスタが生成されなかったことをもって、クラスタリング処理の終了を判定する構成となっている
請求項1又は2に記載の特徴量生成装置。 - 複数の前記学習画像を格納するための画像DBと、
前記画像DBから前記学習画像を読み出すための画像読み出し部とを備えており、
前記画像変換部は、前記画像読み出し部から前記学習画像を取得する構成となっている
請求項1〜3のいずれか1項に記載の特徴量生成装置。 - 前記クラスタ生成部は、
前記局所特徴量の空間における前記クラスタの重心をさらに生成することを特徴とする請求項1〜4の特徴量生成装置。 - 前記クラスタ生成部は、
前記局所特徴量の空間における前記クラスタの半径をさらに生成することを特徴とする請求項1〜4の特徴量生成装置。 - 画像認識に用いる認識用データを生成する特徴量生成方法において、
学習画像を変換するための第1〜第nのパラメータ値を決定するパラメータ調整ステップと、
前記第1〜第nのパラメータ値を用いて前記学習画像を変換することによって、第1〜第nの変換画像を生成する画像変換ステップと、
前記第1〜第nの各変換画像における特徴領域を特定し、前記特徴領域から局所特徴量を抽出する局所特徴量抽出ステップと、
前記局所特徴量をクラスタリングすることにより、前記認識用データとして利用可能なクラスタを生成するクラスタ生成ステップと、
を備えることを特徴とする、特徴量生成方法。 - 請求項7に記載の各ステップをコンピュータに実行させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012110372A JP5602184B2 (ja) | 2012-05-14 | 2012-05-14 | 特徴量生成装置及び特徴量生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012110372A JP5602184B2 (ja) | 2012-05-14 | 2012-05-14 | 特徴量生成装置及び特徴量生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013238953A true JP2013238953A (ja) | 2013-11-28 |
JP5602184B2 JP5602184B2 (ja) | 2014-10-08 |
Family
ID=49763934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012110372A Active JP5602184B2 (ja) | 2012-05-14 | 2012-05-14 | 特徴量生成装置及び特徴量生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5602184B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021152725A (ja) * | 2020-03-24 | 2021-09-30 | Kddi株式会社 | 学習方法、装置及びプログラム |
US11244159B2 (en) | 2019-04-24 | 2022-02-08 | Hitachi, Ltd. | Article recognition system and article recognition method |
-
2012
- 2012-05-14 JP JP2012110372A patent/JP5602184B2/ja active Active
Non-Patent Citations (5)
Title |
---|
CSNG199800770009; 嶌田 聡: '顔の向きによらない人物識別のための辞書構成法' 電子情報通信学会論文誌 第J78-D-II巻 第11号, 19951125, p.1639-1649, 社団法人電子情報通信学会 * |
CSNG200000978003; 村上 早苗: '局所固有空間法を用いたランドマーク認識法' 電子情報通信学会技術研究報告 第98巻 第678号, 19990319, p.17-24, 社団法人電子情報通信学会 * |
JPN6013061640; 村上 早苗: '局所固有空間法を用いたランドマーク認識法' 電子情報通信学会技術研究報告 第98巻 第678号, 19990319, p.17-24, 社団法人電子情報通信学会 * |
JPN6013061641; 西村 孝: '2 段階のRandomized Trees を用いたキーポイントの分類' 画像の認識・理解シンポジウム(MIRU2010) , 201007 * |
JPN6013061642; 嶌田 聡: '顔の向きによらない人物識別のための辞書構成法' 電子情報通信学会論文誌 第J78-D-II巻 第11号, 19951125, p.1639-1649, 社団法人電子情報通信学会 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11244159B2 (en) | 2019-04-24 | 2022-02-08 | Hitachi, Ltd. | Article recognition system and article recognition method |
JP2021152725A (ja) * | 2020-03-24 | 2021-09-30 | Kddi株式会社 | 学習方法、装置及びプログラム |
JP7280215B2 (ja) | 2020-03-24 | 2023-05-23 | Kddi株式会社 | 学習方法、装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5602184B2 (ja) | 2014-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102567285B1 (ko) | 모바일 비디오 서치 기법 | |
CN110852254B (zh) | 人脸关键点跟踪方法、介质、装置和计算设备 | |
JP2012137908A (ja) | クラスタリング装置及びクラスタリング方法 | |
CN112150551B (zh) | 物体位姿的获取方法、装置和电子设备 | |
JP2010079545A (ja) | 画像処理装置、画像処理方法およびプログラム | |
WO2013105505A1 (ja) | インデックス走査装置及びインデックス走査方法 | |
CN111209909B (zh) | 资质识别模板构建方法、装置、设备和存储介质 | |
CN112613513A (zh) | 图像识别方法、装置和系统 | |
JP5602184B2 (ja) | 特徴量生成装置及び特徴量生成方法 | |
JP5430636B2 (ja) | データ取得装置、方法及びプログラム | |
JP2010218479A (ja) | 画像検索装置 | |
CN111985459A (zh) | 表格图像校正方法、装置、电子设备和存储介质 | |
JP5520353B2 (ja) | BoF表現生成装置及びBoF表現生成方法 | |
JP5490859B2 (ja) | ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法 | |
TW202018540A (zh) | 資料庫更新方法和裝置、電子設備、電腦儲存介質 | |
JP5882976B2 (ja) | 学習用局所特徴量生成装置及び学習用局所特徴量生成方法 | |
US20140231523A1 (en) | Electronic device capable of recognizing object | |
JP5061137B2 (ja) | 画像検索装置 | |
JP6419560B2 (ja) | 検索装置、方法及びプログラム | |
JP4460277B2 (ja) | 画像の対応点探索方法、対応点探索装置および対応点探索プログラム | |
JPWO2020044537A1 (ja) | 画像照合装置、画像照合方法、及びプログラム | |
JPWO2011058605A1 (ja) | 計量空間学習装置 | |
US9591220B2 (en) | Selection apparatus, selection method, and storage medium | |
JP6485072B2 (ja) | 画像探索装置、画像探索方法および画像探索プログラム | |
JP5646664B2 (ja) | 画像照合装置及び画像照合方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140722 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140819 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5602184 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |