JP5520353B2 - BoF表現生成装置及びBoF表現生成方法 - Google Patents
BoF表現生成装置及びBoF表現生成方法 Download PDFInfo
- Publication number
- JP5520353B2 JP5520353B2 JP2012192738A JP2012192738A JP5520353B2 JP 5520353 B2 JP5520353 B2 JP 5520353B2 JP 2012192738 A JP2012192738 A JP 2012192738A JP 2012192738 A JP2012192738 A JP 2012192738A JP 5520353 B2 JP5520353 B2 JP 5520353B2
- Authority
- JP
- Japan
- Prior art keywords
- local feature
- bof expression
- clusters
- cluster
- bof
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000014509 gene expression Effects 0.000 title claims description 94
- 238000000034 method Methods 0.000 title claims description 57
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000000052 comparative effect Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
複数の学習局所特徴量に対するクラスタリングにより生成される複数のクラスタを用いて、対象画像に対応するBoF表現を生成するための装置であって、
前記対象画像におけるi番目の対象局所特徴量と、前記複数のクラスタとのそれぞれの距離を算出する距離算出部と、
前記i番目の対象局所特徴量との距離が、他のクラスタよりも相対的に近い、複数のクラスタを特定するクラスタ特定部と、
特定された前記複数のクラスタのID情報を用いて、前記対象画像に対応するBoF表現を生成するBoF表現生成部と
を備えることを特徴とする、BoF表現生成装置。
前記クラスタ特定部は、前記i番目の対象局所特徴量との距離が既定値以内である複数のクラスタを特定する処理を行う構成となっている
項目1に記載のBoF表現生成装置。
前記クラスタ特定部は、前記i番目の対象局所特徴量との距離が近い順に複数のクラスタを特定する処理を行う構成となっている
項目1に記載のBoF表現生成装置。
前記クラスタ特定部は、前記学習局所特徴量の原画像である学習画像と前記対象画像とのジャンルの異同に応じて、特定されるべき前記クラスタの数を変動させる構成となっている
項目1〜3のいずれか1項に記載のBoF表現生成装置。
前記クラスタ特定部は、生成されたBoF表現を用いた画像検索において得られた検索結果の確信度に応じて、特定されるべき前記クラスタの数を変動させる構成となっている
項目1〜4のいずれか1項に記載のBoF表現生成装置。
前記BoF表現生成部は、前記i番目の対象局所特徴量と、前記特定されたクラスタとの距離に応じて、前記BoF表現の重み付けを行う構成となっている
項目1〜5のいずれか1項に記載のBoF表現生成装置。
複数の学習局所特徴量に対するクラスタリングにより生成される複数のクラスタを用いて、対象画像に対応するBoF表現を生成するためのBoF表現生成装置を用いて実行されるBoF表現生成方法であって、
BoF表現生成装置は、距離算出部と、クラスタ特定部と、BoF表現生成部とを備えており、
前記距離算出部が、前記対象画像におけるi番目の対象局所特徴量と、前記複数のクラスタとのそれぞれの距離を算出するステップと、
前記i番目の対象局所特徴量との距離が、他のクラスタよりも相対的に近い、複数のクラスタを、前記クラスタ特定部が特定するステップと、
前記BoF表現生成部が、特定された前記複数のクラスタのID情報を用いて、前記対象画像に対応するBoF表現を生成するステップと
を備えることを特徴とする、BoF表現生成方法。
項目7に記載の各ステップをコンピュータに実行させるためのコンピュータプログラム。
本発明の一実施形態におけるBoF表現生成装置の一例を、図1を参照しながら説明する。このBoF表現生成装置は、距離算出部1と、クラスタ特定部2と、BoF表現生成部3とを備えている。さらに、このBoF表現生成装置は、局所特徴量抽出部4と、クラスタ生成部5とを備えている。
次に、図2〜図11をさらに参照しながら、前記した装置を用いたBoF表現の生成方法について説明する。まず、図2を参照して、全体的な手順を説明し、その後、各手順の詳細を説明する。
まず、入力された学習用の画像データを用いて、局所特徴量のクラスタを生成する。
ついで、生成されたクラスタを用いて、学習画像又はクエリ画像についての各局所特徴量をマッピングする。つまり、局所特徴量に対応するクラスタIDを特定する。
ついで、特定されたクラスタIDのヒストグラムを用いて、学習画像又はクエリ画像についてのBoF表現を生成する。
(図3のステップSB−1)
まず、局所特徴量抽出部4は、学習用の画像データ(図4参照)を受け付ける。画像データとは、例えば、検索対象となる商品の写真であるが、特に制約されない。
ついで、局所特徴量抽出部4は、受け付けた画像データから、局所特徴量を抽出する(図5参照)。この工程は、学習用の各画像データについて行われる。
ついで、クラスタ生成部5は、特徴量空間内の局所特徴量をクラスタリングし、クラスタを生成する。生成されるクラスタの一例を図6に示す。なお、図6では、クラスタ半径を示しているが、クラスタ半径を定義する必要はなく、例えば、クラスタ中心を基準としたボロノイ分割により領域を分けることができる。要するに、クラスタ中心が決まれば、後述する手順を実行できる。
ついで、クラスタ生成部5は、適宜な記録手段(例えばハードディスク)に、生成されたクラスタに関する情報を記録する。
ついで、生成されたクラスタを用いてBoF表現を生成するためのマッピング手法を、図7をさらに参照しながら説明する。
まず、量子化の対象となる画像(学習画像又はクエリ画像)を、局所特徴量抽出部4が受け取る。
ついで、局所特徴量抽出部4は、受け取った画像における局所特徴量を抽出する。なお、学習画像に対する局所特徴量抽出部とクエリ画像に対する局所特徴量抽出部とは、異なるハードウエアあるいはソフトウエアにより実装されていても良いが、この明細書では、集合的に、局所特徴量抽出部4という表現を用いている。
ついで、距離算出部1は、抽出された各局所特徴量と、各クラスタ中心との距離を算出する。このようにして抽出された各局所特徴量を、この明細書ではi番目の局所特徴量と称している。
ついで、クラスタ特定部2は、局所特徴量とクラスタ中心との距離の情報を用いて、当該局所特徴量とクラスタIDとを関連付ける。ここで、本実施形態では、i番目の(つまり特定の一つの)対象局所特徴量との距離が、他のクラスタよりも相対的に近い複数のクラスタを、クラスタ特定部2が特定する。図8の例では、例えば、一つの局所特徴量に対して、既定距離内にある三つのクラスタID(すなわち#2、#4及び#5)を割り振っている。
ここで、図9を参照しながら、クラスタIDを特定する手法について、さらに詳しく説明する。
前記した実施形態では、一つの局所特徴量に対して既定距離内にある複数のクラスタIDを割り振る構成とした。しかしながら、一つの局所特徴量に対して近い順に既定個数のクラスタIDを割り振ることも可能である。この場合は、一つの局所特徴量に割り当てられるクラスタIDの個数は既定値(例えば2個)となる。
クラスタ特定部2は、学習局所特徴量の原画像である学習画像と対象画像(学習又はクエリ画像)とのジャンルの異同に応じて、特定されるべき前記クラスタの数を変動させる構成であってもよい。例えば、クラスタ生成に使用した学習画像のジャンルが風景であり、一方、認識対象の画像のジャンルが人物であったときは、一つの局所特徴量に割り当てるクラスタの数を増やす。このようにすれば、画像検索の精度の向上を期待できる。なお、画像が属するジャンルの決定は、例えば人手により行うことができる。また、各画像に対して、ジャンル情報をあらかじめ付与しておくこともできる。
クラスタ特定部2は、生成されたBoF表現を用いた検索において得られた検索結果の確信度に応じて、特定されるべきクラスタの数を変動させる構成であってもよい。ここで、検索結果の確信度とは、検索結果に対する信頼性を意味しており、それは例えば、生成されたBoF表現(ヒストグラムのベクトルデータ)とDB中のすべてのBoF表現(つまり学習データ)との距離(例えばユークリッド距離)を算出して、最も距離の小さいBoF表現を検索結果とする場合には、その距離が確信度となる。距離が小さい時は確信度が高く、距離が大きい時は確信度が低いと考えることができる。また、距離に対して閾値を設定して、閾値を超えたBoF表現を検索結果とする場合には、検索数が確信度となる。得られた検索数が少ないときは、検索結果の確信度が低いと考えることができる。さらに、BoF表現で検索した後に、この検索で得られた画像における局所特徴量の座標と、認識対象の画像における局所特徴量の座標との位置関係を照合する機能がある場合には、照合の一致度合いを確信度とすることも可能である。局所特徴量の座標を用いた照合の手法としては、既存手法を利用可能なので、詳しい説明は省略する。
BoF表現生成部3は、i番目の(つまり任意の一つの)対象局所特徴量と、特定されたクラスタとの距離に応じて、BoF表現の重み付けを行う構成であってもよい。例えば、一つの局所特徴量に対して、二つのクラスタID(仮にID番号を#1と#2とする)が割り当てられると仮定する。このとき、局所特徴量をクラスタ中心との距離に応じて、クラスタIDのヒストグラムに重み付けを行う。重み付けの手法は特に制約されないが、例えば、重みの値をWとすると、
W=a・1/d
とすることができる。ここで、dは距離、aは正の比例定数である。なお、計算の便宜上、重みの最大値Wmaxを1に正規化することが好ましい。
2 クラスタ特定部
3 BoF表現生成部
4 局所特徴量抽出部
5 クラスタ生成部
Claims (8)
- 複数の学習局所特徴量に対するクラスタリングにより生成される複数のクラスタを用いて、対象画像に対応するBoF表現を生成するための装置であって、
前記対象画像におけるi番目の対象局所特徴量と、前記複数のクラスタとのそれぞれの距離を算出する距離算出部と、
前記i番目の対象局所特徴量との距離が、他のクラスタよりも相対的に近い、複数のクラスタを、前記i番目の対象局所特徴量ごとに特定するクラスタ特定部と、
前記i番目の対象局所特徴量ごとに特定された前記複数のクラスタのID情報の統合的なヒストグラムとして、前記対象画像に対応するBoF表現を生成するBoF表現生成部と
を備えることを特徴とする、BoF表現生成装置。 - 前記クラスタ特定部は、前記i番目の対象局所特徴量との距離が既定値以内である複数のクラスタを特定する処理を行う構成となっている
請求項1に記載のBoF表現生成装置。 - 前記クラスタ特定部は、前記i番目の対象局所特徴量との距離が近い順に複数のクラスタを特定する処理を行う構成となっている
請求項1に記載のBoF表現生成装置。 - 前記クラスタ特定部は、前記学習局所特徴量の原画像である学習画像と前記対象画像とのジャンルの異同に応じて、特定されるべき前記クラスタの数を変動させる構成となっている
請求項1〜3のいずれか1項に記載のBoF表現生成装置。 - 前記クラスタ特定部は、生成されたBoF表現を用いた画像検索において得られた検索結果の確信度に応じて、特定されるべき前記クラスタの数を変動させる構成となっている
請求項1〜4のいずれか1項に記載のBoF表現生成装置。 - 前記BoF表現生成部は、前記i番目の対象局所特徴量と、前記特定されたクラスタとの距離に応じて、前記BoF表現の重み付けを行う構成となっている
請求項1〜5のいずれか1項に記載のBoF表現生成装置。 - 複数の学習局所特徴量に対するクラスタリングにより生成される複数のクラスタを用いて、対象画像に対応するBoF表現を生成するためのBoF表現生成装置を用いて実行されるBoF表現生成方法であって、
BoF表現生成装置は、距離算出部と、クラスタ特定部と、BoF表現生成部とを備えており、
前記距離算出部が、前記対象画像におけるi番目の対象局所特徴量と、前記複数のクラスタとのそれぞれの距離を算出するステップと、
前記i番目の対象局所特徴量との距離が、他のクラスタよりも相対的に近い、複数のクラスタを、前記i番目の対象局所特徴量ごとに前記クラスタ特定部が特定するステップと、
前記BoF表現生成部が、前記i番目の対象局所特徴量ごとに特定された前記複数のクラスタのID情報の統合的なヒストグラムとして、前記対象画像に対応するBoF表現を生成するステップと
を備えることを特徴とする、BoF表現生成方法。
- 請求項7に記載の各ステップをコンピュータに実行させるためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012192738A JP5520353B2 (ja) | 2012-09-03 | 2012-09-03 | BoF表現生成装置及びBoF表現生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012192738A JP5520353B2 (ja) | 2012-09-03 | 2012-09-03 | BoF表現生成装置及びBoF表現生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014048989A JP2014048989A (ja) | 2014-03-17 |
JP5520353B2 true JP5520353B2 (ja) | 2014-06-11 |
Family
ID=50608565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012192738A Active JP5520353B2 (ja) | 2012-09-03 | 2012-09-03 | BoF表現生成装置及びBoF表現生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5520353B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6047120B2 (ja) * | 2014-06-20 | 2016-12-21 | ヤフー株式会社 | ビジュアルキーワード探索装置及びビジュアルキーワード探索方法 |
JP6460926B2 (ja) * | 2015-06-25 | 2019-01-30 | Kddi株式会社 | 撮影画像に写る物体を検索するシステム及び方法 |
CN108241669A (zh) * | 2016-12-26 | 2018-07-03 | 上海神计信息系统工程有限公司 | 一种自适应文本特征簇的构建方法和系统 |
WO2022003973A1 (ja) * | 2020-07-03 | 2022-01-06 | 株式会社ソニー・インタラクティブエンタテインメント | 訓練データ選別装置、訓練データ選別方法及びプログラム |
-
2012
- 2012-09-03 JP JP2012192738A patent/JP5520353B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014048989A (ja) | 2014-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Philbin et al. | Lost in quantization: Improving particular object retrieval in large scale image databases | |
US11048966B2 (en) | Method and device for comparing similarities of high dimensional features of images | |
KR100353798B1 (ko) | 영상 객체 모양 정보 추출 방법 및 그를 이용한 내용기반 이미지 검색 시스템 및 그 방법 | |
US10296534B2 (en) | Storing and searching fingerprints derived from media content based on a classification of the media content | |
US9747308B2 (en) | Method and apparatus for searching an image, and computer-readable recording medium for executing the method | |
CN108292310A (zh) | 用于数字实体相关的技术 | |
JP6378855B1 (ja) | 画像検索システム、画像検索方法およびプログラム | |
AU2012202352A1 (en) | Method, system and apparatus for determining a hash code representing a portion of an image | |
JP5094830B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
US9116898B2 (en) | Information conversion device, computer-readable recording medium, and information conversion method | |
JP5520353B2 (ja) | BoF表現生成装置及びBoF表現生成方法 | |
US20150332172A1 (en) | Learning method, information processing device, and recording medium | |
JPWO2020050413A1 (ja) | 認証用顔画像候補判定装置、認証用顔画像候補判定方法、プログラム、および記録媒体 | |
JP2010250637A (ja) | 画像サーバー、画像検索システム、画像検索方法および画像管理方法 | |
JP2012079186A (ja) | 画像検索装置、画像検索方法及びプログラム | |
JP2014211730A (ja) | 画像検索システム、画像検索装置および画像検索方法 | |
JP2010250630A (ja) | 画像サーバー、画像検索システムおよび画像検索方法 | |
JP7149976B2 (ja) | 誤り訂正方法及び装置、コンピュータ読み取り可能な媒体 | |
JP2014102772A (ja) | 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法 | |
JP5791666B2 (ja) | ビジュアルキーワードの動的生成装置 | |
JP2010250634A (ja) | 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法 | |
JP5490859B2 (ja) | ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法 | |
JP2013073333A (ja) | 画像マッチング装置及び画像マッチングプログラム | |
JP5646664B2 (ja) | 画像照合装置及び画像照合方法 | |
Bhattacharya et al. | DT-RANSAC: a delaunay triangulation based scheme for improved RANSAC feature matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140404 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5520353 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |