JP5520353B2 - BoF表現生成装置及びBoF表現生成方法 - Google Patents

BoF表現生成装置及びBoF表現生成方法 Download PDF

Info

Publication number
JP5520353B2
JP5520353B2 JP2012192738A JP2012192738A JP5520353B2 JP 5520353 B2 JP5520353 B2 JP 5520353B2 JP 2012192738 A JP2012192738 A JP 2012192738A JP 2012192738 A JP2012192738 A JP 2012192738A JP 5520353 B2 JP5520353 B2 JP 5520353B2
Authority
JP
Japan
Prior art keywords
local feature
bof expression
clusters
cluster
bof
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012192738A
Other languages
English (en)
Other versions
JP2014048989A (ja
Inventor
雅二郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2012192738A priority Critical patent/JP5520353B2/ja
Publication of JP2014048989A publication Critical patent/JP2014048989A/ja
Application granted granted Critical
Publication of JP5520353B2 publication Critical patent/JP5520353B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、BoF表現生成装置及びBoF表現生成方法に関するものである。
下記特許文献1に示されるように、局所特徴量を用いた画像認識手法が知られている。この手法では、画像を複数の部分に分割し、各部分に対応して局所特徴量を抽出し、この局所特徴量を用いて類似画像検索を行うことができる。これらの局所特徴量は、画像の特徴を精度良く表すために、通常、多次元のベクトルデータとされている。
ところで、下記特許文献にも示されているように、局所特徴量を用いた類似画像検索では、計算量が膨大となる傾向がある。
そこで、局所特徴量を高速に検索するために、ビジュアルキーワードあるいはBoF(Bag of Features)という手法が提案されている。この手法では、複数の局所特徴量を予めクラスタリングすることにより、クラスタを代表する局所特徴量(つまりビジュアルキーワード)を算出する。さらに、各クラスタにIDを付す。これにより、各局所特徴量を、それが属するクラスタのIDに紐付けることができる。
すると、ある画像に対応する複数の局所特徴量の集合は、クラスタIDのヒストグラム(集合ということもできる)により置き換えることができる。このクラスタIDのヒストグラムを、BoF表現あるいは単にBoFと呼ぶ。一枚の画像に対応して、一つのBoF表現を得ることができる。生成されたBoF表現は、一般に転置ファイルによって検索できる。なお、BoF表現を「特徴ベクトル」と称することがあるが、本明細書では、画像の特徴量を示す特徴ベクトルとの混同を避けるため、BoF表現という用語を用いる。
このように、BoF表現を用いることにより、局所特徴量を量子化して、データ量を減らすことができる。しかも、検索には転置ファイルを利用できるので、局所特徴量自体を用いるよりも高速な類似画像検索(つまり画像認識)が可能となる。
その一方で、局所特徴量を量子化することにより、検索精度が低下するという問題がある。これは、個別の局所特徴量をクラスタIDに置き換えてしまったことに起因すると考えられる。そこで、下記特許文献1では、画像の局所特徴量をクラスタにマッピングする(つまりクラスタIDに紐付ける)際に、局所特徴量とクラスタ中心との距離に応じた重み付けを行って、BoF表現を生成する。しかし、画像の撮影状態によっては、本来マッピングするべきでないクラスタに局所特徴量がマッピングされてしまい、結果的に検索精度が劣化することがある。この問題は、重み付けでは十分に解消できない。すなわち、従来の技術では、検索精度において改善の余地があった。
特開2011−128773号公報(0003〜0005段落、0069段落)
本発明は、前記した状況に鑑みてなされたものである。本発明の主な目的は、精度の良い画像検索を行うことが可能なBoF表現を生成する装置又は方法を提供することである。
本発明は、以下のいずれかの項目に記載の構成とされている。
(項目1)
複数の学習局所特徴量に対するクラスタリングにより生成される複数のクラスタを用いて、対象画像に対応するBoF表現を生成するための装置であって、
前記対象画像におけるi番目の対象局所特徴量と、前記複数のクラスタとのそれぞれの距離を算出する距離算出部と、
前記i番目の対象局所特徴量との距離が、他のクラスタよりも相対的に近い、複数のクラスタを特定するクラスタ特定部と、
特定された前記複数のクラスタのID情報を用いて、前記対象画像に対応するBoF表現を生成するBoF表現生成部と
を備えることを特徴とする、BoF表現生成装置。
本発明においては、特定の局所特徴量と、これに対して既定の関係にある複数のクラスタIDとを紐付けることができ、このクラスタIDを用いてBoF表現を生成することができる。このようなBoF表現の生成は、画像の学習工程あるいは認識(つまり類似検索)工程のいずれか又は両方において行うことができる。学習工程においては、本発明における対象画像は、学習画像であり、認識工程においては、本発明における対象画像は、クエリ(検索)画像である。
また、本発明のクラスタ特定部は、常に複数のクラスタを特定するものでなくとも良い。すなわち、本発明のクラスタ特定部は、既定条件を満たす場合のみ複数クラスタを特定する構成であってもよい。また、本発明においてクラスタの特定とは、クラスタIDを特定することを含む意味である。
(項目2)
前記クラスタ特定部は、前記i番目の対象局所特徴量との距離が既定値以内である複数のクラスタを特定する処理を行う構成となっている
項目1に記載のBoF表現生成装置。
クラスタ特定部は、既定値以内にあるすべてのクラスタを特定してもよく、あるいは、既定範囲内でかつ、近い順に既定個数以内のクラスタを特定してもよい。
(項目3)
前記クラスタ特定部は、前記i番目の対象局所特徴量との距離が近い順に複数のクラスタを特定する処理を行う構成となっている
項目1に記載のBoF表現生成装置。
(項目4)
前記クラスタ特定部は、前記学習局所特徴量の原画像である学習画像と前記対象画像とのジャンルの異同に応じて、特定されるべき前記クラスタの数を変動させる構成となっている
項目1〜3のいずれか1項に記載のBoF表現生成装置。
(項目5)
前記クラスタ特定部は、生成されたBoF表現を用いた画像検索において得られた検索結果の確信度に応じて、特定されるべき前記クラスタの数を変動させる構成となっている
項目1〜4のいずれか1項に記載のBoF表現生成装置。
ここで、検索結果の確信度とは、検索結果に対する信頼性を意味しており、それは例えば、検索により得られた画像の数により決定できる。あるいは、画像検索後に行われる、局所特徴量の座標を用いた照合による座標の一致度により、確信度を決定することも可能である。
(項目6)
前記BoF表現生成部は、前記i番目の対象局所特徴量と、前記特定されたクラスタとの距離に応じて、前記BoF表現の重み付けを行う構成となっている
項目1〜5のいずれか1項に記載のBoF表現生成装置。
(項目7)
複数の学習局所特徴量に対するクラスタリングにより生成される複数のクラスタを用いて、対象画像に対応するBoF表現を生成するためのBoF表現生成装置を用いて実行されるBoF表現生成方法であって、
BoF表現生成装置は、距離算出部と、クラスタ特定部と、BoF表現生成部とを備えており、
前記距離算出部が、前記対象画像におけるi番目の対象局所特徴量と、前記複数のクラスタとのそれぞれの距離を算出するステップと、
前記i番目の対象局所特徴量との距離が、他のクラスタよりも相対的に近い、複数のクラスタを、前記クラスタ特定部が特定するステップと、
前記BoF表現生成部が、特定された前記複数のクラスタのID情報を用いて、前記対象画像に対応するBoF表現を生成するステップと
を備えることを特徴とする、BoF表現生成方法。
(項目8)
項目7に記載の各ステップをコンピュータに実行させるためのコンピュータプログラム。
このコンピュータプログラムは、適宜な記録媒体(例えばCD−ROMやDVDディスクのような光学的な記録媒体、ハードディスクやフレキシブルディスクのような磁気的記録媒体、あるいはMOディスクのような光磁気記録媒体)に格納することができる。このコンピュータプログラムは、インターネットなどの通信回線を介して伝送されることができる。
本発明によれば、精度の良い画像検索を行うことが可能なBoF表現を生成する装置又は方法を提供することが可能となる。
本発明の一実施形態に係るBoF表現生成装置の概略的なブロック図である。 本発明の一実施形態に係るBoF表現生成方法の全体的な手順を示すフローチャートである。 学習画像を用いてクラスタを生成する手順を説明するためのフローチャートである。 複数の学習画像の一例を示す説明図である。 特徴量空間に配置された局所特徴量の一例を示す説明図である。 生成されたクラスタ中心の一例を説明するための説明図である。 局所特徴量をクラスタIDにマッピングする手順を説明するためのフローチャートである。 一つの局所特徴量が三つのクラスタIDにマッピングされた状態を説明するための説明図である。 本発明の実施例の方法と比較例の方法によるマッピングの様子を説明するための説明図である。 図(a)は、比較例の方法で生成されるBoF表現を説明するための説明図である。図(b)は、実施例の方法で生成されるBoF表現を説明するための説明図である。 生成されるBoF表現の一例を示す説明図である。
(本実施形態の構成)
本発明の一実施形態におけるBoF表現生成装置の一例を、図1を参照しながら説明する。このBoF表現生成装置は、距離算出部1と、クラスタ特定部2と、BoF表現生成部3とを備えている。さらに、このBoF表現生成装置は、局所特徴量抽出部4と、クラスタ生成部5とを備えている。
距離算出部1は、対象画像におけるi番目の対象局所特徴量と、後述する複数のクラスタとのそれぞれの距離を算出する構成となっている。ここで、対象画像とは、学習工程における学習画像、または、検索(認識)工程におけるクエリ画像である。以降の説明では、基本的に、学習工程を念頭において説明するが、検索工程においても同様の説明が妥当する。また、i番目の対象局所特徴量とは、特定の対象画像における特定の(通常は任意の一つの)局所特徴量を意味する。したがって、iは、通常は、任意の自然数である。例えば、局所特徴量の数が10個であれば、iがとる値は、一般的には、1≦i≦10となるが、連番でない値をとることは可能である。
クラスタ特定部2は、i番目の対象局所特徴量との距離が、他のクラスタよりも相対的に近い、複数のクラスタを特定する構成となっている。もちろん、既定の条件を満たさない場合は、クラスタ特定部2は、一つのクラスタのみを特定するか、あるいは、クラスタを全く特定しないという処理を行うことができる。
より具体的には、本実施形態のクラスタ特定部2は、i番目の対象局所特徴量との距離が既定値以内である複数のクラスタをすべて、あるいは既定個数(例えば3個以下)だけ特定する処理を行う構成となっている。
BoF表現生成部3は、特定された複数のクラスタIDの情報を用いて、対象画像に対応するBoF表現を生成する構成となっている。すなわち、IDの情報のヒストグラムが、BoF表現に相当する。生成されるBoF表現の具体例は後述する。
局所特徴量抽出部4は、入力された対象画像(学習画像又はクエリ画像)のデータを用いて、局所特徴量を抽出する構成となっている。局所特徴量の抽出手法に関しては、従来と同様の技術(例えばSIFT)を用いることができるので、詳細についての説明は省略する。局所特徴量を抽出すべき部分の特定手法としては、画像全体を所定サイズ毎に分割する手法と、画像における特徴的領域を特定する手法とがあるが、どちらを採用しても良い。また、これらの手法についても、従来と同様の技術を用いることができるので、詳しい説明は省略する。
クラスタ生成部5は、生成された局所特徴量をクラスタリングして、クラスタを生成する構成となっている。クラスタリングの手法としては、たとえばk-meansを用いることができるが、特に制約されない。また、クラスタリング手法としては、既存の手法を利用可能なので、それについての詳しい説明は省略する。
(本実施形態によるBoF表現の生成方法)
次に、図2〜図11をさらに参照しながら、前記した装置を用いたBoF表現の生成方法について説明する。まず、図2を参照して、全体的な手順を説明し、その後、各手順の詳細を説明する。
(図2のステップSA−1)
まず、入力された学習用の画像データを用いて、局所特徴量のクラスタを生成する。
(図2のステップSA−2)
ついで、生成されたクラスタを用いて、学習画像又はクエリ画像についての各局所特徴量をマッピングする。つまり、局所特徴量に対応するクラスタIDを特定する。
(図2のステップSA−3)
ついで、特定されたクラスタIDのヒストグラムを用いて、学習画像又はクエリ画像についてのBoF表現を生成する。
以下、各工程について詳しく説明する。
(クラスタ生成手順)
(図3のステップSB−1)
まず、局所特徴量抽出部4は、学習用の画像データ(図4参照)を受け付ける。画像データとは、例えば、検索対象となる商品の写真であるが、特に制約されない。
(図3のステップSB−2)
ついで、局所特徴量抽出部4は、受け付けた画像データから、局所特徴量を抽出する(図5参照)。この工程は、学習用の各画像データについて行われる。
(図3のステップSB−3)
ついで、クラスタ生成部5は、特徴量空間内の局所特徴量をクラスタリングし、クラスタを生成する。生成されるクラスタの一例を図6に示す。なお、図6では、クラスタ半径を示しているが、クラスタ半径を定義する必要はなく、例えば、クラスタ中心を基準としたボロノイ分割により領域を分けることができる。要するに、クラスタ中心が決まれば、後述する手順を実行できる。
クラスタ生成部5は、得られた各クラスタについてのクラスタIDを生成する。クラスタIDは、例えば、クラスタに付される番号であるが、クラスタを特定できる情報であれば、特に制約されない。さらに本実施形態のクラスタ生成部5は、各クラスタを代表する代表局所特徴量を算出する。代表局所特徴量とは、例えば、クラスタ重心にもっとも近い局所特徴量であるが、クラスタ重心の値を代表局所特徴量とすることもできる。
(図3のステップSB−4)
ついで、クラスタ生成部5は、適宜な記録手段(例えばハードディスク)に、生成されたクラスタに関する情報を記録する。
(マッピング)
ついで、生成されたクラスタを用いてBoF表現を生成するためのマッピング手法を、図7をさらに参照しながら説明する。
(図7のステップSC−1)
まず、量子化の対象となる画像(学習画像又はクエリ画像)を、局所特徴量抽出部4が受け取る。
(図7のステップSC−2)
ついで、局所特徴量抽出部4は、受け取った画像における局所特徴量を抽出する。なお、学習画像に対する局所特徴量抽出部とクエリ画像に対する局所特徴量抽出部とは、異なるハードウエアあるいはソフトウエアにより実装されていても良いが、この明細書では、集合的に、局所特徴量抽出部4という表現を用いている。
(図7のステップSC−3)
ついで、距離算出部1は、抽出された各局所特徴量と、各クラスタ中心との距離を算出する。このようにして抽出された各局所特徴量を、この明細書ではi番目の局所特徴量と称している。
(図7のステップSC−4)
ついで、クラスタ特定部2は、局所特徴量とクラスタ中心との距離の情報を用いて、当該局所特徴量とクラスタIDとを関連付ける。ここで、本実施形態では、i番目の(つまり特定の一つの)対象局所特徴量との距離が、他のクラスタよりも相対的に近い複数のクラスタを、クラスタ特定部2が特定する。図8の例では、例えば、一つの局所特徴量に対して、既定距離内にある三つのクラスタID(すなわち#2、#4及び#5)を割り振っている。
各局所特徴量について、クラスタIDを割り振ることにより、画像全体に対するクラスタIDのヒストグラムを得ることができる。得られたヒストグラムがBoF表現に対応する。したがって、学習画像についてのBoF表現と、クエリ画像についてのBoF表現を生成することができ、これらのBoF表現の類似性あるいは同一性を基準として、類似画像の検索や画像認識を行うことができる。
(実施例及び比較例)
ここで、図9を参照しながら、クラスタIDを特定する手法について、さらに詳しく説明する。
画像(学習用又はクエリ用)の一例を、図9(a)に示す。この図を時計回りに90度回転させた状態を図9(b)に示す。ここで、この図の右目付近の領域の局所特徴量を考える。比較例では、従来と同様に、一つの局所特徴量が一つのクラスタに紐付けられる。この場合、図9(a)の局所特徴量F1が、クラスタ番号#1に割り当てられるにもかかわらず、図9(b)の局所特徴量F2が、クラスタ番号#2に割り当てられるという状況が生じうる(図9(c)参照)。同じ内容の画像であっても、照明条件の変化のような条件変化があると、局所特徴量が異なるためである。このように割り振られると、図9(a)の画像と図9(b)の画像では、生成されるBoF表現が異なってしまうので、結果的に、BoF表現を用いた検索の精度が劣化するという問題を生じる。なお、この比較例の手法により形成されるBoF表現の例を図10(a)に示す。この図に示されるクラスタIDで形成される集合が、BoF表現に相当する。この図の例では、例えば(24,2,4,90,3)という要素を持つベクトル(つまり局所特徴量)が、#39のクラスタIDに割り当てられる。
これに対して、実施例では、前記した実施形態の手法に従って、一つの局所特徴量が複数のクラスタに紐付けられる。すると、図9(a)の局所特徴量F1を、クラスタ番号#1及び#2に割り当てることができる。同様に、図9(b)の局所特徴量F2も、クラスタ番号#1及び#2に割り当てることができる。このように、実施例の手法では、画像の状態が変動していても、内容的に同じ部分画像に対する局所特徴量F1及びF2に対して、同じクラスタ番号を割り振ることが容易となる。したがって、本実施形態の手法によれば、BoFを用いた検索の精度を向上させることができるという利点がある。この実施例の手法により形成されるBoF表現の例を図10(b)に示す。この図に示されるクラスタIDで形成される集合が、BoF表現に相当する。例えば、(24,2,4,90,3)というベクトルが、#39と#27というクラスタに割り当てられる。この例では、局所特徴量に対して、最大3個、最小1個のクラスタIDが割り当てられている。なお、局所特徴量に対して割り当てられるクラスタIDの個数の最大値及び最小値は適宜設定可能である。最小値を0とすることもできる。また、局所特徴量に対して既定距離にあるすべてのクラスタIDを割り当てるという手法も可能である。
(変形例1)
前記した実施形態では、一つの局所特徴量に対して既定距離内にある複数のクラスタIDを割り振る構成とした。しかしながら、一つの局所特徴量に対して近い順に既定個数のクラスタIDを割り振ることも可能である。この場合は、一つの局所特徴量に割り当てられるクラスタIDの個数は既定値(例えば2個)となる。
(変形例2)
クラスタ特定部2は、学習局所特徴量の原画像である学習画像と対象画像(学習又はクエリ画像)とのジャンルの異同に応じて、特定されるべき前記クラスタの数を変動させる構成であってもよい。例えば、クラスタ生成に使用した学習画像のジャンルが風景であり、一方、認識対象の画像のジャンルが人物であったときは、一つの局所特徴量に割り当てるクラスタの数を増やす。このようにすれば、画像検索の精度の向上を期待できる。なお、画像が属するジャンルの決定は、例えば人手により行うことができる。また、各画像に対して、ジャンル情報をあらかじめ付与しておくこともできる。
(変形例3)
クラスタ特定部2は、生成されたBoF表現を用いた検索において得られた検索結果の確信度に応じて、特定されるべきクラスタの数を変動させる構成であってもよい。ここで、検索結果の確信度とは、検索結果に対する信頼性を意味しており、それは例えば、生成されたBoF表現(ヒストグラムのベクトルデータ)とDB中のすべてのBoF表現(つまり学習データ)との距離(例えばユークリッド距離)を算出して、最も距離の小さいBoF表現を検索結果とする場合には、その距離が確信度となる。距離が小さい時は確信度が高く、距離が大きい時は確信度が低いと考えることができる。また、距離に対して閾値を設定して、閾値を超えたBoF表現を検索結果とする場合には、検索数が確信度となる。得られた検索数が少ないときは、検索結果の確信度が低いと考えることができる。さらに、BoF表現で検索した後に、この検索で得られた画像における局所特徴量の座標と、認識対象の画像における局所特徴量の座標との位置関係を照合する機能がある場合には、照合の一致度合いを確信度とすることも可能である。局所特徴量の座標を用いた照合の手法としては、既存手法を利用可能なので、詳しい説明は省略する。
すなわち、BoF表現を用いた検索においては、BoF表現の一致度を基準として検索を行う。このとき、検索結果の確信度が低い(例えば検索で得られた画像の数が0個である)場合には、一つの局所特徴量に割り当てられるクラスタの数を増やすことができる。単に、BoF表現一致度の基準値を下げてしまうと、検索精度の劣化が危惧されるが、この変形例2のようにすれば、検索精度の向上を期待できる。
(変形例4)
BoF表現生成部3は、i番目の(つまり任意の一つの)対象局所特徴量と、特定されたクラスタとの距離に応じて、BoF表現の重み付けを行う構成であってもよい。例えば、一つの局所特徴量に対して、二つのクラスタID(仮にID番号を#1と#2とする)が割り当てられると仮定する。このとき、局所特徴量をクラスタ中心との距離に応じて、クラスタIDのヒストグラムに重み付けを行う。重み付けの手法は特に制約されないが、例えば、重みの値をWとすると、
W=a・1/d
とすることができる。ここで、dは距離、aは正の比例定数である。なお、計算の便宜上、重みの最大値Wmaxを1に正規化することが好ましい。
この重みの値を考慮したヒストグラムを用いて、BoF表現の一致度を計算することができる。
なお、本発明の内容は、前記実施形態に限定されるものではない。本発明は、特許請求の範囲に記載された範囲内において、具体的な構成に対して種々の変更を加えうるものである。
例えば、前記した各構成要素は、機能ブロックとして存在していればよく、独立したハードウエアとして存在しなくても良い。また、実装方法としては、ハードウエアを用いてもコンピュータソフトウエアを用いても良い。さらに、本発明における一つの機能要素が複数の機能要素の集合によって実現されても良く、本発明における複数の機能要素が一つの機能要素により実現されても良い。
また、機能要素は、物理的に離間した位置に配置されていてもよい。この場合、機能要素どうしがネットワークにより接続されていても良い。グリッドコンピューティング又はクラウドコンピューティングにより機能を実現し、あるいは機能要素を構成することも可能である。
1 距離算出部
2 クラスタ特定部
3 BoF表現生成部
4 局所特徴量抽出部
5 クラスタ生成部

Claims (8)

  1. 複数の学習局所特徴量に対するクラスタリングにより生成される複数のクラスタを用いて、対象画像に対応するBoF表現を生成するための装置であって、
    前記対象画像におけるi番目の対象局所特徴量と、前記複数のクラスタとのそれぞれの距離を算出する距離算出部と、
    前記i番目の対象局所特徴量との距離が、他のクラスタよりも相対的に近い、複数のクラスタを、前記i番目の対象局所特徴量ごとに特定するクラスタ特定部と、
    前記i番目の対象局所特徴量ごとに特定された前記複数のクラスタのID情報の統合的なヒストグラムとして、前記対象画像に対応するBoF表現を生成するBoF表現生成部と
    を備えることを特徴とする、BoF表現生成装置。
  2. 前記クラスタ特定部は、前記i番目の対象局所特徴量との距離が既定値以内である複数のクラスタを特定する処理を行う構成となっている
    請求項1に記載のBoF表現生成装置。
  3. 前記クラスタ特定部は、前記i番目の対象局所特徴量との距離が近い順に複数のクラスタを特定する処理を行う構成となっている
    請求項1に記載のBoF表現生成装置。
  4. 前記クラスタ特定部は、前記学習局所特徴量の原画像である学習画像と前記対象画像とのジャンルの異同に応じて、特定されるべき前記クラスタの数を変動させる構成となっている
    請求項1〜3のいずれか1項に記載のBoF表現生成装置。
  5. 前記クラスタ特定部は、生成されたBoF表現を用いた画像検索において得られた検索結果の確信度に応じて、特定されるべき前記クラスタの数を変動させる構成となっている
    請求項1〜4のいずれか1項に記載のBoF表現生成装置。
  6. 前記BoF表現生成部は、前記i番目の対象局所特徴量と、前記特定されたクラスタとの距離に応じて、前記BoF表現の重み付けを行う構成となっている
    請求項1〜5のいずれか1項に記載のBoF表現生成装置。
  7. 複数の学習局所特徴量に対するクラスタリングにより生成される複数のクラスタを用いて、対象画像に対応するBoF表現を生成するためのBoF表現生成装置を用いて実行されるBoF表現生成方法であって、
    BoF表現生成装置は、距離算出部と、クラスタ特定部と、BoF表現生成部とを備えており、
    前記距離算出部が、前記対象画像におけるi番目の対象局所特徴量と、前記複数のクラスタとのそれぞれの距離を算出するステップと、
    前記i番目の対象局所特徴量との距離が、他のクラスタよりも相対的に近い、複数のクラスタを、前記i番目の対象局所特徴量ごとに前記クラスタ特定部が特定するステップと、
    前記BoF表現生成部が、前記i番目の対象局所特徴量ごとに特定された前記複数のクラスタのID情報の統合的なヒストグラムとして、前記対象画像に対応するBoF表現を生成するステップと
    を備えることを特徴とする、BoF表現生成方法。
  8. 請求項7に記載の各ステップをコンピュータに実行させるためのコンピュータプログラム。
JP2012192738A 2012-09-03 2012-09-03 BoF表現生成装置及びBoF表現生成方法 Active JP5520353B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012192738A JP5520353B2 (ja) 2012-09-03 2012-09-03 BoF表現生成装置及びBoF表現生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012192738A JP5520353B2 (ja) 2012-09-03 2012-09-03 BoF表現生成装置及びBoF表現生成方法

Publications (2)

Publication Number Publication Date
JP2014048989A JP2014048989A (ja) 2014-03-17
JP5520353B2 true JP5520353B2 (ja) 2014-06-11

Family

ID=50608565

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012192738A Active JP5520353B2 (ja) 2012-09-03 2012-09-03 BoF表現生成装置及びBoF表現生成方法

Country Status (1)

Country Link
JP (1) JP5520353B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6047120B2 (ja) * 2014-06-20 2016-12-21 ヤフー株式会社 ビジュアルキーワード探索装置及びビジュアルキーワード探索方法
JP6460926B2 (ja) * 2015-06-25 2019-01-30 Kddi株式会社 撮影画像に写る物体を検索するシステム及び方法
CN108241669A (zh) * 2016-12-26 2018-07-03 上海神计信息系统工程有限公司 一种自适应文本特征簇的构建方法和系统
WO2022003973A1 (ja) * 2020-07-03 2022-01-06 株式会社ソニー・インタラクティブエンタテインメント 訓練データ選別装置、訓練データ選別方法及びプログラム

Also Published As

Publication number Publication date
JP2014048989A (ja) 2014-03-17

Similar Documents

Publication Publication Date Title
Philbin et al. Lost in quantization: Improving particular object retrieval in large scale image databases
US11048966B2 (en) Method and device for comparing similarities of high dimensional features of images
KR100353798B1 (ko) 영상 객체 모양 정보 추출 방법 및 그를 이용한 내용기반 이미지 검색 시스템 및 그 방법
US10296534B2 (en) Storing and searching fingerprints derived from media content based on a classification of the media content
US9747308B2 (en) Method and apparatus for searching an image, and computer-readable recording medium for executing the method
CN108292310A (zh) 用于数字实体相关的技术
JP6378855B1 (ja) 画像検索システム、画像検索方法およびプログラム
AU2012202352A1 (en) Method, system and apparatus for determining a hash code representing a portion of an image
JP5094830B2 (ja) 画像検索装置、画像検索方法及びプログラム
US9116898B2 (en) Information conversion device, computer-readable recording medium, and information conversion method
JP5520353B2 (ja) BoF表現生成装置及びBoF表現生成方法
US20150332172A1 (en) Learning method, information processing device, and recording medium
JPWO2020050413A1 (ja) 認証用顔画像候補判定装置、認証用顔画像候補判定方法、プログラム、および記録媒体
JP2010250637A (ja) 画像サーバー、画像検索システム、画像検索方法および画像管理方法
JP2012079186A (ja) 画像検索装置、画像検索方法及びプログラム
JP2014211730A (ja) 画像検索システム、画像検索装置および画像検索方法
JP2010250630A (ja) 画像サーバー、画像検索システムおよび画像検索方法
JP7149976B2 (ja) 誤り訂正方法及び装置、コンピュータ読み取り可能な媒体
JP2014102772A (ja) 特徴ベクトルの集合で表されるコンテンツ間の類似度を算出するプログラム、装置及び方法
JP5791666B2 (ja) ビジュアルキーワードの動的生成装置
JP2010250634A (ja) 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法
JP5490859B2 (ja) ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法
JP2013073333A (ja) 画像マッチング装置及び画像マッチングプログラム
JP5646664B2 (ja) 画像照合装置及び画像照合方法
Bhattacharya et al. DT-RANSAC: a delaunay triangulation based scheme for improved RANSAC feature matching

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140404

R150 Certificate of patent or registration of utility model

Ref document number: 5520353

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250