JP5490859B2 - ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法 - Google Patents

ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法 Download PDF

Info

Publication number
JP5490859B2
JP5490859B2 JP2012192765A JP2012192765A JP5490859B2 JP 5490859 B2 JP5490859 B2 JP 5490859B2 JP 2012192765 A JP2012192765 A JP 2012192765A JP 2012192765 A JP2012192765 A JP 2012192765A JP 5490859 B2 JP5490859 B2 JP 5490859B2
Authority
JP
Japan
Prior art keywords
cluster
clustering
local feature
visual
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012192765A
Other languages
English (en)
Other versions
JP2014048994A (ja
Inventor
雅二郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2012192765A priority Critical patent/JP5490859B2/ja
Publication of JP2014048994A publication Critical patent/JP2014048994A/ja
Application granted granted Critical
Publication of JP5490859B2 publication Critical patent/JP5490859B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法に関するものである。
下記特許文献1に示されるように、局所特徴量を用いた画像認識手法が知られている。この手法では、画像を複数の部分に分割し、各部分に対応して局所特徴量を抽出し、この局所特徴量を用いて類似画像検索を行うことができる。これらの局所特徴量は、画像の特徴を精度良く表すために、通常、多次元のベクトルデータとされている。
ところで、下記特許文献1にも示されているように、局所特徴量を用いた類似画像検索では、計算量が膨大となる傾向がある。
そこで、局所特徴量を高速に検索するために、ビジュアルキーワードあるいはBoF(Bag of Features)という手法が提案されている。この手法では、複数の局所特徴量を予めクラスタリングすることにより、クラスタを代表する局所特徴量(つまりビジュアルキーワード)を算出する。さらに、各クラスタにIDを付す。これにより、各局所特徴量を、それが属するクラスタのIDに紐付けることができる。
すると、ある画像に対応する複数の局所特徴量の集合は、クラスタIDのヒストグラム(集合ということもできる)により置き換えることができる。このクラスタIDのヒストグラムを、BoF表現あるいは単にBoFと呼ぶ。一枚の画像に対応して、一つのBoF表現を得ることができる。生成されたBoF表現は、一般に転置ファイルによって検索できる。なお、BoF表現を「特徴ベクトル」と称することがあるが、本明細書では、画像の特徴量を示す特徴ベクトルとの混同を避けるため、BoF表現という用語を用いる。
このように、BoF表現を用いることにより、局所特徴量を量子化して、データ量を減らすことができる。しかも、検索には転置ファイルを利用できるので、局所特徴量自体を用いるよりも高速な類似画像検索(つまり画像認識)が可能となる。
ところで、局所特徴量のクラスタリングにおいては、局所特徴量の距離が近いものどうしをグループ化し、その中心にあるか又は中心に近い局所特徴量をビジュアルキーワードとして抽出する。
しかしながら、多次元ベクトルである局所特徴量どうしの間の距離と、主観的な画像の類似性とは、必ずしも対応しない。つまり、局所特徴量どうしの距離が近い二つの部分画像を比較したとき、主観的には、必ずしも類似画像ではないことが少なくない。
また、一般的に、局所特徴量の数が増えると、特徴量空間上ではそれらがほぼ均一に分布する傾向がある。一方、有意義なクラスタ形成には、対象となるデータ点の分布の偏りが前提となる。このため、局所特徴量については、通常のクラスタリング手法では、有意義なクラスタを形成することが難しい。
これらの理由から、従来のビジュアルキーワードあるいはBoF表現を用いた画像検索においては、ビジュアルキーワードを適切に選択することが難しくなっており、そのため、十分な検索精度を得られないことが多かった。
特開2011−128773号公報(0003〜0005段落、0069段落) 特開平10−243250号公報(色分布をクラスタリングする手法) 特開2009−48575号公報(クラスタに含まれるベクトル数の偏りを少なくする手法) 特開2012−137908号公報(木構造インデックスを用いたクラスタ生成手法)
本発明は、前記した状況に鑑みてなされたものである。本発明の主な目的は、精度の良い画像検索を行うことが可能なビジュアルキーワードを生成する手法を提供することである。
本発明は、以下のいずれかの項目に記載の構成とされている。
(項目1)
複数の学習局所特徴量に対してクラスタリングを行うことによって、BoF表現生成用のビジュアルキーワードを抽出する装置であって、
前記複数の学習局所特徴量を受け付ける受付部と、
既定個数以内の前記学習局所特徴量が一つのクラスタに属するようにクラスタリングを行うクラスタリング部と、
前記クラスタリング部により生成されたクラスタを代表するビジュアルキーワードを抽出する抽出部と
を備えることを特徴とする、ビジュアルキーワード抽出装置。
(項目2)
前記クラスタリング部は、以下の処理により、前記クラスタリングを行う、項目1に記載のビジュアルキーワード抽出装置:
(a)ルートノードを生成する処理;
(b)データ点を前記学習局所特徴量の集合Sから得る処理;
(c)ルートノードをターゲットノードとする処理;
(d)ターゲットノードが内部ノードならば、それに属する子ノードの中心点と前記データ点との距離が最も近い子ノードをターゲットノードとして、さらにこの処理(d)を繰り返す処理;
(e)ターゲットノードがリーフノードであり、かつ、リーフノードのデータ点の数が閾値n未満であれば、そのリーフノードにデータ点を追加する処理;
(f)ターゲットノードがリーフノードであり、かつ、リーフノードのデータ点の数が閾値n以上であれば、リーフノードに属しているデータ点の集合を二つ又はそれ以上の部分空間に分割し、当該リーフノードを内部ノードに変更した上で、生成した当該部分空間に対応する新たなリーフノードを生成する処理。
(項目3)
前記抽出部は、以下の処理により、前記ビジュアルキーワードの抽出を行う、項目2に記載のビジュアルキーワード抽出装置:
生成された前記リーフノードの内、データ点数が閾値k(k≦n)以上のリーフノードの中心にあるか、または、それに最も近い前記学習局所特徴量を前記ビジュアルキーワードとして抽出する処理。
(項目4)
前記抽出部は、以下の処理により、前記ビジュアルキーワードの抽出を行う、項目2に記載のビジュアルキーワード抽出装置:
生成された前記リーフノードの内、データ点数が閾値k(k≦n)以上のリーフノードに属する前記学習局所特徴量の重心を前記ビジュアルキーワードとして抽出する処理。
(項目5)
前記クラスタリング部は、前記学習局所特徴量の原画像である学習画像の撮影条件の変動量に応じて、前記既定個数を変動させる構成となっている
項目1〜4のいずれか1項に記載のビジュアルキーワード抽出装置。
(項目6)
項目1〜5のいずれか1項に記載のビジュアルキーワード抽出装置と、BoF表現生成部とを備えており、
前記BoF表現生成部は、対象画像における対象局所特徴量に最も近い前記ビジュアルキーワードに対応するクラスタのIDを特定し、このクラスタのIDを用いてBoF表現を生成する構成となっている
BoF表現生成装置。
(項目7)
複数の学習局所特徴量に対してクラスタリングを行うことによって、BoF表現生成用のビジュアルキーワードを抽出するビジュアルキーワード抽出装置を用いて実行されるビジュアルキーワード抽出方法であって、
前記ビジュアルキーワード抽出装置は、受付部と、クラスタリング部と、抽出部とを備えており、
前記受付部が、前記複数の学習局所特徴量を受け付けるステップと、
前記クラスタリング部が、既定個数以内の前記学習局所特徴量を一つのクラスタに属させるようにクラスタリングを行うステップと、
前記抽出部が、前記クラスタリング部により生成されたクラスタを代表するビジュアルキーワードを抽出するステップと
を備えることを特徴とする、ビジュアルキーワード抽出方法。
(項目8)
項目7に記載の各ステップをコンピュータに実行させるためのコンピュータプログラム。
このコンピュータプログラムは、適宜な記録媒体(例えばCD−ROMやDVDディスクのような光学的な記録媒体、ハードディスクやフレキシブルディスクのような磁気的記録媒体、あるいはMOディスクのような光磁気記録媒体)に格納することができる。このコンピュータプログラムは、インターネットなどの通信回線を介して伝送されることができる。
本発明によれば、精度の良い画像検索を行うことが可能なビジュアルキーワードを生成する手法を提供することが可能となる。
本発明の一実施形態に係るビジュアルキーワード抽出装置の概略的なブロック図である。 本発明の一実施形態に係るビジュアルキーワード抽出方法を用いたBoF表現生成方法の全体的な手順を示すフローチャートである。 複数の学習画像の一例を示す説明図である。 特徴量空間に配置された局所特徴量の一例を示す説明図である。 クラスタを生成する手順を説明するためのフローチャートである。 クラスタを生成する手順を説明するための説明図である。図(a)は、特徴量空間に配置された局所特徴量の一例を示す。図(b)は従来のクラスタリング手法により生成されたクラスタの一例を示す。図(c)は本実施形態の手法により生成されたクラスタの一例を示す。図(d)は、要素数の少ないクラスタを削除した状態を示す。 ビジュアルキーワードを抽出する手順を説明するためのフローチャートである。
(本実施形態の構成)
本実施形態のビジュアルキーワード抽出装置は、受付部1と、クラスタリング部2と、抽出部3とを備えている(図1参照)。
受付部1は、局所特徴量抽出部6で生成された複数の学習局所特徴量を受け付ける構成となっている。局所特徴量抽出部6は、学習画像に基づいて、学習画像についての局所特徴量(この明細書では学習局所特徴量と称する)を抽出するための機能要素である。画像データから局所特徴量を抽出する手法としては、既存のものを利用できるので、これについての詳しい説明は省略する。局所特徴量としては、例えばSIFT(Scale-Invariant Feature Transform)特徴量を使用することができる。
クラスタリング部2は、既定個数以内の学習局所特徴量が一つのクラスタに属するようにクラスタリングを行う構成となっている。より詳しくは、クラスタリング部2は、以下の処理(a)〜(f)によりクラスタリングを行う構成となっている。
(a)ルートノードを生成する処理;
(b)データ点を学習局所特徴量の集合Sから得る処理;
(c)ルートノードをターゲットノードとする処理;
(d)ターゲットノードが内部ノードならば、それに属する子ノードの中心点とデータ点との距離が最も近い子ノードをターゲットノードとして、さらにこの処理(d)を繰り返す処理;
(e)ターゲットノードがリーフノードであり、かつ、リーフノードのデータ点の数が閾値n未満であれば、そのリーフノードにデータ点を追加する処理;
(f)ターゲットノードがリーフノードであり、かつ、リーフノードのデータ点の数が閾値n以上であれば、リーフノードに属しているデータ点の集合を二つ又はそれ以上の部分空間に分割し、当該リーフノードを内部ノードに変更した上で、生成した当該部分空間に対応する新たなリーフノードを生成する処理。
クラスタリング手法の詳細については後述する。
抽出部3は、クラスタリング部2により生成されたクラスタを代表するビジュアルキーワードを抽出する構成となっている。より詳しくは、抽出部3は、生成されたリーフノードの内、データ点数が閾値k(k≦n)以上のリーフノードの中心にあるか、または、それに最も近い学習局所特徴量をビジュアルキーワードとして抽出する構成となっている。
さらに、本実施形態の抽出部3は、生成されたリーフノードの内、データ点数が閾値k(k≦n)以上のリーフノードに属する学習局所特徴量の重心をビジュアルキーワードとして抽出する構成となっている。すなわち、本実施形態の抽出部3は、データ点数が既定値以下であるリーフノードからは、ビジュアルキーワードを抽出しない構成となっている。
抽出部3から出力されたビジュアルキーワードは、BoF表現生成部7に送られる。BoF表現生成部7では、入力される画像データ(学習データ又はクエリデータ)に対して、ビジュアルキーワードを用いて、BoF表現を生成する。すなわち、BoF表現生成部7は、対象画像における対象局所特徴量に最も近いビジュアルキーワードに対応するクラスタのIDを特定し、このクラスタのIDを用いてBoF表現を生成する構成となっている。後述するように、ビジュアルキーワードを用いたBoF表現の生成手法としては、既存のものを利用できるので、これについてのこれ以上詳しい説明は省略する。
(本実施形態の動作)
まず、前記したビジュアルキーワード抽出装置を用いたビジュアルキーワード抽出方法の全体的な流れを、図2をさらに参照しながら説明する。
(図2のステップSA−1)
まず、ビジュアルキーワード抽出の準備段階として、局所特徴量抽出部6により、学習画像(図3参照)から学習局所特徴量を抽出する。図示の例では、学習画像は、検索対象となる商品の画像であるが、画像の種類や分野に特段の制約はない。抽出された学習局所特徴量を特徴量空間に配置した状態を、図4に模式的に示す。
(図2のステップSA−2)
ついで、ビジュアルキーワード抽出装置の受付部1は、抽出された学習局所特徴量の入力を受け付ける。
(図2のステップSA−3)
ついで、クラスタリング部2は、入力された学習局所特徴量を用いて、クラスタを生成する。クラスタ生成手法の詳細は後述する。
(図2のステップSA−4)
ついで、抽出部3は、生成されたクラスタを用いて、ビジュアルキーワードを抽出する。ビジュアルキーワード抽出処理の詳細についても後述する。
(図2のステップSA−5)
ついで、BoF表現生成部7は、入力される画像データ(学習画像又はクエリ画像のデータ)に対して、本実施形態のビジュアルキーワード抽出装置で抽出されたビジュアルキーワードを適用することによって、クラスタIDのヒストグラムであるBoF表現を生成する。
(クラスタ生成の手順)
次に、図5をさらに参照して、クラスタリング部2によるクラスタ生成の詳しい手順を説明する。
(図5のステップSB−1)
まず、初期状態として、ルートノードを生成する。
(図5のステップSB−2)
ついで、データ点を学習局所特徴量の集合Sから取得する。図6(a)には、集合Sに属する局所特徴量の、特徴量空間中での分布状態を模式的に示す。
(図5のステップSB−3)
ついで、ルートノードをターゲットノードとする。ターゲットノードとは、判断処理の対象となるノードという意味である。
(図5のステップSB−4及びSB−5)
もし、ターゲットノードが内部ノードならば、それに属する子ノードの中心点とデータ点との距離が最も近い子ノードをターゲットノードとして、さらにこのステップを繰り返す。
(図5のステップSB−6及びSB−7)
ターゲットノードがリーフノードであり、かつ、リーフノードのデータ点の数が閾値n未満であれば、そのリーフノードにデータ点を追加する。ここで、nは、例えば実験的に決定できる自然数である。
(図5のステップSB−8)
ターゲットノードが内部ノードでなく(つまりリーフノードであり)、かつ、リーフノードのデータ点の数が閾値n以上であれば、リーフノードに属しているデータ点の集合を二つ又はそれ以上の部分空間に分割する。分割には既存のクラスタリング手法を用いれば良い。そして、当該リーフノードを内部ノードに変更した上で、生成した当該部分空間に対応する新たなリーフノードを生成する。
(図5のステップSB−9)
ついで、集合Sに新たなデータ点があれば、ステップSB−2に戻る。新たなデータ点がなければ、クラスタ生成処理を終了し、クラスタのデータを適宜な記録媒体又は処理装置に出力する。もちろん、クラスタIDをこの時点で付すこともできる。なお、既定数以下のデータ点しか持たないクラスタをこの時点で削除することもできる。また、「集合Sにデータ点が残っていても、クラスタの個数が既定の上限値に達したらクラスタ生成処理を終了する」という構成を採用することも可能である。
従来のクラスタリング手法(例えばk-mean)では、クラスタに属するデータ点の数は一般には不均一であり(図6(b)参照)、しかも、クラスタリング処理に時間がかかる。これに対して、本実施形態のクラスタリング手法で得られるクラスタの一例を図6(c)に示す。本実施形態では、ノードに属するデータの要素数を基準にしてクラスタを生成するので、クラスタ毎のデータ点の個数を均一化することができる。クラスタ毎のデータ点の個数を均一化することにより、局所特徴量を、均一の類似性を示す部分空間に分割することが可能となる。この点を以下において詳しく説明する。
もし仮に、主観的類似性の座標軸を持つ空間(ただし、実際にはこの空間を表現できない)中に、データ点を均一に分散させたとする。このとき、一定の類似性の範囲内には、およそ均一な個数のデータ点が属すると考えることができる。そして、全データ点を、実データ(実際扱われるデータ)のための特徴量空間にマッピングしたとする。このとき、データ点の個数が均一となるようにクラスタリングできれば、おおよそ、一定の類似性の範囲内のデータを括れることになる。実際に、発明者らの知見によれば、データ点の数が増えると、実データの特徴量空間内で均一ではなくとも、主観的類似性の座標軸を持つ空間中では、データ点が均一に分散する傾向がある。よって、前記の傾向は、データ点の数が増えるほど、確実なものとなる。したがって、本実施形態によれば、得られたクラスタの各範囲は、ほぼ均一な類似範囲を示すものとなり、その結果、クラスタを代表するデータ点は、ほぼ一定な類似範囲を代表するものとなる。
しかも、本実施形態では、前記に示したように、空間を階層的に分割することによりクラスタを生成できるので、クラスタ生成処理に要する時間を短縮することが可能になるという利点もある。なお、図6(c)では、便宜的にクラスタ半径を記載しているが、クラスタ半径を決める必要はなく、クラスタ中心と、クラスタに属するデータ点とが決まればよい。例えば、クラスタIDと、クラスタ中心の特徴量ベクトルと、クラスタに属するデータ点とが関連付けて記録されていればよい。例えば各データ点をその点から最も近いクラスタ中心のクラスタに関連付けると、クラスタ間の境界の形状は、例えばボロノイ分割となる。
(ビジュアルキーワード抽出の手順)
次に、図7をさらに参照して、抽出部3によるビジュアルキーワード抽出手順の具体的な一例を説明する。
(図7のステップSC−1)
まず、クラスタリングによって生成されたクラスタの一つを特定する。なお、以下の説明では、説明の便宜上、クラスタ毎に処理を行うと仮定するが、当然ながら、複数のクラスタについて並行して処理を行うことは可能である。
(図7のステップSC−2)
ついで、当該クラスタに属するデータ点を特定する。データ点の個数は、前記したクラスタリング手法の結果として、閾値n未満となっている。
(図7のステップSC−3及びSC−4)
ついで、当該クラスタに属するデータ点の数が、既定値k以上かどうかを判断する。既定値kは、n以下の自然数とされる。たとえば、既定値kとしては、4や6を指定できるが、これより大きい(又は小さい)数を指定することは可能である。データ点の数が既定値k未満であれば、当該クラスタを無視し(図6(d)参照)、ステップSC−1に戻って、他のクラスタを特定する。複数のクラスタを並行して処理する場合は、単に当該クラスタを無視すればよい。なお、kの値の大小により、ビジュアルキーワード抽出の基本となるクラスタの個数を制御できる。つまり、kの値を大きくすることで、ビジュアルキーワードの数を減らすことができるので、認識速度の向上が期待できる。一方、kの値を小さくすることにより、ビジュアルキーワードの数を増加させることができるので、画像の検索精度の向上を期待できる。
(図7のステップSC−5)
ついで、当該クラスタに属するデータ点の重心を計算する。データ点はベクトル量なので、重心は既知の手法で算出できる。この明細書では、データ点の重心をクラスタの中心と称することがある。
(図7のステップSC−6)
ついで、データ点の重心に位置するか、それにもっとも近いデータ点を特定する。これは、算出されたデータ点の重心そのものを、データ点として特定する場合を含む意味である。特定されたデータ点は、クラスタ中心の特徴量となる。なお、クラスタリング部2のクラスタ生成におけるリーフノードの分割(ステップSB−8参照)時のクラスタリングにより抽出されたクラスタ中心を、そのままこのクラスタ中心として利用しても良い。そして、抽出部3は、クラスタ中心の特徴量を、ビジュアルキーワードとして特定し、それを、所定の記憶手段又は処理装置に出力する。本実施形態では、ビジュアルキーワードは、BoF表現生成部7に送られ、BoF表現生成のために用いられる。
ここで、本実施形態では、前記したように、均一な類似範囲に対応するように特徴量空間を分割して、クラスタを生成することができるので、クラスタを代表するビジュアルキーワードは、均一に分割された類似範囲を代表するものとなる。そして、このようなビジュアルキーワードを用いて生成されたBoF表現は、画像の特徴を精度良く表現するものになる傾向がある。したがって、このようにして生成されたBoF表現を用いた画像認識(あるいは画像検索)は、主観的な類似性を満足する可能性が高く、その結果、画像検索の信頼性(つまり精度)を向上させることができる。
また、要素数の少ないクラスタを基準としてビジュアルキーワードを抽出すると、抽出されたキーワードの信頼性が低くなるという傾向がある。これに対して、本実施形態のビジュアルキーワード抽出手法によれば、要素数の少ないクラスタを無視してビジュアルキーワードを抽出できるので、ビジュアルキーワードの信頼性を向上させることができるという利点がある。
なお、本実施形態におけるBoF表現の生成手法自体は既存の手法を用いることができるので、それについての詳しい説明は省略する。また、生成されたBoF表現を用いた類似画像の検索手法(すなわち画像認識手法)自体も、既存の手法を利用可能なので、説明を省略する。
(変形例)
クラスタリング部2は、学習局所特徴量の原画像である学習画像の撮影条件の変動量に応じて、前記図5のステップSB−6における閾値n(つまり既定個数)を変動させる構成であっても良い。
例えば、本実施形態において、「撮影条件のゆらぎが小さいときは、それに応じて閾値nの値を小さくする」という処理が可能である。撮影条件のゆらぎが小さいときは、閾値nが小さくても、信頼性のあるビジュアルキーワードを生成する可能性が高まると考えられる。このため、このような処理を行うことにより、高い信頼性を持つ多数のビジュアルキーワードを生成でき、その結果、BoF表現を用いた画像認識の精度向上を期待できるという利点がある。
代替的に、あるいは追加的に、本実施形態において、「撮影条件のゆらぎが大きいときは、それに応じて閾値nの値を大きくする」という処理も可能である。撮影条件のゆらぎが大きく、かつ、閾値nが小さい場合は、信頼性のあるビジュアルキーワードを生成する可能性が低いと考えられる。このため、閾値nを大きくすることにより、信頼性の高いビジュアルキーワードを生成でき、その結果、BoF表現を用いた画像認識の精度向上を期待できるという利点がある。
前記において、「撮影条件のゆらぎの大きさ」について測定やその入力は、人手によることが考えられるが、何らかの自動化手法を適用することは可能である。
なお、本発明の内容は、前記実施形態に限定されるものではない。本発明は、特許請求の範囲に記載された範囲内において、具体的な構成に対して種々の変更を加えうるものである。
例えば、前記した各構成要素は、機能ブロックとして存在していればよく、独立したハードウエアとして存在しなくても良い。また、実装方法としては、ハードウエアを用いてもコンピュータソフトウエアを用いても良い。さらに、本発明における一つの機能要素が複数の機能要素の集合によって実現されても良く、本発明における複数の機能要素が一つの機能要素により実現されても良い。
また、機能要素は、物理的に離間した位置に配置されていてもよい。この場合、機能要素どうしがネットワークにより接続されていても良い。グリッドコンピューティング又はクラウドコンピューティングにより機能を実現し、あるいは機能要素を構成することも可能である。
1 受付部
2 クラスタリング部
3 抽出部
6 局所特徴量抽出部
7 BoF表現生成部

Claims (8)

  1. 複数の学習局所特徴量に対してクラスタリングを行うことによって、BoF表現生成用のビジュアルキーワードを抽出する装置であって、
    前記複数の学習局所特徴量を受け付ける受付部と、
    既定個数以内の前記学習局所特徴量が一つのクラスタに属するようにクラスタリングを行うクラスタリング部と、
    前記クラスタリング部により生成されたクラスタを代表するビジュアルキーワードを抽出する抽出部と
    を備えており、
    さらに、前記装置は、
    前記クラスタリング部でのクラスタリングにより生成されたクラスタに属する前記学習局所特徴量の個数が既定個数以下であれば当該クラスタを削除する処理、
    及び、
    前記クラスタリング部でのクラスタリングにより生成されたクラスタに属する前記学習局所特徴量の個数が既定個数以下であれば、前記抽出部における前記ビジュアルキーワードを抽出する対象から当該クラスタを除外する処理、
    のうちのいずれかの処理を行うことにより、前記ビジュアルキーワードが抽出される前記クラスタに属する前記学習局所特徴量の個数を均一化する構成となっていることを特徴とする、ビジュアルキーワード抽出装置。
  2. 前記クラスタリング部は、以下の処理により、前記クラスタリングを行う、請求項1に記載のビジュアルキーワード抽出装置:
    (a)ルートノードを生成する処理;
    (b)データ点を前記学習局所特徴量の集合Sから得る処理;
    (c)ルートノードをターゲットノードとする処理;
    (d)ターゲットノードが内部ノードならば、それに属する子ノードの中心点と前記データ点との距離が最も近い子ノードをターゲットノードとして、さらにこの処理(d)を繰り返す処理;
    (e)ターゲットノードがリーフノードであり、かつ、リーフノードのデータ点の数が閾値n未満であれば、そのリーフノードにデータ点を追加する処理;
    (f)ターゲットノードがリーフノードであり、かつ、リーフノードのデータ点の数が閾値n以上であれば、リーフノードに属しているデータ点の集合を二つ又はそれ以上の部分空間に分割し、当該リーフノードを内部ノードに変更した上で、生成した当該部分空間に対応する新たなリーフノードを生成する処理。
  3. 前記抽出部は、以下の処理により、前記ビジュアルキーワードの抽出を行う、請求項2に記載のビジュアルキーワード抽出装置:
    生成された前記リーフノードの内、データ点数が閾値k(k≦n)以上のリーフノードの中心にあるか、または、それに最も近い前記学習局所特徴量を前記ビジュアルキーワードとして抽出する処理。
  4. 前記抽出部は、以下の処理により、前記ビジュアルキーワードの抽出を行う、請求項2に記載のビジュアルキーワード抽出装置:
    生成された前記リーフノードの内、データ点数が閾値k(k≦n)以上のリーフノードに属する前記学習局所特徴量の重心を前記ビジュアルキーワードとして抽出する処理。
  5. 前記クラスタリング部は、前記学習局所特徴量の原画像である学習画像の撮影条件の変動量に応じて、前記既定個数を変動させる構成となっている
    請求項1〜4のいずれか1項に記載のビジュアルキーワード抽出装置。
  6. 請求項1〜5のいずれか1項に記載のビジュアルキーワード抽出装置と、BoF表現生成部とを備えており、
    前記BoF表現生成部は、対象画像における対象局所特徴量に最も近い前記ビジュアルキーワードに対応するクラスタのIDを特定し、このクラスタのIDを用いてBoF表現を生成する構成となっている
    BoF表現生成装置。
  7. 複数の学習局所特徴量に対してクラスタリングを行うことによって、BoF表現生成用のビジュアルキーワードを抽出するビジュアルキーワード抽出装置を用いて実行されるビジュアルキーワード抽出方法であって、
    前記ビジュアルキーワード抽出装置は、受付部と、クラスタリング部と、抽出部とを備えており、
    前記受付部が、前記複数の学習局所特徴量を受け付けるステップと、
    前記クラスタリング部が、既定個数以内の前記学習局所特徴量を一つのクラスタに属させるようにクラスタリングを行うステップと、
    前記抽出部が、前記クラスタリング部により生成されたクラスタを代表するビジュアルキーワードを抽出するステップと
    を備えており、
    さらに、前記装置は、
    前記クラスタリング部でのクラスタリングにより生成されたクラスタに属する前記学習局所特徴量の個数が既定個数以下であれば当該クラスタを削除する処理、
    及び、
    前記クラスタリング部でのクラスタリングにより生成されたクラスタに属する前記学習局所特徴量の個数が既定個数以下であれば、前記抽出部における前記ビジュアルキーワードを抽出する対象から当該クラスタを除外する処理、
    のうちのいずれかの処理を行うことにより、前記ビジュアルキーワードが抽出される前記クラスタに属する前記学習局所特徴量の個数を均一化する構成となっていることを特徴とする、ビジュアルキーワード抽出方法。
  8. 請求項7に記載の各ステップをコンピュータに実行させるためのコンピュータプログラム。
JP2012192765A 2012-09-03 2012-09-03 ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法 Active JP5490859B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012192765A JP5490859B2 (ja) 2012-09-03 2012-09-03 ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012192765A JP5490859B2 (ja) 2012-09-03 2012-09-03 ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法

Publications (2)

Publication Number Publication Date
JP2014048994A JP2014048994A (ja) 2014-03-17
JP5490859B2 true JP5490859B2 (ja) 2014-05-14

Family

ID=50608570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012192765A Active JP5490859B2 (ja) 2012-09-03 2012-09-03 ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法

Country Status (1)

Country Link
JP (1) JP5490859B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6562984B2 (ja) * 2017-09-11 2019-08-21 ヤフー株式会社 生成装置、生成方法、及び生成プログラム
CN112513893B (zh) * 2018-08-03 2022-09-23 三菱电机株式会社 数据解析装置、系统、方法及程序

Also Published As

Publication number Publication date
JP2014048994A (ja) 2014-03-17

Similar Documents

Publication Publication Date Title
RU2686590C1 (ru) Способ и устройство для сравнения схожих элементов высокоразмерных признаков изображений
JP5862413B2 (ja) 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法
WO2014109127A1 (ja) インデックス生成装置及び方法並びに検索装置及び検索方法
JP2011128773A (ja) 画像検索装置、画像検索方法及びプログラム
WO2016006276A1 (ja) インデックス生成装置及びインデックス生成方法
JP2019204246A (ja) 学習データ作成方法及び学習データ作成装置
CN111651596A (zh) 一种文本聚类的方法、装置、服务器及存储介质
JP5490859B2 (ja) ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法
JP5520353B2 (ja) BoF表現生成装置及びBoF表現生成方法
US9400927B2 (en) Information processing apparatus and non-transitory computer readable medium
Duan et al. Minimizing reconstruction bias hashing via joint projection learning and quantization
JP5676692B2 (ja) 機械学習装置、機械学習方法、およびプログラム
JP2010250634A (ja) 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法
JP5061147B2 (ja) 画像検索装置
US10025851B2 (en) Information processing apparatus, information processing method and non-transitory computer readable medium
JP5602184B2 (ja) 特徴量生成装置及び特徴量生成方法
JP2015022466A (ja) ビジュアルキーワードの動的生成装置
JP5882976B2 (ja) 学習用局所特徴量生成装置及び学習用局所特徴量生成方法
JP4881928B2 (ja) カラーヒストグラム生成装置
CN111090743A (zh) 一种基于词嵌入和多值形式概念分析的论文推荐方法及装置
KR102289411B1 (ko) 가중치 기반의 피처 벡터 생성 장치 및 방법
JP5646664B2 (ja) 画像照合装置及び画像照合方法
JP5181821B2 (ja) 画像処理装置、画像処理方法、プログラム
JP2010250633A (ja) 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法
JP2019194815A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140226

R150 Certificate of patent or registration of utility model

Ref document number: 5490859

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250