JP6131723B2 - 情報処理装置、情報処理方法、プログラムおよび記録媒体 - Google Patents
情報処理装置、情報処理方法、プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP6131723B2 JP6131723B2 JP2013120922A JP2013120922A JP6131723B2 JP 6131723 B2 JP6131723 B2 JP 6131723B2 JP 2013120922 A JP2013120922 A JP 2013120922A JP 2013120922 A JP2013120922 A JP 2013120922A JP 6131723 B2 JP6131723 B2 JP 6131723B2
- Authority
- JP
- Japan
- Prior art keywords
- data group
- image
- distribution
- clustering
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/35—Categorising the entire scene, e.g. birthday party or wedding scene
Description
(1)クラス数を予め指定する必要がある。
データ群のクラス数が既知であることを前提としており、入力されたデータ群に対して最適なクラス数を選択することが困難である。
(2)初期値依存である。
K平均法では、データ群に対してまずランダムにクラスを割り当てるが、この結果としてクラスの初期配置に偏りが生じたり、データが割り当てられない空のクラスが生じたりする問題がある。
(3)再現性がない。
先述したように、K平均法では、データ群に対してまずランダムに初期クラスを割り当てる。したがって、この初期の割り振りが試行毎に異なるため、同じデータ群をクラスタリングする場合であっても毎回結果が異なってしまう。
本発明の目的は、データ群のクラスタリングに際して、既にクラスタリングされている類似するデータ群のモデルパラメータに基づいて初期値を決定し、この初期値を実際のデータ群に合わせて更新することで最適なクラスタリング結果を得る情報処理装置、情報処理方法、プログラムおよび記録媒体を提供することにある。
(1)入力データ群と類似する参照データ群を検索する。
入力データ群と所定の観点で類似すると判断される参照データ群をデータベースから検索する。参照データ群は事前に適切にクラスタリングされた上でデータベースに登録されているものとする。検索により取得された参照データ群601〜603の例を図6(d)に示す。この参照データ群601〜603と入力データ群501〜503とを比較すると分かるように、それぞれ3つの分布から構成され、概ね似たような形状と分布の重なり方をしている。
図6(d)の×印で示す、参照データ群601〜603のクラスタリング結果である参照パラメータを取得する。参照パラメータが内包する情報の例としては、データ群を構成する分布の数(クラス数)、各分布の中心位置、各分布の広がりの情報などが挙げられる。入力データ群と参照データ群の分布は類似しているため、参照データ群のクラスタリング結果(参照パラメータ)は入力データ群の理想的なクラスタリング結果に近いことが予想される。そこで、参照パラメータを入力データ群の初期値に設定する。
設定された初期値を用いて入力データ群501〜503をクラスタリングする。図6(e)の501c〜503cは、クラスタリング結果を示す。前述したように、設定された初期値は入力データ群の理想的なクラスタリング結果に近いことから、初期値を微調整することでクラスタリングが可能となる。したがって、大域最適解の近傍から探索が開始されるため、従来技術のように、局所解に落ちるリスクが低減されることが期待できる。
(1)クラスタリングする画像を入力する(S201)。
画像入力部101からクラスタリングを行う対象である入力画像を入力する。入力画像は予めCD、DVD、HDDなどの記録メディアに保存されているものを読み出しても良いし、図示しないスキャナなどで原稿を読み取っても良い。
画像解析部102は入力画像の特徴量を算出し、記憶部103に記憶する。この特徴量を用いてクラスタリングを行う特徴空間を張る。特徴量の例としては次のようなものが挙げられる。
(a)色:RGB値、CIE−XYZ値、CIE−Lab値など
(b)形状の記述子:SIFT、SURF、HoGなど
(c)テクスチャの記述子:Local Binary Pattern (LBP)、Harr−like特徴など
どの特徴量を用いるか、どのような観点で入力画像をクラスタリングするかに依存するため、クラスタリングの目的に応じてユーザが適切な特徴量並びに特徴空間を選択すればよい。また、画素値をそのまま特徴量として利用しても良い。
類似画像検索部106は入力画像と類似する参照画像を記録部109から検索する。例えば、入力画像の特徴量と参照画像の特徴量に基づいて類似度(距離など)を算出し、類似度の高い参照画像を検索する。このような類似画像検索技術は、例えば特許4340367号など公知のものを用いればよい。尚、類似画像検索に用いる特徴量は、先述したクラスタリングに用いるものと同じであっても良いし、別のものであっても良い。更に、画像に起因する特徴量だけでなく、特徴空間における確率密度分布を特徴付ける特徴量を新たに導出して、入力画像と参照画像との間の類似度を測っても良い。類似する参照画像が見つかった場合には(S204でYes)、S205に進み、見つからなかった場合には(S204でNo)、S209に進む。
・参照画像を記録部に登録した後に特徴量の種類を変更することが可能である。
・参照画像を画面に表示してユーザに提示することができる。
前者は画像そのものという完全な情報が存在すれば、特徴量はいつでも再計算可能であることに起因している。
・参照画像よりも特徴量の方がコンパクトな表現であるため、記録部の容量を削減できる。
・類似画像検索に際しては必ず特徴量を計算するため、検索のたびに特徴量を再計算する手間を省ける。
無論、参照画像とそこから求めた特徴量との両方を参照パラメータと対応付けて記録しても良い。
類似する参照画像が見つかれば、記録部109から類似する参照画像に対応付けて記録されている参照パラメータを読み出す。参照パラメータは参照画像をクラスタリングする際に用いられたモデルパラメータである。混合分布として混合ガウス分布を用いる場合には、モデルパラメータはクラス数Kと、各クラスを表すガウス分布のパラメータ(平均μ、分散s、混合重みw)から構成される。仮に特徴空間が3次元であれば平均μは3次元ベクトル、分散sは3×3の行列(共分散行列)、混合重みwはスカラー量である。尚、分散sは行列の対角成分のみを抽出した3次元ベクトルを用いても良い。また、3次元の特徴空間を3つの1次元の重ね合わせとして表現するのであれば、平均μ、分散s、混合重みwは何れもスカラー量となり、この組が1つのガウス分布に付き3つ必要となる。参照パラメータは事前に手作業でクラスタリングを行って作成してもよいし、以前にクラスタリングを行った結果を蓄積しても利用しても良い。
初期パラメータ決定部107は、類似する参照画像の参照パラメータを、類似度を用いて合成してモデルパラメータの初期値を決定する。合成方法としては、
(a)最も類似度の高い参照画像の参照パラメータを採用する方法
入力画像が参照画像と等しいと仮定して、該当する参照画像の参照パラメータをそのまま流用する方法である。最も単純な手法で、前述の仮定が成立するケースで最も高い効果を発揮する。
(b)予め設定された閾値を超える類似度を持つ参照画像に対応する参照パラメータを算術平均する方法
入力画像を複数の類似する参照画像の組み合わせとして表現する方法の中で、最も単純な方法である。入力画像と極めて近い参照画像が存在しないケースであっても、複数の類似する参照画像を用いて代替することで、比較的安定した結果が得られる。
(c)参照パラメータに類似度を重みとして重畳して加重平均する方法
入力画像を複数の類似する参照画像の組み合わせとして表現する方法の中で、入力画像に類似する参照画像ほど大きな影響を及ぼすように調整された合成方法である。算術平均を行うよりも計算の複雑度は高い反面、安定性と精度の向上が期待できる。
などが考えられる。尚、複数の参照パラメータを合成するためには、各参照画像の確率密度分布をモデル化した混合分布の各分布同士を画像間で対応付ける必要がある。この対応付けは次のように行えばよい。
混合分布では複数の分布が存在するため、複数の参照画像の参照パラメータを合成する際にはある参照画像の分布を別の参照画像のどの分布と対応付けるかが課題となる。このようなケースでは、次のような対応付け方が例示できる。
(a)分布の中心が最も近いものを対応付ける
参照画像Aの分布群{a1,…,ak}と参照画像Bの分布群{b1,…,bk}との間の中心間の距離を求め、最も近い分布同士を合成する方法である。分布間の距離はユークリッド距離など既知の技術を用いればよい。
(b)分布を所定の基準で並べて同じ順位のものを対応付ける
参照画像Aの分布群{a1,…,ak}と参照画像Bの分布群{b1,…,bk}を所定の基準でソートし、1番目の分布同士、2番目の分布同士、と順に対応付ける方法である。一例を挙げれば、特徴空間がCIE−Lab空間であるケースで明度の大きさで分布を並べ替えた上で、同じ順位の分布を対応付けるケースが考えられる。尚、(a)と(b)の中間的な方法として、同程度の明度の分布を対応付け方法も考えられる。
参照画像の間でクラス数が異なる場合には、次のような対応付け方が例示できる。
(a)最もクラス数の多い参照画像を基準にして前述の方法で分布間を対応付ける
基準とする参照画像を除けば、必ず他の参照画像の分布は基準とする参照画像の分布のいずれかに対応付けが成されるアプローチである。クラス数は変動しない。
(b)最もクラス数の少ない参照画像を基準にして前述の方法で分布間を対応付ける
基準とする参照画像を除けば、必ず他の参照画像の分布は基準とする参照画像の分布のいずれかに対応付けがなされるアプローチである。クラス数は変動しない。
(c)分布の中心が近いものを対応付けつつ、対応づかないものはそのまま残す(ORを取るイメージ)
分布の中心間の距離が最も近いものを対応付けつつ、所定の閾値を超える分布は対応付けずに単に追加していくアプローチである。クラス数は対応付けの過程で増加する場合がある。
(d)分布の中心が近いものを対応付けつつ、対応づかないものは削除する(ANDを取るイメージ)
分布の中心間の距離が最も近いものを対応付けつつ、所定の閾値を超える分布は対応付けずに無視するアプローチである。クラス数は対応付けの過程で減少する場合がある。
(e)分布の中心が近いものを対応付け、最終的に合成された分布の数が所定の閾値を超える分布のみを採用する
(c)と近いアプローチであるが、各分布に対して対応付けられた分布の数を管理し、これが閾値を超える(頻繁に対応付けが行われた)分布のみを残すアプローチである。
分布の中心の距離に基づいて対応付けるケースを例に図3に基づいて説明する。参照画像A(クラス数5)の分布{a1,a2,a3,a4,a5}と、参照画像B(クラス数4)の分布{b1,b2,b3,b4}があったとする。尚、説明の都合上、各分布は1次元で表現しており、また、分布間の重なりはないものとしている。
類似する参照画像が見つからなければ、初期パラメータ決定部107において従来技術と同様にモデルパラメータの初期値をランダムに決定する。
パラメータ更新部108は、前ステップで得られたモデルパラメータの初期値を、入力画像の特徴空間における確率密度分布に合わせて更新する。更新方法は従来技術を用いればよく、一例としてはEMアルゴリズムが挙げられる。
クラスタリング部104は、前ステップで得られたモデルパラメータに基づいて、特徴空間における確率密度分布をクラスタリングし、その結果を結果出力部105から出力する。出力する内容はクラスタリング結果の利用方法に応じて決定すればよく、例示すればモデルパラメータの値でも良いし、各画素とクラスとの対応関係のリストでも良いし、入力画像を特徴空間におけるクラスタリング結果に応じて分割した結果を画像として出力しても良い。
(a)ラベルマップ
入力画像と同じサイズのクラス番号を管理する画像(ラベルマップ)を用意し、入力画像の各画素が属するラベルの識別子をラベルマップの対応する画素に記録するものである。
(b)2値マップ
入力画像と同じサイズの画像(マップ)をクラス数だけ用意し、各クラスについて入力画像のある画素がそのクラスに属すればマップの対応する画素に1を、そうでなければ0を記録するものである。尚、2値マップに記録される値は0と1に限定されるわけではなく、クラスへの帰属の有無が判別できればどのような値を用いても良い。
(c)多値マップ
入力画像と同じサイズの画像(マップ)をクラス数だけ用意し、各クラスについて入力画像の各画素がそのクラスに属する確率をマップの対応する画素に記録するものである。一般にマップは0から1までの範囲の値を取り、全てのマップについて同じ画素の値を累積すると1になる。但し、多値マップの設計の仕方しだいではこの条件を満たさない場合もある。
(1)クラスタリングするデータ列を入力する(S401)。
データ列入力部301からクラスタリングを行う対象である入力データ列を入力する。入力データ列は予めCD、DVD、HDDなどの記録メディアに保存されているものを読み出しても良い。
データ列解析部302は入力データ列の特徴量を算出し、記憶部303に記憶する。この特徴量を用いてクラスタリングを行う特徴空間を張る。特徴量の例としては次のようなものが挙げられる。
(a)データの値そのもの
(b)データの勾配
どの特徴量を用いるか、どのような観点で入力データ列をクラスタリングするかに依存するため、クラスタリングの目的に応じてユーザが適切な特徴量並びに特徴空間を選択すればよい。入力データ列のデータまたはデータ群に対応する特徴量をこの特徴空間にマップすることで、モデル化の対象となる確率密度分布が構築される。
類似データ列検索部306は入力データ列と類似する参照データ列を記録部309から検索する。類似データ列検索技術はハミング距離やレーベンシュタイン距離など公知のものを用いればよい。尚、類似データ列検索に用いる特徴量は、先述したクラスタリングに用いるものと同じであっても良いし別のものであっても良い。類似する参照データ列が見つかった場合には(S404でYes)、S405に進み、見つからなかった場合には(S404でNo)、S409に進む。
類似する参照データ列が見つかれば、記録部309から類似する参照データ列に対応付けて記録されている参照パラメータを読み出す。参照パラメータは参照データ列をクラスタリングする際に用いられたモデルパラメータである。混合分布として混合ガウス分布を用いる場合には、モデルパラメータはクラス数Kと、各クラスを表すガウス分布のパラメータ(平均μ、分散s、混合重みw)から構成される。参照パラメータは事前に手作業でクラスタリングを行って作成してもよいし、以前にクラスタリングを行った結果を蓄積しても利用しても良い。
初期パラメータ決定部307は、類似する参照データ列の参照パラメータを、類似度を用いて合成する。合成方法としては、
(a)最も類似度の高い参照データ列の参照パラメータを採用する方法
入力データ列が参照データ列と等しいと仮定して、該当する参照データ列のモデルパラメータをそのまま流用する方法である。最も単純な手法で、前述の仮定が成立するケースで最も高い効果を発揮する。
(b)予め設定された閾値を超える類似度を持つ参照データ列に対応する参照パラメータを算術平均する方法
入力データ列を複数の類似する参照データ列の組み合わせとして表現する方法の中で、最も単純な方法である。入力データ列と極めて近い参照データ列が存在しないケースであっても、複数の類似する参照データ列を用いて代替することで、比較的安定した結果が得られる。
(c)参照パラメータに類似度を重みとして重畳して加重平均する方法
入力データ列を複数の類似する参照データ列の組み合わせとして表現する方法の中で、入力データ列に類似する参照データ列ほど大きな影響を及ぼすように調整された合成方法である。算術平均を行うよりも計算の複雑度は高い反面、安定性と精度の向上が期待できる。
などが考えられる。尚、複数の参照パラメータを合成するためには、各参照データ列の確率密度分布をモデル化した混合分布の各分布同士をデータ列間で対応付ける必要がある。この分布の対応付けに関しては、実施例1で説明した方法を実施すればよい。
類似する参照データ列が見つからなければ、初期パラメータ決定部307は従来技術と同様にモデルパラメータの初期値をランダムに決定する。
パラメータ更新部308は、前ステップで得られたモデルパラメータの初期値を、入力データ列の特徴空間における確率密度分布に合わせて更新する。更新方法は従来技術を用いればよく、一例としてはEMアルゴリズムが挙げられる。
クラスタリング部304は、前ステップで得られたモデルパラメータに基づいて、特徴空間における確率密度分布をクラスタリングし、その結果を結果出力部305から出力する。出力する内容はクラスタリング結果の利用方法に応じて決定すればよく、例示すればモデルパラメータの値でも良いし、各データとクラスとの対応関係のリストでも良い。対応関係は各データに唯一のクラスを割り当てる2値のものと、各データが各クラスに属する確率を与える多値のものとがある。
の初期値を入力画像に合わせて更新するパラメータ更新部、709は参照画像とその特徴量、並びにクラスタリング時に用いた混合分布のモデルパラメータ(参照パラメータ)を記録する記録部、710はネットワークバス、711は参照画像を表示する画像表示部、712は参照画像の選択を受け付ける画像選択部である。
・参照パラメータを合成してモデルパラメータの初期値を決定するステップ(S206)が省略された。
・見つかった類似する参照画像を表示するステップ(S805)が追加された。
・ユーザが表示された参照画像から1つ以上を選択するステップ(S806)が追加された。
・ユーザにより選択された参照画像の参照パラメータをモデルパラメータの初期値に設定するステップ(S807)が追加された。
(1)クラスタリングする画像を入力する(S801)。
(2)入力画像の特徴量を算出する(S802)。
(3)類似する参照画像を検索する(S803)。
(4)参照画像を表示する(S805)。
ユーザにより参照画像の選択を受け付ける。ユーザはマウスポインタなど一般的な入力機器を用いて、画像表示部711に表示された参照画像の中から入力画像のモデルパラメータの初期値として利用するものを選択する。前述したように、選択する画像は1つであっても良いし、複数であっても良い。
初期パラメータ決定部707は、ユーザにより選択された参照画像の参照パラメータを、モデルパラメータの初期値に設定し、初期値を決定する。尚、S805において、複数の類似する参照画像を表示し、S806においてユーザにより複数の参照画像の選択を受け付けた場合には、実施例1のS206における方法により参照パラメータを合成して、モデルパラメータの初期値を決定しても良い。
(7)モデルパラメータの初期値をランダムに決定する(S810)。
(8)モデルパラメータを更新する(S808)。
(9)クラスタリング結果を出力する(S809)。
(1)「クラス数を予め指定する必要がある」点に関して、
類似するデータ群の間でクラスタリング結果が類似するため、適切なクラス数も等しいと考えられる。そこで、本発明では、予め適切にクラスタリングされた類似データ群のモデルパラメータを流用することで、未知のデータ群に対しても適切なクラスタリングが行える。
類似するデータ群の間でクラスタリング結果が類似するため、モデルパラメータもほぼ等しいと考えられる。そこで、本発明では、初期値をランダムに生成するのではなく、予め適切にクラスタリングされた類似データ群のモデルパラメータを流用することで、未知のデータ群に対しても適切な初期値の設定が行える。尚、類似するデータ群の間で全ての分布が完全に一致するわけではないので、流用するモデルパラメータは初期値とし、それを実際のデータ群の性質に合わせて更新することによって、最適なモデル化とクラスタリングが可能となる。
従来技術では、モデルパラメータの初期値をランダムに割り当てていた。本発明では、適切にクラスタリングされた類似するデータ群のモデルパラメータを初期値として流用するため、初期値は複数回試行を行っても変わらず、クラスタリング結果に再現性が担保できる。
102 画像解析部
103 記憶部
104 クラスタリング部
105 結果出力部
106 類似画像検索部
107 初期パラメータ決定部
108 パラメータ更新部
109 記録部
110 ネットワークバス
Claims (10)
- 所定のデータ群から算出される特徴量がつくる特徴空間における前記データ群の確率密度分布を、複数の分布の重ね合せである混合分布モデルを用いてクラスタリングする情報処理装置であって、既にクラスタリングが行われたデータ群(以下、参照データ群)と、前記クラスタリングに用いられた混合分布のモデルパラメータ(以下、参照パラメータ)とを対応付けて記録する記録手段と、処理対象のデータ群に類似する参照データ群を前記記録手段から検索し、類似する参照データ群に対応する参照パラメータを取得する検索手段と、前記取得された参照パラメータに基づいて混合分布のモデルパラメータの初期値を決定する決定手段と、前記混合分布のモデルパラメータの初期値を、前記処理対象のデータ群の確率密度分布に応じて更新する更新手段と、前記更新されたモデルパラメータに基づいて前記処理対象のデータ群の確率密度分布をクラスタリングするクラスタリング手段を備えたことを特徴とする情報処理装置。
- 前記検索手段は、前記処理対象のデータ群と参照データ群との類似度に基づいて複数の参照パラメータを取得し、前記決定手段は、前記複数の参照パラメータを前記類似度に基づいて合成して初期値を決定することを特徴とする請求項1記載の情報処理装置。
- 前記検索手段は、前記処理対象のデータ群の特徴量と、前記参照データ群の特徴量に基づいて前記類似度を算出することを特徴とする請求項2記載の情報処理装置。
- 前記検索手段は、前記特徴量とは異なる特徴量を用いて前記処理対象のデータ群と参照データ群との類似度を算出することを特徴とする請求項2記載の情報処理装置。
- 前記混合分布を構成する各分布は、ガウス分布であることを特徴とする請求項1記載の情報処理装置。
- 前記処理対象のデータ群は画像であり、前記処理対象のデータ群を構成する各データは画素または画素の集合であることを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
- 前記検索手段は、画像の形状を表す特徴量またはテクスチャを表す特徴量を用いて、前記処理対象のデータ群と前記参照データ群との類似度を算出することを特徴とする請求項3記載の情報処理装置。
- 所定のデータ群から算出される特徴量がつくる特徴空間における前記データ群の確率密度分布を、複数の分布の重ね合せである混合分布モデルを用いてクラスタリングする情報処理方法であって、既にクラスタリングが行われたデータ群(以下、参照データ群)と、前記クラスタリングに用いられた混合分布のモデルパラメータ(以下、参照パラメータ)とを対応付けて記録する記録工程と、処理対象のデータ群に類似する参照データ群を前記記録工程から検索し、類似する参照データ群に対応する参照パラメータを取得する検索工程と、前記取得された参照パラメータに基づいて混合分布のモデルパラメータの初期値を決定する決定工程と、前記混合分布のモデルパラメータの初期値を、前記処理対象のデータ群の確率密度分布に応じて更新する更新工程と、前記更新されたモデルパラメータに基づいて前記処理対象のデータ群の確率密度分布をクラスタリングするクラスタリング工程を備えたことを特徴とする情報処理方法。
- 請求項8記載の情報処理方法をコンピュータに実現させるためのプログラム。
- 請求項8記載の情報処理方法をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013120922A JP6131723B2 (ja) | 2012-11-26 | 2013-06-07 | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
US14/064,484 US9519660B2 (en) | 2012-11-26 | 2013-10-28 | Information processing apparatus, clustering method, and recording medium storing clustering program |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012257203 | 2012-11-26 | ||
JP2012257203 | 2012-11-26 | ||
JP2013120922A JP6131723B2 (ja) | 2012-11-26 | 2013-06-07 | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014123341A JP2014123341A (ja) | 2014-07-03 |
JP6131723B2 true JP6131723B2 (ja) | 2017-05-24 |
Family
ID=50774182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013120922A Active JP6131723B2 (ja) | 2012-11-26 | 2013-06-07 | 情報処理装置、情報処理方法、プログラムおよび記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9519660B2 (ja) |
JP (1) | JP6131723B2 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6299299B2 (ja) * | 2014-03-14 | 2018-03-28 | オムロン株式会社 | 事象検出装置および事象検出方法 |
US20150363660A1 (en) * | 2014-06-12 | 2015-12-17 | Asap54.Com Ltd | System for automated segmentation of images through layout classification |
CN105279749A (zh) * | 2014-07-02 | 2016-01-27 | 深圳Tcl新技术有限公司 | 图片抠图方法及装置 |
CN105447008A (zh) * | 2014-08-11 | 2016-03-30 | 中国移动通信集团四川有限公司 | 时序聚类的分布式处理方法及系统 |
CN104615638B (zh) * | 2014-11-25 | 2017-11-07 | 浙江银江研究院有限公司 | 一种面向大数据的分布式密度聚类方法 |
CN107133549B (zh) | 2016-02-29 | 2020-11-24 | 上海联影医疗科技有限公司 | Ect运动门控信号获取方法及ect图像重建方法 |
CN106251381B (zh) * | 2016-07-29 | 2020-02-04 | 上海联影医疗科技有限公司 | 图像重建方法 |
WO2018025845A1 (ja) * | 2016-08-03 | 2018-02-08 | 日本電気株式会社 | 検出装置、検出方法及びプログラムを記憶する記憶媒体 |
JP6840957B2 (ja) | 2016-09-01 | 2021-03-10 | 株式会社リコー | 画像類似度算出装置、画像処理装置、画像処理方法、及び記録媒体 |
CN108122081B (zh) * | 2016-11-26 | 2020-09-25 | 沈阳新松机器人自动化股份有限公司 | 机器人及其库存管理方法 |
WO2019008961A1 (ja) * | 2017-07-07 | 2019-01-10 | 日本電気株式会社 | 情報処理装置、情報処理方法、およびプログラム |
CN110019543A (zh) * | 2017-09-12 | 2019-07-16 | 中兴通讯股份有限公司 | 一种时序聚类的方法及装置 |
US10678888B2 (en) * | 2017-11-24 | 2020-06-09 | Vmware, Inc. | Methods and systems to predict parameters in a database of information technology equipment |
CN108446738A (zh) * | 2018-03-23 | 2018-08-24 | 联想(北京)有限公司 | 一种聚类方法、装置及电子设备 |
CN111178533B (zh) * | 2018-11-12 | 2024-04-16 | 第四范式(北京)技术有限公司 | 实现自动半监督机器学习的方法及装置 |
WO2020166008A1 (ja) * | 2019-02-14 | 2020-08-20 | 株式会社島津製作所 | イメージング分析装置 |
US11461372B1 (en) * | 2021-03-18 | 2022-10-04 | Bae Systems Information And Electronic Systems Integration Inc. | Data clustering in logic devices using unsupervised learning |
CN113204664B (zh) * | 2021-04-25 | 2022-11-04 | 北京三快在线科技有限公司 | 一种图像聚类方法及装置 |
US20230022356A1 (en) * | 2021-07-09 | 2023-01-26 | Hitachi, Ltd. | Method and system for human activity recognition in an industrial setting |
US11842160B2 (en) * | 2021-07-14 | 2023-12-12 | International Business Machines Corporation | Keyword extraction with frequency—inverse document frequency method for word embedding |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07141166A (ja) | 1993-11-19 | 1995-06-02 | Ricoh Co Ltd | クラスタ分析を用いたプログラム解析方法 |
US5983237A (en) * | 1996-03-29 | 1999-11-09 | Virage, Inc. | Visual dictionary |
US6742003B2 (en) * | 2001-04-30 | 2004-05-25 | Microsoft Corporation | Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications |
JP4340367B2 (ja) | 1999-01-27 | 2009-10-07 | 株式会社リコー | 画像分類装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6925199B2 (en) * | 2000-11-29 | 2005-08-02 | Fujitsu Limited | Computer readable recording medium recorded with diagnosis supporting program, diagnosis supporting apparatus and diagnosis supporting method |
US7363278B2 (en) * | 2001-04-05 | 2008-04-22 | Audible Magic Corporation | Copyright detection and protection system and method |
US6993535B2 (en) * | 2001-06-18 | 2006-01-31 | International Business Machines Corporation | Business method and apparatus for employing induced multimedia classifiers based on unified representation of features reflecting disparate modalities |
US7133811B2 (en) * | 2002-10-15 | 2006-11-07 | Microsoft Corporation | Staged mixture modeling |
JP2004272350A (ja) | 2003-03-05 | 2004-09-30 | Nec Corp | クラスタリング装置、クラスタリング方法、クラスタリングプログラム |
US20070255684A1 (en) * | 2006-04-29 | 2007-11-01 | Yahoo! Inc. | System and method using flat clustering for evolutionary clustering of sequential data sets |
US8094948B2 (en) * | 2007-04-27 | 2012-01-10 | The Regents Of The University Of California | Photo classification using optical parameters of camera from EXIF metadata |
US20090119482A1 (en) | 2007-11-02 | 2009-05-07 | Ricoh Company, Ltd. | Image forming device, image formation controlling method, and image formation controlling program |
US8553927B2 (en) | 2007-11-02 | 2013-10-08 | Ricoh Company, Ltd. | Image processing device and method for determining image data processes based on additional information |
US7885794B2 (en) * | 2007-11-30 | 2011-02-08 | Xerox Corporation | Object comparison, retrieval, and categorization methods and apparatuses |
US8335786B2 (en) * | 2009-05-28 | 2012-12-18 | Zeitera, Llc | Multi-media content identification using multi-level content signature correlation and fast similarity search |
JP5672872B2 (ja) | 2010-09-08 | 2015-02-18 | 株式会社リコー | 画像形成装置 |
JP5741007B2 (ja) | 2011-01-21 | 2015-07-01 | 株式会社リコー | 画像処理装置、画素補間方法およびプログラム |
JP5741011B2 (ja) | 2011-01-26 | 2015-07-01 | 株式会社リコー | 画像処理装置、画素補間方法およびプログラム |
WO2012111236A1 (ja) * | 2011-02-17 | 2012-08-23 | 三洋電機株式会社 | 画像識別装置およびプログラム |
JP5799634B2 (ja) | 2011-07-22 | 2015-10-28 | 株式会社リコー | 画像処理装置、画像処理システム |
JP5733083B2 (ja) | 2011-07-28 | 2015-06-10 | 株式会社リコー | 画像処理装置、画像処理システム |
JP5857676B2 (ja) | 2011-11-24 | 2016-02-10 | 株式会社リコー | 画像処理装置、画像処理システム |
-
2013
- 2013-06-07 JP JP2013120922A patent/JP6131723B2/ja active Active
- 2013-10-28 US US14/064,484 patent/US9519660B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014123341A (ja) | 2014-07-03 |
US9519660B2 (en) | 2016-12-13 |
US20140149412A1 (en) | 2014-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6131723B2 (ja) | 情報処理装置、情報処理方法、プログラムおよび記録媒体 | |
JP4579404B2 (ja) | 画像処理方法及びその装置 | |
US11853377B2 (en) | Image searching method and apparatus | |
CN105144239B (zh) | 图像处理装置、图像处理方法 | |
US20080162469A1 (en) | Content register device, content register method and content register program | |
US20060120627A1 (en) | Image search apparatus, image search method, program, and storage medium | |
JP2004361987A (ja) | 画像検索システム、画像分類システム、画像検索プログラム及び画像分類プログラム、並びに画像検索方法及び画像分類方法 | |
JP2008217428A (ja) | 画像検索プログラム、方法及び装置 | |
JP4374902B2 (ja) | 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム | |
WO2019207910A1 (ja) | データ分析システム及びデータ分析方法 | |
JPWO2009031297A1 (ja) | 画像検索装置、画像分類装置及び方法並びにプログラム | |
US8625890B1 (en) | Stylizing geographic features in photographic images based on image content | |
KR100312331B1 (ko) | 내용기반영상검색방법및장치 | |
JP2004192555A (ja) | 情報管理方法、情報管理装置及び情報管理プログラム | |
JP2006260311A (ja) | マッチング方法およびマッチング装置ならびにプログラム | |
JPH1049542A (ja) | 画像登録装置および方法 | |
JP2005353101A (ja) | 画像特徴抽出方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2010250634A (ja) | 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法 | |
US9767579B2 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
JP2007034613A (ja) | 画像処理装置及びその方法 | |
Horning | Land cover classification methods | |
US20080221788A1 (en) | Map generation apparatus, map generation method and computer readable medium | |
JPH07160725A (ja) | 画像検索装置 | |
Narasimha et al. | Classification of Knowledge Based Image using Decision Tree Algorithm | |
JP2008257537A (ja) | 情報登録装置、情報検索装置、情報検索システム、情報登録プログラム、および情報検索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160527 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170321 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170403 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6131723 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |