JP6131723B2 - 情報処理装置、情報処理方法、プログラムおよび記録媒体 - Google Patents

情報処理装置、情報処理方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP6131723B2
JP6131723B2 JP2013120922A JP2013120922A JP6131723B2 JP 6131723 B2 JP6131723 B2 JP 6131723B2 JP 2013120922 A JP2013120922 A JP 2013120922A JP 2013120922 A JP2013120922 A JP 2013120922A JP 6131723 B2 JP6131723 B2 JP 6131723B2
Authority
JP
Japan
Prior art keywords
data group
image
distribution
clustering
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013120922A
Other languages
English (en)
Other versions
JP2014123341A (ja
Inventor
聡史 中村
聡史 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2013120922A priority Critical patent/JP6131723B2/ja
Priority to US14/064,484 priority patent/US9519660B2/en
Publication of JP2014123341A publication Critical patent/JP2014123341A/ja
Application granted granted Critical
Publication of JP6131723B2 publication Critical patent/JP6131723B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene

Description

本発明は、データ群をクラスタリングする情報処理装置、情報処理方法、プログラムおよび記録媒体に関する。
入力されたデータ群を解析するために、データ群を複数のクラスに分類するクラスタリング手法がある。例えば、特許文献1では、クラス数が既知でない場合でも適切にクラスタリングを行い、確率密度関数として混合ガウス分布を用いることにより、各クラスのばらつきが違う場合にも適切にクラスタリングを行っている。
しかし、一般的に利用されるクラスタリング手法であるK平均法や混合ガウス分布を用いた手法では次のような問題があった。
(1)クラス数を予め指定する必要がある。
データ群のクラス数が既知であることを前提としており、入力されたデータ群に対して最適なクラス数を選択することが困難である。
(2)初期値依存である。
K平均法では、データ群に対してまずランダムにクラスを割り当てるが、この結果としてクラスの初期配置に偏りが生じたり、データが割り当てられない空のクラスが生じたりする問題がある。
具体的に説明するために、1つの大きな分布と2つの小さな分布が順に並んだ1次元の分布を仮定する。データ群にランダムにクラスを割り当てると、クラスの初期配置が大きなピーク周辺に偏る可能性が高い。また、K平均法ではデータを最近傍のクラスに独占的に再割り当てするため、クラス中心はデータ数の多い分布に引っ張られる傾向にあり、このようなケースでクラスの配置が大きく改善する見込みはない。したがって、小さな分布同士が適切に分割されない懸念がある。これを回避するためにクラス中心の初期値をランダムに設定する方法もあるが、データが存在しない領域に設定されることで空のクラスが出現する恐れがある。
(3)再現性がない。
先述したように、K平均法では、データ群に対してまずランダムに初期クラスを割り当てる。したがって、この初期の割り振りが試行毎に異なるため、同じデータ群をクラスタリングする場合であっても毎回結果が異なってしまう。
なお、上記(2)と(3)は、K平均法について説明しているが、混合ガウス分布を用いた手法でもクラスの初期値の設定にK平均法を用いることが一般的であるため、同様の問題から無縁ではない。
本発明は上記した課題に鑑みてなされたもので、
本発明の目的は、データ群のクラスタリングに際して、既にクラスタリングされている類似するデータ群のモデルパラメータに基づいて初期値を決定し、この初期値を実際のデータ群に合わせて更新することで最適なクラスタリング結果を得る情報処理装置、情報処理方法、プログラムおよび記録媒体を提供することにある。
本発明は、所定のデータ群から算出される特徴量がつくる特徴空間における前記データ群の確率密度分布を、複数の分布の重ね合せである混合分布モデルを用いてクラスタリングする情報処理装置であって、既にクラスタリングが行われたデータ群(以下、参照データ群)と、前記クラスタリングに用いられた混合分布のモデルパラメータ(以下、参照パラメータ)とを対応付けて記録する記録手段と、処理対象のデータ群に類似する参照データ群を前記記録手段から検索し、類似する参照データ群に対応する参照パラメータを取得する検索手段と、前記取得された参照パラメータに基づいて混合分布のモデルパラメータの初期値を決定する決定手段と、前記混合分布のモデルパラメータの初期値を、前記処理対象のデータ群の確率密度分布に応じて更新する更新手段と、前記更新されたモデルパラメータに基づいて前記処理対象のデータ群の確率密度分布をクラスタリングするクラスタリング手段を備えたことを最も主要な特徴とする。
本発明によれば、データ群のクラスタリングに際して、既にクラスタリングされて記録されているデータ群の中から類似するデータ群を検索し、類似するデータ群をクラスタリングする際に用いられたモデルパラメータに基づいてモデルパラメータの初期値を決定し、この初期値を実際のデータ群に合わせて更新することで最適なクラスタリング結果を得ることができる。
本発明の実施例1の情報処理装置の構成を示す。 実施例1の処理フローチャートを示す。 参照パラメータを合成する際の対応付け方法の例を示す。 実施例2の情報処理装置の構成を示す。 実施例2の処理フローチャートを示す。 本発明の概要を説明する図である。 実施例3の情報処理装置の構成を示す。 実施例3の処理フローチャートを示す。 実施例3の画面表示の例を示す。
以下、発明の実施の形態について図面により詳細に説明する。本発明の概要を図により具体的に説明する。ここでは視覚的な分かりやすさを優先し、2次元の特徴空間におけるデータ群を用いて説明するが、特徴空間は1次元であっても良いし、3次元以上であっても良い。
図6(a)は、入力データ群の例を示し、楕円で示す3つの分布501〜503が重なりを持って存在している。図6(b)、(c)は、従来技術によりクラスタリングした例を示す。図6(b)、(c)では、実線の楕円がクラスタリング結果を表し、破線の楕円が入力データ群を表す。また、×印は各クラスの中心位置を示し、クラスタリング開始時には初期値の位置に相当する。
図6(b)では、初期値はランダムに実際のクラス数と同じだけ与えられ、何れの初期値も入力データ群の内部に存在している場合に、クラスタリングを行った例である。入力データ群の分布が重なっていることから、分割すべき位置を誤り、この影響で実際の分布とは異なるクラスタリング結果501a〜503a生成している。図6(c)でも初期値は実際のクラス数と同じだけ与えられるが、ランダムに与えられたため、1つの初期値504が入力データ群の存在しない場所に設定された例である。この初期値が代表するクラスには、クラスタリング開始時に要素が含まれないことから、空のクラスとなってしまう。このため、3つの分布を実質的に2つのクラスにクラスタリングしてしまい、適切でないクラスタリング結果501b、503bを生成している。
本発明では次の手順によりクラスタリングを行う。
(1)入力データ群と類似する参照データ群を検索する。
入力データ群と所定の観点で類似すると判断される参照データ群をデータベースから検索する。参照データ群は事前に適切にクラスタリングされた上でデータベースに登録されているものとする。検索により取得された参照データ群601〜603の例を図6(d)に示す。この参照データ群601〜603と入力データ群501〜503とを比較すると分かるように、それぞれ3つの分布から構成され、概ね似たような形状と分布の重なり方をしている。
(2)参照パラメータを取得し、入力データ群の初期値に設定する。
図6(d)の×印で示す、参照データ群601〜603のクラスタリング結果である参照パラメータを取得する。参照パラメータが内包する情報の例としては、データ群を構成する分布の数(クラス数)、各分布の中心位置、各分布の広がりの情報などが挙げられる。入力データ群と参照データ群の分布は類似しているため、参照データ群のクラスタリング結果(参照パラメータ)は入力データ群の理想的なクラスタリング結果に近いことが予想される。そこで、参照パラメータを入力データ群の初期値に設定する。
(3)入力データ群をクラスタリングする。
設定された初期値を用いて入力データ群501〜503をクラスタリングする。図6(e)の501c〜503cは、クラスタリング結果を示す。前述したように、設定された初期値は入力データ群の理想的なクラスタリング結果に近いことから、初期値を微調整することでクラスタリングが可能となる。したがって、大域最適解の近傍から探索が開始されるため、従来技術のように、局所解に落ちるリスクが低減されることが期待できる。
実施例1は、データ群として画像(2次元のデータ群)を、個々のデータとして画像を構成する画素または画素群とし、画像の領域をクラスタリングする実施例である。
図1は、本発明の実施例1の情報処理装置の構成を示す。図1において、101は画像の入力を受け付ける画像入力部、102は入力画像を解析し、特徴量を算出する画像解析部、103は入力画像と特徴量を記憶する記憶部、104は更新されたモデルパラメータに基づいて入力画像の確率密度分布をクラスタリングするクラスタリング部、105はクラスタリング結果を出力する結果出力部、106は入力画像に類似する参照画像を記録部から検索する類似画像検索部、107は参照画像の類似度とその参照パラメータを用いてモデルパラメータの初期値を決定する初期パラメータ決定部、108はモデルパラメータの初期値を入力画像に合わせて更新するパラメータ更新部、109は参照画像とその特徴量、並びにクラスタリング時に用いた混合分布のモデルパラメータ(参照パラメータ)を記録する記録部、110はネットワークバスである。
図2は、実施例1の処理フローチャートを示す。
(1)クラスタリングする画像を入力する(S201)。
画像入力部101からクラスタリングを行う対象である入力画像を入力する。入力画像は予めCD、DVD、HDDなどの記録メディアに保存されているものを読み出しても良いし、図示しないスキャナなどで原稿を読み取っても良い。
(2)入力画像の特徴量を算出する(S202)。
画像解析部102は入力画像の特徴量を算出し、記憶部103に記憶する。この特徴量を用いてクラスタリングを行う特徴空間を張る。特徴量の例としては次のようなものが挙げられる。
(a)色:RGB値、CIE−XYZ値、CIE−Lab値など
(b)形状の記述子:SIFT、SURF、HoGなど
(c)テクスチャの記述子:Local Binary Pattern (LBP)、Harr−like特徴など
どの特徴量を用いるか、どのような観点で入力画像をクラスタリングするかに依存するため、クラスタリングの目的に応じてユーザが適切な特徴量並びに特徴空間を選択すればよい。また、画素値をそのまま特徴量として利用しても良い。
入力画像の画素または画素群に対応する特徴量をこの特徴空間にマップ(写像)することで、モデル化の対象となる確率密度分布が構築される。特徴空間としてCIE−Lab空間を選択した場合には、3次元の確率密度分布となる。尚、確率密度分布は後段の計算を簡略化するために、主成分分析などを用いて次元を圧縮したり、より低次元の確率密度分布の組み合わせとして表現したりしても良い。例えば3次元の確率密度分布を3つの1次元の分布の重ね合わせとして近似的に表現することもできる。
(3)類似する参照画像を検索する(S203)。
類似画像検索部106は入力画像と類似する参照画像を記録部109から検索する。例えば、入力画像の特徴量と参照画像の特徴量に基づいて類似度(距離など)を算出し、類似度の高い参照画像を検索する。このような類似画像検索技術は、例えば特許4340367号など公知のものを用いればよい。尚、類似画像検索に用いる特徴量は、先述したクラスタリングに用いるものと同じであっても良いし、別のものであっても良い。更に、画像に起因する特徴量だけでなく、特徴空間における確率密度分布を特徴付ける特徴量を新たに導出して、入力画像と参照画像との間の類似度を測っても良い。類似する参照画像が見つかった場合には(S204でYes)、S205に進み、見つからなかった場合には(S204でNo)、S209に進む。
クラスタリングに用いる特徴量と参照データの検索に用いる特徴量を分けるメリットを説明する。クラスタリングに用いる特徴量と類似画像検索に用いる特徴量とを別個のものとする例としては、前者にRGB値などの色を用い、後者に形状やテクスチャの記述子を用いるものが挙げられる。これは一般的に行われている、画像を色領域に分割することに相当する。具体的には、風景画において青色の領域を空、緑色の領域を草、橙色の領域を土として分割することが考えられる。
類似する参照画像の検索に際して用いる特徴量として、形状やテクスチャの記述子を利用することが望ましい。これは、画像中の画素間の空間的な位置関係や関連性を類似画像検索に利用できるためである。例えば、画像中の各画素をRGB空間にデータ点としてプロットすると画素間の隣接関係が失われてしまうため、データ群の特徴量では画像の内容に関する情報を表現することができない。これに対し、形状やテクスチャの記述子を利用することで、画像の内容に関する情報を、画像同士の類似性の評価に利用することができる。
記録部109では、参照画像と参照パラメータとを対応付けて記録しても良いし、参照画像の特徴量と参照パラメータとを対応付けて記録しても良い。特徴量は画像から求められ、この画像を一意に特定する情報であることから、参照パラメータと対応付けて記憶するのは参照画像自体であっても良いし、そこから導出された特徴量で代替しても良い。
参照画像を利用するメリットの例は次の通りである。
・参照画像を記録部に登録した後に特徴量の種類を変更することが可能である。
・参照画像を画面に表示してユーザに提示することができる。
前者は画像そのものという完全な情報が存在すれば、特徴量はいつでも再計算可能であることに起因している。
一方、参照画像から求められた特徴量を利用するメリットの例は次の通りである。
・参照画像よりも特徴量の方がコンパクトな表現であるため、記録部の容量を削減できる。
・類似画像検索に際しては必ず特徴量を計算するため、検索のたびに特徴量を再計算する手間を省ける。
無論、参照画像とそこから求めた特徴量との両方を参照パラメータと対応付けて記録しても良い。
(4)参照パラメータを取得する(S205)。
類似する参照画像が見つかれば、記録部109から類似する参照画像に対応付けて記録されている参照パラメータを読み出す。参照パラメータは参照画像をクラスタリングする際に用いられたモデルパラメータである。混合分布として混合ガウス分布を用いる場合には、モデルパラメータはクラス数Kと、各クラスを表すガウス分布のパラメータ(平均μ、分散s、混合重みw)から構成される。仮に特徴空間が3次元であれば平均μは3次元ベクトル、分散sは3×3の行列(共分散行列)、混合重みwはスカラー量である。尚、分散sは行列の対角成分のみを抽出した3次元ベクトルを用いても良い。また、3次元の特徴空間を3つの1次元の重ね合わせとして表現するのであれば、平均μ、分散s、混合重みwは何れもスカラー量となり、この組が1つのガウス分布に付き3つ必要となる。参照パラメータは事前に手作業でクラスタリングを行って作成してもよいし、以前にクラスタリングを行った結果を蓄積しても利用しても良い。
(5)参照パラメータを合成してモデルパラメータの初期値を決定する(S206)。
初期パラメータ決定部107は、類似する参照画像の参照パラメータを、類似度を用いて合成してモデルパラメータの初期値を決定する。合成方法としては、
(a)最も類似度の高い参照画像の参照パラメータを採用する方法
入力画像が参照画像と等しいと仮定して、該当する参照画像の参照パラメータをそのまま流用する方法である。最も単純な手法で、前述の仮定が成立するケースで最も高い効果を発揮する。
(b)予め設定された閾値を超える類似度を持つ参照画像に対応する参照パラメータを算術平均する方法
入力画像を複数の類似する参照画像の組み合わせとして表現する方法の中で、最も単純な方法である。入力画像と極めて近い参照画像が存在しないケースであっても、複数の類似する参照画像を用いて代替することで、比較的安定した結果が得られる。
(c)参照パラメータに類似度を重みとして重畳して加重平均する方法
入力画像を複数の類似する参照画像の組み合わせとして表現する方法の中で、入力画像に類似する参照画像ほど大きな影響を及ぼすように調整された合成方法である。算術平均を行うよりも計算の複雑度は高い反面、安定性と精度の向上が期待できる。
などが考えられる。尚、複数の参照パラメータを合成するためには、各参照画像の確率密度分布をモデル化した混合分布の各分布同士を画像間で対応付ける必要がある。この対応付けは次のように行えばよい。
・分布の対応付け方法
混合分布では複数の分布が存在するため、複数の参照画像の参照パラメータを合成する際にはある参照画像の分布を別の参照画像のどの分布と対応付けるかが課題となる。このようなケースでは、次のような対応付け方が例示できる。
(a)分布の中心が最も近いものを対応付ける
参照画像Aの分布群{a1,…,ak}と参照画像Bの分布群{b1,…,bk}との間の中心間の距離を求め、最も近い分布同士を合成する方法である。分布間の距離はユークリッド距離など既知の技術を用いればよい。
(b)分布を所定の基準で並べて同じ順位のものを対応付ける
参照画像Aの分布群{a1,…,ak}と参照画像Bの分布群{b1,…,bk}を所定の基準でソートし、1番目の分布同士、2番目の分布同士、と順に対応付ける方法である。一例を挙げれば、特徴空間がCIE−Lab空間であるケースで明度の大きさで分布を並べ替えた上で、同じ順位の分布を対応付けるケースが考えられる。尚、(a)と(b)の中間的な方法として、同程度の明度の分布を対応付け方法も考えられる。
・クラス数が異なる場合の対応付け方法
参照画像の間でクラス数が異なる場合には、次のような対応付け方が例示できる。
(a)最もクラス数の多い参照画像を基準にして前述の方法で分布間を対応付ける
基準とする参照画像を除けば、必ず他の参照画像の分布は基準とする参照画像の分布のいずれかに対応付けが成されるアプローチである。クラス数は変動しない。
(b)最もクラス数の少ない参照画像を基準にして前述の方法で分布間を対応付ける
基準とする参照画像を除けば、必ず他の参照画像の分布は基準とする参照画像の分布のいずれかに対応付けがなされるアプローチである。クラス数は変動しない。
(c)分布の中心が近いものを対応付けつつ、対応づかないものはそのまま残す(ORを取るイメージ)
分布の中心間の距離が最も近いものを対応付けつつ、所定の閾値を超える分布は対応付けずに単に追加していくアプローチである。クラス数は対応付けの過程で増加する場合がある。
(d)分布の中心が近いものを対応付けつつ、対応づかないものは削除する(ANDを取るイメージ)
分布の中心間の距離が最も近いものを対応付けつつ、所定の閾値を超える分布は対応付けずに無視するアプローチである。クラス数は対応付けの過程で減少する場合がある。
(e)分布の中心が近いものを対応付け、最終的に合成された分布の数が所定の閾値を超える分布のみを採用する
(c)と近いアプローチであるが、各分布に対して対応付けられた分布の数を管理し、これが閾値を超える(頻繁に対応付けが行われた)分布のみを残すアプローチである。
分布の中心の距離に基づいて対応付けるケースを例に図3に基づいて説明する。参照画像A(クラス数5)の分布{a1,a2,a3,a4,a5}と、参照画像B(クラス数4)の分布{b1,b2,b3,b4}があったとする。尚、説明の都合上、各分布は1次元で表現しており、また、分布間の重なりはないものとしている。
(a)のアプローチでは、クラス数の多い参照画像Aを基準とし、分布{a1,a2,a3,a4,a5}に分布{b1,b2,b3,b4}を対応付ける。このとき、分布の中心の距離が最も近いものと対応付けると、b1はa2と、b2はa3と、b3はa4と、b4はa5と、それぞれ対応付けられ、最終的に5クラスとなる。
逆に(b)のアプローチでは、クラス数の少ない参照画像Bを基準とし、分布{b1,b2,b3,b4}に分布{a1,a2,a3,a4,a5}を対応付ける。このとき、分布の中心の距離が最も近いものと対応付けると、a1とa2はb1と、a3はb2と、a4はb3と、a5はb4と、それぞれ対応付けられ、最終的に4クラスとなる。
また、(c)のアプローチでは、a2とb1、a3とb2、a4とb3が対応付けられるが、a1、a5、b4は最も近い分布との距離が閾値を超えるため対応付けられず、最終的に6クラスとなる。一方、(d)のアプローチでは(c)と同様の対応付けの結果、対応付けが行われなかった3つは削除され、最終的に3クラスとなる。更に、(e)のアプローチでは(c)と同様の対応付けが行われ、仮に対応付けられた分布数の閾値を2以上とすれば、(d)と同じ結果となる。
上記した方法以外にも合成方法は考えられる。まず入力画像と参照画像との類似度に、特徴空間における確率密度分布の形状の類似度を含め、この類似度が最も高い参照画像の参照パラメータのクラス数を用い、分布のモデルパラメータは先述した方法を用いるアプローチも考えられる。つまり、クラス数と分布のモデルパラメータを別の基準で決定するものである。
(6)モデルパラメータの初期値をランダムに決定する(S209)。
類似する参照画像が見つからなければ、初期パラメータ決定部107において従来技術と同様にモデルパラメータの初期値をランダムに決定する。
(7)モデルパラメータを更新する(S207)。
パラメータ更新部108は、前ステップで得られたモデルパラメータの初期値を、入力画像の特徴空間における確率密度分布に合わせて更新する。更新方法は従来技術を用いればよく、一例としてはEMアルゴリズムが挙げられる。
(8)クラスタリング結果を出力する(S208)。
クラスタリング部104は、前ステップで得られたモデルパラメータに基づいて、特徴空間における確率密度分布をクラスタリングし、その結果を結果出力部105から出力する。出力する内容はクラスタリング結果の利用方法に応じて決定すればよく、例示すればモデルパラメータの値でも良いし、各画素とクラスとの対応関係のリストでも良いし、入力画像を特徴空間におけるクラスタリング結果に応じて分割した結果を画像として出力しても良い。
クラスタリング結果を画像の形で出力する方法は次のようなものが例示できる。
(a)ラベルマップ
入力画像と同じサイズのクラス番号を管理する画像(ラベルマップ)を用意し、入力画像の各画素が属するラベルの識別子をラベルマップの対応する画素に記録するものである。
(b)2値マップ
入力画像と同じサイズの画像(マップ)をクラス数だけ用意し、各クラスについて入力画像のある画素がそのクラスに属すればマップの対応する画素に1を、そうでなければ0を記録するものである。尚、2値マップに記録される値は0と1に限定されるわけではなく、クラスへの帰属の有無が判別できればどのような値を用いても良い。
(c)多値マップ
入力画像と同じサイズの画像(マップ)をクラス数だけ用意し、各クラスについて入力画像の各画素がそのクラスに属する確率をマップの対応する画素に記録するものである。一般にマップは0から1までの範囲の値を取り、全てのマップについて同じ画素の値を累積すると1になる。但し、多値マップの設計の仕方しだいではこの条件を満たさない場合もある。
実施例1を画像の領域分割に適用する具体例を説明する。本実施例の具体的な適用例として、画像の領域分割が挙げられる。領域分割とは、画像を複数の意味的なまとまりに分解する処理のことであり、例えば風景画像を空、山、森、湖などの領域に分けるシナリオが想定できる。領域分割を色に基づいて行うケースを考えれば、この問題は色を特徴量とする特徴空間におけるデータ群(画素群)の分布のクラスタリングと見なすことができる。
仮に、空は青色、山は明るい緑色、森は深い緑色、湖は明るい青色であったとする。一つの領域と判断されるべき領域の大きさは、画像の種類や領域分割の目的に依存するものの、ここでは上記単位で分割するものとする。モデル分布の初期値として、ランダムな値や事前に定義された色カテゴリ(赤、青、黄、緑、など)ごとの代表値を用いると、同じ系統の色である空と湖、山と森が同じ領域として切り出されてしまう場合や、逆に同じ領域として分割されるべきものが複数の領域に分かれてしまう場合がある。前者を過統合、後者を過分割と呼ぶ。
前述したように、一つの領域として区分されるべき領域の大きさや最終的に得たい領域数は、様々な要因により決定されるため、自動的に同定することは困難である。本発明では、この問題を過去に領域分割がなされた画像(参照画像)をヒントにすることで解消する。類似する画像には類似する領域分割結果が期待されていると考えることができる。そこで、参照画像の領域分割結果(参照パラメータ)を入力画像の領域分割に流用することで、不確かな情報を過去の事例から補うことができる。
前述した風景画像の領域分割の例において、過去に似たような構図で撮影された風景画像を青色の空、明るい緑色の山、深い緑色の森、明るい青色の川に分割していたとする。類似画像検索によりこの参照画像が得られれば、入力画像の初期値として、空には参照画像の空の青、山には参照画像の山の緑、森には参照画像の森の深緑、そして湖には参照画像の川の水色を、それぞれ設定することができ、且つ最終的な領域数は4つであると判断できる。これにより過分割や過統合などの問題を回避して、高精度な領域分割が可能となる。無論、前述した方法で複数の参照画像を合成して初期値を決定しても用いても良い。
画像の領域分割を部分領域ごとに行う例を説明する。上記した画像の領域分割における類似画像検索を用いたモデルパラメータの流用は、画像の部分領域に対しても適用可能である。類似画像検索で得られる参照画像は、入力画像と完全に構図の一致したものとは限らない。仮に入力画像が参照画像の一部分に対応づく場合には、参照パラメータはそのまま流用しても多くの場合に問題は生じないが、逆のケースでは問題が生じる可能性がある。このようなケースでは、例えば入力画像のうち参照画像と対応づく範囲のみを前述の方法で参照パラメータを活用して分割し、残った範囲について再度類似する参照画像を検索して前述の方法で分割し、これを繰り返すことで入力画像全体に渡る領域分割を行うという、代替手段が考えられる。また、入力画像を部分的にカバーする複数の参照画像の参照パラメータを統合して、クラスタリングの初期値に設定する方法も考えられる。モデルパラメータの統合方法は前述した方法を利用すれば良い。
実施例2は、データ群をデータ列(1次元のデータ群)とし、これをクラスタリングする実施例である。図4は、実施例2の情報処理装置の構成を示す。図4において、301はデータ列の入力を受け付けるデータ列入力部、302は入力データ列を解析し、特徴量を算出するデータ列解析部、303は入力データ列と特徴量を記憶する記憶部、304は更新されたモデルパラメータに基づいて入力データ列の確率密度分布をクラスタリングするクラスタリング部、305はクラスタリング結果を出力する結果出力部、306は入力データ列に類似する参照データ列を記録部から検索する類似データ列検索部、307は参照データ列の類似度とその参照パラメータを用いてモデルパラメータの初期値を決定する初期パラメータ決定部、308はモデルパラメータの初期値を入力データ列に合わせて更新するパラメータ更新部、309は参照データ列とその特徴量、並びにクラスタリング時に用いた混合分布のモデルパラメータ(参照パラメータ)を記録する記録部、310はネットワークバスである。
図5は、実施例2の処理フローチャートを示す。
(1)クラスタリングするデータ列を入力する(S401)。
データ列入力部301からクラスタリングを行う対象である入力データ列を入力する。入力データ列は予めCD、DVD、HDDなどの記録メディアに保存されているものを読み出しても良い。
(2)入力データ列の特徴量を算出する(S402)。
データ列解析部302は入力データ列の特徴量を算出し、記憶部303に記憶する。この特徴量を用いてクラスタリングを行う特徴空間を張る。特徴量の例としては次のようなものが挙げられる。
(a)データの値そのもの
(b)データの勾配
どの特徴量を用いるか、どのような観点で入力データ列をクラスタリングするかに依存するため、クラスタリングの目的に応じてユーザが適切な特徴量並びに特徴空間を選択すればよい。入力データ列のデータまたはデータ群に対応する特徴量をこの特徴空間にマップすることで、モデル化の対象となる確率密度分布が構築される。
(3)類似する参照データ列を検索する(S403)。
類似データ列検索部306は入力データ列と類似する参照データ列を記録部309から検索する。類似データ列検索技術はハミング距離やレーベンシュタイン距離など公知のものを用いればよい。尚、類似データ列検索に用いる特徴量は、先述したクラスタリングに用いるものと同じであっても良いし別のものであっても良い。類似する参照データ列が見つかった場合には(S404でYes)、S405に進み、見つからなかった場合には(S404でNo)、S409に進む。
(4)参照パラメータを取得する(S405)。
類似する参照データ列が見つかれば、記録部309から類似する参照データ列に対応付けて記録されている参照パラメータを読み出す。参照パラメータは参照データ列をクラスタリングする際に用いられたモデルパラメータである。混合分布として混合ガウス分布を用いる場合には、モデルパラメータはクラス数Kと、各クラスを表すガウス分布のパラメータ(平均μ、分散s、混合重みw)から構成される。参照パラメータは事前に手作業でクラスタリングを行って作成してもよいし、以前にクラスタリングを行った結果を蓄積しても利用しても良い。
(5)参照パラメータを合成してモデルパラメータの初期値を決定する(S406)。
初期パラメータ決定部307は、類似する参照データ列の参照パラメータを、類似度を用いて合成する。合成方法としては、
(a)最も類似度の高い参照データ列の参照パラメータを採用する方法
入力データ列が参照データ列と等しいと仮定して、該当する参照データ列のモデルパラメータをそのまま流用する方法である。最も単純な手法で、前述の仮定が成立するケースで最も高い効果を発揮する。
(b)予め設定された閾値を超える類似度を持つ参照データ列に対応する参照パラメータを算術平均する方法
入力データ列を複数の類似する参照データ列の組み合わせとして表現する方法の中で、最も単純な方法である。入力データ列と極めて近い参照データ列が存在しないケースであっても、複数の類似する参照データ列を用いて代替することで、比較的安定した結果が得られる。
(c)参照パラメータに類似度を重みとして重畳して加重平均する方法
入力データ列を複数の類似する参照データ列の組み合わせとして表現する方法の中で、入力データ列に類似する参照データ列ほど大きな影響を及ぼすように調整された合成方法である。算術平均を行うよりも計算の複雑度は高い反面、安定性と精度の向上が期待できる。
などが考えられる。尚、複数の参照パラメータを合成するためには、各参照データ列の確率密度分布をモデル化した混合分布の各分布同士をデータ列間で対応付ける必要がある。この分布の対応付けに関しては、実施例1で説明した方法を実施すればよい。
(6)モデルパラメータの初期値をランダムに決定する(S409)
類似する参照データ列が見つからなければ、初期パラメータ決定部307は従来技術と同様にモデルパラメータの初期値をランダムに決定する。
(7)モデルパラメータを更新する(S407)。
パラメータ更新部308は、前ステップで得られたモデルパラメータの初期値を、入力データ列の特徴空間における確率密度分布に合わせて更新する。更新方法は従来技術を用いればよく、一例としてはEMアルゴリズムが挙げられる。
(8)クラスタリング結果を出力する(S408)。
クラスタリング部304は、前ステップで得られたモデルパラメータに基づいて、特徴空間における確率密度分布をクラスタリングし、その結果を結果出力部305から出力する。出力する内容はクラスタリング結果の利用方法に応じて決定すればよく、例示すればモデルパラメータの値でも良いし、各データとクラスとの対応関係のリストでも良い。対応関係は各データに唯一のクラスを割り当てる2値のものと、各データが各クラスに属する確率を与える多値のものとがある。
以上説明したように、本発明では、性質の似たデータ群は、クラスタリング結果も類似する可能性が高いため、予め適切にクラスタリングをされた類似するデータ群のモデルパラメータを流用することで、高精度で安定したクラスタリングを行うことができる。
また、類似するデータ群のモデルパラメータを初期値とし、実際のデータ群の性質に合わせて調整することで細かい差異を埋め、クラスタリングの精度を向上させることができる。
本実施例の具体的な適用例としては、教育現場などで試験の得点の分布から成績の上位、中位、下位を判断する用途が挙げられる。この判断のために事前にそれぞれのクラスに分類する得点の範囲を決定しておいても良いが、この範囲は試験の難易度に応じて適宜調整されるべきものである。しかし、難易度を客観的に評価することは容易ではない。そこで、本発明により過去に分類した結果を利用することで、自動的なクラスタリングを実現することができる。
また、別の適用例としては、画像の減色処理が挙げられる。減色処理にはカラーで色数を削減するものとグレースケールで階調数を作成するものとがあるが、ここではグレースケールの減色処理を用いて説明する。グレースケールの256階調の画像が入力され、これを3階調に減色するケースを考える。まず、入力画像から階調ごとの画素の頻度を表すヒストグラムを作成する。次に、入力画像と類似する参照画像を検索する。この検索に際しては、画像同士の類似度ではなく、ヒストグラム同士の類似度に基づいて参照画像を選択しても良い。続いて、得られた参照画像の参照パラメータに基づいて、入力画像のヒストグラムのモデルパラメータの初期値を設定し、これを更新することでヒストグラムをクラスタリングする。最後に、3つの階調を表す、得られた3つの分布は重なりを持つことから、所定の基準で分布間の境界を設定し、この境界を閾値として3値化することで、減色処理が完了する。分布間の境界を設定する基準の例としては、隣接する分布で値が等しくなること、隣接する分布で値の比が所定の割合となること、などが考えられる。
カラーでの減色処理に際しては、チャンネルごとに独立にグレースケールと同じ処理をすればよい。これにより演算量を抑えながら減色処理ができるが、最終的に得られる色が必ずしも入力画像に対して適切でない場合がある。このような場合にはチャンネル間の相関を維持しながら減色を行うことが有効であり、実施例1と同様に、2次元以上の特徴空間においてクラスタリング処理を行えばよい。
実施例3は、データ群として画像(2次元のデータ群)を用い、個々のデータとして画像を構成する画素または画素群を用い、画像を領域に分割する際にユーザのインタラクションを受け付ける実施例である。本実施例において実施例1と共通する部分については説明を省略する。
図7は、本発明の実施例3の情報処理装置の構成を示す。図7において、701は画像の入力を受け付ける画像入力部、702は入力画像を解析し、特徴量を算出する画像解析部、703は入力画像と特徴量を記憶する記憶部、704は更新されたモデルパラメータに基づいて入力画像の確率密度分布をクラスタリングするクラスタリング部、705はクラスタリング結果を出力する結果出力部、706は入力画像に類似する参照画像を記録部から検索する類似画像検索部、707は参照画像の類似度とその参照パラメータを用いてモデルパラメータの初期値を決定する初期パラメータ決定部、708はモデルパラメータ
の初期値を入力画像に合わせて更新するパラメータ更新部、709は参照画像とその特徴量、並びにクラスタリング時に用いた混合分布のモデルパラメータ(参照パラメータ)を記録する記録部、710はネットワークバス、711は参照画像を表示する画像表示部、712は参照画像の選択を受け付ける画像選択部である。
図8は、実施例3の処理フローチャートを示す。図8(実施例3)と図2(実施例1)との相違点は次の通りである。
・参照パラメータを合成してモデルパラメータの初期値を決定するステップ(S206)が省略された。
・見つかった類似する参照画像を表示するステップ(S805)が追加された。
・ユーザが表示された参照画像から1つ以上を選択するステップ(S806)が追加された。
・ユーザにより選択された参照画像の参照パラメータをモデルパラメータの初期値に設定するステップ(S807)が追加された。
ここでは、追加されたステップS805からS807について説明し、図2と共通する他のステップの説明は省略する。
(1)クラスタリングする画像を入力する(S801)。
(2)入力画像の特徴量を算出する(S802)。
(3)類似する参照画像を検索する(S803)。
(4)参照画像を表示する(S805)。
類似する参照画像が見つかれば、記録部709から類似する参照画像を読み出し、画像表示部711に表示する。参照画像を表示する際には、画像だけを表示しても良いし、参照パラメータも併せて表示しても良い。更に、参照画像の画素のクラスタリング結果も表示しても良い。クラスタリング結果の表示方法としては、特徴空間におけるデータ分布をクラスごとに色分けしたり、各データ点(画素)をこのクラスごとに色分けや番号付けして画像化したりすれば良い。類似する参照画像は複数表示することが望ましい。
図9は、実施例3の画面表示の例を示す。メインウィンドウ901の中に、入力画像の表示領域902と参照画像の表示領域903とが配置されている。表示領域902には、画像入力部701により入力された画像が示されている。また、表示領域903には、類似画像検索部706が記録部709から取得した、入力画像に類似する3枚の参照画像905〜907が列挙されている。参照画像905〜907には、それぞれクラスタリング結果を画像化して付属しており、すなわち、クラスタリング結果として、各クラスに属する画素を連続する領域となるように統合した上で、各領域のクラスを1から5までの番号で示している。尚、同じクラスに属する領域が離れて存在しても良い。
参照画像を表示する際には、所定の基準に基づいて並び替えられることが望ましい。基準の例としては、入力画像と参照画像との画像間の類似度や特徴空間におけるデータ分布の類似度の他、参照パラメータにおけるクラス数、参照画像が選択された回数(又は頻度)などが挙げられる。
参照画像のクラスタリング結果は、参照パラメータを用いて表示時に生成しても良いし、予め記録部709に参照画像と対応付けて記録しておいても良い。
(5)参照画像を選択する(S806)。
ユーザにより参照画像の選択を受け付ける。ユーザはマウスポインタなど一般的な入力機器を用いて、画像表示部711に表示された参照画像の中から入力画像のモデルパラメータの初期値として利用するものを選択する。前述したように、選択する画像は1つであっても良いし、複数であっても良い。
図9を用いて説明すれば、ユーザは参照画像の表示領域903に列挙された参照画像の中から、ユーザが期待するクラスタリング結果に近いと考えるものを選択する。入力画像は空を背景に、森の奥に山がそびえる風景画像である。この風景画像を空、山、森に分割したいとすれば、同様の構図で分割結果が目的に一致している参照画像Aを選択することが妥当であると考えられる。ユーザが参照画像Aをマウスなどで選択すると、参照画像Aの参照パラメータが入力画像のモデルパラメータの初期値に採用される。
尚、ユーザが参照画像を選択すると、参照パラメータを初期値に設定して入力画像をクラスタリングした結果をプレビューとしてユーザに提示しても良い。プレビューを行うことで試行錯誤による探索を、より直感的に実行できるようになる。
(6)参照パラメータを取得してモデルパラメータの初期値に設定する(S807)。
初期パラメータ決定部707は、ユーザにより選択された参照画像の参照パラメータを、モデルパラメータの初期値に設定し、初期値を決定する。尚、S805において、複数の類似する参照画像を表示し、S806においてユーザにより複数の参照画像の選択を受け付けた場合には、実施例1のS206における方法により参照パラメータを合成して、モデルパラメータの初期値を決定しても良い。
(7)モデルパラメータの初期値をランダムに決定する(S810)。
(8)モデルパラメータを更新する(S808)。
(9)クラスタリング結果を出力する(S809)。
以上で説明したように、本発明では、予め適切にクラスタリングされた類似するデータ群のモデルパラメータを流用する際に、類似するデータ群の複数の候補をユーザに提示し、最適な1または複数のデータ群をユーザに選択させることで、ユーザが所望するクラスタリング結果が得られると共に、高精度で安定したクラスタリングを行うことができる。
前述した課題は、本発明により以下のように解決された。すなわち、
(1)「クラス数を予め指定する必要がある」点に関して、
類似するデータ群の間でクラスタリング結果が類似するため、適切なクラス数も等しいと考えられる。そこで、本発明では、予め適切にクラスタリングされた類似データ群のモデルパラメータを流用することで、未知のデータ群に対しても適切なクラスタリングが行える。
(2)「初期値依存である」点に関して、
類似するデータ群の間でクラスタリング結果が類似するため、モデルパラメータもほぼ等しいと考えられる。そこで、本発明では、初期値をランダムに生成するのではなく、予め適切にクラスタリングされた類似データ群のモデルパラメータを流用することで、未知のデータ群に対しても適切な初期値の設定が行える。尚、類似するデータ群の間で全ての分布が完全に一致するわけではないので、流用するモデルパラメータは初期値とし、それを実際のデータ群の性質に合わせて更新することによって、最適なモデル化とクラスタリングが可能となる。
(3)「再現性がない」点に関して、
従来技術では、モデルパラメータの初期値をランダムに割り当てていた。本発明では、適切にクラスタリングされた類似するデータ群のモデルパラメータを初期値として流用するため、初期値は複数回試行を行っても変わらず、クラスタリング結果に再現性が担保できる。
本発明は、前述した実施例の機能を実現するソフトウエアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(CPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても達成される。この場合、記憶媒体から読出されたプログラムコード自体が前述した実施例の機能を実現することになる。プログラムコードを供給するための記憶媒体としては、例えば、ハードディスク、光ディスク、光磁気ディスク、不揮発性のメモリカード、ROMなどを用いることができる。また、コンピュータが読出したプログラムコードを実行することにより、前述した実施例の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施例の機能が実現される場合も含まれる。さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施例の機能が実現される場合も含まれる。また、本発明の実施例の機能等を実現するためのプログラムは、ネットワークを介した通信によってサーバから提供されるものでも良い。
101 画像入力部
102 画像解析部
103 記憶部
104 クラスタリング部
105 結果出力部
106 類似画像検索部
107 初期パラメータ決定部
108 パラメータ更新部
109 記録部
110 ネットワークバス
特開2004−272350号公報

Claims (10)

  1. 所定のデータ群から算出される特徴量がつくる特徴空間における前記データ群の確率密度分布を、複数の分布の重ね合せである混合分布モデルを用いてクラスタリングする情報処理装置であって、既にクラスタリングが行われたデータ群(以下、参照データ群)と、前記クラスタリングに用いられた混合分布のモデルパラメータ(以下、参照パラメータ)とを対応付けて記録する記録手段と、処理対象のデータ群に類似する参照データ群を前記記録手段から検索し、類似する参照データ群に対応する参照パラメータを取得する検索手段と、前記取得された参照パラメータに基づいて混合分布のモデルパラメータの初期値を決定する決定手段と、前記混合分布のモデルパラメータの初期値を、前記処理対象のデータ群の確率密度分布に応じて更新する更新手段と、前記更新されたモデルパラメータに基づいて前記処理対象のデータ群の確率密度分布をクラスタリングするクラスタリング手段を備えたことを特徴とする情報処理装置。
  2. 前記検索手段は、前記処理対象のデータ群と参照データ群との類似度に基づいて複数の参照パラメータを取得し、前記決定手段は、前記複数の参照パラメータを前記類似度に基づいて合成して初期値を決定することを特徴とする請求項1記載の情報処理装置。
  3. 前記検索手段は、前記処理対象のデータ群の特徴量と、前記参照データ群の特徴量に基づいて前記類似度を算出することを特徴とする請求項2記載の情報処理装置。
  4. 前記検索手段は、前記特徴量とは異なる特徴量を用いて前記処理対象のデータ群と参照データ群との類似度を算出することを特徴とする請求項2記載の情報処理装置。
  5. 前記混合分布を構成する各分布は、ガウス分布であることを特徴とする請求項1記載の情報処理装置。
  6. 前記処理対象のデータ群は画像であり、前記処理対象のデータ群を構成する各データは画素または画素の集合であることを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
  7. 前記検索手段は、画像の形状を表す特徴量またはテクスチャを表す特徴量を用いて、前記処理対象のデータ群と前記参照データ群との類似度を算出することを特徴とする請求項3記載の情報処理装置。
  8. 所定のデータ群から算出される特徴量がつくる特徴空間における前記データ群の確率密度分布を、複数の分布の重ね合せである混合分布モデルを用いてクラスタリングする情報処理方法であって、既にクラスタリングが行われたデータ群(以下、参照データ群)と、前記クラスタリングに用いられた混合分布のモデルパラメータ(以下、参照パラメータ)とを対応付けて記録する記録工程と、処理対象のデータ群に類似する参照データ群を前記記録工程から検索し、類似する参照データ群に対応する参照パラメータを取得する検索工程と、前記取得された参照パラメータに基づいて混合分布のモデルパラメータの初期値を決定する決定工程と、前記混合分布のモデルパラメータの初期値を、前記処理対象のデータ群の確率密度分布に応じて更新する更新工程と、前記更新されたモデルパラメータに基づいて前記処理対象のデータ群の確率密度分布をクラスタリングするクラスタリング工程を備えたことを特徴とする情報処理方法。
  9. 請求項8記載の情報処理方法をコンピュータに実現させるためのプログラム。
  10. 請求項8記載の情報処理方法をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2013120922A 2012-11-26 2013-06-07 情報処理装置、情報処理方法、プログラムおよび記録媒体 Active JP6131723B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013120922A JP6131723B2 (ja) 2012-11-26 2013-06-07 情報処理装置、情報処理方法、プログラムおよび記録媒体
US14/064,484 US9519660B2 (en) 2012-11-26 2013-10-28 Information processing apparatus, clustering method, and recording medium storing clustering program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012257203 2012-11-26
JP2012257203 2012-11-26
JP2013120922A JP6131723B2 (ja) 2012-11-26 2013-06-07 情報処理装置、情報処理方法、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2014123341A JP2014123341A (ja) 2014-07-03
JP6131723B2 true JP6131723B2 (ja) 2017-05-24

Family

ID=50774182

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013120922A Active JP6131723B2 (ja) 2012-11-26 2013-06-07 情報処理装置、情報処理方法、プログラムおよび記録媒体

Country Status (2)

Country Link
US (1) US9519660B2 (ja)
JP (1) JP6131723B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6299299B2 (ja) * 2014-03-14 2018-03-28 オムロン株式会社 事象検出装置および事象検出方法
US20150363660A1 (en) * 2014-06-12 2015-12-17 Asap54.Com Ltd System for automated segmentation of images through layout classification
CN105279749A (zh) * 2014-07-02 2016-01-27 深圳Tcl新技术有限公司 图片抠图方法及装置
CN105447008A (zh) * 2014-08-11 2016-03-30 中国移动通信集团四川有限公司 时序聚类的分布式处理方法及系统
CN104615638B (zh) * 2014-11-25 2017-11-07 浙江银江研究院有限公司 一种面向大数据的分布式密度聚类方法
CN107133549B (zh) 2016-02-29 2020-11-24 上海联影医疗科技有限公司 Ect运动门控信号获取方法及ect图像重建方法
CN106251381B (zh) * 2016-07-29 2020-02-04 上海联影医疗科技有限公司 图像重建方法
WO2018025845A1 (ja) * 2016-08-03 2018-02-08 日本電気株式会社 検出装置、検出方法及びプログラムを記憶する記憶媒体
JP6840957B2 (ja) 2016-09-01 2021-03-10 株式会社リコー 画像類似度算出装置、画像処理装置、画像処理方法、及び記録媒体
CN108122081B (zh) * 2016-11-26 2020-09-25 沈阳新松机器人自动化股份有限公司 机器人及其库存管理方法
WO2019008961A1 (ja) * 2017-07-07 2019-01-10 日本電気株式会社 情報処理装置、情報処理方法、およびプログラム
CN110019543A (zh) * 2017-09-12 2019-07-16 中兴通讯股份有限公司 一种时序聚类的方法及装置
US10678888B2 (en) * 2017-11-24 2020-06-09 Vmware, Inc. Methods and systems to predict parameters in a database of information technology equipment
CN108446738A (zh) * 2018-03-23 2018-08-24 联想(北京)有限公司 一种聚类方法、装置及电子设备
CN111178533B (zh) * 2018-11-12 2024-04-16 第四范式(北京)技术有限公司 实现自动半监督机器学习的方法及装置
WO2020166008A1 (ja) * 2019-02-14 2020-08-20 株式会社島津製作所 イメージング分析装置
US11461372B1 (en) * 2021-03-18 2022-10-04 Bae Systems Information And Electronic Systems Integration Inc. Data clustering in logic devices using unsupervised learning
CN113204664B (zh) * 2021-04-25 2022-11-04 北京三快在线科技有限公司 一种图像聚类方法及装置
US20230022356A1 (en) * 2021-07-09 2023-01-26 Hitachi, Ltd. Method and system for human activity recognition in an industrial setting
US11842160B2 (en) * 2021-07-14 2023-12-12 International Business Machines Corporation Keyword extraction with frequency—inverse document frequency method for word embedding

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07141166A (ja) 1993-11-19 1995-06-02 Ricoh Co Ltd クラスタ分析を用いたプログラム解析方法
US5983237A (en) * 1996-03-29 1999-11-09 Virage, Inc. Visual dictionary
US6742003B2 (en) * 2001-04-30 2004-05-25 Microsoft Corporation Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications
JP4340367B2 (ja) 1999-01-27 2009-10-07 株式会社リコー 画像分類装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US6925199B2 (en) * 2000-11-29 2005-08-02 Fujitsu Limited Computer readable recording medium recorded with diagnosis supporting program, diagnosis supporting apparatus and diagnosis supporting method
US7363278B2 (en) * 2001-04-05 2008-04-22 Audible Magic Corporation Copyright detection and protection system and method
US6993535B2 (en) * 2001-06-18 2006-01-31 International Business Machines Corporation Business method and apparatus for employing induced multimedia classifiers based on unified representation of features reflecting disparate modalities
US7133811B2 (en) * 2002-10-15 2006-11-07 Microsoft Corporation Staged mixture modeling
JP2004272350A (ja) 2003-03-05 2004-09-30 Nec Corp クラスタリング装置、クラスタリング方法、クラスタリングプログラム
US20070255684A1 (en) * 2006-04-29 2007-11-01 Yahoo! Inc. System and method using flat clustering for evolutionary clustering of sequential data sets
US8094948B2 (en) * 2007-04-27 2012-01-10 The Regents Of The University Of California Photo classification using optical parameters of camera from EXIF metadata
US20090119482A1 (en) 2007-11-02 2009-05-07 Ricoh Company, Ltd. Image forming device, image formation controlling method, and image formation controlling program
US8553927B2 (en) 2007-11-02 2013-10-08 Ricoh Company, Ltd. Image processing device and method for determining image data processes based on additional information
US7885794B2 (en) * 2007-11-30 2011-02-08 Xerox Corporation Object comparison, retrieval, and categorization methods and apparatuses
US8335786B2 (en) * 2009-05-28 2012-12-18 Zeitera, Llc Multi-media content identification using multi-level content signature correlation and fast similarity search
JP5672872B2 (ja) 2010-09-08 2015-02-18 株式会社リコー 画像形成装置
JP5741007B2 (ja) 2011-01-21 2015-07-01 株式会社リコー 画像処理装置、画素補間方法およびプログラム
JP5741011B2 (ja) 2011-01-26 2015-07-01 株式会社リコー 画像処理装置、画素補間方法およびプログラム
WO2012111236A1 (ja) * 2011-02-17 2012-08-23 三洋電機株式会社 画像識別装置およびプログラム
JP5799634B2 (ja) 2011-07-22 2015-10-28 株式会社リコー 画像処理装置、画像処理システム
JP5733083B2 (ja) 2011-07-28 2015-06-10 株式会社リコー 画像処理装置、画像処理システム
JP5857676B2 (ja) 2011-11-24 2016-02-10 株式会社リコー 画像処理装置、画像処理システム

Also Published As

Publication number Publication date
JP2014123341A (ja) 2014-07-03
US9519660B2 (en) 2016-12-13
US20140149412A1 (en) 2014-05-29

Similar Documents

Publication Publication Date Title
JP6131723B2 (ja) 情報処理装置、情報処理方法、プログラムおよび記録媒体
JP4579404B2 (ja) 画像処理方法及びその装置
US11853377B2 (en) Image searching method and apparatus
CN105144239B (zh) 图像处理装置、图像处理方法
US20080162469A1 (en) Content register device, content register method and content register program
US20060120627A1 (en) Image search apparatus, image search method, program, and storage medium
JP2004361987A (ja) 画像検索システム、画像分類システム、画像検索プログラム及び画像分類プログラム、並びに画像検索方法及び画像分類方法
JP2008217428A (ja) 画像検索プログラム、方法及び装置
JP4374902B2 (ja) 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム
WO2019207910A1 (ja) データ分析システム及びデータ分析方法
JPWO2009031297A1 (ja) 画像検索装置、画像分類装置及び方法並びにプログラム
US8625890B1 (en) Stylizing geographic features in photographic images based on image content
KR100312331B1 (ko) 내용기반영상검색방법및장치
JP2004192555A (ja) 情報管理方法、情報管理装置及び情報管理プログラム
JP2006260311A (ja) マッチング方法およびマッチング装置ならびにプログラム
JPH1049542A (ja) 画像登録装置および方法
JP2005353101A (ja) 画像特徴抽出方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2010250634A (ja) 画像サーバー、画像検索システム、画像検索方法およびインデックス作成方法
US9767579B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
JP2007034613A (ja) 画像処理装置及びその方法
Horning Land cover classification methods
US20080221788A1 (en) Map generation apparatus, map generation method and computer readable medium
JPH07160725A (ja) 画像検索装置
Narasimha et al. Classification of Knowledge Based Image using Decision Tree Algorithm
JP2008257537A (ja) 情報登録装置、情報検索装置、情報検索システム、情報登録プログラム、および情報検索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160527

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170321

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170403

R151 Written notification of patent or utility model registration

Ref document number: 6131723

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151