JP5081059B2 - トピック可視化装置、トピック可視化方法、トピック可視化プログラムおよびそのプログラムを記録した記録媒体 - Google Patents
トピック可視化装置、トピック可視化方法、トピック可視化プログラムおよびそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP5081059B2 JP5081059B2 JP2008124169A JP2008124169A JP5081059B2 JP 5081059 B2 JP5081059 B2 JP 5081059B2 JP 2008124169 A JP2008124169 A JP 2008124169A JP 2008124169 A JP2008124169 A JP 2008124169A JP 5081059 B2 JP5081059 B2 JP 5081059B2
- Authority
- JP
- Japan
- Prior art keywords
- topic
- data
- likelihood
- coordinates
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
山田武士、斉藤和巳、上田修功、「クロスエントロピー最小化に基づくネットワークデータの埋め込み」、情報処理学会論文誌、vol.44、pp.2401-2408(2003) 岩田具治、斉藤和巳、上田修功、「パラメトリック埋め込み法によるクラス構造の可視化」、情報処理学会論文誌、vol.46、pp.2337-2346(2005)
また、請求項4に記載のトピック可視化装置は、請求項2に記載のトピック可視化装置において、前記データw n の集合Cにおける第w番目(1≦w≦W、Wは集合Cで扱う記号単位の総数)の記号単位がトピックzにおいて出現する単語出現確率をθ zw としたとき、前記単語出現確率θ zw は前記単語出現確率θ zwnm のいずれかであり、前記配置処理手段における前記第2の尤度は、後記する式(13)で表され、前記トピックモデル推定処理手段において前記第2の尤度が前記収束条件を満たす場合とは、式(13)に示すQ(X,Φ)が最大となる場合であることを特徴とする。
また、請求項7に記載のトピック可視化方法は、請求項5に記載のトピック可視化方法において、前記配置処理ステップにおける前記第1の尤度は、後記する式(12)で表され、前記トピックモデル推定処理ステップにおいて前記第1の尤度が前記収束条件を満たす場合とは、式(12)に示すL(X,Φ,Θ|C)が最大となる場合であることを特徴とする。
また、請求項8に記載のトピック可視化方法は、請求項6に記載のトピック可視化方法において、前記データw n の集合Cにおける第w番目(1≦w≦W、Wは集合Cで扱う記号単位の総数)の記号単位がトピックzにおいて出現する単語出現確率をθ zw としたとき、前記単語出現確率θ zw は前記単語出現確率θ zwnm のいずれかであり、前記配置処理ステップにおける前記第2の尤度は、後記する式(13)で表され、前記トピックモデル推定処理ステップにおいて前記第2の尤度が前記収束条件を満たす場合とは、式(13)に示すQ(X,Φ)が最大となる場合であることを特徴とする。
また、請求項9に記載のトピック可視化プログラムは、請求項1から請求項4のいずれか一項に記載のトピック可視化装置を構成する各手段として、コンピュータを機能させるためのプログラムである。このように構成されることにより、このプログラムをインストールされたコンピュータは、このプログラムに基づいた各機能を実現することができる。
図1は、本発明の実施形態に係るトピック可視化装置の構成を示すブロック図である。
トピック可視化装置1は、内容を離散値のベクトルとして表現することが可能なデータを、そのデータに内在するトピックと共に、予め定められた空間において可視化するものである。ここで、データとは、意味が付与された記号単位から成る系列を内容として含むものであり、例えば、文書データ、購買データ、遺伝子配列データなどである。例えば、文書データの場合、意味が付与された記号単位とは単語を指し、トピックとは、データの集合において予め定められており、例えば、クラス、ジャンル、ラベル等を指す。以下では、簡単のためデータを文書データとして説明する。このトピック可視化装置1は、図1に示すように、演算手段2と、入力手段3と、記憶手段4と、出力手段5とを備えている。各手段2〜5はバスライン11に接続されている。
(入力データ45)
文書集合で扱うすべての単語の語彙数をWとする。文書集合は、N個の文書(文書データ)からなる。文書に含まれる総単語数はM個である。文書に含まれるM個の総単語には、例えば、日本語であれば「は」、英語であれば「a」のように、文書中に何度も出現する単語が含まれている。文書に含まれるこれらの単語は、W個の語彙数のすべての単語のうちのいずれかの単語である。これらの内容を式(1)および式(2)のように定式化する。文書集合のうち、n番目(1≦n≦N)の文書wn(以下、第n文書wnあるいは単に文書wnという)を、式(1)のように、長さMnの単語系列として表現する。式(1)において、wn mは、第n文書wnにおいてm番目(1≦m≦Mn)に出現した単語を示す。また、式(1)で示した文書wnの集合を式(2)で示す。この式(2)で示された文書集合Cが入力データ45として与えられる。
文書集合Cに含まれるそれぞれの文書(文書データ)を、その文書(文書データ)のトピックにより文書間の関係(文書データ間の関係)が理解されるように可視化する空間としてD次元空間を定義する。Dは、一般に2または3である。ここで、トピックは、例えば、クラス、ジャンル、ラベル等を示し、文書データの構造を直感的に理解させることのできるものであり、データと共に埋め込まれるクラスやベクトルで表すことが可能である。このD次元空間において、文書wnの位置を示す座標xn(以下、文書座標xnという)を式(3)で示す。また、式(3)で示した文書座標xnの集合Xを式(4)で示す。この式(4)で示された文書座標集合Xは、推定する必要がある未知パラメータであり、文書座標集合47として計算される。
D次元空間において、文書間の関係(文書データ間の関係)がその文書(文書データ)のトピックにより理解されるように可視化される際に、z番目のトピックz(以下、単にトピックzという、1≦z≦Z)の位置を示す座標φz(以下、トピック座標φzという)を式(5)で示す。また、式(5)で示したトピック座標φzの集合Φを式(6)で示す。式(6)においてZは、トピックの総数である。この式(6)で示されたトピック座標集合Φは、推定する必要がある未知パラメータであり、トピック座標集合48として計算される。
D次元空間において、文書間の関係(文書データ間の関係)がその文書(文書データ)のトピックにより理解されるように可視化される際に、その文書(文書データ)のトピックzにおいて、文書集合で扱う各単語(語彙数W)がどれくらいの確率で現れているかを示す指標θz(文書集合で前提とするトピックzが内在する全文書において、文書集合で扱う各単語が出現する確率(トピックモデル)、以下、単語出現確率θzという)を式(7)で示す。式(7)においてθz wはトピックzにおいて第w番目(1≦w≦W)の単語が出現する確率を表す。単語出現確率θzは、語彙数Wと同数の要素を有し、式(8)に示すように、各要素の確率の総和は1に正規化されている。なお、第w番目の単語(1≦w≦W)は、前記した単語wn mのいずれかに対応する。すなわち、第w番目の単語とは、第n文書wnにおいてm番目(1≦m≦Mn)に出現した単語のいずれかに対応している。
帰属度は、文書集合Cにおいて前記した式(1)で示された第n文書wn(1≦n≦N)の長さMnの単語系列として出現したm番目(1≦m≦Mn)の単語が、どのトピックzに帰属するかを表し、推定する必要がある未知パラメータである。本実施形態で用いる帰属度は、文書座標がトピックに帰属する確率として推定されるトピック帰属度(以下、トピック帰属確率という)と、式(9)で示された単語出現確率集合Θから推定されるトピック帰属度との双方を考慮したものである。ここで、トピック帰属確率は、式(3)で示された文書座標xnと式(6)で示されたトピック座標集合Φとの両方の座標を用いることで、その文書座標xnがトピックzに帰属する確率として推定される。採用すべきトピック帰属確率(関数)としては、文書座標xnとトピック座標φzとのユークリッド距離が近ければ、そのトピックzに属する確率は高くなり、逆に、遠ければそのトピックzに属する確率は低くなるものを用いる。
は式(8)およびその説明で定義したものである。この式(11)で示された帰属度qn m zは、長さMnの単語系列を有した第n文書wnを文書集合Cに亘って走査した総単語について求められるが、単語出現確率θzが語彙数Wと同数の要素を有しているので、実質的には語彙数Wとトピックの総数Zとの積の個数の集合が求められる。この帰属度qn m zの集合は、推定する必要がある未知パラメータであり、帰属度集合46として計算される。
(処理の全体の流れ)
図2は、図1に示したトピック可視化装置による処理の流れを示すフローチャートである。まず、トピック可視化装置1は、入力データ45(文書集合C)を読み込む(ステップS1)。次に、トピック可視化装置1は、文書座標集合47(文書座標集合X)、トピック座標集合48(トピック座標集合Φ)、単語出現確率集合49(単語出現確率集合Θ)、をランダムに初期化する(ステップS2)。つまり、文書座標集合47、トピック座標集合48、単語出現確率集合49のそれぞれの初期状態は、集合の各要素がランダムな値(例えば、0)を有した集合として設定される。続いて、トピック可視化装置1は、帰属度推定部21において帰属度集合46(帰属度qn m zの集合)を計算する処理(ステップS3:帰属度推定処理ステップ)、配置部22において文書座標集合47およびトピック座標集合48を計算する処理(ステップS4:配置処理ステップ)、トピックモデル推定部23において単語出現確率集合49を計算する処理(ステップS5:トピックモデル推定処理ステップ)を一連の演算処理として、この一連の演算処理を、目的関数が収束するまで繰り返し(ステップS6:No)、目的関数が収束したときに、可視化部24により、そのときの文書座標集合47(文書座標集合X)を出力する(ステップ7:可視化処理ステップ)。このとき出力される文書座標集合47は、D次元空間において、文書間の関係(文書データ間の関係)がその文書(文書データ)のトピックにより理解されるように可視化される配置座標のデータである。
ステップS6において値の収束が判別される目的関数は、「文書座標集合47、トピック座標集合48、単語出現確率集合49が、どのくらい入力データ45を尤もらしく説明できているかを表す尤度」を示す関数である。つまり、「目的関数が収束するまで繰り返す」とは、「それぞれ計算された文書座標集合47、トピック座標集合48、単語出現確率集合49の計算された時点における推定値が、どのくらい入力データ45を尤もらしく説明できているかを表す尤度が収束するまで繰り返す」ことを意味する。ここで、尤度が収束した状態、すなわち、尤度が高くなる状態とは、D次元空間に可視化した際に、例えば、次の(1)〜(3)のような状態になることである。(1)帰属度が高いトピックの位置の近くに文書が配置されている状態、(2)トピックが似ている文書同士が近くに配置されている状態、(3)トピックの典型的な単語の出現確率が高くなっている状態。
次に、演算手段2の各部の構成の詳細を説明する。以下ではEMアルゴリズム(Expectation−Maximization algorithm)に基づいて帰属度推定(ステップS3)、配置(ステップS4)、トピックモデル推定(ステップS5)を行う場合について記述する。なお、EMアルゴリズムは、ステップS3〜S5までの一連の処理で推定された各未知パラメータを入力として式(12)で示される尤度L(X,Φ,Θ|C)の収束条件が満たされるまで(尤度Lが最大化するまで)、Eステップ(Expectation step)とMステップ(Maximization step)との2つの手順を繰り返すアルゴリズムである。
図3は、図1に示した帰属度推定部の構成を示す機能ブロック図である。帰属度推定部(帰属度推定処理手段)21は、記憶手段4に記憶されている文書座標集合47、トピック座標集合48、単語出現確率集合49について入力をそれぞれ受け付け、帰属度を推定し、記憶手段4に更新して格納するものである。このために、帰属度推定部21は、図3に示すように、パラメータ読込部211と、帰属度計算部212と、帰属度書込部213とを備えている。
図4は、図1に示した配置部の構成を示す機能ブロック図である。配置部(配置処理手段)22は、記憶手段4に記憶されている、帰属度集合46、文書座標集合47、トピック座標集合48、単語出現確率集合49について入力を受け付け、入力として受け付けた各集合に対して文書座標集合47およびトピック座標集合48を最適化させるために予め定められた目的関数により、文書座標集合47およびトピック座標集合48を推定し、記憶手段4に更新して格納するものである。このために、配置部22は、図4に示すように、パラメータ読込部221と、配置計算部222と、配置書込部223とを備えている。
図5は、図1に示したトピックモデル推定部の構成を示す機能ブロック図である。トピックモデル推定部(トピックモデル推定処理手段)23は、記憶手段4に記憶されている、可視化対象とする入力データ45(文書集合)ついて入力を受け付け、受け付けた入力データ45により、トピックモデルの集合として単語出現確率集合49を推定し、記憶手段4に更新して格納するものである。このために、トピックモデル推定部23は、図5に示すように、パラメータ読込部231と、トピックモデル計算部232と、トピックモデル書込部233とを備えている。
を計算する。式(14)において、指示関数I(A)は、Aが真ならばI(A)=1、偽ならばI(A)=0となる。なお、「w」を一文字で単独で表記したときには、1〜Wまでの整数を意味するが、「w」を下付き文字と共に表記した場合には、前記した式(1)の文書または単語を意味する。
可視化部(可視化処理手段)24は、帰属度推定部21、配置部22、トピックモデル推定部23による一連の処理を繰り返すことで、入力データ45に対して、文書座標集合47、トピック座標集合48および単語出現確率集合49が最適化した場合に、記憶手段4に記憶されている文書座標集合47を出力手段5に出力するものである。これにより、出力手段5は、入力データ45の可視化結果を表示する。
「MDS(Multi-dimensional scaling:多次元尺度法)」は、2データ間の距離をできるだけ保存するように可視化空間へ埋め込む線形可視化法である。
可視化対象とする入力データとして、3種類の文書データ「NIPS」、「20News」、「EachMovie」を用いた。
評価手法として、可視化空間でのk近傍法(k-nearest neighbor algorithm、k-NN)の正答率を用いた。本実施例のトピック可視化方法(PLSV)と、従来法との比較結果を図6のグラフに示す。図6のグラフにおいて、横軸は最近傍のデータ数(neighbors)を示し、縦軸は正答率(accuracy)を示す。
図7は、入力データとして、「NIPS」データを用いた場合の各方法による可視化結果を示す。図7(a)は、本実施例のトピック可視化方法(PLSV)による可視化結果である。また、図7(b)〜図7(e)は、「MDS」、「Isomap」、「PLSA」、「PLSA+PE」のそれぞれの従来法による可視化結果である。図7(a)〜図7(e)のそれぞれの可視化結果において、丸印等の個々の点が1つの文書(文書データ)を表している。これら個々の点には、文書の13の研究分野に対応した13個の形状や濃淡(実験結果はカラーである)で区別されており、これらが文書データのラベル(トピック)を表している。例えば、比較的濃い丸印「AA」は、その文書が“アルゴリズム&アーキテクチャ”の分野に属していることを示し、比較的薄い丸印「VM」は、“ビジョン(マシーン)”の分野を示す。
2 演算手段
3 入力手段
4 記憶手段
5 出力手段
11 バスライン
21 帰属度推定部(帰属度推定処理手段)
211 パラメータ読込部
212 帰属度計算部
213 帰属度書込部
22 配置部(配置処理手段)
221 パラメータ読込部
222 配置計算部
223 配置書込部
23 トピックモデル推定部(トピックモデル推定処理手段)
231 パラメータ読込部
232 トピックモデル計算部
233 トピックモデル書込部
24 可視化部(可視化処理手段)
25 メモリ
40a プログラム格納部
40b データ格納部
41 帰属度推定プログラム
42 配置プログラム
43 トピックモデル推定プログラム
44 可視化プログラム
45 入力データ
46 帰属度集合
47 文書座標集合
48 トピック座標集合
49 単語出現確率集合
Claims (10)
- 意味が付与された記号単位から成る系列を内容として含むデータであって前記記号単位を離散値のベクトルとして表現することが可能なデータを、予め定められた空間において類似するデータが近くに配置されるように可視化するための各データの配置を求めるトピック可視化装置において、
前記予め定められた空間における第n番目(1≦n≦N、Nはデータの総数)のデータw n の位置であるデータ座標x n の初期値と、前記予め定められた空間における第z番目(1≦z≦Z、Zはトピックの総数)のトピックzの位置であるトピック座標φ z の初期値と、各トピックzにおいて前記データw n に含まれるm番目(1≦m≦M n 、M n はデータw n で扱う記号単位の総数)の記号単位w nm が出現する単語出現確率θ zwnm の初期値を設定する初期化手段と、
前記データ座標x n の集合Xと前記トピック座標φ z の集合Φと前記単語出現確率θ zwnm の集合Θとがどのくらい前記各データw n をもっともらしく説明できているかを表す、予め定められた第1の尤度が最大となるように、前記データ座標x n と前記トピック座標φ z とを更新する配置処理手段と、
前記更新後のデータ座標x n と前記更新後のトピック座標φ z とを用いて前記単語出現確率θ zwnm を更新し、前記更新後のデータ座標x n と前記更新後のトピック座標φ z と前記更新後の単語出現確率θ zwnm とを用いて計算される前記第1の尤度が所定の収束条件を満たさない場合には、前記配置処理手段による処理を繰り返し実行させ、前記第1の尤度が前記収束条件を満たす場合に、前記更新後のデータ座標x n の集合を出力するトピックモデル推定処理手段と、
を備えることを特徴とするトピック可視化装置。 - 前記データ座標x n と前記トピック座標φ z との前記予め定められた空間における距離が近いほど確率が高くなるように、前記データ座標x n が各トピックzに帰属する確率であるトピック帰属確率P(z|x n ,Φ)を計算し、前記トピック帰属確率P(z|x n ,Φ)と前記単語出現確率θ zwnm との積が大きいほど値が大きくなるように、前記各記号単位w nm が各トピックzに帰属する確率である帰属度q nmz を計算する帰属度推定処理手段をさらに有し、
前記配置処理手段は、前記第1の尤度の代わりに、前記データ座標x n の集合Xと前記トピック座標φ z の集合Φと前記単語出現確率θ zwnm の集合Θと前記帰属度q nmz の集合とがどのくらい前記各データw n をもっともらしく説明できているかを表す、予め定められた第2の尤度を用いて、当該第2の尤度が最大となるように、前記データ座標x n と前記トピック座標φ z とを更新し、
前記トピックモデル推定処理手段は、前記第2の尤度が前記収束条件を満たさない場合には、前記帰属度推定処理手段および前記配置処理手段による処理を繰り返し実行させる、
ことを特徴とする請求項1に記載のトピック可視化装置。 - 意味が付与された記号単位から成る系列を内容として含むデータであって前記記号単位を離散値のベクトルとして表現することが可能なデータを、予め定められた空間において類似するデータが近くに配置されるように可視化するための各データの配置を求めるトピック可視化方法であって、
初期化手段が、前記予め定められた空間における第n番目(1≦n≦N、Nはデータの総数)のデータw n の位置であるデータ座標x n の初期値と、前記予め定められた空間における第z番目(1≦z≦Z、Zはトピックの総数)のトピックzの位置であるトピック座標φ z の初期値と、各トピックzにおいて前記データw n に含まれるm番目(1≦m≦M n 、M n はデータw n で扱う記号単位の総数)の記号単位w nm が出現する単語出現確率θ zwnm の初期値を設定する初期化ステップと、
配置処理手段が、前記データ座標x n の集合Xと前記トピック座標φ z の集合Φと前記単語出現確率θ zwnm の集合Θとがどのくらい前記各データw n をもっともらしく説明できているかを表す、予め定められた第1の尤度が最大となるように、前記データ座標x n と前記トピック座標φ z とを更新する配置処理ステップと、
トピックモデル推定処理手段が、前記更新後のデータ座標x n と前記更新後のトピック座標φ z とを用いて前記単語出現確率θ zwnm を更新し、前記更新後のデータ座標x n と前記更新後のトピック座標φ z と前記更新後の単語出現確率θ zwnm とを用いて計算される前記第1の尤度が所定の収束条件を満たさない場合には、前記配置処理ステップを繰り返し実行させ、前記第1の尤度が前記収束条件を満たす場合に、前記更新後のデータ座標x n の集合を出力するトピックモデル推定処理ステップと、
を含むことを特徴とするトピック可視化方法。 - 帰属度推定処理手段が、前記データ座標x n と前記トピック座標φ z との前記予め定められた空間における距離が近いほど確率が高くなるように、前記データ座標x n が各トピックzに帰属する確率であるトピック帰属確率P(z|x n ,Φ)を計算し、前記トピック帰属確率P(z|x n ,Φ)と前記単語出現確率θ zwnm との積が大きいほど値が大きくなるように、前記各記号単位w nm が各トピックzに帰属する確率である帰属度q nmz を計算する帰属度推定処理ステップをさらに含み、
前記配置処理ステップは、前記第1の尤度の代わりに、前記データ座標x n の集合Xと前記トピック座標φ z の集合Φと前記単語出現確率θ zwnm の集合Θと前記帰属度q nmz の集合とがどのくらい前記各データw n をもっともらしく説明できているかを表す、予め定められた第2の尤度を用いて、当該第2の尤度が最大となるように、前記データ座標x n と前記トピック座標φ z とを更新し、
前記トピックモデル推定処理ステップは、前記第2の尤度が前記収束条件を満たさない場合には、前記帰属度推定処理ステップおよび前記配置処理ステップを繰り返し実行させる、
ことを特徴とする請求項5に記載のトピック可視化方法。 - 請求項1から請求項4のいずれか一項に記載のトピック可視化装置を構成する各手段として、コンピュータを機能させるためのトピック可視化プログラム。
- 請求項9に記載のトピック可視化プログラムが記録されたことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008124169A JP5081059B2 (ja) | 2008-05-12 | 2008-05-12 | トピック可視化装置、トピック可視化方法、トピック可視化プログラムおよびそのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008124169A JP5081059B2 (ja) | 2008-05-12 | 2008-05-12 | トピック可視化装置、トピック可視化方法、トピック可視化プログラムおよびそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009271874A JP2009271874A (ja) | 2009-11-19 |
JP5081059B2 true JP5081059B2 (ja) | 2012-11-21 |
Family
ID=41438338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008124169A Expired - Fee Related JP5081059B2 (ja) | 2008-05-12 | 2008-05-12 | トピック可視化装置、トピック可視化方法、トピック可視化プログラムおよびそのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5081059B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5476236B2 (ja) * | 2010-07-02 | 2014-04-23 | 日本電信電話株式会社 | コーディネート推薦装置、コーディネート推薦方法及びそのプログラム |
JP5679442B2 (ja) * | 2011-05-13 | 2015-03-04 | 日本電信電話株式会社 | 競合経験属性表示装置及び方法及びプログラム |
JP5750804B2 (ja) * | 2011-08-29 | 2015-07-22 | 国立大学法人九州工業大学 | マップ生成装置、その方法及びプログラム |
-
2008
- 2008-05-12 JP JP2008124169A patent/JP5081059B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009271874A (ja) | 2009-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kumar et al. | An efficient k-means clustering filtering algorithm using density based initial cluster centers | |
Baştanlar et al. | Introduction to machine learning | |
US8346686B2 (en) | Taxonomy-driven lumping for sequence mining | |
Romary et al. | Unsupervised classification of multivariate geostatistical data: Two algorithms | |
Nagra et al. | Hybrid self-inertia weight adaptive particle swarm optimisation with local search using C4. 5 decision tree classifier for feature selection problems | |
JP5164209B2 (ja) | 分類モデル生成装置、分類装置、分類モデル生成方法、分類方法、分類モデル生成プログラム、分類プログラムおよび記録媒体 | |
CN107220311B (zh) | 一种利用局部嵌入话题建模的文本表示方法 | |
JP2009163615A (ja) | 共クラスタリング装置、共クラスタリング方法、共クラスタリングプログラム、および、そのプログラムを記録した記録媒体 | |
Raza et al. | A heuristic based dependency calculation technique for rough set theory | |
Hahsler et al. | remm: Extensible markov model for data stream clustering in r | |
Beliakov et al. | Density based fuzzy c-means clustering of non-convex patterns | |
Chen et al. | An overlapping cluster algorithm to provide non-exhaustive clustering | |
Franco et al. | Cluster analysis of microarray data | |
Wang et al. | Robust optimal graph clustering | |
Silva et al. | An instance selection method for large datasets based on markov geometric diffusion | |
JP5081059B2 (ja) | トピック可視化装置、トピック可視化方法、トピック可視化プログラムおよびそのプログラムを記録した記録媒体 | |
KR100842215B1 (ko) | 서포트 벡터 도메인 묘사를 이용한 다범주 분류 방법 및장치와 그에 사용되는 컴퓨터 판독가능 저장매체 | |
JP5210224B2 (ja) | アノテーションデータ解析装置、アノテーションデータ解析プログラムおよびそのプログラムを記録した記録媒体 | |
Scrucca et al. | Projection pursuit based on Gaussian mixtures and evolutionary algorithms | |
Schatzmann et al. | Using self-organizing maps to visualize clusters and trends in multidimensional datasets | |
JP5344338B2 (ja) | プログラム、情報記憶媒体及び文字列認識装置 | |
Rubinov et al. | Classes and clusters in data analysis | |
US9183503B2 (en) | Sparse higher-order Markov random field | |
Abualigah et al. | Boosting moth-flame optimization algorithm by arithmetic optimization algorithm for data clustering | |
JP5087518B2 (ja) | 評価装置、及び、コンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100721 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110811 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120604 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120612 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120731 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120828 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120831 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150907 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |