JP6829603B2 - クラスタリング装置、クラスタリング方法及びクラスタリングプログラム - Google Patents

クラスタリング装置、クラスタリング方法及びクラスタリングプログラム Download PDF

Info

Publication number
JP6829603B2
JP6829603B2 JP2017000793A JP2017000793A JP6829603B2 JP 6829603 B2 JP6829603 B2 JP 6829603B2 JP 2017000793 A JP2017000793 A JP 2017000793A JP 2017000793 A JP2017000793 A JP 2017000793A JP 6829603 B2 JP6829603 B2 JP 6829603B2
Authority
JP
Japan
Prior art keywords
data
clustering
unit
selection
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017000793A
Other languages
English (en)
Other versions
JP2018109917A (ja
Inventor
悠樹 鍵谷
悠樹 鍵谷
裕介 中▲崎▼
裕介 中▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SOHGO SECURITY SERVICES CO.,LTD.
Original Assignee
SOHGO SECURITY SERVICES CO.,LTD.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SOHGO SECURITY SERVICES CO.,LTD. filed Critical SOHGO SECURITY SERVICES CO.,LTD.
Priority to JP2017000793A priority Critical patent/JP6829603B2/ja
Publication of JP2018109917A publication Critical patent/JP2018109917A/ja
Application granted granted Critical
Publication of JP6829603B2 publication Critical patent/JP6829603B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、クラスタリング装置、クラスタリング方法及びクラスタリングプログラムに関する。
多数のサービス提供先に対して複数の拠点から迅速にサービスを提供する場合に、拠点の数や立地を最適に決定するための方法として、k−Medoids法、CLARA(Clustering LARge Applications)及びCLARANS(a CLustering Algorithm based on RANdomized Search)などが知られている。例えば、警備や荷物の配送などのサービスを複数の拠点から多数のサービス提供先に対して提供する場合に、サービス提供までの距離や時間を最短にする最適な拠点を決定する必要があるので、上述した方法が用いられる。
また、最適な拠点を決定する従来技術として、例えば特許文献1には、隣接する配送拠点候補間の間隔が所定の立地間隔上限値を越えないように地域に複数の配送拠点候補を仮配置する手段、配送拠点候補から届先までの移動所要時間が所定の配送範囲規定時間内にある届先を当該配送拠点候補の配送先候補として設定する処理を各配送拠点候補について実行する手段、各届先が何れか1又は2以上の配送拠点候補の配送先候補として網羅される配送拠点候補の組み合わせの中で配送拠点候補数が最小の組み合わせを求める手段を有する配送拠点立地決定装置が開示されている。
特許第4233361号公報
しかしながら、k−Medoids法では、サンプル数をNとし、クラスタ数をkとすると、O記法で示される計算量はO(Nk)となり、演算に時間がかかってしまうという問題があった。また、CLARAおよびCLARANSでは、データ集合全体から抽出したサンプルに対してメドイドを算出するため、近似解しか得られないという問題があった。このように、従来技術では、全てのサービス提供先に対して最適な拠点を決定することと、最適な拠点を効率的に決定することとを両立させることができないという問題があった。
本発明は、上記に鑑みてなされたものであって、効率的に全データを用いたクラスタリングを行うことができるクラスタリング装置、クラスタリング方法及びクラスタリングプログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、予め与えられた数の全データを所定数のクラスタに分類するクラスタリング装置であって、前記全データからクラスタリングの対象となる選択データを選択する選択部と、前記選択データに対してクラスタリングを実行し、クラスタ、相違度及びメドイドを算出する実行部と、前記実行部がクラスタリングを実行した結果としてのクラスタ、相違度及びメドイドを記憶装置に記憶させる記憶部と、前記選択部が未だ選択していない前記全データ中のデータを前記選択データに追加するように前記選択部を制御し、前記記憶部が記憶装置に記憶させた結果と、前記選択部がデータを追加した前記選択データとを用いて、クラスタリングを再び実行するように前記実行部を制御し、前記全データに対して前記実行部がクラスタリングの実行を終了させるまで処理を反復させる反復制御部と、を有する。
本発明によれば、効率的に全データを用いたクラスタリングを行うことができるという効果を奏する。
図1は、実施形態にかかるクラスタリング装置のハードウェア構成を例示する図である。 図2は、クラスタリング装置が有する機能の概要を例示するブロック図である。 図3は、取得部が取得した全データに対し、選択部が一部のデータを選択した状態を模式的に示す図である。 図4は、実行部が初期選択データを2個のクラスタに分類した場合の結果を模式的に示す図である。 図5は、選択部が初期選択データに対して未選択データを追加した状態を模式的に示す図である。 図6は、追加データを含んだ選択データに対するクラスタリングを実行部が実行した結果を模式的に示す図である。 図7は、クラスタリング装置の第1動作例を示すフローチャートである。 図8は、クラスタリング装置の第2動作例を示すフローチャートである。
以下に添付図面を参照して、クラスタリング装置の実施形態を詳細に説明する。図1は、実施形態にかかるクラスタリング装置10のハードウェア構成を例示する図である。図1に示すように、クラスタリング装置10は、PC(Personal Computer)などであり、例えばキーボード101、ディスプレイ102、通信I/F(インターフェイス)103、HDD104、CPU105、ROM106、及びRAM107を有する。
キーボード101は、クラスタリング装置10に対するユーザからの入力を受入れる入力部を構成する。入力部は、マウスなどが含まれていてもよい。ディスプレイ102は、クラスタリング装置10の動作状況などをユーザに対して表示する表示部を構成する。通信I/F103は、例えばネットワークなどを介して、他の装置との通信を行う。
HDD104は、クラスタリング装置10が実行するプログラムやデータを記憶する記憶装置である。CPU105は、プログラムを実行することにより、クラスタリング装置10を構成する各部の制御、及び演算を行う。ROM106は、CPU105が実行するブートプログラムなどを記憶する。RAM107は、CPU105がプログラムを実行する場合にデータなどを記憶する。RAM107は、記憶装置として用いられてもよい。以下、HDD104又はRAM104を記憶装置として記す。
次に、クラスタリング装置10が有する機能について説明する。図2は、クラスタリング装置10が有する機能の概要を例示するブロック図である。図2に示すように、クラスタリング装置10は、取得部20、選択部22、実行部24、記憶部26、及び反復制御部28を有し、予め与えられた数の全データを所定数のクラスタに分類する。なお、取得部20、選択部22、実行部24、記憶部26、及び反復制御部28は、CPU105が実行するクラスタリングプログラムを構成するソフトウェアとしてモジュール化されていてもよいし、一部または全部がハードウェアによって構成されていてもよい。
取得部20は、最終的にクラスタリングを実行されるべき予め与えられた数の全データを取得する。例えば、取得部20は、図1に示したキーボード101又は通信I/F103を介し、クラスタリングを実行されるべき全データを取得する。
選択部22は、取得部20が取得した全データ中の一部のデータをクラスタリングの対象となる選択データとして選択する。
実行部24は、例えばクラスタ算出部240、相違度算出部242、及びメドイド算出部244を有し、選択部22が選択した選択データに対して例えばk−Medoids法によるクラスタリングを実行する。例えば、実行部24は、記憶装置が記憶していない相違度のみをクラスタごとに算出してもよい。
クラスタ算出部240は、データxが所属するクラスタを下式1によって算出する。
ここで、Xは選択データの全集合であり、Medoidsはメドイドの集合であるとする。データx,yは、選択データの全集合Xの異なる要素である。また、d(x,y)は、データx,y間の相違度であるとする。ここで、相違度とは、データ間の距離や時間などである。以下、相違度をコストと記す。
相違度算出部242は、実行部24がk個のクラスタに分類を行う場合、データxからi番目のクラスタX内の他のデータまでのコストの総和を、Cost(x)として下式2により算出する。iは、1≦i≦kとなる値である。ここでは、データxは、i番目のクラスタXの要素である。
メドイド算出部244は、下式3によってメドイドを算出する。
記憶部26は、実行部24がクラスタリングを実行した結果を記憶装置に記憶させる。具体的には、記憶部26は、実行部24がクラスタリングを実行するごとにクラスタ、メドイド及びコストをそれぞれ記憶装置に記憶させる。
反復制御部28は、選択部22が未だ選択していない全データ中の一部のデータを選択データに追加するように選択部22を制御する。また、反復制御部28は、記憶部26が記憶装置に記憶させた結果と、選択部22がデータを追加した選択データとを用いて、クラスタリングを再び実行するように実行部24を制御する。そして、反復制御部28は、全データに対して実行部24がクラスタリングの実行を終了させるまで処理を反復させる。
反復制御部28は、記憶部26が記憶装置に記憶させたメドイドそれぞれをクラスタごとの初期メドイドとして、実行部24がクラスタリングを実行するように制御を行ってもよい。
次に、図3〜図7を用いて、クラスタリング装置10の動作をさらに詳述する。図3は、取得部20が取得した全データに対し、選択部22が一部の初期選択データを選択した状態を模式的に示す図である。図3に示したように、クラスタリング装置10は、まず選択部22が全データ中の一部のデータを初期選択データとして選択する。図3においては、初期選択データそれぞれと、選択されていないデータ(以下、未選択データと記す。)それぞれとを合わせたデータは、取得部20が取得した全データとなっている。そして、クラスタリング装置10は、初期選択データに対し、実行部24がk−Medoids法を用いてクラスタリングを実行する。
図4は、実行部24が初期選択データを2個のクラスタに分類した場合の結果を模式的に示す図である。図4に示したように、実行部24は、初期選択データを2個のクラスタに分類する場合、k−Medoids法を用いて初期選択データの中から第1メドイドと第2メドイドとを決定する。ここで、第1メドイドおよび第2メドイドは、それぞれ初期選択データの中のいずれかである。ここで、記憶部26は、実行部24がクラスタリングを実行した結果をHDD104又はRAM107に記憶させる。
次に、反復制御部28は、全データ中の一部の未選択データを選択データに追加させるように選択部22を制御する。図5は、選択部22が初期選択データに対して未選択データを追加した状態を模式的に示す図である。図5においては、第1メドイドおよび第2メドイドを含む初期選択データそれぞれと、追加データそれぞれとを合わせたデータは、取得部20が取得した全データとなっている。なお、図5においては、未選択データの全てを追加データとして一度に選択部22が選択データに追加した場合が例示されているが、反復制御部28は、選択データに対して未選択データを複数回に分けて徐々に追加するように選択部22を制御することが好ましい。
そして、反復制御部28は、追加データを含んだ選択データに対するクラスタリングを実行部24に実行させるように制御を行う。ここで、実行部24は、記憶部26が記憶装置に記憶させた結果と、選択部22がデータを追加した選択データとを用いて、クラスタリングを実行する。記憶部26が記憶装置に記憶させた結果には、実行部24が前回のクラスタリングにより決定したメドイド及び各コストが含まれる。
図6は、追加データを含んだ選択データに対するクラスタリングを実行部24が実行した結果を模式的に示す図である。図6においては、第1メドイドおよび第2メドイドを含む初期選択データそれぞれと、追加データそれぞれとを合わせたデータは、取得部20が取得した全データとなっている。上述したように、実行部24は、記憶部26が記憶装置に記憶させた結果と、選択部22がデータを追加した選択データとを用いて、クラスタリングを実行する。例えば、実行部24は、前回のクラスタリングにより決定したメドイドを初期メドイドとすることにより、全てのデータが均等に最終的なメドイドに成り得るとしてクラスタリングを実行するよりも効率的にクラスタリングを収束させることができる。
また、選択部22が選択データに対して未選択データを複数回に分けて徐々に追加することにより、実行部24は、メドイドの位置が大きく変わることを抑えつつ、クラスタリングを効率的に収束させることができる。そして、反復制御部28は、全データを選択データとして実行部24がクラスタリングの実行を終了させるまで、選択部22及び実行部24に処理を反復させる制御を行う。
例えば、選択部22がt回データを追加した時のi番目のクラスタをXt,iとし、t+1回目にXt,iへ追加するデータの集合をX’t+1,iとする。ここでは、データxは、Xt+1,iの要素である。このとき、下式4が成立する。
そして、選択部22がt+1回データを追加した時、相違度算出部242は、データxからクラスタXt+1,i内の他のデータまでのコストの総和を、Costt+1(x)として下式5により算出する。
相違度算出部242は、上式5における右辺第一項のCost(x)をt回目のデータの追加時に算出済みであり、右辺第二項をt+1回目のデータ追加時に算出する。
また、選択部22が未選択データを選択データに追加した場合、データが他のクラスタへ移動することがある。t+1回目にクラスタXt,iから他のクラスタへ移動するデータの集合をX”t+1,iとすると、下式6が成立する。
この場合、選択部22がt+1回データを追加した時、相違度算出部242は、データxからクラスタXt+1,i内の他のデータまでのコストの総和を、Costt+1(x)として下式7により算出する。
相違度算出部242は、上式7における右辺第一項のCost(x)をt回目のデータの追加時に算出済みであり、右辺第二項及び第三項をt+1回目のデータ追加時に算出する。
次に、クラスタリング装置10の第1動作例についてフローチャートを用いて説明する。図7は、クラスタリング装置10の第1動作例を示すフローチャートである。図7に示すように、ステップ100(S100)において、クラスタリング装置10は、取得部20が取得した全データから、選択部22がまず初期選択データを決定する。
ステップ102(S102)において、実行部24は、選択部22が選択した初期選択データを用いて初期メドイドを決定する。
ステップ104(S104)において、実行部24は、選択部22が選択した選択データのクラスタリングを実行する。
ステップ106(S106)において、実行部24は、選択データの中でそれぞれのコストを計算する。
ステップ108(S108)において、実行部24は、メドイドを決定する。
ステップ110(S110)において、実行部24は、S108の処理でメドイドを決定する前のクラスタそれぞれのメドイドと、S108の処理でメドイドを決定した後のクラスタそれぞれのメドイドがすべて一致したか否かを判定する。実行部24は、クラスタそれぞれのメドイドがすべて一致したと判定した場合にはS112の処理に進み、その他の場合にはS104の処理に戻る。
ステップ112(S112)において、反復制御部28は、選択データ数が全データ数と一致したか否かを判定する。反復制御部28は、選択データ数が全データ数と一致したと判定した場合には処理を終了し、その他の場合にはS114の処理に進む。
ステップ114(S114)において、反復制御部28は、選択部22に対して、選択データに未選択データを追加させる制御を行って、S104の処理に戻る。なお、選択部22が選択データにデータを追加する前のメドイドと、S114の処理で選択部22が選択データにデータを追加した後のメドイドとが一致する場合、反復制御部28は、次に追加させるデータの数をより多くするように制御を行ってもよい。選択データの追加の前後でメドイドが一致する場合、今後少数のデータを追加しても現在のメドイドが変わらない可能性が高いため、データの追加数が多くされると、クラスタリングの収束が早くなることが期待される。
このように、クラスタリング装置10は、選択部22が未選択データを選択データに追加し、記憶部26がHDD104などに記憶させた結果と、選択部22がデータを追加した選択データとを用いて、実行部24がクラスタリングを反復させて実行するので、効率的に全データを用いたクラスタリングを行うことができる。
次に、クラスタリング装置10の第2動作例をフローチャートを用いて説明する。図8は、クラスタリング装置10の第2動作例を示すフローチャートである。なお、図8に示した処理のうち、図7に示した処理と実質的に同じものには、同一の符号が付してある。
ステップ200(S200)において、実行部24は、S108の処理でメドイドを決定する前のクラスタそれぞれのメドイドと、S108の処理でメドイドを決定した後のクラスタそれぞれのメドイドがすべて一致したか否かを判定する。実行部24は、クラスタそれぞれのメドイドがすべて一致したと判定した場合にはS112の処理に進み、その他の場合にはS202の処理に進む。
ステップ202(S202)において、反復制御部28は、選択データ数が全データ数と一致したか否かを判定する。反復制御部28は、選択データ数が全データ数と一致したと判定した場合にはS104の処理に戻り、その他の場合にはS204の処理に進む。
ステップ204(S204)において、反復制御部28は、選択部22に対して、選択データに少数の未選択データを追加させる制御を行って、S104の処理に戻る。
なお、クラスタリング装置10の第2動作例では、実行部24が実行するk−Medoids法によるクラスタリングが収束していない場合(例えば、メドイドが変わった場合)であっても、選択部22が少数のデータを選択データに追加する。つまり、クラスタリング装置10は、第2動作例においては、可能な限り早期に選択データを増やして近似最適解をより早く得るために、kーMedoids法によるクラスタリングが収束していなくても少数のデータを選択データに追加している。
また、クラスタリング装置10は、サービスを提供する施設(以下、サービス提供施設と記す。)をサービス提供先(例えば、機械警備先または訪問介護先、警備輸送先など)に対して適切に配置するために用いられることが可能である。この場合、クラスタリング装置10は、データの全てをサービス提供施設の候補とする。また、データの一部はサービス提供先であり、サービス提供施設候補を兼ねている。
このとき、クラスタリング装置10は、サービス提供先を優先させて選択データに追加することにより、クラスタリングの収束を高速化させてもよい。つまり、選択部22は、データに対応付けられた優先度を示す情報に応じて、全データ中の一部のデータを優先して選択データとして選択してもよい。
また、クラスタリング装置10は、道路の交差点を優先的に選択データに追加するように構成されてもよい。経験則として、交差点が最終的なサービス提供施設の最適位置になりやすいため、道路の交差点が優先的に選択データに追加されると、クラスタリングの収束の高速化が期待される。
また、クラスタリング装置10は、選択部22が全データからランダムに選択データを選択するように構成されてもよい。このように、選択部22が全データからランダムに選択データを選択すると、実行部24がクラスタリングを反復して実行する場合に、早期に近似最適解が得られるため、クラスタリングの収束の高速化が期待される。
さらに、クラスタリング装置10は、道路データにおけるサービス提供先それぞれの地理的空間上の間隔が略均等になるように、選択部22が選択データを選択するように構成されてもよい。例えば、地理的空間上で一定間隔離れたデータがそれぞれ選択される場合、選択データの地理的空間上の位置は略均等となる。選択データが地理的空間上で偏りがないように選択されると、早期に近似最適解が得られるため、クラスタリングの収束の高速化が期待される。
また、クラスタリング装置10は、サービス提供先の地理的空間上の密度分布が略同様になるように、選択部22が選択データを選択するように構成されてもよい。例えば、クラスタリング装置10は、サービス提供先であるデータが優先してランダムに選択されるように構成されると、選択データの地理的空間上の密度分布はサービス提供先の密度分布に近付くこととなる。このように、選択データがサービス提供先の地理的空間上の密度を考慮して選択されると、早期に近似最適解が得られるため、クラスタリングの収束の高速化が期待される。
また、クラスタリング装置10は、すでに配置されている既存のサービス提供施設を移転させたり、再配置を行う場合には、初期メドイドを既存のサービス提供施設の近傍にするように構成されてもよい。過去にクラスタリングが行われた結果が反映されて初期メドイドが決定されると、初期メドイドがランダムに配置される場合に比べて、評価値(例えば、クラスタ内のコストの総和)が小さくなりやすいため、クラスタリングの収束の高速化が期待される。
また、クラスタリング装置10は、選択データのコストを計算する場合に、コストの総和ではなくコストの加重総和を計算するように構成されてもよい。具体的には、実行部24は、データに対応付けられた重みに基づいてコストを算出し、クラスタリングを実行してもよい。例えば、クラスタリング装置10が機械警備、訪問介護、または警備輸送などを行うサービス提供施設の配置を決定する場合、過去のサービス提供実績に応じた重み付けがされることにより、サービス稼働時のサービス提供時間の短縮が期待される。さらに、クラスタリング装置10は、サービス提供先の重要度、定性的な移動のしにくさ、サービスにかかる時間、料金などでコストの重み付けを行うように構成されてもよい。
また、クラスタリング装置10は、対象となる全てデータを用いてクラスタリングを実行するので、2番目に適しているメドイドも明確となっている。例えば、クラスタリング装置10がサービス提供施設の配置の決定に用いられる場合、最適なメドイドが何らかの理由でサービス提供施設にできなくても、2番目に適しているメドイドをサービス提供施設とすることができる。
また、クラスタリング装置10は、ノード数を削減するために、グラフクラスタリングを利用してもよい。グラフクラスタリングは、グラフの一部をクラスタとして検出し、クラスタを1ノードとみなすことにより、ノード数を削減する。
本実施形態のクラスタリング装置10で実行されるクラスタリングプログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、本実施形態のクラスタリング装置10で実行されるクラスタリングプログラムは、インターネット等のネットワークに接続されたコンピュータ上に格納され、ネットワーク経由でダウンロードさせることにより提供されるように構成されてもよい。
10 クラスタリング装置
101 キーボード
104 HDD
105 CPU
107 RAM
20 取得部
22 選択部
24 実行部
240 クラスタ算出部
242 相違度算出部
244 メドイド算出部
26 記憶部
28 反復制御部

Claims (12)

  1. 全データを所定数のクラスタに分類するクラスタリング装置であって、
    前記全データからクラスタリングの対象となる選択データを選択する選択部と、
    前記選択データに対してクラスタリングを実行し、クラスタ、相違度及びメドイドを算出する実行部と、
    前記実行部がクラスタリングを実行した結果としてのクラスタ、相違度及びメドイドを記憶装置に記憶させる記憶部と、
    前記選択部が未だ選択していない前記全データ中のデータを前記選択データに追加するように前記選択部を制御し、前記記憶部が記憶装置に記憶させた結果と、前記選択部がデータを追加した前記選択データとを用いて、クラスタリングを再び実行するように前記実行部を制御し、前記全データに対して前記実行部がクラスタリングの実行を終了させるまで処理を反復させる反復制御部と、
    を有することを特徴とするクラスタリング装置。
  2. 前記実行部は、
    k−Medoids法によるクラスタリングを実行し、
    前記記憶部は、
    前記実行部がクラスタリングを実行するごとにクラスタ、メドイド及び相違度をそれぞれ記憶装置に記憶させること
    を特徴とする請求項1に記載のクラスタリング装置。
  3. 前記反復制御部は、
    前記記憶部が記憶装置に記憶させたメドイドそれぞれをクラスタごとの初期メドイドとして、前記実行部がクラスタリングを実行するように制御すること
    を特徴とする請求項2に記載のクラスタリング装置。
  4. 前記実行部は、
    前記記憶部が記憶装置に記憶させていない相違度のみをクラスタごとに算出すること
    を特徴とする請求項2又は3に記載のクラスタリング装置。
  5. 前記選択部は、
    データに対応付けられた優先度を示す情報に応じて、前記全データからデータを優先させて選択データとして選択すること
    を特徴とする請求項2乃至4のいずれか1項に記載のクラスタリング装置。
  6. 前記選択部は、
    前記全データからランダムに前記選択データを選択すること
    を特徴とする請求項2乃至4のいずれか1項に記載のクラスタリング装置。
  7. 前記選択部は、
    前記選択データそれぞれの間隔が略均等になるように、または前記選択データの密度分布が略同様になるように、前記全データから前記選択データを選択すること
    を特徴とする請求項6に記載のクラスタリング装置。
  8. 前記実行部は、
    データに対応付けられた重みに基づいて相違度を算出し、クラスタリングを実行すること
    を特徴とする請求項2乃至7のいずれか1項に記載のクラスタリング装置。
  9. 前記反復制御部は、
    前記実行部がクラスタリングを収束させる前に、前記選択部が未だ選択していない前記全データ中のデータを前記選択データに追加するように前記選択部を制御し、前記選択部がデータを追加した前記選択データに対してクラスタリングを再び実行するように前記実行部を制御すること
    を特徴とする請求項2乃至8のいずれか1項に記載のクラスタリング装置。
  10. 前記反復制御部は、
    前記選択部がデータを前記選択データに追加した後に前記実行部が算出したメドイドと、データを追加される前に前記実行部が算出したメドイドとが一致した場合、一致しなかった場合よりも多くのデータを追加するように前記選択部を制御すること
    を特徴とする請求項2乃至9のいずれか1項に記載のクラスタリング装置。
  11. 全データを所定数のクラスタに分類するクラスタリング方法であって、
    前記全データからクラスタリングの対象となる選択データを選択する工程と、
    前記選択データに対してクラスタリングを実行し、クラスタ、相違度及びメドイドを算出する工程と、
    クラスタリングを実行した結果としてのクラスタ、相違度及びメドイドを記憶装置に記憶させる工程と、
    未だ選択していない前記全データ中のデータを前記選択データに追加し、記憶装置に記憶させた結果と、データを追加した前記選択データとを用いて、クラスタリングを再び実行する工程と、
    を含み、
    前記全データに対してクラスタリングの実行を終了させるまで工程を反復させるクラスタリング方法。
  12. 全データを所定数のクラスタに分類するクラスタリングプログラムであって、
    前記全データからクラスタリングの対象となる選択データを選択するステップと、
    前記選択データに対してクラスタリングを実行し、クラスタ、相違度及びメドイドを算出するステップと、
    クラスタリングを実行した結果としてのクラスタ、相違度及びメドイドを記憶装置に記憶させるステップと、
    未だ選択していない前記全データ中のデータを前記選択データに追加し、記憶装置に記憶させた結果と、データを追加した前記選択データとを用いて、クラスタリングを再び実行するステップと、
    を含み、
    前記全データに対してクラスタリングの実行を終了させるまで工程を反復させることをコンピュータに実行させるためのクラスタリングプログラム。
JP2017000793A 2017-01-05 2017-01-05 クラスタリング装置、クラスタリング方法及びクラスタリングプログラム Active JP6829603B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017000793A JP6829603B2 (ja) 2017-01-05 2017-01-05 クラスタリング装置、クラスタリング方法及びクラスタリングプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017000793A JP6829603B2 (ja) 2017-01-05 2017-01-05 クラスタリング装置、クラスタリング方法及びクラスタリングプログラム

Publications (2)

Publication Number Publication Date
JP2018109917A JP2018109917A (ja) 2018-07-12
JP6829603B2 true JP6829603B2 (ja) 2021-02-10

Family

ID=62845241

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017000793A Active JP6829603B2 (ja) 2017-01-05 2017-01-05 クラスタリング装置、クラスタリング方法及びクラスタリングプログラム

Country Status (1)

Country Link
JP (1) JP6829603B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012088972A (ja) * 2010-10-20 2012-05-10 Nippon Telegr & Teleph Corp <Ntt> データ分類装置、データ分類方法及びデータ分類プログラム
JP5912667B2 (ja) * 2012-02-29 2016-04-27 綜合警備保障株式会社 クラスタリング装置およびクラスタリング方法

Also Published As

Publication number Publication date
JP2018109917A (ja) 2018-07-12

Similar Documents

Publication Publication Date Title
CN110297848B (zh) 基于联邦学习的推荐模型训练方法、终端及存储介质
JP6629678B2 (ja) 機械学習装置
Geraci A comparison of several algorithms for the single individual SNP haplotyping reconstruction problem
WO2019076173A1 (zh) 内容推送方法、装置及计算机设备
US8510235B2 (en) Information processing apparatus, information processing method, and program
US20130173648A1 (en) Software Application Recognition
JP7125358B2 (ja) 計算機システム及び入力データに対する予測結果の根拠に関する情報の提示方法
JP5123759B2 (ja) パターン検出器の学習装置、学習方法及びプログラム
JP2011520183A (ja) サンプルデータの分類
Jankovic et al. Towards feature-based performance regression using trajectory data
CN114117240B (zh) 基于大数据需求分析的互联网内容推送方法及ai系统
JPWO2010010654A1 (ja) 使い方推定装置
KR101975272B1 (ko) 협업 의존성 기반 컴포넌트 재사용 추천 시스템 및 방법
JP7189068B2 (ja) モデル作成支援方法、及びモデル作成支援システム
Teufel et al. GraphPart: homology partitioning for biological sequence analysis
JP6829603B2 (ja) クラスタリング装置、クラスタリング方法及びクラスタリングプログラム
JP7141371B2 (ja) 学習データの精練方法及び計算機システム
Moschopoulos et al. GIBA: a clustering tool for detecting protein complexes
US11200502B2 (en) Streaming atomic link learning based on socialization and system accuracy
JP2017126212A (ja) パスウェイ解析プログラム、パスウェイ解析方法、及び、情報処理装置
JP2017083963A (ja) パラメータ推定装置、予測装置、方法、及びプログラム
JP6881017B2 (ja) クラスタリング方法、クラスタリングプログラム、および情報処理装置
JP7399216B2 (ja) ユーザ嗜好に基づいた場所個人化推薦のための方法、コンピュータシステム、およびコンピュータプログラム
Krol Distributed Monte Carlo feature selection: Extracting informative features out of multidimensional problems with linear speedup
JP6355554B2 (ja) 設定データ記憶装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200917

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210122

R150 Certificate of patent or registration of utility model

Ref document number: 6829603

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250