WO2022145089A1

WO2022145089A1 - 情報処理装置、情報処理方法及び非一時的なコンピュータ可読媒体

Info

Publication number: WO2022145089A1
Application number: PCT/JP2021/031882
Authority: WO
Inventors: 修長谷川; 洸輔井加田
Original assignee: Ｓｏｉｎｎ株式会社
Priority date: 2020-12-28
Filing date: 2021-08-31
Publication date: 2022-07-07
Also published as: JPWO2022145089A1

Abstract

距離行列算出部（１）は、複数の学習結果に含まれる２つの学習結果の全ての組み合わせにおいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについて、２つのクラスタのノード間の距離を示す距離行列を算出する。評価指数算出部（２）は、各距離行列の各列及び各行の最小値のうちで所定条件を満たすものの個数に基づいて各距離行列にかかる評価指数を算出する。得点算出部（３）は、全ての距離行列について算出した評価指数に基づいて、各学習結果の各クラスタについて、注目している学習結果以外の他の学習結果のクラスタと類似している度合いを示す得点を算出する。学習結果選択部（４）は、得点算出部で算出された各学習結果の各クラスタの得点に基づいて、前期複数の学習結果から最終学習結果を選択する。

Description

情報処理装置、情報処理方法及び非一時的なコンピュータ可読媒体

　本発明は、情報処理装置、情報処理方法及びプログラムに関し、例えば入力ベクトルに対して入力分布構造を学習し、当該入力分布構造に対してクラスタリングする情報処理装置、情報処理方法及びプログラムに関する。

　入力データの入力分布構造を抽出し、その入力分布構造からクラスに分類するいわゆるクラスタリングと呼ばれる手法が多く研究、開発されている。例えばｋ平均法というよく知られている手法は、非階層のクラスタリングであり、クラスタの平均を用いて、任意の指定した数のクラスタを作成する。ｋ平均法はシンプルなアルゴリズムであり、かつ計算効率が高い人気のクラスタリング手法である。

　また、自己組織化ニューラルネットワーク（ＳＯＩＮＮ：Self-Organizing Incremental Neural Network）と呼ばれる手法が提案されている（特許文献１及び２）。ＳＯＩＮＮでは、ノード数を自律的に管理することにより非定常的な入力を学習することができ、複雑な分布形状を有するクラスに対しても適切なクラス数及び位相構造を抽出できるなど多くの利点を有する。ＳＯＩＮＮの応用例として、例えばパターン認識においては、ひらがな文字のクラスを学習させた後に、カタカナ文字のクラスなどを追加的に学習させることができる。

特開２００８－２１７２４６号公報特開２０１４－１６４３９６号公報

　しかしながら、上述のようなクラスタリング手法によって入力ベクトルを学習する場合、入力ベクトルの入力順序やパラメータの相違によって、得られる学習結果が異なってしまうことが見出された。このような異なる学習結果の例について説明する。図２４に、学習対象となる入力データを示す。この入力データでは、２次元の入力ベクトルが円弧状に分布した部分が２つ存在している。図２５に、図２４の入力データをＳＯＩＮＮによって学習した場合に、入力ベクトルの入力順序やパラメータの相違によって生成された複数の学習結果の例を示す。

　図２５では、同じ入力データを学習したにもかかわらず、学習条件の相違によって、８つの異なる学習結果が得られた。このように、複数の異なる学習結果が得られる場合には、異なる学習結果を人で比較し、適切な学習結果を選択するといった作業が必要であり、時間がかかり、非効率性につながっていた。

　本発明は、上記の事情に鑑みて成されたものであり、人による作業を軽減しつつ、入力データの構造をより正確に反映したクラスタリングができる情報処理装置、情報処理方法及びプログラムを提供することを目的とする。

　本発明の一実施の形態にかかる情報処理装置は、複数の入力ベクトルの入力分布構造を、多次元ベクトルで記述される複数のノードを含むネットワーク構造として学習する情報処理装置において、同じ入力ベクトルを異なる条件で学習した結果得られた、異なる入力分布構造を有する複数の学習結果に含まれる２つの学習結果の全ての組み合わせにおいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについて、一方のクラスタに属するノードと他方のクラスタに属するノードとの間の距離を示す距離行列を算出する距離行列算出部と、各距離行列について各列及び各行の最小値を取得し、取得した前記最小値のうちで所定条件を満たすものの個数に基づいて各距離行列にかかる評価指数を算出する評価指数算出部と、全ての距離行列について算出した評価指数に基づいて、各学習結果の各クラスタについて、注目している学習結果以外の他の学習結果のクラスタと類似している度合いを示す得点を算出する得点算出部と、前記得点算出部で算出された各学習結果の各クラスタの得点に基づいて、前期複数の学習結果から最終学習結果を選択する学習結果選択部と、を有するものである。

　本発明の一実施の形態にかかる情報処理装置は、上記の情報処理装置であって、前記得点算出部は、全ての距離行列について算出した評価指数に基づいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについての評価指数で構成される評価指数行列を生成し、前記評価指数行列に含まれる評価指数に基づいて、１つの学習結果に含まれるクラスタが他の学習結果のクラスタに似ているかを示す得点を算出し、全ての学習結果に属するクラスタについての得点を含む得点行列を生成し、前記学習結果選択部は、前記得点行列に基づいて、前記複数の学習結果から最終学習結果を選択することが望ましい。

　本発明の一実施の形態にかかる情報処理装置は、上記の情報処理装置であって、前記評価指数算出部は、前記２つのクラスタのそれぞれに属するノード間の平均的距離を求め、求めた２つの平均的距離の平均値を求め、各距離行列の各列及び各行の前記最小値のうちで、前記平均値以上のものの個数に基づいて各距離行列にかかる評価指数を算出することが望ましい。

　本発明の一実施の形態にかかる情報処理装置は、上記の情報処理装置であって、前記評価指数は、各距離行列の各列及び各行の前記最小値のうちで、前記平均値以上のものの個数を、前記２つのクラスタに属するノードの総数で除算した値であることが望ましい。

　本発明の一実施の形態にかかる情報処理装置は、上記の情報処理装置であって、前記得点算出部は、評価指数行列に含まれる各評価指数を閾値と比較し、比較結果に基づいて得点を与え、各クラスタの合計得点を算出することが望ましい。

　本発明の一実施の形態にかかる情報処理装置は、上記の情報処理装置であって、前記学習結果選択部は、各学習結果に属するクラスタの合計得点のうちで最小値を取得し、取得した最小値のうちで最大の値に対応する学習結果を選択することが望ましい。

　本発明の一実施の形態にかかる情報処理装置は、上記の情報処理装置であって、前記学習結果選択部は、前記得点行列に基づいて、前記複数の学習結果のクラスタから複数の重複しないクラスタを選択して、選択したクラスタで構成される前記最終学習結果を選択することが望ましい。

　本発明の一実施の形態にかかる情報処理装置は、上記の情報処理装置であって、前記学習結果選択部は、前記得点行列に基づいて、前記複数の学習結果のうちの１つの学習結果を前記最終学習結果として選択することが望ましい。

　本発明の一実施の形態にかかる情報処理装置は、上記の情報処理装置であって、各学習結果からクラスタを削除する処理を行う削除処理部をさらに有し、前記削除処理部は、各学習結果に属するクラスタを前記得点の順にソートする得点ソート部と、前記得点が最も高いクラスタを基準クラスタとして選択する基準クラスタ選択部と、ソートされたクラスタから前記基準クラスタより得点が低いクラスタの中で最も得点が高いクラスタを対象クラスタとして選択する対象クラスタ選択部と、前記基準クラスタ及び前記対象クラスタに基づいてクラスタの判定に用いられる判定値を算出する判定値算出部と、前記判定値に基づいて削除対象クラスタを選択するクラスタ判定部と、前記削除対象クラスタを削除するクラスタ削除部と、を有することが望ましい。

　本発明の一実施の形態にかかる情報処理装置は、上記の情報処理装置であって、前記距離行列算出部は、前記基準クラスタと前記対象クラスタとについて、前記基準クラスタのノード数分の行数と前記対象クラスタのノード数分の列数とを有する前記距離行列を算出し、前記評価指数算出部は、前記基準クラスタと前記対象クラスタとについて算出した前記距離行列の各列及び各行の最小値を取得し、前記基準クラスタ及び前記対象クラスタのそれぞれに属するノード間の平均的距離を求め、求めた２つの平均的距離の平均値を求め、前記基準クラスタと前記対象クラスタとについて算出した前記距離行列の各行の前記最小値のうちで前記平均値以上のものの個数である第１の値と、前記距離行列の各列の前記最小値のうちで前記平均値以上のものの個数である第２の値と、をカウントし、前記判定値算出部は、前記第１の値を前記基準クラスタのノード数で除算した第１の判定値と、前記第２の値を前記基準クラスタのノード数で除算した第２の判定値と、を算出し、前記クラスタ判定部は、前記第１及び第２の判定値のいずれかが第２の閾値よりも小さい場合、前記対象クラスタを削除対象クラスタとして選択し、前記クラスタ削除部は、前記削除対象クラスタを削除することが望ましい。

　本発明の一実施の形態にかかる情報処理装置は、上記の情報処理装置であって、前記削除処理部が前記削除対象クラスタを削除した場合、又は、前記クラスタ判定部が前記第１及び第２の判定値が第２の閾値よりも大きいと判定した場合、前記対象クラスタ選択部は、前記対象クラスタの次に得点が低いクラスタを新たな対象クラスタとして選択し、前記削除処理部は、前記基準クラスタと、前記新たな対象クラスタと、に基づいてクラスタを削除する処理を行うことが望ましい。

　本発明の一実施の形態にかかる情報処理装置は、上記の情報処理装置であって、前記対象クラスタの次に得点が低いクラスタが無い場合、前記基準クラスタ選択部は、前記基準クラスタ以外に、前記基準クラスタの次に得点が低いクラスタを新たな基準クラスタとして選択し、前記削除処理部は、前記新たな基準クラスタに基づいてクラスタを削除する処理を行うことが望ましい。

　本発明の一実施の形態にかかる情報処理装置は、上記の情報処理装置であって、前記基準クラスタの次に得点が低いクラスタが無い場合、前記削除処理部は、クラスタを削除する処理を終了することが望ましい。

　本発明の一実施の形態にかかる情報処理方法は、複数の入力ベクトルの入力分布構造を、多次元ベクトルで記述される複数のノードを含むネットワーク構造として学習する情報処理方法であって、距離行列算出部が、同じ入力ベクトルを異なる条件で学習した結果得られた、異なる入力分布構造を有する複数の学習結果に含まれる２つの学習結果の全ての組み合わせにおいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについて、一方のクラスタに属するノードと他方のクラスタに属するノードとの間の距離を示す距離行列を算出し、評価指数算出部が、各距離行列について各列及び各行の最小値を取得し、取得した前記最小値のうちで所定条件を満たすものの個数に基づいて各距離行列にかかる評価指数を算出し、得点算出部が、全ての距離行列について算出した評価指数に基づいて、各学習結果の各クラスタについて、注目している学習結果以外の他の学習結果のクラスタと類似している度合いを示す得点を算出し、学習結果選択部が、前記得点算出部で算出された各学習結果の各クラスタの得点に基づいて、前期複数の学習結果から最終学習結果を選択するものである。

　本発明の一実施の形態にかかるプログラムは、複数の入力ベクトルの入力分布構造を、多次元ベクトルで記述される複数のノードを含むネットワーク構造として学習する処理をコンピュータに実行させるプログラムであって、同じ入力ベクトルを異なる条件で学習した結果得られた、異なる入力分布構造を有する複数の学習結果に含まれる２つの学習結果の全ての組み合わせにおいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについて、一方のクラスタに属するノードと他方のクラスタに属するノードとの間の距離を示す距離行列を算出する処理と、各距離行列について各列及び各行の最小値を取得し、取得した前記最小値のうちで所定条件を満たすものの個数に基づいて各距離行列にかかる評価指数を算出する処理と、全ての距離行列について算出した評価指数に基づいて、各学習結果の各クラスタについて、注目している学習結果以外の他の学習結果のクラスタと類似している度合いを示す得点を算出する処理と、算出された各学習結果の各クラスタの前記得点に基づいて、前期複数の学習結果から最終学習結果を選択する処理と、をコンピュータに実行させるものである。

　本発明によれば、人による作業を軽減しつつ、入力データの構造をより正確に反映したクラスタリングができる情報処理装置、情報処理方法及びプログラムを提供することができる。

実施の形態１にかかる情報処理装置を実現するためのシステム構成の一例を示す図である。入力データでの入力ベクトルの分布を示す図である。図２の入力データを用いてｋ平均法及びＳＯＩＮＮで生成した学習結果を示す図である。同じ入力データを学習した場合に、入力ベクトルの入力順序やパラメータの相違によって生成された５つの異なる学習結果の例を示す図である実施の形態１にかかる情報処理装置の基本的構成を模式的に示す図である。実施の形態１にかかる情報処理装置の構成をより詳細に示す図である。実施の形態１にかかる情報処理装置の学習結果選択動作のフローチャートである。図４に示した５つの学習結果から得られた得点行列の例を示す図である。図２の入力データを学習した場合に、入力ベクトルの入力順序やパラメータの相違によって生成された４つの異なる学習結果の例を示す図である。実施の形態２にかかる情報処理装置の機能構成を模式的に示す図である。実施の形態２にかかる情報処理装置でのクラスタの削除処理のフローチャートである。図８に示した４つの学習結果から得られた得点行列の例を示す図である。図１２の得点行列に基づいてクラスタをソートした例を示す図である。実施の形態２にかかるクラスタ削除処理の推移を示す図である。クラスタ削除後の得点行列の例を示す図である。図１４の得点行列に基づいて選択されたクラスタを含む最終学習結果を示す図である。図２４で示した入力データに対して一部のみのクラスタしか学習できなかった例を示す図である。図１６の場合の得点行列を示す図である。実施の形態３にかかる情報処理装置の構成を模式的に示す図である。実施の形態３にかかる情報処理装置での学習結果削除処理のフローチャートである。図１８の得点行列に基づいてクラスタをソートした例を示す図である。実施の形態３にかかるクラスタ削除処理の推移を示す図である。学習結果削除後の得点行列の例を示す図である。学習対象となる入力データを示す図である。図２４の入力データをＳＯＩＮＮによって学習した場合に、入力ベクトルの入力順序やパラメータの相違によって生成された複数の学習結果の例を示す図である。

　以下、図面を参照して本発明の実施の形態について説明する。各図面においては、同一要素には同一の符号が付されており、必要に応じて重複説明は省略される。

　実施の形態１
　図１は、実施の形態１にかかる情報処理装置を実現するためのシステム構成の一例を示す図である。情報処理装置１００は、専用コンピュータ、パーソナルコンピュータ（ＰＣ）などのコンピュータ１０により実現可能である。但し、コンピュータは、物理的に単一である必要はなく、分散処理を実行する場合には、複数であってもよい。図１に示すように、コンピュータ１０は、ＣＰＵ（Central Processing Unit）１１、ＲＯＭ（Read Only Memory）１２及びＲＡＭ（Random Access Memory）１３を有し、これらがバス１４を介して相互に接続されている。尚、コンピュータを動作させるためのＯＳソフトなどは、説明を省略するが、この情報処理装置を構築するコンピュータも当然有しているものとする。

　バス１４には、入出力インターフェイス１５も接続されている。入出力インターフェイス１５には、例えば、キーボード、マウス、センサなどよりなる入力部１６、ＣＲＴ、ＬＣＤなどよりなるディスプレイ、並びにヘッドフォンやスピーカなどよりなる出力部１７、ハードディスクなどより構成される記憶部１８、モデム、ターミナルアダプタなどより構成される通信部１９などが接続されている。

　ＣＰＵ１１は、ＲＯＭ１２に記憶されている各種プログラム、又は記憶部１８からＲＡＭ１３にロードされた各種プログラムに従って各種の処理、本実施の形態においては、例えば後述する情報処理装置１００の各部の処理を実行する。ＣＰＵ１１とは別にＧＰＵ（Graphics Processing Unit）を設け、ＣＰＵ１１と同様の処理を行わせてもよい。なお、ＧＰＵは、定型的な処理を並列的に行う用途に適しており、後述する学習処理などに適用することで、ＣＰＵ１１に比べて処理速度を向上させることも可能である。ＲＡＭ１３には又、ＣＰＵ１１及びＧＰＵが各種の処理を実行する上において必要なデータなども適宜記憶される。

　通信部１９は、例えば図示しないインターネットを介しての通信処理を行ったり、ＣＰＵ１１から提供されたデータを送信したり、通信相手から受信したデータをＣＰＵ１１、ＲＡＭ１３、記憶部１８に出力したりする。記憶部１８はＣＰＵ１１との間でやり取りし、情報の保存・消去を行う。通信部１９は又、他の装置との間で、アナログ信号又はディジタル信号の通信処理を行う。

　入出力インターフェイス１５はまた、必要に応じてドライブ２０が接続され、例えば、磁気ディスク２０Ａ、光ディスク２０Ｂ、フレキシブルディスク２０Ｃ、又は半導体メモリ２０Ｄなどが適宜装着され、それらから読み出されたコンピュータプログラムが必要に応じて記憶部１８にインストールされる。

　続いて、本実施の形態にかかる情報処理装置１００における各処理について説明する。情報処理装置１００は、ｎ（ｎは、１以上の整数）次元ベクトルで記述されるノードを有し、ノードの情報は、例えばＲＡＭ１３などの記憶部に格納されている。

　入力データは、ｎ次元の入力ベクトルとして入力される。例えば、入力ベクトルは一時記憶部（例えばＲＡＭ１３）に格納される。

　以下、実施の形態１にかかる情報処理装置１００について具体的に説明する。情報処理装置１００は、複数の異なる学習結果から、以下に示す処理を行うことで、入力データの構造を適切に反映した学習結果を選択するものとして構成される。学習結果のそれぞれは、複数のノード及び各ノードが属するクラスタを示す情報（例えば、クラスタラベル）により構成されるクラスタリング結果であり、例えば上述のＥ－ＳＯＩＮＮやＬＢ－ＳＯＩＮＮなどによって生成されるニューラルネットワークでもよいし、例えば、ｋ平均法などの教師なしクラスタリング手法に基づいて入力データをクラスタリングし、クラスタに分割された入力データのいくつかをノードとして生成する等でもよい。図２に、入力データの入力ベクトルの分布を示す。図３に、図２の入力データを用いてｋ平均法及びＳＯＩＮＮで生成した学習結果を示す。図２の入力データは、入力データが４つのクラスタに分かれて分布しており、そのうち３つのクラスタが近接しており、ノイズによって境界が不明瞭になっている。この入力データをｋ平均法及びＳＯＩＮＮによって学習すると、手法の相違のため、学習結果におけるノードの分布が若干異なっているものの、同様な４つのクラスタの検出ができていることがわかる。

　図４に、同じ入力データを学習した場合に、入力ベクトルの入力順序やパラメータの相違によって生成された５つの異なる学習結果の例を示す。ここでは、図２４で示した入力データと同じ入力データを用いた。図４に示すように、学習結果１～５は、クラスタの個数や形状が相違していることがわかる。

　また、図４に示すように、それぞれの学習結果は相違しているものの、異なる学習結果の間で同一と考えられるクラスタが存在していることがわかる。例えば、学習結果１のクラスタ０は、学習結果２のクラスタ０や学習結果５のクラスタ０に近似しており、同一と考えられる。入力順序、学習方法及びパラメータなどが異なっていたとしても、同じ入力データを学習している以上、入力データが真に有しているクラスタが結果として出現する頻度は、入力順序、学習方法及びパラメータなどの影響でノイズ的なクラスタが出現する頻度と比べて、高いと考えられる。よって、複数の学習結果において同一と考えられるクラスタが出現する頻度に基づいて、適切なクラスタを判断できると考え得る。本実施の形態では、複数の学習結果における各クラスタの出現頻度に基づいて適切な学習結果を選択する処理について説明する。

　以下、情報処理装置１００の各構成要素と動作について、図５－７を参照して説明する。図５に、実施の形態１にかかる情報処理装置１００の基本的構成を模式的に示す。図６に、実施の形態１にかかる情報処理装置１００の構成をより詳細に示す。図７に、実施の形態１にかかる情報処理装置１００の学習結果選択動作のフローチャートを示す。情報処理装置１００は、距離行列算出部１、評価指数算出部２、得点算出部３及び学習結果選択部４を有する。評価指数算出部２は、算出部２Ａ及び評価指数行列生成部２Ｂを有する。得点算出部３は、算出部３Ａ及び得点行列生成部３Ｂを有する。

ステップＳ１：距離行列算出
　距離行列算出部１は、以下のステップＳ１１～Ｓ１３に基づいて、距離行列Ｄを算出する。

ステップＳ１１
　距離行列算出部１は、複数の（２以上のｒ個とする）学習結果から、任意の２つの学習結果ＳＡ及びＳＢを選択する。

ステップＳ１２
　距離行列算出部１は、学習結果ＳＡに含まれるｐ個のクラスタＣＡ１～ＣＡｐから、任意の１つのクラスタＡを選択する。学習結果ＳＢに含まれるｑ個のクラスタＣＢ１～ＣＢｑから、任意の１つのクラスタＢを選択する。

ステップＳ１３
　距離行列算出部１は、クラスタＡに含まれるノードａ１～ａｍ（ａｉ、１≦ｉ≦ｍ）と、クラスタＢに含まれるノードｂ１～ｂｎ（ｂｊ、１≦ｊ≦ｎ）と、の組み合わせの全てについてノード間の距離ｄ_ａｉｂｊを計算し、ｍ行ｎ列の距離行列Ｄを算出する。　

ステップＳ２：評価指数算出
　評価指数算出部２の算出部２Ａは、以下のステップＳ２１～Ｓ２５に基づいて、評価指数を算出する。

ステップＳ２１
　算出部２Ａは、距離行列Ｄの各行（ｄ_ａｉｂ１～ｄ_ａｉｂｎ）について、最小値ｍｉｎ_ａｉ（すなわち、ｍｉｎ_ａ１～ｍｉｎ_ａｍ）を取得し、かつ、距離行列Ｄの各列（ｄ_ａ１ｂｊ～ｄ_ａｍｂｊ）について、最小値ｍｉｎｂ_ｊ（すなわち、ｍｉｎ_ｂ１～ｍｉｎ_ｂｎ）を取得する。

ステップＳ２２
　算出部２Ａは、同じクラスタに属するノード間の平均的な距離ｄ_ｍｅａｎを算出する。ｄ_ｍｅａｎは、同一クラスタと識別されているノード間の平均的な距離なので、この平均値以上であれば異なるクラスタと識別し、これより短ければ同一クラスタとして識別できる指標と考えることができる。ｄ_ｍｅａｎは例えば以下のように記載できる。

式［２］において、ｄ_ｉはノードｉとノードｉの属するクラスタに含まれるノードとの距離の最小値である。

　なお、式［２］のｄ_ｍｅａｎは例であり、例えば以下の式［３］のように定義してもよい。

　また、ｄ_ｍｅａｎは、以下の式［４］及び［５］で示す値のうちで、大きな方の値としてもよいし、小さな方の値としてもよい。

　さらに、各行の最小値ｍｉｎ_ａ１～ｍｉｎ_ａｍと各列の最小値ｍｉｎ_ｂ１～ｍｉｎ_ｂｎとで別々のｄ_ｍｅａｎを用意して、使い分けても良い。各行の最小値ｍｉｎ_ａ１～ｍｉｎ_ａｍに対しては、例えば式［６］に示す様に、クラスタＡのみで算出されたｄ_ｍｅａｎを使用してもよい。各列の最小値ｍｉｎ_ｂ１～ｍｉｎ_ｂｎに対しては、例えば式［７］に示す様に、クラスタＢのみで算出されたｄ_ｍｅａｎを使用してもよい。

上述では、複数のノードを含む学習結果について説明したが、ＳＯＩＮＮなどによって入力データを学習した場合には、学習結果は、複数のノードと２つのノード間を接続する複数の辺とを含むこととなる。このように、ノード間に辺が存在する場合は、同じクラスタに属する辺の平均長さをｄ_ｍｅａｎとして用いることが望ましい。辺はノード間の関係性を表し、辺長さはその類似性を表しているので、辺を用いることで、ノイズの影響でたまたま近傍に存在しているノードとの距離がｄ_ｍｅａｎの算出に用いられることを防止することができる。また、本実施の形態では、平均長さとして算術平均（相加平均）を使用したが、近傍ノード間の距離分布の中心的傾向を数値で示すことができればこれに限らない。例えば、２乗平均、相乗平均、調和平均など別の平均指標を平均長さとして使用してもよいし、中央値、最頻値など別の統計的な代表値を使用してもよい。以下では、算術平均の他に説明した平均指標や統計的な代表値を含むものとして、「平均的距離」を用いるものとする。

ステップＳ２３
　算出部２Ａは、各行の最小値ｍｉｎ_ａ１～ｍｉｎ_ａｍのうちで平均的距離ｄ_ｍｅａｎ以上のものの個数ＮＵＭａをカウントし、各列の最小値ｍｉｎ_ｂ１～ｍｉｎ_ｂｎのうちで平均的距離ｄ_ｍｅａｎ以上のものの個数ＮＵＭｂをカウントする。

ステップＳ２４
　算出部２Ａは、取得した個数ＮＵＭａ及びＮＵＭｂの和を、クラスタＡ及びＢのノード総数（ｍ＋ｎ）で除算した値を、評価指数ＥＳとして算出する。

　ここでは、取得した最小値のうちで平均値ｄ_ｍｅａｎ以上のものの個数を数えることで、２つのクラスタ間において近似していないノードの数を検出していると考えることができる。また、式［８］で近似していないノードの数を２つのクラスタのノードの総数で除算することで、ノード総数に対して近似していないノードの数の割合を算出している。つまり、評価指数ＥＳは、大きな値を取る場合には２つのクラスタは類似しておらず、小さな値を取る場合には２つのクラスタは類似していることを示す、非類似度を表す値であるといえる。

　本実施の形態では、距離行列算出部１は、学習結果ＳＡに含まれるｐ個のクラスタＣＡ１～ＣＡｐの任意の１つと、学習結果ＳＢに含まれるｑ個のクラスタＣＢ１～ＣＢｑの任意の１つとの全ての組み合わせについて実行する。そして、算出部２Ａは、２つのクラスタの組み合わせの全てについて、評価指数の算出を行う。

ステップＳ２５
　つまり、算出部２Ａは、２つのクラスタの組み合わせの全てについて評価指数の算出を行ったかを判定する。２つのクラスタの組み合わせの全てについて評価指数の算出を行っていない場合には、ステップＳ１２に戻る。なお、ステップＳ１２に戻る場合には、既に選択された２つのクラスタの組み合わせと同じにならないように、新たに２つのクラスタを選択することは、言うまでもない。２つのクラスタの組み合わせの全てについて評価指数の算出を行った場合には、ステップＳ３へ進む。

ステップＳ３：評価指数行列生成
　全てのクラスタの組み合わせについて評価指数算出が終了したならば、評価指数算出部２の評価指数行列生成部２Ｂは、ｐ行ｑ列の評価指数行列ＥＭを生成する。つまり、評価指数行列ＥＭの行番号は学習結果ＳＡに含まれるクラスタの番号を示し、列番号は学習結果ＳＢに含まれるクラスタの番号を示している。

ステップＳ４：得点算出
　得点算出部３の算出部３Ａは、以下のステップＳ４１及びＳ４２に基づいて、得点を算出する。

ステップＳ４１
　算出部３Ａは、評価指数行列ＥＭに含まれる各評価指数を閾値ＴＨと比較し、閾値ＴＨ以下（似ている）の評価指数ＥＳを構成する両クラスタに高い得点を与え（例えば得点＋１）、閾値よりも大きい（似ていない）の評価指数ＥＳを構成する両クラスタに低い得点（例えば得点０）を与える。そして、学習結果ＳＡの各クラスタ（ＣＡ１～ＣＡｐ）の合計得点をそれぞれ算出する。換言すれば、評価指数行列ＥＭの各行（ＥＳ_ｉ１，…，ＳＥ_ｉｑ）に与えられた得点の合計を各行について算出する。（ＥＳ_ｉ１，…，ＳＥ_ｉｑ）の得点の合計は、クラスタＣＡｉの得点となる。また、学習結果ＳＢの各クラスタ（ＣＢ１～ＣＢｑ）の合計得点を各々算出する。換言すれば、評価指数行列ＥＭの各列（ＥＳ_１ｊ，…，ＳＥ_ｐｊ）に与えられた得点の合計を各列で各々算出する。（ＥＳ_１ｊ，…，ＳＥ_ｐｊ）の得点の合計はクラスタＣＢｊの得点となる。なお、得点算出の方法はこれに限らず、例えば閾値ＴＨ以下でかつ各行でもっとも評価指数ＥＳが低いもの（最もよく似ているもの）や、各列でもっとも評価指数ＥＳが低いもの（最もよく似ているもの）に高い得点を加えるなどの応用を加えてもよい。　　

　本実施の形態では、複数の学習結果から選択した任意の２つの学習結果の全ての組み合わせについて、上記の合計得点の算出を行う。つまり、距離行列算出部１及び評価指数算出部２は、上述の距離行列算出、評価指数算出及び評価指数行列生成を、複数の学習結果から選択した任意の２つの学習結果の全ての組み合わせについて行う。そして、算出部３Ａは、これらの計算結果に基づいて、各学習結果の各クラスタについて、合計得点を取得する。

ステップＳ４２
　つまり、算出部３Ａは、２つの学習結果の全ての組み合わせについて得点の算出を行ったかを判定する。２つの学習結果の全ての組み合わせについて得点の算出を行っていない場合には、ステップＳ１１に戻る。なお、ステップＳ１１に戻る場合には、既に選択された２つの学習結果の組み合わせと同じにならないように、新たに２つの学習結果を選択することは、言うまでもない。２つの学習結果の全ての組み合わせについて得点の算出を行った場合には、ステップＳ５へ進む。

ステップＳ５
　得点算出部３の得点行列生成部３Ｂは、取得した合計得点に基づいて、以下の式［１０］に示すように、クラスタ番号を行番号とするｒ列の得点行列ＳＭを生成する。ここで、得点行列ＳＭの要素Ｓ_ｉｊは学習結果ｊのクラスタｉにおける全合計得点である。具体的には、学習結果ｊとそのほか全ての学習結果との全ての組み合わせについて、算出部３Ａが算出した学習結果ｊのクラスタｉの合計得点を全て合計したものである。また、得点行列ＳＭには存在しない要素もある。例えば、学習結果ｊのクラスタｉは存在していない場合、Ｓ_ｉｊは空となっており、計算などに関与しない。　

　ここで、得点行列ＳＭの具体例について、５つの異なる学習結果が生成された場合について検討する。図８に、図４に示した５つの学習結果から得られた得点行列の例を示す。図８では、クラスタの最大数は３であり、簡略化のため、行列の成分（得点）を表形式で示している。

ステップＳ６：学習結果選択
　学習結果選択部４は、以下のステップＳ６１及びＳ６２に基づいて、複数の学習結果（ここでは、学習結果１～５）から、最終学習結果を選択する。

ステップＳ６１
　学習結果選択部４は、得点行列ＳＭを参照し、各学習結果について最小得点Ｓｍｉｎ１～Ｓｍｉｎｒを取得する。

ステップＳ６２
　学習結果選択部４は、取得した最小得点Ｓｍｉｎ１～Ｓｍｉｎｒのうちで最大値を取る学習結果を、採用する最終学習結果として選択する。換言すれば、学習結果選択部４は、各学習結果について他の学習結果に含まれるクラスタに最も似通っていないクラスタの得点を抽出した後に、その中から一番似通っているクラスタを有する学習結果を最終学習結果として選択している。

　図８に示した得点行列では、学習結果１～５の最小得点はそれぞれ０、０、０、０及び２となっており、この内の最大の得点は２となる。よって、学習結果選択部４は、最終学習結果として、学習結果５を選択する。図４に示すとおり、学習結果５は、クラスタ数は入力データと同じ２つであり、入力データの代表的な最終学習結果として好適であることが理解できる。

　なお、２以上の学習結果において最小得点が同じ値となる場合も有りうる。この場合、例えば、番号が最小の学習結果、番号が最大の学習結果など、任意のルールに基づいて最終学習結果を選択してもよい。また、最小得点が同じ値となる各学習結果において全クラスタの得点を各々合計し、それらを比較して最大の学習結果を選択してもよい。これにより、比較的高い得点を有する学習結果を選択することができる。　

　以上、本構成によれば、同じ入力データを学習するにあたり、入力順序やパラメータの相違によって、複数の異なる学習結果（クラスタリング結果）が得られた場合に、適切な学習結果を自動的に選択することができる。

　これにより、人間によって学習結果を選択する作業を省略でき、作業時間の短縮を実現できる。また、人間による判断を排除することで、判断するものによって選択する学習結果がばらつくことを防ぐことも可能となる。

　本実施の形態では、各学習結果に含まれる最小得点のうちで最大値を取る学習結果を最終学習結果としたが、最終学習結果の選択はこれに限られない。例えば、各学習結果において全クラスタの得点を各々合計し、その合計得点が所定の値以上の学習結果を選択し、選択した各学習結果に含まれる最小得点のうちで最大値をとる学習結果を最終学習結果として選択してもよい。この場合には、合計得点に対して閾値を設けることで、比較的得点の高いクラスタを有する学習結果を選択することができる。また、最終学習結果に比較的得点の低いクラスタが含まれていてもよい場合には、各学習結果において全クラスタの得点を各々合計し、その合計得点が最大となる学習結果を最終学習結果として選択してもよい。この場合には、最終学習結果に含まれるクラスタには得点が低いものも含まれる可能性があるが、全体的には得点の高いクラスタとなっている。これらのクラスタからユーザーが適宜選択するなどすれば、適切な学習結果を得ることができる。

　本実施の形態では、評価指数算出部２が用いる各クラスタの評価指数ＥＳの具体例として、式［８］を示したが、評価指数ＥＳはこの例に限られない。例えば、評価指数ＥＳは、以下の式［１１］のように定義してもよい。

　また、評価指数ＥＳは、以下の式［１２］のように、類似度として定義してもよい。

評価指数ＥＳとして類似度を用いる場合には、ステップＳ４１において、得点算出部が、評価指数行列ＥＭに含まれる各評価指数を閾値と比較し、閾値以上（似ている）の評価指数ＥＳを構成する両クラスタに高い得点を与え（例えば得点＋１）、閾値よりも小さい（似ていない）の評価指数ＥＳを構成する両クラスタに低い得点（例えば得点０）を与えることで、評価指数ＥＳとして非類似度を用いる場合と同様の処理が可能である。以上説明したように、評価指数ＥＳは、クラスタ間の近似度合いを定量的に示すことができれば、いかように定義することも可能である。

　実施の形態２
　実施の形態２では、実施の形態１にかかる学習結果選択の変形例について説明する。実施の形態１では、複数の学習結果における各クラスタの出現頻度に基づいて適切な学習結果を選択する処理について説明した。しかしながら、場合によっては学習結果の中に適切なものが存在していないことがある。図９に、図２４の入力データを学習した場合に、入力ベクトルの入力順序やパラメータの相違によって生成された４つの異なる学習結果の例を示す。入力データのクラスタ数が２つであるのに対し、どの学習結果も入力データの特徴を反映しているものの、クラスタ数は３つとなっており、全てのクラスタを適切に表現している結果ではないことが分かる。本実施の形態では、複数の学習結果における各クラスタの出現頻度に基づいて、適切なクラスタを選択して学習結果を作成する処理について説明する。

　図１０に、実施の形態２にかかる情報処理装置２００の構成を模式的に示す。情報処理装置２００は、実施の形態１にかかる情報処理装置１００に、削除処理部７を追加した構成を有する。削除処理部７は、得点ソート部７１、基準クラスタ選択部７２、対象クラスタ選択部７３、判定値算出部７４、クラスタ判定部７５及びクラスタ削除部７６を有し、距離行列算出部１及び評価指数算出部２ともに、重複クラスタの削除処理を行う。

　図１１に、実施の形態２にかかる情報処理装置２００でのクラスタの削除処理のフローチャートを示す。クラスタの削除処理ステップＳ７は、図７のステップＳ５とステップＳ６との間に挿入されるものであり、以下のステップＳ７０１～Ｓ７１３を含む。

ステップＳ７０１
　得点ソート部７１は、得点行列ＳＭに基づいて、得点順に、例えば降順で全クラスタをソートする。図１２に、図９に示した４つの学習結果から得られた得点行列の例を示す。図１３に、図１２の得点行列に基づいてクラスタをソートした例を示す。

ステップＳ７０２
　基準クラスタ選択部７２は、最も得点が高いクラスタを基準クラスタとして選択する。

ステップＳ７０３
　対象クラスタ選択部７３は、ソートした順（図１３）における基準クラスタの１つ下の行のクラスタを対象クラスタとして選択する。

　なお、既に選択された２つのクラスタの組み合わせと同じにならないように、基準クラスタと対象クラスタとが選択されることは、言うまでもない。

ステップＳ７０４
　距離行列算出部１は、ステップＳ１と同様に、基準クラスタ（クラスタＡとする）及び対象クラスタ（クラスタＢとする）について、距離行列Ｄを算出する。

ステップＳ７０５
　評価指数算出部２は、ステップＳ２１と同様に、距離行列Ｄの各行（ｄ_ａｉｂ１～ｄ_ａｉｂｎ）について、最小値ｍｉｎ_ａｉ（すなわち、ｍｉｎ_ａ１～ｍｉｎ_ａｍ）を取得し、かつ、距離行列Ｄの各列（ｄ_ａ１ｂｊ～ｄ_ａｍｂｊ）について、最小値ｍｉｎｂ_ｊ（すなわち、ｍｉｎ_ｂ１～ｍｉｎ_ｂｎ）を取得する。

ステップＳ７０６
　評価指数算出部２は、ステップＳ２２と同様に、同じクラスタに属するノード間の平均的な距離ｄ_ｍｅａｎを算出する。

ステップＳ７０７
　評価指数算出部２は、ステップＳ２３と同様に、各行の最小値ｍｉｎ_ａ１～ｍｉｎ_ａｍのうちで平均的距離ｄ_ｍｅａｎ以上のものの個数ＮＵＭａをカウントし、各列の最小値ｍｉｎ_ｂ１～ｍｉｎ_ｂｎのうちで平均的距離ｄ_ｍｅａｎ以上のものの個数ＮＵＭｂをカウントする。

ステップＳ７０８
　判定値算出部７４は、各行についてのカウント個数ＮＵＭａをクラスタＡのノード数ｍで除算して、クラスタＡの内クラスタＢとは似ていないノードの割合を示す判定値ＲＡを算出する。また、判定値算出部７４は、各列についてのカウント個数ＮＵＭｂをクラスタＢのノード数ｎで除算して、クラスタＢの内クラスタＡとは似ていないノードの割合を示す判定値ＲＢを算出する。

ステップＳ７０９
　クラスタ判定部７５は、判定値ＲＡ及びＲＢを所定の閾値ＴＨｒと比較し、判定値ＲＡ及びＲＢのいずれかが所定の閾値ＴＨｒよりも小さい場合、クラスタＡ及びＢの一方が他方に含まれる、又は、一致していると判定し、低得点又は同得点のクラスタＢ（すなわち、対象クラスタ）が削除されるべきものと判定する。

ステップＳ７１０
　クラスタ削除部７６は、クラスタ判定部７５において対象クラスタが削除されるべきものと判定された場合には、得点行列ＳＭから低得点の対象クラスタの得点を削除する。後述するように、削除されたクラスタは最終学習結果として選ぶことができない。また、クラスタのソート（図１３）からも、削除したクラスタに該当する行は削除される。つまり、削除したクラスタについては、次の処理以降では、基準クラスタや対象クラスタとして選択されることはない。ただし、ステップＳ７１１及びＳ７１２において次の対象クラスタを算出するための現在の対象クラスタとして用いることは可能である。すなわち、本実施の形態において「ソートした順（図１３）においてあるクラスタの１つ下のクラスタを選択する」と記載する場合、ソートした順（図１３）から削除したクラスタに該当する行が削除された順において、１つ下のクラスタを選択することを意味するものとする。

ステップＳ７１１
　対象クラスタ選択部７３は、ソートした順（図１３）における現在の対象クラスタの１つ下の行に、新たな対象クラスタとして選択可能な他のクラスタが存在するかを判定する。

ステップＳ７１２
　ステップＳ７１１において新たな対象クラスタとして選択可能な他のクラスタが存在すると判定された場合、対象クラスタ選択部７３は、当該他のクラスタ（すなわち、ソートした順（図１３）における現在の対象クラスタの１つ下の行のクラスタ）を新たな対象クラスタとして選択した後、処理をステップＳ７０４へ戻す。

ステップＳ７１３
　ステップＳ７１１において新たな対象クラスタとして選択可能な他のクラスタが存在しないと判定された場合、基準クラスタ選択部７２は、ソートした順（図１３）における現在の基準クラスタの１つ下の行に、削除されずに残存している、新たな基準クラスタとして選択可能な他のクラスタが存在するかを判定する。なお、新たな基準クラスタとして選択可能なクラスタが存在しないと判定した場合、ステップＳ７のクラスタ削除処理を終了する。

ステップＳ７１４
　ステップＳ７１３において新たな基準クラスタとして選択可能なクラスタが存在すると判定された場合、基準クラスタ選択部７２は、ソートした順（図１３）における現在の基準クラスタの１つ下のクラスタを、新たな基準クラスタとして選択した後、処理をステップＳ７０３へ戻す。

　以上のステップＳ７でのクラスタ削除処理について、図９の４つの学習結果に基づく具体例を示して説明する。図１４に、実施の形態２にかかるクラスタ削除処理の推移を示す。

　ステップＳ７でのクラスタ削除処理においては、最も高い得点を有する基準クラスタと対象クラスタとの間で得点の高い順に処理が実行される。その後、次に残存するクラスタの中で得点の高いクラスタが基準クラスタとして選択され、新たな基準クラスタと対象クラスタとの間で、得点の高い順に処理が行われてゆくサイクルが、新たな基準クラスタが選択できなくなるまで繰り返されることとなる。

削除推移１
　まず、得点が最も高い学習結果１のクラスタ０が基準クラスタとなり、それ以外のクラスタとの間で処理が実行される。図１４の削除推移１の表の＊がついている行は、学習結果１のクラスタ０と一致している、学習結果１のクラスタ０を含む、又は、学習結果１のクラスタ０に含まれると判定されるものである。そのため＊の行は削除される。

削除推移２
　削除推移１に示す処理の完了後、削除推移２に示す処理が実行される。図１４の削除推移２では、ソートした順において削除推移１で削除されたクラスタに該当する行を除外して表示している。ここでは、残存するクラスタのなかで　学習結果１のクラスタ０を除いた内で得点が最も高い学習結果３のクラスタ１と、学習結果１のクラスタ０以外の残存するクラスタとの間で処理が実行される。図１４の削除推移２の表の＊がついている行は学習結果３のクラスタ１と一致している、学習結果３のクラスタ１を含む、又は、学習結果３のクラスタ１に含まれると判定されるものである。そのため＊の行は削除される。

削除推移３
　削除推移２に示す処理の完了後、削除推移３に示す処理が実行される。図１４の削除推移３では、ソートした順において削除推移１及び２で削除されたクラスタに該当する行を除外して表示している。削除推移３の状態では未処理のクラスタの組み合わせは存在しないので、ここでクラスタの削除処理を終了する。図１５に、クラスタ削除後の得点行列の例を示す。クラスタ削除前の各クラスタの得点は図１２と同様であるが、ここでは、ステップＳ７によって、×印が表示されているクラスタが削除されている。

ステップＳ６
　ステップＳ７の処理後、重複のないクラスタだけが残されている。学習結果選択部４は、ここから所定の得点閾値以上のクラスタのみを抽出して最終学習結果とする。図１５において、例えば所定の得点閾値を１とすれば、学習結果１のクラスタ０と学習結果３のクラスタ１が最終学習結果となる。ここでは所定の得点閾値を１としたが、これに限らず、適切な値を設定できる。所定の得点閾値を低く設定するとどんなクラスタも抽出し、高くすれば、頻度が高く出現するクラスタのみを抽出できる。図１６に、図１５の得点行列に基づいて選択されたクラスタを含む最終学習結果を示す。図１６に示される通り、入力データの特徴を適切に表現したクラスタになっていることが分かる。

　以上、本構成によれば、複数の学習結果間で共通するクラスタを削除することで、同様のクラスタを選択することなく得点の高いクラスタを全学習結果から選ぶことが可能となる。これにより、学習結果の中に適切なものがなくても適切なクラスタとなる結果を作ることができる。

　本実施の形態では、ステップＳ７０８で判定値ＲＡ及びＲＢのいずれか一方が所定の閾値ＴＨｒよりも小さい場合、クラスタＡ及びＢの一方が他方に含まれると判定し、対象クラスタであるクラスタＢが削除されるべきものと判定し、削除したが、例えば、最終的な学習結果としてのクラスタに付随して、従属クラスとしてユーザーに示しなどしても良い。

　実施の形態３
　実施の形態３では、実施の形態２のクラスタ削除処理をより簡略化し、学習結果削除処理として機能させた例について説明する。学習の仕方によっては、入力データの部分的な特徴しか学習できない場合もあると想定し得る。図１７に、図２４で示した入力データに対して一部のみのクラスタしか学習できなかった例を示す。図１７に示す結果になる確率は低いにしろ、学習結果として得られる可能性はある。このような部分的にしか学習が進まなかった不適切な結果が選択肢の中に含まれていると、実施の形態１では適切に機能しない場合がある。例えば、図４の結果に図１７の結果を追加した複数の学習結果を対象とした場合について想定し、このときの得点行列を図１８に示す。この場合、実施の形態１のステップＳ６２の処理によって最終学習結果を選択すると、図１７の不適切な学習結果が選択されてしまう。そこで、本実施の形態では、入力データに対して部分的にしか特徴を捉えていないような不適切な結果が含まれている場合でも、不適切な学習結果を削除し、適切な学習結果を選択する処理について説明する。

　図１９に、実施の形態３にかかる情報処理装置３００の構成を模式的に示す。情報処理装置３００は、実施の形態２にかかる情報処理装置２００の削除処理部７を削除処理部８に置換した構成を有する。削除処理部８は、削除処理部７のクラスタ削除部７６をクラスタ除外部８６に置換し、かつ、学習結果削除部８７を追加した構成を有する。削除処理部８のその他の構成は削除処理部７と同様であるので、説明を省略する。

　図２０に、実施の形態３にかかる情報処理装置での学習結果の削除処理のフローチャートを示す。学習結果の削除処理ステップＳ８は、図７のステップＳ５とステップＳ６との間に挿入されるものであり、以下のステップＳ８０１～Ｓ８１７を含む。

ステップＳ８０１～Ｓ８０８
　ステップＳ８０１～Ｓ８０８は、図１１のステップＳ７０１～Ｓ７０８と同様であるので、説明を省略する。

ステップＳ８０９
　クラスタ判定部７５は、判定値ＲＡ及びＲＢを所定の閾値ＴＨｒと比較し、判定値ＲＡ及びＲＢのいずれかが所定の閾値ＴＨｒよりも小さいか否かを判定する。判定値ＲＡ及びＲＢのいずれもが所定の閾値ＴＨｒ以上の場合、クラスタ判定部７５は、クラスタＡとクラスタＢとは別のクラスタであるものと判定し、処理をステップＳ８１１へ進める。

ステップＳ８１０
　ステップＳ８０９において判定値ＲＡ及びＲＢのいずれかが所定の閾値ＴＨｒよりも小さいと判定された場合、クラスタ除外部８６は、クラスタＡ及びＢの一方が他方に含まれる、又は、一致しているものとして、低得点又は同得点のクラスタＢ（すなわち、対象クラスタ）を計算から除外する。クラスタのソートから計算から除外されたクラスタに該当する行は削除され、次の処理の基準クラスタや対象クラスタとして選択されることはない。ただし、ステップＳ８１１及びＳ８１２において次の対象クラスタを算出するための現在の対象クラスタとして用いることは可能である。すなわち、本実施の形態において「ソートした順においてあるクラスタの１つ下のクラスタを選択する」と記載する場合、ソートした順から計算から除外したクラスタに該当する行が削除された順において、１つ下のクラスタを選択することを意味するものとする。

ステップＳ８１１～Ｓ８１２
　ステップＳ８１１～Ｓ８１２は、図１１のステップＳ７１１～Ｓ７１２と同様であるので、説明を省略する。

ステップＳ８１３
　クラスタ判定部７５は、基準クラスタと共通しているクラスタを保持していない学習結果が存在するか否かを判定する。ここでは、ステップＳ８０９における判定方法と同じ方法を用いて、各クラスタが基準クラスタと共通しているかを判断することができる。すなわち、本ステップでは、計算から除外されたクラスタを基準クラスタと共通しているクラスタと判断し、基準クラスタ又は基準クラスタと共通しているクラスタを保持していない学習結果を削除するものとして判定する。なお、判定方法はこれに限られるものではなく、例えば、基準クラスタの判定値ＲＡと各クラスタ（対象クラスタ）の判定値ＲＢと、閾値ＴＨｒ１とは異なる閾値ＴＨｒ２を使用して比較し、判定値ＲＡ及びＲＢの両方が閾値ＴＨｒ２よりも小さい場合に、対象クラスタを共通しているクラスタと判定してもよい。クラスタ判定部７５は、基準クラスタ又は基準クラスタと共通しているクラスタを保持していない学習結果が存在しない場合には、削除すべき学習結果はないものとして、処理をステップＳ８１５へ進める。

ステップＳ８１４
　ステップＳ８１３において基準クラスタ又は基準クラスタと共通しているクラスタを保持していない学習結果が存在すると判定された場合、学習結果削除部８７は、その学習結果は削除されるべきものとして、当該学習結果を削除する。その後、処理をステップＳ８１５へ進める。また、ソートした順における、削除された学習結果が保持する全クラスタに該当する行を計算から除外する。　

ステップＳ８１５
　基準クラスタ選択部７２は、ソートした順における現在の基準クラスタの１つ下の行に、削除されずに残存している、新たな基準クラスタとして選択可能な他のクラスタが存在するかを判定する。新たな基準クラスタとして選択可能なクラスタが存在しないと判定した場合、基準クラスタ選択部７２は、ステップＳ８の処理を終了する。

ステップＳ８１６
　ステップＳ８１５において新たな基準クラスタとして選択可能なクラスタが存在すると判定された場合、基準クラスタ選択部７２は、ソートした順における現在の基準クラスタの１つ下の行のクラスタの得点が所定の得点閾値ＴＨｐ以上であるか否かを判定する。基準クラスタの一行下のクラスタの得点が所定の得点閾値ＴＨｐよりも小さい場合、基準クラスタ選択部７２は、ステップＳ８の処理を終了する。

ステップＳ８１７
　ステップＳ８１６において新たな基準クラスタとして選択可能なクラスタが存在すると判定された場合、基準クラスタ選択部７２は、ソートした順における現在の基準クラスタの１つ下のクラスタを、新たな基準クラスタとして選択した後、処理をステップＳ８０３へ戻す。

　ステップＳ８でのクラスタ削除処理について、図４の５つの学習結果に図１７の学習結果を加えた６つの学習結果に基づく具体例を示して説明する。得点行列は図１８に示すものである。図２１に、図１８の得点行列に基づいてクラスタをソートした例を示す。

　図２２に、実施の形態３にかかるクラスタ削除処理の推移を示す。ステップＳ８でのクラスタ削除処理においては、既に削除されたクラスタ以外について、得点の高い順に２つのクラスタを選択して、選択した２つのクラスタについて削除処理が繰り返されることとなる。

削除推移Ａ
　まず、得点が最も高い学習結果１のクラスタ０と、それ以外のクラスタとの間で処理が実行される。図２２の削除推移１の表の＊＊がついている行は基準クラスタを示し、この場合には学習結果１のクラスタ０が基準クラスタである。＊がついている行は、基準クラスタと一致している、基準クラスタを含む、又は、基準クラスタに含まれると判定されたクラスタである。＊＊又は＊が付与されていない学習結果は無いため、ここではいずれの学習結果も削除されない。また、＊の行はソートした表からは除外されるので、削除処理の選択肢（つまり、基準クラスタや対象クラスタとしての選択肢）からは除外される。

削除推移Ｂ
　削除推移Ａに示す処理の完了後、削除推移Ｂに示す処理が実行される。図２２の削除推移Ｂでは、ソートした順において削除推移Ａで計算から除外されたクラスタに該当する行（すなわち、削除推移Ａにおいて＊がついている行）を除外して表示している。ここでは、学習結果１のクラスタ０を除いた内で得点が最も高い学習結果３のクラスタ１が基準クラスタとなり、学習結果１のクラスタ０以外の残存するクラスタとの間で処理が実行される。つまり、図２２の削除推移Ｂの表の＊＊がついている行の学習結果３のクラスタ１が基準クラスタ、＊がついている行が基準クラスタと一致している、基準クラスタを含む、又は、基準クラスタに含まれると判定されたクラスタである。学習結果６のいずれのクラスタも＊＊又は＊が付与されていないため、学習結果６は削除される。また、＊の行はソートした表からは除外されるので、削除処理の選択肢（つまり、基準クラスタや対象クラスタとしての選択肢）からは除外される。

削除推移Ｃ
削除推移Ｂに示す処理の完了後、削除推移Ｃに示す処理が実行される。図２２の削除推移Ｃでは、ソートした順において削除推移Ａ及びＢで計算から除外されたクラスタに該当する行（すなわち削除推移Ａ及びＢにおいて＊がついている行）を除外して表示している。削除推移Ｃの状態では未処理のクラスタの組み合わせは存在しないので、ここで学習結果の削除処理を終了する。図２３に、学習結果削除後の得点行列の例を示す。ステップＳ８によって、×印が付された学習結果６が削除されていることが理解できる。

ステップＳ６
　ソートした全てのクラスタについてステップＳ８の処理が終了した場合、学習結果選択部４は、図４の場合と同様に、得点行列ＳＭに基づいて最終学習結果を選択する。図２３の得点行列によれば、学習結果選択部４は、実施の形態１と同様に、学習結果５を最終学習結果として選択することが理解できる。

　以上、本構成によれば、複数の学習結果間で共通するクラスタを保持しない学習結果を削除することで、入力データに対して部分的にしか特徴を捉えていないような結果を排除し、適切な学習結果を選択することが可能となる。

その他の実施の形態
　なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、ノード間の距離を示す距離尺度についてであるが、ノード間の距離尺度としては、ユークリッド距離、コサイン距離、マンハッタン距離、フラクショナル距離など、任意の距離尺度を適用することができる。一般に、入力データが低次元である場合にユークリッド距離が用いられ、入力データが高次元である場合にコサイン距離、マンハッタン距離及びフラクショナル距離が用いられる。

　また、本発明は様々なクラスタリング手法から得られる複数の結果に対しても適応可能であるが、一つの手法による複数結果に対して適応する方が望ましい。クラスタリング手法には各々特性に違いがあり、構造が複雑な入力データの場合は、特性によるクラスタリング結果の違いが大きくなる場合がある。クラスタリング手法を一つに絞ることにより各結果の手法としての特性差がなくなり、より本発明の効果を発揮できる。

　なお、本発明はｋ平均法などの一般的なクラスタリング手法の結果に対して有効であるが、ＳＯＩＮＮなどに代表される、入力ベクトルを順次入力して入力ベクトルの入力分布構造を複数のノード及び２つのノード間を接続する複数の辺が配置されるネットワーク構造として学習する手法の結果に対して実施することが望ましい。これは、ノードを頻度に基づいて淘汰することでノイズのノードを抑制でき、さらに辺によってノードの関連性も把握できるため、本発明で重要なノード間の距離、クラスタ間の類似性をより的確に算出できるためである。

　上述の実施の形態において、２つの値の大小判定について説明したが、これは例示に過ぎず、２つの値の大小判定において２つの値が等しい場合については、必要に応じて取り扱ってもよい。すなわち、第１の値が第２の値以上であるか又は第２の値よりも小さいかの判定と、第１の値が第２の値よりも大きいか又は第２の値以下であるかの判定とについては、必要に応じていずれを採用してもよい。第１の値が第２の値以下であるか又は第２の値よりも大きいかの判定と、第１の値が第２の値よりも小さいか又は第２の値以上であるかの判定については、いずれを採用してもよい。換言すれば、２つの値の大小判定を行って２つの判定結果を得る場合、２つの値が等しい場合については、必要に応じて２つの判定結果のいずれに含めてもよい。

　上述の実施の形態では、本発明を主にハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、様々なタイプの非一時的なコンピュータ可読媒体（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ　ｃｏｍｐｕｔｅｒ　ｒｅａｄａｂｌｅ　ｍｅｄｉｕｍ）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（ｔａｎｇｉｂｌｅ　ｓｔｏｒａｇｅ　ｍｅｄｉｕｍ）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Ｐｒｏｇｒａｍｍａｂｌｅ　ＲＯＭ）、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　ＰＲＯＭ）、フラッシュＲＯＭ、ＲＡＭ（ｒａｎｄｏｍ　ａｃｃｅｓｓ　ｍｅｍｏｒｙ））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（ｔｒａｎｓｉｔｏｒｙ　ｃｏｍｐｕｔｅｒ　ｒｅａｄａｂｌｅ　ｍｅｄｉｕｍ）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　上記の実施の形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。

　（付記１）複数の入力ベクトルの入力分布構造を、多次元ベクトルで記述される複数のノードを含むネットワーク構造として学習する情報処理装置において、同じ入力ベクトルを異なる条件で学習した結果得られた、異なる入力分布構造を有する複数の学習結果に含まれる２つの学習結果の全ての組み合わせにおいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについて、一方のクラスタに属するノードと他方のクラスタに属するノードとの間の距離を示す距離行列を算出する距離行列算出部と、各距離行列について各列及び各行の最小値を取得し、取得した前記最小値のうちで所定条件を満たすものの個数に基づいて各距離行列にかかる評価指数を算出する評価指数算出部と、全ての距離行列について算出した評価指数に基づいて、各学習結果の各クラスタについて、注目している学習結果以外の他の学習結果のクラスタと類似している度合いを示す得点を算出する得点算出部と、前記得点算出部で算出された各学習結果の各クラスタの得点に基づいて、前期複数の学習結果から最終学習結果を選択する学習結果選択部と、を有する、情報処理装置。

　（付記２）前記得点算出部は、全ての距離行列について算出した評価指数に基づいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについての評価指数で構成される評価指数行列を生成し、前記評価指数行列に含まれる評価指数に基づいて、１つの学習結果に含まれるクラスタが他の学習結果のクラスタに似ているかを示す得点を算出し、全ての学習結果に属するクラスタについての得点を含む得点行列を生成し、前記学習結果選択部は、前記得点行列に基づいて、前記複数の学習結果から最終学習結果を選択する、付記１に記載の情報処理装置。

　（付記３）前記評価指数算出部は、前記２つのクラスタのそれぞれに属するノード間の平均的距離を求め、求めた２つの平均的距離の平均値を求め、各距離行列の各列及び各行の前記最小値のうちで、前記平均値以上のものの個数に基づいて各距離行列にかかる評価指数を算出する、付記２に記載の情報処理装置。

　（付記４）前記評価指数は、各距離行列の各列及び各行の前記最小値のうちで、前記平均値以上のものの個数を、前記２つのクラスタに属するノードの総数で除算した値である、付記３に記載の情報処理装置。

　（付記５）前記得点算出部は、評価指数行列に含まれる各評価指数を閾値と比較し、比較結果に基づいて得点を与え、各クラスタの合計得点を算出する、付記２又は３に記載の情報処理装置。

　（付記６）前記学習結果選択部は、各学習結果に属するクラスタの合計得点のうちで最小値を取得し、取得した最小値のうちで最大の値に対応する学習結果を選択する、付記５に記載の情報処理装置。

　（付記７）前記学習結果選択部は、前記得点行列に基づいて、前記複数の学習結果のクラスタから複数の重複しないクラスタを選択して、選択したクラスタで構成される前記最終学習結果を選択する、付記２乃至５のいずれか一つに記載の情報処理装置。

　（付記８）前記学習結果選択部は、前記得点行列に基づいて、前記複数の学習結果のうちの１つの学習結果を前記最終学習結果として選択する、付記２乃至５のいずれか一つに記載の情報処理装置。

　（付記９）各学習結果からクラスタを削除する処理を行う削除処理部をさらに有し、前記削除処理部は、各学習結果に属するクラスタを前記得点の順にソートする得点ソート部と、前記得点が最も高いクラスタを基準クラスタとして選択する基準クラスタ選択部と、ソートされたクラスタから前記基準クラスタより得点が低いクラスタの中で最も得点が高いクラスタを対象クラスタとして選択する対象クラスタ選択部と、前記基準クラスタ及び前記対象クラスタに基づいてクラスタの判定に用いられる判定値を算出する判定値算出部と、前記判定値に基づいて削除対象クラスタを選択するクラスタ判定部と、前記削除対象クラスタを削除するクラスタ削除部と、を有する、付記３乃至７のいずれか一つに記載の情報処理装置。

　（付記１０）前記距離行列算出部は、前記基準クラスタと前記対象クラスタとについて、前記基準クラスタのノード数分の行数と前記対象クラスタのノード数分の列数とを有する前記距離行列を算出し、前記評価指数算出部は、前記基準クラスタと前記対象クラスタとについて算出した前記距離行列の各列及び各行の最小値を取得し、前記基準クラスタ及び前記対象クラスタのそれぞれに属するノード間の平均的距離を求め、求めた２つの平均的距離の平均値を求め、前記基準クラスタと前記対象クラスタとについて算出した前記距離行列の各行の前記最小値のうちで前記平均値以上のものの個数である第１の値と、前記距離行列の各列の前記最小値のうちで前記平均値以上のものの個数である第２の値と、をカウントし、前記判定値算出部は、前記第１の値を前記基準クラスタのノード数で除算した第１の判定値と、前記第２の値を前記基準クラスタのノード数で除算した第２の判定値と、を算出し、前記クラスタ判定部は、前記第１及び第２の判定値のいずれかが第２の閾値よりも小さい場合、前記対象クラスタを削除対象クラスタとして選択し、前記クラスタ削除部は、前記削除対象クラスタを削除する、付記９に記載の情報処理装置。

　（付記１１）前記削除処理部が前記削除対象クラスタを削除した場合、又は、前記クラスタ判定部が前記第１及び第２の判定値が第２の閾値よりも大きいと判定した場合、前記対象クラスタ選択部は、前記対象クラスタの次に得点が低いクラスタを新たな対象クラスタとして選択し、前記削除処理部は、前記基準クラスタと、前記新たな対象クラスタと、に基づいてクラスタを削除する処理を行う、付記１０に記載の情報処理装置。

　（付記１２）前記対象クラスタの次に得点が低いクラスタが無い場合、前記基準クラスタ選択部は、前記基準クラスタ以外に、前記基準クラスタの次に得点が低いクラスタを新たな基準クラスタとして選択し、前記削除処理部は、前記新たな基準クラスタに基づいてクラスタを削除する処理を行う、付記１１に記載の情報処理装置。

　（付記１３）前記基準クラスタの次に得点が低いクラスタが無い場合、前記削除処理部は、クラスタを削除する処理を終了する、付記１２に記載の情報処理装置。

　（付記１４）前記複数の学習から選択した学習結果を削除する処理を行う削除処理部をさらに有し、前記削除処理部は、各学習結果に属するクラスタを前記得点の順にソートする得点ソート部と、前記得点が最も高いクラスタを基準クラスタとして選択する基準クラスタ選択部と、ソートされたクラスタから前記基準クラスタより得点が低いクラスタの中で最も得点が高いクラスタを対象クラスタとして選択する対象クラスタ選択部と、前記基準クラスタ及び前記対象クラスタに基づいてクラスタの判定に用いられる判定値を算出する判定値算出部と、前記判定値に基づいてクラスタの判別を行う選択するクラスタ判定部と、前記判別の結果に基づいてクラスタを除外する処理を行うクラスタ除外部と、前記基準クラスタと共通するクラスタを有しない学習結果を削除する学習結果削除部と、を有する、付記３乃至７のいずれか一つに記載の情報処理装置。

　（付記１５）前記距離行列算出部は、前記基準クラスタと前記対象クラスタとについて、前記基準クラスタのノード数分の行数と前記対象クラスタのノード数分の列数とを有する前記距離行列を算出し、前記評価指数算出部は、前記基準クラスタと前記対象クラスタとについて算出した前記距離行列の各列及び各行の最小値を取得し、前記基準クラスタ及び前記対象クラスタのそれぞれに属するノード間の平均的距離を求め、求めた２つの平均的距離の平均値を求め、前記基準クラスタと前記対象クラスタとについて算出した前記距離行列の各行の前記最小値のうちで前記平均値以上のものの個数である第１の値と、前記距離行列の各列の前記最小値のうちで前記平均値以上のものの個数である第２の値と、をカウントし、前記判定値算出部は、前記第１の値を前記基準クラスタのノード数で除算した第１の判定値と、前記第２の値を前記基準クラスタのノード数で除算した第２の判定値と、を算出し、前記クラスタ判定部は、前記第１及び第２の判定値のいずれかが第２の閾値よりも小さい場合に前記対象クラスタは前記基準クラスタとは異なるクラスタであり、前記第１及び第２の判定値が前記第２の閾値よりも大きい場合に前記対象クラスタは前記基準クラスタと共通するクラスタであるものと判定し、前記対象クラスタは前記基準クラスタとは異なるクラスタであると判定された場合、前記クラスタ除外部は、前記対象クラスタを、前記対象クラスタが属する学習結果から除外する、付記１４に記載の情報処理装置。

　（付記１６）前記クラスタ除外部が前記対象クラスタを除外した場合、又は、前記クラスタ判定部が前記対象クラスタは前記基準クラスタと共通するクラスタであると判定した場合、前記対象クラスタ選択部は、前記対象クラスタの次に得点が低いクラスタを新たな対象クラスタとして選択し、前記削除処理部は、前記基準クラスタと、前記新たな対象クラスタと、に基づいて学習結果を削除する処理を行う、付記１５に記載の情報処理装置。

　（付記１７）前記対象クラスタの次に得点が低いクラスタが無い場合、前記学習結果削除部は、前記複数の学習結果から前記基準クラスタと共通するクラスタを有しない学習結果を削除する、付記１６に記載の情報処理装置。

　（付記１８）前記学習結果削除部が前記学習結果を削除した場合、又は、前記対象クラスタの次に得点が低いクラスタが無く、かつ、前記基準クラスタと共通するクラスタを有しないクラスタが無い場合、前記基準クラスタ選択部は、前記基準クラスタ以外に、前記基準クラスタの次に得点が低いクラスタの得点が所定値よりも大きい場合、当該クラスタを新たな基準クラスタとして選択し、前記削除処理部は、前記新たな基準クラスタに基づいて学習結果を削除する処理を行う、付記１６に記載の情報処理装置。

　（付記１９）前記基準クラスタの次に得点が低いクラスタの得点が前記所定値よりも小さい場合、又は、前記基準クラスタの次に得点が低いクラスタが無い場合、前記削除処理部は、学習結果を削除する処理を終了する、付記１８に記載の情報処理装置。

　（付記２０）複数の入力ベクトルの入力分布構造を、多次元ベクトルで記述される複数のノードを含むネットワーク構造として学習する情報処理方法であって、距離行列算出部が、同じ入力ベクトルを異なる条件で学習した結果得られた、異なる入力分布構造を有する複数の学習結果に含まれる２つの学習結果の全ての組み合わせにおいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについて、一方のクラスタに属するノードと他方のクラスタに属するノードとの間の距離を示す距離行列を算出し、評価指数算出部が、各距離行列について各列及び各行の最小値を取得し、取得した前記最小値のうちで所定条件を満たすものの個数に基づいて各距離行列にかかる評価指数を算出し、得点算出部が、全ての距離行列について算出した評価指数に基づいて、各学習結果の各クラスタについて、注目している学習結果以外の他の学習結果のクラスタと類似している度合いを示す得点を算出し、学習結果選択部が、前記得点算出部で算出された各学習結果の各クラスタの得点に基づいて、前期複数の学習結果から最終学習結果を選択する、情報処理方法。

　（付記２１）複数の入力ベクトルの入力分布構造を、多次元ベクトルで記述される複数のノードを含むネットワーク構造として学習する処理をコンピュータに実行させるプログラムであって、同じ入力ベクトルを異なる条件で学習した結果得られた、異なる入力分布構造を有する複数の学習結果に含まれる２つの学習結果の全ての組み合わせにおいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについて、一方のクラスタに属するノードと他方のクラスタに属するノードとの間の距離を示す距離行列を算出する処理と、各距離行列について各列及び各行の最小値を取得し、取得した前記最小値のうちで所定条件を満たすものの個数に基づいて各距離行列にかかる評価指数を算出する処理と、全ての距離行列について算出した評価指数に基づいて、各学習結果の各クラスタについて、注目している学習結果以外の他の学習結果のクラスタと類似している度合いを示す得点を算出する処理と、算出された各学習結果の各クラスタの前記得点に基づいて、前期複数の学習結果から最終学習結果を選択する処理と、をコンピュータに実行させる、プログラム。

　以上、実施の形態を参照して本願発明を説明したが、本願発明は上記によって限定されるものではない。本願発明の構成や詳細には、発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２０２０年１２月２８日に出願された日本出願特願２０２０－２１８７１６を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　１　距離行列算出部
　２　評価指数算出部
　２Ａ　算出部
　２Ｂ　評価指数行列生成部
　３　得点算出部
　３Ａ　算出部
　３Ｂ　得点行列生成部
　４　学習結果選択部
　７、８　削除処理部
　１０　コンピュータ
　１１　ＣＰＵ
　１２　ＲＯＭ
　１３　ＲＡＭ
　１４　バス
　１５　入出力インターフェイス
　１６　入力部
　１７　出力部
　１８　記憶部
　１９　通信部
　２０　ドライブ
　２０Ａ　磁気ディスク
　２０Ｂ　光ディスク
　２０Ｃ　フレキシブルディスク
　２０Ｄ　半導体メモリ
　７１　得点ソート部
　７２　基準クラスタ選択部
　７３　対象クラスタ選択部
　７４　判定値算出部
　７５　クラスタ判定部
　７６　クラスタ削除部
　８６　クラスタ削除部
　８７　学習結果削除部
　１００、２００、３００　情報処理装置

Claims

　複数の入力ベクトルの入力分布構造を、多次元ベクトルで記述される複数のノードを含むネットワーク構造として学習する情報処理装置において、
　同じ入力ベクトルを異なる条件で学習した結果得られた、異なる入力分布構造を有する複数の学習結果に含まれる２つの学習結果の全ての組み合わせにおいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについて、一方のクラスタに属するノードと他方のクラスタに属するノードとの間の距離を示す距離行列を算出する距離行列算出部と、
　各距離行列について各列及び各行の最小値を取得し、取得した前記最小値のうちで所定条件を満たすものの個数に基づいて各距離行列にかかる評価指数を算出する評価指数算出部と、
　全ての距離行列について算出した評価指数に基づいて、各学習結果の各クラスタについて、注目している学習結果以外の他の学習結果のクラスタと類似している度合いを示す得点を算出する得点算出部と、
　前記得点算出部で算出された各学習結果の各クラスタの得点に基づいて、前期複数の学習結果から最終学習結果を選択する学習結果選択部と、を備える、
　情報処理装置。
　前記得点算出部は、
　　全ての距離行列について算出した評価指数に基づいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについての評価指数で構成される評価指数行列を生成し、
　　前記評価指数行列に含まれる評価指数に基づいて、１つの学習結果に含まれるクラスタが他の学習結果のクラスタに似ているかを示す得点を算出し、
　　全ての学習結果に属するクラスタについての得点を含む得点行列を生成し、
　前記学習結果選択部は、前記得点行列に基づいて、前記複数の学習結果から最終学習結果を選択する、
　請求項１に記載の情報処理装置。
　前記評価指数算出部は、
　前記２つのクラスタのそれぞれに属するノード間の平均的距離を求め、求めた２つの平均的距離の平均値を求め、
　各距離行列の各列及び各行の前記最小値のうちで、前記平均値以上のものの個数に基づいて各距離行列にかかる評価指数を算出する、
　請求項２に記載の情報処理装置。
　前記評価指数は、各距離行列の各列及び各行の前記最小値のうちで、前記平均値以上のものの個数を、前記２つのクラスタに属するノードの総数で除算した値である、
　請求項３に記載の情報処理装置。
　前記得点算出部は、評価指数行列に含まれる各評価指数を閾値と比較し、比較結果に基づいて得点を与え、各クラスタの合計得点を算出する、
　請求項２又は３に記載の情報処理装置。
　前記学習結果選択部は、各学習結果に属するクラスタの合計得点のうちで最小値を取得し、取得した最小値のうちで最大の値に対応する学習結果を選択する、
　請求項５に記載の情報処理装置。
　前記学習結果選択部は、前記得点行列に基づいて、前記複数の学習結果のクラスタから複数の重複しないクラスタを選択して、選択したクラスタで構成される前記最終学習結果を選択する、
　請求項２乃至５のいずれか一項に記載の情報処理装置。
　前記学習結果選択部は、前記得点行列に基づいて、前記複数の学習結果のうちの１つの学習結果を前記最終学習結果として選択する、
　請求項２乃至５のいずれか一項に記載の情報処理装置。
　各学習結果からクラスタを削除する処理を行う削除処理部をさらに備え、
　前記削除処理部は、
　　各学習結果に属するクラスタを前記得点の順にソートする得点ソート部と、
　　前記得点が最も高いクラスタを基準クラスタとして選択する基準クラスタ選択部と、
　　ソートされたクラスタから前記基準クラスタより得点が低いクラスタの中で最も得点が高いクラスタを対象クラスタとして選択する対象クラスタ選択部と、
　　前記基準クラスタ及び前記対象クラスタに基づいてクラスタの判定に用いられる判定値を算出する判定値算出部と、
　　前記判定値に基づいて削除対象クラスタを選択するクラスタ判定部と、
　　前記削除対象クラスタを削除するクラスタ削除部と、を備える、
　請求項３乃至７のいずれか一項に記載の情報処理装置。
　前記距離行列算出部は、前記基準クラスタと前記対象クラスタとについて、前記基準クラスタのノード数分の行数と前記対象クラスタのノード数分の列数とを有する前記距離行列を算出し、
　前記評価指数算出部は、
　　前記基準クラスタと前記対象クラスタとについて算出した前記距離行列の各列及び各行の最小値を取得し、　
　　前記基準クラスタ及び前記対象クラスタのそれぞれに属するノード間の平均的距離を求め、求めた２つの平均的距離の平均値を求め、
　　前記基準クラスタと前記対象クラスタとについて算出した前記距離行列の各行の前記最小値のうちで前記平均値以上のものの個数である第１の値と、前記距離行列の各列の前記最小値のうちで前記平均値以上のものの個数である第２の値と、をカウントし、
　前記判定値算出部は、前記第１の値を前記基準クラスタのノード数で除算した第１の判定値と、前記第２の値を前記基準クラスタのノード数で除算した第２の判定値と、を算出し、
　前記クラスタ判定部は、前記第１及び第２の判定値のいずれかが第２の閾値よりも小さい場合、前記対象クラスタを削除対象クラスタとして選択し、
　前記クラスタ削除部は、前記削除対象クラスタを削除する、
　請求項９に記載の情報処理装置。
　前記削除処理部が前記削除対象クラスタを削除した場合、又は、前記クラスタ判定部が前記第１及び第２の判定値が第２の閾値よりも大きいと判定した場合、
　前記対象クラスタ選択部は、前記対象クラスタの次に得点が低いクラスタを新たな対象クラスタとして選択し、
　前記削除処理部は、前記基準クラスタと、前記新たな対象クラスタと、に基づいてクラスタを削除する処理を行う、
　請求項１０に記載の情報処理装置。
　前記対象クラスタの次に得点が低いクラスタが無い場合、前記基準クラスタ選択部は、前記基準クラスタ以外に、前記基準クラスタの次に得点が低いクラスタを新たな基準クラスタとして選択し、
　前記削除処理部は、前記新たな基準クラスタに基づいてクラスタを削除する処理を行う、
　請求項１１に記載の情報処理装置。
　前記基準クラスタの次に得点が低いクラスタが無い場合、前記削除処理部は、クラスタを削除する処理を終了する、
　請求項１２に記載の情報処理装置。
　複数の入力ベクトルの入力分布構造を、多次元ベクトルで記述される複数のノードを含むネットワーク構造として学習する情報処理方法であって、
　距離行列算出部が、同じ入力ベクトルを異なる条件で学習した結果得られた、異なる入力分布構造を有する複数の学習結果に含まれる２つの学習結果の全ての組み合わせにおいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについて、一方のクラスタに属するノードと他方のクラスタに属するノードとの間の距離を示す距離行列を算出し、
　評価指数算出部が、各距離行列について各列及び各行の最小値を取得し、取得した前記最小値のうちで所定条件を満たすものの個数に基づいて各距離行列にかかる評価指数を算出し、
　得点算出部が、全ての距離行列について算出した評価指数に基づいて、各学習結果の各クラスタについて、注目している学習結果以外の他の学習結果のクラスタと類似している度合いを示す得点を算出し、
　学習結果選択部が、前記得点算出部で算出された各学習結果の各クラスタの得点に基づいて、前期複数の学習結果から最終学習結果を選択する、
　情報処理方法。
　複数の入力ベクトルの入力分布構造を、多次元ベクトルで記述される複数のノードを含むネットワーク構造として学習する処理をコンピュータに実行させるプログラムであって、
　同じ入力ベクトルを異なる条件で学習した結果得られた、異なる入力分布構造を有する複数の学習結果に含まれる２つの学習結果の全ての組み合わせにおいて、２つの学習結果のそれぞれから１つずつ選択した２つのクラスタ間の全ての組み合わせについて、一方のクラスタに属するノードと他方のクラスタに属するノードとの間の距離を示す距離行列を算出する処理と、
　各距離行列について各列及び各行の最小値を取得し、取得した前記最小値のうちで所定条件を満たすものの個数に基づいて各距離行列にかかる評価指数を算出する処理と、
　全ての距離行列について算出した評価指数に基づいて、各学習結果の各クラスタについて、注目している学習結果以外の他の学習結果のクラスタと類似している度合いを示す得点を算出する処理と、
　算出された各学習結果の各クラスタの前記得点に基づいて、前期複数の学習結果から最終学習結果を選択する処理と、をコンピュータに実行させる、
　プログラムが格納された非一時的なコンピュータ可読媒体。