JP6065318B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP6065318B2
JP6065318B2 JP2013033176A JP2013033176A JP6065318B2 JP 6065318 B2 JP6065318 B2 JP 6065318B2 JP 2013033176 A JP2013033176 A JP 2013033176A JP 2013033176 A JP2013033176 A JP 2013033176A JP 6065318 B2 JP6065318 B2 JP 6065318B2
Authority
JP
Japan
Prior art keywords
node
winner
distance
nodes
density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013033176A
Other languages
English (en)
Other versions
JP2014164396A (ja
Inventor
長谷川 修
修 長谷川
洪偉 張
洪偉 張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SOINN HOLDINGS LLC
Original Assignee
SOINN HOLDINGS LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SOINN HOLDINGS LLC filed Critical SOINN HOLDINGS LLC
Priority to JP2013033176A priority Critical patent/JP6065318B2/ja
Priority to US14/769,692 priority patent/US10558911B2/en
Priority to PCT/JP2014/000390 priority patent/WO2014129116A1/ja
Publication of JP2014164396A publication Critical patent/JP2014164396A/ja
Application granted granted Critical
Publication of JP6065318B2 publication Critical patent/JP6065318B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は任意のクラスに属する入力ベクトルを順次入力して、当該入力ベクトルの入力分布構造を学習する情報処理装置、情報処理方法、及びプログラムに関する。
学習中に必要に応じてニューロンを増殖させる学習手法として、自己組織化ニューラルネットワーク(SOINN:Self-Organizing Incremental Neural Network)と呼ばれる手法が提案されている(非特許文献1を参照。)。非特許文献1に開示されたSOINNでは、ノード数を自律的に管理することにより非定常的な入力を学習することができ、複雑な分布形状を有するクラスに対しても適切なクラス数及び位相構造を抽出できるなど多くの利点を有する。SOINNの応用例として、例えばパターン認識においては、ひらがな文字のクラスを学習させた後に、カタカナ文字のクラスなどを追加的に学習させることができる。
さらに、SOINNに関する技術として、特許文献1に開示されたE-SOINN(Enhanced SOINN)と呼ばれる手法が提案されている。E-SOINNでは、学習を随時追加するオンライン追加学習が可能であり、バッチ学習ではなく学習効率が良いという利点を有している。このため、E-SOINNでは、学習環境が新しい環境に変化した場合においても追加学習が可能である。また、E-SOINNでは、入力データに対するノイズ耐性が高いという利点をも有している。
特許第5130523号公報
F.Shen and O.Hasegawa, "An incremental network for on-line unsupervised classification and topology learning," Neural Networks, Vol.19, No.1, pp.90-106, 2006.
しかしながら、非特許文献1に開示される技術(SOINN)や特許文献1に開示される技術(E-SOINN)では、入力データの入力順序によって学習結果が異なってしまうという安定性の問題があった。また、例えば1000次元以上の高次元データを入力データとする場合に学習精度が低下するという問題もあった。以下、これらの問題をより詳細に説明する。
安定性に関する1つ目の問題点として、入力データの入力順序に応じて学習結果が大きく影響を受けてしまうことがある。即ち、学習環境は変化させずに、入力順序のみを変更して入力データを入力して学習を繰り返した場合に、学習結果(ネットワークにおけるノードの個数及びノードの位置)が異なってしまう。
図1は、実験用の人工データセットを示す。図2(A)、(B)は、図1のガウスデータ分布セットに対するE-SOINNによる学習結果をそれぞれ示し、入力データの分布に関して2つのガウス分布が重複してしまっている。図2(A)は、50万回の学習を経た後の、E-SOINNによる定常的な学習結果を示す。図2(B)は、100万回の学習を経た後の、E-SOINNによる定常的な学習結果を示す。図2(A)、(B)から明らかなように、学習の結果生成されたこれらの分布は、図1に示した入力分布と一致していない。即ち、図1に示した入力データには互いに同一の2つのガウス分布を含み、図2(A)、(B)は、図1の入力データに対する学習結果をそれぞれ示している。しかし、図2(A)、(B)のそれぞれの学習結果では、各分布の中心におけるノードの個数が同一とならないために、図1の2つのガウス分布のそれぞれの中心と、図2(A)の2つのガウス分布のそれぞれの中心とが一致せず、また、図1の2つのガウス分布のそれぞれの中心と、図2(B)の2つのガウス分布のそれぞれの中心とも一致しない。本来であれば、図1の2つのガウス分布のそれぞれの中心は、図2(A)、(B)の2つのガウス分布のそれぞれの中心と一致すべきである。
さらに、E-SOINNの安定性に関する他の問題点を説明する。E-SOINNは、ノードの累積ポイントの平均値を使用して、ノードの密度を表現する(特許文献1の段落0067、数12、数13などを参照。)。E-SOINNは、ノードiのノード密度のポイント値である"p"を、以下の式(1)を用いて算出する。なお、ノード密度のポイント値pは、ノードiが勝者ノードである場合に式(1)の算出値が与えられ、そうでない場合には値0が与えられる。
式(1)におけるd (d は、dの上に記号「(バー)」が付いていることを示す。)は、ノードiからその隣接ノードjまでの平均距離を示し、以下の式(2)を用いて算出する。なお、隣接ノードjとは、ノードiと辺によって直接的に接続されるノードを示す。式(2)において、mはノードiの隣接ノードjの個数を示し、Wはノードiの重みベクトルを示し、Wは隣接ノードjの重みベクトルを示す。
E-SOINNによるこの手法を用いて、図2(A)、(B)に示したノード分布に対してのノードの密度を算出すると、算出されるノードの密度は明らかに不正確なものになる。これは、このノードの分布に対するノードの密度を算出しようとした場合に、当該算出に先立って生成されたノードの分布が入力分布にそもそも一致しておらず、さらに、この入力分布との不一致に起因して、E-SOINNは2つのガウス分布を一つのクラスに誤って統合してしまうことがあるためである。
さらに、E-SOINNの安定性に関する他の問題点を説明する。E-SOINNは、クラス間に存在する大きく重複した領域を削除しようとする。しかし、E-SOINNのアルゴリズムは安定的ではないために、サブクラスタの統合及び分離の繰り返しを引き起こしてしまう。
また、従来技術に関する他の問題点を説明する。従来技術では、高次元データを入力データとした場合に学習精度が低下することがある。例えばE-SOINNでは、ユークリッド距離を使用して最近傍ノードを探索する。しかし、ユークリッド距離の概念を使用して距離を測定すると、与えられた高次元データのデータセットにおける任意の2つの位置が収束してしまうために、入力データの次元数が増加するに従って学習結果の精度が低下してしまう。即ち、高次元空間においてユークリッド距離を使用した場合には、最も近い位置と最も遠い位置との区別が、とりわけ意味をなくしてしまう。このため、E-SOINNは、例えばDNAクラスタリングや文書クラスタリングなどの高次元データを入力ベクトルとする、いくつかのクラスタリングの学習タスクには適していない。
本発明は、上述した問題を解決するためになされたものであり、学習結果について優れた安定性を有する情報処理装置、情報処理方法及びプログラムを提供することを第1の目的とする。さらに、高次元データに対しても良好な精度を有する情報処理装置、情報処理方法及びプログラムを提供することを第2の目的とする。
本発明の一実施の形態に係る情報処理装置は、多次元ベクトルで記述されるノード及び当該ノード間を接続する辺が配置されるネットワーク構造を有し、任意のクラスに属する入力ベクトルを順次入力して、当該入力ベクトルの入力分布構造を学習する情報処理装置において、入力される前記入力ベクトルに最も近い距離に位置するノード及び2番目に近い距離に位置するノードを第1勝者ノード及び第2勝者ノードとしてそれぞれ探索する勝者ノード探索手段と、前記入力ベクトルと前記第1勝者ノード間の距離及び前記入力ベクトルと前記第2勝者ノード間の距離に基づいて、クラス間ノード挿入を実行するか否かを判定するクラス間ノード挿入判定手段と、前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行する場合に、前記入力ベクトルの成分と同一の成分を重みベクトルとして有するクラス間挿入ノードを生成し、当該生成したクラス間挿入ノードを前記ネットワークに挿入するクラス間ノード挿入手段と、前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行しない場合に、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続したときに、前記第1勝者ノードについてノードの学習時間を所定の値増加する勝者ノード学習時間算出手段と、前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行しない場合に、注目するノードについて当該注目するノードと辺によって直接的に接続されるノードを隣接ノードとして、前記第1勝者ノードの重みベクトル及び前記第1勝者ノードの隣接ノードの重みベクトルをそれぞれ前記入力ベクトルに更に近づけるように更新する重みベクトル更新手段と、前記入力ベクトルの総数に応じた所定の周期ごとに、前記ノードの学習時間の値が相対的に大きくかつ偏っているノードを検出し、当該検出したノード及びその隣接ノードの重みベクトルに基づく重みベクトルを有する新たなノードを生成して前記ネットワークに挿入し、前記検出したノードの学習時間及び前記検出したノードの隣接ノードの学習時間をそれぞれ減少し、前記検出したノード及びその隣接ノード間の辺を削除し、前記新たに挿入したノード及び前記検出したノード間と、前記新たに挿入したノード及び前記検出したノードのその隣接ノード間と、に辺をそれぞれ接続する負荷平衡化手段と、を備える、ことを特徴とするものである。これによって、入力データの入力順序に影響を受けずに、入力パターンの接続構造を正確に記述することができるため、従来技術に比べてより優れた安定性能を有する。
また、前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行しない場合に、付与されるノードのサブクラスタラベルに基づいて、前記第1勝者ノード及び前記第2勝者ノードが属するサブクラスタをそれぞれ判定し、当該判定の結果、前記第1勝者ノード及び前記第2勝者ノードが互いに異なるサブクラスタに属する場合には、前記第1勝者ノード及び前記第2勝者ノードのノード密度に関して、前記第1勝者ノードを含むサブクラスタの平均ノード密度を基準とする前記第1勝者ノードについてのノード密度の条件、又は、前記第2勝者ノードを含むサブクラスタの平均ノード密度を基準とする前記第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たすか否かを更に判定する辺接続判定手段と、(1)前記辺接続判定手段による判定の結果、前記第1勝者ノード及び前記第2勝者ノードの少なくとも1つがいずれのサブクラスタに属していない、又は、同一のサブクラスタに属する場合には、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続し、若しくは、(2)前記辺接続判定手段による判定の結果、前記第1勝者ノード及び前記第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たす場合には、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続し、前記第1勝者ノード及び前記第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たさない場合には、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続しない辺接続手段と、注目するノード及び当該注目するノードの隣接ノードからの平均距離に基づいて、当該注目するノードのノード密度を算出するノード密度算出手段と、局所的に最大のノード密度を有するノードを頂点として、当該頂点に対してそれぞれ異なるサブクラスタラベルを付与し、当該サブクラスタラベルが付与されなかった全てのノードに対してノード密度が最大の隣接ノードと同一のサブクラスタラベルを付与し、前記頂点のうちでノード密度が所定の閾値よりも大きな頂点を基準としてボロノイ領域を生成し、当該生成したボロノイ領域において、前記基準とした頂点を含むサブクラスタと前記基準とした頂点とは異なる他の頂点を含むサブクラスタとが重複領域を有し、かつ、当該重複領域に位置するノードの平均ノード密度の条件を満たす場合に、前記基準とした頂点を含むサブクラスタのサブクラスタラベルを、前記他の頂点を含むサブクラスタのサブクラスタラベルとして付与するサブクラスタ決定手段と、を更に備える、ようにしてもよい。これにより、異なるサブクラスタに混合クラスを分離するときの乱れを回避することができるため、学習結果をより安定させることができる。
また、ユークリッド距離に基づいてノード間の距離を算出する重み付きの第1の距離算出式と、前記ユークリッド距離とは異なる他の距離尺度に基づいてノード間の距離を算出する重み付きの第2の距離算出式と、を含むノード間距離算出式を更に備え、前記ネットワークにおける任意の2つのノード間の前記ユークリッド距離に基づく最小距離値及び最大距離値を用いて前記第1の距離算出式を正規化し、前記ネットワークにおける任意の2つのノード間の前記他の距離尺度に基づく最小距離値及び最大距離値を用いて前記第2の距離算出式を正規化し、前記入力ベクトルの次元数が増加するに従って、前記第1の距離算出式の重みを減少させ、前記ノード間距離算出式を用いて、前記入力ベクトル及び前記ノード間の距離、又は、前記ネットワークにおける任意の2つのノード間の距離を算出するようにしてもよい。これにより、低次元空間におけるユークリッド距離の優位性を得られる上に、学習対象とする問題に応じた柔軟な距離尺度の設定が可能になる。さらに、この枠組みは入力ベクトルの事前の分析を必要としないために、オンライン追加の自己増殖型学習タスク、あるいは限られた入力ベクトルのサンプルによる実世界の学習タスクに適している。
また、前記第2の距離算出式は、コサイン距離に基づいてノード間の距離を算出するようにしてもよい。これによって、高次元データに対しても良好な精度を有することができる。
また、前記ユークリッド距離に基づく前記2つのノード間の最小距離値及び最大距離値と、前記他の距離尺度に基づく前記2つのノード間の最小距離値及び最大距離値と、のうちで少なくとも1つの値が変化したか否かを確認し、少なくとも1つの値が変化した場合にはノード密度を更新すると判定するノード密度更新判定手段と、を更に備え、前記ノード密度算出手段は、(1)前記第1の距離算出式及び前記第2の距離算出式をそれぞれ用いて前記第1勝者ノードの隣接ノードからの平均距離のベクトルの各成分を算出し、(2)当該算出した前記第1勝者ノードの前記隣接ノードからの平均距離のベクトルに基づいて前記第1勝者ノードのノード密度のポイント値のベクトルを算出し、(3)当該算出した前記第1勝者ノードの前記ノード密度のポイント値のベクトルに基づいて前記第1勝者ノードのノード密度の累積ポイント値のベクトルを算出し、(4)当該算出した前記第1勝者ノードの前記ノード密度の累積ポイント値のベクトルに基づいて前記第1勝者ノードのノード密度を算出し、(5)前記ノード密度更新判定手段による判定の結果、ノード密度を更新する場合には、変化前後における前記ユークリッド距離に基づく前記2つのノード間の最小距離値及び最大距離値と、変化前後における前記他の距離尺度に基づく前記2つのノード間の最小距離値及び最大距離値と、に基づいて、前記ネットワークに存在する全てのノードについて、注目するノードの前記ノード密度の累積ポイント値のベクトルを更新し、(6)当該更新した前記注目するノードの前記ノード密度の累積ポイント値のベクトルに基づいて前記注目するノードの前記ノード密度を再び算出するようにしてもよい。これにより、ノードが挿入されたことに起因して、ユークリッド距離に基づく2つのノード間の最小距離値及び最大距離値と、他の距離尺度に基づく2つのノード間の最小距離値及び最大距離値と、のうちで少なくとも1つの値が変化した場合においても、これらの変化を反映させたより正確なノード密度を自動的に算出することができる。
本発明の一実施の形態に係る情報処理方法は、多次元ベクトルで記述されるノード及び当該ノード間を接続する辺が配置されるネットワーク構造を有し、任意のクラスに属する入力ベクトルを順次入力して、当該入力ベクトルの入力分布構造を学習する情報処理装置における情報処理方法であって、勝者ノード探索手段が、入力される前記入力ベクトルに最も近い距離に位置するノード及び2番目に近い距離に位置するノードを第1勝者ノード及び第2勝者ノードとしてそれぞれ探索するステップと、クラス間ノード挿入判定手段が、前記入力ベクトルと前記第1勝者ノード間の距離及び前記入力ベクトルと前記第2勝者ノード間の距離に基づいて、クラス間ノード挿入を実行するか否かを判定するステップと、クラス間ノード挿入手段が、前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行する場合に、前記入力ベクトルの成分と同一の成分を重みベクトルとして有するクラス間挿入ノードを生成し、当該生成したクラス間挿入ノードを前記ネットワークに挿入するステップと、勝者ノード学習時間算出手段が、前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行しない場合に、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続したときに、前記第1勝者ノードについてノードの学習時間を所定の値増加するステップと、重みベクトル更新手段が、前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行しない場合に、注目するノードについて当該注目するノードと辺によって直接的に接続されるノードを隣接ノードとして、前記第1勝者ノードの重みベクトル及び前記第1勝者ノードの隣接ノードの重みベクトルをそれぞれ前記入力ベクトルに更に近づけるように更新するステップと、負荷平衡化手段が、前記入力ベクトルの総数に応じた所定の周期ごとに、前記ノードの学習時間の値が相対的に大きくかつ偏っているノードを検出し、当該検出したノード及びその隣接ノードの重みベクトルに基づく重みベクトルを有する新たなノードを生成して前記ネットワークに挿入し、前記検出したノードの学習時間及び前記検出したノードの隣接ノードの学習時間をそれぞれ減少し、前記検出したノード及びその隣接ノード間の辺を削除し、前記新たに挿入したノード及び前記検出したノード間と、前記新たに挿入したノード及び前記検出したノードのその隣接ノード間と、に辺をそれぞれ接続するステップと、を実行する、ことを特徴とするものである。これによって、入力データの入力順序に影響を受けずに、入力パターンの接続構造を正確に記述することができるため、従来技術に比べてより優れた安定性能を有する。
本発明の一実施の形態に係るプログラムは、上記情報処理をコンピュータに実行させることを特徴とするものである。これによって、入力データの入力順序に影響を受けずに、入力パターンの接続構造を正確に記述することができるため、従来技術に比べてより優れた安定性能を有する。
本発明によれば、学習結果について優れた安定性を有する情報処理装置、情報処理方法及びプログラムを提供することができる。さらに、高次元データに対しても良好な精度を有する情報処理装置、情報処理方法及びプログラムを提供することができる。
本発明の課題を説明するための図である。 本発明の課題を説明するための図である。 本発明の課題を説明するための図である。 本発明の課題を説明するための図である。 本発明の課題を説明するための図である。 本実施の形態に係るサブクラスタ決定処理を説明するための図である。 本実施の形態に係るボロノイ領域の一例を説明するための図である。 LBSOINN及びE-SOINNの学習時間の分布を示すグラフである。 人工データセットIに対するノード密度の分布を示すグラフである。 人工データセットIに対するE-SOINNの実験結果を示すグラフである。 人工データセットIに対するLBSOINNの実験結果を示すグラフである。 本実施の形態に係る実験に使用する人工データセットIIを示す図である。 人工データセットIIに対するLBSOINN及びE-SOINNの学習結果を示す図である。 人工データセットIIに対するLBSOINN及びE-SOINNの学習結果を示す図である。 人工データセットIIに対するLBSOINN及びE-SOINNの学習結果を示す図である。 人工データセットIIに対するLBSOINN及びE-SOINNの学習結果を示す図である。 人工データセットIIに対するLBSOINN及びE-SOINNの学習結果を示す図である。 人工データセットIIに対するLBSOINN及びE-SOINNの学習結果を示す図である。 人工データセットIIに対するLBSOINN及びE-SOINNの学習結果を示す図である。 人工データセットIIに対するLBSOINN及びE-SOINNの学習結果を示す図である。 人工データセットIIに対するLBSOINN及びE-SOINNの学習結果を示す図である。 人工データセットIIに対するLBSOINN及びE-SOINNの学習結果を示す図である。 本実施の形態に係る実験に使用する人工データセットIIIを示す図である。 定常的な環境下における人工データセットIIに対するLBSOINNの学習結果を示す図である。 非定常的な環境下における人工データセットIIに対するLBSOINNの学習結果を示す図である。 本実施の形態に係る実験に使用するAT&T顔画像データセットのオリジナル画像である。 AT&T顔画像データセットのオリジナル画像の特徴ベクトルを示す画像である。 AT&T顔画像データセットに対するE-SOINNによるクラスの個数の分布を示すグラフである。 AT&T顔画像データセットに対するLBSOINNによるクラスの個数の分布を示すグラフである。 異なる各クラスに対して異なるパーセントを入力したときの精度を示す。 本実施の形態に係る情報処理装置を実施するための構成例を示す図である。 本実施の形態に係る情報処理装置の機能ブロックを示す図である。 本実施の形態に係る情報処理装置による学習処理の処理概要を示すフローチャートである。 本実施の形態に係るサブクラスタの重複領域に位置するノードを説明するための図である。 本実施の形態に係るサブクラスタの統合処理の様子を説明するための図である。 本実施の形態に係るサブクラスタの統合処理の様子を説明するための図である。 本実施の形態に係るサブクラスタの統合処理の様子を説明するための図である。
本発明の実施の形態に係る具体的な構成・処理の説明に先立ち、本発明の理解をより容易とするために、本発明に関連する技術(以下、E-SOINNと称する。)の概要を簡単に説明する。
E-SOINNは、入力データの入力順序に学習結果が大きく依存するという問題を有している。図3を参照して、E-SOINNによる学習結果を説明する。図3は、E-SOINNによる処理(特許文献1の図5のS611、S607、S612などの処理を指す。具体的には、明細書の段落0071〜0079に記載の処理を指す。)を実行した後の、ネットワークにおけるノードのノード密度の分布を示している。この例では、サブクラスタ間の重複領域が存在し、また、ノード密度の分布は大きな変動を有している。
図3において、符号A及び符号Bは、E-SOINNによる処理によって生成された2つのサブクラスタをそれぞれ示す。なお、ネットワークにおいて辺によって接続されるノードの集合をクラスタとし、クラスタの部分集合をサブクラスタとする。ここで、サブクラスタとは、同一のサブクラスタラベルが付与されたノードからなる集合である。E-SOINNは、サブクラスタA及びサブクラスタBを統合するために、所定の条件(特許文献1の明細書の段落0076、数(14)、数(15)などにより示される。)を定めている。
E-SOINNは、新たな入力データがネットワークに入力されたときに、その第1勝者ノードがサブクラスタAに属し、かつ、第2勝者ノードがサブクラスタBに属し、さらに、(サブクラスタA及びBの重複領域に入力データが初めて現れたために、)サブクラスタA及びサブクラスタBと、サブクラスタC及びサブクラスタDとが統合されていないという状況下では、明らかに、サブクラスタA及びBを統合する条件をとても容易に満たしてしまう。E-SOINNは、サブクラスタA及びサブクラスタBを統合しようとするが、サブクラスタAはサブクラスタCに本来属すべきであり、サブクラスタBはサブクラスタDに本来属すべきである。従って、この問題は、サブクラスタの統合及び分離の繰り返しを引き起こしてしまう。図4は、3つのガウス分布を有する入力データに対するE-SOINNによる学習結果を示し、3つのガウス分布が互いに重複を有しており、また、複数のサブクラスタへの統合及び分離の乱れが行われている。
以下、自己組織化ニューラルネットワーク(SOINN:Self-Organizing Incremental Neural Network)に関する技術として、本発明に係る技術を、LBSOINN(Load Balance Self-Organizing Incremental Neural Network)と称する。
LBSOINNは、ネットワークにおけるノードの負荷をノード学習時間として扱い、このノード学習時間を使用したノードの負荷の平衡化手法を提案する。LBSOINNは、この負荷平衡化手法によって、ネットワークをより安定化させることができる。このため、LBSOINNを負荷平衡(Load Balance)と称している。また、LBSOINNは、ボロノイテセレーション(Voronoi Tessellation)に基づくサブクラスタ決定手法を使用することによって、クラス間の重複領域を削除する際のネットワーク構造の乱れを回避する。さらに、LBSOINNは、2つのノード間の類似度を示す距離尺度に関して、高次元データをオンライン追加学習するのに適した、新たな距離尺度を導入する。
また、詳細は後述するが、本発明に関する効果を確認するための実験を行い、LBSOINNの有効性を確認した。実験では、人工データセットに加え実世界での例に対してもLBSOINNを適用し、クラスタリングにおけるLBSOINNの有効性を実証した。全ての実験結果から、LBSOINNがE-SOINNよりも優れた安定性を有し、また、高次元空間における良好なパフォーマンスを有していることが示された。
実施の形態1.
以下、図面を参照して本発明の実施の形態について説明する。
図20は、LBSOINNの一例としての、本実施の形態1に係る情報処理装置を実現するためのシステム構成の一例を示す図である。情報処理装置1は、専用コンピュータ、パーソナルコンピュータ(PC)などのコンピュータ10により実現可能である。但し、コンピュータは、物理的に単一である必要はなく、分散処理を実行する場合には、複数であってもよい。図20に示すように、コンピュータ10は、CPU11(Central Processing Unit)、ROM12(Read Only Memory)及びRAM13(Random Access Memory)を有し、これらがバス14を介して相互に接続されている。尚、コンピュータを動作させるためのOSソフトなどは、説明を省略するが、この情報処理装置を構築するコンピュータも当然備えているものとする。
バス14には又、入出力インターフェイス15も接続されている。入出力インターフェイス15には、例えば、キーボード、マウス、センサなどよりなる入力部16、CRT、LCDなどよりなるディスプレイ、並びにヘッドフォンやスピーカなどよりなる出力部17、ハードディスクなどより構成される記憶部18、モデム、ターミナルアダプタなどより構成される通信部19などが接続されている。
CPU11は、ROM12に記憶されている各種プログラム、又は記憶部18からRAM13にロードされた各種プログラムに従って各種の処理、本実施の形態においては、例えば後述するノード密度算出手段23や負荷平衡化手段33などの各手段の処理を実行する。RAM13には又、CPU11が各種の処理を実行する上において必要なデータなども適宜記憶される。
通信部19は、例えば図示しないインターネットを介しての通信処理を行ったり、CPU11から提供されたデータを送信したり、通信相手から受信したデータをCPU11、RAM13、記憶部18に出力したりする。記憶部18はCPU11との間でやり取りし、情報の保存・消去を行う。通信部19は又、他の装置との間で、アナログ信号又はディジタル信号の通信処理を行う。
入出力インターフェイス15はまた、必要に応じてドライブ20が接続され、例えば、磁気ディスク201、光ディスク202、フレキシブルディスク203、又は半導体メモリ204などが適宜装着され、それらから読み出されたコンピュータプログラムが必要に応じて記憶部18にインストールされる。
続いて、本実施形態に係る情報処理装置1における各処理について、その主な処理を図21に示す機能ブロック図を用いて説明する。ハードウェア上は、各処理は実際にはソフトウェアと上記CPU11などのハードウェア資源とが協働して実現している。
情報処理装置1は、n次元ベクトルで記述されるノードが配置される非階層構造のニューラルネットワークを有し、入力情報取得手段21、ノード密度更新判定手段22、ノード密度算出手段23、勝者ノード探索手段24、クラス間ノード挿入判定手段25、クラス間ノード挿入手段26、辺接続判定手段27、辺接続手段28、勝者ノード学習時間算出手段29、重みベクトル更新手段30、老齢辺削除手段31、入力数判定手段32、負荷平衡化手段33、サブクラスタ決定手段34、ノイズノード削除手段35、学習終了判定手段36、クラス決定手段37、出力情報表示手段38を含む。以下、各手段の詳細を説明する。
本実施形態においては、情報処理装置1が有するニューラルネットワークは、入力ベクトルをニューラルネットワークに入力し、入力される入力ベクトルに基づいて、ニューラルネットワークに配置されるノードを自動的に増加させる自己増殖型ニューラルネットワークであり、また、ニューラルネットワークは非階層構造を有するものとして以下説明する。
自己増殖型ニューラルネットワークを用いてノードを自動的に増加させることができるため、入力ベクトル空間からランダムに入力ベクトルが与えられる定常的な環境に限られず、例えば一定期間毎に入力ベクトルの属するクラスが切替えられて、切替後のクラスからランダムに入力ベクトルが与えられる非定常的な環境にも対応することができる。さらにまた、非階層構造を採用することで、他の層での学習を開始するタイミングを指定せずに追加学習を実施することができる。即ち、完全なオンラインでの追加学習を実施することができる。
入力情報取得手段21は、情報処理装置1に入力として与えられる情報として、任意のクラスに属するn次元の入力ベクトルを取得する。そして、取得された入力ベクトルを一時記憶部(例えばRAM13)に格納し、一時記憶部に格納されたニューラルネットワークに対して順次入力する。
ノード密度更新判定手段22は、一時記憶部に格納されたノード、各距離尺度に基づくノード間の最小距離値及び最大距離値について、各距離尺度に基づくノード間の最小距離値及び最大距離値のうちで少なくとも1つの値が変化したか否かを確認し、少なくとも1つの値が変化した場合にはノード密度を更新すると判定し、その結果を一時記憶部に格納する。なお、各距離尺度に基づくノード間の最小距離値及び最大距離値の詳細については後述する。
ノード密度算出手段23は、一時記憶部に格納されたノード、各距離尺度に基づくノード間の最小距離値及び最大距離値、隣接ノードからのノードの平均距離のベクトル、ノードのノード密度のポイント値のベクトル、ノード密度の累積ポイント値のベクトル、ノード密度について、第1の距離算出式及び第2の距離算出式をそれぞれ用いて第1勝者ノードの隣接ノードからの平均距離のベクトルの各成分を算出し、当該算出した第1勝者ノードの隣接ノードからの平均距離のベクトルに基づいて第1勝者ノードのノード密度のポイント値のベクトルを算出し、当該算出した第1勝者ノードのノード密度のポイント値のベクトルに基づいて第1勝者ノードのノード密度の累積ポイント値のベクトルを算出し、当該算出した第1勝者ノードのノード密度の累積ポイント値のベクトルに基づいて第1勝者ノードのノード密度を算出し、その結果を一時記憶部に格納する。なお、第1の距離算出式及び第2の距離算出式、第1勝者ノードのノード密度の算出処理の詳細については後述する。
また、ノード密度算出手段23は、一時記憶部に格納されたノード密度更新判定手段22による判定の結果、ノード密度を更新する場合には、一時記憶部に格納されたノード、ノード密度の累積ポイント値のベクトル、ノードの学習時間、各距離尺度に基づくノード間の最小距離値及び最大距離値について、変化前後におけるユークリッド距離に基づく2つのノード間の最小距離値及び最大距離値と、変化前後における他の距離尺度に基づく2つのノード間の最小距離値及び最大距離値と、に基づいて、ネットワークに存在する全てのノードについて、注目するノードのノード密度の累積ポイント値のベクトルを更新し、当該更新した注目するノードのノード密度の累積ポイント値のベクトルに基づいて注目するノードのノード密度を再び算出し、その結果を一時記憶部に格納する。なお、注目するノードの累積ポイント値のベクトルの算出処理の詳細については後述する。
勝者ノード探索手段24は、一時記憶部に格納される入力ベクトル及びノードについて、入力ベクトルに最も近い距離に位置するノードを第1勝者ノードとし、2番目に近い距離に位置するノードを第2勝者ノードとして探索し、その結果を一時記憶部に格納する。なお、本実施の形態に係る距離尺度の詳細については後述する。
クラス間ノード挿入判定手段25は、一時記憶部に格納された入力ベクトル及びノードについて、入力ベクトルと第1勝者ノード間の距離及び入力ベクトルと第2勝者ノード間の距離に基づいて、クラス間ノード挿入を実行するか否かを判定し、その結果を一時記憶部に格納する。なお、本実施の形態に係るクラス間ノード挿入判定処理の詳細については後述する。
クラス間ノード挿入手段26は、一時記憶部に格納されたクラス間ノード挿入判定手段25による判定結果に応じて、一時記憶部に格納された入力ベクトルについて、入力ベクトルが新たにネットワークに追加するノードであるものと見なし、その入力ベクトルの成分と同一の成分を重みベクトルとして有するクラス間挿入ノードを生成し、生成したクラス間挿入ノードをネットワークに挿入し、その結果を一時記憶部に格納する。
辺接続判定手段27は、一時記憶部に格納されたクラス間ノード挿入判定手段25による判定結果に応じて、一時記憶部に格納されたノード、ノードのサブクラスタラベルについて、ノードのサブクラスタラベルに基づいて、第1勝者ノード及び第2勝者ノードが属するサブクラスタをそれぞれ判定し、その結果を一時記憶部に格納する。ここで、ノードのサブクラスタラベルとは、そのノードが属するサブクラスタを示す。クラスタとは、混合クラスに含まれるノードについて、辺によって接続されるノードの集合を示し、サブクラスタは、同一のサブクラスタラベルが付与されたノードからなるクラスタの部分集合を示す。
また、辺接続判定手段27は、一時記憶部に格納された判定の結果、第1勝者ノード及び第2勝者ノードが互いに異なるサブクラスタに属する場合には、一時記憶部に格納されたノード、ノードの密度、ノードのサブクラスタラベルについて、第1勝者ノード及び第2勝者ノードのノード密度に関して、第1勝者ノードを含むサブクラスタの平均ノード密度を基準とする第1勝者ノードのノード密度の条件、又は、第2勝者ノードを含むサブクラスタの平均ノード密度を基準とする第2勝者ノードのノード密度の条件のうちの少なくとも1つを満たすか否かを更に判定し、その結果を一時記憶部に格納する。なお、辺接続判定手段27による辺接続判定処理の詳細については後述する。
辺接続手段28は、一時記憶部に格納された辺接続判定手段27による判定の結果、第1勝者ノード及び第2勝者ノードの少なくとも1つがいずれのサブクラスタに属していない、又は、同一のサブクラスタに属する場合には、一時記憶部に格納されたノード、ノード間の辺について、第1勝者ノード及び第2勝者ノード間に辺を接続し、その結果を一時記憶部に格納する。
また、辺接続手段28は、一時記憶部に格納された辺接続判定手段27による判定の結果、上記の第1勝者及び第2勝者ノードのノード密度の条件のうちの少なくとも1つを満たす場合には、一時記憶部に格納されたノード、ノード間の辺について、第1勝者ノード及び第2勝者ノード間に辺を接続し、その結果を一時記憶部に格納する。
また、辺接続手段28は、一時記憶部に格納された辺接続判定手段27による判定の結果、上記の第1勝者及び第2勝者ノードのノード密度の条件のうちの少なくとも1つを満たさない場合には、一時記憶部に格納されたノード、ノード間の辺について、第1勝者ノード及び第2勝者ノード間に辺を接続せず(第1勝者ノード及び第2勝者ノード間に辺が存在する場合には辺を削除する)、その結果を一時記憶部に格納する。なお、辺接続手段28による勝者ノード接続処理の詳細については後述する。
勝者ノード学習時間算出手段29は、一時記憶部に格納されたノード、ノードの学習時間について、第1勝者ノードの学習時間を所定の値増加し、その結果を一時記憶部に格納する。なお、本実施形態において、ノードの学習時間の詳細については後述する。
重みベクトル更新手段30は、一時記憶部に格納されたノード、ノードの重みベクトルについて、注目するノードについて注目するノードと辺によって直接的に接続されるノードを隣接ノードとして、第1勝者ノードの重みベクトル及び第1勝者ノードの隣接ノードの重みベクトルをそれぞれ入力ベクトルに更に近づけるように更新し、その結果を一時記憶部に格納する。
老齢辺削除手段31は、一時記憶部に格納されたノード、ノード間の辺、辺の年齢について、第1勝者ノードと直接的に接続される全ての辺の年齢を所定の値増加し、その結果を一時記憶部に格納する。また、老齢辺削除手段31は、一時記憶部に格納された辺について、予め設定され一時記憶部に格納された所定の閾値を超えた年齢を有する辺を削除し、その結果を一時記憶部に格納する。
入力数判定手段32は、一時記憶部に格納された与えられた入力ベクトルの総数について、与えられた入力ベクトルの総数が予め設定され一時記憶部に格納された所定の単位数の倍数であるか否かを判定し、その結果を一時記憶部に格納する。
負荷平衡化手段33は、一時記憶部に格納されたノード、ノード間の辺、ノードのサブクラスタラベル、ノードの重みベクトル、ノードの学習時間について、入力ベクトルの総数に応じた所定の周期ごとに、ノードの学習時間の値が相対的に大きくかつ偏っているノードを検出し、当該検出したノード及びその隣接ノードの重みベクトルに基づく重みベクトルを有する新たなノードを生成してネットワークに挿入し、検出したノードの学習時間及び検出したノードの隣接ノードの学習時間をそれぞれ減少し、検出したノード及びその隣接ノード間の辺を削除し、新たに挿入したノード及び検出したノード間と、新たに挿入したノード及び検出したノードのその隣接ノード間と、に辺をそれぞれ接続し、その結果を一時記憶部に格納する。なお、負荷平衡化手段33によるノードの負荷平衡化処理の詳細については後述する。
サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノード間の辺、ノードのサブクラスタラベル、ノード密度、ボロノイ領域について、局所的に最大のノード密度を有するノードを頂点として、当該頂点に対してそれぞれ異なるサブクラスタラベルを付与し、当該サブクラスタラベルが付与されなかった全てのノードに対してノード密度が最大の隣接ノードと同一のサブクラスタラベルを付与し、頂点のうちでノード密度が所定の閾値よりも大きな頂点を基準としてボロノイ領域を生成し、当該生成したボロノイ領域において、基準とした頂点を含むサブクラスタと基準とした頂点とは異なる他の頂点を含むサブクラスタとが重複領域を有し、かつ、当該重複領域に位置するノードの平均ノード密度の条件を満たす場合に、基準とした頂点を含むサブクラスタのサブクラスタラベルを、他の頂点を含むサブクラスタのサブクラスタラベルとして付与し、その結果を一時記憶部に格納する。なお、サブクラスタ決定手段34による処理の詳細については後述する。
ノイズノード削除手段35は、一時記憶部に格納されたノード、ノード密度、ノード間の辺、隣接ノードの個数について、注目するノードについて、注目するノードの隣接ノードの個数及びノード密度に基づいて、注目するノードを削除し、その結果を一時記憶部に格納する。
学習終了判定手段36は、情報処理装置1による学習処理を終了するか否かを判定する。
クラス決定手段37は、一時記憶部に格納されたノード、ノード間の辺、ノードのクラスについて、ノード間に生成された辺に基づいて、ノードの属するクラスを決定し、その結果を一時記憶部に格納する。
出力情報表示手段38は、一時記憶部に格納されたノード及びノードのクラスについて、ノードの属するクラスのクラス数、及び各クラスのプロトタイプベクトルを出力する。
次に、本実施の形態に係る情報処理装置1が有する特徴的な構成・処理を説明する。以下では、<1:ノード間の負荷平衡化処理>、<2:サブクラスタの決定処理>、<3:新たな距離尺度の組み合わせの枠組み>、<4:類似度閾値の定義>、<5:新たなノード密度の定義及びその算出処理>、<6:辺接続判定処理及び辺接続処理>の順に説明する。
<1:ノード間の負荷平衡化処理>
E-SOINNは、第1勝者又は第2勝者の類似度閾値による判定のみを単純に使用して、新たな入力ベクトルであるクラス間ノードをネットワークに挿入すべきか否かを決定する。このため、ネットワークの学習を新たに開始しようとしたときにノードの接続構造が既に構築されていた場合には、新たなノードをネットワークに挿入することが困難になる。この構築済みのノードの接続構造は入力データの入力順序に大きく影響されるため、E-SOINNの学習結果は安定しない。また、図2に示したように、この欠点はノードの密度を算出する際には、入力データに対する低い精度をもたらしてしまう。
ノードの接続構造を正確に表現するためには、ノードの個数を十分な数にすることが重要であり、このこと自体はよく知られている。ネットワークのいくつかの領域においてノードの個数が十分でない場合、それらの領域におけるノードの学習時間の値が大きくかつ偏った状況になる。本実施の形態では、この状況をノードの負荷が不均衡な状態にあるものと定義する。本実施の形態では、この負荷の不均衡を解消するために、以下に示すノード間の負荷平衡化処理を導入する。
<1−1:ノード間の負荷平衡化処理(S101〜S107)>
入力ベクトルの入力総数が所定の単位数(λ)の整数倍となった場合、負荷平衡化手段33は、一時記憶部に格納されたノード、ノード間の辺、ノードのサブクラスタラベル、ノードの重みベクトル、ノードの学習時間、ノードの密度について、ノードが属するサブクラスタの平均学習時間と比較して当該ノードの学習時間の値が相対的に大きくかつ偏ったノード(負荷が不均衡な状態にあるノード)を検出し、当該検出したノードとその隣接ノードの間に新たなノードを挿入し、当該検出したノードとその隣接ノードの学習時間を減少し、その結果を一時記憶部に格納する。これによって、負荷平衡化手段33は、負荷が不均衡な状態にあるノードについて負荷を平衡化させる。以下、ノードの負荷平衡化処理を具体的に説明する。なお、ノードの学習時間及びノードの密度の詳細については後述する。
S101:負荷平衡化手段33は、一時記憶部に格納されたノード、ノードのサブクラスタラベル、ノードの学習時間について、ノードの学習時間に基づいて、各サブクラスタにおいて相対的に大きなノードの学習時間を有するノードを探索し、その結果を一時記憶部に格納する。負荷平衡化手段33は、例えば、各サブクラスタにおいて最大のノードの学習時間を有するノードqを探索し、その結果を一時記憶部に格納する。さらに、負荷平衡化手段33は、一時記憶部に格納されたノード、ノードの学習時間について、検出したノードqの学習時間が、相対的に大きくかつ偏っているか否かを判定し、その結果を一時記憶部に格納する。負荷平衡化手段33は、例えば、ノードqの学習時間M及びノードqが属するサブクラスタの平均学習時間Mcq averageについて、M>3Mcq averageが成立するか否か判定し、その結果を一時記憶部に格納する。なお、負荷平衡化手段33は、ノードqが属するサブクラスタに含まれる全てのノードの学習時間を平均することによって、ノードqが属するサブクラスタの平均学習時間Mcq averageを算出し、その結果を一時記憶部に格納する。一時記憶部に格納された判定の結果、M>3Mcq averageが成立する場合には、負荷平衡化手段33は、以下のようにして新たなノードを追加し、M>3Mcq averageが成立しない場合には、ノードの追加を行わない。
S102:負荷平衡化手段33は、一時記憶部に格納されたノード、ノードの学習時間について、ノードの学習時間に基づいて、ノードqの隣接ノードのうちで、例えば最大の学習時間を有する隣接ノードfを決定し、その結果を一時記憶部に格納する。例えば、負荷平衡化手段33は、一時記憶部に格納される以下の式を満たす隣接ノードfを決定し、その結果を一時記憶部に格納する。ここで、Nは、ノードqの隣接ノード集合を示す。
S103:負荷平衡化手段33は、一時記憶部に格納されたノードについて、新たなノードrを生成してネットワークに追加し、その結果を一時記憶部に格納する。また、負荷平衡化手段33は、一時記憶部に格納されたノード、ノードの重みベクトルについて、ノードrの重みベクトルWを、ノードqの重みベクトルW及び隣接ノードfの重みベクトルWを用いて補間して算出し、その結果を一時記憶部に格納する。例えば、負荷平衡化手段33は、一時記憶部に格納される以下の式に示す操作及び算出処理を実行し、その結果を一時記憶部に格納する。
S104:負荷平衡化手段33は、一時記憶部に格納されたノード、ノードの学習時間について、ノードrの学習時間Mを、ノードqの学習時間M及び隣接ノードfの学習時間Mを用いて補間して算出し、その結果を一時記憶部に格納する。例えば、負荷平衡化手段33は、一時記憶部に格納される以下の式に示す算出処理を実行し、その結果を一時記憶部に格納する。ここで、dは入力ベクトルの次元数を示す。
S105:負荷平衡化手段33は、一時記憶部に格納されたノード、ノードの学習時間について、ノードqの学習時間M及び隣接ノードfの学習時間Mを所定の割合それぞれ減少し、その結果を一時記憶部に格納する。例えば、負荷平衡化手段33は、一時記憶部に格納される以下の式に示す算出処理を実行し、その結果を一時記憶部に格納する。ここで、dは入力ベクトルの次元数を示す。
S106:負荷平衡化手段33は、一時記憶部に格納されたノード、ノードの密度について、ノードrの密度hを、ノードqの密度h及び隣接ノードfの密度hを用いて補間して算出し、その結果を一時記憶部に格納する。例えば、負荷平衡化手段33は、一時記憶部に格納される以下の式に示す算出処理を実行し、その結果を一時記憶部に格納する。
S107:負荷平衡化手段33は、一時記憶部に格納されたノード、ノード間の辺について、新たなノードrとノードqを接続する辺と、新たなノードrと隣接ノードfを接続する辺と、を生成し、また、ノードq及び隣接ノードfの間に元々存在する辺を削除し、その結果を一時記憶部に格納する。例えば、負荷平衡化手段33は、一時記憶部に格納される以下の式(8)、式(9)に示す操作を実行し、その結果を一時記憶部に格納する。ここで、Cは辺集合を示し、例えば(r,q)はノードr及びノードq間を接続する辺を示す。
上述したように、情報処理装置1は、ノードが属するサブクラスタの平均学習時間を基準レベルとして採用し、ネットワークにノードを新たに挿入するか否かという追加学習のタスクに適用する。このため、事前の学習結果により得られた知識(ノード及びその接続構造を含むネットワーク)は、新たに入力される入力ベクトルに影響しない。この処理によって、情報処理装置1によるノード接続構造の生成処理は、E-SOINNとは異なったものになる。
情報処理装置1は、ネットワークに入力ベクトルを新たに挿入すべきか否かに関し、第1勝者又は第2勝者の類似度閾値を使用してノードの挿入を行うクラス間ノード挿入処理に加えて、負荷が不均衡な状態にあるノード(即ち、ノードの学習時間の値が相対的に大きくかつ偏ったノード)を検出して、この検出したノードの近くに新たなノードを挿入する負荷平衡化処理を実行する。これによって、ネットワークにおけるノードの負荷を平衡化させることができる。そして、情報処理装置1は、上述したS101〜S107に示す新たなノード挿入と、後述するS507に示すノード挿入と、の両方がクラス間挿入に属する場合、ネットワークにおけるノードの個数を十分なものにすることができ、この結果、入力データの密度分布を正確に反映することができる。従って、入力データの入力順序に影響を受けずに、入力パターンの接続構造を正確に記述することができるため、従来技術に比べてより優れた安定性能を有する。
<2:サブクラスタの決定処理>
入力ベクトルの入力個数が所定の単位数(λ)の整数倍となった場合、上述した負荷平衡化処理に加えて、サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノード間の辺、ノードのサブクラスタラベル、ノードの密度、ボロノイ領域について、ボロノイテセレーション(Voronoi Tessellation)に基づくサブクラスタの決定処理を実行し、その結果を一時記憶部に格納する。なお、サブクラスタの決定処理とは、ネットワークに存在するノードに対してサブクラスタラベルを付与することによって、当該ノードが属するサブクラスタを決定する処理である。
上述したように、E-SOINNによる処理はサブクラスタの統合及び分離の繰り返しを引き起こしてしまう。これは、E-SOINNによる処理(特許文献1の図5のS611の処理を指す。具体的には、明細書の段落0071に記載の処理を指す。)の実行後にネットワークに多くのサブクラスタが存在し、さらに、E-SOINNによる処理(特許文献1の図5のS607、S612などの処理を指す。具体的には、明細書の段落0072〜0079に記載の処理を指す。)によって、真のサブクラスタの外縁に位置するサブクラスタが容易に統合されてしまうためである。情報処理装置1は、以下に示すサブクラスタの統合を目的とするサブクラスタ決定処理を導入することによって、E-SOINNが有する問題に対処する。
本実施の形態では、以下の処理についての理解をより容易とするために、"サブクラスタ"という用語に代えて"隆起(tuber)"という用語を使用する。後述するように、本実施の形態では、局所的に最大のノード密度を有するノード及び当該ノードと辺によって接続されるノードからなる集合を記述するために、この隆起という用語を使用する。なお、隆起とは通常、山の盛り上がりを示すが、本実施の形態では、あるクラスに含まれる複数のサブクラスタに関して各サブクラスタが含むノードのノード密度の高低を考慮して、ノード密度の盛り上がりを表現するために隆起という用語を用いる。例えば、図5において、A、B、C、Dはそれぞれ隆起を示す。A及びCはそれぞれ同一のクラスに属し、B及びDはそれぞれ他の同一のクラスに属する。
後述するように、本実施の形態では、サブクラスタ決定処理を、各ボロノイ領域において、ノード密度が高密度の隆起から低密度の隆起へと向けて実行する。図5において、例えば、隆起Aからサブクラスタ決定処理を開始した場合、隆起Bは隆起Aと容易に統合し、その結果、ネットワークもまた乱れてしまう。さらに、隆起のサブクラスタ決定処理は、他の隆起と統合することを回避するように、正確に停止する必要がある。また、図5において、例えば、隆起Cのサブクラスタ決定処理では、隆起Bと統合しないようにする必要がある。
隆起の決定処理を以下に示す。この処理は、分離及び降下平滑化アルゴリズム(SDSA:Separate and Downhill smooth algorithm)とも呼ばれる。なお、以下の処理では、局所的に最大のノード密度を有するノードを、隆起の頂点と称する。言い換えると、隆起の頂点とは、対応する隆起に含まれるノードのうちで最大のノード密度を有するノードを示す。
<2−1:サブクラスタの決定処理(S201〜S205、S301〜S305)>
S201:サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノードの密度について、混合クラスにおける全てのノードについて局所的に最大のノード密度を有するノードを探索し、その探索したノードを隆起の頂点としてノード集合LMに追加し、その結果を一時記憶部に格納する。サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノードのサブクラスタラベル(隆起ラベル)について、探索した頂点全てに対してそれぞれ異なる隆起ラベルを付与し、その結果を一時記憶部に格納する。
S202:サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノード間を接続する辺、ノードのサブクラスタラベル(隆起ラベル)について、S201において隆起ラベルが付与されなかった全てのノードに対して、ノード密度が最大の隣接ノードと同じ隆起ラベルを付与する。即ち、S201において、各頂点に対してそれぞれ異なる隆起ラベルが付与される。そして、S202において、頂点を除いた他の全てのノードのそれぞれに対して、当該ノードの隣接ノードのうちで最大のノード密度を有するノードの隆起ラベルが付与される。このようにして全てのノードに対して隆起ラベルが付与され、同一の隆起ラベルが付与されたノードからなる集合を隆起(サブクラスタ)として扱うことで、混合クラスを、複数の隆起(サブクラスタ)に分離する。ここで、注目するノードとその隣接ノードが互いに異なる隆起ラベルを有する場合には、その注目するノード及びその隣接ノードは、分布の重複領域に位置する可能性がある。
S203:サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノードの密度について、頂点のノード集合LMにおいてノード密度がβより大きなノードを探索し、探索したノードをノード集合Kに追加し、その結果を一時記憶部に格納する。例えば、サブクラスタ決定手段34は、一時記憶部に格納される以下の式に示す算出処理を実行することによって値βを算出し、その結果を一時記憶部に格納する。ここで、γはユーザーによって予め適当な値が決定されて設定されるパラメータ(1<γ<2)を示し、hmeanは、頂点の集合LMに含まれる全ての頂点のノードの密度の平均値を示し、hmaxはノード集合LMに含まれる頂点のノード密度のうちで最大のノード密度を示す。
S204:サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノードの重みベクトル、ボロノイ領域について、ノード集合Kに基づいて、頂点のノード集合LMについてのボロノイ領域(図6を参照。)を生成し、その結果を一時記憶部に格納する。例えば、サブクラスタ決定手段34は、一時記憶部に格納される以下の式(11)に示す操作を実行し、その結果を一時記憶部に格納する。式(11)に示すボロノイ領域の生成処理では、ノード集合Kに含まれるノードKをシード(seed)として、このシードに対応するボロノイ領域Vを生成する。即ち、ノード集合Kに含まれるノードKは、ボロノイ領域Vにおけるi番目のシードとなる。このように、S201〜204に示す処理では、ノード集合LMは全ての頂点を含み、ノード集合Kは全ての頂点のうちでノード密度がβよりも高い頂点を含む。そして、ノード集合Kをボロノイ領域のシードとして使用する。例えば図6において、このようなシードを○(白丸)を用いて示している。
なお、ボロノイ領域は人工知能及び数学の分野における基礎的な知識であり(例えば、http://en.m.wikipedia.org/wiki/Voronoi_diagram を参照。)、上述したボロノイ領域の生成処理は、公知のボロノイ領域生成処理を実行すればよい。このため、ここでは、その詳細な説明を省略する。
S205:サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノード間の辺、ノードの密度、ノードのサブクラスタラベル(隆起ラベル)、ボロノイ領域について、以下のS301〜S305に示す処理を実行し、S204において生成した全てのボロノイ領域におけるサブクラスタの統合を行うことによってサブクラスタを決定し、その結果を一時記憶部に格納する。ここで、ボロノイ領域においてサブクラスタを決定するとは、各ボロノイ領域に含まれる隆起についてノード密度に関する所定の条件を満足する場合に、各隆起の隆起ラベルをノードKの隆起ラベルに統合する処理を指す。なお、所定の条件とは、例えば、後述する式(12)又は式(13)のいずれかを満足することを指す。
S301:サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノードのサブクラスタラベル(隆起ラベル)、ボロノイ領域について、ノードに付与された隆起ラベルに基づいて、あるボロノイ領域Vにおいて、当該ボロノイ領域Vに含まれるノードKの隆起(K)とノードjを含む隆起(j)とが重複領域を有するか否かを判定し、その結果を一時記憶部に格納する。なお、ここでは、理解を容易とするため、ノードKが属する隆起を隆起(K)とし、ノードKに付与された隆起ラベルを隆起ラベル(K)とし、ノードjが属する隆起を隆起(j)とし、ノードjに付与された隆起ラベルを隆起ラベル(j)として説明する。また、ここでのノードjとは、頂点の集合LMに含まれるノードであって、且つ、ボロノイ領域Vに含まれるノードを指す。
サブクラスタ決定手段34は、ノードKの隆起(K)とノードjを含む隆起(j)とが重複領域を有するか否かを、例えば、以下のようにして判定する。サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノード間の辺、ノードのサブクラスタラベル(隆起ラベル)について、ネットワークに含まれるノード間の辺およびノードに付与された隆起ラベルに基づいて、その一端のノードの隆起ラベルが隆起ラベル(K)であり、かつ、他端のノードの隆起ラベルが隆起ラベル(j)である辺が存在するか否かを判定し、判定の結果、そのような辺が存在する場合には、ノードKの隆起(K)とノードjを含む隆起(j)とが重複領域を有するものと判定し、その結果を一時記憶部に格納する。
S302:サブクラスタ決定手段34は、一時記憶部に格納された判定の結果、ノードKの隆起(K)とノードjを含む隆起(j)とが重複領域を有する場合、ノード集合OKiにノードjを追加する。ノード集合OKiとは、ノードKの隆起(K)とノードjを含む隆起(j)とが重複領域を有する場合に、ノードKの隆起(K)に対して統合する可能性のある隆起(j)を格納しておくための集合である。サブクラスタ決定手段34は、ノードKの隆起(K)とノードjを含む隆起(j)とが重複領域を有しない場合には、S301へと処理を進め、他のボロノイ領域Vについて処理を行う。
S303:サブクラスタ決定手段34は、一時記憶部に格納されたノード集合OKiについて、ノード集合OKiが空集合であるか否か判定し、その結果を一時記憶部に格納する。サブクラスタ決定手段34は、一時記憶部に格納された判定の結果、ノード集合OKiが空集合である場合には、S301へと処理を進め他のボロノイ領域Vについて処理を行い、ノード集合OKiが空集合でない場合には、S304へと処理を進める。
S304:サブクラスタ決定手段34は、例えば、ノード集合OKiに含まれるノードjそれぞれについて、一時記憶部に格納される以下の式(12)又は式(13)のいずれか1つを満足するか否かを判定し、その結果を一時記憶部に格納する。サブクラスタ決定手段34は、一時記憶部に格納された判定の結果、以下の式(12)又は式(13)のいずれか1つを満足する場合には、ノードj∈OKiの隆起ラベルとして、ノードKの隆起ラベル(K)を付与する。即ち、サブクラスタ決定手段34は、ノードjの隆起ラベル(j)をノードKの隆起ラベル隆起(K)に変更することによって、ノードjが属する隆起(j)を、ノードKが属する隆起(K)に統合する。
式(12)及び式(13)において、hKiは、ノードKのノード密度を示す。meanKiは、隆起(K)に含まれるノード(ネットワークに含まれるノード)のノード密度の平均ノード密度を示す。hは、ノードjのノード密度を示す。meanは、隆起(j)に含まれるノード(ネットワークに含まれるノード)のノード密度の平均ノード密度を示す。
ここで、meanORの定義を説明する。ノード集合OKiに含まれるノードjの隆起(j)について、隆起(K)と隆起(j)とが重複領域を有する場合には、隆起ラベル(K)であるノードと、隆起ラベル(j)であるノードとを接続する辺が存在する。この辺によって直接的に接続される各ノードを、隆起(K)と隆起(j)の重複領域に位置するノードと称する。meanORは、このようなノードのノード密度の平均ノード密度を示す。例えば、図23に例示する場合では、隆起(K)と隆起(j)とが2つの辺によって接続されており、これらの隆起は重複領域を有している。そして、これらの辺により接続されるノードとして、隆起(K)の2つのノードと、隆起(j)の2つのノードが存在し、これらの4個のノードが隆起(K)と隆起(j)の重複領域に位置する。meanORは、これらの4個のノードのノード密度を平均して算出する。
また、θは、ユーザーによって予め適切な値が決定されて設定されるパラメータを示し、その値は[1,2]の範囲内において定められる。また、θは許容度の要素のパラメータであり、1つのクラスにおいて、隆起(K)と隆起(j)との間の差異をどの程度許容するのかを決定するために使用される。θが増加するにつれてこの許容度はより小さくなる。
S305:サブクラスタ決定手段34は、一時記憶部に格納されたノード集合OKiを空集合に設定し、ステップS301へと処理を進め、再びステップS301以降の処理を開始する。
S301〜S305の処理の様子を、図24(A)、(B)、(C)を参照して説明する。
図24(A)に示すように、ボロノイ領域Vにおいて、隆起(K1)、隆起(j1)、隆起(j2)、隆起(j3)、隆起(j4)、隆起(j5)、隆起(j6)、隆起(j7)、隆起(j8)が含まれている。図において、各隆起を破線による白抜きの丸を用いて示す。なお、各ノードおよびノード間の辺については図示を省略した。
サブクラスタ決定手段34は、S301において、隆起(K1)と隆起(j1)が重複領域を有しているか否か、・・・、隆起K1と隆起j8が重複領域を有しているか否か、をそれぞれ判定する。サブクラスタ決定手段34は、S302において、隆起(K1)と隆起(j1)が重複領域を有している場合には、隆起(j1)のノードj1を集合OK1に追加し、隆起(K1)と隆起(j2)が重複領域を有している場合には、隆起(j2)のノードj2を集合OK1に追加し、隆起(K1)と隆起(j3)が重複領域を有している場合には、隆起(j3)のノードj3をOK1に追加する。この結果、集合OK1は、ノードj1、j2、j3を含む。
次に、サブクラスタ決定手段34は、S303において、集合OK1が空集合でないために、次のS304へと進む。サブクラスタ決定手段34は、S304において、ノードj1が属する隆起(j1)について式(12)または(13)が成立するか判定し、成立する場合には、ノードK1の隆起ラベル(K1)をノードj1の隆起ラベルとして付与する。また、サブクラスタ決定手段34は、S304において、ノードj2が属する隆起(j2)について式(12)または(13)が成立するか判定し、成立する場合には、ノードK1の隆起ラベル(K1)をノードj2の隆起ラベルとして付与する。また、サブクラスタ決定手段34は、S304において、ノードj3が属する隆起(j3)について式(12)または(13)が成立するか判定し、成立する場合には、ノードK1の隆起ラベル(K1)をノードj3の隆起ラベルとして付与する。この処理の結果、隆起ラベルに基づく各隆起の状態を、図24(B)に示す。
次に、サブクラスタ決定手段34は、S305において、集合OK1を空集合に設定し、ステップ301へと進む。サブクラスタ決定手段34は、S301において、隆起(K1)と隆起(j4)が重複領域を有しているか否か、・・・、隆起(K1)と隆起(j8)が重複領域を有しているか否か、をそれぞれ判定し、S302において、これらの全ての隆起(j4)〜(j8)が隆起(K1)と重複領域を有している場合には、隆起(j4)〜(j8)のノードj4〜j8を集合OK1に追加する。この結果、集合OK1は、ノードj4〜j8を含む。サブクラスタ決定手段34は、S303を経てS304において、ノードj4〜j8がそれぞれ属する隆起(j4)〜(j8)について、式(13)または(13)が成立するかそれぞれ判定し、成立する場合には、ノードK1の隆起ラベル(K1)を、ノードj4〜j8の隆起ラベルとして付与する。この処理の結果、隆起ラベルに基づく各隆起の状態を、図24(C)に示す。このようにして、サブクラスタ決定手段34は、各ボロノイ領域において、ボロノイ領域のシードとした頂点が属する隆起を中心として、他の隆起の統合を繰り返す。
サブクラスタ決定処理は、高いノード密度の隆起から低いノード密度の隆起へと向けて開始すべきである。このため、式(10)の目的は、ノード密度の境界βを探索して、その境界βの密度がどの程度高いかを決定することである。ノード密度がこの境界βよりも高い隆起は、対応するサブクラスタの中心になりやすい。このため、この種の隆起のノードを、頂点のノード集合Kに追加する。なお、本実施の形態では、隆起に含まれるノードのうちで、局所的に最大のノード密度を有するノードのみをノード集合Kに追加することによって、メモリを節約している。さらに、そのノード密度が境界βよりも低い全ての他の隆起は、ノード集合Kにおいて対応するボロノイ領域の要素となる。
そして、サブクラスタ決定処理を、ノード集合Kにおける要素(ノードK)から開始する。加えて、サブクラスタ決定処理は、同一のボロノイ領域における隆起間においてのみ行う。異なるサブクラスタに属するかもしれない隆起を一緒に統合してしまうことは回避すべきであるため、同一のボロノイ領域における隆起間についてのみサブクラスタ決定処理を行うことはとても重要である。このような目的を実現するために、本実施の形態では、S301〜S305に示した処理を実行する。
S301〜S305に示したサブクラスタ決定処理は、各ボロノイ領域の中心の隆起から開始する。S301〜S305に示したサブクラスタ決定処理は繰り返し処理であり、隆起間に重複領域が存在し、かつ、ノード密度に関する上述した所定の条件を満たす場合に、ボロノイ領域の中心の隆起は、重複領域を有する隆起を統合する。なお、各繰り返し処理において、当初は重複領域を有していなかったいくつかの隆起について、最後の繰り返し処理において、重複領域を有することがある。S301〜S305に示した処理は、異なる方向に向けて山を降りていく処理にとても類似する処理である。
図5は、E-SOINNによって生成された変動を有する分布と、情報処理装置1によって生成されてサブクラスタが統合された分布を概念的に示している。本実施の形態に係るS201〜S205及びS301〜S305の処理によれば、明らかに、異なるサブクラスタに混合クラスを分離するときの乱れを回避することができる。言い換えると、情報処理装置1は、E-SOINNよりも安定であると言える。
<3:新たな距離尺度の組み合わせの枠組み>
E-SOINNは、ユークリッド距離を使用して最近傍ノード(最も近い距離に位置するノード)を探索する。しかしながら、入力データが高次元である場合には、ユークリッド距離を使用すると距離が集中するように見られ、データ要素間での全ての距離がとても類似するように見えてしまう(非特許文献:Verleysen, M., Francois, D. , "The Concentration of Fractional Distances", IEEE Trans. on Knowledge and Data Engineering 19(7), 873-886 (2007).を参照。)。この現象は、"次元の呪い"と呼ばれている。次元の呪いを打倒するためにこれまでに多くの手法が提案されている。
例えば、高次元において近似する類似探索問題を解決するために、局所性鋭敏型ハッシュ(LSH:Locality Sensitive Hashing)手法が広く用いられている(非特許文献:Aristides Gionis , Piotr Indyk , Rajeev Motwani, "Similarity Search in High Dimensions via Hashing", Proceedings of the 25th International Conference on Very Large Data Bases, p.518-529, September 07-10, 1999.や、非特許文献:M. Datar, N. Immorlica, P. Indyk, and V.S. Mirrokni, "Locality-sensitive hashing scheme based on p-stable distributions", in Proc. Symposium on Computational Geometry, 2004, pp.253-262.を参照。)。しかし、LSHは、メモリ消費量が大きすぎるという大きな制約があり(非特許文献:Xiaoguang Gu, Yongdong Zhang, Lei Zhang, Dongming Zhang and Jintao Li, "An improved method of locality sensitive hashing for indexing large-scale and high-dimensional features," in Press, Signal Processing, 2012.を参照。)、オンライン追加学習タスクにLSHを使用することができない。さらに、コンテンツベースの類似サーチ手法として、関連するフィードバックアルゴリズムが与えられて、最適なノルムを選択するという手法がある。しかしながら、この手法もまた、オンライン追加学習タスクには使用することができない(非特許文献:Verleysen, M., Francois, D. , "The Concentration of Fractional Distances", IEEE Trans. on Knowledge and Data Engineering 19(7), 873-886 (2007).を参照。)。
入力データの次元が低次元である場合、ユークリッド距離に基づく距離は有効である。入力データが高次元である場合に有効な距離尺度としては、例えば、コサイン距離、マンハッタン距離(Manhattan distance)、フラクショナル距離(fractional distance)などのいくつかが提案されている。しかし、オンライン追加学習環境においては、サンプルデータを事前に得ることができない。言い換えると、事前に入力ベクトルの次元数を分析し、どの距離尺度が有効であるかを決定することができない。このため、本実施の形態では、距離尺度の組み合わせの枠組みを提案し、高次元空間において有効な他の距離尺度とユークリッド距離を統合する。これによって、次元の呪いを克服する。この距離尺度の組み合わせの枠組みは、オンライン自己増殖型追加学習タスクに適したものである。
本実施の形態に係る距離尺度の組み合わせの枠組みである距離算出式を、例えば、以下の式(14)に示す。ここで、D(p,q)はノードp及びノードqの間の距離を示す。dは入力ベクトルの次元数を示し、nは距離尺度の個数を示す。ηは、ユーザーによって予め適当な値が決定されて設定されるパラメータである。なお、ηは、実験を経て予め適当な値を決定し、ユーザーによって当該値を設定するものとしてもよいし、入力ベクトルの次元数を変数とする関数を情報処理装置1に設定し、情報処理装置1が、当該関数を用いて入力データの次元数に応じた適当な値を自ら算出して設定するようにしてもよい。
式(14)に示す距離算出式は、第1項部分と、第2項部分を含む。第1項部分は、ユークリッド距離に基づいてノード間の距離を算出する第1の距離算出式の一例である。第2項部分は、ユークリッド距離とは異なる他の距離尺度に基づいてノード間の距離を算出する、複数の距離算出式の一例である。第1項部分及び第2項部分はそれぞれ重み付けがされており、当該重み付けは、パラメータη及びdに応じて設定されている。後述するように、入力ベクトルの次元数dが増加するに従って、第1の距離算出式の重みを減少させるように設定されている。
EUpqは、ノードp及びノードqの間のユークリッド距離に基づく距離を示し、式(15)により算出する。EUmin及びEUmaxは、ネットワークにおける任意の2つのノード間の最小のユークリッド距離及び最大のユークリッド距離をそれぞれ示す。EUmaxの値は減少せずに増加するだけであり、このことは、EUmaxの値が、学習の過程においてそれまでに現れた最大のユークリッド距離であることを示す。また、学習フェーズが続く限り、EUminの値は増加せずに減少するだけであり、このことは、EUminの値が、学習の過程においてそれまでに現れた最小のユークリッド距離であることを示す。
pq、D min、D maxは、i番目の距離尺度に関するものである。D pqは、ノードp及びノードqの間のi番目の距離尺度に基づく距離を示す。D min及びD maxは、ネットワークにおける任意の2つのノード間のi番目の距離尺度に基づく最小の距離値及び最大の距離値をそれぞれ示す。即ち、これらはEUpq、EUmin、EUmaxとそれぞれ同一の意味合いを有する。
各距離尺度に基づく距離は、互いに異なるスケールである。このため各距離尺度に基づく距離算出式を一つの距離算出式に統合するために、各距離尺度に基づく2つのノード間の最小距離値及び最大距離値を用いて、式(14)に示すようにして2つのノード間の距離を正規化する。
また、式(14)では、入力ベクトルの次元数が増加するに従って、式(14)に示すノード間距離算出式の値に占めるユークリッド距離に基づく距離算出式による値の比率を減少させ、これに対応するように、他の距離尺度に基づく距離算出式による値の比率を増加させる。
従って、このようなノード間距離算出式に示す枠組みによれば、低次元空間におけるユークリッド距離の優位性を得られる上に、高次元空間における学習タスクに対して情報処理装置1を適用させることも可能となる。さらに、この枠組みは入力ベクトルの事前の分析を必要としないために、オンライン追加の自己増殖型学習タスク、あるいは限られた入力ベクトルのサンプルによる実世界の学習タスクに適している。
後述するように、本実施の形態に係る情報処理装置1に対する実験においては、他の距離尺度の一例としてコサイン距離(cosine distance)を採用し、コサイン距離をユークリッド距離に統合する。コサイン距離の定義を以下の式に示す。ここで、θは、重みベクトルW及び重みベクトルWの間の角度を示す。
本実施の形態では、式(16)を用いて、式(14)に示した距離尺度の組み合わせを、以下に示すように再定義する。情報処理装置1は、例えば、式(17)に示す新たな距離尺度を用いてノードp及びノードqの間の距離を算出し、その結果を一時記憶部に格納する。
<4:類似度閾値の定義>
クラス間ノード挿入判定手段25は、一時記憶部に格納されたノード及びノードの類似度閾値について、注目するノードについて、隣接ノードが存在する場合には、隣接ノードのうち注目するノードからの距離が最大であるノードまでの距離を類似度閾値として算出し、その結果を一時記憶部に格納し、隣接ノードが存在しない場合には、注目するノードからの距離が最小であるノードまでの距離を類似度閾値として算出し、その結果を一時記憶部に格納する。具体的には、例えば以下のようにして注目するノードの類似度閾値を算出し、その結果を一時記憶部に格納する。なお、クラス間ノード挿入判定手段25は、ネットワークに初めて挿入され一時記憶部に格納されたノードiの類似度閾値Tについては、予め定める十分大きな値を設定し、その結果を一時記憶部に格納する。
クラス間ノード挿入判定手段25は、一時記憶部に格納されたノードについて、ノードiが第1勝者ノード又は第2勝者ノードとなった場合に、ノードiが隣接ノードを有するか否かを判定し、その結果を一時記憶部に格納する。
クラス間ノード挿入判定手段25は、一時記憶部に格納された判定の結果、ノードiが隣接ノードを有する場合には、一時記憶部に格納された類似度閾値及びノードについて、類似度閾値Tを隣接ノードへの最大距離とし、その結果を一時記憶部に格納する。即ち、ノードiについて、一時記憶部に格納される以下の式(18)に基づいて類似度閾値Tを算出し、その結果を一時記憶部に格納する。ここで、jは一時記憶部に格納されたノードiの隣接ノード集合Nに含まれるノードであり、D(i,j)は、式(17)を用いて算出する、ノードi及びノードj間の距離である。
クラス間ノード挿入判定手段25は、一時記憶部に格納された判定の結果、ノードiが隣接ノードを有しない場合には、ノードiからノードiを除いた他の各ノードへの距離を算出し、算出された距離のうち最小の距離を類似度閾値Tとする。即ち、ノードiについて、一時記憶部に格納される以下の式(19)に基づいて類似度閾値Tを算出し、その結果を一時記憶部に格納する。
<5:新たなノード密度の定義及びその算出処理>
ノード密度算出手段23は、注目するノードのノード密度を、隣接ノードからのノードの平均距離に基づいて算出する。隣接ノードjからのノードiの平均距離のベクトルd は、例えば、以下の式(20)に示すようにして算出することができる。ここで、変数d は、変数dの上に記号「→(ライトアロー)」が付いていることを示す。また、以下の説明において、記号「→(ライトアロー)」は、ベクトルであることを示す。ここで、ベクトルの要素数は、使用する距離尺度の個数と一致する。本実施の形態では、後述するように、2つの距離尺度を使用するため、ベクトルの要素数は2である。
本実施の形態では、上述したように、新たな距離尺度の組み合わせの枠組みを提案し、ユークリッド距離に加えて他の距離尺度を使用するために、2つのノード間の距離を正規化する。このため、本実施の形態では、以下に説明するように、ノード密度の算出に際して上記式(20)をそのまま採用することに代えて、隣接ノードjからのノードiの平均距離のベクトルd を以下の式(23)を使用して算出する。また、本実施の形態では、各距離尺度の正規化のために使用されるノード間の最小距離値及び最大距離値(EUmax、EUmin、D max、D min)はネットワークに新たな入力ベクトルが入力されると変化するため、この点についても考慮する。
情報処理装置1では、新たな距離尺度の枠組みを採用する。このため、新たなノードiについて隣接ノードからの平均距離を式(20)に基づいて算出する場合に、以前に挿入した他のノードの平均累積ポイント値を算出する際に使用したEUmax又はD maxと比べて、EUmax又はD maxの値が十分に大きくなっている可能性がある(ただし、ここでEUmin及びD minは変化しないものと仮定する。)。言い換えると、以前に挿入した他のノードの隣接ノードからの平均距離が算出され、新しいノードの隣接ノードからの平均距離が算出されるが、それぞれ異なったスケールにおいて正規化がなされる。
そこで、本実施の形態では、情報処理装置1は、ノード密度の新たな定義及び算出処理を導入し、上述した問題に対応する。この基本的な考えは、各距離尺度に基づくノード間の最小距離値及び最大距離値(EUmax、EUmin、D max、D min)のうちで少なくとも1つの値が変化した場合に、ネットワークに存在する全てのノードのノード密度の累積ポイント値を再び算出して更新することである。以下、具体的に説明する。
まず、ノード密度の新たな定義を説明する。ノードiについて、その隣接ノードjからのノードiの平均距離のベクトルd を、以下に示すように新しく定義する。
すると、式(21)を変形することによって、以下の式(22)を得る。
最後に、式(22)の表記を簡略化することによって、隣接ノードjからのノードiの平均距離のベクトルd を、以下の式に示すように表すことができる。ノード密度算出手段23は、一時記憶部に格納されたノード、各距離尺度に基づくノード間の最小距離値及び最大距離値、隣接ノードからのノードの平均距離のベクトルについて、各距離尺度に基づく注目するノードの隣接ノードからの距離と、各距離尺度に基づくノード間の最小距離値及び最大距離値と、に基づいて注目するノードの隣接ノードからの平均距離のベクトルを算出し、その結果を一時記憶部に格納する。ノード密度算出手段23は、例えば、一時記憶部に格納される以下の式(23)を用いて隣接ノードjからの注目するノードiの平均距離のベクトルd を算出し、その結果を一時記憶部に格納する。
上記式(23)に示した隣接ノードjからの注目するノードiの平均距離のベクトルd における各要素は、0より大きくかつ1より小さい。このため、ノード密度のポイント値のベクトルp の新たな定義を、以下の式(24)に示すように定める。ノード密度算出手段23は、一時記憶部に格納されるノード、隣接ノードからのノードの平均距離のベクトル、ノード密度のポイント値のベクトルについて、注目するノードが第1勝者である場合にのみ隣接ノードからのノードの平均距離のベクトルに応じた値をノード密度のポイント値のベクトルとして算出し、その結果を一時記憶部に格納する。ノード密度算出手段23は、例えば、一時記憶部に格納される以下の式(24)に示す算出処理を実行し、ノード密度のポイント値のベクトルp を算出し、その結果を一時記憶部に格納する。
式(24)に示した"ノード密度のポイント値のベクトルp "の定義に関して、隣接ノードからのノードiの平均距離が大きく、かつ、その領域におけるノードの個数が少ない場合、ノード密度のポイント値の定義は、E-SOINNの定義とは異なったものになる。情報処理装置1では、このような場合には、低い"ノード密度のポイント値のベクトルp "を、ノードiに与える(低いとは、ノード密度のポイント値のベクトルp の要素の合計値が小さいことを意味する。)。他方で、隣接ノードからのノードiの平均距離が小さい場合には、その領域におけるノードの個数が多く、その領域におけるノード密度が高いことを意味する。このため、情報処理装置1は、高い"ノード密度のポイント値のベクトルp "を、ノードiに与える(高いとは、ノード密度のポイント値のベクトルp の要素の合計値が大きいことを意味する。)。
情報処理装置1は、入力ベクトルが1つ入力されてそれに対する1回の学習の繰り返しにおいて、式(24)に示したようにノードiが勝者ノードである場合にのみ、ノードiについての"ノード密度のポイント値のベクトルp "のみを算出する。この繰り返しにおいて、勝者ノードでない他のノードの"ノード密度のポイント値のベクトルp "は算出せず、その値は全て0である。情報処理装置1は、ノード密度のポイント値のベクトルp の定義をE-SOINNとは異なるものにし、式(24)が線形関数であることから、各距離尺度に基づくノード間の最小距離値及び最大距離値(EUmax、EUmin、D max、D min)のうちで少なくとも1つの値が変化した場合に、ノード密度を容易に再び算出できるようにする。
ノード密度算出手段25は、一時記憶部に格納されたノード、ノード密度のポイント値のベクトルについて、第1勝者ノードiのノード密度のポイント値のベクトルp を、λ及びmに関して累積して合計することによって、第1勝者ノードiのノード密度の累積ポイント値のベクトルs を算出し、その結果を一時記憶部に格納する。ノード密度算出手段25は、例えば、一時記憶部に格納される以下の式(25)に示す算出処理を実行し、その結果を一時記憶部に格納する。ここで、連続して与えられる入力ベクトルの入力総数がLTとなるまでの学習区間を、1つの学習区間とする。さらに、この学習区間を、入力ベクトルの入力総数が所定の単位数(λ)となるごとに複数の単位学習区間に分割する。この複数の学習区間の個数をmとする(m=LT/λ)。
そして、ノード密度算出手段25は、一時記憶部に格納されたノード、ノード密度の累積ポイント値のベクトルについて、所定の関数fに対してノードiのノード密度の累積ポイント値のベクトルs を入力し、単位入力数Nによって除算して算出し、その結果をノードiのノード密度hとして一時記憶部に格納する。本実施の形態では、単位入力数Nあたりの平均値hを、ノードiのノード密度として定義する。従って、ノード密度算出手段25は、例えば、一時記憶部に格納される以下の式(26)に示す算出処理を実行し、ノード密度を算出し、その結果を一時記憶部に格納する。ここで、f(X)は、ベクトルXの要素の合計値を算出する関数である。単位入力数Nは、m個の単位学習区間のうちで、ノード密度の累積ポイント値のベクトルs の要素が0より大きい場合の単位学習区間の回数として算出する。なお、Nの定義はE-SOINNと同一である(特許文献1の段落0067を参照。)。
次に、ノード密度の更新処理について説明する。ノード密度更新判定手段22は、一時記憶部に格納されたノード、各距離尺度に基づくノード間の最小距離値及び最大距離値について、各距離尺度に基づくノード間の最小距離値及び最大距離値(EUmax、EUmin、D max、D min)のうちで少なくとも1つの値が変化したか否かを確認し、少なくとも1つの値が変化した場合にはノード密度を更新すると判定し、その結果を一時記憶部に格納する。
そして、ノード密度算出手段25は、一時記憶部に格納された判定の結果、ノード密度を更新する場合には、一時記憶部に格納されたノード、ノード密度の累積ポイント値のベクトル、ノードの学習時間、各距離尺度に基づくノード間の最小距離値及び最大距離値について、ノード密度の累積ポイント値のベクトル、ノードの学習時間、各距離尺度に基づくノード間の最小距離値及び最大距離値に基づいて、ネットワークに存在する全てのノードについて、ノードiのノード密度の累積ポイント値のベクトルs を以下に示すようにして再び算出して更新し、更新したノードiのノード密度の累積ポイント値のベクトルs を用いてノードiのノード密度hを再び算出し、その結果を一時記憶部に格納する。ノード密度算出手段25は、例えば、一時記憶部に格納される以下の式(27)〜(30)に示す算出処理を実行することによって、ネットワークに存在するノードiのノード密度の累積ポイント値のベクトルs を算出し、算出したノードiのノード密度の累積ポイント値のベクトルs を式(26)に代入して、ノードiのノード密度hを再び算出し、その結果を一時記憶部に格納する。このようにして、ノード密度算出手段25は、ノードiのノード密度の累積ポイント値のベクトルs 及びノードiのノード密度hを再び算出して更新する。
式(27)において、Mはノードiの学習時間を示す。ノードiの学習時間のベクトルM を、以下の式(28)に示す。
ノード密度算出手段25は、例えば、一時記憶部に格納される以下の式(29)及び式(30)に示す算出処理を実行することによって、式(27)におけるベクトルk及びbを算出し、その結果を一時記憶部に格納する。ここで、EU'max、EU'min、(D max)'、(D min)'は、各距離尺度に基づくノード間の最小距離値及び最大距離値についての、変化後の新たな値である。他方で、EUmax、EUmin、D max、D minは、変化する以前の値である。変化する以前の値とは、学習処理過程においてネットワークにおけるノード間の距離が変化した結果、EUmax、EUmin、D max、D minの値が変化した場合に、変化以前の値を指し、EUmax、EUmin、D max、D minをそのまま用いて記述する。一方で、変化後の新しい値とは、EU'max、EU'min、(D max)'、(D min)'の値が変化した場合に、変化後の値を指し、以前の値と区別するために、EU'max、EU'min、(D max)'、(D min)'を用いて示す。
<6:辺接続判定処理及び辺接続処理(勝者ノード接続処理)>
E-SOINNでは、勝者ノード間の辺接続判定処理及び辺接続処理(特許文献1の図5のS606、S607の処理を指す。具体的には、明細書の段落0072〜0079に記載の処理を指す。)に関して、パラメータαを使用する。このパラメータαは、所定の閾値関数を用いて定義されている(特許文献1の段落0078を参照。)。この所定の閾値関数は、2.0、3.0、0.0、0.5、1.0などのいくつかの整数を必要としており、実際上の応用処理において良好な学習結果を得るためには、これらの整数値を調整する必要がある。しかしながら、ユーザーにとって、そのような調整タスクを行うことは容易ではない。そこで、情報処理装置1では、以下に示す滑らかな関数(soft function)を提案し、区分的関数(piecewise function)である前記所定の閾値関数を置き換える。
辺接続判定手段27は、一時記憶部に格納されたクラス間ノード挿入判定手段25による判定結果に応じて、一時記憶部に格納されたノード、ノードのサブクラスタラベル、ノードの密度について、第1勝者ノード及び第2勝者ノードが属するサブクラスタラベルと、第1勝者ノード及び第2勝者ノードについてのノード密度の条件とに基づいて、第1勝者ノード及び第2勝者ノード間に辺を接続するか否か判定し、その結果を一時記憶部に格納する。
辺接続手段28は、一時記憶部に格納された判定結果に応じて、第1勝者ノード及び第2勝者ノード間の辺の生成及び削除処理を実行し、その結果を一時記憶部に格納する。
辺接続判定手段27は、例えば以下のようにして、辺を接続するか否かを判定し、その結果を一時記憶部に格納する。辺接続手段28は、例えば以下のようにして、辺の生成及び削除処理を実行し、その結果を一時記憶部に格納する。
<辺接続判定処理及び勝者ノード接続処理:S401〜S405>
S401:辺接続判定手段27は、一時記憶部に格納されたノード、ノードのサブクラスタラベル(隆起ラベル)について、ノードのサブクラスタラベル(隆起ラベル)に基づいて、第1勝者ノード及び第2勝者ノードが属するサブクラスタをそれぞれ判定し、その結果を一時記憶部に格納する。
S402:一時記憶部に格納された判定の結果、第1勝者ノード及び第2勝者ノードの少なくとも1つがいずれのサブクラスタにも属していない場合、又は、第1勝者ノード及び第2勝者ノードが同一のサブクラスタに属している場合には、辺接続手段28は、一時記憶部に格納されたノード及びノード間の辺について、第1勝者ノード及び第2勝者ノード間に辺を生成することによりノード間を接続し、その結果を一時記憶部に格納する。
S403:一時記憶部に格納されたS401における判定の結果、第1勝者ノード及び第2勝者ノードが互いに異なるサブクラスタに属す場合には(例えば、第1勝者ノードがサブクラスタAに属し、かつ、第2勝者ノードがサブクラスタBに属する場合)、辺接続判定手段27は、一時記憶部に格納されたノード、ノード密度について、第1勝者ノード及び第2勝者ノードのノード密度に関して、第1勝者ノードを含むサブクラスタの平均ノード密度を基準とする第1勝者ノードについてのノード密度の条件、又は、第2勝者ノードを含むサブクラスタの平均ノード密度を基準とする第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たすか否かを判定し、その結果を一時記憶部に格納する。
S404:一時記憶部に格納されたS403における判定の結果、辺を接続する必要があると判定した場合には、辺接続手段28は、一時記憶部に格納されたノード及びノード間の辺について、第1勝者ノード及び第2勝者ノード間に辺を生成しノード間を接続する。これによって、サブクラスタA及びBが統合される。
S405:一時記憶部に格納されたS403における判定の結果、辺を接続する必要がないと判定した場合には、一時記憶部に格納されたノード及びノード間の辺について、第1勝者ノード及び第2勝者ノード間を辺によって接続しない。なお、ノード間が辺によって既に接続されていた場合には、辺接続手段28は、一時記憶部に格納されたノード及びノード間の辺について、一時記憶部に格納された第1勝者ノード及び第2勝者ノード間の辺を削除し、その結果を一時記憶部に格納する。
ここで、S403における辺接続判定手段27による判定処理について詳細に説明する。
辺接続判定手段27は、例えば、以下の式(31)又は式(32)の少なくとも1つを満足する場合、第1勝者ノード及び第2勝者ノード間に辺を接続するものと判定し、そうでない場合、第1勝者ノード及び第2勝者ノード間に辺を接続しないと判定し、その結果を一時記憶部に格納する。
式(31)及び式(32)において、hwinnerは第1勝者ノードのノード密度を示し、hsecondwinnerは第2勝者ノードのノード密度を示す。min(hwinner,hsecondwinner)は、第1勝者ノードのノード密度hwinner及び第2勝者ノードのノード密度hsecondwinnerのうちの最小のノード密度を示す。hは、サブクラスタAに含まれるノードのうちで最大のノード密度を有するノードのノード密度を示し、meanは、サブクラスタAに含まれる全てのノードから算出するサブクラスタAの平均ノード密度を示す。hは、サブクラスタBに含まれるノードのうちで最大のノード密度を有するノードのノード密度を示し、meanは、サブクラスタBに含まれる全てのノードから算出するサブクラスタBの平均ノード密度を示す。θは、式(12)において用いたパラメータと同一のパラメータである。
式(31)に示す第1勝者ノードについてのノード密度の条件は、第1勝者ノードのノード密度及び第2勝者ノードのノード密度のうちの最小のノード密度が、第1勝者ノードを含むサブクラスタAの平均ノード密度meanを基準として、サブクラスタAの平均ノード密度meanに対する最大ノード密度hの比率に応じて算出する閾値よりも大きいか否かを判定する条件である。また、式(32)に示す第2勝者ノードについてのノード密度の条件は、第1勝者ノードのノード密度及び第2勝者ノードのノード密度のうちの最小のノード密度が、第2勝者ノードを含むサブクラスタBの平均ノード密度meanを基準として、サブクラスタBの平均ノード密度meanに対する最大ノード密度hの比率に応じて算出する閾値よりも大きいか否かを判定する条件である。
<全体処理フロー:S501〜S519>
続いて、本実施形態に係る情報処理装置における全体処理フローについて、図22のフローチャートを用いて説明する。図22は、本実施形態に係る情報処理装置による学習処理の処理概要を示すフローチャートである。
S501:入力情報取得手段21は、2つの入力ベクトルをランダムに取得し、ノード集合Aをそれらに対応する2つのノードのみを含む集合として初期化し、その結果を一時記憶部に格納する。また、入力情報取得手段21は、辺集合C⊂A×Aを空集合として初期化し、その結果を一時記憶部に格納する。
S502:入力情報取得手段21は、新しい入力ベクトルε∈Rを入力し、その結果を一時記憶部に格納する。
S503:ノード密度更新判定手段22は、一時記憶部に格納されたノード、各距離尺度に基づくノード間の最小距離値及び最大距離値について、各距離尺度に基づくノード間の最小距離値及び最大距離値(EUmax、EUmin、D max、D min)のうちで少なくとも1つの値が変化したか否かを確認し、少なくとも1つの値が変化した場合にはノード密度を更新すると判定し、その結果を一時記憶部に格納する。なお、各距離尺度に基づくノード間の最小距離値及び最大距離値(EUmax、EUmin、D max、D min)は、学習開始時点において初期値として0が予め設定される。
S504:ノード密度算出手段23は、一時記憶部に格納された判定の結果、ノード密度を更新する場合には、一時記憶部に格納されたノード、ノード密度の累積ポイント値のベクトル、ノードの学習時間、各距離尺度に基づくノード間の最小距離値及び最大距離値について、ノード密度の累積ポイント値のベクトル、ノードの学習時間、各距離尺度に基づくノード間の最小距離値及び最大距離値に基づいて、ノード集合Aに含まれるノードi∈Aのノード密度の累積ポイント値のベクトルs を再び算出して更新し、更新したノードiのノード密度の累積ポイント値のベクトルs を用いてノードiのノード密度hを再び算出し、その結果を一時記憶部に格納する。ノード密度算出手段23は、例えば、一時記憶部に格納される上述した式(27)〜(30)及び式(26)に示す算出処理を実行することによって、ノードiのノード密度の累積ポイント値のベクトルs 及びノードiのノード密度hを再び算出して更新する。
なお、一時記憶部に格納された判定の結果、ノード密度を更新しない場合には、S504におけるノード密度算出手段23による処理は行わずに、情報処理装置1は、S505へと処理を進める。
S505:勝者ノード探索手段24は、一時記憶部に格納された入力ベクトル及びノードについて、入力ベクトルεに最も距離が近い第1勝者ノードa及び2番目に近い第2勝者ノードaを探索し、その結果を一時記憶部に格納する。勝者ノード探索手段24は、探索処理として、例えば、a=mina∈AD(ε,a),a=mina∈A\{a1}D(ε,a)に示す処理を実行し、その結果を一時記憶部に格納する。ここで、勝者ノード探索手段24は、上述した式(17)に示した新たな距離尺度を用いて入力ベクトルε及びノードaの間の距離D(ε,a)を算出し、その結果を一時記憶部に格納する。
S506:クラス間ノード挿入判定手段25は、一時記憶部に格納された入力ベクトル、ノード、ノードの類似度閾値について、入力ベクトルεと第1勝者ノードa間の距離が第1勝者ノードaの類似度閾値Ta1より大きいか否か、及び、入力ベクトルεと第2勝者ノードa間の距離が第2勝者ノードaの類似度閾値Ta2より大きいか否かを判定し、その結果を一時記憶部に格納する。ここで、クラス間ノード挿入判定手段25は、上述した式(18)又は式(19)を用いて第1勝者ノードaの類似度閾値Ta1及び第2勝者ノードaの類似度閾値Ta2を算出し、その結果を一時記憶部に格納する。さらに、クラス間ノード挿入判定手段25は、入力ベクトルεと第1勝者ノードa間の距離が第1勝者ノードaの類似度閾値Ta1より大きい、又は、入力ベクトルεと第2勝者ノードa間の距離が第2勝者ノードaの類似度閾値Ta2より大きい場合には、クラス間ノード挿入を実行すると判定し、そうでない場合には、クラス間ノード挿入を実行しないと判定し、その結果を一時記憶部に格納する。
S507:一時記憶部に格納されたS506における判定の結果、クラス間ノード挿入を実行する場合には、クラス間ノード挿入手段26は、一時記憶部に格納された入力ベクトル及びノードについて、入力ベクトルεはネットワークへの新たなノードとなるため、入力ベクトルεの成分と同一の成分を重みベクトルとして有するクラス間挿入ノードを生成し、生成したクラス間挿入ノードをノード集合Aに追加し、その結果を一時記憶部に格納する。そして、情報処理装置1は、S502へと処理を進めて、再び入力ベクトルの入力を行う。
S508:一方、一時記憶部に格納されたS506における判定の結果、クラス間ノード挿入を実行しない場合には、辺接続判定手段27は、一時記憶部に格納されたノード、ノードのサブクラスタラベルについて、ノードのサブクラスタラベルに基づいて、第1勝者ノードa及び第2勝者ノードaが属するサブクラスタをそれぞれ判定し、その結果を一時記憶部に格納する。辺接続判定手段27は、例えば、上述したS401に示した辺接続判定処理を行う。
また、辺接続判定手段27は、一時記憶部に格納されたS508における判定の結果、第1勝者ノード及び第2勝者ノードが互いに異なるサブクラスタに属する場合には、一時記憶部に格納されたノード、ノードの密度について、第1勝者ノードa及び第2勝者ノードaのノード密度に関して、第1勝者ノードaを含むサブクラスタの平均ノード密度を基準とする第1勝者ノードについてのノード密度の条件、又は、第2勝者ノードaを含むサブクラスタの平均ノード密度を基準とする第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たすか否かを判定し、その結果を一時記憶部に格納する。例えば、上述したS403に示した辺接続判定処理を行う。
S509:一時記憶部に格納されたS508における判定の結果、第1勝者ノード及び第2勝者ノードの少なくとも1つがいずれのサブクラスタにも属していない、又は、同一のサブクラスタに属する場合には、辺接続手段28は、一時記憶部に格納されたノード及びノード間の辺について、第1勝者ノードa及び第2勝者ノードa間に辺を接続し、その結果を一時記憶部に格納する。辺接続手段28は、例えば、上述したS402に示した勝者ノード接続処理を行う。そして、辺接続手段28は、一時記憶部に格納された辺及び辺の年齢について、新しく生成された辺、及び、既にノード間に辺が生成されていた場合にはその辺について、辺の年齢を0に設定しその結果を一時記憶部に格納する。
また、辺接続手段28は、一時記憶部に格納されたS508における判定の結果、上記の第1勝者ノード及び第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たす場合には、一時記憶部に格納されたノード、ノード間の辺について、第1勝者ノードa及び第2勝者ノードa間に辺を接続し、その結果を一時記憶部に格納する。辺接続手段28は、例えば、上述したS404に示した勝者ノード接続処理を行う。
辺接続手段28は、一時記憶部に格納されたS508における判定の結果、上記の第1勝者ノード及び第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たさない場合には、一時記憶部に格納されたノード、ノード間の辺について、第1勝者ノード及び第2勝者ノード間に辺を接続しない(第1勝者ノード及び第2勝者ノード間に辺が存在する場合には辺を削除する)、その結果を一時記憶部に格納する。辺接続手段28は、例えば、上述したS405に示した勝者ノード接続処理を行う。
S510:ノード密度算出手段23は、一時記憶部に格納されたノード、各距離尺度に基づくノード間の最小距離値及び最大距離値、隣接ノードからのノードの平均距離のベクトル、ノードのノード密度のポイント値のベクトル、ノード密度の累積ポイント値のベクトル、ノード密度について、第1勝者ノードaをノードiとして、各距離尺度に基づく隣接ノードからのノードiの距離と、各距離尺度に基づくノード間の最小距離値及び最大距離値と、に基づいてノードiについての隣接ノードからの平均距離のベクトルd を算出し、当該算出した隣接ノードからの平均距離のベクトルd に基づいて第1勝者ノードaのノード密度のポイント値のベクトルp を算出し、当該算出した第1勝者ノードaのノード密度のポイント値のベクトルp に基づいてノード密度の累積ポイント値のベクトルs を算出し、当該算出した第1勝者ノードaのノード密度の累積ポイント値のベクトルs に基づいて第1勝者ノードaのノード密度hを算出し、その結果を一時記憶部に格納する。ノード密度算出手段23は、例えば、一時記憶部に格納される上述した式(24)〜(26)に示す算出処理を実行することによって、ノードiのノード密度の累積ポイント値のベクトルs 及びノードiのノード密度hを算出する。
S511:勝者ノード学習時間算出手段29は、一時記憶部に格納された第1勝者ノードaの学習時間Ma1を所定の値増加し、その結果を一時記憶部に格納する。勝者ノード学習時間算出手段29は、例えば、Ma1(t+1)=Ma1(t)+1という処理を実行することによって、第1勝者ノードaの学習時間Ma1を1増加し、その結果を一時記憶部に格納する。
S512:重みベクトル更新手段30は、一時記憶部に格納されたノード及びノードの重みベクトルについて、第1勝者ノードa及びその隣接ノードの重みベクトルをそれぞれ入力ベクトルεに更に近づけるように更新し、その結果を一時記憶部に格納する。重みベクトル更新手段30は、例えば以下の式(33)及び式(34)を用いて、第1勝者ノードaの重みベクトルWa1についての更新量ΔWa1及び第1勝者ノードaの隣接ノードjの重みベクトルWs1についての更新量ΔWを算出し、更新量ΔWa1を第1勝者ノードaの重みベクトルWa1に加算し、更新量ΔWを隣接ノードjの重みベクトルWs1に加算して、この結果を一時記憶部に格納する。式(33)及び式(34)において、Ms1は、第1勝者ノードaの学習時間を示す。なお、ここでの重みベクトルの変化方法はE-SOINNと同様である(特許文献1の段落0063を参照。)。
S513:老齢辺削除手段31は、一時記憶部に格納されたノード、ノード間の辺、辺の年齢について、第1勝者ノードaと直接的に接続される全ての辺の年齢を所定の値増加し、その結果を一時記憶部に格納する。老齢辺削除手段31は、例えば、第1勝者ノードaと直接的に接続される全ての辺の年齢を1増加し、その結果を一時記憶部に格納する。老齢辺削除手段31は、一時記憶部に格納された辺について、予め設定され一時記憶部に格納された所定の閾値agemaxを超えた年齢を有する辺を削除し、その結果を一時記憶部に格納する。ここで、パラメータagemaxは実験により予め適当な値を算出し一時記憶部に格納される。
S514:入力数判定手段32は、一時記憶部に格納された与えられた入力ベクトルεの総数について、入力された入力ベクトルεの総数が予め設定され一時記憶部に格納された所定の単位数(λ)の倍数であるか否かを判定し、その結果を一時記憶部に格納する。一時記憶部に格納された判定の結果、入力ベクトルの総数が所定の単位数でない場合にはS502へと戻り、次の入力ベクトルεを処理する。入力ベクトルεの総数が所定の単位数となった場合には以下のS515以降に示す処理を実行する。なお、パラメータλは実験により予め適当な値を算出し一時記憶部に格納される。
なお、S515〜S517に示す処理は、情報処理装置1に対して入力された入力ベクトルの総数が所定の単位数となるごとに実行される。即ち、入力ベクトルの総数が所定の数(λ)となるまでの単位学習区間を一周期とすると、S515〜S517に示す処理は、入力ベクトルの総数に応じた所定の周期ごとに定期的に実行される。
S515:負荷平衡化手段33は、一時記憶部に格納されたノード、ノード間の辺、ノードのサブクラスタラベル、ノードの重みベクトル、ノードの学習時間、ノードの密度について、学習時間の値が大きくかつ偏ったノードをノードの学習時間に基づいて検出し、当該検出したノードとその隣接ノードの間に新たなノードを挿入してノード集合Aに追加する。当該検出したノード及びその隣接ノードについてのノードの学習時間をそれぞれ減少し、その結果を一時記憶部に格納する。負荷平衡化手段33は、例えば、上述したS101〜S107に示したノード間の負荷平衡化処理を実行し、その結果を一時記憶部に格納する。これによって、負荷平衡化手段33は、負荷が不均衡な状態にあるノードについてその負荷を平衡化させる。
S516:サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノード間の辺、ノード密度、ノードのサブクラスタラベルについて、ノード集合Aに含まれるノードから局所的に最大のノード密度を有するノードを頂点として探索し、当該探索した頂点に対してそれぞれ異なるサブクラスタラベル(隆起ラベル)を付与し、当該サブクラスタラベル(隆起ラベル)が付与されなかった全てのノードに対してノード密度が最大の隣接ノードと同一のサブクラスタラベル(隆起ラベル)を付与し、その結果を一時記憶部に格納する。また、サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノード間の辺、ノード密度について、頂点のうちでノード密度が所定の閾値よりも大きな頂点を基準としてボロノイ領域を生成し、その結果を一時記憶部に格納する。さらに、サブクラスタ決定手段34は、一時記憶部に格納されたノード、ノード間の辺、ノード密度、ボロノイ領域について、生成したボロノイ領域において、基準とした頂点を含むサブクラスタと基準とした頂点とは異なる他の頂点を含むサブクラスタとが重複領域を有し、かつ、当該重複領域に位置するノードの平均ノード密度の条件を満たす場合に、基準とした頂点を含むサブクラスタのサブクラスタラベルを、他の頂点を含むサブクラスタのサブクラスタラベルとして付与し、その結果を一時記憶部に格納する。サブクラスタ決定手段34は、例えば、上述したS201〜S205、S301〜S305に示したサブクラスタ決定処理を実行し、その結果を一時記憶部に格納する。
S517:ノイズノード削除手段35は、一時記憶部に格納されたノード集合Aに含まれる全てのノードaについて、ノイズノードと見なしたノードを削除し、その結果を一時記憶部に格納する。ノイズノード削除手段35は、一時記憶部に格納されたノード、ノード間の辺、隣接ノードの個数、ノード密度について、例えば、以下のS601〜S604に示す処理を実行し、注目するノードaの隣接ノードの個数及びノード密度に基づいて、注目するノードを削除し、その結果を一時記憶部に格納する。
S601:ノイズノード削除手段35は、一時記憶部に格納されたノード、ノード間の辺、隣接ノードの個数について、注目するノードaの隣接ノードの個数を算出し、その結果を一時記憶部に格納する。そして、ノイズノード削除手段35は、一時記憶部に格納された隣接ノードの個数に応じて、以下のS602〜S604のいずれかの処理を実行する。なお、以下の処理において使用されるパラメータc及びcは、予め適当な値が設定され一時記憶部に格納される。
S602:一時記憶部に格納された隣接ノード数が2の場合、ノイズノード削除手段35は、一時記憶部に格納される例えば式(35)が成立するか否かを判定し、その結果を一時記憶部に格納する。ここで、hは、ノードaのノード密度を示し、Nは、ノード集合Aに含まれるノードの個数を示す。一時記憶部に格納された判定結果について式(35)が成立する場合には、ノイズノード削除手段35は、一時記憶部に格納されたノードについて、該当するノードaを削除し、その結果を一時記憶部に格納する。
S603:一時記憶部に格納された隣接ノード数が1の場合、ノイズノード削除手段35は、ノードaのノード密度hについて、一時記憶部に格納される例えば式(36)が成立するか否かを判定し、その結果を一時記憶部に格納する。一時記憶部に格納された判定結果について式(36)が成立する場合には、ノイズノード削除手段35は、一時記憶部に格納されたノードについて、該当するノードaを削除し、その結果を一時記憶部に格納する。
S604:一時記憶部に格納された隣接ノード数が0の場合(隣接ノードを有しない場合)、ノイズノード削除手段35は、一時記憶部に格納されたノードについて、該当するノードaを削除し、その結果を一時記憶部に格納する。
S518:学習終了判定手段36は、情報処理装置1による学習処理を終了するか否かを判定する。例えば、学習終了判定手段36は、一時記憶部に格納された与えられた入力ベクトルεの総数について、与えられた入力ベクトルεの総数が予め設定され一時記憶部に格納された所定の数LTの倍数であるか否かを判定し、その結果を一時記憶部に格納する。一時記憶部に格納された判定の結果、入力ベクトルの総数がLTの倍数でない場合にはS502へと戻り、次の入力ベクトルεを処理する。一方、入力ベクトルεの総数がLTの倍数となった場合には以下の処理を実行する。なお、学習終了判定の方法はこれに限定されず、ユーザーによって学習終了の指示が与えられるものとしてもよい。
S519:クラス決定手段37は、一時記憶部に格納されたノード、ノード間の辺、ノードのクラスについて、ノード間に生成された辺に基づいて、各ノードが属するクラスを決定し、その結果を一時記憶部に格納する。そして、出力情報表示手段38は、一時記憶部に格納されたノード及びノードのクラスについて、ノードの属するクラスのクラス数、及び各クラスのプロトタイプベクトルを出力する。以上の処理を終了した後、学習を停止する。
クラス決定手段37は、一時記憶部に格納されたノード、ノード間の辺、ノードのクラスについて、例えば以下のS701〜S704に示す処理を実行して各ノードが属するクラスを決定し、その結果を一時記憶部に格納する。
S701:一時記憶部に格納されたノード及びノードのクラスについて、すべてのノードをどのクラスにも属していない状態にし、その結果を一時記憶部に格納する。
S702:一時記憶部に格納されたノード及びノードのクラスについて、いずれのクラスにも属していないノードからノードiをランダムに選択して新しいクラスラベルを付与し、その結果を一時記憶部に格納する。
S703:一時記憶部に格納されたノード、ノード間の辺、ノードのクラスについて、ノードiと「パス」によって接続しているノードをすべて探索し、当該探索したノードにノードiと同じクラスラベルを付与し、その結果を一時記憶部に格納する。
S704:一時記憶部に格納されたノード及びノードのクラスについて、いずれのクラスにも属していないノードが存在する場合にはS702へと進み、全てのノードに対してクラスラベルを付与し終えるまでの間、処理を続ける。
S703において、任意の2つのノードa及びノードbとが「パス」によって接続されるとは、ノードa及びノードb間において、いくつかの辺を通して2つのノードが接続されることを示す。即ち、ノード集合Aに含まれるノードa、ノードb、ノードx(i=1,2,・・・,n)に対して、ノードa及びノードx1間の辺を示す(a,x1)、ノードx1及びノードx2間の辺を示す(x1,x2)、・・・、ノードx及びノードb間の辺を示す(x,b)という辺の連続が存在する場合に、ノードa及びノードb間とがパスによって接続されると呼ぶ。
<実験結果>
続いて、本実施の形態に係る情報処理装置1の有効性を確認するため、3つの人工データセット及び3つの実世界データセットを用いて実験を行う。情報処理装置1(LBSOINN)をE-SOINNと比較するために、いくつかの実験では同一のデータセットを選択した。また、同一の人工データセットI(図1)を情報処理装置1(LBSOINN)及びE-SOINNに適用してノードの学習時間を比較し、さらに、カーネル密度推定(KDE:kernel density estimation)を使用して、ノード間の接続構造に関するノードの密度を推定する。
図7は、E-SOINN及び情報処理装置1(LBSOINN)におけるノードの学習時間を示す。図において、縦軸はノードの学習時間を示し、横軸はノードの個数を示す。E-SOINNによるノードの個数は、ネットワークのいくつかの領域において十分ではなく、それらの領域におけるノードの学習時間は長くかつ偏っている。一方で、E-SOINNとは異なり、情報処理装置1(LBSOINN)におけるノードの学習時間の分布は平衡していることが分かる。
図8は人工データセットIのノードの密度分布を示す。図9は、E-SOINNにおけるノードの密度の推定結果を示し、図10は、情報処理装置1(LBSOINN)におけるノードの密度の推定結果を示す。図8、9、10において、x軸及びy軸はノードが配置される2次元空間を示し、z軸はノード密度を示す。明らかに、E-SOINNは、入力パターンに対する良好な精度を得ていないことが分かる。しかし、E-SOINNでは、ノード密度を使用してクラス間の重複領域を探索するために、入力パターンの接続構造を正確に表現することはとても重要である。これに対して、図10に示したように、情報処理装置1(LBSOINN)では、入力パターンの接続構造を正確に記述することができるため、E-SOINNに比べてより優れた安定性能を有する。
図11に、人工データセットIIを示す。人工データセットIIでは、ノードの密度に関して高密度の重複領域を有する3つのガウス分布を含む。人工データセットIIを使用して、定常環境におけるE-SOINN及び情報処理装置1(LBSOINN)の安定性についての実験を行う。実験では、データセットから入力パターンをランダムに選択して、入力パターンに対して10%のノイズを追加する。パラメータの設定に関して、E-SOINNでは、λ=200、agemax=50、c=0.001、c=1.0に設定する。情報処理装置1(LBSOINN)では、λ、agemax、c、cについてはE-SOINNと同じ値を設定し、γ=1.3、η=1.001、θ=1.3に設定する。
図12(A)〜(J)は、定常環境において時系列にネットワークを学習したときの、人工データセットIIに対する学習結果を示す。図12(A)〜(E)は、100000回、200000回、300000回、400000回、500000回の繰り返しにおけるE-SOINNの学習結果をそれぞれ示す。図12(F)〜(J)は、100000回、200000回、300000回、400000回、500000回の繰り返しにおける情報処理装置1(LBSOINN)の学習結果をそれぞれ示す。明らかに、E-SOINNは、異なるクラスが常に一緒に接続されてしまうために、ノードの接続構造が乱れておりかつ不安定である。
情報処理装置1(LBSOINN)は、上述したサブクラスタ決定手法を使用して、ネットワークに存在する過度に局所的に最大となるノードの発生を回避する。これによって、情報処理装置1(LBSOINN)は、混合クラスをサブクラスタに分割してしまうことによるノードの接続構造の乱れを回避する。人工データセットIIに対する実験は、E-SOINNと比較して情報処理装置1(LBSOINN)がより優れた安定性を有し、かつ、ノード密度が高密度の重複領域を正確に分離できることを示している。後述するように、AT&T画像データセットを使用して、非定常的な学習環境下において、実世界のデータセットによってまた、E-SOINNと比較して情報処理装置1(LBSOINN)がより優れた安定性を有することを確認する。
図13に、E-SOINNの評価において使用された、他の人工データセットを示す。この人工データセットは、2つのガウス分布、2つのリング形状分布、正弦関数分布を含んでいる。入力分布は、入力サンプル数の合計の10%に達するランダムノイズを含んでいる。パラメータの設定に関して、情報処理装置1(LBSOINN)は、λ=100、agemax=100、c=0.001、c=1.0、γ=1.3、η=1.001、θ=1.3に設定する。図14及び図15は、定常環境下及び非定常環境下での情報処理装置1(LBSOINN)によるクラスタリング結果をそれぞれ描写する。図14及び図15の類似性から、情報処理装置1(LBSOINN)は入力データの入力順序に依存していないこと、即ち、E-SOINNと比較してよりも優れた安定性を有することを示している。
実世界での実験の一つとして、情報処理装置1(LBSOINN)をE-SOINNと比較するために、E-SOINNにおいて使用されたデータセットと同一のAT&T画像データセットを選択する。この画像データセットは、40の異なるクラスと、クラスごとの10の異なる画像を含んでいる。これらのクラスは異なる年齢及び人種に関するものである。いくつかのクラスに対して、異なるタイミングで画像が取得されている。顔の表現(開いた/閉じた目、微笑む/微笑んでいない)及び顔の詳細(メガネあり/メガネなし)にはバリエーションがある。全ての画像は、クラスを有する黒色の均一な背景の下で、直立して正面の位置(ある程度の側面の動きに対する耐性を有する。)から撮られている。このデータセットから10クラスを選択し(図16)、最近傍補間法(nearest-neighbor interpolation)を使用して、データセットにおける画像を92×112から23×28へとサンプリングし直す。そして、ガウス法(Gaussian method)を使用することによって、Width=4、σ=2であるガウシアンを用いて画像を平滑化して、特徴ベクトルを得る(図17)。
定常及び非定常環境下におけるE-SOINN及び情報処理装置1(LBSOINN)の性能を実験する。LBSOINNのパラメータは、λ=25、agemax=25、c=0.0、c=1.0、γ=1.3、η=1.001、θ=1.3に設定する。学習を経て、ネットワークからのプロトタイプベクトルを得ることができる。これらのプロトタイプベクトルを使用して、元々の顔画像及び算出される認識率を分類する。情報処理装置1(LBSOINN)は、定常環境下では、96.3%の認識率であり、非定常環境下では、96.5%の認識率である。E-SOINNは、定常環境下では、90.3%の認識率であり、非定常環境下では、96%の認識率である。即ち、E-SOINNと比較して、情報処理装置1(LBSOINN)は、E-SOINNよりも十分に高い認識率を有している。定常環境及び非定常環境における共通性はまた、情報処理装置1(LBSOINN)が入力データの入力順序に依存せず、E-SOINNと比較してより優れた安定性を有することを示している。
E-SOINN及び情報処理装置1(LBSOINN)の安定性を比較するため、E-SOINNと同一の処理を情報処理装置1(LBSOINN)によって実行する。即ち、(1)E-SOINN及び情報処理装置1(LBSOINN)の両方に対して1000回の学習を実行し、(2)クラスの個数の頻度を記録する。なお、クラスの個数の頻度とは、例えば、1000回の実験を行い、情報処理装置1(LBSOINN)の学習結果としてクラスの個数を10とした出力回数が600回である、又は、クラスの個数を9とした出力回数が90回であるときに、この600回や90回の数値を示す。
図18(A)、(B)は、E-SOINNおよび情報処理装置1(LBSOINN)によるクラスの個数の分布をそれぞれ示す。図において、縦軸はクラスの個数の頻度を示し、横軸はクラスの個数を示す。情報処理装置1(LBSOINN)に対するクラスの個数の分布はE-SOINNのものと比べて十分に大きい。そして、クラスの個数が10個となる辺りにおいて、情報処理装置1(LBSOINN)の分布はE-SOINNのものと比べて十分に大きい。さらに、定常環境下における情報処理装置1(LBSOINN)に対するクラスの個数の分布は、非定常環境下におけるクラスの分布にとても類似している。上述した全ての実験結果は、E-SOINNと比較して情報処理装置1(LBSOINN)がより優れた安定性を有することを示している。
次に、2つのテキストデータセット(WebKbデータセット及びR8データセット)を選択して、高次元空間におけるE-SOINN及び情報処理装置1(LBSOINN)の性能を実験する。WebKbは、1997年1月における様々な大学のコンピュータサイエンス部門から、CMUテキスト学習グループのワールドワイド知識ベースプロジェクトによって収集されたWWWページを含んでいる。その8282ページは、生徒、学部、スタッフ、部門、コース、プロジェクトやその他のカテゴリに、人手によって分類されている。本実験では、生徒、学部及びコースのカテゴリのみを選択する。R8データセットは、1つのトピック及びそのクラス(少なくとも1つの学習及び1つの実験例を有する。)を備えた文書を単に考慮する。WebKb及びR8の両方ともに、フィルタリング処理(非特許文献:Khaled M. Hammouda and Mohamed S. Kamel, "Efficient Phrase-Based Document Indexing for Web Document Clustering," IEEE Transactions on Knowledge and Data Engineering, Vol. 16, No. 10, pp. 1279-1296, 2004.を参照。)と、stop wordsの削除(removing)、刈り取り(pruning)及び取り出し(stemming)処理(非特許文献:R. Baeza-Yates and B. Ribeiro-Neto, "Modern Information Retrieval,"Addison-Wesley, 1999.を参照。)を事前に行う。
図19は、異なる各クラスに対して異なるパーセントを入力したときの精度を示す。パラメータの設定に関して、情報処理装置1(LBSOINN)は、λ=25、agemax=25、c=0.0、c=1.0、γ=1.3、η=1.001、θ=1.3に設定する。また、比較のために、線形関数を使用したサポートベクトルマシーン(SVM)の性能についても示す。
WebKbデータセットに対して、情報処理装置1(LBSOINN)及びSVMの精度は、それぞれ81.21%及び84.21%に達する。そして、R8データセットに対しては、情報処理装置1(LBSOINN)及びSVMの精度は、89.71%及び93.34%に達する。情報処理装置1(LBSOINN)の精度は、SVMの精度ほどは良くない。しかしながら、情報処理装置1(LBSOINN)は、オンライン教師なし学習のアプローチに属する。また違いとして、情報処理装置1(LBSOINN)は、限られたデータセットを用いて満足できる精度を得ることができる。この特徴は、情報処理装置1(LBSOINN)を、実世界におけるタスクにより適したものにする。E-SOINNは高次元タスクを扱うことができないために、E-SOINNの性能はとても悪い。この実験は、高次元空間において情報処理装置1(LBSOINN)が十分に実行可能であることを示している。
以上に、本実施の形態に係る情報処理装置1の構成及び動作、さらに、情報処理装置1に対して実験を行い、その効果を説明した。クラスタリングは最も重要なデータ分析手法の一つである。本実施の形態では、オンラインでの教師なし学習に属する負荷平衡型自己増殖型ニューラルネットワーク(LBSOINN)を提案し、これは、高密度の重複クラスを分離することができる。情報処理装置1(LBSOINN)は、E-SOINNと比較して優れた安定性能を有しており、かつ、E-SOINNが有する全ての利点をも備えている。人口データセット及び実データセットにおける実験により、情報処理装置1(LBSOINN)は、ラベル付けされていないノイズ付き知識をクラスタリングする場合に正確な学習結果を得ることができ、また、高次元空間においても効率的に実行可能なことを確認した。このことは、実世界でのオンライン学習タスクに適していることを示している。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上述した実施の形態では、ノードの負荷平衡化処理において、各サブクラスタにおいて最大のノードの学習時間を有するノードのみを探索する場合を例に説明したが、本発明はこれに限定されず、各サブクラスタにおいて相対的に大きなノードの学習時間を有する複数のノードを探索し、当該探索した複数のノードに関して、以降の負荷平衡化処理を実行するものとしてもよい。
また、例えば、上述した実施の形態では、ノードの負荷平衡化処理において、最大のノードの学習時間を有するノードを探索し、当該探索したノードの隣接ノードのうちで最大の学習時間を有する隣接ノードを決定する場合を例に説明したが、本発明はこれに限定されず、他の隣接ノード(例えば、当該探索したノードの隣接ノードのうちで2番目に大きな学習時間を有する隣接ノード)を決定し、当該決定した隣接ノードに関して、以降の負荷平衡化処理を実行するものとしてもよい。
また、例えば、上述した実施の形態では、距離尺度に関して、ユークリッド距離にコサイン距離を組合せる場合を例に説明したが、本発明はこれに限定されず、他の距離尺度(例えば、コサイン距離、マンハッタン距離、フラクショナル距離)を組合せるものとしてもよい。さらに、高次元空間における有効な距離尺度に限定されず、学習しようとする問題に応じた他の距離尺度を組合せるものとしてもよい。
1 情報処理装置
10 コンピュータ
11 CPU
12 ROM
13 RAM
14 バス
15 入出力インターフェイス
16 入力部
17 出力部
18 記憶部
19 通信部
20 ドライブ
201 磁気ディスク
202 光ディスク
203 フレキシブルディスク
204 半導体メモリ
21 入力情報取得手段
22 ノード密度更新判定手段
23 ノード密度算出手段
24 勝者ノード探索手段
25 クラス間ノード挿入判定手段
26 クラス間ノード挿入手段
27 辺接続判定手段
28 辺接続手段
29 勝者ノード学習時間算出手段
30 重みベクトル更新手段
31 老齢辺削除手段
32 入力数判定手段
33 負荷平衡化手段
34 サブクラスタ決定手段
35 ノイズノード削除手段
36 学習終了判定手段
37 クラス決定手段
38 出力情報表示手段

Claims (11)

  1. 多次元ベクトルで記述されるノード及び当該ノード間を接続する辺が配置されるネットワーク構造を有し、
    任意のクラスに属する入力ベクトルを順次入力して、当該入力ベクトルの入力分布構造を学習する情報処理装置において、
    入力される前記入力ベクトルに最も近い距離に位置するノード及び2番目に近い距離に位置するノードを第1勝者ノード及び第2勝者ノードとしてそれぞれ探索する勝者ノード探索手段と、
    前記入力ベクトルと前記第1勝者ノード間の距離及び前記入力ベクトルと前記第2勝者ノード間の距離に基づいて、クラス間ノード挿入を実行するか否かを判定するクラス間ノード挿入判定手段と、
    前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行する場合に、前記入力ベクトルの成分と同一の成分を重みベクトルとして有するクラス間挿入ノードを生成し、当該生成したクラス間挿入ノードを前記ネットワークに挿入するクラス間ノード挿入手段と、
    前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行しない場合に、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続したときに、前記第1勝者ノードについてノードの学習時間を所定の値増加する勝者ノード学習時間算出手段と、
    前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行しない場合に、注目するノードについて当該注目するノードと辺によって直接的に接続されるノードを隣接ノードとして、前記第1勝者ノードの重みベクトル及び前記第1勝者ノードの隣接ノードの重みベクトルをそれぞれ前記入力ベクトルに更に近づけるように更新する重みベクトル更新手段と、
    前記入力ベクトルの総数に応じた所定の周期ごとに、前記ノードの学習時間の値が相対的に大きくかつ偏っているノードを検出し、当該検出したノード及びその隣接ノードの重みベクトルに基づく重みベクトルを有する新たなノードを生成して前記ネットワークに挿入し、前記検出したノードの学習時間及び前記検出したノードの隣接ノードの学習時間をそれぞれ減少し、前記検出したノード及びその隣接ノード間の辺を削除し、前記新たに挿入したノード及び前記検出したノード間と、前記新たに挿入したノード及び前記検出したノードのその隣接ノード間と、に辺をそれぞれ接続する負荷平衡化手段と、を備える、
    ことを特徴とする情報処理装置。
  2. 前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行しない場合に、付与されるノードのサブクラスタラベルに基づいて、前記第1勝者ノード及び前記第2勝者ノードが属するサブクラスタをそれぞれ判定し、当該判定の結果、前記第1勝者ノード及び前記第2勝者ノードが互いに異なるサブクラスタに属する場合には、前記第1勝者ノード及び前記第2勝者ノードのノード密度に関して、前記第1勝者ノードを含むサブクラスタの平均ノード密度を基準とする前記第1勝者ノードについてのノード密度の条件、又は、前記第2勝者ノードを含むサブクラスタの平均ノード密度を基準とする前記第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たすか否かを更に判定する辺接続判定手段と、
    (1)前記辺接続判定手段による判定の結果、前記第1勝者ノード及び前記第2勝者ノードの少なくとも1つがいずれのサブクラスタに属していない、又は、同一のサブクラスタに属する場合には、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続し、若しくは、(2)前記辺接続判定手段による判定の結果、前記第1勝者ノード及び前記第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たす場合には、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続し、前記第1勝者ノード及び前記第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たさない場合には、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続しない辺接続手段と、
    注目するノード及び当該注目するノードの隣接ノードからの平均距離に基づいて、当該注目するノードのノード密度を算出するノード密度算出手段と、
    局所的に最大のノード密度を有するノードを頂点として、当該頂点に対してそれぞれ異なるサブクラスタラベルを付与し、当該サブクラスタラベルが付与されなかった全てのノードに対してノード密度が最大の隣接ノードと同一のサブクラスタラベルを付与し、前記頂点のうちでノード密度が所定の閾値よりも大きな頂点を基準としてボロノイ領域を生成し、当該生成したボロノイ領域において、前記基準とした頂点を含むサブクラスタと前記基準とした頂点とは異なる他の頂点を含むサブクラスタとが重複領域を有し、かつ、当該重複領域に位置するノードの平均ノード密度の条件を満たす場合に、前記基準とした頂点を含むサブクラスタのサブクラスタラベルを、前記他の頂点を含むサブクラスタのサブクラスタラベルとして付与するサブクラスタ決定手段と、を更に備える、
    請求項1に記載の情報処理装置。
  3. ユークリッド距離に基づいてノード間の距離を算出する重み付きの第1の距離算出式と、前記ユークリッド距離とは異なる他の距離尺度に基づいてノード間の距離を算出する重み付きの第2の距離算出式と、を含むノード間距離算出式を更に備え、
    前記ネットワークにおける任意の2つのノード間の前記ユークリッド距離に基づく最小距離値及び最大距離値を用いて前記第1の距離算出式を正規化し、
    前記ネットワークにおける任意の2つのノード間の前記他の距離尺度に基づく最小距離値及び最大距離値を用いて前記第2の距離算出式を正規化し、
    前記入力ベクトルの次元数が増加するに従って、前記第1の距離算出式の重みを減少させ、
    前記ノード間距離算出式を用いて、前記入力ベクトル及び前記ノード間の距離、又は、前記ネットワークにおける任意の2つのノード間の距離を算出する、
    請求項2に記載の情報処理装置。
  4. 前記第2の距離算出式は、コサイン距離に基づいてノード間の距離を算出する、
    請求項3に記載の情報処理装置。
  5. 前記ユークリッド距離に基づく前記2つのノード間の最小距離値及び最大距離値と、前記他の距離尺度に基づく前記2つのノード間の最小距離値及び最大距離値と、のうちで少なくとも1つの値が変化したか否かを確認し、少なくとも1つの値が変化した場合にはノード密度を更新すると判定するノード密度更新判定手段と、を更に備え、
    前記ノード密度算出手段は、
    (1)前記第1の距離算出式及び前記第2の距離算出式をそれぞれ用いて前記第1勝者ノードの隣接ノードからの平均距離のベクトルの各成分を算出し、(2)当該算出した前記第1勝者ノードの前記隣接ノードからの平均距離のベクトルに基づいて前記第1勝者ノードのノード密度のポイント値のベクトルを算出し、(3)当該算出した前記第1勝者ノードの前記ノード密度のポイント値のベクトルに基づいて前記第1勝者ノードのノード密度の累積ポイント値のベクトルを算出し、(4)当該算出した前記第1勝者ノードの前記ノード密度の累積ポイント値のベクトルに基づいて前記第1勝者ノードのノード密度を算出し、(5)前記ノード密度更新判定手段による判定の結果、ノード密度を更新する場合には、変化前後における前記ユークリッド距離に基づく前記2つのノード間の最小距離値及び最大距離値と、変化前後における前記他の距離尺度に基づく前記2つのノード間の最小距離値及び最大距離値と、に基づいて、前記ネットワークに存在する全てのノードについて、注目するノードの前記ノード密度の累積ポイント値のベクトルを更新し、(6)当該更新した前記注目するノードの前記ノード密度の累積ポイント値のベクトルに基づいて前記注目するノードの前記ノード密度を再び算出する、
    請求項3又は4に記載の情報処理装置。
  6. 多次元ベクトルで記述されるノード及び当該ノード間を接続する辺が配置されるネットワーク構造を有し、
    任意のクラスに属する入力ベクトルを順次入力して、当該入力ベクトルの入力分布構造を学習する情報処理装置における情報処理方法であって、
    勝者ノード探索手段が、入力される前記入力ベクトルに最も近い距離に位置するノード及び2番目に近い距離に位置するノードを第1勝者ノード及び第2勝者ノードとしてそれぞれ探索するステップと、
    クラス間ノード挿入判定手段が、前記入力ベクトルと前記第1勝者ノード間の距離及び前記入力ベクトルと前記第2勝者ノード間の距離に基づいて、クラス間ノード挿入を実行するか否かを判定するステップと、
    クラス間ノード挿入手段が、前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行する場合に、前記入力ベクトルの成分と同一の成分を重みベクトルとして有するクラス間挿入ノードを生成し、当該生成したクラス間挿入ノードを前記ネットワークに挿入するステップと、
    勝者ノード学習時間算出手段が、前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行しない場合に、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続したときに、前記第1勝者ノードについてノードの学習時間を所定の値増加するステップと、
    重みベクトル更新手段が、前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行しない場合に、注目するノードについて当該注目するノードと辺によって直接的に接続されるノードを隣接ノードとして、前記第1勝者ノードの重みベクトル及び前記第1勝者ノードの隣接ノードの重みベクトルをそれぞれ前記入力ベクトルに更に近づけるように更新するステップと、
    負荷平衡化手段が、前記入力ベクトルの総数に応じた所定の周期ごとに、前記ノードの学習時間の値が相対的に大きくかつ偏っているノードを検出し、当該検出したノード及びその隣接ノードの重みベクトルに基づく重みベクトルを有する新たなノードを生成して前記ネットワークに挿入し、前記検出したノードの学習時間及び前記検出したノードの隣接ノードの学習時間をそれぞれ減少し、前記検出したノード及びその隣接ノード間の辺を削除し、前記新たに挿入したノード及び前記検出したノード間と、前記新たに挿入したノード及び前記検出したノードのその隣接ノード間と、に辺をそれぞれ接続するステップと、を実行する、
    ことを特徴とする情報処理方法。
  7. 辺接続判定手段が、前記クラス間ノード挿入判定手段による判定の結果、前記クラス間ノード挿入を実行しない場合に、付与されるノードのサブクラスタラベルに基づいて、前記第1勝者ノード及び前記第2勝者ノードが属するサブクラスタをそれぞれ判定し、当該判定の結果、前記第1勝者ノード及び前記第2勝者ノードが互いに異なるサブクラスタに属する場合には、前記第1勝者ノード及び前記第2勝者ノードのノード密度に関して、前記第1勝者ノードを含むサブクラスタの平均ノード密度を基準とする前記第1勝者ノードについてのノード密度の条件、又は、前記第2勝者ノードを含むサブクラスタの平均ノード密度を基準とする前記第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たすか否かを更に判定するステップと、
    辺接続手段が、(1)前記辺接続判定手段による判定の結果、前記第1勝者ノード及び前記第2勝者ノードの少なくとも1つがいずれのサブクラスタに属していない、又は、同一のサブクラスタに属する場合には、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続し、若しくは、(2)前記辺接続判定手段による判定の結果、前記第1勝者ノード及び前記第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たす場合には、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続し、前記第1勝者ノード及び前記第2勝者ノードについてのノード密度の条件のうちの少なくとも1つを満たさない場合には、前記第1勝者ノード及び前記第2勝者ノード間に辺を接続しないステップと、
    ノード密度算出手段が、注目するノード及び当該注目するノードの隣接ノードからの平均距離に基づいて、当該注目するノードのノード密度を算出するステップと、
    サブクラスタ決定手段が、局所的に最大のノード密度を有するノードを頂点として、当該頂点に対してそれぞれ異なるサブクラスタラベルを付与し、当該サブクラスタラベルが付与されなかった全てのノードに対してノード密度が最大の隣接ノードと同一のサブクラスタラベルを付与し、前記頂点のうちでノード密度が所定の閾値よりも大きな頂点を基準としてボロノイ領域を生成し、当該生成したボロノイ領域において、前記基準とした頂点を含むサブクラスタと前記基準とした頂点とは異なる他の頂点を含むサブクラスタとが重複領域を有し、かつ、当該重複領域に位置するノードの平均ノード密度の条件を満たす場合に、前記基準とした頂点を含むサブクラスタのサブクラスタラベルを、前記他の頂点を含むサブクラスタのサブクラスタラベルとして付与するステップと、を更に実行する、
    請求項6に記載の情報処理方法。
  8. 前記情報処理装置は、ユークリッド距離に基づいてノード間の距離を算出する重み付きの第1の距離算出式と、前記ユークリッド距離とは異なる他の距離尺度に基づいてノード間の距離を算出する重み付きの第2の距離算出式と、を含むノード間距離算出式を更に備え、
    前記ネットワークにおける任意の2つのノード間の前記ユークリッド距離に基づく最小距離値及び最大距離値を用いて前記第1の距離算出式を正規化し、
    前記ネットワークにおける任意の2つのノード間の前記他の距離尺度に基づく最小距離値及び最大距離値を用いて前記第2の距離算出式を正規化し、
    前記入力ベクトルの次元数が増加するに従って、前記第1の距離算出式の重みを減少させ、
    前記ノード間距離算出式を用いて、前記入力ベクトル及び前記ノード間の距離、又は、前記ネットワークにおける任意の2つのノード間の距離を算出する、
    請求項7に記載の情報処理方法。
  9. 前記第2の距離算出式は、コサイン距離に基づいてノード間の距離を算出する、
    請求項8に記載の情報処理方法。
  10. ノード密度更新判定手段が、前記ユークリッド距離に基づく前記2つのノード間の最小距離値及び最大距離値と、前記他の距離尺度に基づく前記2つのノード間の最小距離値及び最大距離値と、のうちで少なくとも1つの値が変化したか否かを確認し、少なくとも1つの値が変化した場合にはノード密度を更新すると判定するステップを更に実行し、
    前記ノード密度算出手段は、
    (1)前記第1の距離算出式及び前記第2の距離算出式をそれぞれ用いて前記第1勝者ノードの隣接ノードからの平均距離のベクトルの各成分を算出し、(2)当該算出した前記第1勝者ノードの前記隣接ノードからの平均距離のベクトルに基づいて前記第1勝者ノードのノード密度のポイント値のベクトルを算出し、(3)当該算出した前記第1勝者ノードの前記ノード密度のポイント値のベクトルに基づいて前記第1勝者ノードのノード密度の累積ポイント値のベクトルを算出し、(4)当該算出した前記第1勝者ノードの前記ノード密度の累積ポイント値のベクトルに基づいて前記第1勝者ノードのノード密度を算出し、(5)前記ノード密度更新判定手段による判定の結果、ノード密度を更新する場合には、変化前後における前記ユークリッド距離に基づく前記2つのノード間の最小距離値及び最大距離値と、変化前後における前記他の距離尺度に基づく前記2つのノード間の最小距離値及び最大距離値と、に基づいて、前記ネットワークに存在する全てのノードについて、注目するノードの前記ノード密度の累積ポイント値のベクトルを更新し、(6)当該更新した前記注目するノードの前記ノード密度の累積ポイント値のベクトルに基づいて前記注目するノードの前記ノード密度を再び算出する、
    請求項8又は9に記載の情報処理方法。
  11. 請求項6乃至10いずれか1項に記載の情報処理をコンピュータに実行させることを特徴とするプログラム。
JP2013033176A 2013-02-22 2013-02-22 情報処理装置、情報処理方法及びプログラム Active JP6065318B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013033176A JP6065318B2 (ja) 2013-02-22 2013-02-22 情報処理装置、情報処理方法及びプログラム
US14/769,692 US10558911B2 (en) 2013-02-22 2014-01-27 Information processing apparatus, information processing method, and non-transitory computer readable medium
PCT/JP2014/000390 WO2014129116A1 (ja) 2013-02-22 2014-01-27 情報処理装置、情報処理方法及び非一時的なコンピュータ可読媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013033176A JP6065318B2 (ja) 2013-02-22 2013-02-22 情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014164396A JP2014164396A (ja) 2014-09-08
JP6065318B2 true JP6065318B2 (ja) 2017-01-25

Family

ID=51390924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013033176A Active JP6065318B2 (ja) 2013-02-22 2013-02-22 情報処理装置、情報処理方法及びプログラム

Country Status (3)

Country Link
US (1) US10558911B2 (ja)
JP (1) JP6065318B2 (ja)
WO (1) WO2014129116A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10901996B2 (en) 2016-02-24 2021-01-26 Salesforce.Com, Inc. Optimized subset processing for de-duplication
US10956450B2 (en) * 2016-03-28 2021-03-23 Salesforce.Com, Inc. Dense subset clustering
US10949395B2 (en) 2016-03-30 2021-03-16 Salesforce.Com, Inc. Cross objects de-duplication
US10831787B2 (en) * 2017-06-30 2020-11-10 Sap Se Security of a computer system
CN108682017B (zh) * 2018-04-11 2021-06-18 浙江工业大学 基于Node2Vec算法的超像素图像边缘检测方法
CN109447261B (zh) * 2018-10-09 2023-08-04 北京邮电大学 一种基于多阶邻近相似度的网络表示学习的方法
US11353859B2 (en) * 2019-03-19 2022-06-07 Mitsubishi Electric Research Laboratories, Inc. System and method for anomaly detection in time-varying system operations
EP3825796A1 (de) * 2019-11-22 2021-05-26 Siemens Aktiengesellschaft Verfahren und vorrichtung zum ki-basierten betreiben eines automatisierungssystems
JP7489730B2 (ja) 2020-12-28 2024-05-24 Soinn株式会社 情報処理装置、情報処理方法及びプログラム
JP7511278B2 (ja) 2020-12-28 2024-07-05 Soinn株式会社 情報処理装置、情報処理方法及びプログラム
WO2022145088A1 (ja) * 2020-12-28 2022-07-07 Soinn株式会社 情報処理装置、情報処理方法及び非一時的なコンピュータ可読媒体
JPWO2023166645A1 (ja) * 2022-03-03 2023-09-07
CN115909210B (zh) * 2022-12-02 2023-09-01 北京思想天下教育科技有限公司 一种有效学习时间统计系统
WO2024161441A1 (ja) * 2023-01-30 2024-08-08 Soinn株式会社 情報処理装置、情報処理方法及びプログラム
CN116543310B (zh) * 2023-06-30 2023-10-31 眉山环天智慧科技有限公司 一种基于Voronoi图和核密度的道路线提取方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835901A (en) * 1994-01-25 1998-11-10 Martin Marietta Corporation Perceptive system including a neural network
US9143393B1 (en) * 2004-05-25 2015-09-22 Red Lambda, Inc. System, method and apparatus for classifying digital data
JP5130523B2 (ja) 2007-03-01 2013-01-30 国立大学法人東京工業大学 情報処理装置、情報処理方法、及びプログラム
JP2009074995A (ja) * 2007-09-21 2009-04-09 Univ Of Electro-Communications 移動体情報処理装置、移動体情報処理方法、およびプログラム
JP2013025398A (ja) * 2011-07-15 2013-02-04 Tokyo Institute Of Technology 識別器生成装置、方法及びプログラム、並びにクラス認識器、方法及びプログラム

Also Published As

Publication number Publication date
JP2014164396A (ja) 2014-09-08
US20160004963A1 (en) 2016-01-07
US10558911B2 (en) 2020-02-11
WO2014129116A1 (ja) 2014-08-28

Similar Documents

Publication Publication Date Title
JP6065318B2 (ja) 情報処理装置、情報処理方法及びプログラム
Boukerche et al. Outlier detection: Methods, models, and classification
Dong et al. Learning space partitions for nearest neighbor search
Amini et al. MuDi-Stream: A multi density clustering algorithm for evolving data stream
Lou et al. Matchminer: Efficient spanning structure mining in large image collections
JP3903610B2 (ja) 検索装置、検索方法及び検索プログラムを記録したコンピュータ読み取り可能な記録媒体
Inkaya A parameter-free similarity graph for spectral clustering
Liu et al. Curvdrop: A ricci curvature based approach to prevent graph neural networks from over-smoothing and over-squashing
Amiri et al. Automatic image annotation using semi-supervised generative modeling
Silva et al. An instance selection method for large datasets based on markov geometric diffusion
Hung et al. Extracting rules from optimal clusters of self-organizing maps
Kumar et al. Community-enhanced Link Prediction in Dynamic Networks
JP5130523B2 (ja) 情報処理装置、情報処理方法、及びプログラム
Hosseini et al. Pool and accuracy based stream classification: a new ensemble algorithm on data stream classification using recurring concepts detection
Tohme et al. MESSY Estimation: Maximum-entropy based stochastic and symbolic density estimation
Li An improved K-nearest neighbor algorithm using tree structure and pruning technology
Pisheh et al. Filter-based information-theoretic feature selection
Yogatama et al. Multilingual spectral clustering using document similarity propagation
Kumar et al. Clustering of web usage data using hybrid K-means and PACT Algorithms
JP5130522B2 (ja) 情報処理装置、情報処理方法、プログラム、データ識別装置、及びデータマイニング装置
Peng et al. Survey on kNN
Chanda et al. A novel graph based clustering approach to document topic modeling
Cao et al. An adaptive density clustering algorithm for massive data
Wang et al. An overview of t-SNE optimization algorithms
Cheng et al. Outlier faces detector via efficient cohesive subgraph identification

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160830

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20161020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20161020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161209

R150 Certificate of patent or registration of utility model

Ref document number: 6065318

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250