JP3785049B2 - 区間ルール抽出方法及びプログラム - Google Patents

区間ルール抽出方法及びプログラム Download PDF

Info

Publication number
JP3785049B2
JP3785049B2 JP2001068743A JP2001068743A JP3785049B2 JP 3785049 B2 JP3785049 B2 JP 3785049B2 JP 2001068743 A JP2001068743 A JP 2001068743A JP 2001068743 A JP2001068743 A JP 2001068743A JP 3785049 B2 JP3785049 B2 JP 3785049B2
Authority
JP
Japan
Prior art keywords
output
section
input
rule
sample data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001068743A
Other languages
English (en)
Other versions
JP2002082807A (ja
Inventor
佐藤  誠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001068743A priority Critical patent/JP3785049B2/ja
Publication of JP2002082807A publication Critical patent/JP2002082807A/ja
Application granted granted Critical
Publication of JP3785049B2 publication Critical patent/JP3785049B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、学習済みのニューラルネットから、入力値又はその属する区間から出力の属する区間を識別するための区間ルールを抽出するための区間ルール抽出方法に関する。
【0002】
【従来の技術】
ニューラルネットは、高度な情報処理機能を人工的に実現するために開発されたコンピュータ技術である。すなわち、ニューラルネットワークは、コンピュータを使用しての、脳の神経回路などを模擬した人工知能の技術であり、情報を入力するための入力素子の集まりである入力層、この入力から答えがどのような値になるのかを出力する出力素子の集まりである出力層、およびそれらの層の中間にある中間素子の集まりである中間層から構成され、各層の各素子は荷重値パラメータを持つ多くの結合によって連結しあっている。
【0003】
ニューラルネットは、属性によって表される入力データと、その入力データに対するニューラルネットの望ましい出力データに基づいて荷重値パラメータを修正する学習処理により、高度な情報処理機能を獲得することができる。
【0004】
しかし、学習されたニューラルネットが高度な情報処理機能を有していても、ニューラルネットの荷重値を見ただけでは、ニューラルネットによってどのような機能が学習されたのか分からないため、エキスパートシステムにおける知識獲得分野や、データマイニング分野においては、人間に理解しやすい形でニューラルネットが学習によって獲得した機能をルールとして取り出す方法が必要とされている。そのため、ニューラルネットからルールを抽出する手法として、例えば、LuMin Fu「Rule Learning by Searching on adapted nets」 Proceedings of the National Conference on Artificial Intelligence(1991)や、Geoffrey G.Towell「Extracting Refined Rules from Knowledge-Based Neural Networks」 Machine Learning13(1993)、R.Setiono「Understanding Neural Networks via Rule Extraction」 Proceedings of IJCAI’95、M.Mar Abad Grau「A Fast Method for Rule Extraction in Neural Networks」 Proceedings of ICNN’98、特開平7-234852号などが知られているが、これらは結論部分が区間であるルールが得られない。
【0005】
区間ルールを抽出する手法としては、Sebastian B.Thrun「Extracting Provably Correct Rules from Artificial Neural Networks」が知られている。しかし、この方法は区間の境界線を決定するためにランダムサーチが必要であり、素子数や階層数の多いニューラルネットになると、計算量が膨大になるため適用は困難である。
【0006】
【発明が解決しようとする課題】
上記のように、学習済みのニューラルネットから、ニューラルネットがどのような機能を学習したのかをルールの形で抽出したいというニーズがあり、区間ルールでないルールを抽出できる方法は多く提案されているものの、従来の区間ルールを抽出する方法はランダムサーチが必要なため、大規模な問題への適用が困難であるという問題点があった。
【0007】
本発明は、上記事情を考慮してなされたもので、大規模な問題に対して適用することも可能とするために、対象とするニューラルネットについて、区間ルールの境界線を効率的な計算量で計算でき、精度のよい区間ルールを抽出可能な区間ルール抽出方法を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明は、出力値生成手段、分割手段、中間・出力区間ルール抽出手段、入力・中間区間ルール抽出手段及び入力・出力区間ルール生成手段を備え、入力素子、中間素子及び出力素子を持つ学習済みのニューラルネットを対象として、該ニューラルネットの入力素子の入力値又はその値の属する区間から該ニューラルネットの出力素子の出力値の属する区間への関係を示す区間ルールを抽出するための区間ルール抽出装置における区間ルール抽出方法において、前記出力値生成手段により、複数のサンプルデータの各々について、当該サンプルデータを前記ニューラルネットの入力素子に入力した場合における各々の入力素子、中間素子及び出力素子の出力値を生成する出力値生成ステップと、前記分割手段により、前記複数のサンプルデータの各々に対応する前記出力素子の出力値に基づいて、該出力素子出力値の取る範囲を複数の出力区間に分割する分割ステップと、前記中間・出力区間ルール抽出手段により、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する前記中間素子の出力値と前記出力素子の出力値の属する前記出力区間との間の対応関係に基づいて、前記中間素子の出力値の取る範囲を複数の中間区間に分割するとともに、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する前記中間素子の出力値の属する中間区間と前記出力素子の出力値の属する出力区間との間の対応関係に基づいて、前記ニューラルネットにおける前記中間区間から前記出力区間への入出力関係を中間・出力区間ルールとして抽出する中間・出力区間ルール抽出ステップと、前記入力・中間区間ルール抽出手段により、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する前記入力素子の出力値と前記中間素子の出力値の属する前記中間区間との間の対応関係に基づいて、前記入力素子の出力値の取る範囲を複数の入力区間に分割するとともに、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する前記入力素子の出力値の属する入力区間と前記中間素子の出力値の属する中間区間との間の対応関係に基づいて、前記ニューラルネットにおける前記入力区間から前記中間区間への入出力関係を入力・中間区間ルールとして抽出する入力・中間区間ルール抽出ステップと、前記入力・出力区間ルール生成手段により、前記中間・出力区間ルール前記入力・中間区間ルールを代入することによって、前記ニューラルネットにおける前記入力区間から前記出力区間への入出力関係を入力・出力区間ルールとして生成する入力・出力区間ルール生成ステップとを有することを特徴とする。
【0009】
本発明によれば、サンプルデータに対するニューラルネットの各素子の出力値であるパターンデータに基づいて、ニューラルネットの出力素子の分割区間を決定し、ある層の区間分割をもとに離散化されたパターンデータを使って、その層より入力層側に近い隣接する層の区間分割を生成し、その層からルールを抽出するという処理を入力層まで行い、最後に合成するので、探索を用いずに短時間で精度の良いルールを抽出できる。
【0010】
また、ユーザからの指示入力に基づいて前記出力区間分割を生成するようにすれば、ユーザが興味を持っているニューラルネットの出力の範囲を満たすような入力の範囲をルールとして取り出すことができる。あるいは、クラスタリングを用いた方法によってニューラルネットの出力素子の分割区間を決定すれば、ニューラルネットの出力を自動的に分割し、パターンデータの性質を反映したルールを取り出すことができる。
【0011】
また、分類木を用いた方法によって中間素子の分割区間、入力素子の分割区間を決定すれば、分類木はサンプルデータを判別するための境界条件を高速に生成できるので、分割区間を効率的に決定できる。また、既存の分類木生成方法は、連続変数入力、離散変数入力、およびそれらの混合した入力を扱えるので、入力部分に連続変数や離散変数が混在するパターンデータからもルールを抽出できる。さらに、分類木の枝刈りによってルールの複雑さを抑えることができる。
【0012】
また、本発明は、出力値生成手段、分割手段、第1の抽出手段、第2の抽出手段、第3の抽出手段及び入力・出力区間ルール生成手段を備え、第1層を構成する入力素子、第2層から第n−1(nは4以上)層までを構成する中間素子及び第n層を構成する出力素子を持つ学習済みのニューラルネットを対象として、該ニューラルネットの入力素子の入力値又はその値の属する区間から該ニューラルネットの出力素子の出力値の属する区間への関係を示す区間ルールを抽出するための区間ルール抽出装置における区間ルール抽出方法において、前記出力値生成手段により、複数のサンプルデータの各々について、当該サンプルデータを前記ニューラルネットの第1層の素子に入力した場合における各々の第1層から第n層までの素子の出力値を生成する出力値生成ステップと、前記分割手段により、前記複数のサンプルデータの各々に対応する前記第n層の素子の出力値に基づいて、該第n層の素子の出力値の取る範囲を複数の出力区間に分割する分割ステップと、前記第1の抽出手段により、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する第n−1層の素子の出力値と第n層の出力素子の出力値の属する出力区間との間の対応関係に基づいて、第n−1層の素子の出力値の取る範囲を複数の第n−1層区間に分割するとともに、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する第n−1層の素子の出力値の属する第n−1層区間と第n層の素子の出力値の属する出力区間との間の対応関係に基づいて、前記ニューラルネットにおける第n−1層区間から出力区間への入出力関係を第n−1の区間ルールとして抽出する第1の抽出ステップと、前記第2の抽出手段により、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する第i−1層の素子の出力値と第i層の素子の出力値の属する第i層区間との間の対応関係に基づいて、第i−1層の素子の出力値の取る範囲を複数の第i−1層区間に分割するとともに、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する第i−1層の素子の出力値の属する第i−1層区間と第i層の素子の出力値の属する第i層区間との間の対応関係に基づいて、前記ニューラルネットにおける第i−1層区間から第i層区間への入出力関係を第i−1の区間ルールとして抽出する処理を、iについてn−1をはじめとして3になるまで1ずつ減じながら逐次的に繰り返し行う第2の抽出ステップと、前記第3の抽出手段により、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する第1層の素子の出力値と第2層の出力素子の出力値の属する第2層区間との間の対応関係に基づいて、第1層の素子の出力値の取る範囲を複数の入力区間に分割するとともに、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する第1層の素子の出力値の属する入力区間と第2層の素子の出力値の属する第2層区間との間の対応関係に基づいて、前記ニューラルネットにおける入力区間から第2層区間への入出力関係を第1の区間ルールとして抽出する第3の抽出ステップと、前記入力・出力区間ルール生成手段により、前記第n−1の区間ルールへ、前記第n−2の区間ルールから前記第1の区間ルールまでを逐次代入することによって、前記ニューラルネットにおける前記入力区間から前記出力区間への入出力関係を入力・出力区間ルールとして生成する入力・出力区間ルール生成ステップとを有することを特徴とする。このように、中間層を複数層持つニューラルネットについても、同様の効果が得られる。
【0013】
なお、区間ルール抽出方法に係る発明は、区間ルール抽出装置に係る発明としても成立する。
また、装置または方法に係る本発明は、コンピュータに当該発明に相当する手順を実行させるための(あるいはコンピュータを当該発明に相当する手段として機能させるための、あるいはコンピュータに当該発明に相当する機能を実現させるための)プログラムを記録したコンピュータ読取り可能な記録媒体としても成立する。
【0014】
【発明の実施の形態】
以下、図面を参照しながら発明の実施の形態を説明する。
【0015】
図1に、本発明の一実施形態に係る区間ルール抽出装置の構成例を示す。
【0016】
図2に、本区間ルール抽出装置の処理手順の一例を示す。
【0017】
図1に示されるように、この区間ルール抽出装置は、サンプルデータ記憶部101、学習済みニューラルネット記憶部102、パターンデータ生成部103、パターンデータ記憶部104、出力区間分割部105、出力区間分割記憶部106、中間・出力区間ルール抽出部107、入力・中間区間ルール抽出部108、入力・中間区間ルール記憶部109、中間・出力区間ルール記憶部110、ルール合成部111、入力・出力区間ルール記憶部112を備えている。
【0018】
この区間ルール抽出装置は、ソフトウェアによって実現することができる(すなわち計算機上でソフトウェアを実行する形で実現することができる)。その際、そのソフトウェアの一部または全部の機能をチップ化あるいはボード化して該計算機に組み込んで実現することもできる。あるいは、この区間ルール抽出装置を専用のハードウェアとして構成することも可能である。
【0019】
なお、本区間ルール抽出装置の処理においてユーザの操作を介入させる形態をとる場合には、ユーザの指示入力等を受け付けるなどの機能を提供するGUI等の手段が用いられる。
【0020】
サンプルデータ記憶部101、学習済みニューラルネット記憶部102、パターンデータ記憶部104、出力区間分割記憶部106、入力・中間区間ルール記憶部109、中間・出力区間ルール記憶部110、入力・出力区間ルール記憶部112は、いずれも、例えばハードディスクや光ディスクや半導体メモリなどの記憶装置によって構成される。なお、各記憶部は、別々の記憶装置によって構成されていてもよいし、それらの全部または一部が同一の記憶装置によって構成されていてもよい。
【0021】
もちろん、本区間ルール抽出装置にネットワーク通信装置を付加して、外部とデータのやり取りができるようにしてもよい。
【0022】
さて、図1において、サンプルデータ記憶部101には、区間ルール抽出のための処理に供されるサンプルデータが格納される。なお、サンプルデータがどのようにして作成あるいは収集されたものであるかについては特に限定されない。また、サンプルデータは、ニューラルネットの学習に用いられたデータと一部又は全部が重複していても構わないし、ニューラルネットの学習に用いられたデータと異なるものであってもよい。
【0023】
学習済みニューラルネット記憶部102には、区間ルール抽出の対象となる学習済みのニューラルネットのデータが格納される。
【0024】
パターンデータ生成部103は、サンプルデータ記憶部101からサンプルデータを取り出し、学習済みニューラルネット記憶部102から学習済みニューラルネットのデータを取り出し、ニューラルネットの各素子の出力値であるパターンデータを生成する(ステップS1)。パターンデータ生成部103によって生成されたパターンデータは、パターンデータ記憶部104に格納される。
【0025】
出力区間分割部105は、パターンデータ記憶部104に格納されたパターンデータを取り出し、出力区間分割を生成する(ステップS2)。出力区間分割部105によって生成された出力区間分割のデータは、出力区間分割記憶部106に格納される。
【0026】
この出力区間分割処理には、例えば、(1)ユーザから指定されたニューラルネットの出力の範囲を取り出す方法(例えばユーザは興味を持っている1または複数の範囲を指定することができる)、(2)パターンデータの出力素子部分をクラスタリングし、隣接するクラスタとクラスタの境界線を出力区間分割として取り出す方法、などの種々の方法が可能である。
【0027】
出力区間分割処理の方法としては、1つの方法のみを用いるものとしてもよいし、複数の方法からユーザが適宜選択可能としてもよい。
【0028】
中間・出力区間ルール抽出部107は、出力区間分割記憶部106に格納されている出力区間分割と、パターンデータ記憶部104に格納されているパターンデータとを取り出し、パターンデータの中間素子部分とパターンデータの出力素子部分との関係を、図3に例示するような形の区間ルールとして抽出する(ステップS3)。中間・出力区間ルール抽出部107によって抽出された中間・出力区間ルールのデータは、中間・出力区間ルール記憶部110に格納される。
【0029】
中間・出力区間ルール抽出処理は、例えば、次のようにする。まず、パターンデータのうち中間層部分を説明変数とし、出力層部分を出力区間分割記憶部106に格納された出力区間分割を基に離散化したものを非説明変数として、分類木を作成する。次に、分類木中で分類に利用された境界線を用いて中間層空間を複数の領域に分類する。そして、分割された各領域について、その領域を構成する区間を条件部とし、その領域内に含まれるサンプルデータの非説明変数が最も多く含まれる区間を結論部としたルールを抽出する(最も多く含まれる区間が複数ある場合には、予め定められた方法によって一つを選択すればよい)。例えば、図4に示すように、ある素子の入力1の区間がBで且つ入力2の区間がBである場合に、出力が区間1〜3にばらついたときは、最も多い区間2を採用する。
【0030】
入力・中間区間ルール抽出部108は、中間・出力区間ルール記憶部110に格納されている中間・出力区間ルールと、パターンデータ記憶部104に格納されているパターンデータとを取り出し、パターンデータの入力素子部分とパターンデータの中間素子部分との関係を、区間ルールとして抽出する(ステップS4)。入力・中間区間ルール抽出部108によって抽出された入力・中間区間ルールのデータは、入力・中間区間ルール記憶部109に格納される。
【0031】
入力・中間区間ルール抽出処理は、例えば、次のようにする。すなわち、中間・出力区間ルール抽出処理での例と同様、まず、パターンデータのうち入力層部分を説明変数とし、中間層部分を中間・出力区間ルール記憶部110に格納された中間・出力区間ルールで用いられている中間区間分割を基に離散化したものを非説明変数として、分類木を作成する。次に、分類木中で分類に利用された境界線を用いて入力層空間を複数の領域に分類する。そして、分割された各領域について、その領域を構成する区間を条件部とし、その領域内に含まれるサンプルデータの非説明変数が最も多く含まれる区間を結論部としたルールを抽出する。
【0032】
ルール合成部111は、入力・中間区間ルール記憶部109に格納されている入力・中間区間ルールと、中間・出力区間ルール記憶部110に格納されている中間・出力区間ルールとを取り出し、中間・出力区間ルールに入力・中間区間ルールを代入して合成することによって、入力・出力区間ルールを生成する(ステップS5)。ルール合成部111によって生成された入力・出力区間ルールのデータは、入力・出力区間ルール記憶部112に格納される。
【0033】
以下では、本実施形態の区間ルール抽出装置について、具体例を用いつつ説明する。
【0034】
なお、ここでは、本発明の理解を容易にするために、1入力1出力のニューラルネットを例にとって説明するとともに、図4のような出力の属する区間のばらつきが発生しない結果となった例を使って説明する。もちろん、本発明は、多入力1出力のニューラルネット、1入力多出力のニューラルネット、多入力多出力のニューラルネットにも適用可能である。また、図4のような出力の属する区間のばらつきが発生した場合には、前述したように例えば最も多く含まれる区間を採用するなどすればよい。
【0035】
図5に、1入力・1出力の3層ニューラルネットの例を示す。図5において、i1、i2は、入力素子、o1は出力素子、h1、h2、h3は、中間素子である。なお、図5の例では、入力素子i2と中間素子h3には定数1が入力されるものとしている。
【0036】
図6に、図5に示したニューラルネットの荷重値パラメータの例を示す。図6において、例えば、i1行h1列の数値(15.41)は、入力素子iと中間素子h1との間の結合荷重値を表す。
【0037】
本実施形態では、入力1の値を0.0〜1.0まで0.05刻みでサンプルすることによって得られる21個のデータをサンプルデータとし、該サンプルデータの各データをそれぞれ入力とした場合の各素子の出力の集合をパターンデータとする。
【0038】
図7に、本具体例のニューラルネットとサンプルデータを基に、パターンデータ生成部103によって生成されたパターンデータの例を示す。ここで、「パターンNo」は、事例番号に相当する。このようなパターンデータに基づいて、出力区間、中間区間、入力区間を分割していく。
【0039】
パターンデータが生成されたならば、次に、出力区間分割部105により出力区間分割処理を行う。
【0040】
出力区間を自動決定する際には、例えば、K−Means法(「統計学事典(p.389) 竹内哲編 東洋経済新報社 ISBN4-492-01038-6」)というよく知られたクラスタリング手法を用いてクラスタを作成し、クラスタ間の境界線を基に分割を生成し、パターンデータの出力部分を離散化する。境界が0.52であった場合におけるパターンデータとその分割結果の例を図8(a),(b)に示す。また、図10のテーブルの初段目に、得られた出力区間分割の例を示す。
【0041】
なお、ユーザ指定によって出力区間を分割する場合には、例えば、図7あるいは図8のような情報を表示画面に表示し、ユーザに区間数や各区間の両端の値などを入力させるようにしてもよい。また、その際に、ユーザ指定に従って図7あるいは図8のような情報を区間が識別できるように色分けなどして呈示し、ユーザに決定ボタンまたは変更ボタンなどを押させるようにしてもよい。
【0042】
次に、中間・出力区間ルール抽出部107により中間・出力区間ルール抽出処理を行う。
【0043】
中間区間については、例えばC4.5(「AIによるデータ解析 J.R.キンラン著 古川康一訳 (株)凸版印刷 ISBN4-8101-8920-1」)というよく知られた分類木生成手法などを用いて分類木を作成し、分類木中で用いられた境界線を基に分割する。
【0044】
図9(a)に、C4.5によって作成された出力素子o1の分類木の例を示す。この例では、中間素子h2についてクラスタ間の境界として0.33が使用され、中間素子h1についてクラスタ間の境界として0.51が使用されている。この結果、例えば、中間素子h1について図10のテーブルの2段目に示すような出力区間分割が得られ、中間素子h2について同じく3段目に示すような出力区間分割が得られ、そして、各区間内に含まれるパターンデータの最も頻度の高い関係をルールとして抽出することによって、図11(a)に示すような中間・出力区間ルールが得られる。
【0045】
次に、入力・中間区間ルール抽出部108により入力・中間区間ルール抽出処理を行う。
【0046】
入力区間については、中間区間と同様に、例えばC4.5などを用いて分類木を作成し、分類木中で用いられた境界線を基に分割する。
【0047】
図9の(b)にC4.5によって作成された中間素子h1の分類木の例を示し、(c)にC4.5によって作成された中間素子h2の分類木の例を示す。(b)ではクラスタ間の境界として0.78が使用され、(c)ではクラスタ間の境界として0.28が使用されている。この結果、例えば、入力素子i1について図10のテーブルの4段目に示すような出力区間分割が得られ、そして、図11(b)に示すような入力・中間区間ルールが得られる。
【0048】
次に、ルール合成部111によりルール合成処理を行う。例えば、図11の(a)のような中間・出力区間ルールに(b)のような入力・中間区間ルールを代入して合成することによって、(c)のような入力・出力区間ルールが生成される。図11(c)に例示した入力・出力区間ルールをみると、図7に示したパターンデータの傾向に従った区間ルールが抽出されていることが確認できる。
【0049】
なお、上記では、各々の区間ルールの抽出を必要な区間分割が得られた時点で行ったが、その代わりに、全各区間ルールの抽出を最後にまとめて行ってもよい。
【0050】
以上では、中間層が1層であるニューラルネットワークについて説明してきたが、中間層が2層以上のニューラルネットワークに対しても本発明は適用可能である。
【0051】
例えば、中間層が第1層から第2層まで2層あるとすると、サンプルデータに対するニューラルネットの各素子の出力値を得て各素子のパターンデータを生成し、該パターンデータに基づいて、ニューラルネットの出力素子からの出力を複数の区間に分割して出力区間分割を生成し、該パターンデータ及び該出力区間分割に基づいて、ニューラルネットの第1層の中間素子と第2層の中間素子と間の入出力関係を第2の区間ルールとして抽出し、該パターンデータ及び該第2の区間ルールに基づいて、該ニューラルネットの入力素子と第1層の中間素子との間の入出力関係を第1の区間ルールとして抽出し、該第1の区間ルールと該第2の区間ルールを合成することによって、該ニューラルネットの入力素子と出力素子との間の入出力関係を入力・出力区間ルールとして生成することができる。
【0052】
また、中間層がn−2層あるとすると、入力層を第1層、中間層を第2層から第n−1層、出力層を第n層として、パターンデータに基づく出力区間分割、パターンデータと出力区間分割に基づく第n−1層の素子と第n層すなわち出力層の素子との間での第n−1の区間分割/ルール抽出、パターンデータと第n−1の区間ルールに基づく第n−2層の素子と第n−1層の素子との間での第n−2の区間分割/ルール抽出、…、パターンデータと第3の区間ルールに基づく第2層の素子と第3層の素子との間での第2の区間分割/ルール抽出、パターンデータと第2の区間ルールに基づく第1層すなわち入力層の素子と第2層の素子との間での第1の区間分割/ルール抽出、全ルール合成による入力・出力区間ルールの生成の順に行えばよい。
【0053】
これらの場合について、全区間ルールの抽出を最後にまとめて行ってもよい点も同様である。
【0054】
以上説明したように本実施形態によれば、従来の方法のように探索を用いず、サンプルデータに基づき分割区間を決定するので、分割区間を効率的に決定することが可能である。例えばC4.5のような分類木生成方法を用いると、ニューラルネットの素子数×パターンデータ数×log(パターンデータ数)の計算量でルールを抽出可能である。
また、各素子ごとの入出力関係を区間ルールとして抽出しその後に合成するので、ニューラルネットの入出力部分しか考慮に入れない場合に比較して、精度のよい区間ルールを抽出することが可能である。
そして、出力区間の生成にクラスタリング手法を用いることにより、パターンデータの固まり具合に対応したルールを自動的に抽出することが可能となる。
さらに、中間区間や入力区間の生成に分類木を用いることにより、連続・離散混合入力を扱うことが可能となり、分類木の枝刈りによってルールの複雑さを抑えることが可能となる。
【0055】
なお、以上の各機能は、ソフトウェアとしても実現可能である。
【0056】
また、本実施形態は、コンピュータに所定の手段を実行させるための(あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるための)プログラムを記録したコンピュータ読取り可能な記録媒体としても実施することもできる。
【0057】
なお、本実施形態で例示した構成は一例であって、それ以外の構成を排除する趣旨のものではなく、例示した構成の一部を他のもので置き換えたり、例示した構成の一部を省いたり、例示した構成に別の機能を付加したり、それらを組み合わせたりすることなどによって得られる別の構成も可能である。また、例示した構成と論理的に等価な別の構成、例示した構成と論理的に等価な部分を含む別の構成、例示した構成の要部と論理的に等価な別の構成なども可能である。また、例示した構成と同一もしくは類似の目的を達成する別の構成、例示した構成と同一もしくは類似の効果を奏する別の構成なども可能である。
また、本実施形態内において、各種構成部分についての各種バリエーションは、適宜組み合わせて実施することが可能である。
また、各実施形態は、装置全体としての発明、装置内部の構成部分についての発明、またはそれらに対応する方法の発明等、種々の観点、段階、概念またはカテゴリに係る発明を包含・内在するものである。
従って、この発明の実施の形態に開示した内容からは、例示した構成に限定されることなく発明を抽出することができるものである。
【0058】
本発明は、上述した実施の形態に限定されるものではなく、その技術的範囲において種々変形して実施することができる。
【0059】
【発明の効果】
本発明によれば、ニューラルネットから精度の良い区間ルールを効率的に抽出することが可能になる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る区間ルール抽出装置の構成例を示す図
【図2】同区間ルール抽出装置の処理手順の一例を示すフローチャート
【図3】抽出された区間ルール例を示す図
【図4】ルール抽出について説明するための図
【図5】ニューラルネットの構造例を示す図
【図6】ニューラルネットの荷重値パラメータの例を示す図
【図7】パターンデータ例を示す図
【図8】パターンデータの離散化について説明するための図
【図9】各素子の分類木について説明するための図
【図10】得られた各分割の例を示す図
【図11】得られた各区間ルールの例を示す図
【符号の説明】
101…サンプルデータ記憶部
102…学習済みニューラルネット記憶部
103…パターンデータ生成部
104…パターンデータ記憶部
105…出力区間分割部
106…出力区間分割記憶部
107…中間・出力区間ルール抽出部
108…入力・中間区間ルール抽出部
109…入力・中間区間ルール記憶部
110…中間・出力区間ルール記憶部
111…ルール合成部
112…入力・出力区間ルール記憶部
i1,i2…入力素子
h1〜h3…中間素子
o1…出力素子

Claims (6)

  1. 出力値生成手段、分割手段、中間・出力区間ルール抽出手段、入力・中間区間ルール抽出手段及び入力・出力区間ルール生成手段を備え、入力素子、中間素子及び出力素子を持つ学習済みのニューラルネットを対象として、該ニューラルネットの入力素子の入力値又はその値の属する区間から該ニューラルネットの出力素子の出力値の属する区間への関係を示す区間ルールを抽出するための区間ルール抽出装置における区間ルール抽出方法において、
    前記出力値生成手段により、複数のサンプルデータの各々について、当該サンプルデータを前記ニューラルネットの入力素子に入力した場合における各々の入力素子、中間素子及び出力素子の出力値を生成する出力値生成ステップと、
    前記分割手段により、前記複数のサンプルデータの各々に対応する前記出力素子の出力値に基づいて、該出力素子出力値の取る範囲を複数の出力区間に分割する分割ステップと、
    前記中間・出力区間ルール抽出手段により、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する前記中間素子の出力値と前記出力素子の出力値の属する前記出力区間との間の対応関係に基づいて、前記中間素子の出力値の取る範囲を複数の中間区間に分割するとともに、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する前記中間素子の出力値の属する中間区間と前記出力素子の出力値の属する出力区間との間の対応関係に基づいて、前記ニューラルネットにおける前記中間区間から前記出力区間への入出力関係を中間・出力区間ルールとして抽出する中間・出力区間ルール抽出ステップと、
    前記入力・中間区間ルール抽出手段により、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する前記入力素子の出力値と前記中間素子の出力値の属する前記中間区間との間の対応関係に基づいて、前記入力素子の出力値の取る範囲を複数の入力区間に分割するとともに、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する前記入力素子の出力値の属する入力区間と前記中間素子の出力値の属する中間区間との間の対応関係に基づいて、前記ニューラルネットにおける前記入力区間から前記中間区間への入出力関係を入力・中間区間ルールとして抽出する入力・中間区間ルール抽出ステップと、
    前記入力・出力区間ルール生成手段により、前記中間・出力区間ルール前記入力・中間区間ルールを代入することによって、前記ニューラルネットにおける前記入力区間から前記出力区間への入出力関係を入力・出力区間ルールとして生成する入力・出力区間ルール生成ステップとを有することを特徴とする区間ルール抽出方法。
  2. 前記分割ステップにおいては、前記出力値生成ステップにおいて前記出力値生成手段により生成された、前記複数のサンプルデータの各々に対応する前記出力素子の出力値をクラスタリングし、これによって得られたクラスタ間の境界線に基づいて、前記分割を行うことを特徴とする請求項1に記載の区間ルール抽出方法。
  3. 前記中間・出力区間ルール抽出ステップにおいては、
    前記分割ステップにおける前記出力区間に係る分割の結果に基づいて、前記出力値生成ステップにおいて前記出力値生成手段により生成された、前記複数のサンプルデータの各々に対応する前記出力素子の出力値を離散化し、
    中間・出力素子間の入出力パターンを分類する分類木を生成し、
    分類木中で用いられる判定条件に基づいて、各中間素子の出力値について前記中間区間に係る分割を行い
    この分割によって決定されるそれぞれの領域について、当該領域を構成する中間区間を条件部とし、当該領域に含まれる前記出力素子の出力値の属する出力区間のうち最も多いものを結論部とするルールを抽出し、これを前記入力・中間区間ルールとすることを特徴とする請求項1に記載の区間ルール抽出方法。
  4. 前記入力・中間区間ルール抽出ステップにおいては、
    前記中間・出力区間ルール抽出ステップにおける前記中間区間に係る分割の結果に基づいて、前記出力値生成ステップにおいて前記出力値生成手段により生成された、前記複数のサンプルデータの各々に対応する前記中間素子の出力値を離散化し、
    入力・中間素子間の入出力パターンを分類する分類木を生成し、
    分類木中で用いられる判定条件に基づいて、各入力素子の出力値について前記入力区間に係る分割を行い
    この分割によって決定されるそれぞれの領域について、当該領域を構成する入力区間を条件部とし、当該領域に含まれる前記中間素子の出力値の属する中間区間のうち最も多いものを結論部とするルールを抽出し、これを前記入力・中間区間ルールとすることを特徴とする請求項1に記載の区間ルール抽出方法。
  5. 出力値生成手段、分割手段、第1の抽出手段、第2の抽出手段、第3の抽出手段及び入力・出力区間ルール生成手段を備え、第1層を構成する入力素子、第2層から第n−1(nは4以上)層までを構成する中間素子及び第n層を構成する出力素子を持つ学習済みのニューラルネットを対象として、該ニューラルネットの入力素子の入力値又はその値の属する区間から該ニューラルネットの出力素子の出力値の属する区間への関係を示す区間ルールを抽出するための区間ルール抽出装置における区間ルール抽出方法において、
    前記出力値生成手段により、複数のサンプルデータの各々について、当該サンプルデータを前記ニューラルネットの第1層の素子に入力した場合における各々の第1層から第n層までの素子の出力値を生成する出力値生成ステップと、
    前記分割手段により、前記複数のサンプルデータの各々に対応する前記第n層の素子の出力値に基づいて、該第n層の素子の出力値の取る範囲を複数の出力区間に分割する分割ステップと、
    前記第1の抽出手段により、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する第n−1層の素子の出力値と第n層の出力素子の出力値の属する出力区間との間の対応関係に基づいて、第n−1層の素子の出力値の取る範囲を複数の第n−1層区間に分割するとともに、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する第n−1層の素子の出力値の属する第n−1層区間と第n層の素子の出力値の属する出力区間との間の対応関係に基づいて、前記ニューラルネットにおける第n−1層区間から出力区間への入出力関係を第n−1の区間ルールとして抽出する第1の抽出ステップと、
    前記第2の抽出手段により、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する第i−1層の素子の出力値と第i層の素子の出力値の属する第i層区間との間の対応関係に基づいて、第i−1層の素子の出力値の取る範囲を複数の第i−1層区間に分割するとともに、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する第i−1層の素子の出力値の属する第i−1層区間と第i層の素子の出力値の属する第i層区間との間の対応関係に基づいて、前記ニューラルネットにおける第i−1層区間から第i層区間への入出力関係を第i−1の区間ルールとして抽出する処理を、iについてn−1をはじめとして3になるまで1ずつ減じながら逐次的に繰り返し行う第2の抽出ステップと、
    前記第3の抽出手段により、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する第1層の素子の出力値と第2層の出力素子の出力値の属する第2層区間との間の対応関係に基づいて、第1層の素子の出力値の取る範囲を複数の入力区間に分割するとともに、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する第1層の素子の出力値の属する入力区間と第2層の素子の出力値の属する第2層区間との間の対応関係に基づいて、前記ニューラルネットにおける入力区間から第2層区間への入出力関係を第1の区間ルールとして抽出する第3の抽出ステップと、
    前記入力・出力区間ルール生成手段により、前記第n−1の区間ルールへ、前記第n−2の区間ルールから前記第1の区間ルールまでを逐次代入することによって、前記ニューラルネットにおける前記入力区間から前記出力区間への入出力関係を入力・出力区間ルールとして生成する入力・出力区間ルール生成ステップとを有することを特徴とする区間ルール抽出方法。
  6. 出力値生成手段、分割手段、中間・出力区間ルール抽出手段、入力・中間区間ルール抽出手段及び入力・出力区間ルール生成手段を備え、入力素子、中間素子及び出力素子を持つ学習済みのニューラルネットを対象として、該ニューラルネットの入力素子の入力値又はその値の属する区間から該ニューラルネットの出力素子の出力値の属する区間への関係を示す区間ルールを抽出するための区間ルール抽出装置としてコンピュータを機能させるためのプログラムであって、
    前記出力値生成手段により、複数のサンプルデータの各々について、当該サンプルデータを前記ニューラルネットの入力素子に入力した場合における各々の入力素子、中間素子及び出力素子の出力値を生成する出力値生成ステップと、
    前記分割手段により、前記複数のサンプルデータの各々に対応する前記出力素子の出力値に基づいて、該出力素子出力値の取る範囲を複数の出力区間に分割する分割ステップと、
    前記中間・出力区間ルール抽出手段により、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する前記中間素子の出力値と前記出力素子の出力値の属する前記出力区間との間の対応関係に基づいて、前記中間素子の出力値の取る範囲を複数の中間区間に分割するとともに、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する前記中間素子の出力値の属する中間区間と前記出力素子の出力値の属する出力区間との間の対応関係に基づいて、前記ニューラルネットにおける前記中間区間から前記出力区間への入出力関係を中間・出力区間ルールとして抽出する中間・出力区間ルール抽出ステップと、
    前記入力・中間区間ルール抽出手段により、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する前記入力素子の出力値と前記中間素子の出力値の属する前記中間区間との間の対応関係に基づいて、前記入力素子の出力値の取る範囲を複数の入力区間に分割するとともに、前記複数のサンプルデータの各々について得られた、当該サンプルデータに対応する前記入力素子の出力値の属する入力区間と前記中間素子の出力値の属する中間区間との間の対応関係に基づいて、前記ニューラルネットにおける前記入力区間から前記中間区間への入出力関係を入力・中間区間ルールとして抽出する入力・中間区間ルール抽出ステップと、
    前記入力・出力区間ルール生成手段により、前記中間・出力区間ルール前記入力・中間区間ルールを代入することによって、前記ニューラルネットにおける前記入力区間から前記出力区間への入出力関係を入力・出力区間ルールとして生成する入力・出力区間ルール生成ステップとをコンピュータに実行させるためのプログラム。
JP2001068743A 2000-06-21 2001-03-12 区間ルール抽出方法及びプログラム Expired - Fee Related JP3785049B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001068743A JP3785049B2 (ja) 2000-06-21 2001-03-12 区間ルール抽出方法及びプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000-186445 2000-06-21
JP2000186445 2000-06-21
JP2001068743A JP3785049B2 (ja) 2000-06-21 2001-03-12 区間ルール抽出方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2002082807A JP2002082807A (ja) 2002-03-22
JP3785049B2 true JP3785049B2 (ja) 2006-06-14

Family

ID=26594380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001068743A Expired - Fee Related JP3785049B2 (ja) 2000-06-21 2001-03-12 区間ルール抽出方法及びプログラム

Country Status (1)

Country Link
JP (1) JP3785049B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019229931A1 (ja) * 2018-05-31 2019-12-05 日本電気株式会社 情報処理装置、制御方法、及びプログラム

Also Published As

Publication number Publication date
JP2002082807A (ja) 2002-03-22

Similar Documents

Publication Publication Date Title
CN107450902B (zh) 用于可视化建模的方法和系统
US11151480B1 (en) Hyperparameter tuning system results viewer
EP4006764A1 (en) Material design system, material design method, and material design program
US20130024173A1 (en) Computer-Implemented Systems and Methods for Testing Large Scale Automatic Forecast Combinations
Roesch et al. Visualization of neural network predictions for weather forecasting
CN109902670A (zh) 数据录入方法及系统
US20080004855A1 (en) Design support apparatus, design support method, and design support program
JP2845618B2 (ja) エキスパートシステム
Peng et al. Representing ordinal preferences in the decision support system GMCR II
Andriyanov Development of prediction methods for taxi order service on the basis of intellectual data analysis
CN106575225A (zh) 模块划分辅助装置、方法和程序
JP3785049B2 (ja) 区間ルール抽出方法及びプログラム
Brzozowska et al. Data engineering in CRISP-DM process production data–case study
KR20210042709A (ko) 기업 관계 데이터를 이용한 주가 예측 방법 및 서버
KR101774834B1 (ko) 빅데이터 시각화 시스템 및 방법
Kocakoç et al. Exploring decision rules for election results by classification trees
Vaghela et al. Students' Admission Prediction using GRBST with Distributed Data Mining
Abidin et al. A Computerized Tool Based on Cellular Automata and Modified Game of Life for Urban Growth Region Analysis
Nisanci et al. The prediction of the electric field level in the reverberation chamber depending on position of stirrer
JPH06290163A (ja) シミュレーション方法及びシステム
Zhan et al. Efficient online hyperparameter learning for traffic flow prediction
JPS6165333A (ja) システム構造評価方式
CN112685922B (zh) 一种两层级联的实验方案设计方法与系统
KR102549006B1 (ko) 사용자 행동 기반 질의 벡터 자동 보정을 활용한 기업 검색 시스템 및 그 방법
Díaz-Lozano et al. Clustering of COVID-19 time series incidence intensity in Andalusia, Spain

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060316

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100324

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees