JPH0675985A - データの分類方法 - Google Patents

データの分類方法

Info

Publication number
JPH0675985A
JPH0675985A JP13008392A JP13008392A JPH0675985A JP H0675985 A JPH0675985 A JP H0675985A JP 13008392 A JP13008392 A JP 13008392A JP 13008392 A JP13008392 A JP 13008392A JP H0675985 A JPH0675985 A JP H0675985A
Authority
JP
Japan
Prior art keywords
category
attribute
categories
distribution
attributes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP13008392A
Other languages
English (en)
Other versions
JP3096353B2 (ja
Inventor
Masato Togami
正人 戸上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Togami Electric Mfg Co Ltd
Original Assignee
Togami Electric Mfg Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Togami Electric Mfg Co Ltd filed Critical Togami Electric Mfg Co Ltd
Priority to JP04130083A priority Critical patent/JP3096353B2/ja
Publication of JPH0675985A publication Critical patent/JPH0675985A/ja
Application granted granted Critical
Publication of JP3096353B2 publication Critical patent/JP3096353B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

(57)【要約】 【目的】 属性値の幅が重なる場合も、可能な限り分類
することにある。分類できない場合は、分類できないカ
テゴリーとカテゴリーの出現頻度を出し、どのような状
況で分類できないかということを提示することにある。 【構成】 本発明では、カテゴリーとカテゴリーのもつ
属性値の分布が完全に分離していなくても、属性値の重
なりのない部分を分類する方法を提案する。重なりのあ
る部分、すなわちそれらのカテゴリーが分類できない部
分についても、属性の確率分布を求めることにより、重
なりのある部分の出現確率を求め、カテゴリーを推定す
る。また重なりのある部分において、任意の属性値が得
られた場合の出現確率を求める。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データが属性とその値
の対の集合で与えられている事例または計算結果がある
場合に、データをいくつかのカテゴリー(クラス)に分
類する方法において、特に属性に分布があり、その分布
に重なりがある場合の帰納的機械学習方法に関し、特に
パターン認識、事故診断に有用なデータの分類方法に関
する。
【0002】
【従来の技術】帰納的機械学習方法は、従来属性の値に
分布を持たず、離散的な属性値により識別木を作成して
いた。
【0003】例えば、従来は表1のような車の種類につ
いての20代の人の好みを、好むならばPと分類し、好
まないならばNと分類したデータがある場合、図1のよ
うな識別木を与えてデータのクラス分類をしていた。
【0004】
【表1】 しかしながら、表1の属性は離散的な値、例えばオート
マチックの有無などを考えているが、通常のデータは属
性が連続値を取っている場合、または離散値であるが属
性の分布を持っている場合と考えてよい場合がある。表
1では色については明度、彩度、色相の3つの属性があ
り、例えば一般に青色といっても、明度、彩度、色相に
ある一定の分布内で青色と認識される。すなわち属性値
が連続値を取っている場合である。また、排気量を考え
ても、表1では2000ccクラス、1600ccクラ
ス、2800ccクラスというように離散値を考えてい
るが、実際には1500cc,1600ccを1600
ccクラス、1800cc,2000cc,2200c
cを2000ccクラス、2500cc,2800c
c,3000ccを2800ccクラスと考えて、離散
値に分布があるにも拘わらず、代表的な離散値を取って
いる場合もある。この場合、1500cc以上1800
cc未満を一つの属性値分布と考え、同様に1800c
c以上2500cc未満、2500cc以上3000c
c未満を一つの属性値分布と考えてもよい。
【0005】また、実際のデータを集計または計算して
みると、データ自体は離散値をとるにも拘わらず、統計
的処理して属性値の分布を考えた方がよい。
【0006】また、実際パターン認識及び事故診断にお
ける属性値、すなわち実際には測定値およびセンサ値
は、通常ノイズや種々のパラメータによる属性値の変化
により属性値に幅を持つ。
【0007】このように属性値に幅を持つ場合、あるい
は属性値の分布が明確に得られる場合は、先に特願平3
−269411号において提案した方法により、識別木
学習が可能となった。
【0008】
【発明が解決しようとする課題】ところで、先に提案し
た特願平3−269411号において提案した方法で
は、属性値が幅を持つ場合においても、カテゴリー(実
際には事故種別)とカテゴリーの持つ属性値の分布が完
全に分離している属性があった場合のみ、識別が可能で
あった(図2の(i)参照)。
【0009】エキスパートシステムは、アルゴリズムが
はっきりしない悪構造問題に対して有用であり、診断に
適用されてきた。しかしエキスパートシステムでは、知
識を人間が獲得することが前提となっている。また一度
知識獲得が終わったかのように見えても、システムの信
頼度向上の要求のため、その診断知識を増加したり、修
正したりする必要がある。しかし、修正に際してはどの
ような知識を加えたらよいかの決定は難しい。既存の知
識との整合性の維持ならびに知識の検証も難しい。した
がってデータの分類において知識の獲得、修正、増加さ
らには、その知識との整合性の維持ならびに検証は、膨
大な人的労力と開発費を必要とする。
【0010】エキスパートシステムではif−then
ルールが用いられるため診断のための計算時間がかかる
ことも問題点である。
【0011】それに対し、識別木による機械学習では、
人間の主観が入らない診断を自動的かつ効率的に作成す
ることが可能になる。また、新しい属性値を使うことに
より、新しい識別木を機械学習により開発することが期
待される。
【0012】最近、ニューラルネットワークを用いたデ
ータの分類方法が研究されているが、データの分類論理
が不透明であり、あいまいな結果が得られた場合もあ
り、結果の正確度についての推定は困難である。中間層
を増やせばデータの分類結果の正確度は向上するが、学
習時間が著しく増大するため、データの分類に使えるネ
ットの切り換えを容易化できない。ニューラルネットワ
ークでは目標概念の一部を構成しない属性を与えた場
合、それが概念とは無関係の属性であることを知ること
はできない。
【0013】それに対し識別木による機械学習では、識
別木が複雑になればデータの分類結果の根拠についての
説明が理解しにくくはなるが、診断アルゴリズムからデ
ータの分類結果の根拠や不要な属性について知ることが
できる。また診断できないときにはその原因を推定する
ことが可能である。
【0014】本発明では、カテゴリーとカテゴリーのも
つ属性値の分布が完全に分離していなくても、属性値の
重なりのない部分を分類する方法を提案する。例えば図
3の属性値aならびにbはカテゴリーCi と分類できる
し、属性値cならびにdはカテゴリーCJ と分類でき
る。重なりのある部分、すなわちそれらのカテゴリーが
分類できない部分についても、属性の確率分布を求める
ことにより、重なりのある部分の出現確率を求め、カテ
ゴリーを推定する。例えば図4(1)の確率分布で斜線
部に示す部分の面積を求めることにより出願確率を算出
し、また重なりのある部分において、任意の属性値が得
られた場合の出現確率を求めることができる。図4の確
率分布で属性値eが得られた場合の出現確率を実線で示
す。
【0015】そこで本発明が解決すべき課題は、上記の
ように属性値の幅が重なる場合も、可能な限り分類する
ことにある。分類できない場合は、分類できないカテゴ
リーとカテゴリーの出現頻度を出し、どのような状況で
分類できないかということを提示することにある。
【0016】また、前記の先の出願で提案した方法で
は、分類する属性の組を見つけ、またその中の最も適切
な属性を属性の組の中から配置する際においても、その
評価関数が適切でないため、その効果が充分でなかっ
た。本発明はそのような問題も解決しようとするもので
ある。
【0017】
【課題を解決するための手段】これらの課題を解決する
ため、本発明のデータの分類方法は、(a)データを分
類するカテゴリーC1 〜Ci 〜Cm を設定し、それぞれ
のカテゴリーが持つ属性T1 〜Tj 〜Tn 毎に測定デー
タを集計するかあるいは計算によりシミュレートするス
テップと、(b)集計または計算されたデータに対応す
るカテゴリーに区分けして各属性毎の分布をとるステッ
プと、(c)集計または計算されたデータ毎の分布に着
目したカテゴリーCi と他のカテゴリーCj との属性値
の分布の重なりの状態に基づいて、少なくとも1つの属
性の分布においてカテゴリーCi からCj を完全に識別
できる状態(i) か、カテゴリーCi とCj においてCi
の属性の分布がCj の属性の分布と一部分重なりのある
状態(ii)か、またはカテゴリーCi とCj においてCi
の属性の分布がCj の属性の分布に包含される状態(ii
i) に判別するステップと、(d)前記カテゴリーCi
とCj が状態(i) にある任意の一つのカテゴリーと任意
の1つのカテゴリーを識別可能とする属性集合の組を選
択する場合、識別可能な属性を1、識別できない属性を
0という論理変数を設定し、論理和の形に表現するステ
ップと、(e)前記カテゴリーCi とCj が状態(i) の
組合せにおいて、カテゴリーCiと他のすべてのカテゴ
リーとを識別可能とする属性集合の組を求める場合、
(d) で求めた論理式の論理積で求めるステップと、
(f)前記カテゴリーCi とCj が状態(i) の組合せに
おいて、すべてのカテゴリーを互いに分類可能とするた
めの属性集合の組を(e)で求めた論理式の論理積で求
めるステップと、(g)前記属性の組の中から、識別木
作成に最も効率的な属性の組を選択するために、属性値
の分布の重なり状態、カテゴリーCi の出現頻度に基づ
く評価関数により評価を行い、最も効率的な属性の組を
選択するステップと、(h)前記において選択した属性
の組の中で、評価式が最大となる属性を親ノードとして
配置し、属性の分布が他のカテゴリーと重なっていない
範囲は親ノードで分類を完了させ、重なっている範囲に
おいては他のカテゴリーと分類できなかったカテゴリー
を子ノードとして配置し、その子ノードの組の間で前記
(c)〜(f)のステップの処理を行ってステップ
(g)で選択した属性の組の中で評価式が親ノードでの
分類に使用した属性を除いた属性の内で最大となる属性
を前記子ノードに対する親ノードとして配置し、これら
の処理をカテゴリーCi と状態(i) にあるカテゴリーC
j との間において再識別ノードがなくなるまで行うステ
ップと、(i)上記ステップにおいて分類できなかった
子ノードにおいてはステップ(c)における状態(ii)ま
たは(iii) の場合を考え、カテゴリーの分割を、ある属
性分布Tk においてあるs個のカテゴリーC1 ,…,C
i ,…Cs が重なりあっている場合、ある属性Tk にお
いて任意のカテゴリーCi は他のすべてのカテゴリーと
重なりのない部分、任意のカテゴリーCi と他の任意の
1個のカテゴリーが重なる部分、任意のカテゴリーCi
と他の任意の2個のカテゴリーが重なる部分、・・・、
任意のカテゴリーCi と他の任意のs−2個のカテゴリ
ーが重なる部分、任意のカテゴリーCi と他の任意のs
−1個のカテゴリーが重なる部分に分け、この分割によ
り、分割された新たなカテゴリーを作り、分割したカテ
ゴリーがすべての属性Tk に対して空集合の場合、新た
なカテゴリーは作らないとするステップと、(j)属性
を用いる時に用いたパラメータの確率分布より任意の属
性分布における属性の確率分布を求めるステップと、
(k)(j)で求めた属性の確率分布において、ある任
意の2つのカテゴリーにおいて、属性の分布に重なりの
ある場合、それぞれのカテゴリーの重なりのある部分の
確率と重なりのない部分の確率を求めるステップと、
(l)任意の属性値が得られ、その属性値の確率および
出現頻度を求め、または属性値によりカテゴリーの識別
ができない場合、(j)で求めた属性の確率分布によ
り、どのカテゴリーに属する確率が高いかを求めるステ
ップと、(m)(i)で求めたカテゴリーの分割によっ
てできた新しいカテゴリーに対し、属性値の分布の重な
りの確率とカテゴリーCi の出現頻度に基づく評価関数
により、評価を行い、最も効率的な属性を選択し、
(h)までのステップで分類できなかった子ノードに対
し、最も効率的な属性によって分類するステップと、
(n)識別木よりデータの分類のフローチャートを作成
するステップとを有し、このフローチャートによりデー
タの分類を行うことを特徴とする。
【0018】
【実施例】以下、本発明を、具体的に説明する。
【0019】本発明の概念的な考え方を図5に示す。ま
た、本発明の全体的なフローチャートを図6に示す。
【0020】本発明では、送配電線事故診断の場合のデ
ータの分類方法を実施例として具体的に説明する。
【0021】通常、データが計算または集計により連続
値として得られる場合は、連続値で与えられる範囲で、
それぞれの属性の属性値の分布として与える。また、デ
ータが離散値で与えられる場合は、例えば統計処理によ
り、標準偏差の3σをとる値の範囲を属性値の分布とし
て与える。
【0022】本実施例では以下の条件により属性値の分
布を求めた。
【0023】なお、本発明の実施例では、図7に示す3
回線配電線の線路モデルを想定し、c配電線上で事故が
起きたとする。各配電線の静電容量は図示の通りであ
る。またc配電線の変電所2次母線のインピーダンスは
0.362Ωならびに線路インピーダンスは0.536
+j1.407Ωとする。負荷は均等負荷と考え、電源
端の大地間電圧は3810V、また電流200Aを中心
値とし、負荷予測により、相対誤差の標準偏差を3.8
%とし、3σを考えた場合、177A〜223Aとし
た。また断線事故においては、負荷は三相負荷のみと考
え、負荷の力率は100%と考えた。事故はc配電線の
電源端と受電端との間で起こったと考え、1線地絡事故
並びに2線線間短絡事故ならびに1線断線事故につい
て、定常状態で電源端での絶対値を計算した。配電線は
非接地方式とし、故障点抵抗は0〜6000Ωとした。
【0024】(A)第1実施例 1)識別木の作成方法ならびにその配電線事故診断にお
けるデータの分類の適用例 本実施例では、センサの零相電流、零相電圧、各相電
流、各相対地間電圧などのセンサ情報をもとに地絡事
故、短絡事故、断線事故などの事故を検出するアルゴリ
ズムをデータの分類識別木により作成する。ここでは、
センサ情報を属性値とし、正常及び短絡事故、地絡事故
ならびに断線事故の区別をカテゴリーとする。
【0025】ここで、選択すべきm個のカテゴリーをC
1 ・・・Ci ・・・Cm とし、これらのカテゴリーが個
々にもつn個の属性をT1 ・・・Tj ・・・Tn とす
る。
【0026】配電線事故診断におけるデータの分類の選
択すべき事故及び正常値のカテゴリーを CN :正常 Cbc:bc線2線短絡事故 Cca:ca線2線短絡事故 Cab:ab線2線短絡事故 Ca :a線地絡事故 Cb :b線地絡事故 Cc :c線地絡事故 CDa:a線断線事故 CDb:b線断線事故 CDc:c線断線事故 とする。
【0027】また上記のカテゴリーが個々にもつ属性を TV0 : 零相電圧 TI0 : 零相電流 TIa : a相電流 TIb : b相電流 TIc : c相電流 TVa : a相対地間電圧 TVb : b相対地間電圧 TVc : c相対地間電圧 とする。
【0028】前記の配電線モデルで計算した属性値を表
2に示す。
【0029】
【表2】 ここでTV0,TVa,TVb,TVcの属性値の単位はV、ま
たTI0, TIa, TIb,TIcの属性値の単位はAである。
【0030】2−1)任意の二つのカテゴリーの分類に
必要な属性の選択(図6のフローチャートの3に相当す
る) すべてのカテゴリーを分類するために必要な属性を見つ
けるために、まず、任意のある一つのカテゴリーに注目
し、それを分類するのに必要な属性を求める。今、注目
しているカテゴリーをCi とし、Ci 以外の任意の一つ
j との属性値分布図上での相対的な分布関係を考え
る。属性Tk における分布図上でのCi から見たCj
相対的な分布関係は、図2に示すように、次の三つの状
態が考えられる。
【0031】状態 (i) Ci の分布とCj の分布は重な
っていない。
【0032】状態 (ii) Ci の分布はCj の分布とす
べて重なっている。
【0033】状態 (iii)Ci の分布はCj の分布と一部
重なっている。
【0034】これら三つの状態のうち、Ci とCj が完
全に分類可能な状態は状態(i) のみである。つまり、任
意の属性Tk でCi とCj が分類可能であるためには、
その二つのカテゴリーの属性値分布の状態が状態(i) で
あることが必要条件となる。そこで属性Tk が状態(i)
であるか否かを示すために式(1)に示すような係数a
ikを定義する。
【0035】 aik=1 Tk が状態(i) 0 その他 (1) また、Tk を論理変数と考え、分類に用いる場合には
1、用いない場合には0の2値を考える。Ci とCj
分類可能とする属性値はaikを用い論理和の形に表現す
ると次式のようになる。
【0036】 f(Ci ,Cj )=ai11 +・・・+aikK +・・・・ainn (2) つまり(2)式においてCi とCj はf(Ci ,Cj
=1となる場合に分類可能となり、f(Ci,Cj)の項
の少なくとも一つの属性を用いればCiとCjは分類でき
る。
【0037】カテゴリーCN と他のカテゴリーとを分類
するために必要な属性を選択した結果を次に示す。
【0038】 f(CN ,Cbc)=TIb+TIc+TVb+TVc (3) f(CN ,Cca)=TIa+TIc+TVa+TVc (4) f(CN ,Cab)=TIa+TIb+TVa+TVb (5) f(CN ,Ca )=TV0+TI0+TVa+TVb+TVc (6) f(CN ,Cb )=TV0+TI0+TVa+TVb+TVc (7) f(CN ,Cc )=TV0+TI0+TVa+TVb+TVc (8) しかしながら、f(CN ,CDa),f(CN ,CDb),
f(CN ,CDc)は属性Tk が状態(i) である属性がな
い。先に提案した方法では、この場合は識別木を作成す
ることが不可能であった。
【0039】2−2)注目カテゴリーの分類に必要な属
性の選択(図6のフローチャートの4に相当する) ここでは、今注目しているカテゴリーCi と、ある属性
k が状態(i) の状態のすべてのカテゴリーCj を分類
可能とする属性の組を求める。
【0040】Ci と属性Tk が状態(i) である状態の一
つCj とを分類可能とする属性は式(2)で求まってい
る。従って、Ci と属性Tk が状態(i) である状態のす
べてのカテゴリーとを分類可能とするためにはCi とそ
れ以外のそれぞれのカテゴリーに対してf(Ci
j )(j=1,・・・,m,i≠j)の論理積を式
(9)のように行う。
【0041】 f(Ci )=f(Ci ,C1 )・・f(Ci ,Cj )・・f(Ci ,Cm ) 但しi≠j (9) すなわち、このf(Ci )の演算結果における論理積の
形で与えられる属性の組は、それぞれ独立して、Ci
属性Tk が状態(i) である状態のすべてのカテゴリーを
分類可能とする属性の組である。
【0042】すなわち、カテゴリーCi と属性Tk が状
態(i) の状態でない任意のCj に対してはf(Ci ,C
j )がf(Ci )の論理積と一項としては含まれないこ
とになる。但し、Ci と他のすべてのカテゴリーにおい
てf(Ci ,Cj )=0の場合は、f(Ci )を求め
ず、次の計算ステップに移る。
【0043】以上の式により、CN と属性Tk が状態
(i) である状態のすべてのカテゴリーCj とを分類する
ために必要な属性は次の(10)式のように式(3)〜
(8)の論理積で表すことができる。
【0044】 f(CN )=f(CN ,Cbc)f(CN ,Cca)f(CN ,Cab) f(CN ,Ca )f(CN ,Cb )f(CN ,Cc ) =TIcIaV0+TIcVAI0+TIcVaV0 +TVbIaI0+TVbIaV0+TVbIcI0 +TVbIcV0+TVbVa+TVbVc+TVcIaI0 +TVcIaV0+TVcVa (10) 式(10)において、12の項のそれぞれの属性の組に
よってCN は属性Tk が状態(i) である状態のすべてカ
テゴリーCj を分類可能とする。
【0045】2−3)属性Tk が状態(i) の状態である
カテゴリーすべてを分類可能な属性の選択(図6のフロ
ーチャートの5に相当する) 式(9)によって求まった各カテゴリーが属性Tk が状
態(i) の状態のカテゴリーを分類するのに必要な属性の
組から、少なくとも1組ずつを取り出し、それらのすべ
てを含む属性の組を用いれば、属性Tk が状態(i) の状
態のカテゴリーが分類可能となる。つまり、属性Tk
状態(i) の状態のカテゴリーを分類可能とするために必
要な属性の組は、各々のカテゴリーに対してf(Ci
=1(i=1,・・・,m)とならしめる属性を見つけ
ることによって求まるから、それらの論理積を式(1
1)のように行う。
【0046】 E=f(C1 )・・・f(Ci )・・・f(Cm ) (11) この演算結果は次のように表せる。
【0047】 E=A1 +・・・+Ax +・・・+Ap 但しAx =Ta b c ・・・ (12) 従って、A1,・・・, Ax , ・・・, Ap は属性Tk
状態(i) の状態のカテゴリーを分類可能とするのに必要
な属性の組である。
【0048】以下同様に、f(Cbc),f(Cca),f
(Cab),f(Ca ),f(Cb ),f(Cc ),f
(CDa),f(CDb),f(CDc)を求める属性Tk
状態(i) の状態のカテゴリーを分類可能とする属性の組
は、 E=f(CN )f(Cbc)f(Cca)f(Cab)f(Ca ) f(Cb )f(Cc )f(CDa)f(CDb)f(CDc) =TIaIbVaVbVc+TIaIcVaVbVc+TIbICVaVbVc (13) となる。これを次のように置き換える。
【0049】 A1 =TIaIbVaVbVc,A2 =TIaIcVaVbVc, A3 =TIbICVaVbVc (14) つまり、これらの3組は、それぞれ独立して、少なくと
も1つの属性Tk が状態(i) である状態のカテゴリーを
分類可能とする属性の組である。また、A3 の属性の組
を選択した場合、TIb,TIc,TVa,TVb,TVc以外の
属性は、分類に必要のない属性である。
【0050】今までの手続きを考察してみると、求めら
れた3組の属性の組A1,A2,A3の属性を使うことに
より、図8の実線で結んだカテゴリー同士を分類でき
る。したがってA1 ,A2 ,A3 の3組のそれぞれの属
性は実線で結ばれたカテゴリーは分類できるが、破線で
結ばれたカテゴリーは分類は完全にはできない。
【0051】3)識別木の各ノードへの属性の配置(図
6のフローチャートの6に相当する) まず実線で結ばれたカテゴリーを分類するために選択し
た属性の組の最適なものを選択し、さらには、最も効率
的に配置するにはどうするかについて述べる。 3−1)最適な属性を選ぶ評価方法 非重なり度合いak (i,j) 属性値分布において、他の分布と重なりが全くない領域
を多くもつ属性値は分類のための貢献度が高くなる。そ
のような属性値を多く含む属性の組を用いて識別木を構
成した方が上位のノードにおいて分類が完了する確率が
大きくなり分類時間の短縮につながる。そこで、あるカ
テゴリーCi の属性値分布について全く重なっていない
領域がCj の属性値分布に対してどの程度占めるかを示
す非重なり度合いak (i,j) を次式で表す。これはTk
がCiの分類に対してどの程度Cjの貢献があるかを示す
ものである。
【0052】 ak (i,j) =lik/L(Ci ) (15) ここでlik:TK の属性値分布において、Ci の分布に
対してCj の分布により重なりがない領域の範囲(図9
参照) L(Ci ):Ci の分布の範囲 前掲の表2の測定データに基づいて非重なり度合いak
(i,j) をTV0について算出すると表3のようになる。表
3ではiは列、jは行を表す。
【0053】
【表3】 )出現頻度P1 次に、カテゴリー、すなわち事故の種類の出現頻度を求
める。その結果を表4に示す。
【0054】
【表4】 当然、出現頻度P1 は正常時≫地絡事故>短絡事故>断
線事故である。
【0055】6)評価値F(Tk ) 以上挙げた2つのパラメータak (i,j) ,P1 を用い
て、各属性に対して次式に示すような評価関数を定め
た。
【0056】
【数1】 このF(Tk )が大きいTk ほど、出現頻度の大きいカ
テゴリーに対して分類の可能性が大きい。
【0057】前述の例の場合、評価値は次のようにな
る。
【0058】
【表5】 以下、定義2で進める。
【0059】識別木作成に効果的な属性の組Aeff は、
1 ,A2 ,A3 のそれぞれの属性の評価値F(Tk
の積G(Ax )が最大となる組である。そこで各組につ
いてG(Ax )を求める。
【0060】 G(A1 )=F(TIa)F(TIb)F(TVa)F(TVb)F(TVc) = 5.364×10-12 (18) G(A2 )=F(TIa)F(TIc)F(TVa)F(TVb)F(TVc) = 5.364×10-12 (19) G(A3 )=F(TIb)F(TIc)F(TVa)F(TVb)F(TVc) = 8.648×10-12 (20) G(A3)の値が最大であるため、G(A3 )をとる。
【0061】7)識別木の各ノードへの属性(図6のフ
ローチャートの7に相当する) 識別木の各ノードへの配置は次のようにする。まず根ノ
ードに関してはAeffのうち評価値F(TK )が最も大
きい方を根ノードに考える。ここではF(TVa)=F
(TVc)なのでTVaとする。属性の重なりの状態によ
り、属性の分布に重なりのない領域、属性の分布に重な
る領域に分かれる。
【0062】属性がこれらの重なりのない領域の値にな
った場合には、根ノードで分類が完了する。重なりのあ
る領域はカテゴリー間の分類が不可能であり、他の属性
で再度分類する。すなわち、前者は葉ノードNe とし、
後者は再分類ノードNc とする。Nc における集合NC'
は例えば図10に示した領域1に関しては、(Cca,C
ab,Ca )となる。
【0063】次に再分類ノードに配置する属性は次のよ
うに選択する。領域1を例にとればSC'の要素の2つず
つのカテゴリーをそれぞれ分類可能とする。属性は次式
のようになる。但し、f(Ci ,Cj )=f(Cj ,C
i )である。
【0064】 f(Cca,Cab)=TIb+TIc+TVb+TVc (21) f(Cab,Ca )=TV0+TI0+TIa+TIb+TVb+TVc (22) f(Ca ,Cca)=TV0+TI0+TIa+TIc+TVc (23) SC'の全要素を分類可能とする属性は、これらの論理積
により次式のように求まる。
【0065】 f(Cca,Cab)f(Cab,Ca )f(Ca ,Cca) =TV0Ib+TV0Ic+TI0Ib+TI0Ic+TIaIb+TIaIc +TIbIc+TVc+TV0Vb+TI0Vb+TIaVb+TICVb (24) この結果、Aeff の部分集合となっている属性はTVc
IbIc,TIcVbである。この3つの属性の組につい
て、それぞれの属性の評価値F(Tk )の積G(AX
を求めるとTVcの属性の組が最大となるのでTVcを配置
する。
【0066】以上のような操作をAeff の部分集合の属
性を使って行う。その結果の一部を図11に示す。但
し、*印をつけたノードは、これまでの手続きでは分離
することができない。
【0067】8)カテゴリーの分割(図6のフローチャ
ートの8に相当する) ある属性分布Tk においてあるs個のカテゴリーC1 ,
…, Ci , …, Cs が重なりあっている場合、すなわち
s個のカテゴリーのすべての組み合わせが図2の状態(i
i)または状態(iii) の場合、以下の方法でカテゴリーの
分割を行う。
【0068】ある属性Tk において任意のカテゴリーC
i は他の全てのカテゴリーと重なりのない部分、任意の
カテゴリーCi と他の任意の一個のカテゴリーが重なる
部分、任意のカテゴリーCi と他の任意の二個のカテゴ
リーが重なる部分、・・・、任意のカテゴリーCi と他
の任意のs−2個のカテゴリーが重なる部分、任意のカ
テゴリーCi と他の任意のs−1個のカテゴリーが重な
る部分に分けることができる。上記の分割により、分割
した新たなカテゴリーを作ることができる。また任意の
カテゴリーCi と他の任意のs−n個のカテゴリーが重
なる部分の組み合わせの数は sS-n+1 で与えられる。
また分割したカテゴリーがすべての属性Tk に対して空
集合の場合、新たなカテゴリーは作らないとする。
【0069】具体的に図12で子ノードが3個のカテゴ
リーC1 ,C2 ,C3 が区別できない場合を考える。こ
こでの属性をT1 ,T2 とする。
【0070】ここでカテゴリーCi が他の全てのカテゴ
リーと重なりのない部分によって新しくできたカテゴリ
ーをC1*とする。例えば図12の属性T1 のC1*であ
り、この例のように属性の分布が分離する場合もある。
任意のカテゴリーCi と他の任意の一つのCj カテゴリ
ーが重なる部分によって、新しくできたカテゴリーをC
ijとする。以下任意のカテゴリーCi と他の任意の2つ
のカテゴリーが重なる部分によって、新しくできたカテ
ゴリーを同様に定義する。図12の属性T1 におけるC
2*ならびにC3*は、空集合のため新たなカテゴリーを作
らないとする。このとき新たに作られたカテゴリーは、
すべての任意の2つの組み合わせにおいて状態(1) を満
たす。属性Tk は上記の方法によりカテゴリーの分割を
行うことができる。
【0071】上記方法で、ノードのカテゴリーの分割を
行う。この図11の*印では通常2つのカテゴリーを分
類できない場合が多いが、*1のように四つのカテゴリ
ーCN ,CDa,CDb,CDcが認識できない場合がある。
【0072】属性Tk において任意のカテゴリーCi
他の全てのカテゴリーと重なりのない部分のカテゴリ
ー、この場合CN*,CDa* ,CDb* ,CDc* を作ること
ができるが、CN*はすべての属性に対して空集合のた
め、カテゴリーCN*を作ることはできない。以下同様に
任意のカテゴリーCi と他の任意の一つのカテゴリーが
重なる部分のカテゴリー、Ci と他の任意の2つのカテ
ゴリーが重なる部分のカテゴリー、Ci と他の任意の三
つのカテゴリーが重なる部分のカテゴリーにより、新た
な八個のカテゴリーCDa* ,CDb* ,CDc*
Da Db*,CDb Dc*,CDb D c*,CDa Db Dc* ,C
N Da Db Dc* を作ることができる。そのカテゴリーの属
性値の分布を表6に示す。
【0073】
【表6】 9)分離した属性を持たないカテゴリー分類 属性値の分布が完全に分離していないカテゴリーに対し
てカテゴリーの分割により、新たなカテゴリーを生成す
る。どの属性を使ってそれらの分類を行うかを考えるた
め、属性の確率分布を考える。
【0074】(9−1)属性の確率分布(図6のフロー
チャートの9に相当する) 属性値はいくつかのパラメータを用いて計算される。例
えば断線事故の電流値の場合、事故前の電流と事故点が
パラメータである。それらのパラメータの確率分布が判
れば属性の確率分布を知ることができ、ある任意の2つ
のカテゴリーにおいて、属性の分布に重なりのある場
合、それぞれのカテゴリーの重なりのある部分の確率と
重なりのない部分の確率を知ることができる。
【0075】ここでは離散的な、2次元の確率分布を例
にとって考え方を説明する。
【0076】二つの確率変数X,Yは互いに独立で、そ
れぞれ任意の値xi とyi において、それぞれ確率pi
ならびにqj とすると、 P(X=xi )=pi (25) P(Y=yj )=qj (26) とおくことができ、任意のi,jに対して P(X=xi ,Y=yj )=P(X=xi )P(Y=yj ) (27) すなわち pij=pi j (28) が成り立つ。
【0077】いま、属性Tk が変数X,Yの関数hとし
て表すことができるとすると、(29)式のように表すこと
ができ、 Tk =h(X,Y) (29) したがって例えば断線事故の電流値の場合、二つのパラ
メータの事故前の電流値xi と事故点yj とその確率p
i とpj からh(X,Y)とpijの総和を求めることに
より、属性Tk の確率分布を求めることができる。した
がって属性Tkの確率分布をZとし、pijの総和の確率
をzk とすると、属性Tk の確率分布は P(Z=zK ) (30) とおくことができ、任意の属性Tk の属性分布において
a≦Z≦bの範囲の確率は、 P(a≦Z≦b)=Σ* r (31) ただし、Σ* r はa≦Z≦bである確率の総和を表
す。したがって任意の属性Tk のZでの確率ならびに属
性Tk の属性分布においてa≦Z≦bの範囲の確率を求
めることができる。
【0078】9−2)属性の選択 前節で求めた確率分布を用い、子ノードの分類に効果的
な属性の選択を行う。属性値分布において、他の分布と
重なりのない部分の確率の高い属性値は分類のための貢
献度が高くなる。そこで、ある属性Tk におけるカテゴ
リーCi のCjに対して全く重なっていない領域の属性
値の確率分布を求め、その確率をΣ* r (i,j) とす
る。実際には図4(1) における斜線部以外の確率であ
る。これはTk がCi の分類に対してどの程度Cj の影
響があるかを示すものである。確率Σ* r (i,j) とカ
テゴリーの出現頻度Pi を使い、次の評価関数を定め
る。
【0079】
【数2】 ここで(17)式で定めたak (i,j) は、属性Tk の確率分
布が一様に分布している場合のΣ* r (i,j) と一致し
ている。このF* (Tk )が大きい属性Tk を用いて、
全ての属性に対し属性値の分布が完全に分離していない
子ノードの分類は8)で述べたカテゴリーの分割によっ
て新しくできたカテゴリーにより分類を行う。
【0080】9−3)属性の確率分布の実施例 ここでは1線断線時の各相の電流値を例とする。その電
流値は三相負荷かつ力率100%の場合、事故点におけ
る事故時の電流は断線相で0A、他の2相の電流は事故
前の電流の半分となる。また事故点以前の負荷は変動し
ない。例えば図7のc配電線のちょうど中央で断線した
と仮定し、正常時の電源端の電流を200Aとした場
合、負荷は均等負荷のため、電流端での断線相の電流
は、c配電線の中央までの負荷の100Aが流れること
となる。他の2相の電流はcの中央までの負荷の100
Aと断線点以降の50Aの計150Aが流れることにな
る。
【0081】事故前の負荷予測の電流値の確率分布は正
規分布が得られ、また事故は配電線上に一様に起きると
考えられることより、事故点の確率分布は一様分布と考
えてよい。したがって、断線時の各相の電流値の確率分
布は(30)式により上記の二つの確率変数の2次元確率分
布から算出することができる。
【0082】ここでは確率を連続値と考え、図13にa
相断線時のa,b,c相の電流の確率密度関数とその正
常時の確率密度関数を示す。カテゴリーCDaの属性TIa
の属性分布がカテゴリーCN の属性TIaの属性分布と重
なり合わない部分の確率は図13のグラフで0〜176
Aまでの確率密度関数の面積から算出でき、その確率は
0.88で、同様に重なりのある部分の確率は0.12
と求めることができる。属性TIaの属性値が180Aと
得られ、カテゴリーCDaもしくはカテゴリーCN の分類
が他の属性ではできなかった場合の確率は図13の確率
密度関数より、CDaは0.005、CN は0.0016
と得られる。しかしながら、表4よりカテゴリーの出現
頻度Pi まで考慮すると、断線事故の確率は小さいた
め、CDaは1.05×10-4、CN は1.58×10-4
であり、正常である確率が高い。
【0083】また、属性TIaの属性値が150Aと得ら
れた場合、図13の確率密度関数より、確率は0.00
5、表4のカテゴリーの出現頻度Pi まで考慮すると、
Daである確率は1.05×10-4と求めることができ
る。
【0084】従来の断線検出の一番初歩的な方法は上述
の通り、電源端での電流値検出である。しかしながら、
この方法の最大の欠点は、末端近くで、断線事故が発生
した場合、断線事故が発生したのか、ただ負荷が減少し
たのかわからない点にある。したがって配電線の末端で
センサー情報すなわち属性値を使って断線事故を検出す
る方法もあるが、変電所までの通信線を設置しなければ
ならず、コストがかかる。電源端検出で断線事故を末端
まで完全に検出するのは原理的に不可能であることがわ
かっている。
【0085】したがって、断線事故か正常かより高い確
度で分類するには、負荷予測の精度を高める必要があ
る。例えば一時間前の負荷予測は、今回データとして用
いた5時間前の負荷予測よりも、予測の相対誤差が小さ
くなると考えられる。すなわち図13の正規分布の確率
分布が、200Aの近くに集まることにより、CN のT
Ia、TIb、TIcのとる属性分布の範囲が狭くなる。した
がって断線事故を検出する確率を高くすることができ
る。それにより、短時間負荷予測により、負荷予測の精
度を高め、時間によって変わる負荷変動を考慮にいれ、
その時々の診断アルゴリズムを識別木学習で作ることに
より、従来検出できなかったより末端に近い断線事故も
検出できるようになる。
【0086】9−4)評価関数F* (Tk )の算出なら
びに子ノードの分類 ここでは四つのカテゴリーCN ,CDa,CDb,CDcでの
評価関数F* (Tk )を表4の出現頻度Pi と、(31)式
より求めるΣ* r (i,j) により、式(32)で評価関数F
* (Tk )の算出を行う。Σ* r (i,j) は前節で求め
たように例えば属性TIaのCDaのCN に対して全く重な
っていない領域の確率は0.88と得られる。その結果
を表7に示す。この場合、F* (TVa)=F* (TVb
=F* (TVc)であるので、属性TVaにより分類する。
子ノードとしてカテゴリーCDa*,CDb* ,CDb Dc*
N Da Db Dc* を分類することができる。その結果を図
11に示す。
【0087】
【表7】 図14〜図19は、前述した実施例において用いた数値
を使用して具体的に事故診断を行うためのデータの分類
を行うフローチャートを示している。
【0088】以上、第1実施例について説明した。この
第1実施例は、最も効率的な識別木およびフローチャー
トの作成方法であるが、効率をある程度犠牲にしても同
様な分類を行うことができる。その例を以下に示す。
【0089】(B)第2実施例 本実施例では少なくとも一つの属性が状態(i)である
カテゴリーの組合せにおいてカテゴリーCi と他のすべ
てのカテゴリーを分類する属性の組を求め、さらにはす
べてのカテゴリーを分類する属性の組を求めるという2
段階のステップを行っていたが本実施例では上記ステッ
プを一度に行うところにある。
【0090】第1実施例の2ー1)までは同じなどで説
明を省略する。
【0091】2−2’)属性Tk が状態(i) の状態であ
るカテゴリーすべてを分類可能な属性の選択を行う。
【0092】少なくとも一つ以上の属性値の分布が完全
に分離しているカテゴリーの組み合わせを識別可能な属
性集合の組は、f(Ci ,Cj )=1となるすべての組
み合わせに対してf(Ci ,Cj )(i=1,・・・,
n、j=1,・・・,m、i≠j)の論理積をとること
により求めることができ、式(33)で求めることがで
きる。
【0093】 E=f(C1 ,C1 )・・f(C1 ,CJ )・・f(C1 ,Cm ) ・ ・ ・ ・ ・ ・ f(Ci ,C1 )・・f(Ci ,CJ )・・f(Ci ,Cm ) ・ ・ ・ ・ ・ ・ f(Cn ,C1 )・・f(Cn ,CJ )・・f(Cn ,Cm ) 但し、i≠j (33) この演算結果は次のように表せる。
【0094】 E=A1 +・・・+Ax +・・・+Ap 但し、Ax =Ta b c ・・・ (34) したがって、A1 ,・・・,Ax ,・・・,Ap は、少
なくとも一つ以上の属性Tk の属性値の分布が完全に分
離しているカテゴリーの組み合わせを分類可能な属性集
合である。
【0095】式(33)によって少なくとも一つ以上の
属性値の分布が完全に分離しているカテゴリーの組み合
わせすべてを分類可能な属性集合の組が選択できる。
【0096】 E=TIaIbVaVbVc+TIaIcVaVbVc+TIbIcVaVbVc (35) となる。これを次のように置き換える。
【0097】 A1 =TIaIbVaVbVc,A2 =TIaIcVaVbVc3 =TIbIcVaVbVc (36) つまり、これらの3組は、それぞれ独立して属性Tk
状態(i) である状態のカテゴリーを分類可能とする属性
の組である。
【0098】今までの手続きを考察してみると、求めら
れた3組の属性の組A1,A2,A3の属性を使うことに
より、図8の実線で結んだカテゴリー同士を分類でき
る。したがってA1 ,A2 ,A3 の3組のそれぞれの属
性は実線で結ばれたカテゴリーは分類できるが、破線で
結ばれたカテゴリーは分類は完全にはできない。
【0099】以下は、第1実施例における3)以降と同
様であるので、説明を省略する。
【0100】(C)第3実施例 属性値の分布が少なくとも一つの属性により、完全にカ
テゴリーを分類する属性をのみ使って識別木を作成しよ
うとするものである。即ち、状態(i) のカテゴリーの組
み合わせだけを考える方法である。言い換えれば、図8
の実線の組み合わせを分類する属性を使って識別木を作
成するもので、属性の分布が状態(ii),(iii)のカテゴリ
ーを識別することについては考慮しない。
【0101】第1実施例の7)までは同じなどで説明を
省略する。
【0102】図11*印をつけたノードは分類せず、そ
の識別木を用いて図14のフローチャートを作成する。
【0103】(D)第4実施例 本実施例は、少なくとも一つの属性が状態(i) のカテゴ
リーの組み合わせの分類する属性の組を求め、求めた組
の中から、任意に1組を選び、さらに選択した属性の組
をノードに配置する際にも、任意の属性を配置するもの
である。これは、効率的な属性の組を選択する点とさら
にはその属性の組をノードに配置する際には効率的な属
性から配置するということが考慮されず、任意に選択配
置する点が第1実施例と異なる。
【0104】第1実施例の2)までは同じなので説明を
省略する。 また2)項のあとに以下の文章をを加える
(14)式のA1 、A2 、A3 の任意の一組を選択す
る。ここではA3 を選択するものとする。A3 の属性の
組の中で任意の属性を根ノードと考える。ここではTVa
とする。
【0105】属性の重なりの状態により、属性の分布に
重なりのない領域、属性の分布に重なる領域に分かれ
る。
【0106】属性がこれらの重なりのない領域の値にな
った場合には、根ノードで分類が完了する。重なりのあ
る領域はカテゴリー間の分類が不可能であり、他の属性
で再度分類する。すなわち、前者は葉ノードNe とし、
後者は再分類ノードNc とする。Nc における集合NC'
は例えば図10に示した領域1に関しては、(Cca,C
ab,Ca )となる。
【0107】次に再分類ノードに配置する属性は次のよ
うに選択する。領域1を例にとればSC'の要素の2つず
つのカテゴリーをそれぞれ分類可能とする。属性は次式
のようになる。但し、f(Ci ,Cj )=f(Cj ,C
i )である。
【0108】 f(Cca,Cab)=TIb+TIc+TVb+TVc (21) f(Cab,Ca )=TV0+TI0+TIa+TIb+TVb+TVc (22) f(Ca ,Cca)=TV0+TI0+TIa+TIc+TVc (23) SC'の全要素を分類可能とする属性は、これらの論理積
により次式のように求まる。
【0109】 f(Cca,Cab)f(Cab,Ca )f(Ca ,Cca) =TV0Ib+TV0Ic+TI0Ib+TI0Ic+TIaIb+TIaIc +TIbIc+TVc+TV0Vb+TI0Vb+TIaVb+TICVb (24) この結果、A3 の部分集合となっている属性はTVc,T
IbIc,TIcVbである。この3つの属性の組につい
て、ここでは任意のTVcを配置する。
【0110】以上のような操作をA3 の部分集合の属性
を使って行う。その結果の一部を図11に示す。但し、
*印をつけたノードは、これまでの手続きでは分離する
ことができない。
【0111】(E)第5実施例 本実施例では、少なくとも一つの属性が状態(i) のカテ
ゴリーの組み合わせの分類する属性の組を求め、求めた
組の中から最も効率的な属性の組を求め、さらにその属
性の組をノードに配置する際は任意に属性を選択してノ
ードに配置するものである。したがって、第1, 第2実
施例とは、属性の組を選択するところまでは効率を考慮
して同じであるが、その属性の組をノードに配置する場
合において、任意に選択することとしており、その点、
効率が考慮されていない点が相違する。
【0112】7)識別木の各ノードへの属性(図6のフ
ローチャートの7に相当する) 識別木の各ノードへの配置は次のようにする。まず根ノ
ードに関してはAeffのうち任意のTVaとする。属性の
重なりの状態により、属性の分布に重なりのない領域、
属性の分布に重なる領域に分かれる。
【0113】属性がこれらの重なりのない領域の値にな
った場合には、根ノードで分類が完了する。重なりのあ
る領域はカテゴリー間の分類が不可能であり、他の属性
で再度分類する。すなわち、前者は葉ノードNe とし、
後者は再分類ノードNc とする。Nc における集合NC'
は例えば図10に示した領域1に関しては、(Cca,C
ab,Ca )となる。
【0114】次に再分類ノードに配置する属性は次のよ
うに選択する。領域1を例にとればSC'の要素の2つず
つのカテゴリーをそれぞれ分類可能とする。属性は次式
のようになる。但し、f(Ci ,Cj )=f(Cj ,C
i )である。
【0115】 f(Cca,Cab)=TIb+TIc+TVb+TVc (21) f(Cab,Ca )=TV0+TI0+TIa+TIb+TVb+TVc (22) f(Ca ,Cca)=TV0+TI0+TIa+TIc+TVc (23) SC'の全要素を分類可能とする属性は、これらの論理積
により次式のように求まる。
【0116】 f(Cca,Cab)f(Cab,Ca )f(Ca ,Cca) =TV0Ib+TV0Ic+TI0Ib+TI0Ic+TIaIb+TIaIc +TIbIc+TVc+TV0Vb+TI0Vb+TIaVb+TICVb (24) この結果、Aeff の部分集合となっている属性はTVc
IbIc,TIcVbである。この3つの属性の組につい
て、ここでは任意のTVcを配置する。
【0117】以上のような操作をAeff の部分集合の属
性を使って行う。その結果の一部を図11に示す。但
し、*印をつけたノードは、これまでの手続きでは分離
することができない。
【0118】(F)第6実施例 本実施例では、少なくとも一つの属性が状態(i) のカテ
ゴリーの組み合わせの分類する属性の組を求め、求めた
組のすべての組のそれぞれの属性に対し、評価関数に基
づいて評価し、上記で求めた互いに識別可能な属性の組
の中で任意の組を選択し、その選択した属性の組をノー
ドに配置する際は、識別が効率的になるように効率的な
属性から優先して配置する。したがって本実施例では効
率的な属性の組は選択されていないが、選択された属性
の組をノードに配置する際においては効率的な属性を優
先して配置するようにしている。
【0119】(14)式の組の中でA3 を選択する。
【0120】7)識別木の各ノードへの属性(図6のフ
ローチャートの7に相当する) 識別木の各ノードへの配置は次のようにする。まず根ノ
ードに関してはA3 のうち評価値F(TK )が最も大き
い方を根ノードに考える。ここではF(TVa)=F(T
Vc)なのでTVaとする。属性の重なりの状態により、属
性の分布に重なりのない領域、属性の分布に重なる領域
に分かれる。
【0121】属性がこれらの重なりのない領域の値にな
った場合には、根ノードで分類が完了する。重なりのあ
る領域はカテゴリー間の分類が不可能であり、他の属性
で再度分類する。すなわち、前者は葉ノードNe とし、
後者は再分類ノードNc とする。Nc における集合NC'
は例えば図10に示した領域1に関しては、(Cca,C
ab,Ca )となる。
【0122】次に再分類ノードに配置する属性は次のよ
うに選択する。領域1を例にとればSC'の要素の2つず
つのカテゴリーをそれぞれ分類可能とする。属性は次式
のようになる。但し、f(Ci ,Cj )=f(Cj ,C
i )である。
【0123】 f(Cca,Cab)=TIb+TIc+TVb+TVc (21) f(Cab,Ca )=TV0+TI0+TIa+TIb+TVb+TVc (22) f(Ca ,Cca)=TV0+TI0+TIa+TIc+TVc (23) SC'の全要素を分類可能とする属性は、これらの論理積
により次式のように求まる。
【0124】 f(Cca,Cab)f(Cab,Ca )f(Ca ,Cca) =TV0Ib+TV0Ic+TI0Ib+TI0Ic+TIaIb+TIaIc +TIbIc+TVc+TV0Vb+TI0Vb+TIaVb+TICVb (24) この結果、A3 の部分集合となっている属性はTVc,T
IbIc,TIcVbである。この3つの属性の組につい
て、それぞれの属性の評価値F(Tk )が最も大きい方
を根ノードと考える。ここではTVcの属性の組が最大と
なるのでTVcを配置する。
【0125】以上のような操作をA3 の部分集合の属性
を使って行う。その結果の一部を図11に示す。但し、
*印をつけたノードは、これまでの手続きでは分離する
ことができない。
【0126】(G)第7実施例 本実施例では、子ノードの分割を行う際には、最も効率
的な属性を選択せず、任意の属性を選択するものであ
る。したがって、本実施例は子ノードの分割を行う際、
効率的な属性を選択しない点が特徴である。
【0127】第1実施例の9−1),9−2),9−
3)を省き、9−4)を以下のように変更する。
【0128】9−4)子ノードの識別 任意の属性TVaより識別する子名ー度としてカテゴリー
Da* ,CDb* ,CDb Dc*,CN Da Db Dc* を識別する
ことができる。その結果を図11に示す。
【0129】(H)第8実施例 本実施例は、少なくとも一つの属性が状態(i) のカテゴ
リーの組み合わせの分類する属性の組を求め、求めた組
の中から、任意に1組を選び、さらに選択した属性の組
をノードに配置する際にも、任意の属性を配置するもの
である。これは、効率的な属性の組を選択する点とさら
にはその属性の組をノードに配置する際には効率的な属
性から配置するということが考慮されず、任意に選択配
置する点が第1実施例と異なる。
【0130】また属性値の分布が少なくとも一つの属性
により、完全にカテゴリーを分類する属性をのみ使って
識別木を作成しようとするものである。即ち、状態(i)
のカテゴリーの組み合わせだけを考える方法である。言
い換えれば、図8の実線の組み合わせを分類する属性を
使って識別木を作成するもので、属性の分布が状態(i
i),(iii)のカテゴリーを識別することについては考慮し
ない。
【0131】第8実施例は第3実施例と第4実施例の両
方の効率を犠牲にしたものであり、第1実施例に対し第
3実施例と第4実施例の両方の変更点を変更する。
【0132】(I)第9実施例 本実施例では、少なくとも一つの属性が状態(i) のカテ
ゴリーの組み合わせの分類する属性の組を求め、求めた
組の中から最も効率的な属性の組を求め、さらにその属
性の組をノードに配置する際は任意に属性を選択してノ
ードに配置するものである。したがって、第1, 第2実
施例とは、属性の組を選択するところまでは効率を考慮
して同じであるが、その属性の組をノードに配置する場
合において、任意に選択することとしており、その点、
効率が考慮されていない点が相違する。
【0133】また属性値の分布が少なくとも一つの属性
により、完全にカテゴリーを分類する属性をのみ使って
識別木を作成しようとするものである。即ち、状態(i)
のカテゴリーの組み合わせだけを考える方法である。言
い換えれば、図8の実線の組み合わせを分類する属性を
使って識別木を作成するもので、属性の分布が状態(i
i),(iii)のカテゴリーを識別することについては考慮し
ない。
【0134】第9実施例は第3実施例と第5実施例の両
方の効率を犠牲にしたものであり、第1実施例に対し第
3実施例と第5実施例の両方の変更点を変更する。
【0135】(J)第10実施例 本実施例では、少なくとも一つの属性が状態(i) のカテ
ゴリーの組み合わせの分類する属性の組を求め、求めた
組のすべての組のそれぞれの属性に対し、評価関数に基
づいて評価し、上記で求めた互いに識別可能な属性の組
の中で任意の組を選択し、その選択した属性の組をノー
ドに配置する際は、識別が効率的になるように効率的な
属性から優先して配置する。したがって本実施例では効
率的な属性の組は選択されていないが、選択された属性
の組をノードに配置する際においては効率的な属性を優
先して配置するようにしている。
【0136】また属性値の分布が少なくとも一つの属性
により、完全にカテゴリーを分類する属性をのみ使って
識別木を作成しようとするものである。即ち、状態(i)
のカテゴリーの組み合わせだけを考える方法である。言
い換えれば、図8の実線の組み合わせを分類する属性を
使って識別木を作成するもので、属性の分布が状態(i
i),(iii)のカテゴリーを識別することについては考慮し
ない。
【0137】第10実施例は第3実施例と第6実施例の
両方の効率を犠牲にしたものであり、第1実施例に対し
第3実施例と第6実施例の両方の変更点を変更する。
【0138】(K)第11実施例 本実施例は、少なくとも一つの属性が状態(i) のカテゴ
リーの組み合わせの分類する属性の組を求め、求めた組
の中から、任意に1組を選び、さらに選択した属性の組
をノードに配置する際にも、任意の属性を配置するもの
である。これは、効率的な属性の組を選択する点とさら
にはその属性の組をノードに配置する際には効率的な属
性から配置するということが考慮されず、任意に選択配
置する点が第1実施例と異なる。
【0139】また本実施例では、子ノードの分割を行う
際には、最も効率的な属性を選択せず、任意の属性を選
択するものである。したがって、本実施例は子ノードの
分割を行う際、効率的な属性を選択しない点が特徴であ
る。
【0140】第11実施例は第4実施例と第7実施例の
両方の効率を犠牲にしたものであり、第1実施例に対し
第4実施例と第7実施例の両方の変更点を変更する。
【0141】(L)第12実施例 本実施例では、少なくとも一つの属性が状態(i) のカテ
ゴリーの組み合わせの分類する属性の組を求め、求めた
組の中から最も効率的な属性の組を求め、さらにその属
性の組をノードに配置する際は任意に属性を選択してノ
ードに配置するものである。したがって、第1, 第2実
施例とは、属性の組を選択するところまでは効率を考慮
して同じであるが、その属性の組をノードに配置する場
合において、任意に選択することとしており、その点、
効率が考慮されていない点が相違する。
【0142】また本実施例では、子ノードの分割を行う
際には、最も効率的な属性を選択せず、任意の属性を選
択するものである。したがって、本実施例は子ノードの
分割を行う際、効率的な属性を選択しない点が特徴であ
る。
【0143】第12実施例は第5実施例と第7実施例の
両方の効率を犠牲にしたものであり、第1実施例に対し
第5実施例と第7実施例の両方の変更点を変更する。
【0144】(M)第13実施例 本実施例では、少なくとも一つの属性が状態(i) のカテ
ゴリーの組み合わせの分類する属性の組を求め、求めた
組のすべての組のそれぞれの属性に対し、評価関数に基
づいて評価し、上記で求めた互いに識別可能な属性の組
の中で任意の組を選択し、その選択した属性の組をノー
ドに配置する際は、識別が効率的になるように効率的な
属性から優先して配置する。したがって本実施例では効
率的な属性の組は選択されていないが、選択された属性
の組をノードに配置する際においては効率的な属性を優
先して配置するようにしている。
【0145】また本実施例では、子ノードの分割を行う
際には、最も効率的な属性を選択せず、任意の属性を選
択するものである。したがって、本実施例は子ノードの
分割を行う際、効率的な属性を選択しない点が特徴であ
る。
【0146】第13実施例は第6実施例と第7実施例の
両方の効率を犠牲にしたものであり、第1実施例に対し
第6実施例と第7実施例の両方の変更点を変更する。
【0147】(N)第14実施例 本実施例では少なくとも一つの属性が状態(i)である
カテゴリーの組合せにおいてカテゴリーCi と他のすべ
てのカテゴリーを分類する属性の組を求め、さらにはす
べてのカテゴリーを分類する属性の組を求めるという2
段階のステップを行っていたが本実施例では上記ステッ
プを一度に行うところにある。
【0148】また属性値の分布が少なくとも一つの属性
により、完全にカテゴリーを分類する属性をのみ使って
識別木を作成しようとするものである。即ち、状態(i)
のカテゴリーの組み合わせだけを考える方法である。言
い換えれば、図8の実線の組み合わせを分類する属性を
使って識別木を作成するもので、属性の分布が状態(i
i),(iii)のカテゴリーを識別することについては考慮し
ない。
【0149】第14実施例は第2実施例に対し、第3実
施例の効率を犠牲にしたものであり、第1実施例に対し
第2実施例と第3実施例の両方の変更点を変更する。
【0150】(O)第15実施例 本実施例では少なくとも一つの属性が状態(i)である
カテゴリーの組合せにおいてカテゴリーCi と他のすべ
てのカテゴリーを分類する属性の組を求め、さらにはす
べてのカテゴリーを分類する属性の組を求めるという2
段階のステップを行っていたが本実施例では上記ステッ
プを一度に行うところにある。
【0151】また本実施例は、少なくとも一つの属性が
状態(i) のカテゴリーの組み合わせの分類する属性の組
を求め、求めた組の中から、任意に1組を選び、さらに
選択した属性の組をノードに配置する際にも、任意の属
性を配置するものである。これは、効率的な属性の組を
選択する点とさらにはその属性の組をノードに配置する
際には効率的な属性から配置するということが考慮され
ず、任意に選択配置する点が第1実施例と異なる。
【0152】第15実施例は第2実施例に対し、第4実
施例の効率を犠牲にしたものであり、第1実施例に対し
第2実施例と第4実施例の両方の変更点を変更する。
【0153】(P)第16実施例 本実施例では少なくとも一つの属性が状態(i)である
カテゴリーの組合せにおいてカテゴリーCi と他のすべ
てのカテゴリーを分類する属性の組を求め、さらにはす
べてのカテゴリーを分類する属性の組を求めるという2
段階のステップを行っていたが本実施例では上記ステッ
プを一度に行うところにある。
【0154】また本実施例では、少なくとも一つの属性
が状態(i) のカテゴリーの組み合わせの分類する属性の
組を求め、求めた組の中から最も効率的な属性の組を求
め、さらにその属性の組をノードに配置する際は任意に
属性を選択してノードに配置するものである。したがっ
て、第1, 第2実施例とは、属性の組を選択するところ
までは効率を考慮して同じであるが、その属性の組をノ
ードに配置する場合において、任意に選択することとし
ており、その点、効率が考慮されていない点が相違す
る。
【0155】第16実施例は第2実施例に対し、第5実
施例の効率を犠牲にしたものであり、第1実施例に対し
第2実施例と第5実施例の両方の変更点を変更する。
【0156】(Q)第17実施例 本実施例では少なくとも一つの属性が状態(i)である
カテゴリーの組合せにおいてカテゴリーCi と他のすべ
てのカテゴリーを分類する属性の組を求め、さらにはす
べてのカテゴリーを分類する属性の組を求めるという2
段階のステップを行っていたが本実施例では上記ステッ
プを一度に行うところにある。
【0157】また本実施例では、少なくとも一つの属性
が状態(i) のカテゴリーの組み合わせの分類する属性の
組を求め、求めた組のすべての組のそれぞれの属性に対
し、評価関数に基づいて評価し、上記で求めた互いに識
別可能な属性の組の中で任意の組を選択し、その選択し
た属性の組をノードに配置する際は、識別が効率的にな
るように効率的な属性から優先して配置する。したがっ
て本実施例では効率的な属性の組は選択されていない
が、選択された属性の組をノードに配置する際において
は効率的な属性を優先して配置するようにしている。
【0158】第17実施例は第2実施例に対し、第6実
施例の効率を犠牲にしたものであり、第1実施例に対し
第2実施例と第6実施例の両方の変更点を変更する。
【0159】(R)第18実施例 本実施例では少なくとも一つの属性が状態(i)である
カテゴリーの組合せにおいてカテゴリーCi と他のすべ
てのカテゴリーを分類する属性の組を求め、さらにはす
べてのカテゴリーを分類する属性の組を求めるという2
段階のステップを行っていたが本実施例では上記ステッ
プを一度に行うところにある。
【0160】また本実施例では、子ノードの分割を行う
際には、最も効率的な属性を選択せず、任意の属性を選
択するものである。したがって、本実施例は子ノードの
分割を行う際、効率的な属性を選択しない点が特徴であ
る。
【0161】第18実施例は第2実施例に対し、第7実
施例の効率を犠牲にしたものであり、第1実施例に対し
第2実施例と第7実施例の両方の変更点を変更する。
【0162】(S)第19実施例 本実施例では少なくとも一つの属性が状態(i)である
カテゴリーの組合せにおいてカテゴリーCi と他のすべ
てのカテゴリーを分類する属性の組を求め、さらにはす
べてのカテゴリーを分類する属性の組を求めるという2
段階のステップを行っていたが本実施例では上記ステッ
プを一度に行うところにある。
【0163】また本実施例は、少なくとも一つの属性が
状態(i) のカテゴリーの組み合わせの分類する属性の組
を求め、求めた組の中から、任意に1組を選び、さらに
選択した属性の組をノードに配置する際にも、任意の属
性を配置するものである。これは、効率的な属性の組を
選択する点とさらにはその属性の組をノードに配置する
際には効率的な属性から配置するということが考慮され
ず、任意に選択配置する点が第1実施例と異なる。
【0164】また属性値の分布が少なくとも一つの属性
により、完全にカテゴリーを分類する属性をのみ使って
識別木を作成しようとするものである。即ち、状態(i)
のカテゴリーの組み合わせだけを考える方法である。言
い換えれば、図8の実線の組み合わせを分類する属性を
使って識別木を作成するもので、属性の分布が状態(i
i),(iii)のカテゴリーを識別することについては考慮し
ない。
【0165】第19実施例は第2実施例に対し、第3実
施例と第4実施例の両方の効率を犠牲にしたものであ
り、第1実施例に対し第2実施例と第3実施例と第4実
施例の三つの変更点を変更する。(T)第20実施例 本実施例では少なくとも一つの属性が状態(i)である
カテゴリーの組合せにおいてカテゴリーCi と他のすべ
てのカテゴリーを分類する属性の組を求め、さらにはす
べてのカテゴリーを分類する属性の組を求めるという2
段階のステップを行っていたが本実施例では上記ステッ
プを一度に行うところにある。
【0166】また本実施例では、少なくとも一つの属性
が状態(i) のカテゴリーの組み合わせの分類する属性の
組を求め、求めた組の中から最も効率的な属性の組を求
め、さらにその属性の組をノードに配置する際は任意に
属性を選択してノードに配置するものである。したがっ
て、第1, 第2実施例とは、属性の組を選択するところ
までは効率を考慮して同じであるが、その属性の組をノ
ードに配置する場合において、任意に選択することとし
ており、その点、効率が考慮されていない点が相違す
る。
【0167】また属性値の分布が少なくとも一つの属性
により、完全にカテゴリーを分類する属性をのみ使って
識別木を作成しようとするものである。即ち、状態(i)
のカテゴリーの組み合わせだけを考える方法である。言
い換えれば、図8の実線の組み合わせを分類する属性を
使って識別木を作成するもので、属性の分布が状態(i
i),(iii)のカテゴリーを識別することについては考慮し
ない。
【0168】第20実施例は第2実施例に対し、第3実
施例と第5実施例の両方の効率を犠牲にしたものであ
り、第1実施例に対し第2実施例と第3実施例と第5実
施例の三つの変更点を変更する。(U)第21実施例 本実施例では少なくとも一つの属性が状態(i)である
カテゴリーの組合せにおいてカテゴリーCi と他のすべ
てのカテゴリーを分類する属性の組を求め、さらにはす
べてのカテゴリーを分類する属性の組を求めるという2
段階のステップを行っていたが本実施例では上記ステッ
プを一度に行うところにある。
【0169】また本実施例では、少なくとも一つの属性
が状態(i) のカテゴリーの組み合わせの分類する属性の
組を求め、求めた組のすべての組のそれぞれの属性に対
し、評価関数に基づいて評価し、上記で求めた互いに識
別可能な属性の組の中で任意の組を選択し、その選択し
た属性の組をノードに配置する際は、識別が効率的にな
るように効率的な属性から優先して配置する。したがっ
て本実施例では効率的な属性の組は選択されていない
が、選択された属性の組をノードに配置する際において
は効率的な属性を優先して配置するようにしている。
【0170】また属性値の分布が少なくとも一つの属性
により、完全にカテゴリーを分類する属性をのみ使って
識別木を作成しようとするものである。即ち、状態(i)
のカテゴリーの組み合わせだけを考える方法である。言
い換えれば、図8の実線の組み合わせを分類する属性を
使って識別木を作成するもので、属性の分布が状態(i
i),(iii)のカテゴリーを識別することについては考慮し
ない。
【0171】第21実施例は第2実施例に対し、第3実
施例と第6実施例の両方の効率を犠牲にしたものであ
り、第1実施例に対し第2実施例と第3実施例と第6実
施例の三つの変更点を変更する。(V)第22実施例 本実施例では少なくとも一つの属性が状態(i)である
カテゴリーの組合せにおいてカテゴリーCi と他のすべ
てのカテゴリーを分類する属性の組を求め、さらにはす
べてのカテゴリーを分類する属性の組を求めるという2
段階のステップを行っていたが本実施例では上記ステッ
プを一度に行うところにある。
【0172】また本実施例は、少なくとも一つの属性が
状態(i) のカテゴリーの組み合わせの分類する属性の組
を求め、求めた組の中から、任意に1組を選び、さらに
選択した属性の組をノードに配置する際にも、任意の属
性を配置するものである。これは、効率的な属性の組を
選択する点とさらにはその属性の組をノードに配置する
際には効率的な属性から配置するということが考慮され
ず、任意に選択配置する点が第1実施例と異なる。
【0173】また本実施例では、子ノードの分割を行う
際には、最も効率的な属性を選択せず、任意の属性を選
択するものである。したがって、本実施例は子ノードの
分割を行う際、効率的な属性を選択しない点が特徴であ
る。
【0174】第22実施例は第2実施例に対し、第4実
施例と第7実施例の両方の効率を犠牲にしたものであ
り、第1実施例に対し第2実施例と第4実施例と第7実
施例の三つの変更点を変更する。(W)第23実施例 本実施例では少なくとも一つの属性が状態(i)である
カテゴリーの組合せにおいてカテゴリーCi と他のすべ
てのカテゴリーを分類する属性の組を求め、さらにはす
べてのカテゴリーを分類する属性の組を求めるという2
段階のステップを行っていたが本実施例では上記ステッ
プを一度に行うところにある。
【0175】また本実施例では、少なくとも一つの属性
が状態(i) のカテゴリーの組み合わせの分類する属性の
組を求め、求めた組の中から最も効率的な属性の組を求
め、さらにその属性の組をノードに配置する際は任意に
属性を選択してノードに配置するものである。したがっ
て、第1, 第2実施例とは、属性の組を選択するところ
までは効率を考慮して同じであるが、その属性の組をノ
ードに配置する場合において、任意に選択することとし
ており、その点、効率が考慮されていない点が相違す
る。
【0176】また本実施例では、子ノードの分割を行う
際には、最も効率的な属性を選択せず、任意の属性を選
択するものである。したがって、本実施例は子ノードの
分割を行う際、効率的な属性を選択しない点が特徴であ
る。
【0177】第23実施例は第2実施例に対し、第5実
施例と第7実施例の両方の効率を犠牲にしたものであ
り、第1実施例に対し第2実施例と第5実施例と第7実
施例の三つの変更点を変更する。(X)第24実施例 本実施例では少なくとも一つの属性が状態(i)である
カテゴリーの組合せにおいてカテゴリーCi と他のすべ
てのカテゴリーを分類する属性の組を求め、さらにはす
べてのカテゴリーを分類する属性の組を求めるという2
段階のステップを行っていたが本実施例では上記ステッ
プを一度に行うところにある。
【0178】また本実施例では、少なくとも一つの属性
が状態(i) のカテゴリーの組み合わせの分類する属性の
組を求め、求めた組のすべての組のそれぞれの属性に対
し、評価関数に基づいて評価し、上記で求めた互いに識
別可能な属性の組の中で任意の組を選択し、その選択し
た属性の組をノードに配置する際は、識別が効率的にな
るように効率的な属性から優先して配置する。したがっ
て本実施例では効率的な属性の組は選択されていない
が、選択された属性の組をノードに配置する際において
は効率的な属性を優先して配置するようにしている。
【0179】また本実施例では、子ノードの分割を行う
際には、最も効率的な属性を選択せず、任意の属性を選
択するものである。したがって、本実施例は子ノードの
分割を行う際、効率的な属性を選択しない点が特徴であ
る。
【0180】第24実施例は第2実施例に対し、第6実
施例と第7実施例の両方の効率を犠牲にしたものであ
り、第1実施例に対し第2実施例と第6実施例と第7実
施例の三つの変更点を変更する。
【0181】
【発明の効果】以上に述べたように、本発明によれば下
記の効果を奏する。
【0182】 任意の2つのカテゴリーにおいて、属
性値の分布が完全に分離していなくても、属性値の重な
りのない部分は分類することができる。
【0183】 重なりのある部分、すなわちカテゴリ
ーが識別できない部分についても、属性の確率分布を求
めることにより、重なりのある部分の確率を求め、カテ
ゴリーの推定を行うことができる。
【0184】 任意の属性値が得られた場合、出現確
率を求めることができ、その属性によってカテゴリーが
分離できなかった場合、どちらのカテゴリーに属するか
の確度を知ることができる。
【0185】 識別木およびフローチャートより、ど
んなカテゴリーが分類できないかがわかり、そのときの
属性値の範囲を知ることができる。
【0186】 データの属性値が分布をもつ場合、診
断、パターン認識、画像処理などいろいろな分類に適用
できる。
【0187】 シミュレータなどで属性値の分布を求
めている場合、シミュレータのパラメータを変えても、
その変化に伴いデータの分類を機械学習により学習させ
ることにより、迅速に作成することができる。
【0188】 人間の主観が入らないアルゴリズムを
自動的に作成することができる。
【0189】 効率のよいアルゴリズムを作成するこ
とができる。
【0190】 データに不要な属性を知ることができ
る。
【図面の簡単な説明】
【図1】 表1のデータに基づく識別木学習の結果を示
す説明図である。
【図2】 属性値分布と任意の2つのカテゴリーの関係
を示す説明図である。
【図3】 一部に重なりがある場合のカテゴリーの分類
を示す説明図である。
【図4】 属性に重なりのある部分の出現確率と任意の
値での出現確率を表す説明図である。
【図5】 本発明におけるアルゴリズムの作成の手順を
示す概念図である。
【図6】 本発明の全体的なフローチャートである。
【図7】 本発明実施例における配電線線路モデルの系
統図である。
【図8】 カテゴリー間の分類可能,不可能の関係を示
す説明図である。
【図9】 属性が重なるカテゴリーの分布の説明図であ
る。
【図10】 各カテゴリーの属性値の分布の例を示す図
である。
【図11】 本発明実施例における識別木の説明図であ
る。
【図12】 本発明におけるカテゴリーの分割の例を示
す説明図である。
【図13】 本発明における電流の確率分布の例を示す
グラフである。
【図14】 本発明を事故診断に適用した例を示すフロ
ーチャートのである。
【図15】 本発明を事故診断に適用した例を示すフロ
ーチャートのである。
【図16】 本発明を事故診断に適用した例を示すフロ
ーチャートのである。
【図17】 本発明を事故診断に適用した例を示すフロ
ーチャートのである。
【図18】 本発明を事故診断に適用した例を示すフロ
ーチャートのである。
【図19】 本発明を事故診断に適用した例を示すフロ
ーチャートのである。

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】(a)データを分類するカテゴリーC1
    i 〜Cm を設定し、それぞれのカテゴリーが持つ属性
    1 〜Tj 〜Tn 毎に測定データを集計するかあるいは
    計算によりシミュレートするステップと、(b)集計ま
    たは計算されたデータに対応するカテゴリーに区分けし
    て各属性毎の分布をとるステップと、(c)集計または
    計算されたデータ毎の分布に着目したカテゴリーCi
    他のカテゴリーCj との属性値の分布の重なりの状態に
    基づいて、少なくとも1つの属性の分布においてカテゴ
    リーCi からCj を完全に識別できる状態(i) か、カテ
    ゴリーCi とCj においてCi の属性の分布がCj の属
    性の分布と一部分重なりのある状態(ii)かまたはカテゴ
    リーCi とCj においてCi の属性の分布がCjの属性
    の分布に包含される状態(iii) に判別するステップと、
    (d)前記カテゴリーCi とCj が状態(i) にある任意
    の一つのカテゴリーと任意の1つのカテゴリーを分類可
    能とする属性集合の組を選択する場合、分類可能な属性
    を1、分類できない属性を0という論理変数を設定し、
    論理和の形に表現するステップと、(e)前記カテゴリ
    ーCi とCj が状態(i) の組合せにおいて、カテゴリー
    iと他のすべてのカテゴリーとを分類可能とする属性
    集合の組を求める場合、 (d) で求めた論理式の論理積
    で求めるステップと、(f)前記カテゴリーCi とCj
    が状態(i) の組合せにおいて、すべてのカテゴリーを互
    いに分類可能とするための属性集合の組を(e)で求め
    た論理式の論理積で求めるステップと、(g)前記属性
    の組の中から、識別木作成に最も効率的な属性の組を選
    択するために、属性値の分布の重なり状態、カテゴリー
    i の出現頻度に基づく評価関数により評価を行い、最
    も効率的な属性の組を選択するステップと、(h)前記
    において選択した属性の組の中で、評価式が最大となる
    属性を親ノードとして配置し、属性の分布が他のカテゴ
    リーと重なっていない範囲は親ノードで分類を完了さ
    せ、重なっている範囲においては他のカテゴリーと分類
    できなかったカテゴリーを子ノードとして配置し、その
    子ノードの組の間で前記(c)〜(f)のステップの処
    理を行ってステップ(g)で選択した属性の組の中で評
    価式が親ノードでの分類に使用した属性を除いた属性の
    内で最大となる属性を前記子ノードに対する親ノードと
    して配置し、これらの処理をカテゴリーCi と状態(i)
    にあるカテゴリーCj との間において再識別ノードがな
    くなるまで行うステップと、(i)上記ステップにおい
    て分類できなかった子ノードにおいてはステップ(c)
    における状態(ii)または(iii) の場合を考え、カテゴリ
    ーの分割を、ある属性分布Tk においてあるs個のカテ
    ゴリーC1 ,…,Ci ,…Cs が重なりあっている場
    合、ある属性Tk において任意のカテゴリーCi は他の
    すべてのカテゴリーと重なりのない部分、任意のカテゴ
    リーCi と他の任意の1個のカテゴリーが重なる部分、
    任意のカテゴリーCi と他の任意の2個のカテゴリーが
    重なる部分、・・・、任意のカテゴリーCi と他の任意
    のs−2個のカテゴリーが重なる部分、任意のカテゴリ
    ーCi と他の任意のs−1個のカテゴリーが重なる部分
    に分け、この分割により、分割された新たなカテゴリー
    を作り、分割したカテゴリーがすべての属性Tk に対し
    て空集合の場合、新たなカテゴリーは作らないとするス
    テップと、(j)属性を用いる時に用いたパラメータの
    確率分布より任意の属性分布における属性の確率分布を
    求めるステップと、(k)(j)で求めた属性の確率分
    布において、ある任意の2つのカテゴリーにおいて、属
    性の分布に重なりのある場合、それぞれのカテゴリーの
    重なりのある部分の確率と重なりのない部分の確率を求
    めるステップと、(l)任意の属性値が得られ、その属
    性値の確率および出現頻度を求め、または属性値により
    カテゴリーの識別ができない場合、(j)で求めた属性
    の確率分布により、どのカテゴリーに属する確率が高い
    かを求めるステップと、(m)(i)で求めたカテゴリ
    ーの分割によってできた新しいカテゴリーに対し、属性
    値の分布の重なりの確率とカテゴリーCi の出現頻度に
    基づく評価関数により、評価を行い、最も効率的な属性
    を選択し、(h)までのステップで分類できなかった子
    ノードに対し、最も効率的な属性によって分類するステ
    ップと、(n)識別木よりデータの分類のフローチャー
    トを作成するステップとを有し、このフローチャートに
    よりデータの分類を行うことを特徴とするデータの分類
    方法。
  2. 【請求項2】(a)データを分類するカテゴリーC1
    i 〜Cm を設定し、それぞれのカテゴリーが持つ属性
    1 〜Tj 〜Tn 毎に測定データを集計するかあるいは
    計算によりシミュレートするステップと、(b)集計ま
    たは計算されたデータに対応するカテゴリーに区分けし
    て各属性毎の分布をとるステップと、(c)集計または
    計算されたデータ毎の分布に着目したカテゴリーCi
    他のカテゴリーCj との属性値の分布の重なりの状態に
    基づいて、少なくとも1つの属性の分布においてカテゴ
    リーCi からCj を完全に識別できる状態(i) か、カテ
    ゴリーCi とCj においてCi の属性の分布がCj の属
    性の分布と一部分重なりのある状態(ii)かまたはカテゴ
    リーCi とCj においてCi の属性の分布がCjの属性
    の分布に包含される状態(iii) に判別するステップと、
    (d)前記カテゴリーCi とCj が状態(i) にある任意
    の一つのカテゴリーと任意の1つのカテゴリーを分類可
    能とする属性集合の組を選択する場合、分類可能な属性
    を1、分類できない属性を0という論理変数を設定し、
    論理和の形に表現するステップと、(e)前記カテゴリ
    ーCi とCj が状態(i) の組合せすべてのカテゴリーに
    おいて、(d)で求めた論理式の論理積をとることによ
    り、すべてのカテゴリーを互いに分類可能とするための
    属性の組を求めるステップと、(f)前記属性の組の中
    から、識別木作成に最も効率的な属性の組を選択するた
    めに、属性値の分布の重なり状態、カテゴリーCi の出
    現頻度に基づく評価関数により評価を行い、最も効率的
    な属性の組を選択するステップと、(g)前記において
    選択した属性の組の中で、評価式が最大となる属性を親
    ノードとして配置し、属性の分布が他のカテゴリーと重
    なっていない範囲は親ノードで分類を完了させ、重なっ
    ている範囲においては他のカテゴリーと分類できなかっ
    たカテゴリーを子ノードとして配置し、その子ノードの
    組の間で前記(c)〜(e)のステップの処理を行って
    ステップ(f)で選択した属性の組の中で評価式が親ノ
    ードでの分類に使用した属性を除いた属性の内で最大と
    なる属性を前記子ノードに対する親ノードとして配置
    し、これらの処理をカテゴリーCi と状態(i) にあるカ
    テゴリーCj との間において再識別ノードがなくなるま
    で行うステップと、(h)上記ステップにおいて分類で
    きなかった子ノードにおいてはステップ(c)における
    状態(ii)または(iii) の場合を考え、カテゴリーの分割
    を、ある属性分布Tk においてあるs個のカテゴリーC
    1 ,…,Ci ,…Cs が重なりあっている場合、ある属
    性Tk において任意のカテゴリーCi は他のすべてのカ
    テゴリーと重なりのない部分、任意のカテゴリーCi
    他の任意の1個のカテゴリーが重なる部分、任意のカテ
    ゴリーCi と他の任意の2個のカテゴリーが重なる部
    分、・・・、任意のカテゴリーCi と他の任意のs−2
    個のカテゴリーが重なる部分、任意のカテゴリーCi
    他の任意のs−1個のカテゴリーが重なる部分に分け、
    この分割により、分割された新たなカテゴリーを作り、
    分割したカテゴリーがすべての属性Tk に対して空集合
    の場合、新たなカテゴリーは作らないとするステップ
    と、(i)属性を用いる時に用いたパラメータの確率分
    布より任意の属性分布における属性の確率分布を求める
    ステップと、(j)(i)で求めた属性の確率分布にお
    いて、ある任意の2つのカテゴリーにおいて、属性の分
    布に重なりのある場合、それぞれのカテゴリーの重なり
    のある部分の確率と重なりのない部分の確率を求めるス
    テップと、(k)任意の属性値が得られ、その属性値の
    確率および出現頻度を求め、または属性値によりカテゴ
    リーの識別ができない場合、(i)で求めた属性の確率
    分布により、どのカテゴリーに属する確率が高いかを求
    めるステップと、(l)(h)で求めたカテゴリーの分
    割によってできた新しいカテゴリーに対し、属性値の分
    布の重なりの確率とカテゴリーCi の出現頻度に基づく
    評価関数により、評価を行い、最も効率的な属性を選択
    し、(g)までのステップで分類できなかった子ノード
    に対し、最も効率的な属性によって分類するステップ
    と、(m)識別木よりデータの分類のフローチャートを
    作成するステップとを有し、このフローチャートにより
    データの分類を行うことを特徴とするデータの分類方
    法。
  3. 【請求項3】(a)データを分類するカテゴリーC1
    i 〜Cm を設定し、それぞれのカテゴリーが持つ属性
    1 〜Tj 〜Tn 毎に測定データを集計するかあるいは
    計算によりシミュレートするステップと、(b)集計ま
    たは計算されたデータに対応するカテゴリーに区分けし
    て各属性毎の分布をとるステップと、(c)集計または
    計算されたデータ毎の分布に着目したカテゴリーCi
    他のカテゴリーCj との属性値の分布の重なりの状態に
    基づいて、少なくとも1つの属性の分布においてカテゴ
    リーCi からCj を完全に識別できる状態(i) か、カテ
    ゴリーCi とCj においてCi の属性の分布がCj の属
    性の分布と一部分重なりのある状態(ii)かまたはカテゴ
    リーCi とCj においてCi の属性の分布がCjの属性
    の分布に包含される状態(iii) に判別するステップと、
    (d)前記カテゴリーCi とCj が状態(i) にある任意
    の一つのカテゴリーと任意の1つのカテゴリーを分類可
    能とする属性集合の組を選択する場合、分類可能な属性
    を1、分類できない属性を0という論理変数を設定し、
    論理和の形に表現するステップと、(e)前記カテゴリ
    ーCi とCj が状態(i) の組合せにおいて、カテゴリー
    iと他のすべてのカテゴリーとを分類可能とする属性
    集合の組を求める場合、 (d) で求めた論理式の論理積
    で求めるステップと、(f)前記カテゴリーCi とCj
    が状態(i) の組合せにおいて、すべてのカテゴリーを互
    いに分類可能とするための属性集合の組を(e)で求め
    た論理式の論理積で求めるステップと、(g)前記属性
    の組の中から、識別木作成に最も効率的な属性の組を選
    択するために、属性値の分布の重なり状態、カテゴリー
    i の出現頻度に基づく評価関数により評価を行い、最
    も効率的な属性の組を選択するステップと、(h)前記
    において選択した属性の組の中で、評価式が最大となる
    属性を親ノードとして配置し、属性の分布が他のカテゴ
    リーと重なっていない範囲は親ノードで分類を完了さ
    せ、重なっている範囲においては他のカテゴリーと分類
    できなかったカテゴリーを子ノードとして配置し、その
    子ノードの組の間で前記(c)〜(f)のステップの処
    理を行ってステップ(g)で選択した属性の組の中で評
    価式が親ノードでの分類に使用した属性を除いた属性の
    内で最大となる属性を前記子ノードに対する親ノードと
    して配置し、これらの処理をカテゴリーCi と状態(i)
    にあるカテゴリーCj との間において再識別ノードがな
    くなるまで行うステップ、(i)識別木よりデータの分
    類のフローチャートを作成するステップとを有し、この
    フローチャートによりデータの分類を行うことを特徴と
    するデータの分類方法。
  4. 【請求項4】(a)データを分類するカテゴリーC1
    i 〜Cm を設定し、それぞれのカテゴリーが持つ属性
    1 〜Tj 〜Tn 毎に測定データを集計するかあるいは
    計算によりシミュレートするステップと、(b)集計ま
    たは計算されたデータに対応するカテゴリーに区分けし
    て各属性毎の分布をとるステップと、(c)集計または
    計算されたデータ毎の分布に着目したカテゴリーCi
    他のカテゴリーCj との属性値の分布の重なりの状態に
    基づいて、少なくとも1つの属性の分布においてカテゴ
    リーCi からCj を完全に識別できる状態(i) か、カテ
    ゴリーCi とCj においてCi の属性の分布がCj の属
    性の分布と一部分重なりのある状態(ii)かまたはカテゴ
    リーCi とCj においてCi の属性の分布がCjの属性
    の分布に包含される状態(iii) に判別するステップと、
    (d)前記カテゴリーCi とCj が状態(i) にある任意
    の一つのカテゴリーと任意の1つのカテゴリーを分類可
    能とする属性集合の組を選択する場合、分類可能な属性
    を1、分類できない属性を0という論理変数を設定し、
    論理和の形に表現するステップと、(e)前記カテゴリ
    ーCi とCj が状態(i) の組合せにおいて、カテゴリー
    iと他のすべてのカテゴリーとを分類可能とする属性
    集合の組を求める場合、 (d) で求めた論理式の論理積
    で求めるステップと、(f)前記カテゴリーCi とCj
    が状態(i) の組合せにおいて、すべてのカテゴリーを互
    いに分類可能とするための属性集合の組を(e)で求め
    た論理式の論理積で求めるステップと、(g)前記で求
    めた属性の組の任意の1組の属性を選択し、その属性の
    組の中で任意の属性を親ノードとして配置し、属性の分
    布が他のカテゴリーと重なっていない範囲は親ノードで
    分類を完了させ、重なっている範囲においては他のカテ
    ゴリーと分類できなかったカテゴリーを子ノードとして
    配置し、その子ノードの組の間で前記(c)〜(f)の
    処理を行って親ノードでの分類に使用した属性を除いた
    属性の内で任意の属性を前記子ノードに体する親ノード
    として配置し、これらの処理をカテゴリーCi と状態
    (i) にあるカテゴリーCj との間において再識別ノード
    がなくなるまで行うステップと、(h)上記ステップに
    おいて分類できなかった子ノードにおいてはステップ
    (c)における状態(ii)または(iii) の場合を考え、カ
    テゴリーの分割を、ある属性分布Tk においてあるs個
    のカテゴリーC1 ,…,Ci ,…Cs が重なりあってい
    る場合、ある属性Tk において任意のカテゴリーCi
    他のすべてのカテゴリーと重なりのない部分、任意のカ
    テゴリーCi と他の任意の1個のカテゴリーが重なる部
    分、任意のカテゴリーCi と他の任意の2個のカテゴリ
    ーが重なる部分、・・・、任意のカテゴリーCi と他の
    任意のs−2個のカテゴリーが重なる部分、任意のカテ
    ゴリーCi と他の任意のs−1個のカテゴリーが重なる
    部分に分け、この分割により、分割された新たなカテゴ
    リーを作り、分割したカテゴリーがすべての属性Tk
    対して空集合の場合、新たなカテゴリーは作らないとす
    るステップと、(i)属性を用いる時に用いたパラメー
    タの確率分布より任意の属性分布における属性の確率分
    布を求めるステップと、(j)(i)で求めた属性の確
    率分布において、ある任意の2つのカテゴリーにおい
    て、属性の分布に重なりのある場合、それぞれのカテゴ
    リーの重なりのある部分の確率と重なりのない部分の確
    率を求めるステップと、(k)任意の属性値が得られ、
    その属性値の確率および出現頻度を求め、または属性値
    によりカテゴリーの識別ができない場合、(i)で求め
    た属性の確率分布により、どのカテゴリーに属する確率
    が高いかを求めるステップと、(l)(h)で求めたカ
    テゴリーの分割によってできた新しいカテゴリーに対
    し、属性値の分布の重なりの確率とカテゴリーCi の出
    現頻度に基づく評価関数により、評価を行い、最も効率
    的な属性を選択し、(g)までのステップで分類できな
    かった子ノードに対し、最も効率的な属性によって分類
    するステップと、(m)識別木よりデータの分類のフロ
    ーチャートを作成するステップとを有し、このフローチ
    ャートによりデータの分類を行うことを特徴とするデー
    タの分類方法。
  5. 【請求項5】(a)データを分類するカテゴリーC1
    i 〜Cm を設定し、それぞれのカテゴリーが持つ属性
    1 〜Tj 〜Tn 毎に測定データを集計するかあるいは
    計算によりシミュレートするステップと、(b)集計ま
    たは計算されたデータに対応するカテゴリーに区分けし
    て各属性毎の分布をとるステップと、(c)集計または
    計算されたデータ毎の分布に着目したカテゴリーCi
    他のカテゴリーCj との属性値の分布の重なりの状態に
    基づいて、少なくとも1つの属性の分布においてカテゴ
    リーCi からCj を完全に識別できる状態(i) か、カテ
    ゴリーCi とCj においてCi の属性の分布がCj の属
    性の分布と一部分重なりのある状態(ii)かまたはカテゴ
    リーCi とCj においてCi の属性の分布がCjの属性
    の分布に包含される状態(iii) に判別するステップと、
    (d)前記カテゴリーCi とCj が状態(i) にある任意
    の一つのカテゴリーと任意の1つのカテゴリーを分類可
    能とする属性集合の組を選択する場合、分類可能な属性
    を1、分類できない属性を0という論理変数を設定し、
    論理和の形に表現するステップと、(e)前記カテゴリ
    ーCi とCj が状態(i) の組合せにおいて、カテゴリー
    iと他のすべてのカテゴリーとを分類可能とする属性
    集合の組を求める場合、 (d) で求めた論理式の論理積
    で求めるステップと、(f)前記カテゴリーCi とCj
    が状態(i) の組合せにおいて、すべてのカテゴリーを互
    いに分類可能とするための属性集合の組を(e)で求め
    た論理式の論理積で求めるステップと、(g)前記属性
    の組の中から、識別木作成に最も効率的な属性の組を選
    択するために、属性値の分布の重なり状態、カテゴリー
    i の出現頻度に基づく評価関数により評価を行い、最
    も効率的な属性の組を選択するステップと、(h)前記
    において選択した属性の組の中で、任意の属性を親ノー
    ドとして配置し、属性の分布が他のカテゴリーと重なっ
    ていない範囲は親ノードで分類を完了させ、重なってい
    る範囲においては他のカテゴリーと分類できなかったカ
    テゴリーを子ノードとして配置し、その子ノードの組の
    間で前記(c)〜(f)のステップの処理を行ってステ
    ップ(g)で選択した属性の組の中で評価式が親ノード
    での分類に使用した属性を除いた属性の内で任意の属性
    を前記子ノードに対する親ノードとして配置し、これら
    の処理をカテゴリーCi と状態(i) にあるカテゴリーC
    j との間において再識別ノードがなくなるまで行うステ
    ップと、(i)上記ステップにおいて分類できなかった
    子ノードにおいてはステップ(c)における状態(ii)ま
    たは(iii) の場合を考え、カテゴリーの分割を、ある属
    性分布Tk においてあるs個のカテゴリーC1 ,…,C
    i ,…Cs が重なりあっている場合、ある属性Tk にお
    いて任意のカテゴリーCi は他のすべてのカテゴリーと
    重なりのない部分、任意のカテゴリーCi と他の任意の
    1個のカテゴリーが重なる部分、任意のカテゴリーCi
    と他の任意の2個のカテゴリーが重なる部分、・・・、
    任意のカテゴリーCi と他の任意のs−2個のカテゴリ
    ーが重なる部分、任意のカテゴリーCi と他の任意のs
    −1個のカテゴリーが重なる部分に分け、この分割によ
    り、分割された新たなカテゴリーを作り、分割したカテ
    ゴリーがすべての属性Tk に対して空集合の場合、新た
    なカテゴリーは作らないとするステップと、(j)属性
    を用いる時に用いたパラメータの確率分布より任意の属
    性分布における属性の確率分布を求めるステップと、
    (k)(j)で求めた属性の確率分布において、ある任
    意の2つのカテゴリーにおいて、属性の分布に重なりの
    ある場合、それぞれのカテゴリーの重なりのある部分の
    確率と重なりのない部分の確率を求めるステップと、
    (l)任意の属性値が得られ、その属性値の確率および
    出現頻度を求め、または属性値によりカテゴリーの識別
    ができない場合、(j)で求めた属性の確率分布によ
    り、どのカテゴリーに属する確率が高いかを求めるステ
    ップと、(m)(i)で求めたカテゴリーの分割によっ
    てできた新しいカテゴリーに対し、属性値の分布の重な
    りの確率とカテゴリーCi の出現頻度に基づく評価関数
    により、評価を行い、最も効率的な属性を選択し、
    (h)までのステップで分類できなかった子ノードに対
    し、最も効率的な属性によって分類するステップと、
    (n)識別木よりデータの分類のフローチャートを作成
    するステップとを有し、このフローチャートによりデー
    タの分類を行うことを特徴とするデータの分類方法。
  6. 【請求項6】(a)データを分類するカテゴリーC1
    i 〜Cm を設定し、それぞれのカテゴリーが持つ属性
    1 〜Tj 〜Tn 毎に測定データを集計するかあるいは
    計算によりシミュレートするステップと、(b)集計ま
    たは計算されたデータに対応するカテゴリーに区分けし
    て各属性毎の分布をとるステップと、(c)集計または
    計算されたデータ毎の分布に着目したカテゴリーCi
    他のカテゴリーCj との属性値の分布の重なりの状態に
    基づいて、少なくとも1つの属性の分布においてカテゴ
    リーCi からCj を完全に識別できる状態(i) か、カテ
    ゴリーCi とCj においてCi の属性の分布がCj の属
    性の分布と一部分重なりのある状態(ii)かまたはカテゴ
    リーCi とCj においてCi の属性の分布がCjの属性
    の分布に包含される状態(iii) に判別するステップと、
    (d)前記カテゴリーCi とCj が状態(i) にある任意
    の一つのカテゴリーと任意の1つのカテゴリーを分類可
    能とする属性集合の組を選択する場合、分類可能な属性
    を1、分類できない属性を0という論理変数を設定し、
    論理和の形に表現するステップと、(e)前記カテゴリ
    ーCi とCj が状態(i) の組合せにおいて、カテゴリー
    iと他のすべてのカテゴリーとを分類可能とする属性
    集合の組を求める場合、 (d) で求めた論理式の論理積
    で求めるステップと、(f)前記カテゴリーCi とCj
    が状態(i) の組合せにおいて、すべてのカテゴリーを互
    いに分類可能とするための属性集合の組を(e)で求め
    た論理式の論理積で求めて任意の属性の組を選択するス
    テップと、(g)前記属性の組の中から、識別木作成に
    最も効率的な属性のノードへの配置をするために、属性
    値の分布の重なり状態、カテゴリーCi の出現頻度に基
    づく評価関数により評価を行うステップと、(h)前記
    において選択した属性の組の中で、評価が最大となる属
    性を親ノードとして配置し、属性の分布が他のカテゴリ
    ーと重なっていない範囲は親ノードで分類を完了させ、
    重なっている範囲においては他のカテゴリーと分類でき
    なかったカテゴリーを子ノードとして配置し、その子ノ
    ードの組の間で前記(c)〜(f)のステップの処理を
    行ってステップ(g)で選択した属性の組の中で評価が
    親ノードでの分類に使用した属性を除いた属性の内で最
    大となる属性を前記子ノードに対する親ノードとして配
    置し、これらの処理をカテゴリーCi と状態(i)にある
    カテゴリーCj との間において再識別ノードがなくなる
    まで行うステップと、(i)上記ステップにおいて分類
    できなかった子ノードにおいてはステップ(c)におけ
    る状態(ii)または(iii) の場合を考え、カテゴリーの分
    割を、ある属性分布Tk においてあるs個のカテゴリー
    1 ,…,Ci ,…Cs が重なりあっている場合、ある
    属性Tk において任意のカテゴリーCi は他のすべての
    カテゴリーと重なりのない部分、任意のカテゴリーCi
    と他の任意の1個のカテゴリーが重なる部分、任意のカ
    テゴリーCi と他の任意の2個のカテゴリーが重なる部
    分、・・・、任意のカテゴリーCi と他の任意のs−2
    個のカテゴリーが重なる部分、任意のカテゴリーCi
    他の任意のs−1個のカテゴリーが重なる部分に分け、
    この分割により、分割された新たなカテゴリーを作り、
    分割したカテゴリーがすべての属性Tk に対して空集合
    の場合、新たなカテゴリーは作らないとするステップ
    と、(j)属性を用いる時に用いたパラメータの確率分
    布より任意の属性分布における属性の確率分布を求める
    ステップと、(k)(j)で求めた属性の確率分布にお
    いて、ある任意の2つのカテゴリーにおいて、属性の分
    布に重なりのある場合、それぞれのカテゴリーの重なり
    のある部分の確率と重なりのない部分の確率を求めるス
    テップと、(l)任意の属性値が得られ、その属性値の
    確率および出現頻度を求め、または属性値によりカテゴ
    リーの識別ができない場合、(j)で求めた属性の確率
    分布により、どのカテゴリーに属する確率が高いかを求
    めるステップと、(m)(i)で求めたカテゴリーの分
    割によってできた新しいカテゴリーに対し、属性値の分
    布の重なりの確率とカテゴリーCi の出現頻度に基づく
    評価関数により、評価を行い、最も効率的な属性を選択
    し、(h)までのステップで分類できなかった子ノード
    に対し、最も効率的な属性によって分類するステップ
    と、(n)識別木よりデータの分類のフローチャートを
    作成するステップとを有し、このフローチャートにより
    データの分類を行うことを特徴とするデータの分類方
    法。
  7. 【請求項7】(a)データを分類するカテゴリーC1
    i 〜Cm を設定し、それぞれのカテゴリーが持つ属性
    1 〜Tj 〜Tn 毎に測定データを集計するかあるいは
    計算によりシミュレートするステップと、(b)集計ま
    たは計算されたデータに対応するカテゴリーに区分けし
    て各属性毎の分布をとるステップと、(c)集計または
    計算されたデータ毎の分布に着目したカテゴリーCi
    他のカテゴリーCj との属性値の分布の重なりの状態に
    基づいて、少なくとも1つの属性の分布においてカテゴ
    リーCi からCj を完全に識別できる状態(i) か、カテ
    ゴリーCi とCj においてCi の属性の分布がCj の属
    性の分布と一部分重なりのある状態(ii)かまたはカテゴ
    リーCi とCj においてCi の属性の分布がCjの属性
    の分布に包含される状態(iii) に判別するステップと、
    (d)前記カテゴリーCi とCj が状態(i) にある任意
    の一つのカテゴリーと任意の1つのカテゴリーを分類可
    能とする属性集合の組を選択する場合、分類可能な属性
    を1、分類できない属性を0という論理変数を設定し、
    論理和の形に表現するステップと、(e)前記カテゴリ
    ーCi とCj が状態(i) の組合せにおいて、カテゴリー
    iと他のすべてのカテゴリーとを分類可能とする属性
    集合の組を求める場合、 (d) で求めた論理式の論理積
    で求めるステップと、(f)前記カテゴリーCi とCj
    が状態(i) の組合せにおいて、すべてのカテゴリーを互
    いに分類可能とするための属性集合の組を(e)で求め
    た論理式の論理積で求めるステップと、(g)前記属性
    の組の中から、識別木作成に最も効率的な属性の組を選
    択するために、属性値の分布の重なり状態、カテゴリー
    i の出現頻度に基づく評価関数により評価を行い、最
    も効率的な属性の組を選択するステップと、(h)前記
    において選択した属性の組の中で、評価式が最大となる
    属性を親ノードとして配置し、属性の分布が他のカテゴ
    リーと重なっていない範囲は親ノードで分類を完了さ
    せ、重なっている範囲においては他のカテゴリーと分類
    できなかったカテゴリーを子ノードとして配置し、その
    子ノードの組の間で前記(c)〜(f)のステップの処
    理を行ってステップ(g)で選択した属性の組の中で評
    価式が親ノードでの分類に使用した属性を除いた属性の
    内で最大となる属性を前記子ノードに対する親ノードと
    して配置し、これらの処理をカテゴリーCi と状態(i)
    にあるカテゴリーCj との間において再識別ノードがな
    くなるまで行うステップと、(i)上記ステップにおい
    て分類できなかった子ノードにおいてはステップ(c)
    における状態(ii)または(iii) の場合を考え、カテゴリ
    ーの分割を、ある属性分布Tk においてあるs個のカテ
    ゴリーC1 ,…,Ci ,…Cs が重なりあっている場
    合、ある属性Tk において任意のカテゴリーCi は他の
    すべてのカテゴリーと重なりのない部分、任意のカテゴ
    リーCi と他の任意の1個のカテゴリーが重なる部分、
    任意のカテゴリーCi と他の任意の2個のカテゴリーが
    重なる部分、・・・、任意のカテゴリーCi と他の任意
    のs−2個のカテゴリーが重なる部分、任意のカテゴリ
    ーCi と他の任意のs−1個のカテゴリーが重なる部分
    に分け、この分割により、分割された新たなカテゴリー
    を作り、分割したカテゴリーがすべての属性Tk に対し
    て空集合の場合、新たなカテゴリーは作らないとするス
    テップと、(j)(i)で求めたカテゴリーの分割によ
    ってできた新しいカテゴリーに対し、任意の属性を選択
    し、(h)までのステップで分類できなかった子ノード
    に対し、任意の属性によって分類するステップと、
    (k)識別木よりデータの分類のフローチャートを作成
    するステップとを有し、このフローチャートによりデー
    タの分類を行うことを特徴とするデータの分類方法。
  8. 【請求項8】(a)データを分類するカテゴリーC1
    i 〜Cm を設定し、それぞれのカテゴリーが持つ属性
    1 〜Tj 〜Tn 毎に測定データを集計するかあるいは
    計算によりシミュレートするステップと、(b)集計ま
    たは計算されたデータに対応するカテゴリーに区分けし
    て各属性毎の分布をとるステップと、(c)集計または
    計算されたデータ毎の分布に着目したカテゴリーCi
    他のカテゴリーCj との属性値の分布の重なりの状態に
    基づいて、少なくとも1つの属性の分布においてカテゴ
    リーCi からCj を完全に識別できる状態(i) か、カテ
    ゴリーCi とCj においてCi の属性の分布がCj の属
    性の分布と一部分重なりのある状態(ii)かまたはカテゴ
    リーCi とCj においてCi の属性の分布がCjの属性
    の分布に包含される状態(iii) に判別するステップと、
    (d)前記カテゴリーCi とCj が状態(i) にある任意
    の一つのカテゴリーと任意の1つのカテゴリーを分類可
    能とする属性集合の組を選択する場合、分類可能な属性
    を1、分類できない属性を0という論理変数を設定し、
    論理和の形に表現するステップと、(e)前記カテゴリ
    ーCi とCj が状態(i) の組合せにおいて、カテゴリー
    iと他のすべてのカテゴリーとを分類可能とする属性
    集合の組を求める場合、 (d) で求めた論理式の論理積
    で求めるステップと、(f)前記カテゴリーCi とCj
    が状態(i) の組合せにおいて、すべてのカテゴリーを互
    いに分類可能とするための属性集合の組を(e)で求め
    た論理式の論理積で求めるステップと、(g)前記で求
    めた属性の組の任意の1組の属性を選択し、その属性の
    組の中で任意の属性を親ノードとして配置し、属性の分
    布が他のカテゴリーと重なっていない範囲は親ノードで
    分類を完了させ、重なっている範囲においては他のカテ
    ゴリーと分類できなかったカテゴリーを子ノードとして
    配置し、その子ノードの組の間で前記(c)〜(f)の
    処理を行って親ノードでの分類に使用した属性を除いた
    属性の内で任意の属性を前記子ノードに体する親ノード
    として配置し、これらの処理をカテゴリーCi と状態
    (i) にあるカテゴリーCj との間において再識別ノード
    がなくなるまで行うステップと、(h)識別木よりデー
    タの分類のフローチャートを作成するステップとを有
    し、このフローチャートによりデータの分類を行うこと
    を特徴とするデータの分類方法。
  9. 【請求項9】(a)データを分類するカテゴリーC1
    i 〜Cm を設定し、それぞれのカテゴリーが持つ属性
    1 〜Tj 〜Tn 毎に測定データを集計するかあるいは
    計算によりシミュレートするステップと、(b)集計ま
    たは計算されたデータに対応するカテゴリーに区分けし
    て各属性毎の分布をとるステップと、(c)集計または
    計算されたデータ毎の分布に着目したカテゴリーCi
    他のカテゴリーCj との属性値の分布の重なりの状態に
    基づいて、少なくとも1つの属性の分布においてカテゴ
    リーCi からCj を完全に識別できる状態(i) か、カテ
    ゴリーCi とCj においてCi の属性の分布がCj の属
    性の分布と一部分重なりのある状態(ii)かまたはカテゴ
    リーCi とCj においてCi の属性の分布がCjの属性
    の分布に包含される状態(iii) に判別するステップと、
    (d)前記カテゴリーCi とCj が状態(i) にある任意
    の一つのカテゴリーと任意の1つのカテゴリーを分類可
    能とする属性集合の組を選択する場合、分類可能な属性
    を1、分類できない属性を0という論理変数を設定し、
    論理和の形に表現するステップと、(e)前記カテゴリ
    ーCi とCj が状態(i) の組合せにおいて、カテゴリー
    iと他のすべてのカテゴリーとを分類可能とする属性
    集合の組を求める場合、 (d) で求めた論理式の論理積
    で求めるステップと、(f)前記カテゴリーCi とCj
    が状態(i) の組合せにおいて、すべてのカテゴリーを互
    いに分類可能とするための属性集合の組を(e)で求め
    た論理式の論理積で求めるステップと、(g)前記属性
    の組の中から、識別木作成に最も効率的な属性の組を選
    択するために、属性値の分布の重なり状態、カテゴリー
    i の出現頻度に基づく評価関数により評価を行い、最
    も効率的な属性の組を選択するステップと、(h)前記
    において選択した属性の組の中で、任意の属性を親ノー
    ドとして配置し、属性の分布が他のカテゴリーと重なっ
    ていない範囲は親ノードで分類を完了させ、重なってい
    る範囲においては他のカテゴリーと分類できなかったカ
    テゴリーを子ノードとして配置し、その子ノードの組の
    間で前記(c)〜(f)のステップの処理を行ってステ
    ップ(g)で選択した属性の組の中で評価式が親ノード
    での分類に使用した属性を除いた属性の内で任意の属性
    を前記子ノードに対する親ノードとして配置し、これら
    の処理をカテゴリーCi と状態(i) にあるカテゴリーC
    j との間において再識別ノードがなくなるまで行うステ
    ップと、(i)識別木よりデータの分類のフローチャー
    トを作成するステップとを有し、このフローチャートに
    よりデータの分類を行うことを特徴とするデータの分類
    方法。
  10. 【請求項10】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せにおいて、カテゴ
    リーCiと他のすべてのカテゴリーとを分類可能とする
    属性集合の組を求める場合、 (d) で求めた論理式の論
    理積で求めるステップと、(f)前記カテゴリーCi
    j が状態(i) の組合せにおいて、すべてのカテゴリー
    を互いに分類可能とするための属性集合の組を(e)で
    求めた論理式の論理積で求め、任意の属性の組を選択す
    るステップと、(g)前記属性の組の中から、識別木作
    成に最も効率的な属性のノードへの配置をするために、
    属性値の分布の重なり状態、カテゴリーCi の出現頻度
    に基づく評価関数により評価を行うステップと、(h)
    (f)において選択した属性の組の中で、評価が最大と
    なる属性を親ノードとして配置し、属性の分布が他のカ
    テゴリーと重なっていない範囲は親ノードで分類を完了
    させ、重なっている範囲においては他のカテゴリーと分
    類できなかったカテゴリーを子ノードとして配置し、そ
    の子ノードの組の間で前記(c)〜(f)のステップの
    処理を行ってステップ(f)で選択した属性の組の中で
    評価が親ノードでの分類に使用した属性を除いた属性の
    内で最大となる属性を前記子ノードに対する親ノードと
    して配置し、これらの処理をカテゴリーCi と状態(i)
    にあるカテゴリーCj との間において再識別ノードがな
    くなるまで行うステップと、(i)識別木よりデータの
    分類のフローチャートを作成するステップとを有し、こ
    のフローチャートによりデータの分類を行うことを特徴
    とするデータの分類方法。
  11. 【請求項11】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せにおいて、カテゴ
    リーCiと他のすべてのカテゴリーとを分類可能とする
    属性集合の組を求める場合、 (d) で求めた論理式の論
    理積で求めるステップと、(f)前記カテゴリーCi
    j が状態(i) の組合せにおいて、すべてのカテゴリー
    を互いに分類可能とするための属性集合の組を(e)で
    求めた論理式の論理積で求めるステップと、(g)前記
    で求めた属性の組の任意の1組の属性を選択し、その属
    性の組の中で任意の属性を親ノードとして配置し、属性
    の分布が他のカテゴリーと重なっていない範囲は親ノー
    ドで分類を完了させ、重なっている範囲においては他の
    カテゴリーと分類できなかったカテゴリーを子ノードと
    して配置し、その子ノードの組の間で前記(c)〜
    (f)のステップの処理を行って親ノードでの分類に使
    用した属性を除いた属性の内で任意の属性を前記子ノー
    ドに対する親ノードとして配置し、これらの処理をカテ
    ゴリーCi と状態(i) にあるカテゴリーCj との間にお
    いて再識別ノードがなくなるまで行うステップと、
    (h)上記ステップにおいて分類できなかった子ノード
    においてはステップ(c)における状態(ii)または(ii
    i) の場合を考え、カテゴリーの分割を、ある属性分布
    k においてあるs個のカテゴリーC1 ,…,Ci ,…
    s が重なりあっている場合、ある属性Tk において任
    意のカテゴリーCi は他のすべてのカテゴリーと重なり
    のない部分、任意のカテゴリーCi と他の任意の1個の
    カテゴリーが重なる部分、任意のカテゴリーCi と他の
    任意の2個のカテゴリーが重なる部分、・・・、任意の
    カテゴリーCi と他の任意のs−2個のカテゴリーが重
    なる部分、任意のカテゴリーCi と他の任意のs−1個
    のカテゴリーが重なる部分に分け、この分割により、分
    割された新たなカテゴリーを作り、分割したカテゴリー
    がすべての属性Tk に対して空集合の場合、新たなカテ
    ゴリーは作らないとするステップと、(i)(h)で求
    めたカテゴリーの分割によってできた新しいカテゴリー
    に対し、任意の属性を選択し、(g)までのステップで
    分類できなかった子ノードに対し、任意の属性によって
    分類するステップと、(j)識別木よりデータの分類の
    フローチャートを作成するステップとを有し、このフロ
    ーチャートによりデータの分類を行うことを特徴とする
    データの分類方法。
  12. 【請求項12】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せにおいて、カテゴ
    リーCiと他のすべてのカテゴリーとを分類可能とする
    属性集合の組を求める場合、 (d) で求めた論理式の論
    理積で求めるステップと、(f)前記カテゴリーCi
    j が状態(i) の組合せにおいて、すべてのカテゴリー
    を互いに分類可能とするための属性集合の組を(e)で
    求めた論理式の論理積で求めるステップと、(g)前記
    属性の組の中から、識別木作成に最も効率的な属性の組
    を選択するために、属性値の分布の重なり状態、カテゴ
    リーCi の出現頻度に基づく評価関数により評価を行
    い、最も効率的な属性の組を選択するステップと、
    (h)前記において選択した属性の組の中で、任意の属
    性を親ノードとして配置し、属性の分布が他のカテゴリ
    ーと重なっていない範囲は親ノードで分類を完了させ、
    重なっている範囲においては他のカテゴリーと分類でき
    なかったカテゴリーを子ノードとして配置し、その子ノ
    ードの組の間で前記(c)〜(f)のステップの処理を
    行ってステップ(g)で選択した属性の組の中で評価式
    が親ノードでの分類に使用した属性を除いた属性の内で
    任意の属性を前記子ノードに対する親ノードとして配置
    し、これらの処理をカテゴリーCi と状態(i) にあるカ
    テゴリーCj との間において再識別ノードがなくなるま
    で行うステップと、(i)上記ステップにおいて分類で
    きなかった子ノードにおいてはステップ(c)における
    状態(ii)または(iii) の場合を考え、カテゴリーの分割
    を、ある属性分布Tk においてあるs個のカテゴリーC
    1 ,…,Ci ,…Cs が重なりあっている場合、ある属
    性Tk において任意のカテゴリーCi は他のすべてのカ
    テゴリーと重なりのない部分、任意のカテゴリーCi
    他の任意の1個のカテゴリーが重なる部分、任意のカテ
    ゴリーCi と他の任意の2個のカテゴリーが重なる部
    分、・・・、任意のカテゴリーCi と他の任意のs−2
    個のカテゴリーが重なる部分、任意のカテゴリーCi
    他の任意のs−1個のカテゴリーが重なる部分に分け、
    この分割により、分割された新たなカテゴリーを作り、
    分割したカテゴリーがすべての属性Tk に対して空集合
    の場合、新たなカテゴリーは作らないとするステップ
    と、(j)(i)で求めたカテゴリーの分割によってで
    きた新しいカテゴリーに対し、任意の属性を選択し、
    (h)までのステップで分類できなかった子ノードに対
    し、任意の属性によって分類するステップと、(j)識
    別木よりデータの分類のフローチャートを作成するステ
    ップとを有し、このフローチャートによりデータの分類
    を行うことを特徴とするデータの分類方法。
  13. 【請求項13】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せにおいて、カテゴ
    リーCiと他のすべてのカテゴリーとを分類可能とする
    属性集合の組を求める場合、 (d) で求めた論理式の論
    理積で求めるステップと、(f)前記カテゴリーCi
    j が状態(i) の組合せにおいて、すべてのカテゴリー
    を互いに分類可能とするための属性集合の組を(e)で
    求めた論理式の論理積で求め、任意の属性の組を選択す
    るステップと、(g)前記属性の組の中から、識別木作
    成に最も効率的な属性のノードへの配置をするために、
    属性値の分布の重なり状態、カテゴリーCi の出現頻度
    に基づく評価関数により評価を行うステップと、(h)
    (f)において選択した属性の組の中で、評価式が最大
    となる属性を親ノードとして配置し、属性の分布が他の
    カテゴリーと重なっていない範囲は親ノードで分類を完
    了させ、重なっている範囲においては他のカテゴリーと
    分類できなかったカテゴリーを子ノードとして配置し、
    その子ノードの組の間で前記(c)〜(f)のステップ
    の処理を行ってステップ(g)で選択した属性の組の中
    で評価が親ノードでの分類に使用した属性を除いた属性
    の内で最大となる属性を前記子ノードに対する親ノード
    として配置し、これらの処理をカテゴリーCi と状態
    (i) にあるカテゴリーCj との間において再識別ノード
    がなくなるまで行うステップと、(i)上記ステップに
    おいて分類できなかった子ノードにおいてはステップ
    (c)における状態(ii)または(iii) の場合を考え、カ
    テゴリーの分割を、ある属性分布Tk においてあるs個
    のカテゴリーC1 ,…,Ci ,…Cs が重なりあってい
    る場合、ある属性Tk において任意のカテゴリーCi
    他のすべてのカテゴリーと重なりのない部分、任意のカ
    テゴリーCi と他の任意の1個のカテゴリーが重なる部
    分、任意のカテゴリーCi と他の任意の2個のカテゴリ
    ーが重なる部分、・・・、任意のカテゴリーCi と他の
    任意のs−2個のカテゴリーが重なる部分、任意のカテ
    ゴリーCi と他の任意のs−1個のカテゴリーが重なる
    部分に分け、この分割により、分割された新たなカテゴ
    リーを作り、分割したカテゴリーがすべての属性Tk
    対して空集合の場合、新たなカテゴリーは作らないとす
    るステップと、(j)(i)で求めたカテゴリーの分割
    によってできた新しいカテゴリーに対し、任意の属性を
    選択し、(h)までのステップで分類できなかった子ノ
    ードに対し、任意の属性によって分類するステップと、
    (j)識別木よりデータの分類のフローチャートを作成
    するステップとを有し、このフローチャートによりデー
    タの分類を行うことを特徴とするデータの分類方法。
  14. 【請求項14】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せすべてのカテゴリ
    ーにおいて、 (d) で求めた論理式の論理積をとること
    により、すべてのカテゴリーを互いに識別可能とするた
    めの属性の組を求めるステップと、(f)前記属性の組
    の中から、識別木作成に最も効率的な属性の組を選択す
    るために、属性値の分布の重なり状態、カテゴリーCi
    の出現頻度に基づく評価関数により評価を行い、最も効
    率的な属性の組を選択するステップと、(g)前記にお
    いて選択した属性の組の中で、評価式が最大となる属性
    を親ノードとして配置し、属性の分布が他のカテゴリー
    と重なっていない範囲は親ノードで分類を完了させ、重
    なっている範囲においては他のカテゴリーと分類できな
    かったカテゴリーを子ノードとして配置し、その子ノー
    ドの組の間で前記(c)〜(e)のステップの処理を行
    ってステップ(f)で選択した属性の組の中で評価式が
    親ノードでの分類に使用した属性を除いた属性の内で最
    大となる属性を前記子ノードに対する親ノードとして配
    置し、これらの処理をカテゴリーCi と状態(i) にある
    カテゴリーCj との間において再識別ノードがなくなる
    まで行うステップ、(h)識別木よりデータの分類のフ
    ローチャートを作成するステップとを有し、このフロー
    チャートによりデータの分類を行うことを特徴とするデ
    ータの分類方法。
  15. 【請求項15】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せすべてのカテゴリ
    ーにおいて、 (d) で求めた論理式の論理積をとること
    により、すべてのカテゴリーを互いに識別可能とするた
    めの属性の組を求めるステップと、(f)前記で求めた
    属性の組の任意の1組の属性を選択し、その属性の組の
    中で任意の属性を親ノードとして配置し、属性の分布が
    他のカテゴリーと重なっていない範囲は親ノードで分類
    を完了させ、重なっている範囲においては他のカテゴリ
    ーと分類できなかったカテゴリーを子ノードとして配置
    し、その子ノードの組の間で前記(c)〜(f)の処理
    を行って親ノードでの分類に使用した属性を除いた属性
    の内で任意の属性を前記子ノードに体する親ノードとし
    て配置し、これらの処理をカテゴリーCi と状態(i) に
    あるカテゴリーCj との間において再識別ノードがなく
    なるまで行うステップと、(g)上記ステップにおいて
    分類できなかった子ノードにおいてはステップ(c)に
    おける状態(ii)または(iii) の場合を考え、カテゴリー
    の分割を、ある属性分布Tk においてあるs個のカテゴ
    リーC1 ,…,Ci ,…Cs が重なりあっている場合、
    ある属性Tk において任意のカテゴリーCi は他のすべ
    てのカテゴリーと重なりのない部分、任意のカテゴリー
    i と他の任意の1個のカテゴリーが重なる部分、任意
    のカテゴリーCi と他の任意の2個のカテゴリーが重な
    る部分、・・・、任意のカテゴリーCi と他の任意のs
    −2個のカテゴリーが重なる部分、任意のカテゴリーC
    i と他の任意のs−1個のカテゴリーが重なる部分に分
    け、この分割により、分割された新たなカテゴリーを作
    り、分割したカテゴリーがすべての属性Tk に対して空
    集合の場合、新たなカテゴリーは作らないとするステッ
    プと、(h)属性を用いる時に用いたパラメータの確率
    分布より任意の属性分布における属性の確率分布を求め
    るステップと、(i)(h)で求めた属性の確率分布に
    おいて、ある任意の2つのカテゴリーにおいて、属性の
    分布に重なりのある場合、それぞれのカテゴリーの重な
    りのある部分の確率と重なりのない部分の確率を求める
    ステップと、(j)任意の属性値が得られ、その属性値
    の確率および出現頻度を求め、または属性値によりカテ
    ゴリーの識別ができない場合、(i)で求めた属性の確
    率分布により、どのカテゴリーに属する確率が高いかを
    求めるステップと、(k)(g)で求めたカテゴリーの
    分割によってできた新しいカテゴリーに対し、属性値の
    分布の重なりの確率とカテゴリーCi の出現頻度に基づ
    く評価関数により、評価を行い、最も効率的な属性を選
    択し、(f)までのステップで分類できなかった子ノー
    ドに対し、最も効率的な属性によって分類するステップ
    と、(l)識別木よりデータの分類のフローチャートを
    作成するステップとを有し、このフローチャートにより
    データの分類を行うことを特徴とするデータの分類方
    法。
  16. 【請求項16】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せすべてのカテゴリ
    ーにおいて、 (d) で求めた論理式の論理積をとること
    により、すべてのカテゴリーを互いに識別可能とするた
    めの属性の組を求めるステップと、(f)前記属性の組
    の中から、識別木作成に最も効率的な属性の組を選択す
    るために、属性値の分布の重なり状態、カテゴリーCi
    の出現頻度に基づく評価関数により評価を行い、最も効
    率的な属性の組を選択するステップと、(g)前記にお
    いて選択した属性の組の中で、任意の属性を親ノードと
    して配置し、属性の分布が他のカテゴリーと重なってい
    ない範囲は親ノードで分類を完了させ、重なっている範
    囲においては他のカテゴリーと分類できなかったカテゴ
    リーを子ノードとして配置し、その子ノードの組の間で
    前記(c)〜(f)のステップの処理を行ってステップ
    (g)で選択した属性の組の中で評価式が親ノードでの
    分類に使用した属性を除いた属性の内で任意の属性を前
    記子ノードに対する親ノードとして配置し、これらの処
    理をカテゴリーCi と状態(i) にあるカテゴリーCj
    の間において再識別ノードがなくなるまで行うステップ
    と、(h)上記ステップにおいて分類できなかった子ノ
    ードにおいてはステップ(c)における状態(ii)または
    (iii) の場合を考え、カテゴリーの分割を、ある属性分
    布Tk においてあるs個のカテゴリーC1 ,…,Ci
    …Cs が重なりあっている場合、ある属性Tk において
    任意のカテゴリーCi は他のすべてのカテゴリーと重な
    りのない部分、任意のカテゴリーCi と他の任意の1個
    のカテゴリーが重なる部分、任意のカテゴリーCi と他
    の任意の2個のカテゴリーが重なる部分、・・・、任意
    のカテゴリーCi と他の任意のs−2個のカテゴリーが
    重なる部分、任意のカテゴリーCi と他の任意のs−1
    個のカテゴリーが重なる部分に分け、この分割により、
    分割された新たなカテゴリーを作り、分割したカテゴリ
    ーがすべての属性Tk に対して空集合の場合、新たなカ
    テゴリーは作らないとするステップと、(i)属性を用
    いる時に用いたパラメータの確率分布より任意の属性分
    布における属性の確率分布を求めるステップと、(j)
    (i)で求めた属性の確率分布において、ある任意の2
    つのカテゴリーにおいて、属性の分布に重なりのある場
    合、それぞれのカテゴリーの重なりのある部分の確率と
    重なりのない部分の確率を求めるステップと、(k)任
    意の属性値が得られ、その属性値の確率および出現頻度
    を求め、または属性値によりカテゴリーの識別ができな
    い場合、(i)で求めた属性の確率分布により、どのカ
    テゴリーに属する確率が高いかを求めるステップと、
    (l)(h)で求めたカテゴリーの分割によってできた
    新しいカテゴリーに対し、属性値の分布の重なりの確率
    とカテゴリーCi の出現頻度に基づく評価関数により、
    評価を行い、最も効率的な属性を選択し、(g)までの
    ステップで分類できなかった子ノードに対し、最も効率
    的な属性によって分類するステップと、(m)識別木よ
    りデータの分類のフローチャートを作成するステップと
    を有し、このフローチャートによりデータの分類を行う
    ことを特徴とするデータの分類方法。
  17. 【請求項17】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せすべてのカテゴリ
    ーにおいて、 (d) で求めた論理式の論理積をとること
    により、すべてのカテゴリーを互いに識別可能とするた
    めの属性の組を求めるステップと、(f)前記属性の組
    の中から、識別木作成に最も効率的な属性のノードへの
    配置をするために、属性値の分布の重なり状態、カテゴ
    リーCi の出現頻度に基づく評価関数により評価を行う
    ステップと、(g)前記において選択した属性の組の中
    で、評価が最大となる属性を親ノードとして配置し、属
    性の分布が他のカテゴリーと重なっていない範囲は親ノ
    ードで分類を完了させ、重なっている範囲においては他
    のカテゴリーと分類できなかったカテゴリーを子ノード
    として配置し、その子ノードの組の間で前記(c)〜
    (e)のステップの処理を行ってステップ(f)で選択
    した属性の組の中で評価が親ノードでの分類に使用した
    属性を除いた属性の内で最大となる属性を前記子ノード
    に対する親ノードとして配置し、これらの処理をカテゴ
    リーCi と状態(i)にあるカテゴリーCj との間におい
    て再識別ノードがなくなるまで行うステップと、(h)
    上記ステップにおいて分類できなかった子ノードにおい
    てはステップ(c)における状態(ii)または(iii) の場
    合を考え、カテゴリーの分割を、ある属性分布Tk にお
    いてあるs個のカテゴリーC1 ,…,Ci ,…Cs が重
    なりあっている場合、ある属性Tk において任意のカテ
    ゴリーCi は他のすべてのカテゴリーと重なりのない部
    分、任意のカテゴリーCi と他の任意の1個のカテゴリ
    ーが重なる部分、任意のカテゴリーCi と他の任意の2
    個のカテゴリーが重なる部分、・・・、任意のカテゴリ
    ーCi と他の任意のs−2個のカテゴリーが重なる部
    分、任意のカテゴリーCi と他の任意のs−1個のカテ
    ゴリーが重なる部分に分け、この分割により、分割され
    た新たなカテゴリーを作り、分割したカテゴリーがすべ
    ての属性Tk に対して空集合の場合、新たなカテゴリー
    は作らないとするステップと、(i)属性を用いる時に
    用いたパラメータの確率分布より任意の属性分布におけ
    る属性の確率分布を求めるステップと、(j)(i)で
    求めた属性の確率分布において、ある任意の2つのカテ
    ゴリーにおいて、属性の分布に重なりのある場合、それ
    ぞれのカテゴリーの重なりのある部分の確率と重なりの
    ない部分の確率を求めるステップと、(k)任意の属性
    値が得られ、その属性値の確率および出現頻度を求め、
    または属性値によりカテゴリーの識別ができない場合、
    (i)で求めた属性の確率分布により、どのカテゴリー
    に属する確率が高いかを求めるステップと、(l)
    (h)で求めたカテゴリーの分割によってできた新しい
    カテゴリーに対し、属性値の分布の重なりの確率とカテ
    ゴリーCi の出現頻度に基づく評価関数により、評価を
    行い、最も効率的な属性を選択し、(g)までのステッ
    プで分類できなかった子ノードに対し、最も効率的な属
    性によって分類するステップと、(m)識別木よりデー
    タの分類のフローチャートを作成するステップとを有
    し、このフローチャートによりデータの分類を行うこと
    を特徴とするデータの分類方法。
  18. 【請求項18】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せすべてのカテゴリ
    ーにおいて、 (d) で求めた論理式の論理積をとること
    により、すべてのカテゴリーを互いに識別可能とするた
    めの属性の組を求めるステップと、(f)前記属性の組
    の中から、識別木作成に最も効率的な属性の組を選択す
    るために、属性値の分布の重なり状態、カテゴリーCi
    の出現頻度に基づく評価関数により評価を行い、最も効
    率的な属性の組を選択するステップと、(g)前記にお
    いて選択した属性の組の中で、評価式が最大となる属性
    を親ノードとして配置し、属性の分布が他のカテゴリー
    と重なっていない範囲は親ノードで分類を完了させ、重
    なっている範囲においては他のカテゴリーと分類できな
    かったカテゴリーを子ノードとして配置し、その子ノー
    ドの組の間で前記(c)〜(e)のステップの処理を行
    ってステップ(f)で選択した属性の組の中で評価式が
    親ノードでの分類に使用した属性を除いた属性の内で最
    大となる属性を前記子ノードに対する親ノードとして配
    置し、これらの処理をカテゴリーCi と状態(i) にある
    カテゴリーCj との間において再識別ノードがなくなる
    まで行うステップと、(h)上記ステップにおいて分類
    できなかった子ノードにおいてはステップ(c)におけ
    る状態(ii)または(iii) の場合を考え、カテゴリーの分
    割を、ある属性分布Tk においてあるs個のカテゴリー
    1 ,…,Ci ,…Cs が重なりあっている場合、ある
    属性Tk において任意のカテゴリーCi は他のすべての
    カテゴリーと重なりのない部分、任意のカテゴリーCi
    と他の任意の1個のカテゴリーが重なる部分、任意のカ
    テゴリーCi と他の任意の2個のカテゴリーが重なる部
    分、・・・、任意のカテゴリーCi と他の任意のs−2
    個のカテゴリーが重なる部分、任意のカテゴリーCi
    他の任意のs−1個のカテゴリーが重なる部分に分け、
    この分割により、分割された新たなカテゴリーを作り、
    分割したカテゴリーがすべての属性Tk に対して空集合
    の場合、新たなカテゴリーは作らないとするステップ
    と、(i)(h)で求めたカテゴリーの分割によってで
    きた新しいカテゴリーに対し、任意の属性を選択し、
    (e)までのステップで分類できなかった子ノードに対
    し、任意の属性によって分類するステップと、(j)識
    別木よりデータの分類のフローチャートを作成するステ
    ップとを有し、このフローチャートによりデータの分類
    を行うことを特徴とするデータの分類方法。
  19. 【請求項19】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せすべてのカテゴリ
    ーにおいて、 (d) で求めた論理式の論理積をとること
    により、すべてのカテゴリーを互いに識別可能とするた
    めの属性の組を求めるステップと、(f)前記で求めた
    属性の組の任意の1組の属性を選択し、その属性の組の
    中で任意の属性を親ノードとして配置し、属性の分布が
    他のカテゴリーと重なっていない範囲は親ノードで分類
    を完了させ、重なっている範囲においては他のカテゴリ
    ーと分類できなかったカテゴリーを子ノードとして配置
    し、その子ノードの組の間で前記(c)〜(e)の処理
    を行って親ノードでの分類に使用した属性を除いた属性
    の内で任意の属性を前記子ノードに体する親ノードとし
    て配置し、これらの処理をカテゴリーCi と状態(i) に
    あるカテゴリーCj との間において再識別ノードがなく
    なるまで行うステップと、(g)識別木よりデータの分
    類のフローチャートを作成するステップとを有し、この
    フローチャートによりデータの分類を行うことを特徴と
    するデータの分類方法。
  20. 【請求項20】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せすべてのカテゴリ
    ーにおいて、 (d) で求めた論理式の論理積をとること
    により、すべてのカテゴリーを互いに識別可能とするた
    めの属性の組を求めるステップと、(f)前記属性の組
    の中から、識別木作成に最も効率的な属性の組を選択す
    るために、属性値の分布の重なり状態、カテゴリーCi
    の出現頻度に基づく評価関数により評価を行い、最も効
    率的な属性の組を選択するステップと、(g)前記にお
    いて選択した属性の組の中で、任意の属性を親ノードと
    して配置し、属性の分布が他のカテゴリーと重なってい
    ない範囲は親ノードで分類を完了させ、重なっている範
    囲においては他のカテゴリーと分類できなかったカテゴ
    リーを子ノードとして配置し、その子ノードの組の間で
    前記(c)〜(e)のステップの処理を行ってステップ
    (f)で選択した属性の組の中で評価式が親ノードでの
    分類に使用した属性を除いた属性の内で任意の属性を前
    記子ノードに対する親ノードとして配置し、これらの処
    理をカテゴリーCi と状態(i) にあるカテゴリーCj
    の間において再識別ノードがなくなるまで行うステップ
    と、(h)識別木よりデータの分類のフローチャートを
    作成するステップとを有し、このフローチャートにより
    データの分類を行うことを特徴とするデータの分類方
    法。
  21. 【請求項21】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せすべてのカテゴリ
    ーにおいて、 (d) で求めた論理式の論理積をとること
    により、すべてのカテゴリーを互いに識別可能とするた
    めの属性の組を求めるステップと、(f)前記属性の組
    の中から、識別木作成に最も効率的な属性のノードへの
    配置をするために、属性値の分布の重なり状態、カテゴ
    リーCi の出現頻度に基づく評価関数により評価を行う
    ステップと、(g)(e)において選択した属性の組の
    中で、評価が最大となる属性を親ノードとして配置し、
    属性の分布が他のカテゴリーと重なっていない範囲は親
    ノードで分類を完了させ、重なっている範囲においては
    他のカテゴリーと分類できなかったカテゴリーを子ノー
    ドとして配置し、その子ノードの組の間で前記(c)〜
    (f)のステップの処理を行ってステップ(f)で選択
    した属性の組の中で評価が親ノードでの分類に使用した
    属性を除いた属性の内で最大となる属性を前記子ノード
    に対する親ノードとして配置し、これらの処理をカテゴ
    リーCi と状態(i) にあるカテゴリーCj との間におい
    て再識別ノードがなくなるまで行うステップと、(h)
    識別木よりデータの分類のフローチャートを作成するス
    テップとを有し、このフローチャートによりデータの分
    類を行うことを特徴とするデータの分類方法。
  22. 【請求項22】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せすべてのカテゴリ
    ーにおいて、 (d) で求めた論理式の論理積をとること
    により、すべてのカテゴリーを互いに識別可能とするた
    めの属性の組を求めるステップと、(f)前記で求めた
    属性の組の任意の1組の属性を選択し、その属性の組の
    中で任意の属性を親ノードとして配置し、属性の分布が
    他のカテゴリーと重なっていない範囲は親ノードで分類
    を完了させ、重なっている範囲においては他のカテゴリ
    ーと分類できなかったカテゴリーを子ノードとして配置
    し、その子ノードの組の間で前記(c)〜(e)のステ
    ップの処理を行って親ノードでの分類に使用した属性を
    除いた属性の内で任意の属性を前記子ノードに対する親
    ノードとして配置し、これらの処理をカテゴリーCi
    状態(i) にあるカテゴリーCj との間において再識別ノ
    ードがなくなるまで行うステップと、(g)上記ステッ
    プにおいて分類できなかった子ノードにおいてはステッ
    プ(c)における状態(ii)または(iii) の場合を考え、
    カテゴリーの分割を、ある属性分布Tk においてあるs
    個のカテゴリーC1 ,…,Ci ,…Cs が重なりあって
    いる場合、ある属性Tk において任意のカテゴリーCi
    は他のすべてのカテゴリーと重なりのない部分、任意の
    カテゴリーCi と他の任意の1個のカテゴリーが重なる
    部分、任意のカテゴリーCi と他の任意の2個のカテゴ
    リーが重なる部分、・・・、任意のカテゴリーCi と他
    の任意のs−2個のカテゴリーが重なる部分、任意のカ
    テゴリーCi と他の任意のs−1個のカテゴリーが重な
    る部分に分け、この分割により、分割された新たなカテ
    ゴリーを作り、分割したカテゴリーがすべての属性Tk
    に対して空集合の場合、新たなカテゴリーは作らないと
    するステップと、(h)(g)で求めたカテゴリーの分
    割によってできた新しいカテゴリーに対し、任意の属性
    を選択し、(f)までのステップで分類できなかった子
    ノードに対し、任意の属性によって分類するステップ
    と、(i)識別木よりデータの分類のフローチャートを
    作成するステップとを有し、このフローチャートにより
    データの分類を行うことを特徴とするデータの分類方
    法。
  23. 【請求項23】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せすべてのカテゴリ
    ーにおいて、 (d) で求めた論理式の論理積をとること
    により、すべてのカテゴリーを互いに識別可能とするた
    めの属性の組を求めるステップと、(f)前記属性の組
    の中から、識別木作成に最も効率的な属性の組を選択す
    るために、属性値の分布の重なり状態、カテゴリーCi
    の出現頻度に基づく評価関数により評価を行い、最も効
    率的な属性の組を選択するステップと、(g)前記にお
    いて選択した属性の組の中で、任意の属性を親ノードと
    して配置し、属性の分布が他のカテゴリーと重なってい
    ない範囲は親ノードで分類を完了させ、重なっている範
    囲においては他のカテゴリーと分類できなかったカテゴ
    リーを子ノードとして配置し、その子ノードの組の間で
    前記(c)〜(e)のステップの処理を行ってステップ
    (f)で選択した属性の組の中で評価式が親ノードでの
    分類に使用した属性を除いた属性の内で任意の属性を前
    記子ノードに対する親ノードとして配置し、これらの処
    理をカテゴリーCi と状態(i) にあるカテゴリーCj
    の間において再識別ノードがなくなるまで行うステップ
    と、(h)上記ステップにおいて分類できなかった子ノ
    ードにおいてはステップ(c)における状態(ii)または
    (iii) の場合を考え、カテゴリーの分割を、ある属性分
    布Tk においてあるs個のカテゴリーC1 ,…,Ci
    …Cs が重なりあっている場合、ある属性Tk において
    任意のカテゴリーCi は他のすべてのカテゴリーと重な
    りのない部分、任意のカテゴリーCi と他の任意の1個
    のカテゴリーが重なる部分、任意のカテゴリーCi と他
    の任意の2個のカテゴリーが重なる部分、・・・、任意
    のカテゴリーCi と他の任意のs−2個のカテゴリーが
    重なる部分、任意のカテゴリーCi と他の任意のs−1
    個のカテゴリーが重なる部分に分け、この分割により、
    分割された新たなカテゴリーを作り、分割したカテゴリ
    ーがすべての属性Tk に対して空集合の場合、新たなカ
    テゴリーは作らないとするステップと、(i)(h)で
    求めたカテゴリーの分割によってできた新しいカテゴリ
    ーに対し、任意の属性を選択し、(g)までのステップ
    で分類できなかった子ノードに対し、任意の属性によっ
    て分類するステップと、(j)識別木よりデータの分類
    のフローチャートを作成するステップとを有し、このフ
    ローチャートによりデータの分類を行うことを特徴とす
    るデータの分類方法。
  24. 【請求項24】(a)データを分類するカテゴリーC1
    〜Ci 〜Cm を設定し、それぞれのカテゴリーが持つ属
    性T1 〜Tj 〜Tn 毎に測定データを集計するかあるい
    は計算によりシミュレートするステップと、(b)集計
    または計算されたデータに対応するカテゴリーに区分け
    して各属性毎の分布をとるステップと、(c)集計また
    は計算されたデータ毎の分布に着目したカテゴリーCi
    と他のカテゴリーCj との属性値の分布の重なりの状態
    に基づいて、少なくとも1つの属性の分布においてカテ
    ゴリーCi からCj を完全に識別できる状態(i) か、カ
    テゴリーCi とCj においてCi の属性の分布がCj
    属性の分布と一部分重なりのある状態(ii)かまたはカテ
    ゴリーCi とCj においてCi の属性の分布がCjの属
    性の分布に包含される状態(iii) に判別するステップ
    と、(d)前記カテゴリーCi とCj が状態(i) にある
    任意の一つのカテゴリーと任意の1つのカテゴリーを分
    類可能とする属性集合の組を選択する場合、分類可能な
    属性を1、分類できない属性を0という論理変数を設定
    し、論理和の形に表現するステップと、(e)前記カテ
    ゴリーCi とCj が状態(i) の組合せすべてのカテゴリ
    ーにおいて、 (d) で求めた論理式の論理積をとること
    により、すべてのカテゴリーを互いに識別可能とするた
    めの属性の組を求めるステップと、(f)前記属性の組
    の中から、識別木作成に最も効率的な属性のノードへの
    配置をするために、属性値の分布の重なり状態、カテゴ
    リーCi の出現頻度に基づく評価関数により評価を行う
    ステップと、(g)(e)において選択した属性の組の
    中で、評価式が最大となる属性を親ノードとして配置
    し、属性の分布が他のカテゴリーと重なっていない範囲
    は親ノードで分類を完了させ、重なっている範囲におい
    ては他のカテゴリーと分類できなかったカテゴリーを子
    ノードとして配置し、その子ノードの組の間で前記
    (c)〜(e)のステップの処理を行ってステップ
    (f)で選択した属性の組の中で評価が親ノードでの分
    類に使用した属性を除いた属性の内で最大となる属性を
    前記子ノードに対する親ノードとして配置し、これらの
    処理をカテゴリーCi と状態(i) にあるカテゴリーCj
    との間において再識別ノードがなくなるまで行うステッ
    プと、(h)上記ステップにおいて分類できなかった子
    ノードにおいてはステップ(c)における状態(ii)また
    は(iii) の場合を考え、カテゴリーの分割を、ある属性
    分布Tk においてあるs個のカテゴリーC1 ,…,
    i ,…Cs が重なりあっている場合、ある属性Tk
    おいて任意のカテゴリーCi は他のすべてのカテゴリー
    と重なりのない部分、任意のカテゴリーCi と他の任意
    の1個のカテゴリーが重なる部分、任意のカテゴリーC
    i と他の任意の2個のカテゴリーが重なる部分、・・
    ・、任意のカテゴリーCi と他の任意のs−2個のカテ
    ゴリーが重なる部分、任意のカテゴリーCi と他の任意
    のs−1個のカテゴリーが重なる部分に分け、この分割
    により、分割された新たなカテゴリーを作り、分割した
    カテゴリーがすべての属性Tk に対して空集合の場合、
    新たなカテゴリーは作らないとするステップと、(i)
    (h)で求めたカテゴリーの分割によってできた新しい
    カテゴリーに対し、任意の属性を選択し、(g)までの
    ステップで分類できなかった子ノードに対し、任意の属
    性によって分類するステップと、(j)識別木よりデー
    タの分類のフローチャートを作成するステップとを有
    し、このフローチャートによりデータの分類を行うこと
    を特徴とするデータの分類方法。
JP04130083A 1992-04-22 1992-04-22 データの分類方法 Expired - Fee Related JP3096353B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04130083A JP3096353B2 (ja) 1992-04-22 1992-04-22 データの分類方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04130083A JP3096353B2 (ja) 1992-04-22 1992-04-22 データの分類方法

Publications (2)

Publication Number Publication Date
JPH0675985A true JPH0675985A (ja) 1994-03-18
JP3096353B2 JP3096353B2 (ja) 2000-10-10

Family

ID=15025577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04130083A Expired - Fee Related JP3096353B2 (ja) 1992-04-22 1992-04-22 データの分類方法

Country Status (1)

Country Link
JP (1) JP3096353B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0867054A (ja) * 1995-09-25 1996-03-12 Canon Inc 印刷制御方法
US7151900B2 (en) 2003-11-18 2006-12-19 Canon Kabushiki Kaisha Image formation device, image formation method, information processing device, and information processing method
WO2007013390A1 (ja) * 2005-07-26 2007-02-01 Sony Corporation 情報処理装置、特徴抽出方法、記録媒体、および、プログラム
US8611676B2 (en) 2005-07-26 2013-12-17 Sony Corporation Information processing apparatus, feature extraction method, recording media, and program

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9361367B2 (en) 2008-07-30 2016-06-07 Nec Corporation Data classifier system, data classifier method and data classifier program
JP5500070B2 (ja) 2008-07-30 2014-05-21 日本電気株式会社 データ分類システム、データ分類方法、及びデータ分類プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0867054A (ja) * 1995-09-25 1996-03-12 Canon Inc 印刷制御方法
US7151900B2 (en) 2003-11-18 2006-12-19 Canon Kabushiki Kaisha Image formation device, image formation method, information processing device, and information processing method
WO2007013390A1 (ja) * 2005-07-26 2007-02-01 Sony Corporation 情報処理装置、特徴抽出方法、記録媒体、および、プログラム
US8611676B2 (en) 2005-07-26 2013-12-17 Sony Corporation Information processing apparatus, feature extraction method, recording media, and program

Also Published As

Publication number Publication date
JP3096353B2 (ja) 2000-10-10

Similar Documents

Publication Publication Date Title
Aydin et al. An approach for automated fault diagnosis based on a fuzzy decision tree and boundary analysis of a reconstructed phase space
US5712796A (en) Method for evaluating the faulted sections and states in a power transmission line
CN108802535A (zh) 筛选方法、主干扰源识别方法及装置、服务器及存储介质
US6618632B1 (en) Process for monitoring processing plants
WO2000026824A1 (de) Verfahren und anordnung zum vergleich einer ersten eigenschaft mit vorgegebenen eigenschaften eines technischen systems
Gutierrez-Rojas et al. Performance evaluation of machine learning for fault selection in power transmission lines
Mora-Florez et al. K-means algorithm and mixture distributions for locating faults in power systems
JPH0675985A (ja) データの分類方法
DE69925556T2 (de) Verfahren und Vorrichtung zur Korrektur eines Platinenmodells
Souza et al. Data visualisation and identification of anomalies in power system state estimation using artificial neural networks
Gururajapathy et al. Support vector classification and regression for fault location in distribution system using voltage sag profile
CN109782158A (zh) 一种基于多级分类的模拟电路诊断方法
Peng et al. Complex network application in fault diagnosis of analog circuits
JP2666870B2 (ja) 送配電線事故診断方法
CN109345155B (zh) 一种配电网故障的基于模型分层诊断方法
JPH05111135A (ja) 送配電線事故診断方法
JP2531407B2 (ja) 送配電線事故診断方法
CN115684835B (zh) 配电网故障诊断方法、装置、设备及存储介质
JP2023550158A (ja) 電力線保護のコンピュータ実装方法、インテリジェント電子デバイスおよび電力システム
KR102495822B1 (ko) 전력 변압기 고장 진단을 위한 지능형 시스템
CN112202162A (zh) 规划电能传输网络的方法、规划装置和计算机程序产品
CN118244049B (zh) 低电阻接地系统的高阻接地故障检测方法及相关装置
JPH06123755A (ja) 送配電線事故診断方法及びそのための属性値の設定方法
CN115144695B (zh) 小电流接地系统故障线路寻找方法、装置、设备及介质
Zhuravlev et al. Measures of the importance of objects in complex systems

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees