JPH0785277A - データ分類方式 - Google Patents

データ分類方式

Info

Publication number
JPH0785277A
JPH0785277A JP5227409A JP22740993A JPH0785277A JP H0785277 A JPH0785277 A JP H0785277A JP 5227409 A JP5227409 A JP 5227409A JP 22740993 A JP22740993 A JP 22740993A JP H0785277 A JPH0785277 A JP H0785277A
Authority
JP
Japan
Prior art keywords
classification
data
rule
reliability
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5227409A
Other languages
English (en)
Inventor
Kiyoshi Nakabayashi
清 仲林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP5227409A priority Critical patent/JPH0785277A/ja
Publication of JPH0785277A publication Critical patent/JPH0785277A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 本発明の目的は、事例データによる分類結果
と分類規則による分類結果を相補的に統合して、高精度
なデータ分類システムを構成することが可能なデータ分
類方式を提供することである。 【構成】 本発明は、分類結果90を出力する比較分類実
行手段10と、分類結果91を出力する分類規則実行手段20
と、入力データ70に類似する事例データ60数の多少に応
じて分類結果90の信頼度を算出する比較分類結果信頼度
算出手段30と、予め設定されたパラメータに従って、分
類結果91の信頼度を算出する分類規則信頼度算出手段40
と、分類結果90,91をそれぞれの信頼度で重み付けし、
最終的な分類結果92を出力する分類結果統合手段50とを
有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データ分類方式に係
り、特に、入力データが複数の分類カテゴリのいずれに
属するものであるかを判定するデータ分類方式に関す
る。
【0002】詳しくは、文字認識システム、音声認識シ
ステムなどのパターン認識システムや、故障診断、医療
診断などの自動診断システムでは、認識・診断の対象物
から抽出される特徴量データに基づいて、その対象物が
属する分類カテゴリ・症状を決定するために不可欠な処
理に関する。
【0003】
【従来の技術】分類対象物の特徴量データは、一般に数
値データの組からなる特徴量ベクトル x=(x1 ,x2 ,…,xD ) である。また、分類カテゴリの集合Cは、 C={c1 ,c2 ,…,cM } と書くことができる。特徴量ベクトルxが与えられた時
に、分類カテゴリの集合Cから分類カテゴリを選択して
対象物が属する分類カテゴリを判定する処理をデータ分
類処理と呼ぶ。
【0004】データ分類処理を精度良く行うための技術
として、従来は、以下に示す2つの方法が用いられてい
る。
【0005】〈従来の第1のデータ分類処理方法〉従来
の第1のデータ分類処理には、分類カテゴリが既知であ
る事例データを予め収集し、事例データの特徴量ベクト
ルと分類カテゴリが未知である入力データの特徴量ベク
トルを比較して、入力データの分類カテゴリを決定する
方法がある。この方法には、例えば、“長尾真『パター
ン情報処理』,コロナ社:4章,パターン認識の理論”
がある。
【0006】以下、図4において、従来の第1のデータ
分類処理を説明する。同図に示すシステムは、予め収集
された分類カテゴリが既知である事例データ集合101
と入力データ特徴量ベクトル103が比較分類実行部1
02に入力され、比較分類実行部102は、それらのデ
ータを比較して、データ分類処理を実行し、分類結果1
04を出力する。
【0007】事例データ集合101は、特徴量ベクトル
と分類カテゴリの組からなる事例データの集合 {(x1 ,c(x1 )),(x2 ,c(x2 )),…,(xN ,c(xN ))} である。但し、c(xn )∈Cである。
【0008】比較分類実行部102は、入力データ10
3の特徴量ベクトルxと各事例データ101の特徴量ベ
クトルxn を比較して、分類カテゴリを選択する。選択
の方法には、種々のものが考えられるが、例えば、以下
のような方法がある。
【0009】まず、入力データ103と各事例データ1
01の特徴量ベクトル間の距離r(x,xn )を算出
し、距離の近い順にK個(K:定数)の事例データを選
択する。次に、これらのK個の事例データについて各々
の分類カテゴリc(xn )を調べ、各カテゴリc1 ,c
2 ,…,cM の出現頻度K1 ,K2 ,…,KM を求め、
出現頻度の高い分類カテゴリを入力データ103に対す
る分類カテゴリとして選択する。
【0010】〈従来の第2のデータ分類処理方法〉従来
の第2のデータ分類処理は、人間がデータ分類のための
規則を書き下ろす方法であって、診断型エキスパートシ
ステム当で、一般的に用いられる方法である。規則を表
現する方法としては、{0、1}の二値の判定結果を出
力するIF−THENルールや[0,1]の連続値で判
定結果を与えるファジールールや確信度付きルールが一
般に用いられる。このような方法として“長尾真,『知
識と推論』,岩波,7章エキスパートシステム”があ
る。
【0011】以下、図5において、従来の第2のデータ
分類処理を説明する。同図に示すシステムは、人間が書
き下ろした分類規則集合201と、入力データ特徴量ベ
クトル103が分類規則実行部202に入力され、分類
規則実行部202は、分類規則集合201に従ってデー
タ分類処理を実行する。
【0012】分類規則201としては、例えば、以下に
示すような特徴量の比較演算及び結果の論理積・論理和
からなるIF−THEN型ルールが用いられる。
【0013】 IF {(x1 >h1 )and (x2 >h2 } or (x3 <h3 ) THEN c1 ELSE c2 (1) 上記の規則は、特徴量ベクトルxの要素x1 ,x2 ,x
3 をそれぞれ定数h1 ,h2 ,h3 と比較し、「x1
1 より大きくかつx2 がh2 より大きいか、または、
3 がh3 より小さい時は、分類カテゴリc1 ,それ以
外の場合は、分類カテゴリc2 を選択する」ことを意味
している。
【0014】分類規則実行部202は、特徴量ベクトル
xが入力されるとその各要素値を分類規則に当てはめて
分類結果104を出力する。
【0015】以上は、{0,1}の二値の判定結果を出
力するIF-THEN ルールの場合である。即ち、ある分類カ
テゴリch を選択するという分類結果をFh =1、選択
しないという分類結果をFh =0で表現すると、結果
は、 F=(F1 ,F2 ,…,FM ) (但し、いずれかひとつのFh が1、他は全て0)とな
る。例えば、(1)式の例では、得られる結論F=(F
1 ,F2 )は、(1,0)または(0,1)のいずれか
である。人間が書き下ろす規則の表現法として上述した
ファジールールや確信度付きルールを用いた場合は、分
類結果Fh は、[0,1]の連続値となり、例えば、 F=(F1 ,F2 )=(0.7,0.3) といった結論が得られる。これは、分類カテゴリがc1
である可能性が0.7,c2 である可能性が0.3であ
るという結論を表している。
【0016】
【発明が解決しようとする課題】しかしながら、上記の
従来の第1の方法は、事例データを収集するだけで、デ
ータ分類処理システムを構成することが可能であるが、
事例データが少ない場合や、収集した事例データになん
らかの偏りやノイズが含まれている場合には、分類精度
の低下を招くという問題がある。
【0017】特に、いずれの事例データにも類似してい
ない入力データ、即ち、いずれの事例データに対しても
特徴量ベクトル間の距離r(x,xn )の大きな入力デ
ータや、事例データ中のノイズデータに距離の近い入力
データに対しては、正しい分類結果が得られる可能性は
非常に低くなる。このため、高い分類精度を得るために
は、非常に多数の事例データを収集する必要が生じる。
【0018】一方、上記の従来の第2の方法は、人間が
過去の経験や分類対象の性質を考慮して分類規則を書き
下ろすため、人間が分類対象に関して十分な知識をもっ
ていいる場合には、良い分類結果を得ることができる
が、一般の人間によって、分類対象に関して概略的・大
局的な性質を記述することは容易であるが、詳細で正確
な記述を行うことは困難である。
【0019】例えば、IF−THENルールにおける
(1)式の例で 「x1 が適当な値h1 より大きくかつx2 が適当な値h
2 より大きいか、または、x3 が適当な値h3 より小さ
い時は、分類カテゴリc1 」といった定性的な関係を記
述することは、人間にとって比較的容易であるが、各定
数h1 ,h2 ,h3 の値を正確に決定することは、非常
に困難であり、高い分類精度を得るためには、試行錯誤
的な調整が必要となる。
【0020】さらに、規則が複雑になるとそれを詳細に
書き下ろして調整する労力は膨大なものとなる。結論が
連続値で与えられるようなルール表現を用いたとしても
それは、中間的な表現が可能である、というだけに過ぎ
ず、高い分類精度を得るために、ルールの微妙な調整が
必要であることに変わりはない。
【0021】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、事例データによる分類
結果と分類規則による分類結果を相補的に統合して、高
精度なデータ分類システムを構成することが可能なデー
タ分類方式を提供することを目的とする。
【0022】
【課題を解決するための手段】図1は、本発明の原理構
成図である。
【0023】本発明は、分類対象物の特徴量データを入
力として、分類対象物の属する分類カテゴリを判定する
データ分類方式において、予め収集された分類結果が既
知である事例データ60と入力データ70とを比較し
て、第1の分類結果90を出力する比較分類実行手段1
0と、入力データ70を予め設定された分類規則80に
従って、分類して得られる第2の分類結果91を出力す
る分類規則実行手段20と、入力データ70に類似する
事例データ60数の多少に応じて第1の分類結果90の
信頼度を算出する比較分類結果信頼度算出手段30と、
予め設定されたパラメータに従って、第2の分類結果9
1の信頼度を算出する分類規則信頼度算出手段40と、
第1及び第2の分類結果90,91を第1と第2の分類
結果の信頼度で重み付けして、最終的な分類結果92を
出力する分類結果統合手段50とを有する。
【0024】また、本発明は、分類規則信頼度算出手段
40において、第2の分類結果91の信頼度を算出する
ためのパラメータを最適な値に調整するために、予め収
集された分類結果が既知である事例データ60に、比較
分類実行手段10、分類規則実行手段20、比較分類結
果信頼度算出手段30、分類規則信頼度算出手段40及
び分類結果統合手段50とを適用して得られる分類結果
92と、事例データの既知である分類結果とを比較する
ことにより調整する分類規則信頼度調整手段を含む。
【0025】
【作用】本発明は、まず、従来と同様に入力データの特
徴量ベクトルから各々分類結果を出力すると、出力され
た分類結果に対する信頼度を、入力データの特徴量ベク
トルと、各事例データの特徴量との距離を計算し、特徴
量ベクトル空間内における入力データの周辺の事例デー
タの分布密度を算出することにより行う。ここで、分布
密度が低ければ、入力データに類似する事例データが少
ないので、事例データに基づく分類結果の信頼性は低く
なることが分かる。逆に分布密度が高ければ、事例デー
タに基づく分類結果の信頼性が高くなることが分かる。
従って、比較分類結果の信頼度の計算により、上記の分
布密度を事例データに基づく分類結果の信頼度として出
力する。
【0026】さらに、分類規則を実行した分類結果の信
頼度を、事前に事例データを用いて算出したパラメータ
に基づいて分類規則の信頼度を出力する。事例データに
対する分類規則の分類精度が高ければ、この信頼度も高
くなるように設定される。
【0027】このようにして得られた分類結果の各々の
信頼度から双方の分類結果に重み付けをして最終的な分
類結果を出力することにより、入力データに類似する事
例データが少ない場合には分類規則による分類結果が優
先され、逆に入力データに類似する事例データが多い場
合は、事例データに基づく分類結果を優先した判断が行
われる。また、事例データに対する分類規則の正解率が
低く、分類規則が十分詳細に記述されていないと考えら
れる場合も、事例データに基づく分類結果を優先した判
断が行われる。
【0028】このように、本発明のデータ分類方式で
は、事例データによる分類結果と分類規則による分類結
果を相補的に統合してデータ分類処理の精度を高めるこ
とが可能である。
【0029】
【実施例】以下、図面と共に本発明の実施例を詳細に説
明する。
【0030】図2は、本発明の一実施例を示すデータ分
類システムの構成を示す。同図において、図4及び図5
と同一構成部分には、同一符号を付し、その説明を省略
する。
【0031】図2に示すシステムは、入力事例データ集
合101、比較分類実行部102、入力データ特徴量ベ
クトル103、分類規則集合201、分類規則実行部2
02、分類結果104に加えて、比較分類実行部102
により出力された分類結果の信頼度を算出する比較分類
結果信頼度算出部310、分類規則実行部202により
出力された分類結果の信頼度を算出する分類規則信頼度
算出部320、事例データ101に基づく分類結果と分
類規則に基づく分類結果を信頼度を用いて重み付けして
最終的な分類結果とする分類結果統合部330、分類規
則201による分類結果の信頼度を算出するためのパラ
メータを最適な値に調整する分類規則信頼度調整部33
1から構成される。
【0032】同図に示すデータ分類システムは、予め収
集した事例データ101を用いて分類規則の信頼度を算
出するためのパラメータを最適な値に調整する準備モー
ドと、分類カテゴリが未知である入力データの分類カテ
ゴリを判定する実行モードの2つの動作を行う。
【0033】〈実行モード〉まず、実行モードの動作の
説明を行う。
【0034】実行モードにおいて、比較分類実行部1
02、比較分類結果信頼度算出部310、分類規則実行
部202、分類規則信頼度算出部320の各々は、入力
データの特徴量ベクトルx=(x1 ,x2 ,…,xD
を入力として受け取る。
【0035】比較分類実行部102は、入力データの
特徴量ベクトルxと事例データ集合101中の各事例デ
ータの特徴量ベクトルxn との距離r(x,xn )を算
出する。D次元ベクトルu=(u1 ,u2 ,…,uD
とv=(v1 ,v2 ,…,v D )との距離r(u,v)
としては、例えば、以下のような式で算出されるユーク
リッド距離を用いる。
【0036】
【数1】
【0037】次に、求めた距離の近い順にK個(K:
定数)の事例データを選択し、これらの各々の分類カテ
ゴリを調べて各カテゴリc1 ,c2 ,…,cM の出現頻
度K1 ,K2,…,KM を求める。そして、各カテゴリ
の出現頻度をKで割って得られる出現率を一組のデータ P=(P1 ,P2 ,…PM )=(K1 /K,K2 /K,…,KM /K) にまとめ、事例データに基づく分類結果として分類結果
統合部330に送る。
【0038】比較分類結果信頼度算出部310は、比
較分類実行部102と同様に入力データ103と各事例
データ101の特徴量ベクトル間の距離r(x,xn
を算出し、距離の近い順にK個(K:定数)の事例デー
タを選択する。そして、K番目の事例データまでの特徴
量ベクトルの距離rK を求める。
【0039】次に、半径rK のD次元超球の体積Vを
求め、特徴量ベクトル空間内における入力データの周辺
の事例データの分布密度K/Vを算出する。得られた分
布密度は、事例データに基づく分類結果の信頼度とし
て、分類結果統合部330に送られる。
【0040】分類規則実行部202は、特徴量ベクト
ルxが入力されるとその各要素値を分類規則201に当
てはめて分類結果を出力する。動作は、従来の第2の方
法と同様であって、分類結果は、各カテゴリc1
2 ,…,cM に対応した数値の組F=(F1 ,F2
…,FM )として出力される。分類規則が2値の判定結
果を出力するIF-THEN ルールの場合は、Fm は{0,
1}の二値であり、ファジィ規則のように連続値の判定
結果を出力する場合は、Fm は[0,1]の連続値であ
る。
【0041】分類規則信頼度算出部320は、特徴量
ベクトルxが入力されると、分類規則による分類結果の
信頼度Aとして、 A=A(x;a) (3) となる、xとパラメータベクトル a=(a1 ,a2 ,…,aQ ) の関数の値を計算して出力する。ここで、パラメータベ
クトルaの値は、後述する準備モードにおいて決定され
る。関数A(x,a)は、正の値を取るものであれば、
どのようなものであってもよく、最も簡単な場合は、x
に対して定数であるような関数、例えば、 A(x,a)=ea >0 を用いればよい。この場合には分類規則信頼度算出部3
20は、常にA=ea を出力する。
【0042】分類結果統合部330は、上記で算出さ
れた値から最終的な分類結果を算出する。即ち、比較分
類実行部102で算出された事例データに基づく分類結
果 P=(P1 ,P2 ,…,PM ) を比較分類結果信頼度算出部310で算出された事例デ
ータに基づく分類結果の信頼度K/Vに比例する値で重
み付けし、分類規則実行部202で算出された分類規則
に基づく分類結果 F=(F1 ,F2 ,…,FM ) を分類規則信頼度算出部320で算出された分類結果の
信頼度Aに比例する値で重み付けし、これらを足し合わ
せて分類結果を求める。
【0043】上記の処理を数式で表すと、統合した分類
結果を Y=(Y1 ,Y2 ,…,YM )として、
【0044】
【数2】 となる。
【0045】以上によって求められた分類結果の
1 ,Y2 ,…YM の最大値Ym に対応する分類カテゴ
リcm を最終的な分類結果として出力する。
【0046】〈準備モード〉次に、予め収集した事例デ
ータを用いて分類規則の信頼度を算出する、準備モード
について説明する。この準備モードにおいては、(3)
式に示した分類規則の信頼度を算出する関数A=A
(x;a)のパラメータaが決定される。パラメータa
の決定は、以下のような原理に基づいて行われる。
【0047】事例データ集合101中の一つの事例デー
タを(xn ,c(xn ))とする。この事例データの特
徴量ベクトルxn を入力として、上記の実行モードと同
様の動作を行い、分類結果Yn を求める。一方、事例デ
ータの分類カテゴリc(xn)は分類カテゴリの集合C
={c1 ,c2 ,…,cM }のいずれかであるので、c
(xn )がm番目の分類カテゴリcm であるとき、m番
目の要素のみが1、他の要素が0であるような、M次元
のベクトルcn を考える。
【0048】この事例データの分類カテゴリを表すベク
トルcn と、事例データに対して実行モードと同様の動
作を適用して得られる分類結果Yn との相違を表す関数
e(Yn ,cn )を設定する。関数e(Yn ,cn )と
しては、例えば、以下のような二乗誤差
【0049】
【数3】 を用いることができる。(4)式よりYn はAの関数で
あり、Aは(3)式のようにaの関数であるから、結
局、関数e(Yn ,cn )はaの関数である。従って、
関数 e(Yn ,cn )=e(Yn ,cn ;a) をN個の事例データ全てに対して足し合わせた総和
【0050】
【数4】 を評価関数とし、評価関数E(a)ができるだけ小さく
なるようにaを調節することができる。
【0051】このような、関数の極小化には、一般によ
く知られた最急降下法などの数値計算手法が適用できる
“J.ウォルシュ『数値計算概論』,日本評論社)即
ち、λを適当な正の整数とし、a=(a1 ,a2 ,…,
Q )を以下の式
【0052】
【数5】 に従って、適当な初期値a(0) からa(1) ,a(2)
…,a(s) と順次計算し、E'(a) の大きさが十分小さ
くなったとき処理を終了する。
【0053】例えば、関数e(Yn ,cn )として、
(5)式のものを使い、(3)式の関数A=A(x;
a)として最も簡単なAがxに対して定数である場合A
=ea を考えると(8)式は以下のようになる。
【0054】
【数6】
【0055】上記原理に基づく動作の詳細を図5に示
す。図5は、本発明の一実施例のデータ分類システムの
準備モード時の動作を示すフローチャートを示す。
【0056】ステップ1:分類規則信頼度算出部320
において、パラメータaを適当な初期値a(0) に設定す
る。
【0057】ステップ2:分類規則信頼度調整部331
は、(10)式のE’(a)の値を算出するためにE’
の値を0に初期設定する。
【0058】ステップ3)事例データ集合101中の事
例データ {(x1 ,c(x1 )),(x2 ,c(x2 )),…,(xN ,c(xN ))} を順次取り出し、以下のステップ31から36の動作を
全ての事例データについて繰り返す。
【0059】ステップ31)比較分類実行部102は、
実行モードと同様の動作により特徴量ベクトルxn に対
する事例データに基づく分類結果Pn を算出する。但
し、事例データとの距離の計算を行う際に、特徴量ベク
トルxn 自身は、対象から除外することが望ましい。
【0060】ステップ32)比較分類結果信頼度算出部
310は実行モードと同様の動作により特徴量ベクトル
n に対する事例データに基づく分類結果の信頼度K/
nを算出する。但し、事例データとの距離の計算を行
う際に特徴量ベクトルxn 自身は、対象から除外するこ
とが望ましい。
【0061】ステップ33)分類規則実行部202は、
実行モードと同様の動作により、特徴量ベクトルxn
対する分類規則に基づく分類結果Fn を算出する。
【0062】ステップ34)分類規則信頼度算出部32
0は、実行モードと同様の動作により特徴量ベクトルx
n に対する分類規則に基づく分類結果の信頼度A=ea
を算出する。
【0063】ステップ35)分類結果統合部330は、
実行モードと同様の動作により、特徴量ベクトルxn
対する最終的な分類結果Yn を算出する。
【0064】ステップ36)分類規則信頼度調整部33
1は、(10)式のE’(a)の値を算出するために上
記のステップ31〜35で算出されたPn ,Fn
n ,K/Vn ,ea 及び、事例データの分類カテゴリ
c(xn )から決定される分類カテゴリを表すベクトル
n を用いてE’の値を以下の式に従って更新する。
【0065】
【数7】
【0066】ステップ4:分類規則信頼度調整部331
は、上記ステップ31〜36の繰り返しによって得られ
たE’の値を用いてパラメータaの修正量−λE’を算
出する。
【0067】ステップ5:比較分類結果信頼度算出部3
10は、パラメータaをa−λE’に修正する。
【0068】ステップ6:もし、ステップ4における
E’が十分小さな値であれば、処理を終了する。そうで
なければ、ステップ2に戻り、上記の処理を繰り返す。
【0069】なお、上記の実施例において、事例データ
に基づく分類を行う比較分類実行部310は、他の事例
データに基づく分類を行う手段に置き換えることも可能
である。このような手段の例としては、各種のニューラ
ルネットワーク“麻生英樹『ニューラルネットワーク情
報処理』,産業図書”や事例データの統計量に基づく分
類方式“長尾真『パターン情報処理』,コロナ社,4章
パターン認識の理論”等を適用することができる。
【0070】また、比較分類結果信頼度算出部310
は、特徴量ベクトル空間内における入力データの周辺の
事例データの分布密度を算出することができる他の方法
と置き換えることができる。このような方法は、“R.Du
da and P.Hart,"Pattern Classification and Scence A
nalysis", John Wiley and Sons, Chapter 4 "Nonparam
etric Techniques" などに記述されている。
【0071】また、分類規則による分類結果の信頼度を
与える関数A=A(x;a)として、上記実施例におい
ては、最も簡単なA=ea の場合を詳述したが、上記で
も述べたように、この関数は、x及びaを変数とする任
意のものを用いることができる。
【0072】さらに、パラメータaを調整する基準とな
る関数e(Y,c)については二乗誤差を用いる場合を
詳述したが、例えば、評価関数E(a)が事例データに
対する正解数となるように、事例データの分類カテゴリ
がcm であるとき、Yの要素Y1 ,Y2 ,…,YM のm
番目の要素Ym が最大値である場合に1、それ以外の要
素が最大値の場合0となるような関数をe(Y,c)と
して用いて、評価関数E(a)ができるだけ大きくなよ
うにパラメータaを調整しても同様な効果を得ることが
できる。
【0073】なお、本発明は、上記実施例に限定される
ことなく、本発明の主旨を逸脱しない範囲で種々変更を
加えることができる。
【0074】
【発明の効果】上述のように、本発明のデータ分類方式
によれば、入力データに類似する事例データが少ない場
合は、分類規則による分類結果を優先し、逆に入力デー
タに類似する事例データが多い場合や、分類規則の正解
率が低い場合は、事例データに基づく分類結果を優先し
てデータ分類処理を行うように構成したので、事例デー
タによる分類結果と分類規則による分類結果を相補的に
統合して高精度なデータ分類処理を行うことが可能とな
る。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の一実施例のデータ分類システムの構成
図である。
【図3】本発明の一実施例のデータ分類システムの動作
を示すフローチャートである。
【図4】従来の第1のデータ分類処理を説明するための
図である。
【図5】従来の第2のデータ分類処理を説明するための
図である。
【符号の説明】
10 比較分類実行手段 20 分類規則実行手段 30 比較分類結果信頼度算出手段 40 分類規則信頼度算出手段 50 分類結果統合手段 60 事例データ 70 入力データ 80 分類規則 90 第1の分類結果 91 第2の分類結果 92 最終的な分類結果 101 事例データ集合 102 比較分類実行部 103 入力データ特徴量ベクトル 104 分類結果 201 分類規則集合 202 分類規則実行部 310 比較分類結果信頼度算出部 320 分類規則信頼度算出部 330 分類結果統合部 331 分類規則信頼度調整部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 分類対象物の特徴量データを入力データ
    として、分類対象物の属する分類カテゴリを判定するデ
    ータ分類方式において、 予め収集された分類結果が既知である事例データと入力
    データとを比較して、第1の分類結果を出力する比較分
    類実行手段と、 該入力データを予め設定された分類規則に従って、分類
    して得られる第2の分類結果を出力する分類規則実行手
    段と、 該入力データに類似する事例データ数の多少に応じて該
    第1の分類結果の信頼度を算出する比較分類結果信頼度
    算出手段と、 予め設定されたパラメータに従って、該第2の分類結果
    の信頼度を算出する分類規則信頼度算出手段と、 該第1及び該第2の分類結果を該第1と該第2の分類結
    果の信頼度で重み付けして、最終的な分類結果を出力す
    る分類結果統合手段とを有することを特徴とするデータ
    分類方式。
  2. 【請求項2】 前記分類規則信頼度算出手段において、
    前記第2の分類結果の信頼度を算出するための前記パラ
    メータを最適な値に調整するために、予め収集された分
    類結果が既知である事例データに、前記比較分類実行手
    段、前記分類規則実行手段、前記比較分類結果信頼度算
    出手段、前記分類規則信頼度算出手段及び分類結果統合
    手段とを適用して得られる分類結果と、該事例データの
    既知である分類結果とを比較することにより調整する分
    類規則信頼度調整手段を含む請求項1記載のデータ分類
    方式。
JP5227409A 1993-09-13 1993-09-13 データ分類方式 Pending JPH0785277A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5227409A JPH0785277A (ja) 1993-09-13 1993-09-13 データ分類方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5227409A JPH0785277A (ja) 1993-09-13 1993-09-13 データ分類方式

Publications (1)

Publication Number Publication Date
JPH0785277A true JPH0785277A (ja) 1995-03-31

Family

ID=16860388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5227409A Pending JPH0785277A (ja) 1993-09-13 1993-09-13 データ分類方式

Country Status (1)

Country Link
JP (1) JPH0785277A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981730A (ja) * 1995-09-18 1997-03-28 Canon Inc パターン認識方法及び装置及びコンピュータ制御装置
JP2005141687A (ja) * 2003-11-10 2005-06-02 Nippon Telegr & Teleph Corp <Ntt> 物体追跡方法、物体追跡装置、物体追跡システム、プログラム、および、記録媒体
JP2007293489A (ja) * 2006-04-24 2007-11-08 Mitsubishi Electric Corp 設備機器用故障診断装置および設備機器用故障診断方法
WO2020070943A1 (ja) * 2018-10-03 2020-04-09 株式会社Nttドコモ パターン認識装置及び学習済みモデル
JP2022535165A (ja) * 2019-08-15 2022-08-04 コリブラ エヌブイ 多数の分類モジュールから集約された情報を使用するデータ分類

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0981730A (ja) * 1995-09-18 1997-03-28 Canon Inc パターン認識方法及び装置及びコンピュータ制御装置
JP2005141687A (ja) * 2003-11-10 2005-06-02 Nippon Telegr & Teleph Corp <Ntt> 物体追跡方法、物体追跡装置、物体追跡システム、プログラム、および、記録媒体
JP4490076B2 (ja) * 2003-11-10 2010-06-23 日本電信電話株式会社 物体追跡方法、物体追跡装置、プログラム、および、記録媒体
JP2007293489A (ja) * 2006-04-24 2007-11-08 Mitsubishi Electric Corp 設備機器用故障診断装置および設備機器用故障診断方法
WO2020070943A1 (ja) * 2018-10-03 2020-04-09 株式会社Nttドコモ パターン認識装置及び学習済みモデル
JPWO2020070943A1 (ja) * 2018-10-03 2021-09-02 株式会社Nttドコモ パターン認識装置及び学習済みモデル
JP2022535165A (ja) * 2019-08-15 2022-08-04 コリブラ エヌブイ 多数の分類モジュールから集約された情報を使用するデータ分類

Similar Documents

Publication Publication Date Title
Angelov et al. Simpl_eTS: A simplified method for learning evolving Takagi-Sugeno fuzzy models
US5617513A (en) Method for analyzing activity in a signal
De Veaux et al. A comparison of two nonparametric estimation schemes: MARS and neural networks
US5398300A (en) Neural network having expert system functionality
US5606646A (en) Recurrent neural network-based fuzzy logic system
Jantzen Neurofuzzy modelling
Joanes Reject inference applied to logistic regression for credit scoring
US8615478B2 (en) Using affinity measures with supervised classifiers
WO2002086814A1 (en) An on-line method for self-organized learning and extraction of fuzzy rules
US6317730B1 (en) Method for optimizing a set of fuzzy rules using a computer
US6282529B1 (en) Method and apparatus for computer-supported generation of at least one artificial training data vector for a neural network
JPH0785277A (ja) データ分類方式
Husmeier The Bayesian evidence scheme for regularizing probability-density estimating neural networks
Lima et al. Fitness function design for genetic algorithms in cost evaluation based problems
US6219658B1 (en) Method for learning data classification in two separate classes separated by a region divider of order 1 or 2
Petrou Learning in pattern recognition
Lughofer et al. Online adaptation of Takagi-Sugeno fuzzy inference systems
JP2674167B2 (ja) 神経回路網モデルを用いたプロセス制御方法
COLLANTES-DUARTE et al. Time Series Forecasting using ARIMA, Neural Networks and Neo Fuzzy Neurons
CN113297540A (zh) 在边缘物联代理服务下的app资源需求预测方法、装置及系统
Suaste-Rivas et al. A fuzzy relational neural network for pattern classification
JPH06231245A (ja) 画像処理フィルタの構成方法
US20040068475A1 (en) Physics based neural network trend detector
JPH0644207A (ja) ニューラルネットワーク及びその構成方法
Bouchon-meunier et al. Inductive learning and fuzziness