JP2002543497A - デシジョンツリーを生成するためのシステムおよび方法 - Google Patents

デシジョンツリーを生成するためのシステムおよび方法

Info

Publication number
JP2002543497A
JP2002543497A JP2000614155A JP2000614155A JP2002543497A JP 2002543497 A JP2002543497 A JP 2002543497A JP 2000614155 A JP2000614155 A JP 2000614155A JP 2000614155 A JP2000614155 A JP 2000614155A JP 2002543497 A JP2002543497 A JP 2002543497A
Authority
JP
Japan
Prior art keywords
cluster
data
fuzzy
decision tree
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000614155A
Other languages
English (en)
Other versions
JP4817502B2 (ja
JP2002543497A5 (ja
Inventor
ランクラー,トーマス・エイ
ロイチャウドューリー,シューナク
Original Assignee
オラクル コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オラクル コーポレーション filed Critical オラクル コーポレーション
Publication of JP2002543497A publication Critical patent/JP2002543497A/ja
Publication of JP2002543497A5 publication Critical patent/JP2002543497A5/ja
Application granted granted Critical
Publication of JP4817502B2 publication Critical patent/JP4817502B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

(57)【要約】 統一された方策を用いてデシジョンツリーと(好ましくはファジーな)クラスタとの両者を抽出するデシジョンツリークラスタリング手順を提供する。デシジョンツリーは、単一の次元または特徴のその後のクラスタリングによって構築され、好ましい分離の選択はクラスタの有効性に基づいている。1つの実施例では、クラスタリングは、ファジーc平均(FCM)モデルおよび分割係数(PC)を用いて選択された分離を決定する。

Description

【発明の詳細な説明】
【0001】
【発明の分野】
本発明は、データ解析に関し、より特定的にはデシジョンツリーを生成するこ
とに関する。
【0002】
【発明の背景】
データマイニング、知識獲得およびデータ解析の他の形は、膨大な量の蓄積さ
れたデータからの有用な情報の抽出を伴う。たとえば、製薬会社は、どの病気が
どの薬品化合物によって有効に治療されるか、および薬品化合物の副作用は何で
あるかなどの、薬品化合物およびそれらの特徴を列挙する大きなデータベースを
生成する。種々の薬品化合物が多数であることを考慮すると、手動でこのデータ
を分析して、薬品のどのグループが病気のグループの各々を治療するのにより有
効であるとか、より有効でないとかいうことを決定するなどの、有用なパターン
を確定することは困難であり、薬品および病気の所望のグルーピングが前もって
特定されていないときにはとりわけそうである。
【0003】 従来のデータマイニング技術は、パターン認識および確率論的解析を用いてデ
シジョンツリーを生成する。デシジョンツリーは、オブジェクトを複数個のクラ
スにいかにして分類するかをうまく示す規則の階層的配置を含むデータ構造であ
る。より具体的には、各オブジェクトは、多数の属性によって特徴付けられ、デ
シジョンツリーにおける各規則は、属性の1つの値をテストする。デシジョンツ
リーは、目標変数に対して異なった影響を有する可能性の高い規則の組にデータ
を分ける。たとえば、薬品化合物およびその投与の方法の特性であって特定の病
気を治療するのに有効である可能性の高いものを見付けたいことがあるかもしれ
ない。これらの特性は、1組の規則に変換可能である。
【0004】 図5は、患者のための仮定的医療条件をいかにして処理するかを表わす例示の
デシジョンツリー500を表わす。例示のデシジョンツリー500は、2つの分
岐ノード510および530と、3つの葉ノード520、540および550と
、アーク512、514、532および534とを含む。
【0005】 分岐ノード510および530の各々は、患者の特定の属性に対する多数の可
能性ある値の中からいかにして選択するかを示す「規則」または条件を表わす。
属性が取り得る可能な値は、アーク512、514、532および534によっ
て示される。可能な値の中から選択がなされると、対応するアークが取られ、葉
ノードまたは別の分岐ノードに到達する。分岐ノード510の1つは、デシジョ
ンツリーの開始点である「ルート」ノードとして指定される。
【0006】 たとえば、ルート分岐ノード510は、「AGE?」とラベル付けされ、患者
の年齢がテストされることを示す。分岐ノード510を葉ノード520に接続す
るアーク512は、「<=12?」とラベル付けされ、患者の年齢が12歳以下
であるならば葉ノード520に到達すべきであることを示す。他方で、アーク5
14は分岐ノード510を分岐ノード530に接続し、患者の年齢が12歳より
大きければ分岐ノード530に到達すべきことを示す、「>12?」とラベル付
けされる。分岐ノード530は、「TEMP?」とラベル付けされ、患者の体温
がテストされることを示す。患者の体温が102°以下であれば(アーク532
によって示される)、葉ノード540に到達する。さもなくば、患者の体温が1
02°より大きければ(アーク534によって示される)、葉ノード550に到
達する。
【0007】 葉ノード520、540および550は、オブジェクトの「判断」または分類
を表わす。たとえば、判断は、患者に対して投与されるべき治療薬である。葉ノ
ード520においては、判断は20mgの薬品Xを使用することであり、葉ノー
ド540においては、判断は40mgの薬品Xを使用することであり、葉ノード
550においては、判断は10mgの薬品Yを使用することである。
【0008】 例示のデシジョンツリー500は、「ルート」ノードで始まって、患者の属性
をテストして、アークを選択し、葉ノードに到達するまでアークを辿ることによ
り、どの治療薬が患者に投与されるべきかを決定するために使用され得る。たと
えば、98.6°の体温の10歳の子供が治療されるべきであるとする。ルート
分岐ノード510で始まり、患者の年齢がテストされる。10歳は12歳未満で
あるので、アーク512を辿って葉ノード520に到達する。したがって、20
mgの薬品Xがその10歳児に処方される。別の例として、患者が105°の熱
を有する32歳であったとする。ルート分岐ノード510で始まり、患者の年齢
がテストされる。32歳という年齢は12歳より大きいので、分岐ノード530
までアーク514を辿り、ここで患者の体温がテストされる。患者は105°の
熱を有するので、アーク534を辿って、10mgの薬品Yが投与されるべきで
あることを示す葉ノード550に到達する。
【0009】 デシジョンツリー誘導とは、トレーニングデータのセットからデシジョンツリ
ーをいかにして構築するかを決定するプロセスのことをいう。特に、デシジョン
ツリーは、あるとすれば、どの属性を最初にテストしどの特性を後にテストすべ
きかをうまく特定することにより構築される。デシジョンツリーを構築するため
のよくある従来の方策は、「デシジョンツリーの誘導」またはID3として知ら
れている。ID3は、1組の予め定義されたクラスに属する1組のトレーニング
オブジェクトで始まる再帰的アルゴリズムである。すべてのオブジェクトが単一
のクラスに属するのであれば、判断はなされず、葉ノードが生成され、そのクラ
スでラベル付けされる。さもなくば、分岐ノードが生成され、分岐ノードでオブ
ジェクトを区別するためにその属性が使用されたならば最高の「情報利得」を与
えるような属性が選択される。情報利得は、各属性の平均エントロピーを求める
ことにより計算される。
【0010】 ID3によって発生されるものなどの従来のデシジョンツリーでの問題は、そ
のようなデシジョンツリーが固定的で柔軟性がなく脆弱であるということである
。薬品の有効性の例において、従来のデシジョンツリーは、異なった薬品が様々
な度合いの有効性を有しているときにも、データへの「二者択一的な」または2
値的な方法を強いる。たとえば、デシジョンツリーにおけるクリスプな範囲の境
界の近くのデータ値は、実世界データの不正確さのために誤って分類されがちで
ある。したがって、デシジョンツリーに「ファジー論理」という概念を適用する
多くの試みがなされてきた。
【0011】 ファジー論理は、実世界の不確かさをモデル化するための手段として1960
年代に導入された。オブジェクトを、あるクラスのフルメンバーまたは全くメン
バーでないのいずれかとして分類する代わりに、ファジー論理は、オブジェクト
がクラスに属する度合いを表わすために0.0と1.0との間の「メンバーシッ
プ関数」を採用する。たとえば、患者の年齢を「12歳以下」および「12歳よ
り上」として類別するのではなく、OldとYoungという2つのファジー集合を採用
して、2歳児が、Oldファジー集合におけるメンバーシップ関数μOld(2)=0
.01以外に、Youngファジー集合におけるメンバーシップ関数μYoung(2)=
0.99を有してもよいようにすることができる。反対に、65歳の退職者は、
μYoung(65)=0.13のYoungメンバーシップ関数と、μOld(65)=0
.87のOldメンバーシップ関数を有してもよい。しかしながら、ティーンエイ
ジャーについては、メンバーシップ関数はそれほど極端ではない。たとえば、1
3歳の者は、μYoung(13)=0.45およびμOld(13)=0.55という
メンバーシップ関数を有してもよい。
【0012】 古典的なクリスプなデシジョンツリーとファジー論理とを組合せるためのある
試みは、FID3として知られており、ユーザが、トレーニングデータのすべて
について予め定義されたクラスの各々においてメンバーシップ関数を定義する。
各メンバーシップ関数は、ファジーな判断のアークラベルとしての役割を果たす
ことができる。ID3においてのように、FID3は、情報利得を最大にするこ
とによりそのデシジョンツリーを生成する。ファジーなデシジョンツリーの判断
はファジー変数でもあり、可能な分類の各々においてテストされたオブジェクト
のメンバーシップを示すものである。図5の例において、分岐ノード510から
発するアーク512および514は、それぞれ、Youngファジー集合およびOldフ
ァジー集合上のメンバーシップ関数によってファジー化することが可能である。
たとえば、アーク512は、μYoung(Xi)<0.5または情報利得を最大にす
るような他の値というテストであり得る。アーク532および534については
、それぞれのファジー集合は、それぞれ、Normal(正常)およびFeverish(熱っ
ぽい)であり得る。たとえば、葉ノード520でのクラスの0.20メンバーシ
ップおよび葉ノード540でのクラスの0.80メンバーシップによる結果は、
36mgの薬品Xを使用することを示唆するかもしれない。
【0013】 FID3での不利益の1つは、トレーニングデータのすべてについての属性の
各々においてメンバーシップ関数が、ユーザによって前もって指定されなければ
ならないということである。しかしながら、多数の属性または大きさを備えるデ
ータに対して、メンバーシップ関数を決定することは典型的には困難な作業であ
り、専門家が集中的に関わる必要がある。さらに、ファジー集合自体は前もって
知られてさえおらず、さらなる調査を必要とするかもしれない。
【0014】 したがって、柔軟な態様で実世界のまたは「ファジーな」データを扱うことの
できるデータ解析技術が必要とされる。また、データのグループ化またはファジ
ーメンバーシップ関数などの他のアプリオリな情報が、前もって供給される必要
のない技術も必要とされる。
【0015】
【発明の概要】
これらのおよび他の必要性は、デシジョンツリーが生成される間データが動的
にクラスタ化される、この発明によって解決される。ある実施例では、データは
、ユーザが集合を予め定義したりまたは前もってメンバーシップ関数を計算する
ことを必要とせずに、メンバーシップ関数をオンザフライで生成するファジーク
ラスタリング解析を用いてクラスタ化される。
【0016】 したがって、この発明のある局面は、いくつかの特徴量によって特徴付けられ
るデータのためのデシジョンツリーを生成するための方法およびソフトウェアに
関し、いくつかのファジークラスタ解析を特徴量の各々に沿って行なって、1つ
以上のファジーなクラスタの対応する集合および最大分割係数(partition coef
ficient)を計算する。最大分割係数に対応する特徴量が選択され、デシジョン
ツリーが、1つ以上のファジーなクラスタの対応する集合に基づいて構築される
。ファジークラスタ解析を行なうことにより、実世界のデータがよりよく説明さ
れる。
【0017】 この発明の別の局面は、いくつかの特徴量によって特徴付けられるデータのた
めのデシジョンツリーを生成するための方法およびソフトウェアに関し、いくつ
かのクラスタ解析を特徴量の各々に沿って行なって、最大クラスタ有効性測度を
計算する。最大クラスタ有効性測度に対応する特徴量の1つが選択され、データ
は、選択された特徴量に基づいて1つ以上のグループに細分される。そして、デ
シジョンツリーが、1つ以上のグループに基づいて構築される。クラスタ解析を
行なって最大クラスタ有効性を計算することにより、デシジョンツリーは、最適
なクラスタ可分性に対応することができる。
【0018】 この発明のさらに別の局面は、いくつかの特徴量(たとえば大きさまたは属性
)によって特徴付けられるデータであってそのうちの1つが選択されるデータの
ためのデシジョンツリーを生成するための方法およびソフトウェアに属する。選
択された特徴量に沿ったクラスタ解析を行なってデータを1つ以上のクラスタに
グループ化し、デシジョンツリーが1つ以上のクラスタに基づいて構築される。
クラスタ解析を行なうことにより、データがグループ化され得るさまざまな可能
な集合を決定するために、データは予め分析される必要がない。
【0019】 この発明のさらに他の目的および利点は、この発明を実施することが企図され
た最良の態様の例示のためにのみ、以下の詳細な説明から容易に明らかとなるで
あろう。理解されるであろうように、この発明は、他のおよび異なった実施例を
可能とし、そのいくつかの詳細が、この発明から全く逸脱することなしに、さま
ざまな明白な点において変形を可能とする。したがって、図面および説明は、制
限的でなく本質的に例示的なものと見なされるべきである。
【0020】 この発明は、添付の図面の図において制限的なものでなく例として示され、同
様の参照番号が同様の要素を参照する。
【0021】
【好ましい実施例の説明】
デシジョンツリーを生成するための方法および装置が記載される。以下の記載
において、説明の目的のために、この発明を完全に理解するために多くの具体的
な詳細が述べられる。しかしながら、当業者には、この発明がこれらの具体的な
詳細なしに実施され得ることが明らかとなるであろう。他の場合には、この発明
を不必要にわかりにくくすることを回避するために、周知の構造および装置がブ
ロック図で示される。
【0022】 ハードウェア概要 図1は、この発明の実施例が実現され得るコンピュータシステム100を示す
ブロック図である。コンピュータシステム100は、情報をやり取りするための
バス102または他の通信メカニズムと、バス102に結合され情報を処理する
ためのプロセッサ104とを含む。コンピュータシステム100は、バス102
に結合され、プロセッサ104によって実行されるべき命令および情報を記憶す
るための、ランダムアクセスメモリ(RAM)または他の動的記憶装置などの主
メモリ106も含む。主メモリ106は、プロセッサ104によって実行される
べき命令の実行中、一時変数または他の中間情報を記憶するために使用されても
よい。コンピュータシステム100は、バス102に結合され、プロセッサ10
4のための命令および静的情報を記憶するための、リードオンリメモリ(ROM
)108または他の静的記憶装置をさらに含む。磁気ディスクまたは光ディスク
などの記憶装置110が設けられ、バス102に結合され、情報および命令を記
憶する。
【0023】 コンピュータシステム100は、情報をコンピュータユーザに表示するための
陰極線管(CRT)などのディスプレイ112にバス102を介して結合されて
もよい。アルファベット数字および他のキーを含む入力装置114がバス102
に結合され、プロセッサ104に情報およびコマンド選択を交信する。ユーザ入
力装置の別のタイプは、プロセッサ104に方向情報およびコマンド選択を交信
しかつディスプレイ112上のカーソルの動きを制御するための、マウス、トラ
ックボール、カーソル方向キーなどのカーソル制御116である。この入力装置
は、典型的には、装置が平面における位置を指定することを可能にする、第1の
軸(たとえばx)および第2の軸(たとえばy)の2つの軸における2自由度を
有する。
【0024】 この発明は、デシジョンツリーを生成するためのコンピュータシステム100
の使用に関する。この発明のある実施例に従えば、プロセッサ104が主メモリ
106に含まれる1つ以上の命令の1つ以上のシーケンスを実行することに応答
して、デシジョンツリーの生成がコンピュータシステム100によって与えられ
る。そのような命令は、記憶装置110などの別のコンピュータ読出可能媒体か
ら主メモリ106に読出されてもよい。主メモリ106に含まれる命令のシーケ
ンスの実行により、プロセッサ104は、ここに記載されるプロセスステップを
行なうようになる。マルチプロセッシング構成における1つ以上のプロセッサを
採用して、主メモリ106に含まれる命令のシーケンスを実行してもよい。代替
の実施例では、この発明を実現するためにソフトウェア命令と組合されまたはそ
の代わりにハードワイヤード回路構成が使用されてもよい。したがって、この発
明の実施例は、ハードウェア回路構成およびソフトウェアのいかなる特定の組合
せにも限られるものでない。
【0025】 ここに使用される「コンピュータ読出可能媒体」という言葉は、命令をプロセ
ッサ104に与えて実行させることに関与する任意の媒体のことをいう。そのよ
うな媒体は、不揮発性媒体、揮発性媒体および伝送媒体を含むがこれに限られる
ものでない多くの形をとり得る。不揮発性媒体は、たとえば、記憶装置110な
どの光ディスクまたは磁気ディスクを含む。揮発性媒体は、主メモリ106など
のダイナミックメモリを含む。伝送媒体は、バス102を含むワイヤを含む、同
軸ケーブル、導線および光ファイバを含む。伝送媒体は、無線周波数(RF)お
よび赤外(IR)データ通信の際に生成されるものなどの、音波または光波の形
をとってもよい。コンピュータ読出可能媒体のよくある形は、たとえば、フロッ
ピー(R)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、ま
たは任意の他の磁気媒体、CD−ROM、DVD、任意の他の光学媒体、パンチ
カード、紙テープ、穴のパターンを備える任意の他の物理的媒体、RAM、PR
OMおよびEPROM、FLASH−EPROM、任意の他のメモリチップもし
くはカートリッジ、以下に記載されるような搬送波、またはコンピュータが読出
すことのできる任意の他の媒体を含む。
【0026】 コンピュータ読出可能媒体の種々の形式のものが、1つ以上の命令の1つ以上
のシーケンスをプロセッサ104に運び実行させるのに必要とされてもよい。た
とえば、命令は最初に遠隔コンピュータの磁気ディスク上に担持されていてもよ
い。遠隔コンピュータは、命令をそのダイナミックメモリにロードし、モデムを
用いて電話線を介して命令を送信することができる。コンピュータシステム10
0にローカルなモデムは、電話線によりデータを受信し、赤外トランスミッタを
用いてデータを赤外信号に変換することができる。バス102に結合される赤外
検出器が、赤外信号で運ばれるデータを受信し、データをバス102に与えるこ
とができる。バス102はデータを主メモリ106に運び、プロセッサ104は
そこから命令を取出して実行する。主メモリ106によって受取られた命令は、
場合により、プロセッサ104による実行の前または後のいずれかで記憶装置1
10に記憶されてもよい。
【0027】 コンピュータシステム100は、バス102に結合される通信インターフェイ
ス118も含む。通信インターフェイス118は、ローカルネットワーク122
に接続されるネットワークリンク120に結合する双方向データ通信を与える。
たとえば、通信インターフェイス118は、統合サービスデジタル網(ISDN
)カードまたはモデムであって、データ通信接続を電話線の対応する型に与えて
もよい。別の例として、通信インターフェイス118は、ローカルエリアネット
ワーク(LAN)カードであって、データ通信接続を互換性のあるLANに与え
てもよい。ワイヤレスリンクが実現されてもよい。いずれのそのような実現化例
でも、通信インターフェイス118は、さまざまなタイプの情報を表わすデジタ
ルデータストリームを運ぶ電気信号、電磁信号または光信号を送受信する。
【0028】 ネットワークリンク120は、典型的には、1つ以上のネットワークを介して
他のデータ装置にデータ通信を与える。たとえば、ネットワークリンク120は
、ローカルネットワーク122を介してホストコンピュータ124に、またはイ
ンターネットサービスプロバイダ(ISP)126によって作動されるデータ機
器に接続を与えてもよい。ISP126は、現在普通「インターネット」128
と呼ばれているワールドワイドなパケットデータ通信ネットワークを介してデー
タ通信サービスを提供する。ローカルネットワーク122およびインターネット
128はどちらも、デジタルデータストリームを運ぶ電気信号、電磁信号または
光信号を用いる。コンピュータシステム100におよびそれからデジタルデータ
を運ぶ、さまざまなネットワークを介する信号ならびにネットワークリンク12
0上のおよび通信インターフェイス118を介する信号は、情報を転送する搬送
波の例示の形である。
【0029】 コンピュータシステム100は、ネットワーク、ネットワークリンク120お
よび通信インターフェイス118を介してプログラムコードを含むデータを受取
りメッセージを送ることができる。インターネットの例では、サーバ130が、
インターネット128、ISP126、ローカルネットワーク122および通信
インターフェイス118を介してアプリケーションプログラムのための要求され
たコードを伝送し得る。この発明に従えば、あるそのようなダウンロードされた
アプリケーションは、ここに記載されるデシジョンツリーの生成に供する。受信
されたコードは、受信されたときにプロセッサ104によって実行されてもよく
、および/または記憶装置110もしくは他の不揮発性記憶装置に記憶されて後
に実行されてもよい。このように、コンピュータシステム100は搬送波の形で
アプリケーションコードを獲得し得る。
【0030】 ファジークラスタリング この発明のある局面は、データセット自体が、合理的なメンバーシップ関数を
得るために使用可能である情報を含むという認識から派生する。したがって、デ
シジョンツリーおよびメンバーシップ関数の両方が、データセットから自動的に
抽出可能である。この発明のある実施例では、ファジーc−平均(FCM)クラ
スタリング法を用いて、データからメンバーシップ関数を抽出するが、ファジー
クラスタリングの他の形がこの発明のさまざまな実施例において採用され得る。
【0031】 FCMモデルは、所与のデータセットX={xi}、大きさl∈1..pでi
∈1..n、およびファジネスパラメータm∈(1,∞)に対する目的関数JFC M の最小化として定義され得る。
【0032】
【数1】
【0033】 式中、U={uik}、V={vi}、uik∈[0,1]は、c個のクラスタの
l番目クラスタにおけるxkのメンバーシップであり、i∈1..c、k∈1.
.n、すべてのk∈1..nに対してΣuik=1であって、viはl番目のクラ
スタの中心、ただし、i∈1..cであり、mは典型的には2である。ある実現
化例では、FCMモデルは、JFCMの必要な極値による交互最適化(alternating
optimization、AO)により最適化されるが、他の最適化技術を採用してもよ
い。
【0034】 FCMのためのAO技術では、クラスタ中心のその後の推定値VおよびV*
【0035】
【数2】
【0036】 ただしvthはしきい値パラメータである、を満たすまで、メンバシップ関数uik およびクラスタ中心viは、以下のように交互に更新される:
【0037】
【数3】
【0038】 および
【0039】
【数4】
【0040】 連続なメンバーシップ関数μi (l):IR→[0,1],i∈1..c,l∈1
..pは、uikメンバーシップの射影およびその後の内挿または近似により、ま
たは単にクラスタ中心viの射影vi (l)を式(4)に挿入することにより、求め
ることができる。
【0041】
【数5】
【0042】 デシジョンツリーの生成 この発明のある実施例に従えば、メンバーシップ関数の抽出は、デシジョンツ
リーを誘導により生成しながらクラスタ化することにより得られる。動作の開始
において、デシジョンツリーは、データセットと関連付けられるルートノードで
始まる。データと関連付けられる各ノードNについて(たとえばルートノードか
ら始まる)、図2に示されるステップが行なわれる。説明の目的のために、この
発明のこの実施例の動作は、以下により詳細に説明するように、パラメータ、m
=2、c=4、vth=10-10および領域境界しきい値rth=0.3を用いて図
3に示す例示のデータセット300に対して例示される。さらに、作業例の結果
は、図4のデシジョンツリー400として表わされる。
【0043】 ステップ200において、残りの大きさpの数が調べられる。ゼロ個の大きさ
が残っていれば、さらに細分化すべきものはなく、現在のノードが葉ノードとさ
れる。作業例における点データは連続であるので、「大きさ」という言葉がこの
議論において用いられるが、この発明はそのように制限されるものでなく、記載
される方策は、名目的な属性データおよび連続な大きさデータであり得るデータ
の特徴により一般的に適用可能である。大きさデータは、典型的には、長さ、時
間、電荷、温度、質量、エネルギなどの連続なまたは量子化された測度のことを
いう。名目的属性データは、典型的には、たとえば、男性/女性などの有限集合
から選択された1つの要素のことをいう。
【0044】 図3を参照し、データセット300は、4つの明らかに目に見えるクラスタ、
すなわち、左上角の6つの点からなるクラスタ310と、左下角の9個の点から
なるクラスタ320と、中央の6個の点からなるクラスタ330と、右上角の4
つの点からなるクラスタ340とを形成する29個の2大きさの点を含む。目視
検査により、クラスタは、垂直線x=25およびx=45で、それぞれ、左側の
クラスタ対と、中央および右の2個の単一クラスタとに分けることができる。ク
ラスタ310および320を含む左側のクラスタ対は、水平線y=30によって
さらに分けることができる。作業例では、2つの残りの大きさxおよびyがあり
、したがって実行はステップ202に進む。
【0045】 ステップ202において、各大きさ(たとえばxおよびy)におけるデータは
クラスタ化され、クラスタリングの妥当性を量子化する分割係数が、クラスタ有
効性、またはどれほどよくクラスタが分けられるかについての測度として、各大
きさごとに計算される。ある実現化例では、ファジーc−平均クラスタリングが
採用可能であるが、ファジーk平均などのファジークラスタリングの他の形が採
用されてもよい。ファジーc−平均クラスタリング法においては、目的関数JFC M が、所与の数のクラスタcに対して、最小化される。したがって、ファジーク
ラスタリングが、分割Uc (l)を導くいくつかの異なったクラスタリング数(たと
えば、最大c=4クラスタまで)について行なわれ、分割係数PC(Uc (l))が
計算される。
【0046】 ある実施例において、PC(Uc (l))が以下のようにc>1に対して計算され
る。
【0047】
【数6】
【0048】 ある状況下では、データ要素が、いかなるクラスタ構造も所有しないかもしれ
ない。したがって、最適のクラスタリングが単一のクラスタリングであるかどう
かを決定するためにデータをテストする必要がある。ある実施例では、データの
領域境界がテストされ、大きさ(ξmax−ξmin)でのクラスタにおけるデータの
領域が、全体のデータセットの領域(xmax−xmin)の予め定められた一部内に
あるならば、データは、単一クラスタを構成するものと見なされる。より具体的
には、以下のテストを行なうことができる。
【0049】
【数7】
【0050】 式中、rthは、設定可能なしきい値パラメータ(たとえば0.3)である。デ
ータが単一クラスタ内にあるものと見なされるべきならば、分割係数は、複数の
クラスタの分割係数よりも大きいものとなる1.0に設定される。
【0051】 作業例では、最大分割係数0.94である大きさxのクラスタリングは3つの
クラスタを有し、最大分割係数0.93である大きさyのクラスタリングも3つ
のクラスタを有する。
【0052】 ステップ204で、最良の分割係数となる大きさl*が選択される。最大PC
(Uc* (l*))=maxc,l{PC(Uc (l))}に対して最良の分割が得られる。
作業例では、大きさxの分割係数(0.94)が大きさyの分割係数(0.93
)よりも大きいために大きさxが選ばれる。
【0053】 ステップ206で、次にデータは選択された大きさl*に沿ってc*個のクラス
タに分割される。これらのサブセットは、現時のノードNにラベルx(l*)<b1 ( l*) ,b1 (l*)<x(l*)<b2 (l*),...,bc*-2 (l*)<x(l*)<bc*-1 (l*)
c*-1 (l*)<x(l*)を持つc*個のアークを作成することにより、デシジョンツ
リーに挿入される(ステップ208)。境界bi (l*),i∈1..c*−1は、(
4)で定義された隣接するメンバーシップ関数が等しくなるように決定されるか
または、一般性を失うことなくクラスタ中心がソートされると仮定すると、以下
のとおりである。
【0054】
【数8】
【0055】 図4を参照する作業例では、大きさxが選択された。したがってデシジョンツ
リーのルートの分岐ノード410は、ノード410で大きさxがテストされるこ
とを示すようにラベル付けされる。ノード410からそれぞれのノード420、
430および440への各アーク412、413および414は、それぞれ境界
(8.00,22.31)、(22.31,41.19)および(41.19,
53.00)でラベル付けされる。
【0056】 図2に戻って、ステップ210で、データは選択された大きさl*を除いて各
クラスタに射影される。言い換えると、各データxiは、b0 (l*)=−∞かつbc* (l*) =+∞としてbi-1 (l*)<x(l*)<bi (l*) の条件ラベルを満たすデータセ
ットXのp−1の大きさの射影のサブセットを含む。大きさxはステップ204
で選択された大きさであるため、作業例ではx座標はデータから除去され、y座
標のみを残す。
【0057】 ステップ212で、大きさまたはデータが残らなくなるまで、各クラスタごと
にステップ200−210のプロセスが再帰的に繰返される。図4を参照する作
業例では、このプロセスの再帰的適用例は、それぞれクラスタ320および31
0に対応する2つの付加的な葉ノード450および460を生じる。分岐ノード
420からそれぞれの葉ノード450および460へのアーク425および42
6は、それぞれ(8.00,31.32)および(31.32,58.00)と
ラベル付けされる。しかしながら、分岐ノード430および440に対応する他
のサブセットに対する再帰呼出しは、不等式(6)のテストが当てはまったため
、クラスタへのさらなる分割は生じない。むしろ、単一のアーク437が分岐ノ
ード430から葉ノード470に出たり、単一のアーク448が分岐ノード44
0から葉ノード480に出たりする。
【0058】 したがって、例示的なデータセット300についてのこの実施例の結果は、4
つの葉ノード450、460、470および480を備えるデジジョンツリーで
あり、その各々が、目視検査で明らかであったデータセット300中の4つのク
ラスタ320、310、330および340にそれぞれ対応する。このように、
対応するクリスプ分割はさらに、視覚的に得られた分割と全く同じである。すな
わち、点xk∈Xは同じ(クリスプな)クラスに属する。しかしながら、境界線
はクラスタリングの結果から自動的に決定されたため、境界線x=22.31、
x=41.19およびy=31.32は、目視検査によって生じたものとはわず
かに異なっている。さらに、自動的に生成された境界線は最適なクラスタ分離性
を生じるように設定される。
【0059】 したがって、デシジョンツリーと(クリスプなまたはファジーな)クラスタと
の両者を抽出する統一された方策を用いるデシジョンツリークラスタリング手順
が説明された。デシジョンツリーは単一の大きさまたは特徴のその後のクラスタ
リングによって構築され、好ましい分離の選択はクラスタ有効性に基づいている
。1つの実施例では,クラスタリングはファジーc平均(FCM)モデルおよび
分割係数(PC)を用いて選択された分離を決定する。クラスタ有効性測度とし
て分割係数を用いることにより、クラスタ分離性に対して優れたまたは最適な結
果をもたらす。しかしながら、他の有効性測度を選択することによって他の最適
性条件を組入れることができ、FCM以外のクラスタリングモデルを用いてデシ
ジョンツリーを生成することができる。たとえば、FCMの代わりにハードc平
均(HCM)モデルを用いることにより、クリスプデシジョンツリーがもたらさ
れる。
【0060】 この発明は現在最も実践的かつ好ましい実施例と考えられるものと関連して説
明されたが、この発明が開示された実施例に限定されるものではなく、これに対
して、添付の請求項の精神および範囲内に含まれるさまざまな修正および同等の
構成を含むことを意図することを理解されたい。
【図面の簡単な説明】
【図1】 この発明の実施例が実現可能であるコンピュータシステムの図で
ある。
【図2】 この発明のある実施例の動作を例示する流れ図である。
【図3】 この発明のある実施例の動作を例示するために使用される例示の
データセットのグラフの図である。
【図4】 この発明のある実施例によって発生される例示のデシジョンツリ
ーの概略図である。
【図5】 デシジョンツリーの概略図である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ロイチャウドューリー,シューナク アメリカ合衆国、94065 カリフォルニア 州、レッドウッド・ショアーズ、オラク ル・パークウェイ、500、オラクル・コー ポレイション内 Fターム(参考) 5B075 NK06 NR12 PP03 QT05

Claims (34)

    【特許請求の範囲】
  1. 【請求項1】 複数の特徴量を特徴とする複数のデータに対してデシジョン
    ツリーを生成するための方法であって、 複数の特徴量の中から1つの特徴量を選択するステップと、 選択された特徴量に沿ってクラスタ解析を行なってデータを1つまたはそれ以
    上のクラスタにグループ化するステップと、 1つまたはそれ以上のクラスタに基づいてデシジョンツリーを構築するステッ
    プとを含む、方法。
  2. 【請求項2】 特徴量を選択するステップは、 特徴量の各々に沿って複数のクラスタ解析を行なって最大クラスタ有効性測度
    を計算するステップを含み、前記最大クラスタ有効性測度は、特徴量の1つに対
    応し、さらに 最大クラスタ有効性測度に対応する特徴量のうち1つを選択するステップを含
    む、請求項1に記載の方法。
  3. 【請求項3】 特徴量の各々に沿って複数のクラスタ解析を行なって最大ク
    ラスタ有効性測度を計算するステップは、 特徴量の各々ごとに、複数のクラスタ数に対して特徴量の前記各々に沿って複
    数のクラスタ解析を行なってそれぞれの分割係数を計算するステップと、 分割係数の中から最大クラスタ有効性測度を決定するステップとを含む、請求
    項2に記載の方法。
  4. 【請求項4】 クラスタ解析を行なうステップはファジークラスタ解析を行
    なうステップを含む、請求項1に記載の方法。
  5. 【請求項5】 ファジークラスタ解析を行なうステップはファジーc平均解
    析を行なうステップを含む、請求項4に記載の方法。
  6. 【請求項6】 クラスタ解析を行なうステップはハードクラスタ解析を行な
    うステップを含む、請求項1に記載の方法。
  7. 【請求項7】 選択された特徴量に沿ってクラスタ解析を行なって1つまた
    はそれ以上のクラスタにデータをグループ化するステップは、 データのスーパーセットの領域境界の差に対するデータの領域境界の差の領域
    比を計算するステップと、 領域比が予め定められたしきい値と予め定められた関係を有するか否かを判断
    するステップと、 領域比が予め定められたしきい値と予め定められた関係を有する場合、データ
    を単一のクラスタにグループ化するステップとを含む、請求項1に記載の方法。
  8. 【請求項8】 領域比が予め定められたしきい値と予め定められた関係を有
    するか否かを判断するステップは、領域比が予め定められたしきい値よりも小さ
    いか否かを判断するステップを含む、請求項7に記載の方法。
  9. 【請求項9】 1つまたはそれ以上のクラスタに基づいてデシジョンツリー
    を構築するステップは、 クラスタの各々にデータを射影するステップを含み、射影されたデータは、選
    択された特徴量を除く複数の特徴量を特徴とし、さらに 特徴量を選択するステップを再帰的に行ない、クラスタの各々の中の射影され
    たデータに対してクラスタ解析を行なうステップを含む、請求項1に記載の方法
  10. 【請求項10】 複数の特徴量を特徴とする複数のデータに対してデシジョ
    ンツリーを生成するための方法であって、 特徴量の各々に沿って複数のクラスタ解析を行なって最大クラスタ有効性測度
    を計算するステップを含み、前記最大クラスタ有効性測度は、特徴量の1つに対
    応し、さらに 最大クラスタ有効性測度に対応する特徴量のうち1つを選択するステップと、 選択された特徴量に基づいてデータを1つまたはそれ以上のグループに細分す
    るステップと、 1つまたはそれ以上のグループに基づいてデシジョンツリーを構築するステッ
    プとを含む、方法。
  11. 【請求項11】 特徴量の各々に沿ってクラスタ解析を行なって最大クラス
    タ有効性測度を計算するステップは、 特徴量の各々ごとに、複数のクラスタ数に対して特徴量の前記各々に沿って複
    数のクラスタ解析を行なってそれぞれの分割係数を計算するステップと、 分割係数の中から最大クラスタ有効性測度を決定するステップとを含む、請求
    項10に記載の方法。
  12. 【請求項12】 クラスタ解析を行なうステップは複数のファジークラスタ
    解析を行なうステップを含む、請求項10に記載の方法。
  13. 【請求項13】 ファジークラスタ解析を行なうステップは複数のファジー
    c平均解析を行なうステップを含む、請求項10に記載の方法。
  14. 【請求項14】 クラスタ解析を行なうステップは複数のハードクラスタ解
    析を行なうステップを含む、請求項10に記載の方法。
  15. 【請求項15】 クラスタ解析を行うステップは、 データのスーパーセットの領域境界の差に対するデータの領域境界の差の領域
    比を計算するステップと、 領域比が予め定められたしきい値と予め定められた関係を有するか否かを判断
    するステップと、 領域比が予め定められたしきい値と予め定められた関係を有する場合、データ
    を単一のクラスタにグループ化するステップとを含む、請求項10に記載の方法
  16. 【請求項16】 1つまたはそれ以上のグループに基づいてデシジョンツリ
    ーを構築するステップは、 グループの各々にデータを射影するステップを含み、射影されたデータは、選
    択された特徴量を除く複数の特徴量を特徴とし、さらに 特徴量を選択するステップを再帰的に行なうステップを含み、さらに方法は、
    新しい最大分割係数に対応する特徴量の新しい1つを選択するステップと、選択
    された新しい特徴量に基づいてデータを1つまたはそれ以上の新しいグループに
    細分するステップとを含む、請求項10に記載の方法。
  17. 【請求項17】 複数の特徴量を特徴とする複数のデータに対してデシジョ
    ンツリーを生成するための方法であって、 特徴量の各々に沿って複数のファジークラスタ解析を行なって最大分割係数お
    よび1つまたはそれ以上のファジークラスタの対応する集合を計算するステップ
    を含み、前記最大分割係数は特徴量の1つに対応し、さらに 最大分割係数に対応する特徴量のうち1つを選択するステップと、 1つまたはそれ以上のファジークラスタの対応する集合に基づいてデシジョン
    ツリーを構築するステップとを含む、方法。
  18. 【請求項18】 複数の特徴量を特徴とする複数のデータに対してデシジョ
    ンツリーを生成するための命令を記録したコンピュータ読出可能媒体であって、 前記命令は、実行の際にそれにより1つまたはそれ以上のプロセッサに 複数の特徴量の中から1つの特徴量を選択するステップと、 選択された特徴量に沿ってクラスタ解析を行なってデータを1つまたはそれ以
    上のクラスタにグループ化するステップと、 1つまたはそれ以上のクラスタに基づいてデシジョンツリーを構築するステッ
    プとを含むステップを行なわせるように構成される、コンピュータ読出可能媒体
  19. 【請求項19】 特徴量を選択するステップは、 特徴量の各々に沿って複数のクラスタ解析を行なって最大クラスタ有効性測度
    を計算するステップを含み、前記最大クラスタ有効性測度は特徴量の1つに対応
    し、さらに 最大クラスタ有効性測度に対応する特徴量のうち1つを選択するステップを含
    む、請求項18に記載のコンピュータ読出可能媒体。
  20. 【請求項20】 特徴量の各々に沿って複数のクラスタ解析を行なって最大
    クラスタ有効性測度を計算するステップは、 特徴量の各々ごとに、複数のクラスタ数に対して特徴量の前記各々に沿って複
    数のクラスタ解析を行なってそれぞれの分割係数を計算するステップと、 分割係数の中から最大クラスタ有効性測度を決定するステップとを含む、請求
    項19に記載のコンピュータ読出可能媒体。
  21. 【請求項21】 クラスタ解析を行なうステップはファジークラスタ解析を
    行なうステップを含む、請求項18に記載のコンピュータ読出可能媒体。
  22. 【請求項22】 ファジークラスタ解析を行なうステップはファジーc平均
    解析を行なうステップを含む、請求項21に記載のコンピュータ読出可能媒体。
  23. 【請求項23】 クラスタ解析を行なうステップはハードクラスタ解析を行
    なうステップを含む、請求項18に記載のコンピュータ読出可能媒体。
  24. 【請求項24】 選択された特徴量に沿ってクラスタ解析を行なって1つま
    たはそれ以上のクラスタにデータをグループ化するステップは、 データのスーパーセットの領域境界の差に対するデータの領域境界の差の領域
    比を計算するステップと、 領域比が予め定められたしきい値と予め定められた関係を有するか否かを判断
    するステップと、 領域比が予め定められたしきい値と予め定められた関係を有する場合、データ
    を単一のクラスタにグループ化するステップとを含む、請求項18に記載のコン
    ピュータ読出可能媒体。
  25. 【請求項25】 領域比が予め定められたしきい値と予め定められた関係を
    有するか否かを判断するステップは、領域比が予め定められたしきい値よりも小
    さいか否かを判断するステップを含む、請求項24に記載のコンピュータ読出可
    能媒体。
  26. 【請求項26】 1つまたはそれ以上のクラスタに基づいてデシジョンツリ
    ーを構築するステップは、 クラスタの各々にデータを射影するステップを含み、射影されたデータは、選
    択された特徴量を除く複数の特徴量を特徴とし、さらに 特徴量を選択するステップを再帰的に行ない、クラスタの各々の中の射影され
    たデータに対してクラスタ解析を行なうステップを含む、請求項18に記載のコ
    ンピュータ読出可能媒体。
  27. 【請求項27】 複数の特徴量を特徴とする複数のデータに対してデシジョ
    ンツリーを生成するための命令を記録したコンピュータ読出可能媒体であって、 前記命令は、実行の際にそれにより1つまたはそれ以上のプロセッサに 特徴量の各々に沿って複数のクラスタ解析を行なって最大クラスタ有効性測度
    を計算するステップと、前記最大クラスタ有効性測度は特徴量の1つに対応し、 最大クラスタ有効性測度に対応する特徴量のうち1つを選択するステップと、 選択された特徴量に基づいてデータを1つまたはそれ以上のグループに細分す
    るステップと、 1つまたはそれ以上のグループに基づいてデシジョンツリーを構築するステッ
    プとを含むステップを行なわせるように構成される、コンピュータ読出可能媒体
  28. 【請求項28】 特徴量の各々に沿って複数のクラスタ解析を行なって最大
    クラスタ有効性測度を計算するステップは、 特徴量の各々ごとに、複数のクラスタ数に対して特徴量の前記各々に沿って複
    数のクラスタ解析を行なってそれぞれの分割係数を計算するステップと、 分割係数の中から最大クラスタ有効性測度を決定するステップとを含む、請求
    項27に記載のコンピュータ読出可能媒体。
  29. 【請求項29】 クラスタ解析を行なうステップは複数のファジークラスタ
    解析を行なうステップを含む、請求項27に記載のコンピュータ読出可能媒体。
  30. 【請求項30】 ファジークラスタ解析を行なうステップは複数のファジー
    c平均解析を行なうステップを含む、請求項27に記載のコンピュータ読出可能
    媒体。
  31. 【請求項31】 クラスタ解析を行なうステップは複数のハードクラスタ解
    析を行なうステップを含む、請求項27に記載のコンピュータ読出可能媒体。
  32. 【請求項32】 クラスタ解析を行うステップは、 データのスーパーセットの領域境界の差に対するデータの領域境界の差の領域
    比を計算するステップと、 領域比が予め定められたしきい値と予め定められた関係を有するか否かを判断
    するステップと、 領域比が予め定められたしきい値と予め定められた関係を有する場合、データ
    を単一のクラスタにグループ化するステップとを含む、請求項27に記載のコン
    ピュータ読出可能媒体。
  33. 【請求項33】 1つまたはそれ以上のグループに基づいてデシジョンツリ
    ーを構築するステップは、 グループの各々にデータを射影するステップを含み、射影されたデータは、選
    択された特徴量を除く複数の特徴量を特徴とし、さらに 特徴量を選択するステップを再帰的に行なうステップを含み、さらに方法は、
    新しい最大分割係数に対応する特徴量の新しい1つを選択するステップと、選択
    された新しい特徴量に基づいてデータを1つまたはそれ以上の新しいグループに
    細分するステップとを含む、請求項27に記載のコンピュータ読出可能媒体。
  34. 【請求項34】 複数の特徴量を特徴とする複数のデータに対してデシジョ
    ンツリーを生成するための命令を記録したコンピュータ読出可能媒体であって、 前記命令は、実行の際にそれにより1つまたはそれ以上のプロセッサに 特徴量の各々に沿って複数のファジークラスタ解析を行なって最大分割係数お
    よび1つまたはそれ以上のファジークラスタの対応する集合を計算するステップ
    と、前記最大分割係数は特徴量の1つに対応し、 最大分割係数に対応する特徴量のうち1つを選択するステップと、 1つまたはそれ以上のファジークラスタの対応する集合に基づいてデシジョン
    ツリーを構築するステップとを含むステップを行なわせるように構成される、コ
    ンピュータ読出可能媒体。
JP2000614155A 1999-04-23 2000-04-21 デシジョンツリーを生成するためのシステムおよび方法 Expired - Fee Related JP4817502B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13063699P 1999-04-23 1999-04-23
US60/130,636 1999-04-23
PCT/US2000/010654 WO2000065480A2 (en) 1999-04-23 2000-04-21 System and method for generating decision trees

Publications (3)

Publication Number Publication Date
JP2002543497A true JP2002543497A (ja) 2002-12-17
JP2002543497A5 JP2002543497A5 (ja) 2007-06-21
JP4817502B2 JP4817502B2 (ja) 2011-11-16

Family

ID=22445618

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000614155A Expired - Fee Related JP4817502B2 (ja) 1999-04-23 2000-04-21 デシジョンツリーを生成するためのシステムおよび方法

Country Status (3)

Country Link
EP (1) EP1212698A2 (ja)
JP (1) JP4817502B2 (ja)
WO (1) WO2000065480A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015526049A (ja) * 2012-08-15 2015-09-07 ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. キーローテーション情報を有するメタデータツリー

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100498651B1 (ko) * 2002-05-03 2005-07-01 이영섭 데이터마이닝의 분류 의사 결정 나무에서 분산이 작은, 즉 순수한 관심 노드 분류를 통한 자료의 통계적 분류 방법
DE10248621A1 (de) * 2002-10-18 2004-04-29 Giesecke & Devrient Gmbh Verfahren und System zur Bearbeitung von Banknoten
CA2426439A1 (en) 2003-04-23 2004-10-23 Ibm Canada Limited - Ibm Canada Limitee Identifying a workload type for a given workload of database requests
CN1871595A (zh) * 2003-09-05 2006-11-29 新加坡科技研究局 处理生物数据的方法
US8024390B2 (en) 2005-07-01 2011-09-20 Schneider Electric USA, Inc. Automated data alignment based upon indirect device relationships
US7349815B2 (en) 2005-07-01 2008-03-25 Square D Company Automated integration of data in utility monitoring systems
US7684441B2 (en) 2005-07-01 2010-03-23 Bickel Jon A Automated precision alignment of data in a utility monitoring system
US7272518B2 (en) 2005-07-01 2007-09-18 Square D Company Automated hierarchy classification in utility monitoring systems
US8081726B2 (en) 2007-05-10 2011-12-20 Schneider Electric USA, Inc. Method and apparatus for synchronizing data in utility system
US8260579B2 (en) 2009-07-01 2012-09-04 Schneider Electric USA, Inc. Automatic identification of multiple power grids using data synchronization
US8583582B2 (en) 2010-01-28 2013-11-12 Schneider Electric USA, Inc. Robust automated hierarchical determination for power monitoring systems
US9176171B2 (en) 2010-11-19 2015-11-03 Schneider Electric USA, Inc. Data alignment in large scale electrical system applications
US9077208B2 (en) 2011-12-30 2015-07-07 Schneider Electric USA, Inc. Method of detecting instability in islanded electrical systems
CN113487182B (zh) * 2021-07-06 2024-04-26 新奥新智科技有限公司 设备健康状态评估方法、装置、计算机设备和介质
CN113627788A (zh) * 2021-08-10 2021-11-09 中国电信股份有限公司 服务策略确定方法、装置、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07311616A (ja) * 1994-05-17 1995-11-28 Mitsubishi Electric Corp 判断手続き生成方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU4661793A (en) * 1992-07-02 1994-01-31 Wellfleet Communications Data packet processing method and apparatus

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07311616A (ja) * 1994-05-17 1995-11-28 Mitsubishi Electric Corp 判断手続き生成方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CSNG200000877012, 亀井 且有 Katsuari KAMEI, "ファジィクラスタリングを用いたファジィID3と制御ルール獲得への応用 Fuzzy ID3 Using FCM and Its Ap", 日本ファジィ学会誌 第11巻 第1号 Journal of Japan Society for Fuzzy Theory and Systems, 19990215, 第11巻 第1号, 第132〜139頁, JP, 日本ファジィ学会誌 *
JPN6010025793, 亀井 且有 Katsuari KAMEI, "ファジィクラスタリングを用いたファジィID3と制御ルール獲得への応用 Fuzzy ID3 Using FCM and Its Ap", 日本ファジィ学会誌 第11巻 第1号 Journal of Japan Society for Fuzzy Theory and Systems, 19990215, 第11巻 第1号, 第132〜139頁, JP, 日本ファジィ学会誌 *
JPN6010025801, 荒木 大,小島 昌一, "数値データによる決定木の帰納学習", 人工知能学会誌, 19921101, 第7巻 第6号, 第992−1000頁, JP *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015526049A (ja) * 2012-08-15 2015-09-07 ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. キーローテーション情報を有するメタデータツリー
US10025903B2 (en) 2012-08-15 2018-07-17 EntIT Software, LLC Validating a metadata tree using a metadata integrity validator
US11373736B2 (en) 2012-08-15 2022-06-28 Micro Focus Llc Metadata tree with key rotation information

Also Published As

Publication number Publication date
JP4817502B2 (ja) 2011-11-16
WO2000065480A3 (en) 2001-04-05
EP1212698A2 (en) 2002-06-12
WO2000065480A2 (en) 2000-11-02

Similar Documents

Publication Publication Date Title
JP4817502B2 (ja) デシジョンツリーを生成するためのシステムおよび方法
US7197504B1 (en) System and method for generating decision trees
US10924947B2 (en) Systems and methods for communications node upgrade and selection
US9348877B2 (en) Methods, systems, and data structures for performing searches on three dimensional objects
US6216134B1 (en) Method and system for visualization of clusters and classifications
EP3850546A1 (en) Systems and methods for graph-based ai training
US20130097125A1 (en) Automated analysis of unstructured data
JP5092165B2 (ja) データ構築方法とシステム
Gandhi et al. Classification rule construction using particle swarm optimization algorithm for breast cancer data sets
EP1094422A2 (en) Systems and methods for ordering categorical attributes to better visualize multidimensional data
CN107240029B (zh) 一种数据处理方法及装置
JP2005339548A (ja) データベースを要約し、データベースの要約を可視化するための方法
Van Ham et al. Interactive visualization of state transition systems
CN110738577A (zh) 社区发现方法、装置、计算机设备和存储介质
WO2023207013A1 (zh) 一种基于图嵌入的关系图谱关键人员分析方法及系统
CN109951846A (zh) 无线网络识别方法、装置、存储介质及计算机设备
JP7347551B2 (ja) イメージ検索方法、装置、電子機器、及びコンピュータ読み取り可能な記憶媒体
CN108197203A (zh) 一种门脸头图挑选方法、装置、服务器和存储介质
Kim et al. Uncertain reasoning and learning for feature grouping
CN114510579A (zh) 一种基于医疗知识图谱的疾病自动问答系统、设备及介质
US8473215B2 (en) Method for clustering data items through distance-merging and density-merging techniques
CN110309337A (zh) 一种针对多种目标识别算法的特征值集中存储方法及装置
US6240068B1 (en) Method for automatically aggregating objects
CN115577696B (zh) 一种基于wbs树的项目相似度评估及分析方法
Azzag et al. Data and text mining with hierarchical clustering ants

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20031204

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20060823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060823

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100817

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100824

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100917

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101018

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110727

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110823

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110830

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees