JP2002543497A - デシジョンツリーを生成するためのシステムおよび方法 - Google Patents
デシジョンツリーを生成するためのシステムおよび方法Info
- Publication number
- JP2002543497A JP2002543497A JP2000614155A JP2000614155A JP2002543497A JP 2002543497 A JP2002543497 A JP 2002543497A JP 2000614155 A JP2000614155 A JP 2000614155A JP 2000614155 A JP2000614155 A JP 2000614155A JP 2002543497 A JP2002543497 A JP 2002543497A
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- data
- fuzzy
- decision tree
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003066 decision tree Methods 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000005192 partition Methods 0.000 claims abstract description 13
- 238000007621 cluster analysis Methods 0.000 claims description 34
- 238000000638 solvent extraction Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000000926 separation method Methods 0.000 abstract description 4
- 239000000284 extract Substances 0.000 abstract 1
- 230000006870 function Effects 0.000 description 24
- 239000003814 drug Substances 0.000 description 17
- 238000004891 communication Methods 0.000 description 16
- 229940079593 drug Drugs 0.000 description 16
- 238000012360 testing method Methods 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000011179 visual inspection Methods 0.000 description 3
- 206010037660 Pyrexia Diseases 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000036760 body temperature Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 240000005020 Acaciella glauca Species 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 235000003499 redwood Nutrition 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
Description
とに関する。
れたデータからの有用な情報の抽出を伴う。たとえば、製薬会社は、どの病気が
どの薬品化合物によって有効に治療されるか、および薬品化合物の副作用は何で
あるかなどの、薬品化合物およびそれらの特徴を列挙する大きなデータベースを
生成する。種々の薬品化合物が多数であることを考慮すると、手動でこのデータ
を分析して、薬品のどのグループが病気のグループの各々を治療するのにより有
効であるとか、より有効でないとかいうことを決定するなどの、有用なパターン
を確定することは困難であり、薬品および病気の所望のグルーピングが前もって
特定されていないときにはとりわけそうである。
シジョンツリーを生成する。デシジョンツリーは、オブジェクトを複数個のクラ
スにいかにして分類するかをうまく示す規則の階層的配置を含むデータ構造であ
る。より具体的には、各オブジェクトは、多数の属性によって特徴付けられ、デ
シジョンツリーにおける各規則は、属性の1つの値をテストする。デシジョンツ
リーは、目標変数に対して異なった影響を有する可能性の高い規則の組にデータ
を分ける。たとえば、薬品化合物およびその投与の方法の特性であって特定の病
気を治療するのに有効である可能性の高いものを見付けたいことがあるかもしれ
ない。これらの特性は、1組の規則に変換可能である。
デシジョンツリー500を表わす。例示のデシジョンツリー500は、2つの分
岐ノード510および530と、3つの葉ノード520、540および550と
、アーク512、514、532および534とを含む。
能性ある値の中からいかにして選択するかを示す「規則」または条件を表わす。
属性が取り得る可能な値は、アーク512、514、532および534によっ
て示される。可能な値の中から選択がなされると、対応するアークが取られ、葉
ノードまたは別の分岐ノードに到達する。分岐ノード510の1つは、デシジョ
ンツリーの開始点である「ルート」ノードとして指定される。
の年齢がテストされることを示す。分岐ノード510を葉ノード520に接続す
るアーク512は、「<=12?」とラベル付けされ、患者の年齢が12歳以下
であるならば葉ノード520に到達すべきであることを示す。他方で、アーク5
14は分岐ノード510を分岐ノード530に接続し、患者の年齢が12歳より
大きければ分岐ノード530に到達すべきことを示す、「>12?」とラベル付
けされる。分岐ノード530は、「TEMP?」とラベル付けされ、患者の体温
がテストされることを示す。患者の体温が102°以下であれば(アーク532
によって示される)、葉ノード540に到達する。さもなくば、患者の体温が1
02°より大きければ(アーク534によって示される)、葉ノード550に到
達する。
を表わす。たとえば、判断は、患者に対して投与されるべき治療薬である。葉ノ
ード520においては、判断は20mgの薬品Xを使用することであり、葉ノー
ド540においては、判断は40mgの薬品Xを使用することであり、葉ノード
550においては、判断は10mgの薬品Yを使用することである。
をテストして、アークを選択し、葉ノードに到達するまでアークを辿ることによ
り、どの治療薬が患者に投与されるべきかを決定するために使用され得る。たと
えば、98.6°の体温の10歳の子供が治療されるべきであるとする。ルート
分岐ノード510で始まり、患者の年齢がテストされる。10歳は12歳未満で
あるので、アーク512を辿って葉ノード520に到達する。したがって、20
mgの薬品Xがその10歳児に処方される。別の例として、患者が105°の熱
を有する32歳であったとする。ルート分岐ノード510で始まり、患者の年齢
がテストされる。32歳という年齢は12歳より大きいので、分岐ノード530
までアーク514を辿り、ここで患者の体温がテストされる。患者は105°の
熱を有するので、アーク534を辿って、10mgの薬品Yが投与されるべきで
あることを示す葉ノード550に到達する。
ーをいかにして構築するかを決定するプロセスのことをいう。特に、デシジョン
ツリーは、あるとすれば、どの属性を最初にテストしどの特性を後にテストすべ
きかをうまく特定することにより構築される。デシジョンツリーを構築するため
のよくある従来の方策は、「デシジョンツリーの誘導」またはID3として知ら
れている。ID3は、1組の予め定義されたクラスに属する1組のトレーニング
オブジェクトで始まる再帰的アルゴリズムである。すべてのオブジェクトが単一
のクラスに属するのであれば、判断はなされず、葉ノードが生成され、そのクラ
スでラベル付けされる。さもなくば、分岐ノードが生成され、分岐ノードでオブ
ジェクトを区別するためにその属性が使用されたならば最高の「情報利得」を与
えるような属性が選択される。情報利得は、各属性の平均エントロピーを求める
ことにより計算される。
のようなデシジョンツリーが固定的で柔軟性がなく脆弱であるということである
。薬品の有効性の例において、従来のデシジョンツリーは、異なった薬品が様々
な度合いの有効性を有しているときにも、データへの「二者択一的な」または2
値的な方法を強いる。たとえば、デシジョンツリーにおけるクリスプな範囲の境
界の近くのデータ値は、実世界データの不正確さのために誤って分類されがちで
ある。したがって、デシジョンツリーに「ファジー論理」という概念を適用する
多くの試みがなされてきた。
年代に導入された。オブジェクトを、あるクラスのフルメンバーまたは全くメン
バーでないのいずれかとして分類する代わりに、ファジー論理は、オブジェクト
がクラスに属する度合いを表わすために0.0と1.0との間の「メンバーシッ
プ関数」を採用する。たとえば、患者の年齢を「12歳以下」および「12歳よ
り上」として類別するのではなく、OldとYoungという2つのファジー集合を採用
して、2歳児が、Oldファジー集合におけるメンバーシップ関数μOld(2)=0
.01以外に、Youngファジー集合におけるメンバーシップ関数μYoung(2)=
0.99を有してもよいようにすることができる。反対に、65歳の退職者は、
μYoung(65)=0.13のYoungメンバーシップ関数と、μOld(65)=0
.87のOldメンバーシップ関数を有してもよい。しかしながら、ティーンエイ
ジャーについては、メンバーシップ関数はそれほど極端ではない。たとえば、1
3歳の者は、μYoung(13)=0.45およびμOld(13)=0.55という
メンバーシップ関数を有してもよい。
試みは、FID3として知られており、ユーザが、トレーニングデータのすべて
について予め定義されたクラスの各々においてメンバーシップ関数を定義する。
各メンバーシップ関数は、ファジーな判断のアークラベルとしての役割を果たす
ことができる。ID3においてのように、FID3は、情報利得を最大にするこ
とによりそのデシジョンツリーを生成する。ファジーなデシジョンツリーの判断
はファジー変数でもあり、可能な分類の各々においてテストされたオブジェクト
のメンバーシップを示すものである。図5の例において、分岐ノード510から
発するアーク512および514は、それぞれ、Youngファジー集合およびOldフ
ァジー集合上のメンバーシップ関数によってファジー化することが可能である。
たとえば、アーク512は、μYoung(Xi)<0.5または情報利得を最大にす
るような他の値というテストであり得る。アーク532および534については
、それぞれのファジー集合は、それぞれ、Normal(正常)およびFeverish(熱っ
ぽい)であり得る。たとえば、葉ノード520でのクラスの0.20メンバーシ
ップおよび葉ノード540でのクラスの0.80メンバーシップによる結果は、
36mgの薬品Xを使用することを示唆するかもしれない。
各々においてメンバーシップ関数が、ユーザによって前もって指定されなければ
ならないということである。しかしながら、多数の属性または大きさを備えるデ
ータに対して、メンバーシップ関数を決定することは典型的には困難な作業であ
り、専門家が集中的に関わる必要がある。さらに、ファジー集合自体は前もって
知られてさえおらず、さらなる調査を必要とするかもしれない。
できるデータ解析技術が必要とされる。また、データのグループ化またはファジ
ーメンバーシップ関数などの他のアプリオリな情報が、前もって供給される必要
のない技術も必要とされる。
にクラスタ化される、この発明によって解決される。ある実施例では、データは
、ユーザが集合を予め定義したりまたは前もってメンバーシップ関数を計算する
ことを必要とせずに、メンバーシップ関数をオンザフライで生成するファジーク
ラスタリング解析を用いてクラスタ化される。
るデータのためのデシジョンツリーを生成するための方法およびソフトウェアに
関し、いくつかのファジークラスタ解析を特徴量の各々に沿って行なって、1つ
以上のファジーなクラスタの対応する集合および最大分割係数(partition coef
ficient)を計算する。最大分割係数に対応する特徴量が選択され、デシジョン
ツリーが、1つ以上のファジーなクラスタの対応する集合に基づいて構築される
。ファジークラスタ解析を行なうことにより、実世界のデータがよりよく説明さ
れる。
めのデシジョンツリーを生成するための方法およびソフトウェアに関し、いくつ
かのクラスタ解析を特徴量の各々に沿って行なって、最大クラスタ有効性測度を
計算する。最大クラスタ有効性測度に対応する特徴量の1つが選択され、データ
は、選択された特徴量に基づいて1つ以上のグループに細分される。そして、デ
シジョンツリーが、1つ以上のグループに基づいて構築される。クラスタ解析を
行なって最大クラスタ有効性を計算することにより、デシジョンツリーは、最適
なクラスタ可分性に対応することができる。
)によって特徴付けられるデータであってそのうちの1つが選択されるデータの
ためのデシジョンツリーを生成するための方法およびソフトウェアに属する。選
択された特徴量に沿ったクラスタ解析を行なってデータを1つ以上のクラスタに
グループ化し、デシジョンツリーが1つ以上のクラスタに基づいて構築される。
クラスタ解析を行なうことにより、データがグループ化され得るさまざまな可能
な集合を決定するために、データは予め分析される必要がない。
た最良の態様の例示のためにのみ、以下の詳細な説明から容易に明らかとなるで
あろう。理解されるであろうように、この発明は、他のおよび異なった実施例を
可能とし、そのいくつかの詳細が、この発明から全く逸脱することなしに、さま
ざまな明白な点において変形を可能とする。したがって、図面および説明は、制
限的でなく本質的に例示的なものと見なされるべきである。
様の参照番号が同様の要素を参照する。
において、説明の目的のために、この発明を完全に理解するために多くの具体的
な詳細が述べられる。しかしながら、当業者には、この発明がこれらの具体的な
詳細なしに実施され得ることが明らかとなるであろう。他の場合には、この発明
を不必要にわかりにくくすることを回避するために、周知の構造および装置がブ
ロック図で示される。
ブロック図である。コンピュータシステム100は、情報をやり取りするための
バス102または他の通信メカニズムと、バス102に結合され情報を処理する
ためのプロセッサ104とを含む。コンピュータシステム100は、バス102
に結合され、プロセッサ104によって実行されるべき命令および情報を記憶す
るための、ランダムアクセスメモリ(RAM)または他の動的記憶装置などの主
メモリ106も含む。主メモリ106は、プロセッサ104によって実行される
べき命令の実行中、一時変数または他の中間情報を記憶するために使用されても
よい。コンピュータシステム100は、バス102に結合され、プロセッサ10
4のための命令および静的情報を記憶するための、リードオンリメモリ(ROM
)108または他の静的記憶装置をさらに含む。磁気ディスクまたは光ディスク
などの記憶装置110が設けられ、バス102に結合され、情報および命令を記
憶する。
陰極線管(CRT)などのディスプレイ112にバス102を介して結合されて
もよい。アルファベット数字および他のキーを含む入力装置114がバス102
に結合され、プロセッサ104に情報およびコマンド選択を交信する。ユーザ入
力装置の別のタイプは、プロセッサ104に方向情報およびコマンド選択を交信
しかつディスプレイ112上のカーソルの動きを制御するための、マウス、トラ
ックボール、カーソル方向キーなどのカーソル制御116である。この入力装置
は、典型的には、装置が平面における位置を指定することを可能にする、第1の
軸(たとえばx)および第2の軸(たとえばy)の2つの軸における2自由度を
有する。
の使用に関する。この発明のある実施例に従えば、プロセッサ104が主メモリ
106に含まれる1つ以上の命令の1つ以上のシーケンスを実行することに応答
して、デシジョンツリーの生成がコンピュータシステム100によって与えられ
る。そのような命令は、記憶装置110などの別のコンピュータ読出可能媒体か
ら主メモリ106に読出されてもよい。主メモリ106に含まれる命令のシーケ
ンスの実行により、プロセッサ104は、ここに記載されるプロセスステップを
行なうようになる。マルチプロセッシング構成における1つ以上のプロセッサを
採用して、主メモリ106に含まれる命令のシーケンスを実行してもよい。代替
の実施例では、この発明を実現するためにソフトウェア命令と組合されまたはそ
の代わりにハードワイヤード回路構成が使用されてもよい。したがって、この発
明の実施例は、ハードウェア回路構成およびソフトウェアのいかなる特定の組合
せにも限られるものでない。
ッサ104に与えて実行させることに関与する任意の媒体のことをいう。そのよ
うな媒体は、不揮発性媒体、揮発性媒体および伝送媒体を含むがこれに限られる
ものでない多くの形をとり得る。不揮発性媒体は、たとえば、記憶装置110な
どの光ディスクまたは磁気ディスクを含む。揮発性媒体は、主メモリ106など
のダイナミックメモリを含む。伝送媒体は、バス102を含むワイヤを含む、同
軸ケーブル、導線および光ファイバを含む。伝送媒体は、無線周波数(RF)お
よび赤外(IR)データ通信の際に生成されるものなどの、音波または光波の形
をとってもよい。コンピュータ読出可能媒体のよくある形は、たとえば、フロッ
ピー(R)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、ま
たは任意の他の磁気媒体、CD−ROM、DVD、任意の他の光学媒体、パンチ
カード、紙テープ、穴のパターンを備える任意の他の物理的媒体、RAM、PR
OMおよびEPROM、FLASH−EPROM、任意の他のメモリチップもし
くはカートリッジ、以下に記載されるような搬送波、またはコンピュータが読出
すことのできる任意の他の媒体を含む。
のシーケンスをプロセッサ104に運び実行させるのに必要とされてもよい。た
とえば、命令は最初に遠隔コンピュータの磁気ディスク上に担持されていてもよ
い。遠隔コンピュータは、命令をそのダイナミックメモリにロードし、モデムを
用いて電話線を介して命令を送信することができる。コンピュータシステム10
0にローカルなモデムは、電話線によりデータを受信し、赤外トランスミッタを
用いてデータを赤外信号に変換することができる。バス102に結合される赤外
検出器が、赤外信号で運ばれるデータを受信し、データをバス102に与えるこ
とができる。バス102はデータを主メモリ106に運び、プロセッサ104は
そこから命令を取出して実行する。主メモリ106によって受取られた命令は、
場合により、プロセッサ104による実行の前または後のいずれかで記憶装置1
10に記憶されてもよい。
ス118も含む。通信インターフェイス118は、ローカルネットワーク122
に接続されるネットワークリンク120に結合する双方向データ通信を与える。
たとえば、通信インターフェイス118は、統合サービスデジタル網(ISDN
)カードまたはモデムであって、データ通信接続を電話線の対応する型に与えて
もよい。別の例として、通信インターフェイス118は、ローカルエリアネット
ワーク(LAN)カードであって、データ通信接続を互換性のあるLANに与え
てもよい。ワイヤレスリンクが実現されてもよい。いずれのそのような実現化例
でも、通信インターフェイス118は、さまざまなタイプの情報を表わすデジタ
ルデータストリームを運ぶ電気信号、電磁信号または光信号を送受信する。
他のデータ装置にデータ通信を与える。たとえば、ネットワークリンク120は
、ローカルネットワーク122を介してホストコンピュータ124に、またはイ
ンターネットサービスプロバイダ(ISP)126によって作動されるデータ機
器に接続を与えてもよい。ISP126は、現在普通「インターネット」128
と呼ばれているワールドワイドなパケットデータ通信ネットワークを介してデー
タ通信サービスを提供する。ローカルネットワーク122およびインターネット
128はどちらも、デジタルデータストリームを運ぶ電気信号、電磁信号または
光信号を用いる。コンピュータシステム100におよびそれからデジタルデータ
を運ぶ、さまざまなネットワークを介する信号ならびにネットワークリンク12
0上のおよび通信インターフェイス118を介する信号は、情報を転送する搬送
波の例示の形である。
よび通信インターフェイス118を介してプログラムコードを含むデータを受取
りメッセージを送ることができる。インターネットの例では、サーバ130が、
インターネット128、ISP126、ローカルネットワーク122および通信
インターフェイス118を介してアプリケーションプログラムのための要求され
たコードを伝送し得る。この発明に従えば、あるそのようなダウンロードされた
アプリケーションは、ここに記載されるデシジョンツリーの生成に供する。受信
されたコードは、受信されたときにプロセッサ104によって実行されてもよく
、および/または記憶装置110もしくは他の不揮発性記憶装置に記憶されて後
に実行されてもよい。このように、コンピュータシステム100は搬送波の形で
アプリケーションコードを獲得し得る。
得るために使用可能である情報を含むという認識から派生する。したがって、デ
シジョンツリーおよびメンバーシップ関数の両方が、データセットから自動的に
抽出可能である。この発明のある実施例では、ファジーc−平均(FCM)クラ
スタリング法を用いて、データからメンバーシップ関数を抽出するが、ファジー
クラスタリングの他の形がこの発明のさまざまな実施例において採用され得る。
∈1..n、およびファジネスパラメータm∈(1,∞)に対する目的関数JFC M の最小化として定義され得る。
l番目クラスタにおけるxkのメンバーシップであり、i∈1..c、k∈1.
.n、すべてのk∈1..nに対してΣuik=1であって、viはl番目のクラ
スタの中心、ただし、i∈1..cであり、mは典型的には2である。ある実現
化例では、FCMモデルは、JFCMの必要な極値による交互最適化(alternating
optimization、AO)により最適化されるが、他の最適化技術を採用してもよ
い。
..pは、uikメンバーシップの射影およびその後の内挿または近似により、ま
たは単にクラスタ中心viの射影vi (l)を式(4)に挿入することにより、求め
ることができる。
リーを誘導により生成しながらクラスタ化することにより得られる。動作の開始
において、デシジョンツリーは、データセットと関連付けられるルートノードで
始まる。データと関連付けられる各ノードNについて(たとえばルートノードか
ら始まる)、図2に示されるステップが行なわれる。説明の目的のために、この
発明のこの実施例の動作は、以下により詳細に説明するように、パラメータ、m
=2、c=4、vth=10-10および領域境界しきい値rth=0.3を用いて図
3に示す例示のデータセット300に対して例示される。さらに、作業例の結果
は、図4のデシジョンツリー400として表わされる。
が残っていれば、さらに細分化すべきものはなく、現在のノードが葉ノードとさ
れる。作業例における点データは連続であるので、「大きさ」という言葉がこの
議論において用いられるが、この発明はそのように制限されるものでなく、記載
される方策は、名目的な属性データおよび連続な大きさデータであり得るデータ
の特徴により一般的に適用可能である。大きさデータは、典型的には、長さ、時
間、電荷、温度、質量、エネルギなどの連続なまたは量子化された測度のことを
いう。名目的属性データは、典型的には、たとえば、男性/女性などの有限集合
から選択された1つの要素のことをいう。
すなわち、左上角の6つの点からなるクラスタ310と、左下角の9個の点から
なるクラスタ320と、中央の6個の点からなるクラスタ330と、右上角の4
つの点からなるクラスタ340とを形成する29個の2大きさの点を含む。目視
検査により、クラスタは、垂直線x=25およびx=45で、それぞれ、左側の
クラスタ対と、中央および右の2個の単一クラスタとに分けることができる。ク
ラスタ310および320を含む左側のクラスタ対は、水平線y=30によって
さらに分けることができる。作業例では、2つの残りの大きさxおよびyがあり
、したがって実行はステップ202に進む。
クラスタ化され、クラスタリングの妥当性を量子化する分割係数が、クラスタ有
効性、またはどれほどよくクラスタが分けられるかについての測度として、各大
きさごとに計算される。ある実現化例では、ファジーc−平均クラスタリングが
採用可能であるが、ファジーk平均などのファジークラスタリングの他の形が採
用されてもよい。ファジーc−平均クラスタリング法においては、目的関数JFC M が、所与の数のクラスタcに対して、最小化される。したがって、ファジーク
ラスタリングが、分割Uc (l)を導くいくつかの異なったクラスタリング数(たと
えば、最大c=4クラスタまで)について行なわれ、分割係数PC(Uc (l))が
計算される。
る。
ない。したがって、最適のクラスタリングが単一のクラスタリングであるかどう
かを決定するためにデータをテストする必要がある。ある実施例では、データの
領域境界がテストされ、大きさ(ξmax−ξmin)でのクラスタにおけるデータの
領域が、全体のデータセットの領域(xmax−xmin)の予め定められた一部内に
あるならば、データは、単一クラスタを構成するものと見なされる。より具体的
には、以下のテストを行なうことができる。
ータが単一クラスタ内にあるものと見なされるべきならば、分割係数は、複数の
クラスタの分割係数よりも大きいものとなる1.0に設定される。
クラスタを有し、最大分割係数0.93である大きさyのクラスタリングも3つ
のクラスタを有する。
(Uc* (l*))=maxc,l{PC(Uc (l))}に対して最良の分割が得られる。
作業例では、大きさxの分割係数(0.94)が大きさyの分割係数(0.93
)よりも大きいために大きさxが選ばれる。
タに分割される。これらのサブセットは、現時のノードNにラベルx(l*)<b1 ( l*) ,b1 (l*)<x(l*)<b2 (l*),...,bc*-2 (l*)<x(l*)<bc*-1 (l*),
bc*-1 (l*)<x(l*)を持つc*個のアークを作成することにより、デシジョンツ
リーに挿入される(ステップ208)。境界bi (l*),i∈1..c*−1は、(
4)で定義された隣接するメンバーシップ関数が等しくなるように決定されるか
または、一般性を失うことなくクラスタ中心がソートされると仮定すると、以下
のとおりである。
リーのルートの分岐ノード410は、ノード410で大きさxがテストされるこ
とを示すようにラベル付けされる。ノード410からそれぞれのノード420、
430および440への各アーク412、413および414は、それぞれ境界
(8.00,22.31)、(22.31,41.19)および(41.19,
53.00)でラベル付けされる。
クラスタに射影される。言い換えると、各データxiは、b0 (l*)=−∞かつbc* (l*) =+∞としてbi-1 (l*)<x(l*)<bi (l*) の条件ラベルを満たすデータセ
ットXのp−1の大きさの射影のサブセットを含む。大きさxはステップ204
で選択された大きさであるため、作業例ではx座標はデータから除去され、y座
標のみを残す。
にステップ200−210のプロセスが再帰的に繰返される。図4を参照する作
業例では、このプロセスの再帰的適用例は、それぞれクラスタ320および31
0に対応する2つの付加的な葉ノード450および460を生じる。分岐ノード
420からそれぞれの葉ノード450および460へのアーク425および42
6は、それぞれ(8.00,31.32)および(31.32,58.00)と
ラベル付けされる。しかしながら、分岐ノード430および440に対応する他
のサブセットに対する再帰呼出しは、不等式(6)のテストが当てはまったため
、クラスタへのさらなる分割は生じない。むしろ、単一のアーク437が分岐ノ
ード430から葉ノード470に出たり、単一のアーク448が分岐ノード44
0から葉ノード480に出たりする。
つの葉ノード450、460、470および480を備えるデジジョンツリーで
あり、その各々が、目視検査で明らかであったデータセット300中の4つのク
ラスタ320、310、330および340にそれぞれ対応する。このように、
対応するクリスプ分割はさらに、視覚的に得られた分割と全く同じである。すな
わち、点xk∈Xは同じ(クリスプな)クラスに属する。しかしながら、境界線
はクラスタリングの結果から自動的に決定されたため、境界線x=22.31、
x=41.19およびy=31.32は、目視検査によって生じたものとはわず
かに異なっている。さらに、自動的に生成された境界線は最適なクラスタ分離性
を生じるように設定される。
の両者を抽出する統一された方策を用いるデシジョンツリークラスタリング手順
が説明された。デシジョンツリーは単一の大きさまたは特徴のその後のクラスタ
リングによって構築され、好ましい分離の選択はクラスタ有効性に基づいている
。1つの実施例では,クラスタリングはファジーc平均(FCM)モデルおよび
分割係数(PC)を用いて選択された分離を決定する。クラスタ有効性測度とし
て分割係数を用いることにより、クラスタ分離性に対して優れたまたは最適な結
果をもたらす。しかしながら、他の有効性測度を選択することによって他の最適
性条件を組入れることができ、FCM以外のクラスタリングモデルを用いてデシ
ジョンツリーを生成することができる。たとえば、FCMの代わりにハードc平
均(HCM)モデルを用いることにより、クリスプデシジョンツリーがもたらさ
れる。
明されたが、この発明が開示された実施例に限定されるものではなく、これに対
して、添付の請求項の精神および範囲内に含まれるさまざまな修正および同等の
構成を含むことを意図することを理解されたい。
ある。
データセットのグラフの図である。
ーの概略図である。
Claims (34)
- 【請求項1】 複数の特徴量を特徴とする複数のデータに対してデシジョン
ツリーを生成するための方法であって、 複数の特徴量の中から1つの特徴量を選択するステップと、 選択された特徴量に沿ってクラスタ解析を行なってデータを1つまたはそれ以
上のクラスタにグループ化するステップと、 1つまたはそれ以上のクラスタに基づいてデシジョンツリーを構築するステッ
プとを含む、方法。 - 【請求項2】 特徴量を選択するステップは、 特徴量の各々に沿って複数のクラスタ解析を行なって最大クラスタ有効性測度
を計算するステップを含み、前記最大クラスタ有効性測度は、特徴量の1つに対
応し、さらに 最大クラスタ有効性測度に対応する特徴量のうち1つを選択するステップを含
む、請求項1に記載の方法。 - 【請求項3】 特徴量の各々に沿って複数のクラスタ解析を行なって最大ク
ラスタ有効性測度を計算するステップは、 特徴量の各々ごとに、複数のクラスタ数に対して特徴量の前記各々に沿って複
数のクラスタ解析を行なってそれぞれの分割係数を計算するステップと、 分割係数の中から最大クラスタ有効性測度を決定するステップとを含む、請求
項2に記載の方法。 - 【請求項4】 クラスタ解析を行なうステップはファジークラスタ解析を行
なうステップを含む、請求項1に記載の方法。 - 【請求項5】 ファジークラスタ解析を行なうステップはファジーc平均解
析を行なうステップを含む、請求項4に記載の方法。 - 【請求項6】 クラスタ解析を行なうステップはハードクラスタ解析を行な
うステップを含む、請求項1に記載の方法。 - 【請求項7】 選択された特徴量に沿ってクラスタ解析を行なって1つまた
はそれ以上のクラスタにデータをグループ化するステップは、 データのスーパーセットの領域境界の差に対するデータの領域境界の差の領域
比を計算するステップと、 領域比が予め定められたしきい値と予め定められた関係を有するか否かを判断
するステップと、 領域比が予め定められたしきい値と予め定められた関係を有する場合、データ
を単一のクラスタにグループ化するステップとを含む、請求項1に記載の方法。 - 【請求項8】 領域比が予め定められたしきい値と予め定められた関係を有
するか否かを判断するステップは、領域比が予め定められたしきい値よりも小さ
いか否かを判断するステップを含む、請求項7に記載の方法。 - 【請求項9】 1つまたはそれ以上のクラスタに基づいてデシジョンツリー
を構築するステップは、 クラスタの各々にデータを射影するステップを含み、射影されたデータは、選
択された特徴量を除く複数の特徴量を特徴とし、さらに 特徴量を選択するステップを再帰的に行ない、クラスタの各々の中の射影され
たデータに対してクラスタ解析を行なうステップを含む、請求項1に記載の方法
。 - 【請求項10】 複数の特徴量を特徴とする複数のデータに対してデシジョ
ンツリーを生成するための方法であって、 特徴量の各々に沿って複数のクラスタ解析を行なって最大クラスタ有効性測度
を計算するステップを含み、前記最大クラスタ有効性測度は、特徴量の1つに対
応し、さらに 最大クラスタ有効性測度に対応する特徴量のうち1つを選択するステップと、 選択された特徴量に基づいてデータを1つまたはそれ以上のグループに細分す
るステップと、 1つまたはそれ以上のグループに基づいてデシジョンツリーを構築するステッ
プとを含む、方法。 - 【請求項11】 特徴量の各々に沿ってクラスタ解析を行なって最大クラス
タ有効性測度を計算するステップは、 特徴量の各々ごとに、複数のクラスタ数に対して特徴量の前記各々に沿って複
数のクラスタ解析を行なってそれぞれの分割係数を計算するステップと、 分割係数の中から最大クラスタ有効性測度を決定するステップとを含む、請求
項10に記載の方法。 - 【請求項12】 クラスタ解析を行なうステップは複数のファジークラスタ
解析を行なうステップを含む、請求項10に記載の方法。 - 【請求項13】 ファジークラスタ解析を行なうステップは複数のファジー
c平均解析を行なうステップを含む、請求項10に記載の方法。 - 【請求項14】 クラスタ解析を行なうステップは複数のハードクラスタ解
析を行なうステップを含む、請求項10に記載の方法。 - 【請求項15】 クラスタ解析を行うステップは、 データのスーパーセットの領域境界の差に対するデータの領域境界の差の領域
比を計算するステップと、 領域比が予め定められたしきい値と予め定められた関係を有するか否かを判断
するステップと、 領域比が予め定められたしきい値と予め定められた関係を有する場合、データ
を単一のクラスタにグループ化するステップとを含む、請求項10に記載の方法
。 - 【請求項16】 1つまたはそれ以上のグループに基づいてデシジョンツリ
ーを構築するステップは、 グループの各々にデータを射影するステップを含み、射影されたデータは、選
択された特徴量を除く複数の特徴量を特徴とし、さらに 特徴量を選択するステップを再帰的に行なうステップを含み、さらに方法は、
新しい最大分割係数に対応する特徴量の新しい1つを選択するステップと、選択
された新しい特徴量に基づいてデータを1つまたはそれ以上の新しいグループに
細分するステップとを含む、請求項10に記載の方法。 - 【請求項17】 複数の特徴量を特徴とする複数のデータに対してデシジョ
ンツリーを生成するための方法であって、 特徴量の各々に沿って複数のファジークラスタ解析を行なって最大分割係数お
よび1つまたはそれ以上のファジークラスタの対応する集合を計算するステップ
を含み、前記最大分割係数は特徴量の1つに対応し、さらに 最大分割係数に対応する特徴量のうち1つを選択するステップと、 1つまたはそれ以上のファジークラスタの対応する集合に基づいてデシジョン
ツリーを構築するステップとを含む、方法。 - 【請求項18】 複数の特徴量を特徴とする複数のデータに対してデシジョ
ンツリーを生成するための命令を記録したコンピュータ読出可能媒体であって、 前記命令は、実行の際にそれにより1つまたはそれ以上のプロセッサに 複数の特徴量の中から1つの特徴量を選択するステップと、 選択された特徴量に沿ってクラスタ解析を行なってデータを1つまたはそれ以
上のクラスタにグループ化するステップと、 1つまたはそれ以上のクラスタに基づいてデシジョンツリーを構築するステッ
プとを含むステップを行なわせるように構成される、コンピュータ読出可能媒体
。 - 【請求項19】 特徴量を選択するステップは、 特徴量の各々に沿って複数のクラスタ解析を行なって最大クラスタ有効性測度
を計算するステップを含み、前記最大クラスタ有効性測度は特徴量の1つに対応
し、さらに 最大クラスタ有効性測度に対応する特徴量のうち1つを選択するステップを含
む、請求項18に記載のコンピュータ読出可能媒体。 - 【請求項20】 特徴量の各々に沿って複数のクラスタ解析を行なって最大
クラスタ有効性測度を計算するステップは、 特徴量の各々ごとに、複数のクラスタ数に対して特徴量の前記各々に沿って複
数のクラスタ解析を行なってそれぞれの分割係数を計算するステップと、 分割係数の中から最大クラスタ有効性測度を決定するステップとを含む、請求
項19に記載のコンピュータ読出可能媒体。 - 【請求項21】 クラスタ解析を行なうステップはファジークラスタ解析を
行なうステップを含む、請求項18に記載のコンピュータ読出可能媒体。 - 【請求項22】 ファジークラスタ解析を行なうステップはファジーc平均
解析を行なうステップを含む、請求項21に記載のコンピュータ読出可能媒体。 - 【請求項23】 クラスタ解析を行なうステップはハードクラスタ解析を行
なうステップを含む、請求項18に記載のコンピュータ読出可能媒体。 - 【請求項24】 選択された特徴量に沿ってクラスタ解析を行なって1つま
たはそれ以上のクラスタにデータをグループ化するステップは、 データのスーパーセットの領域境界の差に対するデータの領域境界の差の領域
比を計算するステップと、 領域比が予め定められたしきい値と予め定められた関係を有するか否かを判断
するステップと、 領域比が予め定められたしきい値と予め定められた関係を有する場合、データ
を単一のクラスタにグループ化するステップとを含む、請求項18に記載のコン
ピュータ読出可能媒体。 - 【請求項25】 領域比が予め定められたしきい値と予め定められた関係を
有するか否かを判断するステップは、領域比が予め定められたしきい値よりも小
さいか否かを判断するステップを含む、請求項24に記載のコンピュータ読出可
能媒体。 - 【請求項26】 1つまたはそれ以上のクラスタに基づいてデシジョンツリ
ーを構築するステップは、 クラスタの各々にデータを射影するステップを含み、射影されたデータは、選
択された特徴量を除く複数の特徴量を特徴とし、さらに 特徴量を選択するステップを再帰的に行ない、クラスタの各々の中の射影され
たデータに対してクラスタ解析を行なうステップを含む、請求項18に記載のコ
ンピュータ読出可能媒体。 - 【請求項27】 複数の特徴量を特徴とする複数のデータに対してデシジョ
ンツリーを生成するための命令を記録したコンピュータ読出可能媒体であって、 前記命令は、実行の際にそれにより1つまたはそれ以上のプロセッサに 特徴量の各々に沿って複数のクラスタ解析を行なって最大クラスタ有効性測度
を計算するステップと、前記最大クラスタ有効性測度は特徴量の1つに対応し、 最大クラスタ有効性測度に対応する特徴量のうち1つを選択するステップと、 選択された特徴量に基づいてデータを1つまたはそれ以上のグループに細分す
るステップと、 1つまたはそれ以上のグループに基づいてデシジョンツリーを構築するステッ
プとを含むステップを行なわせるように構成される、コンピュータ読出可能媒体
。 - 【請求項28】 特徴量の各々に沿って複数のクラスタ解析を行なって最大
クラスタ有効性測度を計算するステップは、 特徴量の各々ごとに、複数のクラスタ数に対して特徴量の前記各々に沿って複
数のクラスタ解析を行なってそれぞれの分割係数を計算するステップと、 分割係数の中から最大クラスタ有効性測度を決定するステップとを含む、請求
項27に記載のコンピュータ読出可能媒体。 - 【請求項29】 クラスタ解析を行なうステップは複数のファジークラスタ
解析を行なうステップを含む、請求項27に記載のコンピュータ読出可能媒体。 - 【請求項30】 ファジークラスタ解析を行なうステップは複数のファジー
c平均解析を行なうステップを含む、請求項27に記載のコンピュータ読出可能
媒体。 - 【請求項31】 クラスタ解析を行なうステップは複数のハードクラスタ解
析を行なうステップを含む、請求項27に記載のコンピュータ読出可能媒体。 - 【請求項32】 クラスタ解析を行うステップは、 データのスーパーセットの領域境界の差に対するデータの領域境界の差の領域
比を計算するステップと、 領域比が予め定められたしきい値と予め定められた関係を有するか否かを判断
するステップと、 領域比が予め定められたしきい値と予め定められた関係を有する場合、データ
を単一のクラスタにグループ化するステップとを含む、請求項27に記載のコン
ピュータ読出可能媒体。 - 【請求項33】 1つまたはそれ以上のグループに基づいてデシジョンツリ
ーを構築するステップは、 グループの各々にデータを射影するステップを含み、射影されたデータは、選
択された特徴量を除く複数の特徴量を特徴とし、さらに 特徴量を選択するステップを再帰的に行なうステップを含み、さらに方法は、
新しい最大分割係数に対応する特徴量の新しい1つを選択するステップと、選択
された新しい特徴量に基づいてデータを1つまたはそれ以上の新しいグループに
細分するステップとを含む、請求項27に記載のコンピュータ読出可能媒体。 - 【請求項34】 複数の特徴量を特徴とする複数のデータに対してデシジョ
ンツリーを生成するための命令を記録したコンピュータ読出可能媒体であって、 前記命令は、実行の際にそれにより1つまたはそれ以上のプロセッサに 特徴量の各々に沿って複数のファジークラスタ解析を行なって最大分割係数お
よび1つまたはそれ以上のファジークラスタの対応する集合を計算するステップ
と、前記最大分割係数は特徴量の1つに対応し、 最大分割係数に対応する特徴量のうち1つを選択するステップと、 1つまたはそれ以上のファジークラスタの対応する集合に基づいてデシジョン
ツリーを構築するステップとを含むステップを行なわせるように構成される、コ
ンピュータ読出可能媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13063699P | 1999-04-23 | 1999-04-23 | |
US60/130,636 | 1999-04-23 | ||
PCT/US2000/010654 WO2000065480A2 (en) | 1999-04-23 | 2000-04-21 | System and method for generating decision trees |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002543497A true JP2002543497A (ja) | 2002-12-17 |
JP2002543497A5 JP2002543497A5 (ja) | 2007-06-21 |
JP4817502B2 JP4817502B2 (ja) | 2011-11-16 |
Family
ID=22445618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000614155A Expired - Fee Related JP4817502B2 (ja) | 1999-04-23 | 2000-04-21 | デシジョンツリーを生成するためのシステムおよび方法 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP1212698A2 (ja) |
JP (1) | JP4817502B2 (ja) |
WO (1) | WO2000065480A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015526049A (ja) * | 2012-08-15 | 2015-09-07 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. | キーローテーション情報を有するメタデータツリー |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100498651B1 (ko) * | 2002-05-03 | 2005-07-01 | 이영섭 | 데이터마이닝의 분류 의사 결정 나무에서 분산이 작은, 즉 순수한 관심 노드 분류를 통한 자료의 통계적 분류 방법 |
DE10248621A1 (de) * | 2002-10-18 | 2004-04-29 | Giesecke & Devrient Gmbh | Verfahren und System zur Bearbeitung von Banknoten |
CA2426439A1 (en) | 2003-04-23 | 2004-10-23 | Ibm Canada Limited - Ibm Canada Limitee | Identifying a workload type for a given workload of database requests |
CN1871595A (zh) * | 2003-09-05 | 2006-11-29 | 新加坡科技研究局 | 处理生物数据的方法 |
US8024390B2 (en) | 2005-07-01 | 2011-09-20 | Schneider Electric USA, Inc. | Automated data alignment based upon indirect device relationships |
US7349815B2 (en) | 2005-07-01 | 2008-03-25 | Square D Company | Automated integration of data in utility monitoring systems |
US7684441B2 (en) | 2005-07-01 | 2010-03-23 | Bickel Jon A | Automated precision alignment of data in a utility monitoring system |
US7272518B2 (en) | 2005-07-01 | 2007-09-18 | Square D Company | Automated hierarchy classification in utility monitoring systems |
US8081726B2 (en) | 2007-05-10 | 2011-12-20 | Schneider Electric USA, Inc. | Method and apparatus for synchronizing data in utility system |
US8260579B2 (en) | 2009-07-01 | 2012-09-04 | Schneider Electric USA, Inc. | Automatic identification of multiple power grids using data synchronization |
US8583582B2 (en) | 2010-01-28 | 2013-11-12 | Schneider Electric USA, Inc. | Robust automated hierarchical determination for power monitoring systems |
US9176171B2 (en) | 2010-11-19 | 2015-11-03 | Schneider Electric USA, Inc. | Data alignment in large scale electrical system applications |
US9077208B2 (en) | 2011-12-30 | 2015-07-07 | Schneider Electric USA, Inc. | Method of detecting instability in islanded electrical systems |
CN113487182B (zh) * | 2021-07-06 | 2024-04-26 | 新奥新智科技有限公司 | 设备健康状态评估方法、装置、计算机设备和介质 |
CN113627788A (zh) * | 2021-08-10 | 2021-11-09 | 中国电信股份有限公司 | 服务策略确定方法、装置、电子设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07311616A (ja) * | 1994-05-17 | 1995-11-28 | Mitsubishi Electric Corp | 判断手続き生成方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU4661793A (en) * | 1992-07-02 | 1994-01-31 | Wellfleet Communications | Data packet processing method and apparatus |
-
2000
- 2000-04-21 JP JP2000614155A patent/JP4817502B2/ja not_active Expired - Fee Related
- 2000-04-21 WO PCT/US2000/010654 patent/WO2000065480A2/en active Application Filing
- 2000-04-21 EP EP00928239A patent/EP1212698A2/en not_active Withdrawn
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07311616A (ja) * | 1994-05-17 | 1995-11-28 | Mitsubishi Electric Corp | 判断手続き生成方法 |
Non-Patent Citations (3)
Title |
---|
CSNG200000877012, 亀井 且有 Katsuari KAMEI, "ファジィクラスタリングを用いたファジィID3と制御ルール獲得への応用 Fuzzy ID3 Using FCM and Its Ap", 日本ファジィ学会誌 第11巻 第1号 Journal of Japan Society for Fuzzy Theory and Systems, 19990215, 第11巻 第1号, 第132〜139頁, JP, 日本ファジィ学会誌 * |
JPN6010025793, 亀井 且有 Katsuari KAMEI, "ファジィクラスタリングを用いたファジィID3と制御ルール獲得への応用 Fuzzy ID3 Using FCM and Its Ap", 日本ファジィ学会誌 第11巻 第1号 Journal of Japan Society for Fuzzy Theory and Systems, 19990215, 第11巻 第1号, 第132〜139頁, JP, 日本ファジィ学会誌 * |
JPN6010025801, 荒木 大,小島 昌一, "数値データによる決定木の帰納学習", 人工知能学会誌, 19921101, 第7巻 第6号, 第992−1000頁, JP * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015526049A (ja) * | 2012-08-15 | 2015-09-07 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. | キーローテーション情報を有するメタデータツリー |
US10025903B2 (en) | 2012-08-15 | 2018-07-17 | EntIT Software, LLC | Validating a metadata tree using a metadata integrity validator |
US11373736B2 (en) | 2012-08-15 | 2022-06-28 | Micro Focus Llc | Metadata tree with key rotation information |
Also Published As
Publication number | Publication date |
---|---|
JP4817502B2 (ja) | 2011-11-16 |
WO2000065480A3 (en) | 2001-04-05 |
EP1212698A2 (en) | 2002-06-12 |
WO2000065480A2 (en) | 2000-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4817502B2 (ja) | デシジョンツリーを生成するためのシステムおよび方法 | |
US7197504B1 (en) | System and method for generating decision trees | |
US10924947B2 (en) | Systems and methods for communications node upgrade and selection | |
US9348877B2 (en) | Methods, systems, and data structures for performing searches on three dimensional objects | |
US6216134B1 (en) | Method and system for visualization of clusters and classifications | |
EP3850546A1 (en) | Systems and methods for graph-based ai training | |
US20130097125A1 (en) | Automated analysis of unstructured data | |
JP5092165B2 (ja) | データ構築方法とシステム | |
Gandhi et al. | Classification rule construction using particle swarm optimization algorithm for breast cancer data sets | |
EP1094422A2 (en) | Systems and methods for ordering categorical attributes to better visualize multidimensional data | |
CN107240029B (zh) | 一种数据处理方法及装置 | |
JP2005339548A (ja) | データベースを要約し、データベースの要約を可視化するための方法 | |
Van Ham et al. | Interactive visualization of state transition systems | |
CN110738577A (zh) | 社区发现方法、装置、计算机设备和存储介质 | |
WO2023207013A1 (zh) | 一种基于图嵌入的关系图谱关键人员分析方法及系统 | |
CN109951846A (zh) | 无线网络识别方法、装置、存储介质及计算机设备 | |
JP7347551B2 (ja) | イメージ検索方法、装置、電子機器、及びコンピュータ読み取り可能な記憶媒体 | |
CN108197203A (zh) | 一种门脸头图挑选方法、装置、服务器和存储介质 | |
Kim et al. | Uncertain reasoning and learning for feature grouping | |
CN114510579A (zh) | 一种基于医疗知识图谱的疾病自动问答系统、设备及介质 | |
US8473215B2 (en) | Method for clustering data items through distance-merging and density-merging techniques | |
CN110309337A (zh) | 一种针对多种目标识别算法的特征值集中存储方法及装置 | |
US6240068B1 (en) | Method for automatically aggregating objects | |
CN115577696B (zh) | 一种基于wbs树的项目相似度评估及分析方法 | |
Azzag et al. | Data and text mining with hierarchical clustering ants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20031204 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20060823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060823 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070327 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100518 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100817 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100824 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100917 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101018 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110727 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110801 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110823 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140909 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |