JP5175607B2 - 決定木作成装置 - Google Patents

決定木作成装置 Download PDF

Info

Publication number
JP5175607B2
JP5175607B2 JP2008116203A JP2008116203A JP5175607B2 JP 5175607 B2 JP5175607 B2 JP 5175607B2 JP 2008116203 A JP2008116203 A JP 2008116203A JP 2008116203 A JP2008116203 A JP 2008116203A JP 5175607 B2 JP5175607 B2 JP 5175607B2
Authority
JP
Japan
Prior art keywords
decision tree
vertex
condition
parts
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008116203A
Other languages
English (en)
Other versions
JP2009266033A (ja
Inventor
茂太 國信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008116203A priority Critical patent/JP5175607B2/ja
Publication of JP2009266033A publication Critical patent/JP2009266033A/ja
Application granted granted Critical
Publication of JP5175607B2 publication Critical patent/JP5175607B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、部品組み合せと識別子の多対一の関係を設定し、識別子により製品の仕様を判別できるようにするために用いられ、指定の部品種類分類順に従った頂点数が最少の決定木を作成する決定木作成装置に関する。
部品組み合せと識別子の多対一の関係を設定し、識別子により製品の仕様を判別できるようにすることは、パソコン製造分野や自動車製造分野でしばしば行われる。指定の部品種類分類順に従った頂点数が最少の決定木として表示することで、部品組み合わせに対して正しい識別子が設定されているかどうかの検証作業を容易にする。
部品組み合わせと識別子の多対一の関係は、一般には表形式で書かれるが部品組み合わせが膨大になると表のサイズも大きくなる。表のサイズを大きくさせないために、if then else形式で解釈する表で管理する方法も考えられている。
Beate Bollig,Ingo Wegener,"Improving the Variable Ordering of OBDDs Is NP−Complete",IEEE Transactions on Computers,45(9):993〜1002,September 1996. Tom M. Mitchell,"Machine Learning",McGraw−Hill Series in Computer Science, 1997. Ian H. Witten, Eibe Frank,"Data Mining: Practical Machine Learning Tools and Techniques",Morgan Kaufmann,June 2005.
部品組み合わせと識別子の多対一の関係は、一般には表形式で書かれるが部品組み合わせが膨大になると表のサイズも大きくなる。表のサイズを大きくさせないために、if then else形式で解釈する表で管理する方法も考えられている。しかし、if then else形式で解釈する表を利用すると、部品組み合わせと識別子との対応を読み解く手間がかかるようになり、誤った対応表となりやすい。そこで、本発明は、部品組み合わせと識別子の多対一の関係をユーザの指定した部品種類分類順に従って頂点数が最少の決定木に変換する決定木作成装置を提供することを目的とする。
本発明の一観点に係る決定木作成装置は、
部品種類の集合をD={d1, ..., dn}とし、
部品種類d(∈D)に分類される部品をParts(d)とし、
∀d∈Dについて、Parts(d)の部分集合Parts’ (d)(⊆Parts(d))を定義したもの(「到達条件」という。)が直積集合すなわち
Figure 0005175607
に含まれる部品組み合せを表し、
到達条件を要素としてもつリスト(「到達条件リスト」という。)は要素となっている到達条件が表す部品組み合わせの和集合に含まれる部品組み合わせを表し、
到達条件リストの集合Lから識別子の集合Mへの部分写像 g: L→M(∀l1,l2∈Lについてl1∩l2=φまたはg(l1)=g(l2)を満たすものに限る)と、逐次入力される分類部品種類とから、決定木を根頂点から子頂点に向かって段階的に作成する決定木作成装置である。
前記決定木は、以下の条件すなわち
条件1:頂点(葉を除く)は部品種類をラベルとしてもつこと、
条件2:葉は単一の識別子をラベルとしてもつこと、
条件3:枝は要素数が1以上の部品名の集合をラベルとしてもつこと、
条件4:逐次入力される分類部品種類の順番は決定木の頂点ラベルと対応している。逐次入力される分類部品種類の順番と頂点ラベルとの対応関係は以下の制約すなわち
制約1:最初に入力された部品分類種類は決定木の根頂点のラベルとする制約
制約2:2番目以降に入力された部品分類種類は、親頂点のラベルが決定されている頂点とであれば自由に対応付けられるという制約
を満たすこと、
条件5:頂点数が最少となっていること、
条件6:根頂点から枝に付けられた部品名を辿って到達する葉頂点ラベル(識別子)は、入力された部分写像gから得られる識別子と一致すること、を満たす。
本発明によれば、分類する部品種類が入力される毎に、その部品種類をラベルとしてもつ頂点と、その頂点から子頂点へ繋げる枝を作成する処理を実行する。その際、枝に付与するラベル(部品名の集合)は、全ての分類部品種類が入力された時点で、決定木の葉頂点ラベルが単一の識別子となり、かつ、頂点数が最少となるように到達条件リストに対する演算を利用し割り振る。到達条件リストに対する演算は、部品組み合わせを展開せずにおこなえるため、状態爆発を抑えられ高速である。
以下、図面を参照しながら本発明の実施形態を説明する。
部品種類の集合をDとし、d∈Dに分類される部品の集合をParts(d)と表す。パソコンの部品を例にすると、CPUやハードディスクなどが部品種類にあたり、例えばPentium(登録商標)4やCeleron(登録商標)がCPUに分類される部品になる。また、300GB HDDや600GB HDDといった部品がハードディスクに分類される部品となる。
図1は本発明の種々の実施形態に係る決定木作成装置を示すブロック図である。
1は、分類する部品種類を入力する分類部品種類入力装置である。分類部品を入力するのは、ユーザであってもよいし、外部の装置(ID3アルゴリズム等)であってもよい。
2は、第1の実施形態に係る到達条件リストの集合Lから識別子の集合Mへの部分写像 g: L→Mを入力する写像入力装置である。部分写像 g: L→Mを入力するのはユーザであってもよいし、同図に示す到達条件リストから識別子への写像作成装置7、9、12、14であってもよい。
3は、分類部品種類入力装置1で入力された分類部品種類dをラベルとしてもつ決定木の頂点を作成したとき、dに分類される部品群をどのように分割し、その頂点から出す枝に割り振ればよいかを計算する部品分割計算装置である。
4は、部品分割計算装置3で算出された部品群の分割結果から頂点や枝を作成する頂点・枝作成装置である。
5は、頂点・枝作成装置で作成された決定木もしくは作成途中の決定木を出力する決定木出力装置である。
6は、第2の実施形態に係わり、直積集合すなわち
Figure 0005175607
から識別子の集合Mへの部分写像すなわち
Figure 0005175607
を入力する写像入力装置である。
7は、写像入力装置6で入力された部分写像fから写像入力装置2への入力となる部分写像gを作成する写像作成装置である。
8は、第3の実施形態に係わり、決定木を入力する決定木入力装置である。
9は、決定木入力装置8で入力された決定木から写像入力装置2への入力となる部分写像gを作成する写像作成装置である。
10は、第4の実施形態に係わり、決定木を入力する決定木入力装置である。
11は、第4の実施形態に係る決定木入力装置10で入力された決定木の部分木を入力(指定)する部分木入力装置である。
12は、部分木入力装置11で入力された部分木を(別の部品種類分類順で)再構成するために必要な、写像入力装置2への入力となる部分写像 gを作成する写像作成装置である。
13は、第5の実施形態に係わり、部品組み合わせ表を入力する入力装置である。
14は、入力装置で入力された部品組み合わせ表から、写像作成装置への入力となる部分写像gを作成する写像作成装置である。
定義1.到達条件C
∀d∈Dについて、Parts(d)の部分集合Parts’ (d)(⊆Parts (d ))を定義したものである。D = {d1, ..., dn}とするとき、Cは直積集合Parts’ (d1)×…×Parts’ (dn)に含まれる部品組み合わせを表す。図2に到達条件の例を示す。ただし、部品種類はX, Y, Zの3つを仮定している。この到達条件はParts’ (X)×Parts’ (Y)×Parts’ (Z)で表される計12通りの部品組み合わせを定義している。
定義2.到達条件リストL
到達条件を要素としてもつリストである。リスト内の到達条件が示す部品組み合わせの和を表す。すなわち、要素数が1の到達条件リストは到達条件ともいえる。例えば、部品組み合わせ(x1×y1×z1)と部品組み合わせ(x2×y2×z2)を表す到達条件は記述できないので、和の形(到達条件のリスト)で表現する。部品組み合わせ(x1×y1×z1)に対する到達条件をR1、部品組み合わせ(x2×y2×z2)に対する到達条件をR2とすると、到達条件リストLはR1とR2を要素としてもつ(図3参照)。
本実施形態では、到達条件リストに対する下記の演算を利用している。
1.到達条件リストLの到達可能性判定(L =φ?)
2.到達条件リストL1と到達条件リストL2の共通到達条件リストLの計算(L = L1∩L2)
3.到達条件リストL1と到達条件リストL2の和到達条件リストLの計算(L = L1∪L2)
4.到達条件リストL1から到達条件リストL2を取り除いた到達条件リストLの計算(L=L1−L2)
5.到達条件C1と到達条件リストC2の包含関係の計算(C1⊇C2?)
まず、これらの演算の方法について説明する。L=L1−L2の演算方法に関してはその正しさの説明もおこなう。到達条件Cのもつ集合Parts ’(d)をC:Parts ’(d)と記述する。
1.到達可能性
1.1到達条件Cの到達可能性
到達条件Cの定義(定義1)から、Parts ’(d)=φとなるd∈Dが存在するならば、Cに含まれる部品組み合わせは存在しないことになる。Cに含まれる部品組み合わせが存在しないとき、Cは到達不能であるといい、C =φと記述する。
1.2到達条件リストLの到達可能性
到達条件リストLに含まれる部品組み合わせが存在しないとき、Lは到達不能であるといい、L =φと記述する。到達条件リストの定義(定義2)からL = C1∪…∪Cpとするとき、∀Ci(1≦i≦p)について、Ci =φならばL =φとなる。
2.共通到達条件(リスト)の計算(積集合計算)
2.1到達条件C1とC2の共通到達条件Cの計算(C = C1∩C2)
∀d∈Dについて、C:Parts ’(d) = C1:Parts ’(d)∩C2:Parts ’ (d)とする。
2.2到達条件リストL1とL2の共通到達条件リストLの計算(L = L1∩L2)
Figure 0005175607
を計算する。
3.到達条件リストL1とL2との和集合の計算(L = L1∪L2)
到達条件リストの定義(定義2)からL1とL2を連結すればよい。
4.到達条件(リスト)の差集合の計算
4.1到達条件C1からC2を取り除いた到達条件リストLの計算(L = C1−C2)
(場合1)C = C1∩C2 = φの場合
LはC1のみを要素としてもつリストとする。
(場合2)C = C1∩C2 ≠φの場合
∀d∈Dについて、到達条件Cdを以下のように作成し、Cdが到達可能ならばLに追加(連結)する。
(Cdの作成方法)
∀f∈Dについて、
d = fの場合、Cd: Parts ’(f) = C1: Parts ’(f)−C2: Parts ’(f)
(=C1: Parts ’(f)−(C1: Parts ’(f)∩C2: Parts ’(f)) )
d≠fの場合、Cd: Parts ’(f) = C1: Parts ’(f)
を計算する。
(例1)C1およびC2が図11のように与えられている場合、L = C1−C2は図12のようになる。
(例2)C3およびC4が図13のように与えられている場合、L=C3−C4は図14のようになる。
<証明>C1−C2 = Lの証明
(前提条件)∀d∈Dについて、C2:Parts ’(d) = C1: Parts ’(d)∩C2: Parts ’(d)とする。一般的にC2にはC1に含まれない部品が含まれているが、C1−C2の計算において、この前提条件をおいても一般性を失うことはない(C1に含まれない部品組み合わせがC2に含まれていても計算結果に影響しない)。
上記Lの作成方法より、L = Cd1∪Cd2∪…∪Cdnとおくことができる({d1,d2, ..., dn}=D)。
・C2∩L =φの証明(LにはC2に含まれる部品組み合わせが含まれていないことの証明)
∀d∈Dについて、Cd: Parts ’(d) =C1: Parts ’(d)−C2: Parts ’(d)となっているためC2∩Cd =φ。したがって、C2∩L=φである。
・C1 = L + C2の証明
一般的な到達条件C1およびC2として図11を仮定すると、L(=R1−R2)は図12のように作成される。Lに含まれる部品組み合わせは定義2から、
{Xa×(Ya∪Yb)×…×(Za∪Zb)} ∪ {(Xa∪Xb)×Ya×…×(Za∪Zb)} ∪ … ∪
{( Xa∪Xb)×(Ya∪Yb)×…×Za} …(式1)
で表すことができる。式1にはXb×Yb×…×Zbに含まれる部品組み合わせを除く全部品組み合わせが含まれる(添え字がbの部品集合の積集合を除く部品組み合わせが含まれる)。一方、C2に含まれる部品組み合わせは定義1から、
Xb×Yb×…×Zb …(式2)
で表すことができる。したがって、(式1)∪(式2)には全部品組み合わせが含まれることになり、
(式1)∪(式2) = (X1∪X2)×(Y1∪Y2)×…×(Z1∪Z2) …(式3)
となる。式3の表す部品組み合わせはC1の表す部品組み合わせに一致する。
4.2到達条件リストL1からL2を取り除いた到達条件リストLの計算(L = L1−L2)
L1 = CL1 1∪…∪CL1 p、L2 = CL2 1∪…∪CL2 qとすると、
Figure 0005175607
である。
5.到達条件の包含関係判定(C2⊇C1?)
∀d∈Dについて、C2: Parts ’(d)⊇C1: Parts ’(d)ならばTrueとし、それ以外の場合Falseとする。
到達条件リストに関する様々な演算を行った結果得られる到達条件リストの要素(到達条件)には不必要なものが含まれてしまう可能性がある。例えば、図15の到達条件リストL1(= C1∪C2)では、C2⊇C1となっているため、C1はL1に加える必要がない。
そこで、L = C1∪…∪Cnとするとき、∀i, j∈{1,..., n}(i≠j)について、Ci⊇Cjならば、CjをLから削除する手続きを到達条件リストに関する演算を行った後に実行する。この縮約処理は必ずしも要素数が最少の到達条件リストを作成するものではないが、決定木の作成に必要なメモリ領域および計算時間の削減に大きく貢献することが実験的に分かっている。図16の到達条件リストL2は上記の縮約方法では縮約されない例である(L2=L2’=L2’’)。
第1の実施形態(図1の部品分別計算装置3および頂点・枝作成装置4:決定木作成装置)
図4の部分写像 g: L→Mに対応する決定木を作成するには以下の手順で実現できる。
処理1:同じ識別子に対応する到達条件リスト同士を連結する。すなわち、識別子毎の到達条件リストを作成する。以後、識別子mに対する到達条件リストをLmと記述する。この処理により、図23のような到達条件リストが作成される。
処理2:入力された分類部品種類をラベルとする頂点を作成し、その頂点に対する到達条件を設定する。以後、頂点nに対する到達条件をCnと記述する。到達条件Cnは頂点nに到達するための部品組み合わせに一致する。すなわち、作成した頂点が根頂点の場合(図9(左))、到達条件 は全ての部品組み合わせが到達可能な条件となり、作成した頂点が根頂点以外の場合(図9(右)頂点2)、到達条件は親頂点の到達条件を枝に付けられた部品集合によりさらに限定したものとなる。例えば、図9(右)頂点1の到達条件C1が、図24のようであれば、頂点2の到達条件C2は、図25に示すとおりとなる。
処理3:処理1で設定された識別子毎の到達条件リストLm、および、処理2で作成された頂点nの到達条件Cnを用いて、頂点nのラベルとなっている部品種類に属する部品の集合をどのように枝のラベルに割り振るかを算出する。ただし、説明では、作成した頂点nのラベルとなっている部品種類をXと仮定する。識別子の集合をMとする。
(処理3の詳細)
処理3.1:∀m∈Mについて、共通到達条件リストLm’ = Lm∩Cnを計算する。
(場合1)Lm’≠φとなる識別子mが1つの場合には、部品集合を分割せずとも識別子が一意に決まるので、頂点nを対応する識別子をラベルとする葉頂点に置き換えて処理終了する。
(場合2)Lm’≠φとなる識別子が2つ以上存在する場合には図26に示すように∀c∈Parts(X)について、ダミーの到達条件Cc’を作成したのち、処理3.2に進む。
処理3.2:∀m∈Mについて、Lm’とCc’の共通到達条件リストLm,c = Lm’∩Cc’を計算する。図4の写像を最初に部品種類Xで分類する場合(決定木の根頂点のラベルがX)、図27のような共通到達条件リストが得られる。
Lm,cは、頂点nを部品cで分類することによって、識別子がどのように分別されるかを知るための情報として処理3.3で利用する。
処理3.3:∀c1, c2∈Parts(X)(c1≠c2)について、c1とc2を分割する必要があるかどうかを判定する(逆にいうと、一つの枝にラベルとして付けることができるかどうかを判定する)。c1とc2を分割する必要がある場合、仮にc1とc2を決定木の一つの枝のラベルとして付けると、最終的に決定木の葉として識別子が分別しきれなくなる。c1とc2を分割する必要があるかどうかの判定方法を処理3.3.1に示す。
処理3.3.1:∀m1,m2∈M(m1≠m2)について、c1=c2という仮定おいた場合に次式4がTrueとなるm1,m2が存在するかどうかを判定する。
(Lm1,c1∪Lm1,c2)∩(Lm2,c1∪Lm2,c2)≠φ…式4
式4がTrueとなるm1,m2が存在する場合、c1=c2の仮定の下で、(式4の左辺)=(Lm1,c1∪Lm1,c2)∩(Lm2,c1∪Lm2,c2)に含まれる部品組み合わせについて、識別子m1とm2が分別できないことを意味する。すなわち、c1とc2は分割する必要があることになる。一方、式4がTrueとなるm1,m2が存在しない場合、c1とc2は分割しなくても、全ての識別子が最終的に分別できることになる。
処理3.4:処理3.3において、∀c1, c2∈Parts(X)(c1≠c2)について、c1とc2が分割不要という結果となる場合、そもそも部品種類Xで分類する意味がないことになる。従って、処理2で作成した部品種類Xがラベルとなっている頂点を削除し、次に分類する部品種類をラベルとしてもつ頂点に置き換える(処理2へ戻る)。次に分類する部品種類がない場合、部品種類Xがラベルとなっている頂点を削除しておく(処理4で葉頂点が作成される)。
図4の写像を最初に部品種類Xで分類する(決定木の根頂点のラベルをXとする)場合、「x1とx2」「x2とx3」は分割する必要があり、「x1とx3」は分割する必要がないという結果が得られる。すなわち、図10のような根頂点とラベルの付けられた枝が作成される。根頂点以外の頂点の作成に関しても、入力される分類する部品種類を利用し、処理2以降を繰り返し適用すれば作成できる。全ての部品種類が入力され処理3が終了した時点で葉頂点を除く決定木が作成されていることになる。
処理4:葉頂点を作成し、その葉頂点に対して到達条件を設定し(処理2をおこなう)、その到達条件に含まれる部品組み合わせに対応する識別子をラベルとして付ける(必ず単一の識別子に対応する)。決定木の全ての葉(ラベルに識別子が付けられた頂点)が作成された時点で決定木が完成する。
第2の実施形態(図1の到達条件リストから識別子への写像作成装置7)
部分写像すなわち
Figure 0005175607
から図1の写像入力装置2への入力となる到達条件リストから識別子への写像を作成する方法は次mの通りである。
Figure 0005175607
が対応する識別子をmp(∈M)とおく。∀pについて、pを表す到達条件とmpとが対応する部分写像g: L→Mを作成する。
第3の実施形態(図1の到達条件リストから識別子への写像作成装置9)
決定木から図1の写像作成装置2への入力となる到達条件リストから識別子への写像を作成する方法は以下の通りである。
処理1:入力された決定木の全ての頂点を探索し、分類する部品種類の一覧を作成する(処理2の到達条件設定で利用)。
処理2:入力された決定木の全ての葉頂点に対し到達条件を設定する。到達条件の設定方法は、第1の実施形態における処理2と同様に、根頂点の到達条件を最初に設定し、以後、子頂点の到達条件を親頂点の到達条件と枝のラベルをもとに計算していく。
処理3:入力された決定木の葉頂点の集合をQとし、q∈Qに設定されている到達条件をCqとおく。∀qについて、Cqとqのラベルが対応する部分写像g: L→Mを作成する。
第3の実施形態を利用すると、ある部品種類分類順で分類された決定木を別の部品種類分類順で分類された決定木に変換することが可能になる。
第4の実施形態(図1の到達条件リストから識別子への写像作成装置12)
決定木およびその決定木の部分木から図1の写像作成装置への入力となる到達条件リストから識別子への写像を作成する方法は以下の通りである。ここでは、入力された部分木の分類順を変更した部分木を作成することが目的であるので、全ての部品組み合わせに対する識別子を定義した部分写像を作成する必要はない。
処理1:入力された決定木の全ての頂点を探索し、分類する部品種類の一覧を作成する(処理2の到達条件設定で利用する。
処理2:部分木の葉の到達条件を設定する。設定方法は第3の実施形態の処理2と同様。
処理3:入力された部分木の葉頂点の集合をQとし、q∈Qに設定されている到達条件をCqとおく。∀qについて、Cqとqのラベルが対応する部分写像g: L→Mを作成する。
ここで作られる部分写像は全ての部品組み合わせに対する識別子が定義されているわけではないが、部分木を再構成するには十分な情報となっている。
第4の実施形態を利用すると、決定木の一部分(部分木)の部品種類分類順を変更した決定木を作成することができる。
第5の実施形態(図1の到達条件リストから識別子への写像作成装置14)
ここでは、図8の部品組み合わせ表に対する処理を例にしながら、図1の写像作成装置への入力となる到達条件リストから識別子への写像を作成する方法を説明する。ただし、Parts (X) = { x1, x2, x3 }, Parts (Y) = { y1, y2 }, Parts (Z) = { z1, z2 }とする。また、部品組み合わせ表に含まれるルールの集合をR(={r1, r2, r3, r4})とおく。
処理1:∀r∈Rに対して、rが適用される部品組み合わせを表す到達条件リストLrを設定する。
(処理1の詳細)
処理1.1:∀r∈Rを優先度の高い順にソートする。図8の例の場合、ルール1→ルール2→ルール3→ルール4の順にソートされる。
処理1.2以降は、ソートされた順番通りに∀r∈Rに対して実行する。
処理1.2:rの到達条件Crを設定する。例えば、ルール1に対する到達条件Cr1は、図28の通りとなる。
ALLは部品種類がもつ全部品と解釈する。例えば、ルール4に対する到達条件Cr4は、図29のとおりとなる。
尚、一般的に、ここで設定される到達条件Crは、ルールrが適用される部品組み合わせとは一致していない(より優先度の高いルールで一部の部品組み合わせが定義されている可能性がある)。
処理1.3:rより前に到達条件リストを設定したルールの到達条件リストをLr1, Lr2,... とするとき、rの到達条件リストLrは、Lr = Cr−Lr1−Lr2−… となる(到達条件リストは再帰的に計算される)。
処理1により、図8の各ルールに設定される到達条件リストは図30のようになる。
処理2:部品組み合わせ表のルールrに対応する識別子をmrとする。処理1で作成されて全てのLrとmrが対応する部分写像g: L→Mを作成する。
実際に図17の部品組み合わせ表を図1の入力装置13へ入力すると、図18の部分写像g: L→Mが得られる。図18の部分写像g: L→MとID3アルゴリズムにより分類部品種類を図1の入力装置1へ入力すると図19の決定木が得られる。ID3アルゴリズムは、決定木の頂点数が最少になる部品種類分類順を計算するために利用できるヒューリスティックである。
次に図19の決定木を図1の決定木入力装置8へ入力すると図18の部分写像g: L→Mが得られる。図18の部分写像g: L→Mと、部品種類分類順を「CPU→筐体色→ハードディスク」となるように図1の2および図1の入力装置1へ入力すると図20の決定木が得られる。
図20の決定木を図1の決定木入力装置8へ入力したときに得られる部分写像g: L→Mは図21のようになり、図18の部分写像g: L→Mとは表現が異なるが内容は同じである。例えば図20の決定木を次の入力とする場合、図18の部分写像g: L→Mのように過去に作成された写像が存在すれば、それを使い回すことが可能である。
図20の決定木と図20の決定木の「筐体色」を根ノードとする左側部分木を図1の決定木入力装置10および図1の部分木入力装置11へ入力すると、図21の上4つの到達条件リストと識別子への対応関係を表す部分写像g: L→Mが作成される。この部分写像g: L→Mと、部品種類分類順を「ハードディスク→筐体色」となるように図1の写像作成装置および図1の入力装置1へ入力すると図22の部分木の構成が変更された決定木が得られる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の実施形態に係る決定木作成装置を示すブロック図 到達条件の表現例を示す図 到達条件リストの表現例を示す図 第1の実施形態に係る決定木作成装置へ入力される写像の例を示す図 作成途中の決定木の例を示す図 完成した決定木の例を示す図 分類する部品種類の指定を示す図 部品組み合わせ表の例を示す図 実施形態説明用の図(頂点の到達条件計算) 実施形態説明用の図(部品種類Xで部品を分類した直後の作成途中の決定木) 実施形態説明用の図(到達条件例) 実施形態説明用の図(図11の到達条件の差演算結果を表す到達条件リスト) 実施形態説明用の図(到達条件例) 実施形態説明用の図(図13の到達条件の差演算結果を表す到達条件リスト) 実施形態説明用の図(縮約可能な到達条件リスト) 実施形態説明用の図(縮約されない到達条件リスト) 実施形態説明用の図(入力する部品組み合わせ表) 実施形態説明用の図(図17の部品組み合わせ表から作成される部分写像) 実施形態説明用の図(出力される決定木(ID3アルゴリズムによる分類順入力)) 実施形態説明用の図(分類順を指定した場合に出力される決定木) 実施形態説明用の図(図20の決定木から作成される部分写像) 実施形態説明用の図(部分木の分類順を指定した場合に出力される決定木) 実施形態説明用の図 実施形態説明用の図 実施形態説明用の図 実施形態説明用の図 実施形態説明用の図 実施形態説明用の図 実施形態説明用の図 実施形態説明用の図
符号の説明
1…分類部品種類入力装置;
2…到達条件リストから識別子への写像入力装置;
3…部品分割計算装置;
4…頂点・枝作成装置;
5…決定木出力装置

Claims (5)

  1. 部品種類の集合をD={d1, ..., dn}とし、部品種類d(∈D)に分類される部品をParts(d)とし、
    ∀d∈Dについて、Parts(d)の部分集合Parts’ (d)(⊆Parts(d))を定義したもの(「到達条件」という。)が直積集合すなわち
    Figure 0005175607
    に含まれる部品組み合せを表し、
    到達条件を要素としてもつリスト(「到達条件リスト」という。)は要素となっている到達条件が表す部品組み合わせの和集合に含まれる部品組み合わせを表し、
    コンピュータが、メモリに記憶した到達条件リストの集合Lから識別子の集合Mへの部分写像 g: L→M(∀l1,l2∈Lについてl1∩l2=φまたはg(l1)=g(l2)を満たすものに限る)と、前記コンピュータに逐次入力される分類部品種類とから、決定木を根頂点から子頂点に向かって段階的に作成し、前記コンピュータが、以下の条件すなわち
    条件1:頂点(葉を除く)は部品種類をラベルとしてもつこと、
    条件2:葉は単一の識別子をラベルとしてもつこと、
    条件3:枝は要素数が1以上の部品名の集合をラベルとしてもつこと、
    条件4:逐次入力される分類部品種類の順番は決定木の頂点ラベルと対応している。逐次入力される分類部品種類の順番と頂点ラベルとの対応関係は以下の制約すなわち
    制約1:最初に入力された部品分類種類は決定木の根頂点のラベルとする制約
    制約2:2番目以降に入力された部品分類種類は、親頂点のラベルが決定されている頂点とであれば自由に対応付けられるという制約
    を満たすこと、
    条件5:頂点数が最少となっていること、
    条件6:根頂点から枝に付けられた部品名を辿って到達する葉頂点ラベル(識別子)は、入力された部分写像gから得られる識別子と一致すること、を満たすように前記決定木を作成する決定木作成装置。
  2. 前記コンピュータが、
    前記直積集合から識別子の集合Mへの部分写像すなわち
    Figure 0005175607
    から、前記到達条件リストの集合Lから識別子の集合Mへの部分写像 g: L→M(∀l1,l2∈Lについてl1∩l2=φまたはg(l1)=g(l2)を満たすものに限る)を作成し、作成された部分写像 g: L→Mと逐次入力される分類部品種類から、前記条件1乃至6を満たす決定木を根頂点から子頂点に向かって段階的に作成していくことを特徴とする請求項1記載の決定木作成装置。
  3. 前記コンピュータが、
    前記条件1乃至3を満たす決定木から、前記到達条件リストの集合Lから識別子の集合Mへの部分写像 g: L→M(∀l1,l2∈Lについてl1∩l2=φまたはg(l1)=g(l2)を満たすものに限る)を作成し、作成された部分写像 g: L→Mと逐次入力される分類部品種類から、前記条件1乃至6を満たす決定木を根頂点から子頂点に向かって段階的に作成していくことを特徴とする請求項1記載の決定木作成装置。
  4. 前記コンピュータが、
    前記条件1乃至3を満たす決定木と該決定木の部分木から、該部分木の再構成に必要十分な、前記到達条件リストの集合Lから識別子の集合Mへの部分写像 g: L→M(∀l1,l2∈Lについてl1∩l2=φまたはg(l1)=g(l2)を満たすものに限る)を作成し、作成された部分写像 g: L→Mと、逐次入力される分類部品種類から、前記条件1乃至6を満たす部分木を前記部分木の根頂点から子頂点に向かって段階的に作成していくことを特徴とする請求項1記載の決定木作成装置。
  5. 前記コンピュータが、
    前記到達条件リストと識別子との対応関係をルールとし、
    優先度を付与した前記ルールを優先度付ルールとし、
    前記優先度付ルールの集合を、優先度に応じた順序付けが必ず行えるルールを要素とする部品組み合わせ表とし、
    前記部品組み合わせ表において、ある部品組み合わせに対応する識別子を検索する場合、優先度の高い到達条件リストから、その部品組み合わせが到達条件リストに含まれているかを調べ、部品組み合わせが含まれていればそのルールに対応する識別子対応させ(if then else形式)、
    入力される前記部品組み合わせ表から、前記到達条件リストの集合Lから識別子の集合Mへの部分写像 g: L→M(∀l1,l2∈Lについてl1∩l2=φまたはg(l1)=g(l2)を満たすものに限る)を作成し、
    作成された部分写像 g: L→Mと、逐次入力される分類部品種類から、前記条件1乃至6を満たす決定木を根頂点から子頂点に向かって段階的に作成していくことを特徴とする請求項1記載の決定木作成装置。
JP2008116203A 2008-04-25 2008-04-25 決定木作成装置 Expired - Fee Related JP5175607B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008116203A JP5175607B2 (ja) 2008-04-25 2008-04-25 決定木作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008116203A JP5175607B2 (ja) 2008-04-25 2008-04-25 決定木作成装置

Publications (2)

Publication Number Publication Date
JP2009266033A JP2009266033A (ja) 2009-11-12
JP5175607B2 true JP5175607B2 (ja) 2013-04-03

Family

ID=41391788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008116203A Expired - Fee Related JP5175607B2 (ja) 2008-04-25 2008-04-25 決定木作成装置

Country Status (1)

Country Link
JP (1) JP5175607B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6033075B2 (ja) * 2012-12-26 2016-11-30 株式会社エクサ 製品検索装置及び製品検索方法のプログラム
CN116468341B (zh) * 2023-04-03 2024-04-09 上海乾臻信息科技有限公司 仲裁工单的处理方法、装置、系统及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032417A (ja) * 2000-07-14 2002-01-31 Ebara Corp 部品管理方法、部品管理サーバ及び構成ツリー
JP2003006242A (ja) * 2001-06-26 2003-01-10 Sharp Corp 製品データ管理システム、そのシステムを動作させるためのプログラム、そのプログラムが記録された記録媒体および製品データ管理方法
JP4369082B2 (ja) * 2001-10-05 2009-11-18 株式会社日立製作所 部品選択支援システム、部品選択支援方法、部品選択支援プログラムおよび部品選択支援記憶媒体
JP2004046650A (ja) * 2002-07-12 2004-02-12 Mitsubishi Electric Corp データ管理方法およびデータベース構造
JP4377704B2 (ja) * 2003-01-24 2009-12-02 株式会社東芝 フローデータ生成方法およびフローデータ生成装置
JP4529861B2 (ja) * 2005-10-07 2010-08-25 株式会社日立製作所 階層データの検索装置および検索方法および検索プログラム

Also Published As

Publication number Publication date
JP2009266033A (ja) 2009-11-12

Similar Documents

Publication Publication Date Title
JP6045706B2 (ja) データ処理システム、データ処理方法およびデータ処理装置
Shatnawi et al. Recovering software product line architecture of a family of object-oriented product variants
JP2011013750A (ja) システムの構成要素の設計アーキテクチャを自動設計する自動設計装置、自動設計方法及び自動設計プログラム
WO2009095981A1 (ja) 表からツリー構造データを構築する方法及び装置
JP4908073B2 (ja) サービスベースソフトウェア設計支援方法及びそのための装置
Shatnawi et al. Mining reusable software components from object-oriented source code of a set of similar software
JP6268435B2 (ja) データベースの再構成方法、データベースの再構成プログラム、及び、データベースの再構成装置
JP5175607B2 (ja) 決定木作成装置
JP2006350729A (ja) アプリケーションソフトウェア構築方法、アプリケーションソフトウェア構築処理プログラム及びアプリケーションソフトウェア構築装置
JP6280270B1 (ja) 内部取引判定装置、内部取引判定方法および内部取引判定プログラム
JP2020504391A (ja) 通信データモデリング方法
JP7099316B2 (ja) 類似度演算装置、方法、およびプログラム
CN106796591A (zh) 将来自多个信息源的信息及工具予以统一化的方法以及应用该方法的计算机程序产品与装置
Schlie et al. Reengineering variants of matlab/simulink software systems
US9129232B2 (en) Determination tree generating apparatus
JP6123372B2 (ja) 情報処理システム、名寄せ判定方法及びプログラム
JP2013008237A (ja) 関連情報抽出プログラム、関連情報抽出方法及び関連情報抽出装置
JP5239597B2 (ja) データ処理装置およびその方法、並びにプログラム
JP6802109B2 (ja) ソフトウェア仕様分析装置、及びソフトウェア仕様分析方法
JP6631139B2 (ja) 検索制御プログラム、検索制御方法および検索サーバ装置
Verbeek et al. Visualizing state spaces with Petri nets
JP5167202B2 (ja) カナ氏名によるデータの名寄せ処理方法および名寄せ処理システム、ならびにそのためのプログラム
JP2016035617A (ja) ログ処理装置、ログ処理方法とそのプログラム
JP2015149018A (ja) データ管理プログラム、データ管理方法、及びデータ管理システム
JP5411954B2 (ja) ツリー抽出装置、ツリー抽出システム、ツリー抽出方法、及びツリー抽出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120925

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130107

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160111

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees