JP2006048183A - Data analyzing device and data analyzing program - Google Patents
Data analyzing device and data analyzing program Download PDFInfo
- Publication number
- JP2006048183A JP2006048183A JP2004224858A JP2004224858A JP2006048183A JP 2006048183 A JP2006048183 A JP 2006048183A JP 2004224858 A JP2004224858 A JP 2004224858A JP 2004224858 A JP2004224858 A JP 2004224858A JP 2006048183 A JP2006048183 A JP 2006048183A
- Authority
- JP
- Japan
- Prior art keywords
- data group
- input attribute
- condition
- data
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012552 review Methods 0.000 claims abstract description 177
- 238000004458 analytical method Methods 0.000 claims abstract description 114
- 230000004044 response Effects 0.000 claims abstract description 30
- 239000002131 composite material Substances 0.000 claims description 105
- 238000007405 data analysis Methods 0.000 claims description 102
- 238000000926 separation method Methods 0.000 claims description 83
- 238000010586 diagram Methods 0.000 claims description 77
- 238000000034 method Methods 0.000 claims description 68
- 238000009826 distribution Methods 0.000 claims description 62
- 238000012545 processing Methods 0.000 claims description 43
- 230000008569 process Effects 0.000 claims description 40
- 238000000605 extraction Methods 0.000 claims description 26
- 230000001364 causal effect Effects 0.000 claims description 21
- 230000008859 change Effects 0.000 claims description 21
- 239000000284 extract Substances 0.000 claims description 11
- 238000005520 cutting process Methods 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000002950 deficient Effects 0.000 description 123
- 230000007547 defect Effects 0.000 description 52
- 239000000758 substrate Substances 0.000 description 16
- 238000009825 accumulation Methods 0.000 description 14
- 230000006872 improvement Effects 0.000 description 14
- 238000011156 evaluation Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 10
- 238000004519 manufacturing process Methods 0.000 description 10
- 238000003860 storage Methods 0.000 description 9
- 238000000556 factor analysis Methods 0.000 description 8
- 230000012447 hatching Effects 0.000 description 7
- 238000012804 iterative process Methods 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 101150094563 YTH1 gene Proteins 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000007689 inspection Methods 0.000 description 3
- 238000012913 prioritisation Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 102100028266 Brain-specific angiogenesis inhibitor 1-associated protein 2-like protein 2 Human genes 0.000 description 1
- 101710102057 Brain-specific angiogenesis inhibitor 1-associated protein 2-like protein 2 Proteins 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、分析対象である出力属性(目的属性)、例えば製造工程で製造される製品の特性等と、出力属性に影響を与える属性である入力属性(説明属性)、例えば製造プロセス条件等との因果関係を分析し、この因果関係を示す情報を出力するデータ分析装置およびデータ分析プログラムに関する。 The present invention relates to an output attribute (object attribute) to be analyzed, such as characteristics of a product manufactured in a manufacturing process, and an input attribute (description attribute) that is an attribute affecting the output attribute, such as a manufacturing process condition. The present invention relates to a data analysis apparatus and a data analysis program for analyzing a cause-and-effect relationship and outputting information indicating the cause-and-effect relationship.
出力属性と入力属性との因果関係を分析する有効な手法としては、回帰木手法が知られている。この手法では、入力属性の値で順次切り分けた葉の部分で、出力属性の値がうまくまとまるような木構造を作成する。 As an effective method for analyzing the causal relationship between the output attribute and the input attribute, a regression tree method is known. This method creates a tree structure in which the values of the output attributes are well organized at the leaf portions that are sequentially separated by the values of the input attributes.
図20は、特許文献1の図20に記載されている回帰木の一例で、トランジスタのスレッシュホールド電圧VT_N2の特徴量を出力属性(目的変数)とし、このトランジスタを製造する各工程での使用装置を入力属性(説明変数)とした分析結果である。
FIG. 20 is an example of the regression tree described in FIG. 20 of
また、図21および図22は、上記回帰木(図20)の第1分岐条件(Field_Ox=PM1,PM3と、Field_Ox=PM2の分岐)に基づくレビュー結果で、それぞれ、スレッシュホールド電圧VT_N2の値の分布を、箱ヒゲグラフ、および、ヒストグラムで表現したグラフである。 21 and 22 show the review results based on the first branch condition (the branch of Field_Ox = PM1, PM3 and Field_Ox = PM2) of the regression tree (FIG. 20), and the values of the threshold voltage VT_N2 are respectively shown. It is the graph which expressed distribution with the box mustache graph and the histogram.
図21および図22を参照して、Field_Ox工程の使用装置が、PM1,PM3の場合と、PM2の場合とで、スレッシュホールド電圧VT_N2の値の分布に有意差があることを確認できる。
従来の回帰木分析(図20〜図22)には、以下の2つの問題点があった。 Conventional regression tree analysis (FIGS. 20 to 22) has the following two problems.
(1)不良の要因を特定しにくいという問題
図20の回帰木は、出力属性(目的変数)の値がまとまるような、入力属性(説明変数)の条件を示しているのみであって、分岐された2つのノードのうちの、どちらのノードが良くて、どちらのノードが悪いのか、といった情報を一切示していない。このため、不良要因の分析で、特に階層構造が深くなった場合には、どの条件を不良要因として特定すれば良いのかを判断しにくい。また、さまざまな階層に現われる複数の条件に対して、それらの間で優先順位を付けることが難しい。
(1) Problem that it is difficult to identify the cause of failure The regression tree in FIG. 20 only shows the condition of the input attribute (explanatory variable) so that the values of the output attribute (object variable) are gathered. No information is shown on which of the two nodes is better and which is worse. For this reason, it is difficult to determine which condition should be specified as the failure factor in the analysis of the failure factor, particularly when the hierarchical structure becomes deep. In addition, it is difficult to prioritize a plurality of conditions appearing on various levels.
例えば、図20において、スレッシュホールド電圧VT_N2の特徴量の値(図中の各ノードNoの横に記載されている)の大きいものが問題であるとした場合、第1分岐において特徴量の値が小さいノードNo.1「Field_Ox=PM1,PM3(特徴量:9.498038E−02)」の3階層下で、特徴量の値が大きいノードNo.10「第1洗浄工程_装置=#76(特徴量:0.17382)」は、問題として捉えるべきか否かが分からない。 For example, in FIG. 20, if the problem is that the feature value of the threshold voltage VT_N2 (shown next to each node No. in the figure) is large, the feature value in the first branch is Small node No. 1 under the three layers of “Field_Ox = PM1, PM3 (feature amount: 9.498038E-02)”, node No. 10 “first cleaning process_device = # 76 (feature amount: 0.17382)” is not known whether it should be regarded as a problem.
また、このノードNo10「第1洗浄工程_装置=#76(特徴量:0.17382)」が問題であったとして、第1分岐のノードNo12「Field_Ox=PM2(特徴量:0.173167)」と比べて、どちらの方が大きな問題なのか、分からない。 Further, assuming that this node No. 10 “first cleaning process_apparatus = # 76 (feature amount: 0.17382)” is a problem, the first branch node No. 12 “Field_Ox = PM2 (feature amount: 0.173167)” I don't know which is the bigger problem.
すなわち、従来の回帰木では、不良の要因を特定しにくいという第1の問題点があった。 That is, the conventional regression tree has a first problem that it is difficult to identify the cause of the failure.
(2)分析結果の評価が困難であるという問題
回帰木分析の結果を評価する際、図21の箱ヒゲグラフや、図22のヒストグラムには、その着目点(すなわち、明確な評価指標)が示されていないので、直感的な判断を行いにくく、また、ユーザによって結果の評価がばらついてしまうという問題がある。例えば、図22の箱ヒゲグラフを参照した場合、PM2の処理品は、PM1,PM3の処理品に比べてVT_N2の値の分布が大きくなっているが、これを有意差と見るか、有意差でないと見るかは、ユーザによって異なり一意なものでない。この例の場合には、比較的顕著な差が見えているので、ほぼ一意的な判断も可能であろうが、現実には、複数の要因の交絡等により、必ずしも顕著な差が現れるわけではない。すなわち、従来技術では、分析結果を評価する際の着目点が不明確であるため、一意的な評価が困難であるという、第2の問題点があった。
(2) Problem that it is difficult to evaluate the analysis result When evaluating the result of the regression tree analysis, the box mustache graph of FIG. 21 and the histogram of FIG. 22 show the point of interest (that is, a clear evaluation index). Therefore, there are problems that it is difficult to make an intuitive judgment and the evaluation of the results varies depending on the user. For example, when referring to the box mustache graph of FIG. 22, the treated product of PM2 has a larger distribution of VT_N2 values than the treated products of PM1 and PM3, but this is regarded as a significant difference or not significant. It depends on the user and is not unique. In the case of this example, a relatively significant difference is seen, so an almost unique judgment may be possible, but in reality, a significant difference does not necessarily appear due to confounding of multiple factors. Absent. That is, the prior art has a second problem that it is difficult to perform unique evaluation because the point of interest when evaluating the analysis result is unclear.
本発明は、上記従来の問題点を鑑みてなされたものであり、その目的は、明確な指標に基づく、分析結果の直感的な評価を可能とするデータ分析装置を提供することにある。また、本発明の他の目的は、所定の出力属性の要因(製品特性不良の要因等)を、優先順位を付けて明確に特定する、データ分析装置を提供することにある。 The present invention has been made in view of the above-described conventional problems, and an object of the present invention is to provide a data analysis apparatus that enables an intuitive evaluation of an analysis result based on a clear index. Another object of the present invention is to provide a data analysis apparatus that clearly identifies a factor of a predetermined output attribute (such as a factor of product characteristic failure) with priority.
本発明のデータ分析装置は、上記の課題を解決するために、複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係の分析結果を出力するデータ分析装置であって、前記出力属性の値に基づいて、前記基本データ群を第1データ群と第2データ群とに分類する分類手段と、前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定する入力属性条件決定手段と、前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の入力属性条件を取得し、前記特定の入力属性条件に基づく前記基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するレビューグラフ作成手段とを含むことを特徴としている。 In order to solve the above problems, the data analysis apparatus of the present invention provides the input attribute and the output attribute for a basic data group that is a set of data composed of a plurality of input attributes and output attributes. Is a data analysis device that analyzes the cause-and-effect relationship and outputs the analysis result of the cause-and-effect relationship, and classifies the basic data group into a first data group and a second data group based on the value of the output attribute An input attribute condition that is an input attribute condition for dividing the basic data group into two parts so that the classification means and the first data group and the second data group are respectively combined. Input attribute condition determining means for determining each of the input attribute condition, obtaining a specific input attribute condition from the plurality of input attribute conditions determined by the input attribute condition determining means, and based on the specific input attribute condition At least one of two data groups obtained by bisection of this data group, and at least one of the first data group and the second data group obtained by bisection of the basic data group based on the value of the output attribute And a review graph creating means for outputting a review graph that visually represents the correspondence relationship.
上記構成によれば、特定の入力属性条件に基づく前記基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するようになっている。これにより、特定の入力属性条件が、第1データ群および第2データ群の少なくとも一方の要因となっているかを示す分析結果をユーザに提示できる。したがって、ユーザは、分析結果を直感的に理解することができる。また、「ユーザによって結果の評価がばらつく」という従来の回帰木の問題も解消できる。 According to the above configuration, at least one of two data groups obtained by bisection of the basic data group based on a specific input attribute condition and the bisection of the basic data group based on the value of the output attribute A review graph that visually represents the correspondence between at least one of the first data group and the second data group is output. Thereby, the analysis result which shows whether a specific input attribute condition becomes a factor of at least one of the 1st data group and the 2nd data group can be shown to a user. Therefore, the user can intuitively understand the analysis result. In addition, the conventional regression tree problem that “the evaluation of the result varies depending on the user” can be solved.
これらの効果は、(1)分類手段が、出力属性の値に基づいて基本データ群を第1データ群と第2データ群とに分類していること、および(2)入力属性条件決定手段が、前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定していることによる。すなわち、(1)出力属性による基本データ群の2分化と、(2)入力属性による基本データ群の2分化とによって、分析結果を評価する際の着目点を明確にしていることによる。 These effects are as follows: (1) the classification means classifies the basic data group into the first data group and the second data group based on the value of the output attribute; and (2) the input attribute condition determination means The input attribute condition, which is an input attribute condition for dividing the basic data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are grouped. It depends on what has been decided. That is, the point of interest when evaluating the analysis result is clarified by (1) bisection of the basic data group based on the output attribute and (2) bisection of the basic data group based on the input attribute.
以上のように、上記構成によれば、「明確な指標に基づく、分析結果の直感的な評価を可能とするデータ分析装置を提供する」という本発明の目的を達成できる。 As described above, according to the above configuration, the object of the present invention of “providing a data analysis apparatus capable of intuitively evaluating an analysis result based on a clear index” can be achieved.
また、上記構成によれば、全ての入力属性について問題事象の要因となる入力属性条件を抽出しているから、分岐条件に競合因子が存在しても、その要因を逃すことなく、確実に捉えることができる。 In addition, according to the above configuration, since the input attribute condition that causes the problem event is extracted for all the input attributes, even if there is a competing factor in the branch condition, it is reliably captured without missing the factor. be able to.
本発明のデータ分析装置は、上記の課題を解決するために、複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係の分析結果を出力するデータ分析装置であって、前記出力属性の値に基づいて、前記基本データ群を第1データ群と第2データ群とに分類する分類手段と、前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定する入力属性条件決定手段と、前記複数の入力属性と出力属性とで構成される前記データの各々は、それぞれ複数のグループのいずれかに属しており、前記複数のグループの各々の単位で、該グループに属する前記入力属性および出力属性の値を平均化したデータ群を表す第2の基本データ群を作成する第2の基本データ群作成手段と、前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の入力属性条件を取得し、前記特定の入力属性条件に基づく前記第2の基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記分類手段で前記基本データ群を分類した条件に基づく前記第2の基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するレビューグラフ作成手段とを含むことを特徴としている。
In order to solve the above problems, the data analysis apparatus of the present invention provides the input attribute and the output attribute for a basic data group that is a set of data composed of a plurality of input attributes and output attributes. Is a data analysis device that analyzes the cause-and-effect relationship and outputs the analysis result of the cause-and-effect relationship, and classifies the basic data group into a first data group and a second data group based on the value of the output attribute An input attribute condition that is an input attribute condition for dividing the basic data group into two parts so that the classification means and the first data group and the second data group are respectively combined. Each of the data constituted by the input attribute condition determining means for determining each of the plurality of input attributes and the output attributes belongs to one of a plurality of groups, Second basic data group creating means for creating a second basic data group representing a data group in which the values of the input attribute and output attribute belonging to the group are averaged in units, and the input attribute condition determining means A specific input attribute condition is acquired from the plurality of input attribute conditions determined in
本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件決定手段で決定された複数の前記入力属性条件の一覧を出力する入力属性条件一覧作成手段をさらに含み、前記レビューグラフ作成手段は、ユーザが、前記入力属性条件一覧作成手段で出力された一覧に含まれる複数の前記入力属性条件の中から特定の入力属性条件を選択する選択操作、および、レビューグラフ描画指示を行うことに応答して、前記選択された入力属性条件を前記特定の入力属性条件として取得し、前記レビューグラフの出力を行うものである構成である。 The data analysis apparatus of the present invention preferably further includes an input attribute condition list creation means for outputting a list of the plurality of input attribute conditions determined by the input attribute condition determination means in the data analysis apparatus having the above configuration, The review graph creating means includes a selection operation in which a user selects a specific input attribute condition from the plurality of input attribute conditions included in the list output by the input attribute condition list creating means, and a review graph drawing In response to the instruction, the selected input attribute condition is acquired as the specific input attribute condition, and the review graph is output.
上記構成によれば、前記入力属性条件決定手段で決定された複数の前記入力属性条件の一覧を出力する入力属性条件一覧作成手段をさらに含み、前記レビューグラフ作成手段は、ユーザが、前記入力属性条件一覧作成手段で出力された一覧に含まれる複数の前記入力属性条件の中から特定の入力属性条件を選択する選択操作に応答して、前記選択された入力属性条件を前記特定の入力属性条件として取得し、前記レビューグラフの出力を行う。これにより、ユーザが、前記入力属性条件決定手段で決定された複数の前記入力属性条件のうち、任意の入力属性条件に基づいたレビューグラフを得ることができる。 According to the above configuration, the apparatus further includes an input attribute condition list creating unit that outputs a list of the plurality of input attribute conditions determined by the input attribute condition determining unit, and the review graph creating unit is configured such that the user In response to a selection operation for selecting a specific input attribute condition from a plurality of the input attribute conditions included in the list output by the condition list creation means, the selected input attribute condition is changed to the specific input attribute condition. And the review graph is output. Thereby, the user can obtain a review graph based on an arbitrary input attribute condition among the plurality of input attribute conditions determined by the input attribute condition determining means.
さらに、上記構成によれば、前記レビューグラフの出力は、ユーザがレビューグラフ描画指示を行うことに応答して行われる。これにより、ユーザの希望に応じてレビューグラフを適時に出力することができ、また、複数種類のレビューグラフを出力することができる。 Further, according to the above configuration, the review graph is output in response to a user giving a review graph drawing instruction. Thereby, a review graph can be output in a timely manner according to a user's request, and a plurality of types of review graphs can be output.
なお、上記の特定の入力属性条件は、上記構成のようにユーザの選択操作によって取得する代わりに、データ分析装置内の選択手段から取得してもよい。この選択手段としては、「入力属性条件に該当するデータ群に含まれる第2データ群の割合」やGiniインデックス法の改善度などを指標として、これらの指標値の高い入力属性条件を選択する選択手段や、単に、入力属性条件一覧作成手段で出力された一覧に含まれる全ての入力属性条件を選択する選択手段などを用いることができる。 The specific input attribute condition may be acquired from a selection unit in the data analysis device instead of being acquired by a user selection operation as in the configuration described above. As the selection means, a selection of selecting an input attribute condition having a high index value by using “the ratio of the second data group included in the data group corresponding to the input attribute condition” or the improvement degree of the Gini index method as an index. Or a selection means for selecting all input attribute conditions included in the list output by the input attribute condition list creation means.
また、上記入力属性条件決定手段における入力属性条件決定の基準(指標)としては、Giniインデックス法の改善度や頻度差分値、および、これらの組み合わせ等を用いることができる。上記頻度差分値は、各入力属性の全ての数値について、第1データ群中において、入力属性がその数値以下であるデータの割合を第1の頻度として演算すると共に、第2データ群中において、入力属性がその数値以下であるデータの割合を第2の頻度として演算する頻度演算ステップと、各入力属性の全ての数値について、第1の頻度と第2の頻度との差分値を演算する差分演算ステップとによって演算できる。 Further, as the reference (index) for determining the input attribute condition in the input attribute condition determining means, the improvement level of the Gini index method, the frequency difference value, a combination thereof, and the like can be used. In the first data group, the frequency difference value is calculated as the first frequency for all the numerical values of each input attribute as the first frequency, and in the second data group, A frequency calculation step for calculating a ratio of data whose input attribute is less than or equal to the numerical value as a second frequency, and a difference for calculating a difference value between the first frequency and the second frequency for all the numerical values of each input attribute It can be calculated by calculating steps.
本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、前記レビューグラフ作成手段は、少なくとも、前記入力属性条件を満たすデータ群と、前記第2データ群に対応する出力属性条件を満たすデータ群との対応関係を視覚的に表すレビューグラフを出力するものである構成である。 In the data analysis device of the present invention, preferably, in the data analysis device configured as described above, the input attribute condition determined by the input attribute condition determining means is “the second data group in the data group that satisfies the input attribute condition”. And the review graph creating means includes at least a data group that satisfies the input attribute condition, and a data group that does not satisfy the input attribute condition. This is a configuration for outputting a review graph that visually represents a correspondence relationship with a data group that satisfies the output attribute condition corresponding to the second data group.
上記構成によれば、少なくとも、特定の入力属性条件を満たすデータ群と、前記第2データ群との対応関係を視覚的に表すレビューグラフを出力するようになっている。これにより、特定の入力属性条件が第2データ群に対応する出力属性の要因となっているかを示す分析結果をユーザに提示できる。したがって、ユーザは、分析結果を直感的に理解することができる。 According to the above configuration, at least a review graph that visually represents a correspondence relationship between a data group that satisfies a specific input attribute condition and the second data group is output. Thereby, it is possible to present to the user an analysis result indicating whether the specific input attribute condition is a factor of the output attribute corresponding to the second data group. Therefore, the user can intuitively understand the analysis result.
本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件の一覧には、前記入力属性条件決定手段で決定された複数の前記入力属性条件の各々に関する、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数と、前記基本データ群中で該入力属性条件を満たすデータの中に前記第2データ群が含まれるデータ個数の割合を表す第2データ群分離度とが、前記入力属性条件に併せて示されている構成である。 The data analysis apparatus of the present invention is preferably the data analysis apparatus configured as described above, wherein the list of input attribute conditions includes the basic attribute relating to each of the plurality of input attribute conditions determined by the input attribute condition determination means. A second data group corresponding number representing the number of data corresponding to the second data group that satisfies the input attribute condition in the data group, and data satisfying the input attribute condition in the basic data group The second data group separation degree indicating the ratio of the number of data in which the second data group is included is configured to be shown together with the input attribute condition.
上記構成によれば、前記入力属性条件の一覧には、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数と、前記基本データ群中で該入力属性条件を満たすデータの中に前記第2データ群が含まれるデータ個数の割合を表す第2データ群分離度とが、前記入力属性条件に併せて示されている。このため、ユーザは、入力属性条件の一覧と併せて示された、第2データ群該当数および第2データ群分離度を参照することで、各入力属性条件が第2データ群に対応する出力属性の発生にどれほど寄与しているのかを知ることができる。それゆえ、ユーザが、第2データ群に対応する出力属性の要因を発見できる可能性の高いレビューグラフを作成することが可能となる。 According to the above configuration, the list of the input attribute conditions includes the second data group corresponding number representing the number of data satisfying the input attribute condition in the basic data group and corresponding to the second data group; The second data group separation degree representing the ratio of the number of data in which the second data group is included in the data satisfying the input attribute condition in the basic data group is indicated together with the input attribute condition. Yes. For this reason, the user refers to the second data group hit count and the second data group separation degree shown together with the list of input attribute conditions, so that each input attribute condition corresponds to the second data group. You can know how much it contributes to the generation of attributes. Therefore, it is possible to create a review graph with a high possibility that the user can find the factor of the output attribute corresponding to the second data group.
また、上記構成によれば、第2データ群該当数および第2データ群分離度の両方が前記入力属性条件の一覧に示されている。これにより、ユーザは、用途によって、(1)第2データ群該当数、(2)第2データ群分離度、(3)第2データ群該当数および第2データ群分離度、のいずれかを指標として選択し、その指標に基づいてレビューグラフを作成することができる。したがって、ユーザが、用途に応じたレビューグラフを容易に作成することができる。 Further, according to the above configuration, both the number of corresponding second data groups and the second data group separation degree are shown in the list of input attribute conditions. Accordingly, the user can select one of (1) the number of corresponding second data groups, (2) the degree of second data group separation, (3) the number of corresponding second data groups and the degree of second data group separation depending on the application. It can be selected as an index and a review graph can be created based on the index. Therefore, the user can easily create a review graph according to the application.
本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件決定手段で決定された複数の前記入力属性条件に対して、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数、および、前記基本データ群中で該入力属性条件を満たすデータの中における、前記第2データ群に該当するデータ個数の割合を表す第2データ群分離度の少なくとも一方を指標として、前記第2データ群に対応する出力属性条件の要因としての重要度による順位付けを行う順位決定手段をさらに含み、前記入力属性条件一覧作成手段は、前記順位決定手段による順位付けの結果を前記入力属性条件の一覧に示す構成である。 The data analysis device of the present invention is preferably the data analysis device configured as described above, wherein the input attribute condition is determined in the basic data group for the plurality of input attribute conditions determined by the input attribute condition determination means. A second data group corresponding number that represents the number of data satisfying and corresponding to the second data group, and corresponding to the second data group in the data that satisfies the input attribute condition in the basic data group Rank determining means for performing ranking according to importance as a factor of an output attribute condition corresponding to the second data group, using at least one of the second data group separation degrees indicating the ratio of the number of data to be performed as an index; The input attribute condition list creating means is configured to show the ranking result by the rank determining means in the list of input attribute conditions.
上記構成によれば、入力属性条件一覧作成手段が、順位決定手段によって決定された、第2データ群該当数および/または第2データ群分離度に基づく優先順位付けの結果を併せて示す入力属性条件の一覧を作成する。この入力属性条件の一覧を参照することによって、ユーザは、第2データ群に対応する出力属性の要因となる複数の入力属性条件を一望して把握できるとともに、その重要度の順位を知ることができる。 According to the above configuration, the input attribute condition list creation unit also shows the input attribute that also indicates the result of prioritization based on the second data group hit count and / or the second data group separation degree determined by the rank determination unit Create a list of conditions. By referring to this list of input attribute conditions, the user can grasp and understand a plurality of input attribute conditions that cause the output attribute corresponding to the second data group, and know the order of importance. it can.
したがって、上記構成によれば、「所定の出力属性の要因(製品特性不良の要因等)を、優先順位を付けて明確に特定する、データ分析装置を提供する」という、本発明の他の目的を達成できる。 Therefore, according to the above configuration, another object of the present invention is to “provide a data analysis apparatus that clearly specifies a factor of a predetermined output attribute (such as a factor of product characteristic failure) with priority ranking”. Can be achieved.
また、上記構成によれば、ユーザは、入力属性条件の一覧における入力属性条件の並び順(優先順位)を参照しながら(すなわち、分析結果をレビューする暫定的な順番をナビゲーションされながら)選択操作を行うことによって、レビューグラフを作成することができる。 Further, according to the above configuration, the user performs a selection operation while referring to the order (priority order) of the input attribute conditions in the list of input attribute conditions (that is, while navigating the provisional order for reviewing the analysis results). A review graph can be created by performing.
本発明のデータ分析装置は、上記構成のデータ分析装置において、前記基本データ群または前記第2の基本データ群における、複数の入力属性と、出力属性とで構成される前記データの各々には、それぞれ判別キーが付与されており、前記レビューグラフ作成手段は、前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性の、前記判別キー毎の変化を示す第1のグラフと、前記出力属性の前記判別キー毎の変化を示す第2のグラフとを共に示すグラフを、前記レビューグラフとして出力するものであり、前記第1のグラフでは、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている構成であってもよい。 The data analysis apparatus of the present invention is the data analysis apparatus having the above configuration, wherein each of the data composed of a plurality of input attributes and output attributes in the basic data group or the second basic data group includes: Each is provided with a discrimination key, and the review graph creating means sets the target data group to be the target of the review graph as the basic data group or the second basic data group, and for the target data group Both the first graph showing the change of the input attribute corresponding to the acquired specific input attribute condition for each of the discrimination keys and the second graph showing the change of the output attribute for each of the discrimination keys A graph to be output as the review graph. In the first graph, the output attribute condition that satisfies the input attribute condition and corresponds to the second data group is output. May be configured to marking process is performed on data that satisfies.
上記構成において、判別キーは、基本データ群のデータの1つずつに異なる判別キーを付与してもよく、基本データ群のデータのグループごとに異なる判別キーを付与してもよい。 In the above configuration, the determination key may be assigned a different determination key for each piece of data in the basic data group, or may be assigned a different determination key for each group of data in the basic data group.
本発明のデータ分析装置は、上記構成のデータ分析装置において、前記基本データ群は、異なる時点に対応する複数のデータを含み、前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性の時間変化を示す第1のトレンドグラフと、前記出力属性の時間変化を示す第2のトレンドグラフとを共に示す第1のレビューグラフを前記レビューグラフとして出力するものであり、前記第1のトレンドグラフでは、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている構成であってもよい。 The data analysis apparatus according to the present invention is the data analysis apparatus having the above-described configuration, wherein the basic data group includes a plurality of data corresponding to different time points, and the target data group to be created as the review graph is the basic data. A first trend graph showing the time change of the input attribute corresponding to the acquired specific input attribute condition for the target data group and the time change of the output attribute A first review graph showing both the second trend graph and the second trend graph are output as the review graph. In the first trend graph, the input attribute condition is satisfied, and the second data group includes A configuration in which marking processing is performed on data corresponding to the corresponding output attribute condition may be employed.
上記構成によれば、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」条件の中から取得された特定の入力属性条件に対応する入力属性の時間変化を示す第1のトレンドグラフを含む第1のレビューグラフを出力するようになっている。さらに、上記構成によれば、第1のトレンドグラフにおいては、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている。これらにより、ユーザは、第1のトレンドグラフから、特定の入力属性条件が第2データ群に対応する出力属性の要因となっている期間を容易に知ることができる。さらに、上記構成によれば、第1のレビューグラフには、第1のトレンドグラフと共に、出力属性の時間変化を示す第2のトレンドグラフが示されているので、ユーザは、これらの時間変化を比較することで、特定の入力属性条件の時間変化について、出力属性の時間変化との同期性(関連性)を即座に理解することができる。 According to the above configuration, the specific data acquired from the condition that “the second data group is grouped into a data group that satisfies the input attribute condition and the first data group is grouped into a data group that does not satisfy the input attribute condition”. The first review graph including the first trend graph indicating the time change of the input attribute corresponding to the input attribute condition is output. Further, according to the above configuration, in the first trend graph, marking processing is performed on data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the second data group. Accordingly, the user can easily know from the first trend graph the period during which the specific input attribute condition is the cause of the output attribute corresponding to the second data group. Further, according to the above configuration, the first review graph includes the first trend graph and the second trend graph indicating the time change of the output attribute. By comparing, it is possible to immediately understand the synchronization (relevance) of the time change of the specific input attribute condition with the time change of the output attribute.
なお、「マーキング処理」とは、レビューグラフにおける特定のデータを示す部分に対して、他のデータを示す部分と区別できるような標識を付ける処理、例えば、特定のデータを示す部分に他のデータを示す部分と異なる色を付ける処理、特定のデータを示す部分の形状を他のデータを示す部分と異なる形状に変える処理、特定のデータを示す部分のみに印(例えば、囲み線)を付ける処理等を指す。 Note that the “marking process” is a process for marking a part indicating specific data in a review graph so that it can be distinguished from a part indicating other data, for example, other data in a part indicating specific data. Processing that gives a color different from the part that indicates, Processing that changes the shape of the part that shows specific data to a shape that is different from the part that shows other data, Process that puts a mark (for example, a surrounding line) only on the part showing specific data Etc.
本発明のデータ分析装置は、上記構成のデータ分析装置において、前記基本データ群は、面内の異なる位置に対応する複数のデータを含み、前記レビューグラフ作成手段は、前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性の面内分布を表す第1のマップと、前記出力属性の面内分布を表す第2のマップとを共に示す第2のレビューグラフを前記レビューグラフとして出力するものであり、前記第1のマップでは、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている構成であってもよい。 The data analysis apparatus according to the present invention is the data analysis apparatus having the above configuration, wherein the basic data group includes a plurality of data corresponding to different positions in a plane, and the review graph creation means is a target for creating the review graph. The target data group is the basic data group or the second basic data group, and the first in-plane distribution of the input attribute corresponding to the acquired specific input attribute condition is expressed for the target data group. And a second review graph showing both the second map representing the in-plane distribution of the output attribute as the review graph, and the first map satisfies the input attribute condition. And the structure by which the marking process is given to the data which satisfy | fills the output attribute conditions corresponding to a said 2nd data group may be sufficient.
上記構成によれば、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」条件の中から取得された特定の入力属性条件に対応する入力属性の面内分布を示す第1のマップを含む第2のレビューグラフを出力するようになっている。さらに、上記構成によれば、第1のマップにおいては、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている。これらにより、ユーザは、第1のマップから、特定の入力属性条件が第2データ群に対応する出力属性の要因となっている可能性のある面内位置を容易に知ることができる。さらに、上記構成によれば、第2のレビューグラフには、第1のマップと共に、出力属性の面内分布を示す第2のマップが示されているので、ユーザは、これらの面内分布を比較することで、特定の入力属性条件の面内分布について、出力属性の面内分布との同期性(関連性)を即座に理解することができる。 According to the above configuration, the specific data acquired from the condition that “the second data group is grouped into a data group that satisfies the input attribute condition and the first data group is grouped into a data group that does not satisfy the input attribute condition”. The second review graph including the first map indicating the in-plane distribution of the input attribute corresponding to the input attribute condition is output. Further, according to the above configuration, in the first map, marking processing is performed on data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the second data group. As a result, the user can easily know from the first map the in-plane position where the specific input attribute condition may cause the output attribute corresponding to the second data group. Furthermore, according to the above configuration, since the second review graph shows the second map indicating the in-plane distribution of the output attribute together with the first map, the user can display these in-plane distributions. By comparing, it is possible to immediately understand the synchronism (relationship) between the in-plane distribution of the specific input attribute condition and the in-plane distribution of the output attribute.
本発明のデータ分析装置は、上記構成のデータ分析装置において、前記レビューグラフ作成手段は、前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性と、前記出力属性との関係を示す散布図である第3のレビューグラフを前記レビューグラフとして出力するものであり、前記散布図では、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている構成であってもよい。 The data analysis apparatus according to the present invention is the data analysis apparatus having the above-described configuration, wherein the review graph creating means sets the target data group to be created as the review graph as the basic data group or the second basic data group. A third review graph, which is a scatter diagram showing the relationship between the input attribute corresponding to the acquired specific input attribute condition and the output attribute, is output as the review graph for the target data group. Yes, the scatter diagram may be configured such that marking processing is performed on data that satisfies the input attribute condition and satisfies the output attribute condition corresponding to the second data group.
上記構成によれば、前記取得された特定の入力属性条件に対応する入力属性と、前記出力属性との関係を示す散布図である第3のレビューグラフを出力することができる。この散布図を参照することにより、ユーザは、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」条件の中から取得された特定の入力属性条件について、多値的に見た出力属性との相関を、即座に理解することができる。 According to the said structure, the 3rd review graph which is a scatter diagram which shows the relationship between the input attribute corresponding to the acquired said specific input attribute condition, and the said output attribute can be output. By referring to this scatter diagram, the user can satisfy the condition of “the second data group is grouped into a data group that satisfies the input attribute condition and the first data group is grouped into a data group that does not satisfy the input attribute condition”. It is possible to immediately understand the correlation between the specific input attribute condition acquired from the inside and the output attribute viewed in multiple values.
本発明のデータ分析装置は、上記構成のデータ分析装置において、前記レビューグラフ作成手段は、ユーザが、散布図の軸に対応する入力属性条件とは異なる他の入力属性条件による系列分けを指示したことに応答して、前記他の入力属性条件を満たすデータと、前記他の入力属性条件を満たさないデータとを異なる形態で散布図に示す構成であってもよい。 In the data analysis apparatus according to the present invention, in the data analysis apparatus having the above-described configuration, the review graph creating means instructs the grouping by another input attribute condition different from the input attribute condition corresponding to the axis of the scatter diagram. In response to this, the configuration may be such that the data satisfying the other input attribute condition and the data not satisfying the other input attribute condition are shown in a scatter diagram in different forms.
上記構成によれば、ユーザは、散布図を参照することにより、入力属性条件決定手段により決定された入力属性条件の中から取得された特定の入力属性条件と出力属性との相関を、他の入力属性条件と出力属性との相関とは独立して理解することができる。 According to the above configuration, the user refers to the scatter diagram to obtain the correlation between the specific input attribute condition acquired from the input attribute condition determined by the input attribute condition determining unit and the output attribute, The correlation between the input attribute condition and the output attribute can be understood independently.
本発明のデータ分析装置は、上記構成のデータ分析装置において、前記レビューグラフ作成手段は、前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、該対象データ群を、前記取得した特定の入力属性条件を満たすデータ群と、該入力属性条件を満たさないデータ群とに分離し、前記データ群の各々における、前記出力属性の度数分布を示す第4のレビューグラフを前記レビューグラフとして出力するものである構成であってもよい。 The data analysis apparatus according to the present invention is the data analysis apparatus having the above-described configuration, wherein the review graph creating means sets the target data group to be created as the review graph as the basic data group or the second basic data group. The target data group is separated into a data group satisfying the acquired specific input attribute condition and a data group not satisfying the input attribute condition, and the frequency distribution of the output attribute in each of the data groups is shown. The structure which outputs a 4th review graph as said review graph may be sufficient.
上記構成によれば、前記基本データ群を、前記取得された特定の入力属性条件を満たすデータ群と、該入力属性条件を満たさないデータ群とに分離し、前記データ群の各々における、前記出力属性の度数分布を示す第4のレビューグラフを前記レビューグラフとして出力することができる。この度数分布を示す第4のレビューグラフを参照することにより、ユーザは、入力属性条件決定手段により決定された入力属性条件の中から取得された特定の入力属性条件とその排他的条件とによる、第1データ群と第2データ群との切分けの程度を、直感的に理解することができる。 According to the above configuration, the basic data group is separated into a data group that satisfies the acquired specific input attribute condition and a data group that does not satisfy the input attribute condition, and the output in each of the data groups A fourth review graph indicating the frequency distribution of attributes can be output as the review graph. By referring to the fourth review graph indicating this frequency distribution, the user can obtain the specific input attribute condition acquired from the input attribute conditions determined by the input attribute condition determination means and the exclusive condition, The degree of separation between the first data group and the second data group can be intuitively understood.
本発明のデータ分析装置は、上記の課題を解決するために、複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係の分析結果を出力するデータ分析装置であって、前記出力属性の値に基づいて、前記基本データ群を、第1データ群と第2データ群とに分類する分類手段と、前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する入力属性条件決定手段と、前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つ以上の入力属性条件を取得し、前記特定の2つ以上の入力属性条件が交絡した条件に基づいて前記基本データ群から抽出されるデータ群と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を表す複合要因グラフを出力する複合要因グラフ作成手段とを含むことを特徴としている。 In order to solve the above problems, the data analysis apparatus of the present invention provides the input attribute and the output attribute for a basic data group that is a set of data composed of a plurality of input attributes and output attributes. Analyzing the causal relationship and outputting the analysis result of the causal relationship, and classifying the basic data group into a first data group and a second data group based on the value of the output attribute A plurality of input attributes, the input attribute condition being an input attribute condition for bisecting the basic data group so that the first data group and the second data group are each grouped Each of the input attribute condition determining means to determine, and two or more specific input attribute conditions are acquired from the plurality of input attribute conditions determined by the input attribute condition determining means, and the specified 2 or more of The first data group and the second data group obtained by bifurcation of a data group extracted from the basic data group based on a condition entangled with an input attribute condition, and the basic data group based on a value of the output attribute And a composite factor graph creating means for outputting a composite factor graph representing a correspondence relationship between at least one of the above.
上記構成によれば、特定の2つ以上の入力属性条件が交絡した条件に基づいて前記基本データ群から抽出されるデータ群と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を視覚的に表す複合要因グラフを出力するようになっている。これにより、特定の2つ以上の入力属性条件が交絡した条件が、第1データ群および第2データ群の少なくとも一方の要因となっているかを示す分析結果をユーザに提示できる。したがって、ユーザは、分析結果を直感的に理解することができる。また、「ユーザによって結果の評価がばらつく」という従来の回帰木の問題も解消できる。 According to the above configuration, the data group extracted from the basic data group based on a condition in which two or more specific input attribute conditions are entangled and the basic data group based on a value of the output attribute are obtained by bisection. A composite factor graph that visually represents a correspondence relationship with at least one of the first data group and the second data group is output. As a result, it is possible to present to the user an analysis result indicating whether a condition in which two or more specific input attribute conditions are entangled is a factor of at least one of the first data group and the second data group. Therefore, the user can intuitively understand the analysis result. In addition, the conventional regression tree problem that “the evaluation of the result varies depending on the user” can be solved.
これらの効果は、(1)分類手段が、出力属性の値に基づいて基本データ群を第1データ群と第2データ群とに分類していること、および(2)入力属性条件決定手段が、前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定していることによる。すなわち、(1)出力属性による基本データ群の2分化と、(2)入力属性による基本データ群の2分化とによって、分析結果を評価する際の着目点を明確にしていることによる。 These effects are as follows: (1) the classification means classifies the basic data group into the first data group and the second data group based on the value of the output attribute; and (2) the input attribute condition determination means The input attribute condition, which is an input attribute condition for dividing the basic data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are grouped. It depends on what has been decided. That is, the point of interest when evaluating the analysis result is clarified by (1) bisection of the basic data group based on the output attribute and (2) bisection of the basic data group based on the input attribute.
以上のように、上記構成によれば、「明確な指標に基づく、分析結果の直感的な評価を可能とするデータ分析装置を提供する」という本発明の目的を達成できる。 As described above, according to the above configuration, the object of the present invention of “providing a data analysis apparatus capable of intuitively evaluating an analysis result based on a clear index” can be achieved.
また、上記構成によれば、全ての入力属性について問題事象の要因となる入力属性条件を抽出しているから、分岐条件に競合因子が存在しても、その要因を逃すことなく、確実に捉えることができる。 In addition, according to the above configuration, since the input attribute condition that causes the problem event is extracted for all the input attributes, even if there is a competing factor in the branch condition, it is reliably captured without missing the factor. be able to.
なお、レビューグラフ作成手段を含むデータ分析装置に係る発明と、複合要因グラフ作成手段を含むデータ分析装置に係る発明とは、分類手段および入力属性条件決定手段という同一の技術的特徴、並びに「明確な指標に基づく、分析結果の直感的な評価を可能とするデータ分析装置を提供する」という、発明の先行技術に対する貢献を明示する特別な技術的特徴(レビューグラフ作成手段および複合要因グラフ作成手段)を有していることにより、単一の一般的発明概念を形成するように連関している。 The invention relating to the data analysis apparatus including the review graph creating means and the invention relating to the data analysis apparatus including the composite factor graph creating means have the same technical features as the classification means and the input attribute condition determining means, Special technical feature (review graph creation means and composite factor graph creation means) that clearly shows the contribution of the invention to the prior art, "Providing a data analysis device that enables intuitive evaluation of analysis results based on various indicators" ) To form a single general inventive concept.
ここで、「2つ以上の前記入力属性条件が交絡した条件」とは、2つ以上の前記入力属性条件を組み合わせた条件、例えば、2つ以上の入力属性条件の論理積(2つ以上の入力属性条件の全てを満たす条件)、2つ以上の入力属性条件の否定論理積(2つの入力属性条件の各々に対する排他的条件を全て満たす条件)、2つの入力属性条件の排他的論理和(2つの入力属性条件のうちの一方の条件のみを満たす条件)等を指す。 Here, “a condition in which two or more input attribute conditions are entangled” means a condition obtained by combining two or more input attribute conditions, for example, a logical product (two or more input attribute conditions). A condition that satisfies all of the input attribute conditions) a negative logical product of two or more input attribute conditions (a condition that satisfies all the exclusive conditions for each of the two input attribute conditions), and an exclusive OR of the two input attribute conditions ( A condition that satisfies only one of the two input attribute conditions).
本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件決定手段で決定された複数の前記入力属性条件の一覧を出力する入力属性条件一覧作成手段をさらに含み、前記複合要因グラフ作成手段は、ユーザが、前記入力属性条件一覧作成手段で出力された一覧に含まれる複数の前記入力属性条件の中から特定の入力属性条件を選択する選択操作、および、複合要因グラフ描画指示を行うことに応答して、前記選択された入力属性条件を含む入力属性条件を、前記特定の2つ以上の入力属性条件として取得し、前記複合要因グラフの出力を行うものである構成である。 The data analysis apparatus of the present invention preferably further includes an input attribute condition list creation means for outputting a list of the plurality of input attribute conditions determined by the input attribute condition determination means in the data analysis apparatus having the above configuration, The composite factor graph creating means includes a selection operation in which a user selects a specific input attribute condition from a plurality of the input attribute conditions included in the list output by the input attribute condition list creating means, and a composite factor In response to performing a graph drawing instruction, the input attribute condition including the selected input attribute condition is acquired as the two or more specific input attribute conditions, and the composite factor graph is output. It is a configuration.
上記構成によれば、前記入力属性条件決定手段で決定された複数の前記入力属性条件の一覧を出力する入力属性条件一覧作成手段をさらに含み、前記複合要因グラフ作成手段は、ユーザが、前記入力属性条件一覧作成手段で出力された一覧に含まれる複数の前記入力属性条件の中から特定の入力属性条件を選択する選択操作に応答して、前記選択された入力属性条件を含む入力属性条件を、前記特定の2つ以上の入力属性条件として取得し、前記複合要因グラフの出力を行う。これにより、ユーザが、前記入力属性条件決定手段で決定された複数の前記入力属性条件のうち、任意の入力属性条件の組合わせに基づいた複合要因グラフを得ることができる。 According to the above configuration, the apparatus further includes an input attribute condition list creating unit that outputs a list of the plurality of input attribute conditions determined by the input attribute condition determining unit, wherein the composite factor graph creating unit is configured so that the user can input the input attribute condition list. In response to a selection operation for selecting a specific input attribute condition from a plurality of the input attribute conditions included in the list output by the attribute condition list creating means, an input attribute condition including the selected input attribute condition is The two or more specific input attribute conditions are acquired, and the composite factor graph is output. Thereby, the user can obtain a composite factor graph based on a combination of arbitrary input attribute conditions among the plurality of input attribute conditions determined by the input attribute condition determining means.
さらに、上記構成によれば、前記複合要因グラフの出力は、ユーザが複合要因グラフ描画指示を行うことに応答して行われる。これにより、ユーザの希望に応じて複合要因グラフを適時に出力することができ、また、複数種類の複合要因グラフを出力することができる。 Further, according to the above configuration, the composite factor graph is output in response to a user giving a composite factor graph drawing instruction. As a result, a composite factor graph can be output in a timely manner according to the user's wishes, and a plurality of types of composite factor graphs can be output.
なお、上記の特定の2つ以上の入力属性条件は、上記構成のようにユーザの選択操作によって取得する代わりに、データ分析装置内の選択手段から取得してもよい。この選択手段としては、「入力属性条件に該当するデータ群に含まれる第2データ群の割合」やGiniインデックス法の改善度などを指標として、これらの指標値の高い入力属性条件を選択する選択手段や、単に、入力属性条件一覧作成手段で出力された一覧に含まれる入力属性条件の中から所定数の入力属性条件の組合せの全てを選択する選択手段などを用いることができる。また、上記入力属性条件決定手段における入力属性条件決定の基準(指標)としては、Giniインデックス法の改善度や、、前述した頻度差分値、および、これらの組み合わせ等を用いることができる。 Note that the two or more specific input attribute conditions may be acquired from a selection unit in the data analysis apparatus instead of being acquired by a user selection operation as in the above configuration. As the selection means, a selection of selecting an input attribute condition having a high index value by using “the ratio of the second data group included in the data group corresponding to the input attribute condition” or the improvement degree of the Gini index method as an index. Or a selection means for selecting all combinations of a predetermined number of input attribute conditions from among the input attribute conditions included in the list output by the input attribute condition list creation means. Further, as the reference (index) for determining the input attribute condition in the input attribute condition determining means, the improvement degree of the Gini index method, the above-described frequency difference value, a combination thereof, and the like can be used.
本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、前記入力属性条件の一覧には、前記入力属性条件決定手段で決定された複数の前記入力属性条件の各々に関する、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数と、前記基本データ群中で該入力属性条件を満たすデータの中に前記第2データ群が含まれるデータ個数の割合を表す第2データ群分離度とが、前記入力属性条件に併せて示されている構成である。 In the data analysis device of the present invention, preferably, in the data analysis device configured as described above, the input attribute condition determined by the input attribute condition determining means is “the second data group in the data group that satisfies the input attribute condition”. The first data group is grouped into a data group that does not satisfy the input attribute condition ”, and the input attribute condition list includes a plurality of items determined by the input attribute condition determining unit. A second data group corresponding number that represents the number of data that satisfies the input attribute condition in the basic data group and that corresponds to the second data group, and the basic data group And the second data group separation degree indicating the ratio of the number of data in which the second data group is included in the data satisfying the input attribute condition is also shown together with the input attribute condition It is a configuration.
上記構成によれば、前記入力属性条件の一覧には、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数と、前記基本データ群中で該入力属性条件を満たすデータの中に前記第2データ群が含まれるデータ個数の割合を表す第2データ群分離度とが、前記入力属性条件に併せて示されている。このため、ユーザは、入力属性条件の一覧と併せて示された、第2データ群該当数および第2データ群分離度を参照することで、各入力属性条件が第2データ群に対応する出力属性の発生にどれほど寄与しているのかを知ることができる。それゆえ、ユーザが、第2データ群に対応する出力属性の要因を発見できる可能性の高い複合要因グラフを作成することが可能となる。 According to the above configuration, the list of the input attribute conditions includes the second data group corresponding number representing the number of data satisfying the input attribute condition in the basic data group and corresponding to the second data group; The second data group separation degree representing the ratio of the number of data in which the second data group is included in the data satisfying the input attribute condition in the basic data group is indicated together with the input attribute condition. Yes. For this reason, the user refers to the second data group hit count and the second data group separation degree shown together with the list of input attribute conditions, so that each input attribute condition corresponds to the second data group. You can know how much it contributes to the generation of attributes. Therefore, it is possible to create a composite factor graph with a high possibility that the user can find the factor of the output attribute corresponding to the second data group.
また、上記構成によれば、第2データ群該当数および第2データ群分離度の両方が前記入力属性条件の一覧に示されている。これにより、ユーザは、用途によって、(1)第2データ群該当数、(2)第2データ群分離度、(3)第2データ群該当数および第2データ群分離度、のいずれかを指標として選択し、その指標に基づいて複合要因グラフを作成することができる。したがって、ユーザが、用途に応じた複合要因グラフを容易に作成することができる。 Further, according to the above configuration, both the number of corresponding second data groups and the second data group separation degree are shown in the list of input attribute conditions. Accordingly, the user can select one of (1) the number of corresponding second data groups, (2) the degree of second data group separation, (3) the number of corresponding second data groups and the degree of second data group separation depending on the application. It can be selected as an index, and a composite factor graph can be created based on the index. Therefore, the user can easily create a composite factor graph according to the application.
本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、前記入力属性条件決定手段で決定された複数の前記入力属性条件に対して、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数、および、前記基本データ群中で該入力属性条件を満たすデータの中における、前記第2データ群に該当するデータ個数の割合を表す第2データ群分離度の少なくとも一方を指標として、前記第2データ群に対応する出力属性条件の要因としての重要度による順位付けを行う順位決定手段をさらに含み、前記入力属性条件一覧作成手段は、前記順位決定手段による順位付けの結果を前記入力属性条件の一覧に示す構成である。 In the data analysis device of the present invention, preferably, in the data analysis device configured as described above, the input attribute condition determined by the input attribute condition determining means is “the second data group in the data group that satisfies the input attribute condition”. Is a condition determined such that the first data group is collected in a data group that does not satisfy the input attribute condition, and for the plurality of input attribute conditions determined by the input attribute condition determining means, A second data group corresponding number representing the number of data corresponding to the second data group that satisfies the input attribute condition in the basic data group, and data satisfying the input attribute condition in the basic data group Output corresponding to the second data group, using as an index at least one of the second data group separation degrees indicating the ratio of the number of data corresponding to the second data group The input attribute condition list creation means further includes a ranking determination means for ranking by importance as a factor of the sex condition, and the input attribute condition list creation means shows a result of ranking by the ranking determination means in the list of input attribute conditions. .
上記構成によれば、入力属性条件一覧作成手段が、順位決定手段によって決定された、第2データ群該当数および/または第2データ群分離度に基づく優先順位付けの結果を併せて示す入力属性条件の一覧を作成する。この入力属性条件の一覧を参照することによって、ユーザは、第2データ群に対応する出力属性の要因となる複数の入力属性条件を一望して把握できるとともに、その重要度の順位を知ることができる。 According to the above configuration, the input attribute condition list creation unit also shows the input attribute that also indicates the result of prioritization based on the second data group hit count and / or the second data group separation degree determined by the rank determination unit Create a list of conditions. By referring to this list of input attribute conditions, the user can grasp and understand a plurality of input attribute conditions that cause the output attribute corresponding to the second data group, and know the order of importance. it can.
したがって、上記構成によれば、「所定の出力属性の要因(製品特性不良の要因等)を、優先順位を付けて明確に特定する、データ分析装置を提供する」という、本発明の他の目的を達成できる。 Therefore, according to the above configuration, another object of the present invention is to “provide a data analysis apparatus that clearly specifies a factor of a predetermined output attribute (such as a factor of product characteristic failure) with priority ranking”. Can be achieved.
また、上記構成によれば、ユーザは、入力属性条件の一覧における入力属性条件の並び順(優先順位)を参照しながら(すなわち、複合要因分析を行う暫定的な順番をナビゲーションされながら)選択操作を行うことによって、複合要因グラフを作成することができる。
本発明のデータ分析装置は、上記構成のデータ分析装置において、前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、前記複合要因グラフ作成手段は、前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つの入力属性条件を取得し、前記基本データ群中で、前記の2つの入力属性条件をともに満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果、および、前記基本データ群中で、前記2つの入力属性条件のうちの一方の条件のみを満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果が、それぞれ示されている第1の複合要因グラフを前記複合要因グラフとして出力するものである構成であってもよい。
Further, according to the above configuration, the user performs a selection operation while referring to the order (priority order) of the input attribute conditions in the list of input attribute conditions (that is, while navigating the provisional order for performing the complex factor analysis). By performing the above, a composite factor graph can be created.
In the data analysis apparatus according to the present invention, the input attribute condition determined by the input attribute condition determination unit in the data analysis apparatus having the above configuration is “the second data group is grouped into a data group that satisfies the input attribute condition, The composite factor graph creating means includes a plurality of the input attributes determined by the input attribute condition determining means, such that the first data group is collected into a data group that does not satisfy the input attribute condition. Result of obtaining two specific input attribute conditions from the conditions, and calculating the number of data satisfying both of the two input attribute conditions in the basic data group and corresponding to the second data group In the basic data group, the number of data satisfying only one of the two input attribute conditions and corresponding to the second data group is calculated. Fruit may be configured and outputs a first composite factor graph shown respectively as the multiple factors graph.
上記構成によれば、入力属性条件決定手段で決定された複数の前記入力属性条件の中から取得された、特定の2つの入力属性条件に対して、前記基本データ群中で、前記の2つの入力属性条件をともに満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果、および、前記基本データ群中で、前記2つの入力属性条件のうちの一方の条件のみを満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果が、それぞれ示されている第1の複合要因グラフを前記複合要因グラフとして出力することができる。これにより、第1の複合要因グラフを参照することにより、ユーザは、特定の2つの入力属性条件のうちの他方の入力属性条件が、特定の2つの入力属性条件のうちの一方の入力属性条件との複合要因(または主従の関係にある要因)を成すものであるのか、前記一方の入力属性条件とは独立した要因であるのかを知ることができる。したがって、入力属性条件決定手段により決定された入力属性条件の中から互いに複合要因となる複数の要因(または主従の関係にある複数の要因)、および、互いに独立した複数の要因を探すことができる。 According to the above configuration, for the two specific input attribute conditions acquired from the plurality of input attribute conditions determined by the input attribute condition determining means, Both the input attribute conditions are satisfied and the number of data corresponding to the second data group is calculated, and in the basic data group, only one of the two input attribute conditions is satisfied, In addition, it is possible to output, as the composite factor graph, the first composite factor graph in which the results of calculating the number of data corresponding to the second data group are respectively shown. Thereby, by referring to the first composite factor graph, the user can determine whether the other input attribute condition of the two specific input attribute conditions is one input attribute condition of the two specific input attribute conditions. It is possible to know whether it is a complex factor (or a factor that has a master-slave relationship) or a factor that is independent of the one input attribute condition. Therefore, a plurality of factors (or a plurality of factors having a master-slave relationship) that are complex factors and a plurality of factors that are independent from each other can be searched from the input attribute conditions determined by the input attribute condition determining means. .
本発明のデータ分析装置は、上記構成のデータ分析装置において、前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、前記複合要因グラフ作成手段は、前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つ以上の入力属性条件を、順位を付けて取得し、前記順位を付けて取得した入力属性条件の順位の順番に、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数を順次積算した結果を示す第2の複合要因グラフを前記複合要因グラフとして出力するものである構成であってもよい。 In the data analysis apparatus according to the present invention, the input attribute condition determined by the input attribute condition determination unit in the data analysis apparatus having the above configuration is “the second data group is grouped into a data group that satisfies the input attribute condition, The composite factor graph creating means includes a plurality of the input attributes determined by the input attribute condition determining means, such that the first data group is collected into a data group that does not satisfy the input attribute condition. Two or more specific input attribute conditions are acquired from the conditions by ranking, and the input attribute conditions are satisfied in the basic data group in the order of the ranking of the input attribute conditions acquired by ranking. In addition, a second composite factor graph showing the result of sequentially integrating the second data group corresponding number representing the number of data corresponding to the second data group is output as the composite factor graph. It may be in a configuration of.
上記構成によれば、前記順位を付けて取得した入力属性条件の順位の順番に、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数を順次積算した結果を示す第2の複合要因グラフを前記複合要因グラフとして出力することができる。この第2の複合要因グラフを参照することにより、ユーザは、取得された2つ以上の入力属性条件の妥当性、すなわち、第2データ群に対応する出力属性の要因となる入力属性条件をほぼ漏れなく選定できているかを確認することができる。 According to the above configuration, the number of pieces of data satisfying the input attribute condition in the basic data group and corresponding to the second data group is represented in the order of the rank of the input attribute condition acquired with the ranking. A second composite factor graph showing the result of sequentially integrating the number of hits in the second data group can be output as the composite factor graph. By referring to the second composite factor graph, the user can substantially determine the validity of the two or more acquired input attribute conditions, that is, the input attribute conditions that cause the output attribute corresponding to the second data group. It can be confirmed whether it is possible to select without omission.
本発明のデータ分析装置は、上記構成のデータ分析装置において、前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、前記複合要因グラフ作成手段は、前記基本データ群の中から、前記取得した2つ以上の入力属性条件を全て満たすデータ群と、前記取得した2つ以上の入力属性条件の各々に対する排他的条件を全て満たすデータ群とをそれぞれ抽出し、前記データ群の各々における、前記出力属性の度数分布を示す第3の複合要因グラフを前記複合要因グラフとして出力するものである構成であってもよい。 In the data analysis apparatus according to the present invention, the input attribute condition determined by the input attribute condition determination unit in the data analysis apparatus having the above configuration is “the second data group is grouped into a data group that satisfies the input attribute condition, The composite factor graph creating means is a condition determined such that the first data group is collected in a data group that does not satisfy the input attribute condition. A data group satisfying all of the input attribute conditions and a data group satisfying all of the exclusive conditions for each of the two or more acquired input attribute conditions are respectively extracted, and the frequency distribution of the output attribute in each of the data groups The third composite factor graph indicating the above may be output as the composite factor graph.
上記構成によれば、前記取得された複数の入力属性条件を全て満たすデータ群と、前記取得された複数の入力属性条件の各々に対する排他的条件を全て満たすデータ群との各々における、前記出力属性の度数分布を示す第3の複合要因グラフを出力することができる。これにより、第3の複合要因グラフを参照することにより、ユーザは、着目した複数の入力属性条件の相互間の影響を、確認することができる。 According to the above configuration, the output attribute in each of the data group that satisfies all of the plurality of acquired input attribute conditions and the data group that satisfies all of the exclusive conditions for each of the acquired plurality of input attribute conditions It is possible to output a third composite factor graph showing the frequency distribution. Thereby, by referring to the third composite factor graph, the user can confirm the mutual influence of the plurality of input attribute conditions of interest.
本発明のデータ分析装置において、前記入力属性条件決定手段は、前記分類手段による分類後の前記基本データ群の中から、分析の対象とする分析データ群を抽出する分析データ群抽出手段と、前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記分析データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する第1の入力属性条件決定手段と、前記第1の入力属性条件決定手段で決定された前記入力属性条件の中で、前記第2データ群を切出す確度が最も高い前記入力属性条件を、分岐条件として決定する分岐条件決定手段と、前記分岐条件決定手段で決定された前記分岐条件に基づいて、前記分析データ群を2つのデータ群に分割する分割手段と、前記第1の入力属性条件決定手段で決定された前記入力属性条件の中から前記第2データ群に対応する出力属性条件の要因としての重要度の高い入力属性条件を選定する第2の入力属性条件決定手段とを含み、前記分析データ群抽出手段は、前記分割手段で分割された2つのデータ群のうち、前記第2データ群の比率が小さい方のデータ群のみを新たな分析データ群として抽出し、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理が繰り返し実行されるようになっており、前記第2の入力属性条件決定手段は、前記入力属性の各々に対して、それぞれ、前記第1の入力属性条件決定手段の繰り返しの処理によって決定された該入力属性における複数の入力属性条件の中から前記重要度の高い入力属性条件を選定し、該選定された入力属性条件を、前記入力属性条件決定手段の出力として決定するものであることが好ましい。 In the data analysis apparatus of the present invention, the input attribute condition determination unit includes an analysis data group extraction unit that extracts an analysis data group to be analyzed from the basic data group after classification by the classification unit; An input attribute condition, which is an input attribute condition for bisecting the analysis data group, is set for each of the plurality of input attributes so that the first data group and the second data group are respectively combined. The first input attribute condition determining means for determining each of the input attribute conditions, and the input attribute condition having the highest probability of cutting out the second data group among the input attribute conditions determined by the first input attribute condition determining means. Branch condition determining means for determining the analysis data group into two data groups based on the branch condition determined by the branch condition determining means, A second input attribute condition for selecting a highly important input attribute condition as a factor of the output attribute condition corresponding to the second data group from the input attribute conditions determined by the first input attribute condition determining means And the analysis data group extraction means extracts only a data group having a smaller ratio of the second data group as a new analysis data group out of the two data groups divided by the division means. And a series of processes consisting of the processing by the analysis data group extracting means, the processing by the first input attribute condition determining means, the processing by the branch condition determining means, and the processing by the dividing means are repeatedly executed. The second input attribute condition determining means is determined for each of the input attributes by the repetition process of the first input attribute condition determining means. The input attribute condition having a high degree of importance is selected from a plurality of input attribute conditions in the input attribute, and the selected input attribute condition is determined as an output of the input attribute condition determining means. preferable.
上記構成によれば、第2の入力属性条件決定手段によって、前記第2データ群に対応する出力属性条件の要因としての重要度に基づいて重要度の高い入力属性条件を選定しているので、如何に複雑な回帰木となろうとも、第2データ群に対応する出力属性条件の要因を明確に把握することができる。 According to the above configuration, since the second input attribute condition determining means selects the input attribute condition having a high importance based on the importance as the factor of the output attribute condition corresponding to the second data group, Regardless of how complicated the regression tree is, the cause of the output attribute condition corresponding to the second data group can be clearly understood.
また、上記構成によれば、第2の入力属性条件決定手段が、繰り返し処理毎に決定された同一の入力属性における複数の入力属性条件のうちで重要度の高い条件のみを選択しているから、詳細な要因分析結果を得るために上記の繰り返し処理を行っても複雑化する事なく、非常に簡潔な形でありながら、高い確度で、第2データ群に対応する出力属性条件の要因を決定することができる。 Further, according to the above configuration, the second input attribute condition determining means selects only a highly important condition among a plurality of input attribute conditions in the same input attribute determined for each repetition process. In order to obtain detailed factor analysis results, the above-mentioned iterative process is not complicated, and the output attribute condition factor corresponding to the second data group can be determined with high accuracy while maintaining a very simple form. Can be determined.
さらに、上記構成によれば、前記分割手段によって分割される(分岐される)2つのデータ群(ノード)のうち、第2データ群の比率が小さい方のデータ群のみについて、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理を繰り返す。このように、第2データ群に対応する出力属性の要因が未発見のデータ群のみに対して、順次、第2データ群に対応する出力属性の要因となる入力属性条件の決定を行うから、それ以前の繰り返し処理で第2データ群の主要因として決定された入力属性条件の影響を除外して、第2データ群の新たな要因を高い確度で、かつ、効率的に抽出できる。 Furthermore, according to the above configuration, the analysis data group extraction is performed only for the data group having the smaller ratio of the second data group among the two data groups (nodes) divided (branched) by the dividing unit. A series of processing consisting of processing by means, processing by the first input attribute condition determining means, processing by the branch condition determining means, and processing by the dividing means is repeated. In this way, since the output attribute factor corresponding to the second data group is determined only for the data group in which the cause of the output attribute corresponding to the second data group is not yet found, the input attribute condition that causes the output attribute corresponding to the second data group is determined. By excluding the influence of the input attribute condition determined as the main factor of the second data group in the previous iterative process, the new factor of the second data group can be extracted with high accuracy and efficiency.
本発明のデータ分析装置は、上記の課題を解決するために、複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係を示す情報を抽出するデータ分析装置であって、前記出力属性の値に基づいて、前記基本データ群を、第1データ群と第2データ群とに分類する分類手段と、前記分類手段による分類後の前記基本データ群の中から、分析の対象とする分析データ群を抽出する分析データ群抽出手段と、前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記分析データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する第1の入力属性条件決定手段と、前記第1の入力属性条件決定手段で決定された前記入力属性条件の中で、前記第2データ群を切出す確度が最も高い前記入力属性条件を、分岐条件として決定する分岐条件決定手段と、前記分岐条件決定手段で決定された前記分岐条件に基づいて、前記分析データ群を2分化する分割手段とを含み、前記分析データ群抽出手段は、前記分割手段で分割されたデータ群のうち、前記第2データ群の比率が小さい方のデータ群のみを新たな分析データ群として抽出し、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理が繰り返し実行されるようになっていることを特徴としている。 In order to solve the above problems, the data analysis apparatus of the present invention provides the input attribute and the output attribute for a basic data group that is a set of data composed of a plurality of input attributes and output attributes. A data analysis apparatus for analyzing the causal relationship of the data and extracting information indicating the causal relationship, and classifying the basic data group into a first data group and a second data group based on the value of the output attribute Classification means, analysis data group extraction means for extracting an analysis data group to be analyzed from the basic data group after classification by the classification means, the first data group and the second data group, Are first input attribute condition determining means for determining, for each of the plurality of input attributes, an input attribute condition that is an input attribute condition for dividing the analysis data group into two. And before Among the input attribute conditions determined by the first input attribute condition determining means, the branch condition determining means for determining the input attribute condition having the highest probability of cutting out the second data group as a branch condition; A splitting unit that divides the analysis data group into two based on the branch condition determined by the branching condition determination unit, and the analysis data group extraction unit includes the data group divided by the splitting unit, Only a data group having a smaller ratio of the second data group is extracted as a new analysis data group, processing by the analysis data group extraction means, processing by the first input attribute condition determination means, and by the branch condition determination means A series of processes including processes and processes by the dividing unit are repeatedly executed.
上記構成によれば、前記分割手段によって分割される(分岐される)2つのデータ群(ノード)のうち、第2データ群の比率が小さい方のデータ群のみについて、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理を繰り返す。このように、第2データ群に対応する出力属性の要因が未発見のデータ群のみに対して、順次、第2データ群に対応する出力属性の要因となる入力属性条件の決定を行うから、それ以前の繰り返し処理で第2データ群の主要因として決定された入力属性条件の影響を除外して、第2データ群の新たな要因を高い確度で、かつ、効率的に抽出できる。 According to the above configuration, only the data group having the smaller ratio of the second data group among the two data groups (nodes) divided (branched) by the dividing unit is analyzed by the analysis data group extracting unit. A series of processing consisting of processing, processing by the first input attribute condition determining means, processing by the branch condition determining means, and processing by the dividing means is repeated. In this way, since the output attribute factor corresponding to the second data group is determined only for the data group in which the cause of the output attribute corresponding to the second data group is not yet found, the input attribute condition that causes the output attribute corresponding to the second data group is determined. By excluding the influence of the input attribute condition determined as the main factor of the second data group in the previous iterative process, the new factor of the second data group can be extracted with high accuracy and efficiency.
また、上記構成によれば、全ての入力属性について問題事象の要因となる入力属性条件を抽出しているから、分岐条件に競合因子が存在しても、その要因を逃すことなく、確実に捉えることができる。 In addition, according to the above configuration, since the input attribute condition that causes the problem event is extracted for all the input attributes, even if there is a competing factor in the branch condition, it is reliably captured without missing the factor. be able to.
なお、「第2データ群を切出す確度」とは、「該入力属性条件を満たすデータ群に前記第2データ群がまとまる」確度を指す。この「第2データ群を切出す確度」としては、Giniインデックス法の改善度や、「入力属性条件に該当するデータ群に含まれる第2データ群の割合」、前述した第1の頻度と第2の頻度との比率、前述した頻度差分値、これらの組み合わせ等を用いることができる。 Note that “the accuracy of cutting out the second data group” refers to the accuracy of “the second data group is collected in the data group that satisfies the input attribute condition”. As the “accuracy of cutting out the second data group”, the improvement degree of the Gini index method, “the ratio of the second data group included in the data group corresponding to the input attribute condition”, the first frequency and the first The ratio with the frequency of 2, the frequency difference value described above, a combination thereof, and the like can be used.
本発明のデータ分析装置およびデータ分析プログラムは、前記入力属性条件決定手段で決定された複数の前記入力属性条件から選ばれる特定の入力属性条件に基づく基本データ群の2分化によって得られる2つのデータ群と、出力属性の値に基づく基本データ群の2分化によって得られる2つのデータ群(第1データ群および第2データ群)と、の対応関係を視覚的に表すレビューグラフを出力するから、分析結果の直感的な評価が可能となる。 The data analysis apparatus and the data analysis program according to the present invention provide two data obtained by bifurcation of a basic data group based on a specific input attribute condition selected from a plurality of the input attribute conditions determined by the input attribute condition determining means Since a review graph that visually represents the correspondence between the group and two data groups (first data group and second data group) obtained by bisectioning the basic data group based on the value of the output attribute is output, Intuitive evaluation of analysis results is possible.
また、本発明のデータ分析装置およびデータ分析プログラムは、前記入力属性条件決定手段で決定された複数の前記入力属性条件から選ばれる特定の入力属性条件に基づく第2の基本データ群の2分化によって得られる2つのデータ群と、前記分類手段で前記基本データ群を分類した条件に基づく第2の基本データ群の2分化によって得られる2つのデータ群と、の対応関係を視覚的に表すレビューグラフを出力するから、分析結果の直感的な評価が可能となる。 Further, the data analysis apparatus and the data analysis program of the present invention are obtained by bisecting the second basic data group based on a specific input attribute condition selected from the plurality of input attribute conditions determined by the input attribute condition determining means. A review graph that visually represents the correspondence between the two data groups obtained and the two data groups obtained by bisectioning the second basic data group based on the conditions for classifying the basic data group by the classification means Can be intuitively evaluated.
また、本発明のデータ分析装置およびデータ分析プログラムは、前記入力属性条件決定手段で決定された複数の前記入力属性条件から選ばれる特定の2つ以上の前記入力属性条件が交絡した条件に基づいて前記基本データ群から抽出されるデータ群と、出力属性の値に基づく基本データ群の2分化によって得られる2つのデータ群(第1データ群および第2データ群)と、の対応関係を表す複合要因グラフを出力するから、分析結果の直感的な評価が可能となる。 Further, the data analysis apparatus and the data analysis program of the present invention are based on a condition in which two or more specific input attribute conditions selected from the plurality of input attribute conditions determined by the input attribute condition determining means are entangled. A composite representing a correspondence relationship between a data group extracted from the basic data group and two data groups (first data group and second data group) obtained by dividing the basic data group based on the value of the output attribute Since the factor graph is output, the analysis result can be intuitively evaluated.
また、本発明のデータ分析装置において、出力属性の値に基づいて、基本データ群を、第1データ群と第2データ群とに分類する分類手段と、第1データ群と第2データ群とが、それぞれまとまるように、基本データ群を2分化するための入力属性条件を決定する入力属性条件決定手段と、入力属性条件決定手段で決定された複数の入力属性条件の一覧を出力する入力属性条件一覧作成手段とを備えており、この入力属性条件の一覧において、第2データ群該当数、および/または、第2データ群分離度に基づいて、複数の入力属性条件に対する優先順位付けがなされている場合には、所定の出力属性の要因を、優先順位を付けて明確に特定することができるという効果も得られる。 In the data analysis apparatus of the present invention, the classification means for classifying the basic data group into the first data group and the second data group based on the value of the output attribute, the first data group and the second data group, Input attribute condition determining means for determining an input attribute condition for dividing the basic data group into two parts, and an input attribute for outputting a list of a plurality of input attribute conditions determined by the input attribute condition determining means And a condition list creating means. In this list of input attribute conditions, priorities are assigned to a plurality of input attribute conditions based on the number of second data group hits and / or the second data group separation degree. In this case, it is possible to clearly specify the factor of the predetermined output attribute by assigning priority.
また、本発明のデータ分析装置およびデータ分析プログラムは、第2データ群に対応する出力属性の要因が未発見のデータ群のみに対して、順次、第2データ群に対応する出力属性の要因となる入力属性条件の決定を行うから、それ以前の繰り返し処理で第2データ群の主要因として決定された入力属性条件の影響を除外して、第2データ群の新たな要因を高い確度で、かつ、効率的に抽出できる。 Further, the data analysis apparatus and the data analysis program of the present invention sequentially outputs the output attribute factor corresponding to the second data group to only the data group for which the output attribute factor corresponding to the second data group is not found. Since the input attribute condition is determined, the influence of the input attribute condition determined as the main factor of the second data group in the previous iterative process is excluded, and the new factor of the second data group is highly accurate. And it can extract efficiently.
本発明の一実施形態を以下に説明する。 One embodiment of the present invention will be described below.
まず、本実施形態のデータ分析装置の構成を図1に基づいて説明する。図1に示すように、データ分析装置は、基本データ群格納部1、分類条件設定部3、データ分類部(分類手段)4、分類後基本データ群格納部5、分析データ群抽出部(分析データ群抽出手段)6、第1の入力属性条件決定部(第1の入力属性条件決定手段)12、分析結果データ格納部13、分岐条件決定部(分岐条件決定手段)14、データ分割部(分割手段)15、終了条件判定部16、不良品データ演算部17、第2の入力属性条件決定部(第2の入力属性条件決定手段)19、入力属性条件一覧グラフ作成部(入力属性条件一覧作成手段)20、レビューグラフ作成部(第2の基本データ群作成手段、レビューグラフ作成手段)21、複合要因グラフ作成部(複合要因グラフ作成手段)22、および順位決定部(順位決定手段)23を備えている。なお、上記の分析データ群抽出部(分析データ群抽出手段)6、第1の入力属性条件決定部(第1の入力属性条件決定手段)12、分析結果データ格納部13、分岐条件決定部(分岐条件決定手段)14、データ分割部(分割手段)15、終了条件判定部16、不良品データ演算部17、および、第2の入力属性条件決定部(第2の入力属性条件決定手段)19が、特許請求の範囲における入力属性条件決定手段としての入力属性条件決定部100を構成している。
First, the structure of the data analysis apparatus of this embodiment is demonstrated based on FIG. As shown in FIG. 1, the data analysis apparatus includes a basic data
また、データ分析装置には、データ分析装置の分類条件設定部3に分類条件の設定情報を入力するための、キーボードやポインティングデバイス等の入力デバイス30と、データ分析装置の入力属性条件一覧グラフ作成部20にユーザ指示を送るための、キーボードやポインティングデバイス、スイッチ等の入力デバイス31と、レビューグラフ等を表示する表示装置32とが接続されている。なお、入力デバイス30と入力デバイス31とは、1つの入力デバイス、例えばキーボードで実現してもよい。また、表示装置32に代えて、表示装置以外の出力デバイス、例えば印刷装置を用いてレビューグラフ等を出力するようにしてもよい。
Further, the data analysis apparatus creates an
次に、表1のデータ群DAを基本データ群とする場合を例として、本実施形態のデータ分析装置の動作を説明する。表1の基本データ群DAは、ハードディスク等の基本データ群格納部1に格納されている。
Next, the operation of the data analysis apparatus of the present embodiment will be described by taking as an example the case where the data group DA in Table 1 is a basic data group. The basic data group DA in Table 1 is stored in the basic
表1の基本データ群DAは、製造工程で製造される液晶パネルやICチップなどの、複数の素子(機能素子)を基板上に配置した製品に関し、素子の1個毎に、各素子の特性データ、検査データ、および、プロセスデータなどを並べたデータ群のサンプルである。 The basic data group DA in Table 1 relates to products in which a plurality of elements (functional elements) such as liquid crystal panels and IC chips manufactured in the manufacturing process are arranged on a substrate, and the characteristics of each element for each element. It is a sample of a data group in which data, inspection data, process data, and the like are arranged.
表1において、「素子番号」は、各素子の1個毎に付与された素子特有の番号、「基板番号」は各素子が属する基板の番号、「素子座標番号」は、各素子の基板内における座標位置の番号を、それぞれ表している。基本データ群DAに含まれる複数のデータは各々、表1に示すように、8つの入力属性1〜8と、出力属性と、素子番号と、基板番号と、素子座標番号とを含んでいる。各基板は、同じ製造工程において製造され、その番号は、製造時期の順に付与されている。 In Table 1, “element number” is a unique number assigned to each element, “substrate number” is the number of the substrate to which each element belongs, and “element coordinate number” is the number of each element in the substrate. The numbers of the coordinate positions in are respectively represented. As shown in Table 1, each of the plurality of data included in the basic data group DA includes eight input attributes 1 to 8, an output attribute, an element number, a board number, and an element coordinate number. Each substrate is manufactured in the same manufacturing process, and the numbers are given in the order of manufacturing time.
また、「出力属性」は、素子の特性データなど、分析の対象とする属性を表し、「入力属性1〜8」は、製造プロセス条件やインライン検査データ(製造途中での検査結果)など、「出力属性」に影響を与える属性を表している。 The “output attribute” represents an attribute to be analyzed such as element characteristic data, and “input attributes 1 to 8” include “manufacturing process conditions and in-line inspection data (inspection results during manufacturing)”. Indicates an attribute that affects the “output attribute”.
図2は、「出力属性」の値の基板毎の推移を示すトレンドグラフで、同一基板内の各素子の「出力属性」の値の平均値を、基板毎に示している。図3は、「出力属性」の値の面内分布を示すマップで、同一の「素子座標番号」にある各素子の「出力属性」の値の平均値の大きい素子座標位置を赤色(図面上では網掛けのハッチングで示す)で、他の座標位置が緑色(図面上では斜線のハッチングで示す)で示している。 FIG. 2 is a trend graph showing the transition of the “output attribute” value for each board, and shows the average value of the “output attribute” values of each element in the same board for each board. FIG. 3 is a map showing the in-plane distribution of the “output attribute” value. The element coordinate position where the average value of the “output attribute” value of each element in the same “element coordinate number” is large is shown in red (on the drawing). The other coordinate positions are shown in green (indicated by hatching in the drawing).
いま、「出力属性」の値が2.5よりも大きい素子(「出力属性」>2.5)を不良品として、この不良の要因を「入力属性1〜8」の中から抽出し、その結果を評価する場合を例として、図1のデータ分析装置の動作を説明する。 Now, an element having an “output attribute” value larger than 2.5 (“output attribute”> 2.5) is regarded as a defective product, and the cause of this failure is extracted from “input attributes 1 to 8”. The operation of the data analysis apparatus in FIG. 1 will be described by taking the case of evaluating the result as an example.
なお、図2のトレンドグラフにおいて、破線Aより上のプロットに対応する基板が不良品(「出力属性」>2.5の素子)を多く含む基板を示している。また、図3のマップにおいて、P1およびP2の位置が、不良品(「出力属性」>2.5の素子)を多く含む座標位置を示し、P3、P4、およびP5の位置が、不良品(「出力属性」>2.5の素子)の数の少ない座標位置を示している。 In the trend graph of FIG. 2, the substrate corresponding to the plot above the broken line A indicates a substrate including many defective products (elements with “output attribute”> 2.5). In the map of FIG. 3, the positions of P1 and P2 indicate coordinate positions including many defective products (elements with “output attribute”> 2.5), and the positions of P3, P4, and P5 are defective products ( A coordinate position with a small number of “output attributes”> 2.5 elements) is shown.
以下、図4に示すフローチャートを参照しながら、図1のデータ分析装置の動作を説明する。なお、表1の基本データ群DAは、ハードディスク等の基本データ群格納部1に格納されている。
Hereinafter, the operation of the data analysis apparatus of FIG. 1 will be described with reference to the flowchart shown in FIG. The basic data group DA in Table 1 is stored in the basic data
[ステップ1]
分類条件設定部3は、予め定められた設定情報に従って、あるいは、ユーザがキーボードやマウス等の入力デバイス30から入力した設定情報に従って、不良品の条件である「出力属性>2.5」を設定し、データ分類部4に出力する(S1)。
[Step 1]
The classification
[ステップ2]
次に、データ分類部4が、分類条件設定部3から出力された分類条件に基づく下記論理(1)(2)によって、基本データ群DAを、出力属性の値に基づいて、第1データ群DA1と第2データ群DA2とに分類し、表2に示すように、各々のデータ群に対応する分類フラグを付与する(S2)。
[Step 2]
Next, the
以下、表2のデータ群を、分類後基本データ群DA00と呼ぶ。分類後基本データ群DA00は、ハードディスク等の分類後基本データ群格納部5に保存される。
Hereinafter, the data group in Table 2 is referred to as a post-classification basic data group DA00. The post-classification basic data group DA00 is stored in the post-classification basic
(1)「出力属性≦2.5」→DA1
(2)「出力属性>2.5」→DA2
ここで、第2データ群DA2は不良品のデータ群(「出力属性>2.5」)であり、第1データ群DA1は不良品でないデータ群(「出力属性≦2.5」)である。以下では、適宜、第1データ群DA1を良品(OK品)データ群、第2データ群DA2を不良品(NG品)データ群と呼ぶ事にする。
(1) “Output attribute ≦ 2.5” → DA1
(2) “Output attribute> 2.5” → DA2
Here, the second data group DA2 is a defective product data group (“output attribute> 2.5”), and the first data group DA1 is a non-defective product data group (“output attribute ≦ 2.5”). . Hereinafter, the first data group DA1 is appropriately referred to as a non-defective product (OK product) data group, and the second data group DA2 is appropriately referred to as a defective product (NG product) data group.
なお、データ分類部4による分類は、上記論理に限らず、不良品の判定結果など、特定の文字データに該当するか否かに基づく、下記の分類条件に示すような論理で行ってもよい。
The classification by the
(1’)「出力属性≠“不良品”」→DA1
(2’)「出力属性=“不良品”」→DA2
また、複数の閾値との比較結果などとして表される複数の条件の、論理和または論理積に基づいて、下記の分類条件に示すような論理で分類してもよい。
(1 ') “Output attribute ≠“ defective product ”” → DA1
(2 ′) “Output attribute =“ defective product ”” → DA2
Further, based on a logical sum or logical product of a plurality of conditions expressed as a comparison result with a plurality of thresholds, etc., the classification may be performed according to the logic shown in the following classification conditions.
(1“)yth1<出力属性≦yth2→DA1(yth1,yth2:閾値)
(2“)出力属性≦yth1 OR 出力属性>yth2→DA2
さらに、出力属性が複数存在し(出力属性1、出力属性2)、各々の出力属性に対する個々の閾値との比較結果などとして表される条件の、論理和または論理積に基づく、下記の分類条件に示すような論理で分類してもよい。
(1 “) yth1 <output attribute ≦ yth2 → DA1 (yth1, yth2: threshold)
(2 “) Output attribute ≦ yth1 OR Output attribute> yth2 → DA2
Furthermore, the following classification conditions based on the logical sum or logical product of the conditions expressed as a comparison result with each threshold value for each output attribute, such as multiple output attributes (
(1‘‘‘)出力属性1≦yth1 OR 出力属性2>yth2→DA1
(2‘‘‘)出力属性1>yth1 AND 出力属性2≦yth2→DA2
[ステップ3]
分析データ群抽出部6が、分類後基本データ群DA00の中から分析対象とする分析データ群DA00’を抽出し、第1の入力属性条件決定部12に送る。
(1 ″ ′)
(2 ″ ′)
[Step 3]
The analysis data
この1回目の処理では、分類後基本データ群DA00と同一のデータが分析データ群DA00’として抽出されるが、後述する繰り返し処理の過程では、データ分割部15が出力する他データ群が抽出される。
In this first process, the same data as the post-classification basic data group DA00 is extracted as the analysis data group DA00 ′. However, in the process of repeated processing described later, another data group output by the
[ステップ4]
第1の入力属性条件決定部12が、入力属性1〜入力属性8の各々に対してそれぞれ入力属性条件を決定する。上記入力属性条件は、良品の第1データ群DA1と不良品の第2データ群DA2とがそれぞれまとまるように、すなわち、2分化によって得られる2つのデータ群のうち、一方に第1データ群DA1がまとまり、他方に第2データ群DA2がまとまるように、分析データ群DA00’を2分化するための入力属性の条件である。ここで、「データ群Aにデータ群Bがまとまる」とは、「データ群Bに属するデータであれば、データ群Aに属するデータである」という相関ルールの確からしさが高いことを指すものとする。
[Step 4]
The first input attribute
なお、第1の入力属性条件決定部12によって決定される入力属性条件は表3に示す通りで、この入力属性条件は、「当該入力属性条件を満たすデータ群に不良品の第2データ群DA2(「出力属性」>2.5)がまとまり、当該入力属性条件を満たさないデータ群に良品の第1データ群DA1(「出力属性」≦2.5)がまとまる」条件である。第1の入力属性条件決定部12によって決定された入力属性条件(表3)は、分析結果データ格納部13に格納される。
The input attribute conditions determined by the first input attribute
第1の入力属性条件決定部12による、入力属性条件の決定方法としては、データ群を2分化するための如何なる手法を用いてもよいが、例えば、非特許文献1に記載のGiniインデックス法が用いられる。
As a method for determining the input attribute condition by the first input attribute
以下に、Giniインデックス法による入力属性条件の決定方法について簡単に説明する。このGiniインデックス法では、「改善度」という指標を用いて、入力属性条件を決定する。 Hereinafter, a method of determining the input attribute condition by the Gini index method will be briefly described. In this Gini index method, an input attribute condition is determined using an index called “degree of improvement”.
Giniインデックス法の「改善度△i(t1)」は、「ノードt1を、ある入力属性条件に基づいて、2つの子ノードt2とt3とに分岐させる場合に、この分岐により、どの程度出力属性のまとまりが良くなるか」を示す指標であり、下式(1)のように表される。 The “improvement degree Δi (t1)” of the Gini index method is “when the node t1 is branched into two child nodes t2 and t3 based on a certain input attribute condition, how much output attribute is caused by this branching. It is an index indicating whether or not the unity is improved, and is expressed by the following equation (1).
△i(t1)=i(t1)−{pt2・i(t2)+pt3・i(t3)}
(1)
ここで、pt2、pt3は、ノードt1を、子ノードt2と子ノードt3とに分岐させるときの、分岐割合を示している。また、i(t1)、i(t2)、i(t3)は、それぞれ、ノードt1、子ノードt2、子ノードt3におけるGiniインデックスを示している。
Δi (t1) = i (t1) − {pt2 · i (t2) + pt3 · i (t3)}
(1)
Here, pt2 and pt3 indicate branching ratios when the node t1 is branched into the child node t2 and the child node t3. Further, i (t1), i (t2), and i (t3) indicate Gini indexes at the node t1, the child node t2, and the child node t3, respectively.
上記のGiniインデックスi(tx)(x=1,2,3)は、出力属性の値のまとまりの程度を表す指標で、下式(2)で表される。 The Gini index i (tx) (x = 1, 2, 3) is an index representing the degree of grouping of output attribute values, and is represented by the following expression (2).
i(tx)=1−Σ{p(j|tx)}2 (2)
ここで、p(j|tx)は、ノードtxにおいて、出力属性が「j」となる確率を示しており、Giniインデックスi(tx)が小さいことは、ノードtxにおいて出力属性の値がうまくまとまっていることを意味している。したがって、「改善度△i(t1)」が大きくなる入力属性条件(すなわち、i(t2)またはi(t3)が小さくなる入力属性条件)は、出力属性のまとまりがよくなるように、ノードt1を2分化できる条件と言える。
i (tx) = 1−Σ {p (j | tx)} 2 (2)
Here, p (j | tx) indicates the probability that the output attribute is “j” at the node tx, and that the Gini index i (tx) is small indicates that the value of the output attribute is well organized at the node tx. It means that Therefore, an input attribute condition that increases the “improvement degree Δi (t1)” (that is, an input attribute condition that decreases i (t2) or i (t3)) sets the node t1 to improve the unity of output attributes. It can be said that it can be differentiated into two.
第1の入力属性条件決定部12は、例えば、上記のGiniインデックス法の改善度を指標として、良品の第1データ群DA1と、不良品の第2データ群DA2とがそれぞれまとまるように、分析データ群DA00’を2分化するための入力属性条件を決定する。
The first input attribute
具体的には、各入力属性が取り得る全ての入力属性条件のパターンについて(入力属性条件を満たすデータ群と、入力属性条件を満たさないデータ群との分岐パターンの全てについて)、上記の改善度を演算し、各入力属性において最大の改善度をもつ条件を抽出する。そして、抽出された条件によって分かれる2つの子ノードのうち、第2データ群に対応する条件を、入力属性条件として決定する。 Specifically, with respect to all patterns of input attribute conditions that can be taken by each input attribute (for all branch patterns of data groups that satisfy the input attribute conditions and data groups that do not satisfy the input attribute conditions), the degree of improvement described above And the condition having the maximum improvement in each input attribute is extracted. Then, a condition corresponding to the second data group is determined as an input attribute condition among the two child nodes separated by the extracted condition.
なお、第1の入力属性条件決定部12における入力属性条件の決定は、Giniインデックス法の改善度以外の指標、例えば、後述する「第1の頻度と第2の頻度との差分値」などに基づいて行ってもよい。上記の「第1の頻度と第2の頻度との差分値」による、第1の入力属性条件決定部12における入力属性条件の決定方法は、例えば、各入力属性の全ての数値について、第1データ群DA1中において、入力属性がその数値以下であるデータの割合を第1の頻度として演算すると共に、第2データ群DA2中において、入力属性がその数値以下であるデータの割合を第2の頻度として演算する頻度演算ステップと、各入力属性の全ての数値について、第1の頻度と第2の頻度との差分値を演算する差分演算ステップと、1つの入力属性がとる各数値の中で、上記差分値が最大となる数値を、該入力属性における閾値とし、各入力属性に対してそれぞれ1つの閾値を決定する閾値決定ステップと、上記閾値決定ステップで決定された閾値に基づいて、上記入力属性条件を決定する入力属性条件決定ステップとを含む方法であってもよい。
The determination of the input attribute condition in the first input attribute
[ステップ5]
分岐条件決定部14が、第1の入力属性条件決定部12で決定された入力属性条件(表3)の中で、第2データ群DA2を切出す確度が最も高い入力属性条件を、分岐条件として決定する。第2データ群DA2を切出す確度の指標としては、上記Giniインデックス法の改善度や、「入力属性条件に該当するデータ群に含まれる第2データ群の割合」、前述した頻度演算ステップによって得られる第1の頻度と第2の頻度との比率、前述した頻度演算ステップおよび差分演算ステップによって得られる第1の頻度と第2の頻度との差分値、これらの組み合わせなどを用いればよい。
[Step 5]
Among the input attribute conditions (Table 3) determined by the first input attribute
この例では、第2データ群DA2を切出す確度の指標としてGiniインデックス法の改善度を用いる。このようにして、表3中の、「入力属性6≦2.00」が分岐条件として決定される。
In this example, the improvement degree of the Gini index method is used as an index of the accuracy of extracting the second data group DA2. In this way, “
[ステップ6]
データ分割部15が、分岐条件決定部14で決定された分岐条件「入力属性6≦2.00」に基づいて、分析データ群DA00’を、「入力属性6≦2.00」を満たす要因データ群と、「入力属性6≦2.00」を満たさない(「入力属性6>2.00」を満たす)他データ群とに分割する。なお、他データ群は、特許請求の範囲における、「第2データ群の比率が小さい方のデータ群」に対応する。
[Step 6]
Based on the branch condition “
[ステップ7]
分析データ群抽出部6が、データ分割部15で分割されたデータ群のうち、他データ群のみを次の分析データ群DA00’として抽出する。そして、終了条件判定部16で終了条件を満たしていると判定されるまで、上記のステップ3〜ステップ6の一連の処理が繰り返される。本実施形態の終了条件判定部16は、分析データ群DA00’に含まれる不良品の第2データ群DA2のデータ個数が0となった場合を終了条件として判定するようになっている。このように不良品の第2データ群DA2のデータ個数が0となるまで繰り返し処理を実行することにより、詳細な要因分析結果が得られる。
[Step 7]
The analysis data
なお、終了条件は、第2データ群DA2のデータ個数に基づく他の終了条件、例えば、(1)第2データ群DA2のデータ個数が所定数以下となった場合、(2)第1データ群DA1のデータ個数に対する第2データ群DA2のデータ個数の割合が所定割合以下となった場合、(3)上記ステップ5で決定された分岐条件における、第2データ群DA2の切出し確度の指標が所定値を下回った場合等としてもよい。これらのような終了条件を用いた場合、より簡潔で十分な要因分析結果を得ることができる。さらに、簡潔な要因分析結果を得ることを優先する場合には、終了条件を単に繰返し処理を所定回数行った場合としたり、終了条件判定部16を省いて、可能な限り繰り返し処理を行うようにしたりしてもよい。
The end condition is another end condition based on the number of data in the second data group DA2, for example, (1) when the number of data in the second data group DA2 is equal to or less than a predetermined number, (2) the first data group. When the ratio of the number of data in the second data group DA2 to the number of data in DA1 is equal to or less than a predetermined ratio, (3) the index of the extraction accuracy of the second data group DA2 under the branch condition determined in
本実施形態(表1の基本データ群DAの分析)においては、分析データ群抽出部6によって抽出された4回目の分析データ群に、不良品の第2データ群DA2が含まれていなかったため、3回の繰り返しで処理が終了した。上記の繰り返し処理毎に、第1の入力属性条件決定部12(ステップ4)によって、各入力属性に対して決定された入力属性条件を表4に示す。
In the present embodiment (analysis of the basic data group DA in Table 1), the fourth analysis data group extracted by the analysis data
[ステップ8]
不良品データ演算部17が、第1の入力属性条件決定部12で決定された入力属性条件(表4)の各々に対し、分類後基本データ群DA00(分析データ群DA00’ではない)の中で、該入力属性条件を満たすデータの個数(表5の「DA1+DA2」列)と、該入力属性条件を満たし、かつ、不良品の第2データ群DA2に該当するデータの個数(表5の「DA2」列)とを集計する。
[Step 8]
For each of the input attribute conditions (Table 4) determined by the first input attribute
この「DA2」列の個数は、各入力属性条件に起因する不良数を表しており、特許請求の範囲における第2データ群該当数に対応する。 The number of “DA2” columns represents the number of defects caused by each input attribute condition, and corresponds to the number of corresponding second data groups in the claims.
次に、表5の「DA2」列の値を、「DA1+DA2」列の値で除算した、不良品分離度を演算する。各入力属性条件の不良品分離度は、該入力属性条件を満たすデータの中に不良品である第2データ群DA2が含まれるデータ個数の割合(分類後基本データ群DA00中で該入力属性条件を満たすデータの中における、不良品の第2データ群DA2に該当するデータの個数の割合)で、該入力属性条件による不良品切り出しの確度(分類後基本データ群DA00の中で該入力属性条件に属するデータを母集団としたときの不良率)を表しており、特許請求の範囲における第2データ群分離度に対応する。この不良品分離度は、分類後基本データ群DA00における、「入力属性条件を満たせば、不良品が発生する」という相関ルールの確信度に相当する。 Next, the defective product separation degree is calculated by dividing the value in the “DA2” column of Table 5 by the value in the “DA1 + DA2” column. The defective product separation degree of each input attribute condition is the ratio of the number of data in which the second data group DA2 which is a defective product is included in the data satisfying the input attribute condition (the input attribute condition in the classified basic data group DA00) The ratio of the number of data corresponding to the second data group DA2 of defective products among the data satisfying the above condition, the accuracy of the defective product extraction by the input attribute condition (the input attribute condition in the basic data group DA00 after classification) The defect rate when the data belonging to is a population), and corresponds to the second data group separation degree in the claims. This degree of defective product separation corresponds to the certainty of an association rule in the post-classification basic data group DA00 that “if the input attribute condition is satisfied, a defective product is generated”.
表5は、上記不良品データ演算部17による演算結果と併せて、その「Total」行に、分類後基本データ群DA00の中の、データ総数(=495:「DA1+DA2」列)、不良品の第2データ群DA2の個数(=253:「DA2」列)、および、不良品含有率(=253/495=0.511:「不良品分離度」列)を示したテーブルである。不良品含有率は、分類後基本データ群DA00の中に含まれる第2データ群DA2のデータ個数の割合であって、分類後基本データ群DA00の全データを母集団としたときの不良率(不良品の割合)を表している。表5のテーブルを、以下では、第1の入力属性条件一覧テーブルと呼ぶ。
Table 5 shows the total number of data (= 495: “DA1 + DA2” column) in the basic data group DA00 after classification in the “Total” row, along with the calculation result by the defective product
表5の各列の意味は、これらを代表的な入力属性条件(入力属性6、入力属性7について1回目に抽出された入力属性条件)についてベン図で表現した図5を参照すると、理解しやすい。図5(a)は、入力属性6について1回目に抽出された入力属性条件による不良品切り出しを行ったときの不良品分離度および不良数を示す図であり、図5(b)は、入力属性7について1回目に抽出された入力属性条件による不良品切り出しを行ったときの不良品分離度および不良数を示す図である。
The meaning of each column in Table 5 can be easily understood by referring to FIG. 5 in which these are represented by Venn diagrams for typical input attribute conditions (input attribute conditions extracted for the first time for
[ステップ9]
第2の入力属性条件決定部19が、第1の入力属性条件一覧テーブル(表5)の中の、同一の入力属性における複数の入力属性条件のうちで、問題事象の要因(第2データ群DA2に対応する出力属性条件の要因)としての重要度、すなわち問題事象を解消するための対策を施す上で優先すべき度合い(以下、「優先度」と称する)の高い入力属性条件のみを選択する。
[Step 9]
The second input attribute
本実施形態では、第2の入力属性条件決定部19は、入力属性条件一覧テーブル(表5)中の同一の入力属性における複数の入力属性条件、すなわちステップ7のn回(nは2以上の整数)の繰り返し処理によって決定されたn個の入力属性条件のうちで、不良品分離度(第2データ群分離度)が最大となる入力属性条件を優先度の高い入力属性条件として選択する。ただし、n個の入力属性条件に複数種類のパターンの入力属性条件が含まれる場合には、第2の入力属性条件決定部19は、各パターンで不良品分離度(第2データ群分離度)が最大となる入力属性条件をそれぞれ優先度の高い入力属性条件として選択する。
In the present embodiment, the second input attribute
具体的には、同一の入力属性に対して、「入力属性が閾値以下である」という第1のパターンの中で、不良品分離度(第2データ群分離度)が最大となる入力属性条件を1つと、「入力属性が閾値を超える」という第2のパターンの中で、不良品分離度(第2データ群分離度)が最大となる入力属性条件を1つとを、それぞれ選択し、不良品の第2データ群DA2(「出力属性」>2.5)の要因を示す情報として決定する。 Specifically, for the same input attribute, the input attribute condition that maximizes the defective product separation degree (second data group separation degree) in the first pattern “input attribute is below threshold” And one input attribute condition that maximizes the defective product separation degree (second data group separation degree) in the second pattern of “input attribute exceeds threshold”, and It is determined as information indicating the factor of the non-defective second data group DA2 (“output attribute”> 2.5).
表5の例の場合には、第2の入力属性条件決定部19によって、最終的に、表6に示す10個の入力属性条件が選択された。
In the case of the example of Table 5, the 10 input attribute conditions shown in Table 6 were finally selected by the second input attribute
ここで、上記の優先度の高い入力属性条件を選択する上で、不良品分離度(第2データ群分離度)を指標としているのは、以下の理由による。すなわち、ある入力属性条件の不良品分離度は、前述したように、該入力属性条件による不良品切り出しの確度を表しているため、この値が大きい入力属性条件は、他の入力属性(外乱)の影響をあまり受けずに高い確度で決定された条件と考えられるからである。 Here, the reason why the defective product separation degree (second data group separation degree) is used as an index in selecting the input attribute condition having a high priority is as follows. That is, as described above, the degree of defective product separation under a certain input attribute condition represents the accuracy of defective product extraction according to the input attribute condition. Therefore, an input attribute condition with a large value is a value other than other input attributes (disturbances). This is because it is considered to be a condition determined with high accuracy without being affected by the above.
第2の入力属性条件決定部19では、さらに以下の処理を行うようにしてもよい。すなわち、表6のテーブルにおける各入力属性条件の中で、分類後基本データ群DA00の不良品含有率(=0.511:「Total」行の「不良品分離度」列)よりも大きい値の不良品分離度をもつ入力属性条件を選択する。表6の例では、最終的に、表7に示す9条件が決定された。
The second input attribute
こうして選ばれた入力属性条件は、分類後基本データ群DA00の中からランダムに選んだサンプルよりも高い割合で、不良品の第2データ群DA2を含む条件であり、不良品の第2データ群DA2の要因を示している。 The input attribute condition selected in this way is a condition including the second data group DA2 of defective products at a higher rate than the randomly selected sample from the classified basic data group DA00, and the second data group of defective products. The factor of DA2 is shown.
上記のようにして、第2の入力属性条件決定部19で決定された入力属性条件(表6または表7)が、入力属性条件決定部100の出力する最終の入力属性条件となる。以下では、表6または表7のテーブルを、第2の入力属性条件一覧テーブルと呼ぶ。
As described above, the input attribute condition (Table 6 or Table 7) determined by the second input attribute
入力属性条件決定部100の処理(すなわち、ステップ3〜ステップ9の処理)の過程を、回帰木の形式で表現すると図6のようになる。図6を参照して、本実施形態では、回帰木によって分割される(分岐される)2つのデータ群(ノード)のうち、「不良品の第2データ群DA2の比率が小さい方のデータ群」である他データ群側についてのみ、順次回帰木を成長させている。このように、不良(第2データ群DA2)の主要因が未発見のデータ群(他データ群)に対して、順次、分析(入力属性条件の決定)を行っているから、それ以前の繰り返し処理で、不良の主要因となった入力属性条件の影響を除外して、新たな要因を高い確度で、かつ、効率的に抽出できる。しかも、回帰木が複雑化せず、直感的に不良の要因を把握しやすい。
The process of the input attribute condition determination unit 100 (that is, the process of
また、本実施形態では、回帰木の分岐毎に、分岐条件だけでなく全ての入力属性について問題事象(不良品の第2データ群DA2)の要因となる入力属性条件を求めている(第1の入力属性条件決定部11による処理)。そして、分岐の回数分(繰り返し処理の回数分)の全て入力属性条件の中で、さらに不良品分離度の高い入力属性条件を絞り込み、最終の不良要因として決定している(第2の入力属性条件決定部19による処理)。このように、回帰木における分岐条件に限らず、全ての入力属性について、問題事象(不良品の第2データ群DA2)の要因となる入力属性条件を抽出しているから、分岐条件に競合因子が存在しても、その要因を逃すことなく、確実に捉えることができる。 In the present embodiment, for each branch of the regression tree, not only the branch condition but also the input attribute condition that causes the problem event (defective product second data group DA2) is obtained for all the input attributes (first data). Of the input attribute condition determination unit 11). Then, among all the input attribute conditions for the number of times of branching (for the number of iterations), input attribute conditions with a higher degree of defective product separation are narrowed down and determined as the final failure factor (second input attribute) Processing by the condition determining unit 19). As described above, since the input attribute condition that causes the problem event (defective product second data group DA2) is extracted for all input attributes, not only the branch condition in the regression tree, the competing factor is included in the branch condition. Even if there is, can be caught without missing the factor.
また、最終的な要因決定(第2の入力属性条件決定部19による、最終入力属性条件の決定処理)において、不良品分離度という明確な指標に基づいて要因の決定を行っているため、如何に複雑な回帰木となろうとも、明確に不良の要因を把握することができる。 In the final factor determination (the final input attribute condition determination process by the second input attribute condition determination unit 19), the factor is determined based on a clear index of defective product separation. Even if it is a complicated regression tree, the cause of the failure can be clearly grasped.
上記のように、第2の入力属性条件決定部19が、不良品分離度(第2データ群分離度)という明確な指標に基づいて、繰り返し処理毎に決定された同一の入力属性における複数の入力属性条件のうちで優先度の高い条件のみを選択しているから、詳細な要因分析結果を得るために上記の繰り返し処理を行っても複雑化する事なく、非常に簡潔な形でありながら、高い確度で、第2データ群に対応する出力属性条件の要因を決定する事ができる。
As described above, the second input attribute
[ステップ10]
入力属性条件一覧グラフ作成部20が、第2の入力属性条件一覧テーブル(表7)に基づいて、入力属性条件一覧グラフ(図7)を作成する。入力属性条件一覧グラフ(図7)には、第2の入力属性条件決定部19(入力属性条件決定部100)で決定された入力属性条件の各々に対する不良数(第2データ群該当数)が棒グラフで、また、不良品分離度(第2データ群分離度)が折れ線グラフで、それぞれ示されている。なお、グラフの左端(“Total”)には、分類後基本データ群DA00の中の、不良数(=253)と不良品含有率(=0.511)が示されている。図7および他の図面において、“・・・E・・・”の形式で示す数値は、10進の指数表記による数値であり、Eの前の数字が仮数部であり、Eの後の数字が指数部である。
[Step 10]
The input attribute condition list
入力属性条件一覧グラフ(図7)の横軸には、第2の入力属性条件決定部19で決定された各入力属性条件(表7の各入力属性条件)が示されている。この入力属性条件の並び順は、(1)不良品分離度(第2データ群分離度)の大きい順、(2)不良数(第2データ群DA2の個数:第2データ群該当数)の大きい順、および、(3)不良品分離度と不良数の双方を考慮した配点の高い順に並替えが可能である。ここで、「不良品分離度と不良数の双方を考慮した配点」とは、不良品分離度(第2データ群分離度)の大きい順に点数が高くなるように与えられた第1の配点と、不良数(第2データ群該当数)の大きい順に点数が高くなるように与えられた第2の配点との合計点である。
The horizontal axis of the input attribute condition list graph (FIG. 7) shows each input attribute condition (each input attribute condition in Table 7) determined by the second input attribute
図8〜図10は、それぞれ、(1)不良品分離度の大きい順、(2)不良数の大きい順、および、(3)不良品分離度と不良数の双方を考慮した配点の高い順に、横軸(入力属性条件)を並べ替えた、入力属性条件一覧グラフを示している。以下に、上記(1)〜(3)の並び順の意味合いを説明する。 8 to 10 are respectively (1) in order of increasing defective product separation, (2) in order of increasing number of defects, and (3) in order of increasing score considering both the degree of defective product separation and the number of defects. The horizontal axis (input attribute conditions) is rearranged, and the input attribute condition list graph is shown. Hereinafter, the meaning of the order of the above (1) to (3) will be described.
(1)不良品分離度(第2データ群分離度)の大きい順
良品と分離して、高い確度で不良を減じることを分析の目的とする場合には、不良品分離度を重視する。ユーザは、不良品分離度の大きい入力属性条件から順に対策を施すことにより、極力良品を落とさずに、高い確度で不良を解消することができる。但し、不良品分離度の大きい入力属性条件において、不良数も大きいとは限らず(決定的な不良要因であるが、その発生頻度が低い場合など)、場合によっては、対策を施しても、不良全体のうちの一部しか解消されない恐れがある。
(1) When the purpose of analysis is to separate defective products with high accuracy by separating them from good products having a large defective product separation degree (second data group separation degree), importance is attached to the defective product separation degree. The user can resolve the defect with high accuracy without dropping the non-defective product as much as possible by taking countermeasures in order from the input attribute condition having a large degree of defective product separation. However, in the input attribute condition with a large degree of defective product separation, the number of defects is not necessarily large (if it is a decisive failure factor but its frequency of occurrence is low), and even if measures are taken, There is a risk that only a part of the whole defect is resolved.
(2)不良数(第2データ群該当数)の大きい順
現在発生している不良を、なるべく多く減じることを分析の目的とする場合には、不良数を重視する。ユーザは、不良数の大きい入力属性条件から順に対策を施すことにより、現在発生している不良の多くを解消することができる。但し、不良数の大きい入力属性条件において、不良品分離度も大きいとは限らず(発生頻度は高いが、必ずしも決定的な不良要因でない場合など)、場合によっては、対策によって、不良の解消と同時に良品も落としてしまう恐れがある。
(2) In order of increasing number of defects (corresponding to the number of second data group) When the purpose of analysis is to reduce the number of defects currently occurring as much as possible, the number of defects is emphasized. The user can resolve many of the currently occurring defects by taking countermeasures in order from the input attribute condition with the largest number of defects. However, in the case of input attribute conditions with a large number of defects, the degree of defective product separation is not necessarily large (when the frequency of occurrence is high, but not necessarily a decisive factor of failure). At the same time, there is a risk of dropping good products.
(3)不良品分離度と不良数の双方を考慮した配点の高い順
不良品分離度と不良数の双方を考慮し、総合的に見て、高い確度で多くの不良を減じることを目的とする場合には、「不良品分離度と不良数の双方を考慮した配点」を重視する。ユーザは、この配点の高い順に対策を施すことにより、高い確度で、しかも多くの不良を解消することができる。但し、この対策により「良品を落とさずに、不良を解消する」効果は(1)に比べて劣り、「不良の多くを解消する」効果は(2)に比べて劣っている。
(3) High order of distribution considering both the degree of defective product separation and the number of defectives The purpose is to reduce many defects with high accuracy, considering both the degree of defective product separation and the number of defective products. In this case, the emphasis is on “scoring considering both the degree of defective product separation and the number of defects”. The user can resolve many defects with high accuracy by taking measures in descending order of the score. However, the effect of “resolving defects without dropping good products” by this measure is inferior to (1), and the effect of “removing many defects” is inferior to (2).
ユーザは、分析の目的に応じて、図7中の「項目並べ替え」ボタンを操作して、上記(1)〜(3)の何れかの並び順を選択し、入力属性条件の並び順を変更する。そして、この並び順に、後述する(ステップ11の)レビューグラフを作成し、技術的な考察を加えて、分析結果をレビューする。すなわち、入力属性条件一覧グラフ(図7〜図10)は、分析結果レビューの暫定的な順番をユーザに知らせる、ナビゲーションの働きをするものである。 The user operates the “item rearrangement” button in FIG. 7 according to the purpose of analysis, selects one of the above-mentioned (1) to (3), and changes the order of input attribute conditions. change. Then, a review graph (in step 11), which will be described later, is created in this order of arrangement, and technical analysis is added to review the analysis results. In other words, the input attribute condition list graphs (FIGS. 7 to 10) serve as a navigation that informs the user of the provisional order of the analysis result review.
入力属性条件一覧グラフ作成部20が、入力属性条件をユーザの選択した並び順((1)〜(3)のいずれか)にしたがって並べる処理は、以下のように、順位決定部23を用いて行なわれる。
The input attribute condition list
まず、分析の目的に応じて、ユーザが、上記3種の並び順(1)〜(3)のうち、どの並び順を採用するかをデータ分析装置に指示する。これに応答して、順位決定部23が、指示された並び順に対応した入力属性条件の優先順位付けを行う。すなわち、順位決定部23が、第2の入力属性条件決定部19が問題事象の要因として決定した各入力属性条件(第2の入力属性条件一覧テーブル(表7)の各入力属性条件)に対して、問題事象の要因(不良品の第2データ群DA2に対応する出力属性条件が発生する要因)としての重要度(優先度)による順位付け、すなわち問題事象を解消するための対策を施す上で優先すべき順序(優先順位)を付ける(優先順位付けを行う)。次いで、入力属性条件一覧グラフ作成部20が、順位決定部23による順位付けの結果にしたがって入力属性条件を並べた入力属性条件一覧グラフを作成する。
First, according to the purpose of analysis, the user instructs the data analysis apparatus which one of the three types of arrangement orders (1) to (3) is to be adopted. In response to this, the
なお、ここでは、入力属性条件一覧グラフにおける入力属性条件の並び順が、3種の並び順(1)〜(3)から選択可能となっていたが、これら3種のうちの2種の並び順から選択可能となってもよく、選択不能となっていてもよい。ただし、3種の並び順(1)〜(3)から選択可能であることが、分析の目的に応じた入力属性条件の選択をユーザが容易に行うことができる点で好ましい。 Here, the arrangement order of the input attribute conditions in the input attribute condition list graph can be selected from the three arrangement orders (1) to (3), but two of these three arrangements are arranged. It may be selectable from the order or may not be selectable. However, it is preferable that the selection can be made from the three types of arrangement orders (1) to (3) in that the user can easily select the input attribute condition according to the purpose of the analysis.
また、ここでは、入力属性条件一覧グラフ作成部20が、順位決定部23による順位付けの結果を入力属性条件一覧グラフにおける入力属性条件の並び順としてユーザに示すようになっていたが、入力属性条件一覧グラフ作成部20は、順位決定部23による順位付けの結果を他の形態でユーザに示すものであってもよい。例えば、入力属性条件一覧グラフ作成部20は、単に入力属性条件の一覧を示す入力属性条件一覧グラフを作成すると共に、順位決定部23により決定された各入力属性条件の優先順位を入力属性条件一覧グラフ内に示すものであってもよい。
Here, the input attribute condition list
[ステップ11]
入力属性条件一覧グラフに示された複数の入力属性条件の並び順(優先順位)を参考にして、ユーザが、入力属性条件一覧グラフに示された複数の入力属性条件の中から特定の入力属性条件を選択する選択操作、および、レビューグラフ描画指示を行う。
ユーザによる選択操作は、入力属性条件一覧グラフ(図7〜図10)の表示画面上での入力デバイス31による操作、例えば、入力属性条件一覧グラフの表示画面上における特定の入力属性条件を示す文字の領域を入力デバイス31としてのポインティングデバイス(マウス等)で指示(ポインティング)する操作によって行われる。また、この場合、ユーザによるレビューグラフ描画指示は、入力属性条件一覧グラフの表示画面上での入力デバイス31による操作、例えば、入力属性条件一覧グラフの表示画面上に表示されたレビューグラフ作成用のボタンを入力デバイス31としてのポインティングデバイス(マウス等)で指示(ポインティング)する操作によって行われる。なお、ユーザによる選択操作やレビューグラフ描画指示は、入力属性条件一覧グラフの表示画面上での操作以外の操作、例えば入力デバイス31としてのキーボードによる特定の文字を入力する操作によって行うことも可能であるが、入力属性条件一覧グラフの表示画面上での入力デバイス31による操作によって行えるようになっている方が、ユーザによる操作が容易である点で好ましい。なお、後述する特定の2つ以上の入力属性条件を選択する操作も、上述した操作により行うことができる。
[Step 11]
Referring to the order (priority order) of multiple input attribute conditions shown in the input attribute condition list graph, the user can select a specific input attribute from the multiple input attribute conditions shown in the input attribute condition list graph. A selection operation for selecting a condition and a review graph drawing instruction are performed.
The selection operation by the user is an operation by the
そして、この選択操作およびレビューグラフ描画指示に応答して、レビューグラフ作成部21が、上記選択された入力属性条件を特定の入力属性条件として取得し、この取得した特定の入力属性条件を満たすデータ群と、第2データ群との対応関係を視覚的に表すレビューグラフを作成する。
Then, in response to the selection operation and the review graph drawing instruction, the review
基本データ群を構成する前記データの各々がそれぞれ複数のグループのいずれかに属している場合には、レビューグラフ作成部21は、上記選択操作およびレビューグラフ描画指示に応答して、前記複数のグループの各々の単位で、該グループに属する前記入力属性および出力属性の値を平均化したデータ群を表す第2の基本データ群を作成し、上記選択された入力属性条件を特定の入力属性条件として取得し、第2の基本データ群のうちで前記取得した特定の入力属性条件を満たすデータ群と、第2の基本データ群のうちで第2データ群に対応する出力属性条件を満たすデータ群との対応関係を視覚的に表すレビューグラフを作成する構成であってもよい。
When each of the data constituting the basic data group belongs to any of a plurality of groups, the review
なお、レビューグラフ作成部21が取得する上記特定の入力属性条件は、1つに限らず複数であってもよい。取得する入力属性条件が複数の場合には、レビューグラフ作成部21は、取得した入力属性条件の数に相当するだけのレビューグラフを作成し、これら一覧のグラフや、ページ方式で格納されたグラフ群などとして、レビューグラフを出力する。
The specific input attribute condition acquired by the review
また、レビューグラフ作成部21が、上記レビューグラフを作成するために特定の入力属性条件を取得する方法は、上記ユーザによる選択操作に限らず、コンピュータによる自動選択であってもよい。例えば、コンピュータが、不良品分離度の大きい順の上位の所定数の入力属性条件を自動選択したり、入力属性条件一覧グラフに示された全ての入力属性条件を自動選択するようになっていても良い。
In addition, the method in which the review
また、レビューグラフ作成部21へのレビューグラフ描画指示は、上記ユーザによる描画指示に限らず、予め設定された内容に基づく、コンピュータからの指示であってもよい。
Further, the review graph drawing instruction to the review
レビューグラフ作成部21が作成するレビューグラフは、例えば、図11に示すように、(1)トレンドグラフ(第1のレビューグラフ)、(2)マップ(第2のレビューグラフ)、(3)散布図(第3のレビューグラフ)、および、(4)度数分布図(第4のレビューグラフ)の4種である。
以下、不良品分離度(第2データ群分離度)の大きい順に並べた、入力属性条件一覧グラフ(図8)に基づく、分析結果のレビュー方法と併せて、上記(1)〜(4)のレビューグラフについて説明する。
The review graph created by the review
Hereinafter, in conjunction with the analysis result review method based on the input attribute condition list graph (FIG. 8) arranged in descending order of defective product separation (second data group separation), the above (1) to (4) The review graph will be described.
なお、(1)〜(4)のレビューグラフは、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上におけるレビューグラフ作成用のボタン(「トレンド/マップ/散布図」ボタンおよび「度数分布図」ボタン)のいずれか1つを入力デバイス31としてのポインティングデバイスで操作することに応答して、レビューグラフ作成部21によって作成される。
Note that the review graphs (1) to (4) include, for example, a button for creating a review graph on the display screen of the input attribute condition list graph (FIG. 8) (“trend / map / scatter diagram” button and In response to operating any one of the “frequency distribution map” buttons) with the pointing device as the
(1)トレンドグラフ(第1のレビューグラフ)
レビューグラフ作成部21は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から特定の入力属性条件を選択し、トレンドグラフ描画指示を行ったことに応答して、前記レビューグラフとして第1のレビューグラフを作成する。この第1のレビューグラフは、ユーザによって選択された特定の入力属性条件に対応する入力属性の時間変化を示す第1のトレンドグラフと、前記出力属性の時間変化を示す第2のトレンドグラフとを共に示している。また、第1のトレンドグラフにおいては、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている。
(1) Trend graph (first review graph)
The review
レビューグラフ作成部21は、例えば、ユーザが、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が上位6位以内の入力属性条件(入力属性6≦2.00、入力属性2≦2.01、入力属性7>1.15、入力属性8>10.7、入力属性3>2.00、入力属性4>2.03)を選択し、トレンドグラフ描画指示を行ったことに応答して、図12に示すトレンドグラフを作成し、トレンドグラフを表示装置32へ出力して表示装置32の画面上にトレンドグラフを描画する。トレンドグラフ描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「トレンド/マップ/散布図」ボタンを入力デバイス31としてのポインティングデバイスで操作した後、さらに「トレンド」を入力デバイス31で選択することによって行われる。
For example, the review
図12のトレンドグラフでは、選択された6個の入力属性条件に対応する各入力属性(入力属性6、入力属性2、入力属性7、入力属性8、入力属性3、入力属性4)の時間変化を示す第1のトレンドグラフと、出力属性の時間変化を示す第2のトレンドグラフとが並べて表示されている。なお、図12のトレンドグラフでは、第2のトレンドグラフを第1のトレンドグラフと並べて表示しているが、第2のトレンドグラフを、第1のトレンドグラフと違う色で第1のトレンドグラフと重ねて表示してもよい。これらのグラフでは、同一基板内の各素子の「入力属性」、または、「出力属性」の値の平均値が、基板毎に示されている。横軸は基板番号を示しているが、本例においては、この並び順は、素子(基板)の製造順番と対応している。
In the trend graph of FIG. 12, the time change of each input attribute (
ここで、各入力属性のトレンドグラフ(第1のトレンドグラフ)のそれぞれにおいて、当該入力属性の入力属性条件を満たし、かつ、不良品の第2データ群DA2に対応する出力属性条件を満たすデータには、赤色(図面上では白抜き)のマーキング処理が施されている。また、出力属性のトレンドグラフ(第2のトレンドグラフ)では、不良品の第2データ群DA2に対応する出力属性条件を満たすデータに赤色(図面上では白抜き)のマーキング処理が施されている。すなわち、図12のトレンドグラフでは、不良品の第2データ群DA2と、その要因として抽出された入力属性条件を満たすデータ群との対応関係が、視覚的に強調して表されている。 Here, in each trend graph (first trend graph) of each input attribute, the data satisfying the input attribute condition of the input attribute and satisfying the output attribute condition corresponding to the second data group DA2 of the defective product. Is subjected to a red marking process (white on the drawing). In the output attribute trend graph (second trend graph), data that satisfies the output attribute condition corresponding to the second data group DA2 of the defective product is subjected to red marking (outlined in the drawing). . That is, in the trend graph of FIG. 12, the correspondence between the defective second data group DA2 and the data group that satisfies the input attribute condition extracted as the factor is visually highlighted.
したがって、図12のトレンドグラフを参照することにより、ユーザは、第2の入力属性決定部19(入力属性条件決定部100)が決定した不良要因(入力属性条件)に対して、その基板毎推移(時間的変化)における出力属性との同期性を即座に理解することができる。具体的には、図12の期間AとBには、入力属性6と入力属性2とが低い条件(「入力属性6≦2.00」という入力属性条件、および「入力属性2≦2.01」という入力属性条件)に起因する不良(「出力属性」>2.5)が、期間Cには入力属性7が高い条件(「入力属性7>1.15」という入力属性条件)に起因する不良が、また、期間Dには入力属性4が高い条件(「入力属性4>2.03」という入力属性条件)に起因する不良が、それぞれ主体になっていることが分かる。また、全期間を通したミクロ的な出力属性の変化(丸で囲んだ部分)が、入力属性3が高い条件(「入力属性3>2.00」という入力属性条件)の影響であることが分かる。一方、入力属性8については、出力属性との明確な相関が見られないが、この点については、後述のマップ(図13)の説明で明らかになる。
Therefore, by referring to the trend graph of FIG. 12, the user can change the failure factor (input attribute condition) determined by the second input attribute determining unit 19 (input attribute condition determining unit 100) for each board. It is possible to immediately understand the synchrony with the output attribute in (time change). Specifically, in the periods A and B in FIG. 12, the condition that the
なお、上記トレンドグラフの横軸には、基板番号やロット番号などを用い、その番号の若いものから順番に並べることもできる。また、上記トレンドグラフの横軸に、素子を製造または検査する、ある特定の工程での処理日時を用い、この処理日時の古いものから順番に並べることも可能である。すなわち、各データに対応する判別キー(基板番号やロット番号、処理日時など)を基準とした並びとすることができる。本発明では、上記のような判別キーを基準とした並びを横軸としたグラフをトレンドグラフと呼んでいる。 It should be noted that the horizontal axis of the trend graph can be arranged in order from the smallest number using a substrate number or a lot number. Moreover, it is also possible to arrange the trend graph in order from the oldest processing date and time using the processing date and time in a specific process for manufacturing or inspecting elements on the horizontal axis of the trend graph. That is, it can be arranged with reference to a discrimination key (substrate number, lot number, processing date and time) corresponding to each data. In the present invention, a graph with the horizontal axis representing the arrangement based on the discrimination keys as described above is called a trend graph.
なお、上記では、表1の基本データ群を分析対象とし、その各データが素子番号単位(すなわち、各素子が、特定の基板番号と、特定の素子座標番号の双方に属する)のものであったため、同一基板内の各素子の「入力属性」または「出力属性」の値の平均値を用いてトレンドグラフを作成していたが、各データが基板単位のものであれば、上記平均値を用いる必要はない。 In the above, the basic data group in Table 1 is an analysis target, and each piece of data is an element number unit (that is, each element belongs to both a specific board number and a specific element coordinate number). Therefore, the trend graph was created using the average value of the “input attribute” or “output attribute” value of each element on the same board. There is no need to use it.
(2)マップ(第2のレビューグラフ)
レビューグラフ作成部21は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から特定の入力属性条件を選択し、マップ描画指示を行ったことに応答して、前記レビューグラフとして第2のレビューグラフを作成する。この第2のレビューグラフは、前記選択された特定の入力属性条件に対応する入力属性の面内分布を表す第1のマップと、前記出力属性の面内分布を表す第2のマップとを共に示している。また、第1のマップにおいては、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている。
(2) Map (second review graph)
For example, the review
なお、上記のマップ(第2のレビューグラフ)は、基板面内の位置(素子座標番号)を判別キーとし、この判別キー毎の入力属性および出力属性の変化を表すグラフである。 The above map (second review graph) is a graph representing changes in input attributes and output attributes for each discrimination key, using the position (element coordinate number) in the substrate surface as the discrimination key.
レビューグラフ作成部21は、例えば、ユーザが、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が上位6位以内の6つの入力属性条件の中から代表的な2つの入力属性条件(入力属性6≦2.00、入力属性8>10.7)を選択し、マップ描画指示を行ったことに応答して、図13に示すマップを作成し、マップを表示装置32へ出力して表示装置32の画面上で描画する。マップ描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「トレンド/マップ/散布図」ボタンを入力デバイス31としてのポインティングデバイスで操作した後、さらに「マップ」を入力デバイス31で選択することによって行われる。
For example, the review
図13のマップでは、選択された2個の入力属性条件に対応する各入力属性(入力属性6、入力属性8)の面内分布(基板上の位置による変化)を表す第1のマップと、出力属性の面内分布を表す第2のマップとが並べて表示されており、これらのマップでは、同一の「素子座標番号」にある各素子の「入力属性」、または、「出力属性」の値の平均値が、素子座標位置毎に色付けをして示されている。具体的には、出力属性のマップ(第2のマップ)において、出力属性の平均値が不良品の条件(「出力属性」>2.5)に対応する座標位置が赤色(図面上では網掛けのハッチングで示す)で示され、他の座標位置が緑色(図面上では斜線のハッチングで示す)で示されている。この例では、座標位置P1およびP2における出力属性の平均値が2.71、座標位置P3における出力属性の平均値が2.46、座標位置P4およびP5における出力属性の平均値が2.22であるので、座標位置P1およびP2が赤色(図面上では網掛けのハッチングで示す)で示されている。各入力属性のマップ(第1のマップ)において、その座標位置に対応する各素子の入力属性の平均値が入力属性条件(入力属性6≦2.00、入力属性8>10.7)を満たす座標位置は、赤色(図面上では網掛けのハッチングで示す)で示されている一方、その座標位置に対応する各素子の入力属性の平均値が入力属性条件を満たさない座標位置は、緑色(図面上では斜線のハッチングで示す)で示されている。この例では、座標位置P1〜P5における入力属性6の平均値が全て1.96(≦2.00)であるので、入力属性6に関する第1のマップでは、座標位置P1〜P5が赤色(図面上では網掛けのハッチングで示す)で示されている。また、この例では、座標位置P1およびP2における入力属性8の平均値がともに11.5、座標位置P3における入力属性8の平均値が10.5、座標位置P4における入力属性8の平均値が9.52、座標位置P5における入力属性8の平均値が9.51であるので、入力属性6に関する第1のマップでは、座標位置P1およびP2が赤色(図面上では網掛けのハッチングで示す)で示されている。
In the map of FIG. 13, a first map representing an in-plane distribution (change due to position on the substrate) of each input attribute (
ここで、各入力属性の面内分布を表す2つの第1のマップのそれぞれにおいて、当該入力属性の入力属性条件を満たし、かつ、不良品の第2データ群DA2に対応する出力属性条件を満たすデータには、赤枠(図面上では黒枠)のマーキング処理が施されている。すなわち、図13のマップでは、不良品の第2データ群DA2と、その要因として抽出された入力属性条件を満たすデータ群との対応関係が、視覚的に強調して表されている。
したがって、図13のマップを参照することにより、ユーザは、第2の入力属性決定部19(入力属性条件決定部100)が決定した不良要因(入力属性条件)に対して、その面内傾向における出力属性との同期性を即座に理解することができる。具体的には、図13における素子座標番号1,2の不良(「出力属性」>2.5)が、主に、入力属性8の高めに起因していることが分かる。一方、入力属性6については、出力属性との明確な相関が見られない。この結果を、トレンドグラフ(図12)と併せて考察すると、入力属性6が基板の一枚毎の単位で出力属性に影響を及ぼす因子であるのに対し、入力属性8は、基板内の面内分布として出力属性に影響を及ぼす因子であることが分かる。
Here, in each of the two first maps representing the in-plane distribution of each input attribute, the input attribute condition of the input attribute is satisfied, and the output attribute condition corresponding to the second data group DA2 of the defective product is satisfied. The data is marked with a red frame (black frame in the drawing). That is, in the map of FIG. 13, the correspondence between the second data group DA2 of defective products and the data group that satisfies the input attribute condition extracted as the factor is visually emphasized.
Therefore, by referring to the map of FIG. 13, the user can determine the failure factor (input attribute condition) determined by the second input attribute determination unit 19 (input attribute condition determination unit 100) in the in-plane tendency. Immediate understanding of synchrony with output attributes. Specifically, it can be seen that the defect of the element coordinate
なお、上記では、表1の基本データ群を分析対象とし、その各データが素子番号単位(すなわち、各素子が、特定の基板番号と、特定の素子座標番号の双方に属する)のものであったため、同一の「素子座標番号」にある各素子の「入力属性」または「出力属性」の値の平均値を用いてマップを作成していたが、各データが素子座標番号単位のものであれば、上記平均値を用いる必要はない。 In the above, the basic data group in Table 1 is an analysis target, and each piece of data is an element number unit (that is, each element belongs to both a specific board number and a specific element coordinate number). Therefore, a map was created using the average value of the “input attribute” or “output attribute” value of each element in the same “element coordinate number”. For example, it is not necessary to use the average value.
(3)散布図(第3のレビューグラフ)
レビューグラフ作成部21は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から特定の入力属性条件を選択し、散布図描画指示を行ったことに応答して、前記レビューグラフとして第3のレビューグラフを作成する。この第3のレビューグラフは、前記選択された特定の入力属性条件に対応する入力属性と、前記出力属性との関係を示す散布図である。また、この散布図においては、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている。
(3) Scatter chart (third review graph)
In response to the user selecting a specific input attribute condition from the input attribute conditions shown in the input attribute condition list graph and giving a scatter diagram drawing instruction, for example, the review graph creation unit 21 A third review graph is created as a review graph. The third review graph is a scatter diagram showing the relationship between the input attribute corresponding to the selected specific input attribute condition and the output attribute. In this scatter diagram, marking processing is applied to data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the second data group.
レビューグラフ作成部21は、例えば、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が1位の入力属性条件(入力属性6≦2.00)をユーザが選択し、散布図描画指示を行ったことに応答して、選択された入力属性条件に対応する入力属性(入力属性6)と、出力属性との関係を示す散布図を作成し、散布図を表示装置32へ出力して、表示装置32の画面上に散布図を描画する。散布図描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「トレンド/マップ/散布図」ボタンを入力デバイス31としてのポインティングデバイスで操作した後、さらに「散布図」を入力デバイス31で選択することによって行われる。
For example, the review
上記散布図において、各データは、「○」で示される。ここで、上記散布図において、その横軸とした入力属性に対応する入力属性条件を満たし、かつ、不良品の第2データ群DA2に対応する出力属性条件を満たすデータには、赤色(図面上ではグレー)のマーキング処理が施されている(すなわち、入力属性条件を満たし、かつ、不良品の第2データ群DA2に対応する出力属性条件を満たすデータは、赤のドット(図面上ではグレーのドット)で示される)。すなわち、図14の散布図では、不良品の第2データ群DA2と、その要因として抽出された入力属性条件を満たすデータ群との対応関係が、視覚的に強調して表されている。 In the scatter diagram, each data is indicated by “◯”. Here, in the above scatter diagram, the data that satisfies the input attribute condition corresponding to the input attribute on the horizontal axis and that satisfies the output attribute condition corresponding to the second data group DA2 of the defective product is red (on the drawing). (In gray) marking processing is performed (that is, data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the defective second data group DA2 is represented by a red dot (gray in the drawing). Indicated by a dot). That is, in the scatter diagram of FIG. 14, the correspondence between the defective second data group DA2 and the data group that satisfies the input attribute condition extracted as the factor is visually emphasized.
したがって、図14の散布図を参照することにより、ユーザは、第2の入力属性条件決定部19(入力属性条件決定部100)が決定した不良要因(入力属性条件)に対して、多値的に見た出力属性との相関を、即座に理解することができる。具体的には、入力属性6の低い条件(入力属性6≦2.00)が、多値的に見ても、不良(「出力属性」>2.5)に影響していることを、直感的に理解できる。
Therefore, by referring to the scatter diagram of FIG. 14, the user can evaluate the failure factor (input attribute condition) determined by the second input attribute condition determination unit 19 (input attribute condition determination unit 100) in a multivalued manner. You can immediately understand the correlation with the output attributes. Specifically, it is intuitive that the low condition of the input attribute 6 (
なお、レビューグラフ作成部21は、ユーザが、散布図の軸に対応する入力属性条件とは異なる他の入力属性条件による系列分けを指示したことに応答して、該他の入力属性条件を満たすデータと、該他の入力属性条件を満たさないデータとを異なる形態で散布図に示すことも可能である。この場合、ユーザは、上記散布図の描画指示の段階で、散布図の軸として特定の入力属性条件を選択する選択操作、および、散布図描画指示を行うと共に、その入力属性条件とは異なる他の入力属性条件による系列分けを指示すればよい。図15は、図14の散布図の描画指示の段階で、入力属性7>1.15による系列分けを指示した結果である。図15では、他の入力属性条件「入力属性7>1.15」を満たすデータが「×」で示される一方、他の入力属性条件「入力属性7>1.15」を満たさないデータが「○」で示される。この結果を参照することにより、入力属性7>1.15(図中の×印)が、入力属性6とは独立的に不良の要因となっていることが分かるとともに、この影響を除いたデータ(入力属性7≦1.15)において、入力属性6と出力属性の関係が、より顕著に確認できる。
The review
(4)度数分布図(第4のレビューグラフ)
レビューグラフ作成部21は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から特定の入力属性条件を選択し、度数分布図描画指示を行ったことに応答して、前記基本データ群を、前記選択された特定の入力属性条件を満たすデータ群と、該入力属性条件を満たさないデータ群とに分離し、前記データ群の各々における、前記出力属性の度数分布を示す第4のレビューグラフを前記レビューグラフとして作成する。
(4) Frequency distribution chart (fourth review graph)
In response to the user selecting a specific input attribute condition from the input attribute conditions shown in the input attribute condition list graph and instructing a frequency distribution diagram, for example, The basic data group is separated into a data group that satisfies the selected specific input attribute condition and a data group that does not satisfy the input attribute condition, and shows the frequency distribution of the output attribute in each of the data groups A fourth review graph is created as the review graph.
レビューグラフ作成部21は、例えば、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が1位の入力属性条件(入力属性6≦2.00)をユーザが選択し、度数分布図描画指示を行ったことに応答して、図16に示す度数分布図を作成し、度数分布図を表示装置32へ出力して表示装置32の画面上に度数分布図を描画する。度数分布図描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「度数分布」ボタンを入力デバイス31としてのポインティングデバイスで選択することによって行われる。なお、度数分布図は、図16では折れ線グラフであるが、横軸の区間毎の頻度を区間幅の棒で表す棒グラフ、すなわち、いわゆるヒストグラムであってもよい。
For example, the review
図16の度数分布図は、基本データ群DA00を、選択された入力属性条件(入力属性6≦2.00)を満たすデータ群と、該入力属性条件を満たさない(入力属性6>2.00を満たす)データ群とに分離したときの、各々のデータ群における出力属性の度数分布を示している。また、図中には、基本データ群を、良品の第1データ群DA1と不良品の第2データ群DA2とに分類した際の出力属性の閾値(2.5)が示されている。すなわち、図16の度数分布図は、不良品の第2データ群DA2と、その要因として抽出された入力属性条件を満たすデータ群との対応関係、および、良品の第1データ群DA1と入力属性条件を満たさないデータ群との対応関係、を表している。
In the frequency distribution diagram of FIG. 16, the basic data group DA00 is divided into a data group that satisfies the selected input attribute condition (
図16の度数分布図を参照することにより、ユーザは、第2の入力属性決定部19(入力属性条件決定部100)が決定した不良要因(入力属性条件)と、その排他的条件とによる、良品と不良品の切分けの程度を、直感的に理解することができる。 By referring to the frequency distribution diagram of FIG. 16, the user can determine the failure factor (input attribute condition) determined by the second input attribute determination unit 19 (input attribute condition determination unit 100) and the exclusive condition. You can intuitively understand the degree of separation between good and defective products.
[ステップ12]
上記のレビューグラフ(図12〜図16)は、主に、入力属性条件一覧グラフ(図7〜図10)の個々の入力属性条件と、出力属性との関係をレビューするものであった。しかし、複数の入力属性条件が互いに交絡したり、主従の関係にあるような場合には、複数の入力属性条件が交絡した条件に基づく分析結果の評価が必要になる。そこで、複合要因グラフ作成部22によって複合要因グラフを作成し、この複合要因グラフを用いて、複数の入力属性条件が交絡した条件に基づく分析結果の評価を行う。
[Step 12]
The review graphs (FIGS. 12 to 16) mainly review the relationship between the individual input attribute conditions of the input attribute condition list graphs (FIGS. 7 to 10) and the output attributes. However, when a plurality of input attribute conditions are entangled with each other or in a master-slave relationship, it is necessary to evaluate an analysis result based on a condition in which a plurality of input attribute conditions are entangled. Therefore, a composite factor graph is created by the composite factor
複合要因グラフ作成部22は、ユーザが、入力属性条件一覧グラフ(図7〜図10)の画面上で、特定の入力属性条件を選択する選択操作、および、グラフ描画指示を行うことに応答して、上記選択された入力属性条件を含む複数の入力属性条件を、特定の2つ以上の入力属性条件として取得し、この取得した特定の2つ以上の入力属性条件が交絡した条件に基づく複合要因グラフを作成する。
The composite factor
なお、複合要因グラフ作成部22が、上記複合要因グラフを作成するために特定の入力属性条件を取得する方法は、上記ユーザによる選択操作に限らず、コンピュータによる自動選択であってもよい。例えば、コンピュータが、不良品分離度の大きい順の上位の所定数の入力属性条件を自動選択したり、入力属性条件一覧グラフに示された入力属性条件の中から所定数の入力属性条件の組合せの全てを、自動選択するようになっていても良い。
Note that the method by which the composite factor
また、複合要因グラフ作成部22へのグラフ描画指示は、上記ユーザによる描画指示に限らず、予め設定された内容に基づく、コンピュータからの指示であってもよい。
Further, the graph drawing instruction to the composite factor
複合要因グラフ作成部22が作成する複合要因グラフは、例えば、図11に示すように、(5)複合要因パレート図(第1の複合要因グラフ)、(6)要因積上げグラフ(第2の複合要因グラフ)、および、(7)ベストケース/ワーストケース度数分布図(第3の複合要因グラフ)の3種である。以下、不良品分離度(第2データ群分離度)の大きい順に並べた、入力属性条件一覧グラフ(図8)に基づく、交絡条件の評価方法と併せて、上記(5)〜(7)の複合要因グラフについて説明する。なお、(5)〜(7)の複合要因グラフは、例えば、ユーザが、入力属性条件一覧グラフ(図8)の画面上の「複合要因分析」ボタンや「要因積上げグラフ」ボタンを操作することに応答して、複合要因グラフ作成部22によって作成される。
The complex factor graph created by the complex factor
(5)複合要因パレート図(第1の複合要因グラフ)
複合要因グラフ作成部22は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から特定の入力属性条件を選択し、複合要因パレート図描画指示を行ったことに応答して、特定の2つの入力属性条件を取得し、前記複合要因グラフとして第1の複合要因グラフを作成する。この第1の複合要因グラフは、基本データ群中で、上記2つの入力属性条件をともに満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果、および、基本データ群中で、前記2つの入力属性条件のうちの一方の条件のみを満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果が、それぞれ示されている複合要因パレート図である。
(5) Composite factor Pareto chart (first composite factor graph)
For example, the composite factor
複合要因グラフ作成部22は、例えば、ユーザが、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が1位の入力属性条件(入力属性6≦2.00)をキー条件として選択し、複合要因パレート図の描画指示を行ったことに応答して、図17に示す複合要因グラフを作成し、該複合要因グラフを表示装置32へ出力して、表示装置32の画面上に複合要因グラフを描画する。複合要因パレート図の描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「複合要因分析」ボタンを入力デバイス31としてのポインティングデバイスで操作した後、さらに「複合要因パレート図」を入力デバイス31で選択することによって行われる。
For example, the composite factor
図17の複合要因パレート図は、図8の各入力属性条件に対して、キー条件(入力属性6≦2.00)と重複する不良(図中のピンク色(図面中では斜線で示す)の棒)と、キー条件(入力属性6≦2.00)と重複しない不良(図中のグレー色(図面中では斜線なしで示す)の棒)とに分けて、不良数(棒グラフ)を示したものである。なお、キー条件の不良数は、赤色(図面中では網掛けで示す)の棒で示している。ここで、キー条件と重複する不良数は、キー条件を含む2つの入力属性条件をともに満たし、かつ、第2データ群に該当するデータの個数を表し、キー条件と重複しない不良数は、2つの入力属性条件のうちの一方の条件(キー条件でない条件)のみを満たし、かつ、第2データ群に該当するデータの個数を表している。図17の複合要因パレート図には、不良品分離度が折れ線グラフで示されている。なお、不良品分離度の折れ線グラフは省略してもよい。
The complex factor Pareto diagram in FIG. 17 shows that each input attribute condition in FIG. 8 is defective (indicated by hatching in the drawing) that overlaps with the key condition (
なお、図17の複合要因パレート図を作成する場合に、複合要因グラフ作成部22が取得する上記特定の2つの入力属性条件とは、その一つを上記キー条件(入力属性6≦2.00)とし、もう一つをキー条件以外の各入力属性条件のそれぞれとした、複数組のものとなる。
Note that when creating the complex factor Pareto diagram of FIG. 17, one of the two specific input attribute conditions acquired by the complex factor
図17の複合要因パレート図を参照することにより、ユーザは、第2の入力属性決定部19(入力属性条件決定部100)が決定した不良要因(入力属性条件)の中で、キー条件(入力属性6≦2.00)との複合要因(または主従の関係にある要因)、および、キー条件(入力属性6≦2.00)とは独立の要因を探すことができる。具体的には、図17の入力属性2≦2.01に起因する不良は、キー条件(入力属性6≦2.00)の不良の大半を含んでおり、キー条件(入力属性6≦2.00)に対して主従の関係にある要因であることが分かる。この結果は、図12のトレンドグラフにおいて、入力属性2と入力属性6とが連動して変化していることと対応する。
By referring to the complex factor Pareto diagram of FIG. 17, the user can select the key condition (input attribute) among the failure factors (input attribute conditions) determined by the second input attribute determining unit 19 (input attribute condition determining unit 100). It is possible to search for a factor independent of the complex factor (or the factor in the master-slave relationship) with the
一方、図17の入力属性7>1.15に起因する不良は、キー条件(入力属性6≦2.00)と重複しない不良の割合が比較的大きく、キー条件(入力属性6≦2.00)とは独立の要因となっていることが分かる。この結果は、図12のトレンドグラフにおいて、入力属性6(入力属性2)の低い(入力属性6≦2.00(入力属性2≦2.01))ことに起因する不良が、期間AとBに発生しているのに対して、入力属性7の高い(入力属性7>1.15)ことに起因する不良が、上記の期間A、Bとは異なる期間Cに発生していることと対応する。
On the other hand, the defect caused by the input attribute 7> 1.15 in FIG. 17 has a relatively large proportion of defects that do not overlap with the key condition (
なお、このように、複合要因パレート図(図17)は、上記トレンドグラフの結果とも対応するものであるから、まず複合要因パレート図を作成し、これを参照してレビューすべき入力属性条件の候補を挙げ、その後に、図12のトレンドグラフを作成するようにしても構わない。 Since the composite factor Pareto diagram (FIG. 17) corresponds to the result of the trend graph as described above, first, a composite factor Pareto diagram is created and the input attribute condition to be reviewed with reference to this is shown. The candidates may be listed and then the trend graph of FIG. 12 may be created.
(6)要因積上げグラフ(第2の複合要因グラフ)
入力属性条件一覧グラフ(図8)の並び順や、複合要因パレート図(図17)を参照してユーザが選定した複数の入力属性条件について、これら入力属性条件の妥当性を確認するために、すなわち、不良要因を漏れなく選定できているかを確認するために、複合要因グラフ作成部22が要因積上げグラフ(第2の複合要因グラフ)を作成する。
(6) Factor accumulation graph (second composite factor graph)
In order to confirm the validity of these input attribute conditions for a plurality of input attribute conditions selected by the user with reference to the arrangement order of the input attribute condition list graph (FIG. 8) and the composite factor Pareto diagram (FIG. 17), That is, in order to confirm whether the failure factor can be selected without omission, the complex factor
複合要因グラフ作成部22は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から、複数の入力属性条件を順位を付けて選択し、要因積上げグラフ描画指示を行ったことに応答して、上記選択された入力属性条件を順位を付けて取得し、前記複合要因グラフとして第2の複合要因グラフを作成する。この第2の複合要因グラフは、前記順位を付けて取得した入力属性条件の順位の順番に、基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を順次積算した要因積上げグラフである。
In the composite factor
なお、複合要因グラフ作成部22が、上記要因積上げグラフを作成するために特定の入力属性条件を取得する方法は、上記ユーザによる選択操作に限らず、コンピュータによる自動選択であってもよい。例えば、コンピュータが、不良品分離度の大きい順の上位の所定数の入力属性条件を、その順位の順番に、自動選択するようになっていても良い。
Note that the method by which the composite factor
複合要因グラフ作成部22は、例えば、ユーザが、複数の入力属性条件を、順位を付けて選択する選択操作、例えば、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が上位6位以内の6つの入力属性条件(入力属性6≦2.00、入力属性2≦2.01、入力属性7>1.15、入力属性8>10.7、入力属性3>2.00、入力属性4>2.03)を、その順番で選択し、グラフ描画指示を行うことに応答して、図18に示す要因積上げグラフを作成し、該要因積上げグラフを表示装置32へ出力して、表示装置32の画面上に要因積上げグラフを描画する。要因積上げグラフの描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「要因積上げグラフ」ボタンを入力デバイス31としてのポインティングデバイスで操作することによって行われる。図18の要因積上げグラフには、不良品分離度が折れ線グラフで示されている。なお、不良品分離度の折れ線グラフは省略してもよい。
For example, the composite factor
図18の要因積上げグラフにおいて、ある入力属性条件におけるピンク色(図面上では斜線で示す)の棒は、該入力属性条件の不良数のうち、それよりも左側の入力属性条件に起因する不良の、何れとも重複しない不良数で、これを入力属性条件毎に階段状に積上げて、複数の入力属性条件による総不良数を表現している。また、オレンジ色(図面上では斜線なしで示す)の棒は、それよりも左側の入力属性条件に起因する不良の何れかと重複する不良数を表している。 In the factor accumulation graph of FIG. 18, a pink bar (indicated by a diagonal line in the drawing) in a certain input attribute condition indicates a defect due to the input attribute condition on the left side of the number of defects in the input attribute condition. These are the number of defects that do not overlap with each other, and are stacked stepwise for each input attribute condition to express the total number of defects due to a plurality of input attribute conditions. An orange bar (shown without a diagonal line in the drawing) represents the number of defects that overlap with any of the defects caused by the input attribute condition on the left side.
図18の要因積上げグラフを参照することにより、ユーザは、選定した複数の入力属性条件の妥当性、すなわち、不良要因を漏れなく選定できているかを確認することができる。具体的には、ユーザが選定した上位3位の入力属性条件(入力属性6≦2.00、入力属性2≦2.01、入力属性7>1.15)が、総不良数の約8割を占めており、また、上位5位の入力属性条件(入力属性6≦2.00、入力属性2≦2.01、入力属性7>1.15、入力属性8>10.7、入力属性3>2.00)が、総不良数のほぼ全てを占めていることが分かる。
By referring to the factor accumulation graph of FIG. 18, the user can confirm the validity of the selected plurality of input attribute conditions, that is, whether the failure factor can be selected without omission. Specifically, the top three input attribute conditions selected by the user (
(7)ベストケース/ワーストケース度数分布図(第3の複合要因グラフ)
複合要因グラフ作成部22は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から、複数の入力属性条件を選択し、ベストケース/ワーストケース度数分布図描画指示を行ったことに応答して、上記選択された入力属性条件を取得し、前記複合要因グラフとして第3の複合要因グラフを作成する。この第3の複合要因グラフは、基本データ群の中から、上記取得した2つ以上の入力属性条件を全て満たすデータ群と、上記取得した2つ以上の入力属性条件の各々に対する排他的条件を全て満たすデータ群とをそれぞれ抽出し、前記データ群の各々における、出力属性の度数分布を示すベストケース/ワーストケース度数分布図である。
(7) Best case / worst case frequency distribution chart (third composite factor graph)
For example, the composite factor
なお、複合要因グラフ作成部22が、上記ベストケース/ワーストケース度数分布図を作成するために特定の入力属性条件を取得する方法は、上記ユーザによる選択操作に限らず、コンピュータによる自動選択であってもよい。例えば、コンピュータが、不良品分離度の大きい順の上位の所定数の入力属性条件を、自動選択するようになっていても良い。
Note that the method by which the composite factor
複合要因グラフ作成部22は、例えば、ユーザが、複数の入力属性条件を選択する選択操作、例えば、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が上位の代表的な2つの入力属性条件(入力属性6≦2.00、入力属性7>1.15)を選択し、ベストケース/ワーストケース度数分布図の描画指示を行ったことに応答して、図19に示すベストケース/ワーストケース度数分布図を作成し、該ベストケース/ワーストケース度数分布図を表示装置32へ出力して、表示装置32の画面上にベストケース/ワーストケース度数分布図を描画する。ベストケース/ワーストケース度数分布図の描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「複合要因分析」ボタンを入力デバイス31としてのポインティングデバイスで操作した後、さらに「ベストケース/ワーストケース度数分布図」を入力デバイス31で選択することによって行われる。なお、ベストケース/ワーストケース度数分布図は、図19では折れ線グラフであるが、横軸の区間毎の頻度を区間幅の棒で表す棒グラフ、すなわち、いわゆるヒストグラムであってもよい。
For example, the composite factor
図19のベストケース/ワーストケース度数分布図では、上記選択された複数の入力属性条件を全て満たすデータ群(入力属性6≦2.00、かつ、入力属性7>1.15:ワーストケースデータ群と呼ぶ)と、上記選択された複数の入力属性条件の各々に対する排他的条件を全て満たすデータ群(入力属性6>2.00、かつ、入力属性7≦1.15:ベストケース)とを基本データ群から抽出したときの、各々のデータ群における出力属性の度数分布図がそれぞれ描かれている。図19では、ベストケースの頻度を「ベストケース頻度」、ワーストケースの頻度を「ワーストケース頻度」と記している。また、図中には、基本データ群を、良品の第1データ群DA1と不良品の第2データ群DA2とに分類した際の出力属性の閾値(2.5)が示されている。すなわち、図19の度数分布図は、不良品の第2データ群DA2の要因として抽出された複数の入力属性条件の相互間の影響を強調して、示している。
In the best case / worst case frequency distribution diagram of FIG. 19, a data group satisfying all the selected input attribute conditions (input
図19のベストケース/ワーストケース度数分布図を参照することにより、ユーザは、着目した複数の入力属性条件の相互間の影響を、確認することができる。具体的には、入力属性6≦2.00かつ入力属性7>1.15なる条件は、入力属性6≦2.00が単独で作用している場合(図16)に比べて、出力属性の高い値の側に、よくまとまっていることを確認できる。
By referring to the best case / worst case frequency distribution diagram of FIG. 19, the user can confirm the influence between a plurality of input attribute conditions of interest. Specifically, the condition of the
上記のステップ11とステップ12が、ユーザの判断に基づき、適宜に繰り返され、さらに、ユーザによる技術的考察が加えられて、不良要因が最終的に特定される。
本実施形態によれば、データ分類部(分類手段)4が、基本データ群DA00を、不良品の第2データ群DA2と、良品の第1データ群DA1とに分類し、入力属性条件決定部100が、不良品の第2データ群DA2と、良品の第1データ群DA1とを切り分ける回帰木を作成する。そして、このとき、「不良品の第2データ群DA2の比率が小さい方のデータ群」である他データ群側についてのみ、順次、回帰木を成長させている。このため、従来の回帰木に比べて構造が単純明快で、また、効率的に、高い確度で不良の要因を特定できる。 According to the present embodiment, the data classification unit (classification means) 4 classifies the basic data group DA00 into a defective second data group DA2 and a non-defective first data group DA1, and an input attribute condition determination unit. 100 creates a regression tree that separates the second data group DA2 of defective products and the first data group DA1 of non-defective products. At this time, the regression tree is sequentially grown only on the other data group side that is the “data group with the smaller ratio of the second data group DA2 of defective products”. For this reason, the structure is simple and clear as compared with the conventional regression tree, and the cause of failure can be identified efficiently and with high accuracy.
また、入力属性条件決定部100が、回帰木の分岐毎に、分岐条件だけでなく全ての入力属性について問題事象(不良品の第2データ群DA2)の要因となる入力属性条件を求め、分岐の回数分の全て入力属性条件の中で、さらに不良品分離度の高い入力属性条件を絞り込み、最終の不良要因(入力属性条件)として決定している。このため、不良の要因を漏れなく、かつ、明確に特定できる。
Further, for each branch of the regression tree, the input attribute
また、入力属性条件一覧グラフ作成部(入力属性条件一覧作成手段)20が、入力属性条件決定部100が演算した、不良品分離度(第2データ群分離度)および/または不良数(第2データ群該当数)に基づく優先順位の順番に、入力属性条件を並べた入力属性条件一覧グラフを作成する。この入力属性条件一覧グラフを参照することによって、ユーザは、複数の不良要因を一望して把握できるとともに、その優先順位を知ることができる。
Further, the input attribute condition list graph creation unit (input attribute condition list creation unit) 20 calculates the defective product separation degree (second data group separation degree) and / or the number of defects (second) calculated by the input attribute
上記のように、本実施形態によれば、「所定の出力属性の要因(製品特性不良の要因等)を、優先順位を付けて明確に特定する、データ分析装置を提供する」という、本発明の他の目的を達成できる。 As described above, according to the present embodiment, the present invention “provides a data analysis device that clearly specifies a factor of a predetermined output attribute (such as a factor of product characteristic failure) with a priority order” is provided. Can achieve other objectives.
また、本実施形態では、上記入力属性条件一覧グラフの画面上の操作でレビューグラフを作成する、レビューグラフ作成部(レビューグラフ作成手段)21を備えている。このため、ユーザは、入力属性条件一覧グラフにおける入力属性条件の並び順(優先順位)を参照しながら(すなわち、分析結果をレビューする暫定的な順番をナビゲーションされながら)、その画面上の操作で、レビューグラフを作成することができる。 In this embodiment, a review graph creation unit (review graph creation means) 21 is provided that creates a review graph by an operation on the screen of the input attribute condition list graph. For this reason, the user can perform operations on the screen while referring to the order (priority order) of the input attribute conditions in the input attribute condition list graph (that is, while navigating the provisional order for reviewing the analysis results). A review graph can be created.
しかも、このレビューグラフでは、不良品の第2データ群DA2と、その要因となる入力属性条件を満たすデータ群との対応関係が、視覚的に強調して表されているから、分析結果を直感的に理解することができる。また、「ユーザによって結果の評価がばらつく」という従来の回帰木の問題も解消できる。 In addition, in this review graph, the correspondence between the second data group DA2 of defective products and the data group that satisfies the input attribute conditions that cause the failure is visually emphasized. Can be understood. In addition, the conventional regression tree problem that “the evaluation of the result varies depending on the user” can be solved.
なお、これらの効果は、(1)データ分類部(分類手段)4が、出力属性の値に基づいて、基本データ群DA00を、不良品の第2データ群DA2と、良品の第1データ群DA1との2グループに分類している事、および、(2)入力属性条件決定部100が、「入力属性条件を満たすデータ群に不良品の第2データ群DA2がまとまり、入力属性条件を満たさないデータ群に良品の第1データ群DA1がまとまる」ように、入力属性条件を決定していること、すなわち、(1)出力属性による基本データ群の2分化と、(2)入力属性による基本データ群との2分化によって、分析結果を評価する際の着目点を明確にしている事による。
These effects are as follows: (1) The data classification unit (classification means) 4 determines the basic data group DA00, the second data group DA2 of defective products, and the first data group of non-defective products based on the value of the output attribute. (2) The input attribute
上記のように、本実施形態によれば、「明確な指標に基づく、分析結果の直感的な評価を可能とするデータ分析装置を提供する」という本発明の目的を達成できる。 As described above, according to the present embodiment, it is possible to achieve the object of the present invention “providing a data analysis device that enables intuitive evaluation of analysis results based on a clear index”.
さらに、本実施形態では、入力属性条件一覧グラフの画面上の操作で、レビューグラフ作成部(レビューグラフ作成手段)21による多角的なレビューグラフの作成と、複合要因グラフ作成部(複合要因グラフ作成手段)22による多角的な複合要因グラフの作成とを適宜に繰り返すことができるから、双方のグラフを比較しながら、分析結果を容易に評価することができる。 Furthermore, in the present embodiment, by operation on the screen of the input attribute condition list graph, creation of a multi-faceted review graph by the review graph creation unit (review graph creation means) 21 and a composite factor graph creation unit (combination factor graph creation) Since the creation of the multi-faceted complex factor graph by means 22 can be repeated as appropriate, the analysis result can be easily evaluated while comparing both graphs.
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。 The present invention is not limited to the above-described embodiments, and various modifications are possible within the scope shown in the claims, and embodiments obtained by appropriately combining technical means disclosed in different embodiments. Is also included in the technical scope of the present invention.
例えば、上記の実施形態では、ステップ3〜ステップ6の繰り返し操作を行う場合を例として、本実施形態の説明を行ったが、特に必要でなければ、繰り返し操作を行わなくてもよい。なお、この場合には、第2の入力属性条件決定部19の出力は、第1の入力属性条件決定部12の出力と同じになるから、分岐条件決定部(分岐条件決定手段)14、データ分割部(分割手段)15、終了条件判定部16、および、第2の入力属性条件決定部(第2の入力属性条件決定手段)19を、入力属性条件決定部100から省略しても構わない。
For example, in the above-described embodiment, the present embodiment has been described by taking as an example the case where the repetitive operations of
また、上記の実施形態では、第2データ群DA2を不良品のデータ群とし、不良の要因を抽出するデータ分析例を示したが、第2データ群DA2を良品のデータ群とし、良品を得るための条件を抽出するデータ分析としてもよい。 In the above embodiment, the second data group DA2 is used as a defective product data group, and a data analysis example for extracting the cause of the failure is shown. However, the second data group DA2 is used as a good data group to obtain a good product. It is good also as data analysis which extracts the conditions for this.
また、上記構成のデータ分析装置は、4種類のレビューグラフを出力可能なレビューグラフ作成部21と、3種類の複合要因グラフを出力可能な複合要因グラフ作成部22とを備えていたが、これらの一方を省略してもよい。また、レビューグラフ作成部21や複合要因グラフ作成部22が出力可能なグラフの種類の数は、特に限定されるものではなく、1種類のみであってもよい。ただし、複数種類のグラフを出力可能である方が、用途にあったグラフを出力でき、また、複数のグラフの組み合わせにより詳細なデータ分析結果の評価が可能となる点で、好ましい。また、レビューグラフ作成部21や複合要因グラフ作成部22が出力可能なグラフは、図示した形態に限定されるものではない。
The data analysis apparatus having the above-described configuration includes the review
また、上記実施形態では、入力属性条件一覧グラフ作成部20が、入力属性条件一覧グラフを作成するようになっていた。しかしながら、入力属性条件一覧グラフ作成部20に代えて、入力属性条件決定部100で決定された複数の前記入力属性条件の一覧(リスト)をグラフ以外の形態、例えば一覧表の形態で出力する入力属性条件一覧作成手段を用いてもよい。
In the above embodiment, the input attribute condition list
以上で説明したデータ分析方法は、コンピュータが図2のS1〜S12(ステップ1〜12)に対応するプロセスを含むデータ分析プログラムを実行することによって実現できる。したがって、図1のデータ分析装置は、データ分析プログラムが、コンピュータを、基本データ群格納部1、分類条件設定部3、データ分類部4、分類後基本データ群格納部5、分析データ群抽出部6、第1の入力属性条件決定部12、分析結果データ格納部13、分岐条件決定部14、データ分割部15、終了条件判定部16、不良品データ演算部17、第2の入力属性条件決定部19、入力属性条件一覧グラフ作成部20、レビューグラフ作成部21、複合要因グラフ作成部22、および順位決定部23として機能させることにより実現することが可能である。
The data analysis method described above can be realized by the computer executing a data analysis program including processes corresponding to S1 to S12 (
上記データ分析プログラムは、コンピュータで読み取り可能な記録媒体に格納してユーザに提供することができる。これにより、データ分析プログラムをコンピュータに容易に提供することができる。この記録媒体は、コンピュータ本体に内蔵された内蔵メディアであってもよいし、コンピュータ本体に対して分離可能に構成されたリムーバブル・メディアであってもよい。上記内蔵メディアとしては、ROM;フラッシュメモリ等の書き換え可能な不揮発性メモリ;ハードディスク等が挙げられる。また、上記リムーバブル・メディアとしては、CD−ROM、DVD等の光記録媒体;MO等の光磁気記録媒体;フロッピー(登録商標)ディスク、カセットテープ、リムーバブル・ハードディスク等の磁気記録媒体;メモリカード等のような書き換え可能な不揮発性メモリを内蔵したメディア;ROMカセット等のようなROMを内蔵したメディア等が挙げられる。 The data analysis program can be stored in a computer-readable recording medium and provided to the user. Thereby, the data analysis program can be easily provided to the computer. The recording medium may be a built-in medium built in the computer main body, or a removable medium configured to be separable from the computer main body. Examples of the built-in medium include ROM; rewritable nonvolatile memory such as flash memory; and hard disk. The removable media includes optical recording media such as CD-ROM and DVD; magneto-optical recording media such as MO; magnetic recording media such as floppy (registered trademark) disks, cassette tapes and removable hard disks; memory cards and the like. Examples of the medium include a rewritable non-volatile memory such as a medium; a medium including a ROM such as a ROM cassette.
上記プログラムは、CPUのアクセスにより実行される構成であってもよいし、記録媒体に格納されているプログラムを読み出し、読み出したプログラムを内蔵メディアのプログラム記憶領域に転送した後、内蔵メディア上のプログラムがCPUのアクセスにより実行される構成であってもよい。また、上記プログラムは、コンピュータで読み取り可能な記録媒体に格納された状態で販売されるものに限定されるものではなく、インターネット等の通信ネットワークを介してユーザのコンピュータに転送する形式で販売されるものであってもよい。 The program may be configured to be executed by CPU access, or after reading the program stored in the recording medium and transferring the read program to the program storage area of the built-in medium, the program on the built-in medium May be executed by CPU access. Further, the program is not limited to a program that is sold in a state of being stored in a computer-readable recording medium, but is sold in a format that is transferred to a user's computer via a communication network such as the Internet. It may be a thing.
1 基本データ群格納部
3 分類条件設定部
4 データ分類部(分類手段)
5 分類後基本データ群格納部
6 分析データ群抽出部(分析データ群抽出手段)
12 第1の入力属性条件決定部(第1の入力属性条件決定手段)
13 分析結果データ格納部
14 分岐条件決定部(分岐条件決定手段)
15 データ分割部(分割手段)
16 終了条件判定部
17 不良品データ演算部
19 第2の入力属性条件決定部(第2の入力属性条件決定手段)
20 入力属性条件一覧グラフ作成部(入力属性条件一覧作成手段)
21 レビューグラフ作成部(レビューグラフ作成手段、第2の基本データ群作成手段)
22 複合要因グラフ作成部(複合要因グラフ作成手段)
100 入力属性条件決定部(入力属性条件決定手段)
1 Basic data
5 Basic data group storage after
12 1st input attribute condition determination part (1st input attribute condition determination means)
13 Analysis result
15 Data division unit (division means)
16 end
20 Input attribute condition list graph creation unit (input attribute condition list creation means)
21 Review graph creation unit (review graph creation means, second basic data group creation means)
22 Composite factor graph creation unit (Compound factor graph creation means)
100 Input attribute condition determining unit (input attribute condition determining means)
Claims (26)
前記出力属性の値に基づいて、前記基本データ群を第1データ群と第2データ群とに分類する分類手段と、
前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定する入力属性条件決定手段と、
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の入力属性条件を取得し、前記特定の入力属性条件に基づく前記基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するレビューグラフ作成手段とを含むことを特徴とするデータ分析装置。 Data for analyzing the causal relationship between the input attribute and the output attribute and outputting the analysis result of the causal relationship with respect to a basic data group that is a set of data composed of a plurality of input attributes and output attributes An analyzer,
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
An input attribute condition, which is an input attribute condition for bisecting the basic data group, is set for each of the plurality of input attributes, so that the first data group and the second data group are respectively combined. An input attribute condition determining means for determining;
Two data groups obtained by obtaining a specific input attribute condition from the plurality of input attribute conditions determined by the input attribute condition determining means, and by dividing the basic data group based on the specific input attribute condition A review graph that visually represents a correspondence relationship between at least one of the first data group and the second data group obtained by bisectioning the basic data group based on the value of the output attribute And a review graph creating means.
前記出力属性の値に基づいて、前記基本データ群を第1データ群と第2データ群とに分類する分類手段と、
前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定する入力属性条件決定手段と、
前記複数の入力属性と出力属性とで構成される前記データの各々は、それぞれ複数のグループのいずれかに属しており、前記複数のグループの各々の単位で、該グループに属する前記入力属性および出力属性の値を平均化したデータ群を表す第2の基本データ群を作成する第2の基本データ群作成手段と、
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の入力属性条件を取得し、前記特定の入力属性条件に基づく前記第2の基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記分類手段で前記基本データ群を分類した条件に基づく前記第2の基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するレビューグラフ作成手段とを含むことを特徴とするデータ分析装置。 Data for analyzing the causal relationship between the input attribute and the output attribute and outputting the analysis result of the causal relationship with respect to a basic data group that is a set of data composed of a plurality of input attributes and output attributes An analyzer,
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
An input attribute condition, which is an input attribute condition for bisecting the basic data group, is set for each of the plurality of input attributes, so that the first data group and the second data group are respectively combined. An input attribute condition determining means for determining;
Each of the data composed of the plurality of input attributes and output attributes belongs to each of a plurality of groups, and the input attributes and outputs belonging to the group in units of the plurality of groups. A second basic data group creating means for creating a second basic data group representing a data group obtained by averaging attribute values;
2 obtained by obtaining a specific input attribute condition from among the plurality of input attribute conditions determined by the input attribute condition determining means, and by dividing the second basic data group based on the specific input attribute condition The correspondence relationship between at least one of the two data groups and at least one of the two data groups obtained by the bisection of the second basic data group based on the condition for classifying the basic data group by the classification means is visually shown. And a review graph creating means for outputting a review graph represented by the data analysis device.
前記レビューグラフ作成手段は、ユーザが、前記入力属性条件一覧作成手段で出力された一覧に含まれる複数の前記入力属性条件の中から特定の入力属性条件を選択する選択操作、および、レビューグラフ描画指示を行うことに応答して、前記選択された入力属性条件を前記特定の入力属性条件として取得し、前記レビューグラフの出力を行うものであることを特徴とする請求項1または2に記載のデータ分析装置。 An input attribute condition list creating means for outputting a list of the plurality of input attribute conditions determined by the input attribute condition determining means;
The review graph creating means includes a selection operation in which a user selects a specific input attribute condition from the plurality of input attribute conditions included in the list output by the input attribute condition list creating means, and a review graph drawing 3. The method according to claim 1, wherein the selected input attribute condition is acquired as the specific input attribute condition in response to performing the instruction, and the review graph is output. 4. Data analysis device.
前記レビューグラフ作成手段は、少なくとも、前記入力属性条件を満たすデータ群と、前記第2データ群に対応する出力属性条件を満たすデータ群との対応関係を視覚的に表すレビューグラフを出力するものであることを特徴とする請求項1〜3のいずれか1項に記載のデータ分析装置。 The input attribute condition determined by the input attribute condition determining means is “the second data group is grouped in a data group that satisfies the input attribute condition, and the first data group is included in a data group that does not satisfy the input attribute condition. Is a condition that is determined to
The review graph creating means outputs a review graph that visually represents at least a correspondence relationship between a data group that satisfies the input attribute condition and a data group that satisfies the output attribute condition corresponding to the second data group. The data analysis apparatus according to claim 1, wherein the data analysis apparatus is provided.
前記入力属性条件一覧作成手段は、前記順位決定手段による順位付けの結果を前記入力属性条件の一覧に示すことを特徴とする請求項4または5に記載のデータ分析装置。 A second value representing the number of data that satisfies the input attribute condition in the basic data group and corresponds to the second data group with respect to the plurality of input attribute conditions determined by the input attribute condition determining means. Using at least one of the number of corresponding data groups and the second data group separation degree indicating the ratio of the number of data corresponding to the second data group in the data satisfying the input attribute condition in the basic data group as an index And rank determination means for ranking according to importance as a factor of the output attribute condition corresponding to the second data group,
6. The data analysis apparatus according to claim 4 or 5, wherein the input attribute condition list creation unit indicates a result of ranking by the rank determination unit in the list of input attribute conditions.
前記レビューグラフ作成手段は、
前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、
該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性の、前記判別キー毎の変化を示す第1のグラフと、前記出力属性の前記判別キー毎の変化を示す第2のグラフとを共に示すグラフを、前記レビューグラフとして出力するものであり、
前記第1のグラフでは、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されていることを特徴とする請求項4〜6のいずれか1項に記載のデータ分析装置。 In each of the data composed of a plurality of input attributes and output attributes in the basic data group or the second basic data group, a discrimination key is given, respectively.
The review graph creating means includes:
The target data group for which the review graph is to be created is the basic data group or the second basic data group,
For the target data group, a first graph showing a change for each discrimination key of an input attribute corresponding to the acquired specific input attribute condition, and a first graph showing a change for each discrimination key of the output attribute A graph showing both of the graphs of 2 is output as the review graph,
7. The marking according to claim 4, wherein in the first graph, marking processing is applied to data satisfying the input attribute condition and satisfying an output attribute condition corresponding to the second data group. The data analysis apparatus according to claim 1.
前記レビューグラフ作成手段は、
前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、
該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性の時間変化を示す第1のトレンドグラフと、前記出力属性の時間変化を示す第2のトレンドグラフとを共に示す第1のレビューグラフを前記レビューグラフとして出力するものであり、
前記第1のトレンドグラフでは、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されていることを特徴とする請求項4〜6のいずれか1項に記載のデータ分析装置。 The basic data group includes a plurality of data corresponding to different time points,
The review graph creating means includes:
The target data group for which the review graph is to be created is the basic data group or the second basic data group,
For the target data group, both a first trend graph showing the time change of the input attribute corresponding to the acquired specific input attribute condition and a second trend graph showing the time change of the output attribute are shown together. The first review graph is output as the review graph,
In the first trend graph, marking processing is performed on data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the second data group. The data analysis device according to any one of claims.
前記レビューグラフ作成手段は、
前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、
該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性の面内分布を表す第1のマップと、前記出力属性の面内分布を表す第2のマップとを共に示す第2のレビューグラフを前記レビューグラフとして出力するものであり、
前記第1のマップでは、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されていることを特徴とする請求項4〜6のいずれか1項に記載のデータ分析装置。 The basic data group includes a plurality of data corresponding to different positions in the plane,
The review graph creating means includes:
The target data group for which the review graph is to be created is the basic data group or the second basic data group,
A first map representing the in-plane distribution of the input attribute corresponding to the acquired specific input attribute condition and a second map representing the in-plane distribution of the output attribute are shown together for the target data group. Outputting a second review graph as the review graph,
7. The marking according to claim 4, wherein in the first map, marking processing is performed on data satisfying the input attribute condition and satisfying an output attribute condition corresponding to the second data group. The data analysis apparatus according to claim 1.
前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、
該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性と、前記出力属性との関係を示す散布図である第3のレビューグラフを前記レビューグラフとして出力するものであり、前記散布図では、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されていることを特徴とする請求項4〜6のいずれか1項に記載のデータ分析装置。 The review graph creating means includes:
The target data group for which the review graph is to be created is the basic data group or the second basic data group,
For the target data group, a third review graph that is a scatter diagram showing a relationship between the input attribute corresponding to the acquired specific input attribute condition and the output attribute is output as the review graph. In the scatter diagram, marking processing is performed on data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the second data group. The data analysis apparatus according to item 1.
前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、
該対象データ群を、前記取得した特定の入力属性条件を満たすデータ群と、該入力属性条件を満たさないデータ群とに分離し、
前記データ群の各々における、前記出力属性の度数分布を示す第4のレビューグラフを前記レビューグラフとして出力するものであることを特徴とする請求項4〜6のいずれか1項に記載のデータ分析装置。 The review graph creating means includes:
The target data group for which the review graph is to be created is the basic data group or the second basic data group,
Separating the target data group into a data group satisfying the acquired specific input attribute condition and a data group not satisfying the input attribute condition;
The data analysis according to any one of claims 4 to 6, wherein a fourth review graph indicating the frequency distribution of the output attribute in each of the data groups is output as the review graph. apparatus.
前記出力属性の値に基づいて、前記基本データ群を、第1データ群と第2データ群とに分類する分類手段と、
前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する入力属性条件決定手段と、
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つ以上の入力属性条件を取得し、前記特定の2つ以上の入力属性条件が交絡した条件に基づいて前記基本データ群から抽出されるデータ群と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を表す複合要因グラフを出力する複合要因グラフ作成手段とを含むことを特徴とするデータ分析装置。 Data for analyzing the causal relationship between the input attribute and the output attribute and outputting the analysis result of the causal relationship with respect to a basic data group that is a set of data composed of a plurality of input attributes and output attributes An analyzer,
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
An input attribute condition, which is an input attribute condition for dividing the basic data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are combined. , Input attribute condition determining means for determining each,
Two or more specific input attribute conditions are acquired from the plurality of input attribute conditions determined by the input attribute condition determining means, and the two or more input attribute conditions are entangled based on the condition A composite representing a correspondence relationship between a data group extracted from a basic data group and at least one of the first data group and the second data group obtained by bisecting the basic data group based on the value of the output attribute A data analysis apparatus comprising: composite factor graph creating means for outputting a factor graph.
前記複合要因グラフ作成手段は、ユーザが、前記入力属性条件一覧作成手段で出力された一覧に含まれる複数の前記入力属性条件の中から特定の入力属性条件を選択する選択操作、および、複合要因グラフ描画指示を行うことに応答して、前記選択された入力属性条件を含む入力属性条件を、前記特定の2つ以上の入力属性条件として取得し、前記複合要因グラフの出力を行うものであることを特徴とする請求項13に記載のデータ分析装置。 An input attribute condition list creating means for outputting a list of the plurality of input attribute conditions determined by the input attribute condition determining means;
The composite factor graph creating means includes a selection operation in which a user selects a specific input attribute condition from a plurality of the input attribute conditions included in the list output by the input attribute condition list creating means, and a composite factor In response to performing a graph drawing instruction, the input attribute condition including the selected input attribute condition is acquired as the two or more specific input attribute conditions, and the composite factor graph is output. The data analysis apparatus according to claim 13.
前記入力属性条件の一覧には、前記入力属性条件決定手段で決定された複数の前記入力属性条件の各々に関する、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数と、前記基本データ群中で該入力属性条件を満たすデータの中に前記第2データ群が含まれるデータ個数の割合を表す第2データ群分離度とが、前記入力属性条件に併せて示されていることを特徴とする請求項14に記載のデータ分析装置。 The input attribute condition determined by the input attribute condition determining means is “the second data group is grouped in a data group that satisfies the input attribute condition, and the first data group is included in a data group that does not satisfy the input attribute condition. Is a condition that is determined to
In the list of input attribute conditions, the input attribute condition is satisfied in the basic data group for each of the plurality of input attribute conditions determined by the input attribute condition determining means, and the second data group A second data group separation that represents the number of corresponding second data groups that represents the number of corresponding data and the ratio of the number of data that includes the second data group in the data that satisfies the input attribute condition in the basic data group The data analysis apparatus according to claim 14, wherein a degree is indicated together with the input attribute condition.
前記入力属性条件決定手段で決定された複数の前記入力属性条件に対して、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数、および、前記基本データ群中で該入力属性条件を満たすデータの中における、前記第2データ群に該当するデータ個数の割合を表す第2データ群分離度の少なくとも一方を指標として、前記第2データ群に対応する出力属性条件の要因としての重要度による順位付けを行う順位決定手段をさらに含み、
前記入力属性条件一覧作成手段は、前記順位決定手段による順位付けの結果を前記入力属性条件の一覧に示すことを特徴とする請求項14または15に記載のデータ分析装置。 The input attribute condition determined by the input attribute condition determining means is “the second data group is grouped in a data group that satisfies the input attribute condition, and the first data group is included in a data group that does not satisfy the input attribute condition. Is a condition that is determined to
A second value representing the number of data that satisfies the input attribute condition in the basic data group and corresponds to the second data group with respect to the plurality of input attribute conditions determined by the input attribute condition determining means. Using at least one of the number of corresponding data groups and the second data group separation degree indicating the ratio of the number of data corresponding to the second data group in the data satisfying the input attribute condition in the basic data group as an index And rank determination means for ranking according to importance as a factor of the output attribute condition corresponding to the second data group,
16. The data analysis apparatus according to claim 14 or 15, wherein the input attribute condition list creation unit indicates a result of ranking by the rank determination unit in the list of input attribute conditions.
前記複合要因グラフ作成手段は、
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つの入力属性条件を取得し、
前記基本データ群中で、前記の2つの入力属性条件をともに満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果、および、
前記基本データ群中で、前記2つの入力属性条件のうちの一方の条件のみを満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果が、それぞれ示されている第1の複合要因グラフを前記複合要因グラフとして出力するものであることを特徴とする請求項13〜16のいずれか1項に記載のデータ分析装置。 The input attribute condition determined by the input attribute condition determining means is “the second data group is grouped in a data group that satisfies the input attribute condition, and the first data group is included in a data group that does not satisfy the input attribute condition. Is a condition that is determined to
The composite factor graph creating means includes:
Two specific input attribute conditions are acquired from the plurality of input attribute conditions determined by the input attribute condition determining means,
In the basic data group, a result of calculating the number of data satisfying both the two input attribute conditions and corresponding to the second data group, and
In the basic data group, the result of calculating the number of data satisfying only one of the two input attribute conditions and corresponding to the second data group is shown as the first data The data analysis apparatus according to any one of claims 13 to 16, wherein a complex factor graph is output as the complex factor graph.
前記複合要因グラフ作成手段は、
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つ以上の入力属性条件を、順位を付けて取得し、
前記順位を付けて取得した入力属性条件の順位の順番に、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数を順次積算した結果を示す第2の複合要因グラフを前記複合要因グラフとして出力するものであることを特徴とする請求項13〜16のいずれか1項に記載のデータ分析装置。 The input attribute condition determined by the input attribute condition determining means is “the second data group is grouped in a data group that satisfies the input attribute condition, and the first data group is included in a data group that does not satisfy the input attribute condition. Is a condition that is determined to
The composite factor graph creating means includes:
Obtaining two or more specific input attribute conditions from among the plurality of input attribute conditions determined by the input attribute condition determining means, with ranking,
The second data group corresponding number representing the number of data satisfying the input attribute condition in the basic data group and corresponding to the second data group in the order of the order of the input attribute conditions acquired with the ranking. The data analysis apparatus according to any one of claims 13 to 16, wherein a second composite factor graph indicating a result of sequentially integrating the two is output as the composite factor graph.
前記複合要因グラフ作成手段は、
前記基本データ群の中から、前記取得した2つ以上の入力属性条件を全て満たすデータ群と、前記取得した2つ以上の入力属性条件の各々に対する排他的条件を全て満たすデータ群とをそれぞれ抽出し、
前記データ群の各々における、前記出力属性の度数分布を示す第3の複合要因グラフを前記複合要因グラフとして出力するものであることを特徴とする請求項13〜16のいずれか1項に記載のデータ分析装置。 The input attribute condition determined by the input attribute condition determining means is “the second data group is grouped in a data group that satisfies the input attribute condition, and the first data group is included in a data group that does not satisfy the input attribute condition. Is a condition that is determined to
The composite factor graph creating means includes:
Extract from the basic data group a data group that satisfies all of the acquired two or more input attribute conditions and a data group that satisfies all of the exclusive conditions for each of the acquired two or more input attribute conditions. And
The third composite factor graph indicating the frequency distribution of the output attribute in each of the data groups is output as the composite factor graph. Data analysis device.
前記分類手段による分類後の前記基本データ群の中から、分析の対象とする分析データ群を抽出する分析データ群抽出手段と、
前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記分析データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する第1の入力属性条件決定手段と、
前記第1の入力属性条件決定手段で決定された前記入力属性条件の中で、前記第2データ群を切出す確度が最も高い前記入力属性条件を、分岐条件として決定する分岐条件決定手段と、
前記分岐条件決定手段で決定された前記分岐条件に基づいて、前記分析データ群を2つのデータ群に分割する分割手段と、
前記第1の入力属性条件決定手段で決定された前記入力属性条件の中から前記第2データ群に対応する出力属性条件の要因としての重要度の高い入力属性条件を選定する第2の入力属性条件決定手段とを含み、
前記分析データ群抽出手段は、前記分割手段で分割された2つのデータ群のうち、前記第2データ群の比率が小さい方のデータ群のみを新たな分析データ群として抽出し、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理が繰り返し実行されるようになっており、
前記第2の入力属性条件決定手段は、前記入力属性の各々に対して、それぞれ、前記第1の入力属性条件決定手段の繰り返しの処理によって決定された該入力属性における複数の入力属性条件の中から前記重要度の高い入力属性条件を選定し、該選定された入力属性条件を、前記入力属性条件決定手段の出力として決定するものであることを特徴とする請求項1、2、または13に記載のデータ分析装置。 The input attribute condition determining means includes
Analysis data group extraction means for extracting an analysis data group to be analyzed from the basic data group after classification by the classification means;
An input attribute condition, which is an input attribute condition for dividing the analysis data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are respectively combined. , First input attribute condition determining means for determining each,
Among the input attribute conditions determined by the first input attribute condition determining means, a branch condition determining means for determining, as a branch condition, the input attribute condition having the highest probability of cutting out the second data group;
Dividing means for dividing the analysis data group into two data groups based on the branch conditions determined by the branch condition determining means;
A second input attribute for selecting a highly important input attribute condition as a factor of an output attribute condition corresponding to the second data group from the input attribute conditions determined by the first input attribute condition determining means Including a condition determining means,
The analysis data group extraction unit extracts only a data group having a smaller ratio of the second data group from the two data groups divided by the division unit as a new analysis data group, and the analysis data group A series of processing consisting of processing by the extracting means, processing by the first input attribute condition determining means, processing by the branch condition determining means, and processing by the dividing means is repeatedly executed,
The second input attribute condition determining unit is configured to select, for each of the input attributes, a plurality of input attribute conditions in the input attribute determined by the repetition process of the first input attribute condition determining unit. The input attribute condition having a high degree of importance is selected from the above, and the selected input attribute condition is determined as an output of the input attribute condition determining means. The data analysis device described.
前記出力属性の値に基づいて、前記基本データ群を、第1データ群と第2データ群とに分類する分類手段と、
前記分類手段による分類後の前記基本データ群の中から、分析の対象とする分析データ群を抽出する分析データ群抽出手段と、
前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記分析データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する第1の入力属性条件決定手段と、
前記第1の入力属性条件決定手段で決定された前記入力属性条件の中で、前記第2データ群を切出す確度が最も高い前記入力属性条件を、分岐条件として決定する分岐条件決定手段と、
前記分岐条件決定手段で決定された前記分岐条件に基づいて、前記分析データ群を2分化する分割手段とを含み、
前記分析データ群抽出手段は、前記分割手段で分割されたデータ群のうち、前記第2データ群の比率が小さい方のデータ群のみを新たな分析データ群として抽出し、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理が繰り返し実行されるようになっていることを特徴とするデータ分析装置。 Data for analyzing a causal relationship between the input attribute and the output attribute and extracting information indicating the causal relationship with respect to a basic data group that is a set of data composed of a plurality of input attributes and output attributes An analyzer,
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
Analysis data group extraction means for extracting an analysis data group to be analyzed from the basic data group after classification by the classification means;
An input attribute condition, which is an input attribute condition for dividing the analysis data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are respectively combined. , First input attribute condition determining means for determining each,
Among the input attribute conditions determined by the first input attribute condition determining means, a branch condition determining means for determining, as a branch condition, the input attribute condition having the highest probability of cutting out the second data group;
Splitting means for dividing the analysis data group into two based on the branch condition determined by the branch condition determining means,
The analysis data group extraction unit extracts only a data group having a smaller ratio of the second data group from the data group divided by the division unit as a new analysis data group, and the analysis data group extraction unit A series of processes consisting of the process according to the above, the process by the first input attribute condition determining means, the process by the branch condition determining means, and the process by the dividing means are repeatedly executed. Data analysis device.
コンピュータを、
前記出力属性の値に基づいて、前記基本データ群を第1データ群と第2データ群とに分類する分類手段、
前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定する入力属性条件決定手段、および
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の入力属性条件を取得し、前記特定の入力属性条件に基づく前記基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するレビューグラフ作成手段として機能させるためのデータ分析プログラム。 The computer analyzes a causal relationship between the input attribute and the output attribute with respect to a basic data group that is a set of data including a plurality of input attributes and an output attribute, and obtains the analysis result of the causal relationship. A data analysis program for functioning as a data analysis device for output,
Computer
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
An input attribute condition, which is an input attribute condition for bisecting the basic data group, is set for each of the plurality of input attributes, so that the first data group and the second data group are respectively combined. An input attribute condition determining means to determine, and a specific input attribute condition is acquired from the plurality of input attribute conditions determined by the input attribute condition determining means, and the basic data group based on the specific input attribute condition is acquired. Correspondence relationship between at least one of two data groups obtained by bisection and at least one of the first data group and the second data group obtained by bisection of the basic data group based on the value of the output attribute Analysis program for functioning as a review graph creation means for outputting a review graph that visually represents a message.
コンピュータを、
前記出力属性の値に基づいて、前記基本データ群を第1データ群と第2データ群とに分類する分類手段、
前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定する入力属性条件決定手段、
前記複数の入力属性と出力属性とで構成される前記データの各々は、それぞれ複数のグループのいずれかに属しており、前記複数のグループの各々の単位で、該グループに属する前記入力属性および出力属性の値を平均化したデータ群を表す第2の基本データ群を作成する第2の基本データ群作成手段、および
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の入力属性条件を取得し、前記特定の入力属性条件に基づく前記第2の基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記分類手段で前記基本データ群を分類した条件に基づく前記第2の基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するレビューグラフ作成手段として機能させるためのデータ分析プログラム。 The computer analyzes a causal relationship between the input attribute and the output attribute with respect to a basic data group that is a set of data including a plurality of input attributes and an output attribute, and obtains the analysis result of the causal relationship. A data analysis program for functioning as a data analysis device for output,
Computer
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
An input attribute condition, which is an input attribute condition for bisecting the basic data group, is set for each of the plurality of input attributes, so that the first data group and the second data group are respectively combined. Input attribute condition determining means to determine,
Each of the data composed of the plurality of input attributes and output attributes belongs to each of a plurality of groups, and the input attributes and outputs belonging to the group in units of the plurality of groups. A second basic data group creating means for creating a second basic data group representing a data group in which attribute values are averaged, and the plurality of input attribute conditions determined by the input attribute condition determining means And a condition obtained by classifying the basic data group by the classifying unit and at least one of two data groups obtained by bisection of the second basic data group based on the specific input attribute condition A review graph that outputs a review graph visually representing a correspondence relationship between at least one of two data groups obtained by bisection of the second basic data group based on Data analysis program to function as a view graph creation means.
コンピュータを、
前記出力属性の値に基づいて、前記基本データ群を、第1データ群と第2データ群とに分類する分類手段、
前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する入力属性条件決定手段、および
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つ以上の入力属性条件を取得し、前記特定の2つ以上の入力属性条件が交絡した条件に基づいて前記基本データ群から抽出されるデータ群と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を表す複合要因グラフを出力する複合要因グラフ作成手段として機能させるためのデータ分析プログラム。 The computer analyzes a causal relationship between the input attribute and the output attribute with respect to a basic data group that is a set of data including a plurality of input attributes and an output attribute, and obtains the analysis result of the causal relationship. A data analysis program for functioning as a data analysis device for output,
Computer
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
An input attribute condition, which is an input attribute condition for dividing the basic data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are combined. , Input attribute condition determining means for determining each, and acquiring two or more specific input attribute conditions from among the plurality of input attribute conditions determined by the input attribute condition determining means, and the two or more specific input attribute conditions The first data group and the second data group obtained by bifurcation of a data group extracted from the basic data group based on a condition entangled with an input attribute condition, and the basic data group based on a value of the output attribute A data analysis program for functioning as a composite factor graph creating means for outputting a composite factor graph representing a correspondence relationship with at least one of the above.
コンピュータを、
前記出力属性の値に基づいて、前記基本データ群を、第1データ群と第2データ群とに分類する分類手段、
前記分類手段による分類後の前記基本データ群の中から、分析の対象とする分析データ群を抽出する分析データ群抽出手段、
前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記分析データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する第1の入力属性条件決定手段、
前記第1の入力属性条件決定手段で決定された前記入力属性条件の中で、前記第2データ群を切出す確度が最も高い前記入力属性条件を、分岐条件として決定する分岐条件決定手段、および
前記分岐条件決定手段で決定された前記分岐条件に基づいて、前記分析データ群を2分化する分割手段として機能させるものであり、
前記分析データ群抽出手段は、前記分割手段で分割されたデータ群のうち、前記第2データ群の比率が小さい方のデータ群のみを新たな分析データ群として抽出し、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理が繰り返し実行されるようになっていることを特徴とするデータ分析プログラム。 In order to analyze a causal relationship between the input attribute and the output attribute and extract information indicating the causal relationship with respect to a basic data group that is a set of data composed of a plurality of input attributes and output attributes Data analysis program
Computer
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
Analysis data group extraction means for extracting an analysis data group to be analyzed from the basic data group after classification by the classification means;
An input attribute condition, which is an input attribute condition for dividing the analysis data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are respectively combined. , First input attribute condition determining means for determining each,
A branch condition determining means for determining, as a branch condition, the input attribute condition having the highest probability of cutting out the second data group among the input attribute conditions determined by the first input attribute condition determining means; Based on the branch condition determined by the branch condition determining means, the analysis data group is made to function as a dividing means for dividing into two parts,
The analysis data group extraction unit extracts only a data group having a smaller ratio of the second data group from the data group divided by the division unit as a new analysis data group, and the analysis data group extraction unit A series of processes consisting of the process according to the above, the process by the first input attribute condition determining means, the process by the branch condition determining means, and the process by the dividing means are repeatedly executed. Data analysis program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004224858A JP2006048183A (en) | 2004-07-30 | 2004-07-30 | Data analyzing device and data analyzing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004224858A JP2006048183A (en) | 2004-07-30 | 2004-07-30 | Data analyzing device and data analyzing program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006048183A true JP2006048183A (en) | 2006-02-16 |
Family
ID=36026683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004224858A Pending JP2006048183A (en) | 2004-07-30 | 2004-07-30 | Data analyzing device and data analyzing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006048183A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446194A (en) * | 2010-10-14 | 2012-05-09 | 金蝶软件(中国)有限公司 | Method and device for grouping and checking product data |
CN111527486A (en) * | 2017-12-28 | 2020-08-11 | 东京毅力科创株式会社 | Data processing device, data processing method, and program |
JP7491821B2 (en) | 2020-11-30 | 2024-05-28 | 三菱重工業株式会社 | Factor estimation method, prediction method, attribute value estimation method, factor estimation device, prediction device, attribute value estimation device, and program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0261769A (en) * | 1988-08-29 | 1990-03-01 | Fujitsu Ltd | Generating device for classification determining tree |
JP2001306999A (en) * | 2000-02-18 | 2001-11-02 | Fujitsu Ltd | Data analyzer and data analysis method |
JP2004186374A (en) * | 2002-12-03 | 2004-07-02 | Fujitsu Ltd | Manufacturing data analyzing method and program for making computer practice the same |
-
2004
- 2004-07-30 JP JP2004224858A patent/JP2006048183A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0261769A (en) * | 1988-08-29 | 1990-03-01 | Fujitsu Ltd | Generating device for classification determining tree |
JP2001306999A (en) * | 2000-02-18 | 2001-11-02 | Fujitsu Ltd | Data analyzer and data analysis method |
JP2004186374A (en) * | 2002-12-03 | 2004-07-02 | Fujitsu Ltd | Manufacturing data analyzing method and program for making computer practice the same |
Non-Patent Citations (2)
Title |
---|
マイケルJ.A.ベリー,ゴードン・リノフ, データマイニング手法 営業、マーケティング、カスタマーサポートのための顧客分析, JPN6010000907, September 1999 (1999-09-01), JP, pages 157 - 171, ISSN: 0001511843 * |
貝原巳樹雄: "二進木を用いる河川水質デ-タの特徴抽出", 分析化学, vol. 52, no. 5, JPN6010000908, 5 May 2003 (2003-05-05), JP, pages 331 - 336, ISSN: 0001511844 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446194A (en) * | 2010-10-14 | 2012-05-09 | 金蝶软件(中国)有限公司 | Method and device for grouping and checking product data |
CN111527486A (en) * | 2017-12-28 | 2020-08-11 | 东京毅力科创株式会社 | Data processing device, data processing method, and program |
JP7491821B2 (en) | 2020-11-30 | 2024-05-28 | 三菱重工業株式会社 | Factor estimation method, prediction method, attribute value estimation method, factor estimation device, prediction device, attribute value estimation device, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cabrera et al. | FairVis: Visual analytics for discovering intersectional bias in machine learning | |
CN114444986B (en) | Product analysis method, system, device and medium | |
JP6771751B2 (en) | Risk assessment method and system | |
May et al. | Guiding feature subset selection with an interactive visualization | |
JP6555061B2 (en) | Clustering program, clustering method, and information processing apparatus | |
Vasudevan et al. | When does dough become a bagel? analyzing the remaining mistakes on imagenet | |
KR20140067065A (en) | Chart recommendations | |
JP2005085166A (en) | Method and system for generating graphic image, and method, system and program for analyzing data | |
US20090012830A1 (en) | Apparatus, method, and program for extracting work item | |
Panahy et al. | The impact of data quality dimensions on business process improvement | |
Vermetten et al. | Bias: A toolbox for benchmarking structural bias in the continuous domain | |
JP2012073812A (en) | Data analysis support system and method | |
Collaris et al. | Strategyatlas: Strategy analysis for machine learning interpretability | |
JP2012094016A (en) | Production information management apparatus and production information management method | |
JP2006048183A (en) | Data analyzing device and data analyzing program | |
JP2010026923A (en) | Method, device and program for document classification, and computer-readable recording medium | |
JP4368755B2 (en) | Data analysis apparatus, data analysis method, and data analysis program | |
JP4298531B2 (en) | Input attribute condition determination device, input attribute condition determination method, input attribute condition determination program, data analysis device, data analysis method, and data analysis program | |
JP2005032117A (en) | Data analysis device, method and program | |
JP4351578B2 (en) | Production planning support system and computer program | |
KR100952634B1 (en) | Analysis system for information and method thereof | |
WO2024079827A1 (en) | Flow aggregation device, method, and program | |
EP3912026A1 (en) | Process for evaluating software elements within software | |
Kalra et al. | Quantifying Influence: A Bibliometric Analysis of Robo-Advisors in Management | |
Sand et al. | Data analysis and error detection in assembly lines using a three-dimensional visualization technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060912 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100323 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100831 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110118 |