JP2006048183A - Data analyzing device and data analyzing program - Google Patents

Data analyzing device and data analyzing program Download PDF

Info

Publication number
JP2006048183A
JP2006048183A JP2004224858A JP2004224858A JP2006048183A JP 2006048183 A JP2006048183 A JP 2006048183A JP 2004224858 A JP2004224858 A JP 2004224858A JP 2004224858 A JP2004224858 A JP 2004224858A JP 2006048183 A JP2006048183 A JP 2006048183A
Authority
JP
Japan
Prior art keywords
data group
input attribute
condition
data
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004224858A
Other languages
Japanese (ja)
Inventor
Hiroaki Takeuchi
博明 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2004224858A priority Critical patent/JP2006048183A/en
Publication of JP2006048183A publication Critical patent/JP2006048183A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a data analyzing device for intuitively evaluating an analysis result. <P>SOLUTION: This data analyzing device is provided with a data classifying part 4 for classifying a basic data group into a first data group and a second data group based on the value of output attributes, an input attribute condition deciding part 100 for deciding input attribute conditions for dividing the basic data group for gathering the first data group and the second data group, an input attribute condition list graph preparing part 20 for outputting an input attribute condition list graph showing the list of a plurality of decided input attribute conditions and a review graph preparing part 21 for outputting a review graph visually expressing the corresponding relation of at least one of two data groups to be acquired by the division of the basic data group based on the input attribute conditions and at least either the first data group or the second data group to be acquired by classification based on the values of the output attributes in response to an operation on the display screen of the input attribute condition list graph. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、分析対象である出力属性(目的属性)、例えば製造工程で製造される製品の特性等と、出力属性に影響を与える属性である入力属性(説明属性)、例えば製造プロセス条件等との因果関係を分析し、この因果関係を示す情報を出力するデータ分析装置およびデータ分析プログラムに関する。   The present invention relates to an output attribute (object attribute) to be analyzed, such as characteristics of a product manufactured in a manufacturing process, and an input attribute (description attribute) that is an attribute affecting the output attribute, such as a manufacturing process condition. The present invention relates to a data analysis apparatus and a data analysis program for analyzing a cause-and-effect relationship and outputting information indicating the cause-and-effect relationship.

出力属性と入力属性との因果関係を分析する有効な手法としては、回帰木手法が知られている。この手法では、入力属性の値で順次切り分けた葉の部分で、出力属性の値がうまくまとまるような木構造を作成する。   As an effective method for analyzing the causal relationship between the output attribute and the input attribute, a regression tree method is known. This method creates a tree structure in which the values of the output attributes are well organized at the leaf portions that are sequentially separated by the values of the input attributes.

図20は、特許文献1の図20に記載されている回帰木の一例で、トランジスタのスレッシュホールド電圧VT_N2の特徴量を出力属性(目的変数)とし、このトランジスタを製造する各工程での使用装置を入力属性(説明変数)とした分析結果である。   FIG. 20 is an example of the regression tree described in FIG. 20 of Patent Document 1, in which the feature value of the threshold voltage VT_N2 of the transistor is an output attribute (object variable), and the device used in each process of manufacturing the transistor Is an analysis result using as an input attribute (an explanatory variable).

また、図21および図22は、上記回帰木(図20)の第1分岐条件(Field_Ox=PM1,PM3と、Field_Ox=PM2の分岐)に基づくレビュー結果で、それぞれ、スレッシュホールド電圧VT_N2の値の分布を、箱ヒゲグラフ、および、ヒストグラムで表現したグラフである。   21 and 22 show the review results based on the first branch condition (the branch of Field_Ox = PM1, PM3 and Field_Ox = PM2) of the regression tree (FIG. 20), and the values of the threshold voltage VT_N2 are respectively shown. It is the graph which expressed distribution with the box mustache graph and the histogram.

図21および図22を参照して、Field_Ox工程の使用装置が、PM1,PM3の場合と、PM2の場合とで、スレッシュホールド電圧VT_N2の値の分布に有意差があることを確認できる。
特開2003−142361号公報(公開日:平成15年(2003)5月16日) 大滝厚、堀江宥治、Dan Steinberg著「応用2進木解析法−CARTによる−」、日科技連、1998年7月6日発行、P44−P47
With reference to FIG. 21 and FIG. 22, it can be confirmed that there is a significant difference in the distribution of the value of the threshold voltage VT_N2 between the PM1 and PM3 use devices and the PM2 use device in the Field_Ox process.
JP 2003-142361 A (publication date: May 16, 2003) Atsushi Otaki, Yuji Horie, Dan Steinberg, "Applied binary tree analysis method-by CART-", Nikka Giren, July 6, 1998, P44-P47

従来の回帰木分析(図20〜図22)には、以下の2つの問題点があった。   Conventional regression tree analysis (FIGS. 20 to 22) has the following two problems.

(1)不良の要因を特定しにくいという問題
図20の回帰木は、出力属性(目的変数)の値がまとまるような、入力属性(説明変数)の条件を示しているのみであって、分岐された2つのノードのうちの、どちらのノードが良くて、どちらのノードが悪いのか、といった情報を一切示していない。このため、不良要因の分析で、特に階層構造が深くなった場合には、どの条件を不良要因として特定すれば良いのかを判断しにくい。また、さまざまな階層に現われる複数の条件に対して、それらの間で優先順位を付けることが難しい。
(1) Problem that it is difficult to identify the cause of failure The regression tree in FIG. 20 only shows the condition of the input attribute (explanatory variable) so that the values of the output attribute (object variable) are gathered. No information is shown on which of the two nodes is better and which is worse. For this reason, it is difficult to determine which condition should be specified as the failure factor in the analysis of the failure factor, particularly when the hierarchical structure becomes deep. In addition, it is difficult to prioritize a plurality of conditions appearing on various levels.

例えば、図20において、スレッシュホールド電圧VT_N2の特徴量の値(図中の各ノードNoの横に記載されている)の大きいものが問題であるとした場合、第1分岐において特徴量の値が小さいノードNo.1「Field_Ox=PM1,PM3(特徴量:9.498038E−02)」の3階層下で、特徴量の値が大きいノードNo.10「第1洗浄工程_装置=#76(特徴量:0.17382)」は、問題として捉えるべきか否かが分からない。   For example, in FIG. 20, if the problem is that the feature value of the threshold voltage VT_N2 (shown next to each node No. in the figure) is large, the feature value in the first branch is Small node No. 1 under the three layers of “Field_Ox = PM1, PM3 (feature amount: 9.498038E-02)”, node No. 10 “first cleaning process_device = # 76 (feature amount: 0.17382)” is not known whether it should be regarded as a problem.

また、このノードNo10「第1洗浄工程_装置=#76(特徴量:0.17382)」が問題であったとして、第1分岐のノードNo12「Field_Ox=PM2(特徴量:0.173167)」と比べて、どちらの方が大きな問題なのか、分からない。   Further, assuming that this node No. 10 “first cleaning process_apparatus = # 76 (feature amount: 0.17382)” is a problem, the first branch node No. 12 “Field_Ox = PM2 (feature amount: 0.173167)” I don't know which is the bigger problem.

すなわち、従来の回帰木では、不良の要因を特定しにくいという第1の問題点があった。   That is, the conventional regression tree has a first problem that it is difficult to identify the cause of the failure.

(2)分析結果の評価が困難であるという問題
回帰木分析の結果を評価する際、図21の箱ヒゲグラフや、図22のヒストグラムには、その着目点(すなわち、明確な評価指標)が示されていないので、直感的な判断を行いにくく、また、ユーザによって結果の評価がばらついてしまうという問題がある。例えば、図22の箱ヒゲグラフを参照した場合、PM2の処理品は、PM1,PM3の処理品に比べてVT_N2の値の分布が大きくなっているが、これを有意差と見るか、有意差でないと見るかは、ユーザによって異なり一意なものでない。この例の場合には、比較的顕著な差が見えているので、ほぼ一意的な判断も可能であろうが、現実には、複数の要因の交絡等により、必ずしも顕著な差が現れるわけではない。すなわち、従来技術では、分析結果を評価する際の着目点が不明確であるため、一意的な評価が困難であるという、第2の問題点があった。
(2) Problem that it is difficult to evaluate the analysis result When evaluating the result of the regression tree analysis, the box mustache graph of FIG. 21 and the histogram of FIG. 22 show the point of interest (that is, a clear evaluation index). Therefore, there are problems that it is difficult to make an intuitive judgment and the evaluation of the results varies depending on the user. For example, when referring to the box mustache graph of FIG. 22, the treated product of PM2 has a larger distribution of VT_N2 values than the treated products of PM1 and PM3, but this is regarded as a significant difference or not significant. It depends on the user and is not unique. In the case of this example, a relatively significant difference is seen, so an almost unique judgment may be possible, but in reality, a significant difference does not necessarily appear due to confounding of multiple factors. Absent. That is, the prior art has a second problem that it is difficult to perform unique evaluation because the point of interest when evaluating the analysis result is unclear.

本発明は、上記従来の問題点を鑑みてなされたものであり、その目的は、明確な指標に基づく、分析結果の直感的な評価を可能とするデータ分析装置を提供することにある。また、本発明の他の目的は、所定の出力属性の要因(製品特性不良の要因等)を、優先順位を付けて明確に特定する、データ分析装置を提供することにある。   The present invention has been made in view of the above-described conventional problems, and an object of the present invention is to provide a data analysis apparatus that enables an intuitive evaluation of an analysis result based on a clear index. Another object of the present invention is to provide a data analysis apparatus that clearly identifies a factor of a predetermined output attribute (such as a factor of product characteristic failure) with priority.

本発明のデータ分析装置は、上記の課題を解決するために、複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係の分析結果を出力するデータ分析装置であって、前記出力属性の値に基づいて、前記基本データ群を第1データ群と第2データ群とに分類する分類手段と、前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定する入力属性条件決定手段と、前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の入力属性条件を取得し、前記特定の入力属性条件に基づく前記基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するレビューグラフ作成手段とを含むことを特徴としている。   In order to solve the above problems, the data analysis apparatus of the present invention provides the input attribute and the output attribute for a basic data group that is a set of data composed of a plurality of input attributes and output attributes. Is a data analysis device that analyzes the cause-and-effect relationship and outputs the analysis result of the cause-and-effect relationship, and classifies the basic data group into a first data group and a second data group based on the value of the output attribute An input attribute condition that is an input attribute condition for dividing the basic data group into two parts so that the classification means and the first data group and the second data group are respectively combined. Input attribute condition determining means for determining each of the input attribute condition, obtaining a specific input attribute condition from the plurality of input attribute conditions determined by the input attribute condition determining means, and based on the specific input attribute condition At least one of two data groups obtained by bisection of this data group, and at least one of the first data group and the second data group obtained by bisection of the basic data group based on the value of the output attribute And a review graph creating means for outputting a review graph that visually represents the correspondence relationship.

上記構成によれば、特定の入力属性条件に基づく前記基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するようになっている。これにより、特定の入力属性条件が、第1データ群および第2データ群の少なくとも一方の要因となっているかを示す分析結果をユーザに提示できる。したがって、ユーザは、分析結果を直感的に理解することができる。また、「ユーザによって結果の評価がばらつく」という従来の回帰木の問題も解消できる。   According to the above configuration, at least one of two data groups obtained by bisection of the basic data group based on a specific input attribute condition and the bisection of the basic data group based on the value of the output attribute A review graph that visually represents the correspondence between at least one of the first data group and the second data group is output. Thereby, the analysis result which shows whether a specific input attribute condition becomes a factor of at least one of the 1st data group and the 2nd data group can be shown to a user. Therefore, the user can intuitively understand the analysis result. In addition, the conventional regression tree problem that “the evaluation of the result varies depending on the user” can be solved.

これらの効果は、(1)分類手段が、出力属性の値に基づいて基本データ群を第1データ群と第2データ群とに分類していること、および(2)入力属性条件決定手段が、前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定していることによる。すなわち、(1)出力属性による基本データ群の2分化と、(2)入力属性による基本データ群の2分化とによって、分析結果を評価する際の着目点を明確にしていることによる。   These effects are as follows: (1) the classification means classifies the basic data group into the first data group and the second data group based on the value of the output attribute; and (2) the input attribute condition determination means The input attribute condition, which is an input attribute condition for dividing the basic data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are grouped. It depends on what has been decided. That is, the point of interest when evaluating the analysis result is clarified by (1) bisection of the basic data group based on the output attribute and (2) bisection of the basic data group based on the input attribute.

以上のように、上記構成によれば、「明確な指標に基づく、分析結果の直感的な評価を可能とするデータ分析装置を提供する」という本発明の目的を達成できる。   As described above, according to the above configuration, the object of the present invention of “providing a data analysis apparatus capable of intuitively evaluating an analysis result based on a clear index” can be achieved.

また、上記構成によれば、全ての入力属性について問題事象の要因となる入力属性条件を抽出しているから、分岐条件に競合因子が存在しても、その要因を逃すことなく、確実に捉えることができる。   In addition, according to the above configuration, since the input attribute condition that causes the problem event is extracted for all the input attributes, even if there is a competing factor in the branch condition, it is reliably captured without missing the factor. be able to.

本発明のデータ分析装置は、上記の課題を解決するために、複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係の分析結果を出力するデータ分析装置であって、前記出力属性の値に基づいて、前記基本データ群を第1データ群と第2データ群とに分類する分類手段と、前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定する入力属性条件決定手段と、前記複数の入力属性と出力属性とで構成される前記データの各々は、それぞれ複数のグループのいずれかに属しており、前記複数のグループの各々の単位で、該グループに属する前記入力属性および出力属性の値を平均化したデータ群を表す第2の基本データ群を作成する第2の基本データ群作成手段と、前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の入力属性条件を取得し、前記特定の入力属性条件に基づく前記第2の基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記分類手段で前記基本データ群を分類した条件に基づく前記第2の基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するレビューグラフ作成手段とを含むことを特徴としている。   In order to solve the above problems, the data analysis apparatus of the present invention provides the input attribute and the output attribute for a basic data group that is a set of data composed of a plurality of input attributes and output attributes. Is a data analysis device that analyzes the cause-and-effect relationship and outputs the analysis result of the cause-and-effect relationship, and classifies the basic data group into a first data group and a second data group based on the value of the output attribute An input attribute condition that is an input attribute condition for dividing the basic data group into two parts so that the classification means and the first data group and the second data group are respectively combined. Each of the data constituted by the input attribute condition determining means for determining each of the plurality of input attributes and the output attributes belongs to one of a plurality of groups, Second basic data group creating means for creating a second basic data group representing a data group in which the values of the input attribute and output attribute belonging to the group are averaged in units, and the input attribute condition determining means A specific input attribute condition is acquired from the plurality of input attribute conditions determined in step 1, and at least one of two data groups obtained by bisecting the second basic data group based on the specific input attribute condition And a review graph that visually represents a correspondence relationship between at least one of the two data groups obtained by bisection of the second basic data group based on the condition for classifying the basic data group by the classification unit And a review graph creating means.

本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件決定手段で決定された複数の前記入力属性条件の一覧を出力する入力属性条件一覧作成手段をさらに含み、前記レビューグラフ作成手段は、ユーザが、前記入力属性条件一覧作成手段で出力された一覧に含まれる複数の前記入力属性条件の中から特定の入力属性条件を選択する選択操作、および、レビューグラフ描画指示を行うことに応答して、前記選択された入力属性条件を前記特定の入力属性条件として取得し、前記レビューグラフの出力を行うものである構成である。   The data analysis apparatus of the present invention preferably further includes an input attribute condition list creation means for outputting a list of the plurality of input attribute conditions determined by the input attribute condition determination means in the data analysis apparatus having the above configuration, The review graph creating means includes a selection operation in which a user selects a specific input attribute condition from the plurality of input attribute conditions included in the list output by the input attribute condition list creating means, and a review graph drawing In response to the instruction, the selected input attribute condition is acquired as the specific input attribute condition, and the review graph is output.

上記構成によれば、前記入力属性条件決定手段で決定された複数の前記入力属性条件の一覧を出力する入力属性条件一覧作成手段をさらに含み、前記レビューグラフ作成手段は、ユーザが、前記入力属性条件一覧作成手段で出力された一覧に含まれる複数の前記入力属性条件の中から特定の入力属性条件を選択する選択操作に応答して、前記選択された入力属性条件を前記特定の入力属性条件として取得し、前記レビューグラフの出力を行う。これにより、ユーザが、前記入力属性条件決定手段で決定された複数の前記入力属性条件のうち、任意の入力属性条件に基づいたレビューグラフを得ることができる。   According to the above configuration, the apparatus further includes an input attribute condition list creating unit that outputs a list of the plurality of input attribute conditions determined by the input attribute condition determining unit, and the review graph creating unit is configured such that the user In response to a selection operation for selecting a specific input attribute condition from a plurality of the input attribute conditions included in the list output by the condition list creation means, the selected input attribute condition is changed to the specific input attribute condition. And the review graph is output. Thereby, the user can obtain a review graph based on an arbitrary input attribute condition among the plurality of input attribute conditions determined by the input attribute condition determining means.

さらに、上記構成によれば、前記レビューグラフの出力は、ユーザがレビューグラフ描画指示を行うことに応答して行われる。これにより、ユーザの希望に応じてレビューグラフを適時に出力することができ、また、複数種類のレビューグラフを出力することができる。   Further, according to the above configuration, the review graph is output in response to a user giving a review graph drawing instruction. Thereby, a review graph can be output in a timely manner according to a user's request, and a plurality of types of review graphs can be output.

なお、上記の特定の入力属性条件は、上記構成のようにユーザの選択操作によって取得する代わりに、データ分析装置内の選択手段から取得してもよい。この選択手段としては、「入力属性条件に該当するデータ群に含まれる第2データ群の割合」やGiniインデックス法の改善度などを指標として、これらの指標値の高い入力属性条件を選択する選択手段や、単に、入力属性条件一覧作成手段で出力された一覧に含まれる全ての入力属性条件を選択する選択手段などを用いることができる。   The specific input attribute condition may be acquired from a selection unit in the data analysis device instead of being acquired by a user selection operation as in the configuration described above. As the selection means, a selection of selecting an input attribute condition having a high index value by using “the ratio of the second data group included in the data group corresponding to the input attribute condition” or the improvement degree of the Gini index method as an index. Or a selection means for selecting all input attribute conditions included in the list output by the input attribute condition list creation means.

また、上記入力属性条件決定手段における入力属性条件決定の基準(指標)としては、Giniインデックス法の改善度や頻度差分値、および、これらの組み合わせ等を用いることができる。上記頻度差分値は、各入力属性の全ての数値について、第1データ群中において、入力属性がその数値以下であるデータの割合を第1の頻度として演算すると共に、第2データ群中において、入力属性がその数値以下であるデータの割合を第2の頻度として演算する頻度演算ステップと、各入力属性の全ての数値について、第1の頻度と第2の頻度との差分値を演算する差分演算ステップとによって演算できる。   Further, as the reference (index) for determining the input attribute condition in the input attribute condition determining means, the improvement level of the Gini index method, the frequency difference value, a combination thereof, and the like can be used. In the first data group, the frequency difference value is calculated as the first frequency for all the numerical values of each input attribute as the first frequency, and in the second data group, A frequency calculation step for calculating a ratio of data whose input attribute is less than or equal to the numerical value as a second frequency, and a difference for calculating a difference value between the first frequency and the second frequency for all the numerical values of each input attribute It can be calculated by calculating steps.

本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、前記レビューグラフ作成手段は、少なくとも、前記入力属性条件を満たすデータ群と、前記第2データ群に対応する出力属性条件を満たすデータ群との対応関係を視覚的に表すレビューグラフを出力するものである構成である。   In the data analysis device of the present invention, preferably, in the data analysis device configured as described above, the input attribute condition determined by the input attribute condition determining means is “the second data group in the data group that satisfies the input attribute condition”. And the review graph creating means includes at least a data group that satisfies the input attribute condition, and a data group that does not satisfy the input attribute condition. This is a configuration for outputting a review graph that visually represents a correspondence relationship with a data group that satisfies the output attribute condition corresponding to the second data group.

上記構成によれば、少なくとも、特定の入力属性条件を満たすデータ群と、前記第2データ群との対応関係を視覚的に表すレビューグラフを出力するようになっている。これにより、特定の入力属性条件が第2データ群に対応する出力属性の要因となっているかを示す分析結果をユーザに提示できる。したがって、ユーザは、分析結果を直感的に理解することができる。   According to the above configuration, at least a review graph that visually represents a correspondence relationship between a data group that satisfies a specific input attribute condition and the second data group is output. Thereby, it is possible to present to the user an analysis result indicating whether the specific input attribute condition is a factor of the output attribute corresponding to the second data group. Therefore, the user can intuitively understand the analysis result.

本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件の一覧には、前記入力属性条件決定手段で決定された複数の前記入力属性条件の各々に関する、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数と、前記基本データ群中で該入力属性条件を満たすデータの中に前記第2データ群が含まれるデータ個数の割合を表す第2データ群分離度とが、前記入力属性条件に併せて示されている構成である。   The data analysis apparatus of the present invention is preferably the data analysis apparatus configured as described above, wherein the list of input attribute conditions includes the basic attribute relating to each of the plurality of input attribute conditions determined by the input attribute condition determination means. A second data group corresponding number representing the number of data corresponding to the second data group that satisfies the input attribute condition in the data group, and data satisfying the input attribute condition in the basic data group The second data group separation degree indicating the ratio of the number of data in which the second data group is included is configured to be shown together with the input attribute condition.

上記構成によれば、前記入力属性条件の一覧には、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数と、前記基本データ群中で該入力属性条件を満たすデータの中に前記第2データ群が含まれるデータ個数の割合を表す第2データ群分離度とが、前記入力属性条件に併せて示されている。このため、ユーザは、入力属性条件の一覧と併せて示された、第2データ群該当数および第2データ群分離度を参照することで、各入力属性条件が第2データ群に対応する出力属性の発生にどれほど寄与しているのかを知ることができる。それゆえ、ユーザが、第2データ群に対応する出力属性の要因を発見できる可能性の高いレビューグラフを作成することが可能となる。   According to the above configuration, the list of the input attribute conditions includes the second data group corresponding number representing the number of data satisfying the input attribute condition in the basic data group and corresponding to the second data group; The second data group separation degree representing the ratio of the number of data in which the second data group is included in the data satisfying the input attribute condition in the basic data group is indicated together with the input attribute condition. Yes. For this reason, the user refers to the second data group hit count and the second data group separation degree shown together with the list of input attribute conditions, so that each input attribute condition corresponds to the second data group. You can know how much it contributes to the generation of attributes. Therefore, it is possible to create a review graph with a high possibility that the user can find the factor of the output attribute corresponding to the second data group.

また、上記構成によれば、第2データ群該当数および第2データ群分離度の両方が前記入力属性条件の一覧に示されている。これにより、ユーザは、用途によって、(1)第2データ群該当数、(2)第2データ群分離度、(3)第2データ群該当数および第2データ群分離度、のいずれかを指標として選択し、その指標に基づいてレビューグラフを作成することができる。したがって、ユーザが、用途に応じたレビューグラフを容易に作成することができる。   Further, according to the above configuration, both the number of corresponding second data groups and the second data group separation degree are shown in the list of input attribute conditions. Accordingly, the user can select one of (1) the number of corresponding second data groups, (2) the degree of second data group separation, (3) the number of corresponding second data groups and the degree of second data group separation depending on the application. It can be selected as an index and a review graph can be created based on the index. Therefore, the user can easily create a review graph according to the application.

本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件決定手段で決定された複数の前記入力属性条件に対して、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数、および、前記基本データ群中で該入力属性条件を満たすデータの中における、前記第2データ群に該当するデータ個数の割合を表す第2データ群分離度の少なくとも一方を指標として、前記第2データ群に対応する出力属性条件の要因としての重要度による順位付けを行う順位決定手段をさらに含み、前記入力属性条件一覧作成手段は、前記順位決定手段による順位付けの結果を前記入力属性条件の一覧に示す構成である。   The data analysis device of the present invention is preferably the data analysis device configured as described above, wherein the input attribute condition is determined in the basic data group for the plurality of input attribute conditions determined by the input attribute condition determination means. A second data group corresponding number that represents the number of data satisfying and corresponding to the second data group, and corresponding to the second data group in the data that satisfies the input attribute condition in the basic data group Rank determining means for performing ranking according to importance as a factor of an output attribute condition corresponding to the second data group, using at least one of the second data group separation degrees indicating the ratio of the number of data to be performed as an index; The input attribute condition list creating means is configured to show the ranking result by the rank determining means in the list of input attribute conditions.

上記構成によれば、入力属性条件一覧作成手段が、順位決定手段によって決定された、第2データ群該当数および/または第2データ群分離度に基づく優先順位付けの結果を併せて示す入力属性条件の一覧を作成する。この入力属性条件の一覧を参照することによって、ユーザは、第2データ群に対応する出力属性の要因となる複数の入力属性条件を一望して把握できるとともに、その重要度の順位を知ることができる。   According to the above configuration, the input attribute condition list creation unit also shows the input attribute that also indicates the result of prioritization based on the second data group hit count and / or the second data group separation degree determined by the rank determination unit Create a list of conditions. By referring to this list of input attribute conditions, the user can grasp and understand a plurality of input attribute conditions that cause the output attribute corresponding to the second data group, and know the order of importance. it can.

したがって、上記構成によれば、「所定の出力属性の要因(製品特性不良の要因等)を、優先順位を付けて明確に特定する、データ分析装置を提供する」という、本発明の他の目的を達成できる。   Therefore, according to the above configuration, another object of the present invention is to “provide a data analysis apparatus that clearly specifies a factor of a predetermined output attribute (such as a factor of product characteristic failure) with priority ranking”. Can be achieved.

また、上記構成によれば、ユーザは、入力属性条件の一覧における入力属性条件の並び順(優先順位)を参照しながら(すなわち、分析結果をレビューする暫定的な順番をナビゲーションされながら)選択操作を行うことによって、レビューグラフを作成することができる。   Further, according to the above configuration, the user performs a selection operation while referring to the order (priority order) of the input attribute conditions in the list of input attribute conditions (that is, while navigating the provisional order for reviewing the analysis results). A review graph can be created by performing.

本発明のデータ分析装置は、上記構成のデータ分析装置において、前記基本データ群または前記第2の基本データ群における、複数の入力属性と、出力属性とで構成される前記データの各々には、それぞれ判別キーが付与されており、前記レビューグラフ作成手段は、前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性の、前記判別キー毎の変化を示す第1のグラフと、前記出力属性の前記判別キー毎の変化を示す第2のグラフとを共に示すグラフを、前記レビューグラフとして出力するものであり、前記第1のグラフでは、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている構成であってもよい。   The data analysis apparatus of the present invention is the data analysis apparatus having the above configuration, wherein each of the data composed of a plurality of input attributes and output attributes in the basic data group or the second basic data group includes: Each is provided with a discrimination key, and the review graph creating means sets the target data group to be the target of the review graph as the basic data group or the second basic data group, and for the target data group Both the first graph showing the change of the input attribute corresponding to the acquired specific input attribute condition for each of the discrimination keys and the second graph showing the change of the output attribute for each of the discrimination keys A graph to be output as the review graph. In the first graph, the output attribute condition that satisfies the input attribute condition and corresponds to the second data group is output. May be configured to marking process is performed on data that satisfies.

上記構成において、判別キーは、基本データ群のデータの1つずつに異なる判別キーを付与してもよく、基本データ群のデータのグループごとに異なる判別キーを付与してもよい。   In the above configuration, the determination key may be assigned a different determination key for each piece of data in the basic data group, or may be assigned a different determination key for each group of data in the basic data group.

本発明のデータ分析装置は、上記構成のデータ分析装置において、前記基本データ群は、異なる時点に対応する複数のデータを含み、前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性の時間変化を示す第1のトレンドグラフと、前記出力属性の時間変化を示す第2のトレンドグラフとを共に示す第1のレビューグラフを前記レビューグラフとして出力するものであり、前記第1のトレンドグラフでは、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている構成であってもよい。   The data analysis apparatus according to the present invention is the data analysis apparatus having the above-described configuration, wherein the basic data group includes a plurality of data corresponding to different time points, and the target data group to be created as the review graph is the basic data. A first trend graph showing the time change of the input attribute corresponding to the acquired specific input attribute condition for the target data group and the time change of the output attribute A first review graph showing both the second trend graph and the second trend graph are output as the review graph. In the first trend graph, the input attribute condition is satisfied, and the second data group includes A configuration in which marking processing is performed on data corresponding to the corresponding output attribute condition may be employed.

上記構成によれば、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」条件の中から取得された特定の入力属性条件に対応する入力属性の時間変化を示す第1のトレンドグラフを含む第1のレビューグラフを出力するようになっている。さらに、上記構成によれば、第1のトレンドグラフにおいては、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている。これらにより、ユーザは、第1のトレンドグラフから、特定の入力属性条件が第2データ群に対応する出力属性の要因となっている期間を容易に知ることができる。さらに、上記構成によれば、第1のレビューグラフには、第1のトレンドグラフと共に、出力属性の時間変化を示す第2のトレンドグラフが示されているので、ユーザは、これらの時間変化を比較することで、特定の入力属性条件の時間変化について、出力属性の時間変化との同期性(関連性)を即座に理解することができる。   According to the above configuration, the specific data acquired from the condition that “the second data group is grouped into a data group that satisfies the input attribute condition and the first data group is grouped into a data group that does not satisfy the input attribute condition”. The first review graph including the first trend graph indicating the time change of the input attribute corresponding to the input attribute condition is output. Further, according to the above configuration, in the first trend graph, marking processing is performed on data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the second data group. Accordingly, the user can easily know from the first trend graph the period during which the specific input attribute condition is the cause of the output attribute corresponding to the second data group. Further, according to the above configuration, the first review graph includes the first trend graph and the second trend graph indicating the time change of the output attribute. By comparing, it is possible to immediately understand the synchronization (relevance) of the time change of the specific input attribute condition with the time change of the output attribute.

なお、「マーキング処理」とは、レビューグラフにおける特定のデータを示す部分に対して、他のデータを示す部分と区別できるような標識を付ける処理、例えば、特定のデータを示す部分に他のデータを示す部分と異なる色を付ける処理、特定のデータを示す部分の形状を他のデータを示す部分と異なる形状に変える処理、特定のデータを示す部分のみに印(例えば、囲み線)を付ける処理等を指す。   Note that the “marking process” is a process for marking a part indicating specific data in a review graph so that it can be distinguished from a part indicating other data, for example, other data in a part indicating specific data. Processing that gives a color different from the part that indicates, Processing that changes the shape of the part that shows specific data to a shape that is different from the part that shows other data, Process that puts a mark (for example, a surrounding line) only on the part showing specific data Etc.

本発明のデータ分析装置は、上記構成のデータ分析装置において、前記基本データ群は、面内の異なる位置に対応する複数のデータを含み、前記レビューグラフ作成手段は、前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性の面内分布を表す第1のマップと、前記出力属性の面内分布を表す第2のマップとを共に示す第2のレビューグラフを前記レビューグラフとして出力するものであり、前記第1のマップでは、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている構成であってもよい。   The data analysis apparatus according to the present invention is the data analysis apparatus having the above configuration, wherein the basic data group includes a plurality of data corresponding to different positions in a plane, and the review graph creation means is a target for creating the review graph. The target data group is the basic data group or the second basic data group, and the first in-plane distribution of the input attribute corresponding to the acquired specific input attribute condition is expressed for the target data group. And a second review graph showing both the second map representing the in-plane distribution of the output attribute as the review graph, and the first map satisfies the input attribute condition. And the structure by which the marking process is given to the data which satisfy | fills the output attribute conditions corresponding to a said 2nd data group may be sufficient.

上記構成によれば、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」条件の中から取得された特定の入力属性条件に対応する入力属性の面内分布を示す第1のマップを含む第2のレビューグラフを出力するようになっている。さらに、上記構成によれば、第1のマップにおいては、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている。これらにより、ユーザは、第1のマップから、特定の入力属性条件が第2データ群に対応する出力属性の要因となっている可能性のある面内位置を容易に知ることができる。さらに、上記構成によれば、第2のレビューグラフには、第1のマップと共に、出力属性の面内分布を示す第2のマップが示されているので、ユーザは、これらの面内分布を比較することで、特定の入力属性条件の面内分布について、出力属性の面内分布との同期性(関連性)を即座に理解することができる。   According to the above configuration, the specific data acquired from the condition that “the second data group is grouped into a data group that satisfies the input attribute condition and the first data group is grouped into a data group that does not satisfy the input attribute condition”. The second review graph including the first map indicating the in-plane distribution of the input attribute corresponding to the input attribute condition is output. Further, according to the above configuration, in the first map, marking processing is performed on data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the second data group. As a result, the user can easily know from the first map the in-plane position where the specific input attribute condition may cause the output attribute corresponding to the second data group. Furthermore, according to the above configuration, since the second review graph shows the second map indicating the in-plane distribution of the output attribute together with the first map, the user can display these in-plane distributions. By comparing, it is possible to immediately understand the synchronism (relationship) between the in-plane distribution of the specific input attribute condition and the in-plane distribution of the output attribute.

本発明のデータ分析装置は、上記構成のデータ分析装置において、前記レビューグラフ作成手段は、前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性と、前記出力属性との関係を示す散布図である第3のレビューグラフを前記レビューグラフとして出力するものであり、前記散布図では、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている構成であってもよい。   The data analysis apparatus according to the present invention is the data analysis apparatus having the above-described configuration, wherein the review graph creating means sets the target data group to be created as the review graph as the basic data group or the second basic data group. A third review graph, which is a scatter diagram showing the relationship between the input attribute corresponding to the acquired specific input attribute condition and the output attribute, is output as the review graph for the target data group. Yes, the scatter diagram may be configured such that marking processing is performed on data that satisfies the input attribute condition and satisfies the output attribute condition corresponding to the second data group.

上記構成によれば、前記取得された特定の入力属性条件に対応する入力属性と、前記出力属性との関係を示す散布図である第3のレビューグラフを出力することができる。この散布図を参照することにより、ユーザは、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」条件の中から取得された特定の入力属性条件について、多値的に見た出力属性との相関を、即座に理解することができる。   According to the said structure, the 3rd review graph which is a scatter diagram which shows the relationship between the input attribute corresponding to the acquired said specific input attribute condition, and the said output attribute can be output. By referring to this scatter diagram, the user can satisfy the condition of “the second data group is grouped into a data group that satisfies the input attribute condition and the first data group is grouped into a data group that does not satisfy the input attribute condition”. It is possible to immediately understand the correlation between the specific input attribute condition acquired from the inside and the output attribute viewed in multiple values.

本発明のデータ分析装置は、上記構成のデータ分析装置において、前記レビューグラフ作成手段は、ユーザが、散布図の軸に対応する入力属性条件とは異なる他の入力属性条件による系列分けを指示したことに応答して、前記他の入力属性条件を満たすデータと、前記他の入力属性条件を満たさないデータとを異なる形態で散布図に示す構成であってもよい。   In the data analysis apparatus according to the present invention, in the data analysis apparatus having the above-described configuration, the review graph creating means instructs the grouping by another input attribute condition different from the input attribute condition corresponding to the axis of the scatter diagram. In response to this, the configuration may be such that the data satisfying the other input attribute condition and the data not satisfying the other input attribute condition are shown in a scatter diagram in different forms.

上記構成によれば、ユーザは、散布図を参照することにより、入力属性条件決定手段により決定された入力属性条件の中から取得された特定の入力属性条件と出力属性との相関を、他の入力属性条件と出力属性との相関とは独立して理解することができる。   According to the above configuration, the user refers to the scatter diagram to obtain the correlation between the specific input attribute condition acquired from the input attribute condition determined by the input attribute condition determining unit and the output attribute, The correlation between the input attribute condition and the output attribute can be understood independently.

本発明のデータ分析装置は、上記構成のデータ分析装置において、前記レビューグラフ作成手段は、前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、該対象データ群を、前記取得した特定の入力属性条件を満たすデータ群と、該入力属性条件を満たさないデータ群とに分離し、前記データ群の各々における、前記出力属性の度数分布を示す第4のレビューグラフを前記レビューグラフとして出力するものである構成であってもよい。   The data analysis apparatus according to the present invention is the data analysis apparatus having the above-described configuration, wherein the review graph creating means sets the target data group to be created as the review graph as the basic data group or the second basic data group. The target data group is separated into a data group satisfying the acquired specific input attribute condition and a data group not satisfying the input attribute condition, and the frequency distribution of the output attribute in each of the data groups is shown. The structure which outputs a 4th review graph as said review graph may be sufficient.

上記構成によれば、前記基本データ群を、前記取得された特定の入力属性条件を満たすデータ群と、該入力属性条件を満たさないデータ群とに分離し、前記データ群の各々における、前記出力属性の度数分布を示す第4のレビューグラフを前記レビューグラフとして出力することができる。この度数分布を示す第4のレビューグラフを参照することにより、ユーザは、入力属性条件決定手段により決定された入力属性条件の中から取得された特定の入力属性条件とその排他的条件とによる、第1データ群と第2データ群との切分けの程度を、直感的に理解することができる。   According to the above configuration, the basic data group is separated into a data group that satisfies the acquired specific input attribute condition and a data group that does not satisfy the input attribute condition, and the output in each of the data groups A fourth review graph indicating the frequency distribution of attributes can be output as the review graph. By referring to the fourth review graph indicating this frequency distribution, the user can obtain the specific input attribute condition acquired from the input attribute conditions determined by the input attribute condition determination means and the exclusive condition, The degree of separation between the first data group and the second data group can be intuitively understood.

本発明のデータ分析装置は、上記の課題を解決するために、複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係の分析結果を出力するデータ分析装置であって、前記出力属性の値に基づいて、前記基本データ群を、第1データ群と第2データ群とに分類する分類手段と、前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する入力属性条件決定手段と、前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つ以上の入力属性条件を取得し、前記特定の2つ以上の入力属性条件が交絡した条件に基づいて前記基本データ群から抽出されるデータ群と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を表す複合要因グラフを出力する複合要因グラフ作成手段とを含むことを特徴としている。   In order to solve the above problems, the data analysis apparatus of the present invention provides the input attribute and the output attribute for a basic data group that is a set of data composed of a plurality of input attributes and output attributes. Analyzing the causal relationship and outputting the analysis result of the causal relationship, and classifying the basic data group into a first data group and a second data group based on the value of the output attribute A plurality of input attributes, the input attribute condition being an input attribute condition for bisecting the basic data group so that the first data group and the second data group are each grouped Each of the input attribute condition determining means to determine, and two or more specific input attribute conditions are acquired from the plurality of input attribute conditions determined by the input attribute condition determining means, and the specified 2 or more of The first data group and the second data group obtained by bifurcation of a data group extracted from the basic data group based on a condition entangled with an input attribute condition, and the basic data group based on a value of the output attribute And a composite factor graph creating means for outputting a composite factor graph representing a correspondence relationship between at least one of the above.

上記構成によれば、特定の2つ以上の入力属性条件が交絡した条件に基づいて前記基本データ群から抽出されるデータ群と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を視覚的に表す複合要因グラフを出力するようになっている。これにより、特定の2つ以上の入力属性条件が交絡した条件が、第1データ群および第2データ群の少なくとも一方の要因となっているかを示す分析結果をユーザに提示できる。したがって、ユーザは、分析結果を直感的に理解することができる。また、「ユーザによって結果の評価がばらつく」という従来の回帰木の問題も解消できる。   According to the above configuration, the data group extracted from the basic data group based on a condition in which two or more specific input attribute conditions are entangled and the basic data group based on a value of the output attribute are obtained by bisection. A composite factor graph that visually represents a correspondence relationship with at least one of the first data group and the second data group is output. As a result, it is possible to present to the user an analysis result indicating whether a condition in which two or more specific input attribute conditions are entangled is a factor of at least one of the first data group and the second data group. Therefore, the user can intuitively understand the analysis result. In addition, the conventional regression tree problem that “the evaluation of the result varies depending on the user” can be solved.

これらの効果は、(1)分類手段が、出力属性の値に基づいて基本データ群を第1データ群と第2データ群とに分類していること、および(2)入力属性条件決定手段が、前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定していることによる。すなわち、(1)出力属性による基本データ群の2分化と、(2)入力属性による基本データ群の2分化とによって、分析結果を評価する際の着目点を明確にしていることによる。   These effects are as follows: (1) the classification means classifies the basic data group into the first data group and the second data group based on the value of the output attribute; and (2) the input attribute condition determination means The input attribute condition, which is an input attribute condition for dividing the basic data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are grouped. It depends on what has been decided. That is, the point of interest when evaluating the analysis result is clarified by (1) bisection of the basic data group based on the output attribute and (2) bisection of the basic data group based on the input attribute.

以上のように、上記構成によれば、「明確な指標に基づく、分析結果の直感的な評価を可能とするデータ分析装置を提供する」という本発明の目的を達成できる。   As described above, according to the above configuration, the object of the present invention of “providing a data analysis apparatus capable of intuitively evaluating an analysis result based on a clear index” can be achieved.

また、上記構成によれば、全ての入力属性について問題事象の要因となる入力属性条件を抽出しているから、分岐条件に競合因子が存在しても、その要因を逃すことなく、確実に捉えることができる。   In addition, according to the above configuration, since the input attribute condition that causes the problem event is extracted for all the input attributes, even if there is a competing factor in the branch condition, it is reliably captured without missing the factor. be able to.

なお、レビューグラフ作成手段を含むデータ分析装置に係る発明と、複合要因グラフ作成手段を含むデータ分析装置に係る発明とは、分類手段および入力属性条件決定手段という同一の技術的特徴、並びに「明確な指標に基づく、分析結果の直感的な評価を可能とするデータ分析装置を提供する」という、発明の先行技術に対する貢献を明示する特別な技術的特徴(レビューグラフ作成手段および複合要因グラフ作成手段)を有していることにより、単一の一般的発明概念を形成するように連関している。   The invention relating to the data analysis apparatus including the review graph creating means and the invention relating to the data analysis apparatus including the composite factor graph creating means have the same technical features as the classification means and the input attribute condition determining means, Special technical feature (review graph creation means and composite factor graph creation means) that clearly shows the contribution of the invention to the prior art, "Providing a data analysis device that enables intuitive evaluation of analysis results based on various indicators" ) To form a single general inventive concept.

ここで、「2つ以上の前記入力属性条件が交絡した条件」とは、2つ以上の前記入力属性条件を組み合わせた条件、例えば、2つ以上の入力属性条件の論理積(2つ以上の入力属性条件の全てを満たす条件)、2つ以上の入力属性条件の否定論理積(2つの入力属性条件の各々に対する排他的条件を全て満たす条件)、2つの入力属性条件の排他的論理和(2つの入力属性条件のうちの一方の条件のみを満たす条件)等を指す。   Here, “a condition in which two or more input attribute conditions are entangled” means a condition obtained by combining two or more input attribute conditions, for example, a logical product (two or more input attribute conditions). A condition that satisfies all of the input attribute conditions) a negative logical product of two or more input attribute conditions (a condition that satisfies all the exclusive conditions for each of the two input attribute conditions), and an exclusive OR of the two input attribute conditions ( A condition that satisfies only one of the two input attribute conditions).

本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件決定手段で決定された複数の前記入力属性条件の一覧を出力する入力属性条件一覧作成手段をさらに含み、前記複合要因グラフ作成手段は、ユーザが、前記入力属性条件一覧作成手段で出力された一覧に含まれる複数の前記入力属性条件の中から特定の入力属性条件を選択する選択操作、および、複合要因グラフ描画指示を行うことに応答して、前記選択された入力属性条件を含む入力属性条件を、前記特定の2つ以上の入力属性条件として取得し、前記複合要因グラフの出力を行うものである構成である。   The data analysis apparatus of the present invention preferably further includes an input attribute condition list creation means for outputting a list of the plurality of input attribute conditions determined by the input attribute condition determination means in the data analysis apparatus having the above configuration, The composite factor graph creating means includes a selection operation in which a user selects a specific input attribute condition from a plurality of the input attribute conditions included in the list output by the input attribute condition list creating means, and a composite factor In response to performing a graph drawing instruction, the input attribute condition including the selected input attribute condition is acquired as the two or more specific input attribute conditions, and the composite factor graph is output. It is a configuration.

上記構成によれば、前記入力属性条件決定手段で決定された複数の前記入力属性条件の一覧を出力する入力属性条件一覧作成手段をさらに含み、前記複合要因グラフ作成手段は、ユーザが、前記入力属性条件一覧作成手段で出力された一覧に含まれる複数の前記入力属性条件の中から特定の入力属性条件を選択する選択操作に応答して、前記選択された入力属性条件を含む入力属性条件を、前記特定の2つ以上の入力属性条件として取得し、前記複合要因グラフの出力を行う。これにより、ユーザが、前記入力属性条件決定手段で決定された複数の前記入力属性条件のうち、任意の入力属性条件の組合わせに基づいた複合要因グラフを得ることができる。   According to the above configuration, the apparatus further includes an input attribute condition list creating unit that outputs a list of the plurality of input attribute conditions determined by the input attribute condition determining unit, wherein the composite factor graph creating unit is configured so that the user can input the input attribute condition list. In response to a selection operation for selecting a specific input attribute condition from a plurality of the input attribute conditions included in the list output by the attribute condition list creating means, an input attribute condition including the selected input attribute condition is The two or more specific input attribute conditions are acquired, and the composite factor graph is output. Thereby, the user can obtain a composite factor graph based on a combination of arbitrary input attribute conditions among the plurality of input attribute conditions determined by the input attribute condition determining means.

さらに、上記構成によれば、前記複合要因グラフの出力は、ユーザが複合要因グラフ描画指示を行うことに応答して行われる。これにより、ユーザの希望に応じて複合要因グラフを適時に出力することができ、また、複数種類の複合要因グラフを出力することができる。   Further, according to the above configuration, the composite factor graph is output in response to a user giving a composite factor graph drawing instruction. As a result, a composite factor graph can be output in a timely manner according to the user's wishes, and a plurality of types of composite factor graphs can be output.

なお、上記の特定の2つ以上の入力属性条件は、上記構成のようにユーザの選択操作によって取得する代わりに、データ分析装置内の選択手段から取得してもよい。この選択手段としては、「入力属性条件に該当するデータ群に含まれる第2データ群の割合」やGiniインデックス法の改善度などを指標として、これらの指標値の高い入力属性条件を選択する選択手段や、単に、入力属性条件一覧作成手段で出力された一覧に含まれる入力属性条件の中から所定数の入力属性条件の組合せの全てを選択する選択手段などを用いることができる。また、上記入力属性条件決定手段における入力属性条件決定の基準(指標)としては、Giniインデックス法の改善度や、、前述した頻度差分値、および、これらの組み合わせ等を用いることができる。   Note that the two or more specific input attribute conditions may be acquired from a selection unit in the data analysis apparatus instead of being acquired by a user selection operation as in the above configuration. As the selection means, a selection of selecting an input attribute condition having a high index value by using “the ratio of the second data group included in the data group corresponding to the input attribute condition” or the improvement degree of the Gini index method as an index. Or a selection means for selecting all combinations of a predetermined number of input attribute conditions from among the input attribute conditions included in the list output by the input attribute condition list creation means. Further, as the reference (index) for determining the input attribute condition in the input attribute condition determining means, the improvement degree of the Gini index method, the above-described frequency difference value, a combination thereof, and the like can be used.

本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、前記入力属性条件の一覧には、前記入力属性条件決定手段で決定された複数の前記入力属性条件の各々に関する、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数と、前記基本データ群中で該入力属性条件を満たすデータの中に前記第2データ群が含まれるデータ個数の割合を表す第2データ群分離度とが、前記入力属性条件に併せて示されている構成である。   In the data analysis device of the present invention, preferably, in the data analysis device configured as described above, the input attribute condition determined by the input attribute condition determining means is “the second data group in the data group that satisfies the input attribute condition”. The first data group is grouped into a data group that does not satisfy the input attribute condition ”, and the input attribute condition list includes a plurality of items determined by the input attribute condition determining unit. A second data group corresponding number that represents the number of data that satisfies the input attribute condition in the basic data group and that corresponds to the second data group, and the basic data group And the second data group separation degree indicating the ratio of the number of data in which the second data group is included in the data satisfying the input attribute condition is also shown together with the input attribute condition It is a configuration.

上記構成によれば、前記入力属性条件の一覧には、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数と、前記基本データ群中で該入力属性条件を満たすデータの中に前記第2データ群が含まれるデータ個数の割合を表す第2データ群分離度とが、前記入力属性条件に併せて示されている。このため、ユーザは、入力属性条件の一覧と併せて示された、第2データ群該当数および第2データ群分離度を参照することで、各入力属性条件が第2データ群に対応する出力属性の発生にどれほど寄与しているのかを知ることができる。それゆえ、ユーザが、第2データ群に対応する出力属性の要因を発見できる可能性の高い複合要因グラフを作成することが可能となる。   According to the above configuration, the list of the input attribute conditions includes the second data group corresponding number representing the number of data satisfying the input attribute condition in the basic data group and corresponding to the second data group; The second data group separation degree representing the ratio of the number of data in which the second data group is included in the data satisfying the input attribute condition in the basic data group is indicated together with the input attribute condition. Yes. For this reason, the user refers to the second data group hit count and the second data group separation degree shown together with the list of input attribute conditions, so that each input attribute condition corresponds to the second data group. You can know how much it contributes to the generation of attributes. Therefore, it is possible to create a composite factor graph with a high possibility that the user can find the factor of the output attribute corresponding to the second data group.

また、上記構成によれば、第2データ群該当数および第2データ群分離度の両方が前記入力属性条件の一覧に示されている。これにより、ユーザは、用途によって、(1)第2データ群該当数、(2)第2データ群分離度、(3)第2データ群該当数および第2データ群分離度、のいずれかを指標として選択し、その指標に基づいて複合要因グラフを作成することができる。したがって、ユーザが、用途に応じた複合要因グラフを容易に作成することができる。   Further, according to the above configuration, both the number of corresponding second data groups and the second data group separation degree are shown in the list of input attribute conditions. Accordingly, the user can select one of (1) the number of corresponding second data groups, (2) the degree of second data group separation, (3) the number of corresponding second data groups and the degree of second data group separation depending on the application. It can be selected as an index, and a composite factor graph can be created based on the index. Therefore, the user can easily create a composite factor graph according to the application.

本発明のデータ分析装置は、好ましくは、上記構成のデータ分析装置において、前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、前記入力属性条件決定手段で決定された複数の前記入力属性条件に対して、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数、および、前記基本データ群中で該入力属性条件を満たすデータの中における、前記第2データ群に該当するデータ個数の割合を表す第2データ群分離度の少なくとも一方を指標として、前記第2データ群に対応する出力属性条件の要因としての重要度による順位付けを行う順位決定手段をさらに含み、前記入力属性条件一覧作成手段は、前記順位決定手段による順位付けの結果を前記入力属性条件の一覧に示す構成である。   In the data analysis device of the present invention, preferably, in the data analysis device configured as described above, the input attribute condition determined by the input attribute condition determining means is “the second data group in the data group that satisfies the input attribute condition”. Is a condition determined such that the first data group is collected in a data group that does not satisfy the input attribute condition, and for the plurality of input attribute conditions determined by the input attribute condition determining means, A second data group corresponding number representing the number of data corresponding to the second data group that satisfies the input attribute condition in the basic data group, and data satisfying the input attribute condition in the basic data group Output corresponding to the second data group, using as an index at least one of the second data group separation degrees indicating the ratio of the number of data corresponding to the second data group The input attribute condition list creation means further includes a ranking determination means for ranking by importance as a factor of the sex condition, and the input attribute condition list creation means shows a result of ranking by the ranking determination means in the list of input attribute conditions. .

上記構成によれば、入力属性条件一覧作成手段が、順位決定手段によって決定された、第2データ群該当数および/または第2データ群分離度に基づく優先順位付けの結果を併せて示す入力属性条件の一覧を作成する。この入力属性条件の一覧を参照することによって、ユーザは、第2データ群に対応する出力属性の要因となる複数の入力属性条件を一望して把握できるとともに、その重要度の順位を知ることができる。   According to the above configuration, the input attribute condition list creation unit also shows the input attribute that also indicates the result of prioritization based on the second data group hit count and / or the second data group separation degree determined by the rank determination unit Create a list of conditions. By referring to this list of input attribute conditions, the user can grasp and understand a plurality of input attribute conditions that cause the output attribute corresponding to the second data group, and know the order of importance. it can.

したがって、上記構成によれば、「所定の出力属性の要因(製品特性不良の要因等)を、優先順位を付けて明確に特定する、データ分析装置を提供する」という、本発明の他の目的を達成できる。   Therefore, according to the above configuration, another object of the present invention is to “provide a data analysis apparatus that clearly specifies a factor of a predetermined output attribute (such as a factor of product characteristic failure) with priority ranking”. Can be achieved.

また、上記構成によれば、ユーザは、入力属性条件の一覧における入力属性条件の並び順(優先順位)を参照しながら(すなわち、複合要因分析を行う暫定的な順番をナビゲーションされながら)選択操作を行うことによって、複合要因グラフを作成することができる。
本発明のデータ分析装置は、上記構成のデータ分析装置において、前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、前記複合要因グラフ作成手段は、前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つの入力属性条件を取得し、前記基本データ群中で、前記の2つの入力属性条件をともに満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果、および、前記基本データ群中で、前記2つの入力属性条件のうちの一方の条件のみを満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果が、それぞれ示されている第1の複合要因グラフを前記複合要因グラフとして出力するものである構成であってもよい。
Further, according to the above configuration, the user performs a selection operation while referring to the order (priority order) of the input attribute conditions in the list of input attribute conditions (that is, while navigating the provisional order for performing the complex factor analysis). By performing the above, a composite factor graph can be created.
In the data analysis apparatus according to the present invention, the input attribute condition determined by the input attribute condition determination unit in the data analysis apparatus having the above configuration is “the second data group is grouped into a data group that satisfies the input attribute condition, The composite factor graph creating means includes a plurality of the input attributes determined by the input attribute condition determining means, such that the first data group is collected into a data group that does not satisfy the input attribute condition. Result of obtaining two specific input attribute conditions from the conditions, and calculating the number of data satisfying both of the two input attribute conditions in the basic data group and corresponding to the second data group In the basic data group, the number of data satisfying only one of the two input attribute conditions and corresponding to the second data group is calculated. Fruit may be configured and outputs a first composite factor graph shown respectively as the multiple factors graph.

上記構成によれば、入力属性条件決定手段で決定された複数の前記入力属性条件の中から取得された、特定の2つの入力属性条件に対して、前記基本データ群中で、前記の2つの入力属性条件をともに満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果、および、前記基本データ群中で、前記2つの入力属性条件のうちの一方の条件のみを満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果が、それぞれ示されている第1の複合要因グラフを前記複合要因グラフとして出力することができる。これにより、第1の複合要因グラフを参照することにより、ユーザは、特定の2つの入力属性条件のうちの他方の入力属性条件が、特定の2つの入力属性条件のうちの一方の入力属性条件との複合要因(または主従の関係にある要因)を成すものであるのか、前記一方の入力属性条件とは独立した要因であるのかを知ることができる。したがって、入力属性条件決定手段により決定された入力属性条件の中から互いに複合要因となる複数の要因(または主従の関係にある複数の要因)、および、互いに独立した複数の要因を探すことができる。   According to the above configuration, for the two specific input attribute conditions acquired from the plurality of input attribute conditions determined by the input attribute condition determining means, Both the input attribute conditions are satisfied and the number of data corresponding to the second data group is calculated, and in the basic data group, only one of the two input attribute conditions is satisfied, In addition, it is possible to output, as the composite factor graph, the first composite factor graph in which the results of calculating the number of data corresponding to the second data group are respectively shown. Thereby, by referring to the first composite factor graph, the user can determine whether the other input attribute condition of the two specific input attribute conditions is one input attribute condition of the two specific input attribute conditions. It is possible to know whether it is a complex factor (or a factor that has a master-slave relationship) or a factor that is independent of the one input attribute condition. Therefore, a plurality of factors (or a plurality of factors having a master-slave relationship) that are complex factors and a plurality of factors that are independent from each other can be searched from the input attribute conditions determined by the input attribute condition determining means. .

本発明のデータ分析装置は、上記構成のデータ分析装置において、前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、前記複合要因グラフ作成手段は、前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つ以上の入力属性条件を、順位を付けて取得し、前記順位を付けて取得した入力属性条件の順位の順番に、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数を順次積算した結果を示す第2の複合要因グラフを前記複合要因グラフとして出力するものである構成であってもよい。   In the data analysis apparatus according to the present invention, the input attribute condition determined by the input attribute condition determination unit in the data analysis apparatus having the above configuration is “the second data group is grouped into a data group that satisfies the input attribute condition, The composite factor graph creating means includes a plurality of the input attributes determined by the input attribute condition determining means, such that the first data group is collected into a data group that does not satisfy the input attribute condition. Two or more specific input attribute conditions are acquired from the conditions by ranking, and the input attribute conditions are satisfied in the basic data group in the order of the ranking of the input attribute conditions acquired by ranking. In addition, a second composite factor graph showing the result of sequentially integrating the second data group corresponding number representing the number of data corresponding to the second data group is output as the composite factor graph. It may be in a configuration of.

上記構成によれば、前記順位を付けて取得した入力属性条件の順位の順番に、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数を順次積算した結果を示す第2の複合要因グラフを前記複合要因グラフとして出力することができる。この第2の複合要因グラフを参照することにより、ユーザは、取得された2つ以上の入力属性条件の妥当性、すなわち、第2データ群に対応する出力属性の要因となる入力属性条件をほぼ漏れなく選定できているかを確認することができる。   According to the above configuration, the number of pieces of data satisfying the input attribute condition in the basic data group and corresponding to the second data group is represented in the order of the rank of the input attribute condition acquired with the ranking. A second composite factor graph showing the result of sequentially integrating the number of hits in the second data group can be output as the composite factor graph. By referring to the second composite factor graph, the user can substantially determine the validity of the two or more acquired input attribute conditions, that is, the input attribute conditions that cause the output attribute corresponding to the second data group. It can be confirmed whether it is possible to select without omission.

本発明のデータ分析装置は、上記構成のデータ分析装置において、前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、前記複合要因グラフ作成手段は、前記基本データ群の中から、前記取得した2つ以上の入力属性条件を全て満たすデータ群と、前記取得した2つ以上の入力属性条件の各々に対する排他的条件を全て満たすデータ群とをそれぞれ抽出し、前記データ群の各々における、前記出力属性の度数分布を示す第3の複合要因グラフを前記複合要因グラフとして出力するものである構成であってもよい。   In the data analysis apparatus according to the present invention, the input attribute condition determined by the input attribute condition determination unit in the data analysis apparatus having the above configuration is “the second data group is grouped into a data group that satisfies the input attribute condition, The composite factor graph creating means is a condition determined such that the first data group is collected in a data group that does not satisfy the input attribute condition. A data group satisfying all of the input attribute conditions and a data group satisfying all of the exclusive conditions for each of the two or more acquired input attribute conditions are respectively extracted, and the frequency distribution of the output attribute in each of the data groups The third composite factor graph indicating the above may be output as the composite factor graph.

上記構成によれば、前記取得された複数の入力属性条件を全て満たすデータ群と、前記取得された複数の入力属性条件の各々に対する排他的条件を全て満たすデータ群との各々における、前記出力属性の度数分布を示す第3の複合要因グラフを出力することができる。これにより、第3の複合要因グラフを参照することにより、ユーザは、着目した複数の入力属性条件の相互間の影響を、確認することができる。   According to the above configuration, the output attribute in each of the data group that satisfies all of the plurality of acquired input attribute conditions and the data group that satisfies all of the exclusive conditions for each of the acquired plurality of input attribute conditions It is possible to output a third composite factor graph showing the frequency distribution. Thereby, by referring to the third composite factor graph, the user can confirm the mutual influence of the plurality of input attribute conditions of interest.

本発明のデータ分析装置において、前記入力属性条件決定手段は、前記分類手段による分類後の前記基本データ群の中から、分析の対象とする分析データ群を抽出する分析データ群抽出手段と、前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記分析データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する第1の入力属性条件決定手段と、前記第1の入力属性条件決定手段で決定された前記入力属性条件の中で、前記第2データ群を切出す確度が最も高い前記入力属性条件を、分岐条件として決定する分岐条件決定手段と、前記分岐条件決定手段で決定された前記分岐条件に基づいて、前記分析データ群を2つのデータ群に分割する分割手段と、前記第1の入力属性条件決定手段で決定された前記入力属性条件の中から前記第2データ群に対応する出力属性条件の要因としての重要度の高い入力属性条件を選定する第2の入力属性条件決定手段とを含み、前記分析データ群抽出手段は、前記分割手段で分割された2つのデータ群のうち、前記第2データ群の比率が小さい方のデータ群のみを新たな分析データ群として抽出し、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理が繰り返し実行されるようになっており、前記第2の入力属性条件決定手段は、前記入力属性の各々に対して、それぞれ、前記第1の入力属性条件決定手段の繰り返しの処理によって決定された該入力属性における複数の入力属性条件の中から前記重要度の高い入力属性条件を選定し、該選定された入力属性条件を、前記入力属性条件決定手段の出力として決定するものであることが好ましい。   In the data analysis apparatus of the present invention, the input attribute condition determination unit includes an analysis data group extraction unit that extracts an analysis data group to be analyzed from the basic data group after classification by the classification unit; An input attribute condition, which is an input attribute condition for bisecting the analysis data group, is set for each of the plurality of input attributes so that the first data group and the second data group are respectively combined. The first input attribute condition determining means for determining each of the input attribute conditions, and the input attribute condition having the highest probability of cutting out the second data group among the input attribute conditions determined by the first input attribute condition determining means. Branch condition determining means for determining the analysis data group into two data groups based on the branch condition determined by the branch condition determining means, A second input attribute condition for selecting a highly important input attribute condition as a factor of the output attribute condition corresponding to the second data group from the input attribute conditions determined by the first input attribute condition determining means And the analysis data group extraction means extracts only a data group having a smaller ratio of the second data group as a new analysis data group out of the two data groups divided by the division means. And a series of processes consisting of the processing by the analysis data group extracting means, the processing by the first input attribute condition determining means, the processing by the branch condition determining means, and the processing by the dividing means are repeatedly executed. The second input attribute condition determining means is determined for each of the input attributes by the repetition process of the first input attribute condition determining means. The input attribute condition having a high degree of importance is selected from a plurality of input attribute conditions in the input attribute, and the selected input attribute condition is determined as an output of the input attribute condition determining means. preferable.

上記構成によれば、第2の入力属性条件決定手段によって、前記第2データ群に対応する出力属性条件の要因としての重要度に基づいて重要度の高い入力属性条件を選定しているので、如何に複雑な回帰木となろうとも、第2データ群に対応する出力属性条件の要因を明確に把握することができる。   According to the above configuration, since the second input attribute condition determining means selects the input attribute condition having a high importance based on the importance as the factor of the output attribute condition corresponding to the second data group, Regardless of how complicated the regression tree is, the cause of the output attribute condition corresponding to the second data group can be clearly understood.

また、上記構成によれば、第2の入力属性条件決定手段が、繰り返し処理毎に決定された同一の入力属性における複数の入力属性条件のうちで重要度の高い条件のみを選択しているから、詳細な要因分析結果を得るために上記の繰り返し処理を行っても複雑化する事なく、非常に簡潔な形でありながら、高い確度で、第2データ群に対応する出力属性条件の要因を決定することができる。   Further, according to the above configuration, the second input attribute condition determining means selects only a highly important condition among a plurality of input attribute conditions in the same input attribute determined for each repetition process. In order to obtain detailed factor analysis results, the above-mentioned iterative process is not complicated, and the output attribute condition factor corresponding to the second data group can be determined with high accuracy while maintaining a very simple form. Can be determined.

さらに、上記構成によれば、前記分割手段によって分割される(分岐される)2つのデータ群(ノード)のうち、第2データ群の比率が小さい方のデータ群のみについて、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理を繰り返す。このように、第2データ群に対応する出力属性の要因が未発見のデータ群のみに対して、順次、第2データ群に対応する出力属性の要因となる入力属性条件の決定を行うから、それ以前の繰り返し処理で第2データ群の主要因として決定された入力属性条件の影響を除外して、第2データ群の新たな要因を高い確度で、かつ、効率的に抽出できる。   Furthermore, according to the above configuration, the analysis data group extraction is performed only for the data group having the smaller ratio of the second data group among the two data groups (nodes) divided (branched) by the dividing unit. A series of processing consisting of processing by means, processing by the first input attribute condition determining means, processing by the branch condition determining means, and processing by the dividing means is repeated. In this way, since the output attribute factor corresponding to the second data group is determined only for the data group in which the cause of the output attribute corresponding to the second data group is not yet found, the input attribute condition that causes the output attribute corresponding to the second data group is determined. By excluding the influence of the input attribute condition determined as the main factor of the second data group in the previous iterative process, the new factor of the second data group can be extracted with high accuracy and efficiency.

本発明のデータ分析装置は、上記の課題を解決するために、複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係を示す情報を抽出するデータ分析装置であって、前記出力属性の値に基づいて、前記基本データ群を、第1データ群と第2データ群とに分類する分類手段と、前記分類手段による分類後の前記基本データ群の中から、分析の対象とする分析データ群を抽出する分析データ群抽出手段と、前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記分析データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する第1の入力属性条件決定手段と、前記第1の入力属性条件決定手段で決定された前記入力属性条件の中で、前記第2データ群を切出す確度が最も高い前記入力属性条件を、分岐条件として決定する分岐条件決定手段と、前記分岐条件決定手段で決定された前記分岐条件に基づいて、前記分析データ群を2分化する分割手段とを含み、前記分析データ群抽出手段は、前記分割手段で分割されたデータ群のうち、前記第2データ群の比率が小さい方のデータ群のみを新たな分析データ群として抽出し、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理が繰り返し実行されるようになっていることを特徴としている。   In order to solve the above problems, the data analysis apparatus of the present invention provides the input attribute and the output attribute for a basic data group that is a set of data composed of a plurality of input attributes and output attributes. A data analysis apparatus for analyzing the causal relationship of the data and extracting information indicating the causal relationship, and classifying the basic data group into a first data group and a second data group based on the value of the output attribute Classification means, analysis data group extraction means for extracting an analysis data group to be analyzed from the basic data group after classification by the classification means, the first data group and the second data group, Are first input attribute condition determining means for determining, for each of the plurality of input attributes, an input attribute condition that is an input attribute condition for dividing the analysis data group into two. And before Among the input attribute conditions determined by the first input attribute condition determining means, the branch condition determining means for determining the input attribute condition having the highest probability of cutting out the second data group as a branch condition; A splitting unit that divides the analysis data group into two based on the branch condition determined by the branching condition determination unit, and the analysis data group extraction unit includes the data group divided by the splitting unit, Only a data group having a smaller ratio of the second data group is extracted as a new analysis data group, processing by the analysis data group extraction means, processing by the first input attribute condition determination means, and by the branch condition determination means A series of processes including processes and processes by the dividing unit are repeatedly executed.

上記構成によれば、前記分割手段によって分割される(分岐される)2つのデータ群(ノード)のうち、第2データ群の比率が小さい方のデータ群のみについて、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理を繰り返す。このように、第2データ群に対応する出力属性の要因が未発見のデータ群のみに対して、順次、第2データ群に対応する出力属性の要因となる入力属性条件の決定を行うから、それ以前の繰り返し処理で第2データ群の主要因として決定された入力属性条件の影響を除外して、第2データ群の新たな要因を高い確度で、かつ、効率的に抽出できる。   According to the above configuration, only the data group having the smaller ratio of the second data group among the two data groups (nodes) divided (branched) by the dividing unit is analyzed by the analysis data group extracting unit. A series of processing consisting of processing, processing by the first input attribute condition determining means, processing by the branch condition determining means, and processing by the dividing means is repeated. In this way, since the output attribute factor corresponding to the second data group is determined only for the data group in which the cause of the output attribute corresponding to the second data group is not yet found, the input attribute condition that causes the output attribute corresponding to the second data group is determined. By excluding the influence of the input attribute condition determined as the main factor of the second data group in the previous iterative process, the new factor of the second data group can be extracted with high accuracy and efficiency.

また、上記構成によれば、全ての入力属性について問題事象の要因となる入力属性条件を抽出しているから、分岐条件に競合因子が存在しても、その要因を逃すことなく、確実に捉えることができる。   In addition, according to the above configuration, since the input attribute condition that causes the problem event is extracted for all the input attributes, even if there is a competing factor in the branch condition, it is reliably captured without missing the factor. be able to.

なお、「第2データ群を切出す確度」とは、「該入力属性条件を満たすデータ群に前記第2データ群がまとまる」確度を指す。この「第2データ群を切出す確度」としては、Giniインデックス法の改善度や、「入力属性条件に該当するデータ群に含まれる第2データ群の割合」、前述した第1の頻度と第2の頻度との比率、前述した頻度差分値、これらの組み合わせ等を用いることができる。   Note that “the accuracy of cutting out the second data group” refers to the accuracy of “the second data group is collected in the data group that satisfies the input attribute condition”. As the “accuracy of cutting out the second data group”, the improvement degree of the Gini index method, “the ratio of the second data group included in the data group corresponding to the input attribute condition”, the first frequency and the first The ratio with the frequency of 2, the frequency difference value described above, a combination thereof, and the like can be used.

本発明のデータ分析装置およびデータ分析プログラムは、前記入力属性条件決定手段で決定された複数の前記入力属性条件から選ばれる特定の入力属性条件に基づく基本データ群の2分化によって得られる2つのデータ群と、出力属性の値に基づく基本データ群の2分化によって得られる2つのデータ群(第1データ群および第2データ群)と、の対応関係を視覚的に表すレビューグラフを出力するから、分析結果の直感的な評価が可能となる。   The data analysis apparatus and the data analysis program according to the present invention provide two data obtained by bifurcation of a basic data group based on a specific input attribute condition selected from a plurality of the input attribute conditions determined by the input attribute condition determining means Since a review graph that visually represents the correspondence between the group and two data groups (first data group and second data group) obtained by bisectioning the basic data group based on the value of the output attribute is output, Intuitive evaluation of analysis results is possible.

また、本発明のデータ分析装置およびデータ分析プログラムは、前記入力属性条件決定手段で決定された複数の前記入力属性条件から選ばれる特定の入力属性条件に基づく第2の基本データ群の2分化によって得られる2つのデータ群と、前記分類手段で前記基本データ群を分類した条件に基づく第2の基本データ群の2分化によって得られる2つのデータ群と、の対応関係を視覚的に表すレビューグラフを出力するから、分析結果の直感的な評価が可能となる。   Further, the data analysis apparatus and the data analysis program of the present invention are obtained by bisecting the second basic data group based on a specific input attribute condition selected from the plurality of input attribute conditions determined by the input attribute condition determining means. A review graph that visually represents the correspondence between the two data groups obtained and the two data groups obtained by bisectioning the second basic data group based on the conditions for classifying the basic data group by the classification means Can be intuitively evaluated.

また、本発明のデータ分析装置およびデータ分析プログラムは、前記入力属性条件決定手段で決定された複数の前記入力属性条件から選ばれる特定の2つ以上の前記入力属性条件が交絡した条件に基づいて前記基本データ群から抽出されるデータ群と、出力属性の値に基づく基本データ群の2分化によって得られる2つのデータ群(第1データ群および第2データ群)と、の対応関係を表す複合要因グラフを出力するから、分析結果の直感的な評価が可能となる。   Further, the data analysis apparatus and the data analysis program of the present invention are based on a condition in which two or more specific input attribute conditions selected from the plurality of input attribute conditions determined by the input attribute condition determining means are entangled. A composite representing a correspondence relationship between a data group extracted from the basic data group and two data groups (first data group and second data group) obtained by dividing the basic data group based on the value of the output attribute Since the factor graph is output, the analysis result can be intuitively evaluated.

また、本発明のデータ分析装置において、出力属性の値に基づいて、基本データ群を、第1データ群と第2データ群とに分類する分類手段と、第1データ群と第2データ群とが、それぞれまとまるように、基本データ群を2分化するための入力属性条件を決定する入力属性条件決定手段と、入力属性条件決定手段で決定された複数の入力属性条件の一覧を出力する入力属性条件一覧作成手段とを備えており、この入力属性条件の一覧において、第2データ群該当数、および/または、第2データ群分離度に基づいて、複数の入力属性条件に対する優先順位付けがなされている場合には、所定の出力属性の要因を、優先順位を付けて明確に特定することができるという効果も得られる。   In the data analysis apparatus of the present invention, the classification means for classifying the basic data group into the first data group and the second data group based on the value of the output attribute, the first data group and the second data group, Input attribute condition determining means for determining an input attribute condition for dividing the basic data group into two parts, and an input attribute for outputting a list of a plurality of input attribute conditions determined by the input attribute condition determining means And a condition list creating means. In this list of input attribute conditions, priorities are assigned to a plurality of input attribute conditions based on the number of second data group hits and / or the second data group separation degree. In this case, it is possible to clearly specify the factor of the predetermined output attribute by assigning priority.

また、本発明のデータ分析装置およびデータ分析プログラムは、第2データ群に対応する出力属性の要因が未発見のデータ群のみに対して、順次、第2データ群に対応する出力属性の要因となる入力属性条件の決定を行うから、それ以前の繰り返し処理で第2データ群の主要因として決定された入力属性条件の影響を除外して、第2データ群の新たな要因を高い確度で、かつ、効率的に抽出できる。   Further, the data analysis apparatus and the data analysis program of the present invention sequentially outputs the output attribute factor corresponding to the second data group to only the data group for which the output attribute factor corresponding to the second data group is not found. Since the input attribute condition is determined, the influence of the input attribute condition determined as the main factor of the second data group in the previous iterative process is excluded, and the new factor of the second data group is highly accurate. And it can extract efficiently.

本発明の一実施形態を以下に説明する。   One embodiment of the present invention will be described below.

まず、本実施形態のデータ分析装置の構成を図1に基づいて説明する。図1に示すように、データ分析装置は、基本データ群格納部1、分類条件設定部3、データ分類部(分類手段)4、分類後基本データ群格納部5、分析データ群抽出部(分析データ群抽出手段)6、第1の入力属性条件決定部(第1の入力属性条件決定手段)12、分析結果データ格納部13、分岐条件決定部(分岐条件決定手段)14、データ分割部(分割手段)15、終了条件判定部16、不良品データ演算部17、第2の入力属性条件決定部(第2の入力属性条件決定手段)19、入力属性条件一覧グラフ作成部(入力属性条件一覧作成手段)20、レビューグラフ作成部(第2の基本データ群作成手段、レビューグラフ作成手段)21、複合要因グラフ作成部(複合要因グラフ作成手段)22、および順位決定部(順位決定手段)23を備えている。なお、上記の分析データ群抽出部(分析データ群抽出手段)6、第1の入力属性条件決定部(第1の入力属性条件決定手段)12、分析結果データ格納部13、分岐条件決定部(分岐条件決定手段)14、データ分割部(分割手段)15、終了条件判定部16、不良品データ演算部17、および、第2の入力属性条件決定部(第2の入力属性条件決定手段)19が、特許請求の範囲における入力属性条件決定手段としての入力属性条件決定部100を構成している。   First, the structure of the data analysis apparatus of this embodiment is demonstrated based on FIG. As shown in FIG. 1, the data analysis apparatus includes a basic data group storage unit 1, a classification condition setting unit 3, a data classification unit (classification means) 4, a post-classification basic data group storage unit 5, an analysis data group extraction unit (analysis). Data group extracting means) 6, first input attribute condition determining section (first input attribute condition determining means) 12, analysis result data storage section 13, branch condition determining section (branch condition determining means) 14, data dividing section ( (Dividing means) 15, end condition determination unit 16, defective product data calculation unit 17, second input attribute condition determination unit (second input attribute condition determination unit) 19, input attribute condition list graph creation unit (input attribute condition list) Creating means) 20, review graph creating section (second basic data group creating means, review graph creating means) 21, composite factor graph creating section (composite factor graph creating means) 22, and rank determining section (rank determining means) 2 It is equipped with a. The analysis data group extraction unit (analysis data group extraction unit) 6, the first input attribute condition determination unit (first input attribute condition determination unit) 12, the analysis result data storage unit 13, the branch condition determination unit ( Branch condition determining means) 14, data dividing section (dividing means) 15, end condition determining section 16, defective product data calculating section 17, and second input attribute condition determining section (second input attribute condition determining means) 19 Constitutes the input attribute condition determining unit 100 as the input attribute condition determining means in the claims.

また、データ分析装置には、データ分析装置の分類条件設定部3に分類条件の設定情報を入力するための、キーボードやポインティングデバイス等の入力デバイス30と、データ分析装置の入力属性条件一覧グラフ作成部20にユーザ指示を送るための、キーボードやポインティングデバイス、スイッチ等の入力デバイス31と、レビューグラフ等を表示する表示装置32とが接続されている。なお、入力デバイス30と入力デバイス31とは、1つの入力デバイス、例えばキーボードで実現してもよい。また、表示装置32に代えて、表示装置以外の出力デバイス、例えば印刷装置を用いてレビューグラフ等を出力するようにしてもよい。   Further, the data analysis apparatus creates an input device 30 such as a keyboard and a pointing device for inputting classification condition setting information to the classification condition setting unit 3 of the data analysis apparatus, and an input attribute condition list graph of the data analysis apparatus. An input device 31 such as a keyboard, a pointing device, and a switch for sending a user instruction to the unit 20 and a display device 32 that displays a review graph and the like are connected. Note that the input device 30 and the input device 31 may be realized by a single input device, for example, a keyboard. Instead of the display device 32, a review graph or the like may be output using an output device other than the display device, for example, a printing device.

次に、表1のデータ群DAを基本データ群とする場合を例として、本実施形態のデータ分析装置の動作を説明する。表1の基本データ群DAは、ハードディスク等の基本データ群格納部1に格納されている。   Next, the operation of the data analysis apparatus of the present embodiment will be described by taking as an example the case where the data group DA in Table 1 is a basic data group. The basic data group DA in Table 1 is stored in the basic data group storage 1 such as a hard disk.

Figure 2006048183
Figure 2006048183

表1の基本データ群DAは、製造工程で製造される液晶パネルやICチップなどの、複数の素子(機能素子)を基板上に配置した製品に関し、素子の1個毎に、各素子の特性データ、検査データ、および、プロセスデータなどを並べたデータ群のサンプルである。   The basic data group DA in Table 1 relates to products in which a plurality of elements (functional elements) such as liquid crystal panels and IC chips manufactured in the manufacturing process are arranged on a substrate, and the characteristics of each element for each element. It is a sample of a data group in which data, inspection data, process data, and the like are arranged.

表1において、「素子番号」は、各素子の1個毎に付与された素子特有の番号、「基板番号」は各素子が属する基板の番号、「素子座標番号」は、各素子の基板内における座標位置の番号を、それぞれ表している。基本データ群DAに含まれる複数のデータは各々、表1に示すように、8つの入力属性1〜8と、出力属性と、素子番号と、基板番号と、素子座標番号とを含んでいる。各基板は、同じ製造工程において製造され、その番号は、製造時期の順に付与されている。   In Table 1, “element number” is a unique number assigned to each element, “substrate number” is the number of the substrate to which each element belongs, and “element coordinate number” is the number of each element in the substrate. The numbers of the coordinate positions in are respectively represented. As shown in Table 1, each of the plurality of data included in the basic data group DA includes eight input attributes 1 to 8, an output attribute, an element number, a board number, and an element coordinate number. Each substrate is manufactured in the same manufacturing process, and the numbers are given in the order of manufacturing time.

また、「出力属性」は、素子の特性データなど、分析の対象とする属性を表し、「入力属性1〜8」は、製造プロセス条件やインライン検査データ(製造途中での検査結果)など、「出力属性」に影響を与える属性を表している。   The “output attribute” represents an attribute to be analyzed such as element characteristic data, and “input attributes 1 to 8” include “manufacturing process conditions and in-line inspection data (inspection results during manufacturing)”. Indicates an attribute that affects the “output attribute”.

図2は、「出力属性」の値の基板毎の推移を示すトレンドグラフで、同一基板内の各素子の「出力属性」の値の平均値を、基板毎に示している。図3は、「出力属性」の値の面内分布を示すマップで、同一の「素子座標番号」にある各素子の「出力属性」の値の平均値の大きい素子座標位置を赤色(図面上では網掛けのハッチングで示す)で、他の座標位置が緑色(図面上では斜線のハッチングで示す)で示している。   FIG. 2 is a trend graph showing the transition of the “output attribute” value for each board, and shows the average value of the “output attribute” values of each element in the same board for each board. FIG. 3 is a map showing the in-plane distribution of the “output attribute” value. The element coordinate position where the average value of the “output attribute” value of each element in the same “element coordinate number” is large is shown in red (on the drawing). The other coordinate positions are shown in green (indicated by hatching in the drawing).

いま、「出力属性」の値が2.5よりも大きい素子(「出力属性」>2.5)を不良品として、この不良の要因を「入力属性1〜8」の中から抽出し、その結果を評価する場合を例として、図1のデータ分析装置の動作を説明する。   Now, an element having an “output attribute” value larger than 2.5 (“output attribute”> 2.5) is regarded as a defective product, and the cause of this failure is extracted from “input attributes 1 to 8”. The operation of the data analysis apparatus in FIG. 1 will be described by taking the case of evaluating the result as an example.

なお、図2のトレンドグラフにおいて、破線Aより上のプロットに対応する基板が不良品(「出力属性」>2.5の素子)を多く含む基板を示している。また、図3のマップにおいて、P1およびP2の位置が、不良品(「出力属性」>2.5の素子)を多く含む座標位置を示し、P3、P4、およびP5の位置が、不良品(「出力属性」>2.5の素子)の数の少ない座標位置を示している。   In the trend graph of FIG. 2, the substrate corresponding to the plot above the broken line A indicates a substrate including many defective products (elements with “output attribute”> 2.5). In the map of FIG. 3, the positions of P1 and P2 indicate coordinate positions including many defective products (elements with “output attribute”> 2.5), and the positions of P3, P4, and P5 are defective products ( A coordinate position with a small number of “output attributes”> 2.5 elements) is shown.

以下、図4に示すフローチャートを参照しながら、図1のデータ分析装置の動作を説明する。なお、表1の基本データ群DAは、ハードディスク等の基本データ群格納部1に格納されている。   Hereinafter, the operation of the data analysis apparatus of FIG. 1 will be described with reference to the flowchart shown in FIG. The basic data group DA in Table 1 is stored in the basic data group storage unit 1 such as a hard disk.

[ステップ1]
分類条件設定部3は、予め定められた設定情報に従って、あるいは、ユーザがキーボードやマウス等の入力デバイス30から入力した設定情報に従って、不良品の条件である「出力属性>2.5」を設定し、データ分類部4に出力する(S1)。
[Step 1]
The classification condition setting unit 3 sets “output attribute> 2.5”, which is a condition for defective products, according to predetermined setting information or according to setting information input by the user from the input device 30 such as a keyboard or a mouse. And output to the data classification unit 4 (S1).

[ステップ2]
次に、データ分類部4が、分類条件設定部3から出力された分類条件に基づく下記論理(1)(2)によって、基本データ群DAを、出力属性の値に基づいて、第1データ群DA1と第2データ群DA2とに分類し、表2に示すように、各々のデータ群に対応する分類フラグを付与する(S2)。
[Step 2]
Next, the data classification unit 4 converts the basic data group DA into the first data group based on the value of the output attribute by the following logic (1) (2) based on the classification condition output from the classification condition setting unit 3. The data is classified into DA1 and second data group DA2, and as shown in Table 2, a classification flag corresponding to each data group is assigned (S2).

Figure 2006048183
Figure 2006048183

以下、表2のデータ群を、分類後基本データ群DA00と呼ぶ。分類後基本データ群DA00は、ハードディスク等の分類後基本データ群格納部5に保存される。   Hereinafter, the data group in Table 2 is referred to as a post-classification basic data group DA00. The post-classification basic data group DA00 is stored in the post-classification basic data group storage 5 such as a hard disk.

(1)「出力属性≦2.5」→DA1
(2)「出力属性>2.5」→DA2
ここで、第2データ群DA2は不良品のデータ群(「出力属性>2.5」)であり、第1データ群DA1は不良品でないデータ群(「出力属性≦2.5」)である。以下では、適宜、第1データ群DA1を良品(OK品)データ群、第2データ群DA2を不良品(NG品)データ群と呼ぶ事にする。
(1) “Output attribute ≦ 2.5” → DA1
(2) “Output attribute> 2.5” → DA2
Here, the second data group DA2 is a defective product data group (“output attribute> 2.5”), and the first data group DA1 is a non-defective product data group (“output attribute ≦ 2.5”). . Hereinafter, the first data group DA1 is appropriately referred to as a non-defective product (OK product) data group, and the second data group DA2 is appropriately referred to as a defective product (NG product) data group.

なお、データ分類部4による分類は、上記論理に限らず、不良品の判定結果など、特定の文字データに該当するか否かに基づく、下記の分類条件に示すような論理で行ってもよい。   The classification by the data classification unit 4 is not limited to the above logic, and may be performed according to the logic shown in the following classification condition based on whether or not it corresponds to specific character data such as a determination result of defective products. .

(1’)「出力属性≠“不良品”」→DA1
(2’)「出力属性=“不良品”」→DA2
また、複数の閾値との比較結果などとして表される複数の条件の、論理和または論理積に基づいて、下記の分類条件に示すような論理で分類してもよい。
(1 ') “Output attribute ≠“ defective product ”” → DA1
(2 ′) “Output attribute =“ defective product ”” → DA2
Further, based on a logical sum or logical product of a plurality of conditions expressed as a comparison result with a plurality of thresholds, etc., the classification may be performed according to the logic shown in the following classification conditions.

(1“)yth1<出力属性≦yth2→DA1(yth1,yth2:閾値)
(2“)出力属性≦yth1 OR 出力属性>yth2→DA2
さらに、出力属性が複数存在し(出力属性1、出力属性2)、各々の出力属性に対する個々の閾値との比較結果などとして表される条件の、論理和または論理積に基づく、下記の分類条件に示すような論理で分類してもよい。
(1 “) yth1 <output attribute ≦ yth2 → DA1 (yth1, yth2: threshold)
(2 “) Output attribute ≦ yth1 OR Output attribute> yth2 → DA2
Furthermore, the following classification conditions based on the logical sum or logical product of the conditions expressed as a comparison result with each threshold value for each output attribute, such as multiple output attributes (output attribute 1, output attribute 2) You may classify | categorize according to logic as shown in.

(1‘‘‘)出力属性1≦yth1 OR 出力属性2>yth2→DA1
(2‘‘‘)出力属性1>yth1 AND 出力属性2≦yth2→DA2
[ステップ3]
分析データ群抽出部6が、分類後基本データ群DA00の中から分析対象とする分析データ群DA00’を抽出し、第1の入力属性条件決定部12に送る。
(1 ″ ′) Output attribute 1 ≦ yth1 OR Output attribute 2> yth2 → DA1
(2 ″ ′) Output attribute 1> yth1 AND Output attribute 2 ≦ yth2 → DA2
[Step 3]
The analysis data group extraction unit 6 extracts an analysis data group DA00 ′ to be analyzed from the classified basic data group DA00 and sends it to the first input attribute condition determination unit 12.

この1回目の処理では、分類後基本データ群DA00と同一のデータが分析データ群DA00’として抽出されるが、後述する繰り返し処理の過程では、データ分割部15が出力する他データ群が抽出される。   In this first process, the same data as the post-classification basic data group DA00 is extracted as the analysis data group DA00 ′. However, in the process of repeated processing described later, another data group output by the data dividing unit 15 is extracted. The

[ステップ4]
第1の入力属性条件決定部12が、入力属性1〜入力属性8の各々に対してそれぞれ入力属性条件を決定する。上記入力属性条件は、良品の第1データ群DA1と不良品の第2データ群DA2とがそれぞれまとまるように、すなわち、2分化によって得られる2つのデータ群のうち、一方に第1データ群DA1がまとまり、他方に第2データ群DA2がまとまるように、分析データ群DA00’を2分化するための入力属性の条件である。ここで、「データ群Aにデータ群Bがまとまる」とは、「データ群Bに属するデータであれば、データ群Aに属するデータである」という相関ルールの確からしさが高いことを指すものとする。
[Step 4]
The first input attribute condition determination unit 12 determines an input attribute condition for each of the input attributes 1 to 8. The input attribute condition is such that the first data group DA1 of the non-defective product and the second data group DA2 of the defective product are grouped together, that is, one of the two data groups obtained by the bisection is set to the first data group DA1. This is an input attribute condition for dividing the analysis data group DA00 ′ into two so that the second data group DA2 is collected on the other side. Here, “the data group B is collected in the data group A” means that the probability of the correlation rule “if the data belongs to the data group B, the data belongs to the data group A” is high. To do.

なお、第1の入力属性条件決定部12によって決定される入力属性条件は表3に示す通りで、この入力属性条件は、「当該入力属性条件を満たすデータ群に不良品の第2データ群DA2(「出力属性」>2.5)がまとまり、当該入力属性条件を満たさないデータ群に良品の第1データ群DA1(「出力属性」≦2.5)がまとまる」条件である。第1の入力属性条件決定部12によって決定された入力属性条件(表3)は、分析結果データ格納部13に格納される。   The input attribute conditions determined by the first input attribute condition determining unit 12 are as shown in Table 3. This input attribute condition is “the second data group DA2 of defective products in the data group that satisfies the input attribute condition”. ("Output attribute"> 2.5) is gathered, and the non-defective first data group DA1 ("Output attribute" ≤2.5) is gathered in a data group that does not satisfy the input attribute condition ". The input attribute condition (Table 3) determined by the first input attribute condition determination unit 12 is stored in the analysis result data storage unit 13.

Figure 2006048183
Figure 2006048183

第1の入力属性条件決定部12による、入力属性条件の決定方法としては、データ群を2分化するための如何なる手法を用いてもよいが、例えば、非特許文献1に記載のGiniインデックス法が用いられる。   As a method for determining the input attribute condition by the first input attribute condition determining unit 12, any method for dividing the data group into two may be used. For example, the Gini index method described in Non-Patent Document 1 is used. Used.

以下に、Giniインデックス法による入力属性条件の決定方法について簡単に説明する。このGiniインデックス法では、「改善度」という指標を用いて、入力属性条件を決定する。   Hereinafter, a method of determining the input attribute condition by the Gini index method will be briefly described. In this Gini index method, an input attribute condition is determined using an index called “degree of improvement”.

Giniインデックス法の「改善度△i(t1)」は、「ノードt1を、ある入力属性条件に基づいて、2つの子ノードt2とt3とに分岐させる場合に、この分岐により、どの程度出力属性のまとまりが良くなるか」を示す指標であり、下式(1)のように表される。   The “improvement degree Δi (t1)” of the Gini index method is “when the node t1 is branched into two child nodes t2 and t3 based on a certain input attribute condition, how much output attribute is caused by this branching. It is an index indicating whether or not the unity is improved, and is expressed by the following equation (1).

△i(t1)=i(t1)−{pt2・i(t2)+pt3・i(t3)}
(1)
ここで、pt2、pt3は、ノードt1を、子ノードt2と子ノードt3とに分岐させるときの、分岐割合を示している。また、i(t1)、i(t2)、i(t3)は、それぞれ、ノードt1、子ノードt2、子ノードt3におけるGiniインデックスを示している。
Δi (t1) = i (t1) − {pt2 · i (t2) + pt3 · i (t3)}
(1)
Here, pt2 and pt3 indicate branching ratios when the node t1 is branched into the child node t2 and the child node t3. Further, i (t1), i (t2), and i (t3) indicate Gini indexes at the node t1, the child node t2, and the child node t3, respectively.

上記のGiniインデックスi(tx)(x=1,2,3)は、出力属性の値のまとまりの程度を表す指標で、下式(2)で表される。   The Gini index i (tx) (x = 1, 2, 3) is an index representing the degree of grouping of output attribute values, and is represented by the following expression (2).

i(tx)=1−Σ{p(j|tx)} (2)
ここで、p(j|tx)は、ノードtxにおいて、出力属性が「j」となる確率を示しており、Giniインデックスi(tx)が小さいことは、ノードtxにおいて出力属性の値がうまくまとまっていることを意味している。したがって、「改善度△i(t1)」が大きくなる入力属性条件(すなわち、i(t2)またはi(t3)が小さくなる入力属性条件)は、出力属性のまとまりがよくなるように、ノードt1を2分化できる条件と言える。
i (tx) = 1−Σ {p (j | tx)} 2 (2)
Here, p (j | tx) indicates the probability that the output attribute is “j” at the node tx, and that the Gini index i (tx) is small indicates that the value of the output attribute is well organized at the node tx. It means that Therefore, an input attribute condition that increases the “improvement degree Δi (t1)” (that is, an input attribute condition that decreases i (t2) or i (t3)) sets the node t1 to improve the unity of output attributes. It can be said that it can be differentiated into two.

第1の入力属性条件決定部12は、例えば、上記のGiniインデックス法の改善度を指標として、良品の第1データ群DA1と、不良品の第2データ群DA2とがそれぞれまとまるように、分析データ群DA00’を2分化するための入力属性条件を決定する。   The first input attribute condition determination unit 12 analyzes, for example, the first data group DA1 of non-defective products and the second data group DA2 of defective products together by using the improvement degree of the Gini index method as an index. An input attribute condition for dividing the data group DA00 ′ into two is determined.

具体的には、各入力属性が取り得る全ての入力属性条件のパターンについて(入力属性条件を満たすデータ群と、入力属性条件を満たさないデータ群との分岐パターンの全てについて)、上記の改善度を演算し、各入力属性において最大の改善度をもつ条件を抽出する。そして、抽出された条件によって分かれる2つの子ノードのうち、第2データ群に対応する条件を、入力属性条件として決定する。   Specifically, with respect to all patterns of input attribute conditions that can be taken by each input attribute (for all branch patterns of data groups that satisfy the input attribute conditions and data groups that do not satisfy the input attribute conditions), the degree of improvement described above And the condition having the maximum improvement in each input attribute is extracted. Then, a condition corresponding to the second data group is determined as an input attribute condition among the two child nodes separated by the extracted condition.

なお、第1の入力属性条件決定部12における入力属性条件の決定は、Giniインデックス法の改善度以外の指標、例えば、後述する「第1の頻度と第2の頻度との差分値」などに基づいて行ってもよい。上記の「第1の頻度と第2の頻度との差分値」による、第1の入力属性条件決定部12における入力属性条件の決定方法は、例えば、各入力属性の全ての数値について、第1データ群DA1中において、入力属性がその数値以下であるデータの割合を第1の頻度として演算すると共に、第2データ群DA2中において、入力属性がその数値以下であるデータの割合を第2の頻度として演算する頻度演算ステップと、各入力属性の全ての数値について、第1の頻度と第2の頻度との差分値を演算する差分演算ステップと、1つの入力属性がとる各数値の中で、上記差分値が最大となる数値を、該入力属性における閾値とし、各入力属性に対してそれぞれ1つの閾値を決定する閾値決定ステップと、上記閾値決定ステップで決定された閾値に基づいて、上記入力属性条件を決定する入力属性条件決定ステップとを含む方法であってもよい。   The determination of the input attribute condition in the first input attribute condition determination unit 12 is based on an index other than the improvement degree of the Gini index method, for example, “difference value between the first frequency and the second frequency” described later. May be based on. The determination method of the input attribute condition in the first input attribute condition determination unit 12 based on the above “difference value between the first frequency and the second frequency” is, for example, the first value for all the numerical values of each input attribute. In the data group DA1, the ratio of data whose input attribute is less than or equal to that value is calculated as the first frequency, and in the second data group DA2, the ratio of data whose input attribute is less than or equal to that value is calculated as the second frequency. Of all the numerical values taken by one input attribute, a frequency calculating step for calculating as a frequency, a difference calculating step for calculating a difference value between the first frequency and the second frequency for all numerical values of each input attribute The numerical value that maximizes the difference value is set as a threshold value for the input attribute, and a threshold value determining step for determining one threshold value for each input attribute and the threshold value determined in the threshold value determining step. Te may be a method comprising an input attribute condition determining step of determining the input attribute conditions.

[ステップ5]
分岐条件決定部14が、第1の入力属性条件決定部12で決定された入力属性条件(表3)の中で、第2データ群DA2を切出す確度が最も高い入力属性条件を、分岐条件として決定する。第2データ群DA2を切出す確度の指標としては、上記Giniインデックス法の改善度や、「入力属性条件に該当するデータ群に含まれる第2データ群の割合」、前述した頻度演算ステップによって得られる第1の頻度と第2の頻度との比率、前述した頻度演算ステップおよび差分演算ステップによって得られる第1の頻度と第2の頻度との差分値、これらの組み合わせなどを用いればよい。
[Step 5]
Among the input attribute conditions (Table 3) determined by the first input attribute condition determining unit 12, the branch condition determining unit 14 selects the input attribute condition having the highest probability of cutting out the second data group DA2 as the branch condition. Determine as. As an index of the accuracy with which the second data group DA2 is cut out, it is obtained by the improvement degree of the Gini index method, “the ratio of the second data group included in the data group corresponding to the input attribute condition”, or the frequency calculation step described above. A ratio between the first frequency and the second frequency, a difference value between the first frequency and the second frequency obtained by the frequency calculation step and the difference calculation step described above, a combination thereof, and the like may be used.

この例では、第2データ群DA2を切出す確度の指標としてGiniインデックス法の改善度を用いる。このようにして、表3中の、「入力属性6≦2.00」が分岐条件として決定される。   In this example, the improvement degree of the Gini index method is used as an index of the accuracy of extracting the second data group DA2. In this way, “input attribute 6 ≦ 2.00” in Table 3 is determined as the branch condition.

[ステップ6]
データ分割部15が、分岐条件決定部14で決定された分岐条件「入力属性6≦2.00」に基づいて、分析データ群DA00’を、「入力属性6≦2.00」を満たす要因データ群と、「入力属性6≦2.00」を満たさない(「入力属性6>2.00」を満たす)他データ群とに分割する。なお、他データ群は、特許請求の範囲における、「第2データ群の比率が小さい方のデータ群」に対応する。
[Step 6]
Based on the branch condition “input attribute 6 ≦ 2.00” determined by the branch condition determining unit 14, the data dividing unit 15 sets the analysis data group DA00 ′ to cause data that satisfies “input attribute 6 ≦ 2.00”. The group is divided into other data groups that do not satisfy “input attribute 6 ≦ 2.00” (that satisfies “input attribute 6> 2.00”). The other data group corresponds to “a data group having a smaller ratio of the second data group” in the claims.

[ステップ7]
分析データ群抽出部6が、データ分割部15で分割されたデータ群のうち、他データ群のみを次の分析データ群DA00’として抽出する。そして、終了条件判定部16で終了条件を満たしていると判定されるまで、上記のステップ3〜ステップ6の一連の処理が繰り返される。本実施形態の終了条件判定部16は、分析データ群DA00’に含まれる不良品の第2データ群DA2のデータ個数が0となった場合を終了条件として判定するようになっている。このように不良品の第2データ群DA2のデータ個数が0となるまで繰り返し処理を実行することにより、詳細な要因分析結果が得られる。
[Step 7]
The analysis data group extraction unit 6 extracts only another data group from the data group divided by the data division unit 15 as the next analysis data group DA00 ′. Then, the series of processing from step 3 to step 6 is repeated until the end condition determination unit 16 determines that the end condition is satisfied. The end condition determination unit 16 of the present embodiment is configured to determine the end condition when the number of data in the second data group DA2 of defective products included in the analysis data group DA00 ′ is zero. As described above, detailed factor analysis results can be obtained by repeatedly performing the process until the number of data in the second data group DA2 of defective products becomes zero.

なお、終了条件は、第2データ群DA2のデータ個数に基づく他の終了条件、例えば、(1)第2データ群DA2のデータ個数が所定数以下となった場合、(2)第1データ群DA1のデータ個数に対する第2データ群DA2のデータ個数の割合が所定割合以下となった場合、(3)上記ステップ5で決定された分岐条件における、第2データ群DA2の切出し確度の指標が所定値を下回った場合等としてもよい。これらのような終了条件を用いた場合、より簡潔で十分な要因分析結果を得ることができる。さらに、簡潔な要因分析結果を得ることを優先する場合には、終了条件を単に繰返し処理を所定回数行った場合としたり、終了条件判定部16を省いて、可能な限り繰り返し処理を行うようにしたりしてもよい。   The end condition is another end condition based on the number of data in the second data group DA2, for example, (1) when the number of data in the second data group DA2 is equal to or less than a predetermined number, (2) the first data group. When the ratio of the number of data in the second data group DA2 to the number of data in DA1 is equal to or less than a predetermined ratio, (3) the index of the extraction accuracy of the second data group DA2 under the branch condition determined in step 5 above is predetermined. It is good also when it falls below a value. When such termination conditions are used, a simpler and sufficient factor analysis result can be obtained. Furthermore, when priority is given to obtaining a simple factor analysis result, the end condition is simply set to the case where the iterative process is performed a predetermined number of times, or the end condition determining unit 16 is omitted to perform the iterative process as much as possible. Or you may.

本実施形態(表1の基本データ群DAの分析)においては、分析データ群抽出部6によって抽出された4回目の分析データ群に、不良品の第2データ群DA2が含まれていなかったため、3回の繰り返しで処理が終了した。上記の繰り返し処理毎に、第1の入力属性条件決定部12(ステップ4)によって、各入力属性に対して決定された入力属性条件を表4に示す。   In the present embodiment (analysis of the basic data group DA in Table 1), the fourth analysis data group extracted by the analysis data group extraction unit 6 does not include the second data group DA2 of defective products. The process was completed after 3 repetitions. Table 4 shows the input attribute conditions determined for each input attribute by the first input attribute condition determination unit 12 (step 4) for each of the repetition processes.

Figure 2006048183
Figure 2006048183

[ステップ8]
不良品データ演算部17が、第1の入力属性条件決定部12で決定された入力属性条件(表4)の各々に対し、分類後基本データ群DA00(分析データ群DA00’ではない)の中で、該入力属性条件を満たすデータの個数(表5の「DA1+DA2」列)と、該入力属性条件を満たし、かつ、不良品の第2データ群DA2に該当するデータの個数(表5の「DA2」列)とを集計する。
[Step 8]
For each of the input attribute conditions (Table 4) determined by the first input attribute condition determination unit 12, the defective product data calculation unit 17 is in the classified basic data group DA00 (not the analysis data group DA00 ′). The number of data satisfying the input attribute condition ("DA1 + DA2" column in Table 5) and the number of data satisfying the input attribute condition and corresponding to the second data group DA2 of defective products ("Table 1" DA2 "column).

Figure 2006048183
Figure 2006048183

この「DA2」列の個数は、各入力属性条件に起因する不良数を表しており、特許請求の範囲における第2データ群該当数に対応する。   The number of “DA2” columns represents the number of defects caused by each input attribute condition, and corresponds to the number of corresponding second data groups in the claims.

次に、表5の「DA2」列の値を、「DA1+DA2」列の値で除算した、不良品分離度を演算する。各入力属性条件の不良品分離度は、該入力属性条件を満たすデータの中に不良品である第2データ群DA2が含まれるデータ個数の割合(分類後基本データ群DA00中で該入力属性条件を満たすデータの中における、不良品の第2データ群DA2に該当するデータの個数の割合)で、該入力属性条件による不良品切り出しの確度(分類後基本データ群DA00の中で該入力属性条件に属するデータを母集団としたときの不良率)を表しており、特許請求の範囲における第2データ群分離度に対応する。この不良品分離度は、分類後基本データ群DA00における、「入力属性条件を満たせば、不良品が発生する」という相関ルールの確信度に相当する。   Next, the defective product separation degree is calculated by dividing the value in the “DA2” column of Table 5 by the value in the “DA1 + DA2” column. The defective product separation degree of each input attribute condition is the ratio of the number of data in which the second data group DA2 which is a defective product is included in the data satisfying the input attribute condition (the input attribute condition in the classified basic data group DA00) The ratio of the number of data corresponding to the second data group DA2 of defective products among the data satisfying the above condition, the accuracy of the defective product extraction by the input attribute condition (the input attribute condition in the basic data group DA00 after classification) The defect rate when the data belonging to is a population), and corresponds to the second data group separation degree in the claims. This degree of defective product separation corresponds to the certainty of an association rule in the post-classification basic data group DA00 that “if the input attribute condition is satisfied, a defective product is generated”.

表5は、上記不良品データ演算部17による演算結果と併せて、その「Total」行に、分類後基本データ群DA00の中の、データ総数(=495:「DA1+DA2」列)、不良品の第2データ群DA2の個数(=253:「DA2」列)、および、不良品含有率(=253/495=0.511:「不良品分離度」列)を示したテーブルである。不良品含有率は、分類後基本データ群DA00の中に含まれる第2データ群DA2のデータ個数の割合であって、分類後基本データ群DA00の全データを母集団としたときの不良率(不良品の割合)を表している。表5のテーブルを、以下では、第1の入力属性条件一覧テーブルと呼ぶ。   Table 5 shows the total number of data (= 495: “DA1 + DA2” column) in the basic data group DA00 after classification in the “Total” row, along with the calculation result by the defective product data calculation unit 17, 12 is a table showing the number of second data groups DA2 (= 253: “DA2” column) and defective product content rate (= 253/495 = 0.511: “defective product separation” column). The defective product content rate is a ratio of the number of data in the second data group DA2 included in the basic data group DA00 after classification, and the defective rate when all the data in the basic data group DA00 after classification is a population ( The ratio of defective products). Hereinafter, the table of Table 5 is referred to as a first input attribute condition list table.

表5の各列の意味は、これらを代表的な入力属性条件(入力属性6、入力属性7について1回目に抽出された入力属性条件)についてベン図で表現した図5を参照すると、理解しやすい。図5(a)は、入力属性6について1回目に抽出された入力属性条件による不良品切り出しを行ったときの不良品分離度および不良数を示す図であり、図5(b)は、入力属性7について1回目に抽出された入力属性条件による不良品切り出しを行ったときの不良品分離度および不良数を示す図である。   The meaning of each column in Table 5 can be easily understood by referring to FIG. 5 in which these are represented by Venn diagrams for typical input attribute conditions (input attribute conditions extracted for the first time for input attribute 6 and input attribute 7). . FIG. 5A is a diagram showing the degree of defective product separation and the number of defects when defective products are cut out for the input attribute 6 based on the input attribute condition extracted for the first time, and FIG. It is a figure which shows the inferior goods isolation | separation degree and the number of inferiorities when performing the inferior goods cutting-out by the input attribute conditions extracted about the attribute 7 first time.

[ステップ9]
第2の入力属性条件決定部19が、第1の入力属性条件一覧テーブル(表5)の中の、同一の入力属性における複数の入力属性条件のうちで、問題事象の要因(第2データ群DA2に対応する出力属性条件の要因)としての重要度、すなわち問題事象を解消するための対策を施す上で優先すべき度合い(以下、「優先度」と称する)の高い入力属性条件のみを選択する。
[Step 9]
The second input attribute condition determination unit 19 causes the problem event (second data group) among the plurality of input attribute conditions for the same input attribute in the first input attribute condition list table (Table 5). Select only input attribute conditions that have a high degree of importance as the factor of output attribute conditions corresponding to DA2, that is, a high degree of priority (hereinafter referred to as "priority") that should be taken when taking measures to eliminate the problem phenomenon To do.

本実施形態では、第2の入力属性条件決定部19は、入力属性条件一覧テーブル(表5)中の同一の入力属性における複数の入力属性条件、すなわちステップ7のn回(nは2以上の整数)の繰り返し処理によって決定されたn個の入力属性条件のうちで、不良品分離度(第2データ群分離度)が最大となる入力属性条件を優先度の高い入力属性条件として選択する。ただし、n個の入力属性条件に複数種類のパターンの入力属性条件が含まれる場合には、第2の入力属性条件決定部19は、各パターンで不良品分離度(第2データ群分離度)が最大となる入力属性条件をそれぞれ優先度の高い入力属性条件として選択する。   In the present embodiment, the second input attribute condition determination unit 19 performs a plurality of input attribute conditions for the same input attribute in the input attribute condition list table (Table 5), that is, n times in Step 7 (n is 2 or more). Among the n input attribute conditions determined by the (integer) repetitive processing, an input attribute condition that maximizes the defective product separation degree (second data group separation degree) is selected as an input attribute condition having a high priority. However, when the input attribute conditions of a plurality of types of patterns are included in the n input attribute conditions, the second input attribute condition determining unit 19 determines the defective product separation degree (second data group separation degree) for each pattern. The input attribute condition that maximizes is selected as an input attribute condition with high priority.

具体的には、同一の入力属性に対して、「入力属性が閾値以下である」という第1のパターンの中で、不良品分離度(第2データ群分離度)が最大となる入力属性条件を1つと、「入力属性が閾値を超える」という第2のパターンの中で、不良品分離度(第2データ群分離度)が最大となる入力属性条件を1つとを、それぞれ選択し、不良品の第2データ群DA2(「出力属性」>2.5)の要因を示す情報として決定する。   Specifically, for the same input attribute, the input attribute condition that maximizes the defective product separation degree (second data group separation degree) in the first pattern “input attribute is below threshold” And one input attribute condition that maximizes the defective product separation degree (second data group separation degree) in the second pattern of “input attribute exceeds threshold”, and It is determined as information indicating the factor of the non-defective second data group DA2 (“output attribute”> 2.5).

表5の例の場合には、第2の入力属性条件決定部19によって、最終的に、表6に示す10個の入力属性条件が選択された。   In the case of the example of Table 5, the 10 input attribute conditions shown in Table 6 were finally selected by the second input attribute condition determination unit 19.

Figure 2006048183
Figure 2006048183

ここで、上記の優先度の高い入力属性条件を選択する上で、不良品分離度(第2データ群分離度)を指標としているのは、以下の理由による。すなわち、ある入力属性条件の不良品分離度は、前述したように、該入力属性条件による不良品切り出しの確度を表しているため、この値が大きい入力属性条件は、他の入力属性(外乱)の影響をあまり受けずに高い確度で決定された条件と考えられるからである。   Here, the reason why the defective product separation degree (second data group separation degree) is used as an index in selecting the input attribute condition having a high priority is as follows. That is, as described above, the degree of defective product separation under a certain input attribute condition represents the accuracy of defective product extraction according to the input attribute condition. Therefore, an input attribute condition with a large value is a value other than other input attributes (disturbances). This is because it is considered to be a condition determined with high accuracy without being affected by the above.

第2の入力属性条件決定部19では、さらに以下の処理を行うようにしてもよい。すなわち、表6のテーブルにおける各入力属性条件の中で、分類後基本データ群DA00の不良品含有率(=0.511:「Total」行の「不良品分離度」列)よりも大きい値の不良品分離度をもつ入力属性条件を選択する。表6の例では、最終的に、表7に示す9条件が決定された。   The second input attribute condition determination unit 19 may further perform the following processing. That is, in each of the input attribute conditions in the table of Table 6, a value larger than the defective product content rate of the basic data group DA00 after classification (= 0.511: “Defect Product Separation” column in the “Total” row). Select an input attribute condition that has a defect separation degree. In the example of Table 6, nine conditions shown in Table 7 were finally determined.

Figure 2006048183
Figure 2006048183

こうして選ばれた入力属性条件は、分類後基本データ群DA00の中からランダムに選んだサンプルよりも高い割合で、不良品の第2データ群DA2を含む条件であり、不良品の第2データ群DA2の要因を示している。   The input attribute condition selected in this way is a condition including the second data group DA2 of defective products at a higher rate than the randomly selected sample from the classified basic data group DA00, and the second data group of defective products. The factor of DA2 is shown.

上記のようにして、第2の入力属性条件決定部19で決定された入力属性条件(表6または表7)が、入力属性条件決定部100の出力する最終の入力属性条件となる。以下では、表6または表7のテーブルを、第2の入力属性条件一覧テーブルと呼ぶ。   As described above, the input attribute condition (Table 6 or Table 7) determined by the second input attribute condition determination unit 19 becomes the final input attribute condition output by the input attribute condition determination unit 100. Hereinafter, the table in Table 6 or 7 is referred to as a second input attribute condition list table.

入力属性条件決定部100の処理(すなわち、ステップ3〜ステップ9の処理)の過程を、回帰木の形式で表現すると図6のようになる。図6を参照して、本実施形態では、回帰木によって分割される(分岐される)2つのデータ群(ノード)のうち、「不良品の第2データ群DA2の比率が小さい方のデータ群」である他データ群側についてのみ、順次回帰木を成長させている。このように、不良(第2データ群DA2)の主要因が未発見のデータ群(他データ群)に対して、順次、分析(入力属性条件の決定)を行っているから、それ以前の繰り返し処理で、不良の主要因となった入力属性条件の影響を除外して、新たな要因を高い確度で、かつ、効率的に抽出できる。しかも、回帰木が複雑化せず、直感的に不良の要因を把握しやすい。   The process of the input attribute condition determination unit 100 (that is, the process of steps 3 to 9) is expressed in the form of a regression tree as shown in FIG. Referring to FIG. 6, in the present embodiment, among the two data groups (nodes) divided (branched) by the regression tree, “the data group having the smaller ratio of the defective second data group DA2”. Only the other data group side that is "is growing the regression tree sequentially. As described above, since the analysis (determination of input attribute conditions) is sequentially performed on the data group (other data group) in which the main cause of the defect (second data group DA2) is not found, the previous iterations are repeated. In the process, the influence of the input attribute condition that becomes the main cause of the defect is excluded, and a new factor can be extracted with high accuracy and efficiency. Moreover, the regression tree is not complicated and it is easy to intuitively grasp the cause of the failure.

また、本実施形態では、回帰木の分岐毎に、分岐条件だけでなく全ての入力属性について問題事象(不良品の第2データ群DA2)の要因となる入力属性条件を求めている(第1の入力属性条件決定部11による処理)。そして、分岐の回数分(繰り返し処理の回数分)の全て入力属性条件の中で、さらに不良品分離度の高い入力属性条件を絞り込み、最終の不良要因として決定している(第2の入力属性条件決定部19による処理)。このように、回帰木における分岐条件に限らず、全ての入力属性について、問題事象(不良品の第2データ群DA2)の要因となる入力属性条件を抽出しているから、分岐条件に競合因子が存在しても、その要因を逃すことなく、確実に捉えることができる。   In the present embodiment, for each branch of the regression tree, not only the branch condition but also the input attribute condition that causes the problem event (defective product second data group DA2) is obtained for all the input attributes (first data). Of the input attribute condition determination unit 11). Then, among all the input attribute conditions for the number of times of branching (for the number of iterations), input attribute conditions with a higher degree of defective product separation are narrowed down and determined as the final failure factor (second input attribute) Processing by the condition determining unit 19). As described above, since the input attribute condition that causes the problem event (defective product second data group DA2) is extracted for all input attributes, not only the branch condition in the regression tree, the competing factor is included in the branch condition. Even if there is, can be caught without missing the factor.

また、最終的な要因決定(第2の入力属性条件決定部19による、最終入力属性条件の決定処理)において、不良品分離度という明確な指標に基づいて要因の決定を行っているため、如何に複雑な回帰木となろうとも、明確に不良の要因を把握することができる。   In the final factor determination (the final input attribute condition determination process by the second input attribute condition determination unit 19), the factor is determined based on a clear index of defective product separation. Even if it is a complicated regression tree, the cause of the failure can be clearly grasped.

上記のように、第2の入力属性条件決定部19が、不良品分離度(第2データ群分離度)という明確な指標に基づいて、繰り返し処理毎に決定された同一の入力属性における複数の入力属性条件のうちで優先度の高い条件のみを選択しているから、詳細な要因分析結果を得るために上記の繰り返し処理を行っても複雑化する事なく、非常に簡潔な形でありながら、高い確度で、第2データ群に対応する出力属性条件の要因を決定する事ができる。   As described above, the second input attribute condition determination unit 19 uses a plurality of the same input attributes determined for each repetition process based on a clear index of defective product separation (second data group separation). Since only high priority conditions are selected from among the input attribute conditions, the above process is repeated in order to obtain a detailed cause analysis result. The cause of the output attribute condition corresponding to the second data group can be determined with high accuracy.

[ステップ10]
入力属性条件一覧グラフ作成部20が、第2の入力属性条件一覧テーブル(表7)に基づいて、入力属性条件一覧グラフ(図7)を作成する。入力属性条件一覧グラフ(図7)には、第2の入力属性条件決定部19(入力属性条件決定部100)で決定された入力属性条件の各々に対する不良数(第2データ群該当数)が棒グラフで、また、不良品分離度(第2データ群分離度)が折れ線グラフで、それぞれ示されている。なお、グラフの左端(“Total”)には、分類後基本データ群DA00の中の、不良数(=253)と不良品含有率(=0.511)が示されている。図7および他の図面において、“・・・E・・・”の形式で示す数値は、10進の指数表記による数値であり、Eの前の数字が仮数部であり、Eの後の数字が指数部である。
[Step 10]
The input attribute condition list graph creation unit 20 creates an input attribute condition list graph (FIG. 7) based on the second input attribute condition list table (Table 7). In the input attribute condition list graph (FIG. 7), the number of defects (the number corresponding to the second data group) for each of the input attribute conditions determined by the second input attribute condition determining unit 19 (input attribute condition determining unit 100) is displayed. The bar graph and the defective product separation degree (second data group separation degree) are each shown by a line graph. The left end (“Total”) of the graph shows the number of defects (= 253) and the defective product content rate (= 0.511) in the basic data group DA00 after classification. In FIG. 7 and other drawings, the numerical value in the form “... E...” Is a numerical value in decimal exponent notation, the number before E is the mantissa, and the number after E. Is the exponent part.

入力属性条件一覧グラフ(図7)の横軸には、第2の入力属性条件決定部19で決定された各入力属性条件(表7の各入力属性条件)が示されている。この入力属性条件の並び順は、(1)不良品分離度(第2データ群分離度)の大きい順、(2)不良数(第2データ群DA2の個数:第2データ群該当数)の大きい順、および、(3)不良品分離度と不良数の双方を考慮した配点の高い順に並替えが可能である。ここで、「不良品分離度と不良数の双方を考慮した配点」とは、不良品分離度(第2データ群分離度)の大きい順に点数が高くなるように与えられた第1の配点と、不良数(第2データ群該当数)の大きい順に点数が高くなるように与えられた第2の配点との合計点である。   The horizontal axis of the input attribute condition list graph (FIG. 7) shows each input attribute condition (each input attribute condition in Table 7) determined by the second input attribute condition determination unit 19. The order of the input attribute conditions is as follows: (1) in order of increasing defective product separation (second data group separation), (2) number of defects (number of second data groups DA2: number of second data groups) Rearrangement is possible in the descending order, and (3) in the descending order of the score considering both the degree of defective product separation and the number of defects. Here, the “scoring in consideration of both the defective product separation degree and the number of defects” means the first scoring given so that the score increases in descending order of the defective product separation degree (second data group separation degree). The total number of points with the second score given so that the score increases in descending order of the number of defects (corresponding number of second data group).

図8〜図10は、それぞれ、(1)不良品分離度の大きい順、(2)不良数の大きい順、および、(3)不良品分離度と不良数の双方を考慮した配点の高い順に、横軸(入力属性条件)を並べ替えた、入力属性条件一覧グラフを示している。以下に、上記(1)〜(3)の並び順の意味合いを説明する。   8 to 10 are respectively (1) in order of increasing defective product separation, (2) in order of increasing number of defects, and (3) in order of increasing score considering both the degree of defective product separation and the number of defects. The horizontal axis (input attribute conditions) is rearranged, and the input attribute condition list graph is shown. Hereinafter, the meaning of the order of the above (1) to (3) will be described.

(1)不良品分離度(第2データ群分離度)の大きい順
良品と分離して、高い確度で不良を減じることを分析の目的とする場合には、不良品分離度を重視する。ユーザは、不良品分離度の大きい入力属性条件から順に対策を施すことにより、極力良品を落とさずに、高い確度で不良を解消することができる。但し、不良品分離度の大きい入力属性条件において、不良数も大きいとは限らず(決定的な不良要因であるが、その発生頻度が低い場合など)、場合によっては、対策を施しても、不良全体のうちの一部しか解消されない恐れがある。
(1) When the purpose of analysis is to separate defective products with high accuracy by separating them from good products having a large defective product separation degree (second data group separation degree), importance is attached to the defective product separation degree. The user can resolve the defect with high accuracy without dropping the non-defective product as much as possible by taking countermeasures in order from the input attribute condition having a large degree of defective product separation. However, in the input attribute condition with a large degree of defective product separation, the number of defects is not necessarily large (if it is a decisive failure factor but its frequency of occurrence is low), and even if measures are taken, There is a risk that only a part of the whole defect is resolved.

(2)不良数(第2データ群該当数)の大きい順
現在発生している不良を、なるべく多く減じることを分析の目的とする場合には、不良数を重視する。ユーザは、不良数の大きい入力属性条件から順に対策を施すことにより、現在発生している不良の多くを解消することができる。但し、不良数の大きい入力属性条件において、不良品分離度も大きいとは限らず(発生頻度は高いが、必ずしも決定的な不良要因でない場合など)、場合によっては、対策によって、不良の解消と同時に良品も落としてしまう恐れがある。
(2) In order of increasing number of defects (corresponding to the number of second data group) When the purpose of analysis is to reduce the number of defects currently occurring as much as possible, the number of defects is emphasized. The user can resolve many of the currently occurring defects by taking countermeasures in order from the input attribute condition with the largest number of defects. However, in the case of input attribute conditions with a large number of defects, the degree of defective product separation is not necessarily large (when the frequency of occurrence is high, but not necessarily a decisive factor of failure). At the same time, there is a risk of dropping good products.

(3)不良品分離度と不良数の双方を考慮した配点の高い順
不良品分離度と不良数の双方を考慮し、総合的に見て、高い確度で多くの不良を減じることを目的とする場合には、「不良品分離度と不良数の双方を考慮した配点」を重視する。ユーザは、この配点の高い順に対策を施すことにより、高い確度で、しかも多くの不良を解消することができる。但し、この対策により「良品を落とさずに、不良を解消する」効果は(1)に比べて劣り、「不良の多くを解消する」効果は(2)に比べて劣っている。
(3) High order of distribution considering both the degree of defective product separation and the number of defectives The purpose is to reduce many defects with high accuracy, considering both the degree of defective product separation and the number of defective products. In this case, the emphasis is on “scoring considering both the degree of defective product separation and the number of defects”. The user can resolve many defects with high accuracy by taking measures in descending order of the score. However, the effect of “resolving defects without dropping good products” by this measure is inferior to (1), and the effect of “removing many defects” is inferior to (2).

ユーザは、分析の目的に応じて、図7中の「項目並べ替え」ボタンを操作して、上記(1)〜(3)の何れかの並び順を選択し、入力属性条件の並び順を変更する。そして、この並び順に、後述する(ステップ11の)レビューグラフを作成し、技術的な考察を加えて、分析結果をレビューする。すなわち、入力属性条件一覧グラフ(図7〜図10)は、分析結果レビューの暫定的な順番をユーザに知らせる、ナビゲーションの働きをするものである。   The user operates the “item rearrangement” button in FIG. 7 according to the purpose of analysis, selects one of the above-mentioned (1) to (3), and changes the order of input attribute conditions. change. Then, a review graph (in step 11), which will be described later, is created in this order of arrangement, and technical analysis is added to review the analysis results. In other words, the input attribute condition list graphs (FIGS. 7 to 10) serve as a navigation that informs the user of the provisional order of the analysis result review.

入力属性条件一覧グラフ作成部20が、入力属性条件をユーザの選択した並び順((1)〜(3)のいずれか)にしたがって並べる処理は、以下のように、順位決定部23を用いて行なわれる。   The input attribute condition list graph creation unit 20 uses the order determination unit 23 to arrange the input attribute conditions in accordance with the order selected by the user (any one of (1) to (3)) as follows. Done.

まず、分析の目的に応じて、ユーザが、上記3種の並び順(1)〜(3)のうち、どの並び順を採用するかをデータ分析装置に指示する。これに応答して、順位決定部23が、指示された並び順に対応した入力属性条件の優先順位付けを行う。すなわち、順位決定部23が、第2の入力属性条件決定部19が問題事象の要因として決定した各入力属性条件(第2の入力属性条件一覧テーブル(表7)の各入力属性条件)に対して、問題事象の要因(不良品の第2データ群DA2に対応する出力属性条件が発生する要因)としての重要度(優先度)による順位付け、すなわち問題事象を解消するための対策を施す上で優先すべき順序(優先順位)を付ける(優先順位付けを行う)。次いで、入力属性条件一覧グラフ作成部20が、順位決定部23による順位付けの結果にしたがって入力属性条件を並べた入力属性条件一覧グラフを作成する。   First, according to the purpose of analysis, the user instructs the data analysis apparatus which one of the three types of arrangement orders (1) to (3) is to be adopted. In response to this, the order determining unit 23 prioritizes the input attribute conditions corresponding to the instructed order. That is, for each input attribute condition (each input attribute condition in the second input attribute condition list table (Table 7)) determined by the rank determining unit 23 as the cause of the problem phenomenon by the second input attribute condition determining unit 19 In order to resolve the problem event, the ranking is based on the importance (priority) as the cause of the problem event (factor causing the output attribute condition corresponding to the second data group DA2 of the defective product). The order (priority order) that should be prioritized is assigned (prioritization is performed). Next, the input attribute condition list graph creating unit 20 creates an input attribute condition list graph in which the input attribute conditions are arranged according to the ranking result by the rank determining unit 23.

なお、ここでは、入力属性条件一覧グラフにおける入力属性条件の並び順が、3種の並び順(1)〜(3)から選択可能となっていたが、これら3種のうちの2種の並び順から選択可能となってもよく、選択不能となっていてもよい。ただし、3種の並び順(1)〜(3)から選択可能であることが、分析の目的に応じた入力属性条件の選択をユーザが容易に行うことができる点で好ましい。   Here, the arrangement order of the input attribute conditions in the input attribute condition list graph can be selected from the three arrangement orders (1) to (3), but two of these three arrangements are arranged. It may be selectable from the order or may not be selectable. However, it is preferable that the selection can be made from the three types of arrangement orders (1) to (3) in that the user can easily select the input attribute condition according to the purpose of the analysis.

また、ここでは、入力属性条件一覧グラフ作成部20が、順位決定部23による順位付けの結果を入力属性条件一覧グラフにおける入力属性条件の並び順としてユーザに示すようになっていたが、入力属性条件一覧グラフ作成部20は、順位決定部23による順位付けの結果を他の形態でユーザに示すものであってもよい。例えば、入力属性条件一覧グラフ作成部20は、単に入力属性条件の一覧を示す入力属性条件一覧グラフを作成すると共に、順位決定部23により決定された各入力属性条件の優先順位を入力属性条件一覧グラフ内に示すものであってもよい。   Here, the input attribute condition list graph creation unit 20 shows the ranking result of the rank determination unit 23 to the user as the order of the input attribute conditions in the input attribute condition list graph. The condition list graph creation unit 20 may show the result of ranking by the rank determination unit 23 to the user in another form. For example, the input attribute condition list graph creating unit 20 simply creates an input attribute condition list graph indicating a list of input attribute conditions, and sets the priority of each input attribute condition determined by the rank determining unit 23 to the input attribute condition list. It may be shown in a graph.

[ステップ11]
入力属性条件一覧グラフに示された複数の入力属性条件の並び順(優先順位)を参考にして、ユーザが、入力属性条件一覧グラフに示された複数の入力属性条件の中から特定の入力属性条件を選択する選択操作、および、レビューグラフ描画指示を行う。
ユーザによる選択操作は、入力属性条件一覧グラフ(図7〜図10)の表示画面上での入力デバイス31による操作、例えば、入力属性条件一覧グラフの表示画面上における特定の入力属性条件を示す文字の領域を入力デバイス31としてのポインティングデバイス(マウス等)で指示(ポインティング)する操作によって行われる。また、この場合、ユーザによるレビューグラフ描画指示は、入力属性条件一覧グラフの表示画面上での入力デバイス31による操作、例えば、入力属性条件一覧グラフの表示画面上に表示されたレビューグラフ作成用のボタンを入力デバイス31としてのポインティングデバイス(マウス等)で指示(ポインティング)する操作によって行われる。なお、ユーザによる選択操作やレビューグラフ描画指示は、入力属性条件一覧グラフの表示画面上での操作以外の操作、例えば入力デバイス31としてのキーボードによる特定の文字を入力する操作によって行うことも可能であるが、入力属性条件一覧グラフの表示画面上での入力デバイス31による操作によって行えるようになっている方が、ユーザによる操作が容易である点で好ましい。なお、後述する特定の2つ以上の入力属性条件を選択する操作も、上述した操作により行うことができる。
[Step 11]
Referring to the order (priority order) of multiple input attribute conditions shown in the input attribute condition list graph, the user can select a specific input attribute from the multiple input attribute conditions shown in the input attribute condition list graph. A selection operation for selecting a condition and a review graph drawing instruction are performed.
The selection operation by the user is an operation by the input device 31 on the display screen of the input attribute condition list graph (FIGS. 7 to 10), for example, a character indicating a specific input attribute condition on the display screen of the input attribute condition list graph Is performed by an operation of pointing (pointing) with the pointing device (mouse or the like) as the input device 31. Further, in this case, the review graph drawing instruction by the user is an operation by the input device 31 on the display screen of the input attribute condition list graph, for example, for creating the review graph displayed on the display screen of the input attribute condition list graph. This is performed by an operation of pointing (pointing) a button with a pointing device (such as a mouse) as the input device 31. Note that the selection operation and review graph drawing instruction by the user can be performed by an operation other than the operation on the display screen of the input attribute condition list graph, for example, an operation of inputting a specific character using the keyboard as the input device 31. However, it is preferable that the operation can be performed by the input device 31 on the display screen of the input attribute condition list graph because the operation by the user is easy. Note that an operation for selecting two or more specific input attribute conditions described later can also be performed by the above-described operation.

そして、この選択操作およびレビューグラフ描画指示に応答して、レビューグラフ作成部21が、上記選択された入力属性条件を特定の入力属性条件として取得し、この取得した特定の入力属性条件を満たすデータ群と、第2データ群との対応関係を視覚的に表すレビューグラフを作成する。   Then, in response to the selection operation and the review graph drawing instruction, the review graph creation unit 21 acquires the selected input attribute condition as a specific input attribute condition, and data that satisfies the acquired specific input attribute condition A review graph that visually represents the correspondence between the group and the second data group is created.

基本データ群を構成する前記データの各々がそれぞれ複数のグループのいずれかに属している場合には、レビューグラフ作成部21は、上記選択操作およびレビューグラフ描画指示に応答して、前記複数のグループの各々の単位で、該グループに属する前記入力属性および出力属性の値を平均化したデータ群を表す第2の基本データ群を作成し、上記選択された入力属性条件を特定の入力属性条件として取得し、第2の基本データ群のうちで前記取得した特定の入力属性条件を満たすデータ群と、第2の基本データ群のうちで第2データ群に対応する出力属性条件を満たすデータ群との対応関係を視覚的に表すレビューグラフを作成する構成であってもよい。   When each of the data constituting the basic data group belongs to any of a plurality of groups, the review graph creating unit 21 responds to the selection operation and the review graph drawing instruction in response to the selection operation and the review graph drawing instruction. In each unit, a second basic data group representing a data group obtained by averaging the values of the input attribute and output attribute belonging to the group is created, and the selected input attribute condition is used as a specific input attribute condition. A data group that satisfies the specific input attribute condition acquired in the second basic data group, and a data group that satisfies the output attribute condition corresponding to the second data group in the second basic data group; It is also possible to create a review graph that visually represents the correspondence relationship.

なお、レビューグラフ作成部21が取得する上記特定の入力属性条件は、1つに限らず複数であってもよい。取得する入力属性条件が複数の場合には、レビューグラフ作成部21は、取得した入力属性条件の数に相当するだけのレビューグラフを作成し、これら一覧のグラフや、ページ方式で格納されたグラフ群などとして、レビューグラフを出力する。   The specific input attribute condition acquired by the review graph creating unit 21 is not limited to one and may be plural. When there are a plurality of input attribute conditions to be acquired, the review graph creating unit 21 creates review graphs corresponding to the number of acquired input attribute conditions, and a graph of these lists or a graph stored in a page format. A review graph is output as a group.

また、レビューグラフ作成部21が、上記レビューグラフを作成するために特定の入力属性条件を取得する方法は、上記ユーザによる選択操作に限らず、コンピュータによる自動選択であってもよい。例えば、コンピュータが、不良品分離度の大きい順の上位の所定数の入力属性条件を自動選択したり、入力属性条件一覧グラフに示された全ての入力属性条件を自動選択するようになっていても良い。   In addition, the method in which the review graph creation unit 21 acquires a specific input attribute condition for creating the review graph is not limited to the selection operation by the user but may be automatic selection by a computer. For example, the computer automatically selects a predetermined number of input attribute conditions in the descending order of the degree of defective product separation, or automatically selects all the input attribute conditions shown in the input attribute condition list graph. Also good.

また、レビューグラフ作成部21へのレビューグラフ描画指示は、上記ユーザによる描画指示に限らず、予め設定された内容に基づく、コンピュータからの指示であってもよい。   Further, the review graph drawing instruction to the review graph creating unit 21 is not limited to the drawing instruction by the user, but may be an instruction from a computer based on preset contents.

レビューグラフ作成部21が作成するレビューグラフは、例えば、図11に示すように、(1)トレンドグラフ(第1のレビューグラフ)、(2)マップ(第2のレビューグラフ)、(3)散布図(第3のレビューグラフ)、および、(4)度数分布図(第4のレビューグラフ)の4種である。
以下、不良品分離度(第2データ群分離度)の大きい順に並べた、入力属性条件一覧グラフ(図8)に基づく、分析結果のレビュー方法と併せて、上記(1)〜(4)のレビューグラフについて説明する。
The review graph created by the review graph creation unit 21 is, for example, as shown in FIG. 11, (1) trend graph (first review graph), (2) map (second review graph), (3) scatter There are four types: a diagram (third review graph) and (4) a frequency distribution diagram (fourth review graph).
Hereinafter, in conjunction with the analysis result review method based on the input attribute condition list graph (FIG. 8) arranged in descending order of defective product separation (second data group separation), the above (1) to (4) The review graph will be described.

なお、(1)〜(4)のレビューグラフは、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上におけるレビューグラフ作成用のボタン(「トレンド/マップ/散布図」ボタンおよび「度数分布図」ボタン)のいずれか1つを入力デバイス31としてのポインティングデバイスで操作することに応答して、レビューグラフ作成部21によって作成される。   Note that the review graphs (1) to (4) include, for example, a button for creating a review graph on the display screen of the input attribute condition list graph (FIG. 8) (“trend / map / scatter diagram” button and In response to operating any one of the “frequency distribution map” buttons) with the pointing device as the input device 31, the review graph creating unit 21 creates it.

(1)トレンドグラフ(第1のレビューグラフ)
レビューグラフ作成部21は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から特定の入力属性条件を選択し、トレンドグラフ描画指示を行ったことに応答して、前記レビューグラフとして第1のレビューグラフを作成する。この第1のレビューグラフは、ユーザによって選択された特定の入力属性条件に対応する入力属性の時間変化を示す第1のトレンドグラフと、前記出力属性の時間変化を示す第2のトレンドグラフとを共に示している。また、第1のトレンドグラフにおいては、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている。
(1) Trend graph (first review graph)
The review graph creation unit 21, for example, in response to the user selecting a specific input attribute condition from the input attribute conditions shown in the input attribute condition list graph and instructing the trend graph drawing, A first review graph is created as a review graph. The first review graph includes a first trend graph showing a time change of an input attribute corresponding to a specific input attribute condition selected by a user, and a second trend graph showing a time change of the output attribute. Both are shown. In the first trend graph, marking processing is performed on data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the second data group.

レビューグラフ作成部21は、例えば、ユーザが、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が上位6位以内の入力属性条件(入力属性6≦2.00、入力属性2≦2.01、入力属性7>1.15、入力属性8>10.7、入力属性3>2.00、入力属性4>2.03)を選択し、トレンドグラフ描画指示を行ったことに応答して、図12に示すトレンドグラフを作成し、トレンドグラフを表示装置32へ出力して表示装置32の画面上にトレンドグラフを描画する。トレンドグラフ描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「トレンド/マップ/散布図」ボタンを入力デバイス31としてのポインティングデバイスで操作した後、さらに「トレンド」を入力デバイス31で選択することによって行われる。   For example, the review graph creation unit 21 is configured so that the user can select an input attribute condition (input attribute 6 ≦ 2.00) having the highest priority among the input attribute conditions shown in the input attribute condition list graph (FIG. 8). , Input attribute 2 ≦ 2.01, input attribute 7> 1.15, input attribute 8> 10.7, input attribute 3> 2.00, input attribute 4> 2.03), and a trend graph drawing instruction In response to this, the trend graph shown in FIG. 12 is created, the trend graph is output to the display device 32, and the trend graph is drawn on the screen of the display device 32. For example, after the user operates the “trend / map / scatter diagram” button on the display screen of the input attribute condition list graph (FIG. 8) with the pointing device as the input device 31, Is selected by the input device 31.

図12のトレンドグラフでは、選択された6個の入力属性条件に対応する各入力属性(入力属性6、入力属性2、入力属性7、入力属性8、入力属性3、入力属性4)の時間変化を示す第1のトレンドグラフと、出力属性の時間変化を示す第2のトレンドグラフとが並べて表示されている。なお、図12のトレンドグラフでは、第2のトレンドグラフを第1のトレンドグラフと並べて表示しているが、第2のトレンドグラフを、第1のトレンドグラフと違う色で第1のトレンドグラフと重ねて表示してもよい。これらのグラフでは、同一基板内の各素子の「入力属性」、または、「出力属性」の値の平均値が、基板毎に示されている。横軸は基板番号を示しているが、本例においては、この並び順は、素子(基板)の製造順番と対応している。   In the trend graph of FIG. 12, the time change of each input attribute (input attribute 6, input attribute 2, input attribute 7, input attribute 8, input attribute 3, input attribute 4) corresponding to the selected six input attribute conditions And a second trend graph showing the time change of the output attribute are displayed side by side. In the trend graph of FIG. 12, the second trend graph is displayed side by side with the first trend graph. However, the second trend graph is displayed in a color different from the first trend graph and the first trend graph. It may be displayed in an overlapping manner. In these graphs, the average value of the “input attribute” or “output attribute” value of each element in the same substrate is shown for each substrate. The horizontal axis indicates the substrate number. In this example, this arrangement order corresponds to the manufacturing order of the elements (substrates).

ここで、各入力属性のトレンドグラフ(第1のトレンドグラフ)のそれぞれにおいて、当該入力属性の入力属性条件を満たし、かつ、不良品の第2データ群DA2に対応する出力属性条件を満たすデータには、赤色(図面上では白抜き)のマーキング処理が施されている。また、出力属性のトレンドグラフ(第2のトレンドグラフ)では、不良品の第2データ群DA2に対応する出力属性条件を満たすデータに赤色(図面上では白抜き)のマーキング処理が施されている。すなわち、図12のトレンドグラフでは、不良品の第2データ群DA2と、その要因として抽出された入力属性条件を満たすデータ群との対応関係が、視覚的に強調して表されている。   Here, in each trend graph (first trend graph) of each input attribute, the data satisfying the input attribute condition of the input attribute and satisfying the output attribute condition corresponding to the second data group DA2 of the defective product. Is subjected to a red marking process (white on the drawing). In the output attribute trend graph (second trend graph), data that satisfies the output attribute condition corresponding to the second data group DA2 of the defective product is subjected to red marking (outlined in the drawing). . That is, in the trend graph of FIG. 12, the correspondence between the defective second data group DA2 and the data group that satisfies the input attribute condition extracted as the factor is visually highlighted.

したがって、図12のトレンドグラフを参照することにより、ユーザは、第2の入力属性決定部19(入力属性条件決定部100)が決定した不良要因(入力属性条件)に対して、その基板毎推移(時間的変化)における出力属性との同期性を即座に理解することができる。具体的には、図12の期間AとBには、入力属性6と入力属性2とが低い条件(「入力属性6≦2.00」という入力属性条件、および「入力属性2≦2.01」という入力属性条件)に起因する不良(「出力属性」>2.5)が、期間Cには入力属性7が高い条件(「入力属性7>1.15」という入力属性条件)に起因する不良が、また、期間Dには入力属性4が高い条件(「入力属性4>2.03」という入力属性条件)に起因する不良が、それぞれ主体になっていることが分かる。また、全期間を通したミクロ的な出力属性の変化(丸で囲んだ部分)が、入力属性3が高い条件(「入力属性3>2.00」という入力属性条件)の影響であることが分かる。一方、入力属性8については、出力属性との明確な相関が見られないが、この点については、後述のマップ(図13)の説明で明らかになる。   Therefore, by referring to the trend graph of FIG. 12, the user can change the failure factor (input attribute condition) determined by the second input attribute determining unit 19 (input attribute condition determining unit 100) for each board. It is possible to immediately understand the synchrony with the output attribute in (time change). Specifically, in the periods A and B in FIG. 12, the condition that the input attribute 6 and the input attribute 2 are low (input attribute condition “input attribute 6 ≦ 2.00” and “input attribute 2 ≦ 2.01”). ”(Input attribute condition“> ”) is caused by a condition (input attribute condition“ input attribute 7> 1.15 ”). It can be seen that defects are caused mainly by the condition that the input attribute 4 is high in the period D (input attribute condition “input attribute 4> 2.03”). In addition, the change in the microscopic output attribute throughout the entire period (the circled portion) may be the influence of the condition where the input attribute 3 is high (the input attribute condition “input attribute 3> 2.00”). I understand. On the other hand, the input attribute 8 does not have a clear correlation with the output attribute, but this point will be clarified in the description of the map (FIG. 13) described later.

なお、上記トレンドグラフの横軸には、基板番号やロット番号などを用い、その番号の若いものから順番に並べることもできる。また、上記トレンドグラフの横軸に、素子を製造または検査する、ある特定の工程での処理日時を用い、この処理日時の古いものから順番に並べることも可能である。すなわち、各データに対応する判別キー(基板番号やロット番号、処理日時など)を基準とした並びとすることができる。本発明では、上記のような判別キーを基準とした並びを横軸としたグラフをトレンドグラフと呼んでいる。   It should be noted that the horizontal axis of the trend graph can be arranged in order from the smallest number using a substrate number or a lot number. Moreover, it is also possible to arrange the trend graph in order from the oldest processing date and time using the processing date and time in a specific process for manufacturing or inspecting elements on the horizontal axis of the trend graph. That is, it can be arranged with reference to a discrimination key (substrate number, lot number, processing date and time) corresponding to each data. In the present invention, a graph with the horizontal axis representing the arrangement based on the discrimination keys as described above is called a trend graph.

なお、上記では、表1の基本データ群を分析対象とし、その各データが素子番号単位(すなわち、各素子が、特定の基板番号と、特定の素子座標番号の双方に属する)のものであったため、同一基板内の各素子の「入力属性」または「出力属性」の値の平均値を用いてトレンドグラフを作成していたが、各データが基板単位のものであれば、上記平均値を用いる必要はない。   In the above, the basic data group in Table 1 is an analysis target, and each piece of data is an element number unit (that is, each element belongs to both a specific board number and a specific element coordinate number). Therefore, the trend graph was created using the average value of the “input attribute” or “output attribute” value of each element on the same board. There is no need to use it.

(2)マップ(第2のレビューグラフ)
レビューグラフ作成部21は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から特定の入力属性条件を選択し、マップ描画指示を行ったことに応答して、前記レビューグラフとして第2のレビューグラフを作成する。この第2のレビューグラフは、前記選択された特定の入力属性条件に対応する入力属性の面内分布を表す第1のマップと、前記出力属性の面内分布を表す第2のマップとを共に示している。また、第1のマップにおいては、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている。
(2) Map (second review graph)
For example, the review graph creation unit 21 responds to the fact that the user selects a specific input attribute condition from the input attribute conditions shown in the input attribute condition list graph and gives a map drawing instruction, in response to the review drawing. A second review graph is created as a graph. The second review graph includes both a first map representing an in-plane distribution of input attributes corresponding to the selected specific input attribute condition, and a second map representing an in-plane distribution of the output attributes. Show. In the first map, data that satisfies the input attribute condition and satisfies the output attribute condition corresponding to the second data group is subjected to marking processing.

なお、上記のマップ(第2のレビューグラフ)は、基板面内の位置(素子座標番号)を判別キーとし、この判別キー毎の入力属性および出力属性の変化を表すグラフである。   The above map (second review graph) is a graph representing changes in input attributes and output attributes for each discrimination key, using the position (element coordinate number) in the substrate surface as the discrimination key.

レビューグラフ作成部21は、例えば、ユーザが、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が上位6位以内の6つの入力属性条件の中から代表的な2つの入力属性条件(入力属性6≦2.00、入力属性8>10.7)を選択し、マップ描画指示を行ったことに応答して、図13に示すマップを作成し、マップを表示装置32へ出力して表示装置32の画面上で描画する。マップ描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「トレンド/マップ/散布図」ボタンを入力デバイス31としてのポインティングデバイスで操作した後、さらに「マップ」を入力デバイス31で選択することによって行われる。   For example, the review graph creation unit 21 is a user representative of the six input attribute conditions having the highest priority among the input attribute conditions shown in the input attribute condition list graph (FIG. 8). In response to selecting two input attribute conditions (input attribute 6 ≦ 2.00, input attribute 8> 10.7) and instructing map drawing, the map shown in FIG. 13 is created and the map is displayed. Output to the device 32 and draw on the screen of the display device 32. For example, after the user operates the “trend / map / scatter chart” button on the display screen of the input attribute condition list graph (FIG. 8) with the pointing device as the input device 31, the map drawing instruction is further displayed as “map”. Is selected by the input device 31.

図13のマップでは、選択された2個の入力属性条件に対応する各入力属性(入力属性6、入力属性8)の面内分布(基板上の位置による変化)を表す第1のマップと、出力属性の面内分布を表す第2のマップとが並べて表示されており、これらのマップでは、同一の「素子座標番号」にある各素子の「入力属性」、または、「出力属性」の値の平均値が、素子座標位置毎に色付けをして示されている。具体的には、出力属性のマップ(第2のマップ)において、出力属性の平均値が不良品の条件(「出力属性」>2.5)に対応する座標位置が赤色(図面上では網掛けのハッチングで示す)で示され、他の座標位置が緑色(図面上では斜線のハッチングで示す)で示されている。この例では、座標位置P1およびP2における出力属性の平均値が2.71、座標位置P3における出力属性の平均値が2.46、座標位置P4およびP5における出力属性の平均値が2.22であるので、座標位置P1およびP2が赤色(図面上では網掛けのハッチングで示す)で示されている。各入力属性のマップ(第1のマップ)において、その座標位置に対応する各素子の入力属性の平均値が入力属性条件(入力属性6≦2.00、入力属性8>10.7)を満たす座標位置は、赤色(図面上では網掛けのハッチングで示す)で示されている一方、その座標位置に対応する各素子の入力属性の平均値が入力属性条件を満たさない座標位置は、緑色(図面上では斜線のハッチングで示す)で示されている。この例では、座標位置P1〜P5における入力属性6の平均値が全て1.96(≦2.00)であるので、入力属性6に関する第1のマップでは、座標位置P1〜P5が赤色(図面上では網掛けのハッチングで示す)で示されている。また、この例では、座標位置P1およびP2における入力属性8の平均値がともに11.5、座標位置P3における入力属性8の平均値が10.5、座標位置P4における入力属性8の平均値が9.52、座標位置P5における入力属性8の平均値が9.51であるので、入力属性6に関する第1のマップでは、座標位置P1およびP2が赤色(図面上では網掛けのハッチングで示す)で示されている。   In the map of FIG. 13, a first map representing an in-plane distribution (change due to position on the substrate) of each input attribute (input attribute 6, input attribute 8) corresponding to two selected input attribute conditions; A second map representing the in-plane distribution of output attributes is displayed side by side. In these maps, the value of “input attribute” or “output attribute” of each element in the same “element coordinate number” is displayed. Are averaged for each element coordinate position. Specifically, in the output attribute map (second map), the coordinate position corresponding to the condition (“output attribute”> 2.5) where the average value of the output attribute is defective is red (shaded in the drawing). The other coordinate positions are shown in green (indicated by hatching in the drawing). In this example, the average value of output attributes at coordinate positions P1 and P2 is 2.71, the average value of output attributes at coordinate position P3 is 2.46, and the average value of output attributes at coordinate positions P4 and P5 is 2.22. Therefore, the coordinate positions P1 and P2 are shown in red (indicated by hatching in the drawing). In each input attribute map (first map), the average value of the input attributes of each element corresponding to the coordinate position satisfies the input attribute condition (input attribute 6 ≦ 2.00, input attribute 8> 10.7). The coordinate position is shown in red (indicated by hatching in the drawing), while the coordinate position where the average value of the input attribute of each element corresponding to the coordinate position does not satisfy the input attribute condition is green ( This is indicated by hatching in the drawing). In this example, since the average values of the input attributes 6 at the coordinate positions P1 to P5 are all 1.96 (≦ 2.00), in the first map related to the input attributes 6, the coordinate positions P1 to P5 are red (drawing). It is shown in the shaded hatch above). In this example, the average value of the input attribute 8 at the coordinate positions P1 and P2 is 11.5, the average value of the input attribute 8 at the coordinate position P3 is 10.5, and the average value of the input attribute 8 at the coordinate position P4 is Since the average value of the input attribute 8 at 9.52 and the coordinate position P5 is 9.51, the coordinate positions P1 and P2 are red (indicated by hatching in the drawing) in the first map related to the input attribute 6. It is shown in

ここで、各入力属性の面内分布を表す2つの第1のマップのそれぞれにおいて、当該入力属性の入力属性条件を満たし、かつ、不良品の第2データ群DA2に対応する出力属性条件を満たすデータには、赤枠(図面上では黒枠)のマーキング処理が施されている。すなわち、図13のマップでは、不良品の第2データ群DA2と、その要因として抽出された入力属性条件を満たすデータ群との対応関係が、視覚的に強調して表されている。
したがって、図13のマップを参照することにより、ユーザは、第2の入力属性決定部19(入力属性条件決定部100)が決定した不良要因(入力属性条件)に対して、その面内傾向における出力属性との同期性を即座に理解することができる。具体的には、図13における素子座標番号1,2の不良(「出力属性」>2.5)が、主に、入力属性8の高めに起因していることが分かる。一方、入力属性6については、出力属性との明確な相関が見られない。この結果を、トレンドグラフ(図12)と併せて考察すると、入力属性6が基板の一枚毎の単位で出力属性に影響を及ぼす因子であるのに対し、入力属性8は、基板内の面内分布として出力属性に影響を及ぼす因子であることが分かる。
Here, in each of the two first maps representing the in-plane distribution of each input attribute, the input attribute condition of the input attribute is satisfied, and the output attribute condition corresponding to the second data group DA2 of the defective product is satisfied. The data is marked with a red frame (black frame in the drawing). That is, in the map of FIG. 13, the correspondence between the second data group DA2 of defective products and the data group that satisfies the input attribute condition extracted as the factor is visually emphasized.
Therefore, by referring to the map of FIG. 13, the user can determine the failure factor (input attribute condition) determined by the second input attribute determination unit 19 (input attribute condition determination unit 100) in the in-plane tendency. Immediate understanding of synchrony with output attributes. Specifically, it can be seen that the defect of the element coordinate numbers 1 and 2 (“output attribute”> 2.5) in FIG. 13 is mainly caused by the higher input attribute 8. On the other hand, the input attribute 6 has no clear correlation with the output attribute. Considering this result together with the trend graph (FIG. 12), the input attribute 6 is a factor that affects the output attribute in units of each board, whereas the input attribute 8 is a surface in the board. It can be seen that this is a factor that affects the output attribute as an internal distribution.

なお、上記では、表1の基本データ群を分析対象とし、その各データが素子番号単位(すなわち、各素子が、特定の基板番号と、特定の素子座標番号の双方に属する)のものであったため、同一の「素子座標番号」にある各素子の「入力属性」または「出力属性」の値の平均値を用いてマップを作成していたが、各データが素子座標番号単位のものであれば、上記平均値を用いる必要はない。   In the above, the basic data group in Table 1 is an analysis target, and each piece of data is an element number unit (that is, each element belongs to both a specific board number and a specific element coordinate number). Therefore, a map was created using the average value of the “input attribute” or “output attribute” value of each element in the same “element coordinate number”. For example, it is not necessary to use the average value.

(3)散布図(第3のレビューグラフ)
レビューグラフ作成部21は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から特定の入力属性条件を選択し、散布図描画指示を行ったことに応答して、前記レビューグラフとして第3のレビューグラフを作成する。この第3のレビューグラフは、前記選択された特定の入力属性条件に対応する入力属性と、前記出力属性との関係を示す散布図である。また、この散布図においては、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されている。
(3) Scatter chart (third review graph)
In response to the user selecting a specific input attribute condition from the input attribute conditions shown in the input attribute condition list graph and giving a scatter diagram drawing instruction, for example, the review graph creation unit 21 A third review graph is created as a review graph. The third review graph is a scatter diagram showing the relationship between the input attribute corresponding to the selected specific input attribute condition and the output attribute. In this scatter diagram, marking processing is applied to data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the second data group.

レビューグラフ作成部21は、例えば、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が1位の入力属性条件(入力属性6≦2.00)をユーザが選択し、散布図描画指示を行ったことに応答して、選択された入力属性条件に対応する入力属性(入力属性6)と、出力属性との関係を示す散布図を作成し、散布図を表示装置32へ出力して、表示装置32の画面上に散布図を描画する。散布図描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「トレンド/マップ/散布図」ボタンを入力デバイス31としてのポインティングデバイスで操作した後、さらに「散布図」を入力デバイス31で選択することによって行われる。   For example, the review graph creation unit 21 selects the input attribute condition (input attribute 6 ≦ 2.00) having the highest priority among the input attribute conditions shown in the input attribute condition list graph (FIG. 8). In response to the scatter diagram drawing instruction, a scatter diagram showing the relationship between the input attribute (input attribute 6) corresponding to the selected input attribute condition and the output attribute is created and the scatter diagram is displayed. Output to the device 32 and draw a scatter diagram on the screen of the display device 32. For example, after the user operates the “trend / map / scatter diagram” button on the display screen of the input attribute condition list graph (FIG. 8) with the pointing device as the input device 31, This is done by selecting “Figure” with the input device 31.

上記散布図において、各データは、「○」で示される。ここで、上記散布図において、その横軸とした入力属性に対応する入力属性条件を満たし、かつ、不良品の第2データ群DA2に対応する出力属性条件を満たすデータには、赤色(図面上ではグレー)のマーキング処理が施されている(すなわち、入力属性条件を満たし、かつ、不良品の第2データ群DA2に対応する出力属性条件を満たすデータは、赤のドット(図面上ではグレーのドット)で示される)。すなわち、図14の散布図では、不良品の第2データ群DA2と、その要因として抽出された入力属性条件を満たすデータ群との対応関係が、視覚的に強調して表されている。   In the scatter diagram, each data is indicated by “◯”. Here, in the above scatter diagram, the data that satisfies the input attribute condition corresponding to the input attribute on the horizontal axis and that satisfies the output attribute condition corresponding to the second data group DA2 of the defective product is red (on the drawing). (In gray) marking processing is performed (that is, data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the defective second data group DA2 is represented by a red dot (gray in the drawing). Indicated by a dot). That is, in the scatter diagram of FIG. 14, the correspondence between the defective second data group DA2 and the data group that satisfies the input attribute condition extracted as the factor is visually emphasized.

したがって、図14の散布図を参照することにより、ユーザは、第2の入力属性条件決定部19(入力属性条件決定部100)が決定した不良要因(入力属性条件)に対して、多値的に見た出力属性との相関を、即座に理解することができる。具体的には、入力属性6の低い条件(入力属性6≦2.00)が、多値的に見ても、不良(「出力属性」>2.5)に影響していることを、直感的に理解できる。   Therefore, by referring to the scatter diagram of FIG. 14, the user can evaluate the failure factor (input attribute condition) determined by the second input attribute condition determination unit 19 (input attribute condition determination unit 100) in a multivalued manner. You can immediately understand the correlation with the output attributes. Specifically, it is intuitive that the low condition of the input attribute 6 (input attribute 6 ≦ 2.00) affects the defect (“output attribute”> 2.5) even when viewed in multiple values. Can understand.

なお、レビューグラフ作成部21は、ユーザが、散布図の軸に対応する入力属性条件とは異なる他の入力属性条件による系列分けを指示したことに応答して、該他の入力属性条件を満たすデータと、該他の入力属性条件を満たさないデータとを異なる形態で散布図に示すことも可能である。この場合、ユーザは、上記散布図の描画指示の段階で、散布図の軸として特定の入力属性条件を選択する選択操作、および、散布図描画指示を行うと共に、その入力属性条件とは異なる他の入力属性条件による系列分けを指示すればよい。図15は、図14の散布図の描画指示の段階で、入力属性7>1.15による系列分けを指示した結果である。図15では、他の入力属性条件「入力属性7>1.15」を満たすデータが「×」で示される一方、他の入力属性条件「入力属性7>1.15」を満たさないデータが「○」で示される。この結果を参照することにより、入力属性7>1.15(図中の×印)が、入力属性6とは独立的に不良の要因となっていることが分かるとともに、この影響を除いたデータ(入力属性7≦1.15)において、入力属性6と出力属性の関係が、より顕著に確認できる。   The review graph creating unit 21 responds to the fact that the user has instructed the grouping by another input attribute condition different from the input attribute condition corresponding to the axis of the scatter diagram, and satisfies the other input attribute condition. It is also possible to show data and data that does not satisfy the other input attribute conditions in different forms in the scatter diagram. In this case, the user performs a selection operation for selecting a specific input attribute condition as an axis of the scatter diagram and a scatter diagram drawing instruction at the stage of the scatter diagram drawing instruction, and is different from the input attribute condition. It suffices to indicate the grouping according to the input attribute condition. FIG. 15 shows the result of instructing the grouping by the input attribute 7> 1.15 at the stage of drawing instruction of the scatter diagram of FIG. In FIG. 15, data satisfying another input attribute condition “input attribute 7> 1.15” is indicated by “x”, while data not satisfying the other input attribute condition “input attribute 7> 1.15” is represented by “ “○”. By referring to this result, it can be seen that the input attribute 7> 1.15 (x in the figure) is a factor of failure independently of the input attribute 6, and data excluding this influence In (input attribute 7 ≦ 1.15), the relationship between the input attribute 6 and the output attribute can be confirmed more remarkably.

(4)度数分布図(第4のレビューグラフ)
レビューグラフ作成部21は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から特定の入力属性条件を選択し、度数分布図描画指示を行ったことに応答して、前記基本データ群を、前記選択された特定の入力属性条件を満たすデータ群と、該入力属性条件を満たさないデータ群とに分離し、前記データ群の各々における、前記出力属性の度数分布を示す第4のレビューグラフを前記レビューグラフとして作成する。
(4) Frequency distribution chart (fourth review graph)
In response to the user selecting a specific input attribute condition from the input attribute conditions shown in the input attribute condition list graph and instructing a frequency distribution diagram, for example, The basic data group is separated into a data group that satisfies the selected specific input attribute condition and a data group that does not satisfy the input attribute condition, and shows the frequency distribution of the output attribute in each of the data groups A fourth review graph is created as the review graph.

レビューグラフ作成部21は、例えば、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が1位の入力属性条件(入力属性6≦2.00)をユーザが選択し、度数分布図描画指示を行ったことに応答して、図16に示す度数分布図を作成し、度数分布図を表示装置32へ出力して表示装置32の画面上に度数分布図を描画する。度数分布図描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「度数分布」ボタンを入力デバイス31としてのポインティングデバイスで選択することによって行われる。なお、度数分布図は、図16では折れ線グラフであるが、横軸の区間毎の頻度を区間幅の棒で表す棒グラフ、すなわち、いわゆるヒストグラムであってもよい。   For example, the review graph creation unit 21 selects the input attribute condition (input attribute 6 ≦ 2.00) having the highest priority among the input attribute conditions shown in the input attribute condition list graph (FIG. 8). In response to the instruction to draw the frequency distribution diagram, the frequency distribution diagram shown in FIG. 16 is created, the frequency distribution diagram is output to the display device 32, and the frequency distribution diagram is drawn on the screen of the display device 32. To do. The frequency distribution diagram drawing instruction is performed, for example, when the user selects the “frequency distribution” button on the display screen of the input attribute condition list graph (FIG. 8) with the pointing device as the input device 31. The frequency distribution diagram is a line graph in FIG. 16, but may be a bar graph in which the frequency for each section on the horizontal axis is represented by a section width bar, that is, a so-called histogram.

図16の度数分布図は、基本データ群DA00を、選択された入力属性条件(入力属性6≦2.00)を満たすデータ群と、該入力属性条件を満たさない(入力属性6>2.00を満たす)データ群とに分離したときの、各々のデータ群における出力属性の度数分布を示している。また、図中には、基本データ群を、良品の第1データ群DA1と不良品の第2データ群DA2とに分類した際の出力属性の閾値(2.5)が示されている。すなわち、図16の度数分布図は、不良品の第2データ群DA2と、その要因として抽出された入力属性条件を満たすデータ群との対応関係、および、良品の第1データ群DA1と入力属性条件を満たさないデータ群との対応関係、を表している。   In the frequency distribution diagram of FIG. 16, the basic data group DA00 is divided into a data group that satisfies the selected input attribute condition (input attribute 6 ≦ 2.00) and an input attribute condition that does not satisfy the input attribute condition (input attribute 6> 2.00). The frequency distribution of output attributes in each data group when separated into data groups is shown. In the figure, output attribute threshold values (2.5) are shown when the basic data group is classified into a good first data group DA1 and a defective second data group DA2. That is, the frequency distribution diagram of FIG. 16 shows the correspondence between the defective second data group DA2 and the data group satisfying the input attribute condition extracted as the factor, and the non-defective first data group DA1 and the input attribute. A correspondence relationship with a data group that does not satisfy the condition is shown.

図16の度数分布図を参照することにより、ユーザは、第2の入力属性決定部19(入力属性条件決定部100)が決定した不良要因(入力属性条件)と、その排他的条件とによる、良品と不良品の切分けの程度を、直感的に理解することができる。   By referring to the frequency distribution diagram of FIG. 16, the user can determine the failure factor (input attribute condition) determined by the second input attribute determination unit 19 (input attribute condition determination unit 100) and the exclusive condition. You can intuitively understand the degree of separation between good and defective products.

[ステップ12]
上記のレビューグラフ(図12〜図16)は、主に、入力属性条件一覧グラフ(図7〜図10)の個々の入力属性条件と、出力属性との関係をレビューするものであった。しかし、複数の入力属性条件が互いに交絡したり、主従の関係にあるような場合には、複数の入力属性条件が交絡した条件に基づく分析結果の評価が必要になる。そこで、複合要因グラフ作成部22によって複合要因グラフを作成し、この複合要因グラフを用いて、複数の入力属性条件が交絡した条件に基づく分析結果の評価を行う。
[Step 12]
The review graphs (FIGS. 12 to 16) mainly review the relationship between the individual input attribute conditions of the input attribute condition list graphs (FIGS. 7 to 10) and the output attributes. However, when a plurality of input attribute conditions are entangled with each other or in a master-slave relationship, it is necessary to evaluate an analysis result based on a condition in which a plurality of input attribute conditions are entangled. Therefore, a composite factor graph is created by the composite factor graph creation unit 22, and an analysis result is evaluated based on a condition in which a plurality of input attribute conditions are entangled using the composite factor graph.

複合要因グラフ作成部22は、ユーザが、入力属性条件一覧グラフ(図7〜図10)の画面上で、特定の入力属性条件を選択する選択操作、および、グラフ描画指示を行うことに応答して、上記選択された入力属性条件を含む複数の入力属性条件を、特定の2つ以上の入力属性条件として取得し、この取得した特定の2つ以上の入力属性条件が交絡した条件に基づく複合要因グラフを作成する。   The composite factor graph creation unit 22 responds to a selection operation for selecting a specific input attribute condition and a graph drawing instruction on the screen of the input attribute condition list graph (FIGS. 7 to 10). A plurality of input attribute conditions including the selected input attribute condition are acquired as two or more specific input attribute conditions, and a composite based on a condition in which the acquired two or more specific input attribute conditions are entangled Create a factor graph.

なお、複合要因グラフ作成部22が、上記複合要因グラフを作成するために特定の入力属性条件を取得する方法は、上記ユーザによる選択操作に限らず、コンピュータによる自動選択であってもよい。例えば、コンピュータが、不良品分離度の大きい順の上位の所定数の入力属性条件を自動選択したり、入力属性条件一覧グラフに示された入力属性条件の中から所定数の入力属性条件の組合せの全てを、自動選択するようになっていても良い。   Note that the method by which the composite factor graph creation unit 22 acquires specific input attribute conditions for creating the composite factor graph is not limited to the selection operation by the user, but may be automatic selection by a computer. For example, the computer automatically selects a predetermined number of input attribute conditions in the descending order of the degree of defective product separation, or a combination of a predetermined number of input attribute conditions from among the input attribute conditions shown in the input attribute condition list graph All of these may be automatically selected.

また、複合要因グラフ作成部22へのグラフ描画指示は、上記ユーザによる描画指示に限らず、予め設定された内容に基づく、コンピュータからの指示であってもよい。   Further, the graph drawing instruction to the composite factor graph creating unit 22 is not limited to the drawing instruction by the user, but may be an instruction from a computer based on preset contents.

複合要因グラフ作成部22が作成する複合要因グラフは、例えば、図11に示すように、(5)複合要因パレート図(第1の複合要因グラフ)、(6)要因積上げグラフ(第2の複合要因グラフ)、および、(7)ベストケース/ワーストケース度数分布図(第3の複合要因グラフ)の3種である。以下、不良品分離度(第2データ群分離度)の大きい順に並べた、入力属性条件一覧グラフ(図8)に基づく、交絡条件の評価方法と併せて、上記(5)〜(7)の複合要因グラフについて説明する。なお、(5)〜(7)の複合要因グラフは、例えば、ユーザが、入力属性条件一覧グラフ(図8)の画面上の「複合要因分析」ボタンや「要因積上げグラフ」ボタンを操作することに応答して、複合要因グラフ作成部22によって作成される。   The complex factor graph created by the complex factor graph creating unit 22 includes, for example, as shown in FIG. 11, (5) a complex factor Pareto diagram (first complex factor graph), (6) factor accumulated graph (second complex graph). Factor graph) and (7) best case / worst case frequency distribution diagram (third composite factor graph). Hereinafter, together with the evaluation method of the confounding condition based on the input attribute condition list graph (FIG. 8) arranged in descending order of the defective product separation degree (second data group separation degree), the above (5) to (7) The composite factor graph will be described. Note that the composite factor graphs (5) to (7) are, for example, that the user operates a “complex factor analysis” button or a “factor cumulative graph” button on the screen of the input attribute condition list graph (FIG. 8). In response to this, it is created by the composite factor graph creation unit 22.

(5)複合要因パレート図(第1の複合要因グラフ)
複合要因グラフ作成部22は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から特定の入力属性条件を選択し、複合要因パレート図描画指示を行ったことに応答して、特定の2つの入力属性条件を取得し、前記複合要因グラフとして第1の複合要因グラフを作成する。この第1の複合要因グラフは、基本データ群中で、上記2つの入力属性条件をともに満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果、および、基本データ群中で、前記2つの入力属性条件のうちの一方の条件のみを満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果が、それぞれ示されている複合要因パレート図である。
(5) Composite factor Pareto chart (first composite factor graph)
For example, the composite factor graph creation unit 22 responds to the user selecting a specific input attribute condition from the input attribute conditions shown in the input attribute condition list graph and instructing the drawing of the composite factor Pareto diagram. Then, two specific input attribute conditions are acquired, and a first composite factor graph is created as the composite factor graph. The first composite factor graph satisfies the above two input attribute conditions in the basic data group and calculates the number of data corresponding to the second data group, and in the basic data group. FIG. 11 is a complex factor Pareto diagram showing the results of calculating the number of data satisfying only one of the two input attribute conditions and corresponding to the second data group.

複合要因グラフ作成部22は、例えば、ユーザが、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が1位の入力属性条件(入力属性6≦2.00)をキー条件として選択し、複合要因パレート図の描画指示を行ったことに応答して、図17に示す複合要因グラフを作成し、該複合要因グラフを表示装置32へ出力して、表示装置32の画面上に複合要因グラフを描画する。複合要因パレート図の描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「複合要因分析」ボタンを入力デバイス31としてのポインティングデバイスで操作した後、さらに「複合要因パレート図」を入力デバイス31で選択することによって行われる。   For example, the composite factor graph creation unit 22 has an input attribute condition (input attribute 6 ≦ 2.00) having the highest priority among the input attribute conditions shown in the input attribute condition list graph (FIG. 8). Is selected as a key condition, and a composite factor graph shown in FIG. 17 is created in response to the drawing instruction of the composite factor Pareto diagram, and the composite factor graph is output to the display device 32. Draw a composite factor graph on the screen. The drawing instruction of the complex factor Pareto diagram is, for example, after the user operates the “complex factor analysis” button on the display screen of the input attribute condition list graph (FIG. 8) with the pointing device as the input device 31, This is done by selecting the “factor Pareto diagram” with the input device 31.

図17の複合要因パレート図は、図8の各入力属性条件に対して、キー条件(入力属性6≦2.00)と重複する不良(図中のピンク色(図面中では斜線で示す)の棒)と、キー条件(入力属性6≦2.00)と重複しない不良(図中のグレー色(図面中では斜線なしで示す)の棒)とに分けて、不良数(棒グラフ)を示したものである。なお、キー条件の不良数は、赤色(図面中では網掛けで示す)の棒で示している。ここで、キー条件と重複する不良数は、キー条件を含む2つの入力属性条件をともに満たし、かつ、第2データ群に該当するデータの個数を表し、キー条件と重複しない不良数は、2つの入力属性条件のうちの一方の条件(キー条件でない条件)のみを満たし、かつ、第2データ群に該当するデータの個数を表している。図17の複合要因パレート図には、不良品分離度が折れ線グラフで示されている。なお、不良品分離度の折れ線グラフは省略してもよい。   The complex factor Pareto diagram in FIG. 17 shows that each input attribute condition in FIG. 8 is defective (indicated by hatching in the drawing) that overlaps with the key condition (input attribute 6 ≦ 2.00). The number of defects (bar graph) is shown separately for the bar) and key conditions (input attribute 6 ≦ 2.00) and non-overlapping defects (bars in gray in the figure (shown without diagonal lines in the drawing)). Is. The number of defective key conditions is indicated by a red bar (indicated by shading in the drawing). Here, the number of defects overlapping with the key condition represents the number of data satisfying both of the two input attribute conditions including the key condition and corresponding to the second data group, and the number of defects not overlapping with the key condition is 2 This represents the number of data satisfying only one of the two input attribute conditions (conditions that are not key conditions) and corresponding to the second data group. In the composite factor Pareto diagram of FIG. 17, the degree of defective product separation is shown as a line graph. Note that the line graph of the degree of defective product separation may be omitted.

なお、図17の複合要因パレート図を作成する場合に、複合要因グラフ作成部22が取得する上記特定の2つの入力属性条件とは、その一つを上記キー条件(入力属性6≦2.00)とし、もう一つをキー条件以外の各入力属性条件のそれぞれとした、複数組のものとなる。   Note that when creating the complex factor Pareto diagram of FIG. 17, one of the two specific input attribute conditions acquired by the complex factor graph creating unit 22 is the key condition (input attribute 6 ≦ 2.00). ), And another one for each input attribute condition other than the key condition.

図17の複合要因パレート図を参照することにより、ユーザは、第2の入力属性決定部19(入力属性条件決定部100)が決定した不良要因(入力属性条件)の中で、キー条件(入力属性6≦2.00)との複合要因(または主従の関係にある要因)、および、キー条件(入力属性6≦2.00)とは独立の要因を探すことができる。具体的には、図17の入力属性2≦2.01に起因する不良は、キー条件(入力属性6≦2.00)の不良の大半を含んでおり、キー条件(入力属性6≦2.00)に対して主従の関係にある要因であることが分かる。この結果は、図12のトレンドグラフにおいて、入力属性2と入力属性6とが連動して変化していることと対応する。   By referring to the complex factor Pareto diagram of FIG. 17, the user can select the key condition (input attribute) among the failure factors (input attribute conditions) determined by the second input attribute determining unit 19 (input attribute condition determining unit 100). It is possible to search for a factor independent of the complex factor (or the factor in the master-slave relationship) with the attribute 6 ≦ 2.00 and the key condition (input attribute 6 ≦ 2.00). Specifically, the defects caused by the input attribute 2 ≦ 2.01 in FIG. 17 include most of the defects of the key condition (input attribute 6 ≦ 2.00), and the key condition (input attribute 6 ≦ 2. It can be seen that this is a factor having a master-slave relationship with (00). This result corresponds to the input attribute 2 and the input attribute 6 changing in conjunction with each other in the trend graph of FIG.

一方、図17の入力属性7>1.15に起因する不良は、キー条件(入力属性6≦2.00)と重複しない不良の割合が比較的大きく、キー条件(入力属性6≦2.00)とは独立の要因となっていることが分かる。この結果は、図12のトレンドグラフにおいて、入力属性6(入力属性2)の低い(入力属性6≦2.00(入力属性2≦2.01))ことに起因する不良が、期間AとBに発生しているのに対して、入力属性7の高い(入力属性7>1.15)ことに起因する不良が、上記の期間A、Bとは異なる期間Cに発生していることと対応する。   On the other hand, the defect caused by the input attribute 7> 1.15 in FIG. 17 has a relatively large proportion of defects that do not overlap with the key condition (input attribute 6 ≦ 2.00), and the key condition (input attribute 6 ≦ 2.00). It can be seen that this is an independent factor. As a result, in the trend graph of FIG. 12, the failure caused by the low input attribute 6 (input attribute 2) (input attribute 6 ≦ 2.00 (input attribute 2 ≦ 2.01)) This corresponds to the fact that a defect caused by a high input attribute 7 (input attribute 7> 1.15) occurs in a period C different from the above periods A and B. To do.

なお、このように、複合要因パレート図(図17)は、上記トレンドグラフの結果とも対応するものであるから、まず複合要因パレート図を作成し、これを参照してレビューすべき入力属性条件の候補を挙げ、その後に、図12のトレンドグラフを作成するようにしても構わない。   Since the composite factor Pareto diagram (FIG. 17) corresponds to the result of the trend graph as described above, first, a composite factor Pareto diagram is created and the input attribute condition to be reviewed with reference to this is shown. The candidates may be listed and then the trend graph of FIG. 12 may be created.

(6)要因積上げグラフ(第2の複合要因グラフ)
入力属性条件一覧グラフ(図8)の並び順や、複合要因パレート図(図17)を参照してユーザが選定した複数の入力属性条件について、これら入力属性条件の妥当性を確認するために、すなわち、不良要因を漏れなく選定できているかを確認するために、複合要因グラフ作成部22が要因積上げグラフ(第2の複合要因グラフ)を作成する。
(6) Factor accumulation graph (second composite factor graph)
In order to confirm the validity of these input attribute conditions for a plurality of input attribute conditions selected by the user with reference to the arrangement order of the input attribute condition list graph (FIG. 8) and the composite factor Pareto diagram (FIG. 17), That is, in order to confirm whether the failure factor can be selected without omission, the complex factor graph creating unit 22 creates a factor accumulation graph (second complex factor graph).

複合要因グラフ作成部22は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から、複数の入力属性条件を順位を付けて選択し、要因積上げグラフ描画指示を行ったことに応答して、上記選択された入力属性条件を順位を付けて取得し、前記複合要因グラフとして第2の複合要因グラフを作成する。この第2の複合要因グラフは、前記順位を付けて取得した入力属性条件の順位の順番に、基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を順次積算した要因積上げグラフである。   In the composite factor graph creation unit 22, for example, the user selects a plurality of input attribute conditions from among the input attribute conditions indicated in the input attribute condition list graph, and gives a factor accumulation graph drawing instruction. In response, the selected input attribute conditions are ranked and acquired, and a second composite factor graph is created as the composite factor graph. In the second composite factor graph, the number of data satisfying the input attribute condition in the basic data group and corresponding to the second data group in the order of the order of the input attribute condition acquired by assigning the rank. It is the factor accumulation graph which accumulated sequentially.

なお、複合要因グラフ作成部22が、上記要因積上げグラフを作成するために特定の入力属性条件を取得する方法は、上記ユーザによる選択操作に限らず、コンピュータによる自動選択であってもよい。例えば、コンピュータが、不良品分離度の大きい順の上位の所定数の入力属性条件を、その順位の順番に、自動選択するようになっていても良い。   Note that the method by which the composite factor graph creation unit 22 acquires specific input attribute conditions for creating the factor accumulation graph is not limited to the selection operation by the user, but may be automatic selection by a computer. For example, the computer may automatically select a predetermined number of input attribute conditions in the descending order of the degree of defective product separation in the order of the order.

複合要因グラフ作成部22は、例えば、ユーザが、複数の入力属性条件を、順位を付けて選択する選択操作、例えば、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が上位6位以内の6つの入力属性条件(入力属性6≦2.00、入力属性2≦2.01、入力属性7>1.15、入力属性8>10.7、入力属性3>2.00、入力属性4>2.03)を、その順番で選択し、グラフ描画指示を行うことに応答して、図18に示す要因積上げグラフを作成し、該要因積上げグラフを表示装置32へ出力して、表示装置32の画面上に要因積上げグラフを描画する。要因積上げグラフの描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「要因積上げグラフ」ボタンを入力デバイス31としてのポインティングデバイスで操作することによって行われる。図18の要因積上げグラフには、不良品分離度が折れ線グラフで示されている。なお、不良品分離度の折れ線グラフは省略してもよい。   For example, the composite factor graph creating unit 22 selects a plurality of input attribute conditions in a ranking order, for example, among the input attribute conditions shown in the input attribute condition list graph (FIG. 8). Six input attribute conditions within the top six priorities (input attribute 6 ≦ 2.00, input attribute 2 ≦ 2.01, input attribute 7> 1.15, input attribute 8> 10.7, input attribute 3> 2.00, input attribute 4> 2.03) are selected in that order, and in response to issuing a graph drawing instruction, the factor accumulation graph shown in FIG. 18 is created, and the factor accumulation graph is displayed on the display device 32. And a factor accumulation graph is drawn on the screen of the display device 32. The factor accumulation graph drawing instruction is performed, for example, when the user operates the “factor accumulation graph” button on the display screen of the input attribute condition list graph (FIG. 8) with the pointing device as the input device 31. In the factor accumulation graph of FIG. 18, the degree of defective product separation is shown as a line graph. Note that the line graph of the degree of defective product separation may be omitted.

図18の要因積上げグラフにおいて、ある入力属性条件におけるピンク色(図面上では斜線で示す)の棒は、該入力属性条件の不良数のうち、それよりも左側の入力属性条件に起因する不良の、何れとも重複しない不良数で、これを入力属性条件毎に階段状に積上げて、複数の入力属性条件による総不良数を表現している。また、オレンジ色(図面上では斜線なしで示す)の棒は、それよりも左側の入力属性条件に起因する不良の何れかと重複する不良数を表している。   In the factor accumulation graph of FIG. 18, a pink bar (indicated by a diagonal line in the drawing) in a certain input attribute condition indicates a defect due to the input attribute condition on the left side of the number of defects in the input attribute condition. These are the number of defects that do not overlap with each other, and are stacked stepwise for each input attribute condition to express the total number of defects due to a plurality of input attribute conditions. An orange bar (shown without a diagonal line in the drawing) represents the number of defects that overlap with any of the defects caused by the input attribute condition on the left side.

図18の要因積上げグラフを参照することにより、ユーザは、選定した複数の入力属性条件の妥当性、すなわち、不良要因を漏れなく選定できているかを確認することができる。具体的には、ユーザが選定した上位3位の入力属性条件(入力属性6≦2.00、入力属性2≦2.01、入力属性7>1.15)が、総不良数の約8割を占めており、また、上位5位の入力属性条件(入力属性6≦2.00、入力属性2≦2.01、入力属性7>1.15、入力属性8>10.7、入力属性3>2.00)が、総不良数のほぼ全てを占めていることが分かる。   By referring to the factor accumulation graph of FIG. 18, the user can confirm the validity of the selected plurality of input attribute conditions, that is, whether the failure factor can be selected without omission. Specifically, the top three input attribute conditions selected by the user (input attribute 6 ≦ 2.00, input attribute 2 ≦ 2.01, input attribute 7> 1.15) are about 80% of the total number of defects. And the top five input attribute conditions (input attribute 6 ≦ 2.00, input attribute 2 ≦ 2.01, input attribute 7> 1.15, input attribute 8> 10.7, input attribute 3 > 2.00) account for almost all of the total number of defects.

(7)ベストケース/ワーストケース度数分布図(第3の複合要因グラフ)
複合要因グラフ作成部22は、例えば、ユーザが、入力属性条件一覧グラフに示された入力属性条件の中から、複数の入力属性条件を選択し、ベストケース/ワーストケース度数分布図描画指示を行ったことに応答して、上記選択された入力属性条件を取得し、前記複合要因グラフとして第3の複合要因グラフを作成する。この第3の複合要因グラフは、基本データ群の中から、上記取得した2つ以上の入力属性条件を全て満たすデータ群と、上記取得した2つ以上の入力属性条件の各々に対する排他的条件を全て満たすデータ群とをそれぞれ抽出し、前記データ群の各々における、出力属性の度数分布を示すベストケース/ワーストケース度数分布図である。
(7) Best case / worst case frequency distribution chart (third composite factor graph)
For example, the composite factor graph creation unit 22 selects a plurality of input attribute conditions from the input attribute conditions shown in the input attribute condition list graph, and instructs the drawing of the best case / worst case frequency distribution diagram. In response to this, the selected input attribute condition is acquired, and a third composite factor graph is created as the composite factor graph. The third composite factor graph includes a data group that satisfies all of the two or more acquired input attribute conditions and an exclusive condition for each of the two or more acquired input attribute conditions from the basic data group. FIG. 6 is a best case / worst case frequency distribution diagram showing a frequency distribution of output attributes in each of the data groups, in which all data groups that satisfy all are extracted.

なお、複合要因グラフ作成部22が、上記ベストケース/ワーストケース度数分布図を作成するために特定の入力属性条件を取得する方法は、上記ユーザによる選択操作に限らず、コンピュータによる自動選択であってもよい。例えば、コンピュータが、不良品分離度の大きい順の上位の所定数の入力属性条件を、自動選択するようになっていても良い。   Note that the method by which the composite factor graph creation unit 22 acquires specific input attribute conditions to create the best case / worst case frequency distribution diagram is not limited to the selection operation by the user, but is automatic selection by a computer. May be. For example, the computer may automatically select a predetermined number of input attribute conditions in the descending order of the degree of defective product separation.

複合要因グラフ作成部22は、例えば、ユーザが、複数の入力属性条件を選択する選択操作、例えば、入力属性条件一覧グラフ(図8)に示された入力属性条件のうちで優先順位が上位の代表的な2つの入力属性条件(入力属性6≦2.00、入力属性7>1.15)を選択し、ベストケース/ワーストケース度数分布図の描画指示を行ったことに応答して、図19に示すベストケース/ワーストケース度数分布図を作成し、該ベストケース/ワーストケース度数分布図を表示装置32へ出力して、表示装置32の画面上にベストケース/ワーストケース度数分布図を描画する。ベストケース/ワーストケース度数分布図の描画指示は、例えば、ユーザが、入力属性条件一覧グラフ(図8)の表示画面上における「複合要因分析」ボタンを入力デバイス31としてのポインティングデバイスで操作した後、さらに「ベストケース/ワーストケース度数分布図」を入力デバイス31で選択することによって行われる。なお、ベストケース/ワーストケース度数分布図は、図19では折れ線グラフであるが、横軸の区間毎の頻度を区間幅の棒で表す棒グラフ、すなわち、いわゆるヒストグラムであってもよい。   For example, the composite factor graph creation unit 22 selects a plurality of input attribute conditions, for example, among the input attribute conditions shown in the input attribute condition list graph (FIG. 8), the priority is higher. In response to selecting two typical input attribute conditions (input attribute 6 ≦ 2.00, input attribute 7> 1.15) and instructing drawing of the best case / worst case frequency distribution diagram, 19 is created, the best case / worst case frequency distribution diagram is output to the display device 32, and the best case / worst case frequency distribution diagram is drawn on the screen of the display device 32. To do. The drawing instruction of the best case / worst case frequency distribution chart is, for example, after the user operates the “complex factor analysis” button on the display screen of the input attribute condition list graph (FIG. 8) with the pointing device as the input device 31. Further, the “best case / worst case frequency distribution diagram” is selected by the input device 31. The best case / worst case frequency distribution diagram is a line graph in FIG. 19, but may be a bar graph in which the frequency for each section on the horizontal axis is represented by a section width bar, that is, a so-called histogram.

図19のベストケース/ワーストケース度数分布図では、上記選択された複数の入力属性条件を全て満たすデータ群(入力属性6≦2.00、かつ、入力属性7>1.15:ワーストケースデータ群と呼ぶ)と、上記選択された複数の入力属性条件の各々に対する排他的条件を全て満たすデータ群(入力属性6>2.00、かつ、入力属性7≦1.15:ベストケース)とを基本データ群から抽出したときの、各々のデータ群における出力属性の度数分布図がそれぞれ描かれている。図19では、ベストケースの頻度を「ベストケース頻度」、ワーストケースの頻度を「ワーストケース頻度」と記している。また、図中には、基本データ群を、良品の第1データ群DA1と不良品の第2データ群DA2とに分類した際の出力属性の閾値(2.5)が示されている。すなわち、図19の度数分布図は、不良品の第2データ群DA2の要因として抽出された複数の入力属性条件の相互間の影響を強調して、示している。   In the best case / worst case frequency distribution diagram of FIG. 19, a data group satisfying all the selected input attribute conditions (input attribute 6 ≦ 2.00 and input attribute 7> 1.15: worst case data group. And a data group (input attribute 6> 2.00 and input attribute 7 ≦ 1.15: best case) satisfying all exclusive conditions for each of the selected input attribute conditions. A frequency distribution diagram of output attributes in each data group when extracted from the data group is drawn. In FIG. 19, the best case frequency is described as “best case frequency”, and the worst case frequency is described as “worst case frequency”. In the figure, output attribute threshold values (2.5) are shown when the basic data group is classified into a good first data group DA1 and a defective second data group DA2. That is, the frequency distribution diagram of FIG. 19 shows the mutual influence of a plurality of input attribute conditions extracted as factors of the defective second data group DA2.

図19のベストケース/ワーストケース度数分布図を参照することにより、ユーザは、着目した複数の入力属性条件の相互間の影響を、確認することができる。具体的には、入力属性6≦2.00かつ入力属性7>1.15なる条件は、入力属性6≦2.00が単独で作用している場合(図16)に比べて、出力属性の高い値の側に、よくまとまっていることを確認できる。   By referring to the best case / worst case frequency distribution diagram of FIG. 19, the user can confirm the influence between a plurality of input attribute conditions of interest. Specifically, the condition of the input attribute 6 ≦ 2.00 and the input attribute 7> 1.15 is greater than the case where the input attribute 6 ≦ 2.00 is acting alone (FIG. 16). You can see that it is well organized on the high value side.

上記のステップ11とステップ12が、ユーザの判断に基づき、適宜に繰り返され、さらに、ユーザによる技術的考察が加えられて、不良要因が最終的に特定される。   Steps 11 and 12 described above are repeated as appropriate based on the user's judgment, and further technical considerations are added by the user to finally identify the failure factor.

本実施形態によれば、データ分類部(分類手段)4が、基本データ群DA00を、不良品の第2データ群DA2と、良品の第1データ群DA1とに分類し、入力属性条件決定部100が、不良品の第2データ群DA2と、良品の第1データ群DA1とを切り分ける回帰木を作成する。そして、このとき、「不良品の第2データ群DA2の比率が小さい方のデータ群」である他データ群側についてのみ、順次、回帰木を成長させている。このため、従来の回帰木に比べて構造が単純明快で、また、効率的に、高い確度で不良の要因を特定できる。   According to the present embodiment, the data classification unit (classification means) 4 classifies the basic data group DA00 into a defective second data group DA2 and a non-defective first data group DA1, and an input attribute condition determination unit. 100 creates a regression tree that separates the second data group DA2 of defective products and the first data group DA1 of non-defective products. At this time, the regression tree is sequentially grown only on the other data group side that is the “data group with the smaller ratio of the second data group DA2 of defective products”. For this reason, the structure is simple and clear as compared with the conventional regression tree, and the cause of failure can be identified efficiently and with high accuracy.

また、入力属性条件決定部100が、回帰木の分岐毎に、分岐条件だけでなく全ての入力属性について問題事象(不良品の第2データ群DA2)の要因となる入力属性条件を求め、分岐の回数分の全て入力属性条件の中で、さらに不良品分離度の高い入力属性条件を絞り込み、最終の不良要因(入力属性条件)として決定している。このため、不良の要因を漏れなく、かつ、明確に特定できる。   Further, for each branch of the regression tree, the input attribute condition determination unit 100 obtains an input attribute condition that causes a problem event (second data group DA2 of defective products) for all input attributes as well as the branch condition. Of all the input attribute conditions for the number of times, input attribute conditions having a higher degree of defective product separation are narrowed down and determined as the final failure factor (input attribute condition). For this reason, the cause of failure can be clearly identified without omission.

また、入力属性条件一覧グラフ作成部(入力属性条件一覧作成手段)20が、入力属性条件決定部100が演算した、不良品分離度(第2データ群分離度)および/または不良数(第2データ群該当数)に基づく優先順位の順番に、入力属性条件を並べた入力属性条件一覧グラフを作成する。この入力属性条件一覧グラフを参照することによって、ユーザは、複数の不良要因を一望して把握できるとともに、その優先順位を知ることができる。   Further, the input attribute condition list graph creation unit (input attribute condition list creation unit) 20 calculates the defective product separation degree (second data group separation degree) and / or the number of defects (second) calculated by the input attribute condition determination unit 100. An input attribute condition list graph in which input attribute conditions are arranged in order of priority based on the number of corresponding data groups) is created. By referring to the input attribute condition list graph, the user can see and understand a plurality of failure factors and can know the priority order thereof.

上記のように、本実施形態によれば、「所定の出力属性の要因(製品特性不良の要因等)を、優先順位を付けて明確に特定する、データ分析装置を提供する」という、本発明の他の目的を達成できる。   As described above, according to the present embodiment, the present invention “provides a data analysis device that clearly specifies a factor of a predetermined output attribute (such as a factor of product characteristic failure) with a priority order” is provided. Can achieve other objectives.

また、本実施形態では、上記入力属性条件一覧グラフの画面上の操作でレビューグラフを作成する、レビューグラフ作成部(レビューグラフ作成手段)21を備えている。このため、ユーザは、入力属性条件一覧グラフにおける入力属性条件の並び順(優先順位)を参照しながら(すなわち、分析結果をレビューする暫定的な順番をナビゲーションされながら)、その画面上の操作で、レビューグラフを作成することができる。   In this embodiment, a review graph creation unit (review graph creation means) 21 is provided that creates a review graph by an operation on the screen of the input attribute condition list graph. For this reason, the user can perform operations on the screen while referring to the order (priority order) of the input attribute conditions in the input attribute condition list graph (that is, while navigating the provisional order for reviewing the analysis results). A review graph can be created.

しかも、このレビューグラフでは、不良品の第2データ群DA2と、その要因となる入力属性条件を満たすデータ群との対応関係が、視覚的に強調して表されているから、分析結果を直感的に理解することができる。また、「ユーザによって結果の評価がばらつく」という従来の回帰木の問題も解消できる。   In addition, in this review graph, the correspondence between the second data group DA2 of defective products and the data group that satisfies the input attribute conditions that cause the failure is visually emphasized. Can be understood. In addition, the conventional regression tree problem that “the evaluation of the result varies depending on the user” can be solved.

なお、これらの効果は、(1)データ分類部(分類手段)4が、出力属性の値に基づいて、基本データ群DA00を、不良品の第2データ群DA2と、良品の第1データ群DA1との2グループに分類している事、および、(2)入力属性条件決定部100が、「入力属性条件を満たすデータ群に不良品の第2データ群DA2がまとまり、入力属性条件を満たさないデータ群に良品の第1データ群DA1がまとまる」ように、入力属性条件を決定していること、すなわち、(1)出力属性による基本データ群の2分化と、(2)入力属性による基本データ群との2分化によって、分析結果を評価する際の着目点を明確にしている事による。   These effects are as follows: (1) The data classification unit (classification means) 4 determines the basic data group DA00, the second data group DA2 of defective products, and the first data group of non-defective products based on the value of the output attribute. (2) The input attribute condition determination unit 100 determines that “the second data group DA2 of defective products is collected in the data group that satisfies the input attribute condition and satisfies the input attribute condition. The input attribute condition is determined so that the non-defective first data group DA1 is gathered into the non-data group ”, that is, (1) the basic data group is divided into two by the output attribute and (2) the basic by the input attribute This is because the point of interest when evaluating the analysis results is clarified by dividing into data groups.

上記のように、本実施形態によれば、「明確な指標に基づく、分析結果の直感的な評価を可能とするデータ分析装置を提供する」という本発明の目的を達成できる。   As described above, according to the present embodiment, it is possible to achieve the object of the present invention “providing a data analysis device that enables intuitive evaluation of analysis results based on a clear index”.

さらに、本実施形態では、入力属性条件一覧グラフの画面上の操作で、レビューグラフ作成部(レビューグラフ作成手段)21による多角的なレビューグラフの作成と、複合要因グラフ作成部(複合要因グラフ作成手段)22による多角的な複合要因グラフの作成とを適宜に繰り返すことができるから、双方のグラフを比較しながら、分析結果を容易に評価することができる。   Furthermore, in the present embodiment, by operation on the screen of the input attribute condition list graph, creation of a multi-faceted review graph by the review graph creation unit (review graph creation means) 21 and a composite factor graph creation unit (combination factor graph creation) Since the creation of the multi-faceted complex factor graph by means 22 can be repeated as appropriate, the analysis result can be easily evaluated while comparing both graphs.

本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。   The present invention is not limited to the above-described embodiments, and various modifications are possible within the scope shown in the claims, and embodiments obtained by appropriately combining technical means disclosed in different embodiments. Is also included in the technical scope of the present invention.

例えば、上記の実施形態では、ステップ3〜ステップ6の繰り返し操作を行う場合を例として、本実施形態の説明を行ったが、特に必要でなければ、繰り返し操作を行わなくてもよい。なお、この場合には、第2の入力属性条件決定部19の出力は、第1の入力属性条件決定部12の出力と同じになるから、分岐条件決定部(分岐条件決定手段)14、データ分割部(分割手段)15、終了条件判定部16、および、第2の入力属性条件決定部(第2の入力属性条件決定手段)19を、入力属性条件決定部100から省略しても構わない。   For example, in the above-described embodiment, the present embodiment has been described by taking as an example the case where the repetitive operations of Step 3 to Step 6 are performed. In this case, since the output of the second input attribute condition determining unit 19 is the same as the output of the first input attribute condition determining unit 12, the branch condition determining unit (branch condition determining means) 14, the data The dividing unit (dividing unit) 15, the end condition determining unit 16, and the second input attribute condition determining unit (second input attribute condition determining unit) 19 may be omitted from the input attribute condition determining unit 100. .

また、上記の実施形態では、第2データ群DA2を不良品のデータ群とし、不良の要因を抽出するデータ分析例を示したが、第2データ群DA2を良品のデータ群とし、良品を得るための条件を抽出するデータ分析としてもよい。   In the above embodiment, the second data group DA2 is used as a defective product data group, and a data analysis example for extracting the cause of the failure is shown. However, the second data group DA2 is used as a good data group to obtain a good product. It is good also as data analysis which extracts the conditions for this.

また、上記構成のデータ分析装置は、4種類のレビューグラフを出力可能なレビューグラフ作成部21と、3種類の複合要因グラフを出力可能な複合要因グラフ作成部22とを備えていたが、これらの一方を省略してもよい。また、レビューグラフ作成部21や複合要因グラフ作成部22が出力可能なグラフの種類の数は、特に限定されるものではなく、1種類のみであってもよい。ただし、複数種類のグラフを出力可能である方が、用途にあったグラフを出力でき、また、複数のグラフの組み合わせにより詳細なデータ分析結果の評価が可能となる点で、好ましい。また、レビューグラフ作成部21や複合要因グラフ作成部22が出力可能なグラフは、図示した形態に限定されるものではない。   The data analysis apparatus having the above-described configuration includes the review graph creation unit 21 that can output four types of review graphs and the composite factor graph creation unit 22 that can output three types of composite factor graphs. One of these may be omitted. Further, the number of types of graphs that can be output by the review graph creation unit 21 and the composite factor graph creation unit 22 is not particularly limited, and may be only one type. However, it is preferable that a plurality of types of graphs can be output because a graph suitable for the application can be output and a detailed data analysis result can be evaluated by a combination of a plurality of graphs. Further, the graph that can be output by the review graph creation unit 21 and the composite factor graph creation unit 22 is not limited to the illustrated form.

また、上記実施形態では、入力属性条件一覧グラフ作成部20が、入力属性条件一覧グラフを作成するようになっていた。しかしながら、入力属性条件一覧グラフ作成部20に代えて、入力属性条件決定部100で決定された複数の前記入力属性条件の一覧(リスト)をグラフ以外の形態、例えば一覧表の形態で出力する入力属性条件一覧作成手段を用いてもよい。   In the above embodiment, the input attribute condition list graph creation unit 20 creates the input attribute condition list graph. However, instead of the input attribute condition list graph creation unit 20, an input that outputs a list of the plurality of input attribute conditions determined by the input attribute condition determination unit 100 in a form other than a graph, for example, a list form. An attribute condition list creation unit may be used.

以上で説明したデータ分析方法は、コンピュータが図2のS1〜S12(ステップ1〜12)に対応するプロセスを含むデータ分析プログラムを実行することによって実現できる。したがって、図1のデータ分析装置は、データ分析プログラムが、コンピュータを、基本データ群格納部1、分類条件設定部3、データ分類部4、分類後基本データ群格納部5、分析データ群抽出部6、第1の入力属性条件決定部12、分析結果データ格納部13、分岐条件決定部14、データ分割部15、終了条件判定部16、不良品データ演算部17、第2の入力属性条件決定部19、入力属性条件一覧グラフ作成部20、レビューグラフ作成部21、複合要因グラフ作成部22、および順位決定部23として機能させることにより実現することが可能である。   The data analysis method described above can be realized by the computer executing a data analysis program including processes corresponding to S1 to S12 (steps 1 to 12) in FIG. Therefore, in the data analysis apparatus of FIG. 1, the data analysis program includes a computer, a basic data group storage unit 1, a classification condition setting unit 3, a data classification unit 4, a post-classification basic data group storage unit 5, and an analysis data group extraction unit. 6, first input attribute condition determination unit 12, analysis result data storage unit 13, branch condition determination unit 14, data division unit 15, end condition determination unit 16, defective product data calculation unit 17, second input attribute condition determination This can be realized by functioning as the unit 19, the input attribute condition list graph creation unit 20, the review graph creation unit 21, the composite factor graph creation unit 22, and the rank determination unit 23.

上記データ分析プログラムは、コンピュータで読み取り可能な記録媒体に格納してユーザに提供することができる。これにより、データ分析プログラムをコンピュータに容易に提供することができる。この記録媒体は、コンピュータ本体に内蔵された内蔵メディアであってもよいし、コンピュータ本体に対して分離可能に構成されたリムーバブル・メディアであってもよい。上記内蔵メディアとしては、ROM;フラッシュメモリ等の書き換え可能な不揮発性メモリ;ハードディスク等が挙げられる。また、上記リムーバブル・メディアとしては、CD−ROM、DVD等の光記録媒体;MO等の光磁気記録媒体;フロッピー(登録商標)ディスク、カセットテープ、リムーバブル・ハードディスク等の磁気記録媒体;メモリカード等のような書き換え可能な不揮発性メモリを内蔵したメディア;ROMカセット等のようなROMを内蔵したメディア等が挙げられる。   The data analysis program can be stored in a computer-readable recording medium and provided to the user. Thereby, the data analysis program can be easily provided to the computer. The recording medium may be a built-in medium built in the computer main body, or a removable medium configured to be separable from the computer main body. Examples of the built-in medium include ROM; rewritable nonvolatile memory such as flash memory; and hard disk. The removable media includes optical recording media such as CD-ROM and DVD; magneto-optical recording media such as MO; magnetic recording media such as floppy (registered trademark) disks, cassette tapes and removable hard disks; memory cards and the like. Examples of the medium include a rewritable non-volatile memory such as a medium; a medium including a ROM such as a ROM cassette.

上記プログラムは、CPUのアクセスにより実行される構成であってもよいし、記録媒体に格納されているプログラムを読み出し、読み出したプログラムを内蔵メディアのプログラム記憶領域に転送した後、内蔵メディア上のプログラムがCPUのアクセスにより実行される構成であってもよい。また、上記プログラムは、コンピュータで読み取り可能な記録媒体に格納された状態で販売されるものに限定されるものではなく、インターネット等の通信ネットワークを介してユーザのコンピュータに転送する形式で販売されるものであってもよい。   The program may be configured to be executed by CPU access, or after reading the program stored in the recording medium and transferring the read program to the program storage area of the built-in medium, the program on the built-in medium May be executed by CPU access. Further, the program is not limited to a program that is sold in a state of being stored in a computer-readable recording medium, but is sold in a format that is transferred to a user's computer via a communication network such as the Internet. It may be a thing.

本発明の一実施形態に係るデータ分析装置の構成を示すブロック図である。It is a block diagram which shows the structure of the data analyzer which concerns on one Embodiment of this invention. 本発明の一実施形態に係るデータ分析装置の動作説明に用いるグラフで、出力属性の値の基板毎の推移を表すトレンドグラフである。It is a graph used for operation | movement description of the data analyzer which concerns on one Embodiment of this invention, and is a trend graph showing transition for every board | substrate of the value of an output attribute. 本発明の一実施形態に係るデータ分析装置の動作説明に用いるグラフで、出力属性の面内分布を表すマップである。It is a graph used for operation | movement description of the data analyzer which concerns on one Embodiment of this invention, and is a map showing in-plane distribution of an output attribute. 本発明の一実施形態に係るデータ分析装置の処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a process of the data analyzer which concerns on one Embodiment of this invention. 本発明の一実施形態に係るデータ分析装置における不良品データ演算部17による演算結果の一例(表5)を、ベン図で表現した図である。It is the figure which expressed the example (Table 5) of the calculation result by the inferior goods data calculating part 17 in the data analyzer which concerns on one Embodiment of this invention with the Venn diagram. 本発明の一実施形態に係るデータ分析装置における、入力属性条件決定部100の動作(ステップ3〜ステップ9)を、回帰木の形式で表現した図である。It is the figure which expressed the operation | movement (step 3-step 9) of the input attribute condition determination part 100 in the data analysis apparatus which concerns on one Embodiment of this invention in the form of a regression tree. 本発明の一実施形態に係るデータ分析装置における入力属性条件一覧グラフ作成部20が出力する、入力属性条件一覧グラフである。It is an input attribute condition list graph which the input attribute condition list graph preparation part 20 in the data analyzer which concerns on one Embodiment of this invention outputs. 図7のグラフを、不良品分離度の大きい順に並べ替えた、入力属性条件一覧グラフである。FIG. 8 is an input attribute condition list graph obtained by rearranging the graph of FIG. 7 in descending order of defective product separation degree. 図7のグラフを、不良数の大きい順に並べ替えた、入力属性条件一覧グラフである。8 is an input attribute condition list graph in which the graph of FIG. 7 is rearranged in descending order of the number of defects. 図7のグラフを、不良品分離度と不良数の双方を考慮した配点の高い順に並べ替えた、入力属性条件一覧グラフである。FIG. 8 is an input attribute condition list graph in which the graph of FIG. 7 is rearranged in descending order of the score considering both the defective product separation degree and the number of defects. 入力属性条件一覧グラフ(図7〜図10)の画面上の操作に応答して、レビューグラフ作成部21が作成するレビューグラフ、および、複合要因グラフ作成部22が作成する複合要因グラフを説明する図である。The review graph created by the review graph creation unit 21 and the composite factor graph created by the composite factor graph creation unit 22 in response to operations on the input attribute condition list graphs (FIGS. 7 to 10) will be described. FIG. 本発明の一実施形態に係るデータ分析装置におけるレビューグラフ作成部21が作成する、トレンドグラフの一例である。It is an example of the trend graph which the review graph preparation part 21 in the data analyzer which concerns on one Embodiment of this invention produces. 本発明の一実施形態に係るデータ分析装置におけるレビューグラフ作成部21が作成する、マップの一例である。It is an example of the map which the review graph preparation part 21 in the data analyzer which concerns on one Embodiment of this invention produces. 本発明の一実施形態に係るデータ分析装置におけるレビューグラフ作成部21が作成する、散布図の一例である。It is an example of the scatter diagram which the review graph preparation part 21 in the data analyzer which concerns on one Embodiment of this invention produces. 本発明の一実施形態に係るデータ分析装置におけるレビューグラフ作成部21が作成する、散布図の一例で、図14の散布図に対して、入力属性7>1.15なる条件で系列分けを行ったグラフである。FIG. 14 is an example of a scatter diagram created by the review graph creation unit 21 in the data analysis apparatus according to the embodiment of the present invention. The scatter diagram of FIG. 14 is divided into series under the condition of input attribute 7> 1.15. It is a graph. 本発明の一実施形態に係るデータ分析装置におけるレビューグラフ作成部21が作成する、度数分布図の一例である。It is an example of the frequency distribution map which the review graph preparation part 21 in the data analyzer which concerns on one Embodiment of this invention produces. 本発明の一実施形態に係るデータ分析装置における複合要因グラフ作成部22が作成する、複合要因パレート図の一例である。It is an example of the complex factor pareto chart which the complex factor graph creation part 22 in the data analysis device concerning one embodiment of the present invention creates. 本発明の一実施形態に係るデータ分析装置における複合要因グラフ作成部22が作成する、要因積上げグラフの一例である。It is an example of the factor accumulation graph which the composite factor graph preparation part 22 in the data analyzer which concerns on one Embodiment of this invention produces. 本発明の一実施形態に係るデータ分析装置における複合要因グラフ作成部22が作成する、ベストケース/ワーストケース度数分布図の一例である。It is an example of the best case / worst case frequency distribution diagram created by the composite factor graph creation unit 22 in the data analysis apparatus according to the embodiment of the present invention. 従来の回帰木を表す図である。It is a figure showing the conventional regression tree. 従来の回帰木分析のレビュー結果で、箱ヒゲグラフを表す。A box-whisker graph is represented by a review result of a conventional regression tree analysis. (a)および(b)は、従来の回帰木分析のレビュー結果で、ヒストグラムを表す。(A) And (b) is the review result of the conventional regression tree analysis, and represents a histogram.

符号の説明Explanation of symbols

1 基本データ群格納部
3 分類条件設定部
4 データ分類部(分類手段)
5 分類後基本データ群格納部
6 分析データ群抽出部(分析データ群抽出手段)
12 第1の入力属性条件決定部(第1の入力属性条件決定手段)
13 分析結果データ格納部
14 分岐条件決定部(分岐条件決定手段)
15 データ分割部(分割手段)
16 終了条件判定部
17 不良品データ演算部
19 第2の入力属性条件決定部(第2の入力属性条件決定手段)
20 入力属性条件一覧グラフ作成部(入力属性条件一覧作成手段)
21 レビューグラフ作成部(レビューグラフ作成手段、第2の基本データ群作成手段)
22 複合要因グラフ作成部(複合要因グラフ作成手段)
100 入力属性条件決定部(入力属性条件決定手段)
1 Basic data group storage unit 3 Classification condition setting unit 4 Data classification unit (classification means)
5 Basic data group storage after classification 6 Analysis data group extraction unit (analysis data group extraction means)
12 1st input attribute condition determination part (1st input attribute condition determination means)
13 Analysis result data storage unit 14 Branch condition determination unit (branch condition determination means)
15 Data division unit (division means)
16 end condition determining unit 17 defective product data calculating unit 19 second input attribute condition determining unit (second input attribute condition determining means)
20 Input attribute condition list graph creation unit (input attribute condition list creation means)
21 Review graph creation unit (review graph creation means, second basic data group creation means)
22 Composite factor graph creation unit (Compound factor graph creation means)
100 Input attribute condition determining unit (input attribute condition determining means)

Claims (26)

複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係の分析結果を出力するデータ分析装置であって、
前記出力属性の値に基づいて、前記基本データ群を第1データ群と第2データ群とに分類する分類手段と、
前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定する入力属性条件決定手段と、
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の入力属性条件を取得し、前記特定の入力属性条件に基づく前記基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するレビューグラフ作成手段とを含むことを特徴とするデータ分析装置。
Data for analyzing the causal relationship between the input attribute and the output attribute and outputting the analysis result of the causal relationship with respect to a basic data group that is a set of data composed of a plurality of input attributes and output attributes An analyzer,
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
An input attribute condition, which is an input attribute condition for bisecting the basic data group, is set for each of the plurality of input attributes, so that the first data group and the second data group are respectively combined. An input attribute condition determining means for determining;
Two data groups obtained by obtaining a specific input attribute condition from the plurality of input attribute conditions determined by the input attribute condition determining means, and by dividing the basic data group based on the specific input attribute condition A review graph that visually represents a correspondence relationship between at least one of the first data group and the second data group obtained by bisectioning the basic data group based on the value of the output attribute And a review graph creating means.
複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係の分析結果を出力するデータ分析装置であって、
前記出力属性の値に基づいて、前記基本データ群を第1データ群と第2データ群とに分類する分類手段と、
前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定する入力属性条件決定手段と、
前記複数の入力属性と出力属性とで構成される前記データの各々は、それぞれ複数のグループのいずれかに属しており、前記複数のグループの各々の単位で、該グループに属する前記入力属性および出力属性の値を平均化したデータ群を表す第2の基本データ群を作成する第2の基本データ群作成手段と、
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の入力属性条件を取得し、前記特定の入力属性条件に基づく前記第2の基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記分類手段で前記基本データ群を分類した条件に基づく前記第2の基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するレビューグラフ作成手段とを含むことを特徴とするデータ分析装置。
Data for analyzing the causal relationship between the input attribute and the output attribute and outputting the analysis result of the causal relationship with respect to a basic data group that is a set of data composed of a plurality of input attributes and output attributes An analyzer,
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
An input attribute condition, which is an input attribute condition for bisecting the basic data group, is set for each of the plurality of input attributes, so that the first data group and the second data group are respectively combined. An input attribute condition determining means for determining;
Each of the data composed of the plurality of input attributes and output attributes belongs to each of a plurality of groups, and the input attributes and outputs belonging to the group in units of the plurality of groups. A second basic data group creating means for creating a second basic data group representing a data group obtained by averaging attribute values;
2 obtained by obtaining a specific input attribute condition from among the plurality of input attribute conditions determined by the input attribute condition determining means, and by dividing the second basic data group based on the specific input attribute condition The correspondence relationship between at least one of the two data groups and at least one of the two data groups obtained by the bisection of the second basic data group based on the condition for classifying the basic data group by the classification means is visually shown. And a review graph creating means for outputting a review graph represented by the data analysis device.
前記入力属性条件決定手段で決定された複数の前記入力属性条件の一覧を出力する入力属性条件一覧作成手段をさらに含み、
前記レビューグラフ作成手段は、ユーザが、前記入力属性条件一覧作成手段で出力された一覧に含まれる複数の前記入力属性条件の中から特定の入力属性条件を選択する選択操作、および、レビューグラフ描画指示を行うことに応答して、前記選択された入力属性条件を前記特定の入力属性条件として取得し、前記レビューグラフの出力を行うものであることを特徴とする請求項1または2に記載のデータ分析装置。
An input attribute condition list creating means for outputting a list of the plurality of input attribute conditions determined by the input attribute condition determining means;
The review graph creating means includes a selection operation in which a user selects a specific input attribute condition from the plurality of input attribute conditions included in the list output by the input attribute condition list creating means, and a review graph drawing 3. The method according to claim 1, wherein the selected input attribute condition is acquired as the specific input attribute condition in response to performing the instruction, and the review graph is output. 4. Data analysis device.
前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、
前記レビューグラフ作成手段は、少なくとも、前記入力属性条件を満たすデータ群と、前記第2データ群に対応する出力属性条件を満たすデータ群との対応関係を視覚的に表すレビューグラフを出力するものであることを特徴とする請求項1〜3のいずれか1項に記載のデータ分析装置。
The input attribute condition determined by the input attribute condition determining means is “the second data group is grouped in a data group that satisfies the input attribute condition, and the first data group is included in a data group that does not satisfy the input attribute condition. Is a condition that is determined to
The review graph creating means outputs a review graph that visually represents at least a correspondence relationship between a data group that satisfies the input attribute condition and a data group that satisfies the output attribute condition corresponding to the second data group. The data analysis apparatus according to claim 1, wherein the data analysis apparatus is provided.
前記入力属性条件の一覧には、前記入力属性条件決定手段で決定された複数の前記入力属性条件の各々に関する、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数と、前記基本データ群中で該入力属性条件を満たすデータの中に前記第2データ群が含まれるデータ個数の割合を表す第2データ群分離度とが、前記入力属性条件に併せて示されていることを特徴とする請求項4に記載のデータ分析装置。   In the list of input attribute conditions, the input attribute condition is satisfied in the basic data group for each of the plurality of input attribute conditions determined by the input attribute condition determining means, and the second data group A second data group separation that represents the number of corresponding second data groups that represents the number of corresponding data and the ratio of the number of data that includes the second data group in the data that satisfies the input attribute condition in the basic data group The data analysis apparatus according to claim 4, wherein a degree is indicated together with the input attribute condition. 前記入力属性条件決定手段で決定された複数の前記入力属性条件に対して、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数、および、前記基本データ群中で該入力属性条件を満たすデータの中における、前記第2データ群に該当するデータ個数の割合を表す第2データ群分離度の少なくとも一方を指標として、前記第2データ群に対応する出力属性条件の要因としての重要度による順位付けを行う順位決定手段をさらに含み、
前記入力属性条件一覧作成手段は、前記順位決定手段による順位付けの結果を前記入力属性条件の一覧に示すことを特徴とする請求項4または5に記載のデータ分析装置。
A second value representing the number of data that satisfies the input attribute condition in the basic data group and corresponds to the second data group with respect to the plurality of input attribute conditions determined by the input attribute condition determining means. Using at least one of the number of corresponding data groups and the second data group separation degree indicating the ratio of the number of data corresponding to the second data group in the data satisfying the input attribute condition in the basic data group as an index And rank determination means for ranking according to importance as a factor of the output attribute condition corresponding to the second data group,
6. The data analysis apparatus according to claim 4 or 5, wherein the input attribute condition list creation unit indicates a result of ranking by the rank determination unit in the list of input attribute conditions.
前記基本データ群または前記第2の基本データ群における、複数の入力属性と、出力属性とで構成される前記データの各々には、それぞれ判別キーが付与されており、
前記レビューグラフ作成手段は、
前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、
該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性の、前記判別キー毎の変化を示す第1のグラフと、前記出力属性の前記判別キー毎の変化を示す第2のグラフとを共に示すグラフを、前記レビューグラフとして出力するものであり、
前記第1のグラフでは、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されていることを特徴とする請求項4〜6のいずれか1項に記載のデータ分析装置。
In each of the data composed of a plurality of input attributes and output attributes in the basic data group or the second basic data group, a discrimination key is given, respectively.
The review graph creating means includes:
The target data group for which the review graph is to be created is the basic data group or the second basic data group,
For the target data group, a first graph showing a change for each discrimination key of an input attribute corresponding to the acquired specific input attribute condition, and a first graph showing a change for each discrimination key of the output attribute A graph showing both of the graphs of 2 is output as the review graph,
7. The marking according to claim 4, wherein in the first graph, marking processing is applied to data satisfying the input attribute condition and satisfying an output attribute condition corresponding to the second data group. The data analysis apparatus according to claim 1.
前記基本データ群は、異なる時点に対応する複数のデータを含み、
前記レビューグラフ作成手段は、
前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、
該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性の時間変化を示す第1のトレンドグラフと、前記出力属性の時間変化を示す第2のトレンドグラフとを共に示す第1のレビューグラフを前記レビューグラフとして出力するものであり、
前記第1のトレンドグラフでは、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されていることを特徴とする請求項4〜6のいずれか1項に記載のデータ分析装置。
The basic data group includes a plurality of data corresponding to different time points,
The review graph creating means includes:
The target data group for which the review graph is to be created is the basic data group or the second basic data group,
For the target data group, both a first trend graph showing the time change of the input attribute corresponding to the acquired specific input attribute condition and a second trend graph showing the time change of the output attribute are shown together. The first review graph is output as the review graph,
In the first trend graph, marking processing is performed on data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the second data group. The data analysis device according to any one of claims.
前記基本データ群は、面内の異なる位置に対応する複数のデータを含み、
前記レビューグラフ作成手段は、
前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、
該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性の面内分布を表す第1のマップと、前記出力属性の面内分布を表す第2のマップとを共に示す第2のレビューグラフを前記レビューグラフとして出力するものであり、
前記第1のマップでは、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されていることを特徴とする請求項4〜6のいずれか1項に記載のデータ分析装置。
The basic data group includes a plurality of data corresponding to different positions in the plane,
The review graph creating means includes:
The target data group for which the review graph is to be created is the basic data group or the second basic data group,
A first map representing the in-plane distribution of the input attribute corresponding to the acquired specific input attribute condition and a second map representing the in-plane distribution of the output attribute are shown together for the target data group. Outputting a second review graph as the review graph,
7. The marking according to claim 4, wherein in the first map, marking processing is performed on data satisfying the input attribute condition and satisfying an output attribute condition corresponding to the second data group. The data analysis apparatus according to claim 1.
前記レビューグラフ作成手段は、
前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、
該対象データ群に対して、前記取得した特定の入力属性条件に対応する入力属性と、前記出力属性との関係を示す散布図である第3のレビューグラフを前記レビューグラフとして出力するものであり、前記散布図では、該入力属性条件を満たし、かつ、前記第2データ群に対応する出力属性条件を満たすデータにマーキング処理が施されていることを特徴とする請求項4〜6のいずれか1項に記載のデータ分析装置。
The review graph creating means includes:
The target data group for which the review graph is to be created is the basic data group or the second basic data group,
For the target data group, a third review graph that is a scatter diagram showing a relationship between the input attribute corresponding to the acquired specific input attribute condition and the output attribute is output as the review graph. In the scatter diagram, marking processing is performed on data satisfying the input attribute condition and satisfying the output attribute condition corresponding to the second data group. The data analysis apparatus according to item 1.
前記レビューグラフ作成手段は、ユーザが、散布図の軸に対応する入力属性条件とは異なる他の入力属性条件による系列分けを指示したことに応答して、前記他の入力属性条件を満たすデータと、前記他の入力属性条件を満たさないデータとを異なる形態で散布図に示すことを特徴とする請求項10に記載のデータ分析装置。   In response to the user instructing the grouping by another input attribute condition different from the input attribute condition corresponding to the axis of the scatter diagram, the review graph creating means The data analysis apparatus according to claim 10, wherein the data that does not satisfy the other input attribute condition is shown in a scatter diagram in a different form. 前記レビューグラフ作成手段は、
前記レビューグラフの作成の対象とする対象データ群を、前記基本データ群または前記第2の基本データ群とし、
該対象データ群を、前記取得した特定の入力属性条件を満たすデータ群と、該入力属性条件を満たさないデータ群とに分離し、
前記データ群の各々における、前記出力属性の度数分布を示す第4のレビューグラフを前記レビューグラフとして出力するものであることを特徴とする請求項4〜6のいずれか1項に記載のデータ分析装置。
The review graph creating means includes:
The target data group for which the review graph is to be created is the basic data group or the second basic data group,
Separating the target data group into a data group satisfying the acquired specific input attribute condition and a data group not satisfying the input attribute condition;
The data analysis according to any one of claims 4 to 6, wherein a fourth review graph indicating the frequency distribution of the output attribute in each of the data groups is output as the review graph. apparatus.
複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係の分析結果を出力するデータ分析装置であって、
前記出力属性の値に基づいて、前記基本データ群を、第1データ群と第2データ群とに分類する分類手段と、
前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する入力属性条件決定手段と、
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つ以上の入力属性条件を取得し、前記特定の2つ以上の入力属性条件が交絡した条件に基づいて前記基本データ群から抽出されるデータ群と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を表す複合要因グラフを出力する複合要因グラフ作成手段とを含むことを特徴とするデータ分析装置。
Data for analyzing the causal relationship between the input attribute and the output attribute and outputting the analysis result of the causal relationship with respect to a basic data group that is a set of data composed of a plurality of input attributes and output attributes An analyzer,
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
An input attribute condition, which is an input attribute condition for dividing the basic data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are combined. , Input attribute condition determining means for determining each,
Two or more specific input attribute conditions are acquired from the plurality of input attribute conditions determined by the input attribute condition determining means, and the two or more input attribute conditions are entangled based on the condition A composite representing a correspondence relationship between a data group extracted from a basic data group and at least one of the first data group and the second data group obtained by bisecting the basic data group based on the value of the output attribute A data analysis apparatus comprising: composite factor graph creating means for outputting a factor graph.
前記入力属性条件決定手段で決定された複数の前記入力属性条件の一覧を出力する入力属性条件一覧作成手段をさらに含み、
前記複合要因グラフ作成手段は、ユーザが、前記入力属性条件一覧作成手段で出力された一覧に含まれる複数の前記入力属性条件の中から特定の入力属性条件を選択する選択操作、および、複合要因グラフ描画指示を行うことに応答して、前記選択された入力属性条件を含む入力属性条件を、前記特定の2つ以上の入力属性条件として取得し、前記複合要因グラフの出力を行うものであることを特徴とする請求項13に記載のデータ分析装置。
An input attribute condition list creating means for outputting a list of the plurality of input attribute conditions determined by the input attribute condition determining means;
The composite factor graph creating means includes a selection operation in which a user selects a specific input attribute condition from a plurality of the input attribute conditions included in the list output by the input attribute condition list creating means, and a composite factor In response to performing a graph drawing instruction, the input attribute condition including the selected input attribute condition is acquired as the two or more specific input attribute conditions, and the composite factor graph is output. The data analysis apparatus according to claim 13.
前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、
前記入力属性条件の一覧には、前記入力属性条件決定手段で決定された複数の前記入力属性条件の各々に関する、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数と、前記基本データ群中で該入力属性条件を満たすデータの中に前記第2データ群が含まれるデータ個数の割合を表す第2データ群分離度とが、前記入力属性条件に併せて示されていることを特徴とする請求項14に記載のデータ分析装置。
The input attribute condition determined by the input attribute condition determining means is “the second data group is grouped in a data group that satisfies the input attribute condition, and the first data group is included in a data group that does not satisfy the input attribute condition. Is a condition that is determined to
In the list of input attribute conditions, the input attribute condition is satisfied in the basic data group for each of the plurality of input attribute conditions determined by the input attribute condition determining means, and the second data group A second data group separation that represents the number of corresponding second data groups that represents the number of corresponding data and the ratio of the number of data that includes the second data group in the data that satisfies the input attribute condition in the basic data group The data analysis apparatus according to claim 14, wherein a degree is indicated together with the input attribute condition.
前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、
前記入力属性条件決定手段で決定された複数の前記入力属性条件に対して、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数、および、前記基本データ群中で該入力属性条件を満たすデータの中における、前記第2データ群に該当するデータ個数の割合を表す第2データ群分離度の少なくとも一方を指標として、前記第2データ群に対応する出力属性条件の要因としての重要度による順位付けを行う順位決定手段をさらに含み、
前記入力属性条件一覧作成手段は、前記順位決定手段による順位付けの結果を前記入力属性条件の一覧に示すことを特徴とする請求項14または15に記載のデータ分析装置。
The input attribute condition determined by the input attribute condition determining means is “the second data group is grouped in a data group that satisfies the input attribute condition, and the first data group is included in a data group that does not satisfy the input attribute condition. Is a condition that is determined to
A second value representing the number of data that satisfies the input attribute condition in the basic data group and corresponds to the second data group with respect to the plurality of input attribute conditions determined by the input attribute condition determining means. Using at least one of the number of corresponding data groups and the second data group separation degree indicating the ratio of the number of data corresponding to the second data group in the data satisfying the input attribute condition in the basic data group as an index And rank determination means for ranking according to importance as a factor of the output attribute condition corresponding to the second data group,
16. The data analysis apparatus according to claim 14 or 15, wherein the input attribute condition list creation unit indicates a result of ranking by the rank determination unit in the list of input attribute conditions.
前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、
前記複合要因グラフ作成手段は、
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つの入力属性条件を取得し、
前記基本データ群中で、前記の2つの入力属性条件をともに満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果、および、
前記基本データ群中で、前記2つの入力属性条件のうちの一方の条件のみを満たし、かつ、前記第2データ群に該当するデータの個数を演算した結果が、それぞれ示されている第1の複合要因グラフを前記複合要因グラフとして出力するものであることを特徴とする請求項13〜16のいずれか1項に記載のデータ分析装置。
The input attribute condition determined by the input attribute condition determining means is “the second data group is grouped in a data group that satisfies the input attribute condition, and the first data group is included in a data group that does not satisfy the input attribute condition. Is a condition that is determined to
The composite factor graph creating means includes:
Two specific input attribute conditions are acquired from the plurality of input attribute conditions determined by the input attribute condition determining means,
In the basic data group, a result of calculating the number of data satisfying both the two input attribute conditions and corresponding to the second data group, and
In the basic data group, the result of calculating the number of data satisfying only one of the two input attribute conditions and corresponding to the second data group is shown as the first data The data analysis apparatus according to any one of claims 13 to 16, wherein a complex factor graph is output as the complex factor graph.
前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、
前記複合要因グラフ作成手段は、
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つ以上の入力属性条件を、順位を付けて取得し、
前記順位を付けて取得した入力属性条件の順位の順番に、前記基本データ群中で該入力属性条件を満たし、かつ、前記第2データ群に該当するデータの個数を表す第2データ群該当数を順次積算した結果を示す第2の複合要因グラフを前記複合要因グラフとして出力するものであることを特徴とする請求項13〜16のいずれか1項に記載のデータ分析装置。
The input attribute condition determined by the input attribute condition determining means is “the second data group is grouped in a data group that satisfies the input attribute condition, and the first data group is included in a data group that does not satisfy the input attribute condition. Is a condition that is determined to
The composite factor graph creating means includes:
Obtaining two or more specific input attribute conditions from among the plurality of input attribute conditions determined by the input attribute condition determining means, with ranking,
The second data group corresponding number representing the number of data satisfying the input attribute condition in the basic data group and corresponding to the second data group in the order of the order of the input attribute conditions acquired with the ranking. The data analysis apparatus according to any one of claims 13 to 16, wherein a second composite factor graph indicating a result of sequentially integrating the two is output as the composite factor graph.
前記入力属性条件決定手段によって決定される前記入力属性条件は、「該入力属性条件を満たすデータ群に前記第2データ群がまとまり、該入力属性条件を満たさないデータ群に前記第1データ群がまとまる」ように決定される条件であり、
前記複合要因グラフ作成手段は、
前記基本データ群の中から、前記取得した2つ以上の入力属性条件を全て満たすデータ群と、前記取得した2つ以上の入力属性条件の各々に対する排他的条件を全て満たすデータ群とをそれぞれ抽出し、
前記データ群の各々における、前記出力属性の度数分布を示す第3の複合要因グラフを前記複合要因グラフとして出力するものであることを特徴とする請求項13〜16のいずれか1項に記載のデータ分析装置。
The input attribute condition determined by the input attribute condition determining means is “the second data group is grouped in a data group that satisfies the input attribute condition, and the first data group is included in a data group that does not satisfy the input attribute condition. Is a condition that is determined to
The composite factor graph creating means includes:
Extract from the basic data group a data group that satisfies all of the acquired two or more input attribute conditions and a data group that satisfies all of the exclusive conditions for each of the acquired two or more input attribute conditions. And
The third composite factor graph indicating the frequency distribution of the output attribute in each of the data groups is output as the composite factor graph. Data analysis device.
前記入力属性条件決定手段は、
前記分類手段による分類後の前記基本データ群の中から、分析の対象とする分析データ群を抽出する分析データ群抽出手段と、
前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記分析データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する第1の入力属性条件決定手段と、
前記第1の入力属性条件決定手段で決定された前記入力属性条件の中で、前記第2データ群を切出す確度が最も高い前記入力属性条件を、分岐条件として決定する分岐条件決定手段と、
前記分岐条件決定手段で決定された前記分岐条件に基づいて、前記分析データ群を2つのデータ群に分割する分割手段と、
前記第1の入力属性条件決定手段で決定された前記入力属性条件の中から前記第2データ群に対応する出力属性条件の要因としての重要度の高い入力属性条件を選定する第2の入力属性条件決定手段とを含み、
前記分析データ群抽出手段は、前記分割手段で分割された2つのデータ群のうち、前記第2データ群の比率が小さい方のデータ群のみを新たな分析データ群として抽出し、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理が繰り返し実行されるようになっており、
前記第2の入力属性条件決定手段は、前記入力属性の各々に対して、それぞれ、前記第1の入力属性条件決定手段の繰り返しの処理によって決定された該入力属性における複数の入力属性条件の中から前記重要度の高い入力属性条件を選定し、該選定された入力属性条件を、前記入力属性条件決定手段の出力として決定するものであることを特徴とする請求項1、2、または13に記載のデータ分析装置。
The input attribute condition determining means includes
Analysis data group extraction means for extracting an analysis data group to be analyzed from the basic data group after classification by the classification means;
An input attribute condition, which is an input attribute condition for dividing the analysis data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are respectively combined. , First input attribute condition determining means for determining each,
Among the input attribute conditions determined by the first input attribute condition determining means, a branch condition determining means for determining, as a branch condition, the input attribute condition having the highest probability of cutting out the second data group;
Dividing means for dividing the analysis data group into two data groups based on the branch conditions determined by the branch condition determining means;
A second input attribute for selecting a highly important input attribute condition as a factor of an output attribute condition corresponding to the second data group from the input attribute conditions determined by the first input attribute condition determining means Including a condition determining means,
The analysis data group extraction unit extracts only a data group having a smaller ratio of the second data group from the two data groups divided by the division unit as a new analysis data group, and the analysis data group A series of processing consisting of processing by the extracting means, processing by the first input attribute condition determining means, processing by the branch condition determining means, and processing by the dividing means is repeatedly executed,
The second input attribute condition determining unit is configured to select, for each of the input attributes, a plurality of input attribute conditions in the input attribute determined by the repetition process of the first input attribute condition determining unit. The input attribute condition having a high degree of importance is selected from the above, and the selected input attribute condition is determined as an output of the input attribute condition determining means. The data analysis device described.
複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係を示す情報を抽出するデータ分析装置であって、
前記出力属性の値に基づいて、前記基本データ群を、第1データ群と第2データ群とに分類する分類手段と、
前記分類手段による分類後の前記基本データ群の中から、分析の対象とする分析データ群を抽出する分析データ群抽出手段と、
前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記分析データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する第1の入力属性条件決定手段と、
前記第1の入力属性条件決定手段で決定された前記入力属性条件の中で、前記第2データ群を切出す確度が最も高い前記入力属性条件を、分岐条件として決定する分岐条件決定手段と、
前記分岐条件決定手段で決定された前記分岐条件に基づいて、前記分析データ群を2分化する分割手段とを含み、
前記分析データ群抽出手段は、前記分割手段で分割されたデータ群のうち、前記第2データ群の比率が小さい方のデータ群のみを新たな分析データ群として抽出し、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理が繰り返し実行されるようになっていることを特徴とするデータ分析装置。
Data for analyzing a causal relationship between the input attribute and the output attribute and extracting information indicating the causal relationship with respect to a basic data group that is a set of data composed of a plurality of input attributes and output attributes An analyzer,
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
Analysis data group extraction means for extracting an analysis data group to be analyzed from the basic data group after classification by the classification means;
An input attribute condition, which is an input attribute condition for dividing the analysis data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are respectively combined. , First input attribute condition determining means for determining each,
Among the input attribute conditions determined by the first input attribute condition determining means, a branch condition determining means for determining, as a branch condition, the input attribute condition having the highest probability of cutting out the second data group;
Splitting means for dividing the analysis data group into two based on the branch condition determined by the branch condition determining means,
The analysis data group extraction unit extracts only a data group having a smaller ratio of the second data group from the data group divided by the division unit as a new analysis data group, and the analysis data group extraction unit A series of processes consisting of the process according to the above, the process by the first input attribute condition determining means, the process by the branch condition determining means, and the process by the dividing means are repeatedly executed. Data analysis device.
コンピュータを、複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係の分析結果を出力するデータ分析装置として機能させるためのデータ分析プログラムであって、
コンピュータを、
前記出力属性の値に基づいて、前記基本データ群を第1データ群と第2データ群とに分類する分類手段、
前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定する入力属性条件決定手段、および
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の入力属性条件を取得し、前記特定の入力属性条件に基づく前記基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するレビューグラフ作成手段として機能させるためのデータ分析プログラム。
The computer analyzes a causal relationship between the input attribute and the output attribute with respect to a basic data group that is a set of data including a plurality of input attributes and an output attribute, and obtains the analysis result of the causal relationship. A data analysis program for functioning as a data analysis device for output,
Computer
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
An input attribute condition, which is an input attribute condition for bisecting the basic data group, is set for each of the plurality of input attributes, so that the first data group and the second data group are respectively combined. An input attribute condition determining means to determine, and a specific input attribute condition is acquired from the plurality of input attribute conditions determined by the input attribute condition determining means, and the basic data group based on the specific input attribute condition is acquired. Correspondence relationship between at least one of two data groups obtained by bisection and at least one of the first data group and the second data group obtained by bisection of the basic data group based on the value of the output attribute Analysis program for functioning as a review graph creation means for outputting a review graph that visually represents a message.
コンピュータを、複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係の分析結果を出力するデータ分析装置として機能させるためのデータ分析プログラムであって、
コンピュータを、
前記出力属性の値に基づいて、前記基本データ群を第1データ群と第2データ群とに分類する分類手段、
前記第1データ群と前記第2データ群とがそれぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対してそれぞれ決定する入力属性条件決定手段、
前記複数の入力属性と出力属性とで構成される前記データの各々は、それぞれ複数のグループのいずれかに属しており、前記複数のグループの各々の単位で、該グループに属する前記入力属性および出力属性の値を平均化したデータ群を表す第2の基本データ群を作成する第2の基本データ群作成手段、および
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の入力属性条件を取得し、前記特定の入力属性条件に基づく前記第2の基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、前記分類手段で前記基本データ群を分類した条件に基づく前記第2の基本データ群の2分化によって得られる2つのデータ群の少なくとも一方と、の対応関係を視覚的に表すレビューグラフを出力するレビューグラフ作成手段として機能させるためのデータ分析プログラム。
The computer analyzes a causal relationship between the input attribute and the output attribute with respect to a basic data group that is a set of data including a plurality of input attributes and an output attribute, and obtains the analysis result of the causal relationship. A data analysis program for functioning as a data analysis device for output,
Computer
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
An input attribute condition, which is an input attribute condition for bisecting the basic data group, is set for each of the plurality of input attributes, so that the first data group and the second data group are respectively combined. Input attribute condition determining means to determine,
Each of the data composed of the plurality of input attributes and output attributes belongs to each of a plurality of groups, and the input attributes and outputs belonging to the group in units of the plurality of groups. A second basic data group creating means for creating a second basic data group representing a data group in which attribute values are averaged, and the plurality of input attribute conditions determined by the input attribute condition determining means And a condition obtained by classifying the basic data group by the classifying unit and at least one of two data groups obtained by bisection of the second basic data group based on the specific input attribute condition A review graph that outputs a review graph visually representing a correspondence relationship between at least one of two data groups obtained by bisection of the second basic data group based on Data analysis program to function as a view graph creation means.
コンピュータを、複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係の分析結果を出力するデータ分析装置として機能させるためのデータ分析プログラムであって、
コンピュータを、
前記出力属性の値に基づいて、前記基本データ群を、第1データ群と第2データ群とに分類する分類手段、
前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記基本データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する入力属性条件決定手段、および
前記入力属性条件決定手段で決定された複数の前記入力属性条件の中から特定の2つ以上の入力属性条件を取得し、前記特定の2つ以上の入力属性条件が交絡した条件に基づいて前記基本データ群から抽出されるデータ群と、前記出力属性の値に基づく前記基本データ群の2分化によって得られる前記第1データ群および前記第2データ群の少なくとも一方と、の対応関係を表す複合要因グラフを出力する複合要因グラフ作成手段として機能させるためのデータ分析プログラム。
The computer analyzes a causal relationship between the input attribute and the output attribute with respect to a basic data group that is a set of data including a plurality of input attributes and an output attribute, and obtains the analysis result of the causal relationship. A data analysis program for functioning as a data analysis device for output,
Computer
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
An input attribute condition, which is an input attribute condition for dividing the basic data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are combined. , Input attribute condition determining means for determining each, and acquiring two or more specific input attribute conditions from among the plurality of input attribute conditions determined by the input attribute condition determining means, and the two or more specific input attribute conditions The first data group and the second data group obtained by bifurcation of a data group extracted from the basic data group based on a condition entangled with an input attribute condition, and the basic data group based on a value of the output attribute A data analysis program for functioning as a composite factor graph creating means for outputting a composite factor graph representing a correspondence relationship with at least one of the above.
複数の入力属性と、出力属性とで構成されるデータの集合である基本データ群に対して、前記入力属性と前記出力属性との因果関係を分析し、前記因果関係を示す情報を抽出するためのデータ分析プログラムであって、
コンピュータを、
前記出力属性の値に基づいて、前記基本データ群を、第1データ群と第2データ群とに分類する分類手段、
前記分類手段による分類後の前記基本データ群の中から、分析の対象とする分析データ群を抽出する分析データ群抽出手段、
前記第1データ群と前記第2データ群とが、それぞれまとまるように、前記分析データ群を2分化するための入力属性の条件である入力属性条件を、前記複数の入力属性の各々に対して、それぞれ決定する第1の入力属性条件決定手段、
前記第1の入力属性条件決定手段で決定された前記入力属性条件の中で、前記第2データ群を切出す確度が最も高い前記入力属性条件を、分岐条件として決定する分岐条件決定手段、および
前記分岐条件決定手段で決定された前記分岐条件に基づいて、前記分析データ群を2分化する分割手段として機能させるものであり、
前記分析データ群抽出手段は、前記分割手段で分割されたデータ群のうち、前記第2データ群の比率が小さい方のデータ群のみを新たな分析データ群として抽出し、該分析データ群抽出手段による処理、前記第1の入力属性条件決定手段による処理、前記分岐条件決定手段による処理、および、前記分割手段による処理からなる一連の処理が繰り返し実行されるようになっていることを特徴とするデータ分析プログラム。
In order to analyze a causal relationship between the input attribute and the output attribute and extract information indicating the causal relationship with respect to a basic data group that is a set of data composed of a plurality of input attributes and output attributes Data analysis program
Computer
Classification means for classifying the basic data group into a first data group and a second data group based on the value of the output attribute;
Analysis data group extraction means for extracting an analysis data group to be analyzed from the basic data group after classification by the classification means;
An input attribute condition, which is an input attribute condition for dividing the analysis data group into two parts, is set for each of the plurality of input attributes so that the first data group and the second data group are respectively combined. , First input attribute condition determining means for determining each,
A branch condition determining means for determining, as a branch condition, the input attribute condition having the highest probability of cutting out the second data group among the input attribute conditions determined by the first input attribute condition determining means; Based on the branch condition determined by the branch condition determining means, the analysis data group is made to function as a dividing means for dividing into two parts,
The analysis data group extraction unit extracts only a data group having a smaller ratio of the second data group from the data group divided by the division unit as a new analysis data group, and the analysis data group extraction unit A series of processes consisting of the process according to the above, the process by the first input attribute condition determining means, the process by the branch condition determining means, and the process by the dividing means are repeatedly executed. Data analysis program.
請求項22ないし25のいずれか1項に記載のデータ分析プログラムを記録したコンピュータ読み取り可能な記録媒体。   A computer-readable recording medium on which the data analysis program according to any one of claims 22 to 25 is recorded.
JP2004224858A 2004-07-30 2004-07-30 Data analyzing device and data analyzing program Pending JP2006048183A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004224858A JP2006048183A (en) 2004-07-30 2004-07-30 Data analyzing device and data analyzing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004224858A JP2006048183A (en) 2004-07-30 2004-07-30 Data analyzing device and data analyzing program

Publications (1)

Publication Number Publication Date
JP2006048183A true JP2006048183A (en) 2006-02-16

Family

ID=36026683

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004224858A Pending JP2006048183A (en) 2004-07-30 2004-07-30 Data analyzing device and data analyzing program

Country Status (1)

Country Link
JP (1) JP2006048183A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446194A (en) * 2010-10-14 2012-05-09 金蝶软件(中国)有限公司 Method and device for grouping and checking product data
CN111527486A (en) * 2017-12-28 2020-08-11 东京毅力科创株式会社 Data processing device, data processing method, and program
JP7491821B2 (en) 2020-11-30 2024-05-28 三菱重工業株式会社 Factor estimation method, prediction method, attribute value estimation method, factor estimation device, prediction device, attribute value estimation device, and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0261769A (en) * 1988-08-29 1990-03-01 Fujitsu Ltd Generating device for classification determining tree
JP2001306999A (en) * 2000-02-18 2001-11-02 Fujitsu Ltd Data analyzer and data analysis method
JP2004186374A (en) * 2002-12-03 2004-07-02 Fujitsu Ltd Manufacturing data analyzing method and program for making computer practice the same

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0261769A (en) * 1988-08-29 1990-03-01 Fujitsu Ltd Generating device for classification determining tree
JP2001306999A (en) * 2000-02-18 2001-11-02 Fujitsu Ltd Data analyzer and data analysis method
JP2004186374A (en) * 2002-12-03 2004-07-02 Fujitsu Ltd Manufacturing data analyzing method and program for making computer practice the same

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
マイケルJ.A.ベリー,ゴードン・リノフ, データマイニング手法 営業、マーケティング、カスタマーサポートのための顧客分析, JPN6010000907, September 1999 (1999-09-01), JP, pages 157 - 171, ISSN: 0001511843 *
貝原巳樹雄: "二進木を用いる河川水質デ-タの特徴抽出", 分析化学, vol. 52, no. 5, JPN6010000908, 5 May 2003 (2003-05-05), JP, pages 331 - 336, ISSN: 0001511844 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446194A (en) * 2010-10-14 2012-05-09 金蝶软件(中国)有限公司 Method and device for grouping and checking product data
CN111527486A (en) * 2017-12-28 2020-08-11 东京毅力科创株式会社 Data processing device, data processing method, and program
JP7491821B2 (en) 2020-11-30 2024-05-28 三菱重工業株式会社 Factor estimation method, prediction method, attribute value estimation method, factor estimation device, prediction device, attribute value estimation device, and program

Similar Documents

Publication Publication Date Title
Cabrera et al. FairVis: Visual analytics for discovering intersectional bias in machine learning
CN114444986B (en) Product analysis method, system, device and medium
JP6771751B2 (en) Risk assessment method and system
May et al. Guiding feature subset selection with an interactive visualization
JP6555061B2 (en) Clustering program, clustering method, and information processing apparatus
Vasudevan et al. When does dough become a bagel? analyzing the remaining mistakes on imagenet
KR20140067065A (en) Chart recommendations
JP2005085166A (en) Method and system for generating graphic image, and method, system and program for analyzing data
US20090012830A1 (en) Apparatus, method, and program for extracting work item
Panahy et al. The impact of data quality dimensions on business process improvement
Vermetten et al. Bias: A toolbox for benchmarking structural bias in the continuous domain
JP2012073812A (en) Data analysis support system and method
Collaris et al. Strategyatlas: Strategy analysis for machine learning interpretability
JP2012094016A (en) Production information management apparatus and production information management method
JP2006048183A (en) Data analyzing device and data analyzing program
JP2010026923A (en) Method, device and program for document classification, and computer-readable recording medium
JP4368755B2 (en) Data analysis apparatus, data analysis method, and data analysis program
JP4298531B2 (en) Input attribute condition determination device, input attribute condition determination method, input attribute condition determination program, data analysis device, data analysis method, and data analysis program
JP2005032117A (en) Data analysis device, method and program
JP4351578B2 (en) Production planning support system and computer program
KR100952634B1 (en) Analysis system for information and method thereof
WO2024079827A1 (en) Flow aggregation device, method, and program
EP3912026A1 (en) Process for evaluating software elements within software
Kalra et al. Quantifying Influence: A Bibliometric Analysis of Robo-Advisors in Management
Sand et al. Data analysis and error detection in assembly lines using a three-dimensional visualization technique

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100323

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100831

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110118