JP5085016B2 - データ解析方法およびデータ解析プログラム - Google Patents

データ解析方法およびデータ解析プログラム Download PDF

Info

Publication number
JP5085016B2
JP5085016B2 JP2005161395A JP2005161395A JP5085016B2 JP 5085016 B2 JP5085016 B2 JP 5085016B2 JP 2005161395 A JP2005161395 A JP 2005161395A JP 2005161395 A JP2005161395 A JP 2005161395A JP 5085016 B2 JP5085016 B2 JP 5085016B2
Authority
JP
Japan
Prior art keywords
record group
correlation
divided
execution control
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005161395A
Other languages
English (en)
Other versions
JP2006338265A (ja
Inventor
英隆 津田
英大 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Semiconductor Ltd
Original Assignee
Fujitsu Semiconductor Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Semiconductor Ltd filed Critical Fujitsu Semiconductor Ltd
Priority to JP2005161395A priority Critical patent/JP5085016B2/ja
Priority to US11/236,716 priority patent/US20060276994A1/en
Publication of JP2006338265A publication Critical patent/JP2006338265A/ja
Application granted granted Critical
Publication of JP5085016B2 publication Critical patent/JP5085016B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明はデータ解析方法およびデータ解析プログラムに関し、特にデータ間の相関関係を抽出するデータ解析方法およびデータ解析プログラムに関する。
半導体製品製造分野を始めとして、多くの分野で多種大量のデータが計算機システムに蓄積されている。これらのデータは、ただ蓄積されるだけでは、ビジネスに活用できず、何らの収益をもたらさない。そこで、これらの多種大量のデータに潜む規則性、特徴を効率的に見出し、ビジネスに活用し得るデータ解析技術の一つであるデータマイニングが注目され、産業界でよく活用されている。データマイニングは、金融、流通等の分野では従来からよく活用され、成果を上げてきたが、近年では、半導体製品製造分野を始めとするプロセスデータの解析を必要とする分野でも適用されるようになってきている。
プロセスデータを解析する主な目的の一つは、製品の不良要因を抽出することにあるが、製品の不良要因となるものは多く、かつ、それらは複雑に絡み合っている。通常、プロセスデータの解析は、収集された全プロセスデータについて行われるが、仮に、特定の2変数間に相関関係があったとしても、対象となる変数の値が他の変数の、値の影響を受けて変化しており、一見すると相関関係が弱くなっているように見える場合も多く、このような潜在している相関関係は容易には抽出することができない。
図51は、レコード群の一例を示す表図である。図では或る抵抗体についてのレコード群を示しており、或る抵抗体に印加した電圧の値および流れる電流の値を装置A、Bで測定して得たものである。変数として“装置の値”、“電流値”、“電圧値”を有している。
図52は、図51に示すレコード群中の2変数:電流値、電圧値の相関図である。図52中、◆印は、装置の値がAであるレコード群における2変数:電流値、電圧値の相関を示す。黒色の□印(楕円Eで囲った部分)は、装置の値がBであるレコード群における2変数:電流値、電圧値の相関を示す。直線L52は、装置の値がA、Bである全レコードにおける2変数:電流値(x)、電圧値(y)の単回帰式(単回帰関数)を示している。この例では、単回帰式:y=0.292x+5.1712、寄与率R=0.1496となっている。但し、Rは相関係数である。
図53は、図51に示すレコード群中の装置の値がBであるレコード群のみを示す表図、図54は、図53に示すレコード群中の2変数:電流値、電圧値の相関図である。図54中、直線L54は図53に示すレコード群における2変数:電流値(x)、電圧値(y)の単回帰式を示している。この例では、単回帰式:y=0.7235x+2.4705、寄与率R=0.9278となっている。
図52に示す相関図では、2変数:電流値、電圧値に顕著な相関関係は見られないが、オームの法則によれば、両者の間には、線形の強い相関関係が存在するはずである。しかし、収集、蓄積されたデータは、実際には諸々の異なった環境、条件下で得られたものであるために、2変数:電流値、電圧値の相関関係は、図52に示すようになってしまい、本来存在するはずの相関関係が観測されない。ところが、装置の値がAであるレコード群と装置の値がBであるレコード群とに分けて相関図を見ると、後者については、図54に示すように、2変数:電流値、電圧値に強い相関関係が見られる。
この例のように、レコード群を何らかの特徴(この例では、装置の値)によって幾つかの層(この例では、装置の値がAであるレコード群の層と、装置の値がBであるレコード群の層)に分けることは層別(stratification)といい、よく使われている手法である。
このようなデータ解析の結果から、上記例では、装置Aに関する条件が変動し、本来存在しているはずの相関関係が見られなくなっていると判断し、装置Aが不良であったと結論付けることもできる。なお、単回帰式:y=ax+bの傾きa、切片bの値および寄与率Rは、市販の表計算ソフトを使用することにより得ることができるが、このような値を得るようにする場合には、相関関係を定量的に評価することが可能となる。
ここに、データを構成する各レコードは、一般的には、多くの変数から成り立っているが、変数間の相関関係を効率的に抽出することは、データ解析の効果を上げるための重要な要素であり、前述のようにレコード群を分割すれば、変数間の相関関係を抽出することができる場合がある。
しかし、一般的に何を根拠にしてレコード群を分割すれば効果的に変数間の相関関係を抽出できるかについての技術は確立されていない。限定された場合については、本願発明者による技術が公開されている(例えば、特許文献1参照)。この技術は、データマイニングの一手法である回帰木分析を使い、歩留りに最も効く要因を判別し、その条件を満たすレコードを除くことによりレコード分割を行い、データ中に潜んでいた相関関係を抽出するというものである。この他に、レコード群を分割することにより効率的に相関関係を抽出する明確な手法は見られない。
特開2001−306999号公報
前述のようにレコード群を分割すれば、変数間の相関関係を抽出することができる場合があるが、一般的に何を根拠にしてレコード群を分割すれば効果的に変数間の相関関係を抽出できるかについての技術は確立されていない。また、相関関係は、連続したレコードに現れるとは限らず、不連続に位置しているレコードにも顕著な相関関係がある場合もある。このような状況の下で、レコード群中の変数間の相関関係を効率的に抽出する手法が望まれる。
本発明はこのような点に鑑みてなされたものであり、レコード群中の変数間の相関関係を効率的に抽出することができるデータ解析方法およびデータ解析プログラムを提供することを目的とする。
本発明では上記問題を解決するために、データ間の相関関係を抽出するコンピュータのデータ解析方法が提供される。データ解析方法は、レコード群ソート手段により、記憶装置に記憶された対象レコード群を、指定された変数でソートするレコード群ソート工程と、レコード群分割・抽出手段により、ソートされた前記対象レコード群を、指定された分割方法で分割し、分割レコード群を抽出するレコード群分割・抽出工程と、相関関係算出手段により、指定された変数間の相関関係を前記分割レコード群毎に算出する相関関係算出工程と、データ解析に必要な実行制御データを実行制御データ入力手段を介して入力する実行制御データ入力工程と、を有し、前記分割方法は、前記実行制御データに含まれ、前記対象レコード群の先頭から何件毎に何件ずらして前記分割レコード群を抽出するかを指定するものである。
本発明のデータ解析方法では、対象レコード群を指定された変数でソートし、指定された分割方法で分割レコード群に分割する。そして、指定された変数間の相関関係を分割レコード群毎に算出するようにした。これによって、レコード群中の変数間の相関関係を効率的に抽出することができる。
以下、本発明の原理を図面を参照して詳細に説明する。
図1は、データ解析方法の概要を説明するための図である。図には、コンピュータによって相関関係が抽出される対象レコード群1が示してある。対象レコード群1は、変数xのデータx1,x2,x3…xn、変数yのデータy1,y2,y3…yn、変数zのデータz1,z2,z3…znから構成されている。rec1,rec2,rec3…recnは、変数x,y,zのレコード順を示し、例えば、rec1では、データx1,y1,z1がレコードされたことを示している。対象レコード群2,3は、相関関係が抽出されるまでに対象レコード群1に対して行われる処理結果を示している。コンピュータは、図示していないが、レコード群ソート手段、レコード群分割・抽出手段、および相関関係算出手段を有し、対象レコード群1の相関関係を抽出する。
コンピュータのレコード群ソート手段は、対象レコード群1を、指定された変数x,y,zでソートする。例えば、変数xが指定されたとすると、変数xの大小で、対象レコード群1をソートする。図の例では、x3<x1<x2…の関係があり、これに基づいて、rec1,rec2,rec3…recnをソートしている。
レコード群分割・抽出手段は、ソートされた対象レコード群2を、指定された分割方法で分割し、分割レコード群G1〜Gmを抽出する。例えば、4分割と指定されれば、rec1〜reciを4個に分割する。
相関関係算出手段は、指定された変数間の相関関係を分割レコード群G1〜Gm毎に算出する。例えば、変数x,yが指定されたとすると、分割レコード群G1における変数x,yの相関関係…分割レコード群Gmにおける変数x,yの相関関係を算出する。
このように、対象レコード群1を指定された変数x,y,zでソートし、指定された分割方法で分割レコード群G1〜Gmに分割する。そして、指定された変数間の相関関係を分割レコード群G1〜Gm毎に算出するようにした。これによって、レコード群中の変数間の相関関係を効率的に抽出することができる。
また、対象レコード群1の全レコードについて解析する場合には容易に抽出することができない、レコード群中に潜んでいる変数間の相関関係を容易に抽出することができる。従って、データ解析方法を、例えば、半導体製品製造分野等、プロセスデータの解析を必要とする分野で利用する場合には、製品の不良要因等の抽出を簡便に行うことができるようになり、産業上の優位性を得ることができる。
次に、本発明の実施の形態を図面を参照して詳細に説明する。
図2は、データ解析方法を実施するためのデータ解析装置の概略的構成例を示した図である。図に示すようにデータ解析装置は、CPU(Central Processing Unit)11、入力装置12、主記憶装置13、外部記憶装置14、および表示装置15を有している。
CPU11は、データ解析に必要な各種処理の実行等を行う。入力装置12は、データ解析に必要な実行制御データの入力等を受け付ける。主記憶装置13は、データ解析対象のデータやデータ解析に必要なプログラムを記憶している。外部記憶装置14は、各種のレコード群やデータ解析に必要な各種のプログラムやデータ解析結果の記憶等に使用される。表示装置15は、実行制御データ入力画面やデータ解析結果を表示する。
主記憶装置13に記憶されている実行制御データ入力プログラム13aは、データ解析に必要な実行制御データの入力処理を行う。実行制御データの入力は、表示装置15に表示される実行制御データ入力画面を介して入力装置12から行われる。
データ入力・編集プログラム13bは、データ解析の対象として指定されたデータを外部記憶装置14から読み出して主記憶装置13に書き込む処理(入力処理)を行い、また、入力したデータがレコード群に編集されていないデータについてはレコード群に編集する処理を行う。データ解析の対象とするデータの指定は、実行制御データ入力画面の入力ファイル指定ボックスを介して行われる。
ソートプログラム13cは、データ解析対象のレコード群中の、指定された変数により、レコード群をソートする。変数の指定は、実行制御データ入力画面のソート変数指定ボックスを介して行われる。
変数選択プログラム13dは、データ解析対象のレコード群中の、指定された変数の中から、相関関係を算出する2変数の選択処理を行う。変数の指定は、実行制御データ入力画面の変数指定欄を介して行われる。
レコード群分割・抽出プログラム13eは、データ解析対象のレコード群を、指定された分割方法で分割し、分割レコード群を抽出する処理を行う。データ解析対象の、レコード群の分割方法の指定は、実行制御データ入力画面の分割方法指定欄を介して行われる。
回帰式計算プログラム13fは、選択された2変数間に成立する単回帰式:y=ax+bのa、bを分割レコード群毎に従来周知の手法で計算する。寄与率計算プログラム13gは、寄与率Rを分割レコード群毎に従来周知の手法で計算する。
寄与率判定プログラム13hは、寄与率計算プログラム13gを用いて計算した寄与率Rが、指定された閾値以上であるか否かを判定する。寄与率Rの閾値の指定は、実行制御データ入力画面のR2閾値指定ボックスを介して行われる。
結果出力プログラム13iは、回帰式計算プログラム13fで計算された単回帰式:y=ax+bのa、bおよび寄与率R等を出力させて、表示装置15への表示処理および外部記憶装置14への書き込み処理を行う。
図3は、実行制御データ入力プログラムにより表示装置に表示された実行制御データ入力画面を示した図である。図3に示す入力ファイル指定ボックス21は、データ解析対象とするデータが格納されているファイルを入力ファイルとして指定するボックスである。
出力ファイル指定ボックス22は、データ解析結果の出力先のファイルを出力ファイルとして指定するボックスである。なお、図3では、ファイルは、CSV形式とされているが、XML形式等とすることもできる。
ソート変数指定ボックス23は、指定した入力ファイルに格納されているレコード群中をソートする変数を指定するボックスである。ソートする変数は、次に説明する変数指定欄24の番号で指定する。例えば、「4」、「5」が入力された場合、レコード群は、変数time(時刻)でソートされ、また、Res.(抵抗値)でソートされる。
変数指定欄24は、指定した入力ファイルに格納されているレコード群中の変数の中から、相関関係を算出する変数を指定するための欄である。変数名指定ボックス24a〜24nは、変数名を指定するボックスである。
図の例は、半導体製品製造プロセスデータを解析対象とした場合であり、変数名指定ボックス24aには半導体製品に形成されたトランジスタのチャネル長、変数名指定ボックス24bには同じくトランジスタのVT(閾値電圧)、変数名指定ボックス24cにはAMP(電流値)、変数名指定ボックス24dにはデータがレコードされたときのtime、変数名指定ボックス24eにはトランジスタのRes.、変数名指定ボックス24nには半導体装置のYield(歩留り値)が記述されている。また、変数としてチャネル長、VT、Yieldが指定されている場合を示している。なお、変数名指定ボックスの番号が小さい方の変数が単回帰式:y=ax+bにおけるx、大きい方の変数がyとされる。
従って、この例においては、チャネル長をx、VTをyとする単回帰式:y=ax+bのa、bおよび寄与率Rと、VTをx、Yieldをyとする単回帰式:y=ax+bのa、bおよび寄与率Rと、チャネル長をx、Yieldをyとする単回帰式:y=ax+bのa、bおよび寄与率Rが計算されることになる。なお、n個(但し、nは正の整数)の変数を指定した場合には、個の組み合わせについて、単回帰式:y=ax+bのa、bおよび寄与率Rが計算されることになる。
分割方法指定欄25は、データ解析対象のレコード群の分割方法を指定するための欄である。分割方法指定欄25のチェックボタン26,27は、分割レコード群に重複のない分割(自動分割という)を行う場合にはチェックボタン26を選択し、自動分割を行わない場合(分割レコード群に重複のある分割を行う場合)にはチェックボタン27を選択する。
分割数記述ボックス28は、チェックボタン26を選択した場合に、分割数を記述することにより、データ解析対象のレコード群の分割数を指定するためのものである。分割数記述ボックス28には、2nの値を記述することができ、2nの値を記述した場合には、2n個の分割レコード群毎に、単回帰式:y=ax+bのa、bおよび寄与率Rが算出されることになる。なお、この場合、さらに、1分割のレコード群についても、単回帰式:y=ax+bのa、bおよび寄与率Rが算出されるようにしても良い。
ボックス29,30は、チェックボタン27を選択した場合に使用されるボックスであり、データ解析対象のレコード群を、先頭から何件毎に何件ずらすかを指定することにより、分割方法を指定するためのボックスである。ボックス29は、何件毎にずらすかを指定するボックスであり、ボックス30は、何件ずらすかを指定するボックスである。
閾値指定ボックス31は、相関関係の情報(単回帰式:y=ax+bのa、bおよび寄与率R)を出力するか否かの閾値となる寄与率Rを指定するためのボックスである。実行ボタン32は、実行制御データ入力画面に記述された実行制御データを入力してデータ解析の実行を開始させるためのボタンである。
図4は、データ解析装置で行われるデータ解析処理手順を示したフローチャートである。図2で示したデータ解析装置は、まず、図3に示した実行制御データ入力画面に実行制御データが記述された後、実行ボタン32を介してデータ解析の実行開始が命令されると、実行制御データ入力画面に記述された実行制御データの入力処理を行う(ステップS1)。この処理は、CPU11が実行制御データ入力プログラム13aを実行することによって実現される。
データ解析装置は、実行制御データの入力処理が終了すると、図3に示した実行制御データ入力画面の入力ファイル指定ボックス21に記述されていた入力ファイルからのデータの入力処理を行い、また、入力したデータがレコード群に編集されていないデータについてはレコード群に編集する処理を行う(ステップS2)。この処理は、CPU11がデータ入力・編集プログラム13bを実行することによって実現される。
データ解析装置は、図3に示したソート変数指定ボックス23で指定された変数で、レコード群をソートする処理を行う(ステップS3)。ソートする変数が複数指定されている場合は、それぞれの変数において、レコード群をソートする。この処理は、CPU11がソートプログラム13cを実行することによって実現される。
データ解析装置は、図3に示した実行制御データ入力画面の変数名指定ボックス24a〜24nで指定されている変数の中から一組を選択する変数選択処理を行う(ステップS4)。この処理は、CPU11が変数選択プログラム13dを実行することによって実現される。
データ解析装置は、図3で示した実行制御データ入力画面の分割方法指定欄25で指定されていた分割方法で主記憶装置13に記憶されているデータ解析対象のレコード群を分割し、一群の分割レコード群を抽出するレコード群分割・抽出処理を行う(ステップS5)。この処理は、CPU11がレコード群分割・抽出プログラム13eを実行することによって実現される。
データ解析装置は、抽出された一群の分割レコード群について、単回帰式:y=ax+bのa、bの計算(回帰式計算処理)を行う(ステップS6)。この処理は、CPU11が回帰式計算プログラム13fを実行することによって実現される。
データ解析装置は、抽出された一群の分割レコード群について、寄与率Rの計算(寄与率計算処理)を行う(ステップS7)。この処理は、CPU11が寄与率計算プログラム13gを実行することによって実現される。なお、回帰式計算処理と寄与率計算処理とで相関関係処理が構成されている。
データ解析装置は、図3に示した実行制御データ入力画面の閾値指定ボックス31に記述された寄与率Rの閾値と、寄与率計算結果の寄与率Rとを比較し、寄与率計算結果の寄与率Rが閾値以上であるか否かを判定する寄与率判定処理を行う(ステップS8)。この処理は、CPU11が寄与率判定プログラム13hを実行することにより実現される。
データ解析装置は、抽出されるべき全分割レコード群についてステップS6〜S8の処理が終了したか否かを判断する(ステップS9)。抽出されるべき全分割レコード群についてステップS6〜S8の処理が終了していない場合には、ステップS5に戻る。
データ解析装置は、抽出されるべき全分割レコード群についてステップS6〜S8の処理が終了した場合には、指定された変数の全ての組み合わせについて、ステップS4〜S8の処理が終了したか否かを判断する(ステップS10)。指定された変数の全ての組み合わせについてステップS4〜S8の処理が終了していない場合には、ステップS4に戻る。
データ解析装置は、指定された全ソート変数についてステップS4〜S8の処理が終了したか否かを判断する(ステップS11)。指定されたソート変数の全てについてステップS4〜S8の処理が終了していない場合には、ステップS4に戻る。
データ解析装置は、指定された全ソート変数の全ての組み合わせについてステップS4〜S8の処理が終了した場合には、寄与率計算結果の寄与率Rが閾値以上である変数間についてのみデータ解析結果を出力する結果出力処理を行う(ステップS12)。この処理は、CPU11が結果出力プログラム13iを実行することにより実現される。
次に、変数のソートとレコード群の分割の仕方によって、データにどのような相関が現れるかについて具体的なデータ例を用いて説明する。なお、ソートする変数は、図3に示した実行制御データ入力画面のソート変数指定ボックス23で指定することができる。例えば、ソート変数指定ボックス23で4,5(timeとRes.)を指定すれば、レコード群をtimeでソートしたときのデータ解析結果と、Res.でソートしたときのデータ解析結果とを得ることができる。
図5は、データ解析対象のレコード群を示した表図である。図に示すレコード群は、例えば、半導体製造プロセスデータの一例であり、20個のレコード群rec1〜rec20から構成されている。レコード群は、トランジスタのパラメータであるチャネル長、しきい値電圧(VT)、歩留まり(Yield)、および抵抗値(Res.)の変数を有している。また、データがレコードされた時刻(time、図では日付のみとなっている)の変数を有している。
図6は、図5のレコード群を時刻でソートしたときのレコード群を示した表図である。図5の表図をtimeでソートすると、レコード群は図に示すように並べ替えられる。なお、図6では、Res.とtimeの変数を省略している。
図7は、図6に示すレコード群におけるチャネル長のトレンドを示した図、図8は、図6に示すレコード群におけるしきい値電圧のトレンドを示した図、図9は、図6に示すレコード群における歩留まりのトレンドを示した図である。図7〜図9に示すように、図6のレコード群から、どの変数間にどのような相関関係があるかを判別することは容易でない。
図10は、図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その1である。図には、図6のソートされたレコードの1番目から5番目まで(rec2,3,4,5,7)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L10を示している。図10の例の場合、寄与率Rは、0.0069である。図11は、図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その1である。図には、図6のソートされたレコードの1番目から5番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L11を示している。図11の例の場合、寄与率Rは、0.0227である。
図12は、図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その2である。図には、図6のソートされたレコードの6番目から10番目まで(rec8,9,10,11,12)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L12を示している。図12の例の場合、寄与率Rは、0.3306である。図13は、図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その2である。図には、図6のソートされたレコードの6番目から10番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L13を示している。図13の例の場合、寄与率Rは、0.0212である。
図14は、図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その3である。図には、図6のソートされたレコードの11番目から15番目まで(rec14,15,16,20,1)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L14を示している。図14の例の場合、寄与率Rは、0.9622である。図15は、図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その3である。図には、図6のソートされたレコードの11番目から15番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L15を示している。図15の例の場合、寄与率Rは、0.3627である。
図16は、図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その4である。図には、図6のソートされたレコードの16番目から20番目まで(rec6,13,17,18,19)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L16を示している。図16の例の場合、寄与率Rは、0.2708である。図17は、図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その4である。図には、図6のソートされたレコードの16番目から20番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L17を示している。図17の例の場合、寄与率Rは、0.9687である。
ここで、図10〜図17を見ると、11番目から15番目までのレコードにおけるチャネルと歩留まりとの間に強い相関関係があることがわかる(図14)。また、16番目から20番目までのレコードにおけるしきい値と歩留まりとの間に強い相関関係があることがわかる(図17)。このように、図5に示すような全データによる解析では、弱い相関関係しか存在しなかったデータの中にも、変数timeによってレコード群をソートし、分割することによって、図14,17に示すような相関関係が潜んでいたことが明らかになる。
次に、分割の仕方を変えたとき、データにどのように相関が現れるかについて具体的なデータ例を用いて説明する。
図18は、図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その5である。図には、図6のソートされたレコードの1番目から10番目まで(rec2,3,4,5,7,8,9,10,11,12)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L18を示している。図18の例の場合、寄与率Rは、6E−05である。図19は、図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その5である。図には、図6のソートされたレコードの1番目から10番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L19を示している。図19の例の場合、寄与率Rは、0.0092である。
図20は、図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その6である。図には、図6のソートされたレコードの6番目から15番目まで(rec8,9,10,11,12,14,15,16,20,1)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L20を示している。図20の例の場合、寄与率Rは、0.952である。図21は、図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その6である。図には、図6のソートされたレコードの6番目から15番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L21を示している。図21の例の場合、寄与率Rは、0.262である。
図22は、図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その7である。図には、図6のソートされたレコードの11番目から20番目まで(rec14,15,16,20,1,6,13,17,18,19)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L22を示している。図22の例の場合、寄与率Rは、0.5013である。図23は、図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その7である。図には、図6のソートされたレコードの11番目から20番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L23を示している。図23の例の場合、寄与率Rは、0.1025である。
ここで、図18〜図23を見ると、6番目から15番目までのレコードにおけるチャネルと歩留まりとの間に強い相関関係があることがわかる(図20)。また、しきい値と歩留まりとの間には強い相関関係があるとは認められないことがわかる。このように、図5に示すような全データによる解析では、弱い相関関係しか存在しなかったデータの中にも、変数によってレコード群をソートし、分割することによって、図20に示すような相関関係が潜んでいたことが明らかになる。
次に、図5のレコード群を抵抗値でソートして分割した場合に、データにどのような相関が現れるかについて具体的なデータ例を用いて説明する。
図24は、図5のレコード群を抵抗値でソートしたときのレコード群を示した表図である。図5の表図をRes.でソートすると、レコード群は図に示すように並べ替えられる。なお、図24では、Res.とtimeの変数を省略している。
図25は、図24に示すレコード群におけるチャネル長のトレンドを示した図、図26は、図24に示すレコード群におけるしきい値電圧のトレンドを示した図、図27は、図24に示すレコード群における歩留まりのトレンドを示した図である。図25〜図27に示すように、図24のレコード群から、どの変数間にどのような相関関係があるかを判別することは容易でない。
図28は、図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その1である。図には、図24のソートされたレコードの1番目から5番目まで(rec14,17,7,2,13)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L28を示している。図28の例の場合、寄与率Rは、1E−06である。図29は、図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その1である。図には、図24のソートされたレコードの1番目から5番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L29を示している。図29の例の場合、寄与率Rは、0.1475である。
図30は、図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その2である。図には、図24のソートされたレコードの6番目から10番目まで(rec4,3,12,18,5)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L30を示している。図30の例の場合、寄与率Rは、0.2345である。図31は、図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その2である。図には、図24のソートされたレコードの6番目から10番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L31を示している。図31の例の場合、寄与率Rは、0.1293である。
図32は、図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その3である。図には、図24のソートされたレコードの11番目から15番目まで(rec16,15,1,9,6)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L32を示している。図32の例の場合、寄与率Rは、0.2931である。図33は、図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その3である。図には、図24のソートされたレコードの11番目から15番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L33を示している。図33の例の場合、寄与率Rは、0.9939である。
図34は、図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その4である。図には、図24のソートされたレコードの16番目から20番目まで(rec20,11,8,10,19)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L34を示している。図34の例の場合、寄与率Rは、0.9788である。図35は、図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その4である。図には、図24のソートされたレコードの16番目から20番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L35を示している。図35の例の場合、寄与率Rは、0.6049である。
ここで、図28〜図35を見ると、16番目から20番目までのレコードにおけるチャネルと歩留まりとの間に強い相関関係があることがわかる(図34)。また、11番目から15番目までのレコードにおけるしきい値と歩留まりとの間に強い相関関係があることがわかる(図33)。このように、図5に示すような全データによる解析では、弱い相関関係しか存在しなかったデータの中にも、変数Res.によってレコード群をソートし、分割することによって、図34,33に示すような相関関係が潜んでいたことが明らかになる。
次に、図24のRes.でソートしたレコード群の分割の仕方を変えたとき、データにどのように相関が現れるかについて具体的なデータ例を用いて説明する。
図36は、図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その5である。図には、図24のソートされたレコードの1番目から10番目まで(rec14,17,7,2,13,4,3,12,18,5)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L36を示している。図36の例の場合、寄与率Rは、0.0951である。図37は、図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その5である。図には、図24のソートされたレコードの1番目から10番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L37を示している。図37の例の場合、寄与率Rは、0.0152である。
図38は、図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その6である。図には、図24のソートされたレコードの6番目から15番目まで(rec4,3,12,18,5,16,15,1,9,6)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L38を示している。図38の例の場合、寄与率Rは、0.3219である。図39は、図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その6である。図には、図24のソートされたレコードの6番目から15番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L39を示している。図39の例の場合、寄与率Rは、0.1053である。
図40は、図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その7である。図には、図24のソートされたレコードの11番目から20番目まで(rec16,15,1,9,6,20,11,8,10,19)のチャネル長と歩留まり値との相関関係を示している。また、図には、単回帰式L40を示している。図40の例の場合、寄与率Rは、0.4821である。図41は、図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その7である。図には、図24のソートされたレコードの11番目から20番目までのしきい値と歩留まり値との相関関係を示している。また、図には、単回帰式L41を示している。図41の例の場合、寄与率Rは、0.4942である。
ここで、図36〜図41を見ると、レコード群のチャネルと歩留まりとの間およびしきい値と歩留まりとの間には、強い相関関係があるとは認められないことがわかる。
次に、レコード群の分割例について説明する。
図42は、自動分割を選択した場合のレコード群の分割方法を示した図である。なお、図42では、図6のレコード群を4分割指定した場合(図3の実行制御データ入力画面の分割数記述ボックス28に4を入力した場合)について示している。この場合には、レコード群rec2〜rec19は、レコード群rec2〜rec7からなる分割レコード群GA1と、レコード群rec8〜rec12からなる分割レコード群GA2と、レコード群rec14〜rec1からなる分割レコード群GA3と、レコード群rec6〜rec19からなる分割レコード群GA4とに分割される。
なお、分割数記述ボックス28に入力された値まで、2ずつ分割するようにしてもよい。例えば、分割数記述ボックス28に16(2)が入力されたとする。この場合、1分割(2)、2分割(2)、4分割(2)、8分割(2)、16分割(2)に分割し、分割レコード群を抽出するようにしてもよい。この機能は、図2で説明したレコード群分割・抽出プログラム13eが有するようにする。
図43は、レコード群を1分割、2分割、…2分割する分割方法を示した図である。図では、分割数記述ボックス28に4を入力した場合の分割方法を示している。この場合には、レコード群rec2〜rec19からなる分割レコード群GB1と、レコード群rec2〜rec12からなる分割レコード群GB2と、レコード群rec14〜rec19からなる分割レコード群GB3と、レコード群rec2〜rec7からなる分割レコード群GB4と、レコード群rec8〜rec12からなる分割レコード群GB5と、レコード群rec14〜rec1からなる分割レコード群GB6と、レコード群rec6〜rec19からなる分割レコード群GB7とに分割される。
図44は、図43の分割方法で分割したときの解析結果を示した図である。この解析結果は、ソート変数としてtimeとRes.を指定し、自動分割を選択し、4分割を指定し、変数として、チャネル長、しきい値電圧、歩留まりを指定した場合に出力される解析結果を示している。なお、解析結果は、ソート変数のtimeとRes.の両方に対応したものが出力されるが、図44では、ソート変数がtimeのみの結果を示している(Res.でソートした解析結果は図45で示す)。
この例では、相関関係の定量的評価値である寄与率R、単回帰式:y=ax+bのa、b、比較項目(変数)1,2、分割レコード群の開始位置(開始レコードの番号)と終了位置(終了レコードの番号)、分割個数、分割番号が出力されている。
図45は、Res.でソートしたレコード群を図43の分割方法で分割したときの解析結果を示した図である。Res.でソートされたレコード群(図24)も、図43で示したのと同様に分割され、図45に示す解析結果が得られる。このように、レコード群を変数でソートして分割することにより、変数間の相関関係を効率的に抽出することができる。
次に、自動分割を選択しない場合、すなわち、図3の実行制御データ入力画面のチェックボタン27を選択した場合について説明する。
図46は、自動分割を選択しない場合の分割方法を示した図である。図46は、図3の実行制御データ入力画面で、チェックボタン27を選択し、10件ごとに5件ずらすことを指定した場合(ボックス29に10を入力し、ボックス30に5を入力した場合)の分割方法を示している。この場合には、レコード群rec2〜rec19は、レコード群rec2〜rec12からなる分割レコード群GC1と、レコード群rec8〜rec1からなる分割レコード群GC2と、レコード群rec14〜rec19からなる分割レコード群GC3とに分割される。
図47は、図46の分割方法で分割したときの解析結果を示した図である。この解析結果は、ソート変数としてtimeとRes.を指定し、10件ごとに5件ずらすことを指定し、変数として、チャネル長、しきい値電圧、歩留まりを指定した場合に出力される解析結果を示している。なお、解析結果は、ソート変数のtimeとRes.の両方が出力されるが、図47では、ソート変数がtimeのみの結果を示している(Res.でソートした解析結果は図48で示す)。
この例では、相関関係の定量的評価値である寄与率R、単回帰式:y=ax+bのa、b、比較項目(変数)1,2、分割レコード群の開始位置(開始レコードの番号)と終了位置(終了レコードの番号)が出力されている。
図48は、Res.でソートしたレコード群を図46の分割方法で分割したときの解析結果を示した図である。Res.でソートされたレコード群(図24)も、図46で示したのと同様に分割され、図48に示す解析結果が得られる。このように、分割方法を変えることによって、変数間の相関関係を効率的に抽出することができる。
次に、レコード群をソートしなかった場合の解析結果について説明する。
図49は、レコード群をソートせずに解析した結果を示した図その1である。図では、図5のレコード群をソートせずに、図43で説明したように分割した場合の解析結果を示している。
図50は、レコード群をソートせずに解析した結果を示した図その2である。図では、図5のレコード群をソートせずに、図46で説明したように分割した場合の解析結果を示している。
図49,50によると、チャネル長と歩留まりの間にはレコード群rec11〜rec20にわたり寄与率Rが0.99超の強い相関関係がある。しきい値と歩留まり間に関しては寄与率Rが最大で0.56程度のものしかなく、さほど顕著な相関関係は抽出されない。
一方、図5のレコード群をtimeでソートして解析すると、図44,47に示した解析結果を得る。ここで最も相関関係が強いとされたのは、図49,50で相関関係はさほどないとされたしきい値と歩留まり間の相関関係で、レコード群rec6,13,17,18,19については、寄与率Rが0.96超である。このような例が生じる原因としては、同一時刻近辺では同一条件であったので強い相関関係が見られたが、収集されたレコードが必ずしも発生時刻順に格納されているわけではないため、データ中に潜む顕著な相関関係が抽出されなかったことが考えられる。なお、図49,50で顕著であったチャネル長と歩留まりとの間にも顕著な相関関係が見られる。
また、図5のレコード群をRes.でソートして解析すると、図45,48に示した解析結果を得る。ここで最も相関関係が強いとされたのは、図49,50で相関関係はさほどないとされたしきい値と歩留まり間の相関関係で、レコード群rec16,15,1,9,6については、寄与率Rが0.99超である。また、チャネル長については、レコード群rec20,11,8,10,19については、寄与率Rが0.97超である。このような例が生じる原因としては、相関関係を求めるいずれかの変数、または、両変数が他の変数の影響を受け不安定となり、相関関係が抽出されなかったことが考えられる。また、両変数間の関連性に差が生じている場合、全レコードにおいて相関関係を求めればノイズを多く含むものとなってしまうことが考えられる。なお、チャネル長と歩留まり間にも顕著な相関関係が検出されている。
このようにレコード群をソートし、分割の仕方によって新たに顕著な相関関係が抽出される要因に次の2つが考えられる。1つ目は、ソートの結果、異常値や外れ値を含むレコードが先頭や最終近くのレコード群にまとまり、異常値や外れ値が存在しないレコード群ができる。2つ目は、ある変数でレコード群をソートすることにより、同一条件であるレコードが同一の分割領域に属する場合が増え、本来存在する顕著な相関関係を抽出できる場合が増える。
データ解析装置の適用分野は、製造装置ログを含む製造プロセスデータの解析である。この分野のデータは、多種大量なものにわたり、多くのシステム、期間にわたり収集され解析対象となる。従って、データは多岐にわたり不連続的に存在し、ファイル中に存在する順だけでレコード群を構成して相関関係を確認しても抽出できる相関関係はわずかなものでしかない。しかし、変数によってレコード群をソートし、分割することによって、データ中に潜む多くの相関関係の抽出が可能となる。
(付記1) データ間の相関関係を抽出するデータ解析方法において、
レコード群ソート手段により、対象レコード群を、指定された変数でソートするレコード群ソート工程と、
レコード群分割・抽出手段により、ソートされた前記対象レコード群を、指定された分割方法で分割し、分割レコード群を抽出するレコード群分割・抽出工程と、
相関関係算出手段により、指定された変数間の相関関係を前記分割レコード群毎に算出する相関関係算出工程と、
を有することを特徴とするデータ解析方法。
(付記2) データ解析に必要な実行制御データを実行制御データ入力手段を介して入力する実行制御データ入力工程を有することを特徴とする付記1記載のデータ解析方法。
(付記3) 前記対象レコード群を含むデータが前記実行制御データの一つとして指定され、データ入力手段により、指定された前記対象レコード群を含むデータを所定の記憶手段から入力するデータ入力工程を含むことを特徴とする付記2記載のデータ解析方法。
(付記4) 前記変数は、前記実行制御データに含まれることを特徴とする付記2記載のデータ解析方法。
(付記5) 前記分割方法は、前記実行制御データに含まれることを特徴とする付記2記載のデータ解析方法。
(付記6) 前記分割方法は、前記対象レコード群の分割数を指定するものであることを特徴とする付記5記載のデータ解析方法。
(付記7) 前記分割方法は、前記対象レコード群の先頭から何件毎に何件ずらして分割レコード群を抽出するかを指定するものであることを特徴とする付記5記載のデータ解析方法。
(付記8) 前記分割方法は、前記対象レコード群の最大分割数を2n(但し、nは正の整数)で指定するものであり、前記レコード群分割・抽出手段は、前記対象レコード群を1分割、2分割、…、2n分割して分割レコード群を抽出することを特徴とする付記5記載のデータ解析方法。
(付記9) 前記相関関係算出工程は、回帰式計算手段により、前記分割レコード群毎に回帰式を計算する回帰式計算工程と、寄与率計算手段により、前記分割レコード群毎に寄与率を計算する寄与率計算工程を含むことを特徴とする付記1記載のデータ解析方法。
(付記10) 実行制御データ入力工程では、寄与率の閾値を指定することができ、寄与率が指定された閾値以上の値を取る変数間の相関関係のみを出力する結果出力工程を有することを特徴とする付記9記載のデータ解析方法。
(付記11) データ間の相関関係を抽出するデータ解析プログラムにおいて、
コンピュータに、
対象レコード群を、指定された変数でソートするレコード群ソート工程と、
ソートされた前記対象レコード群を、指定された分割方法で分割し、分割レコード群を抽出するレコード群分割・抽出工程と、
指定された変数間の相関関係を前記分割レコード群毎に算出する相関関係算出工程と、
を実行させることを特徴とするデータ解析プログラム。
データ解析方法の概要を説明するための図である。 データ解析方法を実施するためのデータ解析装置の概略的構成例を示した図である。 実行制御データ入力プログラムにより表示装置に表示された実行制御データ入力画面を示した図である。 データ解析装置で行われるデータ解析処理手順を示したフローチャートである。 データ解析対象のレコード群を示した表図である。 図5のレコード群を時刻でソートしたときのレコード群を示した表図である。 図6に示すレコード群におけるチャネル長のトレンドを示した図である。 図6に示すレコード群におけるしきい値電圧のトレンドを示した図である。 図6に示すレコード群における歩留まりのトレンドを示した図である。 図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その1である。 図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その1である。 図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その2である。 図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その2である。 図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その3である。 図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その3である。 図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その4である。 図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その4である。 図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その5である。 図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その5である。 図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その6である。 図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その6である。 図6のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その7である。 図6のレコード群におけるしきい値と歩留まり値との相関関係を示した図その7である。 図5のレコード群を抵抗値でソートしたときのレコード群を示した表図である。 図24に示すレコード群におけるチャネル長のトレンドを示した図である。 図24に示すレコード群におけるしきい値電圧のトレンドを示した図である。 図24に示すレコード群における歩留まりのトレンドを示した図である。 図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その1である。 図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その1である。 図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その2である。 図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その2である。 図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その3である。 図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その3である。 図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その4である。 図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その4である。 図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その5である。 図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その5である。 図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その6である。 図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その6である。 図24のレコード群におけるチャネル長と歩留まり値との相関関係を示した図その7である。 図24のレコード群におけるしきい値と歩留まり値との相関関係を示した図その7である。 自動分割を選択した場合のレコード群の分割方法を示した図である。 レコード群を1分割、2分割、…2分割する分割方法を示した図である。 図43の分割方法で分割したときの解析結果を示した図である。 Res.でソートしたレコード群を図43の分割方法で分割したときの解析結果を示した図である。 自動分割を選択しない場合の分割方法を示した図である。 図46の分割方法で分割したときの解析結果を示した図である。 Res.でソートしたレコード群を図46の分割方法で分割したときの解析結果を示した図である。 レコード群をソートせずに解析した結果を示した図その1である。 レコード群をソートせずに解析した結果を示した図その2である。 レコード群の一例を示す表図である。 図51に示すレコード群中の2変数:電流値、電圧値の相関図である。 図51に示すレコード群中の装置の値がBであるレコード群のみを示す表図である。 図53に示すレコード群中の2変数:電流値、電圧値の相関図である。
符号の説明
1〜3 対象レコード群
G1〜Gm 分割レコード群

Claims (4)

  1. データ間の相関関係を抽出するコンピュータのデータ解析方法において、
    レコード群ソート手段により、記憶装置に記憶された対象レコード群を、指定された変数でソートするレコード群ソート工程と、
    レコード群分割・抽出手段により、ソートされた前記対象レコード群を、指定された分割方法で分割し、分割レコード群を抽出するレコード群分割・抽出工程と、
    相関関係算出手段により、指定された変数間の相関関係を前記分割レコード群毎に算出する相関関係算出工程と、
    データ解析に必要な実行制御データを実行制御データ入力手段を介して入力する実行制御データ入力工程と、を有し、
    前記分割方法は、前記実行制御データに含まれ、前記対象レコード群の先頭から何件毎に何件ずらして前記分割レコード群を抽出するかを指定するものであることを特徴とするデータ解析方法。
  2. データ間の相関関係を抽出するデータ解析プログラムにおいて、
    コンピュータに、
    対象レコード群を、指定された変数でソートするレコード群ソート工程と、
    ソートされた前記対象レコード群を、指定された分割方法で分割し、分割レコード群を抽出するレコード群分割・抽出工程と、
    指定された変数間の相関関係を前記分割レコード群毎に算出する相関関係算出工程と、
    データ解析に必要な実行制御データを入力する実行制御データ入力工程と、を実行させ、
    前記分割方法は、前記実行制御データに含まれ、前記対象レコード群の先頭から何件毎に何件ずらして前記分割レコード群を抽出するかを指定するものであることを特徴とするデータ解析プログラム。
  3. データ間の相関関係を抽出するデータ解析プログラムにおいて、
    コンピュータに、
    対象レコード群を、指定された変数でソートするレコード群ソート工程と、
    ソートされた前記対象レコード群を、指定された分割方法で分割し、分割レコード群を抽出するレコード群分割・抽出工程と、
    指定された変数間の相関関係を前記分割レコード群毎に算出する相関関係算出工程と、
    データ解析に必要な実行制御データを入力する実行制御データ入力工程と、を実行させ、
    前記分割方法は、前記実行制御データに含まれ、前記対象レコード群の分割数の指定、前記対象レコード群の先頭から何件毎に何件ずらして前記分割レコード群を抽出するかの指定、および前記対象レコード群を1分割、2分割、…、2 n 分割に分割するように最大分割数の2 n の指定のいずれかが含まれることを特徴とするデータ解析プログラム。
  4. データ間の相関関係を抽出するコンピュータのデータ解析方法において、
    レコード群ソート手段により、対象レコード群を、指定された変数でソートするレコード群ソート工程と、
    レコード群分割・抽出手段により、ソートされた前記対象レコード群を、指定された分割方法で分割し、分割レコード群を抽出するレコード群分割・抽出工程と、
    相関関係算出手段により、指定された変数間の相関関係を前記分割レコード群毎に算出する相関関係算出工程と、
    データ解析に必要な実行制御データを実行制御データ入力手段を介して入力する実行制御データ入力工程と、を有し、
    前記分割方法は、前記実行制御データに含まれ、前記対象レコード群の分割数の指定、前記対象レコード群の先頭から何件毎に何件ずらして前記分割レコード群を抽出するかの指定、および前記対象レコード群を1分割、2分割、…、2 n 分割に分割するように最大分割数の2 n の指定のいずれかが含まれることを特徴とするデータ解析方法。
JP2005161395A 2005-06-01 2005-06-01 データ解析方法およびデータ解析プログラム Expired - Fee Related JP5085016B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005161395A JP5085016B2 (ja) 2005-06-01 2005-06-01 データ解析方法およびデータ解析プログラム
US11/236,716 US20060276994A1 (en) 2005-06-01 2005-09-28 Data analysis method and recording medium recording data analysis program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005161395A JP5085016B2 (ja) 2005-06-01 2005-06-01 データ解析方法およびデータ解析プログラム

Publications (2)

Publication Number Publication Date
JP2006338265A JP2006338265A (ja) 2006-12-14
JP5085016B2 true JP5085016B2 (ja) 2012-11-28

Family

ID=37495218

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005161395A Expired - Fee Related JP5085016B2 (ja) 2005-06-01 2005-06-01 データ解析方法およびデータ解析プログラム

Country Status (2)

Country Link
US (1) US20060276994A1 (ja)
JP (1) JP5085016B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10592584B2 (en) 2016-03-17 2020-03-17 Kabushiki Kaisha Toshiba Information processing apparatus, information processing method, and program

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5603827B2 (ja) * 2010-05-18 2014-10-08 トヨタテクニカルディベロップメント株式会社 制御因子特定用回帰式の生成方法
JP2015022613A (ja) * 2013-07-22 2015-02-02 富士通株式会社 相関抽出方法、相関抽出装置、及び、プログラム
JP6633403B2 (ja) * 2016-02-01 2020-01-22 株式会社神戸製鋼所 解析対象決定装置及び解析対象決定方法
JP6942617B2 (ja) 2017-11-30 2021-09-29 株式会社日立製作所 データ分析システムおよびデータ分析装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05204991A (ja) * 1992-01-30 1993-08-13 Hitachi Ltd 時系列データ検索方法およびこれを用いた検索システム
JPH08161287A (ja) * 1994-12-09 1996-06-21 Hitachi Ltd データ分析支援システム
IL117457A (en) * 1995-03-13 1999-09-22 Knights Technology Inc Information automation using graphics macros and multimedia macros
JP3739201B2 (ja) * 1998-03-06 2006-01-25 富士通株式会社 半導体チップの相関解析方法及び装置、半導体チップ歩留まり調整方法並びに記憶媒体
US7346675B2 (en) * 1999-11-18 2008-03-18 Amdocs (Israel) Ltd. System, method and computer program product for contract-based aggregation
JP3847568B2 (ja) * 2001-03-01 2006-11-22 ファブソリューション株式会社 半導体装置製造方法
US6711522B2 (en) * 2001-04-25 2004-03-23 Fujitsu Limited Data analysis apparatus, data analysis method, and computer products
US6537834B2 (en) * 2001-07-24 2003-03-25 Promos Technologies, Inc. Method and apparatus for determining and assessing chamber inconsistency in a tool
JP2005038098A (ja) * 2003-07-17 2005-02-10 Chugoku Electric Power Co Inc:The データマイニングを用いた機器、施設の運転状況又は取引の監視及び実行方法
US7221987B2 (en) * 2004-06-15 2007-05-22 Kimberly-Clark Worldwide, Inc. Generating a reliability analysis by identifying casual relationships between events in an event-based manufacturing system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10592584B2 (en) 2016-03-17 2020-03-17 Kabushiki Kaisha Toshiba Information processing apparatus, information processing method, and program

Also Published As

Publication number Publication date
US20060276994A1 (en) 2006-12-07
JP2006338265A (ja) 2006-12-14

Similar Documents

Publication Publication Date Title
JP5085016B2 (ja) データ解析方法およびデータ解析プログラム
KR101643438B1 (ko) 요약 테이블을 디스플레이하는 컴퓨터 구현방법 및 시스템과 컴퓨터 판독가능매체
US5530942A (en) Graphic and text interactive user interface for a program execution analyzer
JP4368905B2 (ja) グラフ描画装置および方法、その方法を実行する歩留り解析方法および歩留り向上支援システム、プログラム、並びにコンピュータ読み取り可能な記録媒体
US8555258B2 (en) Software performance analysis using data mining
DE4118454C2 (de) System zum automatischen Testen von Anwendersoftware
US7714864B2 (en) Visual resource profiler for graphical applications
CN110532427A (zh) 一种基于表格型数据的可视化视频生成方法及系统
CN108121802A (zh) 网页访问的热力分析方法、装置及其设备
JP2008250637A (ja) 情報処理装置
JP3181994B2 (ja) ジョブフロー仕様書自動作成方法
US10496251B2 (en) Screen creation apparatus having application screen creation support function
DE112018002626T5 (de) Verfahren und Systeme zur optimierten visuellen Zusammenfassung von Sequenzen mit zeitbezogenen Ereignisdaten
CN110688433B (zh) 一种基于路径的特征生成方法及装置
JP2010020577A (ja) 業務フロー分析プログラム、方法及び装置
US7765220B2 (en) Data relevance filtering
JP7433096B2 (ja) 業務可視化装置、業務可視化方法、及びプログラム
US10324589B2 (en) Navigation by usage locations in a document editing application
CN109062946A (zh) 一种基于多网页的突出显示方法及装置
Csendes et al. The impact of accelerating tools on the interval subdivision algorithm for global optimization
US6515665B1 (en) Data filtering/suppression of data acquisitions/samples for multi-channel electronic display and analysis
JP2006155344A (ja) データ分析装置、データ分析プログラム及びデータ分析方法
JP4797353B2 (ja) データ解析方法及びデータ解析プログラム
Escalona et al. Two graphical models for the analysis and comparison of cartularies
Zellag et al. Consad: a real-time consistency anomalies detector

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080526

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20080729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110418

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120815

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120905

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150914

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees