JP2014235481A - 影響因子抽出方法およびプログラム - Google Patents

影響因子抽出方法およびプログラム Download PDF

Info

Publication number
JP2014235481A
JP2014235481A JP2013115106A JP2013115106A JP2014235481A JP 2014235481 A JP2014235481 A JP 2014235481A JP 2013115106 A JP2013115106 A JP 2013115106A JP 2013115106 A JP2013115106 A JP 2013115106A JP 2014235481 A JP2014235481 A JP 2014235481A
Authority
JP
Japan
Prior art keywords
variable
explanatory
variables
objective
explanatory variables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013115106A
Other languages
English (en)
Other versions
JP5967017B2 (ja
Inventor
石川幸太郎
Kotaro Ishikawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JFE Steel Corp
Original Assignee
JFE Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JFE Steel Corp filed Critical JFE Steel Corp
Priority to JP2013115106A priority Critical patent/JP5967017B2/ja
Publication of JP2014235481A publication Critical patent/JP2014235481A/ja
Application granted granted Critical
Publication of JP5967017B2 publication Critical patent/JP5967017B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • General Factory Administration (AREA)
  • Complex Calculations (AREA)

Abstract

【課題】目的変数の非等分散性に影響する説明変数を質的・量的変数の両方で抽出可能とし、更に目的変数に対する相関の強い説明変数を抽出する又は目的変数を予測することを目的とする。
【解決手段】複数の説明変数の中から説明変数を1つ選定し、説明変数が量的変数の場合、説明変数を、小さい方から大きい方へ又は大きい方から小さい方へと、対応する目的変数と共に並び替え、これを複数の区分に分割し、分割した区分の1つを限定し、他の区分全てと目的変数のF分布の累積分布関数αの計算を行い、又、選定した説明変数が質的変数の場合は区分全ての組合せで目的変数の上記αの計算を行い、以上の処理を他の全ての説明変数についても行い、全てのα値に基づいて非等分散性に影響する説明変数を抽出する。
【選択図】図1

Description

本発明は、影響因子抽出方法およびプログラムに関し、より詳しくは目的変数に対して非等分散性の強い説明変数を含む場合でも目的変数の非等分散性に影響する説明変数を影響因子として抽出し、更に目的変数に対して相関が強い説明変数を抽出する又は目的変数を予測する方法およびプログラムに関するものである。
製造プロセスにおいて、製品品質又は操業指標の実績値やこの実績値と目標値との誤差といった目的変数に対して、製造プロセスの操業条件である種々の説明変数の内で、どの説明変数が目的変数との相関が強いかを判断し、相関が強いすなわち影響の強い説明変数を抽出する。そして、抽出した説明変数を用いて目的変数を最適にすることが広く行われている。目的変数を抽出方法には、一般的に多変量解析が用いられている。
目的変数が量的変数でかつ複数の説明変数が量的変数の場合には、多変量解析の中でも、重回帰分析が用いられている。重回帰分析を利用し、品質又は操業に対して相関が強い説明変数を抽出する技術として、例えば特許文献1に開示された技術がある。なお、量的変数とは、量的に測定または計数できる値を持つ変数である。そして、量的変数と異なる、後述する質的変数とは、量的な値を持たない変数である。製造プロセスにおける、量的変数としては、例えば、材料の温度、寸法などがあり、また、質的変数としては、例えば、製造装置の名称、製造工程の名称、処理方法の名称などがある。
特許文献1に開示された技術においては、織物仕様を入力して、目的変数を評価項目(文献の実施例では糸切れ率)、説明変数を製織条件として複数のパラメーターを準備して重回帰分析を行い評価項目に対する影響度が大きいパラメーターを出力する。これにより、評価項目に対する予測と実績の差を低減するとしている。
また、特許文献2に開示された技術では、荷役用産業車両の管理システムにおいて、燃料の単位消費量当りの合計仕事量を目的変数とし、複数の運転変数を説明変数として、重回帰分析を行う。この結果、目的変数に対して、影響度の大きい説明変数を抽出し、合計仕事量を改善するための指示を出力するとしている。
さらに、特許文献3に開示された技術では、複数の質的、量的変数である説明変数と目的変数のデータセットを質的変数のもつ水準によってセグメントに分離(層別)して、これらを多変量解析の手法を用いて、目的変数に対して影響度の大きい説明変数を抽出する。質的変数のセグメントに分離する前にこれらのデータセットをその水準によって複数のデータに分離し、これらのデータ群同士の間でそれらのデータ群の目的変数の間に有意差があるかどうかをF検定、決定木分析または相関ルールを用いて確認して、有意差がある場合、セグメントを分離するとしている。
上記のように、目的変数に対して相関が強いすなわち影響の強い説明変数を抽出する方法として重回帰分析や検定が提案されている一方で、従来から簡易に自動で説明変数を抽出する方法として、目的変数が2値もしくは量的変数の場合には、多段層別分析(Automatic Interaction Detector:AID)が用いられている。この多段層別分析は、目的変数を最も良く説明できる説明変数を用いて逐次に2分割し、多段階に層別していく方法であり、説明変数を抽出する場合と2分割する場合は、母平均値の差の検定を基本にした検定を利用する。
特開2012−21253号公報 特開2009−256081号公報 特開2009−258890号公報
しかしながら、目的変数の相関が強い説明変数を抽出する重回帰分析を用いた特許文献1および2に開示された技術では、説明変数に対する目的変数の等分散性を前提としており、目的変数に対して非等分散性が強い説明変数を含む場合、説明変数の抽出精度や目的変数の予測精度が悪いという課題がある。ここで、等分散とは、説明変数の変化に対して目的変数の分散の変化が少ないということである。しかしながら、現実の製造プロセスでは、説明変数の変化による目的変数の分散の変化が大きい場合が多くあり、このような場合では、説明変数の変化に対して目的変数の非等分散性の影響が強いため重回帰分析による説明変数の抽出や目的変数の予測が困難となるという課題がある。
また、特許文献3に開示された技術では、質的変数の分離の際にF検定、t検定を用いているものの、この分離は質的変数のみであり、量的変数への適用は考慮されていない。また、質的変数も異なる説明変数間の分散の影響については考慮されていない。
さらに、AIDは、平均値による母平均値の差の検定を基本にした検定のため、説明変数の変化による目的変数の分散の変化を解析することは困難であるという課題がある。
本発明は、前記の課題に鑑みてなされたものであって、目的変数に対して非等分散性の強い説明変数を含む場合でも、目的変数に対して非等分散性に影響する説明変数を質的・量的変数の両方で抽出可能とし、その後、相関の強い説明変数を抽出する又は目的変数を予測する方法を提供する。具体的には目的変数に対する非等分散性の影響が強い説明変数を含む場合においてその説明変数を抽出し、これを層別因子として活用し、その後、目的変数に対する相関の強い説明変数を抽出する又は目的変数を予測する、影響因子抽出方法およびプログラムを提供することを目的とする。
上記課題を解決するための本発明の要旨は以下の通りである。
[1]複数の説明変数と該説明変数に対する目的変数を有する事象を対象に、該目的変数のデータの非等分散性に影響を与える因子である説明変数を抽出する影響因子抽出方法であって、
複数の説明変数の中から説明変数を1つ選定し、選定した説明変数が量的変数の場合には、選定した説明変数のデータを、小さい方から大きい方へ又は大きい方から小さい方へと、対応する目的変数のデータと共に対にして並び替え、並び替えたデータを複数の区分に分割し、分割した区分の1つを選定し、その他全ての区分に対して選定した区分を元に目的変数のF分布の累積分布関数αの計算を、片側または両側のいずれかを選択して行い、
また、選定した説明変数が質的変数である場合には、前記αを片側または両側のいずれかを選択して説明変数の区分全ての組合せで計算し、
以上の処理を他の説明変数についても説明変数がなくなるまで繰り返し行い、計算された全ての目的変数のαに基づいて非等分散性に影響する説明変数を抽出することを特徴とする影響因子抽出方法。
[2]上記[1]に記載の影響因子抽出方法において、
説明変数が量的変数の場合、隣り合う区分同士で前記αの計算を片側または両側のいずれかを選択して行い、該αをα2として、該α2に基づいて、前記隣り合う区分同士を統合又は据置し、
また説明変数が質的変数の場合には、これに対応する計算された前記αに基づいて区分を統合又は据置することを特徴とする影響因子抽出方法。
[3]上記[2]に記載の影響因子抽出方法において、
抽出された説明変数以外の残された説明変数に対して、前記αに基づく説明変数の抽出および前記区分統合又は据置を、説明変数を順次減らしながら繰り返して行うことを特徴とする影響因子抽出方法。
[4]上記[1]ないし[3]のいずれか1項に記載の影響因子抽出方法において、
区分毎のデータ数が閾値または前記αに基づいて処理を中止することを特徴とする影響因子抽出方法。
[5]上記[4]に記載の影響因子抽出方法において、
抽出された説明変数以外の残された説明変数に質的変数があれば、該質的変数に対応する目的変数に対して、説明変数内の区分間の目的変数の値に有意差があるかを平均の差の検定を行い、有意差があると判断した場合、この説明変数を抽出することを特徴とする影響因子抽出方法。
[6]上記[5]に記載の影響因子抽出方法を用いて残った説明変数にて多変量解析を行い、目的変数に対して相関の強い因子を抽出すること又は目的変数を定量的に予測することを特徴とする多変量解析方法。
[7]上記[1]ないし[4]のいずれか1項に記載の影響因子抽出方法における各ステップを、コンピュータに実行させることを特徴とする影響因子抽出プログラム。
本発明によれば、目的変数に対して非等分散性の強い説明変数を含む場合でも目的変数に対する非等分散性の影響が強い説明変数を質的・量的変数の両方で抽出可能とし、更に目的変数に対する相関の強い説明変数を抽出する又は目的変数を予測する、影響因子抽出方法およびプログラムを提供することを目的とする。
本発明による影響因子抽出方法の処理手順を示す図である。 区分統合の様子を説明する図である。 区分分割の例を示す図である。 影響因子抽出方法を多段で行う様子を模式的に示す図である。 N11に対して、N2〜N4で区分化してF0値・αを計算した結果を示す図である。 N12に対して、N2〜N4で区分化してF0値・αを計算した結果を示す図である。 N12N42を更に分割してF0値・αを計算した結果を示す図である。 N13に対して、N2〜N4で区分化してF0値・αを計算した結果を示す図である。 N13N41を更に分割して目的変数のF0値・αを計算した結果を示す図である。 N13N42を更に分割して目的変数のF0値・αを計算した結果を示す図である。 N14に対して、N2〜N4で区分化してF0値・αを計算した結果を示す図である。 実施例で目的変数の非等分散性の影響が強い説明変数を多段で抽出した模式図である。 本発明と従来技術との比較を行う図である。
本発明では、最終的に多変量解析(例えば、重回帰分析や回帰分析)を行うため、複数の説明変数のうち、目的変数に対する非等分散性の影響を与える説明変数を抽出する。非等分散性の強い説明変数が抽出された後、この説明変数を層別に活用し、多変量解析を行う。ここで、一般的に上記の分散を分析する方法としてはF分布の累積分布関数αで行われているが、これは2値問題のみ適用できる方法である。このため本発明で対象としている、説明変数が量的変数を含みかつ説明変数間での比較を行う複雑な場合には、F分布の累積分布関数αの応用技術が必要となる。
図1は、本発明による影響因子抽出方法の処理手順を示す図である。Step00では、複数の説明変数の中で1つの説明変数を選定して、質的変数か量的変数かを判別する。
Step01では、選定された説明変数が量的変数の場合の説明変数およびそれに対応する目的変数の区分分割を行う。選定された説明変数を小さいほうから大きいほうへ又は大きいほうから小さいほうへ並び替え、この説明変数に対応する目的変数もこれと共に対にして並び替え、その後これらを分割して区分を作成(層別)する。説明変数の並び替えは、説明変数の変化に対する目的変数の分散の変化を検討するのに有効である。また、区分の分割は、等データ数で行うのが好ましく、区分に分割する際に、分割線を挟んで説明変数の数値が等しい場合には、説明変数と目的変数の組み合わせのセットをランダムに配置する。これはデータの独立性を保つためである。具体的な例を、後述の実施例で説明する図3にて示す。
次に、Step02ではStep01で選定した説明変数の作成した区分の中で、一つを選定する。この際にこの選定する区分は説明変数が最も小さい区分もしくは最も大きい区分が望ましく、この選定された区分を用いて、他の区分全てと目的変数のF分布の累積分布関数αの計算を両側又は片側のいずれかを選択して行う。なお、F分布の累積分布関数αの計算については公知であり、後述の実施例にて計算結果の例を示す。
Step03は説明変数が質的変数の場合に進むステップであり、説明変数の区分は既にあるため、これを利用して、区分全ての組合せで目的変数のF分布の累積分布関数αの計算を両側又は片側のいずれかを選択して行う。
Step04では残りの説明変数がある場合は Step00に戻し、無い場合は Step05に移行させる判断を行う。これにより、説明変数全てにおいて、上記の目的変数のF分布のαの計算を行う。
Step05では非等分散性に最も強く影響を与える説明変数を上記までに計算された全てのαに基づいて抽出する。具体的にはF分布のαは小さければ、小さい程、分散に差があり、αが小さければ、説明変数の変化に対して分散の変化が大きいことが示される。これより、これらを考慮しながら、説明変数を抽出する。
以上の処理で目的変数のデータ分散に対して最も良く説明できる説明変数を抽出したが、分割された区分同士でも、目的変数の分散が説明変数の変化に対して少ない場合、同じ区分に統合することが必要である。そこで、Step06では、区分統合を行う。図2は、区分統合の様子を説明する図である。
説明変数が量的変数の場合、横軸に説明変数をとり、区分1〜6に分割し、縦軸に目的変数のデータ分散を表している。説明変数に対する目的変数のデータ分散の変化があるかどうかを調査するために隣り合う区分同士で目的変数のαを算出した。この結果、区分1と2、区分2と3、および区分5と6はαが小で、区分3と4および区分4と5はαが大であったことを示されている。このため、以上のαに基づいて区分1,2は据え置きし、区分3,4,5は統合、区分6は据え置きしていることが示されている。
このように、説明変数が量的変数の場合には、目的変数の分散の変化がない区分を統合することによって、説明変数に対して目的変数の分散がどこで変化するかを判断するのに役に立つ。区分を統合する場合は、前述のように、抽出された説明変数の区分に対して区分を小さい順もしくは大きい順に並べて、隣り合う区分同士で目的変数のF分布のαの計算を行い、これをα2とする。このα2に基づいて判断する。
説明変数が質的変数の場合は、Step02もしくはStep03で計算した目的変数のαに基づいて統合を行う。
Step07で、目的変数の非等分散性を最も説明できる説明変数及びその説明変数の区分統合した新しい区分を確定する。
次に、Step08で、処理の中止かどうかの判定を行う。区分毎のデータ数の閾値又は目的変数のF分布のαに基づいて抽出・区分統合処理を中止して、次Step09に進むかStartに戻り処理手順を繰り返すかを判断する。
Startに戻るのは、以下の理由による。これまでで目的変数の非等分散性の影響を最もよく説明できる説明変数を抽出し、目的変数の分散が説明変数のどの場所で変化しているかを推定した。しかし、現実の製造プロセスでは、目的変数に対する非等分散性の影響が強い説明変数が一つとは限らず、複数存在するケースが多い、目的変数の非等分散性の影響に対して、Step04で抽出した説明変数の次に影響する説明変数は、Step05で設定した区分範囲によって異なる。
このため、最もよく説明できる説明変数を抽出した残りの説明変数に対して、最新の区分毎に、次に最もよく説明できる説明変数を抽出し、その後区分統合を行う、という処理を残りの説明変数を順次減らしながら繰り返して行う。これによって、目的変数の分散に対して、2番目に影響する説明変数さらにその次に影響する説明変数と、順番に抽出できる。
また、処理の中止の条件を設定することが望ましい。これは、目的変数の分散に影響しない説明変数に対しても、抽出を行ってしまう可能性があり、これを防ぐためである。この方法は対象とする説明変数の区分毎のデータ数が閾値未満または目的変数のF分布の累積分布関数αに基づいて処理を中止する。
次に、以上の処理で、目的変数に対する非等分散性の影響が強い説明変数が残っているという可能性が削減できたため、Step08で質的変数の説明変数から目的変数の平均に影響を及ぼす説明変数の抽出を行う。具体的には、上述までの処理で残った説明変数の中に、質的変数があれば、この質的変数に対応する目的変数に対して、説明変数内の区分間の目的変数の値に有意差があるかどうかを「平均の差の検定」により判定し、有意差があると判断した場合、この説明変数を抽出する。
Step09は、残った説明変数にて多変量解析を行い、目的変数に対して相関の強い説明変数を抽出する又は目的変数を定量的に予測する。
上記処理ステップは、コンピュータ上に作成したプログラムにて実行する。
本実施例では、目的変数(従属変数)として、製品寸法の誤差という量的変数を、説明変数(独立変数)として4つの製造条件、すなわちN1〜N3の3つの量的変数とN4の1つの質的変数をとった場合を対象にして、以下説明を行う。
(1)目的変数と説明変数N1〜N3での処理
目的変数および説明変数が、共に量的変数である場合である。
(1)−1 説明変数N1に対する処理
処理対象の量的変数である説明変数を分割する。分割方法は、説明変数のデータ値が小さい方から大きい方へと変化する等N数に近い形で行う。分割数は、任意で設定するが2〜10の範囲で選択するのが良い。ここでは、デフォルトとして4分割としている。先ず、説明変数N1を処理対象として、これを等N数に近い形で分割する。
図3は、分割の例を示す図である。上段に説明変数を、そして対応する目的変数を下段に示している。分割数はデフォルトの4であり、説明変数の等分されたデータをそれぞれ小さい順から1,2,3,4として示している。ここで、分割線を挟んで説明変数の数値が等しい場合(図中、分割線2を挟んで破線で囲んだ部分)には、対象となる説明変数と目的変数の組み合わせのセットをランダムに配替して、分割数に必要な組み合わせの数を採取する。実際の解析においては各分割した区分のデータ数であるN数が10未満の場合は処理不可とした。これは、以下に行う目的変数のF分布の累積分布関数αの比較の際の精度悪化抑止のためである。
次に、N11,N12,N13,N14に対する目的変数の標準偏差σおよび分散を、表1のように計算する。
表1では、説明変数および目的変数の平均を、それぞれ、説AVEおよび目AVEと、目的変数の標準偏差および分散を、それぞれ、目σおよび目σ2と表記している。
そして、上記目的変数の標準偏差σおよび分散を用いて、N11をベースにそれぞれの目的変数の分散比F0値から累積分布関数αを、表2のように計算する。本発明では、全ての説明変数に対する目的変数の分布をデータ数を含めて確認し、F0>1としたので、累積分布関数αの計算は片側とする。また、表の表記のN11/N12は割算の意味では無く、組合せを示している。
(1)−2 説明変数N2およびN3に対する処理
上記説明変数N1以外のすべての説明変数に対して、(1)−1と同様の処理を行う。本実施例では、説明変数N2およびN3に対して処理を行う。すなわち、分割数はデフォルトの4とし、等分されたデータをそれぞれとして、これらに対応する目的変数のσを計算する。このσを用いて、それぞれのF0値、αを計算する。説明変数N2に対する計算結果を、表3および表4に、説明変数N3に対する計算結果を、表5および表6に、それぞれ示す。
(2)目的変数と説明変数N4での処理
説明変数が、質的変数(例えば、特定処理の有無、特定成分の有無など)である場合は、データの区分毎に全ての組合せとなるようにF0、αの計算を行う。ただし、質的変数の各区分のデータ数であるN数が10未満ならば、処理は不可とする。結果を、表7および表8に示す。
上記は、区分が2個の場合であるが、3個以上の場合については、全ての区分の組合せでαを計算する。例えば、N41,N42,N43,N44の場合は、 (1)N41-N42、(2)N41-N43、(3)N41-N44、(4)N42-N43、(5)N42-N44、(6)N43-N44でそれぞれF0値、αの計算を行い、それぞれのαを比較する。
(3)説明変数の抽出
(1)〜(2)で処理を行った説明変数N1〜N4の中で、αに基づいて、非等分散性に最も影響のある説明変数を抽出する。αは小さい程、分散の変化が大きいことが示されるが、本発明ではαが最も小さい組み合わせのある説明変数を抽出する。これより、本実施例では、最小値α=1.5283×10-21であるN11/N14の組み合わせがある説明変数N1を抽出する。
(4)区分の統合
N1の区分の中で区分を統合する
以下に、区分統合の手順を説明する。
(4−1)N11〜N14の隣り合う区分で計算したαをα2とする。ここで、F0値を計算するが、F0>1とし、本発明ではα2も片側で計算した。
(4−2)N11とN12が統合可能かα2に基づいて判断する。本発明ではN11/N12のα2が0.05以上の場合、つまりN11とN12での分散の差が小さい場合、統合可能とする。ここでは、αが0.05以下なので統合不可とする。
(4−3)次にN12とN13,N13とN12を順に統合可能かα2に基づいて判断するが、本発明ではα2が0.05以下のため、統合不可とする。
(4−4)本発明では区分統合が無いが、例えば、N11とN12で区分統合した場合、新N11として、N13とのα2に基づいて統合可能かどうかを判断する。これを、N14まで繰り返して、統合・据え置きの判断を行う。また、統合した後、最低2区分は残るようにするが、解析者の任意設定の結果、1区分になってしまう場合は解析者に対して、警報を発する。
(5)多段の解析(停止・解析条件)
(5−1)各区分をN11〜N14で分割した区分を更に分割し、(1)〜(4)の処理を繰り返す。図4は、多段での解析での様子を模式的に示す図である。
(5−2)N11に対する多段の解析
図5は、N11に対して、N2〜N4で区分化してF0値・αを計算した結果を示す図である。N2〜N4で区分化してαを算出したが、本発明ではN11の全ての組み合わせはαが0.01以上のため、N11は分割不可とした。
本発明で採用した解析不可・停止条件は、以下である。
a)各区分のNが10未満
b)αの0.01以上であること
(5−3)N12に対する多段の解析
図6は、N12に対して、N2〜N4で区分化してF0値・αを計算した結果を示す図である。本発明では、αが0.01未満の0.0019であるN12-N4の組み合わせを採用する。そして、N12N42を更に分割して、解析を行う。図7は、N12N42を更に分割してF0値・αを計算した結果を示す図である。図7において、αは0.01以上であるため、処理を停止となった。N12N41は4等分後のデータ数が10未満となるため、解析停止とした。
(5−4)N13に対する多段の解析
図8は、N13に対して、N2〜N4で区分化してF0値・αを計算した結果を示す図である。この結果、N13-N4がαが0.01未満のため採用する。そして、N13N41,N13N42それぞれを更に分割して、解析を行う。図9は、N13N41を更に分割して目的変数のF0値・αを計算した結果を示す図、図10はN13N42を更に分割して目的変数のF0値・αを計算した結果を示す図である。図9,10において、αは0.01以上であるため、処理を停止とした。
(5−5)N14に対する多段の解析
図11は、N14に対して、N2〜N4で区分化してF0値・αを計算した結果を示す図である。この結果、αが0.01以上のため、採用はなしとした。
(5−6)図12は上記の目的変数の非等分散性の影響が強い説明変数を多段で抽出した模式図である。次にこれらの層別を活用して、説明変数に質的変数が残っている層に目的変数の平均の差の検定を行い、更に層別できるかを判断する。ここで、説明変数に質的変数が残っている層はN11とN14で両方ともにN4である。これらのP値を計算した結果を表10に示す
本発明ではP値が0.01以下で層別採用したため、上記の結果より採用無しとした。
(5−7)図13は、従来技術と上記までの層別を用いて重回帰を行った本発明との比較を行う図である。図13(a)は、重回帰分析式において目的変数の説明変数としたかどうかを、「有」「無」で表しており、(b)は、目的変数の実績値と重回帰分析式を用いて推定した目的変数の値との「残差平方和」を表している。
「残差平方和」が小さければ、実績値に近い推定値であることを示している。従来技術の場合、非等分散性の強い説明変数を抽出せずに全ての説明変数で重回帰を行っている。この結果、従来技術よりも本発明の非等分散性の影響の強い説明変数を抽出して、これを層別に活用して重回帰を行った方が全て残差平方和が低くなっている。このため、本発明の有効性を確認することができる。
本発明は、複数の説明変数と該説明変数に対する目的変数を有する事象を対象に広く適用可能であり、特に、製鉄プロセスなどの製造プロセス一般での適用が期待できる。また、重回帰以外にも、主成分分析、及び判別分析などを行う場合にも、本発明を適用し、その後、解析を行った方が、相関係数が向上する可能性がある。

Claims (7)

  1. 複数の説明変数と該説明変数に対する目的変数を有する事象を対象に、該目的変数のデータの非等分散性に影響を与える因子である説明変数を抽出する影響因子抽出方法であって、
    複数の説明変数の中から説明変数を1つ選定し、選定した説明変数が量的変数の場合には、選定した説明変数のデータを、小さい方から大きい方へ又は大きい方から小さい方へと、対応する目的変数のデータと共に対にして並び替え、並び替えたデータを複数の区分に分割し、分割した区分の1つを選定し、その他全ての区分に対して選定した区分を元に目的変数のF分布の累積分布関数αの計算を、片側または両側のいずれかを選択して行い、
    また、選定した説明変数が質的変数である場合には、前記αを片側または両側のいずれかを選択して説明変数の区分全ての組合せで計算し、
    以上の処理を他の説明変数についても説明変数がなくなるまで繰り返し行い、計算された全ての目的変数のαに基づいて非等分散性に影響する説明変数を抽出することを特徴とする影響因子抽出方法。
  2. 請求項1に記載の影響因子抽出方法において、
    説明変数が量的変数の場合、隣り合う区分同士で前記αの計算を片側または両側のいずれかを選択して行い、該αをα2として、該α2に基づいて、前記隣り合う区分同士を統合又は据置し、
    また説明変数が質的変数の場合には、これに対応する計算された前記αに基づいて区分を統合又は据置することを特徴とする影響因子抽出方法。
  3. 請求項2に記載の影響因子抽出方法において、
    抽出された説明変数以外の残された説明変数に対して、前記αに基づく説明変数の抽出および前記区分統合又は据置を、説明変数を順次減らしながら繰り返して行うことを特徴とする影響因子抽出方法。
  4. 請求項1ないし3のいずれか1項に記載の影響因子抽出方法において、
    区分毎のデータ数が閾値または前記αに基づいて処理を中止することを特徴とする影響因子抽出方法。
  5. 請求項4に記載の影響因子抽出方法において、
    抽出された説明変数以外の残された説明変数に質的変数があれば、該質的変数に対応する目的変数に対して、説明変数内の区分間の目的変数の値に有意差があるかを平均の差の検定を行い、有意差があると判断した場合、この説明変数を抽出することを特徴とする影響因子抽出方法。
  6. 請求項5に記載の影響因子抽出方法を用いて残った説明変数にて多変量解析を行い、目的変数に対して相関の強い因子を抽出すること又は目的変数を定量的に予測することを特徴とする多変量解析方法。
  7. 請求項1ないし4のいずれか1項に記載の影響因子抽出方法における各ステップを、コンピュータに実行させることを特徴とする影響因子抽出プログラム。
JP2013115106A 2013-05-31 2013-05-31 影響因子抽出方法およびプログラム Active JP5967017B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013115106A JP5967017B2 (ja) 2013-05-31 2013-05-31 影響因子抽出方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013115106A JP5967017B2 (ja) 2013-05-31 2013-05-31 影響因子抽出方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2014235481A true JP2014235481A (ja) 2014-12-15
JP5967017B2 JP5967017B2 (ja) 2016-08-10

Family

ID=52138169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013115106A Active JP5967017B2 (ja) 2013-05-31 2013-05-31 影響因子抽出方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5967017B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017174390A (ja) * 2016-03-22 2017-09-28 新日鐵住金株式会社 予測テーブル設計装置、方法及びプログラム
JP2020057261A (ja) * 2018-10-03 2020-04-09 トヨタ自動車株式会社 重回帰分析装置及び重回帰分析方法
JP7440438B2 (ja) 2021-02-03 2024-02-28 株式会社日立製作所 公差解析システム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08184546A (ja) * 1994-12-28 1996-07-16 Toyota Central Res & Dev Lab Inc 材料の真密度推定方法および装置、材料の空洞量推定方法
JP2007305048A (ja) * 2006-05-15 2007-11-22 Mitsubishi Electric Information Systems Corp 影響因子推定装置及び影響因子推定プログラム
JP2009140178A (ja) * 2007-12-05 2009-06-25 Fujitsu Ltd パターン抽出装置、パターン抽出プログラムおよびパターン抽出方法
JP2011044592A (ja) * 2009-08-21 2011-03-03 Nec Corp 信頼度判断装置、信頼度判断方法、及び信頼度判断用コンピュータプログラム
JP2011077287A (ja) * 2009-09-30 2011-04-14 Nec Corp 信頼度判断装置、信頼度判断方法、及び信頼度判断用コンピュータプログラム
US20120331024A1 (en) * 2009-12-15 2012-12-27 Nec Corporation Information processing device, method of processing information and storage medium

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08184546A (ja) * 1994-12-28 1996-07-16 Toyota Central Res & Dev Lab Inc 材料の真密度推定方法および装置、材料の空洞量推定方法
JP2007305048A (ja) * 2006-05-15 2007-11-22 Mitsubishi Electric Information Systems Corp 影響因子推定装置及び影響因子推定プログラム
JP2009140178A (ja) * 2007-12-05 2009-06-25 Fujitsu Ltd パターン抽出装置、パターン抽出プログラムおよびパターン抽出方法
JP2011044592A (ja) * 2009-08-21 2011-03-03 Nec Corp 信頼度判断装置、信頼度判断方法、及び信頼度判断用コンピュータプログラム
JP2011077287A (ja) * 2009-09-30 2011-04-14 Nec Corp 信頼度判断装置、信頼度判断方法、及び信頼度判断用コンピュータプログラム
US20120331024A1 (en) * 2009-12-15 2012-12-27 Nec Corporation Information processing device, method of processing information and storage medium

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6015032557; 古山 恒夫: '"エンタプライズ系ソフトウェアの生産性に影響を与える要因の分析"' 情報処理学会研究報告 第2007巻 第33号, 20070323, pp.73-80, 社団法人情報処理学会 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017174390A (ja) * 2016-03-22 2017-09-28 新日鐵住金株式会社 予測テーブル設計装置、方法及びプログラム
JP2020057261A (ja) * 2018-10-03 2020-04-09 トヨタ自動車株式会社 重回帰分析装置及び重回帰分析方法
JP7056497B2 (ja) 2018-10-03 2022-04-19 トヨタ自動車株式会社 重回帰分析装置及び重回帰分析方法
US11790277B2 (en) 2018-10-03 2023-10-17 Toyota Jidosha Kabushiki Kaisha Multiple regression analysis apparatus and multiple regression analysis method
JP7440438B2 (ja) 2021-02-03 2024-02-28 株式会社日立製作所 公差解析システム

Also Published As

Publication number Publication date
JP5967017B2 (ja) 2016-08-10

Similar Documents

Publication Publication Date Title
KR102092054B1 (ko) 자동 결함 분류에서 분류기 준비 및 유지
JP5014500B1 (ja) 異常要因特定方法および装置、上記異常要因特定方法をコンピュータに実行させるためのプログラム、並びに上記プログラムを記録したコンピュータ読み取り可能な記録媒体
US10901401B2 (en) Plan generation apparatus, method and computer readable medium for multi-process production of intermediate product
US8473498B2 (en) Natural language text analytics
KR102258942B1 (ko) 인라인 수율 모니터링을 위한 임계 파라메트릭 전기 테스트 파라미터의 자동 결정을 위한 시스템 및 방법
US7584162B2 (en) Manufacture data analysis method and manufacture data analyzer apparatus
CN111090579B (zh) 基于皮尔森相关性加权关联分类规则的软件缺陷预测方法
JP2008059601A (ja) 双峰性データを判別する方法
JP5967017B2 (ja) 影響因子抽出方法およびプログラム
CN106529580A (zh) 结合edsvm的软件缺陷数据关联分类方法
CN111931334A (zh) 一种用于评估电缆设备运行可靠性的方法及系统
Muthusamy et al. Effectiveness of test case prioritization techniques based on regression testing
Lavalle et al. An approach to automatically detect and visualize bias in data analytics
JP2008250910A (ja) データマイニング方法及び工程管理方法
Buschmann et al. Data-driven decision support for process quality improvements
CN110226160B (zh) 状态分析装置、状态分析方法、以及存储介质
JP2016091138A (ja) ソースコード検証システム
CN105814546B (zh) 用于辅助对算法链的检验和验证的方法和系统
JP2004186374A (ja) 製造データ解析方法及びそれをコンピュータに実行させるプログラム
JP6885211B2 (ja) 情報分析装置、情報分析方法および情報分析プログラム
CN111724048A (zh) 基于特征工程对成品库调度系统性能数据的特征抽取方法
CN112445632A (zh) 基于故障数据建模的hpc可靠性评估方法
Singh et al. Acceptance sampling plan for truncated life tests based on generalized pareto distribution using mean life
Lim et al. Allocation of the equipment path in a multi-stage manufacturing process
Kunz et al. Fractographic reconstitution of fatigue crack growth in integrally stiffened panels

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141219

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160519

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160620

R150 Certificate of patent or registration of utility model

Ref document number: 5967017

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250