JPH056394A - 自動回帰分析装置 - Google Patents
自動回帰分析装置Info
- Publication number
- JPH056394A JPH056394A JP15684191A JP15684191A JPH056394A JP H056394 A JPH056394 A JP H056394A JP 15684191 A JP15684191 A JP 15684191A JP 15684191 A JP15684191 A JP 15684191A JP H056394 A JPH056394 A JP H056394A
- Authority
- JP
- Japan
- Prior art keywords
- hypothesis
- variables
- base
- regression
- explanatory variables
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Complex Calculations (AREA)
Abstract
(57)【要約】
【目的】 分析結果から不適な仮説は棄却し、適切な仮
説の変数を制限して、効率的にかつ自動的に回帰分析を
行う装置を得ることを目的とする。 【構成】 原因となる変数を記憶する関係ベ−スから適
切な変数の組み合わせのみを順次取り出す仮説生成手段
と、回帰分析手段と、回帰式検定手段と、回帰分析結果
と回帰式検定結果から仮説の変数の適・不適を判定し関
係ベ−スに戻す仮説生成制御手段とを設けた。
説の変数を制限して、効率的にかつ自動的に回帰分析を
行う装置を得ることを目的とする。 【構成】 原因となる変数を記憶する関係ベ−スから適
切な変数の組み合わせのみを順次取り出す仮説生成手段
と、回帰分析手段と、回帰式検定手段と、回帰分析結果
と回帰式検定結果から仮説の変数の適・不適を判定し関
係ベ−スに戻す仮説生成制御手段とを設けた。
Description
【0001】
【産業上の利用分野】この発明は得られた統計量に対
し、結果を良く説明する仮説の変数を定め、重回帰分析
を行う回帰分析装置の自動化に関するものである。
し、結果を良く説明する仮説の変数を定め、重回帰分析
を行う回帰分析装置の自動化に関するものである。
【0002】
【従来の技術】既に得られている結果(関数)に対し、
その結果を左右する原因(変数)を特定するために、幾
つかの説明変数を仮定し、その係数を最小2乗法を用い
て推定し、検定することが行われている。重回帰式と呼
ばれるものである。説明変数の組み合わせを決めて、数
値演算を行い、その結果の一つである重相関係数によっ
て説明変数がどのくらいよく当てはまっているかを調べ
る。さらに、得られた回帰式を2つの観点で検定する必
要がある。一つは統計検定量であり、もう一つは回帰式
の係数の符号の意味から回帰式を検定する。
その結果を左右する原因(変数)を特定するために、幾
つかの説明変数を仮定し、その係数を最小2乗法を用い
て推定し、検定することが行われている。重回帰式と呼
ばれるものである。説明変数の組み合わせを決めて、数
値演算を行い、その結果の一つである重相関係数によっ
て説明変数がどのくらいよく当てはまっているかを調べ
る。さらに、得られた回帰式を2つの観点で検定する必
要がある。一つは統計検定量であり、もう一つは回帰式
の係数の符号の意味から回帰式を検定する。
【0003】もし、これらの2つの、検定にパスし重相
関係数から十分当てはまっていなければ、他の説明変数
の組み合わせを試してみる。このプロセスの組み合わせ
を2つの検定をパスし、満足する重相関関係が得られる
まで続ける。図1の回帰分析装置2と仮説検定装置3は
従来でも必要な構成である。従来は、仮説の生成方法と
して、例えばすべての変数の組み合わせを用意してお
き、順々に試した。しかし、説明変数となりうる変量が
Nあった場合、2N ー1通りの説明変数の組み合せが存
在する。このため、全ての組み合わせを試すことには大
変な負荷がかかる。このような場合は、適切でない仮説
は選択しないようにする必要がある。
関係数から十分当てはまっていなければ、他の説明変数
の組み合わせを試してみる。このプロセスの組み合わせ
を2つの検定をパスし、満足する重相関関係が得られる
まで続ける。図1の回帰分析装置2と仮説検定装置3は
従来でも必要な構成である。従来は、仮説の生成方法と
して、例えばすべての変数の組み合わせを用意してお
き、順々に試した。しかし、説明変数となりうる変量が
Nあった場合、2N ー1通りの説明変数の組み合せが存
在する。このため、全ての組み合わせを試すことには大
変な負荷がかかる。このような場合は、適切でない仮説
は選択しないようにする必要がある。
【0004】従来、最良回帰式の求め方として、「多変
量解析入門1」(河口至商著)にある変量増減法、変量
増加法、変量減少法、AICによる方法、Cp統計量に
よる方法が発表されている。
量解析入門1」(河口至商著)にある変量増減法、変量
増加法、変量減少法、AICによる方法、Cp統計量に
よる方法が発表されている。
【0005】また、 人工知能の分野では、 de Kleerは、
「An Assumption based TMS」(Artiーficial Inteligenc
e, Vol. 28, No.2, pp. 127ー162) で、仮説の効率的な
枝刈方法を発表している。ただし、これは論理的な推理
手続きの分野においてである。
「An Assumption based TMS」(Artiーficial Inteligenc
e, Vol. 28, No.2, pp. 127ー162) で、仮説の効率的な
枝刈方法を発表している。ただし、これは論理的な推理
手続きの分野においてである。
【0006】
【発明が解決しようとする課題】従来の選定方法では、
過去の検定の成功、失敗の経験を有効利用せず、すべて
の仮設を平等に扱ってすべての組み合わせを調査するの
で、組み合わせを調査し終わるのに時間がかかり能率が
悪い。また、適切な仮説を選択しないうちに繰り返しを
打ち切ってしまう場合もある。
過去の検定の成功、失敗の経験を有効利用せず、すべて
の仮設を平等に扱ってすべての組み合わせを調査するの
で、組み合わせを調査し終わるのに時間がかかり能率が
悪い。また、適切な仮説を選択しないうちに繰り返しを
打ち切ってしまう場合もある。
【0007】この発明は、このような問題点を解消する
ためになされたもので、不適切な変数は利用しないよう
にして、有効な変数を用いて重回帰分析、仮説の検定と
いう繰り返しを行うようにして、これまでの検定結果を
利用して、効率的に適切な回帰式を得ることを目的とし
ている。
ためになされたもので、不適切な変数は利用しないよう
にして、有効な変数を用いて重回帰分析、仮説の検定と
いう繰り返しを行うようにして、これまでの検定結果を
利用して、効率的に適切な回帰式を得ることを目的とし
ている。
【0008】
【課題を解決するための手段】この発明に係る自動回帰
分析装置は、変数を記憶している関係ベ−スから過去の
検定で成功した変数の組み合わせのみを順次取り出す仮
説生成手段と、取り出された変数で重回帰分析する手段
と、回帰式検定する手段と、これらの結果から変数の適
・不適を選択し関係ベ−スに戻す仮説生成制御手段を設
けた。
分析装置は、変数を記憶している関係ベ−スから過去の
検定で成功した変数の組み合わせのみを順次取り出す仮
説生成手段と、取り出された変数で重回帰分析する手段
と、回帰式検定する手段と、これらの結果から変数の適
・不適を選択し関係ベ−スに戻す仮説生成制御手段を設
けた。
【0009】
【作用】この発明における自動回帰分析装置は、関係ベ
−スに記憶された仮説の変数から過去に失敗した変数は
棄却され、適切な変数だけが組み合わされる。
−スに記憶された仮説の変数から過去に失敗した変数は
棄却され、適切な変数だけが組み合わされる。
【0010】
実施例1.図1は、この発明による自動回帰分析装置の
一実施例の全体構成図である。図1において新規な部分
は1と4である。1は関係ベースを参照して、説明変数
の組み合わせを自動的に生成する仮説生成装置、2は、
説明変数の組み合わせと被説明変数によって表される回
帰式をデータベースを参照して計算する回帰分析装置、
3は、回帰分析の結果をF検定、t検定により統計的に
検定する。この検定にパスした場合、寄与ベースを参照
して、説明変数の符号の意味が適切かどうかを調べる。
4は、廃却された仮説から関係ベースを修正して次の仮
説生成を制限する仮説生成制御装置である。統計的検定
で廃却された仮説に用いられた説明変数間の多重共線性
を計算して、関係ベースを更新する。
一実施例の全体構成図である。図1において新規な部分
は1と4である。1は関係ベースを参照して、説明変数
の組み合わせを自動的に生成する仮説生成装置、2は、
説明変数の組み合わせと被説明変数によって表される回
帰式をデータベースを参照して計算する回帰分析装置、
3は、回帰分析の結果をF検定、t検定により統計的に
検定する。この検定にパスした場合、寄与ベースを参照
して、説明変数の符号の意味が適切かどうかを調べる。
4は、廃却された仮説から関係ベースを修正して次の仮
説生成を制限する仮説生成制御装置である。統計的検定
で廃却された仮説に用いられた説明変数間の多重共線性
を計算して、関係ベースを更新する。
【0011】図1の5は、説明変数の組み合わせを階層
的に整理した関係ベースである。多重共線性が強い組み
合わせ、意味がないと指定された組み合わせはすべてマ
ークされ、その組み合わせの上位ノードも全てマークさ
れている。この関係ベース中のマークされていない組み
合わせだけが、仮説として選択可能である。図1の6
は、説明変数、被説明変数の生データが格納されている
データベースである。図1の7は、説明変数の寄与関係
を格納する寄与ベースである。被説明変数が説明変数の
関数であるとしたとき、 dy/dx > 0のとき、寄与関係は正 dy/dx > 0のとき、寄与関係は負 dy/dx = 0のとき、寄与関係は0であるとす
る。 ここで、yは被説明変数、xは説明変数である。
的に整理した関係ベースである。多重共線性が強い組み
合わせ、意味がないと指定された組み合わせはすべてマ
ークされ、その組み合わせの上位ノードも全てマークさ
れている。この関係ベース中のマークされていない組み
合わせだけが、仮説として選択可能である。図1の6
は、説明変数、被説明変数の生データが格納されている
データベースである。図1の7は、説明変数の寄与関係
を格納する寄与ベースである。被説明変数が説明変数の
関数であるとしたとき、 dy/dx > 0のとき、寄与関係は正 dy/dx > 0のとき、寄与関係は負 dy/dx = 0のとき、寄与関係は0であるとす
る。 ここで、yは被説明変数、xは説明変数である。
【0012】具体例を説明する。図2は、関係ベースの
説明変数の候補が4つの場合の構成である。A、B、
C、Dが説明変数の候補を表している。説明変数の選択
には、24 ー1=15通りの組み合わせがある。ネット
ワーク上のノードはそれぞれの説明変数の組み合わせに
対応し、アークは、説明変数の組み合わせ同士の包含関
係を表している。つまり、矢印の出ている組み合わせ
は、矢印の、向かっている組み合わせの部分の集合であ
ることを表現している。
説明変数の候補が4つの場合の構成である。A、B、
C、Dが説明変数の候補を表している。説明変数の選択
には、24 ー1=15通りの組み合わせがある。ネット
ワーク上のノードはそれぞれの説明変数の組み合わせに
対応し、アークは、説明変数の組み合わせ同士の包含関
係を表している。つまり、矢印の出ている組み合わせ
は、矢印の、向かっている組み合わせの部分の集合であ
ることを表現している。
【0013】次に、この自動回帰分析装置の動作を説明
する。図3は、図2と同様な関係を表しているが、ここ
で、{A,B}という組み合わせのとき検定に失敗する
という情報が得られた場合、{A,B}をマークする。
更に関係ベースのアークを矢印の方向にたどって、上位
の集合もすべてマークする。するとこの場合、次の候補
は15ー4=11個となる。図1の仮説生成制御装置4
はこの動作をする。また、{B,C}も検定に失敗する
という情報が得られたとき、更に2つ減って9個とな
る。このように、説明変数の組み合わせを階層的に整理
して、検定失敗の情報を利用することによって、次に選
択できる仮説の数を制限することが可能になる。
する。図3は、図2と同様な関係を表しているが、ここ
で、{A,B}という組み合わせのとき検定に失敗する
という情報が得られた場合、{A,B}をマークする。
更に関係ベースのアークを矢印の方向にたどって、上位
の集合もすべてマークする。するとこの場合、次の候補
は15ー4=11個となる。図1の仮説生成制御装置4
はこの動作をする。また、{B,C}も検定に失敗する
という情報が得られたとき、更に2つ減って9個とな
る。このように、説明変数の組み合わせを階層的に整理
して、検定失敗の情報を利用することによって、次に選
択できる仮説の数を制限することが可能になる。
【0014】次に、仮説生成装置は関係ベースからまだ
選択されていなくて、マークされていない一番下位のノ
ードを仮説として選択する。ここで選択された仮説はそ
のノードに選択されたという情報を関係ベースに登録す
る。
選択されていなくて、マークされていない一番下位のノ
ードを仮説として選択する。ここで選択された仮説はそ
のノードに選択されたという情報を関係ベースに登録す
る。
【0015】仮説制御装置は、仮説検定装置で統計的に
検定で棄却された仮説に含まれた説明変数間の多重共線
性を計算する。もし、この多重共線性が高ければ、この
仮説が関係ベース中で対応するノードにマークする。ま
た、検定によって棄却されなかった仮説を適切な回帰式
として出力する。
検定で棄却された仮説に含まれた説明変数間の多重共線
性を計算する。もし、この多重共線性が高ければ、この
仮説が関係ベース中で対応するノードにマークする。ま
た、検定によって棄却されなかった仮説を適切な回帰式
として出力する。
【0016】仮説検定装置は、F検定、t検定、寄与ベ
ースに基づいた意味検定の3ステップを行う。これらの
検定を一つ一つ行い、棄却された検定のステップから仮
説生成制御装置へ処理を進める。
ースに基づいた意味検定の3ステップを行う。これらの
検定を一つ一つ行い、棄却された検定のステップから仮
説生成制御装置へ処理を進める。
【0017】寄与ベースには、説明変数と非説明変数の
符号の意味を記述しておく。例えば、xという変数に対
して、A,B,C,Dという4つの変数から回帰式を求
めるとき、XとA,B,C,Dの関係を寄与ベースに登
録しておく。例えば、 plus(X,A) minus(X,B) plus(X,C) plus(X,D) というように、登録する。plus(X,A)は、Aが
増えたとき、Xも増えるという単調増加の関係のあるこ
とを示し、,minus(X,B)は逆に、Bが増えた
とき、xが減ることを表している。このような場合、x
=a0+a1*Aという回帰分析の結果、a1 の係数がマ
イナスであったとき、寄与ベースを参照して、自動的
に、この仮説は正しくないとして棄却する。
符号の意味を記述しておく。例えば、xという変数に対
して、A,B,C,Dという4つの変数から回帰式を求
めるとき、XとA,B,C,Dの関係を寄与ベースに登
録しておく。例えば、 plus(X,A) minus(X,B) plus(X,C) plus(X,D) というように、登録する。plus(X,A)は、Aが
増えたとき、Xも増えるという単調増加の関係のあるこ
とを示し、,minus(X,B)は逆に、Bが増えた
とき、xが減ることを表している。このような場合、x
=a0+a1*Aという回帰分析の結果、a1 の係数がマ
イナスであったとき、寄与ベースを参照して、自動的
に、この仮説は正しくないとして棄却する。
【0018】図1を用いて、全体的なアルゴリズムを説
明する。仮設生成装置が、関係ベースを参照して、マー
クされていない組合せの中から、要素が一番少ないもの
を選択する。その変数の組合せから、回帰モデルをつく
って回帰分析装置に送る。回帰分析装置はデータベース
の生データを用いて、回帰分析を行ない、回帰係数、相
関係数、F検定値、t検定値、各説明変数どうしの多重
共線性を計算する。その計算結果から、仮設検定装置が
自動的に検定を行なう。特に、回帰係数の符号と寄与ベ
ースを比較して、意味的な検定も行なう。この検定結果
で、棄却された時、多重共線性が高い変数の組合せがあ
った場合、関係ベースを更新する。棄却されなかった場
合は、ユーザが相関係数などから見て満足のいくモデル
が得られなければ、他の説明変数の組合せを試すことも
できる。この繰り返しを、可能な組合せがなくなるまで
続けることができる。なお従来で、自動化されていたの
は、「回帰分析装置」だけである。
明する。仮設生成装置が、関係ベースを参照して、マー
クされていない組合せの中から、要素が一番少ないもの
を選択する。その変数の組合せから、回帰モデルをつく
って回帰分析装置に送る。回帰分析装置はデータベース
の生データを用いて、回帰分析を行ない、回帰係数、相
関係数、F検定値、t検定値、各説明変数どうしの多重
共線性を計算する。その計算結果から、仮設検定装置が
自動的に検定を行なう。特に、回帰係数の符号と寄与ベ
ースを比較して、意味的な検定も行なう。この検定結果
で、棄却された時、多重共線性が高い変数の組合せがあ
った場合、関係ベースを更新する。棄却されなかった場
合は、ユーザが相関係数などから見て満足のいくモデル
が得られなければ、他の説明変数の組合せを試すことも
できる。この繰り返しを、可能な組合せがなくなるまで
続けることができる。なお従来で、自動化されていたの
は、「回帰分析装置」だけである。
【0019】
【発明の効果】以上のようにこの発明によれば、仮説か
ら統計的に回帰式に無用の説明変数を棄却し、有効な説
明変数だけを関係ベ−スに登録する仮説生成制御手段を
設け、関係ベ−スから有効な説明変数だけを取り出して
組み合わせ説明変数として設定する仮説生成手段を設け
たので、変数の少ない組み合わせを短時間に試行できる
効果がある。
ら統計的に回帰式に無用の説明変数を棄却し、有効な説
明変数だけを関係ベ−スに登録する仮説生成制御手段を
設け、関係ベ−スから有効な説明変数だけを取り出して
組み合わせ説明変数として設定する仮説生成手段を設け
たので、変数の少ない組み合わせを短時間に試行できる
効果がある。
【図1】この発明による自動回帰分析装置の一実施例の
全体構成図である。
全体構成図である。
【図2】仮説の格納方法を表した図である。
【図3】この発明による選択可能な仮説の制限方法を表
した図である。
した図である。
1 仮説生成装置 2 回帰分析装置 3 仮説検定装置 4 仮説生成制御装置 5 関係ベース 6 データベース 7 寄与ベース
Claims (1)
- 【特許請求の範囲】 【請求項1】 原因となる変数を記憶している関係ベ−
スから、適切な変数の組み合わせのみを順次取り出す仮
説生成手段と、取り出された仮説による変数で重回帰分
析する手段と、さらに回帰式検定する手段と、上記重回
帰分析と回帰式検定との結果から仮説の変数の適・不適
を判定し関係ベ−スにフィ−ドバックする仮説生成制御
手段を備えた自動回帰分析装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15684191A JPH056394A (ja) | 1991-06-27 | 1991-06-27 | 自動回帰分析装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15684191A JPH056394A (ja) | 1991-06-27 | 1991-06-27 | 自動回帰分析装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH056394A true JPH056394A (ja) | 1993-01-14 |
Family
ID=15636545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15684191A Pending JPH056394A (ja) | 1991-06-27 | 1991-06-27 | 自動回帰分析装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH056394A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9043256B2 (en) | 2011-11-30 | 2015-05-26 | International Business Machines Corporation | Hypothesis derived from relationship graph |
US10592584B2 (en) | 2016-03-17 | 2020-03-17 | Kabushiki Kaisha Toshiba | Information processing apparatus, information processing method, and program |
-
1991
- 1991-06-27 JP JP15684191A patent/JPH056394A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9043256B2 (en) | 2011-11-30 | 2015-05-26 | International Business Machines Corporation | Hypothesis derived from relationship graph |
US10592584B2 (en) | 2016-03-17 | 2020-03-17 | Kabushiki Kaisha Toshiba | Information processing apparatus, information processing method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110543421B (zh) | 基于测试用例自动生成算法的单元测试自动执行方法 | |
Nguyen et al. | Checking an Expert Systems Knowledge Base for Consistency and Completeness. | |
JP4557337B2 (ja) | Xリストに基づく多重エラー及び故障を診断する方法並びにシステム | |
CN109344053B (zh) | 接口覆盖测试方法、系统、计算机设备和存储介质 | |
CN109033262A (zh) | 问答知识库更新方法及装置 | |
US6580960B1 (en) | System and method for finding an operation/tool combination that causes integrated failure in a semiconductor fabrication facility | |
US20230066599A1 (en) | Method and Apparatus for Reconstructing the Position of Semiconductor Components on a Wafer | |
CN111767277A (zh) | 数据处理方法和装置 | |
CN109710240A (zh) | 流程图分解方法及系统 | |
CN114416573A (zh) | 一种应用程序的缺陷分析方法、装置、设备及介质 | |
CN114238474A (zh) | 基于排水系统的数据处理方法、装置、设备及存储介质 | |
CN117613908A (zh) | 基于配电网络的智能运维方法及系统 | |
CN110045972A (zh) | Onu在线升级方法和系统 | |
US20080104576A1 (en) | Method and arrangement for locating input domain boundaries | |
JPH056394A (ja) | 自動回帰分析装置 | |
WO2009016090A1 (en) | A method and relative device for the management of technological recipe information to aid in defining process flows, in particular for the development and production of micro- and nanotechnology devices in cleanroom laboratories | |
CN111880957A (zh) | 一种基于随机森林模型的程序错误定位方法 | |
CN104615535B (zh) | 一种基于扩展的数据流模型来生成测试用例的方法与装置 | |
CN114665986B (zh) | 一种蓝牙钥匙的测试系统及方法 | |
Cimitile et al. | A software model for impact analysis: a validation experiment | |
TW200411801A (en) | Method for analyzing defect inspection parameters | |
CN115729825A (zh) | 一种工业协议的模糊测试用例生成方法、装置和电子设备 | |
CN114638185A (zh) | 一种芯片验证方法、装置及存储介质 | |
CN112733524A (zh) | 标准编号自动校正及标准状态批量核查方法、系统、装置 | |
JPH11175144A (ja) | プラント機器の保守支援装置 |