JP2007328744A - 回帰分析方法及びその装置 - Google Patents

回帰分析方法及びその装置 Download PDF

Info

Publication number
JP2007328744A
JP2007328744A JP2006161636A JP2006161636A JP2007328744A JP 2007328744 A JP2007328744 A JP 2007328744A JP 2006161636 A JP2006161636 A JP 2006161636A JP 2006161636 A JP2006161636 A JP 2006161636A JP 2007328744 A JP2007328744 A JP 2007328744A
Authority
JP
Japan
Prior art keywords
regression analysis
regression
calculated
eigenvalues
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006161636A
Other languages
English (en)
Other versions
JP2007328744A5 (ja
Inventor
Teruyoshi Washisawa
輝芳 鷲澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006161636A priority Critical patent/JP2007328744A/ja
Priority to US11/757,545 priority patent/US7610169B2/en
Publication of JP2007328744A publication Critical patent/JP2007328744A/ja
Publication of JP2007328744A5 publication Critical patent/JP2007328744A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Abstract

【課題】 シフト項を含む単回帰モデル、更には一般の重回帰モデルに対する評価関数及びパラメタ推定方法を求める。
【解決手段】 多変量データと目的変数との組み合わせからなる行列の分散共分散行列を求め(S102)、その分散共分散行列を固有値分解することによって、複数の固有値及び対応する固有ベクトルを計算する(S103)。そして、これら複数の固有値より、絶対値の大きい順に累積寄与率を計算し(S104)、所定値を超える累積寄与率に対応する固有値及び固有ベクトルから回帰係数を算出する(S106)。
【選択図】 図1

Description

本発明は、多変量データから目的変数を求める技術に関する。
<記号の説明>
以下の記述で用いられる記号の定義を与える。
1.D次元サンプルベクトルx,y(英小文字)の要素をそれぞれx(1),x(2),…,x(D)及びy(1),y(2),…,y(D)等と記述する。
2.N個のサンプルベクトルx,yのサンプル平均値を<x>,<y>と記述する。
j=N j=N j=N
<x>:=(1/N)Σxj(1),Σxj(2),…,Σxj(D))T …式(4)
j=1 j=1 j=1
3.分散共分散:
サンプルベクトルxjの標準偏差Sxxは、式(5)で表される。
j=N
Sxx=(1/N)Σ||xj−<x>||2 …式(5)
j=1
またサンプルベクトルyjの標準偏差Syyは、式(6)で表される。
j=N
Syy=(1/N)Σ||yj−<y>||2 …式(6)
j=1
ここで、X,yの共分散は、式(7)で表される。
j=N
Sxy=(1/N)Σ||xj−<x>|| ||yj−<y>|| …式(7)
j=1
未知の系に対する入力ベクトルxと出力yの組、或いは変量x,yの測定値がそれぞれN個与えられたとき、これらxとyとの間に線形関係が存在すると仮定すると、その関係は以下の式で表される。
y=θ1Tx+θ2 …式(8)
この式(8)において、パラメタθ1及びθ2を求めることにより、これらxとyとの関係が得られる。ここで、これらパラメタθ1及びθ2を推定する技術は回帰分析技術として知られている。
このような回帰分析の応用例として、特許文献1には、プロセスの状態を推定する方法として重回帰分析が記載されている。また特許文献2では、測色機による分光反射率の測定データから微小見本の分光反射率を推定するために重回帰分析が用いられている。また特許文献3では、積雪量測定装置から得られる積雪情報に基づいて、積雪量測定装置が設置されていない区域の積雪量を高精度に推定するために重回帰分析を用いている。また特許文献4では、3原色を種々組み合わせて作成したサンプルから実測される1次色濃度と再現色濃度とを基に、重回帰分析を用いて再現色濃度を推定している。更に、特許文献5では、走行時の車両状態から路面摩擦係数を算出するために、ブレーキ圧、車輪加速度及び車輪スリップ率から重回帰分析を用いて路面摩擦係数を推定している。
その他、このような応用例は様々な分野において多数存在するが、これらに共通することは、入力ベクトル(説明変数)から出力値(目的変数)への関数のパラメタを精度良く推定する手段として用いられている重回帰分析が主要な役割を果たしているということである。
この推定に使用される数式は、例えば非特許文献1の第165ページに記載されているように、以下のように表すことができる。まず式(8)を変形する。
y=θTX …式(9)
但し、
| 1, 1,…, 1 |
|x1(1),x2(1), ...,xN(1)|
|x1(2),x2(2), ...,xN(2)|
X= | ... | …式(10)
| ... |
|x1(D),x2(D), ...,xN(D)|
θ=(θ2,θ1(1),θ1(2),…,θ1(D))T …式(11)
この式(11)のパラメタθに対する推定式は次のように与えられる。
θ=(XXT-1XYT …式(12)
しかし、サンプルベクトルの2つの成分の相関が強い場合は、行列XXTが特異に近くなり、式(12)によって得られるパラメタベクトルの精度が劣化することが知られている。
このような劣化を防止する技術として、非特許文献2及び非特許文献3には、主成分回帰分析法(PCR)及び部分最小2乗法(PLS)が開示されている。これらはそれぞれ、主成分の分析を利用し、またXの分散を最大化するという評価基準で部分空間の基底を選択し、それを基に回帰分析を行うものである。具体的には、パラメタの推定式は次のように表される。
θ=VS-1TT …式(13)
上式(13)において、V,S及びUは、Xの特異値分解により得られる行列である。
X=USVT …式(14)
いまサンプルベクトルを構成する各成分間の相関が弱ければ上述の式(12)を用いて回帰パラメタを推定できる。しかし、相関の強い複数の成分が存在する場合は、上記式(13)を用いて回帰パラメタを推定することができる。
しかし、最小2乗法に基づくパラメタ推定方法で得られた推定値には一致性がない。即ち、サンプル数をいくら多くしても、真の値との誤差が残ることが知られている。従って、式(12)或いは式(13)で推定されたパラメタは、サンプル数をいくら増やしても真の値との間で誤差が残るという問題がある。
一方、非特許文献4は、式(15)でモデル化される単回帰分析に対するパラメタ推定のための評価関数を式(16)で表すことによって、新たなパラメタ推定方法を開示している。
y=θ1x …式(15)
L=(Y−θ1TX)(Y−θ1TX)T/(1+θ12) …式(16)
この式(16)をパラメタθ1で偏微分することにより、以下の式(17)で示すような、パラメタ推定式が得られる。
θ1={−(Sxx−Syy)±((Sxx−Syy)2+4Sxy)1/2}/(2Sxy) …式(17)
パラメタの推定値は、式(17)の2次方程式の解として得られる2つのうち適切な方、例えば推定誤差が小さい方を選択すれば良い。このパラメタ推定方法で得られた推定値は一致性を持つ。
特開平6−110504号公報 特開平6−117932号公報 特開平6−301669号公報 特開平6−350843号公報 特開平7−017346号公報 S. K. Kachigan :「Multivariate Statistical Analysis」, Radius, ( 1991 ). W. Wu, R. Manne :「Fast regression methods in a Lanczos ( or PLS-1 ) basis. Theory and applications」, Chemometrics and intelligent laboratory systems, 51, pp.145-161 ( 2000 ). R. Ergon :「Informative PLS score-loading plots for process understanding and monitoring」, Journal of Process Control, 14, pp.889-897 (2004). 甘利、川鍋:「線形関係の推定−最小2乗法は最良であるのか?」応用数理, vol.6, no.2, pp.96-109 (JUN. 1996).
しかしながら上記従来技術には以下に述べるような問題があった。
非特許文献4に開示された、式(16)の評価関数に基づくパラメタの推定方法は、式(17)に示す単回帰モデルでシフト項のないものが使用されたに過ぎず、シフト項を含む単回帰モデル、更には一般の重回帰モデルに対する評価関数及びパラメタ推定方法について考慮されていない。
本願発明の目的は上記従来技術の欠点を解消することにある。
上記目的を達成するために本発明の一態様に係る回帰分析方法は以下のような工程を備える。即ち、
多変量データから目的変数を求めるために重回帰分析を行って回帰係数を求める重回帰分析方法であって、
前記多変量データと目的変数との組み合わせからなる行列の分散共分散行列を求める工程と、
前記分散共分散行列を固有値分解することによって複数の固有値及び対応する固有ベクトルを計算するベクトル計算工程と、
前記複数の固有値より絶対値の大きい順に累積寄与率を計算する計算工程と、
所定値を超える前記累積寄与率に対応する前記固有値及び固有ベクトルから回帰係数を算出する算出工程と、を有することを特徴とする。
上記目的を達成するために本発明の一態様に係る回帰分析装置は以下のような構成を備える。即ち、
多変量データから目的変数を求めるために重回帰分析を行って回帰係数を求める重回帰分析装置であって、
前記多変量データと目的変数との組み合わせからなる行列の分散共分散行列を求める手段と、
前記分散共分散行列を固有値分解することによって複数の固有値及び対応する固有ベクトルを計算するベクトル計算手段と、
前記複数の固有値より絶対値の大きい順に累積寄与率を計算する計算手段と、
所定値を超える前記累積寄与率に対応する前記固有値及び固有ベクトルから回帰係数を算出する算出手段と、を有することを特徴とする。
尚、この課題を解決するための手段は、本願発明の特徴の全てを列挙しているものではなく、特許請求の範囲に記載された他の請求項及びそれら特徴群の組み合わせも発明になり得る。
本発明によれば、変数ベクトルの分散共分散行列が正則な場合はもちろん、特異に近い場合でも、従来技術より精度が良く、更にサンプル数の増加に伴って真の値に近づいていく推定値を与えることが可能になった。
以下、添付図面を参照して本発明の好適な実施の形態を詳しく説明する。尚、以下の実施の形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施の形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
図1は、本発明の実施の形態に係る情報処理装置(コンピュータ機器)により実行される処理の流れを説明するフローチャートである。
図2は、本実施の形態に係る情報処理装置(コンピュータ機器)の機能構成を示すブロック図である。
まず図2を参照して、この情報処理装置(コンピュータ機器)の構成を説明する。
図中、CPU201は、一次記憶装置204に記憶されているプログラムに従って、この装置全体の動作を制御している。表示装置202は、液晶やプラズマ、或はCRT等の表示装置で、処理対象のデータや演算結果、ユーザへのメッセージ、エラーなどの表示を行う。入力装置203は、例えばキーボードやポインティングデバイスデバイス(マウス)等を含み、ユーザにより操作されて、この装置にデータを入力したり各種コマンドの入力などに使用される。一次記憶装置204はRAMなどのメモリを含み、アプリケーションプログラムの実行時、CPU201により実行されるアプリケーションプログラムが二次記憶装置205からこの一次記憶装置204にロードされて実行される。またこの一次記憶装置204にはOSもロードされている。更に、一次記憶装置204は、CPU201による制御処理の実行時に、各種データを一時的に保存するためのワークエリアも提供している。2次記憶装置205は、予めインストールされたOSやアプリケーションプログラムなどを記憶しており、実行時に、それらプログラムが読み出されて一次記憶装置204にロードされる。この二次記憶装置205は、例えばハードディスク、MO等を備えている。通信装置206は、LANやインターネット等と接続し、これらネットワークとの間でデータのやり取りを行う。バスライン207は、上述した各部同士を接続するためのバスである。
尚、本実施の形態に係る処理を実行するプログラムは、予め2次記憶装置205に格納されており、入力装置203或いは通信装置206等からのコマンド入力によって一次記憶装置204にロードされ、CPU201の制御の下で実行される。
本実施の形態では、予め設定した線形係数パラメタベクトルθ1とシフトパラメタθ2に基づいて得られるサンプルベクトルxj及びサンプルyjの集合{(yj,xj)}jに対して、従来技術及び本実施の形態に係る回帰分析を実施し、これにより得られた推定値を比較検討する。
サンプルベクトルxjの集合は以下のようにして算出される。
1.一様乱数randに適当な正実数C0をかけてξjを算出する。
ξj=C0 rand …式(18)
2.上記ξjに、標準正規分布に従う観測ノイズを付加してサンプルベクトルxjを得る。
xj=ξj+N(0,ε2) …式(19)
3.ξjの線形関数としてζjを算出する。
ζj=θ1Tξj+θ2 …式(20)
4.サンプルyjは、ζjに標準正規分布に従う観測ノイズを付加することによって得られる。
yj=ζj+N(0,ε2) …式(21)
5.上記1から4の処理を繰り返すことによって、サンプルベクトルxjとサンプルyjの組の集合{(yj,xj)}jを得る。
以下、本実施の形態に係る処理の流れを図1のフローチャートを参照して説明する。
まずステップS101で、サンプルベクトルxi=(xi(1),xi(2),…,xi(d))Tとサンプルyiとから新たな変数ベクトルziを次式(22)により作成する。
zi=(yi,xi(1),xi(2),…,xi(d))T …式(22)
次にステップS102で、このサンプルベクトルziから、zi(i=1,…,d+1)の平均ベクトル<z>を減じて得られるベクトル(zi−<z>)を横に並べて得られる行列Zを求める。これは、
Z=(z1−<z>,z2−<z>,…,zd+1−<z>) …式(23)
で得られる。
これにより、以下の式(24)に従って分散共分散行列Rを作成する。
R=ZZT …式(24)
次にステップS103で、分散共分散行列Rの固有値λi及び対応する固有ベクトルqi(i=1,…,d+1)を算出する。
ここで、この固有値λi及び対応する固有ベクトルqiは、固有値λiの絶対値の大きい順に並べられているとする。
次にステップS104で、各固有値λiに対応する累積寄与率ηk を、
j=k j=d+1
ηk =(Σλj)/(Σλj) …式(4)
j=1 j=1
により算出する。
次にステップS105では、予め設定された有効累積寄与率ηCを超える累積寄与率をサーチし(これをηjとする)、そのときの固有値λj+1に対応する固有ベクトルqj+1をζ1(j)に格納する。
次にステップS106では、
θ1=(ζ1(2)/ζ1(1),ζ1(3)/ζ1(1),…,ζ1(d+1)/ζ1(1))T …式(1)
よりパラメタθ1を推定する。また、
θ2=<y>−θ1T<x> …式(2)
よりパラメタθ2を推定する。但し、ここで<y>はyのサンプル平均値である。
図6は、上述したサンプルベクトルxi、サンプルyi、変数ベクトルzi、その平均<z>、分散共分散行列Rと、その固有値λi、固有ベクトルqi、累積寄与率ηk等が一次記憶装置204に記憶されている状態を説明する図である。
図3(A)〜(H)及び図4(A)〜(H)は、本実施の形態に基づく推定結果を説明する図である。図において、横軸がサンプル数、縦軸が各方法による推定値と真の値との誤差のノルムを示している。
図中、301及び401で示す線は最小2乗法による結果を、一点鎖線302及び402はPCR法による結果を示している。また実線303及び403は、PLS法による結果を示している。更に、点線304及び404は、本実施の形態に係る結果を示している。尚、図3及び図4では、参照番号301〜304,401〜404は簡略化のために他の図3及び図4の(A)〜(C),(E)〜(H)では省略しているが、これらの図においても同様な意味を持っている。
図3(A)〜(H)はサンプルベクトルの次元が5次元の場合を示し、図4(A)〜(H)は10次元の場合を示している。各図3及び図4において、(A),(B),(C),(D)は変数ベクトルの分散共分散行列Rが正則な場合を示している。また(E),(F),(G),(H)は、分散共分散行列Rが特異に近い場合の結果を示している。また(A)は、シフトパラメタθ2、(B)は、線形係数パラメタベクトルθ1に対する結果を示している。
図3(A),(C)及び図4(A),(C)より、分散共分散行列Rが正則な場合のシフトパラメタθ2に対する推定値は、全ての方法で同等の精度が得られていることがわかる。
また図3(B)及び(D)及び図4(B)及び(D)より、分散共分散行列Rが正則な場合の線形係数パラメタベクトルθ1に対する推定値は、点線(304,404)で示す本実施の形態が最も良いことが分かる。次いで実線(303,403)で示すPLS法、最小2乗法(301,401)、PCR法(302,402)の順となっている。
一方、図3(E),(G)と図4(E),(G)より、分散共分散行列Rが特異に近い場合のシフトパラメタθ2に対する推定値は、全ての方法で同等の精度が得られている。
また図3(F),(H)と図4(F),(H)より、分散共分散行列Rが特異に近い場合の線形係数パラメタベクトルθ1に対する推定値は、本実施の形態の場合が最も良いことが分かる。そして、次いでPLS法、最小2乗法、PCR法の順となっている。
更に、線形係数パラメタベクトルの推定誤差において、本実施の形態に係る推定値(304,404)のみが、サンプル数の増加に伴って(グラフの右方向)推定誤差を減少させる傾向にあることが確認できる。
ここでは、「LJ. Peterson, RW. Johnson, CJ. Kerk: "Exploring Relationships in Body Dimensions," Journal of Statistics Education, Vol.11, No.2 (2003)で取り扱われている被験者の身長及び体重の回帰分析を行った。
データファイルには男性247人と女性260人の身体各部の寸法及び体重が記載されている。
図5は、これら男性と女性の身長及び体重の分布例を示す図である。図において,横軸は身長を示し、縦軸は体重を示している。そして○は男性、△は女性のデータを示している。
これらの内、男性247人の身長及び体重のデータを用いて線形回帰分析を行い、身長を体重の一次関数として表現するためのパラメタを推定した。
身長=(パラメタ1(θ1))×体重+(パラメタ2(θ2)) …式(25)
そして、この式(25)を用いて、女性の体重から女性の身長を推定し、正しい値との誤差の絶対値の平均を算出した。表1は、従来方法と本実施の形態に係る方法に対する推定パラメタ値及び誤差の絶対値の平均値を示している。但し、身長と体重は式(25)で関連付けられているとする。
Figure 2007328744
この表1より、従来技術としての3方式は推定パラメタ1,パラメタ2が全て同じ値である。従って誤差の絶対値の平均も同じ値になっている。
一方、本実施の形態に係る方式を用いると、パラメタ1及びパラメタ2の推定値が従来方式と異なっている。その結果、誤差の絶対値の平均が従来の3つの方式よりも小さくなっていることが確認できる。
このように本実施の形態に係る方式によれば、線形回帰分析における推定の精度が向上できる。
以上説明したように本実施の形態によれば、変数ベクトルの分散共分散行列Rが正則な場合はもちろん、特異に近い場合でも、従来技術よりも精度が良くなっている。
更に、サンプル数の増加に伴って真の値に近づいていく推定値を与えることが可能になった。
(他の実施形態)
以上、本発明の実施形態について詳述したが、本発明は、複数の機器から構成されるシステムに適用しても良いし、また一つの機器からなる装置に適用しても良い。
なお、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラムを、システム或いは装置に直接或いは遠隔から供給し、そのシステム或いは装置のコンピュータが該供給されたプログラムを読み出して実行することによっても達成され得る。その場合、プログラムの機能を有していれば、形態は、プログラムである必要はない。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明のクレームでは、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記録媒体としては、様々なものが使用できる。例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などである。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページからハードディスク等の記録媒体にダウンロードすることによっても供給できる。その場合、ダウンロードされるのは、本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルであってもよい。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明のクレームに含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布する形態としても良い。その場合、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムが実行可能な形式でコンピュータにインストールされるようにする。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される形態以外の形態でも実現可能である。例えば、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
更に、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれるようにしてもよい。この場合、その後で、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によって前述した実施形態の機能が実現される。
本発明の実施の形態に係る情報処理装置(コンピュータ機器)により実行される処理の流れを説明するフローチャートである。 本実施の形態に係る情報処理装置の機能構成を示すブロック図である。 本実施の形態に基づく推定結果を説明する図である。 本実施の形態に係る男性と女性の身長及び体重の分布例を示す図である。 実施の形態の計算に用いるサンプル、変数、計算結果などが一次記憶装置に記憶されている状態を説明する図である。

Claims (12)

  1. 多変量データから目的変数を求めるために重回帰分析を行って回帰係数を求める重回帰分析方法であって、
    前記多変量データと目的変数との組み合わせからなる行列の分散共分散行列を求める工程と、
    前記分散共分散行列を固有値分解することによって複数の固有値及び対応する固有ベクトルを計算するベクトル計算工程と、
    前記複数の固有値より絶対値の大きい順に累積寄与率を計算する計算工程と、
    所定値を超える前記累積寄与率に対応する前記固有値及び固有ベクトルから回帰係数を算出する算出工程と、
    を有することを特徴とする回帰分析方法。
  2. 前記所定値を超える前記累積寄与率に対応する前記固有値及び固有ベクトルの番号を、固有値の絶対値の大きい順にj番目とし(j+1)番目の固有ベクトルをζ1(j+1)としたとき、前記算出工程では、以下の式(1)(2)を用いて前記回帰係数(θ1及びθ2)を算出することを特徴とする請求項1に記載の回帰分析方法。
    ここでθ1=(ζ1(2)/ζ1(1),ζ1(3)/ζ1(1),…,ζ1(d+1)/ζ1(1))T
    …式(1)
    θ2=<y>−θ1T<x> …式(2)
    ここで、<x>,<y>のそれぞれは、x,yのサンプル平均値である。
  3. 前記回帰計数は、d次元変数ベクトルxj=(xj(1),xj(2),…,xj(d))Tの集合X={x1,x2,…,xN}と、1次元変数yjの集合Y={y1,y2,…,yN}に対して、y=θ1Tx+θ2となる関係を有することを特徴とする請求項1又は2に記載の回帰分析方法。
  4. 前記ζ1(1)と、予め設定された正の実数とを比較し、前記ζ1(1)の方が小さい場合に、前記回帰係数の算出が不可能であると判定する工程を更に有することを特徴とする請求項2に記載の回帰分析方法。
  5. 前記計算工程は、前記固有値{λ1,λ2,…,λ(d+1}及び前記固有ベクトル{q1,q2,…,qd+1}から、以下の式(3)を用いて、前記累積寄与率が計算されることを特徴とする請求項2に記載の回帰分析方法。
    j=k j=d+1
    ηk :=(Σλj)/(Σλj) …式(3)
    j=1 j=1
  6. 前記算出工程は、前記累積寄与率が前記所定値を超えるkを求め、当該kを前記式(1)(2)のζ1(j)に代入して前記回帰係数を算出することを特徴とする請求項5に記載の回帰分析方法。
  7. 多変量データから目的変数を求めるために重回帰分析を行って回帰係数を求める重回帰分析装置であって、
    前記多変量データと目的変数との組み合わせからなる行列の分散共分散行列を求める手段と、
    前記分散共分散行列を固有値分解することによって複数の固有値及び対応する固有ベクトルを計算するベクトル計算手段と、
    前記複数の固有値より絶対値の大きい順に累積寄与率を計算する計算手段と、
    所定値を超える前記累積寄与率に対応する前記固有値及び固有ベクトルから回帰係数を算出する算出手段と、
    を有することを特徴とする回帰分析装置。
  8. 前記所定値を超える前記累積寄与率に対応する前記固有値及び固有ベクトルの番号をjとし(j+1)番目の固有ベクトルをζ1(j+1)としたとき、前記算出手段では、以下の式(1)(2)を用いて前記回帰係数(θ1及びθ2)を算出することを特徴とする請求項7に記載の回帰分析装置。
    ここでθ1=(ζ1(2)/ζ1(1),ζ1(3)/ζ1(1),…,ζ1(d+1)/ζ1(1))T
    …式(1)
    θ2=<y>−θ1T<x> …式(2)
    ここで、<x>,<y>のそれぞれは、x,yのサンプル平均値である。
  9. 前記回帰計数は、d次元変数ベクトルxj=(xj(1),xj(2),…,xj(d))Tの集合X={x1,x2,…,xN}と、1次元変数yjの集合Y={y1,y2,…,yN}に対して、y=θ1Tx+θ2となる関係を有することを特徴とする請求項7又は8に記載の回帰分析装置。
  10. 前記ζ1(1)と、予め設定された正の実数とを比較し、前記ζ1(1)の方が小さい場合に、前記回帰係数の算出が不可能であると判定する手段を更に有することを特徴とする請求項8に記載の回帰分析装置。
  11. 前記計算手段は、前記固有値{λ1,λ2,…,λ(d+1}及び前記固有ベクトル{q1,q2,…,qd+1}から、以下の式(3)を用いて前記累積寄与率が計算されることを特徴とする請求項8に記載の回帰分析装置。
    j=k j=d+1
    ηk :=(Σλj)/(Σλj) …式(3)
    j=1 j=1
  12. 前記算出手段は、前記累積寄与率が前記所定値を超えるkを求め、当該kを前記式(1)(2)のζ1(j)に代入して前記回帰係数を算出することを特徴とする請求項11に記載の回帰分析装置。
JP2006161636A 2006-06-09 2006-06-09 回帰分析方法及びその装置 Pending JP2007328744A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006161636A JP2007328744A (ja) 2006-06-09 2006-06-09 回帰分析方法及びその装置
US11/757,545 US7610169B2 (en) 2006-06-09 2007-06-04 Regression analysis apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006161636A JP2007328744A (ja) 2006-06-09 2006-06-09 回帰分析方法及びその装置

Publications (2)

Publication Number Publication Date
JP2007328744A true JP2007328744A (ja) 2007-12-20
JP2007328744A5 JP2007328744A5 (ja) 2009-07-23

Family

ID=38822954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006161636A Pending JP2007328744A (ja) 2006-06-09 2006-06-09 回帰分析方法及びその装置

Country Status (2)

Country Link
US (1) US7610169B2 (ja)
JP (1) JP2007328744A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014041566A (ja) * 2012-08-23 2014-03-06 Nippon Telegr & Teleph Corp <Ntt> 線形回帰モデル推定装置、方法、及びプログラム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100017023A (ko) * 2008-08-05 2010-02-16 삼성전자주식회사 화상형성장치 및 그의 어플리케이션 제어방법
US8527327B1 (en) 2010-03-21 2013-09-03 Mark Lawrence Method and apparatus to manage project control
KR101803906B1 (ko) * 2011-11-30 2017-12-05 에스프린팅솔루션 주식회사 복수의 플랫폼이 설치된 화상형성장치 및 그 어플리케이션 실행 방법
US20140372174A1 (en) 2013-06-12 2014-12-18 MEE - Multidimensional Economic Evaluators LLC Multivariate regression analysis
CN106504226B (zh) * 2016-09-26 2019-07-19 深圳大学 超声图像膀胱脱垂自动分级系统
CN106844872B (zh) * 2016-12-27 2020-02-14 东软集团股份有限公司 确定系统预热时间的方法和装置
CN111639777B (zh) * 2019-03-01 2023-09-29 京东科技信息技术有限公司 估计目标体重的方法和装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3035089B2 (ja) 1992-09-25 2000-04-17 松下電工株式会社 プロセスの特性推定方法およびその装置ならびにその推定方法を用いたプロセスの監視方法およびプロセスの制御方法
JPH06117932A (ja) 1992-10-02 1994-04-28 Nippon Kayaku Co Ltd 微小色見本のコンピュ−タカラ−マッチング
JPH06301669A (ja) 1993-04-16 1994-10-28 N T T Data Tsushin Kk 積雪量推定装置
JPH06350843A (ja) 1993-06-03 1994-12-22 Toppan Printing Co Ltd 多色画像再現色濃度予測式決定方法及び装置
JPH0717346A (ja) 1993-06-30 1995-01-20 Toyota Motor Corp 車両衝突防止装置及び路面摩擦係数演算装置
US5641962A (en) * 1995-12-05 1997-06-24 Exxon Research And Engineering Company Non linear multivariate infrared analysis method (LAW362)
WO2003098677A1 (fr) * 2002-05-16 2003-11-27 Tokyo Electron Limited Procede de prediction d'etat de dispositif de traitement ou de resultat de traitement
JP4464276B2 (ja) * 2002-08-13 2010-05-19 東京エレクトロン株式会社 プラズマ処理方法及びプラズマ処理装置
JP2004335841A (ja) * 2003-05-09 2004-11-25 Tokyo Electron Ltd プラズマ処理装置の予測装置及び予測方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014041566A (ja) * 2012-08-23 2014-03-06 Nippon Telegr & Teleph Corp <Ntt> 線形回帰モデル推定装置、方法、及びプログラム

Also Published As

Publication number Publication date
US20070288199A1 (en) 2007-12-13
US7610169B2 (en) 2009-10-27

Similar Documents

Publication Publication Date Title
JP2007328744A (ja) 回帰分析方法及びその装置
Hyndman Measuring forecast accuracy
Bardow et al. Incremental and simultaneous identification of reaction kinetics: methods and comparison
JP5988419B2 (ja) 予測方法、予測システムおよびプログラム
Transtrum et al. Optimal experiment selection for parameter estimation in biological differential equation models
US20210232957A1 (en) Relationship analysis device, relationship analysis method, and recording medium
US11216534B2 (en) Apparatus, system, and method of covariance estimation based on data missing rate for information processing
Döhler et al. Operational modal analysis using a fast stochastic subspace identification method
Pokropek Missing by design: Planned missing-data designs in social science
US8781672B2 (en) System and method for importance sampling based time-dependent reliability prediction
US20210224664A1 (en) Relationship analysis device, relationship analysis method, and recording medium
Nidsunkid et al. The effects of violations of the multivariate normality assumption in multivariate Shewhart and MEWMA control charts
Sanchez-Marquez et al. Multivariate SPC methods for controlling manufacturing processes using predictive models–A case study in the automotive sector
JP6012860B2 (ja) 作業時間推定装置
Bansal et al. A new stochastic simulation algorithm for updating robust reliability of linear structural dynamic systems subjected to future Gaussian excitations
Krenk et al. Turbulent wind field representation and conditional mean-field simulation
Terry et al. Widespread analytical pitfalls in empirical coexistence studies and a checklist for improving their statistical robustness
CN113360983A (zh) 一种边坡可靠度分析与风险评估方法
Mehtätalo An algorithm for ensuring compatibility between estimated percentiles of diameter distribution and measured stand variables
WO2019235608A1 (ja) 分析装置、分析方法および記録媒体
Ward et al. Multivariate estimation using log ratios: a worked alternative
Hassani et al. Degrees of freedom estimation in principal component analysis and consensus principal component analysis
JP7074194B2 (ja) 情報処理装置、制御方法、及びプログラム
Höskuldsson H‐methods in applied sciences
WO2016017171A1 (ja) 流量予測装置、混合比推定装置、方法およびコンピュータ読み取り可能記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090608

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090608

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100419

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100510