JP2006338123A

JP2006338123A - 非線形写像学習コンピュータプログラム、および記録媒体

Info

Publication number: JP2006338123A
Application number: JP2005159328A
Authority: JP
Inventors: Yasuyuki Nakamura; 恭之中村; Toshikazu Wada; 俊和和田
Original assignee: Wakayama University
Current assignee: Wakayama University
Priority date: 2005-05-31
Filing date: 2005-05-31
Publication date: 2006-12-14

Abstract

【課題】新たな非線形写像の学習法を提案すること。
【解決手段】ｐ個の説明変量ｘで説明されるｑ個の目的変量をｙとし、これらのデータがｎ個得られたとする。このデータの集まりを、データ集合Ｄとしたとき、説明変量ｘと目的変量ｙの間の写像関係Ｆを、複数の線形関数φ_iで、ｙ＝φ_i（ｘ）と近似して求めるコンピュータプログラムであって、主ルーチンでは、サンプルデータのデータベースの全学習データＤを読みだして、サブルーチンPLM-Approx(Ｄ)を実行する。サブルーチンPLM-Approx(データ集合Ｄ)では、データ集合Ｄに対して主成分回帰分析法により線形近似し、データ集合Ｄが近似終了条件を満たすなら終了する。データ集合Ｄが近似終了条件を満たさないときは、データ集合Ｄに対して分割テストサブルーチンSplit-Data（Ｄ，Ｄ₁，Ｄ₂）を行い、データ集合ＤをＤ₁とＤ₂に分割する。
【選択図】図１

Description

本発明は、事象と事象との間にある因果関係を、事象間にある相関関係としてとらえ、そのような非線形写像を学習するコンピュータプログラム、および記録媒体に関するものである。

従来より、事象と事象との間にある関係を物理則に基づく因果関係としてとらえ、それを数理モデルで表現する研究が数多く行われてきた。
しかし、そのような方法で現実世界で起きる様々な事象を記述しようとすると、
法則やルールが非常に複雑且つ膨大になってしまうという問題や、そもそも因果関係を解きあかすことが非常に困難な問題が多数存在するという問題に直面することになり、結局は現実世界での知的な行動を実現するシステムは構築できないことになってしまう。
このような場合に、因果関係を数理モデルで表現しなくても、「こうすれば、こうなる」という相関関係のみを学習しておけば、現実世界での知的な活動はある程度のレベルまで実現できるはずである。
また、一般的に、そのような相関関係を事象間の非線形写像として考えても良い。

このような相関関係、すなわち非線形写像の学習はセンサ情報と現在の状態から次の行動指令を決定する制御の問題、連続特徴ベクトルから離散クラスラベルへの写像を求めるパターン認識の問題をはじめとして数多くの分野で必要とされる根本的技術である。

これまで提案されてきた非線形写像の学習法は、ニューラルネットワーク（ＮＮ）法や、Groupe Method of Data-Handling（ＧＭＤＨ）法、そして、事例そのものを記憶しておくｋ近傍（ｋ−ＮＮ）法、入力空間を再帰的に分割して、その分割を木構造で表し、木の終端ノードに写像先の値を格納しておく方法（回帰木）等が主なものである。（例えば、非特許文献１〜５）

（参考文献１） Rumelhart D. E., Hinton G. E., Williams R. J.: "Learning representations by back-propagation errors," Nature 323(1986), pp. 533-536. （参考文献２） Ivakhnenko, A.G.: "Polynomial theory of complex systems," EEE Transactions on Systems, Man, and Cybernetics, pp. 364-378, 1971. （参考文献３） T. Poggio and F. Girosi.: "Networks for approximation and learning," Proceedings of the IEEE, 78(9), pp.1481--1497, September 1990. （参考文献４） Duda,R.O., Hart,P.E.: "Pattern Classification and Scene Analysis," New York, Wiley, 1973. （参考文献５） L. Breiman, J. H. Friedman, R. A. Olshen, and C. J. Stone: "Classification and Regression Trees," Chapman & Hall, New York, 1984.

しかし、上述したような従来の手法には次のような問題がある。
（１）ＮＮ，ＧＭＤＨ法では、
ネットワークの構築を決定するためのパラメータが多く、複雑な写像を学習する場合、ネットワークの初期重み係数値を適切に設定しないと学習が収束しない。また、収束する場合でも、収束するまでの時間が長い。
データ毎に非線形写像の近似精度が保障できない。
（２）ｋ−ＮＮ法では、
入力次元数が大きい場合に、複数の類似事例を検索する（ｋ近傍検索）処理に多大な時間を費やしてしまい写像の計算が高速に行えない。
大量のデータをそのまま記憶しておく必要があり、大量のメモリを消費してしまう。
（３）回帰木では、
回帰木の計算ではデータからのルール発見を主な目的としていたため、一般にルールが複雑化する多次元ベクトル空間を値域とする拡張はほとんど検討されてこなかった。入力空間の分割方法が多様であり、簡便且つ信頼性の高い手法が存在しない。
このような問題があるため、ｐ次元ベクトルからｑ次元ベクトルへの一般的な非線形写像の学習が現実の場面で用いられる機会は非常に限られていた。

そこで、本発明は、上述の問題点を克服した新たな非線形写像の学習法を提案するものであり、基本的なアイデアは、出力変数としてスカラー量のみを扱うだけでなくベクトル量も扱えるようにすることと、さまざまな調整パラメータを廃して許容される推定誤差に関するパラメータを与えるのみで写像が推定できるようにすることである。

本発明にかかる非線形写像学習コンピュータプログラムは、
ｐ個の説明変量ｘ＝（x₁，x₂，・・・・x_p）で説明されるｑ個の目的変量をｙ＝（y₁，y₂，・・・・y_q）とし、これらのデータがｎ個得られたとする。このデータの集まりを、データ集合Ｄとしたとき、説明変量ｘと目的変量ｙの間の写像関係Ｆを、
複数の線形関数φ_iで、
ｙ＝φ_i（ｘ）：ｉ＝１〜ＮＢ（このとき、ＮＢは、入力空間が分割して生成された分割空間の数である。）
と近似して求めるコンピュータプログラムであって、次の主ルーチンとサブルーチンとからなる処理手順から構成されている。
主ルーチン
１．サンプルデータのデータベースの全学習データＤを読みだす。
２．サブルーチンPLM-Approx(Ｄ)を実行する。
サブルーチンPLM-Approx(データ集合Ｄ)
１．データ集合Ｄに対して主成分回帰分析法により線形近似する。
２．データ集合Ｄが近似終了条件を満たすなら終了する。
３．データ集合Ｄが近似終了条件を満たさないときは、
データ集合Ｄに対して分割テストサブルーチンSplit-Data（Ｄ，Ｄ₁，Ｄ₂）を行い、データ集合ＤをＤ₁とＤ₂に分割する。
４．データ集合Ｄ₁に対してサブルーチンPLM-Approx(Ｄ₁)を実行する。
５．データ集合Ｄ₂に対してサブルーチンPLM-Approx(Ｄ₂)を実行する。
分割テストサブルーチンSplit-Data（データ集合Ｄ，Ｄ₁，Ｄ₂）
１．データ集合Ｄの分布を調べ、分布の幅が最大の次元d_maxを見つける。
２．前記最大の次元d_maxに垂直な超平面により、データ集合Ｄをデータ数が等しくなるように２つに分割するため、この超平面を表す値x_dmax＝Ｃを求め、データ集合Ｄ₁，Ｄ₂に分割する。
ここで、近似終了条件は、
１．近似誤差が許容範囲内である。
２．データ数｜Ｄ｜が全学習データに対して十分小さい。
とする。
なお、本発明は次のように表現することもできる。
すなわち、ｐ個の説明変量ｘ＝（x₁，x₂，・・・・x_p）で説明されるｑ個の目的変量をｙ＝（y₁，y₂，・・・・y_q）とし、これらのデータがｎ個得られたとする．このデータの集まりを、データ集合Ｄとしたとき、説明変量ｘと目的変量ｙの間の写像関係Ｆを、
複数の線形関数φ_iで、
ｙ＝φ_i（ｘ）：ｉ＝１〜ＮＢ（このとき、ＮＢは、入力空間が分割して生成された分割空間の数である。）
と近似して求めるようにコンピュータを制御する方法であって、次の処理手順からなる制御方法。
１．サンプルデータのデータベースの全学習データＤを読みだす。
２．サブルーチンPLM-Approx(Ｄ)を実行する。
なお、前記サブルーチンPLM-Approx(データ集合Ｄ)は以下の手順からなる。
１．データ集合Ｄに対して回帰分析法により線形近似する。
２．データ集合Ｄが近似終了条件を満たすなら終了する。
３．データ集合Ｄが近似終了条件を満たさないときは、
データ集合Ｄに対して分割テストサブルーチンSplit-Data（Ｄ，Ｄ₁，Ｄ₂）を行い、データ集合ＤをＤ₁とＤ₂に分割する。
４．データ集合Ｄ₁に対してサブルーチンPLM-Approx(Ｄ₁)を実行する。
５．データ集合Ｄ₂に対してサブルーチンPLM-Approx(Ｄ₂)を実行する。
なお、前記分割テストサブルーチンSplit-Data（データ集合Ｄ，Ｄ₁，Ｄ₂）は以下の手順からなる。
１．データ集合Ｄの分布を調べ、分布の幅が最大の次元d_maxを見つける。
２．前記最大の次元d_maxに垂直な超平面により、データ集合Ｄをデータ数が等しくなるように２つに分割するため、この超平面を表す値x_dmax＝Ｃを求め、データ集合Ｄ₁，Ｄ₂に分割する。
ここで、近似終了条件は、
１．近似誤差が許容範囲内である。
２．データ数｜Ｄ｜が全学習データに対して十分小さい。
とする。
また、次のようなコンピュータプログラムが記録されたコンピュータで読み取り可能な記録媒体である。
すなわち、ｐ個の説明変量ｘ＝（x₁，x₂，・・・・x_p）で説明されるｑ個の目的変量をｙ＝（y₁，y₂，・・・・y_q）とし、これらのデータがｎ個得られたとする．このデータの集まりを、データ集合Ｄとしたとき、説明変量ｘと目的変量ｙの間の写像関係Ｆを、
複数の線形関数φ_iで、
ｙ＝φ_i（ｘ）：ｉ＝１〜ＮＢ（このとき、ＮＢは、入力空間が分割して生成された分割空間の数である。）
と近似して求めるコンピュータプログラムが記録されたコンピュータ読み取り可能な記録媒体であって、次の主ルーチンとサブルーチンとからなるコンピュータプログラムが記録されたコンピュータ読み取り可能な記録媒体。
主ルーチン；
１．サンプルデータのデータベースの全学習データＤを読みだす手順。
２．サブルーチンPLM-Approx(Ｄ)を実行する手順。
サブルーチンPLM-Approx(データ集合Ｄ)；
１．データ集合Ｄに対して回帰分析法により線形近似する手順。
２．データ集合Ｄが近似終了条件を満たすなら終了する手順。
３．データ集合Ｄが近似終了条件を満たさないときは、
データ集合Ｄに対して分割テストサブルーチンSplit-Data（Ｄ，Ｄ₁，Ｄ₂）を行い、データ集合ＤをＤ₁とＤ₂に分割する手順。
４．データ集合Ｄ₁に対してサブルーチンPLM-Approx(Ｄ₁)を実行する手順。
５．データ集合Ｄ₂に対してサブルーチンPLM-Approx(Ｄ₂)を実行する手順。
分割テストサブルーチンSplit-Data（データ集合Ｄ，Ｄ₁，Ｄ₂）；
１．データ集合Ｄの分布を調べ、分布の幅が最大の次元d_maxを見つける手順。
２．前記最大の次元d_maxに垂直な超平面により、データ集合Ｄをデータ数が等しくなるように２つに分割するため、この超平面を表す値x_dmax＝Ｃを求め、データ集合Ｄ₁，Ｄ₂に分割する手順。
ここで、近似終了条件は、
１．近似誤差が許容範囲内である。
２．データ数｜Ｄ｜が全学習データに対して十分小さい。
とする。

図１を参照して例示すると、
例えば、説明変量ｘと目的変量ｙがそれぞれ２、３次元ベクトルとして表現されている場合、入力空間が７個の部分空間に分割され、それぞれの分割空間におけるデータ集合に対して線形写像関数が求められているφ_i（ｉ＝１〜７）。
このとき、図2に示したような２分木構造が生成される。
本発明の学習アルゴリズムにより、上記例のように２分木構造のtreeが構築されるので、本アルゴリズムをPaLM-treeと称する。また、構築される木構造のこともPaLM-treeと称することにする。

本発明のコンピュータプログラムによれば、以下の効果が得られる。
１．多次元の入出力空間内に散在するデータ集合Ｄを、局在する入出力の組に分割して局所的な入出力関係を同定するので、データ単位の近似精度が保障でき、さらに、学習が収束するまでの時間を大幅に短縮できる。
２．当てはめ誤差に関する誤差基準を与えるだけで、データ集合Ｄの分割を決定し、局所的な入出力間の関係を同定するので、学習を制御するパラメータは少なくて済み、パラメータの初期設定値に依存して学習が収束しなくなることはない。
３．学習後において、ある入力状態が過去に経験した事例であるかないかや、学習時に十分な数の事例データを使用して学習されたかどうかを判定できる仕組みを持っているので、新たな入力状態に対して逐次的に学習することや、再学習することが可能である。

以下に、本発明にかかる非線形写像学習コンピュータプログラムを、各図を参照しながら詳細に説明する。
まず、図２に示したように、本発明によるPaLM-treeの中間ノードには、入力空間の分割に使用される超平面を表す値（dmax、Ｃ）（これを、分割基準値という。）が格納されている。終端ノードに到達するまで経由してきた中間ノードの遷移に従って、ある入力情報が入力空間内のある部分領域に分類される。つまり、PaLM-treeの終端ノードは入力空間内のある部分領域を表すことになる。（詳しくは後述する。）
また、終端ノードには、線形近似のための回帰係数行列Ｂと終端ノードが表す部分領域に含まれるデータ数ｎが格納されている。
学習後は、新規の入力に対して、まずPaLM-treeのルートノードから順次中間ノードに格納されている分割基準値に基づいて、どの終端ノードに属するかを判定する。
その後、その終端ノードに格納されている回帰係数行列を用いて、その入力値に対応する出力の近似値を生成する。

＜主成分回帰分析による線形近似＞
入力ベクトルx_i= (x_i1，x_i2，・・・・x_ip)^Tに対応する出力ベクトルをy_i= (y_i1，y_i2，・・・・y_ip)^Tとする。これらのデータ組が n 個得られたとき、全データは、
X = [x₁ ・・・ x_n ], Y = [y₁ ・・・ y_n ]
という２つの行列で表現することができる。B をp × q の係数行列としたとき、x_i に対する回帰式はB(x_i - x) + y と表すことができる。但し, x，y はそれぞれ x_i , y_i (I = 1・・・・n) の平均ベクトルである。
ここで、
X'= [x₁ - x , ・・・ x_n - x],
Y'= [y₁ - y , ・・・ y_n - y]
とし、誤差ベクトル e_i = y_i - B x_i を導入することによって、Y'= BX'+ Eという回帰式が得られる。但し, E= [e₁ ,・・・ e_n ] である。
この式において、X'を特異値分解した行列で置き換えるとY'= B(UDV^T) + E という式が得られるため、B = Y'VD^-1U と回帰係数を推定できる。この回帰係数の計算法は主成分回帰分析と呼ばれる方法であり、独立なデータ数が入力空間の次元数以下でも破綻することなく実行することができることが知られている。また、特異値分解によって計算された最大特異値と最小特異値の比が大きな値を持つ次元に関して、その特異値を零にすることにより、特徴選択を行うことが可能になるため、このような方法を採用している。

＜分割テスト＞
分割位置決定は、Horowits とPavlidisらによるSplit-and-Mergeアルゴリズムによる画像の領域分割法の根底にある考え方、すなわち、分割位置を厳密に決定するのではなく、とりあえず条件を満足するまで分割を行い、後から条件を満足する範囲内で領域をまとめれば、条件を満足する最大の領域が得られるという考え方に基づいた手法を採用している。
PaLM-tree では、各次元についてのデータの分布の幅を調べて、分布の幅が最長の次元を分割する軸として選択し、その分割軸に射影したデータの中央値を分割位置とする方法である。これにより、分割によってデータ数の偏りができるだけ起きないようにしている。
この分割によって得られた領域内のデータに対して回帰計算を行い、回帰誤差が指定された範囲内に収まるまで分割を再帰的に行う。分割が進むと部分領域内のデータ数が減少するが、このとき、データ数が入力空間の次元数以下になったり、データ数が少なすぎて入力変数間に非常に強い相関関係が出てきてしまったりして、一般的な回帰計算手法では計算できなくなるが、PaLM-tree では入力データを特異値分解(SVD) して一般化逆行列を求める回帰計算を行うこと(主成分回帰分析)でこの問題を解決している。
この分割が終了した後に、今度は隣接する部分領域内のデータを統合して、共通の回帰係数で写像が推定できるかどうか、すなわちMerge できるか否かを判定するために再び回帰計算を行う。この計算ではMerge によって新たな部分領域を生成するのではなく、各部分領域における回帰係数を共有化するようにしている。これにより、分割境界付近での写像推定値が不連続になる傾向を抑えている。

＜近似誤差の許容量＞
出力ベクトルを多次元に拡張し、p 次元からq 次元への写像F : Rp →Rq 一般を取り扱えるようにするためには、単純にスカラー値を出力する回帰木を組み合わせるだけでは実現できない。そのため、多次元ベクトルを出力するときの誤差評価を考え直さなければならない。単純に部分領域内での回帰誤差の平均値 1/n Σⁿ _i=1 || y_i - B x_i || を用いた場合には、次に示すような不都合が生じる。Y_i はq次元ベクトルであり、一つの部分領域内部で、ある成分は変動が大きく、ある成分は変動が小さいということが一般的に起こりうる。このため、変動の大きさを考慮した誤差評価を行わなければならない。出力ベクトルをy_i= (y_i1，y_i2，・・・・y_ip)^T としたとき、y_ijの偏差をσ_j と表すものとする。
このとき、
e _j = Σ_I|| y_ij - (B x_i )_j || /σ_j
とし、e = Σ_j e _j によって回帰誤差を評価する。これによって、各成分の変動幅の影響を受けにくい分割判定が行える。

＜シミュレーション＞
・関数近似性能の検証
ここでは、従来法としてＧＭＤＨ法、ＮＮ法を取り上げて、本発明の非線形写像学習コンピュータプログラムと、関数近似性能を比較した。正しい関数は図３(a)に示しているものである。図３(b),(c),(d)は、各手法のデータ毎の推定誤差を表している。
ＧＭＤＨ法(図３(c))、ＮＮ法(図３(d))では、関数の種類によっては近似誤差が１％以内に収束しないものもあったが、本発明によれば、全ての場合においてこの近似誤差条件を満たして学習が収束した(図３(b))。

・学習時間・近似速度の検証
ここでは、従来法としてｋ−ＮＮ法、ＮＦ−ＧＭＤＨ法、ＮＮ法を取り上げて、本発明の非線形写像学習コンピュータプログラムと、学習時間・近似速度を比較した。
ＮＦ−ＧＭＤＨ法、ＮＮ法では、初期重みパラメータの値の設定などが不適切で学習が収束しなかった場合もあった。ｋ−ＮＮ法では、一般的には汎化能力を持たせるためには近傍数を多く取る必要があり、その結果として、探索する近傍数が多くなるとＢＢＤ−tree内でバックトラックして探索することが多くなるため、近似速度が非常に遅くなる。本発明によれば、近傍事例はPaLM-treeの内部ノードによって高速に検出できるため、このような問題は起こらない。

＜応用実験＞
この実施例１では、本発明にかかる非線形写像学習コンピュータプログラムをカメラキャリブレーションへ適用した。
ここで扱うカメラは、自由曲面ミラーを搭載した全方位カメラとする。自由曲面ミラーは、画像処理することなく平面（地面や壁）を真上から見たような映像を、単眼カメラに広角レンズを装着したときと同等かそれ以上の視野を歪みなく撮影できるように設計されている。しかし、ミラーをカメラに対して慎重に取り付けないと、期待するような画像は得られず、その形状の特殊性が原因で、画像に非線形な歪みが生じてしまう。そこで、この歪みを除去するために提案手法を使用して、その推定性能を評価した。
図５に示したような環境内で、カメラ１２に自由曲面ミラー１１を搭載した全方位カメラ１０（図６参照）を用いて、この全方位カメラ１０のカメラ１２によって取得される画像（図７)内の点座標(2次元の入力情報)と実空間中の点座標（3次元の出力情報(ただし、平面上の点であるため実際には2次元の情報となる)）の対応関係を事例データとして保存する。保存された事例データを元にして、提案手法を用いて入出力間の関係を求めることにより、画像内の任意の点の座標を入力すれば、その点の実空間中の座標値が出力されるシステムを構築できる。
全事例データ数296個のうち、214個を学習に使用し、残りの82個については、学習によって生成されたPaLM-treeに入力してその推定性能を検証するために用いる。このデータを検証用データと呼ぶことにする。
図８は、画像内で取得された事例データの様子を示している。画像の端などで糸巻き型歪が生じていることが良く分かる。また、カメラの光軸とミラーの軸が傾いて取り付けられているためか、台形状の歪も生じていることが分かる。また、この図の中に提案手法によって分割された入力空間の様子も同時に表示してある。
図９は、学習時に推定された出力結果と実際のデータを重複させて表示させたグラフである。学習は、推定誤差が１％以下になるまで行った。この図を見れば分かるように、正確に推定できていることがわかる。また、図１０は検証用データを用いた推定結果を示している。このときの82個の検証データについての平均誤差は約1ｃｍであった。使用したカメラの計測範囲が、カメラを中心として床面上の300×200ｃｍの範囲であることを考慮すると、検証用データを用いた場合においても、正確に推定できていると言える。普通の全方位カメラや、広角レンズを付けたカメラにより取得される画像にも、大抵の場合、非線形な歪みが生じており、このようなカメラについても同様に、提案手法を用いることにより、画像内の座標値と実際の3次元座標値の間の非線形な関係を同定可能であると考えられる。なお、紙面の都合上掲載しなかったが、広角レンズを取り付けたカメラのキャリブレーション問題に提案手法を適用した場合においても、良好な結果が得られている

本発明の手法は、学習時間が非常に短いため、外界との相互作用により時々刻々と性能を改善していくような情報システムに応用可能であると考えられる。
また、本発明の手法は、近似速度が早いので、高速な応答が要求されるようなロボット制御にも適用可能であると考えられる。

本発明にかかる非線形写像学習コンピュータプログラムによる写像学習の例を説明する図である。本発明におけるPaLM-treeの2分木構造のノードを説明する図である。本発明と従来手法の関数近似性能に関する比較結果を説明する図である。本発明と従来手法の学習時間と推定時間に関する比較結果を説明する図である。本発明の応用実験の環境の説明図である。前記応用実験における自由曲面ミラーカメラの説明図である。前記応用実験における実際の事例データの説明図である。前記応用実験における事例データと本発明による空間分割結果のグラフである。前記応用実験における出力結果と実際のデータとを重複させたグラフである。検証用データを用いた近似結果のグラフである。

符号の説明

Ｃ・・・入力空間の分割に使用される超平面を表す値（dmax）、分割基準値
Ｂ・・・線形近似のための回帰係数行列
ｎ・・・終端ノードが表す部分領域に含まれるデータ数
１０・・全方位カメラ
１１・・自由曲面ミラー

Claims

ｐ個の説明変量ｘ＝（x₁，x₂，・・・・x_p）で説明されるｑ個の目的変量をｙ＝（y₁，y₂，・・・・y_q）とし、これらのデータがｎ個得られたとする．このデータの集まりを、データ集合Ｄとしたとき、説明変量ｘと目的変量ｙの間の写像関係Ｆを、
複数の線形関数φ_iで、
ｙ＝φ_i（ｘ）：ｉ＝１〜ＮＢ（このとき、ＮＢは、入力空間が分割して生成された分割空間の数である。）
と近似して求めるコンピュータプログラムであって、次の主ルーチンとサブルーチンとからなる処理手順から構成されている。
主ルーチン；
１．サンプルデータのデータベースの全学習データＤを読みだす。
２．サブルーチンPLM-Approx(Ｄ)を実行する。
サブルーチンPLM-Approx(データ集合Ｄ)；
１．データ集合Ｄに対して回帰分析法により線形近似する。
２．データ集合Ｄが近似終了条件を満たすなら終了する。
３．データ集合Ｄが近似終了条件を満たさないときは、
データ集合Ｄに対して分割テストサブルーチンSplit-Data（Ｄ，Ｄ₁，Ｄ₂）を行い、データ集合ＤをＤ₁とＤ₂に分割する。
４．データ集合Ｄ₁に対してサブルーチンPLM-Approx(Ｄ₁)を実行する。
５．データ集合Ｄ₂に対してサブルーチンPLM-Approx(Ｄ₂)を実行する。
分割テストサブルーチンSplit-Data（データ集合Ｄ，Ｄ₁，Ｄ₂）；
１．データ集合Ｄの分布を調べ、分布の幅が最大の次元d_maxを見つける。
２．前記最大の次元d_maxに垂直な超平面により、データ集合Ｄをデータ数が等しくなるように２つに分割するため、この超平面を表す値x_dmax＝Ｃを求め、データ集合Ｄ₁，Ｄ₂に分割する。
ここで、近似終了条件は、
１．近似誤差が許容範囲内である。
２．データ数｜Ｄ｜が全学習データに対して十分小さい。
とする。
ｐ個の説明変量ｘ＝（x₁，x₂，・・・・x_p）で説明されるｑ個の目的変量をｙ＝（y₁，y₂，・・・・y_q）とし、これらのデータがｎ個得られたとする．このデータの集まりを、データ集合Ｄとしたとき、説明変量ｘと目的変量ｙの間の写像関係Ｆを、
複数の線形関数φ_iで、
ｙ＝φ_i（ｘ）：ｉ＝１〜ＮＢ（このとき、ＮＢは、入力空間が分割して生成された分割空間の数である。）
と近似して求めるコンピュータプログラムが記録されたコンピュータ読み取り可能な記録媒体であって、次の主ルーチンとサブルーチンとからなるコンピュータプログラムが記録されたコンピュータ読み取り可能な記録媒体。
主ルーチン；
１．サンプルデータのデータベースの全学習データＤを読みだす手順。
２．サブルーチンPLM-Approx(Ｄ)を実行する手順。
サブルーチンPLM-Approx(データ集合Ｄ)；
１．データ集合Ｄに対して回帰分析法により線形近似する手順。
２．データ集合Ｄが近似終了条件を満たすなら終了する手順。
３．データ集合Ｄが近似終了条件を満たさないときは、
データ集合Ｄに対して分割テストサブルーチンSplit-Data（Ｄ，Ｄ₁，Ｄ₂）を行い、データ集合ＤをＤ₁とＤ₂に分割する手順。
４．データ集合Ｄ₁に対してサブルーチンPLM-Approx(Ｄ₁)を実行する手順。
５．データ集合Ｄ₂に対してサブルーチンPLM-Approx(Ｄ₂)を実行する手順。
分割テストサブルーチンSplit-Data（データ集合Ｄ，Ｄ₁，Ｄ₂）；
１．データ集合Ｄの分布を調べ、分布の幅が最大の次元d_maxを見つける手順。
２．前記最大の次元d_maxに垂直な超平面により、データ集合Ｄをデータ数が等しくなるように２つに分割するため、この超平面を表す値x_dmax＝Ｃを求め、データ集合Ｄ₁，Ｄ₂に分割する手順。
ここで、近似終了条件は、
１．近似誤差が許容範囲内である。
２．データ数｜Ｄ｜が全学習データに対して十分小さい。
とする。