JP6767355B2 - モデル構築システムおよびモデル構築方法 - Google Patents

モデル構築システムおよびモデル構築方法 Download PDF

Info

Publication number
JP6767355B2
JP6767355B2 JP2017249728A JP2017249728A JP6767355B2 JP 6767355 B2 JP6767355 B2 JP 6767355B2 JP 2017249728 A JP2017249728 A JP 2017249728A JP 2017249728 A JP2017249728 A JP 2017249728A JP 6767355 B2 JP6767355 B2 JP 6767355B2
Authority
JP
Japan
Prior art keywords
model
input variables
selected input
variable
variables
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017249728A
Other languages
English (en)
Other versions
JP2018169999A (ja
Inventor
幸仁 西田
幸仁 西田
英己 安井
英己 安井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to TW107106843A priority Critical patent/TWI677799B/zh
Priority to CN201810193409.8A priority patent/CN108693787A/zh
Priority to US15/922,262 priority patent/US20180285317A1/en
Publication of JP2018169999A publication Critical patent/JP2018169999A/ja
Application granted granted Critical
Publication of JP6767355B2 publication Critical patent/JP6767355B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明の実施形態は、モデル構築システムおよびモデル構築方法に関する。
ある出力変数(目的変数)を、複数の入力変数(説明変数)を用いて予測することを目的として、複数の入力変数と出力変数との関係を表すモデルの構築が一般的に行われている。モデルを構築する際には、多数の入力変数の中から一部の入力変数を選択し、選ばれた入力変数と出力変数とを用いてモデルが構築される。例えば、入力変数は、出力変数に対する予測誤差が小さく、出力変数をより高精度に予測できるように選択される。
モデルについては、精度以外に、汎化能力が高いことが求められる。すなわち、ある範囲のデータ(既存のデータ)に基づいて構築されたモデルが、別の範囲のデータ(未知のデータ)に対しても、良好な精度を有することが求められる。しかし、既存のデータに対して高い精度を有するモデルが、高い汎化能力を有するとは限らない。また、既存のデータに対し精度が最も高いモデルより、ある程度精度が低いモデルの方が汎化能力では優れていることもある。このため、精度の低下を抑えつつ、汎化能力の高いモデルを構築できる技術の開発が望まれていた。
特開2010−282547号公報
本発明が解決しようとする課題は、精度の低下を抑制しつつ、汎化能力の高いモデルを構築できるモデル構築システムおよびモデル構築方法を提供することである。
実施形態に係るモデル構築システムは、ベースモデル構築部と、類似度算出部と、変形モデル構築部と、汎化能力算出部と、を備える。前記ベースモデル構築部は、複数の入力変数から選択された選択入力変数と、出力変数と、の関係を表すベースモデルを構築する。前記類似度算出部は、前記複数の入力変数のうち前記選択入力変数以外の非選択入力変数と、前記選択入力変数と、の間の類似度を算出する。前記変形モデル構築部は、前記類似度に基づき、前記選択入力変数の少なくとも一部を、前記非選択入力変数と入れ換え、入れ換えた後の入力変数と出力変数との関係を表す変形モデルを構築する。前記汎化能力算出部は、前記ベースモデルおよび前記変形モデルの汎化能力を算出する。前記変形モデル構築部は、それぞれの前記選択入力変数に対して、所定の閾値以上の前記類似度を有する前記非選択入力変数を抽出し、前記選択入力変数の少なくとも一部を、抽出された前記非選択入力変数と入れ換えて、前記変形モデルを構築する。
実施形態に係るモデル構築システムの構成を表すブロック図である。 実施形態に係るモデル構築システムによる処理の一例を説明する図である。 実施形態に係るモデル構築システムによる処理の一例を説明する図である。 実施形態に係るモデル構築方法の一例を表すフローチャートである。 実施形態に係るモデル構築方法の他の一例を表すフローチャートである。 実施形態に係るモデル構築システムを実現するためのモデル構築装置の構成を例示するブロック図である。 実施形態に係るモデル構築システムを用いて構築したモデルの特性を例示するグラフである。 実施形態に係るモデル構築システムを用いて構築したモデルの特性を例示するグラフである。
以下に、本発明の各実施形態について図面を参照しつつ説明する。
また、本願明細書と各図において、既に説明したものと同様の要素には同一の符号を付して詳細な説明は適宜省略する。
図1は、実施形態に係るモデル構築システム1の構成を表すブロック図である。
図2および図3は、実施形態に係るモデル構築システム1による処理の一例を説明する図である。
図1に表すように、モデル構築システム1は、取得部100、ベースモデル構築部102、モデル情報保存部104、類似度算出部106、類似度情報保存部108、変形モデル構築部110、汎化能力算出部112、外部出力部114、規定数データベース120、および変数データベース122を備える。
規定数データベース120は、規定数を記憶する。規定数は、モデル構築システム1において構築されるモデルの数を表す。規定数は、例えば、予めユーザによって入力される。変数データベース122は、入力変数および出力変数に関して、それぞれの変数の実測値である変数データを記憶している。
取得部100は、規定数データベース120および変数データベース122から、それぞれ、規定数および変数データを取得する。取得部100は、取得した情報を、ベースモデル構築部102に出力する。
ベースモデル構築部102は、取得部100から出力された複数の入力変数から、一部の入力変数を選択する。ベースモデル構築部102は、取得部100によって取得された変数データを用いて、選択された入力変数と出力変数との関係を表すモデルを構築する。入力変数の選択およびモデルの構築は、例えば、Least Absolute Shrinkage and Selection Operator(Lasso)、Elastic Net、Ridge、Least Angle Regression(LARS)、Non Negative Garrote、またはSmoothly Clipped Absolute Deviation(SCAD)を用いて行うことができる。あるいは、入力変数の選択を、ステップワイズ、Variable Important in the Projection(VIP)、遺伝的アルゴリズム、およびNearest Correlation Louvain Method(NCLM)のいずれかを用いて行い、モデルの構築を、重回帰またはPartial Least Squares(PLS)を用いて行っても良い。
以降では、ベースモデル構築部102によるモデル構築の際に選択された入力変数を「選択入力変数」と言う。、選択されなかった変数を「非選択入力変数」と言う。選択入力変数は、取得部100によって取得された複数の入力変数の一部である。非選択入力変数は、複数の入力変数の別の一部である。非選択入力変数は、選択入力変数と異なる。また、ベースモデル構築部102によって、選択入力変数を用いて構築されたモデルを「ベースモデル」と言う。ベースモデルは、複数の選択入力変数を含む入力変数群と、出力変数と、の関係を表す。
ベースモデル構築部102は、構築したベースモデルを、モデル情報保存部104に出力する。これにより、モデル情報保存部104に、モデル情報が保存される。また、ベースモデル構築部102は、ベースモデルを、類似度算出部106および変形モデル構築部110にも出力する。
類似度算出部106は、ベースモデルに含まれる複数の選択入力変数のそれぞれと、複数の非選択入力変数のそれぞれと、の間の複数の類似度を算出する。例えば、相関係数、偏相関係数、正準相関、またはRidge決定係数などを類似度として用いることができる。類似度算出部106は、算出した類似度を、類似度情報保存部108に出力する。
変形モデル構築部110は、類似度情報保存部108から入力変数の類似度情報を取得する。変形モデル構築部110は、この類似度情報に基づいて、複数の選択入力変数の少なくとも一部を、複数の非選択入力変数の少なくとも一部と入れ替える。これにより、別の入力変数群が生成される。このとき、変形モデル構築部110は、ベースモデルに含まれる複数の選択入力変数の全てを、複数の非選択入力変数の少なくとも一部と入れ替えても良い。または、変形モデル構築部110は、ベースモデルに含まれる複数のの選択入力変数の一部を、複数の非選択入力変数の少なくとも一部と入れ替えても良い。変形モデル構築部110は、上記別の入力変数群と出力変数との関係を表すモデルを構築する。以降では、変形モデル構築部110によって構築されたこのモデルを「変形モデル」と言う。
変形モデル構築部110によって構築された変形モデルのモデル情報は、モデル情報保存部104に保存される。また、変形モデル構築部110は、モデル構築システム1によって構築されたベースモデルと変形モデルの総数が規定数に達しているか判定する。構築されたモデルの総数が規定数に達していない場合、変形モデル構築部110は、変形モデルに含まれる変数を入れ換えながら、さらに他の変形モデルを繰り返し構築していく。
ベースモデルおよび変形モデルの総数が規定数に達すると、汎化能力算出部112によって、構築された各モデルの汎化能力が算出される。汎化能力算出部112は、モデル情報保存部104に保存されたモデル情報(ベースモデルおよび変形モデル)を取得し、変数データベース122から変数データを取得する。このとき、汎化能力算出部112は、ベースモデルおよび変形モデルの構築時とは異なる範囲の変数データ(未知のデータ)を取得する。例えば、汎化能力算出部112は、未知のデータの入力変数に対してベースモデルおよび変形モデルを適用する。汎化能力算出部112は、各モデルの予測値と出力変数の実測値とを比較し、予測の精度を各モデルの汎化能力として算出する。
一例として、ベースモデルおよび変形モデルは、ある製造装置で得られた各種データ(温度や、圧力、出来栄え)を入力変数および出力変数として構築される。この場合、各モデルを、別の製造装置で得られた変数データに適用し、その精度を各モデルの汎化能力として算出する。
または、ベースモデルおよび変形モデルは、ある製造装置の所定期間に得られた変数データに基づいて構築される。この場合、各モデルを、当該装置の別の期間に得られたデータに適用し、その精度を各モデルの汎化能力として算出しても良い。
汎化能力は、例えば、Mean Square Error(MSE)、Root Mean Square Error(RMSE)、決定係数(R)、相関係数、Akaike's Information Criterion(AIC)、またはBayesian Information Criterion(BIC)などを用いて算出される。汎化能力算出部112は、各モデルについての汎化能力の算出結果を、外部出力部114に出力する。
外部出力部114は、最も汎化能力が高かったベースモデルおよび変形モデルの1つを、ディスプレイ上でユーザに対して表示させ、または所定のファイル形式で出力させる。外部出力部114は、最も高い汎化能力を有するモデルを含む複数のモデルを出力しても良い。
ここで、図2および図3を参照しつつ、複数の具体的な例について説明する。
例えば、12個の入力変数X(i=1〜12の自然数)と出力変数Yとの変数データが変数データベース122に記憶されている。この場合、ベースモデル構築部102は、12個の入力変数の一部を選択する。ベースモデル構築部102は、12個の入力変数の一部と出力変数Yとの間で、例えば以下の式(1)で表されるベースモデルを作成する。ベースモデル構築部102は、このベースモデルを、モデル情報保存部104に保存する。
Y=b+b+b+b (1)
次に、類似度算出部106は、選択入力変数であるX、X、およびXのそれぞれと、非選択入力変数であるX〜X12のそれぞれと、の間で、図2(a)に表すように、類似度を算出する。図2(a)では、類似度として相関係数を用いた場合を例示している。
1つ目の方法として、変形モデル構築部110は、例えば、予め設定された閾値を用いる。変形モデル構築部110は、それぞれの選択入力変数について、閾値以上の類似度を有する少なくとも1つの非選択入力変数を抽出する。
図2(b)に表した例では、閾値は80%に設定され、それぞれの選択入力変数に対して類似度の高い非選択入力変数が抽出されている。すなわち、この例では、変数Xに対しては、変数X、X、Xが抽出されている。変数Xに対しては、変数X、X、Xが抽出され、変数Xに対しては、変数X10、X11、X12が抽出されている。これにより、1つの選択入力変数と、当該1つの選択入力変数と類似度が高い非選択入力変数と、の組が複数作成される。図2(a)に表す例では、非選択入力変数X12の類似度は、選択入力変数XおよびXの両方に対して80%以上である。この場合、非選択入力変数X12は、例えば、より類似度の高い選択入力変数Xに対して割り当てられる。
変形モデル構築部110は、それぞれの組について、例えば、選択入力変数と非選択入力変数とを一様な確率で入れ換える。変形モデル構築部110は、入れ換え後の選択入力変数と非選択入力変数との群に基づいて変形モデルを構築する。変形モデル構築部110は、この変形モデルを、モデル情報保存部104に保存する。例えば、図2(a)および図2(b)に表した例において、変数XおよびXが入れ換えられず、変数Xが変数Xに入れ換えられる。この場合、変形モデル構築部110は、これらの入力変数に基づいて以下の式(2)で表される変形モデルを構築し、モデル情報保存部104に保存する。
Y=b+b+b+b (2)
2つ目の方法として、変形モデル構築部110は、非選択入力変数の類似度に基づく確率を設定する。変形モデル構築部110は、この確率に従って、少なくとも1つの選択入力変数と少なくとも1つの非選択入力変数とを入れ換える。図2(c)は、図2(a)に表した類似度の算出結果を、各選択入力変数に対して類似度が高い非選択入力変数から順に並べたものである。各非選択入力変数の類似度を用いて、選択入力変数X(j=1、2、3)と、非選択入力変数X(k=4〜12)と、を入れ換える確率Pjkを、例えば、以下の式(3)のように設定される。αは、入れ換えをしない確率のために設定される数値である。
Figure 0006767355
変形モデル構築部110は、式(3)で表される確率に従って選択入力変数と非選択入力変数とを入れ換える。変形モデル構築部110は、式(2)と同様に変形モデルを構築し、この変形モデルをモデル情報保存部104に保存する。この方法によれば、先に説明した方法に比べて、類似度がより忠実に反映されて変形モデルが構築される。従って、先の方法に比べて、より出力変数に対する予測誤差が小さい入力変数Xの組み合わせで変形モデルが構築され易くなる。
あるいは、3つ目の方法として、変形モデル構築部110は、実験計画法を用いて変形モデルを構築しても良い。具体的には、変形モデル構築部110は、まず、図2(b)に表したように、それぞれの選択入力変数に対して類似度の高い非選択入力変数を抽出する。次に、変形モデル構築部110は、実験計画法を用いて、図3(a)に表すように直交表を作成し、この直交表に基づいて順番に変形モデルを構築していく。汎化能力算出部112は、直交表に基づいて構築されたそれぞれの変形モデルについて、図3(b)に表すように、汎化能力(MSE)を算出する。変形モデル構築部110は、汎化能力の算出結果を参照し、変数を入れ換えたことによる主効果を算出する。そして、変形モデル構築部110は、汎化能力が最も高くなるように、複数の選択入力変数の少なくとも一部を、主効果が最も大きい少なくとも1つの非選択入力変数と入れ換えて変形モデルを構築する。変形モデル構構築部110は、この変形モデルを外部へ出力する。
この方法において、変形モデル構築部110は、直交表を作成した際に、直交表に基づいて構築される変形モデルの数が、規定数以下か判定を行っても良い。構築される変形モデルの数が規定数以下である場合は、上述した方法に従って変形モデルの構築や主効果の算出を行う。構築される変形モデルの数が規定数を超える場合、モデル構築システム1は、例えば、外部出力部114からエラーを出力するか、1つ目か2つ目の方法に切り替えて変形モデルを構築していく。
図4は、実施形態に係るモデル構築方法の一例を表すフローチャートである。
図5は、実施形態に係るモデル構築方法の別の一例を表すフローチャートである。
図4に表したフローチャートは、図2(a)〜図2(c)を用いて説明した1つ目および2つ目の方法に対応する。図5に表したフローチャートは、図3を用いて説明した3つ目の方法に対応する。
まず、図4に表したフローチャートについて説明する。
取得部100が、規定数データベース120および変数データベース122から、規定数および変数データを取得する(ステップS1)。ベースモデル構築部102が、複数の入力変数の一部を選択し、ベースモデルを構築する(ステップS2)。ベースモデル構築部102は、構築されたベースモデルのモデル情報を、モデル情報保存部104に保存する(ステップS3)。
類似度算出部106は、ベースモデルの構築のために選択された複数の選択入力変数のそれぞれと、選択されなかった複数の非選択入力変数のそれぞれと、の間の類似度を算出する(ステップS4)。類似度算出部106は、算出されたこれらの変数間の類似度を、類似度情報保存部108に保存する(ステップS5)。変形モデル構築部110は、少なくとも1つの選択入力変数を、当該少なくとも1つの選択入力変数と類似度が高い非選択入力変数と入れ換える。変形モデル構築部110は、入れ換え後の入力変数群に基づいて変形モデルを構築する(ステップS6)。
変形モデル構築部110は、構築された変形モデルのモデル情報を、モデル情報保存部104に保存する(ステップS7)。変形モデル構築部110は、構築されたモデル数が、ステップS1で取得された規定数に達したか判定する(ステップS8)。規定数に達していない場合、規定数に達するまで、ステップS6およびS7を繰り返し行う。
構築されたモデル数が規定数に達すると、汎化能力算出部112は、構築されたモデルの汎化能力を算出するための変数データを、変数データベース122から取得する(ステップS9)。また、汎化能力算出部112は、モデル情報保存部104から、ベースモデルおよび変形モデルのモデル情報を取得し、各モデルの汎化能力を算出する(ステップS10)。外部出力部114は、汎化能力が高いモデルを選択し、外部に出力する(ステップS11)。
次に、図5に表したフローチャートについて説明する。
ステップS1〜S5を、図4に表したフローチャートのステップS1〜S5と同様に実行する。変形モデル構築部110は、類似度情報保存部108に保存された類似度に基づいて、直交表を作成する(ステップS6)。変形モデル構築部110は、直交表に基づいて作成される変形モデルの数が、規定数以下か判定する(ステップS7)。変形モデルの数が規定数を超える場合、実験計画法を用いた変形モデルの構築を終了する。変形モデルの数が規定数以下の場合、変形モデル構築部110は、直交表に基づいて別の変形モデルを構築する(ステップS8)。
変形モデル構築部110は、構築された変形モデルのモデル情報を、モデル情報保存部104に保存する(ステップS9)。汎化能力算出部112は、構築されたモデルの汎化能力を算出するための変数データを、変数データベース122から取得する(ステップS10)。また、汎化能力算出部112は、モデル情報保存部104から、ベースモデルおよび変形モデルのモデル情報を取得し、各モデルの汎化能力を算出する(ステップS11)。汎化能力算出部112は、汎化能力の算出結果を参照し、変数を入れ換えたことによる主効果を算出する(ステップS12)。変形モデル構築部110は、選択入力変数の少なくとも一部を、主効果が最も大きい少なくとも1つの非選択入力変数と入れ換えて、別の変形モデルを構築する(ステップS13)。外部出力部114は、ステップS13で構築された別の変形モデルを、最も汎化能力が高いモデルとして外部に出力する(ステップS14)。
図6は、実施形態に係るモデル構築システム1を実現するためのモデル構築装置2の構成を例示するブロック図である。
モデル構築装置2は、例えば、入力装置200、出力装置202、およびコンピュータ204を備える。コンピュータ204は、例えば、ROM(Read Only Memory)206、RAM(Random Access Memory)208、CPU(Central Processing Unit)210、および記憶装置HDD(Hard Disk Drive)212を有する。
入力装置200は、ユーザがモデル構築装置2に対して情報の入力を行うためのものである。入力装置200は、キーボードまたはタッチパネルなどである。
出力装置202は、モデル構築システム1によって得られる出力結果を、ユーザに対して出力するためのものである。出力装置202は、ディスプレイまたはプリンタなどである。
ROM206は、モデル構築装置2の動作を制御するプログラムを格納している。ROM206は、コンピュータ204を、図1に表した、取得部100、ベースモデル構築部102、類似度算出部106、変形モデル構築部110、汎化能力算出部112、および外部出力部114として機能させるために必要なプログラムを格納している。
RAM208は、ROM206に格納されたプログラムが展開される記憶領域として機能する。CPU210は、ROM103に格納された制御プログラムを読み込み、当該制御プログラムに従ってコンピュータ204の動作を制御する。また、CPU210は、コンピュータ204の動作によって得られた様々なデータをRAM208に展開する。
HDD212は、図1に表した、規定数データベース120および変数データベース122を格納している。また、HDD212は、構築されたモデルや算出された類似度が保存される、モデル情報保存部104および類似度情報保存部108としても機能する。
ここで、以上で説明した実施形態の効果について説明する。
本実施形態に係るモデル構築システム1によれば、まず、ベースモデル構築部102によって、複数の選択入力変数を含む入力変数群を用いて、出力変数を精度良く予測できるベースモデルが構築される。さらに、変形モデル構築部110によって、複数の選択入力変数のそれぞれと複数の非選択入力変数のそれぞれとの間の類似度に基づき、複数の選択入力変数の少なくとも一部が複数の非選択入力変数の少なくとも一部と入れ換えられる。これにより、別の入力変数群が生成される。この別の入力変数群を用いて変形モデルが構築される。類似度を用いて複数の選択入力変数の少なくとも一部と複数の非選択入力変数の少なくとも一部とを入れ換えることで、上記別の入力変数群を用いて構築された変形モデルも、比較的高い精度で出力変数を予測することができる。そして、構築されたベースモデルおよび変形モデルは、汎化能力算出部112によって、汎化能力が算出される。このとき、汎化能力算出部112によって最も高い汎化能力が算出されたモデルは、上述の通り、出力変数を比較的高い精度で予測することが可能である。
すなわち、本実施形態によれば、精度の低下を抑制しつつ、汎化能力の高いモデルを構築することが可能となる。
選択入力変数と非選択入力変数との入れ換えにおいては、例えば図2(a)および図2(b)に表したように、所定の閾値以上の非選択入力変数が抽出される。そして、抽出された非選択入力変数が、確率で選択入力変数と入れ換える。この方法によれば、選択入力変数と類似度の高い非選択入力変数のみが変形モデルの構築に用いられるため、変形モデルの精度の低下を抑えることができる。
または、図2(a)および図2(c)に表したように、全ての非選択入力変数について、類似度に基づく入れ換えの確率が設定される。この確率に従って複数の選択入力変数の少なくとも一部が複数の非選択入力変数の少なくとも一部と入れ換えられても良い。非選択入力変数の類似度が低いほど、選択入力変数が当該非選択入力変数と入れ換わる確率も低下する。このため、この方法においても、変形モデルの精度の低下を抑えることができる。また、この方法によれば、多様な変形モデルが構築されるため、より汎化能力の高いモデルを構築することが可能となる。
あるいは、図3(a)および図3(b)に表したように、直交表に基づいて変数が入れ換えられ、汎化能力が算出されても良い。主効果が最も高くなるように複数の選択入力変数の一部が複数の非選択入力変数の少なくとも一部と入れ換えられて変形モデルが構築される。この方法によれば、精度の低下を抑制しつつ、より一層汎化能力の高いモデルを構築することが可能となる。また、この方法によれば、選択入力変数と抽出された非選択入力変数との全ての組み合わせについて変形モデルを構築する必要が無く、汎化能力の高い変形モデルをより短時間で効率的に構築することが可能となる。
以下で、具体的な実施例について説明する。
(第1実施例)
第1実施例では、電子機器の製造装置において、加工後のワークの出来栄えを出力変数としている。製造装置に設けられた各種センサのデータ(温度や圧力等)を入力変数としている。規定数は、100に設定した。複数の入力変数の選択およびベースモデルの構築は、Adaptive Lassoを用いた。類似度には、選択入力変数と非選択入力変数との間の相関係数を用いた。相関係数が0.5以上の非選択入力変数を抽出し、一様な確率で選択入力変数と入れ換えを行った。選択入力変数と非選択入力変数を入れ換えた後のモデルの構築は、重回帰を用いた。各モデルは、所定の構築期間T0における変数データに基づいて構築された。汎化能力の算出は、同じ製造装置において、構築期間T0の後のテスト期間T1〜T5の各期間の変数データを用いた。
図7は、実施形態に係るモデル構築システム1を用いて構築したモデルの特性を例示するグラフである。
図7(a)は、各期間におけるRを表している。図7(b)は、各期間におけるMSEを表している。
図7(a)および図7(b)では、ベースモデルと最も汎化能力の高い変形モデルのみを表している。ベースモデルの結果は、〇(白丸)で表されている。最も汎化能力の高い変形モデルの結果は、●(黒丸)で表されている。
図7(a)および図7(b)の結果から、変形モデルは、ベースモデルと同様に、高いRおよび小さいMSEが得られ、良好な精度を有することが分かる。テスト期間がより未来に移るに連れて、ベースモデルおよび変形モデルの精度は低下している。テスト期間T4およびT5では、変形モデルの精度の低下が、ベースモデルの精度の低下に比べて緩やかであり、より高い精度を有することが分かる。すなわち、この結果から、本実施形態によって得られた変形モデルは、ベースモデルとほぼ同等の精度を有することが分かる。さらに、変形モデルは、ベースモデルに比べて長期間の変数データに対してより高い精度を有し、高い汎化能力を備えていることがわかる。
(実施例2)
第2実施例では、電子機器の製造装置において、加工後のワークの出来栄えを出力変数としている。製造装置に設けられた各種センサのデータ(加工時温度や圧力等)を入力変数としている。出来栄えは、加工後のワークの寸法およびワークの加工レートの少なくともいずれかに基づく。規定数は、1000に設定した。複数の入力変数の選択およびベースモデルの構築は、Adaptive Lassoを用いた。類似度には、選択入力変数と非選択入力変数との間の相関係数を用いた。相関係数が0.5以上の非選択入力変数を抽出し、一様な確率で選択入力変数と入れ換えを行った。選択入力変数と非選択入力変数を入れ換えた後のモデルの構築は、重回帰を用いた。各モデルは、所定の構築期間T0における変数データに基づいて構築された。汎化能力の算出は、同じ製造装置において、構築期間T10の後のテスト期間T11〜T13の各期間の変数データを用いた。
図8は、実施形態に係るモデル構築システム1を用いて構築したモデルの特性を例示するグラフである。
図8(a)は、各期間における各モデルのRを表している。図8(b)は、各期間における各モデルのMSEを表している。
図8(a)および図8(b)では、ベースモデルと最も汎化能力の高い変形モデルのみを表している。ベースモデルの結果は、〇(白丸)で表されている。最も汎化能力の高い変形モデルの結果は、●(黒丸)で表されている。
図8(a)および図8(b)の結果から、構築時においては、ベースモデルのRおよびMSEは、それぞれ、変形モデルのRおよびMSEとほぼ同じである。すなわち、変形モデルの精度は、ベースモデルの精度と同等である。
そして、ベースモデルについては、時間が経過するほど、Rが低下し、且つMSEが増大している。これに対して、変形モデルについては、Rの低下が期間T12からT13にかけて停止している。また、MSEは、期間T12からT13で低下している。これらの結果は、変形モデルが高い精度を有し、且つ変形モデルの汎化能力が、ベースモデルの汎化能力よりも高いことを示している。
以上、本発明のいくつかの実施形態を例示したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更などを行うことができる。これら実施形態やその変形例は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。また、前述の各実施形態は、相互に組み合わせて実施することができる。
1 モデル構築システム、 2 モデル構築装置、 100 取得部、 102 ベースモデル構築部、 104 モデル情報保存部、 106 類似度算出部、 108 類似度情報保存部、 110 変形モデル構築部、 112 汎化能力算出部、 114 外部出力部、 120 規定数データベース、 122 変数データベース

Claims (4)

  1. 複数の入力変数から選択された選択入力変数と、出力変数と、の関係を表すベースモデルを構築するベースモデル構築部と、
    前記複数の入力変数のうち前記選択入力変数以外の非選択入力変数と、前記選択入力変数と、の間の類似度を算出する類似度算出部と、
    前記類似度に基づき、前記選択入力変数の少なくとも一部を、前記非選択入力変数と入れ換え、入れ換えた後の入力変数と出力変数との関係を表す変形モデルを構築する変形モデル構築部と、
    前記ベースモデルおよび前記変形モデルの汎化能力を算出する汎化能力算出部と、
    を備え
    前記変形モデル構築部は、それぞれの前記選択入力変数に対して、所定の閾値以上の前記類似度を有する前記非選択入力変数を抽出し、前記選択入力変数の少なくとも一部を、抽出された前記非選択入力変数と入れ換えて、前記変形モデルを構築するモデル構築システム。
  2. 前記変形モデル構築部は、前記選択入力変数と抽出された前記非選択入力変数から、実験計画法を用いて直交表を作成し、前記直交表に基づいて複数の前記変形モデルを構築し、
    前記汎化能力算出部は、それぞれの前記変形モデルの汎化能力を算出し、
    前記変形モデル構築部は、当該汎化能力の算出結果から、変数を入れ換えたことによる主効果を算出し、前記主効果が最も高くなるように、前記選択入力変数の少なくとも一部を前記主効果が最も大きい前記非選択入力変数に入れ換えて前記変形モデルを構築する請求項記載のモデル構築システム。
  3. 最も高い前記汎化能力が算出された前記ベースモデルまたは前記変形モデルを外部へ出力する外部出力部をさらに備えた請求項1または2に記載のモデル構築システム。
  4. 複数の入力変数から選択された選択入力変数と、出力変数と、の関係を表すベースモデルを構築し、
    前記複数の入力変数のうち前記選択入力変数以外の非選択入力変数と、前記選択入力変数と、の間の類似度を算出し、
    前記類似度に基づき、前記選択入力変数の少なくとも一部を、前記非選択入力変数と入れ換え、入れ換えた後の入力変数と出力変数との関係を表す変形モデルを構築し、
    前記ベースモデルおよび前記変形モデルの汎化能力を算出するモデル構築方法であって、
    前記変形モデルの構築において、それぞれの前記選択入力変数に対して、所定の閾値以上の前記類似度を有する前記非選択入力変数を抽出し、前記選択入力変数の少なくとも一部を、抽出された前記非選択入力変数と入れ換えて、前記変形モデルを構築するモデル構築方法
JP2017249728A 2017-03-29 2017-12-26 モデル構築システムおよびモデル構築方法 Active JP6767355B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW107106843A TWI677799B (zh) 2017-03-29 2018-03-01 模型構築系統及模型構築方法
CN201810193409.8A CN108693787A (zh) 2017-03-29 2018-03-09 模型构建系统以及模型构建方法
US15/922,262 US20180285317A1 (en) 2017-03-29 2018-03-15 Model generation system and model generation method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017064791 2017-03-29
JP2017064791 2017-03-29

Publications (2)

Publication Number Publication Date
JP2018169999A JP2018169999A (ja) 2018-11-01
JP6767355B2 true JP6767355B2 (ja) 2020-10-14

Family

ID=64018718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017249728A Active JP6767355B2 (ja) 2017-03-29 2017-12-26 モデル構築システムおよびモデル構築方法

Country Status (2)

Country Link
JP (1) JP6767355B2 (ja)
TW (1) TWI677799B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7151604B2 (ja) * 2019-04-15 2022-10-12 日本電信電話株式会社 モデル学習装置、データ分析装置、モデル学習方法、及びプログラム
CN115879586B (zh) * 2022-01-11 2024-01-02 北京中关村科金技术有限公司 基于消融实验的投诉预测优化方法、装置及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09167152A (ja) * 1995-12-19 1997-06-24 Hitachi Ltd 対話的モデル作成方法
JP4211706B2 (ja) * 2004-07-28 2009-01-21 株式会社日立製作所 交通情報提供装置
US7774670B2 (en) * 2007-09-11 2010-08-10 Globalfoundries Inc. Method and apparatus for dynamically determining tester recipes
JP5130851B2 (ja) * 2007-09-27 2013-01-30 富士通株式会社 モデル作成支援システム、モデル作成支援方法、モデル作成支援プログラム
TWI649761B (zh) * 2013-03-15 2019-02-01 美商普羅托斯數位健康公司 用於基於多變量資料融合技術之狀態特徵化的系統
JP2015087973A (ja) * 2013-10-31 2015-05-07 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 生成装置、生成方法、およびプログラム

Also Published As

Publication number Publication date
TW201837761A (zh) 2018-10-16
JP2018169999A (ja) 2018-11-01
TWI677799B (zh) 2019-11-21

Similar Documents

Publication Publication Date Title
JP6740157B2 (ja) 解析装置、解析方法、及び、プログラム
JP5011830B2 (ja) データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置
US8412494B2 (en) Optimal solution relation display apparatus and optimal solution relation display method
KR101081649B1 (ko) 특성이 비슷하고 형상이 서로 다른 설계 형상을 분류ㆍ표시하는 장치, 방법 및 기록 매체
US20180285317A1 (en) Model generation system and model generation method
JP6767355B2 (ja) モデル構築システムおよびモデル構築方法
JP7018004B2 (ja) 製品設計装置および該方法
JP4591794B2 (ja) 情報処理装置および方法、並びにプログラム
JPWO2016047118A1 (ja) モデル評価装置、モデル評価方法、及び、プログラム記録媒体
JP2020027370A (ja) 最適化装置、シミュレーションシステム及び最適化方法
JP2014102578A (ja) 情報処理装置、制御方法、プログラム、及び記録媒体
JP2017146888A (ja) 設計支援装置及び方法及びプログラム
JPWO2010113242A1 (ja) 実行順序決定装置
KR102045415B1 (ko) 자동으로 최적의 통계 모델을 결정하는 방법 및 그 장치
JP2018528511A (ja) 生産システムにおける出力効率の最適化
US20210026339A1 (en) Information processing device, determination rule acquisition method, and computer-readable recording medium recording determination rule acquisition program
JPWO2014087590A1 (ja) 最適化装置、最適化方法および最適化プログラム
JP7396847B2 (ja) 学習装置、学習方法および学習プログラム
JP2016045536A (ja) 設計支援装置
JP4871194B2 (ja) パラメータ抽出方法及び当該パラメータ抽出方法を実行させるプログラムを具備するコンピュータ読み取り可能な記憶媒体
JP3987059B2 (ja) 最適値探索支援装置、最適値探索支援方法、及び記録媒体
KR101949448B1 (ko) 가우시안 프로세스 회귀분석을 이용한 클러스터링 방법 및 그 장치
WO2020218246A1 (ja) 最適化装置、最適化方法、及びプログラム
JP6627258B2 (ja) システムモデル生成支援装置、システムモデル生成支援方法、及び、プログラム
JP6767356B2 (ja) モデル構築システムおよびモデル構築方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200227

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200819

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200917

R151 Written notification of patent or utility model registration

Ref document number: 6767355

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151