JP2023074114A - 情報処理装置、情報処理方法およびプログラム - Google Patents
情報処理装置、情報処理方法およびプログラム Download PDFInfo
- Publication number
- JP2023074114A JP2023074114A JP2021186893A JP2021186893A JP2023074114A JP 2023074114 A JP2023074114 A JP 2023074114A JP 2021186893 A JP2021186893 A JP 2021186893A JP 2021186893 A JP2021186893 A JP 2021186893A JP 2023074114 A JP2023074114 A JP 2023074114A
- Authority
- JP
- Japan
- Prior art keywords
- model
- input data
- information
- unit
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 47
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000003860 storage Methods 0.000 claims abstract description 65
- 238000013526 transfer learning Methods 0.000 claims abstract description 9
- 238000011156 evaluation Methods 0.000 claims description 26
- 238000012800 visualization Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 15
- 238000000034 method Methods 0.000 description 15
- 230000008859 change Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000009826 distribution Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000000556 factor analysis Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B17/00—Systems involving the use of models or simulators of said systems
- G05B17/02—Systems involving the use of models or simulators of said systems electric
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/041—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a variable is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/048—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】モデルの妥当性の検証をより容易に実現可能とする。【解決手段】情報処理装置は、記憶制御部と、選択部と、更新部と、を含む。記憶制御部は、出力データに対する影響度がそれぞれ算出される複数の変数を含む入力データを入力して出力データを出力するモデルであって、1以上の第1入力データそれぞれを用いて更新されたモデルの識別情報と、モデルの更新の履歴と、を含む1以上の履歴情報を記憶部に記憶させる。選択部は、第2入力データを用いた更新の対象とする対象モデルを、1以上の履歴情報に含まれる識別情報で識別されるモデルから選択する。更新部は、対象モデルを初期値として、第2入力データを用いて更新後のパラメータを推定する転移学習により、対象モデルを更新する。【選択図】図1
Description
本発明の実施形態は、情報処理装置、情報処理方法およびプログラムに関する。
工場またはプラントの監視システムにおける予測モデルおよび異常検知モデルなど、連続的に更新される機械学習モデルにおいて、モデルの妥当性検証および要因解析の観点から安定したモデル更新が求められる場合がある。更新前のモデルを機械学習モデルの学習時に考慮することで、安定したモデル更新を可能にする技術が提案されている。
現実の監視システムで得られるデータでは、製造設備の運転状況の切り替え、および、センサの故障などによって、意図せず一時的にデータの分布が大きく変化する場合がある。
M. Takada et al.,"Transfer Learning via $ell_1$ Regularization", Advances in Neural Information Processing Systems (NeurIPS2020), 33, 14266-14277.
しかしながら、従来技術では、意図せず一時的にデータの分布が大きく変化するような特別な期間を考慮していないため、この期間の前後でモデルが示す要因が大きく変化し、モデルの妥当性検証または要因解析が難しくなるという問題があった。
実施形態の情報処理装置は、記憶制御部と、選択部と、更新部と、を含む。記憶制御部は、出力データに対する影響度がそれぞれ算出される複数の変数を含む入力データを入力して出力データを出力するモデルであって、1以上の第1入力データそれぞれを用いて更新されたモデルの識別情報と、モデルの更新の履歴と、を含む1以上の履歴情報を記憶部に記憶させる。選択部は、第2入力データを用いた更新の対象とする対象モデルを、1以上の履歴情報に含まれる識別情報で識別されるモデルから選択する。更新部は、対象モデルを初期値として、第2入力データを用いて更新後のパラメータを推定する転移学習により、対象モデルを更新する。
以下に添付図面を参照して、この発明にかかる情報処理装置の好適な実施形態を詳細に説明する。
本実施形態にかかる情報処理装置は、例えば、以下のような機能を備える。これにより、意図せず一時的にデータの分布が大きく変化するような場合であっても、モデルの妥当性検証および要因解析をより容易に実現することが可能となる。
・過去に更新したモデルおよび更新の履歴(学習履歴)を記憶する機能
・新たなデータを用いて、記憶されたモデルそれぞれの評価値を算出する機能
・記憶されたモデルの中から最適なモデルを選択し、更新の対象とする機能
・一時的に意図しないデータが得られた期間を判定する機能
・過去に更新したモデルおよび更新の履歴(学習履歴)を記憶する機能
・新たなデータを用いて、記憶されたモデルそれぞれの評価値を算出する機能
・記憶されたモデルの中から最適なモデルを選択し、更新の対象とする機能
・一時的に意図しないデータが得られた期間を判定する機能
図1は、本実施形態の情報処理装置を含む情報処理システムの構成の一例を示すブロック図である。図1に示すように、情報処理システムは、情報処理装置100と、管理システム200とが、ネットワーク300を介して接続された構成となっている。
情報処理装置100および管理システム200それぞれは、例えばサーバ装置として構成することができる。情報処理装置100および管理システム200は、物理的に独立した複数の装置(システム)として実現されてもよいし、物理的に1つの装置内にそれぞれの機能が構成されてもよい。後者の場合、ネットワーク300は備えらえなくてもよい。情報処理装置100および管理システム200の少なくとも一方は、クラウド環境上で構築されてもよい。
ネットワーク300は、例えば、LAN(ローカルエリアネットワーク)およびインターネットなどのネットワークである。ネットワーク300は、有線ネットワークおよび無線ネットワークのいずれであってもよい。情報処理装置100と、管理システム200とは、ネットワーク300を介することなく、コンポーネント間の直接的な有線接続または無線接続を用いてデータを送受信してもよい。
管理システム200は、情報処理装置100が処理するモデル、および、モデルの学習(推定)および解析などに用いられるデータを管理するシステムである。管理システム200は、記憶部221と、通信制御部201と、を備えている。
記憶部221は、管理システム200で実行される各種処理で用いられる各種情報を記憶する。例えば記憶部221は、モデルの推定に用いる入力データなどを記憶する。記憶部221は、フラッシュメモリ、メモリカード、RAM(Random Access Memory)、HDD(Hard Disk Drive)、および、光ディスクなどの一般的に利用されているあらゆる記憶媒体により構成することができる。
モデルは、複数の変数(説明変数)を含む入力データを入力して推論結果である出力データ(目的変数)を出力するモデルであり、学習用の入力データを用いた機械学習により学習(更新)される機械学習モデルである。複数の変数それぞれは、出力データに対する影響度がそれぞれ算出可能な変数である。モデルは、例えば、線形回帰モデル、多項式回帰モデル、ロジスティック回帰モデル、ポアソン回帰モデル、一般化線形モデル、および、一般化加法モデルなどである。モデルは、これらに限られるものではない。
モデルは、目的変数および説明変数を含む入力データを用いて学習することにより推定される。目的変数は、例えば、品質特性、不良率、並びに、良品および不良品のいずれかを示す情報などである。説明変数は、その他のセンサ値、加工条件などの設定値、および、制御値などである。
通信制御部201は、情報処理装置100などの外部装置との間の通信を制御する。例えば通信制御部201は、入力データを情報処理装置100に送信する。
上記各部(通信制御部201)は、例えば、1または複数のプロセッサにより実現される。例えば上記各部は、CPU(Central Processing Unit)などのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のIC(Integrated Circuit)などのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち1つを実現してもよいし、各部のうち2以上を実現してもよい。
情報処理装置100は、記憶部121と、入力デバイス122と、ディスプレイ123と、通信制御部101と、記憶制御部102と、受付部103と、予測部104と、評価部105と、選択部106と、更新部107と、生成部111と、表示制御部112と、を備えている。
記憶部121は、情報処理装置100で実行される各種処理で用いられる各種情報を記憶する。例えば記憶部121は、更新部107により更新されたモデルのパラメータ、および、更新されたモデルの学習履歴などを記憶する。記憶部121は、フラッシュメモリ、メモリカード、RAM、HDD、および、光ディスクなどの一般的に利用されているあらゆる記憶媒体により構成することができる。
入力デバイス122は、ユーザなどにより情報を入力するためのデバイスである。入力デバイス122は、例えば、キーボードおよびマウスである。ディスプレイ123は、情報を出力する出力デバイスの一例であり、例えば液晶ディスプレイである。入力デバイス122およびディスプレイ123は、例えばタッチパネルのように一体化されてもよい。
通信制御部101は、管理システム200などの外部装置との間の通信を制御する。例えば通信制御部101は、管理システム200から入力データなどを受信する。
図2は、入力データの一例を示す図である。入力データは、データ期間と、日時と、説明変数と、目的変数と、を含む。データ期間は、複数のデータ(説明変数、目的変数)が取得された期間(日時の範囲)を示す。日時は、複数のデータそれぞれが取得された日時を示す。図2に示すように、入力データは、複数の説明変数を含みうる。
図1に戻り、記憶制御部102は、更新されたモデルのパラメータを記憶部121に記憶する。図3は、モデルのパラメータの一例を示す図である。図3のモデルは、複数の説明変数それぞれに乗じられる係数βをパラメータとする回帰モデルの例である。
図1に戻り、記憶制御部102は、さらに、1以上の入力データ(第1入力データ)それぞれを用いて更新されたモデルの識別情報と、モデルの学習履歴と、を含む1以上の履歴情報を記憶部121に記憶する。
履歴情報それぞれは、例えば、モデルMと、モデルMの学習履歴と、の組(M,H)のように表される。なお「M」はモデルの識別情報の一例である。以下では、識別情報Mで識別されるモデルのことをモデルMという場合がある。
学習履歴は、モデルMが、過去に推定または更新されたモデルのうちいずれのモデルを対象として更新されたかを示す情報である。学習履歴は、例えば、更新に用いられた入力データのデータ期間の履歴により表される。学習履歴の表現方法はこれに限られない。例えば、学習履歴は、更新の対象としたモデル(対象モデル)の識別情報の履歴により表されてもよい。また、学習履歴は、データ期間の履歴と、対象モデルの識別情報の履歴と、の両方を含んでもよい。
記憶制御部102は、例えば1回目からN回目(Nは2以上の整数)の複数の更新それぞれに対応する履歴情報の集合である集合S={(M1,H1),・・・,(MN,HN)}を記憶部121に記憶する。記憶制御部102は、次の更新の対象とする対象モデルの選択時、および、選択された対象モデルを用いたモデルの更新時(学習時)に、必要に応じて履歴情報の読み出しおよび履歴情報の書き込みを行う。
受付部103は、各種情報の入力を受け付ける。例えば受付部103は、通信制御部201および通信制御部101を介して管理システム200から受信された複数の入力データを受け付ける。入力データは、例えば、説明変数Xと目的変数Yとの対からなるデータD=(X,Y)と、データDが取得された期間を示すデータ期間hと、を含む。なお、複数の説明変数が用いられる場合、説明変数Xは、例えば、複数の説明変数それぞれを要素とするベクトルを表すと解釈することができる。
受付部103は、入力されたデータDおよびデータ期間hを、予測部104および更新部107に入力する。予測部104に入力されたデータDは、履歴情報に含まれる各モデルに対する目的変数の予測に用いられる。更新部107は、例えばデータDおよびデータ期間hを使用して、対象モデルのパラメータを更新(学習)する。
予測部104は、履歴情報に含まれる識別情報で識別される1以上のモデルそれぞれについて、入力されたデータD(第2入力データ)を用いて目的変数を予測する。例えば予測部104は、記憶部121の履歴情報に含まれる各モデルM1,・・・,MNに対して、説明変数Xに対する目的変数Yの予測値Y^を予測する。
評価部105は、予測部104により予測される予測値Y^を用いて、モデルそれぞれの予測の精度を表す評価値を求める。評価値は、選択部106が更新の対象とする対象モデルを選択するために用いられる。
例えば評価部105は、それぞれのモデル(モデルM1,・・・,MN)に対して、目的変数Yと予測部104で得られた予測値Y^とから平均二乗誤差を評価値として算出する。評価値は、平均二乗誤差に限られず、例えば、決定係数および平均絶対誤差などの、他の基準で算出される値であってもよい。算出された各モデルの評価値は選択部106に入力される。
選択部106は、更新の対象とする対象モデルを、履歴情報に含まれるモデルから選択する。例えば選択部106は、他のモデルより予測の精度が高いことを示す評価値を有するモデルを、更新の対象として選択する。
例えば評価値が平均二乗誤差または平均絶対誤差の場合、選択部106は、最も小さい評価値を有するモデルを対象モデルとして選択する。評価値が決定係数の場合、選択部106は、最も大きい評価値を有するモデルを対象モデルとして選択する。以下では、選択された対象モデルをMbestとし、対象モデルMbestの学習履歴をHbestとする。
更新部107は、モデルの更新を行う。更新部107は、2回目以降の学習時には、過去に学習したモデルを用いた転移学習を利用したモデル更新を行う。最初の学習時には、過去に学習したモデルが存在しないため、更新部107は、過去に学習したモデルを用いない方法によりモデルを学習する。
例えば更新部107は、選択部106により選択された対象モデルを初期値として、入力されたデータDを用いてモデルのパラメータを推定する転移学習により、対象モデルのパラメータを更新する。より具体的には、更新部107は、選択部106より入力されたモデルMbestと、受付部103より入力されたデータDと、を用いて転移学習を行い、モデルを更新する。更新後のモデルをMnewとする。更新部107は、受付部103より入力されたデータ期間hを、学習履歴Hbestに追加してHnewとする。更新部107は、記憶制御部102を用いて、更新後のモデルおよび履歴情報(Mnew,Hnew)を記憶部121に記憶させる。
更新部107は、モデルの学習(更新)で利用される学習パラメータ(ハイパーパラメータ)および記憶部121に記憶するモデルの個数の最大値を示す閾値(最大モデル数)を予め設定してもよい。最大モデル数は、例えば記憶制御部102による記憶部121の記憶領域の管理に用いられる。
記憶制御部102は、予め定められた条件に従い記憶部121に記憶されている履歴情報の一部を削除する機能を備えてもよい。例えば記憶制御部102は、記憶部121に記憶されているモデルの総数が過大とならないように、モデルの更新後に削除処理を行う。削除処理では、記憶制御部102は、記憶部121に記憶されている履歴情報の集合S={(M1,H1),・・・,(MN,HN)}を入力し、集合の大きさ(集合に含まれる履歴情報の個数)が最大モデル数より大きいとき(条件の一例)、最も古い履歴情報(M1,H1)を削除する。記憶制御部102は、削除後の集合S-1={(M2,H2),・・・,(MN,HN)}を記憶部121を記憶する。
上記のように、予測部104は、記憶部121に記憶されるモデルそれぞれについて目的変数を予測する。従って、最大モデル数が大きくなると、予測のための処理負荷が増加する。一方、意図せず一時的にデータの分布が大きく変化する可能性がある期間より前の期間に対応する履歴情報が記憶されていない場合、適切なモデルが選択できない状況が生じうる。従って、最大モデル数は、処理負荷、および、一時的にデータの分布が大きく変化する可能性がある期間の長さなどを考慮して決定されてもよい。
生成部111は、ディスプレイ123などに表示するための可視化情報を生成する。例えば生成部111は、記憶部121に記憶された履歴情報のうち、ユーザ等により指定された履歴情報に含まれる識別情報で識別されるモデル(指定モデル)の属性を表す属性情報を、可視化情報として生成する。
例えば受付部103は、入力デバイス122などを用いてユーザにより指定された指定モデルを受け付ける。以下では、指定モデルをMsとし、モデルMsの学習履歴をHsとする。
属性情報はどのような情報であってもよいが、例えば以下のような情報(A1)~(A4)である。
(A1)目的変数に対する各説明変数の影響度
(A2)指定モデルのパラメータのうち、指定モデルを更新するときに選択された対象モデルに対して変化したパラメータ
(A3)指定モデルの更新に用いられた1以上の入力データそれぞれが得られた期間(データ期間の履歴)
(A4)入力データが指定モデルの更新に用いられなかった期間を表す対象外期間
(A1)目的変数に対する各説明変数の影響度
(A2)指定モデルのパラメータのうち、指定モデルを更新するときに選択された対象モデルに対して変化したパラメータ
(A3)指定モデルの更新に用いられた1以上の入力データそれぞれが得られた期間(データ期間の履歴)
(A4)入力データが指定モデルの更新に用いられなかった期間を表す対象外期間
例えば生成部111は、指定モデルMsのパラメータを参照して、指定モデルMsの予測に寄与する説明変数を抽出し、抽出した説明変数のリストを属性情報として生成する(A1)。
また、生成部111は、学習履歴Hsを参照して、モデルMsの1つ前のモデル(Msの更新元のモデル)を特定する。生成部111は、特定したモデルのパラメータと指定モデルMsのパラメータとを比較し、変化したパラメータを求める。生成部111は、変化したパラメータを示す属性情報を生成する(A2)。
また、生成部111は、学習履歴Hsを参照して、指定モデルの更新に用いられた入力データが得られた期間を示す属性情報を生成する(A3)。
また、生成部111は、学習履歴Hsを参照して、入力データが指定モデルの更新に用いられていない空白期間を特定し、特定した期間を表す対象外期間を属性情報として生成する(A4)。
なお、意図せずデータの分布が大きく変化していない平時には、通常は最新のモデル(最も新しい期間の入力データで学習されたモデル)が対象モデルとして選択される。一方、意図せずデータの分布が大きく変化したような場合には、最新のモデルが選択されない可能性がある。このような場合、直近の1以上の期間は、対応する入力データがモデルの更新に用いられない空白期間になる。また、モデル更新後の学習履歴は、直近の1以上の期間を含まない履歴となる。言い換えると、学習履歴に含まれる期間が不連続となる。生成部111は、このような空白期間を対象外期間として特定することができる。
表示制御部112は、ディスプレイ123に対する各種情報の表示(可視化)を制御する。例えば表示制御部112は、生成部111により生成された属性情報(可視化情報)をディスプレイ123に表示する。
上記各部(通信制御部101、記憶制御部102、受付部103、予測部104、評価部105、選択部106、更新部107、生成部111、および、表示制御部112)は、例えば、1または複数のプロセッサにより実現される。例えば上記各部は、CPUなどのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のICなどのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち1つを実現してもよいし、各部のうち2以上を実現してもよい。
以下では、ある製品PAの製造装置に関する品質管理を行う情報処理システムを用いた例を主に説明する。製品PAは、例えば濃度がある閾値未満の場合に不良品となる製品である。製造装置が備える、ある濃度センサにより検出される濃度センサ値が、製品PAの品質の監視のために用いられる。
また、製造装置は、この濃度センサ以外にも、電流センサ、温度センサ、および、他の濃度センサなどの様々なセンサを備える。本実施形態では、これらのセンサによるセンサ値を入力データ(説明変数)として、監視対象である濃度センサ値(目的変数)を予測して出力データとして出力するモデルが構築される。このモデルは、予測に対する各入力データの影響度を提示可能なモデルである。影響度を用いて品質に関わる要因を分析することで、例えば歩留まりの改善に取り組むことが可能となる。以下では、モデルの学習方法として非特許文献1で述べられる技術であるTransfer Lasso(Least Absolute Shrinkage and Selection Operator)技術を用いた例を示す。
図4は、実施形態のモデル推定処理の一例を示すフローチャートである。モデル推定処理は、更新の元となる最初のモデルを推定するための処理である。
更新部107は、更新部107で用いる学習パラメータと、記憶部121に記憶する最大モデル数と、を設定する(ステップS101)。例えばTransfer Lasso技術では、正則化パラメータおよび遷移パラメータが、学習パラメータとして設定される。
受付部103は、初期データと、データ期間と、の入力を管理システム200から受け付ける(ステップS102)。初期データは、データ期間h1(例えば1ヵ月)内に得られた、目的変数Y1となる濃度センサ値、および、説明変数X1となるその他のセンサ値を含むデータD1=(X1,Y1)である。初期データのデータ形式は、例えば図2で示した入力データのデータ形式と同様である。
更新部107は、設定された学習パラメータに従い、入力されたデータD1を用いてモデルを学習する(ステップS103)。Transfer Lasso技術では、更新部107は、yを目標値、Xをモデルの入力データとして、y=Xβとなるような係数β={β1,・・・,βp}を学習する。pは、説明変数Xおよび係数βの要素の数である。各係数β1,・・・,βpは、対応する説明変数(各センサのセンサ値)の、目的変数である濃度センサに対する影響度に相当する。
Transfer Lasso技術では、Lasso回帰による学習法で最初のモデルが学習される。学習したモデルを新規モデルM1とする。
更新部107は、モデルM1の学習履歴をH1=[h1]として、モデルM1と、学習履歴H1とを含む履歴情報を記憶部121に記憶する(ステップS104)。また、更新部107は、係数β={β1,・・・,βp}と、係数それぞれに対応するセンサ名とを、モデルM1の情報(パラメータ)として記憶部121に記憶する。上記の図3が、このようにして記憶されるパラメータの例である。
図5は、実施形態のモデル更新処理の一例を示すフローチャートである。モデル更新処理は、図4により推定された最初のモデルを元に、モデルを更新する処理である。更新されたモデルに対して、新たに得られた入力データを用いてさらにモデル更新処理が繰り返し実行されうる。
受付部103は、モデルの更新に用いる入力データDtと、データ期間htと、の入力を管理システム200から受け付ける(ステップS201)。入力データDtは、データ期間ht(例えば1ヵ月)内に得られた、目的変数Ytとなる濃度センサ値、および、その他のセンサ値である説明変数Xtを含むデータである。
次に、予測部104は、記憶部121に記憶されているすべてのモデルM1,・・・,MNおよび学習履歴H1,・・・,HNを記憶部121から読み出す。予測部104は、読み出した各モデルについて、説明変数Xtを入力したときの出力データである、目的変数Ytの予測値Y^tを算出する(ステップS202)。Transfer Lasso技術では、モデルMkの(1≦k≦N)予測値Y^t
kは、Y^t
k=Xβkにより算出される。
次に、評価部105は、各モデルの予測値を用いて、各モデルの評価値を算出する(ステップS203)。例えば評価値として平均二乗誤差を用いる場合、評価部105は、以下の(1)式により、モデルMkの評価値Ekを算出する。
選択部106は、モデルM1,・・・,MNそれぞれの評価値E1,・・・,ENを参照し、最もよい評価値に対応するモデルを、更新の対象モデルMbestとして選択する(ステップS204)。
更新部107は、選択された対象モデルを入力データを用いて学習する(ステップS205)。例えば更新部107は、対象モデルMbestと、対象モデルMbestに対応した学習履歴Hbestと、を選択部106から入力する。また、更新部107は、データDt=(Xt,Yt)およびデータ期間htを、受付部103から入力する。更新部107は、データDt=(Xt,Yt)とモデルMbestとを用いて、Transfer Lasso技術に基づくモデル更新を行い、更新後のモデルMnewを求める。また更新部107は、学習履歴をHnew=[Hbest,ht]のように更新する。
記憶制御部102は、更新されたモデルMnewと学習履歴Hnewとを含む履歴情報を記憶部121に記憶する(ステップS206)。
次に、記憶制御部102は、記憶部121に記憶されている履歴情報の集合を記憶部121から読み出す。記憶制御部102は、記憶部121から入力された履歴情報の集合に含まれるモデルの数が最大モデル数より大きいか否かを判定する(ステップS207)。最大モデル数は、例えば図4のステップS101で設定される。
モデル数が最大モデル数より大きい場合(ステップS207:Yes)、記憶制御部102は、履歴情報の集合から、最も古いモデルと、最も古いモデルに対応する学習履歴を削除し、削除後の履歴情報の集合を記憶部121に入力して置き換える(ステップS208)。
次に、可視化情報(属性情報)を生成して可視化する可視化処理について説明する。図6は、可視化処理の一例を示すフローチャートである。
例えば表示制御部112は、記憶部121内に記憶されたモデルのうち可視化するモデルを選択するための選択画面をディスプレイ123に表示する。ユーザは、入力デバイス122を用いて可視化するモデルを選択する。以下では、選択されたモデルを指定モデルMsとし、指定モデルMsの学習履歴をHsとする。
受付部103は、上記のように選択(指定)された指定モデルMsを受け付ける(ステップS301)。以降、生成部111により、指定モデルMsの属性情報(可視化情報)が生成され、表示制御部112により属性情報がディスプレイ123などに可視化される。
属性情報は、例えば上記の(A1)~(A4)に示す情報である。複数の属性情報のうち、可視化する属性情報をユーザ等が選択可能としてもよい。(A1)~(A4)の属性情報を可視化する場合、それぞれ以下のステップS302~ステップS305が実行される。これらのステップの実行順序は図6に示す順序に限られない。また、例えば可視化する属性情報として選択されなかった場合などには、これらのステップの一部は省略されてもよい。
生成部111は、影響度を表す可視化情報を生成する(ステップS302)。例えば生成部111は、指定モデルMsの予測に寄与する説明変数を抽出する。Transfer Lasso技術では、予測に寄与する変数は係数βが0でない変数であり、係数βの大きさ(絶対値)が影響度となる。
図7は、影響度の算出例を示す図である。図7は、指定モデルMsのパラメータが、図3に示す係数βであるときの影響度の算出例を示す。図7に示すように、値が0である係数βについては影響度が算出されなくてもよい。
図6に戻り、生成部111は、モデルの変化を表す可視化情報を生成する(ステップS303)。例えば生成部111は、指定モデルMsの学習履歴Hsを参照して、指定モデルMsの更新前のモデルMs-1を特定する。生成部111は、モデルMs-1に対する、指定モデルMsの変化を算出する。Transfer Lasso技術によるモデルでは、指定モデルMsとモデルMs-1との間の係数ごとの差をモデルの変化とする。
生成部111は、学習履歴Hsを参照して、指定モデルMsの更新に用いられた入力データが得られた期間を示す可視化情報を生成する(ステップS304)。
生成部111は、対象外期間を表す可視化情報を生成する(ステップS305)。例えば生成部111は、学習履歴Hsを参照して連続していない期間を判定し、判定した期間を対象外期間とする。図8は、対象外期間の推定例を示す図である。図8では、記号「〇」が設定されたデータ期間が、入力データが得られた期間を示す。この例では、生成部111は、2020年4月および2020年5月を対象外期間として推定する。
表示制御部112は、生成された可視化情報をディスプレイ123などに可視化する(ステップS306)。図9は、可視化情報を表示する表示画面901の一例を示す図である。
グラフ911は、各説明変数の影響度を表す。グラフ912は、前回のデータ期間(7月)に対する今回のデータ期間(10月)でのモデルの変化を表す。モデルの変化は、例えば、変化した係数βに対応するセンサごとに、その係数βの変化の量によって表される。グラフ913は、学習履歴(データ期間の履歴)および対象外期間とともに、各期間での目的変数の変化を表す。グラフ914は、今回のデータ期間での目的変数の変化を表す。
なお図9の表示画面901は一例であり、可視化情報の可視化方法はこれに限られない。例えば、図9に示す各グラフのうち、ユーザなどにより指定された属性情報に対応するグラフのみが可視化されてもよい。
以上説明したとおり、本実施形態によれば、意図せず一時的にデータの分布が大きく変化するような場合であっても、モデルの妥当性検証および要因解析などをより容易に実現可能となる。
次に、実施形態にかかる情報処理装置のハードウェア構成について図10を用いて説明する。図10は、実施形態にかかる情報処理装置のハードウェア構成例を示す説明図である。
実施形態にかかる情報処理装置は、CPU51などの制御装置と、ROM(Read Only Memory)52やRAM53などの記憶装置と、ネットワークに接続して通信を行う通信I/F54と、各部を接続するバス61を備えている。
実施形態にかかる情報処理装置で実行されるプログラムは、ROM52等に予め組み込まれて提供される。
実施形態にかかる情報処理装置で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでCD-ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD-R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供されるように構成してもよい。
さらに、実施形態にかかる情報処理装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、実施形態にかかる情報処理装置で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
実施形態にかかる情報処理装置で実行されるプログラムは、コンピュータを上述した情報処理装置の各部として機能させうる。このコンピュータは、CPU51がコンピュータ読取可能な記憶媒体からプログラムを主記憶装置上に読み出して実行することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100 情報処理装置
101 通信制御部
102 記憶制御部
103 受付部
104 予測部
105 評価部
106 選択部
107 更新部
111 生成部
112 表示制御部
121 記憶部
122 入力デバイス
123 ディスプレイ
200 管理システム
201 通信制御部
221 記憶部
300 ネットワーク
101 通信制御部
102 記憶制御部
103 受付部
104 予測部
105 評価部
106 選択部
107 更新部
111 生成部
112 表示制御部
121 記憶部
122 入力デバイス
123 ディスプレイ
200 管理システム
201 通信制御部
221 記憶部
300 ネットワーク
Claims (11)
- 出力データに対する影響度がそれぞれ算出される複数の変数を含む入力データを入力して前記出力データを出力するモデルであって、1以上の第1入力データそれぞれを用いて更新されたモデルの識別情報と、前記モデルの更新の履歴と、を含む1以上の履歴情報を記憶部に記憶させる記憶制御部と、
第2入力データを用いた更新の対象とする対象モデルを、1以上の前記履歴情報に含まれる識別情報で識別されるモデルから選択する選択部と、
前記対象モデルを初期値として、前記第2入力データを用いて更新後のパラメータを推定する転移学習により、前記対象モデルを更新する更新部と、
を備える情報処理装置。 - 前記履歴情報に含まれる識別情報で識別される1以上の前記モデルそれぞれについて、前記第2入力データを用いて前記出力データを予測する予測部と、
前記出力データに基づいて、前記モデルそれぞれの予測の精度を表す評価値を求める評価部と、をさらに備え、
前記選択部は、他のモデルより予測の精度が高いことを示す前記評価値を有するモデルを前記対象モデルとして選択する、
請求項1に記載の情報処理装置。 - 前記モデルは、複数の説明変数を含む入力データを入力し、目的変数である出力データを出力する回帰モデルであり、
前記評価値は、平均二乗誤差、決定係数、および、平均絶対誤差のいずれかである、
請求項2に記載の情報処理装置。 - 前記記憶制御部は、前記履歴情報の数が閾値より大きい場合に、前記記憶部に記憶されている履歴情報の一部を削除する、
請求項1から3のいずれか1項に記載の情報処理装置。 - 前記履歴情報のうち指定された前記履歴情報に含まれる識別情報で識別されるモデルである指定モデルの属性を表す属性情報を生成する生成部と、
前記属性情報を可視化する表示制御部と、をさらに備える、
請求項1から4のいずれか1項に記載の情報処理装置。 - 前記生成部は、前記影響度を前記属性情報として生成する、
請求項5に記載の情報処理装置。 - 前記生成部は、前記指定モデルのパラメータのうち、前記指定モデルを更新するときに選択された前記対象モデルに対して変化したパラメータを示す前記属性情報を生成する、
請求項5に記載の情報処理装置。 - 前記履歴情報は、前記指定モデルの更新に用いられた1以上の前記第1入力データそれぞれが得られた期間をさらに含み、
前記生成部は、前記期間を示す前記属性情報を生成する、
請求項5に記載の情報処理装置。 - 前記履歴情報は、前記指定モデルの更新に用いられた1以上の前記第1入力データそれぞれが得られた期間をさらに含み、
前記生成部は、前記履歴情報に基づいて、前記第1入力データが前記指定モデルの更新に用いられなかった期間を表す対象外期間を示す前記属性情報を生成する、
請求項5に記載の情報処理装置。 - 情報処理装置で実行される情報処理方法であって、
出力データに対する影響度がそれぞれ算出される複数の変数を含む入力データを入力して前記出力データを出力するモデルであって、1以上の第1入力データそれぞれを用いて更新されたモデルの識別情報と、前記モデルの更新の履歴と、を含む1以上の履歴情報を記憶部に記憶させる記憶制御ステップと、
第2入力データを用いた更新の対象とする対象モデルを、1以上の前記履歴情報に含まれる識別情報で識別されるモデルから選択する選択ステップと、
前記対象モデルを初期値として、前記第2入力データを用いて更新後のパラメータを推定する転移学習により、前記対象モデルを更新する更新ステップと、
を含む情報処理方法。 - コンピュータに、
出力データに対する影響度がそれぞれ算出される複数の変数を含む入力データを入力して前記出力データを出力するモデルであって、1以上の第1入力データそれぞれを用いて更新されたモデルの識別情報と、前記モデルの更新の履歴と、を含む1以上の履歴情報を記憶部に記憶させる記憶制御ステップと、
第2入力データを用いた更新の対象とする対象モデルを、1以上の前記履歴情報に含まれる識別情報で識別されるモデルから選択する選択ステップと、
前記対象モデルを初期値として、前記第2入力データを用いて更新後のパラメータを推定する転移学習により、前記対象モデルを更新する更新ステップと、
を実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021186893A JP2023074114A (ja) | 2021-11-17 | 2021-11-17 | 情報処理装置、情報処理方法およびプログラム |
US17/898,697 US20230152759A1 (en) | 2021-11-17 | 2022-08-30 | Information processing apparatus, information processing method, and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021186893A JP2023074114A (ja) | 2021-11-17 | 2021-11-17 | 情報処理装置、情報処理方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023074114A true JP2023074114A (ja) | 2023-05-29 |
Family
ID=86324599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021186893A Pending JP2023074114A (ja) | 2021-11-17 | 2021-11-17 | 情報処理装置、情報処理方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20230152759A1 (ja) |
JP (1) | JP2023074114A (ja) |
-
2021
- 2021-11-17 JP JP2021186893A patent/JP2023074114A/ja active Pending
-
2022
- 2022-08-30 US US17/898,697 patent/US20230152759A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230152759A1 (en) | 2023-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5768834B2 (ja) | プラントモデル管理装置及び方法 | |
US11796989B2 (en) | Monitoring system and monitoring method | |
US7548830B2 (en) | System and method for equipment remaining life estimation | |
JP2020052714A5 (ja) | ||
JP2016004525A (ja) | データ分析システム及びデータ分析方法 | |
JP6730340B2 (ja) | 因果推定装置、因果推定方法、及びプログラム | |
JP2018205994A (ja) | 時系列データ分析装置、時系列データ分析方法およびコンピュータプログラム | |
JP6718500B2 (ja) | 生産システムにおける出力効率の最適化 | |
JP7180692B2 (ja) | 推定装置、推定方法、及びプログラム | |
JP7283485B2 (ja) | 推定装置、推定方法、及びプログラム | |
JP5413240B2 (ja) | イベント予測システムおよびイベント予測方法、ならびにコンピュータ・プログラム | |
JP2021184139A (ja) | 管理計算機、管理プログラム、及び管理方法 | |
WO2021210353A1 (ja) | 故障予兆システム | |
KR102124425B1 (ko) | 시계열 데이터 예측 모델 평가 방법 및 장치 | |
JP6919856B2 (ja) | 強化学習プログラム、強化学習方法、および強化学習装置 | |
JP2023074114A (ja) | 情報処理装置、情報処理方法およびプログラム | |
Kazemi et al. | Estimating the drift time for processes subject to linear trend disturbance using fuzzy statistical clustering | |
JP2007164346A (ja) | 決定木変更方法、異常性判定方法およびプログラム | |
JP2022167097A (ja) | 情報処理装置、情報処理方法及びプログラム | |
KR20160053977A (ko) | 모델 적응을 위한 장치 및 방법 | |
JP7161379B2 (ja) | 推論装置 | |
JP2022111841A (ja) | 表示プログラム、情報処理装置および表示方法 | |
US20090037155A1 (en) | Machine condition monitoring using a flexible monitoring framework | |
JP7127686B2 (ja) | 仮説推論装置、仮説推論方法、及びプログラム | |
US11754985B2 (en) | Information processing apparatus, information processing method and computer program product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240910 |