JP2022046145A - 機械学習モデル精度分析システム、機械学習モデル精度分析方法及びプログラム - Google Patents

機械学習モデル精度分析システム、機械学習モデル精度分析方法及びプログラム Download PDF

Info

Publication number
JP2022046145A
JP2022046145A JP2020152054A JP2020152054A JP2022046145A JP 2022046145 A JP2022046145 A JP 2022046145A JP 2020152054 A JP2020152054 A JP 2020152054A JP 2020152054 A JP2020152054 A JP 2020152054A JP 2022046145 A JP2022046145 A JP 2022046145A
Authority
JP
Japan
Prior art keywords
accuracy
predicted value
model
machine learning
learning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020152054A
Other languages
English (en)
Other versions
JP6899475B1 (ja
Inventor
順一 吉田
Junichi Yoshida
慎吾 北村
Shingo Kitamura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Industry and Control Solutions Co Ltd
Original Assignee
Hitachi Industry and Control Solutions Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Industry and Control Solutions Co Ltd filed Critical Hitachi Industry and Control Solutions Co Ltd
Priority to JP2020152054A priority Critical patent/JP6899475B1/ja
Application granted granted Critical
Publication of JP6899475B1 publication Critical patent/JP6899475B1/ja
Publication of JP2022046145A publication Critical patent/JP2022046145A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】ブラックボックス化された機械学習モデルが出力する予測値の予測精度が悪化した要因を特定することが可能な機械学習モデル精度分析システムを提供する。【解決手段】分析システム2が備えるホワイトボックスモデル作成部23は、ブラックボックスモデル15の作成に合わせて、ブラックボックスモデル15の作成に用いられた入力データを説明変数とし、ブラックボックスモデル15が出力する予測値を目的変数としてホワイトボックスモデル24を作成する。精度悪化要因特定部25は、ブラックボックスモデル15の予測値の精度が判定される判定期間に、ブラックボックスモデル15から出力される予測値の精度が変化したことが判定されると、判定期間に蓄積された入力データをホワイトボックスモデル24に入力して、予測値の精度が変化した要因を特定する。【選択図】図1

Description

本発明は、機械学習モデル精度分析システム、機械学習モデル精度分析方法及びプログラムに関する。
近年、人工知能技術(以下、AI(Artificial Intelligence)と記載)の発展が目覚ましい。AIのプログラム自身が機械学習を行うことで、所定の学習期間に取得する入力データの特徴を見つけて、予測値を出力する機械学習モデルを作成することが可能となる。
機械学習モデルが出力する予測値が、実際に運用される制御システムで実測される実測値を精度よく表したものであれば、機械学習モデルの予測値に基づいて制御システムの動作を予測することが可能となる。しかし、長期間にわたって運用される制御システムは、様々な要因により学習時の状態から変化する。このため、機械学習モデルが出力する予測値が徐々に実測値から乖離し、予測精度が変化することがあった。
一般的に機械学習モデルの構成はブラックボックス化されており、外部から機械学習モデルの処理内容を把握することは難しい。このため、機械学習モデルの予測精度が変化したことを説明することが困難であった。なお、以下の説明では、ブラックボックス化された機械学習モデルを「ブラックボックスモデル」と呼ぶ。
このような課題に対して、AI(例えば、機械学習モデル)が予測値を予測した根拠を説明可能なXAI(Explainable AI)と呼ばれる技術が開発されつつある。従来のXAIとして、機械学習モデルの構築時に使用された学習データを用いて、機械学習モデルから出力される出力データが算出された要因を特定する技術が提供されていた。
例えば、従来のXAIを表す技術として、特許文献1及び2に開示された技術が知られている。特許文献1には、「データベースに格納されているデータに基づいてディープラーニングモデルを用いて予測処理を実行するディープラーニング予測手段と、ディープラーニング予測手段による予測結果を目的変数とし、データベースに格納されているデータを説明変数として重回帰分析を行い、重回帰分析の結果に基づいて、ディープラーニングモデルの予測結果を説明するための変数を決定する」と記載されている。
また、特許文献2には、「分析者がモデル実行装置のモデル(説明変数データ)を決定し、適宜モデルを機械学習により再構築(リモデル)することを、有益な情報の画面表示により支援する」と記載されている。
国際公開第2018/142753号 特許第6625183号
ところで、特許文献1に開示された技術では、ディープラーニングモデルの予測結果を説明するための変数が、ディープラーニングモデルでどのように使われているかを外部から知ることができなかった。
また、特許文献2に開示された技術においても単に演算モデルの再構築が促されるに過ぎず、演算モデルの精度が悪化した要因を把握できなかった。このように従来の技術では、ブラックボックス化された機械学習モデルの予測精度が変化した要因を説明するには不十分であった。
本発明はこのような状況に鑑みて成されたものであり、ブラックボックス化された機械学習モデルが出力する予測値の予測精度が変化した要因を特定することを目的とする。
本発明に係る機械学習モデル精度分析システムは、制御システムで使用される制御対象機器に対して制御装置が行った処理の結果を含む入力データが蓄積された入力データベースより、予め設定された学習期間で読み出した入力データに基づいて学習されるブラックボックス化された機械学習モデルであって、入力データから処理の結果を予測値として出力可能なブラックボックス化された機械学習モデルの作成に合わせて、ブラックボックス化された機械学習モデルの作成に用いられた入力データを説明変数とし、ブラックボックス化された機械学習モデルが出力する予測値を目的変数としてホワイトボックスモデルを作成するホワイトボックスモデル作成部と、ブラックボックス化された機械学習モデルの予測値の精度が判定される判定期間に、ブラックボックス化された機械学習モデルから出力される予測値の精度が変化したことが判定されると、判定期間に蓄積された入力データをホワイトボックスモデルに入力して、予測値の精度が変化した要因を特定する要因特定部と、を備える。
本発明によれば、判定期間に蓄積された入力データをホワイトボックスモデルに入力して、ブラックボックス化された機械学習モデルから出力される予測値の精度が変化した要因を特定することが可能となる。
上記した以外の課題、構成及び効果は、以下の実施の形態の説明により明らかにされる。
本発明の第1の実施の形態に係る制御システム及び分析システムの全体構成例を示すブロック図である。 本発明の第1の実施の形態に係る制御システム及び分析システムで用いられる様々なデータの流れの例を示す図である。 本発明の第1の実施の形態に係る決定木モデルの構成例を示す図である。 本発明の第1の実施の形態に係るクラスタリングモデルの構成例を示す図である。 本発明の第1の実施の形態に係る計算機のハードウェア構成例を示すブロック図である。 本発明の第1の実施の形態に係る分析システム全体の処理の例を示すフローチャートである。 本発明の第1の実施の形態に係るホワイトボックスモデル作成部が、ホワイトボックスモデルを作成する処理の例を示すフローチャートである。 本発明の第1の実施の形態に係る精度悪化要因特定部が、ブラックボックスモデルの予測値の精度悪化要因を特定する処理の例を示すフローチャートである。 本発明の第1の実施の形態に係る再モデリング方法提案部が、ブラックボックスモデルの再モデリング方法を提案する処理の例を示すフローチャートである。 本発明の第1の実施の形態に係る再モデリング方法の提案画面の例を示す図である。 本発明の第2の実施の形態に係る再モデリング方法提案部が、ブラックボックスモデルの再モデリング方法を提案する処理の例を示すフローチャートである。 本発明の第2の実施の形態に係る再モデリング方法の提案画面の例を示す図である。
以下、本発明を実施するための形態について、添付図面を参照して説明する。本明細書及び図面において、実質的に同一の機能又は構成を有する構成要素については、同一の符号を付することにより重複する説明を省略する。
[第1の実施の形態]
<分析システムの構成例>
始めに、本発明の第1の実施の形態に係るブラックボックス化された機械学習モデルの精度を分析する機械学習モデル精度分析システムについて説明する。
図1は、制御システム1及び分析システム2の構成例を示すブロック図である。
図1には、顧客で使用される制御システム1と、顧客に所定のサービスを提供するサービス提供者が制御システム1の動作を分析するために使用する分析システム2(機械学習モデル精度分析システムの一例)とが示されている。制御システム1は、例えば、計測装置11、機器12、入力データベース13、ブラックボックスモデル作成装置14、ブラックボックスモデル15及び精度データ蓄積データベース16を備える。
(制御システム)
始めに、制御システム1の内部構成例について説明する。
計測装置11(制御装置の一例)は、顧客で使用される機器12(制御対象機器の一例)の温度等を計測する。計測装置11が機器12を計測して得たデジタル又はアナログの実測値は、入力データとして入力データベース13(図では、「入力DB」と記載)に格納される。
入力データベース13は、例えば、HDD(Hard Disk Drive)等の大容量の不揮発性ストレージ67(後述する図5を参照)で構成されており、大量の入力データを格納する。入力データベース13には、制御システム1で使用される機器12に対して計測装置11が行った処理の結果が入力データとして蓄積される。この入力データは、計測装置11が実際に機器12を計測して得た実測値を含む。なお、計測装置11が機器12に行った処理は、機器12が加工した加工物を計測する処理を含むものとする。
入力データベース13に保存される入力データは、ブラックボックスモデル作成装置14がブラックボックスモデル15を構築する学習時に用いられる。学習時に用いられる入力データを「学習データ」とも呼ぶ。また、入力データベース13に保存される入力データは、制御システム1の運用開始後に、検証部22がブラックボックスモデル15の予測値を評価する時にも用いられる。
ブラックボックスモデル作成装置14は、学習時に入力データベース13から学習期間の入力データを読み出す。上述したようにブラックボックスモデル作成装置14に入力される入力データは、いずれも実測値である。そして、ブラックボックスモデル作成装置14は、予め設定された学習期間で読み出した入力データに基づいて入力データの特徴を学習し、ブラックボックスモデル15を作成する。図中の左側には、学習時に構築されたブラックボックスモデル15の例が示される。このブラックボックスモデル15は、入力データベース13から入力された実測値の入力データを説明変数及び目的変数として構築される、ブラックボックス化された機械学習モデルの一例であり、顧客以外に内部構成が公開されていない。
制御システム1が運用開始されると、ブラックボックスモデル15が稼働する。計測装置11及び機器12を管理する顧客は、ブラックボックスモデル15が出力する予測値に基づいて、機器12の状態を監視し、機器12の動作を予測する。制御システム1の運用時に稼働するブラックボックスモデル15は、図中の右側に配置されており、このブラックボックスモデル15を用いて予測処理が行われることが示される。
ブラックボックスモデル15には、入力データベース13から読み出された、実測値である入力データが説明変数として入力される。そして、ブラックボックスモデル15は、実測値に対する予測値を目的変数として出力し、精度データ蓄積データベース16(図では、「精度データ蓄積DB」と記載)に精度データとして蓄積する。
精度データ蓄積データベース16には、入力データベース13から読み出された実測値の入力データが目的変数として蓄積される。また、精度データ蓄積データベース16には、上述したブラックボックスモデル15から出力された予測値が目的変数として蓄積される。つまり、精度データ蓄積データベース16に蓄積される精度データには、計測装置11が機器12を計測して取得する実測値と、ブラックボックスモデル15が予測した予測値とが含まれる。
(分析システム)
次に、分析システム2の内部構成例について説明する。
分析システム2は、ブラックボックスモデル15の予測値の予測精度を分析する。ブラックボックスモデル15は、ブラックボックス化された機械学習モデルの一例である。ブラックボックスモデル15の内部処理は、サービス提供者が把握できない。この分析システム2は、ブラックボックスモデル15の予測精度が悪化した要因(以下、「精度悪化要因」と呼ぶ)を特定するサービスの提供者によって使用される。この分析システム2は、既存の制御システム1に後付けすることが可能である。この分析システム2は、精度判定部21、検証部22及び提案学習データ抽出部27を備える。
精度判定部21は、ブラックボックスモデル15の予測値の精度が判定される精度判定期間(「計測時」とも呼ぶ)にブラックボックスモデル15から出力される予測値の精度が、サービス提供者により予め設定された閾値(精度閾値)よりも変化した場合に、予測値の精度が悪化したと判定する。ここで、「予測値の精度」とは、実測値に対してブラックボックスモデル15から出力される予測値が合致している割合のことをいう。そして、学習時に判定される予測値の精度に対して、計測時に判定される予測値の精度が閾値よりも低くなることを、「予測値の精度が悪化した」と言う。例えば、閾値を70%と設定した場合に、計測時における実測値に対する予測値の精度が65%であると、予測値が閾値よりも低くなるので、精度判定部21は、予測値の精度が悪化したと判定する。70%と設定された閾値は、学習時における実測値に対する予測値の精度を基に決定される。
そこで、精度判定部21は、ブラックボックスモデル15が作成されたタイミングで精度データ蓄積データベース16から読み出した精度データを入力として、実測値に対する予測値の予測精度の良否を判定する。例えば、判定期間における予測値の精度が、学習期間における予測値の精度と同等であれば、ブラックボックスモデル15の動作に問題はない。一方、判定期間における予測値の精度が、学習期間における予測値の精度から乖離してくれば、制御システム1は、ブラックボックスモデル15が出力したデータを予測値として用いることができない。そこで、精度判定部21は、予測精度の判定結果を検証部22に出力する。
(精度悪化要因の特定)
ここで、検証部22の内部構成例及び動作例について説明する。
検証部22は、ブラックボックスモデル15が出力した予測値を検証し、精度悪化要因を特定すると、顧客にブラックボックスモデル15の再モデリング方法を提案する。この検証部22は、顧客が作成した既存のブラックボックスモデル15の性能を評価し、精度悪化要因を特定するために用いられる。そこで、分析システム2と同様に、検証部22だけを既存の制御システム1に後付けすることも可能である。この検証部22は、ホワイトボックスモデル作成部23、ホワイトボックスモデル24、精度悪化要因特定部25、及び再モデリング方法提案部26を備える。
ホワイトボックスモデル作成部23は、入力データベース13から読み出した入力データから、計測装置11による処理の結果を予測値として出力可能なブラックボックスモデル15の作成に合わせて、サービス提供者が内部処理を把握可能なホワイトボックスモデル24を作成する。ホワイトボックスモデル24の作成処理では、まず、図中の左側に配置されたブラックボックスモデル15が予測した予測値と、入力データベース13から読み出した実測値とを含む入力データがホワイトボックスモデル作成部23に入力される。そして、ホワイトボックスモデル作成部23は、ブラックボックスモデル15の作成に用いられた入力データを説明変数とし、ブラックボックスモデル15が出力する予測値を目的変数としてホワイトボックスモデル24を作成することができる。後述するようにブラックボックスモデル15の再モデリング(再学習)の際にもホワイトボックスモデル作成部23が稼働する。
このホワイトボックスモデル24は、ブラックボックスモデル15の処理を模したものである。サービス提供者は、ホワイトボックスモデル24を通じて、処理の分岐、判断の内容等を確認することができ、ホワイトボックスモデル24の内部構造を把握することが可能である。図中の左側には、ブラックボックスモデル15と共に作成されたホワイトボックスモデル24の例が示される。ホワイトボックスモデル24は、例えば、検証部22が備える不揮発性ストレージ67(後述する図5を参照)に保存されるとよい。
そして、検証部22が、予測値の精度悪化要因を特定する際には、図中の右側に配置されたホワイトボックスモデル24が稼働する。このホワイトボックスモデル24には、入力データベース13から読み出された実測値の入力データが、説明変数及び目的変数として入力される。ホワイトボックスモデル24に実測値の説明変数及び目的変数が入力されるのは、精度悪化要因特定部25が、ホワイトボックスモデル24内の分岐で、正しい分岐、及び間違っている分岐を判別するためである。精度悪化要因特定部25は、分岐の正誤を判別することで、ブラックボックスモデル15の間違っているところを把握する、すなわち精度悪化要因の特定を行うことが可能となる。
そこで、精度悪化要因特定部25(要因特定部の一例)は、精度判定部21から入力された精度判定結果が、予測値の精度が悪化したことを示す結果である場合に、予測値の精度が悪化した要因を特定するために、図1の右側に配置されるホワイトボックスモデル24を稼働させる。この際、精度悪化要因特定部25は、ブラックボックスモデル15の予測値の精度が判定される判定期間に、ブラックボックスモデル15から出力される予測値の精度が変化したことが判定されると、判定期間に入力データベース13へ蓄積された入力データをホワイトボックスモデル24に入力して、予測値の精度が変化した要因を特定する。
この際、精度悪化要因特定部25は、ホワイトボックスモデル24から出力される予測値と、ホワイトボックスモデル24自体の内部構造に基づいて、精度悪化要因を特定する処理を行う。そして、精度悪化要因特定部25は、特定した精度悪化要因を再モデリング方法提案部26に出力する。
再モデリング方法提案部26(提案部の一例)は、精度悪化要因特定部25により予測値の精度が変化した要因が特定されると、ブラックボックスモデル15の再モデリング(「再学習」とも呼ぶ)の方法を提案する。提案される再モデリング方法には、例えば、ブラックボックスモデル15の予測値の精度が悪化した期間以降の入力データ(後述する図10に示す2020年02月以降のデータ)を用いて、ブラックボックスモデル15の再学習を提案する等の具体的な方法が含まれる。
再モデリング方法提案部26は、サービス提供者に再モデリング方法を提案する。このため再モデリング方法提案部26は、ホワイトボックスモデル24から精度悪化要因として特定された処理の一部、又はどのような再モデリング方法でブラックボックスモデル15を再モデリングすれば予測値の精度を高められるかといった情報を表示装置65(後述する図5を参照)に出力する。
再モデリング方法提案部26により提案された再モデリング方法は、サービス提供者のみならず顧客にも提供される。そして、分析システム2では、再モデリング方法提案部26が、提案学習データ抽出部27に対して、ブラックボックスモデル15の再モデリング方法に基づくデータ抽出の指示を出力する。このため、顧客の了承の下、分析システム2がブラックボックスモデル15の再モデリングに必要なデータを改めて入力データベース13から抽出し、制御システム1に抽出したデータを提供する。制御システム1は、提供されたデータを用いてブラックボックスモデル15の再モデリングを行う。
(再モデリング)
次に、ブラックボックスモデル15の再モデリングの処理について説明する。
図1の左上にある提案学習データ抽出部27(抽出部の一例)は、再モデリング方法提案部26から出力された指示に基づいて、入力データベース13から入力データを抽出する処理を開始する。再モデリング方法提案部26から出力された指示は、例えば、再モデリング方法提案部26がサービス提供者に提案し、了承を得た再モデリング方法の実行指示である。再モデリング方法提案部26は、例えば、複数の再モデリング方法を提案すると、サービス提供者により、一つの再モデリング方法が選択される。そして、サービス提供者が選択した再モデリング方法の実行指示が行われることで、提案学習データ抽出部27が始動する。そして、提案学習データ抽出部27は、再モデリング方法提案部26により指示された再モデリング方法に基づいて入力データベース13から抽出した入力データを、ブラックボックスモデル15を作成するブラックボックスモデル作成装置14に出力する。
提案学習データ抽出部27が入力データベース13から抽出する入力データは、ブラックボックスモデル15の再モデリングに必要となる提案学習データとして用いられる。例えば、入力データベース13からは、精度判定部21によりブラックボックスモデル15の予測値の精度が悪化したと判定された時点以降に蓄積された入力データが提案学習データとして抽出される。提案学習データ抽出部27が抽出した提案学習データは、ブラックボックスモデル作成装置14に出力される。
なお、提案学習データ抽出部27は、再モデリング方法提案部26が提案した再モデリング方法に対して修正があった場合(例えば、入力データの抽出期間の変更)、この修正した方法に従って再モデリング方法提案部26から再モデリング方法に基づくデータ抽出の指示が出力される。この場合においても、提案学習データ抽出部27は、データ抽出の指示に従って、入力データベース13から入力データ(提案学習データ)を抽出することができる。
ブラックボックスモデル作成装置14は、提案学習データ抽出部27から入力される提案学習データを再学習用データとして用いて、ブラックボックスモデル15を再作成する。ブラックボックスモデル15の再作成は、提案学習データ抽出部27から再学習用データとして入力される実測値の提案学習データを説明変数及び目的変数として用いて、ブラックボックスモデル15を再作成する処理である。この処理の後、制御システム1では、再作成されたブラックボックスモデル15を用いて、実測値に対する予測値を出力する処理が行われる。
また、ブラックボックスモデル15が再作成されると、ホワイトボックスモデル作成部23は、ホワイトボックスモデル24を再作成する。この際、ホワイトボックスモデル作成部23には、ブラックボックスモデル15の再作成時にブラックボックスモデル作成装置14に入力された提案学習データが、再学習用データとして入力される。そして、ホワイトボックスモデル作成部23は、提案学習データ抽出部27から入力される実測値の再学習用データを説明変数及び目的変数として用いて、ホワイトボックスモデル24を再作成する。このようなブラックボックスモデル15の予測値の精度判定、精度悪化要因の特定、ブラックボックスモデル15及びホワイトボックスモデル24の再作成が繰り返し行われる。
<データの流れ>
次に、各システムで用いられるデータの流れについて説明する。
図2は、制御システム1及び分析システム2で用いられる様々なデータの流れの例を示す図である。図2では、データの流れに注目するため、ブラックボックスモデル作成装置14、精度判定部21及びホワイトボックスモデル作成部23の記載を省略する。
図1に示した入力データベース13には、多数の入力データが格納される。上述したようにブラックボックスモデル作成装置14は、入力データを入力としてブラックボックスモデル15を作成する。ホワイトボックスモデル作成部23は、入力データと、ブラックボックスモデル15が出力するデータとを用いてホワイトボックスモデル24を作成する。
制御システム1の運用開始後に、ブラックボックスモデル15は、運用開始後の実測値である入力データを入力として、予測値を出力する。しかし、制御システム1の運用期間が長くなると、ブラックボックスモデル15が作成された時点よりも予測値の予測精度が変化する。そこで、図1に示した精度判定部21が算出した予測精度が、予め定めた閾値より悪化すると、ブラックボックスモデル15の予測精度が悪化した要因を特定する処理が行われる。例えば、精度判定部21が算出した予測精度が、80%から70%未満(閾値10%以上の変化)に変化すると、予測精度が悪化したと判定される。
ただし、サービス提供者は、ブラックボックスモデル15の外部から、その処理の内容を知ることができない。そこで、ホワイトボックスモデル作成部23は、ブラックボックスモデル15の処理を可視化したホワイトボックスモデル24を作成しておく。この際、ホワイトボックスモデル作成部23は、入力データベース13から読み出した入力データ(実測値)を説明変数とし、ブラックボックスモデル15の出力データ(予測値)を目的変数としてホワイトボックスモデル24を作成する。図中には、ホワイトボックスモデル24として、例えば、決定木モデル24a及びクラスタリングモデル24bが作成されたことが示される。
<ホワイトボックスモデルの例>
ここで、ホワイトボックスモデル24の一例として用いられる、決定木モデル24a及びクラスタリングモデル24bの構成例について、図3と図4を参照して説明する。
(決定木モデル)
図3は、決定木モデル24aの構成例を示す図である。決定木モデルは、最上位にあるルートと、ルートに接続されたノード、子がないノードであるリーフによって構成される木構造を用いて、事象を分類する手法である。ここでは、ホワイトボックスモデル24が、決定木モデル24aで表されたとする。決定木モデル24aは、所定の発生率で機器12に出現する事象を所定の条件で分岐する決定木で構成され、この決定木により事象が特定される。決定木モデル24aは、ルート31、ノード33、リーフ32,34,35によって構成される。
(学習時)
始めに、ブラックボックスモデル作成装置14がブラックボックスモデル15を作成した学習時に、決定木モデル24aがどのような構成であったかを説明する。決定木モデル24aでは、ルート31にて、発生率が15%の事象(例えば、計測対象である機器12の水分値、機器12の不良等)が分類対象とされる。ここで、学習時には、1000個以上の事象がブラックボックスモデル15及びホワイトボックスモデル24の作成に用いられたとする。そして、学習時には、後述する図10の決定木モデル表示部W1aに示すように、板厚が20以上である分岐条件に対して、決定木モデル24aのノード33で表される事象の発生率が30%であり、加熱温度が200℃未満であるリーフ34で表される事象の発生率が50%であったとする。ここで、学習時に算出された事象の発生率をノード33、リーフ34,35の近傍に括弧書きで併記する。
(計測時)
次に、制御システム1の運用開始後、すなわち計測装置11による機器12の計測時において、ブラックボックスモデル15の予測精度が変化(悪化)した時点で、決定木モデル24aがどのような構成に変化するかを説明する。決定木モデル24aが、ルート31にて、発生率が15%の事象を分類対象とすることは、学習時と同様である。そして、計測時には、500個の事象がホワイトボックスモデル24の作成に用いられたとする。
しかし、計測時には、ノード33で表される事象の発生率が30%から25%に低下し、さらに、リーフ34で表される事象の発生率が50%から30%に低下したとする。つまり、リーフ34で表される事象の発生率は、学習時に50%であったのが、計測時に20%低下して30%になったことから、分岐36における精度が著しく悪化している。このように精度悪化要因特定部25は、判定期間に蓄積された入力データを決定木モデル24aに入力し、決定木の分岐ごとに事象の発生率を算出する。
そして、精度悪化要因特定部25は、学習期間における事象の発生率が予測される予測値と、判定期間における事象の発生率が予測される予測値との変化量が、閾値よりも大きくなった場合に、決定木の分岐条件を予測値の精度が変化した要因として特定する。特定された精度悪化要因は、再モデリング方法提案部26により表示装置65に表示される。このように、ホワイトボックスモデル24として決定木モデル24aが用いられると、サービス提供者は、ブラックボックスモデル15の予測値の精度悪化要因を把握しやすくなる。
(クラスタリングモデル)
図4は、クラスタリングモデル24bの構成例を示す図である。ホワイトボックスモデル24は、クラスタリング手法を用いて説明変数(実測値)について同種の特徴を持つ部分集合に分割したクラスタリングモデル24bを生成する。通常、説明変数(実測値)は複数用いられるが、ここでは分かり易く説明するために2つの説明変数を用いて説明する。例えば、「板厚」と「加熱温度」の説明変数から成る同種の特徴を持つ部分集合として、クラスタ41、42、43という3つのクラスタで構成される。このため、ホワイトボックスモデル24は、機器12に出現する事象を、同じ特徴を持つ部分集合に分割したクラスタ41,42,43ごとに分類するクラスタリングモデル24bで表される。
(学習時)
始めに、ブラックボックスモデル作成装置14がブラックボックスモデル15を作成した学習時に、クラスタリングモデル24bがどのような構成であったかを説明する。クラスタリングモデル24bでは、板厚が20以上、かつ加熱温度が200℃未満であるクラスタ43で表される事象の発生率が50%であったとする。ここで、学習時に算出された事象の発生率をクラスタ41、42、43の近傍に括弧書きで併記する。
(計測時)
次に、制御システム1の運用開始後、すなわち計測装置11による機器12の計測時において、ブラックボックスモデル15の予測精度が変化(悪化)した時点で、クラスタリングモデル24bがどのような構成に変化するかを説明する。
計測時には、クラスタ43で表される事象の発生率が50%から30%に低下したとする。つまり、クラスタ43で表される事象の発生率は、学習時に50%であったのが、計測時に20%低下して30%になったことから、クラスタ43における精度が著しく悪化している。このように精度悪化要因特定部25は、判定期間に蓄積された入力データをクラスタリングモデル24bに入力し、クラスタごとに事象の発生率を算出する。
そして、精度悪化要因特定部25は、学習期間における事象の発生率が予測される予測値と、判定期間における事象の発生率が予測される予測値との変化量が、閾値よりも大きくなった場合に、変化量が大きくなったクラスタの特徴を予測値の精度が変化した要因として特定する。精度悪化要因特定部25により特定された精度悪化要因は、再モデリング方法提案部26により表示装置65に表示される。このように、ホワイトボックスモデル24としてクラスタリングモデル24bが用いられると、サービス提供者は、ブラックボックスモデル15の予測値の精度悪化要因を把握しやすくなる。
ここで、精度悪化要因特定部25は、変化量が大きくなったクラスタ43について、クラスタ43からの距離が最も近いクラスタ41と、クラスタ43との中心間の距離44を算出する。これは、最も近いクラスタに対して、どの説明変数の値が大きく異なるクラスタなのかを知ることで、そのクラスタの特徴を抽出するためである。距離44は、ユークリッド距離を前提とするが、その他の任意の距離(マハラノビス距離、チェビシェフ距離、ミンコフスキー距離等)であってもよい。さらに、距離44に対する説明変数毎の距離成分を抽出する。距離44の距離成分については、例えば、板厚で「10」、加熱温度で「5」のように抽出される。このとき、「板厚」の距離成分が「加熱温度」の距離成分より大きいため、「板厚」が予測値の精度を変化させた要因であると特定する。
(分析システムの処理)
以上の説明により、計測時にブラックボックスモデル15から出力される予測値の精度が悪化したのは、図3に示した分岐条件、又は図4に示したクラスタ間の距離における距離成分が最も大きい説明変数が要因であることが示された。このため、精度悪化要因特定部25は、ホワイトボックスモデル24を用いて精度悪化の要因を特定することが可能となる。
<計算機のハードウェア構成例>
次に、制御システム1及び分析システム2のそれぞれのシステムで構成される計算機60のハードウェア構成を説明する。
図5は、計算機60のハードウェア構成例を示すブロック図である。計算機60は、制御システム1及び分析システム2の各機能を実現するコンピューターとして用いられるハードウェアの一例である。
計算機60は、バス64にそれぞれ接続されたCPU(Central Processing Unit)61、ROM(Read Only Memory)62、及びRAM(Random Access Memory)63、表示装置65、入力装置66、不揮発性ストレージ67及びネットワークインターフェイス68を備える。
CPU61は、本実施の形態に係る各機能を実現するソフトウェアのプログラムコードをROM62から読み出してRAM63にロードし、実行する。RAM63には、CPU61の演算処理の途中で発生した変数やパラメーター等が一時的に書き込まれ、これらの変数やパラメーター等がCPU61によって適宜読み出される。ただし、CPU61に代えてMPU(Micro Processing Unit)を用いてもよい。
表示装置65は、例えば、液晶ディスプレイモニターであり、計算機60で行われる処理の結果等を、各システムを使用するユーザーに表示する。入力装置66には、例えば、キーボード、マウス等が用いられ、ユーザーが所定の操作入力、指示を行うことが可能である。
不揮発性ストレージ67としては、例えば、HDD、SSD(Solid State Drive)、フレキシブルディスク、光ディスク、光磁気ディスク、CD-ROM、CD-R、磁気テープ又は不揮発性のメモリ等が用いられる。この不揮発性ストレージ67には、OS(Operating System)、各種のパラメーターの他に、計算機60を機能させるためのプログラムが記録されている。ROM62及び不揮発性ストレージ67は、CPU61が動作するために必要なプログラムやデータ等を記録しており、計算機60によって実行されるプログラムを格納したコンピューター読取可能な非一過性の記憶媒体の一例として用いられる。
ネットワークインターフェイス68には、例えば、NIC(Network Interface Card)等が用いられ、NICの端子に接続されたLAN(Local Area Network)、専用線等を介して各種のデータを装置間で送受信することが可能である。例えば、ネットワークインターフェイス68を介して、制御システム1と分析システム2がデータを送受信することができる。
<制御システム及び分析システムの処理>
次に、制御システム1及び分析システム2全体の処理について、図6~図9を参照して説明する。
図6は、制御システム1及び分析システム2全体の処理の例を示すフローチャートである。なお、図6に破線で示す処理は、制御システム1で行われる処理を表し、図6に実線で示す処理は、分析システム2で行われる処理(機械学習モデル精度分析方法の一例)を表す。
始めに、ブラックボックスモデル作成装置14は、入力データベース13から読み出した学習データを用いて、ブラックボックスモデル15を作成する(S1)。
次に、ホワイトボックスモデル作成部23は、入力データベース13から読み出した学習データを用いて、ホワイトボックスモデル24を作成する(S2)。ここで、図7を参照して、ステップS2のホワイトボックスモデル24の作成処理について説明する。
<ホワイトボックスモデル作成処理>
図7は、ホワイトボックスモデル24の作成処理の例を示すフローチャートである。
始めに、ホワイトボックスモデル作成部23は、学習データが入力されたブラックボックスモデル15から出力される予測値を用意する(S11)。
次に、ホワイトボックスモデル作成部23は、ブラックボックスモデル15から出力された予測値を目的変数とし、ブラックボックスモデル15に入力されたものと同じ学習データを説明変数として、決定木モデル24a(ホワイトボックスモデル24)を作成する(S12)。以下の説明では、このホワイトボックスモデル24が、図3に示した決定木モデル24aで表されるものとする。
次に、ホワイトボックスモデル作成部23は、決定木モデル24a(ホワイトボックスモデル24)の分岐ごとの精度を計算しておく(S13)。そして、ホワイトボックスモデル作成部23は、図6に処理を戻す。
再び図6の説明を続ける。
図6のステップS2でホワイトボックスモデル24が作成された後、制御システム1の運用が開始される。入力データベース13には、制御システム1で用いられた実測値の入力データが蓄積され、精度データ蓄積データベース16には、入力データベース13から読み出された、制御システム1の運用開始後の入力データが蓄積される。
次に、精度判定部21は、入力データが入力されたブラックボックスモデル15から出力される予測値の精度をモニタリングする(S3)。この際、精度判定部21は、精度データ蓄積データベース16に蓄積された実測値と、ブラックボックスモデル15から出力される予測値とを比較して、予測値の精度を算出する。
次に、精度判定部21は、ブラックボックスモデル15の予測値の精度、すなわちブラックボックスモデル15から出力される予測値の精度が悪いか否かを判定する(S4)。精度判定部21は、ブラックボックスモデル15の予測値の精度が悪くないと判定した場合(S4のNO)、再びステップS3に戻って、モニタリングを続ける。
一方、精度判定部21が、ブラックボックスモデル15の予測値の精度が悪いと判定した場合(S4のYES)、精度悪化要因特定部25は、精度悪化要因を特定する処理を行う(S5)。ここで、図8を参照して、精度悪化要因特定部25により行われる、ステップS5に示した精度悪化要因を特定する処理について説明する。
<精度悪化要因の特定処理>
図8は、分析システム2が、ブラックボックスモデル15の予測値の精度悪化要因を特定する処理の例を示すフローチャートである。
始めに、精度悪化要因特定部25は、精度判定部21により、新しい入力データに対して適用されるブラックボックスモデル15の精度が悪くなったと判定された場合、ブラックボックスモデル15に入力されたものと同じ入力データを入力データベース13から読み出し、この入力データを決定木モデル24a(ホワイトボックスモデル24)に適用する(S21)。
次に、精度悪化要因特定部25は、ステップS21で適用された今回の入力データに対して、決定木モデル24aの分岐ごとの精度を算出する(S22)。
次に、精度悪化要因特定部25は、決定木モデル24aの分岐ごとの精度を、ホワイトボックスモデル24に学習データを入力した時(図では「学習データ時」と記載)と、今回の入力データを入力した時(図では「入力データ時」と記載)とで比較する。そして、精度悪化要因特定部25は、精度の差が大きい箇所(例えば、図3の分岐36)を、精度悪化要因の分岐と特定する(S23)。ステップS23の後、精度悪化要因特定部25は、図6に処理を戻す。
ステップS5の後、再モデリング方法提案部26は、ブラックボックスモデル15の再モデリング方法を提案する(S6)。ここで、図9を参照して、ステップS6に示したブラックボックスモデル15の再モデリング方法を提案する処理について説明する。
<再モデリング方法の提案処理>
図9は、再モデリング方法提案部26が、ブラックボックスモデル15の再モデリング方法を提案する処理の例を示すフローチャートである。
始めに、再モデリング方法提案部26は、精度悪化要因特定部25が精度の悪化要因を特定するために用いた、新しい入力データに関して、悪化要因が特定された分岐に注目し、この分岐の期間ごとの精度を計算する。この入力データは、精度悪化要因特定部25により入力データベース13から判定期間で読み出されたものである。そして、再モデリング方法提案部26は、悪化要因が特定された分岐の精度が変化した時点を表す精度の変化点を抽出する(S31)。
次に、再モデリング方法提案部26は、抽出した精度の変化点以降で取得可能な入力データを新しい学習データとしてブラックボックスモデル15を再モデリングする提案を行う(S32)。この提案として、例えば、後述する図10に示す再モデリング方法の提案画面を表示する処理が行われる。
再モデリング方法の提案処理においては、後述する図10に示すような、サービス提供者が確認可能な提案画面W1が表示される。この提案画面W1は、サービス提供者が、機械学習で既に作成されているホワイトボックスモデル24に対して、判定期間の入力データを入力した際に現れる決定木モデルの分岐の発生率がどのように変化するかを確認するために用いられる。また、この提案画面W1には、サービス提供者及び顧客への再モデリング方法が提案される。ステップS32の後、図6に処理が戻り、顧客が再モデリング方法の提案を了承すると、図6のステップS1に戻ってブラックボックスモデル15の再作成が行われる。
ブラックボックスモデル15の再作成の処理では、図6のステップS1で、提案学習データ抽出部27が入力データベース13から抽出した、精度悪化要因特定部25により悪化要因が特定された分岐精度の変化点以降の入力データが再学習用データとして用いられる。そして、ブラックボックスモデル作成装置14がブラックボックスモデル15を再作成する。その後、計測時には、再作成されたブラックボックスモデル15が用いられる。
<再モデリング方法の提案画面>
図10は、再モデリング方法の提案画面W1の表示例を示す図である。この提案画面W1は、例えば、図5に示した表示装置65に表示される。
提案画面W1は、決定木モデル表示部W1a,W1b、グラフ表示部W1cを備える。再モデリング方法提案部26は、ブラックボックスモデル15の学習時に用いられた入力データが入力されたホワイトボックスモデル24の出力結果と、ブラックボックスモデル15の予測値の精度が変化した時点を含む判定期間の入力データが入力されたホワイトボックスモデル24の出力結果とを提案画面W1に示す。
例えば、決定木モデル表示部W1aには、ブラックボックスモデル15が作成された学習時に、ホワイトボックスモデル作成部23が作成したホワイトボックスモデル24が、決定木モデル24aとして表示される。決定木モデル表示部W1aに示される決定木モデル24aには、例えば、2019年8月~12月の学習期間で入力データベース13から取得した1000件の入力データを用いて決定木モデル24aの分岐ごとに算出された事象ごとの件数及び発生率が表示される。
また、決定木モデル表示部W1bには、ブラックボックスモデル15の予測値の精度が悪化したことで、精度悪化要因特定部25がホワイトボックスモデル24を通じて精度悪化要因を特定した時点におけるホワイトボックスモデル24が、決定木モデル24aとして表示される。決定木モデル表示部W1bに示される決定木モデル24aには、例えば、2020年1月~3月の評価期間で入力データベース13から取得した500件の入力データを用いて決定木モデル24aの分岐ごとに算出された事象ごとの件数及び発生率が表示される。そして、決定木モデル表示部W1bには、決定木モデル24aの分岐36にて、リーフ34の発生率が20%低下したことがコメント71と共に表示されている。なお、リーフ35についても、発生率が学習時の10%から計測時の20%に上昇しており、何らかの異常がある。
このように決定木モデル24aで示される事象で発生率の予測精度が変わった場合、この事象に至る経路の分岐(例えば、分岐36)では何らかの状態変化が発生していることが推測される。
グラフ表示部W1cには、発生率が低下した分岐36における発生率の推移を表すグラフが表示される。図中のグラフの横軸は日にち、縦軸は発生率を表す。そして、図1に示したブラックボックスモデル作成装置14がブラックボックスモデル15を作成するために入力データベース13から入力データを読み出した学習期間は、グラフ表示部W1cの左側の2019年08月~12月の間である。一方、制御システム1が本番運用され、ブラックボックスモデル15の予測値の精度が判定される判定期間は、2020年01月~03月の間である。
ここで、学習時におけるリーフ34の発生率の平均が50%であるのに対して、計測時におけるリーフ34の発生率の平均が30%であることが表示される。特に、計測時の2020年2月からリーフ34の発生率が低下しており、ブラックボックスモデル15の予測値が変化している。
そこで、グラフ表示部W1cの下部には、ホワイトボックスモデル24が合わなくなっている個所(例えば、2020年2月)以降のデータで再学習することを提案するコメント72が表示される。このように再モデリング方法提案部26は、精度悪化要因特定部25により特定された予測値の精度が変化した要因を示し、ブラックボックスモデル15の予測値の精度を判定する判定条件の変更を提案する。この際、再モデリング方法提案部26は、ブラックボックスモデル15の予測値の精度が変化した時点を示し、判定条件の変更として、再モデリングで用いられる入力データを取得する期間を提案することができる。なお、ブラックボックスモデル15の再作成に必要な再学習用データのデータ数が少ない場合には、再学習用データを閾値まで蓄積することを促す提案がされてもよい。
以上説明した第1の実施の形態に係る分析システム2では、制御システム1で使用されるブラックボックスモデル15を模して作成されたホワイトボックスモデル24を用いて、正常状態のブラックボックスモデル15から出力される予測値との差異を抽出する。そして、分析システム2は、精度悪化要因の特定、及び、予測値の精度を改善するためのブラックボックスモデル15の再モデリング方法をサービス提供者に提供することができる。このため、サービス提供者は、精度悪化要因、及び再モデリング方法を顧客に通知することで、顧客にブラックボックスモデル15の再作成を促すことができる。
ここで、ホワイトボックスモデル24として、例えば、制御システム1の実行環境で使用される入力データが入力され、分岐ごとの発生率が算出される決定木モデル24a、入力データで表される事象がクラスタリングされたクラスタリングモデル24bなどが用いられる。このようにホワイトボックスモデル24により、ブラックボックスモデル15の処理が可視化される。このため、ブラックボックスモデル15の予測値の精度が変化した箇所や、計測時に入力された入力データがどのように学習時と異なるかをサービス提供者が把握することができる。
また、図10に示したように、どの時点からの入力データを使って再モデリングすればよいかをサービス提供者が把握することができる。このため、サービス提供者は、顧客がブラックボックスモデル15を再作成するために必要な情報を提供することができる。そして、顧客は、通知された再モデリング方法を用いて、予測値の精度が改善したブラックボックスモデル15を再び作成し、再作成したブラックボックスモデル15を制御システム1で使用することができる。
[第2の実施の形態]
次に、本発明の第2の実施の形態に係るブラックボックス化された機械学習モデルの機械学習モデル精度分析システムについて説明する。本実施の形態に係る機械学習モデル精度分析システムでは、学習データの取得時と、計測時の入力データの取得時とで、特定の事象の発生率が大きく変化した場合に、発生率の変化が大きい分岐条件を削除してブラックボックスモデルの再学習(再モデリング方法)を提案するものである。第2の実施の形態に係る機械学習モデル精度分析システムの一例として、上述した第1の実施の形態に係る分析システム2が用いられる。ここでは、ブラックボックスモデル15の再モデリング方法を提案する処理、及び再モデリング方法の提案画面について説明する。
図11は、第2の実施の形態に係る再モデリング方法提案部26が、ブラックボックスモデル15の再モデリング方法を提案する処理の例を示すフローチャートである。図11に示す処理は、図6を参照して既に説明した、精度悪化要因特定処理(S5)の後に行われる。
始めに、再モデリング方法提案部26は、精度悪化要因特定部25が精度の悪化要因を特定するために用いた新しい入力データに関して、悪化要因が特定された分岐に注目し、この分岐の期間ごとの精度を計算する。この入力データは、精度悪化要因特定部25により入力データベース13から判定期間で読み出されたものである。そして、再モデリング方法提案部26は、決定木モデルの分岐ごとの精度を学習時と今回の入力データの入力時とで比較し、精度の差の平均が大きい項目(本実施形態では分岐条件)を抽出する(S41)。
次に、再モデリング方法提案部26は、抽出した項目を除外したデータを新しい学習データとして、ブラックボックスモデル15を再モデリングする提案を行う(S42)。この提案として、例えば、後述する図12に示す再モデリング方法の提案画面を表示する処理が行われる。その後、図6に処理が戻り、顧客が再モデリング方法の提案を了承すると、図6のステップS1に戻ってブラックボックスモデル15の再作成が行われる。
<再モデリング方法の提案画面>
図12は、再モデリング方法の提案画面W2の表示例を示す図である。この提案画面W2は、例えば、図5に示した表示装置65に表示される。
提案画面W2は、図10に示した提案画面W1と同様に決定木モデル表示部W1a,W1bを備える。再モデリング方法提案部26は、ブラックボックスモデル15の学習時に用いられた入力データが入力されたホワイトボックスモデル24の出力結果と、ブラックボックスモデル15の予測値の精度が大きく変化した時点を含む判定期間の入力データが入力されたホワイトボックスモデル24の出力結果とを提案画面W2に示す。
例えば、決定木モデル表示部W1aには、ブラックボックスモデル15が作成された学習時に、ホワイトボックスモデル作成部23が作成したホワイトボックスモデル24が、決定木モデル24aとして表示される。学習時に作成された決定木モデル24aのノード81で表される事象の発生率が50%であり、回転数が20回未満であるリーフ82で表される事象の発生率が65%であり、回転数が20回以上であるリーフ83で表される事象の発生率が35%であったとする。同様に、決定木モデル24aのノード84で表される事象の発生率が20%であり、回転数が10回未満であるリーフ85で表される事象の発生率が40%であり、回転数が10回以上であるリーフ86で表される事象の発生率が7%であったとする。
決定木モデル表示部W1bには、ブラックボックスモデル15の予測値の精度が悪化したことで、精度悪化要因特定部25がホワイトボックスモデル24を通じて精度悪化要因を特定した時点におけるホワイトボックスモデル24が、決定木モデル24aとして表示される。決定木モデル24aで示される事象で発生率の予測精度が変わった場合、この事象に至る経路の分岐(例えば、分岐87,88)では何らかの状態変化が発生していることが推測される。分岐87では、項目「回転数」の発生率が、分岐87の左側で35%低下し、分岐87の右側で15%上昇したことが、コメント91に示されている。そして、分岐87では、項目「回転数」の発生率の変化の平均は、25%(=(35%+15%)/2)と計算される。
同様に、分岐88では、項目「回転数」の発生率が、分岐88の左側で25%低下し、分岐88の右側で23%上昇したことが、コメント92に示されている。そして、分岐88では、項目「回転数」の発生率の変化の平均は、24%(=(25%+23%)/2)と計算される。このため、分岐87,88の項目「回転数」の発生率の変化の全体平均は、24.5%(=(25%+24%)/2)と計算される。このように項目「回転数」の発生率の変化の全体平均が、閾値(例えば、15%)以上であれば、項目「回転数」は、決定木モデル24aの構成とするにはふさわしくない。そこで、提案画面W2の下部には、「発生率の変化の平均が24.5%である項目「回転数」は除外して、再学習をおすすめします。」というコメント93が表示される。このように再モデリング方法提案部26は、判定条件の変更として、精度悪化要因特定部25により特定された要因により、発生率の変化が閾値より大きくなった分岐条件の削除を提案する。そして、サービス提供者は、顧客に対して、項目「回転数」を除外して、ブラックボックスモデル15の再学習を勧めることができる。
ここで、再モデリング方法提案部26により提案される項目「回転数」の除外とは、20回で区切った分岐87、10回で区切った分岐88のいずれをも除外して、決定木モデルを再構成することである。ただし、既に構築されている決定木の構成は特段意識されず、単に項目「回転数」を説明変数に加えずに決定木を作り直す処理が、ブラックボックスモデル作成装置14及びホワイトボックスモデル作成部23によって行われることとなる。
ブラックボックスモデル15の再作成の処理では、図6のステップS1で、提案学習データ抽出部27が入力データベース13から抽出した、精度悪化要因特定部25により悪化要因が特定された分岐精度の変化点以降の入力データが再学習用データとして用いられる。そして、ブラックボックスモデル作成装置14は、事象の発生率の変化が大きい分岐条件を削除、つまり項目「回転数」を除外して、ブラックボックスモデル15を再作成する。また、ホワイトボックスモデル作成部23についても、事象の発生率の変化が大きい分岐条件を削除して、ホワイトボックスモデル24を再作成する。その後の計測時には、制御システム1において、再作成されたブラックボックスモデル15が用いられる。
以上説明した第2の実施の形態に係る分析システム2では、学習時に比べて計測時における分岐の項目の発生率が大きく変化したことにより、ブラックボックスモデル15の予測値の精度が悪化したことが判明した場合、この分岐条件を削除して、ブラックボックスモデル15を再学習(再モデリング方法)することが提案される。このため、顧客は、サービス提供者から通知された再モデリング方法を用いて、予測値の精度が改善したブラックボックスモデル15を再び作成し、再作成したブラックボックスモデル15を制御システム1で使用することができる。また、サービス提供者においても、ブラックボックスモデル15の予測値の精度が悪化したことに起因する分岐条件を削除して、ホワイトボックスモデル24を再作成し、制御システム1の処理を可視化することができる。
また、再モデリング方法提案部26は、図10の決定木モデル表示部W1aに示したグラフ表示部W1cを、図12の決定木モデル表示部W1bに付して表示してもよい。グラフ表示部W1cが表示されることで、サービス提供者は、どの時点からの入力データを使って再モデリングすればよいかを把握しやすくなる。
[変形例]
なお、上述した実施の形態では、分析システム2が精度判定部21及び提案学習データ抽出部27を含む構成としたが、制御システム1が精度判定部21及び提案学習データ抽出部27のうち、少なくとも一つを含む構成としてもよい。このような構成とした場合、分析システム2は、制御システム1で稼働する精度判定部21が不良の精度判定結果を出力したタイミングで、精度悪化要因特定部25及び再モデリング方法提案部26の処理を行ってもよい。
また、分析システム2がブラックボックスモデル作成装置14を備える構成として、分析システム2内でブラックボックスモデル15を有してもよい。そして、サービス提供者は、顧客にブラックボックスモデル15を提供するサービスを提供してもよい。
また、上述した実施の形態では、ブラックボックスモデル15及びホワイトボックスモデル24の作成に際して用いられる入力データが学習期間で読み出され、その後、ブラックボックスモデル15から出力される予測値の精度が変化したことは判定期間で読み出された入力データが用いられることとした。しかし、学習期間と判定期間とは重なっていてもよい。
なお、本発明は上述した実施の形態に限られるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りその他種々の応用例、変形例を取り得ることは勿論である。
例えば、上述した実施の形態は本発明を分かりやすく説明するためにシステムの構成を詳細かつ具体的に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されない。また、本実施の形態の構成の一部について、他の構成の追加、削除、置換をすることも可能である。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
1…制御システム、2…分析システム、13…入力データベース、14…ブラックボックスモデル作成装置、15…ブラックボックスモデル、16…精度データ蓄積データベース、21…精度判定部、22…検証部、23…ホワイトボックスモデル作成部、24…ホワイトボックスモデル、25…精度悪化要因特定部、26…再モデリング方法提案部、27…提案学習データ抽出部
そして、精度悪化要因特定部25は、学習期間に算出される事象の発生率と、判定期間に算出される事象の発生率との変化量が、閾値よりも大きくなった場合に、決定木の分岐条件を予測値の精度が変化した要因として特定する。特定された精度悪化要因は、再モデリング方法提案部26により表示装置65に表示される。このように、ホワイトボックスモデル24として決定木モデル24aが用いられると、サービス提供者は、ブラックボックスモデル15の予測値の精度悪化要因を把握しやすくなる。
そして、精度悪化要因特定部25は、学習期間に算出される事象の発生率と、判定期間に算出される事象の発生率との変化量が、閾値よりも大きくなった場合に、変化量が大きくなったクラスタの特徴を予測値の精度が変化した要因として特定する。精度悪化要因特定部25により特定された精度悪化要因は、再モデリング方法提案部26により表示装置65に表示される。このように、ホワイトボックスモデル24としてクラスタリングモデル24bが用いられると、サービス提供者は、ブラックボックスモデル15の予測値の精度悪化要因を把握しやすくなる。
そこで、グラフ表示部W1cの下部には、ホワイトボックスモデル24が合わなくなっている個所(例えば、2020年2月)以降のデータで再学習することを提案するコメント72が表示される。このように再モデリング方法提案部26は、精度悪化要因特定部25により特定された予測値の精度が変化した要因を示し、再モデリングで用いられる入力データの条件の変更を提案する。この際、再モデリング方法提案部26は、分岐36の発生率が低下した時点をブラックボックスモデル15の予測値の精度が低下した時点として示し、再モデリングで用いられる入力データの条件として、再モデリングで用いられる入力データを取得する期間を提案することができる。なお、ブラックボックスモデル15の再作成に必要な再学習用データのデータ数が少ない場合には、再学習用データを閾値まで蓄積することを促す提案がされてもよい。
同様に、分岐88では、項目「回転数」の発生率が、分岐88の左側で25%低下し、分岐88の右側で23%上昇したことが、コメント92に示されている。そして、分岐88では、項目「回転数」の発生率の変化の平均は、24%(=(25%+23%)/2)と計算される。このため、分岐87,88の項目「回転数」の発生率の変化の全体平均は、24.5%(=(25%+24%)/2)と計算される。このように項目「回転数」の発生率の変化の全体平均が、閾値(例えば、15%)以上であれば、項目「回転数」は、決定木モデル24aの構成とするにはふさわしくない。そこで、提案画面W2の下部には、「発生率の変化の平均が24.5%である項目「回転数」は除外して、再学習をおすすめします。」というコメント93が表示される。このように再モデリング方法提案部26は、精度悪化要因特定部25により特定された要因により、発生率の変化が閾値より大きくなった分岐条件の削除を提案する。そして、サービス提供者は、顧客に対して、項目「回転数」を除外して、ブラックボックスモデル15の再学習を勧めることができる。

Claims (13)

  1. 制御システムで使用される制御対象機器に対して制御装置が行った処理の結果を含む入力データが蓄積された入力データベースより、予め設定された学習期間で読み出した前記入力データに基づいて学習されるブラックボックス化された機械学習モデルであって、前記入力データから前記処理の結果を予測値として出力可能な前記ブラックボックス化された機械学習モデルの作成に合わせて、前記ブラックボックス化された機械学習モデルの作成に用いられた前記入力データを説明変数とし、前記ブラックボックス化された機械学習モデルが出力する予測値を目的変数としてホワイトボックスモデルを作成するホワイトボックスモデル作成部と、
    前記ブラックボックス化された機械学習モデルの予測値の精度が判定される判定期間に、前記ブラックボックス化された機械学習モデルから出力される前記予測値の精度が変化したことが判定されると、前記判定期間に蓄積された前記入力データを前記ホワイトボックスモデルに入力して、前記予測値の精度が変化した要因を特定する要因特定部と、を備える
    機械学習モデル精度分析システム。
  2. 前記判定期間に、前記ブラックボックス化された機械学習モデルから出力される前記予測値の精度が閾値よりも変化した場合に、前記予測値の精度が悪化したと判定する精度判定部を備え、
    前記要因特定部は、前記精度判定部により前記予測値の精度が悪化したと判定された場合に、前記予測値の精度が変化した要因を特定する
    請求項1に記載の機械学習モデル精度分析システム。
  3. 前記要因特定部により前記予測値の精度が変化した要因が特定されると、前記ブラックボックス化された機械学習モデルの再モデリング方法を提案する提案部を備える
    請求項2に記載の機械学習モデル精度分析システム。
  4. 前記提案部は、前記要因特定部により特定された前記予測値の精度が変化した要因を示し、前記ブラックボックス化された機械学習モデルの予測値の精度を判定する判定条件の変更を提案する
    請求項3に記載の機械学習モデル精度分析システム。
  5. 前記提案部は、前記ブラックボックス化された機械学習モデルの学習時に用いられた前記入力データが入力された前記ホワイトボックスモデルの出力結果と、前記ブラックボックス化された機械学習モデルの前記予測値の精度が変化した時点を含む前記判定期間の前記入力データが作成された前記ホワイトボックスモデルの出力結果とを示す
    請求項4に記載の機械学習モデル精度分析システム。
  6. 前記提案部により指示された、前記ブラックボックス化された機械学習モデルの再モデリング方法に基づいて前記入力データベースから抽出した前記入力データを、前記ブラックボックス化された機械学習モデルを作成するブラックボックス化された機械学習モデルの作成装置に出力する抽出部を備える
    請求項3に記載の機械学習モデル精度分析システム。
  7. 前記ホワイトボックスモデルは、所定の発生率で前記制御対象機器に出現する事象を所定の条件で分岐する決定木により前記事象を特定する決定木モデルで表され、
    前記要因特定部は、前記判定期間に蓄積された前記入力データを前記決定木モデルに入力して、前記決定木の分岐ごとに前記事象の発生率を算出し、
    前記学習期間における前記事象の発生率が予測される前記予測値と、前記判定期間における前記事象の発生率が予測される前記予測値との変化量が、閾値よりも大きくなった場合に、前記決定木の分岐条件を前記予測値の精度が変化した要因として特定する
    請求項1~6のいずれか一項に記載の機械学習モデル精度分析システム。
  8. 前記提案部は、前記ブラックボックス化された機械学習モデルの前記予測値の精度が変化した時点を示し、前記判定条件の変更として、前記再モデリングで用いられる前記入力データを取得する期間を提案する
    請求項7に記載の機械学習モデル精度分析システム。
  9. 前記提案部は、前記判定条件の変更として、前記要因特定部により特定された前記要因により、前記発生率の変化が前記閾値より大きくなった分岐条件の削除を提案する
    請求項7に記載の機械学習モデル精度分析システム。
  10. 前記ホワイトボックスモデルは、前記制御対象機器に出現する事象を、同じ特徴を持つ部分集合に分割したクラスタごとに分類するクラスタリングモデルで表され、
    前記要因特定部は、前記判定期間に蓄積された前記入力データを前記クラスタリングモデルに入力して、前記クラスタごとに前記事象の発生率を算出し、
    前記学習期間における前記事象の発生率が予測される前記予測値と、前記判定期間における前記事象の発生率が予測される前記予測値との変化量が、閾値よりも大きくなった場合に、前記変化量が大きくなった前記クラスタについて、距離が最も近いクラスタとの中心間の距離を算出し、
    前記距離における距離成分が最も大きい説明変数を前記予測値の精度が変化した要因として特定する
    請求項1~6のいずれか一項に記載の機械学習モデル精度分析システム。
  11. 前記制御装置が前記制御対象機器に行った処理は、前記制御対象機器が加工した加工物を計測する処理を含む
    請求項1に記載の機械学習モデル精度分析システム。
  12. 制御システムで使用される制御対象機器に対して制御装置が行った処理の結果が蓄積された入力データベースより、予め設定された学習期間で読み出した入力データに基づいて学習されるブラックボックス化された機械学習モデルであって、前記入力データから前記処理の結果を予測値として出力可能な前記ブラックボックス化された機械学習モデルの作成に合わせて、前記ブラックボックス化された機械学習モデルの作成に用いられた前記入力データを説明変数とし、前記ブラックボックス化された機械学習モデルが出力する予測値を目的変数としたホワイトボックスモデルを作成するステップと、
    前記ブラックボックス化された機械学習モデルの予測値の精度が判定される判定期間に、前記ブラックボックス化された機械学習モデルから出力される前記予測値の精度が変化したことが判定されると、前記判定期間に蓄積された前記入力データを前記ホワイトボックスモデルに入力して、前記予測値の精度が変化した要因を特定するステップと、を含む
    機械学習モデル精度分析方法。
  13. 制御システムで使用される制御対象機器に対して制御装置が行った処理の結果が蓄積された入力データベースより、予め設定された学習期間で読み出した入力データに基づいて学習されるブラックボックス化された機械学習モデルであって、前記入力データから前記処理の結果を予測値として出力可能な前記ブラックボックス化された機械学習モデルの作成に合わせて、前記ブラックボックス化された機械学習モデルの作成に用いられた前記入力データを説明変数とし、前記ブラックボックス化された機械学習モデルが出力する予測値を目的変数としたホワイトボックスモデルを作成する手順と、
    前記ブラックボックス化された機械学習モデルの予測値の精度が判定される判定期間に、前記ブラックボックス化された機械学習モデルから出力される前記予測値の精度が変化したことが判定されると、前記判定期間に蓄積された前記入力データを前記ホワイトボックスモデルに入力して、前記予測値の精度が変化した要因を特定する手順と、を
    コンピューターに実行させるためのプログラム。
JP2020152054A 2020-09-10 2020-09-10 機械学習モデル精度分析システム、機械学習モデル精度分析方法及びプログラム Active JP6899475B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020152054A JP6899475B1 (ja) 2020-09-10 2020-09-10 機械学習モデル精度分析システム、機械学習モデル精度分析方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020152054A JP6899475B1 (ja) 2020-09-10 2020-09-10 機械学習モデル精度分析システム、機械学習モデル精度分析方法及びプログラム

Publications (2)

Publication Number Publication Date
JP6899475B1 JP6899475B1 (ja) 2021-07-07
JP2022046145A true JP2022046145A (ja) 2022-03-23

Family

ID=76650139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020152054A Active JP6899475B1 (ja) 2020-09-10 2020-09-10 機械学習モデル精度分析システム、機械学習モデル精度分析方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6899475B1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018142753A1 (ja) * 2017-02-02 2018-08-09 日本電気株式会社 ディープラーニングを用いる情報処理装置、情報処理方法及び情報処理プログラム
WO2020026643A1 (ja) * 2018-08-03 2020-02-06 ソニー株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018142753A1 (ja) * 2017-02-02 2018-08-09 日本電気株式会社 ディープラーニングを用いる情報処理装置、情報処理方法及び情報処理プログラム
WO2020026643A1 (ja) * 2018-08-03 2020-02-06 ソニー株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"説明できるAI Solution XAIの活用で、継続的なAI運用と改善を支援する「AI導入・運用支", はいたっく, vol. 通巻629号, JPN6021000675, 20 March 2020 (2020-03-20), pages 13 - 14, ISSN: 0004425934 *
GUIDOTTI, RICCARDO ET AL., A SURVEY OF METHODS FOR EXPLAINING BLACK BOX MODELS [ONLINE], JPN7021000084, August 2018 (2018-08-01), ISSN: 0004425935 *

Also Published As

Publication number Publication date
JP6899475B1 (ja) 2021-07-07

Similar Documents

Publication Publication Date Title
CN108375715B (zh) 一种配电网线路故障风险日预测方法及系统
US11487996B2 (en) Real-time predictive maintenance of hardware components using a stacked deep learning architecture on time-variant parameters combined with a dense neural network supplied with exogeneous static outputs
CN113010389B (zh) 一种训练方法、故障预测方法、相关装置及设备
JP5151556B2 (ja) 工程解析装置、工程解析方法および工程解析プログラム
CN111459700A (zh) 设备故障的诊断方法、诊断装置、诊断设备及存储介质
US11385782B2 (en) Machine learning-based interactive visual monitoring tool for high dimensional data sets across multiple KPIs
JP7304698B2 (ja) 水需要予測方法およびシステム
WO2024078339A1 (zh) 基于车辆历史数据的故障预测方法、系统和存储介质
CN109783384A (zh) 日志用例测试方法、日志用例测试装置和电子设备
Patel et al. Doctor for machines: a failure pattern analysis solution for industry 4.0
Rosli et al. The design of a software fault prone application using evolutionary algorithm
Sousa et al. Applying Machine Learning to Estimate the Effort and Duration of Individual Tasks in Software Projects
JP6899475B1 (ja) 機械学習モデル精度分析システム、機械学習モデル精度分析方法及びプログラム
CN109711665A (zh) 一种基于金融风控数据的预测模型构建方法及相关设备
JP6257986B2 (ja) 対話型設備不良予測方法及び対話型設備不良予測システム
JP7062505B2 (ja) 設備管理支援システム
CN112668415A (zh) 一种飞机发动机故障预测方法
WO2017009888A1 (ja) プロジェクトリスク管理システムおよびプロジェクトリスク管理方法
JP2019066989A (ja) 評価システム、評価方法及びプログラム
Engström et al. Decision support for test management and scope selection in a software product line context
Aikhuele et al. A hybrid fuzzy model for lean product development performance measurement
JP7154468B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Oliveira et al. Framework for Quality Assurance and Quality Control in DL Systems
Laukkanen Quality 4.0 enabling cost of poor quality measurement
US20240077865A1 (en) Information processing apparatus, information processing method, and computer-readable recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200910

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200910

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200918

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210614

R150 Certificate of patent or registration of utility model

Ref document number: 6899475

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150