JP2023140233A - モデル検証装置、モデル検証方法、および、モデル検証プログラム - Google Patents
モデル検証装置、モデル検証方法、および、モデル検証プログラム Download PDFInfo
- Publication number
- JP2023140233A JP2023140233A JP2022046154A JP2022046154A JP2023140233A JP 2023140233 A JP2023140233 A JP 2023140233A JP 2022046154 A JP2022046154 A JP 2022046154A JP 2022046154 A JP2022046154 A JP 2022046154A JP 2023140233 A JP2023140233 A JP 2023140233A
- Authority
- JP
- Japan
- Prior art keywords
- verification
- model
- learning
- range
- machine learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012795 verification Methods 0.000 title claims abstract description 302
- 238000000034 method Methods 0.000 title claims description 22
- 238000010801 machine learning Methods 0.000 claims abstract description 134
- 230000006399 behavior Effects 0.000 claims abstract description 90
- 230000004044 response Effects 0.000 claims abstract description 28
- 238000003860 storage Methods 0.000 claims abstract description 26
- 230000009471 action Effects 0.000 claims description 67
- 239000003086 colorant Substances 0.000 claims description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 30
- 230000006870 function Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 8
- 230000003542 behavioural effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000010865 sewage Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D9/00—Level control, e.g. controlling quantity of material stored in vessel
- G05D9/12—Level control, e.g. controlling quantity of material stored in vessel characterised by the use of electric means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Mechanical Engineering (AREA)
- Life Sciences & Earth Sciences (AREA)
- Robotics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Feedback Control In General (AREA)
Abstract
【課題】設備に設けられた制御対象を制御するために学習サンプルを用いて機械学習されたモデル検証装置を提供する。【解決手段】制御対象が設けられた設備の状態を示す状態データ、および、前記制御対象に与える操作量を決定するための行動を示す行動データを含む学習サンプルを用いて、前記設備の状態に応じた行動を出力するように機械学習された機械学習モデルを記憶するモデル記憶部と、前記学習サンプルの範囲を示す学習範囲を特定する学習範囲特定部と、前記学習範囲外における、前記設備の複数の状態を示す検証データを取得する検証データ取得部と、前記検証データを入力したことに応じて前記機械学習モデルが出力する複数の行動を示す検証結果を出力する検証結果出力部と、を備える、モデル検証装置を提供する。【選択図】図1
Description
本発明は、モデル検証装置、モデル検証方法、および、モデル検証プログラムに関する。
特許文献1には、「記録した制御則…を画面に表示」することが記載されている。特許文献2には、「事例ベースモデル」が記載されている。特許文献3には、「自律学習型制御器」が記載されている。特許文献4には、「学習の状況を監視する」ことが記載されている。特許文献5には、「運転員に制御対象の操作量を提示する」ことが記載されている。
[先行技術文献]
[特許文献]
[特許文献1] 特開2019-159876
[特許文献2] 特開2007-156881
[特許文献3] 特開2015-028783
[特許文献4] 特開2018-106466
[特許文献5] 特開2021-137748
[先行技術文献]
[特許文献]
[特許文献1] 特開2019-159876
[特許文献2] 特開2007-156881
[特許文献3] 特開2015-028783
[特許文献4] 特開2018-106466
[特許文献5] 特開2021-137748
本発明の第1の態様においては、モデル検証装置を提供する。前記モデル検証装置は、制御対象が設けられた設備の状態を示す状態データ、および、前記制御対象に与える操作量を決定するための行動を示す行動データを含む学習サンプルを用いて、前記設備の状態に応じた行動を出力するように機械学習された機械学習モデルを記憶するモデル記憶部を備えてよい。前記モデル検証装置は、前記学習サンプルの範囲を示す学習範囲を特定する学習範囲特定部を備えてよい。前記モデル検証装置は、前記学習範囲外における、前記設備の複数の状態を示す検証データを取得する検証データ取得部を備えてよい。前記モデル検証装置は、前記検証データを入力したことに応じて前記機械学習モデルが出力する複数の行動を示す検証結果を出力する検証結果出力部を備えてよい。
前記検証結果出力部は、前記検証結果とともに前記学習範囲内における行動を出力してよい。
前記検証結果出力部は、前記検証結果を、前記学習範囲内における行動とは識別可能に出力してよい。
前記検証結果出力部は、前記複数の行動を前記複数の状態と対応付けた行動マップを出力してよい。
前記検証結果出力部は、前記複数の行動を前記設備の複数の物理量に係る前記複数の状態と対応付けた行動マップを出力してよい。
前記検証結果出力部は、前記複数の行動を、行動の内容に応じて異なる濃度で出力してよい。
前記検証結果出力部は、前記複数の行動を、行動の内容に応じて異なる色で出力してよい。
前記モデル検証装置は、前記検証データの範囲を示す検証範囲を指定する検証範囲指定部を更に備えてよい。前記モデル検証装置は、前記検証範囲に基づいて前記検証データを生成する検証データ生成部を更に備えてよい。
前記モデル検証装置は、前記学習サンプルとなるサンプルデータを取得するサンプルデータ取得部を更に備えてよい。前記モデル検証装置は、前記学習サンプルを用いた機械学習により前記機械学習モデルを生成するモデル生成部を更に備えてよい。
前記モデル検証装置は、前記検証結果が出力されたことに応じて、ユーザ入力を受け付けるユーザ入力部を更に備えてよい。
前記モデル検証装置は、前記ユーザ入力に応じて、前記機械学習モデルを出力するモデル出力部を更に備えてよい。
前記モデル検証装置は、前記ユーザ入力に応じて、前記機械学習モデルを用いた前記制御対象の制御を開始する制御部を更に備えてよい。
本発明の第2の態様においては、モデル検証方法を提供する。前記モデル検証方法は、制御対象が設けられた設備の状態を示す状態データ、および、前記制御対象に与える操作量を決定するための行動を示す行動データを含む学習サンプルを用いて、前記設備の状態に応じた行動を出力するように機械学習された機械学習モデルを記憶することを備えてよい。前記モデル検証方法は、前記学習サンプルの範囲を示す学習範囲を特定することを備えてよい。前記モデル検証方法は、前記学習範囲外における、前記設備の複数の状態を示す検証データを取得することを備えてよい。前記モデル検証方法は、前記検証データを入力したことに応じて前記機械学習モデルが出力する複数の行動を示す検証結果を出力することを備えてよい。
本発明の第3の態様においては、モデル検証プログラムを提供する。前記モデル検証プログラムは、コンピュータにより実行されてよい。前記モデル検証プログラムは、前記コンピュータを、制御対象が設けられた設備の状態を示す状態データ、および、前記制御対象に与える操作量を決定するための行動を示す行動データを含む学習サンプルを用いて、前記設備の状態に応じた行動を出力するように機械学習された機械学習モデルを記憶するモデル記憶部して機能させてよい。前記モデル検証プログラムは、前記コンピュータを、前記学習サンプルの範囲を示す学習範囲を特定する学習範囲特定部として機能させてよい。前記モデル検証プログラムは、前記コンピュータを、前記学習範囲外における、前記設備の複数の状態を示す検証データを取得する検証データ取得部として機能させてよい。前記モデル検証プログラムは、前記コンピュータを、前記検証データを入力したことに応じて前記機械学習モデルが出力する複数の行動を示す検証結果を出力する検証結果出力部として機能させてよい。
なお、上記の発明の概要は、本発明の特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、第1の実施形態に係るモデル検証装置100のブロック図の一例を示す。モデル検証装置100は、設備に設けられた制御対象を制御するために学習サンプルを用いて機械学習されたモデルを検証する。この際、モデル検証装置100は、学習サンプルの範囲外において検証対象とするモデルがどのような行動を出力するのかを検証し、結果を出力する。
設備は、制御対象が設けられた施設や装置等である。例えば、設備は、プラントであってもよいし、複数の機器を複合させた複合装置であってもよい。プラントとしては、化学やバイオ等の工業プラントの他、ガス田や油田等の井戸元やその周辺を管理制御するプラント、水力・火力・原子力等の発電を管理制御するプラント、太陽光や風力等の環境発電を管理制御するプラント、上下水やダム等を管理制御するプラント等が挙げられる。
これより先、設備が、プロセス装置の1つである三段水槽である場合を一例として説明する。三段水槽は、貯水タンクからポンプで水をくみ上げ、三段目(一番上)の水槽(「上段タンク」ともいう)に水を注ぎ、それが二段目(真ん中)の水槽(「中段タンク」ともいう)、一段目(一番下)の水槽(「下段タンク」ともいう)へと順次流れていき、再び貯水タンクに戻る循環システムである。このような三段水槽においては、一例として、一段目の水槽の水位を任意の値(例えば、30)に調整することを目標として、三段目の水槽へ注ぐ水の流量を制御すべく、貯水タンクから三段目の水槽の間の制御経路に設けられたバルブが開閉制御される。
制御対象は、設備に設けられ、制御の対象となる機器および装置等である。例えば、制御対象は、設備のプロセスにおける物体の量、温度、圧力、流量、速度、および、pH等の少なくとも1つの物理量を制御する、バルブ、ヒータ、モータ、ファン、および、スイッチ等のアクチュエータであってよく、操作量MV(Manipulated Variable)に応じた所要の操作を実行する。一例として、設備が三段水槽である場合、制御対象は、制御経路に設けられたバルブであってよい。
このような制御対象が設けられた設備には、設備の内外における様々な状態(物理量)を測定可能な1または複数のセンサが設けられていてよい。一例として、設備が三段水槽である場合、センサは、各水槽の水位や制御経路の流量等を測定した測定値PV(Process Variable)を出力してよい。設備の状態を示す状態データには、このような測定値PVが含まれていてよい。また、状態データには、制御対象であるバルブの開閉度を示す操作量MVが含まれていてよい。状態データには、このように制御対象を制御した結果の運転状態を示す運転データに加えて、設備におけるエネルギーや原材料の消費量を示す消費量データや、制御対象の制御に対して外乱として作用し得る物理量を示す外乱環境データ等が含まれていてもよい。
三段水槽において、制御対象であるバルブを開閉制御するにあたり、PID(Proportional Integral Differential)制御が用いられる場合、オーバーシュートが発生し、一段目の水槽の水位が、例えば、目標値DV(Desired Variable)の±5%以内とする制定値に入るまでに長い時間を要することがあった。そこで、このようなバルブを開閉制御するにあたり、機械学習により生成された機械学習モデルが用いられることが考えられる。モデル検証装置100は、一例として、このような三段水槽においてバルブの開閉を制御するために機械学習された機械学習モデルを検証対象としてよい。
モデル検証装置100は、PC(パーソナルコンピュータ)、タブレット型コンピュータ、スマートフォン、ワークステーション、サーバコンピュータ、または汎用コンピュータ等のコンピュータであってよく、複数のコンピュータが接続されたコンピュータシステムであってもよい。このようなコンピュータシステムもまた広義のコンピュータである。また、モデル検証装置100は、コンピュータ内で1または複数実行可能な仮想コンピュータ環境によって実装されてもよい。これに代えて、モデル検証装置100は、機械学習モデルの検証用に設計された専用コンピュータであってもよく、専用回路によって実現された専用ハードウェアであってもよい。また、モデル検証装置100がインターネットに接続可能な場合、モデル検証装置100は、クラウドコンピューティングにより実現されてもよい。
モデル検証装置100は、モデル記憶部110と、学習範囲特定部120と、検証データ取得部130と、検証結果出力部140とを備える。なお、これらブロックは、それぞれ機能的に分離された機能ブロックであって、実際のデバイス構成とは必ずしも一致していなくてもよい。すなわち、本図において、1つのブロックとして示されているからといって、それが必ずしも1つのデバイスにより構成されていなくてもよい。また、本図において、別々のブロックとして示されているからといって、それらが必ずしも別々のデバイスにより構成されていなくてもよい。
モデル記憶部110は、機械学習モデル115を記憶する。機械学習モデル115は、制御対象が設けられた設備の状態を示す状態データ、および、制御対象に与える操作量MVを決定するための行動を示す行動データを含む学習サンプルを用いて、設備の状態に応じた行動を出力するように機械学習されたモデルである。ここで、このような機械学習モデル115は、他の装置が機械学習により生成したものであってもよいし、後述するように、モデル検証装置100自身が機械学習により生成したものであってもよい。
機械学習モデル115には、状態に応じて行動を決定するポリシーが保存される。一例として、機械学習モデル115は、学習サンプルとして複数のサンプルデータを保存したテーブルを有していてよい。このようなテーブルは、設備の状態と、制御対象に与える操作量MVを決定するための行動との組み合わせ、および、当該組み合わせに対する重みで構成されていてよい。テーブルの詳細については、後述する。
このような機械学習モデル115において、例えば次のようにして、設備の状態に応じた行動を出力してよい。機械学習モデル115は、入力された状態データと選択肢に含まれる各行動との組み合わせについて、テーブルに保存された各サンプルデータとの間でカーネル計算を行い、各サンプルデータとの間の距離をそれぞれ算出してよい。次に、機械学習モデル115は、各サンプルデータについて算出した距離にそれぞれの重みを乗算したものを順次足し合わせ、組み合わせ毎に評価値を算出してよい。そして、機械学習モデル115は、評価値が最も高い組み合わせにおける行動を次の行動として選択し、出力してよい。
また、このようにして選択された行動に基づいて、強化学習が実行されてよい。一例として、各サンプルデータ、および、当該サンプルデータに対する報酬値に基づいて、KDPP(Kernel Dynamic Policy Programming)等の既知のアルゴリズムにより強化学習が実行されてよい。この際、制御対象が操作された設備の次の状態に基づいて、選択された行動を評価して報酬値が計算される。ここで、一例として、一段目の水槽の水位を任意の値に調整することを目標とする場合、一段目の水槽の水位における測定値PVが目標値DVに近づく程、報酬値が高くなるように報酬関数が設定されてよい。そして、一連の行動によって得られる報酬をより高めるように機械学習モデル115が更新されてよい。すなわち、機械学習モデル115が報酬をより高める行動を出力しやすくするために、テーブルに保存された各サンプルデータに対する重みが上書きされるほか、これまでに保存されていない新たなサンプルデータが学習サンプルとしてテーブルに追加されてよい。
学習範囲特定部120は、学習サンプルの範囲を示す学習範囲を特定する。学習範囲特定部120は、例えば、モデル記憶部110にアクセスしてよい。そして、学習範囲特定部120は、機械学習モデル115のテーブルに保存された学習サンプルを統計処理し、学習サンプルの範囲がどこからどこまでの範囲であるかを特定してよい。学習範囲特定部120は、特定した学習範囲の情報を検証データ取得部130へ供給する。
検証データ取得部130は、学習範囲外における、設備の複数の状態を示す検証データを取得する。検証データ取得部130は、学習範囲特定部120から供給された情報に基づいて学習範囲を認識可能である。したがって、検証データ取得部130は、このような情報に基づいて、学習範囲外における設備の複数の状態を示す検証データを取得してよい。検証データ取得部130は、取得した検証データを機械学習モデル115へ入力する。
検証結果出力部140は、検証データを入力したことに応じて機械学習モデル115が出力する複数の行動を示す検証結果を出力する。
図2は、モデル検証装置100が検証対象とする機械学習モデル115が有するテーブルの一例を示す。このようなテーブルは、本図に示されるように、設備の状態と行動との組み合わせ、および、当該組み合わせに対する重みで構成されていてよい。ここで、設備の状態Sを示す複数の物理量には、それぞれ異なるタグが対応付けられていてよい。本図においては、一例として、上段タンク、中段タンク、および、下段タンクの水位データに、タグ「LI003」、タグ「LI002」、および、タグ「LI001」がそれぞれ対応付けられている。また、制御経路の流量データに、タグ「FI001」が対応付けられていてる。また、制御対象であるバルブの開度データ、すなわち、操作量MVに、タグ「V001」が対応付けられている。
ここで、本テーブルにおける1行目が、時間aについてのデータを示していたとする。この場合、時間aにおける設備の状態は、状態データSa=(31.02,30.67,35.23,47.21,50)として示されてよい。また、本テーブルにおける2行目が、時間aに続く時間bについてのデータを示していたとする。この場合、時間bにおける設備の状態は、状態データSb=(29.17,30.15,32.89,44.19,47)として示されてよい。したがって、設備の状態は、このような状態データSを用いて時系列に示すことができる。
また、制御対象に与える操作量MVを決定するための行動は、操作量MVの変更量として示されてよい。例えば、時間aにおいて操作量MV(すなわち、タグ「V001」)が50であり、時間aに続く時間bにおいて操作量MVが47である場合、時間aから時間bにかけて操作量MVが50の状態から47の状態に変化したことを示している。ここで、時間bにおける操作量MV=47から時間aにおける操作量MV=50を減算すると、操作変更量ΔMV=-3となる。この場合、時間aにおける行動は、行動データAa=-3として示されてよい。これは、時間aにおいて、上段タンク水位が31.02%、中段タンク水位が30.67%、下段タンク水位が35.23%、制御経路の流量が47.21%である状態下で、制御対象であるバルブを50%から-3%(例えば、バルブを閉じる方向である時計回りに3%)回転制御させる行動がとられたことを意味している。同様に、時間bに続く時間cにおいて操作量MVが46である場合、時間cにおける操作量MV=46から時間bにおける操作量MV=47を減算すると、操作変更量ΔMV=-1となる。この場合、時間bにおける行動は、行動データAb=-1として示されてよい。したがって、操作量MVを決定するための行動は、このような行動データAを用いて時系列に示すことができる。
このように、機械学習モデル115が有するテーブルには、各々が、状態データS=(LI003,LI002,LI001,FI001,V001)と行動データA=ΔMVとの組み合わせ、および、当該組み合わせに対する重みを示す重みデータWで構成された複数のサンプルデータが学習サンプルとして保存されていてよい。なお、テーブルに保存されるこれらの値は、例えば、%等の割合によって示されてもよいし、絶対値等によって示されてもよい。
図3は、学習範囲内における機械学習モデル115の出力を示す行動マップの一例を示す。本図において、横軸は、LI001、すなわち、下段タンクの水位を示している。ここで、本図において横軸が20~40の範囲を示しているが、これは、学習サンプルの範囲を示す学習範囲がLI001=20~40であったことを意味している。
また、縦軸は、FI001、すなわち、制御経路の流量を示している。ここで、本図において縦軸が40.0~64.0の範囲を示しているが、これは、学習サンプルの範囲を示す学習範囲がFI001=40.0~64.0であったことを意味している。
そして、本図では、学習範囲内において機械学習モデル115が出力する行動が、LI001を列、FI001を行とした各セルにマッピングされている。これより先、このような行動の示し方を「行動マップ」と呼ぶこととする。行動マップの詳細については、後述する。
このような機械学習モデル115においては、学習範囲外にある状態データが入力される場合に、どのような行動を出力するのか不明である。したがって、制御対象の制御にこのような機械学習モデル115が用いられる場合、学習範囲外にある状態データの入力に応じて、機械学習モデル115が意図しない行動を出力し、それが設備に悪影響を与える可能性がある。このような影響は、特に、安全・安心が求められるプラントを操業する上で、非常に深刻となり得る。そこで、モデル検証装置100は、このような機械学習モデル115を検証する。これについてフローを用いて詳細に説明する。
図4は、モデル検証装置100が機械学習モデル115を検証するフローの一例を示す。ステップS410において、モデル検証装置100は、機械学習モデル115を記憶する。例えば、モデル検証装置100は、他の装置が機械学習により生成した機械学習モデル115を、ネットワーク、各種メモリデバイス、または、ユーザ入力等を介して取得する。このような機械学習モデル115は、上述のとおり制御対象が設けられた設備の状態を示す状態データ、および、制御対象に与える操作量MVを決定するための行動を示す行動データを含む学習サンプルを用いて、設備の状態に応じた行動を出力するように機械学習されたモデルであってよい。そして、モデル記憶部110は、このような機械学習モデル115を記憶する。
ステップS420において、モデル検証装置100は、学習範囲を特定する。例えば、学習範囲特定部120は、学習サンプルの範囲を示す学習範囲を特定する。一例として、学習範囲特定部120は、モデル記憶部110にアクセスしてよい。そして、学習範囲特定部120は、ステップS410において記憶された機械学習モデル115のテーブルに保存された学習サンプルを統計処理し、学習サンプルの範囲がどこからどこまでの範囲であるかを特定してよい。
この際、学習範囲特定部120は、学習サンプルとして保存されたサンプルデータに含まれる状態データを、物理量毎にそれぞれ統計処理してよい。すなわち、学習範囲特定部120は、サンプルデータに含まれるLI001を統計処理する。ここで、LI001の最小値が20.0であり、最大値が40.0であったとする。この場合、学習範囲特定部120は、LI001の学習範囲がLI001=20.0~40.0であると特定してよい。
同様に、学習範囲特定部120は、サンプルデータに含まれるFI001を統計処理する。ここで、FI001の最小値が40.0であり、最大値が64.0であったとする。この場合、学習範囲特定部120は、FI001の学習範囲がFI001=40.0~64.0であると特定してよい。学習範囲特定部120は、他の物理量、すなわち、LI002、LI003、V001についても同様に学習範囲を特定してよい。
なお、上述の説明では、学習範囲特定部120が最小値および最大値を用いて学習範囲を特定する場合を一例として示したが、これに限定されるものではない。学習範囲特定部120は、例えば、偏差等の他の統計量を用いて学習範囲を特定してもよい。一例として、学習範囲特定部120は、少なくともいずれかの物理量について、平均-3σ~平均+3σの範囲を学習範囲として特定してもよい。
また、上述の説明では、学習範囲が連続した一つの範囲である場合を一例として示したが、学習範囲は離散した複数の範囲であってもよい。学習範囲特定部120は、例えばこのようにして、学習サンプルの範囲を示す学習範囲を物理量毎に特定することができる。学習範囲特定部120は、特定した学習範囲の情報を検証データ取得部130へ供給する。
ステップS430において、モデル検証装置100は、検証データを取得する。例えば、検証データ取得部130は、学習範囲外における、設備の複数の状態を示す検証データを取得する。一例として、検証データ取得部130は、ステップS420において特定された学習範囲を示す情報を出力し、学習範囲に含まれていない設備の状態の入力をユーザに促してよい。これに応じて、ユーザは、関心のある範囲のうち学習範囲に含まれていない、設備の複数の状態を入力してよい。例えば、検証データ取得部130は、学習範囲がLI001=20.0~40.0、FI001=40.0~64.0であることを示す画面をモニタに表示してよい。これに応じて、ユーザは、関心のあるLI001=10.0~70.0、FI001=30.0~65.0の範囲であって学習範囲を除く範囲における設備の複数の状態を入力してよい。検証データ取得部130は、他の物理量についても同様に検証データを取得してよい。
しかしながら、これに限定されるものではない。検証データ取得部130は、学習範囲を示す情報を設備や他の装置へ送信し、学習範囲に含まれていない設備の状態を要求してもよい。これに応じて、設備や他の装置は、学習範囲に含まれていない、設備の複数の状態を回答してもよい。検証データ取得部130は、例えばこのようにして、検証データを取得することができる。
ステップS440において、モデル検証装置100は、検証データを機械学習モデル115へ入力する。例えば、検証データ取得部130は、ステップS430において取得された検証データを、ステップS410において記憶された機械学習モデル115に入力する。これに応じて、機械学習モデル115は、検証データに含まれる複数の状態に応じた複数の行動をそれぞれ出力する。
一例として、モデル検証装置100は、(LI003,LI002,LI001,FI001,V001)=(38,39,44,65,68)である検証データを機械学習モデル115へ入力する。これに応じて、機械学習モデル115は、行動として「-3」(バルブを3%閉じる)を出力する。同様に、モデル検証装置100は、(LI003,LI002,LI001,FI001,V001)=(20,28,18,35,39)である検証データを機械学習モデル115へ入力する。これに応じて、機械学習モデル115は、行動として「3」(バルブを3%開く)を出力する。
ステップS450において、モデル検証装置100は、検証結果を出力する。例えば、検証結果出力部140は、ステップS440において機械学習モデル115がそれぞれ出力した複数の行動を取得する。そして、検証結果出力部140は、取得した複数の行動を示す検証結果をモニタに表示出力してよい。しかしながら、これに限定されるものではない。検証結果出力部140は、検証結果をスピーカにより音声出力してもよいし、プリンタにより印字出力してもよいし、他の装置へ送信出力してもよい。このようにして、検証結果出力部140は、検証データを入力したことに応じて機械学習モデル115が出力する複数の行動を示す検証結果を出力してよい。
図5は、モデル検証装置100が出力する検証結果の第1の例を示す。例えば、モデル検証装置100は、検証結果を、図3と同様、行動マップとして出力してよい。この際、検証結果出力部140は、検証結果とともに学習範囲内における行動を出力してよい。すなわち、検証結果出力部140は、学習範囲外における行動とともに、学習範囲内における行動を併せて出力してよい。ここで、本図において、太線で囲まれた領域は、学習範囲内を示している。そして、太線で囲まれた領域の外が学習範囲外を示している。このように、検証結果出力部140は、検証結果を、学習範囲内における行動とは識別可能に出力するとよい。
本図において、横軸は、図3と同様、LI001、すなわち、下段タンクの水位を示している。ここで、本図においては、横軸が10.0~70.0の範囲を示している。これは、LI001において、検証データの範囲がLI001=10.0~70.0であったことを意味している。
また、縦軸は、図3と同様、FI001、すなわち、制御経路の流量を示している。ここで、本図においては、縦軸が30.0~65.0の範囲を示している。これは、FI001において、検証データの範囲がFI001=30.0~65.0であったことを意味している。
そして、本図においては、図3と同様、機械学習モデル115が出力する行動が、LI001を列、FI001を行とした各セルにマッピングされている。すなわち、各セルは、列に示されるLI001および行に示されるFI001を含む状態データS=(LI003,LI002,LI001,FI001,V001)を機械学習モデル115に入力した場合に、機械学習モデル115が出力する行動データA=ΔMVをそれぞれ示している。このように、検証結果出力部140は、複数の行動を複数の状態と対応付けた行動マップを出力してよい。また、検証結果出力部140は、複数の行動を設備の複数の物理量(本図では、LI001およびFI001)に係る複数の状態と対応付けた行動マップを出力してよい。
この際、検証結果出力部140は、本図に示されるように、複数の行動を、行動の内容に応じて異なる濃度で出力してよい。例えば、機械学習モデル115が出力する行動の選択肢として、[-3,-1,0,1,3]の5通りの選択肢、すなわち、[3%閉める,1%閉める,変更なし,1%開く,3%開く]の5通りの選択肢が用いられているとする。この場合、検証結果出力部140は、行動として「-3」または「-1」が出力される(すなわち、バルブを閉じる行動が出力される)確率が高いセル程、濃くし、行動として「3」または「1」が出力される(すなわち、バルブを開く行動が出力される)確率が高いセル程、薄くする等して、機械学習モデル115が出力する行動を、行動の内容に応じて段階的な濃度で出力してもよい。
これに代えて、または、加えて、検証結果出力部140は、複数の行動を、行動の内容に応じて異なる色で出力してもよい。例えば、検証結果出力部140は、行動として「-3」が出力されるセルを青色、「-1」が出力されるセルを水色、「0」が出力されるセルを緑色、「1」が出力されるセルを黄緑色、「3」が出力されるセルを黄色とする等して、機械学習モデル115が出力する行動を、行動の内容に応じて異なる色で出力してもよい。
なお、上述の説明では、モデル検証装置100が、横軸をLI001、縦軸をFI001とした行動マップを採用した場合を一例として示した。しかしながら、これに限定されるものではない。モデル検証装置100は、横軸および縦軸の少なくともいずれかを他の物理量とした行動マップを採用してもよい。ただし、特定の物理量を任意の値に調整することを目標として制御する場合においては、当該特定の物理量を少なくとも含む行動マップを採用することが好ましい。また、上述の説明では、モデル検証装置100が2次元の行動マップを採用した場合を一例として示した。しかしながら、これに限定されるものではない。モデル検証装置100は、3つ以上の物理量を含む多次元の行動マップを採用してもよい。
図6は、モデル検証装置100が出力する検証結果の第2の例を示す。本図において、縦軸は、LI003、すなわち、上段タンクの水位を示している。その他の定義については、図5と同様である。すなわち、本図においては、機械学習モデル115が出力する行動が、LI001を列、LI003を行とした各セルにマッピングされている。
図7は、モデル検証装置100が出力する検証結果の第3の例を示す。本図において、縦軸は、LI002、すなわち、中段タンクの水位を示している。その他の定義については、図5と同様である。すなわち、本図においては、機械学習モデル115が出力する行動が、LI001を列、LI002を行とした各セルにマッピングされている。
図8は、モデル検証装置100が出力する検証結果の第4の例を示す。本図において、縦軸は、V001、すなわち、バルブの開度を示している。その他の定義については、図5と同様である。すなわち、本図においては、機械学習モデル115が出力する行動が、LI001を列、V001を行とした各セルにマッピングされている。
検証結果出力部140は、例えばこのような、複数の物理量の異なる組み合わせからなる複数の行動マップを出力してよい。この際、検証結果出力部140は、複数の行動マップを一画面に表示してもよいし、ユーザ入力に応じて行動マップを順次切り替えて表示してもよい。
一般に、三段水槽の特性上、下段タンクの水位はバルブ操作から遅れる。また、上段タンクの水位や中段タンクの水位が遅れて下段タンクの水位に影響する。そのため、このような制御系における傾向を把握するのは困難であった。
これに対して、モデル検証装置100は、設備に設けられた制御対象を制御するために学習サンプルを用いて機械学習された機械学習モデル115を検証する。この際、モデル検証装置100は、学習サンプルの範囲外において機械学習モデル115がどのような行動を出力するのかを検証し、結果を出力する。これにより、モデル検証装置100によれば、機械学習モデル115が学習サンプルの範囲外においてどのような行動を出力するかをユーザに提示することができる。したがって、機械学習モデル115を用いて制御対象を制御するのに先立ち、このようなモデル検証装置100を用いることにより、設備に悪影響を与えることを未然に防ぐことができる。また、機械学習モデル115を用いた制御下においても、このようなモデル検証装置100を用いることにより、例えば、設備に異常が発生した場合の原因究明に活用することができる。このような効果は、特に、安全・安心が求められるプラントを操業する上で、非常に有益となり得る。
また、モデル検証装置100は、検証結果、すなわち、学習範囲外における行動のみを出力するのではなく、学習範囲内における行動をも出力してよい。これにより、モデル検証装置100は、設備の状態が学習範囲の内から外へいくに連れて機械学習モデル115が出力する行動がどのように変化していくかをユーザに知らしめることができる。この際、モデル検証装置100は、学習範囲外における行動を学習範囲内における行動とは識別可能に出力してよい。これにより、モデル検証装置100によれば、どの範囲までが学習範囲内であり、どの範囲からが学習範囲外であるかをユーザに知らしめることができる。
また、モデル検証装置100は、検証結果を、複数の状態を複数の行動と対応付けた行動マップとして出力してよい。これにより、モデル検証装置100によれば、設備の状態が異なる複数の場合について機械学習モデル115がそれぞれどのような行動を出力するのかを、一括してユーザに知らしめることができる。この際、モデル検証装置100は、検証結果を、複数の行動を設備の複数の物理量に係る複数の状態と対応付けた行動マップとして出力してよい。このような行動マップは、機械学習モデル115が出力する行動が、複数の物理量(例えば、水位と流量等)の状態に依存する場合に、特に、有用となり得る。
また、モデル検証装置100は、複数の行動を行動マップとして出力するにあたって、行動の内容に応じて異なる濃度や色で出力してよい。これにより、モデル検証装置100によれば、機械学習モデル115が出力する行動の違いを、視覚的にユーザに知らしめることができる。異なる濃度での出力は、装置が、モノクロ、白黒、または、グレースケール出力しかできない場合に、特に、有用となり得る。また、異なる色での出力は、機械学習モデル115が出力する行動の選択肢が多い場合や視認性を向上させたい場合に、特に、有用となり得る。
このような行動マップにおいては、一つの指標として、例えば、設備の状態が目標値に近い範囲においては、バルブを閉じる行動およびバルブを開く行動が概ね同じ程度の確率で出現し、目標値から遠い範囲においては、バルブを閉じる行動またはバルブを開く行動のみが一律に出現することが好ましいと考えられる。したがって、このような行動マップを見たユーザは、行動マップにおける段階的な変化により、学習範囲外において機械学習モデル115が意図した行動を出力しているか否かを比較的容易に判断することができる。そして、ユーザは、機械学習モデル115が意図した行動を出力していないと判断した場合に、機械学習モデル115の再学習を指示することができる。
図9は、第2の実施形態に係るモデル検証装置100のブロック図の一例を示す。図9においては、図1と同じ機能および構成を有する部材に対して同じ符号を付すとともに、以下相違点を除き説明を省略する。上述の実施形態においては、モデル検証装置100が外部(ユーザや設備等)から検証データを取得する場合を一例として示したが、本実施形態においては、モデル検証装置100が自身で検証データを生成する。本実施形態に係るモデル検証装置100は、上述の実施形態に係るモデル検証装置100が備える機能部に加えて、検証範囲指定部610と、検証データ生成部620と、を更に備える。本実施形態においては、学習範囲特定部120は、特定した学習範囲の情報を検証範囲指定部610へ供給する。
検証範囲指定部610は、検証データの範囲を示す検証範囲を指定する。検証範囲指定部610は、学習範囲特定部120から供給された情報に基づいて学習範囲を認識可能である。したがって、検証範囲指定部610は、このような情報に基づいて、検証データの範囲を示す検証範囲を指定してよい。例えば、検証範囲指定部610は、学習範囲特定部120が特定した学習範囲と、予め定められた検証マージンMとに基づいて検証範囲を指定してよい。一例として、学習範囲特定部120が「最小値」~「最大値」の範囲を学習範囲として特定する場合、検証範囲指定部610は、「最小値-M」~「最大値+M」の範囲のうちの学習範囲に含まれない範囲を検証範囲として指定してよい。また、学習範囲特定部120が「平均-3σ」~「平均+3σ」の範囲を学習範囲として特定する場合、検証範囲指定部610は、「平均-(3+M)σ」~「平均+(3+M)σ」の範囲のうちの学習範囲に含まれない範囲を検証範囲として指定してよい。検証範囲指定部610は、例えばこのようにして、検証範囲を指定することができる。また、検証範囲指定部610は、検証範囲の分解能、すなわち、検証範囲を何分割するか等も併せて指定してもよい。検証範囲指定部610は、指定した検証範囲の情報を検証データ生成部620へ供給する。
検証データ生成部620は、検証範囲に基づいて検証データを生成する。例えば、検証データ生成部620は、指定された検証範囲において、ランダムに、または、網羅的に複数の状態データを発生させることによって、検証データを生成してよい。これに代えて、または加えて、検証データ生成部620は、既に取得済みの状態データの中から検証範囲に含まれる複数の状態データを抽出することによって、検証データを生成してもよい。検証データ生成部620は、生成した検証データを機械学習モデル115へ入力する。これより先の処理は、第1の実施形態と同様であってよいので、ここでは説明を省略する。
このように、本実施形態に係るモデル検証装置100は、機械学習モデル115を検証するための検証データを、自らが生成する。これにより、本実施形態に係るモデル検証装置100によれば、外部から検証データを取得することなく、自装置内で完結して機械学習モデルを検証することができる。
図10は、第3の実施形態に係るモデル検証装置100のブロック図の一例を示す。図10においては、図1と同じ機能および構成を有する部材に対して同じ符号を付すとともに、以下相違点を除き説明を省略する。上述の実施形態においては、モデル検証装置100が、他の装置が生成した機械学習モデルを記憶する場合を一例として示したが、本実施形態においては、モデル検証装置100が、自身で機械学習モデルを生成する。本実施形態に係るモデル検証装置100は、上述の実施形態に係るモデル検証装置100が備える機能部に加えて、サンプルデータ取得部710と、モデル生成部720と、を更に備える。
サンプルデータ取得部710は、学習サンプルとなるサンプルデータを取得する。例えば、サンプルデータ取得部710は、状態データS=(LI003,LI002,LI001,FI001,V001)を取得する。この際、サンプルデータ取得部710は、ネットワーク、ユーザ入力、または、各種メモリデバイスの少なくともいずれかを介して状態データを取得してよい。そして、サンプルデータ取得部710は、取得した状態データに含まれる操作量MV(すなわち、V001)から行動データを算出してよい。なお、上述の説明では、サンプルデータ取得部710が、取得した状態データから行動データを二次的に取得する場合を一例として示したが、サンプルデータ取得部710は、状態データと同様、行動データを直接取得してもよい。サンプルデータ取得部710は、取得したサンプルデータをモデル生成部720へ供給する。
モデル生成部720は、学習サンプルを用いた機械学習により機械学習モデル115を生成する。例えば、モデル生成部720は、サンプルデータ取得部710から供給されたサンプルデータを学習サンプルとして用いて機械学習することにより、機械学習モデル115を生成する。機械学習の詳細については上述のとおりであってよいので、ここでは詳細な説明を省略する。モデル生成部720は、生成した機械学習モデル115をモデル記憶部110へ供給する。したがって、本実施形態において、モデル記憶部110は、モデル検証装置100自身が機械学習により生成した機械学習モデル115を記憶する。すなわち、本実施形態において、モデル検証装置100は、自身が生成した機械学習モデル115を検証対象とする。
このように、本実施形態に係るモデル検証装置100は、学習サンプルを用いた機械学習により機械学習モデル115を自らが生成する。これにより、本実施形態に係るモデル検証装置100によれば、自身が機械学習により生成した機械学習モデル115を検証の対象とすることができ、機械学習モデル115を生成する機能と機械学習モデル115を検証する機能とを一つの装置内で完結させることができる。
図11は、第4の実施形態に係るモデル検証装置100のブロック図の一例を示す。図11においては、図1と同じ機能および構成を有する部材に対して同じ符号を付すとともに、以下相違点を除き説明を省略する。上述の実施形態においては、モデル検証装置100が機械学習モデル115の検証結果を出力するまでの機能を有する場合を一例として示したが、本実施形態においては、モデル検証装置100は、ユーザ入力に応じて機械学習モデル115を出力する機能を更に有する。本実施形態に係るモデル検証装置100は、上述の実施形態に係るモデル検証装置100が備える機能部に加えて、ユーザ入力部810と、モデル出力部820と、を更に備える。
ユーザ入力部810は、検証結果が出力されたことに応じて、ユーザ入力を受け付ける。例えば、ユーザ入力部810は、検証結果出力部140が検証対象とする機械学習モデル115の検証結果を出力したことに応じて、当該機械学習モデル115の妥当性を示すユーザ入力を受け付ける。そして、ユーザ入力部810は、キーボードやマウス等を介して、機械学習モデル115が妥当である旨が入力された場合に、その旨をモデル出力部820へ通知する。
モデル出力部820は、ユーザ入力に応じて、機械学習モデルを出力する。例えば、モデル出力部820は、ユーザ入力部810から機械学習モデル115が妥当である旨が通知された場合に、モデル記憶部110に記憶されている機械学習モデル115を、制御対象の制御を担う制御装置(図示せず)へ出力する。この際、モデル出力部820は、モデル記憶部110に記憶された機械学習モデル115を制御装置へムーブすることによって出力してもよいし、モデル記憶部110に記憶された機械学習モデル115を制御装置へコピーすることによって出力してもよい。
このように、本実施形態に係るモデル検証装置100は、ユーザ入力に応じて、機械学習モデル115を出力する。これにより、本実施形態に係るモデル検証装置100によれば、検証結果を見たユーザが、機械学習モデル115が妥当であると判断したことをトリガとして、当該機械学習モデル115を制御対象の制御を担う制御装置へ提供することができる。
図12は、第5の実施形態に係るモデル検証装置100のブロック図の一例を示す。図12においては、図11と同じ機能および構成を有する部材に対して同じ符号を付すとともに、以下相違点を除き説明を省略する。第4の実施形態においては、モデル検証装置100が、制御対象の制御を担う他の制御装置に対して機械学習モデル115を出力する場合を一例として示したが、第5の実施形態においては、モデル検証装置100自身が制御対象を制御する。本実施形態に係るモデル検証装置100は、モデル出力部820に代えて、状態データ取得部910と、制御部920と、を更に備える。
状態データ取得部910は、設備の状態を示す状態データを時系列に取得する。例えば、状態データ取得部910は、状態データS=(LI003,LI002,LI001,FI001,V001)を、ネットワークを介して設備から時系列に取得してよい。状態データ取得部910は、取得した状態データを制御部920へ順次供給する。
制御部920は、ユーザ入力に応じて、機械学習モデルを用いた制御対象の制御を開始する。例えば、制御部920は、ユーザ入力部810から機械学習モデル115が妥当である旨が通知された場合に、状態データ取得部910から供給された状態データをモデル記憶部110に記憶された機械学習モデル115に入力する。そして、制御部920は、機械学習モデル115が出力する行動を現在の操作量MV(すなわち、V001)に加えた新たな操作量MVを制御対象へ与える。これにより、制御部920は、機械学習モデルを用いて制御対象を制御する。なお、このような制御部920は、他の機能部と一体に構成されていてもよいし、別体(例えば、他の機能部がクラウドで実行される等)に構成されていてもよい。
このように、本実施形態に係るモデル検証装置100は、ユーザ入力に応じて、機械学習モデル115を用いた制御対象の制御を開始する。これにより、本実施形態に係るモデル検証装置100によれば、検証結果を見たユーザが、機械学習モデル115が妥当であると判断したことをトリガとして、いわゆるAIコントローラとして機能し、制御対象を実際に制御することができる。
本発明の様々な実施形態は、フローチャートおよびブロック図を参照して記載されてよく、ここにおいてブロックは、(1)操作が実行されるプロセスの段階または(2)操作を実行する役割を持つ装置のセクションを表わしてよい。特定の段階およびセクションが、専用回路、コンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、および/またはコンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタルおよび/またはアナログハードウェア回路を含んでよく、集積回路(IC)および/またはディスクリート回路を含んでよい。プログラマブル回路は、論理AND、論理OR、論理XOR、論理NAND、論理NOR、および他の論理操作、フリップフロップ、レジスタ、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルロジックアレイ(PLA)等のようなメモリ要素等を含む、再構成可能なハードウェア回路を含んでよい。
コンピュータ可読媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読媒体は、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(RTM)ディスク、メモリスティック、集積回路カード等が含まれてよい。
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1または複数のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかを含んでよい。
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサまたはプログラマブル回路に対し、ローカルにまたはローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して提供され、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく、コンピュータ可読命令を実行してよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
図13は、本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ9900の例を示す。コンピュータ9900にインストールされたプログラムは、コンピュータ9900に、本発明の実施形態に係る装置に関連付けられる操作または当該装置の1または複数のセクションとして機能させることができ、または当該操作または当該1または複数のセクションを実行させることができ、および/またはコンピュータ9900に、本発明の実施形態に係るプロセスまたは当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ9900に、本明細書に記載のフローチャートおよびブロック図のブロックのうちのいくつかまたはすべてに関連付けられた特定の操作を実行させるべく、CPU9912によって実行されてよい。
本実施形態によるコンピュータ9900は、CPU9912、RAM9914、グラフィックコントローラ9916、およびディスプレイデバイス9918を含み、それらはホストコントローラ9910によって相互に接続されている。コンピュータ9900はまた、通信インターフェイス9922、ハードディスクドライブ9924、DVDドライブ9926、およびICカードドライブのような入/出力ユニットを含み、それらは入/出力コントローラ9920を介してホストコントローラ9910に接続されている。コンピュータはまた、ROM9930およびキーボード9942のようなレガシの入/出力ユニットを含み、それらは入/出力チップ9940を介して入/出力コントローラ9920に接続されている。
CPU9912は、ROM9930およびRAM9914内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ9916は、RAM9914内に提供されるフレームバッファ等またはそれ自体の中にCPU9912によって生成されたイメージデータを取得し、イメージデータがディスプレイデバイス9918上に表示されるようにする。
通信インターフェイス9922は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ9924は、コンピュータ9900内のCPU9912によって使用されるプログラムおよびデータを格納する。DVDドライブ9926は、プログラムまたはデータをDVD-ROM9901から読み取り、ハードディスクドライブ9924にRAM9914を介してプログラムまたはデータを提供する。ICカードドライブは、プログラムおよびデータをICカードから読み取り、および/またはプログラムおよびデータをICカードに書き込む。
ROM9930はその中に、アクティブ化時にコンピュータ9900によって実行されるブートプログラム等、および/またはコンピュータ9900のハードウェアに依存するプログラムを格納する。入/出力チップ9940はまた、様々な入/出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入/出力コントローラ9920に接続してよい。
プログラムが、DVD-ROM9901またはICカードのようなコンピュータ可読媒体によって提供される。プログラムは、コンピュータ可読媒体から読み取られ、コンピュータ可読媒体の例でもあるハードディスクドライブ9924、RAM9914、またはROM9930にインストールされ、CPU9912によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ9900に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置または方法が、コンピュータ9900の使用に従い情報の操作または処理を実現することによって構成されてよい。
例えば、通信がコンピュータ9900および外部デバイス間で実行される場合、CPU9912は、RAM9914にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インターフェイス9922に対し、通信処理を命令してよい。通信インターフェイス9922は、CPU9912の制御下、RAM9914、ハードディスクドライブ9924、DVD-ROM9901、またはICカードのような記録媒体内に提供される送信バッファ処理領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、またはネットワークから受信された受信データを記録媒体上に提供される受信バッファ処理領域等に書き込む。
また、CPU9912は、ハードディスクドライブ9924、DVDドライブ9926(DVD-ROM9901)、ICカード等のような外部記録媒体に格納されたファイルまたはデータベースの全部または必要な部分がRAM9914に読み取られるようにし、RAM9914上のデータに対し様々なタイプの処理を実行してよい。CPU9912は次に、処理されたデータを外部記録媒体にライトバックする。
様々なタイプのプログラム、データ、テーブル、およびデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU9912は、RAM9914から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプの操作、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM9914に対しライトバックする。また、CPU9912は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU9912は、第1の属性の属性値が指定される、条件に一致するエントリを当該複数のエントリの中から検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
上で説明したプログラムまたはソフトウェアモジュールは、コンピュータ9900上またはコンピュータ9900近傍のコンピュータ可読媒体に格納されてよい。また、専用通信ネットワークまたはインターネットに接続されたサーバーシステム内に提供されるハードディスクまたはRAMのような記録媒体が、コンピュータ可読媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ9900に提供する。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
100 モデル検証装置
110 モデル記憶部
115 機械学習モデル
120 学習範囲特定部
130 検証データ取得部
140 検証結果出力部
610 検証範囲指定部
620 検証データ生成部
710 サンプルデータ取得部
720 モデル生成部
810 ユーザ入力部
820 モデル出力部
910 状態データ取得部
920 制御部
9900 コンピュータ
9901 DVD-ROM
9910 ホストコントローラ
9912 CPU
9914 RAM
9916 グラフィックコントローラ
9918 ディスプレイデバイス
9920 入/出力コントローラ
9922 通信インターフェイス
9924 ハードディスクドライブ
9926 DVDドライブ
9930 ROM
9940 入/出力チップ
9942 キーボード
110 モデル記憶部
115 機械学習モデル
120 学習範囲特定部
130 検証データ取得部
140 検証結果出力部
610 検証範囲指定部
620 検証データ生成部
710 サンプルデータ取得部
720 モデル生成部
810 ユーザ入力部
820 モデル出力部
910 状態データ取得部
920 制御部
9900 コンピュータ
9901 DVD-ROM
9910 ホストコントローラ
9912 CPU
9914 RAM
9916 グラフィックコントローラ
9918 ディスプレイデバイス
9920 入/出力コントローラ
9922 通信インターフェイス
9924 ハードディスクドライブ
9926 DVDドライブ
9930 ROM
9940 入/出力チップ
9942 キーボード
Claims (14)
- 制御対象が設けられた設備の状態を示す状態データ、および、前記制御対象に与える操作量を決定するための行動を示す行動データを含む学習サンプルを用いて、前記設備の状態に応じた行動を出力するように機械学習された機械学習モデルを記憶するモデル記憶部と、
前記学習サンプルの範囲を示す学習範囲を特定する学習範囲特定部と、
前記学習範囲外における、前記設備の複数の状態を示す検証データを取得する検証データ取得部と、
前記検証データを入力したことに応じて前記機械学習モデルが出力する複数の行動を示す検証結果を出力する検証結果出力部と、
を備える、モデル検証装置。 - 前記検証結果出力部は、前記検証結果とともに前記学習範囲内における行動を出力する、請求項1に記載のモデル検証装置。
- 前記検証結果出力部は、前記検証結果を、前記学習範囲内における行動とは識別可能に出力する、請求項2に記載のモデル検証装置。
- 前記検証結果出力部は、前記複数の行動を前記複数の状態と対応付けた行動マップを出力する、請求項1から3のいずれか一項に記載のモデル検証装置。
- 前記検証結果出力部は、前記複数の行動を前記設備の複数の物理量に係る前記複数の状態と対応付けた行動マップを出力する、請求項4に記載のモデル検証装置。
- 前記検証結果出力部は、前記複数の行動を、行動の内容に応じて異なる濃度で出力する、請求項4または5に記載のモデル検証装置。
- 前記検証結果出力部は、前記複数の行動を、行動の内容に応じて異なる色で出力する、請求項4から6のいずれか一項に記載のモデル検証装置。
- 前記検証データの範囲を示す検証範囲を指定する検証範囲指定部と、
前記検証範囲に基づいて前記検証データを生成する検証データ生成部と、
を更に備える、請求項1から7のいずれか一項に記載のモデル検証装置。 - 前記学習サンプルとなるサンプルデータを取得するサンプルデータ取得部と、
前記学習サンプルを用いた機械学習により前記機械学習モデルを生成するモデル生成部と、
を更に備える、請求項1から8のいずれか一項に記載のモデル検証装置。 - 前記検証結果が出力されたことに応じて、ユーザ入力を受け付けるユーザ入力部を更に備える、請求項1から9のいずれか一項に記載のモデル検証装置。
- 前記ユーザ入力に応じて、前記機械学習モデルを出力するモデル出力部を更に備える、請求項10に記載のモデル検証装置。
- 前記ユーザ入力に応じて、前記機械学習モデルを用いた前記制御対象の制御を開始する制御部を更に備える、請求項10に記載のモデル検証装置。
- 制御対象が設けられた設備の状態を示す状態データ、および、前記制御対象に与える操作量を決定するための行動を示す行動データを含む学習サンプルを用いて、前記設備の状態に応じた行動を出力するように機械学習された機械学習モデルを記憶することと、
前記学習サンプルの範囲を示す学習範囲を特定することと、
前記学習範囲外における、前記設備の複数の状態を示す検証データを取得することと、
前記検証データを入力したことに応じて前記機械学習モデルが出力する複数の行動を示す検証結果を出力することと、
を備える、モデル検証方法。 - コンピュータにより実行されて、前記コンピュータを、
制御対象が設けられた設備の状態を示す状態データ、および、前記制御対象に与える操作量を決定するための行動を示す行動データを含む学習サンプルを用いて、前記設備の状態に応じた行動を出力するように機械学習された機械学習モデルを記憶するモデル記憶部と、
前記学習サンプルの範囲を示す学習範囲を特定する学習範囲特定部と、
前記学習範囲外における、前記設備の複数の状態を示す検証データを取得する検証データ取得部と、
前記検証データを入力したことに応じて前記機械学習モデルが出力する複数の行動を示す検証結果を出力する検証結果出力部と、
して機能させる、モデル検証プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022046154A JP7444186B2 (ja) | 2022-03-22 | 2022-03-22 | モデル検証装置、モデル検証方法、および、モデル検証プログラム |
US18/171,361 US20230305501A1 (en) | 2022-03-22 | 2023-02-19 | Model verification apparatus, model verification method, and non-transitory computer readable medium |
EP23160158.4A EP4249179A1 (en) | 2022-03-22 | 2023-03-06 | Model verification apparatus, model verification method, and model verification program |
CN202310280150.1A CN116796853A (zh) | 2022-03-22 | 2023-03-21 | 模型验证装置、模型验证方法和非临时性计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022046154A JP7444186B2 (ja) | 2022-03-22 | 2022-03-22 | モデル検証装置、モデル検証方法、および、モデル検証プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023140233A true JP2023140233A (ja) | 2023-10-04 |
JP7444186B2 JP7444186B2 (ja) | 2024-03-06 |
Family
ID=85505593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022046154A Active JP7444186B2 (ja) | 2022-03-22 | 2022-03-22 | モデル検証装置、モデル検証方法、および、モデル検証プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230305501A1 (ja) |
EP (1) | EP4249179A1 (ja) |
JP (1) | JP7444186B2 (ja) |
CN (1) | CN116796853A (ja) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4402645B2 (ja) | 2005-12-06 | 2010-01-20 | 株式会社山武 | 制御系解析装置およびプログラム |
JP2015028783A (ja) | 2014-07-13 | 2015-02-12 | 洋彰 宮崎 | 自律学習型制御器 |
JP6744208B2 (ja) | 2016-12-27 | 2020-08-19 | 株式会社日立製作所 | 制御装置及び制御方法 |
JP7064356B2 (ja) | 2018-03-14 | 2022-05-10 | 株式会社日立製作所 | 将来状態推定装置および将来状態推定方法 |
EP3620983B1 (en) * | 2018-09-05 | 2023-10-25 | Sartorius Stedim Data Analytics AB | Computer-implemented method, computer program product and system for data analysis |
JP7298494B2 (ja) | 2020-01-31 | 2023-06-27 | 横河電機株式会社 | 学習装置、学習方法、学習プログラム、判定装置、判定方法、および判定プログラム |
JP7331737B2 (ja) | 2020-03-06 | 2023-08-23 | 株式会社明電舎 | 水処理施設の運転支援装置 |
-
2022
- 2022-03-22 JP JP2022046154A patent/JP7444186B2/ja active Active
-
2023
- 2023-02-19 US US18/171,361 patent/US20230305501A1/en active Pending
- 2023-03-06 EP EP23160158.4A patent/EP4249179A1/en not_active Withdrawn
- 2023-03-21 CN CN202310280150.1A patent/CN116796853A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN116796853A (zh) | 2023-09-22 |
EP4249179A1 (en) | 2023-09-27 |
JP7444186B2 (ja) | 2024-03-06 |
US20230305501A1 (en) | 2023-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7011239B2 (ja) | 装置、方法、プログラム、および、記録媒体 | |
JP7298494B2 (ja) | 学習装置、学習方法、学習プログラム、判定装置、判定方法、および判定プログラム | |
JP7207596B1 (ja) | 運転支援装置、運転支援方法及びプログラム | |
CN113568379A (zh) | 控制辅助装置、控制辅助方法、计算机可读介质及控制系统 | |
KR102054500B1 (ko) | 설계 도면 제공 방법 | |
JP7359178B2 (ja) | 制御装置、制御方法、および、制御プログラム | |
JP7444186B2 (ja) | モデル検証装置、モデル検証方法、および、モデル検証プログラム | |
US20220291671A1 (en) | Control apparatus, control method and recording medium having recorded thereon control program | |
Korbicz et al. | Confidence estimation of GMDH neural networks and its application in fault detection systems | |
Mittelsteadt | Artificial intelligence: An introduction for policymakers | |
CN115705038A (zh) | 学习装置、学习方法、记录介质以及控制装置 | |
JP2022035737A (ja) | 制御システム、制御方法、制御装置及びプログラム | |
Ertiame et al. | Robust fault diagnosis for an exothermic semi-batch polymerization reactor under open-loop | |
US20230409928A1 (en) | Estimation apparatus, estimation method, and non-transitory computer-readable medium | |
WO2020054164A1 (ja) | 運転支援システム及び方法、自動プランナ、並びにコンピュータ可読媒体 | |
JP7359176B2 (ja) | 判定装置、判定方法、および、判定プログラム | |
JP7327623B1 (ja) | 予測装置、予測方法及びプログラム | |
US20230341828A1 (en) | Control apparatus, control method, and non-transitory computer readable medium | |
JP7409345B2 (ja) | 学習処理装置、制御装置、学習処理方法、制御方法、学習プログラムおよび制御プログラム | |
US20230384744A1 (en) | Remote-control apparatus, local-control apparatus, learning processing apparatus, method, and recording medium | |
JP2024157999A (ja) | 復帰操作を決定するための装置、方法、および、プログラム | |
US20240288839A1 (en) | Systems, methods, and devices for asset simulation and analytics | |
EP3739525A1 (en) | Informed imperceptible exploration based on control-policies | |
JP2023106917A (ja) | 装置、方法およびプログラム | |
Ma et al. | Subspace Method Aided Data‐Driven Fault Detection Based on Principal Component Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7444186 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |