JP2023078710A - 装置、方法およびプログラム - Google Patents

装置、方法およびプログラム Download PDF

Info

Publication number
JP2023078710A
JP2023078710A JP2021191964A JP2021191964A JP2023078710A JP 2023078710 A JP2023078710 A JP 2023078710A JP 2021191964 A JP2021191964 A JP 2021191964A JP 2021191964 A JP2021191964 A JP 2021191964A JP 2023078710 A JP2023078710 A JP 2023078710A
Authority
JP
Japan
Prior art keywords
parameter
model
target
identification information
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021191964A
Other languages
English (en)
Other versions
JP7459856B2 (ja
Inventor
豪 ▲高▼見
Go Takami
順二 山本
Junji Yamamoto
恵一郎 小渕
Keiichiro Obuchi
宏明 鹿子木
Hiroaki Kaneki
陽太 古川
Yota Furukawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yokogawa Electric Corp
Original Assignee
Yokogawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yokogawa Electric Corp filed Critical Yokogawa Electric Corp
Priority to JP2021191964A priority Critical patent/JP7459856B2/ja
Priority to US17/970,556 priority patent/US20230126776A1/en
Priority to US17/970,544 priority patent/US20230126567A1/en
Priority to US17/970,561 priority patent/US20230129189A1/en
Priority to CN202211324690.7A priority patent/CN116027659A/zh
Priority to CN202211325002.9A priority patent/CN116027660A/zh
Priority to EP22204158.4A priority patent/EP4174592A1/en
Priority to EP22204147.7A priority patent/EP4174591A1/en
Priority to CN202211325445.8A priority patent/CN116050535A/zh
Priority to EP22204153.5A priority patent/EP4174589B1/en
Publication of JP2023078710A publication Critical patent/JP2023078710A/ja
Application granted granted Critical
Publication of JP7459856B2 publication Critical patent/JP7459856B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Abstract

【解決手段】 設備の操業計画と、設備に関するパラメータのうち目標範囲の設定対象とされたパラメータの識別情報および当該パラメータに対して設定された目標範囲を含む目標設定データであって、設備を操業する操業モデルの学習に用いられた目標設定データのうちの少なくともパラメータの識別情報と、を取得する第1取得部と、第1取得部が取得したパラメータの識別情報および操業計画を含む学習データを用いて、操業計画が入力されることに応じて、操業モデルの学習に用いるべき目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルの学習処理を行う第1学習処理部と、を備える装置が提供される。【選択図】図1

Description

本発明は、装置、方法およびプログラムに関する。
特許文献1には、「測定データの入力に応じ、予め設定された報酬関数により定まる報酬値を高めるために推奨される第1種類の制御内容を示す推奨制御パラメータを出力する第1モデルの学習処理を実行する」と記載されている。
[先行技術文献]
[特許文献]
[特許文献1] 特開2021-086283号公報
[特許文献2] 特開2020-027556号公報
[特許文献3] 特開2019-020885号公報
[非特許文献]
[非特許文献1] 高見豪、「プラント制御AIの実現」、横河技報、横河電機株式会社、2020年、Vol.63、第1号、p.33~36
[非特許文献2] 今井拓司、「横河電機とNAISTが化学プラント向けに強化学習、少ない試行回数で高度な制御を実現」、日経Robotics、株式会社日経BP,2019年3月号
本発明の第1の態様においては、装置が提供される。装置は、設備の操業計画と、設備に関するパラメータのうち目標範囲の設定対象とされたパラメータの識別情報および当該パラメータに対して設定された目標範囲を含む目標設定データであって、設備を操業する操業モデルの学習に用いられた目標設定データのうちの少なくともパラメータの識別情報と、を取得する第1取得部を備えてよい。装置は、第1取得部が取得したパラメータの識別情報および操業計画を含む学習データを用いて、操業計画が入力されることに応じて、操業モデルの学習に用いるべき目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルの学習処理を行う第1学習処理部を備えてよい。
目標設定モデルは、操業計画が入力されることに応じて、目標範囲の設定対象とされるべきパラメータの識別情報を出力するパラメータ設定モデルを有してよい。第1学習処理部は、第1取得部が取得したパラメータの識別情報と、操業計画とを含む学習データを用いてパラメータ設定モデルの学習処理を行ってよい。
目標設定モデルは、操業計画と、目標範囲の設定対象とされるべきパラメータの識別情報とが入力されることに応じて、当該パラメータに対して設定されるべき目標範囲を出力する目標範囲設定モデルを有してよい。第1学習処理部は、第1取得部が取得したパラメータの識別情報および目標範囲と、操業計画とを含む学習データを用いて目標範囲設定モデルの学習処理を行ってよい。
装置は、設備に関する状態パラメータの値と、設備の制御パラメータの値とを含む学習データと、目標設定データとを用いて、状態パラメータの値が入力されることに応じて、設備に関する状態を、当該目標設定データの内容に応じた状態に近づける制御パラメータの値を出力するように操業モデルの学習処理を行う第2学習処理部を備えてよい。
装置は、新たに操業計画が入力されることに応じて、目標設定モデルに対して新たな操業計画を供給する第1供給部を備えてよい。装置は、第1供給部によって操業計画が供給された目標設定モデルからの出力データを取得する第2取得部を備えてよい。第2学習処理部は、第2取得部により取得された出力データに応じた目標設定データを用いて操業モデルの学習処理を行ってよい。
本発明の第2の態様においては、装置が提供される。装置は、設備の操業計画が入力されることに応じて、設備に関するパラメータのうち目標範囲の設定対象とするべきパラメータの識別情報、および、当該パラメータに対して設定するべき目標範囲を含む目標設定データであって、設備を操業する操業モデルの学習に用いられる目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルに対し、操業計画を供給する第1供給部を備えてよい。装置は、第1供給部によって操業計画が供給された目標設定モデルからの出力データを取得する第2取得部を備えてよい。装置は、第2取得部により取得された出力データに応じた目標設定データを用いて、設備を操業する操業モデルの学習処理を行う第2学習処理部を備えてよい。
目標設定モデルは、操業計画が入力されることに応じて、目標範囲の設定対象とされるべきパラメータの識別情報を出力するパラメータ設定モデルを有してよい。
目標設定モデルは、操業計画と、目標範囲の設定対象とされるべきパラメータの識別情報とが入力されることに応じて、当該パラメータに対して設定されるべき目標範囲を出力する目標範囲設定モデルを有してよい。
目標設定モデルは、第1供給部から操業計画が入力されることに応じて、目標範囲の設定対象とされるべきパラメータの識別情報を出力するパラメータ設定モデルを有してよい。目標設定モデルは、第1供給部から操業計画が入力され、かつ、第1供給部により操業計画が入力されたパラメータ設定モデルから、目標範囲の設定対象とされるべきパラメータの識別情報が入力されることに応じて、当該パラメータに対して設定されるべき目標範囲を出力する目標範囲設定モデルを有してよい。
本発明の第3の態様においては、方法が提供される。方法は、設備の操業計画と、設備に関するパラメータのうち目標範囲の設定対象とされたパラメータの識別情報および当該パラメータに対して設定された目標範囲を含む目標設定データであって、設備を操業する操業モデルの学習に用いられた目標設定データのうちの少なくともパラメータの識別情報と、を取得する第1取得段階を備えてよい。方法は、第1取得段階により取得したパラメータの識別情報および操業計画を含む学習データを用いて、操業計画が入力されることに応じて、操業モデルの学習に用いるべき目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルの学習処理を行う第1学習処理段階を備えてよい。
本発明の第4の態様においては、方法が提供される。方法は、設備の操業計画が入力されることに応じて、設備に関するパラメータのうち目標範囲の設定対象とするべきパラメータの識別情報、および、当該パラメータに対して設定するべき目標範囲を含む目標設定データであって、設備を操業する操業モデルの学習に用いられる目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルに対し、操業計画を供給する第1供給段階を備えてよい。方法は、第1供給段階によって操業計画が供給された目標設定モデルからの出力データを取得する第2取得段階を備えてよい。方法は、第2取得段階により取得された出力データに応じた目標設定データを含む学習データを用いて、設備を操業する操業モデルの学習処理を行う第2学習処理段階を備えてよい。
本発明の第5の態様においては、プログラムが提供される。プログラムは、コンピュータを、設備の操業計画と、設備に関するパラメータのうち目標範囲の設定対象とされたパラメータの識別情報および当該パラメータに対して設定された目標範囲を含む目標設定データであって、設備を操業する操業モデルの学習に用いられた目標設定データのうちの少なくともパラメータの識別情報と、を取得する第1取得部として機能させてよい。プログラムは、コンピュータを、第1取得部が取得したパラメータの識別情報および操業計画を含む学習データを用いて、操業計画が入力されることに応じて、操業モデルの学習に用いるべき目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルの学習処理を行う第1学習処理部として機能させてよい。
本発明の第6の態様においては、プログラムが提供される。プログラムは、コンピュータを、設備の操業計画が入力されることに応じて、設備に関するパラメータのうち目標範囲の設定対象とするべきパラメータの識別情報、および、当該パラメータに対して設定するべき目標範囲を含む目標設定データであって、設備を操業する操業モデルの学習に用いられる目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルに対し、操業計画を供給する第1供給部として機能させてよい。プログラムは、コンピュータを、第1供給部によって操業計画が供給された目標設定モデルからの出力データを取得する第2取得部として機能させてよい。プログラムは、コンピュータを、第2取得部により取得された出力データに応じた目標設定データを用いて、設備を操業する操業モデルの学習処理を行う第2学習処理部として機能させてよい。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
実施形態に係るシステム1を示す。 操業モデル401のデータ構造を示す。 行動決定テーブルを示す。 操業モデル401の学習動作を示す。 操業モデル401の他の学習動作を示す。 目標設定モデル414の学習動作を示す。 操業モデル401の評価動作を示す。 設備2の操業動作を示す。 変形例に係る目標設定モデル414Aを示す。 本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ2200の例を示す。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
[1.システム]
図1は、本実施形態に係るシステム1を示す。システム1は、設備2と、装置4とを備える。なお、図中のブロックは、それぞれ機能的に分離された機能ブロックであって、実際の装置構成とは必ずしも一致していなくてもよい。すなわち、本図において、1つのブロックとして示されているからといって、それが必ずしも1つの装置により構成されていなくてもよい。また、本図において、別々のブロックとして示されているからといって、それらが必ずしも別々の装置により構成されていなくてもよい。
[1.1.設備2]
設備2は、1または複数の機器(図示せず)が備え付けられた施設や装置等である。例えば、設備2は、プラントであってもよいし、複数の機器を複合させた複合装置であってもよい。プラントとしては、化学やバイオ等の工業プラントの他、ガス田や油田等の井戸元やその周辺を管理制御するプラント、水力・火力・原子力等の発電を管理制御するプラント、太陽光や風力等の環境発電を管理制御するプラント、上下水やダム等を管理制御するプラント等が挙げられる。
各機器は、器具、機械または装置であり、例えば、設備2のプロセスにおける圧力、温度、pH、速度、流量などの少なくとも1つの物理量を制御するバルブ、ポンプ、ヒータ、ファン、モータ、スイッチ等のアクチュエータであってよい。各機器は互いに異種でもよいし、少なくとも一部の2以上の機器が同種でもよい。各機器は、装置2により有線または無線で制御されてよい。
設備2には、1または複数のセンサ(図示せず)が設けられてよい。各センサは、設備2に関する状態の計測または判別を行う。各センサは、設備2の生産量、混入する不純物の割合、各制御対象の運転状況、アラームの発生状況等の操業状態の計測または判別を行ってよい。機器の運転状況は、一例として機器により制御される圧力、温度、pH、速度、流量などの少なくとも1つの物理量で表されてよい。各センサは、計測または判別の結果を、装置2に供給してよい。
[1.2.装置4]
装置4は、設備2を操業する操業モデル401を用いて設備2を操業するものであってよく、操業モデル401と、操業部402と、パラメータ取得部403とを有してよい。また、装置4は、操業モデル401の学習処理を行うものであってよく、入力部411と、記憶部412と、第2学習処理部413と、目標設定モデル414と、第1供給部415と、第2取得部416と、第2供給部417とを有してよい。また、装置4は、目標設定モデル414の学習処理を行うものであってよく、第1取得部421と、第1学習処理部422とを有してよい。また、装置4は、操業モデル401の評価を行うものであってよく、シミュレータ431と、表示制御部432と、目標範囲取得部433と、評価値取得部434と、評価部435とを有してよい。
[1.2.1.操業モデル401]
操業モデル401は、設備2を操業するためのモデルである。操業モデル401は、設備2に関する状態パラメータの値が入力されることに応じて設備2の制御パラメータの推奨値を出力してよい。操業モデル401は、制御パラメータを操業部402に供給してよい。
操業モデル401は、状態パラメータの値が入力されることに応じて、設備2に関する状態を当該操業モデル401の学習に用いられた目標設定データの内容に応じた状態に近づける制御パラメータの推奨値を出力してよい。目標設定データは、設備2に関するパラメータのうち、目標範囲の設定対象とされたパラメータの識別情報、および、当該パラメータに対して設定された目標範囲を含んでよい。目標設定データは、パラメータの識別情報および目標範囲の組み合わせを1つのみ含んでもよいし、複数含んでもよい。
設備2に関するパラメータは、設備2に関する状態パラメータと、設備2の制御パラメータとを含んでよい。設備2に関する状態パラメータは、設備2の状態パラメータと、設備2の操業による生産物の状態パラメータ(パフォーマンスパラメータとも称する)とを含んでよい。設備2の状態パラメータは、例えば圧力や流量、温度、pH,速度、消費電力、濃度などであってよい。設備2の状態パラメータは、設備2の消費エネルギーに関するパラメータであってもよいし、温室効果ガスの排出量に関するパラメータであってもよいし、歩留まりに関するパラメータであってもよい。生産物の状態パラメータは、例えば品質を示す指標値(品質値とも称する)や生産量などであってよい。品質値は、例えば生産物の純度や濃度、組成、粘度、色などを示す値であってよい。制御パラメータは、例えばバルブの操作量などであってよい。なお、本実施形態では一例として、目標範囲の設定対象のパラメータは、設備2に関する状態パラメータであってよい。
[1.2.2.操業部402]
操業部402は、操業モデル401を用いて設備2を操業する。操業部402は、後述のパラメータ取得部403が操業モデル401に状態パラメータの値を供給することに応じて当該操業モデル401から出力される制御パラメータの推奨値を取得してよい。操業部402は、操業モデル401から出力される制御パラメータを用いて設備2の各機器を制御することで、設備2を操業してよい。操業部402は、操業モデル401から出力される制御パラメータの推奨値をシミュレータ431に供給して、設備2の操業をシミュレートさせてもよい。
なお、操業部402は、入力部411を介して入力される人手の操作に応じて設備2を操業してもよい。操業部402は、人手の操作に応じた制御パラメータをシミュレータ431に供給して、設備2の操業をシミュレートさせてもよい。
[1.2.3.パラメータ取得部403]
パラメータ取得部403は、設備2に関するパラメータを取得する。パラメータ取得部403は、設備2の制御パラメータを操業部402から取得してよい。パラメータ取得部403は、設備2に関する状態パラメータ(本実施形態では一例として生産物の状態パラメータおよび設備2の状態パラメータ)を設備2から取得してよい。但し、パラメータ取得部403は、設備2の制御パラメータを設備2から取得してもよいし、生産物の状態パラメータをオペレータから取得してもよい。また、シミュレータ431によって設備2のシミュレーションが行われる場合には、パラメータ取得部403は、シミュレーションされた設備2に関するパラメータのうち、設備2に関する状態パラメータをシミュレータ431から取得してもよい。
パラメータ取得部403は、取得した各パラメータを記憶部412に記憶させてよい。パラメータ取得部403は、操業モデル401に対し、状態パラメータの値を供給してよい。
[1.2.4.入力部411]
入力部411は、オペレータから種々の入力操作を受ける。入力部411は、オペレータから設備2の操業計画の入力操作を受けてよい。また、入力部411は、オペレータから目標設定データの入力操作を受けてよい。目標設定モデル414の学習処理が完了していない場合には、操業計画と、目標設定データとは対応付けて入力されてよい。
ここで、設備2の操業計画は、設備2によって生産される物の生産計画量、目標品質および材料種別の少なくとも1つを示してよい。設備2の操業計画は、設備2のエネルギー効率や消費電力、歩留まり、温室効果ガスの排出量など、他の内容を示してもよい。
入力部411は、入力された操業計画および目標設定データを記憶部412に記憶させてよい。入力部411は、入力された目標設定データを第2学習処理部413に供給してよい。入力部411は、入力された操業計画を第1供給部415に供給してよい。
[1.2.5.記憶部412]
記憶部412は、種々のデータを記憶する。記憶部412は、パラメータ取得部403により取得された各パラメータを記憶してよい。また、記憶部412は、入力部411により入力された目標設定データと、設備2の操業計画とを記憶してよい。記憶部412に記憶される目標設定データは、操業モデル401の学習に用いられたデータであってよく、一例としてベテランのオペレータにより設定されたデータであってよい。なお、後述の目標設定モデル414に操業計画を供給して目標設定データが生成される場合には、記憶部412は、当該目標設定データと操業計画とをさらに記憶してよい。記憶部412に記憶されたデータは、第1学習処理部422および第2学習処理部413による学習処理に使用されてよい。
[1.2.6.第2学習処理部413]
第2学習処理部413は、設備2に関する状態パラメータの値、および、設備2の制御パラメータの値を含む学習データを用い、状態パラメータの値が入力されることに応じて制御パラメータの推奨値を出力するように操業モデル401の学習処理を実行する。第2学習処理部413が用いる学習データに含まれる状態パラメータおよび制御パラメータの種類は、パラメータ取得部403により取得されるパラメータの中でオペレータにより任意に選択されてよい。
第2学習処理部413は、操業モデル401の学習処理を強化学習により行ってよい。例えば、第2学習処理部413は、学習データと、予め設定された報酬関数により定まる報酬値とを用いて操業モデル401の学習処理を実行してよい。
第2学習処理部413は、目標設定データをさらに用いて操業モデル401の学習処理を行ってよく、状態パラメータの値が入力されることに応じて、設備2に関する状態を、当該目標設定データの内容に応じた状態に近づける制御パラメータの値を出力するように学習処理を行ってよい。この場合に、第2学習処理部413は、目標設定データの内容に基づいて設定された報酬関数により定まる報酬値を用いて学習処理を行ってよい。
例えば、報酬関数は、操業モデル401から出力される制御パラメータを用いて操業された設備2に関する状態パラメータの値が目標設定データの内容を満たす場合に報酬値を1とし、満たさない場合に報酬値を0とする関数であってよい。また、報酬関数は、操業モデル401から出力される制御パラメータを用いて操業された設備2に関する状態パラメータの値が目標設定データの目標範囲から外れる度合いに応じて報酬値を変化させる関数であってよい。一例として、報酬関数は、次の式(1)で示される関数であってよい。
報酬値=a*省エネ指標-b*品質値の外れ度 (1)
なお、式(1)中「a」,「b」は係数であってよい。「省エネ指標」とは、設備2の省エネルギーの度合いを示す指標であり、設備2の状態パラメータから算出される値であってよい。「品質値の外れ度」とは、生産物の品質値が目標設定データにおける品質値の目標範囲から外れた大きさであってよい。
[1.2.7.目標設定モデル414]
目標設定モデル414は、操業計画が入力されることに応じて、操業モデル401の学習に用いるべき目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する。本実施形態では一例として、目標設定モデル414は、パラメータの識別情報および目標範囲の両方を出力してよい。目標設定モデル414は、パラメータの識別情報および目標範囲の組み合わせを1つのみ出力してもよいし、複数出力してもよい。
[1.2.8.第1供給部415]
第1供給部415は、設備2の操業計画が入力されることに応じて、目標設定モデル414に当該操業計画を供給する。第1供給部415には、入力部411に対して新たに操業計画が入力されることに応じて、当該新たな操業計画を目標設定モデル414に供給してよい。これにより、操業計画に応じたデータが目標設定モデル414から出力される。
[1.2.9.第2取得部416]
第2取得部416は、第1供給部415によって操業計画が供給された目標設定モデル414からの出力データを取得する。本実施形態では一例として、第2取得部416は、目標設定モデル414からパラメータの識別情報および目標範囲の両方を出力データとして取得してよい。第2取得部416は、取得した出力データを第2供給部417に供給してよい。
[1.2.10.第2供給部417]
第2供給部417は、第2学習処理部413に対し、第2取得部416により取得された出力データに応じた目標設定データを供給する。これにより、第2供給部417から供給された目標設定データを用いて操業モデル401の学習処理が行われる。
なお、本実施形態においては一例として、目標設定モデル414からの出力データは、パラメータの識別情報および目標範囲の両方を含んでいる。そのため、第2供給部417は、出力データをそのまま目標設定データとして操業モデル401に供給してよい。
[1.2.11.第1取得部421]
第1取得部421は、設備2の操業計画と、操業モデル401の学習に用いられた目標設定データのうちの少なくともパラメータの識別情報と、を取得する。本実施形態では一例として、第1取得部421は、目標設定データのうちのパラメータの識別情報および目標範囲の両方を取得してよい。第1取得部421は、取得したデータを第1学習処理部422に供給してよい。
[1.2.12.第1学習処理部422]
第1学習処理部422は、第1取得部421が取得したパラメータの識別情報および操業計画を含む学習データを用いて目標設定モデル414の学習処理を行う。
第1学習処理部422は、ディープラーニングなどの教師あり学習によって目標設定モデル414の学習処理を行うが、他の機械学習の手法によって目標設定モデル414の学習を行ってもよい。例えば、第1学習処理部422は、操業モデル401の学習に用いられた目標設定データにおけるパラメータの識別情報と、当該目標設定データと対応付けて入力された操業計画とを含む学習データを用いて目標設定モデル414の学習処理を行ってよい。本実施形態では一例として、第1学習処理部422は、ベテランのオペレータにより設定されて操業モデル401の学習に用いられた目標設定データにおけるパラメータの識別情報と、当該目標設定データと対応付けて入力された操業計画とを含む学習データを用いて目標設定モデル414の学習処理を行ってよい。
第1学習処理部422は、目標設定モデル414からの出力データの内容が、操業モデル401の学習に用いられた目標設定データの内容に近似するように、目標設定モデル414の学習処理を行ってよい。また、第1学習処理部422は、目標設定モデル414に対し、操業計画が入力されることに応じて、当該操業計画が達成されるために操業モデル401の学習に用いられるべき目標設定データのパラメータの識別情報や目標範囲を出力するように学習処理を行ってよい。
第1学習処理部422は、第1取得部421が取得したパラメータの目標範囲をさらに含む学習データを用いて目標設定モデル414の学習処理を行ってよい。つまり、第1学習処理部422は、操業モデル401の学習に用いられた目標設定データにおけるパラメータの識別情報および目標範囲を含む学習データを用いて目標設定モデル414の学習処理を行ってよい。第1学習処理部422は、目標設定モデル414に対し、操業計画が入力されることに応じて、当該操業計画が達成されるために操業モデル401の学習に用いられるべき目標設定データのうち、パラメータの識別情報および目標範囲の両方を出力するように学習処理を行ってよい。
[1.2.13.シミュレータ431]
シミュレータ431は、設備2の状態をシミュレーションする。シミュレータ431は、設備2の定常状態から停止までを動的にシミュレーションするダイナミックシミュレータでもよいし、設備2の定常状態をシミュレーションするスタティックシミュレータでもよい。
シミュレータ431は、操業部402から供給される制御パラメータの値に基づいて操業された設備2に関する状態をシミュレートしてよい。操業部402から供給される制御パラメータの値は、操業モデル401から出力される制御パラメータの推奨値であってもよいし、人手の操作に応じた制御パラメータであってもよい。シミュレータ431は、シミュレーションにおいて操業された設備2に関するパラメータ(本実施形態では一例として、設備2に関する状態パラメータ)を評価値取得部434およびパラメータ取得部403に供給してよい。
[1.2.14.表示制御部432]
表示制御部432は、図示しない表示装置に種々の情報を表示させる。例えば、表示制御部432は、目標設定モデル414から第2取得部416が取得したパラメータの識別情報や目標範囲を表示させてもよい。また、表示制御部432は、パラメータ取得部403により取得された各パラメータを記憶部412から読み出して表示させてよい。表示制御部432は、設備2に関する複数種類のパラメータから何れかのパラメータ(選択パラメータとも称する)がオペレータにより選択されることに応じて、設備2の過去の操業での当該選択パラメータの値を表示させてよい。
なお、設備2が物の製造を行う場合には、表示制御部432と、後述の目標範囲取得部433、評価値取得部434および評価部435とにおいて、設備2に関するパラメータは、生産物に関する状態パラメータであってよく、本実施形態では一例として生産物の品質を示す指標値または生産物の生産量の少なくとも1つであってよい。これに加えて、または、これに代えて、設備2に関するパラメータは、設備2の状態パラメータ(一例として設備2のエネルギー効率や消費電力など)であってもよいし、設備2の制御パラメータであってもよい。
[1.2.15.目標範囲取得部433]
目標範囲取得部433は、オペレータにより選択された選択パラメータについて、操業モデル401を評価するためにオペレータにより設定される目標範囲(評価用目標範囲とも称する)を取得する。例えば、目標範囲取得部433は、表示制御部432によって各選択パラメータについて表示される過去の操業での値に基づいてオペレータにより設定される評価用目標範囲を取得してよい。目標範囲取得部433は、取得した評価用目標範囲を評価値取得部434に供給してよい。
なお、評価用目標範囲は、操業モデル401の学習に用いられた目標設定データ内の目標範囲と同じであってもよいし、異なってもよい。また、評価用目標範囲が設定されるパラメータは、操業モデル401の学習に用いられた目標設定データ内のパラメータと同じであってもよいし、異なってもよい。
[1.2.16.評価値取得部434]
評価値取得部434は、操業部402により操業モデル401から取得された推奨値により設備2を操業した結果に応じたモデル評価値を取得する。評価値取得部434は、取得したモデル評価値を評価部435に供給してよい。
モデル評価値は、操業モデル401を評価するための評価値であってよい。本実施形態においては一例として、モデル評価値は、操業モデル401から出力された推奨値によって操業された設備2に関するパラメータが評価用目標範囲に収まるか否かに基づいて算出されてよい。なお、モデル評価値は、第2学習処理部413が操業モデル401の強化学習において用いる報酬値と同じ値であってもよいし、異なる値であってもよい。
また、評価値取得部434は、設備2を人手の操作(一例としてベテランのオペレータの操作)により操業した結果に応じた基準評価値をさらに取得してよい。評価値取得部434は、取得した基準評価値を評価部435に供給してよい。
基準評価値は、モデル評価値の基準値であってよい。基準評価値は、人手の操作により操業された設備2に関するパラメータが目標範囲内に収まるか否かに基づいて、モデル評価値と同様に算出されてよい。
[1.2.17.評価部435]
評価部435は、モデル評価値、および、基準評価値に基づいて操業モデル401を評価する。評価部435は、モデル評価値と基準評価値との比較結果に基づいて操業モデル401を評価してよい。例えば、評価部435は、モデル評価値が基準評価値よりも良好な値である場合に、操業モデル401が良好である旨の評価を行ってよい。評価部435は、評価結果を表示制御部432などに出力してよい。
以上の装置4によれば、目標設定モデル414は、操業計画が入力されることに応じて、操業モデル401の学習に用いるべき目標設定データのうちパラメータの識別情報または目標範囲の少なくとも一方を出力する。また、目標設定モデル414の学習処理は、設備2の操業計画と、操業モデル401の学習に用いられた目標設定データのうちの少なくともパラメータの識別情報とを含む学習データを用いて行われる。従って、目標設定モデル414からの出力データ(ここではパラメータの識別情報または目標範囲の少なくとも一方)の内容を、操業計画が達成されるために操業モデル401の学習において用いられた目標設定データの内容に近似させることができる。よって、目標設定モデル414からの出力データを用いて操業モデル401の学習処理を行うことにより、操業計画に応じた適切な操業を行う操業モデル401を生成することができる。
また、目標設定データを用い、状態パラメータの値が入力されることに応じて、設備2に関する状態を当該目標設定データの内容に応じた状態に近づける制御パラメータの値を出力するように操業モデル401の学習処理が行われる。従って、適切な操業状態で設備2の操業を行う操業モデル401を生成することができる。
また、新たな操業計画が入力されることに応じて、当該操業計画が目標設定モデル414に供給され、目標設定モデル414からの出力データに応じた目標設定データを用いて操業モデル401の学習処理が行われる。従って、操業計画が変更されるごとに、操業計画に応じた目標設定データを用いて操業モデル401の学習処理を行い、操業計画に応じた適切な操業を行う操業モデル401を生成することができる。
また、操業モデル401から出力される制御パラメータの推奨値により設備2を操業した結果に応じたモデル評価値と、設備2を人手の操作により操業した結果に応じた基準評価値と基づいて操業モデル401が評価される。従って、操業モデル401を用いることによる操業結果の良否、ひいては操業モデル401の良否を画一的に判断することができる。
また、操業モデル401から出力される制御パラメータの推奨値により操業された設備2に関するパラメータが操業モデル401の評価用目標範囲内に収まるか否かに基づいてモデル評価値が算出され、人手の操作により操業された設備2に関するパラメータが評価用目標範囲内に収まるか否かに基づいて基準評価値が算出される。従って、操業モデル401を用いることによる操業結果の良否をいっそう画一的に判断することができる。
また、設備2に関する複数種類のパラメータのうち、オペレータにより選択される選択パラメータについて、オペレータにより設定される評価用目標範囲が取得されるので、任意のパラメータについて任意の評価用目標範囲を設定することができる。従って、操業結果の評価基準を任意に設定することができる。
また、複数種類のパラメータから選択パラメータが選択されることに応じて、設備2の過去の操業での当該選択パラメータの値が表示されるので、過去の選択パラメータの値に基づいて評価用目標範囲を設定することができる。
また、操業モデル401の評価において、設備2に関するパラメータは設備2による生産物の品質を示す指標値または生産物の生産量の少なくとも1つであるので、生産量や品質が向上する操業モデル401を良好な操業モデル401とする評価結果を取得することができる。従って、評価の高い操業モデル401を用いることにより、生産量や品質を向上させることができる。
また、状態パラメータの値、および、制御パラメータの値を含む学習データを用いて第2学習処理部413により操業モデル401の学習処理が実行されるので、評価の低い操業モデル401に学習処理を行い、評価の高い操業モデル401を得ることができる。
また、学習データと、予め設定された報酬関数により定まる報酬値とを用いて操業モデル401の学習処理が実行されるので、評価の高い操業モデル401を確実に得ることができる。
[2.操業モデル401]
図2は、操業モデル401のデータ構造を示す。操業モデル401は、サンプリングされた状態データの集合を示す状態sと各状態下に取られた行動aとの組み合わせ(s,a)と、報酬によって計算されたウエイトwとで構成されるデータ構造を有する。なお、このようなウエイトは、目標設定データを用いた報酬関数により定まる報酬に基づいて決定されてよい。本図においては、一例として、状態s=(TI001,TI002,TI003,FI001,FI002,VI001)とした場合を示している。そして、本図においては、例えば、s=(-2.47803,-2.48413,-0.07324,29.71191,24.2511,70)の状態下でa=1の行動が取られた場合に、報酬によって計算されたウエイトがw=144.1484であることを意味している。このような操業モデル401により次の行動が決定される。
図3は、行動決定テーブルを示す。行動決定テーブルは、入力された状態sと取り得る行動aとで構成される。本図においては、一例として、入力された状態がs=(0.1,0.2,0.4,0.3,0.8,0.2)であり、取り得る行動がa=(-3,-1,0,1,3)の5つである場合を示している。例えば、このような行動決定テーブルを図4に示される操業モデル401に入力することにより、次の行動が決定される。これについてフローを用いて詳細に説明する。
[3.装置4の動作]
[3.1.操業モデル401の学習動作]
図4は、操業モデル401の学習動作を示す。装置1は、ステップS101~S119の処理により操業モデル401を生成してよい。
ステップS101において、第2学習処理部413は、目標設定データを取得する。本図の動作において第2学習処理部413は、入力部411を介して入力されたパラメータの識別情報と、当該パラメータの目標範囲とを含む目標設定データを取得してよい。
なお、ステップS101において表示制御部432は、操業モデル401の学習で以前に用いられた目標設定データの内容を表示させてもよい。例えば、表示制御部432は、設備2に関する複数種類のパラメータの何れかが目標範囲の設定対象としてオペレータにより選択されることに応じて、当該パラメータについて以前に設定された目標範囲を表示させてよい。また、表示制御部432は、以前に設定された目標範囲に含まれる少なくとも一部の領域を、推奨される目標範囲としてさらに表示させてもよい。例えば、表示制御部432は、以前に設定された目標範囲のうち、予め指定された割合の中央部分の範囲を推奨される目標範囲として表示させてよい。一例として、パラメータPaについて以前に設定された目標範囲が5~15であり、パラメータPbについて以前に設定された目標範囲が10~30であり、指定割合が90%である場合には、表示制御部432は、パラメータPaについて推奨される目標範囲を6~14、パラメータPbについて推奨される目標範囲を12~28としてよい。
表示制御部432は、目標範囲の設定対象の各パラメータを座標軸とする座標空間に、以前に設定された目標範囲を表示させてよい。また、表示制御部432は、推奨される目標範囲を座標空間にさらに表示させてよい。以前に設定された目標範囲が座標空間に表示される場合には、第2学習処理部413は、入力部411により座標空間内で範囲指定が行われることに応じて、その指定範囲を目標範囲として取得してよい。
ステップS103において、第2学習処理部413は、目標設定データを用いて報酬関数を決定する。第2学習処理部413は、操業モデル401により操業された設備2に関する状態が、目標設定データの内容に応じた状態に近づく場合に報酬値が高くなるように報酬関数を決定してよい。また、第2学習処理部413は、操業モデル401により操業された設備2に関する状態パラメータが、目標設定データの内容を満たす場合に報酬値が高くなるように報酬関数を決定してよい。
ステップS105において、パラメータ取得部403は、設備2に関する状態パラメータを取得する。例えば、パラメータ取得部403は、設備2またはシミュレータ431から状態パラメータを取得してよい。
ステップS107において、第2学習処理部413は、行動を決定し、決定した行動に応じた制御パラメータを決定する。例えば、第2学習処理部413は、ランダムに行動を決定する。なお、上述の説明では、第2学習処理部413がランダムに行動を決定する場合を一例として示したが、これに限定されるものではない。第2学習処理部413が行動を決定するにあたって、例えば、FKDPP(Factorial Kernel Dynamic Policy Programming)等の既知のAIアルゴリズムが用いられてもよい。このようなカーネル法を用いる場合、第2学習処理部413は、状態データから状態sのベクトルを生成する。次に、第2学習処理部413は、状態sと、取り得る全ての行動aとの組み合わせを、例えば図3に示されるような行動決定テーブルとして生成する。そして、第2学習処理部413は、行動決定テーブルを、例えば図2に示されるような操業モデル401へ入力する。これに応じて、行動決定テーブルの各行と、操業モデル401のうちのウエイト列を除いた各サンプルデータとの間でカーネル計算が行われ、各サンプルデータとの間の距離がそれぞれ算出される。そして、各サンプルデータについて算出した距離にそれぞれのウエイト列の値を乗算したものが順次足し合わせられて、各行動における報酬期待値が計算される。操業モデル401は、このようにして計算された報酬期待値が最も高くなる行動を選択する。第2学習処理部413は、例えばこのようにして、更新中の操業モデルを用いて報酬期待値が最も高いと判断された行動を選択することにより行動を決定してもよい。学習時においては、第2学習処理部413は、ランダムに行動を決定するか、操業モデル401を用いて行動を決定するかを適宜選択しながら行動を決定すればよい。第2学習処理部413は、決定した行動に応じた制御パラメータを操業部402へ供給する。
ステップS109において、操業部402は、供給された制御パラメータに応じて設備2を操業する。操業部402は、供給された制御パラメータに応じてシミュレータ431にシミュレーションを行わせてもよい。
ステップS111において、パラメータ取得部403は、設備2に関する状態パラメータを取得する。これにより、決定された制御パラメータにより設備2が操業されたことに応じて変化した後の状態パラメータが取得される。なお、ステップS109においてシミュレーションが行われた場合には、パラメータ取得部403は、状態パラメータをシミュレータ431から取得してよい。
ステップS113において、第2学習処理部413は、取得されたパラメータに基づいて報酬値を算出する。第2学習処理部413は、ステップS103で決定した報酬関数を用いて報酬値を算出してよい。
ステップS115において、第2学習処理部413は、制御パラメータの決定に応じたパラメータの取得処理が、指定されたステップ回数を超えたかどうか判定する。なお、このようなステップ回数は、予めオペレータにより指定されたものであってもよいし、学習対象期間(例えば10日間等)を基に定められたものであってもよい。上述の処理が指定されたステップ回数を超えていないと判定された場合(ステップS115;No)、第2学習処理部413は、処理をステップS107に戻してフローを継続する。これにより、制御パラメータの決定に応じた状態パラメータの取得処理が指定されたステップ回数だけ実行される。
ステップS115において、上述の処理が指定されたステップ回数を超えたと判定された場合(ステップS115;Yes)、第2学習処理部413は、処理をステップS117へ進める。ステップS117において、第2学習処理部413は、操業モデル401を更新する。例えば、第2学習処理部413は、図2に示される操業モデルにおけるウエイト列の値を上書きするほか、これまでに保存されていない新たなサンプルデータを操業モデル401に追加する。
ステップS119において、第2学習処理部413は、操業モデル401の更新処理が、指定された繰り返し回数を超えたかどうか判定する。なお、このような繰り返し回数は、予めオペレータにより指定されたものであってもよいし、操業モデル401の妥当性に応じて定められたものであってもよい。上述の処理が指定された繰り返し回数を超えていないと判定された場合(ステップS119;No)、第2学習処理部413は、処理をステップS105へ戻してフローを継続する。
ステップS119において、上述の処理が指定された繰り返し回数を超えたと判定された場合(ステップS119;Yes)、第2学習処理部413は、フローを終了する。第2学習処理部413は、例えばこのようにして、設備2に関する状態パラメータに応じた制御パラメータを出力する操業モデル401を生成することができる。
[3.2.操業モデル401の他の学習動作]
図5は、操業モデル401の他の学習動作を示す。目標設定モデル414の学習処理が完了している場合には、装置1は、ステップS121~S123,S103~S119の処理により操業モデル401を生成してもよい。
ステップS121において、第1供給部415は、新たに入力される操業計画を取得する。第1供給部415は、入力部411に新たに入力される操業計画を取得してよい。
ステップS123において、第1供給部415は、取得した操業計画を目標設定モデル414に供給する。これにより、新たに操業計画が入力されることに応じて、当該操業計画が目標設定モデル414に供給される。
ステップS125において、第2供給部417は、目標設定モデルからの出力データ(本実施形態では一例として、パラメータの識別情報および目標範囲)を取得し、当該出力データに応じた目標設定データを取得する。第2供給部417は、出力データをそのまま目標設定データとして取得してよい。
これに代えて、第2供給部417は、取得した出力データの内容を、推奨される目標設定データとして表示制御部432に表示させ、表示内容に基づいてオペレータにより入力される目標設定データを取得してもよい。一例として、或るパラメータについて目標範囲を1~10とする出力データの内容が表示され、オペレータが当該パラメータの目標範囲を2~9と入力した場合には、第2供給部417は、当該パラメータについての目標範囲を2~9とする目標設定データを取得してよい。
以降、上述のステップS103~S119と同様にして、操業モデル401の学習動作が行われてよい。
[3.3.目標設定モデル414の学習動作]
図6は、目標設定モデル414の学習動作を示す。装置1は、ステップS131~S133の処理により目標設定モデル414を生成してよい。
ステップS131において、第1取得部421は、設備2の操業計画と、操業モデル401の学習に用いられた目標設定データのうちの少なくともパラメータの識別情報と、を取得する。本実施形態では一例として、第1取得部421は、操業モデル401の学習に用いられた目標設定データのうち少なくともパラメータの識別情報と、当該目標設定データと対応付けて入力部411により入力された操業計画とを取得してよい。また、第1取得部421は、目標設定データのうちのパラメータの識別情報および目標範囲の両方を取得してよい。第1取得部421は、目標設定データにおけるパラメータの識別情報や、操業計画などを記憶部412から取得してよい。
ステップS133において、第1学習処理部422は、第1取得部421が取得したパラメータの識別情報および操業計画を含む学習データを用いて目標設定モデル414の学習処理を行う。第1学習処理部422は、ディープラーニングなどの教師あり学習によって目標設定モデル414の学習処理を行ってよく、目標設定モデル414からの出力データの内容が、操業モデル401の学習に用いられた目標設定データの内容に近似するように、目標設定モデル414の学習処理を行ってよい。また、本実施形態では一例として、第1学習処理部422は、目標設定モデル414に対し、操業計画が入力されることに応じて、当該操業計画が達成されるために操業モデル401の学習に用いられるべき目標設定データの内容を出力するように学習処理を行ってよい。
[3.4.操業モデル401の評価動作]
図7は、操業モデル401の評価動作を示す。装置1は、ステップS141~S175の処理により、生成された操業モデル401を評価してよい。
ステップS141において、表示制御部432は、設備2に関する複数種類のパラメータの何れかが選択パラメータとしてオペレータにより選択されることに応じて、設備2の過去の操業での当該選択パラメータの値を表示させる。例えば、表示制御部432は、各選択パラメータを座標軸とする座標空間に、設備2の過去の操業での各選択パラメータの値を表示させてよい。一例として、表示制御部432は、設備2の過去の操業での各選択パラメータの値をそれぞれ表示させてもよいし、設備2の過去の操業での各選択パラメータの値の最大値および最小値を表示させることで、各選択パラメータの値の範囲を表示させてもよい。
ステップS143において、目標範囲取得部433は、選択パラメータについて、オペレータにより設定される評価用目標範囲を取得する。目標範囲取得部433は、表示制御部432によって表示される、各選択パラメータを座標軸とする座標空間内で範囲指定が行われることに応じて、その指定範囲を評価用目標範囲として取得してよい。
ステップS145において状態パラメータ取得部403は、設備2に関する状態パラメータをシミュレータ431から取得する。なお、ステップS145の処理が最初に実行される場合には、設備2の状態は、予め設定された初期状態であってよい。
ステップS147においてシミュレータ431は、人手の操作に応じたシミュレーションを行う。シミュレータ431は、人手の操作に応じた制御パラメータに基づいて操業された設備2の状態をシミュレートしてよい。
ステップS149においてシミュレータ431は、シミュレーションの終了が指示されたか否かを判定する。例えば、シミュレータ431は、入力部411を介してシミュレーションの終了指示が入力されたか否かを判定してよい。ステップS149においてシミュレーションの終了が指示されていないと判定した場合(ステップS149;No)には、上述のステップS145に処理が移行してよい。ステップS149においてシミュレーションの終了が指示されたと判定した場合(ステップS149;Yes)には、ステップS151に処理が移行してよい。
ステップS151において評価値取得部434は、設備2を人手の操作により操業した結果に応じた基準評価値を取得する。本実施形態では一例として、基準評価値は、シミュレータ431に人手の操作を入力した結果に基づいて算出されてよい。
基準評価値は、人手の操作に応じた制御パラメータによって操業された設備2に関するパラメータが評価用目標範囲に収まるか否かに基づいて算出されてよい。設備2に関する複数のパラメータのそれぞれについて評価用目標範囲が設定される場合には、基準評価値は、評価用目標範囲が設定されたパラメータ数(a)のうち、対応する目標範囲内に収まるパラメータ数(b)の割合(つまりb/a)に基づいて算出されてよい。なお、基準評価値は、シミュレータ431により算出されてもよいし、操業された設備2に関するパラメータをシミュレータ431から取得した評価値取得部434によって算出されてもよい。
ステップS153においてシミュレータ431は人手の操作に応じたシミュレーションを終了する。シミュレーションの終了により、シミュレートされた設備2の状態は初期状態にリセットされてよい。
ステップS161において状態パラメータ取得部403は、設備2に関する状態パラメータをシミュレータ431から取得する。なお、ステップS161の処理が最初に実行される場合には、設備2の状態は、予め設定された初期状態であってよい。
ステップS163においてパラメータ取得部403は、取得した状態パラメータを操業モデル401に供給する。これにより、操業モデル401から制御パラメータの推奨値が出力される。
ステップS165において操業部402は、操業モデル401から出力される制御パラメータの推奨値を取得する。
ステップS167においてシミュレータ431は、操業モデル401からの制御パラメータの推奨値に応じたシミュレーションを行う。シミュレータ431は、制御パラメータの推奨値に基づいて操業された設備2の状態をシミュレートしてよい。
ステップS169においてシミュレータ431は、シミュレーションの終了が指示されたか否かを判定する。ステップS169においてシミュレーションの終了が指示されていないと判定した場合(ステップS169;No)には、上述のステップS161に処理が移行してよい。ステップS169においてシミュレーションの終了が指示されたと判定した場合(ステップS169;Yes)には、ステップS171に処理が移行してよい。
ステップS171において評価値取得部434は、設備2を制御パラメータの推奨値により操業した結果に応じたモデル評価値を取得する。本実施形態では一例として、モデル評価値は、操業部402により取得された推奨値を設備2のシミュレータ431に入力した結果に基づいて算出されてよい。モデル評価値は、基準評価値と同様にして、制御パラメータの推奨値によって操業された設備2に関するパラメータが評価用目標範囲に収まるか否かに基づいて算出されてよい。
ステップS173においてシミュレータ431は制御パラメータの推奨値に応じたシミュレーションを終了する。シミュレーションの終了により、シミュレートされた設備2の状態は初期状態にリセットされてよい。
ステップS175において評価部435は、モデル評価値、および、基準評価値に基づいて操業モデル401を評価する。本実施形態では一例として、評価部435は、モデル評価値が基準評価値よりも大きい場合に、操業モデル401が良好である旨の評価を行ってよい。
以上の動作によれば、設備2のシミュレータ431に人手の操作を入力した結果に基づいて基準評価値が算出されるので、実際に設備2を操業することなく速やかに基準評価値を得ることができる。
また、操業モデル401から取得された制御パラメータの推奨値を設備2のシミュレータ431に入力した結果に基づいてモデル評価値が算出されるので、実際に設備2を操業することなく速やかにモデル評価値を得ることができる。
また、基準評価値およびモデル評価値がそれぞれシミュレーションの結果に基づいて算出されるので、人手の操作により設備2を操業する場合と、操業モデル401を用いて設備2を操業する場合とで、操業前の設備2を同じ状態に揃えることができる。従って、操業モデル401を用いることによる操業結果の良否を精度良く判断することができる。
また、評価用目標範囲を設定する場合に、オペレータにより選択された各選択パラメータを座標軸とする座標空間に、設備2の過去の操業での各選択パラメータの値が表示されるので、選択パラメータの過去の値や、その範囲の把握を容易化し、評価用目標範囲の設定を容易化することができる。
[3.5.設備2の操業動作]
図8は、設備2の操業動作を示す。装置1は、ステップS181~S191の処理により設備2を操業してよい。
ステップS181において状態パラメータ取得部403は、設備2に関する状態パラメータを取得する。ステップS183においてパラメータ取得部403は、取得した状態パラメータを操業モデル401に供給する。これにより、操業モデル401から制御パラメータの推奨値が出力される。ステップS185において操業部402は、操業モデル401から出力される制御パラメータの推奨値を取得する。ステップS187において操業部402は、操業モデル401からの制御パラメータの推奨値に応じて設備2を操業する。
ステップS189において操業部402は、操業の終了が指示されたか否かを判定する。ステップS189において操業の終了が指示されていないと判定した場合(ステップS189;No)には、上述のステップS181に処理が移行してよい。ステップS189において操業の終了が指示されたと判定した場合(ステップS189;Yes)には、ステップS191に処理が移行し、操業部402は設備2の操業を終了する。
[4.目標設定モデル414の変形例(1)]
なお、上記の実施形態においては、目標設定モデル414には操業計画と、操業モデル401の学習に用いた目標設定データにおけるパラメータの識別情報および目標範囲を含む学習データとを用いて学習処理が行われ、学習処理が行われた目標設定モデル414は操業計画の入力に応じて、操業モデル401の学習に用いるべき目標設定データのうち、パラメータの識別情報および目標範囲を出力することとして説明した。しかしながら、目標設定モデル414についての学習データ、入力データ、および、出力データの内容の組み合わせはこれに限らない。
例えば、目標設定モデル414は、操業計画と、操業モデル401の学習に用いた目標設定データにおけるパラメータの識別情報を含む学習データとを用いて学習処理が行われ、操業計画の入力に応じて、操業モデル401の学習に用いるべき目標設定データのうち、パラメータの識別情報のみを出力し、目標範囲を出力しなくてもよい。学習データには、操業モデルの学習に用いた目標設定データにおけるパラメータの識別情報および目標範囲の両方が含まれてもよい。目標設定モデル414は、単一のパラメータの識別情報を出力してもよいし、複数のパラメータの識別情報を出力してもよい。パラメータの識別情報のみが目標設定モデル414から出力される場合には、第2供給部417は、出力された各パラメータの識別情報を表示制御部432に表示させて、オペレータにより入力される目標範囲をパラメータの識別情報毎に取得し、これらの識別情報および目標範囲を示す目標設定データを生成して、第2学習処理部413に供給してよい。
また、目標設定モデル414は、操業計画と、操業モデル401の学習に用いた目標設定データにおけるパラメータの識別情報および目標範囲を含む学習データとを用いて学習処理が行われ、操業計画と、目標範囲の設定対象とするべきパラメータの識別情報との入力に応じて、操業モデル401の学習に用いるべき目標設定データのうち、当該パラメータについての目標範囲のみを出力し、パラメータの識別情報を出力しなくてもよい。この場合には、目標範囲の設定対象とするべき単一のパラメータの識別情報が入力部411を介してオペレータから目標設定モデル414に入力されて、目標設定モデル414から当該単一のパラメータの目標範囲が出力されてよい。これに代えて、目標範囲の設定対象とするべき複数のパラメータの識別情報が入力部411を介してオペレータから目標設定モデル414に入力されて、目標設定モデル414から各パラメータの目標範囲が出力されてもよい。第2供給部417は、目標設定モデル414に入力された各パラメータの識別情報と、目標設定モデル414から出力された各パラメータの目標範囲とを示す目標設定データを生成して、第2学習処理部413に供給してよい。
[5.目標設定モデル414の変形例(2)]
また、上記の実施形態においては、目標設定モデル414を単一のモデルとして説明したが、機能の異なる複数のモデルを有してもよい。
図9は、本変形例に係る目標設定モデル414Aを示す。目標設定モデル414Aは、少なくとも1つのパラメータ設定モデル4141と、少なくとも1つの目標範囲設定モデル4142とを有してよい。本実施形態においては一例として、目標設定モデル414Aは、2つのパラメータ設定モデル4141a,4141bと、4つの目標範囲設定モデル4142a~4142dとを有する。各パラメータ設定モデル4141は、操業計画が入力されることに応じて、目標範囲の設定対象とされるべきパラメータの識別情報を出力する。各目標範囲設定モデル4142は、操業計画と、目標範囲の設定対象とされるべきパラメータの識別情報とが入力されることに応じて、当該パラメータに対して設定されるべき目標範囲を出力する。
このうち、パラメータ設定モデル4141aは、操業計画が入力されることに応じて、目標範囲の設定対象とされるべきパラメータ(パラメータPaとも称する)の識別情報を出力してよい。本実施形態においては一例として、パラメータ設定モデル4141aは、第1供給部415から操業計画が入力されることに応じて、当該操業計画と、パラメータPaの識別情報とを目標範囲設定モデル4142aに供給する。
目標範囲設定モデル4142aは、操業計画と、パラメータの識別情報とが入力されることに応じて、当該パラメータに対して設定されるべき目標範囲の上限値を出力してよい。本実施形態においては一例として、目標範囲設定モデル4142aは、第1供給部415により操業計画が入力されたパラメータ設定モデル4141aから操業計画と、パラメータPaの識別情報とが入力されることに応じて、当該操業計画と、パラメータPaの識別情報と、パラメータPaの目標範囲の上限値VPaMAXとを目標範囲設定モデル4142bに供給する。なお、操業計画は、パラメータ設定モデル4141aを介して第1供給部415から目標範囲設定モデル4142aに入力される代わりに、第1供給部415から目標範囲設定モデル4142aに直接入力されてもよい。後述の目標範囲設定モデル4142b~4142dや、パラメータ設定モデル4141bについても同様である。
目標範囲設定モデル4142bは、操業計画と、パラメータの識別情報とが入力されることに応じて、当該パラメータに対して設定されるべき目標範囲の下限値を出力してよい。本実施形態においては一例として、目標範囲設定モデル4142bは、第1供給部415により操業計画が入力されたパラメータ設定モデル4141aから操業計画と、パラメータPaの識別情報と、パラメータPaの目標範囲の上限値VPaMAXとが入力されることに応じて、当該操業計画と、パラメータPaの識別情報と、パラメータPaの目標範囲の上下限値VPaMAX,VPaMINとをパラメータ設定モデル4141bに供給する。
パラメータ設定モデル4141bは、操業計画と、既に目標範囲の設定対象とされたパラメータPaの識別情報とが入力されることに応じて、目標範囲の設定対象とされるべき他のパラメータ(パラメータPbとも称する)の識別情報を出力してよい。本実施形態においては一例として、パラメータ設定モデル4141bは、目標範囲設定モデル4142bから操業計画と、パラメータPaの識別情報および目標範囲の上下限値VPaMAX,VPaMINとが入力されることに応じて、当該操業計画と、パラメータPaの識別情報および上下限値VPaMAX,VPaMINと、パラメータPaとは異なるパラメータPbの識別情報とを目標範囲設定モデル4142cに供給する。
目標範囲設定モデル4142cは、操業計画と、パラメータの識別情報とが入力されることに応じて、当該パラメータに対して設定されるべき目標範囲の上限値を出力してよい。本実施形態においては一例として、目標範囲設定モデル4142cは、パラメータ設定モデル4141bから操業計画と、パラメータPaの識別情報および目標範囲の上下限値VPaMAX,VPaMINと、パラメータPbの識別情報とが供給されることに応じて、当該操業計画と、パラメータPaの識別情報と、パラメータPaの目標範囲の上下限値VPaMAX,VPaMINと、パラメータPbの識別情報と、パラメータPbの目標範囲の上限値VPbMAXとを目標範囲設定モデル4142dに供給する。
目標範囲設定モデル4142dは、操業計画と、パラメータの識別情報とが入力されることに応じて、当該パラメータに対して設定されるべき目標範囲の下限値を出力してよい。本実施形態においては一例として、目標範囲設定モデル4142dは、目標範囲設定モデル4142cから操業計画と、パラメータPaの識別情報および目標範囲の上下限値VPaMAX,VPaMINと、パラメータPbの識別情報と、パラメータPbの目標範囲の上限値VPbMAXとが供給されることに応じて、当該操業計画と、パラメータPaの識別情報と、パラメータPaの目標範囲の上下限値VPaMAX,VPaMINと、パラメータPbの識別情報と、パラメータPbの目標範囲の上下限値VPbMAX,VPbMINとを出力する。
以上の目標設定モデル414Aによれば、パラメータ設定モデル4141に操業計画が入力されることに応じて、目標範囲の設定対象とされるべきパラメータの識別情報が出力される。従って、目標範囲が設定されるパラメータを、操業モデル401の学習に用いられた目標設定データのパラメータに合わせることができる。
また、パラメータ設定モデル4141bに操業計画と、既に目標範囲の設定対象とされたパラメータPaの識別情報とが入力されることに応じて、目標範囲の設定対象とされるべきパラメータPbの識別情報が出力される。従って、目標範囲が設定されるパラメータPbを、操業モデル401の学習においてパラメータPaとともに目標設定データに用いられたパラメータに合わせることができる。
また、パラメータ設定モデル4141bに操業計画と、既に目標範囲の設定対象とされたパラメータPaの識別情報および目標範囲の上下限値VPaMAX,VPaMINとが入力されることに応じて、目標範囲の設定対象とされるべきパラメータPbの識別情報が出力される。従って、目標範囲が設定されるパラメータPbを、操業モデル401の学習においてパラメータPaの識別情報および上下限値VPaMAX,VPaMINとともに目標設定データに用いられたパラメータに合わせることができる。
また、目標範囲設定モデル4142に操業計画と、目標範囲の設定対象とされるべきパラメータPa,Pbの識別情報とが入力されることに応じて、当該パラメータPa,Pbに対して設定されるべき目標範囲が出力される。従って、パラメータPa,Pbに対して設定されるべき目標範囲を、操業モデル401の学習に用いられた目標設定データの目標範囲に合わせることができる。
また、パラメータ設定モデル4141aに対して操業計画が入力されることに応じて、目標範囲の設定対象とされるべきパラメータPaの識別情報がパラメータ設定モデル4141aから出力され、目標範囲設定モデル4142aに対して操業計画が入力され、かつ、パラメータ設定モデル4141からパラメータPaの識別情報が入力されることに応じて、当該パラメータPaに対して設定されるべき目標範囲VPaMAX,VPaMINが目標範囲設定モデル4142aから出力される。従って、目標設定データのパラメータと、目標範囲とを順次、自動的に取得することができる。
なお、以上の目標設定モデル414Aのパラメータ設定モデル4141aは、第1取得部421が取得したパラメータの識別情報と、操業計画とを含む学習データを用いて第1学習処理部422により学習処理が行われてよい。これにより、パラメータ設定モデル4141aを学習するための学習データではパラメータの目標範囲を省くことができるため、学習処理を容易化することができる。
また、パラメータ設定モデル4141bと、目標範囲設定モデル4142a~4142dとは、第1取得部421が取得したパラメータの識別情報および目標範囲と、操業計画とを含む学習データを用いて第1学習処理部422により学習処理が行われてよい。これにより、モデルからの出力データの内容を、操業計画が達成されるために操業モデル401の学習に用いられた目標設定データの内容に近似させることができる。
[6.その他の変形例]
なお、上記の実施形態においては、装置4は操業モデル401および目標設定モデル414を有することとして説明したが、これらの何れかを有しないこととしてもよい。装置4は、操業モデル401および目標設定モデル414を有しない場合には、外部接続された記憶装置内の操業モデル401および目標設定モデル414に対して学習処理を行ってもよいし、外部接続された記憶装置内の操業モデル401に対して評価を行ってもよいし、外部接続された記憶装置内の操業モデル401を用いて操業を行ってもよい。
また、装置4は、目標設定モデル414の学習処理を行うべく第1取得部421および第1学習処理部422などを有することとして説明したが、これらを有しなくてもよい。この場合には、装置4は、学習済みの目標設定モデル414を用いて操業モデル401の学習処理を行ってよい。学習済みの目標設定モデル414を複数の装置4で共有し、各装置4で別々の操業モデル401の学習処理を行ってもよい。
また、装置4は、操業モデル401の学習処理を行うべく第2学習処理部413等を有することとして説明したが、有しなくてもよい。この場合には、装置4は、操業モデル401の学習で用いられた目標設定データ内のパラメータの識別情報などを外部から取得して、目標設定モデル414の学習処理を行ってよい。
また、評価値取得部434は、シミュレーション結果に応じた基準評価値およびモデル評価値を取得することとして説明したが、設備2を実際に操業した結果に応じた基準評価値およびモデル評価値を取得してもよい。
また、評価値取得部434が基準評価値を算出することとして説明したが、固定値として予め装置4内に記憶されていてもよい。
また、本発明の様々な実施形態は、フローチャートおよびブロック図を参照して記載されてよく、ここにおいてブロックは、(1)操作が実行されるプロセスの段階または(2)操作を実行する役割を持つ装置のセクションを表わしてよい。特定の段階およびセクションが、専用回路、コンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、および/またはコンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタルおよび/またはアナログハードウェア回路を含んでよく、集積回路(IC)および/またはディスクリート回路を含んでよい。プログラマブル回路は、論理AND、論理OR、論理XOR、論理NAND、論理NOR、および他の論理操作、フリップフロップ、レジスタ、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルロジックアレイ(PLA)等のようなメモリ要素等を含む、再構成可能なハードウェア回路を含んでよい。
コンピュータ可読媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読媒体は、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(RTM)ディスク、メモリスティック、集積回路カード等が含まれてよい。
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1または複数のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかを含んでよい。
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサまたはプログラマブル回路に対し、ローカルにまたはローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して提供され、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく、コンピュータ可読命令を実行してよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
図10は、本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ2200の例を示す。コンピュータ2200にインストールされたプログラムは、コンピュータ2200に、本発明の実施形態に係る装置に関連付けられる操作または当該装置の1または複数のセクションとして機能させることができ、または当該操作または当該1または複数のセクションを実行させることができ、および/またはコンピュータ2200に、本発明の実施形態に係るプロセスまたは当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ2200に、本明細書に記載のフローチャートおよびブロック図のブロックのうちのいくつかまたはすべてに関連付けられた特定の操作を実行させるべく、CPU2212によって実行されてよい。
本実施形態によるコンピュータ2200は、CPU2212、RAM2214、グラフィックコントローラ2216、およびディスプレイデバイス2218を含み、それらはホストコントローラ2210によって相互に接続されている。コンピュータ2200はまた、通信インタフェース2222、ハードディスクドライブ2224、DVD-ROMドライブ2226、およびICカードドライブのような入/出力ユニットを含み、それらは入/出力コントローラ2220を介してホストコントローラ2210に接続されている。コンピュータはまた、ROM2230およびキーボード2242のようなレガシの入/出力ユニットを含み、それらは入/出力チップ2240を介して入/出力コントローラ2220に接続されている。
CPU2212は、ROM2230およびRAM2214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ2216は、RAM2214内に提供されるフレームバッファ等またはそれ自体の中にCPU2212によって生成されたイメージデータを取得し、イメージデータがディスプレイデバイス2218上に表示されるようにする。
通信インタフェース2222は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ2224は、コンピュータ2200内のCPU2212によって使用されるプログラムおよびデータを格納する。DVD-ROMドライブ2226は、プログラムまたはデータをDVD-ROM2201から読み取り、ハードディスクドライブ2224にRAM2214を介してプログラムまたはデータを提供する。ICカードドライブは、プログラムおよびデータをICカードから読み取り、および/またはプログラムおよびデータをICカードに書き込む。
ROM2230はその中に、アクティブ化時にコンピュータ2200によって実行されるブートプログラム等、および/またはコンピュータ2200のハードウェアに依存するプログラムを格納する。入/出力チップ2240はまた、様々な入/出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入/出力コントローラ2220に接続してよい。
プログラムが、DVD-ROM2201またはICカードのようなコンピュータ可読媒体によって提供される。プログラムは、コンピュータ可読媒体から読み取られ、コンピュータ可読媒体の例でもあるハードディスクドライブ2224、RAM2214、またはROM2230にインストールされ、CPU2212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ2200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置または方法が、コンピュータ2200の使用に従い情報の操作または処理を実現することによって構成されてよい。
例えば、通信がコンピュータ2200および外部デバイス間で実行される場合、CPU2212は、RAM2214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース2222に対し、通信処理を命令してよい。通信インタフェース2222は、CPU2212の制御下、RAM2214、ハードディスクドライブ2224、DVD-ROM2201、またはICカードのような記録媒体内に提供される送信バッファ処理領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、またはネットワークから受信された受信データを記録媒体上に提供される受信バッファ処理領域等に書き込む。
また、CPU2212は、ハードディスクドライブ2224、DVD-ROMドライブ2226(DVD-ROM2201)、ICカード等のような外部記録媒体に格納されたファイルまたはデータベースの全部または必要な部分がRAM2214に読み取られるようにし、RAM2214上のデータに対し様々なタイプの処理を実行してよい。CPU2212は次に、処理されたデータを外部記録媒体にライトバックする。
様々なタイプのプログラム、データ、テーブル、およびデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU2212は、RAM2214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプの操作、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM2214に対しライトバックする。また、CPU2212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU2212は、第1の属性の属性値が指定される、条件に一致するエントリを当該複数のエントリの中から検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
上で説明したプログラムまたはソフトウェアモジュールは、コンピュータ2200上またはコンピュータ2200近傍のコンピュータ可読媒体に格納されてよい。また、専用通信ネットワークまたはインターネットに接続されたサーバーシステム内に提供されるハードディスクまたはRAMのような記録媒体が、コンピュータ可読媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ2200に提供する。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
1 システム
2 設備
4 装置
401 操業モデル
402 操業部
403 パラメータ取得部
411 入力部
412 記憶部
413 第2学習処理部
414 目標設定モデル
415 第1供給部
416 第2取得部
417 第2供給部
421 第1取得部
422 第1学習処理部
431 シミュレータ
432 表示制御部
433 目標範囲取得部
434 評価値取得部
435 評価部
2200 コンピュータ
2201 DVD-ROM
2210 ホストコントローラ
2212 CPU
2214 RAM
2216 グラフィックコントローラ
2218 ディスプレイデバイス
2220 入/出力コントローラ
2222 通信インタフェース
2224 ハードディスクドライブ
2226 DVD-ROMドライブ
2230 ROM
2240 入/出力チップ
2242 キーボード
4141 パラメータ設定モデル
4142 目標範囲設定モデル

Claims (13)

  1. 設備の操業計画と、前記設備に関するパラメータのうち目標範囲の設定対象とされたパラメータの識別情報および当該パラメータに対して設定された目標範囲を含む目標設定データであって、前記設備を操業する操業モデルの学習に用いられた目標設定データのうちの少なくともパラメータの識別情報と、を取得する第1取得部と、
    前記第1取得部が取得したパラメータの識別情報および前記操業計画を含む学習データを用いて、前記操業計画が入力されることに応じて、前記操業モデルの学習に用いるべき前記目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルの学習処理を行う第1学習処理部と、
    を備える装置。
  2. 前記目標設定モデルは、前記操業計画が入力されることに応じて、目標範囲の設定対象とされるべきパラメータの識別情報を出力するパラメータ設定モデルを有し、
    前記第1学習処理部は、前記第1取得部が取得したパラメータの識別情報と、前記操業計画とを含む学習データを用いて前記パラメータ設定モデルの学習処理を行う、請求項1に記載の装置。
  3. 前記目標設定モデルは、前記操業計画と、目標範囲の設定対象とされるべきパラメータの識別情報とが入力されることに応じて、当該パラメータに対して設定されるべき目標範囲を出力する目標範囲設定モデルを有し、
    前記第1学習処理部は、前記第1取得部が取得したパラメータの識別情報および目標範囲と、前記操業計画とを含む学習データを用いて前記目標範囲設定モデルの学習処理を行う、請求項1または2に記載の装置。
  4. 前記設備に関する状態パラメータの値と、前記設備の制御パラメータの値とを含む学習データと、前記目標設定データとを用いて、状態パラメータの値が入力されることに応じて、前記設備に関する状態を、当該前記目標設定データの内容に応じた状態に近づける制御パラメータの値を出力するように前記操業モデルの学習処理を行う第2学習処理部を備える、請求項1から3の何れか一項に記載の装置。
  5. 新たに操業計画が入力されることに応じて、前記目標設定モデルに対して前記新たな操業計画を供給する第1供給部と、
    前記第1供給部によって操業計画が供給された前記目標設定モデルからの出力データを取得する第2取得部と、
    を備え、
    前記第2学習処理部は、前記第2取得部により取得された出力データに応じた前記目標設定データを用いて前記操業モデルの学習処理を行う、請求項4に記載の装置。
  6. 設備の操業計画が入力されることに応じて、前記設備に関するパラメータのうち目標範囲の設定対象とするべきパラメータの識別情報、および、当該パラメータに対して設定するべき目標範囲を含む目標設定データであって、前記設備を操業する操業モデルの学習に用いられる目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルに対し、操業計画を供給する第1供給部と、
    前記第1供給部によって操業計画が供給された前記目標設定モデルからの出力データを取得する第2取得部と、
    前記第2取得部により取得された出力データに応じた前記目標設定データを用いて、前記設備を操業する操業モデルの学習処理を行う第2学習処理部と、
    を備える装置。
  7. 前記目標設定モデルは、前記操業計画が入力されることに応じて、目標範囲の設定対象とされるべきパラメータの識別情報を出力するパラメータ設定モデルを有する、請求項5または6に記載の装置。
  8. 前記目標設定モデルは、前記操業計画と、目標範囲の設定対象とされるべきパラメータの識別情報とが入力されることに応じて、当該パラメータに対して設定されるべき目標範囲を出力する目標範囲設定モデルを有する、請求項5から7の何れか一項に記載の装置。
  9. 前記目標設定モデルは、
    前記第1供給部から前記操業計画が入力されることに応じて、目標範囲の設定対象とされるべきパラメータの識別情報を出力するパラメータ設定モデルと、
    前記第1供給部から前記操業計画が入力され、かつ、前記第1供給部により前記操業計画が入力された前記パラメータ設定モデルから、目標範囲の設定対象とされるべきパラメータの識別情報が入力されることに応じて、当該パラメータに対して設定されるべき目標範囲を出力する目標範囲設定モデルと、
    を有する、請求項5または6に記載の装置。
  10. 設備の操業計画と、前記設備に関するパラメータのうち目標範囲の設定対象とされたパラメータの識別情報および当該パラメータに対して設定された目標範囲を含む目標設定データであって、前記設備を操業する操業モデルの学習に用いられた目標設定データのうちの少なくともパラメータの識別情報と、を取得する第1取得段階と、
    前記第1取得段階により取得したパラメータの識別情報および前記操業計画を含む学習データを用いて、前記操業計画が入力されることに応じて、前記操業モデルの学習に用いるべき前記目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルの学習処理を行う第1学習処理段階と、
    を備える方法。
  11. 設備の操業計画が入力されることに応じて、前記設備に関するパラメータのうち目標範囲の設定対象とするべきパラメータの識別情報、および、当該パラメータに対して設定するべき目標範囲を含む目標設定データであって、前記設備を操業する操業モデルの学習に用いられる目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルに対し、操業計画を供給する第1供給段階と、
    前記第1供給段階によって操業計画が供給された前記目標設定モデルからの出力データを取得する第2取得段階と、
    前記第2取得段階により取得された出力データに応じた前記目標設定データを含む学習データを用いて、前記設備を操業する操業モデルの学習処理を行う第2学習処理段階と
    を備える方法。
  12. コンピュータを、
    設備の操業計画と、前記設備に関するパラメータのうち目標範囲の設定対象とされたパラメータの識別情報および当該パラメータに対して設定された目標範囲を含む目標設定データであって、前記設備を操業する操業モデルの学習に用いられた目標設定データのうちの少なくともパラメータの識別情報と、を取得する第1取得部と、
    前記第1取得部が取得したパラメータの識別情報および前記操業計画を含む学習データを用いて、前記操業計画が入力されることに応じて、前記操業モデルの学習に用いるべき前記目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルの学習処理を行う第1学習処理部
    として機能させるプログラム。
  13. コンピュータを、
    設備の操業計画が入力されることに応じて、前記設備に関するパラメータのうち目標範囲の設定対象とするべきパラメータの識別情報、および、当該パラメータに対して設定するべき目標範囲を含む目標設定データであって、前記設備を操業する操業モデルの学習に用いられる目標設定データのうち、パラメータの識別情報または目標範囲の少なくとも一方を出力する目標設定モデルに対し、操業計画を供給する第1供給部と、
    前記第1供給部によって操業計画が供給された前記目標設定モデルからの出力データを取得する第2取得部と、
    前記第2取得部により取得された出力データに応じた前記目標設定データを用いて、前記設備を操業する操業モデルの学習処理を行う第2学習処理部
    として機能させるプログラム。
JP2021191964A 2021-10-27 2021-11-26 装置、方法およびプログラム Active JP7459856B2 (ja)

Priority Applications (10)

Application Number Priority Date Filing Date Title
JP2021191964A JP7459856B2 (ja) 2021-11-26 2021-11-26 装置、方法およびプログラム
US17/970,544 US20230126567A1 (en) 2021-10-27 2022-10-20 Operation system, operation method and recording medium having recorded thereon operation program
US17/970,561 US20230129189A1 (en) 2021-10-27 2022-10-20 Apparatus, method, and computer readable medium
US17/970,556 US20230126776A1 (en) 2021-10-27 2022-10-20 Apparatus, method, and computer readable medium
CN202211325002.9A CN116027660A (zh) 2021-10-27 2022-10-27 装置、方法以及计算机可读介质
EP22204158.4A EP4174592A1 (en) 2021-10-27 2022-10-27 Apparatus, method, and program
CN202211324690.7A CN116027659A (zh) 2021-10-27 2022-10-27 装置、方法以及计算机可读介质
EP22204147.7A EP4174591A1 (en) 2021-10-27 2022-10-27 Operation system, operation method and operation program
CN202211325445.8A CN116050535A (zh) 2021-10-27 2022-10-27 操作系统、操作方法、评价模型生成装置、评价模型生成方法及记录介质
EP22204153.5A EP4174589B1 (en) 2021-10-27 2022-10-27 Apparatus, method and computer readable medium for evaluating an operation model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021191964A JP7459856B2 (ja) 2021-11-26 2021-11-26 装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2023078710A true JP2023078710A (ja) 2023-06-07
JP7459856B2 JP7459856B2 (ja) 2024-04-02

Family

ID=86646373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021191964A Active JP7459856B2 (ja) 2021-10-27 2021-11-26 装置、方法およびプログラム

Country Status (1)

Country Link
JP (1) JP7459856B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019101680A (ja) * 2017-11-30 2019-06-24 三菱重工工作機械株式会社 加工シミュレーションの条件の適正化方法、加工シミュレーション装置、加工シミュレーションシステム及びプログラム
JP2019141869A (ja) * 2018-02-19 2019-08-29 ファナック株式会社 制御装置及び機械学習装置
JP2021064049A (ja) * 2019-10-10 2021-04-22 株式会社日立製作所 計算機システム及び数理モデルの生成支援方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019101680A (ja) * 2017-11-30 2019-06-24 三菱重工工作機械株式会社 加工シミュレーションの条件の適正化方法、加工シミュレーション装置、加工シミュレーションシステム及びプログラム
JP2019141869A (ja) * 2018-02-19 2019-08-29 ファナック株式会社 制御装置及び機械学習装置
JP2021064049A (ja) * 2019-10-10 2021-04-22 株式会社日立製作所 計算機システム及び数理モデルの生成支援方法

Also Published As

Publication number Publication date
JP7459856B2 (ja) 2024-04-02

Similar Documents

Publication Publication Date Title
JP7331660B2 (ja) 装置、方法およびプログラム
JP7011239B2 (ja) 装置、方法、プログラム、および、記録媒体
PH12017000197A1 (en) Plant builder system with integrated simulation and control system configuration
US11429090B2 (en) Apparatus, method, and program
CN113568379B (zh) 控制辅助装置、控制辅助方法、计算机可读介质及控制系统
CN111566574A (zh) 用于动态模型生成的设备、方法和程序
CN111527455A (zh) 设备、模拟系统、方法和程序
EP4174589B1 (en) Apparatus, method and computer readable medium for evaluating an operation model
US11320811B2 (en) Plant operating condition setting support system, learning device, and operating condition setting support device
JP2022151193A (ja) 装置、方法およびプログラム
JP2023078710A (ja) 装置、方法およびプログラム
JP2023078694A (ja) 装置、方法およびプログラム
US20230045222A1 (en) Learning device, learning method, recording medium having recorded thereon learning program, and control device
JP7363839B2 (ja) 制御装置、制御方法、および、制御プログラム
JP7363840B2 (ja) 解析装置、解析方法およびプログラム
JP2021174259A (ja) 制御装置、制御方法および制御プログラム
JP7359176B2 (ja) 判定装置、判定方法、および、判定プログラム
JP7409345B2 (ja) 学習処理装置、制御装置、学習処理方法、制御方法、学習プログラムおよび制御プログラム
WO2024101351A1 (ja) 装置、方法およびプログラム
JP7525032B1 (ja) 性能評価装置、性能評価方法、及びプログラム
US20230065835A1 (en) Information processing device, evaluation method, and computer-readable recording medium
JP7444186B2 (ja) モデル検証装置、モデル検証方法、および、モデル検証プログラム
JP2023174330A (ja) リモート制御装置、ローカル制御装置、学習処理装置、方法、およびプログラム
EP4270118A1 (en) Control apparatus, control method, and control program
US20230409928A1 (en) Estimation apparatus, estimation method, and non-transitory computer-readable medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231024

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240304

R150 Certificate of patent or registration of utility model

Ref document number: 7459856

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150