JP2022035737A - Control system, control method, control device and program - Google Patents
Control system, control method, control device and program Download PDFInfo
- Publication number
- JP2022035737A JP2022035737A JP2020140257A JP2020140257A JP2022035737A JP 2022035737 A JP2022035737 A JP 2022035737A JP 2020140257 A JP2020140257 A JP 2020140257A JP 2020140257 A JP2020140257 A JP 2020140257A JP 2022035737 A JP2022035737 A JP 2022035737A
- Authority
- JP
- Japan
- Prior art keywords
- control
- parameter value
- control parameter
- intervention
- controlled object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 34
- 238000004364 calculation method Methods 0.000 claims abstract description 20
- 238000004088 simulation Methods 0.000 abstract 1
- 238000004891 communication Methods 0.000 description 9
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000005314 correlation function Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000002787 reinforcement Effects 0.000 description 4
- 238000010187 selection method Methods 0.000 description 4
- 238000005311 autocorrelation function Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000009628 steelmaking Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
Images
Abstract
Description
本発明は、制御システム、制御方法、制御装置及びプログラムに関する。 The present invention relates to control systems, control methods, control devices and programs.
化学プラントや製鉄プラント、エネルギープラント等の各種プラントでは、PID(Proportional-Integral-Differential)制御を用いた自動制御が広く行われている。PID制御は単純ながらも優れた自動制御手法であるが、プラントの状態によっては人間のオペレータが手動で制御に介入しなければならない場合が多々あることが知られている。例えば、プラントの状態変化や外乱の影響等により自動制御では制御対象を目標に近付けることが困難になった場合、オペレータはセンサ値等を監視しつつ必要に応じて手動で制御に介入する必要がある。 In various plants such as chemical plants, steelmaking plants, and energy plants, automatic control using PID (Proportional-Integral-Differential) control is widely performed. PID control is a simple but excellent automated control method, but it is known that depending on the state of the plant, a human operator often has to manually intervene in the control. For example, when it becomes difficult to bring the controlled object closer to the target by automatic control due to changes in the state of the plant or the influence of disturbance, the operator needs to manually intervene in the control as necessary while monitoring the sensor values. be.
オペレータの介入の増加は作業負担の増加や人件費の増加等に繋がるため、オペレータの介入を低減することが望ましい。このため、近年では、オペレータの介入を低減するために強化学習を利用した自動制御手法が注目されている。強化学習は複雑な系の自動制御に有効な手法であるが、学習初期にはランダムな制御をプラントに対して行うため制御性が悪化し、運転中のプラントに適用することは難しい。これに対して、自動制御を行うのではなく、強化学習でプラントを自動制御した場合の最適な制御パラメータ値を学習しておき、介入が必要となったときに最適な制御パラメータ値をオペレータに提案することも考えられる。 Since an increase in operator intervention leads to an increase in work load and labor cost, it is desirable to reduce operator intervention. Therefore, in recent years, an automatic control method using reinforcement learning has attracted attention in order to reduce operator intervention. Reinforcement learning is an effective method for automatic control of complex systems, but it is difficult to apply it to an operating plant because random control is performed on the plant at the initial stage of learning, resulting in poor controllability. On the other hand, instead of performing automatic control, the optimum control parameter value when the plant is automatically controlled by reinforcement learning is learned, and the optimum control parameter value is given to the operator when intervention is required. It is also possible to make a suggestion.
しかしながら、強化学習はプラントの最適な自動制御をモデル化するため、オペレータに提案された制御パラメータ値の説明可能性(つまり、なぜその制御パラメータ値が提案されたのかといった判断根拠の説明可能性)が低かった。このため、オペレータはその制御パラメータ値が本当に最適な値なのかを判断することは困難であった。 However, since reinforcement learning models the optimal automatic control of the plant, the possibility of explaining the control parameter value proposed to the operator (that is, the possibility of explaining the judgment basis such as why the control parameter value was proposed). Was low. Therefore, it is difficult for the operator to determine whether the control parameter value is really the optimum value.
本発明の一実施形態は、上記の点に鑑みてなされたもので、自動制御に対する介入時に説明可能性の高い制御パラメータ値を得ることを目的とする。 One embodiment of the present invention has been made in view of the above points, and an object of the present invention is to obtain control parameter values that are highly explainable when intervening in automatic control.
上記目的を達成するため、一実施形態に係る制御システムは、制御対象に対してオペレータが介入を行った場合における制御パラメータ値の履歴に基づいて、前記制御対象の状態と前記制御パラメータ値との関係を表すモデルを模倣学習により作成する作成部と、前記制御対象の状態に応じて、前記モデルにより制御パラメータ値を算出する算出部と、を有する。 In order to achieve the above object, the control system according to the embodiment has the state of the controlled object and the control parameter value based on the history of the control parameter value when the operator intervenes in the controlled object. It has a creation unit that creates a model representing a relationship by imitation learning, and a calculation unit that calculates a control parameter value by the model according to the state of the control target.
自動制御に対する介入時に説明可能性の高い制御パラメータ値を得ることができる。 It is possible to obtain control parameter values that are highly explainable when intervening in automatic control.
以下、本発明の一実施形態について説明する。本実施形態では、制御対象(例えば、各種プラントや各種設備、各種機器等)の自動制御に対する介入時に説明可能性の高い制御パラメータ値を得ることができる制御システム1について説明する。本実施形態に係る制御システム1は、機械学習手法の1つである模倣学習(Imitation Learning)によりオペレータが過去に介入した時の制御対象の状態と制御パラメータ値の関係をモデル化した上で、このモデル(以下、「介入モデル」ともいう。)を用いて自動制御に対する介入時の制御パラメータ値を得る。これにより、過去に実際にオペレータが介入した時と同様の制御パラメータ値が得られるため、説明可能性の高い制御パラメータ値が得ることが可能となる。したがって、オペレータに提案される制御パラメータの信頼性が確保され、例えば、プラントの安定的な操業にも資することが可能となる。
Hereinafter, an embodiment of the present invention will be described. In this embodiment, a
なお、制御パラメータ値とは制御対象を制御するためのパラメータの値のことであり、例えば、制御対象に対する操作量(MV:Manipulative Variable)や操作量に影響を与える目標値(SV:Set Variable)等のことである。 The control parameter value is a parameter value for controlling the control target. For example, an operation amount (MV: Manipulative Variable) for the control target or a target value (SV: Set Variable) that affects the operation amount. And so on.
<全体構成>
まず、本実施形態に係る制御システム1の全体構成について、図1を参照しながら説明する。図1は、本実施形態に係る制御システム1の全体構成の一例を示す図である。
<Overall configuration>
First, the overall configuration of the
図1に示すように、本実施形態に係る制御システム1は、制御装置10と、サーバ20と、オペレータ端末30と、制御対象40とを有する。制御装置10とサーバ20は、例えば、インターネット等の通信ネットワークを介して通信可能に接続される。また、制御装置10とオペレータ端末30と制御対象40は、例えば、制御ネットワーク等の通信ネットワークを介して通信可能に接続される。
As shown in FIG. 1, the
制御装置10は、制御対象40を制御するコンピュータ又はコンピュータシステムである。このとき、制御装置10は、フィードバック制御の1つであるPID制御等の自動制御手法により制御対象40を制御する。制御装置10としては、例えば、PLC(Programmable Logic Controller)やDCS(Distributed Control System)等を用いることが可能である。
The
また、制御装置10は、オペレータの介入が必要になった場合(例えば、制御対象40の状態(つまり、観測値(PV:Process Variable))が目標から外れそうになった場合等)に、介入モデルにより制御パラメータ値を算出し、オペレータ端末30に送信する。これにより、当該制御パラメータ値が、オペレータ端末30を利用するオペレータに提案される。
Further, the
サーバ20は、オペレータが過去に介入した時の履歴(以下、「介入履歴」ともいう。)を用いて模倣学習により介入モデルを作成し、制御装置10に送信するコンピュータ又はコンピュータシステムである。
The
オペレータ端末30は、制御対象40に対する制御を監視したり介入を行ったりするオペレータが利用する各種端末である。オペレータ端末30としては、例えば、PC(パーソナルコンピュータ)、タブレット端末、スマートフォン等を用いることが可能である。
The
制御対象40は、制御装置10によって制御される各種プラントや各種設備、各種機器等である。制御対象40には各種センサ(例えば、温度センサ、流量計、圧力計、濃度計等)が備え付けられており、当該制御対象40の状態を示す観測値が制御周期毎に制御装置10に送信(フィードバック)される。なお、観測値とは制御対象40の状態を表す各種センサ値(例えば、温度、流量、圧力、特定の成分の濃度等)であるが、これら以外にも、観測値には制御対象40の状態を表す任意の情報(例えば、制御対象40を撮影した撮影画像、制御対象40から出力される音を録音した音データ等)が含まれていてもよい。
The
なお、図1に示す制御システム1の全体構成は一例であって、他の構成であってもよい。例えば、制御システム1にはサーバ20が含まれず、制御装置10で介入モデルを作成するようにしてもよい。
The overall configuration of the
<ハードウェア構成>
次に、本実施形態に係る制御装置10のハードウェア構成について、図2を参照しながら説明する。図2は、本実施形態に係る制御装置10のハードウェア構成の一例を示す図である。
<Hardware configuration>
Next, the hardware configuration of the
図2に示すように、本実施形態に係る制御装置10は一般的なコンピュータ又はコンピュータシステムのハードウェア構成で実現され、入力装置11と、表示装置12と、外部I/F13と、通信I/F14と、プロセッサ15と、メモリ装置16とを有する。これら各ハードウェアは、それぞれがバス17を介して通信可能に接続されている。
As shown in FIG. 2, the
入力装置11は、例えば、キーボードやマウス、タッチパネル等である。表示装置12は、例えば、ディスプレイ等である。なお、制御装置10は、入力装置11及び表示装置12のうちの少なくとも一方を有していなくてもよい。
The input device 11 is, for example, a keyboard, a mouse, a touch panel, or the like. The
外部I/F13は、外部装置とのインタフェースである。外部装置には、記録媒体13a等がある。制御装置10は、外部I/F13を介して、記録媒体13aの読み取りや書き込み等を行うことができる。なお、記録媒体13aには、例えば、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等がある。
The external I /
通信I/F14は、制御装置10を通信ネットワークに接続するためのインタフェースである。プロセッサ15は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等の各種演算装置である。メモリ装置16は、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ等の各種記憶装置である。
The communication I /
本実施形態に係る制御装置10は、図2に示すハードウェア構成を有することにより、後述する各種処理を実現することができる。ただし、図2に示すハードウェア構成は一例であって、制御装置10は、他のハードウェア構成を有していてもよい。例えば、制御装置10は、複数のプロセッサ15を有していてもよいし、複数のメモリ装置16を有していてもよい。
By having the hardware configuration shown in FIG. 2, the
なお、サーバ20及びオペレータ端末30も同様に一般的なコンピュータ又はコンピュータシステムのハードウェア構成で実現され、入力装置と、表示装置と、外部I/Fと、通信I/Fと、プロセッサと、メモリ装置とを有する。ただし、サーバ20は、入力装置及び表示装置のうちの少なくとも一方を有していなくてもよい。また、サーバ20及びオペレータ端末30は、複数のプロセッサを有していてもよいし、複数のメモリ装置を有していてもよい。
Similarly, the
<機能構成>
次に、本実施形態に係る制御システム1の機能構成について、図3を参照しながら説明する。図3は、本実施形態に係る制御システム1の機能構成の一例を示す図である。
<Functional configuration>
Next, the functional configuration of the
≪制御装置10≫
図3に示すように、本実施形態に係る制御装置10は、制御部101と、介入判定部102と、算出部103と、提案部104と、再学習部105とを有する。これら各部は、制御装置10にインストールされた1以上のプログラムがプロセッサ15に実行させる処理により実現される。
<<
As shown in FIG. 3, the
また、本実施形態に係る制御装置10は、記憶部106を有する。記憶部106は、例えば、メモリ装置16により実現される。なお、記憶部106は、制御装置10と通信ネットワークを介して接続される記憶装置(例えば、データベースサーバ等)により実現されていてもよい。
Further, the
制御部101は、PID制御等の自動制御手法により制御対象40を制御したり、介入モデルにより算出された制御パラメータ値により制御対象40を制御したりする。すなわち、制御部101は、観測値と目標値を用いて自動制御手法により算出した操作量を制御対象40に送信したり、介入モデルにより算出された制御パラメータ値に基づく操作量を制御対象40に送信したりすることで当該制御対象40を制御する。ここで、制御パラメータ値に基づく操作量とは、例えば、制御パラメータ値が操作量である場合には当該操作量そのもののことであり、制御パラメータ値が目標値である場合には観測値と当該目標値とを用いて自動制御手法により算出した操作量のことである。
The
介入判定部102は、自動制御に対して介入が必要か否かを判定する。自動制御に対して介入が必要な場合とは、例えば、制御対象40の状態を示す観測値と目標値の差が所定の閾値を超えた場合や当該観測値が所定の閾値を超えた(又は下回った)場合等が挙げられる。
The
算出部103は、介入判定部102により介入が必要と判定された場合、制御対象40の現在の状態を示す観測値を用いて、介入モデルにより制御パラメータ値を算出する。
When the
提案部104は、算出部103により算出された制御パラメータ値をオペレータ端末30に送信し、この制御パラメータ値をオペレータに提案する。
The
再学習部105は、提案部104がオペレータに提案した制御パラメータ値が採用されたか否か(つまり、当該制御パラメータ値で介入が行われたか否か)に応じて、制御対象40の現在の状態を示す観測値と当該制御パラメータ値とを用いて介入モデルの再学習を行う。
The
記憶部106は、サーバ20で作成された介入モデルを記憶する。また、記憶部106には、オペレータが過去に介入した時の介入履歴も記憶される。なお、記憶部106には、自動制御に対する介入が行われる毎に、この介入に関する介入履歴が記憶される。
The
ここで、各介入履歴には、例えば、介入が行われた日時と、この介入時の制御対象40の状態を示す観測値と、この介入時の制御パラメータ値とが含まれる。なお、これら以外にも、各介入履歴には、例えば、当該介入を行ったオペレータのID(以下、「オペレータID」ともいう。)が含まれていてもよいし、当該介入の結果を示す情報(例えば、次の制御周期(又はそれ以降の制御周期)における観測値とその目標値との差等)が含まれていてもよい。
Here, each intervention history includes, for example, the date and time when the intervention was performed, the observed value indicating the state of the controlled
≪サーバ20≫
図3に示すように、本実施形態に係るサーバ20は、モデル作成部201を有する。モデル作成部201は、例えば、サーバ20にインストールされた1以上のプログラムがプロセッサに実行させる処理により実現される。
As shown in FIG. 3, the
また、本実施形態に係るサーバ20は、記憶部202を有する。記憶部202は、例えば、メモリ装置により実現される。なお、記憶部202は、サーバ20と通信ネットワークを介して接続される記憶装置(例えば、データベースサーバ等)により実現されていてもよい。
Further, the
モデル作成部201は、記憶部202に記憶されている複数の介入履歴を用いて模倣学習により介入モデルを作成(学習)する。すなわち、モデル作成部201は、複数の介入履歴を用いて、制御対象40の状態を示す観測値と当該状態のときに行われた介入の制御パラメータ値との関係を模倣学習によりモデル化し、観測値を入力、制御パラメータ値を出力とする介入モデルを作成する。そして、モデル作成部201は、当該介入モデルを制御装置10に送信する。なお、模倣学習とは機械学習手法の1つ(特に、強化学習に類似する枠組みの機械学習手法の1つ)であり、行動履歴(本実施形態では介入履歴)を用いて環境(本実施形態では観測値)に対する最適な行動(本実施形態では制御パラメータ値)を学習する手法のことである。
The
記憶部202は、制御装置10から送信された複数の介入履歴を記憶する。これらの介入履歴は、介入モデルが作成される際に、例えば、制御装置10から送信される。
The
なお、図3に示す制御システム1の機能構成は一例であって、他の構成であってもよい。例えば、制御装置10で介入モデルが作成される場合には、制御装置10がモデル作成部201を有していてもよい。
The functional configuration of the
<モデル作成処理>
次に、本実施形態に係るモデル作成処理の流れについて、図4を参照しながら説明する。図4は、本実施形態に係るモデル作成処理の流れの一例を示すフローチャートである。なお、図4に示すモデル作成処理は、後述する制御処理よりも前に実行される。以降では、サーバ20の記憶部202には、制御装置10から送信された複数の介入履歴が記憶されているものとする。
<Model creation process>
Next, the flow of the model creation process according to the present embodiment will be described with reference to FIG. FIG. 4 is a flowchart showing an example of the flow of the model creation process according to the present embodiment. The model creation process shown in FIG. 4 is executed before the control process described later. Hereinafter, it is assumed that the
モデル作成部201は、記憶部202に記憶されている複数の介入履歴を用いて模倣学習により介入モデルを作成する(ステップS101)。このとき、モデル作成部201は、記憶部202に記憶されている全ての介入履歴を用いて介入モデルを作成してもよいし、記憶部202に記憶されている複数の介入履歴の中から選択した一部の介入履歴を用いて介入モデルを作成してもよい。ここで、介入モデルの作成に用いられる介入履歴を選択する際には任意の方法で選択すればよいが、例えば、以下の選択方法1~選択方法3のいずれかの方法により選択することが考えられる。
The
選択方法1:記憶部202に記憶されている複数の介入履歴の中からオペレータ(又は介入モデル作成の担当者)の判断により介入モデルの作成に用いる介入履歴を選択する。これは、過去の介入履歴の中から人間が「良い介入が行われた時の介入履歴」と「悪い介入が行われた時の介入履歴」を決定及び選択することを意味する。
Selection method 1: The intervention history used for creating the intervention model is selected from the plurality of intervention histories stored in the
選択方法2:記憶部202に記憶されている複数の介入履歴を所定の期間毎に分割した上で、各期間で所定の統計値(例えば、自己相関関数値又は相互相関関数値)を算出し、これらの統計値により介入モデルの作成に用いる介入履歴を選択する。具体的には、例えば、統計値が自己相関関数値又は相互相関関数値である場合、自己相関関数値又は相互相関関数値が所定の閾値以上(又は未満)の期間に含まれる介入履歴を選択すればよい。これにより、相関(自己相関又は相互相関)がある(又はない)期間に含まれる介入履歴を選択することができる。
Selection method 2: After dividing a plurality of intervention histories stored in the
選択方法3:記憶部202に記憶されている複数の介入履歴のうち、或る特定のオペレータIDが含まれる介入履歴を選択したり、或る特定のオペレータIDが含まれる介入履歴以外の介入履歴を選択したりする。具体的には、例えば、熟練者のオペレータのオペレータIDが含まれる介入履歴を選択したり、経験の浅いオペレータのオペレータIDが含まれる介入履歴以外の介入履歴を選択したりすればよい。これにより、介入時の制御パラメータ値の決定が上手いオペレータの介入履歴を選択することができたり、逆に下手なオペレータの介入履歴を除外したりすることができる。
Selection method 3: Among a plurality of intervention histories stored in the
そして、モデル作成部201は、上記のステップS101で作成された介入モデルを制御装置10に送信する(ステップS102)。これにより、制御装置10の記憶部106に当該介入モデルが記憶される。
Then, the
以上のように、本実施形態に係る制御システム1は、オペレータが過去に行った実際の介入の履歴を用いて、当該介入時の制御対象40の状態を示す観測値と当該介入時の制御パラメータ値との関係を模倣学習によりモデル化する。これにより、介入時のオペレータと同等の制御則をモデル化することが可能となり、後述するように、介入の必要が発生した際のオペレータの負担を軽減させることができると共に、説明可能性の高い制御パラメータ値をオペレータに提案することができるようになる。
As described above, the
<制御処理>
次に、本実施形態に係る制御処理の流れについて、図5を参照しながら説明する。図5は、本実施形態に係る制御処理の流れの一例を示すフローチャートである。この図5に示す制御処理は制御周期毎に繰り返し実行される。以降では、或る1つの制御周期における制御処理について説明する。また、以降では、制御装置10の記憶部106には、サーバ20で作成された介入モデルが記憶されているものとする。
<Control processing>
Next, the flow of the control process according to the present embodiment will be described with reference to FIG. FIG. 5 is a flowchart showing an example of the flow of control processing according to the present embodiment. The control process shown in FIG. 5 is repeatedly executed every control cycle. Hereinafter, the control process in a certain control cycle will be described. Further, from now on, it is assumed that the intervention model created by the
制御部101は、制御対象40の現在の状態を示す観測値を受信する(ステップS201)。
The
介入判定部102は、上記のステップS201で受信した観測値から介入が必要か否かを判定する(ステップS202)。なお、上述したように、介入が必要な場合とは、例えば、当該観測値と目標値の差が所定の閾値を超えた場合や当該観測値が所定の閾値を超えた(又は下回った)場合等が挙げられる。
The
上記のステップS202で介入が必要ないと判定された場合、制御部101は、当該観測値と目標値を用いて自動制御手法により算出した操作量を制御対象40に送信する(ステップS203)。これにより、当該操作量に従って制御対象40が制御される。
When it is determined in step S202 that intervention is not necessary, the
一方で、上記のステップS202で介入が必要であると判定された場合、算出部103は、記憶部106に記憶されている介入モデルにより制御パラメータ値を算出する(ステップS204)。すなわち、算出部103は、上記のステップS201で受信した観測値を介入モデルに入力することで、その出力として制御パラメータ値を算出する。
On the other hand, when it is determined in step S202 that intervention is necessary, the
ここで、算出部103は、上記の制御パラメータ値に加えて、その制御パラメータ値の根拠を表す根拠情報を作成してもよい。例えば、算出部103は、以下の根拠情報1~根拠情報4のうちの1つ以上の根拠情報を作成すればよい。
Here, in addition to the above-mentioned control parameter value, the
根拠情報1:制御対象40の現在の状態を示す観測値と当該制御パラメータ値とを用いて、介入モデルの作成及び再学習に用いられた複数の介入履歴を検索し、その検索結果を根拠情報として作成する。これにより、例えば、検索結果に含まれるオペレータID(つまり、過去に制御対象40が同様の状態のときに同様の制御パラメータ値で介入を行ったオペレータIDを)等を、オペレータ端末30のオペレータに提示することが可能となる。また、このとき、例えば、介入の結果を示す情報が介入履歴に含まれる場合には、この介入の結果を示す情報も当該オペレータに提示することが可能となる。なお、介入モデルの再学習については後述する。
Evidence information 1: Using the observed values indicating the current state of the controlled
根拠情報2:上記の根拠情報1で得られたオペレータID(及び介入の結果を示す情報)を数値化した情報を根拠情報としてもよい。このとき、例えば、オペレータの熟練度や経験に応じて、熟練度が高かったり経験が豊富なほど根拠情報の値を高くし、熟練度が低かったり経験が浅いほど根拠情報の値を低くすればよい。また、介入の結果を示す情報に応じて、制御対象40の状態が目標に近づくほど根拠情報の値を高くし、そうでないほど根拠情報の値を低くすればよい。
Evidence information 2: The information obtained by quantifying the operator ID (and the information indicating the result of the intervention) obtained in the above-mentioned
根拠情報3:制御対象40の現在の状態を示す観測値及び当該制御パラメータ値と記憶部106に記憶されている複数の介入履歴のうちの直近のN-1(ただし、Nは予め決められた自然数)個の介入履歴とを用いて、介入モデルの作成及び再学習に用いられた複数の介入履歴のうちのN個の介入履歴との相互相関関数値を類似度として算出した上で、最も高い値の類似度が得られたN個の介入履歴と当該類似度とを根拠情報として作成する。これにより、制御対象40の現在の状態と類似する過去の介入履歴と、それがどの程度類似するのかとをオペレータに提示することが可能となる。なお、上記の相互相関関数の代わりに、動的時間伸縮法(DTW:Dynamic Time Warping)により類似度が算出されてもよい。
Rationale information 3: The most recent N-1 (however, N is predetermined) among the observed value indicating the current state of the controlled
根拠情報4:既知の要因可視化技術を用いて、介入モデルの作成及び再学習に用いられた複数の介入履歴のうちどの介入履歴が判断根拠となっているか示す情報を根拠情報として作成する。なお、このような要因可視化技術は機械学習モデルの推論結果に対する判断根拠(要因)を可視化する技術として一般に知られている。 Evidence information 4: Using known factor visualization technology, information indicating which intervention history is the basis for judgment among a plurality of intervention histories used for creating and relearning an intervention model is created as evidence information. It should be noted that such a factor visualization technique is generally known as a technique for visualizing the judgment basis (factor) for the inference result of the machine learning model.
ステップS204に続いて、提案部104は、上記のステップS204で算出された制御パラメータ値(及びその根拠情報)をオペレータ端末30に送信する(ステップS205)。これにより、当該オペレータ端末30のオペレータに対して当該制御パラメータ値が提案される。当該制御パラメータ値を受信したオペレータ端末30は、例えば、この制御パラメータ値を任意の形態(例えば、数値やグラフ等)で画面上に表示すると共に、アラートを発出したり、警告灯を点滅させたりしてもよい。これに対して、オペレータはオペレータ端末30を操作し、制御装置10から提案された制御パラメータ値を採用するか否かを当該制御装置10に返信する。このとき、オペレータが当該制御パラメータ値を採用しない場合は、当該制御パラメータ値とは異なる値の新たな制御パラメータ値を返信する。
Following step S204, the
なお、オペレータは介入不要と判断した場合には、オペレータ端末30を操作し、介入不要であることを示す情報を制御装置10に返信してもよい。この場合は、上記のステップS203が実行され、自動制御が行われる。
If the operator determines that intervention is unnecessary, the operator may operate the
次に、制御部101は、オペレータ端末30から採用を示す情報が返信された場合は上記のステップS204で算出された制御パラメータ値に基づく操作量を制御対象40に送信し、オペレータ端末30から不採用を示す情報と新たな制御パラメータ値が返信された場合は新たな制御パラメータ値に基づく操作量を制御対象40に送信する(ステップS206)。なお、このとき、制御部101は、上記のステップS201で受信した観測値(つまり、制御対象40の現在の状態を示す観測値)と、上記のステップS204で算出した制御パラメータ値又は新たな制御パラメータ値とを含む介入履歴を作成し、記憶部106に記憶させる。
Next, when the
続いて、再学習部105は、上記のステップS205におけるオペレータ端末30の返信結果(採用又は不採用)に応じて、記憶部106に記憶されている介入モデルを再学習する(ステップS207)。すなわち、再学習部105は、上記のステップS201で受信した観測値と上記のステップS204で算出した制御パラメータ値とを用いて模倣学習により介入モデルを再学習する。このとき、再学習部105は、上記のステップS205におけるオペレータ端末30の返信結果が不採用を示す情報である場合はペナルティが課されるように介入モデルの再学習を行う。このようなペナルティは、介入モデルの作成及び再学習に用いられる目的関数に対して、不採用を示す情報がオペレータ端末30から返信された場合には目的関数値の評価に対して罰則を課す項(これは罰則項又はペナルティ項等と呼ばれる。)を追加することで実現することができる。
Subsequently, the
以上のように、本実施形態に係る制御システム1は、オペレータが過去に行った実際の介入の履歴を模倣学習によりモデル化した介入モデルを用いて、制御対象40の自動制御に対して介入の必要が生じた場合に制御パラメータ値をオペレータに提案する。また、このとき、本実施形態に係る制御システム1は、その制御パラメータ値を介入モデルが算出したことの根拠を表す情報も当該オペレータに提示することができる。これにより、オペレータの負担を軽減させることができると共に、説明可能性の高い制御パラメータ値をオペレータに提案することができるようになる。
As described above, the
<変形例>
以下、本実施形態の変形例について説明する。
<Modification example>
Hereinafter, a modification of the present embodiment will be described.
≪変形例1≫
本実施形態では、介入モデルにより算出された制御パラメータ値をオペレータに提案したが、オペレータに提案せずに、当該制御パラメータ値に基づく操作量が制御対象40に送信されてもよい。つまり、自動制御に対して介入の必要があると判定された場合には、介入モデルにより算出された制御パラメータ値に基づく操作量により制御対象40が制御されてもよい。
<<
In the present embodiment, the control parameter value calculated by the intervention model is proposed to the operator, but the operation amount based on the control parameter value may be transmitted to the
また、このとき、上記の根拠情報2の値や上記の根拠情報3の類似度(これらの値や類似度は「確信度」等と称されてもよい。)が所定の閾値を超えている場合(つまり、確信度が高く、介入モデルにより算出された制御パラメータ値で制御対象40を適切に制御できる可能性が高い場合)にのみ制御パラメータ値に基づく操作量が制御対象40に送信されてもよい。
Further, at this time, the value of the above-mentioned evidence information 2 and the degree of similarity of the above-mentioned evidence information 3 (these values and the degree of similarity may be referred to as “confidence” or the like) exceed a predetermined threshold value. The operation amount based on the control parameter value is transmitted to the
≪変形例2≫
本実施形態では、1つの介入モデルを作成し、この介入モデルにより制御パラメータ値を算出したが、複数の介入モデルを作成し、予め決められた条件に応じて介入モデルを切り替えて使用してもよい。例えば、夜間用の介入モデルと昼間用の介入モデルを作成し、制御対象40の運用時間帯に応じて介入モデルを切り替えてもよい。同様に、例えば、製品の種類毎に介入モデルを作成し、制御対象40が製造する製品に応じて介入モデルを切り替えてもよい。また、例えば、制御対象40の状態が取り得る範囲(例えば、温度の範囲等)毎に複数の介入モデルを作成し、制御対象40の状態に応じて介入モデルを切り替えてもよい。
<< Modification 2 >>
In the present embodiment, one intervention model is created and control parameter values are calculated by this intervention model. However, even if a plurality of intervention models are created and the intervention models are switched and used according to predetermined conditions. good. For example, an intervention model for nighttime and an intervention model for daytime may be created, and the intervention model may be switched according to the operating time zone of the controlled
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。 The present invention is not limited to the above-described embodiment disclosed specifically, and various modifications and modifications, combinations with known techniques, and the like are possible without departing from the description of the scope of claims. be.
1 制御システム
10 制御装置
11 入力装置
12 表示装置
13 外部I/F
13a 記録媒体
14 通信I/F
15 プロセッサ
16 メモリ装置
17 バス
20 サーバ
30 オペレータ端末
40 制御対象
101 制御部
102 介入判定部
103 算出部
104 提案部
105 再学習部
106 記憶部
201 モデル作成部
202 記憶部
1
13a Recording medium 14 Communication I / F
15
Claims (11)
前記制御対象の状態に応じて、前記モデルにより制御パラメータ値を算出する算出部と、
を有する制御システム。 A creation unit that creates a model representing the relationship between the state of the controlled object and the control parameter value by imitation learning based on the history of the control parameter value when the operator intervenes in the controlled object.
A calculation unit that calculates control parameter values using the model according to the state of the control target,
Control system with.
前記提案部は、前記制御パラメータ値に加えて、前記根拠情報も前記オペレータに提案する、請求項2に記載の制御システム。 The calculation unit creates evidence information representing the basis of the control parameter value calculated by the model.
The control system according to claim 2, wherein the proposal unit proposes the basis information to the operator in addition to the control parameter value.
前記制御部は、前記指標値が所定の閾値を超えている場合、前記算出部で算出された制御パラメータ値によって前記制御対象を制御する、請求項5に記載の制御システム。 The calculation unit further calculates a predetermined index value related to the control parameter value calculated by the model.
The control system according to claim 5, wherein the control unit controls the control target by the control parameter value calculated by the calculation unit when the index value exceeds a predetermined threshold value.
前記算出部は、前記制御対象の状態と、前記時間帯又は前記制御対象が製造する製品の種類とに応じて、複数の前記モデルのうちの一のモデルにより制御パラメータ値を算出する、請求項1乃至6の何れか一項に記載の制御システム。 The creating unit creates a plurality of the models according to the time zone, the type of the product manufactured by the controlled object, or the range of values that the state of the controlled object can take.
The calculation unit calculates a control parameter value by one of a plurality of the models according to the state of the control target and the time zone or the type of the product manufactured by the control target. The control system according to any one of 1 to 6.
前記制御対象の状態に応じて、前記モデルにより制御パラメータ値を算出する算出手順と、
をコンピュータが実行する制御方法。 A creation procedure for creating a model representing the relationship between the state of the controlled object and the control parameter value by imitation learning based on the history of the control parameter value when the operator intervenes in the controlled object.
A calculation procedure for calculating a control parameter value by the model according to the state of the controlled object, and
The control method that the computer performs.
前記制御対象の状態に応じて、前記モデルにより制御パラメータ値を算出する算出部と、
を有する制御装置。 A creation unit that creates a model representing the relationship between the state of the controlled object and the control parameter value by imitation learning based on the history of the control parameter value when the operator intervenes in the controlled object.
A calculation unit that calculates control parameter values using the model according to the state of the control target,
Control device with.
前記制御対象の状態に応じて、前記モデルにより制御パラメータ値を算出する算出手順と、
をコンピュータに実行させるプログラム。 A creation procedure for creating a model representing the relationship between the state of the controlled object and the control parameter value by imitation learning based on the history of the control parameter value when the operator intervenes in the controlled object.
A calculation procedure for calculating a control parameter value by the model according to the state of the controlled object, and
A program that causes a computer to run.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020140257A JP2022035737A (en) | 2020-08-21 | 2020-08-21 | Control system, control method, control device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020140257A JP2022035737A (en) | 2020-08-21 | 2020-08-21 | Control system, control method, control device and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022035737A true JP2022035737A (en) | 2022-03-04 |
Family
ID=80443674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020140257A Pending JP2022035737A (en) | 2020-08-21 | 2020-08-21 | Control system, control method, control device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022035737A (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011159103A (en) * | 2010-02-01 | 2011-08-18 | Mitsubishi Electric Corp | Plant operation support apparatus |
JP2017049801A (en) * | 2015-09-02 | 2017-03-09 | 三菱重工業株式会社 | Operation support system, operation support method and program |
WO2020065808A1 (en) * | 2018-09-27 | 2020-04-02 | 日本電気株式会社 | Information processing device and system, and non-temporary computer-readable medium for storing model adaptation method and program |
-
2020
- 2020-08-21 JP JP2020140257A patent/JP2022035737A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011159103A (en) * | 2010-02-01 | 2011-08-18 | Mitsubishi Electric Corp | Plant operation support apparatus |
JP2017049801A (en) * | 2015-09-02 | 2017-03-09 | 三菱重工業株式会社 | Operation support system, operation support method and program |
WO2020065808A1 (en) * | 2018-09-27 | 2020-04-02 | 日本電気株式会社 | Information processing device and system, and non-temporary computer-readable medium for storing model adaptation method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7011239B2 (en) | Equipment, methods, programs, and recording media | |
JP7069269B2 (en) | Semi-supervised methods and systems for deep anomaly detection for large industrial surveillance systems based on time series data using digital twin simulation data | |
US10394229B2 (en) | Orchestration of learning and execution of model predictive control tool for manufacturing processes | |
EP3904987B1 (en) | Control support apparatus, control support method, control support program, computer readable medium with control support program recorded thereon and control system | |
EP3985460B1 (en) | Controller, control system and method to control a facility and to generate a control model by learning | |
JP2021121888A (en) | Learning device, learning method, learning program, determination device, determination method, and determination program | |
JP2023183577A (en) | Driving support device, driving support method and program | |
JP2022035737A (en) | Control system, control method, control device and program | |
US20220351101A1 (en) | Evaluation apparatus, evaluation method, recording medium having recorded thereon evaluation program, control apparatus and recording medium having recorded thereon control program | |
JP7359178B2 (en) | Control device, control method, and control program | |
JP7444186B2 (en) | Model verification device, model verification method, and model verification program | |
US20230384744A1 (en) | Remote-control apparatus, local-control apparatus, learning processing apparatus, method, and recording medium | |
US20230384742A1 (en) | Model selection apparatus, model selection method, and non-transitory computer readable medium | |
Sonthited et al. | Prediction of Production Performance for Tapioca Industry using LSTM neural network | |
JP7416015B2 (en) | Information processing device, alarm prediction method, and alarm prediction program | |
US20230409928A1 (en) | Estimation apparatus, estimation method, and non-transitory computer-readable medium | |
JP7359176B2 (en) | Judgment device, judgment method, and judgment program | |
EP4109187A1 (en) | Predicting process variables by simulation based on an only partially measurable initial state | |
JP7452509B2 (en) | Monitoring devices, monitoring methods, and monitoring programs | |
JP7362937B2 (en) | Production condition generation system using a generative adversarial network, its production condition generation method, and production condition generation program | |
EP3739525A1 (en) | Informed imperceptible exploration based on control-policies | |
JP2023161707A (en) | Control device, control method and control program | |
JP2022148258A (en) | Simulation device, simulation system, simulation method, and simulation program | |
JP2023084566A (en) | Estimation device, estimation method and estimation program | |
JP2022055715A (en) | Abnormality prediction device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240415 |