JP2020194453A - Model prediction control system, information processing device, program, and model prediction control method - Google Patents

Model prediction control system, information processing device, program, and model prediction control method Download PDF

Info

Publication number
JP2020194453A
JP2020194453A JP2019100719A JP2019100719A JP2020194453A JP 2020194453 A JP2020194453 A JP 2020194453A JP 2019100719 A JP2019100719 A JP 2019100719A JP 2019100719 A JP2019100719 A JP 2019100719A JP 2020194453 A JP2020194453 A JP 2020194453A
Authority
JP
Japan
Prior art keywords
model
control
time
storage means
series data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019100719A
Other languages
Japanese (ja)
Other versions
JP7287835B2 (en
Inventor
大輔 中
Daisuke Naka
大輔 中
考寛 唐鎌
Takahiro Karakama
考寛 唐鎌
大樹 若松
Hiroki Wakamatsu
大樹 若松
高橋 宏幸
Hiroyuki Takahashi
宏幸 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Metawater Co Ltd
Original Assignee
Metawater Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Metawater Co Ltd filed Critical Metawater Co Ltd
Priority to JP2019100719A priority Critical patent/JP7287835B2/en
Publication of JP2020194453A publication Critical patent/JP2020194453A/en
Application granted granted Critical
Publication of JP7287835B2 publication Critical patent/JP7287835B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Feedback Control In General (AREA)

Abstract

To improve a technique relating to process model prediction control.SOLUTION: A model prediction control system 1 comprises: storage means 131 for storing a process model; process control means 132 for performing model prediction control of a process using the process model; storage means 133 for storing a control output and a control input of the process as time series data; and setting means 134 for setting a target value of a model parameter of the process model by machine learning using the accumulated time series data as training data. The process control means 132 performs model prediction control while asymptotically bringing the model parameters closer to the target value over time.SELECTED DRAWING: Figure 2

Description

本発明は、モデル予測制御システム、情報処理装置、プログラム、及びモデル予測制御方法に関する。 The present invention relates to a model predictive control system, an information processing device, a program, and a model predictive control method.

従来、プロセス制御の手法として、制御対象とするプロセスの数学モデル(以下、「プロセスモデル」ともいう。)を用いるモデル予測制御(MPC;Model Predictive Control)が知られている。また、例えば機器の経年劣化等の要因によってプロセスの特性が変化するとモデル予測制御の精度が低下し得るという課題に対して、プロセスモデルを定期的に更新する手法が知られている。例えば、特許文献1には、オンラインモデル同定を用いたモデル予測制御方法であって、モデル予測制御演算実施にあたっては、用いるプロセス動的モデルを実操業データに基づいて毎回導出するモデル再同定を行う技術が開示されている。 Conventionally, as a process control method, a model predictive control (MPC; Model Predictive Control) using a mathematical model of a process to be controlled (hereinafter, also referred to as a “process model”) is known. Further, there is known a method of periodically updating a process model to solve the problem that the accuracy of model prediction control may decrease when the process characteristics change due to factors such as aged deterioration of equipment. For example, Patent Document 1 describes a model prediction control method using online model identification, and in executing a model prediction control calculation, model reidentification is performed to derive a process dynamic model to be used each time based on actual operation data. The technology is disclosed.

特開2011−198327号公報Japanese Unexamined Patent Publication No. 2011-198327

従来技術では、モデル再同定が実施される度にプロセスモデルのモデルパラメータが変化し得るので、モデルパラメータはモデル再同定の各実施タイミングで不連続な階段関数となる。しかしながら、モデルパラメータの変化に不連続点が発生すると、例えば制御安定性の低下等の不都合が発生する場合がある。したがって、プロセスのモデル予測制御に関する技術には改善の余地があった。 In the prior art, the model parameters of the process model can change each time the model re-identification is performed, so that the model parameters become a discontinuous step function at each execution timing of the model re-identification. However, if a discontinuity occurs in the change of model parameters, inconveniences such as a decrease in control stability may occur. Therefore, there was room for improvement in the technology related to process model predictive control.

かかる事情に鑑みてなされた本発明の目的は、プロセスのモデル予測制御に関する技術を改善することにある。 An object of the present invention made in view of such circumstances is to improve a technique relating to model predictive control of a process.

本発明の一実施形態に係るモデル予測制御システムは、
プロセスモデルを記憶する記憶手段と、
前記プロセスモデルを用いてプロセスのモデル予測制御を実施するプロセス制御手段と、
前記プロセスの制御出力及び制御入力を時系列データとして蓄積する蓄積手段と、
蓄積された前記時系列データを学習データとして用いる機械学習により前記プロセスモデルのモデルパラメータの目標値を設定する設定手段と、
を備えるモデル予測制御システムであって、
前記プロセス制御手段は、時間経過に従って前記モデルパラメータを前記目標値に漸近させながら前記モデル予測制御を実施する。
The model prediction control system according to the embodiment of the present invention is
A storage means for storing the process model and
A process control means for performing model predictive control of a process using the process model, and
A storage means for accumulating the control output and control input of the process as time series data,
A setting means for setting target values of model parameters of the process model by machine learning using the accumulated time-series data as learning data, and
It is a model prediction control system equipped with
The process control means carries out the model prediction control while asymptotically bringing the model parameter closer to the target value over time.

本発明の一実施形態に係る情報処理装置は、
プロセスモデルを記憶する記憶手段と、
前記プロセスモデルを用いてプロセスのモデル予測制御を実施するプロセス制御手段と、
前記プロセスの制御出力及び制御入力を時系列データとして蓄積する蓄積手段と、
蓄積された前記時系列データを学習データとして用いる機械学習により前記プロセスモデルのモデルパラメータの目標値を設定する設定手段と、
を備える情報処理装置であって、
前記プロセス制御手段は、時間経過に従って前記モデルパラメータを前記目標値に漸近させながら前記モデル予測制御を実施する。
The information processing device according to the embodiment of the present invention is
A storage means for storing the process model and
A process control means for performing model predictive control of a process using the process model, and
A storage means for accumulating the control output and control input of the process as time series data,
A setting means for setting target values of model parameters of the process model by machine learning using the accumulated time-series data as learning data, and
It is an information processing device equipped with
The process control means carries out the model prediction control while asymptotically bringing the model parameter closer to the target value over time.

本発明の一実施形態に係る情報処理装置は、
プロセスモデルを記憶する記憶手段と、前記プロセスモデルを用いてプロセスのモデル予測制御を実施するプロセス制御手段と、前記プロセスの制御出力及び制御入力を時系列データとして蓄積する蓄積手段と、蓄積された前記時系列データを学習データとして用いる機械学習により前記プロセスモデルのモデルパラメータの目標値を設定する設定手段と、を備え、前記プロセス制御手段が時間経過に従って前記モデルパラメータを前記目標値に漸近させながら前記モデル予測制御を実施するモデル予測制御システムを構成するために、
前記記憶手段、前記プロセス制御手段、前記蓄積手段、及び前記設定手段のうち少なくとも1つを備える。
The information processing device according to the embodiment of the present invention is
A storage means for storing a process model, a process control means for performing model prediction control of a process using the process model, a storage means for storing control outputs and control inputs of the process as time-series data, and storage means. A setting means for setting a target value of a model parameter of the process model by machine learning using the time-series data as training data is provided, and the process control means gradually brings the model parameter closer to the target value over time. To configure a model predictive control system that implements the model predictive control
It includes at least one of the storage means, the process control means, the storage means, and the setting means.

本発明の一実施形態に係るプログラムは、
情報処理装置を、
プロセスモデルを記憶する記憶手段と、
前記プロセスモデルを用いてプロセスのモデル予測制御を実施するプロセス制御手段と、
前記プロセスの制御出力及び制御入力を時系列データとして蓄積する蓄積手段と、
蓄積された前記時系列データを学習データとして用いる機械学習により前記プロセスモデルのモデルパラメータの目標値を設定する設定手段と、
として機能させるプログラムであって、
前記プロセス制御手段は、時間経過に従って前記モデルパラメータを前記目標値に漸近させながら前記モデル予測制御を実施する。
The program according to the embodiment of the present invention
Information processing device,
A storage means for storing the process model and
A process control means for performing model predictive control of a process using the process model, and
A storage means for accumulating the control output and control input of the process as time series data,
A setting means for setting target values of model parameters of the process model by machine learning using the accumulated time-series data as learning data, and
It is a program that functions as
The process control means carries out the model prediction control while asymptotically bringing the model parameter closer to the target value over time.

本発明の一実施形態に係るプログラムは、
通信可能に接続された複数の情報処理装置を含んで構成され、プロセスモデルを記憶する記憶手段と、前記プロセスモデルを用いてプロセスのモデル予測制御を実施するプロセス制御手段と、前記プロセスの制御出力及び制御入力を時系列データとして蓄積する蓄積手段と、蓄積された前記時系列データを学習データとして用いる機械学習により前記プロセスモデルのモデルパラメータの目標値を設定する設定手段と、を備え、前記プロセス制御手段が時間経過に従って前記モデルパラメータを前記目標値に漸近させながら前記モデル予測制御を実施するモデル予測制御システムにおける、前記複数の情報処理装置のうち1つの情報処理装置を、
前記記憶手段、前記プロセス制御手段、前記蓄積手段、及び前記設定手段のうち少なくとも1つとして機能させる。
The program according to the embodiment of the present invention
A storage means that includes a plurality of information processing devices that are communicably connected and stores a process model, a process control means that performs model prediction control of a process using the process model, and a control output of the process. The process is provided with a storage means for accumulating control inputs as time-series data and a setting means for setting target values of model parameters of the process model by machine learning using the accumulated time-series data as training data. One of the plurality of information processing devices in a model prediction control system in which the control means performs the model prediction control while gradually bringing the model parameters closer to the target value with the passage of time.
It functions as at least one of the storage means, the process control means, the storage means, and the setting means.

本発明の一実施形態に係るモデル予測制御方法は、
情報処理装置が実行するプロセスのモデル予測制御方法であって、
プロセスモデルを記憶するステップと、
前記プロセスモデルを用いてプロセスのモデル予測制御を実施する制御ステップと、
前記プロセスの制御出力及び制御入力を時系列データとして蓄積するステップと、
蓄積された前記時系列データを学習データとして用いる機械学習により前記プロセスモデルのモデルパラメータの目標値を設定するステップと、
を含み、
前記制御ステップにおいて、時間経過に従って前記モデルパラメータを前記目標値に漸近させながら前記モデル予測制御を実施する。
The model prediction control method according to the embodiment of the present invention is
It is a model prediction control method of the process executed by the information processing device.
Steps to memorize the process model and
A control step for performing model prediction control of a process using the process model, and
A step of accumulating the control output and control input of the process as time series data,
A step of setting target values of model parameters of the process model by machine learning using the accumulated time series data as learning data, and
Including
In the control step, the model prediction control is performed while asymptotically approaching the model parameter to the target value with the passage of time.

本発明の一実施形態によれば、プロセスのモデル予測制御に関する技術が改善する。 According to one embodiment of the present invention, techniques relating to process model predictive control are improved.

本発明の一実施形態に係るモデル予測制御システムの概略構成を示す図である。It is a figure which shows the schematic structure of the model prediction control system which concerns on one Embodiment of this invention. 情報処理装置の概略構成を示すブロック図である。It is a block diagram which shows the schematic structure of an information processing apparatus. 情報処理装置に蓄積される第1時系列データを示す図である。It is a figure which shows the 1st time series data which is stored in an information processing apparatus. 情報処理装置に蓄積される第2時系列データを示す図である。It is a figure which shows the 2nd time series data which is stored in the information processing apparatus. 情報処理装置の動作を示すフローチャートである。It is a flowchart which shows the operation of an information processing apparatus. モデルパラメータの時間変化の第1例を示す図である。It is a figure which shows the 1st example of the time change of a model parameter. モデルパラメータの時間変化の第2例を示す図である。It is a figure which shows the 2nd example of the time change of a model parameter.

以下、本発明の実施形態について説明する。 Hereinafter, embodiments of the present invention will be described.

(モデル予測制御システムの構成)
図1を参照して、本発明の一実施形態に係るモデル予測制御システム1について説明する。モデル予測制御システム1は、例えば水処理プラント等、任意のプラントにおけるプロセスを制御するために用いられるシステムである。モデル予測制御システム1は、情報処理装置10と、1つ以上のプラント設備20と、を備える。図1において、情報処理装置10については1つのみを、プラント設備20については3つをそれぞれ図示しているが、モデル予測制御システム1は任意の数の情報処理装置10及びプラント設備20を備えてもよい。
(Configuration of model prediction control system)
The model prediction control system 1 according to the embodiment of the present invention will be described with reference to FIG. The model predictive control system 1 is a system used to control a process in an arbitrary plant such as a water treatment plant. The model prediction control system 1 includes an information processing device 10 and one or more plant facilities 20. In FIG. 1, only one information processing device 10 and three plant facilities 20 are shown, but the model prediction control system 1 includes an arbitrary number of information processing devices 10 and plant equipment 20. You may.

情報処理装置10は、制御対象とする任意のプロセスのモデル予測制御を実施する装置である。具体的には、情報処理装置10は、制御周期毎に、制御対象とするプロセスのプロセスモデルを用いて将来の制御出力を予測するとともに、実際の制御出力を所望の値に近付けるように制御入力を決定する。例えば、水処理プラントにおける浄水プロセスを制御対象とする場合、処理水中の硝酸濃度及び/又はアンモニア濃度等のプロセスデータを制御出力とし、処理水に対して送風する空気の送風量又は送風機の駆動電力等の操作量を制御入力とすることができる。しかしながら、制御対象とするプロセス、並びに当該プロセスの制御出力及び制御入力は、当該例に限られず、任意に決定可能である。 The information processing device 10 is a device that performs model prediction control of an arbitrary process to be controlled. Specifically, the information processing apparatus 10 predicts the future control output by using the process model of the process to be controlled for each control cycle, and controls the input so that the actual control output approaches a desired value. To determine. For example, when the water purification process in a water treatment plant is to be controlled, the control output is process data such as nitric acid concentration and / or ammonia concentration in the treated water, and the amount of air blown to the treated water or the driving power of the blower. The amount of operation such as, etc. can be used as the control input. However, the process to be controlled and the control output and control input of the process are not limited to the above example and can be arbitrarily determined.

また情報処理装置10は、例えばインターネット又はLAN(Local Area Network)等のネットワークNを介して、プラント内に設置されたプラント設備20と通信可能である。ここでプラント設備20は、プラントにおけるプロセスの実施に用いられる任意の設備である。例えば水処理プラントにおける浄水プロセスの実施に用いられるプラント設備20は、処理水中の硝酸濃度及び/又はアンモニア濃度等のプロセスデータを検出するセンサ、処理水に対して空気を送風する送風機等の現場機器、及び当該現場機器を制御するPLC(Programmable Logic Controller)等を含む設備であるが、これらに限られない。情報処理装置10は、例えばプラントの中央管理室に設置されるが、これに限られず任意の場所に設置可能である。 Further, the information processing device 10 can communicate with the plant equipment 20 installed in the plant via, for example, the Internet or a network N such as a LAN (Local Area Network). Here, the plant equipment 20 is any equipment used to carry out a process in the plant. For example, the plant equipment 20 used to carry out a water purification process in a water treatment plant includes on-site equipment such as a sensor that detects process data such as nitrate concentration and / or ammonia concentration in the treated water, and a blower that blows air to the treated water. , And equipment including PLC (Programmable Logic Controller) that controls the field equipment, but is not limited to these. The information processing device 10 is installed in, for example, the central control room of the plant, but the information processing device 10 is not limited to this and can be installed in any place.

ここで、本実施形態の概要について説明し、詳細については後述する。情報処理装置10は、プロセスモデルを用いてプロセスのモデル予測制御を実施し、当該プロセスの制御出力及び制御入力を時系列データ(以下、「第1時系列データ」ともいう。)として蓄積する。情報処理装置10は、蓄積された第1時系列データに基づいてプロセスモデルのモデルパラメータの目標値を設定する。そして、情報処理装置10は、時間経過に従ってモデルパラメータを当該目標値に漸近させながらモデル予測制御を実施する。 Here, the outline of the present embodiment will be described, and the details will be described later. The information processing device 10 executes model prediction control of a process using a process model, and stores the control output and control input of the process as time series data (hereinafter, also referred to as “first time series data”). The information processing device 10 sets the target value of the model parameter of the process model based on the accumulated first time series data. Then, the information processing apparatus 10 carries out model prediction control while asymptotically bringing the model parameters closer to the target value over time.

かかる構成によれば、モデルパラメータが時間経過に従って徐々に変化するので、モデルパラメータの変化に実質的な不連続点が発生する機会が低減する。したがって、例えば制御安定性の低下等の不都合が発生する蓋然性が低減するので、プロセスのモデル予測制御に関する技術が改善する。なお、モデルパラメータは制御周期毎に離散的に変化するため、モデルパラメータの変化が実質的には連続している場合であっても厳密には制御周期毎に不連続点が発生するところ、上記の「実質的な不連続点」とは、このような厳密な意味での不連続点以外の不連続点を指す。 According to such a configuration, since the model parameters gradually change with the passage of time, the chance of a substantial discontinuity occurring in the changes of the model parameters is reduced. Therefore, the probability that inconveniences such as a decrease in control stability will occur is reduced, and the technique for process model prediction control is improved. Since the model parameters change discretely in each control cycle, strictly speaking, discontinuities occur in each control cycle even when the changes in the model parameters are substantially continuous. "Substantial discontinuity" refers to a discontinuity other than such a discontinuity in the strict sense.

(情報処理装置のハードウェア構成)
図2を参照して、情報処理装置10のハードウェア構成について説明する。情報処理装置10は、通信部11と、記憶部12と、制御部13と、を備える。
(Hardware configuration of information processing device)
The hardware configuration of the information processing apparatus 10 will be described with reference to FIG. The information processing device 10 includes a communication unit 11, a storage unit 12, and a control unit 13.

通信部11は、無線又は有線を介して外部装置と通信する1つ以上の通信インタフェースである。本実施形態において、通信部11は、ネットワークNを介してプラント設備20と通信する通信インタフェースを含む。また、通信部11は、表示装置30及び入力装置40のそれぞれと通信する通信インタフェースを含む。ここで表示装置30は、例えば液晶ディスプレイ又はOEL(Organic Electro-luminescence)ディスプレイ等の任意のディスプレイである。入力装置40は、例えばキーボード又はマウス等の、ユーザによる操作を受け付ける任意の入力インタフェースである。 The communication unit 11 is one or more communication interfaces that communicate with an external device via wireless or wired. In the present embodiment, the communication unit 11 includes a communication interface that communicates with the plant equipment 20 via the network N. Further, the communication unit 11 includes a communication interface for communicating with each of the display device 30 and the input device 40. Here, the display device 30 is an arbitrary display such as a liquid crystal display or an OEL (Organic Electro-luminescence) display. The input device 40 is an arbitrary input interface that accepts operations by the user, such as a keyboard or a mouse.

記憶部12は、1つ以上のメモリである。本実施形態において「メモリ」は、例えば半導体メモリ、磁気メモリ、又は光メモリ等であるが、これらに限られず任意のメモリとすることができる。記憶部12に含まれる各メモリは、例えば主記憶装置、補助記憶装置、又はキャッシュメモリとして機能する。記憶部12は、例えば情報処理装置10に内蔵されるが、任意のインタフェースを介して情報処理装置10に外部から接続される構成も可能である。 The storage unit 12 is one or more memories. In the present embodiment, the "memory" is, for example, a semiconductor memory, a magnetic memory, an optical memory, or the like, but the memory is not limited to these and may be any memory. Each memory included in the storage unit 12 functions as, for example, a main storage device, an auxiliary storage device, or a cache memory. The storage unit 12 is built in the information processing device 10, for example, but can be connected to the information processing device 10 from the outside via an arbitrary interface.

制御部13は、1つ以上のプロセッサを含む。本実施形態において「プロセッサ」は、汎用のプロセッサ、特定の処理に特化した専用のプロセッサ等であるが、これらに限られず任意のプロセッサとすることができる。制御部13は、情報処理装置10全体の動作を制御する。情報処理装置10の動作の詳細については後述する。 The control unit 13 includes one or more processors. In the present embodiment, the "processor" is a general-purpose processor, a dedicated processor specialized for a specific process, or the like, but is not limited to these, and may be any processor. The control unit 13 controls the operation of the entire information processing device 10. The details of the operation of the information processing device 10 will be described later.

(情報処理装置のソフトウェア構成)
図2を参照して、情報処理装置10のソフトウェア構成について説明する。情報処理装置10の動作の制御に用いられる1つ以上のプログラムが記憶部12に記憶される。当該1つ以上のプログラムは、制御部13によって読み込まれると、制御部13を記憶手段131、プロセス制御手段132、蓄積手段133、設定手段134、判定手段135、及び決定手段136として機能させる。
(Software configuration of information processing device)
The software configuration of the information processing apparatus 10 will be described with reference to FIG. One or more programs used for controlling the operation of the information processing device 10 are stored in the storage unit 12. When the one or more programs are read by the control unit 13, the control unit 13 functions as a storage means 131, a process control means 132, a storage means 133, a setting means 134, a determination means 135, and a determination means 136.

記憶手段131は、制御対象とするプロセスのプロセスモデルを記憶部12に記憶する手段である。プロセスモデルは、1つ以上のモデルパラメータを有する数学モデルである。プロセスモデルは、各モデルパラメータの初期値の情報を更に含む。プロセスモデルは、例えば実験又はシミュレーションにより事前に決定可能である。 The storage means 131 is a means for storing the process model of the process to be controlled in the storage unit 12. A process model is a mathematical model with one or more model parameters. The process model further contains information on the initial values of each model parameter. The process model can be determined in advance, for example by experiment or simulation.

プロセス制御手段132は、記憶部12に記憶されたプロセスモデルを用いてプロセスのモデル予測制御を実施する手段である。具体的には、プロセス制御手段132は、制御周期毎に、記憶部12に記憶されたプロセスモデルに基づいて将来の制御出力(例えば、硝酸濃度及び/又はアンモニア濃度等のプロセスデータ)を予測し、実際の制御出力を所望の値に近付けるように制御入力(例えば、送風量又は送風機の駆動電力等の操作量)を決定し、決定した制御入力をプラント設備20に入力する。なお制御周期は、後述する更新周期と比較して十分短い。 The process control means 132 is a means for performing model prediction control of a process using the process model stored in the storage unit 12. Specifically, the process control means 132 predicts a future control output (for example, process data such as nitric acid concentration and / or ammonia concentration) based on the process model stored in the storage unit 12 for each control cycle. The control input (for example, the amount of air blown or the amount of operation such as the drive power of the blower) is determined so that the actual control output approaches a desired value, and the determined control input is input to the plant equipment 20. The control cycle is sufficiently shorter than the update cycle described later.

詳細には、プロセス制御手段132は、後述するように時間経過に従ってモデルパラメータを目標値に漸近させながらモデル予測制御を実施する。かかる構成によれば、例えばモデルパラメータが現在値から目標値に瞬間的に変化するのではなく、時間経過に従って徐々に変化するので、モデルパラメータの変化に実質的な不連続点が発生する機会が低減する。 Specifically, the process control means 132 performs model prediction control while asymptotically bringing the model parameters closer to the target value over time as described later. According to such a configuration, for example, the model parameter does not change instantaneously from the current value to the target value, but gradually changes with the passage of time, so that there is an opportunity for a substantial discontinuity to occur in the change of the model parameter. Reduce.

ここで、プロセス制御手段132は、後述するように決定手段136によってスタート値が決定されると、モデルパラメータの現在値を当該スタート値で上書きしてから、時間経過に従ってモデルパラメータを目標値に漸近させる。かかる構成によれば、後述するように、モデルパラメータの目標値を決定するための機械学習における過剰適合を緩和又は防止することができる。 Here, when the start value is determined by the determination means 136, the process control means 132 overwrites the current value of the model parameter with the start value, and then asymptoticizes the model parameter to the target value with the passage of time. Let me. According to such a configuration, as will be described later, overfitting in machine learning for determining the target value of the model parameter can be alleviated or prevented.

蓄積手段133は、プロセスの制御出力及び制御入力を第1時系列データとして記憶部12に蓄積する手段である。具体的には、蓄積手段133は、通信部11を介してプラント設備20から制御出力(例えば、プロセスデータ)を制御周期毎に取得する。また蓄積手段133は、プロセス制御手段132から、プラント設備20に入力する制御入力(例えば、操作量)を制御周期毎に取得する。そして蓄積手段133は、制御出力及び制御入力を第1時系列データとして記憶部12に蓄積する。したがって、第1時系列データは、現在及び過去の制御出力及び制御入力を示すデータである。例えば図3に示すように、時刻データ、制御出力であるプロセスデータ、及び制御入力である操作量の組み合わせが、第1時系列データとして記憶部12に蓄積される。 The storage means 133 is a means for storing the control output and the control input of the process in the storage unit 12 as the first time series data. Specifically, the storage means 133 acquires a control output (for example, process data) from the plant equipment 20 via the communication unit 11 for each control cycle. Further, the storage means 133 acquires a control input (for example, an operation amount) to be input to the plant equipment 20 from the process control means 132 for each control cycle. Then, the storage means 133 stores the control output and the control input in the storage unit 12 as the first time series data. Therefore, the first time series data is data indicating current and past control outputs and control inputs. For example, as shown in FIG. 3, a combination of time data, process data as control output, and operation amount as control input is stored in the storage unit 12 as first time series data.

また、蓄積手段133は、後述するように設定手段134によって更新周期毎に設定されるモデルパラメータの目標値を時系列データ(以下、「第2時系列データ」ともいう。)として記憶部12に蓄積する手段としても機能する。したがって、第2時系列データは、現在及び過去の目標値を示すデータである。例えば図4に示すように、時刻データ及び目標値の組み合わせが、第2時系列データとして記憶部12に蓄積される。 Further, the storage means 133 stores the target value of the model parameter set for each update cycle by the setting means 134 as time series data (hereinafter, also referred to as “second time series data”) in the storage unit 12. It also functions as a means of accumulating. Therefore, the second time series data is data showing current and past target values. For example, as shown in FIG. 4, a combination of time data and a target value is stored in the storage unit 12 as second time series data.

設定手段134は、記憶部12に蓄積された第1時系列データを学習データとして用いる機械学習によりプロセスモデルのモデルパラメータの目標値を設定する手段である。具体的には、設定手段134は、更新周期毎に、記憶部12に蓄積された第1時系列データの少なくとも一部を学習データとして用いる機械学習によりモデルパラメータの推定値を探索し、探索した当該推定値をモデルパラメータの目標値として設定する。したがって、モデルパラメータの目標値は更新周期毎に更新される。 The setting means 134 is a means for setting the target value of the model parameter of the process model by machine learning using the first time series data accumulated in the storage unit 12 as learning data. Specifically, the setting means 134 searches for the estimated value of the model parameter by machine learning using at least a part of the first time series data stored in the storage unit 12 as learning data for each update cycle. The estimated value is set as the target value of the model parameter. Therefore, the target value of the model parameter is updated every update cycle.

判定手段135は、設定手段134により更新周期毎に設定されたモデルパラメータの目標値の変化に基づいて、上述の機械学習において過剰適合が発生している可能性の有無を判定する手段である。ここで、過剰適合が発生している可能性の有無の判定には、任意の手法が採用可能である。例えば、判定手段135は、モデルパラメータの現在及び過去の目標値の分散が所定閾値未満である場合、過剰適合が発生している可能性があると判定する。 The determination means 135 is a means for determining whether or not there is a possibility that overfitting has occurred in the above-mentioned machine learning based on the change in the target value of the model parameter set by the setting means 134 for each update cycle. Here, any method can be adopted for determining the presence or absence of the possibility of overfitting. For example, the determination means 135 determines that overfitting may have occurred if the variance of the current and past target values of the model parameters is less than a predetermined threshold.

決定手段136は、判定手段135により過剰適合が発生している可能性が有ると判定された場合、モデルパラメータの現在値から現在の目標値までの数値範囲に含まれない値をスタート値として決定する決定手段である。ここで、スタート値の決定には、任意の手法が採用可能である。例えば、決定手段136は、モデルパラメータの現在値から現在の目標値までの数値範囲に含まれない任意の値をスタート値として決定してもよい。或いは、決定手段136は、モデルパラメータの現在及び過去の目標値に基づいてスタート値を決定してもよい。具体的には、決定手段136は、過去の一定期間内における、現在及び過去の目標値の平均値、加重平均値、又は最頻値を決定する。そして決定手段136は、モデルパラメータの現在値から現在の目標値までの数値範囲に、当該平均値、加重平均値、又は最頻値が含まれない場合、当該平均値、加重平均値、又は最頻値をスタート値として決定する。なお、加重平均値が採用される場合、各目標値に乗じる重み係数は、例えば目標値が新しいほど大きくなるように定められるが、当該例に限られず、任意のアルゴリズムで決定可能である。 When the determination means 135 determines that overfitting may have occurred, the determination means 136 determines a value not included in the numerical range from the current value of the model parameter to the current target value as a start value. It is a deciding means to do. Here, any method can be adopted for determining the start value. For example, the determination means 136 may determine an arbitrary value not included in the numerical range from the current value of the model parameter to the current target value as the start value. Alternatively, the determination means 136 may determine the start value based on the current and past target values of the model parameters. Specifically, the determination means 136 determines the average value, the weighted average value, or the mode value of the current and past target values within a certain period in the past. Then, when the numerical range from the current value of the model parameter to the current target value does not include the average value, the weighted average value, or the mode value, the determination means 136 determines the average value, the weighted average value, or the mode. Determine the mode as the start value. When the weighted average value is adopted, the weighting coefficient to be multiplied by each target value is determined so as to be larger as the target value is newer, but the present invention is not limited to this example and can be determined by an arbitrary algorithm.

なお、制御部13は、上述した各手段131〜136に加えて、一般的にプロセッサが実行可能な任意の処理を実施する手段(例えば、一般的な演算処理及び計時処理を実行する手段等)として更に機能する構成も可能である。 In addition to the above-described means 131 to 136, the control unit 13 generally performs arbitrary processing that can be executed by the processor (for example, means for executing general arithmetic processing and timekeeping processing). It is also possible to have a configuration that further functions as.

(情報処理装置の動作)
図5を参照して、情報処理装置10の動作について説明する。当該動作は、時間経過に従ってモデルパラメータを目標値に漸近させながらモデル予測制御を実施する動作である。
(Operation of information processing device)
The operation of the information processing apparatus 10 will be described with reference to FIG. This operation is an operation of performing model prediction control while asymptotically bringing the model parameters closer to the target value with the passage of time.

ステップS100:記憶手段131は、制御対象とするプロセスのプロセスモデルを記憶部1に記憶する。 Step S100: The storage means 131 stores the process model of the process to be controlled in the storage unit 1.

ステップS102:制御部13は、モデル予測制御の初期設定を行う。 Step S102: The control unit 13 performs initial setting of model prediction control.

具体的には、制御部13は、変数iを1に設定する。変数iは、モデル予測制御の開始時から起算した現在時刻が何回目の更新周期に属するかを示す変数である。具体的には、モデル予測制御の開始時から起算した現在時刻をt、更新周期の長さをTとすると、(i−1)T≦t<iTであるとき、現在時刻tはi回目の更新周期に属する。 Specifically, the control unit 13 sets the variable i to 1. The variable i is a variable indicating which update cycle the current time calculated from the start of the model prediction control belongs to. Specifically, assuming that the current time calculated from the start of model prediction control is t and the length of the update cycle is T, (i-1) When T ≦ t <iT, the current time t is the i-th time. It belongs to the update cycle.

また、制御部13は、1回目の更新周期におけるモデルパラメータの目標値G1を設定するとともに、モデルパラメータの初期値P0を設定する。ここでは、G1の値は予め定められており、P0はG1と等しいものとして説明する。 Further, the control unit 13 sets the target value G 1 of the model parameter in the first update cycle and sets the initial value P 0 of the model parameter. Here, the value of G 1 is predetermined, and P 0 is described as being equal to G 1 .

ステップS104:プロセス制御手段132は、モデルパラメータを目標値Giに近付けるように変化させる。目標値Giは、i回目の更新周期におけるモデルパラメータの目標値である。i回目の更新周期において、ステップS104が制御周期毎に繰り返し実行されることにより、時間経過に従ってモデルパラメータが目標値Giに漸近する。 Step S104: The process control unit 132 changes the model parameters so as to approach the target value G i. The target value G i is the target value of the model parameter in the i-th update cycle. In the i-th update cycle, step S104 is repeatedly executed for each control cycle, so that the model parameters asymptotically approach the target value G i with the passage of time.

ここで、モデルパラメータを示す関数として、時間経過に従って目標値Giに漸近するような任意の関数が採用可能である。例えば、i回目の更新周期におけるモデルパラメータは、当該更新周期の開始時から起算した時刻tの関数で示すことができる。一例において、i回目の更新周期におけるモデルパラメータP(t)は、以下の式(1)で示される。
P(t)=Gi-1+(Gi−Gi-1)・(1−exp(−α・t)) (1)
なお、αはi回目の更新周期における目標値Giへの近付き方を決める係数であって、任意に決定可能である。
Here, as a function indicating the model parameters, any function that approaches the target value G i can be employed with the lapse of time. For example, the model parameter in the i-th update cycle can be indicated by a function of time t calculated from the start of the update cycle. In one example, the model parameter P (t) in the i-th update cycle is represented by the following equation (1).
P (t) = G i-1 + (G i − G i-1 ) · (1-exp (−α · t)) (1)
Note that α is a coefficient that determines how to approach the target value G i in the i-th update cycle, and can be arbitrarily determined.

なお、モデルパラメータの現在値が目標値Giと等しい場合、モデルパラメータは変化しない。例えば上述のように、モデルパラメータの初期値P0は1回目の更新周期における目標値G1と等しい。したがって、少なくとも1回目の更新周期(すなわち、0≦t<T)においては、モデルパラメータは変化しない。 If the current value of the model parameter is equal to the target value G i , the model parameter does not change. For example, as described above, the initial value P 0 of the model parameter is equal to the target value G 1 in the first update cycle. Therefore, the model parameters do not change at least in the first update cycle (ie, 0 ≦ t <T).

ステップS106:プロセス制御手段132は、プロセスモデルに基づいて将来の制御出力を予測し、実際の制御出力を所望の値に近付けるように制御入力を決定し、決定した制御入力をプラント設備20に入力する。 Step S106: The process control means 132 predicts a future control output based on the process model, determines a control input so as to bring the actual control output closer to a desired value, and inputs the determined control input to the plant equipment 20. To do.

ステップS108:蓄積手段133は、プロセスの制御出力及び制御入力を第1時系列データとして記憶部12に蓄積する。 Step S108: The storage means 133 stores the control output and the control input of the process in the storage unit 12 as the first time series data.

ステップS110:制御部13は、i回目の更新周期が経過したか否かを判定する。具体的には、制御部13は、t=iTであるとき、i回目の更新周期が経過したと判定し(ステップS110−Yes)、動作がステップS112に進む。一方、制御部13は、(i−1)T≦t<iTであるとき、i回目の更新周期が経過していないと判定し(ステップS110−No)、動作がステップS104に戻る。ステップS104〜S110が繰り返し実行されることにより、時間経過に従ってモデルパラメータを目標値Giに漸近させながらモデル予測制御が実施される。 Step S110: The control unit 13 determines whether or not the i-th update cycle has elapsed. Specifically, when t = iT, the control unit 13 determines that the i-th update cycle has elapsed (step S110-Yes), and the operation proceeds to step S112. On the other hand, when (i-1) T ≦ t <iT, the control unit 13 determines that the i-th update cycle has not elapsed (step S110-No), and the operation returns to step S104. By step S104~S110 are repeated, model predictive control is performed while asymptotic model parameter to the target value G i with the lapse of time.

ステップS112:設定手段134は、記憶部12に蓄積された第1時系列データの少なくとも一部を学習データとして用いる機械学習によりモデルパラメータの推定値を探索し、探索した当該推定値をi+1回目の更新周期におけるモデルパラメータの目標値Gi+1として設定する。設定された目標値Gi+1は、第2時系列データとして蓄積手段133により記憶部12に蓄積される。 Step S112: The setting means 134 searches for an estimated value of the model parameter by machine learning using at least a part of the first time series data stored in the storage unit 12 as learning data, and uses the searched estimated value for the i + 1th time. It is set as the target value G i + 1 of the model parameter in the update cycle. The set target value G i + 1 is stored in the storage unit 12 by the storage means 133 as the second time series data.

ステップS114:判定手段135は、更新周期毎に設定されたモデルパラメータの目標値の変化に基づいて、上述の機械学習において過剰適合が発生している可能性の有無を判定する。具体的には、判定手段135は、直近の複数の更新周期においてモデルパラメータに変化がない場合(例えば、モデルパラメータの現在及び過去の目標値の分散が所定閾値未満である場合)、過剰適合が発生している可能性が有ると判定し(ステップS114−Yes)、動作がステップS116に進む。一方、判定手段135は、直近の複数の更新周期においてモデルパラメータに変化がある場合(例えば、当該分散が当該所定閾値以上である場合)、過剰適合が発生している可能性が無いと判定し(ステップS114−No)、動作がステップS120に進む。 Step S114: The determination means 135 determines whether or not there is a possibility that overfitting has occurred in the above-mentioned machine learning based on the change in the target value of the model parameter set for each update cycle. Specifically, the determination means 135 is overfitted when there is no change in the model parameters in the latest plurality of update cycles (for example, when the variance of the current and past target values of the model parameters is less than a predetermined threshold value). It is determined that there is a possibility that it has occurred (step S114-Yes), and the operation proceeds to step S116. On the other hand, the determination means 135 determines that there is no possibility that overfitting has occurred when there is a change in the model parameters in the latest plurality of update cycles (for example, when the variance is equal to or greater than the predetermined threshold value). (Step S114-No), the operation proceeds to step S120.

ステップS116:決定手段136は、モデルパラメータの現在値から現在の目標値(すなわち、ステップS112で設定された、i+1回目の更新周期におけるモデルパラメータの目標値Gi+1)までの数値範囲に含まれない値をスタート値Si+1として決定する。 Step S116: The determining means 136 is included in the numerical range from the current value of the model parameter to the current target value (that is, the target value G i + 1 of the model parameter in the i + 1th update cycle set in step S112). The value that does not exist is determined as the start value S i + 1 .

ステップS118:プロセス制御手段132は、モデルパラメータの現在値をスタート値Si+1で上書きする。 Step S118: The process control means 132 overwrites the current value of the model parameter with the start value S i + 1 .

ステップS120:制御部13は、変数iをインクリメントする。その後、動作がステップS104に戻る。 Step S120: The control unit 13 increments the variable i. After that, the operation returns to step S104.

(モデルパラメータの時間変化)
図6及び図7を参照して、情報処理装置10が上述の動作を実行した場合におけるモデルパラメータの時間変化について、具体的に説明する。図6及び図7は、横軸が時間を示し、縦軸がモデルパラメータを示すグラフである。
(Time change of model parameters)
With reference to FIGS. 6 and 7, the time change of the model parameter when the information processing apparatus 10 executes the above operation will be specifically described. 6 and 7 are graphs in which the horizontal axis represents time and the vertical axis represents model parameters.

まず図6を参照して、2回目以降の各更新周期(2≦i)においてモデルパラメータが時間経過に従い目標値Giに漸近する様子について説明する。図6は、1回目〜3回目の更新周期におけるモデルパラメータの時間変化の例を示す。1回目の更新周期(i=1)においては、モデルパラメータの初期値P0が目標値G1と等しいため、モデルパラメータは変化していない。また、2回目の更新周期(i=2)においては、時間経過に従ってモデルパラメータがG1から目標値G2に向かって漸近している。また、3回目の更新周期においては、時間経過に従ってモデルパラメータがG2から目標値G3に向かって漸近している。2回目以降の各更新周期におけるモデルパラメータは、例えば上述の式(1)で示される。 First, with reference to FIG. 6, a state in which the model parameters gradually approach the target value G i with the passage of time will be described in each update cycle (2 ≦ i) after the second update. FIG. 6 shows an example of time change of model parameters in the first to third update cycles. In the first update cycle (i = 1), the initial value P 0 of the model parameter is equal to the target value G 1 , so the model parameter has not changed. Further, in the second update cycle (i = 2), the model parameters gradually approach from G 1 toward the target value G 2 with the passage of time. Further, in the third update cycle, the model parameters gradually approach from G 2 toward the target value G 3 with the passage of time. The model parameters in each update cycle from the second time onward are represented by, for example, the above equation (1).

このように、本実施形態によれば、モデルパラメータが、例えば各更新周期の開始タイミングで瞬間的に変化するではなく時間経過に従って徐々に変化するので、モデルパラメータの変化に実質的な不連続点が発生する機会が低減する。したがって、例えば制御安定性の低下等の不都合が発生する蓋然性が低減するので、プロセスのモデル予測制御に関する技術が改善する。 As described above, according to the present embodiment, the model parameters do not change instantaneously at the start timing of each update cycle, but gradually change with the passage of time, so that the change of the model parameters is a substantial discontinuity. Is reduced. Therefore, the probability that inconveniences such as a decrease in control stability will occur is reduced, and the technique for process model prediction control is improved.

次に図7を参照して、過剰適合が発生している可能性が有ると判定された場合に、モデルパラメータの現在値がスタート値で上書きされてから、モデルパラメータが時間経過に従い目標値Giに漸近する様子について説明する。図7は、m回目〜m+2回目の更新周期におけるモデルパラメータの時間変化の例を示す。ここでは、mは比較的大きい値であり、モデル予測制御が十分長い時間継続して実施されているものとする。m回目の更新周期(i=m)においては、時間経過に従ってモデルパラメータがGm-1から目標値Gmに向かって漸近している。また、m+1回目の更新周期(i=m+1)においては、時間経過に従ってモデルパラメータがGmから目標値Gm+1に向かって漸近している。ここで、m+1回目の更新周期の終了時に、判定手段135によって過剰適合が発生している可能性が有ると判定されたものとする。このため、時刻t=(m+1)Tにおいて、モデルパラメータがスタート値Sm+2で上書きされている。そして、m+2回目の更新周期(i=m+2)においては、時間経過に従ってモデルパラメータがSm+2から目標値Gm+2に向かって漸近している。 Next, referring to FIG. 7, when it is determined that overfitting may have occurred, the current value of the model parameter is overwritten with the start value, and then the model parameter is set to the target value Gi over time. I will explain how it approaches. FIG. 7 shows an example of the time change of the model parameter in the m-th to m + second update cycles. Here, it is assumed that m is a relatively large value and the model prediction control is continuously performed for a sufficiently long time. In the mth update cycle (i = m), the model parameters asymptotically approach from G m-1 to the target value G m with the passage of time. Further, in the m + 1th update cycle (i = m + 1), the model parameters gradually approach from G m toward the target value G m + 1 with the passage of time. Here, it is assumed that there is a possibility that overfitting has occurred by the determination means 135 at the end of the m + 1th update cycle. Therefore, at time t = (m + 1) T, the model parameter is overwritten with the start value S m + 2 . Then, in the m + second update cycle (i = m + 2), the model parameters gradually approach from S m + 2 toward the target value G m + 2 with the passage of time.

このように、本実施形態によれば、i回目の更新周期の終了時において、過剰適合が発生している可能性が有ると判定された場合には例外的に、モデルパラメータの現在値がスタート値Si+1で上書きされる。上述のように、スタート値Si+1は、i回目の更新周期の終了時におけるモデルパラメータの値(すなわち、上書き前の値)からi+1回目の更新周期における目標値Gi+1までの数値範囲に含まれない値である。このため、i+1回目の更新周期においては、例えばモデルパラメータをスタート値Si+1で上書きしない場合とは異なる数値範囲でモデルパラメータが変化する。すなわち、本実施形態によれば、過剰適合が発生している可能性が有ると判定された場合には、モデルパラメータの変化態様にゆらぎが発生する。 As described above, according to the present embodiment, at the end of the i-th update cycle, the current value of the model parameter is exceptionally started when it is determined that overfitting may have occurred. Overwritten with the value S i + 1 . As described above, the start value S i + 1 is a numerical value from the value of the model parameter at the end of the i-th update cycle (that is, the value before overwriting) to the target value G i + 1 in the i + 1-th update cycle. A value that is not included in the range. Therefore, in the i + 1th update cycle, the model parameter changes in a numerical range different from the case where the model parameter is not overwritten with the start value S i + 1 , for example. That is, according to the present embodiment, when it is determined that there is a possibility that overfitting has occurred, fluctuations occur in the change mode of the model parameters.

上述のように、モデルパラメータの目標値を決定するための機械学習においてはモデルパラメータの推定値が探索されるが、その探索範囲は過去のモデルパラメータの変化態様に依存する。例えばプロセスの定常状態が長期間に亘って継続した場合には、過去のモデルパラメータの変化が小さくなるため、モデルパラメータの推定値の探索範囲が比較的狭くなって過剰適合が発生し得る。これに対して本実施形態によれば、モデルパラメータの変化態様にゆらぎを発生させるので、モデルパラメータの目標値を決定するための機械学習における過剰適合を緩和又は防止することができる。 As described above, in machine learning for determining the target value of the model parameter, the estimated value of the model parameter is searched, and the search range depends on the change mode of the past model parameter. For example, when the steady state of the process continues for a long period of time, the change in the past model parameters becomes small, so that the search range of the estimated value of the model parameters becomes relatively narrow and overfitting may occur. On the other hand, according to the present embodiment, since fluctuations are generated in the change mode of the model parameters, it is possible to alleviate or prevent overfitting in machine learning for determining the target value of the model parameters.

本発明を諸図面及び実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形及び修正を行うことが容易であることに注意されたい。したがって、これらの変形及び修正は本発明の範囲に含まれることに留意されたい。例えば、各手段、各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の手段及びステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。 Although the present invention has been described with reference to the drawings and examples, it should be noted that those skilled in the art can easily make various modifications and modifications based on the present disclosure. Therefore, it should be noted that these modifications and modifications are within the scope of the present invention. For example, the functions included in each means, each step, etc. can be rearranged so as not to be logically inconsistent, and a plurality of means, steps, etc. can be combined or divided into one. ..

例えば、モデル予測制御システム1が複数の情報処理装置10を備える構成も可能である。また、実施形態に係る1つの情報処理装置10の各構成又は各手段が、互いに通信可能な複数の装置に分散配置された構成も可能である。 For example, the model prediction control system 1 may be configured to include a plurality of information processing devices 10. Further, each configuration or each means of one information processing device 10 according to the embodiment may be distributed and arranged in a plurality of devices capable of communicating with each other.

また、上述した実施形態において、図5を参照して情報処理装置10の動作の例について説明した。しかしながら、上述した動作に含まれる一部のステップ、又は1つのステップに含まれる一部の動作が、論理的に矛盾しない範囲内において省略された構成も可能である。また、上述した動作に含まれる複数のステップの順番が、論理的に矛盾しない範囲内において入れ替わった構成も可能である。 Further, in the above-described embodiment, an example of the operation of the information processing apparatus 10 has been described with reference to FIG. However, it is also possible that some steps included in the above-mentioned operations or some operations included in one step are omitted within a range that is logically consistent. Further, it is possible that the order of the plurality of steps included in the above-described operation is interchanged within a range that is logically consistent.

また、上述した実施形態において、制御部13によって実現される各手段をソフトウェア構成として説明したが、これらのうち少なくとも一部の手段は、ソフトウェア資源及び/又はハードウェア資源を含む概念であってもよい。例えば、記憶手段131及び蓄積手段133はメモリを含んでもよい。 Further, in the above-described embodiment, each means realized by the control unit 13 has been described as a software configuration, but at least some of these means may be a concept including software resources and / or hardware resources. Good. For example, the storage means 131 and the storage means 133 may include a memory.

また、上述した実施形態に係る情報処理装置10として機能させるために、コンピュータ又は携帯電話等の汎用の情報処理装置を用いることができる。当該情報処理装置は、実施形態に係る情報処理装置10の各機能を実現する処理内容を記述したプログラムを、当該情報処理装置のメモリに格納し、当該情報処理装置のプロセッサによって当該プログラムを読み出して実行させることによって実現可能である。 Further, in order to function as the information processing device 10 according to the above-described embodiment, a general-purpose information processing device such as a computer or a mobile phone can be used. The information processing apparatus stores a program describing processing contents for realizing each function of the information processing apparatus 10 according to the embodiment in the memory of the information processing apparatus, and reads the program by the processor of the information processing apparatus. It can be realized by executing it.

1 モデル予測制御システム
10 情報処理装置
11 通信部
12 記憶部
13 制御部
131 記憶手段
132 プロセス制御手段
133 蓄積手段
134 設定手段
135 判定手段
136 決定手段
20 プラント設備
30 表示装置
40 入力装置
N ネットワーク
1 Model prediction control system 10 Information processing device 11 Communication unit 12 Storage unit 13 Control unit 131 Storage means 132 Process control means 133 Storage means 134 Setting means 135 Judgment means 136 Decision means 20 Plant equipment 30 Display device 40 Input device N network

Claims (9)

プロセスモデルを記憶する記憶手段と、
前記プロセスモデルを用いてプロセスのモデル予測制御を実施するプロセス制御手段と、
前記プロセスの制御出力及び制御入力を時系列データとして蓄積する蓄積手段と、
蓄積された前記時系列データを学習データとして用いる機械学習により前記プロセスモデルのモデルパラメータの目標値を設定する設定手段と、
を備えるモデル予測制御システムであって、
前記プロセス制御手段は、時間経過に従って前記モデルパラメータを前記目標値に漸近させながら前記モデル予測制御を実施する、モデル予測制御システム。
A storage means for storing the process model and
A process control means for performing model predictive control of a process using the process model, and
A storage means for accumulating the control output and control input of the process as time series data,
A setting means for setting target values of model parameters of the process model by machine learning using the accumulated time-series data as learning data, and
It is a model prediction control system equipped with
The process control means is a model prediction control system that carries out the model prediction control while asymptotically bringing the model parameters closer to the target value over time.
請求項1に記載のモデル予測制御システムであって、
前記設定手段により周期的に設定された前記モデルパラメータの目標値の変化に基づいて、前記機械学習において過剰適合が発生している可能性の有無を判定する判定手段と、
前記判定手段により前記過剰適合が発生している可能性が有ると判定された場合、前記モデルパラメータの現在値から現在の目標値までの数値範囲に含まれない値をスタート値として決定する決定手段と、
を更に備え、
前記プロセス制御手段は、前記判定手段により前記過剰適合が発生している可能性が有ると判定された場合、前記モデルパラメータの現在値を前記スタート値で上書きしてから、時間経過に従って前記モデルパラメータを前記現在の目標値に漸近させる、モデル予測制御システム。
The model prediction control system according to claim 1.
A determination means for determining whether or not overfitting may have occurred in the machine learning based on a change in the target value of the model parameter periodically set by the setting means.
When it is determined by the determination means that the overfitting may have occurred, a determination means for determining a value not included in the numerical range from the current value of the model parameter to the current target value as a start value. When,
With more
When the determination means determines that the overfitting may have occurred, the process control means overwrites the current value of the model parameter with the start value, and then the model parameter with the passage of time. A model predictive control system that asymptotically approaches the current target value.
請求項2に記載のモデル予測制御システムであって、
前記判定手段は、前記モデルパラメータの現在及び過去の目標値の分散が所定閾値未満である場合、前記過剰適合が発生している可能性が有ると判定する、モデル予測制御システム。
The model prediction control system according to claim 2.
The determination means is a model prediction control system that determines that the overfitting may have occurred when the variance of the current and past target values of the model parameters is less than a predetermined threshold value.
請求項2又は3に記載のモデル予測制御システムであって、
前記決定手段は、前記モデルパラメータの現在及び過去の目標値に基づいて前記スタート値を決定する、モデル予測制御システム。
The model predictive control system according to claim 2 or 3.
The determination means is a model prediction control system that determines the start value based on the current and past target values of the model parameter.
プロセスモデルを記憶する記憶手段と、
前記プロセスモデルを用いてプロセスのモデル予測制御を実施するプロセス制御手段と、
前記プロセスの制御出力及び制御入力を時系列データとして蓄積する蓄積手段と、
蓄積された前記時系列データを学習データとして用いる機械学習により前記プロセスモデルのモデルパラメータの目標値を設定する設定手段と、
を備える情報処理装置であって、
前記プロセス制御手段は、時間経過に従って前記モデルパラメータを前記目標値に漸近させながら前記モデル予測制御を実施する、情報処理装置。
A storage means for storing the process model and
A process control means for performing model predictive control of a process using the process model, and
A storage means for accumulating the control output and control input of the process as time series data,
A setting means for setting target values of model parameters of the process model by machine learning using the accumulated time-series data as learning data, and
It is an information processing device equipped with
The process control means is an information processing device that performs the model prediction control while asymptotically bringing the model parameters closer to the target value with the passage of time.
プロセスモデルを記憶する記憶手段と、前記プロセスモデルを用いてプロセスのモデル予測制御を実施するプロセス制御手段と、前記プロセスの制御出力及び制御入力を時系列データとして蓄積する蓄積手段と、蓄積された前記時系列データを学習データとして用いる機械学習により前記プロセスモデルのモデルパラメータの目標値を設定する設定手段と、を備え、前記プロセス制御手段が時間経過に従って前記モデルパラメータを前記目標値に漸近させながら前記モデル予測制御を実施するモデル予測制御システムを構成するために、
前記記憶手段、前記プロセス制御手段、前記蓄積手段、及び前記設定手段のうち少なくとも1つを備える、情報処理装置。
A storage means for storing a process model, a process control means for performing model prediction control of a process using the process model, a storage means for storing control outputs and control inputs of the process as time-series data, and storage means. A setting means for setting a target value of a model parameter of the process model by machine learning using the time-series data as training data is provided, and the process control means gradually brings the model parameter closer to the target value over time. To configure a model predictive control system that implements the model predictive control
An information processing device including at least one of the storage means, the process control means, the storage means, and the setting means.
情報処理装置を、
プロセスモデルを記憶する記憶手段と、
前記プロセスモデルを用いてプロセスのモデル予測制御を実施するプロセス制御手段と、
前記プロセスの制御出力及び制御入力を時系列データとして蓄積する蓄積手段と、
蓄積された前記時系列データを学習データとして用いる機械学習により前記プロセスモデルのモデルパラメータの目標値を設定する設定手段と、
として機能させるプログラムであって、
前記プロセス制御手段は、時間経過に従って前記モデルパラメータを前記目標値に漸近させながら前記モデル予測制御を実施する、プログラム。
Information processing device,
A storage means for storing the process model and
A process control means for performing model predictive control of a process using the process model, and
A storage means for accumulating the control output and control input of the process as time series data,
A setting means for setting target values of model parameters of the process model by machine learning using the accumulated time-series data as learning data, and
It is a program that functions as
The process control means is a program that carries out the model prediction control while asymptotically bringing the model parameters closer to the target value over time.
通信可能に接続された複数の情報処理装置を含んで構成され、プロセスモデルを記憶する記憶手段と、前記プロセスモデルを用いてプロセスのモデル予測制御を実施するプロセス制御手段と、前記プロセスの制御出力及び制御入力を時系列データとして蓄積する蓄積手段と、蓄積された前記時系列データを学習データとして用いる機械学習により前記プロセスモデルのモデルパラメータの目標値を設定する設定手段と、を備え、前記プロセス制御手段が時間経過に従って前記モデルパラメータを前記目標値に漸近させながら前記モデル予測制御を実施するモデル予測制御システムにおける、前記複数の情報処理装置のうち1つの情報処理装置を、
前記記憶手段、前記プロセス制御手段、前記蓄積手段、及び前記設定手段のうち少なくとも1つとして機能させる、プログラム。
A storage means that includes a plurality of information processing devices that are communicably connected and stores a process model, a process control means that performs model prediction control of a process using the process model, and a control output of the process. The process is provided with a storage means for accumulating control inputs as time-series data and a setting means for setting target values of model parameters of the process model by machine learning using the accumulated time-series data as training data. One of the plurality of information processing devices in a model prediction control system in which the control means performs the model prediction control while gradually bringing the model parameters closer to the target value with the passage of time.
A program that functions as at least one of the storage means, the process control means, the storage means, and the setting means.
情報処理装置が実行するプロセスのモデル予測制御方法であって、
プロセスモデルを記憶するステップと、
前記プロセスモデルを用いてプロセスのモデル予測制御を実施する制御ステップと、
前記プロセスの制御出力及び制御入力を時系列データとして蓄積するステップと、
蓄積された前記時系列データを学習データとして用いる機械学習により前記プロセスモデルのモデルパラメータの目標値を設定するステップと、
を含み、
前記制御ステップにおいて、時間経過に従って前記モデルパラメータを前記目標値に漸近させながら前記モデル予測制御を実施する、モデル予測制御方法。
It is a model prediction control method of the process executed by the information processing device.
Steps to memorize the process model and
A control step for performing model prediction control of a process using the process model, and
A step of accumulating the control output and control input of the process as time series data,
A step of setting target values of model parameters of the process model by machine learning using the accumulated time series data as learning data, and
Including
A model prediction control method in which, in the control step, the model prediction control is performed while the model parameters are asymptotically approached to the target value with the passage of time.
JP2019100719A 2019-05-29 2019-05-29 Model predictive control system, information processing device, program, and model predictive control method Active JP7287835B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019100719A JP7287835B2 (en) 2019-05-29 2019-05-29 Model predictive control system, information processing device, program, and model predictive control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019100719A JP7287835B2 (en) 2019-05-29 2019-05-29 Model predictive control system, information processing device, program, and model predictive control method

Publications (2)

Publication Number Publication Date
JP2020194453A true JP2020194453A (en) 2020-12-03
JP7287835B2 JP7287835B2 (en) 2023-06-06

Family

ID=73547955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019100719A Active JP7287835B2 (en) 2019-05-29 2019-05-29 Model predictive control system, information processing device, program, and model predictive control method

Country Status (1)

Country Link
JP (1) JP7287835B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020197967A (en) * 2019-06-04 2020-12-10 メタウォーター株式会社 Model prediction control system, information processing device, program, and model prediction control method
CN113515852A (en) * 2021-06-07 2021-10-19 河北工业大学 Sustainable learning fan output prediction method, system, equipment and storage medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219205A (en) * 1998-01-30 1999-08-10 Yamatake Corp Imc controller
JP2011198327A (en) * 2010-03-24 2011-10-06 Jfe Steel Corp Model predictive control method and device using online model identification
WO2015037165A1 (en) * 2013-09-12 2015-03-19 日本電気株式会社 Information processing device, predictive control method, and recording medium
JP2019013858A (en) * 2017-07-03 2019-01-31 横河電機株式会社 Control system and control method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11219205A (en) * 1998-01-30 1999-08-10 Yamatake Corp Imc controller
JP2011198327A (en) * 2010-03-24 2011-10-06 Jfe Steel Corp Model predictive control method and device using online model identification
WO2015037165A1 (en) * 2013-09-12 2015-03-19 日本電気株式会社 Information processing device, predictive control method, and recording medium
JP2019013858A (en) * 2017-07-03 2019-01-31 横河電機株式会社 Control system and control method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020197967A (en) * 2019-06-04 2020-12-10 メタウォーター株式会社 Model prediction control system, information processing device, program, and model prediction control method
JP7353804B2 (en) 2019-06-04 2023-10-02 メタウォーター株式会社 Model predictive control system, information processing device, program, and model predictive control method
CN113515852A (en) * 2021-06-07 2021-10-19 河北工业大学 Sustainable learning fan output prediction method, system, equipment and storage medium

Also Published As

Publication number Publication date
JP7287835B2 (en) 2023-06-06

Similar Documents

Publication Publication Date Title
US11521056B2 (en) System and methods for intrinsic reward reinforcement learning
KR102506122B1 (en) Reinforcement learning model construction method, device, electronic equipment and medium
JP6942790B2 (en) Information processing device and information processing method
CN109032078A (en) Machine learning device, control device and computer-readable medium
US10962960B2 (en) Chip removal apparatus and information processing apparatus
CN112488183A (en) Model optimization method and device, computer equipment and storage medium
WO2019234810A1 (en) Learning device, inference device, method, and program
JP2020194453A (en) Model prediction control system, information processing device, program, and model prediction control method
KR102660544B1 (en) Control apparatus, controller, control system, control method and control program
US11897066B2 (en) Simulation apparatus
CN108830376B (en) Multivalent value network deep reinforcement learning method for time-sensitive environment
KR20170015097A (en) Method and apparatus for power management
US11947623B2 (en) Information processing device, information processing method, and computer program product
US20190317472A1 (en) Controller and control method
JP2019185742A (en) Controller and control method
JPWO2016151620A1 (en) SIMULATION SYSTEM, SIMULATION METHOD, AND SIMULATION PROGRAM
JP2005004658A (en) Change point detection device, change point detection method and change point-detecting program
JP2020197967A (en) Model prediction control system, information processing device, program, and model prediction control method
US20230419109A1 (en) Method of learning neural network, recording medium, and remaining life prediction system
JPH09256338A (en) Water level forecasting device for river
JP2020197944A (en) Model prediction control system, information processing device, program, and model prediction control method
CN113408782A (en) Robot path navigation method and system based on improved DDPG algorithm
JP7085140B2 (en) Control device, control method and control program
US11195116B2 (en) Dynamic boltzmann machine for predicting general distributions of time series datasets
CN111008735A (en) Predictive emission management system and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221130

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20221215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20221215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230525

R150 Certificate of patent or registration of utility model

Ref document number: 7287835

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150