JP2024067631A - Apparatus, method and program - Google Patents

Apparatus, method and program Download PDF

Info

Publication number
JP2024067631A
JP2024067631A JP2022177854A JP2022177854A JP2024067631A JP 2024067631 A JP2024067631 A JP 2024067631A JP 2022177854 A JP2022177854 A JP 2022177854A JP 2022177854 A JP2022177854 A JP 2022177854A JP 2024067631 A JP2024067631 A JP 2024067631A
Authority
JP
Japan
Prior art keywords
control
deviation
control parameter
acquisition unit
recommended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022177854A
Other languages
Japanese (ja)
Inventor
琢 劉
英二 石井
豪 ▲高▼見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yokogawa Electric Corp
Original Assignee
Yokogawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yokogawa Electric Corp filed Critical Yokogawa Electric Corp
Priority to JP2022177854A priority Critical patent/JP2024067631A/en
Publication of JP2024067631A publication Critical patent/JP2024067631A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Feedback Control In General (AREA)

Abstract

【課題】制御モデルから出力される推奨制御パラメータを出力する。【解決手段】制御対象に関する状態の測定値および目標値の偏差を取得する偏差取得部と、前記制御対象に対して供給された制御パラメータをシフトさせたシフト済み制御パラメータを取得する制御パラメータ取得部と、偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記偏差取得部により取得された偏差と、前記制御パラメータ取得部により取得された前記シフト済み制御パラメータとを供給する第1供給部と、前記第1供給部から前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力部と、を備える装置が提供される。【選択図】図1[Problem] A device is provided that outputs recommended control parameters output from a control model. [Solution] An apparatus is provided that includes a deviation acquisition unit that acquires a deviation between a measured value and a target value of a state related to a controlled object, a control parameter acquisition unit that acquires shifted control parameters obtained by shifting control parameters supplied to the controlled object, a first supply unit that supplies the deviation acquired by the deviation acquisition unit and the shifted control parameters acquired by the control parameter acquisition unit to a control model that outputs recommended control parameters to be supplied to the controlled object in response to input of the deviation and control parameters, and an output unit that outputs the recommended control parameters output from the control model in response to supply to the control model from the first supply unit. [Selected Figure] Figure 1

Description

本発明は、装置、方法およびプログラムに関する。 The present invention relates to an apparatus, a method and a program.

特許文献1~4には、「目標値SVに基づいて操作量マップを選択して、選択した操作量マップを用いて操作量MVを算出する」(特許文献1の段落0031)などと記載されている。
[先行技術文献]
[特許文献]
[特許文献1] 特開2022-156797号公報
[特許文献2]特開2020-95352号公報
[特許文献3]特開2021-117699号公報
[特許文献4]特開2022-014099号公報
Patent Documents 1 to 4 state, for example, that "an operation amount map is selected based on the target value SV, and the operation amount MV is calculated using the selected operation amount map" (paragraph 0031 of Patent Document 1).
[Prior Art Literature]
[Patent Documents]
[Patent Document 1] JP 2022-156797 A [Patent Document 2] JP 2020-95352 A [Patent Document 3] JP 2021-117699 A [Patent Document 4] JP 2022-014099 A

本発明の第1の態様においては、制御対象に関する状態の測定値および目標値の偏差を取得する偏差取得部と、前記制御対象に対して供給された制御パラメータをシフトさせたシフト済み制御パラメータを取得する制御パラメータ取得部と、偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記偏差取得部により取得された偏差と、前記制御パラメータ取得部により取得された前記シフト済み制御パラメータとを供給する第1供給部と、前記第1供給部から前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力部と、を備える装置が提供される。 In a first aspect of the present invention, there is provided an apparatus including: a deviation acquisition unit that acquires the deviation between a measured value and a target value of a state related to a control object; a control parameter acquisition unit that acquires shifted control parameters obtained by shifting control parameters supplied to the control object; a first supply unit that supplies the deviation acquired by the deviation acquisition unit and the shifted control parameters acquired by the control parameter acquisition unit to a control model that outputs recommended control parameters to be supplied to the control object in response to input of the deviation and the control parameters; and an output unit that outputs the recommended control parameters output from the control model in response to supply from the first supply unit to the control model.

上記の装置においては、前記状態の目標値を取得する目標値取得部をさらに備え、前記制御パラメータ取得部は、前記目標値が基準目標値から変更されたことに応じて、前記制御対象に対して供給された制御パラメータをシフトさせて、前記シフト済み制御パラメータを取得してよい。 The above device may further include a target value acquisition unit that acquires a target value for the state, and the control parameter acquisition unit may shift the control parameters supplied to the control object in response to the target value being changed from a reference target value, and acquire the shifted control parameters.

上記の装置においては、前記制御パラメータ取得部は、前記目標値が基準目標値から変更されたことに応じて、前記制御対象に対して供給された制御パラメータを、前記目標値に応じたシフト量だけシフトさせて、前記シフト済み制御パラメータを取得してよい。 In the above device, the control parameter acquisition unit may, in response to the target value being changed from the reference target value, shift the control parameter supplied to the control object by a shift amount corresponding to the target value, and acquire the shifted control parameter.

前記制御パラメータを前記目標値に応じたシフト量だけシフトさせる上記の装置においては、前記制御パラメータ取得部は、前記目標値および前記基準目標値の差分と、予め設定された係数とを乗算して前記シフト量を決定してよい。 In the above device that shifts the control parameter by a shift amount corresponding to the target value, the control parameter acquisition unit may determine the shift amount by multiplying the difference between the target value and the reference target value by a preset coefficient.

前記制御パラメータを前記目標値に応じたシフト量だけシフトさせる上記の装置においては、前記制御パラメータ取得部は、前記目標値に設定された値と、当該値に前記測定値が安定するときの制御パラメータの値との関係を示す、予め設定された関係式を用いて前記シフト量を決定してよい。 In the above device in which the control parameter is shifted by a shift amount corresponding to the target value, the control parameter acquisition unit may determine the shift amount using a pre-set relational expression that indicates the relationship between a value set as the target value and the value of the control parameter when the measured value stabilizes at that value.

上記何れかの装置においては、前記推奨制御パラメータにより前記制御対象が制御された後に前記偏差取得部により取得される偏差が基準範囲内に安定しないことを検出する第1検出部をさらに備え、前記制御パラメータ取得部は、前記偏差取得部により取得される偏差が前記基準範囲内に安定しないことが前記第1検出部により検出されたことに応じて、前記制御対象に対して供給された前記制御パラメータをシフトさせて、前記シフト済み制御パラメータを取得してよい。 Any of the above devices may further include a first detection unit that detects that the deviation acquired by the deviation acquisition unit is not stable within a reference range after the control object is controlled by the recommended control parameters, and the control parameter acquisition unit may shift the control parameters supplied to the control object and acquire the shifted control parameters in response to the first detection unit detecting that the deviation acquired by the deviation acquisition unit is not stable within the reference range.

上記の装置においては、偏差および当該偏差の変化速度が入力されることに応じて、前記制御パラメータ取得部により制御パラメータについてシフトすることを推奨する推奨シフト量を出力するシフト量出力モデルに対し、前記偏差取得部により取得された偏差と、当該偏差の変化速度とを供給する第2供給部をさらに備え、前記制御パラメータ取得部は、前記偏差取得部により取得される偏差が前記基準範囲内に安定しないことが前記第1検出部により検出され、かつ、前記第2供給部から前記シフト量出力モデルに対する供給が行われたことに応じて当該シフト量出力モデルから出力される前記推奨シフト量だけ、前記制御対象に対して供給された制御パラメータをシフトさせて、前記シフト済み制御パラメータを取得してよい。 The above device further includes a second supply unit that supplies the deviation acquired by the deviation acquisition unit and the rate of change of the deviation to a shift amount output model that outputs a recommended shift amount that recommends a shift of a control parameter by the control parameter acquisition unit in response to input of the deviation and the rate of change of the deviation, and the control parameter acquisition unit may shift the control parameter supplied to the controlled object by the recommended shift amount output from the shift amount output model in response to detection by the first detection unit that the deviation acquired by the deviation acquisition unit is not stable within the reference range and supply from the second supply unit to the shift amount output model to acquire the shifted control parameter.

前記偏差取得部により取得された偏差と、当該偏差の変化速度とをシフト量出力モデルに供給する上記の装置においては、前記第2供給部は、基準インターバルごとに前記シフト量出力モデルに対する供給を行ってよい。 In the above device that supplies the deviation acquired by the deviation acquisition unit and the rate of change of the deviation to a shift amount output model, the second supply unit may supply the deviation to the shift amount output model at each reference interval.

前記偏差取得部により取得された偏差と、当該偏差の変化速度とをシフト量出力モデルに供給する上記の装置においては、前記偏差取得部により取得される偏差と、当該偏差の変化速度と、前記制御パラメータ取得部による前記制御パラメータのシフト量とを含む学習データを用い、偏差および当該偏差の変化速度の入力に応じ、予め設定された報酬関数により定まる報酬値を高めるために推奨される前記推奨シフト量を出力するよう前記シフト量出力モデルの学習処理を行う第1学習処理部をさらに備えてよい。 The above device, which supplies the deviation acquired by the deviation acquisition unit and the rate of change of the deviation to a shift amount output model, may further include a first learning processing unit that performs learning processing of the shift amount output model using learning data including the deviation acquired by the deviation acquisition unit, the rate of change of the deviation, and the shift amount of the control parameter acquired by the control parameter acquisition unit, and outputs the recommended shift amount recommended to increase a reward value determined by a preset reward function in response to input of the deviation and the rate of change of the deviation.

上記何れかの装置においては、前記制御対象が変更されたことを検出する第2検出部をさらに備え、前記制御パラメータ取得部は、前記制御対象が変更されたことが前記第2検出部により検出されたことに応じて、前記制御対象に対して供給された制御パラメータをシフトさせて、前記シフト済み制御パラメータを取得してよい。 Any of the above devices may further include a second detection unit that detects that the control target has been changed, and the control parameter acquisition unit may shift the control parameters supplied to the control target in response to the second detection unit detecting that the control target has been changed, and acquire the shifted control parameters.

上記何れかの装置においては、前記制御モデルは、偏差および制御パラメータが入力されることに応じて、当該制御パラメータについて変更することを推奨する推奨変更量を出力する変更量出力モデルと、前記制御対象に供給された前記制御パラメータと、前記変更量出力モデルから出力される前記推奨変更量とを加算して前記推奨制御パラメータを算出する加算部と、を有してよい。 In any of the above devices, the control model may include a change amount output model that outputs a recommended change amount that recommends a change to the control parameter in response to input of the deviation and the control parameter, and an adder that calculates the recommended control parameter by adding the control parameter supplied to the control target and the recommended change amount output from the change amount output model.

上記の装置においては、前記偏差取得部により取得される偏差と、前記制御パラメータ取得部により取得される制御パラメータと、を含む学習データを用い、偏差および制御パラメータの入力に応じ、予め設定された報酬関数により定まる報酬値を高めるために推奨される前記推奨変更量を出力するよう前記変更量出力モデルの学習処理を行う第2学習処理部をさらに備えてよい。 The above device may further include a second learning processing unit that performs learning processing of the change amount output model using learning data including the deviation acquired by the deviation acquisition unit and the control parameters acquired by the control parameter acquisition unit, and outputs the recommended change amount recommended to increase a reward value determined by a preset reward function in response to input of the deviation and the control parameters.

本発明の第2の態様においては、制御対象に関する状態の測定値および目標値の偏差を取得する偏差取得段階と、前記制御対象に対して供給された制御パラメータをシフトさせたシフト済み制御パラメータを取得する制御パラメータ取得段階と、偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記偏差取得段階により取得された偏差と、前記制御パラメータ取得段階により取得された前記シフト済み制御パラメータとを供給する第1供給段階と、前記第1供給段階により前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力段階と、を備える方法が提供される。 In a second aspect of the present invention, a method is provided that includes a deviation acquisition step of acquiring a deviation between a measured value and a target value of a state related to a control object, a control parameter acquisition step of acquiring a shifted control parameter obtained by shifting a control parameter supplied to the control object, a first supply step of supplying the deviation acquired by the deviation acquisition step and the shifted control parameter acquired by the control parameter acquisition step to a control model that outputs a recommended control parameter recommended to be supplied to the control object in response to input of the deviation and the control parameter, and an output step of outputting the recommended control parameter output from the control model in response to supply to the control model by the first supply step.

本発明の第3の態様においては、コンピュータを、制御対象に関する状態の測定値および目標値の偏差を取得する偏差取得部と、前記制御対象に対して供給された制御パラメータをシフトさせたシフト済み制御パラメータを取得する制御パラメータ取得部と、偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記偏差取得部により取得された偏差と、前記制御パラメータ取得部により取得された前記シフト済み制御パラメータとを供給する第1供給部と、前記第1供給部から前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力部として機能させるプログラムが提供される。 In a third aspect of the present invention, a program is provided that causes a computer to function as a deviation acquisition unit that acquires the deviation between a measured value and a target value of a state related to a control object, a control parameter acquisition unit that acquires shifted control parameters obtained by shifting control parameters supplied to the control object, a first supply unit that supplies the deviation acquired by the deviation acquisition unit and the shifted control parameters acquired by the control parameter acquisition unit to a control model that outputs recommended control parameters to be supplied to the control object in response to input of the deviation and control parameters, and an output unit that outputs the recommended control parameters output from the control model in response to supply from the first supply unit to the control model.

なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。 Note that the above summary of the invention does not list all of the necessary features of the present invention. Also, subcombinations of these features may also be inventions.

第1実施形態に係るシステム1を示す。1 shows a system 1 according to a first embodiment. 変更量出力モデル2061の一例を示す。2 shows an example of a change amount output model 2061. 変更量出力モデル2061の他の例を示す。2 shows another example of the change amount output model 2061. 制御モデル206に入力される制御パラメータをシフトすることによる効果を示す。The effect of shifting the control parameters input to the control model 206 is shown. サンプルデータの近似曲線を示す。The fitted curve of the sample data is shown. 装置200の動作を示す。2 illustrates the operation of the device 200. 目標値SPが変更される場合の測定値PVと、制御パラメータとの推移を示す。13 shows the transition of the measured value PV and the control parameter when the target value SP is changed. 第2実施形態に係るシステム1Aを示す。1 shows a system 1A according to a second embodiment. シフト量出力モデル213Aの一例を示す。2 shows an example of a shift amount output model 213A. シフト量出力モデル213Aの他の例を示す。13 shows another example of the shift amount output model 213A. 装置200Aの動作を示す。The operation of the device 200A is shown. 外乱が生じる場合の測定値PVと、制御パラメータとの推移を示す。13 shows the transition of the measured value PV and the control parameter when a disturbance occurs. 第3実施形態に係るシステム1Bを示す。13 shows a system 1B according to a third embodiment. 本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ2200の例を示す。22 illustrates an example computer 2200 in which aspects of the present invention may be embodied, in whole or in part.

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。 The present invention will be described below through embodiments of the invention, but the following embodiments do not limit the invention according to the claims. Furthermore, not all of the combinations of features described in the embodiments are necessarily essential to the solution of the invention.

<1.第1実施形態>
<1.1.システム1>
図1は、第1実施形態に係るシステム1を示す。システム1は設備100と、装置200とを備える。
<1. First embodiment>
<1.1. System 1>
1 shows a system 1 according to the first embodiment. The system 1 includes a facility 100 and an apparatus 200.

<1.1.1.設備100>
設備100は、制御対象101が備え付けられた施設や装置等である。例えば、設備100は、プラントであってもよいし、複数の機器を複合させた複合装置であってもよい。プラントとしては、化学やバイオ等の工業プラントの他、ガス田や油田等の井戸元やその周辺を管理制御するプラント、水力・火力・原子力等の発電を管理制御するプラント、太陽光や風力等の環境発電を管理制御するプラント、上下水やダム等を管理制御するプラント等が挙げられる。
<1.1.1. Equipment 100>
The equipment 100 is a facility or device in which a control target 101 is installed. For example, the equipment 100 may be a plant or a composite device in which multiple devices are combined. In addition to industrial plants such as chemical and biotechnology plants, plants that manage and control wellheads and surrounding areas of gas and oil fields, plants that manage and control hydroelectric, thermal and nuclear power plants, and environmental power plants such as solar and wind power plants. Examples of such plants include those that manage and control water supply, sewage, and dams.

設備100には、1または複数の制御対象101が設けられている。制御対象101は、制御の対象となる器具、機械または装置等であり、いわゆるフィールド機器であってよい。例えば、制御対象101は、圧力計、流量計、温度センサ等のセンサ機器、流量制御弁や開閉弁等のバルブ機器、またはファンやモータ等のアクチュエータ機器であってよい。制御対象101は、外部から有線または無線で制御されるが、手動で制御されてもよい。制御対象101は、装置200における制御部207によって制御されてよい。本実施形態では一例として、制御対象101は、操作量MV(Manipulated Variable)についての指示値IV(Instructed value)を制御部207から供給されることで制御されてよい。 The facility 100 is provided with one or more control objects 101. The control object 101 may be a tool, machine, or device to be controlled, and may be a so-called field device. For example, the control object 101 may be a sensor device such as a pressure gauge, flow meter, or temperature sensor, a valve device such as a flow control valve or an on-off valve, or an actuator device such as a fan or a motor. The control object 101 is controlled from the outside by wire or wirelessly, but may also be controlled manually. The control object 101 may be controlled by the control unit 207 in the device 200. In this embodiment, as an example, the control object 101 may be controlled by supplying an instruction value IV (Instructed Value) for a manipulated variable MV (Manipulated Variable) from the control unit 207.

また、設備100には、1または複数のセンサ102が設けられていてよい。各センサ102は、設備100の内外の状態の測定値、つまり、内外の状態を示す物理量の測定値を測定してよい。少なくとも1つのセンサ102は、制御対象101の状態の測定値PV(Process Variable)を測定してよい。測定値PVは、制御対象101を制御した結果の運転状態を示す運転データであってよく、制御の対象となる制御量を示してよい。一例として、測定値PVは、制御対象101の出力そのものを示してもよいし、制御対象101の出力によって変化する様々な値を示してもよい。一例として、測定値PVは、圧力、温度、pH、速度、流量などを示してよい。各センサ102は、測定した測定値PVを装置200に供給してよい。 The facility 100 may be provided with one or more sensors 102. Each sensor 102 may measure a measurement value of the inside and outside state of the facility 100, that is, a measurement value of a physical quantity indicating the inside and outside state. At least one sensor 102 may measure a measurement value PV (Process Variable) of the state of the control object 101. The measurement value PV may be operation data indicating the operation state as a result of controlling the control object 101, and may indicate the control amount to be controlled. As an example, the measurement value PV may indicate the output of the control object 101 itself, or may indicate various values that change depending on the output of the control object 101. As an example, the measurement value PV may indicate pressure, temperature, pH, speed, flow rate, etc. Each sensor 102 may supply the measured measurement value PV to the device 200.

<1.1.2.装置200>
装置200は、制御対象101を制御するものであり、例えば制御対象101のコントローラであってよい。装置200は、制御対象101の操作量MVについての指示値IVを出力して温度の調節、液面の水位調整または流量の調整などのプロセス制御を実行してよい。
<1.1.2. Apparatus 200>
The device 200 controls the controlled object 101, and may be, for example, a controller for the controlled object 101. The device 200 outputs an instruction value IV for a manipulated variable MV of the controlled object 101 to adjust the temperature, Process controls such as adjusting the surface level or adjusting the flow rate may be performed.

装置200は、PC(パーソナルコンピュータ)、タブレット型コンピュータ、スマートフォン、ワークステーション、サーバコンピュータ、または汎用コンピュータ等のコンピュータであってよく、複数のコンピュータが接続されたコンピュータシステムであってもよい。このようなコンピュータシステムもまた広義のコンピュータである。また、装置200は、コンピュータ内で1または複数実行可能な仮想コンピュータ環境によって実装されてもよい。これに代えて、装置200は、AI制御用に設計された専用コンピュータであってもよく、専用回路によって実現された専用ハードウェアであってもよい。また、装置200がインターネットに接続可能な場合、装置200は、クラウドコンピューティングにより実現されてもよい。 The device 200 may be a computer such as a PC (personal computer), a tablet computer, a smartphone, a workstation, a server computer, or a general-purpose computer, or may be a computer system to which multiple computers are connected. Such a computer system is also a computer in the broad sense. The device 200 may be implemented by a virtual computer environment in which one or more programs can be executed within a computer. Alternatively, the device 200 may be a dedicated computer designed for AI control, or may be dedicated hardware realized by a dedicated circuit. Furthermore, if the device 200 can be connected to the Internet, the device 200 may be realized by cloud computing.

装置200は、測定値取得部201と、目標値取得部202と、偏差取得部203と、制御パラメータ取得部204と、第1供給部205と、制御モデル206と、制御部207と、学習処理部208とを有してよい。なお、これらブロックは、それぞれ機能的に分離された機能ブロックであって、実際のデバイス構成とは必ずしも一致していなくてもよい。即ち、本図において、1つのブロックとして示されている場合であっても、それが1つのデバイスにより構成されるものに限定されない。また、本図において、別々のブロックとして示されている場合であっても、それらが別々のデバイスにより構成されるものに限定されない。 The device 200 may have a measurement value acquisition unit 201, a target value acquisition unit 202, a deviation acquisition unit 203, a control parameter acquisition unit 204, a first supply unit 205, a control model 206, a control unit 207, and a learning processing unit 208. Note that these blocks are functionally separated functional blocks, and may not necessarily match the actual device configuration. That is, even if shown as one block in this diagram, it is not limited to being configured by one device. Also, even if shown as separate blocks in this diagram, it is not limited to being configured by separate devices.

<1.1.2―1.測定値取得部201>
測定値取得部201は、制御対象101に関する状態の測定値PVを取得する。本実施形態では一例として、測定値取得部201は、一の物理量についての測定値PVを一のセンサ102から取得することとして説明するが、複数の物理量のそれぞれについての測定値PVを複数のセンサ102から取得してもよい。測定値取得部201は、取得した測定値PVを偏差取得部203に供給してよい。
<1.1.2-1. Measurement value acquisition unit 201>
The measurement value acquiring unit 201 acquires a measurement value PV of a state related to the control target 101. In the present embodiment, as an example, the measurement value acquiring unit 201 acquires a measurement value PV for one physical quantity from one sensor 102, but the measurement value acquiring unit 201 may acquire measurement values PV for each of a plurality of physical quantities from a plurality of sensors 102. The measurement value acquiring unit 201 may supply the acquired measurement value PV to the deviation acquiring unit 203.

<1.1.2-2.目標値取得部202>
目標値取得部202は、制御対象101に関する状態の目標値SP(Set Point)を取得する。目標値取得部202は、測定値取得部201により取得される測定値PVの目標値SPを取得してよい。目標値取得部202は、図示しない入力部を介してオペレータから目標値SPを取得してよい。目標値取得部202は、オペレータにより目標値SPが設定されない場合には、予め設定された基準目標値を目標値SPとして取得してよい。目標値取得部202は、取得した目標値SPを偏差取得部203に供給してよい。目標値取得部202は、基準目標値とは異なる値に目標値SPが設定されることに応じて、設定された目標値SPを示す信号(目標値変更信号とも称する)を制御パラメータ取得部204に供給してよい。
<1.1.2-2. Target value acquisition unit 202>
The target value acquisition unit 202 acquires a target value SP (Set Point) of a state related to the control target 101. The target value acquisition unit 202 may acquire the target value SP of the measurement value PV acquired by the measurement value acquisition unit 201. The target value acquisition unit 202 may acquire the target value SP from an operator via an input unit (not shown). When the target value SP is not set by the operator, the target value acquisition unit 202 may acquire a preset reference target value as the target value SP. The target value acquisition unit 202 may supply the acquired target value SP to the deviation acquisition unit 203. In response to the target value SP being set to a value different from the reference target value, the target value acquisition unit 202 may supply a signal indicating the set target value SP (also referred to as a target value change signal) to the control parameter acquisition unit 204.

<1.1.2-3.偏差取得部203>
偏差取得部203は、制御対象101に関する状態の測定値PVおよび目標値SPの偏差を取得する。偏差取得部203は、測定値取得部201から測定値PVを、目標値取得部202から目標値SPを取得し、目標値SPから測定値PVを減算して偏差を算出してよい。これに代えて、偏差取得部203は、測定値PVから目標値SPを減算して偏差を算出してもよい。偏差取得部203は、取得した偏差を第1供給部205に供給してよい。偏差取得部203は、取得した偏差を、図示しない記憶部に記憶させてよい。
<1.1.2-3. Deviation acquisition unit 203>
The deviation acquisition unit 203 acquires the deviation between the measurement value PV and the target value SP of the state related to the control target 101. The deviation acquisition unit 203 may acquire the measurement value PV from the measurement value acquisition unit 201 and the target value SP from the target value acquisition unit 202, and calculate the deviation by subtracting the measurement value PV from the target value SP. Alternatively, the deviation acquisition unit 203 may calculate the deviation by subtracting the target value SP from the measurement value PV. The deviation acquisition unit 203 may supply the acquired deviation to the first supply unit 205. The deviation acquisition unit 203 may store the acquired deviation in a storage unit not shown.

<1.1.2-4.制御パラメータ取得部204>
制御パラメータ取得部204は、制御対象101に対して供給された制御パラメータPをシフトさせたシフト済み制御パラメータP+Δpを取得する。制御パラメータ取得部204は、後述の制御部207から制御パラメータPを取得してよく、本実施形態では一例として、制御部207が制御対象101に制御パラメータPを供給するごとに当該制御パラメータPを取得してよい。制御パラメータPは、制御対象101の操作量MVについての指示値IVを示してよい。制御対象101がバルブである場合には、制御パラメータPは一例としてバルブ開度を示してよい。制御パラメータ取得部204は、制御部207から取得した制御パラメータPをシフトさせてシフト済み制御パラメータP+Δpを生成してよい。
<1.1.2-4. Control parameter acquisition unit 204>
The control parameter acquisition unit 204 acquires a shifted control parameter P+Δp by shifting the control parameter P supplied to the control object 101. The control parameter acquisition unit 204 may acquire the control parameter P from the control unit 207 described later, and in the present embodiment, as an example, may acquire the control parameter P every time the control unit 207 supplies the control parameter P to the control object 101. The control parameter P may indicate an instruction value IV for an operation amount MV of the control object 101. When the control object 101 is a valve, the control parameter P may indicate a valve opening degree, as an example. The control parameter acquisition unit 204 may shift the control parameter P acquired from the control unit 207 to generate the shifted control parameter P+Δp.

制御パラメータ取得部204は、目標値SPが上述の基準目標値から変更されたことに応じて、制御対象101に対して供給された制御パラメータPをシフトさせてシフト済み制御パラメータP+Δpを取得してよい。制御パラメータ取得部204は、目標値取得部202から目標値変更信号を受信したことに応じて、制御部207から取得した直近の制御パラメータPをシフトさせ、シフト済み制御パラメータP+Δpを生成してよい。 The control parameter acquisition unit 204 may shift the control parameter P supplied to the control object 101 in response to a change in the target value SP from the above-mentioned reference target value, and acquire a shifted control parameter P+Δp. In response to receiving a target value change signal from the target value acquisition unit 202, the control parameter acquisition unit 204 may shift the most recent control parameter P acquired from the control unit 207, and generate a shifted control parameter P+Δp.

制御パラメータ取得部204は、目標値SPが上述の基準目標値から変更されたことに応じて、制御対象101に対して供給された制御パラメータPを、目標値SPに応じたシフト量Δpだけシフトさせてシフト済み制御パラメータP+Δpを取得してよい。制御パラメータ取得部204は、目標値変更信号で示される目標値SPに基づいてシフト量Δpを決定してよい。なお、シフト量Δpについては詳細を後述する。 In response to the target value SP being changed from the above-mentioned reference target value, the control parameter acquisition unit 204 may shift the control parameter P supplied to the control target 101 by a shift amount Δp corresponding to the target value SP to acquire a shifted control parameter P+Δp. The control parameter acquisition unit 204 may determine the shift amount Δp based on the target value SP indicated by the target value change signal. The shift amount Δp will be described in detail later.

制御パラメータ取得部204は、取得したシフト済み制御パラメータP+Δpを第1供給部205に供給してよい。なお、本実施形態では一例として、制御パラメータ取得部204は、目標値SPが基準目標値である場合には、制御部207から取得した制御パラメータPをシフトさせずに第1供給部205に供給することとして説明するが、当該制御パラメータPを0だけシフトさせたシフト済み制御パラメータP+Δpとして第1供給部205に供給してもよい。 The control parameter acquisition unit 204 may supply the acquired shifted control parameter P+Δp to the first supply unit 205. Note that, as an example in this embodiment, when the target value SP is a reference target value, the control parameter acquisition unit 204 supplies the control parameter P acquired from the control unit 207 to the first supply unit 205 without shifting it, but the control parameter P may be shifted by 0 and supplied to the first supply unit 205 as a shifted control parameter P+Δp.

<1.1.2-5.第1供給部205>
第1供給部205は、制御モデル206に対し、偏差取得部203により取得された偏差と、制御パラメータ取得部204により取得されたシフト済み制御パラメータP+Δpとを供給する。第1供給部205は、制御部207から制御対象101に供給された制御パラメータPをシフトさせたシフト済み制御パラメータP+Δpと、当該制御パラメータPにより制御対象101を制御した結果の運転状態を示す偏差とを制御モデル206に供給してよい。第1供給部205は、シフトされていない制御パラメータPが制御パラメータ取得部204から供給される場合には、当該制御パラメータPと偏差とを制御モデル206に供給してよい。
<1.1.2-5. First supply unit 205>
The first supply unit 205 supplies the deviation acquired by the deviation acquisition unit 203 and the shifted control parameter P+Δp acquired by the control parameter acquisition unit 204 to the control model 206. A shifted control parameter P+Δp obtained by shifting the control parameter P supplied from the control unit 207 to the controlled object 101 and a deviation indicating an operating state as a result of controlling the controlled object 101 using the control parameter P are supplied to the control model 206. When the unshifted control parameter P is supplied from the control parameter acquisition unit 204, the first supplying unit 205 may supply the control parameter P and the deviation to the control model 206.

<1.1.2-6.制御モデル206>
制御モデル206は、偏差および制御パラメータPが入力されることに応じて、制御対象101に供給することを推奨する推奨制御パラメータPrを出力する。制御モデル206は、偏差と、一の制御対象101に供給された制御パラメータPとが入力されることに応じて、当該一の制御対象101に供給することを推奨する推奨制御パラメータPrを出力してよい。推奨制御パラメータPrは、制御対象101の操作量MVについての、推奨される指示値IVを示してよい。
<1.1.2-6. Control model 206>
In response to input of the deviation and the control parameter P, the control model 206 outputs a recommended control parameter Pr recommended to be supplied to the controlled object 101. In response to input of the deviation and the control parameter P supplied to one controlled object 101, the control model 206 may output a recommended control parameter Pr recommended to be supplied to the one controlled object 101. The recommended control parameter Pr may indicate a recommended indicated value IV for the manipulated variable MV of the controlled object 101.

制御モデル206は、制御パラメータPについて基準値V(一例として0)を基準として生成されていてよく、基準値Vに対する制御パラメータPの相対値が偏差と共に入力されることに応じて、当該基準値Vを基準とした推奨制御パラメータPrの値を出力してよい。基準値Vを基準とした制御モデル206に対して偏差と制御パラメータPとが入力されることに代えて、偏差とシフト済み制御パラメータP+Δpとが入力されることは、基準値V-Δpを基準とした他の制御モデルに対して偏差と制御パラメータPとが入力されることに相当してよい。このような他の制御モデルは、特許文献1で示されるような従来技術において、制御モデル206とは異なる環境で使用するべく生成され得る。 The control model 206 may be generated based on a reference value V (0, for example) for the control parameter P, and may output the value of the recommended control parameter Pr based on the reference value V in response to inputting the relative value of the control parameter P with respect to the reference value V together with the deviation. Inputting the deviation and the shifted control parameter P+Δp instead of inputting the deviation and the control parameter P to the control model 206 based on the reference value V may be equivalent to inputting the deviation and the control parameter P to another control model based on the reference value V-Δp. Such another control model may be generated for use in an environment different from that of the control model 206 in the conventional technology as shown in Patent Document 1.

制御モデル206は、偏差および制御パラメータPが入力されることに応じて、目標値SPが基準目標値である状態に応じた推奨制御パラメータPrを出力してよい。別言すれば、制御モデル206は、目標値が基準目標値である状態において推奨される推奨制御パラメータPrを出力してよい。このような制御モデル206に対して偏差と制御パラメータPとが入力されることに代えて、偏差とシフト済み制御パラメータP+Δpとが入力されることは、目標値SPが基準目標値とは異なる一の値である場合に適合した推奨制御パラメータPrを出力する他の制御モデルに対し、偏差と制御パラメータPとが入力されることに相当してよい。 In response to the input of the deviation and the control parameter P, the control model 206 may output a recommended control parameter Pr corresponding to a state in which the target value SP is a reference target value. In other words, the control model 206 may output a recommended control parameter Pr that is recommended in a state in which the target value is a reference target value. Inputting the deviation and the shifted control parameter P+Δp instead of inputting the deviation and the control parameter P to such a control model 206 may be equivalent to inputting the deviation and the control parameter P to another control model that outputs a recommended control parameter Pr that is suitable when the target value SP is a value different from the reference target value.

制御モデル206は、第1供給部205から偏差と、シフト済み制御パラメータP+Δpまたは制御パラメータPとを入力されることに応じて、制御部207に推奨制御パラメータPrを出力してよい。本実施形態では一例として、制御モデル206には一の物理量についての測定値PVおよび目標値SPの偏差が入力されることとして説明するが、複数の物理量についての測定値PVおよび目標値SPの偏差がそれぞれ入力されることとしてもよい。制御モデル206は、変更量出力モデル2061と、加算部2062とを有してよい。 The control model 206 may output a recommended control parameter Pr to the control unit 207 in response to input of the deviation and the shifted control parameter P+Δp or the control parameter P from the first supply unit 205. In this embodiment, as an example, the deviation of the measurement value PV and the target value SP for one physical quantity is described as being input to the control model 206, but the deviations of the measurement value PV and the target value SP for multiple physical quantities may also be input. The control model 206 may have a change amount output model 2061 and an adder 2062.

<1.1.2-6(1).変更量出力モデル2061>
変更量出力モデル2061は、偏差および制御パラメータPが入力されることに応じて、当該制御パラメータPについて変更することを推奨する推奨変更量を出力する。変更量出力モデル2061は、推奨変更量を加算部2062に供給してよい。推奨変更量は、制御対象101に対して供給された直近の制御パラメータPから変更することを推奨する変更量を示してよい。本実施形態では一例として推奨変更量は、操作量MVについての直近の指示値IVについての推奨される変更量を示してよい。変更量出力モデル2061は、学習処理部208による学習処理によって生成されてよく、図示しない記憶部に記憶されていてよい。
<1.1.2-6(1). Change amount output model 2061>
In response to input of the deviation and the control parameter P, the change amount output model 2061 outputs a recommended change amount that recommends a change to the control parameter P. The change amount output model 2061 may supply the recommended change amount to the adder 2062. The recommended change amount may indicate a change amount that is recommended to be changed from the most recent control parameter P supplied to the controlled object 101. In the present embodiment, as an example, the recommended change amount may indicate a recommended change amount for the most recent indicated value IV for the manipulated variable MV. The change amount output model 2061 may be generated by a learning process by the learning processor 208, and may be stored in a storage unit (not shown).

<1.1.2-6(2).加算部2062>
加算部2062は、制御対象101に供給された制御パラメータPと、変更量出力モデル2061から出力される推奨変更量とを加算して推奨制御パラメータPrを算出する。加算部2062は、制御部207から供給された直近の制御パラメータPと、変更量出力モデル2061から供給された推奨変更量とを加算して推奨制御パラメータPrを算出してよい。
<1.1.2-6(2). Addition unit 2062>
The adder 2062 calculates a recommended control parameter Pr by adding the control parameter P supplied to the control target 101 and the recommended change amount output from the change amount output model 2061. The adder 2062 may calculate the recommended control parameter Pr by adding the most recent control parameter P supplied from the control unit 207 and the recommended change amount supplied from the change amount output model 2061.

加算部2062は、次の(1)式に示すように、時点t-1での制御パラメータP(t-1)と、時点tでの推奨変更量Δu(t)とを加算して、時点tでの推奨制御パラメータPr(t)を算出してよい。
Pr(t)=P(t-1)+Δu(t) (1)
The adder 2062 may calculate the recommended control parameter Pr(t) at time t by adding the control parameter P (t-1) at time t-1 and the recommended change amount Δu (t) at time t, as shown in the following equation (1) .
Pr (t) = P (t-1) + Δu (t) (1)

加算部2062は、制御部207から供給される制御パラメータPを記憶して、推奨制御パラメータPrの算出に用いてよい。加算部2062は、算出された推奨制御パラメータPrを制御部207に供給してよい。 The adder 2062 may store the control parameter P supplied from the control unit 207 and use it to calculate the recommended control parameter Pr. The adder 2062 may supply the calculated recommended control parameter Pr to the control unit 207.

<1.1.2-7.制御部207>
制御部207は、出力部の一例であり、第1供給部205から制御モデル206に対する供給が行われたことに応じて当該制御モデル206から出力される推奨制御パラメータPrを出力する。本実施形態では一例として、制御部207は、推奨制御パラメータPrを制御パラメータPとして制御対象101に出力して、制御対象101を制御してよい。制御部207は、オペレータから入力される制御パラメータPを制御対象101に出力して制御対象101を制御してもよい。制御部207は、制御対象101の制御周期に合わせて制御パラメータPを制御対象101に出力してよい。
<1.1.2-7. Control unit 207>
The control unit 207 is an example of an output unit, and outputs a recommended control parameter Pr output from the control model 206 in response to supply from the first supply unit 205 to the control model 206. As an example in the present embodiment, the control unit 207 may output the recommended control parameter Pr to the control object 101 as a control parameter P to control the control object 101. The control unit 207 may output the control parameter P input by an operator to the control object 101 to control the control object 101. The control unit 207 may output the control parameter P to the control object 101 in accordance with the control period of the control object 101.

制御部207は、制御対象101に供給される制御パラメータPを、図示しない記憶部に記憶させてよい。制御部207は、制御対象101に供給される制御パラメータPを、偏差取得部203により取得される偏差と対応付けて記憶部に記憶させてよい。制御部207は、制御対象101に供給される制御パラメータPを、当該制御パラメータPにより制御対象101を制御した結果の運転状態を示す偏差と対応付けて記憶部に記憶させてよい。 The control unit 207 may store the control parameter P supplied to the control object 101 in a storage unit (not shown). The control unit 207 may store the control parameter P supplied to the control object 101 in the storage unit in association with the deviation acquired by the deviation acquisition unit 203. The control unit 207 may store the control parameter P supplied to the control object 101 in the storage unit in association with the deviation indicating the operating state resulting from controlling the control object 101 with the control parameter P.

<1.1.2-8.学習処理部208>
学習処理部208は、第2学習処理部の一例であり、偏差取得部203により取得される偏差と、制御パラメータ取得部204により取得される制御パラメータPと、を含む学習データを用いて変更量出力モデル2061の学習処理を行う。学習データに含まれる偏差および制御パラメータPは、目標値SPが上述の基準目標値である場合に取得される偏差および制御パラメータPであってよく、図示しない記憶部において対応付けて記憶されてよい。なお、学習データは、実際のシステム1から取得される代わりに、システム1のシミュレータ(図示せず)から取得されてもよい。シミュレータは、任意のシステム同定技術により設備100の実測データなどを用いて作成されてよい。
<1.1.2-8. Learning processing unit 208>
The learning processing unit 208 is an example of a second learning processing unit, and performs learning processing of the change amount output model 2061 using learning data including the deviation acquired by the deviation acquisition unit 203 and the control parameter P acquired by the control parameter acquisition unit 204. The deviation and control parameter P included in the learning data may be the deviation and control parameter P acquired when the target value SP is the above-mentioned reference target value, and may be stored in association with each other in a storage unit (not shown). Note that the learning data may be acquired from a simulator (not shown) of the system 1 instead of being acquired from the actual system 1. The simulator may be created using actual measurement data of the facility 100 by any system identification technology.

学習処理部208は、偏差および制御パラメータPの入力に応じ、報酬値を高めるために推奨される推奨変更量を出力するよう変更量出力モデル2061の学習を行ってよい。推奨変更量は、所定の時点(一例として偏差および制御パラメータPの取得時点)での制御対象101の状態に対応する報酬値(一例としてその時点の測定値PVに応じた値を報酬関数に入力して得られる報酬値)を基準報酬値とした場合に、当該基準報酬値よりも報酬値を高くするために推奨される変更量であってよい。一例として、学習処理部208は、カーネルダイナミックポリシープログラミング法(Kernel Dynamic Policy Programming、KDPP)のアルゴリズムにより学習を行ってよい。報酬値は、予め設定された報酬関数により定まる値であってよい。報酬関数は、偏差に基づく関数であってよく、一例として、偏差が小さいほど報酬値が大きくなる関数であってよい。なお、偏差取得部203により複数の物理量のそれぞれについて偏差が取得される場合には、報酬関数は複数の偏差の総和に基づく関数であってもよいし、複数の偏差を重み付け加算した結果に基づく関数であってもよい。 The learning processing unit 208 may learn the change amount output model 2061 so as to output a recommended change amount recommended for increasing the reward value in response to the input of the deviation and the control parameter P. The recommended change amount may be a change amount recommended for increasing the reward value above a reference reward value (for example, a reward value obtained by inputting a value corresponding to the measurement value PV at that time into the reward function) corresponding to the state of the control object 101 at a predetermined time point (for example, the time point at which the deviation and the control parameter P are acquired) when the reference reward value is set as the reward value. As an example, the learning processing unit 208 may learn using an algorithm of the Kernel Dynamic Policy Programming (KDPP). The reward value may be a value determined by a preset reward function. The reward function may be a function based on the deviation, and as an example, a function in which the smaller the deviation, the larger the reward value. In addition, when the deviation acquisition unit 203 acquires deviations for each of multiple physical quantities, the reward function may be a function based on the sum of the multiple deviations, or may be a function based on the result of weighting and adding the multiple deviations.

以上の装置200によれば、測定値PVおよび目標値SPの偏差と制御パラメータPとが入力されることに応じて推奨制御パラメータPrを出力する制御モデル206に対し、制御パラメータPをシフトさせたシフト済み制御パラメータP+Δpが供給される。従って、制御パラメータPの基準値を制御モデル206よりもシフト量-Δpだけシフトさせた他の制御モデルに制御パラメータPを入力して出力される推奨制御パラメータPrを、制御モデル206から取得することができる。よって、環境の変化(本実施形態では一例として目標値の変化)に合わせて制御パラメータPをシフトさせて制御モデル206に入力することで、変化した環境に適合した推奨制御パラメータPrを取得することができる。また、制御パラメータPをシフトすることにより、基準値の異なる他の制御モデルから出力される推奨制御パラメータPrを制御モデル206から取得することができるため、複数の制御モデルを装置200に内蔵する場合と比較して、装置200を小型化することができる。 According to the above-described device 200, the control model 206 outputs the recommended control parameter Pr in response to the input of the deviation between the measured value PV and the target value SP and the control parameter P, and the shifted control parameter P+Δp is supplied to the control model 206. Therefore, the recommended control parameter Pr output by inputting the control parameter P to another control model in which the reference value of the control parameter P is shifted by the shift amount -Δp from the control model 206 can be obtained from the control model 206. Therefore, by shifting the control parameter P in accordance with the change in the environment (the change in the target value as an example in this embodiment) and inputting it to the control model 206, the recommended control parameter Pr adapted to the changed environment can be obtained. In addition, by shifting the control parameter P, the recommended control parameter Pr output from another control model with a different reference value can be obtained from the control model 206, so that the device 200 can be made smaller than when multiple control models are built into the device 200.

また、制御モデル206では、偏差と、制御対象101に供給済みの制御パラメータPとに応じて当該制御パラメータPの推奨変更量が変更量出力モデル2061から出力され、当該供給済みの制御パラメータPと、当該推奨変更量とが加算されて推奨制御パラメータPrが算出される。従って、制御パラメータPをシフト済み制御パラメータP+ΔPとして制御モデル206に入力することで制御モデル206を他の制御モデルとして用いる場合であっても、供給済みの制御パラメータPをベースとした推奨制御パラメータPrを取得することができる。よって、制御対象101に適合した適切な推奨制御パラメータPrを取得することができる。 In addition, in the control model 206, a recommended change amount for the control parameter P is output from the change amount output model 2061 according to the deviation and the control parameter P that has already been supplied to the control object 101, and the recommended change amount is added to the supplied control parameter P to calculate the recommended control parameter Pr. Therefore, even when the control model 206 is used as another control model by inputting the control parameter P to the control model 206 as the shifted control parameter P+ΔP, a recommended control parameter Pr based on the supplied control parameter P can be obtained. Therefore, an appropriate recommended control parameter Pr that is suited to the control object 101 can be obtained.

また、偏差取得部203により取得される偏差と、制御パラメータ取得部204により取得される制御パラメータPとを含む学習データを用い、偏差および制御パラメータPの入力に応じ、報酬関数により定まる報酬値を高めるために推奨される推奨変更量を出力するよう変更量出力モデル2061の学習処理が行われる。従って、適切な推奨制御パラメータPrを制御モデル206から確実に取得することができる。 In addition, using learning data including the deviation acquired by the deviation acquisition unit 203 and the control parameter P acquired by the control parameter acquisition unit 204, a learning process is performed on the change amount output model 2061 so as to output a recommended change amount recommended for increasing the reward value determined by the reward function in response to the input of the deviation and the control parameter P. Therefore, an appropriate recommended control parameter Pr can be reliably acquired from the control model 206.

また、偏差および制御パラメータPが制御モデル206に入力されることに応じて、目標値SPが基準目標値である状態に応じた推奨制御パラメータPrが制御モデル206から出力され、目標値SPが基準目標値から変更されたことに応じて、制御パラメータPをシフトさせたシフト済み制御パラメータP+Δpが制御モデル206に供給される。従って、単一の制御モデル206を用い、目標値SPの変化に応じた推奨制御パラメータPrを取得することができる。 In addition, in response to the deviation and control parameter P being input to the control model 206, a recommended control parameter Pr corresponding to the state in which the target value SP is the reference target value is output from the control model 206, and in response to the target value SP being changed from the reference target value, a shifted control parameter P+Δp obtained by shifting the control parameter P is supplied to the control model 206. Therefore, using a single control model 206, it is possible to obtain a recommended control parameter Pr corresponding to a change in the target value SP.

また、目標値SPが上述の基準目標値から変更されたことに応じて、制御対象101に対して供給された制御パラメータPを目標値SPに応じたシフト量Δpだけシフトさせてシフト済み制御パラメータP+Δpが取得される。従って、単一の制御モデル206を用い、目標値SPの変化に応じた高精度の推奨制御パラメータPrを取得することができる。 In addition, in response to the target value SP being changed from the above-mentioned reference target value, the control parameter P supplied to the control target 101 is shifted by a shift amount Δp corresponding to the target value SP to obtain a shifted control parameter P+Δp. Therefore, using a single control model 206, it is possible to obtain a highly accurate recommended control parameter Pr corresponding to the change in the target value SP.

<1.2.変更量出力モデル2061>
図2は、変更量出力モデル2061の一例を示す。なお、図2や後述の図4等において縦軸は制御パラメータP(一例としてバルブの開度の指示値IV)を示し、横軸は偏差を示す。
<1.2. Change amount output model 2061>
Fig. 2 shows an example of the change amount output model 2061. In Fig. 2 and Fig. 4 described later, the vertical axis indicates the control parameter P (as an example, the command value IV of the valve opening) and the horizontal axis indicates the deviation.

変更量出力モデル2061は、偏差および制御パラメータPの組み合わせと、推奨変更量との対応関係を示してよい。本例の変更量出力モデル2061は、偏差および制御パラメータPの組み合わせと、推奨変更量との対応関係をマッピングした操作量マップであってよい。操作量マップは、制御パラメータPと偏差との組み合わせに応じて、それぞれ別々の推奨変更量に対応付けられた複数の領域に分けられてよく、入力される制御パラメータPおよび偏差の組み合わせの座標位置に対応付けられた推奨変更量を出力してよい。このような変更量出力モデル2061を用いると、偏差が0で、かつ、変更量が0の座標点(平衡点Oとも称する。図2では一例として偏差=0かつ制御パラメータP=約50の点)でプロセスが安定状態となる。 The change amount output model 2061 may show the correspondence between the combination of the deviation and the control parameter P and the recommended change amount. The change amount output model 2061 in this example may be an operation amount map that maps the correspondence between the combination of the deviation and the control parameter P and the recommended change amount. The operation amount map may be divided into multiple regions that correspond to different recommended change amounts according to the combination of the control parameter P and the deviation, and may output recommended change amounts that correspond to the coordinate position of the input combination of the control parameter P and the deviation. When such a change amount output model 2061 is used, the process becomes stable at a coordinate point where the deviation is 0 and the change amount is 0 (also called the equilibrium point O. In FIG. 2, as an example, the point where the deviation is 0 and the control parameter P is about 50).

なお、変更量出力モデル2061は、操作量マップの全域に関する情報を含んでよい。これに代えて、変更量出力モデル2061は、各領域の境界を示す情報(一例として境界を示す座標や関数式)と、各領域に対応する推奨変更量とのみを含んでもよい。この場合には、変更量出力モデル2061を記憶するための記憶領域を小さくすることができる。 The change amount output model 2061 may include information about the entire area of the operation amount map. Alternatively, the change amount output model 2061 may include only information indicating the boundaries of each area (for example, coordinates or function formulas indicating the boundaries) and the recommended change amount corresponding to each area. In this case, the storage area for storing the change amount output model 2061 can be reduced.

図3は、変更量出力モデル2061の他の例を示す。この図に示すように、変更量出力モデル2061は、偏差および制御パラメータPの組み合わせと、推奨変更量とを対応付けたテーブルであってもよい。 Figure 3 shows another example of the change amount output model 2061. As shown in this figure, the change amount output model 2061 may be a table that associates combinations of deviations and control parameters P with recommended change amounts.

<1.3.制御パラメータPのシフト>
図4は、制御モデル206に入力される制御パラメータPをシフトすることによる効果を示す。
1.3. Shift of control parameter P
FIG. 4 illustrates the effect of shifting the control parameter P input to the control model 206.

本実施形態に係る変更量出力モデル2061の操作量マップは偏差についての座標軸を有しており、目標値SPが基準目標値から変更される等によりシステム1の環境が変化する場合にも、偏差=0の線上でプロセスが安定することには変わりがない。従って、環境が変化することによる平衡点Oのずれは、操作量マップを制御パラメータPの座標軸方向(本図では一例として縦軸方向)にシフトさせることで解消され得る。 The manipulated variable map of the change amount output model 2061 according to this embodiment has a coordinate axis for the deviation, and even if the environment of the system 1 changes, for example because the target value SP is changed from the reference target value, the process remains stable on the line of deviation = 0. Therefore, the deviation of the equilibrium point O caused by a change in the environment can be eliminated by shifting the manipulated variable map in the direction of the coordinate axis of the control parameter P (the vertical axis direction in this figure is used as an example).

本実施形態に係る装置200では、環境が変化することにより元の平衡点Oとは異なる点Osが実際の平衡点となる場合に、制御モデル206の変更量出力モデル2061に対し、制御パラメータPをシフト量Δpだけシフトさせて入力する。これにより、図中上側に示す変更量出力モデル2061の操作量マップを制御パラメータPの座標軸方向に―Δpだけシフトさせて、図中下側に示す操作量マップとし、偏差と制御パラメータPとを入力した場合と同様の推奨変更量が出力される。よって、制御パラメータPをシフトさせて制御モデル206に入力することにより、操作量マップをシフトさせた他の制御モデルからの出力を取得することができる。 In the device 200 according to this embodiment, when a point Os different from the original equilibrium point O becomes the actual equilibrium point due to a change in the environment, the control parameter P is shifted by a shift amount Δp and input to the change amount output model 2061 of the control model 206. As a result, the operation amount map of the change amount output model 2061 shown in the upper part of the figure is shifted by -Δp in the coordinate axis direction of the control parameter P to become the operation amount map shown in the lower part of the figure, and a recommended change amount similar to that when the deviation and the control parameter P are input is output. Therefore, by shifting the control parameter P and inputting it to the control model 206, it is possible to obtain an output from another control model with a shifted operation amount map.

<1.4.シフト量>
制御パラメータ取得部204は、制御対象101に供給された制御パラメータPを、設定された目標値SPに応じたシフト量Δpだけシフトさせてシフト済み制御パラメータP+Δpを生成してよい。例えば、制御パラメータ取得部204は、目標値SPおよび基準目標値の差分と、予め設定された係数とを乗算してシフト量Δpを決定してよい。これに代えて、または、これに加えて、制御パラメータ取得部204は、目標値SPに設定された値と、当該値に測定値PVが安定するときの制御パラメータPの値(平衡点Oでの制御パラメータPの値とも称する)との関係を示す、予め設定された関係式を用いてシフト量Δpを決定してよい。
1.4. Shift amount
The control parameter acquisition unit 204 may shift the control parameter P supplied to the controlled object 101 by a shift amount Δp according to the set target value SP to generate a shifted control parameter P+Δp. For example, the control parameter acquisition unit 204 may determine the shift amount Δp by multiplying the difference between the target value SP and the reference target value by a preset coefficient. Alternatively or in addition to this, the control parameter acquisition unit 204 may determine the shift amount Δp using a preset relational expression that indicates the relationship between the value set in the target value SP and the value of the control parameter P when the measurement value PV stabilizes at that value (also referred to as the value of the control parameter P at the equilibrium point O).

測定値PVが目標値SPに安定するとは、制御部207から制御対象101に制御パラメータPが出力されて第1の基準時間が経過した後に、第2の基準時間内に亘って測定値PVが基準範囲内に収まることであってよい。基準範囲は、目標値SPを中央に含む範囲であってよい。第1の基準時間および第2の基準時間は制御対象101の時定数に応じてそれぞれ予め設定されてよい。第1の基準時間および第2の基準時間は互いに異なる時間であってよい。第2の基準時間は第1の基準時間よりも長くてよく、制御部207による制御対象101の制御周囲より長くてよい。 The measurement value PV being stabilized at the target value SP may mean that after the control parameter P is output from the control unit 207 to the control object 101 and the first reference time has elapsed, the measurement value PV falls within a reference range over a second reference time. The reference range may be a range that includes the target value SP at the center. The first reference time and the second reference time may be set in advance according to the time constant of the control object 101. The first reference time and the second reference time may be different times from each other. The second reference time may be longer than the first reference time and may be longer than the control perimeter of the control object 101 by the control unit 207.

シフト量の決定に用いられる上述の係数や関係式は、平衡点Oでの測定値PVと当該平衡点Oでの制御パラメータPとを含む複数のサンプルデータに対する近似曲線から設定されてよい。平衡点Oでの測定値PVを測定値PVの目標値SPとして捉えると、近似曲線は目標値SPと、平衡点Oでの制御パラメータPの値との関係を示してよい。当該基準時曲線の関数は、シフト量の決定に用いられる上述の関係式として予め設定されてよい。近似曲線が一次関数である場合には、目標値SPの変化量に対する制御パラメータPの変化量の比、つまり近似曲線の傾きを示す値は、シフト量の決定に用いられる上述の係数として予め設定されてよい。 The above-mentioned coefficients and relational expressions used to determine the shift amount may be set from an approximation curve for multiple sample data including the measurement value PV at the equilibrium point O and the control parameter P at the equilibrium point O. If the measurement value PV at the equilibrium point O is taken as the target value SP of the measurement value PV, the approximation curve may indicate the relationship between the target value SP and the value of the control parameter P at the equilibrium point O. The function of the reference time curve may be set in advance as the above-mentioned relational expression used to determine the shift amount. If the approximation curve is a linear function, the ratio of the change in the control parameter P to the change in the target value SP, i.e., a value indicating the slope of the approximation curve, may be set in advance as the above-mentioned coefficient used to determine the shift amount.

各サンプルデータは、制御対象101に供給する制御パラメータPを一定値に維持して測定値PVのステップ応答が一の値に安定したときの制御パラメータPの値と、測定値PVの値とを含んでよい。これに代えて、各サンプルデータは、目標値SPを設定して制御対象101をPID制御によって制御し、測定値PVが目標値SPに安定したときの制御パラメータPの値と、目標値SPとを含んでよい。各サンプルデータは制御対象101を実際に動作させて取得されてもよいし、シミュレータによって取得されてもよい。サンプルデータの近似曲線は、最小二乗法などの線形回帰により算出されてもよいし、多項式近似やガウス過程回帰などの非線形回帰により算出されてもよい。 Each sample data may include the value of the control parameter P when the step response of the measurement value PV stabilizes to a single value while maintaining the control parameter P supplied to the control object 101 at a constant value, and the value of the measurement value PV. Alternatively, each sample data may include the value of the control parameter P when the measurement value PV stabilizes to the target value SP by setting a target value SP and controlling the control object 101 by PID control, and the target value SP. Each sample data may be obtained by actually operating the control object 101, or may be obtained by a simulator. An approximation curve of the sample data may be calculated by linear regression such as the least squares method, or may be calculated by nonlinear regression such as polynomial approximation or Gaussian process regression.

図5は、サンプルデータの近似曲線を示す。図中の横軸(x軸)は目標値SP(または平衡点Oでの測定値PV)を示し、縦軸(y軸)は平衡点での制御パラメータPの値を示す。本図の例では、近似曲線はy=0.8165x-0.0002であってよく、目標値SPは基準目標値としての50から80に変更されてよい。この場合に、制御パラメータ取得部204は、目標値SPおよび基準目標値の差分である30と、予め設定された係数としての0.8165とを乗算して、シフト量Δpを24.495と決定してよい。これに代えて、制御パラメータ取得部204は、予め設定された関数式y=0.8165x-0.0002を用いて、目標値SPが基準目標値の50である場合の制御パラメータPの値を40.8248(=0.8165×50)、目標値SPが80である場合の制御パラメータPの値を65.3198(=0.8165×80)としてそれぞれ算出し、両者の差分からシフト量Δpを24.495と決定してもよい。なお、目標値SPが基準目標値である場合の制御パラメータPの値(本例では40.8248)は予め制御パラメータ取得部204に記憶されてもよい。 Figure 5 shows an approximation curve of sample data. The horizontal axis (x-axis) in the figure shows the target value SP (or the measurement value PV at the equilibrium point O), and the vertical axis (y-axis) shows the value of the control parameter P at the equilibrium point. In the example of this figure, the approximation curve may be y = 0.8165x - 0.0002, and the target value SP may be changed from 50 as the reference target value to 80. In this case, the control parameter acquisition unit 204 may multiply 30, which is the difference between the target value SP and the reference target value, by 0.8165, which is a preset coefficient, to determine the shift amount Δp as 24.495. Alternatively, the control parameter acquisition unit 204 may use a preset function formula y = 0.8165x - 0.0002 to calculate the value of the control parameter P as 40.8248 (= 0.8165 x 50) when the target value SP is the reference target value of 50, and the value of the control parameter P as 65.3198 (= 0.8165 x 80) when the target value SP is 80, and determine the shift amount Δp to be 24.495 from the difference between the two. Note that the value of the control parameter P when the target value SP is the reference target value (40.8248 in this example) may be stored in advance in the control parameter acquisition unit 204.

以上のような制御パラメータ取得部204を有する装置200によれば、目標値SPおよび基準目標値の差分と、予め設定された係数とを乗算してシフト量が決定されるので、変更後の目標値SPに合わせた高精度の推奨制御パラメータPrを取得することができる。 With the device 200 having the control parameter acquisition unit 204 described above, the shift amount is determined by multiplying the difference between the target value SP and the reference target value by a preset coefficient, so that a highly accurate recommended control parameter Pr can be obtained that matches the changed target value SP.

また、目標値SPに設定された値と、当該値に測定値PVが安定するときの制御パラメータPの値との関係を示す既定の関係式を用いてシフト量が決定されるので、関数式に目標値SPを入力することでシフト量を決定することができる。従って、変更後の目標値SPに合わせた高精度の推奨制御パラメータPrを容易に取得することができる。 In addition, since the shift amount is determined using a predefined relational equation that indicates the relationship between the value set for the target value SP and the value of the control parameter P when the measurement value PV stabilizes at that value, the shift amount can be determined by inputting the target value SP into the function equation. Therefore, it is possible to easily obtain a highly accurate recommended control parameter Pr that matches the changed target value SP.

<1.5.動作>
図6は、装置200の動作を示す。装置200は、ステップS11~S29の処理を行うことにより、制御対象101を制御してよい。なお、この動作は装置200が起動されることに応じて開始してよい。また、動作の開始時点においては変更量出力モデル2061の学習処理が完了していてよい。
<1.5. Operation>
6 shows the operation of the device 200. The device 200 may control the control target 101 by performing the processes of steps S11 to S29. Note that this operation is performed in response to the device 200 being started up. In addition, the learning process of the change amount output model 2061 may be completed at the start of the operation.

ステップS11において目標値取得部202は、制御対象101に関する状態の目標値SPを取得する。目標値取得部202は、予め設定された基準目標値を目標値SPとして取得してもよいし、基準目標値とは異なる値を目標値SPとして取得してもよい。ステップS11の処理が最初に実行される場合には、目標値取得部202は、基準目標値を目標値SPとして取得してよい。目標値取得部202は、基準目標値とは異なる値を目標値SPとして取得したことに応じて、設定された目標値SPを示す目標値変更信号を出力してよい。 In step S11, the target value acquisition unit 202 acquires a target value SP for the state related to the control object 101. The target value acquisition unit 202 may acquire a preset reference target value as the target value SP, or may acquire a value different from the reference target value as the target value SP. When the process of step S11 is executed for the first time, the target value acquisition unit 202 may acquire the reference target value as the target value SP. In response to acquiring a value different from the reference target value as the target value SP, the target value acquisition unit 202 may output a target value change signal indicating the set target value SP.

ステップS13において測定値取得部201は、制御対象101に関する状態の測定値PVを取得する。目標値取得部202は、設備100のセンサ102から測定値PVを取得してよい。 In step S13, the measurement value acquisition unit 201 acquires the measurement value PV of the state of the control object 101. The target value acquisition unit 202 may acquire the measurement value PV from the sensor 102 of the equipment 100.

ステップS15において偏差取得部203は、ステップS11で取得された目標値SPと、ステップS13で取得された測定値PVとの偏差を取得する。 In step S15, the deviation acquisition unit 203 acquires the deviation between the target value SP acquired in step S11 and the measurement value PV acquired in step S13.

ステップS17において制御パラメータ取得部204は、制御対象101に対して供給された制御パラメータPを取得する。制御パラメータ取得部204は、直近の制御周期において制御対象101に供給された制御パラメータPを制御部207から取得してよい。一例として、制御パラメータ取得部204は、後述のステップS27の処理で制御部207から制御対象101に出力される制御パラメータPを取得して一時保存しておき、ステップS17において当該制御パラメータPを読み出してよい。ステップS17が最初に実行される場合、つまりステップS27の処理が実行されていない場合には、制御パラメータ取得部204は、予め設定された制御パラメータPの初期値を取得してよい。 In step S17, the control parameter acquisition unit 204 acquires the control parameter P supplied to the control object 101. The control parameter acquisition unit 204 may acquire the control parameter P supplied to the control object 101 in the most recent control cycle from the control unit 207. As an example, the control parameter acquisition unit 204 may acquire and temporarily store the control parameter P output from the control unit 207 to the control object 101 in the processing of step S27 described below, and read out the control parameter P in step S17. When step S17 is executed for the first time, that is, when the processing of step S27 has not been executed, the control parameter acquisition unit 204 may acquire the initial value of the control parameter P that has been set in advance.

ステップS19において制御パラメータ取得部204は、ステップS11で取得された目標値SPが基準目標値であるか否かを判定する。制御パラメータ取得部204は、目標値取得部202から目標値変更信号を取得したか否かに基づいて判定を行ってよい。ステップS19において目標値SPが基準目標値であると判定された場合(ステップS19;Yes)にはステップS25に処理が移行してよい。ステップS19において目標値SPが基準目標値でないと判定された場合(ステップS19;No)にはステップS21に処理が移行してよい。 In step S19, the control parameter acquisition unit 204 determines whether the target value SP acquired in step S11 is a reference target value. The control parameter acquisition unit 204 may make this determination based on whether a target value change signal has been acquired from the target value acquisition unit 202. If it is determined in step S19 that the target value SP is the reference target value (step S19; Yes), the process may proceed to step S25. If it is determined in step S19 that the target value SP is not the reference target value (step S19; No), the process may proceed to step S21.

ステップS21において制御パラメータ取得部204は、制御パラメータPのシフト量Δpを決定する。制御パラメータ取得部204は、ステップS11で取得された目標値SPに応じてシフト量Δpを決定してよい。 In step S21, the control parameter acquisition unit 204 determines a shift amount Δp of the control parameter P. The control parameter acquisition unit 204 may determine the shift amount Δp according to the target value SP acquired in step S11.

ステップS23において、制御パラメータ取得部204は、ステップS17で取得された制御パラメータPを、決定されたシフト量Δpだけシフトさせてシフト済み制御パラメータP+Δpを取得する。 In step S23, the control parameter acquisition unit 204 shifts the control parameter P acquired in step S17 by the determined shift amount Δp to acquire the shifted control parameter P+Δp.

ステップS25において第1供給部205は、制御パラメータ取得部204から供給された制御パラメータPと、偏差取得部203から供給された偏差とを制御モデル206に供給する。第1供給部205は、ステップS19において目標値SPが基準目標値であると判定されている場合には、ステップS17で制御パラメータ取得部204により取得された制御パラメータPをそのまま制御モデル206に供給してよい。第1供給部205は、ステップS19において目標値SPが基準目標値でないと判定されている場合には、ステップS23でシフトされた制御パラメータP、つまりシフト済み制御パラメータP+Δpを制御モデル206に供給してよい。 In step S25, the first supply unit 205 supplies the control parameter P supplied from the control parameter acquisition unit 204 and the deviation supplied from the deviation acquisition unit 203 to the control model 206. If the target value SP is determined to be the reference target value in step S19, the first supply unit 205 may supply the control parameter P acquired by the control parameter acquisition unit 204 in step S17 to the control model 206 as is. If the target value SP is determined to not be the reference target value in step S19, the first supply unit 205 may supply the control parameter P shifted in step S23, i.e., the shifted control parameter P+Δp, to the control model 206.

これにより、入力された制御パラメータPおよび偏差に応じた推奨制御パラメータPrが制御モデル206から出力される。本実施形態では一例として、入力された制御パラメータPおよび偏差に応じた推奨変更量が変更量出力モデル2061から出力され、推奨変更量と、ステップS17で取得された制御パラメータPとが加算部2062により加算されて推奨制御パラメータPrが生成されてよい。 As a result, a recommended control parameter Pr corresponding to the input control parameter P and deviation is output from the control model 206. As an example in this embodiment, a recommended change amount corresponding to the input control parameter P and deviation is output from the change amount output model 2061, and the recommended change amount and the control parameter P acquired in step S17 are added by the adder 2062 to generate the recommended control parameter Pr.

ステップS27において制御部207は、制御モデル206からの推奨制御パラメータPrを出力する。制御部207は、推奨制御パラメータPrを制御パラメータPとして制御対象101に供給して、制御対象101を制御してよい。 In step S27, the control unit 207 outputs the recommended control parameters Pr from the control model 206. The control unit 207 may supply the recommended control parameters Pr to the control object 101 as control parameters P to control the control object 101.

ステップS29において目標値取得部202は、オペレータにより目標値SPが変更されるか否かを判定する。目標値SPが変更されないと判定された場合(ステップS29;No)にはステップS13に処理が移行してよい。目標値SPが変更されたと判定された場合(ステップS29;Yes)にはステップS11に処理が移行してよい。 In step S29, the target value acquisition unit 202 determines whether the target value SP is changed by the operator. If it is determined that the target value SP is not changed (step S29; No), the process may proceed to step S13. If it is determined that the target value SP is changed (step S29; Yes), the process may proceed to step S11.

<1.6.動作例>
図7は、目標値SPが変更される場合の測定値PVと、制御パラメータPとの推移を示す。図中の横軸は時間(秒)を示し、縦軸は測定値PVおよび制御パラメータPの値を示す。なお、本図では一例として制御パラメータPは、バルブの開度の指示値IVを示しており、測定値PVおよび制御パラメータPは0~100の範囲内に正規化されている。この図に示されるように、本実施形態に係る装置200では、目標値SPが変更される場合であっても、変更後の目標値SPに測定値PVが一致するよう制御対象101が制御される。
<1.6. Operation example>
7 shows the transition of the measurement value PV and the control parameter P when the target value SP is changed. The horizontal axis in the figure indicates time (seconds), and the vertical axis indicates the values of the measurement value PV and the control parameter P. Note that in this figure, as an example, the control parameter P indicates the indication value IV of the valve opening, and the measurement value PV and the control parameter P are normalized within the range of 0 to 100. As shown in this figure, in the device 200 according to this embodiment, even when the target value SP is changed, the controlled object 101 is controlled so that the measurement value PV coincides with the changed target value SP.

<2.第2実施形態>
<2.1.システム1A>
図8は、第2実施形態に係るシステム1Aを示す。なお、図1に示されたシステム1と略同一のものには同一の符号を付け、説明を省略する。システム1Aは装置200Aを備える。装置200Aは、偏差取得部203Aと、不安定状態検出部211Aと、第2供給部212Aと、シフト量出力モデル213Aと、制御パラメータ取得部204Aと、学習処理部214Aとを有してよい。
<2. Second embodiment>
<2.1. System 1A>
Fig. 8 shows a system 1A according to the second embodiment. Components that are substantially the same as those in the system 1 shown in Fig. 1 are given the same reference numerals, and descriptions thereof will be omitted. The system 1A includes an apparatus 200A. The apparatus 200A may include a deviation acquisition unit 203A, an unstable state detection unit 211A, a second supply unit 212A, a shift amount output model 213A, a control parameter acquisition unit 204A, and a learning processing unit 214A.

<2.1.1.偏差取得部203A>
偏差取得部203Aは、上述の第1実施形態における偏差取得部203と同様にして、制御対象101に関する状態の測定値PVおよび目標値SPの偏差を取得する。偏差取得部203Aは、取得した偏差の変化速度をさらに取得してよい。例えば、偏差取得部203Aは、偏差を取得するごとに、直近の2つの偏差の変化量を取得タイミングのインターバルで除算することで、偏差の変化速度を算出してよい。偏差取得部203Aは、取得した偏差を第1供給部205および不安定状態検出部211Aに供給してよい。偏差取得部203Aは、取得した偏差と、その変化速度とを第2供給部212Aに供給してよい。偏差取得部203Aは、取得した偏差と、その変化速度とを、図示しない記憶部に記憶させてよい。
<2.1.1. Deviation Acquisition Unit 203A>
The deviation acquisition unit 203A acquires the deviation between the measured value PV and the target value SP of the state of the control target 101 in the same manner as the deviation acquisition unit 203 in the first embodiment described above. For example, each time the deviation is acquired, the deviation acquisition unit 203A calculates the rate of change of the deviation by dividing the amount of change between the most recent two deviations by the interval between the acquisition timings. The deviation acquisition unit 203A may supply the acquired deviation to the first supply unit 205 and the unstable state detection unit 211A. The deviation acquisition section 203A may supply the deviation and the rate of change therein to the supply section 212A. The deviation acquisition section 203A may store the acquired deviation and the rate of change therein in a storage section (not shown).

<2.1.2.不安定状態検出部211A>
不安定状態検出部211Aは、第1検出部の一例であり、推奨制御パラメータPrにより制御対象101が制御された後に偏差取得部203Aにより取得される偏差が基準範囲内に安定しないことを検出する。基準範囲は0を中央に含む任意の大きさの範囲であってよい。偏差が基準範囲に安定しないとは、制御部207から制御対象101に制御パラメータPが出力されて第1の基準時間が経過した後に、第2の基準時間内の少なくとも一時点で偏差が基準範囲外となることであってよい。偏差が基準範囲内に安定しない状況は、設備100の外部環境の変化(外乱とも称する)によって生じてよい。不安定状態検出部211Aは、偏差が基準範囲内に安定しないことを検出したことに応じて、その旨を示す信号(不安定状態検出信号とも称する)を制御パラメータ取得部204Aに供給してよい。
<2.1.2. Unstable state detection unit 211A>
The unstable state detection unit 211A is an example of a first detection unit, and detects that the deviation acquired by the deviation acquisition unit 203A after the control target 101 is controlled by the recommended control parameter Pr is not stable within the reference range. The reference range may be a range of any size including 0 at the center. The deviation not being stable within the reference range may mean that the deviation is outside the reference range at least at one point within the second reference time after the control parameter P is output from the control unit 207 to the control target 101 and the first reference time has elapsed. The situation in which the deviation is not stable within the reference range may be caused by a change in the external environment of the equipment 100 (also referred to as a disturbance). In response to detecting that the deviation is not stable within the reference range, the unstable state detection unit 211A may supply a signal indicating that fact (also referred to as an unstable state detection signal) to the control parameter acquisition unit 204A.

<2.1.3.第2供給部212A>
第2供給部212Aは、シフト量出力モデル213Aに対し、偏差取得部203Aにより取得された偏差と、当該偏差の変化速度とを供給する。第2供給部212Aは、基準インターバルごとにシフト量出力モデル213Aに対する供給を行ってよい。基準インターバルは、制御部207による制御対象101の制御周期以上の長さであってよい。基準インターバルは制御対象101の時定数に応じた長さ(一例として時定数に整数を乗算した長さ)を有してよい。
<2.1.3. Second supply unit 212A>
The second supply unit 212A supplies the deviation acquired by the deviation acquisition unit 203A and the rate of change of the deviation to the shift amount output model 213A. The reference interval may be equal to or longer than the control period of the control target 101 by the control unit 207. The reference interval may be set to a length according to the time constant of the control target 101 (for example, the time The length of the byte may be a constant multiplied by an integer.

<2.1.4.シフト量出力モデル213A>
シフト量出力モデル213Aは、偏差および当該偏差の変化速度が入力されることに応じて、制御パラメータ取得部204により制御パラメータPについてシフトすることを推奨する推奨シフト量Δprを出力する。シフト量出力モデル213Aは、第2供給部212Aから偏差および変化速度が入力されることに応じて、制御パラメータ取得部204Aに推奨シフト量Δprを出力してよい。
<2.1.4. Shift amount output model 213A>
In response to input of the deviation and the rate of change of the deviation, the shift amount output model 213A outputs a recommended shift amount Δpr that recommends a shift of the control parameter P by the control parameter acquisition unit 204. In response to input of the deviation and the rate of change from the second supply unit 212A, the shift amount output model 213A may output the recommended shift amount Δpr to the control parameter acquisition unit 204A.

シフト量出力モデル213Aは、偏差および偏差の変化速度の組み合わせと、推奨シフト量Δprとの対応関係を示してよい。一例としてシフト量出力モデル213Aは、偏差および変化速度の組み合わせと、推奨シフト量Δprとの対応関係をマッピングしたシフト量マップであってよい。これに代えて、シフト量出力モデル213Aは、偏差および変化速度の組み合わせと、推奨シフト量Δprとを対応付けたテーブルであってもよい。シフト量出力モデル213Aは、学習処理部214Aによる学習処理によって生成されてよく、図示しない記憶部に記憶されていてよい。 The shift amount output model 213A may indicate the correspondence between the combination of the deviation and the rate of change of the deviation, and the recommended shift amount Δpr. As an example, the shift amount output model 213A may be a shift amount map that maps the correspondence between the combination of the deviation and the rate of change, and the recommended shift amount Δpr. Alternatively, the shift amount output model 213A may be a table that associates the combination of the deviation and the rate of change with the recommended shift amount Δpr. The shift amount output model 213A may be generated by a learning process by the learning processing unit 214A, and may be stored in a storage unit (not shown).

<2.1.5.制御パラメータ取得部204A>
制御パラメータ取得部204Aは、上記第1実施形態における制御パラメータ取得部204と同様にして、シフト済み制御パラメータP+Δpを取得する。
<2.1.5. Control parameter acquisition unit 204A>
The control parameter acquisition unit 204A acquires the shifted control parameter P+Δp in the same manner as the control parameter acquisition unit 204 in the first embodiment.

これに加えて、制御パラメータ取得部204Aは、偏差取得部203Aにより取得される偏差が基準範囲内に安定しないことが不安定状態検出部211Aにより検出されたことに応じて、制御対象101に対して供給された制御パラメータP(本実施形態では一例として制御部207から供給される制御パラメータP)をシフトさせて、シフト済み制御パラメータP+Δpを取得してよい。 In addition, in response to detection by the unstable state detection unit 211A that the deviation acquired by the deviation acquisition unit 203A is not stable within the reference range, the control parameter acquisition unit 204A may shift the control parameter P supplied to the control target 101 (the control parameter P supplied from the control unit 207 in this embodiment as an example) to acquire the shifted control parameter P+Δp.

制御パラメータ取得部204Aは、偏差取得部203Aにより取得される偏差が基準範囲内に安定しないことが不安定状態検出部211Aにより検出され、かつ、第2供給部212Aからシフト量出力モデル213Aに対する供給が行われたことに応じて当該シフト量出力モデル213Aから出力される推奨シフト量Δprだけ、制御対象101に対して供給された制御パラメータPをシフトさせてよい。 When the unstable state detection unit 211A detects that the deviation acquired by the deviation acquisition unit 203A is not stable within the reference range, and when a supply is made from the second supply unit 212A to the shift amount output model 213A, the control parameter acquisition unit 204A may shift the control parameter P supplied to the control object 101 by the recommended shift amount Δpr output from the shift amount output model 213A.

制御パラメータ取得部204Aは、取得したシフト済み制御パラメータP+Δpを第1供給部205に供給してよい。なお、本実施形態では一例として、制御パラメータ取得部204Aは、目標値SPが基準目標値であり、かつ、偏差が目標値SPに安定している場合には、制御部207から取得した制御パラメータPをシフトさせずに第1供給部205に供給することとして説明するが、当該制御パラメータPを0だけシフトさせたシフト済み制御パラメータP+Δpとして第1供給部205に供給してもよい。 The control parameter acquisition unit 204A may supply the acquired shifted control parameter P+Δp to the first supply unit 205. Note that, as an example in this embodiment, when the target value SP is a reference target value and the deviation is stable at the target value SP, the control parameter acquisition unit 204A supplies the control parameter P acquired from the control unit 207 to the first supply unit 205 without shifting it, but the control parameter P may be shifted by 0 to supply it to the first supply unit 205 as a shifted control parameter P+Δp.

<2.1.6.学習処理部214A>
学習処理部214Aは、第1学習処理部の一例であり、偏差取得部203Aにより取得される偏差と、当該偏差の変化速度と、制御パラメータ取得部204Aによる制御パラメータPのシフト量Δpとを含む学習データを用いてシフト量出力モデル213Aの学習処理を行う。学習データに含まれる偏差および変化速度は、目標値SPが基準目標値である場合に取得される偏差および変化速度であってよい。
<2.1.6. Learning processing unit 214A>
The learning processing unit 214A is an example of a first learning processing unit, and performs learning processing of the shift amount output model 213A using learning data including the deviation acquired by the deviation acquiring unit 203A, the rate of change of the deviation, and the shift amount Δp of the control parameter P acquired by the control parameter acquiring unit 204A. The deviation and the rate of change included in the learning data may be the deviation and the rate of change acquired when the target value SP is a reference target value.

学習データは、システム1のシミュレータ(図示せず)によって生成されてよく、設備100に対して人為的に任意の外乱を与えたシミュレーションにおいて偏差取得部203Aにより取得される偏差と、偏差の変化速度と、制御パラメータ取得部204Aによりシフトされる制御パラメータPのシフト量Δpとの組み合わせを含んでよい。シミュレータは、任意のシステム同定技術により設備100の実測データなどを用いて作成されてよい。シフト量出力モデル213Aの生成後には、学習データは、実際に設備100を運転して測定値PVが目標値SPに安定しない場合の偏差と、当該偏差の変化速度と、制御パラメータ取得部204Aによる制御パラメータPのシフト量Δpとを含んでよい。 The learning data may be generated by a simulator (not shown) of the system 1, and may include a combination of the deviation acquired by the deviation acquisition unit 203A in a simulation in which an arbitrary disturbance is artificially applied to the equipment 100, the rate of change of the deviation, and the shift amount Δp of the control parameter P shifted by the control parameter acquisition unit 204A. The simulator may be created using actual measurement data of the equipment 100 by any system identification technique. After the shift amount output model 213A is generated, the learning data may include the deviation when the measurement value PV does not stabilize at the target value SP when the equipment 100 is actually operated, the rate of change of the deviation, and the shift amount Δp of the control parameter P by the control parameter acquisition unit 204A.

学習処理部214Aは、偏差および当該偏差の変化速度の入力に応じ、報酬値を高めるために推奨される推奨シフト量Δprを出力するようシフト量出力モデル213Aの学習を行ってよい。推奨シフト量Δprは、所定の時点(一例として偏差および変化速度の取得時点)での制御対象101の状態に対応する報酬値(一例としてその時点の測定値PVに応じた値を報酬関数に入力して得られる報酬値)を基準報酬値とした場合に、当該基準報酬値よりも報酬値を高くするために推奨されるシフト量であってよい。一例として、学習処理部214Aは、カーネルダイナミックポリシープログラミング法のアルゴリズムにより学習を行ってよい。報酬値は、予め設定された報酬関数により定まる値であってよい。報酬関数は、偏差に基づく関数であってよく、一例として、偏差が小さいほど報酬値が大きくなる関数であってよい。なお、偏差取得部203Aにより複数の物理量のそれぞれについて偏差が取得される場合には、報酬関数は複数の偏差の総和に基づく関数であってもよいし、複数の偏差を重み付け加算した結果に基づく関数であってもよい。 The learning processing unit 214A may learn the shift amount output model 213A so as to output a recommended shift amount Δpr recommended for increasing the reward value in response to the input of the deviation and the change rate of the deviation. The recommended shift amount Δpr may be a shift amount recommended for increasing the reward value higher than the reference reward value when the reward value (for example, the reward value obtained by inputting a value corresponding to the measurement value PV at that time into the reward function) corresponding to the state of the control object 101 at a predetermined time point (for example, the time point at which the deviation and the change rate are acquired) is set as the reference reward value. As an example, the learning processing unit 214A may learn using an algorithm of the kernel dynamic policy programming method. The reward value may be a value determined by a preset reward function. The reward function may be a function based on the deviation, and as an example, a function in which the smaller the deviation, the larger the reward value. Note that, when the deviation acquisition unit 203A acquires deviations for each of the multiple physical quantities, the reward function may be a function based on the sum of the multiple deviations, or may be a function based on the result of weighted addition of the multiple deviations.

以上の装置200Aによれば、取得される偏差が目標値SPに安定しないことが検出されたことに応じて、制御対象101に対して供給された制御パラメータPがシフトされてシフト済み制御パラメータP+Δpが取得される。従って、単一の制御モデル206を用い、外乱の発生に応じた推奨制御パラメータPrを取得することができる。また、外乱の発生時にも推奨制御パラメータPrを取得することができるため、装置200Aのロバスト性を向上させることができる。 According to the above-described device 200A, in response to detection that the acquired deviation is not stable at the target value SP, the control parameter P supplied to the control object 101 is shifted to acquire the shifted control parameter P+Δp. Therefore, a single control model 206 can be used to acquire the recommended control parameter Pr in response to the occurrence of a disturbance. In addition, since the recommended control parameter Pr can be acquired even when a disturbance occurs, the robustness of the device 200A can be improved.

また、偏差と、当該偏差の変化速度とに応じてシフト量出力モデル213Aから出力される推奨シフト量Δprだけ制御パラメータPがシフトされる。従って、予めシフト量出力モデル213Aを生成しておくことにより、外乱が発生した場合の推奨制御パラメータPrを容易に取得することができる。 The control parameter P is shifted by the recommended shift amount Δpr output from the shift amount output model 213A according to the deviation and the rate of change of the deviation. Therefore, by generating the shift amount output model 213A in advance, the recommended control parameter Pr when a disturbance occurs can be easily obtained.

また、基準インターバルごとに偏差と、当該偏差の変化速度とがシフト量出力モデル213Aに供給されるので、外乱の状況に合わせてシフト量Δpを変更し、適切な推奨制御パラメータPrを取得することができる。 In addition, the deviation and the rate of change of the deviation are supplied to the shift amount output model 213A for each reference interval, so that the shift amount Δp can be changed according to the disturbance situation and an appropriate recommended control parameter Pr can be obtained.

また、偏差と、当該偏差の変化速度と、制御パラメータPのシフト量Δpとを含む学習データを用い、偏差および当該偏差の変化速度の入力に応じ既定の報酬関数により定まる報酬値を高めるために推奨される推奨シフト量Δprを出力するようシフト量出力モデル213Aの学習処理が行われる。従って、適切な推奨シフト量Δprをシフト量出力モデル213Aから確実に取得することができる。 In addition, using learning data including the deviation, the rate of change of the deviation, and the shift amount Δp of the control parameter P, the shift amount output model 213A performs a learning process to output a recommended shift amount Δpr that is recommended to increase the reward value determined by a default reward function in response to the input of the deviation and the rate of change of the deviation. Therefore, an appropriate recommended shift amount Δpr can be reliably obtained from the shift amount output model 213A.

<2.2.シフト量出力モデル213A>
図9は、シフト量出力モデル213Aの一例を示す。なお、図9において縦軸は偏差の変化速度を示し、横軸は偏差を示す。
2.2. Shift amount output model 213A
9 shows an example of the shift amount output model 213 A. In FIG. 9, the vertical axis indicates the rate of change of the deviation, and the horizontal axis indicates the deviation.

シフト量出力モデル213Aは、偏差および変化速度の組み合わせと、推奨シフト量との対応関係を示してよい。本例のシフト量出力モデル213Aは、偏差および制御パラメータPの組み合わせと、推奨シフト量Δprとの対応関係をマッピングしたシフト量マップであってよい。シフト量出力モデル213Aは、偏差と変化速度との組み合わせに応じて、それぞれ別々の推奨シフト量Δprに対応付けられた複数の領域に分けられてよく、入力される偏差および変化速度の組み合わせの座標位置に対応付けられた推奨シフト量Δprを出力してよい。 The shift amount output model 213A may indicate the correspondence between the combination of deviation and change rate and the recommended shift amount. In this example, the shift amount output model 213A may be a shift amount map that maps the correspondence between the combination of deviation and control parameter P and the recommended shift amount Δpr. The shift amount output model 213A may be divided into multiple regions that correspond to different recommended shift amounts Δpr according to the combination of deviation and change rate, and may output the recommended shift amount Δpr that corresponds to the coordinate position of the input combination of deviation and change rate.

なお、シフト量出力モデル213Aは、シフト量マップの全域に関する情報を含んでよい。これに代えて、シフト量出力モデル213Aは、各領域の境界を示す情報(一例として境界を示す座標や関数式)と、当該領域に対応する推奨シフト量Δprとのみを含んでもよい。この場合には、シフト量出力モデル213Aを記憶するための記憶領域を小さくすることができる。 The shift amount output model 213A may include information about the entire area of the shift amount map. Alternatively, the shift amount output model 213A may include only information indicating the boundaries of each area (for example, coordinates or a function indicating the boundaries) and the recommended shift amount Δpr corresponding to the area. In this case, the storage area for storing the shift amount output model 213A can be reduced.

図10は、シフト量出力モデル213Aの他の例を示す。この図に示すように、シフト量出力モデル213Aは、偏差および変化速度の組み合わせと、推奨シフト量Δprとを対応付けたテーブルであってもよい。 Figure 10 shows another example of the shift amount output model 213A. As shown in this figure, the shift amount output model 213A may be a table that associates combinations of deviation and rate of change with the recommended shift amount Δpr.

<2.3.動作>
図11は、装置200Aの動作を示す。装置200Aは、ステップS11~S45の処理を行うことにより、制御対象101を制御してよい。なお、この動作は装置200Aが起動されることに応じて開始してよい。また、動作の開始時点においては変更量出力モデル2061およびシフト量出力モデル213Aの学習処理が完了していてよい。第2実施形態に係る装置200Aの動作は、第1実施形態に係る装置200の動作と比較してステップS27,S29の間にステップS31~S45の処理を行う点で異なっている。
<2.3. Operation>
11 shows the operation of the device 200A. The device 200A may control the control target 101 by performing the processes of steps S11 to S45. Note that this operation is performed in response to the device 200A being started. At the start of the operation, the learning process of the change amount output model 2061 and the shift amount output model 213A may be completed. The operation of the device 200A according to the second embodiment may be performed in the same manner as in the first embodiment. 10. This differs from the operation of the apparatus 200 in that steps S31 to S45 are performed between steps S27 and S29.

ステップS31において測定値取得部201は、制御対象101に関する状態の測定値PVを取得する。目標値取得部202は、ステップS13と同様にして測定値PVを取得してよい。 In step S31, the measurement value acquisition unit 201 acquires the measurement value PV of the state of the control object 101. The target value acquisition unit 202 may acquire the measurement value PV in the same manner as in step S13.

ステップS33において偏差取得部203Aは、ステップS11で取得された目標値SPと、ステップS31で取得された測定値PVとの偏差を取得する。また、偏差取得部203Aは、取得した偏差の変化速度をさらに取得する。 In step S33, the deviation acquisition unit 203A acquires the deviation between the target value SP acquired in step S11 and the measurement value PV acquired in step S31. The deviation acquisition unit 203A further acquires the rate of change of the acquired deviation.

ステップS35において不安定状態検出部211Aは、偏差が基準範囲内に安定するか否かを判定する。不安定状態検出部211Aは、ステップS27の処理により制御部207から制御対象101に制御パラメータPが出力されて第1の基準時間が経過した後に、第2の基準時間内の少なくとも一時点で偏差が基準範囲外となったことに応じて、偏差が基準範囲内に安定しないことを検出し、その旨の判定を行ってよい。 In step S35, the unstable state detection unit 211A determines whether the deviation stabilizes within the reference range. After the control parameter P is output from the control unit 207 to the control object 101 by the processing of step S27 and the first reference time has elapsed, the unstable state detection unit 211A may detect that the deviation does not stabilize within the reference range in response to the deviation being outside the reference range at least at one point within the second reference time, and make a determination to that effect.

ステップS35において偏差が基準範囲内に安定すると判定された場合(ステップS35;Yes)にはステップS29に処理が移行してよい。ステップS35において偏差が基準範囲内に安定しないと判定された場合(ステップS35;No)には、ステップS37に処理が移行してよい。 If it is determined in step S35 that the deviation is stable within the reference range (step S35; Yes), the process may proceed to step S29. If it is determined in step S35 that the deviation is not stable within the reference range (step S35; No), the process may proceed to step S37.

ステップS37において制御パラメータ取得部204Aは、制御パラメータPのシフト量Δpを決定する。制御パラメータ取得部204Aは、ステップS33で取得された偏差および変化速度がシフト量出力モデル213Aに供給されることに応じて当該シフト量出力モデル213Aから出力される推奨シフト量Δprをシフト量Δpとして決定してよい。 In step S37, the control parameter acquisition unit 204A determines a shift amount Δp of the control parameter P. In response to the deviation and rate of change acquired in step S33 being supplied to the shift amount output model 213A, the control parameter acquisition unit 204A may determine the recommended shift amount Δpr output from the shift amount output model 213A as the shift amount Δp.

ステップS39において制御パラメータ取得部204Aは、制御対象101に対して供給された制御パラメータPを取得する。制御パラメータ取得部204Aは、直近の制御周期において制御対象101に供給された制御パラメータPを制御部207Aから取得してよい。一例として、制御パラメータ取得部204Aは、ステップS27および後述のステップS45のうち、直近に実行された処理で制御部207から制御対象101に出力される制御パラメータPを取得して一時保存しておき、ステップS39において読み出してよい。 In step S39, the control parameter acquisition unit 204A acquires the control parameters P supplied to the control object 101. The control parameter acquisition unit 204A may acquire the control parameters P supplied to the control object 101 in the most recent control cycle from the control unit 207A. As an example, the control parameter acquisition unit 204A may acquire and temporarily store the control parameters P output from the control unit 207 to the control object 101 in the most recently executed process of step S27 or step S45 described below, and read them out in step S39.

ステップS41において制御パラメータ取得部204Aは、ステップS39で取得された制御パラメータPを、ステップS37で決定されたシフト量Δpだけシフトさせてシフト済み制御パラメータP+Δpを取得する。 In step S41, the control parameter acquisition unit 204A shifts the control parameter P acquired in step S39 by the shift amount Δp determined in step S37 to acquire the shifted control parameter P+Δp.

ステップS43において第1供給部205は、ステップS41で取得されたシフト済み制御パラメータP+Δpと、ステップS33で取得された偏差とを制御モデル206に供給する。 In step S43, the first supply unit 205 supplies the shifted control parameter P+Δp obtained in step S41 and the deviation obtained in step S33 to the control model 206.

ステップS45において制御部207は、制御モデル206からの推奨制御パラメータPrを出力する。制御部207は、推奨制御パラメータPrを制御パラメータPとして制御対象101に供給して、制御対象101を制御してよい。ステップS45の処理が完了したら、ステップS31に処理が移行してよい。 In step S45, the control unit 207 outputs the recommended control parameters Pr from the control model 206. The control unit 207 may supply the recommended control parameters Pr to the control object 101 as control parameters P to control the control object 101. When the processing of step S45 is completed, the processing may proceed to step S31.

<2.4.動作例>
図12は、外乱が生じる場合の測定値PVと、制御パラメータPとの推移を示す。図中の横軸は時間(秒)を示し、縦軸は測定値PVおよび制御パラメータPの値を示す。なお、本図では一例として制御パラメータPは、バルブの開度の指示値IVを示しており、測定値PVおよび制御パラメータPは0~100の範囲内に正規化されている。この図に示されるように、本実施形態に係る装置200Aでは、外乱が生じる場合であっても、目標値SPに測定値PVが一致するよう制御対象101が制御される。
<2.4. Operation example>
12 shows the transition of the measurement value PV and the control parameter P when a disturbance occurs. The horizontal axis in the figure indicates time (seconds), and the vertical axis indicates the values of the measurement value PV and the control parameter P. Note that in this figure, as an example, the control parameter P indicates the indication value IV of the valve opening, and the measurement value PV and the control parameter P are normalized within the range of 0 to 100. As shown in this figure, in the device 200A according to this embodiment, even when a disturbance occurs, the controlled object 101 is controlled so that the measurement value PV coincides with the target value SP.

<3.第3実施形態>
<3.1.システム1B>
図13は、第3実施形態に係るシステム1Bを示す。なお、図1,図2に示されたシステム1,1Aと略同一のものには同一の符号を付け、説明を省略する。システム1Bは装置200Bを備える。本実施形態に係る装置200Bは、制御対象101を変更可能となっている。変更前後の制御対象101は、互いにプロセス動特性が近似してよく、それぞれ1次遅れ系であってもよいし、それぞれ2次遅れ系であってもよい。別言すれば、変更前後の制御対象101は、入出力の関係を示す伝達関数の分母の次数が等しくてよい。装置200Bは、対象情報取得部221Bと、制御部207Bと、制御パラメータ取得部204Bとを有してよい。
<3. Third embodiment>
<3.1. System 1B>
FIG. 13 shows a system 1B according to the third embodiment. The same reference numerals are used for the parts that are substantially the same as those in the systems 1 and 1A shown in FIG. 1 and FIG. 2, and the description thereof is omitted. The system 1B includes an apparatus 200B. The apparatus 200B according to this embodiment is capable of changing the controlled object 101. The controlled object 101 before and after the change may have similar process dynamic characteristics, and may be a first-order lag system or a second-order lag system. In other words, the controlled object 101 before and after the change may have the same order of the denominator of the transfer function indicating the relationship between the input and output. The apparatus 200B may include an object information acquisition unit 221B, a control unit 207B, and a control parameter acquisition unit 204B.

<3.1.1.対象情報取得部221B>
対象情報取得部221Bは、第2検出部の一例であり、制御対象101が変更されたことを検出する。対象情報取得部221Bは、制御対象101が変更されるごとに、変更後の制御対象101の識別情報をオペレータから取得することにより、制御対象101が変更されたことを検出してよい。対象情報取得部221Bは、制御対象101が変更されたことに応じて、変更後の制御対象101の識別情報を示す信号(制御対象変更信号とも称する)を制御部207Bおよび制御パラメータ取得部204Bに供給してよい。
<3.1.1. Target information acquisition unit 221B>
The target information acquisition unit 221B is an example of a second detection unit, and detects that the control target 101 has been changed. The target information acquisition unit 221B may detect that the control target 101 has been changed by acquiring identification information of the changed control target 101 from the operator every time the control target 101 is changed. In response to the change in the control target 101, the target information acquisition unit 221B may supply a signal indicating the identification information of the changed control target 101 (also referred to as a control target change signal) to the control unit 207B and the control parameter acquisition unit 204B.

<3.1.2.制御部207B>
制御部207Bは、上記第1実施形態における制御部207Bと同様にして、第1供給部205から制御モデル206に対する供給が行われたことに応じて当該制御モデル206から出力される推奨制御パラメータPrを制御パラメータPとして出力する。制御部207Bは、対象情報取得部221Bから制御対象変更信号を受信したことに応じて、変更後の制御対象101に制御パラメータPを出力して、変更後の制御対象101を制御してよい。
<3.1.2. Control unit 207B>
Similar to the control unit 207B in the first embodiment, in response to a supply from the first supply unit 205 to the control model 206, the control unit 207B outputs the recommended control parameters Pr output from the control model 206 as control parameters P. In response to receiving a control target change signal from the target information acquisition unit 221B, the control unit 207B may output the control parameters P to the changed control target 101 to control the changed control target 101.

<3.1.3.制御パラメータ取得部204B>
制御パラメータ取得部204Bは、上記第2実施形態における制御パラメータ取得部204Aと同様にして、シフト済み制御パラメータP+Δpを取得する。
<3.1.3. Control parameter acquisition unit 204B>
The control parameter acquisition unit 204B acquires the shifted control parameter P+Δp in the same manner as the control parameter acquisition unit 204A in the second embodiment.

これに加えて、制御パラメータ取得部204Bは、制御対象101が変更されたことが対象情報取得部221Bにより検出されたことに応じて、制御対象101に対して供給された制御パラメータP(本実施形態では一例として制御部207から供給される制御パラメータP)をシフトさせてシフト済み制御パラメータP+Δpを取得してよい。制御対象101に対して供給された制御パラメータPは、変更前の制御対象101に対して供給された制御パラメータPであってもよいし、変更後の制御対象101に対して供給された制御パラメータPであってもよい。 In addition, in response to detection by the target information acquisition unit 221B that the control target 101 has been changed, the control parameter acquisition unit 204B may shift the control parameter P supplied to the control target 101 (the control parameter P supplied from the control unit 207 as an example in this embodiment) to acquire a shifted control parameter P+Δp. The control parameter P supplied to the control target 101 may be the control parameter P supplied to the control target 101 before the change, or may be the control parameter P supplied to the control target 101 after the change.

制御対象101が変更された場合に、制御パラメータ取得部204Bは、変更前後の各制御対象101の平衡点での制御パラメータPの値の差分に基づいてシフト量Δpを決定してよい。 When the control object 101 is changed, the control parameter acquisition unit 204B may determine the shift amount Δp based on the difference between the values of the control parameter P at the equilibrium point of each control object 101 before and after the change.

例えば、制御パラメータ取得部204Bは、予め目標値SPを基準目標値に設定して変更前後の制御対象101をそれぞれ用いた場合に取得された平衡点Oでの制御パラメータPの値の差分を、シフト量Δpとして決定してよい。この場合には、制御パラメータ取得部204Bは、制御対象101ごとに、目標値SPを基準目標値に設定した場合の平衡点Oでの制御パラメータPの値を予め記憶してよい。 For example, the control parameter acquisition unit 204B may determine, as the shift amount Δp, the difference between the values of the control parameter P at the equilibrium point O acquired when the target value SP is set to a reference target value in advance and the control object 101 before and after the change are used. In this case, the control parameter acquisition unit 204B may store in advance, for each control object 101, the value of the control parameter P at the equilibrium point O when the target value SP is set to a reference target value.

これに代えて、制御パラメータ取得部204Bは、予め目標値SPを現在の設定値と同じ値に設定して変更前後の制御対象101をそれぞれ用いた場合に取得された平衡点Oでの制御パラメータPの値の差分を、シフト量Δpとして決定してよい。この場合には、制御パラメータ取得部204Bは、制御対象101ごとに、目標値SPと、平衡点Oでの制御パラメータPとの関係を示す関係式を予め記憶してよく、現在の目標値SPに対応する平衡点での制御パラメータPの値を当該関数式から算出してよい。 Alternatively, the control parameter acquisition unit 204B may determine, as the shift amount Δp, the difference between the values of the control parameter P at the equilibrium point O acquired when the target value SP is set in advance to the same value as the current setting value and the control object 101 before and after the change are used. In this case, the control parameter acquisition unit 204B may store in advance, for each control object 101, a relational expression showing the relationship between the target value SP and the control parameter P at the equilibrium point O, and may calculate the value of the control parameter P at the equilibrium point corresponding to the current target value SP from the function expression.

制御パラメータ取得部204Bは、上述のステップS19において目標値SPが基準目標値であり、かつ、制御対象101が変更されたことに応じて、変更前後の各制御対象101の平衡点での制御パラメータPの値の差分に基づいてシフト量Δpを決定し、シフト済み制御パラメータP+Δpを第1供給部205に供給してよい。制御対象101が変更された後、目標値SPが基準目標値から変更される場合には、制御パラメータ取得部204Bは、変更後の制御対象101について目標値SPと平衡点Oでの制御パラメータPの値との関係を示す上述の関係式を用いてシフト量Δpを決定してよい。 In the above-mentioned step S19, when the target value SP is the reference target value and the control object 101 has been changed, the control parameter acquisition unit 204B may determine a shift amount Δp based on the difference between the values of the control parameter P at the equilibrium point of each control object 101 before and after the change, and supply the shifted control parameter P+Δp to the first supply unit 205. When the target value SP is changed from the reference target value after the control object 101 is changed, the control parameter acquisition unit 204B may determine the shift amount Δp using the above-mentioned relational expression showing the relationship between the target value SP and the value of the control parameter P at the equilibrium point O for the changed control object 101.

なお、本実施形態では一例として、制御パラメータ取得部204Bは、目標値SPが基準目標値であり、偏差が目標値SPに安定しており、かつ、制御対象101が変更されない場合には、制御部207から取得した制御パラメータPをシフトさせずに第1供給部205に供給してよい。これに代えて、制御パラメータ取得部204は、当該制御パラメータPを0だけシフトさせたシフト済み制御パラメータP+Δpとして第1供給部205に供給してもよい。 In this embodiment, as an example, when the target value SP is a reference target value, the deviation is stable at the target value SP, and the control target 101 is not changed, the control parameter acquisition unit 204B may supply the control parameter P acquired from the control unit 207 to the first supply unit 205 without shifting it. Alternatively, the control parameter acquisition unit 204 may supply the control parameter P to the first supply unit 205 as a shifted control parameter P+Δp, which is obtained by shifting the control parameter P by 0.

以上の装置200Bによれば、制御対象101が変更されたことに応じて、制御対象101に対して供給された制御パラメータPがシフトされてシフト済み制御パラメータP+Δpが取得される。従って、単一の制御モデル206を用い、制御対象101の変更に応じた推奨制御パラメータPrを取得することができるため、制御対象101ごとに別々の制御モデルを用いる場合と比較して、装置200Bの汎用性を高め、装置200Bを小型化することができる。 According to the above-described device 200B, in response to a change in the control object 101, the control parameter P supplied to the control object 101 is shifted to obtain the shifted control parameter P+Δp. Therefore, since a single control model 206 can be used to obtain the recommended control parameter Pr in response to a change in the control object 101, the versatility of the device 200B can be improved and the device 200B can be made smaller than when a separate control model is used for each control object 101.

また、制御モデル206では、偏差と、制御対象101に供給済みの制御パラメータPとに応じて当該制御パラメータPの推奨変更量Δprが変更量出力モデル2061から出力され、当該供給済みの制御パラメータPと、当該推奨変更量Δprとが加算されて推奨制御パラメータPrが算出される。従って、制御パラメータPをシフト済み制御パラメータP+ΔPとして制御モデル206に入力することで制御モデル206を他の制御対象101に流用する場合であっても、供給済みの制御パラメータPをベースとした推奨制御パラメータPrを取得することができる。よって、制御対象101ごとのプロセスゲインの違いによらず、変更後の制御対象101に適合した適切な推奨制御パラメータPrを取得することができる。 In the control model 206, the recommended change amount Δpr of the control parameter P is output from the change amount output model 2061 according to the deviation and the control parameter P already supplied to the control object 101, and the recommended change amount Δpr is added to the already supplied control parameter P to calculate the recommended control parameter Pr. Therefore, even if the control model 206 is used for another control object 101 by inputting the control parameter P to the control model 206 as the shifted control parameter P+ΔP, it is possible to obtain a recommended control parameter Pr based on the already supplied control parameter P. Therefore, regardless of the difference in process gain for each control object 101, it is possible to obtain an appropriate recommended control parameter Pr that is suitable for the changed control object 101.

<3.変形例>
なお、上記の第1~第3実施形態においては、制御モデル206が変更量出力モデル2061と加算部2062とを有することとして説明したが、偏差および制御パラメータPが入力されることに応じて推奨制御パラメータPrを出力する限りにおいて、これらを有しなくてもよい。この場合には、制御モデル206は、カーネルダイナミックポリシープログラミング法や深層強化学習、サポートベクトルマシン、ロジスティック回帰、決定木、ニューラルネットワークなどのアルゴリズムにより生成された学習モデルであってよい。学習処理部208は、偏差取得部203により取得された偏差と、制御パラメータ取得部204により取得された制御パラメータPと、を含む学習データを用いて制御モデル206の学習処理を行ってよい。
3. Modifications
In the above first to third embodiments, the control model 206 has been described as having the change amount output model 2061 and the adder 2062, but as long as the recommended control parameter Pr is output in response to the input of the deviation and the control parameter P, the control model 206 may not have these. In this case, the control model 206 may be a learning model generated by an algorithm such as a kernel dynamic policy programming method, deep reinforcement learning, a support vector machine, a logistic regression, a decision tree, or a neural network. The learning processing unit 208 may perform learning processing of the control model 206 using learning data including the deviation acquired by the deviation acquisition unit 203 and the control parameter P acquired by the control parameter acquisition unit 204.

また、変更量出力モデル2061およびシフト量出力モデル213Aをカーネルダイナミックポリシープログラミング法の学習アルゴリズムにより生成されたマップやテーブルとして説明したが、深層強化学習やサポートベクトルマシン、ロジスティック回帰、決定木、ニューラルネットワークなどの他のアルゴリズムにより生成されてもよいし、マップやテーブルとは異なる他の形態のモデルであってもよい。 In addition, the change amount output model 2061 and the shift amount output model 213A have been described as maps and tables generated by the learning algorithm of the kernel dynamic policy programming method, but they may be generated by other algorithms such as deep reinforcement learning, support vector machines, logistic regression, decision trees, and neural networks, or may be models of other forms different from maps and tables.

また、変更量出力モデル2061には偏差および制御パラメータPが入力されることとして説明したが、他の値がさらに入力されてよい。同様に、シフト量出力モデル213Aには偏差および変化速度が入力されることとして説明したが、他の値がさらに入力されてよい。他の値は、例えばセンサ102による測定値の微分値や積分値であってよい。 Furthermore, although it has been described that the deviation and the control parameter P are input to the change amount output model 2061, other values may also be input. Similarly, although it has been described that the deviation and the rate of change are input to the shift amount output model 213A, other values may also be input. The other values may be, for example, the differential value or integral value of the measurement value by the sensor 102.

また、装置200,200A,200Bが測定値取得部201、目標値取得部202、学習処理部208を有することとして説明したが、これらの何れかを有しなくてもよい。装置200,200A,200Bが測定値取得部201および目標値取得部202を有しない場合には、偏差取得部203,203Aは外部機器で算出された偏差を取得してよい。装置200,200A,200Bが学習処理部208を有しない場合には、予め外部機器で学習された変更量出力モデル2061を有してよい。 In addition, although the devices 200, 200A, and 200B have been described as having a measurement value acquisition unit 201, a target value acquisition unit 202, and a learning processing unit 208, they may not have any of these. If the devices 200, 200A, and 200B do not have the measurement value acquisition unit 201 and the target value acquisition unit 202, the deviation acquisition units 203 and 203A may acquire a deviation calculated by an external device. If the devices 200, 200A, and 200B do not have the learning processing unit 208, they may have a change amount output model 2061 that has been learned in advance by an external device.

また、制御パラメータ取得部204,204A,204Bはシフト済み制御パラメータP+Δpを算出して取得することとして説明したが、装置200,200A,200Bの外部で算出されたシフト済み制御パラメータP+Δpを取得してもよい。 In addition, although the control parameter acquisition units 204, 204A, and 204B have been described as calculating and acquiring the shifted control parameter P+Δp, the shifted control parameter P+Δp calculated outside the devices 200, 200A, and 200B may be acquired.

また、上記の第2,第3実施形態においては装置200A,200Bが学習処理部214Aを有することとして説明したが、学習処理部214Aを有しないこととしてもよい。この場合には、装置200A,200Bは予め外部機器で学習されたシフト量出力モデル213Aを有してよい。 In addition, in the second and third embodiments, the devices 200A and 200B are described as having the learning processing unit 214A, but they may not have the learning processing unit 214A. In this case, the devices 200A and 200B may have a shift amount output model 213A that has been trained in advance by an external device.

また、上記の第2実施形態においては、制御パラメータ取得部204は目標値SPが基準目標値から変更される場合と、偏差が基準範囲内に安定しない場合とに制御パラメータPをシフトさせることとして説明したが、目標値SPが基準目標値から変更される場合に制御パラメータPをシフトさせなくてもよい。 In the second embodiment described above, the control parameter acquisition unit 204 shifts the control parameter P when the target value SP is changed from the reference target value and when the deviation is not stabilized within the reference range. However, it is not necessary to shift the control parameter P when the target value SP is changed from the reference target value.

同様に、上記の第3実施形態においては、制御パラメータ取得部204は目標値SPが基準目標値から変更される場合と、偏差が基準範囲内に安定しない場合と、制御対象101が変更された場合とに制御パラメータPをシフトさせることとして説明したが、目標値SPが基準目標値から変更される場合と、偏差が基準範囲内に安定しない場合との少なくとも一方で制御パラメータPをシフトさせなくてもよい。 Similarly, in the above third embodiment, the control parameter acquisition unit 204 has been described as shifting the control parameter P when the target value SP is changed from the reference target value, when the deviation is not stabilized within the reference range, and when the control target 101 is changed, but it is not necessary to shift the control parameter P when at least one of the cases is when the target value SP is changed from the reference target value and when the deviation is not stabilized within the reference range.

また、本発明の様々な実施形態は、フローチャートおよびブロック図を参照して記載されてよく、ここにおいてブロックは、(1)操作が実行されるプロセスの段階または(2)操作を実行する役割を持つ装置のセクションを表わしてよい。特定の段階およびセクションが、専用回路、コンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、および/またはコンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタルおよび/またはアナログハードウェア回路を含んでよく、集積回路(IC)および/またはディスクリート回路を含んでよい。プログラマブル回路は、論理AND、論理OR、論理XOR、論理NAND、論理NOR、および他の論理操作、フリップフロップ、レジスタ、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルロジックアレイ(PLA)等のようなメモリ要素等を含む、再構成可能なハードウェア回路を含んでよい。 Various embodiments of the present invention may also be described with reference to flow charts and block diagrams, where the blocks may represent (1) stages of a process in which operations are performed or (2) sections of an apparatus responsible for performing the operations. Particular stages and sections may be implemented by dedicated circuitry, programmable circuitry provided with computer readable instructions stored on a computer readable medium, and/or a processor provided with computer readable instructions stored on a computer readable medium. Dedicated circuitry may include digital and/or analog hardware circuitry and may include integrated circuits (ICs) and/or discrete circuits. Programmable circuitry may include reconfigurable hardware circuitry including logical AND, logical OR, logical XOR, logical NAND, logical NOR, and other logical operations, memory elements such as flip-flops, registers, field programmable gate arrays (FPGAs), programmable logic arrays (PLAs), and the like.

コンピュータ可読媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読媒体は、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(RTM)ディスク、メモリスティック、集積回路カード等が含まれてよい。 A computer-readable medium may include any tangible device capable of storing instructions that are executed by a suitable device, such that the computer-readable medium having instructions stored thereon comprises an article of manufacture that includes instructions that can be executed to create means for performing the operations specified in the flowchart or block diagram. Examples of computer-readable media may include electronic storage media, magnetic storage media, optical storage media, electromagnetic storage media, semiconductor storage media, and the like. More specific examples of computer-readable media may include floppy disks, diskettes, hard disks, random access memories (RAMs), read-only memories (ROMs), erasable programmable read-only memories (EPROMs or flash memories), electrically erasable programmable read-only memories (EEPROMs), static random access memories (SRAMs), compact disk read-only memories (CD-ROMs), digital versatile disks (DVDs), Blu-ray (RTM) disks, memory sticks, integrated circuit cards, and the like.

コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1または複数のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかを含んでよい。 The computer readable instructions may include either assembler instructions, instruction set architecture (ISA) instructions, machine instructions, machine-dependent instructions, microcode, firmware instructions, state setting data, or source or object code written in any combination of one or more programming languages, including object-oriented programming languages such as Smalltalk®, JAVA®, C++, etc., and conventional procedural programming languages such as the "C" programming language or similar programming languages.

コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサまたはプログラマブル回路に対し、ローカルにまたはローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して提供され、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく、コンピュータ可読命令を実行してよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。 The computer-readable instructions may be provided to a processor or programmable circuit of a general-purpose computer, special-purpose computer, or other programmable data processing apparatus, either locally or over a wide area network (WAN) such as a local area network (LAN), the Internet, etc., to execute the computer-readable instructions to create means for performing the operations specified in the flowcharts or block diagrams. Examples of processors include computer processors, processing units, microprocessors, digital signal processors, controllers, microcontrollers, etc.

図14は、本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ2200の例を示す。コンピュータ2200にインストールされたプログラムは、コンピュータ2200に、本発明の実施形態に係る装置に関連付けられる操作または当該装置の1または複数のセクションとして機能させることができ、または当該操作または当該1または複数のセクションを実行させることができ、および/またはコンピュータ2200に、本発明の実施形態に係るプロセスまたは当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ2200に、本明細書に記載のフローチャートおよびブロック図のブロックのうちのいくつかまたはすべてに関連付けられた特定の操作を実行させるべく、CPU2212によって実行されてよい。 14 shows an example of a computer 2200 in which aspects of the present invention may be embodied in whole or in part. A program installed on the computer 2200 may cause the computer 2200 to function as or perform operations associated with an apparatus or one or more sections of the apparatus according to an embodiment of the present invention, and/or to perform a process or steps of the process according to an embodiment of the present invention. Such a program may be executed by the CPU 2212 to cause the computer 2200 to perform certain operations associated with some or all of the blocks of the flowcharts and block diagrams described herein.

本実施形態によるコンピュータ2200は、CPU2212、RAM2214、グラフィックコントローラ2216、およびディスプレイデバイス2218を含み、それらはホストコントローラ2210によって相互に接続されている。コンピュータ2200はまた、通信インタフェース2222、ハードディスクドライブ2224、DVD-ROMドライブ2226、およびICカードドライブのような入/出力ユニットを含み、それらは入/出力コントローラ2220を介してホストコントローラ2210に接続されている。コンピュータはまた、ROM2230およびキーボード2242のようなレガシの入/出力ユニットを含み、それらは入/出力チップ2240を介して入/出力コントローラ2220に接続されている。 The computer 2200 according to this embodiment includes a CPU 2212, a RAM 2214, a graphics controller 2216, and a display device 2218, which are interconnected by a host controller 2210. The computer 2200 also includes input/output units such as a communication interface 2222, a hard disk drive 2224, a DVD-ROM drive 2226, and an IC card drive, which are connected to the host controller 2210 via an input/output controller 2220. The computer also includes legacy input/output units such as a ROM 2230 and a keyboard 2242, which are connected to the input/output controller 2220 via an input/output chip 2240.

CPU2212は、ROM2230およびRAM2214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ2216は、RAM2214内に提供されるフレームバッファ等またはそれ自体の中にCPU2212によって生成されたイメージデータを取得し、イメージデータがディスプレイデバイス2218上に表示されるようにする。 The CPU 2212 operates according to the programs stored in the ROM 2230 and the RAM 2214, thereby controlling each unit. The graphics controller 2216 retrieves image data generated by the CPU 2212 into a frame buffer or the like provided in the RAM 2214 or into itself, and causes the image data to be displayed on the display device 2218.

通信インタフェース2222は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ2224は、コンピュータ2200内のCPU2212によって使用されるプログラムおよびデータを格納する。DVD-ROMドライブ2226は、プログラムまたはデータをDVD-ROM2201から読み取り、ハードディスクドライブ2224にRAM2214を介してプログラムまたはデータを提供する。ICカードドライブは、プログラムおよびデータをICカードから読み取り、および/またはプログラムおよびデータをICカードに書き込む。 The communication interface 2222 communicates with other electronic devices via a network. The hard disk drive 2224 stores programs and data used by the CPU 2212 in the computer 2200. The DVD-ROM drive 2226 reads programs or data from the DVD-ROM 2201 and provides the programs or data to the hard disk drive 2224 via the RAM 2214. The IC card drive reads programs and data from an IC card and/or writes programs and data to an IC card.

ROM2230はその中に、アクティブ化時にコンピュータ2200によって実行されるブートプログラム等、および/またはコンピュータ2200のハードウェアに依存するプログラムを格納する。入/出力チップ2240はまた、様々な入/出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入/出力コントローラ2220に接続してよい。 ROM 2230 stores therein a boot program, etc., executed by computer 2200 upon activation, and/or a program that depends on the hardware of computer 2200. I/O chip 2240 may also connect various I/O units to I/O controller 2220 via a parallel port, a serial port, a keyboard port, a mouse port, etc.

プログラムが、DVD-ROM2201またはICカードのようなコンピュータ可読媒体によって提供される。プログラムは、コンピュータ可読媒体から読み取られ、コンピュータ可読媒体の例でもあるハードディスクドライブ2224、RAM2214、またはROM2230にインストールされ、CPU2212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ2200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置または方法が、コンピュータ2200の使用に従い情報の操作または処理を実現することによって構成されてよい。 The programs are provided by a computer-readable medium such as a DVD-ROM 2201 or an IC card. The programs are read from the computer-readable medium, installed in the hard disk drive 2224, RAM 2214, or ROM 2230, which are also examples of computer-readable media, and executed by the CPU 2212. The information processing described in these programs is read by the computer 2200, and brings about cooperation between the programs and the various types of hardware resources described above. An apparatus or method may be constructed by realizing the manipulation or processing of information according to the use of the computer 2200.

例えば、通信がコンピュータ2200および外部デバイス間で実行される場合、CPU2212は、RAM2214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース2222に対し、通信処理を命令してよい。通信インタフェース2222は、CPU2212の制御下、RAM2214、ハードディスクドライブ2224、DVD-ROM2201、またはICカードのような記録媒体内に提供される送信バッファ処理領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、またはネットワークから受信された受信データを記録媒体上に提供される受信バッファ処理領域等に書き込む。 For example, when communication is performed between computer 2200 and an external device, CPU 2212 may execute a communication program loaded into RAM 2214 and instruct communication interface 2222 to perform communication processing based on the processing described in the communication program. Under the control of CPU 2212, communication interface 2222 reads transmission data stored in a transmission buffer processing area provided in RAM 2214, hard disk drive 2224, DVD-ROM 2201, or a recording medium such as an IC card, and transmits the read transmission data to the network, or writes reception data received from the network to a reception buffer processing area or the like provided on the recording medium.

また、CPU2212は、ハードディスクドライブ2224、DVD-ROMドライブ2226(DVD-ROM2201)、ICカード等のような外部記録媒体に格納されたファイルまたはデータベースの全部または必要な部分がRAM2214に読み取られるようにし、RAM2214上のデータに対し様々なタイプの処理を実行してよい。CPU2212は次に、処理されたデータを外部記録媒体にライトバックする。 The CPU 2212 may also cause all or a necessary portion of a file or database stored on an external recording medium such as the hard disk drive 2224, the DVD-ROM drive 2226 (DVD-ROM 2201), an IC card, etc. to be read into the RAM 2214, and perform various types of processing on the data on the RAM 2214. The CPU 2212 then writes back the processed data to the external recording medium.

様々なタイプのプログラム、データ、テーブル、およびデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU2212は、RAM2214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプの操作、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM2214に対しライトバックする。また、CPU2212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU2212は、第1の属性の属性値が指定される、条件に一致するエントリを当該複数のエントリの中から検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。 Various types of information, such as various types of programs, data, tables, and databases, may be stored in the recording medium and may undergo information processing. CPU 2212 may perform various types of processing on data read from RAM 2214, including various types of operations, information processing, conditional judgment, conditional branching, unconditional branching, information search/replacement, etc., as described throughout this disclosure and specified by the instruction sequence of the program, and write back the results to RAM 2214. CPU 2212 may also search for information in a file, database, etc. in the recording medium. For example, if multiple entries each having an attribute value of a first attribute associated with an attribute value of a second attribute are stored in the recording medium, CPU 2212 may search for an entry that matches a condition in which an attribute value of the first attribute is specified from among the multiple entries, read the attribute value of the second attribute stored in the entry, and thereby obtain the attribute value of the second attribute associated with the first attribute that satisfies a predetermined condition.

上で説明したプログラムまたはソフトウェアモジュールは、コンピュータ2200上またはコンピュータ2200近傍のコンピュータ可読媒体に格納されてよい。また、専用通信ネットワークまたはインターネットに接続されたサーバーシステム内に提供されるハードディスクまたはRAMのような記録媒体が、コンピュータ可読媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ2200に提供する。 The above-described program or software module may be stored on a computer-readable medium on the computer 2200 or in the vicinity of the computer 2200. Also, a recording medium such as a hard disk or RAM provided in a server system connected to a dedicated communication network or the Internet can be used as a computer-readable medium, thereby providing the program to the computer 2200 via the network.

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。 The present invention has been described above using an embodiment, but the technical scope of the present invention is not limited to the scope described in the above embodiment. It is clear to those skilled in the art that various modifications and improvements can be made to the above embodiment. It is clear from the claims that forms with such modifications or improvements can also be included in the technical scope of the present invention.

特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。 The order of execution of each process, such as operations, procedures, steps, and stages, in the devices, systems, programs, and methods shown in the claims, specifications, and drawings is not specifically stated as "before" or "prior to," and it should be noted that the processes may be performed in any order, unless the output of a previous process is used in a later process. Even if the operational flow in the claims, specifications, and drawings is explained using "first," "next," etc. for convenience, it does not mean that it is necessary to perform the processes in this order.

1 システム
100 設備
101 制御対象
102 センサ
200 装置
201 測定値取得部
202 目標値取得部
203 偏差取得部
204 制御パラメータ取得部
205 第1供給部
206 制御モデル
207 制御部
208 学習処理部
211 不安定状態検出部
212 第2供給部
213 シフト量出力モデル
214 学習処理部
221 対象情報取得部
2061 変更量出力モデル
2062 加算部
2200 コンピュータ
2201 DVD-ROM
2210 ホストコントローラ
2212 CPU
2214 RAM
2216 グラフィックコントローラ
2218 ディスプレイデバイス
2220 入/出力コントローラ
2222 通信インタフェース
2224 ハードディスクドライブ
2226 DVD-ROMドライブ
2230 ROM
2240 入/出力チップ
2242 キーボード
REFERENCE SIGNS LIST 1 System 100 Equipment 101 Control target 102 Sensor 200 Device 201 Measurement value acquisition unit 202 Target value acquisition unit 203 Deviation acquisition unit 204 Control parameter acquisition unit 205 First supply unit 206 Control model 207 Control unit 208 Learning processing unit 211 Unstable state detection unit 212 Second supply unit 213 Shift amount output model 214 Learning processing unit 221 Target information acquisition unit 2061 Change amount output model 2062 Addition unit 2200 Computer 2201 DVD-ROM
2210 host controller 2212 CPU
2214 RAM
2216 Graphic controller 2218 Display device 2220 Input/output controller 2222 Communication interface 2224 Hard disk drive 2226 DVD-ROM drive 2230 ROM
2240 Input/Output Chip 2242 Keyboard

Claims (14)

制御対象に関する状態の測定値および目標値の偏差を取得する偏差取得部と、
前記制御対象に対して供給された制御パラメータをシフトさせたシフト済み制御パラメータを取得する制御パラメータ取得部と、
偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記偏差取得部により取得された偏差と、前記制御パラメータ取得部により取得された前記シフト済み制御パラメータとを供給する第1供給部と、
前記第1供給部から前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力部と、
を備える装置。
a deviation acquisition unit for acquiring a deviation between a measured value of a state of a control object and a target value;
a control parameter acquisition unit that acquires shifted control parameters by shifting the control parameters supplied to the control target;
a first supply unit that supplies the deviation acquired by the deviation acquisition unit and the shifted control parameter acquired by the control parameter acquisition unit to a control model that outputs a recommended control parameter to be recommended to be supplied to the controlled object in response to an input of the deviation and the control parameter;
an output unit that outputs the recommended control parameters output from the control model in response to the supply from the first supply unit to the control model;
An apparatus comprising:
前記状態の目標値を取得する目標値取得部をさらに備え、
前記制御パラメータ取得部は、前記目標値が基準目標値から変更されたことに応じて、前記制御対象に対して供給された制御パラメータをシフトさせて、前記シフト済み制御パラメータを取得する、請求項1に記載の装置。
A target value acquisition unit that acquires a target value of the state,
The device according to claim 1 , wherein the control parameter acquisition unit shifts the control parameters supplied to the controlled object in response to the target value being changed from a reference target value, and acquires the shifted control parameters.
前記制御パラメータ取得部は、前記目標値が基準目標値から変更されたことに応じて、前記制御対象に対して供給された制御パラメータを、前記目標値に応じたシフト量だけシフトさせて、前記シフト済み制御パラメータを取得する、請求項2に記載の装置。 The device according to claim 2, wherein the control parameter acquisition unit, in response to the target value being changed from the reference target value, shifts the control parameters supplied to the control target by a shift amount corresponding to the target value, and acquires the shifted control parameters. 前記制御パラメータ取得部は、前記目標値および前記基準目標値の差分と、予め設定された係数とを乗算して前記シフト量を決定する、請求項3に記載の装置。 The device according to claim 3, wherein the control parameter acquisition unit determines the shift amount by multiplying the difference between the target value and the reference target value by a preset coefficient. 前記制御パラメータ取得部は、前記目標値に設定された値と、当該値に前記測定値が安定するときの制御パラメータの値との関係を示す、予め設定された関係式を用いて前記シフト量を決定する、請求項3に記載の装置。 The device according to claim 3, wherein the control parameter acquisition unit determines the shift amount using a pre-set relational expression that indicates the relationship between a value set for the target value and the value of the control parameter when the measured value stabilizes at that value. 前記推奨制御パラメータにより前記制御対象が制御された後に前記偏差取得部により取得される偏差が基準範囲内に安定しないことを検出する第1検出部をさらに備え、
前記制御パラメータ取得部は、前記偏差取得部により取得される偏差が前記基準範囲内に安定しないことが前記第1検出部により検出されたことに応じて、前記制御対象に対して供給された前記制御パラメータをシフトさせて、前記シフト済み制御パラメータを取得する、請求項1~3の何れか一項に記載の装置。
a first detection unit that detects that the deviation acquired by the deviation acquisition unit is not stable within a reference range after the control target is controlled by the recommended control parameters,
The device according to any one of claims 1 to 3, wherein the control parameter acquisition unit shifts the control parameter supplied to the controlled object in response to detection by the first detection unit that the deviation acquired by the deviation acquisition unit is not stable within the reference range, and acquires the shifted control parameter.
偏差および当該偏差の変化速度が入力されることに応じて、前記制御パラメータ取得部により制御パラメータについてシフトすることを推奨する推奨シフト量を出力するシフト量出力モデルに対し、前記偏差取得部により取得された偏差と、当該偏差の変化速度とを供給する第2供給部をさらに備え、
前記制御パラメータ取得部は、前記偏差取得部により取得される偏差が前記基準範囲内に安定しないことが前記第1検出部により検出され、かつ、前記第2供給部から前記シフト量出力モデルに対する供給が行われたことに応じて当該シフト量出力モデルから出力される前記推奨シフト量だけ、前記制御対象に対して供給された制御パラメータをシフトさせて、前記シフト済み制御パラメータを取得する、請求項6に記載の装置。
a second supply unit that supplies the deviation acquired by the deviation acquisition unit and the change rate of the deviation to a shift amount output model that outputs a recommended shift amount that recommends a shift of the control parameter by the control parameter acquisition unit in response to input of the deviation and the change rate of the deviation,
7. The device according to claim 6, wherein the control parameter acquisition unit shifts the control parameters supplied to the controlled object by the recommended shift amount output from the shift amount output model in response to the first detection unit detecting that the deviation acquired by the deviation acquisition unit is not stable within the reference range and the second supply unit supplying the shift amount to the shift amount output model, thereby acquiring the shifted control parameters.
前記第2供給部は、基準インターバルごとに前記シフト量出力モデルに対する供給を行う、請求項7に記載の装置。 The device according to claim 7, wherein the second supply unit supplies the shift amount output model for each reference interval. 前記偏差取得部により取得される偏差と、当該偏差の変化速度と、前記制御パラメータ取得部による前記制御パラメータのシフト量とを含む学習データを用い、偏差および当該偏差の変化速度の入力に応じ、予め設定された報酬関数により定まる報酬値を高めるために推奨される前記推奨シフト量を出力するよう前記シフト量出力モデルの学習処理を行う第1学習処理部をさらに備える、請求項7に記載の装置。 The device according to claim 7, further comprising a first learning processing unit that performs learning processing of the shift amount output model using learning data including the deviation acquired by the deviation acquisition unit, the rate of change of the deviation, and the shift amount of the control parameter acquired by the control parameter acquisition unit, so as to output the recommended shift amount recommended to increase a reward value determined by a preset reward function in response to input of the deviation and the rate of change of the deviation. 前記制御対象が変更されたことを検出する第2検出部をさらに備え、
前記制御パラメータ取得部は、前記制御対象が変更されたことが前記第2検出部により検出されたことに応じて、前記制御対象に対して供給された制御パラメータをシフトさせて、前記シフト済み制御パラメータを取得する、請求項1に記載の装置。
A second detection unit that detects that the control target has been changed,
The device according to claim 1 , wherein the control parameter acquisition unit shifts the control parameters supplied to the control object in response to detection by the second detection unit that the control object has been changed, and acquires the shifted control parameters.
前記制御モデルは、
偏差および制御パラメータが入力されることに応じて、当該制御パラメータについて変更することを推奨する推奨変更量を出力する変更量出力モデルと、
前記制御対象に供給された前記制御パラメータと、前記変更量出力モデルから出力される前記推奨変更量とを加算して前記推奨制御パラメータを算出する加算部と、
を有する、請求項1に記載の装置。
The control model is
a change amount output model that outputs a recommended change amount that recommends a change to the control parameter in response to input of the deviation and the control parameter;
an adder that calculates the recommended control parameter by adding the control parameter supplied to the controlled object and the recommended change amount output from the change amount output model;
The apparatus of claim 1 , further comprising:
前記偏差取得部により取得される偏差と、前記制御パラメータ取得部により取得される制御パラメータと、を含む学習データを用い、偏差および制御パラメータの入力に応じ、予め設定された報酬関数により定まる報酬値を高めるために推奨される前記推奨変更量を出力するよう前記変更量出力モデルの学習処理を行う第2学習処理部をさらに備える、請求項11に記載の装置。 The device according to claim 11, further comprising a second learning processing unit that performs learning processing of the change amount output model using learning data including the deviation acquired by the deviation acquisition unit and the control parameters acquired by the control parameter acquisition unit, so as to output the recommended change amount recommended for increasing a reward value determined by a preset reward function in response to input of the deviation and the control parameters. 制御対象に関する状態の測定値および目標値の偏差を取得する偏差取得段階と、
前記制御対象に対して供給された制御パラメータをシフトさせたシフト済み制御パラメータを取得する制御パラメータ取得段階と、
偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記偏差取得段階により取得された偏差と、前記制御パラメータ取得段階により取得された前記シフト済み制御パラメータとを供給する第1供給段階と、
前記第1供給段階により前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力段階と、
を備える方法。
A deviation acquisition step of acquiring a deviation between a measured value of a state of a control object and a target value;
a control parameter acquisition step of acquiring shifted control parameters by shifting the control parameters supplied to the control object;
a first supply step of supplying the deviation acquired in the deviation acquisition step and the shifted control parameter acquired in the control parameter acquisition step to a control model that outputs a recommended control parameter to be recommended to be supplied to the controlled object in response to an input of the deviation and the control parameter;
an output step of outputting the recommended control parameters output from the control model in response to the supply to the control model by the first supply step;
A method for providing the above.
コンピュータを、
制御対象に関する状態の測定値および目標値の偏差を取得する偏差取得部と、
前記制御対象に対して供給された制御パラメータをシフトさせたシフト済み制御パラメータを取得する制御パラメータ取得部と、
偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記偏差取得部により取得された偏差と、前記制御パラメータ取得部により取得された前記シフト済み制御パラメータとを供給する第1供給部と、
前記第1供給部から前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力部
として機能させるプログラム。
Computer,
a deviation acquisition unit for acquiring a deviation between a measured value of a state of a control object and a target value;
a control parameter acquisition unit that acquires shifted control parameters by shifting the control parameters supplied to the control target;
a first supply unit that supplies the deviation acquired by the deviation acquisition unit and the shifted control parameter acquired by the control parameter acquisition unit to a control model that outputs a recommended control parameter to be recommended to be supplied to the controlled object in response to an input of the deviation and the control parameter;
an output unit that outputs the recommended control parameters output from the control model in response to the supply from the first supply unit to the control model.
JP2022177854A 2022-11-07 2022-11-07 Apparatus, method and program Pending JP2024067631A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022177854A JP2024067631A (en) 2022-11-07 2022-11-07 Apparatus, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022177854A JP2024067631A (en) 2022-11-07 2022-11-07 Apparatus, method and program

Publications (1)

Publication Number Publication Date
JP2024067631A true JP2024067631A (en) 2024-05-17

Family

ID=91068448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022177854A Pending JP2024067631A (en) 2022-11-07 2022-11-07 Apparatus, method and program

Country Status (1)

Country Link
JP (1) JP2024067631A (en)

Similar Documents

Publication Publication Date Title
US11119451B2 (en) Apparatus, method, program, and recording medium
US20210157280A1 (en) Apparatus, method and storage medium
CN113205187A (en) Learning device, learning method, computer-readable medium, determination device, determination method, and computer-readable medium
EP3904987B1 (en) Control support apparatus, control support method, control support program, computer readable medium with control support program recorded thereon and control system
US20220307944A1 (en) Apparatus, method, and computer-readable medium
JP2024067631A (en) Apparatus, method and program
US20230126776A1 (en) Apparatus, method, and computer readable medium
WO2024101351A1 (en) Device, method, and program
US20220291671A1 (en) Control apparatus, control method and recording medium having recorded thereon control program
US20220042829A1 (en) Data management system, data management method, and recording medium recording data management program
CN115705038A (en) Learning device, learning method, recording medium, and control device
JP7359178B2 (en) Control device, control method, and control program
US20230350875A1 (en) Data processing apparatus, data processing method, and recording medium
US20220317636A1 (en) Learning processing apparatus, control apparatus, learning processing method, control method, non-transitory computer-readable medium having learning program recorded thereon, and non-transitory computer-readable medium having control program recorded thereon
US20230384744A1 (en) Remote-control apparatus, local-control apparatus, learning processing apparatus, method, and recording medium
US20230305501A1 (en) Model verification apparatus, model verification method, and non-transitory computer readable medium
US20220284158A1 (en) Determination apparatus, determination method, and recording medium having recorded thereon determination program
US20230409928A1 (en) Estimation apparatus, estimation method, and non-transitory computer-readable medium
EP4216092A1 (en) Apparatus, method, and program
EP4283412A1 (en) Model selection apparatus, model selection method, and model selection program
KR20230067360A (en) Apparatus for anomaly detection based on clustering and method therefor
CN116957098A (en) Control device, control method, and non-transitory computer readable medium
JP2016091403A (en) Analyzer, analysis method, and program