WO2023007596A1 - 制御装置 - Google Patents

制御装置 Download PDF

Info

Publication number
WO2023007596A1
WO2023007596A1 PCT/JP2021/027811 JP2021027811W WO2023007596A1 WO 2023007596 A1 WO2023007596 A1 WO 2023007596A1 JP 2021027811 W JP2021027811 W JP 2021027811W WO 2023007596 A1 WO2023007596 A1 WO 2023007596A1
Authority
WO
WIPO (PCT)
Prior art keywords
output
difference
controller
controlled object
input
Prior art date
Application number
PCT/JP2021/027811
Other languages
English (en)
French (fr)
Inventor
勝敏 井▲崎▼
誠司 橋本
Original Assignee
理化工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 理化工業株式会社 filed Critical 理化工業株式会社
Priority to PCT/JP2021/027811 priority Critical patent/WO2023007596A1/ja
Publication of WO2023007596A1 publication Critical patent/WO2023007596A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators

Definitions

  • Patent Literature 1 discloses a control method focusing on the slow mode.
  • dead time compensation is performed for the slowest mode at multiple points, and output information without delay is extracted from the compensation result.
  • the extracted output information is given as a target value for another mode (faster mode), and a feedforward structure is used to quickly follow the target value to reduce the temperature difference and control the average temperature.
  • Patent Document 2 PID control is performed by assuming an ideal first-order lag model by canceling out the interference term by ⁇ ' and by canceling out the dynamic characteristics of the object by the inverse characteristics of the object (inverse characteristics of the temperature difference model). A structure is disclosed.
  • the multi-point temperature control methods described in Patent Documents 1 and 2 are all control methods focused on making the temperature difference between multiple points zero, and do not always take dead time into account. It does not focus on performance improvement for improved transient performance. As a result, it is not possible to actively improve both the temperature difference between multiple points and the transient characteristics with respect to the average temperature.
  • one object of the present invention is to construct a control system for a multi-input/output controlled object that solves the above problems. It is another object of the present invention to provide a control apparatus having a neural network learning ability for a dead time system without being affected by the dead time and improving transient characteristics with respect to command inputs.
  • a pre-designed feedback controller that includes a dead-time element and has a plurality of inputs including a first input and a second input and a plurality of outputs including a first output and a second output.
  • the learning controller that learns so that the first difference and the second difference become equal to or less than a minimum or a predetermined threshold value due to changes in the output from A controller is provided comprising:
  • control system controls, for example, a multi-input/output controlled object including a dead time element.
  • a multi-input/output controlled object including a dead time element.
  • an object to be controlled with two inputs and two outputs will be described as an example, but the object to be controlled may have N inputs and M outputs (where N and M are integers of 2 or more).
  • the output signal u12 of the neural network controller for the error e12 is applied to the first input u1 with a negative sign (or with a positive sign on the second input u2, or, for example, with a negative sign and a positive sign on u1 and u2, respectively). ) may be added (configuration examples 3-1 to 3-3).
  • FIG. 1 is a block diagram of a configuration example 1 of a control system according to this embodiment.
  • the control system according to this embodiment includes a control device 1 that controls a controlled object 2 .
  • the control device 1 has a feedback controller 10, a reference model section 20, a neural network controller 30, a difference section (differentiators 41 and 42), and an addition section (adders 12-1 and 12-2). .
  • the feedback controller 10 operates, for example, as a main controller.
  • the feedback controller 10 is a controller for operating the output of the controlled object 2 according to a desired design when it is assumed that there is no modeling error and no disturbance.
  • a PID controller that can be automatically designed by autotuning or the like can be used.
  • the feedback controller 10 can be an I-PD controller that suppresses the amount of overshoot, and the rise to the target value can be improved by the neural network controller 30 .
  • the dead time of the reference model unit 20 may be within a range of plus or minus 10%, or may be within a range of plus or minus 30%, with respect to the dead time of the controlled object 2 .
  • An error er1 between the output of the reference model unit 20 and the first output y1 of the controlled object 2 and an error er2 between the output of the reference model unit 20 and the second output y2 of the controlled object 2 are obtained by the neural network controller 30. is given as a teacher signal to
  • a neural network has an input, an output, and one or more intermediate layers.
  • the middle layer consists of multiple nodes.
  • An appropriate configuration can be used for the configuration of the neural network, and a known learning method can be used for the learning method of the neural network.
  • the difference unit includes a differentiator 41 for obtaining the difference (first difference) er1 between the output y1 of the controlled object 2 and the output of the reference model unit 20, and the difference between the output y2 of the controlled object 2 and the output of the reference model unit 20. and a differentiator 42 for obtaining (second difference) er2.
  • the reference model unit 20 and the neural network controller 30 may be implemented by a digital device having a processing unit such as a CPU (Central Processing Unit) and a DSP (Digital Signal Processor), and a storage unit such as a memory.
  • the processing unit and storage unit of the reference model unit 20 and the neural network controller 30 may use a common processing unit and storage unit, or may use separate processing units and storage units.
  • the neural network controller 30 may have a plurality of processing units and execute at least some of the processing in parallel.
  • a controller that can be designed using autotuning can be used as the feedback controller 10 . Therefore, when designing the feedback controller 10, a model of the controlled object 2 is unnecessary. In addition, since a model of the controlled object 2 is not required for designing the neural network controller 30 as well, a model is not required for designing each controller of the control device 1 .
  • the control system of this embodiment learns so that the output of the controlled object 2 follows the output of the reference model unit 20 .
  • the reference model unit 20 With a dead time, it is possible to prevent the neural network controller 30 from starting learning using the neural network in a state where there is no output from the controlled object 2 (that is, when causality is To establish).
  • the neural network controller 30 it is possible to avoid the problem that learning precedes the dead time. Therefore, there is no need to delay the learning of the neural network by the dead time, and there is no need to intentionally increase the learning cycle. This avoids the phenomenon that the neural network controller 30 gives excessive control input in an attempt to increase the output of the controlled object 2 .
  • the role of the feedback controller 10 is mainly to operate so as to satisfy the nominal specifications at the time of design.
  • the feedback controller 10 operates so as to satisfy the specifications as a control device (controller) in the control system, the operation specifications of the PID, and the like.
  • the role of the neural network controller 30 is to operate so that the output of the controlled object 2 follows the output of the reference model section 20 after learning.
  • neural network controller 30 compensates for modeling errors and disturbances when they occur. If such an error or disturbance occurs, an error will occur between the output of the controlled object 2 and the output of the reference model unit 20, and the neural network controller 30 operates based on this error, thereby causing a modeling error and disturbance. to compensate.
  • FIG. 2 is a block diagram of configuration example 2 of the control system according to the present embodiment.
  • Configuration example 2 is, for example, a configuration that directly minimizes the error between multipoint outputs.
  • the multipoint output error (e12) is also added to the teacher signal, and the minimization of its squared error is also directly considered in the learning of the neural network controller 30.
  • the inputs (yd, y1, y2) of the neural network controller 30 are the same as in configuration example 1, but one teacher signal is added to configuration example 1, resulting in (er1, er2, e12).
  • the output of the neural network controller 30 also has three outputs accordingly, but since the feedback controller 10 has two outputs, only the corresponding outputs (uN1, uN2) are used.
  • the differentiator further includes a differentiator 43 .
  • the differentiator 43 obtains an error e12 between the outputs y1 and y2 of the controlled object, and gives the error e12 to the neural network controller 30 as a teacher signal.
  • Other configurations are the same as in configuration example 1. FIG.
  • Configuration Example 3 uses the output uN3 for the multi-point output error e12 of the neural network controller 30.
  • the output signal u12 corresponding to the multipoint output error e12 is added with a negative sign to the output of the feedback controller 10-1, and is used as the first input u1 to be controlled (configuration example 3-1: FIG. 3).
  • the output signal u12 corresponding to the multipoint output error e12 is added with a positive sign to the output of the feedback controller 10-2 and used as the second input u2 to be controlled (configuration example 3-2: FIG. 4).
  • the output signal u12 corresponding to the multi-point output error e12 is added in halves to the output of the feedback controller 10-1 with a negative sign as the first input u1 to be controlled, and the feedback controller 10-2 is added with a positive sign to be the second input u2 to be controlled (configuration example 3-3: FIG. 5).
  • the output signal u12 may be divided at a predetermined ratio and added instead of being added in halves.
  • a distribution unit that distributes the output signal u12 at a predetermined ratio may be further provided. With such a configuration, it is possible to further minimize the error signal.
  • FIG. 6 is a block diagram of Modification 1 of the control system according to the present embodiment.
  • the output limiter limits or sets the output of the neural network controller 30 to zero when the learning of the neural network controller 30 is not good or the control performance is not improved. Even in this case, the initial basic performance is guaranteed by the feedback controller 10 .
  • the control system in Modification 1 further includes an output limiter 50 .
  • FIG. 6 shows an example in which an output limiter 50 is provided for configuration example 2 shown in FIG. Note that the output limiter 50 may be provided in the configuration example 1 shown in FIG. Other configurations are the same as in configuration example 1.
  • FIG. 6 shows an example in which an output limiter 50 is provided for configuration example 2 shown in FIG. Note that the output limiter 50 may be provided in the configuration example 1 shown in FIG. Other configurations are the same as in configuration example 1.
  • FIG. 6 shows an example in which an output limiter 50 is provided for configuration example 2 shown in FIG. Note that the output limiter 50 may be provided in the configuration example 1 shown in FIG. Other configurations are the same as in configuration example 1.
  • the output limitation unit 50 may limit the output of the neural network controller 30.
  • the output of neural network controller 30 may be limited so that it does not exceed a predetermined limit value.
  • the output limiter 50 may multiply the output of the neural network controller 30 by a predetermined coefficient (0.0 to 1.0) and output the result.
  • the neural network controller 30 You may make it restrict
  • FIG. 7 is a block of Modification 2 of the control system according to this embodiment.
  • FIG. 7 shows an example in which an output limiter 50 is provided for the configuration example 3-1 shown in FIG. Note that the output limiting unit 50 may be provided in the configuration example 3-2 shown in FIG. 4 or the configuration example 3-3 shown in FIG.
  • the output signal u12 of the neural network controller 30 is also input to the output limiter 50.
  • the operation of the output limiter 50 and other configurations are the same as in the first modification.
  • the control device of this embodiment also has the following effects. ⁇ Since the configuration follows the output of the reference model unit 20, even if the learning of the neural network progresses due to the setting and adjustment of the reference model unit 20, the control input is unlikely to become excessive. In other words, the input of the controlled object 2 can be adjusted indirectly.
  • the design of the neural network controller 30 does not require a model of the controlled object.
  • the feedback controller 10 designed by auto-tuning can be used, the control system can be designed without a model.
  • the feedback control system can be maintained without shifting to a feedforward structure. For example, when the error between the output of the reference model unit 20 and the output of the controlled object 2 is zero, it is equivalent to only the feedback controller 10 operating.
  • the I-PD structure in the feedback controller 10 it is possible to improve only the responsiveness without overshooting due to the learning progress of the neural network.
  • the output of the controlled object 2 rises slowly immediately after the start of control, but can be controlled to improve the rise as learning progresses while suppressing the amount of overshoot.
  • the present embodiment is configured, for example, to cause the output of the controlled object with multiple outputs to follow the output of the reference model including the dead time.
  • the dead time of the reference model can be the largest dead time of the controlled object.
  • This embodiment is configured, for example, to add the output of a controller by a neural network (NN) to the output of a feedback (FB) controller.
  • the design of the feedback controller can be automatically adjusted by autotuning, and the design of the neural network controller does not require a model of the controlled object.
  • the target is that the response of the controlled object matches the response of the reference model, so that the control input does not become excessive even if the learning progresses. In other words, the input of the controlled object can be adjusted indirectly.
  • the division of roles between the feedback controller and the neural network controller is clear.
  • the basic performance of feedback control is mainly guaranteed by the feedback controller, and the compensation of the error with the reference model, disturbance, and modeling error is mainly guaranteed by the neural network controller. If the learning of the neural network controller is not good or the control performance does not improve, the initial basic performance is guaranteed by the feedback controller even if the output of the neural network controller is limited or set to zero.
  • the rise is sacrificed immediately after the start of control, but the amount of overshoot is suppressed, and the rise is improved as learning progresses. Control is possible.
  • control system of this embodiment learns so that the multiple outputs follow the output of the reference model, in addition to improving the characteristics of the transient state, output equalization control at multiple points (multiple outputs), that is, reducing the output temperature difference is possible.
  • a model reference type multi-input/output control system using both a neural network-based controller and a feedback controller can be realized.
  • the characteristics of the temperature outputs can be improved so that the temperature outputs follow the target value through learning as time elapses, along with the uniformity of the temperature outputs of the multiple points.
  • Simulation results and effects of a control system using the control device 1 of this embodiment will be described in comparison with a comparative example.
  • the simulation results for a two-input, two-output dead-time system are shown below.
  • the control target between each input and output (including the interference term) is set to first-order delay + dead time.
  • the ratio (LT ratio) between the dead time and the time constant of the first output (ch1) is 1:13, and the LT ratio of the second output (ch2) is 1:16.
  • the target value was a square wave signal at a temperature of 100-105 degrees.
  • the step response for the I-PD control system is shown in FIG.
  • the upper part shows the response waveform when the target value is changed in the positive direction (change from 100 to 105 degrees), and the lower part shows the response waveform in the negative direction (change from 105 to 100 degrees).
  • the output of the reference model unit 20 is indicated by a dashed line
  • the first output y1 of the controlled object 2 is indicated by a solid line
  • the second output y2 of the controlled object 2 is indicated by a dashed line.
  • the horizontal axis is time and the vertical axis is temperature.
  • the horizontal axis, vertical axis and line type are the same in subsequent similar drawings.
  • FIG. 9 shows the temperature difference between outputs (y1-y2) when the target value is changed in the positive direction.
  • the horizontal axis is time and the vertical axis is temperature difference.
  • the horizontal and vertical axes are the same in subsequent similar drawings.
  • FIG. 13 shows the output temperature difference in the I-PD control system, configuration example 1 (NN: 2TS) and configuration example 2 (NN: 3TS) as a reference. From the figure, it can be confirmed that by adding the temperature difference to the teacher signal, the temperature difference at the time of applying the step command can also be reduced compared to other control systems.
  • Table 1 compares the maximum error of y1-y2 after learning for each control structure and the sum of squared errors in one step.
  • the temperature difference between the multi-outputs is minimized (equalized). ) know that it can be done. Furthermore, it can be seen that the temperature difference can be minimized more effectively by adding the temperature difference itself to the teacher signal.
  • the difference between each output and the output of the teacher model section may be used as the teacher signal.
  • the difference between the output and the output of the teacher model section may be used as the teacher signal.
  • the error signal e12 in Configuration Example 2 error signals of all combinations of three or more outputs may be used as teacher signals.
  • an error signal for an arbitrary combination of multiple outputs among three or more outputs may be used as the teacher signal.
  • the first output y1 may be used as a reference output, and error signals between the reference output and other outputs may be used as teacher signals.
  • one or more of the outputs for the error signal are added in the same manner as in configuration example 3. , may be added to either output of the corresponding feedback controller with a negative sign or a positive sign, or may be added in halves with a negative sign or a positive sign.
  • the neural network controller 30 learns using a neural network, but may learn using functions other than the neural network. That is, neural network controller 30 may be a learning controller. Further, it is possible to provide a second control device having a configuration in which the feedback controller 10 is not included in the control device 1 .
  • the above-described control system may be configured by applying a control device having the reference model unit 20 and the neural network controller 30 to a control system that controls a controlled object using an existing feedback controller designed in advance. good.
  • Each configuration and processing described above can also be realized by a computer having a processing unit and a storage unit.
  • the processing unit executes processing of each configuration.
  • the storage unit stores programs executed by the processing unit.
  • the above-described processing can also be implemented as a control method executed by the processing unit. Further, it can be realized by a program or a program medium containing instructions for causing the processing unit to execute the above-described processes, a computer-readable recording medium storing the program, a non-temporary recording medium, or the like.
  • control device and control system of this embodiment can be applied, for example, to a control system that controls a controlled object with multiple inputs and outputs and dead time.
  • a control system that controls a controlled object with multiple inputs and outputs and dead time.
  • it can be applied to a process control system or a temperature control system. More specific examples include temperature control/air conditioning systems, injection molding machines and extrusion molding machines.
  • control device controlled object
  • feedback controller 12 adder (adding unit)
  • Reference model unit 30 Neural network controllers 41, 42, 43 Differentiator (difference unit) 50 output limiter

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

むだ時間要素を含み、第1の入力及び第2の入力を含む複数の入力と、第1の出力及び第2の出力を含む複数の出力とを有する制御対象を制御する制御装置(1)であって、制御装置は、制御対象を制御するフィードバック制御器(10)と、むだ時間要素を含み、所望の応答波形を出力する規範モデル部(20)と、制御対象からの第1の出力と規範モデル部からの応答波形との差である第1の差分、及び、制御対象からの第2の出力と規範モデル部からの応答波形との差である第2の差分をそれぞれ求める差分部(41,42)と、第1の差分及び第2の差分が教師信号として与えられ、出力がフィードバック制御器の出力と加算されて制御対象に入力される学習型制御器(30)であって、学習型制御器からの出力の変化により第1の差分及び第2の差分が最小又は予め定められた閾値以下になるように、学習する学習型制御器とを備える。

Description

制御装置
 本発明は、制御装置に係り、特に、むだ時間を含む多入出力の制御対象を制御する制御装置に関する。
 多点温度制御の従来技術として、PID制御を用いた多点PID制御法がよく用いられている。これに対して、応答の遅い測定点(遅いモード)の出力への追従性を考慮することで多点の温度差と平均温度を制御する手法や、非干渉化と極零相殺を用いた極零制御法などが提案されている。例えば、特許文献1には、遅いモードに着目した制御法が開示されている。特許文献1では、多点での最も遅いモードに対してむだ時間補償を行い、補償結果から遅れのない出力情報を取り出している。また、取り出した出力情報を他のモード(より早いモード)の目標値として指令を与え、フィードフォワード構造を利用し素早く追従させることで温度差を低減するとともに、平均温度を制御可能な構造が開示されている。また、特許文献2では、β’により干渉項を相殺しつつ対象の逆特性(温度差モデルの逆特性)により対象の動特性を相殺し、理想の一次遅れモデルを仮定し、PID制御を行う構造が開示されている。
 一方、学習的に応答特性を改善する手法として、ニューラルネットワークを用いた制御法がある。むだ時間を含む制御対象に対しては、学習の因果関係(出力が得られる前は学習が始まらない)を成立させるために、ニューラルネットワーク(NN)に規範モデルを導入する必要がある。ここで、規範モデルを用いたニューラルネットワークに基づく制御法として、特許文献3があり、フィードバック制御器そのものをNN学習型のコントローラとした構造が開示されている。
国際公開2018/142523号 特開2009-282878号公報 特開平06-035510号公報
 上述の特許文献1及び2に記載の手法はいずれも、多点の温度差を最小化しつつ目標温度へ追従させることを目的とするものである。しかしながらこれらの手法では、以下のような課題がある。まず、制御対象の特性はむだ時間を含んでいるため、PID制御器の設計にはむだ時間を考慮した設計が必要である。例えば、Ziegler-Nichols(ZN)法などによる設計となる。これに伴い、多点間の温度差は従来の手法(例えば多点PID制御法)に比べて改善されるが、平均温度については大幅な特性改善は望めない。仮に、平均温度特性を(ZN法と比べ)改善した場合には、トレードオフの関係から外乱特性が劣化する。
 また、特許文献3に記載の構造では、仮に規範モデルにむだ時間を含めれば学習遅れは回避し得る。しかしながら、以下の課題がある。例えば、ニューラルネットワーク制御器の初期設計段階で、制御対象のモデルが必要である。したがって、制御器の設計が複雑であり、モデル誤差も生じ得る。また、目標値応答、外乱及び変動など全ての補償対象をニューラルネットワーク制御器で補償する必要が有る。そのため、補償対象別に制御器を設計・調整することが困難であり、補償器の学習による修正が複雑となる。さらに、多入出力制御系へ応用すること及びその方法は示されておらず、多点出力の均一化も考慮されていない。
 このように、特許文献1及び2に記載されるような多点温度制御法は、いずれも多点間の温度差を零とすることに主眼をおいた制御法であり、必ずしもむだ時間を考慮した過渡特性の改善に対する性能改善については焦点をあてていない。その結果、多点間温度差と平均温度に対する過渡特性を両立して積極的に改善することは望めない。
 また、ニューラルネットワークを用いた制御法は、むだ時間のない、あるいはその影響が無視できる系での規範モデルへの追従性に主眼をおいた制御法であり、むだ時間を考慮した過渡特性の性能改善については焦点をあてていない。その結果、むだ時間システムに対する過渡応答特性改善と、ニューラルネットワークの学習効果による更なる特性改善を両立して実現することは困難である。さらに、フィードバック制御器がNN制御器設計のみのため、その設計には制御対象のモデルが必要である。さらに、多入出力むだ時間系への応用も考慮されておらず、多点出力の均一化も困難である。
 本発明は以上の点に鑑み、上記の課題を解決する、多入出力の制御対象に対する制御系を構築することを目的にひとつとする。また、本発明は、むだ時間システムに対してもニューラルネットワークがむだ時間の影響なく学習し、指令入力に対する過渡特性を改善する能力を有する制御装置を提供することを目的とする。
 本発明の第1の態様によると、
 むだ時間要素を含み、第1の入力及び第2の入力を含む複数の入力と、第1の出力及び第2の出力を含む複数の出力とを有する制御対象を制御する制御装置であって、
 前記制御対象を制御するフィードバック制御器と、
 むだ時間要素を含み、所望の応答波形を出力する規範モデル部と、
 前記制御対象からの前記第1の出力と前記規範モデル部からの応答波形との差である第1の差分、及び、前記制御対象からの前記第2の出力と前記規範モデル部からの応答波形との差である第2の差分をそれぞれ求める差分部と、
 前記第1の差分及び前記第2の差分が教師信号として与えられ、出力が前記フィードバック制御器の出力と加算されて前記制御対象に入力される学習型制御器であって、前記学習型制御器からの出力の変化により前記第1の差分及び前記第2の差分が最小又は予め定められた閾値以下になるように、学習する前記学習型制御器と、
を備えた制御装置が提供される。
 本発明の第2の態様によると、
 むだ時間要素を含み、第1の入力及び第2の入力を含む複数の入力と、第1の出力及び第2の出力を含む複数の出力とを有する制御対象を、予め設計されたフィードバック制御器を用いて制御する制御系に適用される制御装置であって、
 むだ時間要素を含み、所望の応答波形を出力する規範モデル部と、
 前記制御対象からの前記第1の出力と前記規範モデル部からの応答波形との差である第1の差分、及び、前記制御対象からの前記第2の出力と前記規範モデル部からの応答波形との差である第2の差分をそれぞれ求める差分部と、
 前記第1の差分及び前記第2の差分が教師信号として与えられ、出力が前記フィードバック制御器の出力と加算されて前記制御対象に入力される学習型制御器であって、前記学習型制御器からの出力の変化により前記第1の差分及び前記第2の差分が最小又は予め定められた閾値以下になるように、学習する前記学習型制御器と、
を備えた制御装置が提供される。
 本発明によると、むだ時間システムに対してもニューラルネットワークがむだ時間の影響なく学習し、指令入力に対する過渡特性を改善する能力を有する制御装置を提供することができる。
本実施形態に係る制御系の構成例1のブロック図。 本実施形態に係る制御系の構成例2のブロック図。 本実施形態に係る制御系の構成例3-1のブロック図。 本実施形態に係る制御系の構成例3-2のブロック図。 本実施形態に係る制御系の構成例3-3のブロック図。 本実施形態に係る制御系の変形例1のブロック図。 本実施形態に係る制御系の変形例2のブロック図。 比較例の制御系における繰り返しステップ応答波形の重ね合わせ比較図。 比較例の制御系におけるチャネル間の温度差を示す図。 構成例1の制御系における繰り返しステップ応答波形の重ね合わせ比較図。 構成例1の制御系におけるチャネル間の温度差を示す図。 構成例2の制御系における繰り返しステップ応答波形の重ね合わせ比較図。 構成例2の制御系におけるチャネル間の温度差を示す図。 構成例3-1の制御系における繰り返しステップ応答波形の重ね合わせ比較図。 構成例3-1の制御系におけるチャネル間の温度差を示す図。
 以下、本発明の実施形態を図面を参照して説明する。
<本実施形態の概要>
 まず、本実施形態の概要を説明する。本実施形態における制御系(制御システム)は、例えば、多入出力で、かつ、むだ時間要素を含む制御対象を制御するものである。以下の例では、2入力2出力の制御対象を例に説明するが、制御対象はN入力M出力(N、Mは2以上の整数)でもよい。
 フィードバック(FB)制御器は、従来のフィードバック(FB)制御器を使用することができる。制御対象の応答を、むだ時間を有する規範モデルの出力に追従させる。そのために、ニューラルネットワーク制御器において、制御対象の出力(実出力)と規範モデルの出力との誤差を、ニューラルネットワークの教師信号とし、その誤差を例えば最小化するようにニューラルネットワークを学習させる。また、ニューラルネットワーク制御器の出力を、フィードバック制御器の出力に加算して制御対象への入力とし、制御対象を制御する。
 上記の概要を多入出力の制御対象についてより具体的に説明すると、多点の出力(y1、y2)と規範モデル出力yrの誤差(er1、er2)を教師信号とし、学習によりその誤差を最小化する(構成例1。構成例1では2出力の制御対象に対し教師信号は2つ)。
 さらに、教師信号に多点出力間の誤差信号(e12)を追加してもよい(構成例2。構成例2では2出力の制御対象に対して教師信号は3つ)。本構成は、より積極的に制御対象の多点出力(y1、y2)の誤差を最小化させる構成である。
 また、誤差e12に対するニューラルネットワーク制御器の出力信号u12を、第1の入力u1に負符号で(あるいは第2の入力u2に正符号で、あるいはu1とu2に例えば半量をそれぞれ負符号と正負号で)加えてもよい(構成例3-1~3-3)。
<本実施の形態の説明>
(構成例1)
 図1は、本実施形態に係る制御系の構成例1のブロック図である。本実施形態に係る制御系は、制御対象2を制御する制御装置1を含む。制御装置1は、フィードバック制御器10と、規範モデル部20と、ニューラルネットワーク制御器30と、差分部(差分器41、42)と、加算部(加算器12-1、12-2)を有する。
 フィードバック制御器10は、制御対象2の出力に関する予め定められた目標値ydに従い、制御対象2を制御する。フィードバック制御器10は、制御対象の入力数に応じたフィードバック制御器10-N(Nは2以上の整数)を有することができる。例えば、フィードバック制御器10は、予め定められた目標値yd(SVと記す場合もある)と、制御対象2の出力y(測定値、PVと記す場合もある)の差eを入力し、所定の制御演算を行い、制御対象2への操作量を出力する。より具体的には、フィードバック制御器10(フィードバック制御器10-1)は、予め定められた目標値SVと、制御対象2の第1の出力y1の差e1を入力し、所定の制御演算を行い、制御対象2の第1の入力への操作量を出力する。制御対象の他の出力についても同様である。
 フィードバック制御器10は、例えば、メインの制御器として動作する。例えば、フィードバック制御器10は、モデル化誤差が無く、外乱が無いと仮定した場合に、制御対象2の出力を所望の設計通りに動作させるための制御器である。フィードバック制御器10としては、例えば、オートチューニングなどで自動的に設計可能なPID制御器などを用いることができる。また、フィードバック制御器10には、行き過ぎ量を抑えたI-PD制御器を用い、目標値に対する立ち上がりはニューラルネットワーク制御器30で改善することもできる。
 規範モデル部20は、むだ時間(むだ時間要素)を含み、入力に対する所望の応答波形を出力する。規範モデル部20は、目標値ydを入力する。規範モデル部20の入出力の関係は、例えばむだ時間要素を含む1次遅れ系などで表すことができるが、これに限らず、むだ時間要素を含む適宜の関係でもよい。規範モデル部20のむだ時間は、例えば、制御対象2のむだ時間と同じ時間に設定されることができる。また、規範モデル部20のむだ時間は、制御対象2のむだ時間と同程度の時間でもよい。ここで同程度とは、例えば、ニューラルネットワーク制御器30により、制御対象2の出力の応答性が改善される程度であればよい。また、制御対象2のむだ時間を予め定められた桁で丸めた値、換言すると、予め定められた許容誤差の範囲内の値でもよい。一例として、規範モデル部20のむだ時間は、制御対象2のむだ時間に対してプラスマイナス10%程度の範囲内であってもよく、プラスマイナス30%程度の範囲内であってもよい。規範モデル部20の出力と制御対象2の第1の出力y1との誤差er1、及び、規範モデル部20の出力と制御対象2の第2の出力y2との誤差er2を、ニューラルネットワーク制御器30に教師信号として与える。
 ニューラルネットワーク制御器30への入力信号には目標値ydと制御対象の出力y1、y2を用いる。また、ニューラルネットワーク制御器30の出力uN1、uN2は、フィードバック制御器10の出力と加算されて、制御対象2への制御入力(u1、u2)となる。ニューラルネットワーク制御器30は、ニューラルネットワーク制御器30の出力の変化(調整)によって制御対象2の出力と規範モデル部20の出力の誤差er1、er2が最小化又は予め定められた閾値以下になるようにニューラルネットワークを用いて学習する。例えば、ニューラルネットワーク制御器30は、評価規範である2乗誤差(er1、er2)を最小化するように、最急降下法とバックプロパゲーションにより学習する。ニューラルネットワーク制御器30は、入力信号と学習結果に応じた出力を供給する。また、ニューラルネットワーク制御器30からの出力は、上述のようにフィードバック制御器10の出力と加算されて操作量xが求められ、制御対象2へ入力される。このようにニューラルネットワーク制御器30の出力をフィードバック制御器10の出力と加算して制御対象2へ入力することで、フィードバック制御器10とニューラルネットワーク制御器30の役割分担が可能となる。
 なお、ニューラルネットワークは、入力及び出力と、1又は複数の中間層とを有する。中間層は、複数のノードで構成される。ニューラルネットワークの構成は適宜の構成を用いることができ、ニューラルネットワークの学習方法については公知の学習方法を用いることができる。
 差分部は、制御対象2の出力y1と規範モデル部20の出力との差(第1の差分)er1を求める差分器41と、制御対象2の出力y2と規範モデル部20の出力との差(第2の差分)er2を求める差分器42と含む。
 加算部は、フィードバック制御器10の第1の出力(フィードバック制御器10-1の出力)とニューラルネットワーク制御器30の出力uN1とを加算する加算器12-1と、フィードバック制御器10の第2の出力(フィードバック制御器10-2の出力)とニューラルネットワーク制御器30の出力uN2とを加算する加算器12-2とを含む。
 また、制御装置1は、目標値ydと制御対象2の出力y1,y2との差e1、e2をそれぞれ求める差分器13-1、13-2を有してもよい。
 規範モデル部20とニューラルネットワーク制御器30は、例えばCPU(Central Processing Unit)及びDSP(Digital Signal Processor)などの処理部と、メモリなどの記憶部を有するデジタル装置によって実装されてもよい。規範モデル部20とニューラルネットワーク制御器30の処理部及び記憶部は、共通の処理部及び記憶部を用いてもよいし、別々の処理部及び記憶部を用いてもよい。また、ニューラルネットワーク制御器30は、複数の処理部を有し、少なくとも一部の処理を並列に実行してもよい。
(構成例1の効果)
 上述の制御装置によると、例えば以下の効果を奏する。ただし、本実施形態の制御装置は、必ずしも以下の全ての効果を奏する装置に限定されるものではない。
 フィードバック制御器10としてオートチューニングを用いて設計可能な制御器などが利用可能である。そのため、フィードバック制御器10の設計に際して、制御対象2のモデルが不要である。また、ニューラルネットワーク制御器30の設計にも制御対象2のモデルが不要であるため、制御装置1の各制御器の設計に対し、モデルが不要である。
 本実施形態の制御系では、規範モデル部20の出力に制御対象2の出力が追従するよう学習する。規範モデル部20にむだ時間を持たせることで、制御対象2の出力が無い状態でニューラルネットワーク制御器30がニューラルネットワークを用いた学習を開始することを回避することができる(すなわち、因果性が成立する)。また、ニューラルネットワークの学習において、むだ時間に先行し学習が行われるという問題を回避できる。したがって、ニューラルネットワークの学習をむだ時間分だけ遅らせる必要がなく、学習周期を意図的に大きくする必要もない。これにより制御対象2の出力を増大させようとニューラルネットワーク制御器30が過剰な制御入力を与えるといった現象を回避できる。
 フィードバック制御器10の役割は、主として設計時のノミナル仕様を満たすように動作することである。例えば、フィードバック制御器10は、制御系における制御装置(コントローラ)としての仕様、PIDの動作仕様などを満たすように動作する。一方、ニューラルネットワーク制御器30の役割は、学習の後に制御対象2の出力を規範モデル部20の出力に追従させるよう動作することである。さらに、ニューラルネットワーク制御器30は、モデル化誤差や外乱が生じた場合に、モデル化誤差や外乱を補償する。このような誤差や外乱が生じる場合、制御対象2の出力と規範モデル部20の出力とに誤差が生じることなり、ニューラルネットワーク制御器30は、この誤差に基づき動作することでモデル化誤差や外乱を補償する。
 また、規範モデル部20の出力と多点出力との間の誤差を最小化することにより、学習とともに過渡特性改善を行うことが可能となる。また、規範モデル部20の出力に多点出力が追従することにより、間接的に多点出力間の温度差も小さくなる。
(構成例2)
 図2は、本実施形態に係る制御系の構成例2のブロック図である。
 構成例2は、例えば、多点出力間の誤差を直接的に最小化する構成である。多点間出力誤差(e12)も教師信号に追加し、その2乗誤差の最小化もニューラルネットワーク制御器30の学習において直接的に考慮する。この場合、ニューラルネットワーク制御器30の入力(yd、y1、y2)は構成例1と同一であるが、教師信号は構成例1に対して1つ加わり、(er1、er2、e12)となる。ニューラルネットワーク制御器30の出力もそれにあわせて3出力となるが、フィードバックゲ制御器10の出力が2つであるため、それに対応した出力である(uN1、uN2)のみを利用する。
 より具体的には、構成例2における制御系において、差分部は差分器43をさらに有する。差分器43は、制御対象の出力y1とy2の誤差e12を求め、誤差e12を教師信号としてニューラルネットワーク制御器30に与える。その他の構成は、構成例1と同様である。
(構成例2の効果)
 上述の制御装置によると、上述の構成例1の効果に加え、教師信号に多点出力同士の誤差を加えることにより、直接的に多点出力間の温度差も最適化(最小化)することが可能となる。
(構成例3)
 図3~図5は、本実施形態に係る制御系の構成例3-1~3-3のブロック図である。
 構成例3は、ニューラルネットワーク制御器30の多点間出力誤差e12に対する出力uN3を利用する。ここでは、多点出力間誤差e12に対する出力信号u12を、フィードバック制御器10-1の出力に負符号で加え、制御対象の第1の入力u1とする(構成例3-1:図3)。他の構成例として、多点出力間誤差e12に対する出力信号u12を、フィードバック制御器10-2の出力に正符号で加え、制御対象の第2の入力u2とする(構成例3-2:図4)。また、他の構成例として、多点出力間誤差e12に対する出力信号u12を、半量ずつ、フィードバック制御器10-1の出力に負符号で加えて制御対象の第1の入力u1とし、フィードバック制御器10-2の出力に正符号で加えて制御対象の第2の入力u2とする(構成例3-3:図5)。なお、出力信号u12は、半量ずつ加える以外に、所定の割合で分割して加えてもよい。また、出力信号u12を所定の割合で分配する分配部をさらに備えてもよい。このような構成により、さらなる誤差信号の最小化を図ることができる。
(構成例3の効果)
 上述の制御装置によると、上述の構成例1及び2の効果に加え、多点出力間の誤差に対するニューラルネットワーク制御器30の出力信号u12を、フィードバック制御器10-1の出力u1に負符号で加えることにより(又はフィードバック制御器10-2の出力u2に正負号で加えることにより、又はu1とu2に例えば半量をそれぞれ負符号と正負号で加えることにより)、制御対象2の出力y1側の温度(又は出力y2側の温度、又はその両方)を制御して、誤差e12のさらなる最小化が可能である。
(変形例1)
 図6は、本実施形態に係る制御系の変形例1のブロック図である。
 変形例1では、ニューラルネットワーク制御器30の学習が良好でない、又は制御性能改善に向かわない場合などに、例えば出力制限部がニューラルネットワーク制御器30の出力を制限し又はゼロにする。この場合でも、初期の基本性能がフィードバック制御器10により保証される。
 変形例1における制御系は、出力制限部50をさらに備える。図6には、図2に示す構成例2に対して出力制限部50を備えた例を示す。なお、図1に示す構成例1に対して出力制限部50を備えてもよい。他の構成は、構成例1と同様である。
 制限の態様としては、例えば、出力制限部50は、ニューラルネットワーク制御器30の出力にリミット処理を行ってもよい。例えば、ニューラルネットワーク制御器30の出力を、予め定められたリミット値を超えないように制限してもよい。また、出力制限部50は、ニューラルネットワーク制御器30の出力に予め定められた係数(0.0~1.0)を掛けて出力してもよい。
 出力制限部50が、制限を適用する条件としては、フィードバック制御器10のみでの応答に対して、ニューラルネットワークの動作を加えたときに以下のような状態となる場合に、ニューラルネットワーク制御器30の出力に制限を掛けるようにしてもよい。なお、この判断は例えば出力制限部50が測定値等に基づき判断してもよい。
 ・フィードバック制御器10のみの場合より、オーバーシュートが大きくなる場合
 ・フィードバック制御器10のみの場合より、測定値が設定値に安定するまでの時間(整定時間)が長くなる場合
 ・ニューラルネットワーク制御器30の動作を加えたことで、測定値が振動しているとき(例えば、所定時間内に測定値の振動幅が所定以下にならず、測定値が安定しない)。
(変形例2)
 図7は、本実施形態に係る制御系の変形例2のブロックである。図7には、図3に示す構成例3-1に対して出力制限部50を備えた例を示す。なお、図4に示す構成例3-2、又は図5に示す構成例3-3に対して出力制限部50を備えてもよい。
 この例では、出力制限部50にはニューラルネットワーク制御器30の出力信号u12も入力される。出力制限部50の動作、及び他の構成は、変形例1と同様である。
 なお、上述の変形例1及び2における出力制限部は、他の構成例に適用することも可能である。
(本実施の形態の効果)
 本実施形態の制御装置は、以下の効果も有する。
 ・規範モデル部20の出力へ追従する構成であるため、規範モデル部20の設定及び調整によりニューラルネットワークの学習が進んでも制御入力が過大になりにくい。換言すると、制御対象2の入力を間接的に調整できる。
 ・ニューラルネットワーク制御器30の設計には制御対象のモデルが必要ない。また、オートチューニングにより設計されるフィードバック制御器10を利用できるため、制御系がモデルレスで設計可能である。
 ・ニューラルネットワークの学習が進んでもフィードフォワード構造にシフトせず、フィードバック制御系を維持できる。例えば、規範モデル部20の出力と制御対象2の出力との誤差がゼロである場合、フィードバック制御器10のみ動作しているのと同等である。
 ・フィードバック制御器10にI-PD構造を利用することで、ニューラルネットワークの学習経過により行き過ぎ量なく応答性のみを改善することができる。例えば、制御対象2の出力は、制御開始直後は立ち上がりが遅くなるが、行き過ぎ量を抑えつつ、学習が進むにつれ立ち上がりを改善していく、というような制御が可能となる。
 ・2入出力以上の多入出力システムへ適用できる。過渡状態を含めて温度均一化制御が可能である。
 また、本実施形態は、例えば、むだ時間を含む規範モデルの出力に多出力となる制御対象の出力を追従させるよう構成されている。ここで、規範モデルのむだ時間は、制御対象の最も大きいむだ時間とすることができる。本構成により、ニューラルネットワークの学習において、むだ時間に先行し学習が行われるという課題を回避できる。また、学習をむだ時間分遅らせたり、学習周期を故意に大きくする必要もない。
 本実施形態は、例えば、フィードバック(FB)制御器の出力にニューラルネットワーク(NN)による制御器の出力を加算するよう構成されている。本構成により、フィードバック制御器の設計はオートチューニングによる自動調整が可能であり、かつニューラルネットワーク制御器の設計には制御対象のモデルが不要である。このように、全ての制御系の設計に対し、モデルが不要である。また、制御対象の応答は規範モデルの応答に一致することが目標であり、学習が進んでも制御入力が過大にならない。換言すると、制御対象の入力を間接的に調整できる。
 本実施形態は、例えば、フィードバック制御器とニューラルネットワーク制御器の役割分担が明確である。フィードバック制御の基本性能は主としてフィードバック制御器により保証され、規範モデルとの誤差や外乱、モデル化誤差の補償は主としてニューラルネットワーク制御器により保証される。仮にニューラルネットワーク制御器の学習が良好でない、又は制御性能改善に向かわない場合などは、ニューラルネットワーク制御器の出力を制限し又はゼロとしても初期の基本性能がフィードバック制御器により保証される。
 本実施形態の構成において、フィードバック制御器にI-PD制御器を導入することで、制御開始直後は立ち上がりは犠牲になるが行き過ぎ量を抑えつつ、学習が進むにつれ立ち上がりを改善していく、という制御が可能である。
 本実施形態の制御系は、規範モデルの出力に多出力が追従するよう学習するため、過渡状態の特性改善に加え、多点(多出力)での出力均一化制御、すなわち出力温度差の低減が可能である。
 さらに、出力間温度差を教師信号として追加することで、より直接的に(効果的に)温度差を低減することも可能である。
 また、出力間温度差の教師信号に対するニューラルネットワーク制御器の出力をいずれか一方のフィードバック制御器出力に(あるいは半量を両方のフィードバック制御器出力に)加えることで、更なる温度差低減が可能である。
(適用例)
 本実施形態によると、例えば多点温度制御においてニューラルネットワークに基づく制御器とフィードバック制御器を併用したモデル規範型多入出力制御系を実現できる。また、多点の温度出力の均一化とともに、その温度出力を時間経過とともに学習的に目標値へ追従するよう特性改善することができる。
(シミュレーション結果)
 本実施形態における制御装置1を用いた制御系のシミュレーション結果及び効果を、比較例と対比して説明する。
 一例として、2入力2出力むだ時間システムでのシミュレーション結果について以下に示す。各入出力間(干渉項含む)の制御対象は1次遅れ+むだ時間とした。また、第1の出力(ch1)のむだ時間と時定数の比(LT比)は1:13で、第2の出力(ch2)のLT比は1:16である。目標値は温度で100-105度の矩形波信号とした。
 まずは参考としてI-PD制御系に対するステップ応答を図8に示す。上段が目標値を正方向に変化させた場合(100から105度へ変化)の応答波形を示し、下段が負方向(105から100度へ変化)の応答波形を示す。規範モデル部20の出力を破線で示し、制御対象2の第1の出力y1を実線で示し、制御対象2の第2の出力y2を一点鎖線で示す。なお、図8において、横軸は時間、縦軸は温度である。以降の同様の図のついても、横軸、縦軸及び線種は同様である。図9に、目標値を正方向に変化させた場合の出力間温度差(y1-y2)を示す。なお、図9において、横軸は時間、縦軸は温度差である。以降の同様の図のついても、横軸及び縦軸は同様である。
 続いて、教師信号を2つ(er1、er2)とした場合の構成例1(図4)において、同様のシミュレーションを行った結果を図10と図11に示す。同図より、行き過ぎ量が改善されていることが確認できる。また、I-PD制御系の結果の比較より、ステップ指令印加時の短時間は温度差が増大しているものの、それ以降は温度差が低減されていることが確認できる。
 さらに、教師信号に2出力間の温度差(e12=y1-y2)を追加した3教師信号(er1、er2、e12)での構成例2(図2)において、同様のシミュレーションを行った結果を図12と図13に示す。図13では比較のため、参考としてのI-PD制御系、構成例1(NN:2TS)及び構成例2(NN:3TS)の制御系での出力温度差を示している。同図より、教師信号に温度差を追加したことによりステップ指令印加時の温度差も他の制御系に比べ低減できていることが確認できる。
 また、教師信号e12に対するニューラルネットワーク制御器30の出力u12をu1に負符号で加算した場合(構成例3-1、図3)において、同様のシミュレーションを行った結果を図14と図15に示す。図15より、最大誤差とそのゼロへの収束が改善されていることが確認できる。この改善特性は、u12をu2へ正負号で加算した場合、及びu12の半量をu1とu2にそれぞれ負符号と正負号で加えた場合にも同様の結果がえられる。
 以上、各制御構造に対する学習後のy1-y2の最大誤差と1ステップでの2乗誤差和を比較して表1に示す。
Figure JPOXMLDOC01-appb-T000001
 以上より、多入出力むだ時間制御系において、多出力を規範モデル出力に追従するようニューラルネットワーク制御器を学習させることで、過渡特性改善に加え、多出力間の温度差を最小化(均一化)できることがわかる。さらに、温度差そのものを教師信号に加えることで、より効果的に温度差を最小化できることがわかる。
(その他)
 上述の実施形態では、主に2入力2出力の系を例に説明したが、N入力以上の系、M出力以上の系(N、Mは3以上の整数)にも適用できる。なお、N=Mでもよい。制御対象が3出力以上の場合、各出力と教師モデル部の出力との差を教師信号としてもよい。また、3以上の出力のうち任意の複数の出力について、当該出力と教師モデル部の出力との差を教師信号としてもよい。構成例2における誤差信号e12については、3以上の各出力の組み合わせ全ての誤差信号を教師信号として用いてもよい。若しくは、3以上の出力のうち任意の複数の出力の組み合わせについての誤差信号を教師信号として用いてもよい。例えば、第1の出力y1を基準出力とし、基準出力と他の出力との各誤差信号を教師信号として用いてもよい。構成例3のように、ニューラルネットワーク制御器からの、誤差信号に対する出力をフィードバック制御器からの出力に加算する場合は、誤差信号に対する出力のひとつ又は複数を、構成例3での説明と同様に、対応するフィードバック制御器のいずれかの出力に負符号又は正符号で加算してもよいし、半量ずつ負符号又は正符号で加算してもよい。
 上述の実施形態では、ニューラルネットワーク制御器30はニューラルネットワークを用いて学習したが、ニューラルネットワーク以外の機能を用いて学習してもよい。すなわち、ニューラルネットワーク制御器30は学習型制御器でもよい。また、制御装置1のうちフィードバック制御器10を含まない構成を有する第2の制御装置を提供することもできる。例えば、予め設計された既存のフィードバック制御器を用いて制御対象を制御する制御系に、規範モデル部20とニューラルネットワーク制御器30を有する制御装置が適用して上述の制御系を構成してもよい。
 上述の各構成及び処理は、処理部と記憶部を有するコンピュータで実現することも可能である。処理部は、各構成の処理を実行する。記憶部は、処理部が実行するプログラムを記憶する。上述の処理は、処理部が実行する制御方法としても実現可能である。また、処理部に上述の処理を実行させるための命令を含むプログラム又はプログラム媒体、該プログラムを記憶したコンピュータ読み取り可能な記録媒体及び非一時的な記録媒体等により実現可能である。
 本実施形態の制御装置及び制御系は、例えば、多入出力でむだ時間を有する制御対象を制御する制御系に適用可能である。一例として、プロセス制御系や温度調整系に適用可能である。より具体的な例としては、温調・空調システム、射出成型機及び押出成形機などが挙げられる。
1 制御装置
2 制御対象
10 フィードバック制御器
12 加算器(加算部)
20 規範モデル部
30 ニューラルネットワーク制御器
41,42,43 差分器(差分部)
50 出力制限部

Claims (6)

  1.  むだ時間要素を含み、第1の入力及び第2の入力を含む複数の入力と、第1の出力及び第2の出力を含む複数の出力とを有する制御対象を制御する制御装置であって、
     前記制御対象を制御するフィードバック制御器と、
     むだ時間要素を含み、所望の応答波形を出力する規範モデル部と、
     前記制御対象からの前記第1の出力と前記規範モデル部からの応答波形との差である第1の差分、及び、前記制御対象からの前記第2の出力と前記規範モデル部からの応答波形との差である第2の差分をそれぞれ求める差分部と、
     前記第1の差分及び前記第2の差分が教師信号として与えられ、出力が前記フィードバック制御器の出力と加算されて前記制御対象に入力される学習型制御器であって、前記学習型制御器からの出力の変化により前記第1の差分及び前記第2の差分が最小又は予め定められた閾値以下になるように、学習する前記学習型制御器と、
    を備えた制御装置。
  2.  前記学習型制御器は、前記第1の差分に対応する第3の出力と、前記第2の差分に対応する第4の出力とを出力し、
     前記制御装置は、
      前記フィードバック制御器から前記制御対象の前記第1の入力への出力に、前記学習制御器からの前記第3の出力を加算し、及び、前記フィードバック制御器から前記制御対象の前記第2の入力への出力に、前記学習制御器からの前記第4の出力を加算する加算部をさらに備える請求項1に記載の制御装置。
  3.  前記差分部は、前記制御対象からの前記第1の出力と前記制御対象からの前記第2の出力との差である第3の差分を求め、
     前記学習型制御器は、前記第3の差分が教師信号としてさらに与えられ、前記学習型制御器からの出力の変化により前記第1の差分及び前記第2の差分及び前記第3の差分が最小又は予め定められた閾値以下になるように、学習する請求項1に記載の制御装置。
  4.  前記学習型制御器は、前記第3の差分に対応する第5の出力を出力し、
     前記加算部は、さらに、
     前記学習型制御器からの前記第5の出力を、前記フィードバック制御器から前記制御対象の前記第1の入力への出力に、若しくは、前記フィードバック制御器から前記制御対象の前記第2の入力への出力に正符号若しくは負符号で加算し、又は、前記フィードバック制御器から前記制御対象の前記第1の入力への出力と前記第2の入力への出力の双方に分割して正符号若しくは負符号で加算する請求項1に記載の制御装置。
  5.  前記学習型制御器から前記加算部への出力を制限する出力制限部
    をさらに備える請求項1乃至4のいずれかに記載の制御装置。
  6.  むだ時間要素を含み、第1の入力及び第2の入力を含む複数の入力と、第1の出力及び第2の出力を含む複数の出力とを有する制御対象を、予め設計されたフィードバック制御器を用いて制御する制御系に適用される制御装置であって、
     むだ時間要素を含み、所望の応答波形を出力する規範モデル部と、
     前記制御対象からの前記第1の出力と前記規範モデル部からの応答波形との差である第1の差分、及び、前記制御対象からの前記第2の出力と前記規範モデル部からの応答波形との差である第2の差分をそれぞれ求める差分部と、
     前記第1の差分及び前記第2の差分が教師信号として与えられ、出力が前記フィードバック制御器の出力と加算されて前記制御対象に入力される学習型制御器であって、前記学習型制御器からの出力の変化により前記第1の差分及び前記第2の差分が最小又は予め定められた閾値以下になるように、学習する前記学習型制御器と、
    を備えた制御装置。
PCT/JP2021/027811 2021-07-27 2021-07-27 制御装置 WO2023007596A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/027811 WO2023007596A1 (ja) 2021-07-27 2021-07-27 制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/027811 WO2023007596A1 (ja) 2021-07-27 2021-07-27 制御装置

Publications (1)

Publication Number Publication Date
WO2023007596A1 true WO2023007596A1 (ja) 2023-02-02

Family

ID=85086428

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/027811 WO2023007596A1 (ja) 2021-07-27 2021-07-27 制御装置

Country Status (1)

Country Link
WO (1) WO2023007596A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0635510A (ja) * 1992-07-15 1994-02-10 Fujitsu Ltd ニューラルネットワークを用いたモデル規範型適応制御装置
JP2010113638A (ja) * 2008-11-10 2010-05-20 Fuji Electric Systems Co Ltd プラント制御システムおよび制御方法
JP2010181955A (ja) * 2009-02-03 2010-08-19 Canon Inc 制御装置
WO2019216143A1 (ja) * 2018-05-08 2019-11-14 千代田化工建設株式会社 プラント運転条件設定支援システム、学習装置、及び運転条件設定支援装置
WO2020217445A1 (ja) * 2019-04-26 2020-10-29 理化工業株式会社 制御装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0635510A (ja) * 1992-07-15 1994-02-10 Fujitsu Ltd ニューラルネットワークを用いたモデル規範型適応制御装置
JP2010113638A (ja) * 2008-11-10 2010-05-20 Fuji Electric Systems Co Ltd プラント制御システムおよび制御方法
JP2010181955A (ja) * 2009-02-03 2010-08-19 Canon Inc 制御装置
WO2019216143A1 (ja) * 2018-05-08 2019-11-14 千代田化工建設株式会社 プラント運転条件設定支援システム、学習装置、及び運転条件設定支援装置
WO2020217445A1 (ja) * 2019-04-26 2020-10-29 理化工業株式会社 制御装置

Similar Documents

Publication Publication Date Title
Wang et al. Fixed-time disturbance observer based fixed-time back-stepping control for an air-breathing hypersonic vehicle
Meng et al. Application of sum of squares method in nonlinear H∞ control for satellite attitude maneuvers
Zhang et al. Disturbance observer based adaptive fuzzy sliding mode control: A dynamic sliding surface approach
Zhou et al. Finite-time prescribed performance adaptive fuzzy control for unknown nonlinear systems
Zhu et al. Predictor feedback for uncertain linear systems with distributed input delays
CN112305907A (zh) 自适应pid温度控制方法、装置及设备
JP7432838B2 (ja) 制御装置
Cristofaro et al. Linear-quadratic optimal boundary control of a one-link flexible arm
WO2023007596A1 (ja) 制御装置
Zhang et al. Predefined-time stabilization for nonlinear stochastic Itô systems
CN108563123B (zh) 直线电机x-y的自适应迭代学习鲁棒控制系统及设计方法
Evald et al. A hybrid robust model reference adaptive controller and proportional integral controller without reference model for partially modeled systems
CN113377008A (zh) 一种pid控制系统及参数整定方法
CN109613830B (zh) 基于递减预测步长的模型预测控制方法
Kurniawan et al. Variable-structure repetitive control for discrete-time linear systems with multiple-period exogenous signals
Ortseifen et al. A new design method for mismatch-based anti-windup compensators: Achieving local performance and global stability in the SISO case
CN114019786A (zh) 一种pi在线切换到pid的控制系统及参数整定方法
Liu et al. Adaptive reduced dimension fuzzy decoupling control method with its application to a deployable antenna panel
JP6792790B2 (ja) 制御装置及び制御方法
Haigang et al. Direct adaptive fuzzy sliding mode control with variable universe fuzzy switching term for a class of MIMO nonlinear systems
Deng et al. An adaptive fuzzy logic controller with self-tuning scaling factors based on neural networks
Zhao et al. Stabilization of linear systems with time delay and disturbance: A new state prediction approach
Zhu et al. Cooperative control of NN super twisting sliding mode and EPH methods for uncertain nonlinear systems
CN108762092B (zh) 一种用于压电驱动器精密定位的控制方法
Jia et al. Adaptive backstepping control for longitudinal dynamics of hypersonic vehicle subject to actuator saturation and disturbance

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21951804

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE