WO2023007596A1

WO2023007596A1 - 制御装置

Info

Publication number: WO2023007596A1
Application number: PCT/JP2021/027811
Authority: WO
Inventors: 勝敏井▲崎▼; 誠司橋本
Original assignee: 理化工業株式会社
Priority date: 2021-07-27
Filing date: 2021-07-27
Publication date: 2023-02-02

Abstract

むだ時間要素を含み、第１の入力及び第２の入力を含む複数の入力と、第１の出力及び第２の出力を含む複数の出力とを有する制御対象を制御する制御装置（１）であって、制御装置は、制御対象を制御するフィードバック制御器（１０）と、むだ時間要素を含み、所望の応答波形を出力する規範モデル部（２０）と、制御対象からの第１の出力と規範モデル部からの応答波形との差である第１の差分、及び、制御対象からの第２の出力と規範モデル部からの応答波形との差である第２の差分をそれぞれ求める差分部（４１，４２）と、第１の差分及び第２の差分が教師信号として与えられ、出力がフィードバック制御器の出力と加算されて制御対象に入力される学習型制御器（３０）であって、学習型制御器からの出力の変化により第１の差分及び第２の差分が最小又は予め定められた閾値以下になるように、学習する学習型制御器とを備える。

Description

制御装置

　本発明は、制御装置に係り、特に、むだ時間を含む多入出力の制御対象を制御する制御装置に関する。

　多点温度制御の従来技術として、ＰＩＤ制御を用いた多点ＰＩＤ制御法がよく用いられている。これに対して、応答の遅い測定点（遅いモード）の出力への追従性を考慮することで多点の温度差と平均温度を制御する手法や、非干渉化と極零相殺を用いた極零制御法などが提案されている。例えば、特許文献１には、遅いモードに着目した制御法が開示されている。特許文献１では、多点での最も遅いモードに対してむだ時間補償を行い、補償結果から遅れのない出力情報を取り出している。また、取り出した出力情報を他のモード（より早いモード）の目標値として指令を与え、フィードフォワード構造を利用し素早く追従させることで温度差を低減するとともに、平均温度を制御可能な構造が開示されている。また、特許文献２では、β’により干渉項を相殺しつつ対象の逆特性（温度差モデルの逆特性）により対象の動特性を相殺し、理想の一次遅れモデルを仮定し、ＰＩＤ制御を行う構造が開示されている。

　一方、学習的に応答特性を改善する手法として、ニューラルネットワークを用いた制御法がある。むだ時間を含む制御対象に対しては、学習の因果関係（出力が得られる前は学習が始まらない）を成立させるために、ニューラルネットワーク（ＮＮ）に規範モデルを導入する必要がある。ここで、規範モデルを用いたニューラルネットワークに基づく制御法として、特許文献３があり、フィードバック制御器そのものをＮＮ学習型のコントローラとした構造が開示されている。

国際公開２０１８／１４２５２３号特開２００９－２８２８７８号公報特開平０６－０３５５１０号公報

　上述の特許文献１及び２に記載の手法はいずれも、多点の温度差を最小化しつつ目標温度へ追従させることを目的とするものである。しかしながらこれらの手法では、以下のような課題がある。まず、制御対象の特性はむだ時間を含んでいるため、ＰＩＤ制御器の設計にはむだ時間を考慮した設計が必要である。例えば、Ｚｉｅｇｌｅｒ－Ｎｉｃｈｏｌｓ（ＺＮ）法などによる設計となる。これに伴い、多点間の温度差は従来の手法（例えば多点ＰＩＤ制御法）に比べて改善されるが、平均温度については大幅な特性改善は望めない。仮に、平均温度特性を（ＺＮ法と比べ）改善した場合には、トレードオフの関係から外乱特性が劣化する。

　また、特許文献３に記載の構造では、仮に規範モデルにむだ時間を含めれば学習遅れは回避し得る。しかしながら、以下の課題がある。例えば、ニューラルネットワーク制御器の初期設計段階で、制御対象のモデルが必要である。したがって、制御器の設計が複雑であり、モデル誤差も生じ得る。また、目標値応答、外乱及び変動など全ての補償対象をニューラルネットワーク制御器で補償する必要が有る。そのため、補償対象別に制御器を設計・調整することが困難であり、補償器の学習による修正が複雑となる。さらに、多入出力制御系へ応用すること及びその方法は示されておらず、多点出力の均一化も考慮されていない。

　このように、特許文献１及び２に記載されるような多点温度制御法は、いずれも多点間の温度差を零とすることに主眼をおいた制御法であり、必ずしもむだ時間を考慮した過渡特性の改善に対する性能改善については焦点をあてていない。その結果、多点間温度差と平均温度に対する過渡特性を両立して積極的に改善することは望めない。

　また、ニューラルネットワークを用いた制御法は、むだ時間のない、あるいはその影響が無視できる系での規範モデルへの追従性に主眼をおいた制御法であり、むだ時間を考慮した過渡特性の性能改善については焦点をあてていない。その結果、むだ時間システムに対する過渡応答特性改善と、ニューラルネットワークの学習効果による更なる特性改善を両立して実現することは困難である。さらに、フィードバック制御器がＮＮ制御器設計のみのため、その設計には制御対象のモデルが必要である。さらに、多入出力むだ時間系への応用も考慮されておらず、多点出力の均一化も困難である。

　本発明は以上の点に鑑み、上記の課題を解決する、多入出力の制御対象に対する制御系を構築することを目的にひとつとする。また、本発明は、むだ時間システムに対してもニューラルネットワークがむだ時間の影響なく学習し、指令入力に対する過渡特性を改善する能力を有する制御装置を提供することを目的とする。

　本発明の第１の態様によると、
　むだ時間要素を含み、第１の入力及び第２の入力を含む複数の入力と、第１の出力及び第２の出力を含む複数の出力とを有する制御対象を制御する制御装置であって、
　前記制御対象を制御するフィードバック制御器と、
　むだ時間要素を含み、所望の応答波形を出力する規範モデル部と、
　前記制御対象からの前記第１の出力と前記規範モデル部からの応答波形との差である第１の差分、及び、前記制御対象からの前記第２の出力と前記規範モデル部からの応答波形との差である第２の差分をそれぞれ求める差分部と、
　前記第１の差分及び前記第２の差分が教師信号として与えられ、出力が前記フィードバック制御器の出力と加算されて前記制御対象に入力される学習型制御器であって、前記学習型制御器からの出力の変化により前記第１の差分及び前記第２の差分が最小又は予め定められた閾値以下になるように、学習する前記学習型制御器と、
を備えた制御装置が提供される。

　本発明の第２の態様によると、
　むだ時間要素を含み、第１の入力及び第２の入力を含む複数の入力と、第１の出力及び第２の出力を含む複数の出力とを有する制御対象を、予め設計されたフィードバック制御器を用いて制御する制御系に適用される制御装置であって、
　むだ時間要素を含み、所望の応答波形を出力する規範モデル部と、
　前記制御対象からの前記第１の出力と前記規範モデル部からの応答波形との差である第１の差分、及び、前記制御対象からの前記第２の出力と前記規範モデル部からの応答波形との差である第２の差分をそれぞれ求める差分部と、
　前記第１の差分及び前記第２の差分が教師信号として与えられ、出力が前記フィードバック制御器の出力と加算されて前記制御対象に入力される学習型制御器であって、前記学習型制御器からの出力の変化により前記第１の差分及び前記第２の差分が最小又は予め定められた閾値以下になるように、学習する前記学習型制御器と、
を備えた制御装置が提供される。

　本発明によると、むだ時間システムに対してもニューラルネットワークがむだ時間の影響なく学習し、指令入力に対する過渡特性を改善する能力を有する制御装置を提供することができる。

本実施形態に係る制御系の構成例１のブロック図。本実施形態に係る制御系の構成例２のブロック図。本実施形態に係る制御系の構成例３－１のブロック図。本実施形態に係る制御系の構成例３－２のブロック図。本実施形態に係る制御系の構成例３－３のブロック図。本実施形態に係る制御系の変形例１のブロック図。本実施形態に係る制御系の変形例２のブロック図。比較例の制御系における繰り返しステップ応答波形の重ね合わせ比較図。比較例の制御系におけるチャネル間の温度差を示す図。構成例１の制御系における繰り返しステップ応答波形の重ね合わせ比較図。構成例１の制御系におけるチャネル間の温度差を示す図。構成例２の制御系における繰り返しステップ応答波形の重ね合わせ比較図。構成例２の制御系におけるチャネル間の温度差を示す図。構成例３－１の制御系における繰り返しステップ応答波形の重ね合わせ比較図。構成例３－１の制御系におけるチャネル間の温度差を示す図。

　以下、本発明の実施形態を図面を参照して説明する。

＜本実施形態の概要＞
　まず、本実施形態の概要を説明する。本実施形態における制御系（制御システム）は、例えば、多入出力で、かつ、むだ時間要素を含む制御対象を制御するものである。以下の例では、２入力２出力の制御対象を例に説明するが、制御対象はＮ入力Ｍ出力（Ｎ、Ｍは２以上の整数）でもよい。

　フィードバック（ＦＢ）制御器は、従来のフィードバック（ＦＢ）制御器を使用することができる。制御対象の応答を、むだ時間を有する規範モデルの出力に追従させる。そのために、ニューラルネットワーク制御器において、制御対象の出力（実出力）と規範モデルの出力との誤差を、ニューラルネットワークの教師信号とし、その誤差を例えば最小化するようにニューラルネットワークを学習させる。また、ニューラルネットワーク制御器の出力を、フィードバック制御器の出力に加算して制御対象への入力とし、制御対象を制御する。
　上記の概要を多入出力の制御対象についてより具体的に説明すると、多点の出力（ｙ１、ｙ２）と規範モデル出力ｙｒの誤差（ｅｒ１、ｅｒ２）を教師信号とし、学習によりその誤差を最小化する（構成例１。構成例１では２出力の制御対象に対し教師信号は２つ）。

　さらに、教師信号に多点出力間の誤差信号（ｅ１２）を追加してもよい（構成例２。構成例２では２出力の制御対象に対して教師信号は３つ）。本構成は、より積極的に制御対象の多点出力（ｙ１、ｙ２）の誤差を最小化させる構成である。

　また、誤差ｅ１２に対するニューラルネットワーク制御器の出力信号ｕ１２を、第１の入力ｕ１に負符号で（あるいは第２の入力ｕ２に正符号で、あるいはｕ１とｕ２に例えば半量をそれぞれ負符号と正負号で）加えてもよい（構成例３－１～３－３）。

＜本実施の形態の説明＞
（構成例１）
　図１は、本実施形態に係る制御系の構成例１のブロック図である。本実施形態に係る制御系は、制御対象２を制御する制御装置１を含む。制御装置１は、フィードバック制御器１０と、規範モデル部２０と、ニューラルネットワーク制御器３０と、差分部（差分器４１、４２）と、加算部（加算器１２－１、１２－２）を有する。

　フィードバック制御器１０は、制御対象２の出力に関する予め定められた目標値ｙｄに従い、制御対象２を制御する。フィードバック制御器１０は、制御対象の入力数に応じたフィードバック制御器１０－Ｎ（Ｎは２以上の整数）を有することができる。例えば、フィードバック制御器１０は、予め定められた目標値ｙｄ（ＳＶと記す場合もある）と、制御対象２の出力ｙ（測定値、ＰＶと記す場合もある）の差ｅを入力し、所定の制御演算を行い、制御対象２への操作量を出力する。より具体的には、フィードバック制御器１０（フィードバック制御器１０－１）は、予め定められた目標値ＳＶと、制御対象２の第１の出力ｙ１の差ｅ１を入力し、所定の制御演算を行い、制御対象２の第１の入力への操作量を出力する。制御対象の他の出力についても同様である。

　フィードバック制御器１０は、例えば、メインの制御器として動作する。例えば、フィードバック制御器１０は、モデル化誤差が無く、外乱が無いと仮定した場合に、制御対象２の出力を所望の設計通りに動作させるための制御器である。フィードバック制御器１０としては、例えば、オートチューニングなどで自動的に設計可能なＰＩＤ制御器などを用いることができる。また、フィードバック制御器１０には、行き過ぎ量を抑えたＩ－ＰＤ制御器を用い、目標値に対する立ち上がりはニューラルネットワーク制御器３０で改善することもできる。

　規範モデル部２０は、むだ時間（むだ時間要素）を含み、入力に対する所望の応答波形を出力する。規範モデル部２０は、目標値ｙｄを入力する。規範モデル部２０の入出力の関係は、例えばむだ時間要素を含む１次遅れ系などで表すことができるが、これに限らず、むだ時間要素を含む適宜の関係でもよい。規範モデル部２０のむだ時間は、例えば、制御対象２のむだ時間と同じ時間に設定されることができる。また、規範モデル部２０のむだ時間は、制御対象２のむだ時間と同程度の時間でもよい。ここで同程度とは、例えば、ニューラルネットワーク制御器３０により、制御対象２の出力の応答性が改善される程度であればよい。また、制御対象２のむだ時間を予め定められた桁で丸めた値、換言すると、予め定められた許容誤差の範囲内の値でもよい。一例として、規範モデル部２０のむだ時間は、制御対象２のむだ時間に対してプラスマイナス１０％程度の範囲内であってもよく、プラスマイナス３０％程度の範囲内であってもよい。規範モデル部２０の出力と制御対象２の第１の出力ｙ１との誤差ｅｒ１、及び、規範モデル部２０の出力と制御対象２の第２の出力ｙ２との誤差ｅｒ２を、ニューラルネットワーク制御器３０に教師信号として与える。

　ニューラルネットワーク制御器３０への入力信号には目標値ｙｄと制御対象の出力ｙ１、ｙ２を用いる。また、ニューラルネットワーク制御器３０の出力ｕＮ１、ｕＮ２は、フィードバック制御器１０の出力と加算されて、制御対象２への制御入力（ｕ１、ｕ２）となる。ニューラルネットワーク制御器３０は、ニューラルネットワーク制御器３０の出力の変化（調整）によって制御対象２の出力と規範モデル部２０の出力の誤差ｅｒ１、ｅｒ２が最小化又は予め定められた閾値以下になるようにニューラルネットワークを用いて学習する。例えば、ニューラルネットワーク制御器３０は、評価規範である２乗誤差（ｅｒ１^２、ｅｒ２^２）を最小化するように、最急降下法とバックプロパゲーションにより学習する。ニューラルネットワーク制御器３０は、入力信号と学習結果に応じた出力を供給する。また、ニューラルネットワーク制御器３０からの出力は、上述のようにフィードバック制御器１０の出力と加算されて操作量ｘが求められ、制御対象２へ入力される。このようにニューラルネットワーク制御器３０の出力をフィードバック制御器１０の出力と加算して制御対象２へ入力することで、フィードバック制御器１０とニューラルネットワーク制御器３０の役割分担が可能となる。

　なお、ニューラルネットワークは、入力及び出力と、１又は複数の中間層とを有する。中間層は、複数のノードで構成される。ニューラルネットワークの構成は適宜の構成を用いることができ、ニューラルネットワークの学習方法については公知の学習方法を用いることができる。

　差分部は、制御対象２の出力ｙ１と規範モデル部２０の出力との差（第１の差分）ｅｒ１を求める差分器４１と、制御対象２の出力ｙ２と規範モデル部２０の出力との差（第２の差分）ｅｒ２を求める差分器４２と含む。

　加算部は、フィードバック制御器１０の第１の出力（フィードバック制御器１０－１の出力）とニューラルネットワーク制御器３０の出力ｕＮ１とを加算する加算器１２－１と、フィードバック制御器１０の第２の出力（フィードバック制御器１０－２の出力）とニューラルネットワーク制御器３０の出力ｕＮ２とを加算する加算器１２－２とを含む。

　また、制御装置１は、目標値ｙｄと制御対象２の出力ｙ１，ｙ２との差ｅ１、ｅ２をそれぞれ求める差分器１３－１、１３－２を有してもよい。

　規範モデル部２０とニューラルネットワーク制御器３０は、例えばＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）及びＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）などの処理部と、メモリなどの記憶部を有するデジタル装置によって実装されてもよい。規範モデル部２０とニューラルネットワーク制御器３０の処理部及び記憶部は、共通の処理部及び記憶部を用いてもよいし、別々の処理部及び記憶部を用いてもよい。また、ニューラルネットワーク制御器３０は、複数の処理部を有し、少なくとも一部の処理を並列に実行してもよい。

（構成例１の効果）
　上述の制御装置によると、例えば以下の効果を奏する。ただし、本実施形態の制御装置は、必ずしも以下の全ての効果を奏する装置に限定されるものではない。

　フィードバック制御器１０としてオートチューニングを用いて設計可能な制御器などが利用可能である。そのため、フィードバック制御器１０の設計に際して、制御対象２のモデルが不要である。また、ニューラルネットワーク制御器３０の設計にも制御対象２のモデルが不要であるため、制御装置１の各制御器の設計に対し、モデルが不要である。

　本実施形態の制御系では、規範モデル部２０の出力に制御対象２の出力が追従するよう学習する。規範モデル部２０にむだ時間を持たせることで、制御対象２の出力が無い状態でニューラルネットワーク制御器３０がニューラルネットワークを用いた学習を開始することを回避することができる（すなわち、因果性が成立する）。また、ニューラルネットワークの学習において、むだ時間に先行し学習が行われるという問題を回避できる。したがって、ニューラルネットワークの学習をむだ時間分だけ遅らせる必要がなく、学習周期を意図的に大きくする必要もない。これにより制御対象２の出力を増大させようとニューラルネットワーク制御器３０が過剰な制御入力を与えるといった現象を回避できる。

　フィードバック制御器１０の役割は、主として設計時のノミナル仕様を満たすように動作することである。例えば、フィードバック制御器１０は、制御系における制御装置（コントローラ）としての仕様、ＰＩＤの動作仕様などを満たすように動作する。一方、ニューラルネットワーク制御器３０の役割は、学習の後に制御対象２の出力を規範モデル部２０の出力に追従させるよう動作することである。さらに、ニューラルネットワーク制御器３０は、モデル化誤差や外乱が生じた場合に、モデル化誤差や外乱を補償する。このような誤差や外乱が生じる場合、制御対象２の出力と規範モデル部２０の出力とに誤差が生じることなり、ニューラルネットワーク制御器３０は、この誤差に基づき動作することでモデル化誤差や外乱を補償する。

　また、規範モデル部２０の出力と多点出力との間の誤差を最小化することにより、学習とともに過渡特性改善を行うことが可能となる。また、規範モデル部２０の出力に多点出力が追従することにより、間接的に多点出力間の温度差も小さくなる。

（構成例２）
　図２は、本実施形態に係る制御系の構成例２のブロック図である。

　構成例２は、例えば、多点出力間の誤差を直接的に最小化する構成である。多点間出力誤差（ｅ１２）も教師信号に追加し、その２乗誤差の最小化もニューラルネットワーク制御器３０の学習において直接的に考慮する。この場合、ニューラルネットワーク制御器３０の入力（ｙｄ、ｙ１、ｙ２）は構成例１と同一であるが、教師信号は構成例１に対して１つ加わり、（ｅｒ１、ｅｒ２、ｅ１２）となる。ニューラルネットワーク制御器３０の出力もそれにあわせて３出力となるが、フィードバックゲ制御器１０の出力が２つであるため、それに対応した出力である（ｕＮ１、ｕＮ２）のみを利用する。

　より具体的には、構成例２における制御系において、差分部は差分器４３をさらに有する。差分器４３は、制御対象の出力ｙ１とｙ２の誤差ｅ１２を求め、誤差ｅ１２を教師信号としてニューラルネットワーク制御器３０に与える。その他の構成は、構成例１と同様である。

（構成例２の効果）
　上述の制御装置によると、上述の構成例１の効果に加え、教師信号に多点出力同士の誤差を加えることにより、直接的に多点出力間の温度差も最適化（最小化）することが可能となる。

（構成例３）
　図３～図５は、本実施形態に係る制御系の構成例３－１～３－３のブロック図である。
　構成例３は、ニューラルネットワーク制御器３０の多点間出力誤差ｅ１２に対する出力ｕＮ３を利用する。ここでは、多点出力間誤差ｅ１２に対する出力信号ｕ１２を、フィードバック制御器１０－１の出力に負符号で加え、制御対象の第１の入力ｕ１とする（構成例３－１：図３）。他の構成例として、多点出力間誤差ｅ１２に対する出力信号ｕ１２を、フィードバック制御器１０－２の出力に正符号で加え、制御対象の第２の入力ｕ２とする（構成例３－２：図４）。また、他の構成例として、多点出力間誤差ｅ１２に対する出力信号ｕ１２を、半量ずつ、フィードバック制御器１０－１の出力に負符号で加えて制御対象の第１の入力ｕ１とし、フィードバック制御器１０－２の出力に正符号で加えて制御対象の第２の入力ｕ２とする（構成例３－３：図５）。なお、出力信号ｕ１２は、半量ずつ加える以外に、所定の割合で分割して加えてもよい。また、出力信号ｕ１２を所定の割合で分配する分配部をさらに備えてもよい。このような構成により、さらなる誤差信号の最小化を図ることができる。

（構成例３の効果）
　上述の制御装置によると、上述の構成例１及び２の効果に加え、多点出力間の誤差に対するニューラルネットワーク制御器３０の出力信号ｕ１２を、フィードバック制御器１０－１の出力ｕ１に負符号で加えることにより（又はフィードバック制御器１０－２の出力ｕ２に正負号で加えることにより、又はｕ１とｕ２に例えば半量をそれぞれ負符号と正負号で加えることにより）、制御対象２の出力ｙ１側の温度（又は出力ｙ２側の温度、又はその両方）を制御して、誤差ｅ１２のさらなる最小化が可能である。

（変形例１）
　図６は、本実施形態に係る制御系の変形例１のブロック図である。

　変形例１では、ニューラルネットワーク制御器３０の学習が良好でない、又は制御性能改善に向かわない場合などに、例えば出力制限部がニューラルネットワーク制御器３０の出力を制限し又はゼロにする。この場合でも、初期の基本性能がフィードバック制御器１０により保証される。

　変形例１における制御系は、出力制限部５０をさらに備える。図６には、図２に示す構成例２に対して出力制限部５０を備えた例を示す。なお、図１に示す構成例１に対して出力制限部５０を備えてもよい。他の構成は、構成例１と同様である。

　制限の態様としては、例えば、出力制限部５０は、ニューラルネットワーク制御器３０の出力にリミット処理を行ってもよい。例えば、ニューラルネットワーク制御器３０の出力を、予め定められたリミット値を超えないように制限してもよい。また、出力制限部５０は、ニューラルネットワーク制御器３０の出力に予め定められた係数（０．０～１．０）を掛けて出力してもよい。

　出力制限部５０が、制限を適用する条件としては、フィードバック制御器１０のみでの応答に対して、ニューラルネットワークの動作を加えたときに以下のような状態となる場合に、ニューラルネットワーク制御器３０の出力に制限を掛けるようにしてもよい。なお、この判断は例えば出力制限部５０が測定値等に基づき判断してもよい。
　・フィードバック制御器１０のみの場合より、オーバーシュートが大きくなる場合
　・フィードバック制御器１０のみの場合より、測定値が設定値に安定するまでの時間（整定時間）が長くなる場合
　・ニューラルネットワーク制御器３０の動作を加えたことで、測定値が振動しているとき（例えば、所定時間内に測定値の振動幅が所定以下にならず、測定値が安定しない）。

（変形例２）
　図７は、本実施形態に係る制御系の変形例２のブロックである。図７には、図３に示す構成例３－１に対して出力制限部５０を備えた例を示す。なお、図４に示す構成例３－２、又は図５に示す構成例３－３に対して出力制限部５０を備えてもよい。

　この例では、出力制限部５０にはニューラルネットワーク制御器３０の出力信号ｕ１２も入力される。出力制限部５０の動作、及び他の構成は、変形例１と同様である。

　なお、上述の変形例１及び２における出力制限部は、他の構成例に適用することも可能である。

（本実施の形態の効果）
　本実施形態の制御装置は、以下の効果も有する。
　・規範モデル部２０の出力へ追従する構成であるため、規範モデル部２０の設定及び調整によりニューラルネットワークの学習が進んでも制御入力が過大になりにくい。換言すると、制御対象２の入力を間接的に調整できる。

　・ニューラルネットワーク制御器３０の設計には制御対象のモデルが必要ない。また、オートチューニングにより設計されるフィードバック制御器１０を利用できるため、制御系がモデルレスで設計可能である。

　・ニューラルネットワークの学習が進んでもフィードフォワード構造にシフトせず、フィードバック制御系を維持できる。例えば、規範モデル部２０の出力と制御対象２の出力との誤差がゼロである場合、フィードバック制御器１０のみ動作しているのと同等である。

　・フィードバック制御器１０にＩ－ＰＤ構造を利用することで、ニューラルネットワークの学習経過により行き過ぎ量なく応答性のみを改善することができる。例えば、制御対象２の出力は、制御開始直後は立ち上がりが遅くなるが、行き過ぎ量を抑えつつ、学習が進むにつれ立ち上がりを改善していく、というような制御が可能となる。

　・２入出力以上の多入出力システムへ適用できる。過渡状態を含めて温度均一化制御が可能である。

　また、本実施形態は、例えば、むだ時間を含む規範モデルの出力に多出力となる制御対象の出力を追従させるよう構成されている。ここで、規範モデルのむだ時間は、制御対象の最も大きいむだ時間とすることができる。本構成により、ニューラルネットワークの学習において、むだ時間に先行し学習が行われるという課題を回避できる。また、学習をむだ時間分遅らせたり、学習周期を故意に大きくする必要もない。

　本実施形態は、例えば、フィードバック（ＦＢ）制御器の出力にニューラルネットワーク（ＮＮ）による制御器の出力を加算するよう構成されている。本構成により、フィードバック制御器の設計はオートチューニングによる自動調整が可能であり、かつニューラルネットワーク制御器の設計には制御対象のモデルが不要である。このように、全ての制御系の設計に対し、モデルが不要である。また、制御対象の応答は規範モデルの応答に一致することが目標であり、学習が進んでも制御入力が過大にならない。換言すると、制御対象の入力を間接的に調整できる。

　本実施形態は、例えば、フィードバック制御器とニューラルネットワーク制御器の役割分担が明確である。フィードバック制御の基本性能は主としてフィードバック制御器により保証され、規範モデルとの誤差や外乱、モデル化誤差の補償は主としてニューラルネットワーク制御器により保証される。仮にニューラルネットワーク制御器の学習が良好でない、又は制御性能改善に向かわない場合などは、ニューラルネットワーク制御器の出力を制限し又はゼロとしても初期の基本性能がフィードバック制御器により保証される。

　本実施形態の構成において、フィードバック制御器にＩ－ＰＤ制御器を導入することで、制御開始直後は立ち上がりは犠牲になるが行き過ぎ量を抑えつつ、学習が進むにつれ立ち上がりを改善していく、という制御が可能である。

　本実施形態の制御系は、規範モデルの出力に多出力が追従するよう学習するため、過渡状態の特性改善に加え、多点（多出力）での出力均一化制御、すなわち出力温度差の低減が可能である。

　さらに、出力間温度差を教師信号として追加することで、より直接的に（効果的に）温度差を低減することも可能である。

　また、出力間温度差の教師信号に対するニューラルネットワーク制御器の出力をいずれか一方のフィードバック制御器出力に（あるいは半量を両方のフィードバック制御器出力に）加えることで、更なる温度差低減が可能である。

（適用例）
　本実施形態によると、例えば多点温度制御においてニューラルネットワークに基づく制御器とフィードバック制御器を併用したモデル規範型多入出力制御系を実現できる。また、多点の温度出力の均一化とともに、その温度出力を時間経過とともに学習的に目標値へ追従するよう特性改善することができる。

（シミュレーション結果）
　本実施形態における制御装置１を用いた制御系のシミュレーション結果及び効果を、比較例と対比して説明する。

　一例として、２入力２出力むだ時間システムでのシミュレーション結果について以下に示す。各入出力間（干渉項含む）の制御対象は１次遅れ＋むだ時間とした。また、第１の出力（ｃｈ１）のむだ時間と時定数の比（ＬＴ比）は１：１３で、第２の出力（ｃｈ２）のＬＴ比は１：１６である。目標値は温度で１００－１０５度の矩形波信号とした。

　まずは参考としてＩ－ＰＤ制御系に対するステップ応答を図８に示す。上段が目標値を正方向に変化させた場合（１００から１０５度へ変化）の応答波形を示し、下段が負方向（１０５から１００度へ変化）の応答波形を示す。規範モデル部２０の出力を破線で示し、制御対象２の第１の出力ｙ１を実線で示し、制御対象２の第２の出力ｙ２を一点鎖線で示す。なお、図８において、横軸は時間、縦軸は温度である。以降の同様の図のついても、横軸、縦軸及び線種は同様である。図９に、目標値を正方向に変化させた場合の出力間温度差（ｙ１－ｙ２）を示す。なお、図９において、横軸は時間、縦軸は温度差である。以降の同様の図のついても、横軸及び縦軸は同様である。

　続いて、教師信号を２つ（ｅｒ１、ｅｒ２）とした場合の構成例１（図４）において、同様のシミュレーションを行った結果を図１０と図１１に示す。同図より、行き過ぎ量が改善されていることが確認できる。また、Ｉ－ＰＤ制御系の結果の比較より、ステップ指令印加時の短時間は温度差が増大しているものの、それ以降は温度差が低減されていることが確認できる。

　さらに、教師信号に２出力間の温度差（ｅ１２＝ｙ１－ｙ２）を追加した３教師信号（ｅｒ１、ｅｒ２、ｅ１２）での構成例２（図２）において、同様のシミュレーションを行った結果を図１２と図１３に示す。図１３では比較のため、参考としてのＩ－ＰＤ制御系、構成例１（ＮＮ：２ＴＳ）及び構成例２（ＮＮ：３ＴＳ）の制御系での出力温度差を示している。同図より、教師信号に温度差を追加したことによりステップ指令印加時の温度差も他の制御系に比べ低減できていることが確認できる。

　また、教師信号ｅ１２に対するニューラルネットワーク制御器３０の出力ｕ１２をｕ１に負符号で加算した場合（構成例３－１、図３）において、同様のシミュレーションを行った結果を図１４と図１５に示す。図１５より、最大誤差とそのゼロへの収束が改善されていることが確認できる。この改善特性は、ｕ１２をｕ２へ正負号で加算した場合、及びｕ１２の半量をｕ１とｕ２にそれぞれ負符号と正負号で加えた場合にも同様の結果がえられる。

　以上、各制御構造に対する学習後のｙ１－ｙ２の最大誤差と１ステップでの２乗誤差和を比較して表１に示す。

　以上より、多入出力むだ時間制御系において、多出力を規範モデル出力に追従するようニューラルネットワーク制御器を学習させることで、過渡特性改善に加え、多出力間の温度差を最小化（均一化）できることがわかる。さらに、温度差そのものを教師信号に加えることで、より効果的に温度差を最小化できることがわかる。

（その他）
　上述の実施形態では、主に２入力２出力の系を例に説明したが、Ｎ入力以上の系、Ｍ出力以上の系（Ｎ、Ｍは３以上の整数）にも適用できる。なお、Ｎ＝Ｍでもよい。制御対象が３出力以上の場合、各出力と教師モデル部の出力との差を教師信号としてもよい。また、３以上の出力のうち任意の複数の出力について、当該出力と教師モデル部の出力との差を教師信号としてもよい。構成例２における誤差信号ｅ１２については、３以上の各出力の組み合わせ全ての誤差信号を教師信号として用いてもよい。若しくは、３以上の出力のうち任意の複数の出力の組み合わせについての誤差信号を教師信号として用いてもよい。例えば、第１の出力ｙ１を基準出力とし、基準出力と他の出力との各誤差信号を教師信号として用いてもよい。構成例３のように、ニューラルネットワーク制御器からの、誤差信号に対する出力をフィードバック制御器からの出力に加算する場合は、誤差信号に対する出力のひとつ又は複数を、構成例３での説明と同様に、対応するフィードバック制御器のいずれかの出力に負符号又は正符号で加算してもよいし、半量ずつ負符号又は正符号で加算してもよい。

　上述の実施形態では、ニューラルネットワーク制御器３０はニューラルネットワークを用いて学習したが、ニューラルネットワーク以外の機能を用いて学習してもよい。すなわち、ニューラルネットワーク制御器３０は学習型制御器でもよい。また、制御装置１のうちフィードバック制御器１０を含まない構成を有する第２の制御装置を提供することもできる。例えば、予め設計された既存のフィードバック制御器を用いて制御対象を制御する制御系に、規範モデル部２０とニューラルネットワーク制御器３０を有する制御装置が適用して上述の制御系を構成してもよい。

　上述の各構成及び処理は、処理部と記憶部を有するコンピュータで実現することも可能である。処理部は、各構成の処理を実行する。記憶部は、処理部が実行するプログラムを記憶する。上述の処理は、処理部が実行する制御方法としても実現可能である。また、処理部に上述の処理を実行させるための命令を含むプログラム又はプログラム媒体、該プログラムを記憶したコンピュータ読み取り可能な記録媒体及び非一時的な記録媒体等により実現可能である。

　本実施形態の制御装置及び制御系は、例えば、多入出力でむだ時間を有する制御対象を制御する制御系に適用可能である。一例として、プロセス制御系や温度調整系に適用可能である。より具体的な例としては、温調・空調システム、射出成型機及び押出成形機などが挙げられる。

１　制御装置
２　制御対象
１０　フィードバック制御器
１２　加算器（加算部）
２０　規範モデル部
３０　ニューラルネットワーク制御器
４１，４２，４３　差分器（差分部）
５０　出力制限部

Claims

　むだ時間要素を含み、第１の入力及び第２の入力を含む複数の入力と、第１の出力及び第２の出力を含む複数の出力とを有する制御対象を制御する制御装置であって、
　前記制御対象を制御するフィードバック制御器と、
　むだ時間要素を含み、所望の応答波形を出力する規範モデル部と、
　前記制御対象からの前記第１の出力と前記規範モデル部からの応答波形との差である第１の差分、及び、前記制御対象からの前記第２の出力と前記規範モデル部からの応答波形との差である第２の差分をそれぞれ求める差分部と、
　前記第１の差分及び前記第２の差分が教師信号として与えられ、出力が前記フィードバック制御器の出力と加算されて前記制御対象に入力される学習型制御器であって、前記学習型制御器からの出力の変化により前記第１の差分及び前記第２の差分が最小又は予め定められた閾値以下になるように、学習する前記学習型制御器と、
を備えた制御装置。
　前記学習型制御器は、前記第１の差分に対応する第３の出力と、前記第２の差分に対応する第４の出力とを出力し、
　前記制御装置は、
　　前記フィードバック制御器から前記制御対象の前記第１の入力への出力に、前記学習制御器からの前記第３の出力を加算し、及び、前記フィードバック制御器から前記制御対象の前記第２の入力への出力に、前記学習制御器からの前記第４の出力を加算する加算部をさらに備える請求項１に記載の制御装置。
　前記差分部は、前記制御対象からの前記第１の出力と前記制御対象からの前記第２の出力との差である第３の差分を求め、
　前記学習型制御器は、前記第３の差分が教師信号としてさらに与えられ、前記学習型制御器からの出力の変化により前記第１の差分及び前記第２の差分及び前記第３の差分が最小又は予め定められた閾値以下になるように、学習する請求項１に記載の制御装置。
　前記学習型制御器は、前記第３の差分に対応する第５の出力を出力し、
　前記加算部は、さらに、
　前記学習型制御器からの前記第５の出力を、前記フィードバック制御器から前記制御対象の前記第１の入力への出力に、若しくは、前記フィードバック制御器から前記制御対象の前記第２の入力への出力に正符号若しくは負符号で加算し、又は、前記フィードバック制御器から前記制御対象の前記第１の入力への出力と前記第２の入力への出力の双方に分割して正符号若しくは負符号で加算する請求項１に記載の制御装置。
　前記学習型制御器から前記加算部への出力を制限する出力制限部
をさらに備える請求項１乃至４のいずれかに記載の制御装置。
　むだ時間要素を含み、第１の入力及び第２の入力を含む複数の入力と、第１の出力及び第２の出力を含む複数の出力とを有する制御対象を、予め設計されたフィードバック制御器を用いて制御する制御系に適用される制御装置であって、
　むだ時間要素を含み、所望の応答波形を出力する規範モデル部と、
　前記制御対象からの前記第１の出力と前記規範モデル部からの応答波形との差である第１の差分、及び、前記制御対象からの前記第２の出力と前記規範モデル部からの応答波形との差である第２の差分をそれぞれ求める差分部と、
　前記第１の差分及び前記第２の差分が教師信号として与えられ、出力が前記フィードバック制御器の出力と加算されて前記制御対象に入力される学習型制御器であって、前記学習型制御器からの出力の変化により前記第１の差分及び前記第２の差分が最小又は予め定められた閾値以下になるように、学習する前記学習型制御器と、
を備えた制御装置。