JP2020060827A - 制御装置および制御方法 - Google Patents

制御装置および制御方法 Download PDF

Info

Publication number
JP2020060827A
JP2020060827A JP2018189695A JP2018189695A JP2020060827A JP 2020060827 A JP2020060827 A JP 2020060827A JP 2018189695 A JP2018189695 A JP 2018189695A JP 2018189695 A JP2018189695 A JP 2018189695A JP 2020060827 A JP2020060827 A JP 2020060827A
Authority
JP
Japan
Prior art keywords
control
amount
neural network
disturbance
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018189695A
Other languages
English (en)
Other versions
JP7034046B2 (ja
Inventor
服部 哲
Satoru Hattori
哲 服部
敬規 高田
Takanori Takada
敬規 高田
佑樹 田内
Yuki Tanaka
佑樹 田内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018189695A priority Critical patent/JP7034046B2/ja
Priority to CN201910881209.6A priority patent/CN111001660B/zh
Priority to DE102019214548.5A priority patent/DE102019214548A1/de
Publication of JP2020060827A publication Critical patent/JP2020060827A/ja
Application granted granted Critical
Publication of JP7034046B2 publication Critical patent/JP7034046B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B21MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
    • B21BROLLING OF METAL
    • B21B13/00Metal-rolling stands, i.e. an assembly composed of a stand frame, rolls, and accessories
    • B21B13/14Metal-rolling stands, i.e. an assembly composed of a stand frame, rolls, and accessories having counter-pressure devices acting on rolls to inhibit deflection of same under load; Back-up rolls
    • B21B13/147Cluster mills, e.g. Sendzimir mills, Rohn mills, i.e. each work roll being supported by two rolls only arranged symmetrically with respect to the plane passing through the working rolls
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B21MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
    • B21BROLLING OF METAL
    • B21B2275/00Mill drive parameters
    • B21B2275/02Speed
    • B21B2275/06Product speed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B21MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
    • B21BROLLING OF METAL
    • B21B37/00Control devices or methods specially adapted for metal-rolling mills or the work produced thereby
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B21MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
    • B21BROLLING OF METAL
    • B21B37/00Control devices or methods specially adapted for metal-rolling mills or the work produced thereby
    • B21B37/28Control of flatness or profile during rolling of strip, sheets or plates

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Mechanical Engineering (AREA)
  • Feedback Control In General (AREA)
  • Control Of Metal Rolling (AREA)

Abstract

【課題】予測精度の高いフィードフォワード制御を実現する。【解決手段】制御装置は、制御対象の制御された結果である制御状態量と前記制御対象に加わった外乱との関係を学習することにより、前記制御対象へ入力される外乱から前記制御対象の制御状態量の変化量を予測する第1フィードフォワード制御ニューラルネットワークを構築するフィードフォワード制御方法学習装置と、前記第1フィードフォワード制御ニューラルネットワークに基づいて前記制御対象へ加わる外乱から前記制御対象の制御状態量の変化量を予測し、該制御状態量の変化量に基づいて前記制御操作量を直接的あるいは間接的に補正するフィードフォワード制御実行装置と、を有する。【選択図】図4

Description

本発明は、ニューラルネット等の人工知能を用いた実時間のフィードバック制御を行う技術に関する。
従来から、各種のプラントにおいてはその制御により所望の制御結果を得るために各種制御理論に基づいたプラント制御が実施されている。
プラントの一例として例えば圧延機制御においては、制御の一例として板の波打ち状態を制御する形状制御を対象とした制御理論として、ファジィ制御やニューロ・ファジィ制御が適用されてきた。ファジィ制御は、クーラントを利用した形状制御に、また、ニューロ・ファジィ制御は、センジミア圧延機の形状制御に適用されている。このうちニューロ・ファジィ制御を適用した形状制御は、特許文献1に示されるように、形状検出器で検出された実績形状パターンと目標形状パターンの差と、予め設定された基準形状パターンとの類似割合を求め、その類似割合からこれも予め設定された基準形状パターンに対する制御操作端操作量によって表現された制御ルールにより、操作端に対する制御出力量を求めることにより行われている。以下、従来技術として、ニューロ・ファジィ制御を用いたセンヂミア圧延機の形状制御を用いるものとする。
図1に、特許文献1の図1に記述されたセンヂミア圧延機の形状制御を示す。センヂミア圧延機の形状制御では、ニューロ・ファジィ制御が用いられる。この例では、パターン認識機構51で、形状検出器52にて検出した実形状より形状のパターン認識を行い、実形状が予め設定された基準形状パターンのどれに最も近いかを演算する。制御演算機構53では、図2で示すような予め設定された形状パターンに対する制御操作端操作量で構成される制御ルールを用いて制御を実施する。図2についてより具体的に述べると、パターン認識機構51では、形状検出器52にて検出した形状実績と目標形状(εref)との差分(Δε)が、1から8の形状パターン(ε)のどれに最も近いかを演算し、制御演算機構53では、1から8の制御方法のいずれかを選択し実行する。
特許2804161号公報
圧延機においては、被圧延材の形状の他、被圧延材の板厚、張力等を一定とする板厚制御、張力制御の他、圧延速度を加減速する自動または手動の操作が実施される。板厚制御、張力制御は、その目的のため圧延機の圧延荷重、圧延速度等を変動させる。それらの変動は、形状にも影響を与える。
例えば、圧延荷重が増加すると、圧延機を構成するロールのたわみが大きくなり、耳延び形状が発生する。その場合、形状制御(フィードバック制御)が耳伸び形状を抑制する方向に動作して、形状を一定に維持しようとする。圧延荷重が増加する事による、形状変化する事が予め予測できれば、それに応じて形状制御(フィードバック制御、以下形状FB制御と略記する)が動作するのを待つことなくフィードフォワード的に形状制御操作端を操作して形状変動を未然に防ぐ事が可能である(これを形状FF制御と略記する)。
形状FF制御を実施するためには、形状が圧延荷重や圧延速度によりどのように変化するか予測する必要が有る。しかしながら、圧延状態が異なる状態において形状変化を予測するモデルを作成する事は困難である。また、気温や圧延油、圧延機のロール等の機械条件が変化しても、形状変化は変動する問題が有る。
上記で示したように、一般的な制御対象プラントにおいて、複数の制御系が適用されている場合において、他の制御系の操作量が自分の制御系へ与える影響を予測してフィードフォワード制御を実施する場合においては、影響の予測精度が低いと、制御効果が減少するばかりでなく、逆に自分の制御系へ与える影響を増大してしまう場合が発生する。
そのため、影響の予測精度を上げる必要が有り、制御対象の数式モデルを用いて予測する事が一般的である。しかしながら、数式モデルを用いた場合、制御対象のモデル化が不十分である場合が多い。また、制御対象の状態が外部要因の影響等で変化した場合、それを反映させるのは困難である。
従来のフィードフォワード制御においては、制御対象のモデル化が不十分であり、制御精度が悪化するという問題が有った。
本発明の目的は、予測精度の高いフィードフォワード制御を実現する技術を提供することである。
本開示による制御装置は、対象とする制御操作と該制御操作に対する外乱とが加わる制御対象を制御する制御装置であって、学習データとして前記制御対象の制御された結果である制御状態量と前記制御対象に加わった外乱との組合せを学習することにより、前記制御対象への外乱から前記制御対象の制御状態量の変化量を予測するための第1フィードフォワード制御ニューラルネットワークを構築するフィードフォワード制御方法学習装置と、前記第1フィードフォワード制御ニューラルネットワークに基づいて前記制御対象への外乱から前記制御対象の制御状態量の変化量を予測し、該制御状態量の変化量に基づいて前記制御操作の操作量である制御操作量を直接的あるいは間接的に補正して前記制御対象への制御出力とするフィードフォワード制御実行装置と、を有する。
本開示によれば、予測精度の高いフィードフォワード制御を実現することが期待される。
特許文献1の図1に記述されたセンヂミア圧延機の形状制御を示す図である。
予め設定された形状パターンに対する制御操作端操作量で構成される制御ルールを示す図である。
制御対象プラントの構成の概要を示す図である。
FF制御について説明するための図である。
FF制御について説明するための図である。
プラント制御装置の概要を示す図である。
外乱パターンに対する制御操作端操作量で構成される制御ルールを示す図である。
制御ルール実行部の具体的な構成事例を示す図である。
制御ルール学習部の具体的な構成事例を示す図である。
センヂミア圧延機の形状制御に用いる場合のニューラルネット構成を示す図である。
学習データデータベースに保存された学習データの例を示す図である。
ニューラルネット管理テーブルの構成を示す図である。
学習データデータベースの構成を示す図である。
実施例2におけるFF制御について説明するための図である。
実施例3における圧延機の初期設定について説明するための図である。
実施例3におけるFF制御について説明するための図である。
まず、本発明における知見、並びに本発明に至る経緯について圧延機の形状制御を例にして説明をしておく。
図3は、制御対象プラントの構成の概要を示す図である。ここでは、制御対象プラントに対して、制御Aおよび制御Bが実施されている。制御対象プラントの状態量xは、制御Aから制御対象プラントへの制御出力量uと、制御Bおよび/または手動操作から制御対象プラントへの制御出力量dと、により変動する。この制御プラントの状態量xの変動量をXとする。
制御Aは制御プラントの状態量のうち一部を制御し、制御Bは他の一部の状態量を制御とする。状態量yが制御Aの制御する状態量であり、状態量y’が制御Bの制御する状態量である。制御Aが制御する状態量yは、制御Aの制御出力(操作量)uだけでなく、制御Bの制御出力(操作量)dによっても変化する。そのため、制御Aにとって制御Bの制御出力dは外乱となる。同様に、制御Bにとっては制御Aの制御出力uが外乱となる。
本発明の実施形態では説明の都合上、制御Aを自制御とし、制御Aの制御出力uを制御出力とし、制御Bの制御出力dを外乱として扱うものする。ただし、その逆についても同様のことが言える。
本発明の実施形態では、圧延機による板の形状制御を例とする。制御Aは、板の形状のフィードバック制御(以下「形状FB制御」ともいう)であり、制御Bは、板厚および張力の制御であるとする。また、状態量yが形状であり、状態量y’が板厚および張力である。制御出力uがAS−Uおよび中間ロールの操作量であり、制御出力(外乱)dが速度および荷重の操作量である。
本発明の実施形態における形状FB制御は、学習データとして基準となる形状パターンとその形状パターンに対する制御操作との組合せを学習し、学習結果を用いて制御操作を実施するというものである。
本発明の実施形態のニューラルネットワークは、圧延機で発生した形状パターンを入力とし、その形状パターンに対する、補正すべき制御操作の変化量を出力とする。形状FB制御においては、基準となる形状パターンとその形状パターンに対する制御操作との組合せを変化させることにより、制御結果が良くなるように制御操作を変更していくことになる。
学習データとして、基準となる形状パターンとその形状パターンに対する制御操作との組合せを学習して学習結果を本ニューラルネットワークに適用することが可能であり、この学習により、本ニューラルネットワークは制御結果の良否に応じて形状パターンに対する制御操作を好適なものへと変更していく。
本発明の実施形態では、このようなニューラルネットワークによる形状FB制御に対しても、この形状FB制御のニューラルネットワークと同様の考え方で構築した別のニューラルネットワークによる補正を実施する。形状FB制御に対する補正はフィードフォワード制御(以下「FF制御」ともいう)により実施する。
図4は、FF制御について説明するための図である。図4におけるFB制御が上述した形状FB制御に相当する。本発明の実施形態のFF制御には、FF制御−1と、FF制御−2という2つFF制御が含まれている。FF制御−2は、制御対象プラントに対するフィードフォワード制御である。FF制御−1は、FB制御に対するフィードフォワード制御である。ここでは説明の便宜上、FF制御−1とFF制御−2はそれぞれ別個のニューラルネットワークで構成されるものとする。
FF制御−1のニューラルネットワーク(第1FF制御ニューラルネットワーク)は、図4において実線の矢印で示されているように、外乱を入力とし、FB制御への入力である制御偏差の変化量を出力とする。このFF制御−1のニューラルネットワークは、外乱に基づいて制御対象状態量(制御偏差)の変化を予測する。その予測した制御対象状態量(制御偏差)の変化に基づいて、制御対象状態量(制御偏差)を補正することになる。
FF制御−2のニューラルネットワーク(第2FF制御ニューラルネットワーク)は、図4において実線の矢印で示されているように、外乱を入力とし、FB制御の出力である制御操作量の変化量を出力とする。このFF制御−2のニューラルネットワークは、外乱に基づいて、形状FB制御が動かすべき(補正すべき)制御操作量の変化量を予測する。その予測した制御操作量の変化量に基づいて、制御操作量を補正することになる。
上述したように、FF制御−1のニューラルネットワークは、外乱(速度、荷重)が入力であり、制御対象状態量(形状)の変化量が出力である。従って、FF制御−1のニューラルネットワークの学習に用いる教師データは、図4において破線の矢印で示されているように、そのニューラルネットワークの出力となる制御対象状態量(形状)である。制御対象状態量と外乱との関係を学習することとなる。
同様に、FF制御−2のニューラルネットワークは、外乱(速度、荷重)が入力であり、制御操作量(AS−U、中間ロール)の変化量が出力である。従って、FF制御−2のニューラルネットワークの学習に用いる教師データは、図4において破線の矢印で示されているように、そのニューラルネットワークの出力となる制御操作量(AS−U、中間ロール)である。制御操作量と外乱との関係を学習することとなる。
このような本発明の実施形態の構成によれば、FF制御−2によりFB制御の出力である制御操作量の変化量を補正することで制御対象プラントの制御の精度を向上するとともに、そのFF制御−2の出力する補正量の過不足により残った制御対象状態量の目標との偏差をFF制御−1により補正することでFB制御の動作を速めることができる。また、その補正により制御対象プラントの制御対象状態量の目標との偏差を小さくすることができ、その結果、FF制御−2のニューラルネットワークの制御結果の良否に応じた学習の精度を向上することができる。
図5は、本発明の実施形態におけるFF制御について説明するための図である。
本発明の実施形態のFF制御系は所定のサンプリング周期で外乱、状態量変化、操作量変化等をサンプリングし、FF制御を実行する。図5の上段に示すように、本発明の実施形態のような圧延機の形状FB制御では、板の形状の制御に対する外乱となる圧延速度の変動は、形状の制御において制御操作を更新する制御周期に比べて長時間にわたって継続する。例えば、圧延速度を加速している時間と圧延速度を減速している時間は、形状の制御の制御周期に比べて長い。そのため、外乱が発生する前後の時間、つまり圧延速度が変動する前後の圧延速度が一定である時間で板の形状が目標形状に近い状態で取得される実績データでニューラルネットワークの学習を行うことは妥当でなく、圧延速度が変動する間にも実績データを取得し、ニューラルネットワークの学習に用いるのが妥当である。
本発明の実施形態では、圧延速度が変動する間もFF制御(FF制御−1とFF制御−2)が最適であれば形状の目標との偏差(以下「形状偏差」ともいう)は変動しないとし、制御周期によるサンプリング点とサンプリング点の間に生じる形状偏差の変化量Δε(i)はFF制御が不十分なために生じたものとみなす。また、FF制御−2のニューラルネットワークの出力は、図5の下段に示すような、制御対象プラントに入力される制御操作量のサンプリング点間での変化量Δu(i)であるとする。また、外乱は、図5の上段に示すような、外乱量d(i)と、その外乱量d(i)の変化量である外乱変化量Δd(i)であるとする。この外乱変化量Δd(i)は、外乱量d(i)の1回前のサンプリング時の外乱量d(i−1)との偏差とする。i−1からiに外乱が変化した結果がi+1で検出器にて測定されたと考える。
FF制御−2では、制御操作量の変化量Δu(i)が次回のFF制御−2の出力となる。最適な状態でなければ、FF制御−2が、変化量Δu(i)だけ制御操作量u(i)を補正した結果として、制御対象状態量には、図5の中段に示すような、形状偏差に変化量Δε(i)が残る。FF制御−1は、この形状偏差の変化量Δε(i)を予測し、FB制御に入力される制御対象状態量(制御偏差)に加算(補正)する。このFF制御−2とFF制御−1を繰り返すことにより、最終的には、FF制御−2が変化量Δu(i)だけFB制御の出力を補正するという動作を繰り返すことにより、形状偏差の変化量Δε(i)が0(ゼロ)になることが期待される。
なお、ここでは判りやすくするためFF制御−1、FF制御−2としたが、実際はFF制御として1つのニューラルネットにより実現する事も可能であり、以下の実施例においても1つのニューラルネットとする。
以下、より具体的な実施例について図面を用いて詳細に説明する。
図6に、本実施例に係るプラント制御装置の概要を示す。図6のプラント制御装置は、制御対象プラント1と、制御対象プラント1に対してフィードバック制御を行うFB制御装置2と、制御対象プラント1への外乱Siを入力して図7に例示したような制御ルールに従い定めた制御操作補正量SO2および状態量補正量SO1を制御対象プラント1への制御に与える制御実行装置20と、制御対象プラント1への外乱Siなどを入力して学習を行い、学習した制御ルールを制御実行装置20における制御ルールに反映させる制御方法学習装置21と、複数のデータベースDB(12、13)、並びにデータベース管理テーブル15から構成されている。
FB制御装置2、制御実行装置20、および制御方法学習装置21は、各装置の実行する処理を規定したソフトウェアプログラムをプロセッサにより実行するコンピュータにより実現されるものであってもよい。また、各装置が複数のコンピュータにより実現されるものであってよい。また、それらの装置のうち2つまたは全てが同一のコンピュータにより実現されてもよい。
FB制御装置2は、フィードバック制御用のニューラルネットワークを用いて上述した形状FB制御を実行する装置である。制御ルールはニューラルネットワーク(以下「ニューラルネット」ともいう)により実現される。制御操作補正量は、制御操作量をどれだけ補正すべきかを示す値であり、制御操作量の変化量に相当する。状態量補正量は、状態量をどれだけ補正すべきかを示す値であり、状態量の変化量に相当する。制御方法学習装置21は、上述した第1FF制御ニューラルネットおよび第2FF制御ニューラルネットを構築する装置である。制御実行装置20は、上述した第1FF制御ニューラルネットおよび第2FF制御ニューラルネットを用いて、上述したFF制御を実行する装置である。
制御実行装置20は、制御ルール実行部10を主たる要素として構成されている。
このうち制御実行装置20においては、まず制御対象プラント1である圧延機の外乱Siより、制御ルール実行部10の入力データS1を作成する。制御ルール実行部10は、制御対象の外乱Siと制御操作端操作指令S2の関係を表現するニューラルネット(制御ルール)を用いて、制御対象の外乱Siから制御操作端補正量SO2を作成する。また、制御対象の外乱Siと制御状態量S3の関係を表現するニューラルネット(制御ルール)を用いて、制御対象の外乱Siから制御状態量補正量SO1を作成する。
以上のように構成された制御実行装置20は、その処理実行のために、さらに後述するように、制御ルールデータベース12を参照する。制御ルールデータベース12は、制御実行装置20内の制御ルール実行部10と、後述する制御方法学習装置21内の制御ルール学習部11の双方にアクセス可能に接続されている。制御ルール学習部11における学習結果としての制御ルール(ニューラルネット)が制御ルールデータベース12に格納されており、制御ルール実行部10は制御ルールデータベース12に格納された制御ルールを参照する。
図8は、本実施例に係る制御ルール実行部10の具体的な構成事例を示している。制御ルール実行部10は、入力データS1を入力して、制御状態量補正量SO1および制御操作端補正量SO2を出力する。制御ルール実行部10はニューラルネット101を備えている。ここではニューラルネット101は、上述した第1FF制御ニューラルネットと第2FF制御ニューラルネットを一体的に構成したものである。ニューラルネット101では基本的には図7に例示したような手法により制御状態量補正量SO1および制御操作端補正量SO2を定めている。本実施例においては、制御ルール実行部10はさらにニューラルネット選択部102を備えており、制御ルールデータベース12に格納された制御ルールを参照することで、ニューラルネット101における制御ルールとして、最適な制御ルールを選択し、実行せしめる。このように図8の制御ルール実行部10においては、オペレータ班や制御目的で分けられた複数のニューラルネットから、必要なニューラルネットを選択し、使用している。制御ルールデータベース12には、制御対象プラント1からのデータとして、ニューラルネットを選択できるような実績データ(操業班のデータ等)Siも含むのがよい。なお、ニューラルネットを実行すると制御ルールになるという関係にあることから、本開示においてはニューラルネットと制御ルールを区別せず、同義の意味で使用している。
図6に戻り、制御方法学習装置21においては、制御実行装置20で使用するニューラルネット101の学習を実施する。制御実行装置20が制御対象プラント1に対して、制御を実施した場合、形状制御の制御サンプリングに応じて実績データを得るため、図5にて示したように、前回値との偏差が必要となる。このため、制御サンプリング時間だけ時間遅れさせたデータを用いて前回値との偏差を得る。図6において、Z−1は、各データに対する制御サンプリング周期に応じた時間遅れを生じさせる機能部を表している。
制御方法学習装置21は、学習データ作成部7、制御ルール学習部11、制御ルールデータベース12、学習データデータベース13を主たる要素として構成されている。
制御方法学習装置21内の学習データ作成部7においては、制御対象プラント1への、制御出力S2および制御対象プラント1の状態量S3の、前回制御サンプリングとの偏差を作成して入力データとし、ニューラルネットの学習に使用する新規の教師データS7aを作成し、制御ルール学習部11に与える。なお、教師データS7aは、制御ルール実行部10が出力する制御状態量補正量SO1および制御操作端補正量SO2に対応するものである。
図9は、本実施例に係る制御ルール学習部11の具体的な構成事例を示している。制御ルール学習部11は、入力データ作成部114、教師データ作成部115、ニューラルネット処理部110、ニューラルネット選択部113を主たる構成要素として構成されている。また制御ルール学習部11は、外部からの入力としてデータS8aを、学習データ作成部7からの新規の教師データS7aを得、また制御ルールデータベース12および学習データデータベース13に蓄積されたデータを参照する。
また制御ルール学習部11において、学習データ作成部7からの新規の教師データS7aは、教師データ作成部115において学習データデータベース13に記憶されている過去の教師データS7bも含めた合計の教師データS7cとして、ニューラルネット処理部110に与えられる。これらの教師データS7a、S7bは、適宜、学習データデータベースDB3に記憶されて、利用される。
同様に、制御入力データ作成部2からの入力データS8aは、入力データ作成部114において学習データデータベース13に記憶されている過去の入力データS8bも含めた合計の入力データS8cとして、ニューラルネット処理部110に与えられる。これらの入力データS8a、S8bは、適宜、学習データデータベース13に記憶されて、利用される。
ニューラルネット処理部110は、ニューラルネット111とニューラルネット学習制御部112により構成されており、ニューラルネット111は、入力データ作成装置114からの入力データS8c、教師データ作成部115からの教師データS7c、ニューラルネット選択部113が選択した制御ルール(ニューラルネット)を取り込み、最終的に決定したニューラルネットを制御ルールデータベース12に格納する。
ニューラルネット学習制御部112は、入力データ作成装置114、教師データ作成部115、ニューラルネット選択部113に対して、適宜のタイミングでこれらを制御し、ニューラルネット111の入力を得、また処理結果を制御ルールデータベース12に格納すべく制御している。
ここで、図8の制御実行装置20におけるニューラルネット101と、図9の制御方法学習装置21におけるニューラルネット111は、いずれも同じ概念のニューラルネットであるが、利用するうえでの基本概念上の相違について説明をしておくと、以下のようである。まず制御実行装置20におけるニューラルネット101は、予め定められた内容のニューラルネットであり、入力データS1を与えたときに対応する出力としての制御状態量補正量SO1および制御操作端補正量SO2を求めるものであり、いわば一方方向の処理に利用されるニューラルネットである。これに対し、制御方法学習装置21におけるニューラルネット111は、入力データS1と制御状態量補正量SO1および制御操作端補正量SO2についての入力データS8c、教師データS7cを学習データとして設定したときに、この入出力関係を満足するニューラルネットを学習により求めるためのものである。
また図9に例示する制御ルール学習部11においては、ニューラルネット学習制御部112によるデータ処理の結果として、以下のように処理している。ここでは、まず制御実行装置20への入力データS1を時間遅れさせたS8cと、教師データ作成部115にて作成した教師データS7cの組合せである学習データを用いて、制御ルール実行部10にて用いたニューラルネット101の学習を実施する。実際には、制御ルール実行部10のニューラルネット101と同じニューラルネット111を制御ルール学習部11内に備えて、各種条件で運用テストしてその時の応答を学習し、学習の結果としてより良い結果を生じることが確認された制御ルールを得るものである。学習は、複数個の学習データを用いて行わせる必要があるため、過去に作成された学習データを蓄積している学習データデータベース13より、過去の学習データを複数個取り出して、学習し処理を実施するとともに、今回の学習データを学習データデータベース13に格納する。また、学習したニューラルネットは、制御ルール実行部10にて利用するために、制御ルールデータベース12に格納される。
ニューラルネットの学習は、新しい学習データが作成される毎に、過去の学習データを一緒に用いて学習しても良いし、学習データがある程度(例えば100個分)蓄積されてから、過去の学習データを一緒に用いて学習しても良い。
以下、図1および図2に示したようなセンヂミア圧延機における形状制御を対象に、本プラント制御方法の詳細を説明する。
本実施例では、複数のニューラルネットの中から操業条件に応じていずれかを選択し、フィードフォワード制御に利用するものとする。ここでは制御の優先度と予め判明している条件とにより操業条件を区別するもとする。具体的には、制御の優先度を示す仕様Aと予め判明している条件を示す仕様Bとにより操業条件が定まる。
仕様Aは、例えば、板幅方向の制御優先度とし、仕様A1を端部優先、仕様A2を中央部優先とする。仕様Bは、予め判明している条件への対応についての仕様である。一例をあげると、形状パターンと制御方法の関係は、種々の条件で変化することから、例えば、仕様B1を板幅、仕様B2を鋼種とする区分で分ける必要がある事が考えられる。上記それぞれが変化することで、形状操作端の形状への影響度合が変化する。
この事例では制御対象プラント1は、センヂミア圧延機であり、実績データは形状実績となる。なおセンヂミア圧延機は、ステンレスなどの硬い材料を冷間圧延するためのクラスターロールを持つ圧延機である。ゼンジミア圧延機では、硬い材料に強圧下を与える目的で、小径のワークロールを用いる。このため、平坦な鋼板を得ることが難しい。この対策として、クラスターロールの構造やさまざまな形状制御部を採用している。センヂミア圧延機は一般には、上下の第1中間ロールが片テーパを持ち、シフトできるようになっているほか、上下に6個の分割ロールと2個のAS−Uと呼ばれるロールを備えている。以下に説明する事例では、形状の外乱Siとしては、圧延速度、圧延荷重を用い、さらに入力データS1としては、外乱Siおよび前回値との偏差ΔSiを用いる。また制御操作量S2としては、#1〜#nのAS−U、上下の第1中間ロールのロールシフト量とする。
図10に、センヂミア圧延機の形状制御に用いる場合のニューラルネット構成を示す。ここでニューラルネットとは、制御ルール実行部10用ではニューラルネット101のことであり、制御ルール学習部11用ではニューラルネット111に示したニューラルネットを示しているが、いずも構造は同じである。
図10に示すセンヂミア圧延機の形状制御の事例では、制御対象プラント1からの外乱データS1は圧延速度、圧延荷重を含むセンヂミア圧延機の実績データである。これによりニューラルネット101、111の入力層は、外乱今回値Si、前回値との偏差ΔSiより構成される。
また、ニューラルネット101、111の入力層は、センヂミア圧延機の形状偏差変化量301とセンヂミア圧延機の形状制御操作端である、AS−U、第1中間ロールに合わせて、AS−Uと第1中間の操作変化量302により構成される。AS−Uのサドルが7本、上下第1中間ロールが板幅方向でシフト可能とすると、出力層は形状偏差変化量301が、形状検出器のゾーン数分、操作変化量302がAS−U7個、1中間操作度合が2個の計9個となる。中間層の層数および各層のニューロン数については、適時設定する。
以上説明した図10のような構成のニューラルネット101、111に対して、外乱に対する補正方法を学習させ、学習させたニューラルネットを用いて形状FF制御を実施する。同じ構成のニューラルネットでも、学習の条件により異なった特性となり、同じ外乱に対して異なった制御出力を出すようにすることができる。
そのため、圧延実績の他の条件に応じて、複数のニューラルネットを使い分けることで、多様な条件に対して最適なFF制御を構成することができる。これは仕様Bへの対応である。先に説明した図8の構成は、係る仕様を行う場合の具体例を示している。図8の構成事例では、制御ルール実行部10において使用するニューラルネット101を、圧延実績や、圧延機オペレータ名、被圧延材の鋼種、板幅等により別個のニューラルネットを準備し、制御ルールデータベース12に登録しておく。ニューラルネット選択部102においては、その時点の条件に合致するニューラルネットを選択し、制御ルール実行部10のニューラルネット101に設定する。なおニューラルネット選択部102における、その時点の条件としては、制御対象プラント1における実績データSiの中から板幅のデータを取り込み、これに応じてニューラルネットを選択するのがよい。また、ここで使用する複数のニューラルネットは、図10に示すような入力層、出力層を持てば、中間層の層数、各層のユニット数は異なっても良い。
次に、学習データ作成部7の概要について説明する。図6に示したように、学習データ作成部7においては、制御状態量S3および制御操作量S2の変化量ΔS3、ΔS2より、制御ルール学習部11で使用するニューラルネット111に対する教師データS7aを作成する。
この場合の教師データS7aは、図10に示す、ニューラルネット111の出力層からの出力である、形状偏差変化量301および操作端操作量302となる。学習データ作成部7は、形状偏差変化量301および操作端操作変化量302を用いて、制御ルール学習部11で使用するニューラルネット111に対する教師データS7aを作成する。
図11は学習データデータベース13に保存されたデータ例を示している。ニューラルネット111を学習するためには、学習データとして、多数の入力データS8aと教師データS7aの組合せが必要である。従って、学習データ作成部7で作成した教師データS7a(形状偏差変化量301、操作端操作変化量302)は、制御実行装置20にて制御ルール実行部10に入力された入力データS1(外乱201および外乱変化量202)の時間遅れデータS8aと組合せて一組の学習データとして、学習データデータベース13に保存される。
なお図6のプラント制御装置においては、各種のデータベース12、13を使用しているが、図12に各データベース12、13を連系的に管理運用するためのニューラルネット管理テーブル15の構成を示す。管理テーブル15は、仕様の管理テーブルを備えている。具体的には、管理テーブル15は、仕様について(B1)板幅、(B2)鋼種、および制御の優先度についての仕様A1、A2に応じて区分けされる。(B1)板幅としては、例えば、3フィート幅、メータ幅、4フィート幅、5フィート幅の4区分が、鋼種としては、鋼種(1)〜鋼種(10)の10区分程度を用いる。また、制御の優先度についての仕様Aについては、A1およびA2の2種類とする。この場合、80区分となり、80個のニューラルネットを、圧延条件に応じて使い分けて使用する事となる。
ニューラルネット学習制御部112は、図11に示すような、入力データおよび教師データの組合せである学習データを、図12のニューラルネット管理テーブル15に従って、該当するニューラルネットNo.と紐付けて、図13に示すような学習データデータベース13に格納する。
制御実行装置20が、制御対象プラント1に対して、形状制御を実行するたびに、学習データが作成される。教師データがある程度(例えば200組)蓄積されたら、または新たに学習データデータベースDB2に蓄積されたら、ニューラルネット学習制御部112は、ニューラルネット111の学習を指示する。
制御ルールデータベース12には、図12に示すような管理テーブル15に従って、複数のニューラルネットが格納されており、ニューラルネット学習制御部112においては、学習が必要なニューラルネットNo.を指定して、ニューラルネット選択部113が制御ルールデータベースDB1より当該ニューラルネットを取り出し、ニューラルネット111に設定する。ニューラルネット学習制御部112は、学習データデータベースDB2より、当該ニューラルネットに対応する、入力データおよび教師データの取り出しを、入力データ作成部114および教師データ作成部115に指示し、それらを用いてニューラルネット111の学習を実施する。なおニューラルネットの学習方法は手法が種々提案されており、いずれの手法を用いても良い。
ニューラルネット111の学習が完了すると、ニューラルネット学習制御部112は、学習結果であるニューラルネット111を、制御ルールデータベースDB1の当該ニューラルネットNo.の位置に書き戻すことで、学習が完了する。
学習は、図12にて定義された全てのニューラルネットに対して定時間間隔(例えば1日毎)で一斉に実施しても良いし、新しい学習データがある程度(例えば100組)蓄積されたニューラルネットNo.のニューラルネットのみ、その時点で学習させても良い。
以上により、制御対象プラント1である圧延機の外乱(圧延速度、圧延荷重の変動)と、それに対する制御操作端操作量およびそれによる形状制御偏差とを自動的に学習することができる。学習済みのニューラルネット101、111を用いてフィードフォワード制御を行うことにより、制御操作端操作量およびそれによる形状制御偏差の変化量を抑制し、制御の精度を向上することができる。
なお、制御ルールデータベース12には、制御実行装置20で使用するニューラルネットが格納されるが、格納されるニューラルネットが、乱数でイニシャル処理を実施しただけのものだと、ニューラルネットの学習が進行し、それなりの制御が可能となるまで時間がかかる。そのため、制御対象プラント1に対して、制御部を構築した時に、その時点で判明している制御対象プラント1の制御モデルに基づき、予めシミュレーションにて、制御ルールの学習を実施し、シミュレータでの学習が完了したニューラルネットをデータベースに格納しておく事で、制御対象プラントの立上げ当初から、ある程度の性能の制御を実施する事が可能である。
上記実施例1は、制御対象プラントに対して、FB制御が実施されている場合について説明したが、プラントによってはFB制御が実施されておらず、オペレータの手動操作に頼っている場合も多い。上述したフィードフォワード制御は、FB制御が実施されていない場合にも適用可能である。その一例を実施例2に示す。
図14は、実施例2におけるFF制御について説明するための図である。実施例2においても、FF制御−1のニューラルネットワーク(第1FF制御ニューラルネット)は、実施例1のものと同様に、外乱を入力とし、制御対象状態量(実施例2では状態量)の変化量を出力とする。実施例2では、制御対象プラントをFB制御しないので、FF制御−1の出力は、所定値の制御ゲインを与えた後に、制御対象プラントへ入力される制御操作量に加えられる。この制御ゲインの値は特に限定されない。たとえば制御ゲインが1、すなわち何ら制御ゲインを与えないものも含まれる。
本実施例においても、実施例1と同様に、FF制御系である制御ルール実行装置10は、所定のサンプリング周期で外乱(例えば速度変化)、状態量変化(形状変化)、操作量変化(AS−U、中間ロール)をサンプリングし、得られた実績データを蓄積し、蓄積した実績データを学習することでFF制御の制御ルールを作成することができる。本実施例2は、圧延機で生成される板の形状が悪化してくるとオペレータが手動操作を行い、形状偏差を修正するものである。
本実施例では、FB制御系が存在しないが、形状と操作端操作量の関係をある程度予測し、制御対象の状態量(形状)の偏差から操作端操作量を演算する事で、FF制御の出力を補正し、FF制御の精度を上げる事が可能である。
形状変動が操業上許容可能であれば、圧延速度が変化している途中はオペレータによる手動操作を行わないものとして手動操作なしでの形状の変動のみを学習し、図14のようなFF制御−1により簡易的なFB制御を構成し、FF制御−1で形状変動を予測し、その変動量に基づいて制御を行うことにしてもよい。
上記実施例1および実施例2は、変動する外乱と制御操作量および/または制御対象の状態量の変化との関係を学習し、FF制御を実施する例を示した。しかしながら、外乱のように変動しない入力量についても、その入力量と制御操作量および制御対象の状態量の変化との関係を学習し、FF制御を実施することも可能である。変動しない入力量は、例えば対象とする制御操作以外の固定される制御操作の初期設定である。
図15は、実施例3における圧延機の初期設定について説明するための図である。初期設定は通板速度で板を送っているときの目標形状に合わせて設定する形状以外の制御操作の操作量である。通板速度は、圧延機による圧延を開始するときの最初の圧延速度である。初期設定は、圧延開始前に予め制御操作端に制御操作量である設定される。初期設定では、制御操作量は、その動かすべき偏差を設定するのではなく、絶対値(制御操作端初期設定値)を設定する。
初期設定で設定した値が、あるべき正しい値と合っていなければ、図15の上段に示すように、通板速度で圧延機が動作しているとき板の形状が悪い状態となる。そうなるとオペレータが手動操作で介入することが必要となる。そして、手動操作により形状偏差がある程度まで小さくなると、オペレータは圧延機を通板速度から加速するための操作を実施する。
したがって、形状偏差がある程度小さくなった段階をデータ採取タイミングとし、図15の中段および下段に示すように、そのデータ取得タイミングで形状偏差と制御操作量を採取し、学習データとして蓄積することで、操作端へ初期設定として設定する、制御操作端操作量と、それを設定した場合の形状偏差とを学習することが可能となる。
形状偏差がある程度まで小さくなったデータ取得タイミングは、オペレータが圧延速度の加速を開始したこと、あるいは、形状偏差が所定の閾値を下回ったことにより判断することができる。
図16は、実施例3におけるFF制御について説明するための図である。図16に形状の初期設定を実施するための構成が例示されている。初期設定(操業データ)は、所定の仕様の製品を生成するための圧延機に対する板厚、張力等の初期設定である。形状に関する初期設定は、初期設定−1および初期設定−2を有する初期設定(形状)で実施する。
初期設定−1のニューラルネットワーク(第1初期設定ニューラルネットワーク)は、図16において実線の矢印で示すように、初期設定(操業データ)を入力とし、制御対象状態量を出力とする。この第1初期設定ニューラルネットワークは、初期設定(操業データ)に基づいて制御対象状態量を予測する。その予測した制御対象状態量に所定の制御ゲインを加えて、制御操作量の補正を行うことになる。従って、第1初期設定ニューラルネットワークの学習に用いる教師データは、図16において破線の矢印で示されているように、そのニューラルネットワークの出力となる制御対象状態量である。制御対象状態量と初期設定(操業データ)との関係を学習することとなる。
初期設定−2ニューラルネットワークは(第2初期設定ニューラルネットワーク)は、図16において実線の矢印で示すように、初期設定(操業データ)を入力とし、初期設定の制御操作量を出力とする。従って、第2初期設定ニューラルネットワークの学習に用いる教師データは、図16において破線の矢印で示されているように、そのニューラルネットワークの出力となる制御操作量である。制御操作量と初期設定(操業データ)との関係を学習することとなる。
初期設定を行うタイミングにおいて、第2初期設定ニューラルネットワークは制御操作量の初期設定の値を出力し、第1初期設定ニューラルネットワークは制御対象状態量である形状偏差を出力する。この形状偏差に所定の制御ゲインを加えて制御操作量を補正し、制御対象プラントへの制御入力とする。
本実施例によれば、以上のように圧延機の運転開始前に実施する初期設定についても学習していくことが可能である。
本実施形態のプラント制御装置は、実際には計算機システムとして実現されることになるが、この場合には計算機システム内に複数のプログラム群を形成することになる。
これらのプログラム群は、例えば、制御実行装置の処理を達成させるための、制御対象プラントの実績データと制御操作の定められた関係に従って制御出力を与える制御ルール実行プログラム、制御ルール実行プログラムが出力する制御出力の可否を判定するとともに、当該実績データと制御操作が誤りである事を前記制御方法学習装置に通知する制御出力判定プログラム、制御出力判定プログラムが、制御出力を制御対象プラントに出力した場合、制御対象プラントの前記実績データが悪化すると判断した場合は、制御出力を前記制御対象プラントに出力することを阻止する制御出力抑制プログラムであり、制御方法学習装置の処理を達成させるための、制御実行装置が制御出力を実際に、制御対象プラントに出力した場合に、制御効果が実績データに表れるまでの時間遅れ後に、実績データが当該制御前に比較して良くなったか、悪くなったかについての制御結果の良否を判定する制御結果良否判定の処理を達成させるための制御結果良否判定プログラム、該制御結果良否判定プログラムにおける制御結果の良否と、制御出力をもちいて教師データを得る学習データ作成プログラム、前記実績データと前記教師データを学習データとして学習する制御ルール学習プログラムである。
そして、制御方法学習装置が学習する事で、前記制御対象プラントの状態に応じて複数の制御目標に対して別個の実績データと制御操作の関係を得、得られた実績データと制御操作の関係を前記制御ルール実行プログラムにおける制御対象プラントの実績データと制御操作の定められた組合せとして使用するものである。
なお本実施形態による装置を実プラントに適用するに当たり、ニューラルネットの初期値を定めておく必要があるが、この点に関して実績データと制御操作の組合せを、制御対象プラントでの制御を実施する前に、制御対象プラントの制御モデルを用いてシミュレーションにより作成し、制御対象プラントにおける実績データと制御操作の関係を学習する期間を短縮するのがよい。
以上説明した各実施例には以下に示す事項が含まれている。ただし、各実施例に含まれる事項が以下に示す事項に限られるものではない。
本開示の制御装置は、対象とする制御操作と該制御操作に対する外乱とが加わる制御対象を制御する制御装置であって、学習データとして前記制御対象の制御された結果である制御状態量と前記制御対象に加わった外乱との組合せを学習することにより、前記制御対象への外乱から前記制御対象の制御状態量の変化量を予測するための第1フィードフォワード制御ニューラルネットワークを構築するフィードフォワード制御方法学習装置と、前記第1フィードフォワード制御ニューラルネットワークに基づいて前記制御対象への外乱から前記制御対象の制御状態量の変化量を予測し、該制御状態量の変化量に基づいて前記制御操作の操作量である制御操作量を直接的あるいは間接的に補正して前記制御対象への制御出力とするフィードフォワード制御実行装置と、を有する。
この構成によれば、制御対象の制御結果である制御状態量と制御対象に加わる外乱との関係を学習することで構築された第1フィードフォワード制御ニューラルネットワークにより制御操作量を補正することで、制御対象に対して精度の高い制御を行うことができる。
また、本開示の制御装置は、前記制御対象の制御状態量に基づいて前記制御操作量を補正して前記制御出力とするフィードバック制御装置を更に有し、前記フィードフォワード制御方法学習装置は、更に、学習データとして前記制御操作量と前記外乱との組合せを学習することにより、前記制御対象への外乱から前記制御対象への制御操作量の変化量を予測するための第2フィードフォワード制御ニューラルネットワークを構築し、前記フィードフォワード制御実行装置は、前記第2フィードフォワード制御ニューラルネットワークに基づいて、前記制御対象へ加わる外乱から、前記制御対象への制御操作量の変化量を予測し、該制御操作量の変化量に基づいて、前記制御操作量を補正するとともに、前記第1フィードフォワード制御ニューラルネットワークに基づいて予測した前記制御対象の制御状態量の変化量に基づいて、前記フィードバック制御装置の入力である前記制御対象の制御対象状態量を補正する。
この構成によれば、フィードバック制御を行う構成において、第2フィードフォワード制御ニューラルネットワークにより制御対象にフィードフォワード制御を加えるとともに、第1フィードフォワード制御ニューラルネットワークによりフィードバック制御に対してフィードフォワード制御を加えるので、制御対象に対して精度の高い制御を行うことができる。
また、本開示において、前記フィードバック制御装置は、学習データとして前記制御対象の制御状態量と前記制御対象に加わった制御操作量との組合せを学習することにより構築されたフィードバック制御ニューラルネットワークを用いて、前記制御対象の制御状態量に基づいて前記制御操作量の変化量を予測し、前記変化量に基づいて前記制御操作量を補正する。
また、本開示において、前記第1フィードフォワード制御ニューラルネットワークと前記第2フィードフォワード制御ニューラルネットワークとが一体のニューラルネットワークである。この構成によれば、第1フィードフォワード制御ニューラルネットワークと第2フィードフォワード制御ニューラルネットワークを1つのニューラルネットワークとして管理し、学習データも1セットの学習データとして管理することができる。
また、本開示において、前記フィードフォワード制御方法学習装置は、学習データとして前記制御対象の制御状態量と前記制御対象に加わった外乱および該外乱の変化量である外乱変化量との組合せを学習することにより、前記制御対象へ入力される外乱および外乱変化量から前記制御対象の制御状態量の変化量を予測するための第1フィードフォワード制御ニューラルネットワークを構築し、学習データとして前記制御対象への制御操作量と前記制御対象に加わった外乱および該外乱の変化量である外乱変化量との組合せを学習することにより、前記制御対象へ入力される外乱および外乱変化量から前記制御対象に入力される制御操作量の変化量を予測するための第2フィードフォワード制御ニューラルネットワークを構築する。前記フィードフォワード制御実行装置は、前記第1フィードフォワード制御ニューラルネットワークに基づいて前記制御対象へ加わる外乱および外乱変化量から前記制御対象の制御状態量の変化量を予測し、前記第2フィードフォワード制御ニューラルネットワークに基づいて、前記制御対象へ加わる外乱および外乱変化量から、前記制御対象への制御操作量の変化量を予測する。
この構成によれば、フィードフォワード制御ニューラルネットワークが外乱と外乱変化量を入力とするので、より外乱の影響を高い精度で表す出力を得ることができ、外乱の影響を高い精度で抑制することができる。
また、本開示において、前記制御対象が圧延機であり、前記制御状態量が板の形状であり、前記外乱に圧延速度が含まれ、前記外乱変化量に前記圧延速度の変化量が含まれる。
この構成によれば、圧延機の制御においては一定速度で圧延する時間帯の他に、圧延速度を加速する時間帯や減速する時間帯がある。そしてその加速や減速をしている時間帯に形状の乱れが生じやすい。本構成のように圧延速度の変化量つまり加速度をニューラルネットワークの入力として扱うことにより、加速や減速をしている時間帯におけるフィードフォワード制御の精度を向上することができる。
また、本開示において、前記フィードフォワード制御方法学習装置は、操業条件毎の実績データをそれぞれ別個に学習し、操業条件の異なる複数の第1フィードフォワード制御ニューラルネットワークおよび第2フィードフォワード制御ニューラルネットワークを構築し、前記フィードフォワード制御実行装置は、操業条件に基づいて、いずれかの第1フィードフォワード制御ニューラルネットワークおよび第2フィードフォワード制御ニューラルネットワークを選択して用いる。
また、本開示における制御装置は、対象とする制御操作と該制御操作に対する外乱とが加わる制御対象を制御する制御装置であって、学習データとして前記制御対象の制御された結果である制御状態量と前記制御対象に加わった初期設定との組合せを学習することにより、前記制御対象への初期設定から前記制御対象の制御状態量を予測するための第1初期設定ニューラルネットワークを構築し、学習データとして前記制御操作の操作量である制御操作量と前記初期設定との組合せを学習することにより、前記制御対象への初期設定から前記制御対象への制御操作量を予測するための第2初期設定ニューラルネットワークを構築する初期設定方法学習装置と、前記第2初期設定ニューラルネットワークに基づいて、前記制御対象への初期設定から、前記制御対象への制御操作量を予測し、前記第1初期設定ニューラルネットワークに基づいて予測した前記制御対象の制御状態量に基づいて、前記第2初期設定ニューラルネットワークで予測した前記制御操作量を補正し、前記制御対象へ出力する初期設定実行装置と、を有する。
この構成によれば、第2初期設定ニューラルネットワークにより制御対象に初期設定を加えるとともに、第1初期設定ニューラルネットワークによりその初期設定に補正を加えるので、制御対象に対して精度の高い初期設定を行うことができる。
本発明は、例えば圧延設備の1つである圧延機の制御方法及び部に関するものであり、実適用に当たっての問題点は特に無い。
1:制御対象プラント、2:制御入力データ作成部、3:制御出力演算部、4:制御出力抑制部、5:制御出力判定部、6:制御結果良否判定部、7:学習データ作成部、10:制御ルール実行部、11:制御ルール学習部、20:制御実行装置、21:制御方法学習装置、12:制御ルールデータベース、13:学習データデータベース、S7a、S7b、S7c:教師データ、S8a、S8b、S8c:入力データ(制御ルール学習部用)

Claims (9)

  1. 対象とする制御操作と該制御操作に対する外乱とが加わる制御対象を制御する制御装置であって、
    学習データとして前記制御対象の制御された結果である制御状態量と前記制御対象に加わった外乱との組合せを学習することにより、前記制御対象への外乱から前記制御対象の制御状態量の変化量を予測するための第1フィードフォワード制御ニューラルネットワークを構築するフィードフォワード制御方法学習装置と、
    前記第1フィードフォワード制御ニューラルネットワークに基づいて前記制御対象への外乱から前記制御対象の制御状態量の変化量を予測し、該制御状態量の変化量に基づいて前記制御操作の操作量である制御操作量を直接的あるいは間接的に補正して前記制御対象への制御出力とするフィードフォワード制御実行装置と、
    を有する制御装置。
  2. 前記制御対象の制御状態量に基づいて前記制御操作量を補正して前記制御出力とするフィードバック制御装置を更に有し、
    前記フィードフォワード制御方法学習装置は、更に、学習データとして前記制御操作量と前記外乱との組合せを学習することにより、前記制御対象への外乱から前記制御対象への制御操作量の変化量を予測するための第2フィードフォワード制御ニューラルネットワークを構築し、
    前記フィードフォワード制御実行装置は、前記第2フィードフォワード制御ニューラルネットワークに基づいて、前記制御対象へ加わる外乱から、前記制御対象への制御操作量の変化量を予測し、該制御操作量の変化量に基づいて、前記制御操作量を補正するとともに、前記第1フィードフォワード制御ニューラルネットワークに基づいて予測した前記制御対象の制御状態量の変化量に基づいて、前記フィードバック制御装置の入力である前記制御対象の制御対象状態量を補正する、
    請求項1に記載の制御装置。
  3. 前記フィードバック制御装置は、学習データとして前記制御対象の制御状態量と前記制御対象に加わった制御操作量との組合せを学習することにより構築されたフィードバック制御ニューラルネットワークを用いて、前記制御対象の制御状態量に基づいて前記制御操作量の変化量を予測し、前記変化量に基づいて前記制御操作量を補正する、
    請求項2に記載の制御装置。
  4. 前記第1フィードフォワード制御ニューラルネットワークと前記第2フィードフォワード制御ニューラルネットワークとが一体のニューラルネットワークである、
    請求項2に記載の制御装置。
  5. 前記フィードフォワード制御方法学習装置は、
    学習データとして前記制御対象の制御状態量と前記制御対象に加わった外乱および該外乱の変化量である外乱変化量との組合せを学習することにより、前記制御対象へ入力される外乱および外乱変化量から前記制御対象の制御状態量の変化量を予測するための第1フィードフォワード制御ニューラルネットワークを構築し、
    学習データとして前記制御対象への制御操作量と前記制御対象に加わった外乱および該外乱の変化量である外乱変化量との組合せを学習することにより、前記制御対象へ入力される外乱および外乱変化量から前記制御対象に入力される制御操作量の変化量を予測するための第2フィードフォワード制御ニューラルネットワークを構築し、
    前記フィードフォワード制御実行装置は、
    前記第1フィードフォワード制御ニューラルネットワークに基づいて前記制御対象へ加わる外乱および外乱変化量から前記制御対象の制御状態量の変化量を予測し、
    前記第2フィードフォワード制御ニューラルネットワークに基づいて、前記制御対象へ加わる外乱および外乱変化量から、前記制御対象への制御操作量の変化量を予測する、
    請求項2に記載の制御装置。
  6. 前記制御対象が圧延機であり、前記制御状態量が板の形状であり、前記外乱に圧延速度が含まれ、前記外乱変化量に前記圧延速度の変化量が含まれる、
    請求項5に記載の制御装置。
  7. 前記フィードフォワード制御方法学習装置は、操業条件毎の実績データをそれぞれ別個に学習し、操業条件の異なる複数の第1フィードフォワード制御ニューラルネットワークおよび第2フィードフォワード制御ニューラルネットワークを構築し、
    前記実行装置は、操業条件に基づいて、いずれかの第1フィードフォワード制御ニューラルネットワークおよび第2フィードフォワード制御ニューラルネットワークを選択して用いる、
    請求項2に記載の制御装置。
  8. 対象とする制御操作と該制御操作に対する外乱とが加わる制御対象を制御する制御装置であって、
    学習データとして前記制御対象の制御された結果である制御状態量と前記制御対象に加わった初期設定との組合せを学習することにより、前記制御対象への初期設定から前記制御対象の制御状態量を予測するための第1初期設定ニューラルネットワークを構築し、学習データとして前記制御操作の操作量である制御操作量と前記初期設定との組合せを学習することにより、前記制御対象への初期設定から前記制御対象への制御操作量を予測するための第2初期設定ニューラルネットワークを構築する初期設定方法学習装置と、
    前記第2初期設定ニューラルネットワークに基づいて、前記制御対象への初期設定から、前記制御対象への制御操作量を予測し、前記第1初期設定ニューラルネットワークに基づいて予測した前記制御対象の制御状態量に基づいて、前記第2初期設定ニューラルネットワークで予測した前記制御操作量を補正し、前記制御対象へ出力する初期設定実行装置と、
    を有する制御装置。
  9. 対象とする制御操作と該制御操作に対する外乱とが加わる制御対象を制御するための制御方法であって、
    学習データとして前記制御対象の制御された結果である制御状態量と前記制御対象に加わった外乱との組合せを学習することにより、前記制御対象へ入力される外乱から前記制御対象の制御状態量の変化量を予測するための第1フィードフォワード制御ニューラルネットワークを構築し、
    前記第1フィードフォワード制御ニューラルネットワークに基づいて前記制御対象への外乱から前記制御対象の制御状態量の変化量を予測し、
    該制御状態量の変化量に基づいて前記制御操作の操作量である制御操作量を直接的あるいは間接的に補正して前記制御対象への制御出力とする、
    ことをコンピュータが実行する制御方法。

JP2018189695A 2018-10-05 2018-10-05 制御装置および制御方法 Active JP7034046B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018189695A JP7034046B2 (ja) 2018-10-05 2018-10-05 制御装置および制御方法
CN201910881209.6A CN111001660B (zh) 2018-10-05 2019-09-18 控制装置以及控制方法
DE102019214548.5A DE102019214548A1 (de) 2018-10-05 2019-09-24 Steuervorrichtung und steuerverfahren

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018189695A JP7034046B2 (ja) 2018-10-05 2018-10-05 制御装置および制御方法

Publications (2)

Publication Number Publication Date
JP2020060827A true JP2020060827A (ja) 2020-04-16
JP7034046B2 JP7034046B2 (ja) 2022-03-11

Family

ID=69886613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018189695A Active JP7034046B2 (ja) 2018-10-05 2018-10-05 制御装置および制御方法

Country Status (3)

Country Link
JP (1) JP7034046B2 (ja)
CN (1) CN111001660B (ja)
DE (1) DE102019214548A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114074120A (zh) * 2020-08-11 2022-02-22 株式会社日立制作所 设备控制装置、轧制控制装置、设备控制方法以及设备控制程序
CN114082789A (zh) * 2020-08-24 2022-02-25 株式会社日立制作所 成套设备控制装置以及成套设备控制方法
WO2023053514A1 (ja) * 2021-09-28 2023-04-06 オムロン株式会社 制御装置、制御システム、および制御方法
WO2024090126A1 (ja) * 2022-10-25 2024-05-02 キヤノン株式会社 制御方法、制御装置、リソグラフィ装置、および物品製造方法
WO2024181536A1 (ja) * 2023-03-02 2024-09-06 オムロン株式会社 制御対象に対するフィードフォワード制御に関する機械学習のための装置、教師データの生成プログラム、および教師データの生成方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07100516A (ja) * 1993-10-05 1995-04-18 Hitachi Ltd 圧延機制御方法および装置
JPH1063307A (ja) * 1996-08-21 1998-03-06 Hitachi Ltd 火力プラント主制御系におけるフィードフォワード制御装置
JPH11231907A (ja) * 1998-02-12 1999-08-27 Yamaha Motor Co Ltd 学習可能な制御ロジックを用いたフィードフォワード制御における予測学習方法
JP2018005544A (ja) * 2016-07-01 2018-01-11 株式会社日立製作所 プラント制御装置、圧延制御装置、プラント制御方法およびプラント制御プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2767362B2 (ja) * 1993-06-15 1998-06-18 株式会社日立製作所 圧延機制御方法及び装置
JP4516515B2 (ja) * 2005-11-30 2010-08-04 株式会社日立製作所 形状制御装置、及び形状制御方法
CN103384572B (zh) * 2011-03-18 2015-05-27 株式会社日立制作所 轧制控制装置、轧制控制方法以及轧制控制程序
CN202527481U (zh) * 2012-01-30 2012-11-14 中冶南方工程技术有限公司 一种冷轧带钢板形前馈控制系统
JP6435234B2 (ja) * 2015-05-20 2018-12-05 株式会社日立製作所 熱間圧延仕上げミル出側温度制御装置およびその制御方法
CN105869401B (zh) * 2016-05-12 2018-06-29 华南理工大学 一种基于不同拥挤程度的路网动态分区方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07100516A (ja) * 1993-10-05 1995-04-18 Hitachi Ltd 圧延機制御方法および装置
JPH1063307A (ja) * 1996-08-21 1998-03-06 Hitachi Ltd 火力プラント主制御系におけるフィードフォワード制御装置
JPH11231907A (ja) * 1998-02-12 1999-08-27 Yamaha Motor Co Ltd 学習可能な制御ロジックを用いたフィードフォワード制御における予測学習方法
JP2018005544A (ja) * 2016-07-01 2018-01-11 株式会社日立製作所 プラント制御装置、圧延制御装置、プラント制御方法およびプラント制御プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114074120A (zh) * 2020-08-11 2022-02-22 株式会社日立制作所 设备控制装置、轧制控制装置、设备控制方法以及设备控制程序
CN114074120B (zh) * 2020-08-11 2023-10-31 株式会社日立制作所 设备控制装置、轧制控制装置、设备控制方法以及计算机可读记录介质
CN114082789A (zh) * 2020-08-24 2022-02-25 株式会社日立制作所 成套设备控制装置以及成套设备控制方法
CN114082789B (zh) * 2020-08-24 2023-09-19 株式会社日立制作所 轧制机控制装置以及轧制机控制方法
WO2023053514A1 (ja) * 2021-09-28 2023-04-06 オムロン株式会社 制御装置、制御システム、および制御方法
TWI837636B (zh) * 2021-09-28 2024-04-01 日商歐姆龍股份有限公司 控制裝置、控制系統以及控制方法
WO2024090126A1 (ja) * 2022-10-25 2024-05-02 キヤノン株式会社 制御方法、制御装置、リソグラフィ装置、および物品製造方法
WO2024181536A1 (ja) * 2023-03-02 2024-09-06 オムロン株式会社 制御対象に対するフィードフォワード制御に関する機械学習のための装置、教師データの生成プログラム、および教師データの生成方法

Also Published As

Publication number Publication date
JP7034046B2 (ja) 2022-03-11
DE102019214548A1 (de) 2020-04-09
CN111001660A (zh) 2020-04-14
CN111001660B (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
JP7034046B2 (ja) 制御装置および制御方法
CN108170529A (zh) 一种基于长短期记忆网络的云数据中心负载预测方法
JP2019028824A (ja) プラント制御装置およびその制御方法、圧延機制御装置およびその制御方法並びにプログラム
CN110285403A (zh) 基于被控参数预估的主蒸汽温度控制方法
CN108687137B (zh) 整套设备控制装置、轧机控制装置、控制方法及存储介质
CN116468425B (zh) 多态系统的联合运维优化方法、电子设备和计算机可读存储介质
CN109581864A (zh) 参数自整定的mimo异因子偏格式无模型控制方法
CN109523136A (zh) 一种面向智能制造的调度知识管理系统
Wei et al. A reinforcement learning-based approach to dynamic job-shop scheduling
Zeng et al. DDPG-based continuous thickness and tension coupling control for the unsteady cold rolling process
JP2021030264A (ja) 学習モデル生成方法、データベース構築方法、ミルセットアップ設定方法、圧延材の製造方法、処理対象の製造方法、及び学習モデル生成装置
JP2020157327A (ja) 鋼板の仕上出側温度制御方法、鋼板の仕上出側温度制御装置、及び鋼板の製造方法
JP2021061019A (ja) プラント制御装置およびその制御方法、圧延機制御装置およびその制御方法並びにプログラム
CN109814389A (zh) 参数自整定的mimo异因子紧格式无模型控制方法
CN113743784A (zh) 一种基于深度强化学习的生产时序表智能生成方法
JP2021152702A (ja) プラント運転最適化支援装置、プラント運転最適化制御装置並びに方法
CN116402303A (zh) 一种克服车间中作业释放扰动的主动调度方法
TWI798047B (zh) 鋼板軋延力預測方法與軋延系統
JP2003058579A (ja) 設計・配合の最適化方法
CN111279276A (zh) 用于控制复杂系统的随机化加强学习
JP2019212146A (ja) 教師データ生成装置および教師データ生成方法
CN109884893B (zh) 一种多工序变量间动态时滞估计方法
JP6952018B2 (ja) 制御装置および制御方法
CN111781821B (zh) SISO紧格式无模型控制器基于Attention机制循环神经网络的参数自整定方法
KR102440698B1 (ko) 플랜트 제어 장치 및 그의 제어 방법, 압연기 제어 장치 및 그의 제어 방법 그리고 프로그램

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220301

R150 Certificate of patent or registration of utility model

Ref document number: 7034046

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150