JP7495874B2

JP7495874B2 - プラント制御システム、プラント制御方法及びプログラム

Info

Publication number: JP7495874B2
Application number: JP2020208192A
Authority: JP
Inventors: 敬規高田; 哲服部; 隆阿部; 佑樹田内; 大輝黒川; 正剛綿島
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2020-12-16
Filing date: 2020-12-16
Publication date: 2024-06-05
Anticipated expiration: 2040-12-16
Also published as: CN114637194A; DE102021214272A1; JP2022095082A

Description

本発明は、プラント制御システム、プラント制御方法及びプログラムに関する。

従来から、各種のプラントにおいてはその制御により適正な制御結果を得るために、各種制御理論に基づいたプラント制御が実行されている。

プラントの一例を説明すると、例えば圧延機制御において、板の波打ち状態を制御する形状制御を対象とした制御理論として、ファジィ制御やニューロ・ファジィ制御が適用されている。ファジィ制御は、クーラントを利用した形状制御に、また、ニューロ・ファジィ制御は、センジミア圧延機の形状制御に適用されている。このうち、ニューロ・ファジィ制御を適用した形状制御は、特許文献１に示されるように、形状検出器で検出された実績形状パターンと目標形状パターンの差と、予め設定された基準形状パターンとの類似割合を求めるものである。そして、求めた類似割合から、予め設定された基準形状パターンに対する制御操作端操作量によって表現された制御ルールにより、操作端に対する制御出力量を求めることにより行われている。

以下、ニューロ・ファジィ制御を用いたセンヂミア圧延機の形状制御の従来技術について説明する。
センヂミア圧延機の形状制御では、ニューロ・ファジィ制御が用いられる。図２５に示すように、センヂミア圧延機５０は、パターン認識部５１で、形状検出器５２にて検出した実形状より形状のパターン認識が行われ、実形状が予め設定された基準形状パターンのどれに最も近いかが演算される。形状検出器５２で検出した実形状のデータは、形状検出前処理部５４でパターン認識用の前処理が行われる。

そして、制御演算部５３で、予め設定された形状パターンに対する制御操作端操作量で構成される制御ルールを用いて制御が実行される。
ここでは、図２６に示すように、パターン認識部５１は、形状検出器５２にて検出した実績の形状パターン（ε）と、目標形状（ε_ｒｅｆ）との差分（Δε）が、パターン１からパターン８の形状のどれに最も近いかを演算する。そして、制御演算部５３は、演算結果に基づいて、パターン１からパターン８の制御方法のいずれかを選択し実行する。

特許２８０４１６１号特開２０１８－１８０７９９号公報

特許文献１に記載された従来技術は、予め代表的な形状を基準形状パターンとして設定し、基準形状パターンに対する制御操作端操作量との関係を示す制御ルールを基に制御を行っている。制御ルールの学習についても、基準形状パターンに対する制御操作端操作量に関するものであり、予め定めている代表的な基準形状パターンはそのまま用いている。そのため、特定の形状パターンにしか反応しない形状制御となってしまうという問題がある。

基準形状パターンは、人間が予め対象となる圧延機に関する知識や、形状実績と手動介入操作を蓄積した経験より定めたものであるが、対象となる圧延機及び被圧延材で発生する全ての形状を網羅する事は困難である。そのため、基準形状パターンとは異なる形状が発生した場合、形状制御による制御が実行されず、形状偏差が抑制されずに残ってしまい、あるいは似たような基準形状パターンと誤認識し、誤った制御操作を行って、逆に形状を悪化させてしまう場合もある。

そのため、従来の形状制御においては、予め設定された基準形状パターンとそれに対する制御ルールを用いて制御ルールの学習をし、制御を実行するため、制御精度の向上に限界があるという問題があった。

この問題を解決するために、例えば特許文献２に記載された技術が提案されている。特許文献２には、制御時に外乱を発生させて、学習によりニューラルネットを徐々に賢くする処理が記載されている。しかしながら、特許文献２に記載されたような制御外乱を発生させる処理は、実際に制御対象プラントを運用して、その運用時に制御外乱を発生させるものであり、制御対象プラントの実運用を乱すものであり、運用上、あまり好ましいとは言えない。さらに、制御対象プラントをある程度運用しない限り、ニューラルネットが適正にならないものであり、運転初期時から暫くの間、適正な制御ができない可能性が高い。

本発明の目的は、プラントの制御を乱すリスクを少なくして、制御ルールを効率的に修正できるプラント制御システム、プラント制御方法及びプログラムを提供することにある。

上記課題を解決するために、例えば特許請求の範囲に記載の構成を採用する。
本願は、上記課題を解決する手段を複数含んでいるが、その一例を挙げるならば、プラント制御システムは、制御対象プラントに対して、制御対象プラントの実績データの組合せのパターンを認識して、制御を実行するものに適用される。
そして、プラント制御システムは、制御対象プラントの実績データと制御操作の組合せを学習する制御方法学習ユニットと、制御方法学習部が学習した実績データと制御操作の組合せに応じて制御対象プラントの制御を実行する制御実行ユニットと、制御対象プラントの実績データと制御操作の組合せと制御結果良否の組み合わせを学習する良否判定ルール学習ユニットとを備える。
ここで、制御実行ユニットは、
制御対象プラントの実績データと制御操作の定められた組合せに従って制御出力を与える制御ルール実行部と、
制御対象プラントの実績データと制御操作と制御結果良否の定められた組み合わせに従って制御出力の良否判定を行う制御出力良否判定ルール実行部と、
制御出力良否判定ルール実行部での良否判定を元に新規操作探索用操作量を演算する新規探索操作量演算部と、
制御出力良否判定ルール実行部での良否判定と制御シミュレータを用いたシミュレーションデータとを使って、制御出力を制御対象プラントに出力した場合に制御対象プラントの実績データが悪化すると判断した場合に、制御出力を制御対象プラントに出力することを阻止する制御出力抑制部とを備える。
また、良否判定ルール学習ユニットは、
制御実行部が制御出力を制御対象プラントに出力した場合に、制御効果が実績データに表れるまでの時間遅れ後に、制御結果の良否を判定する制御結果良否判定部と、
制御結果良否判定部における制御結果の良否と実績データと制御出力を学習データとして学習する良否判定ルール学習部とを備える。
さらに、制御方法学習ユニットは、
制御出力良否判定ルール実行部での制御出力の良否判定と、制御出力を用いて教師データを得る学習データ作成部と、
実績データと教師データを学習データとして学習する制御ルール学習部とを備える。

本発明によれば、制御中に形状制御で使用される形状パターンと操作方法の制御ルールを、プラントへのリスクを少なくして、効率的に自動修正し、経年的なプラントの環境変化に対応した、最適なものとすることが可能になる。そのため、本発明によれば、制御精度の向上、制御部の立上げ期間の短縮、経年変化に対する対応が可能となる。
また、本発明によると、制御ルールの性能を予め評価することにより、新たな制御ルールの適用によるプラントへのリスク低減と、最適な制御ルールの選択による制御性能が向上するという効果がある。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。

本発明の一実施の形態例に係るプラント制御システムの概要を示す構成図である。本発明の一実施の形態例に係る制御ルール実行部の具体的な構成例を示す図である。本発明の一実施例に係る制御出力良否判定ルール実行部の例を示す構成図である。本発明の一実施の形態例に係る制御ルール学習部の具体的な構成例を示す図である。本発明の一実施例に係る良否判定ルール学習部の例を示す構成図である。センヂミア圧延機の形状制御における制御方法に対する制御結果良否判定の例を示す図である。本発明の一実施の形態例に係るセンヂミア圧延機の形状制御に用いる場合のニューラルネット構成を示す図である。本発明の一実施の形態例に係る形状偏差と制御方法を説明する図である。本発明の一実施の形態例に係る制御入力データ作成部の例を示す構成図である。本発明の一実施の形態例に係る制御出力演算部の例を示す構成図である。本発明の一実施の形態例に係るセンヂミア圧延機の良否判定に用いる場合のニューラルネット構成を示す図である。本発明の一実施の形態例に係る新規探索操作量演算部における操作量演算方法を示す図である。本発明の一実施の形態例に係る制御出力判定部の例を示す構成図である。本発明の一実施の形態例に係る制御出力演算部の例を示す構成図である。本発明の一実施の形態例に係る学習データ作成部における処理段階と処理内容を示す図である。本発明の一実施の形態例に係る学習データデータベースに保存されるデータ例を示す図である。本発明の一実施の形態例に係るニューラルネット管理テーブルの例を示す図である。本発明の一実施の形態例に係る学習データデータベースの例を示す構成図である。本発明の一実施の形態例に係る制御良否判定部の例を示す構成図である。本発明の一実施の形態例に係る学習データデータベースに保存されるデータ例を示す図である。本発明の一実施の形態例に係るニューラルネット管理テーブルの例を示す図である。本発明の一実施の形態例に係る学習データデータベースの例を示す図である。本発明の一実施の形態例に係るプラント制御システムが制御ルール評価ユニットを備えた例を示す構成図である。本発明の一実施の形態例に係るプラント制御システムのハードウェア構成例を示すブロック図である。センヂミア圧延機の例を示す構成図である。センヂミア圧延機の形状制御における制御ルールの一覧の例を示す図である。

以下、本発明の一実施の形態例（以下、「本例」と称する）のプラント制御システムを、添付図面を参照して説明する。

まず、本例を説明するに先立って、本発明に至る経緯とその概要について、プラント制御システムを圧延機の形状制御装置に適用した場合を例にして説明する。

まず、本発明の目的の一つである、プラントへのリスクを少ない状態で、制御ルールを効率的に修正できるプラント制御システムを得るためには、下記の要件（１），（２），（３），（４）が必要になる。
・要件（１）：制御ルールを改善させるには、制御結果の良い制御操作を学習できていない場合には、制御操作を大きく変更して、制御結果が良かった場合に新たな制御操作方法として取り入れるようにし、制御結果の良い制御操作を学習できている場合には、制御操作を変更しないか小さな変更に留めて、それに対する制御結果が良かった場合に新たな制御操作方法として取り入れるようにする。
・要件（２）：形状パターンと制御操作と制御結果の良否の組み合わせを、実機データを元に学習することにより、機械モデルを用いたシミュレータよりも、精度よく制御結果の良否が推定可能なモデルを構築し、定期的な自動学習によって常に最新のプラント状態に適合したモデルを構築する。
・要件（３）：制御結果の良否判定を推定するモデルを用いて、従来技術で簡易の機械モデルでのみ行っていたプラントへの制御出力抑制機能の信頼性を高める。
・要件（４）：従来技術で一回の制御結果の良否判定で行っていた制御ルール学習データの生成機能において、制御結果の良否判定を推定するモデルを用いることにより、プラントデータに含まれるノイズの影響を抑え、効果の小さな微調整も学習データの対象とすることを可能にし、同時に、制御効果の誤判定を防止することによって、学習データの変動を抑え、制御性能を安定させる。

これらの要件（１）～（４）を実現するためには、制御装置内で、形状制御に使用する形状パターン、制御操作及び制御結果の良否の組合せを学習可能なニューラルネットを構成するのが好ましい。そして、制御装置は、ニューラルネットに圧延機で発生した形状パターンと制御操作の出力を入力して得た値で、圧延機で発生した形状パターンに対する制御操作の出力による制御結果の良否を推定することが必要になる。さらに、制御装置は、制御結果の良否の推定値を用いて、新規制御操作探索用の制御操作量の演算方法を選択する。

圧延機の簡易モデル等を用いて検証し、明らかに形状が悪化すると考えられる出力に対しては、制御装置は、圧延機の制御操作端に対して出力しないようにして形状悪化を防止する。このとき、制御装置は、制御結果の良否の推定値を、出力抑制の判断に使用することで、保護の信頼性を高め、抑制の範囲を適正化することによって、制御機能による対応可能範囲を拡大することができる。

制御結果の良否の推定精度が不十分な適用初期の段階においては、悪いと推定された制御操作出力についても、プラントに出力することで、未学習の形状パターン、制御操作及び制御結果の良否の組合せについて、学習している範囲を拡大していくことが必要である。

制御結果の良否判定推定精度が十分に高い段階では、プラントに操作量を出力しなくても制御結果の良否を推定できるので、制御装置は、制御ルールの学習データを生成することが可能になる。

制御装置は、制御結果の良否を推定可能なニューラルネットを用いて制御結果の良否を推定することにより、プラントデータが持つノイズの影響を少なくでき、効果の小さな微調整データについての良否判定が可能となる。これにより、制御装置は、学習データを生成することができる。さらに、制御装置は、ノイズによる誤った良否判定を防止することで、学習データの精度を高めることができる。

また、経年変化によるプラントの環境変化等で制御結果の良否判定の推定精度が低下した場合、制御装置は、直近のプラントの実績データを用いて再学習することによって、最新のプラント状態に適合した制御結果の良否判定の推定が可能になる。

制御結果の良否判定の推定精度を確認するためには、ニューラルネットの学習に使用したデータとは別に精度検証用としてテストデータが用意される。そして、制御装置は、この精度検証用のテストデータに含まれる形状パターンと制御操作の出力を、ニューラルネットに入力することにより出力された値と、テストデータに含まれる制御結果との良否判定の誤差を元に、良否判定の推定精度を確認することが可能になる。

図１は、本例のプラント制御システムの構成を示す。
図１のプラント制御システムは、制御実行ユニット２０、制御方法学習ユニット２１、良否判定ルール学習ユニット２２、複数のデータベースＤＢ（ＤＢ１～ＤＢ８）、及び各データベースＤＢの管理テーブルＴＢを備える。

制御実行ユニット２０は、制御対象プラント１からの実績データＳｉを入力して制御ルール（ニューラルネット）に従い定めた制御操作量出力ＳＯを制御対象プラント１に与えて、制御対象プラント１を制御する。ここでの制御対象プラント１は、既に説明した図２５に示すセンヂミア圧延機５０とする。
ここで、制御ルールとは、図２６で説明したように、例えば検出した実績の形状パターンＡ（ε）と目標形状（ε_ｒｅｆ）との差分ａ（Δε）が、用意された複数のパターンの形状のどれに最も近いかを演算するルールである。制御実行ユニット２０は、この制御ルールによる演算結果に基づいて、いずれかのパターンの制御方法を選択して実行する。

制御方法学習ユニット２１は、制御実行ユニット２０にて作成した制御入力データＳ１などを入力して学習を行い、学習した制御ルールを制御実行ユニット２０における制御ルールに反映させる。
良否判定ルール学習ユニット２２は、制御対象プラント１の制御前後の実績データSiなどを入力して学習を行い、学習した良否判定ルールを制御実行ユニット２０における良否判定ルールに反映させる。

制御実行ユニット２０は、制御入力データ作成部２、制御ルール実行部１０、制御出力演算部３、制御出力抑制部４、制御出力判定部５、制御出力良否判定ルール実行部１７、新規探索操作量演算部３３、及び制御出力操作方法選択部１８を備える。

制御実行ユニット２０は、制御対象プラント１である圧延機の実績データＳｉより、制御入力データ作成部２を用いて、制御ルール実行部１０の入力データＳ１を作成する。
制御ルール実行部１０は、制御対象の実績データＳｉと制御操作端操作指令Ｓ２の関係を表現するニューラルネット（制御ルール）を用いて、制御対象の実績データＳｉから制御操作端操作指令Ｓ２を作成する制御ルール実行処理を行う。制御出力演算部３は、制御操作端操作指令Ｓ２をもとに、制御操作端への制御操作量Ｓ３を演算する。これにより、制御実行ユニット２０は、制御対象プラント１の実績データＳｉに応じて、ニューラルネットを用いて制御操作量Ｓ３を作成する。

また、制御出力良否判定ルール実行部１７は、制御対象の実績データＳｉと制御操作量Ｓ３とその制御結果の制御結果良否データＳ６の関係を表現するニューラルネット（良否判定ルール）を用いて、制御対象の実績データＳｉと制御操作量Ｓ３から制御出力良否判定推定値Ｓ９を作成する制御出力良否判定ルール実行処理を行う。さらに、制御出力良否判定ルール実行部１７は、制御対象の実績データＳｉと後述する選択制御操作量Ｓ８から制御結果良否判定推定値Ｓ１１を作成する。

新規探索操作量演算部３３は、制御出力良否判定推定値Ｓ９を元に、新規探索制御操作量Ｓ１２を演算する新規探索操作量演算処理を行う。
制御出力操作方法選択部１８は、制御操作量Ｓ３又は新規探索制御操作量Ｓ１２を元に選択制御操作量Ｓ８と制御方法選択フラグＳ１４を作成する。

また、制御実行ユニット２０内の制御出力判定部５は、制御対象プラント１からの実績データＳｉ及び制御出力演算部３からの制御操作量Ｓ３を用いて、制御操作端への制御操作量出力可否データＳ４を決定する。制御出力抑制部４は、制御操作量出力可否データＳ４と制御結果良否判定推定値Ｓ１１を元に、制御操作端への選択制御操作量Ｓ８の出力可否を決定し、可とされた選択制御操作量Ｓ８を、制御対象プラント１に与える制御操作量出力ＳＯとして出力する。これにより、異常と判断される選択制御操作量Ｓ８は、制御実行ユニット２０から制御対象プラント１に出力されなくなる。

以上のように構成された制御実行ユニット２０は、その処理を実行するために、制御ルールデータベースＤＢ１、出力判定データベースＤＢ３及び良否判定ルールデータベースＤＢ５を参照する。
制御ルールデータベースＤＢ１は、制御実行ユニット２０内の制御ルール実行部１０と、後述する制御方法学習ユニット２１内の制御ルール学習部８０２の双方にアクセス可能に接続されている。

制御ルールデータベースＤＢ１には、制御ルール学習部８０２における学習結果としての制御ルール（ニューラルネット）が格納される。制御ルール実行部１０は、制御ルールデータベースＤＢ１に格納された制御ルールを参照する。
学習データデータベースＤＢ２には、制御ルール学習部８０２で得られた学習データが格納される。
出力判定データベースＤＢ３は、制御実行ユニット２０内の制御出力判定部５にアクセス可能に接続され、出力判定データベースＤＢ３には出力判定結果が格納される。

良否判定データベースＤＢ４には、良否判定のためのデータが格納される。
良否判定ルールデータベースＤＢ５には、良否判定ルール学習部３１における学習結果としての良否判定ルール（ニューラルネット）が格納される。この良否判定ルールデータベースＤＢ５は、制御実行ユニット２０内の制御出力良否判定ルール実行部１７、後述する良否判定ルール学習ユニット２２内の良否判定ルール学習部３１の双方にアクセス可能に接続されている。制御出力良否判定ルール実行部１７は、良否判定ルールデータベースＤＢ５に格納された良否判定ルールを参照する。
学習データデータベースＤＢ６には、制御方法学習ユニット２１で学習された学習データが格納される。
検証データデータベースＤＢ７には、良否判定をするのに必要な検証データが格納される。

図２は、本例の制御ルール実行部１０の具体的な構成例を示す。
制御ルール実行部１０には、制御入力データ作成部２で作成された入力データＳ１が入力される。制御ルール実行部１０は、入力データＳ１を処理して制御出力演算部３に制御操作端操作指令Ｓ２を与える。制御ルール実行部１０は、ニューラルネット１０１を備えており、ニューラルネット１０１は、図２６に示すような形状制御ルールに則した制御操作端操作指令Ｓ２を出力する。

制御ルール実行部１０は、さらにニューラルネット選択部１０２を備えており、制御ルールデータベースＤＢ１に格納された制御ルールを参照することで、ニューラルネット１０１における制御ルールとして最適な制御ルールを選択し、ニューラルネット１０１に実行させる。

このように制御ルール実行部１０は、オペレータ班や制御目的で分けられた複数のニューラルネットから、必要なニューラルネットを選択して使用している。制御ルールデータベースＤＢ１には、制御対象プラント１からのデータとして、ニューラルネット及び良否判定基準を選択できるような実績データ（操業班のデータ等）Ｓｉも含むのがよい。
なお、ニューラルネットを実行すると制御ルールになることから、本明細書では、ニューラルネットと制御ルールは同義の意味で使用する。

図３は、制御出力良否判定ルール実行部１７の具体的な構成を示す。
制御出力良否判定ルール実行部１７には、制御入力データ作成部２で作成され入力データＳ１及び制御出力演算部３で作成された制御操作量Ｓ３が入力される。制御出力良否判定ルール実行部１７は、これらの入力データに基づいて制御出力良否判定推定値Ｓ９を生成し新規探索操作量演算部３３に与える。

また、制御出力良否判定ルール実行部１７には、制御入力データ作成部２で作成された入力データＳ１及び制御出力操作方法選択部１８で作成された選択制御操作量Ｓ８が入力される。制御出力良否判定ルール実行部１７は、これらの入力データに基づいて制御結果良否判定推定値Ｓ１１を生成し、制御出力抑制部４に与える。

制御出力良否判定ルール実行部１７は、ニューラルネット１７１及びニューラルネット選択部１７２を備える。
ニューラルネット１７１は、入力データＳ１（形状パターン）に対して、制御操作量Ｓ３（制御パターン）を出力した場合の制御結果の良否判定値を過去の制御実績を元に推定する。
ニューラルネット選択部１７２は、良否判定ルールデータベースＤＢ５に格納された良否判定ルールを参照することで、ニューラルネット１７１における良否判定ルールとして、最適な良否判定ルールを選択する。

このように制御出力良否判定ルール実行部１７は、制御対象となる材料性質の違い、良否判定基準の違いで分けられた複数のニューラルネットから、必要なニューラルネットを選択する。
良否判定ルールデータベースＤＢ５には、制御対象プラント１からのデータとして、制御対象となる材料性質及び良否判定基準を選択できるような実績データ（操業班のデータ等）Ｓｉを含むのがよい。なお、ニューラルネットを実行すると良否判定ルールになることから、本明細書においてはニューラルネットと良否判定ルールは、同義の意味で使用する。

図１の説明に戻ると、制御方法学習ユニット２１は、制御実行ユニット２０で使用するニューラルネット１０１の学習を実行する。
制御方法学習ユニット２１は、学習データ作成部８０１及び制御ルール学習部８０２を備える。

制御方法学習ユニット２１内の学習データ作成部８０１は、制御実行ユニット２０にて作成した選択制御操作量Ｓ８と、制御方法選択フラグＳ１４、制御出力良否判定ルール実行部１７で作成した制御結果良否判定推定値Ｓ１１を用いて、ニューラルネットの学習に使用する新規の教師データＳ７ａを作成する学習データ作成処理を行う。学習データ作成部８０１が作成した学習データＳ７ａは、制御ルール学習部８０２に与える。
教師データＳ７ａは、制御ルール実行部１０が出力する制御操作端操作指令Ｓ２に対応するものである。

学習データ作成部８０１は、制御出力良否判定ルール実行部１７で作成した制御結果良否判定推定値Ｓ１１を用いて、制御ルール実行部１０が出力する制御操作端操作指令Ｓ２を推定して得たデータを、新規の教師データＳ７ａとして求める。

図４は、制御ルール学習部８０２の具体的な構成例を示す。
制御ルール学習部８０２は、入力データ作成部１１４、教師データ作成部１１５、ニューラルネット処理部１１０、及びニューラルネット選択部１１３を備える。
制御ルール学習部８０２には、外部からの入力として制御入力データ作成部２からの入力データＳ１と、学習データ作成部８０１からの新規の教師データＳ７ａが入力されている。また、制御ルール学習部８０２は、制御ルールデータベースＤＢ１及び学習データデータベースＤＢ２に蓄積されたデータを参照する。

制御ルール学習部８０２において、入力データＳ１は入力データ作成部１１４を介してニューラルネット処理部１１０に取り込まれる。

また、制御ルール学習部８０２において、学習データ作成部８０１からの新規の教師データＳ７ａは、教師データ作成部１１５において学習データデータベースＤＢ２に記憶されている過去の教師データＳ７ｂも含めた合計の教師データＳ７ｃとして、ニューラルネット処理部１１０に与えられる。これらの教師データＳ７ａ，Ｓ７ｂは、適宜、学習データデータベースＤＢ２に記憶されて利用される。

同様に、制御入力データ作成部２からの入力データＳ８ａは、入力データ作成部１１４において学習データデータベースＤＢ２に記憶されている過去の入力データＳ８ｂも含めた合計の入力データＳ８ｃとして、ニューラルネット処理部１１０に与えられる。これらの入力データＳ８ａ，Ｓ８ｂについても、適宜、学習データデータベースＤＢ２に記憶されて利用される。

ニューラルネット処理部１１０は、ニューラルネット１１１とニューラルネット学習制御部１１２により構成される。
ニューラルネット１１１は、入力データ作成部１１４からの入力データＳ８ｃ、教師データ作成部１１５からの教師データＳ７ｃ、ニューラルネット選択部１１３が選択した制御ルール（ニューラルネット）を取り込み、最終的に決定したニューラルネットを制御ルールデータベースＤＢ１に格納する。

ニューラルネット学習制御部１１２は、入力データ作成部１１４、教師データ作成部１１５、ニューラルネット選択部１１３に対して、適宜のタイミングでこれらを制御し、ニューラルネット１１１の入力を得、また処理結果を制御ルールデータベースＤＢ１に格納する。

ここで、図２の制御ルール実行部１０におけるニューラルネット１０１と、図４の制御方法学習ユニット２１におけるニューラルネット１１１は、いずれも同じ概念のニューラルネットであるが、以下のように相違している。
すなわち、制御ルール実行部１０におけるニューラルネット１０１は、予め定められた内容のニューラルネットであり、入力データＳ１を与えたときに対応する出力としての制御操作端操作指令Ｓ２を求めるニューラルネットである。

一方、制御方法学習ユニット２１におけるニューラルネット１１１は、入力データＳ１と制御操作端操作指令Ｓ２についての入力データＳ８ｃ、教師データＳ７ｃを学習データとして設定したときに、この入出力関係を学習により求めるニューラルネットである。

制御方法学習ユニット２１における基本的な処理の考え方は、以下のとおりである。
まず、制御操作量出力可否データＳ４の内容が「可」の場合、制御実行ユニット２０が、制御対象プラント１に制御操作量出力ＳＯを出力する。ここで、制御結果良否判定推定値Ｓ１１の内容が「良」（実績データＳｉが良くなる方向に変化）の場合、学習データ作成部８０１は、制御出力操作方法選択部１８が出力した選択制御操作量Ｓ８が正しいと判断し、ニューラルネットの出力が選択制御操作量Ｓ８となるように学習データを作成する。

一方、制御操作量出力可否データＳ４の内容が「否」、又は、制御対象プラント１に制御操作量出力ＳＯを出力した制御結果良否判定推定値Ｓ１１の内容が「否」（実績データＳｉが悪くなる方向に変化）の場合、学習データ作成部８０１は、制御出力操作方法選択部１８が出力した選択制御操作量Ｓ８が誤っていると判断する。

この場合、学習データ作成部８０１は、制御方法選択フラグＳ１４から、制御出力操作方法選択部１８において制御操作量Ｓ３を選択していた場合かどうかを確認する。この確認で制御操作量Ｓ３を選択していた場合、学習データ作成部８０１は、制御ルール実行部１０が出力した制御操作端操作指令Ｓ２は誤っていると判断し、ニューラルネットの出力が出ないように学習データを作成する。このとき、制御出力として、同じ制御操作端に対して＋方向、－方向の２種類の出力が出るようにニューラルネット出力を構成しておき、出力した側の制御操作端操作指令Ｓ２が出力されないように学習データを作成する。

また、図４に示す制御ルール学習部８０２は、ニューラルネット学習制御部１１２によるデータ処理の結果として、以下のように処理を行う。
まず、制御ルール学習部８０２は、制御実行ユニット２０への入力データＳ１から求めたデータＳ８ｃと、教師データ作成部１１５にて作成した教師データＳ７ｃの組合せである学習データを用いて、制御ルール実行部１０にて用いたニューラルネット１０１の学習を実行する。

実際には、制御ルール学習部８０２は、制御ルール実行部１０のニューラルネット１０１と同じニューラルネット１１１を制御ルール学習部８０２内に備えて、各種条件で運用テストしてそのときの応答を学習し、学習の結果としてより良い結果を生じることが確認された制御ルールを得る。

ここでの学習は、複数個の学習データを用いて行わせる必要があるため、過去に作成された学習データを蓄積している学習データデータベースＤＢ２より、過去の学習データを複数個取り出して、学習し処理を実行する。そして、今回の学習データは、学習データデータベースＤＢ２に格納される。また、学習したニューラルネットは、制御ルール実行部１０で利用するために、制御ルールデータベースＤＢ１に格納される。

ニューラルネットの学習は、新しい学習データが作成される毎に、過去の学習データを一緒に用いて学習してもよいし、学習データがある程度（例えば１００個分）蓄積されてから、過去の学習データを一緒に用いて学習してもよい。

このような構成とすることで、制御出力操作方法選択部１８が新規探索操作量を選択することで、新規探索操作量を対象プラントに出力し、その制御結果に応じて学習データを作成し、新たな制御方法を学習することが可能になる。

図１の説明に戻ると、良否判定ルール学習ユニット２２は、制御実行ユニット２０で使用するニューラルネット１７１（図３）の学習を実行する。制御実行ユニット２０が制御対象プラント１に対して、制御操作量出力ＳＯを出力した場合、実際に制御効果が実績データＳｉの変化となって現れるのには時間を要する。このため、その時間だけ時間遅れさせたデータを用いて学習を実行する。なお、図１などにおいて、「Ｚ^－１」と記載した処理部ＤＬは、各データが伝送される際に、適宜の時間遅れがあることを示す。

良否判定ルール学習ユニット２２は、制御結果良否判定部６、良否判定ルール学習部３１、良否判定データベースＤＢ４を備える。

制御結果良否判定部６は、制御対象プラント１からの実績データＳｉ及び実績データ前回値Ｓｉ０、並びに良否判定データベースＤＢ４に記憶された良否判定データＳ５を用いて、実績データＳｉが良くなる方向に変化したか、悪くなる方向に変化したか判定する制御結果良否判定処理を行う。そして、制御結果良否判定部６は、判定結果を示す制御結果良否データＳ６を出力する。

図５は、良否判定ルール学習部３１の具体的な構成を示す。
良否判定ルール学習部３１は、入力データ作成部３１４、教師データ作成部３１５、ニューラルネット処理部３１０、ニューラルネット選択部３１３を備える。
良否判定ルール学習部３１は、外部からの入力として、制御入力データ作成部２からの入力データＳ１を時間遅れさせたデータＳ１２ａ１と、制御出力抑制部４からの制御出力量Ｓ０を時間遅れさせたデータＳ１２ａ２を得る。また、良否判定ルール学習部３１は、制御結果良否判定部６からの制御結果良否データＳ６（Ｓ１３ａ）を得る。
さらに、良否判定ルール学習部３１は、良否判定ルールデータベースＤＢ５及び学習データデータベースＤＢ６に蓄積されたデータを参照する。

入力データＳ１及び制御出力量Ｓ０は、適宜の時間遅れ補償後に入力データ作成部３１４を介してニューラルネット処理部３１０に取り込まれる。

また、制御結果良否判定部６からの制御結果良否データＳ６（Ｓ１３ａ）は、教師データ作成部３１５において学習データデータベースＤＢ６に記憶されている過去の教師データＳ１３ｂも含めた合計の教師データＳ１３ｃとして、ニューラルネット処理部３１０に与えられる。これらの教師データＳ１３ａ、Ｓ１３ｂは、適宜、学習データデータベースＤＢ６に記憶されて、利用される。

同様に、制御入力データ作成部２及び制御出力抑制部４からの入力データＳ１２ａ１とＳ１２ａ２は、入力データ作成部３１４において学習データデータベースＤＢ６に記憶されている過去の入力データＳ１２ｂも含めた合計の入力データＳ１２ｃとして、ニューラルネット処理部３１０に与えられる。これらの入力データＳ１２ａ１、Ｓ１２ａ２、Ｓ１２ｂは、適宜、学習データデータベースＤＢ６に記憶されて、利用される。

ニューラルネット処理部３１０は、ニューラルネット３１１とニューラルネット学習制御部３１２とにより構成される。
ニューラルネット３１１は、入力データ作成部３１４からの入力データＳ１２ｃ、教師データ作成部３１５からの教師データＳ１３ｃ、及びニューラルネット選択部３１３が選択した制御ルール（ニューラルネット）を取り込む。そして、ニューラルネット３１１は、最終的に決定したニューラルネットを、良否判定ルールデータベースＤＢ５に格納する。

ニューラルネット学習制御部３１２は、入力データ作成部３１４、教師データ作成部３１５、及びニューラルネット選択部３１３に対して、適宜のタイミングでこれらを制御し、ニューラルネット３１１の入力を得る。また、ニューラルネット学習制御部３１２は、ニューラルネット選択部３１３を経由して、処理結果を良否判定ルールデータベースＤＢ５に格納する。

図６は、センヂミア圧延機の形状制御における制御方法に対する制御結果良否判定の具体例を示す図である。図６は、図２６に示す形状制御ルールごとの制御結果良否判定結果を示す。

ここで、図３に示す制御実行ユニット２０のニューラルネット１７１と、図５に示す良否判定ルール学習ユニット２２におけるニューラルネット３１１は、いずれも同じ概念のニューラルネットであるが、以下の点で相違している。
制御実行ユニット２０におけるニューラルネット１７１は、予め定められた内容のニューラルネットである。すなわち、ニューラルネット１７１は、入力データＳ１と選択制御操作量Ｓ８又は制御操作量Ｓ３を与えたときに対応する出力としての制御出力良否判定推定値Ｓ９又はＳ１１を求めるものであり、いわば一方方向の処理に利用されるニューラルネットである。

これに対し、良否判定ルール学習ユニット２２におけるニューラルネット３１１は、入力データＳ１と制御出力量Ｓ０の入力データＳ１２ｃ、教師データＳ１３ｃを学習データとして設定したときに、これらの入出力関係を満足するニューラルネットである。

次に、センヂミア圧延機における形状制御を対象に、プラント制御方法の具体例を説明する。なお形状制御に関しては、以下の仕様Ａ，Ｂを採用するものとして説明する。

仕様Ａは、優先度についての仕様であり、板幅方向の優先度の情報を持つものとする。例えば形状制御においては、板幅方向全域にわたって目標値に制御することが、機械特性上困難な場合が多い。そのため、板幅方向で下記の２つの優先度についての仕様Ａ１，Ａ２を設ける。このうち優先度についての仕様Ａ１は「板端部を優先する」ものである。また、優先度についての仕様Ａ２は「中央部を優先する」ものである。
この仕様Ａ１，Ａ２という２つの優先順位に従った制御を実行する。つまり、プラント制御システムが制御を実行する場合は、優先度についての仕様Ａ１又はＡ２のいずれかを考慮する。

仕様Ｂは、予め判明している条件への対応についての仕様である。一例をあげると、形状パターンと制御方法の関係は、種々の条件で変化することから、例えば、仕様Ｂ１を板幅、仕様Ｂ２を鋼種とする区分で分ける必要がある。それぞれの仕様が変化することで、形状操作端の形状への影響度合が変化する。

本例での制御対象プラント１は、センヂミア圧延機であり、実績データは形状実績となる。センヂミア圧延機は、ステンレスなどの硬い材料を冷間圧延するためのクラスターロールを持つ圧延機である。ゼンジミア圧延機は、硬い材料に強圧下を与える目的で、小径のワークロールを使用する。このため、ゼンジミア圧延機は、平坦な鋼板を得るための制御が難しい。この対策として、ゼンジミア圧延機は、クラスターロールの構造やさまざまな形状制御部を採用している。

センヂミア圧延機は、一般には上下の第１中間ロールが片テーパを持ち、シフトできるようになっているほか、上下に６個の分割ロールと２個のＡＳ－Ｕと呼ばれるロールを備えている。以下に説明する例では、形状の実績データＳｉは、形状検出器の検出データを用い、入力データＳ１は、目標形状との差である、形状偏差を用いる。また、制御操作量Ｓ３は、＃１～＃ｎのＡＳ－Ｕ、上下の第１中間ロールのロールシフト量とする。

図７は、センヂミア圧延機の形状制御に用いる場合のニューラルネット構成を示す。ここでニューラルネットは、制御ルール実行部１０用としては、ニューラルネット１０１を示す。また、制御ルール学習部８０２用としては、ニューラルネット１１１を示す。ニューラルネット１０１とニューラルネット１１１は、いずれも構造が同じである。

センヂミア圧延機の形状制御の事例では、制御対象プラント１からの実績データＳｉは形状検出器のデータ（ここでは、実績形状と目標形状との差である形状偏差が出力されるものとする）を含むセンヂミア圧延機の実績データである。制御入力データ作成部２は、入力データＳ１として規格化形状偏差２０１、形状偏差段階２０２を得る。これによりニューラルネット１０１、１１１の入力層は、規格化形状偏差２０１、形状偏差段階２０２により構成される。なお図７では、形状偏差段階２０２をニューラルネット入力層への入力としているが、段階に応じてニューラルネットを切替てもよい。

ニューラルネット１０１、１１１の出力層は、センヂミア圧延機の形状制御操作端である、ＡＳ－Ｕ、第１中間ロールに合わせて、ＡＳ－Ｕ操作度合３０１と第１中間操作度合３０２により構成される。それぞれの操作度合は、ＡＳ－Ｕについては、ＡＳ－Ｕ開方向（ロールギャップ（圧延機の上下作業ロール間の間隔）が開く方向）、ＡＳ－Ｕ閉方向（ロールギャップが閉じる方向）を各ＡＳ－Ｕについて持つ。

第１中間ロールについては、第１中間ロール開方向（第１中間ロールが圧延機中心より外側に向かって動作する方向）、第１中間ロール閉方向（第１中間ロールが圧延機中心側に向かって動作する方向）を、上下第１中間ロールについて持つ。
例えば、形状検出器が２０ゾーンで、形状偏差段階２０２を３段階（大、中、小）とした場合、入力層は２３個の入力となる。また、ＡＳ－Ｕのサドルが７本、上下第１中間ロールが板幅方向でシフト可能とすると、出力層はＡＳ－Ｕ操作度合３０１が１４個、１中間操作度合が４個の計１８個となる。中間層の層数及び各層のニューロン数については、適時設定する。
なお、出力層であるセンヂミア圧延機の形状制御操作端は、個々の制御操作端に対して＋方向、－方向の２種類の出力が出るようにニューラルネット出力を構成している。

図８は、本例での形状偏差と制御方法を示す。
図８（ａ）は、形状偏差が大きい場合の制御方法を示し、図８（ｂ）は、形状偏差が小さい場合の制御方法を示す。図８（ａ），（ｂ）の高さ方向（縦軸方向）は形状偏差の大きさ、横軸方向は板幅方向であり、板幅の両側が板端部、中央が板中央部を示す。

図８（ａ）に示すように、形状偏差が大きい場合は、板幅方向の局部的な形状偏差よりも全体的な形状を修正することを優先する。
一方、図８（ｂ）に示すように、形状偏差が小さい場合は、局部的な形状偏差を小さくすることを優先する。

このように、形状偏差の大きさに応じて制御方法を変える必要があるため、図７に示すように形状偏差段階２０２を設けてニューラルネット１０１、１１１に与え、形状偏差の大きさを判定する。形状偏差については形状偏差の大小にかかわらず、例えば０～１に規格化したものを用いるのがよい。これは、一例であって、形状偏差を規格化せずにそのままニューラルネットの入力層へ入力してもよく、形状偏差の大小に応じて、ニューラルネット自体を変えてもよい。例えば、２つのニューラルネットを準備し、形状偏差が大きい場合に使用するニューラルネットと、小さい場合に使用するニューラルネットを分けてもよい。

本例のプラント制御では、以上説明した図７のような構成のニューラルネット１０１、１１１に対して、形状パターンに対する操作方法を学習させ、学習させたニューラルネットを用いて形状制御を実行する。同じ構成のニューラルネットでも、学習の条件により異なった特性となり、同じ形状パターンに対して異なった制御出力を出すことができる。

そのため、形状実績の他の条件に応じて、複数のニューラルネットを使い分けることで、多様な条件に対して最適な制御を構成することができる。これは仕様Ｂへの対応である。先に説明した図２の構成は、このような仕様を行う場合の具体例を示している。
すなわち、図２の構成例では、制御ルール実行部１０において使用するニューラルネット１０１を、圧延実績や、圧延機オペレータ名、被圧延材の鋼種、板幅等により別個のニューラルネットを準備し、制御ルールデータベースＤＢ１に登録しておく。ニューラルネット選択部１０２は、その時点の条件に合致するニューラルネットを選択し、制御ルール実行部１０のニューラルネット１０１に設定する。

なお、ニューラルネット選択部１０２における、その時点の条件としては、制御対象プラント１における実績データＳｉの中から板幅のデータを取り込み、これに応じてニューラルネットを選択するのがよい。また、ここで使用する複数のニューラルネットは、図７に示すような入力層、出力層を持てば、中間層の層数、各層のユニット数は異なってもよい。

図９は、ニューラルネット１０１、１１１の入力層へ入力するためのデータＳ１（規格化形状偏差２０１、形状偏差段階２０２）を作成する、制御入力データ作成部２の構成を示す。
制御入力データ作成部２は、実績データＳｉとして、制御対象プラント１であるセンヂミア圧延機における圧延時の板形状を検出する、形状検出器の形状検出器データを入力とする。そして、制御入力データ作成部２は、形状偏差ＰＰ値演算部２１０にて各形状検出器ゾーンの検出結果の最大値と最小値の差である形状偏差ＰＰ値（Peak To Peak値）ＳＰＰを求める。

形状偏差段階演算部２１１は、形状偏差ＰＰ値ＳＰＰにより、形状偏差を大、中、小の３段階に分類する。形状は、被圧延材の伸び率の板幅方向分布であり、伸び率を１０－５単位で表すＩ－ＵＮＩＴが単位として用いられる。例えば、以下の数式で示すように分類する。

ここでは［数１］式の成立により形状偏差段階が（大＝１、中＝０、小＝０）とし、［数２］式の成立により形状偏差段階が（大＝０、中＝１、小＝０）とし、［数３］式の成立により形状偏差段階が（大＝０、中＝０、小＝１）とするように分類している。各ゾーンの形状偏差については、ＳＰＭ＝ＳＰＰとした、ＳＰＭを用いて規格化を実行する。

以上のように、制御入力データ作成部２は、ニューラルネット１０１への入力データである規格化形状偏差２０１及び形状偏差段階２０２を作成する。規格化形状偏差２０１及び形状偏差段階２０２は、制御ルール実行部１０の入力データＳ１である。

図１０は、制御出力演算部３の構成を示す。
制御出力演算部３は、制御ルール実行部１０内の、ニューラルネット１０１からの出力である制御操作端操作指令Ｓ２より、各形状制御操作端への操作指令である制御操作量Ｓ３を作成する。制御操作端操作指令Ｓ２は、センヂミア圧延機の形状制御の場合には、ＡＳ－Ｕ操作度合３０１、第１中間操作度合３０２に相当する。
図１０では、複数個数が存在するＡＳ－Ｕ操作度合３０１、第１中間操作度合３０２について、各１つのデータ例を示しており、各データは開方向度合と閉方向度合の一対のデータで構成されている。

制御出力演算部３内では、入力されたＡＳ－Ｕ操作度合３０１は、各ＡＳ－Ｕ開方向、閉方向の出力をもつため、それらの差が減算器３０３で算出される。そして、乗算器３０４で減算器３０３の出力に変換ゲインＧ_ＡＳＵを乗算することで、各ＡＳ－Ｕへの操作指令が生成されて出力される。変換ゲインＧ_ＡＳＵは、各ＡＳ－Ｕへの制御出力がＡＳ－Ｕ位置変更量（単位は長さ）となることから、度合から位置変更量への変換ゲインとなる。

同様に入力された第１中間操作度合３０２は、第１中間外側、内側の出力をもつため、それらの差が減算器３０５で算出される。そして、乗算器３０６で減算器３０５の出力に変換ゲインＧ_１ＳＴを乗算することで、各第１中間ロールシフトへの操作指令が生成されて出力される。変換ゲインＧ_１ＳＴは、各第１中間ロールへの制御出力が第１中間ロールシフト位置変更量（単位は長さ）となることから、度合から位置変更量への変換ゲインとなる。

以上により、制御出力演算部３は、制御操作量Ｓ３を演算することができる。制御操作量Ｓ３は、＃１～＃ｎＡＳ－Ｕ位置変更量（ｎはＡＳ－Ｕロールのサドル数による）と、上第１中間シフト位置変更量、下第１中間シフト位置変更量から構成されている。

図１１は、制御出力良否判定ルール実行部１７及び良否判定ルール学習部３１に用いるセンヂミア圧延機の形状制御結果の良否判定に用いる場合のニューラルネット構成を示す。ここでのニューラルネットは、制御出力良否判定ルール実行部１７用ではニューラルネット１７１であり、良否判定ルール学習部３１用ではニューラルネット３１１を示しているが、いずれも構造は同じである。

入力データＳ１として規格化形状偏差２０１、形状偏差段階２０２については、図７で説明したニューラルネット入力層への入力と同一の信号が使用される。さらに制御操作量Ｓ３あるいは後述する選択制御操作量Ｓ８を、入力層への入力とする。この制御操作量Ｓ３あるいは選択制御操作量Ｓ８は、各制御操作機器の位置変更量で構成される。

また、出力層は、入力データＳ１に対して制御操作量Ｓ３あるいは選択制御操作量Ｓ８を出力したときの、制御結果の良否判定を推定した値を出力する。中間層の層数及び各層のニューロン数については、適時設定される。

図１２は、新規探索操作量演算部３３における操作量演算方法を示す。
新規探索操作量演算部３３は、制御出力良否判定ルール実行部１７で出力した制御出力良否判定推定値Ｓ９を用いて、以下のような方針で新規探索制御操作量Ｓ１２を演算する。
すなわち、制御出力良否判定推定値Ｓ９の値が大きいときは、制御操作の良否判定が良く推定されているので、新規探索操作量演算部３３は、新規探索操作量としての微調整を行う。
制御出力良否判定推定値Ｓ９の値が小さい時は、制御操作の良否判定が悪く推定されているので、新規探索操作量演算部３３は、制御操作を大きく変更することで新たな適切な操作方法の探索を行う。

以上の方針により、新規探索操作量Ｃrandを求める式を以下のように設定する。
ＩＦ（Ｓ９＞ｔｈ）ＴＨＥＮＣrand＝Ｃref^＊（１＋β^＊th1）
ＩＦ（ｔｈ＞＝Ｓ９）ＴＨＥＮＣrand＝Ｃref＋γ^＊th2^＊Ｇ
ここで、β及びγは－１～１の間で発生させるランダム値を示す。ｔｈ１は微調整を行う度合いを示しており、例えば、元々の指令の±１０％の範囲を微調整とする場合には、ｔｈ１を０．１に設定する。

ｔｈ２は操作方法を大きく変更する度合いの設定であり、例えばｔｈ２を０．１とした場合には、元の指令に１０％のオフセットが加算されることになり、操作極性が変わる可能性や元々操作しなかった機器の指令を出力することが発生する。
β及びγの値は、各操作機器で異なる値が使用され、各機器の操作量はそれぞれ独立に変更が行われる。Ｇは各制御操作機器の最大操作位置制御指令を示しており、上述した指令％に掛け合わせることで、％の値を操作位置制御指令に変換される。

制御出力操作方法選択部１８は、制御操作量Ｓ３か新規探索制御操作量Ｓ１２を選択して、選択制御操作量Ｓ８として出力する。制御操作量Ｓ３か新規探索制御操作量Ｓ１２のどちらを選択するかは、確率的に決定することとして、新規探索制御操作量Ｓ１２を使用する確率Ｐrandを０～１で、ユーザにて設定できるようにする。０から１の値をランダムにとる値δを用いて、次式により決定する。
ＩＦ（δ＞Ｐrand）ＴＨＥＮＣ”ref＝Ｃref、α＝１
ＥＬＳＥＣ”ref＝Ｃrand、α＝０

ここで、Ｃ”refは制御出力操作方法選択部１８が以降の演算部に出力する選択制御操作量Ｓ８を示す。δは全機器操作量の演算に共有の値を使用し、全機器とも同じ側の操作量を使用する。αは、制御方法選択フラグＳ１４であり、制御操作量Ｓ３を選択した場合に１、新規探索制御操作量Ｓ１２を選択する場合０を取る。この制御方法選択フラグＳ１４は、選択制御操作量Ｓ８とともに以降の演算部に出力する。Ｐrandの設定の仕方として、実機での制御においてランダムな操作によってプラントへのリスクを与えたくない場合には０に設定しておき、制御ルールの改善の為に、新規探索用操作量を出力させたい場合に０以外の割合を設定する。

図１３は、制御出力判定部５の構成を示す。
制御出力判定部５は、圧延現象モデル５０１と形状修正良否判定部５０２から構成される。そして、制御出力判定部５は、制御対象プラント１よりの実績データＳｉ、制御出力演算部３からの制御操作量Ｓ３、及び出力判定データベースＤＢ３の情報を得て、制御操作端への制御操作量出力可否データＳ４を与える。

このような構成の制御出力判定部５は、制御出力操作方法選択部１８にて演算した選択制御操作量Ｓ８を制御対象プラント１である圧延機に出力した場合の形状の変化を、既知の制御対象プラント１のモデルに入力することで予測する。既知の制御対象プラント１のモデルは、ここでは圧延現象モデル５０１である。この予測で、形状が悪化すると予想される場合、制御出力判定部５は、制御操作量出力ＳＯを抑制し、形状が大きく悪化することを防止する。

より詳細に述べると、制御出力判定部５は、選択制御操作量Ｓ８を圧延現象モデル５０１に入力し選択制御操作量Ｓ８による形状変化を予測し、形状偏差修正量予測データ５０３を演算する。
他方、制御出力判定部５は、制御対象プラント１からの形状検出器データＳｉに、形状偏差修正量予測データ５０３を加算することで形状偏差予測データ５０５を得、形状偏差予測データ５０５を評価する。これにより、制御出力判定部５は、制御操作量Ｓ３を制御対象プラント１に出力したときに、形状がどのように変化するかが予測できる。ここでの形状検出器データＳｉは、現時点での形状偏差実績データ５０４である。
制御出力判定部５は、現状の形状偏差実績データ５０４と形状偏差予測データ５０５とにより、形状修正良否判定部５０２は、形状が良くなる方向に変化するのか、悪くなる方向に変化するのかを判定し、制御操作量出力可否データＳ４を得る。

形状修正良否判定部５０２は、具体的には以下のようにして形状修正の良否判定を行う。まず形状制御の優先度についての仕様Ａ，Ｂで示したように、板幅方向での制御優先度を考慮するため、出力判定データベースＤＢ３には、板幅方向の重み係数ｗ（ｉ）を仕様Ａ１、仕様Ａ２の各仕様に対して設定しておく。それを用いて、例えば下記の［数４］式のような評価関数Ｊを用いて形状変化の良否を判定する。なお、［数４］式において、ｗ（ｉ）は重み係数、εfb（ｉ）は形状偏差実績データ５０４、εest（ｉ）は形状偏差予測データ５０５、ｉは形状検出器ゾーン、randは乱数項である。

［数４］式の評価関数Ｊを用いた場合、形状が良くなるときは評価関数Ｊが正、悪くなるときは評価関数Ｊが負となる。また、randは乱数項であり、評価関数Ｊの評価結果を乱数的に変化させる。これにより、形状が悪化する場合であっても、評価関数Ｊとしては正になる場合が発生するため、圧延現象モデル５０１が正しくない場合についても形状パターンと制御方法の関係を学習していくことが可能である。

ここで乱数項randは、試運転当初のように、制御対象プラント１のモデルが不確実の場合は最大値を大きくし、ある程度制御方法を学習し安定した制御を実行したい場合は０とするように、適時変更する。

形状修正良否判定部５０２は、評価関数Ｊを演算し、Ｊ≧０のとき制御操作量出力可否データＳ４＝１（可）とし、Ｊ＜０のとき制御操作量出力可否データＳ４＝０（否）として、制御操作量出力可否データＳ４を出力する。

既に説明した通り、制御出力良否判定ルール実行部１７には、規格化形状偏差２０１、形状偏差段階２０２及び選択制御操作量Ｓ８が入力され、制御結果良否判定推定値Ｓ１１が出力される。制御結果良否判定推定値Ｓ１１は、制御した結果良くなると推定する場合が１、それ以外が０の値を取る。

制御出力抑制部４は、制御出力判定部５の判定結果である制御操作量出力可否データＳ４及び制御結果良否判定推定値Ｓ１１に応じて、制御対象プラント１への制御操作量出力ＳＯの出力有無を決定する。制御操作量出力可否データＳ４は、＃１～＃ｎＡＳ－Ｕ位置変更量出力、上第１中間シフト位置変更量出力、下第１中間シフト位置変更量出力であり、以下の条件で決定される。

ＩＦ（制御方法選択フラグ＝１）ＴＨＥＮ
ＩＦ（制御操作量出力可否データＳ４＝０ＯＲ制御結果良否判定推定値Ｓ１１＜＝thprot）ＴＨＥＮ
＃１～＃ｎＡＳ－Ｕ位置変更量出力＝０
上第１中間シフト位置変更量出力＝０
下第１中間シフト位置変更量出力＝０
ＥＬＳＥ
＃１～＃ｎＡＳ－Ｕ位置変更量出力＝＃１～＃ｎＡＳ－Ｕ位置変更量
上第１中間シフト位置変更量出力＝上第１中間シフト位置変更量
下第１中間シフト位置変更量出力＝下第１中間シフト位置変更量
ＥＮＤＩＦ
ＥＬＳＥ
ＩＦ（（制御操作量出力可否データＳ４＝０ＯＲ制御結果良否判定推定値Ｓ１１＜＝thprot）AND（PTRIAL＜η））ＴＨＥＮ
＃１～＃ｎＡＳ－Ｕ位置変更量出力＝０
上第１中間シフト位置変更量出力＝０
下第１中間シフト位置変更量出力＝０
ＥＬＳＥ
＃１～＃ｎＡＳ－Ｕ位置変更量出力＝＃１～＃ｎＡＳ－Ｕ位置変更量
上第１中間シフト位置変更量出力＝上第１中間シフト位置変更量
下第１中間シフト位置変更量出力＝下第１中間シフト位置変更量
ＥＮＤＩＦ
ＥＮＤＩＦ

ここでthprotは、制御結果良否判定の推定値を元に、出力抑制をかける基準値を設定する。具体的には、プラントの操業データが不十分な立上げ初期は、良否判定の推定精度も低いと考えられるので、基準値を低くしておき、あまり良否判定の推定による出力抑制をかけないようにする。
一方、操業の実績データを十分に蓄積し、良否判定の精度が高くなってからは、基準値を高くして、制御結果の良否判定推定による出力抑制の効果を高めていく。良否判定の精度については、良否判定ルール学習ユニットにおける良否判定ルール精度検証部３４から良否判定ルール精度Ｓ１５を受け取ることで、現状使用している良否判定ルールの推定精度の検証結果を元に判断する。

また、ηは０～１でランダムな値を取る変数で、PTRIALは出力抑制を無効化して新規探索操作をプラントへ出力させる確率を示す。制御方法選択フラグＳ１４が０のときは、未知の領域における制御方法の効果を検証する場合を含むため、一定の確率で、プラントへの出力抑制を無視してプラントへ出力を行うようにする。

制御実行ユニット２０においては、制御対象プラント１（圧延機）からの実績データＳｉより、上述した演算を実行し、制御操作量出力ＳＯを制御対象プラント１（圧延機）に出力することにより形状制御を実行する。また、制御方法学習ユニット２１は、制御実行ユニット２０で用いたデータを使用する。

次に、学習データ作成部８０１が行う動作について説明する。
図１に示したように、学習データ作成部８０１は、制御出力良否判定ルール実行部１７からの制御結果良否判定推定値Ｓ１１を基にして、制御操作端操作指令Ｓ２、選択制御操作量Ｓ８、制御方法選択フラグＳ１４、制御出力抑制部の判定結果（制御操作量出力可否データＳ４）より、制御ルール学習部８０２で使用するニューラルネット１１１に対する教師データＳ７ａを作成する。

この場合の教師データＳ７ａは、図７に示す、ニューラルネット１１１の出力層からの出力である、ＡＳ－Ｕ操作度合３０１、１中間操作度合３０２となる。学習データ作成部７は、ニューラルネット１０１の出力である制御操作端操作指令Ｓ２（ＡＳ－Ｕ操作度合３０１、１中間操作度合３０２）と、選択制御操作量Ｓ８である＃１～＃ｎＡＳ－Ｕ位置変更量出力、上第１中間シフト位置変更量出力、下第１中間シフト位置変更量出力を用いて、制御ルール学習部８０２で使用するニューラルネット１１１に対する教師データＳ７ａを作成する。

学習データ作成部８０１の動作を説明するにあたり、図１０に示す制御出力演算部３における各部データや記号の関係を、図１４に示す。ここでは、ニューラルネット１０１の出力である制御操作端操作指令Ｓ２についてＡＳ－Ｕ操作度合３０１を代表的に示しており、操作度合正側のデータをＯＰref、操作度合負側のデータをＯＭref、変換ゲインをＧ、制御操作量Ｓ３をＣrefとする。

操作度合正データＯＰref、操作度合負データＯＭrefは、減算器７０１で差が取られ、乗算器７０２で変換ゲインＧが乗算されて、制御操作量出力Ｃrefが得られる。この制御操作量出力Ｃrefが、制御出力操作方法選択部１８に供給され、選択された操作指令値Ｃ”ｒｅｆが得られる。
ここでは、簡単のため、制御ルール実行部１０のニューラルネット１０１の出力層からの出力として、操作度合正側及び操作度合負側、制御操作外乱発生部１６からの乱数的に発生する操作度合を操作度合乱数としている。また、制御操作端に対する制御操作量出力ＳＯを操作指令値としている。

図１５は、学習データ作成部７における処理段階と処理内容を示している。
最初の処理段階７１では、操作指令値Ｃ”refは、制御出力操作方法選択部１８の出力値である選択制御操作量Ｓ８を参照する。

次の処理段階７２では、制御結果良否判定推定値Ｓ１１と制御操作量出力可否データＳ４に応じて操作指令値Ｃrefを修正しＣ´refとする。具体的には制御結果良否判定推定値Ｓ１１＝０又は制御操作量出力可否データＳ４＝０のとき、以下の［数５］式、制御結果良否判定推定値Ｓ１１＝１かつ制御操作量出力可否データＳ４＝１のとき以下の［数６］式により、操作指令値Ｃ”refの修正値Ｃ´refとする。

処理段階７３では、修正された操作指令値Ｃ´refより、［数７］式、［数８］式により操作度合修正量ΔＯｒｅｆを求める。

処理段階７４では、ニューラルネット１１１への教師データＯＰ´ref、ＯＭ´refを［数９］式により求める。

このように学習データ作成部７では、図１４に示すように、実際に制御対象プラント１に対して出力した操作指令値Ｃ”refを、制御出力良否判定ルール実行部１７の制御結果良否判定推定値Ｓ１１と制御出力抑制部４の制御操作量出力可否データＳ４に応じて、操作指令値修正値Ｃ´refを演算する。
具体的には、制御結果良否判定推定値Ｓ１１＝１かつ制御操作量出力可否データＳ４＝１の場合は、良い操作であると判断された場合で、操作指令値を同じ方向にΔＣrefだけ増加するようにする。

逆に、制御結果良否判定推定値Ｓ１１＝０又は制御操作量出力可否データＳ４＝０の場合は、良くない操作であると判断された場合で、操作指令値を逆方向にΔＣｒｅｆだけ減少するようにする。変換ゲインＧは、予め設定したものであるから既知であることから、操作度合正側及び操作度合負側の値が判れば、修正量ΔＯｒｅｆを求めることが可能である。ここでΔＣrefは、予め適当な値をシミュレーション等で求めておき、設定する。以上の手順により、制御ルール学習部８０２にて使用する教師データＯＰ´ref、ＯＭ´refは［数９］式により求めることができる。

なお、図１４では簡単な例で説明を行っているが、実際には、＃１～＃ｎＡＳ－Ｕに対するＡＳ－Ｕ操作度合３０１及び、上第１中間ロールシフト、下第１中間ロールシフトに対する第１中間操作度合３０２についてその全てを実行し、制御ルール学習部８０２で用いるニューラルネット１１１の教師データ（ＡＳ－Ｕ操作度合教師データ、１中間操作度合教師データ）とする。

図１６は、学習データデータベースＤＢ２に保存されるデータの例を示す。
ニューラルネット１１１を学習するためには、多数の入力データＳ８ａと教師データＳ７ａの組合せが必要である。したがって、学習データ作成部７で作成した教師データＳ７ａは、制御実行ユニット２０にて制御ルール実行部１０に入力された入力データＳ１（Ｓ８ａ）と組み合わせて一組の学習データとして、学習データデータベースＤＢ２に保存される。ここでの教師データＳ７ａは、ＡＳ－Ｕ操作度合教師データ、第１中間操作度合である。また、入力データＳ１（Ｓ８ａ）は、規格化形状偏差２０１及び形状偏差段階である。

なお、図１のプラント制御システムは、各種のデータベースＤＢ１、ＤＢ２、ＤＢ３、ＤＢ４を使用しているが、各データベースＤＢ１、ＤＢ２、ＤＢ３、ＤＢ４は、ニューラルネット管理テーブルＴＢにより連系的に管理運用される。

図１７は、ニューラルネット管理テーブルＴＢの構成を示す。
ニューラルネット管理テーブルＴＢは、仕様について（Ｂ１）板幅、（Ｂ２）鋼種、及び制御の優先度についての仕様Ａ１、Ａ２に応じて区分けされる。（Ｂ１）板幅としては、例えば、３フィート幅、メータ幅、４フィート幅、５フィート幅の４区分が、鋼種としては、鋼種（１）～鋼種（１０）の１０区分程度を用いる。また、制御の優先度についての仕様Ａについては、Ａ１及びＡ２の２種類とする。この場合、８０区分となり、８０個のニューラルネットを、圧延条件に応じて使い分けて使用することになる。

ニューラルネット学習制御部１１２は、図１６に示すような、入力データ及び教師データの組合せである学習データを、図１７に示すニューラルネット管理テーブルＴＢに従って、該当するニューラルネットＮｏ．と紐付けて、図１８に示すような学習データデータベースＤＢ２に格納する。

制御実行ユニット２０は、制御対象プラント１に対して、形状制御を実行するたびに、学習データが２組作成される。これは、同じ入力データ、制御出力に対して、制御結果良否判定が制御の優先度についての仕様Ａ１及び仕様Ａ２の２つの評価基準を用いて行われるため、教師データが２種類作成されるためである。教師データがある程度（例えば２００組）蓄積されたら、又は新たに学習データデータベースＤＢ２に蓄積されたら、ニューラルネット学習制御部１１２は、ニューラルネット１１１の学習を指示する。

制御ルールデータベースＤＢ１には、図１７に示すような管理テーブルＴＢに従って、複数のニューラルネットが格納されている。ニューラルネット学習制御部１１２は、学習が必要なニューラルネットＮｏ．を指定して、ニューラルネット選択部１１３が制御ルールデータベースＤＢ１より当該ニューラルネットを取り出し、ニューラルネット１１１に設定する。

ニューラルネット学習制御部１１２は、学習データデータベースＤＢ２より、該当するニューラルネットに対応する、入力データ及び教師データの取り出しを、入力データ作成部１１４及び教師データ作成部１１５に指示し、それらを用いてニューラルネット１１１の学習を実行する。なお、ニューラルネットの学習方法は手法が種々提案されており、いずれの手法を用いてもよい。

ニューラルネット１１１の学習が完了すると、ニューラルネット学習制御部１１２は、学習結果であるニューラルネット１１１を、制御ルールデータベースＤＢ１の該当するニューラルネットＮｏ．の位置に書き戻すことで、学習が完了する。

学習は、図１７に示すように定義された全てのニューラルネットに対して定時間間隔（例えば１日毎）で一斉に実行してもよいし、新しい学習データがある程度（例えば１００組）蓄積されたニューラルネットＮｏ．のニューラルネットのみ、その時点で学習させてもよい。

次に、良否判定ルール学習ユニット２２の動作について説明する。
良否判定ルール学習ユニット２２は、制御実行ユニット２０で用いたデータの時間遅れデータを使用する。ここでの時間遅れＺ^－１は、ｅ－ＴＳを意味し、予め設定した時間Ｔだけ遅延させることを示す。
制御対象プラント１は、時間応答を持つため、制御操作量出力ＳＯにより、実績データが変化するまで時間遅れが存在する。そのため、学習は、制御操作実行後、遅延時間Ｔだけ経過した時点での実績データを用いて実行する。

形状制御においては、ＡＳ－Ｕや第１中間ロールに対する操作指令出力後、形状計が形状変化を検出するまで数秒要するため、Ｔ＝２秒から３秒程度に設定するのがよい。なお、形状検出器の種類や圧延速度によっても、遅れ時間は変化するため、制御操作端の変更が形状変化となるまでの最適な時間をＴとして設定するのがよい。

図１９は、制御結果良否判定部６の動作を示す。形状変化良否判定部６０２においては、［数１０］式に示す良否判定評価関数Ｊｃを用いる。

この［数１０］式において、εfb（ｉ）は実績データＳｉに含まれる形状偏差実績データ、εlast（ｉ）は形状偏差実績データ前回値であり、ｗＣ（ｉ）は良否判定用の板幅方向重み係数である。ここで、良否判定用の重み係数ｗＣ（ｉ）は、良否判定データベースＤＢ４より、制御の優先度についての仕様Ａ１、Ａ２に応じて設定する。良否判定評価関数Ｊｃにより、制御結果の良否を判定する。

閾値上限ＬＣＵと閾値下限ＬＣＬを、閾値条件（ＬＣＵ≧０≧ＬＣＬ）のもとで予め設定しておく。このときに、良否判定評価関数Ｊｃとの比較の結果が、Ｊｃ＞ＬＣＵであれば、制御結果良否データＳ６＝０（形状が悪くなった）とし、Ｊｃ＜ＬＣＬであれば、制御結果良否データＳ６＝１（形状が良くなった）とする。

このように、制御の優先度についての仕様Ａ１、Ａ２に応じて、板幅方向の重み係数ｗＣ（ｉ）が変わるため、良否判定評価関数Ｊｃは異なる。そのため、制御結果良否データＳ６の判定結果も異なることが考えられる。そのため、良否判定ルール学習ユニット２２は、制御の優先度についての仕様Ａ１、Ａ２の２種類について、制御結果良否データＳ６の判定を実行する。
この制御結果良否データＳ６をそのまま良否判定ルール学習部３１で使用するニューラルネット３１１に対する教師データＳ１３ａとして用いる。

図２０は、学習データデータベースＤＢ６に保存されるデータ例を示す。
ニューラルネット３１１を学習するためには、多数の入力データＳ１２ａと教師データＳ１３ａの組合せが必要である。したがって、制御結果良否判定部６で作成した教師データＳ１３ａ（制御結果良否データ）は、制御実行ユニット２０にて制御ルール実行部１０に入力された入力データＳ１（規格化形状偏差２０１及び形状偏差段階）の時間遅れデータＳ１２ａと組み合わせて一組の学習データとして、学習データデータベースＤＢ６に保存される。
このとき、学習データは一定の比率で、検証データデータベースＤＢ７に保存しておき、良否判定ルール精度検証部３４における良否判定ルール検証に使用できるようにする。

良否判定ルール精度検証部３４は、制御出力良否判定ルール実行部１７と同様に一方向の演算のみを行うニューラルネットを備えておく。そして、良否判定ルール精度検証部３４は、検証データデータベースＤＢ７からテストデータを取り出し、そのデータの入力データをニューラルネットに入力して得られる出力データと、テストデータの持つ出力データの誤差を演算する。例えば、良否判定ルール精度検証部３４は、全テストデータの誤差の平均値などを良否判定ルールの良否判定ルール精度Ｓ１５として演算する。

なお、図１のプラント制御システムは、各種のデータベースＤＢ５、ＤＢ６を使用しているが、図２１に各データベースＤＢ５、ＤＢ６を連系的に管理運用するためのニューラルネット管理テーブルＴＢの構成を示す。すなわち、管理テーブルＴＢは、仕様の管理テーブルを備えている。

具体的には、図２１に示すように、管理テーブルＴＢは、仕様について（Ｂ１）板幅、（Ｂ２）鋼種、及び制御の優先度についての仕様Ａ１、Ａ２に応じて区分けされる。（Ｂ１）板幅としては、例えば、３フィート幅、メータ幅、４フィート幅、５フィート幅の４区分が、鋼種としては、鋼種（１）～鋼種（１０）の１０区分程度を用いる。また、制御の優先度についての仕様Ａについては、Ａ１及びＡ２の２種類とする。この場合、８０区分となり、８０個のニューラルネットを、圧延条件に応じて使い分けて使用することになる。

ニューラルネット学習制御部３１２は、図２０に示すような、入力データ及び教師データの組合せである学習データを、図２１のニューラルネット管理テーブルＴＢに従って、該当するニューラルネットＮｏ．と紐付けて、図２２に示すような学習データデータベースＤＢ６に格納する。

制御実行ユニット２０が、制御対象プラント１に対して、形状制御を実行するたびに、学習データが２組作成される。これは、同じ入力データ、制御出力に対して、制御結果良否判定が制御の優先度についての仕様Ａ１及び仕様Ａ２の２つの評価基準を用いて行われるため、教師データが２種類作成されるためである。教師データがある程度（例えば２００組）蓄積されたら、又は新たに学習データデータベースＤＢ６に蓄積されたら、ニューラルネット学習制御部３１２は、ニューラルネット３１１の学習を指示する。

良否判定ルールデータベースＤＢ５は、図２１に示すような管理テーブルＴＢに従って、複数のニューラルネットを格納している。そして、ニューラルネット学習制御部３１２は、学習が必要なニューラルネットＮｏ．を指定して、ニューラルネット選択部３１３が良否判定ルールデータベースＤＢ５より該当するニューラルネットを取り出し、ニューラルネット３１１に設定する。ニューラルネット学習制御部３１２は、学習データデータベースＤＢ６より、該当するニューラルネットに対応する、入力データ及び教師データを取り出し、入力データ作成部３１４及び教師データ作成部３１５に指示し、それらを用いてニューラルネット３１１の学習を実行する。なお、ニューラルネットの学習方法は手法が種々提案されており、いずれの手法を用いても良い。

ニューラルネット３１１の学習が完了すると、ニューラルネット学習制御部３１２は、学習結果であるニューラルネット３１１を、制御ルールデータベースＤＢ６の当該ニューラルネットＮｏ．の位置に書き戻すことで、学習が完了する。

学習は、図２１に示す管理テーブルＴＢで定義された全てのニューラルネットに対して定時間間隔（例えば１日毎）で一斉に実行する。あるいは、新しい学習データがある程度（例えば１００組）蓄積されたニューラルネットＮｏ．のニューラルネットのみについて、その時点で学習してもよい。

また、良否判定ルールの入力データに圧延実績、鋼種、板幅を含めることで、良否判定基準の違いも含めて１つのニューラルネットで学習させることも可能である。この場合、良否判定ルール実行時に圧延条件に応じて良否判定ルールを切り替えることが不要となる。

以上説明したように、制御対象プラント１の制御ルールを改善させるには、制御結果の良い制御操作を学習できていない場合、制御操作を大きく変更する。また、制御結果が良かった場合、新たな制御操作方法として取り入れる。さらに、制御結果の良い制御操作を学習できている場合、制御操作を変更しないか小さな変更に留める。そして、これらに対する制御結果が良かった場合、新たな制御操作方法として取り入れるようにするのが効率的である。

そして、形状パターンと制御操作と制御結果の良否の組み合わせを、実機データを元に学習することにより、機械モデルを用いたシミュレータよりも、精度よく制御結果の良否が推定可能なモデルを構築し、定期的な自動学習によって常に最新のプラント状態に適合したモデルを構築できる。

また、制御結果の良否判定を推定するモデルを用いて、従来技術で簡易の機械モデルでのみ行っていたプラントへの制御出力抑制機能の信頼性を高めることができる。
また、従来は一回の制御結果の良否判定で行っていた制御ルール学習データの生成が、本例の場合、制御結果の良否判定を推定するモデルを用いることで、プラントデータに含まれるノイズの影響を抑え、効果の小さな微調整も学習データの対象とすることが可能になる。さらに、本例によると、制御効果の誤判定を防止することによって、学習データの変動を抑え、制御性能を安定させることが実現できる。

なお、制御ルールデータベースＤＢ１には、制御実行ユニット２０で使用するニューラルネットが格納される。ここで、格納されるニューラルネットが、乱数でイニシャル処理を実行しただけの場合、ニューラルネットの学習が進行し、それなりの制御が可能となるまで時間がかかる。そのため、制御対象プラント１に対して、制御部を構築した時に、その時点で判明している制御対象プラント１の制御モデルに基づき、予めシミュレーションにて、制御ルールの学習を実行する。そして、シミュレータでの学習が完了したニューラルネットをデータベースに格納しておくことで、制御対象プラントの立上げ当初から、ある程度の性能の制御を実行できるようになる。

あるいは、実機での操業データの実績データを元に、良否判定ルール学習ユニット２２にて良否判定ルールを学習させることにより、実機への制御を行わなくても、制御ルールの学習が可能であり、制御対象プラントへの適用前に、ある程度の性能の制御を実行することが可能となる。

図２３は、本例のプラント制御システムとして、制御ルールの評価処理を行う制御ルール評価ユニット２３を備えた場合の構成を示す。
制御ルール評価ユニット２３は、制御ルール良否判定データ収集部３５、制御ルール評価データ演算部３６、制御ルールデータベース更新部３７、制御ルール評価データデータベースＤＢ８、及び制御ルール評価値データベースＤＢ９を備える。

制御ルール良否判定データ収集部３５は、制御出力良否判定ルール実行部１７から制御出力良否判定推定値Ｓ９を受け取るとともに、良否判定ルール精度検証部３４から良否判定ルール精度Ｓ１５を受け取る。そして、制御ルール良否判定データ収集部３５は、制御実行ユニット２０で使用している制御ルール番号とともに、制御ルール良否判定データＳ１６を制御ルール評価データデータベースＤＢ８に保存する。制御ルール良否判定データＳ１６は、制御出力良否判定推定値Ｓ９である。但し、良否判定ルール精度Ｓ１５が一定以下のときは、データベースＤＢ８に保存は行わない。

制御ルール良否判定データＳ１６は、制御実行ユニット２０にて制御ルールを用いた制御出力の演算が行われるたびに新たなデータが得られ、得られた制御ルール良否判定データＳ１６が制御ルール評価データデータベースＤＢ８に保存される。この場合、制御ルール毎に大量のデータが保管されることになるので、制御ルール評価データデータベースＤＢ８は、各制御ルールで保管するデータの上限を定めておき、一定以上になった場合には古いデータを削除して、新たなデータを保管する。

制御ルール評価データ演算部３６は、制御ルール評価データデータベースＤＢ８より制御ルール毎に蓄積された制御ルール良否判定データＳ１７を一括で取り出し、この平均値を制御ルール評価データＳ１８として演算で求める。求めた平均値が評価値に相当する。
制御ルール評価データ演算部３６が算出した制御ルール評価データＳ１８は、制御ルール評価値データベースＤＢ９に保存する。但し、制御ルール良否判定データの数が一定数に満たない場合には、評価値の信頼性が低いため、評価結果は保存しない。

データベース管理テーブルＴＢには、条件に応じて使用するニューラルネットＮｏ．（制御ルール）が１つずつ登録されている。これに対して、制御ルール評価値データベースＤＢ９には、複数の制御ルールの評価値が管理されている。制御ルールデータベース更新部３７は、制御ルール評価値データベースＤＢ９を参照して、データベース管理テーブルＴＢに登録されているニューラルネットＮｏ．（制御ルール）の制御ルール評価値と、その条件に適用可能な他の制御ルールの制御ルール評価値を比較し、その中で最も評価値の高い制御ルールをデータベース管理テーブルＴＢのニューラルネットＮｏ．（制御ルール）に更新する。

図２３に示すプラント制御システムのその他の箇所は、図１に示すプラント制御システムと同様に構成する。但し、図２３に示すプラント制御システムの場合には、制御対象プラント１の過去実績データとして、制御ルール評価ユニット２３がその過去実績に基づいて評価を行うため、制御実行ユニット２０が実際に制御対象プラント１を実行する必要がない。具体的には、制御出力抑制部４から制御出力量Ｓ０を制御対象プラント１に供給する必要がない。

この図２３に示すプラント制御システムによると、制御ルール実行部１０に評価を実行したい制御ルールを設定し、過去の実績データをＳｉとして与えることで、実際に制御対象プラント１に制御出力をしなくても、制御ルール評価値データベースＤＢ９を更新することができる。

＜変形例＞
なお、本発明は、上述した各実施の形態例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施の形態例は、本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。

例えば、図１や図２３に示すプラント制御システムは、データの作成や学習、制御などの処理を行う処理部を備える構成とした。この図１や図２３に示す制御実行ユニット２０、制御方法学習ユニット２１、良否判定ルール学習ユニット２２、制御ルール評価ユニット２３は、プロセッサがそれぞれの機能を実現するプログラム（ソフトウェア）で構成して、プログラムをコンピュータに実行させてもよい。図２４はこの場合のコンピュータの構成例を示す。

すなわち、図２４に示すように、各ユニット２０～２３を構成するコンピュータは、バスにそれぞれ接続されたＣＰＵ（Central Processing Unit：中央処理ユニット）ａと、ＲＯＭ（Read Only Memory）ｂと、ＲＡＭ（Random Access Memory）ｃを備える。さらに、コンピュータは、不揮発性ストレージｄと、ネットワークインタフェースｅとを備える。

ＣＰＵａは、各ユニット２０～２３での処理を実行するソフトウェアのプログラムコードをＲＯＭｂから読み出して実行する演算処理部である。ＲＡＭｃには、演算処理の途中に発生した変数やパラメータ等が一時的に書き込まれる。不揮発性ストレージｄには、例えば、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）などの大容量の情報記憶部が用いられ、各ユニット２０～２３が実行するプログラムや、各データベースのデータなどが格納される。
なお、各ユニット２０～２３は、それぞれ別のコンピュータで構成してもよいが、１つなどの少ない数のコンピュータに各プログラムを実装して、同時に実行してもよい。

ネットワークインタフェースｅには、例えば、ＮＩＣ（Network Interface Card）などが用いられ、他のユニットや制御対象プラント１とのデータの送受信が行われる。
この場合の各処理機能を実現するプログラムなどの情報は、ＨＤＤやＳＳＤなどの不揮発性ストレージｄの他に、メモリ、ＩＣカード、ＳＤカード、光ディスク等の記録媒体に置くことができる。

また、各ユニット２０～２３が行う機能の一部又は全部を、ＦＰＧＡ（Field Programmable Gate Array）やＡＳＩＣ（Application Specific Integrated Circuit）などのハードウェアによって実現してもよい。

また、図１や図２３などに示すブロック図では、制御線や情報線は説明上必要と考えられるものだけを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
また、上述した実施の形態例では、制御対象プラント１として、センヂミア圧延機に適用した例としたが、本発明は、その他の各種プラントの制御に適用が可能である。センヂミア圧延機に適用した場合の制御ルールについても、一例を示したものであり、本発明は、上述した実施の形態例に限定されない。

１…制御対象プラント、２…制御入力データ作成部、３…制御出力演算部、４…制御出力抑制部、５…制御出力判定部、６…制御結果良否判定部、７…学習データ作成部、１０…制御ルール実行部、１６…制御操作外乱発生部、１７…制御出力良否判定ルール実行部、１８…制御出力操作方法選択部、２０…制御実行ユニット、２１…制御方法学習ユニット、２２…良否判定ルール学習ユニット、２３…制御ルール評価ユニット、３１…良否判定ルール学習部、３３…新規探索操作量演算部、３４…良否判定ルール精度検証部、３５…制御ルール良否判定データ収集部、３６…制御ルール評価データ演算部、３７…制御ルールデータベース更新部、５０…センヂミア圧延機、５１…パターン認識部、５２…形状検出器、５３…制御演算部、５４…形状検出前処理部、１０１…ニューラルネット、１０２…ニューラルネット選択部、１１０…ニューラルネット処理部、１１１…ニューラルネット、１１２…ニューラルネット学習制御部、１１３…ニューラルネット選択部、１１４…入力データ作成部、１１５…教師データ作成部、１７１…ニューラルネット、１７２…ニューラルネット選択部、２０１…規格化形状偏差、２０２…形状偏差段階、２１０…形状偏差ＰＰ値演算部、２１１…形状偏差段階演算部、３１０…ニューラルネット処理部、３１１…ニューラルネット、３１２…ニューラルネット学習制御部、３１３…ニューラルネット選択部、３１４…入力データ作成部、３１５…教師データ作成部、５０１…圧延現象モデル、５０２…形状修正良否判定部、５０３…形状偏差修正量予測データ、５０４…形状偏差実績データ、５０５…形状偏差予測データ、６０２…形状変化良否判定部、８０１…学習データ作成部、８０２…制御ルール学習部、ＤＢ１…制御ルールデータベース、ＤＢ２…学習データデータベース、ＤＢ３…出力判定データベース、ＤＢ４…良否判定データベース、ＤＢ５…良否判定ルールデータベース、ＤＢ６…学習データデータベース、ＤＢ７…検証データデータベース、ＤＢ８…制御ルール評価データデータベース、ＤＢ９…制御ルール評価値データベース

Claims

制御対象プラントに対して、前記制御対象プラントの実績データの組合せのパターンを認識して、制御を実行するプラント制御システムであって、
前記制御対象プラントの実績データと制御操作の組合せを学習する制御方法学習ユニットと、前記制御方法学習ユニットが学習した実績データと制御操作の組合せに応じて制御対象プラントの制御を実行する制御実行ユニットと、前記制御対象プラントの実績データと制御操作の組合せと制御結果良否の組み合わせを学習する良否判定ルール学習ユニットとを備え、
前記制御実行ユニットは、
前記制御対象プラントの実績データと制御操作の定められた組合せに従って制御出力を与える制御ルール実行部と、
前記制御対象プラントの実績データと制御操作と制御結果良否の定められた組み合わせに従って前記制御出力の良否判定を行う制御出力良否判定ルール実行部と、
前記制御出力良否判定ルール実行部での良否判定を元に新規操作探索用操作量を演算する新規探索操作量演算部と、
前記制御出力良否判定ルール実行部での良否判定と制御シミュレータを用いたシミュレーションデータとを使って、制御出力を前記制御対象プラントに出力した場合に前記制御対象プラントの実績データが悪化すると判断した場合に、制御出力を前記制御対象プラントに出力することを阻止する制御出力抑制部とを備え、
前記良否判定ルール学習ユニットは、
前記制御実行ユニットが制御出力を前記制御対象プラントに出力した場合に、制御効果が実績データに表れるまでの時間遅れ後に、制御結果の良否を判定する制御結果良否判定部と、
前記制御結果良否判定部における制御結果の良否と前記実績データと前記制御出力を学習データとして学習する良否判定ルール学習部とを備え、
前記制御方法学習ユニットは、
前記制御出力良否判定ルール実行部での前記制御出力の良否判定と、前記制御出力を用いて教師データを得る学習データ作成部と、
前記実績データと前記教師データを学習データとして学習する制御ルール学習部とを備える
プラント制御システム。
前記制御方法学習ユニットが学習することで、前記制御対象プラントの状態に応じて複数の制御目標に対して別個の実績データと制御操作の組合せを得、
得られた実績データと制御操作の組合せを、前記制御ルール実行部における前記制御対象プラントの実績データと制御操作の定められた組合せとして使用する
請求項１に記載のプラント制御システム。
前記制御出力良否判定ルール実行部は、前記制御対象プラントの実績データと制御操作と制御結果良否の定められた組合せを第１のニューラルネットとして保持し、
前記良否判定ルール学習部は、実績データと制御操作と制御結果良否の組合せを第２のニューラルネットとして保持し、
前記良否判定ルール学習部における学習の結果得られた前記第２のニューラルネットを、前記制御出力良否判定ルール実行部における前記第１のニューラルネットとして使用する
請求項１に記載のプラント制御システム。
前記良否判定ルール学習ユニットは、良否判定ルール精度検証部を備え、
前記良否判定ルール精度検証部で生成した良否判定ルール精度を用いて、前記制御出力抑制部における制御結果良否を用いた出力抑制の基準を変更する
請求項１に記載のプラント制御システム。
さらに、制御ルール評価ユニットを備え、
前記制御ルール評価ユニットは、
前記制御実行ユニットの前記制御出力良否判定ルール実行部の良否判定データと前記良否判定ルール学習ユニットで得た良否判定ルールの精度検証結果をデータベースに蓄積する制御ルール良否判定データ収集部と、
前記データベースに蓄積された良否判定データと、前記良否判定ルールの精度検証結果を元に制御ルール評価データを演算する制御ルール評価データ演算部を有し、
前記制御実行ユニットに用いた制御ルールの評価を前記制御対象プラントに出力せずに実行する
請求項１～４のいずれか１項に記載のプラント制御システム。
制御対象プラントに対して、前記制御対象プラントの実績データの組合せのパターンを認識して、前記制御対象プラントの制御をコンピュータにより実行するプラント制御方法であって、
前記コンピュータが実行する処理として、
前記制御対象プラントの実績データと制御操作の組合せを学習する制御方法学習処理と、前記制御方法学習処理により学習した実績データと制御操作の組合せに応じて制御対象プラントの制御を実行する制御実行処理と、前記制御対象プラントの実績データと制御操作の組合せと制御結果良否の組み合わせを学習する良否判定ルール学習処理と、を含み、
前記制御実行処理は、
前記制御対象プラントの実績データと制御操作の定められた組合せに従って制御出力を与える制御ルール実行処理と、
前記制御対象プラントの実績データと制御操作と制御結果良否の定められた組み合わせに従って前記制御出力の良否判定を行う制御出力良否判定ルール実行処理と、
前記制御出力良否判定ルール実行処理による良否判定を元に新規操作探索用操作量を演算する新規探索操作量演算処理と、
前記制御出力良否判定ルール実行処理による良否判定と制御シミュレータを用いたシミュレーションデータとを使って、制御出力を前記制御対象プラントに出力した場合に前記制御対象プラントの実績データが悪化すると判断した場合に、制御出力を前記制御対象プラントに出力することを阻止する制御出力抑制処理と、を含み、
前記良否判定ルール学習処理は、
前記制御実行処理により制御出力を前記制御対象プラントに出力した場合に、制御効果が実績データに表れるまでの時間遅れ後に、制御結果の良否を判定する制御結果良否判定処理と、
前記制御結果良否判定処理での制御結果の良否と前記実績データと前記制御出力を学習データとして学習する良否判定ルール学習処理と、を含み、
前記制御方法学習処理は、
前記制御出力良否判定ルール実行処理による前記制御出力の良否判定と、前記制御出力を用いて教師データを得る学習データ作成処理と、
前記実績データと前記教師データを学習データとして学習する制御ルール学習処理と、
を含む
プラント制御方法。
制御対象プラントに対して、前記制御対象プラントの実績データの組合せのパターンを認識して、コンピュータにプラント制御を実行させるプログラムであり、
当該プログラムは、前記制御対象プラントの実績データと制御操作の組合せを学習する制御方法学習手順と、前記制御方法学習手順により学習した実績データと制御操作の組合せに応じて制御対象プラントの制御を実行する制御実行手順と、前記制御対象プラントの実績データと制御操作の組合せと制御結果良否の組み合わせを学習する良否判定ルール学習手順と、を前記コンピュータに実行させるものであり、
前記制御実行手順は、
前記制御対象プラントの実績データと制御操作の定められた組合せに従って制御出力を与える制御ルール実行手順と、
前記制御対象プラントの実績データと制御操作と制御結果良否の定められた組み合わせに従って前記制御出力の良否判定を行う制御出力良否判定ルール実行手順と、
前記制御出力良否判定ルール実行手順による良否判定を元に新規操作探索用操作量を演算する新規探索操作量演算手順と、
前記制御出力良否判定ルール実行手順による良否判定と制御シミュレータを用いたシミュレーションデータとを使って、制御出力を前記制御対象プラントに出力した場合に前記制御対象プラントの実績データが悪化すると判断した場合に、制御出力を前記制御対象プラントに出力することを阻止する制御出力抑制手順と、を含み、
前記良否判定ルール学習手順は、
前記制御実行手順により制御出力を前記制御対象プラントに出力した場合に、制御効果が実績データに表れるまでの時間遅れ後に、制御結果の良否を判定する制御結果良否判定手順と、
前記制御結果良否判定手順での制御結果の良否と前記実績データと前記制御出力を学習データとして学習する良否判定ルール学習手順と、を含み、
前記制御方法学習手順は、
前記制御出力良否判定ルール実行手順による前記制御出力の良否判定と、前記制御出力を用いて教師データを得る学習データ作成手順と、
前記実績データと前記教師データを学習データとして学習する制御ルール学習手順と、
を含む
プログラム。