JP2022182538A

JP2022182538A - プラント制御システム、プラント制御方法及びプログラム

Info

Publication number: JP2022182538A
Application number: JP2021090146A
Authority: JP
Inventors: 敬規高田; Takanori Takada; 大輝黒川; Daiki Kurokawa; 佑樹田内; Yuki Tanaka; 哲服部; Satoru Hattori
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2022-12-08
Anticipated expiration: 2041-05-28
Also published as: CN115407726A; DE102022204937A1; JP7535475B2

Abstract

【課題】プラント制御システムにおいて、プラントの制御を乱すリスクを少ない状態で、制御ルールを効率的に修正する。【解決手段】対象プラントの実績データと制御操作の組合せを学習する制御方法学習ユニットと、制御方法学習部が学習した実績データと制御操作の組合せに応じて対象プラントの制御を実行する制御実行ユニットと、対象プラントの実績データと制御操作と制御対象の状態変化の組み合わせを学習する状態変化ルール学習ユニットとを備える。対象プラントの実績データと制御操作と制御対象の状態変化の定められた組み合わせに従って制御対象の状態変化を予測することで制御出力の良否判定を行い、良否判定結果と実績データと教師データを学習データとして制御ルールを学習する。【選択図】図３

Description

本発明は、プラント制御システム、プラント制御方法及びプログラムに関する。

従来から、各種のプラントにおいてはその制御により適正な制御結果を得るために、各種制御理論に基づいたプラント制御が実行されている。

プラントの一例を説明すると、例えば圧延機制御において、板の波打ち状態を制御する形状制御を対象とした制御理論として、ファジィ制御やニューロ・ファジィ制御が適用されている。ファジィ制御は、クーラントを利用した形状制御に、また、ニューロ・ファジィ制御は、センジミア圧延機の形状制御に適用されている。このうち、ニューロ・ファジィ制御を適用した形状制御は、特許文献１に示されるように、形状検出器で検出された実績形状パターンと目標形状パターンの差と、予め設定された基準形状パターンとの類似割合を求めるものである。そして、求めた類似割合から、予め設定された基準形状パターンに対する制御操作端操作量によって表現された制御ルールにより、操作端に対する制御出力量を求めることにより行われている。

以下、ニューロ・ファジィ制御を用いたセンヂミア圧延機の形状制御の従来技術について説明する。
センヂミア圧延機の形状制御では、ニューロ・ファジィ制御が用いられる。図３１に示すように、センヂミア圧延機５０は、パターン認識部５１で、形状検出器５２にて検出した実形状より形状のパターン認識が行われ、実形状が予め設定された基準形状パターンのどれに最も近いかが演算される。形状検出器５２で検出した実形状のデータは、形状検出前処理部５４でパターン認識用の前処理が行われる。

そして、制御演算部５３で、予め設定された形状パターンに対する制御操作端操作量で構成される制御ルールを用いて制御が実行される。
ここでは、図３２に示すように、パターン認識部５１は、形状検出器５２にて検出した実績の形状パターン（ε）と、目標形状（εｒｅｆ）との差分（Δε）が、パターン１からパターン８の形状のどれに最も近いかを演算する。そして、制御演算部５３は、演算結果に基づいて、パターン１からパターン８の制御方法のいずれかを選択し実行する。

特許２８０４１６１号特開２０１８－１８０７９９号公報

特許文献１に記載された従来技術は、予め代表的な形状を基準形状パターンとして設定し、基準波形パターンに対する制御操作端操作量との関係を示す制御ルールを基に制御を行っている。制御ルールの学習についても、基準波形パターンに対する制御操作端操作量に関するものであり、予め定めている代表的な基準形状パターンはそのまま用いている。そのため、特定の形状パターンにしか反応しない形状制御となってしまうという問題がある。

基準形状パターンは、人間が予め対象となる圧延機に関する知識や、形状実績と手動介入操作を蓄積した経験より定めたものであるが、対象となる圧延機及び被圧延材で発生する全ての形状を網羅する事は困難である。そのため、基準形状パターンとは異なる形状が発生した場合、形状制御による制御が実行されず、形状偏差が抑制されずに残ってしまい、あるいは似たような基準形状パターンと誤認識し、誤った制御操作を行って、逆に形状を悪化させてしまう場合もある。

そのため、従来の形状制御においては、予め設定された基準形状パターンとそれに対する制御ルールを用いて制御ルールの学習をし、制御を実行するため、制御精度の向上に限界があるという問題があった。

この問題を解決するために、例えば特許文献２に記載された技術が提案されている。特許文献２には、制御時に外乱を発生させて、学習によりニューラルネットを徐々に賢くする処理が記載されている。しかしながら、特許文献２に記載されたような制御外乱を発生させる処理は、実際に制御対象プラントを運用して、その運用時に制御外乱を発生させるものであり、制御対象プラントの実運用を乱すものであり、運用上、あまり好ましいとは言えない。さらに、制御対象プラントをある程度運用しない限り、ニューラルネットが適正にならないものであり、運転初期時には、適正な制御ができない可能性が高い。

本発明の目的は、プラントの制御を乱すリスクを少なくして、制御ルールを効率的に修正できるプラント制御システム、プラント制御方法及びプログラムを提供することにある。

上記課題を解決するために、例えば特許請求の範囲に記載の構成を採用する。
本願は、上記課題を解決する手段を複数含んでいるが、その一例を挙げるならば、プラント制御システムは、制御対象プラントに対して、制御対象プラントの実績データの組合せのパターンを認識して、制御を実行するものに適用される。
そして、プラント制御システムは、制御対象プラントの実績データと制御操作の組合せを学習する制御方法学習ユニットと、制御方法学習ユニットが学習した実績データと制御操作の組合せに応じて制御対象プラントの制御を実行する制御実行ユニットと、制御対象プラントの実績データと制御操作と制御対象の状態変化の組み合わせを学習する状態変化ルール学習ユニットとを備える。
ここで、制御実行ユニットは、
制御対象プラントの実績データと制御操作の定められた組合せに従って制御出力を与える制御ルール実行部と、
制御対象プラントの実績データと制御操作と制御対象の状態変化の定められた組み合わせに従って、制御対象の状態変化を予測し前記制御出力の良否判定を推定する制御出力良否判定実行部と、
制御出力良否判定実行部での良否判定を元に新規操作探索用操作量を演算する新規探索操作量演算部と、
制御出力良否判定実行部での良否判定を用いて、制御出力を前記制御対象プラントに出力した場合に前記制御対象プラントの実績データが悪化すると判断した場合に、制御出力を前記制御対象プラントに出力することを阻止する制御出力抑制部とを備える。
また、状態変化ルール学習ユニットは、
制御対象プラントの実績データより、実績データと制御操作と、制御操作による制御効果が実績データに表れるまでの時間遅れの間の制御対象の状態変化量の組合せを抽出して学習データを作成し、学習データを用いて学習する状態変化ルール学習部とを備える。
さらに、制御方法学習ユニットは、
制御出力良否判定実行部での制御出力の良否判定と、制御出力を用いて教師データを得る学習データ作成部と、実績データと教師データを学習データとして学習する制御ルール学習部とを備える。

本発明によれば、制御中に形状制御で使用される形状パターンと操作方法の制御ルールを、プラントへのリスクを少なくして、効率的に自動修正し、経年的なプラントの環境変化に対応した、最適なものとすることが可能になる。そのため、本発明によれば、制御精度の向上、制御部の立上げ期間の短縮、経年変化に対する対応が可能となる。
また、本発明によると、制御ルールの性能を予め評価することにより、新たな制御ルールの適用によるプラントへのリスク低減と、最適な制御ルールの選択による制御性能が向上するという効果がある。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。

本発明の一実施の形態例に係るプラント制御システムの概要を示す構成図である。本発明の一実施の形態例に係る制御ルール実行部の具体的な構成例を示す図である。本発明の一実施例に係る制御出力良否判定実行部の例を示す構成図である。本発明の一実施の形態例に係る制御ルール学習部の具体的な構成例を示す図である。本発明の一実施例に係る状態変化ルール学習部の例を示す構成図である。センヂミア圧延機の形状制御における制御方法に対する制御結果良否判定の例を示す図である。本発明の一実施の形態例に係る良否判定誤差検証部の例を示す構成図である。本発明の一実施の形態例に係るセンヂミア圧延機の形状制御に用いる場合のニューラルネット構成を示す図である。本発明の一実施の形態例に係る形状偏差と制御方法を説明する図である。本発明の一実施の形態例に係る制御入力データ作成部の例を示す構成図である。本発明の一実施の形態例に係る制御出力演算部の例を示す構成図である。本発明の一実施の形態例に係るセンヂミア圧延機の状態変化予測に用いる場合のニューラルネット構成を示す図である。本発明の一実施の形態例に係る制御結果良否判定部の例を示す構成図である。本発明の一実施の形態例に係る新規探索操作量演算部における操作量演算方法を示す図である。本発明の一実施の形態例に係る制御出力判定部の例を示す構成図である。本発明の一実施の形態例に係る制御出力演算部の例を示す構成図である。本発明の一実施の形態例に係る学習データ作成部における処理段階と処理内容を示す図である。本発明の一実施の形態例に係る学習データデータベースに保存されるデータ例を示す図である。本発明の一実施の形態例に係るニューラルネット管理テーブルの例を示す図である。本発明の一実施の形態例に係る学習データデータベースの例を示す構成図である。本発明の一実施の形態例に係る学習データデータベースに保存されるデータ例を示す図である。本発明の一実施の形態例に係る検証データデータベースの例を示す図である。本発明の一実施の形態例に係るニューラルネット管理テーブルの例を示す図である。本発明の一実施の形態例に係る学習データデータベースの例を示す図である。本発明の一実施の形態例に係る良否判定誤差データベースの例を示す図である。本発明の一実施の形態例に係る良否評価値データベースの例を示す図である。本発明の一実施の形態例に係るプラント制御システムが制御ルール評価ユニットを備えた例を示す構成図である。本発明の一実施の形態例に係る制御ルール評価データデータベースの例を示す図である。本発明の一実施の形態例に係る制御ルール評価値データベースの例を示す図である。本発明の一実施の形態例に係るプラント制御システムのハードウェア構成例を示すブロック図である。センヂミア圧延機の例を示す構成図である。センヂミア圧延機の形状制御における制御ルールの一覧の例を示す図である。

以下、本発明の一実施の形態例（以下、「本例」と称する）のプラント制御システムを、添付図面を参照して説明する。

まず、本例を説明するに先立って、本発明に至る経緯とその概要について、プラント制御システムを圧延機の形状制御装置に適用した場合を例にして説明する。

まず、本発明の目的の一つである、プラントへのリスクを少ない状態で、制御ルールを効率的に修正できるプラント制御システムを得るためには、下記の要件（１），（２），（３），（４）が必要になる。
・要件（１）：制御ルールを改善させるには、制御結果の良い制御操作を学習できていない場合には、制御操作を大きく変更して、制御結果が良かった場合に新たな制御操作方法として取り入れるようにし、制御結果の良い制御操作を学習できている場合には、制御操作を変更しないか小さな変更に留めて、それに対する制御結果が良かった場合に新たな制御操作方法として取り入れるようにする。
・要件（２）：圧延の実績データ、制御操作と形状パターンの変化の組み合わせを、実機データを元に学習することにより、機械モデルを用いたシミュレータよりも、精度よく制御結果の良否が推定可能なモデルを構築し、定期的な自動学習によって常に最新のプラント状態に適合したモデルを構築する。
・要件（３）：制御操作による形状変化を推定するモデルを用いて、従来技術で簡易の機械モデルでのみ行っていたプラントへの制御出力抑制機能の信頼性を高める。
・要件（４）：従来技術で一回の制御結果の良否判定で行っていた制御ルール学習データの生成機能において、制御操作による形状変化を推定するモデルを用いることにより、プラントデータに含まれるノイズの影響を抑え、効果の小さな微調整も学習データの対象とすることを可能にし、同時に、制御効果の誤判定を防止することによって、学習データの変動を抑え、制御性能を安定させる。

これらの要件（１）～（４）を実現するためには、制御装置内で、圧延の実績データ、制御操作及び制御操作による形状変化の組合せを学習可能なニューラルネットを構成するのが好ましい。そして、制御装置は、ニューラルネットに制御操作の出力を入力して得た値で、圧延機で発生した形状パターンに対する制御操作の出力による制御結果の良否を推定することが必要になる。さらに、制御装置は、制御結果の良否の推定値を用いて、新規制御操作探索用の制御操作量の演算方法を選択する。

圧延機の簡易モデル等を用いて検証し、明らかに形状が悪化すると考えられる出力に対しては、制御装置は、圧延機の制御操作端に対して出力しないようにして形状悪化を防止する。このとき、制御装置は、制御結果の良否の推定値を、出力抑制の判断に使用することで、保護の信頼性を高め、抑制の範囲を適正化することによって、制御機能による対応可能範囲を拡大することができる。また、圧延機の簡易モデル等が得られない場合でも、制御結果の良否の推定値を用いることで出力抑制の判断が実行可能となり、制御装置の適用対象範囲を広げることができる。

制御結果の良否の推定精度が不十分な適用初期の段階においては、悪いと推定された制御操作についても、プラントに出力することで、圧延の実績データ、制御操作及び制御操作による形状変化の組合せについて、学習している範囲を拡大していくことが必要である。

制御結果の良否判定推定精度が十分に高い段階では、プラントに操作量を出力しなくても制御結果の良否を推定できるので、制御装置は、制御ルールの学習データを生成することが可能になる。

制御装置は、制御操作による形状変化を推定可能なニューラルネットを用いて制御結果の良否を推定することにより、プラントデータが持つノイズの影響を少なくでき、効果の小さな微調整データについての良否判定が可能となる。これにより、制御装置は、学習データを生成することができる。さらに、制御装置は、ノイズによる誤った良否判定を防止することで、学習データの精度を高めることができる。

また、経年変化によるプラントの環境変化等で制御結果の良否判定の推定精度が低下した場合、制御装置は、直近のプラントの実績データを用いて再学習することによって、最新のプラント状態に適合した制御結果の良否判定の推定が可能になる。

制御結果の良否判定の推定精度を確認するためには、ニューラルネットの学習に使用したデータとは別に精度検証用としてテストデータが用意される。そして、制御装置は、この精度検証用のテストデータに含まれる圧延実績データと制御操作を、ニューラルネットに入力することにより出力された形状変化の予測値を用いた良否予測値と、テストデータに含まれる制御結果の良否との誤差を元に、良否判定の予測誤差を確認することが可能になる。

図１は、本例のプラント制御システムの構成を示す。
図１のプラント制御システムは、制御実行ユニット２０、制御方法学習ユニット２１、状態変化ルール学習ユニット２２、複数のデータベースＤＢ（ＤＢ１～ＤＢ８）、及び各データベースＤＢの管理テーブルＴＢを備える。

制御実行ユニット２０は、制御対象プラント１からの実績データＳｉを入力して制御ルール（ニューラルネット）に従い定めた制御操作量出力ＳＯを制御対象プラント１に与えて、制御対象プラント１を制御する。ここでの制御対象プラント１は、既に説明した図３１に示すセンヂミア圧延機５０とする。
ここで、制御ルールとは、図２６で説明したように、例えば検出した実績の形状パターンＡ（ε）と目標形状（ε_ｒｅｆ）との差分ａ（Δε）が、用意された複数のパターンの形状のどれに最も近いかを演算するルールである。制御実行ユニット２０は、この制御ルールによる演算結果に基づいて、いずれかのパターンの制御方法を選択して実行する。

制御方法学習ユニット２１は、制御実行ユニット２０にて作成した制御入力データＳ１などを入力して学習を行い、学習した制御ルールを制御実行ユニット２０における制御ルールに反映させる。
状態変化ルール学習ユニット２２は、制御対象プラント１の制御操作前後の実績データSiなどを入力して学習を行い、学習した状態変化ルールを制御実行ユニット２０における状態変化ルールに反映させる。

制御実行ユニット２０は、制御入力データ作成部２、制御ルール実行部１０、制御出力演算部３、制御出力抑制部４、制御出力判定部５、制御出力良否判定実行部１７、新規探索操作量演算部３３、及び制御出力操作方法選択部１８を備える。

制御実行ユニット２０は、制御対象プラント１である圧延機の実績データＳｉより、制御入力データ作成部２を用いて、制御ルール実行部１０の入力データＳ１を作成する。
制御ルール実行部１０は、制御対象の実績データＳｉと制御操作端操作指令Ｓ２の関係を表現するニューラルネット（制御ルール）を用いて、入力データＳ１から制御操作端操作指令Ｓ２を作成する制御ルール実行処理を行う。制御出力演算部３は、制御操作端操作指令Ｓ２をもとに、制御操作端への制御操作量Ｓ３を演算する。これにより、制御実行ユニット２０は、制御対象プラント１の実績データＳｉに応じて、ニューラルネットを用いて制御操作量Ｓ３を作成する。

また、制御出力良否判定実行部１７は、制御対象の実績データＳｉと制御操作量Ｓ３とその制御操作による形状変化の関係を表現するニューラルネット（状態変化ルール）を用いて、制御対象の実績データＳｉと制御操作量Ｓ３から制御出力良否判定推定値Ｓ９を作成する制御出力良否判定実行処理を行う。さらに、制御出力良否判定実行部１７は、制御対象の実績データＳｉと後述する選択制御操作量Ｓ８から制御結果良否判定推定値Ｓ１１を作成する。

新規探索操作量演算部３３は、制御操作量Ｓ３と制御出力良否判定推定値Ｓ９を元に、新規探索制御操作量Ｓ１２を演算する新規探索操作量演算処理を行う。
制御出力操作方法選択部１８は、制御操作量Ｓ３と新規探索制御操作量Ｓ１２を元に選択制御操作量Ｓ８と制御方法選択フラグＳ１４を作成する。

また、制御実行ユニット２０内の制御出力判定部５は、制御対象プラント１からの実績データＳｉ及び制御出力操作方法選択部１８からの選択制御操作量Ｓ８を用いて、制御操作端への制御操作量出力可否データＳ４を決定する制御出力判定処理を行う。制御出力抑制部４は、制御操作量出力可否データＳ４と制御結果良否判定推定値Ｓ１１を元に、制御操作端への選択制御操作量Ｓ８の出力可否を決定し、可とされた選択制御操作量Ｓ８を、制御対象プラント１に与える制御操作量出力ＳＯとして出力する。これにより、異常と判断される選択制御操作量Ｓ８は、制御実行ユニット２０から制御対象プラント１に出力されなくなる。

以上のように構成された制御実行ユニット２０は、その処理を実行するために、制御ルールデータベースＤＢ１、出力判定データベースＤＢ３及び良否判定データベースＤＢ４、状態変化ルールデータベースＤＢ５及び良否判定誤差データベースＤＢ７を参照する。
制御ルールデータベースＤＢ１は、制御実行ユニット２０内の制御ルール実行部１０と、後述する制御方法学習ユニット２１内の制御ルール学習部８０２の双方にアクセス可能に接続されている。

制御ルールデータベースＤＢ１には、制御ルール学習部８０２における学習結果としての制御ルール（ニューラルネット）が格納される。制御ルール実行部１０は、制御ルールデータベースＤＢ１に格納された制御ルールを参照する。
学習データデータベースＤＢ２には、制御ルール学習部８０２で得られた学習データが格納される。
出力判定データベースＤＢ３は、制御実行ユニット２０内の制御出力判定部５にアクセス可能に接続されている。

良否判定データベースＤＢ４には、良否判定のためのデータが格納される。
状態変化ルールデータベースＤＢ５には、状態変化ルール学習部３１における学習結果としての状態変化ルール（ニューラルネット）が格納される。この状態変化ルールデータベースＤＢ５は、制御実行ユニット２０内の制御出力良否判定実行部１７、後述する状態変化ルール学習ユニット２２内の状態変化ルール学習部３１及び状態変化ルール良否判定誤差検証部３４のいずれにもアクセス可能に接続されている。制御出力良否判定実行部１７と状態変化ルール良否判定誤差検証部３４は、状態変化ルールデータベースＤＢ５に格納された状態変化ルールを参照する。
学習データデータベースＤＢ６には、状態変化ルール学習部３１で学習された学習データが格納される。
良否判定誤差データベースＤＢ７には、良否判定をするのに必要な良否判定誤差が格納される。

図２は、本例の制御ルール実行部１０の具体的な構成例を示す。
制御ルール実行部１０には、制御入力データ作成部２で作成された入力データＳ１が入力される。制御ルール実行部１０は、入力データＳ１を処理して制御出力演算部３に制御操作端操作指令Ｓ２を与える。制御ルール実行部１０は、ニューラルネット１０１を備えており、ニューラルネット１０１は、図２６に示すような形状制御ルールに則した制御操作端操作指令Ｓ２を出力する。

制御ルール実行部１０は、さらにニューラルネット選択部１０２を備えており、制御ルールデータベースＤＢ１に格納された制御ルールを参照することで、ニューラルネット１０１における制御ルールとして最適な制御ルールを選択し、ニューラルネット１０１に実行させる。

このように制御ルール実行部１０は、オペレータ班や制御目的で分けられた複数のニューラルネットから、必要なニューラルネットを選択して使用している。制御ルールデータベースＤＢ１には、制御対象プラント１からのデータとして、ニューラルネット及び良否判定基準を選択できるような実績データ（操業班のデータ等）Ｓｉも含むのが良い。
なお、ニューラルネットを実行すると制御ルールになることから、本明細書では、ニューラルネットと制御ルールは同義の意味で使用する。

図３は、制御出力良否判定実行部１７の具体的な構成を示す。
制御出力良否判定実行部１７には、制御対象プラント１から入力される実績データＳiと制御出力演算部３で作成された制御操作量Ｓ３が入力される。制御出力良否判定実行部１７は、これらの入力データに基づいて制御出力良否判定推定値Ｓ９を生成し新規探索操作量演算部３３に与える。

また、制御出力良否判定実行部１７には、制御対象プラント１から入力される実績データＳiと制御出力操作方法選択部１８で作成された選択制御操作量Ｓ８が入力される。制御出力良否判定実行部１７は、これらの入力データに基づいて制御結果良否判定推定値Ｓ１１を生成し、制御出力抑制部４及び学習データ作成部８０１に与える。

制御出力良否判定実行部１７は、ニューラルネット１７１及びニューラルネット選択部１７２を備える。
ニューラルネット１７１は、実績データＳiに対して、制御操作量Ｓ３（制御パターン）を出力した場合の形状変化の予測値Ｓ２０を過去の制御実績を元に推定する。
ニューラルネット選択部１７２は、状態変化ルールデータベースＤＢ５に格納された状態変化ルールを参照することで、ニューラルネット１７１における状態変化ルールとして、最適な状態変化ルールを選択する。

このように制御出力良否判定実行部１７は、制御対象となる材料性質の違いで分けられた複数のニューラルネットから、必要なニューラルネットを選択する。
状態変化ルールデータベースＤＢ５には、制御対象プラント１からのデータとして、制御対象となる材料性質を選択できるような実績データ（鋼種や板幅のデータ等）Ｓｉを含むのが良い。なお、ニューラルネットを実行すると状態変化ルールになることから、本明細書においてはニューラルネットと状態変化ルールは、同義の意味で使用する。

制御結果良否判定部６は、制御対象プラント１からの実績データＳi及びニューラルネットが推定した形状変化Ｓ２０、良否判定データベースＤＢ４に記憶された良否判定データＳ５並びに良否判定誤差データベースＤＢ７に記憶された良否判定誤差データＳ２１を用いて、実績データＳiが良くなる方向に変化するか、悪くなる方向に変化するか判定する制御結果良否判定処理を行う。そして、制御結果良否判定部６は、判定結果を示す制御結果良否データＳ９あるいはＳ１１を出力する。

図６は、センヂミア圧延機の形状制御における制御方法に対する制御結果良否判定の具体例を示す図である。図６は、図２６に示す形状制御ルールごとの制御結果良否判定結果を示す。

図１の説明に戻ると、制御方法学習ユニット２１は、制御実行ユニット２０で使用するニューラルネット１０１の学習を実行する。
制御方法学習ユニット２１は、学習データ作成部８０１及び制御ルール学習部８０２を備える。

制御方法学習ユニット２１内の学習データ作成部８０１は、制御実行ユニット２０にて作成した制御操作端操作指令Ｓ２、選択制御操作量Ｓ８、制御方法選択フラグＳ１４、制御出力良否判定実行部１７で作成した制御結果良否判定推定値Ｓ１１、制御出力判定部５で作成した制御操作量出力可否データＳ４を用いて、ニューラルネットの学習に使用する新規の教師データＳ７ａを作成する学習データ作成処理を行う。学習データ作成部８０１が作成した学習データＳ７ａは、制御ルール学習部８０２に与える。
教師データＳ７ａは、制御ルール実行部１０が出力する制御操作端操作指令Ｓ２に対応するものである。

図４は、制御ルール学習部８０２の具体的な構成例を示す。
制御ルール学習部８０２は、入力データ作成部１１４、教師データ作成部１１５、ニューラルネット処理部１１０、及びニューラルネット選択部１１３を備える。
制御ルール学習部８０２には、外部からの入力として制御入力データ作成部２からの入力データＳ１と、学習データ作成部８０１からの新規の教師データＳ７ａが入力されている。また、制御ルール学習部８０２は、制御ルールデータベースＤＢ１及び学習データデータベースＤＢ２に蓄積されたデータを参照する。

制御ルール学習部８０２において、入力データＳ１は入力データ作成部１１４を介してニューラルネット処理部１１０に取り込まれる。

また、制御ルール学習部８０２において、学習データ作成部８０１からの新規の教師データＳ７ａは、教師データ作成部１１５において学習データデータベースＤＢ２に記憶されている過去の教師データＳ７ｂも含めた合計の教師データＳ７ｃとして、ニューラルネット処理部１１０に与えられる。これらの教師データＳ７ａ，Ｓ７ｂは、適宜、学習データデータベースＤＢ２に記憶されて利用される。

同様に、制御入力データ作成部２からの入力データＳ８ａは、入力データ作成部１１４において学習データデータベースＤＢ２に記憶されている過去の入力データＳ８ｂも含めた合計の入力データＳ８ｃとして、ニューラルネット処理部１１０に与えられる。これらの入力データＳ８ａ，Ｓ８ｂについても、適宜、学習データデータベースＤＢ２に記憶されて利用される。

ニューラルネット処理部１１０は、ニューラルネット１１１とニューラルネット学習制御部１１２により構成される。
ニューラルネット１１１は、入力データ作成部１１４からの入力データＳ８ｃ、教師データ作成部１１５からの教師データＳ７ｃ、ニューラルネット選択部１１３が選択した制御ルール（ニューラルネット）を取り込み、最終的に決定したニューラルネットを制御ルールデータベースＤＢ１に格納する。

ニューラルネット学習制御部１１２は、入力データ作成部１１４、教師データ作成部１１５、ニューラルネット選択部１１３に対して、適宜のタイミングでこれらを制御し、ニューラルネット１１１の入力を得、また処理結果を制御ルールデータベースＤＢ１に格納する。

ここで、図２の制御ルール実行部１０におけるニューラルネット１０１と、図４の制御方法学習ユニット２１におけるニューラルネット１１１は、いずれも同じ概念のニューラルネットであるが、以下のように相違している。
すなわち、制御ルール実行部１０におけるニューラルネット１０１は、予め定められた内容のニューラルネットであり、入力データＳ１を与えたときに対応する出力としての制御操作端操作指令Ｓ２を求めるニューラルネットである。

一方、制御方法学習ユニット２１におけるニューラルネット１１１は、入力データＳ１と制御操作端操作指令Ｓ２についての入力データＳ８ｃ、教師データＳ７ｃを学習データとして設定したときに、この入出力関係を学習により求めるニューラルネットである。

制御方法学習ユニット２１における基本的な処理の考え方は、以下のとおりである。
まず、制御操作量出力可否データＳ４の内容が「可」かつ制御結果良否判定推定値Ｓ１１の内容が「良」（実績データＳiが良くなる方向に変化）の場合、制御実行ユニット２０が、制御対象プラント１に制御操作量出力ＳＯを出力する。ここで、学習データ作成部８０１は、制御出力操作方法選択部１８が出力した選択制御操作量Ｓ８が正しいと判断し、ニューラルネットの出力が選択制御操作量Ｓ８となるように学習データを作成する。

一方、制御操作量出力可否データＳ４の内容が「否」、又は、制御対象プラント１に制御操作量出力ＳＯを出力した制御結果良否判定推定値Ｓ１１の内容が「否」（実績データＳｉが悪くなる方向に変化）の場合、学習データ作成部８０１は、制御出力操作方法選択部１８が出力した選択制御操作量Ｓ８が誤っていると判断する。

この場合、学習データ作成部８０１は、制御方法選択フラグＳ１４から、制御出力操作方法選択部１８において制御操作量Ｓ３を選択していた場合かどうかを確認する。この確認で制御操作量Ｓ３を選択していた場合、学習データ作成部８０１は、制御ルール実行部１０が出力した制御操作端操作指令Ｓ２は誤っていると判断し、ニューラルネットの出力が出ないように学習データを作成する。このとき、制御出力として、同じ制御操作端に対して＋方向、－方向の２種類の出力が出るようにニューラルネット出力を構成しておき、出力した側の制御操作端操作指令Ｓ２が出力されないように学習データを作成する。

また、図４に示す制御ルール学習部８０２は、ニューラルネット学習制御部１１２によるデータ処理の結果として、以下のように処理を行う。
まず、制御ルール学習部８０２は、制御実行ユニット２０への入力データＳ１から求めたデータＳ８ｃと、教師データ作成部１１５にて作成した教師データＳ７ｃの組合せである学習データを用いて、制御ルール実行部１０にて用いたニューラルネット１０１の学習を実行する。

実際には、制御ルール学習部８０２は、制御ルール実行部１０のニューラルネット１０１と同じニューラルネット１１１を制御ルール学習部８０２内に備えて、各種条件で運用テストしてそのときの応答を学習し、学習の結果としてより良い結果を生じることが確認された制御ルールを得る。

ここでの学習は、複数個の学習データを用いて行わせる必要があるため、過去に作成された学習データを蓄積している学習データデータベースＤＢ２より、過去の学習データを複数個取り出して、学習し処理を実行する。そして、今回の学習データは、学習データデータベースＤＢ２に格納される。また、学習したニューラルネットは、制御ルール実行部１０で利用するために、制御ルールデータベースＤＢ１に格納される。

ニューラルネットの学習は、新しい学習データが作成される毎に、過去の学習データを一緒に用いて学習しても良いし、学習データがある程度（例えば１００個分）蓄積されてから、過去の学習データを一緒に用いて学習しても良い。

このような構成とすることで、制御出力操作方法選択部１８が新規探索操作量を選択することで、新規探索操作量を対象プラントに出力し、その制御結果に応じて学習データを作成し、新たな制御方法を学習することが可能になる。

図１の説明に戻ると、状態変化ルール学習ユニット２２は、制御実行ユニット２０で使用するニューラルネット１７１（図３）の学習を実行する。制御対象プラント１において、機器位置が変化した場合、実際に制御効果が実績データＳｉの変化となって現れるのには時間を要する。このため、その時間だけ時間遅れさせたデータを用いて学習を実行する。なお、図１などにおいて、「Ｚ^－１」と記載した処理部ＤＬは、各データが伝送される際に、適宜の時間遅れがあることを示す。

状態変化ルール学習ユニット２２は、状態変化ルール学習部３１、良否判定誤差検証部３４、良否判定データベースＤＢ４を備える。

図５は、状態変化ルール学習部３１の具体的な構成を示す。
状態変化ルール学習部３１は、入力データ作成部３１４、教師データ作成部３１５、ニューラルネット処理部３１０、ニューラルネット選択部３１３、学習データ作成部３１６を備える。
状態変化ルール学習部３１は、外部からの入力として、制御対象プラント１の圧延実績データＳiと時間遅れした圧延実績データＳi-1を得る。
さらに、状態変化ルール学習部３１は、状態変化ルールデータベースＤＢ５及び学習データデータベースＤＢ６、検証データデータベースＤＢ８にアクセス可能として接続されている。

学習データ作成部３１６は、時間遅れした圧延実績データＳi-1より、圧延状態変数と制御操作量を抽出して、入力データＳ１２ａとして入力データ作成部３１４に出力する。また、学習データ作成部３１６は、圧延実績データＳｉから形状偏差を抽出し、時間遅れした圧延実績データＳi-1から形状偏差を抽出し、その差分より形状変化量を求めて、教師データＳ１３ａとして教師データ作成部３１５に出力する。

教師データＳ１３ａは、教師データ作成部３１５において、学習データデータベースＤＢ６に記憶されている過去の教師データＳ１３ｂも含めた合計の教師データＳ１３ｃとして、ニューラルネット処理部３１０に与えられる。これらの教師データＳ１３ａ、Ｓ１３ｂは、適宜、学習データデータベースＤＢ６に記憶されて、利用される。

同様に、入力データＳ１２ａは、入力データ作成部３１４において、学習データデータベースＤＢ６に記憶されている過去の入力データＳ１２ｂも含めた合計の入力データＳ１２ｃとして、ニューラルネット処理部３１０に与えられる。これらの入力データＳ１２ａ、Ｓ１２ｂは、適宜、学習データデータベースＤＢ６に記憶されて、利用される。

このとき、学習データ作成部３１６は、一定の比率で作成した教師データＳ１３ａと入力データＳ１２ａを学習データデータベースＤＢ６ではなく、検証データデータベースＤＢ８に記憶する。検証データデータベースＤＢ８には、時間遅れした圧延実績データＳi-1から抽出した変化前形状偏差とニューラルネット３１１に設定されているニューラルネット番号も併せて記憶していく。

ニューラルネット処理部３１０は、ニューラルネット３１１とニューラルネット学習制御部３１２とにより構成される。
ニューラルネット３１１は、入力データ作成部３１４からの入力データＳ１２ｃ、教師データ作成部３１５からの教師データＳ１３ｃ、及びニューラルネット選択部３１３が選択した制御ルール（ニューラルネット）を取り込む。

ニューラルネット学習制御部３１２は、入力データ作成部３１４、教師データ作成部３１５、及びニューラルネット選択部３１３に対して、適宜のタイミングでこれらを制御し、ニューラルネット３１１の入力を得る。また、ニューラルネット学習制御部３１２は、ニューラルネット選択部３１３を経由して、処理結果を状態変化ルールデータベースＤＢ５に格納する。

ここで、図３に示す制御実行ユニット２０のニューラルネット１７１及び後述する良否判定精度検証部３４のニューラルネット３４１と、図５に示す状態変化ルール学習ユニット２２におけるニューラルネット３１１は、いずれも同じ概念のニューラルネットであるが、以下の点で相違している。
制御実行ユニット２０におけるニューラルネット１７１と良否判定精度検証部３４におけるニューラルネット３４１は、予め定められた内容のニューラルネットである。すなわち、ニューラルネット１７１及びニューラルネット３４１は、圧延状態変数Ｓiと選択制御操作量Ｓ８又は制御操作量Ｓ３又は検証用入力データＳ２４を与えたときに対応する出力としての予測形状変化Ｓ２０、Ｓ２５を求めるものであり、いわば一方方向の処理に利用されるニューラルネットである。

これに対し、状態変化ルール学習ユニット２２におけるニューラルネット３１１は、時間遅れ後の圧延実績データＳiから制御操作量を抽出したデータＳ１２ｃ、教師データＳ１３ｃを学習データとして設定したときに、この入出力関係を学習により求めるニューラルネットである。

図７は、良否判定誤差検証部３４の具体的な構成を示す。
良否判定誤差検証部３４は、検証用データ作成部３４３、ニューラルネット３４１、ニューラルネット選択部３４２、状態変化良否変換部３４４、良否評価値データベースＤＢ９、良否判定誤差演算部３４５を備える。

検証用データ作成部３４３は、検証データデータベースＤＢ８から誤差検証を実施したい状態変化ルール（ニューラルネットＮｏ．）に対応する検証用データＳ２２を順番に読み出し、ニューラルネット３４１に検証用入力データＳ２４を出力するとともに、状態変化良否変換部３４４に良否変換用検証データＳ２３を出力する。

ニューラルネット３４１は、検証用データ作成部３４３から検証用入力データＳ２４を受け取り、過去の制御実績を元に予測した予測形状変化量Ｓ２５を状態変化良否変換部３４４に出力する。
ニューラルネット選択部３４２は、状態変化ルールデータベースＤＢ５に格納された状態変化ルールを参照し、制御対象となる材料性質の違いで分けられた複数のニューラルネットから、誤差検証を実施する状態変化ルールを選択する。

状態変化良否予測値変換部３４４は、検証用データ作成部３４３から良否変換用検証データＳ２３を受け取り、ニューラルネット３４１から予測形状変化量Ｓ２５を受け取り、それらを元に検証データ良否評価値と予測良否評価値を演算して、良否評価値Ｓ２６を良否評価値データベースＤＢ９に保存する。

良否判定誤差演算部３４５は、良否評価値データベースＤＢ９より、ニューラルネットＮｏ．単位で良否評価値データＳ２７を読み出し、検証データ良否評価値と予測良否評価値の良否判定誤差を演算し、検証結果フラグとともに、良否判定誤差データＳ２８として、良否判定誤差データベースＤＢ７に書き出す。

次に、センヂミア圧延機における形状制御を対象に、プラント制御方法の具体例を説明する。なお形状制御に関しては、以下の仕様Ａ，Ｂを採用するものとして説明する。

仕様Ａは、優先度についての仕様であり、板幅方向の優先度の情報を持つものとする。例えば形状制御においては、板幅方向全域にわたって目標値に制御することが、機械特性上困難な場合が多い。そのため、操作員は過去の経験に基づき板幅方向で優先順位をつけて操作を実施する。そこで、板幅方向で下記の２つの優先度についての仕様Ａ１，Ａ２を設ける。このうち優先度についての仕様Ａ１は「板端部を優先する」ものである。また、優先度についての仕様Ａ２は「中央部を優先する」ものである。どちらの仕様を用いるかは、操作員の経験に基づき速度条件や加減速中等の圧延状態に応じて決定する。
この仕様Ａ１，Ａ２という２つの優先順位に従った制御を実行する。つまり、プラント制御システムが制御を実行する場合は、優先度についての仕様Ａ１又はＡ２のいずれかを考慮する。

仕様Ｂは、予め判明している条件への対応についての仕様である。一例をあげると、形状パターンと制御方法の関係は、種々の条件で変化することから、例えば、仕様Ｂ１を板幅、仕様Ｂ２を鋼種とする区分で分ける必要がある。それぞれの仕様が変化することで、形状操作端の形状への影響度合が変化する。

本例での制御対象プラント１は、センヂミア圧延機であり、実績データは形状実績となる。センヂミア圧延機は、ステンレスなどの硬い材料を冷間圧延するためのクラスターロールを持つ圧延機である。ゼンジミア圧延機は、硬い材料に強圧下を与える目的で、小径のワークロールを使用する。このため、ゼンジミア圧延機は、平坦な鋼板を得るための制御が難しい。この対策として、ゼンジミア圧延機は、クラスターロールの構造やさまざまな形状制御部を採用している。

センヂミア圧延機は、一般には上下の第１中間ロールが片テーパを持ち、シフトできるようになっているほか、上下に６個の分割ロールと２個のＡＳ－Ｕと呼ばれるロールを備えている。以下に説明する例では、形状の実績データＳｉは、形状検出器の検出データを用い、入力データＳ１は、目標形状との差である、形状偏差を用いる。また、制御操作量Ｓ３は、＃１～＃ｎのＡＳ－Ｕ、上下の第１中間ロールのロールシフト量とする。

図８は、センヂミア圧延機の形状制御に用いる場合のニューラルネット構成を示す。ここでニューラルネットは、制御ルール実行部１０用としては、ニューラルネット１０１を示す。また、制御ルール学習部８０２用としては、ニューラルネット１１１を示す。ニューラルネット１０１とニューラルネット１１１は、いずれも構造が同じである。

センヂミア圧延機の形状制御の事例では、制御対象プラント１からの実績データＳｉは形状検出器のデータ（ここでは、実績形状と目標形状との差である形状偏差が出力されるものとする）を含むセンヂミア圧延機の実績データである。制御入力データ作成部２は、入力データＳ１として規格化形状偏差２０１、形状偏差段階２０２を得る。これによりニューラルネット１０１、１１１の入力層は、規格化形状偏差２０１、形状偏差段階２０２により構成される。なお図８では、形状偏差段階２０２をニューラルネット入力層への入力としているが、段階に応じてニューラルネットを切替ても良い。

ニューラルネット１０１、１１１の出力層は、センヂミア圧延機の形状制御操作端である、ＡＳ－Ｕ、第１中間ロールに合わせて、ＡＳ－Ｕ操作度合３０１と第１中間操作度合３０２により構成される。それぞれの操作度合は、ＡＳ－Ｕについては、ＡＳ－Ｕ開方向（ロールギャップ（圧延機の上下作業ロール間の間隔）が開く方向）、ＡＳ－Ｕ閉方向（ロールギャップが閉じる方向）を各ＡＳ－Ｕについて持つ。

第１中間ロールについては、第１中間ロール開方向（第１中間ロールが圧延機中心より外側に向かって動作する方向）、第１中間ロール閉方向（第１中間ロールが圧延機中心側に向かって動作する方向）を、上下第１中間ロールについて持つ。
例えば、形状検出器が２０ゾーンで、形状偏差段階２０２を３段階（大、中、小）とした場合、入力層は２３個の入力となる。また、ＡＳ－Ｕのサドルが７本、上下第１中間ロールが板幅方向でシフト可能とすると、出力層はＡＳ－Ｕ操作度合３０１が１４個、１中間操作度合が４個の計１８個となる。中間層の層数及び各層のニューロン数については、適時設定する。
なお、出力層であるセンヂミア圧延機の形状制御操作端は、個々の制御操作端に対して＋方向、－方向の２種類の出力が出るようにニューラルネット出力を構成している。

図９は、本例での形状偏差と制御方法を示す。
図９（ａ）は、形状偏差が大きい場合の制御方法を示し、図９（ｂ）は、形状偏差が小さい場合の制御方法を示す。図９（ａ），（ｂ）の高さ方向（縦軸方向）は形状偏差の大きさ、横軸方向は板幅方向であり、板幅の両側が板端部、中央が板中央部を示す。

図９（ａ）に示すように、形状偏差が大きい場合は、板幅方向の局部的な形状偏差よりも全体的な形状を修正することを優先する。
一方、図９（ｂ）に示すように、形状偏差が小さい場合は、局部的な形状偏差を小さくすることを優先する。

このように、形状偏差の大きさに応じて制御方法を変える必要があるため、図８に示すように形状偏差段階２０２を設けてニューラルネット１０１、１１１に与え、形状偏差の大きさを判定する。形状偏差については形状偏差の大小にかかわらず、例えば０～１に規格化したものを用いるのが良い。これは、一例であって、形状偏差を規格化せずにそのままニューラルネットの入力層へ入力してもよく、形状偏差の大小に応じて、ニューラルネット自体を変えても良い。例えば、２つのニューラルネットを準備し、形状偏差が大きい場合に使用するニューラルネットと、小さい場合に使用するニューラルネットを分けても良い。

本例のプラント制御では、以上説明した図８のような構成のニューラルネット１０１、１１１に対して、形状パターンに対する操作方法を学習させ、学習させたニューラルネットを用いて形状制御を実行する。同じ構成のニューラルネットでも、学習の条件により異なった特性となり、同じ形状パターンに対して異なった制御出力を出すことができる。

そのため、形状実績の他の条件に応じて、複数のニューラルネットを使い分けることで、多様な条件に対して最適な制御を構成することができる。これは仕様Ｂへの対応である。先に説明した図２の構成は、このような仕様を行う場合の具体例を示している。
すなわち、図２の構成例では、制御ルール実行部１０において使用するニューラルネット１０１を、圧延実績や、圧延機オペレータ名、被圧延材の鋼種、板幅等により別個のニューラルネットを準備し、制御ルールデータベースＤＢ１に登録しておく。ニューラルネット選択部１０２は、その時点の条件に合致するニューラルネットを選択し、制御ルール実行部１０のニューラルネット１０１に設定する。

なお、ニューラルネット選択部１０２における、その時点の条件としては、制御対象プラント１における実績データＳｉの中から板幅のデータを取り込み、これに応じてニューラルネットを選択するのが良い。また、ここで使用する複数のニューラルネットは、図８に示すような入力層、出力層を持てば、中間層の層数、各層のユニット数は異なっても良い。

図１０は、ニューラルネット１０１、１１１の入力層へ入力するためのデータＳ１（規格化形状偏差２０１、形状偏差段階２０２）を作成する、制御入力データ作成部２の構成を示す。
制御入力データ作成部２は、実績データＳｉとして、制御対象プラント１であるセンヂミア圧延機における圧延時の板形状を検出する、形状検出器の形状検出器データを入力とする。そして、制御入力データ作成部２は、形状偏差ＰＰ値演算部２１０にて各形状検出器ゾーンの検出結果の最大値と最小値の差である形状偏差ＰＰ値（Peak To Peak値）ＳＰＰを求める。

形状偏差段階演算部２１１は、形状偏差ＰＰ値ＳＰＰにより、形状偏差を大、中、小の３段階に分類する。形状は、被圧延材の伸び率の板幅方向分布であり、伸び率を１０－５単位で表すＩ－ＵＮＩＴが単位として用いられる。例えば、以下の数式で示すように分類する。

ここでは［数１］式の成立により形状偏差段階が（大＝１、中＝０、小＝０）とし、［数２］式の成立により形状偏差段階が（大＝０、中＝１、小＝０）とし、［数３］式の成立により形状偏差段階が（大＝０、中＝０、小＝１）とするように分類している。各ゾーンの形状偏差については、ＳＰＭ＝ＳＰＰとした、ＳＰＭを用いて規格化を実行する。

以上のように、制御入力データ作成部２は、ニューラルネット１０１への入力データである規格化形状偏差２０１及び形状偏差段階２０２を作成する。規格化形状偏差２０１及び形状偏差段階２０２は、制御ルール実行部１０の入力データＳ１である。

図１１は、制御出力演算部３の構成を示す。
制御出力演算部３は、制御ルール実行部１０内の、ニューラルネット１０１からの出力である制御操作端操作指令Ｓ２より、各形状制御操作端への操作指令である制御操作量Ｓ３を作成する。制御操作端操作指令Ｓ２は、センヂミア圧延機の形状制御の場合には、ＡＳ－Ｕ操作度合３０１、第１中間操作度合３０２に相当する。
図１１では、複数個数が存在するＡＳ－Ｕ操作度合３０１、第１中間操作度合３０２について、各１つのデータ例を示しており、各データは開方向度合と閉方向度合の一対のデータで構成されている。

制御出力演算部３内では、入力されたＡＳ－Ｕ操作度合３０１は、各ＡＳ－Ｕ開方向、閉方向の出力をもつため、それらの差が減算器３０３で算出される。そして、乗算器３０４で減算器３０３の出力に変換ゲインＧ_ＡＳＵを乗算することで、各ＡＳ－Ｕへの操作指令が生成されて出力される。変換ゲインＧ_ＡＳＵは、各ＡＳ－Ｕへの制御出力がＡＳ－Ｕ位置変更量（単位は長さ）となることから、度合から位置変更量への変換ゲインとなる。

同様に入力された第１中間操作度合３０２は、第１中間外側、内側の出力をもつため、それらの差が減算器３０５で算出される。そして、乗算器３０６で減算器３０５の出力に変換ゲインＧ_１ＳＴを乗算することで、各第１中間ロールシフトへの操作指令が生成されて出力される。変換ゲインＧ_１ＳＴは、各第１中間ロールへの制御出力が第１中間ロールシフト位置変更量（単位は長さ）となることから、度合から位置変更量への変換ゲインとなる。

以上により、制御出力演算部３は、制御操作量Ｓ３を演算することができる。制御操作量Ｓ３は、＃１～＃ｎＡＳ－Ｕ位置変更量（ｎはＡＳ－Ｕロールのサドル数による）と、上第１中間シフト位置変更量、下第１中間シフト位置変更量から構成されている。

図１２は、制御出力良否判定実行部１７、状態変化ルール学習部３１及び良否判定誤差検証部３４に用いるセンヂミア圧延機の状態変化予測に用いる場合のニューラルネット構成を示す。ここでのニューラルネットは、制御出力良否判定実行部１７用ではニューラルネット１７１であり、状態変化ルール学習部３１用ではニューラルネット３１１であり、良否判定誤差検証部３４用ではニューラルネット３４１を示しているが、いずれも構造は同じである。

制御対象プラント１の制御実績データＳiより、制御機器位置などの圧延状態変数と制御操作量Ｓ３あるいは後述する選択制御操作量Ｓ８、または圧延実績データＳiを時間遅れさせたデータから制御操作量を抽出し、入力層への入力とする。この制御操作量Ｓ３、または圧延実績データSiから抽出した制御操作量または選択制御操作量Ｓ８は、各制御操作機器の操作量で構成される。圧延状態変数は、圧延速度や各制御機器の位置のデータなど、制御操作後の状態変化を予測するのに影響が大きい状態量を用いるのが良い。

また、出力層は、制御操作を制御対象プラント１に出力したときの、予測した形状変化量Ｓ２０または形状変化の教師データＳ１３ｃを出力する。中間層の層数及び各層のニューロン数については、適時設定される。

本例のプラント制御では、以上説明した図１２のような構成のニューラルネット１７１、３１１、３４１に対して、制御機器位置変化に対する形状変化を学習させ、学習させたニューラルネットを用いて形状変化の予測を実行する。同じ構成のニューラルネットでも、学習に用いる実績データにより異なった特性となり、同じ制御機器位置変化に対して異なった形状変化を出すことができる。

そのため、圧延実績データの他の条件に応じて、複数のニューラルネットを使い分けることで、多様な条件に対して最適な形状変化予測を実行することができる。これは仕様Ｂへの対応である。先に説明した図３の構成は、このような仕様を行う場合の具体例を示している。
すなわち、図３の構成例では、制御出力良否判定実行部１７において使用するニューラルネット１７１を、被圧延材の鋼種、板幅等により別個のニューラルネットを準備し、状態変化ルールデータベースＤＢ５に登録しておく。ニューラルネット選択部１７２は、その時点の条件に合致するニューラルネットを選択し、制御出力良否判定実行部１７のニューラルネット１７１に設定する。

なお、ニューラルネット選択部１７２における、その時点の条件としては、制御対象プラント１における実績データＳｉの中から板幅のデータを取り込み、これに応じてニューラルネットを選択するのが良い。また、ここで使用する複数のニューラルネットは、図１２に示すような入力層、出力層を持てば、中間層の層数、各層のユニット数は異なっても良い。

図１３は、制御結果良否判定部６の動作を示す。形状変化良否判定部６０２においては、［数４］式に示す良否判定評価関数Ｊｃを用いる。

この［数４］式において、εchg（ｉ）はニューラルネット１７１が出力した予測形状変化量Ｓ２１、εfb（ｉ）は実績データＳｉに含まれる形状偏差実績データであり、εpred（ｉ）は制御操作後の予測形状偏差であり、ｗＣ（ｉ）は良否判定用の板幅方向重み係数である。ここで、良否判定用の重み係数ｗＣ（ｉ）は、良否判定データベースＤＢ４より、制御の優先度についての仕様Ａ１、Ａ２に応じて設定する。良否判定評価関数Ｊｃにより、制御結果の良否を判定する。

閾値上限ＬＣＵと閾値加減ＬＣＬを、閾値条件（ＬＣＵ≧０≧ＬＣＬ）のもとで予め設定しておく。このときに、良否判定評価関数Ｊｃとの比較の結果が、Ｊｃ＞ＬＣＵであれば、良否判定推定値Ｓ９（Ｓ１１）＝０（形状が悪くなる）とし、Ｊｃ＜ＬＣＬであれば、良否判定推定値Ｓ９（Ｓ１１）＝１（形状が良くなる）、ＬＣＵ≧０≧ＬＣＬであれば、良否判定推定値Ｓ９（Ｓ１１）＝－１（良否判定の対象外）とする。

ここで、閾値上限ＬＣＵと閾値加減ＬＣＬの決定の為に、良否判定誤差データベースより制御ルール実行部に使用しているニューラルネット番号に応じた良否判定誤差データＳ２８を読出し、ニューラルネットnの良否判定標準誤差εnと検証結果フラグfnを参照する。検証結果フラグfnは、検証が十分なデータ数で実施したかどうかを示し、検証が十分なデータ数に達していない場合は、良否判定の値は信頼性が低いため、使用しない方がよく、閾値上限ＬＣＵと閾値加減ＬＣＬを十分大きな値を設定してすべての場合で良否判定推定値Ｓ９（Ｓ１１）＝－１（良否判定の対象外）と判定されるようにする。検証が十分なデータ数に達していた場合は、良否判定標準誤差を基準として、閾値上限ＬＣＵと閾値加減ＬＣＬを設定することにより、判定精度にあった閾値設定ができる。

IF flagn=0, THEN LCU=-LCL=th_big
IF flagn=1, THEN LCU=-LCL=εn

この閾値設定において、th_bigは十分に大きな値を設定する。閾値上限ＬＣＵと閾値加減ＬＣＬの絶対値を標準誤差にしているが、場合に応じて標準誤差の２倍や０．５倍など変更することにより、制御出力の信頼性を調節することができる。

このように、制御の優先度についての仕様Ａ１、Ａ２に応じて、板幅方向の重み係数ｗＣ（ｉ）が変わるため、良否判定評価関数Ｊｃは異なる。そのため、良否判定推定値Ｓ９（Ｓ１１）の判定結果も異なることが考えられる。そのため、良否判定ルール学習ユニット２２は、制御の優先度についての仕様Ａ１、Ａ２の２種類について、良否判定推定値Ｓ９（Ｓ１１）の判定を実行する。

図１４は、新規探索操作量演算部３３における操作量演算方法を示す。
新規探索操作量演算部３３は、制御出力良否判定実行部１７で出力した制御出力良否判定推定値Ｓ９を用いて、以下のような方針で新規探索制御操作量Ｓ１２を演算する。
すなわち、制御出力良否判定推定値Ｓ９＝１のときは、制御操作の良否判定が良く推定されているので、新規探索操作量演算部３３は、新規探索操作量としての微調整を行う。
制御出力良否判定推定値Ｓ９＝０の時は、制御操作の良否判定が悪く推定されているので、新規探索操作量演算部３３は、制御操作を大きく変更することで新たな適切な操作方法の探索を行う。
制御出力良否判定推定値Ｓ９＝－１の時は、良否判定の対象外であるため、制御操作を変更する事は実施しない。

以上の方針により、新規探索操作量Ｃrandを求める式を以下のように設定する。
ＩＦ（Ｓ９＝１）ＴＨＥＮＣrand＝Ｃref^＊（１＋β^＊th1）
ＩＦ（Ｓ９＝０）ＴＨＥＮＣrand＝Ｃref＋γ^＊th2^＊Ｇ
ＩＦ（Ｓ９＝－１）ＴＨＥＮＣrand＝Ｃref
ここで、β及びγは－１～１の間で発生させるランダム値を示す。ｔｈ１は微調整を行う度合いを示しており、例えば、元々の指令の±１０％の範囲を微調整とする場合には、ｔｈ１を０．１に設定する。

ｔｈ２は操作方法を大きく変更する度合いの設定であり、例えばｔｈ２を０．１とした場合には、元の指令に１０％のオフセットが加算されることになり、操作極性が変わる可能性や元々操作しなかった機器の指令を出力することが発生する。
β及びγの値は、各操作機器で異なる値が使用され、各機器の操作量はそれぞれ独立に変更が行われる。Ｇは各制御操作機器の最大操作位置制御指令を示しており、上述した指令％に掛け合わせることで、％の値を操作位置制御指令に変換される。

制御出力操作方法選択部１８は、制御操作量Ｓ３か新規探索制御操作量Ｓ１２を選択して、選択制御操作量Ｓ８として出力する。制御操作量Ｓ３か新規探索制御操作量Ｓ１２のどちらを選択するかは、確率的に決定することとして、新規探索制御操作量Ｓ１２を使用する確率Ｐrandを０～１で、ユーザにて設定できるようにする。０から１の値をランダムにとる値δを用いて、次式により決定する。
ＩＦ（δ＞Ｐrand）ＴＨＥＮＣ″ref＝Ｃref、α＝１
ＥＬＳＥＣ″ref＝Ｃrand、α＝０

ここで、Ｃ″refは制御出力操作方法選択部１８が以降の演算部に出力する選択制御操作量Ｓ８を示す。δは全機器操作量の演算に共通の値を使用し、全機器とも同じ側の操作量を使用する。αは、制御方法選択フラグＳ１４であり、制御操作量Ｓ３を選択した場合に１、新規探索制御操作量Ｓ１２を選択する場合０を取る。この制御方法選択フラグＳ１４は、選択制御操作量Ｓ８とともに以降の演算部に出力する。Ｐradの設定の仕方として、実機での制御においてランダムな操作によってプラントへのリスクを与えたくない場合には０に設定しておき、制御ルールの改善の為に、新規探索用操作量を出力させたい場合に０以外の割合を設定する。

図１５は、制御出力判定部５の構成を示す。
制御出力判定部５は、圧延現象モデル５０１と形状修正良否判定部５０２から構成される。そして、制御出力判定部５は、制御対象プラント１よりの実績データＳｉ、制御出力演算部３からの制御操作量Ｓ３、及び出力判定データベースＤＢ３の情報を得て、制御操作端への制御操作量出力可否データＳ４を与える。

このような構成の制御出力判定部５は、制御出力操作方法選択部１８にて演算した選択制御操作量Ｓ８を制御対象プラント１である圧延機に出力した場合の形状の変化を、既知の制御対象プラント１のモデルに入力することで予測する。既知の制御対象プラント１のモデルは、ここでは圧延現象モデル５０１である。この予測で、形状が悪化すると予想される場合、制御出力判定部５は、制御操作量出力ＳＯを抑制し、形状が大きく悪化することを防止する。

より詳細に述べると、制御出力判定部５は、選択制御操作量Ｓ８を圧延現象モデル５０１に入力し選択制御操作量Ｓ８による形状変化を予測し、形状偏差修正量予測データ５０３を演算する。
他方、制御出力判定部５は、制御対象プラント１からの形状検出器データＳｉに、形状偏差修正量予測データ５０３を加算することで形状偏差予測データ５０５を得、形状偏差予測データ５０５を評価する。これにより、制御出力判定部５は、制御操作量Ｓ３を制御対象プラント１に出力したときに、形状がどのように変化するかが予測できる。ここでの形状検出器データＳｉは、現時点での形状偏差実績データ５０４である。
制御出力判定部５は、現状の形状偏差実績データ５０４と形状偏差予測データ５０５とにより、形状修正良否判定部５０２は、形状が良くなる方向に変化するのか、悪くなる方向に変化するのかを判定し、制御操作量出力可否データＳ４を得る。

形状修正良否判定部５０２は、具体的には以下のようにして形状修正の良否判定を行う。まず形状制御の優先度についての仕様Ａ，Ｂで示したように、板幅方向での制御優先度を考慮するため、出力判定データベースＤＢ３には、板幅方向の重み係数ｗ（ｉ）を仕様Ａ１、仕様Ａ２の各仕様に対して設定しておく。それを用いて、例えば下記の［数４］式のような評価関数Ｊを用いて形状変化の良否を判定する。なお、［数４］式において、ｗ（ｉ）は重み係数、εfb（ｉ）は形状偏差実績データ５０４、εest（ｉ）は形状偏差予測データ５０５、ｉは形状検出器ゾーン、randは乱数項である。

［数５］式の評価関数Ｊを用いた場合、形状が良くなるときは評価関数Ｊが正、悪くなるときは評価関数Ｊが負となる。また、randは乱数項であり、評価関数Ｊの評価結果を乱数的に変化させる。これにより、形状が悪化する場合であっても、評価関数Ｊとしては正になる場合が発生するため、圧延現象モデル５０１が正しくない場合についても形状パターンと制御方法の関係を学習していくことが可能である。

ここで乱数項randは、試運転当初のように、制御対象プラント１のモデルが不確実の場合は最大値を大きくし、ある程度制御方法を学習し安定した制御を実行したい場合は０とするように、適時変更する。

形状修正良否判定部５０２は、評価関数Ｊを演算し、Ｊ≧０のとき制御操作量出力可否データＳ４＝１（可）とし、Ｊ＜０のとき制御操作量出力可否データＳ４＝０（否）として、制御操作量出力可否データＳ４を出力する。

既に説明した通り、制御出力良否判定実行部１７には、制御対象プラント１の制御実績データＳiより、制御機器位置などの圧延実績データ及び選択制御操作量Ｓ８が入力され、制御結果良否判定推定値Ｓ１１が出力される。制御結果良否判定推定値Ｓ１１は、制御した結果良くなると推定する場合が１、悪くなると推定する場合が０、良否判定対象外の場合が－１の値を取る。

制御出力抑制部４は、制御出力判定部５の判定結果である制御操作量出力可否データＳ４及び制御結果良否判定推定値Ｓ１１に応じて、制御対象プラント１への制御操作量出力ＳＯの出力有無を決定する。制御操作量出力可否データＳ４は、＃１～＃ｎＡＳ－Ｕ位置変更量出力、上第１中間シフト位置変更量出力、下第１中間シフト位置変更量出力であり、以下の条件で決定される。

ＩＦ（制御方法選択フラグ＝１）ＴＨＥＮ
ＩＦ（制御操作量出力可否データＳ４＝０ＯＲ制御結果良否判定推定値Ｓ１１＝０）ＴＨＥＮ
＃１～＃ｎＡＳ－Ｕ位置変更量出力＝０
上第１中間シフト位置変更量出力＝０
下第１中間シフト位置変更量出力＝０
ＥＬＳＥ
＃１～＃ｎＡＳ－Ｕ位置変更量出力＝＃１～＃ｎＡＳ－Ｕ位置変更量
上第１中間シフト位置変更量出力＝上第１中間シフト位置変更量
下第１中間シフト位置変更量出力＝下第１中間シフト位置変更量
ＥＮＤＩＦ
ＥＬＳＥ
ＩＦ（（制御操作量出力可否データＳ４＝０ＯＲ制御結果良否判定推定値Ｓ１１＝０）AND（PTRIAL＜η））ＴＨＥＮ
＃１～＃ｎＡＳ－Ｕ位置変更量出力＝０
上第１中間シフト位置変更量出力＝０
下第１中間シフト位置変更量出力＝０
ＥＬＳＥ
＃１～＃ｎＡＳ－Ｕ位置変更量出力＝＃１～＃ｎＡＳ－Ｕ位置変更量
上第１中間シフト位置変更量出力＝上第１中間シフト位置変更量
下第１中間シフト位置変更量出力＝下第１中間シフト位置変更量
ＥＮＤＩＦ
ＥＮＤＩＦ

また、ηは０～１でランダムな値を取る変数で、PTRIALは出力抑制を無効化して新規探索操作をプラントへ出力させる確率を示す。制御方法選択フラグＳ１４が０のときは、未知の領域における制御方法の効果を検証する場合を含むため、一定の確率で、プラントへの出力抑制を無視してプラントへ出力を行うようにする。

上述した例では、制御出力判定部５の判定結果である制御操作量出力可否データＳ４及び制御結果良否判定推定値Ｓ１１の両方を使用する形を示したが、制御対象によっては設備の情報が十分に得られず制御対象のシミュレーションを使用した制御出力判定部５の制御操作量出力可否データＳ４が構築できない場合も考えられる。その場合は、制御結果良否判定推定値Ｓ１１のみを使用して以下にて処理を実施する。

ＩＦ（制御方法選択フラグ＝１）ＴＨＥＮ
ＩＦ（制御結果良否判定推定値Ｓ１１＝０）ＴＨＥＮ
＃１～＃ｎＡＳ－Ｕ位置変更量出力＝０
上第１中間シフト位置変更量出力＝０
下第１中間シフト位置変更量出力＝０
ＥＬＳＥ
＃１～＃ｎＡＳ－Ｕ位置変更量出力＝＃１～＃ｎＡＳ－Ｕ位置変更量
上第１中間シフト位置変更量出力＝上第１中間シフト位置変更量
下第１中間シフト位置変更量出力＝下第１中間シフト位置変更量
ＥＮＤＩＦ
ＥＬＳＥ
ＩＦ（（制御結果良否判定推定値Ｓ１１＝０）AND（PTRIAL＜η））ＴＨＥＮ
＃１～＃ｎＡＳ－Ｕ位置変更量出力＝０
上第１中間シフト位置変更量出力＝０
下第１中間シフト位置変更量出力＝０
ＥＬＳＥ
＃１～＃ｎＡＳ－Ｕ位置変更量出力＝＃１～＃ｎＡＳ－Ｕ位置変更量
上第１中間シフト位置変更量出力＝上第１中間シフト位置変更量
下第１中間シフト位置変更量出力＝下第１中間シフト位置変更量
ＥＮＤＩＦ
ＥＮＤＩＦ

制御実行ユニット２０においては、制御対象プラント１（圧延機）からの実績データＳｉより、上述した演算を実行し、制御操作量出力ＳＯを制御対象プラント１（圧延機）に出力することにより形状制御を実行する。また、制御方法学習ユニット２１は、制御実行ユニット２０で用いたデータを使用する。

次に、学習データ作成部８０１が行う動作について説明する。
図１に示したように、学習データ作成部８０１は、制御出力良否判定ルール実行部１７からの制御結果良否判定推定値Ｓ１１を基にして、制御操作端操作指令Ｓ２、選択制御操作量Ｓ８、制御方法選択フラグＳ１４、制御出力抑制部の判定結果（制御操作量出力可否データＳ４）より、制御ルール学習部８０２で使用するニューラルネット１１１に対する教師データＳ７ａを作成する。

この場合の教師データＳ７ａは、図８に示す、ニューラルネット１１１の出力層からの出力である、ＡＳ－Ｕ操作度合３０１、１中間操作度合３０２となる。学習データ作成部７は、ニューラルネット１０１の出力である制御操作端操作指令Ｓ２（ＡＳ－Ｕ操作度合３０１、１中間操作度合３０１）と、選択制御操作量Ｓ８である＃１～＃ｎＡＳ－Ｕ位置変更量出力、上第１中間シフト位置変更量出力、下第１中間シフト位置変更量出力を用いて、制御ルール学習部８０２で使用するニューラルネット１１１に対する教師データＳ７ａを作成する。

学習データ作成部８０１の動作を説明するにあたり、図１１に示す制御出力演算部３における各部データや記号の関係を、図１６に示す。ここでは、ニューラルネット１０１の出力である制御操作端操作指令Ｓ２についてＡＳ－Ｕ操作度合３０１を代表的に示しており、操作度合正側のデータをＯＰref、操作度合負側のデータをＯＭref、変換ゲインをＧ、制御操作量出力Ｓ３をＣrefとする。

操作度合正データＯＰref、操作度合負データＯＭrefは、減算器７０１で差が取られ、乗算器７０２で変換ゲインＧが乗算されて、制御操作量出力Ｃrefが得られる。この制御操作量出力Ｃrefが、制御出力操作方法選択部１８に供給され、選択された操作指令値Ｃ″ｒｅｆが得られる。
ここでは、簡単のため、制御ルール実行部１０のニューラルネット１０１の出力層からの出力を操作度合正側及び操作度合負側としている。

図１７は、学習データ作成部７における処理段階と処理内容を示している。
最初の処理段階７１では、操作指令値Ｃ″refは、制御出力操作方法選択部１８の出力値である選択制御操作量Ｓ８を参照する。

次の処理段階７２では、制御結果良否判定推定値Ｓ１１と制御操作量出力可否データＳ４と制御方法選択フラグ１４に応じて操作指令値Ｃ″refを修正しＣ´refとする。具体的には（制御結果良否判定推定値Ｓ１１＝０又は制御操作量出力可否データ＝０）かつ制御方法選択フラグＳ１４＝１のとき、以下の［数６］式、制御結果良否推定値Ｓ１０＝１かつ制御操作量出力可否データ＝１のとき以下の［数７］式により、操作指令値Ｃ″refの修正値Ｃ´refとする。なお（制御結果良否判定推定値Ｓ１１＝０又は制御操作量出力可否データ＝０）かつ制御方法選択フラグＳ１４＝０の時は、新規探索方法が選択されて、制御効果が低いと判定された場合なので、新たな教師データの生成は実施しない。

［数６］
ＩＦＣ″ref＞０ＴＨＥＮＣ’ref＝Ｃ″ref－Δcref
ＩＦＣ″ref＜０ＴＨＥＮＣ’ref＝Ｃ″ref＋Δcref

［数７］
ＩＦＣ″ref＞０ＴＨＥＮＣ’ ref＝Ｃ″ref＋Δcref
ＩＦＣ″ref＜０ＴＨＥＮＣ’ ref＝Ｃ″ref－Δcref

処理段階７３では、修正された操作指令値Ｃ´refより、［数８］式により操作度合修正量ΔＯｒｅｆを求める。

処理段階７４では、ニューラルネット１１１への教師データＯＰ´ref、ＯＭ´refを［数９］式により求める。

このように学習データ作成部７では、図１６に示すように、実際に制御対象プラント１に対して出力した操作指令値Ｃ″refを、制御出力良否判定ルール実行部１７の制御結果良否判定推定値Ｓ１１と制御出力抑制部４の制御操作量出力可否データＳ４と制御方法選択フラグＳ１４に応じて、操作指令値修正値Ｃ´refを演算する。
具体的には、制御結果良否推定値Ｓ１１＝１かつ制御操作量出力可否データＳ４＝１の場合は、良い操作であると判断された場合で、操作指令値を同じ方向にΔＣrefだけ増加するようにする。

逆に、制御結果良否推定値Ｓ１１＝０又は制御操作量出力可否データＳ４＝０の場合は、良くない操作であると判断された場合で、制御方法選択フラグが０で制御ルール実行部１０の出力に基づく操作量が選択されている場合には、操作指令値を逆方向にΔＣｒｅｆだけ減少するよう新たな教師データを作成する。変換ゲインＧは、予め設定したものであるから既知であることから、操作度合正側及び操作度合負側の値が判れば、修正量ΔＯｒｅｆを求めることが可能である。ここでΔＣrefは、予め適当な値をシミュレーション等で求めておき、設定する。以上の手順により、制御ルール学習部８０２にて使用する教師データＯＰ´ref、ＯＭ´refは［数９］式により求めることができる。

なお、図１６では簡単な例で説明を行っているが、実際には、＃１～＃ｎＡＳ－Ｕに対するＡＳ－Ｕ操作度合３０１及び、上第１中間ロールシフト、下第１中間ロールシフトに対する第１中間操作度合３０２についてその全てを実行し、制御ルール学習部８０２で用いるニューラルネット１１１の教師データ（ＡＳ－Ｕ操作度合教師データ、１中間操作度合教師データ）とする。

図１８は、学習データデータベースＤＢ２に保存されるデータの例を示す。
ニューラルネット１１１を学習するためには、多数の入力データＳ８ａと教師データＳ７ａの組合せが必要である。学習データ作成部７で作成した教師データＳ７ａと制御実行ユニット２０にて制御ルール実行部１０に入力された入力データＳ１（Ｓ８ａ）とを組み合わせた一組の学習データを学習データデータベースＤＢ２に蓄積していく。ここでの教師データＳ７ａは、ＡＳ－Ｕ操作度合教師データ、第１中間操作度合である。また、入力データＳ１（Ｓ８ａ）は、規格化形状偏差２０１及び形状偏差段階である。

なお、図１のプラント制御システムは、各種のデータベースＤＢ１、ＤＢ２、ＤＢ３、ＤＢ４を使用しているが、各データベースＤＢ１、ＤＢ２、ＤＢ３、ＤＢ４は、ニューラルネット管理テーブルＴＢにより連系的に管理運用される。

図１９は、ニューラルネット管理テーブルＴＢの構成を示す。
ニューラルネット管理テーブルＴＢは、仕様について（Ｂ１）板幅、（Ｂ２）鋼種、及び制御の優先度についての仕様Ａ１、Ａ２に応じて区分けされる。（Ｂ１）板幅としては、例えば、３フィート幅、メータ幅、４フィート幅、５フィート幅の４区分が、鋼種としては、鋼種（１）～鋼種（１０）の１０区分程度を用いる。また、制御の優先度についての仕様Ａについては、Ａ１及びＡ２の２種類とする。この場合、８０区分となり、８０個のニューラルネットを、圧延条件に応じて使い分けて使用することになる。

ニューラルネット学習制御部１１２は、図１８に示すような、入力データ及び教師データの組合せである学習データを、図１９に示すニューラルネット管理テーブルＴＢに従って、該当するニューラルネットＮｏ．と紐付けて、図２０に示すような学習データデータベースＤＢ２に格納する。

制御実行ユニット２０は、制御対象プラント１に対して、形状制御を実行するたびに、学習データが２組作成される。これは、同じ入力データ、制御出力に対して、制御結果良否判定が制御の優先度についての仕様Ａ１及び仕様Ａ２の２つの評価基準を用いて行われるため、教師データが２種類作成されるためである。教師データがある程度（例えば２００組）蓄積されたら、又は新たに学習データデータベースＤＢ２に蓄積されたら、ニューラルネット学習制御部１１２は、ニューラルネット１１１の学習を指示する。

制御ルールデータベースＤＢ１には、図１９に示すような管理テーブルＴＢに従って、複数のニューラルネットが格納されている。ニューラルネット学習制御部１１２は、学習が必要なニューラルネットＮｏ．を指定して、ニューラルネット選択部１１３が制御ルールデータベースＤＢ１より当該ニューラルネットを取り出し、ニューラルネット１１１に設定する。

ニューラルネット学習制御部１１２は、学習データデータベースＤＢ２より、該当するニューラルネットに対応する、入力データ及び教師データの取り出しを、入力データ作成部１１４及び教師データ作成部１１５に指示し、それらを用いてニューラルネット１１１の学習を実行する。なお、ニューラルネットの学習方法は手法が種々提案されており、いずれの手法を用いても良い。

ニューラルネット１１１の学習が完了すると、ニューラルネット学習制御部１１２は、学習結果であるニューラルネット１１１を、制御ルールデータベースＤＢ１の該当するニューラルネットＮｏ．の位置に書き戻すことで、学習が完了する。

学習は、図１９に示すように定義された全てのニューラルネットに対して定時間間隔（例えば１日毎）で一斉に実行しても良いし、新しい学習データがある程度（例えば１００組）蓄積されたニューラルネットＮｏ．のニューラルネットのみ、その時点で学習させても良い。

次に、状態変化ルール学習ユニット２２の動作について説明する。
状態変化ルール学習ユニット２２は、制御対象プラント１の圧延実績データＳiの時間遅れデータを使用する。ここでの時間遅れＺ^－１は、ｅ－ＴＳを意味し、予め設定した時間Ｔだけ遅延させることを示す。
制御対象プラント１は、時間応答を持つため、制御機器位置の変化により、実績データが変化するまで時間遅れが存在する。そのため、学習は、制御機器位置変化後、遅延時間Ｔだけ経過した時点での実績データから制御機器位置変化前の実績データを引くことにより計算した形状変化量を用いる。

形状制御においては、ＡＳ－Ｕや第１中間ロールに対する操作指令出力後、形状計が形状変化を検出するまで数秒要するため、Ｔ＝２秒から３秒程度に設定するのが良い。なお、形状検出器の種類や圧延速度によっても、遅れ時間は変化するため、制御操作端の変更が形状変化となるまでの最適な時間をＴとして設定するのが良い。
制御操作後、遅延時間Ｔだけ経過した時点での実績データより抽出した形状偏差から、制御機器位置変化前の実績データより抽出した形状偏差を引くことにより計算した形状変化量をニューラルネット３１１に対する教師データＳ１３ａとして用いる。

図２１は、学習データデータベースＤＢ６に保存されるデータ例を示す。
ニューラルネット３１１を学習するためには、多数の入力データＳ１２ａと教師データＳ１３ａの組合せが必要である。したがって、教師データＳ１３ａ（形状変化量データ）と時間遅れした圧延実績データＳiから圧延状態変数と制御操作量を抽出した入力データＳ１２ａとを組み合わせた一組の学習データを学習データデータベースＤＢ６に蓄積していく。

ここで、圧延状態変数は、制御操作によって形状変化する傾向に影響の大きい圧延状態変数を選択して、圧延実績データＳiから抽出する。例えば、圧延速度や制御機器位置、圧延機前後の張力などは、制御操作による形状変化の傾向に与える影響が大きいため選択するのが良い。ただし、圧延状態変数を増やしすぎると学習する関係が複雑になり、必要な学習データ数が増えて結果的にニューラルネットの学習に必要な時間が増えたり、ニューラルネットの構造が複雑になることにより、計算負荷が大きくなって制御演算に遅れが生じることもあるので、使用条件に合わせて影響が多大である変数から優先的に選択するのが良い。

このとき、学習データは一定の比率で、学習データデータベースＤＢ６ではなく、検証データデータベースＤＢ７に保存しておき、良否判定ルール精度検証部３４における良否判定ルール検証に使用できるようにする。図２２に、検証データデータベースＤＢ８に保存されるデータ例を示す。学習データと同様の入力データと教師データの組み合わせに加えて、追加データとして時間遅れした圧延実績データＳiから抽出した変化前形状偏差とニューラルネットＮｏ．を保存する。

なお、図１のプラント制御システムは、各種のデータベースＤＢ５、ＤＢ６を使用しているが、図２３に各データベースＤＢ５、ＤＢ６を連系的に管理運用するためのニューラルネット管理テーブルＴＢ２の構成を示す。

具体的には、図２３に示すように、管理テーブルＴＢ２は、仕様について（Ｂ１）板幅、（Ｂ２）鋼種に応じて区分けされる。（Ｂ１）板幅としては、例えば、３フィート幅、メータ幅、４フィート幅、５フィート幅の４区分が、鋼種としては、鋼種（１）～鋼種（１０）の１０区分程度を用いる。この場合、１０区分となり、４０個のニューラルネットを、圧延条件に応じて使い分けて使用することになる。

ニューラルネット学習制御部３１２は、図２１に示すような、入力データ及び教師データの組合せである学習データを、図２３のニューラルネット管理テーブルＴＢ２に従って、該当するニューラルネットＮｏ．と紐付けて、図２４に示すような学習データデータベースＤＢ６に格納する。

制御対象プラント１において、形状制御機器が一定以上動作するたびに、学習データが作成される。教師データがある程度（例えば２００組）蓄積されたら、又は新たに学習データデータベースＤＢ６に蓄積されたら、ニューラルネット学習制御部３１２は、ニューラルネット３１１の学習を指示する。

状態変化ルールデータベースＤＢ５は、図２１に示すような管理テーブルＴＢ２に従って、複数のニューラルネットを格納している。そして、ニューラルネット学習制御部３１２は、学習が必要なニューラルネットＮｏ．を指定して、ニューラルネット選択部３１３が状態変化ルールデータベースＤＢ５より該当するニューラルネットを取り出し、ニューラルネット３１１に設定する。ニューラルネット学習制御部３１２は、学習データデータベースＤＢ６より、該当するニューラルネットに対応する、入力データ及び教師データを取り出し、入力データ作成部３１４及び教師データ作成部３１５に指示し、それらを用いてニューラルネット３１１の学習を実行する。なお、ニューラルネットの学習方法は手法が種々提案されており、いずれの手法を用いても良い。

ニューラルネット３１１の学習が完了すると、ニューラルネット学習制御部３１２は、学習結果であるニューラルネット３１１を、制御ルールデータベースＤＢ６の当該ニューラルネットＮｏ．の位置に書き戻すことで、学習が完了する。

学習は、図２３に示す管理テーブルＴＢ２で定義された全てのニューラルネットに対して定時間間隔（例えば１日毎）で一斉に実行する。あるいは、新しい学習データがある程度（例えば１００組）蓄積されたニューラルネットＮｏ．のニューラルネットのみについて、その時点で学習しても良い。

また、状態変化ルールの入力データに鋼種や板幅といった圧延材の情報を含めることで、仕様Ｂによる形状変化傾向の違いも含めて１つのニューラルネットで学習させることも可能である。この場合、状態変化ルール実行時に圧延条件に応じて状態変化ルールを切り替えることが不要となる。

良否判定誤差検証部３４は、制御出力良否判定実行部１７と同様に一方向の演算のみを行うニューラルネット３４１を備えておく。検証用データ作成部３４３は、検証データデータベースＤＢ８より、時間遅れした圧延実績データＳiから抽出した圧延状態変数と制御操作量を検証用入力データＳ２４として読出し、ニューラルネット３４１に出力する。そして、ニューラルネット３４１は予測形状変化Ｓ２５を出力する。同時に、検証用データ作成部３４３は、検証データデータベースＤＢ８より、形状変化と変化前形状偏差とを良否変換用検証データS23として読出し、状態変化良否変換部３４４に出力する。

状態変化良否変換部３４４は、検証用データ作成部３４３から形状変化と変化前形状偏差とを良否変換用検証データS23として受け取り、前述のニューラルネット３４１から検証データの入力データに基づく予測形状変化S２５を受け取る。状態変化良否変換部３４４は、以下の式により、教師データに基づく制御機器位置変化後の形状偏差spda(i)と、ニューラルネットの出力に基づく制御機器位置変化後の予測形状偏差

を、以下の［数１０］式に示すように求める。ここで、spdは良否変換用検証データS23に含まれる変化前形状偏差、Δspは良否変換用検証データS23に含まれる形状変化であり、

は予測形状変化S２５、iは板幅方向の形状検出器番号を示す。

さらに、状態変化良否変換部３４４は、以下の［数１１］式により良否評価値evaとニューラルネットの出力に基づく良否評価値evpを演算する。ここで、wcは、良否判定データベースＤＢ４に保存されている板幅方向の重みを示す。ここでは、仕様Ａのそれぞれに対して、教師データに基づく良否評価値evaとニューラルネットの出力に基づく良否評価値evpを演算し、仕様Ａの情報とともに、図２５に示すような良否評価値データベースＤＢ９に保管する。

良否判定誤差演算部３４５は、良否評価値ＤＢ９に保管された検証データごとで演算した教師データに基づく良否評価値evaとニューラルネットの出力に基づく良否評価値evpをもとに以下の式によって、ニューラルネットNo.毎、仕様Ａのそれぞれに対して、良否判定標準誤差εおよび検証結果フラグflagの演算を実施する。ここでnは検証データ数を表す。thは検証データ数が十分あるかの判定閾値であり、検証データ数が閾値に満たない場合はflag=0(検証不十分)として、状態変化ルールの検証がまだ完了していない事を制御実行ユニット２０の制御出力判定実行部１７が、良否判定誤差データベースＤＢ７を利用する際にわかるようにしておく。こうして求めたニューラルネットNo.毎、仕様Ａごとの良否判定標準誤差εおよび検証結果フラグflagを、図２６に示すような良否判定誤差データベースＤＢ７に保存する。

以上説明したように、制御対象プラント１の制御ルールを改善させるには、制御結果の良い制御操作を学習できていない場合、制御操作を大きく変更する。また、制御結果が良かった場合、新たな制御操作方法として取り入れる。さらに、制御結果の良い制御操作を学習できている場合、制御操作を変更しないか小さな変更に留める。そして、これらに対する制御結果が良かった場合、新たな制御操作方法として取り入れるようにするのが効率的である。

そして、制御機器の位置変化と形状変化の組み合わせを、実機データを元に学習することにより、機械モデルを用いたシミュレータよりも、プラント状態に合わせて精度よく制御結果の良否が推定可能となり、定期的な自動学習によって常に最新のプラント状態に適合したモデルを構築できる。

また、制御結果の良否判定を推定することで、従来技術で簡易の機械モデルでのみ行っていたプラントへの制御出力抑制機能の信頼性を高めることができる。
また、従来は一回の制御結果の良否判定で行っていた制御ルール学習データの生成が、本例の場合、制御結果の良否判定を推定することで、プラントデータに含まれるノイズの影響を抑え、効果の小さな微調整も学習データの対象とすることが可能になる。さらに、本例によると、制御効果の誤判定を防止することによって、学習データの変動を抑え、制御性能を安定させることが実現できる。

なお、制御ルールデータベースＤＢ１には、制御実行ユニット２０で使用するニューラルネットが格納される。ここで、格納されるニューラルネットが、乱数でイニシャル処理を実行しただけの場合、ニューラルネットの学習が進行し、それなりの制御が可能となるまで時間がかかる。そのため、制御対象プラント１に対して、制御部を構築した時に、その時点で判明している制御対象プラント１の制御モデルに基づき、予めシミュレーションにて、制御ルールの学習を実行する。そして、シミュレータでの学習が完了したニューラルネットをデータベースに格納しておくことで、制御対象プラントの立上げ当初から、ある程度の性能の制御を実行できるようになる。

あるいは、実機での操業データの実績データを元に、状態変化ルール学習ユニット２２にて状態変化ルールを学習させることにより、実機への制御を行わなくても、制御ルールの出力による良否判定の推定が可能となり、それに基づく制御ルールの学習が可能であり、制御対象プラントへの適用前に、ある程度の性能の制御を実行することが可能となる。

図２７は、本例のプラント制御システムとして、制御ルールの評価処理を行う制御ルール評価ユニット２３を備えた場合の構成を示す。
制御ルール評価ユニット２３は、制御ルール良否判定データ収集部３５、制御ルール評価データ演算部３６、制御ルールデータベース更新部３７、制御ルール評価データデータベースＤＢ１０、及び制御ルール評価値データベースＤＢ１１を備える。

制御ルール評価ユニット２３は、制御実行ユニット２０の制御ルール実行部に性能を評価したい制御ルールを設定した状態で、制御入力データＳ２に対する制御出力の演算を行わせ制御出力良否判定実行部１７にて、推定した制御出力良否判定推定値Ｓ９を用いて、制御ルールの評価を実施する。
制御ルール評価ユニット２３は、制御ルールの評価を行った結果として、現在制御に適用している制御ルールの評価と比較して、今回評価を行った新たな制御ルールの方が高い評価である場合には新たな制御ルールを制御に適用する為に、データベース管理テーブルＴＢにおけるニューラルネット番号を更新する。以下、制御ルール評価ユニット２３における処理内容について示す。

制御ルール良否判定データ収集部３５は、制御出力良否判定ルール実行部１７から制御出力良否判定推定値Ｓ９を受け取る。そして、制御出力良否判定推定値Ｓ９が－１（判定対象外）で無かった場合、制御ルール良否判定データ収集部３５は、制御実行ユニット２０で使用している評価対象ニューラルネットＮｏ.、制御ルール番号選択条件（仕様Ａ,Ｂ）と判定回数と制御出力良否判定推定値Ｓ９を制御ルール良否判定データＳ１６として、制御ルール評価データデータベースＤＢ１０に保存していく。評価対象ニューラルネットＮｏ．として、今回評価対象とする制御ルールが、現状制御に適用されているデータベース管理テーブルＴＢに登録されていない制御ルールであった場合には、データベース管理テーブルＴＢに登録されているニューラルネットＮｏ．の最後の番号から連番で取っていく。図２８に制御ルール評価データデータベースＤＢ１０に保存するデータ例を示す。この例では、データベース管理テーブルＴＢに登録されているニューラルネットＮｏ．の最後の番号が１００であるとして、新たな制御ルールを１０１～として番号を取っている。

制御ルール良否判定データＳ１６は、制御実行ユニット２０にて制御ルールを用いた制御出力の演算が行われるたびに新たなデータが得られ、得られた制御ルール良否判定データＳ１６が制御ルール評価データデータベースＤＢ１０に保存される。この場合、制御ルール毎に大量のデータが保管されることになるので、制御ルール評価データデータベースＤＢ１０は、各制御ルールで保管するデータの上限を定めておき、一定以上になった場合には古いデータを削除して、新たなデータを保管する。

制御ルール評価データ演算部３６は、制御ルール評価データデータベースＤＢ１０より制御ルール毎、仕様条件（Ａ，Ｂ）毎に蓄積された制御ルール良否判定データＳ１７を一括で取り出し、制御出力良否判定推定値Ｓ９の平均値を演算する。求めた平均値は、制御ルールが出力した全体の回数における良い操作を出力した回数の割合となり、この値を制御ルールの性能を評価する指標として用いる。
制御ルール評価データ演算部３６は上記により算出した制御ルール評価データＳ１８を、制御ルール評価値データベースＤＢ１１に保存する。図２９に制御ルール評価値データベースＤＢ１１に保存するデータ例を示す。Ｂ１、Ｂ２、Ａの仕様で制御ルールを適用した場合の制御ルール評価データＳ１８を保存する。同一の制御ルールでも異なる期間で再度評価を行う事で最新のプラントの操業状態に合った評価値を計算できる。この場合、再評価により算出した評価値は以前の評価値に上書きする形でデータベースを更新していく。

データベース管理テーブルＴＢには、条件に応じて使用するニューラルネットＮｏ．（制御ルール）が１つずつ登録されている。これに対して、制御ルール評価値データベースＤＢ９には、同一の条件に対して複数の制御ルールの評価値が管理されている。制御ルールデータベース更新部３７は、制御ルール評価値データベースＤＢ１１を参照して、データベース管理テーブルＴＢに登録されているニューラルネットＮｏ．（制御ルール）の制御ルール評価値と、その条件に適用した場合の他の制御ルールの制御ルール評価値とを比較し、その中で最も評価値の高い制御ルールを今後制御に適用を行っていく制御ルールと決定し、データベース管理テーブルＴＢのニューラルネットＮｏ．（制御ルール）に更新する。

図２７に示すプラント制御システムのその他の箇所は、図１に示すプラント制御システムと同様に構成する。但し、図２７に示すプラント制御システムの場合は、図１に示すプラント制御システムがプラントの制御を実施している裏側でオフライン系として圧延実績データＳiを用いて評価を行うことや、制御対象プラント１を過去実績データにして、制御ルール評価ユニット２３がその過去実績に基づいて評価を行うことが可能である。この場合は、制御実行ユニット２０が実際に制御対象プラント１を実行する必要がない。具体的には、制御出力抑制部４から制御出力量Ｓ０を制御対象プラント１に供給する必要がない。

この図２７に示すプラント制御システムによると、制御ルール実行部１０に評価を実行したい制御ルールを設定し、過去の実績データをＳｉとして与えることで、実際に制御対象プラント１に制御出力をしなくても、制御ルール評価値データベースＤＢ１１及びデータベース管理テーブルＴＢを更新することができる。

＜変形例＞
なお、本発明は、上述した各実施の形態例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施の形態例は、本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。

例えば、図１や図２７に示すプラント制御システムは、データの作成や学習、制御などの処理を行う処理部を備える構成とした。この図１や図２７に示す制御実行ユニット２０、制御方法学習ユニット２１、良否判定ルール学習ユニット２２、制御ルール評価ユニット２３は、プロセッサがそれぞれの機能を実現するプログラム（ソフトウェア）で構成して、プログラムをコンピュータに実行させても良い。図３０はこの場合のコンピュータの構成例を示す。

すなわち、図３０に示すように、各ユニット２０～２３を構成するコンピュータは、バスにそれぞれ接続されたＣＰＵ（Central Processing Unit：中央処理ユニット）ａと、ＲＯＭ（Read Only Memory）ｂと、ＲＡＭ（Random Access Memory）ｃを備える。さらに、コンピュータは、不揮発性ストレージｄと、ネットワークインタフェースｅとを備える。

ＣＰＵａは、各ユニット２０～２３での処理を実行するソフトウェアのプログラムコードをＲＯＭｂから読み出して実行する演算処理部である。ＲＡＭｃには、演算処理の途中に発生した変数やパラメータ等が一時的に書き込まれる。不揮発性ストレージｄには、例えば、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）などの大容量の情報記憶部が用いられ、各ユニット２０～２３が実行するプログラムや、各データベースのデータなどが格納される。
なお、各ユニット２０～２３は、それぞれ別のコンピュータで構成しても良いが、１つなどの少ない数のコンピュータに各プログラムを実装して、同時に実行しても良い。

ネットワークインタフェースｅには、例えば、ＮＩＣ（Network Interface Card）などが用いられ、他のユニットや制御対象プラント１とのデータの送受信が行われる。
この場合の各処理機能を実現するプログラムなどの情報は、ＨＤＤやＳＳＤなどの不揮発性ストレージｄの他に、メモリ、ＩＣカード、ＳＤカード、光ディスク等の記録媒体に置くことができる。

また、各ユニット２０～２３が行う機能の一部又は全部を、ＦＰＧＡ（Field Programmable Gate Array）やＡＳＩＣ（Application Specific Integrated Circuit）などのハードウェアによって実現しても良い。

また、図１や図２７などに示すブロック図では、制御線や情報線は説明上必要と考えられるものだけを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えても良い。
また、上述した実施の形態例では、制御対象プラント１として、センヂミア圧延機に適用した例としたが、本発明は、その他の各種プラントの制御に適用が可能である。センヂミア圧延機に適用した場合の制御ルールについても、一例を示したものであり、本発明は、上述した実施の形態例に限定されない。

１…制御対象プラント、２…制御入力データ作成部、３…制御出力演算部、４…制御出力抑制部、５…制御出力判定部、６…制御結果良否判定部、７…学習データ作成部、１０…制御ルール実行部、１６…制御操作外乱発生部、１７…制御出力良否判定実行部、１８…制御出力操作方法選択部、２０…制御実行ユニット、２１…制御方法学習ユニット、２２…良否判定ルール学習ユニット、２３…制御ルール評価ユニット、３１…状態変化ルール学習部、３３…新規探索操作量演算部、３４…良否判定誤差検証部、３５…制御ルール良否判定データ収集部、３６…制御ルール評価データ演算部、３７…制御ルールデータベース更新部、５０…センヂミア圧延機、５１…パターン認識部、５２…形状検出器、５３…制御演算部、５４…形状検出前処理部、１０１…ニューラルネット、１０２…ニューラルネット選択部、１１０…ニューラルネット処理部、１１１…ニューラルネット、１１２…ニューラルネット学習制御部、１１３…ニューラルネット選択部、１１４…入力データ作成部、１１５…教師データ作成部、１７１…ニューラルネット、１７２…ニューラルネット選択部、２０１…規格化形状偏差、２０２…形状偏差段階、２１０…形状偏差ＰＰ値演算部、２１１…形状偏差段階演算部、３１０…ニューラルネット処理部、３１１…ニューラルネット、３１２…ニューラルネット学習制御部、３１３…ニューラルネット選択部、３１４…入力データ作成部、３１５…教師データ作成部、３４１…ニューラルネット、３４２…ニューラルネット選択部、３４３…検証用データ作成部、３４４…状態変化良否変換部、３４５…良否判定誤差演算部、５０１…圧延現象モデル、５０２…形状修正良否判定部、５０３…形状偏差修正量予測データ、５０４…形状偏差実績データ、５０５…形状偏差予測データ、６０２…形状変化良否判定部、７０３…制御出力操作方法選択部、８０１…学習データ作成部、８０２…制御ルール学習部、ＤＢ１…制御ルールデータベース、ＤＢ２…学習データデータベース、ＤＢ３…出力判定データベース、ＤＢ４…良否判定データベース、ＤＢ５…状態変化ルールデータベース、ＤＢ６…学習データデータベース、ＤＢ７…良否判定誤差データベース、ＤＢ８…検証データデータベース、ＤＢ９…良否評価値データベース、ＤＢ１０…制御ルール評価データデータベース、ＤＢ１１…制御ルール評価値データベース

Claims

制御対象プラントに対して、前記制御対象プラントの実績データの組合せのパターンを認識して、制御を実行するプラント制御システムであって、
前記制御対象プラントの実績データと制御操作の組合せを学習する制御方法学習ユニットと、前記制御方法学習ユニットが学習した実績データと制御操作の組合せに応じて制御対象プラントの制御を実行する制御実行ユニットと、前記制御対象プラントの実績データと制御操作と制御対象の状態変化の組み合わせを学習する状態変化ルール学習ユニットとを備え、
前記制御実行ユニットは、
前記制御対象プラントの実績データと制御操作の定められた組合せに従って制御出力を与える制御ルール実行部と、
前記制御対象プラントの実績データと制御操作と制御対象の状態変化の定められた組み合わせに従って、制御対象の状態変化を予測し前記制御出力の良否判定を推定する制御出力良否判定実行部と、
前記制御出力良否判定実行部での良否判定を元に新規操作探索用操作量を演算する新規探索操作量演算部と、
前記制御出力良否判定実行部での良否判定を用いて、制御出力を前記制御対象プラントに出力した場合に前記制御対象プラントの実績データが悪化すると判断した場合に、制御出力を前記制御対象プラントに出力することを阻止する制御出力抑制部とを備え、
前記状態変化ルール学習ユニットは、
前記制御対象プラントの実績データより、実績データと制御操作と、前記制御操作による制御効果が実績データに表れるまでの時間遅れの間の制御対象の状態変化量の組合せを抽出して学習データを作成し、前記学習データを用いて学習する状態変化ルール学習部を備え、
前記制御方法学習ユニットは、
前記制御出力良否判定実行部での前記制御出力の良否判定と、前記制御出力を用いて教師データを得る学習データ作成部と、
前記実績データと前記教師データを学習データとして学習する制御ルール学習部とを備える
プラント制御システム。
前記制御方法学習ユニットが学習することで、前記制御対象プラントの状態に応じて複数の制御目標に対して別個の実績データと制御操作の組合せを得、
得られた実績データと制御操作の組合せを、前記制御ルール実行部における前記制御対象プラントの実績データと制御操作の定められた組合せとして使用する
請求項１に記載のプラント制御システム。
前記制御出力良否判定実行部は、前記制御対象プラントの実績データと制御操作と制御対象の状態変化の定められた組合せを第１のニューラルネットとして保持し、
前記状態変化ルール学習部は、実績データと制御操作と制御対象の状態変化の組合せを第２のニューラルネットとして保持し、
前記状態変化ルール学習部における学習の結果得られた前記第２のニューラルネットを、前記制御出力良否判定実行部における前記第１のニューラルネットとして使用する
請求項１に記載のプラント制御システム。
前記状態変化ルール学習ユニットは、過去の実績データの制御出力の良否判定と、前記制御対象プラントの実績データと制御操作と制御対象の状態変化の定められた組み合わせに従って、制御対象の状態変化を予測し制御出力の良否判定を比較する事により良否判定の誤差を演算する良否判定誤差検証部を備え、
前記良否判定誤差検証部で生成した良否判定誤差を用いて、前記制御出力良否判定実行部における制御結果良否判定の基準を変更する
請求項１に記載のプラント制御システム。
さらに、物理モデルを用いたシミュレーションに基づき前記制御出力の可否を判定する制御出力判定部を備え、
前記制御出力抑制部は、前記制御出力良否判定実行部での良否判定と前記制御出力判定部の制御出力可否判定の双方、あるいは前記制御出力良否判定実行部での良否判定を用いて、制御出力を前記制御対象プラントに出力した場合に前記制御対象プラントの実績データが悪化すると判断した場合に、制御出力を前記制御対象プラントに出力する
請求項１に記載のプラント制御システム。
さらに、制御ルール評価ユニットを備え、
前記制御ルール評価ユニットは、
前記制御実行ユニットの前記良否判定実行部の良否判定データをデータベースに蓄積する制御ルール良否判定データ収集部と、
前記データベースに蓄積された良否判定データを元に制御ルール評価データを演算する制御ルール評価データ演算部を有し、
前記制御実行ユニットに用いた制御ルールを前記制御対象プラントに出力せずに評価が可能な
請求項１～５のいずれか１項に記載のプラント制御システム。
制御対象プラントに対して、前記制御対象プラントの実績データの組合せのパターンを認識して、前記制御対象プラントの制御をコンピュータにより実行するプラント制御方法であって、
前記コンピュータが実行する処理として、
前記制御対象プラントの実績データと制御操作の組合せを学習する制御方法学習処理と、前記制御方法学習処理により学習した実績データと制御操作の組合せに応じて制御対象プラントの制御を実行する制御実行処理と、前記制御対象プラントの実績データと制御操作と制御対象の状態変化の組合せと制御結果良否の組み合わせを学習する状態変化ルール学習処理と、を含み、
前記制御実行処理は、
前記制御対象プラントの実績データと制御操作の定められた組合せに従って制御出力を与える制御ルール実行処理と、
前記制御対象プラントの実績データと制御操作と制御対象の状態変化の定められた組み合わせに従って、制御対象の状態変化を予測し前記制御出力の良否判定を推定する制御出力良否判定実行処理と、
前記制御出力良否判定実行処理での良否判定を元に新規操作探索用操作量を演算する新規探索操作量演算処理と、
前記制御出力良否判定実行処理での良否判定を用いて、制御出力を前記制御対象プラントに出力した場合に前記制御対象プラントの実績データが悪化すると判断した場合に、制御出力を前記制御対象プラントに出力することを阻止する制御出力抑制処理と、を含み、
前記状態変化ルール学習処理は、
前記制御対象プラントの実績データより、実績データと制御操作と、前記制御操作による制御効果が実績データに表れるまでの時間遅れの間の制御対象の状態変化量の組合せを抽出して学習データを作成し、前記学習データを用いて学習する状態変化ルール学習処理を含み、
前記制御方法学習処理は、
前記制御出力良否判定実行処理での前記制御出力の良否判定と、前記制御出力を用いて教師データを得る学習データ作成処理と、
前記実績データと前記教師データを学習データとして学習する制御ルール学習処理と、を含む
プラント制御方法。
制御対象プラントに対して、前記制御対象プラントの実績データの組合せのパターンを認識して、コンピュータにプラント制御を実行させるプログラムであり、
当該プログラムは、前記制御対象プラントの実績データと制御操作の組合せを学習する制御方法学習手順と、前記制御方法学習手順により学習した実績データと制御操作の組合せに応じて制御対象プラントの制御を実行する制御実行手順と、前記制御対象プラントの実績データと制御操作と制御対象の状態変化の組合せと制御結果良否の組み合わせを学習する状態変化ルール学習手順と、を前記コンピュータに実行させるものであり、
前記制御実行手順は、
前記制御対象プラントの実績データと制御操作の定められた組合せに従って制御出力を与える制御ルール実行手順と、
前記制御対象プラントの実績データと制御操作と制御対象の状態変化の定められた組み合わせに従って、制御対象の状態変化を予測し前記制御出力の良否判定を推定する制御出力良否判定実行手順と、
前記制御出力良否判定実行手順での良否判定を元に新規操作探索用操作量を演算する新規探索操作量演算手順と、
前記制御出力良否判定実行手順での良否判定を用いて、制御出力を前記制御対象プラントに出力した場合に前記制御対象プラントの実績データが悪化すると判断した場合に、制御出力を前記制御対象プラントに出力することを阻止する制御出力抑制手順と、を含み、
前記状態変化ルール学習手順は、
前記制御対象プラントの実績データより、実績データと制御操作と、前記制御操作による制御効果が実績データに表れるまでの時間遅れの間の制御対象の状態変化量の組合せを抽出して学習データを作成し、前記学習データを用いて学習する状態変化ルール学習手順を含み、
前記制御方法学習手順は、
前記制御出力良否判定実行手順での前記制御出力の良否判定と、前記制御出力を用いて教師データを得る学習データ作成手順と、
前記実績データと前記教師データを学習データとして学習する制御ルール学習手順と、を含む
プログラム。