JP2022183827A - プラント制御システム、圧延機制御装置、プラント制御方法、及びプラント制御プログラム - Google Patents
プラント制御システム、圧延機制御装置、プラント制御方法、及びプラント制御プログラム Download PDFInfo
- Publication number
- JP2022183827A JP2022183827A JP2021091321A JP2021091321A JP2022183827A JP 2022183827 A JP2022183827 A JP 2022183827A JP 2021091321 A JP2021091321 A JP 2021091321A JP 2021091321 A JP2021091321 A JP 2021091321A JP 2022183827 A JP2022183827 A JP 2022183827A
- Authority
- JP
- Japan
- Prior art keywords
- control
- plant
- controlled
- rule
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000005096 rolling process Methods 0.000 title claims description 60
- 238000013528 artificial neural network Methods 0.000 claims description 136
- 238000011156 evaluation Methods 0.000 claims description 74
- 238000012545 processing Methods 0.000 claims description 45
- 230000008859 change Effects 0.000 claims description 40
- 238000007726 management method Methods 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 5
- 238000003909 pattern recognition Methods 0.000 claims description 4
- 238000004088 simulation Methods 0.000 claims description 4
- 230000001629 suppression Effects 0.000 claims description 4
- 238000004904 shortening Methods 0.000 claims 1
- 230000006978 adaptation Effects 0.000 abstract 2
- 238000012423 maintenance Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 22
- 238000004364 calculation method Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 15
- 238000012937 correction Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 238000012549 training Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 229910000831 Steel Inorganic materials 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 239000010959 steel Substances 0.000 description 3
- 230000032683 aging Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000002436 steel type Substances 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000005097 cold rolling Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002826 coolant Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000010935 stainless steel Substances 0.000 description 1
- 229910001220 stainless steel Inorganic materials 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010977 unit operation Methods 0.000 description 1
Images
Landscapes
- Control Of Metal Rolling (AREA)
- Feedback Control In General (AREA)
Abstract
【課題】適切な頻度で制御モデルを更新することで計算機負荷を低減し、制御ルールの性能維持を実現する。【解決手段】制御対象プラントの制御を実施するプラント制御システムは、制御対象プラントの実績データと制御操作の組合せに基づいて制御ルールを学習する制御方法学習装置と、制御方法学習装置によって学習された制御ルールに基づいて制御対象プラントの制御を実施する制御実行装置と、制御ルールに基づいて制御対象プラントの制御を実施した際の実績データに基づいて制御対象プラントに対する制御ルールの適合度を演算し、適合度に基づいて制御ルールを更新する制御ルール更新判断装置とを備えた。【選択図】図1
Description
本発明は、ニューラルネット等の人工知能技術を用いて行う実時間のフィードバック制御を行うと共に、人工知能の学習の自動更新機能を有するプラント制御システム、圧延機制御装置、プラント制御方法、及びプラント制御プログラムに関する。
従来から、各種のプラントにおいてはその制御により所望の制御結果を得るために各種制御理論に基づいたプラント制御が実施されている。
プラントの一例として例えば圧延機制御においては、制御の一例として板の波打ち状態を制御する形状制御を対象とした制御理論として、ファジィ制御やニューロ・ファジィ制御が適用されてきた。ファジィ制御は、クーラントを利用した形状制御に、また、ニューロ・ファジィ制御は、ゼンジミア圧延機の形状制御に適用されている。このうちニューロ・ファジィ制御を適用した形状制御は、特許文献1に示されるように、形状検出器で検出された実績形状パターンと目標形状パターンの差と、予め設定された基準形状パターンとの類似割合を求め、その類似割合からこれも予め設定された基準形状パターンに対する制御操作端操作量によって表現された制御ルールにより、操作端に対する制御出力量を求めることにより行われている。以下、従来技術として、ニューロ・ファジィ制御を用いたゼンジミア圧延機の形状制御を用いるものとする。
また制御装置の管理装置としては、特許文献3に示されるように油圧シリンダーのピストン位置を制御する油圧圧下装置と、複数の前記油圧圧下制御装置の管理装置とを含む油圧圧下制御装置の管理システムが知られている。
この管理システムでは、油圧圧下制御装置の制御モデルのパラメータの更新タイミングを判断し、制御モデルから油圧圧下制御装置への指令値とその実測値によってパラメータを調整する機能がある。
図5に、特許文献1の図1に記述されたゼンジミア圧延機の形状制御を示す。ゼンジミア圧延機の形状制御では、ニューロ・ファジィ制御が用いられる。この例では、パターン認識機構51で、形状検出器52にて検出した実形状より形状のパターン認識を行い、実形状が予め設定された基準形状パターンのどれに最も近いかを演算する。制御演算機構53では、図6で示すような予め設定された形状パターンに対する制御操作端操作量で構成される制御ルールを用いて制御を実施する。図6についてより具体的に述べると、パターン認識機構51では、形状検出器52にて検出した形状実績と目標形状(εref)との差分(Δε)が、1から8の形状パターン(ε)のどれに最も近いかを演算し、制御演算機構53では、1から8の制御方法のいずれかを選択し実行する。
ところが特許文献1の手法では、制御ルールの検証のために、圧延中にオペレータに手動操作を行ってもらい制御ルールの検証等行う場合が有るが、予想に反した形状変化を示す場合がある。つまり、上記の様にして決定した制御ルールが現実に則していない場合が発生する。これは、機械的特性の検討不足や圧延機の操業状態や機械条件の変化が原因であるが、予め設定した制御ルールが最も良いルールかどうかを1つ1つ検証するのは、考慮すべき条件が多く困難である。そのため、制御ルールを一度設定してしまうと、不具合が無い限りそのままとしてしまう場合が多い。
操業条件の変化等で、制御ルールが現実に則したものでなくなってくると、制御ルールが固定されているため、ある程度以上の制御精度を出すことは困難となってくる。また、一旦形状制御が動作してしまうと、オペレータは手動操作をしなくなる(制御にとって外乱となってしまう)ため、新たな制御ルールをオペレータの手動介入により見つけていくのも困難である。さらに、新しい規格の圧延材を圧延する場合も制御ルールをその材料にあわせて設定するのは困難である。
以上のように、従来の形状制御においては、予め設定された制御ルールを用いて制御するため、制御ルールを修正するのが困難であるという問題が有った。
この問題を解決するために、特許文献2に示すような、形状制御を行いながら制御ルールをランダムに変化させ、形状が良くなるルールを学習して行くことで、
1)圧延中に形状制御を実施しながら新たな制御ルールを発見していく。
2)新たな制御ルールは、予め予想できるものでは無く、全く予測できなかった制御ルールが最適となる場合も有る事から、ランダムに制御操作端を動作させ、それに対する制御結果を見ながら見つけていく。
ことを実現している。
1)圧延中に形状制御を実施しながら新たな制御ルールを発見していく。
2)新たな制御ルールは、予め予想できるものでは無く、全く予測できなかった制御ルールが最適となる場合も有る事から、ランダムに制御操作端を動作させ、それに対する制御結果を見ながら見つけていく。
ことを実現している。
上記従来技術は、予め代表的な形状を基準形状パターンとして設定し、基準波形パターンに対する制御操作端操作量との関係を示す制御ルールを基に制御を行っている。制御ルールの学習についても、基準波形パターンに対する制御操作端操作量に関するものであり、予め定めている代表的な基準形状パターンはそのまま用いている。そのため、特定の形状パターンにしか反応しない形状制御となってしまう問題がある。
基準形状パターンは、人間が予め対象となる圧延機に関する知識や、形状実績と手動介入操作を蓄積した経験より定めたものであるが、対象となる圧延機および被圧延材で発生する全ての形状を網羅する事は困難である。そのため、基準形状パターンとは異なる形状が発生した場合、形状制御による制御が実施されず、形状偏差が抑制されずに残ってしまい、あるいは似たような基準形状パターンと誤認識し、誤った制御操作を行って、逆に形状を悪化させてしまう場合も有る。
以上のように、従来の形状制御においては、予め設定された基準形状パターンとそれに対する制御ルールを用いて制御ルールの学習をし、制御を実施するため、制御精度の向上に限界があるという問題が有った。
また、Deep Learning適用形状制御で用いる制御モデルは、更新直後において高い制御効果を発揮できるものの、一定期間が経過し、プラント環境の経年変化や操業状況の変化などが発生すると、プラントへの適合度が低下し、制御効果を十分に発揮できなくなる。そのため制御モデルをプラントの状態によって逐次最適化しなければならないが、時々刻々と生成される圧延実績データを用いて、教師データの作成や制御モデル構築処理をリアルタイムで実行することは計算機負荷が大きい為、常に制御モデルを更新し続けることは困難である。
以上のことから本発明においては、制御対象プラントの制御を実施するプラント制御システムは、前記制御対象プラントの実績データと制御操作の組合せに基づいて制御ルールを学習する制御方法学習装置と、前記制御方法学習装置によって学習された前記制御ルールに基づいて前記制御対象プラントの制御を実施する制御実行装置と、前記制御ルールに基づいて前記制御対象プラントの制御を実施した際の前記実績データに基づいて前記制御対象プラントに対する該制御ルールの適合度を演算し、該適合度に基づいて該制御ルールを更新する制御ルール更新判断装置とを備えたことを特徴とする。
本発明を用いることにより、制御中に形状制御で使用する、形状パターンと操作方法の制御ルールを自動的に修正し最適なものとすることが可能となる。そのため、制御精度の向上、制御部の立上げ期間の短縮、経年変化に対する対応が可能となる等の効果が有る。
さらに本発明によると、制御ルールと実績データの適合度を評価し、制御ルールの更新タイミングを判定し、自動で再学習することにより、適切な頻度で制御モデルを更新することで計算機負荷を低減し、制御ルールの性能維持を実現する。
以下本発明の実施例について、図面を用いて詳細に説明するが、その前に本発明における知見、並びに本発明に至る経緯について圧延機の形状制御を例にして説明をしておく。
まず、本発明における上記課題を解決するためには、
1)基準形状パターンと、それに対する制御操作を予め別々に設定し、制御操作方法を学習していくのではなく、形状パターンと制御操作の組合せを学習し、それを用いて制御操作を実施する。
2)新たな制御ルールは、予め予想できるものでは無く、全く予測できなかった制御ルールが最適となる場合も有る事から、ランダムに制御操作端を動作させ、それに対する制御結果を見ながら見つけていく。
ことが必要となる。
1)基準形状パターンと、それに対する制御操作を予め別々に設定し、制御操作方法を学習していくのではなく、形状パターンと制御操作の組合せを学習し、それを用いて制御操作を実施する。
2)新たな制御ルールは、予め予想できるものでは無く、全く予測できなかった制御ルールが最適となる場合も有る事から、ランダムに制御操作端を動作させ、それに対する制御結果を見ながら見つけていく。
ことが必要となる。
これを実現するためには、形状制御に使用する形状パターンと制御操作の組合せを変化させて、制御結果が良くなるように制御操作を変更していく必要がある。そのためには、形状パターンと制御操作の組合せを学習可能なニューラルネットを構成し、圧延機で発生した形状パターンに対する、ニューラルネットの制御操作の出力を、制御結果の良否に応じて変更していく事が必要である。
上記を、操業中の圧延機に対して形状制御を実施しながら、実施すると、誤った制御出力を出す場合もあることから、形状が悪化し、板破断等の操業異常が発生する事がある。板破断が発生すると、圧延機で使用するロールの交換に時間を要したり、圧延中の被圧延材が無駄になったりと、ダメージが大きい。そのため、可能な限り誤った制御出力を圧延機に対して出力しないようにする事が必要である。
以上のことから本発明においては、これを実現するため、ニューラルネットが出力した制御操作の良否を、例えば圧延機の簡易モデル等を用いて検証し、明らかに形状が悪化すると考えられる出力は、圧延機の制御操作端に対して出力しないようにし、形状悪化を防止する。この時、ニューラルネットに関しては、その形状パターンに対する制御操作は誤りであるとして学習を実施する。
制御操作の良否の検証方法自体が誤っている可能性が有るため、ある確率で誤っていると判断されたニューラルネットの制御操作量出力についても、圧延機の制御操作端に出力することで、想定外の形状パターンと制御操作の組合せについても学習していく事が可能となる。
また経年変化によるプラントの環境変化や操業条件の変化により制御ルールがプラントに対して最適でなくなった場合、計算機負荷を監視し、適切なタイミングで制御ルールをプラントの状態によって逐次最適化することで、制御性能の低下を回避することが可能になる。
プラントに対する制御ルールの適合度は、プラントの操業中に逐次作成される実績データに含まれる形状をニューラルネットに入力することにより出力された値と、実績データに含まれる制御出力との誤差を元に評価することが可能になる。
図1に、本発明の実施例に係るプラント制御システムの概要を示す。図1のプラント制御システムは、制御対象プラント1と、制御対象プラント1からの実績データSiを入力して図6に例示したような制御ルール(ニューラルネット)に従い定めた制御操作量出力SOを制御対象プラント1に与えて制御する制御実行装置20と、制御対象プラント1からの実績データSiなどを入力して学習を行い、学習した制御ルールを制御実行装置20における制御ルールに反映させる制御方法学習装置21と、プラントの操業中に逐次作成される実績データSiと制御ルールの適合度を評価し、適切なタイミングで制御ルール学習指示を制御ルール学習部11へ与える制御ルール更新判断装置22と、複数のデータベースDB(DB1からDB5)、並びにデータベースDBのデータベース管理テーブルTBから構成されている。
制御実行装置20は、制御入力データ作成部2、制御ルール実行部10、制御出力演算部3、制御出力抑制部4、制御出力判定部5、制御操作外乱発生部16を主たる要素として構成されている。
このうち制御実行装置20においては、まず制御対象プラント1である圧延機の実績データSiより、制御入力データ作成部2を用いて、制御ルール実行部10の入力データS1を作成する。制御ルール実行部10は、制御対象の実績データSiと制御操作端操作指令S2の関係を表現するニューラルネット(制御ルール)を用いて、制御対象の実績データSiから制御操作端操作指令S2を作成する。制御出力演算部3においては、制御操作端操作指令S2をもとに、制御操作端への制御操作量S3を演算する。これにより、制御対象プラント1の実績データSiに応じて、ニューラルネットを用いて制御操作量S3を作成する。
また制御実行装置20内の制御出力判定部5においては、制御対象プラント1からの実績データSiおよび制御出力演算部3からの制御操作量S3を用いて、制御操作端への制御操作量出力可否データS4を決定する。制御出力抑制部4においては、制御操作量出力可否データS4に応じて制御操作端への制御操作量S3の出力可否を決定し、可とされた制御操作量S3を、制御対象プラント1に与える制御操作量出力SOとして出力する。これにより、異常と判断される制御操作量S3は、制御対象プラント1に出力されなくなる。なお制御操作外乱発生部16は、プラント制御システムを検証する目的のために、外乱を生成し、制御対象プラント1に与えるものである。
以上のように構成された制御実行装置20は、その処理実行のために、さらに後述するように、制御ルール評価値データベースDB1および出力判定データベースDB3を参照する。制御ルール評価値データベースDB1は、制御実行装置20内の制御ルール実行部10と、後述する制御方法学習装置21内の制御ルール学習部11の双方にアクセス可能に接続されている。制御ルール学習部11における学習結果としての制御ルール(ニューラルネット)が制御ルール評価値データベースDB1に格納されており、制御ルール実行部10は制御ルール評価値データベースDB1に格納された制御ルールを参照する。出力判定データベースDB3は、制御実行装置20内の制御出力判定部5にアクセス可能に接続されている。
図2は、本発明の実施例に係る制御ルール実行部10の具体的な構成事例を示している。制御ルール実行部10は、制御入力データ作成部2で作成した入力データS1を入力して、制御出力演算部3に制御操作端操作指令S2を与える。制御ルール実行部10はニューラルネット101を備えており、ニューラルネット101では基本的には図6に例示したような特許文献1の手法により制御操作端操作指令S2を定めている。本発明においては、制御ルール実行部10はさらにニューラルネット選択部102を備えており、制御ルール評価値データベースDB1に格納された制御ルールを参照することで、ニューラルネット101における制御ルールとして、最適な制御ルールを選択し、実行せしめる。このように図2の制御ルール実行部10においては、オペレータ班や制御目的で分けられた複数のニューラルネットから、必要なニューラルネットを選択し、使用している。制御ルール評価値データベースDB1には、制御対象プラント1からのデータとして、ニューラルネットおよび良否判定基準を選択できるような実績データ(操業班のデータ等)Siも含むのがよい。なお、ニューラルネットを実行すると制御ルールになるという関係にあることから、本明細書においてはニューラルネットと制御ルールを区別せず、同義の意味で使用している。
図1に戻り、制御方法学習装置21においては、制御実行装置20で使用するニューラルネット101の学習を実施する。制御実行装置20が制御対象プラント1に対して、制御操作量出力SOを出力した場合、実際に制御効果が実績データSiの変化となって現れるには時間を要する。このため、その時間だけ時間遅れさせたデータを用いて学習を実施する。図1において、Z-1は、各データに対する適宜の時間遅れ機能を表している。
制御方法学習装置21は、制御結果良否判定部6、学習データ作成部7、制御ルール学習部11、良否判定データベースDB4を主たる要素として構成されている。
このうち、制御結果良否判定部6は、制御対象プラント1からの実績データSiおよび実績データ前回値Si0、並びに良否判定データベースDB4に記憶された良否判定データS5を用いて、実績データSiが良くなる方向に変化したか、悪くなる方向に変化したか判定し、制御結果良否データS6を出力する。
制御方法学習装置21内の学習データ作成部7においては、制御実行装置20にて作成した制御操作端操作指令S2、制御操作量S3、制御操作量出力可否データS4などの入力データをそれぞれ同じ時間だけ時間遅れさせたデータと、制御結果良否判定部6よりの制御結果良否データS6を用いて、ニューラルネットの学習に使用する新規の教師データS7aを作成し、制御ルール学習部11に与える。なお、教師データS7aは、制御ルール実行部10が出力する制御操作端操作指令S2に対応するものであり、学習データ作成部7は、制御結果良否判定部6が与える制御結果良否データS6を用いて制御ルール実行部10が出力する制御操作端操作指令S2を推定して得たデータを、新規の教師データS7aとして求めたものということができる。
制御ルール更新判断装置22は、実績データSiと制御ルールから制御ルールのプラントへの適合度を評価し、制御処理計算機23が高負荷になることなく処理できるタイミングで新たな教師データS7aから制御ルールを学習し、制御ルールを更新する。制御処理計算機23は、制御実行装置20および制御ルール更新判断装置22を実現する計算機である。
図1の説明に戻ると、制御ルール更新判断装置22は、制御実行装置20で使用するニューラルネット101の更新を実行する。制御ルール更新判断装置22は、制御ルール更新処理管理部24、制御ルール適合度評価部25、制御ルール更新評価部26、および制御ルール評価値データベースDB5を備える。
制御ルール適合度評価部25は、プラントの操業中に逐次作成される実績データSiに対して、データベース管理テーブルTBから実績データSiに対応するニューラルネット(制御ルール)No.S9を取得し、制御ルール評価値データベースDB1から該当する制御ルールS10を選択する。制御ルール適合度評価部25は、選択した制御ルールへ実績データSiの形状を入力した際の出力と実績データSiに含まれる制御出力との差分(誤差)または差分に基づく指標をプラントに対する制御ルールの適合度として算出し、制御ルール評価値データベースDB5へ格納する。制御ルール適合度評価部25は、制御ルール更新評価部26に対して、評価したニューラルネット(制御ルール)のNo.と制御ルール更新評価の実行指示S12を出力する。
制御ルール更新評価部26は、制御ルール適合度評価部25から制御ルール更新評価の実行指示を受けた後、制御ルール適合度評価部25にて評価されたニューラルネット(制御ルール)No.の制御ルールを取得し(S13)、その更新要否を評価し、評価結果を制御ルール評価値データベースDB5に登録し、制御ルール評価値データベースDB5に登録されている制御ルールの更新優先度を更新する(S14)。制御ルールは、各ニューラルネットNo.について、最新の所定数の制御ルール適合度評価値の平均の低い順番で高い更新優先度とする。
制御ルール更新処理管理部24は、制御ルール評価値データベースDB5から更新優先度が最も高い制御ルールを選択し(S15)、制御ルール学習部11へ制御ルールの学習を指示する処理実行指示S16を与えることで、制御ルールの更新を実行させる。制御ルール学習の実行は計算機負荷が大きいため、制御ルール更新処理管理部24は、制御処理計算機23のCPU負荷とメモリ使用率等のリソース使用状況を監視し(S17)、実績データSiから操業中か否かを監視し、制御プラントで更新対象の制御モデルが圧延に使用されていない、および/または、制御ルール学習処理を実行しても制御実行装置20の処理が遅延しない場合に、処理実行指示S16を出力する。その後、制御ルール更新処理管理部24は、処理実行指示S16を出力した制御ルールに関する情報を制御ルール評価値データベースDB5から削除する削除指示S18を出力する。
図3は、本発明の実施例に係る制御ルール学習部11の具体的な構成事例を示している。制御ルール学習部11は、入力データ作成部114、教師データ作成部115、ニューラルネット処理部110、ニューラルネット選択部113を主たる構成要素として構成されている。また制御ルール学習部11は、外部からの入力として制御入力データ作成部2からの入力データS1を時間遅れさせたデータS8aを、学習データ作成部7からの新規の教師データS7aを得、また制御ルール評価値データベースDB1および学習データデータベースDB2に蓄積されたデータを参照する。
制御ルール学習部11において、入力データS1は適宜の時間遅れ補償後に入力データ作成部114を介してニューラルネット処理部110に取り込まれる。
また制御ルール学習部11において、学習データ作成部7からの新規の教師データS7aは、教師データ作成部115において学習データデータベースDB2に記憶されている過去の教師データS7bも含めた合計の教師データS7cとして、ニューラルネット処理部110に与えられる。これらの教師データS7a、S7bは、適宜、学習データデータベースDB2に記憶されて、利用される。
同様に、制御入力データ作成部2からの入力データS8aは、入力データ作成部114において学習データデータベースDB2に記憶されている過去の入力データS8bも含めた合計の入力データS8cとして、ニューラルネット処理部110に与えられる。これらの入力データS8a、S8bは、適宜、学習データデータベースDB2に記憶されて、利用される。
ニューラルネット処理部110は、ニューラルネット111とニューラルネット学習制御部112により構成されており、ニューラルネット111は、入力データ作成部114からの入力データS8c、教師データ作成部115からの教師データS7c、ニューラルネット選択部113が選択した制御ルール(ニューラルネット)を取り込み、最終的に決定したニューラルネットを制御ルール評価値データベースDB1に格納する。
ニューラルネット学習制御部112は、入力データ作成部114、教師データ作成部115、ニューラルネット選択部113に対して、適宜のタイミングでこれらを制御し、ニューラルネット111の入力を得、また処理結果を制御ルール評価値データベースDB1に格納すべく制御している。
ここで、図2の制御実行装置20におけるニューラルネット101と、図3の制御方法学習装置21におけるニューラルネット111は、いずれも同じ概念のニューラルネットであるが、利用するうえでの基本概念上の相違について説明をしておくと、以下のようである。まず制御実行装置20におけるニューラルネット101は、予め定められた内容のニューラルネットであり、入力データS1を与えたときに対応する出力としての制御操作端操作指令S2を求めるものであり、いわば一方方向の処理に利用されるニューラルネットである。これに対し、制御方法学習装置21におけるニューラルネット111は、入力データS1と制御操作端操作指令S2についての入力データS8c、教師データS7cを学習データとして設定したときに、この入出力関係を満足するニューラルネットを学習により求めるためのものである。
上記のように構成された制御方法学習装置21における基本的な処理の考え方は、以下のようである。まず、制御操作量出力可否データS4の内容が「可」の場合、制御対象プラント1に制御操作量出力SOを出力し、制御結果良否データS6の内容が「良」(実績データSiが良くなる方向に変化)の場合、制御ルール実行部10が出力した制御操作端操作指令S2は正しいと判断し、ニューラルネットの出力が制御操作端操作指令S2となるように学習データを作成する。
一方、制御操作量出力可否データS4の内容が「否」、または、制御対象プラント1に制御操作量出力SOを出力し、制御結果良否データS6の内容が「否」(実績データSiが悪くなる方向に変化)の場合、制御ルール実行部10が出力した制御操作端操作指令S2は誤っていると判断し、ニューラルネットの出力が出ないように学習データを作成する。このとき、制御出力として、同じ制御操作端に対して+方向、-方向の2種類の出力が出るようにニューラルネット出力を構成しておき、出力した側の制御操作端操作指令S2が出力されないように学習データを作成する。
また図3に例示する制御ルール学習部11においては、ニューラルネット学習制御部112によるデータ処理の結果として、以下のように処理している。ここでは、まず制御実行装置20への入力データS1を時間遅れさせたS8cと、教師データ作成部115にて作成した教師データS7cの組合せである学習データを用いて、制御ルール実行部10にて用いたニューラルネット101の学習を実施する。実際には、制御ルール実行部10のニューラルネット101と同じニューラルネット111を制御ルール学習部11内に備えて、各種条件で運用テストしてその時の応答を学習し、学習の結果としてより良い結果を生じることが確認された制御ルールを得るものである。学習は、複数個の学習データを用いて行わせる必要があるため、過去に作成された学習データを蓄積している学習データデータベースDB2より、過去の学習データを複数個取り出して、学習し処理を実施するとともに、今回の学習データを学習データデータベースDB2に格納する。また、学習したニューラルネットは、制御ルール実行部10にて利用するために、制御ルール評価値データベースDB1に格納される。
ニューラルネットの学習は、新しい学習データが作成される毎に、過去の学習データを一緒に用いて学習しても良いし、学習データがある程度(例えば100個分)蓄積されてから、過去の学習データを一緒に用いて学習しても良い。
また、制御結果良否判定部6においては、良否判定データベースDB4からの良否判定基準をもとに良否判定を実施する。制御結果の良否判定は、制御目的に応じて判断結果が異なるため、複数の制御目的に応じたニューラルネットを複数作成し、入力データが同じでも制御目的によりそれぞれ教師データを作成し、学習することで、1回分の入力データに対して複数の教師データを作成し、それぞれの教師データに対応するニューラルネットの学習に用いることで、同時に複数の制御目的に対応したニューラルネットを学習していくことが可能である。ここで、複数の制御目的とは、例えば形状制御の場合、板幅方向でどの部分(板端部、センター部、非対称部等)を優先的に制御したいか、複数の制御対象項目(例えば、板厚と張力、圧延荷重等)のいずれを優先的に制御したいか、等のことである。
上記の様な構成とした場合、一旦制御ルール実行部10で用いられるニューラルネット101が学習してしまうと、新たな制御操作が実施されなくなる。そのため、制御操作外乱発生部16により、適時新たな操作方法を乱数的に発生させ、制御操作量S3に加えて制御操作を実行する事で、新たな制御方法を学習していく。
以下、特許文献1に示すようなゼンジミア圧延機における形状制御を対象に、本プラント制御方法の詳細を説明する。なお形状制御に関しては、下記のような仕様A、Bを採用するものとして説明する。
仕様Aは、優先度についての仕様であり、板幅方向の優先度の情報を持つものとする。例えば形状制御においては、板幅方向全域にわたって目標値に制御する事が、機械特性上困難な場合が多い。そのため、板幅方向で下記2つの優先度についての仕様A1、A2を設ける。このうち優先度についての仕様A1は「板端部を優先する」、優先度についての仕様A2は「中央部を優先する」であり、A1、A2という2つの優先順位に従った制御を実施する。制御を実施する場合は優先度についての仕様A1またはA2のいずれかを考慮する。
仕様Bは、予め判明している条件への対応についての仕様である。一例をあげると、形状パターンと制御方法の関係は、種々の条件で変化することから、例えば、仕様B1を板幅、仕様B2を鋼種とする区分で分ける必要がある事が考えられる。上記それぞれが変化することで、形状操作端の形状への影響度合が変化する。
この事例では制御対象プラント1は、ゼンジミア圧延機であり、実績データは形状実績となる。なおゼンジミア圧延機は、ステンレスなどの硬い材料を冷間圧延するためのクラスターロールを持つ圧延機である。ゼンジミア圧延機では、硬い材料に強圧下を与える目的で、小径のワークロールを用いる。このため、平坦な鋼板を得ることが難しい。この対策として、クラスターロールの構造やさまざまな形状制御部を採用している。ゼンジミア圧延機は一般には、上下の第1中間ロールが片テーパを持ち、シフトできるようになっているほか、上下に6個の分割ロールと2個のAS-Uと呼ばれるロールを備えている。以下に説明する事例では、形状の実績データSiとしては、形状検出器の検出データを用い、さらに入力データS1としては、目標形状との差である、形状偏差を用いる。また制御操作量S3としては、#1~#nのAS-U、上下の第1中間ロールのロールシフト量とする。
図4に、ゼンジミア圧延機の形状制御に用いる場合のニューラルネット構成を示す。ここでニューラルネットとは、制御ルール実行部10用ではニューラルネット101のことであり、制御ルール学習部11用ではニューラルネット111に示したニューラルネットを示しているが、いずも構造は同じである。
図4に示すゼンジミア圧延機の形状制御の事例では、制御対象プラント1からの実績データSiは形状検出器のデータ(ここでは、実績形状と目標形状との差である形状偏差が出力されるものとする)を含むゼンジミア圧延機の実績データであり、制御入力データ作成部2では、入力データS1として規格化形状偏差201、形状偏差段階202を得る。これによりニューラルネット101、111の入力層は、規格化形状偏差201、形状偏差段階202により構成される。なお図4では、形状偏差段階202をニューラルネット入力層への入力としているが、段階に応じてニューラルネットを切替てもよい。
また、出力層は、ゼンジミア圧延機の形状制御操作端である、AS-U、第1中間ロールに合わせて、AS-U操作度合301と第1中間操作度合302により構成される。それぞれの操作度合は、AS-Uについては、AS-U開方向(ロールギャップ(圧延機の上下作業ロール間の間隔)が開く方向)、AS-U閉方向(ロールギャップが閉じる方向)を各AS-Uについて持つ。また、第1中間ロールについては、第1中間ロール開方向(第1中間ロールが圧延機中心より外側に向かって動作する方向)、第1中間ロール閉方向(第1中間ロールが圧延機中心側に向かって動作する方向)を上下第1中間ロールについて持つ。例えば、形状検出器が20ゾーンで、形状偏差段階202を3段階(大、中、小)とした場合、入力層は23個の入力となる。また、AS-Uのサドルが7本、上下第1中間ロールが板幅方向でシフト可能とすると、出力層はAS-U操作度合301が14個、1中間操作度合が4個の計18個となる。中間層の層数および各層のニューロン数については、適時設定する。なお図8を参照して後述するが、出力層であるゼンジミア圧延機の形状制御操作端について、個々の制御操作端に対して+方向、-方向の2種類の出力が出るようにニューラルネット出力を構成している。
図10に形状偏差と制御方法について示している。ここでは図10上部に、形状偏差が大きい場合の制御方法を示し、図10の下部に形状偏差が小さい場合の制御方法を示している。なお高さ方向は形状偏差の大きさ、横軸方向は板幅方向であり、板幅の両側が板端部、中央が板中央部を表している。この図10の上部に示すように、形状偏差が大きい場合は、板幅方向の局部的な形状偏差よりも全体的な形状を修正することを優先する。一方図10の下部に示すように、形状偏差が小さい場合は、局部的な形状偏差を小さくすることを優先する。
このように、形状偏差の大きさに応じて制御方法を変える必要があるため、図4に示すように形状偏差段階202を設けてニューラルネット101、111に与え、形状偏差の大きさを判定する。形状偏差については形状偏差の大小にかかわらず、例えば0~1に規格化したものを用いるのがよい。これは、一例であって、形状偏差を規格化せずにそのままニューラルネットの入力層へ入力することも考えられるし、形状偏差の大小に応じて、ニューラルネット自体を変える(例えば、2つのニューラルネットを準備し、形状偏差が大きい場合に使用するニューラルネットと、小さい場合に使用するニューラルネットを分ける)事も考えられる。
以上説明した図4のような構成のニューラルネット101、111に対して、形状パターンに対する操作方法を学習させ、学習させたニューラルネットを用いて形状制御を実施する。同じ構成のニューラルネットでも、学習の条件により異なった特性となり、同じ形状パターンに対して異なった制御出力を出すようにすることができる。
そのため、形状実績の他の条件に応じて、複数のニューラルネットを使い分けることで、多様な条件に対して最適な制御を構成することができる。これは仕様Bへの対応である。先に説明した図2の構成は、係る仕様を行う場合の具体例を示している。図2の構成事例では、制御ルール実行部10において使用するニューラルネット101を、圧延実績や、圧延機オペレータ名、被圧延材の鋼種、板幅等により別個のニューラルネットを準備し、制御ルール評価値データベースDB1に登録しておく。ニューラルネット選択部102においては、その時点の条件に合致するニューラルネットを選択し、制御ルール実行部10のニューラルネット101に設定する。なおニューラルネット選択部102における、その時点の条件としては、制御対象プラント1における実績データSiの中から板幅のデータを取り込み、これに応じてニューラルネットを選択するのがよい。また、ここで使用する複数のニューラルネットは、図4に示すような入力層、出力層を持てば、中間層の層数、各層のユニット数は異なっても良い。
図7に、ニューラルネット101、111の入力層へ入力するためのデータS1(規格化形状偏差201、形状偏差段階202)を作成する、制御入力データ作成部2の概要を示す。ここでは実績データSiとして、制御対象プラント1であるゼンジミア圧延機における圧延時の板形状を検出する、形状検出器の形状検出器データを入力とし、まず、形状偏差PP値演算装置210にて各形状検出器ゾーンの検出結果の最大値と最小値の差である形状偏差PP値(Peak To Peak値)SPPを求める。形状偏差段階演算装置211では、形状偏差PP値SPPにより、形状偏差を大、中、小の3段階に分類する。形状は、被圧延材の伸び率の板幅方向分布であり、伸び率を10-5単位で表すI-UNITが単位として用いられる。例えば、下式のように分類する。
ここでは、(1)式の成立により形状偏差段階が(大=1、中=0、小=0)とし、(2)式の成立により形状偏差段階が(大=0、中=1、小=0)とし、(3)式の成立により形状偏差段階が(大=0、中=0、小=1)とするように分類している。なおここでは、各ゾーンの形状偏差については、SPM=SPPとした、SPMを用いて規格化を実施する。
以上のようにして、ニューラルネット101への入力データである規格化形状偏差201および形状偏差段階202を作成する。規格化形状偏差201および形状偏差段階202は、制御ルール実行部10の入力データS1である。
図8に、制御出力演算部3の概要を示す。制御出力演算部3は、制御ルール実行部10内の、ニューラルネット101からの出力である制御操作端操作指令S2(ゼンジミア圧延機の形状制御の事例では、AS-U操作度合301、第1中間操作度合302がこれに相当する)より、各形状制御操作端への操作指令である制御操作量S3を作成する。なおここでは、複数個数が存在するAS-U操作度合301、第1中間操作度合302について、各1つのデータ例を示しており、各データは開方向度合と閉方向度合の一対のデータで構成されている。
制御出力演算部3内では、入力されたAS-U操作度合301は、各AS-U開方向、閉方向の出力をもつため、それらの差に変換ゲインGASUを掛ける事で、各AS-Uへの操作指令を出力する。変換ゲインGASUは、各AS-Uへの制御出力がAS-U位置変更量(単位は長さ)となることから、度合から位置変更量への変換ゲインとなる。
また同じく入力された第1中間操作度合302は、第1中間外側、内側の出力をもつため、それらの差に変換ゲインG1STを掛ける事で、各第1中間ロールシフトへの操作指令を出力する。変換ゲインG1STは、各第1中間ロールへの制御出力が第1中間ロールシフト位置変更量(単位は長さ)となることから、度合から位置変更量への変換ゲインとなる。
以上により、制御操作量S3を演算することができる。制御操作量S3は、#1~#nAS-U位置変更量(nはAS-Uロールのサドル数による)と、上第1中間シフト位置変更量、下第1中間シフト位置変更量から構成されている。なお、図8には、制御操作外乱発生部16からの外乱データを制御操作端操作指令S2に加算する系統が図示されている。
図9に、制御出力判定部5の概要を示す。制御出力判定部5は、圧延現象モデル501と形状修正良否判定部502から構成されており、制御対象プラント1よりの実績データSi、制御出力演算部3からの制御操作量S3、および出力判定データベースDB3の情報を得て、制御操作端への制御操作量出力可否データS4を与える。係る構成により制御出力判定部5においては、制御出力演算部3にて演算した制御操作量S3を制御対象プラント1である圧延機に出力した場合の形状の変化を、既知の制御対象プラント1のモデル(図9の実施例の場合は、圧延現象モデル501)に入力することで予測し、形状が悪化すると予想される場合は制御操作量出力SOを抑制し、形状が大きく悪化する事を防止する。
より詳細に述べると、制御操作量S3を圧延現象モデル501に入力し制御操作量S3による形状変化を予測し、形状偏差修正量予測データ503を演算する。他方、制御対象プラント1からの形状検出器データSi(現時点での形状偏差実績データ504)に、形状偏差修正量予測データ503を加算する事で形状偏差予測データ505を得、形状偏差予測データ505を評価することで、制御操作量S3を制御対象プラント1に出力したときに、形状がどのように変化するかが予測できる。現状の形状偏差実績データ504と形状偏差予測データ505より、形状修正良否判定部502においては、形状が良くなる方向に変化するのか、悪くなる方向に変化するのか判定し、制御操作量出力可否データS4を得る。
形状修正良否判定部502では、具体的には以下のようにして形状修正の良否判定を行う。まず形状制御の優先度についての仕様A1、A2で示したように、板幅方向での制御優先度を考慮するため、出力判定データベースDB3には、板幅方向の重み係数w(i)を仕様A1、仕様A2の各仕様に対して設定しておく。それを用いて、例えば下記の(4)式のような評価関数Jを用いて形状変化の良否を判定する。なお(4)式において、w(i)は重み係数、εfb(i)は形状偏差実績データ504、εest(i)は形状偏差予測データ505、iは形状検出器ゾーン、randは乱数項である。
(4)式の評価関数Jを用いた場合、形状が良くなるときは評価関数Jが正、悪くなるときは評価関数Jが負となる。また、randは乱数項であり、評価関数Jの評価結果を乱数的に変化させる。これにより、形状が悪化する場合であっても、評価関数Jとしては正になる場合が発生するため、圧延現象モデル501が正しくない場合についても形状パターンと制御方法の関係を学習していく事が可能である。ここでrandは、試運転当初の様に、制御対象プラント1のモデルが不確実の場合は最大値を大きくし、ある程度制御方法を学習し安定した制御を実施したい場合は0とするように、適時変更する。
形状修正良否判定部502においては、評価関数Jを演算し、J≧0のとき制御操作量出力可否データS4=1(可)とし、J<0のとき制御操作量出力可否データS4=0(否)のように制御操作量出力可否データS4を出力する。
制御出力抑制部4においては、制御出力判定部5の判定結果である制御操作量出力可否データS4に応じて、制御対象プラント1への制御操作量出力SOの出力有無を決定する。制御操作量出力可否データS4は、#1~#nAS-U位置変更量出力、上第1中間シフト位置変更量出力、下第1中間シフト位置変更量出力であり、
IF(制御操作量出力可否データS4=0)THEN
#1~#nAS-U位置変更量出力=0
上第1中間シフト位置変更量出力=0
下第1中間シフト位置変更量出力=0
ELSE
#1~#nAS-U位置変更量出力=#1~#nAS-U位置変更量
上第1中間シフト位置変更量出力=上第1中間シフト位置変更量
下第1中間シフト位置変更量出力=下第1中間シフト位置変更量
ENDIF
により決定される。
IF(制御操作量出力可否データS4=0)THEN
#1~#nAS-U位置変更量出力=0
上第1中間シフト位置変更量出力=0
下第1中間シフト位置変更量出力=0
ELSE
#1~#nAS-U位置変更量出力=#1~#nAS-U位置変更量
上第1中間シフト位置変更量出力=上第1中間シフト位置変更量
下第1中間シフト位置変更量出力=下第1中間シフト位置変更量
ENDIF
により決定される。
制御実行装置20においては、制御対象プラント1(圧延機)からの実績データSiより、上記の演算を実行し、制御操作量出力SOを制御対象プラント1(圧延機)に出力する事により形状制御を実施する。
次に、制御方法学習装置21の動作概要について説明する。制御方法学習装置21においては、制御実行装置20で用いたデータの時間遅れデータを使用する。時間遅れZ-1は、e-TSを意味し、予め設定した時間Tだけ遅延させる事を示す。制御対象プラント1は、時間応答を持つため、制御操作量出力SOにより、実績データが変化するまで時間遅れが存在する。そのため、学習は、制御操作実行後、遅延時間Tだけ経過した時点での実績データを用いて実施する。形状制御においては、AS-Uや第1中間ロールに対する操作指令出力後、形状計が形状変化を検出するまで数秒要するため、T=2から3秒程度に設定するのがよい(形状検出器の種類や圧延速度によっても、遅れ時間は変化するため、制御操作端の変更が形状変化となるまでの最適な時間をTとして設定すればよい。)。
図11に、制御結果良否判定部6の動作概要を示す。形状変化良否判定部602においては、下式のような良否判定評価関数Jcを用いる。
なお(5)式において、εfb(i)は実績データSiに含まれる形状偏差実績データ、εlast(i)は形状偏差実績データ前回値であり、wC(i)は良否判定用の板幅方向重み係数である。ここで、良否判定用の重み係数wC(i)は、良否判定データベースDB4より、制御の優先度についての仕様A1、A2に応じて設定する。良否判定評価関数Jcにより、制御結果の良否を判定する。また、制御出力判定部5の判定結果である制御操作量出力可否データS4が0(制御出力不可)の場合についても、実際に制御対象プラント1へ制御操作量出力=0であるが、形状が悪くなったと判断する。
ここでは、制御操作量出力可否データS4=0の場合、制御結果良否データS6=-1とする。また閾値上限LCUと閾値加減LCLを、閾値条件(LCU≧0≧LCL)のもとで予め設定しておく。このときに、良否判定評価関数Jcとの比較の結果が、Jc>LCUであれば、制御結果良否データS6=-1(形状が悪くなった)とし、LCU≧Jc≧0であれば、制御結果良否データS6=0(形状が悪くなる方向に変化)とし、0>Jc≧LCLであれば、制御結果良否データS6=1(形状が良くなる方向に変化)とし、Jc<LCLであれば、制御結果良否データS6=0(形状が良くなった)とする。
ここで、制御結果良否データS6=-1は、形状が悪くなったので、出力した制御出力を抑制する場合、制御結果良否データS6=0は、形状変化無し、または形状が良くなったので出力した制御出力を保持する場合、制御結果良否データS6=1は、形状が良くなる方向に変化したが、更に良くなる可能性が有るので、出力した制御量を増大させる場合である。
このように、制御の優先度についての仕様A1、A2に応じて、板幅方向の重み係数wC(i)が変わるため、良否判定評価関数Jcは異なる。そのため、制御結果良否データS6の判定結果も異なる事が考えられる。そのため、制御方法学習装置21においては、制御の優先度についての仕様A1、A2の2種類について、制御結果良否データS6の判定を実施する。
次に、学習データ作成部7の概要について説明する。図1に示したように、学習データ作成部7においては、制御結果良否判定部6からの判定結果(制御結果良否データS6)を基にして、制御操作端操作指令S2、制御操作量S3、制御出力抑制部の判定結果(制御操作量出力可否データS4)より、制御ルール学習部11で使用するニューラルネット111に対する教師データS7aを作成する。
この場合の教師データS7aは、図4に示す、ニューラルネット111の出力層からの出力である、AS-U操作度合301、第1中間操作度合302となる。学習データ作成部7は、ニューラルネット101の出力である制御操作端操作指令S2(AS-U操作度合301、第1中間操作度合302)と、制御操作量出力SOである#1~#nAS-U位置変更量出力、上第1中間シフト位置変更量出力、下第1中間シフト位置変更量出力を用いて、制御ルール学習部11で使用するニューラルネット111に対する教師データS7aを作成する。
学習データ作成部7の動作概要を説明するにあたり、図8の制御出力演算部3における各部データや記号の関係を図12に整理している。ここでは、ニューラルネット101の出力である制御操作端操作指令S2についてAS-U操作度合301を代表的に示しており、操作度合正側のデータをOPref、操作度合負側のデータをOMref、制御操作外乱発生部16からの乱数的に発生する操作度合を操作度合乱数Oref、変換ゲインをG、制御操作量出力SOをCrefとして説明する。このように、ここでは、簡単のため、制御ルール実行部10のニューラルネット101の出力層からの出力として、操作度合正側および操作度合負側、制御操作外乱発生部16からの乱数的に発生する操作度合を操作度合乱数としている。また、制御操作端に対する制御操作量出力SOを操作指令値としている。
図13は、学習データ作成部7における処理段階と処理内容を示している。ここで、図12の記号の約束に則り説明すると、最初の処理段階71では、操作指令値Crefを(6)式により求めている。
次の処理段階72では、制御結果良否データS6に応じて操作指令値Crefを修正しC´refとする。具体的には制御結果良否データS6=-1のとき(7)式、制御結果良否データS6=0のとき(8)式、制御結果良否データS6=1のとき(9)式により、操作指令値Crefの修正値C´refとする。
処理段階73では、修正された操作指令値C´refより、(10)、(11)式により操作度合修正量ΔOrefを求める。
処理段階74では、ニューラルネット111への教師データOP´ref、OM´refを(12)式により求める。
このように学習データ作成部7では、図12に示すように、実際に制御対象プラント1に対して出力した操作指令値Crefを、制御結果良否判定部6における判定結果である制御結果良否データS6に応じて、操作指令値修正値C´refを演算する。具体的には、制御結果良否データS6=1の場合は、制御方向はOKであるが、制御出力が不足していると判断された場合で、操作指令値を同じ方向にΔCrefだけ増加するようにする。逆に制御結果良否データS6=-1の場合は、制御方向が間違っていると判断された場合で、操作指令値を逆方向にΔCrefだけ減少するようにする。変換ゲインGは、予め設定したものであるから既知である事から、操作度合正側および操作度合負側の値が判れば、修正量ΔOrefを求める事が可能である。ここでΔCrefは、予め適当な値をシミュレーション等で求めておき、設定する。以上の手順により、制御ルール学習部11にて使用する教師データOP´ref、OM´refは上記の(12)式により求める事ができる。
なお図13では簡便な事例で説明を行っているが、実際には、#1~#nAS-Uに対するAS-U操作度合301および、上第1中間ロールシフト、下第1中間ロールシフトに対する第1中間操作度合302についてその全てを実施し、制御ルール学習部11で用いるニューラルネット111の教師データ(AS-U操作度合教師データ、1中間操作度合教師データ)とする。
図14は学習データデータベースDB2に保存されたデータ例を示している。ニューラルネット111を学習するためには、多数の入力データS8aと教師データS7aの組合せが必要である。従って、学習データ作成部7で作成した教師データS7a(AS-U操作度合教師データ、第1中間操作度合)は、制御実行装置20にて制御ルール実行部10に入力された入力データS1(規格化形状偏差201および形状偏差段階)の時間遅れデータS8aと組み合わせて一組の学習データとして、学習データデータベースDB2に保存される。
なお図1のプラント制御システムにおいては、各種のデータベースDB1、DB2、DB3、DB4を使用しているが、図14に各データベースDB1、DB2、DB3、DB4を連系的に管理運用するためのデータベース管理テーブルTBの構成を示す。データベース管理テーブルTBは、仕様の管理テーブルを備えている。具体的には、データベース管理テーブルTBは、仕様について(B1)板幅、(B2)鋼種、および制御の優先度についての仕様A1、A2に応じて区分けされる。(B1)板幅としては、例えば、3フィート幅、メータ幅、4フィート幅、5フィート幅の4区分が、鋼種としては、鋼種(1)~鋼種(10)の10区分程度を用いる。また、制御の優先度についての仕様Aについては、A1およびA2の2種類とする。この場合、80区分となり、80個のニューラルネットを、圧延条件に応じて使い分けて使用する事となる。
ニューラルネット学習制御部112は、図14に示すような、入力データおよび教師データの組合せである学習データを、図15のデータベース管理テーブルTBに従って、該当するニューラルネットNo.と紐付けて、図16に示すような学習データデータベースDB2に格納する。
制御実行装置20が、制御対象プラント1に対して、形状制御を実行するたびに、学習データが2組作成される。これは、同じ入力データ、制御出力に対して、制御結果良否判定が制御の優先度についての仕様A1および仕様A2の2つの評価基準を用いて行われるため、教師データが2種類作成されるためである。教師データがある程度(例えば200組)蓄積されたら、または新たに学習データデータベースDB2に蓄積されたら、ニューラルネット学習制御部112は、ニューラルネット111の学習を指示する。
制御ルールデータベースDB1には、図15に示すようなデータベース管理テーブルTBに従って、複数のニューラルネットが格納されており、ニューラルネット学習制御部112においては、学習が必要なニューラルネットNo.を指定して、ニューラルネット選択部113が制御ルール評価値データベースDB1より当該ニューラルネットを取り出し、ニューラルネット111に設定する。ニューラルネット学習制御部112は、学習データデータベースDB2より、当該ニューラルネットに対応する、入力データおよび教師データの取り出しを、入力データ作成部114および教師データ作成部115に指示し、それらを用いてニューラルネット111の学習を実施する。なおニューラルネットの学習方法は手法が種々提案されており、いずれの手法を用いても良い。
ニューラルネット111の学習が完了すると、ニューラルネット学習制御部112は、学習結果であるニューラルネット111を、制御ルール評価値データベースDB1の当該ニューラルネットNo.の位置に書き戻すことで、学習が完了する。
学習は、図15にて定義された全てのニューラルネットに対して定時間間隔(例えば1日毎)で一斉に実施しても良いし、新しい学習データがある程度(例えば100組)蓄積されたニューラルネットNo.のニューラルネットのみ、その時点で学習させても良い。
図17は制御ルール適合度評価部25の構成を示す。制御ルール適合度評価部25は、実績データSiと制御結果良否判定部6からの制御結果良否データS6を処理実行判断部254へ入力する。制御ルール適合度評価部25は、形状が良くなる有効な操作が行われたことを確認できた場合に、実績データSiで用いられた制御ルールS10を制御ルール評価値データベースDB5から、この制御ルールS10のニューラルネットNo.S9をデータベース管理テーブルTBからそれぞれ取得する。処理実行判断部254は、実績データSiと制御結果良否データS6から、制御出力取得部251の処理実行の要否を判断し、制御出力取得部251の処理を実行する場合に処理実行指示S2505を出力する。制御出力取得部251は、制御ルールS10、実績データSi、および処理実行指示S2505が入力され、制御ルールS10へ実績データSiに含まれる実形状を入力し、形状制御装置に対する出力S2501を得る。制御出力誤差演算部252は、出力S2501と実績データSiに含まれる形状制御の出力の差を(13)式にて演算する。
ここで制御ルールS10の出力S2501をr、実績データSiに含まれる形状制御の出力をg、形状制御の機器の総数をN、制御ルールS10と実績データSiの出力誤差をSUVとする。
制御出力誤差演算部252は、出力誤差SUVがある閾値TS以下となった場合、制御ルールS10は制御対象プラントに対して適合していると判断し、適合度DSUを1とし、閾値TSを上回った場合、制御ルールは制御対象プラントに対して不適合であると判断し、適合度DSUを0とする。制御出力誤差演算部252は、制御ルール評価値データベースDB5へこの制御ルールS10に対応するニューラルネットNo.と適合度DSUの値を登録する。適合度DSUの演算は(14)式にて行う。
閾値TSが大きいほど適合度が1となる割合が増え、閾値TSが小さいほど適合度が0となる割合が増えるので、後述する制御ルール更新判断結果が閾値TSによって大きく変化する。制御ルールを短いスパンで更新したい場合は閾値TSを小さい値に設定するなど、プラントの操業に合わせて柔軟に設定する必要がある。
その後制御出力誤差演算部252は、制御ルール更新評価指示部253へ処理実行指示S2504を出力する。制御ルール更新評価指示部253は、制御出力誤差演算部252からの処理実行指示を受けて、ニューラルネットNo.を含む処理実行指示S12を制御ルール更新評価部26へ出力する。
図18は制御ルール更新評価部26の構成を示す。制御ルール更新評価部26は、制御ルール適合度評価部25からニューラルネットNo.を含む処理実行指示S12を受け取ったタイミングで処理を実行する。制御ルール更新要否判定部261は、処理実行指示S12に含まれるニューラルネットNo.について、一定期間(担当オペレータ毎の操作のばらつきを抑制するために、オペレータのシフトが一巡する期間、例えば一週間)の適合度DSUを制御ルール評価値データベースDB5から取得し(S13a)、その平均値UEVを演算し、制御ルール評価値データベースDB5へ登録する(S14a)。演算式を(15)式にて示す。
ここで一定期間分のデータ数をWとする。
平均値UEVが閾値TU以下となった場合、制御ルール更新要否フラグRUFを1とし、それ以外の場合は制御ルール更新要否フラグRUFを0として制御ルール評価値データベースDB5に登録する。ただし適合度DSUが一定期間分蓄積されていない場合、制御ルール更新要否フラグRUF算出演算を実行しない。演算式を(16)式にて示す。
制御ルール更新要否フラグの演算結果は閾値TUの設定によって変化する。このため、制御ルールの更新頻度を下げたい場合は閾値TUを小さい値に設定するなど、プラントの操業に合わせて柔軟に設定する必要がある。
その後制御ルール更新要否判定部261は、制御ルール更新優先度更新部262へ処理実行指示S2601を出力する。制御ルール更新優先度更新部262は、処理実行指示S2601を受けて、制御ルール評価値データベースDB5に登録されているニューラルネットNo.毎の制御ルール更新優先度を読み出し(S13b)、更新する(S14b)。制御ルール更新優先度は、制御ルール評価値データベースDB5に登録されている平均値UEVが小さいニューラルネットNo.から順に1,2,3,・・・と自然数を割付けていく。
図19は制御ルール評価値データベースDB5の詳細を示す。制御ルール評価値データベースDB5は、例えばテーブル形式で、ニューラルネットNo.に対して、制御ルール更新要否フラグRUF、制御ルール更新優先度、平均値UEV、各適合度DSUおよびそれらの演算実行日時を対応付けて登録する。
図20は制御ルール更新処理管理部24の概要を示す。制御ルール更新処理管理部24は、制御ルール評価値データベースDB5から制御ルール更新優先度が最も高い制御ルールに該当するニューラルネットNo.S15を取得し、制御ルール学習部11へ処理実行指示S16を与える。ただし処理実行指示S16は、制御ルール学習部11の実行処理を担う制御処理計算機23の計算機負荷情報S17(例えばCPU負荷やメモリ使用率等)から、制御処理計算機23の計算機負荷が低い場合、および/または、実績データSiを参照して制御対象プラントが更新対象の制御モデルを圧延に使用している状況でないことを確認できた場合に限定する。これは制御処理計算機23に過剰な負荷が掛かることによって制御実行装置20の処理に遅延が発生し、制御対象プラントへの制御出力タイミングが遅延することを防ぎ、また、操業中に制御ルールが変更されることを防ぐためである。制御ルール更新可否判断部241から制御ルール学習部11へ処理実行指示S16が送信された後、制御ルール更新可否判断部241から制御ルール更新完了処理部242へニューラルネットNo.S15を含む処理実行指示S2401が出力される。制御ルール更新完了処理部242は、処理実行指示S2401を受信すると、制御ルール評価値データベースDB5に登録されているニューラルネットNo.S15に紐づく情報を全て削除する。
以上により、制御対象プラント1である圧延機の形状を大きく乱すことなく、
1)基準形状パターンと、それに対する制御操作を予め別々に設定し、制御操作方法を学習していくのではなく、形状パターンと制御操作の組合せを学習し、それを用いて制御操作を実施する。
2)新たな制御ルールは、予め予想できるものでは無く、全く予測できなかった制御ルールが最適となる場合も有る事から、ランダムに制御操作端を動作させ、それに対する制御結果を見ながら見つけていく。
事が実現できる。
1)基準形状パターンと、それに対する制御操作を予め別々に設定し、制御操作方法を学習していくのではなく、形状パターンと制御操作の組合せを学習し、それを用いて制御操作を実施する。
2)新たな制御ルールは、予め予想できるものでは無く、全く予測できなかった制御ルールが最適となる場合も有る事から、ランダムに制御操作端を動作させ、それに対する制御結果を見ながら見つけていく。
事が実現できる。
なお、制御ルール評価値データベースDB1には、制御実行装置20で使用するニューラルネットが格納されるが、格納されるニューラルネットが、乱数でイニシャル処理を実施しただけのものだと、ニューラルネットの学習が進行し、それなりの制御が可能となるまで時間がかかる。そのため、制御対象プラント1に対して、制御部を構築した時に、その時点で判明している制御対象プラント1の制御モデルに基づき、予めシミュレーションにて、制御ルールの学習を実施し、シミュレータでの学習が完了したニューラルネットをデータベースに格納しておく事で、制御対象プラントの立上げ当初から、ある程度の性能の制御を実施する事が可能である。
図21は、制御実行装置20、制御方法学習装置21、制御ルール更新判断装置22、制御処理計算機23、およびこれらを適宜統合したシステムの各システムを実現するコンピュータ500のハードウェアの概要を示す図である。コンピュータ500では、CPUなどのプロセッサ510、RAM(Random Access Memory)などのメモリ520、SSD(Solid State Drive)やHDD(Hard Disk Drive)などのストレージ530、ネットワークI/F(Inter/Face)540、入出力装置550(例えばキーボード、マウス、タッチパネル、ディスプレイ等)、および周辺装置560が、バスを介して接続されている。
コンピュータ500において、各システムを実現するための各プログラムがストレージ530から読み出されプロセッサ510およびメモリ520の協働により実行されることで、各システムが実現される。あるいは、各システムを実現するための各プログラムは、ネットワークI/F540を介した通信により外部のコンピュータから取得されてもよい。あるいは各プログラムは、非一時的記録媒体に記録され、媒体読み取り装置によって読み出されることで取得されてもよい。
なお本発明装置を実プラントに適用するに当たり、ニューラルネットの初期値を定めておく必要があるが、この点に関して実績データと制御操作の組合せを、制御対象プラントでの制御を実施する前に、制御対象プラントの制御モデルを用いてシミュレーションにより作成し、制御対象プラントにおける実績データと制御操作の組合せの学習期間を短縮するのがよい。
本発明は上述の実施形態に限定されるものではなく、様々な変形例を含む。例えば、上述の実施形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、矛盾しない限りにおいて、ある実施形態の構成の一部を他の実施形態の構成で置き換え、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、構成の追加、削除、置換、統合、または分散をすることが可能である。また実施形態で示した構成および処理は、処理効率あるいは実装効率に基づいて適宜分散、統合、または入れ替えることが可能である。
1:制御対象プラント、20:制御実行装置、21:制御方法学習装置、22:制御ルール更新判断装置、23:制御処理計算機、500:コンピュータ
Claims (17)
- 制御対象プラントの制御を実施するプラント制御システムであって、
前記制御対象プラントの実績データと制御操作の組合せに基づいて制御ルールを学習する制御方法学習装置と、
前記制御方法学習装置によって学習された前記制御ルールに基づいて前記制御対象プラントの制御を実施する制御実行装置と、
前記制御ルールに基づいて前記制御対象プラントの制御を実施した際の前記実績データに基づいて前記制御対象プラントに対する該制御ルールの適合度を演算し、該適合度に基づいて該制御ルールを更新する制御ルール更新判断装置と
を備えたことを特徴とするプラント制御システム。 - 請求項1に記載のプラント制御システムであって、
前記制御ルール更新判断装置は、
所定の各タイミングにおける前記適合度を演算する制御ルール適合度評価部と、
直近の所定期間の前記所定の各タイミングにおける前記適合度に基づいて、前記制御ルールの更新要否および更新優先度を判定する制御ルール更新評価部と、
前記更新要否および前記更新優先度に基づいて前記制御ルールの更新指示を出力する制御ルール更新処理管理部と
を備えたことを特徴とするプラント制御システム。 - 請求項2に記載のプラント制御システムであって、
前記制御ルール更新評価部は、
前記直近の所定期間の前記所定の各タイミングで演算された前記適合度と所定基準値との比較結果に基づいて前記更新要否を判定する
ことを特徴とするプラント制御システム。 - 請求項2に記載のプラント制御システムであって、
前記制御ルール適合度評価部は、
前記制御ルールに基づいて前記制御対象プラントの制御を実施した際の制御出力と前記実績データに含まれる制御出力との出力誤差が、閾値以下である場合に該制御ルールが該制御対象プラントに対して適合していると判断して前記適合度を1とし、閾値より大である場合に該制御ルールが該制御対象プラントに対して適合していないと判断して前記適合度を0とし、
前記制御ルール更新評価部は、
前記直近の所定期間の前記所定の各タイミングで演算された前記適合度の平均に基づいて前記更新要否および前記更新優先度を判定する
ことを特徴とするプラント制御システム。 - 請求項2に記載のプラント制御システムであって、
前記制御ルール更新処理管理部は、
前記制御対象プラントで更新対象の前記制御ルールを前記制御実行装置で使用している状況でないことを条件として前記更新指示を出力する
ことを特徴とするプラント制御システム。 - 請求項5に記載のプラント制御システムであって、
前記制御実行装置および前記制御方法学習装置が稼働する制御処理計算機が所定の高負荷状態でないことを条件として前記更新指示を出力する
ことを特徴とするプラント制御システム。 - 請求項1に記載のプラント制御システムであって、
前記制御実行装置は、
制御対象プラントの実績データと制御操作の定められた組合せに従って制御出力を与える制御ルール実行部と、
該制御ルール実行部が出力する制御出力の可否を判定するとともに、当該実績データと制御操作が誤りである事を前記制御方法学習装置に通知する制御出力判定部と、
該制御出力判定部が、制御出力を前記制御対象プラントに出力した場合、前記制御対象プラントの前記実績データが悪化すると判断した場合は、制御出力を前記制御対象プラントに出力することを阻止する制御出力抑制部と、を備え、
前記制御方法学習装置は、
前記制御実行装置が制御出力を実際に、制御対象プラントに出力した場合に、制御効果が実績データに表れるまでの時間遅れ後に、実績データが制御前に比較して良くなったか、悪くなったかについての制御結果の良否を判定する制御結果良否判定部と、該制御結果良否判定部における制御結果の良否と、前記制御出力をもちいて教師データを得る学習データ作成部と、前記実績データと前記教師データを学習データとして学習する制御ルール学習部と、を備え、
前記制御方法学習装置が学習する事で、前記制御対象プラントの状態に応じて複数の制御目標に対して別個の実績データと制御操作の組合せを得、得られた実績データと制御操作の組合せを前記制御ルール実行部における制御対象プラントの実績データと制御操作の定められた組合せとして使用することを特徴とするプラント制御システム。 - 請求項7に記載のプラント制御システムであって、
制御対象プラントの実績データの大小に応じて、実績データと制御操作の組合せを替える為、実績データの大小に関する情報と、実績データを規格化しパターン認識を実施しやすくする情報を用いて、実績データと制御操作の組合せを学習し、制御する事を特徴とするプラント制御システム。 - 請求項7、または請求項8に記載のプラント制御システムであって、
前記制御ルール実行部は、制御対象プラントの実績データと制御操作の定められた組合せを第1のニューラルネットとして保持し、前記制御ルール学習部は、実績データと制御操作の組合せを第2のニューラルネットとして保持し、前記制御方法学習装置における学習の結果得られた第2のニューラルネットを前記制御ルール実行部における前記第1のニューラルネットとして使用することを特徴とするプラント制御システム。 - 請求項7から請求項9のいずれか1項に記載のプラント制御システムであって、
前記制御実行装置は、前記制御出力に外乱を与える制御操作外乱発生部を備え、前記制御方法学習装置は、外乱を印加されたときも含めて学習することを特徴とするプラント制御システム。 - 請求項7から請求項10のいずれか1項に記載のプラント制御システムであって、
前記制御方法学習装置は、予め定められた複数の仕様のもとでの学習により、実績データと制御操作の複数の組合せを得ており、前記制御実行装置は、実績データと制御操作の複数の組合せの中から制御対象プラントの運転状態に応じて1つの実績データと制御操作の複数の組合せを選択し前記制御出力を与えることを特徴とするプラント制御システム。 - 請求項9に記載のプラント制御システムであって、
実績データの大小に応じて、使用する実績データと操作方法の組合せを学習するニューラルネットを変更する事を特徴とするプラント制御システム。 - 請求項7から請求項12のいずれか1項に記載のプラント制御システムであって、
前記制御対象プラントの状態、または制御対象プラントの操作員の経験等にもとづき、制御結果の良否判定基準を変更し、制御対象プラントに対する実績データと操作法の関係をそれぞれ求め、データベースにそれぞれ格納する事で、前記制御対象プラントの状態、または制御対象プラントの操作員の経験等に応じて、異なる制御方法で制御する事を特徴とするプラント制御システム。 - 請求項7から請求項13のいずれか1項に記載のプラント制御システムであって、
前記実績データと制御操作の組合せを、制御対象プラントでの制御を実施する前に、制御対象プラントの制御モデルを用いてシミュレーションにより作成し、制御対象プラントにおける前記実績データと制御操作の組合せの学習期間を短縮する事を特徴とするプラント制御システム。 - 請求項7から請求項14のいずれか1項に記載のプラント制御システムを適用した圧延機制御装置であって、
前記制御対象プラントは、圧延機であり、前記実績データは前記圧延機の出側形状であることを特徴とする圧延機制御装置。 - 制御対象プラントの制御を実施するプラント制御システムが実行するプラント制御方法であって、
前記プラント制御システムの制御方法学習装置が、前記制御対象プラントの実績データと制御操作の組合せに基づく制御ルールを学習し、
前記プラント制御システムの制御実行装置が、前記制御方法学習装置によって学習された前記制御ルールに基づいて前記制御対象プラントの制御を実施し、
前記プラント制御システムの制御ルール更新判断装置が、前記制御ルールに基づいて前記制御対象プラントの制御を実施した際の前記実績データに基づいて前記制御対象プラントに対する該制御ルールの適合度を演算し、該適合度に基づいて該制御ルールを更新する
各処理を含んだことを特徴とするプラント制御方法。 - 請求項1から請求項15のいずれか1項に記載のプラント制御システムまたは圧延機制御装置としてコンピュータを機能させるためのプラント制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021091321A JP2022183827A (ja) | 2021-05-31 | 2021-05-31 | プラント制御システム、圧延機制御装置、プラント制御方法、及びプラント制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021091321A JP2022183827A (ja) | 2021-05-31 | 2021-05-31 | プラント制御システム、圧延機制御装置、プラント制御方法、及びプラント制御プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022183827A true JP2022183827A (ja) | 2022-12-13 |
Family
ID=84437951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021091321A Pending JP2022183827A (ja) | 2021-05-31 | 2021-05-31 | プラント制御システム、圧延機制御装置、プラント制御方法、及びプラント制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022183827A (ja) |
-
2021
- 2021-05-31 JP JP2021091321A patent/JP2022183827A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6899273B2 (ja) | プラント制御装置およびその制御方法、圧延機制御装置およびその制御方法並びにプログラム | |
CN113064879B (zh) | 数据库参数调整方法、装置及计算机可读存储介质 | |
JP6813416B2 (ja) | プラント制御装置およびその制御方法、圧延機制御装置およびその制御方法並びにプログラム | |
JP5970034B2 (ja) | 因果分析で使用する特徴抽出プログラムと装置 | |
JP2019087152A (ja) | 製造プロセスの状態予測装置、方法及びプログラム、並びに製造プロセスの制御システム | |
JP7034046B2 (ja) | 制御装置および制御方法 | |
GB2600213A (en) | Plate performance prediction method and apparatus | |
JP2012081518A (ja) | 厚鋼板の冷却制御方法、冷却制御装置及び厚鋼板の製造方法 | |
CN114143326A (zh) | 负载调节方法、管理节点以及存储介质 | |
JP7033639B2 (ja) | プラント制御装置およびその制御方法、圧延機制御装置およびその制御方法並びにプログラム | |
CN112990420A (zh) | 一种用于卷积神经网络模型的剪枝方法 | |
JP2022183827A (ja) | プラント制御システム、圧延機制御装置、プラント制御方法、及びプラント制御プログラム | |
CN109829115B (zh) | 搜索引擎关键词优化方法 | |
JP7328142B2 (ja) | プラント制御装置およびその制御方法、圧延機制御装置およびその制御方法並びにプログラム | |
JP6952018B2 (ja) | 制御装置および制御方法 | |
JP7495874B2 (ja) | プラント制御システム、プラント制御方法及びプログラム | |
JP7535475B2 (ja) | プラント制御システム、プラント制御方法及びプログラム | |
Roslan et al. | Mathematical model on relationship between expenditure in education and household income group in Malaysia | |
JP7452443B2 (ja) | 圧延モデルの学習方法 | |
CN115202591B (zh) | 一种分布式数据库系统的存储装置、方法及存储介质 | |
JP5415872B2 (ja) | 層別テーブル数値演算装置および該方法、該装置および該方法を備える制御装置および制御方法ならびに圧延システム | |
Verstraete et al. | Data Comparison | |
CN117474223A (zh) | 一种智慧数字化平台的工单管理方法及系统 | |
JP2020166599A (ja) | 運転計画支援装置、運転計画支援方法及び運転計画支援プログラム | |
CN116776629A (zh) | 一种综合耦合度模型与n-k模型的系统效能分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240226 |