JP7111761B2 - プラント運転最適化支援装置、プラント運転最適化制御装置並びに方法 - Google Patents

プラント運転最適化支援装置、プラント運転最適化制御装置並びに方法 Download PDF

Info

Publication number
JP7111761B2
JP7111761B2 JP2020041671A JP2020041671A JP7111761B2 JP 7111761 B2 JP7111761 B2 JP 7111761B2 JP 2020041671 A JP2020041671 A JP 2020041671A JP 2020041671 A JP2020041671 A JP 2020041671A JP 7111761 B2 JP7111761 B2 JP 7111761B2
Authority
JP
Japan
Prior art keywords
signal
state
plant
sensitivity
operating state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020041671A
Other languages
English (en)
Other versions
JP2021144391A (ja
Inventor
勇也 徳田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2020041671A priority Critical patent/JP7111761B2/ja
Priority to PCT/JP2021/004672 priority patent/WO2021181979A1/ja
Priority to DE112021000080.2T priority patent/DE112021000080T5/de
Priority to CN202180004995.7A priority patent/CN114258513B/zh
Priority to US17/635,805 priority patent/US20220326694A1/en
Publication of JP2021144391A publication Critical patent/JP2021144391A/ja
Application granted granted Critical
Publication of JP7111761B2 publication Critical patent/JP7111761B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0205Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
    • G05B13/024Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS], computer integrated manufacturing [CIM]
    • G05B19/41835Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS], computer integrated manufacturing [CIM] characterised by programme execution
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/37Measurements
    • G05B2219/37591Plant characteristics

Description

本発明は低い計算負荷でプラント運転の支援及び運転を最適化するプラント運転最適化支援装置、プラント運転最適化制御装置並びに方法に関する。
各種プラントにおいては、そのプラント効率を最大化した運転とすべくプラント運転最適化制御装置を構成する傾向にあり、例えば特許文献1のプラント運転最適化制御装置は、「制御対象プロセスの操作量、外乱、及び制御量を含む状態量を入力とし制御量を出力とするニューラルネットワークモデルにより制御すべき時点から先の各制御量の変化を予測する制御量変化予測手段と、前記制御すべき時点の前記状態量により、これから先に与える各前記操作量の変化量に対する各前記制御量の変化量の感度を計算する制御量感度計算手段と、該制御量感度計算手段による計算によって得られた感度行列を用いて、前記変化予測手段により予測される各前記制御量が所定の目標値に可及的に一致し且つ各前記操作量の変化量が可及的に小さく成るように最適化計算して各操作量を決定する最適化計算・決定手段と、を備え、該最適化計算・決定手段によって決定された各前記操作量を前記制御対象プロセスの前記操作量として外部に出力することを特徴とする多変数モデル予測制御装置。」のように構成されている。
特開2002-157003号
特許文献1に開示されたプラント運転最適化制御装置によれば、プラントの運転効率を高く維持しながら運転することが可能となる。しかしながら、計算機装置を用いて実現するときには、計算機負荷が大きいという課題がある。これは特許文献1では、プラントのすべてのセンサ信号を入力として、常時取り扱っていることが影響している。産業プラント分野では効率向上を目的に、機械学習による最適制御技術の適用を試行しており、制御量の計算に要する負荷の低減が求められている。
また制御量の計算に要する負荷の低減を図りながら、高感度なセンサ情報量の抽出、低頻度な運転(特殊運転)でも高感度な信号を縮約後にも保持できること、プラント状態変化への追従が可能であることなどが具体的な課題として望まれている。
このことから本発明においては、プラントの全センサ信号から、制御目標の達成に必須な信号を自律的に抽出することで、計算負荷を低減することができるプラント運転最適化支援装置、プラント運転最適化制御装置並びに方法を提供することを目的としている。
以上のことから本発明においては、「プラントに与えた操作量信号とプラントで検出したプロセス信号を入力信号として入力する入力部と、操作量信号に対するプロセス信号の時間変化分を感度信号として求める感度推定部と、入力信号からプラントの運転状態を区分して運転状態信号を与えるとともに、区分された運転状態ごとに感度信号の中から高感度を示す感度信号を状態別高感度信号として抽出する信号分類部を備えることを特徴とするプラント運転最適化支援装置」としたものである。
また本発明においては、「プラントに与えた操作量信号とプラントで検出したプロセス信号を入力信号として入力する入力部と、操作量信号に対するプロセス信号の時間変化分を感度信号として求める感度推定部と、入力信号からプラントの運転状態を区分して運転状態信号を与えるとともに、区分された運転状態ごとに感度信号の中から高感度を示す感度信号を状態別高感度信号として抽出する信号分類部と、状態別高感度信号を入力として、プラントの高効率運転状態を目標状態としたときの、この目標状態に遷移するためのプラント制御における制御則を定めて制御則信号として与える制御則最適化部と、運転状態信号のときの状態別高感度信号から求めた制御則を用いてプラントに与える操作量信号を定める制御装置を備えることを特徴とするプラント運転最適化制御装置」としたものである。
また本発明においては、「プラントに与えた操作量信号とプラントで検出したプロセス信号を入力信号として入力し、操作量信号に対するプロセス信号の時間変化分を感度信号として求め、入力信号からプラントの運転状態を区分して運転状態信号を与えるとともに、区分された運転状態ごとに感度信号の中から高感度を示す感度信号を状態別高感度信号として抽出することを特徴とするプラント運転最適化支援方法」としたものである。
また本発明においては、「プラントに与えた操作量信号とプラントで検出したプロセス信号を入力信号として入力し、操作量信号に対するプロセス信号の時間変化分を感度信号として求め、入力信号からプラントの運転状態を区分して運転状態信号を与えるとともに、区分された運転状態ごとに感度信号の中から高感度を示す感度信号を状態別高感度信号として抽出し、状態別高感度信号を用いて、プラントの高効率運転状態を目標状態としたときの、この目標状態に遷移するためのプラント制御における制御則を定めて制御則信号として与え、運転状態信号のときの状態別高感度信号から求めた制御則を用いてプラントに与える操作量信号を定めることを特徴とするプラント運転最適化制御方法」としたものである。
プラントの全センサ信号から、制御目標の達成に必須な信号を自律的に抽出することで、計算負荷を低減することができるプラント運転最適化支援装置、プラント運転最適化制御装置並びに方法を提供することができる。
本発明の実施例1に係るプラント運転最適化制御装置の構成例を示す図。 運転状態と感度信号の関係を例示した図。 本発明の実施例1の処理における一連の手順を示すフロー図。 本発明の実施例2に係るプラント運転最適化制御装置の構成例を示す図。 本発明の実施例2の処理における一連の手順を示すフロー図。 本発明の実施例3に係るプラント運転最適化制御装置の構成例を示す図。 情報の表示装置への表示事例を示す図。 モデルの形式が状態遷移確率行列Tであった場合の一例を示す図。 (1)式の処理を模式的に示した図。 将来状態予測演算部B21で演算した減衰型状態遷移行列Dを画面に表示した場合の一例を示す図。 報酬関数がベクトル形式の場合の一例を示す図。 状態価値関数Vの一例を示す図。 (4)式の計算結果の一例を示す図。 制御則の一例を示す図。
以下,本発明の実施例について、図面を用いて説明する。
図1は、本発明の実施例1に係るプラント運転最適化制御装置の構成例を示す図である。図1において、プラント運転最適化制御装置100は、プラント104から入力信号Sg1を入力し、最終的にプラント内の図示せぬプラント機器に対して操作量信号(制御量信号)Sg6を与える。ここで、入力信号は、プラント機器に対して与えた操作量信号Sg6やプラン各部のセンサで検知したプロセス信号を含んでいる。
プラント運転最適化制御装置100は、情報量縮約装置101と制御則最適化部116及び制御装置120を主要な構成要素として備えており、これらからの信号Sg4,Sg5により制御装置120がプラント内の図示せぬプラント機器に対する操作量信号Sg6を定める。
なお、図1において本発明をプラント運転最適化支援装置として構成することもできる。この場合には、情報量縮約装置101、あるいはさらに制御則最適化部116が与える各種のデータをモニタなどの表示装置を介して利用者に提示する構成とすればよく、制御装置120は、提示されたデータを自ら判断して選択した情報を用いて制御装置120に反映し、運転することで、間接的にプラント104の最適化運転を可能とする。
情報量縮約装置101は、感度推定部109と信号分類部110により構成されている。このうち感度推定部109では、プラント104に外乱(プラント入力)として与えた操作量信号Sg6に対するプラント出力としてのプロセス信号の関係を時間変化分、つまり感度信号として抽出する。これは例えば操作量信号Sg6をx、プロセス信号をy、時刻をtとしたとき、dyt/dxtを時刻tにおける感度信号として求めたものである。感度信号はプラントの想定可能な入出力関係に基づいて多様に準備しておくのがよい。
信号分類部110は、プラント104の運転状態をクラスタリングなどの統計手法により複数の運転状態に分類する。これは例えばボイラプラントであれば、昇速段階、負荷増加段階、負荷一定運転段階、負荷減少段階などの運転状態が例示できるが、区分される運転状態はこれに限られたものではない。また本発明において運転状態の区分は、クラスタリング手法によらず、適宜の手法で行われればよい。
図2は、運転状態と感度信号Sg2の関係を例示している。ここでは横軸にプラントの運転状態を示し、縦軸に感度信号を例示している。横軸のプラントの運転状態として、この例では通常運転状態201、通常運転状態203、特殊運転状態202を例示している。なお特殊運転状態とは、通常運転状態に比較して発生頻度が少ない運転状態を表している。
図2は、プラント状態に応じて信号の感度Sg2が変動することを示している。プラントが通常運転状態201の範囲内にある場合は信号Sg22の感度が高く、特殊運転状態202では信号Sg23、通常運転状態203では信号Sg21の感度が高い。また発生頻度の低い特殊運転状態202で高い感度を持つ信号Sg23は発生頻度の高い他の運転では感度が低いという傾向があることを表している。そのため、従来の感度分析手法では、信号Sg23の感度の順位は低く、情報縮約後の信号として選定される可能性も低いことになる。本発明では、各時刻tにおける感度dy/dxを計算するため、発生頻度の低い特殊運転状態で感度の高い信号を抽出できる。
信号分類部110においては、以上のことから、判別した運転状態を意味する運転状態クラスタ信号Sg4と、この運転状態で高い感度を示す状態別高感度信号Sg3を抽出する。なお選択する状態別高感度信号Sg3は、1つには限らず高感度の複数のものを選択してもよい。これらの運転状態クラスタ信号Sg4と、この運転状態で高い感度を示す状態別高感度信号Sg3の組み合わせは、適宜のデータベースに保存され、この結果過去の運転状態を反映して、逐次データベース内容は豊富化される。この中には、発生頻度が低い運転状態の時の状態別高感度信号Sg3の情報も含まれている。
このようにして情報量縮約装置101は、現在の運転状態とこの時の高感度信号を与えているので、取り扱う情報量は全プロセス量の中から選別されたものであり、情報を縮約する機能を備えたものということができる。
制御則最適化部116は、プラントの特性を模擬するモデル機能を備えたものであり、この運転状態で高い感度を示す状態別高感度信号Sg3を入力して、この時の最適化された制御則を定める。ここで制御則とは、例えばプラントの操作量を意味している。状態別高感度信号Sg3から求めた操作量とすべくプラントを運転することは、プラント入力が最小でプラント出力を最大とすることを意味しており、もって高効率運転が実現できることになる。制御則最適化部116の具体的な実現手法例について、実施例4で詳細に説明する。
制御装置120は、制御則最適化部116で求めた制御則信号Sg5と、信号分類部110で求めた運転状態クラスタ信号Sg4と、プロセス信号Sg1を入力とする制御部である。一般的に制御装置120は、例えば比例積分調節機能やシーケンサなどにより構成されており、所定の与えられた目標信号に対してプロセス信号Sg1を帰還信号あるいは補正信号として用いて、プラント機器に対する操作量信号Sg6を定めている構成のものである。これに対し本発明の制御装置120は、運転状態クラスタ信号Sg4により現在の運転状態を把握し、この運転状態の時の最適化された制御則信号Sg5を入力して、制御装置120の各部に作用し、操作量信号Sg6を制御則信号Sg5に従った最適値に修正する。なお、制御装置各部への作用の仕方としては、最適な設定値に修正する、最適な調節機能とすべく時定数やゲインを修正する、バイアス信号を印加するなどが考えられる。
図3は、本発明の実施例1の処理における一連の手順を示すフロー図である。この図において、各処理ステップの右側には、この機能を実行する図1の各部装置を記述している。この処理によれば、まず処理ステップS1201においてプロセス信号などの入力信号Sg1を入力し、処理ステップS1202において時系列的に感度信号に変換する。処理ステップS1203では、判別した運転状態を意味する運転状態クラスタ信号Sg4と、この運転状態で高い感度を示す状態別高感度信号Sg3を抽出する。
制御則最適化部116に対応する処理ステップS1204では、状態別高感度信号Sg3からこの状態の時の最適な制御則信号Sg5を計算するとともに、処理ステップS1205では運転状態に応じて適宜制御則を更新している。
制御装置120に対応する処理ステップS1206からS1028では、まず処理ステップS1206においてプラント運転中であることを判定し、プラント運転中であるときは処理ステップS1207でプロセス信号などを読み込み、処理ステップS1208で制御則に対応した操作量信号を算出して、プラント104に与える。
上記の実施例1によれば、センサ情報量の縮約により計算機負荷が低減でき、発生頻度が少ない特殊運転にも必要なセンサ情報を保持することができ、かつプラント状態変化に応じて最適な制御則へ切り替え運用することが可能となる。
実施例1では、情報量縮約装置101内の感度推定部109における、感度の種別は予め利用者が事前設定しておくという前提である。つまり、多数のプラント入力と多数のプロセス信号について、どの組み合わせの時間変化分を監視の対象とすべきかは、事前把握され、予め設定されていたという前提であった。
これに対し、実施例2では、この組み合わせの抽出も自動化したものである。実施例2に係るプラント運転最適化制御装置の構成例を示す図4は、情報量縮約装置101内に新たに挙動モデル学習部108を追加した点を除いて、実施例1と同じ構成のものである。
挙動モデル学習部108では、操作量信号Sg6および操作前後のプロセス信号Sg1の関係を、ニューラルネットワークなどを用いて事前に学習する。これにより、入出力の相関が高い入力と出力の組み合わせ111が、自動的に作成できることになる。ニューラルネットワークで得た関係性を用いて自動微分が計算できるため、この特性を用いて信号感度推定部109では各時刻tにおける感度dy/dxを計算する。なお挙動モデル学習部108は、すべての組み合わせを提示するものであってもよいが、感度推定部109における計算機負荷が増大することになる。
図5は、本発明の実施例2の処理における一連の手順を示すフロー図である。図3の処理フローとの差異は、処理ステップS1201は挙動モデル学習部108と信号感度推定部109の両方で実行される点と、処理ステップS1202の前に処理ステップS1209が追加された点である。処理ステップS1209では、挙動モデル学習部108にて操作量信号Sg6および操作前後のプロセス信号Sg1の関係を学習する。
実施例1、実施例2のプラント運転最適化制御装置100は、主に最適化制御の観点からの装置構成、処理内容などを説明しているが、実際には利用者の立場からの装置構成、利用体制とすべきであり、実施例3ではこの点について説明する。
この前提として、実施例1、実施例2のプラント運転最適化制御装置100には、適宜のデータベースが構成され、各部入力データ、中間成果物データ、最終成果物データが適切に保存されるべきである。図6の構成では、入力データデータベースDB1に入力信号Sg1を蓄積し、中間成果物データデータベースDB2,DB3,DB4,に感度信号Sg2,状態別高感度信号Sg3、運転状態クラスタ信号Sg4をそれぞれ蓄積し、最終成果物データデータベースDB5には制御則信号Sg5が蓄積される。なお図示例では表記の都合上、各種データベースDBがプラント運転最適化制御装置100の範囲外に記述されているが、これは範囲内に置かれてもよいことは言うまでもない。
制御室105内の利用者は、これらのデータベースDBからの各種信号を入力し、モニタ画面などに適宜の表示形式の情報提供によりプラントの現状をより的確に把握することができる。
図7は、これら情報の表示装置への表示事例を示す図であり、表示装置101の表示画面102には、縦軸に運転状態クラスタ信号Sg4で定まるクラスタ、横軸側に状態別高感度信号Sg3を感度の種別(信号名)や数値とともに表示している。なお、クラスタについて、その内容を示す情報として運転状態の範囲などが例示されているのがよい。
実施例4では、制御則最適化部116の具体的な実現手法例について、説明する。
図1の制御則最適化部116では、高効率データ(状態別高感度信号Sg3)を用いて求めたプラントの高効率運転状態を目標状態としたときの、この目標状態に遷移するための制御則を定める。ここで制御則とは、各操作条件の操作量を意味している。制御則最適化部116は、将来状態予測演算部B21と制御則算出部B22により構成されている。以下、制御則最適化部116の処理内容について詳細に説明する。
制御則最適化部116においては、まず将来状態予測演算部B21で高効率データ(状態別高感度信号Sg3)の各点(例えばS1)が別の各点(例えばS2)に遷移する確率を求める、いわゆる状態遷移確率行列の処理を行う。ここでは高効率データ群の各点sは、一般的には「状態」として把握されている。また状態遷移確率処理は、将来状態予測演算を行うものということができる。将来状態予測演算では、モデルデータ(プラントの高効率運転の観点から選択された状態のデータ)を用いた減衰型状態遷移行列を計算する。またここでは、将来状態の予測対象とする物体や現象を模擬対象と呼ぶこととし、本事例での模擬対象はプラントである。
本発明でのモデルの入力は模擬対象の状態と時間経過や、操作、外乱などの影響因子であり、出力は影響因子の影響を受けた後の模擬対象の状態であり、本発明ではこのモデルを状態遷移モデルと呼ぶこととする。また状態遷移モデルは、有限の状態空間内において、無限時間または無限ステップ先における模擬対象とその周辺環境の状態を確率密度分布の形式で表現している。
状態遷移モデルなどの保存形式の一例として、例えば状態遷移確率行列や、ニューラルネットワーク、動径基底関数ネットワーク、またはニューラルネットワークや動径基底関数ネットワークの重みが現されている行列が考えられるが、本発明は模擬対象のモデル保存形式をこれらの例に限定しない。
モデルの形式が状態遷移確率行列Tであった場合の一例を図8に示す。図8は、遷移元の状態si(i=1、2、・・・n)と遷移先の状態sj(j=1、2、・・・n)を縦横のマトリクスにして示しており、マトリクス内には状態遷移確率P(sj|si)を数値表示している。遷移確率行列Tは一般的に制御対象の運動特性や物理現象を模擬するモデルの一種であり、すべての状態間の遷移確率を保存する関数または行列)である。ここで、表の行が遷移元の状態si(i=1、2、・・・n)、列が遷移先の状態sj(j=1、2、・・・n)、要素Tijは事前に設定した刻み時間Δt(またはステップ)が経過した際に、状態が状態siから状態sjに遷移する確率P(sj|si)である。
図8は、遷移元の状態siのうちs1に着目したとき、経過時間Δt後における遷移先の状態sjにおいて、s1となる確率P(s1|s1)が0.5であり、s2となる確率P(s2|s1)が0.5であり、s3以降となる確率P(s3|s1)は0であることを表している。同様にs2に着目したとき、経過時間Δt後における遷移先の状態sjにおいて、s1となる確率P(s1|s2)が0であり、s2となる確率P(s2|s2)が0.25であり、s3となる確率P(s3|s2)は0.5であり、s4となる確率P(s4|s1)が0.25であることを示している。なお図8の表は、遷移元の状態と遷移後に移動する移動先の確率を示しているので、この表は確率密度分布の表とみることができる。確率密度分布は、例えば山状の形状を示す。
なお上記説明においては、状態遷移確率行列Tについて、経過時間Δtの前後の一断面のみを示す表Tijを例示しているが、実際にはさらに経過時間Δt刻みの表が連続的に存在して、モデルである状態遷移確率行列Tが形成されている。表Tijの経過時間Δt後の表がTt+1であり、さらに経過時間Δt後の表がTt+2である。
図8の例では状態sは全体を範囲に区切ってn分割した離散空間として扱っているが、ニューラルネットワーク、動径基底関数ネットワークなどを用いることで、状態sを連続空間としても扱うことができる。また、ニューラルネットワーク、動径基底関数ネットワークなどを用いる場合は、ニューロンへ入る入力信号の重み係数や、基底関数の重み係数
を要素値とした行列で状態遷移確率行列Tを代用しても良い。
将来状態予測演算部B21は、モデルデータから、減衰型状態遷移行列を計算し記録する。減衰型状態遷移行列を計算する方法の一例を、以下の(1)式に示す。なお、(1)式の例ではモデルの保存形式を状態遷移確率行列Tと仮定した。
Figure 0007111761000001
(1)式において、Dは減衰型状態遷移行列、γは減衰率とよぶ0以上で1未満の定数である。また、TkはΔt×kの時間が経過した際の、すべての状態間の遷移確率を保存する関数(または行列)である。
図9は、(1)式の処理を模式的に示した図であり、図8の経過時間Δtごとの複数の状態遷移確率行列Tijについて、経過時間Δtごとに減衰していく重み係数γを乗じ、その合計を算出したものである。なお図9において、複数の状態遷移確率行列Tijにおける遷移元の状態siと遷移先の状態sjを示す確率分布は、例えば山状の特性群として把握されている。
このように、減衰型状態遷移行列Dは、Δt時間経過後の状態遷移確率行列TからΔt×∞時間経過後の状態遷移確率行列T∞までの和であり、すべての状態間の統計的な近さを保存する行列でもある。また、遠い将来に遷移する状態ほど重みを下げるため、経過時間に応じて減衰率γの分を多く掛けている。
現時点における状態遷移確率行列Tから∞時間経過後における状態遷移確率行列T∞までの計算を必要とする(1)式は、実時間以内の計算が困難である。そこで(1)式を以下の(2)式に変換して実行するのがよい。(2)式は要するに、無限時間または無限ステップ先における模擬対象とその周辺環境の状態を確率密度分布の形式で推定するにあたり、状態遷移確率行列の級数と等価な計算を行うものである。
Figure 0007111761000002
(2)式において、Eは単位行列である。(2)式は(1)式と等価の計算式である。(1)式の状態遷移確率行列Tから状態遷移確率行列T∞までの和の計算を、(2)式では(E-γT)の逆行列に変換することによって、有限時間以内に(1)式と同じ計算結果が得られる。ここで、状態遷移確率行列Tが線形独立でない場合は、擬似逆行列を用いても良い。また、減衰型状態遷移行列Dの代わりに、減衰型状態遷移行列を各行で正規化した行列を用いても良い。
このように、模擬対象の挙動を模擬するモデルを状態遷移モデルとすることで、Tkの計算でΔt×k時間後の状態遷移確率を計算することが可能である。また、Δt時間経過後の状態遷移確率行列TからΔt×∞時間経過後の状態遷移確率行列T∞までの和をとり、経過時間によって減衰率γによる重み付けによって、Δt×∞時間経過後を考慮した状態遷移確率を、有限時間以内に計算することを可能とした。
図10は、将来状態予測演算部B21で演算した減衰型状態遷移行列Dを画面に表示した場合の一例である。図では、減衰型状態遷移行列Dを、移動元状態siと移動先状態sjによるマトリクス形式により画面に表示している。なお画面に表示するのは、減衰型状態遷移行列Dの代わりに、減衰型状態遷移行列Dを各行で正規化した行列でもよい。この表記によれば、例えば遷移元の状態s1が、そのまま遷移後の状態s1となる確率は0.14、遷移元の状態s1が、遷移後の状態s2となる確率は0.15、遷移後の状態s3となる確率は0.09、遷移後の状態s4となる確率は0.08、遷移後の状態s5となる確率は0.25となることを表している。
図1に戻り、制御則最適化部116内の制御則算出部B22は、将来状態予測演算部B21で求めた(2)式の減衰型状態遷移行列Dと、図9の報酬関数Rから、最適な制御則(最適な操作量a)を計算し記録する。
ここで報酬関数Rとは、目標位置や目標速度などの制御目標を関数、表、ベクトル、行列などの形式で表したものである。本発明ではこの制御目標の情報を有する関数、表、ベクトル、行列などを報酬関数Rと呼ぶこととする。報酬関数がベクトル形式の場合の一例を図11に示す。図11では、遷移元の状態IDごとに報酬関数Rを数値で表している。この図によれば、状態sは全体を範囲に区切ってn分割した離散空間として扱っており、初期の状態から状態s3へ遷移することを目標とした。ここでは目標とするベクトルの要素値は、状態s3を1、その他の状態を0とした。本発明では、このベクトルの要素値や、報酬関数Rの値を報酬と呼ぶこととする。なお制御における報酬としては、AIにおける強化学習の際の希望値或は目的関数が例示される。
これらの一連の処理は要するに、プラント運転の基準となる信号s(状態別高感度信号Sg3)を状態とし、信号sの時系列の変化から、状態遷移確率行列を作成するものである。このとき、状態遷移確率の算出時のみ、高効率の全データを用いる。次に、信号sを実現した操作条件に対する効率Y(報酬)を学習させ、状態遷移確率が所定値以上で、かつ効率Y(報酬)が最も高くなる状態を制御目標に定めることにしたものである。すなわち、効率が高かった実績ある条件に誘導するものである。
制御則算出部B22において、最適な制御則を計算する方法の一例を以下に示す。本例では、最適な制御則を求めるために以下の3段階で計算する。
段階1:先ず、各状態sと報酬関数Rで目標とする状態sgoalとの近さ(または遷移しやすさを示す統計的な指標)を保存する関数を計算する。この関数を本発明では状態価値関数Vと呼ぶこととする。また、状態価値関数Vは関数以外にも表、ベクトル、行列などの形式で保存してもよく、本発明において保存形式は限定しない。状態価値関数Vの
計算方法の一例を以下の(3)式に示す。
Figure 0007111761000003
上記(3)式に示すように、状態価値関数Vは減衰型状態遷移行列Dと報酬関数Rの積である。例えば、図8と図11に示したように、減衰型状態遷移行列Dがn×nの行列、報酬関数Rがn次元のベクトルの場合、状態価値関数Vは図12に示すようなn次元のベクトルとなる。状態価値関数Vの要素値は目標とする状態sgoalへ遷移しやすい状態ほど高い。本発明ではこの要素値を価値と呼ぶこととする。また、本発明の状態価値関数Vは、強化学習法での状態価値関数の定義と値が等価となる。
段階2:次に、状態価値関数Vを用いて、遷移元の状態siから遷移できる遷移先の状態sjの中で、最も目標とする状態sgoalへ遷移しやすい状態sj*を、遷移元の各状態siについて計算する。状態sj*の計算方法の一例を以下の(4)式に示す。
Figure 0007111761000004
ここでT(si、sj)とは、状態遷移確率行列Tにおけるsi行、sj列の要素値である。(4)式の計算結果の一例を図13に示す。図13では、遷移元の状態ID(si)ごとに遷移先の状態ID(sj)を表している。この図13によれば、遷移元の状態が状態s1の場合、状態遷移確率行列T(図8)において、遷移先となる得る状態は状態s1か状態s2の2つである。この2つの状態のうち、状態価値関数Vで価値が高いのは状態s2である。そのため図13の例において、遷移元の状態s1の遷移先の状態として状態s2が保存されている。
段階3:最後の段階では、遷移元の各状態siから、段階2で得られた状態sj*へ遷移するために必要な操作量aを計算する。操作量aの計算は、例えばプラントの逆モデル(遷移元の状態siと状態sj*を入力として、対応する操作量aを出力するモデル)を求めることで計算できる。段階3の計算結果としては、例えば図14に示したような制御則が得られる。
図14では、遷移元の状態ID(si)ごとに操作量IDを数値で表している。この図によれば、状態siは全体を範囲に区切ってn分割した離散空間として扱っており、各状態の範囲に対して最適な操作量ac(c=1、2・・・m)が保存されている。
このように上記(3)式で価値を計算することによって、各状態におけるsgoalへの遷移し易さが評価を可能とし、上記(4)式によってΔt時間経過によって遷移できる状態のうち最もsgoalへ遷移し易い状態sj*の特定を可能とし、逆モデルによって状態sj*へ遷移するための操作量aの特定を可能としている。
100:プラント運転最適化制御装置
101:情報量縮約装置
104:プラント104
109:感度推定部
110:信号分類部
116:制御則最適化部
120:制御装置120
Sg1:入力信号
Sg2:感度信号
Sg3:状態別高感度信号
Sg4:運転状態クラスタ信号
Sg5:制御則信号
Sg6:操作量信号(制御量信号)
B21:将来状態予測演算部
B22:制御則算出部

Claims (6)

  1. プラントに与えた操作量信号とプラントで検出したプロセス信号を入力信号として入力する入力部と、前記操作量信号に対する前記プロセス信号の時間変化分を感度信号として求める感度推定部と、前記入力信号から前記プラントの運転状態を区分して運転状態信号を与えるとともに、区分された運転状態ごとに前記感度信号の中から高感度を示す感度信号を状態別高感度信号として抽出する信号分類部を備えることを特徴とするプラント運転最適化支援装置。
  2. 請求項1に記載のプラント運転最適化支援装置であって、
    前記状態別高感度信号を入力として、プラントの高効率運転状態を目標状態としたときの、この目標状態に遷移するためのプラント制御における制御則を定めて制御則信号として与える制御則最適化部とを備えることを特徴とするプラント運転最適化支援装置。
  3. プラントに与えた操作量信号とプラントで検出したプロセス信号を入力信号として入力する入力部と、前記操作量信号に対する前記プロセス信号の時間変化分を感度信号として求める感度推定部と、前記入力信号から前記プラントの運転状態を区分して運転状態信号を与えるとともに、区分された運転状態ごとに前記感度信号の中から高感度を示す感度信号を状態別高感度信号として抽出する信号分類部と、前記状態別高感度信号を入力として、プラントの高効率運転状態を目標状態としたときの、この目標状態に遷移するためのプラント制御における制御則を定めて制御則信号として与える制御則最適化部と、前記運転状態信号のときの前記状態別高感度信号から求めた制御則を用いて前記プラントに与える前記操作量信号を定める制御装置を備えることを特徴とするプラント運転最適化制御装置。
  4. プラントに与えた操作量信号とプラントで検出したプロセス信号を入力信号として入力し、前記操作量信号に対する前記プロセス信号の時間変化分を感度信号として求め、前記入力信号から前記プラントの運転状態を区分して運転状態信号を与えるとともに、区分された運転状態ごとに前記感度信号の中から高感度を示す感度信号を状態別高感度信号として抽出することを特徴とするプラント運転最適化支援方法。
  5. 請求項4に記載のプラント運転最適化支援方法であって、
    前記状態別高感度信号を入力として、プラントの高効率運転状態を目標状態としたときの、この目標状態に遷移するためのプラント制御における制御則を定めて制御則信号として与えることを特徴とするプラント運転最適化支援方法。
  6. プラントに与えた操作量信号とプラントで検出したプロセス信号を入力信号として入力し、前記操作量信号に対する前記プロセス信号の時間変化分を感度信号として求め、前記入力信号から前記プラントの運転状態を区分して運転状態信号を与えるとともに、区分された運転状態ごとに前記感度信号の中から高感度を示す感度信号を状態別高感度信号として抽出し、前記状態別高感度信号を用いて、プラントの高効率運転状態を目標状態としたときの、この目標状態に遷移するためのプラント制御における制御則を定めて制御則信号として与え、前記運転状態信号のときの前記状態別高感度信号から求めた制御則を用いて前記プラントに与える前記操作量信号を定めることを特徴とするプラント運転最適化制御方法。
JP2020041671A 2020-03-11 2020-03-11 プラント運転最適化支援装置、プラント運転最適化制御装置並びに方法 Active JP7111761B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2020041671A JP7111761B2 (ja) 2020-03-11 2020-03-11 プラント運転最適化支援装置、プラント運転最適化制御装置並びに方法
PCT/JP2021/004672 WO2021181979A1 (ja) 2020-03-11 2021-02-08 プラント運転最適化支援装置、プラント運転最適化制御装置並びに方法
DE112021000080.2T DE112021000080T5 (de) 2020-03-11 2021-02-08 Unterstützungseinrichtung zur anlagenbetriebsoptimierung, steuerungseinrichtung zur anlagenbetriebsoptimierung und verfahren
CN202180004995.7A CN114258513B (zh) 2020-03-11 2021-02-08 设备运行优化辅助装置、设备运行优化控制装置及方法
US17/635,805 US20220326694A1 (en) 2020-03-11 2021-02-08 Plant operation optimization support device, plant operation optimization control device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020041671A JP7111761B2 (ja) 2020-03-11 2020-03-11 プラント運転最適化支援装置、プラント運転最適化制御装置並びに方法

Publications (2)

Publication Number Publication Date
JP2021144391A JP2021144391A (ja) 2021-09-24
JP7111761B2 true JP7111761B2 (ja) 2022-08-02

Family

ID=77671543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020041671A Active JP7111761B2 (ja) 2020-03-11 2020-03-11 プラント運転最適化支援装置、プラント運転最適化制御装置並びに方法

Country Status (5)

Country Link
US (1) US20220326694A1 (ja)
JP (1) JP7111761B2 (ja)
CN (1) CN114258513B (ja)
DE (1) DE112021000080T5 (ja)
WO (1) WO2021181979A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002157003A (ja) 2000-11-17 2002-05-31 Fuji Electric Co Ltd 多変数モデル予測制御装置、方法、及びその記憶媒体

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63310001A (ja) * 1987-06-11 1988-12-19 Hitachi Ltd 制御装置
CN1161753A (zh) * 1994-10-24 1997-10-08 奥林公司 模型预测控制装置与方法
JPH1115517A (ja) * 1997-06-19 1999-01-22 Toshiba Corp プラント状態監視システム
US7376472B2 (en) * 2002-09-11 2008-05-20 Fisher-Rosemount Systems, Inc. Integrated model predictive control and optimization within a process control system
DE102004058238B4 (de) * 2003-12-03 2016-02-04 Fisher-Rosemount Systems, Inc. Adaptive, multivariable Prozesssteuerung, die Modellschaltung und Attribut-Interpolation nutzt
JP4190517B2 (ja) * 2005-05-30 2008-12-03 株式会社東芝 プロセスモデルのパラメータ調整支援装置及び方法
JP4423617B2 (ja) * 2007-01-10 2010-03-03 株式会社日立製作所 プラント制御装置
JP4995169B2 (ja) * 2008-09-29 2012-08-08 三菱重工業株式会社 ガスタービン制御方法及び装置
WO2010050249A1 (ja) * 2008-10-30 2010-05-06 株式会社日立製作所 情報処理システムの運用管理装置
JP5251938B2 (ja) * 2010-08-31 2013-07-31 株式会社日立製作所 プラントの制御装置及び火力発電プラントの制御装置
JP5813317B2 (ja) * 2010-12-28 2015-11-17 株式会社東芝 プロセス状態監視装置
JP5284433B2 (ja) * 2011-09-14 2013-09-11 株式会社東芝 プロセス監視・診断・支援装置
JP5918663B2 (ja) * 2012-09-10 2016-05-18 株式会社日立製作所 火力プラントの制御装置及び制御方法
JP5722371B2 (ja) * 2013-03-14 2015-05-20 株式会社東芝 ノウハウ可視化装置及びノウハウ可視化方法
JP6320203B2 (ja) * 2014-07-03 2018-05-09 アズビル株式会社 Pidコントローラおよびデータ収集方法
CN107615184B (zh) * 2015-06-05 2021-02-09 国际壳牌研究有限公司 用于针对模型预测估计和控制应用程序中的模型的后台元件切换的系统和方法
JP6498059B2 (ja) * 2015-06-30 2019-04-10 三菱日立パワーシステムズ株式会社 起動制御装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002157003A (ja) 2000-11-17 2002-05-31 Fuji Electric Co Ltd 多変数モデル予測制御装置、方法、及びその記憶媒体

Also Published As

Publication number Publication date
WO2021181979A1 (ja) 2021-09-16
DE112021000080T5 (de) 2022-04-21
CN114258513A (zh) 2022-03-29
US20220326694A1 (en) 2022-10-13
JP2021144391A (ja) 2021-09-24
CN114258513B (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
US11275345B2 (en) Machine learning Method and machine learning device for learning fault conditions, and fault prediction device and fault prediction system including the machine learning device
US11573541B2 (en) Future state estimation device and future state estimation method
JP2005535024A (ja) 離散的制約を用いたソフト演算に基づく非線形動的制御のためのシステムおよび方法
JP2005535025A (ja) 量子ソフト演算に基づくインテリジェントメカトロニクス制御サスペンションシステム
CN113325721B (zh) 一种工业系统无模型自适应控制方法及系统
Abonyi et al. Fuzzy model-based predictive control by instantaneous linearization
CN111433689B (zh) 用于目标系统的控制系统的生成
CN104024964B (zh) 用于工业过程控制的方法、装置和系统
JP7081728B1 (ja) 運転支援装置、運転支援方法及びプログラム
CN113614743A (zh) 用于操控机器人的方法和设备
Wu et al. Learning dynamics of gradient descent optimization in deep neural networks
JP7111761B2 (ja) プラント運転最適化支援装置、プラント運転最適化制御装置並びに方法
CN112101516A (zh) 一种目标变量预测模型的生成方法、系统及装置
WO2019142728A1 (ja) 制御装置、制御方法およびプログラム記録媒体
JPH06332506A (ja) 非線形制御装置
Kicki et al. Tuning of extended state observer with neural network-based control performance assessment
JP7336425B2 (ja) モデル学習装置、制御装置、モデル学習方法、および、コンピュータプログラム
CN110908280B (zh) 一种小车-二级倒立摆系统优化控制方法
CN114981825A (zh) 基于自动学习预测及控制时间序列数据的方法及装置
JP6829271B2 (ja) 測定動作パラメータ調整装置、機械学習装置及びシステム
JP7441775B2 (ja) 制御装置及び制御方法
Gaffour et al. ‘Symbiotic’data-driven modelling for the accurate prediction of mechanical properties of alloy steels
WO2023090068A1 (ja) 将来状態推定装置
EP3971796A1 (en) Removing undesirable inferences from a machine learning model
Wu et al. Fractional-order Learning Algorithm for PID Neural Network Decoupling Control Based on Sparrow Search Algorithm

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220628

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220721

R150 Certificate of patent or registration of utility model

Ref document number: 7111761

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150