JP2010146068A - プラントの制御装置及び火力発電プラントの制御装置 - Google Patents

プラントの制御装置及び火力発電プラントの制御装置 Download PDF

Info

Publication number
JP2010146068A
JP2010146068A JP2008319568A JP2008319568A JP2010146068A JP 2010146068 A JP2010146068 A JP 2010146068A JP 2008319568 A JP2008319568 A JP 2008319568A JP 2008319568 A JP2008319568 A JP 2008319568A JP 2010146068 A JP2010146068 A JP 2010146068A
Authority
JP
Japan
Prior art keywords
learning
model
search
plant
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008319568A
Other languages
English (en)
Inventor
Toru Eguchi
徹 江口
Akihiko Yamada
昭彦 山田
Hisahiro Kusumi
尚弘 楠見
Takao Sekiai
孝朗 関合
Masayuki Fukai
雅之 深井
Satoru Shimizu
悟 清水
Yoshinari Hori
嘉成 堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008319568A priority Critical patent/JP2010146068A/ja
Publication of JP2010146068A publication Critical patent/JP2010146068A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Feedback Control In General (AREA)

Abstract

【課題】制御対象の特性が複雑で情報が不完全なプラントの制御において、制御装置に内包された探索手段により自律的に抽出した、効率的な問題解決のための学習指針を用いることで、望ましい操作方法を制御周期以内で学習可能なプラントの制御装置を提供する。
【解決手段】本制御装置は、プラントに制御信号を与えた時に取得する計測信号の値を推定するモデルと、モデル出力が目標値を達成するようにモデル入力の生成方法を学習する操作方法学習部と、操作方法学習部における学習の制約条件及び学習結果に関する情報を保存する学習情報データベースと、所望のモデル出力が得られる運転条件に相当するモデル入力を探索する最適解探索部と、最適解探索部における探索の制約条件及び最適解探索に関する情報を保存する探索情報データベースとを備え、操作方法学習部は、最適解探索部で得られた最適な運転条件に関する情報を用いてモデル入力を生成する。
【選択図】図1

Description

本発明は、プラントの制御装置に関するものであり、特に石炭等の化石燃料を用いて発電する火力発電プラントの制御装置に関する。
プラントの制御装置は、制御対象であるプラントから得られる計測信号を処理し、制御対象に与える制御信号(操作信号)を算出し、制御対象に伝達する。制御装置には、プラントの計測信号がその目標値を満足するように、操作信号を計算するアルゴリズムが実装される。
プラントの制御に用いられている制御アルゴリズムとして、PI(比例・積分)制御アルゴリズムがある。PI制御では、プラントの計測信号とその目標値との偏差に比例ゲインを乗じた値に、偏差を時間積分した値を加算して、制御対象に与える操作信号を導出する。
PI制御を用いた制御アルゴリズムは、ブロック線図などで入出力関係を記述することができるため、入力と出力の因果関係が分かりやすく、多くの適用実績がある。しかし、プラント運転状態の変更や環境の変化など、事前に想定していない条件でプラントを運転する場合には、制御ロジックを変更するなどの作業が必要になる場合がある。
一方、プラントの運転状態や環境の変化に適応できる制御方式には、制御アルゴリズムやパラメータ値を自動的に修正する適応制御や学習アルゴリズムを用いた制御方式がある。学習アルゴリズムを用いてプラントの制御装置の操作信号を導出する方法として、特許文献1には、強化学習理論を用いた制御装置に関する技術が記載されている。この制御装置は、制御対象の特性を予測するモデルと、望ましいモデル出力の値が得られるようなモデル入力の操作方法を学習する学習部とを持つ。学習部において学習したモデル入力をモデルに入力することで、モデル出力が望ましい値に近づく効果が得られる。また、操作信号の変更により得られるプラントの計測情報を基に、モデル特性を逐次修正し、修正したモデルを再学習することで、高い適応性を実現する。モデルが修正される周期(制御周期)以内で学習を終了できない場合は、制御目標を達成する制御ロジックの構築に時間を要するため、運用コストの面で望ましくない。そのため、学習は制御周期以内に終了することが望ましい。
このような学習型適応制御では、設計者による望ましい操作への指針が与えられていない状況でも、ある学習指針に従って操作の決定に必要なパラメータを更新することで操作方法を自律的に獲得する。しかし、その学習指針の多くは発見的・試行錯誤的なプロセスを通じて望ましい操作方法を獲得するものであり、学習の対象となる問題の規模や性質によっては、解の組み合わせ数の増加によって学習に時間を要する場合や、学習が停滞し望ましい操作方法の獲得に至らない場合が想定される。
一方で、学習型適応制御が有する上記の課題に対して、学習する問題を複数の小問題に分解し、小問題に対する学習結果を有機的に結合することで、元の問題に対する望ましい操作方法を獲得する手法が検討されており、小問題への分割による学習時間増加の抑制効果が期待されている。
例えば非特許文献1には、強化学習による制御器において、分割した小問題毎に学習目標であるサブゴールを設定して階層的な構造を与え、各サブゴールの学習と最終的な学習目標を達成するためのサブゴールの切り替え制御則とを同時に学習させることで、学習時間の増加、及び学習の停滞を回避する技術が記載されている。
特開2000−35956号公報 Morimoto, J., Doya, K.: Acquisition of stand-up behavior by a real robot using hierarchical reinforcement learning. Robotics and Autonomous Systems, 36, 37-51 (2001)
特許文献1、及び非特許文献1の技術をプラントの制御装置へ適用した場合、制御目標を達成するプラントの操作信号の生成方法を自動的に学習できる。
ところが、一般に複雑かつ強い非線形性を持つプラントの特性に対して学習する場合、従来技術の試行錯誤的なプロセスでは、学習を制御周期以内で終了させることが困難となり、制御目標を達成する制御ロジックの構築に時間を要してしまう可能性がある。また、問題を複数の小問題に分割することを考える場合、問題の分割やそれに伴うサブゴールの設定は設計者の経験的な知識に依存する部分が大きく、特性が複雑でそれに関する情報が不完全な問題に対しては、適切な問題分割・サブゴールの設定が困難となり、望ましい操作方法を学習できない可能性がある。
本発明は、以上の従来技術が有する課題に鑑みてなされたものであり、その目的は、制御対象の特性が複雑で、それに関する情報が不完全な場合が多いプラントの制御において、制御装置に内包された探索手段によって自律的に抽出した、効率的な問題解決のための学習指針を用いることで、望ましい操作方法を制御周期以内で学習し、制御目標を達成する制御ロジックを短期間で構築可能なプラントの制御装置を提供することである。ここで、学習指針とは、望ましいモデル出力が得られる最適なプラントの運転条件に関する情報を指す。
本発明は、制御・計測対象のプラントに制御信号を与えた時に取得する計測信号の値を推定するモデルと、前記モデルを用いて、前記計測信号に相当するモデル出力が目標値を達成するように、前記制御信号に相当するモデル入力の生成方法を学習する操作方法学習部と、前記操作方法学習部における学習の制約条件及び学習結果に関する情報を保存する学習情報データベースとを備え、前記計測信号を用いてプラントの制御信号を計算し、この制御信号をプラントに送信するプラントの制御装置において、前記モデルを用いて、予め設定した制御目標及び制約条件を満足する所望のモデル出力が得られる運転条件に相当するモデル入力を探索する最適解探索部と、前記最適解探索部における探索の制約条件及び最適解探索に関する情報を保存する探索情報データベースとを備え、前記操作方法学習部は、前記最適解探索部の探索結果である最適な運転条件に関する情報を用いてモデル入力を生成することを特徴とする。
本発明の望ましい実施態様によれば、最適解探索部により自律的に獲得した、望ましい運転条件に関する情報を用いて、学習時の操作を実行する。これにより、学習時の操作に望ましい運転条件への指向性を持たせることができ、試行錯誤的な学習方式に比べて効率的に学習できる。また、そのような望ましい運転条件は、設計者の知識やプラントの特性に関する先験情報を用いることなく獲得できるため、プラントの特性に関する情報が不完全な場合においてもロバストな制御性能が期待できる。
本発明によるプラントの制御装置において、操作方法学習部は、学習情報データベース及び探索情報データベースに保存された情報を用いてモデル入力の操作方法を決定するモデル入力生成機能と、モデルを操作した結果得られるプラントの特性値に相当するモデル出力を用いてモデルの操作に対する評価値を計算する評価値計算機能と、学習情報データベースに保存された情報を用いてモデル入力の操作方法を学習する操作学習機能のうち、少なくとも1つを備えることが望ましい。
また、モデル入力生成機能は、学習情報データベースに保存された学習結果を基に試行錯誤的に決定される基準操作量ベクトルを算出する機能と、探索情報データベースに保存された所望の運転条件に関する情報を基に決定された最良解移動ベクトルを算出する機能と、基準操作量ベクトルと最良解移動ベクトルとを基に所望の運転条件への指向性を持つ操作量ベクトルを算出する機能のうち、少なくとも1つを備えることが望ましい。
また、モデル入力生成機能は、操作量ベクトルを算出する際に、予め定めた一定のパラメータに基づいて算出する機能と、現在の運転条件から所望の運転条件までの距離情報を用いて適応的に調整して算出する機能のうち、少なくとも1つを備えることが望ましい。
本発明によるプラントの制御装置は、画像表示装置と接続され、学習情報データベース及び探索情報データベースに保存された情報を画像表示装置に表示する機能と、操作方法学習部及び最適解探索部で用いる学習・探索条件が画像表示装置を介して設定される機能と、所望の運転条件の探索結果及び操作方法の学習結果を画像表示装置に表示する機能のうち、少なくとも1つを備えることが望ましい。
学習及び探索の条件設定を、画像表示装置を介して入力する機能を備えることにより、プラントの運転員は、プラントの制御ニーズに応じて適切な学習・探索条件を設定できる。さらに、探索時の目的関数の推移、並びに学習時の評価値及びモデル出力値の推移を画像表示装置に表示する機能を備えることにより、プラントの運転員は、所望の運転条件を探索できたか及び操作方法を学習できたかどうかを確認し、予め設定した最大学習回数や最大探索回数に達する前に学習または探索を終了させるか否かを決定できる。
また、本発明の他の実施態様は、火力発電プラントから取得する計測信号を用いて、火力発電プラントに与える制御信号を導出する制御信号生成部を備えた火力発電プラントの制御装置である。計測信号は、火力発電プラントから排出されるガスに含まれる窒素酸化物、一酸化炭素、及び硫化水素の夫々の濃度のうち少なくとも1つを表す信号を含む。制御信号は、空気ダンパの開度、空気流量、燃料流量、排ガス再循環流量のうち少なくとも1つを決定する信号を含む。本制御装置は、火力発電プラントに制御信号を与えた時の、計測信号の値を推定するモデルと、このモデルを用いて、予め設定した制御目標及び制約条件を満足する所望のモデル出力が得られる運転条件に相当するモデル入力を探索する最適解探索部と、最適解探索部の実行条件に関する情報、及び探索によって得られた、火力発電プラントの空気ダンパの開度、空気流量、燃料流量、排ガス再循環流量のうち少なくとも1つに関する所望のモデル出力が得られる運転条件を決定する信号を保存する探索情報データベースと、モデル及び最適解探索部の探索結果である最適な運転条件に関する情報を用いて、計測信号に相当するモデル出力が目標値を達成するように、制御信号に相当するモデル入力の生成方法を学習する操作方法学習部と、操作方法学習部における学習の制約条件及び学習結果に関する情報を保存する学習情報データベースとを設けたことを特徴とする。
また、画像表示装置と接続され、学習情報データベース及び探索情報データベースに保存された情報を画像表示装置に表示する機能と、操作方法学習部及び最適解探索部で用いる学習・探索条件が画像表示装置を介して設定される機能と、所望の運転条件の探索結果及び操作方法の学習結果を画像表示装置に表示する機能のうち、少なくとも1つを備えることができる。
本発明を火力発電プラントへ適用した一実施例では、火力発電プラントにおけるモデル出力に該当する窒素酸化物濃度、一酸化炭素濃度、及び硫化水素濃度に関する制御保証値、または最適な運転条件の探索時の目的関数計算に用いる重み係数を、画像表示装置を介して入力する。
次に、本発明の実施例であるプラントの制御装置について図面を参照して説明する。尚、ベクトル量を表す記号は、少なくとも初出時にベクトル量であることを明記する。
図1は、本発明の実施例1によるプラントの制御装置のシステム構成図である。プラント100は、制御装置200によって制御される。制御装置200は保守ツール910と接続されているので、プラント100の運転員は、保守ツール910に接続された外部入力装置900と画像表示装置(例えばCRTディスプレイ)920とを介して、制御装置200を制御する。
制御装置200には、演算装置として、計測信号変換部300、数値解析部400、モデル500、制御信号生成部600、操作方法学習部700、及び最適解探索部800が設けられている。
また、制御装置200には、データベース(DB)として、計測信号データベース210、モデル構築データベース220、学習情報データベース230、探索情報データベース240、制御ロジックデータベース250、及び制御信号データベース260が設けられている。
また、制御装置200には、外部とのインターフェースとして、外部入力インターフェース201、及び外部出力インターフェース202が設けられている。
制御装置200では、外部入力インターフェース201を介して、プラント100から計測信号1を制御装置200に取り込む。また、外部出力インターフェース202を介して、制御対象のプラント100に制御信号15を送るようになっている。
制御装置200では、外部入力インターフェース201から取り込んだ計測信号2は、計測信号データベース210に保存される。また、制御信号生成部600にて生成される制御信号14は、外部出力インターフェース202に伝送されると共に、制御信号データベース260に保存される。
計測信号変換部300では、計測信号データベース210に保存された計測データ3をモデル構築データ4に変換する。モデル構築データ4は、モデル構築データベース220に保存される。また、計測データ3に含まれる直前の制御結果として得られた運転条件は、制御信号生成部600に入力される。
数値解析部400では、プラント100を模擬する物理モデルを用いて、プラント100の特性を予測する。数値解析部400で実行して得られた数値解析データ5は、モデル構築データベース220に保存される。
操作方法学習部700は、学習データ10を生成し、学習情報データベース230に保存する。また、最適解探索部800は、探索データ12を生成し、探索情報データベース240に保存する。
モデル500は、プラント100の制御特性を模擬する機能を持つ。すなわち、制御信号15をプラント100に与え、その制御結果に対する計測信号1を得るのと同等の機能を模擬演算する。この模擬演算のために、モデル500は、操作方法学習部700より受けたモデル入力7と、モデル構築データベース220に保存されたモデル構築データ6とを使用する。モデル入力7は、制御信号15に相当する。モデル入力7とモデル構築データ6とから、モデル500は、ニューラルネットワークなどの統計的手法によりプラント100の制御による特性変化を模擬演算して、モデル出力8を得る。モデル出力8は、プラント100の計測信号1の予測値となる。尚、モデル入力7、モデル出力8は共に、その数は1種類に限定されず、夫々複数種類用意することができる。
制御信号生成部600では、学習情報データベース230より出力された学習情報データ9、及び制御ロジックデータベース250に保存された制御ロジックデータ13を用いて、計測信号1が望ましい値となるように制御信号14を生成する。この制御ロジックデータベース250には、制御ロジックデータ13を算出する制御回路、及び制御パラメータが保存される。この制御ロジックデータ13を算出する制御回路には、従来技術として公知のPI(比例・積分)制御を用いることができる。
操作方法学習部700は、学習情報データベース230に保存された学習の制約条件及び学習のパラメータ設定条件等を含む学習情報データ9、並びに探索情報データベース240に保存された探索データ12を用いて、モデル入力7の操作方法を学習する。探索データ12は、最適解探索部800を用いて学習と並行して実行する最適解探索の結果である。学習結果である学習データ10は、学習情報データベース230に保存される。
最適解探索部800は、学習情報データベース230に保存された学習情報データ9、並びに探索情報データベース240に保存された探索の制約条件及びパラメータ設定条件等を含む探索情報データ11を用いて、制約条件を満足しつつ、モデル出力8が最適となるモデル入力7を探索する。ここで、制約条件を満足し、モデル出力が最適となるモデル入力を最適解、探索のある時点までに求まった上記条件を満たす最良のモデル入力を最良解と定義する。探索結果である探索データ12は、探索情報データベース240に保存される。
このように、制御装置200の動作において、学習の制約条件を満足しつつ、モデル出力8が最適となるモデル入力7の最適解を最適解探索部800において探索し、探索した最良解情報を含む探索データ12を用いて操作方法学習部700が操作方法を学習するメカニズムを具備することにより、学習時の試行錯誤による操作に最適解への指向性を付加させることができる。その結果、試行錯誤操作のみによる学習に比べて効率的に最適解へ到達する操作を経験できるため、望ましい操作方法を効率的に学習でき、学習時間を短縮できる。
尚、操作方法学習部700、及び最適解探索部800の詳細な機能については、後述する。また、操作方法学習部700から学習情報データベース230に保存される学習データ10には、操作前後のモデル入力、及びその操作の結果得られるモデル出力に関する情報が含まれている。学習情報データベース230では、現在の運転条件に対応する学習データ10が選択され、学習情報データ9として制御信号生成部600に入力される。
プラント100の運転員は、キーボード901とマウス902で構成される外部入力装置900、制御装置200とデータを送受信できる保守ツール910、及び画像表示装置920を用いることにより、制御装置200に備えられている種々のデータベースに保存された情報にアクセスすることができる。また、これらの装置を用いることにより、数値解析部400、操作方法学習部700、及び最適解探索部800で用いるパラメータ設定値、学習の制約条件、及び学習・探索の開始・終了信号を入力することができる。
保守ツール910は、外部入力インターフェース911、データ送受信処理部912、及び外部出力インターフェース913で構成され、データ送受信処理部912を介して制御装置200とデータを送受信できる。
外部入力装置900で生成した保守ツール入力信号91は、外部入力インターフェース911を介して保守ツール910に取り込まれる。保守ツール910のデータ送受信処理部912では、保守ツール入力信号92の情報に従って、制御装置200から取得した入出力データ情報90を取得する。また、データ送受信処理部912では、保守ツール入力信号92の情報に従って、数値解析部400、操作方法学習部700、及び最適解探索部800で用いるパラメータ設定値、学習の制約条件、及び学習・探索の開始・終了信号を含む入出力データ情報90を出力する。
データ送受信処理部912では、入出力データ情報90を処理した結果得られる保守ツール出力信号93を、外部出力インターフェース913に送信する。外部出力インターフェース913から送信された保守ツール出力信号94は、画像表示装置920に表示される。
尚、上記の制御装置200では、計測信号データベース210、モデル構築データベース220、学習情報データベース230、探索情報データベース240、制御ロジックデータベース250、及び制御信号データベース260が制御装置200の内部に配置されるが、これらの全て、あるいは一部を制御装置200の外部に配置することもできる。
また、数値解析部400が制御装置200の内部に配置されるが、これを制御装置200の外部に配置することもできる。
例えば、数値解析部400、及びモデル構築データベース220を制御装置200の外部に配置し、数値解析データ5をインターネット経由で制御装置200に送信するようにしてもよい。
図2に、以上説明した実施例における操作方法の学習時の動作を示すフローチャートを示す。図2のフローチャートは、ステップ1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、及び2100を組み合わせて実行する。以下では、夫々のステップについて説明する。
制御装置200の動作開始後、ステップ1000では、学習時の最大学習回数、最大操作回数、学習の制約条件、最適解探索に用いるパラメータ条件、及びモデル入力操作量決定に用いるパラメータ等、種々のパラメータ値を設定する。
ステップ1100では、ステップ1300〜2000の繰り返し回数を示す値である学習回数kを初期化(k=1に設定)する。
ステップ1200では、最適解探索部800を動作させ、モデル入力7の最適解を探索する。
ステップ1300では、学習を開始する際のモデル入力の初期値を設定する。モデル入力の初期値としては、予め設定された操作可能範囲内の任意の値を選ぶことができる。すなわち、この操作可能範囲内であれば、初期条件として任意の状態が選択可能である。尚、モデル入力は、通常連続値ベクトルとして表現されるが、離散値ベクトルを用いてもよい。
ステップ1400では、ステップ1500〜1900の繰り返し回数を示す値である操作回数oを初期化(o=1に設定)する。
ステップ1500では、操作方法学習部700を動作させ、モデル入力7の操作量を決定する。
ステップ1600では、決定したモデル入力7の操作量を用いてモデル入力7を更新する。
ステップ1700では、更新したモデル入力7をモデル500へ入力し、モデル入力7に対するモデル500の演算結果であるモデル出力8を計算する。
ステップ1800では、計算したモデル出力8の値を基に、強化学習理論等の学習アルゴリズムを用いて、モデル入力7の操作方法を学習する。
ステップ1900は分岐である。操作回数oがステップ1000で設定した最大操作回数よりも小さい場合は、oに1を加算した後にステップ1500に戻り、oが最大操作回数に達している場合は、ステップ2000に進む。
ステップ2000も分岐である。学習回数kがステップ1000で設定した最大学習回数よりも小さい、または学習終了条件を満たさない場合には、kに1を加算した後にステップ1300に戻り、kが最大学習回数に達している、または学習終了条件を満たす場合は、ステップ2100に進む。学習終了条件とは、保守ツール910から制御装置200に対して、学習の強制終了信号が入力された場合を指す。
ステップ2100では、操作方法の学習結果を学習情報データベース230に保存し、操作方法の学習の動作を終了させるステップに進む。
以上の動作によって、操作方法の学習では、プラント100の運転員が設定した学習条件、及び最適解の探索条件に基づき、任意のモデル入力条件から最適解探索によって得られたモデル入力の最適解に到達し、望ましいモデル出力が得られるような操作方法を自律的に獲得できる。
次に、操作方法学習部700の動作について、図3を用いて詳細に説明する。図3は、操作方法学習部700の動作を説明する図であり、図1に示した制御装置200において、モデル500、操作方法学習部700、学習情報データベース230、及び探索情報データベース240を含む部分を詳細に示したものである。
操作方法学習部700は、モデル入力生成機能701、評価値計算機能702、及び操作学習機能703で構成される。
モデル入力生成機能701は、学習情報データベース230に保存された学習情報データ9、探索情報データベース240に保存された探索データ12、及び操作学習機能703によって更新される操作量決定パラメータ70を用いてモデル入力の操作量を決定する。さらに、モデル入力生成機能701は、この操作量を現在のモデル入力に加え、操作後のモデル入力7としてモデル500へ入力する。ここで、学習情報データ9は、学習の制約条件と設定条件等を含み、探索データ12は、モデル入力の最良解情報を含み、操作量決定パラメータ70は、操作方法を決定するパラメータである。以上の動作は、図2のステップ1500、及び1600に相当する。
モデル500は、モデル入力生成機能701が決定したモデル入力7に対して、モデル出力8を評価値計算機能702へ出力する。
評価値計算機能702は、モデル出力8を基に、モデル入力7の操作結果に対する評価値71を計算し、操作学習機能703へ出力する。評価値71は、学習情報データベース230に保存された学習の制約条件を含む学習情報データ9を基に計算され、望ましいモデル出力に近づくほど高い評価値が得られるように設定される。すなわち、評価値71は、現在のモデル出力が、モデル入力の最適解に対するモデル出力へどの程度到達しているかを表す値であり、これらのモデル出力の差分をとる、または所定の関数を用いるなどの方法により求めることができる。
操作学習機能703は、評価値計算機能702が計算した評価値71、及び学習情報データベース230に保存された学習情報データ9を基に、操作量決定パラメータ70を更新し、これをモデル入力生成機能701へ出力する。学習情報データ9には、操作方法の学習に関するパラメータが含まれる。以上の動作は、図2のステップ1800に相当する。また、学習終了後に最終的に得られた操作量決定パラメータ70は、学習データ10として学習情報データベース230に保存される(図2のステップ2100に相当)。
以下では、モデル入力生成機能701による操作量決定のアルゴリズムについて、その概念図(図4)及びフローチャート(図7)を参照しながら説明する。
図4は、モデル入力生成機能701による操作量決定アルゴリズムの概念図であり、モデル入力空間におけるモデル操作量ベクトルの生成メカニズムを2次元座標上で示したものである。
図4に示すように、モデル入力生成機能701によって決定される操作量ベクトルvは、操作量決定パラメータ70(図3参照)を用いて計算される現在のモデル入力x(ベクトル量)に対する基準操作量ベクトルvbase、及び、それまでの最適解探索の結果得られた最良解xbest(ベクトル量)を基準とした最良解移動ベクトルvbestを基に、式(1)に従って計算する。ここで、基準操作量ベクトルvbaseは、従来技術で用いられる試行錯誤的な要素を含む操作と等価であり、これまでに学習した操作方法に基づく量である。vbaseとvbestの各成分は、xの各成分の操作量を意味する。また、操作は予め設定された操作可能範囲内で実行されるため、各操作ベクトルv、vbase、vbestのベクトル終点(操作後のモデル入力)は、全て操作可能範囲内となることが保証される。
Figure 2010146068
図4において、最良解移動ベクトルvbestは、現在のモデル入力xから最良解xbestへのベクトル方向成分を持ち、かつベクトル終点が操作可能範囲の境界条件に一致するように決定される。
また式(1)において、φは、操作量ベクトルvを決定する比率パラメータであり、[0,1]の範囲に設定される。図5は、φの変化により操作量ベクトルvがどのように変化するかを示した図である。操作量ベクトルvは、φが大きい値をとる場合、基準操作量ベクトルvbaseへの指向性が強くなり、φが小さい値をとる場合、最良解移動ベクトルvbestへの指向性が強くなる。このように、φを適切に設定することにより、学習時に実行される操作に、最適解探索によって決定した最良解への指向性が付加されるため、試行錯誤的な操作に比べて最適解へ到達する操作方法を効率的に学習できる。
比率パラメータφは、外部入力装置900(図1参照)を介して定数値として設定することもできるが、現在のモデル入力情報を用いて適応的に調整することもできる。具体的には、現在のモデル入力xとこれまでに得られた最良解xbestとの距離情報dを基に、式(2)によって定義されるφの特性式に従ってφを決定する。
Figure 2010146068
図6は、距離情報dに対する比率パラメータφの特性を示したグラフである。図6に示すように、φは、モデル入力xと最良解xbestとの距離dが0の場合に1となり、距離dが大きくなるほど減少して0に漸近する。このような動作は、最良解から離れたモデル入力条件においては操作の最良解への指向性を強めることで学習を加速し、最良解に近づくにつれてその指向性を弱め、最良解近傍のモデル入力条件を試行錯誤的に経験させることで学習の精度を向上させることを鑑みてなされるものである。
また、式(2)におけるβは比率パラメータφ関数の特性を決定するための特性パラメータであり、外部入力装置900を介して設定される。
尚、図6及び式(2)に示した特性式は実施の一例であり、これ以外にも上記のφ決定方針に従えば、線形関数を用いた例や、ステップ関数を用いた例等も考えられる。
以上の説明に基づく、モデル入力生成機能701による、モデル入力の操作量決定のアルゴリズム動作を示すフローチャートを図7に示す。図7のフローチャートは、図2におけるステップ1500に相当し、ステップ1510、1520、1530、1540、1550、及び1560を組み合わせて実行する。以下では、夫々のステップについて説明する。
モデル入力の操作量決定のアルゴリズム開始後、ステップ1510では、操作量決定パラメータ70を用いて現在のモデル入力xにおける基準操作量ベクトルvbaseを決定する。
ステップ1520では、それまでの最適解探索の結果得られた最良解xbestを基準とした最良解移動ベクトルvbestを計算する。
ステップ1530は分岐であり、比率パラメータφの決定方法を選択する。φの決定方法は、前述したように、(1)定数値とする方式、(2)現在のモデル入力xと最良解xbestとの距離dを基準に決定する方式、の2種類から選択する。φの決定方法として(1)を用いる場合は、φを外部入力装置900から設定した値としてステップ1560に進み、(2)を用いる場合は、ステップ1540へ進む。
ステップ1540では、モデル入力xと最良解xbestとの距離dを、式(3)に従って計算する。式(3)において、符号“| |”はベクトルの絶対値を示す。
Figure 2010146068
次に、ステップ1550では、距離d、及び外部入力装置900を介して設定した特性パラメータβを用いて、式(2)に従って比率パラメータφを計算する。
ステップ1560では、決定した比率パラメータφを用いて、式(1)に従ってモデル操作量ベクトルvを決定し、モデル入力生成機能701の動作を終了させるステップに進む。
以上の説明から、モデル入力生成機能701では、モデル入力の操作量ベクトルvが、それまでに学習した操作方法に基づく基準操作量ベクトルvbase、及びそれまでの最適解探索で得られた最良解xbestを基準とした最良解移動ベクトルvbestによって決定される。したがって、学習時の操作は、任意のモデル入力条件から探索で得られた最良解へ向かうように実行されるため、試行錯誤的な操作に比べて最良解への操作を実行する確率を大きくすることができる。その結果、学習の停滞や局所解への収束に陥ることなく、効率的に最適解へ到達する操作方法を学習できる。
次に、最適解探索部800における最適解探索アルゴリズムの詳細な動作について、図8のフローチャートを用いて説明する。図8の最適解探索アルゴリズムの動作フローチャートは、図2のステップ1200に相当し、ステップ1210、1220、1230、1240、1250、1260、及び1270を組み合わせて実行する。以下では、夫々のステップについて説明する。
ステップ1210は分岐であり、アルゴリズムが探索の終了条件を満たす場合は最適解探索アルゴリズムの動作を終了するステップに進み、そうでない場合はステップ1220に進む。ここで探索の終了条件とは、保守ツール910(図1参照)から制御装置200に対して、探索の強制終了信号が入力された場合を指す。
ステップ1220では、ステップ1230〜1260の繰り返し回数を示す値である探索回数sを初期化(s=1に設定)する。
ステップ1230では、式(4)に示す目的関数fを最適化することを目的として、最適化手法(メタ・ヒューリスティクス)を用いて、解候補x´(ベクトル量)となるモデル入力条件を決定する。最適化手法としては、焼きなまし法、タブー探索法、粒子群最適化手法等、既存の公知技術を用いることができる。式(4)の目的関数fは、扱うモデル出力の種類に応じて最小化・最大化のいずれかを最適化の目的とする。式(4)において、fiはモデル出力値、iはモデル出力を識別するための添え字、Iはiの集合である。また、Ciは重み係数パラメータであり、外部入力装置900を介して設定することができる。
Figure 2010146068
ステップ1240は分岐であり、ステップ1230で決定した解候補x´と、これまでの探索で得られた最良解xbestについて、式(4)に従って求めた夫々の目的関数の値fを比較し、解候補x´が最良解xbestよりも改善する場合(fが収束に向かう場合)はステップ1250に進み、そうでない場合はステップ1260に進む。
ステップ1250では、最良解xbestをx´に更新する。
ステップ1260は分岐であり、探索回数sが図2のステップ1000で設定した最大探索回数よりも小さい場合は、sに1を加算した後にステップ1230に戻り、そうでない場合は、ステップ1270に進む。
ステップ1270では、最良解の探索結果を探索情報データベース240に保存し、最適解探索の動作を終了させるステップに進む。
上記の動作によって、制約条件を満足し、モデル出力値が最適となる操作条件の探索が実行される。探索は学習と並行して実行されるため、学習時にモデル入力の最適解が変化する場合においても、常に探索によって更新された最良解xbestに近づくように操作が実行される。したがって、本発明における制御装置は、学習時のモデル特性変化にも対応した操作方法の学習が可能である。以上で、操作方法学習部700、及び最適解探索部800の詳細な動作の説明を終了する。
次に、画像表示装置920(図1参照)に表示される画面について、図9及び図10を用いて説明する。図9及び図10は、画像表示装置920に表示される画面の一実施例である。
図9は、図2のフローチャートにおけるステップ1000の学習・探索条件の設定画面の一例である。図9に示す画面が画像表示装置920に表示された状態で、マウス902を操作して画面上の数値ボックスにフォーカスを移し、キーボード901を用いることで数値を入力できる。また、マウス902を操作して画面上のボタンをクリックすることで、ボタンを選択する(押す)ことができる。同様に、マウス902を操作して画面上のチェックボックスをクリックすることで、チェックを入れることができる。
図9では、数値ボックス3000、3001、及び3002の夫々にフォーカスを移して数値を入力することで、図2のフローチャートにおける学習回数kの閾値である最大学習回数、及び操作回数oの閾値である最大操作回数、並びに図8のフローチャートにおける探索回数sの閾値である最大探索回数を決定することができる。
次に、チェックボックス3003、及び3004では、いずれかのチェックボックスを選択することで、図7の操作量決定アルゴリズムのフローチャートで用いる比率パラメータφの決定方法を選択することができる。チェックボックス3003を選択した場合は、比率パラメータφの値は定数値(固定)となり、その値を数値ボックス3005より入力する。チェックボックス3004を選択した場合は、比率パラメータφの値は、可変となり、式(2)によって定義されるφの特性式にしたがって決定される。この場合、数値ボックス3006より、式(2)における特性パラメータβの設定値を入力する。
最後に、モデル出力重み係数設定画面3007では、式(4)に示した目的関数fの計算に用いる重み係数パラメータCiを、夫々のモデル出力に対して数値ボックス3008より入力できる。
以上の学習・探索条件設定の終了後、ボタン3009を選択することで、学習を開始することができる。また、ボタン3010を選択すると初期画面に戻る。
図10は、図2のフローチャートにおけるステップ2000の学習の終了判定時、及び図8のフローチャートにおけるステップ1210の探索の終了判定時に用いる画面の一例である。図10における探索結果表示画面3100は、図8のフローチャートにおけるステップ1240からステップ1270までの一連の最適解探索実行時に表示される画面であり、最適解探索で得られた目的関数fの値の推移がグラフで表示される。ここで、探索結果表示画面3100のグラフの横軸は、学習を通じての延べ探索回数である。
プラントの運転員は、探索結果表示画面3100に表示される探索結果を見ながら、探索が充分進んでいるかどうかを判断することができる。一定の探索回数が経過後、目的関数fの値の改善が見られない場合(目的関数fの値がある値に収束した場合)は、最適解の探索が充分進み最良解xbestが最適解に漸近していると判断できるため、探索回数が最大探索回数に達していない場合でも、ボタン3101を選択することで探索を終了することができる。この操作により、以降の操作方法の学習では、図8のステップ1210の判定において以降の探索(ステップ1220からステップ1270まで)が実行されなくなるため、学習を高速化できる。
また、図10における学習結果表示画面3102は、図2のフローチャートにおけるステップ1200からステップ2100までの一連の学習実行時に表示される画面の一例である。学習結果表示画面3102には、各学習回数経過時点で得られた操作方法を用いたモデル操作に対し、このモデル操作の結果得られたモデル出力値、及び学習の評価値の推移が表示される。学習の評価値とは、図3の評価値71のことであり、望ましいモデル出力に近づくほど値が大きくなる。
プラントの運転員は、学習結果表示画面3102に表示される学習結果を見ながら、学習が充分進んでいるかどうかを判断することができる。学習の収束状況の判定条件としては、以下のものが挙げられる。(1)探索が充分収束している状況で、学習回数に対するモデル出力値(モデル出力が複数ある場合は、全てのモデル出力値)が充分改善され、かつ収束している。(2)探索が充分収束している状況で、学習回数に対する評価値が最大値付近まで大きくなり、収束している。
以上の条件を全部、または少なくとも1つ以上満足する場合に、プラントの運転員は、学習回数が設定した最大学習回数に達していない場合でも、ボタン3103を選択することで学習を終了させることができる。この操作により、従来想定していたよりも学習に要する時間を短縮できる。そのためプラントを操作する回数を増加させ、より高い制御効果を得ることができる。
以上で、画像表示装置920に表示される画面についての説明を終了する。
本発明のプラントの制御装置200を、火力発電プラントに適用した実施例について説明する。尚、火力発電プラント以外のプラントを制御する際にも、本発明の実施例の制御装置200を使用できることは言うまでもない。
図11は、火力発電プラントの概略を示す図である。先ず、火力発電プラントの発電の仕組みについて説明する。
火力発電プラントを構成するボイラ101には、ミル110で石炭を細かく粉砕した燃料である微粉炭と、微粉炭搬送用の1次空気及び燃焼調整用の2次空気とを供給するバーナー102が設けられている。このバーナー102を介して供給した微粉炭を、ボイラ101の内部で燃焼させる。尚、微粉炭と1次空気は配管134から、2次空気は配管141から夫々バーナー102に導かれる。
また、ボイラ101には、2段燃焼用の空気をボイラ101に投入するアフタエアポート103が設けられている。2段燃焼用の空気は、配管142からアフタエアポート103に導かれる。
燃焼により発生した高温の燃焼ガスは、ボイラ101の内部の経路に沿って下流側に流れた後、ボイラ101に配置された熱交換器106を通過して熱交換した後、エアーヒーター104を通過する。エアーヒーター104を通過したガスは、排ガス処理を施した後、煙突から大気に放出される。
ボイラ101の熱交換器106を循環する給水は、給水ポンプ105を介して熱交換器106に供給され、熱交換器106においてボイラ101を流下する燃焼ガスによって過熱され、高温高圧の蒸気となる。尚、本実施例では熱交換器の数を1つとしているが、熱交換器を複数配置するようにしてもよい。
熱交換器106を通過した高温高圧の蒸気は、タービンガバナ107を介して蒸気タービン108に導かれ、蒸気の持つエネルギーによって蒸気タービン108を駆動して発電機109で発電する。
火力発電プラントには、火力発電プラントの運転状態を検出する様々な計測器が配置されており、これらの計測器から取得されたプラントの計測信号は、計測信号1(図1参照)として制御装置200に送信される。計測器としては、例えば図11には、流量計測器150、温度計測器151、圧力計測器152、発電出力計測器153、及び濃度計測器154が図示されている。
流量計測器150は、給水ポンプ105からボイラ101に供給される給水の流量を計測する。また、温度計測器151、及び圧力計測器152は、熱交換器106から蒸気タービン108に供給される蒸気の温度、及び圧力を夫々計測する。
発電機109で発電された電力量は、発電出力計測器153で計測する。ボイラ101を通過する燃焼ガスに含まれている成分(窒素酸化物(NOx)、一酸化炭素(CO)、及び硫化水素(HS)など)の濃度に関する情報は、ボイラ101の下流側に設けた濃度計測器154で計測することができる。
即ち、本発明の制御装置200を上記火力発電プラントに用いた場合に、計測データ項目には、上記計測器によって計測した燃料流量、空気流量、給水流量、蒸気温度、ガス温度、給水圧力、ガス濃度、及び排ガス再循環流量等が含まれる。これらの計測データ項目は、制御信号15(図1参照)により決定される量である。
尚、一般的には図11に図示した以外にも多数の計測器が火力発電プラントに配置されるが、ここでは図示を省略する。
次に、ボイラ101の内部に投入される空気の経路、すなわちバーナー102から投入される1次空気と2次空気の経路、及びアフタエアポート103から投入される空気の経路について説明する。
1次空気は、ファン120から配管130に導かれ、途中でボイラ101の下流側に設置されたエアーヒーター104を通過する配管132とこれを通過せずにバイパスする配管131とに分岐して、再び配管133にて合流し、バーナー102の上流側に設置されたミル110に導かれる。エアーヒーター104を通過する空気は、ボイラ101を流下する燃焼ガスにより加熱される。この1次空気と共に、ミル110において粉砕した微分炭をバーナー102に搬送する。
ファン121を用いて配管140から投入された空気は、エアーヒーター104で同様にして加熱された後に、2次空気用の配管141とアフタエアポート用の配管142とに分岐して、夫々バーナー102とアフタエアポート103とに導かれる。
本実施例では、ファン121から送られてボイラ101内へ投入される空気流量を制御する例として、本発明の制御装置200を配管141と配管142の上流側に設けている。制御装置200は、他の計測データ項目を制御することもでき、設置場所を制御対象に応じて変えてもよい。
図12は、図11に示した火力発電プラントにおけるエアーヒーター104と関連する配管部の拡大図である。配管130、140と、これらの配管から分岐する配管131、132、141、142と、配管131、132が合流する配管133と、エアーヒーター104とを示してある。図12に示すように、配管131、132、141、142には、エアダンパ160、161、162、163が夫々配置される。これらのエアダンパを操作することにより、配管131、132、141、142を空気が通過する面積を変更することができるので、配管131、132、141、142を通過する空気流量を個別に調整できる。
ボイラ101では、制御装置200によって生成された制御信号15(図1参照)を用いて、エアダンパ160、161、162、163などの機器を操作する。尚、本実施例では、エアダンパ160、161、162、163などの機器のことを操作端と呼び、これを操作するのに必要な指令信号を操作信号と呼ぶ。
以降では、本発明の制御装置200を上記火力発電プラントに用い、操作端をバーナー102のエアダンパ162及びアフタエアポート103のエアダンパ163とし、被制御量をボイラより排出されるCO、NOx、及びHSの濃度とする場合について説明する。尚、本実施例では、操作端の操作量(エアダンパ162、163の開度)がモデル入力に、NOx、CO及びHS濃度がモデル出力になり、モデル出力夫々の最小化が学習及び探索の目的となる。
図13は、本発明の制御装置200を火力発電プラントに用いた場合に、画像表示装置920に表示される画面の一実施例であり、実施例1で示した図9に対応する画面である。
火力発電プラントでは、NOx、COといった排ガスの排出量に環境規制が課せられており、プラントはその環境規制値を満足するように運転することが望まれる。また、運用コストの面からも、NOxの還元処理に要するコストや、ボイラ101のHS腐食による劣化を防ぐという目的から、NOx、及びHS等をできるだけ低減することも望まれる。そのような要求に鑑み、図13では、被制御量であるNOx、CO、及びHS濃度に対し、制御上の目標を(1)制御保証値以下、及び(2)可能な限り低減、の2通りに設定できるようになっている。ここで、制御保証値は、前述のNOx等に対する環境規制値を考慮して設定される。
この制御上の目標は、最適解探索の目的関数設定、及び学習の評価値設定に反映させることができる。図13では、制御保証値・モデル出力重み係数設定画面3207(図9のモデル出力重み係数設定画面3007に対応)において、制御保証チェックボックス3208をチェックすることで、上記2種類の目標設定のうち、どちらを使用するかを選択することができる。チェックした項目に対しては、(1)制御保証値以下、の目標設定を使用し、制御保証値を数値ボックス3209より入力する。チェックされない項目については、(2)可能な限り低減、の目標設定を使用し、目的関数fの値を計算するための重み係数パラメータCiを数値ボックス3210より入力する。
図13に示すように制御保証値と重み係数を設定した場合、式(4)の最適解探索の目的関数fは、式(5)のように表される。
Figure 2010146068
ここで、fNOxはNOx濃度、fCOはCO濃度、fH2SはHS濃度(単位:ppm)を示す。即ち式(5)では、CO濃度が制御保証値(100ppm)以下の制約条件のもとで、計算した目的関数fが最小となるモデル入力条件が最適解となる。以上のように最適化の目的関数fを計算することにより、最適解探索部800(図1参照)は、CO濃度が制御保証値以下で、NOx濃度、及びHS濃度が最小となるモデル入力条件を探索し、操作方法学習部700(図1参照)は、探索したモデル入力条件へ到達する操作方法を学習することができる。尚、図13において、数値ボックス3200、3201、3202、3205、及び3206、チェックボックス3203、及び3204、並びにボタン3211、及び3212の機能については、図9の場合と同様である。
図14は、本発明の制御装置200を火力発電プラントに用いた場合に、画像表示装置920に表示される画面の一実施例であり、実施例1で示した図10に対応する画面である。図14では、図13で設定したモデル出力の制御保証値等の制御目標値に対して、それを満足する学習結果が得られているかどうかを判断できるようになっている。
プラント運転員は、学習結果表示画面3302に表示されるCO濃度が制御保証値以下で、NOx、及びHS濃度が充分に低減されているかどうかを確認し、これらを満足する場合は、ボタン3303を選択することで学習を終了させることができる。尚、図14において、探索結果表示画面3300、及びボタン3301の機能については、図10の場合と同様である。
以上説明したように、本発明のプラントの制御装置200を火力発電プラントに適用すれば、環境規制や運用コストに対する要求を満たす操作方法を学習することにより、火力発電プラントから排出されるNOx、CO、及びHS濃度の目標値を達成することができる。
本発明の実施例1によるプラントの制御装置の構成を示すブロック図である。 本発明の実施例1によるプラントの制御装置における、操作方法の学習時の動作フローチャートである。 本発明の実施例1によるプラントの制御装置における、操作方法学習部の構成を示すブロック図である。 本発明の実施例1によるプラントの制御装置における、モデル入力操作量決定アルゴリズムの概念図である。 本発明の実施例1によるプラントの制御装置における、モデル入力操作量決定時のパラメータ設定による影響を説明する図面である。 本発明の実施例1によるプラントの制御装置における、モデル入力操作量を決定するパラメータ特性を示す図面である。 本発明の実施例1によるプラントの制御装置における、モデル入力操作量決定の動作フローチャートである。 本発明の実施例1によるプラントの制御装置における、最適解探索の動作フローチャートである。 本発明の実施例1によるプラントの制御装置において、学習を実行する際に、画像表示装置に表示される画面の一例である。 本発明の実施例1によるプラントの制御装置において、学習及び探索の終了を判定する際に、画像表示装置に表示される画面の一例である。 火力発電プラントの構成を説明する図である。 火力発電プラントにおいて、エアーヒーター部分の拡大図である。 本発明の実施例2によるプラントの制御装置において、学習を実行する際に、画像表示装置に表示される画面の一例である。 本発明の実施例2によるプラントの制御装置において、学習及び探索の終了を判定する際に、画像表示装置に表示される画面の一例である。
符号の説明
1…計測信号、15…制御信号、90…入出力データ情報、100…プラント、200…制御装置、201…外部入力インターフェース、202…外部出力インターフェース、210…計測信号データベース、220…モデル構築データベース、230…学習情報データベース、240…探索情報データベース、250…制御ロジックデータベース、260…制御信号データベース、300…計測信号変換部、400…数値解析部、500…モデル、600…制御信号生成部、700…操作方法学習部、800…最適解探索部、900…外部入力装置、901…キーボード、902…マウス、910…保守ツール、911…外部入力インターフェース、912…データ送受信処理部、913…外部出力インターフェース、920…画像表示装置。

Claims (12)

  1. 制御・計測対象のプラントに制御信号を与えた時に取得する計測信号の値を推定するモデルと、
    前記モデルを用いて、前記計測信号に相当するモデル出力が目標値を達成するように、前記制御信号に相当するモデル入力の生成方法を学習する操作方法学習部と、
    前記操作方法学習部における学習の制約条件及び学習結果に関する情報を保存する学習情報データベースと、を備え、
    前記計測信号を用いてプラントの制御信号を計算し、この制御信号をプラントに送信するプラントの制御装置において、
    前記モデルを用いて、予め設定した制御目標及び制約条件を満足する所望のモデル出力が得られる運転条件に相当するモデル入力を探索する最適解探索部と、
    前記最適解探索部における探索の制約条件及び最適解探索に関する情報を保存する探索情報データベースと、を備え、
    前記操作方法学習部は、前記最適解探索部の探索結果である最適な運転条件に関する情報を用いてモデル入力を生成する、ことを特徴とするプラントの制御装置。
  2. 請求項1記載のプラントの制御装置において、
    前記操作方法学習部は、前記学習情報データベース及び前記探索情報データベースに保存された情報を用いて前記モデル入力の操作方法を決定するモデル入力生成機能と、前記モデルを操作した結果得られるプラントの特性値に相当するモデル出力を用いて前記モデルの操作に対する評価値を計算する評価値計算機能と、前記学習情報データベースに保存された情報を用いてモデル入力の操作方法を学習する操作学習機能のうち、少なくとも1つを備えるプラントの制御装置。
  3. 請求項2記載のプラントの制御装置において、
    前記モデル入力生成機能は、前記学習情報データベースに保存された学習結果を基に試行錯誤的に決定される基準操作量ベクトルを算出する機能と、前記探索情報データベースに保存された所望の運転条件に関する情報を基に決定された最良解移動ベクトルを算出する機能と、前記基準操作量ベクトルと前記最良解移動ベクトルとを基に所望の運転条件への指向性を持つ操作量ベクトルを算出する機能のうち、少なくとも1つを備えるプラントの制御装置。
  4. 請求項3記載のプラントの制御装置において、
    前記モデル入力生成機能は、前記操作量ベクトルを算出する際に、予め定めた一定のパラメータに基づいて算出する機能と、現在の運転条件から所望の運転条件までの距離情報を用いて適応的に調整して算出する機能のうち、少なくとも1つを備えるプラントの制御装置。
  5. 請求項1記載のプラントの制御装置において、
    画像表示装置と接続され、
    前記学習情報データベース及び前記探索情報データベースに保存された情報を前記画像表示装置に表示する機能と、前記操作方法学習部及び前記最適解探索部で用いる学習・探索条件が前記画像表示装置を介して設定される機能と、所望の運転条件の探索結果及び操作方法の学習結果を前記画像表示装置に表示する機能のうち、少なくとも1つを備えるプラントの制御装置。
  6. 火力発電プラントから取得する計測信号を用いて、前記火力発電プラントに与える制御信号を導出する制御信号生成部を備えた火力発電プラントの制御装置であって、
    前記計測信号は、前記火力発電プラントから排出されるガスに含まれる窒素酸化物、一酸化炭素、及び硫化水素の夫々の濃度のうち少なくとも1つを表す信号を含み、
    前記制御信号は、空気ダンパの開度、空気流量、燃料流量、排ガス再循環流量のうち少なくとも1つを決定する信号を含み、
    前記制御装置が、
    前記火力発電プラントに前記制御信号を与えた時の、前記計測信号の値を推定するモデルと、
    前記モデルを用いて、前記計測信号に相当するモデル出力が目標値を達成するように、前記制御信号に相当するモデル入力の生成方法を学習する操作方法学習部と、
    前記操作方法学習部における学習の制約条件及び学習結果に関する情報を保存する学習情報データベースと、
    前記モデルを用いて、予め設定した制御目標及び制約条件を満足する所望のモデル出力が得られる運転条件に相当するモデル入力を探索する最適解探索部と、
    前記最適解探索部における探索の制約条件及び最適解探索に関する情報を保存する探索情報データベースと、を備える、ことを特徴とする火力発電プラントの制御装置。
  7. 請求項6記載の火力発電プラントの制御装置において、
    前記探索情報データベースに保存される情報は、火力発電プラントの空気ダンパの開度、空気流量、燃料流量、排ガス再循環流量のうち少なくとも1つに関する所望のモデル出力が得られる運転条件を決定する信号を含み、
    前記操作方法学習部は、前記学習情報データベース及び前記探索情報データベースに保存された情報を用いて前記モデル入力の操作方法を決定するモデル入力生成機能と、前記モデルを操作した結果得られる火力発電プラントの特性値に相当するモデル出力を用いて前記モデルの操作に対する評価値を計算する評価値計算機能と、前記学習情報データベースに保存された情報を用いてモデル入力の操作方法を学習する操作学習機能のうち、少なくとも1つを備える火力発電プラントの制御装置。
  8. 請求項7記載の火力発電プラントの制御装置において、
    前記モデル入力生成機能は、前記学習情報データベースに保存された学習結果を基に試行錯誤的に決定される基準操作量ベクトルを算出する機能と、前記探索情報データベースに保存された所望の運転条件に関する情報を基に決定された最良解移動ベクトルを算出する機能と、前記基準操作量ベクトルと前記最良解移動ベクトルとを基に所望の運転条件への指向性を持つ操作量ベクトルを算出する機能のうち、少なくとも1つを備える火力発電プラントの制御装置。
  9. 請求項8記載の火力発電プラントの制御装置において、
    前記モデル入力生成機能は、前記操作量ベクトルを算出する際に、予め定めた一定のパラメータに基づいて算出する機能と、現在の運転条件から所望の運転条件までの距離情報を用いて適応的に調整して算出する機能のうち、少なくとも1つを備える火力発電プラントの制御装置。
  10. 請求項6記載の火力発電プラントの制御装置において、
    画像表示装置と接続され、
    前記学習情報データベース及び前記探索情報データベースに保存された情報を前記画像表示装置に表示する機能と、前記操作方法学習部及び前記最適解探索部で用いる学習・探索条件が前記画像表示装置を介して設定される機能と、所望の運転条件の探索結果及び操作方法の学習結果を前記画像表示装置に表示する機能のうち、少なくとも1つを備える火力発電プラントの制御装置。
  11. 請求項6記載の火力発電プラントの制御装置において、
    前記最適解探索部は、前記火力発電プラントから排出されるガスに含まれる窒素酸化物、一酸化炭素、及び硫化水素の夫々の濃度に対して、予め定めた制御保証値以下となるモデル入力条件と、最小となるモデル入力条件のうち、少なくとも1つを探索する機能を備える火力発電プラントの制御装置。
  12. 請求項6記載の火力発電プラントの制御装置において、
    前記操作方法学習部は、前記火力発電プラントから排出されるガスに含まれる窒素酸化物、一酸化炭素、及び硫化水素の夫々の濃度に対して、予め定めた制御保証値以下となる操作方法と、最小値となる操作方法のうち、少なくとも1つを学習する機能を備える火力発電プラントの制御装置。
JP2008319568A 2008-12-16 2008-12-16 プラントの制御装置及び火力発電プラントの制御装置 Pending JP2010146068A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008319568A JP2010146068A (ja) 2008-12-16 2008-12-16 プラントの制御装置及び火力発電プラントの制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008319568A JP2010146068A (ja) 2008-12-16 2008-12-16 プラントの制御装置及び火力発電プラントの制御装置

Publications (1)

Publication Number Publication Date
JP2010146068A true JP2010146068A (ja) 2010-07-01

Family

ID=42566493

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008319568A Pending JP2010146068A (ja) 2008-12-16 2008-12-16 プラントの制御装置及び火力発電プラントの制御装置

Country Status (1)

Country Link
JP (1) JP2010146068A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012053505A (ja) * 2010-08-31 2012-03-15 Hitachi Ltd プラントの制御装置及び火力発電プラントの制御装置
JP2014052929A (ja) * 2012-09-10 2014-03-20 Hitachi Ltd 火力プラントの制御装置及び制御方法
JP2017157112A (ja) * 2016-03-03 2017-09-07 三菱日立パワーシステムズ株式会社 制御パラメータ自動調整装置、制御パラメータ自動調整方法、及び制御パラメータ自動調整装置ネットワーク
WO2020045193A1 (ja) * 2018-08-28 2020-03-05 株式会社 Preferred Networks 訓練方法、訓練装置、学習済みモデル、推定方法、推定装置、プログラム及び非一時的コンピュータ可読媒体

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012053505A (ja) * 2010-08-31 2012-03-15 Hitachi Ltd プラントの制御装置及び火力発電プラントの制御装置
JP2014052929A (ja) * 2012-09-10 2014-03-20 Hitachi Ltd 火力プラントの制御装置及び制御方法
JP2017157112A (ja) * 2016-03-03 2017-09-07 三菱日立パワーシステムズ株式会社 制御パラメータ自動調整装置、制御パラメータ自動調整方法、及び制御パラメータ自動調整装置ネットワーク
US20170255177A1 (en) * 2016-03-03 2017-09-07 Mitsubishi Hitachi Power Systems, Ltd. Control Parameter Automatic-Adjustment Apparatus, Control Parameter Automatic-Adjustment Method, and Control Parameter Automatic-Adjustment Apparatus Network
US10732595B2 (en) 2016-03-03 2020-08-04 Mitsubishi Hitachi Power Systems, Ltd. Control parameter automatic-adjustment apparatus, control parameter automatic-adjustment method, and control parameter automatic-adjustment apparatus network
WO2020045193A1 (ja) * 2018-08-28 2020-03-05 株式会社 Preferred Networks 訓練方法、訓練装置、学習済みモデル、推定方法、推定装置、プログラム及び非一時的コンピュータ可読媒体

Similar Documents

Publication Publication Date Title
JP4627553B2 (ja) プラントの制御装置および火力発電プラントの制御装置
US8185216B2 (en) Plant controlling device and method, thermal power plant, and its control method
JP5251938B2 (ja) プラントの制御装置及び火力発電プラントの制御装置
US8554706B2 (en) Power plant control device which uses a model, a learning signal, a correction signal, and a manipulation signal
JP4423617B2 (ja) プラント制御装置
US8355996B2 (en) Plant control apparatus that uses a model to simulate the plant and a pattern base containing state information
JP5503563B2 (ja) プラントの制御装置及び火力発電プラントの制御装置
JP4876057B2 (ja) プラントの制御装置、及び火力発電プラントの制御装置
JP4974330B2 (ja) 制御装置
JP4741968B2 (ja) プラントの制御装置
JP5277064B2 (ja) プラントの制御装置、火力発電プラントの制御装置及び火力発電プラント
JP4989421B2 (ja) プラントの制御装置および火力発電プラントの制御装置
JP5410480B2 (ja) プラントの制御装置
JP2010146068A (ja) プラントの制御装置及び火力発電プラントの制御装置
JP5378288B2 (ja) プラントの制御装置及び火力発電プラントの制御装置
JP4627509B2 (ja) プラントの制御装置及びプラントの制御方法
JP5469226B2 (ja) 制御装置の保守ツール
JP2009070200A (ja) プラント運用適正化装置、プラント運用適正化方法およびプラント運用適正化プログラム
JP5203763B2 (ja) 石炭焚きボイラの炭種判別装置及び石炭焚きボイラの炭種判別方法
JP2008241220A (ja) ボイラの制御装置、及び制御方法