次に、本発明によるプラントの制御装置及び火力発電プラントの制御装置の実施例について図面を参照して説明する。
本発明に係るプラントの制御装置の実施例1、及び火力発電プラントの制御装置の実施例3の両者に共通した構成となるプラントの制御装置において、前記制御装置を構成するコスト評価部は、プラントの運転特性を計算する運転特性計算部より入力される運転特性値を用いて、プラントの運転コスト評価値を計算する運転コスト評価機能と、プラントの機器寿命特性を計算する機器特性計算部より入力される機器特性値を用いて、プラントの機器コスト評価値を計算する機器コスト評価機能と、前記2種類のコスト評価値を用いて運転コスト評価指標値及び機器コスト評価指標値を計算するコスト評価指標計算機能のうち、少なくとも1つを備えることが望ましい。
また、前記コスト評価指標計算機能には、現在の操作条件から仮想的にプラントを操作する一連の操作結果に対して獲得する運転コスト評価値または機器コスト評価値の時間平均である、運転コスト評価指標値または運転コスト評価指標値のうち、少なくとも1つを計算する機能を備えることが望ましい。
また、前記制御装置を構成する操作方法学習部は、前記コスト評価部が計算したコスト評価指標値の重み付け和である、スカラー評価値を計算するスカラー評価値計算機能と、前記スカラー評価値を基に、操作方法の生成ロジックを修正する学習処理機能と、前記運転特性計算部及び機器特性計算部に入力される、プラントの仮想的な操作信号を生成する操作方法管理機能のうち、少なくとも1つを備えることが望ましい。
前記制御装置は画像表示装置と接続され、前記コスト評価部で用いるコスト評価指標条件の種類、評価期間及び重み係数を、画像表示装置を通じて設定する機能と、操作方法学習部で用いる最大操作回数及び最大学習回数を、画像表示装置を通じて設定する機能のうち、少なくとも1つを備えることが望ましい。
また、前記制御装置において、前記制御信号生成部においてプラントに出力する制御信号を生成する際に、前回の操作時に学習した前記コスト評価指標値と、今回学習したコスト評価指標値を、それぞれレーダーチャートとして画像表示装置に表示させる機能と、その表示内容に従って学習結果を制御信号の生成に反映させるかどうかを選択できる機能のうち、少なくとも1つを備えることが望ましい。
また、本発明に係るプラントの制御装置の実施例2、及び火力発電プラントの制御装置の実施例3の両者に共通した構成となるプラントの制御装置において、前記制御装置を構成する操作方法学習部は、前記コスト評価部が計算したコスト評価指標値に対する多目的ランキング評価によりランク評価値を計算するランク評価値計算機能と、前記ランク評価値を基に、操作方法の生成ロジックを修正する学習処理機能と、前記運転特性計算部及び機器特性計算部に入力される、プラントの仮想的な操作信号を生成する操作方法管理機能のうち、少なくとも1つを備えることが望ましい。
前記制御装置は画像表示装置と接続され、前記コスト評価部で用いるコスト評価指標条件の種類、評価期間及び制約値を、画像表示装置を通じて設定する機能と、前記操作方法学習部及びコスト評価部で用いる最大操作回数,学習実行判定閾値,最大学習回数及びランク評価値係数を、画像表示装置を通じて設定する機能のうち、少なくとも1つを備えることが望ましい。
また、前記制御装置において、前記制御信号生成部においてプラントに出力する制御信号を生成する際に、前回の操作時に学習した前記コスト評価指標値と、今回学習したコスト評価指標値を、それぞれレーダーチャートとして画像表示装置に表示させる機能と、そのレーダーチャート上に、設定した各評価指標値の制約値を表示させる機能と、その表示内容に従って学習結果を制御信号の生成に反映させるかどうかを選択できる機能と、前記制約値情報を用いて、学習結果を制御信号の生成に反映させるかどうかの処理を自動実行する機能のうち、少なくとも1つを備えることが望ましい。
また、本発明の制御装置を火力発電プラントに適用する実施例3において、火力発電プラントから取得する計測信号を用いて、火力発電プラントに与える制御信号を導出する制御信号生成部を備えた構成の火力発電プラントの制御装置となる。
これらの計測信号は、火力発電プラントから排出されるガスに含まれる窒素酸化物,一酸化炭素,二酸化炭素,窒素,酸素,灰中未燃分及び硫化水素の濃度のうち少なくとも1つを表す信号を含む。また制御信号は、空気ダンパの開度,空気流量,燃料流量,排ガス再循環流量のうち少なくとも1つを決定する信号を含む。
前記制御装置は、前記火力発電プラントの状態量である計測信号を取り込んで保存する計測信号データベースと、火力発電プラントの運転計画に関する情報及び、火力発電プラントの運転特性を推定するのに必要な情報を保存する運転情報データベースと、前記運転情報データベースに保存されたデータを用いて前記火力発電プラントに制御信号を与えたときに該プラントの状態量である前記計測信号に相当する運転特性値を計算する運転特性計算部と、火力発電プラントの機器寿命や交換コストに関する特性を推定するのに必要な情報を保存する機器情報データベースと、前記機器情報データベースに保存されたデータを用いて前記火力発電プラントに制御信号を与えた時に該プラントの機器の寿命や交換コストに相当する機器特性値を計算する機器特性計算部と、前記運転特性計算部、及び機器特性計算部が計算した特性値を用いて火力発電プラントの運用コストを評価するコスト評価部と、前記コスト評価部におけるコスト評価の実行条件に相当するコスト評価情報データを保存するコスト評価情報データベースと、前記運転特性計算部、機器特性計算部及びコスト評価部を用いて、前記コスト評価部が出力するコスト評価値が最適となるように火力発電プラントに与える制御信号の生成方法を自律学習する操作方法学習部と、前記操作方法学習部における学習の制約条件及び学習結果に関する学習情報データを保存する学習情報データベースと、前記計測信号データベースの計測信号、及び前記学習情報データベースの学習情報データを用いて火力発電プラントに対して送信される制御信号を演算する制御信号生成部とを備える。
また、上記の各構成,機能,処理部,処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成,機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム,テーブル,ファイル,測定情報,算出情報等の情報は、メモリや、ハードディスク,SSD(Solid State Drive)等の記録装置、または、ICカード,SDカード,DVD等の記録媒体に置くことができる。よって、各処理,各構成は、処理部,処理ユニット,プログラムモジュールなどとして各機能を実現可能である。
次に、本発明の実施例であるプラントの制御装置及び火力発電プラントの制御装置について図面を参照して説明する。
〔第1実施例〕
まず、本発明の第1実施例であるプラントの制御装置について図面を参照して説明する。
図1は、本発明の第1実施例によるプラントの制御装置のシステム構成図である。図1に示すように、制御対象のプラント100は、制御装置200によって制御される。
プラント100を制御する制御装置200は保守ツール910と接続されているので、プラント100の運転員は、保守ツール910に接続された外部入力装置900と画像表示装置(例えばCRTディスプレイ)920とを介して、制御装置200を制御することができる。
制御装置200には、演算装置として、計測信号変換部300,運転特性計算部400,機器特性計算部500,コスト評価部600,操作方法学習部700、及び制御信号生成部800が夫々備えられた構成となっている。
また制御装置200には、データベース(DB)として、計測信号データベース210,運転情報データベース220,機器情報データベース230,コスト評価情報データベース240,学習情報データベース250,制御ロジックデータベース260、及び制御信号データベース270が夫々設けられている。
また制御装置200には、外部とのインターフェースとして、外部入力インターフェース201、及び外部出力インターフェース202が設けられている。
そしてこの制御装置200では、外部入力インターフェース201を介して、プラント100から該プラントの各種状態量を計測した計測信号1を制御装置200の計測信号データベース210に取り込んでおり、また、制御装置200の制御信号生成部800から外部出力インターフェース202を介して、制御対象のプラント100に対して該プラントを制御する制御信号16を、例えば供給する空気流量を制御する制御信号17として出力するように構成されている。
この制御装置200では、外部入力インターフェース201を介して前記プラント100から取り込んだプラント100の状態量を計測した計測信号2は、計測信号データベース210に保存される。
また、制御装置200に設けた制御信号生成部800にて生成される制御信号16は、制御装置200に設けた制御信号データベース270に保存されると共に、外部出力インターフェース202から前記プラント100に対する制御信号17として出力される。
制御装置200に設けた計測信号変換部300では、計測信号データベース210に保存された計測信号データ3を前処理計測データ4に変換する。前処理計測データ4は、該プラントより取得した計測信号データ3を、運転特性計算部400及び機器特性計算部500にて使用するデータの形式及び単位に適合するように前処理変換したものである。また、計測信号データ3は、制御信号16を導出するために、制御装置200に設けた制御信号生成部800に入力される。
制御装置200に設けた運転特性計算部400はプラント100の運転特性を模擬する機能(運転特性モデル)を持つ。即ち、制御信号17をプラント100に与え、その制御結果に対する計測信号1を得るのと同等の機能を模擬演算する。この模擬演算のために、前記計測信号変換部300によって変換された前処理計測データ4、運転情報データベース220から取り込んだ運転情報データ5、及び制御装置200に設けた操作方法学習部700から出力される模擬制御信号7を使用する。運転情報データ5には、プラントの運転条件や時系列の運転計画に関する情報が含まれる。運転特性計算部400が出力する運転特性値8には、例えばプラントの燃料流量,生産効率,排出物流量,温度及び圧力等の情報が含まれる。運転特性計算部400は、運転情報データ5に含まれる運転条件及び運転計画情報を用いて、任意の時刻の運転特性値8を模擬計算することができる。例えば、現在時刻を開始とする時系列の模擬制御信号7が入力されると、時系列の運転特性値が得られる。
制御装置200に設けた機器特性計算部500は、プラント100の各種機器の状態からその劣化度及び交換時期を計算する機能(機器特性モデル)を持つ。この計算のため、前記計測信号変換部300によって変換された前処理計測データ4、機器情報データベース230から取り込んだ機器情報データ6、及び前記操作方法学習部700から出力される模擬制御信号7を使用する。機器情報データ6には、プラントの各種機器の寿命やコストに関する情報が含まれる。機器特性計算部500が出力する機器特性値9には、計算された各機器の交換時期及びコストに関する情報が含まれる。機器特性計算部500は、機器情報データ6に含まれる機器寿命及びコストに関する情報を用いて、任意の時刻の機器特性値9を模擬計算することができる。例えば、現在時刻を開始とする時系列の模擬制御信号7が入力されると、時系列の機器特性値が得られる。
制御装置200に設けたコスト評価部600では、前記運転特性値8,機器特性値9、並びにコスト評価情報データベース240から取り込んだコスト評価情報10を用いて、現在のプラント運転状態に対するコスト評価を実施する。詳細は後述するが、コスト評価部600ではプラントのエネルギー効率や廃棄物処理に関する運転コスト、及び各種機器の交換寿命に関するコストを評価し、コスト評価値11として、前記操作方法学習部700に出力する。
制御装置200に設けた操作方法学習部700では、学習情報データベース250から取り込んだ学習情報12を用いて、プラント100に対する模擬操作を実行する。模擬操作の出力である模擬制御信号7は前記運転特性計算部400、及び前記機器特性計算部500に出力される。そして、その模擬操作の結果前記コスト評価部600において計算されたコスト評価値11を取り込み、それを基にプラント100の操作方法を学習する。学習した結果は、学習結果データ13として前記学習情報データベース250に出力する。
制御装置200に設けた制御信号生成部800では、学習情報データベース250より出力された学習情報データ14、及び制御ロジックデータベース260に保存された制御ロジックデータ15を用いて、計測信号1が望ましい値となるように制御信号16を生成する。
この制御ロジックデータベース260には、制御ロジックデータ15を算出する制御回路、及び制御パラメータが保存される。この制御回路には、従来技術として公知のPI(比例・積分)制御を用いることができる。
このように、制御装置200の動作において、プラントの運転特性及び機器特性を模擬し、その特性を基に算出したコスト評価値を最小化するように操作方法を学習するメカニズムを具備することにより、プラントの運用コスト及び機器寿命を考慮した運転制御を実行できるため、プラント運用経費の低減に寄与できる。
尚、制御装置200に設けたコスト評価部600、及び操作方法学習部700の詳細な機能については、後述する。
プラント100の運転員は、キーボード901とマウス902で構成される外部入力装置900、制御装置200とデータを送受信できる保守ツール910、及び画像表示装置920を用いることにより、制御装置200に備えられている種々のデータベースに保存された情報にアクセスすることができる。制御装置200は保守ツール910と入出力データ情報90をやり取りするための入力部又は出力部を有する。
また、これらの装置を用いることにより、制御装置200の運転特性計算部400,機器特性計算部500,コスト評価部600、及び操作方法学習部700で用いる特性パラメータ値,機器情報値,適応修正の実行条件等の設定情報を入力することができる。
保守ツール910は、外部入力インターフェース911,データ送受信処理部912、及び外部出力インターフェース913で構成され、データ送受信処理部912を介して制御装置200とデータを送受信できる。
外部入力装置900で生成した保守ツール入力信号91は、外部入力インターフェース911を介して保守ツール910に取り込まれる。保守ツール910のデータ送受信処理部912では、保守ツール入力信号92の情報に従って、制御装置200から入出力データ情報90を取得する。
また、データ送受信処理部912では、保守ツール入力信号92の情報に従って、制御装置200の運転特性計算部400,機器特性計算部500,コスト評価部600、及び操作方法学習部700で用いる特性パラメータ値,機器情報値,学習の実行条件等の設定情報を含む入出力データ情報90を出力する。
データ送受信処理部912では、入出力データ情報90を処理した結果得られる保守ツール出力信号93を、外部出力インターフェース913に送信する。外部出力インターフェース913から送信された保守ツール出力信号94は、画像表示装置920に表示される。
尚、上記の制御装置200では、計測信号データベース210,運転情報データベース220,機器情報データベース230,コスト評価情報データベース240,学習情報データベース250,制御ロジックデータベース260、及び制御信号データベース270が制御装置200の内部に配置されるが、これらの全て、あるいは一部を制御装置200の外部に配置することもできる。
図2は、図1に示した第1実施例であるプラントの制御装置における操作方法の学習の手順を示すフローチャート図である。
図2では、第1実施例のプラントの制御装置200に設置された運転特性計算部400によるプラント運転特性の計算、機器特性計算部500によるプラント機器特性の計算、コスト評価部600によるプラントのコスト評価,操作方法学習部700による操作方法の学習の動作を表すフローチャートを示している。
図2に示したフローチャートは、ステップ1000,1100,1200,1300,1400,1500,1600,1700,1800,1900,2000を組み合わせて実行する。以下では、夫々のステップについて説明する。
制御装置200の動作開始後、操作方法の学習条件及びコスト評価条件を設定するステップ1000では、操作方法学習時の最大学習回数,最大操作回数及びコスト評価指標等、種々のパラメータ値を設定する。学習では、プラントの任意の操作条件から仮想的に操作を実行し、その操作結果に対する運転特性値及び機器特性値からコスト評価値を求め、それを最小化するように操作方法を学習する。この一連の操作及び学習処理を定数回(最大操作回数)反復実行することをエピソードと定義する。学習は、このエピソードを定数回(最大学習回数)繰り返すことで実行される。学習は、コスト評価値の良い(値の小さい)操作をより多く経験するほど、コスト低減効果の大きい操作方法を学習できる。プラントの操作条件は前記模擬制御信号7に相当し、これはプラントの実際の操作端の設定値をそのまま用いてもよいし、それらをパラメータ変換したものを用いてもよい。
次に、プラント特性モデルを修正するステップ1100では、制御装置200の運転特性計算部400及び機器特性計算部500に対して前処理計測データ4を入力し、プラント運転特性モデル及び機器特性モデルを修正する。このように、プラントから得られた計測データを用いて各特性モデルを修正することにより、モデルの特性を実機プラントに近づけより正確なコスト評価が可能となり、学習する操作方法の制御性能向上に寄与できる。
次に、学習回数を初期化するステップ1200では、操作方法学習部700による学習のエピソードの繰り返し回数iを初期化する。
次に、操作回数及び操作条件を初期化するステップ1300では、操作方法学習部700による操作方法の学習時の1エピソードにおける操作回数t及び操作条件を初期化する。
次に、操作条件を変更するステップ1400では、操作方法学習部700を動作させて、プラントの操作条件を仮想的に変更する。
次に、運転特性及び機器特性を計算するステップ1500では、運転特性計算部400及び機器特性計算部500を動作させて、変更後の操作条件に対するプラントの運転特性値8及び機器特性値9を計算する。このプラントの運転特性及び機器特性計算は、操作条件の変更が実行される毎に実行する。したがって、一連の操作に対して時系列の運転特性値及び機器特性値が得られることとなる。
次に、コスト評価を実行するステップ1600では、制御装置200のコスト評価部600を動作させて、前記ステップ1500で計算したプラントの運転特性及び機器特性に対するコスト評価値を計算する。
次に、操作方法を学習するステップ1700では、前記ステップ1600で計算したコスト評価値を用いて、運転特性計算部400及び機器特性計算部500の出力する運転特性値8及び機器特性値9が望ましい値となるような模擬制御信号7の操作方法を、操作方法学習部700を動作させて学習する。学習に用いるアルゴリズムとしては、強化学習理論等の公知の手法を用いることができる。
次の、操作の反復回数を判定するステップ1800は分岐である。操作回数tが、前記ステップ1000で設定した最大操作回数以下となる場合はtを1加算してステップ1400に戻り、最大操作回数より大きい場合はステップ1900へ進む。
次の、学習回数を判定するステップ1900も分岐である。学習回数iが、前記ステップ1000で設定した最大学習回数以下となる場合はiを1加算してステップ1300に戻り、最大学習回数より大きい場合はステップ2000へ進む。
次に、学習結果を学習情報データベースに保存するステップ2000では、操作方法の学習結果である、学習結果データ13を前記学習情報データベース250に保存し、制御装置200における一連の操作方法の学習動作を終了させるステップに進む。
以上の動作によって、本発明の実施例1における制御装置200によるプラント100の制御では、プラント100の運転員が設定した実行条件に基づき、望ましい運転特性及び機器特性が得られるプラントの操作方法を自律的に学習できる。更には、学習において操作に対するコスト評価値を最小化する操作方法を学習する機能を具備させたことにより、プラントの運用コスト及び機器寿命を考慮した運転制御を実行できるため、プラント運用経費の低減に寄与できる。
次に、前記制御装置200におけるコスト評価部600の動作について、図3及び図4を用いて詳細に説明する。図3は、コスト評価部600の詳細な構成図であり、図1に示した制御装置200において、運転特性計算部400,機器特性計算部500,コスト評価部600,操作方法学習部700及びコスト評価情報データベース240を含む部分を詳細に示したものである。
前記コスト評価部600は、運転コスト評価機能601,機器コスト評価機能602及びコスト評価指標計算機能603で構成される。
運転コスト評価機能601は、プラントを仮想的に操作することで運転特性計算部400より得られる時系列の運転特性値8に対して、コスト評価情報データベース240に保存されているコスト評価情報10を用いて運転コスト評価値60を評価する。運転特性値8には、例えばプラントの燃料流量,生産効率,排出物流量等が含まれる。運転コスト評価値60は、プラントの燃料消費コスト,生産効率コスト,排出物処理コスト等の各評価項目について計算したコスト評価値の総和として、〔数1〕により計算される。
ここで、amtは操作回数tにおける評価項目mの運転コスト評価値であり(mは運転コスト評価項目の添字)、運転コスト評価値は操作回数tにおける運転コスト評価値60を意味する。
コスト評価項目に含まれる要素については、前記のものに限定されず、プラントの実施態様及びプラント運用に関するニーズに応じて種々設定が可能である。また、それぞれのコスト評価項目の導出方法については、実施態様や運用に則した公知の方法を用いることができるため、ここでの詳細な記述は省略する。
また、機器コスト評価機能602は、プラントを仮想的に操作することで機器特性計算部500より得られる時系列の機器特性値9に対して、コスト評価情報データベース240に保存されているコスト評価情報10を用いて機器コスト評価値61を評価する。機器コスト評価値61は、操作回数tにおけるプラントの各種機器毎の交換コストbnt(nは機器の添字)を、現在時刻から機器寿命(交換時期)までの時間cntで除した値の総和として、〔数2〕により計算される。
機器コスト評価値は、機器の交換コストが大きいほど、また機器の寿命が短いほど大きくなる。
コスト評価指標計算機能603では、上記のようにして求めたプラントの運転コスト評価値60及び機器コスト評価値61に対して、コスト評価情報データベース240に保存されているコスト評価情報10を用いて、任意の評価期間に対する平均値である、操作回数tにおける運転コスト評価指標値及び機器コスト評価指標値を、〔数3〕〔数4〕により計算する。ここでk,lは評価期間に応じて決定されるコスト評価指標値の添字である。
〔数3〕〔数4〕においてTk,Tlはそれぞれ、運転コスト評価指標値及び機器コスト評価指標値の最大評価期間であり、正の整数値で与えられる。ここで、前記コスト評価指標値及びその計算式〔数3〕〔数4〕について、図4を用いて説明する。図4及び〔数3〕から、各操作において計算される運転コスト評価値に対して、運転コスト評価指標値は現在の操作回数tからTk回前までの操作で獲得した運転コスト評価値の平均として計算される(操作回数tがTkより小さい値の場合は、t=0からtまでの平均として計算する)。図4では、Tk=5とした場合の、操作回数に対する運転コスト評価値及び、運転コスト評価指標値を示している。図4に示すように、t=5の場合の運転コスト評価指標値の値は、t=1から5の期間に獲得したコスト評価値の平均値として求まる。機器コストに関しても同様であり、このように、任意の評価期間Tk,Tlに対してコスト評価指標値を計算することによって、操作方法の学習時に現在の操作結果だけでなく、過去の一連の操作結果がプラントのコスト評価値に与える影響を考慮できる。これにより、現在のコスト評価値のみを考慮する場合に比べて、経時的なプラント特性の変化にも対応した、コスト低減に繋がる安定した制御特性を得ることができる。また、これらのコスト評価指標値は任意の評価期間に対して複数考慮できるため、望ましい制御特性のニーズに応じた柔軟な操作方法の学習が可能である。
上記の手順で計算した運転コスト評価指標値及び機器コスト評価指標値は、コスト評価値11として、前記操作方法学習部700に出力される。
以下では、上記に示した前記制御装置200に設けたコスト評価部600における運転コスト評価機能601,機器コスト評価機能602及びコスト評価指標計算機能603によるコスト評価のアルゴリズムについて、そのフローチャートを参照しながら説明する。
図5は、前記コスト評価部600のアルゴリズム動作を示すフローチャートであり、図2のフローチャートにおけるコストを評価するステップ1600に相当する。
図5に示したフローチャートは、ステップ1610,1620,1630を組み合わせて実行する。以下では、夫々のステップについて説明する。
コスト評価のアルゴリズムを開始後、運転コストを計算するステップ1610では、運転コスト評価機能601を動作させて、前述の処理内容に従い運転コスト60を計算する。
次に、機器コストを計算するステップ1620では、機器コスト評価機能602を動作させて、前述の処理内容に従い機器寿命コスト61を計算する。
最後に、前記運転コスト評価指標値,機器コスト評価指標値を計算するステップ1630では、コスト評価指標計算機能603を動作させて、前述の処理内容に従い、運転コスト評価指標値及び機器コスト評価指標値を計算し、コスト評価のアルゴリズムを終了させるステップに進む。
尚、コスト評価部600は、前記運転情報データベース220と運転特性計算部400の組み合わせ又は機器情報データベース230と機器特性計算部500の組み合わせのいずれか一つを含むこととしても良い。以上で、本発明のコスト評価部600の詳細な動作の説明を終了する。
次に、前記制御装置200における操作方法学習部700の動作について、図6を用いて詳細に説明する。図6は、操作方法学習部700の詳細な構成図であり、図1に示した制御装置200において、運転特性計算部400,機器特性計算部500,コスト評価部600,操作方法学習部700及び学習情報データベース250を含む部分を詳細に示したものである。
前記操作方法学習部700は、スカラー評価値計算機能701,操作方法管理機能702及び学習処理機能703で構成される。
スカラー評価値計算機能701には、前記コスト評価部にて計算・出力されたコスト評価値11が入力される。コスト評価値11は、前記運転コスト評価指標値及び機器コスト評価指標値からなるため、これらを〔数5〕によってスカラー評価値70(Ft)に変換する。
〔数5〕においてwk,wlは夫々運転コスト評価指標及び機器コスト評価指標の重み係数であり、学習情報12として学習情報データベース250より入力される。Kは運転コスト評価指標の集合、Lは機器コスト評価指標の集合である。計算したスカラー評価値70は、学習処理機能702に出力される。
操作方法管理機能703はプラントの模擬制御信号7を生成する機能を持つ。操作方法の学習とは、この模擬制御信号7を生成する操作ロジックを、学習処理機能702を用いて修正することに相当する。すなわち、学習処理機能702を動作させ、スカラー評価値70を最小化するように、模擬制御信号7を生成する操作ロジックパラメータ71を修正する。学習した操作ロジックパラメータ71を含む学習結果データ13は、前記学習情報データベース250に保存される。
以下では、上記に示した前記制御装置200に設けた操作方法学習部700におけるスカラー評価値計算機能701,操作方法管理機能702及び学習処理機能703による操作方法学習のアルゴリズムについて、図7のフローチャートを参照しながら説明する。
図7は、前記操作方法学習部700のアルゴリズム動作を示すフローチャートであり、図2のフローチャートにおける操作方法を学習するステップ1700に相当する。
図7に示したフローチャートは、ステップ1710,1720を組み合わせて実行する。以下では、夫々のステップについて説明する。
操作方法学習のアルゴリズム開始後、スカラー評価値を計算するステップ1710では、スカラー評価値計算機能701を動作させて、前述の処理内容に従いスカラー評価値70を計算する。
次に、操作方法を学習するステップ1720では、学習処理機能702及び操作方法管理機能703を動作させて、前述の処理内容に従い操作方法を学習し、操作方法学習のアルゴリズムを終了させるステップに進む。
このように、操作方法学習部700では、コスト評価部600で評価したコスト評価値11の重み付け和を最小化するように、操作方法を学習する。これにより、制御装置200では、プラント100に対して、その運転コスト及び機器コストの低減効果が得られるように制御が実行される。以上で、本発明の操作方法学習部700の詳細な動作の説明を終了する。
次に、第1実施例であるプラントの制御装置において、制御装置200とデータを送受信できる保守ツール910の外部出力インターフェース913から送信された保守ツール出力信号94を表示する画像表示装置920にて表示される画面について、図8及び図9を用いて説明する。図8及び図9は、画像表示装置920に表示される画面の一具体例である。
図8は第1実施例であるプラントの制御装置において、学習時に使用する前記コスト評価指標及び、実行条件を設定する際に前記画像表示装置920に表示される画面例であり、第1実施例のプラントの制御装置における制御の手順を示す図2のフローチャートにおける、実行条件を設定するステップ1000で使用する。
この図8に示した画面では、操作方法の学習時に使用するコスト評価指標について、種類,評価期間,スカラー評価値計算時の重み係数を設定することで、任意の評価指標を定義することができる。また、学習の実行時に使用する最大操作回数及び最大学習回数を設定することができる。
図8に示す画面が前記画像表示装置920に表示された状態で、外部入力装置900のマウス902を操作して画面上の数値ボックスにフォーカスを移し、キーボード901を用いることで数値を入力できる。また、矢印キーが表示されたプルダウンボタンへフォーカスを移しボタンを選択することでメニューリストが開き、任意のメニューを選択することができる。
図8に示した画面では、まず、コスト評価指標設定において、評価指標の種類を選択するプルダウンメニュー3000から、定義するコスト評価指標が運転コストに関するものか、機器コストに関するものかを選択することができる。次に、数値ボックス3001及び3002から、定義するコスト評価指標の評価期間(Tk,Tl)及び重み係数(wk,wl)を任意に設定できる。
設定後、ボタン3003を選択することで、設定した新たなコスト評価指標をコスト評価指標リスト3004に追加できる。既に定義したコスト評価指標をリストから削除する場合には、削除したい項目をマウス902により選択し(図8中に灰色で表示)、ボタン3005を選択することでリストから削除できる。
図8に示した画面では、次に、実行条件設定において、学習時に使用する最大操作回数及び最大学習回数を、数値ボックスを3006及び3007より設定できる。
以上の実行条件設定の終了後、ボタン3008を選択すると、コスト評価指標及び実行条件設定を終了し、運転特性計算機能400及び機器特性計算機能500を修正する図2のステップ1100に進む。
図9は第1実施例であるプラントの制御装置において、学習した操作方法を用いて、プラントの制御信号を生成する際に画像表示装置920に表示される画面例であり、第1実施例のプラントの制御装置における、図1の前記制御信号生成部800において、制御信号16を生成する際に表示される画面の一例である。
この図9に示した学習結果表示画面では、前回の操作時(学習前)と今回の操作時(学習後)における、学習において最終的に獲得した一連の操作における運転コスト評価指標値,機器コスト評価指標値が、グラフ3100、及び3101にレーダーチャートで表示される。レーダーチャート3102は、図8の画面表示で定義したコスト評価指標別に、最終的に獲得した評価指標値を線で結び表示しており、数値ボックス3103には、評価指標の値が表示される。コスト評価指標値は値が小さいほど望ましい値であるため、レーダーチャートの面積が小さいほど望ましい制御結果を得ることができる。
プラントの運転員は、図9に示した学習結果表示画面に表示されるグラフ3100及び3101を見ながら、学習前後でコスト評価指標値がどのように変化したかを確認することができる。各コスト評価指標値が望ましい値となり制御実行可能と判断した場合には、ボタン3104を選択することで、前記制御信号生成部800に対して学習情報データ14が入力され、制御信号16が生成される。また、望ましいコスト評価指標値が得られず所望の制御効果が得られない場合、またはプラントの運転状態が悪化する場合には、ボタン3105を選択することで、前記制御信号生成部800に対する学習情報データ14の入力をキャンセルすることができる。以上の処理が終了後には、再び図2の操作方法を学習するフローチャートが実行される。
このように、第1実施例のプラント制御装置においては、図9に示した学習結果表示画面に表示される情報に応じて、前記制御信号生成部800における制御信号16の生成時に学習結果を反映させるかどうかを決定できる機能を具備させたことにより、学習で望ましい制御効果が得られた場合のみ、学習結果を制御信号に反映させることができるため、学習が失敗した場合にプラント100の運転に悪影響を及ぼすことを回避できる。
上記した本実施例のプラントの制御装置では、前記コスト評価部600において計算された、任意の評価期間に対するコスト評価指標値を用いて操作方法を学習することにより、経時的なプラント特性の変化にも対応した、コスト低減に繋がる安定した制御特性を得ることができる。
以上で、第1実施例であるプラントの制御装置における画像表示装置920に表示される画面についての説明を終了する。
〔第2実施例〕
次に、本発明の第2実施例であるプラントの制御装置について図面を参照して説明する。
図10は、本発明の第2実施例によるプラントの制御装置のシステム構成図である。図10に示した本発明の第2実施例において、制御装置200に設けたコスト評価部600では、前記運転特性計算部400が計算する運転特性値8、前記機器特性計算部500が計算する機器特性値9、並びにコスト評価情報データベース240から取り込んだコスト評価情報10を用いて、現在のプラント運転状態に対するコスト評価を実行し、コスト評価値11として、前記コスト評価情報データベース240に出力する。
制御装置200に設けた操作方法学習部700では、学習情報データベース250から取り込んだ学習情報12を用いて、プラント100に対する模擬操作を実行する。模擬操作の出力である模擬制御信号7は前記運転特性計算部400、及び前記機器特性計算部500に出力される。そして、その模擬操作の結果前記コスト評価部600において計算され、コスト評価情報データベース240に保存されたコスト評価値18を取り込み、それを基にプラント100の操作方法を学習する。学習した結果は、学習結果データ13として前記学習情報データベース250に出力する。
以上の制御装置200における運転特性計算部400,機器特性計算部500,コスト評価部600,操作方法学習部700,コスト評価情報データベース240及び学習情報データベース250の各機能を除く部分は、第1実施例と同様の構成及び機能を具備しており、説明を省略する。
図11は、図10に示した第2実施例であるプラントの制御装置における操作方法の学習の手順を示すフローチャート図である。
図11では、第2実施例のプラントの制御装置200に設置された運転特性計算部400によるプラント運転特性の計算、機器特性計算部500によるプラント機器特性の計算、コスト評価部600によるプラントのコスト評価、操作方法学習部700による操作方法の学習の動作を表すフローチャートを示している。
図2に示したフローチャートは、ステップ1000,1100,1200,1300,1400,1500,1600,1700,1800,1900,2000,2100を組み合わせて実行する。以下では、夫々のステップについて、図2に示した本発明の実施例1と実施が異なる部分に注目して説明する。
制御装置200の動作開始後、操作方法の学習条件及びコスト評価条件を設定するステップ1000では、操作方法学習時の最大学習回数,最大操作回数,学習実行判定閾値λ及びコスト評価指標等、種々のパラメータ値を設定する。
次の、プラント特性モデルを修正するステップ1100からコスト評価を実行するステップ1600までの一連の処理内容は、図2の本発明の第1実施例と同様であり、ここでは説明を省略する。
次の、操作の反復回数を判定するステップ1700は分岐である。操作回数tが、前記ステップ1000で設定した最大操作回数以下となる場合はtを1加算してステップ1400に戻り、最大操作回数より大きい場合はステップ1800へ進む。
次の、操作方法の学習実行を判定するステップ1800は分岐である。学習回数iがステップ1000で設定した学習実行判定閾値λの整数倍となる場合はステップ1900に進み、そうでない場合はステップ2000に進む。
次に、操作方法を学習するステップ1900では、前記ステップ1600で計算したコスト評価値を用いて、運転特性計算部400及び機器特性計算部500の出力する運転特性値8及び機器特性値9が望ましい値となるような模擬制御信号7の操作方法を、操作方法学習部700を動作させて学習する。
次の、学習回数を判定するステップ2000は分岐である。学習回数iが、前記ステップ1000で設定した最大学習回数以下となる場合はiを1加算してステップ1300に戻り、最大学習回数より大きい場合はステップ2100へ進む。
次に、学習結果を学習情報データベースに保存するステップ2100では、操作方法の学習結果である、学習結果データ13を前記学習情報データベース250に保存し、制御装置200における一連の操作方法の学習動作を終了させるステップに進む。
以上の動作によって、本発明の実施例1における制御装置200によるプラント100の制御では、プラント100の運転員が設定した実行条件に基づき、望ましい運転特性及び機器特性が得られるプラントの操作方法を自律的に学習できる。尚、本発明の第1実施例と異なる機能は、操作が実行される度に学習するのではなく、一連の操作(エピソード)を複数回(λ)反復実行後、操作方法を学習する点である。この機能を含むコスト評価部600及び操作方法学習部700の詳細動作については、後述する。
次に、本発明の第2実施例の制御装置200におけるコスト評価部600の動作について、図12を用いて詳細に説明する。図12は、コスト評価部600の詳細な構成図であり、図10に示した制御装置200において、運転特性計算部400,機器特性計算部500,コスト評価部600,操作方法学習部700及びコスト評価情報データベース240を含む部分を詳細に示したものである。
図12において、コスト評価部600を構成する運転コスト評価機能601,機器コスト評価機能602及びコスト評価指標計算機能603におけるコスト評価処理内容は、本発明の第1実施例にて前記したものと同様である。但し、コスト評価指標計算機能603にて計算した運転コスト評価指標値及び機器コスト評価指標値は、コスト評価値11として、コスト評価情報データベースに240に保存される。コスト評価情報データベース240に保存されたコスト評価値11は、前回の操作方法学習から一定回数(λ)学習が経過した後に、コスト評価値18として前記操作方法学習部700に出力される。
以下では、上記に示した本発明の第2実施例の前記制御装置200に設けたコスト評価部600における運転コスト評価機能601,機器コスト評価機能602及びコスト評価指標計算機能603によるコスト評価のアルゴリズムについて、そのフローチャートを参照しながら説明する。
図13は、前記コスト評価部600のアルゴリズム動作を示すフローチャートであり、図11のフローチャートにおけるコストを評価するステップ1600に相当する。
図13に示したフローチャートは、ステップ1610,1620,1630,1640を組み合わせて実行する。以下では、夫々のステップについて図2に示した本発明の実施例1と実施が異なる部分に注目して説明する。
コスト評価のアルゴリズムを開始後、運転コストを計算するステップ1610からコスト評価指標値を計算するステップ1630までの一連の処理内容は、図2の本発明の第1実施例と同様であり、ここでは説明を省略する。
次に、評価指標値の計算結果を保存するステップ1640では、前記ステップ1630で計算したコスト評価指標値を、前記コスト評価情報データベース240へ保存し、コスト評価のアルゴリズムを終了させるステップに進む。以上で、本発明のコスト評価部600の詳細な動作の説明を終了する。
次に、本発明の第2実施例の前記制御装置200における操作方法学習部700の動作について、図14,図15及び図16を用いて詳細に説明する。図14は、操作方法学習部700の詳細な構成図であり、図10に示した制御装置200において、運転特性計算部400,機器特性計算部500,コスト評価部600,操作方法学習部700及び学習情報データベース250を含む部分を詳細に示したものである。
前記操作方法学習部700は、ランク評価値計算機能2701,操作方法管理機能702及び学習処理機能703で構成される。
ランク評価値計算機能2701には、前記コスト評価情報データベース240に保存されたコスト評価値18が入力される。コスト評価値18には、前回の操作方法学習からλ回のエピソード実行分に相当するコスト評価指標データが含まれる。図15は、コスト評価情報データベース240に保存されるコスト評価指標データの態様の一例である。図15では、各エピソードの操作の結果計算された、運転コスト評価指標値及び機器コスト評価指標値が記載されており、具体的には、学習回数241,操作回数242に対するコスト評価指標値243がリスト表示される。コスト評価指標値243の内容は、図11のステップ1000で設定したコスト評価指標に応じて決定される。
上記の態様を持つコスト評価値18に対して、ランク評価値計算機能2701は、多目的ランキング評価により各コスト評価値のランク評価値を計算する。図16は、多目的ランキング評価の概念を示しており、コスト評価指標値を運転コスト評価指標値,機器コスト評価指標値の2次元とした場合の説明図である。図16に示すように、ランキング評価では、コスト評価指標からなる評価空間上に、コスト評価指標データをプロットする。そして、まず各データ点について、他のデータ点とのコスト評価指標値を比較する。その中で、全てのコスト評価指標値について、自己のデータ点よりも評価指標値が小さくなる(支配される)他のデータ点が存在しないものをランク1と決定する。次に、自己のデータ点が全てのコスト評価指標値について、ランク1のデータ点のみによって支配される場合、そのデータ点をランク2と決定する。以降、自己のデータ点が支配されるデータ点のランクの最大値+1を、そのデータ点のランクと決定する処理を全てのデータ点について実行する。その結果、図16に示すように、各データ点のランクが決定される。
上記の手順で決定したコスト評価指標データのランクrを用いて、〔数6〕によって各コスト評価指標値のランク評価値70 Rit(iは学習回数、tは操作回数の添字)を計算する。
〔数6〕において、r=1の場合にランク評価値Ritは最大値(=1)となり、ランクが増加するほど減少する。本実施例では、このランク評価値Ritが最大化されるように操作方法を学習する。αはランク評価値の感度を決定するパラメータであり、即ち、αを大きくするとランクが低いコスト評価指標値については学習に反映されず、αを小さくするとランクが低いコスト評価指標値も学習に反映される。以上の手順で計算したランク評価値70は、学習処理機能702に出力される。
操作方法管理機能703はプラントの模擬制御信号7を生成する機能を持つ。操作方法の学習とは、この模擬制御信号7を生成する操作ロジックを、学習処理機能702を用いて修正することに相当する。すなわち、学習処理機能702を動作させ、ランク評価値70を最大化するように、模擬制御信号7を生成する操作ロジックパラメータ71を修正する。学習した操作ロジックパラメータ71を含む学習結果データ13は、前記学習情報データベース250に保存される。
以下では、上記に示した本実施例における前記制御装置200に設けた操作方法学習部700におけるスカラー評価値計算機能701,操作方法管理機能702及び学習処理機能703による操作方法学習のアルゴリズムについて、図17のフローチャートを参照しながら説明する。
図17は、前記操作方法学習部700のアルゴリズム動作を示すフローチャートであり、図10のフローチャートにおける操作方法を学習するステップ1900に相当する。
図17に示したフローチャートは、ステップ1910,1920,1930,1940,1950を組み合わせて実行する。以下では、夫々のステップについて説明する。
操作方法学習のアルゴリズム開始後、コスト評価指標データのランクを計算するステップ1910では、ランク評価値計算機能2701を動作させて、前述の処理内容に従い各コスト評価指標データのランクを計算する。
次に、ランク評価値を計算するステップ1920では、ランク評価値計算機能2701を動作させて、ステップ1910で求めたランクを用いて前述の処理内容に従い各コスト評価指標データのランク評価値を計算する。
次に、カウンタを初期化するステップ1930では、ランク評価値を計算した各コスト評価指標データについて操作方法を学習するため、データをカウントするカウンタjを0に初期化する。
次に、操作方法を学習するステップ1940では、学習処理機能702及び操作方法管理機能703を動作させて、前述の処理内容に従い操作方法を学習する。
次の、カウンタjを判定するステップは分岐である。jの値がコスト評価指標データ数以下であれば、jを1加算してステップ1940に戻り、そうでなければ、操作方法学習のアルゴリズムを終了させるステップに進む。
このように、操作方法学習部700では、コスト評価情報データベース240に保存されたコスト評価値18のランク評価値を最大化するように、操作方法を学習する。これにより、制御装置200では、プラント100に対して、その運転コスト及び機器コストの低減効果が得られるように制御が実行される。また、ランク評価値の計算に多目的ランキング評価を適用することにより、コスト評価指標空間を満遍なく学習できるため、コスト評価指標の線形和であるスカラー評価値よりも高精度でコスト低減効果の大きい操作方法の学習が可能である。
以上で、本発明の第2実施例における操作方法学習部700の詳細な動作の説明を終了する。
次に、第2実施例であるプラントの制御装置において、制御装置200とデータを送受信できる保守ツール910の外部出力インターフェース913から送信された保守ツール出力信号94を表示する画像表示装置920にて表示される画面について、図18及び図19を用いて説明する。図18及び図19は、画像表示装置920に表示される画面の一具体例である。
図18は第2実施例であるプラントの制御装置において、学習時に使用する前記コスト評価指標及び、実行条件を設定する際に前記画像表示装置920に表示される画面例であり、第2実施例のプラントの制御装置における制御の手順を示す図11のフローチャートにおける、実行条件を設定するステップ1000で使用する。
図18に示した画面では、操作方法の学習時に使用するコスト評価指標について、種類,評価期間、及び制約値を設定することで、任意のコスト評価指標を定義することができる。また、学習の実行時に使用する最大操作回数,最大学習回数,学習の実行を判定する閾値(λ)及び、ランク評価値計算時に使用する係数(α)を設定することができる。
図18に示した画面では、第1実施例と同様に、コスト評価指標設定において、コスト評価指標の種類、評価期間をプルダウンメニュー3000及び数値ボックス3001から入力する。そして、制御信号の生成に使用するコスト評価指標の制約値を数値ボックス3002から設定する。次の、設定後のコスト評価指標の追加及び削除は、第1実施例と同様に実施する。
次に、実行条件設定では、学習の実行時に使用する最大操作回数,最大学習回数,学習の実行を判定する閾値(λ)及び、ランク評価値計算時に使用する係数(α)を、数値ボックスを3006,3007,3008及び3009より設定できる。
以上の実行条件設定の終了後、ボタン3010を選択すると、コスト評価指標及び実行条件設定を終了し、運転特性計算機能400及び機器特性計算機能500を修正する図2のステップ1100に進む。
図19は第1実施例であるプラントの制御装置において、学習した操作方法を用いて、プラントの制御信号を生成する際に画像表示装置920に表示される画面例であり、第2実施例のプラントの制御装置における、前記制御信号生成部800において、制御信号16を生成する際に表示される画面の一例である。
図19に示した学習結果表示画面では、前記した本発明の第1実施例と同じく、学習前と学習後の双方において、最終的に学習の結果獲得したコスト評価指標値がレーダーチャート3102表示される。グラフ3101には、レーダーチャートに加えて、図18のコスト評価指標設定画面で設定した、各コスト評価指標の制約値3104が表示される。
プラントの運転員は、図19に示した学習結果表示画面に表示されるグラフ3100及び3101を見ながら、学習前後でコスト評価指標値がどのように変化したかを確認することができる。学習結果を制御信号生成に反映させる基準の一つとして、レーダーチャート3102の各コスト評価指標値が制約値3104以下となっているかを判断し、それらをすべて満たす場合はボタン3105を選択することで、前記制御信号生成部800に対して学習情報データ14が入力され、制御信号16が生成される。また、レーダーチャート3102のコスト評価指標値が制約値3104以上となるケースが存在する場合には、ボタン3105を選択することで、前記制御信号生成部800に対する学習情報データ14の入力をキャンセルすることができる。
また、上記のボタン操作の替わりに、ボタン3107を選択することにより、学習後のコスト評価指標値が制約値以下を満足するかを判定し、満足すれば学習結果を制御信号の生成に使用し、そうでなければ使用しないといった一連の処理を自動的に実行させることができる。以上の機能を具備させたことにより、手動判定による時間的コストや、人為的要因によるミスを無くし、プラントの運転制御を安全かつ効率的に実施できる。
以上で、第2実施例であるプラントの制御装置における画像表示装置920に表示される画面についての説明を終了する。
〔第3実施例〕
次に、本発明に係わる制御装置200を、火力発電プラントに適用した第3実施例である火力発電プラントの制御装置について説明する。
尚、火力発電プラント以外のプラントを制御する際にも、本発明に係わる制御装置200を使用できることは言うまでもない。
図20は、本発明に係わる制御装置200が適用される火力発電プラント100aの構成を示す概略図である。先ず、火力発電プラント100aによる発電の仕組みについて簡単に説明する。
図20において、火力発電プラント100aを構成するボイラ101には、ミル110で石炭を細かく粉砕した燃料である微粉炭と、微粉炭搬送用の1次空気及び燃焼調整用の2次空気とを供給する複数のバーナ102が設けられており、このバーナ102を通じて供給した微粉炭を、ボイラ101の内部で燃焼させる。尚、微粉炭と1次空気は配管134から、2次空気は配管141から夫々バーナ102に導かれる。
また、ボイラ101には、2段燃焼用の空気をボイラ101に投入するアフタエアーポート103が設けられている。2段燃焼用の空気は、配管142からアフタエアーポート103に導かれる。
ボイラ101の内部で微粉炭を燃焼することによって発生した高温の燃焼ガスは、ボイラ101の内部の経路に沿って下流側に流下して、ボイラ101の内部に配置された熱交換器106で給水と熱交換して蒸気を発生させた後に、排ガスとなってボイラ101の下流側に設置されたエアーヒーター104に流入し、このエアーヒーター104で熱交換してボイラ101に供給する空気を昇温する。
そして、このエアーヒーター104を通過した排ガスは、図示していない排ガス処理を施した後に、煙突から大気に放出される。
ボイラ101の熱交換器106を循環する給水は、給水ポンプ105を介して熱交換器106に供給され、熱交換器106においてボイラ101を流下する燃焼ガスによって過熱され、高温高圧の蒸気となる。尚、本実施例では熱交換器の数を1つとしているが、熱交換器を複数配置するようにしてもよい。
熱交換器106で発生した高温高圧の蒸気は、タービンガバナ107を介して蒸気タービン108に導かれ、蒸気の持つエネルギーによって蒸気タービン108を駆動して発電機109で発電する。
上記第3実施例の火力発電プラント100aには、火力発電プラントの運転状態を示す状態量を検出する様々な計測器が配置されている。
前記火力発電プラント100aは図1及び図10に示すプラント100に該当しているので、これらの計測器から取得された火力発電プラントの計測信号は、図1及び図10に示すようにプラント100から計測信号1として制御装置200の外部入力インターフェース201に送信される。
計測器としては、例えば図20の火力発電プラント100aに示すように、熱交換器106から蒸気タービン108に供給される高温高圧の蒸気の温度を計測する温度計測器151,蒸気の圧力を計測する圧力計測器152,発電機9で発電される電力量を計測する発電出力計測器153が図示されている。
蒸気タービン108の復水器(図示せず)によって蒸気を冷却して生じた給水は、給水ポンプ105によってボイラ101の熱交換器106に供給されるが、この給水の流量は流量計測器150によって計測されている。
また、ボイラ101から排出する燃焼ガスである排ガス中に含まれている成分(窒素酸化物(NOx),一酸化炭素(CO),二酸化炭素(CO2),窒素(N2),酸素(O2),灰中未燃分及び硫化水素(H2S)など)の濃度に関する状態量の計測信号は、ボイラ101の下流側に設けた濃度計測器154によって計測される。
即ち、本発明の制御装置200を上記火力発電プラント100aに適用した第3実施例の火力発電プラントの制御装置において、計測器で計測される火力発電プラント100aの計測データ項目には、上記各計測器によって計測した火力発電プラント100aの状態量であるボイラ101に供給される燃料流量、ボイラ101に供給される空気流量、ボイラ101の熱交換器106に供給される給水流量、ボイラ101の熱交換器106で発生して蒸気タービン108に供給される蒸気温度、ボイラ101の熱交換器106に供給される給水の給水圧力、ボイラ101から排出される排ガスのガス温度、前記排ガスのガス濃度、及びボイラ101から排出される排ガスの一部をボイラ101に再循環させる排ガス再循環流量等が含まれる。
これらの計測データ項目は、図1及び図10で示した制御装置200における制御信号生成部800で演算して出力された制御信号16を、外部出力インターフェース202を介して火力発電プラント100aに対する制御信号17として入力することよって決定される計測データ項目である。
尚、一般的には図20に図示した以外にも多数の計測器が火力発電プラント100aに配置されるが、ここでは図示を省略する。
次に、ボイラ101の内部に投入される空気の経路、すなわちバーナ102からボイラ101の内部に投入される1次空気と2次空気の経路、及びアフタエアーポート103からボイラ101の内部に投入される空気の経路について図21を用いて説明する。
図20に示したボイラ101において、1次空気は、ファン120から配管130に導かれ、途中でボイラ101の下流側に設置されたエアーヒーター104を通過する配管132と、エアーヒーター104を通過せずにバイパスする配管131とに分岐するが、エアーヒーター104の下流側に配設した配管133となって再び合流し、バーナ102の上流側に設置された微粉炭を製造するミル110に導かれる。
エアーヒーター104を通過する1次空気は、ボイラ101を流下する燃焼ガスと熱交換することによって加熱される。この加熱された1次空気と共に、エアーヒーター104をバイパスした1次空気は、ミル110において粉砕した微分炭をバーナ102に搬送する。
ファン121を用いて配管140から投入された空気は、エアーヒーター104で同様にして加熱された後に、2次空気用の配管141とアフタエアーポート用の配管142とに分岐して、夫々、ボイラ101のバーナ102とアフタエアーポート103とに導かれる。
第3実施例である火力発電プラントの制御装置においては、ファン121から送られてバーナ102とアフタエアーポート103からボイラ101の内部へ投入される空気流量を制御する例として、2次空気用の配管141とアフタエアーポート用の配管142の上流側に操作端機器となるエアーダンパ162及びエアーダンパ163をそれぞれ設け、制御装置200によってこれらのエアーダンパ162及びエアーダンパ163の開度を調節して、ボイラ101の内部に供給される2次空気とアフタエアーの流量をそれぞれ制御できるように構成している。
また、ファン120から送られてバーナ102から微粉炭と共にボイラ101の内部へ投入される空気流量を制御する例として、配管133に合流する直前部分の配管131及び配管132に操作端機器となるエアーダンパ160及びエアーダンパ161をそれぞれ設け、制御装置200によってこれらのエアーダンパ160及びエアーダンパ161の開度を調節して、ボイラ101の内部に供給される空気の流量をそれぞれ制御できるように構成している。
前記制御装置200は、他の計測データ項目を制御することもできるので、操作端機器の設置場所を制御対象に応じて変えてもよい。
図21は、図20に示した火力発電プラント100aのボイラ101の下流側に設置したエアーヒーター104と関連する配管部の拡大図である。
図21に示したように、エアーヒーター104には空気を供給する配管130、及び配管140がそれぞれ設置されており、このうち、配管140はエアーヒーター104を貫通して配設され、配管130は途中から分岐した配管131と配管132によって構成されており、前記配管131はエアーヒーター104をバイパスして配設され、前記配管132はエアーヒーター104を貫通して配設されている。
そして配管132はエアーヒーター104を貫通した後に配管131と合流した配管133となってミル110に導かれ、このミル110から該配管133を通じて微粉炭と共に空気をボイラ101のバーナ102に導くように配設されている。
また、配管140はエアーヒーター104を貫通した後に配管141と配管142とに分岐し、このうち、配管141はボイラ101のバーナ102に、配管142はボイラ101のアフタエアーポート103に、それぞれ空気を導くように配設されている。
また、前記配管133に合流する直前部分の配管131及び配管132には、流通する空気量を調節するエアーダンパ160及びエアーダンパ161がそれぞれ設置され、前記配管141及び配管142の上流部分には、流通する空気量を調節するエアーダンパ162及びエアーダンパ163がそれぞれ設置されている。
そして、これらのエアーダンパ160〜163を操作することにより、配管131,132,141,142を空気が通過する面積を変更することができるので、配管131,132,141,142を通過してボイラ101の内部に供給される空気流量を個別に調整できる。
制御装置200の制御信号生成部800によって演算された制御信号16を外部出力インターフェース202を介して火力発電プラント100aに対する制御信号17として出力し、ボイラ101の配管131,132,141,142にそれぞれ設置したエアーダンパ160,161,162,163などの操作端の機器を操作する。
尚、本実施例では、エアーダンパ160,161,162,163などの機器のことを操作端と呼ぶ。また、制御信号生成部800によって演算されて前記操作端に出力される制御信号17としては、ボイラ101に配管131,132,141,142を通じて供給される空気流量、ボイラ101に空気を供給する配管131,132,141,142にそれぞれ設置された空気の流量を調節する空気ダンパ160〜163の開度、ボイラ101のバーナ102に供給される微粉炭の燃料流量、及びボイラ101から排出される排ガスの一部をボイラ101に再循環させる排ガス再循環流量等が含まれる。
以降では、本発明の制御装置を火力発電プラント100aに適用して、操作端をボイラ101に設置したバーナ102に供給する空気量を調節する配管131,132にそれぞれ設置されたエアーダンパ160,161、及びボイラ101に設置したアフタエアーポート103に供給する空気量を調節する配管141,142にそれぞれ設置されたエアーダンパ162,163として、被制御量をボイラ101から排出される排ガス中のCO,NOx,O2,灰中未燃分及びH2Sの濃度とする場合について説明する。
尚、本実施例では、ボイラ101の操作端の操作量(エアーダンパ160,161,162,163の開度)及びそれらを基にパラメータ変換したものが、制御装置200を構成する操作方法学習部がプラントを仮想的に操作する際の操作条件7となり、ボイラ101から排出される排ガスに含まれるCO,NOx,CO2,N2,O2,灰中未燃分及びH2S濃度が運転特性計算部400の計算・出力する運転特性値8となる。また、ボイラ101を構成するバーナ102,アフタエアーポート103,エアーヒーター104を含む各機器の経年劣化情報及び交換コスト情報が、機器特性計算部500の計算・出力する機器特性値9となる。
尚、本発明の第3実施例である火力発電プラントの制御装置において、その制御装置200の構成並びに各構成要素の機能に関しては、本発明の第1実施例並びに第2実施例の構成及び機能を用いることができる。更に、本発明の運転コスト評価に用いる要素としては、火力発電プラント100aに設置されている脱硝系統の脱硝剤使用コスト,バーナ102及びアフタエアーポート103で使用する空気を供給するファン120及び121の動力量,排ガス中に含まれるCO,O2,灰中未燃分によって発生する熱損失量,H2Sにより生じるボイラ101内部の腐食量を用いることができる。これらの評価は、運転特性計算部400より出力される運転特性情報を用いて計算する。
以上説明したように、本発明のプラントの制御装置200を火力発電プラントに適用すれば、プラントの運転コストや機器の寿命コストに対する要求を満たす操作方法を学習することにより、プラントの運転状態を改善し安全かつ効率的な運用が可能となる。
また本実施例によれば、学習において操作に対するコスト評価値を最小化する操作方法を学習する機能を具備させたことにより、プラントの運用コスト及び機器寿命を考慮した運転制御を実行できるため、プラント運用経費の低減に寄与可能な火力発電プラントの制御装置を実現することができる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
また、上記の各構成,機能,処理部,処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成,機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム,テーブル,ファイル,測定情報,算出情報等の情報は、メモリや、ハードディスク,SSD(Solid State Drive)等の記録装置、または、ICカード,SDカード,DVD等の記録媒体に置くことができる。よって、各処理,各構成は、処理部,処理ユニット,プログラムモジュールなどとして各機能を実現可能である。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。