JP2012053505A

JP2012053505A - プラントの制御装置及び火力発電プラントの制御装置

Info

Publication number: JP2012053505A
Application number: JP2010193070A
Authority: JP
Inventors: Toru Eguchi; 徹江口; Hisahiro Kusumi; 尚弘楠見; Takao Sekiai; 孝朗関合; Masayuki Fukai; 雅之深井; Satoru Shimizu; 悟清水
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2010-08-31
Filing date: 2010-08-31
Publication date: 2012-03-15
Anticipated expiration: 2030-08-31
Also published as: CN102418919B; JP5251938B2; CN102418919A

Abstract

【課題】本発明の目的は、将来的に予測されるプラントの運転状態の変化をも考慮に入れた、プラントの環境負荷物質低減及び運転効率改善を実現する制御ロジックを自律学習する機能を具備させることで、プラントの運転条件変更に対してロバストな制御を提供する。
【解決手段】本発明のプラントの制御装置は、運転情報データベースと運転特性計算部の組み合わせ又は機器情報データベースと機器特性計算部の組み合わせのいずれか一つを含み、前記運転特性計算部、又は機器特性計算部が計算した特性値を用いてプラントの運用コストを評価するコスト評価部と、前記コスト評価部が出力するコスト評価値が最適となるようにプラントに与える制御信号の生成方法を自律学習する操作方法学習部とを備え、前記操作方法学習部は、前記コスト評価部が出力するコスト評価値を手掛かりに操作方法を学習するように構成する。
【選択図】図１

Description

本発明は、プラントの制御装置に関するものであり、特に石炭等の化石燃料を用いて発電する火力発電プラントの制御装置に関する。

プラントの制御装置は、制御対象であるプラントから得られる状態量の計測信号を処理し、制御対象に与える制御信号を算出して制御対象に伝達する。プラントの前記制御装置には、プラントの状態量の計測信号がその目標値を満足するように、制御信号を計算するアルゴリズムが実装される。

プラントの制御に用いられている制御アルゴリズムとして、ＰＩ（比例・積分）制御アルゴリズムがある。ＰＩ制御では、プラントの状態量の計測信号とその目標値との偏差に比例ゲインを乗じた値に、偏差を時間積分した値を加算して、制御対象に与える制御信号を導出する。

ＰＩ制御を用いた制御アルゴリズムは、ブロック線図などで入出力関係を記述することができるため、入力と出力の因果関係が分かりやすく、多くの適用実績がある。しかし、プラントの運転状態の変更や環境の変化など、事前に想定していない条件でプラントを運転する場合には、制御ロジックを変更するなどの作業が必要になる場合がある。

プラントの運転状態や環境の変化に適応してロジックを変更する制御方式には、制御アルゴリズムやパラメータ値を自動的に修正する適応制御や学習アルゴリズムを用いた制御方式がある。

学習アルゴリズムを用いてプラントの制御装置の制御信号を導出する方法としては、プラントの計測データや数値解析を基に構築したデータを統計的に処理したものや、及びプラントの内部で起こる現象を、物理式等を用いてモデル化したものが使用され、このプラント特性計算機能が推定するプラントの運転特性を対象として最適な制御ロジックを自律的に学習させる手法が一般的である（モデルベース学習制御方式）。

一方で、近年の地球環境保護の観点から、プラントを始めとする産業システムにおいて、窒素酸化物（ＮＯｘ）や一酸化炭素（ＣＯ）といった環境負荷物質の排出量を低減するための取り組みが進められている。また、省エネルギーの観点から、システムの運用効率を向上させ、エネルギーコストを可能な限り低く抑えるための取り組みも進められている。

このような背景に鑑み、特許文献１に記載されている技術では、エネルギー消費型産業システムにおいて、現在のシステムの運転状態から計測される情報を手掛かりとして、システムが排出する環境負荷物質の量、及びシステムが消費するエネルギーコストを最適にするシステム運転方法を、ニューラルネットワークを用いて自律学習させる技術が開示されている。

特開２０００−１０５６０３号公報

特許文献１に開示された技術をプラントの制御装置へ適用した場合、プラントが排出する環境負荷物質の量やプラントのエネルギーコストを最適にする制御ロジックを自律的に学習できるため、プラントの環境に与える影響やコストを低減し、運転効率を向上させる効果的な運転制御を実施できる。

一方、プラントの運転では、エネルギー需給や稼働率調整の観点、及び資源調達上の理由から、月単位から時間単位に亘る多様な範囲で運転条件が計画され、それに基づいた運転条件の変更が実施される。ところが、前記公知技術においては、現在のプラントの運転状態から計測される情報のみに基づいて制御方法を学習するため、将来的に予測されるプラントの運転状態の変化に対応した制御方法の学習には対応していない。それゆえ、前記要因によりプラントの運転状態が変更した場合、所望の制御効果が得られないばかりか、プラントの運転状態に深刻な影響を及ぼす可能性がある。

本発明の目的は、プラントの制御ロジックを自律的に学習する制御装置において、将来的に予測されるプラントの運転状態の変化をも考慮に入れた、プラントの環境負荷物質低減及び運転効率改善を実現する制御ロジックを自律学習する機能を具備させることで、プラントの運転条件変更に対してロバストな制御を実行できるプラントの制御装置又は火力発電プラントの制御装置を提供することにある。

本発明は、プラントから該プラントの状態量である計測信号を取り込み、前記計測信号を用いて前記プラントを制御する制御信号を演算する制御装置を備え、制御装置は、プラントの運転計画に関する情報及び、プラントの運転特性を推定するのに必要な情報を保存する運転情報データベースと、前記運転情報データベースに保存されたデータを用いて前記プラントに制御信号を与えたときに該プラントの状態量である前記計測信号に相当する運転特性値を計算する運転特性計算部と、プラントの機器寿命や交換コストに関する特性を推定するのに必要な情報を保存する機器情報データベースと、前記機器情報データベースに保存されたデータを用いて前記プラントに制御信号を与えた時に該プラントの機器の寿命や交換コストに相当する機器特性値を計算する機器特性計算部のうち前記運転情報データベースと運転特性計算部の組み合わせ又は機器情報データベースと機器特性計算部の組み合わせのいずれか一つを含み、前記運転特性計算部、又は機器特性計算部が計算した特性値を用いてプラントの運用コストを評価するコスト評価部と、前記コスト評価部におけるコスト評価の実行条件に相当するコスト評価情報データを保存するコスト評価情報データベースと、前記運転特性計算部、機器特性計算部及びコスト評価部を用いて、前記コスト評価部が出力するコスト評価値が最適となるようにプラントに与える制御信号の生成方法を学習する操作方法学習部と、前記操作方法学習部における学習の制約条件及び学習結果に関する学習情報データを保存する学習情報データベースとを備えて構成したことを特徴とするプラントの制御装置である。

本発明によれば、プラントの制御ロジックを自律的に学習する制御装置において、将来的に予測されるプラントの運転状態の変化をも考慮に入れた、プラントの環境負荷物質低減及び運転効率改善を実現する制御ロジックを自律学習する機能を具備させることで、プラントの運転条件変更に対してロバストな制御を実行できるプラントの制御装置又は火力発電プラントの制御装置を提供することができる。

本発明の第１実施例であるプラントの制御装置の構成を示すブロック図。図１に記載した本発明の第１実施例によるプラントの制御装置における操作方法の学習時の動作フローを示すフローチャート。図１に記載した本発明の第１実施例によるプラントの制御装置におけるコスト評価部の構成を示すブロック図。図１に記載した本発明の第１実施例によるプラントの制御装置におけるコスト評価部の処理内容を示す図。図１に記載した本発明の第１実施例によるプラントの制御装置におけるコスト評価部の動作フローを示すフローチャート。図１に記載した本発明の第１実施例によるプラントの制御装置における操作方法学習部の構成を示すブロック図。図１に記載した本発明の第１実施例によるプラントの制御装置における操作方法学習部の動作フローを示すフローチャート。図１に記載した本発明の第１実施例によるプラントの制御装置において、コスト評価指標・実行条件を設定する際に画像表示装置に表示される画面の一例。図１に記載した本発明の第１実施例によるプラントの制御装置において、制御信号を生成する際に画像表示装置に表示される画面の一例。本発明の第２実施例であるプラントの制御装置の構成を示すブロック図。図１０に記載した本発明の第２実施例によるプラントの制御装置における操作方法の学習時の動作フローを示すフローチャート。図１０に記載した本発明の第２実施例によるプラントの制御装置におけるコスト評価部の構成図。図１０に記載した本発明の第２実施例によるプラントの制御装置におけるコスト評価部の動作フローを示すフローチャート。図１０に記載した本発明の第２実施例によるプラントの制御装置における操作方法学習部の構成を示すブロック図。図１０に記載した本発明の第２実施例によるプラントの制御装置におけるコスト評価情報データベースに保存されるデータの態様を示す図。図１０に記載した本発明の第２実施例によるプラントの制御装置における操作方法学習部で計算するランキング評価方法を説明する概要図。図１０に記載した本発明の第２実施例によるプラントの制御装置における操作方法学習部の動作フローを示すフローチャート。図１０に記載した本発明の第２実施例によるプラントの制御装置において、コスト評価指標・実行条件を設定する際に画像表示装置に表示される画面の一例。図１０に記載した本発明の第２実施例によるプラントの制御装置において、制御信号を生成する際に画像表示装置に表示される画面の一例。本発明のプラントの制御装置が適用される第２実施例である火力発電プラントの構成を示す概略構成図。図２０に記載した第３実施例の火力発電プラントに備えられたエアーヒーターの構成を示す概略構造図。

次に、本発明によるプラントの制御装置及び火力発電プラントの制御装置の実施例について図面を参照して説明する。

本発明に係るプラントの制御装置の実施例１、及び火力発電プラントの制御装置の実施例３の両者に共通した構成となるプラントの制御装置において、前記制御装置を構成するコスト評価部は、プラントの運転特性を計算する運転特性計算部より入力される運転特性値を用いて、プラントの運転コスト評価値を計算する運転コスト評価機能と、プラントの機器寿命特性を計算する機器特性計算部より入力される機器特性値を用いて、プラントの機器コスト評価値を計算する機器コスト評価機能と、前記２種類のコスト評価値を用いて運転コスト評価指標値及び機器コスト評価指標値を計算するコスト評価指標計算機能のうち、少なくとも１つを備えることが望ましい。

また、前記コスト評価指標計算機能には、現在の操作条件から仮想的にプラントを操作する一連の操作結果に対して獲得する運転コスト評価値または機器コスト評価値の時間平均である、運転コスト評価指標値または運転コスト評価指標値のうち、少なくとも１つを計算する機能を備えることが望ましい。

また、前記制御装置を構成する操作方法学習部は、前記コスト評価部が計算したコスト評価指標値の重み付け和である、スカラー評価値を計算するスカラー評価値計算機能と、前記スカラー評価値を基に、操作方法の生成ロジックを修正する学習処理機能と、前記運転特性計算部及び機器特性計算部に入力される、プラントの仮想的な操作信号を生成する操作方法管理機能のうち、少なくとも１つを備えることが望ましい。

前記制御装置は画像表示装置と接続され、前記コスト評価部で用いるコスト評価指標条件の種類、評価期間及び重み係数を、画像表示装置を通じて設定する機能と、操作方法学習部で用いる最大操作回数及び最大学習回数を、画像表示装置を通じて設定する機能のうち、少なくとも１つを備えることが望ましい。

また、前記制御装置において、前記制御信号生成部においてプラントに出力する制御信号を生成する際に、前回の操作時に学習した前記コスト評価指標値と、今回学習したコスト評価指標値を、それぞれレーダーチャートとして画像表示装置に表示させる機能と、その表示内容に従って学習結果を制御信号の生成に反映させるかどうかを選択できる機能のうち、少なくとも１つを備えることが望ましい。

また、本発明に係るプラントの制御装置の実施例２、及び火力発電プラントの制御装置の実施例３の両者に共通した構成となるプラントの制御装置において、前記制御装置を構成する操作方法学習部は、前記コスト評価部が計算したコスト評価指標値に対する多目的ランキング評価によりランク評価値を計算するランク評価値計算機能と、前記ランク評価値を基に、操作方法の生成ロジックを修正する学習処理機能と、前記運転特性計算部及び機器特性計算部に入力される、プラントの仮想的な操作信号を生成する操作方法管理機能のうち、少なくとも１つを備えることが望ましい。

前記制御装置は画像表示装置と接続され、前記コスト評価部で用いるコスト評価指標条件の種類、評価期間及び制約値を、画像表示装置を通じて設定する機能と、前記操作方法学習部及びコスト評価部で用いる最大操作回数，学習実行判定閾値，最大学習回数及びランク評価値係数を、画像表示装置を通じて設定する機能のうち、少なくとも１つを備えることが望ましい。

また、前記制御装置において、前記制御信号生成部においてプラントに出力する制御信号を生成する際に、前回の操作時に学習した前記コスト評価指標値と、今回学習したコスト評価指標値を、それぞれレーダーチャートとして画像表示装置に表示させる機能と、そのレーダーチャート上に、設定した各評価指標値の制約値を表示させる機能と、その表示内容に従って学習結果を制御信号の生成に反映させるかどうかを選択できる機能と、前記制約値情報を用いて、学習結果を制御信号の生成に反映させるかどうかの処理を自動実行する機能のうち、少なくとも１つを備えることが望ましい。

また、本発明の制御装置を火力発電プラントに適用する実施例３において、火力発電プラントから取得する計測信号を用いて、火力発電プラントに与える制御信号を導出する制御信号生成部を備えた構成の火力発電プラントの制御装置となる。

これらの計測信号は、火力発電プラントから排出されるガスに含まれる窒素酸化物，一酸化炭素，二酸化炭素，窒素，酸素，灰中未燃分及び硫化水素の濃度のうち少なくとも１つを表す信号を含む。また制御信号は、空気ダンパの開度，空気流量，燃料流量，排ガス再循環流量のうち少なくとも１つを決定する信号を含む。

前記制御装置は、前記火力発電プラントの状態量である計測信号を取り込んで保存する計測信号データベースと、火力発電プラントの運転計画に関する情報及び、火力発電プラントの運転特性を推定するのに必要な情報を保存する運転情報データベースと、前記運転情報データベースに保存されたデータを用いて前記火力発電プラントに制御信号を与えたときに該プラントの状態量である前記計測信号に相当する運転特性値を計算する運転特性計算部と、火力発電プラントの機器寿命や交換コストに関する特性を推定するのに必要な情報を保存する機器情報データベースと、前記機器情報データベースに保存されたデータを用いて前記火力発電プラントに制御信号を与えた時に該プラントの機器の寿命や交換コストに相当する機器特性値を計算する機器特性計算部と、前記運転特性計算部、及び機器特性計算部が計算した特性値を用いて火力発電プラントの運用コストを評価するコスト評価部と、前記コスト評価部におけるコスト評価の実行条件に相当するコスト評価情報データを保存するコスト評価情報データベースと、前記運転特性計算部、機器特性計算部及びコスト評価部を用いて、前記コスト評価部が出力するコスト評価値が最適となるように火力発電プラントに与える制御信号の生成方法を自律学習する操作方法学習部と、前記操作方法学習部における学習の制約条件及び学習結果に関する学習情報データを保存する学習情報データベースと、前記計測信号データベースの計測信号、及び前記学習情報データベースの学習情報データを用いて火力発電プラントに対して送信される制御信号を演算する制御信号生成部とを備える。

また、上記の各構成，機能，処理部，処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成，機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム，テーブル，ファイル，測定情報，算出情報等の情報は、メモリや、ハードディスク，ＳＳＤ（Solid State Drive）等の記録装置、または、ＩＣカード，ＳＤカード，ＤＶＤ等の記録媒体に置くことができる。よって、各処理，各構成は、処理部，処理ユニット，プログラムモジュールなどとして各機能を実現可能である。

次に、本発明の実施例であるプラントの制御装置及び火力発電プラントの制御装置について図面を参照して説明する。

〔第１実施例〕
まず、本発明の第１実施例であるプラントの制御装置について図面を参照して説明する。

図１は、本発明の第１実施例によるプラントの制御装置のシステム構成図である。図１に示すように、制御対象のプラント１００は、制御装置２００によって制御される。

プラント１００を制御する制御装置２００は保守ツール９１０と接続されているので、プラント１００の運転員は、保守ツール９１０に接続された外部入力装置９００と画像表示装置（例えばＣＲＴディスプレイ）９２０とを介して、制御装置２００を制御することができる。

制御装置２００には、演算装置として、計測信号変換部３００，運転特性計算部４００，機器特性計算部５００，コスト評価部６００，操作方法学習部７００、及び制御信号生成部８００が夫々備えられた構成となっている。

また制御装置２００には、データベース（ＤＢ）として、計測信号データベース２１０，運転情報データベース２２０，機器情報データベース２３０，コスト評価情報データベース２４０，学習情報データベース２５０，制御ロジックデータベース２６０、及び制御信号データベース２７０が夫々設けられている。

また制御装置２００には、外部とのインターフェースとして、外部入力インターフェース２０１、及び外部出力インターフェース２０２が設けられている。

そしてこの制御装置２００では、外部入力インターフェース２０１を介して、プラント１００から該プラントの各種状態量を計測した計測信号１を制御装置２００の計測信号データベース２１０に取り込んでおり、また、制御装置２００の制御信号生成部８００から外部出力インターフェース２０２を介して、制御対象のプラント１００に対して該プラントを制御する制御信号１６を、例えば供給する空気流量を制御する制御信号１７として出力するように構成されている。

この制御装置２００では、外部入力インターフェース２０１を介して前記プラント１００から取り込んだプラント１００の状態量を計測した計測信号２は、計測信号データベース２１０に保存される。

また、制御装置２００に設けた制御信号生成部８００にて生成される制御信号１６は、制御装置２００に設けた制御信号データベース２７０に保存されると共に、外部出力インターフェース２０２から前記プラント１００に対する制御信号１７として出力される。

制御装置２００に設けた計測信号変換部３００では、計測信号データベース２１０に保存された計測信号データ３を前処理計測データ４に変換する。前処理計測データ４は、該プラントより取得した計測信号データ３を、運転特性計算部４００及び機器特性計算部５００にて使用するデータの形式及び単位に適合するように前処理変換したものである。また、計測信号データ３は、制御信号１６を導出するために、制御装置２００に設けた制御信号生成部８００に入力される。

制御装置２００に設けた運転特性計算部４００はプラント１００の運転特性を模擬する機能（運転特性モデル）を持つ。即ち、制御信号１７をプラント１００に与え、その制御結果に対する計測信号１を得るのと同等の機能を模擬演算する。この模擬演算のために、前記計測信号変換部３００によって変換された前処理計測データ４、運転情報データベース２２０から取り込んだ運転情報データ５、及び制御装置２００に設けた操作方法学習部７００から出力される模擬制御信号７を使用する。運転情報データ５には、プラントの運転条件や時系列の運転計画に関する情報が含まれる。運転特性計算部４００が出力する運転特性値８には、例えばプラントの燃料流量，生産効率，排出物流量，温度及び圧力等の情報が含まれる。運転特性計算部４００は、運転情報データ５に含まれる運転条件及び運転計画情報を用いて、任意の時刻の運転特性値８を模擬計算することができる。例えば、現在時刻を開始とする時系列の模擬制御信号７が入力されると、時系列の運転特性値が得られる。

制御装置２００に設けた機器特性計算部５００は、プラント１００の各種機器の状態からその劣化度及び交換時期を計算する機能（機器特性モデル）を持つ。この計算のため、前記計測信号変換部３００によって変換された前処理計測データ４、機器情報データベース２３０から取り込んだ機器情報データ６、及び前記操作方法学習部７００から出力される模擬制御信号７を使用する。機器情報データ６には、プラントの各種機器の寿命やコストに関する情報が含まれる。機器特性計算部５００が出力する機器特性値９には、計算された各機器の交換時期及びコストに関する情報が含まれる。機器特性計算部５００は、機器情報データ６に含まれる機器寿命及びコストに関する情報を用いて、任意の時刻の機器特性値９を模擬計算することができる。例えば、現在時刻を開始とする時系列の模擬制御信号７が入力されると、時系列の機器特性値が得られる。

制御装置２００に設けたコスト評価部６００では、前記運転特性値８，機器特性値９、並びにコスト評価情報データベース２４０から取り込んだコスト評価情報１０を用いて、現在のプラント運転状態に対するコスト評価を実施する。詳細は後述するが、コスト評価部６００ではプラントのエネルギー効率や廃棄物処理に関する運転コスト、及び各種機器の交換寿命に関するコストを評価し、コスト評価値１１として、前記操作方法学習部７００に出力する。

制御装置２００に設けた操作方法学習部７００では、学習情報データベース２５０から取り込んだ学習情報１２を用いて、プラント１００に対する模擬操作を実行する。模擬操作の出力である模擬制御信号７は前記運転特性計算部４００、及び前記機器特性計算部５００に出力される。そして、その模擬操作の結果前記コスト評価部６００において計算されたコスト評価値１１を取り込み、それを基にプラント１００の操作方法を学習する。学習した結果は、学習結果データ１３として前記学習情報データベース２５０に出力する。

制御装置２００に設けた制御信号生成部８００では、学習情報データベース２５０より出力された学習情報データ１４、及び制御ロジックデータベース２６０に保存された制御ロジックデータ１５を用いて、計測信号１が望ましい値となるように制御信号１６を生成する。

この制御ロジックデータベース２６０には、制御ロジックデータ１５を算出する制御回路、及び制御パラメータが保存される。この制御回路には、従来技術として公知のＰＩ（比例・積分）制御を用いることができる。

このように、制御装置２００の動作において、プラントの運転特性及び機器特性を模擬し、その特性を基に算出したコスト評価値を最小化するように操作方法を学習するメカニズムを具備することにより、プラントの運用コスト及び機器寿命を考慮した運転制御を実行できるため、プラント運用経費の低減に寄与できる。

尚、制御装置２００に設けたコスト評価部６００、及び操作方法学習部７００の詳細な機能については、後述する。

プラント１００の運転員は、キーボード９０１とマウス９０２で構成される外部入力装置９００、制御装置２００とデータを送受信できる保守ツール９１０、及び画像表示装置９２０を用いることにより、制御装置２００に備えられている種々のデータベースに保存された情報にアクセスすることができる。制御装置２００は保守ツール９１０と入出力データ情報９０をやり取りするための入力部又は出力部を有する。

また、これらの装置を用いることにより、制御装置２００の運転特性計算部４００，機器特性計算部５００，コスト評価部６００、及び操作方法学習部７００で用いる特性パラメータ値，機器情報値，適応修正の実行条件等の設定情報を入力することができる。

保守ツール９１０は、外部入力インターフェース９１１，データ送受信処理部９１２、及び外部出力インターフェース９１３で構成され、データ送受信処理部９１２を介して制御装置２００とデータを送受信できる。

外部入力装置９００で生成した保守ツール入力信号９１は、外部入力インターフェース９１１を介して保守ツール９１０に取り込まれる。保守ツール９１０のデータ送受信処理部９１２では、保守ツール入力信号９２の情報に従って、制御装置２００から入出力データ情報９０を取得する。

また、データ送受信処理部９１２では、保守ツール入力信号９２の情報に従って、制御装置２００の運転特性計算部４００，機器特性計算部５００，コスト評価部６００、及び操作方法学習部７００で用いる特性パラメータ値，機器情報値，学習の実行条件等の設定情報を含む入出力データ情報９０を出力する。

データ送受信処理部９１２では、入出力データ情報９０を処理した結果得られる保守ツール出力信号９３を、外部出力インターフェース９１３に送信する。外部出力インターフェース９１３から送信された保守ツール出力信号９４は、画像表示装置９２０に表示される。

尚、上記の制御装置２００では、計測信号データベース２１０，運転情報データベース２２０，機器情報データベース２３０，コスト評価情報データベース２４０，学習情報データベース２５０，制御ロジックデータベース２６０、及び制御信号データベース２７０が制御装置２００の内部に配置されるが、これらの全て、あるいは一部を制御装置２００の外部に配置することもできる。

図２は、図１に示した第１実施例であるプラントの制御装置における操作方法の学習の手順を示すフローチャート図である。

図２では、第１実施例のプラントの制御装置２００に設置された運転特性計算部４００によるプラント運転特性の計算、機器特性計算部５００によるプラント機器特性の計算、コスト評価部６００によるプラントのコスト評価，操作方法学習部７００による操作方法の学習の動作を表すフローチャートを示している。

図２に示したフローチャートは、ステップ１０００，１１００，１２００，１３００，１４００，１５００，１６００，１７００，１８００，１９００，２０００を組み合わせて実行する。以下では、夫々のステップについて説明する。

制御装置２００の動作開始後、操作方法の学習条件及びコスト評価条件を設定するステップ１０００では、操作方法学習時の最大学習回数，最大操作回数及びコスト評価指標等、種々のパラメータ値を設定する。学習では、プラントの任意の操作条件から仮想的に操作を実行し、その操作結果に対する運転特性値及び機器特性値からコスト評価値を求め、それを最小化するように操作方法を学習する。この一連の操作及び学習処理を定数回（最大操作回数）反復実行することをエピソードと定義する。学習は、このエピソードを定数回（最大学習回数）繰り返すことで実行される。学習は、コスト評価値の良い（値の小さい）操作をより多く経験するほど、コスト低減効果の大きい操作方法を学習できる。プラントの操作条件は前記模擬制御信号７に相当し、これはプラントの実際の操作端の設定値をそのまま用いてもよいし、それらをパラメータ変換したものを用いてもよい。

次に、プラント特性モデルを修正するステップ１１００では、制御装置２００の運転特性計算部４００及び機器特性計算部５００に対して前処理計測データ４を入力し、プラント運転特性モデル及び機器特性モデルを修正する。このように、プラントから得られた計測データを用いて各特性モデルを修正することにより、モデルの特性を実機プラントに近づけより正確なコスト評価が可能となり、学習する操作方法の制御性能向上に寄与できる。

次に、学習回数を初期化するステップ１２００では、操作方法学習部７００による学習のエピソードの繰り返し回数ｉを初期化する。

次に、操作回数及び操作条件を初期化するステップ１３００では、操作方法学習部７００による操作方法の学習時の１エピソードにおける操作回数ｔ及び操作条件を初期化する。

次に、操作条件を変更するステップ１４００では、操作方法学習部７００を動作させて、プラントの操作条件を仮想的に変更する。

次に、運転特性及び機器特性を計算するステップ１５００では、運転特性計算部４００及び機器特性計算部５００を動作させて、変更後の操作条件に対するプラントの運転特性値８及び機器特性値９を計算する。このプラントの運転特性及び機器特性計算は、操作条件の変更が実行される毎に実行する。したがって、一連の操作に対して時系列の運転特性値及び機器特性値が得られることとなる。

次に、コスト評価を実行するステップ１６００では、制御装置２００のコスト評価部６００を動作させて、前記ステップ１５００で計算したプラントの運転特性及び機器特性に対するコスト評価値を計算する。

次に、操作方法を学習するステップ１７００では、前記ステップ１６００で計算したコスト評価値を用いて、運転特性計算部４００及び機器特性計算部５００の出力する運転特性値８及び機器特性値９が望ましい値となるような模擬制御信号７の操作方法を、操作方法学習部７００を動作させて学習する。学習に用いるアルゴリズムとしては、強化学習理論等の公知の手法を用いることができる。

次の、操作の反復回数を判定するステップ１８００は分岐である。操作回数ｔが、前記ステップ１０００で設定した最大操作回数以下となる場合はｔを１加算してステップ１４００に戻り、最大操作回数より大きい場合はステップ１９００へ進む。

次の、学習回数を判定するステップ１９００も分岐である。学習回数ｉが、前記ステップ１０００で設定した最大学習回数以下となる場合はｉを１加算してステップ１３００に戻り、最大学習回数より大きい場合はステップ２０００へ進む。

次に、学習結果を学習情報データベースに保存するステップ２０００では、操作方法の学習結果である、学習結果データ１３を前記学習情報データベース２５０に保存し、制御装置２００における一連の操作方法の学習動作を終了させるステップに進む。

以上の動作によって、本発明の実施例１における制御装置２００によるプラント１００の制御では、プラント１００の運転員が設定した実行条件に基づき、望ましい運転特性及び機器特性が得られるプラントの操作方法を自律的に学習できる。更には、学習において操作に対するコスト評価値を最小化する操作方法を学習する機能を具備させたことにより、プラントの運用コスト及び機器寿命を考慮した運転制御を実行できるため、プラント運用経費の低減に寄与できる。

次に、前記制御装置２００におけるコスト評価部６００の動作について、図３及び図４を用いて詳細に説明する。図３は、コスト評価部６００の詳細な構成図であり、図１に示した制御装置２００において、運転特性計算部４００，機器特性計算部５００，コスト評価部６００，操作方法学習部７００及びコスト評価情報データベース２４０を含む部分を詳細に示したものである。

前記コスト評価部６００は、運転コスト評価機能６０１，機器コスト評価機能６０２及びコスト評価指標計算機能６０３で構成される。

運転コスト評価機能６０１は、プラントを仮想的に操作することで運転特性計算部４００より得られる時系列の運転特性値８に対して、コスト評価情報データベース２４０に保存されているコスト評価情報１０を用いて運転コスト評価値６０を評価する。運転特性値８には、例えばプラントの燃料流量，生産効率，排出物流量等が含まれる。運転コスト評価値６０は、プラントの燃料消費コスト，生産効率コスト，排出物処理コスト等の各評価項目について計算したコスト評価値の総和として、〔数１〕により計算される。

ここで、ａ_mtは操作回数ｔにおける評価項目ｍの運転コスト評価値であり（ｍは運転コスト評価項目の添字）、運転コスト評価値は操作回数ｔにおける運転コスト評価値６０を意味する。

コスト評価項目に含まれる要素については、前記のものに限定されず、プラントの実施態様及びプラント運用に関するニーズに応じて種々設定が可能である。また、それぞれのコスト評価項目の導出方法については、実施態様や運用に則した公知の方法を用いることができるため、ここでの詳細な記述は省略する。

また、機器コスト評価機能６０２は、プラントを仮想的に操作することで機器特性計算部５００より得られる時系列の機器特性値９に対して、コスト評価情報データベース２４０に保存されているコスト評価情報１０を用いて機器コスト評価値６１を評価する。機器コスト評価値６１は、操作回数ｔにおけるプラントの各種機器毎の交換コストｂ_nt（ｎは機器の添字）を、現在時刻から機器寿命（交換時期）までの時間ｃ_ntで除した値の総和として、〔数２〕により計算される。

機器コスト評価値は、機器の交換コストが大きいほど、また機器の寿命が短いほど大きくなる。

コスト評価指標計算機能６０３では、上記のようにして求めたプラントの運転コスト評価値６０及び機器コスト評価値６１に対して、コスト評価情報データベース２４０に保存されているコスト評価情報１０を用いて、任意の評価期間に対する平均値である、操作回数ｔにおける運転コスト評価指標値及び機器コスト評価指標値を、〔数３〕〔数４〕により計算する。ここでｋ，ｌは評価期間に応じて決定されるコスト評価指標値の添字である。

〔数３〕〔数４〕においてＴ_k，Ｔ_lはそれぞれ、運転コスト評価指標値及び機器コスト評価指標値の最大評価期間であり、正の整数値で与えられる。ここで、前記コスト評価指標値及びその計算式〔数３〕〔数４〕について、図４を用いて説明する。図４及び〔数３〕から、各操作において計算される運転コスト評価値に対して、運転コスト評価指標値は現在の操作回数ｔからＴ_k回前までの操作で獲得した運転コスト評価値の平均として計算される（操作回数ｔがＴ_kより小さい値の場合は、ｔ＝０からｔまでの平均として計算する）。図４では、Ｔ_k＝５とした場合の、操作回数に対する運転コスト評価値及び、運転コスト評価指標値を示している。図４に示すように、ｔ＝５の場合の運転コスト評価指標値の値は、ｔ＝１から５の期間に獲得したコスト評価値の平均値として求まる。機器コストに関しても同様であり、このように、任意の評価期間Ｔ_k，Ｔ_lに対してコスト評価指標値を計算することによって、操作方法の学習時に現在の操作結果だけでなく、過去の一連の操作結果がプラントのコスト評価値に与える影響を考慮できる。これにより、現在のコスト評価値のみを考慮する場合に比べて、経時的なプラント特性の変化にも対応した、コスト低減に繋がる安定した制御特性を得ることができる。また、これらのコスト評価指標値は任意の評価期間に対して複数考慮できるため、望ましい制御特性のニーズに応じた柔軟な操作方法の学習が可能である。

上記の手順で計算した運転コスト評価指標値及び機器コスト評価指標値は、コスト評価値１１として、前記操作方法学習部７００に出力される。

以下では、上記に示した前記制御装置２００に設けたコスト評価部６００における運転コスト評価機能６０１，機器コスト評価機能６０２及びコスト評価指標計算機能６０３によるコスト評価のアルゴリズムについて、そのフローチャートを参照しながら説明する。

図５は、前記コスト評価部６００のアルゴリズム動作を示すフローチャートであり、図２のフローチャートにおけるコストを評価するステップ１６００に相当する。

図５に示したフローチャートは、ステップ１６１０，１６２０，１６３０を組み合わせて実行する。以下では、夫々のステップについて説明する。

コスト評価のアルゴリズムを開始後、運転コストを計算するステップ１６１０では、運転コスト評価機能６０１を動作させて、前述の処理内容に従い運転コスト６０を計算する。

次に、機器コストを計算するステップ１６２０では、機器コスト評価機能６０２を動作させて、前述の処理内容に従い機器寿命コスト６１を計算する。

最後に、前記運転コスト評価指標値，機器コスト評価指標値を計算するステップ１６３０では、コスト評価指標計算機能６０３を動作させて、前述の処理内容に従い、運転コスト評価指標値及び機器コスト評価指標値を計算し、コスト評価のアルゴリズムを終了させるステップに進む。

尚、コスト評価部６００は、前記運転情報データベース２２０と運転特性計算部４００の組み合わせ又は機器情報データベース２３０と機器特性計算部５００の組み合わせのいずれか一つを含むこととしても良い。以上で、本発明のコスト評価部６００の詳細な動作の説明を終了する。

次に、前記制御装置２００における操作方法学習部７００の動作について、図６を用いて詳細に説明する。図６は、操作方法学習部７００の詳細な構成図であり、図１に示した制御装置２００において、運転特性計算部４００，機器特性計算部５００，コスト評価部６００，操作方法学習部７００及び学習情報データベース２５０を含む部分を詳細に示したものである。

前記操作方法学習部７００は、スカラー評価値計算機能７０１，操作方法管理機能７０２及び学習処理機能７０３で構成される。

スカラー評価値計算機能７０１には、前記コスト評価部にて計算・出力されたコスト評価値１１が入力される。コスト評価値１１は、前記運転コスト評価指標値及び機器コスト評価指標値からなるため、これらを〔数５〕によってスカラー評価値７０（Ｆ_t）に変換する。

〔数５〕においてｗ_k，ｗ_lは夫々運転コスト評価指標及び機器コスト評価指標の重み係数であり、学習情報１２として学習情報データベース２５０より入力される。Ｋは運転コスト評価指標の集合、Ｌは機器コスト評価指標の集合である。計算したスカラー評価値７０は、学習処理機能７０２に出力される。

操作方法管理機能７０３はプラントの模擬制御信号７を生成する機能を持つ。操作方法の学習とは、この模擬制御信号７を生成する操作ロジックを、学習処理機能７０２を用いて修正することに相当する。すなわち、学習処理機能７０２を動作させ、スカラー評価値７０を最小化するように、模擬制御信号７を生成する操作ロジックパラメータ７１を修正する。学習した操作ロジックパラメータ７１を含む学習結果データ１３は、前記学習情報データベース２５０に保存される。

以下では、上記に示した前記制御装置２００に設けた操作方法学習部７００におけるスカラー評価値計算機能７０１，操作方法管理機能７０２及び学習処理機能７０３による操作方法学習のアルゴリズムについて、図７のフローチャートを参照しながら説明する。

図７は、前記操作方法学習部７００のアルゴリズム動作を示すフローチャートであり、図２のフローチャートにおける操作方法を学習するステップ１７００に相当する。

図７に示したフローチャートは、ステップ１７１０，１７２０を組み合わせて実行する。以下では、夫々のステップについて説明する。

操作方法学習のアルゴリズム開始後、スカラー評価値を計算するステップ１７１０では、スカラー評価値計算機能７０１を動作させて、前述の処理内容に従いスカラー評価値７０を計算する。

次に、操作方法を学習するステップ１７２０では、学習処理機能７０２及び操作方法管理機能７０３を動作させて、前述の処理内容に従い操作方法を学習し、操作方法学習のアルゴリズムを終了させるステップに進む。

このように、操作方法学習部７００では、コスト評価部６００で評価したコスト評価値１１の重み付け和を最小化するように、操作方法を学習する。これにより、制御装置２００では、プラント１００に対して、その運転コスト及び機器コストの低減効果が得られるように制御が実行される。以上で、本発明の操作方法学習部７００の詳細な動作の説明を終了する。

次に、第１実施例であるプラントの制御装置において、制御装置２００とデータを送受信できる保守ツール９１０の外部出力インターフェース９１３から送信された保守ツール出力信号９４を表示する画像表示装置９２０にて表示される画面について、図８及び図９を用いて説明する。図８及び図９は、画像表示装置９２０に表示される画面の一具体例である。

図８は第１実施例であるプラントの制御装置において、学習時に使用する前記コスト評価指標及び、実行条件を設定する際に前記画像表示装置９２０に表示される画面例であり、第１実施例のプラントの制御装置における制御の手順を示す図２のフローチャートにおける、実行条件を設定するステップ１０００で使用する。

この図８に示した画面では、操作方法の学習時に使用するコスト評価指標について、種類，評価期間，スカラー評価値計算時の重み係数を設定することで、任意の評価指標を定義することができる。また、学習の実行時に使用する最大操作回数及び最大学習回数を設定することができる。

図８に示す画面が前記画像表示装置９２０に表示された状態で、外部入力装置９００のマウス９０２を操作して画面上の数値ボックスにフォーカスを移し、キーボード９０１を用いることで数値を入力できる。また、矢印キーが表示されたプルダウンボタンへフォーカスを移しボタンを選択することでメニューリストが開き、任意のメニューを選択することができる。

図８に示した画面では、まず、コスト評価指標設定において、評価指標の種類を選択するプルダウンメニュー３０００から、定義するコスト評価指標が運転コストに関するものか、機器コストに関するものかを選択することができる。次に、数値ボックス３００１及び３００２から、定義するコスト評価指標の評価期間（Ｔ_k，Ｔ_l）及び重み係数（ｗ_k，ｗ_l）を任意に設定できる。

設定後、ボタン３００３を選択することで、設定した新たなコスト評価指標をコスト評価指標リスト３００４に追加できる。既に定義したコスト評価指標をリストから削除する場合には、削除したい項目をマウス９０２により選択し（図８中に灰色で表示）、ボタン３００５を選択することでリストから削除できる。

図８に示した画面では、次に、実行条件設定において、学習時に使用する最大操作回数及び最大学習回数を、数値ボックスを３００６及び３００７より設定できる。

以上の実行条件設定の終了後、ボタン３００８を選択すると、コスト評価指標及び実行条件設定を終了し、運転特性計算機能４００及び機器特性計算機能５００を修正する図２のステップ１１００に進む。

図９は第１実施例であるプラントの制御装置において、学習した操作方法を用いて、プラントの制御信号を生成する際に画像表示装置９２０に表示される画面例であり、第１実施例のプラントの制御装置における、図１の前記制御信号生成部８００において、制御信号１６を生成する際に表示される画面の一例である。

この図９に示した学習結果表示画面では、前回の操作時（学習前）と今回の操作時（学習後）における、学習において最終的に獲得した一連の操作における運転コスト評価指標値，機器コスト評価指標値が、グラフ３１００、及び３１０１にレーダーチャートで表示される。レーダーチャート３１０２は、図８の画面表示で定義したコスト評価指標別に、最終的に獲得した評価指標値を線で結び表示しており、数値ボックス３１０３には、評価指標の値が表示される。コスト評価指標値は値が小さいほど望ましい値であるため、レーダーチャートの面積が小さいほど望ましい制御結果を得ることができる。

プラントの運転員は、図９に示した学習結果表示画面に表示されるグラフ３１００及び３１０１を見ながら、学習前後でコスト評価指標値がどのように変化したかを確認することができる。各コスト評価指標値が望ましい値となり制御実行可能と判断した場合には、ボタン３１０４を選択することで、前記制御信号生成部８００に対して学習情報データ１４が入力され、制御信号１６が生成される。また、望ましいコスト評価指標値が得られず所望の制御効果が得られない場合、またはプラントの運転状態が悪化する場合には、ボタン３１０５を選択することで、前記制御信号生成部８００に対する学習情報データ１４の入力をキャンセルすることができる。以上の処理が終了後には、再び図２の操作方法を学習するフローチャートが実行される。

このように、第１実施例のプラント制御装置においては、図９に示した学習結果表示画面に表示される情報に応じて、前記制御信号生成部８００における制御信号１６の生成時に学習結果を反映させるかどうかを決定できる機能を具備させたことにより、学習で望ましい制御効果が得られた場合のみ、学習結果を制御信号に反映させることができるため、学習が失敗した場合にプラント１００の運転に悪影響を及ぼすことを回避できる。

上記した本実施例のプラントの制御装置では、前記コスト評価部６００において計算された、任意の評価期間に対するコスト評価指標値を用いて操作方法を学習することにより、経時的なプラント特性の変化にも対応した、コスト低減に繋がる安定した制御特性を得ることができる。

以上で、第１実施例であるプラントの制御装置における画像表示装置９２０に表示される画面についての説明を終了する。

〔第２実施例〕
次に、本発明の第２実施例であるプラントの制御装置について図面を参照して説明する。

図１０は、本発明の第２実施例によるプラントの制御装置のシステム構成図である。図１０に示した本発明の第２実施例において、制御装置２００に設けたコスト評価部６００では、前記運転特性計算部４００が計算する運転特性値８、前記機器特性計算部５００が計算する機器特性値９、並びにコスト評価情報データベース２４０から取り込んだコスト評価情報１０を用いて、現在のプラント運転状態に対するコスト評価を実行し、コスト評価値１１として、前記コスト評価情報データベース２４０に出力する。

制御装置２００に設けた操作方法学習部７００では、学習情報データベース２５０から取り込んだ学習情報１２を用いて、プラント１００に対する模擬操作を実行する。模擬操作の出力である模擬制御信号７は前記運転特性計算部４００、及び前記機器特性計算部５００に出力される。そして、その模擬操作の結果前記コスト評価部６００において計算され、コスト評価情報データベース２４０に保存されたコスト評価値１８を取り込み、それを基にプラント１００の操作方法を学習する。学習した結果は、学習結果データ１３として前記学習情報データベース２５０に出力する。

以上の制御装置２００における運転特性計算部４００，機器特性計算部５００，コスト評価部６００，操作方法学習部７００，コスト評価情報データベース２４０及び学習情報データベース２５０の各機能を除く部分は、第１実施例と同様の構成及び機能を具備しており、説明を省略する。

図１１は、図１０に示した第２実施例であるプラントの制御装置における操作方法の学習の手順を示すフローチャート図である。

図１１では、第２実施例のプラントの制御装置２００に設置された運転特性計算部４００によるプラント運転特性の計算、機器特性計算部５００によるプラント機器特性の計算、コスト評価部６００によるプラントのコスト評価、操作方法学習部７００による操作方法の学習の動作を表すフローチャートを示している。

図２に示したフローチャートは、ステップ１０００，１１００，１２００，１３００，１４００，１５００，１６００，１７００，１８００，１９００，２０００，２１００を組み合わせて実行する。以下では、夫々のステップについて、図２に示した本発明の実施例１と実施が異なる部分に注目して説明する。

制御装置２００の動作開始後、操作方法の学習条件及びコスト評価条件を設定するステップ１０００では、操作方法学習時の最大学習回数，最大操作回数，学習実行判定閾値λ及びコスト評価指標等、種々のパラメータ値を設定する。

次の、プラント特性モデルを修正するステップ１１００からコスト評価を実行するステップ１６００までの一連の処理内容は、図２の本発明の第１実施例と同様であり、ここでは説明を省略する。

次の、操作の反復回数を判定するステップ１７００は分岐である。操作回数ｔが、前記ステップ１０００で設定した最大操作回数以下となる場合はｔを１加算してステップ１４００に戻り、最大操作回数より大きい場合はステップ１８００へ進む。

次の、操作方法の学習実行を判定するステップ１８００は分岐である。学習回数ｉがステップ１０００で設定した学習実行判定閾値λの整数倍となる場合はステップ１９００に進み、そうでない場合はステップ２０００に進む。

次に、操作方法を学習するステップ１９００では、前記ステップ１６００で計算したコスト評価値を用いて、運転特性計算部４００及び機器特性計算部５００の出力する運転特性値８及び機器特性値９が望ましい値となるような模擬制御信号７の操作方法を、操作方法学習部７００を動作させて学習する。

次の、学習回数を判定するステップ２０００は分岐である。学習回数ｉが、前記ステップ１０００で設定した最大学習回数以下となる場合はｉを１加算してステップ１３００に戻り、最大学習回数より大きい場合はステップ２１００へ進む。

次に、学習結果を学習情報データベースに保存するステップ２１００では、操作方法の学習結果である、学習結果データ１３を前記学習情報データベース２５０に保存し、制御装置２００における一連の操作方法の学習動作を終了させるステップに進む。

以上の動作によって、本発明の実施例１における制御装置２００によるプラント１００の制御では、プラント１００の運転員が設定した実行条件に基づき、望ましい運転特性及び機器特性が得られるプラントの操作方法を自律的に学習できる。尚、本発明の第１実施例と異なる機能は、操作が実行される度に学習するのではなく、一連の操作（エピソード）を複数回（λ）反復実行後、操作方法を学習する点である。この機能を含むコスト評価部６００及び操作方法学習部７００の詳細動作については、後述する。

次に、本発明の第２実施例の制御装置２００におけるコスト評価部６００の動作について、図１２を用いて詳細に説明する。図１２は、コスト評価部６００の詳細な構成図であり、図１０に示した制御装置２００において、運転特性計算部４００，機器特性計算部５００，コスト評価部６００，操作方法学習部７００及びコスト評価情報データベース２４０を含む部分を詳細に示したものである。

図１２において、コスト評価部６００を構成する運転コスト評価機能６０１，機器コスト評価機能６０２及びコスト評価指標計算機能６０３におけるコスト評価処理内容は、本発明の第１実施例にて前記したものと同様である。但し、コスト評価指標計算機能６０３にて計算した運転コスト評価指標値及び機器コスト評価指標値は、コスト評価値１１として、コスト評価情報データベースに２４０に保存される。コスト評価情報データベース２４０に保存されたコスト評価値１１は、前回の操作方法学習から一定回数（λ）学習が経過した後に、コスト評価値１８として前記操作方法学習部７００に出力される。

以下では、上記に示した本発明の第２実施例の前記制御装置２００に設けたコスト評価部６００における運転コスト評価機能６０１，機器コスト評価機能６０２及びコスト評価指標計算機能６０３によるコスト評価のアルゴリズムについて、そのフローチャートを参照しながら説明する。

図１３は、前記コスト評価部６００のアルゴリズム動作を示すフローチャートであり、図１１のフローチャートにおけるコストを評価するステップ１６００に相当する。

図１３に示したフローチャートは、ステップ１６１０，１６２０，１６３０，１６４０を組み合わせて実行する。以下では、夫々のステップについて図２に示した本発明の実施例１と実施が異なる部分に注目して説明する。

コスト評価のアルゴリズムを開始後、運転コストを計算するステップ１６１０からコスト評価指標値を計算するステップ１６３０までの一連の処理内容は、図２の本発明の第１実施例と同様であり、ここでは説明を省略する。

次に、評価指標値の計算結果を保存するステップ１６４０では、前記ステップ１６３０で計算したコスト評価指標値を、前記コスト評価情報データベース２４０へ保存し、コスト評価のアルゴリズムを終了させるステップに進む。以上で、本発明のコスト評価部６００の詳細な動作の説明を終了する。

次に、本発明の第２実施例の前記制御装置２００における操作方法学習部７００の動作について、図１４，図１５及び図１６を用いて詳細に説明する。図１４は、操作方法学習部７００の詳細な構成図であり、図１０に示した制御装置２００において、運転特性計算部４００，機器特性計算部５００，コスト評価部６００，操作方法学習部７００及び学習情報データベース２５０を含む部分を詳細に示したものである。

前記操作方法学習部７００は、ランク評価値計算機能２７０１，操作方法管理機能７０２及び学習処理機能７０３で構成される。

ランク評価値計算機能２７０１には、前記コスト評価情報データベース２４０に保存されたコスト評価値１８が入力される。コスト評価値１８には、前回の操作方法学習からλ回のエピソード実行分に相当するコスト評価指標データが含まれる。図１５は、コスト評価情報データベース２４０に保存されるコスト評価指標データの態様の一例である。図１５では、各エピソードの操作の結果計算された、運転コスト評価指標値及び機器コスト評価指標値が記載されており、具体的には、学習回数２４１，操作回数２４２に対するコスト評価指標値２４３がリスト表示される。コスト評価指標値２４３の内容は、図１１のステップ１０００で設定したコスト評価指標に応じて決定される。

上記の態様を持つコスト評価値１８に対して、ランク評価値計算機能２７０１は、多目的ランキング評価により各コスト評価値のランク評価値を計算する。図１６は、多目的ランキング評価の概念を示しており、コスト評価指標値を運転コスト評価指標値，機器コスト評価指標値の２次元とした場合の説明図である。図１６に示すように、ランキング評価では、コスト評価指標からなる評価空間上に、コスト評価指標データをプロットする。そして、まず各データ点について、他のデータ点とのコスト評価指標値を比較する。その中で、全てのコスト評価指標値について、自己のデータ点よりも評価指標値が小さくなる（支配される）他のデータ点が存在しないものをランク１と決定する。次に、自己のデータ点が全てのコスト評価指標値について、ランク１のデータ点のみによって支配される場合、そのデータ点をランク２と決定する。以降、自己のデータ点が支配されるデータ点のランクの最大値＋１を、そのデータ点のランクと決定する処理を全てのデータ点について実行する。その結果、図１６に示すように、各データ点のランクが決定される。

上記の手順で決定したコスト評価指標データのランクｒを用いて、〔数６〕によって各コスト評価指標値のランク評価値７０Ｒ_it（ｉは学習回数、ｔは操作回数の添字）を計算する。

〔数６〕において、ｒ＝１の場合にランク評価値Ｒ_itは最大値（＝１）となり、ランクが増加するほど減少する。本実施例では、このランク評価値Ｒ_itが最大化されるように操作方法を学習する。αはランク評価値の感度を決定するパラメータであり、即ち、αを大きくするとランクが低いコスト評価指標値については学習に反映されず、αを小さくするとランクが低いコスト評価指標値も学習に反映される。以上の手順で計算したランク評価値７０は、学習処理機能７０２に出力される。

操作方法管理機能７０３はプラントの模擬制御信号７を生成する機能を持つ。操作方法の学習とは、この模擬制御信号７を生成する操作ロジックを、学習処理機能７０２を用いて修正することに相当する。すなわち、学習処理機能７０２を動作させ、ランク評価値７０を最大化するように、模擬制御信号７を生成する操作ロジックパラメータ７１を修正する。学習した操作ロジックパラメータ７１を含む学習結果データ１３は、前記学習情報データベース２５０に保存される。

以下では、上記に示した本実施例における前記制御装置２００に設けた操作方法学習部７００におけるスカラー評価値計算機能７０１，操作方法管理機能７０２及び学習処理機能７０３による操作方法学習のアルゴリズムについて、図１７のフローチャートを参照しながら説明する。

図１７は、前記操作方法学習部７００のアルゴリズム動作を示すフローチャートであり、図１０のフローチャートにおける操作方法を学習するステップ１９００に相当する。

図１７に示したフローチャートは、ステップ１９１０，１９２０，１９３０，１９４０，１９５０を組み合わせて実行する。以下では、夫々のステップについて説明する。

操作方法学習のアルゴリズム開始後、コスト評価指標データのランクを計算するステップ１９１０では、ランク評価値計算機能２７０１を動作させて、前述の処理内容に従い各コスト評価指標データのランクを計算する。

次に、ランク評価値を計算するステップ１９２０では、ランク評価値計算機能２７０１を動作させて、ステップ１９１０で求めたランクを用いて前述の処理内容に従い各コスト評価指標データのランク評価値を計算する。

次に、カウンタを初期化するステップ１９３０では、ランク評価値を計算した各コスト評価指標データについて操作方法を学習するため、データをカウントするカウンタｊを０に初期化する。

次に、操作方法を学習するステップ１９４０では、学習処理機能７０２及び操作方法管理機能７０３を動作させて、前述の処理内容に従い操作方法を学習する。

次の、カウンタｊを判定するステップは分岐である。ｊの値がコスト評価指標データ数以下であれば、ｊを１加算してステップ１９４０に戻り、そうでなければ、操作方法学習のアルゴリズムを終了させるステップに進む。

このように、操作方法学習部７００では、コスト評価情報データベース２４０に保存されたコスト評価値１８のランク評価値を最大化するように、操作方法を学習する。これにより、制御装置２００では、プラント１００に対して、その運転コスト及び機器コストの低減効果が得られるように制御が実行される。また、ランク評価値の計算に多目的ランキング評価を適用することにより、コスト評価指標空間を満遍なく学習できるため、コスト評価指標の線形和であるスカラー評価値よりも高精度でコスト低減効果の大きい操作方法の学習が可能である。

以上で、本発明の第２実施例における操作方法学習部７００の詳細な動作の説明を終了する。

次に、第２実施例であるプラントの制御装置において、制御装置２００とデータを送受信できる保守ツール９１０の外部出力インターフェース９１３から送信された保守ツール出力信号９４を表示する画像表示装置９２０にて表示される画面について、図１８及び図１９を用いて説明する。図１８及び図１９は、画像表示装置９２０に表示される画面の一具体例である。

図１８は第２実施例であるプラントの制御装置において、学習時に使用する前記コスト評価指標及び、実行条件を設定する際に前記画像表示装置９２０に表示される画面例であり、第２実施例のプラントの制御装置における制御の手順を示す図１１のフローチャートにおける、実行条件を設定するステップ１０００で使用する。

図１８に示した画面では、操作方法の学習時に使用するコスト評価指標について、種類，評価期間、及び制約値を設定することで、任意のコスト評価指標を定義することができる。また、学習の実行時に使用する最大操作回数，最大学習回数，学習の実行を判定する閾値（λ）及び、ランク評価値計算時に使用する係数（α）を設定することができる。

図１８に示した画面では、第１実施例と同様に、コスト評価指標設定において、コスト評価指標の種類、評価期間をプルダウンメニュー３０００及び数値ボックス３００１から入力する。そして、制御信号の生成に使用するコスト評価指標の制約値を数値ボックス３００２から設定する。次の、設定後のコスト評価指標の追加及び削除は、第１実施例と同様に実施する。

次に、実行条件設定では、学習の実行時に使用する最大操作回数，最大学習回数，学習の実行を判定する閾値（λ）及び、ランク評価値計算時に使用する係数（α）を、数値ボックスを３００６，３００７，３００８及び３００９より設定できる。

以上の実行条件設定の終了後、ボタン３０１０を選択すると、コスト評価指標及び実行条件設定を終了し、運転特性計算機能４００及び機器特性計算機能５００を修正する図２のステップ１１００に進む。

図１９は第１実施例であるプラントの制御装置において、学習した操作方法を用いて、プラントの制御信号を生成する際に画像表示装置９２０に表示される画面例であり、第２実施例のプラントの制御装置における、前記制御信号生成部８００において、制御信号１６を生成する際に表示される画面の一例である。

図１９に示した学習結果表示画面では、前記した本発明の第１実施例と同じく、学習前と学習後の双方において、最終的に学習の結果獲得したコスト評価指標値がレーダーチャート３１０２表示される。グラフ３１０１には、レーダーチャートに加えて、図１８のコスト評価指標設定画面で設定した、各コスト評価指標の制約値３１０４が表示される。

プラントの運転員は、図１９に示した学習結果表示画面に表示されるグラフ３１００及び３１０１を見ながら、学習前後でコスト評価指標値がどのように変化したかを確認することができる。学習結果を制御信号生成に反映させる基準の一つとして、レーダーチャート３１０２の各コスト評価指標値が制約値３１０４以下となっているかを判断し、それらをすべて満たす場合はボタン３１０５を選択することで、前記制御信号生成部８００に対して学習情報データ１４が入力され、制御信号１６が生成される。また、レーダーチャート３１０２のコスト評価指標値が制約値３１０４以上となるケースが存在する場合には、ボタン３１０５を選択することで、前記制御信号生成部８００に対する学習情報データ１４の入力をキャンセルすることができる。

また、上記のボタン操作の替わりに、ボタン３１０７を選択することにより、学習後のコスト評価指標値が制約値以下を満足するかを判定し、満足すれば学習結果を制御信号の生成に使用し、そうでなければ使用しないといった一連の処理を自動的に実行させることができる。以上の機能を具備させたことにより、手動判定による時間的コストや、人為的要因によるミスを無くし、プラントの運転制御を安全かつ効率的に実施できる。

以上で、第２実施例であるプラントの制御装置における画像表示装置９２０に表示される画面についての説明を終了する。

〔第３実施例〕
次に、本発明に係わる制御装置２００を、火力発電プラントに適用した第３実施例である火力発電プラントの制御装置について説明する。

尚、火力発電プラント以外のプラントを制御する際にも、本発明に係わる制御装置２００を使用できることは言うまでもない。

図２０は、本発明に係わる制御装置２００が適用される火力発電プラント１００ａの構成を示す概略図である。先ず、火力発電プラント１００ａによる発電の仕組みについて簡単に説明する。

図２０において、火力発電プラント１００ａを構成するボイラ１０１には、ミル１１０で石炭を細かく粉砕した燃料である微粉炭と、微粉炭搬送用の１次空気及び燃焼調整用の２次空気とを供給する複数のバーナ１０２が設けられており、このバーナ１０２を通じて供給した微粉炭を、ボイラ１０１の内部で燃焼させる。尚、微粉炭と１次空気は配管１３４から、２次空気は配管１４１から夫々バーナ１０２に導かれる。

また、ボイラ１０１には、２段燃焼用の空気をボイラ１０１に投入するアフタエアーポート１０３が設けられている。２段燃焼用の空気は、配管１４２からアフタエアーポート１０３に導かれる。

ボイラ１０１の内部で微粉炭を燃焼することによって発生した高温の燃焼ガスは、ボイラ１０１の内部の経路に沿って下流側に流下して、ボイラ１０１の内部に配置された熱交換器１０６で給水と熱交換して蒸気を発生させた後に、排ガスとなってボイラ１０１の下流側に設置されたエアーヒーター１０４に流入し、このエアーヒーター１０４で熱交換してボイラ１０１に供給する空気を昇温する。

そして、このエアーヒーター１０４を通過した排ガスは、図示していない排ガス処理を施した後に、煙突から大気に放出される。

ボイラ１０１の熱交換器１０６を循環する給水は、給水ポンプ１０５を介して熱交換器１０６に供給され、熱交換器１０６においてボイラ１０１を流下する燃焼ガスによって過熱され、高温高圧の蒸気となる。尚、本実施例では熱交換器の数を１つとしているが、熱交換器を複数配置するようにしてもよい。

熱交換器１０６で発生した高温高圧の蒸気は、タービンガバナ１０７を介して蒸気タービン１０８に導かれ、蒸気の持つエネルギーによって蒸気タービン１０８を駆動して発電機１０９で発電する。

上記第３実施例の火力発電プラント１００ａには、火力発電プラントの運転状態を示す状態量を検出する様々な計測器が配置されている。

前記火力発電プラント１００ａは図１及び図１０に示すプラント１００に該当しているので、これらの計測器から取得された火力発電プラントの計測信号は、図１及び図１０に示すようにプラント１００から計測信号１として制御装置２００の外部入力インターフェース２０１に送信される。

計測器としては、例えば図２０の火力発電プラント１００ａに示すように、熱交換器１０６から蒸気タービン１０８に供給される高温高圧の蒸気の温度を計測する温度計測器１５１，蒸気の圧力を計測する圧力計測器１５２，発電機９で発電される電力量を計測する発電出力計測器１５３が図示されている。

蒸気タービン１０８の復水器（図示せず）によって蒸気を冷却して生じた給水は、給水ポンプ１０５によってボイラ１０１の熱交換器１０６に供給されるが、この給水の流量は流量計測器１５０によって計測されている。

また、ボイラ１０１から排出する燃焼ガスである排ガス中に含まれている成分（窒素酸化物（ＮＯｘ），一酸化炭素（ＣＯ），二酸化炭素（ＣＯ₂），窒素（Ｎ₂），酸素（Ｏ₂），灰中未燃分及び硫化水素（Ｈ₂Ｓ）など）の濃度に関する状態量の計測信号は、ボイラ１０１の下流側に設けた濃度計測器１５４によって計測される。

即ち、本発明の制御装置２００を上記火力発電プラント１００ａに適用した第３実施例の火力発電プラントの制御装置において、計測器で計測される火力発電プラント１００ａの計測データ項目には、上記各計測器によって計測した火力発電プラント１００ａの状態量であるボイラ１０１に供給される燃料流量、ボイラ１０１に供給される空気流量、ボイラ１０１の熱交換器１０６に供給される給水流量、ボイラ１０１の熱交換器１０６で発生して蒸気タービン１０８に供給される蒸気温度、ボイラ１０１の熱交換器１０６に供給される給水の給水圧力、ボイラ１０１から排出される排ガスのガス温度、前記排ガスのガス濃度、及びボイラ１０１から排出される排ガスの一部をボイラ１０１に再循環させる排ガス再循環流量等が含まれる。

これらの計測データ項目は、図１及び図１０で示した制御装置２００における制御信号生成部８００で演算して出力された制御信号１６を、外部出力インターフェース２０２を介して火力発電プラント１００ａに対する制御信号１７として入力することよって決定される計測データ項目である。

尚、一般的には図２０に図示した以外にも多数の計測器が火力発電プラント１００ａに配置されるが、ここでは図示を省略する。

次に、ボイラ１０１の内部に投入される空気の経路、すなわちバーナ１０２からボイラ１０１の内部に投入される１次空気と２次空気の経路、及びアフタエアーポート１０３からボイラ１０１の内部に投入される空気の経路について図２１を用いて説明する。

図２０に示したボイラ１０１において、１次空気は、ファン１２０から配管１３０に導かれ、途中でボイラ１０１の下流側に設置されたエアーヒーター１０４を通過する配管１３２と、エアーヒーター１０４を通過せずにバイパスする配管１３１とに分岐するが、エアーヒーター１０４の下流側に配設した配管１３３となって再び合流し、バーナ１０２の上流側に設置された微粉炭を製造するミル１１０に導かれる。

エアーヒーター１０４を通過する１次空気は、ボイラ１０１を流下する燃焼ガスと熱交換することによって加熱される。この加熱された１次空気と共に、エアーヒーター１０４をバイパスした１次空気は、ミル１１０において粉砕した微分炭をバーナ１０２に搬送する。

ファン１２１を用いて配管１４０から投入された空気は、エアーヒーター１０４で同様にして加熱された後に、２次空気用の配管１４１とアフタエアーポート用の配管１４２とに分岐して、夫々、ボイラ１０１のバーナ１０２とアフタエアーポート１０３とに導かれる。

第３実施例である火力発電プラントの制御装置においては、ファン１２１から送られてバーナ１０２とアフタエアーポート１０３からボイラ１０１の内部へ投入される空気流量を制御する例として、２次空気用の配管１４１とアフタエアーポート用の配管１４２の上流側に操作端機器となるエアーダンパ１６２及びエアーダンパ１６３をそれぞれ設け、制御装置２００によってこれらのエアーダンパ１６２及びエアーダンパ１６３の開度を調節して、ボイラ１０１の内部に供給される２次空気とアフタエアーの流量をそれぞれ制御できるように構成している。

また、ファン１２０から送られてバーナ１０２から微粉炭と共にボイラ１０１の内部へ投入される空気流量を制御する例として、配管１３３に合流する直前部分の配管１３１及び配管１３２に操作端機器となるエアーダンパ１６０及びエアーダンパ１６１をそれぞれ設け、制御装置２００によってこれらのエアーダンパ１６０及びエアーダンパ１６１の開度を調節して、ボイラ１０１の内部に供給される空気の流量をそれぞれ制御できるように構成している。

前記制御装置２００は、他の計測データ項目を制御することもできるので、操作端機器の設置場所を制御対象に応じて変えてもよい。

図２１は、図２０に示した火力発電プラント１００ａのボイラ１０１の下流側に設置したエアーヒーター１０４と関連する配管部の拡大図である。

図２１に示したように、エアーヒーター１０４には空気を供給する配管１３０、及び配管１４０がそれぞれ設置されており、このうち、配管１４０はエアーヒーター１０４を貫通して配設され、配管１３０は途中から分岐した配管１３１と配管１３２によって構成されており、前記配管１３１はエアーヒーター１０４をバイパスして配設され、前記配管１３２はエアーヒーター１０４を貫通して配設されている。

そして配管１３２はエアーヒーター１０４を貫通した後に配管１３１と合流した配管１３３となってミル１１０に導かれ、このミル１１０から該配管１３３を通じて微粉炭と共に空気をボイラ１０１のバーナ１０２に導くように配設されている。

また、配管１４０はエアーヒーター１０４を貫通した後に配管１４１と配管１４２とに分岐し、このうち、配管１４１はボイラ１０１のバーナ１０２に、配管１４２はボイラ１０１のアフタエアーポート１０３に、それぞれ空気を導くように配設されている。

また、前記配管１３３に合流する直前部分の配管１３１及び配管１３２には、流通する空気量を調節するエアーダンパ１６０及びエアーダンパ１６１がそれぞれ設置され、前記配管１４１及び配管１４２の上流部分には、流通する空気量を調節するエアーダンパ１６２及びエアーダンパ１６３がそれぞれ設置されている。

そして、これらのエアーダンパ１６０〜１６３を操作することにより、配管１３１，１３２，１４１，１４２を空気が通過する面積を変更することができるので、配管１３１，１３２，１４１，１４２を通過してボイラ１０１の内部に供給される空気流量を個別に調整できる。

制御装置２００の制御信号生成部８００によって演算された制御信号１６を外部出力インターフェース２０２を介して火力発電プラント１００ａに対する制御信号１７として出力し、ボイラ１０１の配管１３１，１３２，１４１，１４２にそれぞれ設置したエアーダンパ１６０，１６１，１６２，１６３などの操作端の機器を操作する。

尚、本実施例では、エアーダンパ１６０，１６１，１６２，１６３などの機器のことを操作端と呼ぶ。また、制御信号生成部８００によって演算されて前記操作端に出力される制御信号１７としては、ボイラ１０１に配管１３１，１３２，１４１，１４２を通じて供給される空気流量、ボイラ１０１に空気を供給する配管１３１，１３２，１４１，１４２にそれぞれ設置された空気の流量を調節する空気ダンパ１６０〜１６３の開度、ボイラ１０１のバーナ１０２に供給される微粉炭の燃料流量、及びボイラ１０１から排出される排ガスの一部をボイラ１０１に再循環させる排ガス再循環流量等が含まれる。

以降では、本発明の制御装置を火力発電プラント１００ａに適用して、操作端をボイラ１０１に設置したバーナ１０２に供給する空気量を調節する配管１３１，１３２にそれぞれ設置されたエアーダンパ１６０，１６１、及びボイラ１０１に設置したアフタエアーポート１０３に供給する空気量を調節する配管１４１，１４２にそれぞれ設置されたエアーダンパ１６２，１６３として、被制御量をボイラ１０１から排出される排ガス中のＣＯ，ＮＯｘ，Ｏ₂，灰中未燃分及びＨ₂Ｓの濃度とする場合について説明する。

尚、本実施例では、ボイラ１０１の操作端の操作量（エアーダンパ１６０，１６１，１６２，１６３の開度）及びそれらを基にパラメータ変換したものが、制御装置２００を構成する操作方法学習部がプラントを仮想的に操作する際の操作条件７となり、ボイラ１０１から排出される排ガスに含まれるＣＯ，ＮＯｘ，ＣＯ₂，Ｎ₂，Ｏ₂，灰中未燃分及びＨ₂Ｓ濃度が運転特性計算部４００の計算・出力する運転特性値８となる。また、ボイラ１０１を構成するバーナ１０２，アフタエアーポート１０３，エアーヒーター１０４を含む各機器の経年劣化情報及び交換コスト情報が、機器特性計算部５００の計算・出力する機器特性値９となる。

尚、本発明の第３実施例である火力発電プラントの制御装置において、その制御装置２００の構成並びに各構成要素の機能に関しては、本発明の第１実施例並びに第２実施例の構成及び機能を用いることができる。更に、本発明の運転コスト評価に用いる要素としては、火力発電プラント１００ａに設置されている脱硝系統の脱硝剤使用コスト，バーナ１０２及びアフタエアーポート１０３で使用する空気を供給するファン１２０及び１２１の動力量，排ガス中に含まれるＣＯ，Ｏ₂，灰中未燃分によって発生する熱損失量，Ｈ₂Ｓにより生じるボイラ１０１内部の腐食量を用いることができる。これらの評価は、運転特性計算部４００より出力される運転特性情報を用いて計算する。

以上説明したように、本発明のプラントの制御装置２００を火力発電プラントに適用すれば、プラントの運転コストや機器の寿命コストに対する要求を満たす操作方法を学習することにより、プラントの運転状態を改善し安全かつ効率的な運用が可能となる。

また本実施例によれば、学習において操作に対するコスト評価値を最小化する操作方法を学習する機能を具備させたことにより、プラントの運用コスト及び機器寿命を考慮した運転制御を実行できるため、プラント運用経費の低減に寄与可能な火力発電プラントの制御装置を実現することができる。

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。

また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。

本発明は、プラントの制御装置及び火力発電プラントの制御装置に適用可能である。

１計測信号
１７制御信号
９０入出力データ情報
１００プラント
１００ａ火力発電プラント
１０１ボイラ
１０２バーナ
１０３アフタエアーポート
１３０〜１３３，１４０〜１４２配管
１６０〜１６３エアーダンパ
２００制御装置
２０１，９１１外部入力インターフェース
２０２，９１３外部出力インターフェース
２１０計測信号データベース
２２０運転情報データベース
２３０機器情報データベース
２４０コスト評価情報データベース
２５０学習情報データベース
２６０制御ロジックデータベース
２７０制御信号データベース
３００計測信号変換部
４００運転特性計算部
５００機器特性計算部
６００コスト評価部
７００操作方法学習部
８００制御信号生成部
９００外部入力装置
９０１キーボード
９０２マウス
９１０保守ツール
９１２データ送受信処理部
９２０画像表示装置

Claims

プラントから該プラントの状態量である計測信号を取り込み、前記計測信号を用いて前記プラントを制御する制御信号を演算する制御装置を備えたプラントの制御装置において、
制御装置は、プラントの運転計画に関する情報及び、プラントの運転特性を推定するのに必要な情報を保存する運転情報データベースと、前記運転情報データベースに保存されたデータを用いて前記プラントに制御信号を与えたときに該プラントの状態量である前記計測信号に相当する運転特性値を計算する運転特性計算部と、プラントの機器寿命や交換コストに関する特性を推定するのに必要な情報を保存する機器情報データベースと、前記機器情報データベースに保存されたデータを用いて前記プラントに制御信号を与えた時に該プラントの機器の寿命や交換コストに相当する機器特性値を計算する機器特性計算部のうち前記運転情報データベースと運転特性計算部の組み合わせ又は機器情報データベースと機器特性計算部の組み合わせのいずれか一つを含み、前記運転特性計算部、又は機器特性計算部が計算した特性値を用いてプラントの運用コストを評価するコスト評価部と、前記コスト評価部におけるコスト評価の実行条件に相当するコスト評価情報データを保存するコスト評価情報データベースと、前記運転特性計算部，機器特性計算部のいずれか一方及びコスト評価部を用いて、前記コスト評価部が出力するコスト評価値が最適となるようにプラントに与える制御信号の生成方法を学習する操作方法学習部と、前記操作方法学習部における学習の制約条件及び学習結果に関する学習情報データを保存する学習情報データベースとを備えて構成したことを特徴とするプラントの制御装置。
請求項１に記載のプラントの制御装置において、前記プラントは、ボイラを備えた火力発電プラントであり、
前記計測信号は、前記火力発電プラントのボイラから排出される排ガスに含まれる窒素酸化物，一酸化炭素，二酸化炭素，窒素，酸素，灰中未燃分及び硫化水素の濃度のうち少なくとも１つを表す状態量の信号を含み、
前記制御信号は、前記火力発電プラントのボイラに供給する空気流量、この空気流量を調節する空気ダンパの開度，ボイラに供給される燃料流量，ボイラから排出された排ガスを該ボイラに再循環させる排ガス再循環流量のうち少なくとも１つを表す信号を含むことを特徴とする火力発電プラントの制御装置。
請求項１のプラントの制御装置又は請求項２の火力発電プラントの制御装置において、
前記コスト評価部は、プラントの運転特性を計算する運転特性計算部より入力される運転特性値を用いて、プラントの運転コスト評価値を計算する運転コスト評価部と、プラントの機器寿命特性を計算する機器特性計算部より入力される機器特性値を用いて、プラントの機器コスト評価値を計算する機器コスト評価部と、前記２種類のコスト評価値を用いて運転コスト評価指標値及び機器コスト評価指標値を計算するコスト評価指標計算部のうち、少なくとも１つを備えることを特徴とする制御装置。
請求項１のプラントの制御装置又は請求項２の火力発電プラントの制御装置において、
前記コスト評価指標計算部は、現在の操作条件から仮想的にプラントを操作する一連の操作結果に対して獲得する運転コスト評価値または機器コスト評価値の時間平均である、運転コスト評価指標値または機器コスト評価指標値のうち、少なくとも１つを計算することを特徴とする制御装置。
請求項１のプラントの制御装置又は請求項２の火力発電プラントの制御装置において、
前記操作方法学習部は、前記コスト評価部が計算したコスト評価指標値の重み付け和である、スカラー評価値を計算するスカラー評価値計算部と、前記スカラー評価値を基に、操作方法の生成ロジックを修正する学習処理部と、前記運転特性計算部及び機器特性計算部に入力される、プラントの仮想的な操作信号を生成する操作方法管理部のうち、少なくとも１つを備えることを特徴とする制御装置。
請求項１のプラントの制御装置又は請求項２の火力発電プラントの制御装置において、
前記コスト評価部で用いるコスト評価指標条件の種類，評価期間及び重み係数を、画像表示装置を通じて設定する設定部と、操作方法学習部で用いる最大操作回数及び最大学習回数を、画像表示装置を通じて設定する設定部のうち、少なくとも１つを備えることを特徴とする制御装置。
請求項１のプラントの制御装置又は請求項２の火力発電プラントの制御装置において、
前記制御信号生成部においてプラントに出力する制御信号を生成する際に、前回の操作時に学習した前記コスト評価指標値と、今回学習したコスト評価指標値を、それぞれレーダーチャートとして画像表示装置に表示させる出力部と、その表示内容に従って学習結果を制御信号の生成に反映させるかどうかを選択できる入力部のうち、少なくとも１つを備えることを特徴とする制御装置。
請求項１のプラントの制御装置又は請求項２の火力発電プラントの制御装置において、
前記制御装置を構成する操作方法学習部は、前記コスト評価部が計算したコスト評価指標値に対する多目的ランキング評価によりランク評価値を計算するランク評価値計算部と、前記ランク評価値を基に、操作方法の生成ロジックを修正する学習処理部と、前記運転特性計算部及び機器特性計算部に入力される、プラントの仮想的な操作信号を生成する操作方法管理部のうち、少なくとも１つを備えることを特徴とする制御装置。
請求項１のプラントの制御装置又は請求項２の火力発電プラントの制御装置において、
前記コスト評価部で用いるコスト評価指標条件の種類，評価期間及び制約値を、画像表示装置を通じて設定する設定部と、前記操作方法学習部及びコスト評価部で用いる最大操作回数，学習実行判定閾値，最大学習回数及びランク評価値係数を、画像表示装置を通じて設定する設定部のうち、少なくとも１つを備えることを特徴とする制御装置。
請求項１のプラントの制御装置又は請求項２の火力発電プラントの制御装置において、
前記制御信号生成部においてプラントに出力する制御信号を生成する際に、前回の操作時に学習した前記コスト評価指標値と、今回学習したコスト評価指標値を、それぞれレーダーチャートとして画像表示装置に表示させる出力部と、そのレーダーチャート上に、設定した各評価指標値の制約値を表示させる出力部と、その表示内容に従って学習結果を制御信号の生成に反映させるかどうかを選択できる入力部と、前記制約値情報を用いて、学習結果を制御信号の生成に反映させるかどうかの処理を自動実行させることを選択できる入力部のうち、少なくとも１つを備えることを特徴とする制御装置。