JP2019020885A - プラント制御支援装置、プラント制御支援方法、プラント制御支援プログラム及び記録媒体 - Google Patents

プラント制御支援装置、プラント制御支援方法、プラント制御支援プログラム及び記録媒体 Download PDF

Info

Publication number
JP2019020885A
JP2019020885A JP2017136899A JP2017136899A JP2019020885A JP 2019020885 A JP2019020885 A JP 2019020885A JP 2017136899 A JP2017136899 A JP 2017136899A JP 2017136899 A JP2017136899 A JP 2017136899A JP 2019020885 A JP2019020885 A JP 2019020885A
Authority
JP
Japan
Prior art keywords
segment
parameter
plant
learning
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017136899A
Other languages
English (en)
Other versions
JP6939162B2 (ja
Inventor
鹿子木 宏明
Hiroaki Kaneki
宏明 鹿子木
豪 ▲高▼見
豪 ▲高▼見
Go Takami
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yokogawa Electric Corp
Original Assignee
Yokogawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yokogawa Electric Corp filed Critical Yokogawa Electric Corp
Priority to JP2017136899A priority Critical patent/JP6939162B2/ja
Priority to US16/031,568 priority patent/US11442416B2/en
Priority to EP18182945.8A priority patent/EP3428744B1/en
Priority to CN201810756313.8A priority patent/CN109254575B/zh
Publication of JP2019020885A publication Critical patent/JP2019020885A/ja
Application granted granted Critical
Publication of JP6939162B2 publication Critical patent/JP6939162B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0208Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the configuration of the monitoring system
    • G05B23/0213Modular or universal configuration of the monitoring system, e.g. monitoring system having modules that may be combined to build monitoring program; monitoring system that can be applied to legacy systems; adaptable monitoring system; using different communication protocols
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0208Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the configuration of the monitoring system
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0286Modifications to the monitored process, e.g. stopping operation or adapting control
    • G05B23/0294Optimizing process, e.g. process efficiency, product quality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/02Computing arrangements based on specific mathematical models using fuzzy logic
    • G06N7/023Learning or tuning the parameters of a fuzzy system
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24065Real time diagnostics
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0283Predictive maintenance, e.g. involving the monitoring of a system and, based on the monitoring results, taking decisions on the maintenance schedule of the monitored system; Estimating remaining useful life [RUL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Fuzzy Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Feedback Control In General (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

【課題】プラントの運転状態を示すパラメータの最適値を求める学習をより短時間で収束させ易くすること。【解決手段】プラント制御支援装置は、プラントを構成するセグメントの中から、運転状態を示すパラメータの最適値を求める学習を行う前記セグメントを選択するセグメント選択部と、前記学習に用いられる報酬関数を定義する報酬関数定義部と、前記プラントで用いられる機器の入出力情報、及び前記セグメントに含まれる機器の構成を示すセグメント情報に基づいて、選択されたセグメントにおける前記学習の対象となるパラメータを抽出するパラメータ抽出部と、前記報酬関数、及び抽出された前記パラメータに基づいて、運転状態を示すパラメータの最適値を求める学習を前記セグメントごとに行う学習部と、を備える。【選択図】図3

Description

本発明は、プラント制御支援装置、プラント制御支援方法、プラント制御支援プログラム及び記録媒体に関する。
従来から、化学等の工業プラントや工場、ガス田や油田等の井戸元やその周辺を管理制御するプラント、水力・火力・原子力等の発電を管理制御するプラント、太陽光や風力等の環境発電を管理制御するプラント、及び、上下水やダム等を管理制御するプラント等のプラントや工場(以下、これらを総称する場合には「プラント」という)においては、フィールド機器と呼ばれる測定器または操作器等の現場機器と、これらを制御する制御装置とが通信手段を介して接続された分散制御システム(DCS:Distributed Control System)が構築されており、DCSによる高度な自動操業が実現されている。
従来、上記のようなプラントのシステムにおいては、プラントの収量、運転状況、アラームの発生状況等の操業状態がセンサ等の測定器によって測定される。そして、測定値は、DCSを介して収集され、操作盤や監視端末のモニタ等の監視装置において表示される。プラントの操業状態を監視するボードオペレータは、監視装置によってプラントに異常を認識した場合、あるいはプラントの収量を増減させる場合等には、フィールドオペレータと呼ばれる作業者に対して、フィールド機器の調査、点検、または交換等の指示、若しくはバルブ等の操作器の調整指示を行う。
昨今、このような操作器等の調整を人工知能によって最適化して行い、プラント操業を自動化する技術が検討されている。例えば、特許文献1に記載のプラント制御システムは、センサ等の入力情報をサンプルデータとした判断モデルを用いた人工知能により、作業者に対して情報を提供する。
特開2014−174993号公報
ところで、上述の特許文献1等に開示された人工知能の技術を用いれば、プラントの運転状態を容易に最適化することができるとも考えられる。しかしながら、一般的にプラントの操業においては、人工知能が学習するべき範囲が広く、学習の対象となるパラメータの数が膨大になるため、プラントの運転状態を示すパラメータの最適値を求める学習が収束するまでに非現実的な長い時間を要したり、さらには学習が収束しなかったりする場合があるという課題がある。
本発明は上記事情に鑑みてなされたものであり、プラントの運転状態を示すパラメータの最適値を求める学習をより短時間で収束させ易くすることができるプラント制御支援装置、プラント制御支援方法、プラント制御支援プログラム及び記録媒体を提供することを目的とする。
(1)本発明は上記の課題を解決するためになされたものであり、本発明の一態様としては、プラントを構成するセグメントの中から、運転状態を示すパラメータの最適値を求める学習を行う前記セグメントを選択するセグメント選択部と、前記学習に用いられる報酬関数を定義する報酬関数定義部と、前記プラントで用いられる機器の入出力情報、及び前記セグメントに含まれる機器の構成を示すセグメント情報に基づいて、選択されたセグメントにおける前記学習の対象となるパラメータを抽出するパラメータ抽出部と、前記報酬関数、及び抽出された前記パラメータに基づいて、運転状態を示すパラメータの最適値を求める学習を前記セグメントごとに行う学習部と、を備えることを特徴とするプラント制御支援装置である。
(2)また、本発明の一態様としては、上記のプラント制御支援装置であって、前記パラメータ抽出部によって抽出された前記パラメータを、前記セグメント情報及び前記入出力情報に基づいて、セグメント内の可変パラメータ、セグメント内のモニタパラメータ、セグメント外の可変パラメータ、またはセグメント外の固定パラメータに分類するパラメータ分類部を備え、前記学習部は、前記パラメータ分類部によって分類された前記パラメータに基づいて前記学習を行うことを特徴とする。
(3)また、本発明の一態様としては、上記のプラント制御支援装置であって、前記学習部は、前記セグメント情報に基づく前記パラメータの間の相関を示す関連モデルに基づいて前記学習を行うことを特徴とする。
(4)また、本発明の一態様としては、上記のプラント制御支援装置であって、前記セグメント選択部は、前記プラントにおける工程の流れに応じて、前記プラントを構成する複数のセグメントを順に選択することを特徴とする。
(5)また、本発明の一態様としては、上記のプラント制御支援装置であって、前記セグメントごとになされた前記学習によってそれぞれ決定したパラメータに基づいて、前記プラントの全体に対して前記パラメータの最適化のための学習を行う全体最適化部、を備えることを特徴とする。
(6)また、本発明の一態様としては、上記のプラント制御支援装置であって、前記報酬関数定義部は、前記プラントにおいて発生するアラームに基づく値に応じて前記報酬関数の値を減算するための関数であるペナルティ関数を定義し、前記学習部は、前記ペナルティ関数に基づいて、前記学習を前記セグメントごとに行うことを特徴とする。
(7)また、本発明の一態様としては、上記のプラント制御支援装置であって、前記報酬関数を最大化する目的に寄与しないパラメータを前記セグメント情報に基づいて特定し、特定したパラメータを前記パラメータ抽出部によって抽出されたパラメータから除外することにより、前記パラメータ抽出部によって抽出されたパラメータの絞り込みを行うパラメータ絞り込み部、を備えることを特徴とする。
(8)また、本発明の一態様としては、コンピュータによるプラント制御支援方法であって、プラントを構成するセグメントの中から、運転状態を示すパラメータの最適値を求める学習を行う前記セグメントを選択するセグメント選択ステップと、前記学習に用いられる報酬関数を定義する報酬関数定義ステップと、前記プラントで用いられる機器の入出力情報、及び前記セグメントに含まれる機器の構成を示すセグメント情報に基づいて、選択されたセグメントにおける前記学習の対象となるパラメータを抽出するパラメータ抽出ステップと、前記報酬関数、及び抽出された前記パラメータに基づいて、運転状態を示すパラメータの最適値を求める学習を前記セグメントごとに行う学習ステップと、を有することを特徴とするプラント制御支援方法である。
(9)また、本発明の一態様としては、コンピュータに、プラントを構成するセグメントの中から、運転状態を示すパラメータの最適値を求める学習を行う前記セグメントを選択するセグメント選択ステップと、前記学習に用いられる報酬関数を定義する報酬関数定義ステップと、前記プラントで用いられる機器の入出力情報、及び前記セグメントに含まれる機器の構成を示すセグメント情報に基づいて、選択されたセグメントにおける前記学習の対象となるパラメータを抽出するパラメータ抽出ステップと、前記報酬関数、及び抽出された前記パラメータに基づいて、運転状態を示すパラメータの最適値を求める学習を前記セグメントごとに行う学習ステップと、を実行させるためのプラント制御支援プログラムである。
(10)また、本発明の一態様としては、コンピュータに、プラントを構成するセグメントの中から、運転状態を示すパラメータの最適値を求める学習を行う前記セグメントを選択するセグメント選択ステップと、前記学習に用いられる報酬関数を定義する報酬関数定義ステップと、前記プラントで用いられる機器の入出力情報、及び前記セグメントに含まれる機器の構成を示すセグメント情報に基づいて、選択されたセグメントにおける前記学習パラメータを抽出するパラメータ抽出ステップと、前記報酬関数、及び抽出された前記パラメータに基づいて、運転状態を示すパラメータの最適値を求める学習を前記セグメントごとに行う学習ステップと、を実行させるためのプラント制御支援プログラムを記録した記録媒体である。
本発明によれば、プラントの運転状態を示すパラメータの最適値を求める学習をより短時間で収束させ易くすることができるプラント制御支援装置、プラント制御支援方法、プラント制御支援プログラム及び記録媒体を提供することができる。
本発明の第1の実施形態に係るプラント制御支援装置を用いたプラントの構成を示す概略図である。 本発明の第1の実施形態に係るプラント制御支援装置のハードウェア構成を示すブロック図である。 本発明の第1の実施形態に係るプラント制御支援装置のソフトウェア構成を示すブロック図である。 本発明の第1の実施形態に係るプラント制御支援装置の動作を示すフローチャートである。 本発明の第1の実施形態に係るプラント制御支援装置が用いるI/O図の構成を示す図である。 本発明の第1の実施形態に係るプラント制御支援装置が用いるアラーム設定定義データの構成を示す図である。 本発明の第1の実施形態に係るプラント制御支援装置によるパラメータの学習を示す概略図である。 発明の第1の実施形態に係るプラント制御支援装置によるセグメント選択について説明するための図である。 発明の第1の実施形態に係るプラント制御支援装置によるセグメント選択について説明するための図である。 発明の第1の実施形態に係るプラント制御支援装置によるセグメント選択について説明するための図である。 本発明の第1の実施形態に係るプラント制御支援装置1が制御するプラント機器のセグメントの一例を示す図である。 本発明の第1の実施形態に係るプラント制御支援装置1が制御するプラント機器のセグメントの一例を示す図である。
<第1の実施形態>
[プラントの概要]
以下、プラント制御支援装置を用いたプラントの構成の一例について、図面を参照しながら説明する。図1は、本発明の第1の実施形態に係るプラント制御支援装置1を用いたプラント100の構成を示す概略図である。
図示するように、プラント100は、プラント制御支援装置1、基幹業務システム2、製造実行システム3、運転制御装置4、操作盤5、保全機器6、フィールドオペレータ端末7、プラント機器P0を有する。
プラント機器P0は、所定の生成物(最終成果物)を生成する。図1に例示するプラント機器P0は、原料塩水から水素や塩素を生成するプラント機器である。図示するように、プラント機器P0は、モニタM1〜モニタM5、及びバルブV1〜バルブV8を含む、各種機器を有している。
モニタM1〜モニタM5は、例えば、差圧計、温度計、または流量計等の物理量(圧力、温度、または流量等)の信号を運転制御装置4に入力する入力機器である。モニタM1は、プラント機器P0で生成される最終成果物の1つ(水素)の収量を測定する測定装置である。なお、本実施形態においてプラント100は、モニタM1で測定される生成物の収量が目標収量となるように制御されるプラントであるものとする。
また、バルブV1〜バルブV8は、運転制御装置4からのバルブ開度の指示に従って動作する出力機器であり、バルブ開度を変化させることによって、材料または生成物等の流量や圧力を調整する。
なお、プラント機器P0の中で、モニタM1〜モニタM5、及びバルブV1〜バルブV8を、以下「フィールド機器」という。フィールド機器は、プラント制御支援装置1の制御対象となる機器であり、プラント制御支援装置1は、フィールド機器を制御することによって、プラント機器P0によって生成される生成物の収量等を制御することができる。なお、以下の説明において、「プラント機器P0」と言う場合、プラント機器P0に含まれる1または複数の機器(フィールド機器を含む)のことをいうものとする。
なお、図1に図示したプラント機器P0の構成は一例として示したものである。プラント機器P0は、例えばモニタM1〜モニタM5等の入力機器によって計測された物理量に基づいて、例えばバルブV1〜バルブV8等の出力機器による調整操作が行われることにより生成物の収量等の制御が行われるようなプラント機器であるならば、図1に示すプラント機器P0の構成に限られるものではない。
また、入力機器や出力機器は、上記構成に含まれるバルブやモニタ等に限定されない。例えば、プラント機器P0は、入力機器として、スイッチ類等の機器を含んでいてもよい。また、例えば、プラント機器P0は、出力機器として、ポンプ等のアクチュエータ、ヒータ等の機器を含んでいてもよい。
基幹業務システム2は、例えば、会計処理、生産管理、及び販売管理等の経営資源を管理するためのプロセス製造業向けERP(Enterprise Resource Planning:経営資源統合)システムである。基幹業務システム2は、プラントの運転状態に関する情報を、経営資源の管理情報として利用してもよい。また、基幹業務システム2は、プラントの保守や修理の業務情報を管理する保守管理システム等を含んでいてもよい。基幹業務システム2は、例えば、サーバ装置、デスクトップ型パーソナルコンピュータ(PC)等の汎用的なコンピュータを含んで構成される。
製造実行システム3は、例えば、基幹業務システム2と運転制御装置4との間に位置するMES(Manufacturing Execution System;製造実行システム)であり、運転制御装置4が取得したプラント機器P0の動作状態や作業者の作業状況等を監視して管理する。製造実行システム3は、プラント制御支援装置1と通信を行い、例えば、基幹業務システム2から取得した目標収量等の情報を、プラント制御支援装置1へ出力する。また、製造実行システム3は、プラント機器P0を動作させるための運転指示をプラント制御支援装置1から取得する。製造実行システム3は、例えば、サーバ装置、デスクトップ型PC等の汎用的なコンピュータを含んで構成される。
運転制御装置4は、モニタM1〜モニタM5等の入力機器から計測値等を取得したり、バルブV1〜バルブV8等の出力機器を動作させるための運転指示を出力したりすることにより、フィールド機器の動作を制御する。本実施形態において、モニタM1〜モニタM5から運転制御装置4へ入力される入力値や、運転制御装置4からバルブV1〜バルブV8等へ出力する出力値は、プラントの運転状態を数値で示した指標(数値指標)であり、プラント制御支援装置1と運転制御装置4との間においてこの数値指標の入出力が行われる。運転制御装置4は、例えば、FA(Factory Automation)コンピュータ、PLC(Programmable Logic Controller)等の装置を含んで構成される。
操作盤5は、プラントのフィールドオペレータがフィールド機器の動作状態を監視し、フィールド機器を操作するための装置である。操作盤5は、例えば、ランプ、ディスプレイ等の表示機器、または押しボタンスイッチ、キーボード等の操作機器を有する。例えば、後述するプラント制御支援装置1から出力されるプラントの運転を指示する運転指示を受けたフィールドオペレータは、操作盤5の操作機器を用いてプラント機器P0のフィールド機器を操作する。
保全機器6は、フィールドオペレータがフィールド機器の保全を行うための機器である。フィールド機器の保全とは、例えば、フィールド機器に設定された機器情報を読み出して確認する処理、フィールド機器に対して新たな機器情報(パラメータ)を設定する処理、フィールド機器に設定された機器情報を調整または変更する処理、ならびにフィールド機器に機器情報を設定して所定の動作を実行させる処理等である。
保全機器6は、フィールド機器との間で、例えば、有線通信または無線通信を用いて通信を行う通信機能を有する。保全機器6は、通信機能を用いて、フィールド機器の保全を行う。保全機器6が通信機能を用いて行う上記保全において、フィールド機器と送受信する情報を「保全情報」という。保全情報には、上述のようにフィールド機器から読み出した情報の外に、フィールドオペレータが保全機器6に記録した、テキスト情報、画像情報、及び音声情報等を含んでいてもよい。保全機器6は、保全情報をプラント制御支援装置1に送信する。保全機器6は、ノート型またはタブレット型のコンピュータ、PDA(Personal Digital Assistant;携帯情報端末)、またはスマートフォン等である。
フィールドオペレータ端末7は、フィールドオペレータが所持する端末装置である。フィールドオペレータ端末7は、プラント制御支援装置1から出力されるプラントの運転を指示する運転指示を取得する。フィールドオペレータ端末7は、例えば、電子メール、チャット、音声通話等の通信手段によってプラント制御支援装置1から運転指示を取得して、フィールドオペレータに対して報知する。フィールドオペレータ端末7は、ノート型またはタブレット型のコンピュータ、PDA、またはスマートフォン等である。
プラント制御支援装置1は、製造実行システム3、運転制御装置4、保全機器6及びフィールドオペレータ端末7と通信を行う。プラント制御支援装置1は、運転制御装置4及び保全機器6からフィールド機器の状態を取得する。プラント制御支援装置1は、運転制御装置4またはフィールドオペレータ端末7に対して運転指示を出力することにより、プラント機器P0を制御する。
また、プラント制御支援装置1は、プラントに特化した各種データ、例えば、I/O(Input/Output;入出力)図、セグメント図、アラーム設定定義データ、及びパラメータ暫定初期値データ等に基づいて、プラント機器P0が備えるフィールド機器のパラメータについて人工知能による学習を行い、パラメータ値の最適化を行う。
なお、パラメータとは、プラント機器P0内のフィールド機器における機器情報であり、例えば、フィールド機器がセンサである場合にはセンサ値、及びフィールド機器がバルブである場合にはバルブ開度等を示す値である。
なお、I/O図(入出力情報)とは、プラント機器P0内のフィールド機器のリストを含んだデータであり、フィールド機器を識別する識別子、フィールド機器の種別(例えば、バルブやセンサ等)、及び計測値の単位などを定義したデータである。
また、セグメント図(セグメント情報)とは、プラント機器P0内に敷設された配管の構成や、プラント機器P0を構成するブロック(セグメント)等を、視覚的に図示したデータである。
また、アラーム設定定義データとは、例えば、センサの状態を異常と判定するセンサ値の閾値(上限値及び下限値の少なくともいずれか)、及び異常と判定した場合に発生させるアラームの重要度等を定義したデータである。
また、パラメータ暫定初期値データとは、プラント機器P0が正常に動いている場合において、当該プラント機器P0の設計上予測される、センサ値やバルブ開度等の大まかな値を示すデータである。
なお、プラント制御支援装置1は、ボードオペレータの作業を代替(または補佐)して運転指示を出力することができるため、ボードオペレータの人為的なミスを低減させることができ、プラントの安全性を向上させることができる。また、ボードオペレータを代替または補佐することにより、プラント制御支援装置1は、ボードオペレータの負荷を無くす(または軽減する)ことができるため、ボードオペレータの人件費を低減させ、プラント運転のランニングコストを低減させることができる。
[プラント制御支援装置のハードウェア構成]
次に、プラント制御支援装置1のハードウェア構成の一例について、図面を参照しながら説明する。図2は、本発明の第1の実施形態に係るプラント制御支援装置1のハードウェア構成を示すブロック図である。
図示するように、プラント制御支援装置1は、CPU(Central Processing Unit;中央演算処理装置)11、RAM(Random Access Memory;読み書き可能なメモリ)12、ROM(Read Only Memory;読み出し専用メモリ)13、HDD(Hard Disk Drive)14、表示装置15、入力装置16、通信I/F(Interface)17、及びこれらを接続するバス19を備える。
プラント制御支援装置1は、例えば、サーバ装置、デスクトップ型PC等の汎用的なコンピュータ、FAコンピュータ、PLC等の装置、ノート型またはタブレット型のコンピュータ、PDA、またはスマートフォン等を含んで構成される。プラント制御支援装置1は、ボードオペレータの作業を代替(または補佐)するものであり、例えば、ボードオペレータが監視する監視端末(図示せず)の近傍に設置されるようにしてもよい。
CPU11は、RAM12、ROM13またはHDD14に記憶されたプログラムを実行することにより、プラント制御支援装置1の制御を行う。CPU11は、後述するプラント制御支援装置1の動作を実現するためのプラント制御支援プログラムを実行する。プラント制御支援プログラムは、例えば、プラント制御支援プログラムを記録した記録媒体、またはネットワークを介したプラント制御支援プログラムを提供するサーバ等から取得されて、HDD14にインストールされ、CPU11から読み出し可能にRAM12に記憶される。
表示装置15は、表示機能を有する、例えば液晶ディスプレイ等の装置である。なお、表示装置15は、ヘッドマウント型ディスプレイ、眼鏡型ディスプレイ、腕時計型ディスプレイ等の種々の形態の装置によって実現されてもよい。
入力装置16は、入力機能を有する、例えばキーボードまたはマウスなどの装置である。なお、入力装置16は、音声情報を入力するマイク、画像情報を入力するカメラ等の装置であってもよい。
また、表示装置15と入力装置16とが、表示機能と入力機能とを有する、例えばタッチパネル等の装置によって実現されてもよい。
通信I/F17は、有線通信または無線通信を介して、製造実行システム3、運転制御装置4、保全機器6、フィールドオペレータ端末7等の他の装置との通信を制御する。通信I/F17は、接続された他の装置と、データ送受信、音声通話、または電子メール送受信等の通信制御を行う。
通信I/F17は、例えば、ISA(International Society of Automation:国際計測制御学会)の無線通信規格であるISA100、HART(Highway Addressable Remote Transducer)(登録商標)、BRAIN(登録商標)、FOUNDATION Fieldbus、PROFIBUS等の工業計器専用の通信規格に対応した通信制御を行うものであってもよい。また、通信I/F17は、無線LAN通信、有線LAN通信、赤外線通信、及び近距離無線通信等の、汎用通信規格に対応した通信制御を行うものであってもよい。
[プラント制御支援装置のソフトウェア構成]
次に、プラント制御支援装置1のソフトウェア構成の一例について、図面を参照しながら説明する。図3は、本発明の第1の実施形態に係るプラント制御支援装置1のソフトウェア構成を示すブロック図である。
図示するように、プラント制御支援装置1は、運転状態取得部101と、ユーザデータ取得部102と、セグメント選択部103と、報酬関数定義部104と、パラメータ抽出部105と、パラメータ分類部106と、パラメータ絞り込み部107と、学習部108と、運転指示部109と、全体最適化部110と、を含んで構成される。
運転状態取得部101は、プラント機器P0の運転状態を取得する。本実施形態において、プラント機器P0の運転状態は、モニタM1〜モニタM5の計測値、及びバルブV1〜バルブV8のバルブ開度等で表される。運転状態取得部101は、例えば、モニタM1〜モニタM5に対して計測値の取得を要求して計測値を取得したり、バルブV1〜バルブV8に対してバルブ開度の取得を要求してバルブ開度を取得したりする。運転状態取得部101は、取得した運転状態を逐次記録する。
ユーザデータ取得部102は、各種ユーザデータを取得する。ここでいうユーザデータとは、上述した、I/O図、セグメント図、アラーム設定定義データ、パラメータ暫定初期値データ、及び、後述する報酬関数定義データ等である。
セグメント選択部103は、プラント機器P0を構成するセグメントの中から、運転状態を示すパラメータの最適値を求める学習を行うセグメントを選択する。なお、ここでいうセグメントとは、プラント機器P0の一部の範囲を示すものであり、例えば、プラント機器P0を制御ループの単位でセグメント分けすることによって定義される。
セグメント選択部103は、プラント機器P0における工程の流れに応じて、セグメントを順に選択する。すなわち、セグメント選択部103は、例えば、プラント機器P0を構成する複数のセグメントにおいて、当該プラント機器P0における、より下流の工程であるセグメントからより上流の工程であるセグメントへ、隣接するセグメントを順に選択していく。
なお、セグメント選択部103が、より上流の工程であるセグメントからより下流の工程であるセグメントへ、隣接するセグメントを順に選択していくような構成であってもよい。
なお、プラント機器P0のセグメント分け、及びセグメント選択については後に詳しく説明する。
報酬関数定義部104は、プラント機器P0におけるフィールド機器の運転状態を示すパラメータの最適値を求める学習に用いられる、報酬・ペナルティ関数を定義する。
なお、報酬・ペナルティ関数の定義については後に詳しく説明する。
パラメータ抽出部105は、パラメータに対応するフィールド機器の入出力情報を示す上記のI/O図、及びフィールド機器等の構成や配置を示す情報(セグメント情報)を示す上記のセグメント図等に基づいて、選択されたセグメントにおける学習の対象となるパラメータを抽出する。
パラメータ分類部106は、パラメータ抽出部105によって抽出されたパラメータを、I/O図及びセグメント図に基づいて、セグメント内の可変パラメータ、セグメント内のモニタパラメータ、セグメント外の可変パラメータ、またはセグメント外の固定パラメータに分類する。
パラメータ絞り込み部107は、パラメータ抽出部105によって抽出され、パラメータ分類部106によって分類されたパラメータのうち、報酬・ペナルティ関数を最大化する目的に寄与しないパラメータを、セグメント図に基づいて特定して削除(除外)する。あるいは、パラメータ絞り込み部107は、学習部108において最適値を求めるパラメータの優先順位付けを行う。これにより、学習の対象となるパラメータの絞り込みが行われる。
なお、報酬・ペナルティ関数を最大化する目的に寄与しないパラメータとは、例えば、プラント機器P0の生成物(最終成果物)の収量を計測するモニタに接続していない(すなわち、当該モニタの計測値に影響しない、あるいは影響が小さい)フィールド機器に対応するパラメータである。
パラメータ絞り込み部107は、学習部108による学習を収束し易くするための情報である、パラメータ間の相関を示す関連モデルをセグメント図に基づいて生成する。
なお、パラメータ絞り込み部107が、上述したような、セグメント図に基づいて特定したパラメータの削除(除外)、あるいは、パラメータの優先順位付けを行うことなく、パラメータ分類部106によって分類された全てのパラメータに対して、パラメータ間の相関を示す関連モデルをセグメント図に基づいて生成するようにしてもよい。
学習部108は、報酬・ペナルティ関数に基づいて、パラメータ抽出部105によって抽出されたパラメータの最適値を求めるための学習をセグメントごとに実行する。また、学習部108は、パラメータ絞り込み部によって生成された関連モデルに基づいて、パラメータの間の相関確率の学習を実行する。学習部108は、当該相関確率に基づいて、上記のパラメータの最適値を求めるための学習を実行する。
運転指示部109は、学習部108による学習によって決定したパラメータのパラメータ値に基づいて、プラント機器P0の運転を指示する運転指示を出力する。運転指示部109は、フィールド機器に対して、あるいはフィールドオペレータに対して、運転指示を出力する。例えば、運転指示部109は、学習部108において決定されたバルブV1〜V8のバルブ開度に応じて、運転制御装置4に対して4〜20mAの電流値、またはデジタル信号を出力する。また、運転指示部109は、学習部108による学習によって決定したバルブV1〜V8のバルブ開度を示す運転指示を出力する。
運転指示の出力は、所定のタイミングで実行される。例えば、運転制御装置4に対する運転指示の出力は、パラメータが決定された時点で直ちに実行される。一方、例えば、フィールドオペレータに対する運転指示の出力は、一定の間隔でフィールドオペレータ端末7へ(例えば、電子メール等により)送信されることにより実行される。
運転指示部109がフィールド機器またはフィールドオペレータに対して運転指示を出力することにより、プラント制御支援装置1は、ボードオペレータの作業負荷を軽減する(または無くす)ことができる。なお、運転指示部109は、運転指示の内容を、図2に図示した表示装置15に表示することによって、ボードオペレータに対して報知するようにしてもよい。
また、ボードオペレータは報知された運転指示に問題があると判断した場合、入力装置16を介して、運転指示部109に対し運転指示の変更または中止の指示を行うようにしてもよい。
全体最適化部110は、セグメントごとになされた学習によってそれぞれ決定したパラメータのパラメータ値に基づいて、プラント全体の(全てのセグメントの)、運転状態を示すパラメータの全体最適値を求める学習を実行する。
なお、図3においては、運転状態取得部101、ユーザデータ取得部102、セグメント選択部103、報酬関数定義部104、パラメータ抽出部105、パラメータ分類部106、パラメータ絞り込み部107、学習部108、運転指示部109、及び全体最適化部110の各機能がソフトウェアによって実現される場合を説明した。しかし、上記各機能のうち、1つ以上の機能がハードウェアによって実現されるものであっても良い。
また、上記の各機能が、複数の機能に分割されて実施されるような構成であってもよい。また、上記の各機能のうち2つ以上の機能が、1つの機能に集約されて実施されるような構成であってもよい。
[プラント制御支援装置の動作]
次に、プラント制御支援装置1の動作の一例について図面を参照しながら説明する。図4は、本発明の第1の実施形態に係るプラント制御支援装置1の動作を示すフローチャートである。
本フローチャートが示す処理は、プラント制御支援装置1の電源がオンにされた際に開始する。
(ステップS001)セグメント選択部103は、プラント機器(例えば、図1に図示したプラント機器P0)を構成する複数のセグメントの中から、運転状態を示すパラメータの最適値を求める学習の実行対象となるセグメントを1つ選択する。その後、ステップS002へ進む。
(ステップS002)報酬関数定義部104は、運転状態を示すパラメータの最適値を求める学習に用いる報酬・ペナルティ関数を定義する。その後、ステップS003へ進む。
(ステップS003)パラメータ抽出部105は、I/O図及びセグメント図に基づいて、ステップS001において選択されたセグメントに含まれる、学習の対象となるパラメータを抽出する。また、パラメータ抽出部105は、抽出したパラメータに対しパラメータ値を設定する(例えば、パラメータ暫定初期値データに基づいてパラメータ値を設定する)。その後、ステップS004へ進む。
(ステップS004)パラメータ分類部106は、ステップS003において抽出したパラメータを、I/O図及びセグメント図に基づいて、「セグメント内の可変パラメータ」、「セグメント内のモニタパラメータ」、「セグメント外の可変パラメータ」、または「セグメント外の固定パラメータ」に分類する。その後、ステップS005へ進む。
(ステップS005)パラメータ絞り込み部107は、セグメント図に基づいて、ステップS002において定義した報酬・ペナルティ関数の最大化において有効でなさそうなパラメータを削除(除外)することにより有効なパラメータに絞り込む。あるいは、パラメータ絞り込み部107は、学習部108において最適値を求めるパラメータの優先順位付けを行い、より有効なパラメータの優先順位を高くする。また、パラメータ絞り込み部107は、セグメント図に基づいて、学習部108による学習が収束しやすくするための情報となる、パラメータ間の相関を示す関連モデルを生成する。その後、ステップS006へ進む。
(ステップS006)学習部108は、ステップS002において定義された報酬・ペナルティ関数と、ステップS004において分類されステップS005において絞り込まれたパラメータのパラメータ名と、当該パラメータそれぞれの(ステップS003において設定された)パラメータ値と、ステップS005において生成された関連モデルと、を取得する。そして、学習部108は、上記取得した情報を用いて、運転状態を示すパラメータの最適値を求めるための、人工知能による強化学習を行う。その後、ステップS007へ進む。
(ステップS007)プラント機器の全てのセグメントに対して、運転状態を示すパラメータの最適値を求める学習が完了した場合には、ステップS008へ進む。そうでない場合は、ステップS001へ戻る。
(ステップS008)全体最適化部110は、ステップS006における学習によって決定したパラメータのパラメータ値を用いて、プラント機器全体に対する運転状態を示すパラメータの全体最適値を求める学習を実行する。
以上で本フローチャートの処理が終了する。
[I/O図の構成]
次に、I/O図の構成の一例について、図面を参照しながら説明する。図5は、本発明の第1の実施形態に係るプラント制御支援装置1が用いるI/O図の構成を示す図である。
図示するように、本実施形態に係るI/O図は、「機器ID」、「機器種別」、「設置場所」、「制御ループ名」、「I/Oタイプ」、「IOP下限値」、「IOP上限値」、「単位」、及び「機器重要度」の9つの項目の列を含む2次元の表形式のデータである。
「機器ID」は、プラント機器P0に含まれるフィールド機器を識別する識別子(ID)を示す。
「機器種別」は、機器IDによって識別されるフィールド機器の種類を示す。フィールド機器の種類とは、例えば、圧力計や温度計等のモニタ、及びバルブ等である。
「設置場所」は、プラントにおいて、機器IDによって識別されるフィールド機器が設置された場所を示す。
「制御ループ名」は、プラント機器P0に含まれる制御ループのうち、機器IDによって識別されるフィールド機器が含まれる制御ループの名称を示す。なお、本実施形態においては、プラント機器P0は、制御ループの単位でセグメント分けがなされる。
「I/Oタイプ」は、機器IDによって識別されるフィールド機器が、プラント制御支援装置1へパラメータ値を入力する入力装置(例えば、モニタ)であるか、あるいは、プラント制御支援装置1から出力されたパラメータ値を取得して動作する出力装置(例えば、バルブなどの操作)であるかを示す。
「IOP(Input/Output Processor;入出力プロセッサ)下限値」は、機器IDによって識別されるフィールド機器のパラメータ値(例えば、モニタ値)が異常であると判定される下限の閾値を示す。すなわち、フィールド機器のパラメータ値が、このIOP下限値を下回った場合に、所定の条件に基づいて所定のアラームが挙げられる。
「IOP上限値」は、機器IDによって識別されるフィールド機器のパラメータ値(例えば、モニタ値)が異常であると判定される上限の閾値を示す。すなわち、フィールド機器のパラメータ値が、このIOP上限値を上回った場合に、所定の条件に基づいて所定のアラームが挙げられる。
「単位」は、機器IDによって識別されるフィールド機器のパラメータ値(例えば、モニタ値、またはバルブ開度)の単位を示す。フィールド機器が圧力計である場合には、単位は、例えば「hPa(hectopascal;ヘクトパスカル)」等である。また、フィールド機器が温度計である場合には、単位は、例えば「℃(セルシウス度)」等である。また、フィールド機器がバルブである場合には、単位は、例えば「%(パーセント)」(最大開度に対する割合を示す)である。
「機器重要度」は、機器IDによって識別されるフィールド機器の重要度を示す。この重要度に基づいて、後述するアラーム重要度が設定され、当該アラーム重要度が、後述するペナルティ関数の定義に反映される。
なお、機器重要度は、例えば、機器のパラメータの、プラント機器P0や各セグメントの収量への影響度合い、あるいはプラント機器P0や各セグメントが停止してしまう可能性の影響度合いによって設定される。
[アラーム設定定義データの構成]
次に、アラーム設定定義データの構成の一例について、図面を参照しながら説明する。図6は、本発明の第1の実施形態に係るプラント制御支援装置1が用いるアラーム設定定義データの構成を示す図である。図6に図示するように、本実施形態に係るアラーム設定定義データは、図5に図示したI/O図において定義されている「機器重要度」と「制御ループ」とに応じて決定されるアラームの重要度が定義された、2次元の表形式のデータである。
なお、アラームの重要度は、例えば、制御ループごとに、プラント機器P0や各セグメントの収量への影響度合い、あるいはプラント機器P0や各セグメントが停止してしまう可能性の影響度合いが異なるので、機器重要度に加えて機器が含まれる制御ループの重要度も考慮して定義されている。
例えば、図5に図示したI/O図において、「機器ID」が「P1234」であるフィールド機器が含まれる制御ループの制御ループ名は「ループ1」であり、「機器ID」が「P1234」であるフィールド機器の「機器重要度」は「低」である。また、図6に図示するアラーム設定定義データにおいて、「制御ループ名」が「ループ1」であり、「機器重要度」が「低」である場合、アラーム重要度は「低」である。これにより、プラント制御支援装置1は、「機器ID」が「P1234」で「ループ1」に含まれるフィールド機器におけるアラーム重要度が「低」であることを認識することができる。
同様に、例えば、図5に図示したI/O図において、「機器ID」が「P1245」であるフィールド機器が含まれる制御ループの制御ループ名は「ループ4」であり、「機器ID」が「P1245」であるフィールド機器の「機器重要度」は「高」である。また、図6に図示するアラーム設定定義データにおいて、「制御ループ名」が「ループ4」であり、「機器重要度」が「高」である場合、アラーム重要度は「中」である。これにより、プラント制御支援装置1は、「機器ID」が「P1245」で「ループ4」に含まれるフィールド機器におけるアラーム重要度が「中」であることを認識することができる。
なお、図6に図示するアラーム設定定義データにおいて、例えば、「制御ループ名」が「ループ3」であり、「機器重要度」が「低」である場合、アラーム重要度は「非表示」となっている。あるフィールド機器におけるアラーム重要度が「非表示」となっている場合、当該フィールド機器のアラームについては、報酬関数定義部104は、報酬・ペナルティ関数の定義においてペナルティ関数に含めない。
[運転状態を示すパラメータの最適値を求める学習]
次に、運転状態を示すパラメータの最適値を求める学習の処理について、図面を参照しながら更に詳しく説明する。図7は、本発明の第1の実施形態に係るプラント制御支援装置1によるパラメータの学習を示す概略図である。
図示するように、本実施形態に係るプラント制御支援装置1によるパラメータの学習は、当該学習における処理を示す処理pr1〜処理pr7、ユーザ(システム管理者やオペレータ等)によって与えられる情報を示すユーザデータud1〜ユーザデータud5、処理pr1〜処理pr7によって生成される計算データcd1〜cd7、及びプラント制御支援装置1の電源pwにより実行される。
なお、本実施形態に係るプラント機器(例えば、図1に図示したプラント機器P0)は、複数のセグメントを含んで構成される。セグメントとは、上述したように、プラント機器の一部の範囲を示すものである。本実施形態においては、セグメントは、プラント機器を制御ループの単位でセグメント分けすることによって定義される。
なお、セグメントは、ユーザ(システム管理者やオペレータ等)によって定義されてもよいし、コンピュータプログラムによって(例えば、I/O及びセグメント図等から制御ループを認識して、制御ループ単位でプラント機器をセグメント分けすることにより)定義されてもよい。
図7に図示するように、まず、プラント制御支援装置1の電源pwがオンにされると、セグメント選択部103は、プラント機器(例えば、図1に図示したプラント機器P0)を構成する複数のセグメントの中から、運転状態を示すパラメータの最適値を求める学習の実行対象となるセグメントを1つ選択する処理pr1を実行する。
なお、初回の選択時においては、ユーザによって指定されたセグメントが選択される。例えば、ユーザ(ボードオペレータ)が図2に図示した入力装置16を介して入力する、あるいはユーザ(フィールドオペレータ)が図1に図示したフィールドオペレータ端末7を介して入力することにより、セグメントが指定される。
なお、本実施形態において初回時に選択されるセグメントは、プラント機器P0の生成物(最終成果物)の収量を計測するモニタが含まれるセグメントである。例えば、初回時に選択されるセグメントは、図1に図示するプラント機器P0において、最終成果物である「水素」の収量を計測するモニタM1が含まれるセグメントである。
セグメントが選択されると、報酬関数定義部104は、運転状態を示すパラメータの最適値を求める学習に用いる報酬・ペナルティ関数を定義する処理pr2を実行する。
なお、報酬・ペナルティ関数とは、報酬関数とペナルティ関数とが組み合わされた関数である。
報酬関数定義部104は、処理pr2によって定義された報酬・ペナルティ関数を学習部108へ出力する。
報酬関数とは、最適化する対象となるプラント機器において何を最適化するのか(例えば、成果物の収量を最大化するのか、成果物の品質を最良にするのか、あるいは、プラント操業の安定度(安全度)を最高にするのか)について定義される関数である。
報酬関数は、ユーザにより予めユーザデータud3(報酬関数定義データ)に定義されている。例えば、ユーザ(ボードオペレータ)が図2に図示した入力装置16を介して入力する、あるいはユーザ(フィールドオペレータ)が図1に図示したフィールドオペレータ端末7を介して入力することにより、ユーザデータud3(報酬関数定義データ)に報酬関数が定義される。
例えば、m1やm2を成果物の収量の計測値とし、a1をアラームの値とすることにより、例えば、成果物の収量を最大化する報酬関数を「Max(m1)」と定義したり、成果物の品質を最良にする報酬関数を「m1/m2=50%」と定義したり、あるいは、プラントの操業の安定度(安全度)を最高にする報酬関数を「10<m1<20、a1=0」と定義したりすることができる。
なお、プラント制御支援装置1は、複数の報酬の組み合わせを1つの報酬関数として、この複数の報酬の組み合わせを最適化するように学習を実行するようにしてもよい。例えば、報酬関数を「m1+1/(m1/m2−50%)」と定義することにより、m1を最大(収量最大)にしつつ、m1/m2を50%に最も近付けた状態(品質最良)が最良の状態であるような報酬関数を定義することができる。
ペナルティ関数とは、アラームが挙がること(アラームの値)に応じて報酬関数の値を減算するための関数である。ペナルティ関数は、ユーザデータud2(アラーム設定定義データ)から自動もしくは半自動で作成される。
例えば、アラームの値a1〜a3がユーザデータud2(アラーム設定定義データ)において定義されており、それぞれ、a1が「(アラーム優先度)高」、a2が「(アラーム優先度)中」、及びa3が「(アラーム優先度)低」、であるものとする。この場合、例えば、ペナルティ関数を「−a1*100−a2*10−a3*1」と定義することによって、アラーム優先度が高いほど報酬関数をより多く減算するように重みづけしたペナルティ関数を定義することができる。
報酬関数定義部104は、上述した報酬関数とペナルティ関数を組み合わせることにより、例えば、報酬・ペナルティ関数F(x)を、「F(x)=m1+/(m1/m2−50%)−a1*100−a2*10−a3*1」と定義する。
報酬・ペナルティ関数が決定すると、パラメータ抽出部105は、(処理pr1において)選択されたセグメントに含まれる、学習の対象となるパラメータを抽出する処理pr3を実行する。パラメータは、ユーザデータud1(セグメント図)、及びユーザデータud4(I/O図)に含まれる「制御ループ名」や「設置場所」などの情報に基づいて抽出される。なお、パラメータの抽出は、ユーザ(システム管理者やオペレータ等)によって行われるようにしてもよい。
また、初回時は、パラメータ抽出部105は、抽出したパラメータに対して予め設定されているパラメータ暫定初期値を、ユーザデータud5(パラメータ暫定初期値データ)から取得する。
パラメータが抽出され、抽出されたパラメータのパラメータ暫定初期値が取得されると、パラメータ抽出部105は、当該パラメータのリストと、それぞれのパラメータのパラメータ暫定初期値とを、パラメータ分類部106へ出力する。
パラメータ分類部106は、取得したパラメータを、ユーザデータud1(セグメント図)、及びユーザデータud4(I/O図)に基づいて分類する処理pr4を実行する。
パラメータ分類部106は、取得したパラメータを、「セグメント内の可変パラメータ」、「セグメント内のモニタパラメータ」、「セグメント外の可変パラメータ」、または「セグメント外の固定パラメータ」に分類する。
なお、「セグメント内の可変パラメータ」とは、セグメント内に存在する、パラメータ値を制御することができるパラメータである。「セグメント内の可変パラメータ」は、主に、ユーザデータud4(I/O図)において、例えば「バルブ」と示されているフィールド機器(出力機器)が該当するが、その他、例えば手動弁のようなものが含まれていてもよい。
また、「セグメント内のモニタパラメータ」とは、セグメント内に存在する、モニタ用の(パラメータ値を制御することができない)パラメータである。「セグメント内のモニタパラメータ」は、主に、ユーザデータu4d(I/O図)において、例えば「温度計」、「圧力計」、あるいは「流量計」と示されているフィールド機器(入力機器)が該当する。
また、「セグメント外の可変パラメータ」及び「セグメント外の可変パラメータ」とは、隣接する他のセグメントとのやりとりを表すパラメータである。
「セグメント外の可変パラメータ」は、他のセグメントを調整することによってパラメータ値を制御することができるパラメータである。「セグメント外の可変パラメータ」には、隣接する他のセグメントから選択されているセグメントへの入力値を示すパラメータと、選択されているセグメントから隣接する他のセグメントへの出力値を示すパラメータと、がある。
「セグメント外の固定パラメータ」は、パラメータ値を制御することができないパラメータである。「セグメント外の固定パラメータ」には、隣接する他のセグメントから選択されているセグメントへの入力値を示すパラメータ、選択されているセグメントから隣接する他のセグメントへの出力値を示すパラメータ、あるいは、学習による最適化の対象である最終成果物の収量を示すパラメータである。
なお、セグメント選択とパラメータの分類については後に詳しく説明する。
パラメータが分類されると、パラメータ絞り込み部107は、セグメント図に基づいて、報酬・ペナルティ関数の最大化において有効でなさそうなパラメータを削除(除外)することにより有効なパラメータに絞り込む。あるいは、パラメータ絞り込み部107は、学習部108において最適値を求めるパラメータの優先順位付けを行い、より有効なパラメータの優先順位を高くする。また、パラメータ絞り込み部107は、セグメント図に基づいて、学習部108による学習が収束しやすくするための情報となる、パラメータ間の相関を示す関連モデルを生成する処理pr5を実行する。
なお、学習部108により運転状態を示すパラメータの最適値を求める学習が実行される場合において、もしパラメータ絞り込み部107によるパラメータの絞り込みや、パラメータ間の相関を示す関連モデルの生成がなされていないならば、学習部108は、パラメータ値を制御することができる全てのパラメータ(可変パラメータ)について、それぞれパラメータ値を変更させながら最適値を探索していかなければならない。
しかしながら、この場合、比較的短時間で最適値を求めることが可能な場合もあるが、場合によっては、可変パラメータの数が多くなると、調整するパラメータ値の組み合わせが膨大になるため、学習が収束するまでに長時間を要するか、あるいは学習が収束しない、あるいは局所最適に収束する等の問題が発生する場合がある。そのため、パラメータ絞り込み部107は、上述したように、報酬・ペナルティ関数の最大化において有効でなさそうなパラメータを削除(除外)して(あるいは、学習部108において最適値を求めるパラメータの優先順位付けを行って)有効なパラメータに絞り込み、パラメータ間の相関を示す関連モデルを生成する処理pr5を実行し、絞り込んだパラメータと、生成した関連モデルと、を学習部108へ出力する。
なお、関連モデルによるパラメータ間の相関確率計算については後に詳しく説明する。
学習部108は、パラメータ絞り込み部107から、計算データcd1〜計算データcd4を取得する(なお、計算データcd1〜計算データcd3はパラメータ分類部106からも取得可能)。そして、学習部108は、これらの取得したデータと報酬関数定義部104から取得した報酬・ペナルティ関数とを用いて、人工知能による強化学習を行う処理pr6を実行する。ここで、計算データcd1は、セグメント内の可変パラメータ名とパラメータ値である。また、計算データcd2は、セグメント内のモニタパラメータ名とパラメータ値である。また、計算データcd3は、セグメント外の可変パラメータ名及び固定パラメータ名とそれぞれのパラメータ値である。また、計算データcd4は、パラメータ間の相関を示す関連モデルである。
なお、人工知能による強化学習は、既存の技術を用いて行われる。学習部108は、計算データcd1〜計算データcd4に基づいて、セグメント内及びセグメント外の可変パラメータのパラメータ値を変更させながら学習の処理を行い、当該パラメータ値を最適化する。
学習部108により最初に選択されたセグメントにおけるパラメータのパラメータ値の最適化が完了すると、学習部108は、計算データcd5〜計算データcd7をパラメータ抽出部105へ出力する。ここで、計算データcd5は、セグメント内の可変パラメータの最適値(最適化されたパラメータ値)である。また、計算データcd6は、セグメント外の可変パラメータの出力最適値(セグメント外へ出力するフィールド機器の可変パラメータの最適値)である。また、計算データcd7は、セグメント外の可変パラメータの入力最適値(セグメント外から入力されるフィールド機器の可変パラメータの最適値)である。
学習部108により最初に選択されたセグメントにおけるパラメータのパラメータ値の最適化が完了すると、セグメント選択部103は、上記において最初に選択したセグメントに隣接するセグメント(すなわち、プラント機器P0に一段階上流の工程であるセグメント)を1つ選択する処理pr1を再び実行する。
セグメントが選択されると、報酬関数定義部104は、運転状態を示すパラメータの最適値を求める学習に用いる報酬・ペナルティ関数を決定する処理pr2を再び実行する。
報酬・ペナルティ関数が決定すると、パラメータ抽出部105は、(処理pr1において)選択されたセグメントに含まれる、学習の対象となるパラメータを抽出する処理pr3を再び実行する。
パラメータが抽出され、抽出されたパラメータのパラメータ値が取得されると、パラメータ抽出部105は、当該パラメータのリストと、それぞれのパラメータのパラメータ値とをパラメータ分類部106へ出力する。パラメータ分類部106は、取得したパラメータを、ユーザデータud1(セグメント図)、及びユーザデータud4(I/O図)に基づいて分類する処理pr4を再び実行する。
パラメータ分類部106は、取得したパラメータを、「セグメント内の可変パラメータ」、「セグメント内のモニタパラメータ」、「セグメント外の可変パラメータ」、または「セグメント外の固定パラメータ」に分類する。
なお、前回(ここでは、初回に)選択されたセグメントにおける学習時において最適化された「セグメント外の可変パラメータ」に対応するパラメータが、今回選択されたセグメントにおける学習での「セグメント外の固定パラメータ」に分類される。すなわち、今回セグメントにおける学習では、前回選択された隣接するセグメントの学習において最適化されたパラメータのパラメータ値を満たすことを条件として、学習部108により可変パラメータのパラメータ値が最適化される。
パラメータが分類されると、パラメータ絞り込み部107は、セグメント図に基づいて、報酬・ペナルティ関数の最大化において有効でなさそうなパラメータを削除(除外)することにより有効なパラメータに絞り込む。あるいは、パラメータ絞り込み部107は、学習部108において最適値を求めるパラメータの優先順位付けを行い、より有効なパラメータの優先順位を高くする。また、パラメータ絞り込み部107は、セグメント図に基づいて、学習部108による学習が収束しやすくするための情報となる、パラメータ間の相関を示す関連モデルを生成する処理pr5を再び実行する。
学習部108は、パラメータ絞り込み部107から、計算データcd1〜計算データcd4を取得すると、これらの取得したデータを用いて、人工知能による強化学習を行う処理pr6を再び実行する。
学習部108により最初に選択されたセグメントにおける可変パラメータのパラメータ値の最適化が完了すると、学習部108は、計算データcd5〜計算データcd7をパラメータ抽出部105へ出力する。
このように、プラント機器に含まれる全てのセグメントについて学習が実行されるまで、上記の処理p1〜処理p6が繰り返される。
全てのセグメントについてのそれぞれの学習が実行完了すると、全体最適化部110は、当該学習によって決定したパラメータのパラメータ値を用いて、プラント機器全体に対する運転状態を示すパラメータの全体最適値を求める学習の処理pr7を実行する。
上述したように、可変パラメータの数が多くなると、調整するパラメータ値の組み合わせが膨大な数になるため、学習が収束するまでに長時間を要する、あるいは学習が収束しない、あるいは局所最適に収束しやすい等の問題が発生する場合がある。
しかしながら、本実施形態に係るプラント制御支援装置1は、まず、プラント機器をセグメント分けして、セグメントごとにそれぞれパラメータのパラメータ値の最適化を図る。その後、プラント制御支援装置1は、セグメントごとに最適化されたパラメータのパラメータ値を、それぞれのパラメータの初期値に設定して、今度は全てのセグメントを含むプラント機器全体に対して、パラメータのパラメータ値の全体最適化を行う。これにより、セグメントごとに既に部分最適化されているパラメータ値を、パラメータ暫定初期値として学習を行うことができるため、本実施形態に係るプラント制御支援装置1は、プラント機器全体に対する、運転状態を示すパラメータの全体最適値を求める学習を、より短時間で収束させ易くすることができる。
[セグメント選択]
次に、セグメント選択について、図面を参照しながら説明する。図8〜図10は、本発明の第1の実施形態に係るプラント制御支援装置1によるセグメント選択について説明するための図である。図8〜図10は、いずれも、図1に図示したプラント100におけるプラント機器P0の構成を示したものである。以下、図1に図示したプラント機器P0を例として、セグメント選択について説明する。
上述したように、セグメント選択部103は、例えば、制御ループの単位でプラント機器P0をセグメント分けする。
まず、セグメント選択部103は、図8に図示するセグメントSG1の範囲を、最適化する最初のセグメントとして選択する。セグメントSG1は、バルブV1及びバルブV2のバルブ開度が調整されることにより、プラント機器P0の最終成果物の収量(すなわち、モニタM1のモニタ値)、隣接する他のセグメントからセグメントSG1への入力を示すセグメント外の可変パラメータであるモニタM2のモニタ値、及びセグメントSG1から隣接する他のセグメントへの出力を示すセグメント外の可変パラメータであるモニタM3のモニタ値、の制御がなされる制御ループである。
学習部108は、最終成果物の収量を計測するモニタM1のモニタ値を最大化するように、セグメント内の可変パラメータであるバルブV1及びバルブV2のバルブ開度、及びセグメント外の可変パラメータであるモニタM2及びモニタM3のモニタ値、をそれぞれ変更させる。学習部108は、モニタM1のモニタ値を最大化するセグメント内の可変パラメータのパラメータ値(バルブ開度)及びセグメント外の可変パラメータのパラメータ値(モニタ値)の探索を完了させると、それぞれのパラメータ値を記憶領域(例えば、RAM12)に記憶させる。
次に、セグメント選択部103は、図9に図示するセグメントSG2の範囲を、最適化する次のセグメントとして選択する。セグメントSG1における学習において、セグメント外の可変パラメータであったモニタM2及びモニタM3は、セグメントSG2における学習においては、セグメント外の固定パラメータとなる。すなわち、学習部108は、セグメントSG1における学習によって探索されたモニタM2及びモニタM3のパラメータ値(モニタ値)となるように、セグメント内の可変パラメータであるバルブV3のパラメータ値(バルブ開度)、及びセグメント外の可変パラメータであるモニタM4のパラメータ値(モニタ値)、を変化させる。
なお、セグメントSG2は、バルブV3のパラメータ値(バルブ開度)が調整されることにより、セグメントSG2からセグメントSG1への出力を示すセグメント外の固定パラメータであるモニタM2のパラメータ値(モニタ値)、セグメントSG1からセグメントSG2への入力を示すセグメント外の固定パラメータであるモニタM3のパラメータ値(モニタ値)、及び隣接する他のセグメントからセグメントSG2への入力を示すセグメント外の可変パラメータであるモニタM4のパラメータ値(モニタ値)、の制御がなされる制御ループである。
学習部108は、セグメント内の可変パラメータであるバルブV3のパラメータ値(バルブ開度)、及びセグメント外の可変パラメータであるモニタM4のパラメータ値(モニタ値)の探索を完了させると、それぞれのパラメータ値を記憶領域(例えば、RAM12)に記憶させる。
次に、セグメント選択部103は、図10に図示するセグメントSG3の範囲を、最適化する次のセグメントとして選択する。セグメントSG2における学習において、セグメント外の可変パラメータであったモニタM4は、セグメントSG3における学習においては、セグメント外の固定パラメータとなる。すなわち、学習部108は、セグメントSG2における学習によって探索されたモニタM4のパラメータ値(モニタ値)となるように、セグメント内の可変パラメータであるバルブV4〜バルブV8のパラメータ値(バルブ開度)、及びセグメント外の可変パラメータであるモニタM5のパラメータ値(モニタ値)、を変化させる。
なお、セグメントSG3は、バルブV4〜バルブV8のパラメータ値(バルブ開度)が調整されることにより、セグメントSG3からセグメントSG2への出力を示すセグメント外の固定パラメータであるモニタM4のパラメータ値(モニタ値)、及び隣接する他のセグメントからセグメントSG3への入力を示すセグメント外の可変パラメータであるモニタM5のパラメータ値(モニタ値)、の制御がなされる制御ループである。
学習部108は、セグメント内の可変パラメータであるバルブV4〜バルブV8のパラメータ値(バルブ開度)、及びセグメント外の可変パラメータであるモニタM5のパラメータ値(モニタ値)の探索を完了させると、それぞれのパラメータ値を記憶領域(例えば、RAM12)に記憶させる。
このように、セグメント選択部103は、I/O図及びセグメント図に基づいて、プラント機器P0の最終成果物を生成する制御ループを最初に最適化するセグメントとして選択し、その後、I/O図及びセグメント図に基づいて、選択したセグメントの一段階上流の工程にあたるセグメント(制御ループ)を次に最適化するセグメントとして、順に選択していく。これにより、学習部108は、I/O図及びセグメント図に基づき、プラント機器P0を構成する複数のセグメントにおいて、当該プラント機器P0における、最も下流の工程であるセグメントからより上流のセグメントへ、順番に、セグメントごとに運転状態を示すパラメータの最適値を求める学習を実行することができる。
そして、学習部108によりプラント機器P0の全てのセグメントに対する最適化が完了すると、全体最適化部110は、上記の処理において記憶領域(例えば、RAM12)に記憶に記憶されたパラメータ値を初期値として、プラント機器P0全体を対象として、運転状態を示すパラメータの全体最適値を求める学習を実行する。
[パラメータ間の相関確率計算]
次に、パラメータ間の相関確率計算について、図面を参照しながら説明する。図11〜図12は、本発明の第1の実施形態に係るプラント制御支援装置1が制御するプラント機器のセグメントの一例を示す図である。
図11に図示するように、セグメントSG4は、モニタM01〜モニタM05と、バルブV01〜バルブV04と、を含んで構成される。
一般的に、図11に図示するようなセグメントに対して、運転状態を示すパラメータの最適値を求める学習が行われる場合、可変パラメータであるバルブV01〜バルブV04の全てのパラメータ値(バルブ開度)を変化させながら、最適値を探索する処理が行われる。しかしながら、上述したように、可変パラメータの数が多くなるにつれて、取りうるパラメータ値の組み合わせの数が膨大になるため、学習が収束するまでに長時間を要する、あるいは学習が収束しない、あるいは局所最適に収束しやすい等の問題が発生する場合がある。
一般的に、プラントの場合においては、例えば図10のような、セグメントを図示したセグメント図が予め存在するため、当該セグメント図から、どの可変パラメータのパラメータ値がどのモニタパラメータのパラメータ値に影響するか(あるいは、より影響しやすいか)を推定することが可能である。
例えば、図11に図示するセグメント図に基づいて、例えば、モニタM04のモニタ値を変化させたい場合には、バルブV03またはバルブV04のバルブ開度を変更するだけでよく、バルブV01またはバルブV02のバルブ開度はモニタM04のモニタ値に対して影響を与えない(あるいは、影響が小さい)ことを、ユーザ(システム管理者やオペレータ等)は推測することが可能である。
また、パラメータ絞り込み部107は、図11に図示するセグメント図から、図12に図示するようなパラメータ間の相関を示す関連モデルを論理的に作成することができる。
図12に図示する関連モデルの各ノードは、図11に示したフィールド機器にそれぞれ相当する。すなわち、例えば、ノード「M01」はモニタM01に相当し、ノード「V01」はバルブV01に相当する。そして、それぞれのノード間を結ぶ実線に対して付されたp1〜p10は、それぞれのノードに対応するパラメータ(すなわち、モニタ値やバルブ開度)間の相関確率を示す。
パラメータ絞り込み部107は、関連モデルを学習部108へ出力する。学習部108は、関連モデルを用いて人工知能による学習を行い、どのバルブのバルブ開度を可変させると、モニタのモニタ値がより大きく変動する可能性が高いか等を学習していき、パラメータの相関確率(ベイズ確率)を計算する。
例えば、図12に示すように、モニタM01のモニタ値がモニタM05のモニタ値に対してどれくらい影響を与えるかについては、P0501=(P7*P3+P8*P4)*P1によって計算することができる。また、例えば、モニタM03のモニタ値がモニタM05のモニタ値に対してどれくらい影響を与えるかについては、P0503=P1によって計算することができる。これにより、P0501≦P0503となることが分かるため、モニタM01を変化させるよりも、モニタM03を変化させるほうが、モニタM05を変化させる確率が高いことを認識することができる。(なお、P1〜P10の初期値は全て1であるが、学習を行う段階で実際の値に変化していく)。
このように、本実施形態に係るプラント制御支援装置1は、モニタパラメータのパラメータ値に対して必要な変化を起こさせるために、どの可変パラメータのパラメータ値を変化させることがより有効であるか(より確率が高いか)についての情報を、セグメント図から取り込むことができる。これにより、プラント制御支援装置1は、運転状態を示すパラメータの最適値を求める学習を、より短時間で収束させたり、局所最適にならないように収束させたりすることができる。
以上説明したように、本実施形態に係るプラント制御支援装置1は、一般的にプラントの設計時には必ず存在する情報を、人工知能による学習の入力データ(パラメータ)として自動的または半自動的に設定して、学習を実行する。なお、ここでいう必ず存在する情報とは、上述したように、I/O図、セグメント図、アラーム設定定義データ、及びパラメータ暫定初期値データ等である。
これにより、本実施形態に係るプラント制御支援装置1は、プラントが既設のプラントであるか、あるいは新設のプラントであるかを問わず、また、プラントの分野を問わず、多種多様な業種のプラントに対して適用することが可能である。
また、以上説明したように、本実施形態に係るプラント制御支援装置1は、セグメント図やI/O図に基づいてプラント機器をセグメント化し、セグメントごとに運転状態を示すパラメータの最適値を求める学習を実行する。また、プラント制御支援装置1は、セグメント図が示すプラント内のフィールド機器の構成情報に基づいて、学習の対象となるパラメータの数を削減したり、パラメータの有効度や関連性を確率によって表した情報を学習に用いたりすることができる。これにより、本実施形態に係るプラント制御支援装置1は、より短時間に学習を収束させ易くすることができる。
また、一般的にプラントを人工知能で制御する場合、プラント全体を一度に制御することは困難であることが多いが、本実施形態に係るプラント制御支援装置1によれば、セグメントごとに制御を行うことにより、プラント全体を制御することが可能である。
<第2の実施形態>
第1の実施形態では、DCSの機能を有するプラント制御支援装置に対して、人工知能による学習を実行する機能を備えさせ、プラント制御支援装置は、フィールド機器の運転状態を示すパラメータの最適値を求める学習を実行した。これにより、プラント制御支援装置は、学習の収束結果に基づいてフィールド機器のパラメータを調整し、プラントを自動制御することを可能にした。
一方、第2の実施形態では、プラントシミュレータに対して、人工知能による学習を実行する機能を備えさせる。これにより、プラントシミュレータは、例えば、プラントにおけるトラブル発生した時の状態をパラメータ暫定初期値に設定して、実際のプラント機器の動きを模擬する(シミュレーションを実行する)ことができる。
これにより、プラントシミュレータは、トラブル発生に対する、最適な(例えば、最短時間での)リカバリ手順の発見を行うことができる。
また、これにより、本実施形態に係るプラントシミュレータは、学習の過程において設定されるパラメータのパラメータ値を実プラント上で適用する前に、事前にプラントシミュレータにおいて安全に模擬(シミュレーション)を行うことができる。本実施形態によれば、プラントシミュレータ上でプラント機器の安定した動作が確認された後で、学習結果であるパラメータのパラメータ値を実プラント上で適用する仕組みを提供することができる。
また、プラントシミュレータにおいては、時間のスケールを自由に設定する(例えば、2倍速、あるいは10倍速等に設定する)ことも可能である。一般的に、人工知能による強化学習によりパラメータ値の最適化を行う場合、パラメータ値の変更に対して系が反応するまでのタイムラグを考慮する必要がある。しかしながら、本実施形態によれば、系の落ち着きを見ながら時間のスケールを自由に変更することができるため、長時間のタイムラグを伴うプラントの制御であっても、より短時間でシミュレーションを実行することができる。
なお、上述した実施形態におけるプラント100及びプラント制御支援装置1の一部または全部をコンピュータで実現するようにしてもよい。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。
なお、ここでいう「コンピュータシステム」とは、プラント100及びプラント制御支援装置1に内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信回線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
また、上述した実施形態におけるプラント100及びプラント制御支援装置1の一部または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。プラント100及びプラント制御支援装置1の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
1・・・プラント制御支援装置、2・・・基幹業務システム、3・・・製造実行システム、4・・・運転制御装置、5・・・操作盤、6・・・保全機器、7・・・フィールドオペレータ端末、11・・・CPU、12・・・RAM、13・・・ROM、14・・・HDD、15・・・表示装置、16・・・入力装置、17・・・通信I/F、100・・・プラント、101・・・運転状態取得部、102・・・ユーザデータ取得部、103・・・セグメント選択部、104・・・報酬関数定義部、105・・・パラメータ抽出部、106・・・パラメータ分類部、107・・・パラメータ絞り込み部、108・・・学習部、109・・・運転指示部、110・・・全体最適化部

Claims (10)

  1. プラントを構成するセグメントの中から、運転状態を示すパラメータの最適値を求める学習を行う前記セグメントを選択するセグメント選択部と、
    前記学習に用いられる報酬関数を定義する報酬関数定義部と、
    前記プラントで用いられる機器の入出力情報、及び前記セグメントに含まれる機器の構成を示すセグメント情報に基づいて、選択されたセグメントにおける前記学習の対象となるパラメータを抽出するパラメータ抽出部と、
    前記報酬関数、及び抽出された前記パラメータに基づいて、運転状態を示すパラメータの最適値を求める学習を前記セグメントごとに行う学習部と、
    を備えることを特徴とするプラント制御支援装置。
  2. 前記パラメータ抽出部によって抽出された前記パラメータを、前記セグメント情報及び前記入出力情報に基づいて、セグメント内の可変パラメータ、セグメント内のモニタパラメータ、セグメント外の可変パラメータ、またはセグメント外の固定パラメータに分類するパラメータ分類部を備え、
    前記学習部は、前記パラメータ分類部によって分類された前記パラメータに基づいて前記学習を行う
    ことを特徴とする請求項1に記載のプラント制御支援装置。
  3. 前記学習部は、前記セグメント情報に基づく前記パラメータの間の相関を示す関連モデルに基づいて前記学習を行う
    ことを特徴とする請求項2に記載のプラント制御支援装置。
  4. 前記セグメント選択部は、前記プラントにおける工程の流れに応じて、前記プラントを構成する複数のセグメントを順に選択する
    ことを特徴とする請求項1から請求項3のうちいずれか一項に記載のプラント制御支援装置。
  5. 前記セグメントごとになされた前記学習によってそれぞれ決定したパラメータに基づいて、前記プラントの全体に対して前記パラメータの最適化のための学習を行う全体最適化部、
    を備えることを特徴とする請求項1から請求項4のうちいずれか一項に記載のプラント制御支援装置。
  6. 前記報酬関数定義部は、前記プラントにおいて発生するアラームに基づく値に応じて前記報酬関数の値を減算するための関数であるペナルティ関数を定義し、
    前記学習部は、前記ペナルティ関数に基づいて、前記学習を前記セグメントごとに行う
    ことを特徴とする請求項1から請求項5のうちいずれか一項に記載のプラント制御支援装置。
  7. 前記報酬関数を最大化する目的に寄与しないパラメータを前記セグメント情報に基づいて特定し、特定したパラメータを前記パラメータ抽出部によって抽出されたパラメータから除外することにより、前記パラメータ抽出部によって抽出されたパラメータの絞り込みを行うパラメータ絞り込み部、
    を備えることを特徴とする請求項1から請求項6のうちいずれか一項に記載のプラント制御支援装置。
  8. コンピュータによるプラント制御支援方法であって、
    プラントを構成するセグメントの中から、運転状態を示すパラメータの最適値を求める学習を行う前記セグメントを選択するセグメント選択ステップと、
    前記学習に用いられる報酬関数を定義する報酬関数定義ステップと、
    前記プラントで用いられる機器の入出力情報、及び前記セグメントに含まれる機器の構成を示すセグメント情報に基づいて、選択されたセグメントにおける前記学習の対象となるパラメータを抽出するパラメータ抽出ステップと、
    前記報酬関数、及び抽出された前記パラメータに基づいて、運転状態を示すパラメータの最適値を求める学習を前記セグメントごとに行う学習ステップと、
    を有することを特徴とするプラント制御支援方法。
  9. コンピュータに、
    プラントを構成するセグメントの中から、運転状態を示すパラメータの最適値を求める学習を行う前記セグメントを選択するセグメント選択ステップと、
    前記学習に用いられる報酬関数を定義する報酬関数定義ステップと、
    前記プラントで用いられる機器の入出力情報、及び前記セグメントに含まれる機器の構成を示すセグメント情報に基づいて、選択されたセグメントにおける前記学習の対象となるパラメータを抽出するパラメータ抽出ステップと、
    前記報酬関数、及び抽出された前記パラメータに基づいて、運転状態を示すパラメータの最適値を求める学習を前記セグメントごとに行う学習ステップと、
    を実行させるためのプラント制御支援プログラム。
  10. コンピュータに、
    プラントを構成するセグメントの中から、運転状態を示すパラメータの最適値を求める学習を行う前記セグメントを選択するセグメント選択ステップと、
    前記学習に用いられる報酬関数を定義する報酬関数定義ステップと、
    前記プラントで用いられる機器の入出力情報、及び前記セグメントに含まれる機器の構成を示すセグメント情報に基づいて、選択されたセグメントにおける前記学習の対象となるパラメータを抽出するパラメータ抽出ステップと、
    前記報酬関数、及び抽出された前記パラメータに基づいて、運転状態を示すパラメータの最適値を求める学習を前記セグメントごとに行う学習ステップと、
    を実行させるためのプラント制御支援プログラムを記録した記録媒体。
JP2017136899A 2017-07-13 2017-07-13 プラント制御支援装置、プラント制御支援方法、プラント制御支援プログラム及び記録媒体 Active JP6939162B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2017136899A JP6939162B2 (ja) 2017-07-13 2017-07-13 プラント制御支援装置、プラント制御支援方法、プラント制御支援プログラム及び記録媒体
US16/031,568 US11442416B2 (en) 2017-07-13 2018-07-10 Plant control supporting apparatus, plant control supporting method, and recording medium
EP18182945.8A EP3428744B1 (en) 2017-07-13 2018-07-11 Plant control supporting apparatus, plant control supporting method, plant control supporting program, and recording medium
CN201810756313.8A CN109254575B (zh) 2017-07-13 2018-07-11 车间控制辅助装置、车间控制辅助方法及记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017136899A JP6939162B2 (ja) 2017-07-13 2017-07-13 プラント制御支援装置、プラント制御支援方法、プラント制御支援プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2019020885A true JP2019020885A (ja) 2019-02-07
JP6939162B2 JP6939162B2 (ja) 2021-09-22

Family

ID=62916554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017136899A Active JP6939162B2 (ja) 2017-07-13 2017-07-13 プラント制御支援装置、プラント制御支援方法、プラント制御支援プログラム及び記録媒体

Country Status (4)

Country Link
US (1) US11442416B2 (ja)
EP (1) EP3428744B1 (ja)
JP (1) JP6939162B2 (ja)
CN (1) CN109254575B (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020235061A1 (ja) * 2019-05-22 2020-11-26
JP2021071932A (ja) * 2019-10-31 2021-05-06 横河電機株式会社 装置、方法およびプログラム
JP2022537606A (ja) * 2019-08-16 2022-08-26 三菱電機株式会社 強化学習制御のための制約アダプタ
EP4174591A1 (en) 2021-10-27 2023-05-03 Yokogawa Electric Corporation Operation system, operation method and operation program
EP4270118A1 (en) 2022-04-26 2023-11-01 Yokogawa Electric Corporation Control apparatus, control method, and control program
WO2024024220A1 (ja) * 2022-07-28 2024-02-01 株式会社日立製作所 制御装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3654123B1 (en) * 2018-11-14 2022-02-16 ABB Schweiz AG Method of comissioning a field device in an industrial system network
WO2020225883A1 (ja) * 2019-05-08 2020-11-12 三菱電機株式会社 工程管理装置、工程管理方法および工程管理プログラム
CN113033815A (zh) * 2021-02-07 2021-06-25 广州杰赛科技股份有限公司 一种阀门智能协作控制方法、装置、设备及存储介质
WO2022195825A1 (ja) * 2021-03-18 2022-09-22 三菱電機株式会社 運転改善支援プログラム、運転改善支援装置および運転改善支援方法
US20230097885A1 (en) * 2021-09-24 2023-03-30 Rockwell Automation Technologies, Inc. Machine learning models for asset optimization within industrial automation environments
JP2023149010A (ja) * 2022-03-30 2023-10-13 横河電機株式会社 情報処理装置、プラント制御方法およびプラント制御プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7418301B2 (en) * 1996-05-06 2008-08-26 Pavilion Technologies, Inc. Method and apparatus for approximating gains in dynamic and steady-state processes for prediction, control, and optimization
JP2000276206A (ja) * 1999-03-24 2000-10-06 Yamaha Motor Co Ltd 総合特性最適化方法及び装置
US7376472B2 (en) * 2002-09-11 2008-05-20 Fisher-Rosemount Systems, Inc. Integrated model predictive control and optimization within a process control system
US7587804B2 (en) * 2004-12-20 2009-09-15 General Motors Corporation System and method for optimization of product throughput
CA2592908A1 (en) * 2006-06-30 2007-12-30 Hitachi, Ltd. Line diagnostic device, bus system, line diagnostic method, bus system control method, and line diagnostic program
JP4427074B2 (ja) * 2007-06-07 2010-03-03 株式会社日立製作所 プラントの制御装置
US9477214B2 (en) 2013-03-07 2016-10-25 General Electric Company Plant control systems and methods
WO2015194006A1 (ja) * 2014-06-19 2015-12-23 富士通株式会社 プログラム生成装置、プログラム生成方法およびプログラム
DE102014212747A1 (de) * 2014-07-01 2016-01-07 Siemens Aktiengesellschaft Interaktives Assistenzsystem und Verfahren zur rechnergestützten Steuerungsoptimierung für ein technisches System
JP6522445B2 (ja) * 2015-06-30 2019-05-29 三菱日立パワーシステムズ株式会社 制御パラメータ最適化システム及びそれを備えた運転制御最適化装置
US20170286882A1 (en) * 2016-04-01 2017-10-05 Demand Energy Networks, Inc. Control systems and methods for economical optimization of an electrical system
US10534328B2 (en) * 2016-06-21 2020-01-14 General Electric Company Methods and systems for enhancing control of power plant generating units

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020235061A1 (ja) * 2019-05-22 2020-11-26
WO2020235061A1 (ja) * 2019-05-22 2020-11-26 日本電気株式会社 動作規則決定装置、動作規則決定方法および記録媒体
JP2022537606A (ja) * 2019-08-16 2022-08-26 三菱電機株式会社 強化学習制御のための制約アダプタ
JP7297155B2 (ja) 2019-08-16 2023-06-23 三菱電機株式会社 マシンの動作を制御するためのシステムおよびコンピュータ実施方法
JP2021071932A (ja) * 2019-10-31 2021-05-06 横河電機株式会社 装置、方法およびプログラム
EP4174591A1 (en) 2021-10-27 2023-05-03 Yokogawa Electric Corporation Operation system, operation method and operation program
EP4174589A1 (en) 2021-10-27 2023-05-03 Yokogawa Electric Corporation Apparatus, method and computer readable medium for evaluating an operation model
EP4174592A1 (en) 2021-10-27 2023-05-03 Yokogawa Electric Corporation Apparatus, method, and program
EP4270118A1 (en) 2022-04-26 2023-11-01 Yokogawa Electric Corporation Control apparatus, control method, and control program
WO2024024220A1 (ja) * 2022-07-28 2024-02-01 株式会社日立製作所 制御装置

Also Published As

Publication number Publication date
EP3428744B1 (en) 2021-09-15
US20190018374A1 (en) 2019-01-17
EP3428744A1 (en) 2019-01-16
CN109254575A (zh) 2019-01-22
JP6939162B2 (ja) 2021-09-22
CN109254575B (zh) 2023-04-25
US11442416B2 (en) 2022-09-13

Similar Documents

Publication Publication Date Title
JP6939162B2 (ja) プラント制御支援装置、プラント制御支援方法、プラント制御支援プログラム及び記録媒体
JP7499291B2 (ja) プロセス制御データの遠隔アクセスのためのモバイルデバイス
JP7461440B2 (ja) 根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法
US10564617B2 (en) Plant control device, plant control method, and recording medium
US10365640B2 (en) Controlling multi-stage manufacturing process based on internet of things (IoT) sensors and cognitive rule induction
CN103703425B (zh) 监控工业过程的方法
JP6933899B2 (ja) プラント運転支援装置、プラント運転支援方法、及びプラント運転支援プログラム
JP7481537B2 (ja) 情報処理システム、情報処理方法及び情報処理装置
JP2021174397A (ja) 制御支援装置、制御支援方法、制御支援プログラム、および制御システム
US11906951B2 (en) Method and system for managing model updates for process models
US20230097599A1 (en) Monitoring apparatus, monitoring method, and non-transitory computer readable medium
CN107615199A (zh) 系统设计辅助装置、方法及程序
US20180088565A1 (en) Operator Display Switching Preview
CN117076452A (zh) 表单更新方法、装置、设备、系统及计算机可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210816

R150 Certificate of patent or registration of utility model

Ref document number: 6939162

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150