JP7286439B2 - Supervisory control system, information processing device, information processing method, and computer program - Google Patents
Supervisory control system, information processing device, information processing method, and computer program Download PDFInfo
- Publication number
- JP7286439B2 JP7286439B2 JP2019119480A JP2019119480A JP7286439B2 JP 7286439 B2 JP7286439 B2 JP 7286439B2 JP 2019119480 A JP2019119480 A JP 2019119480A JP 2019119480 A JP2019119480 A JP 2019119480A JP 7286439 B2 JP7286439 B2 JP 7286439B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- failure
- unit
- ras
- recorded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Testing And Monitoring For Control Systems (AREA)
- Debugging And Monitoring (AREA)
Description
本発明の実施形態は、監視制御システム、情報処理装置、情報処理方法及びコンピュータプログラムに関する。 TECHNICAL FIELD Embodiments of the present invention relate to a monitoring control system, an information processing apparatus, an information processing method, and a computer program.
監視制御システムに障害が発生した場合、障害原因の調査が行われる。障害原因の調査では専門の技術者が監視制御システムに関するログの収集及び解析を行う。障害原因の調査には、監視制御システムに関する知識や監視制御システムのソフトウェアに用いられているプログラミング言語に関する知識が求められる。このため、障害原因の調査には長い時間や大きな労力を要する場合があった。 When a fault occurs in the supervisory control system, the cause of the fault is investigated. In investigating the cause of a failure, a professional engineer collects and analyzes logs related to the supervisory control system. Investigation of the cause of failure requires knowledge of the supervisory control system and knowledge of the programming language used for the software of the supervisory control system. For this reason, it sometimes takes a long time and a lot of labor to investigate the cause of the failure.
本発明が解決しようとする課題は、より簡単に障害原因を特定することができる監視制御システム、情報処理装置、情報処理方法及びコンピュータプログラムを提供することである。 The problem to be solved by the present invention is to provide a monitoring control system, an information processing device, an information processing method, and a computer program that can more easily identify the cause of failure.
実施形態の監視制御システムは、記録情報取得部と、障害検出部と、出力制御部とを持つ。記録情報取得部は、所定の機器に対する監視制御を行う装置の動作に関する情報が記録された記録情報を前記装置から取得する。障害検出部は、前記装置に発生する可能性がある障害に関する障害情報と前記記録情報とに基づいて、前記装置に障害が発生しているか否かを検出し、前記障害が検出された場合、前記障害の障害原因を前記記録情報に基づいて推定する。出力制御部は、前記障害原因に関する情報を予め定められた所定の方法で出力する。 A supervisory control system according to an embodiment has a recorded information acquisition section, a failure detection section, and an output control section. The record information acquisition unit acquires record information in which information relating to the operation of a device that performs monitoring control on a predetermined device is recorded from the device. The failure detection unit detects whether or not a failure has occurred in the device based on failure information regarding a failure that may occur in the device and the recorded information, and if the failure is detected, A failure cause of the failure is estimated based on the recorded information. The output control unit outputs the information about the cause of failure by a predetermined method.
以下、実施形態の監視制御システム、情報処理装置、情報処理方法及びコンピュータプログラムを、図面を参照して説明する。 Hereinafter, a monitoring control system, an information processing apparatus, an information processing method, and a computer program according to embodiments will be described with reference to the drawings.
図1は、実施形態の監視制御システム1のシステム構成を示すシステム構成図である。監視制御システム1は、情報処理装置100、監視制御装置200、端末装置300及び制御装置400を備える。監視制御システム1の各装置にインストールされたソフトウェアは、Java(登録商標)やC言語等の汎用的なプログラミング言語で実装される。監視制御システム1では、監視制御システム1における障害の発生を検出した場合、又は障害発生の恐れを検出した場合(以下「障害検出処理」という。)、RAS(Reliability Availability Serviceability)情報の記憶が行われる。監視制御システム1は、障害検出処理において定期的に収集されるRAS情報を解析することで障害に関するログを検出する。監視制御システム1は、検出されたログに基づいて、障害の原因となる機能又は処理を特定する。機能又は処理は、各装置にインストールされたソフトウェアと同じプログラミング言語で実装される。RAS情報とは、装置、OS(Operating System)又はソフトウェア等の監視制御システム1を構成する装置やソフトウェアが出力する情報である。RAS情報は、例えば監視制御システム1を構成する装置やソフトウェアが出力するログである。以下、障害の発生又は障害発生の恐れについて、区別しないときは、単に障害の発生と称して説明する。
FIG. 1 is a system configuration diagram showing the system configuration of a monitoring control system 1 according to an embodiment. The supervisory control system 1 includes an
情報処理装置100、監視制御装置200、端末装置300及び制御装置400は、いずれもネットワーク500を介して通信可能である。ネットワーク500は、例えばLAN(Local Area Network)等の閉域通信網である。ネットワーク500は、無線通信を用いたネットワークであってもよいし、有線通信を用いたネットワークであってもよい。ネットワーク500は、複数のネットワークが組み合わされて構成されてもよい。ネットワーク500は、インターネット等の広域通信網であってもよい。なお、ネットワーク500は、各装置の通信を実現するためのネットワークの具体例にすぎず、各装置の通信を実現するためのネットワークとして他の構成が採用されてもよい。例えば、特定の装置間の通信が他の装置間の通信に用いられるネットワークとは異なるネットワークを用いて実現されてもよい。具体的には、情報処理装置100と制御装置400との間の通信は、情報処理装置100、監視制御装置200、端末装置300及び制御装置400の各装置間の通信とは異なるネットワークで実現されてもよい。
The
図2は、実施形態の情報処理装置100の機能構成を示す機能ブロック図である。情報処理装置100は、パーソナルコンピュータ又はサーバ等の情報処理装置を用いて構成される。情報処理装置100は、障害検出処理を実行するための機能が実装されている。障害検出処理の機能は、ハードウェアによって情報処理装置100に実装されてもよいし、ソフトウェアのインストールによって実装されてもよい。情報処理装置100は、通信部101、入力部102、出力部103、RAS情報記憶部104、障害情報記憶部105及び制御部106を備える。
FIG. 2 is a functional block diagram showing the functional configuration of the
通信部101は、ネットワークインタフェース等の通信装置である。通信部101は所定のプロトコルでネットワーク500に通信可能に接続する。通信部101は、制御部106の制御に応じてネットワーク500を介して、他の装置との間でデータ通信する。
The
入力部102は、キーボード、ポインティングデバイス(マウス、タブレット等)、ボタン、タッチパネル等の入力装置を用いて構成される。入力部102は、ユーザの指示を情報処理装置100に入力する際にユーザによって操作される。入力部102は、入力装置を情報処理装置100に接続するためのインタフェースであってもよい。この場合、入力部102は、入力装置においてユーザの入力に応じて生成された入力信号を情報処理装置100に入力する。
The
出力部103は、情報処理装置100に接続された不図示の出力装置を介し、情報処理装置100のユーザに対してデータの出力を行う。出力部103は、障害検出処理の結果をユーザに知らせる。出力装置は、例えば画像や文字を画面に出力する装置を用いて構成されても良い。例えば、出力装置は、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイ、電子泳動方式ディスプレイ、CRT(Cathode Ray Tube)ディスプレイ等の画像表示装置を用いて構成できる。また、出力装置は、画像や文字をシートに印刷(印字)する装置を用いて構成されても良い。例えば、出力装置は、インクジェットプリンタやレーザープリンタ等を用いて構成できる。また、出力装置は、文字を音声に変換して出力する装置を用いて構成されても良い。この場合、出力装置は、音声合成装置及び音声出力装置(スピーカー)を用いて構成できる。出力装置は、LED(Light Emitting Diode)等の発光装置を用いて構成されてもよい。出力部103は、情報処理装置100に設けられた通信装置を介して他の情報処理装置に対し障害検出処理の結果を送信してもよい。なお、出力部103は、情報処理装置100と一体として構成された出力装置であってもよい。
The
RAS情報記憶部104は、磁気ハードディスク装置や半導体記憶装置等の記憶装置を用いて構成される。RAS情報記憶部104は、他の装置から受信したRAS情報を記憶する。図3は、実施形態のRAS情報記憶部104に記憶されたRAS情報の一具体例を示す図である。RAS情報は、日時、送信元、障害内容、機能内容及び処理内容の各値を有する。日時は、RAS情報の生成された日時を表す。日時は、RAS情報を生成した装置によって決定される。送信元は、RAS情報を生成した装置を表す。実施形態において、送信元が例えば監視制御装置200である場合、送信元はserver200で表される。障害内容は、RAS情報を生成した装置に発生した障害の内容を表す。障害内容は、OS又はアプリケーション等の装置が備えるソフトウェアによって表される。障害内容は、例えば、エラーを表す“Error”や警告を表す“Warning”等の特定の文言であってもよい。障害内容は、“XX装置への書き込みに失敗しました”等のユーザによって指定された文言であってもよい。障害内容は、障害に関するRAS情報ではない場合、空値であってもよい。機能内容は、RAS情報を生成した装置に関する機能を表す。機能内容は、OS又はアプリケーション等の装置が備えるソフトウェアに実装された機能である。機能内容は、例えばアラートを送信する“Send alert”や空調機を制御する“Air”等の機能であってもよい。機能内容は、“DMND”等のユーザによって指定された任意の機能であってもよい。処理内容は、機能によって行われた処理を表す。例えば、機能内容がSend alertで、処理内容がdevice300である場合について説明する。この場合、device300に対してアラートが送信されることを表す。RAS情報は、記録情報の一具体例である。記録情報は、所定の機器に対する監視制御を行う装置の動作に関する情報が記録された情報である。
The RAS
図3に示される例では、最上段のRAS情報は、日時の値が“Jun 18 07:02”、送信元の値が“server200”、障害内容の値が“Error”、機能内容が“Send alert”、処理内容が“device300”である。従って、最上段のRAS情報によると、日時“Jun 18 07:02”に生成されたRAS情報であることがわかる。また、RAS情報の送信元が“server200”(監視制御装置200)であることがわかる。また、障害内容は“Error”であるため、RAS情報は、エラーを表す。機能内容は、“Send alert”、処理内容は“device300”(端末装置300)である。このため、監視制御装置200は端末装置300にアラートを送信したRAS情報であることを表す。なお、図3に示されるRAS情報は一具体例に過ぎない。そのため、図3とは異なる態様でRAS情報が構成されてもよい。例えば、RAS情報は、年の値を有してもよい。
In the example shown in FIG. 3, the RAS information at the top has a date and time value of "
図2に戻って、情報処理装置100の説明を続ける。障害情報記憶部105は、磁気ハードディスク装置や半導体記憶装置等の記憶装置を用いて構成される。障害情報記憶部105は、障害情報を記憶する。障害情報は、監視制御システム1を構成する装置が有する機能に対して発生する可能性がある障害に関する情報である。障害情報は、障害内容と機能内容と処理内容とを有する。障害情報は、RAS情報に保持される値と同等の値を有する。障害情報記憶部105は、予め障害情報を記憶していてもよい。障害情報記憶部105は、外部から送信された障害情報を記憶してもよい。障害情報記憶部105は、障害の種類に応じて複数の障害情報を記憶する。障害情報記憶部105は、監視制御システム1の固有のルールで生成されるログを含むRAS情報を障害情報として記憶してもよい。この場合、情報処理装置100は、監視制御システム1の固有のルールについても障害の発生を解析できる。
Returning to FIG. 2, the description of the
制御部106は、情報処理装置100の各部の動作を制御する。制御部106は、CPU(Central Processing Unit)等のプロセッサ及びRAM(Random Access Memory)を用いて構成される。制御部106は、プロセッサが特定のプログラムを実行することによって、RAS情報取得部161、障害検出部162及び出力制御部163として機能する。
The
RAS情報取得部161は、監視制御システム1を構成する装置からRAS情報を取得する。具体的には、RAS情報取得部161は、RAS収集クライアント機能を実行することで、他の装置に対してRAS情報要求を送信する。他の装置とは、例えば監視制御装置200、端末装置300又は制御装置400等の監視制御システム1を構成する装置である。RAS情報取得部161は、RAS情報要求に基づいて他の装置から送信されたRAS情報応答を受信する。RAS情報応答には、RAS情報が含まれる。RAS情報取得部161は、監視制御システム1を構成する装置、OS又はソフトウェア等のRAS情報を収集する。RAS情報取得部161は、1日1回程度の頻度でRAS情報要求を送信する。なお、RAS情報取得部161は、予め定められた頻度であれば、1日1回以外の頻度でRAS情報要求を送信してもよい。
The RAS
障害検出部162は、監視制御システム1を構成する装置に障害が発生しているか否かを検出する。障害検出部162は、装置に障害が発生している場合、障害が発生している機能又は処理に影響を与えた原因を推定する。障害検出部162は、原因となりうる情報を出力する。以下、具体的に説明する。まず、障害検出部162は、RAS情報を解析する。障害検出部162は、解析にあたって、障害情報記憶部105から障害情報を取得する。障害検出部162は、解析対象となるRAS情報と取得された障害情報とに基づいて装置に障害が発生しているか否かを検出する。例えば、障害検出部162は、障害情報が有する障害内容をRAS情報が有する障害内容が含むか否かを判定する。障害情報が有する障害内容がRAS情報が有する障害内容を含む場合、障害検出部162は、装置に障害が発生していると判定する。障害情報が有する障害内容がRAS情報が有する障害内容を含まない場合、障害検出部162は、装置に障害が発生していないと判定する。障害検出部162は、RAS情報応答によって送信された全てのRAS情報に対して判定を行う。いずれのRAS情報に対しても、装置に障害が発生していないと判定された場合、障害検出部162は、送信されたRAS情報を破棄して処理を終了する。
The
いずれか1つ以上のRAS情報に対して、装置に障害が発生していると判定された場合、障害検出部162は、送信されたRAS情報をRAS情報記憶部104に記録する。次に、障害検出部162は、障害が発生した機能又は処理内容を特定する。例えば、障害検出部162は、障害内容に値を有するRAS情報に基づいて、障害が発生した機能又は処理内容を特定する。この場合、障害検出部162は、障害内容に値を有するRAS情報が有する機能内容及び処理内容を取得する。障害検出部162は、取得された機能内容及び処理内容に障害発生の原因があると特定する。障害検出部162は、取得された機能内容及び処理内容に基づいて解析対象となるRAS情報を取得する。具体的には、特定された機能内容及び処理内容を有するRAS情報をRAS情報記憶部104から取得する。また、障害検出部162は、障害内容に値を有するRAS情報の前後の時間に生成されたRAS情報が有する機能内容及び処理内容も取得してもよい。
If it is determined that a failure has occurred in the device for any one or more pieces of RAS information,
なお、障害検出部162は、取得された処理内容に他の装置の名前を有していたり、機能内容が装置間の連携や伝送に関する機能であれば、対象となる装置に関するRAS情報を解析対象として取得する。この場合、障害検出部162は、当該時間に生成されたRAS情報を取得する。
Note that if the acquired processing content includes the name of another device, or if the function content is a function related to inter-device cooperation or transmission, the
障害検出部162は、解析対象のRAS情報に基づいて、障害の原因を推定する。例えば、障害検出部162は、RAS情報が有する送信元の値を障害が発生した装置であると推定する。障害検出部162は、RAS情報が有する機能内容の値を障害が発生した機能であると推定する。障害検出部162は、RAS情報が有する処理内容の値を障害が発生した処理であると推定する。例えば、解析対象のRAS情報が、図3の最上段のRAS情報に基づいて説明する。この場合、障害検出部162は、監視制御装置200に障害が発生したと推定する。また、障害検出部162は、端末装置300に対するSend alert機能に障害が発生したと推定する。この障害は、監視制御装置200と端末装置300との間の処理に関する障害である。このため、監視制御装置200の代わりに端末装置300において障害が発生した場合もあり得る。したがって、障害検出部162は、端末装置300によって生成されたRAS情報に基づいて、同様に障害の原因を解析する。したがって、障害検出部162は、他の装置が原因で障害が発生している場合、他の装置によって生成されたRAS情報と解析対象のRAS情報とに基づいて、障害の原因を推定する。
The
出力制御部163は、障害検出部162によって推定された障害原因に関する情報を所定の方法で出力する。障害原因に関する情報は、例えば、障害が発生した装置の名称、障害が発生した機能の内容、障害が発生した処理の内容等のRAS情報に基づいて推定された情報である。所定の方法は、メールであってもよいし、画面への出力であってもよいし、紙への印刷であってもよいし、音声の出力であってもよいし、ランプの点灯であってもよい。所定の方法は、予め定められた方法であればどのような方法であってもよい。例えば、所定の方法がメールである場合について説明する。この場合、出力制御部163は、予め定められた送信先となる通信装置に対して、障害に関する情報を記述したメールを送信する。予め定められた送信先とは、例えばユーザであってもよいし、監視制御システム1の保守担当者であってもよい。
The
図4は、実施形態の監視制御装置200の機能構成を示す機能ブロック図である。監視制御装置200は、パーソナルコンピュータ又はサーバ等の情報処理装置を用いて構成される。監視制御装置200は、監視制御対象の装置を監視制御するための機能が実装されている。監視制御装置200は、自装置で生成されたRAS情報を情報処理装置100に送信するための機能が実装されている。監視制御装置200の各機能は、ハードウェアによって監視制御装置200に実装されてもよいし、ソフトウェアのインストールによって実装されてもよい。監視制御装置200は、通信部201、入力部202、出力部203、RAS情報記憶部204及び制御部205を備える。
FIG. 4 is a functional block diagram showing the functional configuration of the
通信部201は、ネットワークインタフェース等の通信装置である。通信部201は所定のプロトコルでネットワーク500に通信可能に接続する。通信部201は、制御部205の制御に応じてネットワーク500を介して、他の装置との間でデータ通信する。
A
入力部202は、キーボード、ポインティングデバイス(マウス、タブレット等)、ボタン、タッチパネル等の入力装置を用いて構成される。入力部202は、ユーザの指示を監視制御装置200に入力する際にユーザによって操作される。入力部202は、入力装置を監視制御装置200に接続するためのインタフェースであってもよい。この場合、入力部202は、入力装置においてユーザの入力に応じて生成された入力信号を監視制御装置200に入力する。
The
出力部203は、監視制御装置200に接続された不図示の出力装置を介し、監視制御装置200のユーザに対してデータの出力を行う。出力部203は、監視制御の結果を出力する。出力装置は、例えば画像や文字を画面に出力する装置を用いて構成されても良い。例えば、出力装置は、液晶ディスプレイ、有機ELディスプレイ、電子泳動方式ディスプレイ、CRTディスプレイ等の画像表示装置を用いて構成できる。また、出力装置は、画像や文字をシートに印刷(印字)する装置を用いて構成されても良い。例えば、出力装置は、インクジェットプリンタやレーザープリンタ等を用いて構成できる。また、出力装置は、文字を音声に変換して出力する装置を用いて構成されても良い。この場合、出力装置は、音声合成装置及び音声出力装置(スピーカー)を用いて構成できる。出力装置は、LED等の発光装置を用いて構成されてもよい。出力部203は、監視制御装置200に設けられた通信装置を介して他の情報処理装置に対し監視制御の結果を送信してもよい。なお、出力部203は、監視制御装置200と一体として構成された出力装置であってもよい。
The
RAS情報記憶部204は、磁気ハードディスク装置や半導体記憶装置等の記憶装置を用いて構成される。RAS情報記憶部204は、監視制御装置200によって生成されたRAS情報を記憶する。
The RAS
制御部205は、監視制御装置200の各部の動作を制御する。制御部205は、CPU等のプロセッサ及びRAMを用いて構成される。制御部205は、プロセッサが特定のプログラムを実行することによって、監視制御部251及びRAS情報応答部252として機能する。
A
監視制御部251は、監視制御対象の設備を監視制御する。監視制御部251は、監視制御した結果に基づいてRAS情報を生成する。例えば、監視制御部251は、監視制御対象の設備として空調機をオンした場合について説明する。監視制御部251は、空調機をオンした場合、オンした結果に基づいてRAS情報を生成する。例えば、監視制御部251は、監視制御装置200をRAS情報の送信元として決定する。監視制御部251は、障害内容を空値として決定する。監視制御部251は、空調機を表すAirを機能内容として決定する。監視制御部251は、ONを処理内容として決定する。監視制御部251は、決定された情報に基づいてRAS情報を生成する。監視制御部251は、RAS情報の生成された日時をRAS情報の日時として決定する。監視制御部251は、生成されたRAS情報をRAS情報記憶部204に記録する。なお、監視制御部251は、空調機をオンした場合に、所定の警告が空調機から通知されると、Warningを障害内容として有するRAS情報についても生成する。
The
RAS情報応答部252は、情報処理装置100に対してRAS情報を送信する。以下、具体的に説明する。まず、RAS情報応答部252は、情報処理装置100からRAS情報要求を受信すると、RAS情報記憶部204に記憶されたRAS情報を取得する。RAS情報応答部252は、取得されたRAS情報をRAS情報応答として情報処理装置100に送信する。
RAS
図5は、実施形態の端末装置300の機能構成を示す機能ブロック図である。端末装置300は、パーソナルコンピュータ又はサーバ等の情報処理装置を用いて構成される。端末装置300は、監視制御装置200に対する指示を送信したり、監視制御の結果を出力するための機能が実装されている。端末装置300は、自装置で生成されたRAS情報を情報処理装置100に送信するための機能が実装されている。端末装置300の各機能は、ハードウェアによって端末装置300に実装されてもよいし、ソフトウェアのインストールによって実装されてもよい。端末装置300は、通信部301、入力部302、出力部303、RAS情報記憶部304及び制御部305を備える。
FIG. 5 is a functional block diagram showing the functional configuration of the
通信部301は、ネットワークインタフェース等の通信装置である。通信部301は所定のプロトコルでネットワーク500に通信可能に接続する。通信部301は、制御部305の制御に応じてネットワーク500を介して、他の装置との間でデータ通信する。
A
入力部302は、キーボード、ポインティングデバイス(マウス、タブレット等)、ボタン、タッチパネル等の入力装置を用いて構成される。入力部302は、ユーザの指示を端末装置300に入力する際にユーザによって操作される。入力部302は、入力装置を端末装置300に接続するためのインタフェースであってもよい。この場合、入力部302は、入力装置においてユーザの入力に応じて生成された入力信号を端末装置300に入力する。
The
出力部303は、端末装置300に接続された不図示の出力装置を介し、端末装置300のユーザに対してデータの出力を行う。出力部303は、監視制御装置200から受信した監視制御の結果を出力する。出力装置は、例えば画像や文字を画面に出力する装置を用いて構成されても良い。例えば、出力装置は、液晶ディスプレイ、有機ELディスプレイ、電子泳動方式ディスプレイ、CRTディスプレイ等の画像表示装置を用いて構成できる。また、出力装置は、画像や文字をシートに印刷(印字)する装置を用いて構成されても良い。例えば、出力装置は、インクジェットプリンタやレーザープリンタ等を用いて構成できる。また、出力装置は、文字を音声に変換して出力する装置を用いて構成されても良い。この場合、出力装置は、音声合成装置及び音声出力装置(スピーカー)を用いて構成できる。出力装置は、LED等の発光装置を用いて構成されてもよい。出力部303は、端末装置300に設けられた通信装置を介して他の情報処理装置に対し監視制御の結果を送信してもよい。なお、出力部303は、端末装置300と一体として構成された出力装置であってもよい。
The
RAS情報記憶部304は、磁気ハードディスク装置や半導体記憶装置等の記憶装置を用いて構成される。RAS情報記憶部304は、端末装置300によって生成されたRAS情報を記憶する。
The RAS
制御部305は、端末装置300の各部の動作を制御する。制御部305は、CPU等のプロセッサ及びRAMを用いて構成される。制御部305は、プロセッサが特定のプログラムを実行することによって、通信制御部351及びRAS情報応答部352として機能する。
The
通信制御部351は、監視制御装置200等の他の装置に対して指示を送信する。通信制御部351は、他の装置からの指示の結果を出力する。通信制御部351は、指示の送信結果や、他の装置からの指示の結果に基づいてRAS情報を生成する。通信制御部351は、生成されたRAS情報をRAS情報記憶部304に記録する。
The
RAS情報応答部352は、情報処理装置100に対してRAS情報を送信する。以下、具体的に説明する。まず、RAS情報応答部352は、情報処理装置100からRAS情報要求を受信すると、RAS情報記憶部304に記憶されたRAS情報を取得する。RAS情報応答部352は、取得されたRAS情報をRAS情報応答として情報処理装置100に送信する。
RAS
図6は、実施形態の制御装置400の機能構成を示す機能ブロック図である。制御装置400は、PLC(Programmable Logic Controller)等の制御装置を用いて構成される。制御装置400は、監視制御対象となる機器(不図示)に対する指示を送信したり、監視制御対象となる機器の計測データを取得するための機能が実装されている。制御装置400は、自装置で生成されたRAS情報を情報処理装置100に送信するための機能が実装されている。制御装置400の各機能は、ハードウェアによって制御装置400に実装されてもよいし、ソフトウェアのインストールによって実装されてもよい。制御装置400は、通信部401、RAS情報記憶部402及び制御部403を備える。
FIG. 6 is a functional block diagram showing the functional configuration of the
通信部401は、ネットワークインタフェース等の通信装置である。通信部401は所定のプロトコルでネットワーク500に通信可能に接続する。通信部401は、制御部403の制御に応じてネットワーク500を介して、他の装置との間でデータ通信する。
A
RAS情報記憶部402は、磁気ハードディスク装置や半導体記憶装置等の記憶装置を用いて構成される。RAS情報記憶部402は、制御装置400によって生成されたRAS情報を記憶する。
The RAS
制御部403は、制御装置400の各部の動作を制御する。制御部403は、CPU等のプロセッサ及びRAMを用いて構成される。制御部403は、プロセッサが特定のプログラムを実行することによって、機器制御部431及びRAS情報応答部432として機能する。
The
機器制御部431は、監視制御対象となる機器(不図示)に対して指示を送信する。機器制御部431は、監視制御対象となる機器の計測データを取得する。機器制御部431は、指示の送信結果や、取得された計測データに基づいてRAS情報を生成する。機器制御部431は、生成されたRAS情報をRAS情報記憶部402に記録する。
The
RAS情報応答部432は、情報処理装置100に対してRAS情報を送信する。以下、具体的に説明する。まず、RAS情報応答部432は、情報処理装置100からRAS情報要求を受信すると、RAS情報記憶部402に記憶されたRAS情報を取得する。RAS情報応答部432は、取得されたRAS情報をRAS情報応答として情報処理装置100に送信する。
RAS
図7は、実施形態の障害検出処理の流れの一具体例を示すシーケンス図である。障害検出の処理は、所定のタイミングで行われてもよい。所定のタイミングは、例えば1日1回であってもよいし、予め定められたタイミングであってもよい。情報処理装置100のRAS情報取得部161は、監視制御システム1を構成する装置に対して、RAS情報要求を送信する(ステップS101)。例えば、RAS情報取得部161は、監視制御装置200、端末装置300及び制御装置400に対してRAS情報要求を送信する。
FIG. 7 is a sequence diagram showing a specific example of the flow of failure detection processing according to the embodiment. The failure detection process may be performed at a predetermined timing. The predetermined timing may be, for example, once a day or a predetermined timing. The RAS
監視制御装置200のRAS情報応答部252は、RAS情報要求を受信すると、RAS情報記憶部204に記憶されたRAS情報を取得する(ステップS102)。RAS情報応答部252は、取得されたRAS情報をRAS情報応答として情報処理装置100に送信する(ステップS103)。
Upon receiving the RAS information request, the RAS
端末装置300のRAS情報応答部352は、RAS情報要求を受信すると、RAS情報記憶部304に記憶されたRAS情報を取得する(ステップS104)。RAS情報応答部352は、取得されたRAS情報をRAS情報応答として情報処理装置100に送信する(ステップS105)。
Upon receiving the RAS information request, the RAS
制御装置400のRAS情報応答部432は、RAS情報要求を受信すると、RAS情報記憶部402に記憶されたRAS情報を取得する(ステップS106)。RAS情報応答部432は、取得されたRAS情報をRAS情報応答として情報処理装置100に送信する(ステップS107)。
Upon receiving the RAS information request, the RAS
情報処理装置100の障害検出部162は、RAS情報を解析する(ステップS108)。障害検出部162は、解析にあたって、障害情報記憶部105から障害情報を取得する。障害検出部162は、取得されたRAS情報と取得された障害情報とに基づいてRAS情報の送信元となる装置に障害が発生しているか否かを検出する(ステップS109)。障害検出部162は、取得された全てのRAS情報に対して障害が発生しているか否かの検出を行う。解析の結果、いずれの装置にも障害が発生していない場合(ステップS109:NO)、障害検出部162は、送信されたRAS情報を破棄して処理を終了する。解析の結果、いずれかの装置に障害が発生している場合(ステップS109:YES)、障害検出部162は、送信されたRAS情報をRAS情報記憶部104に記録する(ステップS110)。
The
障害検出部162は、障害が発生した機能又は処理内容を特定する(ステップS111)。例えば、障害検出部162は、障害が発生していると検出されたRAS情報に基づいて、障害が発生した機能又は処理内容を特定する。障害検出部162は、取得された機能内容及び処理内容に基づいて解析対象となるRAS情報を取得する(ステップS112)。具体的には、障害検出部162は特定された機能内容及び処理内容を有するRAS情報をRAS情報記憶部104から取得する。
The
障害検出部162は、解析対象のRAS情報に基づいて、障害の原因を推定する(ステップS113)。例えば、障害検出部162は、RAS情報が有する送信元の値を障害が発生した装置であると推定してもよい。障害検出部162は、RAS情報が有する機能内容の値を障害が発生した機能であると推定してもよい。障害検出部162は、RAS情報が有する処理内容の値を障害が発生した処理であると推定してもよい。
The
出力制御部163は、障害検出部162によって推定された障害原因に関する情報を所定の方法で出力する(ステップS114)。所定の方法は、インターネット等のネットワークを介して送信されるメールであってもよいし、画面への出力であってもよいし、紙への印刷であってもよいし、音声の出力であってもよいし、ランプの点灯であってもよい。所定の方法は、予め定められた方法であればどのような方法であってもよい。
The
このように構成された、監視制御システム1の障害検出部162は、取得されたログ等のRAS情報に基づいて、障害の発生を検出する。そして、監視制御システム1は、検出された障害に関するログ等のRAS情報に基づいて、障害の原因となる機能・処理内容を推定する。このように、監視制御システム1が、障害の原因となる機能・処理内容を推定することで、ユーザは技術的な知識がなくても、障害発生原因の絞り込み及び特定が可能となる。
The
監視制御システム1を構成する各装置においては、ハードディスク等の記憶装置の容量に制限がある。このため、監視制御システム1の情報処理装置100が全てのRAS情報を記憶した場合、記憶装置が障害原因の推定に関係がないRAS情報で満たされる場合がある。このような場合、情報処理装置100は、障害原因となるような操作内容や処理内容を示すRAS情報を記録できない。このため、情報処理装置100は、障害原因を特定できない場合があった。そこで、情報処理装置100の障害検出部162は、監視制御システム1において、障害となる恐れのあるログに関するRAS情報を検出した場合、又は障害のあるログに関するRAS情報を検出した場合、RAS情報の記録を行う。このため、監視制御システム1は、RAS情報を障害を検出してからリアルタイムで記録することが可能となる。このため、監視制御システム1は、障害が発生していない期間を含む長期間のRAS情報を記録しなくてもよくなる。監視制御システム1は、RAS情報記憶部104の記憶容量を障害の原因を推定するために用いられるRAS情報を記録することが可能になる。
Each device constituting the monitoring and control system 1 has a limited capacity of a storage device such as a hard disk. Therefore, when the
また、監視制御システム1の出力制御部163は、推定された障害原因に関する情報をクラウドコンピューティングシステムにアップロードしたり、監視制御システム1の保守担当者にメールを送信してもよい。このように構成されることで、ユーザは監視制御システム1の状態を監視制御システム1にアクセスすることなく確認できる。このため、ユーザは障害発生時にRAS情報を収集しなくても障害に対する対策を検討することが可能となる。このため、ユーザは監視制御システム1における障害発生から障害からの復旧までのリードタイムを短縮することができる。
In addition, the
<変形例>
障害検出部162は、実施形態の推定手段に加えて、機械学習によって生成された学習モデルに基づいて、障害原因を推定するように構成されてもよい。この場合、障害検出部162は所定の教師データに基づいて、機械学習を行うことで学習モデルを予め生成する。教師データは、例えばRAS情報と障害内容とが対応付けたデータである。機械学習は、例えばニューラルネットワークを用いたアルゴリズムであってもよいし、決定木アルゴリズムであってもよい。機械学習は、障害原因を推定可能な学習モデルを生成するアルゴリズムであればどのような学習方法であってもよい。
<Modification>
The
情報処理装置100は、RAS情報が不足している等の理由で障害原因を推定することができない場合がある。このような場合、ユーザは、監視制御システム1の保守担当者や、監視制御システム1の開発業者にて調査を依頼することが求められる。このような、保守担当者は開発業者による調査結果を情報処理装置100の障害検出部162に教師データとしてフィードバックすることで学習モデルの精度を高めることができる。したがって、障害検出部162は、より高い精度で障害原因を推定することが可能になる。
The
本実施形態では、情報処理装置100はそれぞれ1台の装置であるとして説明したが、複数の装置で構成されてもよい。情報処理装置100は、それぞれクラウドコンピューティングシステムによって構成されてもよい。
In the present embodiment, each
このように、情報処理装置100がクラウドコンピューティングシステムによって構成される場合、より多くのRAS情報等のデータを管理及び記憶できる。このため、障害検出部162は、障害発生時に過去のRAS情報を参照し、同様の障害が発生しているRAS情報を取得することで、障害発生時の対策内容を確認することが可能になる。このため、より早い時間で障害からの復旧が可能となる。
Thus, when the
また、監視制御装置200、端末装置300及び制御装置400はそれぞれ1台の装置であるとして説明したが、複数の装置で構成されてもよい。監視制御装置200、端末装置300及び制御装置400は、それぞれクラウドコンピューティングシステムによって構成されてもよい。
Also, although the
上記各実施形態では、RAS情報取得部161、障害検出部162、出力制御部163、監視制御部251、通信制御部351、機器制御部431及びRAS情報応答部252、352、432はソフトウェア機能部であるものとしたが、LSI等のハードウェア機能部であってもよい。
In each of the above embodiments, the RAS
以上説明した少なくともひとつの実施形態によれば、RAS情報取得部161、障害検出部162、出力制御部163を持つことにより、より簡単に障害原因を特定することができる。
According to at least one embodiment described above, having the RAS
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。 While several embodiments of the invention have been described, these embodiments have been presented by way of example and are not intended to limit the scope of the invention. These embodiments can be implemented in various other forms, and various omissions, replacements, and modifications can be made without departing from the scope of the invention. These embodiments and their modifications are included in the scope and spirit of the invention, as well as the scope of the invention described in the claims and equivalents thereof.
1…監視制御システム、100…情報処理装置、101…通信部、102…入力部、103…出力部、104…RAS情報記憶部、105…障害情報記憶部、106…制御部、161…RAS情報取得部、162…障害検出部、163…出力制御部、200…監視制御装置、201…通信部、202…入力部、203…出力部、204…RAS情報記憶部、205…制御部、251…監視制御部、252…RAS情報応答部、300…端末装置、301…通信部、302…入力部、303…出力部、304…RAS情報記憶部、305…制御部、351…通信制御部、352…RAS情報応答部、400…制御装置、401…通信部、402…RAS情報記憶部、403…制御部、431…機器制御部、432…RAS情報応答部、500…ネットワーク
DESCRIPTION OF SYMBOLS 1...
Claims (7)
前記装置に発生する可能性がある障害に関する障害情報と前記記録情報とに基づいて、前記装置に障害が発生しているか否かを検出し、前記障害が検出された場合、前記障害の障害原因を前記記録情報に基づいて推定する障害検出部と、
前記障害原因に関する情報を予め定められた所定の方法で出力する出力制御部と、
を備え、
前記障害検出部は、前記記録情報が他の装置に関する情報を含む場合、前記他の装置から取得された前記他の装置の動作に関する記録情報である他装置記録情報と前記記録情報とに基づいて前記障害原因を推定する、監視制御システム。 a recorded information acquisition unit that acquires from the device recorded information in which information about the operation of a device that monitors and controls a predetermined device is recorded;
Detecting whether or not a failure has occurred in the device based on failure information relating to failures that may occur in the device and the recorded information, and detecting the failure cause of the failure if the failure is detected based on the recorded information;
an output control unit that outputs information about the cause of the failure by a predetermined method;
with
When the recorded information includes information about another device, the fault detection unit performs the fault detection based on the other device recorded information, which is recorded information about the operation of the other device acquired from the other device, and the recorded information. A supervisory control system that estimates the cause of the failure .
前記障害検出部は、前記障害が検出された場合、前記記録情報を前記記録情報記憶部に記録し、前記障害が検出されなかった場合、前記記録情報を前記記録情報記憶部に記録しない、
請求項1に記載の監視制御システム。 further comprising a record information storage unit that stores the record information;
The failure detection unit records the record information in the record information storage unit when the failure is detected, and does not record the record information in the record information storage unit when the failure is not detected.
The supervisory control system according to claim 1 .
請求項1から3のいずれか一項に記載の監視制御システム。 The failure information includes failure details, functions of the device, and processing details of the functions. detect faults,
The supervisory control system according to any one of claims 1 to 3 .
前記装置に発生する可能性がある障害に関する障害情報と前記記録情報とに基づいて、前記装置に障害が発生しているか否かを検出し、前記障害が検出された場合、前記障害の障害原因を前記記録情報に基づいて推定する障害検出部と、
前記障害原因に関する情報を予め定められた所定の方法で出力する出力制御部と、
を備え、
前記障害検出部は、前記記録情報が他の装置に関する情報を含む場合、前記他の装置から取得された前記他の装置の動作に関する記録情報である他装置記録情報と前記記録情報とに基づいて前記障害原因を推定する、情報処理装置。 a recorded information acquisition unit that acquires from the device recorded information in which information about the operation of a device that monitors and controls a predetermined device is recorded;
Detecting whether or not a failure has occurred in the device based on failure information relating to a failure that may occur in the device and the recorded information, and detecting the failure cause of the failure if the failure is detected based on the recorded information;
an output control unit that outputs information about the cause of the failure by a predetermined method;
with
When the recorded information includes information about another device, the fault detection unit performs the fault detection based on the other device recorded information, which is the recorded information about the operation of the other device acquired from the other device, and the recorded information. An information processing device that estimates the cause of the failure .
情報処理装置が、前記装置に発生する可能性がある障害に関する障害情報と前記記録情報とに基づいて、前記装置に障害が発生しているか否かを検出し、前記障害が検出された場合、前記障害の障害原因を前記記録情報に基づいて推定する障害検出ステップと、
前記障害原因に関する情報を予め定められた所定の方法で出力する出力制御ステップと、
を有し、
前記情報処理装置は、前記障害検出ステップにおいて、前記記録情報が他の装置に関する情報を含む場合、前記他の装置から取得された前記他の装置の動作に関する記録情報である他装置記録情報と前記記録情報とに基づいて前記障害原因を推定する、情報処理方法。 a recorded information obtaining step in which the information processing device obtains from the device recorded information in which information relating to the operation of a device that performs monitoring and control over a predetermined device is recorded;
The information processing device detects whether or not a failure has occurred in the device based on failure information relating to a failure that may occur in the device and the recorded information, and if the failure is detected, a failure detection step of estimating a failure cause of the failure based on the recorded information;
an output control step of outputting information about the cause of the failure by a predetermined method;
has
In the failure detection step, when the recorded information includes information about another device, the information processing device includes other device recorded information, which is recorded information about the operation of the other device acquired from the other device, and the and an information processing method for estimating the cause of the failure based on recorded information .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019119480A JP7286439B2 (en) | 2019-06-27 | 2019-06-27 | Supervisory control system, information processing device, information processing method, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019119480A JP7286439B2 (en) | 2019-06-27 | 2019-06-27 | Supervisory control system, information processing device, information processing method, and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021005275A JP2021005275A (en) | 2021-01-14 |
JP7286439B2 true JP7286439B2 (en) | 2023-06-05 |
Family
ID=74097679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019119480A Active JP7286439B2 (en) | 2019-06-27 | 2019-06-27 | Supervisory control system, information processing device, information processing method, and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7286439B2 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007241540A (en) | 2006-03-07 | 2007-09-20 | Ricoh Co Ltd | Log information management system |
JP2011034507A (en) | 2009-08-05 | 2011-02-17 | Fujitsu Ltd | Behavior history collection device, and behavior history collecting method and program |
JP2012198796A (en) | 2011-03-22 | 2012-10-18 | Nec Corp | Log collection system, device, method and program |
JP2014225179A (en) | 2013-05-17 | 2014-12-04 | 日本電信電話株式会社 | Log acquisition device, log acquisition method, and log acquisition program |
JP2018110327A (en) | 2017-01-04 | 2018-07-12 | 富士ゼロックス株式会社 | Image-processing device and program |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190294523A1 (en) * | 2016-12-12 | 2019-09-26 | Nec Corporation | Anomaly identification system, method, and storage medium |
-
2019
- 2019-06-27 JP JP2019119480A patent/JP7286439B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007241540A (en) | 2006-03-07 | 2007-09-20 | Ricoh Co Ltd | Log information management system |
JP2011034507A (en) | 2009-08-05 | 2011-02-17 | Fujitsu Ltd | Behavior history collection device, and behavior history collecting method and program |
JP2012198796A (en) | 2011-03-22 | 2012-10-18 | Nec Corp | Log collection system, device, method and program |
JP2014225179A (en) | 2013-05-17 | 2014-12-04 | 日本電信電話株式会社 | Log acquisition device, log acquisition method, and log acquisition program |
JP2018110327A (en) | 2017-01-04 | 2018-07-12 | 富士ゼロックス株式会社 | Image-processing device and program |
Also Published As
Publication number | Publication date |
---|---|
JP2021005275A (en) | 2021-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220036264A1 (en) | Real-time adaptive operations performance management system | |
CN107291911B (en) | Anomaly detection method and device | |
US11706079B2 (en) | Fault recovery method and apparatus, and storage medium | |
US9652316B2 (en) | Preventing and servicing system errors with event pattern correlation | |
US10600002B2 (en) | Machine learning techniques for providing enriched root causes based on machine-generated data | |
US11789760B2 (en) | Alerting, diagnosing, and transmitting computer issues to a technical resource in response to an indication of occurrence by an end user | |
US10659312B2 (en) | Network anomaly detection | |
US20080086295A1 (en) | Monitoring simulating device, method, and program | |
US11677613B2 (en) | Root-cause analysis and automated remediation for Wi-Fi authentication failures | |
US20120136970A1 (en) | Computer system and method for managing computer device | |
US11669423B2 (en) | Systems and methods for monitoring application health in a distributed architecture | |
US11263072B2 (en) | Recovery of application from error | |
CN111209153A (en) | Abnormity detection processing method and device and electronic equipment | |
US20190354991A1 (en) | System and method for managing service requests | |
US20220308572A1 (en) | System and method for determining a health condition and an anomaly of an equipment using one or more sensors | |
EP3809343A1 (en) | Apparatus, method, and computer program product for field device maintenance request management | |
JP7286439B2 (en) | Supervisory control system, information processing device, information processing method, and computer program | |
WO2023200597A1 (en) | Automated positive train control event data extraction and analysis engine for performing root cause analysis of unstructured data | |
WO2023224764A1 (en) | Multi-modality root cause localization for cloud computing systems | |
US20220345356A1 (en) | Determining a root-cause of a network access failure and conducting remediation | |
US9372746B2 (en) | Methods for identifying silent failures in an application and devices thereof | |
CN113260984A (en) | Monitoring system, monitoring method, and monitoring program | |
US11861509B2 (en) | Automated positive train control event data extraction and analysis engine for performing root cause analysis of unstructured data | |
US20210367859A1 (en) | System and approach for remote room controller and device diagnostics and health monitoring | |
Karanth et al. | Workaround Prediction of Cloud Alarms using Machine Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7286439 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |