JP2015146152A - 監視制御装置 - Google Patents

監視制御装置 Download PDF

Info

Publication number
JP2015146152A
JP2015146152A JP2014019189A JP2014019189A JP2015146152A JP 2015146152 A JP2015146152 A JP 2015146152A JP 2014019189 A JP2014019189 A JP 2014019189A JP 2014019189 A JP2014019189 A JP 2014019189A JP 2015146152 A JP2015146152 A JP 2015146152A
Authority
JP
Japan
Prior art keywords
basic software
output
log information
log
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014019189A
Other languages
English (en)
Inventor
恵 入江
Megumi Irie
恵 入江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2014019189A priority Critical patent/JP2015146152A/ja
Publication of JP2015146152A publication Critical patent/JP2015146152A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】オペレーティングシステムなどの基本ソフトに関わる障害発生の検出を効率よく行う監視制御装置を得る。
【解決手段】オペレーティングシステムを含む基本ソフト11が出力するログ情報12を、基本ソフト出力ログデータベース作成機能13が、定周期でチェックし、新しいイベントのログ情報を基本ソフト出力ログデータベース14に蓄積して、基本ソフト出力ログデータベース入力インタフェース15から、それぞれのログ情報に対するシステム影響度とシステムエラー情報の出力の有無を入力し、一方、基本ソフトエラー検知機能16が、基本ソフト11の出力したログ情報12について、基本ソフト出力ログデータベース作成機能13を参照して、操作員へのシステムエラー情報の出力が必要なログ情報を抽出して、システムエラー発生/復旧情報ファイル17に格納するようにした。
【選択図】図1

Description

この発明は、基本ソフトの出力するログ情報から障害検出を行う監視制御装置に関するものである。
従来の監視制御システムにおいては、障害発生時には障害発生情報として予め記録することを定め、その記録された情報を基に障害解析を行うとともに、監視画面上に表示あるいは警報ランプ点灯等により障害が発生したことを通知する機能を有しているものが主流である。
そのような中で、特許文献1においては、障害発生時に記録したログ情報と、予め設定した障害発生部位と関連部位の関連付け情報とを用いて、障害発生箇所の特定を容易にする手段が記載されている。
また、特許文献2においても、障害発生情報の収集の要否や収集情報を予め定め、障害発生時にログ情報として書込み、その収集情報を元に障害解析を行う手段や監視端末に通知して表示する手段が記載されている。
特開2011−221703号公報(第4〜7頁、第1図) 特開平9−325903号公報(第4〜6頁、第1図)
従来の監視制御システムにおける「ログ情報による障害解析手段および障害発生通知手法」では、障害発生時に障害発生情報として予めログ情報を記録することを定め、また予め設定した情報を基にして障害発生箇所の特定を容易化し、障害箇所復旧の迅速化を図っていた。
しかしながら、オペレーティングシステム等の基本ソフトが出力する情報は膨大であるとともに、出力内容はシステム構成(接続機器・システムの使われ方)に依存する。
そのため、事前にオペレーティングシステム等の基本ソフトから出力される情報を抽出したり、その中から監視制御システムに影響を及ぼす障害を正確に定めることは非常に手間のかかる作業であり、障害発生時の解析・通知のために、予め「正確に」情報設定しておくこと自体が困難であった。
ここで「正確に」とは、設定に漏れているとオペレーティングシステム等の基本ソフトがログ情報として出力していても障害検出できないことになるし、逆に設定されすぎていると、監視制御システムの動作としては影響を及ぼさない事象であるにも関わらず、エラー通知してしまうことになる、これら2つの状態を発生させないというものである。
この発明は、上述のような課題を解決するためになされたものであり、オペレーティングシステムなどの基本ソフトに関わる障害発生の検出を効率よく行う監視制御装置を得ることを目的とする。
この発明に係わる監視制御装置においては、オペレーティングシステムを含む基本ソフトが出力したログ情報を定周期でチェックし、新しいイベントのログ情報をログデータベースに蓄積するログデータベース作成手段、ログデータベースに蓄積されたログ情報ごと
に、システムへの影響の有無を入力するための入力手段、及びログデータベースを参照して、基本ソフトが出力したログ情報から、システムへの影響有りのログ情報を抽出する基本ソフトエラー検知手段を備えたものである。
この発明によれば、オペレーティングシステムを含む基本ソフトが出力したログ情報を定周期でチェックし、新しいイベントのログ情報をログデータベースに蓄積するログデータベース作成手段、ログデータベースに蓄積されたログ情報ごとに、システムへの影響の有無を入力するための入力手段、及びログデータベースを参照して、基本ソフトが出力したログ情報から、システムへの影響有りのログ情報を抽出する基本ソフトエラー検知手段を備えたので、基本ソフトに関わる障害発生の検出を効率よく行うことができるとともに、検出のための事前作業を容易化することができる。
この発明の実施の形態1による監視制御サーバを示す構成図である。 この発明の実施の形態1による監視制御サーバの基本ソフト出力ログデータベースの構造を示す図である。 この発明の実施の形態1による監視制御サーバの基本ソフト出力ログデータベース作成機能の処理を示すフローチャートである。 この発明の実施の形態1による監視制御サーバの基本ソフトエラー検知機能の処理を示すフローチャートである。 この発明の実施の形態2による監視制御システムの監視端末画面による表示を示す構成図である。 この発明の実施の形態2による監視制御システムの警告灯による表示を示す構成図である。 この発明の実施の形態2による監視制御システムのメール通知を示す構成図である。 この発明の実施の形態3による監視制御システムの基本ソフト出力ログデータベース作成機能の処理を示すフローチャートである。 この発明の実施の形態4による監視制御サーバを示す構成図である。 この発明の実施の形態4による監視制御サーバの基本ソフト出力ログデータベースの構造を示す図である。 この発明の実施の形態5による監視制御システムを示す構成図である。
実施の形態1.
以下、この発明の実施の形態1を図に基づいて説明する。
図1は、この発明の実施の形態1による監視制御サーバを示す構成図である。
図1において、プラント設備の監視制御を行う監視制御システムを構成する監視制御サーバ1(監視制御装置)は、次のように構成されている。
基本ソフト11は、オペレーティングシステム等の基本ソフトである。ログ情報12は、オペレーティングシステム等の基本ソフトの動作状態の変化、エラー発生、復旧などのイベントの記録のために、基本ソフト11によって出力される情報であり、少なくともイベントIDを持っている。イベントIDは、発生事項の内容やその状態(発生、復旧の別)を判別することができるものである。
基本ソフト出力ログデータベース作成機能13(ログデータベース作成手段)は、基本ソフト11が出力するログ情報12を定周期で参照し、新規発生したイベントのログ情報を基本ソフト出力ログデータベース14(ログデータベース)に蓄積する。基本ソフト出力ログデータベース14は、基本ソフト出力ログデータベース作成機能13により作成・蓄積される。
基本ソフト出力ログデータベース入力インタフェース15(入力手段)は、基本ソフト出力ログデータベース14に対して、図2で後述するシステム影響度フラグ及びシステムエラー情報を設定するための入力インタフェースである。
基本ソフトエラー検知機能16(基本ソフトエラー検知手段)は、基本ソフト11が出力するログ情報12と基本ソフト出力ログデータベース14の両方を参照し、システムエラーの発生や復旧に関するシステムエラー発生/復旧情報ファイル17を作成する。システムエラー発生/復旧情報ファイル17には、図2で後述するシステムエラー情報で「出力あり」の設定がされているログ情報が格納されている。
図2は、この発明の実施の形態1による監視制御サーバの基本ソフト出力ログデータベースの構造を示す図である。
図2において、イベントID、システム影響フラグ、システムエラー情報の項目があり、基本ソフト出力ログデータベース作成機能13が、ログ情報を定周期でチェックし、新しいイベント発生のつど、イベントIDの項目を書込み、基本ソフト出力ログデータベース入力インタフェース15が、当該イベントについて、システム影響度フラグ及びシステムエラー情報を書込む。
ここで、システム影響度フラグは、システムへの影響の有無を示す。また、システムエラー情報は、システムエラーとして、操作員に対して出力するかどうか、及び出力する場合、発生情報とするか復旧情報とするか等の情報である。
次に、動作について説明する。
まず、基本ソフト出力ログデータベース作成機能13の処理について、図3を参照して説明する。
基本ソフト出力ログデータベース作成機能13は、定周期で基本ソフト11が出力したログ情報12を参照し(S11)、ログ情報12から1データを抽出し(S12)、基本ソフト出力ログデータベース14に一致するデータがあるかないか、すなわち過去に同じイベントIDがあるかないかを検索する(S13)。
一致するデータがなければ(S14)、基本ソフト出力ログデータベース14に対して項目追加して、基本ソフト11が出力した当該データのイベントIDを蓄積する(S15)。
一致するデータがあれば(S14)、ログ情報12の全データをチェック済みかどうかを確認し(S16)、全データをチェック済みであれば、終了し、チェック済みでなければ、S12に進む。
このように、基本ソフト出力ログデータベース作成機能13は、オペレーティングシステム等の基本ソフト11が出力するログ情報12を自動的に定期チェックし、基本ソフト出力ログデータベース14にないログ情報を自動的に抽出・蓄積する。
これにより、基本ソフト11によって出力されたログ情報の事前抽出作業を容易化することができる。
基本ソフト出力ログデータベース作成機能13が作成した基本ソフト出力ログデータベース14の新しい追加データに対して、基本ソフト出力ログデータベース入力インタフェース15を通じて、システムへの影響度(有無)、及びシステムエラー情報の入力を行う。
これにより、基本ソフト出力ログデータベース14を、システム動作に影響を及ぼすログ情報12のみを検知するためのデータベースとすることができる。
したがって、実際に発生したイベントを格納した基本ソフト出力ログデータベース14を作成するため、システム構成(接続機器・システムの使われ方)に応じて、予め「正確に」情報設定することが可能になる。
次に、基本ソフトエラー検知機能16の動作について、図4を用いて説明する。
定周期で、基本ソフト11が出力したログ情報12を参照し(S21)、ログ情報12から1データを抽出し(S22)、基本ソフト出力ログデータベース14で該当するイベントIDを検索して、そのイベントに対応するシステムエラー情報をチェックする(S23)。
システムエラー情報にて「出力あり」の設定がされている場合には(S24)、システムエラー発生/復旧情報ファイル17に書き込みを行う(S25)。
このシステムエラー発生/復旧情報ファイル17を参照することで、システム動作に影響を及ぼすログ情報のみが把握可能となる。
ログ情報12の全データについて、S22〜S25の処理を行う(S26)。
実施の形態1によれば、基本ソフトによって出力されるログ情報の事前抽出作業を容易化することができる。
また、システム構成(接続機器・システムの使われ方)に応じて、予め「正確に」情報設定することが可能になる。
また、システムエラー発生/復旧情報ファイルを参照することで、システム動作に影響を及ぼすログ情報のみが把握可能となる。
実施の形態2.
図5は、この発明の実施の形態2による監視制御システムの監視端末画面による表示を示す構成図である。
図5において、1、11〜17は図1におけるものと同一のものである。図5では、監視制御サーバ1に監視端末通信機能18(通知手段)を設け、監視端末2に通知して、基本ソフト11に関わる障害発生及び復旧状態を障害発生/復旧表示画面21に表示させる。
図6は、この発明の実施の形態2による監視制御システムの警告灯による表示を示す構成図である。
図6において、1、11〜17は図1におけるものと同一のものである。図6では、監視制御サーバ1に接点出力機能19(通知手段)を設け、警告灯3を点灯または消灯させる。
図7は、この発明の実施の形態2による監視制御システムのメール通知を示す構成図である。
図7において、1、11〜17は図1におけるものと同一のものである。図7では、監視制御サーバ1にメール作成・通知機能20(通知手段)を設け、メールサーバ4に対してメール送信を行う。
実施の形態1では、オペレーティングシステム等の基本ソフト11が出力したログ情報12のうちシステム動作に影響を及ぼすログ情報(システムエラー情報にて「出力あり」の設定がされているログ情報)の出力のみを検知するものを示したが、実施の形態2は、システム動作に影響を及ぼすログ情報の出力を検知した場合に、操作員に対してタイムリーに障害発生/復旧を知らせるようにした。
システム動作に影響を及ぼすログ情報の出力を検知した場合に、図5に示す監視端末2の操作画面に、障害発生/復旧表示画面21を表示することで、操作員に対してタイムリーに障害発生/復旧を知らせることが可能である。
同様に、システム動作に影響を及ぼすログ情報出力を検知した場合に、図6に示すように、接点出力オン/オフすることで、警告灯3の点灯/消灯を行い、警告灯3により操作員に対し、障害発生/復旧を知らせるようにすることもできる。
また同様に、システム動作に影響を及ぼすログ情報出力を検知した場合に、図7に示すように、メールを作成してメールサーバ4にメール送信することで、システム操作員以外のシステム管理者やシステムメンテナンス者に対し、障害発生/復旧を知らせることも可能である。
実施の形態2によれば、システム動作に影響を及ぼすログ情報の出力を検知した場合に、操作員に対してタイムリーに障害発生/復旧を知らせることができる。
実施の形態3.
実施の形態1では、基本ソフト出力ログデータベース作成機能13の基本的な動作を示したが、実施の形態3は、定周期でログ情報12を参照する際に、チェック済みフラグ(チェック完了フラグ)を設定するようにして、そのタイミングでどこまでチェック完了しているかを記録しておくようにした。
次に、図8を用いて、実施の形態3の基本ソフト出力ログデータベース作成機能13の処理について説明する。
図8において、S11、S13〜S16は図3におけるものと同一の処理である。図8では、S11とS13の間にS311、S312を挿入している。
基本ソフト出力ログデータベース作成機能13が、定周期でログ情報12を参照する際に、チェック済みフラグを設定するようにして、そのタイミングでどこまでチェック完了しているかを記録しておく。次回、定周期でのログ情報参照時に前回チェック以降、新規に出力されたログのみを対象に、基本ソフト出力ログデータベース14に一致するデータがあるかないかを検索できるようになる。
この検索で、一致するデータがなければ、基本ソフト出力ログデータベースに対して項目追加する動作を行うことができる。
図8で、定周期で、ログ情報の1データの抽出に当って、ログ情報のうちチェック済みフラグ最終点(S311)、の次の1データを抽出する。このとき抽出したデータにチャック済みフラグを設定する(S312)。
実施の形態3によれば、これにより、基本ソフトによって出力されるログ情報の自動的な抽出・蓄積を短時間に行うことが可能になる。
実施の形態4.
図9は、この発明の実施の形態4による監視制御サーバを示す構成図である。
図9において、1、13〜17は図1におけるものと同一のものである。図9では、図1の基本ソフト11ごとにログ情報12を出力するようにした。すなわち、基本ソフト1(111)、基本ソフト2(112)、基本ソフト3(113)が、それぞれログ情報121、122、123を出力する。
なお、基本ソフト1(111)は、例えばオペレーティングシステムであり、基本ソフト2(112)、3(113)は、例えばデバイスドライバソフトである。
図10は、この発明の実施の形態4による監視制御サーバの基本ソフト出力ログデータベースの構造を示す図である。
図10において、イベントID、システム影響度フラグ、システムエラー情報は図2におけるものと同じである。図10では、基本ソフトの別を示す基本ソフトNoの項目があり、基本ソフト出力ログデータベース作成機能13によって書込まれる。
実施の形態1では、基本的な動作として、オペレーティングシステム等の基本ソフト1つを対象とした動作を示したが、実施の形態4は、複数の基本ソフトを対象として、各基本ソフトが出力するログ情報を自動的に定期チェックし、必要なログ情報を自動的に抽出して、基本ソフト出力ログデータベースとして、一元管理するようにした。
すなわち、基本ソフト1(111)、基本ソフト2(112)、基本ソフト3(113)が、それぞれログ情報121、122、123を出力する。基本ソフト出力ログデータベース作成機能13と、基本ソフトエラー検知機能16は、ログ情報121、122、123を各別に、実施の形態1と同様にして自動的に定期チェックする。
実施の形態4によれば、これにより、オペレーティングシステムやデバイスドライバソフト等の基本ソフト別に障害発生を検出し、障害発生検出率の向上を図ることができる。
実施の形態5.
図11は、この発明の実施の形態5による監視制御システムを示す構成図である。
図11において、1、2、11〜18は図5におけるものと同一のものである。図11では、基本ソフト出力ログデータベース14へのログ情報の追加を、監視端末2に、基本ソフト出力ログデータベース新規項目追加表示画面23により通知する。監視端末2にデータベース入力画面22を表示して、追加されたログ情報に対するシステムへの影響度やシステムエラー情報の入力を行うようにした。
実施の形態1では、基本的な動作として、監視制御サーバ1上で基本ソフト出力ログデータベース14に対して、システムへの影響度及びシステムエラー情報の入力を行うこととしたが、実施の形態5は、基本ソフト出力ログデータベース14に対し、項目追加してオペレーティングシステム等の基本ソフト11が出力するログ情報を蓄積した場合に、監視端末2等のリモート端末に通知して、基本ソフト出力ログデータベース新規項目追加表示画面23を表示させて操作員に通知するとともに、監視端末2にデータベース入力画面22を表示して、操作員にシステムへの影響度及びシステムエラー情報の入力を行わせるようにした。
これにより、基本ソフト出力ログデータベース14に対して、監視端末2上でシステムへの影響度及びシステムエラー情報の入力を行えるようになり、監視制御システムを運用しながら、タイムリーに基本ソフト出力ログデータベース14を整備することが可能になる。
実施の形態5によれば、オペレーティングシステム等の基本ソフトに関わる障害発生検出率の向上を、監視制御システムを運用しながらタイムリーに図ることができる。
なお、本発明は、その発明の範囲内において、各実施の形態を自由に組み合わせたり、各実施の形態を適宜、変形、省略することが可能である。
1 監視制御サーバ、2 監視端末、3 警告灯、4 メールサーバ、
11 基本ソフト、12 ログ情報、13 基本ソフト出力ログデータベース作成機能、14 基本ソフト出力ログデータベース、
15 基本ソフト出力ログデータベース入力インタフェース、
16 基本ソフトエラー検知機能、17 システムエラー発生/復旧情報ファイル、
18 監視端末通信機能、19 接点出力機能、20 メール作成・通知機能、
21 障害発生/復旧表示画面、22 データベース入力画面、
23 基本ソフト出力ログデータベース新規項目追加表示画面。

Claims (7)

  1. オペレーティングシステムを含む基本ソフトが出力したログ情報を定周期でチェックし、新しいイベントのログ情報をログデータベースに蓄積するログデータベース作成手段、
    上記ログデータベースに蓄積されたログ情報ごとに、システムへの影響の有無を入力するための入力手段、
    及び上記ログデータベースを参照して、上記基本ソフトが出力したログ情報から、上記システムへの影響有りのログ情報を抽出する基本ソフトエラー検知手段を備えたことを特徴とする監視制御装置。
  2. 上記基本ソフトエラー検知手段により、上記システムへの影響有りのログ情報が抽出された場合に、障害発生を監視端末に通知する通知手段を備えたことを特徴とする請求項1記載の監視制御装置。
  3. 上記基本ソフトエラー検知手段により、上記システムへの影響有りのログ情報が抽出された場合に、警告灯により障害発生を通知する通知手段を備えたことを特徴とする請求項1記載の監視制御装置。
  4. 上記基本ソフトエラー検知手段により、上記システムへの影響有りのログ情報が抽出された場合に、障害発生をメールサーバに通知する通知手段を備えたことを特徴とする請求項1記載の監視制御装置。
  5. 上記ログデータベース作成手段は、上記ログ情報の定周期での蓄積に当たって、上記ログ情報のチェック済みのデータにチェック完了フラグを設定することを特徴とする請求項1から請求項4のいずれか一項記載の監視制御装置。
  6. 上記基本ソフトが出力するログ情報は、複数の基本ソフトが各別に出力するものであることを特徴とする請求項1から請求項5のいずれか一項記載の監視制御装置。
  7. 上記入力手段は、上記監視制御装置に接続された監視端末に設けられていることを特徴とする請求項1から請求項6のいずれか一項記載の監視制御装置。


JP2014019189A 2014-02-04 2014-02-04 監視制御装置 Pending JP2015146152A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014019189A JP2015146152A (ja) 2014-02-04 2014-02-04 監視制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014019189A JP2015146152A (ja) 2014-02-04 2014-02-04 監視制御装置

Publications (1)

Publication Number Publication Date
JP2015146152A true JP2015146152A (ja) 2015-08-13

Family

ID=53890345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014019189A Pending JP2015146152A (ja) 2014-02-04 2014-02-04 監視制御装置

Country Status (1)

Country Link
JP (1) JP2015146152A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016188175A1 (zh) * 2015-10-14 2016-12-01 中兴通讯股份有限公司 一种硬件故障分析系统和方法
JP2018169920A (ja) * 2017-03-30 2018-11-01 富士通株式会社 管理装置、管理方法及び管理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016188175A1 (zh) * 2015-10-14 2016-12-01 中兴通讯股份有限公司 一种硬件故障分析系统和方法
JP2018169920A (ja) * 2017-03-30 2018-11-01 富士通株式会社 管理装置、管理方法及び管理プログラム

Similar Documents

Publication Publication Date Title
JP6458858B2 (ja) 監視制御装置
JP2014067369A (ja) 情報処理装置,プログラム,情報処理方法
US10248517B2 (en) Computer-implemented method, information processing device, and recording medium
CN102231161A (zh) 数据库同步验证及监控方法
JP2010049532A (ja) 運転監視支援装置
JP2019049802A (ja) 障害解析支援装置、インシデント管理システム、障害解析支援方法及びプログラム
JPWO2018066661A1 (ja) ログ分析方法、システムおよび記録媒体
JP2018190029A (ja) 施設監視装置
CN105300447A (zh) 一种用于监控设备运行状态的系统及方法
JP6528381B2 (ja) ログ管理装置,ログ管理プログラム,及びログ管理方法
JP2015146152A (ja) 監視制御装置
JP2014115768A (ja) ログ判定システム、ログ判定基準構築装置及びログ判定方法
CN106533812B (zh) 一种应用服务器
JP6515048B2 (ja) インシデント管理システム
CN117009180A (zh) 日志、异常警报信息处理方法及装置
JP6438875B2 (ja) ネットワーク監視装置およびネットワーク監視方法
JP2013257708A (ja) 障害対策システム、および、障害対策方法
JP6405851B2 (ja) 予兆検知支援プログラム、方法、装置、及び予兆検知プログラム、
JP6216621B2 (ja) プラント監視制御システム
JP6504611B2 (ja) 監視装置、情報監視システム、監視装置の制御方法、及びプログラム
JP2008198123A (ja) 障害検知システム及び障害検知プログラム
US20150154498A1 (en) Methods for identifying silent failures in an application and devices thereof
JP2017069912A (ja) ネットワーク監視装置およびネットワーク監視方法
JP2017076165A (ja) 機器監視装置およびアラート情報管理方法
JP2011150586A (ja) 障害履歴の管理システム