JP2019159474A - メッセージ監視サーバ、方法、プログラム - Google Patents

メッセージ監視サーバ、方法、プログラム Download PDF

Info

Publication number
JP2019159474A
JP2019159474A JP2018041906A JP2018041906A JP2019159474A JP 2019159474 A JP2019159474 A JP 2019159474A JP 2018041906 A JP2018041906 A JP 2018041906A JP 2018041906 A JP2018041906 A JP 2018041906A JP 2019159474 A JP2019159474 A JP 2019159474A
Authority
JP
Japan
Prior art keywords
message
server
determination process
match
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018041906A
Other languages
English (en)
Other versions
JP6835763B2 (ja
Inventor
洋一 岩倉
Yoichi Iwakura
洋一 岩倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2018041906A priority Critical patent/JP6835763B2/ja
Publication of JP2019159474A publication Critical patent/JP2019159474A/ja
Application granted granted Critical
Publication of JP6835763B2 publication Critical patent/JP6835763B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】データセンター側からのメッセージ内容を自動で精査することで、管理ユーザの負担を軽減することができる技術を提供する。【解決手段】保守運用センター20において、メッセージ監視サーバ10は、サーバ40の異常の有無を監視するメッセージ監視サーバであって、サーバ40から出力されたサーバ40の装置等の異常に関する第1メッセージを格納する出力メッセージ格納部11と、サーバ40から出力されることが想定されるサーバ40の設定変更に伴う第2メッセージを格納する想定メッセージ格納部12と、過去にサーバ40から出力されたサーバ40の設定変更に伴う第3メッセージを格納するナレッジ13と、第1、第2及び第3メッセージを比較して判定する判定部14と、判定部14による判定に基づき、管理ユーザに調査依頼の実施を促す表示制御部15と、を備える。【選択図】図2

Description

データセンター内のサーバを監視する技術に関する。
銀行のATMを運用するシステムは、データセンターに設置された制御用のサーバが、各拠点におけるATMの取引処理の制御や、ホストサーバとの通信を実施する集中型のシステムを採用している。そのため、データセンターにおいて異常が発生した際には迅速に調査、復旧を行う必要がある。
従来、そのような異常の発生に対応する為に、データセンターのサーバを監視する監視装置が用いられている。データセンターのサーバにおいて異常が発生した際には、サーバから異常を示すメッセージが出力される。監視装置を扱うオペレータはそのメッセージの内容を読みとり、待機中のエンジニアへサーバの調査依頼を送ることで、エンジニアによってサーバの状況が調査され、復旧される。
特許文献1では、操作ログファイルを取得して、機器上での変更された監視項目の有無を判定し、システム管理者に対して設定変更を報知する処理が記載されている。
特開2013−080387号公報
一方で、データセンターのサーバがメッセージを出力するような状況としては、メンテナンス時においてサーバに設定変更が発生した場合も該当する。このような設定変更は、予め実施することが予定された設定変更であり、装置等の異常ではないため、オペレータがエンジニアに対して調査依頼を出す必要はない。
なお、メンテナンス時のサーバの設定変更にはアプリケーションの更新等も含まれる。
しかし、日々行われる監視業務では、オペレータが、メッセージの内容を確認してサーバに異常が生じたか予定された設定変更が行われたかを判別することは難しい。そのため、従来では予定された設定変更であっても、オペレータは異常が生じた可能性があるとしてエンジニアへ調査依頼を送っている。即ち、管理ユーザ(オペレータ、エンジニア)の作業量が必要以上に多くなり、負担が増加してしまっているという問題があった。
以上の実情を考慮し、本発明では、データセンター側からのメッセージ内容を自動で精査することで、管理ユーザの負担を軽減することができる技術を提供することを目的とする。
本発明の一態様におけるメッセージ監視サーバは、サーバの異常の有無を監視するメッセージ監視サーバであって、前記サーバから出力された第1メッセージを格納する出力メッセージ格納部と、前記サーバから出力されることが想定される第2メッセージを格納する想定メッセージ格納部と、過去に前記サーバから出力された第3メッセージを格納するナレッジと、前記第1、第2及び第3メッセージを比較して判定する判定部と、前記判定部による判定に基づき、管理ユーザに調査依頼または確認依頼の実施を促す報知手段と、を備え、前記判定部は、前記第1メッセージと前記第2メッセージとが一致するかどうかの第1判定処理を実行し、前記第1メッセージと前記第3メッセージとが一致するかどうかの第2判定処理を実行し、前記第2メッセージと前記第3メッセージとが一致するかどうかの第3判定処理を実行し、前記報知手段は、前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致する場合には、前記管理ユーザに調査依頼の実施を促さず、前記第1メッセージと前記第2メッセージとが一致しない場合には、前記第2及び第3判定処理の結果に基づき、前記管理ユーザに前記調査依頼または前記確認依頼の実施を促し、前記ナレッジは、前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致し、かつ前記第2判定処理の結果として、前記第1メッセージと前記第3メッセージとが一致せず、かつ前記第3判定処理の結果として、前記第2メッセージと前記第3メッセージとが一致しない場合に、前記第1メッセージを前記第3メッセージとして格納する。
本発明の一態様におけるメッセージ監視方法は、サーバから出力された第1メッセージを格納し、前記サーバから出力されることが想定される第2メッセージを格納し、過去に前記サーバから出力された第3メッセージを格納し、前記第1メッセージと前記第2メッセージとが一致するかどうかの第1判定処理を実行し、前記第1メッセージと前記第3メッセージとが一致するかどうかの第2判定処理を実行し、前記第2メッセージと前記第3メッセージとが一致するかどうかの第3判定処理を実行し、前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致する場合には、管理ユーザに調査依頼の実施を促さず、前記第1メッセージと前記第2メッセージとが一致しない場合には、前記第2判定処理及び第3判定処理の結果に基づき、管理ユーザに前記調査依頼または確認依頼の実施を促し、前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致し、かつ前記第2判定処理の結果として、前記第1メッセージと前記第3メッセージとが一致せず、かつ前記第3判定処理の結果として、前記第2メッセージと前記第3メッセージとが一致しない場合に、前記第1メッセージを前記第3メッセージとして格納する。
本発明の一態様におけるプログラムは、サーバから出力された第1メッセージを格納し、前記サーバから出力されることが想定される第2メッセージを格納し、過去に前記サーバから出力された第3メッセージを格納し、前記第1メッセージと前記第2メッセージとが一致するかどうかの第1判定処理を実行し、前記第1メッセージと前記第3メッセージとが一致するかどうかの第2判定処理を実行し、前記第2メッセージと前記第3メッセージとが一致するかどうかの第3判定処理を実行し、前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致する場合には、管理ユーザに調査依頼の実施を促さず、前記第1メッセージと前記第2メッセージとが一致しない場合には、前記第2判定処理及び第3判定処理の結果に基づき、管理ユーザに前記調査依頼または確認依頼の実施を促し、前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致し、かつ前記第2判定処理の結果として、前記第1メッセージと前記第3メッセージとが一致せず、かつ前記第3判定処理の結果として、前記第2メッセージと前記第3メッセージとが一致しない場合に、前記第1メッセージを前記第3メッセージとして格納する。
本発明によれば、データセンター側からのメッセージ内容を自動で精査することで、管理ユーザの負担を軽減することができる。
管理システムの概略を示す図である。 メッセージ監視サーバの機能構成を示す図である。 出力メッセージ格納部、想定メッセージ格納部、ナレッジがそれぞれ第1〜3メッセージを管理テーブル上に格納する場合の一例を示す図である。 判定部による判定処理の結果を管理するためのテーブルを示す図である。 メッセージ監視サーバのハードウェア構成図である。 メッセージの登録処理を示すフローチャートである。 サーバを監視する一連の制御を示すフローチャートである。 メッセージ確認処理を示すフローチャートである。 調査依頼内容を決定する処理を示すフローチャートである。 調査依頼内容を決定する処理を示すフローチャートである。 コンソールを介したオペレータへの指示処理を示すフローチャートである。 テーブル比較処理における共通のフローチャートである。 復帰値<1>既知の対応が設定される一例となる各テーブルを示す図である。 復帰値<2>記載ミス可能性有が設定される一例となる各テーブルを示す図である。 復帰値<3>記載ミス指摘が設定される一例となる各テーブルを示す図である。 復帰値<4>新規の対応が設定される一例となる各テーブルを示す図である。 復帰値<5>要調査が設定される一例となる各テーブルを示す図である。 復帰値<6>エラーが設定される一例となる各テーブルを示す図である。 復帰値<7>エラーが設定される一例となる各テーブルを示す図である。 復帰値<8>エラーが設定される一例となる各テーブルを示す図である。
以下、本発明の一実施の形態における管理システム100について説明する。図1は、管理システム100の概略を示す図である。管理システム100は、オペレータが常駐し、メッセージ監視サーバ10及びコンソール17が設置された保守運用センター20と、複数のサーバ40が設置されたデータセンター50と、エンジニア(SE、CEを含む)が使用する通信端末であって、オペレータが操作するコンソール17との間で通信を行う通信端末30と、を含む。以降オペレータ等の管理システム100を利用する立場のユーザを管理ユーザとも表記する。
管理システム100では、データセンター50のサーバ40が各拠点におけるATM60の取引処理の制御や、ホストサーバ70との通信を実施する。即ち、管理システム100は、サーバ40を主体とした銀行のATMの運用に関する集中型の管理システム等である。
保守運用センター20は、データセンター50に設置されたサーバ40における装置等の異常を監視する場所である。サーバ40における装置等の異常には、サーバ40内のアプリケーションの更新やミドルウェアの変更等のメンテナンス時等において予め実施することが予定された設定変更に伴う異常も含まれる。
本発明の一実施形態における管理システム100では、メッセージ監視サーバ10が、サーバ40における装置等の異常を監視するとともに、サーバ40からの出力されるメッセージを自動で精査する。
以下、図1、2を用いて、メッセージ監視サーバ10の機能を説明する。図2は、メッセージ監視サーバ10の機能構成を示す図である。
メッセージ監視サーバ10は、出力メッセージ格納部11、想定メッセージ格納部12、ナレッジ13、判定部14、表示制御部15、通信部16を含む(図2を参照)。
出力メッセージ格納部11は、サーバ40において装置等の異常があった場合に、サーバ40から通信部16を介して受信したメッセージ(第1メッセージとする)を格納する。
想定メッセージ格納部12は、サーバ40から出力されることが想定される設定変更に伴うメッセージ(第2メッセージとする)を格納する。想定される設定変更に伴うメッセージとは、メンテナンス時等において予め実施されることが判っているが、その設定変更を行うことにより装置等の異常として認識されてしまう設定変更に伴うメッセージである。例えば、エンジニア等のシステム担当者は、事前に想定メッセージ格納部12へ第2メッセージとなり得るメッセージを格納しておく。
ナレッジ13は、過去にサーバ40から出力されたことのある設定変更に関するメッセージ(第3メッセージとする)を格納する。
判定部14は、出力メッセージ格納部11、想定メッセージ格納部12、ナレッジ13にそれぞれ格納された第1メッセージ、第2メッセージ、第3メッセージを比較し、合致するものがあるかどうかの判定処理を実行する。具体的には、判定部14は、第1メッセージと第2メッセージとが一致するかどうかの第1判定処理を実行する。また、判定部14は、第1メッセージと第3メッセージとが一致するかどうかの第2判定処理を実行する。また、判定部14は、第2メッセージと第3メッセージとが一致するかどうかの第3判定処理を実行する。判定部14が実行する上記の判定処理は、新たに第1メッセージが受信されて出力メッセージ格納部11に格納された際に行われる。
また、想定メッセージ格納部12において第2メッセージを格納する際、サーバ40から第2メッセージが出力されることが想定される規定の条件を、格納した第2メッセージ毎に設定する。このようにすることで、複数の異なる条件においてサーバ40から受信し得るメッセージを一括して格納しておいた場合でも、現在規定の条件となったメッセージのみを第2メッセージとして、判定部14の判定処理の対象とすることができる。規定の条件とは、例えば日時であり、一例ではメッセージ監視サーバ10内では、対象となる日時において、判定部14が判定処理に用いることを可能とするようなフラグが設定される。
表示制御部15は、判定部14による第1〜第3判定処理の結果に基づき、管理ユーザであるオペレータへの指示をコンソール17上へ表示する制御を実行する。具体的には、表示制御部15は、サーバ40における装置等の異常を受けて、エンジニアにサーバ40の調査依頼を出す必要がある場合に、コンソール17に表示させる表示画面を通してオペレータへ調査依頼の実施を促す。即ち、表示制御部15は、報知手段として機能する。調査依頼の実施が必要な状況とは、メンテナンス時等における予定された設定変更に伴う装置等の異常がサーバ40に発生したのではなく、エラー等による予期しない装置等の異常がサーバ40に発生した可能性がある場合である。
詳しくは、判定部14による第1の判定処理の結果として、出力メッセージ格納部11内のメッセージと想定メッセージ格納部12内のメッセージが一致しない場合には、想定されないメッセージがサーバ40から出力されたとし、表示制御部15が調査依頼または確認依頼の実施を促す画面を表示する。確認依頼については詳しくは後述するが、エンジニア等のシステム担当者が事前に格納した第2メッセージに誤りがある可能性が大きい場合に、システム担当者に第2メッセージに誤りがあるかどうかの確認を依頼するものである。逆に、判定部14による第1の判定処理の結果として、出力メッセージ格納部11と想定メッセージ格納部12内でメッセージが一致した場合には、想定されたメッセージがサーバ40から出力されたとし、調査依頼または確認依頼の実施を促さない。(調査依頼および確認依頼は不要の画面を表示してもよい)
通信部16は、サーバ40において設定変更が生じた場合に出力される第1メッセージを受信する。
コンソール17は、オペレータが操作する制御盤であって、画像出力を行うモニター(不図示)、キーボード等の入出力装置(不図示)を有している。コンソール17は、表示制御部からの指示をモニターに表示し、表示メッセージを確認したオペレータが電話やメール等を行うことで、エンジニアへ向けた調査依頼、確認依頼の実施を可能とする。異常の発生時に調査依頼を引き受けたエンジニアがサーバ40の状況を調査し、復旧する。
図3は、出力メッセージ格納部11、想定メッセージ格納部12、ナレッジ13によりそれぞれ管理テーブルに格納される第1〜3メッセージの一例である。
テーブルAは、出力メッセージ格納部11が記憶するテーブルであり、第1メッセージが含まれる。テーブルAにおいて、”出力日時”は、第1メッセージが出力された日時を示す。”メッセージ出力サーバ”は、複数のサーバ40のうち第1メッセージを出力したサーバを示す。”出力メッセージ”は、第1メッセージの内容を示す。
テーブルBは、想定メッセージ格納部12が記憶するテーブルであり、第2メッセージが含まれる。テーブルBにおいて、”SE作業名”は、該当する第2メッセージが出力され得る状態であるエンジニアによる作業またはジョブ等の名称を示す。”メッセージ出力サーバ”は、この第2メッセージが出力され得るサーバ40を示す。”出力メッセージ”は、第2メッセージの内容を示す。”作業開始日時”、”作業終了日時”は、該当する第2メッセージが出力され得るエンジニアの作業またはジョブ等が行われるまたは実行される時間帯の開始日時と終了日時を示す。”対象フラグ”は、現在該当するメッセージが出力され得る状態(即ち規定の条件である)であるかどうかを示す。対象フラグがONのときには、該当する第2メッセージを判定部14による判定処理の対象とする。対象フラグがOFFのときには、該当する第2メッセージを判定部14による判定処理の対象から除外する。対象フラグがEOF(End of file)となった場合、格納済みの第2メッセージのうち最後の第2メッセージの判定処理を終えた状態を示し、格納済みの全ての第2メッセージの判定処理が終わったものとする。”管理番号”とは、第2メッセージそれぞれを区別するための固有の番号であり、判定部14における判定処理の結果を後述するテーブルDにおいて管理するために用いられる。
テーブルCは、ナレッジ13が記憶するテーブルであり、第3メッセージが含まれる。テーブルCにおいて、”SE作業名”は、該当する第3メッセージがサーバ40から出力されたときのエンジニアによる作業またはジョブ等の名称を示す。”メッセージ出力サーバ”は、この第3メッセージが出力されたサーバ40を示す。”出力メッセージ”は、第3メッセージの内容を示す。
図4は、判定部14による判定処理の結果を管理するためのテーブルDを示す。テーブルDは、判定部14による判定対象となるテーブルBに記載の管理番号のメッセージに関する判定処理の結果を格納する。”メッセージ処理番号”には、テーブルBに記載した管理番号が記載される。判定部14による各種判定処理(第1〜3判定処理)の比較結果においては、比較対象のメッセージ間で一致するメッセージがあった場合に”Y”が記載され、一致するメッセージがなかった場合には、”N”が記載される。
なお、”メッセージ処理番号”には初期値として“0”を、各種判定処理(第1〜3判定処理)には初期値として“−”を設定することが望ましい。
図5は、メッセージ監視サーバ10のハードウェア構成図である。ハードウェア構成は、CPU111、DRAM112、ROM113、記憶部114、入出力IF115を備えている。
CPU111は、ROM113に格納される各種制御プログラムを読みこんで実行する。
DRAM112は、制御プログラムや各種データを一時的に格納するワーキングエリアを提供する。ROM113は、各種制御プログラムを不揮発的に記憶する記憶媒体である。
記憶部114は、プログラムや各種処理に用いるデータを格納し、フラッシュメモリやハードディスク等により構成される。入出力IF115は、コンソール等の外部機器とデータの送受信を行うものである。通信IF117は、ホストサーバやATMとの通信を行うものである。尚、各構成は、バス116により接続される。判定部14は、CPU111、DRAM112、ROM113により実現される。また、出力メッセージ格納部11、想定メッセージ格納部12及びナレッジ13は、CPU111、DRAM112、ROM113、記憶部114により実現される。
以下、メッセージ監視サーバ10によるサーバ40の監視に係る制御を、図6〜図11に示すフローチャートを用いて説明する。図6は、メッセージの登録処理を示すフローチャートである。図7は、サーバ40を監視する一連の制御を示すフローチャートである。図8は、メッセージ確認処理を示すフローチャートである。図9、図10は、調査依頼または確認依頼を決定する処理を示すフローチャートである。図11は、コンソール17を介したオペレータへの指示処理を示すフローチャートである。
図6に示す登録処理を説明する。ステップS1では、エンジニア等のシステム担当者からの入力に基づき、メッセージ監視サーバ10は、想定メッセージ格納部12に第2メッセージを登録する。このとき、図3のテーブルBに示す各項目(SE作業名、メッセージ出力サーバ等)の登録を行う。尚、テーブルBに示す管理番号については、メッセージ監視サーバ10がテーブルB内で固有な番号を付与する。ステップS1が実行されると、登録処理を終了する。
以下、図7〜図10を用いてサーバ40を監視する一連の制御を説明する。
図7のステップS11では、メッセージ監視サーバ10は、OSの終了等の割り込み処理等により監視処理が終了されたかを判定する。ステップS11の判定がYesであれば、図7に示す処理を終了する。ステップS11の判定がNoであれば、ステップS12へ移行する。
ステップS12では、メッセージ監視サーバ10は、サーバ40内のシステムログを監視する。ステップS13において、新規のメッセージがあるか判定し、あった場合、ステップS14へ移行する。ステップS14において、メッセージ監視サーバ10は、通信部16を介してサーバ40から該当する新規のメッセージを受信し、出力メッセージ格納部11に第1メッセージとして格納する。ステップS13において、新規のメッセージがない場合、ステップS15へ移行する。
ステップS15では、判定部14がサーバ40から出力された第1メッセージを確認するメッセージ確認処理を実行する。
以下、図8を用いてメッセージ確認処理を詳述する。
図8のステップS31では、判定部14は、想定メッセージ格納部12に格納された第2メッセージを確認する。一例では、図3のテーブルBに格納された第2メッセージを上の行から確認する。
ステップS32では、判定部14は、確認中のメッセージの”対象フラグ”の項目がEOFであるかどうか判定する。即ち、テーブルBのメッセージの最終項目まで確認が終わっている場合、EOFとなる。ステップS32の判定がNoである場合、ステップS33へ移行する。ステップS32の判定がYesである場合、復帰値として対応不要を設定し、図8のメッセージ確認処理を終了する。
ステップS33では、判定部14は、確認中のメッセージの”対象フラグ”の項目がONであるかどうかを判定する。ステップS33の判定がNo(即ち対象フラグがOFF)である場合、ステップS31へ戻り処理を繰り返す。ステップS33の判定がYes(即ち対象フラグがON)である場合、ステップS34へ移行し、次のメッセージを確認する。
ステップS34では、判定部14は、現在の時刻が確認中のメッセージの”作業開始日時”、”作業終了日時”の間の時刻であるかどうか、即ち予め想定された作業の実施またはジョブの実行が行われる時間内であるかどうかを判定する。ステップS34の判定がNoである場合、ステップS31へ移行し、次のメッセージを確認する。ステップS34の判定がYesである場合、ステップS35へ移行する。
ステップS35〜S40では、ステップS31〜S34の判定を経た図3のテーブルBの該当する行の第2メッセージが、判定部14における比較処理(第1、3判定処理)に用いられる。
ステップS35では、判定部14は、図4のテーブルDのメッセージ処理番号に該当する第2メッセージの行の管理番号を設定する。テーブルDを比較処理テーブルとも呼ぶ。
ステップS36では、判定部14は、テーブルAに登録された第1メッセージと、ステップS31〜S34の判定を経た図3のテーブルBの該当する行の第2メッセージを比較するテーブル比較処理(第1判定処理である)を実行する。
ステップS37では、判定部14は、テーブルAに登録された第1メッセージと、テーブルCに格納された第3メッセージを比較するテーブル比較処理(第2判定処理である)を実行する。
ステップS38では、判定部14は、ステップS35でテーブルBに設定された第2メッセージと、テーブルCに格納された第3メッセージを比較するテーブル比較処理(第3判定処理である)を実行する。
図12は、ステップS36〜S38の各テーブル比較処理における共通のフローチャート(関数等の処理)である。
ステップS111では、判定部14は、以降のテーブル比較処理に用いる引数を設定する。詳しくは、テーブル(1),(2)にA〜Cのうち指定された引数A、B、Cを設定する。例えば、ステップS36であれば、引数A、Bを(1),(2)へ設定する。
なお、テーブル(1),(2)は、図12の共通のフローチャート(関数等の処理)へ因数を渡すテーブルであり、図示は省略する。
ステップS112では、判定部14は、テーブル(1),(2)のそれぞれの”メッセージ出力サーバ”の欄を比較する。
ステップS113では、判定部14は、メッセージ出力サーバ名が一致するかを判定する。言い換えると、複数のサーバ40のうち同じサーバから出力されたメッセージであるかどうかを判定する。ステップS113の判定がYesである場合、ステップS114へ移行する。ステップS113の判定がNoである場合、ステップS117へ移行して復帰値に[N]を設定する。なお、復帰値の返し方は特に規定しない。
ステップS114では、判定部14は、テーブル(1),(2)のそれぞれの”出力メッセージ”の欄を比較する。
ステップS115では、判定部14は、出力メッセージ名が一致するかを判定する。ステップS115の判定がNoである場合、ステップS117へ移行して復帰値に[N]を設定する。ステップS115の判定がYesである場合、ステップS116へ移行して復帰値に[Y]を設定する。
図8に戻る。ステップS39では、判定部14は、テーブルDにステップS36〜S38の判定の結果を格納する。詳しくは、テーブルDの各比較項目に図12のテーブル比較処理において返された復帰値のYまたはNを格納する。そして、ステップS40では、判定部14は、復帰値として対応要と設定し、図8のメッセージ確認処理を終了する。
なお、復帰値の返し方は特に規定しない。
図7の処理に戻る。図7のステップS16では、メッセージ監視サーバ10は、復帰値として対応要と設定がされているかどうかを判定する。ステップS16の判定がYesの場合、ステップS17の調査依頼決定処理へ移行する。ステップS16の判定がNoの場合、ステップS22へ移行し、一定時間のWait処理の後ステップS11へ戻り処理を繰り返す。
以下、図9、図10を用いて調査依頼決定処理を詳述する。
ステップS41では、メッセージ監視サーバ10は、テーブルAとテーブルBの比較結果の項目(第1判定処理の結果)がY、即ち第1判定処理において第1メッセージと第2メッセージとが一致している状態、であるかを判定する。すなわち、メッセージ監視サーバ10は、比較処理テーブル(テーブルD)の比較項目2であるAとB比較結果を判定する。ステップS41の判定がYesである場合ステップS42へ移行する。ステップS41の判定がNoである場合図10のステップS49へ移行する。
ステップS42では、メッセージ監視サーバ10は、テーブルAとテーブルCの比較結果の項目(第2判定処理の結果)がY、即ち第2判定処理において第1メッセージと第3メッセージとが一致している状態、であるかを判定する。すなわち、メッセージ監視サーバ10は、比較処理テーブル(テーブルD)の比較項目3であるAとC比較結果を判定する。ステップS42の判定がYesである場合ステップS43へ移行する。ステップS42の判定がNoである場合ステップS44へ移行する。
ステップS43では、メッセージ監視サーバ10は、テーブルBとテーブルCの比較結果の項目(第3判定処理の結果)がY、即ち第3判定処理において第2メッセージと第3メッセージとが一致している状態、であるかを判定する。すなわち、メッセージ監視サーバ10は、比較処理テーブル(テーブルD)の比較項目4であるBとC比較結果を判定する。ステップS43の判定がYesである場合ステップS45へ移行する。ステップS43の判定がNoである場合ステップS46へ移行する。
その他、図9のステップS44は、ステップS43の処理と同様である。また、図10のステップS49は、図9のステップS42の処理と同様であり、図10のステップS50、S51の処理は、図9のステップS43の処理と同様である。各判定(ステップS41〜S44、S49〜S51)の結果ステップS45〜S48、S52〜S55のいずれかへ到達する。
ステップS45では、第1〜第3判定処理の結果が全てYである。つまり、想定されたメッセージがサーバ40から出力されたことからサーバ40に異常は発生しておらず、且つ、以前にサーバ40から出力されたことのある既知のメッセージが出力された状態である。このとき、メッセージ監視サーバ10は、復帰値<1>既知の対応を設定する。
なお、復帰値の返し方は特に規定しない。
図13は、ステップS45へ到達して復帰値<1>既知の対応が設定される一例となるテーブルA,B,C,Dを示す。
ステップS46では、第1、第2判定処理の結果がYであり、第3判定処理の結果がNである。判定結果に矛盾があり、通常出力されない状態なので、ステップS46へ到達した場合エラーとされる。このとき、メッセージ監視サーバ10は、復帰値<7>エラーを設定する。
図19は、ステップS46へ到達して復帰値<7>エラーが設定される一例となるテーブルA,B,C,Dを示す。
ステップS47では、第1、3判定処理の結果がYであり、第2判定処理の結果がNである。判定結果に矛盾があり、通常出力されない状態なので、ステップS46へ到達した場合エラーとされる。このとき、メッセージ監視サーバ10は、復帰値<6>エラーを設定する。
図18は、ステップS47へ到達して復帰値<6>エラーが設定される一例となるテーブルA,B,C,Dを示す。
ステップS48では、第1判定処理の結果がYであり、第2、3判定処理の結果がNである。つまり、想定されたメッセージがサーバ40から出力されたことからサーバ40に異常は発生していないが、以前にサーバ40から出力されたことのある既知メッセージではない新規のメッセージが出力された状態である。このとき、メッセージ監視サーバ10は、復帰値<4>新規の対応を設定する。
図16は、ステップS48へ到達して復帰値<4>新規の対応が設定される一例となるテーブルA,B,C,Dを示す。
ステップS52では、第1判定処理の結果がNであり、第2、3判定処理の結果がYである。判定結果に矛盾があり、通常出力されない状態なので、ステップS52へ到達した場合エラーとされる。このとき、メッセージ監視サーバ10は、復帰値<8>エラーを設定する。
図20は、ステップS52へ到達して復帰値<8>エラーが設定される一例となるテーブルA,B,C,Dを示す。
ステップS53では、第1、3判定処理の結果がNであり、第2判定処理の結果がYである。つまり、想定されたメッセージがサーバ40から出力されておらずサーバ40に異常が発生した可能性がある。一方で、出力されたメッセージは、以前にサーバ40から出力されたことのあるメッセージであり、システム担当者(エンジニア)がテーブルBへ格納した今回判定対象になったメッセージに誤りがある可能性が比較的高い状況でもある。このとき、メッセージ監視サーバ10は、復帰値<3>記載ミス指摘を設定する。
図15は、ステップS53へ到達して復帰値<3>記載ミス指摘が設定される一例となるテーブルA,B,C,Dを示す。
ステップS54では、第1、2判定処理の結果がNであり、第3判定処理の結果がYである。つまり、想定されたメッセージがサーバ40から出力されておらずサーバ40に異常が発生した可能性がある。一方で、システム担当者(エンジニア)がテーブルBへ格納した今回判定対象になったメッセージは、以前にサーバ40から出力されたことのあるメッセージであり、例えば、想定されるメッセージは新規のものであるが、システム担当者(エンジニア)が誤って既知のメッセージをテーブルBへ格納してしまった虞もある。このとき、メッセージ監視サーバ10は、復帰値<2>記載ミス可能性有を設定する。
図14は、ステップS54へ到達して復帰値<2>記載ミス可能性有が設定される一例となるテーブルA,B,C,Dを示す。
ステップS55では、第1〜第3判定処理の結果が全てNである。つまり、想定されたメッセージがサーバ40から出力されておらずサーバ40に異常は発生した可能性がある。そして、実際にサーバ40から出力されたメッセージは、システム担当者(エンジニア)がテーブルBへ格納した今回判定対象になったメッセージとも、以前にサーバ40から出力されたことのある既知のメッセージとも異なる状況であり、想定外のメッセージが出力された可能性が高い。このとき、メッセージ監視サーバ10は、復帰値<5>要調査を設定する。
図17は、ステップS55へ到達して復帰値<5>要調査が設定される一例となるテーブルA,B,C,Dを示す。
図7において、ステップS17が終了したあと、ステップS18のオペレータ指示処理へ移行する。以下、図11において、オペレータ指示処理を詳述する。
図11のステップS61では、表示制御部15は、調査依頼決定処理の復帰値に応じて、コンソール17へ指示画面を表示する。
ステップS61の表示制御部15による処理の概要を以下にまとめる。復帰値が<1>、<4>の場合には、エンジニアによる作業実施やジョブ実行に伴う予定された設定変更に基づいてサーバ40からメッセージが出力された状態であるため、オペレータに対して調査依頼が不要である旨を伝達する。復帰値が<2>、<3>の場合には、サーバ40において生じた装置等の異常が予定された設定変更に伴うものではないが、テーブルBに設定されたメッセージに誤りがある可能性があることから、テーブルBの第2メッセージの正誤の確認を含めたエンジニアへの確認依頼を伝達する。復帰値が<5>の場合には、出力されたメッセージが想定メッセージ格納部12のテーブルB、ナレッジのテーブルCのいずれにも無く、想定外のメッセージが出力された可能性が高いため、主に出力されたメッセージについての調査依頼を伝達する。尚、復帰値が<6>、<7>、<8>の場合には、判定結果に矛盾があり、通常出力されない状態なので、管理システム100を管理するシステム管理者への問い合わせを要求することが望ましい。
一例として、復帰値が<1>、<4>の場合は「SE作業によるものですので、対応不要です」のような指示を表示する。復帰値が<2>の場合は、一例として、「事前に登録した”SE作業時出力メッセージ”に誤りの可能性もあります。SEへ確認依頼してください」のような指示を表示する。復帰値が<3>の場合は、一例として、「事前に登録した”SE作業時出力メッセージ”に誤りがありますので、SEへ確認依頼してください」のような指示を表示する。復帰値が<5>の場合は、一例として、「時刻○○にサーバ△△から出力されたメッセージについて、SEへ調査依頼してください」のような指示を表示する。復帰値が<6>、<7>、<8>の場合は、「システム管理者へ連絡してください」のような指示を表示する。
図7の処理に戻る。図7のステップS19では、復帰値が<4>新規の対応であるかどうかを判定する。ステップS19の判定がYesの場合、ステップS20において、ナレッジが該当する第1メッセージを第3メッセージとして格納する。
ステップS21では、メッセージ監視サーバ10は、後処理として、該当するテーブルBの行における対象フラグをOFFしたり、テーブルDを初期化する、詳しくは、”メッセージ処理番号”には初期値として“0”を、各種判定処理(第1〜3判定処理)には初期値として“−”を設定する。ステップS22で一定時間、例えば5秒のWait処理の後ステップS11へ戻り処理を繰り返す。
以上のメッセージ監視サーバ10によれば、図7のループ(ステップS11〜S22)を繰り返すことで、テーブルBに格納された各第2メッセージに対し、サーバ40からの第2メッセージの出力が想定される規定の条件となった際に、実際に出力された第1メッセージとの間で比較が行われる(テーブルA、Bの比較であり、第1判定処理である)。このような第1判定処理によって調査依頼の要否を判定し、オペレータへ伝達することができる。
従来、予定された設定変更であっても、オペレータは、サーバに異常が生じた可能性があるとしてエンジニアへ調査依頼を送っていた。一方、メッセージ監視サーバ10によれば、サーバ40からのメッセージ内容を自動で精査し、調査依頼の要否を判定することで、調査依頼不要なものについてはオペレータが調査依頼を出さなくてもよいことを報知するため、管理ユーザ(オペレータ)が行う作業負担が軽減される。
さらに、第1判定処理の結果、テーブルA、B間でメッセージが一致した場合において、第2、3判定処理によりテーブルCのメッセージとも比較され、以前出力されたことのある既知のメッセージか、新規のメッセージかを判定することができる。例えば、新規のメッセージであった場合には、新規のメッセージをナレッジのテーブルCへ格納する(図7のステップS19、S20参照)。このように、サーバ40から出力されるメッセージが新規のものであった場合の管理(ナレッジへの格納)も自動で行うことで、管理ユーザの管理作業を肩代わりすることで負担を軽減する。
また、第1判定処理の結果、テーブルA、B間でメッセージが一致しない場合、予定されていない想定外のメッセージが出力された可能性があるため確認依頼を要する旨をオペレータへ伝達することになる。このときメッセージ監視サーバ10によれば、第2、3判定処理によって、テーブルCとの間においてもメッセージの比較がなされる。従って、想定外のメッセージが出力された状況かどうかということだけでなく、エンジニアがテーブルBへ誤ったメッセージ(第2メッセージ)を登録した虞がある場合についても判別することができる。尚、エンジニア側のミスであれば、サーバ40において異常が発生していないため、エンジニアがサーバ40の調査を実行する必要がなくなる。このようにヒューマンエラーを判別可能な構成とすることで、システム担当者(エンジニア)の負担をより軽減することができる。
上述した実施形態は、発明の理解を容易にするために具体例を示したものであり、本発明はこれらの実施形態に限定されるものではない。上述した管理システム、メッセージ監視サーバ、方法、プログラムは、特許請求の範囲に記載した本発明を逸脱しない範囲において、さまざまな変形、変更が可能である。
10 メッセージ監視サーバ
11 出力メッセージ格納部
12 想定メッセージ格納部
13 ナレッジ
14 判定部
15 表示制御部
16 通信部
17 コンソール
20 保守運用センター
30 通信端末
40 サーバ
50 データセンター
60 ATM
70 ホストサーバ
100 管理システム
111 CPU
112 DRAM
113 ROM
114 記憶部
115 入出力IF
116 バス
117 通信IF

Claims (6)

  1. サーバの異常の有無を監視するメッセージ監視サーバであって、
    前記サーバから出力された第1メッセージを格納する出力メッセージ格納部と、
    前記サーバから出力されることが想定される第2メッセージを格納する想定メッセージ格納部と、
    過去に前記サーバから出力された第3メッセージを格納するナレッジと、
    前記第1、第2及び第3メッセージを比較して判定する判定部と、
    前記判定部による判定に基づき、管理ユーザに調査依頼または確認依頼の実施を促す報知手段と、を備え、
    前記判定部は、前記第1メッセージと前記第2メッセージとが一致するかどうかの第1判定処理を実行し、前記第1メッセージと前記第3メッセージとが一致するかどうかの第2判定処理を実行し、前記第2メッセージと前記第3メッセージとが一致するかどうかの第3判定処理を実行し、
    前記報知手段は、前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致する場合には、前記管理ユーザに調査依頼の実施を促さず、前記第1メッセージと前記第2メッセージとが一致しない場合には、前記第2及び第3判定処理の結果に基づき、前記管理ユーザに前記調査依頼または前記確認依頼の実施を促し、
    前記ナレッジは、前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致し、かつ前記第2判定処理の結果として、前記第1メッセージと前記第3メッセージとが一致せず、かつ前記第3判定処理の結果として、前記第2メッセージと前記第3メッセージとが一致しない場合に、前記第1メッセージを前記第3メッセージとして格納する
    ことを特徴とするメッセージ監視サーバ。
  2. 前記第2メッセージが前記サーバから出力されることが想定される規定の条件を前記第2メッセージ毎に設定し、
    前記判定部は、前記第2メッセージのうち規定の条件となったメッセージを、前記第1及び第3判定処理に用いる
    ことを特徴とする請求項1に記載のメッセージ監視サーバ。
  3. 前記規定の条件は、日時である
    ことを特徴とする請求項2に記載のメッセージ監視サーバ。
  4. 前記報知手段は、前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致しない場合であって、
    前記第2判定処理の結果として、前記第1メッセージと前記第3メッセージとが一致せず、前記第3判定処理の結果として、前記第2メッセージと前記第3メッセージとが一致する場合か、または、
    前記第2判定処理の結果として、前記第1メッセージと前記第3メッセージとが一致し、前記第3判定処理の結果として、前記第2メッセージと前記第3メッセージとが一致しない場合には、
    前記管理ユーザに前記第2メッセージの正誤を確認するための前記確認依頼を促す
    ことを特徴とする請求項1乃至請求項3のいずれか1項に記載のメッセージ監視サーバ。
  5. サーバから出力された第1メッセージを格納し、
    前記サーバから出力されることが想定される第2メッセージを格納し、
    過去に前記サーバから出力された第3メッセージを格納し、
    前記第1メッセージと前記第2メッセージとが一致するかどうかの第1判定処理を実行し、
    前記第1メッセージと前記第3メッセージとが一致するかどうかの第2判定処理を実行し、
    前記第2メッセージと前記第3メッセージとが一致するかどうかの第3判定処理を実行し、
    前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致する場合には、管理ユーザに調査依頼の実施を促さず、前記第1メッセージと前記第2メッセージとが一致しない場合には、前記第2判定処理及び第3判定処理の結果に基づき、管理ユーザに前記調査依頼または確認依頼の実施を促し、
    前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致し、かつ前記第2判定処理の結果として、前記第1メッセージと前記第3メッセージとが一致せず、かつ前記第3判定処理の結果として、前記第2メッセージと前記第3メッセージとが一致しない場合に、前記第1メッセージを前記第3メッセージとして格納する
    ことを特徴とするメッセージ監視方法。
  6. サーバから出力された第1メッセージを格納し、
    前記サーバから出力されることが想定される第2メッセージを格納し、
    過去に前記サーバから出力された第3メッセージを格納し、
    前記第1メッセージと前記第2メッセージとが一致するかどうかの第1判定処理を実行し、
    前記第1メッセージと前記第3メッセージとが一致するかどうかの第2判定処理を実行し、
    前記第2メッセージと前記第3メッセージとが一致するかどうかの第3判定処理を実行し、
    前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致する場合には、管理ユーザに調査依頼の実施を促さず、前記第1メッセージと前記第2メッセージとが一致しない場合には、前記第2判定処理及び第3判定処理の結果に基づき、管理ユーザに前記調査依頼または確認依頼の実施を促し、
    前記第1判定処理の結果として、前記第1メッセージと前記第2メッセージとが一致し、かつ前記第2判定処理の結果として、前記第1メッセージと前記第3メッセージとが一致せず、かつ前記第3判定処理の結果として、前記第2メッセージと前記第3メッセージとが一致しない場合に、前記第1メッセージを前記第3メッセージとして格納する
    処理をコンピュータへ実行させることを特徴とするプログラム。
JP2018041906A 2018-03-08 2018-03-08 メッセージ監視サーバ、方法、プログラム Active JP6835763B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018041906A JP6835763B2 (ja) 2018-03-08 2018-03-08 メッセージ監視サーバ、方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018041906A JP6835763B2 (ja) 2018-03-08 2018-03-08 メッセージ監視サーバ、方法、プログラム

Publications (2)

Publication Number Publication Date
JP2019159474A true JP2019159474A (ja) 2019-09-19
JP6835763B2 JP6835763B2 (ja) 2021-02-24

Family

ID=67994857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018041906A Active JP6835763B2 (ja) 2018-03-08 2018-03-08 メッセージ監視サーバ、方法、プログラム

Country Status (1)

Country Link
JP (1) JP6835763B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006318036A (ja) * 2005-05-10 2006-11-24 Hitachi Information Systems Ltd 障害監視システム
US20120278663A1 (en) * 2010-01-08 2012-11-01 Hideo Hasegawa Operation management apparatus, operation management method, and program storage medium
JP2014049045A (ja) * 2012-09-03 2014-03-17 Hitachi Solutions Ltd ジョブ管理システムにおける障害対応システム及びそのプログラム
JP2016177598A (ja) * 2015-03-20 2016-10-06 富士通フロンテック株式会社 管理装置及び管理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006318036A (ja) * 2005-05-10 2006-11-24 Hitachi Information Systems Ltd 障害監視システム
US20120278663A1 (en) * 2010-01-08 2012-11-01 Hideo Hasegawa Operation management apparatus, operation management method, and program storage medium
JP2014049045A (ja) * 2012-09-03 2014-03-17 Hitachi Solutions Ltd ジョブ管理システムにおける障害対応システム及びそのプログラム
JP2016177598A (ja) * 2015-03-20 2016-10-06 富士通フロンテック株式会社 管理装置及び管理方法

Also Published As

Publication number Publication date
JP6835763B2 (ja) 2021-02-24

Similar Documents

Publication Publication Date Title
CN110399260B (zh) 用于预测性地服务和支持解决方案的系统和方法
JP6267184B2 (ja) モバイル機器サポートサービスを提供するためのシステム、方法、装置、およびコンピュータプログラム製品
KR101540129B1 (ko) 원격 액세스 진단 디바이스 및 이의 방법들
CN108427616B (zh) 后台程序监控方法及监控装置
EP0474058A2 (en) Problem analysis of a node computer with assistance from a central site
US8855627B2 (en) System and method for enhanced diagnostics on mobile communication devices
US20060085404A1 (en) Method, apparatus, and computer program product updating software in an information processing apparatus
US8843623B2 (en) Methods, apparatuses, and computer program products for automated remote data collection
US20180081751A1 (en) Server performance correction using remote server actions
EP2916301A1 (en) Self-service terminal (SST) backups and rollbacks
JP2008191878A (ja) 遠隔診断・障害対応システム、遠隔診断・障害対応装置、遠隔診断・障害対応指示装置、遠隔診断・障害対応方法、及び遠隔診断・障害対応プログラム
CN112463421A (zh) 信息处理系统
JP5983102B2 (ja) 監視プログラム、方法及び装置
JP2016200981A (ja) 運用管理プログラム、運用管理方法、および運用管理装置
JP4905165B2 (ja) 監視支援プログラム、監視方法および監視システム
JP6015750B2 (ja) ログ収集サーバ、ログ収集システム、ログ収集方法
US20210042093A1 (en) System and method that support production management
JP2002366388A (ja) カスタマサポート支援方法、カスタマサポート支援システム及びカスタマサポート支援プログラム
JP6835763B2 (ja) メッセージ監視サーバ、方法、プログラム
JP2009151456A (ja) 監視システム、ネットワーク監視装置及びサービス実行環境監視方法
JP2007068090A (ja) ネットワーク装置監視システムおよび監視方法、ならびにそのプログラム
JP2014021586A (ja) プログラムのアップグレードを実施するサーバ、サーバと複数の機器からなるプログラムのアップグレードシステム及びプログラムのアップグレード方法
JP5139485B2 (ja) リモートセキュリティ診断システム
KR101783201B1 (ko) 서버 통합 관리 시스템 및 방법
US20080141262A1 (en) System, apparatus, and method for managing a service

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200311

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20200311

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210204

R150 Certificate of patent or registration of utility model

Ref document number: 6835763

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150