JP4260441B2 - System health check program and system health check method - Google Patents
System health check program and system health check method Download PDFInfo
- Publication number
- JP4260441B2 JP4260441B2 JP2002246900A JP2002246900A JP4260441B2 JP 4260441 B2 JP4260441 B2 JP 4260441B2 JP 2002246900 A JP2002246900 A JP 2002246900A JP 2002246900 A JP2002246900 A JP 2002246900A JP 4260441 B2 JP4260441 B2 JP 4260441B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- check data
- health check
- processes
- end point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明は、システムヘルスチェックプログラム及びシステムヘルスチェック方法に関し、特にコンピュータを利用したシステムヘルスチェックプログラム及びシステムヘルスチェック方法に関する。
【0002】
【従来の技術】
従来、システムへルスチェックとは、複数のプロセス群の全てが正常に動作していることを確認するために、各プロセスが提供する固有のチェック方法を用いて、全てのプロセスに関するチェックを行なっていた。例えば特開平10−116211号公報では、専用のヘルスチェックプロセスが、定期的に各プロセスに対してヘルスチェックデータを送り、それぞれの応答時間を確認してエラーかどうかの判断を行っている。
【0003】
【発明が解決しようとする課題】
しかしながら、上記のように全プロセスが正常に動作していることを個別に確認するためには、全てのプロセスに関する知識が必要となる。また各プロセスに対するチェックの手法が統一されていない事により、それぞれに対応した手法でチェックを行う必要があるため、自動的に実行させるのが困難である。特にプロセスの数が多い場合に、全てのプロセスのチェックを行うには膨大な時間を要する可能性があるという問題がある。
【0004】
本発明は、上記の点に鑑みてなされたものであって、複数のプロセスの動作確認を容易に行うことのできるシステムヘルスチェックプログラム及びシステムヘルスチェック方法の提供を目的とする。
【0005】
【課題を解決するための手段】
そこで上記課題を解決するため、本発明は、コンピュータに、直列的に所定のデータに関する処理を実行する複数のプロセスのうち、前記処理の起点プロセスに対しチェックデータを送信するチェックデータ送信手順と、前記複数のプロセスのうち前記処理の終点プロセスにおける前記処理の完了を検知する処理完了検知手順とを実行させるためのシステムヘルスチェックプログラムとして構成される。
【0006】
このようなシステムヘルスチェックプログラムでは、複数のプロセスによって実行する処理の終点プロセスに、動作確認のための処理としてヘルスチェックプログラムに対する完了通知処理を追加すればよいので、直列的に処理を実行する複数のプロセスの動作確認を容易に行うことができる。
【0007】
また上記課題を解決するため、本発明は、上記システムヘルスチェックプログラムが実行する方法、システムヘルスチェックプログラムを実行する装置、及びシステムヘルスチェックプログラムを記録した記録媒体としてもよい。
【0008】
【発明の実施の形態】
以下、図面に基づいて本発明の実施の形態を説明する。
【0009】
図1は、本発明の実施の形態におけるシステムヘルスチェック装置のハードウェア構成例を示す図である。図1のシステムヘルスチェック装置10は、それぞれバスBで相互に接続されているドライブ装置100と、記憶媒体101と、補助記憶装置102と、メモリ装置103と、演算処理装置104と、インタフェース装置105とを有するように構成される。
【0010】
インタフェース装置105は、例えばモデム、ルータ等で構成され、図2のネットワーク40に接続するために用いられる。
【0011】
システムヘルスチェック装置10が利用するシステムヘルスチェックプログラムは、CD―ROM等の記憶媒体101によって提供される。システムヘルスチェックプログラムを記録した記憶媒体101は、ドライブ装置100にセットされ、システムヘルスチェックプログラムが記憶媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。
【0012】
補助記憶装置102は、インストールされたシステムヘルスチェックプログラムを格納すると共に、必要なファイルやデータ等を格納する。例えば補助記憶装置102は、システムヘルスチェックプログラムの処理に必要な、後述する各種テーブルを格納している。
【0013】
メモリ装置103は、システムヘルスチェック装置10の起動時等、システムヘルスチェックプログラムの起動指示があった場合に、補助記憶装置102からシステムヘルスチェックプログラムを読み出して格納する。演算処理装置104は、メモリ装置103に格納されたシステムヘルスチェックプログラムに従ってシステムヘルスチェック装置10に係る機能を実行する。
【0014】
次に、本実施の形態においてシステムヘルスチェック装置10、即ちシステムヘルスチェックプログラムが動作を監視するイベント管理システムについて説明する。図2は、本発明によるシステムヘルスチェックプログラムが監視するイベント管理システムの一例の構成図を示す。
【0015】
図2のイベント管理システム30は、起点プロセス31、中間プロセス32、終点プロセス33、ホスト管理DB34及びイベント管理DB35等から構成され、所定のホスト20にインストールされている。ホスト20は、ホストA、ホストB、ホストC及びホストD等とLAN等のネットワーク40を介して接続されている。
【0016】
イベント管理システム30は、ホストA41等から送信される障害情報等のイベントデータを処理するシステムである。即ち、ホスト20がホストA41等からのイベントデータを受信すると(S1)、起点プロセス31が、イベントデータの送信元のホストA41はホスト管理DB34に既に登録済みか否かを判断し、登録済みでない場合は、ホストA41の情報をホスト管理DB34に登録する(S2)。ステップS2に続いてステップS3に進み、起点プロセス31は、イベントデータを中間プロセス32に送信する。
【0017】
中間プロセス32は、イベントデータを受信すると、イベントデータについて所定の処理を実行し、終点プロセス33にイベントデータを送信する(S4)。
【0018】
終点プロセス33は、イベントデータを受信すると、イベントデータをイベント管理DB35に登録する(S5)。
【0019】
図3は、各ホストからイベント管理システム30に送信されるイベントデータのデータ形式の一例の構成図を示す。図3のイベントデータ形式50は、イベントデータを識別するための「データ種別」、イベントの重要度が格納される「重要度」、イベントデータの送信元のホスト名が格納される「ホスト名」、イベント情報に関するテキスト情報が格納される「テキスト」、及び当該イベントデータがヘルスチェック用のデータ(以下「ヘルスチェックデータ」という。)であるか否かを示すフラグが格納される「ヘルスチェックフラグ」等の項目で構成される。
【0020】
ここで、ヘルスチェックフラグは、イベント管理システム30の各プロセスにおいて、それぞれが受信したイベントデータがヘルスチェックデータであるか否かを判断するためのフラグであり、ヘルスチェックデータの場合は「1」が、そうでない場合は「0」が格納される。但し、他の項目により正規のイベントデータとヘルスチェックデータとを区別することができれば、必ずしも必要ではない。他の項目により区別するとは、例えばテキスト項目内にヘルスチェックデータであることを示す文字列を埋め込む等が該当する。
【0021】
なお、システムヘルスチェックプログラムが監視可能なシステムは、イベント管理システム30のみに限られるものではない。即ち、システム内のプロセスの数に特に制限はなく、また、ホストA等から送信されるイベントデータのデータ形式も図3のイベントデータ形式50と同一である必要はない。更に、起点プロセス31等の各プロセスは、同一のホスト上で動作している必要もない。複数のプロセスが直列的に処理を実行し、処理の起点となる起点プロセスと処理の終点となるプロセスが明らかなものであればよい。
【0022】
以下、システムヘルスチェックプログラムが、イベント管理システムの動作を確認するための処理手順について説明する。なお、以下の説明においてシステムヘルスチェックプログラムは、図2におけるホスト20にインストールされているものとする。即ちホスト20がシステムヘルスチェック装置10も兼ねる。但し、システムヘルスチェックプログラムと、監視対象となるシステムが必ずしも同一のハードウェア内で動作している必要はなく、システムヘルスチェック装置10とホスト20は、ネットワークを介して接続される別々のハードウェアであってもよい。
【0023】
図4は、第一の実施の形態におけるシステムヘルスチェックプログラムの処理を説明するための図である。
【0024】
ステップS10において、システムヘルスチェックプログラム11は、起点プロセス31に対してイベントデータ形式50と同様の形式で構成され、図5に示されるヘルスチェックデータを送信する。
【0025】
図5は、ヘルスチェックデータの一例を示す図である。図5のヘルスチェックデータ51は、「データ種別」に「D1」、「重要度」に「一般」、「ホスト名」に「dummy」、「テキスト」に「healthcheck」、「ヘルスチェックフラグ」に「1」がそれぞれ格納されている。
【0026】
ステップS10に続いてステップS11に進み、ヘルスチェックデータ51を受信した起点プロセス31は、ヘルスチェックデータ51のヘルスチェックフラグを確認することにより、受信したヘルスチェックデータ51が正規のイベントデータではなく、ヘルスチェックデータであることを認識する。従って、起点プロセス31は、ヘルスチェックデータ51の影響がホスト管理DB34に及ばないようにホスト管理DB34への書き込み処理等は実行せずに、ヘルスチェックデータ51を中間プロセス32に送信する。
【0027】
ステップS11に続いてステップS12に進み、中間プロセス32は所定の処理を実行し、受信したヘルスチェックデータ51を終点プロセス33に送信する。なお、中間プロセス32は、データベースに対する書き込み処理等、ヘルスチェックデータ51を正規のイベントデータと同様に処理することによる不都合が生ずる処理は実行しないため、ヘルスチェックデータ51がヘルスチェックデータであることは意識せずに、通常の処理を行う。
【0028】
ステップS12に続いてステップS13に進み、ヘルスチェックデータ51を受信した終点プロセス33は、ヘルスチェックデータ51のヘルスチェックフラグを確認することにより、受信したヘルスチェックデータ51が正規のイベントデータではなく、ヘルスチェックデータであることを認識する。従って、終点プロセス33は、ヘルスチェックデータ51の影響がイベント管理DB35に及ばないようにイベント管理DB35への書き込み処理等は実行せずに、処理が完了した旨の通知(以下「完了通知」という。)をシステムヘルスチェックプログラム11に送信する。
【0029】
システムヘルスチェックプログラム11は、終点プロセス33から完了通知を受信することにより、イベント管理システム30が正常に動作していることを確認する。一方、システムヘルスチェックプログラム11は、起点プロセス31にヘルスチェックデータ51を送信後、所定の時間が経過(タイムアウト)しても終点プロセス33からの完了通知を受信できない場合は、イベント管理システム30に異常が発生していると判断し、エラーパネルの表示と、異常を知らせる処理を実行する。なお、タイムアウトの時間は、イベント管理システム30の各プロセスの処理時間等に基づいて決めればよい。システムヘルスチェックプログラム11は、ステップS10におけるヘルスチェックデータ51の送信処理を定期的に繰り返すことにより、イベント管理システム30の動作を定期的に確認する。
【0030】
上述した第一の実施の形態におけるシステムヘルスチェックプログラム11によれば、連続して処理を実行する複数プロセスのうち、少なくとも終点プロセス33にのみシステムヘルスチェックプログラム11に対する通知処理を追加するだけで、イベント管理システム30の動作確認を行うことができる。また、起点プロセス31や終点プロセス33のようにデータベースへのデータ登録処理等を行うプロセス、即ちヘルスチェックデータ51が正規のイベントデータと同様に処理されると不都合が生ずるプロセスが存在する場合には、そのようなプロセスにのみヘルスチェックデータ51か否かの判断処理を追加すればよく、中間プロセス32のようにヘルスチェックデータ51を正規のイベントデータと同様に処理しても不都合が生じないプロセスは、なんら特別な処理を追加する必要はない。
【0031】
なお、正規のイベントデータとヘルスチェックデータ51との区別が必要となるプロセスが多数存在する場合、又は、各プロセスの処理が正常に行われることまで確認する必要はなく、単にプロセスが起動していることのみ確認できればいい場合は、各プロセスにおけるイベントデータの受信処理を共通のライブラリ等にしておけばよい。即ち、イベントデータを受信した際にイベントデータのヘルスチェックフラグを確認し、ヘルスチェックデータであると判断した場合は次のプロセスに送信してしまうという処理を共通の関数とし、各プロセスはイベントデータの受信処理にその関数を利用するようにすればよい。
【0032】
次に第二の実施例として、イベント管理システム30の処理がイベントデータの内容によって分岐する場合について説明する。
【0033】
図6は、第二の実施の形態におけるヘルスチェックプロラムの処理を説明するための図を示す。図2において、起点プロセス131については、第一の実施の形態における起点プロセス31と同様であるので説明は省略する。中間プロセス132は、イベントデータを受信すると所定の処理を実施し、イベントデータの重要度等に応じてイベントデータを送信する終点プロセスを変更したり、又はイベントデータを廃棄したりするといったフィルタの役割を果たす。終点プロセスとしては、終点プロセスE1〜Em135までのm個のプロセスが存在し、イベントデータの重要度に応じた処理を実行する。
【0034】
システムヘルスチェックプログラム111は、起点プロセス131にヘルスチェックデータを送信し、終点プロセスから完了通知を受信する点では第一の実施の形態におけるシステムヘルスチェックプログラム11と同様である。但し、中間プロセス132における分岐処理をも含めて動作を確認するために、分岐処理のバリエーションに応じたヘルスチェックデータを送信すべく、ヘルスチェックデータ一覧テーブル112を予め有している。また、完了通知の送信元が、ヘルスチェックデータに対応した終点プロセスであるか否かを判断するために、終了プロセス確認テーブル113を予め有している。
【0035】
図7は、ヘルスチェックデータ一覧テーブルの一例の構成図を示す。図2のヘルスチェックデータ一覧テーブル112には、データ種別が「D1」、「D2」、「D3」、「D4」の4つのヘルスチェックデータが格納されている。それぞれの重要度は、「重要」、「一般」、「警告」、「無視」となっている。システムヘルスチェックプログラム111は、D1から順に、起点プロセス131に対して送信する。
【0036】
また、図8は、ヘルスチェックデータ/終了プロセス対応テーブルの一例の構成図を示す。図8のヘルスチェックデータ/終了プロセス対応テーブル113(以下「対応テーブル113」という。)は、図7のヘルスチェックデータD1〜D4に対する終了プロセスは、図6の終了プロセスE1〜Emのいずれであるかを管理するテーブルである。即ち、各ヘルスチェックデータについて、1が格納されているセルに係る終了プロセスが、当該ヘルスチェックデータを利用した場合の終了プロセスであることを示す。例えば、データ種別が「D1」のヘルスチェックデータ(以下「ヘルスチェックデータD1」という。)を利用した場合は、終了プロセスE1又はEmが終了プロセスであり、ヘルスチェックデータD2を利用した場合は、終了プロセスE2が終了プロセスであることが分かる。またヘルスチェックデータD4については、終了プロセスはないことが分かる。これは、ヘルスチェックデータD4は、図7に示されるようにその重要度が「無視」であるため、中間プロセス132によって廃棄されてしまうからである。
【0037】
以下、第二の実施の形態におけるシステムヘルスチェックプログラム111の処理について図6を参照して説明する。
【0038】
ステップS20において、システムヘルスチェックプログラム111は、ヘルスチェックデータ一覧テーブル112からヘルスチェックデータを一つ取り出す。最初はヘルスチェックデータD1を取り出す。
【0039】
ステップS20に続いてステップS21に進み、システムヘルスチェックプログラム111は、ヘルスチェックデータD1を起点プロセス131に送信する。ヘルスチェックデータD1を受信した起点プロセス131は、第一の実施の形態における起点プロセス31と同様な処理を実行し、ヘルスチェックデータD1を中間プロセス132に送信する(S22)。
【0040】
ステップS22に続いてステップS23に進み、中間プロセス132は、ヘルスチェックデータD1の重要度を確認し、それに応じた終点プロセスにヘルスチェックデータD1を送信する。例えば、重要度が「重要」の場合の送信先が終点プロセスE1である場合は、中間プロセス132は終点プロセスE1にヘルスチェックデータD1を送信する。
【0041】
ステップS23に続いてステップS24に進み、終点プロセスE1は、所定の処理を実行し、完了通知をシステムヘルスチェックプログラム111に送信する。
【0042】
ステップS24に続いてステップS25に進み、システムヘルスチェックプログラム111は、対応テーブル113を参照することにより、完了通知の送信元が正しい終了プロセスであるかどうかを確認する。なお、システムヘルスチェックプログラム111は、起点プロセス131にヘルスチェックデータを送信後、所定の時間が経過(タイムアウト)しても終点プロセスからの完了通知を受信できない場合は、異常が発生していると判断するのは、第一の実施の形態と同様である。但し、対応テーブル113において、D4のように終点プロセスが無い場合は、中間プロセス132によりヘルスチェックデータD4が期待とおり廃棄されたと判断する。
【0043】
上述したステップS20からステップS25までの処理を、ヘルスチェックデータ一覧テーブル112の各ヘルスチェックデータについて実行することにより、システムヘルスチェックプログラム111はイベント管理システム130が正常に動作しているか否かを判定することができる。
【0044】
更に、ステップS25における、終了プロセスの判定処理の詳細について説明する。図9は、システムヘルスチェックプログラムの終了プロセス判定処理のフローチャートを示す。
【0045】
ステップS100において、システムヘルスチェックプログラム111は、ヘルスチェックデータDnを起点プロセスに送信すると、上述した処理を経て終了プロセスEmから完了通知を受信する。
【0046】
ステップS100に続いてステップS101に進み、システムヘルスチェックプログラム111は、対応テーブル113を参照し、DnとEmの組み合わせに係るセルの値が1であるかどうかを確認する。値が1の場合はステップS102に進み、システムヘルスチェックプログラム111は、完了通知は期待した終点プロセスから送信されたと判断し、イベント管理システム130は正常に動作していると判断する。値が0の場合は、ステップS103に進み、システムヘルスチェックプログラム111は、完了通知は期待した終点プロセスとは異なる終点プロセスから送信されたと判断し、イベント管理システム130に異常が発生していると判断する。
【0047】
上述したように、本実施の形態におけるシステムヘルスチェックプログラム111によれば、監視対象のシステムの処理が分岐している場合であっても容易に動作確認を実行することができる。
【0048】
以上、本発明の好ましい実施例について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【0049】
なお、以上の説明に関して更に以下の付記を開示する。
(付記1) コンピュータに、
直列的に所定のデータに関する処理を実行する複数のプロセスのうち、前記処理の起点プロセスに対しチェックデータを送信するチェックデータ送信手順と、
前記複数のプロセスのうち前記処理の終点プロセスにおける前記処理の完了を検知する処理完了検知手順と
を実行させるためのシステムヘルスチェックプログラム。
(付記2) 前記複数のプロセスにおける終点プロセスは、前記チェックデータの内容に応じて変わり、
前記処理完了検知手順は、前記終点プロセスが前記チェックデータ送信手順において送信したチェックデータに応じたものであるか否かを判断する終了プロセス判断手順を更に有することを特徴とする付記1記載のシステムヘルスチェックプログラム。
(付記3) 前記処理完了検知手順は、前記チェックデータ送信手順から所定時間内に前記終点プロセスの処理の完了が検知できない場合には、前記処理は完了しなかったと判断することを特徴とする付記1又は2記載のシステムヘルスチェックプログラム。
(付記4) 前記チェックデータは、前記所定のデータと同一形式であることを特徴とする付記1乃至3いずれか一項記載のシステムヘルスチェックプログラム。
(付記5) コンピュータが、直列的に所定のデータに関する処理を実行する複数のプロセスの動作確認を行うシステムヘルスチェック方法であって、
前記コンピュータが、前記複数のプロセスのうち、前記処理の起点プロセスに対しチェックデータを送信するチェックデータ送信手順と、
前記コンピュータが、前記複数のプロセスのうち前記処理の終点プロセスにおける前記処理の完了を検知する処理完了検知手順と
を有することを特徴とするシステムヘルスチェック方法。
(付記6) コンピュータに、
直列的に所定のデータに関する処理を実行する複数のプロセスのうち、前記処理の起点プロセスに対しチェックデータを送信するチェックデータ送信手順と、
前記複数のプロセスのうち前記処理の終点プロセスにおける前記処理の完了を検知する処理完了検知手順と
を実行させるためのシステムヘルスチェックプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0050】
【発明の効果】
上述の如く、本発明によれば、複数のプロセスによって実行する処理の終点プロセスに、ヘルスチェックプログラムに対する完了通知処理を追加すればよいので、複数のプロセスの動作確認を容易に行うことができる。
【図面の簡単な説明】
【図1】本発明によるシステムヘルスチェック装置の一実施例のハードウェア構成図である。
【図2】本発明によるシステムヘルスチェックプログラムが監視するイベント管理システムの一例の構成図である。
【図3】各ホストからイベント管理システムに送信されるイベントデータのデータ形式の一例の構成図
【図4】第一の実施の形態におけるシステムヘルスチェックプログラムの処理を説明するための図である。
【図5】ヘルスチェックデータの一例を示す図である。
【図6】第二の実施の形態におけるヘルスチェックプロラムの処理を説明するための図である。
【図7】ヘルスチェックデータ一覧テーブルの一例の構成図である。
【図8】ヘルスチェックデータ/終了プロセス対応テーブルの一例の構成図である。
【図9】システムヘルスチェックプログラムの終了プロセス判定処理のフローチャートである。
【符号の説明】
10 システムヘルスチェック装置
20 ホスト
30 イベント管理システム
11、111 システムヘルスチェックプログラム
31、131 起点プロセス
32、132 中間プロセス
33、133 終点プロセス
34 ホスト管理DB
35 イベント管理DB
40 ネットワーク
100 ドライブ装置
101 記憶媒体
102 補助記憶装置
103 メモリ装置
104 演算処理装置
105 インタフェース装置
B バス[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a system health check program and a system health check method, and more particularly to a system health check program and a system health check method using a computer.
[0002]
[Prior art]
Conventionally, the system health check is to check all processes using a unique check method provided by each process in order to confirm that all of a plurality of process groups are operating normally. It was. For example, in Japanese Patent Application Laid-Open No. 10-116211, a dedicated health check process periodically sends health check data to each process, checks each response time, and determines whether there is an error.
[0003]
[Problems to be solved by the invention]
However, in order to individually confirm that all processes are operating normally as described above, knowledge about all processes is required. In addition, since the checking method for each process is not unified, it is necessary to check using a method corresponding to each process, so that it is difficult to execute automatically. In particular, when the number of processes is large, there is a problem that it may take an enormous amount of time to check all processes.
[0004]
The present invention has been made in view of the above points, and an object of the present invention is to provide a system health check program and a system health check method capable of easily confirming the operation of a plurality of processes.
[0005]
[Means for Solving the Problems]
Therefore, in order to solve the above-mentioned problem, the present invention provides a check data transmission procedure for transmitting check data to a starting process of the processing among a plurality of processes for executing processing related to predetermined data in series with a computer, The system health check program is configured to execute a process completion detection procedure for detecting completion of the process in the process end point process among the plurality of processes.
[0006]
In such a system health check program, it is only necessary to add a completion notification process for the health check program as a process for confirming the operation to an end point process of a process executed by a plurality of processes. It is possible to easily check the operation of this process.
[0007]
In order to solve the above problems, the present invention may be a method executed by the system health check program, an apparatus for executing the system health check program, and a recording medium on which the system health check program is recorded.
[0008]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0009]
FIG. 1 is a diagram illustrating a hardware configuration example of a system health check apparatus according to an embodiment of the present invention. The system
[0010]
The
[0011]
A system health check program used by the system
[0012]
The auxiliary storage device 102 stores the installed system health check program and also stores necessary files and data. For example, the auxiliary storage device 102 stores various tables, which will be described later, necessary for processing the system health check program.
[0013]
The memory device 103 reads the system health check program from the auxiliary storage device 102 and stores it when there is an instruction to start the system health check program, such as when the system
[0014]
Next, an event management system that monitors the operation of the system
[0015]
The
[0016]
The
[0017]
When receiving the event data, the
[0018]
When receiving the event data, the
[0019]
FIG. 3 shows a configuration diagram of an example of a data format of event data transmitted from each host to the
[0020]
Here, the health check flag is a flag for determining whether or not the event data received by each process of the
[0021]
The system that can be monitored by the system health check program is not limited to the
[0022]
Hereinafter, a processing procedure for the system health check program to confirm the operation of the event management system will be described. In the following description, it is assumed that the system health check program is installed in the
[0023]
FIG. 4 is a diagram for explaining the processing of the system health check program in the first embodiment.
[0024]
In step S10, the system health check program 11 is configured in the same format as the
[0025]
FIG. 5 is a diagram illustrating an example of health check data. The
[0026]
Progressing to step S11 following step S10, the
[0027]
Progressing to step S12 following step S11, the
[0028]
Progressing to step S13 following step S12, the
[0029]
The system health check program 11 confirms that the
[0030]
According to the system health check program 11 in the first embodiment described above, only the notification process for the system health check program 11 is added only to at least the
[0031]
In addition, when there are many processes that require distinction between the regular event data and the
[0032]
Next, a case where the process of the
[0033]
FIG. 6 is a diagram for explaining the process of the health check program in the second embodiment. In FIG. 2, the
[0034]
The system
[0035]
FIG. 7 shows a configuration diagram of an example of the health check data list table. The health check data list table 112 in FIG. 2 stores four health check data with data types “D 1 ”, “D 2 ”, “D 3 ”, and “D 4 ”. The respective importance levels are “important”, “general”, “warning”, and “ignore”. System
[0036]
FIG. 8 is a configuration diagram of an example of the health check data / end process correspondence table. The health check data / end process correspondence table 113 (hereinafter referred to as “correspondence table 113”) in FIG. 8 is the end process for the health check data D 1 to D 4 in FIG. It is a table that manages whether or not. That is, for each health check data, the end process related to the cell in which 1 is stored is the end process when the health check data is used. For example, when the health check data having the data type “D 1 ” (hereinafter referred to as “health check data D 1 ”) is used, the end process E 1 or Em is the end process, and the health check data D 2 is when using it can be seen that termination process E 2 is an end process. With respect to the health check data D 4, it can be seen that no termination process. This health check data D 4, because of importance, as shown in FIG. 7 is "ignore", since is discarded by the
[0037]
Hereinafter, the process of the system
[0038]
In step S <b> 20, the system
[0039]
Proceeds to step S21 following step S20, system
[0040]
Proceeds Following step S22 in step S23, the
[0041]
Proceeds to step S24 following step S23, the end point process E 1 executes predetermined processing, and transmits a completion notification to the System
[0042]
Progressing to step S25 following step S24, the system
[0043]
The system
[0044]
Further, details of the termination process determination process in step S25 will be described. FIG. 9 shows a flowchart of the end process determination process of the system health check program.
[0045]
In step S100, the system
[0046]
Progressing to step S101 following step S100, the system
[0047]
As described above, according to the system
[0048]
The preferred embodiments of the present invention have been described in detail above, but the present invention is not limited to such specific embodiments, and various modifications can be made within the scope of the gist of the present invention described in the claims.・ Change is possible.
[0049]
In addition, the following additional notes are disclosed regarding the above description.
(Supplementary note 1)
Among a plurality of processes that execute processing related to predetermined data in series, a check data transmission procedure for transmitting check data to the starting process of the processing;
A system health check program for executing a processing completion detection procedure for detecting completion of the processing in an end point process of the processing among the plurality of processes.
(Supplementary Note 2) The end point process in the plurality of processes changes according to the content of the check data,
The system according to
(Additional remark 3) The said process completion detection procedure judges that the said process was not completed when the completion of the process of the said end point process cannot be detected within the predetermined time from the said check data transmission procedure. The system health check program according to 1 or 2.
(Supplementary note 4) The system health check program according to any one of
(Supplementary Note 5) A system health check method in which a computer performs operation confirmation of a plurality of processes that execute processing related to predetermined data in series,
A check data transmission procedure in which the computer transmits check data to a starting process of the processing among the plurality of processes;
A system health check method, comprising: a process completion detection procedure for detecting completion of the process in the process end point process among the plurality of processes.
(Appendix 6)
Among a plurality of processes that execute processing related to predetermined data in series, a check data transmission procedure for transmitting check data to the starting process of the processing;
A computer-readable recording medium recording a system health check program for executing a process completion detection procedure for detecting completion of the process in an end process of the process among the plurality of processes.
[0050]
【The invention's effect】
As described above, according to the present invention, since the completion notification process for the health check program has only to be added to the end point process of the process executed by a plurality of processes, the operation confirmation of the plurality of processes can be easily performed.
[Brief description of the drawings]
FIG. 1 is a hardware configuration diagram of an embodiment of a system health check apparatus according to the present invention.
FIG. 2 is a configuration diagram of an example of an event management system monitored by a system health check program according to the present invention.
FIG. 3 is a configuration diagram of an example of a data format of event data transmitted from each host to the event management system. FIG. 4 is a diagram for explaining processing of a system health check program in the first embodiment.
FIG. 5 is a diagram illustrating an example of health check data.
FIG. 6 is a diagram for explaining processing of a health check program in the second embodiment.
FIG. 7 is a configuration diagram of an example of a health check data list table.
FIG. 8 is a configuration diagram of an example of a health check data / end process correspondence table;
FIG. 9 is a flowchart of an end process determination process of a system health check program.
[Explanation of symbols]
DESCRIPTION OF
35 Event management DB
40
Claims (2)
連続して所定のデータに関する処理を前記コンピュータに実行させる複数のプロセスのうち、前記処理の起点プロセスに対し、記憶装置に記録されている、前記所定のデータと同一の構成を有し前記所定のデータに含まれているフラグ情報に基づいて前記複数のプロセスによって前記所定のデータと区別されるチェックデータの一覧に含まれているチェックデータを前記所定のデータの代わりに送信するチェックデータ送信手順と、
前記複数のプロセスのうち前記処理の終点プロセスより前記チェックデータを受信することにより前記処理の完了を検知する処理完了検知手順と、
前記チェックデータが前記起点プロセスに対して送信されてから所定の時間の経過前に前記処理完了検知手順が実行されたときは、前記処理の終点プロセスが、記憶装置に記録された、前記一覧に含まれる各チェックデータに含まれるデータ種別ごとに複数の終点プロセスのいずれと対応するかを示す対応情報に応じたものであるかを判断し、前記終点プロセスが前記対応情報に応じたものでないと判断される場合は前記処理に異常が発生していると判断し、前記チェックデータが前記起点プロセスに対して送信されてから前記所定の時間が経過しても前記処理完了検知手順が実行されないときは、当該チェックデータが前記対応情報において前記複数の終点プロセスのいずれにも対応付けられていない場合を除いて前記処理に異常が発生していると判断する終点プロセス判断手順とを実行させ、
前記複数のプロセスは、受信したデータが前記チェックデータである場合に、当該チェックデータに含まれ、前記データ種別と1対1に対応する重要度に応じて、当該チェックデータの送信先のプロセスを変更し、又は当該チェックデータを廃棄するシステムヘルスチェックプログラム。On the computer,
Among a plurality of processes that cause the computer to execute processing related to predetermined data continuously, the process having the same configuration as the predetermined data recorded in a storage device with respect to the starting process of the processing has the predetermined A check data transmission procedure for transmitting check data included in a list of check data distinguished from the predetermined data by the plurality of processes based on flag information included in the data instead of the predetermined data; ,
A process completion detection procedure for detecting completion of the process by receiving the check data from an end point process of the process among the plurality of processes;
When the processing completion detection procedure is executed before the elapse of a predetermined time after the check data is transmitted to the start process, the end point process of the process is recorded in the list recorded in the storage device. For each data type included in each check data included, it is determined whether it corresponds to correspondence information indicating which of a plurality of end point processes corresponds to, and the end point process does not correspond to the correspondence information When it is determined, it is determined that an abnormality has occurred in the processing, and the processing completion detection procedure is not executed even after the predetermined time has elapsed since the check data was transmitted to the starting process. Except that the check data is not associated with any of the plurality of end point processes in the correspondence information. To execute the endpoint process determination procedure to determine that there,
When the received data is the check data, the plurality of processes are included in the check data, and the process of the transmission destination of the check data is determined according to the importance corresponding to the data type on a one-to-one basis. A system health check program that changes or discards the check data.
前記コンピュータが、前記複数のプロセスのうち前記処理の終点プロセスより前記チェックデータを受信することにより前記処理の完了を検知する処理完了検知手順と、
前記コンピュータが、前記チェックデータが前記起点プロセスに対して送信されてから所定の時間の経過前に前記処理完了検知手順が実行されたときは、前記処理の終点プロセスが、記憶装置に記録された、前記一覧に含まれる各チェックデータに含まれるデータ種別ごとに複数の終点プロセスのいずれと対応するかを示す対応情報に応じたものであるかを判断し、前記終点プロセスが前記対応情報に応じたものでないと判断される場合は前記処理に異常が発生していると判断し、前記チェックデータが前記起点プロセスに対して送信されてから前記所定の時間が経過しても前記処理完了検知手順が実行されないときは、当該チェックデータが前記対応情報において前記複数の終点プロセスのいずれにも対応付けられていない場合を除いて前記処理に異常が発生していると判断する終点プロセス判断手順とを実行し、
前記複数のプロセスは、受信したデータが前記チェックデータである場合に、当該チェックデータに含まれ、前記データ種別と1対1に対応する重要度に応じて、当該チェックデータの送信先のプロセスを変更し、又は当該チェックデータを廃棄するシステムヘルスチェック方法。The computer has the same configuration as the predetermined data recorded in the storage device with respect to the starting process of the processing among a plurality of processes that cause the computer to execute processing related to the predetermined data continuously. Check data for transmitting, instead of the predetermined data, check data included in a list of check data distinguished from the predetermined data by the plurality of processes based on flag information included in the predetermined data Sending procedure,
A process completion detection procedure in which the computer detects completion of the process by receiving the check data from an end process of the process among the plurality of processes;
When the computer completes the processing completion detection procedure before a lapse of a predetermined time after the check data is transmitted to the starting process, the end point process of the processing is recorded in the storage device. Determining whether each of the data types included in each check data included in the list corresponds to correspondence information indicating which of the plurality of end point processes corresponds to the data, and the end point process corresponds to the correspondence information. If it is determined that the process is abnormal, it is determined that an abnormality has occurred in the process, and the process completion detection procedure is performed even if the predetermined time has elapsed since the check data was transmitted to the starting process. Is not executed, except when the check data is not associated with any of the plurality of end point processes in the correspondence information. It is determined that abnormality has occurred in the process running and end process determines procedure,
When the received data is the check data, the plurality of processes are included in the check data, and the process of the transmission destination of the check data is determined according to the importance corresponding to the data type on a one-to-one basis. A system health check method that changes or discards the check data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002246900A JP4260441B2 (en) | 2002-08-27 | 2002-08-27 | System health check program and system health check method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002246900A JP4260441B2 (en) | 2002-08-27 | 2002-08-27 | System health check program and system health check method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004086574A JP2004086574A (en) | 2004-03-18 |
JP4260441B2 true JP4260441B2 (en) | 2009-04-30 |
Family
ID=32054670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002246900A Expired - Fee Related JP4260441B2 (en) | 2002-08-27 | 2002-08-27 | System health check program and system health check method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4260441B2 (en) |
-
2002
- 2002-08-27 JP JP2002246900A patent/JP4260441B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004086574A (en) | 2004-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2012046293A1 (en) | Fault monitoring device, fault monitoring method and program | |
JP6183931B2 (en) | Cluster system, server apparatus, cluster system management method, and program | |
US7831710B2 (en) | Communication of offline status between computer systems | |
US20080288828A1 (en) | structures for interrupt management in a processing environment | |
JP5366184B2 (en) | Data storage system and data storage method | |
CN101127580B (en) | Node device, control device, and control method | |
JP5535471B2 (en) | Multi-partition computer system, failure processing method and program thereof | |
JP2011159011A (en) | System and program for monitoring job | |
JP4260441B2 (en) | System health check program and system health check method | |
US6622257B1 (en) | Computer network with swappable components | |
JP6317074B2 (en) | Failure notification device, failure notification program, and failure notification method | |
JP2008217118A (en) | Log file management device, log file transmission device, log file management method, log file transmission method and program | |
US20130091271A1 (en) | Connection method | |
JP3202721B2 (en) | Failure prediction system, failure prediction method, and recording medium recording failure prediction program | |
JP5136200B2 (en) | Logging system | |
JP2004220221A (en) | Information processor, monitoring control method for information processor, and information processing system | |
JPH1040097A (en) | Computer with virus checking function | |
JP2011253285A (en) | Diagnosis system, diagnosis apparatus, and diagnosis program | |
JP4459185B2 (en) | Computer system | |
JP2008217682A (en) | Monitoring system, method, and program | |
JP2806321B2 (en) | Hardware connection status monitoring method | |
JP2010170169A (en) | System for asynchronously notifying client of failure | |
JP2003337720A (en) | Fault detecting system, fault detecting method, and fault detecting program | |
JP2010288213A (en) | Node device and information processing apparatus | |
JP2008228027A (en) | Network system, relay processing apparatus, and log information management method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050606 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080226 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080603 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080731 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080826 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080922 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20081027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081202 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090203 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090204 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140220 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |