JP2005004699A - コンピュータシステム異常検出システム、コンピュータシステム異常検出方法およびコンピュータシステム - Google Patents

コンピュータシステム異常検出システム、コンピュータシステム異常検出方法およびコンピュータシステム Download PDF

Info

Publication number
JP2005004699A
JP2005004699A JP2003170548A JP2003170548A JP2005004699A JP 2005004699 A JP2005004699 A JP 2005004699A JP 2003170548 A JP2003170548 A JP 2003170548A JP 2003170548 A JP2003170548 A JP 2003170548A JP 2005004699 A JP2005004699 A JP 2005004699A
Authority
JP
Japan
Prior art keywords
computer system
time
abnormality detection
program
abnormality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003170548A
Other languages
English (en)
Inventor
Hiroshi Ichige
洋 市毛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Trecenti Technologies Inc
Original Assignee
Trecenti Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Trecenti Technologies Inc filed Critical Trecenti Technologies Inc
Priority to JP2003170548A priority Critical patent/JP2005004699A/ja
Publication of JP2005004699A publication Critical patent/JP2005004699A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】自動化されたコンピュータシステムにおいて、コンピュータシステムにおける異常発生から復旧までの時間を短縮し、影響を最小限に抑えることができる技術を提供する。
【解決手段】システムA1,A2,…,An内で行われた処理のタイムスタンプの内、監視の対象となるデータのタイムスタンプ群をコンピュータシステム異常検出システム10が収集し、収集したタイムスタンプから最終処理日時を算出し、算出した最終処理日時と現在の日時との差が所定の時間より長い場合には、システムA1,A2,…,Anで異常が発生したと判断する。これにより、長時間かかっていたシステムの異常検出を短時間で検出でき、システムの異常発生から復旧までの時間を短縮し、影響を最小限に抑えることができる。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、コンピュータシステム異常検出システム・方法およびそれらを利用したコンピュータシステムに関し、特に自動化されたコンピュータシステムの異常検出技術に適用して有効な技術に関する。
【0002】
【従来の技術】
コンピュータシステムにおいて異常が発生した場合、従来は人間が異常と認識した時に初めてシステムの異常が検出され、復旧するまでに時間がかかっていた。特に、自動化されたコンピュータシステムでは、人間がそのシステムに触れることがないため、人間が異常と認識するまでに長い時間がかかっていた。
【0003】
本発明者が検討した技術として、例えば、コンピュータシステムの異常を検出する方法については、以下の技術が考えられる。
【0004】
例えば、監視手段が複数のアプリケーションに備えられた各々のオンライン管理手段に対して、アプリケーションプログラムについての定型処理を定期的に実行させ、その定型処理所要時間が所定の時間より長い場合には、アプリケーションの機能を損なう障害や処理効率の低下が発生したと判断する(特許文献1参照)。
【0005】
【特許文献1】
特開平6−231008号公報
【0006】
【発明が解決しようとする課題】
ところで、前記のようなコンピュータシステムの異常を検出する技術について、本発明者が検討した結果、以下のようなことが明らかとなった。
【0007】
例えば、前記特許文献1に記載された技術は、要求情報を受信したことを確認する回答情報を返送する手段、および要求情報の伝送時刻から所定時間経過しても回答情報を受信しないことにより判断する手段によるものであって、監視する側から監視される側へ要求情報を伝送し、それに対して監視される側から監視する側へ回答情報を返送させることにより異常発生を判断するものである。そのため、監視される側に要求情報を受信し回答情報を送信する機能を持たせる必要がある。したがって、このような受信・送信の機能を付加することのできない市販のアプリケーションソフトなどに対しては、当該技術を利用してコンピュータシステムを監視することができない。
【0008】
また、当該技術はオンラインアプリケーションの機能を損なう障害や処理効率の低下などを検知し表示するだけのものであり、全自動工程システムなど人間がそのシステムの表示装置を確認する頻度が低い場合、人間がそのシステムの異常を把握し対処するまでに時間がかかる。
【0009】
そこで、本発明の目的は、自動化されたコンピュータシステムにおいて、コンピュータシステムにおける異常発生から復旧までの時間を短縮し、影響を最小限に抑えることができる技術を提供するものである。
【0010】
本発明の前記並びにその他の目的と新規な特徴は、本明細書の記述及び添付図面から明らかになるであろう。
【0011】
【課題を解決するための手段】
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。
【0012】
すなわち、本発明によるコンピュータシステム異常検出システム・方法は、第1のプログラム(または当該第1のプログラムを含むシステム)内で行われた処理のタイムスタンプ(時間情報)の内、監視の対象となるデータのタイムスタンプ群を第2のプログラム(または当該第2のプログラムを含むシステム)が収集し、収集したタイムスタンプから最終処理日時を算出し、算出した最終処理日時と現在の日時との差が所定の時間より長い場合には、第1のプログラム(または当該第1のプログラムを含むシステム)で異常が発生したと判断するものである。
【0013】
時間情報としてのタイムスタンプには、第1のプログラム(または当該第1のプログラムを含むシステム)がデータベースやメモリへ書き込んだデータのタイムスタンプ、電子ファイルとして記録装置に書き込まれたデータのタイムスタンプ、または電子ファイルの情報(作成日時、更新日時、アクセス日時)などのタイムスタンプが使用できる。
【0014】
また、第1のプログラム(または当該第1のプログラムを含むシステム)に異常が発生したことを第2のプログラム(または当該第2のプログラムを含むシステム)が自動的に判断するため、第1のプログラム(または当該第1のプログラムを含むシステム)を自動的に終了させ自動的に再起動を行うことによる自動復旧が可能となる。
【0015】
また、異常発生および自動復旧を画面へ表示したりアラーム音を出力したりEメール送信をしたり携帯電話へメール送信したりすることにより、ユーザがいつどこにいても自動通知が可能となる。
【0016】
よって、前記コンピュータシステム異常検出システム・方法によれば、長時間かかっていたコンピュータシステムの異常を短時間で検出することができる。
【0017】
以下、プログラムまたは当該プログラムを含むコンピュータシステムを単に「システム」と称する。
【0018】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部材には同一の符号を付し、その繰り返しの説明は省略する。
【0019】
図1は本発明の一実施の形態のコンピュータシステム異常検出システムの構成を示す概略構成図、図2は本実施の形態のコンピュータシステム異常検出方法を示すフローチャート、図3は本実施の形態において、監視されるシステムが1つの場合のコンピュータシステム異常検出方法を示すフローチャート、図4は本実施の形態において、監視されるシステムが複数の場合のコンピュータシステム異常検出方法を示すフローチャート、図5は本実施の形態のコンピュータシステム異常検出システムを含むコンピュータシステムを示す概略構成図である。
【0020】
まず、図1により、本実施の形態のコンピュータシステム異常検出システムの構成の一例を説明する。本実施の形態のコンピュータシステム異常検出システム10は、例えば1または2以上のシステムA1,A2,…,Anの異常を検出するシステムであって、処理実行部23と、ユーザへの通知部22などから構成される。
【0021】
処理実行部23は、システムA1,A2,…,Anにおいて処理が実行された時に記録される時間情報としてのタイムスタンプを収集するタイムスタンプ情報収集プログラム11と、収集したタイムスタンプに基づいて最終処理日時を算出する最終処理日時算出プログラム12と、現在の日時を算出する現在日時算出プログラム13と、最終処理日時算出プログラム12により算出した最終処理日時と現在日時算出プログラム13により算出した現在の日時との差により最終処理日時からの経過時間を算出する経過時間算出プログラム14と、経過時間算出プログラム14により算出した経過時間と設定時間とを比較し当該経過時間が当該設定時間を上回った場合はシステムA1,A2,…,Anのいずれかにおいて異常が発生したと判断するシステム異常検出プログラム15と、当該異常発生をユーザへ通知する異常発生通知プログラム16と、システムA1,A2,…,Anのいずれかにおいて異常が発生したと判断された場合、システムA1,A2,…,Anのうち異常システムを強制終了し再起動して自動復旧する自動復旧プログラム17と、自動復旧プログラム17により異常システムが正常な状態に復旧した場合、当該正常復旧をユーザへ通知する正常復旧通知プログラム18などから構成されている。
【0022】
ユーザへの通知部22は、画面表示を行う表示装置19と、アラーム音の出力を行うアラーム音出力装置20と、Eメールまたは携帯メールなどの電子メール送信を行う通信装置21などから構成されている。
【0023】
異常発生通知プログラム16の出力は、回線を介して表示装置19,アラーム音出力装置20,通信装置21などへ入力され、正常復旧通知プログラム18の出力は、回線を介して表示装置19,通信装置21などへ入力されている。また、システムA1,A2,…,Anと処理実行部23とは、それぞれ回線を介して接続されている。
【0024】
1または2以上のシステムA1,A2,…,Anは、コンピュータシステム異常検出システム10により監視されるシステムであり、オペレータ入力装置24と内部処理プログラム25とからなる内部処理部26と、処理を実行する中央演算装置27と、タイムスタンプ情報を記録するデータ記録装置28などから構成される。内部処理部26と中央演算装置27とは回線およびバスを介して接続され、中央演算装置27とデータ記録装置28とは回線およびバスを介して接続されている。なお、システムA1,A2,…,Anは、プログラムのみであってもよい。
【0025】
また、オペレータ入力装置29と外部アクセスプログラム30とからなる外部処理装置31が、回線を介して中央演算装置27と接続されている。
【0026】
次に、図1および図2により、本実施の形態のコンピュータシステム異常検出システム10を利用したコンピュータシステム異常検出方法について説明する。
【0027】
システムA1,A2,…,Anの内部処理部26などによりシステム内で様々な処理が実行され(ステップS101)、または外部処理装置31などからの処置(人間の指示や他のシステムの指示による)が実行され(ステップS102)、それらを受けて中央演算装置27においてシステム処理が実行される(ステップS103)。そして、システムA1,A2,…,Anは、データ記録装置28において、様々な処理が実行された時の時間情報としてのタイムスタンプ情報を保持する(ステップS104)。タイムスタンプ情報は、電子ファイルやメモリに保存されたデータ内のタイムスタンプ情報、または電子ファイルそのものの保存日時や更新日時等のタイムスタンプ情報などである。
【0028】
次に、コンピュータシステム異常検出システム10は、タイムスタンプ情報収集プログラム11により、システムA1,A2,…,Anのデータ記録装置28において保持されたタイムスタンプ情報から必要な情報を取得し(ステップS105)、最終処理日時算出プログラム12により最終処理日時を算出する(ステップS106)。
【0029】
また、コンピュータシステム異常検出システム10は、現在日時算出プログラム13により現在の日時を算出する(ステップS107)。
【0030】
コンピュータシステム異常検出システム10は、経過時間算出プログラム14により、算出した最終処理日時から現在の日時をマイナスして、最終処理日時からの経過時間を算出する(ステップS108)。
【0031】
続いて、システム異常検出プログラム15により、算出した最終処理日時からの経過時間が設定した時間を上回った場合、システムA1,A2,…,Anのいずれかに異常が発生している可能性があることを検出する(ステップS109)。
【0032】
そして、異常発生の可能性が検出されたら、異常発生通知プログラム16により、システムA1,A2,…,Anのいずれかで異常発生の可能性があることをユーザへ知らせる(ステップS110)。ユーザへの通知は、ユーザへの通知部22により、表示装置19への画面表示、アラーム音出力装置20へのアラーム音出力、通信装置21へのEメール送信もしくは携帯メール送信などを行う。
【0033】
その際、自動復旧プログラム17により、システムA1,A2,…,Anのうち異常が発生しているシステムを強制終了し、当該異常システムを再起動して自動的に復旧処理を行う(ステップS111)。
【0034】
システムA1,A2,…,Anが正常に復旧した場合には、正常復旧通知プログラム18により、システムA1,A2,…,Anで発生した異常が正常な状態に復旧したことをユーザへ通知する(ステップS112)。ユーザへの通知は、ユーザへの通知部22により、表示装置19への画面表示、通信装置21へのEメール送信もしくは携帯メール送信などを行う。
【0035】
なお、システム異常検出プログラム15で使用する異常検出のための設定時間は、システムA1,A2,…,Anが正常に動作している時の最終処理からの経過時間データを集計し、集計結果を基に異常検出のための設定時間を決定する(ステップS113)。
【0036】
以上のように、コンピュータシステム異常検出システム10は、単数もしくは複数のシステムA1,A2,…,Anに対して異常検出を行うことができる。また、プログラムの1つ1つをシステムと見ることもできるため、システムA1,A2,…,Anは、プログラムのみであってもよい。その場合、同じシステム内の各プログラムを監視し異常を検出することも可能である。
【0037】
次に、図3により、監視されるシステムが1つの場合のコンピュータシステム異常検出方法を説明する。例えば、監視されるシステムがシステムAのみであるとする。図3(a)は、監視されるシステムA内の処理フローを示すフローチャート、図3(b)は、システムAを監視し、システムAの異常を検出するコンピュータシステム異常検出システム10内の処理フローを示すフローチャートである。
【0038】
図3(a)に示すように、システムAにおいて以下の処理が実行される。すなわち、システムA内部の処理(ステップS230)において、オペレータ入力の有無をチェックし(ステップS201)、オペレータ入力があった場合はオペレータ入力による処理を行い(ステップS202)、処理時のタイムスタンプデータを保存する(ステップS209)。処理時のタイムスタンプデータを保存した後は、最初に戻り同じ処理を繰り返す。オペレータ入力がない場合はプログラムによる自動処理の有無をチェックし(ステップS203)、プログラムによる自動処理があった場合はプログラムによる自動処理を行い(ステップS204)、処理時のタイムスタンプデータを保存する(ステップS209)。処理時のタイムスタンプデータを保存した後は、同様にして、最初に戻り同じ処理を繰り返す。
【0039】
プログラムによる自動処理がない場合は、外部システムからシステムAへの処理(ステップS231)により、オペレータ入力の有無をチェックし(ステップS205)、オペレータ入力があった場合はオペレータ入力による処理を行い(ステップS206)、処理時のタイムスタンプデータを保存する(ステップS209)。処理時のタイムスタンプデータを保存した後は、最初に戻り同じ処理を再び繰り返す。オペレータ入力がない場合はプログラムによる自動処理の有無をチェックし(ステップS207)、プログラムによる自動処理があった場合はプログラムによる自動処理を行い(ステップS208)、処理時のタイムスタンプデータを保存する(ステップS209)。処理時のタイムスタンプデータを保存した後は、同様にして、最初に戻り同じ処理を再び繰り返す。プログラムによる自動処理がない場合は、最初に戻り同じ処理を再び繰り返す。
【0040】
図3(b)に示すように、コンピュータシステム異常検出システム10において以下の処理が実行され、システムAの異常が検出される(ステップS200)。すなわち、異常判定処理(ステップS232)により、システムAのタイムスタンプデータを収集し(ステップS210)、現在の日時を算出し(ステップS211)、システムAのタイムスタンプデータから最終のタイムスタンプ日時を算出し(ステップS212)、現在日時と最終のタイムスタンプ日時との差より経過時間を算出し(ステップS213)、当該経過時間が設定時間を上回ったか否かをチェックする(ステップS214)。当該経過時間が設定時間を上回った場合は、前回の判定結果において経過時間が設定時間を上回っていたか否かをチェックする(ステップS216)。前回の判定結果において経過時間が設定時間を上回っていた場合は、最初に戻り同じ処理を繰り返す。前回の判定結果において経過時間が設定時間を上回っていない場合は、ユーザへの異常自動通知処理(ステップS233)により、画面表示し(ステップS217)、アラーム音を出力し(ステップS218)、Eメールを送信し(ステップS219)、携帯メールを送信する(ステップS220)。続いて自動復旧処理(ステップS234)により、システムAを強制終了し(ステップS221)、システムAを再起動する(ステップS222)。自動復旧処理(ステップS234)を行った後は、最初に戻り同じ処理を繰り返す。ステップS214において当該経過時間が設定時間を上回っていない場合は、前回の判定結果において経過時間が設定時間を上回っていたか否かをチェックする(ステップS215)。前回の判定結果において経過時間が設定時間を上回っていた場合は、ユーザへの正常復帰通知処理(ステップS235)により、画面表示し(ステップS223)、Eメールを送信し(ステップS224)、携帯メールを送信する(ステップS225)。ユーザへの正常復帰通知処理(ステップS235)を行った後は、最初に戻り同じ処理を繰り返す。ステップS215において前回の判定結果において経過時間が設定時間を上回っていない場合は、最初に戻り同じ処理を再び繰り返す。
【0041】
次に、図4により、監視されるシステムが複数の場合のコンピュータシステム異常検出方法を説明する。例えば、監視されるシステムが複数のシステムA1,A2,…,Anであるとする。図4は、複数のシステムA1,A2,…,Anを監視し、システムA1,A2,…,Anの異常を検出するコンピュータシステム異常検出システム10内の処理フローを示すフローチャートである。
【0042】
複数のシステムA1,A2,…,Anでは、それぞれ別々に、前記図3(a)に示す処理フローと同様な処理が実行される。
【0043】
一方、コンピュータシステム異常検出システム10では、図4に示すように、前記図3(b)に示す処理フローと同様な処理がシステムA1〜システムAnについて順次実行されることにより、システムA1〜システムAnの異常が検出される。すなわち、コンピュータシステム異常検出システム10は、まず、システムA1について、異常判定処理(ステップS332)、ユーザへの異常自動通知処理(ステップS333)、自動復旧処理(ステップS334)、ユーザへの正常復帰通知処理(ステップS335)からなるシステムA1の異常検出(ステップS300)を行う。異常判定処理(ステップS332)、ユーザへの異常自動通知処理(ステップS333)、自動復旧処理(ステップS334)、ユーザへの正常復帰通知処理(ステップS335)の各処理は前記図3(b)に示す異常判定処理(ステップS232)、ユーザへの異常自動通知処理(ステップS233)、自動復旧処理(ステップS234)、ユーザへの正常復帰通知処理(ステップS235)と同様なので詳細説明は省略する。
【0044】
続いて、システムA2についてもステップS300と同じ処理を実行する(ステップS400)。そして、システムAnまで同様な処理を実行する。システムAnの異常検出(ステップS500)が終了したら、最初に戻り同様な処理を再び繰り返す。
【0045】
なお、以上の実施の形態においては、システムA1〜システムAnの異常検出を1つずつ直列的に処理する方法について説明したが、システムA1〜システムAnの異常検出を同時並行的に処理してもよい。
【0046】
次に、図5により、前記実施の形態のコンピュータシステム異常検出システム10を備えたコンピュータシステムの一実施の形態を説明する。
【0047】
本実施の形態のコンピュータシステム50は、ハードウェア51と、ソフトウェア52と、オペレーションシステム53などから構成される。ハードウェア51は、中央演算機構54と、入出力装置55と、記録装置56と、通信機構57などから構成される。ソフトウェア52は、システム異常監視プログラム58と、ネットワーク通信プログラム59と、アラーム出力プログラム60と、データベース61などから構成される。
【0048】
オペレーションシステム53は、例えば、コンピュータシステムのジョブを監視・制御するためのプロセス管理機能、複数のプログラムを同時に実行する時にコンピュータの実行時間を最適配分するためのCPUスケジュール管理機能、容量に限りのある記憶域に実行プログラムを効率良く格納するための記憶域管理機能、実行命令や処理結果の授受に必要な通信制御機能などを備えている。
【0049】
中央演算機構54は、前記実施の形態のシステムA1,A2,…,Anの中央演算装置27、コンピュータシステム異常検出システム10の処理実行部23の種々のプログラムを実行する中央演算装置などが該当する。入出力装置55は、オペレータ入力装置24,29、表示装置19、アラーム音出力装置20などが該当する。記録装置56は、データ記録装置28などが該当する。通信機構57は、通信装置21、各種回線などが該当する。システム異常監視プログラム58は、タイムスタンプ情報収集プログラム11、最終処理日時算出プログラム12、現在日時算出プログラム13、経過時間算出プログラム14、システム異常検出プログラム15、異常発生通知プログラム16、自動復旧プログラム17、正常復旧通知プログラム18などが該当する。ネットワーク通信プログラム59は、ネットワーク通信機能、電子メール通信機能などを備えている。アラーム出力プログラム60は、アラーム音出力機能を備えている。データベース61は、内部処理プログラム25、外部アクセスプログラム30などが該当する。
【0050】
以上の構成からなるコンピュータシステム50において、前記実施の形態のコンピュータシステム異常検出方法が実施される。
【0051】
従って、前記実施の形態のコンピュータシステム異常検出システム、コンピュータシステム異常検出方法およびコンピュータシステムによれば、長時間かかっていたシステムの異常検出を短時間で検出できる。また、自動的に検出するため、自動で復旧させることも可能となり、アラーム音・Eメール・携帯メールにより、複数のユーザにすぐに報告することも可能となる。これらの方法により、システムでの異常発生から復旧までの時間を短縮し、影響を最小限に抑える効果が得られる。
【0052】
コンピュータシステムで異常が発生した場合には、そのシステムに接続された別のシステムでも異常が発生する可能性があるが、前記実施の形態により、早期に異常を検出することができるため、接続された他のシステムについても早期復旧が可能となることから、接続されているシステム全体のトラブルを軽減することができる。
【0053】
とくに、異常検出機能を持たないシステム、または異常検出機能を持たせることができないシステムにおいては、最も効果が大きい。例えば、実行ファイル形式の市販のソフトなどである。
【0054】
以上、本発明者によってなされた発明をその実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
【0055】
【発明の効果】
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば、以下のとおりである。
【0056】
(1)長時間かかっていたシステムの異常検出を短時間で検出できる。
【0057】
(2)システムの異常発生から復旧までの時間を短縮し、影響を最小限に抑えることができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態であるコンピュータシステム異常検出システムの構成を示す概略構成図である。
【図2】本発明の一実施の形態であるコンピュータシステム異常検出方法を示すフローチャートである。
【図3】本発明の一実施の形態において、監視されるシステムが1つの場合のコンピュータシステム異常検出方法を示すフローチャートであり、(a)は監視されるシステム内の処理フローを示し、(b)はコンピュータシステム異常検出システム内の処理フローを示す。
【図4】本発明の一実施の形態において、監視されるシステムが複数の場合のコンピュータシステム異常検出方法を示すフローチャートである。
【図5】本発明の一実施の形態であるコンピュータシステム異常検出システムを含むコンピュータシステムを示す概略構成図である。
【符号の説明】
10 コンピュータシステム異常検出システム
11 タイムスタンプ情報収集プログラム
12 最終処理日時算出プログラム
13 現在日時算出プログラム
14 経過時間算出プログラム
15 システム異常検出プログラム
16 異常発生通知プログラム
17 自動復旧プログラム
18 正常復旧通知プログラム
19 表示装置
20 アラーム音出力装置
21 通信装置
22 ユーザへの通知部
23 処理実行部
24,29 オペレータ入力装置
25 内部処理プログラム
26 内部処理部
27 中央演算装置
28 データ記録装置
30 外部アクセスプログラム
31 外部処理装置
50 コンピュータシステム
51 ハードウェア
52 ソフトウェア
53 オペレーションシステム
54 中央演算機構
55 入出力装置
56 記録装置
57 通信機構
58 システム異常監視プログラム
59 ネットワーク通信プログラム
60 アラーム出力プログラム
61 データベース

Claims (10)

  1. 1もしくは2以上のプログラムまたは前記プログラムを含むコンピュータシステムにおいて処理が実行された時に記録される時間情報を収集する手段と、
    前記収集した時間情報に基づいて最終処理日時を算出する手段と、
    前記算出した最終処理日時と現在の日時との差により前記最終処理日時からの経過時間を算出する手段と、
    前記算出した経過時間と設定時間とを比較し、前記経過時間が前記設定時間を上回った場合は前記プログラムまたは前記コンピュータシステムにおいて異常が発生したと判断し、前記異常発生をユーザへ通知する手段と、
    を有することを特徴とするコンピュータシステム異常検出システム。
  2. 請求項1記載のコンピュータシステム異常検出システムであって、
    前記プログラムまたは前記コンピュータシステムにおいて異常が発生したと判断された場合、前記プログラムまたは前記コンピュータシステムを強制終了し再起動して自動復旧する手段をさらに有することを特徴とするコンピュータシステム異常検出システム。
  3. 請求項2記載のコンピュータシステム異常検出システムであって、
    前記自動復旧により前記プログラムまたは前記コンピュータシステムが正常な状態に復旧した場合、前記正常復旧をユーザへ通知する手段をさらに有することを特徴とするコンピュータシステム異常検出システム。
  4. 請求項1〜3のいずれか1項に記載のコンピュータシステム異常検出システムであって、
    前記ユーザへの通知は、画面への表示、アラーム音の出力および/または電子メールの送信であることを特徴とするコンピュータシステム異常検出システム。
  5. 請求項1〜4のいずれか1項に記載のコンピュータシステム異常検出システムを有することを特徴とするコンピュータシステム。
  6. 1もしくは2以上のプログラムまたは前記プログラムを含むコンピュータシステムにおいて処理が実行された時に保持される時間情報を取得する工程と、
    前記取得した時間情報に基づいて最終処理日時を算出する工程と、
    前記算出した最終処理日時と現在の日時との差により前記最終処理日時からの経過時間を算出する工程と、
    前記算出した経過時間と設定時間とを比較し、前記経過時間が前記設定時間を上回った場合は前記プログラムまたは前記コンピュータシステムにおいて異常が発生したと判断し、前記異常発生をユーザへ通知する工程と、
    を有することを特徴とするコンピュータシステム異常検出方法。
  7. 請求項6記載のコンピュータシステム異常検出方法であって、
    前記プログラムまたは前記コンピュータシステムにおいて異常が発生したと判断された場合、前記プログラムまたは前記コンピュータシステムを強制終了し再起動して自動復旧する工程をさらに有することを特徴とするコンピュータシステム異常検出方法。
  8. 請求項7記載のコンピュータシステム異常検出方法であって、
    前記自動復旧により前記プログラムまたは前記コンピュータシステムが正常な状態に復旧した場合、前記正常復旧をユーザへ通知する工程をさらに有することを特徴とするコンピュータシステム異常検出方法。
  9. 請求項6〜8のいずれか1項に記載のコンピュータシステム異常検出方法であって、
    前記ユーザへの通知は、画面への表示、アラーム音の出力および/または電子メールの送信であることを特徴とするコンピュータシステム異常検出方法。
  10. 請求項6〜9のいずれか1項に記載のコンピュータシステム異常検出方法を実施することを特徴とするコンピュータシステム。
JP2003170548A 2003-06-16 2003-06-16 コンピュータシステム異常検出システム、コンピュータシステム異常検出方法およびコンピュータシステム Pending JP2005004699A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003170548A JP2005004699A (ja) 2003-06-16 2003-06-16 コンピュータシステム異常検出システム、コンピュータシステム異常検出方法およびコンピュータシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003170548A JP2005004699A (ja) 2003-06-16 2003-06-16 コンピュータシステム異常検出システム、コンピュータシステム異常検出方法およびコンピュータシステム

Publications (1)

Publication Number Publication Date
JP2005004699A true JP2005004699A (ja) 2005-01-06

Family

ID=34095315

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003170548A Pending JP2005004699A (ja) 2003-06-16 2003-06-16 コンピュータシステム異常検出システム、コンピュータシステム異常検出方法およびコンピュータシステム

Country Status (1)

Country Link
JP (1) JP2005004699A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007133870A (ja) * 2005-11-07 2007-05-31 Internatl Business Mach Corp <Ibm> コンピューティング・システムのオートノミック能力を測定するための方法、システム及びコンピュータ・プログラム
WO2008120566A1 (ja) * 2007-03-29 2008-10-09 Nec Corporation エンジン・プロセッサ連携システム、及び連携方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007133870A (ja) * 2005-11-07 2007-05-31 Internatl Business Mach Corp <Ibm> コンピューティング・システムのオートノミック能力を測定するための方法、システム及びコンピュータ・プログラム
WO2008120566A1 (ja) * 2007-03-29 2008-10-09 Nec Corporation エンジン・プロセッサ連携システム、及び連携方法
JP5278705B2 (ja) * 2007-03-29 2013-09-04 日本電気株式会社 エンジン・プロセッサ連携システム、及び連携方法

Similar Documents

Publication Publication Date Title
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
US7281040B1 (en) Diagnostic/remote monitoring by email
US10868744B2 (en) Influence range identification method and influence range identification apparatus
US20090024356A1 (en) Determination of root cause(s) of symptoms using stochastic gradient descent
CN100394394C (zh) 容错双工计算机系统及其控制方法
CN107766208B (zh) 一种监控业务系统的方法、系统及装置
CN110609778A (zh) 一种保存服务器宕机日志的方法及系统
EP4206839A1 (en) Method for managing ecu on vehicle, and ecu and readable storage medium
JP2007323193A (ja) 性能負荷異常検出システム、性能負荷異常検出方法、及びプログラム
JP2007042082A (ja) 診断システム
CN114978883B (zh) 网络唤醒的管理方法、装置、电子设备及存储介质
CN109766198B (zh) 流式处理方法、装置、设备及计算机可读存储介质
US10089162B2 (en) Method for maintaining file system of computer system
US10496464B1 (en) System and method for data logging within a field replacement unit
JP2005316808A (ja) 性能監視装置および性能監視方法並びにプログラム
JP2018180982A (ja) 情報処理装置、およびログ記録方法
JP6504610B2 (ja) 処理装置、方法及びプログラム
JP2005004699A (ja) コンピュータシステム異常検出システム、コンピュータシステム異常検出方法およびコンピュータシステム
JP2016076072A (ja) 障害通報装置、障害通報方法及び障害通報プログラム
JP2007207213A (ja) ワイヤレスデバイスのリアルタイム診断に適用する診断情報収集手法
CN110851316B (zh) 异常预警方法及装置、系统、电子设备、存储介质
JP4968092B2 (ja) ストール検出装置、ストール検出方法、及びストール検出プログラム
JP2012146049A (ja) バッチジョブ遅延警告自動発報システムおよび自動発報方法、ならびにそのためのプログラム
JP2002182951A (ja) 情報処理装置のメンテナンス方法および情報処理装置
KR20090052418A (ko) 재기동 정보 관리 기능을 구비한 장치

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050318