JP2006202076A - トレース情報収集システム、トレース情報収集方法、及びトレース情報収集プログラム - Google Patents

トレース情報収集システム、トレース情報収集方法、及びトレース情報収集プログラム Download PDF

Info

Publication number
JP2006202076A
JP2006202076A JP2005013600A JP2005013600A JP2006202076A JP 2006202076 A JP2006202076 A JP 2006202076A JP 2005013600 A JP2005013600 A JP 2005013600A JP 2005013600 A JP2005013600 A JP 2005013600A JP 2006202076 A JP2006202076 A JP 2006202076A
Authority
JP
Japan
Prior art keywords
trace information
target program
failure
stop
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005013600A
Other languages
English (en)
Other versions
JP4114879B2 (ja
Inventor
Kazuo Nemoto
和郎 根本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2005013600A priority Critical patent/JP4114879B2/ja
Priority to US11/337,377 priority patent/US7574626B2/en
Publication of JP2006202076A publication Critical patent/JP2006202076A/ja
Application granted granted Critical
Publication of JP4114879B2 publication Critical patent/JP4114879B2/ja
Priority to US12/175,744 priority patent/US20080288826A1/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0715Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】コンピュータシステムの障害発生を適切に検出して、障害除去に必要な情報を自動的に収集する。
【解決手段】プログラムの処理経過を示すトレース情報を収集するトレース情報収集システムは、トレース情報の生成対象である対象プログラムの稼動及び停止の履歴を記録する履歴記録部と、停止している対象プログラムが稼動を開始する場合に、対象プログラムが前回に稼動及び停止した動作パターンが、対象プログラムが前回以前に稼動及び停止した動作パターンに類似する程度を示す類似度を算出する類似度算出部と、類似度算出部により算出された類似度が基準の類似度よりも低いことを条件として、対象プログラムの前回の稼動に障害が発生したと判断する障害発生判断部と、障害が発生したと判断されたことに応答して、障害が発生したと判断されていない場合には収集していないトレース情報を対象プログラムから収集するトレース情報収集部とを備える。
【選択図】図4

Description

本発明は、トレース情報収集システム、トレース情報収集方法、及びトレース情報収集プログラムに関する。特に、本発明は、プログラムの処理経過を示すトレース情報を収集するトレース情報収集システム、トレース情報収集方法、及びトレース情報収集プログラムに関する。
企業等で運用中のコンピュータシステムに障害が発生した場合には、その障害除去のために、例えば、以下の流れで処理が進められる。
(1)運用中のコンピュータシステムで障害が発生
(2)システム担当者の解析により、障害を発生させたプログラムモジュールを特定
(3)次回稼動時に、そのプログラムモジュールの処理経過を示すトレース情報を取得
(4)取得したトレース情報を解析
(5)障害の原因を究明
トレース情報は、コンピュータシステムの稼動中に順次生成され出力される。このため、コンピュータシステムの運用中にトレース情報を取得しようとすれば、トレース情報を記憶装置等に記憶させる処理が定期的に発生し、本来の処理の処理速度を低下させてしまう。従って、従来は、通常の運用時にはトレース情報を取得せず、障害が発生した場合に限って、システム担当者がトレース情報を取得するように設定変更する場合が多い。但し、運用中のコンピュータシステムの設定を変更するためには、利用者や所有者による同意が必要な場合が多く、その同意を得るのに時間がかかる場合が多い。
一方、近年、コンピュータシステムは、企業における事務処理の効率化のためのみならず、基幹業務においても欠かせない役割を果たすようになってきている。このため、コンピュータシステムに障害が発生したからといってその原因を追究するためにコンピュータシステムを長期間停止することは許されない。従って、障害が発生した場合であってもコンピュータシステムが即座に再起動され、トレース情報を取得するために同意を得る等の作業時間が確保できない場合が多い。このように、運用中のコンピュータシステムにおいて障害を除去するのは困難な場合が多かった。
参考技術として、従来、データベースに対するトランザクションが失敗した場合に、トランザクションの処理経過を取得するように自動的に設定変更し、そのトランザクションを再試行するシステムが提案されている(特許文献1参照。)。このシステムによれば、トランザクションの処理中に発生した障害の原因を追究しやすくすることができる。
特開平5−257758号公報
上記文献に記載の技術は、トレース情報を自動的に取得できる点で、コンピュータシステムの障害に応用可能かとも考えられる。しかしながら、コンピュータシステムの場合、トランザクションと異なり、障害が発生したか否かの判断が困難な場合が多い。例えば、トランザクションの失敗は、所定の記憶領域に記録されたエラーコード等により容易に検出できる。これに対して、コンピュータシステムは、様々なモジュールの複合的な要因で障害が発生する場合が多く、各モジュールが正常でも全体としては異常動作している場合もある。更に、障害が発生していない場合であっても、運用上の都合で処理を中断させる場合もある。このように、コンピュータシステムにおいては障害の発生を適切に判断するのは困難であり、トレース情報を生成するタイミングを適切に定めるのは困難であった。
そこで本発明は、上記の課題を解決することのできるトレース情報収集システム、トレース情報収集方法、及びトレース情報収集プログラムを提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
上記課題を解決するために、本発明の第1の形態においては、プログラムの処理経過を示すトレース情報を収集するトレース情報収集システムであって、トレース情報の生成対象である対象プログラムの稼動及び停止の履歴を記録する履歴記録部と、停止している対象プログラムが稼動を開始する場合に、対象プログラムが前回に稼動及び停止した動作パターンが、対象プログラムが前回以前に稼動及び停止した動作パターンに類似する程度を示す類似度を算出する類似度算出部と、類似度算出部により算出された類似度が基準の類似度よりも低いことを条件として、対象プログラムの前回の稼動に障害が発生したと判断する障害発生判断部と、障害が発生したと判断されたことに応答して、障害が発生したと判断されていない場合には収集していないトレース情報を対象プログラムから収集するトレース情報収集部とを備えるトレース情報収集システム。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となりうる。
本発明によれば、コンピュータシステムの障害発生を適切に検出して、障害除去に必要な情報を自動的に収集することができる。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、情報処理装置10の内部構成を示す。情報処理装置10は、ホストコントローラ1082により相互に接続される中央処理装置1000、RAM1020、及びグラフィックコントローラ1075を有する中央処理装置周辺部を備える。また、中央処理装置1000は、入出力コントローラ1084によりホストコントローラ1082に接続される通信インターフェイス1030、ハードディスクドライブ1040、及びCD−ROMドライブ1060を有する入出力部を備える。また、中央処理装置1000は、入出力コントローラ1084に接続されるROM1010、フレキシブルディスクドライブ1050、及び入出力チップ1070を有するレガシー入出力部を備える。
中央処理装置1000は、ROM1010及びRAM1020に格納されたプログラムに基づいて動作し、各部の制御を行う。例えば本実施例において、中央処理装置1000は、トレース情報の生成対象である対象プログラム30を実行する。対象プログラム30は、例えば、外部のクライアント装置から受けた要求に応じて各種のサービスを処理するミドルウェアである。これに代えて、対象プログラム30は、各種のオペレーティングシステムやアプリケーションプログラムであってもよい。更に、中央処理装置1000は、情報処理装置10にインストールされたトレース情報収集プログラムにより、トレース情報収集システム40として機能する。トレース情報収集システム40は、対象プログラム30の処理経過を示すトレース情報を収集してトレース記録部25に記録する。
ホストコントローラ1082は、RAM1020と、高い転送レートでRAM1020をアクセスする中央処理装置1000及びグラフィックコントローラ1075とを接続する。グラフィックコントローラ1075は、中央処理装置1000等がRAM1020内に設けたフレームバッファ上に生成する画像データを取得し、表示装置1080上に表示させる。これに代えて、グラフィックコントローラ1075は、中央処理装置1000等が生成する画像データを格納するフレームバッファを、内部に含んでもよい。
入出力コントローラ1084は、ホストコントローラ1082と、比較的高速な入出力装置である通信インターフェイス1030、ハードディスクドライブ1040、及びCD−ROMドライブ1060を接続する。通信インターフェイス1030は、ネットワークを介して外部の装置と通信する。ハードディスクドライブ1040は、情報処理装置10が使用するプログラム及びデータを格納する。例えば、ハードディスクドライブ1040は、履歴記録部20と、対象プログラム30として機能する。履歴記録部20は、例えば対象プログラム30に予め備わっている機能により、対象プログラム30の稼動及び停止の履歴を記録する。トレース記録部25は、トレース情報収集システム40により収集されたトレース情報等を記録する。
CD−ROMドライブ1060は、CD−ROM1095からプログラム又はデータを読み取り、RAM1020又はハードディスクドライブ1040に提供する。また、入出力コントローラ1084には、ROM1010と、フレキシブルディスクドライブ1050や入出力チップ1070等の比較的低速な入出力装置とが接続される。ROM1010は、情報処理装置10の起動時に中央処理装置1000が実行するブートプログラムや、情報処理装置10のハードウェアに依存するプログラム等を格納する。
フレキシブルディスクドライブ1050は、フレキシブルディスク1090からプログラム又はデータを読み取り、入出力チップ1070を介してRAM1020またはハードディスクドライブ1040に提供する。入出力チップ1070は、フレキシブルディスク1090や、例えばパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して各種の入出力装置を接続する。
情報処理装置10に提供されるプログラムは、フレキシブルディスク1090、CD−ROM1095、又はICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、入出力チップ1070及び/又は入出力コントローラ1084を介して、記録媒体から読み出され情報処理装置10にインストールされて実行される。プログラムが情報処理装置10等に働きかけて行わせる動作は、図2から図7において後述する。
以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク1090、CD−ROM1095の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムを情報処理装置10に提供してもよい。
図2は、履歴記録部20のデータ構造の一例を示す。履歴記録部20は、対象プログラム30の稼動及び停止の履歴を記録する。例えば、履歴記録部20は、対象プログラム30を起動させて稼動を開始させる場合に、稼動を開始させるイベントが発生した旨を、そのイベントが発生した時刻に対応付けて記録する。また、履歴記録部20は、対象プログラム30を停止させる場合に、対象プログラム30を停止させるイベントが発生した旨を、そのイベントが発生した時刻に対応付けて記録する。
一例として、履歴記録部20は、アプリケーションプログラム又はオペレーティングシステムに発生したその他のイベントを含めて記録するイベントログである。即ち、履歴記録部20は、アプリケーションプログラム等に何らかのイベントが発生する毎に、その旨の情報をアプリケーションプログラム等から取得し、その旨をその発生時刻に対応付けて記録する。このように、履歴記録部20は、対象プログラム30に障害が発生したか否かに関わらず、対象プログラム30の動作中に発生したイベントを継続して記録し続ける。
更に、履歴記録部20は、対象プログラム30が停止される場合に、対象プログラム30を停止させる停止手続の種類を記録してもよい。具体的には、履歴記録部20は、既に開始した処理を中断して停止させる即時停止手続であるか、或いは、既に開始した処理を完了させてから停止させる完了待停止手続であるかを記録してもよい。例えば、対象プログラム30が、要求されたトランザクションを処理するミドルウェアである場合には、対象プログラム30を停止させる場合における当該トランザクション処理の取り扱いが問題となる。例えば、既に開始したトランザクション処理を中断してしまえば、これまで行った処理結果が失われてしまう。一方、既に開始したトランザクション処理の終了を待ってから停止すれば、これまでの処理結果が無駄になることは無いが、停止手続の完了には時間がかかる。このため、停止手続の種類を記録すれば、その停止手続を行った際の状況が推測される。
図3は、対象プログラム30が稼動及び停止する動作パターンの一例を示す。本図に示す動作パターンは、図2の履歴記録部20に記録された履歴に対応している。具体的には、対象プログラム30は、3月6日(金)の19:00に完了待停止手続により停止している。そして、対象プログラム30は、3月9日(月)の8:30に起動し、3月13日(金)の19:00に完了待停止手続により停止している。即ち、対象プログラム30は、月曜の朝に起動して金曜の夜間に停止する動作パターンにより動作しているようである。
しかしながら、対象プログラム30は、3月16日(月)の8:30に起動した後は、3月20日(金)を待たずに3月18日(水)の13:00に即時停止手続により停止している。その後、対象プログラム30は、15分後に再度起動している。このように、前回の稼動及び停止の動作パターンが、前回以前の動作パターンと類似していない場合には、対象プログラム30の稼動に何らかの障害が生じた可能性が高い。即ち、通常は週初に起動して週末に停止する対象プログラム30が、水曜日に再起動されたのであれば、その時に障害が発生した可能性が高い。
また、完了待停止手続でなく即時停止手続により停止した場合には、既に開始した処理の途中経過を破棄してまで停止したのであるから、対象プログラム30の稼動に何らかの障害が生じた可能性が高い。本実施例におけるトレース情報収集システム40は、このような過去の稼動及び停止の動作パターンから、対象プログラム30における障害発生を適切に検出し、自動的にトレース情報を生成することを目的とする。
図4は、トレース情報収集システム40の機能を機能ブロックに分類して示す。トレース情報収集システム40は、稼動停止時間比率算出部400と、類似度算出部410と、稼動時間偏差値算出部420と、スコア算出部430と、障害発生判断部440と、動作パラメータ収集部450と、トレース情報収集部460と、平均稼動時間算出部470と、ファイル入出力頻度検出部480と、中央処理装置使用率検出部490とを有する。稼動停止時間比率算出部400は、停止している対象プログラム30が稼動を開始する場合に、対象プログラム30が稼動及び停止を繰り返す各々の繰り返し毎に、対象プログラム30が停止してから稼動するまでに経過した停止時間、及び、稼動してから停止するまでに経過した稼動時間の比率である稼動停止時間比率を算出する。
具体的には、図3を例にとれば、稼動停止時間比率算出部400は、稼動時間ON2及び停止時間OFF2の比率、稼動時間ON1及び停止時間OFF1の比率、及び、稼動時間ON及び停止時間OFFの比率を算出する。類似度算出部410は、対象プログラム30が前回に稼動及び停止した動作パターンが、対象プログラム30が前回以前に稼動及び停止した動作パターンに類似する程度を示す類似度を算出する。より具体的には、類似度算出部410は、稼動及び停止の繰り返しの各々における稼動停止時間比率の確率分布における、前回の稼動及び停止の稼動停止時間比率の偏りを示す値を算出し、当該類似度を示す情報としてもよい。
稼動時間偏差値算出部420は、履歴記録部20に記録された稼動及び停止の履歴に基づいて、対象プログラム30が稼動及び停止を繰り返す各々の繰り返しにおける稼動時間の長さの確率分布を求める。そして、稼動時間偏差値算出部420は、その確率分布における、対象プログラム30が前回に稼動を開始してから停止するまでに経過した稼動時間の偏りを示す値を算出する。スコア算出部430は、類似度算出部410により算出された類似度、及び、稼動時間偏差値算出部420により算出された値、その他履歴記録部20に記録された履歴に基づいて、対象プログラム30に障害が発生した可能性を示すスコアを算出する。
障害発生判断部440は、スコア算出部430により算出されたスコアが予め定められた基準値よりも高いことを条件として、対象プログラム30の前回の稼動に障害が発生したと判断する。一方、障害発生判断部440は、そのスコアが基準値以下であることを条件として、当該障害が発生したと判断しない。動作パラメータ収集部450は、障害発生判断部440により障害が発生したと判断されたことに応答して、対象プログラム30に与える動作パラメータを取得し、トレース記録部25に記録する。動作パラメータは、対象プログラム30の動作開始時に読み出される初期設定ファイル等から取得される。また、動作パラメータは、稼動を開始した対象プログラム30から取得されてもよいし、オペレーティングシステムの環境変数の値を動作パラメータとして取得してもよい。動作パラメータは、対象プログラム30による処理の進行や利用者の操作によって時々刻々と変更される場合があるので、障害発生直後の動作パラメータのスナップショットを退避できれば、障害除去に役立てることができる。
トレース情報収集部460は、障害発生判断部440により障害が発生したと判断されたことに応答して、障害が発生したと判断されていない場合には収集していないトレース情報を対象プログラム30から収集する。そして、トレース情報収集部460は、収集したトレース情報をトレース記録部25に順次記録する。この結果、トレース記録部25には、対象プログラム30の稼動開始時点における動作パラメータと、対象プログラム30の稼動開始から所定の時間までの処理経過を示すトレース情報が記録される。これにより、システム管理者等による特別な作業によらず、障害の原因解析に必要な情報を適切に収集できる。
ここで、動作パラメータ及びトレース情報の収集とは、対象プログラム30等から出力された動作パラメータ及びトレース情報を取得して、後ほどアクセス可能な状態で情報処理装置1040等の記録媒体に記録する処理をいう。従って、トレース情報収集システム40は、トレース情報等の出力を対象プログラム30等に対して必ずしも明示的に指示しなくてもよい。例えば、対象プログラム30は、トレース情報が収集されていない場合であってもトレース情報を出力ストリームに対して書き出し続けており、トレース情報収集システム40は、必要な場合にのみそれらを取得してもよい。
平均稼動時間算出部470は、障害発生判断部440により障害が発生したと判断されたことに応答して、履歴記録部20に記録された対象プログラム30の稼動の履歴に基づいて、対象プログラム30の稼動開始から停止までの平均の稼動時間を算出する。そして、トレース情報収集部460は、トレース情報を収集している場合であっても、対象プログラム30の稼動の開始から当該平均の稼動時間が経過した場合には、そのトレース情報の収集を終了する。これにより、トレース情報の過剰な収集を防ぎ、情報処理装置10の処理能力を維持することができる。
ファイル入出力頻度検出部480は、障害発生判断部440により障害が発生したと判断されたことを条件として、例えば定期的に、対象プログラム30を実行する当該情報処理装置10のファイル入出力の頻度を検出する。そして、トレース情報収集部460は、トレース情報を収集している場合であっても、ファイル入出力の頻度が予め定められた基準の頻度を超えた場合には、そのトレース情報の収集を終了する。これにより、本来の処理によりファイル入出力が頻繁に行われている場合には情報処理装置10のファイル入出力の処理能力を維持し、当該本来の処理を効率的に実行させることができる。
中央処理装置使用率検出部490は、障害発生判断部440により障害が発生したと判断されたことを条件として、例えば定期的に、対象プログラム30を実行する情報処理装置10の中央処理装置1000の使用率を検出する。そして、トレース情報収集部460はトレース情報を収集している場合であっても、中央処理装置1000の使用率が予め定められた基準の使用率を超えた場合には、そのトレース情報の収集を終了する。これにより、本来の処理により中央処理装置1000の処理能力が必要とされている場合には中央処理装置1000の処理能力を維持し、当該本来の処理を効率的に実行させることができる。
図5は、トレース情報収集システム40がトレース情報の収集を開始する処理のフローチャートを示す。停止している対象プログラム30が起動して稼動を開始すると(S500)、まず、履歴記録部20は、対象プログラム30が稼動を開始した旨を履歴として記録する(S510)。次に、スコア算出部430は、対象プログラム30に障害が発生した可能性を示すスコアを算出する(S520)。スコア算出部430により算出されたスコアが予め定められた基準値以下の場合には(S530:NO)、トレース情報収集システム40は、対象プログラム30による通常の処理を開始させ(S580)、その処理過程においてトレース情報を収集しない。
一方、障害発生判断部440は、スコア算出部430により算出されたスコアが予め定められた基準値よりも高いことを条件として(S530:YES)、対象プログラム30の前回の稼動に障害が発生したと判断する(S540)。障害発生判断部440により障害が発生したと判断されたことに応答して、まず、動作パラメータ収集部450は、対象プログラム30に与える動作パラメータを収集する(S550)。次に、トレース情報収集部460は、トレース情報を収集させるための設定変更を行う(S560)。また、平均稼動時間算出部470は、履歴記録部20に記録された対象プログラム30の稼動の履歴に基づいて、対象プログラム30の稼動開始から停止までの平均稼動時間を算出する(S570)。そして、トレース情報収集システム40は、対象プログラム30による通常の処理を開始させ(S580)、トレース情報収集部460は、その処理過程においてトレース情報を収集する。
図6は、図5のS520における処理の詳細を示すフローチャートである。稼動停止時間比率算出部400は、対象プログラム30が稼動及び停止を繰り返す各々の繰り返し毎に、稼動停止時間比率を算出する(S600)。次に、類似度算出部410は、各々の稼動停止時間比率の確率分布に基づいて、その標準偏差を算出する(S610)。
そして、類似度算出部410は、算出した標準偏差に基づいて、対象プログラム30の前回の稼動及び停止における稼動停止時間比率の偏りを示す値を、動作パターンの類似度を示す指標値として算出する(S620)。例えば、類似度算出部410は、前回の稼動及び停止における稼動停止時間比率の偏差値を求め、前回以前の確率分布における偏差値の中央値からの差分の絶対値を求める。これに代えて、類似度算出部410は、前回の稼動及び停止における稼動停止時間比率の、前回以前の確率分布に対するカイ2乗検定値を求めてもよい。
スコア算出部430は、この値を、対象プログラム30に障害が発生した可能性を示すスコアとする。この値は、対象プログラム30が前回に稼動及び停止した動作パターンが、対象プログラム30が前回以前に稼動及び停止した動作パターンに類似する程度を示す類似度を示すパラメータである。この値がより高い場合には、前回の稼動及び停止における稼動停止時間比率の偏りがより高くなるのであるから、類似度はより低くなる。即ち、スコア算出部430により算出されるスコアは、類似度算出部410により判断された類似度がより低い場合にはより高い値をとる。
これにより、障害発生判断部440は、類似度算出部410により算出された類似度が基準の類似度よりも低いことを条件として、対象プログラム30の前回の稼動に障害が発生したと判断することができる。
続いて、稼動時間偏差値算出部420は、対象プログラム30が稼動及び停止を繰り返す各々の繰り返しにおける稼動時間の確率分布に基づいて、その標準偏差を算出する(S630)。そして、稼動時間偏差値算出部420は、算出した標準偏差に基づいて、対象プログラム30の前回の稼動における稼動時間の偏りを示す値を算出する(S640)。例えば、稼動時間偏差値算出部420は、前回の稼動時間の偏差値を求め、前回以前の稼動時間の確率分布における偏差値の中央値からの差分の絶対値を求めてもよい。そして、スコア算出部430は、求めた値をスコアに加算する。
これにより、類似度によっては障害の判断が困難な場合であっても、障害発生判断部440は、稼動時間の偏りを示す値が基準の値より高いことを条件として、当該障害が発生したと判断することができる。
続いて、スコア算出部430は、対象プログラム30を前回停止させた停止手続が即時停止手続であるか否かを判断する(S650)。即時停止手続であれば(S650:YES)、スコア算出部430は、所定のポイントを上記のスコアに加点する(S660)。即ち、スコア算出部430により算出されるスコアは、対象プログラム30を前回停止させた停止手続が即時停止手続である場合に、完了待停止手続である場合と比較してより高い値をとる。
これにより、類似度や稼動時間の偏りによっても障害の判断が困難な場合であっても、障害発生判断部440は、前回の停止手続が即時停止手続であることを条件として、当該障害が発生したと判断することができる。
更に、スコア算出部430は、その即時停止手続において中断した処理の数に応じたポイントをそのスコアに加点する(S670)。これは、並行して実行する処理の数が多い時には、これらの処理の複合的な要因で障害が発生する可能性が高まることが推測されるからである。これにより、停止手続の種類によっても障害の判断が困難な場合であっても、障害発生判断部440は、即時停止手続により中断した処理の数が基準の数より多いことを条件として当該障害が発生したと判断できる。
そして、スコア算出部430は、対象プログラム30が前回停止してから稼動するまでに経過した停止時間を求め、その停止時間の1時間に対する逆数をそのスコアに乗じる(S680)。即ち、定時間が1時間未満の場合にはスコアが増加し、1時間以上の場合にはスコアが減少する。これにより、停止手続の種類等によっても障害の判断が困難な場合であっても、障害発生判断部440は、対象プログラム30が前回停止してから稼動するまでの停止時間が基準の停止時間より短いことを条件として、障害が発生したと更に判断できる。
このように、本図に示す処理によれば、対象プログラム30の稼動に障害が発生した可能性を示すスコアを、動作パターンの類似度、稼動時間の偏り、停止手続の種類、及び前回の停止時間に基づく簡単な計算により求めることができる。これにより、障害発生判断部440は、対象プログラム30に障害が発生して早急に再起動が必要な緊急事態においても、再起動処理その他本来の処理を遅延させること無く、障害発生の有無を迅速に判断できる。
なお、スコアの算出には、本図に示した処理の全てが必須ではなく、本図に示す一部の処理を除外してスコアを算出してもよい。即ち例えば、スコア算出部430は、稼動停止時間比率の偏りと、停止手続が即時停止手続であるか否かとに基づいて、スコアを算出し、稼動時間の偏りをスコア算出の要素から除外してもよい。このような一部の処理を除外した算出方法も、本発明の技術的範囲に含まれる。
図7は、トレース情報収集システム40がトレース情報の収集を終了する処理のフローチャートを示す。トレース情報収集システム40は、トレース情報を収集している場合に、以下の処理を例えば定期的に行う。まず、トレース情報収集部460は、対象プログラム30の稼動の開始から平均の稼動時間が経過した場合に(S700:YES)、そのトレース情報の収集を終了する(S730)。
中央処理装置使用率検出部490は、対象プログラム30を実行する情報処理装置10の中央処理装置1000の使用率を検出し、トレース情報収集部460は、その使用率が予め定められた基準の使用率を超えた場合に(S710:YES)、トレース情報の収集を終了する(S730)。ファイル入出力頻度検出部480は、対象プログラム30を実行する当該情報処理装置10のファイル入出力の頻度を検出し、トレース情報収集部460は、その頻度が予め定められた基準の頻度を超えた場合に(S720:YES)、トレース情報の収集を終了する(S730)。それ以外の場合にはトレース情報の収集を継続する(S740)。
なお、本図の例に代えて、トレース情報収集部460は、トレース情報の収集を開始してから予め定められた期間が経過した場合に一律にトレース情報の収集を終了してもよいし、利用者から指示を受けるまでトレース情報を収集し続けてもよい。これらの場合は、トレース情報の収集中に終了を判断するために何らかの処理を行う必要はなく、対象プログラム30本来の処理をより効率的に実行させることができる。
以上、本実施例に係るトレース情報収集システム40によれば、プログラムから明示的なエラーコード等が得られない場合であっても、プログラムの実行中に発生した障害を適切に検出して、障害解析に必要な情報を自動的に収集することができる。これにより、従来人手で行っていた設定変更を不要とし、運用中のコンピュータシステムにおける障害対応の効率をこれまでより向上させることができる。更に、障害の検出判断には様々なパラメータを用いることで、障害検出の精度を高めることができる。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
図1は、情報処理装置10の機能を機能ブロックに分類して示す。 図2は、履歴記録部20のデータ構造の一例を示す。 図3は、対象プログラム30が稼動及び停止する動作パターンの一例を示す。 図4は、トレース情報収集システム40の機能を機能ブロックに分類して示す。 図5は、トレース情報収集システム40がトレース情報の収集を開始する処理のフローチャートを示す。 図6は、図5のS520における処理の詳細を示すフローチャートである。 図7は、トレース情報収集システム40がトレース情報の収集を終了する処理のフローチャートを示す。
符号の説明
10 情報処理装置
20 履歴記録部
25 トレース記録部
30 対象プログラム
40 トレース情報収集システム
400 稼動停止時間比率算出部
410 類似度算出部
420 稼動時間偏差値算出部
430 スコア算出部
440 障害発生判断部
450 動作パラメータ収集部
460 トレース情報収集部
470 平均稼動時間算出部
480 ファイル入出力頻度検出部
490 中央処理装置使用率検出部
1000 中央処理装置

Claims (13)

  1. プログラムの処理経過を示すトレース情報を収集するトレース情報収集システムであって、
    トレース情報の生成対象である対象プログラムの稼動及び停止の履歴を記録する履歴記録部と、
    停止している前記対象プログラムが稼動を開始する場合に、前記対象プログラムが前回に稼動及び停止した動作パターンが、前記対象プログラムが前回以前に稼動及び停止した動作パターンに類似する程度を示す類似度を算出する類似度算出部と、
    前記類似度算出部により算出された前記類似度が基準の類似度よりも低いことを条件として、前記対象プログラムの前回の稼動に障害が発生したと判断する障害発生判断部と、
    前記障害が発生したと判断されたことに応答して、前記障害が発生したと判断されていない場合には収集していないトレース情報を前記対象プログラムから収集するトレース情報収集部と
    を備えるトレース情報収集システム。
  2. 前記対象プログラムが稼動及び停止を繰り返す各々の繰り返し毎に、前記対象プログラムが停止してから稼動するまでに経過した停止時間、及び、稼動してから停止するまでに経過した稼動時間の比率である稼動停止時間比率を算出する稼動停止時間比率算出部を更に備え、
    前記類似度算出部は、前記繰り返しの各々における前記稼動停止時間比率の確率分布における、前回の稼動及び停止の前記稼動停止時間比率の偏りを示す値を、前記類似度を示す情報として算出し、
    前記障害発生判断部は、前記類似度算出部により算出された当該偏りを示す値が、基準の値より高い場合に、前記類似度が基準の類似度よりも低いと判断する
    請求項1記載のトレース情報収集システム。
  3. 前記障害発生判断部は、前記対象プログラムが前回停止してから稼動するまでに経過した停止時間が基準の停止時間より短いことを条件として、前記障害が発生したと更に判断する
    請求項1記載のトレース情報収集システム。
  4. 前記履歴記録部は、前記対象プログラムが停止される場合に、更に、前記対象プログラムを停止させる停止手続の種類を記録し、
    前記障害発生判断部は、前記対象プログラムを前回停止させた停止手続が、既に開始した処理を中断して停止させる即時停止手続であることを条件として、前記障害が発生したと判断し、当該停止手続が、既に開始した処理を完了させてから停止させる完了待停止手続であることを条件として、前記障害が発生したと判断しない
    請求項1記載のトレース情報収集システム。
  5. 前記類似度判断部により判断された類似度がより低い場合により高い値をとり、前記対象プログラムを前回停止させた停止手続が前記即時停止手続である場合に前記完了待停止手続である場合と比較してより高い値をとり、かつ、前記対象プログラムが前回停止してから稼動するまでに経過した停止時間が基準の停止時間より短い場合により高い値をとる、前記対象プログラムに前記障害が発生した可能性を示すスコアを算出するスコア算出部を更に備え、
    前記障害発生判断部は、前記スコア算出部により算出されたスコアが予め定められた基準値よりも高いことを条件として、前記障害が発生したと判断し、当該スコアが当該基準値以下であることを条件として、前記障害が発生したと判断しない
    請求項4記載のトレース情報収集システム。
  6. 前記障害発生判断部は、前記対象プログラムを前回停止させた停止手続が前記即時停止手続であって、かつ、中断した処理の数が基準の数より多いことを更に条件として、前記障害が発生したと判断する
    請求項4記載のトレース情報収集システム。
  7. 前記履歴記録部に記録された稼動及び停止の履歴に基づいて、前記対象プログラムが稼動及び停止を繰り返す各々の繰り返しにおける稼動時間の長さの確率分布における、前記対象プログラムが前回に稼動を開始してから停止するまでに経過した稼動時間の偏りを示す値を算出する稼動時間偏差算出を更に備え、
    前記障害発生判断部は、前記稼動時間偏差算出部によって算出された当該偏りを示す値が基準の値より高い場合に、更に、前記障害が発生したと判断する
    請求項1記載のトレース情報収集システム。
  8. 前記障害発生判断部により前記障害が発生したと判断されたことに応答して、前記対象プログラムに与える動作パラメータを収集する動作パラメータ収集部
    を更に備える請求項1記載のトレース情報収集システム。
  9. 前記履歴記録部に記録された稼動の履歴に基づいて、前記対象プログラムの稼動開始から停止までの平均の稼動時間を算出する平均稼動時間算出部を更に備え、
    前記トレース情報収集部は、前記障害が発生したと判断されたことに応答して、前記障害が発生したと判断されていない場合には収集しないトレース情報を収集し、前記対象プログラムの稼動の開始から前記平均の稼動時間が経過した場合に、当該トレース情報の収集を終了する
    請求項1記載のトレース情報収集システム。
  10. 前記対象プログラムを実行する情報処理装置のファイル入出力の頻度を検出するファイル入出力使用率検出部を更に備え、
    前記トレース情報収集部は、前記トレース情報を収集している場合であっても、前記ファイル入出力の頻度が予め定められた基準の頻度を超えた場合には、当該トレース情報の収集を終了する
    請求項1記載のトレース情報収集システム。
  11. 前記対象プログラムを実行する情報処理装置の中央処理装置の使用率を検出する中央処理装置使用率検出部を更に備え、
    前記トレース情報収集部は、前記トレース情報を収集している場合であっても、前記中央処理装置の使用率が予め定められた基準の使用率を超えた場合には、当該トレース情報の収集を終了する
    請求項1記載のトレース情報収集システム。
  12. プログラムの処理経過を示すトレース情報を収集するトレース情報収集方法であって、
    トレース情報の生成対象である対象プログラムの稼動及び停止の履歴を記録する履歴記録段階と、
    停止している前記対象プログラムが稼動を開始する場合に、前記対象プログラムが前回に稼動及び停止した動作パターンが、前記対象プログラムが前回以前に稼動及び停止した動作パターンに類似する程度を示す類似度を算出する類似度算出段階と、
    前記類似度算出部により算出された前記類似度が基準の類似度よりも低いことを条件として、前記対象プログラムの前回の稼動に障害が発生したと判断する障害発生判断段階と、
    前記障害が発生したと判断されたことに応答して、前記障害が発生したと判断されていない場合には収集していないトレース情報を前記対象プログラムから収集するトレース情報収集段階と
    を備えるトレース情報収集方法。
  13. プログラムの処理経過を示すトレース情報を収集するトレース情報収集システムとして、情報処理装置を機能させるトレース情報収集プログラムであって、
    前記情報処理装置を、
    トレース情報の生成対象である対象プログラムの稼動及び停止の履歴を記録する履歴記録部と、
    停止している前記対象プログラムが稼動を開始する場合に、前記対象プログラムが前回に稼動及び停止した動作パターンが、前記対象プログラムが前回以前に稼動及び停止した動作パターンに類似する程度を示す類似度を算出する類似度算出部と、
    前記類似度算出部により算出された前記類似度が基準の類似度よりも低いことを条件として、前記対象プログラムの前回の稼動に障害が発生したと判断する障害発生判断部と、
    前記障害が発生したと判断されたことに応答して、前記障害が発生したと判断されていない場合には収集していないトレース情報を前記対象プログラムから収集するトレース情報収集部と
    して機能させるトレース情報収集プログラム。
JP2005013600A 2005-01-21 2005-01-21 トレース情報収集システム、トレース情報収集方法、及びトレース情報収集プログラム Expired - Fee Related JP4114879B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005013600A JP4114879B2 (ja) 2005-01-21 2005-01-21 トレース情報収集システム、トレース情報収集方法、及びトレース情報収集プログラム
US11/337,377 US7574626B2 (en) 2005-01-21 2006-01-23 Trace information collecting system, method and program
US12/175,744 US20080288826A1 (en) 2005-01-21 2008-07-18 Trace information collecting system and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005013600A JP4114879B2 (ja) 2005-01-21 2005-01-21 トレース情報収集システム、トレース情報収集方法、及びトレース情報収集プログラム

Publications (2)

Publication Number Publication Date
JP2006202076A true JP2006202076A (ja) 2006-08-03
JP4114879B2 JP4114879B2 (ja) 2008-07-09

Family

ID=36698473

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005013600A Expired - Fee Related JP4114879B2 (ja) 2005-01-21 2005-01-21 トレース情報収集システム、トレース情報収集方法、及びトレース情報収集プログラム

Country Status (2)

Country Link
US (2) US7574626B2 (ja)
JP (1) JP4114879B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008060713A (ja) * 2006-08-29 2008-03-13 Fuji Xerox Co Ltd 情報処理装置およびプログラム
JPWO2012101759A1 (ja) * 2011-01-25 2014-06-30 富士通株式会社 プロセッサ処理方法、およびプロセッサシステム
US11449378B2 (en) 2019-05-31 2022-09-20 Fujitsu Limited Information processing apparatus and log control method
WO2023162243A1 (ja) * 2022-02-28 2023-08-31 日本電信電話株式会社 障害情報検出装置、障害情報検出方法、および障害情報検出プログラム

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7590892B2 (en) * 2005-05-16 2009-09-15 Texas Instruments Incorporated Method and system of profiling real-time streaming channels
US8086904B2 (en) * 2006-07-28 2011-12-27 Apple Inc. Event-based setting of process tracing scope
US8116179B2 (en) * 2006-07-28 2012-02-14 Apple Inc. Simultaneous viewing of multiple tool execution results
US7739553B2 (en) * 2007-05-31 2010-06-15 Microsoft Corporation System crash analysis using path tracing technologies
US7698602B2 (en) * 2007-06-13 2010-04-13 International Business Machines Corporation Systems, methods and computer products for trace capability per work unit
US8776029B2 (en) 2011-03-23 2014-07-08 Zerodee, Inc. System and method of software execution path identification
US10042737B2 (en) 2016-08-31 2018-08-07 Microsoft Technology Licensing, Llc Program tracing for time travel debugging and analysis
US10031834B2 (en) 2016-08-31 2018-07-24 Microsoft Technology Licensing, Llc Cache-based tracing for time travel debugging and analysis
US10031833B2 (en) 2016-08-31 2018-07-24 Microsoft Technology Licensing, Llc Cache-based tracing for time travel debugging and analysis
US10310963B2 (en) 2016-10-20 2019-06-04 Microsoft Technology Licensing, Llc Facilitating recording a trace file of code execution using index bits in a processor cache
US10324851B2 (en) 2016-10-20 2019-06-18 Microsoft Technology Licensing, Llc Facilitating recording a trace file of code execution using way-locking in a set-associative processor cache
US10489273B2 (en) 2016-10-20 2019-11-26 Microsoft Technology Licensing, Llc Reuse of a related thread's cache while recording a trace file of code execution
US10310977B2 (en) 2016-10-20 2019-06-04 Microsoft Technology Licensing, Llc Facilitating recording a trace file of code execution using a processor cache
US10540250B2 (en) 2016-11-11 2020-01-21 Microsoft Technology Licensing, Llc Reducing storage requirements for storing memory addresses and values
US10318332B2 (en) 2017-04-01 2019-06-11 Microsoft Technology Licensing, Llc Virtual machine execution tracing
US10296442B2 (en) 2017-06-29 2019-05-21 Microsoft Technology Licensing, Llc Distributed time-travel trace recording and replay
US10459824B2 (en) 2017-09-18 2019-10-29 Microsoft Technology Licensing, Llc Cache-based trace recording using cache coherence protocol data
US10558572B2 (en) 2018-01-16 2020-02-11 Microsoft Technology Licensing, Llc Decoupling trace data streams using cache coherence protocol data
US11907091B2 (en) 2018-02-16 2024-02-20 Microsoft Technology Licensing, Llc Trace recording by logging influxes to an upper-layer shared cache, plus cache coherence protocol transitions among lower-layer caches
US10496537B2 (en) 2018-02-23 2019-12-03 Microsoft Technology Licensing, Llc Trace recording by logging influxes to a lower-layer cache based on entries in an upper-layer cache
US10642737B2 (en) 2018-02-23 2020-05-05 Microsoft Technology Licensing, Llc Logging cache influxes by request to a higher-level cache
CN111651937B (zh) * 2020-06-03 2023-07-25 苏州大学 变工况下类内自适应轴承故障诊断方法
CN112783719B (zh) * 2020-12-31 2023-02-28 杭州趣链科技有限公司 监控数据获取方法、服务器、系统及计算机可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01231160A (ja) * 1988-03-11 1989-09-14 Hitachi Ltd 電子計算機システムの運転装置
JPH1078894A (ja) * 1996-09-03 1998-03-24 Hitachi Ltd 計算機システムの障害回復支援方法
JPH1091581A (ja) * 1996-09-17 1998-04-10 Nec Software Ltd トランザクション処理システム
JP2002132543A (ja) * 2000-10-25 2002-05-10 Hitachi Ltd 計算機システムの管理方法
JP2002278804A (ja) * 2001-03-15 2002-09-27 Nec Software Chubu Ltd ジョブ実行監視方法およびプログラム
JP2003122599A (ja) * 2001-10-11 2003-04-25 Hitachi Ltd 計算機システムおよび計算機システムにおけるプログラム実行監視方法
JP2004164271A (ja) * 2002-11-13 2004-06-10 Nec System Technologies Ltd ジョブ実行監視方法及びプログラム
JP2004362140A (ja) * 2003-06-03 2004-12-24 Hitachi Ltd 運用監視方法及び実施システム並びに処理プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2762816B2 (ja) 1992-02-14 1998-06-04 日本電気株式会社 トランザクション実行トレース情報採取方式
JP2001231160A (ja) 2000-02-15 2001-08-24 Nec Corp 電源供給回路の故障検出装置及び故障検出方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01231160A (ja) * 1988-03-11 1989-09-14 Hitachi Ltd 電子計算機システムの運転装置
JPH1078894A (ja) * 1996-09-03 1998-03-24 Hitachi Ltd 計算機システムの障害回復支援方法
JPH1091581A (ja) * 1996-09-17 1998-04-10 Nec Software Ltd トランザクション処理システム
JP2002132543A (ja) * 2000-10-25 2002-05-10 Hitachi Ltd 計算機システムの管理方法
JP2002278804A (ja) * 2001-03-15 2002-09-27 Nec Software Chubu Ltd ジョブ実行監視方法およびプログラム
JP2003122599A (ja) * 2001-10-11 2003-04-25 Hitachi Ltd 計算機システムおよび計算機システムにおけるプログラム実行監視方法
JP2004164271A (ja) * 2002-11-13 2004-06-10 Nec System Technologies Ltd ジョブ実行監視方法及びプログラム
JP2004362140A (ja) * 2003-06-03 2004-12-24 Hitachi Ltd 運用監視方法及び実施システム並びに処理プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008060713A (ja) * 2006-08-29 2008-03-13 Fuji Xerox Co Ltd 情報処理装置およびプログラム
JPWO2012101759A1 (ja) * 2011-01-25 2014-06-30 富士通株式会社 プロセッサ処理方法、およびプロセッサシステム
JP5704176B2 (ja) * 2011-01-25 2015-04-22 富士通株式会社 プロセッサ処理方法、およびプロセッサシステム
US11449378B2 (en) 2019-05-31 2022-09-20 Fujitsu Limited Information processing apparatus and log control method
WO2023162243A1 (ja) * 2022-02-28 2023-08-31 日本電信電話株式会社 障害情報検出装置、障害情報検出方法、および障害情報検出プログラム

Also Published As

Publication number Publication date
US20080288826A1 (en) 2008-11-20
US20060168481A1 (en) 2006-07-27
JP4114879B2 (ja) 2008-07-09
US7574626B2 (en) 2009-08-11

Similar Documents

Publication Publication Date Title
JP4114879B2 (ja) トレース情報収集システム、トレース情報収集方法、及びトレース情報収集プログラム
JP2004171249A (ja) データベースのバックアップ実行判断方法
JP2010086364A (ja) 情報処理装置、動作状態監視装置および方法
US20090083580A1 (en) Techniques for Background Testing a Hard Disk Drive
WO2005017735A1 (ja) ディスクアレイ装置におけるボトルネックを検出するシステムおよびプログラム
CN110704287B (zh) Linux系统下RAID卡异常日志收集方法、系统及存储介质
JP2008310748A (ja) タスク実行時間記録装置、タスク実行時間記録方法、及びタスク実行時間記録用プログラム
US20090138740A1 (en) Method and computer device capable of dealing with power fail
CN111949368A (zh) 应用程序控制方法及装置
JP2016224883A (ja) 異常検出方法、情報処理装置および異常検出プログラム
CN115470059A (zh) 一种磁盘检测方法、装置、设备及存储介质
US20150286548A1 (en) Information processing device and method
EP1672496A2 (en) Context save method, information processor and interrupt generator
CN117312092A (zh) 多核mcu的监控方法、装置、车辆及可读存储介质
US20070101034A1 (en) Monitor method for computer system
CN112035322A (zh) Jvm监控方法及装置
CN103092710A (zh) 云计算操作系统中一种高可用虚拟机运行方法
JP2001331348A (ja) プロセスメモリ消費量増加傾向検出方式
JP2002358170A (ja) ディスク記憶装置、同ディスク記憶装置を備えた計算機システム及び同計算機システムにおけるリトライ処理時のエラー通知方法
CN113127245B (zh) 一种系统管理中断的处理方法、系统及装置
US8359220B2 (en) Technical support routing among members of a technical support group
JP5365273B2 (ja) 情報処理システム、監視方法及び監視プログラム
CN107357684A (zh) 一种内核故障重启方法和装置
CN113190278B (zh) 一种多场景故障处理方法、系统及介质
JPH11259160A (ja) コンピュータの起動方法、コンピュータ、起動処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071031

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20071207

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20071221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080226

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080408

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20080409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080411

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees