JP2011159234A - 障害対応システム及び障害対応方法 - Google Patents

障害対応システム及び障害対応方法 Download PDF

Info

Publication number
JP2011159234A
JP2011159234A JP2010022471A JP2010022471A JP2011159234A JP 2011159234 A JP2011159234 A JP 2011159234A JP 2010022471 A JP2010022471 A JP 2010022471A JP 2010022471 A JP2010022471 A JP 2010022471A JP 2011159234 A JP2011159234 A JP 2011159234A
Authority
JP
Japan
Prior art keywords
failure
information
computer
function unit
countermeasure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010022471A
Other languages
English (en)
Inventor
Makoto Nishi
誠 西
Ryoji Sato
良二 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information Systems Ltd
Original Assignee
Hitachi Information Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information Systems Ltd filed Critical Hitachi Information Systems Ltd
Priority to JP2010022471A priority Critical patent/JP2011159234A/ja
Publication of JP2011159234A publication Critical patent/JP2011159234A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】コンピュータ障害を予防及び自動的に修復すること。
【解決手段】障害予知情報による障害を予防するためのコマンドジョブ又はバッチジョブを含む予防データと障害後情報による障害を回復するためのコマンドジョブ又はバッチジョブからなる対策データとを格納する障害診断テーブル部60を設け、解析機能部20が、コンピュータ10から収集した障害イベントリが障害予知情報か障害後情報かを判定し、予防機能部30が、前記解析機能部20により障害イベント情報と判定されたとき、障害診断テーブル部60から障害予知情報に対応した予防データを取得して表示部に表示させ、対策機能部40が、障害イベントリが障害後情報と判定されたとき、障害診断テーブル部60から対策データを取得し、取得した対策データに含まれるコマンドジョブ又はバッチジョブをコンピュータに対して実行させる障害対応システム。
【選択図】図1

Description

本発明は、コンピュータに発生する障害を予防及び障害を自動的に修復することができる障害対応システム並びにこれらをすることができる障害対応方法に関する。
一般に複数のコンピュータから構成されるコンピュータシステムにおける障害は、アプリケーションソフトウェア自体に起因するものと、コンピュータが接続されるサーバやホストコンピュータやネットワークやミドルウェアやデータセンタ設備などのアプリケーションを動かす環境であるインフラに起因するものもあり、この障害の原因を追及することは非常に困難な作業である。このため従来技術においては、コンピュータに障害が発生した場合、この障害発生を検知し、管理者に通報する障害検知機能や、発生した障害に対応する過去の障害履歴に含まれる解決策を管理者に表示する技術が下記特許文献1に記載されている。
特開2004−38535号公報
前述の従来技術は、障害発生を管理者に通知することや障害に対する解決策を管理者に通知する機能は備えるものの、障害を予防することや障害を自動的に修復することができないという課題があった。
本発明の目的は、前述の従来技術による不具合を除去することであり、コンピュータにおいて発生する障害を予防及び自動的に修復することができる障害対応システム及び障害対応方法を提供することである。
前記目的を達成するために請求項1記載の発明は、情報を表示する表示部を有し、障害が発生する前に通知される障害予知情報及び障害が発生した後に通知される障害後情報を障害イベントリとしてメモリに格納するコンピュータの障害を修復することができる障害対応システムであって、前記障害予知情報による障害を予防するためのコマンドジョブ又はバッチジョブを含む予防データと前記障害後情報による障害を回復するためのコマンドジョブ又はバッチジョブからなる対策データとを格納する障害診断テーブル部と、前記コンピュータから通知される障害イベントリを前記メモリから収集し、前記収集した障害イベントリが障害予知情報か障害後情報かを判定する解析機能部と、前記解析機能部により障害イベントリが障害予知情報と判定したとき、前記障害診断テーブル部から前記判定した障害予知情報に対応した予防データを取得し、前記コンピュータの表示部に表示する予防機能部と、前記前記解析機能部により障害イベントリが障害後情報と判定したとき、前記障害診断テーブル部から前記判定した障害後情報に対応した対策データを取得し、前記取得した対策データに含まれるコマンドジョブ又はバッチジョブをコンピュータに対して実行する対策機能部とを備えることを特徴とする。
請求項2記載の発明は、前記予防機能部が、前記取得した予防データに含まれるコマンドジョブ又はバッチジョブをコンピュータに対して実行し、前記実行結果を表示部に表示することを特徴とする。
請求項3記載の発明は、前記コンピュータが、前記コマンドジョブ又はバッチジョブの実行する際の承認を得る機能を有し、前記対策機能部が、前記承認を得た後にコマンドジョブ又はバッチジョブを実行することを特徴とする。
請求項4記載の発明は、情報を表示する表示部を有し、障害が発生する前に通知される障害予知情報及び障害が発生した後に通知される障害後情報を障害イベントリとしてメモリに格納するコンピュータと、前記コンピュータの障害を修復するサーバとを備えるコンピュータシステムの障害対応方法であって、前記サーバが、前記障害予知情報による障害を予防するためのコマンドジョブ又はバッチジョブを含む予防データと前記障害後情報による障害を回復するためのコマンドジョブ又はバッチジョブからなる対策データとを格納する障害診断テーブル部と、前記コンピュータから通知される障害イベントリを前記メモリから収集し、前記収集した障害イベントリが障害予知情報か障害後情報かを判定する解析機能部と、前記解析機能部により障害イベントリが障害予知情報と判定したとき、前記障害診断テーブル部から前記判定した障害予知情報に対応した予防データを取得し、前記コンピュータの表示部に表示する予防機能部と、前記前記解析機能部により障害イベントリが障害後情報と判定したとき、前記障害診断テーブル部から前記判定した障害後情報に対応した対策データを取得し、前記取得した対策データに含まれるコマンドジョブ又はバッチジョブをコンピュータに対して実行する対策機能部とを有し、前記解析機能部に、前記コンピュータから通知される障害イベントリを前記メモリから収集させ、前記収集した障害イベントリが障害予知情報か障害後情報かを判定させる工程と、前記予防機能部に、前記解析機能部により障害イベントリが障害予知情報と判定したとき、前記障害診断テーブル部から前記判定した障害予知情報に対応した予防データを取得させ、前記コンピュータの表示部に表示させる工程と、前記対策機能部に、前記前記解析機能部により障害イベントリが障害後情報と判定したとき、前記障害診断テーブル部から前記判定した障害後情報に対応した対策データを取得させ、前記取得した対策データに含まれるコマンドジョブ又はバッチジョブをコンピュータに対して実行させることを特徴とする。
請求項5記載の発明は、前記予防機能部に、前記取得した予防データに含まれるコマンドジョブ又はバッチジョブをコンピュータに対して実行させ、前記実行結果を表示部に表示させる工程を含むことを特徴とする。
請求項6記載の発明は、前記コンピュータが、前記コマンドジョブ又はバッチジョブの実行する際の承認を得る機能を有し、前記対策機能部に、前記承認を得た後にコマンドジョブ又はバッチジョブを実行させることを特徴とする。
本発明による障害対応システム及び障害対応方法は、前記解析機能部に、前記コンピュータから通知される障害イベントリを収集させ、この収集した障害イベントリが障害予知情報か障害後情報かを判定させる工程と、前記予防機能部に、前記解析機能部により障害イベントリが障害予知情報と判定したとき、前記障害診断テーブル部から前記判定した障害予知情報に対応した予防データを取得させて前記コンピュータの表示部に表示させる工程と、前記対策機能部に、前記前記解析機能部により障害イベントリが障害後情報と判定したとき、前記障害診断テーブル部から前記判定した障害後情報に対応した対策データを取得させ、前記取得した対策データに含まれるコマンドジョブ又はバッチジョブをコンピュータに対して実行させることによって、コンピュータにおいて発生する障害を予防及びを自動的に修復することができる。
本発明の障害対応システムが適用されるコンピュータシステムの全体図 本発明の実施形態を示す障害対応システムの構成図 本発明の実施形態を示す障害診断テーブル部の構成図 本発明の実施形態を示す障害解析手順を示すフロー図 本発明の実施形態を示す障害予防手順を示すフロー図 本発明の実施形態を示す障害対策手順を示すフロー図 本発明の実施形態による障害登録手順を示すフロー図
以下、本発明による障害対応システム及び障害対応方法の一実施形態を図面を参照して詳細に説明する。
まず、本発明による障害対応システムは、図1に示す如く、ネットワークを介して接続された複数のコンピュータ10a〜10c及びこの複数のコンピュータ10a〜10cを外部と接続するルータ11とを有するコンピュータシステム200に接続されたサーバ300の内部に設けられ、このサーバ300は、図示しない一般の業務処理用の処理部やデータ記憶部の他に、障害対応システムを構成するヘルプデスク部100と、このヘルプデスク部100に接続される障害診断テーブル部60とを備える。前記各コンピュータ10a〜10cは、CPU(Central Processing Unit)、メインメモリ、磁気ディスク装置等の記憶手段、表示部、キーボード等の入出金機器、各種インターフェース機器、基本OS(オペレーティングシステム)及び各種ソフトウェア、障害が発生する前に通知される障害予知情報及び障害が発生した後に通知される障害後情報とを障害イベントリとして登録するメモリとを備える。
このヘルプデスク部100は、図2に示す如く、例えばコンピュータ10aから発せられる障害情報を受け、障害診断テーブル部60に格納した過去の障害履歴情報を格納した障害診断テーブル部60を参照して障害情報を解析する解析機能部20と、同様に障害履歴情報を参照して障害に対する予防を行う予防機能部30と、障害に対するエラー回復の対策を行う対策機能部40と、これら障害に対する解析と予防と対策の各情報を障害診断テーブル部60に格納する登録機能部50とから構成され、前記障害監視データは、障害が発生する前に通知される障害予知情報と、障害が発生した後に通知される障害後情報とに大別される。
前記障害診断テーブル部60は、図3に示す如く、前記過去の障害履歴情報毎に付与された障害識別番号(以下、障害IDという。)と、この障害IDに対応した障害監視データと、障害内容を診断するための診断データと、この診断結果に応じた障害の発生を予防するための予防データと、発生した障害によるエラー回復を行うための対策データとを格納し、例えば図示の例における障害履歴情報は、障害ID「01」の障害監視データが「しきい値監視1」、診断データが「メモリ使用率超過」、予防データが「メモリ解放バッチ」のバッチジョブであることが格納され、障害ID「21」の障害監視データが「エラーログ1」、診断データが「システムエラー」、対策データが「コンピュータ再起動」のコマンドジョブであることが格納されている。このように本実施形態による障害診断テーブル部60は、障害監視を行うためのデータとしてしきい値を設定し、このしきい値を監視する1番目の診断データがコンピュータ10a〜10cの「メモリ使用率超過」であり、この「メモリ使用率」が所定値を超えたとときの障害の予防策として「メモリ解放バッチ起動」を設定することや、障害監視を行うための監視データとして「エラーログ」を設定し、この「エラーログ」において「システムエラー」が報告されたときの障害の予防策として「PC(コンピュータ)の再起動」であることを設定している。
なお、コマンドジョブとは、コマンド(命令語)によりコンピュータが実行する1単位の仕事を定義したものであり、バッチジョブとは、複数の手順からなる処理において、あらかじめ一連のコマンドの実行手順を登録しておき、自動的に複数コマンドの連続処理を行なう仕事を定義したものである。
[動作]
次に前述のように構成された障害対応システムの動作を図4以降を参照して詳細に説明する。なお、前記コンピュータ10a〜10cは、任意のコンピュータのため、コンピュータ10と記載して説明し、予防データとは、障害予知情報による障害を予防するためのコマンドジョブ又はバッチジョブを含むものとし、対策データとは、障害後情報による障害を回復するためのコマンドジョブ又はバッチジョブを含むものとして説明する。
まず、本実施形態による障害対応システムは、図4に示す如く、コンピュータシステム200の任意のコンピュータ10が現在の自己マシン状態を障害イベントリとしてメモリに登録するステップ101と、ヘルプデスク部100の解析機能部20が、コンピュータ10から前記障害イベントリを収集するステップ102と、この収集したイベトリを障害診断テーブル部60に登録するステップ103と、前記障害診断テーブル部60に同一コンピュータの同一障害イベントリが登録されているかを判定するステップ104と、このステップ104において同一障害イベントリが登録されていないと判定したとき、新たな障害情報として判断し、データを対策機能部40に登録して、後述する対策機能部40の動作に移行するステップ109と、前記ステップ104において同一障害イベントリが登録されていると判定したとき、障害診断テーブル部60に登録されている過去の障害診断データから不随するデータ(図3に示した予防データ又は対策データ)を検索するステップ105と、このステップ105により検索したデータが予防データか対策データかを判定するステップ106と、このステップ106において予防データと判定したとき、検索された予防データをOS別に種別するステップ107と、この種別した予防データを予防機能部30へ登録し、後述する予防機能部30の動作へ移行するステップ108と、前記ステップ106において対策データと判定したとき、検索された対策データをOS別に種別するステップ110と、この種別した対策データを対策機能部40へ登録し、後述する対策機能部40の動作へ移行するステップ111とを実行することによって、コンピュータ10から収集した障害イベントリが同一コンピュータにおける過去の障害イベントリと同一か否かを判定し、同一でないと判定したときには障害データを対策機能部40へ登録し、新たな障害且つ予防データと判定したときに予防データを予防機能部30へ登録し、新たな障害且つ対策データと判定したときに対策データを対策機能部40へ登録するように動作する。
前記ステップ108において新たな障害且つ予防データと判定したとき、本システムは、図5に示す如く、予防機能部30が前記予防データを受信するステップ201と、この予防機能部30が受信した予防データを該当のコンピュータに送信するステップ202と、この送信した予防データによる動作がコンピュータ10のバックグラウンドで実行可能か否かを判定するステップ203と、このステップ203においてバックグラウンドにて動作できないと判定したとき、コンピュータ10の画面上に予防データの内容を表示により通知するステップ211と、ユーザによる対応を待つステップ212とを実行することによって、例えば、予防データが「ハードディスク交換時期通知」の場合、ユーザにハードディスクの交換を促すことができる。
本システムは、前記図4のステップ203においてバックグラウンドにて実行できる予防データと判定したとき、コンピュータ10にて前記予防データを実行するステップ204と、コンピュータ10へ予防完了のメッセージを表示させるステップ205と、この予防動作によりコンピュータの再起動が必要か否かを判定し、再起動が必要ないと判定したときに処理を終了させるステップ206と、このステップ206において再起動が必要と判定したとき、コンピュータ10へ再起動が必要な旨を通知するステップ207と、コンピュータ10の操作者の判断により再起動が承認されたか否かを判定するステップ208と、このステップ208において承認されないと判定したとき、1時間おきにコンピュータ10へ再起動が必要な旨を通知するステップ210と、前記ステップ208において再起動が承認されたと判定したとき、コンピュータ10に再起動を指示して再起動を実行して処理を終了するステップ209とを実行することによって、予防データの実行がコンピュータのバックグラウンドで実行不能な場合は操作者に予防内容を通知し、予防データによる処理を実行した後、バックグラウンドで実行可能且つ再起動が不要な場合は通知せずに処理を終了し、バックグラウンドで実行可能且つ再起動が必要な場合は操作者の承認後にコンピュータを再起動するように障害に対する予防処置を講ずることができる。
本システムは、前記図4の前記ステップ108又は111により対策データが送信されたとき、図6に示す如く、対策機能部40が、対策データを受信するステップ301と、この受信した対策データが新規か否かを障害診断テーブル部60に登録された障害データを参照して判定するステップ302と、このステップ302において新規と判定したとき、コンピュータ10の表示部にエラーを表示させて操作者に通知するステップ313と、ユーザにて障害に対応した処置を講ずるステップ314と、ユーザが対応した対応方法と障害内容の障害イベントリを収集し、登録機能部50へ送信して処理を登録機能部50へ移行するステップ315とを実行することによって、新たな障害に対する対応(予防データ又は対策データ)を障害診断テーブル部60へ登録するように動作する。
前記ステップ302において既存の障害と判定したとき、本システムは、ステップ301により受信した対策データをコンピュータ10へ送信するステップ303と、コンピュータ10の表示画面にエラー通知を行うステップ304と、ユーザが障害に対する対策の実行を承認したか否かを判定し、承認していないと判定したときに前記ステップ304に戻るステップ305と、このステップ305において承認を得たと判定したとき、コマンドジョブ又はバッチジョブによる対策データを実行するステップ306と、このステップ306の完了後にユーザへ際策完了を通知するステップ307と、前記対策データの実行によるコンピュータの再起動が必要か否かをOSのメッセージ等により判定し、再起動が不要と判定したときに処理を終了するステップ308と、このステップ308において再起動が必要と判定したとき、コンピュータ10へ再起動が必要な旨を通知するステップ309と、コンピュータ10の操作者の判断により再起動が承認されたか否かを判定するステップ310と、このステップ310において承認されないと判定したとき、1時間おきにコンピュータ10へ再起動が必要な旨を通知するステップ312と、前記ステップ310において再起動が承認されたと判定したとき、コンピュータ10に再起動を指示して再起動を実行して処理を終了するステップ311とを実行することによって、既存の障害に対する対策データの実行を操作者から承認を得た後に対策データを実行し、再起動が必要な場合は操作者から承認を得た後にコンピュータを再起動することによって、対策データの実行及び必要な再起動を行うことができる。
前記図6のステップ315により対応方法及び障害内容が送信されたとき、本システムは、図7に示す如く、登録機能部50が前記対応方法及び障害内容を基に該当のコンピュータ10から障害イベントリを収集するステップ401と、収集した障害イベントリを基に対策内容を既存の情報から自動的に作成可能か否かを判定するステップ402と、このステップ402において作成可能と判定したとき、障害イベントリを基に対策方法(コマンドジョブ又はバッチジョブ)を作成するステップ403と、この作成した対策方法を障害診断テーブル部60へ登録して処理を終了するステップ404と、前記ステップ402において自動生成不能と判定したとき、システム管理者に対策方法を作成するように通知して作成させるステップ405と、この作成された対策方法を障害診断テーブル部60へ登録して処理を終了するステップ406とを実行することによって、新たな障害に対する予防又は対策データを対策方法して障害診断テーブル部60ら登録することができる。
このように本実施形態による障害対応システム及び方法は、コンピュータ10に発生した障害イベントリに対する予防データ及び対策データを障害診断テーブル部60に格納しおき、解析機能部20が前記障害診断テーブル部60に格納した障害イベントリに対する予防データ及び対策データが格納されているか否かを判定し、予防データ及び対策データが登録されていると判定したときに前記予防データ及び対策データを対策機能部40により実行させることによって、障害に対する予防及び対策を講ずることを自動的に行うことができると共に、前記障害が新たな障害と判定したとき、ユーザが実行した障害イベントリに対する予防データ及び対策データを前記障害診断テーブル部60に登録することができる。
10a コンピュータ、10b コンピュータ、10c コンピュータ、11 ルータ、20 解析機能部、30 予防機能部、40 対策機能部、50 登録機能部、60 障害診断テーブル部、100 ヘルプデスク部、200 コンピュータシステム、300 サーバ。

Claims (6)

  1. 情報を表示する表示部を有し、障害が発生する前に通知される障害予知情報及び障害が発生した後に通知される障害後情報を障害イベントリとしてメモリに格納するコンピュータの障害を修復することができる障害対応システムであって、前記障害予知情報による障害を予防するためのコマンドジョブ又はバッチジョブを含む予防データと前記障害後情報による障害を回復するためのコマンドジョブ又はバッチジョブからなる対策データとを格納する障害診断テーブル部と、前記コンピュータから通知される障害イベントリを前記メモリから収集し、前記収集した障害イベントリが障害予知情報か障害後情報かを判定する解析機能部と、前記解析機能部により障害イベントリが障害予知情報と判定したとき、前記障害診断テーブル部から前記判定した障害予知情報に対応した予防データを取得し、前記コンピュータの表示部に表示する予防機能部と、前記前記解析機能部により障害イベントリが障害後情報と判定したとき、前記障害診断テーブル部から前記判定した障害後情報に対応した対策データを取得し、前記取得した対策データに含まれるコマンドジョブ又はバッチジョブをコンピュータに対して実行する対策機能部とを備える障害対応システム。
  2. 前記予防機能部が、前記取得した予防データに含まれるコマンドジョブ又はバッチジョブをコンピュータに対して実行し、前記実行結果を表示部に表示する請求項1記載の障害対応システム。
  3. 前記コンピュータが、前記コマンドジョブ又はバッチジョブの実行する際の承認を得る機能を有し、前記対策機能部が、前記承認を得た後にコマンドジョブ又はバッチジョブを実行する請求項1又は2記載の障害対応システム。
  4. 情報を表示する表示部を有し、障害が発生する前に通知される障害予知情報及び障害が発生した後に通知される障害後情報を障害イベントリとしてメモリに格納するコンピュータと、前記コンピュータの障害を修復するサーバとを備えるコンピュータシステムの障害対応方法であって、前記サーバが、前記障害予知情報による障害を予防するためのコマンドジョブ又はバッチジョブを含む予防データと前記障害後情報による障害を回復するためのコマンドジョブ又はバッチジョブからなる対策データとを格納する障害診断テーブル部と、前記コンピュータから通知される障害イベントリを前記メモリから収集し、前記収集した障害イベントリが障害予知情報か障害後情報かを判定する解析機能部と、前記解析機能部により障害イベントリが障害予知情報と判定したとき、前記障害診断テーブル部から前記判定した障害予知情報に対応した予防データを取得し、前記コンピュータの表示部に表示する予防機能部と、前記前記解析機能部により障害イベントリが障害後情報と判定したとき、前記障害診断テーブル部から前記判定した障害後情報に対応した対策データを取得し、前記取得した対策データに含まれるコマンドジョブ又はバッチジョブをコンピュータに対して実行する対策機能部とを有し、前記解析機能部に、前記コンピュータから通知される障害イベントリを前記メモリから収集させ、前記収集した障害イベントリが障害予知情報か障害後情報かを判定させる工程と、前記予防機能部に、前記解析機能部により障害イベントリが障害予知情報と判定したとき、前記障害診断テーブル部から前記判定した障害予知情報に対応した予防データを取得させ、前記コンピュータの表示部に表示させる工程と、前記対策機能部に、前記前記解析機能部により障害イベントリが障害後情報と判定したとき、前記障害診断テーブル部から前記判定した障害後情報に対応した対策データを取得させ、前記取得した対策データに含まれるコマンドジョブ又はバッチジョブをコンピュータに対して実行させる工程とからなる障害対応方法。
  5. 前記予防機能部に、前記取得した予防データに含まれるコマンドジョブ又はバッチジョブをコンピュータに対して実行させ、前記実行結果を表示部に表示させる工程を含む請求項4記載の障害対応方法。
  6. 前記コンピュータが、前記コマンドジョブ又はバッチジョブの実行する際の承認を得る機能を有し、前記対策機能部に、前記承認を得た後にコマンドジョブ又はバッチジョブを実行させる工程を含む請求項4又は5記載の障害対応方法。







JP2010022471A 2010-02-03 2010-02-03 障害対応システム及び障害対応方法 Withdrawn JP2011159234A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010022471A JP2011159234A (ja) 2010-02-03 2010-02-03 障害対応システム及び障害対応方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010022471A JP2011159234A (ja) 2010-02-03 2010-02-03 障害対応システム及び障害対応方法

Publications (1)

Publication Number Publication Date
JP2011159234A true JP2011159234A (ja) 2011-08-18

Family

ID=44591108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010022471A Withdrawn JP2011159234A (ja) 2010-02-03 2010-02-03 障害対応システム及び障害対応方法

Country Status (1)

Country Link
JP (1) JP2011159234A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110941255A (zh) * 2019-12-05 2020-03-31 中国航发贵阳发动机设计研究所 故障信息管理系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110941255A (zh) * 2019-12-05 2020-03-31 中国航发贵阳发动机设计研究所 故障信息管理系统
CN110941255B (zh) * 2019-12-05 2023-11-24 中国航发贵阳发动机设计研究所 故障信息管理系统

Similar Documents

Publication Publication Date Title
JP6333410B2 (ja) 障害処理方法、関連装置、およびコンピュータ
KR102268355B1 (ko) 클라우드 배치 기반구조 검증 엔진
CN107660289B (zh) 自动网络控制
US7856575B2 (en) Collaborative troubleshooting computer systems using fault tree analysis
US8910172B2 (en) Application resource switchover systems and methods
US10489232B1 (en) Data center diagnostic information
JPWO2012046293A1 (ja) 障害監視装置、障害監視方法及びプログラム
JP2007249761A (ja) コンピュータ装置、起動制御方法及び起動制御プログラム
JP5425720B2 (ja) 仮想化環境監視装置とその監視方法およびプログラム
JP6558037B2 (ja) 運用管理プログラム、運用管理方法、および運用管理装置
JP2010009411A (ja) 仮想化環境運用支援システム及び仮想環境運用支援プログラム
US11263072B2 (en) Recovery of application from error
JP6317074B2 (ja) 障害通知装置、障害通知プログラムならびに障害通知方法
CN109271270A (zh) 存储系统中底层硬件的故障排除方法、系统及相关装置
EP2495660A1 (en) Information processing device and method for controlling information processing device
JP4575020B2 (ja) 障害解析装置
JP6070040B2 (ja) データベースシステム、データベース装置、データベースの障害回復方法およびプログラム
JP2005266919A (ja) システム解析装置及び解析システム
JP2011159234A (ja) 障害対応システム及び障害対応方法
KR101783201B1 (ko) 서버 통합 관리 시스템 및 방법
JP2018169920A (ja) 管理装置、管理方法及び管理プログラム
JP2012146049A (ja) バッチジョブ遅延警告自動発報システムおよび自動発報方法、ならびにそのためのプログラム
JP2009059204A (ja) コンピュータリモート制御システム
JP5997005B2 (ja) 情報処理装置、プロセスの正常終了判定方法およびプログラム
JP4021874B2 (ja) 障害管理装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20130507