JP2007267352A - 障害回復システム及びサーバ - Google Patents
障害回復システム及びサーバ Download PDFInfo
- Publication number
- JP2007267352A JP2007267352A JP2006274639A JP2006274639A JP2007267352A JP 2007267352 A JP2007267352 A JP 2007267352A JP 2006274639 A JP2006274639 A JP 2006274639A JP 2006274639 A JP2006274639 A JP 2006274639A JP 2007267352 A JP2007267352 A JP 2007267352A
- Authority
- JP
- Japan
- Prior art keywords
- information
- failure
- network device
- server
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0748—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/076—Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/40—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
- Computer And Data Communications (AREA)
Abstract
ネットワークにおける障害の抑止またはネットワークの障害の自動回復を図る。
【解決手段】
サーバ200は、障害回復の対象であるひとつ又は複数のネットワーク装置A、B、Cを示す監視対象情報と、障害内容を識別するための障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルを有する。例えばネットワーク装置A300は、自ネットワーク装置の障害を検出し、障害イベントをサーバ200に送信する。サーバ200が、シナリオテーブルを参照して、頻度情報が高い順に処情報を選択し、ネットワーク装置A300に送信する。サーバ200は、ネットワーク装置A300から障害イベントが受信されなくなるまで、対象情報の選択と送信を繰り返す。
【選択図】図1
Description
(2)本システムは、単一または複数のネットワーク装置の物理的接続関係または論理的接続関係または物理的接続と論理的接続の関係の選択優先度を記述した構成定義テンプレートは、文法定義を事前に定義したフォーマットに基づいた記述方法を持っている。
(3)本システムは、構成定義テンプレートと構成定義において、構成定義テンプレートの文法定義と構成定義のフォーマットの間に一定の変換規則を持っている。
(4)本システムは、サーバのシナリオテーブルに登録またはシナリオテーブル一覧を表示するための外部インタフェースであるクライアントは、サーバとの接続においてネットワークまたはサーバ内の機能を実現するプロセス間での通信を介する。
(5)本システムは、構成定義によって反映したネットワーク中継の機能に起因する障害または機能の状態変化の情報である装置障害イベントを送信する機能は、ネットワーク装置に備わる通信送信機能またはサーバもしくはネットワーク装置からのコールバックによる送信機能を含む。
(6)本システムは、監視対象は単一または複数のネットワーク装置または装置内の機能部位を論理関係で記述する。
(7)本システムは、シナリオテーブルにユーザが登録した障害に該当する対処方法がすべて頻度情報順に実行されるまで続き、未選択のシナリオがなくなった時点で装置障害イベントの受信が続いた場合に、ユーザに対し手動での対処要求を通知する。
(8)本システムのサーバは、ネットワークまたはプロセス間通信を介してクライアントと通信可能であり、ネットワークを介して単一または複数の装置から送信されてくる装置障害イベントを受信する。サーバは、装置からの装置障害イベントを受信する装置障害イベント受信プログラムと、装置障害イベントの内容に従い、対象機能かつ監視対象かつ障害情報を満たす単一または複数のシナリオ候補一覧をシナリオテーブルから取り出し、シナリオ候補リストとして管理するシナリオテーブル管理プログラムを備える。
(9)本システムは、シナリオテーブルに存在する該当対処方法のうち頻度情報順とは、頻度情報をもとに選択する順序が降順である。
(10)本システムにおけるデータ処理法は、複数の障害対象に対する、処理を各処理対処の使用頻度を利用しつつ行う、コンピュータを用いた使用頻度を利用したデータ処理法であり、コンピュータは選択された処理対象の使用頻度を更新して記録し、コンピュータは複数の処理対象を、選択のために利用する際に、記録されている各処理対象の使用頻度を読み出して、選択のための情報として利用する使用頻度を利用したデータ処理方法である。
(11)本システムは、ユーザが事前にシナリオとして登録した障害種別と対処方法との組み合わせに対し、過去の同様の障害における対処方法の使用頻度を頻度情報として付加することにより、過去の事例による対象方法の選択をコンピュータに行わせることを可能とする処理方法をもつ。
(12)本システムのクライアントは、シナリオテーブルに登録またはシナリオテーブル一覧を表示するための外部インタフェースであり、シナリオテーブル一覧の表示機能とユーザが登録するシナリオの送信機能とを備えたクライアントである。
(13)本システムは、シナリオテーブル一覧表示機能において、表示を利用する対象は、直接ユーザである人間またはプログラムである。
(14)本システムのシナリオテーブルは、ユーザが登録したシナリオ一覧を有するシナリオテーブルであって、装置障害の対象機能を保持する対象機能領域と、前記障害発生を起こした機能に該当する単一または複数の装置情報を保持する監視対象領域と、障害情報を保持する障害情報領域と、障害に対処する対処方法領域と、
を備えたシナリオテーブルである。
(15)本システムは、対処方法は、単一または複数のネットワーク装置の物理的接続関係または論理的接続関係または物理的接続と論理的接続の関係の選択優先度を記述した文法定義を事前に定義したフォーマットに基づく構成定義テンプレートである。
(16)本システムは、シナリオテーブルにおいて、シナリオテーブルに登録されているシナリオの頻度情報が0の場合、テーブルに登録されている順序が、シナリオを選択する際の順となる。
(17)本システムは、シナリオテーブルにおいて、シナリオテーブルに登録されている二つ以上のシナリオの頻度情報が同じ値の場合、テーブルに登録されている順序が、シナリオを選択する際の順となる。
(18)装置障害イベントにおいて、装置障害イベントによって選択したシナリオの実行は実行回数による制限が可能であり、クライアントまたはサーバにおいて前記実行回数の定義できる。
(19)装置障害イベントにおいて、サーバが特定の装置障害イベントを受け続ける時間を制限することが可能であり、クライアントまたはサーバにおいて前記時間を定義できる。
(20)ユーザが事前にシナリオとして登録した障害種別と対処方法との組み合わせに対し、過去の同様の障害における対処方法の使用頻度を頻度情報として付加することにより、過去の事例による対象方法の選択をコンピュータに行わせることを可能とする処理方法であり、コンピュータに行わせた結果をログとしてクライアントまたはサーバまたはネットワーク装置に保存できる。
(21)シナリオテーブルにおいて、シナリオテーブルのシナリオを構成する項目は拡張が可能である。
ネットワークを構成するひとつ又は複数のネットワーク装置と、
前記ネットワーク装置に接続され、障害回復の対象であるひとつ又は複数の前記ネットワーク装置を示す監視対象情報と、障害内容を識別するための障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルを有するサーバと
を備え、
前記ネットワーク装置が、自ネットワーク装置の障害を検出し、自装置を示す監視対象情報と該障害内容を識別するための障害情報とを含む障害イベントを前記サーバに送信することと、
前記サーバが、該障害イベントを受信し、前記シナリオテーブルを参照して、該障害イベントに含まれる監視対象情報と障害情報に対応するひとつ又は複数の対処情報を検索し、該当する対処情報の中から、対応する頻度情報が最も大きい又は予め定められた値以上の対処情報をひとつ選択することと、
前記サーバが、選択された対処情報を前記ネットワーク装置に送信することと、
前記ネットワーク装置が、対処情報を受信し、該対処情報を反映し又は該対処情報に基づき設定を変更することと、
前記サーバは、選択された対処情報を送信してから予め定められた時間内に前記障害イベントを再度受信していないと判断されると、前記シナリオテーブルを参照し、選択された対処情報に対応する頻度情報を増加させること
を含む障害回復システムが提供される。
ネットワークを構成するひとつ又は複数のネットワーク装置と通信するためのインタフェースと、
障害回復の対象であるひとつ又は複数の前記ネットワーク装置を示す監視対象情報と、障害内容を識別するための障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルと
処理部と
を備え、
前記処理部は、
前記ネットワーク装置が障害を検出することで送信される、前記ネットワーク装置を示す監視対象情報と該障害内容を識別するための障害情報とを含む障害イベントを、前記インタフェースを介して受信することと、
前記シナリオテーブルを参照して、該障害イベントに含まれる監視対象情報と障害情報に対応するひとつ又は複数の対処情報を検索し、該当する対処情報の中から、対応する頻度情報が最も大きい又は予め定められた値以上の対処情報をひとつ選択することと、
選択された対処情報を、前記インタフェースを介して前記ネットワーク装置に送信することと、
選択された対処情報を送信してから予め定められた時間内に前記障害イベントを再度受信しない場合、前記シナリオテーブルを参照し、選択された対処情報に対応する頻度情報を増加させること
を含むサーバが提供される。
ネットワークを構成する第1のネットワーク装置と、
前記第1のネットワーク装置に接続され、及び、ネットワークを構成する第2のネットワーク装置と、
前記第1及び第2のネットワーク装置に接続され、障害回復の対象である前記第1及び第2のネットワーク装置を示す監視対象情報と、前記第1のネットワーク装置の状態と前記第2のネットワーク装置の状態の組み合わせで定まる障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルを有するサーバと
を備え、
前記第1のネットワーク装置が、自装置を示す第1の監視対象情報と自装置の状態を示す第1の状態情報を含む第1のイベントを前記サーバに送信することと、
前記第2のネットワーク装置が、自装置を示す第2の監視対象情報と自装置の状態を示す第2の状態情報を含む第2のイベントを前記サーバに送信することと、
前記サーバが、第1及び第2のイベントを受信し、第1の状態情報と第2の状態情報に基づき障害の有無を判断し、及び、障害情報を求めることと、
前記サーバが、前記シナリオテーブルを参照して、第1及び第2のイベントに含まれる第1及び第2の監視対象情報及び求められた障害情報に対応するひとつ又は複数の対処情報を検索し、該当する対処情報の中から、対応する頻度情報が最も大きい又は予め定められた値以上の対処情報をひとつ選択することと、
前記サーバが、選択された対処情報を前記第1及び第2のネットワーク装置にそれぞれ送信することと、
前記第1及び第2のネットワーク装置がそれぞれ、対処情報を受信し、該対処情報を反映し又は該対処情報に基づき設定を変更することと、
前記サーバは、障害が回避されると、前記シナリオテーブルを参照し、選択された対処情報に対応する頻度情報を増加させること
を含む障害回復システムが提供される。
ネットワークを構成する第1及び第2のネットワーク装置と通信するためのインタフェースと、
障害回復の対象である前記第1及び第2のネットワーク装置を示す監視対象情報と、前記第1のネットワーク装置の状態と前記第2のネットワーク装置の状態の組み合わせで定まる障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルと
処理部と
を備え、
前記処理部は、
前記第1のネットワーク装置から、前記第1のネットワーク装置を示す第1の監視対象情報と前記第1のネットワーク装置の状態を示す第1の状態情報を含む第1のイベントを、前記インタフェースを介して受信することと、
前記第2のネットワーク装置から、前記第2のネットワーク装置を示す第2の監視対象情報と前記第2のネットワーク装置の状態を示す第2の状態情報を含む第2のイベントを、前記インタフェースを介して受信することと、
第1の状態情報と第2の状態情報に基づき障害の有無を判断し、及び、障害情報を求めることと、
前記シナリオテーブルを参照して、第1及び第2のイベントに含まれる第1及び第2の監視対象情報及び求められた障害情報に対応するひとつ又は複数の対処情報を検索し、該当する対処情報の中から、対応する頻度情報が最も大きい又は予め定められた値以上の対処情報をひとつ選択することと、
選択された対処情報を、前記ネットワークインタフェースを介して前記第1及び第2のネットワーク装置にそれぞれ送信することと、
障害が回避されると、前記シナリオテーブルを参照し、選択された対処情報に対応する頻度情報を増加させること
を含むサーバが提供される。
ネットワークを構成する第1のネットワーク装置と、
ネットワークを構成する第2のネットワーク装置と、
前記第1のネットワーク装置を介してネットワークに接続され、かつ、前記第2のネットワーク装置を介してネットワークに接続される第3のネットワーク装置と、
前記第1及び第2のネットワーク装置に接続され、障害回復の対象であるひとつ又は複数の前記ネットワーク装置を示す監視対象情報と、障害内容を識別するための障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルを有するサーバと
を備え、
前記第3のネットワーク装置が、前記第1又は第2のネットワーク装置の障害により、ネットワークへの転送に障害が発生したことを検出すると、自装置を示す監視対象情報と転送機能の障害であることを識別するための障害情報とを含む障害イベントを前記サーバに送信することと、
前記サーバが、障害イベントを受信し、前記シナリオテーブルを参照して、該障害イベントに含まれる監視対象情報と障害情報に対応するひとつ又は複数の対処情報を検索し、該当する対処情報の中から、対応する頻度情報が最も大きい又は予め定められた値以上の対処情報をひとつ選択することと、
前記サーバが、選択された対処情報に従い、該対処情報を前記第1及び第2のネットワーク装置に送信することと、
前記第1及び第2のネットワーク装置が、対処情報を受信し、該対処情報を反映し又は該対処情報に基づき設定を変更することと、
前記サーバは、選択された対処情報を送信してから予め定められた時間内に前記障害イベントを再度受信しないと、前記シナリオテーブルを参照し、選択された対処情報に対応する頻度情報を増加させること
を含む障害回復システムが提供される。
ネットワークを構成する第1及び第2及び第3のネットワーク装置と通信するためのインタフェースと、
障害回復の対象であるひとつ又は複数の前記ネットワーク装置を示す監視対象情報と、障害内容を識別するための障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルと、
処理部と
を備え、
前記処理部は、
前記第3のネットワーク装置が、前記第1又は第2のネットワーク装置の障害によりネットワークへの転送に障害が発生したことを検出することで送信される、前記第3のネットワーク装置を示す監視対象情報と転送機能の障害であることを識別するための障害情報とを含む障害イベントを、前記インタフェースを介して受信することと、
前記シナリオテーブルを参照して、該障害イベントに含まれる監視対象情報と障害情報に対応するひとつ又は複数の対処情報を検索し、該当する対処情報の中から、対応する頻度情報が最も大きい又は予め定められた値以上の対処情報をひとつ選択することと、
選択された対処情報に従い、前記ネットワークインタフェースを介して、該対処情報を前記第1及び第2のネットワーク装置に送信することと、
選択された対処情報を送信してから予め定められた時間内に前記障害イベントを再度受信しないと、前記シナリオテーブルを参照し、選択された対処情報に対応する頻度情報を増加させること
を含むサーバが提供される。
本実施の形態では、ルーティングに関する実施の形態について説明する。
2.第2の実施の形態
本実施の形態では、レイヤー2装置冗長における実施の形態について説明する。
3.第3の実施の形態
本実施の形態では、マルチキャストルーティングにおける実施の形態について説明する。
(1)上述の実施の形態によると、事前に予測される障害と対処方法を頻度順に実施してみることで、ネットワークにおける障害の抑止またはネットワークの障害の自動回復を図ることが可能となる。また、上述の実施の形態によると、実施した対処方法によってネットワークにおける障害の抑止または自動回復が成功した対処方法に頻度情報を付加することにより、頻度情報に基づく確実な対処方法が選択される可能性が増え、さらに効率的なネットワークの安定化を図ることが可能となる。さらに、上述の実施の形態によると、階層化されているネットワークレイヤーの対処方法を登録しておくことにより本来解決が困難であった特定のネットワークレイヤーの障害に対しても対応することが可能になる。
(2)上述の実施の形態によると、構成定義テンプレートが特有のフォーマットで記述できることは、構成定義テンプレート作成アプリケーションの作成を容易とすることができる。
(3)上述の実施の形態によると、構成定義テンプレートの文法定義と構成定義のフォーマットの間に一定の変換規則を持つことは、機種依存定義である構成定義への変換を容易とすることができる。上述の実施の形態の構成定義テンプレートと構成定義において、構成定義テンプレートの文法定義と構成定義のフォーマットの間に一定の変換規則を持つことを特徴のひとつとする。
(4)上述の実施の形態によると、サーバのシナリオテーブルに登録またはシナリオテーブル一覧を表示するための外部インタフェースであるクライアントは、サーバとの接続においてネットワークまたはサーバ内の機能を実現するプロセス間での通信を介することを特徴のひとつとしているため、既存システムまたは分散システム環境との接続を容易とする。
(5)上述の実施の形態によると、構成定義によって反映したネットワーク中継の機能に起因する障害または機能の状態変化の情報である装置障害イベントを送信する機能とは、ネットワーク装置に備わる通信送信機能またはサーバもしくはネットワーク装置からのコールバックによる送信機能を含むことを特徴のひとつとしているため、既存システムまたは分散システムとの連携で用いられる送信技術への対応を容易とする。
(6)上述の実施の形態によると、監視対象とは単一または複数のネットワーク装置またはネットワーク装置内の機能部位を論理的に記述できることを特徴のひとつとしているため、単一または複数のネットワーク装置のシナリオの記述を容易とし、シナリオテーブルが適切化されやすくなる。
(7)上述の実施の形態によると、シナリオテーブルにユーザが登録した障害に該当する対処方法がすべて頻度情報順に実行されるまで続き、未選択のシナリオがなくなった時点で装置障害イベントの受信が続いた場合に、ユーザに対し手動での対処要求を通知するため、未知の障害があったとしても対処がなされる。
(8)上述の実施の形態によると、シナリオ候補リストとして関連するシナリオ候補を抜き出しているため、該当シナリオを選択するための効率が良い。
(9)上述の実施の形態によると、頻度情報の優先度を明確に決めているため、システムで過去によく使用した順に実行することが可能である。
(10)上述の実施の形態によると、選択の対象である各処理対象の使用頻度に基づき、選択の効率化が可能である。
(11)上述の実施の形態によると、ユーザが事前にシナリオとして登録した障害種別と対処方法との組み合わせに対し、過去の同様の障害における対処方法の使用頻度を頻度情報として付加することにより、過去の事例による対象方法の選択をコンピュータに行わせることが可能である。
(12)上述の実施の形態によると、シナリオテーブルへのシナリオ登録を容易に行うことができる。
(13)上述の実施の形態によると、シナリオテーブル一覧表示機能は、直接ユーザである人間またはプログラムを対象としているため、GUI(Graphic User Interface)またはアプリケーション構築が可能である。
(14)上述の実施の形態によると、シナリオテーブルのデータ構造が明確化されているため、アプリケーションとして実装が容易である。
(15)上述の実施の形態によると、対処方法の記述として構成定義テンプレートを用いているため、論理的な記述が可能である。
(16)上述の実施の形態によると、シナリオテーブルにおいて、シナリオテーブルに登録されているシナリオの頻度情報が0の場合、テーブルに登録されている順序がシナリオを選択する際の順となるため、シナリオを登録して頻度情報が更新されていない状態であっても適切に動作が可能である。
(17)上述の実施の形態によると、シナリオテーブルにおいて、シナリオテーブルに登録されている二つ以上のシナリオの頻度情報が同じ値の場合、テーブルに登録されている順序が、シナリオを選択する際の順となるため、頻度情報が同じ値であっても、適切に処理が可能である。
(18)上述の実施の形態によると、シナリオによっては複数回実行することにより、ネットワークを不安定にすることもありえるため、ユーザが任意に制限を設けることまたはシステムとしての制限を事前に設定しておくことで一定の制限をかけることが可能である。
(19)上述の実施の形態によると、シナリオによっては長時間実行することにより、ネットワークを不安定にすることもありえるため、サーバが特定の装置障害イベントを受けつづける時間に一定の制限を設けることによりシナリオの実行に一定の制限を設けることが可能である。
(20)上述の実施の形態によると、ログを保持することによりシステムによって実行された、シナリオの選択または実行順またはシナリオ実行によるネットワーク装置の状態変化をトレースができ、シナリオ作成または障害の抜本的解決に役立てることが可能である。
(21)上述の実施の形態によると、シナリオテーブルのシナリオを構成する項目を拡張可能にすることにより将来的なシナリオ選択の重み付けの差別化を行うことが可能である。
4.第4の実施の形態
以下に示す実施例は、その本質を変容させることなく、互いに組み合わせ可能であり、他の実施形態にも適用できる。
(1)障害に対する自動回復だけではなく、補足または注意などの変更点をより詳細にユーザに通知することが可能となる。
(2)保守マニュアルをXML形式で保持することにより、XMLの持つあらゆるドキュメントへの変換が容易であるという特性を利用することが可能であり、例えば紙に印刷されたものや、最初からHTMLのものとは異なり、再利用性が高まる。
200 サーバ
300 ネットワーク装置A
400 ネットワーク装置B
500 ネットワーク装置C
600 ネットワーク装置D
210 シナリオテーブル表示プログラム
220 シナリオテーブル管理プログラム
230 シナリオテーブル
240 シナリオ候補リスト
250 構成定義テンプレート生成プログラム
260 装置障害イベント受信プログラム
270 メモリ
280 CPU
290 ネットワークインタフェース
310 構成定義管理プログラム
320 装置障害イベント送信プログラム
330 メモリ
340 CPU
350 ネットワークインタフェース
101 シナリオを送信するボタン
231 対象機能
232 監視対象
233 障害情報
234 対処方法
235 頻度情報
236 シナリオ
240 シナリオ候補リスト
241 対象機能
242 監視対象
243 障害情報
244 対処方法
245 頻度情報
700 マニュアルデータ
800 保守マニュアル
Claims (15)
- ネットワークを構成するひとつ又は複数のネットワーク装置と、
前記ネットワーク装置に接続され、障害回復の対象であるひとつ又は複数の前記ネットワーク装置を示す監視対象情報と、障害内容を識別するための障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルを有するサーバと
を備え、
前記ネットワーク装置が、自ネットワーク装置の障害を検出し、自装置を示す監視対象情報と該障害内容を識別するための障害情報とを含む障害イベントを前記サーバに送信することと、
前記サーバが、該障害イベントを受信し、前記シナリオテーブルを参照して、該障害イベントに含まれる監視対象情報と障害情報に対応するひとつ又は複数の対処情報を検索し、該当する対処情報の中から、対応する頻度情報が最も大きい又は予め定められた値以上の対処情報をひとつ選択することと、
前記サーバが、選択された対処情報を前記ネットワーク装置に送信することと、
前記ネットワーク装置が、対処情報を受信し、該対処情報を反映し又は該対処情報に基づき設定を変更することと、
前記サーバは、選択された対処情報を送信してから予め定められた時間内に前記障害イベントを再度受信していないと判断されると、前記シナリオテーブルを参照し、選択された対処情報に対応する頻度情報を増加させること
を含む障害回復システム。 - ネットワークを構成するひとつ又は複数のネットワーク装置と通信するためのインタフェースと、
障害回復の対象であるひとつ又は複数の前記ネットワーク装置を示す監視対象情報と、障害内容を識別するための障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルと、
処理部と
を備え、
前記処理部は、
前記ネットワーク装置が障害を検出することで送信される、前記ネットワーク装置を示す監視対象情報と該障害内容を識別するための障害情報とを含む障害イベントを、前記インタフェースを介して受信することと、
前記シナリオテーブルを参照して、該障害イベントに含まれる監視対象情報と障害情報に対応するひとつ又は複数の対処情報を検索し、該当する対処情報の中から、対応する頻度情報が最も大きい又は予め定められた値以上の対処情報をひとつ選択することと、
選択された対処情報を、前記インタフェースを介して前記ネットワーク装置に送信することと、
選択された対処情報を送信してから予め定められた時間内に前記障害イベントを再度受信しない場合、前記シナリオテーブルを参照し、選択された対処情報に対応する頻度情報を増加させること
を含むサーバ。 - 前記サーバは、
前記ネットワーク装置が該対処情報を反映し又は該対処情報に基づき設定を変更した後に、前記障害が再度検出されることにより送信される前記障害イベントを再度受信することと、
前記障害イベントを再度受信すると、前記シナリオテーブルを参照し、前記障害イベントに含まれる監視対象情報と障害情報に対応するひとつ又は複数の対処情報の中から、対応する頻度情報が大きい順に対処情報を選択すること、及び、該対処情報を前記ネットワーク装置に送信することを、前記障害イベントが再度受信されなくなるまで繰り返すことをさらに含む請求項1に記載の障害回復システム又は請求項2に記載のサーバ。 - 前記サーバに送信することは、
前記ネットワーク装置が、経路計算のログを含む予め出力されたログを監視し、一定時間内に発生した経路計算の回数を求めることと、
前記ネットワーク装置が、求められた経路計算の回数が予め設定された閾値よりも大きいことにより、経路学習が頻発している障害を検出することと、
前記ネットワーク装置が、自装置を示す監視対象情報と、経路学習が頻発していることを識別するための障害情報とを含む障害イベントを前記サーバに送信すること
を含む請求項1に記載の障害回復システム。 - ネットワークを構成する第1のネットワーク装置と、
前記第1のネットワーク装置に接続され、及び、ネットワークを構成する第2のネットワーク装置と、
前記第1及び第2のネットワーク装置に接続され、障害回復の対象である前記第1及び第2のネットワーク装置を示す監視対象情報と、前記第1のネットワーク装置の状態と前記第2のネットワーク装置の状態の組み合わせで定まる障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルを有するサーバと
を備え、
前記第1のネットワーク装置が、自装置を示す第1の監視対象情報と自装置の状態を示す第1の状態情報を含む第1のイベントを前記サーバに送信することと、
前記第2のネットワーク装置が、自装置を示す第2の監視対象情報と自装置の状態を示す第2の状態情報を含む第2のイベントを前記サーバに送信することと、
前記サーバが、第1及び第2のイベントを受信し、第1の状態情報と第2の状態情報に基づき障害の有無を判断し、及び、障害情報を求めることと、
前記サーバが、前記シナリオテーブルを参照して、第1及び第2のイベントに含まれる第1及び第2の監視対象情報及び求められた障害情報に対応するひとつ又は複数の対処情報を検索し、該当する対処情報の中から、対応する頻度情報が最も大きい又は予め定められた値以上の対処情報をひとつ選択することと、
前記サーバが、選択された対処情報を前記第1及び第2のネットワーク装置にそれぞれ送信することと、
前記第1及び第2のネットワーク装置がそれぞれ、対処情報を受信し、該対処情報を反映し又は該対処情報に基づき設定を変更することと、
前記サーバは、障害が回避されると、前記シナリオテーブルを参照し、選択された対処情報に対応する頻度情報を増加させること
を含む障害回復システム。 - ネットワークを構成する第1及び第2のネットワーク装置と通信するためのインタフェースと、
障害回復の対象である前記第1及び第2のネットワーク装置を示す監視対象情報と、前記第1のネットワーク装置の状態と前記第2のネットワーク装置の状態の組み合わせで定まる障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルと
処理部と
を備え、
前記処理部は、
前記第1のネットワーク装置から、前記第1のネットワーク装置を示す第1の監視対象情報と前記第1のネットワーク装置の状態を示す第1の状態情報を含む第1のイベントを、前記インタフェースを介して受信することと、
前記第2のネットワーク装置から、前記第2のネットワーク装置を示す第2の監視対象情報と前記第2のネットワーク装置の状態を示す第2の状態情報を含む第2のイベントを、前記インタフェースを介して受信することと、
第1の状態情報と第2の状態情報に基づき障害の有無を判断し、及び、障害情報を求めることと、
前記シナリオテーブルを参照して、第1及び第2のイベントに含まれる第1及び第2の監視対象情報及び求められた障害情報に対応するひとつ又は複数の対処情報を検索し、該当する対処情報の中から、対応する頻度情報が最も大きい又は予め定められた値以上の対処情報をひとつ選択することと、
選択された対処情報を、前記ネットワークインタフェースを介して前記第1及び第2のネットワーク装置にそれぞれ送信することと、
障害が回避されると、前記シナリオテーブルを参照し、選択された対処情報に対応する頻度情報を増加させること
を含むサーバ。 - 前記サーバは、
前記第1のネットワーク装置から、第1の監視対象情報と、対処情報が反映され又は設定が変更された後の前記第1のネットワーク装置の状態を示す第3の状態情報とを含む第3のイベントを受信することと、
前記第2のネットワーク装置から、第2の監視対象情報と、対処情報が反映され又は設定が変更された後の前記第2のネットワーク装置の状態を示す第4の状態情報とを含む第4のイベントを受信することと、
第3の状態情報と第4の状態情報に基づき障害が回避されたか判断することと、
障害が回避されていないと判断されると、前記シナリオテーブルを参照し、第1及び第2の監視対象情報と障害情報とに対応するひとつ又は複数の対処情報の中から、対応する頻度情報が大きい順に対処情報を選択すること、及び、該対処情報を前記第1及び第2のネットワーク装置に送信することを、障害が回避されたと判断されるまで繰り返すこと、
をさらに含む請求項5に記載の障害回復システム又は請求項6に記載のサーバ。 - 前記第1及び前記第2のネットワーク装置は、冗長構成で動作し、
前記障害情報を求めることは、
前記サーバが、前記第1のネットワーク装置の第1の状態情報と、前記第2のネットワーク装置の第2の状態情報の双方がマスターを示す場合、及び、双方がバックアップを示す場合に、前記サーバは障害があると判断すること、及び、ダブルマスター又はダブルバックアップを示す障害情報を求めること
を含み、
前記対処情報は、前記第1のネットワーク装置及び前記第2のネットワーク装置の一方をマスター、他方をバックアップとさせるための情報を含む請求項5に記載の障害回復システム。 - ネットワークを構成する第1のネットワーク装置と、
ネットワークを構成する第2のネットワーク装置と、
前記第1のネットワーク装置を介してネットワークに接続され、かつ、前記第2のネットワーク装置を介してネットワークに接続される第3のネットワーク装置と、
前記第1及び第2のネットワーク装置に接続され、障害回復の対象であるひとつ又は複数の前記ネットワーク装置を示す監視対象情報と、障害内容を識別するための障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルを有するサーバと
を備え、
前記第3のネットワーク装置が、前記第1又は第2のネットワーク装置の障害により、ネットワークへの転送に障害が発生したことを検出すると、自装置を示す監視対象情報と転送機能の障害であることを識別するための障害情報とを含む障害イベントを前記サーバに送信することと、
前記サーバが、障害イベントを受信し、前記シナリオテーブルを参照して、該障害イベントに含まれる監視対象情報と障害情報に対応するひとつ又は複数の対処情報を検索し、該当する対処情報の中から、対応する頻度情報が最も大きい又は予め定められた値以上の対処情報をひとつ選択することと、
前記サーバが、選択された対処情報に従い、該対処情報を前記第1及び第2のネットワーク装置に送信することと、
前記第1及び第2のネットワーク装置が、対処情報を受信し、該対処情報を反映し又は該対処情報に基づき設定を変更することと、
前記サーバは、選択された対処情報を送信してから予め定められた時間内に前記障害イベントを再度受信しないと、前記シナリオテーブルを参照し、選択された対処情報に対応する頻度情報を増加させること
を含む障害回復システム。 - ネットワークを構成する第1及び第2及び第3のネットワーク装置と通信するためのインタフェースと、
障害回復の対象であるひとつ又は複数の前記ネットワーク装置を示す監視対象情報と、障害内容を識別するための障害情報と、該障害に対する対処情報と、該対処情報により障害が回復した回数を示す頻度情報とが対応して記憶されたシナリオテーブルと、
処理部と
を備え、
前記処理部は、
前記第3のネットワーク装置が、前記第1又は第2のネットワーク装置の障害によりネットワークへの転送に障害が発生したことを検出することで送信される、前記第3のネットワーク装置を示す監視対象情報と転送機能の障害であることを識別するための障害情報とを含む障害イベントを、前記インタフェースを介して受信することと、
前記シナリオテーブルを参照して、該障害イベントに含まれる監視対象情報と障害情報に対応するひとつ又は複数の対処情報を検索し、該当する対処情報の中から、対応する頻度情報が最も大きい又は予め定められた値以上の対処情報をひとつ選択することと、
選択された対処情報に従い、前記ネットワークインタフェースを介して、該対処情報を前記第1及び第2のネットワーク装置に送信することと、
選択された対処情報を送信してから予め定められた時間内に前記障害イベントを再度受信しないと、前記シナリオテーブルを参照し、選択された対処情報に対応する頻度情報を増加させること
を含むサーバ。 - 前記サーバは、
前記第1及び第2のネットワーク装置が該対処情報を反映し又は該対処情報に基づき設定を変更した後に、前記第3のネットワーク装置で前記障害が再度検出されることにより送信される前記障害イベントを再度受信することと、
前記障害イベントを再度受信すると、前記シナリオテーブルを参照し、前記障害イベントに含まれる監視対象情報と障害情報に対応するひとつ又は複数の対処情報の中から、対応する頻度情報が大きい順に対処情報を選択すること、及び、該対処情報を前記第1及び第2のネットワーク装置に送信することを、前記第3のネットワーク装置から前記障害イベントが再度受信されなくなるまで繰り返すことと
をさらに含む請求項9に記載の障害回復システム又は請求項10に記載のサーバ。 - 前記第1のネットワーク装置が、マルチキャストルーティングのランデブーポイントとして設定され、
前記サーバに送信することは、
前記第3のネットワーク装置が、前記第1のネットワーク装置のランデブーポイント機能の障害により、自装置のマルチキャストルーティング機能に障害が発生したことを検出すること、及び、障害イベントを前記サーバに送信すること
を含み、
前記対処情報は、前記第2のネットワーク装置をマルチキャストルーティングのランデブーポイントとして設定するための情報を含む請求項9に記載の障害回復システム。 - 前記サーバに接続されたクライアント装置
をさらに備え、
前記クライアント装置は、入力部から監視対象情報と障害情報と対処情報とを入力して前記サーバへ送信し、
前記サーバは、前記クライアント装置から受信された監視対象情報と障害情報と対処情報とを前記シナリオテーブルに記憶し、
前記サーバは、記憶された各情報に対応する頻度情報を初期化する請求項1又は5又は9に記載の障害回復システム。 - 前記サーバに接続されたクライアント装置
をさらに備え、
前記サーバは、前記シナリオテーブルの該当する対処情報が順次選択されることにより、未選択の対処情報がなくなった場合に、前記クライアント装置に通知し、
前記クライアント装置は、対処情報がなくなったことを表示部に表示又は出力部に出力する請求項1又は5又は9に記載の障害回復システム。 - 前記シナリオテーブルは、前記障害情報に関連するマニュアル情報を記憶することを特徴とする請求項1記載の障害回復システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006274639A JP4701148B2 (ja) | 2006-03-02 | 2006-10-06 | 障害回復システム及びサーバ |
US11/680,868 US7827446B2 (en) | 2006-03-02 | 2007-03-01 | Failure recovery system and server |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006056257 | 2006-03-02 | ||
JP2006056257 | 2006-03-02 | ||
JP2006274639A JP4701148B2 (ja) | 2006-03-02 | 2006-10-06 | 障害回復システム及びサーバ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007267352A true JP2007267352A (ja) | 2007-10-11 |
JP4701148B2 JP4701148B2 (ja) | 2011-06-15 |
Family
ID=38519365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006274639A Expired - Fee Related JP4701148B2 (ja) | 2006-03-02 | 2006-10-06 | 障害回復システム及びサーバ |
Country Status (2)
Country | Link |
---|---|
US (1) | US7827446B2 (ja) |
JP (1) | JP4701148B2 (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010079528A (ja) * | 2008-09-25 | 2010-04-08 | Fuji Xerox Co Ltd | 画像処理装置及び障害情報管理システム |
JP2012190378A (ja) * | 2011-03-14 | 2012-10-04 | Kddi Corp | サーバシステム |
JP2013219938A (ja) * | 2012-04-10 | 2013-10-24 | Denso Corp | 通信復旧支援装置、および通信復旧支援用インターフェース |
JP2014032598A (ja) * | 2012-08-06 | 2014-02-20 | Hitachi Systems Ltd | インシデント管理システム及びその方法 |
JP5456921B1 (ja) * | 2013-02-18 | 2014-04-02 | ソフトバンクモバイル株式会社 | 障害復旧装置、障害復旧方法、及び障害復旧プログラム |
WO2015140987A1 (ja) * | 2014-03-20 | 2015-09-24 | 株式会社日立システムズ | 事象対応支援装置、事象対応支援方法、及びプログラム |
JP2016219962A (ja) * | 2015-05-18 | 2016-12-22 | Kddi株式会社 | 運用損失を考慮して障害予測結果を評価する装置、システム、プログラム及び方法 |
JP2018005352A (ja) * | 2016-06-28 | 2018-01-11 | 株式会社沖データ | 保守管理システム |
JP2018170675A (ja) * | 2017-03-30 | 2018-11-01 | Kddi株式会社 | 障害復旧手順最適化システムおよび障害復旧手順最適化方法 |
KR102139058B1 (ko) * | 2019-05-10 | 2020-07-29 | (주)비앤에스컴 | 서버 관리 장치를 구비한 클라우드 서버 및 로컬 서버를 이용하는 제로클라이언트 단말기용 클라우드 컴퓨팅 시스템 |
KR102221052B1 (ko) * | 2020-11-30 | 2021-02-25 | 윤동권 | Sdn 오픈플로우 프로토콜을 지원하는 네트워크 장비의 장애처리 시스템 |
JP2021136595A (ja) * | 2020-02-27 | 2021-09-13 | 沖電気工業株式会社 | ゲートウェイ装置、端末管理方法、及びプログラム |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2020776A1 (en) * | 2007-07-30 | 2009-02-04 | Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO | Restarting networks |
CN101437175B (zh) * | 2007-11-15 | 2010-09-15 | 华为技术有限公司 | 一种处理容灾切换的方法、装置及系统 |
US9369516B2 (en) | 2009-01-13 | 2016-06-14 | Viasat, Inc. | Deltacasting |
US8078914B2 (en) * | 2009-06-03 | 2011-12-13 | Microsoft Corporation | Open error-handling system |
EP2455863A4 (en) * | 2009-07-16 | 2013-03-27 | Hitachi Ltd | MANAGEMENT SYSTEM FOR PROVIDING INFORMATION DESCRIBING A RECOVERY METHOD CORRESPONDING TO A FUNDAMENTAL CAUSE OF FAILURE |
US8433260B2 (en) * | 2009-09-01 | 2013-04-30 | Ubidyne Inc. | Base-station failure predictor |
US8467474B2 (en) * | 2009-09-01 | 2013-06-18 | Ubidyne Inc. | Monitor for spectral degradation of transmitter or receiver |
US8832259B1 (en) * | 2009-10-30 | 2014-09-09 | Hewlett-Packard Development Company, L.P. | Virtual service mode methods for network remote monitoring and managing system |
US8516253B1 (en) | 2010-01-18 | 2013-08-20 | Viasat, Inc. | Self-keyed protection of anticipatory content |
US8904241B2 (en) * | 2011-07-27 | 2014-12-02 | Oracle International Corporation | Proactive and adaptive cloud monitoring |
US9043385B1 (en) | 2010-04-18 | 2015-05-26 | Viasat, Inc. | Static tracker |
JP5229696B2 (ja) * | 2011-03-04 | 2013-07-03 | 日本電気株式会社 | 情報処理システム、情報処理装置、その制御方法、及びその制御プログラム、通信環境監視復旧方法 |
US9037638B1 (en) | 2011-04-11 | 2015-05-19 | Viasat, Inc. | Assisted browsing using hinting functionality |
US9912718B1 (en) | 2011-04-11 | 2018-03-06 | Viasat, Inc. | Progressive prefetching |
US9106607B1 (en) | 2011-04-11 | 2015-08-11 | Viasat, Inc. | Browser based feedback for optimized web browsing |
US11983233B2 (en) | 2011-04-11 | 2024-05-14 | Viasat, Inc. | Browser based feedback for optimized web browsing |
US9456050B1 (en) | 2011-04-11 | 2016-09-27 | Viasat, Inc. | Browser optimization through user history analysis |
EP2536065B1 (en) | 2011-06-14 | 2019-11-27 | ViaSat, Inc. | Transport protocol for anticipatory content |
US9407355B1 (en) | 2011-10-25 | 2016-08-02 | Viasat Inc. | Opportunistic content delivery using delta coding |
US9021310B1 (en) * | 2012-02-14 | 2015-04-28 | Amazon Technologies, Inc. | Policy-driven automatic network fault remediation |
US8432808B1 (en) | 2012-06-15 | 2013-04-30 | Viasat Inc. | Opportunistically delayed delivery in a satellite network |
GB2506614A (en) * | 2012-10-03 | 2014-04-09 | Ibm | Extracting core data for a summary dump file based upon most recent trace data entries |
JP6055285B2 (ja) * | 2012-11-19 | 2016-12-27 | 株式会社東芝 | データ保全装置およびその方法、システム |
US20160020965A1 (en) * | 2013-08-07 | 2016-01-21 | Hitachi, Ltd. | Method and apparatus for dynamic monitoring condition control |
US9391865B1 (en) * | 2013-09-20 | 2016-07-12 | Veritas Technologies Llc | Systems and methods for facilitating fault-tolerant backup jobs |
JP2015118685A (ja) * | 2013-11-12 | 2015-06-25 | 株式会社リコー | 情報処理システム、情報処理方法、及びプログラム |
US20150149450A1 (en) * | 2013-11-27 | 2015-05-28 | International Business Machines Corporation | Determining problem resolutions within a networked computing environment |
US10855797B2 (en) | 2014-06-03 | 2020-12-01 | Viasat, Inc. | Server-machine-driven hint generation for improved web page loading using client-machine-driven feedback |
US10129184B1 (en) * | 2015-09-28 | 2018-11-13 | Amazon Technologies, Inc. | Detecting the source of link errors in a cut-through forwarding network fabric |
US10048996B1 (en) * | 2015-09-29 | 2018-08-14 | Amazon Technologies, Inc. | Predicting infrastructure failures in a data center for hosted service mitigation actions |
EP3365802A1 (en) | 2015-10-20 | 2018-08-29 | Viasat, Inc. | Hint model updating using automated browsing clusters |
CN105527511A (zh) * | 2015-11-27 | 2016-04-27 | 小米科技有限责任公司 | 一种设备自动修复的方法、装置和系统 |
JP2018170618A (ja) * | 2017-03-29 | 2018-11-01 | Kddi株式会社 | 障害自動復旧システム、制御装置、手順作成装置およびプログラム |
US20180329792A1 (en) * | 2017-05-15 | 2018-11-15 | Microsoft Technology Licensing, Llc | Network device monitoring |
US10680887B2 (en) * | 2017-07-21 | 2020-06-09 | Cisco Technology, Inc. | Remote device status audit and recovery |
US10565021B2 (en) * | 2017-11-30 | 2020-02-18 | Microsoft Technology Licensing, Llc | Automated capacity management in distributed computing systems |
US11513817B2 (en) * | 2020-03-04 | 2022-11-29 | Kyndryl, Inc. | Preventing disruption within information technology environments |
JP7339298B2 (ja) * | 2021-05-27 | 2023-09-05 | 株式会社日立製作所 | 情報処理システム及び方法並びに装置 |
US11681522B2 (en) * | 2021-10-21 | 2023-06-20 | Salesforce, Inc. | Self-healing build pipelines for an application build process across distributed computer platforms |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005018179A (ja) * | 2003-06-24 | 2005-01-20 | Hitachi Ltd | 障害監視装置 |
US20050262472A1 (en) * | 2004-05-21 | 2005-11-24 | Eric Wood | Method and system for intelligent and adaptive exception handling |
JP2005331998A (ja) * | 2004-05-18 | 2005-12-02 | Hitachi Ltd | 分散システムにおける自動未定義障害対処方法 |
JP2006023910A (ja) * | 2004-07-07 | 2006-01-26 | Hitachi Ltd | サーバ障害回復方法およびサーバ障害回復システム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0399770U (ja) | 1990-01-31 | 1991-10-18 | ||
US5666481A (en) * | 1993-02-26 | 1997-09-09 | Cabletron Systems, Inc. | Method and apparatus for resolving faults in communications networks |
US6006016A (en) * | 1994-11-10 | 1999-12-21 | Bay Networks, Inc. | Network fault correlation |
JP3099770B2 (ja) | 1997-04-30 | 2000-10-16 | 日本電気株式会社 | ネットワーク監視システムにおける障害情報管理方式 |
JP3618682B2 (ja) | 2001-05-01 | 2005-02-09 | 株式会社エヌ・ティ・ティ・データ | マニュアルの自動生成および動作確認システムならびにその方法 |
US20050081118A1 (en) * | 2003-10-10 | 2005-04-14 | International Business Machines Corporation; | System and method of generating trouble tickets to document computer failures |
JP4445300B2 (ja) * | 2004-03-18 | 2010-04-07 | 富士通株式会社 | ネットワーク障害推定方法及びネットワーク障害推定装置 |
FR2873879B1 (fr) * | 2004-07-30 | 2006-10-27 | Cit Alcatel | Systeme de gestion de reseau de communication pour reparation automatique de pannes |
-
2006
- 2006-10-06 JP JP2006274639A patent/JP4701148B2/ja not_active Expired - Fee Related
-
2007
- 2007-03-01 US US11/680,868 patent/US7827446B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005018179A (ja) * | 2003-06-24 | 2005-01-20 | Hitachi Ltd | 障害監視装置 |
JP2005331998A (ja) * | 2004-05-18 | 2005-12-02 | Hitachi Ltd | 分散システムにおける自動未定義障害対処方法 |
US20050262472A1 (en) * | 2004-05-21 | 2005-11-24 | Eric Wood | Method and system for intelligent and adaptive exception handling |
JP2006023910A (ja) * | 2004-07-07 | 2006-01-26 | Hitachi Ltd | サーバ障害回復方法およびサーバ障害回復システム |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010079528A (ja) * | 2008-09-25 | 2010-04-08 | Fuji Xerox Co Ltd | 画像処理装置及び障害情報管理システム |
JP2012190378A (ja) * | 2011-03-14 | 2012-10-04 | Kddi Corp | サーバシステム |
JP2013219938A (ja) * | 2012-04-10 | 2013-10-24 | Denso Corp | 通信復旧支援装置、および通信復旧支援用インターフェース |
JP2014032598A (ja) * | 2012-08-06 | 2014-02-20 | Hitachi Systems Ltd | インシデント管理システム及びその方法 |
JP5456921B1 (ja) * | 2013-02-18 | 2014-04-02 | ソフトバンクモバイル株式会社 | 障害復旧装置、障害復旧方法、及び障害復旧プログラム |
WO2015140987A1 (ja) * | 2014-03-20 | 2015-09-24 | 株式会社日立システムズ | 事象対応支援装置、事象対応支援方法、及びプログラム |
JP2016219962A (ja) * | 2015-05-18 | 2016-12-22 | Kddi株式会社 | 運用損失を考慮して障害予測結果を評価する装置、システム、プログラム及び方法 |
JP2018005352A (ja) * | 2016-06-28 | 2018-01-11 | 株式会社沖データ | 保守管理システム |
JP2018170675A (ja) * | 2017-03-30 | 2018-11-01 | Kddi株式会社 | 障害復旧手順最適化システムおよび障害復旧手順最適化方法 |
KR102139058B1 (ko) * | 2019-05-10 | 2020-07-29 | (주)비앤에스컴 | 서버 관리 장치를 구비한 클라우드 서버 및 로컬 서버를 이용하는 제로클라이언트 단말기용 클라우드 컴퓨팅 시스템 |
JP2021136595A (ja) * | 2020-02-27 | 2021-09-13 | 沖電気工業株式会社 | ゲートウェイ装置、端末管理方法、及びプログラム |
JP7409153B2 (ja) | 2020-02-27 | 2024-01-09 | 沖電気工業株式会社 | ゲートウェイ装置、端末管理方法、及びプログラム |
KR102221052B1 (ko) * | 2020-11-30 | 2021-02-25 | 윤동권 | Sdn 오픈플로우 프로토콜을 지원하는 네트워크 장비의 장애처리 시스템 |
Also Published As
Publication number | Publication date |
---|---|
US7827446B2 (en) | 2010-11-02 |
US20070220303A1 (en) | 2007-09-20 |
JP4701148B2 (ja) | 2011-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4701148B2 (ja) | 障害回復システム及びサーバ | |
US10255322B2 (en) | Utilizing persistent and non-persistent connections for distributed tasks for performing a job | |
US9246777B2 (en) | Computer program and monitoring apparatus | |
JP6549959B2 (ja) | 障害切り分け方法および障害切り分けを行う管理サーバ | |
JP2006277696A (ja) | ジョブ実行監視システム、ジョブ制御装置、ジョブ実行方法及びジョブ制御プログラム | |
JP2005165775A (ja) | 代行印刷システム、情報処理装置、及び制御方法 | |
JP2005063411A (ja) | 印刷処理装置、画像処理装置、文書管理装置、印刷処理システム、印刷処理装置の制御方法、印刷処理装置の制御プログラム及び記録媒体 | |
JP4239989B2 (ja) | 障害復旧システム、障害復旧装置、ルール作成方法、および障害復旧プログラム | |
US20220222266A1 (en) | Monitoring and alerting platform for extract, transform, and load jobs | |
JP2007079896A (ja) | 監視装置及び監視方法 | |
JP2006053728A (ja) | 障害対処ルール伝播方法、障害復旧装置およびプログラム | |
JP5086820B2 (ja) | サービス管理方法とシステムおよびプログラム | |
JP2007004272A (ja) | 情報処理装置、情報処理システム、及び情報処理方法 | |
JP5088738B2 (ja) | 障害監視装置及び障害監視方法並びにそのためのプログラム | |
CN114567536A (zh) | 异常数据处理方法、装置、电子设备和存储介质 | |
JP2004363946A (ja) | 故障措置システム、及び、故障要因特定方法 | |
US11941432B2 (en) | Processing system, processing method, higher-level system, lower-level system, higher-level program, and lower-level program | |
JP5704756B2 (ja) | コマンドスケジュール対応型クラウド統一操作システムおよび方法 | |
JPH11288367A (ja) | プログラム自動生成システムと方法 | |
JP6213496B2 (ja) | 制御装置、制御方法及び制御プログラム | |
WO2004042483A1 (ja) | 制御装置および制御履歴管理方法 | |
JP2002314538A (ja) | ネットワーク被管理装置および管理ネットワークシステムならびに管理操作方法 | |
JP2014067354A (ja) | メッセージ変換システム | |
JP2009080643A (ja) | 情報管理システム及び情報管理プログラム | |
JP5629911B2 (ja) | 無線基地局監視制御システム及び無線基地局の監視制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081217 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100914 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101207 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110128 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110307 |
|
LAPS | Cancellation because of no payment of annual fees |