JP5731334B2 - インシデント・プールの管理方法、システムおよびコンピュータ・プログラム - Google Patents

インシデント・プールの管理方法、システムおよびコンピュータ・プログラム Download PDF

Info

Publication number
JP5731334B2
JP5731334B2 JP2011197462A JP2011197462A JP5731334B2 JP 5731334 B2 JP5731334 B2 JP 5731334B2 JP 2011197462 A JP2011197462 A JP 2011197462A JP 2011197462 A JP2011197462 A JP 2011197462A JP 5731334 B2 JP5731334 B2 JP 5731334B2
Authority
JP
Japan
Prior art keywords
pool
event
incident
alert
analyzer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011197462A
Other languages
English (en)
Other versions
JP2012099092A (ja
Inventor
ジェームス・エドワード・カレイ
マーク・ジー.・アトキンス
フィリップ・ジェームス・サンダース
マシュー・ダブリュ.・マークランド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2012099092A publication Critical patent/JP2012099092A/ja
Application granted granted Critical
Publication of JP5731334B2 publication Critical patent/JP5731334B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks

Description

本発明の分野は、データ処理であり、さらに具体的に言い換えると、分散処理システムにおける、イベントおよびアラート抑制に関連した適切なアラートの配信、ならびにイベントおよびアラート分析のためのインシデント・プール(incident pool)の管理のための方法、システムおよび製品である。
1948年のEDVACコンピュータ・システムの開発は、コンピュータ時代の幕開けとして言及されることが多い。そのとき以来、コンピュータ・システムは、非常に複雑なデバイスへと発達してきた。今日のコンピュータは、EDVACなどの初期のシステムよりも大幅に高度化されている。典型的には、コンピュータ・システムは、ハードウェアおよびソフトウェア・コンポーネントの組み合わせ、アプリケーション・プログラム、オペレーティング・システム、プロセッサ、バス、メモリ、入出力デバイスなどを含む。半導体加工およびコンピュータ・アーキテクチャの進歩がコンピュータのパフォーマンスのさらなる向上を推進していくにつれて、ハードウェアの向上したパフォーマンスを生かすよう、より高度なコンピュータ・ソフトウェアが発達し、今日では、わずか数年前よりも大幅に強力なコンピュータ・システムがもたらされている。
集中的な計算用の現代の分散処理システムは、多数のデバイスを有し、多くのプロセスが各デバイス上で実行されることもあり、それらはすべて、自動エラー回復のため、システム管理者へのレポーティングのため、およびその他の理由による、エラーおよびステータス・レポーティングを行うことができる。多くの場合、例えばエラーの場合には、そのようなエラー・レポートおよびステータス・レポートの多さに圧倒され、それらを意味のある形で扱うことができない。例えば、10万のエラー・レポートを受信するシステム管理者は、そのようなレポートの多さに圧倒されると考えられ、その結果、全体としてそうしたレポートの有益さおよび適切さはいっそう失われていく。
分散処理システムにおけるイベントおよびアラート分析のためにインシデント・プールを管理する方法、システム、およびコンピュータ・プログラムが提供され、分散処理システムの1つ以上のコンポーネントからの複数のインシデント(incident)を、インシデント・アナライザ(incident analyzer)によってインシデント・キューから受信すること、インシデントのプールであって、所定の初期期間を有するプールを、インシデント・アナライザによって作成すること、受信されたインシデントそれぞれを、インシデント・アナライザによってプールに割り当てること、インシデント・アナライザによって、各インシデントに、プールに含められるべき所定の最短時間を割り当てること、インシデント・アナライザによって、インシデントの1つ以上に関して、そのインシデントに割り当てられている特定の期間、プールの所定の初期期間を延長すること、プールをクローズする(close)条件が満たされたかどうかを、インシデント・アナライザによって判断すること、プールをクローズする条件が満たされた場合、プール内の各インシデントに関して、そのインシデントが、プールに含められるべきその所定の最短時間、プールに入っていたかどうかを判断すること、インシデントが、その所定の最短時間プールに入っていた場合、クローズされたプールにインシデントを含めること、インシデントが、その所定の最短時間プールに入っていない場合、クローズされたプールからインシデントを取り出し(evict)、インシデントを次のプールに含めることが含まれる。
本発明の前述およびその他の目的、特徴、および利点が、添付の図面に表す本発明の例示の実施形態の、より詳しい以下の記載から明らかになる。添付の図面では、同じ参照番号は、概して本発明の例示の実施形態の同じ部分を表現する。
本発明の実施形態による、分散処理システムにおけるイベントおよびアラート抑制を用いた適切なアラートの配信のための例示のシステムを表す。 本発明の実施形態による、イベントおよびアラート抑制を用いた適切なアラートの配信で有用な例示のコンピュータを含む自動計算機(automated computing machinery)のブロック図を示す。 本発明の実施形態による、分散処理システムにおけるイベントおよびアラート抑制を用いた適切なアラートの配信のための例示のシステムのブロック図を示す。 本発明の実施形態による、イベント・プールへのイベントの割り当てを表す図を示す。 本発明の実施形態による、アラート・プールへのアラートの割り当てを表す図を示す。 本発明の実施形態による、イベントおよびアラート抑制を用いた適切なアラートの配信方法の例を表すフローチャートを示す。 本発明の実施形態による、分散処理システムにおけるイベントおよびアラート分析のためにインシデント・プールを管理する例示の方法を表すフローチャートを示す。 本発明の実施形態による、分散処理システムにおけるイベントおよびアラート分析のためにインシデント・プールを管理するさらなる方法を表すフローチャートを示す。 本発明の実施形態による、分散処理システムにおけるイベントおよびアラート分析のためにインシデント・プールを管理するさらなる方法を表すフローチャートを示す。
分散処理システムにおいて、本発明の実施形態に従い、イベントおよびアラート分析ならびに適切なアラートの配信のためにインシデント・プールを管理するための例示の方法、システム、およびコンピュータ・プログラムについて、添付の図面を参照して記載される。図1より開始する。図1は、本発明の実施形態による、分散処理システムにおけるイベントおよびアラート分析ならびに適切なアラートの配信のために、インシデント・プールを管理する例示のシステムを表す。分散処理システムは、典型的には、コンピュータ・ネットワークを介して通信する複数の自律コンピュータまたは半自律コンピュータ(semi−autonomous computer)として実装される。そのような分散処理システムの例では、コンピュータは、共通の目的を達成するために相互に対話することが多い。そのような、例としての分散システムで実行されるコンピュータ・プログラムは、典型的には分散プログラムと呼ばれ、そのようなプログラムを書くプロセスを表現するには、分散プログラミングが用いられることが多い。
図1の例では、分散処理システム(101)は、並列コンピュータ・ネットワーク(100)、データ記憶デバイス(118)の形態のコンピュータの不揮発性メモリ、プリンタ(120)の形態のコンピュータの出力デバイス、およびコンピュータ端末(122)の形態のコンピュータの入出力デバイスとして実装されている。図1の例の並列コンピュータ・ネットワーク(100)は、複数の計算ノード(102)も含む。各計算ノードは、1つ以上のコンピュータ・プロセッサ、専用のコンピュータ・メモリ、および専用の入出力機能性から成る、自動計算デバイスである。計算ノード(102)は、データ通信のために、いくつかの独立したデータ通信ネットワークによって結合されており、このデータ通信ネットワークには、高速イーサネット(R)ネットワーク(174)、ジョイント・テスト・アクション・グループ(「JTAG:Joint Test Action Group」)ネットワーク(104)、共同動作向けに最適化されたツリー・ネットワーク(106)、およびポイント・ツー・ポイント動作向けに最適化されたトーラス・ネットワーク(108)が含まれる。ツリー・ネットワーク(106)は、計算ノードをツリー構造として編成するように計算ノードに接続されたデータ通信リンクを含む、データ通信ネットワークである。各データ通信ネットワークは、計算ノード(102)間のデータ通信リンクを用いて実装される。データ通信リンクは、並列コンピュータの計算ノード間の並列動作のためのデータ通信を提供する。
並列コンピュータ・ネットワーク(100)は、計算ノードに加えて、データ通信ネットワークの1つ(174)を介して計算ノード(102)に結合された入出力(「I/O:input/output」)ノード(110、114)を含む。I/Oノード(110、114)は、計算ノード(102)と、I/Oデバイス(118、120、122)との間のI/Oサービスを提供する。I/Oノード(110、114)は、ローカル・エリア・ネットワーク(「LAN:local area network」)(130)を介して、データ通信のために接続されている。さらに、並列コンピュータ・ネットワーク(100)は、ネットワークの1つ(104)を介して計算ノードに結合されたサービス・ノード(116)を含む。サービス・ノード(116)は、プログラムを計算ノードへロードすること、計算ノード上でのプログラム実行を開始すること、計算ノード上でのプログラム動作の結果を回収することなど、複数の計算ノードに共通するサービスを提供する。サービス・ノード(116)は、イベントおよびアラート分析モジュール(124)を実行し、コンピュータ端末(122)上で実行されているサービス・アプリケーション・インターフェース(126)を介してシステム管理者(128)と通信する。
図1の分散処理システムのコンポーネント、すなわち、分散処理システムのデバイスまたは図1の分散処理システムのデバイス上で実行されているプロセスの多くは、イベントを介して何らかの形態のエラーまたはステータス・レポーティングを行うことができ、上記のコンポーネントの多くはさらに、そのようなイベントの1つ以上に応答してアラートを受信できる。本発明の実施形態による有用な分散処理システムでは、多くの場合、何十万または何百万ものコンポーネントが、多くの場合はイベントの形態のインシデントの提供またはアラートの受信を行うことができる。
インシデントとは、本明細書で使用される総称であり、以下に記載されるイベントなど、分散処理システムのコンポーネント上での特定の事象(occurrence)の識別情報もしくは通知、または、以下に記載されるアラートなど、多くの場合イベントに基づく、事象の純化された識別情報、または、当業者が想到するであろうその他の通知を指す。
インシデントは、本発明の実施形態によるイベントおよびアラート分析のためにプールにおいて管理される。インシデントのプールは、インシデントの発生時間、インシデント・キューへの記録時間、インシデント・プールに含められた時間、または当業者が想到するであろうその他の時間に基づいて整理されたインシデントの集合である。
図1のサービス・ノード(116)には、イベントおよびアラート分析モジュール(124)がインストールされており、イベントおよびアラート分析モジュール(124)は、本発明の実施形態による、分散処理システムにおけるイベントおよびアラート分析のためにインシデント・プールを管理できるイベント・アナライザおよびアラート・アナライザとして実装された、少なくとも2つのインシデント・アナライザを含む。イベントおよびアラート分析モジュール(124)は、分散処理システムの1つ以上のコンポーネントからの複数のインシデントを受信すること、インシデントのプールであって、所定の初期期間を有するプールを作成すること、受信されたインシデントそれぞれをプールに割り当てること、各インシデントに、プールに含められるべき所定の最短時間を割り当てること、インシデントの1つ以上に関して、そのインシデントに割り当てられている特定の期間、プールの所定の初期期間を延長すること、プールをクローズする条件が満たされたかどうかを判断すること、プールをクローズする条件が満たされた場合、プール内の各インシデントに関して、そのインシデントが、プールに含められるべきその所定の最短時間、プールに入っていたかどうかを判断すること、インシデントが、その所定の最短時間プールに入っていた場合、クローズされたプールにインシデントを含めること、ならびにインシデントが、その所定の最短時間プールに入っていない場合、クローズされたプールからインシデントを取り出し、インシデントを次のプールに含めることができる自動計算機として実装される。
さらに、イベントおよびアラート分析モジュール(124)は、本発明の実施形態による分散処理システムにおいて、イベントおよびアラート抑制を用いた適切なアラート配信を行うことができる。図1のイベントおよびアラート分析モジュール(124)は、分散処理システムの1つ以上のコンポーネントからの複数のイベントを、イベント・キューにおいて受信すること、イベント到着ルール(event arrival rules)、イベント・プール動作ルール(events pool operation rules)、イベント抑制ルール(event suppression rules)、およびイベント・プール・クローズ・ルール(events pool closure rules)を含むイベント分析ルールを含むイベント・アナライザによって、イベント・プールに、受信されたイベントそれぞれを割り当てること、イベント到着ルールと、イベント・プールに割り当てられているイベントとに基づき、イベント・アナライザによって1つ以上のアラートを特定すること、イベント・アナライザによって、イベント・プール動作ルールに基づき、イベント・プールをクローズすること、クローズされたイベント・プール内の1つ以上のイベントを抑制するかどうかを、イベント・アナライザによってイベント抑制ルールに基づき判断すること、ならびに、イベント・アナライザによって、イベント・プール・クローズ・ルールと、イベント・プールに割り当てられている任意の抑制されないイベントとに基づき、1つ以上の追加のアラートを特定すること、イベント・アナライザによって特定されたすべてのアラートを、イベント・アナライザによってアラート・アナライザに送信すること、特定されたアラートを、アラート・アナライザによってアラート・プールに割り当てること、任意のアラートを抑制するかどうかを、アラート・アナライザによって、アラート分析ルールと、アラート・プール内のアラートとに基づき判断すること、ならびに、抑制されないアラートを、分散処理システムの1つ以上のコンポーネントに送ることができる自動計算機として実装される。
一部の実施形態では、抑制されないアラートは、分散処理システムの1つ以上のコンポーネントに送られる。そのようなコンポーネントの1つは、システム管理者に表示するために、コンピュータ端末(122)としてもよい。他のコンポーネントには、イベントを生成したコンポーネント、エラー・レポーティング用のコンポーネント、自動エラー回復用のコンポーネント、またはそのほか当業者が想到するであろう任意のコンポーネントが含まれ得る。
図1のイベントおよびアラート分析モジュール(124)は、任意の時点で、受信されるイベントおよび生成されるアラートなど、発生するインシデントの数を、分散処理システムにおける問題または事象を特定しようと試みるシステム管理者(128)にとって、より扱いやすいものにすることを可能にする。本発明の実施形態による、イベントおよびアラート分析、ならびにイベントおよびアラート抑制を用いる適切なアラートの配信のためのインシデント・プールの管理は、分散処理システムに関連する機能およびエラーの管理方法を判断する際にユーザにとってより意味のあるアラートを提供する。
図1に表されている例示の分散処理システムを構成するノード、ネットワーク、およびI/Oデバイスの構成は、説明のみのためのものであり、本発明を制限するものではない。本発明の実施形態によるイベントおよびアラート分析、ならびに適切なアラートの配信のためにインシデント・プールを管理できる分散データ処理システムは、当業者が想到するであろうように、図1に示されていないさらなるノード、ネットワーク、デバイス、およびアーキテクチャを含んでもよい。図1の例の並列コンピュータ・ネットワーク(100)は、16の計算ノード(102)を含む。本発明の実施形態による適切なアラートの配信を行うことができる並列コンピュータは、何千もの計算ノードを含むこともある。上記のデータ処理システムにおけるネットワークは、イーサネットおよびJTAGに加えて、例えばTCP(Transmission Control Protocol:伝送制御プロトコル)、IP(Internet Protocol:インターネット・プロトコル)、および当業者が想到するであろう他のものを含む、多数のデータ通信プロトコルをサポートし得る。本発明の様々な実施形態は、図1に表されているものに加えて、様々なハードウェア・プラットフォーム上に実装され得る。
本発明による、イベントおよびアラート分析、ならびにイベントおよびアラート抑制を用いる適切なアラートの配信のためのインシデント・プールの管理は、概して、コンピュータ、すなわち自動計算機を用いて実装される。例えば、図1のシステムでは、並列コンピュータのすべてのサービス・ノード、I/Oノード、計算ノードが、少なくともある程度、コンピュータとして実装される。したがって、さらなる説明のために、図2は、本発明の実施形態による適切なアラートの配信で有用な例示のコンピュータ(152)を含む自動計算機のブロック図を示す。図2のコンピュータ(152)は、少なくとも1つのプロセッサ(156)、すなわち「CPU」、ならびにランダム・アクセス・メモリ(168)(「RAM:random access memory」)を含み、RAM(168)は、高速メモリ・バス(166)およびバス・アダプタ(158)を介して、プロセッサ(156)と、コンピュータ(152)の他のコンポーネントとに接続され、さらに、分散処理システム(101)の他のコンポーネントとの通信用のアダプタに、拡張バスを介して接続されている。
RAM(168)には、本発明の実施形態による適切なアラートの配信のための自動計算機のモジュールである、イベントおよびアラート分析モジュール(124)が記憶されている。イベントおよびアラート分析モジュール(124)は、本発明の実施形態による2つのインシデント・アナライザを含む。インシデント・アナライザは、イベント・アナライザ(208)およびアラート・アナライザ(218)を含む。イベント・アナライザ(208)およびアラート・アナライザは、それぞれ、本発明の実施形態による分散処理システムにおけるイベントおよびアラート分析のためにインシデント・プールを管理することができる。本発明の実施形態によれば、イベント・アナライザは、分散処理システムの1つ以上のコンポーネントからの複数のイベントを、イベント・アナライザによってイベント・キューから受信すること、イベントのプールであって、所定の初期期間を有するプールを、イベント・アナライザによって作成すること、受信されたイベントそれぞれを、イベント・アナライザによってプールに割り当てること、イベント・アナライザによって、各イベントに、プールに含められるべき所定の最短時間を割り当てること、イベント・アナライザによって、イベントの1つ以上に関して、そのイベントに割り当てられている特定の期間、プールの所定の初期期間を延長すること、プールをクローズする条件が満たされたかどうかをイベント・アナライザによって判断すること、プールをクローズする条件が満たされた場合、プール内の各イベントに関して、そのイベントが、プールに含められるべきその所定の最短時間、プールに入っていたかどうかを判断すること、イベントが、その所定の最短時間プールに入っていた場合、クローズされたプールにイベントを含めること、ならびにイベントが、その所定の最短時間プールに入っていない場合、クローズされたプールからイベントを取り出し、イベントを次のプールに含めることによって、イベントのプールの管理を行う。
本発明の実施形態によれば、アラート・アナライザは、分散処理システムの1つ以上のコンポーネントからの複数のアラートを、アラート・アナライザによってアラート・キューから受信すること、アラートのプールであって、所定の初期期間を有するプールを、アラート・アナライザによって作成すること、受信されたアラートそれぞれを、アラート・アナライザによってプールに割り当てること、アラート・アナライザによって、各アラートに、プールに含められるべき所定の最短時間を割り当てること、アラート・アナライザによって、アラートの1つ以上に関して、そのアラートに割り当てられている特定の期間、プールの所定の初期期間を延長すること、プールをクローズする条件が満たされたかどうかをアラート・アナライザによって判断すること、プールをクローズする条件が満たされた場合、プール内の各アラートに関して、そのアラートが、プールに含められるべきその所定の最短時間、プールに入っていたかどうかを判断すること、アラートが、その所定の最短時間プールに入っていた場合、クローズされたプールにアラートを含めること、ならびにアラートが、その所定の最短時間プールに入っていない場合、クローズされたプールからアラートを取り出し、アラートを次のプールに含めることによって、アラートのプールの管理を行う。
図2のイベント・アナライザは、受信されたイベントに基づきアラートを特定できる、自動計算機のモジュールである。すなわち、イベント・アナライザは、主として、イベントを受信し、アラートを生成する。多くの実施形態において、複数のイベント・アナライザが並行して実装される。上記のイベント・アナライザは、イベントの特定のプールに割り当てられることが多く、特定のコンポーネントからのイベントまたは特定の事象に起因するイベントに集中して、より簡潔なアラートのセットを生成してもよい。
図2のアラート・アナライザは、送るべきアラートをイベントおよび他のアラートから特定すること、送るべき追加のアラートを特定すること、およびイベント・アナライザによって特定された、不要な、または不適切な、またはその他の理由で望ましくないアラートを抑制することができる、自動計算機のモジュールである。すなわち、アラート・アナライザは、主として、アラートおよびイベントを受信し、そのアラートおよびイベントに基づきアラートを生成または転送する。多くの実施形態において、複数のアラート・アナライザが並行して実装される。上記のアラート・アナライザは、アラートの特定のプールに割り当てられることが多く、特定の属性を持つアラートに集中して、より簡潔なアラートのセットを生成してもよい。
図2のイベントおよびアラート分析モジュール(124)は、分散処理システム(101)の1つ以上のコンポーネント(例えば100、182、181、180および170)からの複数のイベントを、イベント・キューにおいて受信すること、受信されたイベントそれぞれをイベント・アナライザ(208)によってイベント・プールに割り当てること、イベント到着ルールと、イベント・プールに割り当てられているイベントとに基づき、イベント・アナライザ(208)によって1つ以上のアラートを特定すること、イベント・アナライザ(208)によって、イベント・プール動作ルールに基づき、イベント・プールをクローズすること、クローズされたイベント・プール内の1つ以上のイベントを抑制するかどうかを、イベント・アナライザ(208)によってイベント抑制ルールに基づき判断すること、イベント・アナライザ(208)によって、イベント・プール・クローズ・ルールと、イベント・プールに割り当てられている任意の抑制されないイベントとに基づき、1つ以上の追加のアラートを特定すること、イベント・アナライザによって特定されたすべてのアラートを、イベント・アナライザ(208)によってアラート・アナライザ(218)に送信すること、特定されたアラートを、アラート・アナライザ(218)によってアラート・プールに割り当てること、任意のアラートを抑制するかどうかを、アラート・アナライザ(218)によって、アラート分析ルールと、アラート・プール内のアラートとに基づき判断すること、ならびに、抑制されないアラートを、分散処理システムの1つ以上のコンポーネントに送ること(428)のコンピュータ・プログラム命令を含む。
RAM(168)には、オペレーティング・システム(154)も記憶されている。本発明の実施形態による適切なアラートの配信に有用なオペレーティング・システムには、UNIX(TM)、Linux(TM)、Microsoft XP(TM)、AIX(IBM社の登録商標)、IBMのi5/OS(IBM社の登録商標)、および当業者が想到するであろう他のものが含まれる。図2の例のオペレーティング・システム(154)、イベントおよびアラート分析モジュール(124)、イベント・アナライザ(208)、アラート・アナライザ(218)は、RAM(168)内に示されているが、そのようなソフトウェアの多くのコンポーネントは、典型的には、例えばディスク・ドライブ(170)などの不揮発性メモリにも記憶される。
図2のコンピュータ(152)は、拡張バス(160)およびバス・アダプタ(158)を介して、プロセッサ(156)と、コンピュータ(152)のその他のコンポーネントとに結合された、ディスク・ドライブ・アダプタ(172)を含む。ディスク・ドライブ・アダプタ(172)は、不揮発性データ記憶装置を、ディスク・ドライブ(170)の形態でコンピュータ(152)に接続する。本発明の実施形態による適切なアラートの配信のためのコンピュータで有用なディスク・ドライブ・アダプタには、統合ドライブ・エレクトロニクス(「IDE:Integrated Drive Electronics」)アダプタ、小型コンピュータ・システム・インターフェース(「SCSI:Small Computer System Interface」)アダプタ、および当業者が想到するであろう他のものが含まれる。さらに、不揮発性コンピュータ・メモリは、当業者が想到するであろうように、光ディスク・ドライブ、電気的消去可能プログラム可能読み取り専用メモリ(いわゆる「EEPROM:electrically erasable programmable read−only memory」または「フラッシュ」メモリ)、RAMドライブなどとして実装されてもよい。
図2のコンピュータ(152)の例は、1つ以上の入出力(「I/O」)アダプタ(178)を含む。I/Oアダプタは、例えば、コンピュータ・ディスプレイ画面などのディスプレイ・デバイスへの出力、ならびにキーボードおよびマウスなどのユーザ入力デバイス(181)からのユーザ入力を制御するソフトウェア・ドライバおよびコンピュータ・ハードウェアを介して、ユーザ指向の入出力を実装する。図2のコンピュータ(152)の例は、ビデオ・アダプタ(209)を含み、これは、ディスプレイ画面またはコンピュータ・モニタなどのディスプレイ・デバイス(180)へのグラフィック出力用に特別に設計されたI/Oアダプタの例である。ビデオ・アダプタ(209)は、高速ビデオ・バス(164)、バス・アダプタ(158)、および、同じく高速バスであるフロント・サイド・バス(162)を介してプロセッサ(156)に接続されている。
図2の例示のコンピュータ(152)は、その他のコンピュータ(182)とのデータ通信および並列コンピュータ・ネットワーク(100)とのデータ通信用の通信アダプタ(167)を含む。上記のデータ通信は、RS−232接続を介してシリアル方式で、ユニバーサル・シリアル・バス(「USB:Universal Serial Bus」)などの外部バスを介して、IPデータ通信ネットワークなどのデータ通信ネットワークを介して、および当業者が想到するであろう他の方法で実行され得る。通信アダプタは、ハードウェア・レベルのデータ通信を実装し、それを介して1つのコンピュータが別のコンピュータへ直接またはデータ通信ネットワークを介してデータ通信を送信する。本発明の実施形態による適切なアラートの配信に有用な通信アダプタの例には、有線ダイヤルアップ通信用のモデム、有線データ通信ネットワーク通信用のイーサネット(IEEE 802.3)アダプタ、および無線データ通信ネットワーク通信用の802.11アダプタが含まれる。
さらなる説明のために、図3は、本発明の実施形態による、分散処理システム(101)におけるイベントおよびアラート分析ならびに適切なアラートの配信のために、インシデント・プールを管理する例示のシステムのブロック図を示す。図3の方法は、イベント・キュー(206)において、分散処理システム(101)の1つ以上のコンポーネントからの複数のイベント(202)を受信することを含む。本発明の実施形態による分散処理システムのコンポーネントは、分散処理システムのデバイス、または分散処理システムのデバイス上で実行されているプロセスであってもよい。上記のコンポーネントは、多くの場合はエラーまたはステータス・レポーティングのために、何らかの形態のイベント送信ができることが多い。
本発明の実施形態によるイベントは、分散処理システムのコンポーネント内またはコンポーネント上での特定の事象の通知である。本発明によれば、そのようなイベントは、事象が発生したコンポーネントまたは別のレポーティング・コンポーネントから、イベントおよびアラート分析モジュールに送信される。イベントは、データ処理システムのコンポーネントにおいて発生するエラーの通知であることが多い。イベントは、データ通信ネットワークまたは共有メモリのいずれかを介して送信されるメッセージとして実装されることが多い。本発明の実施形態によるイベントおよびアラート分析に関する典型的なイベントは、発生時間、記録時間、イベント・タイプ、イベントID、レポーティング・コンポーネント、およびソース・コンポーネント、ならびにその他の属性を含む。発生時間は、コンポーネント上でイベントが発生した時間である。記録時間は、イベント・キュー(206)にイベントが含められた時間であり、典型的には、図3の例にあるモニタ(204)によってイベントに挿入される。イベント・タイプは、当業者が想到するであろうように、例えば電源エラー、リンク障害エラー、メッセージの未受信またはパケット損失に関するエラーなどの一般的なイベントのタイプである。イベントIDは、イベントの固有の識別情報である。レポーティング・コンポーネントは、イベントをレポートしたコンポーネントの識別情報である。ソース・コンポーネントは、イベントが発生したコンポーネントの識別情報である。すべてではないが、多くの場合、レポーティング・コンポーネントと、ソース・コンポーネントとは、分散処理システムの同一コンポーネントである。
図3の例では、イベントおよびアラート分析モジュール(124)は、分散処理システムのコンポーネントからイベントを受信し、受信されたイベント(202)をイベント・キュー(206)に入れるモニタ(204)を含む。図3のモニタ(204)は、分散処理システムのコンポーネントから、その合図に応じてイベントを受信してもよく、分散処理システムのコンポーネントの1つ以上に定期的にポーリングを行ってもよく、または当業者が想到するであろうその他の方法でコンポーネントからイベントを受信してもよい。
図3のシステムは、イベント・アナライザ(208)を含む。図3のイベント・アナライザ(208)は、受信されたイベントに基づきアラートを特定できる、自動計算機のモジュールである。すなわち、イベント・アナライザは、主として、イベントを受信し、アラートを生成する。多くの実施形態において、複数のイベント・アナライザが並行して実装される。イベント・アナライザは、イベントの特定のプールに割り当てられることが多く、特定のコンポーネントからのイベントまたは特定の事象に起因するイベントに集中して、より簡潔なアラートのセットを生成してもよい。
図3のイベント・アナライザ(208)は、受信されたイベント(202)それぞれをイベント・プール(212)に割り当てる。イベント・プール(212)は、イベントの発生時間、イベント・キューへの記録時間、イベント・プールに含められた時間、または当業者が想到するであろうその他の時間に基づいて整理されたイベントの集合である。すなわち、イベント・プールは、時間に基づいて整理されたイベントの集合である。上記のイベント・プールは、多くの場合、時間に関係するイベントのグループを分析し、それに基づきアラートを特定する能力を提供する。上記のイベント・プールは、関係する複数のイベントに基づき、より少数で、より適切なアラートを特定するのに有用であることが多い。
本発明の実施形態によれば、イベント・プール(212)は、イベント・アナライザ(208)によって管理される。本発明の実施形態によれば、イベント・アナライザは、分散処理システムの1つ以上のコンポーネントからの複数のイベントを、イベント・アナライザによってイベント・キューから受信すること、イベントのプールであって、所定の初期期間を有するプールを、イベント・アナライザによって作成すること、受信されたイベントそれぞれを、イベント・アナライザによってプールに割り当てること、イベント・アナライザによって、各イベントに、プールに含められるべき所定の最短時間を割り当てること、イベント・アナライザによって、イベントの1つ以上に関して、そのイベントに割り当てられている特定の期間、プールの所定の初期期間を延長すること、プールをクローズする条件が満たされたかどうかをイベント・アナライザによって判断すること、プールをクローズする条件が満たされた場合、プール内の各イベントに関して、そのイベントが、プールに含められるべきその所定の最短時間、プールに入っていたかどうかを判断すること、イベントが、その所定の最短時間プールに入っていた場合、クローズされたプールにイベントを含めること、イベントが、その所定の最短時間プールに入っていない場合、クローズされたプールからイベントを取り出し、イベントを次のプールに含めることによって、イベントのプールの管理を行う。
前述のように、図3の方法によるイベント・プールは、所定の初期期間を有する。図3の例では、受信されたイベントそれぞれをイベント・アナライザによってイベント・プールに割り当てることは、イベント・プールに割り当てられる各イベントごとに、そのイベントに割り当てられている特定の期間、所定の初期期間を延長することを含む。このように、アラートを特定するために有益に使用され得るイベントの集合がイベント・プールに割り当てられるまで、受信される各イベントごとにプールが延長される。
上記のように、本発明の一部の実施形態では、2つ以上のイベント・アナライザが並行して動作してもよい。よって、各イベント・アナライザが、本発明の実施形態による適切なアラートの配信のために、1つ以上のイベント・プールを保持してもよい。したがって、イベント・アナライザによってイベントをイベント・プールに割り当てることは、1つ以上の特定のコンポーネントからのイベントのみを選択することを含んでもよい。そのような実施形態では、特定のイベント・プールに対して、特定のコンポーネントが選択されて、1つ以上のコンポーネントの特定のセットからの、特定の期間に関連するイベントが提供されてもよい。
さらに、イベント・アナライザによる、イベントのイベント・プールへの割り当ては、特定のイベント・タイプのイベントのみを選択することによって実行されてもよい。そのような実施形態では、特定のイベント・プールに対して、特定のイベントが選択されて、イベント・タイプの特定のセットからの、特定の期間に関連するイベントが提供されてもよい。
図3の例にあるイベント・アナライザ(208)は、イベント分析ルール(210)と、イベント・プールに割り当てられているイベントとに基づき、1つ以上のアラート(214)を特定する。イベント分析ルール(210)は、受信されたイベントを意味があるように構文解析し、イベントに基づき適切なアラートを特定するための、所定のルールの集合である。
図3のイベント分析ルール(210)は、イベント到着ルール(230)、イベント・プール動作ルール(232)、イベント抑制ルール(234)、およびイベント・プール・クローズ・ルール(236)を含む。イベント到着ルール(230)は、イベントがイベント・プールに割り当てられるときに、それらのイベントに基づき、リアル・タイムでアラートを特定するための、設定可能な所定のルールである。すなわち、イベント到着ルール(230)は、イベント・プールをクローズする前に、イベントに基づきアラートを特定する。上記のルールは、主として、当該イベントの属性に基づき特定のアラートを特定するよう、あらかじめ定められる。イベント到着ルールは、例えば、イベントの特定のイベント・タイプもしくはコンポーネント・タイプ、またはそのイベントの他の属性に基づき、システム管理者に送る所定の特定のアラートを特定することを指示してもよい。上記のルールには柔軟性があり、特定の分散計算システムおよびその機能に合わせられてもよい。
本発明の実施形態によるアラートは、2つ以上のイベントに基づく、エラーなどの事象の純化された識別情報であり、したがって、分散処理システムにおける事象の影響との関連で、事象の識別情報を提供する。多くの場合、アラートは、データ処理システムの1つ以上のコンポーネントから受信された複数のイベントに基づき特定される、特定のエラー・タイプの事象、例えば単一のリンク障害に基づいて多数のイベントをそれぞれ生成する複数のデバイスの間のリンク障害、または多数のイベントを引き起こす電源障害などの通知であり得る。
アラートは、データ通信ネットワークまたは共有メモリを介して送信されるメッセージとして実装されることが多い。本発明の実施形態による典型的なアラートは、アラートが特定されるもととなった受信イベントの属性に基づいて付加された属性を有する。
イベント・プール動作ルール(232)は、イベント・プールの動作を制御するための、設定可能な所定のルールである。上記のルールは、各イベント・プールの所定の初期期間を特定するルール、新たなイベントそれぞれがプールに割り当てられるとプールが延長される時間の長さを指示するルール、プールがクローズされるときにイベントの集合にイベントが含められるために、それまでにそのイベントがプールに入っていなければならない最短時間を指示するルール、イベント・プールのクローズを制御するルール、および当業者が想到するであろう他のものを含む。上記のルールには柔軟性があり、特定の分散計算システムおよびその機能に合わせられてもよい。
イベント抑制ルール(234)は、アラートの特定に使用されるクローズされたイベントのプール内の1つ以上のイベントを抑制するための、設定可能な所定のルールである。すなわち、多くの場合、クローズされたイベント・プール内のイベントは、重複したイベントであること、冗長なイベントであること、もしくはその他の理由でアラートの特定に不要である、または役に立たないイベントであることがある。上記の抑制ルールは、主として、抑制される当該イベントを、削除、廃棄、またはその他の形で無視するようあらかじめ定められる。イベント抑制ルールは、例えば、特定のイベント・タイプまたはコンポーネント・タイプの、閾値数を超えるイベントが抑制されるよう指示してもよい。上記のルールにも柔軟性があり、特定の分散計算システムおよびその機能に合わせられてもよい。
イベント・プール・クローズ・ルール(236)は、クローズされたイベント・プール内の抑制されないイベントと、イベント到着ルールによって特定されたアラートとに基づきアラートを特定するための、設定可能な所定のルールである。すなわち、イベント・プール・クローズ・ルールは、クローズされたイベント・プール内の、1つ以上の抑制されないイベントに基づき、または抑制されないイベントすべてにさえも基づき、新たなアラートを特定する。さらに、イベント・プール・クローズ・ルールは、イベント到着ルール(230)によって特定されたアラートに基づき、またはイベント到着ルール(230)によって特定されたアラートと、クローズされたイベント・プール内の抑制されないイベントのうちの1つ以上との組み合わせに基づき、アラートを特定する。
図3の例にあるイベント・アナライザ(208)は、イベント・アナライザ(208)によって特定されたすべてのアラート(214)をアラート・アナライザ(218)に送信する。図3のアラート・アナライザは、送るべきアラートをイベントおよび他のアラートから特定すること、送るべき追加のアラートを特定すること、およびイベント・アナライザによって特定された、不要な、または不適切な、またはその他の理由で望ましくない、もしくは役に立たないアラートを抑制することができる、自動計算機のモジュールである。すなわち、アラート・アナライザは、主として、アラートおよびイベントを受信し、そのアラートおよびイベントに基づきアラートを生成または転送する。多くの実施形態において、複数のアラート・アナライザが並行して実装される。図3の例にあるアラート(214)は、イベント・アナライザ(208)から、アラート・アナライザ(218)にアラート・キュー(216)を介して送信される。
図3のアラート・アナライザ(218)は、特定されたアラート(214)それぞれをアラート・プール(224)に割り当てる。アラート・プール(224)は、アラートの特定をもたらす1つ以上のイベントの時間、アラートの特定時間、または当業者が想到するであろう他の時間に基づいて整理されたアラートの集合である。すなわち、アラート・プールは、時間に基づいて整理されたアラートの集合である。上記のアラート・プールは、多くの場合、特定されて何らかの時間に従いアラート・プールに含められた、アラートのグループを分析する能力を提供する。上記のアラート・プールは、関係する複数のイベントおよび関係する複数のアラートに基づき、より少数で、より適切なアラートを特定するのに有用であることが多い。
本発明の実施形態によれば、アラート・アナライザは、分散処理システムの1つ以上のコンポーネントからの複数のアラートを、アラート・アナライザによってアラート・キューから受信すること、アラートのプールであって、所定の初期期間を有するプールを、アラート・アナライザによって作成すること、受信されたアラートそれぞれを、アラート・アナライザによってプールに割り当てること、アラート・アナライザによって、各アラートに、プールに含められるべき所定の最短時間を割り当てること、アラート・アナライザによって、アラートの1つ以上に関して、そのアラートに割り当てられている特定の期間、プールの所定の初期期間を延長すること、プールをクローズする条件が満たされたかどうかをアラート・アナライザによって判断すること、プールをクローズする条件が満たされた場合、プール内の各アラートに関して、そのアラートが、プールに含められるべきその所定の最短時間、プールに入っていたかどうかを判断すること、アラートが、その所定の最短時間プールに入っていた場合、クローズされたプールにアラートを含めること、アラートが、その所定の最短時間プールに入っていない場合、クローズされたプールからアラートを取り出し、アラートを次のプールに含めることによって、アラートのプールの管理を行う。
アラート・アナライザは、特定されたアラートを、アラートの属性または当該のアラートが特定されるもととなったイベントの属性に基づき、アラート・プール(224)に割り当ててもよい。例えば、図3のアラート・アナライザは、当業者が想到するであろうように、1つ以上の特定のコンポーネントからのイベントから生じたアラート、特定のアラート・タイプに関連するアラートを選択することなどによって、アラートをアラート・プール(224)に割り当ててもよい。
図3のアラート・アナライザ(218)は、任意のアラートを抑制するかどうかを、アラート分析ルール(222)と、アラート・プール内のアラートとに基づき判断する。アラートの抑制は、典型的には、アラートを廃棄すること、アラートを削除すること、または別の形で、無視すること、または抑制されるアラートを分散処理システムのコンポーネントに送らないことによって実行される。
アラート分析ルール(222)は、例えばシステム管理者に表示するためなどに分散処理システムのコンポーネントに送られるより適切なアラートのセットを提供し、分散処理システムの1つ以上のコンポーネントに送られる追加のアラートを特定するために、1つ以上のアラートを抑制するルールの集合である。例えば、アラート分析ルールは、当業者が想到するであろうように、重複したアラートが抑制されること、特定のコンポーネントに送られる特定のタイプのアラートが抑制されることなどを指示してもよい。上記のアラートは、自動エラー回復用の分散処理システムのコンポーネントにとって、またはシステム管理者にとって、より意味があるものであってもよい。システム管理者は、他の場合であれば、いくつかの分析されていない生のアラートによって、より少ない情報しか与えられないと考えられる。
さらに、図3のアラート・アナライザ(218)は、イベント・キュー(206)にアクセスできる。一部の実施形態では、図3のアラート・アナライザ(218)は、アラート分析ルールに基づき、イベント・キューからイベントを選択し、任意のアラートを抑制するかどうかを、選択されたイベントに基づき判断してもよい。すなわち、アラート分析ルールは、アラートの抑制、および1つ以上のコンポーネントに送る追加のアラートの特定に関して、イベントおよびその属性も考慮に入れてもよい。上記のイベントは、アラート・プール内のアラートに関係してもよく、またはそうしたアラートからは独立していてもよい。
図3のアラート・アナライザ(218)は、抑制されないアラートを、分散処理システムの1つ以上のコンポーネントに送る。アラート・アナライザは、アラートをメッセージとして、データ通信ネットワークを通して、または共有メモリを介して、または当業者が想到するであろうその他の方法で送信することによって、抑制されないアラートを分散処理システムの1つ以上のコンポーネントに送ってもよい。図3の例では、抑制されないアラート(220)は、システム管理者(128)に対して表示されるようコンピュータ端末(122)に送られる。
さらに、図3のアラート・アナライザ(218)は、アラート分析ルール(222)、アラート・プール(224)内のアラート、および選択されたイベント(202)に基づき、1つ以上の追加のアラートを特定し、分散処理システムの1つ以上のコンポーネントに送ることができる。追加のアラートは、イベント・アナライザによって特定されていない1つ以上のアラートを含んでもよい。そのような追加のアラートは、システム管理者の、分散処理システムのコンポーネントに、追加情報を提供してもよい。
上記のように、本発明による適切なアラートの配信は、イベントをイベント・プールに割り当てることを含み、そのプールは、本発明の実施形態に従って管理される。さらなる説明のために、図4は、本発明の実施形態による、イベント・プールへのイベントの割り当てを表す図を示す。イベント・プール(212)は、イベントの発生時間、イベント・キューへの記録時間、イベント・プールに含められた時間、または当業者が想到するであろうその他の時間に基づいて整理されたイベントの集合である。すなわち、イベント・プールは、時間に基づいて整理されたイベントの集合である。上記のイベント・プールは、多くの場合、時間に関係するイベントのグループを分析し、それに基づきアラートを特定する能力を提供する。上記のイベント・プールは、関係する複数のイベントに基づき、より少数で、より適切なアラートを特定するのに有用であることが多い。
本発明の実施形態によるイベント・プールは、主として、イベント・プール動作ルールに従って動作させられ、多くの場合、このルール自体はイベント分析ルールに含まれる。上記のイベント・プール動作ルールは、イベント・プールの動作を制御するための、設定可能な所定のルールである。上記のルールは、各イベント・プールの所定の初期期間を特定するルール、新たなイベントそれぞれがプールに割り当てられるとプールが延長される時間の長さを指示するルール、プールがクローズされるときにイベントの集合にイベントが含められるために、それまでにそのイベントがプールに入っていなければならない最短時間を指示するルール、イベント・プールのクローズを制御するルール、および当業者が想到するであろう他のものを含む。上記のルールには柔軟性があり、特定の分散計算システムおよびその機能に合わせられてもよい。
多くの場合、イベントは、記録時間に従いイベント・プールに割り当てられる。すなわち、イベントは、典型的には、イベント・キューにおいて受信された順序でイベント・プールに挿入される。図4の例では、イベント・プール(212)のタイミングは、第1のイベント「イベント0」(400)が、時間tにイベント・プール(212)に割り当てられたときに開始される。図4のイベント・プールは、所定の初期期間t〜tで開始される。すなわち、第1のイベント「イベント0」(400)を受信すると、図4のイベント・プールは、tに始まりtに終わる所定の初期期間を有する。所定の初期期間は、当業者が想到するであろうように、分散処理システム内のコンポーネントの数、イベント受信の頻度、主に受信されるイベントのタイプなど、当業者が想到するであろういつくかの要因に基づき設定してもよい。
図4の例では、所定の初期期間t〜tの間イベント・プールに割り当てられる新たなイベントごとに、そのイベントに割り当てられている特定の期間、初期期間が延長される。図4の例では、「イベント1」(402)をイベント・プール(212)に割り当てると、所定の初期期間t〜tが、時間e1を有する「延長1」(406)延長され、それによって新たな時間がもたらされ、tf+e1より前にプールに他のイベントが割り当てられなければtf+e1にイベント・プール(212)がクローズされる。同じく、図4の例では、時間e2を有する「イベント2」(404)をイベント・プールに割り当てると、そのときすでに延長されている期間t〜tf+e1が、再び延長2(408)延長され、それによって新たな時間が規定され、tf+e1+e2より前、またはイベント・プールの何らかの最長時間が終了する前にプールに他のイベントが割り当てられなければ時間tf+e1+e2にプールがクローズされる。このように、アラートを特定するために有益に使用され得るイベントの集合がイベント・プールに割り当てられるまで、受信される各イベントごとにイベント・プールが延長される。
本発明の典型的な実施形態では、イベント・プールは、それ以上は延長できない最長持続時間を有してもよい。そのような場合には、閾値期間イベント・プールになかったイベントは、次のイベント・プールに移動される、という要求事項が存在してもよい。一部の実施形態では、次のイベント・プールに移動されるそうしたイベントの属性は、最初のイベント・プールを用いる本発明の実施形態による適切なアラートの配信に使用され、他の実施形態では、そうしたイベントの属性は、そのイベントの移動先である次のイベント・プールを用いる適切なアラートの配信に使用される。
図4の例では、プールをクローズする条件が満たされると、イベント・アナライザは、イベント・プール(212)内の各イベント(400、402、404)に関して、そのイベントが、プールに含められるべきその所定の最短時間、プールに入っていたかどうかを判断する。イベントが、その所定の最短時間プールに入っていた場合、イベントは、本発明の実施形態による適切なアラートの配信のためのイベント分析のために、クローズされたプールに含められる。イベントが、その所定の最短時間プールに入っていない場合、イベントは、クローズされたプールから取り出され、本発明の実施形態による適切なアラートの配信のためのイベント分析のために、次のプールに含められる。
多くの実施形態では、複数のイベント・プールが並行して使用されてもよく、そのようなイベント・プールの1つ以上が、特定のイベント・アナライザに割り当てられる。そのような実施形態では、イベント・アナライザは、特定の属性を有するイベント・プール内のイベントを対象としてもよい。
上記のように、本発明による適切なアラートの配信は、さらに、アラート・プールにアラートを割り当てることを含む。さらなる説明のために、図5は、本発明の実施形態による、アラート・プールへのアラートの割り当てを表す図を示す。図5のアラート・プール(224)は、図4のイベント・プールと似た形で動作する。すなわち、図5の例によるアラート・プールは、アラートを含み、アラート・プールのタイミングは、第1のアラート「アラート0」(500)により時間tに始まり、所定の初期期間t〜tを有するよう設定されている。図5の例では、所定の初期期間t〜tにアラート・プールに割り当てられる新たなアラートごとに、そのアラートに割り当てられている特定の期間、初期期間が延長される。図5の例では、「アラート1」(502)をアラート・プール(224)に割り当てると、所定の初期期間t〜tが、時間e1を有する「延長1」(506)延長され、それによって新たな時間がもたらされ、tf+e1より前にプールに他のアラートが割り当てられなければtf+e1にアラート・プール(224)がクローズされる。同じく、図5の例では、時間e2を有する「アラート2」(504)をアラート・プールに割り当てると、そのときすでに延長されている期間t〜tf+e1が、再び「延長2」(508)延長され、それによって新たな時間が規定され、tf+e1+e2より前、またはアラート・プールの何らかの最長時間が終了する前にプールに他のアラートが割り当てられなければ時間tf+e1+e2にプールがクローズされる。
本発明の典型的な実施形態では、アラート・プールは、それ以上は延長できない最長持続時間を有してもよい。そのような場合には、閾値期間アラート・プールになかったアラートは、次のアラート・プールに移動される、という要求事項が存在してもよい。一部の実施形態では、次のアラート・プールに移動されるそうしたアラートの属性は、最初のアラート・プールを用いる本発明の実施形態による適切なアラートの配信に使用され、他の実施形態では、そうしたアラートの属性は、そのアラートの移動先である次のアラート・プールを用いる適切なアラートの配信に使用される。
図5の例では、プールをクローズする条件が満たされると、アラート・アナライザは、アラート・プール(224)内の各アラート(500、502、504)に関して、そのアラートが、プールに含められるべきその所定の最短時間、プールに入っていたかどうかを判断する。アラートが、その所定の最短時間プールに入っていた場合、アラートは、本発明の実施形態による適切なアラートの配信のためのアラート分析のために、クローズされたプールに含められる。アラートが、その所定の最短時間プールに入っていない場合、アラートは、クローズされたプールから取り出され、本発明の実施形態による適切なアラートの配信のためのアラート分析のために、次のプールに含められる。
多くの実施形態では、複数のアラート・プールが並行して使用されてもよく、そのようなアラート・プールの1つ以上が、特定のアラート・アナライザに割り当てられる。そのような実施形態では、アラート・アナライザは、特定の属性を有するアラート・プール内のアラートを対象としてもよい。
さらなる説明のために、図6は、本発明の実施形態による、分散処理システムにおけるイベントおよびアラート抑制を用いた適切なアラートの配信方法の例を表すフローチャートを示す。図6の方法は、分散処理システムの1つ以上のコンポーネントからの複数のイベント(202)を、イベント・キューにおいて受信すること(402)を含む。本発明の実施形態による、イベントおよびアラート抑制を用いる適切なアラートの配信において有用なイベントは、発生時間、記録時間、イベント・タイプ、イベントID、レポーティング・コンポーネント、およびソース・コンポーネントを含み得る。
分散処理システムの1つ以上のコンポーネントからの複数のイベント(202)を、イベント・キューにおいて受信すること(402)は、データ処理システムの1つ以上のコンポーネントによって開始されたイベントを受信して、イベントが発生した時間に従って、またはイベントが受信された時間に従って、イベントをイベント・キューに記憶することによって実行されてもよい。さらに、分散処理システムの1つ以上のコンポーネントからの複数のイベント(202)を、イベント・キューにおいて受信すること(402)は、ステータスに関してコンポーネントにポーリングを行ってそれに応答してイベントを受信し、イベントが発生した時間に従って、またはイベントが受信された時間に従って、イベントをイベント・キューに記憶することによって実行されてもよい。
さらに、図6の方法は、受信されたイベントそれぞれを、イベント・アナライザによってイベント・プール(212)に割り当てること(404)を含む。本発明の一部の実施形態では、受信されたイベント(202)それぞれを、イベント・アナライザによってイベント・プール(212)に割り当てること(404)は、イベントを、記録時間に従ってイベント・プールに割り当てることによって実行されてもよい。さらに、受信されたイベント(202)それぞれを、イベント・アナライザによってイベント・プール(212)に割り当てること(404)は、イベントの属性に基づき実行されてもよい。上記の属性は、当業者が想到するであろうように、イベントを作成する事象が発生したコンポーネントの識別情報またはタイプ、イベントのレポーティング・コンポーネント、イベントID、イベント・タイプなどを含んでもよい。
図6の方法によるイベント・プールは、所定の初期期間の間に発生するイベントを含み、図6の例では、受信されたイベントそれぞれをイベント・アナライザによってイベント・プールに割り当てること(404)は、イベント・プールに割り当てられる各イベントごとに、そのイベントに割り当てられている特定の期間、所定の初期期間を延長すること(432)を含む。
イベント・アナライザは、イベント到着ルール、イベント・プール動作ルール、イベント抑制ルール、およびイベント・プール・クローズ・ルールを含む、イベント分析ルール(210)を含む。イベント到着ルールは、イベントがイベント・プールに割り当てられるときに、それらのイベントに基づき、リアル・タイムでアラートを特定するための、設定可能な所定のルールである。すなわち、イベント到着ルールは、イベント・プールをクローズする前に、イベントに基づきアラートを特定する。上記のルールには柔軟性があり、特定の分散計算システムおよびその機能に合わせられてもよい。
本発明の実施形態によるアラートは、2つ以上のイベントに基づく、エラーなどの事象の純化された識別情報であり、したがって、分散処理システムにおける事象の影響との関連で、事象の識別情報を提供する。多くの場合、アラートは、データ処理システムの1つ以上のコンポーネントから受信された複数のイベントに基づき特定される、特定のエラー・タイプの事象、例えば単一のリンク障害に基づいて多数のイベントをそれぞれ生成する複数のデバイスの間のリンク障害、または多数のイベントを引き起こす電源障害などの通知であり得る。
アラートは、データ通信ネットワークまたは共有メモリを介して送信されるメッセージとして実装されることが多い。本発明の実施形態による典型的なアラートは、アラートが特定されるもととなった受信イベントの属性に基づいて付加された属性を有する。
イベント・プール動作ルールは、イベント・プールの動作を制御するための、設定可能な所定のルールである。上記のルールは、各イベント・プールの所定の初期期間を特定するルール、新たなイベントそれぞれがプールに割り当てられるとプールが延長される時間の長さを指示するルール、プールがクローズされるときにイベントの集合にイベントが含められるために、それまでにそのイベントがプールに入っていなければならない最短時間を指示するルール、イベント・プールのクローズを制御するルール、および当業者が想到するであろう他のものを含む。上記のルールには柔軟性があり、特定の分散計算システムおよびその機能に合わせられてもよい。
イベント抑制ルールは、アラートの特定に使用されるクローズされたイベントのプール内の1つ以上のイベントを抑制するための、設定可能な所定のルールである。すなわち、多くの場合、クローズされたイベント・プール内のイベントは、重複したイベントであること、冗長なイベントであること、もしくはその他の理由でアラートの特定に不要である、または役に立たないイベントであることがある。上記の抑制ルールは、主として、抑制される当該イベントを、削除、廃棄、またはその他の形で無視するようあらかじめ定められる。イベント抑制ルールは、例えば、特定のイベント・タイプまたはコンポーネント・タイプの、閾値数を超えるイベントが抑制されるよう指示してもよい。上記のルールにも柔軟性があり、特定の分散計算システムおよびその機能に合わせられてもよい。
イベント・プール・クローズ・ルールは、クローズされたイベント・プール内の抑制されないイベントと、イベント到着ルールによって特定されたアラートとに基づきアラートを特定するための、設定可能な所定のルールである。すなわち、イベント・プール・クローズ・ルールは、クローズされたイベント・プール内の、1つ以上の抑制されないイベントに基づき、または抑制されないイベントすべてにさえも基づき、新たなアラートを特定する。さらに、イベント・プール・クローズ・ルールは、イベント到着ルールによって特定されたアラートに基づき、またはイベント到着ルールによって特定されたアラートと、クローズされたイベント・プール内の抑制されないイベントのうちの1つ以上との組み合わせに基づき、アラートを特定する。
さらに、図6の例の方法は、イベント到着ルールと、イベント・プールに割り当てられているイベントとに基づき、イベント・アナライザによって1つ以上のアラート(214)を特定すること(410)を含む。イベント到着ルールと、イベント・プールに割り当てられているイベントとに基づき、イベント・アナライザによって1つ以上のアラート(214)を特定すること(410)は、イベントがイベント・プールに割り当てられるときに、そのイベントの1つ以上の属性に基づきアラートを特定することによって実行されてもよい。イベント到着ルールと、イベント・プールに割り当てられているイベントとに基づき、イベント・アナライザによって1つ以上のアラート(214)を特定すること(410)は、イベントの属性と、イベント到着ルールとを比較して、比較の結果として1つ以上のアラートを特定することによって実行されてもよい。上記の属性には、イベントが受信されたもとのコンポーネントのタイプ、イベントを作成するコンポーネントのタイプ、イベントを作成するコンポーネントの識別情報、イベントが作成または受信された時間、イベント内でレポートされているエラー、および当業者が想到するであろう多数の他のものが含まれ得る。
さらに、図6の方法は、イベント・アナライザによって、イベント・プール動作ルールに基づき、イベント・プール(212)をクローズすること(412)を含む。イベント・アナライザによって、イベント・プール動作ルールに基づき、イベント・プール(212)をクローズすること(412)は、イベント・プール動作ルールによって指示されている、新たなイベントのイベント・プールへの割り当てを停止する条件が満たされたと判断し、クローズされたイベントのプールに含められる特定のイベントを、そうしたイベント・プール動作ルールに基づき特定することによって実行されてもよい。
イベント・プールをクローズすることは、イベント・プールの初期期間と、初期期間に対する延長となった、イベント・プールにおいて受信されたイベントの任意の特定の期間とが終了したと判断することによって実行されてもよい。そのような場合には、イベント・プールの初期期間と、初期期間に対する延長となった、イベント・プールにおいて受信されたイベントの任意の特定の期間とが終了する前に、新たなイベントが受信されなければ、プールはクローズされる。
さらに、イベント・プールをクローズすることは、イベント・プールの最長持続時間が終了したと判断することによって実行されてもよい。そのような場合には、イベント・プールの最長持続時間が終了した後に受信される新たなイベントの数にかかわらず、プールはクローズされる。そのような実施形態では、イベント・プールの最長持続時間によって、本発明の実施形態による適切なアラートの配信に有用な数を超えるイベントをイベント・プールが含むことが防がれる。
さらに、図6の方法は、イベント・アナライザによって、イベント抑制ルールに基づき、クローズされたイベント・プール(212)内の1つ以上のイベントを抑制するかどうかを判断すること(414)を含む。イベント・アナライザによって、イベント抑制ルールに基づき、クローズされたイベント・プール(212)内の1つ以上のイベントを抑制するかどうかを判断すること(414)は、クローズされたプール内の1つ以上のイベントの属性に基づき、クローズされたプール内のイベントのうちの1つ以上を、削除、廃棄、またはその他の形で無視するかどうかを判断することによって実行されてもよい。
図6の方法は、イベント・アナライザによって、イベント・プール・クローズ・ルールと、イベント・プールに割り当てられている任意の抑制されないイベントとに基づき、1つ以上の追加のアラート(417)を特定すること(416)を含む。イベント・アナライザによって、イベント・プール・クローズ・ルールと、イベント・プールに割り当てられている任意の抑制されないイベントとに基づき、1つ以上の追加のアラート(417)を特定すること(416)は、イベントがイベント・プールに割り当てられるときに、そのイベントの1つ以上の属性に基づきアラートを特定することによって実行されてもよい。イベント・アナライザによって、イベント・プール・クローズ・ルールと、イベント・プールに割り当てられている任意の抑制されないイベントとに基づき、1つ以上の追加のアラート(417)を特定すること(416)は、イベント・プールの抑制されないイベントを選択し、イベント・プールの抑制されないイベントの属性と、プール・クローズ・ルールとを比較し、比較の結果として1つ以上の追加のアラートを特定することによって実行されてもよい。上記の属性には、抑制されないイベントの1つ以上が受信されたもとのコンポーネントのタイプ、抑制されないイベントを作成するコンポーネントのタイプ、抑制されないイベントを作成するコンポーネントの識別情報、イベントが作成または受信された時間、イベントによってレポートされている1つ以上のエラー、プール内のイベントの数、および当業者が想到するであろう多数の他のものが含まれ得る。
図6の方法は、イベント・アナライザによって特定されたすべてのアラートを、イベント・アナライザによってアラート・アナライザに送信すること(418)を含む。イベント・アナライザによって特定されたすべてのアラート(214)を、イベント・アナライザによってアラート・アナライザに送信すること(418)は、イベント・アナライザからアラート・アナライザに、アラートを含むメッセージを送信することによって実行されてもよい。そのようなメッセージは、イベント・アナライザからアラート・アナライザに、ネットワークを通して、または共有メモリを介して、または当業者が想到するであろう他の方法で送信されてもよい。
図6の方法は、特定されたアラートを、アラート・アナライザによってアラート・プール(224)に割り当てること(420)を含む。図6の方法によるアラート・プールは、所定の初期期間を有する。図6の例では、特定されたアラートをアラート・アナライザによってアラート・プール(224)に割り当てること(420)は、アラート・プールに割り当てられる各アラートごとに、そのアラートに割り当てられている特定の期間、所定の初期期間を延長することを含む。さらに、特定されたアラートを、アラート・アナライザによってアラート・プール(224)に割り当てること(420)は、アラートの属性に基づき実行されてもよい。そうした属性は、当業者が想到するであろうように、アラートの特定に使用されたイベントを作成する事象が発生したコンポーネントの識別情報またはタイプ、アラートID、アラート・タイプなどを含んでもよい。
図6の方法は、任意のアラートを抑制するかどうかを、アラート・アナライザによって、アラート分析ルール(222)と、アラート・プール内のアラートとに基づき判断すること(422)を含む。任意のアラートを抑制するかどうかを、アラート・アナライザによって、アラート分析ルール(222)と、アラート・プール内のアラートとに基づき判断すること(422)は、アラートの1つ以上の属性に基づき実行されてもよい。そのような属性は、当業者が想到するであろうように、アラートの特定に使用されたイベントを作成する事象が発生したコンポーネントの識別情報またはタイプ、アラートID、アラート・タイプなどを含んでもよい。そのような実施形態では、任意のアラートを抑制するかどうかを、アラート・アナライザによって、アラート分析ルール(222)と、アラート・プール内のアラートとに基づき判断すること(422)は、アラート・プール内のアラートの属性と、アラート分析ルールとを比較して、比較の結果として、アラート分析ルールに従って、抑制される1つ以上のアラートを特定することによって実行されてもよい。
図6の方法は、抑制されないアラートを、分散処理システムの1つ以上のコンポーネントに送ること(428)を含む。抑制されないアラートを分散処理システムの1つ以上のコンポーネントに送ること(428)は、アラートを含むメッセージを分散処理システムの1つ以上のコンポーネントに送信することによって実行されてもよい。多くの場合、アラートは、メッセージとしてシステム管理者に送信され、分散処理システム内での1つ以上の事象についてシステム管理者に報告してもよい。
上記のように、アラート分析ルールは、イベントに基づき、追加のアラートを選択しても、またはアラートを抑制してもよい。そのような実施形態では、任意のアラートを抑制するかどうかを判断することは、イベントを選択して、その選択されたイベントに基づき、任意のアラートを抑制するかどうかを判断することを含む。したがって、図6の方法はさらに、アラート・アナライザによって、アラート分析ルール(222)、アラート・プール(224)内のアラート、および任意の選択されたイベントに基づき、1つ以上の追加のアラートを特定すること(426)を含み、図6の方法では、抑制されないアラートを送ること(428)はさらに、任意の追加のアラートを、分散処理システムの1つ以上のコンポーネントに送ること(430)を含む。
上記のように、本発明の実施形態による適切なアラートの配信は、イベント、アラート、または当業者が想到するであろうその他のインシデントなどのインシデントの1つ以上のプールの管理を含む。さらなる説明のために、図7は、本発明の実施形態による、分散処理システムにおけるイベントおよびアラート分析のためにインシデント・プールを管理する例示の方法を表すフローチャートを示す。図7の方法は、分散処理システムの1つ以上のコンポーネントからの複数のインシデント(704)を、インシデント・アナライザによってイベント・キューから受信すること(702)を含む。図7のインシデントは、イベントとして実装されてもよく、インシデントのプールは、イベント・プールとして実装されてもよい。さらに、図7のインシデントは、アラートとして実装されてもよく、インシデントのプールは、アラート・プールとして実装されてもよい。
分散処理システムの1つ以上のコンポーネントからの複数のインシデント(704)を、インシデント・アナライザによってインシデント・キューから受信すること(702)は、上記で説明したように、イベント・アナライザによってイベント・キューからイベントを受信することによって実行されてもよい。上記のイベントは、分散処理システムの1つ以上のコンポーネントから送信されてもよい。さらに、分散処理システムの1つ以上のコンポーネントからの複数のインシデント(704)を、インシデント・アナライザによってインシデント・キューから受信すること(702)は、上記で説明したように、アラート・アナライザによって、アラート・キューからアラートを受信することによって実行されてもよい。上記のアラートは、上記で説明したように、イベント・アナライザによって生成されてもよい。
図7の方法は、インシデントのプール(708)であって、所定の初期期間を有するプールを、インシデント・アナライザによって作成すること(706)を含む。図7の方法は、インシデント・アナライザによって、インシデントのプール(708)を作成すること(706)を含み、これは、イベントまたはアラートを含めるデータ構造を作成し、イベント、アラート、または当業者が想到するであろうその他のインシデントを当該データ構造内に含める初期期間を、当該データ構造に対して規定することによって実行されてもよい。
さらに、図7の方法は、受信されたインシデントそれぞれを、インシデント・アナライザによってプールに割り当てること(710)を含む。受信されたインシデントそれぞれを、インシデント・アナライザによってプールに割り当てること(710)は、インシデントの属性に基づき実行されてもよい。受信されたインシデントそれぞれをプールに割り当てること(710)は、例えば、当業者が想到するであろうように、イベントを作成するコンポーネント、イベント・タイプ、アラート・タイプ、イベントをレポートするコンポーネント、イベントに基づきアラートが作成された該イベントをレポートまたは作成したコンポーネントなどの属性に基づき、イベント、アラート、またはその他のインシデントを選択することによって実行されてもよい。
さらに、図7の方法は、プール(708)に含められるべき所定の最短時間(714)を、各インシデントにインシデント・アナライザによって割り当てること(712)を含む。プールに含められるべき所定の最短時間(714)は、典型的には、プールの初期期間よりも短く、その結果、最初に到着するインシデントは、インシデントのプールがクローズされるときにそのプールに含まれる。所定の最短時間は、当業者が想到するであろうように、インシデントの属性によって異なってもよい。インシデントの属性によって異なる最短時間を考慮することによって、様々な形態の分散処理システムにおける本発明の実施形態によるプールの管理における柔軟性が提供される。
図7の方法は、インシデント・アナライザによって、インシデントの1つ以上に関して、そのインシデントに割り当てられている特定の期間、プール(708)の所定の初期期間を延長すること(716)を含む。所定の初期期間が延長される特定の期間は、インシデントのタイプ、インシデントの識別情報、インシデントが作成された、または送られたコンテキスト、および当業者が想到するであろう他のものなどのインシデントの属性によって決まってもよい。
さらに、図7の方法は、プール(708)をクローズする条件が満たされたかどうかを、インシデント・アナライザによって判断すること(718)を含む。プール(708)をクローズする条件が満たされたかどうかを、インシデント・アナライザによって判断すること(718)は、プールの最長時間が経過したかどうかを判断することによって実行されてもよい。プールに対して規定される最長時間は、主として、分散処理システムのサイズ、分散処理システムのコンポーネント、分散処理システムの計算上の要求事項、および当業者が想到するであろう他のものなどの、分散処理システムの要素によって決まる。典型的には、最長時間は、意味のあるイベントまたはアラート分析に十分なインシデントをプールに蓄積できるよう十分に長く、ただし分析がインシデントの多さに圧倒されず、かつアラートの適時レポートが可能なよう十分に短く規定される。
インシデント・アナライザによって、プール(708)をクローズする条件が満たされたかどうかを判断すること(718)は、別のインシデントがプールに割り当てられる前に、所定の初期期間と、プールに割り当てられた任意のインシデントに関連する任意の延長時間(extensions of time)とが経過したと判断することによって実行されてもよい。そのような実施形態では、通常、所定の初期期間およびプールに対するすべての延長時間は、プールの最長時間より前に経過しており、その結果、プールはプールの最長時間より前にクローズされる。
さらに、図7の方法は、プールをクローズする条件が満たされると、プール内の各インシデントに関して、そのインシデントが、プール(708)に含められるべきその所定の最短時間(714)、プールに入っていたかどうかを判断すること(720)を含む。プール内の各インシデントに関して、そのインシデントが、プール(708)に含められるべきその所定の最短時間(714)、プールに入っていたかどうかを判断すること(720)は、各インシデントがプールにあった時間の長さと、プールに含められるべきその最短時間とを比較することによって実行されてもよい。
図7の方法は、インシデントが、その所定の最短時間プールに入っていた場合、クローズされたプールにインシデントを含めること(722)を含む。クローズされたプールにインシデントを含めること(722)は、インシデントを、イベント分析、アラート分析、または当業者が想到するであろう他のインシデント分析用に、クローズされたプールに保持することによって実行される。
図7の方法は、インシデントが、その所定の最短時間プールに入っていない場合、クローズされたプールからインシデントを取り出し、インシデントを次のプールに含めること(724)を含む。クローズされたプールからインシデントを取り出し、インシデントを次のプールに含めること(724)は、次のプールを作成して、インシデントを次のプールへと移動させることによって実行されてもよい。次のプールを作成し、インシデントを次のプールへと移動させることは、その、次のプールに移動させられるイベントの最短時間と少なくとも同じ長さの所定の時間を、次のプールに関して規定することを含んでもよい。
さらなる説明のために、図8は、本発明の実施形態による、分散処理システムにおけるイベントおよびアラート分析のためにインシデント・プールを管理するさらなる方法を表すフローチャートを示す。分散処理システムの1つ以上のコンポーネントからの複数のインシデント(704)を、インシデント・アナライザによってインシデント・キューから受信すること(702)、インシデントのプール(708)であって、所定の初期期間を有するプールを、インシデント・アナライザによって作成すること(706)、受信されたインシデントそれぞれを、インシデント・アナライザによってプールに割り当てること(710)、インシデント・アナライザによって、各インシデントに、プールに含められるべき所定の最短時間を割り当てること(712)、インシデント・アナライザによって、インシデントの1つ以上に関して、そのインシデントに割り当てられている特定の期間、プール(708)の所定の初期期間を延長すること(716)、プールをクローズする条件が満たされたかどうかを、インシデント・アナライザによって判断すること(718)、プールをクローズする条件が満たされた場合、プール内の各インシデントに関して、インシデントが、プールに含められるべきその所定の最短時間、プールに入っていたかどうかを判断すること(720)、インシデントが、その所定の最短時間プールに入っていた場合、クローズされたプールにインシデントを含めること(722)、インシデントがその所定の最短時間プールに入っていない場合、クローズされたプールからインシデントを取り出し、インシデントを次のプールに含めること(724)を、図8の方法が含むという点で、図8の方法は図7の方法に似ている。
図8の方法では、インシデント(704)の1つ以上がイベントであり、図8の方法がさらに、プール(708)に割り当てられている1つ以上のイベントに基づき1つ以上のアラートを特定すること(726)を含むという点で、図8の方法は、図7の方法とは異なる。プール(708)に割り当てられている1つ以上のイベントに基づき1つ以上のアラートを特定すること(726)は、上記で説明したようにイベント到着ルールに基づきアラートを特定することによって、上記で説明したようにプール・クローズ・ルールに基づき追加のアラートを特定することによって、さらに当業者が想到するであろう他の方法で、実行されてもよい。
図8の方法では、インシデントを取り出し、インシデントを次のプールに含めること(724)はさらに、少なくとも1つのイベントを取り出し(802)、取り出されたイベントを次のプールに含め(804)、取り出されたイベントに基づき特定された任意のアラートと、クローズされたプールとを関連付けること(806)を含む。さらに、インシデントを取り出し、インシデントを次のプールに含めること(724)は、少なくとも1つのイベントを取り出すこと(802)を含み、取り出されたイベントを次のプールに含めること(804)は、次のプールを作成し、インシデントを次のプールへと移動させることによって実行されてもよい。
取り出されたイベントに基づき特定された任意のアラートと、クローズされたプールとを関連付けること(806)は、イベント到着ルールに基づき特定された任意のアラートを、アラート・アナライザによるアラート分析のために、クローズされたプールを用いて保持することによって実行されてもよい。そのような実施形態では、イベントは取り出されて次のプールに含められるが、そのイベントに基づき特定された任意のアラートは、アラート分析のために、クローズされたプールを用いて保持される。
さらなる説明のために、図9は、本発明の実施形態による、分散処理システムにおけるイベントおよびアラート分析のためにインシデント・プールを管理するさらなる方法を表すフローチャートを示す。分散処理システムの1つ以上のコンポーネントからの複数のインシデント(704)を、インシデント・アナライザによってインシデント・キューから受信すること(702)、インシデントのプール(708)であって、所定の初期期間を有するプールを、インシデント・アナライザによって作成すること(706)、受信されたインシデントそれぞれを、インシデント・アナライザによってプールに割り当てること(710)、インシデント・アナライザによって、各インシデントに、プールに含められるべき最短時間を割り当てること(712)、インシデント・アナライザによって、インシデントの1つ以上に関して、そのインシデントに割り当てられている特定の期間、プール(708)の所定の初期期間を延長すること(716)、プールをクローズする条件が満たされたかどうかを、インシデント・アナライザによって判断すること(718)、プールをクローズする条件が満たされた場合、プール内の各インシデントに関して、インシデントが、プールに含められるべきその所定の最短時間、プールに入っていたかどうかを判断すること(720)、インシデントが、その所定の最短時間プールに入っていた場合、クローズされたプールにインシデントを含めること(722)、インシデントがその所定の最短時間プールに入っていない場合、クローズされたプールからインシデントを取り出し、インシデントを次のプールに含めること(724)を、図9の方法が含むという点で、図9の方法は図7および8の方法に似ている。
図9の方法では、インシデント(704)の1つ以上がイベント(202)であり、図9の方法がさらに、プール(708)に割り当てられている1つ以上のイベントに基づき1つ以上のアラートを特定すること(726)を含むという点で、図9の方法は図7の方法とは異なる。プール(708)に割り当てられている1つ以上のイベントに基づき1つ以上のアラートを特定すること(726)は、上記で説明したようにイベント到着ルールに基づきアラートを特定することによって、上記で説明したようにプール・クローズ・ルールに基づき追加のアラートを特定することによって、および当業者が想到するであろう他の方法で、実行されてもよい。
図9の方法では、インシデントを取り出し、インシデントを次のプールに含めること(724)はさらに、少なくとも1つのイベントを取り出し(902)、取り出されたイベントを次のプールに含め(904)、取り出されたイベントに基づき特定された任意のアラートと、次のプールとを関連付けること(906)を含む。さらに、インシデントを取り出し、インシデントを次のプールに含めること(724)は、少なくとも1つのイベントを取り出すこと(902)を含み、取り出されたイベントを次のプールに含めること(904)は、次のプールを作成し、インシデントを次のプールへと移動させることによって実行されてもよい。
取り出されたイベントに基づき特定された任意のアラートと、次のプールとを関連付けること(906)は、イベント到着ルールに基づき特定された任意のアラートと、アラート・アナライザによるアラート分析のための、クローズされたプールとの関連付けを解除し、当該のアラートと、次のプールとを関連付けることによって実行されてもよい。そのような実施形態では、イベントは取り出されて次のプールに含められ、そのイベントに基づき特定された任意のアラートも、次のプールを用いたアラート分析のために、次のプールと関連付けられる。
一部の実施形態では、アラートは、他のアラートに基づき特定されてもよい。したがって、そのような実施形態では、図9の方法による、取り出されたイベントに基づき特定された任意のアラートと、次のプールとを関連付けることはさらに、すでに次のプールと関連付けられている特定されたアラートに依存する任意のアラートまたはイベントであって、クローズされたプール内の該任意のアラートまたはイベントを、無効にすることによって実行されてもよい。すなわち、すでに次のプールに関連付けられているアラートに基づき特定されたアラートは、クローズされたプールにおいて無効にされる。そうしたアラートを無効にすることで、すでに次のプールと関連付けられているアラートに対する、クローズされたプールにおける依存がなくなる。
当業者であれば当然のことであるが、本発明の側面は、システム、方法またはコンピュータ・プログラムとして具現化され得る。したがって、本発明の側面は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)、または本願明細書においてすべて概して「回路」、「モジュール」または「システム」と呼ばれ得る、ソフトウェアおよびハードウェアの側面を兼ね備えた実施形態の形態をとってもよい。さらに、本発明の側面は、コンピュータ可読プログラム・コードが具現化された1つ以上のコンピュータ可読媒体(単数または複数)において具現化されたコンピュータ・プログラムの形態をとることもできる。
1つ以上のコンピュータ可読媒体(単数または複数)の任意の組み合わせが利用され得る。コンピュータ可読媒体は、コンピュータ可読信号媒体またはコンピュータ可読記憶媒体とされ得る。コンピュータ可読記憶媒体は、例えば、限定はされないが、電子、磁気、光学、電磁気、赤外線、もしくは半導体システム、装置、もしくはデバイス、または前述のものの任意の適切な組み合わせとすることもできる。コンピュータ可読記憶媒体のより具体的な例(包括的でないリスト)には、1つ以上のワイヤを有する電気的接続、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM:read−only memory)、消去可能プログラム可能読み取り専用メモリ(EPROM(erasable programmable read−only memory)またはフラッシュ・メモリ)、光ファイバ、ポータブル・コンパクト・ディスク読み取り専用メモリ(CD−ROM:compact disc read−only memory)、光学式記憶デバイス、磁気記憶デバイスまたは前述のものの任意の適切な組み合わせが含まれるであろう。この文書の文脈では、コンピュータ可読記憶媒体は、命令実行システム、装置もしくはデバイスによって、またはそれに関連して使用されるプログラムを含むこと、または記憶することができる任意の有形の媒体であればよい。
コンピュータ可読信号媒体は、例えば、ベースバンドに、または搬送波の一部として、伝播データ信号において具現化されたコンピュータ可読プログラム・コードを備える伝播データ信号を含み得る。そのような伝播信号は、限定はされないが、電磁気、光学、またはその任意の適切な組み合わせを含む様々な形態のいずれかをとってよい。コンピュータ可読信号媒体は、コンピュータ可読記憶媒体でなく、命令実行システム、装置もしくはデバイスによって、またはそれに関連して使用されるプログラムを伝達すること、伝播させること、または搬送することができる、任意のコンピュータ可読媒体としてもよい。
コンピュータ可読媒体上に具現化されたプログラム・コードは、限定はされないが、無線、有線、光ファイバ・ケーブル、RFなどを使用して、または前述のものの任意の適切な組み合わせを含む任意の適切な媒体を使用して送られてもよい。
本発明の側面の動作を実行するコンピュータ・プログラム・コードは、Java(R)、Smalltalk(R)、C++または同様のものなどのオブジェクト指向プログラミング言語、および「C」プログラミング言語もしくは同様のプログラミング言語などの従来の手続きプログラミング言語を含む、1つ以上のプログラミング言語の任意の組み合わせで書かれていてよい。プログラム・コードは、スタンド・アロン・ソフトウェア・パッケージとして、完全にユーザのコンピュータ上で実行されること、部分的にユーザのコンピュータ上で実行されること、または部分的にユーザのコンピュータ上で、かつ部分的にリモート・コンピュータ上で実行されること、または完全にリモート・コンピュータもしくはサーバ上で実行されることもできる。後者のシナリオでは、ローカル・エリア・ネットワーク(LAN)、もしくは広域ネットワーク(WAN:wide area network)を含む任意のタイプのネットワークを介してリモート・コンピュータがユーザのコンピュータに接続されてもよく、または、外部コンピュータに接続されてもよい(例えば、インターネット・サービス・プロバイダを使用しインターネットを介して)。
本発明の側面は、本発明の実施形態による方法、装置(システム)およびコンピュータ・プログラムのフローチャート図またはブロック図あるいはその両方を参照して、以上に記載される。当然のことながら、フローチャート図またはブロック図、あるいはその両方の各ブロック、およびフローチャート図またはブロック図、あるいはその両方の複数ブロックの組み合わせは、コンピュータ・プログラム命令により実装可能である。当該コンピュータ・プログラム命令が、マシンを生じるよう、汎用コンピュータ、専用コンピュータ、またはその他のプログラム可能データ処理装置のプロセッサに提供されて、この命令が、コンピュータまたはその他のプログラム可能データ処理装置のプロセッサにより実行されて、フローチャートまたはブロック図あるいはその両方のブロックまたは複数ブロックにおいて指定された機能/動作を実装する手段を作り出すようにすることもできる。
さらに、特定の形で機能するようコンピュータ、その他のプログラム可能データ処理装置、またはその他のデバイスに指示することができる当該コンピュータ・プログラム命令は、コンピュータ可読媒体に記憶されて、コンピュータ可読媒体に記憶されたこの命令が、フローチャートまたはブロック図あるいはその両方のブロックもしくは複数ブロックにおいて指定された機能/動作を実装する命令を含む製品を生じるようにすることもできる。
さらに、コンピュータ・プログラム命令は、コンピュータ、その他のプログラム可能データ処理装置、またはその他のデバイスにロードされて、コンピュータ、その他のプログラム可能装置、またはその他のデバイス上で一連の動作ステップが実行されるようにしてコンピュータに実装されるプロセスを生じさせ、コンピュータまたはその他のプログラム可能装置上で実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックもしくは複数ブロックにおいて指定された機能/動作を実装するためのプロセスを提供するようにすることもできる。
各図面のフローチャートおよびブロック図は、本発明の様々な実施形態によるシステム、方法およびコンピュータ・プログラムの考えられる実装のアーキテクチャ、機能性および動作を表す。この関連で、フローチャートまたはブロック図内の各ブロックは、指定の論理機能(単数または複数)を実装する1つ以上の実行可能命令を含むモジュール、セグメント、またはコードの一部を表現することもできる。なお、さらに、いくつかの代わりの実装では、ブロック内に示されている機能が、図面に示されているのとは異なる順序で生じてもよい。例えば、関連する機能性次第で、連続して示されている2つのブロックが実際には事実上同時に実行されてもよく、または、各ブロックが逆順で実行されることがあってもよい。なお、さらに、ブロック図もしくはフローチャート図あるいはその両方の各ブロック、およびブロック図もしくはフローチャート図あるいはその両方の複数ブロックの組み合わせは、指定の機能もしくは動作を実行する専用ハードウェア・ベース・システム、または専用ハードウェアおよびコンピュータ命令の組み合わせにより実装することができる。
本発明の真の意図から逸脱することなく、本発明の様々な実施形態において、改変または変更が加えられ得ることが、前述の記載から分かるであろう。本明細書の記載は、説明のみを目的としており、限定的な意味に解釈されてはならない。本発明の範囲は、添付の特許請求の範囲の言葉によってのみ限定される。
101 分散処理システム
122 端末
124 イベントおよびアラート分析モジュール
128 システム管理者
202 イベント
204 モニタ
206 イベント・キュー
208 イベント・アナライザ
210 イベント分析ルール
212 イベント・プール
214、220 アラート
216 アラート・キュー
218 アラート・アナライザ
222 アラート分析ルール
224 アラート・プール
230 イベント到着ルール
232 イベント・プール動作ルール
234 イベント抑制ルール
236 イベント・プール・クローズ・ルール

Claims (20)

  1. 分散処理システムにおけるイベントおよびアラート分析のためにインシデント・プールを管理する方法であって、
    前記分散処理システムの1つ以上のコンポーネントからの複数のインシデントを、インシデント・アナライザによってインシデント・キューから受信するステップと、
    前記インシデント・アナライザによって、インシデントのプールを作成するステップと、
    受信されたインシデントそれぞれを、前記インシデント・アナライザによって前記プールに割り当てるステップと、
    前記インシデント・アナライザによって、各インシデントに、プールに含められるべき所定の最短時間を割り当てるステップと、
    前記プールをクローズする条件が満たされたかどうかを、前記インシデント・アナライザによって判断するステップと、
    前記プールをクローズする条件が満たされた場合、前記プール内の各インシデントに関して、前記インシデントが、プールに含められるべきその所定の最短時間、前記プールに入っていたかどうかを判断するステップと、
    前記インシデントが、その所定の最短時間前記プールに入っていた場合、前記クローズされたプールに前記インシデントを保持するステップと、
    前記インシデントが、その所定の最短時間前記プールに入っていない場合、前記クローズされたプールから前記インシデントを取り出し、前記インシデントを次のプールに含めるステップと、
    を含む、前記方法。
  2. 前記インシデントのうちの1つ以上は、イベントを含み、前記方法は、前記プールに割り当てられている1つ以上のイベントに基づき、1つ以上のアラートを特定するステップをさらに含み、
    前記インシデントを取り出し、前記インシデントを次のプールに含めるステップは、少なくとも1つのイベントを取り出し、前記取り出されたイベントを、前記次のプールに含め、前記取り出されたイベントに基づき特定された任意のアラートと、前記クローズされたプールとを関連付けるステップをさらに含む、請求項1に記載の方法。
  3. 前記インシデントのうちの1つ以上は、イベントを含み、前記方法は、前記プールに割り当てられている1つ以上のイベントに基づき、1つ以上のアラートを特定するステップをさらに含み、
    前記インシデントを取り出し、前記インシデントを次のプールに含めるステップは、少なくとも1つのイベントを取り出し、前記取り出されたイベントを、前記次のプールに含め、前記取り出されたイベントに基づき特定された任意のアラートと、前記次のプールとを関連付けるステップをさらに含む、請求項1に記載の方法。
  4. 前記取り出されたイベントに基づき特定された任意のアラートと、前記次のプールとを関連付けるステップは、すでに前記次のプールに関連付けられている前記特定されたアラートに依存する任意のアラートまたはイベントであって、前記クローズされたプール内の前記任意のアラートまたはイベントを、無効にするステップをさらに含む、請求項3に記載の方法。
  5. 前記プールをクローズする条件が満たされたかどうかを、前記インシデント・アナライザによって判断するステップは、前記プールの最長時間が経過したかどうかを判断するステップをさらに含む、請求項1に記載の方法。
  6. インシデントの前記プールは、所定の初期期間を有し、前記方法は、前記インシデント・アナライザによって、前記インシデントの1つ以上に関して、前記インシデントに割り当てられている特定の期間、前記プールの前記所定の初期期間を延長するステップをさらに含み、
    前記プールをクローズする条件が満たされたかどうかを、前記インシデント・アナライザによって判断するステップは、別のインシデントが前記プールに割り当てられる前に、前記所定の初期期間と、前記プールに割り当てられた任意のインシデントに関連する任意の延長時間とが経過したと判断するステップをさらに含む、請求項1に記載の方法。
  7. 前記インシデントは、イベントを含み、インシデントの前記プールは、イベント・プールを含む、請求項1に記載の方法。
  8. 前記インシデントは、アラートを含み、インシデントの前記プールは、アラート・プールを含む、請求項1に記載の方法。
  9. 分散処理システムにおけるイベントおよびアラート分析のためにインシデント・プールを管理するシステムであって、前記システムは、コンピュータ・プロセッサと、前記コンピュータ・プロセッサに動作可能なように結合されたコンピュータ・メモリとを含み、前記コンピュータ・メモリ内にコンピュータ・プログラム命令が配置されており、前記コンピュータ・プログラム命令は、前記コンピュータ・プロセッサによって実行されると、前記システムに、
    前記分散処理システムの1つ以上のコンポーネントからの複数のインシデントを、インシデント・アナライザによってインシデント・キューから受信するステップと、
    前記インシデント・アナライザによって、インシデントのプールを作成するステップと、
    受信されたインシデントそれぞれを、前記インシデント・アナライザによって前記プールに割り当てるステップと、
    前記インシデント・アナライザによって、各インシデントに、プールに含められるべき所定の最短時間を割り当てるステップと、
    前記プールをクローズする条件が満たされたかどうかを、前記インシデント・アナライザによって判断するステップと、
    前記プールをクローズする条件が満たされた場合、前記プール内の各インシデントに関して、前記インシデントが、プールに含められるべきその所定の最短時間、前記プールに入っていたかどうかを判断するステップと、
    前記インシデントが、その所定の最短時間前記プールに入っていた場合、前記クローズされたプールに前記インシデントを保持するステップと、
    前記インシデントが、その所定の最短時間前記プールに入っていない場合、前記クローズされたプールから前記インシデントを取り出し、前記インシデントを次のプールに含めるステップと、
    を実行させることができる、システム。
  10. 前記インシデントのうちの1つ以上は、イベントを含み、前記システムは、前記プールに割り当てられている1つ以上のイベントに基づき、1つ以上のアラートを特定できるコンピュータ・プログラム命令をさらに含み、
    前記インシデントを取り出し、前記インシデントを次のプールに含めるステップは、少なくとも1つのイベントを取り出し、前記取り出されたイベントを、前記次のプールに含め、前記取り出されたイベントに基づき特定された任意のアラートと、前記クローズされたプールとを関連付けるステップをさらに含む、請求項9に記載のシステム。
  11. 前記インシデントのうちの1つ以上は、イベントを含み、前記システムは、前記プールに割り当てられている1つ以上のイベントに基づき、1つ以上のアラートを特定できるコンピュータ・プログラム命令をさらに含み、
    前記インシデントを取り出し、前記インシデントを次のプールに含めるステップは、少なくとも1つのイベントを取り出し、前記取り出されたイベントを、前記次のプールに含め、前記取り出されたイベントに基づき特定された任意のアラートと、前記次のプールとを関連付けるステップをさらに含む、請求項9に記載のシステム。
  12. 前記取り出されたイベントに基づき特定された任意のアラートと、前記次のプールとを関連付けるステップは、すでに前記次のプールに関連付けられている前記特定されたアラートに依存する任意のアラートまたはイベントであって、前記クローズされたプール内の前記任意のアラートまたはイベントを、無効にするステップをさらに含む、請求項11に記載のシステム。
  13. 分散処理システムにおけるイベントおよびアラート分析のためにインシデント・プールを管理するためのコンピュータ・プログラムであって、前記コンピュータ・プログラムは、コンピュータ可読記憶媒体上に配置され、前記コンピュータ・プログラムは、
    前記分散処理システムの1つ以上のコンポーネントからの複数のインシデントを、インシデント・アナライザによってインシデント・キューから受信すること、
    前記インシデント・アナライザによって、インシデントのプールを作成すること、
    受信されたインシデントそれぞれを、前記インシデント・アナライザによって前記プールに割り当てること、
    前記インシデント・アナライザによって、各インシデントに、プールに含められるべき所定の最短時間を割り当てること、
    前記プールをクローズする条件が満たされたかどうかを、前記インシデント・アナライザによって判断すること、
    前記プールをクローズする条件が満たされた場合、前記プール内の各インシデントに関して、前記インシデントが、プールに含められるべきその所定の最短時間、前記プールに入っていたかどうかを判断すること、
    前記インシデントが、その所定の最短時間前記プールに入っていた場合、前記クローズされたプールに前記インシデントを保持すること、および
    前記インシデントが、その所定の最短時間前記プールに入っていない場合、前記クローズされたプールから前記インシデントを取り出し、前記インシデントを次のプールに含めること、
    のコンピュータ・プログラム命令を含む、コンピュータ・プログラム。
  14. 前記インシデントのうちの1つ以上は、イベントを含み、前記コンピュータ・プログラムは、前記プールに割り当てられている1つ以上のイベントに基づき、1つ以上のアラートを特定することのコンピュータ・プログラム命令をさらに含み、
    前記インシデントを取り出し、前記インシデントを次のプールに含めることのコンピュータ・プログラム命令は、少なくとも1つのイベントを取り出し、前記取り出されたイベントを、前記次のプールに含め、前記取り出されたイベントに基づき特定された任意のアラートと、前記クローズされたプールとを関連付けることのコンピュータ・プログラム命令をさらに含む、請求項13に記載のコンピュータ・プログラム。
  15. 前記インシデントのうちの1つ以上は、イベントを含み、前記コンピュータ・プログラムは、前記プールに割り当てられている1つ以上のイベントに基づき、1つ以上のアラートを特定することのコンピュータ・プログラム命令をさらに含み、
    前記インシデントを取り出し、前記インシデントを次のプールに含めることのコンピュータ・プログラム命令は、少なくとも1つのイベントを取り出し、前記取り出されたイベントを、前記次のプールに含め、前記取り出されたイベントに基づき特定された任意のアラートと、前記次のプールとを関連付けることのコンピュータ・プログラム命令をさらに含む、請求項13に記載のコンピュータ・プログラム。
  16. 前記取り出されたイベントに基づき特定された任意のアラートと、前記次のプールとを関連付けることのコンピュータ・プログラム命令は、すでに前記次のプールに関連付けられている前記特定されたアラートに依存する任意のアラートまたはイベントであって、前記クローズされたプール内の前記任意のアラートまたはイベントを、無効にすることのコンピュータ・プログラム命令をさらに含む、請求項15に記載のコンピュータ・プログラム。
  17. 前記プールをクローズする条件が満たされたかどうかを、前記インシデント・アナライザによって判断することのコンピュータ・プログラム命令は、前記プールの最長時間が経過したかどうかを判断することのコンピュータ・プログラム命令をさらに含む、請求項13に記載のコンピュータ・プログラム。
  18. 前記プールは、所定の初期期間を有し、前記コンピュータ・プログラムは、前記インシデント・アナライザによって、前記インシデントの1つ以上に関して、前記インシデントに割り当てられている特定の期間、前記プールの前記所定の初期期間を延長することのコンピュータ・プログラム命令を含み、
    前記プールをクローズする条件が満たされたかどうかを、前記インシデント・アナライザによって判断することのコンピュータ・プログラム命令は、別のインシデントが前記プールに割り当てられる前に、前記所定の初期期間と、前記プールに割り当てられた任意のインシデントに関連する任意の延長時間とが経過したと判断することのコンピュータ・プログラム命令をさらに含む、請求項13に記載のコンピュータ・プログラム。
  19. 前記インシデントは、イベントを含み、インシデントの前記プールは、イベント・プールを含む、請求項13に記載のコンピュータ・プログラム。
  20. 前記インシデントは、アラートを含み、インシデントの前記プールは、アラート・プールを含む、請求項13に記載のコンピュータ・プログラム。
JP2011197462A 2010-11-02 2011-09-09 インシデント・プールの管理方法、システムおよびコンピュータ・プログラム Active JP5731334B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/938,067 US8364813B2 (en) 2010-11-02 2010-11-02 Administering incident pools for event and alert analysis
US12/938067 2010-11-02

Publications (2)

Publication Number Publication Date
JP2012099092A JP2012099092A (ja) 2012-05-24
JP5731334B2 true JP5731334B2 (ja) 2015-06-10

Family

ID=45997900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011197462A Active JP5731334B2 (ja) 2010-11-02 2011-09-09 インシデント・プールの管理方法、システムおよびコンピュータ・プログラム

Country Status (3)

Country Link
US (3) US8364813B2 (ja)
JP (1) JP5731334B2 (ja)
CN (1) CN102591731B (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8386602B2 (en) 2010-11-02 2013-02-26 International Business Machines Corporation Relevant alert delivery in a distributed processing system
US8364813B2 (en) 2010-11-02 2013-01-29 International Business Machines Corporation Administering incident pools for event and alert analysis
US8621277B2 (en) 2010-12-06 2013-12-31 International Business Machines Corporation Dynamic administration of component event reporting in a distributed processing system
US8868984B2 (en) * 2010-12-07 2014-10-21 International Business Machines Corporation Relevant alert delivery in a distributed processing system with event listeners and alert listeners
US8737231B2 (en) 2010-12-07 2014-05-27 International Business Machines Corporation Dynamic administration of event pools for relevant event and alert analysis during event storms
US8805999B2 (en) 2010-12-07 2014-08-12 International Business Machines Corporation Administering event reporting rules in a distributed processing system
US8756462B2 (en) 2011-05-24 2014-06-17 International Business Machines Corporation Configurable alert delivery for reducing the amount of alerts transmitted in a distributed processing system
US8645757B2 (en) 2011-05-26 2014-02-04 International Business Machines Corporation Administering incident pools for event and alert analysis
US9213621B2 (en) 2011-05-27 2015-12-15 International Business Machines Corporation Administering event pools for relevant event analysis in a distributed processing system
US8676883B2 (en) 2011-05-27 2014-03-18 International Business Machines Corporation Event management in a distributed processing system
US8713366B2 (en) 2011-06-22 2014-04-29 International Business Machines Corporation Restarting event and alert analysis after a shutdown in a distributed processing system
US8392385B2 (en) 2011-06-22 2013-03-05 International Business Machines Corporation Flexible event data content management for relevant event and alert analysis within a distributed processing system
US8880943B2 (en) 2011-06-22 2014-11-04 International Business Machines Corporation Restarting event and alert analysis after a shutdown in a distributed processing system
US9419650B2 (en) 2011-06-22 2016-08-16 International Business Machines Corporation Flexible event data content management for relevant event and alert analysis within a distributed processing system
US9436635B1 (en) * 2011-08-30 2016-09-06 Emc Corporation Leases in a heterogenous data environment
US20130097272A1 (en) 2011-10-18 2013-04-18 International Business Machines Corporation Prioritized Alert Delivery In A Distributed Processing System
US8887175B2 (en) 2011-10-18 2014-11-11 International Business Machines Corporation Administering incident pools for event and alert analysis
US9178936B2 (en) 2011-10-18 2015-11-03 International Business Machines Corporation Selected alert delivery in a distributed processing system
US20130097215A1 (en) 2011-10-18 2013-04-18 International Business Machines Corporation Selected Alert Delivery In A Distributed Processing System
US8713581B2 (en) 2011-10-27 2014-04-29 International Business Machines Corporation Selected alert delivery in a distributed processing system
US8954811B2 (en) 2012-08-06 2015-02-10 International Business Machines Corporation Administering incident pools for incident analysis
US8943366B2 (en) 2012-08-09 2015-01-27 International Business Machines Corporation Administering checkpoints for incident analysis
US9361184B2 (en) 2013-05-09 2016-06-07 International Business Machines Corporation Selecting during a system shutdown procedure, a restart incident checkpoint of an incident analyzer in a distributed processing system
US9170860B2 (en) 2013-07-26 2015-10-27 International Business Machines Corporation Parallel incident processing
US9658902B2 (en) 2013-08-22 2017-05-23 Globalfoundries Inc. Adaptive clock throttling for event processing
US9256482B2 (en) 2013-08-23 2016-02-09 International Business Machines Corporation Determining whether to send an alert in a distributed processing system
US9602337B2 (en) 2013-09-11 2017-03-21 International Business Machines Corporation Event and alert analysis in a distributed processing system
US9086968B2 (en) 2013-09-11 2015-07-21 International Business Machines Corporation Checkpointing for delayed alert creation
US9389943B2 (en) 2014-01-07 2016-07-12 International Business Machines Corporation Determining a number of unique incidents in a plurality of incidents for incident processing in a distributed processing system
JP6295176B2 (ja) * 2014-10-07 2018-03-14 株式会社日立製作所 メッセージ処理装置およびメッセージ処理方法
US10623236B2 (en) 2014-12-08 2020-04-14 Tata Consultancy Services Limited Alert management system for enterprises
US9703624B2 (en) 2015-10-12 2017-07-11 Bank Of America Corporation Event correlation and calculation engine
US10235227B2 (en) 2015-10-12 2019-03-19 Bank Of America Corporation Detection, remediation and inference rule development for multi-layer information technology (“IT”) structures
US9684556B2 (en) * 2015-10-12 2017-06-20 Bank Of America Corporation Method and apparatus for a self-adjusting calibrator
JP6515048B2 (ja) * 2016-03-14 2019-05-15 株式会社日立製作所 インシデント管理システム
US11418395B2 (en) * 2020-01-08 2022-08-16 Servicenow, Inc. Systems and methods for an enhanced framework for a distributed computing system
US11487537B2 (en) 2020-11-18 2022-11-01 International Business Machines Corporation Linking operational events with system changes

Family Cites Families (153)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4823261A (en) 1986-11-24 1989-04-18 International Business Machines Corp. Multiprocessor system for updating status information through flip-flopping read version and write version of checkpoint data
US4812852A (en) 1987-02-20 1989-03-14 Scientific Development Corporation Locating system and method
US4965772A (en) 1987-06-15 1990-10-23 International Business Machines Corporation Method and apparatus for communication network alert message construction
US5119377A (en) 1989-06-16 1992-06-02 International Business Machines Corporation System and method for software error early detection and data capture
US5276861A (en) 1991-03-18 1994-01-04 Bull Hn Information Systems Inc. Guaranteed message delivery from a data handling computer to management computer by monitoring the management computer with the data handling computer and other management computer
JPH0595357A (ja) * 1991-10-02 1993-04-16 Shikoku Nippon Denki Software Kk 障害情報の待ち合わせによる対象外情報の削除方式
DE4332993C1 (de) * 1993-09-28 1994-11-24 Siemens Ag Tracer-System zur Fehleranalyse in laufenden Realzeitsystemen
US5619656A (en) 1994-05-05 1997-04-08 Openservice, Inc. System for uninterruptively displaying only relevant and non-redundant alert message of the highest severity for specific condition associated with group of computers being managed
US6446224B1 (en) 1995-03-03 2002-09-03 Fujitsu Limited Method and apparatus for prioritizing and handling errors in a computer system
US6255943B1 (en) 1995-03-29 2001-07-03 Cabletron Systems, Inc. Method and apparatus for distributed object filtering
US5777549A (en) 1995-03-29 1998-07-07 Cabletron Systems, Inc. Method and apparatus for policy-based alarm notification in a distributed network management environment
JPH09288594A (ja) * 1996-04-23 1997-11-04 Nec Commun Syst Ltd 障害対処方法通知システム
JPH11120036A (ja) * 1997-10-20 1999-04-30 Fujitsu Ltd 障害メッセージ出力制御システム
JP3488617B2 (ja) 1998-02-10 2004-01-19 シャープ株式会社 インターネットを用いた遠隔障害管理システム
US6094681A (en) 1998-03-31 2000-07-25 Siemens Information And Communication Networks, Inc. Apparatus and method for automated event notification
US6314533B1 (en) 1998-09-21 2001-11-06 Microsoft Corporation System and method for forward custom marshaling event filters
US6321338B1 (en) 1998-11-09 2001-11-20 Sri International Network surveillance
US6631409B1 (en) 1998-12-23 2003-10-07 Worldcom, Inc. Method and apparatus for monitoring a communications system
US6446136B1 (en) 1998-12-31 2002-09-03 Computer Associates Think, Inc. System and method for dynamic correlation of events
US6405250B1 (en) 1999-01-25 2002-06-11 Lucent Technologies Inc. Network management system based on passive monitoring and proactive management for formulation behavior state transition models
US6918059B1 (en) 1999-04-28 2005-07-12 Universal Music Group Method and system for handling errors in a distributed computer system
US6459913B2 (en) 1999-05-03 2002-10-01 At&T Corp. Unified alerting device and method for alerting a subscriber in a communication network based upon the result of logical functions
US6539335B1 (en) 1999-05-26 2003-03-25 Bert W. Morris Data collection and analysis aid
US6513129B1 (en) 1999-06-30 2003-01-28 Objective Systems Integrators, Inc. System and method for managing faults using a gateway
GB2351870B (en) 1999-07-09 2001-09-19 Mitel Corp Feature interaction resolution using fuzzy rules
US6629127B1 (en) 1999-07-26 2003-09-30 Microsoft Corporation Methods and systems for processing HTTP requests
US6801927B1 (en) * 1999-09-24 2004-10-05 Akamba Corporation Network adaptor card with reverse proxy and cache and method implemented therewith
JP3875436B2 (ja) 1999-10-28 2007-01-31 富士通株式会社 ネットワーク管理装置および記録媒体
US10061369B2 (en) 1999-11-29 2018-08-28 Intel Corporation Automatically enabling information to be displayed after a processor-based system is turned off
US6594786B1 (en) 2000-01-31 2003-07-15 Hewlett-Packard Development Company, Lp Fault tolerant high availability meter
JP2001331350A (ja) * 2000-05-19 2001-11-30 Mitsubishi Electric Corp 保守管理装置
US6708288B1 (en) 2000-10-31 2004-03-16 Hewlett-Packard Development Company, L.P. Compiler-based checkpointing for support of error recovery
US6792459B2 (en) 2000-12-14 2004-09-14 International Business Machines Corporation Verification of service level agreement contracts in a client server environment
US6934853B2 (en) 2001-01-18 2005-08-23 International Business Machines Corporation Method, system and program for sharing the ability to set configuration parameters in a network environment
US7168093B2 (en) 2001-01-25 2007-01-23 Solutionary, Inc. Method and apparatus for verifying the integrity and security of computer networks and implementation of counter measures
WO2002069300A1 (en) 2001-02-22 2002-09-06 Koyo Musen America, Inc. Collecting, analyzing, consolidating, delivering and utilizing data relating to a current event
US6731832B2 (en) 2001-02-28 2004-05-04 Lambda Opticalsystems Corporation Detection of module insertion/removal in a modular optical network, and methods and apparatus therefor
US7401054B1 (en) 2001-03-26 2008-07-15 Accenture Gmbh Content bank for objects
US7197561B1 (en) 2001-03-28 2007-03-27 Shoregroup, Inc. Method and apparatus for maintaining the status of objects in computer networks using virtual state machines
US20060265746A1 (en) * 2001-04-27 2006-11-23 Internet Security Systems, Inc. Method and system for managing computer security information
US7043659B1 (en) 2001-08-31 2006-05-09 Agilent Technologies, Inc. System and method for flexible processing of management policies for managing network elements
US7308714B2 (en) 2001-09-27 2007-12-11 International Business Machines Corporation Limiting the output of alerts generated by an intrusion detection sensor during a denial of service attack
JP2003228497A (ja) * 2002-02-04 2003-08-15 Nec Software Chubu Ltd 障害通知システムおよび障害通知プログラム
US6925586B1 (en) 2002-05-09 2005-08-02 Ronald Perrella Methods and systems for centrally-controlled client-side filtering
US7213179B2 (en) 2002-07-30 2007-05-01 Cisco Technology, Inc. Automated and embedded software reliability measurement and classification in network elements
US7251829B1 (en) 2002-10-26 2007-07-31 Type80 Security Software, Inc. Data analysis and security system
US7117391B1 (en) 2002-10-31 2006-10-03 Oracle International Corporation Checkpoint model building for data mining
US7051244B2 (en) 2002-10-31 2006-05-23 Hewlett-Packard Development Company, L.P. Method and apparatus for managing incident reports
US7603711B2 (en) 2002-10-31 2009-10-13 Secnap Networks Security, LLC Intrusion detection system
US7275062B2 (en) 2003-03-10 2007-09-25 Fisher-Rosemount Systems, Inc. Automatic linkage of process event data to a data historian
US20040221025A1 (en) 2003-04-29 2004-11-04 Johnson Ted C. Apparatus and method for monitoring computer networks
WO2004098544A1 (ja) 2003-05-09 2004-11-18 The Nisshin Oillio Group, Ltd. 自己乳化型油性液状化粧料
CN2636359Y (zh) 2003-05-24 2004-08-25 鸿富锦精密工业(深圳)有限公司 光学记录/再现装置
US7296204B2 (en) 2003-05-30 2007-11-13 Wegener Communications, Inc. Error correction apparatus and method
US9117220B2 (en) 2003-06-16 2015-08-25 Meetup, Inc. Web-based interactive meeting facility with revenue generation through sponsorship
US8904295B2 (en) 2003-06-16 2014-12-02 Meetup, Inc. Web-based interactive meeting facility with recommendations to users
US7289988B2 (en) 2003-07-08 2007-10-30 Hewlett-Packard Development Company, L.P. Method and system for managing events
US20050034130A1 (en) 2003-08-05 2005-02-10 International Business Machines Corporation Balancing workload of a grid computing environment
US20050193285A1 (en) 2004-02-11 2005-09-01 Eung-Sun Jeon Method and system for processing fault information in NMS
GB0404696D0 (en) * 2004-03-02 2004-04-07 Level 5 Networks Ltd Dual driver interface
US7516362B2 (en) 2004-03-19 2009-04-07 Hewlett-Packard Development Company, L.P. Method and apparatus for automating the root cause analysis of system failures
JP2005316634A (ja) 2004-04-28 2005-11-10 Hitachi Ltd セッション情報保存システム及び方法
GB0409582D0 (en) 2004-04-29 2004-06-02 British Telecomm Event notification network
US7818631B1 (en) 2004-04-30 2010-10-19 Sprint Communications Company L.P. Method and system for automatically generating network trouble tickets
WO2006002108A2 (en) 2004-06-21 2006-01-05 Musman Scott A Computer network management using agent-based distributed reasoning
US7568027B2 (en) 2004-07-13 2009-07-28 International Business Machines Corporation Event suppression tool for temporarily suppressing actions on received events
US7886296B2 (en) 2004-07-22 2011-02-08 Computer Associates Think, Inc. System and method for providing alerts for heterogeneous jobs
US7299152B1 (en) 2004-10-04 2007-11-20 United States Of America As Represented By The Secretary Of The Navy Correlating event data for large geographic area
US7599359B1 (en) 2004-12-14 2009-10-06 At&T Corp. Method and apparatus for monitoring end-to-end performance in a network
US8458619B2 (en) 2004-12-14 2013-06-04 International Business Machines Corporation Method, system and program product for screensaver breakthrough of prioritized messages
GB0427695D0 (en) 2004-12-17 2005-01-19 Ncr Int Inc A method of and system for prediction of the state of health of an apparatus
US7562366B2 (en) 2005-02-03 2009-07-14 Solarflare Communications, Inc. Transmit completion event batching
US7260663B2 (en) * 2005-04-07 2007-08-21 International Business Machines Corporation System and method for presenting interrupts
US7548911B2 (en) 2005-05-28 2009-06-16 Microsoft Corporation Diagnosing problems in distributed systems
US20070002736A1 (en) 2005-06-16 2007-01-04 Cisco Technology, Inc. System and method for improving network resource utilization
US7779421B2 (en) 2005-06-30 2010-08-17 Ebay Inc. Business event processing
US8171499B2 (en) 2005-07-22 2012-05-01 International Business Machines Corporation Apparatus, system, and method for object clone event notification
US7904319B1 (en) 2005-07-26 2011-03-08 Sas Institute Inc. Computer-implemented systems and methods for warranty analysis
JP4619254B2 (ja) 2005-09-30 2011-01-26 富士通株式会社 Idsのイベント解析及び警告システム
US7693873B2 (en) 2005-10-13 2010-04-06 International Business Machines Corporation System, method and program to synchronize files in distributed computer system
US20070100960A1 (en) 2005-10-28 2007-05-03 Yahoo! Inc. Managing content for RSS alerts over a network
US20070100959A1 (en) 2005-10-28 2007-05-03 Yahoo! Inc. Customizing RSS content for use over a network
US20070124437A1 (en) 2005-11-30 2007-05-31 Cisco Technology, Inc. Method and system for real-time collection of log data from distributed network components
US7408458B1 (en) 2005-12-29 2008-08-05 At&T Corp. Method and apparatus for suppressing duplicate alarms
US20070174768A1 (en) 2006-01-20 2007-07-26 International Business Machines Corporation Adaptive alert management
US8347143B2 (en) 2006-01-30 2013-01-01 International Business Machines Corporation Facilitating event management and analysis within a communications environment
US7504936B2 (en) 2006-03-14 2009-03-17 Motorola Inc. Method and apparatus for dynamically prioritize network faults based on real-time service degradation
US7848835B2 (en) 2006-06-02 2010-12-07 Cymer, Inc. High power laser flat panel workpiece treatment system controller
US7430692B2 (en) 2006-06-16 2008-09-30 Siemens Medical Solutions Usa, Inc. Processor operational status management system
US7865584B2 (en) 2006-06-20 2011-01-04 Alcatel Lucent Network service performance monitoring apparatus and methods
US7756053B2 (en) 2006-06-30 2010-07-13 Intel Corporation Memory agent with error hardware
WO2008000290A1 (en) 2006-06-30 2008-01-03 Telecom Italia S.P.A. Fault location in telecommunications networks using bayesian networks
US8984513B2 (en) 2006-08-28 2015-03-17 International Business Machines Corporation Transfer of event logs for replication of executing programs
US7872982B2 (en) 2006-10-02 2011-01-18 International Business Machines Corporation Implementing an error log analysis model to facilitate faster problem isolation and repair
US7702782B1 (en) 2006-10-18 2010-04-20 Emc Corporation Using watermarks to indicate alerts in a storage area network management console
US7640457B2 (en) 2006-11-07 2009-12-29 International Business Machines Corporation Automated error reporting and diagnosis in distributed computing environment
US7984452B2 (en) 2006-11-10 2011-07-19 Cptn Holdings Llc Event source management using a metadata-driven framework
JP5074752B2 (ja) * 2006-12-07 2012-11-14 キヤノン株式会社 画像要求方法
US8578335B2 (en) 2006-12-20 2013-11-05 International Business Machines Corporation Apparatus and method to repair an error condition in a device comprising a computer readable medium comprising computer readable code
US7822848B2 (en) 2006-12-28 2010-10-26 International Business Machines Corporation Alert log activity thread integration
US7818418B2 (en) 2007-03-20 2010-10-19 Computer Associates Think, Inc. Automatic root cause analysis of performance problems using auto-baselining on aggregated performance metrics
US7792042B2 (en) 2007-03-29 2010-09-07 Cisco Technology, Inc. Classification of signaling protocol errors to trigger network connectivity troubleshooting
US7890814B2 (en) 2007-06-27 2011-02-15 Microsoft Corporation Software error report analysis
US8782203B2 (en) 2007-09-14 2014-07-15 International Business Machines Corporation Propagating accelerated events in a network management system
US9077863B2 (en) 2007-10-08 2015-07-07 Nice Systems Ltd. System and method for managing location based video services
US7996046B2 (en) 2008-01-10 2011-08-09 Microsoft Corporation Smart alert charms for wireless devices
US8201029B2 (en) 2008-01-31 2012-06-12 International Business Machines Corporation Method and apparatus for operating system event notification mechanism using file system interface
US8839419B2 (en) 2008-04-05 2014-09-16 Microsoft Corporation Distributive security investigation
US20090275807A1 (en) 2008-05-02 2009-11-05 General Electric Company Method for managing alarms in a physiological monitoring system
US7856498B2 (en) 2008-06-26 2010-12-21 Sybase, Inc. Collaborative alert management and monitoring
ATE533257T1 (de) 2008-06-27 2011-11-15 Thomson Licensing Nachrichtenverwaltung und unterdrückung in einem überwachungssystem
JP2010033118A (ja) 2008-07-25 2010-02-12 Yokogawa Electric Corp アラーム管理装置
US8260751B2 (en) 2008-08-12 2012-09-04 Tdi Technologies, Inc. Log file time sequence stamping
WO2010026362A1 (en) 2008-09-08 2010-03-11 British Telecommunications Public Limited Company Distributed data processing system
JP5237034B2 (ja) 2008-09-30 2013-07-17 株式会社日立製作所 イベント情報取得外のit装置を対象とする根本原因解析方法、装置、プログラム。
WO2010061735A1 (ja) * 2008-11-27 2010-06-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 検出イベントに応じたアクション実行を支援するシステム、検出イベントに応じたアクション実行を支援する方法、支援装置及びコンピュータプログラム
US8032804B2 (en) 2009-01-12 2011-10-04 Micron Technology, Inc. Systems and methods for monitoring a memory system
US8583071B2 (en) 2009-01-16 2013-11-12 Rambus Inc. Methods and circuits for detecting and reporting high-energy particles using mobile phones and other portable computing devices
US20100211192A1 (en) 2009-02-17 2010-08-19 Honeywell International Inc. Apparatus and method for automated analysis of alarm data to support alarm rationalization
US8166352B2 (en) 2009-06-30 2012-04-24 Alcatel Lucent Alarm correlation system
US8078922B2 (en) 2009-09-30 2011-12-13 Sap Ag Internal server error analysis
US8930526B2 (en) 2009-10-30 2015-01-06 International Business Machines Corporation Processing network events
US8576724B2 (en) 2009-11-24 2013-11-05 At&T Intellectual Property I, L.P. Method, system, and computer program product, for correlating special service impacting events
CN101739745B (zh) * 2009-12-01 2011-11-16 中国建设银行股份有限公司 一种排队处理装置及其处理方法和排队机
JP2011123752A (ja) 2009-12-11 2011-06-23 Fujitsu Ltd ログ収集装置、ログ収集プログラム、ログ収集方法及びログ収集システム
US9571782B2 (en) 2010-02-17 2017-02-14 CSC Holdings, LLC Feature activation on occurrence of an event
US8350681B2 (en) 2010-06-02 2013-01-08 Research In Motion Limited System and method for escalating event alerts
US20120084432A1 (en) 2010-09-30 2012-04-05 Soprovich Greg F Method and apparatus for protocol event management
US8364813B2 (en) 2010-11-02 2013-01-29 International Business Machines Corporation Administering incident pools for event and alert analysis
US8386602B2 (en) 2010-11-02 2013-02-26 International Business Machines Corporation Relevant alert delivery in a distributed processing system
US8495661B2 (en) 2010-11-02 2013-07-23 International Business Machines Corporation Relevant alert delivery with event and alert suppression in a distributed processing system
US20120143875A1 (en) 2010-12-01 2012-06-07 Yahoo! Inc. Method and system for discovering dynamic relations among entities
US8621277B2 (en) 2010-12-06 2013-12-31 International Business Machines Corporation Dynamic administration of component event reporting in a distributed processing system
US8805999B2 (en) 2010-12-07 2014-08-12 International Business Machines Corporation Administering event reporting rules in a distributed processing system
US8868984B2 (en) 2010-12-07 2014-10-21 International Business Machines Corporation Relevant alert delivery in a distributed processing system with event listeners and alert listeners
US8737231B2 (en) 2010-12-07 2014-05-27 International Business Machines Corporation Dynamic administration of event pools for relevant event and alert analysis during event storms
US8380838B2 (en) 2011-04-08 2013-02-19 International Business Machines Corporation Reduction of alerts in information technology systems
US20120275456A1 (en) 2011-04-28 2012-11-01 Amarnath Ammireddy Expedited graceful ospf restart
US8756462B2 (en) 2011-05-24 2014-06-17 International Business Machines Corporation Configurable alert delivery for reducing the amount of alerts transmitted in a distributed processing system
US8645757B2 (en) 2011-05-26 2014-02-04 International Business Machines Corporation Administering incident pools for event and alert analysis
US9213621B2 (en) 2011-05-27 2015-12-15 International Business Machines Corporation Administering event pools for relevant event analysis in a distributed processing system
US8676883B2 (en) 2011-05-27 2014-03-18 International Business Machines Corporation Event management in a distributed processing system
US8880943B2 (en) 2011-06-22 2014-11-04 International Business Machines Corporation Restarting event and alert analysis after a shutdown in a distributed processing system
US8392385B2 (en) 2011-06-22 2013-03-05 International Business Machines Corporation Flexible event data content management for relevant event and alert analysis within a distributed processing system
US9419650B2 (en) 2011-06-22 2016-08-16 International Business Machines Corporation Flexible event data content management for relevant event and alert analysis within a distributed processing system
US8713366B2 (en) 2011-06-22 2014-04-29 International Business Machines Corporation Restarting event and alert analysis after a shutdown in a distributed processing system
US20130097272A1 (en) 2011-10-18 2013-04-18 International Business Machines Corporation Prioritized Alert Delivery In A Distributed Processing System
US20130097215A1 (en) 2011-10-18 2013-04-18 International Business Machines Corporation Selected Alert Delivery In A Distributed Processing System
US9178936B2 (en) 2011-10-18 2015-11-03 International Business Machines Corporation Selected alert delivery in a distributed processing system
US8887175B2 (en) 2011-10-18 2014-11-11 International Business Machines Corporation Administering incident pools for event and alert analysis
US8713581B2 (en) 2011-10-27 2014-04-29 International Business Machines Corporation Selected alert delivery in a distributed processing system
US8954811B2 (en) 2012-08-06 2015-02-10 International Business Machines Corporation Administering incident pools for incident analysis
US8943366B2 (en) 2012-08-09 2015-01-27 International Business Machines Corporation Administering checkpoints for incident analysis

Also Published As

Publication number Publication date
JP2012099092A (ja) 2012-05-24
US8560689B2 (en) 2013-10-15
US20130097300A1 (en) 2013-04-18
CN102591731B (zh) 2014-07-02
US20130179905A1 (en) 2013-07-11
US8898299B2 (en) 2014-11-25
CN102591731A (zh) 2012-07-18
US8364813B2 (en) 2013-01-29
US20120110153A1 (en) 2012-05-03

Similar Documents

Publication Publication Date Title
JP5731334B2 (ja) インシデント・プールの管理方法、システムおよびコンピュータ・プログラム
JP5656799B2 (ja) 適切なアラートの配信方法、システムおよびコンピュータ・プログラム
US8730816B2 (en) Dynamic administration of event pools for relevant event and alert analysis during event storms
US8639980B2 (en) Administering incident pools for event and alert analysis
US8893157B2 (en) Administering incident pools for event and alert analysis
US8495661B2 (en) Relevant alert delivery with event and alert suppression in a distributed processing system
US8713366B2 (en) Restarting event and alert analysis after a shutdown in a distributed processing system
US8688769B2 (en) Selected alert delivery in a distributed processing system
US8499203B2 (en) Configurable alert delivery in a distributed processing system
US9246865B2 (en) Prioritized alert delivery in a distributed processing system
US9178937B2 (en) Selected alert delivery in a distributed processing system
US8954811B2 (en) Administering incident pools for incident analysis
US9086968B2 (en) Checkpointing for delayed alert creation
US20130091386A1 (en) Administering event pools for relevant event analysis in a distributed processing system
US20150033243A1 (en) Parallel incident processing
US9361184B2 (en) Selecting during a system shutdown procedure, a restart incident checkpoint of an incident analyzer in a distributed processing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140409

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150317

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150409

R150 Certificate of patent or registration of utility model

Ref document number: 5731334

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150