JP2002323987A - 論理分割マルチプロセッシング・システムにおいて重複して報告されるエラーをなくす方法およびシステム - Google Patents

論理分割マルチプロセッシング・システムにおいて重複して報告されるエラーをなくす方法およびシステム

Info

Publication number
JP2002323987A
JP2002323987A JP2002049004A JP2002049004A JP2002323987A JP 2002323987 A JP2002323987 A JP 2002323987A JP 2002049004 A JP2002049004 A JP 2002049004A JP 2002049004 A JP2002049004 A JP 2002049004A JP 2002323987 A JP2002323987 A JP 2002323987A
Authority
JP
Japan
Prior art keywords
service
reported errors
reported
errors
sae
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002049004A
Other languages
English (en)
Inventor
George H Ahrens
ジョージ・エイチ・アーレンス
Douglas M Benignus
ダグラス・エム・ベニグナス
Leo C Mooney
レオ・シー・ムーニー
Arthur J Tysor
アーサー・ジェイ・タイザー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2002323987A publication Critical patent/JP2002323987A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】 グローバル・エラーの報告に要する時間を減
らし、報告の重複をなくすシステムおよび方法を提供す
ること。 【解決手段】 論理分割マルチプロセッシング・システ
ムにおいて重複して報告されるエラーをなくす方法およ
びシステムを開示する。この方法およびシステムは、複
数の関連するグローバルに報告されたエラーを受け取る
ための単一のソースを提供するステップと、サービス要
求が1つだけ提供されるように、複数の関連するグロー
バルに報告されたエラーをフィルタリングするステップ
とを含む。したがって、本発明によるシステムおよび方
法を使用することによって、グローバルな障害が複数の
OS区画によって報告される際、ハードウェア・コンソ
ールからはサービス要求が1つだけ開始される。これを
行う上において、サービス技術員は、同一の報告された
障害に対してはサービスを繰り返さずに済む。さらに、
別のサービス技術員が別の区画を担当している場合は、
1名の技術員のみが障害の報告に対応すればよい。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般には論理分割
マルチプロセッシング・システムに関し、より詳細に
は、このようなシステムにおいて重複して報告されるエ
ラーをなくすことに関する。
【0002】
【従来の技術】論理分割とは、単一のマルチプロセッシ
ング・システムを、あたかもそれが複数の独立したシス
テムであるかのように、動作させる能力のことである。
各論理区画はシステムにおけるリソースの一部分に相当
し、独立した論理システムとして動作する。各区画は論
理的である。それは、リソースの該当部分が物理的また
は仮想的である可能性があるためである。論理区画の一
例は、1つのマルチプロセッサ・コンピュータ・システ
ムを、それぞれ自前のプロセッサ、主記憶装置、および
入出力装置を備えた複数の独立したサーバへ分割するこ
とである。
【0003】論理分割システムでは、ローカル・エラー
(その区画だけの入出力アダプタ)は、その区画で動作
するOSに報告される。グローバル・エラー(すべての
区画、たとえばファン、電源機構、メモリなどに影響す
る可能性のあるエラー)は、すべてのオペレーティング
・システムに報告される。現行では、修復が行われた際
は、グローバルな修復であっても、その修復処置は、エ
ラーが生じた区画用のエラー・ログに記録されるだけで
ある。各区画のログに修復データを繰り返し入力する必
要なくすべての区画に修復を報告することができれば有
利であろう。その解決策は、全区画をカバーするファー
ムウェア診断にアクセスし、すべての区画のログにグロ
ーバル・エラーを入力させることである。
【0004】図1は、論理分割(LPAR)マルチプロ
セッシング・システム100を示すブロック図である。
マルチプロセッシング・システム100は、複数のオペ
レーティング・システム(OS)区画102a、102
b、102c、102dを含み、これらは、複数の入出
力装置(IO)104から入力をローカルに受け取り、
電源機構、クーリング・サプライ、ファン、メモリ、お
よびプロセッサなどの基本ハードウェア106からグロ
ーバルに入力を受け取る。この図では4つのOS区画が
示されているが、本発明の趣旨および範囲を逸脱するこ
となく任意の数の区画を使用できることは、当業者なら
容易に理解できるだろう。各OS区画102a〜102
dは、識別(id)番号105a〜105dを有する。
【0005】LPARマルチプロセッシング・システム
100には、あるタイプ(ローカル)のエラーがあり、
これは、割り当てられたまたは所有している区画のオペ
レーティング・システムに報告されるだけである。その
一例は、単一の区画のオペレーティング・システムにの
み割り当てられた入出力アダプタの障害である。別のタ
イプ(グローバル)のエラーもあり、これは各区画の動
作に影響する可能性があるため、各区画のオペレーティ
ング・システムに報告される。このタイプの例は、電源
機構、ファン、メモリ、およびプロセッサの障害であ
る。
【0006】1つの区画上のエラー・ログに記録される
グローバル・リソース上の修復処置を、そのリソースを
共有する他のすべての区画のエラー・ログに報告するこ
とが望ましい。区画は互いに分離されているため、他の
区画のエラー・ログ情報はわからない。サービス処置を
必要とするハードウェア・エラーがログに記録される
と、ログ修復処置がログに記録されるまで、診断が問題
を報告し続ける。従来のLPARマルチプロセッシング
・システムでは、「修復された」リソースを共有する各
OS区画を(システム検査モードで診断を実行するか、
またはログ修復処置保守援助機能を使用して)訪れ、修
復処置を手動で記録しなければならない。さもないとグ
ローバル・リソースは、修復処置が記録された区画では
なく、それらの区画の問題として引き続き報告されてし
まう。このことによって、グローバルに報告されたエラ
ーに対して修復処置を行うたびに、著しく時間がかか
り、顧客は混乱する。グローバルに報告されたエラーの
ため、サービスの観点から、トラッキング、サービスへ
の報告、および修復の目的で、報告する各OS区画から
のエラー報告を統合できる必要がある。
【0007】
【発明が解決しようとする課題】したがって、グローバ
ル・エラーの報告に要する時間を減らし、報告の重複を
なくすシステムおよび方法が必要である。このシステム
および方法は、コスト効率が高く、容易に実装すること
ができ、既存のシステムに簡単に適合できなければなら
ない。本発明はこうした必要性に対応するものである。
【0008】
【課題を解決するための手段】論理分割マルチプロセッ
シング・システムにおいて重複して報告されるエラーを
なくす方法およびシステムを開示する。この方法および
システムは、複数の関連するグローバルに報告されたエ
ラーを受け取るための単一のソースを提供するステップ
と、サービス要求が1つだけ提供されるように、複数の
関連するグローバルに報告されたエラーをフィルタリン
グするステップとを含む。
【0009】したがって、本発明によるシステムおよび
方法を使用することによって、グローバルな障害が複数
のOS区画によって報告される際、ハードウェア・コン
ソールからはサービス要求が1つだけ開始される。これ
を行う上において、サービス技術員は、同一の報告され
た障害に対しては呼び出しを繰り返さずに済む。さら
に、別のサービス技術員が別の区画を担当している場合
は、1名の技術員のみが障害の報告に対応すればよい。
【0010】
【発明の実施の形態】本発明は、一般には論理分割コン
ピュータ・システムに関し、より詳細にはエラー・ログ
のフィルタ操作に関する。以下の記述は、当業者による
本発明の実施を可能にするために提示され、特許出願お
よびその要件という文脈で提供される。本明細書に記載
する好ましい実施形態ならびに一般的な原理および特徴
に対する様々な修正は、当業者なら容易に理解できるだ
ろう。したがって本発明は、記載の実施形態に限定され
るものではなく、本明細書に記載された原理および特徴
と矛盾しない最も広い範囲を与えられるものである。
【0011】本発明は、ハードウェア・システム・コン
ソール内のサービス・フォーカル・ポイント・アプリケ
ーション中にある、グローバルに報告された障害の数を
最少化するプロシージャを使用する。図2は、本発明に
よるサービス・フォーカル・ポイント(SFP)アプリ
ケーションを示す図である。このシステムでは、SFP
アプリケーション202はハードウェア・システム・コ
ンソール200に常駐する。ハードウェア・システム・
コンソールは、SFPアプリケーション202を実行す
るプロセッサ(図示せず)を含む。SFPアプリケーシ
ョン202は通常、フロッピ(R)、ディスク・ドライ
ブ、CD ROM、DVDなどのコンピュータ可読媒体
に常駐する。SFPアプリケーション202は、OS区
画102a〜102nからフィルタ206を介してエラ
ー報告を受け取るサービス処置イベント(SAE)ログ
204を含む。サービス・エージェント・アプリケーシ
ョン208は、エラー報告に関するフィルタリングされ
た情報を受け取り、サービス要求を実行する。図示のよ
うに、LPARマルチプロセッシング・システムでは、
グローバル障害およびローカル障害はいずれも各OS区
画102a〜102nから提供される。各OS区画10
2a〜102nは、グローバル障害を受け取ると、ハー
ドウェア・システム内のSFPアプリケーション202
にエラー報告を送信する。本発明の動作をさらに詳しく
説明するため、次に添付の図面と併せて以下の記述を参
照されたい。
【0012】図3は、本発明によるLPARマルチプロ
セッシング・システムにおいて重複して報告されるエラ
ーを最少化するプロセスを示すフローチャートである。
次に図2と図3を併せて参照すると、グローバル障害
は、ステップ302において各OS区画102a〜10
2nに報告される。次いで、各OS区画は、ステップ3
04においてSFPアプリケーション202内のSAE
ログ204に障害を報告する。SAEログ204は、O
S区画102a〜102nからの重複エラー・ログをフ
ィルタリングするフィルタ・メカニズム(206)を含
む。
【0013】好ましい実施形態では、フィルタ・メカニ
ズムはソフトウェア・アルゴリズムにより提供される。
図4は、本発明によるフィルタ・メカニズムの好ましい
実施形態を示すフローチャートである。まずステップ4
02において、SFPアプリケーション202が「サー
ビス可能イベント」の通知を受け取る。次いでSFPア
プリケーション202は、ステップ404において、イ
ベントのタイプに基づいてフィルタ操作が必要かどうか
を判定する。次いでステップ406において、イベント
のタイプが所定のフィルタ操作候補と合致するかどうか
を判定する。合致しない場合は、イベントのフィルタ操
作は不要であり、障害は新たな欠陥と判定され、ステッ
プ408においてSAEログ・エントリが作成される。
【0014】イベントがフィルタ操作候補と合致する場
合は、そのイベントはフィルタ操作の候補となる。その
後、ステップ410において、SFPはサービス・イベ
ント・クラス・データの所定の部分をSAEログ内のオ
ープン・イベントで検査する。次いでステップ412に
おいて、以前の関連するオープンSAEログが見つかる
かどうかを判定する。ログが見つからない場合は、ステ
ップ408において、新たなSAEログ・エントリが作
成される。ログが見つかった場合は、そのイベントは重
複した報告であり、ステップ414において、報告区画
IDが取り出され、オープンSAEログ・エントリと共
に記憶される。
【0015】したがって、フィルタ・メカニズムの一例
では、AIXオペレーティング・システムによって報告
されたエラーに関して、フィルタ206はサービス・イ
ベント・クラス・データの「エラー・コード」フィール
ドおよび「ロケーション・コード」フィールドを問い合
わせる。エラー・コードおよびロケーション・コードが
オープンSAEイベントと完全に一致する場合は、新た
なSAEログ要求からの区画IDがクラス・データから
取り出され、SAEログ・エントリと共に記憶される。
比較の結果、オープンSAEログ・エントリと完全には
一致しない場合は、報告されたエラーは新たなものであ
り、新規のSAEログ・エントリが開き、サービスを要
求する。
【0016】再び図3を参照すると、フィルタ操作の発
生に続いて、ステップ306においてSAEログ204
は、最初に報告されたエラーの発生を、サービス技術員
が後で使用できるように、エラーを報告した各OS区画
102a〜102nの区画ID105a〜105nと共
に記憶する。次いでステップ308において、SAEロ
グ内でフィルタリングされたエラー・ログは、サービス
・エージェント・アプリケーションに渡される。さらに
ステップ310において、サービス・エージェント・ア
プリケーション(208)は単一の報告をサービス技術
員に送信し、サービスを要求する。
【0017】したがって、本発明によるシステムおよび
方法を使用することによって、グローバル障害が複数の
OS区画によって報告される際、ハードウェア・システ
ム・コンソールからはサービス要求が1つだけ開始され
る。これを行う上において、サービス技術員は、同一の
報告された障害に対してはサービスを繰り返さずに済
む。さらに、別のサービス技術員が別の区画を担当して
いる場合は、1名の技術員のみが障害の報告に対応すれ
ばよい。
【0018】記載の実施形態によって本発明について説
明したが、これらの実施形態は修正が可能であり、そう
した修正は本発明の趣旨および範囲内で行えることを当
業者なら容易に理解できるだろう。したがって、添付の
特許請求の範囲の趣旨および範囲を逸脱することなく当
業者によって多くの修正を行うことができる。
【図面の簡単な説明】
【図1】論理分割マルチプロセッシング・システムを示
すブロック図である。
【図2】本発明によるサービス・フォーカル・ポイント
・アプリケーションを示す図である。
【図3】本発明によるLPARマルチプロセッシング・
システムにおいて重複して報告されるエラーを最少化す
るプロセスを示すフローチャートである。
【図4】本発明によるフィルタ・メカニズムの好ましい
実施形態を示すフローチャートである。
【符号の説明】
100 論理分割LPARマルチプロセッシング・シス
テム 102a オペレーティング・システム(OS)区画 102b オペレーティング・システム(OS)区画 102c オペレーティング・システム(OS)区画 102d オペレーティング・システム(OS)区画 102n オペレーティング・システム(OS)区画 104 入出力装置(IO) 105a 識別(id)番号 105b 識別(id)番号 105c 識別(id)番号 105d 識別(id)番号 106 基本ハードウェア 200 ハードウェア・システム・コンソール 202 サービス・フォーカル・ポイント・アプリケー
ション 204 サービス処置イベント(SAE)ログ 206 フィルタ 208 サービス・エージェント・アプリケーション
フロントページの続き (72)発明者 ジョージ・エイチ・アーレンス アメリカ合衆国78660 テキサス州プフリ ューガーヴィル ウッドローン・ドライブ 1231 (72)発明者 ダグラス・エム・ベニグナス アメリカ合衆国77853 テキサス州ダイ ム・ボックス アールティー1 ボックス 159エイ−1 (72)発明者 レオ・シー・ムーニー アメリカ合衆国78613 テキサス州シーダ ー・パーク ホワイトウィング・ドライブ 903 (72)発明者 アーサー・ジェイ・タイザー アメリカ合衆国78610 テキサス州ブダ レジャーウッズ 702 Fターム(参考) 5B042 GA11 GA19 GA22 GC10 JJ03 KK13 MA08 MA18 MC17 MC18 NN16 5B098 GC16 HH08 JJ01

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】論理分割(LPAR)マルチプロセッシン
    グ・システムにおいて重複して報告されるエラーをなく
    す方法であって、 (a)複数の関連するグローバルに報告されたエラーを
    受け取るための単一のソースを提供するステップと、 (b)サービス要求が1つだけ提供されるように、前記
    複数の関連するグローバルに報告されたエラーをフィル
    タリングするステップとを含む方法。
  2. 【請求項2】フィルタリングするステップ(b)が、 (b1)前記LPARマルチプロセッシング・システム
    から前記複数の関連するグローバルに報告されたエラー
    を受け取るステップと、 (b2)前記複数の関連するグローバルに報告されたエ
    ラーの最初の発生を記憶するステップと、 (b3)前記最初の発生をサービス・エージェントに送
    信するステップとを含む、請求項1に記載の方法。
  3. 【請求項3】前記記憶するステップ(b2)が、 (b21)障害を報告した各区画の識別子を記憶するス
    テップをさらに含む、請求項2に記載の方法。
  4. 【請求項4】前記フィルタリングするステップ(b)
    が、 (b1)サービス・イベント・データの複数のフィール
    ドを問い合わせるステップと、 (b2)前記フィールドがオープンSAEイベントと合
    致するかどうかを判定するステップと、 (b3)前記データから区画識別子を取り出すステップ
    とを含む、請求項1に記載の方法。
  5. 【請求項5】論理分割(LPAR)マルチプロセッシン
    グ・システムにおいて重複して報告されるエラーをなく
    すシステムであって、 前記マルチプロセッシング・システム内の複数の区画に
    対する複数の関連するグローバルに報告されたエラーを
    受け取ってフィルタリングするためのサービス処置イベ
    ント(SAE)ログであって、前記複数のグローバルに
    報告されたエラーの前記最初の発生のみをエラー・ログ
    に記憶するSAEログと、 前記SAEログから前記エラー・ログを受け取るための
    サービス・エージェントとを含むシステム。
  6. 【請求項6】前記SAEログが、 前記LPARマルチプロセッシング・システムから前記
    複数の関連するグローバルに報告されたエラーを受け取
    るための手段と、 前記複数の関連するグローバルに報告されたエラーの最
    初の発生を記憶するための手段と、 前記最初の発生をサービス・エージェントに送信するた
    めの手段とをさらに含む、請求項5に記載のシステム。
  7. 【請求項7】前記SAEログが、 障害を報告した各区画の識別子を記憶するための手段を
    さらに含む、請求項6に記載のシステム。
  8. 【請求項8】前記フィルタリングが、サービス・イベン
    ト・データの複数のフィールドを問い合わせ、前記フィ
    ールドがオープンSAEイベントと合致するかどうかを
    判定し、 前記データから区画識別子を取り出す、請求項5に記載
    のシステム。
  9. 【請求項9】論理分割(LPAR)マルチプロセッシン
    グ・システムにおいて重複して報告されるエラーをなく
    すためのプログラム命令を含むコンピュータ可読媒体で
    あって、前記プログラム命令が、 (a)複数の関連するグローバルに報告されたエラーを
    受け取るための単一のソースを提供するステップと、 (b)サービス要求が1つだけ提供されるように、前記
    複数の関連するグローバルに報告されたエラーをフィル
    タリングするステップとを実行するコンピュータ可読媒
    体。
  10. 【請求項10】フィルタリングするステップ(b)が、 (b1)前記LPARマルチプロセッシング・システム
    から前記複数の関連するグローバルに報告されたエラー
    を受け取るステップと、 (b2)前記複数の関連するグローバルに報告されたエ
    ラーの最初の発生を記憶するステップと、 (b3)前記最初の発生をサービス・エージェントに送
    信するステップとを含む、請求項7に記載のコンピュー
    タ可読媒体。
  11. 【請求項11】前記記憶するステップ(b2)が、 (b21)障害を報告した各区画の識別子を記憶するス
    テップをさらに含む、請求項8に記載のコンピュータ可
    読媒体。
  12. 【請求項12】前記フィルタリングするステップ(b)
    が、 (b1)サービス・イベント・データの複数のフィール
    ドを問い合わせるステップと、 (b2)前記フィールドがオープンSAEイベントと合
    致するかどうかを判定するステップと、 (b3)前記データから区画識別子を除去するステップ
    とを含む、請求項9に記載のコンピュータ可読媒体。
JP2002049004A 2001-03-01 2002-02-26 論理分割マルチプロセッシング・システムにおいて重複して報告されるエラーをなくす方法およびシステム Pending JP2002323987A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/798,207 US20020124214A1 (en) 2001-03-01 2001-03-01 Method and system for eliminating duplicate reported errors in a logically partitioned multiprocessing system
US09/798207 2001-03-01

Publications (1)

Publication Number Publication Date
JP2002323987A true JP2002323987A (ja) 2002-11-08

Family

ID=25172797

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002049004A Pending JP2002323987A (ja) 2001-03-01 2002-02-26 論理分割マルチプロセッシング・システムにおいて重複して報告されるエラーをなくす方法およびシステム

Country Status (4)

Country Link
US (1) US20020124214A1 (ja)
JP (1) JP2002323987A (ja)
KR (1) KR20020070795A (ja)
TW (1) TW594473B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7139940B2 (en) 2003-04-10 2006-11-21 International Business Machines Corporation Method and apparatus for reporting global errors on heterogeneous partitioned systems
JP2008269194A (ja) * 2007-04-19 2008-11-06 Hitachi Ltd 仮想計算機システム
JP2011154491A (ja) * 2010-01-26 2011-08-11 Fujitsu Ltd 情報管理プログラム、情報管理装置、および情報管理方法

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6823482B2 (en) * 2001-03-08 2004-11-23 International Business Machines Corporation System and method for reporting platform errors in partitioned systems
US6751758B1 (en) * 2001-06-20 2004-06-15 Emc Corporation Method and system for handling errors in a data storage environment
US6842870B2 (en) * 2001-09-20 2005-01-11 International Business Machines Corporation Method and apparatus for filtering error logs in a logically partitioned data processing system
US6865697B2 (en) * 2002-01-18 2005-03-08 International Business Machines Corporation Method and apparatus for reduced error checking of data received by a server from a client
US6925586B1 (en) * 2002-05-09 2005-08-02 Ronald Perrella Methods and systems for centrally-controlled client-side filtering
US20040158834A1 (en) * 2003-02-06 2004-08-12 International Business Machines Corporation Apparatus and method for dynamically allocating resources of a dead logical partition
US7480828B2 (en) * 2004-06-10 2009-01-20 International Business Machines Corporation Method, apparatus and program storage device for extending dispersion frame technique behavior using dynamic rule sets
US7516149B2 (en) 2004-08-30 2009-04-07 Microsoft Corporation Robust detector of fuzzy duplicates
JP4357433B2 (ja) * 2005-02-15 2009-11-04 株式会社日立製作所 ストレージシステム
US7739376B2 (en) * 2005-03-07 2010-06-15 Sap Aktiengesellschaft Message filtering
JP4652090B2 (ja) * 2005-03-15 2011-03-16 富士通株式会社 事象通知管理プログラム、事象通知管理装置及び事象通知管理方法
US9262253B2 (en) * 2012-06-28 2016-02-16 Microsoft Technology Licensing, Llc Middlebox reliability
US9229800B2 (en) 2012-06-28 2016-01-05 Microsoft Technology Licensing, Llc Problem inference from support tickets
US8806648B2 (en) 2012-09-11 2014-08-12 International Business Machines Corporation Automatic classification of security vulnerabilities in computer software applications
CN103793284B (zh) * 2012-10-29 2017-06-20 伊姆西公司 基于共同序列模式的、用于智能客户服务的分析系统和方法
US9325748B2 (en) 2012-11-15 2016-04-26 Microsoft Technology Licensing, Llc Characterizing service levels on an electronic network
US9565080B2 (en) 2012-11-15 2017-02-07 Microsoft Technology Licensing, Llc Evaluating electronic network devices in view of cost and service level considerations
US9350601B2 (en) 2013-06-21 2016-05-24 Microsoft Technology Licensing, Llc Network event processing and prioritization
US9529661B1 (en) * 2015-06-18 2016-12-27 Rockwell Collins, Inc. Optimal multi-core health monitor architecture
CN108255591B (zh) * 2017-12-07 2021-10-15 中国航空工业集团公司西安航空计算技术研究所 一种分区操作系统的统一异常处理方法
TWI709039B (zh) * 2019-04-25 2020-11-01 神雲科技股份有限公司 伺服器及錯誤事件紀錄登載功能的控制方法
CN111552599B (zh) * 2020-04-26 2024-04-09 武汉精测电子集团股份有限公司 一种分布式进程处理系统、半导体老化测试方法及系统、分布式系统
CN112763936B (zh) * 2021-02-04 2021-11-26 厦门市智联信通物联网科技有限公司 一种故障智能处理方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4843541A (en) * 1987-07-29 1989-06-27 International Business Machines Corporation Logical resource partitioning of a data processing system
US5528759A (en) * 1990-10-31 1996-06-18 International Business Machines Corporation Method and apparatus for correlating network management report messages
JPH06214969A (ja) * 1992-09-30 1994-08-05 Internatl Business Mach Corp <Ibm> 情報通信方法および装置
US5768501A (en) * 1996-05-28 1998-06-16 Cabletron Systems Method and apparatus for inter-domain alarm correlation
US5913036A (en) * 1996-06-28 1999-06-15 Mci Communications Corporation Raw performance monitoring correlated problem alert signals
US6000046A (en) * 1997-01-09 1999-12-07 Hewlett-Packard Company Common error handling system
US6414595B1 (en) * 2000-06-16 2002-07-02 Ciena Corporation Method and system for processing alarm objects in a communications network
US6618805B1 (en) * 2000-06-30 2003-09-09 Sun Microsystems, Inc. System and method for simplifying and managing complex transactions in a distributed high-availability computer system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7139940B2 (en) 2003-04-10 2006-11-21 International Business Machines Corporation Method and apparatus for reporting global errors on heterogeneous partitioned systems
JP2008269194A (ja) * 2007-04-19 2008-11-06 Hitachi Ltd 仮想計算機システム
US7917811B2 (en) 2007-04-19 2011-03-29 Hitachi, Ltd. Virtual computer system
JP2011154491A (ja) * 2010-01-26 2011-08-11 Fujitsu Ltd 情報管理プログラム、情報管理装置、および情報管理方法

Also Published As

Publication number Publication date
KR20020070795A (ko) 2002-09-11
US20020124214A1 (en) 2002-09-05
TW594473B (en) 2004-06-21

Similar Documents

Publication Publication Date Title
JP2002323987A (ja) 論理分割マルチプロセッシング・システムにおいて重複して報告されるエラーをなくす方法およびシステム
JP3962393B2 (ja) グローバル・エラーを報告するための論理分割データ処理システム
TW567410B (en) Method and system for log repair action handling on a logically partitioned multiprocessing system
US7979749B2 (en) Method and infrastructure for detecting and/or servicing a failing/failed operating system instance
US7313717B2 (en) Error management
JP3910554B2 (ja) 論理パーティション・データ処理システムでのエラーまたはイベントを処理する方法、コンピュータ・プログラム、データ処理システム
US7765431B2 (en) Preservation of error data on a diskless platform
US20040221198A1 (en) Automatic error diagnosis
US8863278B2 (en) Grid security intrusion detection configuration mechanism
JP2004220582A (ja) 論理環境においてエラーログを報告するための方法および装置
JPH0683788A (ja) プロセッサと結合機能間に対するメッセージ経路指定機能を有するデータ処理システム
JPH09231013A (ja) 複数の記憶サブシステムの間で付勢状態の予備ドライブ(hsd)を共有するための方法とその装置
CN1744049A (zh) 用于调试输入/输出故障的方法和系统
JP4366336B2 (ja) 論理パーティション・データ処理システムにおいてトレース・データを管理するための方法、トレース・データを管理するための論理パーティション・データ処理システム、コンピュータにトレース・データを管理させるためのコンピュータ・プログラム、論理パーティション・データ処理システム
US20060129664A1 (en) Method and apparatus for diagnosing a network
CN111966520A (zh) 数据库高可用切换方法、设备及系统
US9354962B1 (en) Memory dump file collection and analysis using analysis server and cloud knowledge base
US10223186B2 (en) Coherency error detection and reporting in a processor
US20030191978A1 (en) Multiple fault location in a series of devices
JP2001216166A (ja) 情報処理装置の保守管理方法および情報処理装置ならびにソフトウェアの作成方法およびソフトウェア
US7356619B2 (en) Method and apparatus for dynamic management of input/output subsystem addressing
WO2015015621A1 (ja) 情報処理装置、診断方法、診断プログラム、及び情報処理システム
JP2003016214A (ja) コンピュータ修理のサービス・ヒストリ・ログ
US8051260B1 (en) Determining environmental availability in a storage subsystem
US20070083867A1 (en) Method and system to recover from control block hangs in a heterogenous multiprocessor environment

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050713

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20051011

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20051014

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060314