JP2002312201A

JP2002312201A - 論理分割マルチプロセッシング・システムに対するログ修復処置の処理システム、処理方法およびその記録媒体

Info

Publication number: JP2002312201A
Application number: JP2002046093A
Authority: JP
Inventors: Mark S Edwards; マーク・エス・エドワーズ; George H Ahrens; ジョージ・エイチ・アーレンス; Douglas M Benignus; ダグラス・エム・ベニーナス; Arthur J Tysor; アーサー・ジェイ・タイサー
Original assignee: International Business Machines Corp; Infineon Technologies North America Corp
Current assignee: International Business Machines Corp; Infineon Technologies North America Corp
Priority date: 2001-03-01
Filing date: 2002-02-22
Publication date: 2002-10-25
Also published as: US20020124201A1; TW567410B

Abstract

(57)【要約】【課題】論理分割（ＬＰＡＲ）マルチプロセッシング
・システムにおいてログ修復処置を処理する方法を開示
する。【解決手段】本発明に係るシステムおよび方法は、制
御の単一のフォーカル・ポイントを用いる通知方式を使
用することにより、複数の区画において同一のアクショ
ンを実行しなければならないという問題を解決する。フ
ォーカル・ポイントが、実行されたアクションが他の区
画に共通であると判断する場合には、そのアクションが
フォーカル・ポイントによって他の区画に対してブロー
ドキャストされ、各々の区画を訪問してアクションを繰
り返す必要性を除去する。各々の受信側区画は、ブロー
ドキャスト情報を用いてそのログ修復処置レコードを更
新する。このようにして、アクティブな作業区画に対す
る短縮された修復シナリオとより少ない中断とが与えら
れ、より高いユーザ満足をもたらすシステム可用性の増
大をユーザに提供する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、一般的には論理分
割マルチプロセッシング・システムに関し、特に、この
ようなシステムにおけるログ修復処置の処理に関する。

【０００２】

【従来の技術】論理分割は、単一のマルチプロセッシン
グ・システムを、それがまるで２以上の独立したシステ
ムであるかのように稼働させることができる。各論理区
画は、システム内のリソースの分割を表し、独立した論
理システムとして動作する。リソースの分割は物理的ま
たは仮想的であり得るので、各区画は論理的である。論
理区画の１例は、各々が自身のプロセッサ，主記憶装置
および入出力装置を備える複数の独立したサーバへのマ
ルチプロセッサ・コンピュータ・システムの分割であ
る。

【０００３】論理分割システムにおいて、ローカル・エ
ラー（その区画のみに対する入出力アダプタ）は、その
区画上で実行するＯＳに報告される。グローバル・エラ
ー（全ての区画、例えばファン，電源機構，メモリ等に
影響を及ぼし得るエラー）は、全てのオペレーティング
・システムに報告される。一般に、修復が行われる時、
たとえグローバル修復であっても、修復処置はエラーを
有する区画用のエラー・ログ内に記録されるだけであ
る。各区画のログ内に修復データを繰り返し入力する必
要性なしに、全ての区画に対して修復を報告することは
有益であり得る。

【０００４】図１は、論理分割（ｌｏｇｉｃａｌｌｙ
ｐａｒｔｉｔｉｏｎｅｄ；ＬＰＡＲ）マルチプロセッシ
ング・システム１００のブロック図である。マルチプロ
セッシング・システム１００は、複数の入出力装置（Ｉ
／Ｏ）１０４からローカルに、そして、基本ハードウェ
ア１０６例えば、電源機構，冷却機構，ファン，メモリ
およびプロセッサからグローバルに入力を受信する複数
のオペレーティング・システム（ＯＳ）区画１０２ａ，
１０２ｂ，１０２ｃおよび１０２ｄを有する。４つのＯ
Ｓ区画がここに示されているが、当業者は、本発明の趣
旨および範囲内であらゆる数の区画を用いることができ
るということを容易に理解できる。ＯＳ区画１０２ａ−
１０２ｄの各々は、識別（ＩＤ）番号１０５ａ−１０５
ｄを有する。

【０００５】このようなシステムにおいて、１つの区画
上のエラー・ログに記録されるグローバル・リソースへ
の修復処置を、当該リソースを共用するその他の全ての
区画内のエラー・ログへ報告することが望ましい。区画
は、互いに分離されているので、他のどの区画のエラー
・ログ情報も知ることができない。サービス・アクショ
ンを要求するハードウェア・エラーがログに記録される
場合、診断は、ログ修復処置がログに記録されるまで問
題を報告し続けることとなる。従来のＬＰＡＲマルチプ
ロセッシング・システムにおいて、“修復された”リソ
ースを共用する各区画は、修復処置を手動で記録するた
めに、（システム検証モードの実行中の診断かまたはロ
グ修復処置保守援助機能の使用によって）訪問（ｖｉｓ
ｉｔ）される必要がある。すなわち、グローバル・リソ
ースは、これらの区画における問題として報告され続
け、修復処置が記録された区画においては報告されない
こととなる。これは、グローバルに報告されたエラーに
対するあらゆる修復処置を手動で記録するためにかなり
の時間とユーザの中断とを与える。

【０００６】したがって、グローバル・エラーの修復処
置を記録するために要求される時間の量を削減するため
のシステムおよび方法が必要とされる。当該システムお
よび方法は、費用有効的であり，容易に実現され，既存
システムに容易に適用できる必要がある。本発明はこの
ような必要性に取り組むものである。

【０００７】

【課題を解決するための手段】論理分割（ＬＰＡＲ）マ
ルチプロセッシング・システムにおいてログ修復処置を
処理する方法を開示する。ＬＰＡＲマルチプロセッシン
グ・システムは、複数の区画を有する。本方法およびシ
ステムは、複数の区画のうちの１つにログ修復処置を記
録するステップを含む。本方法およびシステムは、単一
のログ修復処置サービスへログ修復処置のレコードを送
信するステップをさらに含み、当該レコードは、ログ修
復処置と複数の区画のうちの１つの区画識別コードとを
含む。本方法およびシステムは、ログ修復処置を、単一
のサービスから複数の区画のうちのその他の区画のそれ
ぞれへ送信するステップをさらに含む。

【０００８】これにより、本発明に係るシステムおよび
方法は、制御の単一のフォーカル・ポイントを用いる通
知方式を使用することにより、複数の区画内で同一のア
クションを実行しなければならないという問題を解決す
る。フォーカル・ポイントが、実行されたアクションが
他の区画に共通であると判断する場合に、そのアクショ
ンはフォーカル・ポイントによって他の区画へブロード
キャストされ、各々の区画を訪問してアクションを繰り
返す必要性を除去する。各々の受信側区画は、ブロード
キャスト情報を用いてそのログ修復処置レコードを更新
する。このようにして、アクティブな作業区画に対する
短縮された修復シナリオとより少ない中断とが与えら
れ、これにより、より高いユーザ満足をもたらすシステ
ム可用性の増大をユーザに提供する。

【０００９】

【発明の実施の形態】本発明は、一般的には論理分割マ
ルチプロセッシング・システムに関し、特に、このよう
なシステムにおけるログ修復処置の処理に関する。以下
の説明は、当業者が本発明を実施し利用できるようにす
るために提供され、特許出願およびその要件の背景にお
いて与えられる。好適な実施の形態に対する様々な変更
とここに述べられる包括的な原理および特徴とは、当業
者にとって容易に明らかとすることができる。したがっ
て、本発明は、示される実施の形態に限定されることは
意図されず、ここに述べられる原理および特徴と一致す
る最大の範囲と一致することが意図される。

【００１０】本発明は、ハードウェア・システム・コン
ソール内部のサービス・フォーカル・ポイント（ＳＦ
Ｐ）・アプリケーション内のプロシージャを用いて、グ
ローバルに報告された障害に関連した各区画内のログ修
復処置を処理する。図２は、本発明に係るサービス・フ
ォーカル・ポイント（ＳＦＰ）・アプリケーションの図
である。このシステムおいて、ＳＦＰアプリケーション
２０２は、ハードウェア・システム・コンソール２００
上に存在する。ハードウェア・システム・コンソール２
００は、ＳＦＰアプリケーション２０２を実行する（図
示しない）プロセッサを含む。ＳＦＰアプリケーション
２０２は、典型的に、コンピュータ読み取り可能媒体、
例えば、フロッピー（Ｒ），ディスク・ドライブ，ＣＤ
ＲＯＭ，ＤＶＤ等上に存在する。サービス・フォーカ
ル・ポイント・アプリケーション２０２は、フィルタ２
０４を介してＯＳ区画１０２ａ−１０２ｎからエラー報
告を受信するサービス・アクション・イベント（ｓｅｒ
ｖｉｃｅａｃｔｉｏｎｅｖｅｎｔ；ＳＡＥ）・ログ
２０６を有する。ハードウェア・システム・コンソール
上にある他のアプリケーションは、エラー報告に関する
フィルタに掛けられた情報を受信し、サービスのコール
を発行するサービス・エージェント２０８である。示さ
れるように、ＬＰＡＲマルチプロセッシング・システム
において、各々の区画から与えられ得るローカル障害と
共にオペレーティング・システム１０２ａ−１０２ｎの
各々から与えられるグローバル障害が存在する。障害を
受信したＯＳ区画１０２ａ−１０２ｎの各々は、ハード
ウェア・システム内のサービス・フォーカル・ポイント
・アプリケーション２０２へエラー報告を送信すること
となる。各々のＯＳ区画１０２ａ−１０２ｎは、エラー
・ログを有する。

【００１１】図３は、単一の区画１０２のブロック図で
ある。区画１０２は、マネージャ１５２と通信するエラ
ー・ログ１５０を有する。マネージャ１５２は、（図２
の）ＳＦＰアプリケーション２０２から情報を受信し、
ＳＦＰアプリケーション２０２へ情報を伝送する。マネ
ージャ１５２は、ログ修復診断を実行する。本形態の論
理分割マルチプロセッシング・システムにおいては、報
告されるエラーの複製を除去し、サービス担当者へ報告
されるエラーの数を最小化することを指向する。

【００１２】図４は、ＬＰＡＲマルチプロセッシング・
システムにおいて、報告されるエラーの複製を最小化す
るプロセスを説明するフローチャートである。図２およ
び４を共に参照すると、ステップ３０２により、グロー
バルに報告された障害が、各ＯＳ区画１０２ａ−１０２
ｎへ報告される。続いて、ステップ３０４により、各オ
ペレーティング・システム区画は、障害をサービス・フ
ォーカル・ポイント・アプリケーション内のＳＡＥログ
２０６へ報告する。ＳＡＥログ２０６は、ＯＳ区画１０
２ａ−１０２ｎからの複製されたエラー・ログをフィル
タに掛けるフィルタ機構を有する。次に、ステップ３０
６により、ＳＡＥログ２０６は、サービス担当者による
後の利用のために、エラーを報告したＯＳ区画１０２ａ
−１０２ｎのそれぞれの区画ＩＤ１０５ａ−１０５ｎと
共にエラーの発生の最初の報告を保管する。ＳＡＥログ
２０６内のフィルタに掛けられたエラー・ログは、次
に、ステップ３０８により、サービス・エージェント・
アプリケーション２０８に受け渡される。次に、ステッ
プ３１０により、サービス・エージェント・アプリケー
ションは、サービスのコールに関して、単一の報告をサ
ービス担当者へ送信する。

【００１３】上述したプロセスは、エラーの複製がＳＦ
Ｐからサービス・エージェントへ報告されないというこ
とを保証する。本発明は、特定区画のユーザが、診断に
よって報告される問題を経験し続けることがないという
ことを保証するために、サービスが実行された後に区画
を更新する。

【００１４】本発明の特徴をより詳細に説明するため
に、関連する図と共に以下の説明を示す。図５は、区画
上のエラー・ログを更新するプロセスのフローチャート
である。図２，３および５を共に参照すると、サービス
が実行された後に最初に、ステップ４０４により、修復
された区画に修正が記録され、その区画のエラーおよび
区画ＩＤ番号と共にＳＦＰアプリケーション２０２へ送
信される。その次に、ステップ４０６により、ＳＦＰア
プリケーション２０２は、同一のエラーを報告した区画
のそれぞれに対してログ修復処置を送信する。次に、ス
テップ４０８により、ログ修復処置を受信した各区画
は、プログラム・マネージャ１５２によってログ修復処
置をそのエラー・ログ１５０に記録する。このように、
ＳＦＰアプリケーション２０２の使用により、ユーザが
ログ修復処置を手動で実行しなければならないのではな
く、ログ修復処置が自動的に実行可能となる。

【００１５】したがって、本発明によれば、サービス担
当者が障害が起きているリソースに対する正常な修復処
置を実行する場合には、それが区画上に記録され、エラ
ー・コード，修正リソースのロケーション・コードおよ
び報告区画情報と共に制御のフォーカル・ポイントへ受
け渡される。この時点で、区画のうちの１つだけが、リ
ソースが修正されたということを認識しており、訂正さ
れない場合には、認識していない区画上で不必要な修復
処置を生じさせる可能性がある。修復処置通知に基づい
て、制御のフォーカル・ポイントは、存在する場合には
その他の区画のうちのどれが同一のエラーを受信したか
判断する。同一のリソースに関する同一のエラーを報告
したその他の区画のそれぞれについて、制御のフォーカ
ル・ポイントは、修復の通知を当該その他の区画へ送信
する。続いて、その他の区画は、まるでサービス担当者
がその区画内でアクションを実行したかのように修復処
置を記録する。

【００１６】このようにして、本発明に係るシステムお
よび方法は、制御の単一のフォーカル・ポイントを用い
る通知方式を使用することにより、複数の区画において
同一のアクションを実行しなければならないという問題
を解決する。フォーカル・ポイントが、実行されたアク
ションが他の区画に共通であると判断する場合には、そ
のアクションは、フォーカル・ポイントによって当該他
の区画へブロードキャストされ、各区画を訪問してアク
ションを繰り返す必要性を除去する。このようにして、
アクティブな作業区画に対する短縮された修復シナリオ
とより少ない中断とが与えられ、より高いユーザ満足を
もたらすシステム可用性の増大をユーザに提供する。

【００１７】示された実施の形態に従って本発明を説明
してきたが、実施の形態に対する変形が可能であり、そ
のような変形は本発明の趣旨および範囲に含まれ得ると
いうことを、当業者は容易に理解できる。したがって、
当業者は、特許請求の範囲の趣旨および範囲から外れる
ことなしに、多くの変更を行うことができる。

【００１８】まとめとして、本発明の構成に関して以下
の事項を開示する。（１）論理分割（ＬＰＡＲ）マルチプロセッシング・シ
ステムにおいてログ修復処置を処理する方法であって、
前記ＬＰＡＲマルチプロセッシング・システムは、複数
の区画を有し、グローバルに報告されたエラーに応答す
る前記ログ修復処置を実行し、前記方法は、（ａ）前記
複数の区画のうちの１つに前記ログ修復処置を記録する
ステップと、（ｂ）前記ログ修復処置のレコードを単一
のログ修復処置サービスへ送信するステップとを有し、
前記レコードは、前記ログ修復処置と前記複数の区画の
うちの前記１つについての区画識別コードとを含み、さ
らに、（ｃ）前記ログ修復処置を、前記単一のサービス
から前記複数の区画のうちのその他の区画のそれぞれへ
送信するステップ、を含む方法。（２）（ｄ）前記複数の区画のうちの前記その他の区画
によって、前記ログ修復処置を記録するステップをさら
に含む上記（１）に記載の方法。（３）前記ログ修復処置は、前記複数の区画のうちの前
記その他の区画のそれぞれの内部のエラー・ログに記録
される上記（２）に記載の方法。（４）論理分割（ＬＰＡＲ）マルチプロセッシング・シ
ステムにおいてログ修復処置を処理するシステムであっ
て、前記ＬＰＡＲマルチプロセッシング・システムは、
複数の区画を有し、グローバルに報告されたエラーに応
答する前記ログ修復処置を実行し、前記システムは、前
記マルチプロセッシング・システム内の複数の区画に関
して、複数の関連するグローバルに報告されたエラーを
受信しフィルタに掛けるためのサービス・アクション・
イベント（ＳＡＥ）ログであって、前記複数のグローバ
ルに報告されたエラーのうちの最初の発生のみを保管
し、前記複数の区画のうちのその他の区画のそれぞれへ
ログ修復処置を与えるＳＡＥログと、前記ログ修復処置
を前記ＳＡＥログから受信し、前記ログ修復処置を記録
するための前記区画のそれぞれの内部のエラー・ログと
を備えるシステム。（５）前記ＳＡＥログは、前記複数の関連するグローバ
ルに報告されたエラーを前記ＬＰＡＲマルチプロセッシ
ング・システムから受信する手段と、前記複数の関連す
るグローバルに報告されたエラーのうちの最初の発生を
保管する手段と、前記最初の発生をサービス・エージェ
ントへ送信する手段とを、さらに備える上記（４）に記
載のシステム。（６）前記ＳＡＥログは、障害を報告した各区画のＩＤ
を保管する手段をさらに備える上記（５）に記載のシス
テム。（７）論理分割（ＬＰＡＲ）マルチプロセッシング・シ
ステムにおいてログ修復処置を処理するプログラムを含
むコンピュータ読み取り可能媒体であって、前記ＬＰＡ
Ｒマルチプロセッシング・システムは、複数の区画を有
し、グローバルに報告されたエラーに応答する前記ログ
修復処置を実行し、前記プログラムは、（ａ）前記複数
の区画のうちの１つに前記ログ修復処置を記録するステ
ップと、（ｂ）前記ログ修復処置のレコードを単一のロ
グ修復処置サービスへ送信するステップとを有し、前記
レコードは、前記ログ修復処置と前記複数の区画のうち
の前記１つについての区画識別コードとを含み、さら
に、（ｃ）前記ログ修復処置を、前記単一のサービスか
ら前記複数の区画のうちのその他の区画のそれぞれへ送
信するステップ、を含むコンピュータ読み取り可能媒
体。（８）（ｄ）前記複数の区画のうちの前記その他の区画
によって、前記ログ修復処置を記録するステップをさら
に含む上記（７）に記載のコンピュータ読み取り可能媒
体。（９）前記ログ修復処置は、前記複数の区画のうちの前
記その他の区画のそれぞれの内部のエラー・ログに記録
される上記（８）に記載のコンピュータ読み取り可能媒
体。

【図面の簡単な説明】

【図１】図１は、論理分割マルチプロセッシング・シス
テムのブロック図である。

【図２】図２は、本発明に係るサービス・フォーカル・
ポイント・アプリケーションの図である。

【図３】図３は、単一の区画のブロック図である。

【図４】図４は、本発明に係るＬＰＡＲマルチプロセッ
シング・システムにおいて、報告されるエラーの複製を
最小化するプロセスを説明するフローチャートである。

【図５】図５は、区画上のエラー・ログを更新するプロ
セスのフローチャートである。

【符号の説明】

１００論理分割（ＬＰＡＲ）マルチプロセッシング・
システム１０２オペレーティング・システム（ＯＳ）区画１０４入出力装置（Ｉ／Ｏ）１０５識別（ＩＤ）番号１０６基本ハードウェア１５０エラー・ログ１５２マネージャ２００ハードウェア・システム・コンソール２０２サービス・フォーカル・ポイント（ＳＦＰ）・
アプリケーション２０４フィルタ２０６サービス・アクション・イベント（ＳＡＥ）・
ログ２０８サービス・エージェント

───────────────────────────────────────────────────── フロントページの続き (71)出願人 399035836 インフィニオンテクノロジーズノースアメリカコーポレイションＩｎｆｉｎｅｏｎＴｅｃｈｎｏｌｏｇｉｅｓＮｏｒｔｈＡｍｅｒｉｃａＣｏｒｐアメリカ合衆国カリフォルニアサンホセノースファーストストリート 1730 1730 ＮｏｒｔｈＦｉｒｓｔＳｔｒｅｅｔ、ＳａｎＪｏｓｅ、ＣＡ、ＵＳＡ (74)上記１名の代理人 100086243 弁理士坂口博（外２名） (72)発明者マーク・エス・エドワーズアメリカ合衆国 78727 テキサス州オースティンアントワネットプレイス 12317 (72)発明者ジョージ・エイチ・アーレンスアメリカ合衆国 78660 テキサス州ピーフルーガーヴィルウッドローンドライブ 1213 (72)発明者ダグラス・エム・ベニーナスアメリカ合衆国 77853 テキサス州ダイムボックスボックス159エイ−１アールティー１（番地なし) (72)発明者アーサー・ジェイ・タイサーアメリカ合衆国 78610 テキサス州ブッダレジャーウッズ 702 Ｆターム(参考） 5B042 GA22 GC10 KK09 MA08 MC15 MC40 5B098 HH08 JJ01 JJ09

Claims

【特許請求の範囲】

【請求項１】論理分割（ＬＰＡＲ）マルチプロセッシン
グ・システムにおいてログ修復処置を処理する方法であ
って、前記ＬＰＡＲマルチプロセッシング・システム
は、複数の区画を有し、グローバルに報告されたエラー
に応答する前記ログ修復処置を実行し、前記方法は、（ａ）前記複数の区画のうちの１つに前記ログ修復処置
を記録するステップと、（ｂ）前記ログ修復処置のレコードを単一のログ修復処
置サービスへ送信するステップとを有し、前記レコード
は、前記ログ修復処置と前記複数の区画のうちの前記１
つについての区画識別コードとを含み、さらに、（ｃ）前記ログ修復処置を、前記単一のサービスから前
記複数の区画のうちのその他の区画のそれぞれへ送信す
るステップ、を含む方法。
【請求項２】（ｄ）前記複数の区画のうちの前記その他
の区画によって、前記ログ修復処置を記録するステップ
をさらに含む請求項１に記載の方法。
【請求項３】前記ログ修復処置は、前記複数の区画のう
ちの前記その他の区画のそれぞれの内部のエラー・ログ
に記録される請求項２に記載の方法。
【請求項４】論理分割（ＬＰＡＲ）マルチプロセッシン
グ・システムにおいてログ修復処置を処理するシステム
であって、前記ＬＰＡＲマルチプロセッシング・システ
ムは、複数の区画を有し、グローバルに報告されたエラ
ーに応答する前記ログ修復処置を実行し、前記システム
は、前記マルチプロセッシング・システム内の複数の区画に
関して、複数の関連するグローバルに報告されたエラー
を受信しフィルタに掛けるためのサービス・アクション
・イベント（ＳＡＥ）ログであって、前記複数のグロー
バルに報告されたエラーのうちの最初の発生のみを保管
し、前記複数の区画のうちのその他の区画のそれぞれへ
ログ修復処置を与えるＳＡＥログと、前記ログ修復処置を前記ＳＡＥログから受信し、前記ロ
グ修復処置を記録するための前記区画のそれぞれの内部
のエラー・ログとを備えるシステム。
【請求項５】前記ＳＡＥログは、前記複数の関連するグローバルに報告されたエラーを前
記ＬＰＡＲマルチプロセッシング・システムから受信す
る手段と、前記複数の関連するグローバルに報告されたエラーのう
ちの最初の発生を保管する手段と、前記最初の発生をサービス・エージェントへ送信する手
段とを、さらに備える請求項４に記載のシステム。
【請求項６】前記ＳＡＥログは、障害を報告した各区画のＩＤを保管する手段をさらに備
える請求項５に記載のシステム。
【請求項７】論理分割（ＬＰＡＲ）マルチプロセッシン
グ・システムにおいてログ修復処置を処理するプログラ
ムを含むコンピュータ読み取り可能媒体であって、前記
ＬＰＡＲマルチプロセッシング・システムは、複数の区
画を有し、グローバルに報告されたエラーに応答する前
記ログ修復処置を実行し、前記プログラムは、（ａ）前記複数の区画のうちの１つに前記ログ修復処置
を記録するステップと、（ｂ）前記ログ修復処置のレコードを単一のログ修復処
置サービスへ送信するステップとを有し、前記レコード
は、前記ログ修復処置と前記複数の区画のうちの前記１
つについての区画識別コードとを含み、さらに、（ｃ）前記ログ修復処置を、前記単一のサービスから前
記複数の区画のうちのその他の区画のそれぞれへ送信す
るステップ、を含むコンピュータ読み取り可能媒体。
【請求項８】（ｄ）前記複数の区画のうちの前記その他
の区画によって、前記ログ修復処置を記録するステップ
をさらに含む請求項７に記載のコンピュータ読み取り可
能媒体。
【請求項９】前記ログ修復処置は、前記複数の区画のう
ちの前記その他の区画のそれぞれの内部のエラー・ログ
に記録される請求項８に記載のコンピュータ読み取り可
能媒体。