JP2003323306A - 論理パーティション・データ処理システムでのエラーまたはイベントを処理する方法、コンピュータ・プログラム、データ処理システム - Google Patents

論理パーティション・データ処理システムでのエラーまたはイベントを処理する方法、コンピュータ・プログラム、データ処理システム

Info

Publication number
JP2003323306A
JP2003323306A JP2003100322A JP2003100322A JP2003323306A JP 2003323306 A JP2003323306 A JP 2003323306A JP 2003100322 A JP2003100322 A JP 2003100322A JP 2003100322 A JP2003100322 A JP 2003100322A JP 2003323306 A JP2003323306 A JP 2003323306A
Authority
JP
Japan
Prior art keywords
operating system
data processing
event
events
processing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003100322A
Other languages
English (en)
Other versions
JP3910554B2 (ja
Inventor
George John Dawkins
ジョージ・ジョン・ドーキンス
Prakash Vinodrai Desai
プラカシュ・ヴィノドレイ・デサイ
Gordon D Mcintosh
ゴードン・ディー・マッキントッシュ
Kanisha Patel
カニシャ・パテル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2003323306A publication Critical patent/JP2003323306A/ja
Application granted granted Critical
Publication of JP3910554B2 publication Critical patent/JP3910554B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】 【課題】 データ処理システムの論理パーティションで
エラーまたはイベントを処理する方法、コンピュータ・
プログラム、データ処理システムを提供する。 【解決手段】 オペレーティング・システム(OS)が
論理パーティションで初期設定されると、OSは、管理
ソフトウエアを用いて特定のエラーまたは他のイベント
を処理する機能を登録する。論理パーティションに影響
を与えるエラーまたは他のイベントが発生すると、管理
ソフトウエアは検査して、特定のエラーまたはイベント
が、OSにより処理できるエラーまたはイベントである
かどうかを調べる。もし、OSにより処理できるエラー
またはイベントであれば、OSは、エラーまたはイベン
トを通知される。そうでなければ、管理ソフトウエア
は、OSに他の適切な処理、例えば、OSおよび/また
はパーティションの終了を行うことを命ずる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般に論理パーテ
ィション・データ処理システムにおける複数のオペレー
ティング・システム・パーティションの管理に関し、特
にエラーおよび他のイベントの処理に関する。
【0002】
【従来の技術】データ処理システム(プラットフォー
ム)内の論理パーティション化された(logical
partioned:LPAR)機能は、単一オペレ
ーティング・システム(operating syst
em:OS)の複数コピーまたは複数の異機種オペレー
ティング・システムが単一データ処理システム・プラッ
トフォームで同時に動作することを可能にする。内部で
オペレーティング・システム・イメージが動作するパー
ティションは、プラットフォームのリソースの非並行サ
ブセットを割り当てられる。リソースを配分できるこれ
らのプラットフォームは、割り込み管理エリア、システ
ム・メモリ領域および入出力(I/O)アダプタ・バス
・スロットを有する1以上の構成的に別個のプロセッサ
を含む。パーティションのリソースは、OSイメージに
対するプラットフォームのファームウエアによって表現
される。
【0003】プラットフォーム内の別個のOSまたはO
S動作イメージのそれぞれは、1つの論理パーティショ
ンにおけるソフトウエア・エラーが、他のどのパーティ
ションの正しいオペレーションに影響を与えることがな
いように互いに保護されている。これは、非結合の1セ
ットのプラットフォーム・リソースに、各OSイメージ
によって直接管理されるように割り振ることによって、
および種々のイメージが、イメージに割り振られなかっ
たどのリソースも制御できないことを確実にする機構を
用意することによって実現される。さらに、オペレーテ
ィング・システムの割り振られたリソースの制御におけ
るソフトウエア・エラーは、他の全てのイメージのリソ
ースに影響を与えることを阻止される。したがって、O
S(または各別個のOS)の各イメージは、プラットフ
ォーム内の別個の1セットの配分可能なリソースを直接
に制御する。
【0004】LPARシステムにおけるハードウエア・
リソースについては、これらのリソースは、種々のパー
ティション間で個別に共有されている。パーティション
は、それ自体個別であるので、各パーティションは、ス
タンド−アローン・コンピュータのように見える。これ
らのリソースは、例えば入出力(I/O)アダプタ、メ
モリ・ディム(dimm)、不揮発性ランダム・アクセ
ス・メモリおよびハード・ディスクを含むことができ
る。LPARシステム内の各パーティションは、システ
ム全体のスイッチを切ったり入れたりすることなく、何
度も繰り返してブートおよびシャットダウンが可能であ
る。
【0005】実際には、パーティション間で個別に共有
されている入出力(I/O)装置の幾つかは、ハードウ
エアの共通部分、例えば、制御されまたはブリッジの下
流に位置する多くの入出力(I/O)アダプタを持つこ
とができるホストPCI(Peripheral Co
mponent Interface)ブリッジによっ
てそれ自体を制御される。このブリッジは、スロットに
割り当てられる全てのパーティションによって共有され
ていると考えることができる。したがって、ブリッジが
作動不能になると、ブリッジは、ブリッジの下流に位置
する装置を共有する全てのパーティションに影響を与え
る。実際は、問題自体は非常に厳しいので、いずれかの
パーティションがブリッジを更に使用しようとするなら
ば、LPARシステム全体はクラッシュするであろう。
すなわち、クラッシュで、LPARシステム全体が故障
する。通常の処理の方法は、ブリッジを共有する動作パ
ーティションを終了することである。このことは、この
故障のためにシステムがクラッシュするのを防ぐであろ
う。
【0006】通常起こるのは、ブリッジを使用不可(エ
ラー)状態にする入出力(I/O)アダプタ故障であ
る。発生の時には、入出力(I/O)アダプタ故障は、
マシン・チェック割り込み(machine chec
k interrupt:MCI)ハンドラを呼び出
す。これは、順に、エラーを報告し、次に、適切なパー
ティションを終了する。このプロセスは、この問題のた
めにLPARシステム全体がクラッシュするのを防ぐ通
常の解決方法である。
【0007】
【発明が解決しようとする課題】しかしながら、与えら
れたパーティションで動作する特定のオペレーティング
・システムしだいで、いくつかのエラーは、オペレーテ
ィング・システムによって回復可能であり、他のエラー
は回復不可能である。エラーが、特定のオペレーティン
グ・システムによって回復できるならば、最善の処理の
方法は、オペレーティング・システムにエラーを通知し
て、最適な処理を行うようにすることであろう。しかし
ながら、オペレーティング・システムが、エラーを回復
する機能を有していないならば、オペレーティング・シ
ステムにエラーを通知することを試みることは、好まし
くなく、エラー通知を解釈できないオペレーティング・
システムは、クラッシュが発生するまで、一定の処理を
単に続けるであろう。
【0008】したがって、必要なことは、エラーが発生
した時に、特定のエラーを処理できるオペレーティング
・システムに通知し、特定のエラーを処理できないオペ
レーティング・システムを終了する方法である。
【0009】
【課題を解決するための手段】本発明は、論理パーティ
ション(LPAR)データ処理システムにおけるエラー
または他のイベントを処理する方法、コンピュータ・プ
ログラム、データ処理システムを提供する。オペレーテ
ィング・システムが論理パーティションで初期設定され
ると、オペレーティング・システムは、管理ソフトウエ
アを用いて特定のエラーまたは他のイベントを処理する
機能を登録する。その論理パーティションに影響を与え
るエラーまたは他のイベントが発生すると、管理ソフト
ウエアは検査して、特定のエラーまたはイベントが、オ
ペレーティング・システムにより処理できるエラーまた
はイベントであるかどうかを調べる。もし、オペレーテ
ィング・システムにより処理できるエラーまたはイベン
トであれば、オペレーティング・システムは、エラーま
たはイベントを通知される。そうでなければ、管理ソフ
トウエアは、オペレーティング・システムに他の適切な
処理、例えば、オペレーティング・システムおよび/ま
たはパーティションの終了を行うことを命ずる。
【0010】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。図1を参照すると、本発明
を実現できる、データ処理システムのブロック図が示さ
れている。データ処理システム100は、システム・バ
ス106に接続された複数のプロセッサ101,10
2,103,104を含む対称マルチプロセッサ(sy
mmetric multiprocessor:SM
P)システムとすることができる。例えば、データ処理
システム100は、ネットワーク内のサーバとして構成
されるIBM RS/6000(登録商標)(ニューヨ
ーク州アーモンクのインターナショナル・ビジネス・マ
シーンズ・コーポレイションの製品)とすることができ
る。あるいはまた、単一プロセッサ・システムを用いる
ことができる。また、システム・バス106には、複数
のローカル・メモリ160〜163とのインターフェー
スを与えるメモリ・コントローラ/キャッシュ108が
接続されている。I/Oバス・ブリッジ110は、シス
テム・バス106に接続され、I/Oバス112とのイ
ンターフェースを与える。メモリ・コントローラ/キャ
ッシュ108とI/Oバス・ブリッジ110は、図に示
されているように、統合することができる。
【0011】データ処理システム100は、論理的にパ
ーティション化されたデータ処理システムである。した
がって、データ処理システム100は、同時に動作する
複数の異機種オペレーティング・システム(または単一
オペレーティング・システムの複数のインスタンス)を
有することができる。これらの複数のオペレーティング
・システムのそれぞれは、その内部で実行される多数の
ソフトウエア・プログラムを有することができる。デー
タ処理システム100は、別個のPCII/Oアダプタ
120,121,128,129,136、グラフィッ
ク・アダプタ148およびハード・ディスク・アダプタ
149を別個の論理パーティションに割り当てることが
できるように論理的にパーティション化されている。こ
の場合、グラフィック・アダプタ148は、図示しない
ディスプレイ装置の接続部を与え、一方、ハード・ディ
スク・アダプタ149は、ハード・ディスク150の接
続部を与え、ハード・ディスク150を制御する。
【0012】したがって、例えば、データ処理システム
100が、3つの論理区間P1,P2,P3に分割され
ているとすると、各PCII/Oアダプタ120,12
1,128,129,136、グラフィック・アダプタ
148、ハード・ディスク・アダプタ149、各ホスト
・プロセッサ101〜104および各ローカル・メモリ
160〜163は、3つのパーティションの内の1つに
割り当てられる。例えば、プロセッサ101、ローカル
・メモリ160およびPCII/Oアダプタ120,1
28,129は、論理パーティションP1に割り当てる
ことができ、プロセッサ102,103、ローカル・メ
モリ161およびPCII/Oアダプタ121,136
は、論理パーティションP2に割り当てることができ、
プロセッサ104、ローカルメモリ162,163、グ
ラフィック・アダプタ148およびハード・ディスク・
アダプタ149は、論理パーティションP3に割り当て
ることができる。
【0013】データ処理システム100内で実行される
各オペレーティング・システムは、別個の論理パーティ
ションに割り当てられる。したがって、データ処理シス
テム100内で実行される各オペレーティング・システ
ムは、論理パーティション内にある入出力装置のみにア
クセスすることができる。したがって、例えば、拡張対
話式エグゼクティブ(Advanced Intera
ctive Executive:AIX)オペレーテ
ィング・システムの第1のインスタンスは、パーティシ
ョンP1内で実行でき、AIXオペレーティング・シス
テムの第2のインスタンス(イメージ)は、パーティシ
ョンP2内で実行でき、リナックス・オペレーティング
・システムは、パーティションP3内で実行できる。
【0014】I/Oバス112に接続されたPCIホス
ト・ブリッジ114は、PCIバス115とのインター
フェースを与える。多数のPCII/Oアダプタ12
0,121は、PCI−to−PCIブリッジ116、
PCIバス118、PCIバス119、I/Oスロット
170およびI/Oスロット171を介してPCIバス
115に接続できる。PCI−to−PCIブリッジ1
16は、PCIバス118およびPCIバス119との
インターフェースを与える。各PCII/Oアダプタ1
20,121は、I/Oスロット170,171にそれ
ぞれ装着される。一般的なPCIバス実装は、4個から
8個のアダプタ(すなわち、アドイン・コネクタのため
の拡張スロット)をサポートする。各PCII/Oアダ
プタ120,121は、データ処理システム100と、
入出力装置、例えばデータ処理システム100のクライ
アントである他のネットワーク・コンピュータとの間の
インターフェースを与える。
【0015】追加のPCIホスト・ブリッジ122は、
追加のPCIバス123のためのインターフェースを与
える。PCIバス123は、多数のPCII/Oアダプ
タ128,129に接続される。PCII/Oアダプタ
128,129は、PCI−to−PCIブリッジ12
4、PCIバス126、PCIバス127、I/Oスロ
ット172およびI/Oスロット173を介してPCI
バス123へ接続できる。PCI−to−PCIブリッ
ジ124は、PCIバス126とPCIバス127との
間のインターフェースを与える。各PCII/Oアダプ
タ128,129は、I/Oスロット172,173に
それぞれ装着される。このようにして、追加の入出力装
置、例えばモデムまたはネットワーク・アダプタは、各
PCII/Oアダプタ128,129を介してサポート
できる。このようにして、データ処理システム100
は、複数のネットワーク・コンピュータへの接続を可能
にする。
【0016】I/Oスロット174に挿入された、メモ
リ・マップ・グラフィックアダプタ148は、PCIバ
ス144、PCI−to−PCIブリッジ142、PC
Iバス141およびPCIホスト・ブリッジ140を介
してI/Oバス112に接続できる。ハード・ディスク
・アダプタ149は、PCIバス145に接続されるI
/Oスロット175に装着できる。順に、このPCIバ
ス145は、PCI−to−PCIブリッジ142に接
続され、PCI−to−PCIブリッジ142は、PC
Iバス141によってPCIホスト・ブリッジ140に
接続される。
【0017】PCIホスト・ブリッジ130は、PCI
バス131のためのインターフェースを与え、I/Oバ
ス112に接続する。PCII/Oアダプタ136は、
I/Oスロット176に接続され、I/Oスロット17
6は、PCIバス133によってPCI−to−PCI
ブリッジ132に接続される。PCI−to−PCIブ
リッジ132は、PCIバス131に接続される。この
PCIバスは、またPCIホスト・ブリッジ130を、
サービス・プロセッサ・メールボックス・インターフェ
ースおよびISAバス・アクセス・パススルー・ロジッ
ク194およびPCI−to−PCIブリッジ132に
接続する。サービス・プロセッサ・メールボックス・イ
ンターフェースおよびISAバス・アクセス・パススル
ー・ロジック194は、PCI/ISAブリッジ193
に向かうPCIアクセスを転送する。NVRAMストレ
ージ192は、ISAバス196に接続される。サービ
ス・プロセッサ135は、ローカルPCIバス195を
介してサービス・プロセッサ・メールボックス・インタ
ーフェースおよびISAバス・アクセス・パススルー・
ロジック194に接続されている。サービス・プロセッ
サ135は、また多数のJTAG/I2 Cバス134を
経由してプロセッサ101〜104に接続されている。
JTAG/I2 Cバス134は、JTAG/スキャン・
バス(IEEE 1149.1参照)とフィリップス
(Phillips)I2 Cバスとの組み合わせであ
る。あるいはまた、JTAG/I2 Cバス134は、フ
ィリップスI2 CバスまたはJTAG/スキャン・バス
のみで置き換えることができる。ホスト・プロセッサ1
01,102,103,104の全てのSP−ATTN
信号は、サービス・プロセッサの割り込み入力信号に一
緒に接続される。サービス・プロセッサ135は、それ
自体のローカル・メモリ191を有し、ハードウエア・
OP−パネル190にアクセスする。
【0018】データ処理システム100が最初に立ち上
げられるとき、サービス・プロセッサ135は、JTA
G/I2 Cバス134を使用し、システム(ホスト)プ
ロセッサ101〜104、メモリ・コントローラ/キャ
ッシュ108およびI/Oバス・ブリッジ110に問い
合わせをする。このステップが完了すると、サービス・
プロセッサ135は、データ処理システム100につい
てのインベントリおよびトポロジ理解を有している。サ
ービス・プロセッサ135は、またホスト・プロセッサ
101〜104、メモリ・コントローラ/キャッシュ1
08およびI/Oバス・ブリッジ110に問い合わせを
することによって発見される全てのエレメントに、組み
込み自己テスト(Built−In−Self−Tes
t:BIST)、基本検証テスト(Basic Ass
urance Test:BAT)およびメモリ・テス
トを実行する。BIST、BATおよびメモリ・テスト
の際に検出される障害の全てのエラー情報が、サービス
・プロセッサ135によって集められ、報告される。
【0019】BIST、BATおよびメモリ・テストの
際に欠陥があることを分かったエレメントを取り出した
後に、システム・リソースの意味のある/有効な構成
が、依然として可能であるならば、データ処理システム
100は、ローカル(ホスト)メモリ160〜163へ
実行可能コードをロードすることができる。サービス・
プロセッサ135は、次に、ローカル・メモリ160〜
163へロードされたコードの実行のためにホスト・プ
ロセッサ101〜104を解放する。ホスト・プロセッ
サ101〜104が、データ処理システム100内の各
オペレーティング・システムからのコードを実行してい
る間、サービス・プロセッサ135は、モニタおよびエ
ラー報告のモードに入る。サービス・プロセッサ135
によってモニタされる種類の項目には、例えば、冷却フ
ァンの速度と動作、熱センサ、電源調整器、プロセッサ
101〜104,ローカル・メモリ160〜163およ
びI/Oバス・ブリッジ110によって報告される回復
可能および回復不可能エラーがある。サービス・プロセ
ッサ135は、データ処理システム100における全て
のモニタ項目に関係するエラー情報を保管し、報告しな
ければならない。また、サービス・プロセッサ135
は、エラーの種類および定められたしきい値に基づいて
処理を行う。例えば、サービス・プロセッサ135は、
プロセッサのキャッシュ・メモリの過剰な回復可能エラ
ーに注目し、ハード障害の前兆であると決定することが
可能である。この決定に基づき、サービス・プロセッサ
135は、現在動作しているセッションと将来のイニシ
ャル・プログラム・ロード(Initial Prog
ram Load:IPL)との際に、構成解除のリソ
ースをマークすることが可能である。IPLは、また
“ブート”または“ブートストラップ”と呼ばれること
がある。
【0020】データ処理システム100は、種々の市販
のコンピュータ・システムを用いて構成できる。例え
ば、データ処理システム100は、インターナショナル
・ビジネス・マシーンズ・コーポレイションから入手可
能なIBM(登録商標)eサーバ・iシリーズ・モデル
840システムを用いて構成できる。このようなシステ
ムは、これもまたインターナショナル・ビジネス・マシ
ーンズ・コーポレイションから入手可能なOS/400
オペレーティング・システムを用いて論理パーティショ
ン化することをサポートできる。
【0021】当業者は、図1に示されたハードウエアが
種々変化できることを理解するであろう。例えば、他の
周辺装置、例えば光学ディスク・ドライブ等もまた、図
示されたハードウエアに追加してまたは置き換えて用い
ることができる。図示された例は、本発明に関して、構
成的な制限を意味するものではない。
【0022】図2を参照すると、本発明を実現できる、
代表的な論理パーティション化されたプラットフォーム
のブロック図が示されている。論理パーティション化さ
れたプラットフォーム200のハードウエアは、例えば
図1のデータ処理システム100のように構成できる。
論理パーティション化されたプラットフォーム200
は、パーティション化されたハードウエア230、オペ
レーティング・システム202,204,206,20
8およびハイパーバイザ210を備える。オペレーティ
ング・システム202,204,206,208は、プ
ラットフォーム200で同時に動作する単一オペレーテ
ィング・システムの複数コピーまたは複数の異機種オペ
レーティング・システムとすることが可能である。これ
らのオペレーティング・システムは、ハイパーバイザと
インターフェースするために設計されているOS/40
0を用いて構成できる。オペレーティング・システム2
02,204,206,208は、パーティション20
3,205,207,209に配置される。さらに、こ
れらのパーティションは、また、ファームウエア・ロー
ダ211,213,215,217を備える。パーティ
ション203,205,207,209がインスタンス
化されると、オープン・ファームウエアのコピーが、ハ
イパーバイザのパーティション・マネージャによって各
パーティションにロードされる。パーティションに関連
付けられた、または割り当てられたプロセッサは、次
に、パーティションのメモリにディスパッチされ、パー
ティション・ファームウエアを実行する。
【0023】パーティション化されたハードウエア23
0は、複数のプロセッサ232〜238、複数のシステ
ム・メモリ装置240〜246、複数の入出力(I/
O)アダプタ248〜262およびストレージ装置27
0を備える。また、パーティション化されたハードウエ
ア230は、種々のサービス、例えばパーティションで
のエラー処理、を提供するために用いることができるサ
ービス・プロセッサ290を備える。プロセッサ232
〜238、メモリ装置240〜246、NVRAMスト
レージ298および入出力(I/O)アダプタ248〜
262のそれぞれは、オペレーティング・システム20
2,204,206,208の1つにそれぞれ対応す
る、論理パーティション化されたプラットフォーム20
0内の複数パーティションの1つに割り当てが可能であ
る。
【0024】ハイパーバイザ(パーティション管理ファ
ームウエア)210は、パーティション203,20
5,207,209のための多数の機能とサービスを実
行して、論理パーティション化されたプラットフォーム
200のパーティションを作り出し、実施する。ハイパ
ーバイザ210は、基礎ハードウエアと同一の、ファー
ムウエアで構成される仮想計算機である。ハイパーバイ
ザ・ソフトウエアは、インターナショナル・ビジネス・
マシーンズ・コーポレイションから入手可能である。フ
ァームウエアは、電気的パワー無しに内容を保持するメ
モリ・チップ、例えば、読み取り専用メモリ(RO
M)、プログラマブルROM(PROM)、電気的消去
プログラマブルROM(EEPROM)および不揮発性
ランダム・アクセス・メモリ(不揮発性RAM)に格納
されたソフトウエアである。したがって、ハイパーバイ
ザ210は、論理パーティション化されたプラットフォ
ーム200の全てのハードウエア・リソースをバーチャ
ライズすることによって、独立したオペレーティング・
システム202,204,206,208のイメージの
同時実行を可能にする。
【0025】本発明は、論理パーティション・データ処
理システム内の別個の論理パーティションで実行される
別個のオペレーティング・システムによってエラーまた
はイベントの処理を管理する方法、コンピュータ・プロ
グラムおよびデータ処理システムに関する。本発明の好
適な実施の形態において、ローカル・パーティションの
中でオペレーティング・システムの実行が開始される
と、オペレーティング・システム、すなわちオペレーテ
ィング・システムをロードするための適切なロード・プ
ログラムは、特定のエラーまたはイベントを処理するた
めのオペレーティング・システムの機能を管理ソフトウ
エア(すなわちハイパーバイザ)を用いて登録する。管
理ソフトウエアは、次に、その情報を用い、エラーまた
はイベントが管理ソフトウエアによってオペレーティン
グ・システムに関してどのように扱われるべきかを判別
する。
【0026】図3は、本発明の好適な実施の形態に従っ
て、管理ソフトウエアを用いて特定のエラーまたはイベ
ントを処理する機能を登録するオペレーティング・シス
テムのプロセスを示すブロック図である。オペレーティ
ング・システム300は、開始されており、論理パーテ
ィション302で実行されている。オペレーティング・
システム300は、オペレーティング・システム300
が処理できる1セットのエラーおよび/またはイベント
を説明する情報304を送ることによって管理ソフトウ
エア306を用いて機能を登録する。1セットは、0以
上のアイテムの集まりを意味する。この場合、1セット
内の項目は、オペレーティング・システム300が処理
できるエラーまたはイベントの識別である。エラーおよ
びイベントの例には、バス・エラー,セクタ・ルック・
アサイド・バッファ・エラー(sector look
aside buffer errors),トラン
スレーション・ルック・アサイド・バッファ・エラー
(translationlook aside bu
ffer errors),入出力エラー,ユーザー入
力,有用な新しいメッセージまたはコミュニケーション
等が含まれるが、これらに制限されるものではない。図
では、これらのエラーおよびイベントは、頭文字で示さ
れている。
【0027】管理ソフトウエア306は、メモリ中のデ
ータ構造310に情報308を格納する。データ構造3
10は、データ処理システムのいずれかの論理パーティ
ションで実行されるオペレーティング・システムに発せ
られる、どのエラーまたはイベントが処理できるか、管
理ソフトウエア306が識別できるようにする。
【0028】図4は、オペレーティング・システムが、
エラーまたはイベントを処理することが可能であるとき
に、本発明の好適な実施の形態において、エラーまたは
イベントを管理するプロセスを示すブロック図である。
ハードウエア・コンポーネント400は、管理ソフトウ
エア306が認識するエラーまたはイベント402を知
る。イベント402が、パーティション302で実行さ
れるオペレーティング・システム300に影響を与える
ことを判別する管理ソフトウエア306は、データ構造
310に照会404を行い、オペレーティング・システ
ム300がエラーまたはイベントを処理することが可能
であるかどうかを判別する。この場合、オペレーティン
グ・システム300は、エラーまたはイベントを処理す
ることが可能なので、照会404は、肯定的な結果40
6で応じられる。管理ソフトウエア306は、この肯定
的な結果に応じて、オペレーティング・システム300
にエラーまたはイベントの通知408を行う。オペレー
ティング・システム300は、次に、プログラミングに
従って、エラーまたはイベントに対して適切な処理を行
うことができる。
【0029】図5は、オペレーティング・システムが、
エラーまたはイベントを処理することが不可能であると
きに、本発明の好適な実施の形態において、エラーまた
はイベントを管理するプロセスを示すブロック図であ
る。ハードウエア・コンポーネント400は、管理ソフ
トウエア306が認識するエラーまたはイベント500
を知る。管理ソフトウエア306は、データ構造310
に照会502を行い、オペレーティング・システム30
0がエラーまたはイベントを処理することが可能である
かどうかを判別する。このとき、オペレーティング・シ
ステム300は、発生した特定のエラーまたはイベント
を処理することが不可能なので、否定的な結果504が
返される。管理ソフトウエア306は、そのとき、エラ
ーまたはイベントを処理する責任を負わなければならな
い。管理ソフトウエア306は、オペレーティング・シ
ステム300に適切な処理を行うこと命ずることによっ
てこれを行う。例えば、エラーの場合、管理ソフトウエ
ア306は、オペレーティング・システム300に致命
的エラーを伝えることによって、オペレーティング・シ
ステム300にインスタンスの終了506を行うことを
命ずることができる。言い換えれば、管理ソフトウエア
306は、オペレーティング・システム300に安全な
シャット・ダウンを行うことを命ずることができる。オ
ペレーティング・システム300が、管理ソフトウエア
306によって行うことを命じられたことが最後まで完
全に実行できないならば、管理ソフトウエア306は、
更なるエラーを避けるためにパーティション302を強
制的に終了することができる。
【0030】図6は、本発明の好適な実施の形態に従っ
て、オペレーティング・システムから管理機能を受け取
るプロセスを説明するフローチャートである。まず、管
理ソフトウエアは、特定のエラーまたはイベントを処理
するオペレーティング・システムの機能を受け取る(ス
テップ600)。管理ソフトウエアは、次に、これらの
機能をメモリ中のデータ構造に書き込む(ステップ60
2)。次に、管理ソフトウエアは、発生するエラーまた
はイベントを待つ(ステップ603)。
【0031】図7は、本発明の好適な実施の形態に従っ
て、論理パーティションで実行されるオペレーティング
・システムに関して、イベントを管理するプロセスを説
明するフローチャートである。まず、管理ソフトウエア
は、イベント(エラーでも良い)を識別する(ステップ
700)。次に、管理ソフトウエアは、特定のパーティ
ションに常駐するオペレーティング・システムがそのイ
ベントをサポートするかどうかを判別する(ステップ7
02)。言い換えれば、管理ソフトウエアは、そのオペ
レーティング・システムがそのイベントを処理すること
が可能かどうかを判別する。もし、そうであれば、管理
ソフトウエアは、オペレーティング・システムによって
処理することができるように、オペレーティング・シス
テムにイベントを通知し(ステップ704)、そしてプ
ロセスは終了する。もしそのプロセスがそのイベントを
サポートしないならば、管理ソフトウエアは、オペレー
ティング・システムに適切な処理、例えば安全なシャッ
トダウンを行うことを命じる(ステップ706)。次
に、管理ソフトウエアは、オペレーティング・システム
が命じられたタスクを完全に実行したかどうかを判別す
る(ステップ708)。もし、完全に実行していれば、
そのプロセスは、単に終了する。しかしながら、完全に
実行していないならば、管理ソフトウエアは、内部で実
行されているオペレーティング・システムおよび/また
はパーティションの実行を最終的に終了する(ステップ
710)。
【0032】本発明は、充分に機能するデータ処理シス
テムについて記述したが、本発明のプロセスが、命令ま
たは他の機能記述要素からなるコンピュータ読み取り可
能媒体の形態および種々の他の形態で配布できること、
および本発明が、配布を行うために実際に用いられる信
号保持媒体の特定のタイプに関係なく等しく適用可能で
あること、を当業者が理解するであろうことに注目する
ことは重要である。コンピュータ読み取り可能媒体の例
には、記録可能型媒体、例えばフロッピー(登録商標)
ディスク,ハード・ディスク,RAM,CD−ROM,
DVD−ROM、および伝送型媒体、例えば高周波およ
び光波伝送の伝送形態を用いるデジタルおよびアナログ
通信リンク,有線または無線通信リンクが含まれる。コ
ンピュータ読み取り可能媒体は、特定のデータ処理シス
テムにおいて実際の使用のためにデコードされる、コー
ド化されたフォーマットの形式を取ることができる。機
能記述要素は、機械に機能を与える情報である。機能記
述要素には、コンピュータ・プログラム,命令,規則,
事実,計算可能関数の定義,オブジェクトおよびデータ
構造が含まれるが、これらに制限されるものではない。
【0033】本発明の記述は、説明と記述のために提示
されており、開示された形態の発明に制限されることを
意図しない。多くの変更と変形が可能であることは当業
者には明らかであろう。実施例は、本発明の原理および
実際的な応用を最も良く説明し、意図された特定の使用
に適しているような種々の変更を有する種々の実施例の
発明を当業者に理解できるようにするために選択され、
記述されている。
【0034】まとめとして、本発明の構成に関して以下
の事項を開示する。 (1)オペレーティング・システムが処理できる1セッ
トのイベントを識別する情報をオペレーティング・シス
テムから受け取り、イベントの発生に応じて、イベント
が前記1セットのイベントに含まれるかどうかを判別
し、イベントが前記1セットのイベントに含まれている
という判別に応じて、オペレーティング・システムにそ
のイベントを通知し、イベントが前記1セットのイベン
トに含まれていないという判別に応じて、オペレーティ
ング・システムにオペレーションを行うことを命令する
方法。 (2)前記イベントは、エラーである上記(1)に記載
の方法。 (3)前記エラーは、ハードウエア・コンポーネントに
発生したエラーである上記(2)に記載の方法。 (4)前記オペレーションは、オペレーティング・シス
テムの実行を終了することである上記(1)に記載の方
法。 (5)前記オペレーティング・システムは、データ処理
システムの論理パーティション内で実行され、オペレー
ティング・システムの実行を終了することは、論理パー
ティションを終了することを含む上記(4)に記載の方
法。 (6)前記オペレーションは、致命的エラーを処理する
ことである上記(1)に記載の方法。 (7)前記オペレーティング・システムにオペレーショ
ンを行うことを命令することに応じて、前記オペレーテ
ィング・システムが、オペレーションを行ったかどうか
を判別し、前記オペレーティング・システムがオペレー
ションを行うことができなかったという判別に応じて、
前記オペレーティング・システムの実行を終了する上記
(1)に記載の方法。 (8)前記オペレーティング・システムは、データ処理
システムの論理パーティション内で実行され、オペレー
ティング・システムの実行を終了することは、論理パー
ティションを終了することを含む上記(7)に記載の方
法。 (9)データ処理システムの論理パーティション内でオ
ペレーティング・システムを開始し、前記オペレーティ
ング・システムによって処理できる1セットのエラー状
態をデータ処理システム内で実行を行う管理ソフトウエ
アを用いて登録する方法。 (10)前記管理ソフトウエアは、データ処理システム
のファームウエアからなる上記(9)に記載の方法。 (11)前記管理ソフトウエアは、前記論理パーティシ
ョンの外部にある環境で実行される上記(9)に記載の
方法。 (12)機能記述要素からなるコンピューター読み取り
可能媒体内のコンピュータ・プログラムであって、コン
ピュータによって実行されたときに、オペレーティング
・システムが処理できる1セットのイベントを識別する
情報をオペレーティング・システムから受け取り、イベ
ントの発生に応じて、イベントが前記1セットのイベン
トに含まれるかどうかを判別し、イベントが前記1セッ
トのイベントに含まれているという判別に応じて、オペ
レーティング・システムにそのイベントを通知し、イベ
ントが前記1セットのイベントに含まれていないという
判別に応じて、オペレーティング・システムにオペレー
ションを行うことを命令する、ことを含む処理をコンピ
ュータが行うことを可能にするコンピュータ・プログラ
ム。 (13)前記イベントは、エラーである上記(12)に
記載のコンピュータ・プログラム。 (14)前記エラーは、ハードウエア・コンポーネント
に発生したエラーである上記(13)に記載のコンピュ
ータ・プログラム。 (15)前記オペレーションは、オペレーティング・シ
ステムの実行を終了することである上記(12)に記載
のコンピュータ・プログラム。 (16)前記オペレーティング・システムは、データ処
理システムの論理パーティション内で実行され、オペレ
ーティング・システムの実行を終了することは、論理パ
ーティションを終了することを含む上記(15)に記載
のコンピュータ・プログラム。 (17)前記オペレーションは、致命的エラーを処理す
ることである上記(12)に記載のコンピュータ・プロ
グラム。 (18)コンピュータによって実行されたときに、前記
オペレーティング・システムにオペレーションを行うこ
とを命令することに応じて、前記オペレーティング・シ
ステムが、オペレーションを行ったかどうかを判別し、
前記オペレーティング・システムがオペレーションを行
うことができなかったという判別に応じて、前記オペレ
ーティング・システムの実行を終了する、ことを含む追
加の処理をコンピュータが行うことを可能にする追加の
機能記述要素からなる上記(12)に記載のコンピュー
タ・プログラム。 (19)前記オペレーティング・システムは、データ処
理システムの論理パーティション内で実行され、オペレ
ーティング・システムの実行を終了することは、論理パ
ーティションを終了することを含む上記(18)に記載
のコンピュータ・プログラム。 (20)機能記述要素を含むコンピュータ読み取り可能
媒体内のコンピュータ・プログラムであって、コンピュ
ータによって実行されたときに、データ処理システムの
論理パーティション内でオペレーティング・システムを
開始し、前記オペレーティング・システムによって処理
できる1セットのエラー状態をデータ処理システム内で
実行を行う管理ソフトウエアを用いて登録する、ことを
含む処理をコンピュータが行うことを可能にするコンピ
ュータ・プログラム。 (21)前記機能記述要素は、オペレーティング・シス
テムの一部を形成する上記(20)に記載のコンピュー
タ・プログラム。 (22)コンピュータによって実行されたときに、スト
レージ装置からオペレーティング・システムをロードす
ることを含む追加の処理をコンピュータが行うことを可
能にする追加の機能記述要素からなる上記(20)に記
載のコンピュータ・プログラム。 (23)少なくとも1つのプロセッサを有する処理装置
と、処理装置と通信するメモリと、メモリに格納された
ファームウエアとを備え、処理装置がファームウエアを
実行して、オペレーティング・システムが処理できる1
セットのイベントを識別する情報を前記オペレーティン
グ・システムから受け取り、イベントの発生に応じて、
イベントが前記1セットのイベントに含まれるかどうか
を判別し、イベントが前記1セットのイベントに含まれ
ているという判別に応じて、オペレーティング・システ
ムにイベントを通知し、イベントが前記1セットのイベ
ントに含まれていないという判別に応じて、オペレーテ
ィング・システムにオペレーションを行うことを命令す
る、ことを含む処理を行うデータ処理システム。 (24)前記イベントは、エラーである上記(23)に
記載のデータ処理システム。 (25)前記エラーは、ハードウエア・コンポーネント
に発生したエラーである上記(24)に記載のデータ処
理システム。 (26)前記オペレーションは、オペレーティング・シ
ステムの実行を終了することである上記(23)に記載
のデータ処理システム。 (27)前記オペレーティング・システムは、データ処
理システムの論理パーティション内で実行され、オペレ
ーティング・システムの実行を終了することは、論理パ
ーティションを終了することを含む上記(26)に記載
のデータ処理システム。 (28)前記オペレーションは、致命的エラーを処理す
ることである上記(23)に記載のデータ処理システ
ム。 (29)前記処理装置がファームウエアを実行して、前
記オペレーティング・システムにオペレーションを行う
ことを命令することに応じて、前記オペレーティング・
システムが、オペレーションを行ったかどうかを判別
し、前記オペレーティング・システムがオペレーション
を行うことができなかったという判別に応じて、前記オ
ペレーティング・システムの実行を終了する、追加の処
理を行う上記(23)に記載のデータ処理システム。 (30)前記オペレーティング・システムは、データ処
理システムの論理パーティション内で実行され、オペレ
ーティング・システムの実行を終了することは、論理パ
ーティションを終了することを含む上記(29)に記載
のデータ処理システム。 (31)オペレーティング・システムが処理できる1セ
ットのイベントを識別する情報をオペレーティング・シ
ステムから受け取る手段と、イベントの発生に応じて、
イベントが前記1セットのイベントに含まれるかどうか
を判別する手段と、イベントが前記1セットのイベント
に含まれているという判別に応じて、オペレーティング
・システムにイベントを通知する手段と、イベントが前
記1セットのイベントに含まれていないという判別に応
じて、オペレーティング・システムにオペレーションを
行うことを命令する手段と、を有するデータ処理システ
ム。 (32)データ処理システムの論理パーティション内で
オペレーティング・システムを開始する手段と、前記オ
ペレーティング・システムによって処理できる1セット
のエラー状態をデータ処理システム内で実行を行う管理
ソフトウエアを用いて登録する手段と、を有するデータ
処理システム。
【図面の簡単な説明】
【図1】本発明を実現できる、データ処理システムのブ
ロック図である。
【図2】本発明を実現できる、代表的な論理パーティシ
ョン化されたプラットフォームのブロック図である。
【図3】本発明の好適な実施の形態に従って、管理ソフ
トウエアを用いて特定のエラーまたはイベントを処理す
る機能を登録するオペレーティング・システムのプロセ
スを示すブロック図である。
【図4】オペレーティング・システムが、エラーまたは
イベントを処理することが可能であるときに、本発明の
好適な実施の形態において、エラーまたはイベントを管
理するプロセスを示すブロック図である。
【図5】オペレーティング・システムが、エラーまたは
イベントを処理することが不可能であるときに、本発明
の好適な実施の形態において、エラーまたはイベントを
管理するプロセスを示すブロック図である。
【図6】本発明の好適な実施の形態に従って、オペレー
ティング・システムから管理機能を受け取るプロセスを
説明するフローチャートである。
【図7】本発明の好適な実施の形態に従って、論理パー
ティションで実行されるオペレーティング・システムに
関して、イベントを管理するプロセスを説明するフロー
チャートである。
【符号の説明】
100 データ処理システム 101〜104,232,234,236,238 プ
ロセッサ 106 システム・バス 108 メモリ・コントローラ/キャッシュ 110 I/Oバス・ブリッジ 112 I/Oバス 114,122,130,140 PCIホスト・ブリ
ッジ 115,118,119,123,126,127,1
31,133,141,144,145 PCIバス 116,124,132,142 PCI−to−PC
I 120,121,128,129,136 PCII/
Oアダプタ 134 JTAG/I2 Cバス 135,290 サービス・プロセッサ 148 グラフィック・アダプタ 149 ハード・ディスク・アダプタ 150 ハード・ディスク 160〜163 ローカル・メモリ 170〜176 I/Oスロット 190 ハードウエア・OP−パネル 191 メモリ 192,298 NVRAMストレージ 193 PCI/ISAブリッジ 194 サービス・プロセッサ・メールボックス・イン
ターフェースおよびISAバス・アクセス・パススルー
・ロジック 195 ローカルPCIバス 196 ISAバス 200 論理パーティション化されたプラットフォーム 202,204,206,208,300 オペレーテ
ィング・システム 203,205,207,209,302 パーティシ
ョン 210 ハイパーバイザ 211,213,215,217 ファームウエア・ロ
ーダ 230 パーティション化されたハードウエア 240,242,244,246 メモリ装置 248,250,252,254,256,258,2
60,262 入出力(I/O)アダプタ 270 ストレージ装置 304,308 情報 306 管理ソフトウエア 310 データ構造 400 ハードウエア・コンポーネント 402,500 エラーまたはイベント 404,502 照会 406,504 結果 408 通知 506 終了 600,602,604 処理ステップ 700,702,704,706,708,710 処
理ステップ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジョージ・ジョン・ドーキンス アメリカ合衆国 78759 テキサス州 オ ースティン ブラックホーク ドライブ 11601 (72)発明者 プラカシュ・ヴィノドレイ・デサイ アメリカ合衆国 78681 テキサス州 ラ ウンド ロック ロビン トレイル 1202 (72)発明者 ゴードン・ディー・マッキントッシュ アメリカ合衆国 78758 テキサス州 オ ースティン #1633ビー ストーンホロウ ディーアール 11915 (72)発明者 カニシャ・パテル アメリカ合衆国 78613 テキサス州 セ ダー パーク メスキート ロード 1222 Fターム(参考) 5B098 HH01 HH04 JJ08

Claims (32)

    【特許請求の範囲】
  1. 【請求項1】オペレーティング・システムが処理できる
    1セットのイベントを識別する情報をオペレーティング
    ・システムから受け取り、 イベントの発生に応じて、イベントが前記1セットのイ
    ベントに含まれるかどうかを判別し、 イベントが前記1セットのイベントに含まれているとい
    う判別に応じて、オペレーティング・システムにそのイ
    ベントを通知し、 イベントが前記1セットのイベントに含まれていないと
    いう判別に応じて、オペレーティング・システムにオペ
    レーションを行うことを命令する方法。
  2. 【請求項2】前記イベントは、エラーである請求項1に
    記載の方法。
  3. 【請求項3】前記エラーは、ハードウエア・コンポーネ
    ントに発生したエラーである請求項2に記載の方法。
  4. 【請求項4】前記オペレーションは、オペレーティング
    ・システムの実行を終了することである請求項1に記載
    の方法。
  5. 【請求項5】前記オペレーティング・システムは、デー
    タ処理システムの論理パーティション内で実行され、オ
    ペレーティング・システムの実行を終了することは、論
    理パーティションを終了することを含む請求項4に記載
    の方法。
  6. 【請求項6】前記オペレーションは、致命的エラーを処
    理することである請求項1に記載の方法。
  7. 【請求項7】前記オペレーティング・システムにオペレ
    ーションを行うことを命令することに応じて、前記オペ
    レーティング・システムが、オペレーションを行ったか
    どうかを判別し、 前記オペレーティング・システムがオペレーションを行
    うことができなかったという判別に応じて、前記オペレ
    ーティング・システムの実行を終了する請求項1に記載
    の方法。
  8. 【請求項8】前記オペレーティング・システムは、デー
    タ処理システムの論理パーティション内で実行され、オ
    ペレーティング・システムの実行を終了することは、論
    理パーティションを終了することを含む請求項7に記載
    の方法。
  9. 【請求項9】データ処理システムの論理パーティション
    内でオペレーティング・システムを開始し、 前記オペレーティング・システムによって処理できる1
    セットのエラー状態をデータ処理システム内で実行を行
    う管理ソフトウエアを用いて登録する方法。
  10. 【請求項10】前記管理ソフトウエアは、データ処理シ
    ステムのファームウエアからなる請求項9に記載の方
    法。
  11. 【請求項11】前記管理ソフトウエアは、前記論理パー
    ティションの外部にある環境で実行される請求項9に記
    載の方法。
  12. 【請求項12】機能記述要素からなるコンピューター読
    み取り可能媒体内のコンピュータ・プログラムであっ
    て、 コンピュータによって実行されたときに、 オペレーティング・システムが処理できる1セットのイ
    ベントを識別する情報をオペレーティング・システムか
    ら受け取り、 イベントの発生に応じて、イベントが前記1セットのイ
    ベントに含まれるかどうかを判別し、 イベントが前記1セットのイベントに含まれているとい
    う判別に応じて、オペレーティング・システムにそのイ
    ベントを通知し、 イベントが前記1セットのイベントに含まれていないと
    いう判別に応じて、オペレーティング・システムにオペ
    レーションを行うことを命令する、ことを含む処理をコ
    ンピュータが行うことを可能にするコンピュータ・プロ
    グラム。
  13. 【請求項13】前記イベントは、エラーである請求項1
    2に記載のコンピュータ・プログラム。
  14. 【請求項14】前記エラーは、ハードウエア・コンポー
    ネントに発生したエラーである請求項13に記載のコン
    ピュータ・プログラム。
  15. 【請求項15】前記オペレーションは、オペレーティン
    グ・システムの実行を終了することである請求項12に
    記載のコンピュータ・プログラム。
  16. 【請求項16】前記オペレーティング・システムは、デ
    ータ処理システムの論理パーティション内で実行され、
    オペレーティング・システムの実行を終了することは、
    論理パーティションを終了することを含む請求項15に
    記載のコンピュータ・プログラム。
  17. 【請求項17】前記オペレーションは、致命的エラーを
    処理することである請求項12に記載のコンピュータ・
    プログラム。
  18. 【請求項18】コンピュータによって実行されたとき
    に、 前記オペレーティング・システムにオペレーションを行
    うことを命令することに応じて、前記オペレーティング
    ・システムが、オペレーションを行ったかどうかを判別
    し、 前記オペレーティング・システムがオペレーションを行
    うことができなかったという判別に応じて、前記オペレ
    ーティング・システムの実行を終了する、ことを含む追
    加の処理をコンピュータが行うことを可能にする追加の
    機能記述要素からなる請求項12に記載のコンピュータ
    ・プログラム。
  19. 【請求項19】前記オペレーティング・システムは、デ
    ータ処理システムの論理パーティション内で実行され、
    オペレーティング・システムの実行を終了することは、
    論理パーティションを終了することを含む請求項18に
    記載のコンピュータ・プログラム。
  20. 【請求項20】機能記述要素を含むコンピュータ読み取
    り可能媒体内のコンピュータ・プログラムであって、 コンピュータによって実行されたときに、 データ処理システムの論理パーティション内でオペレー
    ティング・システムを開始し、 前記オペレーティング・システムによって処理できる1
    セットのエラー状態をデータ処理システム内で実行を行
    う管理ソフトウエアを用いて登録する、ことを含む処理
    をコンピュータが行うことを可能にするコンピュータ・
    プログラム。
  21. 【請求項21】前記機能記述要素は、オペレーティング
    ・システムの一部を形成する請求項20に記載のコンピ
    ュータ・プログラム。
  22. 【請求項22】コンピュータによって実行されたとき
    に、 ストレージ装置からオペレーティング・システムをロー
    ドすることを含む追加の処理をコンピュータが行うこと
    を可能にする追加の機能記述要素からなる請求項20に
    記載のコンピュータ・プログラム。
  23. 【請求項23】少なくとも1つのプロセッサを有する処
    理装置と、 処理装置と通信するメモリと、 メモリに格納されたファームウエアとを備え、 処理装置がファームウエアを実行して、 オペレーティング・システムが処理できる1セットのイ
    ベントを識別する情報を前記オペレーティング・システ
    ムから受け取り、 イベントの発生に応じて、イベントが前記1セットのイ
    ベントに含まれるかどうかを判別し、 イベントが前記1セットのイベントに含まれているとい
    う判別に応じて、オペレーティング・システムにイベン
    トを通知し、 イベントが前記1セットのイベントに含まれていないと
    いう判別に応じて、オペレーティング・システムにオペ
    レーションを行うことを命令する、ことを含む処理を行
    うデータ処理システム。
  24. 【請求項24】前記イベントは、エラーである請求項2
    3に記載のデータ処理システム。
  25. 【請求項25】前記エラーは、ハードウエア・コンポー
    ネントに発生したエラーである請求項24に記載のデー
    タ処理システム。
  26. 【請求項26】前記オペレーションは、オペレーティン
    グ・システムの実行を終了することである請求項23に
    記載のデータ処理システム。
  27. 【請求項27】前記オペレーティング・システムは、デ
    ータ処理システムの論理パーティション内で実行され、
    オペレーティング・システムの実行を終了することは、
    論理パーティションを終了することを含む請求項26に
    記載のデータ処理システム。
  28. 【請求項28】前記オペレーションは、致命的エラーを
    処理することである請求項23に記載のデータ処理シス
    テム。
  29. 【請求項29】前記処理装置がファームウエアを実行し
    て、 前記オペレーティング・システムにオペレーションを行
    うことを命令することに応じて、前記オペレーティング
    ・システムが、オペレーションを行ったかどうかを判別
    し、 前記オペレーティング・システムがオペレーションを行
    うことができなかったという判別に応じて、前記オペレ
    ーティング・システムの実行を終了する、追加の処理を
    行う請求項23に記載のデータ処理システム。
  30. 【請求項30】前記オペレーティング・システムは、デ
    ータ処理システムの論理パーティション内で実行され、
    オペレーティング・システムの実行を終了することは、
    論理パーティションを終了することを含む請求項29に
    記載のデータ処理システム。
  31. 【請求項31】オペレーティング・システムが処理でき
    る1セットのイベントを識別する情報をオペレーティン
    グ・システムから受け取る手段と、 イベントの発生に応じて、イベントが前記1セットのイ
    ベントに含まれるかどうかを判別する手段と、 イベントが前記1セットのイベントに含まれているとい
    う判別に応じて、オペレーティング・システムにイベン
    トを通知する手段と、 イベントが前記1セットのイベントに含まれていないと
    いう判別に応じて、オペレーティング・システムにオペ
    レーションを行うことを命令する手段と、を有するデー
    タ処理システム。
  32. 【請求項32】データ処理システムの論理パーティショ
    ン内でオペレーティング・システムを開始する手段と、 前記オペレーティング・システムによって処理できる1
    セットのエラー状態をデータ処理システム内で実行を行
    う管理ソフトウエアを用いて登録する手段と、を有する
    データ処理システム。
JP2003100322A 2002-04-25 2003-04-03 論理パーティション・データ処理システムでのエラーまたはイベントを処理する方法、コンピュータ・プログラム、データ処理システム Expired - Lifetime JP3910554B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/132,136 US6920587B2 (en) 2002-04-25 2002-04-25 Handling multiple operating system capabilities in a logical partition data processing system
US10/132136 2002-04-25

Publications (2)

Publication Number Publication Date
JP2003323306A true JP2003323306A (ja) 2003-11-14
JP3910554B2 JP3910554B2 (ja) 2007-04-25

Family

ID=29248695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003100322A Expired - Lifetime JP3910554B2 (ja) 2002-04-25 2003-04-03 論理パーティション・データ処理システムでのエラーまたはイベントを処理する方法、コンピュータ・プログラム、データ処理システム

Country Status (3)

Country Link
US (1) US6920587B2 (ja)
JP (1) JP3910554B2 (ja)
TW (1) TWI241525B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005228323A (ja) * 2004-02-12 2005-08-25 Internatl Business Mach Corp <Ibm> テクノロジの利用に関する追跡ならびに請求書作成の方法およびシステム
JP2008005481A (ja) * 2006-06-20 2008-01-10 Lenovo Singapore Pte Ltd ネットワークアドレスを維持する方法、装置、およびプログラム
JP2013534665A (ja) * 2010-06-23 2013-09-05 インターナショナル・ビジネス・マシーンズ・コーポレーション コンピューティング環境のイベントを管理する方法、これを実行するためのコンピュータ・プログラム、およびコンピュータ・システム

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002251326A (ja) * 2001-02-22 2002-09-06 Hitachi Ltd 耐タンパ計算機システム
US8612992B2 (en) * 2003-04-09 2013-12-17 Jaluna Sa Operating systems
EP1467282B1 (en) * 2003-04-09 2008-10-01 Jaluna SA Operating systems
US7117385B2 (en) * 2003-04-21 2006-10-03 International Business Machines Corporation Method and apparatus for recovery of partitions in a logical partitioned data processing system
EP1503286B1 (en) * 2003-07-30 2014-09-03 Jaluna SA Multiple operating system networking
JP2007509387A (ja) * 2003-09-30 2007-04-12 ジャルナ エスアー オペレーティングシステム
US7260752B2 (en) * 2004-02-19 2007-08-21 International Business Machines Corporation Method and apparatus for responding to critical abstracted platform events in a data processing system
US7383555B2 (en) 2004-03-11 2008-06-03 International Business Machines Corporation Apparatus and method for sharing a network I/O adapter between logical partitions
US7509538B2 (en) * 2004-04-21 2009-03-24 Microsoft Corporation Systems and methods for automated classification and analysis of large volumes of test result data
US8028189B2 (en) * 2004-11-17 2011-09-27 International Business Machines Corporation Recoverable machine check handling
US7325163B2 (en) * 2005-01-04 2008-01-29 International Business Machines Corporation Error monitoring of partitions in a computer system using supervisor partitions
US7543305B2 (en) * 2005-03-24 2009-06-02 International Business Machines Corporation Selective event registration
JP2007226413A (ja) * 2006-02-22 2007-09-06 Hitachi Ltd メモリダンプ方法、メモリダンププログラム、及び、計算機システム
US8209668B2 (en) 2006-08-30 2012-06-26 International Business Machines Corporation Method and system for measuring the performance of a computer system on a per logical partition basis
US7979749B2 (en) * 2006-11-15 2011-07-12 International Business Machines Corporation Method and infrastructure for detecting and/or servicing a failing/failed operating system instance
US7783867B2 (en) * 2007-02-01 2010-08-24 International Business Machines Corporation Controlling instruction execution in a processing environment
US8352960B2 (en) * 2007-08-13 2013-01-08 International Business Machines Corporation Limiting receipt of unsolicited events by a logical partition in a data storage system
US20090049456A1 (en) * 2007-08-13 2009-02-19 Ibm Corporation Limiting receipt of unsolicited events by a logical partition in a data storage system
US8655868B2 (en) * 2007-09-12 2014-02-18 Ebay Inc. Inference of query relationships based on retrieved attributes
US7779305B2 (en) * 2007-12-28 2010-08-17 Intel Corporation Method and system for recovery from an error in a computing device by transferring control from a virtual machine monitor to separate firmware instructions
US8201029B2 (en) 2008-01-31 2012-06-12 International Business Machines Corporation Method and apparatus for operating system event notification mechanism using file system interface
US7953914B2 (en) * 2008-06-03 2011-05-31 International Business Machines Corporation Clearing interrupts raised while performing operating system critical tasks
US8195981B2 (en) * 2008-06-03 2012-06-05 International Business Machines Corporation Memory metadata used to handle memory errors without process termination
US7743375B2 (en) * 2008-06-27 2010-06-22 International Business Machines Corporation Information handling system including dynamically merged physical partitions
JP5251385B2 (ja) * 2008-09-16 2013-07-31 富士通株式会社 イベント検出システム、イベント検出方法、およびプログラム
JP4888742B2 (ja) 2009-02-25 2012-02-29 ソニー株式会社 情報処理装置および方法、並びにプログラム
US8132057B2 (en) * 2009-08-07 2012-03-06 International Business Machines Corporation Automated transition to a recovery kernel via firmware-assisted-dump flows providing automated operating system diagnosis and repair
US8793686B2 (en) 2011-06-08 2014-07-29 Microsoft Corporation Operating system decoupled heterogeneous computing
US8713378B2 (en) 2011-07-07 2014-04-29 Microsoft Corporation Health monitoring of applications in a guest partition
EP2795505A4 (en) 2011-12-22 2015-09-02 Intel Corp ACTIVATION AND MONETIZATION OF INTEGRATED FUNCTIONS IN STORAGE SUBSYSTEMS USING A RELIABLE CONNECTION SERVICE BACKPACK INFRASTRUCTURE
US9026865B2 (en) * 2012-06-11 2015-05-05 Unisys Corporation Software handling of hardware error handling in hypervisor-based systems
JP5933356B2 (ja) * 2012-06-12 2016-06-08 ルネサスエレクトロニクス株式会社 コンピュータシステム
CN105051698B (zh) 2013-03-28 2018-11-16 瑞典爱立信有限公司 用于基础设施即服务云中故障管理的方法和布置
CN107203451B (zh) * 2016-03-18 2020-09-18 伊姆西Ip控股有限责任公司 用于在存储系统中处理故障的方法及设备
US20240211372A1 (en) * 2022-12-22 2024-06-27 Lenovo Enterprise Solutions (Singapore) Pte Ltd. Generating partition-dependent log output

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4371930A (en) 1980-06-03 1983-02-01 Burroughs Corporation Apparatus for detecting, correcting and logging single bit memory read errors
JPS5755454A (en) 1980-09-19 1982-04-02 Hitachi Ltd Failure recovery system
US4535455A (en) 1983-03-11 1985-08-13 At&T Bell Laboratories Correction and monitoring of transient errors in a memory system
US4604751A (en) 1984-06-29 1986-08-05 International Business Machines Corporation Error logging memory system for avoiding miscorrection of triple errors
US5072450A (en) 1989-07-27 1991-12-10 Zenith Data Systems Corporation Method and apparatus for error detection and localization
US5245615A (en) 1991-06-06 1993-09-14 International Business Machines Corporation Diagnostic system and interface for a personal computer
US5263032A (en) 1991-06-27 1993-11-16 Digital Equipment Corporation Computer system operation with corrected read data function
JP2888401B2 (ja) 1992-08-03 1999-05-10 インターナショナル・ビジネス・マシーンズ・コーポレイション 冗長ディスクドライブアレイに対する同期方法
US5504859A (en) 1993-11-09 1996-04-02 International Business Machines Corporation Data processor with enhanced error recovery
US5729767A (en) 1994-10-07 1998-03-17 Dell Usa, L.P. System and method for accessing peripheral devices on a non-functional controller
JPH08137764A (ja) 1994-11-10 1996-05-31 Fujitsu Ltd 記憶装置のソフトエラー回復方法と固定障害検出方法
US5889933A (en) 1997-01-30 1999-03-30 Aiwa Co., Ltd. Adaptive power failure recovery
DE69827949T2 (de) 1997-07-28 2005-10-27 Intergraph Hardware Technologies Co., Las Vegas Gerät und verfahren um speicherfehler zu erkennen und zu berichten
US6269409B1 (en) * 1997-09-02 2001-07-31 Lsi Logic Corporation Method and apparatus for concurrent execution of operating systems
US6061788A (en) 1997-10-02 2000-05-09 Siemens Information And Communication Networks, Inc. System and method for intelligent and reliable booting
US6658486B2 (en) * 1998-02-25 2003-12-02 Hewlett-Packard Development Company, L.P. System and method for efficiently blocking event signals associated with an operating system
US6317848B1 (en) 1998-09-24 2001-11-13 Xerox Corporation System for tracking and automatically communicating printer failures and usage profile aspects
US6594774B1 (en) * 1999-09-07 2003-07-15 Microsoft Corporation Method and apparatus for monitoring computer system objects to improve system reliability
US6601188B1 (en) * 1999-10-28 2003-07-29 International Business Machines Corporation Method and apparatus for external crash analysis in a multitasking operating system
US6636991B1 (en) * 1999-12-23 2003-10-21 Intel Corporation Flexible method for satisfying complex system error handling requirements via error promotion/demotion
US6792564B2 (en) * 2001-03-01 2004-09-14 International Business Machines Corporation Standardized format for reporting error events occurring within logically partitioned multiprocessing systems

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005228323A (ja) * 2004-02-12 2005-08-25 Internatl Business Mach Corp <Ibm> テクノロジの利用に関する追跡ならびに請求書作成の方法およびシステム
JP2008005481A (ja) * 2006-06-20 2008-01-10 Lenovo Singapore Pte Ltd ネットワークアドレスを維持する方法、装置、およびプログラム
JP4523619B2 (ja) * 2006-06-20 2010-08-11 レノボ・シンガポール・プライベート・リミテッド ネットワークアドレスを維持する方法、装置、およびプログラム
US8327008B2 (en) 2006-06-20 2012-12-04 Lenovo (Singapore) Pte. Ltd. Methods and apparatus for maintaining network addresses
JP2013534665A (ja) * 2010-06-23 2013-09-05 インターナショナル・ビジネス・マシーンズ・コーポレーション コンピューティング環境のイベントを管理する方法、これを実行するためのコンピュータ・プログラム、およびコンピュータ・システム

Also Published As

Publication number Publication date
US6920587B2 (en) 2005-07-19
JP3910554B2 (ja) 2007-04-25
TW200400468A (en) 2004-01-01
TWI241525B (en) 2005-10-11
US20030204780A1 (en) 2003-10-30

Similar Documents

Publication Publication Date Title
JP2003323306A (ja) 論理パーティション・データ処理システムでのエラーまたはイベントを処理する方法、コンピュータ・プログラム、データ処理システム
JP3954088B2 (ja) 論理分割された(lpar)計算機でシステム・ファームウェア更新を安全に実行する機構
US6901537B2 (en) Method and apparatus for preventing the propagation of input/output errors in a logical partitioned data processing system
KR100530710B1 (ko) 이종 분할 시스템에서의 글로벌 에러 보고 방법 및 장치
JP5579354B2 (ja) 関連アプリケーションに対するトラック・データ・クロスリファレンスを保存する方法及び装置
US6865688B2 (en) Logical partition management apparatus and method for handling system reset interrupts
US7480911B2 (en) Method and apparatus for dynamically allocating and deallocating processors in a logical partitioned data processing system
US7107495B2 (en) Method, system, and product for improving isolation of input/output errors in logically partitioned data processing systems
US20070260910A1 (en) Method and apparatus for propagating physical device link status to virtual devices
US6883116B2 (en) Method and apparatus for verifying hardware implementation of a processor architecture in a logically partitioned data processing system
US7120823B2 (en) Method and apparatus for recovering logical partition configuration data
US7877643B2 (en) Method, system, and product for providing extended error handling capability in host bridges
JP2005209198A (ja) 論理区画化データ処理システムでの電力消費を削減する方法および装置
US7117385B2 (en) Method and apparatus for recovery of partitions in a logical partitioned data processing system
US6976191B2 (en) Method and apparatus for analyzing hardware errors in a logical partitioned data processing system
US20050268065A1 (en) Free resource error/event lot for autonomic data processing system
US7260752B2 (en) Method and apparatus for responding to critical abstracted platform events in a data processing system
US6934888B2 (en) Method and apparatus for enhancing input/output error analysis in hardware sub-systems
US7302690B2 (en) Method and apparatus for transparently sharing an exception vector between firmware and an operating system
US7275185B2 (en) Method and apparatus for device error log persistence in a logical partitioned data processing system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051013

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060307

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060607

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060612

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070124

R150 Certificate of patent or registration of utility model

Ref document number: 3910554

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110202

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120202

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130202

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130202

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140202

Year of fee payment: 7

EXPY Cancellation because of completion of term