JP5579354B2 - 関連アプリケーションに対するトラック・データ・クロスリファレンスを保存する方法及び装置 - Google Patents

関連アプリケーションに対するトラック・データ・クロスリファレンスを保存する方法及び装置 Download PDF

Info

Publication number
JP5579354B2
JP5579354B2 JP2005155947A JP2005155947A JP5579354B2 JP 5579354 B2 JP5579354 B2 JP 5579354B2 JP 2005155947 A JP2005155947 A JP 2005155947A JP 2005155947 A JP2005155947 A JP 2005155947A JP 5579354 B2 JP5579354 B2 JP 5579354B2
Authority
JP
Japan
Prior art keywords
partition
data
trace
partitions
processing system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005155947A
Other languages
English (en)
Other versions
JP2005339561A5 (ja
JP2005339561A (ja
Inventor
アロングコーン
アシュウィニ・クルカーニ
ゴードン・ディー・マッキントッシュ
ゲイリー・リー・ルゼック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2005339561A publication Critical patent/JP2005339561A/ja
Publication of JP2005339561A5 publication Critical patent/JP2005339561A5/ja
Application granted granted Critical
Publication of JP5579354B2 publication Critical patent/JP5579354B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0775Content or structure details of the error report, e.g. specific table structure, specific error fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems

Description

本発明は、一般的には、データ処理システムの改良に関し、特に、データを処理するための方法及び装置に関するものである。更に詳しく言えば、本発明は、論理パーティション・データ処理システムにおいてトレース・データを管理するための方法、装置、及びコンピュータ命令に関するものである。
インターナショナル・ビジネス・マシーンズ・コーポレーションから入手可能な IBM eServer P690、ヒューレット・パッカード・カンパニーから入手可能な DHP9000 SuperdomeEnterprise Server、及びサン・マイクロシステムズ・インコーポレーテッドから入手可能な Sunfire 15K サーバのような益々大型化した対称マルチプロセッサ・データ処理システムは単一の大型データ処理システムとして使用されてはいない。その代わり、これらのタイプのデータ処理システムはパーティション化され、小型システムとして使用されている。これらのシステムは、論理パーティション(LPAR)・データ処理システムと呼ばれることもある。データ処理システム内の論理的にパーティション化された機能性は、単一のオペレーティング・システムの複数コピー又は複数の異種オペレーティング・システムが単一のデータ処理システム・プラットフォーム上で同時に稼動することを可能にしている。1つのオペレーティング・システムのイメージが内部で稼動するパーティションは、プラットフォーム・リソースが重畳しないサブセットを割り当てられる。これらのプラットフォームの割り振り可能なリソースは、割り込み管理エリア、システム・メモリの領域、入出力(I/O)アダプタ・バス・スロットを有する1つ又は複数の体系的に別個のプロセッサを有する。そのパーティションのリソースは、オペレーティング・システム・イメージに対するプラットフォームのファームウェアによって表される。
1つのプラットフォーム内で稼動する各個別のオペレーティング・システム又は1つのオペレーティング・システムのイメージは、1つの論理パーティションにおけるソフトウェア・エラーが他のいずれのパーティションにおける正しいオペレーションにも影響しないように、相互に保護されている。この保護は、各オペレーティング・システムのイメージによって直接管理されるようにプラットフォーム・リソースの結合解除済みセットを割り振ることによって、及びそのイメージに割り振られていないいずれのリソースも種々のイメージが制御し得ないことを保証するための機構を設けることによって、行われる。更に、オペレーティング・システムの割り振られたリソースを制御するときのソフトウェア・エラーは、他の如何なるイメージのリソースにも影響を与えないようにされる。
従って、オペレーティング・システムの各イメージ又は異なる各オペレーティング・システムは、プラットフォームにおける割り振り可能なリソースの異なるセットを直接に制御する。論理パーティション・データ処理システムにおけるハードウェア・リソースに関して、これらのリソースは種々のパーティション間で相互に無関係状態で共用される。これらのリソースは、例えば、入出力(I/O)アダプタ、メモリDIMM、不揮発性ランダム・アクセス・メモリ(NVRAM)、及びハードディスク・ドライブを含んでもよい。LPARデータ処理システム内の各パーティションは、そのデータ処理システム全体をパワー・サイクルすることを必要とせずに何度もブート及びシャット・ダウンすることが可能である。
論理パーティション・データ処理システムが障害に遭遇するとき、プロセス及びシステム状態に関連するデータは、その障害の識別及び分析を援助する必要がある。現在の論理パーティション・データ処理システムでは、そのシステムの現設計ために、障害を診断するに必要なデータのうちのあるものが利用し得ない。プラットフォーム・ファームウェアは、例えば、そのファームウェアにおけるコード・パスのトレースを可能にするためのトレース機構を含む。論理パーティション・データ処理システムにおいて使用されるプラットフォーム・ファームウェアの例は、インターナショナル・ビジネス・マシーンズ・コーポレーションから入手可能なハイパーバイザである。
現在使用されているトレース機構の場合、各パーティションがプラットフォーム・ファームウェア・コールを行うとき、そのプラットフォーム・ファームウェアにおいて必要なコード・パスを示すトレース情報及び臨界的なデータ値がトレース・バッファに書き込まれる。このトレース情報は、パーティションがエラーに遭遇し、そのエラー・パスが臨界的なデータ値と共にトレースされるとき、特に重要なものである。
現在、すべての論理パーティション・モードのデータ処理システム・プラットフォームがハイパーバイザ・トレース機構をサポートしている。そのハイパーバイザ・トレース機構は、ハイパーバイザ実行時にハイパーバイザ・スペースに設けられたトレース・バッファにハイパーバイザ・コード実行トレース・ポイント・データを書き込むために使用される。このハイパーバイザ・トレース・データは、システム障害の場合にそのフィールドにおける効果的な障害分析にとって不可欠なものである。
この状況は、プロセッサが複数のパーティションに専用のものであり、これらのパーティションが同じバッファに書き込みを行うという構成の場合に問題を生じる。これらのバッファは、一般に、環状態様に編成される。従って、パーティション・クラッシュが生じる場合、トレース・データが、論理パーティション・データ処理システムにおける他のパーティションによって素早く上書きされることがある。その結果、その問題の診断を援助するために必要な重要データが失われることがある。
1つの解決方法は、より大きなバッファを作成することである。更に、パーティションの数が増加するにつれて、このトレース・バッファのサイズは、更なるデータを収容するように大きくなる必要がある。各論理パーティション・データ処理システムが個々に構成され、動的な構成が可能にされるので、バッファ構造は、意図的に最大の構成を事前割振りされなければならない。その結果、不用なメモリ・スペースがより小さい構成として存在することになる。更に、システム・メモリが高額であるシステムでは、その不用なメモリ・スペースがその論理パーティション・データ処理システムのコストを増大させている。
したがって、トレース・データを保存するための改良された方法、装置、及びコンピュータ命令を持つことは有利なことであろう。
本発明の目的は、論理パーティション・データ処理システムにおいてトレース・データを処理するための方法、装置、及びコンピュータ命令を提供することにある。
例外を生じさせるパーティションがその例外の検出に応答して識別される。そのパーティションは、論理パーティション・データ処理システムにおける一組のパーティション内の1つである。識別されたパーティションに対するトレース・データが、マシンチェック割込みハンドラに対するエラー・ログ又は他のデータ構造体に記憶される。
図面、特に、図1を参照すると、本発明を実施し得るデータ処理システム100のブロック図が示される。データ処理システム100は、システム・バス106に接続された複数のプロセッサ101、102、103、及び104を含む対称マルチプロセッサ(SMP)システムであってもよい。例えば、データ処理システム100は、米国ニューヨーク州アーモンクにあるインターナショナル・ビジネス・マシーンズ・コーポレーションの製品であって、ネットワークにおけるサーバとして具現化された IBM eServer であってもよい。それとは別に、単一のプロセッサ・システムが使用されてもよい。更に、システム・バス106には、メモリ・コントローラ/キャッシュ108が接続される。メモリ・コントローラ/キャッシュ108は、複数のローカル・メモリ160〜163に対するインターフェースを提供する。システム・バス106には、I/Oバス・ブリッジ110が接続され、それはI/Oバス112に対するインターフェースを提供する。メモリ・コントローラ/キャッシュ108及びI/Oバス・ブリッジ110は、図示のように、一体化されてもよい。
データ処理システム100は、論理パーティション(LPAR)データ処理システムである。従って、データ処理システム100は、同時に実行される複数の異種オペレーティング・システム(または、単一オペレーティング・システムの複数インスタンス)を有してもよい。これらの複数のオペレーティング・システムの各々は、それの内部で実行される任意の数のソフトウェア・プログラムを有することが可能である。データ処理システム100は、種々のPCI I/Oアダプタ120〜121、128〜129、136、グラフィックス・アダプタ148、及びハード・ディスク・アダプタ149が種々の論理パーティションに割り当てられるよう、論理的にパーティション化される。この場合、グラフィックス・アダプタ148はディスプレイ装置(図示されてない)に対する接続を提供し、一方、ハード・ディスク・アダプタ149はハード・ディスク150に対する接続を提供する。
従って、例えば、データ処理システム100が3つの論理パーティションP1、P2、及びP3に分割されるものと仮定する。PCI I/Oアダプタ120〜121、128〜129、136、グラフィックス・アダプタ148、及びハード・ディスク・アダプタ149の各々、ホスト・プロセッサ101〜104の各々、及びローカル・メモリ160〜163のメモリがそれら3つの論理パーティションの各々に割り当てられる。これらの例では、ローカル・メモリ160〜163は、デュアル・インライン・メモリ・モジュール(DIMM)の形式を取るものでもよい。DIMMは、いつもDIMM毎にパーティションに割り当てられるとは限らない。その代わり、プラットフォームから見たメモリ全体の一部分を、1つのパーティションが得るであろう。例えば、プロセッサ101と、ローカル・メモリ160〜163からのメモリのある部分と、PCI I/Oアダプタ120、128、及び129が論理パーティションP1に割り当てられ、プロセッサ102〜103と、ローカル・メモリ160〜163からのメモリのある部分と、PCI I/Oアダプタ121及び136が論理パーティションP2に割り当てられ、そしてプロセッサ104と、ローカル・メモリ160〜163からのメモリのある部分と、グラフィックス・アダプタ148と、ハード・ディスク・アダプタ149が論理パーティションP3に割り当てられてもよい。
データ処理システム100において実行される各オペレーティング・システムは異なる論理パーティションに割り当てられる。従って、データ処理システム100において実行される各オペレーティング・システムは、それの各論理パーティション内にあるI/O装置だけをアクセスすることが可能である。従って、例えば、拡張対話式エグゼクティブ(AIX)オペレーティング・システムの1つのインスタンスが論理パーティションP1内で実行中であり、AIXオペレーティング・システムの第2インスタンス(イメージ)が論理パーティションP2内で実行中であり、そして Linux または OS/400 オペレーティング・システムが論理パーティションP3内で実行中であってもよい。
I/Oバス112に接続されたペリフェラル・コンポーネント・インターコネクト(PCI)ホスト・ブリッジ114がPCIローカル・バス115に対するインターフェースを提供する。多数のPCI入出力アダプタ120〜121がPCI-TO-PCIブリッジ116、PCIバス118、PCIバス119、I/Oスロット170、及びI/Oスロット171を介してPCIバス115に接続される。PCI-TO-PCIブリッジ116は、PCIバス118及びPCIバス119に対するインターフェースを提供する。PCI I/Oアダプタ120及び121が、それぞれ、I/Oスロット170及び171に設けられる。代表的なPCIを具現化したものは、4個及び8個のI/Oアダプタ(即ち、アド・イン・コネクタのための拡張スロット)の間をサポートするであろう。各PCI I/Oアダプタ120〜121は、データ処理システム100と、例えば、データ処理システム100にとってはクライアントである他のネットワーク・コンピュータのような入出力装置との間のインターフェースを提供する。
更なるPCIホスト・ブリッジ122が更なるPCIバス123に対するインターフェースを提供する。PCIバス123は、複数のPCI I/Oアダプタ128〜129に接続される。PCI I/Oアダプタ128〜129は、PCI-TO-PCIブリッジ124、PCIバス126、PCIバス127、I/Oスロット172、及びI/Oスロット173を介してPCIバス123に接続される。PCI-TO-PCIブリッジ124は、PCIバス126及びPCIバス127に対するインターフェースを提供する。PCI I/Oアダプタ128及び129は、それぞれ、I/Oスロット172及び173に設けられる。このように、例えば、モデムまたはネットワーク・アダプタのような更なるI/O装置がPCI I/Oアダプタ128〜129の各々を介してサポートされてもよい。このように、データ処理システム100は、複数のネットワーク・コンピュータへの接続を可能にする。
I/Oスロット174に挿入されたメモリ・マップ・グラフィックス・アダプタ148がPCIバス144、PCI-TO-PCIブリッジ142、PCIバス141、及びPCIホスト・ブリッジ140を介してI/Oバス112に接続される。ハード・ディスク・アダプタ149がI/Oスロット175に挿入され、I/Oスロット175はPCIバス145に接続される。更に、このバス145は、PCI-TO-PCIブリッジ142に接続され、そのブリッジ142は、PCIバス141によってPCIホスト・ブリッジ140に接続される。
PCIホスト・ブリッジ130が、PCIバス131をI/Oバス112に接続するためのインターフェースを提供する。PCI I/Oアダプタ136がI/Oスロット176に接続される。そのI/Oスロット176はPCIバス133によってPCI-TO-PCIブリッジ132に接続される。PCI-TO-PCIブリッジ132はPCIバス131に接続される。このPCIバス131は、PCIホスト・ブリッジ130をサービス・プロセッサ・メールボックス・インターフェース及びISAバス・アクセス・パススルー・ロジック194、並びにPCI-TO-PCIブリッジ132にも接続する。サービス・プロセッサ・メールボックス・インターフェース及びISAバス・アクセス・パススルー・ロジック194は、PCI/ISAブリッジ193を宛先とするPCIアクセスを搬送する。NVRAMストレージ192がISAバス196に接続される。サービス・プロセッサ135がPCIバス195を介してサービス・プロセッサ・メールボックス・インターフェース及びISAバス・アクセス・パススルー・ロジック194に接続される。サービス・プロセッサ135は、複数のJTAG/ICバス134を介してプロセッサ101〜104にも接続される。JTAG/ICバス134は、JTAG/スキャン・バス(IEEE 1149.1参照)及びPhillipsICバスの結合体である。しかし、JTAG/ICバス134は、その代替として、Phillips ICバスのみ、またはJTAG/スキャン・バスのみによる置換も可能である。ホスト・プロセッサ101、102、103、及び104のSP−ATTN信号が、すべて、サービス・プロセッサの割込み入力信号に結合される。サービス・プロセッサ135は、それ自身のローカル・メモリ191を有し、ハードウェアOPパネル190に対するアクセスも行う。
データ処理システム100が最初に電源投入されるとき、サービス・プロセッサ135が、JTAG/ICバス134を使用してシステム(ホスト)プロセッサ101〜104、メモリ・コントローラ/キャッシュ108、及びI/Oブリッジ110に問い合わせを行う。このステップの終了時に、サービス・プロセッサ135が、データ処理システム100に関するインベントリ及びトポロジを理解する。サービス・プロセッサ135は、更に、ホスト・プロセッサ101〜104、メモリ・コントローラ/キャッシュ108、及びI/Oブリッジ110に問い合わせを行うことによってわかったすべての素子に関して、組込み自己診断テスト(BIST)、基本保証テスト(BAT)、およびメモリ・テストを実行する。BIST、BAT、及びメモリ・テスト中に検出された障害に関するすべてのエラー情報がサービス・プロセッサ135によって収集され、報告される。
BIST、BAT、及びメモリ・テスト中に障害があることがわかった素子を取り除いた後、依然として、システムリソースの有意義な/有効な構成が可能である場合、データ処理システム100は、実行可能なコードをローカル(ホスト)メモリ160〜163にロードするように進行することを可能にされる。そこで、サービス・プロセッサ135が、ローカル・メモリ160〜163にロードされたコードを実行するためにホスト・プロセッサ101〜104を解放する。ホスト・プロセッサ101〜104はデータ処理システム100におけるそれぞれのオペレーティング・システムからのコードを実行するが、サービス・プロセッサ135はエラーを監視及び報告するモードに入る。サービス・プロセッサ135によって監視される項目のタイプは、例えば、冷却ファンの速度及び動作、温度センサ、電源調整器を含み、更に、プロセッサ101〜104、ローカル・メモリ160〜163、及びI/Oブリッジ110によって報告された回復可能エラー及び回復不能エラーを含む。
サービス・プロセッサ135は、データ処理システム100におけるすべての監視された項目に関するエラー情報を保存及び報告する責任を負っている。更に、サービス・プロセッサ135は、エラーのタイプ及び定義された閾値に基づいてアクションを取る。例えば、サービス・プロセッサ135は、プロセッサのキャッシュ・メモリに関する過度の回復可能なエラーを注目し、これが難しい障害を予測するものであることを決定することがある。この決定に基づいて、サービス・プロセッサ135は、現在稼動しているセッション時及び将来の初期プログラム・ロード(IPL)時に構成解除するようにそのリソースにマークを付することも可能である。なお、IPLは、時には「ブート」または「ブートストラップ」と呼ばれることもある。
データ処理システム100は、種々の商業的に入手可能なコンピュータ・システムを使用して具現化することが可能である。例えば、データ処理システム100は、インターナショナル・ビジネス・マシーンズ・コーポレーションから入手可能な IBM eServer iSeries Model 840 システムを使用して具現化することができる。そのようなシステムは、OS/400オペレーティング・システムを使用して論理パーティションをサポートすることが可能である。なお、OS/400 オペレーティング・システムも、インターナショナル・ビジネス・マシーンズ・コーポレーションから入手可能である。
図1に示されたハードウェアが変更可能なものであることは当業者には明らかであろう。例えば、光ディスク・ドライブ等のような他の周辺装置が、図示のハードウェアに加えて、またはそのハードウェアに代わって、使用されてもよい。図示の例は、本発明に関してアーキテクチャ上の限定を暗に示すことを意図するものではない。
図2を参照すると、本発明を実装することが可能である例示的な論理パーティション・プラットフォームのブロック図が示される。論理パーティション・プラットフォーム200におけるハードウェアは、例えば、図1におけるデータ処理システム100として実装することが可能である。論理パーティション・プラットフォーム200は、パーティション・ハードウェア230、オペレーティング・システム202、204、206、208、及びパーティション管理ファームウェア(プラットフォーム・ファームウェア)210を含む。オペレーティング・システム202、204、206、及び208は、論理パーティション・プラットフォーム200において同時に稼動する単一のオペレーティング・システムの複数コピー、または複数の異種のオペレーティング・システムであってもよい。これらのオペレーティング・システムは、ハイパーバイザのようなパーティション管理ファームウェアとインターフェースするように設計された OS/400 を使用して具現化することが可能である。OS/400 は、これらの実施例では単に1つの例として使用される。もちろん、特定の具現化方法次第で、AIX及び Linux のような他のタイプのオペレーティング・システムを使用することも可能である。オペレーティング・システム202、204、206、及び208がパーティション203、205、207、及び209に設けられる。ハイパーバイザ・ソフトウェアは、パーティション管理ファームウェア210を具現化するために使用可能なソフトウェアの一例であり、それは、インターナショナル・ビジネス・マシーンズ・コーポレーションから入手可能である。ファームウェアは、例えば、リード・オンリ・メモリ(ROM)、プログラマブルROM(PROM)、消去可能プログラマブルROM(EPROM)、電気的消去可能プログラマブルROM(EEPROM)、及び不揮発性ランダム・アクセス・メモリ(不揮発性RAM)のような、電力がなくても内容を保持するメモリ・チップに記憶された「ソフトウェア」である。
更に、これらのパーティションは、パーティション・ファームウェア211、213、215、及び217を含む。パーティション・ファームウェア211、213、215、及び217は、初期ブート・ストラップ・コード、IEEE−1275スタンダード・オープン・ファームウェア、及びランタイム・アブストラクション・ソフトウェア(RTAS)を使用して具現化可能である。なお、RTASは、インターナショナル・ビジネス・マシーンズ・コーポレーションから入手可能である。パーティション203、205、207、及び209がインスタンス化されるとき、ブート・ストラップ・コードのコピーがプラットフォーム・ファームウェア210によってパーティション203、205、207、及び209にロードされる。しかる後、ブート・ストラップ・コードがその後オープン・ファームウェア及びRTASをロードすることによって、そのブート・ストラップ・コードに制御が移される。次に、それらのパーティションに関連した又は割り当てられたプロセッサが、パーティション・ファームウェアを実行するためにそれらのパーティションのメモリにディスパッチされる。
パーティション・ハードウェア230は、複数のプロセッサ232〜238、複数のシステム・メモリ・ユニット240〜246、複数の入出力(I/O)アダプタ248〜262、及びストレージ・ユニット270を含む。プロセッサ232〜238、メモリ・ユニット240〜246、NVRAM298、及びI/Oアダプタ248〜262の各々は論理パーティション・プラットフォーム200における複数のパーティションの1つに割り当て可能である。なお、それらのパーティションの各々は、オペレーティング・システム202、204、206、及び208の1つに対応する。
パーティション管理ファームウェア210は、論理パーティション・プラットフォーム200のパーティション化をもたらし且つ強化するために、パーティション203、205、207、及び209に対する多数の機能及びサービスを遂行する。パーティション管理ファームウェア210は、基本的なハードウェアと同様のファームウェア実装の仮想マシンである。従って、パーティション管理ファームウェア210は、論理パーティション・プラットフォーム200のすべてのハードウェア・リソースを仮想化することによって、独立したオペレーティング・システム202、204、206、及び208の同時実行を可能にする。
パーティションにおけるプラットフォーム・エラーの処理のような種々のサービスを提供するためにサービス・プロセッサ290を使用することが可能である。これらのサービスは、インターナショナル・ビジネス・マシーンズ・コーポレーションのような製造業者にエラーを報告するためのサービス・エージェントとして作用することも可能である。種々なパーティションの操作がハードウェア管理コンソール280を介して制御可能である。ハードウェア管理コンソール280は、種々のパーティションに対するリソースの再割り振りを含む種々の機能をシステム管理者が遂行することを可能にする別のデータ処理システムである。
次に、図3を参照すると、トレース・データを処理するために使用される現在入手可能な論理パーティション・データ処理システムにおけるコンポーネントを表す図が示される。この実施例では、パーティション300がオペレーティング・システム302及びRTAS304を含む。パーティション306が、オペレーティング・システム308及びRTAS310を含む。これらの図示された例では、255個までのパーティションが存在可能である。これらのパーティションは、すべて、ハイパーバイザ312のようなプラットフォーム・ファームウェアを通して管理される。
パーティション300がハイパーバイザ312に対してコールを行うとき、ハイパーバイザ・コード・パス318が生成される。これらのコールから生成されたトレース・データがハイパーバイザ・トレース・バッファ316に記憶される。このトレース・データは、図4におけるハイパーバイザ・トレース・バッファ418におけるエントリに記憶される。トレース・データは、これらの実施例では、得られたコード・パスを示すトレース情報及び重要なデータ値を含む。トレース情報のほかに、各エントリは、そのトレース・データを生じさせたコールを行ったパーティションを識別するためのパーティション識別子を含む。パーティション・マネージャ314は、コード・パスが生じたとき、ハイパーバイザ・トレース・バッファ316にトレース情報を書き込む。このトレース情報は、このパーティション・マネージャ314がハイパーバイザ312に対してコールを行うときに書き込まれる。パーティション・マネージャ314はハイパーバイザ312における1つのコンポーネントである。このコンポーネントはパーティションを管理するために使用され、パーティションを開始及び終了させるというような機能を含む。パーティション・マネージャ314によって行われたコールがハイパーバイザ・トレース・バッファ316に記憶される。
同様に、ハイパーバイザ312に対するコールがパーティション306によって行われるとき、ハイパーバイザ・コード・パス320が形成され、これらのコールに対するトレース・データがハイパーバイザ・トレース・バッファ316に記憶される。同様に、ハイパーバイザ・コード・パス320は、ハイパーバイザ312がパーティション306によるコールを受けるときに形成される。このパスに対するトレース・データもハイパーバイザ・トレース・バッファ316に記憶される。
各パーティションが活性化されるとき、オペレーティング・システムがロードされ、実行を開始する。オペレーティング・システム302のようなオペレーティング・システムがプラットフォーム・リソースを必要とするとき、そのオペレーティング・システムはRTAS304に対してRTASコールを行う。一方、RTAS304は、ハイパーバイザ312に対してハイパーバイザ・コールを行う。ハイパーバイザ・コールが実行されるとき、パーティション・データを分離することなく、トレース・データがハイパーバイザ・トレース・バッファ316に書き込まれるという特別の「トレース・ポイント」が実行される。換言すると、すべてのパーティションによるすべてのコールに対するすべてのトレース・データがこのバッファに書き込まれる。
パーティションを代表してハイパーバイザ・コールを実行するハイパーバイザ・データが単一のバッファに書き込まれるのみならず、ハイパーバイザ機構であるパーティション・マネージャ314もそれのトレース・データを同じトレース・バッファに書き込む。更に、マシンチェック割り込みハンドラ322が同じトレース機構を使用し、ハイパーバイザ・トレース・バッファ316に情報を記憶する。
しかし、この現在のシステムは、すべての情報をハイパーバイザ・トレース・バッファ316に記憶する。その結果、これらのタイプのバッファにおける制限されたスペースのために、現在のシステムでは、データが上書きされることがある。問題は、すべてのプロセッサが複数のパーティションに専用であるとき、同様に編成された同じバッファに書き込む構成が大きくなることである。パーティション・クラッシュが生じる場合、その問題の診断を助けることがあり得る重要なデータの喪失を他のパーティションが生じさせることによって、ハイパーバイザ・コード・パス318におけるトレース・データが直ちに上書きされる。
次に、図4を参照すると、セキュリティ上の弱点を排除するようにトレース・データを管理するための構成を表す図が本発明の好適な実施例に従って示される。この実施例では、パーティション400及びパーティション402が存在し、ハイパーバイザ404を通して管理される。パーティション400はオペレーティング・システム406及びRTAS408を含み、一方、パーティション402はオペレーティング・システム410及びRTAS412を含む。パーティション400又はパーティション402がハイパーバイザ404にコールを発生するとき、トレース・データがハイパーバイザ・トレース・バッファ418に記憶されることによって、ハイパーバイザ・コード・パス414及びハイパーバイザ・コード・パス416が生成される。
更に、パーティション・マネージャ420は、トレース・データをハイパーバイザ・トレース・バッファ418に記憶するコールを生成することが可能である。マシンチェック割り込みハンドラ422もハイパーバイザ・トレース・バッファ418にデータを記憶する。
ハイパーバイザ・トレース・バッファ422はエラー・バッファ426を含む。このバッファには、エラー・ログ428がある。このエラー・ログは、選択された又は特定の分析プログラムが使用し得るフォーマットを持ったエラー特有の部分を含む。なお、このログは、図示の実施例ではトレース・データを記憶するために使用し得るユーザ・エリアも含む。
図示の実施例では、マシンチェック例外が生じるときには、いつも、ハイパーバイザ・トレース・バッファ418におけるトレース・データがエラー・バッファ426におけるエラー・ログ428にコピーされる。そのコピー動作は、これらの実施例では、マシンチェック割込みハンドラ422によって遂行される。例外は、プログラムにおける正規の制御フローを変更する1つのエラー条件である。例外は、ハードウェア又はソフトウェアによって生成又は引き起こされることがある。ハードウェア例外は、例えば、リセット、割込み、又はメモリ管理ユニットからの信号を含む。例外は、ゼロによる除算、オーバフロー、又はアンダーフローのような数値エラーに対する演算論理ユニット又は浮動小数点ユニットによって、或いは、特権命令、予約命令、トラップ命令、又は未定義の命令のようなエラーをデコードする命令によって発生されることがある。
パーティション・クラッシュの大多数がマシンチェック例外を発生する。本発明の機構は、トレース・データの喪失を回避する方法でそのトレース・データを獲得及び記憶するためにこのタイプの事象を使用する。更に詳しく言えば、エラー・ログ428のユーザ部分はこれらの実施例では使用されない。この部分は、トレース・データを記憶するために使用される。エラー・ログの如何なる未使用部分も、又はエラー・バッファ426における他の未使用スペースも、ハイパーバイザ・トレース・バッファ418からのトレース・データを記憶するために使用可能である。マシンチェック例外が生じるたびに、マシンチェック割込みハンドラ422がトレース・バッファ・データをエラー・ログ428の未使用部分に書き込む。この特徴は、エラー・ログがすべての稼動パーティションに送られるとき、それらのデータをデバッグのために容易に利用し得るようにすることを可能にする。
この追加の特徴を含むためには、マシンチェック割込みハンドラ422に対するわずかな簡単なコーディングの変更しか必要ない。例外によって開始されるマシンチェックの間、マシンチェックを生じさせる最後のパーティション・データをハイパーバイザ・トレース・バッファ418からエラー・ログ428にコピーするために、トレース・データに対する現在のポインタが使用される。そのトレース・データは、例外が生じたパーティションからのトレース・データだけがエラー・ログ428にコピーされるように、フィルタされる。このフィルタリングは、これらの実施例ではハイパーバイザ404内のパーティション・データ・フィルタ424において実施される。パーティション・データ・フィルタ424は、ハイパーバイザ・トレース・バッファ418における最後のトレース・エントリにおいて見つかったパーティション識別子を調べることによって、例外が生じたパーティションを識別する。この識別子(ID)は、マシンチェック割込みハンドラ422によって要求されたトレース・データを弁別するために使用される。もちろん、このフィルタは、マシンチェック割込みハンドラ422内のような他の場所でも実装することが可能である。
パーティションが終了した場合、マシンチェック割込みハンドラ422が呼び出されるとき、パーティション・データは、依然として、ハイパーバイザ・トレース・バッファ418に存在するであろう。マシンチェック割込みハンドラ422は、デバッグを目的としてトレース・データを保存するために、トレース・データをエラー・ログ428にコピーする。エラー・ログ428における使用可能なスペースの量次第で、すべてのトレース・データがハイパーバイザ・トレース・バッファ418からエラー・ログ428にコピー可能であるわけではない。マシンチェック割込みハンドラ422は、すべてのトレース・データがコピーされてしまうまで、又はエラー・ログ428における使用可能なそれ以上のスペースがなくなるまで、データをエラー・ログ428にコピーする。
マシンチェック割込みハンドラ422がパーティション・トレース・データをエラー・ログ428にコピーした後、このログはNVRAM430のような不揮発性ストレージに書き込まれる。このログは、特殊エラー収集ルーチンによってコピーされる。そこで、このルーチンは、分析のためにこのログをすべてのアクティブなパーティションにコピーする。これらの実施例では、そのルーチンは、マシンチェック割込みハンドラの一部である。
次に、図5を参照すると、本発明の好適な実施例に従ってトレース・データを弁別するためのプロセスのフローチャートが示される。図5に示されたプロセスは、図4におけるパーティション・データ・フィルタ424のようなフィルタ・プロセスにおいて実施することが可能である。このプロセスは、図4におけるハイパーバイザ・トレース・バッファ418のようなトレース・バッファからのデータに対するリクエストが受領されるときに開始される。これらの実施例では、マシンチェック割込みハンドラからのリクエストが受領される。
プロセスは、トレース・データに対するリクエストを受けることによって開始する(ステップ500)。次に、最後のトレース・データ・エントリにおけるパーティション識別子(PID)が識別される(ステップ502)。しかる後、そのトレース・データ・エントリが選択される(ステップ504)。選択されたエントリは、要求者に送られなかったエントリである。これらの実施例におけるエントリは、最も新しいものから最も古いものへと選択される。換言すると、最も新しいエントリが転送のために最初に選択される。
次に、選択されたトレース・データ・エントリに対するデータが検索される(ステップ506)。次に、データが、識別されたPIDに対するものであるかどうかに関する決定が行われる(ステップ508)。データがその識別されたPIDに対するものである場合、データはマシンチェック割込みハンドラに戻される(ステップ510)。次に、トレース・データに対する更なるリクエストが存在するかどうかに関する決定が行われる(ステップ512)。トレース・データに対する更なるリクエストが存在しない場合、プロセスは終了する。
ステップ508を再び参照すると、識別されたPIDに対するデータが使用可能でない場合、次のトレース・データ・エントリが選択されてそのプロセスを処理し(ステップ514)、しかる後、上述のステップ506に戻る。ステップ512において、トレース・データに対する更なるリクエストが行われる場合、プロセスは、上述のステップ514に戻る。
次に図6を参照すると、本発明の好適な実施例に従って、トレース・データをエラー・ログに保存するためのプロセスのフローチャートが示される。図6に示されたプロセスは、図4におけるマシンチェック割込みハンドラ422のようなマシンチェック割込みハンドラにおいて具現化することが可能である。このプロセスは、マシンチェック割込みハンドラが処理すべき例外が存在するときに開始される。
プロセスは、プラットフォーム・ファームウェア・トレース・データに対するポインタを識別することによって開始する(ステップ600)。このポインタは、トレース・データ・バッファにおける現在のレコードを指す。次に、トレース・データ・バッファにおけるレコードに対するトレース・データがそのトレース・データ・バッファからリクエストされる(ステップ602)。このポインタは、検査のためにトレース・バッファにおける種々のレコードをリクエストするようデクリメントすることが可能である。そのリクエストに応答して、トレース・データが受領されたかどうかに関する決定が行われる(ステップ604)。これらの例では、そのリクエストに応答して、トレース・データが戻されるか又はそれ以上のデータが存在しないという表示が戻される。そこで、トレース・データが受領された場合、このトレース・データがエラー・ログにコピーされる(ステップ606)。次に、エラー・ログにおいて使用可能な更なる空きがあるかどうかに関する決定が行われる(ステップ608)。エラー・ログにおいて使用可能な更なる空きがない場合、プロセスは終了する。
ステップ608を再び参照すると、エラー・ログにおいて使用可能な更なる空きがある場合、プロセスは、前述のステップ602に戻る。ステップ604を再び参照すると、トレース・データが受領されない場合、プロセスは終了する。
従って、本発明は、トレース・データを処理するための改良された方法、装置、及びコンピュータ命令を提供する。本発明の機構は、トレース・データを記憶するための存在するエラー・ログ・スペースを使用することによって、トレース・データを保存する。これらの例では、エラー・ログは、マシンチェック割込みハンドラによる使用に関連したもの又はその使用のために作成されたものである。マシンチェック割込みハンドラによって処理されるべき例外が生じるたびに、データが検索される。この機構は、パーティションからのデータのうち例外を生じさせるデータだけが戻されるように、検索されたデータを弁別する。
十分に機能するデータ処理システムに関連して本発明を説明したけれども、本発明のプロセスがコンピュータ可読媒体という形式で及び種々の形式で命令を配布することができること、及び、その配布を行うために実際に使用される信号保持媒体の特定のタイプに関係なく、本発明が等しく適用し得ることは当業者には明らかであろう。コンピュータ可読媒体の例は、フロッピ(商標)・ディスク、ハードディスク・ドライブ、RAM、CD−ROM、DVD−ROMのような記録可能タイプの媒体、及び、例えば、無線周波伝送及び光波伝送のような伝送形式を使用するディジタル及びアナログ通信リンク、有線又は無線通信リンクのような伝送タイプの媒体を含む。コンピュータ可読媒体は、特定のデータ処理システムにおける実際の使用のためにデコードされるコード化フォーマットの形式を取ることも可能である。
図解及び説明を目的として本発明を記述した。それは、網羅的であることを意図するものではなく、開示された形式の発明に限定することを意図するものでもない。当業者には、多くの修正及び変更が明らかであろう。例えば、図示の実施例はトレース・データをエラー・ログに記憶している。このデータは、例外を処理するプロセスによってアクセス可能な任意のデータ構造で記憶されることも可能である。実施例は、発明の原理及び実用的な応用を最もよく理解するために、及び、意図する特定の用途に適した種々の修正によって当業者が種々の実施例に関して発明を理解することを可能にするために、選択及び開示したものである。
本発明を実装し得るデータ処理システムのブロック図である。 本発明を実装し得る例示的な論理パーティション・プラットフォームのブロック図である。 トレース・データを処理するために使用される現時点で利用可能な論理パーティション・データ処理システムにおけるコンポーネントを示す図である。 本発明の好適な実施例に従ってセキュリティ上の弱点を排除するためにトレース・データを管理するための構成を示す図である。 本発明の好適な実施例に従ってセキュリティ上の弱点を排除するためにトレース・データを管理する構成を示す図である。 本発明の好適な実施例に従ってトレース・データをエラー・ログに保存するためのプロセスを表すフローチャートを示す図である。

Claims (8)

  1. 複数のプロセッサが複数のパーティションに専用であり当該複数のパーティションが環状態様で同じバッファにデータの書き込みを行う構成をなす論理パーティション・データ処理システムにおいてトレース・データを処理するための方法であって、
    例外の検出に応答して、前記論理パーティション・データ処理システムにおける前記複数のパーティション内の前記例外に関連したパーティションを識別するステップであって、前記複数のパーティションに対する単一の同じトレース・バッファの最新のトレース・データ・エントリにおけるパーティション識別子をパーティション・データ・フィルタによって識別する、前記パーティションを識別するステップと、
    前記識別されたパーティションに対するトレース・データを、当該トレース・データの書き込みが行われた前記トレース・バッファから、マシンチェック割込みハンドラが有するエラー・ログに記憶するステップと、
    を含む方法。
  2. 前記エラー・ログを不揮発性ストレージに記憶するステップを更に含む、請求項1に記載の方法。
  3. 前記不揮発性ストレージが不揮発性ランダム・アクセス・メモリである、請求項2に記載の方法。
  4. 前記識別するステップ及び前記記憶するステップがプラットフォーム・ファームウェアによって遂行される、請求項1に記載の方法。
  5. 前記記憶するステップがマシンチェック割込みハンドラによって遂行される、請求項1に記載の方法。
  6. 前記識別されたパーティションに対するトレース・データだけが前記エラー・ログに記憶される、請求項1に記載の方法。
  7. 複数のプロセッサが複数のパーティションに専用であり当該複数のパーティションが環状態様で同じバッファにデータの書き込みを行う構成をなすトレース・データを処理するための論理パーティション・データ処理システムであって、
    識別されたパーティションを形成するために、例外の検出に応答して、前記論理パーティション・データ処理システムにおける前記複数のパーティション内の前記例外に関連したパーティションを識別するための識別手段であって、前記複数のパーティションに対する単一の同じトレース・バッファの最新のトレース・データ・エントリにおけるパーティション識別子を識別する、パーティション・データ・フィルタによって構成される前記識別手段と、
    前記識別されたパーティションに対するトレース・データを、当該トレース・データの書き込みが行われた前記トレース・バッファから、マシンチェック割込みハンドラが有するエラー・ログに記憶するための記憶手段と、
    を含む、データ処理システム。
  8. 複数のプロセッサが複数のパーティションに専用であり当該複数のパーティションが環状態様で同じバッファにデータの書き込みを行う構成をなす論理パーティション・データ処理システムにおいてトレース・データを処理するためのコンピュータ・プログラムであって、
    コンピュータに、
    識別されたパーティションを形成するために、例外の検出に応答して、前記論理パーティション・データ処理システムにおける前記複数のパーティション内の前記例外に関連したパーティションを識別するための第1命令であって、前記複数のパーティションに対する単一の同じトレース・バッファの最新のトレース・データ・エントリにおけるパーティション識別子をパーティション・データ・フィルタによって識別する、前記第1命令と、
    前記識別されたパーティションに対するトレース・データを、当該トレース・データの書き込みが行われた前記トレース・バッファから、マシンチェック割込みハンドラが有するエラー・ログに記憶するための第2命令と、
    を実行させる、コンピュータ・プログラム。
JP2005155947A 2004-05-28 2005-05-27 関連アプリケーションに対するトラック・データ・クロスリファレンスを保存する方法及び装置 Expired - Fee Related JP5579354B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/857,459 US7343521B2 (en) 2004-05-28 2004-05-28 Method and apparatus to preserve trace data
US10/857,459 2004-05-28

Publications (3)

Publication Number Publication Date
JP2005339561A JP2005339561A (ja) 2005-12-08
JP2005339561A5 JP2005339561A5 (ja) 2008-06-19
JP5579354B2 true JP5579354B2 (ja) 2014-08-27

Family

ID=35461909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005155947A Expired - Fee Related JP5579354B2 (ja) 2004-05-28 2005-05-27 関連アプリケーションに対するトラック・データ・クロスリファレンスを保存する方法及び装置

Country Status (4)

Country Link
US (2) US7343521B2 (ja)
JP (1) JP5579354B2 (ja)
CN (1) CN100356335C (ja)
TW (1) TW200611115A (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2395578A (en) * 2002-11-22 2004-05-26 Ibm Fault tracing in systems with virtualization layers
US7370240B2 (en) * 2004-04-29 2008-05-06 International Business Machines Corporation Method and apparatus for preserving trace data in a logical partitioned data processing system
US7734741B2 (en) * 2004-12-13 2010-06-08 Intel Corporation Method, system, and apparatus for dynamic reconfiguration of resources
US7738484B2 (en) 2004-12-13 2010-06-15 Intel Corporation Method, system, and apparatus for system level initialization
US7555682B2 (en) * 2005-05-13 2009-06-30 Texas Instruments Incorporated Distributed width trace receiver
US20080155246A1 (en) * 2006-12-21 2008-06-26 Unisys Corporation System and method for synchronizing memory management functions of two disparate operating systems
WO2008099453A1 (ja) * 2007-02-09 2008-08-21 Fujitsu Limited 縮退方法および情報処理装置
US7853928B2 (en) * 2007-04-19 2010-12-14 International Business Machines Corporation Creating a physical trace from a virtual trace
US20100029193A1 (en) * 2008-07-31 2010-02-04 International Business Machines Corporation Method for preventing air recirculation and oversupply in data centers
JP5176837B2 (ja) * 2008-09-30 2013-04-03 富士通株式会社 情報処理システム及びその管理方法、制御プログラム並びに記録媒体
US8566798B2 (en) * 2008-10-15 2013-10-22 International Business Machines Corporation Capturing context information in a currently occurring event
US8171257B2 (en) * 2009-09-25 2012-05-01 International Business Machines Corporation Determining an end of valid log in a log of write records using a next pointer and a far ahead pointer
JP5445051B2 (ja) * 2009-11-13 2014-03-19 株式会社リコー 情報処理装置、apiプログラム、及びログ環境提供方法
US8504875B2 (en) * 2009-12-28 2013-08-06 International Business Machines Corporation Debugging module to load error decoding logic from firmware and to execute logic in response to an error
JP5585655B2 (ja) * 2010-08-24 2014-09-10 富士通株式会社 システム制御装置、ログ制御方法および情報処理装置
WO2012026035A1 (ja) * 2010-08-27 2012-03-01 富士通株式会社 障害処理方法,障害処理システム,障害処理装置及び障害処理プログラム
WO2012098434A1 (en) * 2011-01-21 2012-07-26 Freescale Semiconductor, Inc. Method, system, and computer program product
US9916192B2 (en) 2012-01-12 2018-03-13 International Business Machines Corporation Thread based dynamic data collection
US8954546B2 (en) 2013-01-25 2015-02-10 Concurix Corporation Tracing with a workload distributor
US9323863B2 (en) 2013-02-01 2016-04-26 Microsoft Technology Licensing, Llc Highlighting of time series data on force directed graph
US9256969B2 (en) 2013-02-01 2016-02-09 Microsoft Technology Licensing, Llc Transformation function insertion for dynamically displayed tracer data
US8843901B2 (en) 2013-02-12 2014-09-23 Concurix Corporation Cost analysis for selecting trace objectives
US9021447B2 (en) 2013-02-12 2015-04-28 Concurix Corporation Application tracing by distributed objectives
US20130283102A1 (en) * 2013-02-12 2013-10-24 Concurix Corporation Deployment of Profile Models with a Monitoring Agent
US8997063B2 (en) 2013-02-12 2015-03-31 Concurix Corporation Periodicity optimization in an automated tracing system
US20130283281A1 (en) 2013-02-12 2013-10-24 Concurix Corporation Deploying Trace Objectives using Cost Analyses
US8924941B2 (en) 2013-02-12 2014-12-30 Concurix Corporation Optimization analysis using similar frequencies
US9665474B2 (en) 2013-03-15 2017-05-30 Microsoft Technology Licensing, Llc Relationships derived from trace data
US9575874B2 (en) 2013-04-20 2017-02-21 Microsoft Technology Licensing, Llc Error list and bug report analysis for configuring an application tracer
US8990777B2 (en) 2013-05-21 2015-03-24 Concurix Corporation Interactive graph for navigating and monitoring execution of application code
US9734040B2 (en) 2013-05-21 2017-08-15 Microsoft Technology Licensing, Llc Animated highlights in a graph representing an application
US9280841B2 (en) 2013-07-24 2016-03-08 Microsoft Technology Licensing, Llc Event chain visualization of performance data
US9292415B2 (en) 2013-09-04 2016-03-22 Microsoft Technology Licensing, Llc Module specific tracing in a shared module environment
EP3069267A4 (en) 2013-11-13 2017-09-27 Microsoft Technology Licensing, LLC Software component recommendation based on multiple trace runs
WO2015071778A1 (en) 2013-11-13 2015-05-21 Concurix Corporation Application execution path tracing with configurable origin definition
US9329884B2 (en) * 2014-07-11 2016-05-03 Intel Corporation Managing generated trace data for a virtual machine
US9710321B2 (en) 2015-06-23 2017-07-18 Microsoft Technology Licensing, Llc Atypical reboot data collection and analysis
US9965375B2 (en) 2016-06-28 2018-05-08 Intel Corporation Virtualizing precise event based sampling
US10896253B2 (en) * 2017-02-06 2021-01-19 Huawei Technologies Co., Ltd. Processor trace-based enforcement of control flow integrity of a computer system
CN112306908B (zh) * 2020-11-19 2024-03-15 广州安凯微电子股份有限公司 Cpu的icache指令缓存区异常定位方法、系统、终端设备及介质
WO2023287517A1 (en) * 2021-07-13 2023-01-19 SiFive, Inc. Error management in system on a chip with securely partitioned memory space

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4837767A (en) 1987-09-04 1989-06-06 Digital Equipment Corporation Bus adapter module with improved error recovery in a multibus computer system
US5168554A (en) * 1989-10-13 1992-12-01 International Business Machines Corporation Converting trace data from processors executing in parallel into graphical form
JPH03217949A (ja) * 1990-01-23 1991-09-25 Hitachi Ltd 計算機システム
DE69113181T2 (de) * 1990-08-31 1996-05-02 Ibm Verfahren und Gerät zur Querteilungssteuerung in einer verteilten Verarbeitungsumgebung.
JP3318121B2 (ja) * 1994-08-04 2002-08-26 富士通株式会社 仮想計算機システム
US5642478A (en) 1994-12-29 1997-06-24 International Business Machines Corporation Distributed trace data acquisition system
JP3196004B2 (ja) * 1995-03-23 2001-08-06 株式会社日立製作所 障害回復処理方法
US5918047A (en) * 1996-01-26 1999-06-29 Texas Instruments Incorporated Initializing a processing system
US6256705B1 (en) 1998-06-05 2001-07-03 International Business Machines Corporation System and method for organizing data stored in a log structured array
US6493837B1 (en) 1999-07-16 2002-12-10 Microsoft Corporation Using log buffers to trace an event in a computer system
US6636991B1 (en) * 1999-12-23 2003-10-21 Intel Corporation Flexible method for satisfying complex system error handling requirements via error promotion/demotion
US6658591B1 (en) * 2000-06-08 2003-12-02 International Business Machines Corporation Recovery from data fetch errors in hypervisor code
US6915416B2 (en) 2000-12-28 2005-07-05 Texas Instruments Incorporated Apparatus and method for microcontroller debugging
US6813731B2 (en) 2001-02-26 2004-11-02 Emc Corporation Methods and apparatus for accessing trace data
US6834363B2 (en) * 2001-03-22 2004-12-21 International Business Machines Corporation Method for prioritizing bus errors
US6711700B2 (en) * 2001-04-23 2004-03-23 International Business Machines Corporation Method and apparatus to monitor the run state of a multi-partitioned computer system
US6851074B2 (en) * 2001-04-30 2005-02-01 Hewlett-Packard Development Company System and method for recovering from memory failures in computer systems
US6842870B2 (en) * 2001-09-20 2005-01-11 International Business Machines Corporation Method and apparatus for filtering error logs in a logically partitioned data processing system
US6883116B2 (en) * 2001-09-27 2005-04-19 International Business Machines Corporation Method and apparatus for verifying hardware implementation of a processor architecture in a logically partitioned data processing system
US6910160B2 (en) * 2002-01-10 2005-06-21 International Business Machines Corporation System, method, and computer program product for preserving trace data after partition crash in logically partitioned systems
US6681309B2 (en) * 2002-01-25 2004-01-20 Hewlett-Packard Development Company, L.P. Method and apparatus for measuring and optimizing spatial segmentation of electronic storage workloads
US6886064B2 (en) * 2002-03-28 2005-04-26 International Business Machines Corporation Computer system serialization control method involving unlocking global lock of one partition, after completion of machine check analysis regardless of state of other partition locks
US7383428B2 (en) 2003-09-11 2008-06-03 International Business Machines Corporation Method, apparatus and computer program product for implementing atomic data tracing
US7370240B2 (en) * 2004-04-29 2008-05-06 International Business Machines Corporation Method and apparatus for preserving trace data in a logical partitioned data processing system
US7496729B2 (en) * 2004-05-13 2009-02-24 International Business Machines Corporation Method and apparatus to eliminate interpartition covert storage channel and partition analysis

Also Published As

Publication number Publication date
CN1702625A (zh) 2005-11-30
CN100356335C (zh) 2007-12-19
US7343521B2 (en) 2008-03-11
US20050278574A1 (en) 2005-12-15
TW200611115A (en) 2006-04-01
US7930594B2 (en) 2011-04-19
JP2005339561A (ja) 2005-12-08
US20080140985A1 (en) 2008-06-12

Similar Documents

Publication Publication Date Title
JP5579354B2 (ja) 関連アプリケーションに対するトラック・データ・クロスリファレンスを保存する方法及び装置
US7055071B2 (en) Method and apparatus for reporting error logs in a logical environment
KR100530710B1 (ko) 이종 분할 시스템에서의 글로벌 에러 보고 방법 및 장치
JP3910554B2 (ja) 論理パーティション・データ処理システムでのエラーまたはイベントを処理する方法、コンピュータ・プログラム、データ処理システム
US7103808B2 (en) Apparatus for reporting and isolating errors below a host bridge
US7480911B2 (en) Method and apparatus for dynamically allocating and deallocating processors in a logical partitioned data processing system
JP4157710B2 (ja) Pci入出力スロットの論理分割を実施する方法および装置
JP3954088B2 (ja) 論理分割された(lpar)計算機でシステム・ファームウェア更新を安全に実行する機構
US6842870B2 (en) Method and apparatus for filtering error logs in a logically partitioned data processing system
JP5016028B2 (ja) メモリ・マイグレーション中のdma動作を停止させるコンピュータ実装方法、装置、及びコンピュータ・プログラム
JP4366336B2 (ja) 論理パーティション・データ処理システムにおいてトレース・データを管理するための方法、トレース・データを管理するための論理パーティション・データ処理システム、コンピュータにトレース・データを管理させるためのコンピュータ・プログラム、論理パーティション・データ処理システム
US7877643B2 (en) Method, system, and product for providing extended error handling capability in host bridges
US6976191B2 (en) Method and apparatus for analyzing hardware errors in a logical partitioned data processing system
US8024544B2 (en) Free resource error/event log for autonomic data processing system
US6934888B2 (en) Method and apparatus for enhancing input/output error analysis in hardware sub-systems
US7260752B2 (en) Method and apparatus for responding to critical abstracted platform events in a data processing system
US8010838B2 (en) Hardware recovery responsive to concurrent maintenance
US7370240B2 (en) Method and apparatus for preserving trace data in a logical partitioned data processing system
US7302690B2 (en) Method and apparatus for transparently sharing an exception vector between firmware and an operating system

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080423

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080423

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110412

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120308

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120605

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120925

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20121002

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20121221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140513

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140709

R150 Certificate of patent or registration of utility model

Ref document number: 5579354

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees