JP2004220582A - 論理環境においてエラーログを報告するための方法および装置 - Google Patents

論理環境においてエラーログを報告するための方法および装置 Download PDF

Info

Publication number
JP2004220582A
JP2004220582A JP2003421702A JP2003421702A JP2004220582A JP 2004220582 A JP2004220582 A JP 2004220582A JP 2003421702 A JP2003421702 A JP 2003421702A JP 2003421702 A JP2003421702 A JP 2003421702A JP 2004220582 A JP2004220582 A JP 2004220582A
Authority
JP
Japan
Prior art keywords
error
buffer
data processing
processing system
error information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003421702A
Other languages
English (en)
Other versions
JP3943538B2 (ja
Inventor
Christopher Harry Austen
クリストファー・ハリー・オーステン
Alongkorn Kitamorn
アロングコーン・キタモーン
Douglas Wayne Oliver
ダグラス・ウェイン・オリバー
David R Willoughby
デヴィッド・アール・ウィロウビィ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2004220582A publication Critical patent/JP2004220582A/ja
Application granted granted Critical
Publication of JP3943538B2 publication Critical patent/JP3943538B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】 LPARデータ処理システムにおいてエラーログを報告するための改善された方法、装置およびコンピュータ命令を有すること。
【解決手段】 エラーログを管理するための方法、装置およびコンピュータ命令。エラー情報にアクセスするために論理区画化データ処理システムの複数の区画内の区画から要求が受取られる。エラー情報がバッファにあるかどうかについて判断がなされる。エラー情報がバッファに存在しないことに応答して、エラー情報は不揮発性メモリから検索される。不揮発性メモリから検索された取得エラー情報は、バッファに記憶される。このエラー情報は、所定の時限の間だけバッファに記憶される。その時限の後、このエラー情報はバッファから削除または除去される。このようにして、古くなったエラー情報は複数の区画に返されない。
【選択図】 図1

Description

本発明は、全体として、改善されたデータ処理システム、より詳細にはエラー分析のための方法および装置に関する。さらに詳しくは、本発明は、論理区画化データ処理システムにおける区画に関するログを検索するための方法および装置を提供する。
データ処理システム(プラットフォーム)内の論理区画化(LPAR)機能は、単一のオペレーティングシステム(OS)の複数のコピーまたは複数の異種オペレーティングシステムが、単一のデータ処理システムプラットフォームにおいて同時に実行されることを可能にする。その内部でオペレーティングシステムイメージが走行する区画は、プラットフォームの資源の非重畳サブセットが割当てられる。これらのプラットフォーム割当て可能資源は、各自のインタラプト管理領域を備える1つ以上のアーキテクチャ的に別個のプロセッサ、システムメモリの領域、および入出力(I/O)アダプタバススロットを含む。区画の資源はプラットフォームのファームウェアによってOSイメージに表現される。
プラットフォーム内で実行する各個別のOSまたはOSのイメージは、1つの論理区画のソフトウェアエラーが他の区画のいずれの適正な動作に影響し得ないように、相互に保護されている。これは、個々のOSイメージによって直接管理されるプラットフォーム資源のばらばらの集合を割当て、それに割当てられていないいずれの資源も異なるイメージが制御できないように保証する機構を設けることによって得られる。さらに、オペレーティングシステムの割当てられた資源の制御におけるソフトウェアエラーが、いずれかの他のイメージの資源に影響を及ぼさないように予防される。従って、OSの個々のイメージ(または個々の異なるOS)は、プラットフォーム内の割当て可能資源の別個の集合を直接制御する。
LPARデータ処理システム内のオペレーティングシステムは、状態を検査し見つかったエラーを報告するためのルーチンを定期的に呼出し得る。このルーチンは、実行時抽象化サービス(RTAS)コンポーネントの一部であり、事象スキャンと呼ばれる。RTASは、オペレーティングシステムが、プラットフォーム特定コードを要求するようなプラットフォーム機能について知り、それらを操作しなくてもすむように設計されている。RTASは、ハードウェアレジスタといったハードウェアとのインタフェースとして呼出される。各区画はRTASのコピーをメモリに有する。RTASは、インターナショナル・ビジネス・マシンズ・コーポレーション(International Business Machines Corporation)から入手可能な、アイ・ビー・エム・イーサーバ・ピーシリーズ(IBMeServer pSeries)製品に見られる。事象スキャン機能は、データ処理システムの各種サブシステムによって報告され得るエラーログを検査する。これらのサブシステムは例えば、サービスプロセッサ、オープンファームウェアおよびノンマスカブルマシンインタラプトコードを含む。これらのサブシステムのそれぞれは、オペレーティングシステムに関する報告されたエラーログを特定のロケーションに入れる。区画に関する報告可能ログを置くためにサービスプロセッサによって使用される1つのロケーションが、不揮発性ランダムアクセスメモリ(NVRAM)である。事象スキャン機能は、新しい未報告エラーログを見つけるために、それらのコンポーネントによって使用される様々なロケーションを探索する。新しい未報告ログが識別されると、この機能は、ログが報告されなければならないというログをオペレーティングシステムに報告し、それが以後新しい未報告のものとみなされないようにログをマークする。このようにログをマークすることによって、事象スキャン機能が後に再びログを報告することはない。付加的に、これは、ログによって占有された空間が新しい未報告ログで重ね書きされることを可能にする。
対称型マルチプロセッサモード機器構成において、全体のデータ処理システムは、1つのオペレーティングシステムによって所有される。その結果、事象スキャン機能のただ1つのインスタンスだけが呼出される。事象スキャン機能のただ1つのインスタンスだけにより、オペレーティングシステムに報告されたあらゆるエラーログは、古い報告済みのものとしてマークされ得る。LPAR環境において、いくつかの問題が明白になる。例えば、各LPAR区画により、事象スキャン機能のインスタンスが呼出され得る。個々の事象スキャン機能は、同じエラーログを各自のオペレーティングシステムに報告するように要求される。サブシステムが新しいエラーログを置くNVRAMロケーションが閉塞されないようにすることが重要である。そうしなければ、エラーは見逃されるかもしれない。データ処理システムが始動された後数日または数ヶ月してブートされたLPARシステム内の区画は、たとえエラーがその区画にとって新しいものとみなされるかもしれないとしても、古くなったエラーログを受取る理由はまったくない。LPARシステムでは、1つの区画によって呼出される事象スキャン機能は、別の区画にとってはそのエラーログが古いまたは報告済みのものではないかもしれないので、エラーログを古い報告済みのものとしてマークすることができない。エラーログをマークできるこの能力がなければ、ログは除去できず、メモリ空間が使い果たされるまで新しいエラーログの追加を防ぐことができない。
従って、LPARデータ処理システムにおいてエラーログを報告するための改善された方法、装置およびコンピュータ命令を有することが有利であろう。
本発明は、エラーログを管理するための方法、装置およびコンピュータ命令を提供する。エラー情報にアクセスするために、論理区画化データ処理システムにおける複数の区画内の区画から要求が受取られる。エラー情報がバッファに入っているかどうかについて判断がなされる。エラー情報がバッファに存在しないということに応答して、エラー情報は不揮発性メモリから検索される。不揮発性メモリから検索された取得エラー情報は、バッファに記憶される。このエラー情報は、所定の時限の間だけバッファに記憶される。その時限の後、このエラー情報はバッファから削除または除去される。このようにして、古くなったエラー情報はそれらの複数の区画に返されない。
ここで、各図に関して、特に図1に関して説明すれば、本発明が具体化され得るデータ処理システムのブロック図が図示されている。データ処理システム100は、システムバス106に接続された複数のプロセッサ101、102、103および104を含む対称型マルチプロセッサ(SMP)システムとすることができる。例えば、データ処理システム100は、ネットワーク内のサーバとして具体化された、インターナショナル・ビジネス・マシンズ・コーポレーション(ニューヨーク州アーモンク)の製品、IBM RS/6000とすることができる。代替的に、単一プロセッサシステムを使用することもできる。また、システムバス106には、複数のローカルメモリ160〜163とのインタフェースとなる、メモリコントローラ/キャッシュ108が接続されている。入出力バスブリッジ110がシステムバス106と接続され、入出力バス112とのインタフェースとなる。メモリコントローラ/キャッシュ108および入出力バスブリッジ110は、図示のように統合され得る。
データ処理システム100は、論理区画化データ処理システムである。従って、データ処理システム100は、同時に走行する複数の異種のオペレーティングシステム(または単一のオペレーティングシステムの複数のインスタンス)を有することができる。これらの複数のオペレーティングシステムの各々は、その内部で実行する任意の数のソフトウェアプログラムを有することができる。データ処理システム100は、論理的に区画化されており、その結果、種々のPCI入出力アダプタ120〜121、128〜129および136、グラフィックスアダプタ148およびハードディスクアダプタ149が異なる論理区画に割当てられ得る。この場合、グラフィックスアダプタ148は表示装置(図示せず)に接続を付与し、ハードディスクアダプタ149はハードディスク150を制御するための接続を付与する。
このようにして、例えば、データ処理システム100が3つの論理区画P1、P2およびP3に分割されていると仮定する。PCI入出力アダプタ120〜121、128〜129および136のそれぞれ、グラフィックスアダプタ148、ハードディスクアダプタ149、ホストプロセッサ101〜104のそれぞれ、およびローカルメモリ160〜163のそれぞれは、3つの区画のうちの1つに割当てられる。例えば、プロセッサ101、ローカルメモリ160および、入出力アダプタ120、128および129は、論理区画P1に割当てられ得る。プロセッサ102〜103、ローカルメモリ161および、PCI入出力アダプタ121および136は、区画P2に割当てられ得る。そして、プロセッサ104、ローカルメモリ162〜163、グラフィックスアダプタ148およびハードディスクアダプタ149は、論理区画P3に割当てられ得る。
データ処理システム100内で実行する個々のオペレーティングシステムは、異なる論理区画に割当てられる。従って、データ処理システム100内で実行する各オペレーティングシステムは、その論理区画内にあるそれらの入出力装置にのみアクセスし得る。従って例えば、AIXオペレーティングシステムの1つのインスタンスが区画P1内で実行しており、AIXオペレーティングシステムの第2のインスタンス(イメージ)が区画P2内で実行しており、ウィンドウズ(登録商標)XPオペレーティングシステムが論理区画P1内で動作し得る。ウィンドウズXPはワシントン州レドモンドのマイクロソフト・コーポレーション(Microsoft Corporation)の製品および商標である。
入出力バス112に接続されたペリフェラル・コンポーネント・インターコネクト(PCI)ホストブリッジ114は、PCIローカルバス115とのインタフェースとなる。多数のPCI入出力アダプタ120〜121が、PCI−PCIブリッジ116、PCIバス118、PCIバス119、入出力スロット170および入出力スロット171を介してPCIバス115に接続され得る。PCI−PCIブリッジ116は、PCIバス118およびPCIバス119とのインタフェースとなる。PCI入出力アダプタ120および121が、それぞれ入出力スロット170および171に入れられている。典型的なPCIバスの具体化は、4〜8つの入出力アダプタ(すなわちアドインコネクタ用拡張スロット)をサポートするはずである。個々のPCI入出力アダプタ120〜121は、データ処理システム100と、例えばデータ処理システム100にとってクライアントである他のネットワークコンピュータといった入出力装置との間のインタフェースとなる。
追加のPCIホストブリッジ122は、追加のPCIバス123とのインタフェースとなる。PCIバス123は複数のPCI入出力アダプタ128〜129に接続されている。PCI入出力アダプタ128〜129は、PCI−PCIブリッジ124、PCIバス126、PCIバス127、入出力スロット172および入出力スロット173を介してPCIバス123に接続され得る。PCI−PCIブリッジ124は、PCIバス126およびPCIバス127とのインタフェースとなる。PCI入出力アダプタ128および129が、それぞれ入出力スロット172および173に入れられている。このようにして、例えばモデムまたはネットワークアダプタといった追加の入出力装置は、PCI入出力アダプタ128〜129のそれぞれを介してサポートされ得る。このようにして、データ処理システム100は複数のネットワークコンピュータとの接続を可能にする。
入出力スロット174に挿入されたメモリマップドグラフィックスアダプタ148は、PCIバス144、PCI−PCIブリッジ142、PCIバス141およびPCIホストブリッジ140を介して入出力バス112に接続され得る。ハードディスクアダプタ149は、PCIバス145に接続されている入出力スロット175に入れることができる。転じて、このバスはPCI−PCIブリッジ142に接続されており、後者はPCIバス141によってPCIホストブリッジ140に接続されている。
PCIホストブリッジ130が、入出力バス112と接続するためにPCIバス131のインタフェースとなっている。PCI入出力アダプタ136は、PCIバス133によってPCI−PCIブリッジ132に接続されている入出力スロット176と接続されている。PCI−PCIブリッジ132はPCIバス131に接続されている。このPCIバスはまた、PCIホストブリッジ130を、サービスプロセッサメールボックスインタフェース・ISAバスアクセスパススルー論理194およびPCI−PCIブリッジ132に接続している。サービスプロセッサメールボックスインタフェース・ISAバスアクセスパススルー論理194は、PCI/ISAブリッジ193に向けられたPCIアクセスを転送する。NVRAM記憶装置192はISAバス196に接続されている。サービスプロセッサ135は、そのローカルPCIバス195を介してサービスプロセッサメールボックスインタフェース・ISAバスアクセスパススルー論理194に結合される。サービスプロセッサ135はまた、複数のJTAG/ICバス134を通じてプロセッサ101〜104に接続されている。JTAG/ICバス134は、JTAG/スキャンバス(IEEE1149.1参照)とフィリップス(Phillips)のICバスとの組合せである。しかし、代替的に、JTAG/ICバス134は、フィリップスICバスのみか、またはJTAG/スキャンバスのみによって代用され得る。ホストプロセッサ101、102、103および104の全部のSP−ATTN信号は、サービスプロセッサの割込み入力信号と一緒に接続される。サービスプロセッサ135は、自己自身のローカルメモリ191を有し、ハードウェア操作パネル190にアクセスできる。
データ処理システム100が最初に電源投入される時、サービスプロセッサ135は、JTAG/ICバス134を使用して、システム(ホスト)プロセッサ101〜104、メモリコントローラ/キャッシュ108および入出力ブリッジ110に問い合わせる。このステップの完了時に、サービスプロセッサ135は、データ処理システム100のインベントリおよびトポロジを理解する。サービスプロセッサ135はまた、ホストプロセッサ101〜104、メモリコントローラ/キャッシュ108および入出力ブリッジ110に問い合わせて見つかった全部の要素に関してビルトインセルフテスト(BIST)、ベーシックアシュアランステスト(BAT)およびメモリテストを実行する。BIST、BATおよびメモリテストの間に検出された故障に関するあらゆるエラー情報が、サービスプロセッサ135によって収集され報告される。
BIST、BATおよびメモリテストの間に故障であるとわかった要素を取り除いた後にシステム資源の有効/妥当な機器構成が依然可能であれば、データ処理システム100は、ローカル(ホスト)メモリ160〜163に実行可能コードをロードすることに進むことが許される。サービスプロセッサ135はその後、ローカルメモリ160〜163にロードされたコードの実行のためにホストプロセッサ101〜104を解放する。ホストプロセッサ101〜104がデータ処理システム100内の各自のオペレーティングシステムからコードを実行している間、サービスプロセッサ135はエラーの監視および報告モードに入る。サービスプロセッサ135によって監視される項目の形式は、例えば、冷却ファンの速度および動作、温度センサ、電源調整器ならびに、プロセッサ101〜104、ローカルメモリ160〜163および入出力ブリッジ110によって報告される回復可能および非回復可能エラーを含む。
サービスプロセッサ135は、データ処理システム100における全部の監視項目に関連するエラー情報を保存し報告することに責任を負う。サービスプロセッサ135はまた、エラーの形式および規定のしきい値に基づいてアクションを取る。例えば、サービスプロセッサ135は、プロセッサのキャッシュメモリの過剰な回復可能エラーを注意し、それがハードウェア障害の前兆となるものかを判断することができる。この判断に基づき、サービスプロセッサ135は、現在の実行中のセッションおよび以後の初期プログラムロード(IPL)の間におけるデコンフィギュレーションのためにその資源をマークできる。IPLは時に「ブート」または「ブートストラップ」とも呼ばれる。
データ処理システム100は、各種の市販のデータ処理システムを用いて具体化され得る。例えば、データ処理システム100は、インターナショナル・ビジネス・マシンズ・コーポレーションから入手可能なアイ・ビー・エム・イーサーバ・ピーシリーズ(IBM eServer iSeries)モデル840システムを用いて具体化され得る。当該システムは、やはりインターナショナル・ビジネス・マシンズ・コーポレーションから入手可能なOS/400オペレーティングシステムを用いた論理区画化をサポートすることができる。
当業者は、図1に図示されたハードウェアが変更し得ることを理解するであろう。例えば、光ディスクドライブなどといった他の周辺装置もまた、図示されたハードウェアに加えて、またはそれに代えて使用され得る。図示された例は、本発明に関するアーキテクチャ上の限定を含意するものではない。
ここで図2に関して説明すれば、本発明が具体化され得る例示的な論理区画化プラットフォームのブロック図が図示されている。論理区画化プラットフォーム200のハードウェアは、例えば図1のデータ処理システム100と同様に具体化され得る。論理区画化プラットフォーム200は、区画化ハードウェア230、オペレーティングシステム202、204、206、208および、ハイパバイザ210を含む。オペレーティングシステム202、204、206および208は、プラットフォーム200上で同時に走行する単一のオペレーティングシステムの複数のコピーまたは複数の異種のオペレーティングシステムとすることができる。これらのオペレーティングシステムは、ハイパバイザとインタフェースをとるように設計されているOS/400を用いて具体化され得る。オペレーティングシステム202、204、206および208は、区画203、205、207および209にある。付加的に、これらの区画はファームウェアローダ211、213、215および217も含む。これらのファームウェアローダは、RTASを用いて具体化され得る。区画203、205、207および209がインスタンス化される時、オープンファームウェアのコピーが、ハイパバイザの区画マネージャによって各区画にロードされる。区画に関係づけられたかまたは割当てられたプロセッサはその後、区画ファームウェアを実行するために区画のメモリにディスパッチされる。
区画化ハードウェア230は、複数のプロセッサ232〜238、複数のシステムメモリ装置240〜246、複数の入出力(I/O)アダプタ248〜262、および記憶装置270を含む。区画化ハードウェア230はまた、区画におけるエラーの処理といった各種サービスを提供するために使用され得るサービスプロセッサ290も含む。プロセッサ232〜238、メモリ装置240〜246、NVRAM記憶装置298および入出力アダプタ248〜262のそれぞれは、そのそれぞれがオペレーティングシステム202、204、206および208のうちの1つに対応している、論理区画化プラットフォーム200内の複数の区画に割当てられ得る。NVRAM記憶装置298のほとんどは異なる区画による使用のために区画化されているが、このNVRAMはまた、サービスプロセッサがログを置き、区画の全部によってアクセスされる共通領域も含む。
区画管理ファームウェア(ハイパバイザ)210は、論理区画化プラットフォーム200の区画化を創成し実施するために区画203、205、207および209のための多数の機能およびサービスを実行する。ハイパバイザ210は基礎となるハードウェアと同一のファームウェア具体化仮想マシンである。ハイパバイザソフトウェアは、インターナショナル・ビジネス・マシンズ・コーポレーションから入手可能である。ファームウェアは、例えばリードオンリメモリ(ROM)、プログラマブルROM(PROM)、消去可能プログラム可能ROM(EPROM)、電気的消去可能なPROM(EEPROM)および不揮発性ランダムアクセスメモリ(不揮発性RAM)といった、電力を要さずにその内容を保持するメモリチップに記憶された「ソフトウェア」である。従って、ハイパバイザ210は、論理区画化プラットフォーム200の全部のハードウェア資源を仮想化することによって独立したOSイメージ202、204、206および208の同時実行を可能にする。
本発明は、論理区画化データ処理システムにおける異なる区画へのエラー情報の報告を管理するための方法、装置およびコンピュータ実行命令を提供する。本発明の機構はエラーログをバッファにコピーする。これらの事例において、バッファは、異なる区画によって呼出され得る事象スキャン機能の全部のインスタンスによってアクセス可能である。情報は、図2のNVRAM 298といったエラーログを記憶するために通常使用されるロケーションからコピーされる。エラーログがバッファにコピーされると、このログは、古い報告済みのものとしてNVRAMにおいてマークされる。付加的に、バッファにコピーされるログは満了タイムスタンプが割当てられるかまたは付与される。このタイムスタンプは、ログがバッファから削除または除去できる時を決定するために使用される。このバッファは、区画ログバッファとも称する。区画ログバッファは、データ処理システムの様々な場所に置くことができる。例えば、区画ログバッファは、図1のローカルメモリ160といったローカルメモリに置くことができる。このバッファはまた、ハードディスクドライブやテープドライブといった記憶装置に置くことができる。このようにして、エラーログが、所定の時限以内にはLPARシステムのあらゆる区画に使用可能になり得る。従って、マシンが始動されて数日または数ヶ月後にブートまたは始動された区画は、それらの特定の区画にとってはそれらのログが新しいかもしれなくても、古くなったエラーログを見ることはない。
ここで図3に目を向ければ、エラーログを管理する際に使用されるコンポーネントを例示する図が、本発明の好ましい実施形態に従って図示されている。この事例において、区画管理ファームウェア300は、図2の区画管理ファームウェア210といったハイパバイザを用いて具体化され得る。このファームウェアは、事象スキャン機能に類似の機能を含む。しかし、その機能は、区画ログバッファ302においてログを管理することを含む。このバッファは、区画304といった区画によってアクセスされるはずのログを記憶するために使用される。NVRAM 306は、これらの事例で様々なサブシステムがエラーログを置くロケーションである。具体化に応じて他のロケーションを使用することもできる。データ処理システムが電源を切られた場合にこれらのログを保持するために、一般に不揮発性メモリが使用される。
区画304は、エラー情報を要求するためにファームウェアローダ310を介してオペレーティングシステム308の区画管理ファームウェア300の事象スキャン機能を呼出すことができる。応答して、区画管理ファームウェア300はログ検索機能を呼出し、この時、その呼出しは要求側区画番号および、ログが置かれているはずであるメモリ領域を含む。このメモリ領域は、要求側区画がエラー情報を受取ることを期待する領域を識別する。この機能が、ログ312といったログが区画ログバッファ302に存在することを指示した場合、この機能は、その区画による使用のためにその呼出しで識別されたメモリ領域に情報をコピーする。
ログ検索機能が、その区画についていかなる新しいログも区画ログバッファ302に存在しないことを指示した場合、区画管理ファームウェア300は新しい未報告のエラーログが存在するかどうかを決定するためにNVRAM 306を検査する。この事例では、NVRAM 306はログ314およびログ316を含んでいる。これらのログのどちらも新しい未報告のものでなければ、区画管理ファームウェア300は、いかなるエラー情報も存在しないことを指示するメッセージを呼出し側区画に返す。これらのログのうちの1つ以上が新しい未報告のものであれば、その新しい未報告のエラーログはNVRAM 306から区画ログバッファ302にコピーされる。これらの事例では、1つのログだけが区画ログバッファ302にコピーされる。当然ながら、具体化に応じて、複数のログがこのバッファにコピーされ得る。区画ログバッファ302にコピーされたエラーログは、そのログがいつ区画ログバッファ302から除去されるかを指示するために時限またはタイムスタンプと関係づけられる。さらに、区画ログバッファ302にコピーされたログは、NVRAM 306内で古い報告済みのものであるとマークされる。新しいログが区画ログバッファ302にコピーされた後、区画管理ファームウェア300は、区画ログバッファ302にログが存在するので、再びログ検索機能を呼出すことになる。
次に図4に目を向ければ、区画ログバッファの例示的構造を例示する図が本発明の好ましい実施形態に従って図示されている。データ構造400は、図3の区画ログバッファ302といった区画ログバッファを具体化するために使用されるデータ構造の1例である。この事例において、行402は、区画ログバッファにおける最新の記録されたログのためのインデックスである。行404は、ある特定の区画に報告された最も古いログがいずれであるかに関する、区画ごとのインデックスを識別する。行406は、区画ログバッファ内に記憶されたログの満了時間を記録するための区画ログバッファにおける領域を定義する。行408は、区画がエラーログを報告し始めたかどうかを識別するために使用される。行410は、エラーログのコピーを保持するために使用されるバッファを定義するために使用される。
この事例では、区画ログバッファの個々のエラーログは1Kバッファに記憶される。ログの満了時間は2時間であるように選定される。さらに、この特定の具体化では、区画ログバッファは64のログを保持するように設計されている。当然ながら、特定のシステムおよび具体化に応じて、様々なサイズ、時間およびログ数が区画ログバッファについて選定され得る。
ここで図5に関して説明すれば、論理区画化データ処理システムにおいてエラーログを管理するために使用されるプロセスの流れ図が、本発明の好ましい実施形態に従って図示されている。図5に例示されたプロセスは、図3の区画管理ファームウェア300といった区画管理ファームウェアコンポーネントにおいて具体化され得る。
プロセスは、エラー情報の要求を受取ることによって始まる(ステップ500)。この要求は、図3の区画304といった区画から受取る。ログ検索機能が呼出される(ステップ502)。この機能は、以下図6において詳細に説明する。区画ログバッファに存在するエラーログがログ検索機能によって区画にコピーまたは送られたかどうかについて判断がなされる(ステップ504)。エラーログがこの機能によってコピーまたは送られていなければ、不揮発性記憶装置が新しいログについて検査される(ステップ506)。この事例では、不揮発性記憶装置は、図3のNVRAM 306といったNVRAMである。「新しい未報告の」エラーログが不揮発性記憶装置に存在するかどうかについて判断がなされる(ステップ508)。ログの管理を容易にするために、ヘッダがNVRAM 306に含入され得る。ヘッダは、NVRAMの各ログのロケーションおよび状態を記述している。これらの事例では、状態は単一バイトを用いて指示される。値0はログが古い報告済みのものであることを指示し、値1はログが新しい未報告のものであることを指示する。「新しい未報告の」エラーログが不揮発性記憶装置に存在する場合、ログ追加機能が呼出される(ステップ510)。この機能は、ログを不揮発性記憶装置から区画ログバッファにコピーするために使用される。その後、不揮発性記憶装置から区画ログバッファにコピーされたエラーログは、「古い報告済みのもの」としてマークされ(ステップ512)、プロセスは上述のステップ502に戻る。
再びステップ508に関して、「新しい未報告の」エラーログが不揮発性記憶装置に存在しなければ、プロセスは終了する。再びステップ504を参照して、ログ検索機能がエラー情報、エラーログを区画にコピーまたは送っていた場合もやはり、プロセスは終了する。
ここで図6に目を向ければ、ログを検索するために使用されるプロセスの流れ図が、本発明の好ましい実施形態に従って図示されている。図6に例示されたプロセスは、図3の区画管理ファームウェア300といった区画管理ファームウェアコンポーネントにおいて具体化され得る。この流れ図に例示された機能は、図5のステップ502において呼出されるログ検索機能の詳細な説明である。
プロセスは、区画に関する最も古い未報告ログを区画バッファログで検索することによって始まる(ステップ600)。ログが区画ログバッファに存在するかどうかについて判断がなされる(ステップ602)。ログが存在した場合、ログの満了時間が検査される(ステップ604)。次に、ログが満了したかどうかについて判断がなされる(ステップ606)。この判断は、ログに割当てられたタイマまたはタイムスタンプを検査することによって行われ得る。ログが満了していなければ、ログは区画に返されて(ステップ608)、その後プロセスは終了する。これらの事例では、このログは、ログを記憶域にコピーし、この機能の呼出し側によって指定された区画番号を使用することによって、区画に返されるかまたは送られる。
再びステップ606に関して、ログが満了していた場合、ログ削除機能が呼出され(ステップ610)、その後プロセスは終了する。再びステップ602を参照して、ログが存在しなければ、プロセスはいかなるログも存在しないことを報告し(ステップ612)、その後プロセスは終了する。
ここで図7に関して説明すれば、ログを区画ログバッファにコピーするために使用されるプロセスの流れ図が、本発明の好ましい実施形態に従って図示されている。図7に例示されたプロセスは、図3の区画管理ファームウェア300といった区画管理ファームウェアコンポーネントにおいて具体化され得る。このプロセスは、図5のステップ510において呼出されるログ追加機能の詳細な説明である。
プロセスは、不揮発性記憶装置から区画ログバッファにエラーログをコピーすることによって始まる(ステップ700)。現在時刻が取得される(ステップ702)。現在時刻に2時間が加算される(ステップ704)。この新しい時刻は満了タイムスタンプを形成し、ログに関係づけて記憶され(ステップ706)、その後プロセスは終了する。このタイムスタンプは、ログが満了したかどうかを判断するために使用される。
ここで図8に目を向ければ、区画ログバッファのログを削除するために使用されるプロセスの流れ図が、本発明の好ましい実施形態に従って図示されている。図8に例示されたプロセスは、図3の区画管理ファームウェア300といった区画管理ファームウェアコンポーネントにおいて具体化され得る。この図に例示されたプロセスは、図6のステップ610において呼出されるログ削除機能の詳細な説明である。
プロセスは、区画ログバッファからログを消去することによって始まる(ステップ800)。また、ログに関係づけられた満了時間も消去され(ステップ802)、その後プロセスは終了する。
このようにして、本発明は、論理区画化データ処理システムにおけるエラーログを管理するための改善された方法、装置およびコンピュータ命令を提供する。具体的には、本発明の機構は、エラーを報告するために種々のサブシステムによって使用されるものとは別個のロケーションにエラーログを置く。別個のロケーションに置かれたエラーログは、いずれかの選定された時限が経過した後にこれらのログがバッファから削除されるように、満了時間と関係づけられる。このようにして、データ処理システムが始動された時から後刻にブートされる区画は、古くなったエラーログを受取らないことになる。
本発明は完全に機能するデータ処理システムの文脈において説明したが、当業者は、本発明のプロセスが命令のコンピュータ可読媒体の形態および多様な形態で分散させることができ、本発明がそうした分散を行うために実際に使用される信号担持媒体の特定の形式に関わらず等しく適用されることを理解するはずであることを指摘しておくことは重要である。コンピュータ可読媒体の例は、フロッピー(登録商標)ディスク、ハードディスクドライブ、RAM、CD−ROM、DVD−ROMといった記録可能型媒体および、ディジタルおよびアナログ通信リンク、例えば無線周波および光波伝送といった伝送形式を用いた有線または無線通信リンクといった伝送型媒体を含む。コンピュータ可読媒体は、特定のデータ処理システムにおける実際の使用のために復号化される符号化フォーマットの形態を取ることができる。
本発明の記載は例示説明の目的で提示されており、徹底的なものであるように、または本発明を開示した形態に限定するように意図されていない。多くの修正および変更は、当業者には明白であろう。実施形態は、本発明の原理、その実際の応用を最善に説明し、他の当業者が、想定される特定の用途に適するような様々な修正を伴う様々な実施形態について本発明を理解できるようにするために選択され記載されたものである。
本発明を特徴づけると考えられる新規な特徴は、添付された特許請求の範囲に記載されている。しかし、本発明自体だけでなく、その使用の好ましい態様、さらなる目的および利益は、添付図面とともに読んだ時に、例示的な実施形態の以下の詳細な説明によって最善に理解されるはずである。
本発明が具体化され得るデータ処理システムのブロック図である。 本発明が具体化され得る例示的な論理区画化プラットフォームのブロック図である。 本発明の好ましい実施形態に従ってエラーログを管理する際に使用されるコンポーネントを例示する図である。 本発明の好ましい実施形態に従った区画ログバッファの例示的構造を例示する図である。 本発明の好ましい実施形態に従って論理区画化データ処理システムにおいてエラーログを管理するために使用されるプロセスの流れ図である。 本発明の好ましい実施形態に従ってログを検索するために使用されるプロセスの流れ図である。 本発明の好ましい実施形態に従ってログを区画ログバッファにコピーするために使用されるプロセスの流れ図である。 本発明の好ましい実施形態に従って区画ログバッファのログを削除するために使用されるプロセスの流れ図である。
符号の説明
100 データ処理システム
101、102、103、104 ホストプロセッサ
106 システムバス
108 メモリコントローラ/キャッシュ
110 入出力ブリッジ
112 入出力バス
114、122、130、140 PCIホストブリッジ
115、118、119、123、126、127、131、133、141、144、145 PCIバス
116、124、132、142 PCI−PCIブリッジ
120、121、128、129、136 PCI入出力アダプタ
134 JTAG/ICバス
135 サービスプロセッサ
148 グラフィックスアダプタ
149 ハードディスクアダプタ
150 ハードディスク
160、161、162、163 ローカルメモリ
170、171、172、173、174、175、176 入出力スロット
190 ハードウェア操作パネル
191 ローカルメモリ
192 NVRAM記憶装置
194 サービスプロセッサメールボックスインタフェース・ISAバスアクセスパススルー論理
196 ISAバス
200 論理区画化プラットフォーム
200 プラットフォーム
202、204、206、208 オペレーティングシステム
203、205、207、209 区画
210 区画管理ファームウェア(ハイパバイザ)
211、213、215、217 ファームウェアローダ
230 区画化ハードウェア
232、234、236、238 プロセッサ
240、242、244、246 システムメモリ装置
248、250、252、254、256、258、260、262 入出力アダプタ
270 記憶装置
290 サービスプロセッサ
298 NVRAM記憶装置
300 区画管理ファームウェア
302 区画ログバッファ
304 区画
306 NVRAM
308 オペレーティングシステム
310 ファームウェアローダ
312、314、316 ログ
400 データ構造
402、404、406、408、410 行

Claims (32)

  1. 論理区画化データ処理システムにおいてエラーログを管理する方法であって、方法が、
    エラー情報にアクセスするために論理区画化データ処理システムの複数の区画内の区画から要求を受取ることと、
    エラー情報がバッファにあるかどうかを決定することと、
    エラー情報がバッファに存在しないということに応答して、不揮発性メモリからエラー情報を検索することと、
    不揮発性メモリから検索された取得エラー情報をバッファに記憶することとを含み、取得エラー情報は所定の時限の間だけバッファに記憶される、方法。
  2. 取得エラー情報をバッファから区画に送ることをさらに含む、請求項1の方法。
  3. 取得エラー情報はデータ構造に入れられる、請求項1の方法。
  4. データ構造はエラーログである、請求項3の方法。
  5. 不揮発性メモリは不揮発性RAMである、請求項1の方法。
  6. エラー情報は満了時限を割当てられる、請求項1の方法。
  7. 満了時限が経過した後に取得エラー情報をバッファから除去することをさらに含み、複数の区画は古くなったエラー情報を取得することができない、請求項6の方法。
  8. バッファは、RAM、テープドライブおよびハードディスクドライブのうちの少なくとも1つである、請求項1の方法。
  9. 受取る工程、決定する工程、検索する工程および記憶する工程は、区画管理ファームウェアによって実行される、請求項1の方法。
  10. 論理区画化データ処理システムにおいてエラーログを管理する方法であって、方法が、
    論理区画化データ処理システムにおける複数の区画内の区画からエラー情報の要求を受取ることに応答して、エラーログがバッファメモリに存在するかどうかを決定することと、
    バッファメモリにおけるエラーログの不在に応答して、エラーログが未報告である場合にエラーログの集合を含んでいる不揮発性メモリからエラーログを検索することと、
    不揮発性メモリから検索されたエラーログをバッファメモリに記憶することと、エラーログは所定の時限の間だけバッファに記憶され、
    バッファメモリに記憶されたエラーログを使用する区画にエラー情報を返すこととを含む、方法。
  11. 所定の時限の後にエラーログをバッファメモリから削除することをさらに含む、請求項10の方法。
  12. 所定の時限はエラーログに関係づけられたタイムスタンプを用いて識別される、請求項11の方法。
  13. エラーログは、最も古い未報告エラーログであるとして複数のエラーログから選定される、請求項10の方法。
  14. 受取る工程、決定する工程、記憶する工程および返す工程は、区画管理ファームウェアにより実行される、請求項10の方法。
  15. エラーログを管理するための論理区画化データ処理システムであって、論理区画化データ処理システムが、
    バスシステムと、
    バスシステムに接続された通信装置と、
    バスシステムに接続されたメモリと、メモリは命令の集合を含んでおり、
    バスシステムに接続された処理装置とを含み、処理装置は、エラー情報にアクセスするために論理区画化データ処理システムにおける複数の区画内の区画から要求を受取り、エラー情報がバッファにあるかどうかを決定し、エラー情報がバッファに存在しないことに応答して不揮発性メモリからエラー情報を検索し、不揮発性メモリから検索された取得エラー情報をバッファに記憶するために命令の集合を実行するものであり、取得エラー情報は所定の時限の間だけバッファに記憶される、論理区画化データ処理システム。
  16. エラーログを管理するための論理区画化データ処理システムであって、論理区画化データ処理システムが、
    バスシステムと、
    バスシステムに接続された通信装置と、
    バスシステムに接続されたメモリと、メモリは命令の集合を含んでおり、
    バスシステムに接続された処理装置とを含み、処理装置は、論理区画化データ処理システムにおける複数の区画内の区画からエラー情報の要求を受取ったことに応答して、エラーログがバッファメモリに存在するかどうかを決定し、バッファメモリにおけるエラーログの不在に応答してエラーログが未報告である場合にエラーログの集合を含んでいる不揮発性メモリからエラーログを検索し、不揮発性メモリから検索されたエラーログをバッファメモリに記憶し、エラーログは所定の時限の間だけバッファに記憶され、バッファメモリに記憶されたエラーログを使用する区画にエラー情報を返すために命令の集合を実行する、論理区画化データ処理システム。
  17. エラーログを管理するための論理区画化データ処理システムであって、論理区画化データ処理システムが、
    エラー情報にアクセスするために論理区画化データ処理システムにおける複数の区画内の区画から要求を受取るための受信手段と、
    エラー情報がバッファにあるかどうかを決定するための決定手段と、
    エラー情報がバッファに存在しないことに応答し不揮発性メモリからエラー情報を検索するための検索手段と、
    不揮発性メモリから検索された取得エラー情報をバッファに記憶するための記憶手段とを含み、取得エラー情報は所定の時限の間だけバッファに記憶される、論理区画化データ処理システム。
  18. 取得エラー情報をバッファから区画に送るための送信手段をさらに含む、請求項17のデータ処理システム。
  19. 取得エラー情報はデータ構造に入れられる、請求項17のデータ処理システム。
  20. データ構造はエラーログである、請求項19のデータ処理システム。
  21. 不揮発性メモリは不揮発性RAMである、請求項17のデータ処理システム。
  22. エラー情報は満了時限を割当てられる、請求項17のデータ処理システム。
  23. 満了時限が経過した後に取得エラー情報をバッファから除去するための除去手段をさらに含み、複数の区画は古くなったエラー情報を得ることができない、請求項22のデータ処理システム。
  24. バッファは、RAM、テープドライブおよびハードディスクドライブのうちの少なくとも1つである、請求項17のデータ処理システム。
  25. 受信手段、決定手段、検索手段および記憶手段は、区画管理ファームウェアにある、請求項17のデータ処理システム。
  26. エラーログを管理するための論理区画化データ処理システムであって、論理区画化データ処理システムが、
    論理区画化データ処理システムにおける複数の区画内の区画からエラー情報の要求を受取ったことに応答し、エラーログがバッファメモリに存在するかどうかを決定するための決定手段と、
    バッファメモリにおけるエラーログの不在に応答しエラーログが未報告である場合にエラーログの集合を含んでいる不揮発性メモリからエラーログを検索するための検索手段と、
    不揮発性メモリから検索されたエラーログをバッファメモリに記憶するための記憶手段と、
    バッファメモリに記憶されたエラーログを使用する区画にエラー情報を返すための返信手段とを含む、論理区画化データ処理システム。
  27. 所定の時限の後にバッファメモリからエラーログを削除するための削除手段をさらに含む、請求項26のデータ処理システム。
  28. 所定の時限はエラーログに関係づけられたタイムスタンプを用いて識別される、請求項27のデータ処理システム。
  29. エラーログは、最も古い未報告エラーログであるとして複数のエラーログから選定される、請求項26のデータ処理システム。
  30. 受信手段、検索手段、記憶手段および返信手段は、区画管理ファームウェアにある、請求項26のデータ処理システム。
  31. エラーログを管理するためのコンピュータで実行可能なコンピュータプログラムであって、コンピュータプログラムが、
    エラー情報にアクセスするために論理区画化データ処理システムにおける複数の区画内の区画から要求を受取るための第1の命令と、
    エラー情報がバッファにあるかどうかを決定するための第2の命令と、
    エラー情報がバッファに存在しないことに応答し不揮発性メモリからエラー情報を検索するための第3の命令と、
    不揮発性メモリから検索された取得エラー情報をバッファに記憶するための第4の命令とを含み、取得エラー情報は所定の時限の間だけバッファに記憶される、コンピュータプログラム。
  32. エラーログを管理するためのコンピュータで実行可能なコンピュータプログラムであって、コンピュータプログラムが、
    論理区画化データ処理システムにおける複数の区画内の区画からエラー情報の要求を受取ったこと応答しエラーログがバッファメモリに存在するかどうかを決定するための第1の命令と、
    バッファメモリにおけるエラーログの不在に応答しエラーログが未報告である場合にエラーログの集合を含んでいる不揮発性メモリからエラーログを検索するための第2の命令と、
    不揮発性メモリから検索されたエラーログをバッファメモリに記憶するための第3の命令と、
    バッファメモリに記憶されたエラーログを使用する区画にエラー情報を返すための第4の命令とを含む、コンピュータプログラム。
JP2003421702A 2003-01-09 2003-12-18 論理区画化データ処理システムにおいてエラーログを管理する方法 Expired - Lifetime JP3943538B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/339,770 US7055071B2 (en) 2003-01-09 2003-01-09 Method and apparatus for reporting error logs in a logical environment

Publications (2)

Publication Number Publication Date
JP2004220582A true JP2004220582A (ja) 2004-08-05
JP3943538B2 JP3943538B2 (ja) 2007-07-11

Family

ID=32711170

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003421702A Expired - Lifetime JP3943538B2 (ja) 2003-01-09 2003-12-18 論理区画化データ処理システムにおいてエラーログを管理する方法

Country Status (2)

Country Link
US (1) US7055071B2 (ja)
JP (1) JP3943538B2 (ja)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7673070B1 (en) * 2003-03-17 2010-03-02 Network Equipment Technologies, Inc. Method of sharing telecommunications node equipment facilities
US7707189B2 (en) * 2004-10-05 2010-04-27 Microsoft Corporation Log management system and method
US7321987B2 (en) * 2005-01-04 2008-01-22 International Business Machines Corporation Error monitoring of partitions in a computer system using partition status indicators
JP4471898B2 (ja) * 2005-07-22 2010-06-02 シャープ株式会社 携帯情報端末装置
US20070077200A1 (en) * 2005-09-30 2007-04-05 Baker Clark R Method and system for controlled maintenance of hypoxia for therapeutic or diagnostic purposes
US20070083792A1 (en) * 2005-10-11 2007-04-12 Mcdermott Andrew System and method for error detection and reporting
US20070088987A1 (en) * 2005-10-13 2007-04-19 Hiroshi Kimizuka System and method for handling information transfer errors between devices
EP1860557A1 (en) * 2006-05-24 2007-11-28 Robert Bosch Gmbh Method of handling fault codes in a memory
US20080086515A1 (en) * 2006-10-06 2008-04-10 International Business Machines Corporation Method and System for a Soft Error Collection of Trace Files
WO2009047759A2 (en) * 2007-10-11 2009-04-16 N-Trig Ltd. Method for palm touch identification in multi-touch digitizing systems
US8122290B2 (en) * 2009-12-17 2012-02-21 Hewlett-Packard Development Company, L.P. Error log consolidation
US8874888B1 (en) 2011-01-13 2014-10-28 Google Inc. Managed boot in a cloud system
US9135037B1 (en) 2011-01-13 2015-09-15 Google Inc. Virtual network protocol
US8533343B1 (en) 2011-01-13 2013-09-10 Google Inc. Virtual network pairs
US8862743B1 (en) 2011-01-13 2014-10-14 Google Inc. Resource management
US9419921B1 (en) 2011-01-13 2016-08-16 Google Inc. Network address translation for virtual machines
US9619662B1 (en) 2011-01-13 2017-04-11 Google Inc. Virtual network pairs
US8745329B2 (en) 2011-01-20 2014-06-03 Google Inc. Storing data across a plurality of storage nodes
US8812586B1 (en) 2011-02-15 2014-08-19 Google Inc. Correlating status information generated in a computer network
WO2012111010A1 (en) * 2011-02-15 2012-08-23 N-Trig Ltd. Tracking input to a multi-touch digitizer system
CN103190117B (zh) * 2011-02-24 2016-08-31 慧与发展有限责任合伙企业 网络中的错误报告系统及方法
US8533796B1 (en) 2011-03-16 2013-09-10 Google Inc. Providing application programs with access to secured resources
US9176759B1 (en) 2011-03-16 2015-11-03 Google Inc. Monitoring and automatically managing applications
US9237087B1 (en) 2011-03-16 2016-01-12 Google Inc. Virtual machine name resolution
US8261295B1 (en) 2011-03-16 2012-09-04 Google Inc. High-level language for specifying configurations of cloud-based deployments
US9063818B1 (en) 2011-03-16 2015-06-23 Google Inc. Automated software updating based on prior activity
US10228959B1 (en) 2011-06-02 2019-03-12 Google Llc Virtual network for virtual machine communication and migration
US9075979B1 (en) 2011-08-11 2015-07-07 Google Inc. Authentication based on proximity to mobile device
US8966198B1 (en) 2011-09-01 2015-02-24 Google Inc. Providing snapshots of virtual storage devices
US9069616B2 (en) 2011-09-23 2015-06-30 Google Inc. Bandwidth throttling of virtual disks
US8276140B1 (en) 2011-11-14 2012-09-25 Google Inc. Adjustable virtual network performance
US8958293B1 (en) 2011-12-06 2015-02-17 Google Inc. Transparent load-balancing for cloud computing services
US9178698B1 (en) 2011-12-21 2015-11-03 Google Inc. Dynamic key management
US8800009B1 (en) 2011-12-30 2014-08-05 Google Inc. Virtual machine service access
US8983860B1 (en) 2012-01-30 2015-03-17 Google Inc. Advertising auction system
US9672052B1 (en) 2012-02-16 2017-06-06 Google Inc. Secure inter-process communication
US8996887B2 (en) 2012-02-24 2015-03-31 Google Inc. Log structured volume encryption for virtual machines
US8677449B1 (en) 2012-03-19 2014-03-18 Google Inc. Exposing data to virtual machines
US9069806B2 (en) 2012-03-27 2015-06-30 Google Inc. Virtual block devices
US8909939B1 (en) 2012-04-04 2014-12-09 Google Inc. Distribution of cryptographic host keys in a cloud computing environment
JP2013222435A (ja) * 2012-04-19 2013-10-28 Toshiba Corp 半導体記憶装置及びその制御方法
US20130339801A1 (en) * 2012-06-14 2013-12-19 Sap Ag System and method for log and trace diagnostics and analytics
US9430255B1 (en) 2013-03-15 2016-08-30 Google Inc. Updating virtual machine generated metadata to a distribution service for sharing and backup
WO2014158153A1 (en) 2013-03-28 2014-10-02 Hewlett-Packard Development Company, L.P. Identifying memory of a blade device for use by an operating system of a partition including the blade device
WO2014158161A1 (en) * 2013-03-28 2014-10-02 Hewlett-Packard Development Company, L.P. Error coordination message for a blade device having a logical processor in another system firmware domain
EP2979170B1 (en) 2013-03-28 2020-07-08 Hewlett-Packard Enterprise Development LP Making memory of compute and expansion blade devices available for use by an operating system
US9529661B1 (en) * 2015-06-18 2016-12-27 Rockwell Collins, Inc. Optimal multi-core health monitor architecture
US11556408B2 (en) 2020-04-14 2023-01-17 Paypal, Inc. Classifying errors in a failure log

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4633467A (en) 1984-07-26 1986-12-30 At&T Bell Laboratories Computer system fault recovery based on historical analysis
US4780809A (en) 1986-08-08 1988-10-25 Amdahl Corporation Apparatus for storing data with deferred uncorrectable error reporting
US4993030A (en) * 1988-04-22 1991-02-12 Amdahl Corporation File system for a plurality of storage classes
US5128885A (en) 1990-02-23 1992-07-07 International Business Machines Corporation Method for automatic generation of document history log exception reports in a data processing system
JPH04242842A (ja) * 1990-12-29 1992-08-31 Nec Corp データベースバッファ制御装置
JPH0635732A (ja) 1992-07-14 1994-02-10 Hitachi Ltd 記憶装置の領域割り当て方法
US5847972A (en) 1993-09-24 1998-12-08 Eick; Stephen Gregory Method and apparatus for graphically analzying a log-file
US5499340A (en) 1994-01-12 1996-03-12 Isogon Corporation Method and apparatus for computer program usage monitoring
JPH07262054A (ja) 1994-03-17 1995-10-13 Hitachi Ltd 障害情報管理方式
US5790779A (en) 1995-03-10 1998-08-04 Microsoft Corporation Method and system for consolidating related error reports in a computer system
US5892917A (en) 1995-09-27 1999-04-06 Microsoft Corporation System for log record and log expansion with inserted log records representing object request for specified object corresponding to cached object copies
US5857190A (en) 1996-06-27 1999-01-05 Microsoft Corporation Event logging system and method for logging events in a network system
US5801948A (en) * 1996-08-22 1998-09-01 Dickey-John Corporation Universal control system with alarm history tracking for mobile material distribution apparatus
US5822513A (en) 1996-09-27 1998-10-13 Emc Corporation Method and apparatus for detecting stale write data
US5892898A (en) 1996-10-04 1999-04-06 Honeywell, Inc. Error management system for supporting the identification and logging of error messages
US6493837B1 (en) * 1999-07-16 2002-12-10 Microsoft Corporation Using log buffers to trace an event in a computer system
JP2001325165A (ja) 2000-05-16 2001-11-22 Hitachi Electronics Service Co Ltd ハードウエア障害監視システム及び障害監視コンピュータと監視センタ用コンピュータ並びに記録媒体
US6823482B2 (en) * 2001-03-08 2004-11-23 International Business Machines Corporation System and method for reporting platform errors in partitioned systems

Also Published As

Publication number Publication date
US20040139368A1 (en) 2004-07-15
US7055071B2 (en) 2006-05-30
JP3943538B2 (ja) 2007-07-11

Similar Documents

Publication Publication Date Title
JP3943538B2 (ja) 論理区画化データ処理システムにおいてエラーログを管理する方法
JP5579354B2 (ja) 関連アプリケーションに対するトラック・データ・クロスリファレンスを保存する方法及び装置
JP3910554B2 (ja) 論理パーティション・データ処理システムでのエラーまたはイベントを処理する方法、コンピュータ・プログラム、データ処理システム
JP3962393B2 (ja) グローバル・エラーを報告するための論理分割データ処理システム
US8352940B2 (en) Virtual cluster proxy to virtual I/O server manager interface
US6941436B2 (en) Method and apparatus for managing memory blocks in a logical partitioned data processing system
US6842870B2 (en) Method and apparatus for filtering error logs in a logically partitioned data processing system
US7480911B2 (en) Method and apparatus for dynamically allocating and deallocating processors in a logical partitioned data processing system
US7103808B2 (en) Apparatus for reporting and isolating errors below a host bridge
US6934879B2 (en) Method and apparatus for backing up and restoring data from nonvolatile memory
US6910160B2 (en) System, method, and computer program product for preserving trace data after partition crash in logically partitioned systems
US7010726B2 (en) Method and apparatus for saving data used in error analysis
US20070260910A1 (en) Method and apparatus for propagating physical device link status to virtual devices
US6971002B2 (en) Method, system, and product for booting a partition using one of multiple, different firmware images without rebooting other partitions
US20050015661A1 (en) Method and apparatus for managing processors in a multi-processor data processing system
JP4366336B2 (ja) 論理パーティション・データ処理システムにおいてトレース・データを管理するための方法、トレース・データを管理するための論理パーティション・データ処理システム、コンピュータにトレース・データを管理させるためのコンピュータ・プログラム、論理パーティション・データ処理システム
JP2004318880A (ja) ロジカル・パーティション・データ処理システムにおいてパーティション・ファームウェアを同時更新及び活動化するための方法及び装置
US6976191B2 (en) Method and apparatus for analyzing hardware errors in a logical partitioned data processing system
US8024544B2 (en) Free resource error/event log for autonomic data processing system
US6898731B2 (en) System, method, and computer program product for preventing machine crashes due to hard errors in logically partitioned systems
US7260752B2 (en) Method and apparatus for responding to critical abstracted platform events in a data processing system
US6934888B2 (en) Method and apparatus for enhancing input/output error analysis in hardware sub-systems
US7302690B2 (en) Method and apparatus for transparently sharing an exception vector between firmware and an operating system
US20030191978A1 (en) Multiple fault location in a series of devices

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060425

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060628

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060913

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061031

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070115

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070320

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070405

R150 Certificate of patent or registration of utility model

Ref document number: 3943538

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110413

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110413

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120413

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120413

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120413

Year of fee payment: 5

S202 Request for registration of non-exclusive licence

Free format text: JAPANESE INTERMEDIATE CODE: R315201

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130413

Year of fee payment: 6

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130413

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140413

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term