JP2002342178A - バス・エラーに優先順位を付ける方法、コンピュータ・プログラムおよびデータ処理システム - Google Patents

バス・エラーに優先順位を付ける方法、コンピュータ・プログラムおよびデータ処理システム

Info

Publication number
JP2002342178A
JP2002342178A JP2002078872A JP2002078872A JP2002342178A JP 2002342178 A JP2002342178 A JP 2002342178A JP 2002078872 A JP2002078872 A JP 2002078872A JP 2002078872 A JP2002078872 A JP 2002078872A JP 2002342178 A JP2002342178 A JP 2002342178A
Authority
JP
Japan
Prior art keywords
error
subsystem
severity
severity level
subsystems
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002078872A
Other languages
English (en)
Inventor
Christopher Harry Austen
クリストファー・ハリー・オースチン
Anthony Peres Michael
マイケル・アンソニー・ペレス
Waltz Wening Mark
マーク・ワルツ・ウェニング
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2002342178A publication Critical patent/JP2002342178A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • G06F11/0724Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0745Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test buses, lines or interfaces, e.g. stuck-at or open line faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】 コンピュータ・システムのバス・エラーに優
先順位を付ける方法を提供すること。 【解決手段】 サブシステム・テストが、バス・システ
ム上の複数のサブシステムからの第1サブシステム上で
実行され、バス・システム上のサブシステム・テスト
は、第1バス・サブシステムに固有である。サブシステ
ム・テストの実行に応答して、出力が受け取られる。第
1サブシステムでのエラーを示す出力に応答して、重大
度レベルが、エラーに基づいて査定される。バス・シス
テム上の複数のサブシステムからのすべてのサブシステ
ムについて、残りのサブシステムのそれぞれに対してサ
ブシステム・テストが実行され、バス・システム上の各
サブシステム・テストは、各残りのサブシステムに固有
である。各サブシステム・テストの実行に応答して、出
力が受け取られる。残りのサブシステムのいずれかでの
エラーを示す出力に応答して、重大度レベルが、エラー
に基づいて査定される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、全般的にはコンピ
ュータ・アーキテクチャの分野に関し、具体的には、ラ
ンタイム中のマシン・チェック割込みを管理する方法お
よびシステムに関する。
【0002】
【従来の技術】コンピュータがますます洗練されるにつ
れて、診断処理および修理処理が、ますます複雑にな
り、完了により長い時間を必要とするようになってき
た。サービス技術者は、コンピュータ内でエラーを引き
起こしている可能性がある1つまたは複数の構成要素を
突き止めようとして長々しい診断手順を介してエラーを
「追跡」することができる。診断手順では、一般に、問
題の判定および後続の解決へと技術者を案内するため
に、エラーまたは問題に対する複数の可能な解決策が指
定される。しかし、診断手順では、一般に、エラーの候
補である可能性が高い1つの構成要素が指され、その構
成要素が信頼できると判定される場合には、次のエラー
が発生するまで問題が未解決のままになる可能性があ
る。新しい構成要素に関する支払いのほかに、会社は、
サービス技術者の繰り返し発生する労働コストと、エラ
ーを起こしやすいコンピュータのユーザの失われる生産
性についても支払わなければならない。
【0003】ほとんどのコンピュータ・システムで、コ
ンピュータ・システムの動作中のシステム問題を検出す
るのを助けるために、ある種のサーベイランスが使用さ
れる。サーベイランスは、たとえば拡張対話式エグゼク
ティブ(AIX)などのオペレーティング・システム
と、たとえばサービス・プロセッサなどのサポート・シ
ステムの間の通信システムである。通常のサーベイラン
スでは、オペレーティング・システムとサポート・シス
テムの両方が、周期的に互いに「ハートビート」メッセ
ージを送る。一方が、所与の時間の期間内に他方からの
ハートビート・メッセージを受け取らない場合には、他
方の構成要素が故障したと仮定する。その結果、障害
が、対応するエラー・ログにログ記録され、修理処置が
必要であることが示される。しかし、マシン・チェック
で見つかった最初のエラーの報告が、必ずしもマシン・
チェックの実際の原因ではない場合がある。
【0004】
【発明が解決しようとする課題】したがって、PCIバ
スから報告される複数のエラーに優先順位を付け、系統
的なリスト内でエラーを順序付ける方法およびシステム
が望ましい。
【0005】
【課題を解決するための手段】本発明は、コンピュータ
・システムのバス・エラーに優先順位を付ける方法を提
供する。サブシステム・テストが、バス・システム上の
複数のサブシステムからの第1サブシステム上で実行さ
れ、バス・システム上のサブシステム・テストは、第1
バス・サブシステムに固有である。サブシステム・テス
トの実行に応答して、出力が受け取られる。第1サブシ
ステムでのエラーを示す出力に応答して、重大度レベル
が、エラーに基づいて査定される。バス・システム上の
複数のサブシステムからのすべてのサブシステムについ
て、残りのサブシステムのそれぞれに対してサブシステ
ム・テストが実行され、バス・システム上の各サブシス
テム・テストは、各残りのサブシステムに固有である。
各サブシステム・テストの実行に応答して、出力が受け
取られる。残りのサブシステムのいずれかでのエラーを
示す出力に応答して、重大度レベルが、エラーに基づい
て査定される。
【0006】本発明に特有と思われる新規の特徴を、請
求項に示す。しかし、本発明自体ならびに本発明の使用
の好ましい態様、さらなる目的、および長所は、添付図
面と共に読まれる時に、下記の例示的実施形態の詳細な
説明を参照することによって最もよく理解される。
【0007】
【発明の実施の形態】ここで図面、具体的には図1を参
照すると、図1は、本発明を実施することができるネッ
トワーク化されたデータ処理システムの絵図である。
【0008】ネットワーク化されたデータ処理システム
100は、本発明を実施することができるコンピュータ
のネットワークである。ネットワーク化されたデータ処
理システム100には、ネットワーク102が含まれ、
このネットワーク102は、ネットワーク化されたデー
タ処理システム100内で一緒に接続されたさまざまな
装置およびコンピュータの間の通信リンクを提供するの
に使用される媒体である。ネットワーク102には、銅
線または光ファイバ・ケーブルなどの有線接続と、セル
電話接続などの無線接続を含めることができる。また、
ネットワーク102の接続は、専用回線を用いるものな
どの永久的接続、または、ダイヤル・アップ電話接続を
介して行われる接続などの一時的接続のいずれかまたは
両方とすることができる。
【0009】図示の例では、サーバ104が、記憶装置
106と共にネットワーク102に接続される。さら
に、クライアント108、110、および112も、ネ
ットワーク102に接続される。これらのクライアント
108、110、および112は、たとえば、パーソナ
ル・コンピュータまたはネットワーク・コンピュータと
することができる。本明細書において、ネットワーク・
コンピュータは、ネットワークに結合され、ネットワー
クに結合された別のコンピュータからプログラムまたは
他のアプリケーションを受信する、任意のコンピュータ
である。図示の例では、サーバ104が、ブート・ファ
イル、オペレーティング・システム・イメージ、および
アプリケーションなどのデータを、クライアント10
8、110、および112に供給する。クライアント1
08、110、および112は、サーバ104に対する
クライアントである。複数層ネットワーク化環境では、
ネットワーク化されたアプリケーションが提供され、こ
こで、アプリケーションの一部が、サーバ104などの
サーバ上に配置され、アプリケーションの別の部分が、
クライアント108などのクライアントに配置される。
この実施形態では、クライアントが、第1層システムと
みなされ、サーバが、第2層システムとみなされる。
【0010】ネットワーク化されたデータ処理システム
100に、図示されていない追加のサーバ、クライアン
ト、および他の装置を含めることができる。図示の例で
は、ネットワーク化されたデータ処理システム100
が、インターネットであり、ネットワーク102が、互
いに通信するのにTCP/IPプロトコル・スイートを
使用するネットワークおよびゲートウェイの全世界の集
合を表す。インターネットの心臓部には、データおよび
メッセージをルーティングする、数千の商用、政府、教
育機関および他のコンピュータ・システムからなる、主
要ノードまたはホスト・コンピュータの間の高速データ
通信回線のバックボーンがある。もちろん、ネットワー
ク化されたデータ処理システム100は、たとえばイン
トラネットまたはローカル・エリア・ネットワークなど
の、複数の異なるタイプのネットワークとして実施する
こともできる。
【0011】図1は、例として意図されており、本発明
の処理に関するアーキテクチャ的制限として意図されて
はいない。たとえば、ネットワーク102で、図1に示
されたハードウェアに加えて、またはその代わりに、プ
ロッタ、光学スキャナ、および類似物などの他のハード
ウェア装置を使用することができる。
【0012】図2に、本発明を実施することができる、
サーバとして実施することができるデータ処理システム
のブロック図を示す。データ処理システム200は、シ
ステム・バス206に接続された複数のプロセッサ20
1、202、203、および204を含む対称マルチプ
ロセッサ(SMP)システムとすることができる。たと
えば、データ処理システム200は、ネットワーク内の
サーバとして実施された、米国ニューヨーク州アーモン
クのInternational Business Machines Corporation社
の製品であるIBM RS/6000とすることができ
る。あるいはその代わりに、単一プロセッサ・システム
を使用することができる。システム・バス206には、
メモリ・コントローラ/キャッシュ208も接続され、
このメモリ・コントローラ/キャッシュ208が、複数
のローカル・メモリ260ないし263へのインターフ
ェースを提供する。入出力バス・ブリッジ210が、シ
ステム・バス206に接続され、入出力バス212への
インターフェースを提供する。メモリ・コントローラ/
キャッシュ208および入出力バス・ブリッジ210
を、図示のように統合することができる。
【0013】データ処理システム200は、論理分割さ
れたデータ処理システムである。したがって、データ処
理システム200は、複数の異種オペレーティング・シ
ステム(または単一のオペレーティング・システムの複
数のインスタンス)を同時に稼動させることができる。
これらの複数のオペレーティング・システムのそれぞれ
が、任意の個数のソフトウェア・プログラムをその中で
実行させることができる。データ処理システム200
は、異なる入出力アダプタ220、221、228、2
29、236、237、248、および249を異なる
論理区画に割り当てることができるように論理分割され
る。
【0014】したがって、たとえば、データ処理システ
ム200が、3つの論理区画P1、P2、およびP3に
分割されると想定されたい。入出力アダプタ220、2
21、228、229、236、および237のそれぞ
れと、プロセッサ201ないし204のそれぞれと、ロ
ーカル・メモリ260ないし263のそれぞれが、3つ
の区画の1つに割り当てられる。たとえば、プロセッサ
201と、ローカル・メモリ260と、入出力アダプタ
220、228および229を、論理区画P1に割り当
てることができ、プロセッサ202および203と、ロ
ーカル・メモリ261と、入出力アダプタ221および
237を、区画P2に割り当てることができ、プロセッ
サ204と、ローカル・メモリ262および263と、
入出力アダプタ236、248、および249を、論理
区画P3に割り当てることができる。
【0015】データ処理システム200内で実行される
各オペレーティング・システムは、異なる論理区画に割
り当てられる。したがって、データ処理システム200
内で実行される各オペレーティング・システムは、その
論理区画内にある入出力ユニットだけにアクセスするこ
とができる。したがって、たとえば、拡張対話式エグゼ
クティブ(AIX)オペレーティング・システムの1つ
のインスタンスを、区画P1内で実行されているものと
することができ、AIXオペレーティング・システムの
第2のインスタンス(イメージ)を、区画P2内で実行
されているものとすることができ、Windows(R) 2000
オペレーティング・システムを、論理区画P3内で動作
しているものとすることができる。Windows(R) 2000
は、米国ワシントン州レッドモンドのMicrosoft Corpor
ation社の製品であり、商標である。
【0016】入出力バス212に接続されたperipheral
component interconnect(PCI)ホスト・ブリッジ
214が、プライマリPCIバス215へのインターフ
ェースを提供する。複数の入出力アダプタ220および
221を、めいめいのセカンダリPCIバス218およ
び219と外部アドレス・ストローブ(EADS)21
6とを介してプライマリPCIバス215に接続するこ
とができる。通常のPCIバス実施形態では、4つと8
つの間の入出力アダプタ(すなわちアドイン・コネクタ
用の拡張スロット)がサポートされる。各入出力アダプ
タ220および221は、データ処理システム200
と、たとえばデータ処理システム200に対するクライ
アントである他のネットワーク・コンピュータなどの入
出力装置との間のインターフェースを提供する。
【0017】EADS216、224、232、および
242は、セカンダリPCIバス218、219、22
6、227、234、235、244、および245で
の入出力アダプタのホット・プラギングをサポートする
多機能PCI−PCIブリッジである。ホット・プラギ
ングによって、ランタイム中の入出力アダプタ220、
221、228、229、236、237、248、お
よび249の追加、除去、および交換が可能になる。各
入出力アダプタ220、221、228、229、23
6、237、248、および249は、それ自体のセカ
ンダリPCIバス218、219、226、227、2
34、235、244、および245を有し、これによ
ってホット・プラギングが可能になる。各EADS21
6、224、232、および242を、プライマリPC
Iバス215、223、231、および241から8つ
までのホット・プラグのセカンダリPCIバス218、
219、226、227、234、235、244、お
よび245へのブリッジとして機能するように構成する
ことができる。図示の実施形態では、プライマリPCI
バス215、223、231、および241が、64ビ
ット幅、3.3V対応であり、16MHzと66MHz
の間で稼動する。セカンダリPCIバス218、21
9、226、227、234、235、244、および
245は、32ビット幅であり、セカンダリPCIバス
218/219、226/227、234/235、お
よび244/245の対のそれぞれを組み合わせて、6
4ビット幅バスにすることができる。
【0018】追加のPCIホスト・ブリッジ222およ
び230は、追加のプライマリPCIバス223および
231へのインターフェースを提供する。追加のプライ
マリPCIバス223および231のそれぞれは、めい
めいのEADS224および232に接続される。EA
DS224および232のそれぞれは、図2に示されて
いるように、複数のセカンダリPCIバス226/22
7および234/235に接続される。セカンダリPC
Iバス226/227および234/235は、複数の
入出力アダプタ228/229および236/237と
EADS224および232の間の接続を提供する。し
たがって、たとえば、モデムまたはネットワーク・アダ
プタなどの追加の入出力デバイスを、入出力アダプタ2
28/229および236/237のそれぞれを介して
サポートすることができる。この形で、データ処理シス
テム200を、複数のネットワーク・コンピュータに接
続することができるようになる。
【0019】メモリ・マップ・グラフィックス・アダプ
タである入出力アダプタ248と、ハード・ディスク2
50も、EADS242およびPCIホスト・ブリッジ
240を介して入出力バス212に接続することができ
る。EADS242は、プライマリPCIバス241を
介してPCIホスト・ブリッジ240に接続される。グ
ラフィックス・アダプタである入出力アダプタ248
は、セカンダリPCIバス244を介してEADS24
2に接続され、ハード・ディスク・アダプタである入出
力アダプタ249は、これを介してハード・ディスク2
50がデータ処理システム200に接続されるが、セカ
ンダリPCIバス245を介してEADS242に接続
される。ハード・ディスク250は、追加のハード・デ
ィスクの必要なしに、さまざまな区画の間で論理分割す
ることができる。しかし、望むならば、追加のハード・
ディスクを使用することができる。
【0020】当業者は、図2に示されたハードウェアを
変更できることを諒解するであろう。たとえば、光ディ
スク・ドライブおよび類似物などの他の周辺装置も、図
示のハードウェアに加えてまたはその代わりに使用する
ことができる。さらに、本発明は、マルチプロセッサ論
理分割システムでの実施に制限されるのではなく、たと
えば、通常のパーソナル・コンピュータなど、オペレー
ティング・システムの単一のイメージが稼動する単一プ
ロセッサ・システムなどの、他のタイプのデータ処理シ
ステムで実施することもできる。図示の例は、本発明に
関するアーキテクチャ的制限を暗示することを意図され
ていない。
【0021】図3は、本発明を実施することができる、
クライアントとして実施することができるデータ処理シ
ステムのブロック図である。データ処理システム300
は、クライアント・コンピュータの1例である。データ
処理システム300では、PCI(Peripheral Compone
nt Interconnect)ローカル・バス・アーキテクチャが
使用される。図示の例ではPCIバスが使用されるが、
マイクロ・チャネルおよびISAなどの他のバス・アー
キテクチャを使用することができる。プロセッサ302
および主記憶304は、PCIブリッジ308を介して
PCIローカル・バス306に接続される。PCIブリ
ッジ308には、プロセッサ302用の統合されたメモ
リ・コントローラおよびキャッシュ・メモリを含めるこ
ともできる。PCIローカル・バス306への追加の接
続は、直接構成要素相互接続を介するかアドイン・ボー
ドを介して行うことができる。図示の例では、ローカル
・エリア・ネットワーク(LAN)アダプタ310、S
CSIホスト・バス・アダプタ312、および拡張バス
・インターフェース314が、直接構成要素接続によっ
てPCIローカル・バス306に接続される。対照的
に、オーディオ・アダプタ316、グラフィックス・ア
ダプタ318、およびオーディオ/ビデオ・アダプタ
(A/V)319は、拡張スロットに挿入されるアドイ
ン・ボードによってPCIローカル・バス306に接続
される。拡張バス・インターフェース314は、キーボ
ードおよびマウス・アダプタ320、モデム322、お
よび追加メモリ324の接続を提供する。SCSIホス
ト・バス・アダプタ312は、図示の例では、ハード・
ディスク装置326、テープ駆動装置328、CD−R
OM駆動装置330、およびディジタル多用途ディスク
読取専用メモリ装置(DVD−ROM)332の接続を
提供する。通常のPCIローカル・バス実施形態では、
3つまたは4つのPCI拡張スロットまたはアドイン・
コネクタがサポートされる。
【0022】オペレーティング・システムが、プロセッ
サ302上で稼動し、図3のデータ処理システム300
内のさまざまな構成要素を調整し、それらの制御を提供
するのに使用される。オペレーティング・システムは、
Microsoft Corporation社が販売するWindows(R) 200
0などの市販オペレーティング・システムとすることが
できる。「Windows(R) 2000」は、Microsoft Corpor
ation社の商標である。Java(R)などのオブジェクト
指向プログラミング・システムが、オペレーティング・
システムと共に稼動することができ、これによって、デ
ータ処理システム300上で実行されるJava(R)プロ
グラムまたはJava(R)アプリケーションからオペレー
ティング・システムへの呼出しが提供される。オペレー
ティング・システム、オブジェクト指向オペレーティン
グ・システム、およびアプリケーションまたはプログラ
ムのための命令は、ハード・ディスク装置326などの
記憶装置に配置され、プロセッサ302による実行のた
めに主記憶304にロードすることができる。
【0023】当業者は、図3のハードウェアを実施形態
に応じて変更できることを諒解するであろう。たとえ
ば、光ディスク駆動装置および類似物などの他の周辺装
置を、図3に示されたハードウェアに追加してまたはそ
の代わりに、使用することができる。図示の例は、本発
明に関するアーキテクチャ的制限を暗示する目的のもの
ではない。たとえば、本発明の処理は、マルチプロセッ
サ・データ処理システムに適用することができる。
【0024】本発明は、PCIバスから報告される複数
のエラーに優先順位を付け、系統的なリスト内でエラー
を順序付ける方法を提供する。システムが、マシン・チ
ェックを行う時に、オペレーティング・システムが、例
外を引き起こしたエラーを分離するルーチンを呼び出
す。このエラーが、エラー・ログ内でオペレーティング
・システムに報告される。ルーチンが、エラーが発見さ
れた時に、レジスタに保管されたエラーを検索し、エラ
ーを分析する。重大度係数が、エラー・タイプおよび動
作に割り当てられる。エラー・タイプ重大度係数と動作
重大度係数の合計によって、エラー重大度レベルが決定
される。各エラーは、優先順位付けされたリストにリス
トされる。マシン・チェックが完了する時に、優先順位
付けされたリストが、オペレーティング・システムに返
される。
【0025】マシン・チェックが受け取られる時に、例
外チェック・コードが、エラー・レジスタを読み取りな
がらPCIバスを検索する。例外チェック・コードが、
エラーを見つけた時に、例外チェック・コードが、その
エラーを分析する。エラー「タイプ」およびエラー「動
作」が、計算される。エラー・タイプおよびエラー動作
は、高い値から低い値までの範囲とすることができる。
エラー・タイプおよびエラー動作の両方に、たとえば0
から4までの数を割り当てることができる。エラー・タ
イプ数およびエラー動作数は、複数の形、たとえばエラ
ー・タイプ数およびエラー動作数の少なくとも1つに乗
数を加え、2つの値の合計をとることによって、組み合
わせることができる。エラー・タイプ数およびエラー動
作数の組合せによって、エラー重大度レベルが作成され
る。
【0026】最初に検出されるエラーが、最悪のエラー
として記録される。例外チェック・コードは、さらなる
エラーについてPCIバスのスキャンを継続する。第2
のエラーが検出される場合に、第2のエラーは、最初に
検出されたエラーに類似する、その重大度について分析
される。第2のエラーが、最初に検出されたエラーより
高いエラー重大度レベルを有する場合に、2番目に検出
されたエラーが、最悪のエラーとして、最初に検出され
たエラーと置換され、最初に検出されたエラーは、エラ
ー重大度リストの下方に移動される。2番目に検出され
たエラーの重大度レベルが、最初に検出されたエラーの
重大度レベルより低い場合には、2番目に検出されたレ
ベルが、最初に検出されたエラーの下にリストされる。
PCIバスの分析は、PCIバス上のすべての項目がエ
ラーについて検査されるまで継続される。PCIバス上
のすべての項目を検査した後に、例外チェック・コード
が、すべてのエラーおよび関連するエラー重大度レベル
のリスティングを含む可能性があるエラー・ログを送
る。エラーおよび関連するエラー重大度レベルは、各エ
ラーの重大度レベルに従って優先順位を付けられる。
【0027】図4に、本発明による、システムの電源を
遮断する必要なしに、マシン・チェック割込みを処理す
るシステムのブロック図を示す。マシン・チェック割込
みとは、たとえばAIXなどのオペレーティング・シス
テムが、アダプタが故障したことをデータ処理システム
が検出した時に使用する割込みである。AIXに必ずマ
シン・チェックを報告させる破滅的なエラーが、システ
ム・エラー(SERR)である。SERRは、たとえば
パリティ・エラーなど、さまざまな理由から引き起こさ
れる可能性がある。パリティ・エラーには、特殊なサイ
クルの間のデータ・パリティ・エラーおよびアドレス・
パリティ・エラーを含めることができる。SERRは、
たとえばマスタ打切りエラーなど、パリティ以外の他の
クリティカル・エラーによっても引き起こされる可能性
がある。
【0028】たとえば図2のデータ処理システム200
などのデータ処理システム内で実行中のオペレーティン
グ・システム(OS)402に、データ処理システム内
で発生するマシン・チェック割込みを処理するOS割込
みハンドラ404が含まれる。OS402は、たとえば
AIXとすることができる。ランタイム抽象化サービス
(RTAS)408が、PCIホスト・ブリッジ410
および412からマシン・チェック割込みを受け取る機
構を提供する。この例では、RTAS408が、ファー
ムウェア内で実施される。ファームウェアは、たとえば
読取専用メモリ(ROM)、プログラマブルROM(P
ROM)、消去・プログラマブルROM(EPRO
M)、電気的消去・プログラマブルROM(EEPRO
M)、および不揮発性ランダム・アクセス・メモリ(不
揮発性RAM)などの、電力なしでその内容を保持する
メモリ・チップに保管されたソフトウェアである。
【0029】マシン・チェック割込みは、PCIホスト
・ブリッジ410および412に接続された入出力アダ
プタ422ないし428の1つが不良である(すなわ
ち、正しく動作しなくなった)ことを示す。OS割込み
ハンドラ404は、RTAS408への呼び出しを行っ
て、マシン・チェックが発生したかどうかを判定し、R
TAS408は、マシン・チェック割込みデータを、エ
ラー・ログ項目の形でOS割込みハンドラ404に渡
す。エラー・ログ項目の例を示す。BFE4C025 060712030
0 P H sysplanar0 MACHINE_CHECK_CHRPこのようなエラ
ー・ログ項目によって、たとえばID「BFE4C025」によ
って識別される入出力アダプタ422ないし428が故
障したことを示すマシン・チェック割込みが受け取られ
たことが、OS402に示される。OS割込みハンドラ
404は、RTAS408から受け取った情報に基づい
て、データをエラー・ログ406に記入する。図5のエ
ラー・ログ500に、エラー・ログ406内に含まれる
可能な内容および情報を示す、本発明によるエラー・ロ
グ内に含まれる可能な内容および情報を示す例示的テー
ブルを示す。
【0030】エラー・ログ406の内容によって、入出
力アダプタ422ないし428のどれが不良であるかを
RTAS408が判定できる場合に、その情報が示され
る。そうでない場合には、エラー・ログ406内の項目
は、入出力アダプタ422ないし428のどれがマシン
・チェック割込みを引き起こしたかを示さずに、マシン
・チェック割込みがデータ処理システム内で発生したと
いう事実を反映するだけである。
【0031】OS割込みハンドラ404が、エラー・ロ
グ406に書き込んだ後に、OS402が、エラー・ロ
グ406を分析して、故障した入出力アダプタ422な
いし428の識別を判定する。たとえば、AIXオペレ
ーティング・システムは、「DIAG」コマンドを使用して
エラー・ログ406を分析し、次の結果を作ることがで
きる。 A03-030: I/O bus time-out, access, or other errorn
/a FRU:n/a U0.1-P1-I3
【0032】「U0.X」の形のデータ構造は、「X」によ
って、不良アダプタのドロワ番号を示す。したがって、
上の例では、「U0.1」(X=1)によって、不良アダプタ
のドロワ番号が「1」であることが示される。「IY」の
形のデータ構造は、不良アダプタのスロット番号を示
し、「Y」がスロット番号である。したがって、上の例
では、不良アダプタが、ドロワ1のスロット3にある。
【0033】OS割込みハンドラ404が、入出力アダ
プタ422ないし428のうちの故障した入出力アダプ
タを判定できない場合には、データ処理システムの電源
が切断される。しかし、OS割込みハンドラ404が、
入出力アダプタ422ないし428のうちの故障した入
出力アダプタを判定できる場合には、OS402が、R
TAS408ホット・プラグを呼び出して、故障した入
出力アダプタ422ないし428を使用不可にし、入出
力アダプタ422ないし428のうちの故障したものに
バインドされたすべてのプロセスを割振り解除する。
【0034】入出力アダプタ422ないし428のうち
の故障したものが使用不可にされた後に、urgent syspl
anarメッセージをユーザに送って、たとえばページ、ビ
デオ・ディスプレイ端末へのメッセージ、または不良ア
ダプタを含むスロットのライトの点滅を介するなど、不
良アダプタについてユーザに通知することができる。ur
gent sysplanarは、通常は事前定義の時間間隔で、シス
テムが出力装置に出力するメッセージであり、その結
果、ユーザに、アダプタがもやは動作していないことを
警告することができる。
【0035】ユーザは、不良アダプタを交換し、協力し
て動作しているOS402、RTAS408、EADS
414および418によって提供されるホットプラグ機
能を使用して、アダプタを再び使用可能にすることがで
きる。その後、ユーザは、交換の後にアダプタを再構成
することができる。
【0036】当業者は、図4に示されたハードウェアお
よびソフトウェアを変更できることを諒解するであろ
う。たとえば、図4に示されたものより多数または少数
の入出力アダプタを使用することができる。図示の例
は、本発明に関するアーキテクチャ的制限を暗示する目
的のものではない。
【0037】図6に、本発明の好ましい実施形態によ
る、エラー・ログ内で報告される複数のエラーに優先順
位を付ける例示的処理を示す流れ図を示す。この例で
は、動作が、例外コードのチェックから始まる(ステッ
プ602)。例外コードは、例外を引き起こしたエラー
を分離するためにオペレーティング・システムによって
呼び出されるルーチンからのものである可能性がある。
その後、PCIバスを分析する(ステップ604)。P
CIバスのWorst_severity(最悪重大度)を、「0」と
して確立する(ステップ606)。PCIバス・デバイ
スを突き止める(ステップ608)。その後、PCIバ
ス・デバイスが存在するか否かに関する判定を行う(ス
テップ610)。PCIバス・デバイスが存在しない場
合(ステップ610のNO)、動作が終了する。PCIバ
ス・デバイスが存在する場合(ステップ610のYE
S)、PCIバス・デバイスの状況レジスタを読み取る
(ステップ612)。その後、PCIバス・デバイスが
エラーを報告しているか否かに関する判定を行う(ステ
ップ614)。PCIバス・デバイスがエラーを報告し
ていない場合(ステップ614のNO)、追加のPCIバ
ス・デバイスがあるか否かに関する判定を行う(ステッ
プ616)。追加のPCIバス・デバイスがない場合
(ステップ616のNO)、動作が終了する。追加のPC
Iバス・デバイスがある場合(ステップ616のYE
S)、動作はステップ608に戻り、PCIバス・デバ
イスを突き止める。
【0038】ステップ614に戻って、PCIバス・デ
バイスがエラーを報告している場合(ステップ614の
YES)、エラーを報告しているPCIバス・デバイスを
分析する(ステップ618)。その後、PCIバス・デ
バイス・エラーのcurrent severity(現行重大度)を計
算する(ステップ620)。PCIバス・デバイス・エ
ラーのcurrent severityは、次のように表現することが
できる。 severity = (rc.type*10) + rc.op ここで、rc.typeはエラー・タイプであり、rc.opは、動
作タイプである。
【0039】その後、PCIバス・エラーのcurrent se
verityが、PCIバス・エラーのworst severityより大
きいかどうかに関する判定を行う(ステップ622)。
PCIバス・エラーのworst severityは、前のPCIバ
ス・デバイス分析から確立されている可能性がある。P
CIバス・デバイス・エラーのcurrent severityが、P
CIバス・デバイス・エラーのworst severityより大き
くない場合(ステップ622のNO)、PCIバス・デバ
イス・エラーのcurrent severityおよび関連するPCI
バス・デバイスを、エラー可能性リストに記録し、保管
し(ステップ630)、その後、処理が終了する。PC
Iバス・デバイス・エラーのcurrent severityが、PC
Iバス・デバイス・エラーのworst severityより大きい
場合(ステップ622のYES)、最悪のPCIバス・デ
バイスが、現行PCIバス・デバイスと等しい(ステッ
プ624)。PCIバス・デバイス・エラーのworst se
verityは、PCIバス・デバイス・エラーのcurrent se
verityと等しい(ステップ626)。PCIバス・デバ
イスのworst severityおよび関連するPCIバス・デバ
イスを、エラー可能性リストに記録し、保管し(ステッ
プ628)、その後、処理が終了する。
【0040】図7は、本発明の好ましい実施形態によ
る、状況ビット割当テーブルの例示的な例を示す図であ
る。この例では、マスタ・データ・パリティ・エラー
(PERR)が、ビット8に配置される。シグナルド
(Signaled)・システム・エラー(SERR)が、ビッ
ト14に配置され、検出されたパリティ・エラー(DE
RR)が、ビット15に配置される。
【0041】図8、9、および10に、本発明の好まし
い実施形態による、エラーに重大度係数を適用する例示
的処理を示す例示的流れ図を示す。この例では、動作
が、PCIバス・デバイスを分析することによって開始
される(ステップ802)。次に、PCIバス・デバイ
スの「状況」レジスタを読み取る(ステップ804)。
次に、SERRがセットされているか否かに関する判定
を行う(ステップ806)。SERRがセットされてい
ない場合(ステップ806のNO)、DERRがセットさ
れているか否かに関する判定を行う(ステップ80
8)。DERRがセットされていない場合(ステップ8
08のNO)、PCIバス・デバイスが有効であるか否か
に関する判定を行う(ステップ810)。PCIバス・
デバイスが有効である場合(ステップ810のYES)、e
rror type(エラー・タイプ)が「hard」として示さ
れ、operation type(動作タイプ)が「unknown」とし
て示され(ステップ812)その後、処理が終了する。
PCIバス・デバイスが有効でない場合(ステップ81
0のNO)、error typeが「unknown」として示され、ope
ration typeが「unknown」として示され(ステップ81
4)、その後、動作が終了する。
【0042】ステップ808に戻って、DERRがセッ
トされている場合(ステップ808のYES)、PCIバ
ス・デバイスの「状況」レジスタを読み取る(ステップ
846)。その後、PCIバス・デバイスがPCIバス
・ブリッジであるか否かに関する判定を行う(ステップ
848)。PCIバス・デバイスがPCIバス・ブリッ
ジでない場合(ステップ848のNO)、PERRがセッ
トされているか否かに関する判定を行う(ステップ85
0)。PERRがセットされている場合(ステップ85
0のYES)、error typeが「parity」として示され、ope
ration typeが「read」として示され(ステップ85
2)、その後、動作が終了する。PERRがセットされ
ていない場合(ステップ850のNO)、error typeが
「parity」として示され、operation typeが「write」
として示され(ステップ854)、その後、動作が終了
する。
【0043】ステップ848に戻って、PCIバス・デ
バイスが、PCIバス・ブリッジである場合(ステップ
848のYES)、PCIバス・デバイスの「2次状況」
レジスタを読み取る(ステップ856)。その後、DE
RRがセットされているか否かに関する判定を行う(ス
テップ858)。DERRがセットされている場合(ス
テップ858のYES)、PCIバス・デバイスの「状
況」レジスタを読み取り(ステップ862)、その後、
動作はステップ850に戻り、PERRがセットされて
いるか否かに関する判定を行う。DERRがセットされ
ていない場合(ステップ858のNO)、PCIバス・デ
バイスの「2次状況」レジスタを読み取り(ステップ8
60)、その後、動作はステップ850に戻り、PER
Rがセットされているか否かに関する判定を行う。
【0044】ステップ806に戻って、SERRがセッ
トされている場合(ステップ806のYES)、PCIバ
ス・デバイスの「状況」レジスタを読み取る(ステップ
816)。その後、PCIバス・デバイスがPCIバス
・ブリッジであるか否かに関する判定を行う(ステップ
818)。PCIバス・デバイスがPCIバス・ブリッ
ジでない場合(ステップ818のNO)、PERRがセッ
トされているか否かに関する判定を行う(ステップ83
4)。PERRがセットされていない場合(ステップ8
34のNO)、error typeが「internal」として示され、
operation typeが「none」として示され(ステップ83
8)、その後、動作が終了する。PERRがセットされ
ている場合(ステップ834のYES)、error typeが「p
arity」として示され、operation typeが「address」と
して示され(ステップ836)、その後、動作が終了す
る。
【0045】ステップ818に戻って、PCIバス・デ
バイスがPCIバス・ブリッジである場合(ステップ8
18のYES)、PCIバス・デバイスの「2次状況」レ
ジスタを読み取る(ステップ820)。その後、SER
Rがセットされているか否かに関する判定を行う(ステ
ップ822)。SERRがセットされていない場合(ス
テップ822のNO)、PCIバス・デバイスの「2次状
況」レジスタを読み取る(ステップ840)。その後、
PCIバス・デバイスの「状況」レジスタ内でセットさ
れたDERRが、PCIバス・デバイスの「2次状況」
レジスタに相等しいか否かに関する判定を行う(ステッ
プ842)。PCIバス・デバイスの「状況」レジスタ
でセットされたDERRが、PCIバス・デバイスの
「2次状況」レジスタと相等しい場合(ステップ842
のYES)、動作はステップ856へ継続され、ここで、
PCIバス・デバイスの「2次状況」レジスタを読み取
る。PCIバス・デバイスの「状況」レジスタでセット
されたDERRが、PCIバス・デバイスの「2次状
況」レジスタと相等しくない場合(ステップ842のN
O)、PCIバス・デバイスの「状況」レジスタでセッ
トされたPERRが、PCIバス・デバイスの「2次状
況」レジスタと相等しいか否かに関する判定を行う(ス
テップ844)。PCIバス・デバイスの「状況」レジ
スタでセットされたPERRが、PCIバス・デバイス
の「2次状況」レジスタと相等しい場合(ステップ84
4のYES)、error typeが「parity」として示され、ope
ration typeが「unknown」として示され(ステップ83
6)、その後、動作が終了する。PCIバス・デバイス
の「状況」レジスタでセットされたPERRが、PCI
バス・デバイスの「2次状況」レジスタと相等しくない
場合(ステップ844のNO)、error typeが「interna
l」として示され、operation typeが「none」として示
され(ステップ838)、その後、動作が終了する。
【0046】ステップ822に戻って、SERRがセッ
トされている場合(ステップ822のYES)、セカンダ
リ・バスへの切替を行う(ステップ824)。その後、
次のPCIバス・デバイスを突き止める(ステップ82
6)。その後、PCIバス・デバイスが存在するか否か
に関する判定を行う(ステップ828)。PCIバス・
デバイスが存在しない場合(ステップ828のNO)、動
作はステップ810に戻り、PCIバス・デバイスが有
効であるか否かに関する判定を行う。PCIバス・デバ
イスが存在する場合(ステップ828のYES)、PCI
バス・デバイスの「状況」レジスタを読み取る(ステッ
プ830)。その後、PCIバス・デバイスがエラーを
報告しているか否かに関する判定を行う(ステップ83
2)。PCIバス・デバイスがエラーを報告していない
場合(ステップ832のNO)、動作はステップ826に
戻り、次のPCIバス・デバイスを突き止める。PCI
バス・デバイスがエラーを報告している場合(ステップ
832のYES)、動作はステップ802に戻り、PCI
バス・デバイスを分析する。
【0047】図11に、本発明の好ましい実施形態によ
る、エラー重大度係数によって優先順位を付けられたエ
ラーを表示する系統的リストを展開する例示的処理を示
す流れ図を示す。この例では、動作が、PCIバス・デ
バイス・エラーをログ記録することから開始される(ス
テップ902)。その後、標準エラー・ログ詳細を作成
する(ステップ904)。最悪PCIバス・デバイスの
位置をログ記録する(ステップ906)。エラー可能性
リスト内の項目を読み取る試みを行う(ステップ90
8)。その後、エラー可能性リストが存在するか否かに
関する判定を行う(ステップ910)。エラー可能性リ
ストが存在しない場合(ステップ910のNO)、エラー
・ログ詳細が完成され(ステップ914)、その後、動
作が終了する。エラー可能性リストが存在する場合(ス
テップ910のYES)、PCIバス・デバイスのロケー
ション・コードの末尾に「>」(より大きい)を追加す
る(ステップ912)。その後、PCIバス・デバイス
のロケーション・コードを、エラー可能性リストに追加
する(ステップ916)。その後、エラー可能性リスト
内の次の項目を読み取る試みを行う(ステップ91
8)。その後、エラー可能性リストが空であるか否かに
関する判定を行う(ステップ920)。エラー可能性リ
ストが空でない場合(ステップ920のNO)、動作はス
テップ916に戻り、PCIバス・デバイスのロケーシ
ョン・コードをエラー可能性リストに追加する。エラー
可能性リストが空である場合(ステップ920のYE
S)、エラー・ログ詳細が完成され(ステップ91
4)、その後、動作が終了する。
【0048】図12に、本発明の好ましい実施形態によ
る、オペレーティング・システムにエラーの発見を報告
する例外チェック・コードを示す。この例では、PCI
バス・エラー・タイプ902’ならびにPCIバス動作
エラー904’が監視される。PCIバス・エラー・タ
イプ902’は、複数のエラー・カテゴリから構成する
ことができる。この例では、PCIバス・エラー・タイ
プ902’に、たとえば、none(なし)、unknown(不
明)、internal(内部)、hard(ハードウェア)、およ
びparity(パリティ)というエラー分類を含めることが
でき、これらのエラー部類のそれぞれに、たとえば値0
ないし4の、対応する値が関連付けられる。さらに、P
CIバス動作エラー904’に、たとえばnone(な
し)、unknown(不明)、data_read(データ読取)、da
ta_write(データ書込)、およびaddress(アドレス)
というエラー分類を含めることもでき、これらのエラー
分類のそれぞれに、たとえば値0ないし4の、対応する
値が関連付けられる。
【0049】各バス・エラー値、たとえば、タイプ・エ
ラー値および動作エラー値を決定する時に、重大度レベ
ルを査定することができる。重大度レベル計算906’
によって示されているように、エラー・タイプ・エラー
値およびエラー動作エラー値を、組み合わせることがで
きる。本発明の1実施形態では、重大度レベルを、たと
えば次式を使用することによって組み合わせることがで
きる。重大度レベル=10×(エラー・タイプ値)+
(エラー動作値)
【0050】たとえば、たとえばtarget_abort(ターゲ
ット打切り)などの内部エラー・タイプが、20の重大
度レベルを有することができる。たとえば図10に示さ
れたものなどの場合に、エラー・タイプparityエラーと
動作addressエラーが組み合わされて、パリティエラー
が44の値を有することができる。
【0051】したがって、本発明は、バスから報告され
る複数のエラーに優先順位を付け、系統的なリスト内で
エラーを順序付ける方法を提供する。マシン・チェック
が受け取られる時に、例外チェック・コードが、検索中
にエラー・レジスタを読み取りながら、たとえばPCI
バスを検索する。エラーが発見された時に、本発明によ
って、エラーが分析される。たとえば、エラー・タイプ
およびエラー動作など、複数のエラーを検出することが
できる。その後、エラーに、エラーの深刻さに基づく値
を割り当てることができる。その後、エラー値を組み合
わせて、エラー重大度レベルを計算することができる。
【0052】本発明の処理を用いると、最初のエラー
は、最も深刻なエラーとして記録される。例外チェック
・コードが、さらなるエラーの存在についてバスのスキ
ャンを継続する。スキャン処理中にもう1つのエラーが
検出される場合に、追加のエラーが分析される。重大度
レベルが、追加のエラーについて計算され、第1のエラ
ーと比較される。追加のエラーが、第1のエラーより高
い組み合わされた値を有する場合に、追加のエラーが、
第1のエラーより上位にリストされる。しかし、第1の
エラーの値が、最高の検出されたエラーとしてどどまる
場合には、第1のエラーが、追加のエラーより上位にリ
ストされたままになる。バスの分析は、バスに接続され
たすべての項目がチェックされるまで継続される。バス
に接続されたすべての項目をチェックした後に、例外チ
ェック・コードが、エラー・ログに、すべての検出され
たエラーをそれに対応する重大度レベルに基づいてリス
トしたリスティングを送る。これによって、本発明を使
用することによって、システム管理者またはシステム技
術者が、バス上のすべての障害の原因ならびにバスの破
滅的障害を引き起こす確率が最も高い障害を判定でき
る。
【0053】完全に機能するデータ処理システムに関し
て本発明を説明してきたが、本発明の処理を、命令のコ
ンピュータ可読媒体の形およびさまざまな形で配布する
ことができることと、本発明が、配布の実行に実際に使
用される信号担持媒体の特定の種類に無関係に同等に適
用されることとを、当業者が諒解するであろうことに留
意することが重要である。コンピュータ可読媒体の例に
は、フロッピ(R)・ディスク、ハード・ディスク、R
AM、およびCD−ROMなどの記録可能型媒体と、デ
ィジタル通信リンクおよびアナログ通信リンクなどの伝
送型媒体が含まれる。
【0054】本発明の説明は、例示および説明のために
提示されたものであって、網羅的であることまたは開示
された形態に本発明を制限することを意図されてはいな
い。多数の修正形態および変形形態が、当業者には明白
であろう。この実施形態は、本発明の原理および実用的
応用例を最もよく説明し、企図される特定の用途に適す
るさまざまな修正を有するさまざまな実施形態のために
当業者が本発明を理解できるようにするために、選択さ
れ、記述された。
【0055】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0056】(1)データ処理システム内でバス・エラ
ーに優先順位を付ける方法であって、(a)バス・シス
テム上の複数のサブシステムからの第1サブシステム上
でサブシステム・テストを実行するステップであって、
前記バス・システム上の前記サブシステム・テストが、
前記第1サブシステムに固有である、ステップと、
(b)前記サブシステム・テストの実行に応答する出力
を受け取るステップと、(c)前記第1サブシステム上
のエラーを示す前記出力に応答して、前記エラーに基づ
く重大度レベルを割り当てるステップとを含む方法。 (2)(d)前記バス・システム上の前記複数のサブシ
ステムからのすべてのサブシステムについてステップ
(a)ないし(c)を繰り返すステップをさらに含む、
上記(1)に記載の方法。 (3)(e)複数の重大度レベルのリストをコンパイル
するステップであって、前記複数の重大度レベルの前記
リスト内の重大度レベルが、エラーを示すサブシステム
に関連する、ステップと、(f)前記リスト内の前記複
数の重大度レベルを互いに比較するステップと、(g)
前記比較に基づいて前記重大度レベルに優先順位を付け
るステップとをさらに含む、上記(2)に記載の方法。 (4)(h)記号に少なくとも1つの重大度レベルを関
連付けるステップと(i)前記記号および前記少なくと
も1つの重大度レベルを表示するステップとをさらに含
む、上記(3)に記載の方法。 (5)前記少なくとも1つの重大度レベルが、最高の重
大度レベルである、上記(4)に記載の方法。 (6)前記重大度レベルの優先順位付けが、最高の重大
度レベルから最低の重大度レベルへ優先順位を付けられ
る、上記(3)に記載の方法。 (7)重大度レベルが、エラー・タイプ値および動作タ
イプ値の少なくとも1つを含む、上記(1)に記載の方
法。 (8)前記エラー・タイプ値および前記動作タイプ値
が、4の最高の値および0の最低の値を有する、上記
(7)に記載の方法。 (9)前記重大度レベルが、所定の係数と前記エラー・
タイプ値との積に前記動作タイプ値を加えたものとして
表される、上記(7)に記載の方法。 (10)前記所定の係数が、10である、上記(9)に
記載の方法。 (11)前記エラーに基づく前記重大度レベルの割当の
結果が、複数の項目としてログ記録される、上記(1)
に記載の方法。 (12)前記複数の項目の各項目が、前記複数のサブシ
ステムからの1つのサブシステムだけに関連する、上記
(11)に記載の方法。 (13)前記複数の項目内の各項目が、ロケーション・
コードに関連する、上記(12)に記載の方法。 (14)前記重大度レベルが、データベースに保管され
る、上記(1)に記載の方法。 (15)前記第1サブシステムが、複数の状況レジスタ
に関連する、上記(1)に記載の方法。 (16)前記バス・システムが、少なくとも1つのPeri
pheral Component Interconnect(PCI)デバイスを
含む、上記(1)に記載の方法。 (17)前記エラーが、エラー・タイプおよび動作タイ
プの少なくとも1つを含む、上記(1)に記載の方法。 (18)前記エラー・タイプが、parity、internal、ha
rd、およびunknownの1つである、上記(17)に記載
の方法。 (19)前記動作タイプが、address、data_read、data
_write、およびunknownの1つである、上記(17)に
記載の方法。 (20)データ処理システム内でバス・エラーに優先順
位を付ける、コンピュータ可読媒体内のコンピュータ・
プログラム製品であって、a)バス・システム上の複数
のサブシステムからの第1サブシステム上でサブシステ
ム・テストを実行する命令であって、前記バス・システ
ム上の前記サブシステム・テストが、前記第1サブシス
テムに固有である、命令と、(b)前記サブシステム・
テストの実行に応答する出力を受け取る命令と、(c)
前記第1サブシステム上のエラーを示す前記出力に応答
して、前記エラーに基づく重大度レベルを割り当てる命
令とを含むコンピュータ・プログラム製品。 (21)(d)前記バス・システム上の前記複数のサブ
システムからのすべてのサブシステムについてステップ
(a)ないし(c)を繰り返す命令をさらに含む、上記
(20)に記載のコンピュータ・プログラム製品。 (22)(e)複数の重大度レベルのリストをコンパイ
ルする命令であって、前記複数の重大度レベルの前記リ
スト内の重大度レベルが、エラーを示すサブシステムに
関連する、命令と、(f)前記リスト内の前記複数の重
大度レベルを互いに比較する命令と、(g)前記比較に
基づいて前記重大度レベルに優先順位を付ける命令とを
さらに含む、上記(21)に記載のコンピュータ・プロ
グラム製品。 (23)(h)記号に少なくとも1つの重大度レベルを
関連付ける命令と(i)前記記号および前記少なくとも
1つの重大度レベルを表示する命令とをさらに含む、上
記(22)に記載のコンピュータ・プログラム製品。 (24)前記少なくとも1つの重大度レベルが、最高の
重大度レベルである、上記(23)に記載のコンピュー
タ・プログラム製品。 (25)前記重大度レベルの優先順位付けが、最高の重
大度レベルから最低の重大度レベルへ優先順位を付けら
れる、上記(22)に記載のコンピュータ・プログラム
製品。 (26)重大度レベルが、エラー・タイプ値および動作
タイプ値の少なくとも1つを含む、上記(20)に記載
のコンピュータ・プログラム製品。 (27)前記エラー・タイプ値および前記動作タイプ値
が、4の最高の値および0の最低の値を有する、上記
(26)に記載のコンピュータ・プログラム製品。 (28)前記重大度レベルが、所定の係数と前記エラー
・タイプ値との積に前記動作タイプ値を加えたものとし
て表される、上記(26)に記載のコンピュータ・プロ
グラム製品。 (29)前記所定の係数が、10である、上記(28)
に記載のコンピュータ・プログラム製品。 (30)前記エラーに基づく前記重大度レベルの割当の
結果が、複数の項目としてログ記録される、上記(2
0)に記載のコンピュータ・プログラム製品。 (31)前記複数の項目の各項目が、前記複数のサブシ
ステムからの1つのサブシステムだけに関連する、上記
(30)に記載のコンピュータ・プログラム製品。 (32)前記複数の項目内の各項目が、ロケーション・
コードに関連する、上記(31)に記載のコンピュータ
・プログラム製品。 (33)前記重大度レベルが、データベースに保管され
る、上記(20)に記載のコンピュータ・プログラム製
品。 (34)前記第1サブシステムが、複数の状況レジスタ
に関連する、上記(20)に記載のコンピュータ・プロ
グラム製品。 (35)前記バス・システムが、少なくとも1つのPeri
pheral Component Interconnect(PCI)デバイスを
含む、上記(20)に記載のコンピュータ・プログラム
製品。 (36)前記エラーが、エラー・タイプおよび動作タイ
プの少なくとも1つを含む、上記(20)に記載のコン
ピュータ・プログラム製品。 (37)前記エラー・タイプが、parity、internal、ha
rd、およびunknownの1つである、上記(36)に記載
のコンピュータ・プログラム製品。 (38)前記動作タイプが、address、data_read、data
_write、およびunknownの1つである、上記(36)に
記載のコンピュータ・プログラム製品。 (39)データ処理システムであって、少なくとも1つ
のバス・システムと、前記少なくとも1つのバス・シス
テムに接続された通信ユニットと、前記少なくとも1つ
のバス・システムに接続されたメモリであって、命令の
組を含む、メモリと、前記少なくとも1つのバス・シス
テムに接続されたプロセッサとを含み、前記プロセッサ
が、(a)前記バス・システム上の複数のサブシステム
からの第1サブシステム上でのサブシステム・テストで
あって、前記少なくとも1つのバス・システム上の前記
サブシステム・テストが、前記第1サブシステムに固有
である、サブシステム・テストを実行し、(b)前記サ
ブシステム・テストの実行に応答する出力を受け取り、
(c)前記第1サブシステム上のエラーを示す前記出力
に応答して、前記エラーに基づく重大度レベルを割り当
てるために、前記メモリからの前記命令の組を実行する
データ処理システム。 (40)前記プロセッサが、前記少なくとも1つのバス
・システム上の前記複数のサブシステムからのすべての
サブシステムについてステップ(a)ないし(c)を繰
り返すために、前記メモリからの前記命令の組を実行す
ることをさらに含む、上記(39)に記載のデータ処理
システム。 (41)データ処理システム内でバス・エラーに優先順
位を付けるシステムであって、(a)バス・システム上
の複数のサブシステムからの第1サブシステム上でサブ
システム・テストを実行する実行手段であって、前記バ
ス・システム上の前記サブシステム・テストが、前記第
1サブシステムに固有である、実行手段と、(b)前記
サブシステム・テストの実行に応答する出力を受け取る
受取手段と、(c)前記第1サブシステム上のエラーを
示す前記出力に応答して、前記エラーに基づく重大度レ
ベルを割り当てる割当手段とを含むシステム。 (42)(d)前記バス・システム上の前記複数のサブ
システムからのすべてのサブシステムについてステップ
(a)ないし(c)を繰り返す繰返し手段をさらに含
む、上記(41)に記載のシステム。 (43)(e)複数の重大度レベルのリストをコンパイ
ルするコンパイル手段であって、前記複数の重大度レベ
ルの前記リスト内の重大度レベルが、エラーを示すサブ
システムに関連する、コンパイル手段と、(f)前記リ
スト内の前記複数の重大度レベルを互いに比較する比較
手段と、(g)前記比較に基づいて前記重大度レベルに
優先順位を付ける優先順位付け手段とをさらに含む、上
記(42)に記載のシステム。 (44)(h)記号に少なくとも1つの重大度レベルを
関連付ける関連付け手段と(i)前記記号および前記少
なくとも1つの重大度レベルを表示する表示手段とをさ
らに含む、上記(43)に記載のシステム。
【図面の簡単な説明】
【図1】本発明を実施することができるネットワーク化
されたデータ処理システムの絵図である。
【図2】本発明を実施することができる、サーバとして
実施することができるデータ処理システムのブロック図
である。
【図3】本発明を実施することができる、クライアント
として実施することができるデータ処理システムのブロ
ック図である。
【図4】本発明による、システムの電源を遮断する必要
なしに、マシン・チェック割込みを処理するシステムの
ブロック図である。
【図5】本発明による、エラー・ログ内に含まれる可能
な内容および情報を示す例示的テーブルである。
【図6】本発明の好ましい実施形態による、エラー・ロ
グ内で報告される複数のエラーに優先順位を付ける例示
的処理を示す流れ図である。
【図7】本発明の好ましい実施形態による、状況ビット
割当テーブルの例示的な例を示す図である。
【図8】本発明の好ましい実施形態による、PCIバス
・デバイス・エラーに重大度係数を適用する例示的処理
を示す例示的流れ図である。
【図9】本発明の好ましい実施形態による、PCIバス
・デバイス・エラーに重大度係数を適用する例示的処理
を示す例示的流れ図である。
【図10】本発明の好ましい実施形態による、PCIバ
ス・デバイス・エラーに重大度係数を適用する例示的処
理を示す例示的流れ図である。
【図11】本発明の好ましい実施形態による、エラー重
大度係数によって優先順位を付けられたエラーを表示す
る系統的リストを展開する例示的処理を示す流れ図であ
る。
【図12】本発明の好ましい実施形態による、オペレー
ティング・システムにエラーの発見を報告する例外チェ
ック・コードを示す図である。
【符号の説明】
602 例外コードをチェックするステップ 604 PCIバスを分析するステップ 606 Worst_severity=0を確立するステップ 608 PCIバス・デバイスを突き止めるステップ 610 PCIバス・デバイスが存在するか否かを判定
するステップ 612 PCIバス・デバイスの状況レジスタを読み取
るステップ 614 PCIバス・デバイスがエラーを報告している
か否かにを判定するステップ 616 追加のPCIバス・デバイスがあるか否かを判
定するステップ 618 PCIバス・デバイスを分析するステップ 620 current severity = (rc.type*10) + rc.opを
計算するステップ 622 current severity > worst severityかどうか
を判定するステップ 624 最悪のPCIバス・デバイス=現行PCIバス
・デバイス 626 worst severity = current severity 628 worst severityおよびエラー状態の関連するP
CIバス・デバイスを、エラー可能性リストに記録する
ステップ 630 current severityおよびエラー状態の関連する
PCIバス・デバイスを、エラー可能性リストに記録す
るステップ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 クリストファー・ハリー・オースチン アメリカ合衆国78759 テキサス州オース チン アンブルサイド・ドライブ 3510 (72)発明者 マイケル・アンソニー・ペレス アメリカ合衆国78613 テキサス州セダ ー・パーク ノース・レインボー・ブリッ ジ 305 (72)発明者 マーク・ワルツ・ウェニング アメリカ合衆国78613 テキサス州セダ ー・パーク ドーバー・パス 1104 Fターム(参考) 5B083 AA01 BB02 BB06 CC10 CE01 DD08 EE11 EF11 EF12 GG04

Claims (35)

    【特許請求の範囲】
  1. 【請求項1】データ処理システム内でバス・エラーに優
    先順位を付ける方法であって、 (a)バス・システム上の複数のサブシステムからの第
    1サブシステム上でサブシステム・テストを実行するス
    テップであって、前記バス・システム上の前記サブシス
    テム・テストが、前記第1サブシステムに固有である、
    ステップと、 (b)前記サブシステム・テストの実行に応答する出力
    を受け取るステップと、 (c)前記第1サブシステム上のエラーを示す前記出力
    に応答して、前記エラーに基づく重大度レベルを割り当
    てるステップとを含む方法。
  2. 【請求項2】(d)前記バス・システム上の前記複数の
    サブシステムからのすべてのサブシステムについてステ
    ップ(a)ないし(c)を繰り返すステップをさらに含
    む、請求項1に記載の方法。
  3. 【請求項3】(e)複数の重大度レベルのリストを編集
    するステップであって、前記複数の重大度レベルの前記
    リスト内の重大度レベルが、エラーを示すサブシステム
    に関連する、ステップと、 (f)前記リスト内の前記複数の重大度レベルを互いに
    比較するステップと、 (g)前記比較に基づいて前記重大度レベルに優先順位
    を付けるステップとをさらに含む、請求項2に記載の方
    法。
  4. 【請求項4】(h)記号に少なくとも1つの重大度レベ
    ルを関連付けるステップと (i)前記記号および前記少なくとも1つの重大度レベ
    ルを表示するステップとをさらに含む、請求項3に記載
    の方法。
  5. 【請求項5】前記少なくとも1つの重大度レベルが、最
    高の重大度レベルである、請求項4に記載の方法。
  6. 【請求項6】前記重大度レベルの優先順位付けが、最高
    の重大度レベルから最低の重大度レベルへ優先順位を付
    けられる、請求項3に記載の方法。
  7. 【請求項7】重大度レベルが、エラー・タイプ値および
    動作タイプ値の少なくとも1つを含む、請求項1に記載
    の方法。
  8. 【請求項8】前記重大度レベルが、所定の係数と前記エ
    ラー・タイプ値との積に前記動作タイプ値を加えたもの
    として表される、請求項7に記載の方法。
  9. 【請求項9】前記エラーに基づく前記重大度レベルの割
    当の結果が、複数の項目としてログ記録される、請求項
    1に記載の方法。
  10. 【請求項10】前記複数の項目の各項目が、前記複数の
    サブシステムからの1つのサブシステムだけに関連す
    る、請求項9に記載の方法。
  11. 【請求項11】前記複数の項目内の各項目が、ロケーシ
    ョン・コードに関連する、請求項10に記載の方法。
  12. 【請求項12】前記重大度レベルが、データベースに保
    管される、請求項1に記載の方法。
  13. 【請求項13】前記第1サブシステムが、複数の状況レ
    ジスタに関連する、請求項1に記載の方法。
  14. 【請求項14】前記バス・システムが、少なくとも1つ
    のPeripheral Component Interconnect(PCI)デバ
    イスを含む、請求項1に記載の方法。
  15. 【請求項15】前記エラーが、エラー・タイプおよび動
    作タイプの少なくとも1つを含む、請求項1に記載の方
    法。
  16. 【請求項16】前記エラー・タイプが、parity、intern
    al、hard、およびunknownの1つである、請求項15に
    記載の方法。
  17. 【請求項17】前記動作タイプが、address、data_rea
    d、data_write、およびunknownの1つである、請求項1
    5に記載の方法。
  18. 【請求項18】データ処理システム内でバス・エラーに
    優先順位を付ける、コンピュータ・プログラムであっ
    て、 a)バス・システム上の複数のサブシステムからの第1
    サブシステム上でサブシステム・テストを実行する命令
    であって、前記バス・システム上の前記サブシステム・
    テストが、前記第1サブシステムに固有である、命令
    と、 (b)前記サブシステム・テストの実行に応答する出力
    を受け取る命令と、 (c)前記第1サブシステム上のエラーを示す前記出力
    に応答して、前記エラーに基づく重大度レベルを割り当
    てる命令とを含むコンピュータ・プログラム。
  19. 【請求項19】(d)前記バス・システム上の前記複数
    のサブシステムからのすべてのサブシステムについてス
    テップ(a)ないし(c)を繰り返す命令をさらに含
    む、請求項18に記載のコンピュータ・プログラム。
  20. 【請求項20】(e)複数の重大度レベルのリストを編
    集する命令であって、前記複数の重大度レベルの前記リ
    スト内の重大度レベルが、エラーを示すサブシステムに
    関連する、命令と、 (f)前記リスト内の前記複数の重大度レベルを互いに
    比較する命令と、 (g)前記比較に基づいて前記重大度レベルに優先順位
    を付ける命令とをさらに含む、請求項19に記載のコン
    ピュータ・プログラム。
  21. 【請求項21】(h)記号に少なくとも1つの重大度レ
    ベルを関連付ける命令と (i)前記記号および前記少なくとも1つの重大度レベ
    ルを表示する命令とをさらに含む、請求項20に記載の
    コンピュータ・プログラム。
  22. 【請求項22】前記少なくとも1つの重大度レベルが、
    最高の重大度レベルである、請求項21に記載のコンピ
    ュータ・プログラム。
  23. 【請求項23】前記重大度レベルの優先順位付けが、最
    高の重大度レベルから最低の重大度レベルへ優先順位を
    付けられる、請求項20に記載のコンピュータ・プログ
    ラム。
  24. 【請求項24】重大度レベルが、エラー・タイプ値およ
    び動作タイプ値の少なくとも1つを含む、請求項18に
    記載のコンピュータ・プログラム。
  25. 【請求項25】前記重大度レベルが、所定の係数と前記
    エラー・タイプ値との積に前記動作タイプ値を加えたも
    のとして表される、請求項24に記載のコンピュータ・
    プログラム。
  26. 【請求項26】前記エラーに基づく前記重大度レベルの
    割当の結果が、複数の項目としてログ記録される、請求
    項18に記載のコンピュータ・プログラム。
  27. 【請求項27】前記複数の項目内の各項目が、ロケーシ
    ョン・コードに関連する、請求項26に記載のコンピュ
    ータ・プログラム。
  28. 【請求項28】前記第1サブシステムが、複数の状況レ
    ジスタに関連する、請求項18に記載のコンピュータ・
    プログラム。
  29. 【請求項29】前記エラーが、エラー・タイプおよび動
    作タイプの少なくとも1つを含む、請求項18に記載の
    コンピュータ・プログラム。
  30. 【請求項30】データ処理システムであって、 少なくとも1つのバス・システムと、 前記少なくとも1つのバス・システムに接続された通信
    ユニットと、 前記少なくとも1つのバス・システムに接続されたメモ
    リであって、命令の組を含む、メモリと、 前記少なくとも1つのバス・システムに接続されたプロ
    セッサとを含み、前記プロセッサが、(a)前記バス・
    システム上の複数のサブシステムからの第1サブシステ
    ム上でのサブシステム・テストであって、前記少なくと
    も1つのバス・システム上の前記サブシステム・テスト
    が、前記第1サブシステムに固有である、サブシステム
    ・テストを実行し、(b)前記サブシステム・テストの
    実行に応答する出力を受け取り、(c)前記第1サブシ
    ステム上のエラーを示す前記出力に応答して、前記エラ
    ーに基づく重大度レベルを割り当てるために、前記メモ
    リからの前記命令の組を実行するデータ処理システム。
  31. 【請求項31】前記プロセッサが、前記少なくとも1つ
    のバス・システム上の前記複数のサブシステムからのす
    べてのサブシステムについてステップ(a)ないし
    (c)を繰り返すために、前記メモリからの前記命令の
    組を実行することをさらに含む、請求項30に記載のデ
    ータ処理システム。
  32. 【請求項32】データ処理システム内でバス・エラーに
    優先順位を付けるシステムであって、 (a)バス・システム上の複数のサブシステムからの第
    1サブシステム上でサブシステム・テストを実行する実
    行手段であって、前記バス・システム上の前記サブシス
    テム・テストが、前記第1サブシステムに固有である、
    実行手段と、 (b)前記サブシステム・テストの実行に応答する出力
    を受け取る受取手段と、 (c)前記第1サブシステム上のエラーを示す前記出力
    に応答して、前記エラーに基づく重大度レベルを割り当
    てる割当手段とを含むシステム。
  33. 【請求項33】(d)前記バス・システム上の前記複数
    のサブシステムからのすべてのサブシステムについてス
    テップ(a)ないし(c)を繰り返す繰返し手段をさら
    に含む、請求項32に記載のシステム。
  34. 【請求項34】(e)複数の重大度レベルのリストを編
    集する編集手段であって、前記複数の重大度レベルの前
    記リスト内の重大度レベルが、エラーを示すサブシステ
    ムに関連する、編集手段と、 (f)前記リスト内の前記複数の重大度レベルを互いに
    比較する比較手段と、 (g)前記比較に基づいて前記重大度レベルに優先順位
    を付ける優先順位付け手段とをさらに含む、請求項33
    に記載のシステム。
  35. 【請求項35】(h)記号に少なくとも1つの重大度レ
    ベルを関連付ける関連付け手段と (i)前記記号および前記少なくとも1つの重大度レベ
    ルを表示する表示手段とをさらに含む、請求項34に記
    載のシステム。
JP2002078872A 2001-03-22 2002-03-20 バス・エラーに優先順位を付ける方法、コンピュータ・プログラムおよびデータ処理システム Pending JP2002342178A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/815543 2001-03-22
US09/815,543 US6834363B2 (en) 2001-03-22 2001-03-22 Method for prioritizing bus errors

Publications (1)

Publication Number Publication Date
JP2002342178A true JP2002342178A (ja) 2002-11-29

Family

ID=25218113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002078872A Pending JP2002342178A (ja) 2001-03-22 2002-03-20 バス・エラーに優先順位を付ける方法、コンピュータ・プログラムおよびデータ処理システム

Country Status (2)

Country Link
US (1) US6834363B2 (ja)
JP (1) JP2002342178A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113573599A (zh) * 2020-02-26 2021-10-29 韩国烟草人参公社 用于气溶胶生成装置的错误分析装置及系统

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6834363B2 (en) * 2001-03-22 2004-12-21 International Business Machines Corporation Method for prioritizing bus errors
US7093168B2 (en) * 2002-01-22 2006-08-15 Honeywell International, Inc. Signal validation and arbitration system and method
US6961878B2 (en) * 2002-02-28 2005-11-01 Bellsouth Intellectual Property Corporation Software application error severity notification to users
US7260744B2 (en) * 2003-10-21 2007-08-21 Sap Aktiengesellschaft Computer system diagnosis with user-developed procedure
US7263634B2 (en) * 2003-10-21 2007-08-28 Sap Aktiengesellschaft Failures of computer system diagnostic procedures addressed in specified order
US7260750B2 (en) * 2003-10-22 2007-08-21 Sap Aktiengesellschaft Computer system diagnostic procedures performed in specified order
US7370240B2 (en) * 2004-04-29 2008-05-06 International Business Machines Corporation Method and apparatus for preserving trace data in a logical partitioned data processing system
US7496729B2 (en) * 2004-05-13 2009-02-24 International Business Machines Corporation Method and apparatus to eliminate interpartition covert storage channel and partition analysis
US7343521B2 (en) * 2004-05-28 2008-03-11 International Business Machines Corporation Method and apparatus to preserve trace data
US7428665B2 (en) * 2004-11-12 2008-09-23 Lsi Corporation Methods and structure for detection and handling of catastrophic SCSI errors
US7464300B2 (en) * 2004-12-14 2008-12-09 Intel Corporation Method, apparatus and system to detect and signal sequential hot plug failure diagnostics
JP4584853B2 (ja) * 2006-03-17 2010-11-24 富士通株式会社 被疑箇所特定装置および処理方法
US7500023B2 (en) * 2006-10-10 2009-03-03 International Business Machines Corporation Facilitating input/output processing by using transport control words to reduce input/output communications
US7502873B2 (en) * 2006-10-10 2009-03-10 International Business Machines Corporation Facilitating access to status and measurement data associated with input/output processing
US8196149B2 (en) * 2008-02-14 2012-06-05 International Business Machines Corporation Processing of data to determine compatability in an input/output processing system
US8082481B2 (en) * 2008-02-14 2011-12-20 International Business Machines Corporation Multiple CRC insertion in an output data stream
US8214562B2 (en) * 2008-02-14 2012-07-03 International Business Machines Corporation Processing of data to perform system changes in an input/output processing system
US7917813B2 (en) * 2008-02-14 2011-03-29 International Business Machines Corporation Exception condition determination at a control unit in an I/O processing system
US9052837B2 (en) * 2008-02-14 2015-06-09 International Business Machines Corporation Processing communication data in a ships passing condition
US8312189B2 (en) * 2008-02-14 2012-11-13 International Business Machines Corporation Processing of data to monitor input/output operations
US8117347B2 (en) * 2008-02-14 2012-02-14 International Business Machines Corporation Providing indirect data addressing for a control block at a channel subsystem of an I/O processing system
US7899944B2 (en) * 2008-02-14 2011-03-01 International Business Machines Corporation Open exchange limiting in an I/O processing system
US7937507B2 (en) * 2008-02-14 2011-05-03 International Business Machines Corporation Extended measurement word determination at a channel subsystem of an I/O processing system
US8095847B2 (en) * 2008-02-14 2012-01-10 International Business Machines Corporation Exception condition handling at a channel subsystem in an I/O processing system
US7890668B2 (en) 2008-02-14 2011-02-15 International Business Machines Corporation Providing indirect data addressing in an input/output processing system where the indirect data address list is non-contiguous
US8478915B2 (en) 2008-02-14 2013-07-02 International Business Machines Corporation Determining extended capability of a channel path
US8108570B2 (en) * 2008-02-14 2012-01-31 International Business Machines Corporation Determining the state of an I/O operation
US7840717B2 (en) * 2008-02-14 2010-11-23 International Business Machines Corporation Processing a variable length device command word at a control unit in an I/O processing system
US7904605B2 (en) * 2008-02-14 2011-03-08 International Business Machines Corporation Computer command and response for determining the state of an I/O operation
US8166206B2 (en) * 2008-02-14 2012-04-24 International Business Machines Corporation Cancel instruction and command for determining the state of an I/O operation
US8176222B2 (en) 2008-02-14 2012-05-08 International Business Machines Corporation Early termination of an I/O operation in an I/O processing system
US7941570B2 (en) 2008-02-14 2011-05-10 International Business Machines Corporation Bi-directional data transfer within a single I/O operation
US7840718B2 (en) * 2008-02-14 2010-11-23 International Business Machines Corporation Processing of data to suspend operations in an input/output processing log-out system
US7908403B2 (en) * 2008-02-14 2011-03-15 International Business Machines Corporation Reserved device access contention reduction
US7937504B2 (en) * 2008-07-31 2011-05-03 International Business Machines Corporation Transport control channel program message pairing
US8055807B2 (en) * 2008-07-31 2011-11-08 International Business Machines Corporation Transport control channel program chain linking including determining sequence order
US7904606B2 (en) * 2008-07-31 2011-03-08 International Business Machines Corporation Transport control channel program chain linked branching
US8332542B2 (en) * 2009-11-12 2012-12-11 International Business Machines Corporation Communication with input/output system devices
US9401813B2 (en) * 2009-12-29 2016-07-26 Iheartmedia Management Services, Inc. Media stream monitor
US8583988B2 (en) 2011-06-01 2013-11-12 International Business Machines Corporation Fibre channel input/output data routing system and method
US8738811B2 (en) 2011-06-01 2014-05-27 International Business Machines Corporation Fibre channel input/output data routing system and method
US8364853B2 (en) 2011-06-01 2013-01-29 International Business Machines Corporation Fibre channel input/output data routing system and method
US8364854B2 (en) 2011-06-01 2013-01-29 International Business Machines Corporation Fibre channel input/output data routing system and method
US8677027B2 (en) 2011-06-01 2014-03-18 International Business Machines Corporation Fibre channel input/output data routing system and method
US9021155B2 (en) 2011-06-01 2015-04-28 International Business Machines Corporation Fibre channel input/output data routing including discarding of data transfer requests in response to error detection
US8549185B2 (en) 2011-06-30 2013-10-01 International Business Machines Corporation Facilitating transport mode input/output operations between a channel subsystem and input/output devices
US8312176B1 (en) 2011-06-30 2012-11-13 International Business Machines Corporation Facilitating transport mode input/output operations between a channel subsystem and input/output devices
US8346978B1 (en) 2011-06-30 2013-01-01 International Business Machines Corporation Facilitating transport mode input/output operations between a channel subsystem and input/output devices
US8473641B2 (en) 2011-06-30 2013-06-25 International Business Machines Corporation Facilitating transport mode input/output operations between a channel subsystem and input/output devices
US8918542B2 (en) 2013-03-15 2014-12-23 International Business Machines Corporation Facilitating transport mode data transfer between a channel subsystem and input/output devices
US8990439B2 (en) 2013-05-29 2015-03-24 International Business Machines Corporation Transport mode data transfer between a channel subsystem and input/output devices

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701409A (en) * 1995-02-22 1997-12-23 Adaptec, Inc. Error generation circuit for testing a digital bus
US5596716A (en) * 1995-03-01 1997-01-21 Unisys Corporation Method and apparatus for indicating the severity of a fault within a computer system
JPH08286984A (ja) * 1995-04-19 1996-11-01 Fuji Xerox Co Ltd 障害情報通知システム
US5666485A (en) * 1995-06-07 1997-09-09 Samsung Electronics Inc. Software driver for a system bus
US6012152A (en) * 1996-11-27 2000-01-04 Telefonaktiebolaget Lm Ericsson (Publ) Software fault management system
US6430164B1 (en) * 1999-06-17 2002-08-06 Cellport Systems, Inc. Communications involving disparate protocol network/bus and device subsystems
US6650949B1 (en) * 1999-12-30 2003-11-18 General Electric Company Method and system for sorting incident log data from a plurality of machines
US6701464B2 (en) * 2001-03-01 2004-03-02 International Business Machines Corporation Method and system for reporting error logs within a logical partition environment
US6834363B2 (en) * 2001-03-22 2004-12-21 International Business Machines Corporation Method for prioritizing bus errors

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113573599A (zh) * 2020-02-26 2021-10-29 韩国烟草人参公社 用于气溶胶生成装置的错误分析装置及系统
JP2022525569A (ja) * 2020-02-26 2022-05-18 ケーティー アンド ジー コーポレイション エアロゾル生成装置のエラーを分析する装置及びそのシステム
JP7301959B2 (ja) 2020-02-26 2023-07-03 ケーティー アンド ジー コーポレイション エアロゾル生成装置のエラーを分析する装置及びそのシステム
CN113573599B (zh) * 2020-02-26 2024-01-09 韩国烟草人参公社 气溶胶生成装置、错误分析装置及错误分析系统

Also Published As

Publication number Publication date
US6834363B2 (en) 2004-12-21
US20020178404A1 (en) 2002-11-28

Similar Documents

Publication Publication Date Title
JP2002342178A (ja) バス・エラーに優先順位を付ける方法、コンピュータ・プログラムおよびデータ処理システム
JP3697178B2 (ja) ハードウェア・デバイスを管理する方法、システムおよびコンピュータ・プログラム・プロダクト
US6792564B2 (en) Standardized format for reporting error events occurring within logically partitioned multiprocessing systems
EP1119806B1 (en) Configuring system units
US7139940B2 (en) Method and apparatus for reporting global errors on heterogeneous partitioned systems
US6839892B2 (en) Operating system debugger extensions for hypervisor debugging
US6915343B1 (en) System and method of running diagnostic testing programs on a diagnostic adapter card and analyzing the results for diagnosing hardware and software problems on a network computer
US7363546B2 (en) Latent fault detector
JP4015740B2 (ja) Pciバス・エラーの障害を分離する方法およびシステム
US7664986B2 (en) System and method for determining fault isolation in an enterprise computing system
US6460151B1 (en) System and method for predicting storage device failures
US6760868B2 (en) Diagnostic cage for testing redundant system controllers
US6912676B1 (en) Automated risk assessment tool for AIX-based computer systems
US6910160B2 (en) System, method, and computer program product for preserving trace data after partition crash in logically partitioned systems
CN100375960C (zh) 用于调试输入/输出故障的方法和系统
JP4366336B2 (ja) 論理パーティション・データ処理システムにおいてトレース・データを管理するための方法、トレース・データを管理するための論理パーティション・データ処理システム、コンピュータにトレース・データを管理させるためのコンピュータ・プログラム、論理パーティション・データ処理システム
US6880108B1 (en) Risk assessment methodology for AIX-based computer systems
US7305595B2 (en) Method, system, and product for isolating memory system defects to a particular memory system component
US7610429B2 (en) Method and system for determining device criticality in a computer configuration
EP0478131A2 (en) Memory management in a data processing network
GB2342471A (en) Configuring system units
US7673082B2 (en) Method and system to determine device criticality for hot-plugging in computer configurations
US7130929B2 (en) Method for configuring system adapters
US7565424B2 (en) Data processing system, method, and product for reporting loss of service application
US6898731B2 (en) System, method, and computer program product for preventing machine crashes due to hard errors in logically partitioned systems

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041130

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050228

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050823