JPH09218828A - データ処理システム内の周辺構成要素の分離によるエラー回復 - Google Patents

データ処理システム内の周辺構成要素の分離によるエラー回復

Info

Publication number
JPH09218828A
JPH09218828A JP8279727A JP27972796A JPH09218828A JP H09218828 A JPH09218828 A JP H09218828A JP 8279727 A JP8279727 A JP 8279727A JP 27972796 A JP27972796 A JP 27972796A JP H09218828 A JPH09218828 A JP H09218828A
Authority
JP
Japan
Prior art keywords
cards
error signal
issued
card
slot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8279727A
Other languages
English (en)
Other versions
JP3771649B2 (ja
Inventor
Allen Bucklando Patrick
パトリック・アレン・バックランド
Marvin Neil Danny
ダニー・マーヴィン・ニール
Marc Saba Stephen
スティーブン・マーク・サーバー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH09218828A publication Critical patent/JPH09218828A/ja
Application granted granted Critical
Publication of JP3771649B2 publication Critical patent/JP3771649B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0745Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4027Coupling between buses using bus bridges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/325Display of status information by lamps or LED's
    • G06F11/326Display of status information by lamps or LED's for error or online/offline status

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)
  • Power Sources (AREA)

Abstract

(57)【要約】 【課題】 複数のカードのうちのどれがエラー信号を出
したかをユーザが識別できるようにするためのコンピュ
ータ・システムを提供する。 【解決手段】 エラー信号を出した装置は分離され、エ
ラー条件を有する装置についてのみエラー回復技法(ま
たは再初期設定)が実施される。コンピュータ・システ
ムは、様々な情報バスを相互接続するブリッジ・チップ
と、入出力、メモリなどの特定の機能を実施するカード
を受け入れるための少なくとも1つのコネクタ・スロッ
トとともに、追加の制御論理回路を含む。エラー信号が
存在すると判定されると、システム・ハードウェアは、
エラー信号を出した装置へのリセット信号を活動化し、
保持する。さらに、ブリッジ・チップ内のレジスタの状
況ビットが設定される。次に、エラー信号を出した装置
に対応するデバイス・ドライバが状況ビットを読み取
り、エラーが発生したことを検証し、ブリッジをリセッ
トし、エラー条件を有する装置のみをリセットまたは初
期設定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般的には、中央
演算処理装置(CPU)と、特定のシステム機能を実行
するための複数の装置またはカードとを有するコンピュ
ータ・システムに関する。より具体的には、CPUが装
置の1つのエラー条件を識別し、エラー回復のためにそ
の装置を分離できるようにするシステムを開示する。
【0002】
【従来の技術】典型的なコンピュータ・システムは、配
線層によって互いに電気的に接続されたメモリ制御装
置、入出力制御装置などの他の特定用途向け集積回路
(ASIC)と、マイクロプロセッサとを含む、システ
ム・ボードを含んでいる。また、多くのコンピュータ
は、カード上のチップをマイクロプロセッサやシステム
・ボード上の他のチップに接続してコンピュータ・シス
テムに追加機能を提供することができる、追加のアダプ
タ・カード用のスロットも含んでいる。ユーザがコンピ
ュータに追加すると思われる典型的な機能としては、拡
張メモリ、ファックス/モデム機能、サウンド・カー
ド、グラフィック・カードなどがある。一般に、システ
ム・ボード上に含まれるスロットは、アダプタ・カード
上の露出タブを受け入れるための導電ランドを有するイ
ンライン電気コネクタを含んでいる。カード上のチップ
の入出力は、このタブに接続される。次に、コネクタ
は、前述の配線層によりマイクロプロセッサなどに電気
的に接続される。
【0003】通常、従来のコンピュータ・システムで
は、アダプタ・カードの1つの装置の1つでエラー条件
が発生すると、CPUはどの装置がエラー信号を発生し
たかを判定することができない。というのは、アダプタ
・カードからのエラー信号が論理OR演算によって合成
されるからである。したがって、ユーザまたはシステム
管理者は、カードの1つの単一装置だけがエラー条件を
持っている場合でもシステム全体のIPLをリセットし
なければならない。システムがサーバである場合、1つ
のマシン、すなわち、サーバのみのエラーによって多く
のクライアント・システムが影響を受ける可能性がある
ことが分かるだろう。さらに、マルチタスク・クライア
ント・システムでは、複数の機能が同時に行われている
可能性があるので、システムをリセットすると、単一装
置のエラーによってすべてのコンピュータ機能が終了す
る恐れがある。
【0004】したがって、特定のアダプタ・カード上の
どの特定の装置がエラー信号を生成したかをCPUが識
別できるようなシステムの必要性が存在することが分か
るだろう。また、エラー信号を生成する特定の装置に対
してエラー回復技法を実施できるように、エラー信号が
生成されたカードを分離することが望ましいと思われ
る。その結果、エラー信号を出した装置についてエラー
回復動作が実施される間に、残りの装置は通常動作を続
行できるはずである。これは、特定のカードが故障して
いると判定された後でコンピュータのハードウェア構成
を変更することと、その後、コンピュータ・システムに
新しいカードを取り付けることを含むことができる。こ
のようなシステム・ハードウェア構成の変更は、コンピ
ュータ・システムから実際のカバーを取り外し、システ
ム全体の電力を低下させたり、またはコンピュータをオ
フライン化する必要もなく、実施できるはずである。
【0005】
【発明が解決しようとする課題】先行技術とは対照的
に、本発明は、複数のカードのうちのどれがエラー信号
を出したかをユーザが識別できるようにするためのコン
ピュータ・システムを提供する。次に、エラー信号を出
した装置が分離され、エラー条件を有する装置について
のみエラー回復技法が実施される。必要であれば、本発
明では、コンピュータ・システム全体の電力を低下させ
る必要がなく、特定のカードを取り外したり交換するこ
とができるように、個々のコネクタを使用禁止にするこ
ともできる。
【0006】
【課題を解決するための手段】概して、追加の制御論理
回路を有するコンピュータ・システムには、ブリッジ・
チップと、入出力、メモリなどの特定の機能を実施する
カードを受け入れるための少なくとも1つのコネクタ・
スロットが設けられている。エラー信号が存在すると判
定されると、システム・ハードウェアは、エラー信号を
出した装置へのリセット信号を活動化し、保持する。さ
らに、ブリッジ・チップ内のレジスタの状況ビットが設
定される。次に、エラー信号を出した装置に対応するデ
バイス・ドライバが状況ビットを読み取り、エラーが発
生したことを検証し、ブリッジをリセットし、エラー条
件を有する装置のみをリセットまたは初期設定する。
【0007】上記の概要によると、本発明の目的、特
徴、および利点は、添付図面に関連して示される以下の
説明および特許請求の範囲により当業者に明らかになる
だろう。
【0008】
【発明の実施の形態】図1を参照すると、同図には、シ
ステム・ボード1と機構またはアダプタ・カード5の斜
視図が示されている。ボード1は、たとえば、IBMか
ら販売されているPowerPCマイクロプロセッサ
(PowerPCはIBMの商標である)などのマイク
ロプロセッサ2や、メモリ、入出力制御装置などの他の
特定用途向け集積回路3などの、様々な集積回路チップ
を含んでいる。また、システム・ボード1に接続された
インライン・コネクタ4および4aも示されている。こ
れらのコネクタは、システム・ボード内に存在する配線
層によりボード1上のICに電気的に接続されている。
コネクタ4および4aには導電ランド10が存在し、こ
れがカード上の導電タブと相互接続する。デバイス5と
も呼ばれるカード5は、遠近法で示され、そこに導電タ
ブ9を有する相互接続部8を含んでいる。これらのタブ
9は、システム・ボード1上の様々な構成要素とカード
5上に存在するチップとの間に電気接続ができるよう
に、コネクタ4内のランド10と接触する。カード5上
のチップ6および7は、コンピュータ・システムに追加
機能を提供するような複数の集積回路のいずれでもよ
い。たとえば、このようなチップ6および7は、メモ
リ、グラフィック・アクセレレータ、数値計算補助プロ
セッサ、モデムなどのICにすることができる。この場
合も、カード5がコネクタ4に挿入されたときにカード
5上のチップ6および7をシステム・ボード上のマイク
ロプロセッサ2およびチップ3と接続するような、配線
層がカード5に存在する。カード5とシステム・ボード
1が、FR4など、複数の基板のいずれでもよく、それ
がバイアによって互いに接続された導電性かつ交互に絶
縁する材料の層を含むことは、当業者には理解されるだ
ろう。ボード1およびカード5の層は、表面パッドに引
き出され、次に、制御済み崩壊チップ接続(C4)、は
んだボール接続(SBC)ワイヤ結合、表面実装技術
(SMT)などの数多くの相互接続方法の1つを使用し
て様々なチップ上の入出力点に接続される。
【0009】図2は、本発明のガイド手段の好ましい実
施例を示している。アダプタ・カード5は、図1に関し
て記載したのと同じように導電タブ9を有するものとし
て示されている。さらに、摩擦ばめ、クランプ、ねじ、
その他の取付け手段によりカード5に付加されたカード
・ガイド31が示されている。ただし、業界で一般的な
半分のサイズのアダプタ・カードを収容するために、ガ
イド31を短縮するか、またはその他の変更を加えるこ
とができることに留意されたい。全サイズのアダプタ・
カードを使用して本発明について説明するが、本発明の
範囲では半分のサイズのカードが考慮されることに留意
されたい。ガイド31は、取付け手段30によってアダ
プタ・カード5の両端に付加された端部29および27
を含んでいる。
【0010】図4に詳しく示すように、カード・ガイド
31をスライド式に受け入れるガイド・レール28が設
けられている。ガイド・レール28の内部表面にぴった
り合うかまたは適合する少なくとも1つの肩部33が含
まれている(図4を参照)。ガイド・レール28には、
ピボット点24および25がしっかり付加されている。
ピボット25は、レバー部26を有する細長い力伝達部
材20にも回転式に取り付けられている。第2の力伝達
部材21は、一方の端ではピボット24に回転式に取り
付けられ、もう一方の端付近では部材20にしっかり付
加されたピボット23に回転式に取り付けられている。
レバー部26の反対側にある力伝達部材20の端部は、
図5に示すようにフレーム部材43などにしっかり付加
されたピボット部材42に回転式に取り付けられてい
る。ただし、ピボット点22および23は、カード5を
持ち上げたり下げたりすることによってカード5をコネ
クタ4から取り外したり、コネクタ4に挿入したときに
(図2の矢印が示す方向に)何らかのスライド運動を行
うように、そこに挿入されたピボット・ピンの周りのス
ロット付き開口部も含むことに留意されたい。
【0011】導電タブ9が図1のインライン・コネクタ
4にぴったりはまり、接続するように、図2の配置は矢
印Cが示すようにカード5の下方向垂直運動を提供する
ことが分かるだろう。当業者は、カード5がピボットに
直接取り付けられている場合、タブ9が傾斜してコネク
タ4に接近し、カード5をコネクタ4に挿入して信頼性
の高い機械的かつ電気的接続を行うのが極めて難しくな
ることを理解するだろう。
【0012】図2に示すように、アダプタ・カードを解
除するためにレバー26で上方向に力が加わると、ピボ
ット25で上方向垂直力が発生し、それが電気接続タブ
9と位置合せされた点でカード5に直接伝達される。同
時に、上方向の力は、ピボット23により部材21に印
加され、ピボット点24でカード5に伝達される。これ
により、カード5にわずかな上方向の力が加わり、カー
ドをコネクタ4から取り外すときにカードが回転するの
を防止し、電気的かつ機械的にカードがコネクタから容
易に解除されるようにする。カード5をシステム・ボー
ド1上のコネクタ4に挿入する必要がある場合は、プロ
セスが逆になる。ガイド31は、カード5に取り付けら
れた後、ガイド・レール28にスライド挿入される。次
に、レバー26に下方向の力が印加され、この力がピボ
ット25によりカード5に伝達される。ピボット25が
タブ9と位置合せされているので、この下方向の力は接
続タブに垂直に直接加わる。また、レバー26上の下方
向の力によって、ピボット23を介して部材21に下方
向の力が加わる。この力は、アダプタ・カードがコネク
タ4に接近したときにアダプタ・カードが回転するのを
防止するため、ピボット24によりカード5にわずかな
下方向の力として伝達される。したがって、前述のよう
に、図2の装置により、コンピュータ・システム・ボー
ド上に存在するインライン・コネクタにアダプタ・カー
ドを垂直に挿入し、そこから取り外す方法が分かるだろ
う。上記の説明は本発明の好ましい一実施例であるが、
当業者は、カム・ギヤなどのその他の機構を使用して、
アダプタ・カードのコネクタへの垂直挿入とコネクタか
らの取外しを可能にするような装置を提供する方法を容
易に理解するだろう。
【0013】図3は、図2の線A−Aに沿って示すカー
ド5の図であり、端部27および29とともにガイド部
材31がねじ30などの取付け手段を使用してカードに
取り付けられている状態を示している。図4は、図2の
線B−Bに沿って示すカード5の側面図である。この図
は、その端部29と取付け手段30とともにガイド部材
31を示したものである。上記の通り、ガイド部材31
の肩部33は、カード5がそれに取り付けられたガイド
31をスライド可能な配置でガイド・レール28に縦に
挿入できるように、ガイド・レール28の内部表面35
に適合している。図4にはピボット手段25も示されて
いるが、これは図2に示すのと同じ方法でガイド・レー
ル28に付加されている。
【0014】図5は、スロット41がそこに形成された
カバー40を有するコンピュータ・システムの斜視図で
ある。図5には、2つのスロット41が示されている。
しかし、所望の数のアダプタ・カード5を収容するため
にカバー40には任意の数のスロット41を形成できる
ものとする。コンピュータ内部のシステム・ボード1
(または他の適当なサポート)に付加されたフレーム部
材43が示されている。また、フレーム部材43上に配
置され、図2のガイド手段のピボット点22に回転式に
取り付けられているピボット手段42も示されている。
また、ピボット点45は、図2のガイド手段に追加の機
械的サポートを提供するためにフレーム部材43または
他の適当なサポートに回転式に取り付けられている。図
5のカバー40が図1のシステム・ボード1を取り囲む
ように配置されている場合、スロット41はコネクタ4
および4aと位置合せされた関係になる。ガイド・レー
ル28はフレーム部材43にスライド挿入され、ピボッ
ト点22はピボット42に接続されるのに対し、ピボッ
ト点45はピボット46に接続される。このようにし
て、図2のカード・ガイド手段もシステム・ボード1の
コネクタ4および4aと位置合せされる。次に、ガイド
部材31がアダプタ・カード5に取り付けられ、アセン
ブリ全体がガイド・レール28にスライド挿入され、レ
バー26がスロット41から外側に伸びる。コンピュー
タ・システム内にアダプタ・カード5を電気的に取り付
けるためには、アダプタ・カード5の導電タブ9が、た
とえば、コネクタ4のランド10と電気接続されるま
で、レバー26に下方向の圧力が加えられる。カードを
取り外すか、またはあるアダプタ・カードを他のものに
交換するためには、プロセスが逆になる。すなわち、レ
バー26には上方向の圧力が加えられ、カード5のタブ
9がコネクタ4のランド10から切断される。次に、ガ
イド・レール31を備えたカード5がガイド・レール2
8からスライドして外され、新しいカードまたは交換用
カードがガイド・レール28にスライド挿入される。こ
の場合も、新しいカードを機械的かつ電気的に取り付け
るために、下方向の圧力がレバー26に加えられる。
【0015】コンピュータ・カバー40を外す必要もな
く、ファックス/モデム、グラフィック・アクセレレー
タなどのアダプタ・カード5をコンピュータ・システム
に取り付けるかまたはコンピュータ・システムで交換で
きるようにすることにより、本発明によってユーザがコ
ンピュータのハードウェア構成を変更できることは、容
易に分かるだろう。コンピュータ・システム・ユーザ
は、CPU2からコネクタ4を電気的に分離するかまた
は切断し、次に、アダプタ・カード5の取付け、取外
し、または交換を行うだけでよい。パーソナル・コンピ
ュータにおける電気的分離とは、カードを取り付けるか
または取り外す間に単にマシンの電源をオフにすること
を含む場合もある。より高度なシステムでは、残りのコ
ネクタを電気的に切断せずに、新しいカードまたは異な
るカードを取り付ける特定のコネクタまたは複数コネク
タのグループの分離を試みることが必要になる場合もあ
る。
【0016】多くのパーソナル・コンピュータ、ワーク
ステーション、サーバでは、入出力サブシステムの修理
またはアップグレード・アクションの通常の手順は、電
源をオフにし、入出力領域(コネクタ4)にアクセスす
るためにカバーを開き、不良またはアップグレード対象
のアダプタ・カードの取付け、取外し、または交換を行
うことである。次に、カバーを元に戻し、電源を復旧す
る。サーバ・システムでは、このようにして入出力修理
およびアップグレード・アクションを処理することがま
すます受け入れがたいものになっている。というのは、
多くのユーザが複雑なネットワークを越えてサーバに拘
束されており、修理/アップグレード・アクション中に
遮断されるからである。
【0017】現在、一部のメインフレームやハイエンド
・サーバ・マシンでは、冗長システムを用意することに
よって、高価なオンライン・メンテナンス機能を提供し
ている。本発明では、システムおよび入出力サブシステ
ムの他の部分が処理動作を続行できるようにしながら、
コンピュータのカバーを開けずに入出力カードを交換で
きるようにする入出力サブシステムのオンライン・メン
テナンスを実行するための比較的安価かつ単純な方法を
提供する。
【0018】図6は、コンピュータ・システムの入出力
サブシステム内の様々な構成要素用の電気接続を示して
いる。CPU2とメモリ3は、IBMから販売されてい
る60Xまたは6XXバスなどのシステム・バス100
に接続されたものとして示されている。ホスト・ブリッ
ジ・チップ113が示されているが、これは、PCIバ
スなどの入出力用のメザニン・バス102とシステム・
バス100との間のインタフェースを提供する。図6は
PCIバスとPCIホスト・ブリッジ・チップを示して
いるが、本発明では、いかなる入出力バスの使用も考慮
している。PCIブリッジ・チップ113は、割込み処
理、メッセージの引渡し、アービトレーション、スヌー
プなどを含み、システム・バス100とバス102との
間でバス・プロトコルを変換できるようにする論理およ
び機能性を含む。
【0019】メザニン・バス102は、少なくとも1つ
のPCI間ブリッジ・チップ104に接続されている。
このチップは、コネクタ4および追加の論理を含む実際
のアダプタ・スロット106と入出力バスとの間のイン
タフェースを提供する。スロット106は入出力装置1
08を受け入れ、この装置はデバイス5上に存在する可
能性がある。PCIのアーキテクチャおよび仕様は、PC
I Special Interest Group (PCI-SIG)より入手でき、参
照により本明細書に組み込まれる。本発明は、参照番号
105で示す追加の制御論理回路を追加するが、PCI
アーキテクチャの変更は必要としない。ただし、図6に
示すように、多くのコンピュータ・システムが複数の入
出力スロットを含むことに留意されたい。追加のスロッ
トは、本発明の構成要素の記述に使用する参照番号に
「a」という文字を追加することによって表す。
【0020】前述のように、システム・ユーザがアダプ
タ・カードの取付け、取外し、または交換を行うために
は、そのスロットまたは複数スロットのバンクにおける
すべての処理活動が停止するように、コネクタまたはス
ロット(複数スロットのバンクを含む)を分離しなけれ
ばならない。すべての活動を停止させる方法の1つは、
マシンをオフにするだけである。しかし、これは、多く
のクライアント・コンピュータを相互接続するサーバ・
タイプのマシンでは実用的ではない場合が多い。特にフ
ォールト・トレラントまたは高可用性システムでは、こ
れが該当する。また、マルチタスク・システムが使用可
能な場合には、特に重要な活動が行われるときに単一コ
ンピュータの電源をオフにすることが望ましくない場合
がある。たとえば、ファックス/モデムを備えたパーソ
ナル・コンピュータでは、送信を受信するために電源を
オンにしたままにする必要がある。この場合、残りのス
ロットを活動状態にして、特定の入出力スロット(複数
も可)を非活動化することができれば、有利なはずであ
る。本発明により、ユーザは、システムがサーバかパー
ソナル・コンピュータかにかかわらず、システムの電源
をオフにする必要もなく特定のアダプタ・カードを交換
することができる。
【0021】図7は、本発明の構成要素を示している
が、この構成要素は、システム全体の電源をオフにする
必要もなく、アダプタ・カードの取付け、取外し、また
は交換を可能にするものである。入出力バス102、た
とえば、PCIバスは、PCI間ブリッジ・チップ10
4に接続され、追加の制御論理回路105と組み合わせ
て、単一PCIスロット106の制御に使用する。ただ
し、スロット106は、2次バス103とチップ104
との間の電気的かつ機械的機能インタフェース全体であ
ると見なされることに留意されたい。このインタフェー
スは、後述するように電気機械感知装置107など、様
々な他の電気および機械構成要素とともに、一部分とし
てコネクタ4を含む。1組の制御論理回路105ととも
に1つの変更済みブリッジ・チップ104を使用して、
1つのスロット106を制御する。当然のことながら、
このような要素の組合せは、コンピュータ・システム内
に存在する入出力スロットの数に応じて複製される。こ
のため、入出力カードの取外し、交換、または取付けを
行うときに、RST#信号によって各スロットを選択的
にリセットし、そのスロットから電力を取り除くことが
できる。
【0022】プレーナまたはシステム・ボード1は、各
入出力コネクタ4用のブリッジ・チップ104を含むよ
うに変更される。次に、ブリッジ・チップ104を使用
して、2次バス103とスロット106を入出力バス1
02の残りの部分から分離する。スロットが空である場
合、そのスロットには電力が一切印加されていないの
で、新しいカードをそこに取り付けることができる。入
出力カードを取り外す場合、取外し中にアダプタが活動
状態にならないように保証するため、まず、そのカード
をリセットする。ブリッジ・チップ104は、スロット
106をオフライン化し、追加の制御論理回路によっ
て、リセット時にそのカードから電力を取り除く。次
に、前述のように、カードが機械的に取り外される。ま
た、スロットに電力が印加されている間に入出力カード
の取外しが行われるのを防止するように入出力カードを
インタロックするために、ソレノイド・スイッチなどの
電気機械手段を設けることもできる。
【0023】入出力カードの挿入の場合、カードがマシ
ンに挿入される(前述のガイド手段などを使用すること
ができる)。カードが所定の位置に納まると、システム
は、新しい入出力アダプタ・カードを識別し初期設定す
るように構成される。新たに取り付けたカードが構成さ
れるまで、カード・スロット106は入出力バス102
から電気的に分離される。カードが構成されると、プレ
ーナ上の論理回路がコネクタ4の電力ピンへの電力のラ
ンプアップに備える。アップグレード/修理アクション
中は、再構成する入出力スロットだけが影響を受けるは
ずなので、システムと入出力サブシステムの他の部分は
動作中のままになる。ただし、上記の動作では、PCI
(または他の入出力バス)の仕様またはアーキテクチャ
そのものの変更は必要ないことに留意されたい。すなわ
ち、本発明は、入出力バス・アーキテクチャを変更せず
に完全に実施することができる。
【0024】図7に示す制御論理回路105は、スロッ
ト・リセット検出器110と、ブリッジ制御論理回路1
12と、電力制御論理回路114と、LEDドライバ1
16とを含む。また、LEDドライバ116によって制
御される発光ダイオード(LED)118も示されてい
る。
【0025】個々のスロットを分離するものとして図7
の好ましい実施例について説明してきたが、本発明の範
囲は、複数の任意の数のスロット、すなわち、他のスロ
ットまたは複数スロットのバンクからの複数スロットの
バンクの分離を含む。複数スロットのバンクを分離する
ことにより、単一ブリッジ・チップ104を使用してそ
のバンクを制御することができ、その結果、各スロット
106ごとにブリッジ・チップ104を1つずつ用意す
る必要が解消される。当然のことながら、単一チップが
複数のスロットを制御するとフレキシビリティがある程
度失われるが、しかしシステム・コストを低減し、他の
システム機能を非活動化せずにカードを変更できるよう
にすることが必要な一部のアプリケーション・システム
では、これが望ましい場合もある。
【0026】図8は、本発明の電気的動作を説明するた
めに図7とともに使用する流れ図である。
【0027】第1のケースでは、取り外すべき既存のア
ダプタ・カード5がPCI(またはその他の入出力プロ
トコル)106に存在すると想定される。図8を参照す
ると、ステップ1でユーザは、アダプタ・カードの取外
し、交換、または追加を行うことによってシステム・ハ
ードウェア構成を変更するためのプロセスを開始する
(一連のキーストローク、マウスによるアイコンの選択
などによる)。次にプロセスは、単一ブリッジ・チップ
104によって制御される単一アダプタ・スロットまた
は複数スロットのバンクがシステム内に存在するかどう
かを判定する。複数スロットのバンクが存在する場合、
この方法は図13のステップ17(後述する)に移行す
る。ステップ1aで、単一スロットが存在すると判定さ
れた場合は、ステップ2により、スロット106にカー
ドが存在するかどうかを判定する。電気機械感知装置1
07は、論理回路114にカード存在信号を提供する。
この例では、カードを取り外すものを想定しているの
で、プロセスはカードがスロット106に存在すると判
定することになる。ユーザは、キーボード、マウス、ス
タイラス、またはその他の入出力装置により、コンピュ
ータ・システムにコマンドなどを入力することによって
このプロセスを開始する。このようなコマンドでは、ユ
ーザが所与の情報、たとえば、複数のスロット106の
うちのどれを再構成すべきかなどを提供しなければなら
ない場合もある。
【0028】ステップ10では、ディスク・オペレーテ
ィング・システム(DOS)、OS/2、AIXなど
(OS/2とAIXはIBMの商標である)などのオペ
レーティング・システムにより、アダプタ5とコンピュ
ータ・システムの残りの部分との間のすべてのデータ処
理活動が停止される。その後、ブリッジ・チップ104
から入出力スロット106にリセット信号RST#が出
される(ステップ11)。このRST#信号はリセット
検出器110にも送られ、次にその検出器が制御信号を
ブリッジ制御論理回路112に伝送する。ステップ12
では、入出力ブリッジ・チップ104が1次入出力バス
102から2次バス103を切断する。この切断は、ブ
リッジ制御論理回路112から入出力ブリッジ・チップ
104に送られる制御信号によって実施される。RST
#信号の検出に基づいて、スロット・リセット検出器1
10は電力制御論理回路114にも制御信号を送り、ス
ロット106への電力を徐々に低減(ランプ・ダウン)
しなければならないことを示す。次に、ステップ13で
電力が低下する。
【0029】図11は、スロット106への電力をラン
プ・アップまたはランプ・ダウンするために電力制御論
理回路114が使用可能な回路の一実施例を示してい
る。電圧Vddは、レール121上に示され、N型トラ
ンジスタ120、122、121、123、124に接
続されている(N型トランジスタは、電圧、すなわち、
論理1がそのゲートに印加されたときに電気を伝導す
る)。これらのデバイスはそれぞれ異なるしきい電圧を
有するので、それぞれのトランジスタでの電圧降下が異
なるものになるように、オンになったときに異なる抵抗
を提示する。図11の実施例では、トランジスタ120
の電圧降下が大きくなり、トランジスタ122、12
3、124のそれぞれの電圧降下が徐々に小さくなるよ
うに、デバイスのサイズが決定されている。たとえば、
Vddが3.3ボルトであると想定され、トランジスタ
120が2.5ボルトの電圧降下を有する場合、t=1
ではレール125上の電圧がVdd−2.5=0.8ボ
ルトになる。1.5ボルトのしきい電圧降下を示すよう
にトランジスタ122のサイズが決まっている場合、t
=2ではレール125上の電圧が3.3−1.5=1.
8ボルトになる。この例の場合、トランジスタ123の
しきい電圧が0.5ボルトであると想定すると、t=3
ではレール125上の電圧が3.3−0.5=2.8ボ
ルトになる。また、t=4でレール125上の電圧が
3.3−0=3.3ボルトすなわちVddになるよう
に、トランジスタ124のしきい電圧がほぼ0.0であ
ると想定される。したがって、時間t=1からt=4の
間にスロット106に接続されたレール125上の電圧
が0.8ボルトから3.3ボルトにどのように徐々に増
加(ランプ・アップ)するかが分かるだろう。スロット
106への電力を徐々に低下(ランプ・ダウン)するこ
とが必要な場合、プロセスはほぼ逆になる。定常状態条
件では、トランジスタ124は、Vddがスロット10
6に提供されるようにオンになる。レール125上の電
圧を低下させるため、そのゲートから電圧を取り除くこ
とによってトランジスタ124がオフになり、トランジ
スタ123がオンになる。その結果、デバイス123か
らのしきい電圧が0.5ボルトになるため、レール12
5上では2.8ボルトになる。次の期間中、トランジス
タ123はオフになり、デバイス122はオンになるの
で、デバイス122のしきい電圧が1.5ボルトになる
ため、レール125上には1.8ボルトの電圧が存在す
ることになる。次に、トランジスタ122がオフにな
り、トランジスタ120がオンになるので、トランジス
タ120のしきい電圧が2.5ボルトになるため、レー
ル125上には0.8ボルトの電圧が生じる。当然のこ
とながら、クロック生成回路によってt=1からt=4
までのパルスがどのように変化するか、ならびに、電力
なし(電圧=0)から電力完全(電圧=Vdd)までの
間にスロット106で勾配のより緩やかな遷移を行うた
めに追加のトランジスタを追加できることを、当業者は
容易に理解するだろう。
【0030】さらに、電力制御論理回路114は、スロ
ット106が実際に入出力バス102から切断されたこ
とを示す確認信号をブリッジ制御論理回路112から受
け取る。これにより、活動状態で結合された入出力カー
ドを取り外すことによって発生しそうな損傷、データ損
失などが防止される。また、スロット106から電力制
御論理回路114には、カード5が実際にスロット10
6に存在することを確認するカード存在信号も提供され
る。スロット106から電力が取り除かれると、電力制
御論理回路114からLEDドライバ116に信号が送
られ、次にこのドライバがLED118を励起し、それ
により、スロットがバスから切断され、スロットが励起
解除され、上記の機械式ガイド手段など(図1〜5)に
よってカードを取り外すことができる(ステップ15)
ことをユーザに示す。好ましい実施例では、リレー、ソ
レノイド・スイッチなどの電気機械装置107を使用
し、カードの電力が低下しない限り、カードが取り外さ
れることを物理的に防止することができる。ステップ1
5に続き、入出力スロットからアダプタ・カードを取り
外すプロセスはステップ16で終了する。ただし、制御
論理回路105の実施態様は多種多様であり、本発明は
特定の実施態様によって限定されないことを当業者が理
解することに留意されたい。たとえば、外部制御論理回
路105のどの部分もPCI間ブリッジ・チップ104
に組み込むことができるが、ブリッジ・チップ104上
に追加のピンが必要になるはずである。
【0031】第2の例では、コンピュータ・システム上
のスロットにカードを挿入すると想定される。このケー
スでは、挿入すべきカードは新品であるか、またはステ
ップ10〜15に従ってすでに取り外された別のアダプ
タ・カードの交換品になる。したがって、ステップ2で
は、スロット106のコネクタ4にアダプタ・カード5
が存在しないと判定される。次にステップ3では、LE
D118が示すようにスロット106から電力が取り除
かれたことと、スロットに電力が印加されている場合に
は電気機械装置107により新しいカード5をスロット
に物理的に挿入できないことが確認される。ステップ4
では、図1〜5に関連して説明したように本発明の機械
装置を使用して、スロット106のコネクタ4に新しい
アダプタ・カード5が挿入される。次に電気機械装置1
07は、電力制御論理回路114にカード存在信号を出
し、それにより、新しいカード5がスロット106に物
理的に存在することを示す(ステップ5)。論理回路1
14がカード存在信号を受け取ると、図11に従って前
述したような装置を使用して、スロット電力およびスロ
ット・アース電力分配線により、スロット106に電力
を徐々に印加できることを意味する(ステップ6)。ス
ロット106に電力が増加されると、電力制御論理回路
114はLEDドライバ116に制御信号を提供し、そ
れにより、LEDがオフになり、スロットに電力が印加
され、カードを取り外すことができないことをユーザに
示す。ステップ7では、電力制御論理回路がブリッジ制
御回路112に接続バス制御信号を出し、次にこの回路
が入出力ブリッジ・チップ104にイネーブル信号を送
り、その結果、2次バス103が1次入出力バス102
に結合される。次に、ステップ8でブリッジ・チップ1
04からのRST#信号が非活動化される。この時点
で、新しいカード5はコネクタ4に物理的に存在し、ス
ロット106に電力が印加され、2次バス103は入出
力バス102に接続されている。残っていることは、ど
のタイプのカードが取り付けられ、それがどのタイプの
プロトコルを使用するかの判定など、コンピュータ・シ
ステム内のソフトウェアが構成活動を開始することであ
る(ステップ9)。構成ソフトウェアは、このような判
定を行うためにアダプタ・カード上の読取り専用メモリ
(ROM)を読み取ることができる。構成に続いて、新
しいカードを使用したデータ処理活動を開始することが
できる。これで取付けプロセスは完了し、図8の方法は
ステップ10で終了する。
【0032】図12は、複数スロット106のバンクが
単一ブリッジ・チップ104によって制御される、本発
明の一実施例のブロック図を示している。これらのスロ
ットは、1つのグループとして制御、すなわち、非活動
化することができる。図12の参照番号が図7で使用す
る同一番号に対応する場合、同じ構成要素を表すことを
意味し、もう一度説明しないものとする。リセット検出
器110はリセット信号RST#に基づいてアービタ1
30に制御信号を提供することが分かるだろう。このア
ービタは、2次バス103の所有権に関する要求を受け
取り、そのバスに最近アクセスしていないデバイスなど
の1組の所定の基準に基づいてブリッジ・チップ104
またはスロット106の1つにバスを授与する、標準的
な論理デバイスである。アービタ130は、ブリッジ・
チップ104に接続されたものとして示されているが、
ブリッジ・チップにより各スロット106にも接続され
ている。また、ブリッジ・チップ104によりスロット
106からアービタ130にバス要求信号を伝送する要
求線131も示されている。当業者は、バス103が、
アービトレーション・サイクル後にそのバスが特定のス
ロットに授与されていることを特定のスロットに示すア
ービトレーション授与線など、他の多くの制御信号線を
含むことを理解するだろう。データおよびアドレス信号
を収容する他の線もバス103に含まれているが、これ
らは図12には図示しない。要求線131内には1組の
インライン・スイッチ133が配置され、スイッチ制御
論理回路117によって制御される。ただし、バンク内
に存在する各スロットごとにスイッチが1組ずつ存在す
ることに留意されたい。ブリッジ・チップ104からの
RST#信号を検出すると、スイッチ制御論理回路11
7はアービタ130に制御信号を送り、それがブリッジ
・チップ104にバス103の所有権を授与する。これ
により、複数スロットのバンクを非活動化するプロセス
が開始されると、そのバンク内のどのスロット106も
バス103の所有権を持てなくなる。同時に、アービタ
130に送られる信号により、スイッチ制御論理回路1
17はスイッチ133にもスイッチを開く制御信号を送
り、その結果、スロット106内のどのカードもバス1
03へのアクセスを要求できなくなり、アービトレーシ
ョン・サイクルが開始される。アービトレーションが使
用禁止になると、図7および図8に関連して前述したの
と同じ技法により、複数スロット106のバンクを非活
動化することができる。
【0033】次に、図12に関連して図13の流れ図に
ついて説明する。図8のステップ1aで複数スロットの
バンクがコンピュータ・システム内に存在すると判定さ
れた場合、図13のステップ17では、取外しまたは交
換を行うカード(複数も可)がバンク内のスロットの1
つであるかどうかを判定する。そうである場合、ステッ
プ18でスロット・リセット検出器110がスイッチ制
御論理回路117に制御信号を提供し、次にその論理回
路がアービタ130に信号を提供する。ステップ19で
はアービタ130がバス103の所有権をブリッジ・チ
ップ104に授与する。次に、スイッチ133を開くこ
とにより、スイッチ制御論理回路117がバス要求信号
線131を使用禁止にする(ステップ20)。ステップ
21で構成ソフトウェアはスロット106内のカードへ
の活動を停止する。次にブリッジ・チップ104はステ
ップ22で入出力バス102から2次バス103を切断
する。次に、ステップ23で複数スロットのバンクへの
電力が徐々に低下する。ステップ24でLED118
は、スロット106から電力が取り除かれた時期を示
し、カード(複数も可)が取り外せるようになる(ステ
ップ25)。
【0034】ステップ17で、バンク内のスロット10
6の1つにカードを挿入すると判定された場合、バンク
内のスロットが非活動状態になる(ステップ26)。と
いうのは、ステップ18〜25に従ってそのバンクが前
に非活動化されているからである。ステップ27では、
コンピュータ・システムに追加すべきカード(複数も
可)5がコネクタ(複数も可)4に挿入される。次に電
磁スイッチ(複数も可)107がカード(複数も可)の
存在を示す(ステップ28)。次にステップ29で複数
スロットのバンクへの電力が徐々に増加し、ブリッジ・
チップ104によってバス103を入出力バス102に
結合できるという表示が行われる。ステップ30では、
ブリッジ・チップ104が2次バス103を入出力バス
102に再接続する。ステップ31でリセット信号が非
活動化される。これにより、スイッチ133を閉じるこ
とによって、スイッチ制御論理回路がバス103のアー
ビトレーションを可能にする(ステップ32)。複数ス
ロットのバンク内の各カード用の構成ソフトウェアによ
り、複数スロットのバンク内のカード(複数も可)5が
データ処理活動を開始できるようになる(ステップ3
3)。ステップ25および33の両方に続いて、プロセ
スはステップ16(図8)に移行し、終了する。
【0035】PCIバスなど、特定のタイプの入出力バ
スを有するコンピュータ・システムでは、(場合によっ
ては)入出力バス上で発生するエラーを報告し、このよ
うなエラーからの回復に対応することが不可能である。
たとえば、システム・エラー信号(SERR#)によっ
てアドレス・パリティ・エラーが報告される。この信号
は、中央演算処理装置へのマスク不能割込み(NMI)
信号を生成する。多くのシステムではNMIは回復不能
であり、NMIによって報告されたエラーによってコン
ピュータ・システムが再始動されるので、問題が発生す
る。すなわち、今日の複雑なプロセッサには様々なパイ
プライン・ステージがあるため、NMI用のエラー回復
が一切ない。したがって、コンピュータ・システムはエ
ラー条件を解決するためにその初期プログラム・ロード
(IPL)を完了しなければならない。これは、システ
ムの再IPLによってサーバに接続されたすべてのクラ
イアント・システムも再始動されるようなサーバなどの
コンピュータ・システムでは望ましくないことである。
【0036】さらに、様々なスロットに複数のカードを
有するパーソナル・コンピュータなどのクライアント・
システムでは、カードまたはデバイスの1つがNMIを
出した場合、悪影響を受けることになる。すなわち、単
一カードがCPUにNMIを出した場合、唯一頼りにな
るのはCPUが再IPLを行うことである。これは、N
MIが出される原因となるエラー条件をどのカードが持
っているかをCPUが識別できないからである。
【0037】さらに、デバイス(すなわち、カード)に
よってSERR#信号が励起され、サービス不能な内部
エラー条件が存在することを示す場合もある。通常、様
々なデバイスのSERR#信号は他のSERR#信号と
のORがまとめて取られるので、CPUは、どのデバイ
スがその信号を開始したか、なぜその信号が出された
か、または複数のデバイスがSERR#信号を出してい
るかどうかなどを把握していない。回復不能エラーの他
の例としては、今後の完了のためにプロセッサが実行中
の動作がスレーブ装置(アダプタ・カード)によって通
知された場合に発生するほぼすべてのエラーが挙げられ
る。このタイプのエラーは、PCIメモリ・アドレス空
間向けの、多くの別のタイプの市販マイクロプロセッサ
とともに使用されるすべてのプログラム式入出力(PI
O)動作(ロード命令とストア命令による)に適用され
る。したがって、システム・ソフトウェアは入出力装
置、たとえば、PCI装置にデータを書き込むことがで
き、その動作はプロセッサ・バスで正常に完了するの
で、ソフトウェア・プログラムが動作を続行する。その
後、PCIバス上で発生するエラーは遅すぎるため、ソ
フトウェアで問題を訂正することができなくなる。
【0038】本発明の他の好ましい実施例では、PCI
バス(または他の同様の入出力バス)上のエラー回復を
可能にするために、入出力プロトコルをわずかに変更す
ることができる。このエラー回復を可能にするため、C
PUがエラーのタイプとどのカードがエラー信号を出し
ているかを判定できるように、各スロットを分離しなけ
ればならない。
【0039】図9は、本発明のエラー回復態様の好まし
い実施例のブロック図である。ただし、図9に番号で示
されている構成要素は図7および図12で使用する同一
構成要素に対応するので、ここでは説明しないことに留
意されたい。図9のシステム・バス100は、CPU2
とメモリ3をブリッジ・チップ113に接続している。
CPU2は、AIXまたはOS/2オペレーティング・
システムなどのソフトウェア・オペレーティング・シス
テム200を有する。また、CPU2にはデバイス・ド
ライバ201が導入されているが、これはオペレーティ
ング・システム200に含まれる場合もある。このよう
なデバイス・ドライバ201は、コンピュータ・システ
ムのスロット106のカード5を含む、様々な構成要素
を制御するために使用する。デバイス・ドライバ201
は、このような機能および通信、エラー検出と訂正など
を実行する。入出力ホスト・ブリッジ・チップ113は
システム・バス100に接続され、入出力バス102に
も接続される。次に、ブリッジ・チップ104は入出力
バス102とスロット106に接続される。現在説明し
ている実施例では、状況情報を格納するために少なくと
も1つの追加レジスタ203がブリッジ・チップ104
に追加されている。さらに、信号線103を使用してリ
セット信号RST#をスロット106に伝送することが
図9から分かるだろう。また、信号線204はスロット
106からブリッジ・チップ104にSERR#信号を
提供する。図9の構成要素の残りは図7に示すものと同
一なので、それに従って説明する。
【0040】エラー回復方式にとって重要なことは、変
更済みブリッジ・チップ104により各入出力装置、す
なわち、各入出力スロット106を1次入出力バス10
2から分離することである。この好ましい実施例では、
前述のPCI間実施態様の変更が必要である。より具体
的には、スロット106内のカードのうちの特定の1つ
にエラー条件が存在する場合に設定される回復モード構
成ビットが追加される。モード構成ビットが設定される
と、前述のようにシステムに対する損害が発生しないよ
うに装置5をそのリセット状態に維持するため、RST
#信号が活動化され、保持される。さらに、システムに
外部割込みを通知するためにレジスタ203の状況ビッ
トが設定される。また、構成ビットが設定されると、ス
トア時にCPUからデータを投げ捨て、ロード操作時に
すべての論理1の値を返すことにより、CPU2から装
置への追加のロードまたはストアがすべて無視される。
最後に、装置5からの直接メモリ・アクセス(DMA)
データは破棄され、DMAデータを伝えそうな動作はす
べて打ち切られる。
【0041】デバイス・ドライバ201は、動作がコー
ド内の特定のポイント(実行中の命令)で正しく完了す
ることを確認するために、ブリッジ・チップ104また
はデバイスそのもので入出力動作の状況を検査する責任
を負っている。レジスタ203は、たとえば、論理0で
あれば、エラーが一切存在せず、デバイス・ドライバが
入出力装置から情報を読み取ることができることを示す
ような何らかのビットを含むことになる。しかし、レジ
スタ203の状況ビットが論理1を含み、ブリッジ・チ
ップ104が装置5をリセット状態(RST#が活動状
態)に保持している場合、デバイス・ドライバが装置か
ら情報を読み取ると、すべてのビットが論理1に設定さ
れ、その結果、動作が正しく完了していないことをドラ
イバに示すことになる。ただし、1次入出力バス102
上のエラーはやはりマシン・チェックを生成し、システ
ムの再IPLの原因となることに留意されたい。しか
し、本発明の分離方法を使用することにより、1次入出
力バス102はいずれのスロット106もそれに直接接
続していないので、したがって、その信頼性が大幅に増
加している。
【0042】さらに、装置5のうち特定のものだけがこ
の「リセット」タイプのエラー回復に関与するように、
コンピュータ・システムを設計することができる。この
実施例のエラー回復がオンになっていない場合、エラー
は装置から1次入出力バス102に伝えられ、その結
果、おそらくマシン・チェックが生成されることにな
る。本発明のエラー回復方式を利用するために、システ
ム内のデータの大部分を処理する重要装置(たとえば、
サーバ・システムのDASDおよびLANアダプタ)だ
けを変更すればよいように設計することは、所与のシス
テムにとっては受け入れられることであろう。このた
め、コンピュータ・システム全体を変更する必要もな
く、システムの信頼性を大幅に増加することができる。
【0043】図10は、本発明のエラー回復態様によっ
て実施されるステップを示す流れ図である。ステップ1
ではプロセスが開始され、ステップ2ではデバイス・ド
ライバが制御中の装置へのロード/ストア動作を実行す
る。ただし、本発明では、一連のまたは関連グループの
ロード/ストア動作が実施されるような状況も扱うこと
に留意されたい。次にステップ3では、コンピュータ・
システム内のアダプタ・カード上の複数の装置の1つか
らのSERR#信号が存在するかどうかを判定する。存
在する場合、ステップ4ではSERR#を槌する装置に
対してリセット信号RST#が活動化され(ブリッジ・
チップ104による)、装置5をそのリセット状態に
し、システムに対する損害を回避すると同時に、装置を
システムに結合された状態に維持する。すなわち、SE
RR#信号を出したカードを有するスロット106は、
前述のようにリセットされる(データ処理活動が停止す
る)。ステップ5では、レジスタ203の状況ビット
が、たとえば、論理1に設定される。次にステップ6で
は、図9に示す制御ハードウェアがすべてのロード動作
とストア動作を無視し、保留中の直接メモリ・アクセス
(DMA)動作を打ち切る。ステップ3でSERR#信
号が一切存在していないと判定された場合、本発明のプ
ロセスはステップ7に移行し、そこで、実施中の一連の
命令に追加のロードおよびストア動作が存在するかどう
かが判定される。追加のロードまたはストアあるいはそ
の両方が存在する場合、プロセスはステップ2にループ
・バックし、そこでデバイス・ドライバがロード/スト
アを実施する。追加のロード/ストア動作が一切存在し
ない場合、ステップ8でデバイス・ドライバがブリッジ
・チップ104のレジスタ203の状況ビットを読み取
る。次にステップ9では、エラー条件が発生しているか
どうかを判定する。ステップ5で、SERR#エラーが
発生していることを示すために状況ビットが設定されて
いない場合、ロード/ストア動作は完了したものと見な
される(ステップ10)。しかし、ステップ5で、SE
RR#信号の存在を示すために状況ビットが設定されて
いる場合、ステップ11でブリッジ・チップ104が
(再初期設定により)再構成される。通常、デバイス・
ドライバは、デバイスを再初期設定することにより、カ
ードをリセットする。しかし、本発明では、デバイス・
ドライバが、それ自体とデバイスとの間の情報転送を試
みているバス・マスタ・デバイスに対し、転送動作をも
う一度試みるように指示すると思われる再試行動作も試
みることができるものとする。エラー条件が取り除かれ
ていれば、ロード/ストア動作を正しく実施することが
できる。さらに、ステップ11で、デバイス・ドライバ
は、デバイス内のエラー条件を訂正しようと試みる1つ
または複数のサービス・ルーチンを呼び出すことができ
る。このようなエラー・ルーチンは、パワー・オン自己
検査(post)コードなどの一部としてコンピュータ
の読取り専用メモリ(ROM)内に常駐することができ
る。しかし、デバイス・ドライバがエラー条件を有する
デバイスを再初期設定することが、典型的な状況であ
る。本発明によれば、実際にエラー・コードを生成する
特定のデバイスについてのみ、再IPLが行われる。コ
ンピュータ・システム内の複数のカード上の残りのデバ
イスは、通常のデータ処理活動を続行することになる。
したがって、本発明により、コンピュータ・システム
が、異なるスロットの他のカード5上の他のデバイスの
動作に影響せずに、どのように特定の入出力スロット1
06内の単一デバイスを分離できるかが分かるだろう。
【0044】ステップ12では、エラー・コードを生成
する特定のデバイスがデバイス・ドライバによって再初
期設定される。次にデバイス・ドライバは、通常のデー
タ処理活動のためのチェックポイント状態に設定される
(ステップ13)。すなわち、デバイス・ドライバはす
でにそのデバイスを初期設定したので、それ自体と制御
中のデバイスとの間で情報を転送するためにロードおよ
びストア動作を実施することなどにより、通常通り、そ
の活動を制御している。また、これは、ステップ3が示
すように、制御中のデバイスでSERR#信号が発生し
た時期を判定することも含む。ステップ13に続き、プ
ロセスはステップ2にループ・バックし、続行されるこ
とが分かるだろう。
【0045】本発明は、コンピュータ・システム全体の
電力を低下させずに、個々のカード上でエラー条件を訂
正できるようにすることにより、信頼性を大幅に改善す
るものであることが分かるだろう。
【0046】所与の好ましい実施例について示し説明し
てきたが、特許請求の範囲から逸脱せずに多くの変更お
よび修正を行うことができることに留意されたい。たと
えば、他の実施例では、その装置によるDMA転送が禁
止されるが、ロードおよびストア動作は続行できるよう
に、リセット線が装置側に引き寄せられるものと思われ
る(これは、デバイス・ドライバがより複雑になること
を犠牲にして障害分離を改善することを考慮したもので
ある)。
【0047】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0048】(1)データ処理機能を実施するための複
数のカードと、前記複数のカードのうち、エラー信号を
出した特定の1つを識別するための手段と、残りの複数
のカードが前記データ処理活動を続行する間に前記複数
のカードのうちの前記1つをリセットするための手段と
を含むことを特徴とする、コンピュータ・システム。 (2)前記システムが、それぞれが複数のカードの1つ
に対応し、前記カードをCPUと相互接続するための複
数のインタフェース手段と、前記インタフェース手段内
にあって、前記複数のカードのうちの対応する1つがエ
ラー信号を出したかどうかを表示するための手段とをさ
らに含むことを特徴とする、上記(1)に記載のシステ
ム。 (3)前記識別手段が、前記複数のカードのうち、前記
エラー信号を出した前記1つによってデータ処理機能を
実施するためのすべての要求を無視するための手段と、
前記複数のカードのうち、前記エラー信号を出した前記
1つと、システム・メモリとの間の直接メモリ・アクセ
ス動作を打ち切るための手段とをさらに含むことを特徴
とする、上記(2)に記載のシステム。 (4)前記リセット手段が、前記複数のカードのうちの
どれが前記エラー信号を出したかを判定するための手段
と、前記複数のカードのうち、前記エラー信号を出した
前記1つを再構成するための手段とを含むことを特徴と
する、上記(3)に記載のシステム。 (5)前記再構成手段が、前記複数のカードのうち、前
記エラー信号を出した前記1つを再初期設定するための
手段を含むことを特徴とする、上記(4)に記載のシス
テム。 (6)前記再構成手段が、前記複数のカードのうち、前
記エラー信号を出した前記1つのエラー条件を修理する
ためにエラー回復ルーチンを呼び出すための手段と、前
記複数のカードのうちの前記1つで前記データ処理活動
を再実施するための手段とをさらに含むことを特徴とす
る、上記(5)に記載のシステム。 (7)前記表示手段が、前記複数のカードのうちの対応
する1つによってエラー信号が出されたかどうかを示す
状況ビットを格納するためのレジスタであることを特徴
とする、上記(6)に記載のシステム。 (8)前記判定手段が、前記複数のカードのうちの1つ
に対応し、前記レジスタをポーリングするデバイス・ド
ライバであることを特徴とする、上記(7)に記載のシ
ステム。 (9)データ処理機能を実施するための複数のカードの
1つを分離する方法において、前記方法が、前記複数の
カードのうち、エラー信号を出した特定の1つを識別す
るステップと、残りの複数のカードがデータ処理活動を
続行する間に前記複数のカードのうちの前記1つをリセ
ットするステップとを含むことを特徴とする方法。 (10)前記方法が、それぞれが複数のカードの1つに
対応し、前記カードをCPUと相互接続するための複数
のインタフェース手段を設けるステップと、前記インタ
フェース手段により、前記複数のカードのうちの対応す
る1つがエラー信号を出したかどうかを指示するステッ
プとをさらに含むことを特徴とする、上記(9)に記載
の方法。 (11)前記識別ステップが、前記複数のカードのう
ち、前記エラー信号を出した前記1つによってデータ処
理機能を実施するためのすべての要求を無視するステッ
プと、前記複数のカードのうち、前記エラー信号を出し
た前記1つと、システム・メモリとの間の直接メモリ・
アクセス動作を打ち切るステップとをさらに含むことを
特徴とする、上記(10)に記載の方法。 (12)前記リセット・ステップが、前記複数のカード
のうちのどれが前記エラー信号を出したかを判定するス
テップと、前記複数のカードのうち、前記エラー信号を
出した前記1つを再構成するステップとを含むことを特
徴とする、上記(11)に記載の方法。 (13)前記再構成ステップが、前記複数のカードのう
ち、前記エラー信号を出した前記1つを再初期設定する
ステップを含むことを特徴とする、上記(12)に記載
の方法。 (14)前記リセット・ステップが、前記複数のカード
のうち、前記エラー信号を出した前記1つのエラー条件
を修理するためにエラー回復ルーチンを呼び出すステッ
プと、前記複数のカードのうちの前記1つで前記データ
処理活動を再実施するステップとをさらに含むことを特
徴とする、上記(13)に記載の方法。 (15)前記指示ステップが、前記複数のカードのうち
の対応する1つによってエラー信号が出されたかどうか
を示す状況ビットをレジスタに格納するステップを含む
ことを特徴とする、上記(14)に記載の方法。 (16)前記判定ステップが、前記複数のカードのうち
の1つに対応するデバイス・ドライバによって前記レジ
スタをポーリングするステップを含むことを特徴とす
る、上記(15)に記載の方法。
【図面の簡単な説明】
【図1】システム・ボードおよびアダプタ・カードと、
それらの機械的関係を示す斜視図である。
【図2】対応する接続ガイド部材を備えたアダプタ・カ
ードの正面図である。
【図3】図2の切断線A−Aに沿って示す、本発明のア
ダプタ・カードおよびガイド部材の平面図である。
【図4】図2の切断線B−Bに沿って示す、本発明のア
ダプタ・カードおよびガイド部材の正面図である。
【図5】本発明のアダプタ・カードおよびガイド部材を
収容するスロットを示す、コンピュータ・システム・カ
バーの斜視図である。
【図6】ホスト・ブリッジにより入出力バスに接続され
たシステム・バスを有し、複数のアダプタ・スロットが
入出力バスに電気的に接続されているコンピュータ・シ
ステムの概略図である。
【図7】複数カード・スロットのバンクを含む、本発明
のアダプタ・カード・スロット態様の動作に必要な制御
信号を示す概略図である。
【図8】アダプタ・カードを入出力スロットにホット・
プラグするために本発明によって実施される様々なプロ
セス・ステップを示す流れ図である。
【図9】エラー回復を強化するために入出力アダプタ・
スロットが分離された、本発明の他の態様に必要な制御
信号を示す概略図である。
【図10】本発明のエラー回復態様を実施するために必
要なステップの流れ図である。
【図11】アダプタ・カード・スロットへの電力をラン
プ・アップまたはランプ・ダウンするために本発明が使
用可能な回路の一例を示す概略図である。
【図12】システム全体をオフライン化する必要がな
く、カードの取付け、取外し、または交換のために複数
スロットのバンクを非活動化することができる、本発明
の好ましい一実施例を示すブロック図である。
【図13】複数スロットのバンクのカードの取外し、取
付け、または交換を行うのに必要なステップを示す流れ
図である。
【符号の説明】
1 システム・ボード 2 マイクロプロセッサ 3 特定用途向け集積回路 4 インライン・コネクタ 4a インライン・コネクタ 5 機構またはアダプタ・カード 6 チップ 7 チップ 8 相互接続部 9 導電タブ 10 導電ランド
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ダニー・マーヴィン・ニール アメリカ合衆国78681 テキサス州ラウン ド・ロック ハイタワー・ドライブ 4604 (72)発明者 スティーブン・マーク・サーバー アメリカ合衆国78717 テキサス州オース チン エフレイム・ロード 8308

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】データ処理機能を実施するための複数のカ
    ードと、 前記複数のカードのうち、エラー信号を出した特定の1
    つを識別するための手段と、 残りの複数のカードが前記データ処理活動を続行する間
    に前記複数のカードのうちの前記1つをリセットするた
    めの手段とを含むことを特徴とする、コンピュータ・シ
    ステム。
  2. 【請求項2】前記システムが、 それぞれが複数のカードの1つに対応し、前記カードを
    CPUと相互接続するための複数のインタフェース手段
    と、 前記インタフェース手段内にあって、前記複数のカード
    のうちの対応する1つがエラー信号を出したかどうかを
    表示するための手段とをさらに含むことを特徴とする、
    請求項1に記載のシステム。
  3. 【請求項3】前記識別手段が、 前記複数のカードのうち、前記エラー信号を出した前記
    1つによってデータ処理機能を実施するためのすべての
    要求を無視するための手段と、 前記複数のカードのうち、前記エラー信号を出した前記
    1つと、システム・メモリとの間の直接メモリ・アクセ
    ス動作を打ち切るための手段とをさらに含むことを特徴
    とする、請求項2に記載のシステム。
  4. 【請求項4】前記リセット手段が、 前記複数のカードのうちのどれが前記エラー信号を出し
    たかを判定するための手段と、 前記複数のカードのうち、前記エラー信号を出した前記
    1つを再構成するための手段とを含むことを特徴とす
    る、請求項3に記載のシステム。
  5. 【請求項5】前記再構成手段が、前記複数のカードのう
    ち、前記エラー信号を出した前記1つを再初期設定する
    ための手段を含むことを特徴とする、請求項4に記載の
    システム。
  6. 【請求項6】前記再構成手段が、 前記複数のカードのうち、前記エラー信号を出した前記
    1つのエラー条件を修理するためにエラー回復ルーチン
    を呼び出すための手段と、 前記複数のカードのうちの前記1つで前記データ処理活
    動を再実施するための手段とをさらに含むことを特徴と
    する、請求項5に記載のシステム。
  7. 【請求項7】前記表示手段が、前記複数のカードのうち
    の対応する1つによってエラー信号が出されたかどうか
    を示す状況ビットを格納するためのレジスタであること
    を特徴とする、請求項6に記載のシステム。
  8. 【請求項8】前記判定手段が、前記複数のカードのうち
    の1つに対応し、前記レジスタをポーリングするデバイ
    ス・ドライバであることを特徴とする、請求項7に記載
    のシステム。
  9. 【請求項9】データ処理機能を実施するための複数のカ
    ードの1つを分離する方法において、前記方法が、 前記複数のカードのうち、エラー信号を出した特定の1
    つを識別するステップと、 残りの複数のカードがデータ処理活動を続行する間に前
    記複数のカードのうちの前記1つをリセットするステッ
    プとを含むことを特徴とする方法。
  10. 【請求項10】前記方法が、 それぞれが複数のカードの1つに対応し、前記カードを
    CPUと相互接続するための複数のインタフェース手段
    を設けるステップと、 前記インタフェース手段により、前記複数のカードのう
    ちの対応する1つがエラー信号を出したかどうかを指示
    するステップとをさらに含むことを特徴とする、請求項
    9に記載の方法。
  11. 【請求項11】前記識別ステップが、 前記複数のカードのうち、前記エラー信号を出した前記
    1つによってデータ処理機能を実施するためのすべての
    要求を無視するステップと、 前記複数のカードのうち、前記エラー信号を出した前記
    1つと、システム・メモリとの間の直接メモリ・アクセ
    ス動作を打ち切るステップとをさらに含むことを特徴と
    する、請求項10に記載の方法。
  12. 【請求項12】前記リセット・ステップが、 前記複数のカードのうちのどれが前記エラー信号を出し
    たかを判定するステップと、 前記複数のカードのうち、前記エラー信号を出した前記
    1つを再構成するステップとを含むことを特徴とする、
    請求項11に記載の方法。
  13. 【請求項13】前記再構成ステップが、前記複数のカー
    ドのうち、前記エラー信号を出した前記1つを再初期設
    定するステップを含むことを特徴とする、請求項12に
    記載の方法。
  14. 【請求項14】前記リセット・ステップが、 前記複数のカードのうち、前記エラー信号を出した前記
    1つのエラー条件を修理するためにエラー回復ルーチン
    を呼び出すステップと、 前記複数のカードのうちの前記1つで前記データ処理活
    動を再実施するステップとをさらに含むことを特徴とす
    る、請求項13に記載の方法。
  15. 【請求項15】前記指示ステップが、前記複数のカード
    のうちの対応する1つによってエラー信号が出されたか
    どうかを示す状況ビットをレジスタに格納するステップ
    を含むことを特徴とする、請求項14に記載の方法。
  16. 【請求項16】前記判定ステップが、前記複数のカード
    のうちの1つに対応するデバイス・ドライバによって前
    記レジスタをポーリングするステップを含むことを特徴
    とする、請求項15に記載の方法。
JP27972796A 1995-11-02 1996-10-22 データ処理システム内の周辺構成要素の分離によるエラー回復 Expired - Lifetime JP3771649B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US55688795A 1995-11-02 1995-11-02
US08/556887 1995-11-02

Publications (2)

Publication Number Publication Date
JPH09218828A true JPH09218828A (ja) 1997-08-19
JP3771649B2 JP3771649B2 (ja) 2006-04-26

Family

ID=24223235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27972796A Expired - Lifetime JP3771649B2 (ja) 1995-11-02 1996-10-22 データ処理システム内の周辺構成要素の分離によるエラー回復

Country Status (3)

Country Link
US (1) US5815647A (ja)
JP (1) JP3771649B2 (ja)
KR (1) KR100244836B1 (ja)

Families Citing this family (151)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6182180B1 (en) 1997-05-13 2001-01-30 Micron Electronics, Inc. Apparatus for interfacing buses
US6192434B1 (en) 1997-05-13 2001-02-20 Micron Electronics, Inc System for hot swapping a programmable adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6173346B1 (en) 1997-05-13 2001-01-09 Micron Electronics, Inc. Method for hot swapping a programmable storage adapter using a programmable processor for selectively enabling or disabling power to adapter slot in response to respective request signals
US6134668A (en) 1997-05-13 2000-10-17 Micron Electronics, Inc. Method of selective independent powering of portion of computer system through remote interface from remote interface power supply
US6179486B1 (en) 1997-05-13 2001-01-30 Micron Electronics, Inc. Method for hot add of a mass storage adapter on a system including a dynamically loaded adapter driver
US6499073B1 (en) 1997-05-13 2002-12-24 Micron Electronics, Inc. System using programmable processor for selectively enabling or disabling power to adapter in response to respective request signals
US6363497B1 (en) 1997-05-13 2002-03-26 Micron Technology, Inc. System for clustering software applications
US6219734B1 (en) 1997-05-13 2001-04-17 Micron Electronics, Inc. Method for the hot add of a mass storage adapter on a system including a statically loaded adapter driver
US6249834B1 (en) 1997-05-13 2001-06-19 Micron Technology, Inc. System for expanding PCI bus loading capacity
US6330690B1 (en) 1997-05-13 2001-12-11 Micron Electronics, Inc. Method of resetting a server
US5892928A (en) 1997-05-13 1999-04-06 Micron Electronics, Inc. Method for the hot add of a network adapter on a system including a dynamically loaded adapter driver
US6253334B1 (en) 1997-05-13 2001-06-26 Micron Electronics, Inc. Three bus server architecture with a legacy PCI bus and mirrored I/O PCI buses
US6163849A (en) 1997-05-13 2000-12-19 Micron Electronics, Inc. Method of powering up or powering down a server to a maintenance state
US6145098A (en) 1997-05-13 2000-11-07 Micron Electronics, Inc. System for displaying system status
US6170028B1 (en) 1997-05-13 2001-01-02 Micron Electronics, Inc. Method for hot swapping a programmable network adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6247079B1 (en) 1997-05-13 2001-06-12 Micron Electronics, Inc Apparatus for computer implemented hot-swap and hot-add
US6202111B1 (en) 1997-05-13 2001-03-13 Micron Electronics, Inc. Method for the hot add of a network adapter on a system including a statically loaded adapter driver
US6269417B1 (en) 1997-05-13 2001-07-31 Micron Technology, Inc. Method for determining and displaying the physical slot number of an expansion bus device
US6163853A (en) 1997-05-13 2000-12-19 Micron Electronics, Inc. Method for communicating a software-generated pulse waveform between two servers in a network
US5987554A (en) 1997-05-13 1999-11-16 Micron Electronics, Inc. Method of controlling the transfer of information across an interface between two buses
US6324608B1 (en) 1997-05-13 2001-11-27 Micron Electronics Method for hot swapping of network components
US6266721B1 (en) 1997-05-13 2001-07-24 Micron Electronics, Inc. System architecture for remote access and control of environmental management
US6338150B1 (en) 1997-05-13 2002-01-08 Micron Technology, Inc. Diagnostic and managing distributed processor system
US6247080B1 (en) 1997-05-13 2001-06-12 Micron Electronics, Inc. Method for the hot add of devices
US6292905B1 (en) 1997-05-13 2001-09-18 Micron Technology, Inc. Method for providing a fault tolerant network using distributed server processes to remap clustered network resources to other servers during server failure
US6269412B1 (en) 1997-05-13 2001-07-31 Micron Technology, Inc. Apparatus for recording information system events
US6073255A (en) 1997-05-13 2000-06-06 Micron Electronics, Inc. Method of reading system log
US6195717B1 (en) 1997-05-13 2001-02-27 Micron Electronics, Inc. Method of expanding bus loading capacity
US6249828B1 (en) * 1997-05-13 2001-06-19 Micron Electronics, Inc. Method for the hot swap of a mass storage adapter on a system including a statically loaded adapter driver
US6148355A (en) 1997-05-13 2000-11-14 Micron Electronics, Inc. Configuration management method for hot adding and hot replacing devices
US6134615A (en) * 1997-05-13 2000-10-17 Micron Electronics, Inc. System for facilitating the replacement or insertion of devices in a computer system through the use of a graphical user interface
US6122758A (en) 1997-05-13 2000-09-19 Micron Electronics, Inc. System for mapping environmental resources to memory for program access
US6138250A (en) 1997-05-13 2000-10-24 Micron Electronics, Inc. System for reading system log
US6243838B1 (en) 1997-05-13 2001-06-05 Micron Electronics, Inc. Method for automatically reporting a system failure in a server
US6418492B1 (en) 1997-05-13 2002-07-09 Micron Electronics Method for computer implemented hot-swap and hot-add
US6170067B1 (en) 1997-05-13 2001-01-02 Micron Technology, Inc. System for automatically reporting a system failure in a server
US6243773B1 (en) 1997-05-13 2001-06-05 Micron Electronics, Inc. Configuration management system for hot adding and hot replacing devices
US6304929B1 (en) 1997-05-13 2001-10-16 Micron Electronics, Inc. Method for hot swapping a programmable adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6134673A (en) 1997-05-13 2000-10-17 Micron Electronics, Inc. Method for clustering software applications
US6122746A (en) 1997-05-13 2000-09-19 Micron Electronics, Inc. System for powering up and powering down a server
US6202160B1 (en) 1997-05-13 2001-03-13 Micron Electronics, Inc. System for independent powering of a computer system
US6012114A (en) * 1997-06-30 2000-01-04 Compaq Computer Corporation System for preventing software of a computer system from interacting with a connector to avoid data corruption due to surprise removal of a circuit card
KR100259841B1 (ko) * 1997-07-31 2000-06-15 윤종용 씽글 칩을 이용한 피씨아이 버스의 핫 플러그 제어기
US5938751A (en) * 1997-08-15 1999-08-17 Compaq Computer Corporation Bus ring-back and voltage over-shoot reduction techniques coupled with hot-pluggability
US6154835A (en) 1997-10-01 2000-11-28 Micron Electronics, Inc. Method for automatically configuring and formatting a computer system and installing software
US6212585B1 (en) * 1997-10-01 2001-04-03 Micron Electronics, Inc. Method of automatically configuring a server after hot add of a device
US6138179A (en) 1997-10-01 2000-10-24 Micron Electronics, Inc. System for automatically partitioning and formatting a primary hard disk for installing software in which selection of extended partition size is not related to size of hard disk
US6199173B1 (en) 1997-10-01 2001-03-06 Micron Electronics, Inc. Method for mapping environmental resources to memory for program access
US6088816A (en) 1997-10-01 2000-07-11 Micron Electronics, Inc. Method of displaying system status
US6175490B1 (en) 1997-10-01 2001-01-16 Micron Electronics, Inc. Fault tolerant computer system
US6065053A (en) 1997-10-01 2000-05-16 Micron Electronics, Inc. System for resetting a server
US6263387B1 (en) 1997-10-01 2001-07-17 Micron Electronics, Inc. System for automatically configuring a server after hot add of a device
US6009541A (en) 1997-10-01 1999-12-28 Micron Electronics, Inc. Apparatus for performing an extensive diagnostic test in conjunction with a bios test routine
US5996038A (en) * 1998-01-26 1999-11-30 Intel Corporation Individually resettable bus expander bridge mechanism
US6035355A (en) * 1998-04-27 2000-03-07 International Business Machines Corporation PCI system and adapter requirements following reset
US6223299B1 (en) * 1998-05-04 2001-04-24 International Business Machines Corporation Enhanced error handling for I/O load/store operations to a PCI device via bad parity or zero byte enables
US6199130B1 (en) * 1998-06-04 2001-03-06 International Business Machines Corporation Concurrent maintenance for PCI based DASD subsystem with concurrent maintenance message being communicated between SPCN (system power control network) and I/O adapter using PCI bridge
JP2000003255A (ja) * 1998-06-12 2000-01-07 Nec Corp ディスクアレイ装置
KR100305312B1 (ko) 1998-06-15 2001-11-30 윤종용 인터페이스장치
US6128682A (en) * 1998-06-25 2000-10-03 Compaq Computer Corporation Method and apparatus for bus isolation
US6205503B1 (en) 1998-07-17 2001-03-20 Mallikarjunan Mahalingam Method for the hot swap and add of input/output platforms and devices
US6223234B1 (en) 1998-07-17 2001-04-24 Micron Electronics, Inc. Apparatus for the hot swap and add of input/output platforms and devices
US6189117B1 (en) 1998-08-18 2001-02-13 International Business Machines Corporation Error handling between a processor and a system managed by the processor
US6269459B1 (en) * 1998-08-25 2001-07-31 Advanced Micro Devices, Inc. Error reporting mechanism for an AGP chipset driver using a registry
US6295566B1 (en) * 1998-10-31 2001-09-25 Campaq Computer Corporation PCI add-in-card capability using PCI-to-PCI bridge power management
US6324596B1 (en) * 1998-11-30 2001-11-27 Micron Technology, Inc. Providing device status during bus retry operations
US6240473B1 (en) 1998-11-30 2001-05-29 Micron Technology, Inc. Providing device status during bus retry operations
US6507879B1 (en) * 1999-02-11 2003-01-14 Micron Technology, Inc. Apparatus for configuration devices on a communications channel
US6363452B1 (en) * 1999-03-29 2002-03-26 Sun Microsystems, Inc. Method and apparatus for adding and removing components without powering down computer system
US6345331B1 (en) * 1999-04-20 2002-02-05 International Business Machines Corporation Device adapter being reintegrated with plurality of device adapters of network, or reestablishing permissions and resubmitting I/O requests depending on determined device state after failure
FI107207B (fi) * 1999-04-28 2001-06-15 Nokia Networks Oy Menetelmä, järjestelmä ja laite viallisen yksikön tunnistamiseksi
US6253250B1 (en) * 1999-06-28 2001-06-26 Telocity, Incorporated Method and apparatus for bridging a plurality of buses and handling of an exception event to provide bus isolation
US6574752B1 (en) 1999-07-15 2003-06-03 International Business Machines Corporation Method and system for error isolation during PCI bus configuration cycles
US6633946B1 (en) * 1999-09-28 2003-10-14 Sun Microsystems, Inc. Flexible switch-based I/O system interconnect
US7266728B1 (en) * 1999-10-01 2007-09-04 Stmicroelectronics Ltd. Circuit for monitoring information on an interconnect
US6553444B1 (en) * 1999-10-28 2003-04-22 Hewlett-Packard Development Company, L.P. Method and system for sensing the proper insertion of a portable memory element
US6564340B1 (en) * 1999-11-18 2003-05-13 Honeywell International Inc. Fault tolerant virtual VMEbus backplane design
US6526528B1 (en) * 2000-01-19 2003-02-25 Bae Systems Controls, Inc. Ticket punch watchdog monitor
US6735715B1 (en) 2000-04-13 2004-05-11 Stratus Technologies Bermuda Ltd. System and method for operating a SCSI bus with redundant SCSI adaptors
US6687851B1 (en) 2000-04-13 2004-02-03 Stratus Technologies Bermuda Ltd. Method and system for upgrading fault-tolerant systems
US6820213B1 (en) 2000-04-13 2004-11-16 Stratus Technologies Bermuda, Ltd. Fault-tolerant computer system with voter delay buffer
US6691257B1 (en) 2000-04-13 2004-02-10 Stratus Technologies Bermuda Ltd. Fault-tolerant maintenance bus protocol and method for using the same
US6708283B1 (en) 2000-04-13 2004-03-16 Stratus Technologies, Bermuda Ltd. System and method for operating a system with redundant peripheral bus controllers
US6633996B1 (en) 2000-04-13 2003-10-14 Stratus Technologies Bermuda Ltd. Fault-tolerant maintenance bus architecture
FR2810426B1 (fr) * 2000-06-16 2006-01-27 Canon Kk Dispositif et procede de controle d'acces de peripherique informatique
US6658599B1 (en) * 2000-06-22 2003-12-02 International Business Machines Corporation Method for recovering from a machine check interrupt during runtime
US6662320B1 (en) * 2000-07-20 2003-12-09 International Business Machines Corporation Method and apparatus for inhibiting an adapter bus error signal following a reset operation
US6892263B1 (en) 2000-10-05 2005-05-10 Sun Microsystems, Inc. System and method for hot swapping daughtercards in high availability computer systems
US7225467B2 (en) * 2000-11-15 2007-05-29 Lockheed Martin Corporation Active intrusion resistant environment of layered object and compartment keys (airelock)
US7213265B2 (en) * 2000-11-15 2007-05-01 Lockheed Martin Corporation Real time active network compartmentalization
US6629048B1 (en) 2000-11-20 2003-09-30 Tektronix, Inc. Measurement test instrument and associated voltage management system for accessory device
US6745345B2 (en) * 2000-12-04 2004-06-01 International Business Machines Corporation Method for testing a computer bus using a bridge chip having a freeze-on-error option
US6766479B2 (en) 2001-02-28 2004-07-20 Stratus Technologies Bermuda, Ltd. Apparatus and methods for identifying bus protocol violations
US20020184576A1 (en) * 2001-03-29 2002-12-05 International Business Machines Corporation Method and apparatus for isolating failing hardware in a PCI recoverable error
US6807596B2 (en) * 2001-07-26 2004-10-19 Hewlett-Packard Development Company, L.P. System for removing and replacing core I/O hardware in an operational computer system
US7096300B2 (en) * 2001-08-31 2006-08-22 American Megatrends, Inc. Method and apparatus for suspending communication with a hard disk drive in order to transfer data relating to the hard disk drive
US7159063B2 (en) * 2001-08-31 2007-01-02 American Megatrends, Inc. Method and apparatus for hot-swapping a hard disk drive
US7007109B2 (en) 2001-08-31 2006-02-28 American Megatrends, Inc. Method and apparatus for suspending communication with a hard disk drive in order to transfer data relating to the hard disk drive
US6963942B2 (en) * 2001-12-04 2005-11-08 Motorola, Inc. High availability system and method for improved intialization
US6904546B2 (en) * 2002-02-12 2005-06-07 Dell Usa, L.P. System and method for interface isolation and operating system notification during bus errors
US7487283B2 (en) * 2002-08-16 2009-02-03 American Megatrends, Inc. Apparatus for bridging two or more data communications interfaces
US7650530B2 (en) * 2002-09-30 2010-01-19 International Business Machines Corporation Initializing a processing system to ensure fail-safe boot when faulty PCI adapters are present
US7146643B2 (en) * 2002-10-29 2006-12-05 Lockheed Martin Corporation Intrusion detection accelerator
US20070061884A1 (en) * 2002-10-29 2007-03-15 Dapp Michael C Intrusion detection accelerator
US20040083466A1 (en) * 2002-10-29 2004-04-29 Dapp Michael C. Hardware parser accelerator
US7080094B2 (en) * 2002-10-29 2006-07-18 Lockheed Martin Corporation Hardware accelerated validating parser
US7051140B2 (en) * 2002-11-13 2006-05-23 International Business Machines Corporation Connector that enables aggregation of independent system resources across PCI/PCI-X bus and interlocked method for aggregating independent system resources across PCI/PCI-X bus
US7664991B1 (en) * 2002-12-17 2010-02-16 Symantec Operating Corporation System and method for distributed file system I/O recovery
US7480831B2 (en) * 2003-01-23 2009-01-20 Dell Products L.P. Method and apparatus for recovering from a failed I/O controller in an information handling system
US20040172234A1 (en) * 2003-02-28 2004-09-02 Dapp Michael C. Hardware accelerator personality compiler
US7103808B2 (en) * 2003-04-10 2006-09-05 International Business Machines Corporation Apparatus for reporting and isolating errors below a host bridge
US20040267969A1 (en) * 2003-05-01 2004-12-30 Takayuki Uchida IEEE 1394 function control apparatus and method of controlling multiple functions
US7577877B2 (en) * 2003-05-22 2009-08-18 Hewlett-Packard Development Company, L.P. Mechanisms to prevent undesirable bus behavior
US7107495B2 (en) * 2003-06-19 2006-09-12 International Business Machines Corporation Method, system, and product for improving isolation of input/output errors in logically partitioned data processing systems
US20050052856A1 (en) * 2003-09-04 2005-03-10 Sun Microsystems, Inc. Method and apparatus having field replaceable units with electrical connectors
US7251753B2 (en) * 2003-09-17 2007-07-31 International Business Machines Corporation Apparatus, system, and method for identifying a faulty communication module
US7657689B1 (en) * 2003-10-07 2010-02-02 Altera Corporation Methods and apparatus for handling reset events in a bus bridge
US20050081080A1 (en) * 2003-10-14 2005-04-14 International Business Machines Corporation Error recovery for data processing systems transferring message packets through communications adapters
US7194663B2 (en) * 2003-11-18 2007-03-20 Honeywell International, Inc. Protective bus interface and method
JP4218538B2 (ja) * 2004-01-28 2009-02-04 日本電気株式会社 コンピュータシステム、バスコントローラ及びそれらに用いるバス障害処理方法
US7415634B2 (en) * 2004-03-25 2008-08-19 International Business Machines Corporation Method for fast system recovery via degraded reboot
US8028189B2 (en) * 2004-11-17 2011-09-27 International Business Machines Corporation Recoverable machine check handling
US7624305B2 (en) * 2004-11-18 2009-11-24 International Business Machines Corporation Failure isolation in a communication system
US20060150010A1 (en) * 2005-01-03 2006-07-06 Stiffler Jack J Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
USRE45632E1 (en) * 2005-01-03 2015-07-28 O'shantel Software L.L.C. Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
US7840768B2 (en) * 2005-12-13 2010-11-23 Reliable Technologies, Inc. Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
US7447934B2 (en) * 2005-06-27 2008-11-04 International Business Machines Corporation System and method for using hot plug configuration for PCI error recovery
US7532492B2 (en) * 2005-12-20 2009-05-12 Tektronix, Inc. Host controlled voltage input system for an accessory device
US8032745B2 (en) * 2005-12-20 2011-10-04 International Business Machines Corporation Authentication of I2C bus transactions
CN101331438B (zh) * 2006-02-23 2010-08-18 富士通株式会社 维护指导显示装置、维护指导显示方法
EP1830268B1 (en) * 2006-03-03 2019-05-08 STMicroelectronics (Research & Development) Limited Multiple purpose integrated circuit
TWI297780B (en) * 2006-05-24 2008-06-11 Compal Electronics Inc Crcuit board testing interface and its testing method
JP4728896B2 (ja) * 2006-07-13 2011-07-20 エヌイーシーコンピュータテクノ株式会社 コンピュータシステム
JP5096905B2 (ja) * 2007-12-20 2012-12-12 株式会社日立製作所 サーバ装置及びそのリンク回復処理方法
US7711869B1 (en) * 2007-12-20 2010-05-04 Emc Corporation Method for communicating plural signals generated at a source to a remote destination through a single wire
US8510592B1 (en) * 2009-09-15 2013-08-13 Netapp, Inc. PCI error resilience
US8683108B2 (en) 2010-06-23 2014-03-25 International Business Machines Corporation Connected input/output hub management
US8677180B2 (en) 2010-06-23 2014-03-18 International Business Machines Corporation Switch failover control in a multiprocessor computer system
US8656228B2 (en) * 2010-06-23 2014-02-18 International Business Machines Corporation Memory error isolation and recovery in a multiprocessor computer system
US8615622B2 (en) 2010-06-23 2013-12-24 International Business Machines Corporation Non-standard I/O adapters in a standardized I/O architecture
US8745292B2 (en) 2010-06-23 2014-06-03 International Business Machines Corporation System and method for routing I/O expansion requests and responses in a PCIE architecture
US8645606B2 (en) 2010-06-23 2014-02-04 International Business Machines Corporation Upbound input/output expansion request and response processing in a PCIe architecture
US8918573B2 (en) 2010-06-23 2014-12-23 International Business Machines Corporation Input/output (I/O) expansion response processing in a peripheral component interconnect express (PCIe) environment
US8645767B2 (en) 2010-06-23 2014-02-04 International Business Machines Corporation Scalable I/O adapter function level error detection, isolation, and reporting
US8572294B2 (en) * 2011-05-17 2013-10-29 Ncr Corporation Device start up system and method
US9026842B2 (en) 2012-03-20 2015-05-05 Blackberry Limited Selective fault recovery of subsystems
US9235485B2 (en) * 2013-07-22 2016-01-12 International Business Machines Corporation Moving objects in a primary computer based on memory errors in a secondary computer
KR102183852B1 (ko) * 2013-11-22 2020-11-30 삼성전자주식회사 전자 장치의 무결성 검증을 위한 방법, 저장 매체 및 전자 장치
JP2016197360A (ja) * 2015-04-06 2016-11-24 富士通株式会社 情報処理装置、情報処理装置の制御プログラム及び情報処理装置の制御方法
US9792167B1 (en) * 2016-09-27 2017-10-17 International Business Machines Corporation Transparent north port recovery
US11249872B1 (en) * 2020-06-26 2022-02-15 Xilinx, Inc. Governor circuit for system-on-chip

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2202231A1 (de) * 1972-01-18 1973-07-26 Siemens Ag Verarbeitungssystem mit verdreifachten systemeinheiten
US4453215A (en) * 1981-10-01 1984-06-05 Stratus Computer, Inc. Central processing apparatus for fault-tolerant computing
US4689766A (en) * 1984-11-16 1987-08-25 Zenith Electronics Corporation System for resetting the operation of a signal processing device upon the failure of accessng a predetermined memory location within a predetermined time interval
US4870643A (en) * 1987-11-06 1989-09-26 Micropolis Corporation Parallel drive array storage system
JP2568261B2 (ja) * 1988-11-21 1996-12-25 沖電気工業株式会社 カートリッジ接続回路
JPH02294753A (ja) * 1989-05-09 1990-12-05 Fujitsu Ltd 入出力処理装置の初期化方式
WO1991016678A1 (fr) * 1990-04-13 1991-10-31 Fujitsu Limited Procede de remise a zero d'un module adaptateur suite a une panne et syteme d'ordinateur executant ledit procede
US5317697A (en) * 1991-07-31 1994-05-31 Synernetics Inc. Method and apparatus for live insertion and removal of electronic sub-assemblies
US5379184A (en) * 1991-08-30 1995-01-03 Unisys Corporation Pry-in/pry-out disk drive receptacle
US5333285A (en) * 1991-11-21 1994-07-26 International Business Machines Corporation System crash detect and automatic reset mechanism for processor cards
US5319751A (en) * 1991-12-27 1994-06-07 Intel Corporation Device driver configuration in a computer system
US5345350A (en) * 1992-11-13 1994-09-06 International Business Machines Corporation Dual-purpose picker for automated multimedia library
US5367669A (en) * 1993-03-23 1994-11-22 Eclipse Technologies, Inc. Fault tolerant hard disk array controller
KR960016648B1 (ko) * 1993-12-29 1996-12-19 현대전자산업 주식회사 커먼 컨트롤 중복 스위치 방법
US5721882A (en) * 1994-08-05 1998-02-24 Intel Corporation Method and apparatus for interfacing memory devices operating at different speeds to a computer system bus
JPH0895687A (ja) * 1994-09-26 1996-04-12 Fujitsu Ltd I/oカード、このi/oカードに接続される接続ケーブル及びi/oカードのパワーセーブ方法
US5568610A (en) * 1995-05-15 1996-10-22 Dell Usa, L.P. Method and apparatus for detecting the insertion or removal of expansion cards using capacitive sensing
US5644470A (en) * 1995-11-02 1997-07-01 International Business Machines Corporation Autodocking hardware for installing and/or removing adapter cards without opening the computer system cover

Also Published As

Publication number Publication date
KR100244836B1 (ko) 2000-02-15
JP3771649B2 (ja) 2006-04-26
US5815647A (en) 1998-09-29
KR970029043A (ko) 1997-06-26

Similar Documents

Publication Publication Date Title
JPH09218828A (ja) データ処理システム内の周辺構成要素の分離によるエラー回復
US5644470A (en) Autodocking hardware for installing and/or removing adapter cards without opening the computer system cover
US5875310A (en) Secondary I/O bus with expanded slot capacity and hot plugging capability
EP0974085B1 (en) Method and system for enabling nondisruptive live insertion and removal of feature cards in a computer system
US5664119A (en) Local proactive hot swap request/acknowledge system
US5754804A (en) Method and system for managing system bus communications in a data processing system
US6018810A (en) Fault-tolerant interconnection means in a computer system
US6487623B1 (en) Replacement, upgrade and/or addition of hot-pluggable components in a computer system
US6725318B1 (en) Automated selection between a USB and PS/2 interface for connecting a keyboard to a computer
US7447934B2 (en) System and method for using hot plug configuration for PCI error recovery
US7447822B2 (en) Hot-plug control system and method
CN1129074C (zh) 在不中断操作的情况下维护计算机系统的方法及其电力系统
US6687777B2 (en) Apparatus and method of connecting and interfacing active device components
US6532545B1 (en) Apparatus for swapping, adding or removing a processor in an operating computer system
US6898740B2 (en) Computer system having configurable core logic chipset for connection to a fault-tolerant accelerated graphics port bus and peripheral component interconnect bus
CN1300394A (zh) 在多个系统处理器之间进行切换的方法
US7000153B2 (en) Computer apparatus and method of diagnosing the computer apparatus and replacing, repairing or adding hardware during non-stop operation of the computer apparatus
JPH09146875A (ja) ホット・プラギング用のアダプタ・カード・スロットの分離
US6532546B2 (en) Computer system for dynamically scaling busses during operation
US6108732A (en) Method for swapping, adding or removing a processor in an operating computer system
US6901344B2 (en) Apparatus and method for verification of system interconnect upon hot-plugging of electronic field replaceable units
US20050132110A1 (en) PCI validation
Cisco Corrective Maintenance�Control Circuits
JP4915113B2 (ja) バスシステム、リセットイニシャライズ回路、及びバスシステムにおける障害復旧方法
Hughes et al. BladeCenter processor blades, I/O expansion adapters, and units

Legal Events

Date Code Title Description
RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20051213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060210

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100217

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110217

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110217

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120217

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120217

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130217

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130217

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140217

Year of fee payment: 8

EXPY Cancellation because of completion of term