JP3771649B2 - データ処理システム内の周辺構成要素の分離によるエラー回復 - Google Patents

データ処理システム内の周辺構成要素の分離によるエラー回復 Download PDF

Info

Publication number
JP3771649B2
JP3771649B2 JP27972796A JP27972796A JP3771649B2 JP 3771649 B2 JP3771649 B2 JP 3771649B2 JP 27972796 A JP27972796 A JP 27972796A JP 27972796 A JP27972796 A JP 27972796A JP 3771649 B2 JP3771649 B2 JP 3771649B2
Authority
JP
Japan
Prior art keywords
card
error signal
input
output
issued
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP27972796A
Other languages
English (en)
Other versions
JPH09218828A (ja
Inventor
パトリック・アレン・バックランド
ダニー・マーヴィン・ニール
スティーブン・マーク・サーバー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH09218828A publication Critical patent/JPH09218828A/ja
Application granted granted Critical
Publication of JP3771649B2 publication Critical patent/JP3771649B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0745Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in an input/output transactions management context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4027Coupling between buses using bus bridges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/325Display of status information by lamps or LED's
    • G06F11/326Display of status information by lamps or LED's for error or online/offline status

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)
  • Power Sources (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、一般的には、中央演算処理装置(CPU)と、特定のシステム機能を実行するための複数の装置またはカードとを有するコンピュータ・システムに関する。より具体的には、CPUが装置の1つのエラー条件を識別し、エラー回復のためにその装置を分離できるようにするシステムを開示する。
【0002】
【従来の技術】
典型的なコンピュータ・システムは、配線層によって互いに電気的に接続されたメモリ制御装置、入出力制御装置などの他の特定用途向け集積回路(ASIC)と、マイクロプロセッサとを含む、システム・ボードを含んでいる。また、多くのコンピュータは、カード上のチップをマイクロプロセッサやシステム・ボード上の他のチップに接続してコンピュータ・システムに追加機能を提供することができる、追加のアダプタ・カード用のスロットも含んでいる。ユーザがコンピュータに追加すると思われる典型的な機能としては、拡張メモリ、ファックス/モデム機能、サウンド・カード、グラフィック・カードなどがある。一般に、システム・ボード上に含まれるスロットは、アダプタ・カード上の露出タブを受け入れるための導電ランドを有するインライン電気コネクタを含んでいる。カード上のチップの入出力は、このタブに接続される。次に、コネクタは、前述の配線層によりマイクロプロセッサなどに電気的に接続される。
【0003】
通常、従来のコンピュータ・システムでは、アダプタ・カードの1つの装置の1つでエラー条件が発生すると、CPUはどの装置がエラー信号を発生したかを判定することができない。というのは、アダプタ・カードからのエラー信号が論理OR演算によって合成されるからである。したがって、ユーザまたはシステム管理者は、カードの1つの単一装置だけがエラー条件を持っている場合でもシステム全体のIPLをリセットしなければならない。システムがサーバである場合、1つのマシン、すなわち、サーバのみのエラーによって多くのクライアント・システムが影響を受ける可能性があることが分かるだろう。さらに、マルチタスク・クライアント・システムでは、複数の機能が同時に行われている可能性があるので、システムをリセットすると、単一装置のエラーによってすべてのコンピュータ機能が終了する恐れがある。
【0004】
したがって、特定のアダプタ・カード上のどの特定の装置がエラー信号を生成したかをCPUが識別できるようなシステムの必要性が存在することが分かるだろう。また、エラー信号を生成する特定の装置に対してエラー回復技法を実施できるように、エラー信号が生成されたカードを分離することが望ましいと思われる。その結果、エラー信号を出した装置についてエラー回復動作が実施される間に、残りの装置は通常動作を続行できるはずである。これは、特定のカードが故障していると判定された後でコンピュータのハードウェア構成を変更することと、その後、コンピュータ・システムに新しいカードを取り付けることを含むことができる。このようなシステム・ハードウェア構成の変更は、コンピュータ・システムから実際のカバーを取り外し、システム全体の電力を低下させたり、またはコンピュータをオフライン化する必要もなく、実施できるはずである。
【0005】
【発明が解決しようとする課題】
先行技術とは対照的に、本発明は、複数のカードのうちのどれがエラー信号を出したかをユーザが識別できるようにするためのコンピュータ・システムを提供する。次に、エラー信号を出した装置が分離され、エラー条件を有する装置についてのみエラー回復技法が実施される。必要であれば、本発明では、コンピュータ・システム全体の電力を低下させる必要がなく、特定のカードを取り外したり交換することができるように、個々のコネクタを使用禁止にすることもできる。
【0006】
【課題を解決するための手段】
概して、追加の制御論理回路を有するコンピュータ・システムには、ブリッジ・チップと、入出力、メモリなどの特定の機能を実施するカードを受け入れるための少なくとも1つのコネクタ・スロットが設けられている。エラー信号が存在すると判定されると、システム・ハードウェアは、エラー信号を出した装置へのリセット信号を活動化し、保持する。さらに、ブリッジ・チップ内のレジスタの状況ビットが設定される。次に、エラー信号を出した装置に対応するデバイス・ドライバが状況ビットを読み取り、エラーが発生したことを検証し、ブリッジをリセットし、エラー条件を有する装置のみをリセットまたは初期設定する。
【0007】
上記の概要によると、本発明の目的、特徴、および利点は、添付図面に関連して示される以下の説明および特許請求の範囲により当業者に明らかになるだろう。
【0008】
【発明の実施の形態】
図1を参照すると、同図には、システム・ボード1と機構またはアダプタ・カード5の斜視図が示されている。ボード1は、たとえば、IBMから販売されているPowerPCマイクロプロセッサ(PowerPCはIBMの商標である)などのマイクロプロセッサ2や、メモリ、入出力制御装置などの他の特定用途向け集積回路3などの、様々な集積回路チップを含んでいる。また、システム・ボード1に接続されたインライン・コネクタ4および4aも示されている。これらのコネクタは、システム・ボード内に存在する配線層によりボード1上のICに電気的に接続されている。コネクタ4および4aには導電ランド10が存在し、これがカード上の導電タブと相互接続する。デバイス5とも呼ばれるカード5は、遠近法で示され、そこに導電タブ9を有する相互接続部8を含んでいる。これらのタブ9は、システム・ボード1上の様々な構成要素とカード5上に存在するチップとの間に電気接続ができるように、コネクタ4内のランド10と接触する。カード5上のチップ6および7は、コンピュータ・システムに追加機能を提供するような複数の集積回路のいずれでもよい。たとえば、このようなチップ6および7は、メモリ、グラフィック・アクセレレータ、数値計算補助プロセッサ、モデムなどのICにすることができる。この場合も、カード5がコネクタ4に挿入されたときにカード5上のチップ6および7をシステム・ボード上のマイクロプロセッサ2およびチップ3と接続するような、配線層がカード5に存在する。カード5とシステム・ボード1が、FR4など、複数の基板のいずれでもよく、それがバイアによって互いに接続された導電性かつ交互に絶縁する材料の層を含むことは、当業者には理解されるだろう。ボード1およびカード5の層は、表面パッドに引き出され、次に、制御済み崩壊チップ接続(C4)、はんだボール接続(SBC)ワイヤ結合、表面実装技術(SMT)などの数多くの相互接続方法の1つを使用して様々なチップ上の入出力点に接続される。
【0009】
図2は、本発明のガイド手段の好ましい実施例を示している。アダプタ・カード5は、図1に関して記載したのと同じように導電タブ9を有するものとして示されている。さらに、摩擦ばめ、クランプ、ねじ、その他の取付け手段によりカード5に付加されたカード・ガイド31が示されている。ただし、業界で一般的な半分のサイズのアダプタ・カードを収容するために、ガイド31を短縮するか、またはその他の変更を加えることができることに留意されたい。全サイズのアダプタ・カードを使用して本発明について説明するが、本発明の範囲では半分のサイズのカードが考慮されることに留意されたい。ガイド31は、取付け手段30によってアダプタ・カード5の両端に付加された端部29および27を含んでいる。
【0010】
図4に詳しく示すように、カード・ガイド31をスライド式に受け入れるガイド・レール28が設けられている。ガイド・レール28の内部表面にぴったり合うかまたは適合する少なくとも1つの肩部33が含まれている(図4を参照)。ガイド・レール28には、ピボット点24および25がしっかり付加されている。ピボット25は、レバー部26を有する細長い力伝達部材20にも回転式に取り付けられている。第2の力伝達部材21は、一方の端ではピボット24に回転式に取り付けられ、もう一方の端付近では部材20にしっかり付加されたピボット23に回転式に取り付けられている。レバー部26の反対側にある力伝達部材20の端部は、図5に示すようにフレーム部材43などにしっかり付加されたピボット部材42に回転式に取り付けられている。ただし、ピボット点22および23は、カード5を持ち上げたり下げたりすることによってカード5をコネクタ4から取り外したり、コネクタ4に挿入したときに(図2の矢印が示す方向に)何らかのスライド運動を行うように、そこに挿入されたピボット・ピンの周りのスロット付き開口部も含むことに留意されたい。
【0011】
導電タブ9が図1のインライン・コネクタ4にぴったりはまり、接続するように、図2の配置は矢印Cが示すようにカード5の下方向垂直運動を提供することが分かるだろう。当業者は、カード5がピボットに直接取り付けられている場合、タブ9が傾斜してコネクタ4に接近し、カード5をコネクタ4に挿入して信頼性の高い機械的かつ電気的接続を行うのが極めて難しくなることを理解するだろう。
【0012】
図2に示すように、アダプタ・カードを解除するためにレバー26で上方向に力が加わると、ピボット25で上方向垂直力が発生し、それが電気接続タブ9と位置合せされた点でカード5に直接伝達される。同時に、上方向の力は、ピボット23により部材21に印加され、ピボット点24でカード5に伝達される。これにより、カード5にわずかな上方向の力が加わり、カードをコネクタ4から取り外すときにカードが回転するのを防止し、電気的かつ機械的にカードがコネクタから容易に解除されるようにする。カード5をシステム・ボード1上のコネクタ4に挿入する必要がある場合は、プロセスが逆になる。ガイド31は、カード5に取り付けられた後、ガイド・レール28にスライド挿入される。次に、レバー26に下方向の力が印加され、この力がピボット25によりカード5に伝達される。ピボット25がタブ9と位置合せされているので、この下方向の力は接続タブに垂直に直接加わる。また、レバー26上の下方向の力によって、ピボット23を介して部材21に下方向の力が加わる。この力は、アダプタ・カードがコネクタ4に接近したときにアダプタ・カードが回転するのを防止するため、ピボット24によりカード5にわずかな下方向の力として伝達される。したがって、前述のように、図2の装置により、コンピュータ・システム・ボード上に存在するインライン・コネクタにアダプタ・カードを垂直に挿入し、そこから取り外す方法が分かるだろう。上記の説明は本発明の好ましい一実施例であるが、当業者は、カム・ギヤなどのその他の機構を使用して、アダプタ・カードのコネクタへの垂直挿入とコネクタからの取外しを可能にするような装置を提供する方法を容易に理解するだろう。
【0013】
図3は、図2の線A−Aに沿って示すカード5の図であり、端部27および29とともにガイド部材31がねじ30などの取付け手段を使用してカードに取り付けられている状態を示している。図4は、図2の線B−Bに沿って示すカード5の側面図である。この図は、その端部29と取付け手段30とともにガイド部材31を示したものである。上記の通り、ガイド部材31の肩部33は、カード5がそれに取り付けられたガイド31をスライド可能な配置でガイド・レール28に縦に挿入できるように、ガイド・レール28の内部表面35に適合している。図4にはピボット手段25も示されているが、これは図2に示すのと同じ方法でガイド・レール28に付加されている。
【0014】
図5は、スロット41がそこに形成されたカバー40を有するコンピュータ・システムの斜視図である。図5には、2つのスロット41が示されている。しかし、所望の数のアダプタ・カード5を収容するためにカバー40には任意の数のスロット41を形成できるものとする。コンピュータ内部のシステム・ボード1(または他の適当なサポート)に付加されたフレーム部材43が示されている。また、フレーム部材43上に配置され、図2のガイド手段のピボット点22に回転式に取り付けられているピボット手段42も示されている。また、ピボット点45は、図2のガイド手段に追加の機械的サポートを提供するためにフレーム部材43または他の適当なサポートに回転式に取り付けられている。図5のカバー40が図1のシステム・ボード1を取り囲むように配置されている場合、スロット41はコネクタ4および4aと位置合せされた関係になる。ガイド・レール28はフレーム部材43にスライド挿入され、ピボット点22はピボット42に接続されるのに対し、ピボット点45はピボット46に接続される。このようにして、図2のカード・ガイド手段もシステム・ボード1のコネクタ4および4aと位置合せされる。次に、ガイド部材31がアダプタ・カード5に取り付けられ、アセンブリ全体がガイド・レール28にスライド挿入され、レバー26がスロット41から外側に伸びる。コンピュータ・システム内にアダプタ・カード5を電気的に取り付けるためには、アダプタ・カード5の導電タブ9が、たとえば、コネクタ4のランド10と電気接続されるまで、レバー26に下方向の圧力が加えられる。カードを取り外すか、またはあるアダプタ・カードを他のものに交換するためには、プロセスが逆になる。すなわち、レバー26には上方向の圧力が加えられ、カード5のタブ9がコネクタ4のランド10から切断される。次に、ガイド・レール31を備えたカード5がガイド・レール28からスライドして外され、新しいカードまたは交換用カードがガイド・レール28にスライド挿入される。この場合も、新しいカードを機械的かつ電気的に取り付けるために、下方向の圧力がレバー26に加えられる。
【0015】
コンピュータ・カバー40を外す必要もなく、ファックス/モデム、グラフィック・アクセレレータなどのアダプタ・カード5をコンピュータ・システムに取り付けるかまたはコンピュータ・システムで交換できるようにすることにより、本発明によってユーザがコンピュータのハードウェア構成を変更できることは、容易に分かるだろう。コンピュータ・システム・ユーザは、CPU2からコネクタ4を電気的に分離するかまたは切断し、次に、アダプタ・カード5の取付け、取外し、または交換を行うだけでよい。パーソナル・コンピュータにおける電気的分離とは、カードを取り付けるかまたは取り外す間に単にマシンの電源をオフにすることを含む場合もある。より高度なシステムでは、残りのコネクタを電気的に切断せずに、新しいカードまたは異なるカードを取り付ける特定のコネクタまたは複数コネクタのグループの分離を試みることが必要になる場合もある。
【0016】
多くのパーソナル・コンピュータ、ワークステーション、サーバでは、入出力サブシステムの修理またはアップグレード・アクションの通常の手順は、電源をオフにし、入出力領域(コネクタ4)にアクセスするためにカバーを開き、不良またはアップグレード対象のアダプタ・カードの取付け、取外し、または交換を行うことである。次に、カバーを元に戻し、電源を復旧する。サーバ・システムでは、このようにして入出力修理およびアップグレード・アクションを処理することがますます受け入れがたいものになっている。というのは、多くのユーザが複雑なネットワークを越えてサーバに拘束されており、修理/アップグレード・アクション中に遮断されるからである。
【0017】
現在、一部のメインフレームやハイエンド・サーバ・マシンでは、冗長システムを用意することによって、高価なオンライン・メンテナンス機能を提供している。本発明では、システムおよび入出力サブシステムの他の部分が処理動作を続行できるようにしながら、コンピュータのカバーを開けずに入出力カードを交換できるようにする入出力サブシステムのオンライン・メンテナンスを実行するための比較的安価かつ単純な方法を提供する。
【0018】
図6は、コンピュータ・システムの入出力サブシステム内の様々な構成要素用の電気接続を示している。CPU2とメモリ3は、IBMから販売されている60Xまたは6XXバスなどのシステム・バス100に接続されたものとして示されている。ホスト・ブリッジ・チップ113が示されているが、これは、PCIバスなどの入出力用のメザニン・バス102とシステム・バス100との間のインタフェースを提供する。図6はPCIバスとPCIホスト・ブリッジ・チップを示しているが、本発明では、いかなる入出力バスの使用も考慮している。PCIブリッジ・チップ113は、割込み処理、メッセージの引渡し、アービトレーション、スヌープなどを含み、システム・バス100とバス102との間でバス・プロトコルを変換できるようにする論理および機能性を含む。
【0019】
メザニン・バス102は、少なくとも1つのPCI間ブリッジ・チップ104に接続されている。このチップは、コネクタ4および追加の論理を含む実際のアダプタ・スロット106と入出力バスとの間のインタフェースを提供する。スロット106は入出力装置108を受け入れ、この装置はデバイス5上に存在する可能性がある。PCIのアーキテクチャおよび仕様は、PCI Special Interest Group (PCI-SIG)より入手でき、参照により本明細書に組み込まれる。本発明は、参照番号105で示す追加の制御論理回路を追加するが、PCIアーキテクチャの変更は必要としない。ただし、図6に示すように、多くのコンピュータ・システムが複数の入出力スロットを含むことに留意されたい。追加のスロットは、本発明の構成要素の記述に使用する参照番号に「a」という文字を追加することによって表す。
【0020】
前述のように、システム・ユーザがアダプタ・カードの取付け、取外し、または交換を行うためには、そのスロットまたは複数スロットのバンクにおけるすべての処理活動が停止するように、コネクタまたはスロット(複数スロットのバンクを含む)を分離しなければならない。すべての活動を停止させる方法の1つは、マシンをオフにするだけである。しかし、これは、多くのクライアント・コンピュータを相互接続するサーバ・タイプのマシンでは実用的ではない場合が多い。特にフォールト・トレラントまたは高可用性システムでは、これが該当する。また、マルチタスク・システムが使用可能な場合には、特に重要な活動が行われるときに単一コンピュータの電源をオフにすることが望ましくない場合がある。たとえば、ファックス/モデムを備えたパーソナル・コンピュータでは、送信を受信するために電源をオンにしたままにする必要がある。この場合、残りのスロットを活動状態にして、特定の入出力スロット(複数も可)を非活動化することができれば、有利なはずである。本発明により、ユーザは、システムがサーバかパーソナル・コンピュータかにかかわらず、システムの電源をオフにする必要もなく特定のアダプタ・カードを交換することができる。
【0021】
図7は、本発明の構成要素を示しているが、この構成要素は、システム全体の電源をオフにする必要もなく、アダプタ・カードの取付け、取外し、または交換を可能にするものである。入出力バス102、たとえば、PCIバスは、PCI間ブリッジ・チップ104に接続され、追加の制御論理回路105と組み合わせて、単一PCIスロット106の制御に使用する。ただし、スロット106は、2次バス103とチップ104との間の電気的かつ機械的機能インタフェース全体であると見なされることに留意されたい。このインタフェースは、後述するように電気機械感知装置107など、様々な他の電気および機械構成要素とともに、一部分としてコネクタ4を含む。1組の制御論理回路105とともに1つの変更済みブリッジ・チップ104を使用して、1つのスロット106を制御する。当然のことながら、このような要素の組合せは、コンピュータ・システム内に存在する入出力スロットの数に応じて複製される。このため、入出力カードの取外し、交換、または取付けを行うときに、RST#信号によって各スロットを選択的にリセットし、そのスロットから電力を取り除くことができる。
【0022】
プレーナまたはシステム・ボード1は、各入出力コネクタ4用のブリッジ・チップ104を含むように変更される。次に、ブリッジ・チップ104を使用して、2次バス103とスロット106を入出力バス102の残りの部分から分離する。スロットが空である場合、そのスロットには電力が一切印加されていないので、新しいカードをそこに取り付けることができる。入出力カードを取り外す場合、取外し中にアダプタが活動状態にならないように保証するため、まず、そのカードをリセットする。ブリッジ・チップ104は、スロット106をオフライン化し、追加の制御論理回路によって、リセット時にそのカードから電力を取り除く。次に、前述のように、カードが機械的に取り外される。また、スロットに電力が印加されている間に入出力カードの取外しが行われるのを防止するように入出力カードをインタロックするために、ソレノイド・スイッチなどの電気機械手段を設けることもできる。
【0023】
入出力カードの挿入の場合、カードがマシンに挿入される(前述のガイド手段などを使用することができる)。カードが所定の位置に納まると、システムは、新しい入出力アダプタ・カードを識別し初期設定するように構成される。新たに取り付けたカードが構成されるまで、カード・スロット106は入出力バス102から電気的に分離される。カードが構成されると、プレーナ上の論理回路がコネクタ4の電力ピンへの電力のランプアップに備える。アップグレード/修理アクション中は、再構成する入出力スロットだけが影響を受けるはずなので、システムと入出力サブシステムの他の部分は動作中のままになる。ただし、上記の動作では、PCI(または他の入出力バス)の仕様またはアーキテクチャそのものの変更は必要ないことに留意されたい。すなわち、本発明は、入出力バス・アーキテクチャを変更せずに完全に実施することができる。
【0024】
図7に示す制御論理回路105は、スロット・リセット検出器110と、ブリッジ制御論理回路112と、電力制御論理回路114と、LEDドライバ116とを含む。また、LEDドライバ116によって制御される発光ダイオード(LED)118も示されている。
【0025】
個々のスロットを分離するものとして図7の好ましい実施例について説明してきたが、本発明の範囲は、複数の任意の数のスロット、すなわち、他のスロットまたは複数スロットのバンクからの複数スロットのバンクの分離を含む。複数スロットのバンクを分離することにより、単一ブリッジ・チップ104を使用してそのバンクを制御することができ、その結果、各スロット106ごとにブリッジ・チップ104を1つずつ用意する必要が解消される。当然のことながら、単一チップが複数のスロットを制御するとフレキシビリティがある程度失われるが、しかしシステム・コストを低減し、他のシステム機能を非活動化せずにカードを変更できるようにすることが必要な一部のアプリケーション・システムでは、これが望ましい場合もある。
【0026】
図8は、本発明の電気的動作を説明するために図7とともに使用する流れ図である。
【0027】
第1のケースでは、取り外すべき既存のアダプタ・カード5がPCI(またはその他の入出力プロトコル)106に存在すると想定される。図8を参照すると、ステップ1でユーザは、アダプタ・カードの取外し、交換、または追加を行うことによってシステム・ハードウェア構成を変更するためのプロセスを開始する(一連のキーストローク、マウスによるアイコンの選択などによる)。次にプロセスは、単一ブリッジ・チップ104によって制御される単一アダプタ・スロットまたは複数スロットのバンクがシステム内に存在するかどうかを判定する。複数スロットのバンクが存在する場合、この方法は図13のステップ17(後述する)に移行する。ステップ1aで、単一スロットが存在すると判定された場合は、ステップ2により、スロット106にカードが存在するかどうかを判定する。電気機械感知装置107は、論理回路114にカード存在信号を提供する。この例では、カードを取り外すものを想定しているので、プロセスはカードがスロット106に存在すると判定することになる。ユーザは、キーボード、マウス、スタイラス、またはその他の入出力装置により、コンピュータ・システムにコマンドなどを入力することによってこのプロセスを開始する。このようなコマンドでは、ユーザが所与の情報、たとえば、複数のスロット106のうちのどれを再構成すべきかなどを提供しなければならない場合もある。
【0028】
ステップ10では、ディスク・オペレーティング・システム(DOS)、OS/2、AIXなど(OS/2とAIXはIBMの商標である)などのオペレーティング・システムにより、アダプタ5とコンピュータ・システムの残りの部分との間のすべてのデータ処理活動が停止される。その後、ブリッジ・チップ104から入出力スロット106にリセット信号RST#が出される(ステップ11)。このRST#信号はリセット検出器110にも送られ、次にその検出器が制御信号をブリッジ制御論理回路112に伝送する。ステップ12では、入出力ブリッジ・チップ104が1次入出力バス102から2次バス103を切断する。この切断は、ブリッジ制御論理回路112から入出力ブリッジ・チップ104に送られる制御信号によって実施される。RST#信号の検出に基づいて、スロット・リセット検出器110は電力制御論理回路114にも制御信号を送り、スロット106への電力を徐々に低減(ランプ・ダウン)しなければならないことを示す。次に、ステップ13で電力が低下する。
【0029】
図11は、スロット106への電力をランプ・アップまたはランプ・ダウンするために電力制御論理回路114が使用可能な回路の一実施例を示している。電圧Vddは、レール121上に示され、N型トランジスタ120、122、121、123、124に接続されている(N型トランジスタは、電圧、すなわち、論理1がそのゲートに印加されたときに電気を伝導する)。これらのデバイスはそれぞれ異なるしきい電圧を有するので、それぞれのトランジスタでの電圧降下が異なるものになるように、オンになったときに異なる抵抗を提示する。図11の実施例では、トランジスタ120の電圧降下が大きくなり、トランジスタ122、123、124のそれぞれの電圧降下が徐々に小さくなるように、デバイスのサイズが決定されている。たとえば、Vddが3.3ボルトであると想定され、トランジスタ120が2.5ボルトの電圧降下を有する場合、t=1ではレール125上の電圧がVdd−2.5=0.8ボルトになる。1.5ボルトのしきい電圧降下を示すようにトランジスタ122のサイズが決まっている場合、t=2ではレール125上の電圧が3.3−1.5=1.8ボルトになる。この例の場合、トランジスタ123のしきい電圧が0.5ボルトであると想定すると、t=3ではレール125上の電圧が3.3−0.5=2.8ボルトになる。また、t=4でレール125上の電圧が3.3−0=3.3ボルトすなわちVddになるように、トランジスタ124のしきい電圧がほぼ0.0であると想定される。したがって、時間t=1からt=4の間にスロット106に接続されたレール125上の電圧が0.8ボルトから3.3ボルトにどのように徐々に増加(ランプ・アップ)するかが分かるだろう。スロット106への電力を徐々に低下(ランプ・ダウン)することが必要な場合、プロセスはほぼ逆になる。定常状態条件では、トランジスタ124は、Vddがスロット106に提供されるようにオンになる。レール125上の電圧を低下させるため、そのゲートから電圧を取り除くことによってトランジスタ124がオフになり、トランジスタ123がオンになる。その結果、デバイス123からのしきい電圧が0.5ボルトになるため、レール125上では2.8ボルトになる。次の期間中、トランジスタ123はオフになり、デバイス122はオンになるので、デバイス122のしきい電圧が1.5ボルトになるため、レール125上には1.8ボルトの電圧が存在することになる。次に、トランジスタ122がオフになり、トランジスタ120がオンになるので、トランジスタ120のしきい電圧が2.5ボルトになるため、レール125上には0.8ボルトの電圧が生じる。当然のことながら、クロック生成回路によってt=1からt=4までのパルスがどのように変化するか、ならびに、電力なし(電圧=0)から電力完全(電圧=Vdd)までの間にスロット106で勾配のより緩やかな遷移を行うために追加のトランジスタを追加できることを、当業者は容易に理解するだろう。
【0030】
さらに、電力制御論理回路114は、スロット106が実際に入出力バス102から切断されたことを示す確認信号をブリッジ制御論理回路112から受け取る。これにより、活動状態で結合された入出力カードを取り外すことによって発生しそうな損傷、データ損失などが防止される。また、スロット106から電力制御論理回路114には、カード5が実際にスロット106に存在することを確認するカード存在信号も提供される。スロット106から電力が取り除かれると、電力制御論理回路114からLEDドライバ116に信号が送られ、次にこのドライバがLED118を励起し、それにより、スロットがバスから切断され、スロットが励起解除され、上記の機械式ガイド手段など(図1〜5)によってカードを取り外すことができる(ステップ15)ことをユーザに示す。好ましい実施例では、リレー、ソレノイド・スイッチなどの電気機械装置107を使用し、カードの電力が低下しない限り、カードが取り外されることを物理的に防止することができる。ステップ15に続き、入出力スロットからアダプタ・カードを取り外すプロセスはステップ16で終了する。ただし、制御論理回路105の実施態様は多種多様であり、本発明は特定の実施態様によって限定されないことを当業者が理解することに留意されたい。たとえば、外部制御論理回路105のどの部分もPCI間ブリッジ・チップ104に組み込むことができるが、ブリッジ・チップ104上に追加のピンが必要になるはずである。
【0031】
第2の例では、コンピュータ・システム上のスロットにカードを挿入すると想定される。このケースでは、挿入すべきカードは新品であるか、またはステップ10〜15に従ってすでに取り外された別のアダプタ・カードの交換品になる。したがって、ステップ2では、スロット106のコネクタ4にアダプタ・カード5が存在しないと判定される。次にステップ3では、LED118が示すようにスロット106から電力が取り除かれたことと、スロットに電力が印加されている場合には電気機械装置107により新しいカード5をスロットに物理的に挿入できないことが確認される。ステップ4では、図1〜5に関連して説明したように本発明の機械装置を使用して、スロット106のコネクタ4に新しいアダプタ・カード5が挿入される。次に電気機械装置107は、電力制御論理回路114にカード存在信号を出し、それにより、新しいカード5がスロット106に物理的に存在することを示す(ステップ5)。論理回路114がカード存在信号を受け取ると、図11に従って前述したような装置を使用して、スロット電力およびスロット・アース電力分配線により、スロット106に電力を徐々に印加できることを意味する(ステップ6)。スロット106に電力が増加されると、電力制御論理回路114はLEDドライバ116に制御信号を提供し、それにより、LEDがオフになり、スロットに電力が印加され、カードを取り外すことができないことをユーザに示す。ステップ7では、電力制御論理回路がブリッジ制御回路112に接続バス制御信号を出し、次にこの回路が入出力ブリッジ・チップ104にイネーブル信号を送り、その結果、2次バス103が1次入出力バス102に結合される。次に、ステップ8でブリッジ・チップ104からのRST#信号が非活動化される。この時点で、新しいカード5はコネクタ4に物理的に存在し、スロット106に電力が印加され、2次バス103は入出力バス102に接続されている。残っていることは、どのタイプのカードが取り付けられ、それがどのタイプのプロトコルを使用するかの判定など、コンピュータ・システム内のソフトウェアが構成活動を開始することである(ステップ9)。構成ソフトウェアは、このような判定を行うためにアダプタ・カード上の読取り専用メモリ(ROM)を読み取ることができる。構成に続いて、新しいカードを使用したデータ処理活動を開始することができる。これで取付けプロセスは完了し、図8の方法はステップ10で終了する。
【0032】
図12は、複数スロット106のバンクが単一ブリッジ・チップ104によって制御される、本発明の一実施例のブロック図を示している。これらのスロットは、1つのグループとして制御、すなわち、非活動化することができる。図12の参照番号が図7で使用する同一番号に対応する場合、同じ構成要素を表すことを意味し、もう一度説明しないものとする。リセット検出器110はリセット信号RST#に基づいてアービタ130に制御信号を提供することが分かるだろう。このアービタは、2次バス103の所有権に関する要求を受け取り、そのバスに最近アクセスしていないデバイスなどの1組の所定の基準に基づいてブリッジ・チップ104またはスロット106の1つにバスを授与する、標準的な論理デバイスである。アービタ130は、ブリッジ・チップ104に接続されたものとして示されているが、ブリッジ・チップにより各スロット106にも接続されている。また、ブリッジ・チップ104によりスロット106からアービタ130にバス要求信号を伝送する要求線131も示されている。当業者は、バス103が、アービトレーション・サイクル後にそのバスが特定のスロットに授与されていることを特定のスロットに示すアービトレーション授与線など、他の多くの制御信号線を含むことを理解するだろう。データおよびアドレス信号を収容する他の線もバス103に含まれているが、これらは図12には図示しない。要求線131内には1組のインライン・スイッチ133が配置され、スイッチ制御論理回路117によって制御される。ただし、バンク内に存在する各スロットごとにスイッチが1組ずつ存在することに留意されたい。ブリッジ・チップ104からのRST#信号を検出すると、スイッチ制御論理回路117はアービタ130に制御信号を送り、それがブリッジ・チップ104にバス103の所有権を授与する。これにより、複数スロットのバンクを非活動化するプロセスが開始されると、そのバンク内のどのスロット106もバス103の所有権を持てなくなる。同時に、アービタ130に送られる信号により、スイッチ制御論理回路117はスイッチ133にもスイッチを開く制御信号を送り、その結果、スロット106内のどのカードもバス103へのアクセスを要求できなくなり、アービトレーション・サイクルが開始される。アービトレーションが使用禁止になると、図7および図8に関連して前述したのと同じ技法により、複数スロット106のバンクを非活動化することができる。
【0033】
次に、図12に関連して図13の流れ図について説明する。図8のステップ1aで複数スロットのバンクがコンピュータ・システム内に存在すると判定された場合、図13のステップ17では、取外しまたは交換を行うカード(複数も可)がバンク内のスロットの1つであるかどうかを判定する。そうである場合、ステップ18でスロット・リセット検出器110がスイッチ制御論理回路117に制御信号を提供し、次にその論理回路がアービタ130に信号を提供する。ステップ19ではアービタ130がバス103の所有権をブリッジ・チップ104に授与する。次に、スイッチ133を開くことにより、スイッチ制御論理回路117がバス要求信号線131を使用禁止にする(ステップ20)。ステップ21で構成ソフトウェアはスロット106内のカードへの活動を停止する。次にブリッジ・チップ104はステップ22で入出力バス102から2次バス103を切断する。次に、ステップ23で複数スロットのバンクへの電力が徐々に低下する。ステップ24でLED118は、スロット106から電力が取り除かれた時期を示し、カード(複数も可)が取り外せるようになる(ステップ25)。
【0034】
ステップ17で、バンク内のスロット106の1つにカードを挿入すると判定された場合、バンク内のスロットが非活動状態になる(ステップ26)。というのは、ステップ18〜25に従ってそのバンクが前に非活動化されているからである。ステップ27では、コンピュータ・システムに追加すべきカード(複数も可)5がコネクタ(複数も可)4に挿入される。次に電磁スイッチ(複数も可)107がカード(複数も可)の存在を示す(ステップ28)。次にステップ29で複数スロットのバンクへの電力が徐々に増加し、ブリッジ・チップ104によってバス103を入出力バス102に結合できるという表示が行われる。ステップ30では、ブリッジ・チップ104が2次バス103を入出力バス102に再接続する。ステップ31でリセット信号が非活動化される。これにより、スイッチ133を閉じることによって、スイッチ制御論理回路がバス103のアービトレーションを可能にする(ステップ32)。複数スロットのバンク内の各カード用の構成ソフトウェアにより、複数スロットのバンク内のカード(複数も可)5がデータ処理活動を開始できるようになる(ステップ33)。ステップ25および33の両方に続いて、プロセスはステップ16(図8)に移行し、終了する。
【0035】
PCIバスなど、特定のタイプの入出力バスを有するコンピュータ・システムでは、(場合によっては)入出力バス上で発生するエラーを報告し、このようなエラーからの回復に対応することが不可能である。たとえば、システム・エラー信号(SERR#)によってアドレス・パリティ・エラーが報告される。この信号は、中央演算処理装置へのマスク不能割込み(NMI)信号を生成する。多くのシステムではNMIは回復不能であり、NMIによって報告されたエラーによってコンピュータ・システムが再始動されるので、問題が発生する。すなわち、今日の複雑なプロセッサには様々なパイプライン・ステージがあるため、NMI用のエラー回復が一切ない。したがって、コンピュータ・システムはエラー条件を解決するためにその初期プログラム・ロード(IPL)を完了しなければならない。これは、システムの再IPLによってサーバに接続されたすべてのクライアント・システムも再始動されるようなサーバなどのコンピュータ・システムでは望ましくないことである。
【0036】
さらに、様々なスロットに複数のカードを有するパーソナル・コンピュータなどのクライアント・システムでは、カードまたはデバイスの1つがNMIを出した場合、悪影響を受けることになる。すなわち、単一カードがCPUにNMIを出した場合、唯一頼りになるのはCPUが再IPLを行うことである。これは、NMIが出される原因となるエラー条件をどのカードが持っているかをCPUが識別できないからである。
【0037】
さらに、デバイス(すなわち、カード)によってSERR#信号が励起され、サービス不能な内部エラー条件が存在することを示す場合もある。通常、様々なデバイスのSERR#信号は他のSERR#信号とのORがまとめて取られるので、CPUは、どのデバイスがその信号を開始したか、なぜその信号が出されたか、または複数のデバイスがSERR#信号を出しているかどうかなどを把握していない。回復不能エラーの他の例としては、今後の完了のためにプロセッサが実行中の動作がスレーブ装置(アダプタ・カード)によって通知された場合に発生するほぼすべてのエラーが挙げられる。このタイプのエラーは、PCIメモリ・アドレス空間向けの、多くの別のタイプの市販マイクロプロセッサとともに使用されるすべてのプログラム式入出力(PIO)動作(ロード命令とストア命令による)に適用される。したがって、システム・ソフトウェアは入出力装置、たとえば、PCI装置にデータを書き込むことができ、その動作はプロセッサ・バスで正常に完了するので、ソフトウェア・プログラムが動作を続行する。その後、PCIバス上で発生するエラーは遅すぎるため、ソフトウェアで問題を訂正することができなくなる。
【0038】
本発明の他の好ましい実施例では、PCIバス(または他の同様の入出力バス)上のエラー回復を可能にするために、入出力プロトコルをわずかに変更することができる。このエラー回復を可能にするため、CPUがエラーのタイプとどのカードがエラー信号を出しているかを判定できるように、各スロットを分離しなければならない。
【0039】
図9は、本発明のエラー回復態様の好ましい実施例のブロック図である。ただし、図9に番号で示されている構成要素は図7および図12で使用する同一構成要素に対応するので、ここでは説明しないことに留意されたい。図9のシステム・バス100は、CPU2とメモリ3をブリッジ・チップ113に接続している。CPU2は、AIXまたはOS/2オペレーティング・システムなどのソフトウェア・オペレーティング・システム200を有する。また、CPU2にはデバイス・ドライバ201が導入されているが、これはオペレーティング・システム200に含まれる場合もある。このようなデバイス・ドライバ201は、コンピュータ・システムのスロット106のカード5を含む、様々な構成要素を制御するために使用する。デバイス・ドライバ201は、このような機能および通信、エラー検出と訂正などを実行する。入出力ホスト・ブリッジ・チップ113はシステム・バス100に接続され、入出力バス102にも接続される。次に、ブリッジ・チップ104は入出力バス102とスロット106に接続される。現在説明している実施例では、状況情報を格納するために少なくとも1つの追加レジスタ203がブリッジ・チップ104に追加されている。さらに、信号線103を使用してリセット信号RST#をスロット106に伝送することが図9から分かるだろう。また、信号線204はスロット106からブリッジ・チップ104にSERR#信号を提供する。図9の構成要素の残りは図7に示すものと同一なので、それに従って説明する。
【0040】
エラー回復方式にとって重要なことは、変更済みブリッジ・チップ104により各入出力装置、すなわち、各入出力スロット106を1次入出力バス102から分離することである。この好ましい実施例では、前述のPCI間実施態様の変更が必要である。より具体的には、スロット106内のカードのうちの特定の1つにエラー条件が存在する場合に設定される回復モード構成ビットが追加される。モード構成ビットが設定されると、前述のようにシステムに対する損害が発生しないように装置5をそのリセット状態に維持するため、RST#信号が活動化され、保持される。さらに、システムに外部割込みを通知するためにレジスタ203の状況ビットが設定される。また、構成ビットが設定されると、ストア時にCPUからデータを投げ捨て、ロード操作時にすべての論理1の値を返すことにより、CPU2から装置への追加のロードまたはストアがすべて無視される。最後に、装置5からの直接メモリ・アクセス(DMA)データは破棄され、DMAデータを伝えそうな動作はすべて打ち切られる。
【0041】
デバイス・ドライバ201は、動作がコード内の特定のポイント(実行中の命令)で正しく完了することを確認するために、ブリッジ・チップ104またはデバイスそのもので入出力動作の状況を検査する責任を負っている。レジスタ203は、たとえば、論理0であれば、エラーが一切存在せず、デバイス・ドライバが入出力装置から情報を読み取ることができることを示すような何らかのビットを含むことになる。しかし、レジスタ203の状況ビットが論理1を含み、ブリッジ・チップ104が装置5をリセット状態(RST#が活動状態)に保持している場合、デバイス・ドライバが装置から情報を読み取ると、すべてのビットが論理1に設定され、その結果、動作が正しく完了していないことをドライバに示すことになる。ただし、1次入出力バス102上のエラーはやはりマシン・チェックを生成し、システムの再IPLの原因となることに留意されたい。しかし、本発明の分離方法を使用することにより、1次入出力バス102はいずれのスロット106もそれに直接接続していないので、したがって、その信頼性が大幅に増加している。
【0042】
さらに、装置5のうち特定のものだけがこの「リセット」タイプのエラー回復に関与するように、コンピュータ・システムを設計することができる。この実施例のエラー回復がオンになっていない場合、エラーは装置から1次入出力バス102に伝えられ、その結果、おそらくマシン・チェックが生成されることになる。本発明のエラー回復方式を利用するために、システム内のデータの大部分を処理する重要装置(たとえば、サーバ・システムのDASDおよびLANアダプタ)だけを変更すればよいように設計することは、所与のシステムにとっては受け入れられることであろう。このため、コンピュータ・システム全体を変更する必要もなく、システムの信頼性を大幅に増加することができる。
【0043】
図10は、本発明のエラー回復態様によって実施されるステップを示す流れ図である。ステップ1ではプロセスが開始され、ステップ2ではデバイス・ドライバが制御中の装置へのロード/ストア動作を実行する。ただし、本発明では、一連のまたは関連グループのロード/ストア動作が実施されるような状況も扱うことに留意されたい。次にステップ3では、コンピュータ・システム内のアダプタ・カード上の複数の装置の1つからのSERR#信号が存在するかどうかを判定する。存在する場合、ステップ4ではSERR#を槌する装置に対してリセット信号RST#が活動化され(ブリッジ・チップ104による)、装置5をそのリセット状態にし、システムに対する損害を回避すると同時に、装置をシステムに結合された状態に維持する。すなわち、SERR#信号を出したカードを有するスロット106は、前述のようにリセットされる(データ処理活動が停止する)。ステップ5では、レジスタ203の状況ビットが、たとえば、論理1に設定される。次にステップ6では、図9に示す制御ハードウェアがすべてのロード動作とストア動作を無視し、保留中の直接メモリ・アクセス(DMA)動作を打ち切る。ステップ3でSERR#信号が一切存在していないと判定された場合、本発明のプロセスはステップ7に移行し、そこで、実施中の一連の命令に追加のロードおよびストア動作が存在するかどうかが判定される。追加のロードまたはストアあるいはその両方が存在する場合、プロセスはステップ2にループ・バックし、そこでデバイス・ドライバがロード/ストアを実施する。追加のロード/ストア動作が一切存在しない場合、ステップ8でデバイス・ドライバがブリッジ・チップ104のレジスタ203の状況ビットを読み取る。次にステップ9では、エラー条件が発生しているかどうかを判定する。ステップ5で、SERR#エラーが発生していることを示すために状況ビットが設定されていない場合、ロード/ストア動作は完了したものと見なされる(ステップ10)。しかし、ステップ5で、SERR#信号の存在を示すために状況ビットが設定されている場合、ステップ11でブリッジ・チップ104が(再初期設定により)再構成される。通常、デバイス・ドライバは、デバイスを再初期設定することにより、カードをリセットする。しかし、本発明では、デバイス・ドライバが、それ自体とデバイスとの間の情報転送を試みているバス・マスタ・デバイスに対し、転送動作をもう一度試みるように指示すると思われる再試行動作も試みることができるものとする。エラー条件が取り除かれていれば、ロード/ストア動作を正しく実施することができる。さらに、ステップ11で、デバイス・ドライバは、デバイス内のエラー条件を訂正しようと試みる1つまたは複数のサービス・ルーチンを呼び出すことができる。このようなエラー・ルーチンは、パワー・オン自己検査(post)コードなどの一部としてコンピュータの読取り専用メモリ(ROM)内に常駐することができる。しかし、デバイス・ドライバがエラー条件を有するデバイスを再初期設定することが、典型的な状況である。本発明によれば、実際にエラー・コードを生成する特定のデバイスについてのみ、再IPLが行われる。コンピュータ・システム内の複数のカード上の残りのデバイスは、通常のデータ処理活動を続行することになる。したがって、本発明により、コンピュータ・システムが、異なるスロットの他のカード5上の他のデバイスの動作に影響せずに、どのように特定の入出力スロット106内の単一デバイスを分離できるかが分かるだろう。
【0044】
ステップ12では、エラー・コードを生成する特定のデバイスがデバイス・ドライバによって再初期設定される。次にデバイス・ドライバは、通常のデータ処理活動のためのチェックポイント状態に設定される(ステップ13)。すなわち、デバイス・ドライバはすでにそのデバイスを初期設定したので、それ自体と制御中のデバイスとの間で情報を転送するためにロードおよびストア動作を実施することなどにより、通常通り、その活動を制御している。また、これは、ステップ3が示すように、制御中のデバイスでSERR#信号が発生した時期を判定することも含む。ステップ13に続き、プロセスはステップ2にループ・バックし、続行されることが分かるだろう。
【0045】
本発明は、コンピュータ・システム全体の電力を低下させずに、個々のカード上でエラー条件を訂正できるようにすることにより、信頼性を大幅に改善するものであることが分かるだろう。
【0046】
所与の好ましい実施例について示し説明してきたが、特許請求の範囲から逸脱せずに多くの変更および修正を行うことができることに留意されたい。たとえば、他の実施例では、その装置によるDMA転送が禁止されるが、ロードおよびストア動作は続行できるように、リセット線が装置側に引き寄せられるものと思われる(これは、デバイス・ドライバがより複雑になることを犠牲にして障害分離を改善することを考慮したものである)。
【0047】
まとめとして、本発明の構成に関して以下の事項を開示する。
【0048】
(1)データ処理機能を実施するための複数のカードと、
前記複数のカードのうち、エラー信号を出した特定の1つを識別するための手段と、
残りの複数のカードが前記データ処理活動を続行する間に前記複数のカードのうちの前記1つをリセットするための手段とを含むことを特徴とする、コンピュータ・システム。
(2)前記システムが、
それぞれが複数のカードの1つに対応し、前記カードをCPUと相互接続するための複数のインタフェース手段と、
前記インタフェース手段内にあって、前記複数のカードのうちの対応する1つがエラー信号を出したかどうかを表示するための手段とをさらに含むことを特徴とする、上記(1)に記載のシステム。
(3)前記識別手段が、
前記複数のカードのうち、前記エラー信号を出した前記1つによってデータ処理機能を実施するためのすべての要求を無視するための手段と、
前記複数のカードのうち、前記エラー信号を出した前記1つと、システム・メモリとの間の直接メモリ・アクセス動作を打ち切るための手段とをさらに含むことを特徴とする、上記(2)に記載のシステム。
(4)前記リセット手段が、
前記複数のカードのうちのどれが前記エラー信号を出したかを判定するための手段と、
前記複数のカードのうち、前記エラー信号を出した前記1つを再構成するための手段とを含むことを特徴とする、上記(3)に記載のシステム。
(5)前記再構成手段が、前記複数のカードのうち、前記エラー信号を出した前記1つを再初期設定するための手段を含むことを特徴とする、上記(4)に記載のシステム。
(6)前記再構成手段が、
前記複数のカードのうち、前記エラー信号を出した前記1つのエラー条件を修理するためにエラー回復ルーチンを呼び出すための手段と、
前記複数のカードのうちの前記1つで前記データ処理活動を再実施するための手段とをさらに含むことを特徴とする、上記(5)に記載のシステム。
(7)前記表示手段が、前記複数のカードのうちの対応する1つによってエラー信号が出されたかどうかを示す状況ビットを格納するためのレジスタであることを特徴とする、上記(6)に記載のシステム。
(8)前記判定手段が、前記複数のカードのうちの1つに対応し、前記レジスタをポーリングするデバイス・ドライバであることを特徴とする、上記(7)に記載のシステム。
(9)データ処理機能を実施するための複数のカードの1つを分離する方法において、前記方法が、
前記複数のカードのうち、エラー信号を出した特定の1つを識別するステップと、
残りの複数のカードがデータ処理活動を続行する間に前記複数のカードのうちの前記1つをリセットするステップとを含むことを特徴とする方法。
(10)前記方法が、
それぞれが複数のカードの1つに対応し、前記カードをCPUと相互接続するための複数のインタフェース手段を設けるステップと、
前記インタフェース手段により、前記複数のカードのうちの対応する1つがエラー信号を出したかどうかを指示するステップとをさらに含むことを特徴とする、上記(9)に記載の方法。
(11)前記識別ステップが、
前記複数のカードのうち、前記エラー信号を出した前記1つによってデータ処理機能を実施するためのすべての要求を無視するステップと、
前記複数のカードのうち、前記エラー信号を出した前記1つと、システム・メモリとの間の直接メモリ・アクセス動作を打ち切るステップとをさらに含むことを特徴とする、上記(10)に記載の方法。
(12)前記リセット・ステップが、
前記複数のカードのうちのどれが前記エラー信号を出したかを判定するステップと、
前記複数のカードのうち、前記エラー信号を出した前記1つを再構成するステップとを含むことを特徴とする、上記(11)に記載の方法。
(13)前記再構成ステップが、前記複数のカードのうち、前記エラー信号を出した前記1つを再初期設定するステップを含むことを特徴とする、上記(12)に記載の方法。
(14)前記リセット・ステップが、
前記複数のカードのうち、前記エラー信号を出した前記1つのエラー条件を修理するためにエラー回復ルーチンを呼び出すステップと、
前記複数のカードのうちの前記1つで前記データ処理活動を再実施するステップとをさらに含むことを特徴とする、上記(13)に記載の方法。
(15)前記指示ステップが、前記複数のカードのうちの対応する1つによってエラー信号が出されたかどうかを示す状況ビットをレジスタに格納するステップを含むことを特徴とする、上記(14)に記載の方法。
(16)前記判定ステップが、前記複数のカードのうちの1つに対応するデバイス・ドライバによって前記レジスタをポーリングするステップを含むことを特徴とする、上記(15)に記載の方法。
【図面の簡単な説明】
【図1】システム・ボードおよびアダプタ・カードと、それらの機械的関係を示す斜視図である。
【図2】対応する接続ガイド部材を備えたアダプタ・カードの正面図である。
【図3】図2の切断線A−Aに沿って示す、本発明のアダプタ・カードおよびガイド部材の平面図である。
【図4】図2の切断線B−Bに沿って示す、本発明のアダプタ・カードおよびガイド部材の正面図である。
【図5】本発明のアダプタ・カードおよびガイド部材を収容するスロットを示す、コンピュータ・システム・カバーの斜視図である。
【図6】ホスト・ブリッジにより入出力バスに接続されたシステム・バスを有し、複数のアダプタ・スロットが入出力バスに電気的に接続されているコンピュータ・システムの概略図である。
【図7】複数カード・スロットのバンクを含む、本発明のアダプタ・カード・スロット態様の動作に必要な制御信号を示す概略図である。
【図8】アダプタ・カードを入出力スロットにホット・プラグするために本発明によって実施される様々なプロセス・ステップを示す流れ図である。
【図9】エラー回復を強化するために入出力アダプタ・スロットが分離された、本発明の他の態様に必要な制御信号を示す概略図である。
【図10】本発明のエラー回復態様を実施するために必要なステップの流れ図である。
【図11】アダプタ・カード・スロットへの電力をランプ・アップまたはランプ・ダウンするために本発明が使用可能な回路の一例を示す概略図である。
【図12】システム全体をオフライン化する必要がなく、カードの取付け、取外し、または交換のために複数スロットのバンクを非活動化することができる、本発明の好ましい一実施例を示すブロック図である。
【図13】複数スロットのバンクのカードの取外し、取付け、または交換を行うのに必要なステップを示す流れ図である。
【符号の説明】
1 システム・ボード
2 マイクロプロセッサ
3 特定用途向け集積回路
4 インライン・コネクタ
4a インライン・コネクタ
5 機構またはアダプタ・カード
6 チップ
7 チップ
8 相互接続部
9 導電タブ
10 導電ランド

Claims (28)

  1. (a)データ処理機能を実施するための、着脱可能な複数のカードと、
    (b)それぞれが複数のカードの1つに対応し、前記カードを入出力バスと相互接続するための複数のブリッジ・インタフェースと、
    (c)前記ブリッジ・インタフェース内にあって、前記複数のカードのうちの対応する1つがエラー信号を出したかどうかを判定するための手段と、
    (d)前記ブリッジ・インタフェース内にあって、前記複数のカードのうち、エラー信号を出した特定の1つのカードを前記入出力バスから分離させることによって、前記エラー信号が前記入出力バスに伝送されるのを防止する手段と、
    (e)前記ブリッジ・インタフェース内にあって、残りの複数のカードがデータ処理活動を続行している間に、前記エラー信号を出した特定の1つのカードをリセットするための手段と、
    を含むことを特徴とする、コンピュータ・システム。
  2. 前記ブリッジ・インタフェースの中にあって、
    該ブリッジ・インタフェースに接続された前記カードがエラー信号を出したかどうかを示す状況ビットを格納するためのレジスタを、さらに含むことを特徴とする、請求項1に記載のシステム。
  3. 前記ブリッジ・インタフェースが、
    前記複数のカードのうち、前記エラー信号を出した前記特定の1つのカードによってデータ処理機能を実施するためのすべての要求を無視するための手段と、
    前記複数のカードのうち、前記エラー信号を出した前記特定の1つのカードと、システム・メモリとの間の直接メモリ・アクセス動作を打ち切るための手段と、
    をさらに含むことを特徴とする、請求項1または2に記載のシステム。
  4. 前記リセット手段が、
    前記複数のカードのうち、前記エラー信号を出した前記特定の1つのカードを再構成するための手段と、
    を含むことを特徴とする、請求項1〜3の何れか1つに記載のシステム。
  5. 前記再構成手段が、前記複数のカードのうち、前記エラー信号を出した前記特定の1つのカードを再初期設定するための手段を含むことを特徴とする、請求項4に記載のシステム。
  6. 前記再構成手段が、
    前記複数のカードのうち、前記エラー信号を出した前記特定の1つのカードのエラー条件を修理するためにエラー回復ルーチンを呼び出すための手段と、
    前記エラー信号を出した前記特定の1つのカードで前記データ処理活動を再実施するための手段と、
    を含むことを特徴とする、請求項4に記載のシステム。
  7. データ処理機能を実施するための複数のカードと、それぞれが複数のカードの1つに対応し、前記カードを入出力バスと相互接続するための複数のブリッジ・インタフェースとを備えたコンピュータ・システムが実行するコンピュータ処理方法であって、
    前記ブリッジ・インタフェースが、前記複数のカードのうちの対応する1つがエラー信号を出したかどうかを判定するステップと
    前記ブリッジ・インタフェースが、前記複数のカードのうち、エラー信号を出した特定の1つのカードを前記入出力バスから分離させることによって、前記エラー信号が前記入出力バスに伝送されるのを防止するステップと、
    前記ブリッジ・インタフェースが、残りの複数のカードがデータ処理活動を続行している間に、前記エラー信号を出した前記特定の1つのカードをリセットするステップと、
    を含むことを特徴とするコンピュータ処理方法。
  8. 前記ブリッジ・インタフェースが、
    前記ブリッジ・インタフェースに接続された前記カードが前記エラー信号を出したかどうかを示す状況ビットを前記ブリッジ・インタフェース内のレジスタに格納するステップを、さらに実行することを特徴とする、請求項に記載の方法。
  9. 前記ブリッジ・インタフェースが、
    前記複数のカードのうち、前記エラー信号を出した前記特定の1つのカード係るデータ処理機能を実施するためのすべての要求を無視するステップと、
    前記複数のカードのうち、前記エラー信号を出した前記特定の1つのカードと、システム・メモリとの間の直接メモリ・アクセス動作を打ち切るステップと、をさらに実行することを特徴とする、請求項またはに記載の方法。
  10. 前記リセット・ステップが、
    前記複数のカードのうち、前記エラー信号を出した前記特定の1つのカードを再構成するステップと、を含むことを特徴とする、請求項の何れか1つに記載の方法。
  11. 前記再構成ステップが、前記複数のカードのうち、前記エラー信号を出した前記特定の1つのカードを再初期設定するステップを含むことを特徴とする、請求項1に記載の方法。
  12. 前記再構成ステップが、
    前記複数のカードのうち、前記エラー信号を出した前記特定の1つのカードのエラー条件を修理するためにエラー回復ルーチンを呼び出すステップと、
    前記複数のカードのうち、前記エラー信号を出した前記特定の1つのカードで前記データ処理活動を再実施するステップと、
    を含むことを特徴とする、請求項1に記載の方法。
  13. 自身を覆うカバーを有するコンピュータ・システムにおいて、
    (a)プロセッサと、
    (b)前記プロセッサに接続されたシステム・バスと、
    (c)前記システム・バスに接続されたブリッジ・チップと、
    (d)前記ブリッジ・チップに接続された入出力用のメザニン・バスと、
    (e)カードを受け入れるための複数の入出力スロットと、
    (f)入出力用の前記メザニン・バスに電気的に接続され、それぞれが複数の入出力スロットの1つに対応し、前記入出力スロットを入出力用の前記メザニン・バスと相互接続するための複数のブリッジ・インタフェースと、
    (f1)前記ブリッジ・インタフェース内にあって、前記複数のカードのうち、エラー信号を出した特定の1つのカードを前記入出力用のメザニン・バスから分離させることによって、前記エラー信号が前記入出力用のメザニン・バスに伝送されるのを防止する手段と、
    )前記プロセッサがデータ処理を遂行し、前記入出力用のメザニン・バスが作動している間に、前記エラー信号を出した特定の1つのカードに対応する前記入出力スロットを不活性化させることにより前記コンピュータ・システムのハードウェア構成を変化させる手段と、
    )前記コンピュータ・システムから前記カバーを取り外さずに前記カードを交換可能 手段と、を含み、
    前記(g)に示される変化手段は、
    リセット制御信号を活性化させる手段と、
    該リセット制御信号を検出する手段と、
    前記少なくとも1つの入出力スロット内にあるカードをリセットする手段と、
    をさらに含むことを特徴とするコンピュータ・システム。
  14. 前記エラー信号を出した特定の1つのカードに対応する前記入出力スロットが空であるかどうかを判定する手段を、さらに含むことを特徴とする請求項1に記載のコンピュータ・システム。
  15. 前記()に示される変化手段は、
    前記エラー信号を出した特定の1つのカードに対応する前記入出力スロット内にある前記エラー信号を出した特定の1つのカードに係るデータ処理活動を終了させる手段を含むことを特徴とする請求項1に記載のコンピュータ・システム。
  16. 前記(g)に示される変化手段は、
    前記リセット手段に応答して、前記ブリッジ・インタフェースによって、前記エラー信号を出した特定の1つのカードに対応する前記入出力スロットを入出力用の前記メザニン・バスから切り離し、前記エラー信号を出した特定の1つのカードに対応する前記入出力スロットへの電力を減少させる手段を、
    さらに含むことを特徴とする請求項13に記載のコンピュータ・システム。
  17. 前記(g)に示される変化手段は、
    前記エラー信号を出した特定の1つのカードに対応する前記入出力スロットが不活性化され、前記エラー信号を出した特定の1つのカードが取り除かれうる状態になったことを示すLEDを、
    さらに含むことを特徴とする請求項16に記載のコンピュータ・システム。
  18. 前記(g)に示される変化手段は、
    前記不活性化された入出力スロット内にインストールされる新しいカードが、コネクタに挿入されたことを検出する手段と、
    該新しいカードの検出に応じて、コネクタへの電力を増加させる手段と、
    を、さらに含むことを特徴とする請求項17に記載のコンピュータ・システム。
  19. 前記(g)に示される変化手段は、
    前記新しいカードの検出に応じて、前記ブリッジ・インタフェースによって、前記新しいカードがコネクタに挿入された入出力スロットを前記入出力用のメザニン・バスに接続する手段と、
    前記リセット制御信号を不活性化させる手段と、
    を、さらに含むことを特徴とする請求項18に記載のコンピュータ・システム。
  20. 前記(g)に示される変化手段は、
    前記新しいカードがコネクタに挿入された入出力スロットにおいて、前記新しいカードに対するデータ処理活動を開始する手段を、
    さらに含むことを特徴とする請求項19に記載のコンピュータ・システム。
  21. システム・バスに接続されたプロセッサと、前記システム・バスを入出力用のメザニン・バスに接続するブリッジ・チップと、複数のカードを受け入れるための複数の入出力スロットと、入出力用の前記メザニン・バスに電気的に接続され、それぞれが複数の入出力 スロットの1つに対応し、前記入出力スロットを入出力用の前記メザニン・バスと相互接続するための複数のブリッジ・インタフェースと、自身を覆うカバーを有しており、前記カバーを取り外さずに前記カードを交換可能なコンピュータ・システムが実行するハードウェア構成を変化させる方法であって、
    (a)前記ブリッジ・インタフェースが、前記複数のカードのうち、エラー信号を出した特定の1つのカードを前記入出力用のメザニン・バスから分離させることによって、前記エラー信号が前記入出力用のメザニン・バスに伝送されるのを防止するステップと、
    (b)前記プロセッサがデータ処理を遂行し、前記入出力用のメザニン・バスが作動している間に、前記エラー信号を出した特定の1つのカードに対応する入出力スロットを不活性化させるステップと、を含み、
    さらに、前記不活性化させるステップが、
    リセット制御信号を活性化させるステップと、
    該リセット制御信号を検出するステップと、
    前記少なくとも1つの入出力スロット内にあるカードをリセットするステップと、
    を含むことを特徴とする方法。
  22. 前記エラー信号を出した特定の1つのカードに対応する入出力スロットが空であるかどうかを判定するステップを、さらに含むことを特徴とする請求項2に記載の方法。
  23. 前記エラー信号を出した特定の1つのカードに対応する入出力スロット内にあるカードに係るデータ処理活動を終了させるステップを、含むことを特徴とする請求項2に記載の方法。
  24. 前記リセットステップに応答して、前記ブリッジ・インタフェースによって、前記エラー信号を出した特定の1つのカードに対応する入出力スロットを前記入出力用のメザニン・バスから切り離し、前記エラー信号を出した特定の1つのカードに対応する入出力スロットへの電力を減少させるステップ、
    を、さらに含むことを特徴とする請求項23に記載の方法。
  25. 前記エラー信号を出した特定の1つのカードに対応する入出力スロットが不活性化され、前記エラー信号を出した特定の1つのカードが取り除かれうる状態になったことを表示するステップ、
    を、さらに含むことを特徴とする請求項24に記載の方法。
  26. 前記エラー信号を出した特定の1つのカードに対応する入出力スロット内にインストールされる新しいカードが、コネクタに挿入されたことを検出するステップと、
    該新しいカードの検出に応じて、コネクタへの電力を増加させるステップと、
    を、さらに含むことを特徴とする請求項25に記載の方法。
  27. 前記新しいカードの検出に応じて、前記ブリッジ・インタフェースによって、前記エラー信号を出した特定の1つのカードに対応する入出力スロットを前記入出力用のメザニン・バスに接続させ、前記リセット制御信号を不活性化させるステップと、
    を、さらに含むことを特徴とする請求項26に記載の方法。
  28. 前記エラー信号を出した特定の1つのカードに対応する入出力スロットにおいて、前記新しいカードに対するデータ処理活動を開始するステップと、
    を、さらに含むことを特徴とする請求項27に記載の方法。
JP27972796A 1995-11-02 1996-10-22 データ処理システム内の周辺構成要素の分離によるエラー回復 Expired - Lifetime JP3771649B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US55688795A 1995-11-02 1995-11-02
US08/556887 1995-11-02

Publications (2)

Publication Number Publication Date
JPH09218828A JPH09218828A (ja) 1997-08-19
JP3771649B2 true JP3771649B2 (ja) 2006-04-26

Family

ID=24223235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27972796A Expired - Lifetime JP3771649B2 (ja) 1995-11-02 1996-10-22 データ処理システム内の周辺構成要素の分離によるエラー回復

Country Status (3)

Country Link
US (1) US5815647A (ja)
JP (1) JP3771649B2 (ja)
KR (1) KR100244836B1 (ja)

Families Citing this family (151)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6182180B1 (en) 1997-05-13 2001-01-30 Micron Electronics, Inc. Apparatus for interfacing buses
US6192434B1 (en) 1997-05-13 2001-02-20 Micron Electronics, Inc System for hot swapping a programmable adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6173346B1 (en) 1997-05-13 2001-01-09 Micron Electronics, Inc. Method for hot swapping a programmable storage adapter using a programmable processor for selectively enabling or disabling power to adapter slot in response to respective request signals
US6134668A (en) 1997-05-13 2000-10-17 Micron Electronics, Inc. Method of selective independent powering of portion of computer system through remote interface from remote interface power supply
US6179486B1 (en) 1997-05-13 2001-01-30 Micron Electronics, Inc. Method for hot add of a mass storage adapter on a system including a dynamically loaded adapter driver
US6499073B1 (en) 1997-05-13 2002-12-24 Micron Electronics, Inc. System using programmable processor for selectively enabling or disabling power to adapter in response to respective request signals
US6363497B1 (en) 1997-05-13 2002-03-26 Micron Technology, Inc. System for clustering software applications
US6219734B1 (en) 1997-05-13 2001-04-17 Micron Electronics, Inc. Method for the hot add of a mass storage adapter on a system including a statically loaded adapter driver
US6249834B1 (en) 1997-05-13 2001-06-19 Micron Technology, Inc. System for expanding PCI bus loading capacity
US6330690B1 (en) 1997-05-13 2001-12-11 Micron Electronics, Inc. Method of resetting a server
US5892928A (en) 1997-05-13 1999-04-06 Micron Electronics, Inc. Method for the hot add of a network adapter on a system including a dynamically loaded adapter driver
US6253334B1 (en) 1997-05-13 2001-06-26 Micron Electronics, Inc. Three bus server architecture with a legacy PCI bus and mirrored I/O PCI buses
US6163849A (en) 1997-05-13 2000-12-19 Micron Electronics, Inc. Method of powering up or powering down a server to a maintenance state
US6145098A (en) 1997-05-13 2000-11-07 Micron Electronics, Inc. System for displaying system status
US6170028B1 (en) 1997-05-13 2001-01-02 Micron Electronics, Inc. Method for hot swapping a programmable network adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6247079B1 (en) 1997-05-13 2001-06-12 Micron Electronics, Inc Apparatus for computer implemented hot-swap and hot-add
US6202111B1 (en) 1997-05-13 2001-03-13 Micron Electronics, Inc. Method for the hot add of a network adapter on a system including a statically loaded adapter driver
US6269417B1 (en) 1997-05-13 2001-07-31 Micron Technology, Inc. Method for determining and displaying the physical slot number of an expansion bus device
US6163853A (en) 1997-05-13 2000-12-19 Micron Electronics, Inc. Method for communicating a software-generated pulse waveform between two servers in a network
US5987554A (en) 1997-05-13 1999-11-16 Micron Electronics, Inc. Method of controlling the transfer of information across an interface between two buses
US6324608B1 (en) 1997-05-13 2001-11-27 Micron Electronics Method for hot swapping of network components
US6266721B1 (en) 1997-05-13 2001-07-24 Micron Electronics, Inc. System architecture for remote access and control of environmental management
US6338150B1 (en) 1997-05-13 2002-01-08 Micron Technology, Inc. Diagnostic and managing distributed processor system
US6247080B1 (en) 1997-05-13 2001-06-12 Micron Electronics, Inc. Method for the hot add of devices
US6292905B1 (en) 1997-05-13 2001-09-18 Micron Technology, Inc. Method for providing a fault tolerant network using distributed server processes to remap clustered network resources to other servers during server failure
US6269412B1 (en) 1997-05-13 2001-07-31 Micron Technology, Inc. Apparatus for recording information system events
US6073255A (en) 1997-05-13 2000-06-06 Micron Electronics, Inc. Method of reading system log
US6195717B1 (en) 1997-05-13 2001-02-27 Micron Electronics, Inc. Method of expanding bus loading capacity
US6249828B1 (en) * 1997-05-13 2001-06-19 Micron Electronics, Inc. Method for the hot swap of a mass storage adapter on a system including a statically loaded adapter driver
US6148355A (en) 1997-05-13 2000-11-14 Micron Electronics, Inc. Configuration management method for hot adding and hot replacing devices
US6134615A (en) * 1997-05-13 2000-10-17 Micron Electronics, Inc. System for facilitating the replacement or insertion of devices in a computer system through the use of a graphical user interface
US6122758A (en) 1997-05-13 2000-09-19 Micron Electronics, Inc. System for mapping environmental resources to memory for program access
US6138250A (en) 1997-05-13 2000-10-24 Micron Electronics, Inc. System for reading system log
US6243838B1 (en) 1997-05-13 2001-06-05 Micron Electronics, Inc. Method for automatically reporting a system failure in a server
US6418492B1 (en) 1997-05-13 2002-07-09 Micron Electronics Method for computer implemented hot-swap and hot-add
US6170067B1 (en) 1997-05-13 2001-01-02 Micron Technology, Inc. System for automatically reporting a system failure in a server
US6243773B1 (en) 1997-05-13 2001-06-05 Micron Electronics, Inc. Configuration management system for hot adding and hot replacing devices
US6304929B1 (en) 1997-05-13 2001-10-16 Micron Electronics, Inc. Method for hot swapping a programmable adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6134673A (en) 1997-05-13 2000-10-17 Micron Electronics, Inc. Method for clustering software applications
US6122746A (en) 1997-05-13 2000-09-19 Micron Electronics, Inc. System for powering up and powering down a server
US6202160B1 (en) 1997-05-13 2001-03-13 Micron Electronics, Inc. System for independent powering of a computer system
US6012114A (en) * 1997-06-30 2000-01-04 Compaq Computer Corporation System for preventing software of a computer system from interacting with a connector to avoid data corruption due to surprise removal of a circuit card
KR100259841B1 (ko) * 1997-07-31 2000-06-15 윤종용 씽글 칩을 이용한 피씨아이 버스의 핫 플러그 제어기
US5938751A (en) * 1997-08-15 1999-08-17 Compaq Computer Corporation Bus ring-back and voltage over-shoot reduction techniques coupled with hot-pluggability
US6154835A (en) 1997-10-01 2000-11-28 Micron Electronics, Inc. Method for automatically configuring and formatting a computer system and installing software
US6212585B1 (en) * 1997-10-01 2001-04-03 Micron Electronics, Inc. Method of automatically configuring a server after hot add of a device
US6138179A (en) 1997-10-01 2000-10-24 Micron Electronics, Inc. System for automatically partitioning and formatting a primary hard disk for installing software in which selection of extended partition size is not related to size of hard disk
US6199173B1 (en) 1997-10-01 2001-03-06 Micron Electronics, Inc. Method for mapping environmental resources to memory for program access
US6088816A (en) 1997-10-01 2000-07-11 Micron Electronics, Inc. Method of displaying system status
US6175490B1 (en) 1997-10-01 2001-01-16 Micron Electronics, Inc. Fault tolerant computer system
US6065053A (en) 1997-10-01 2000-05-16 Micron Electronics, Inc. System for resetting a server
US6263387B1 (en) 1997-10-01 2001-07-17 Micron Electronics, Inc. System for automatically configuring a server after hot add of a device
US6009541A (en) 1997-10-01 1999-12-28 Micron Electronics, Inc. Apparatus for performing an extensive diagnostic test in conjunction with a bios test routine
US5996038A (en) * 1998-01-26 1999-11-30 Intel Corporation Individually resettable bus expander bridge mechanism
US6035355A (en) * 1998-04-27 2000-03-07 International Business Machines Corporation PCI system and adapter requirements following reset
US6223299B1 (en) * 1998-05-04 2001-04-24 International Business Machines Corporation Enhanced error handling for I/O load/store operations to a PCI device via bad parity or zero byte enables
US6199130B1 (en) * 1998-06-04 2001-03-06 International Business Machines Corporation Concurrent maintenance for PCI based DASD subsystem with concurrent maintenance message being communicated between SPCN (system power control network) and I/O adapter using PCI bridge
JP2000003255A (ja) * 1998-06-12 2000-01-07 Nec Corp ディスクアレイ装置
KR100305312B1 (ko) 1998-06-15 2001-11-30 윤종용 인터페이스장치
US6128682A (en) * 1998-06-25 2000-10-03 Compaq Computer Corporation Method and apparatus for bus isolation
US6205503B1 (en) 1998-07-17 2001-03-20 Mallikarjunan Mahalingam Method for the hot swap and add of input/output platforms and devices
US6223234B1 (en) 1998-07-17 2001-04-24 Micron Electronics, Inc. Apparatus for the hot swap and add of input/output platforms and devices
US6189117B1 (en) 1998-08-18 2001-02-13 International Business Machines Corporation Error handling between a processor and a system managed by the processor
US6269459B1 (en) * 1998-08-25 2001-07-31 Advanced Micro Devices, Inc. Error reporting mechanism for an AGP chipset driver using a registry
US6295566B1 (en) * 1998-10-31 2001-09-25 Campaq Computer Corporation PCI add-in-card capability using PCI-to-PCI bridge power management
US6324596B1 (en) * 1998-11-30 2001-11-27 Micron Technology, Inc. Providing device status during bus retry operations
US6240473B1 (en) 1998-11-30 2001-05-29 Micron Technology, Inc. Providing device status during bus retry operations
US6507879B1 (en) * 1999-02-11 2003-01-14 Micron Technology, Inc. Apparatus for configuration devices on a communications channel
US6363452B1 (en) * 1999-03-29 2002-03-26 Sun Microsystems, Inc. Method and apparatus for adding and removing components without powering down computer system
US6345331B1 (en) * 1999-04-20 2002-02-05 International Business Machines Corporation Device adapter being reintegrated with plurality of device adapters of network, or reestablishing permissions and resubmitting I/O requests depending on determined device state after failure
FI107207B (fi) * 1999-04-28 2001-06-15 Nokia Networks Oy Menetelmä, järjestelmä ja laite viallisen yksikön tunnistamiseksi
US6253250B1 (en) * 1999-06-28 2001-06-26 Telocity, Incorporated Method and apparatus for bridging a plurality of buses and handling of an exception event to provide bus isolation
US6574752B1 (en) 1999-07-15 2003-06-03 International Business Machines Corporation Method and system for error isolation during PCI bus configuration cycles
US6633946B1 (en) * 1999-09-28 2003-10-14 Sun Microsystems, Inc. Flexible switch-based I/O system interconnect
US7266728B1 (en) * 1999-10-01 2007-09-04 Stmicroelectronics Ltd. Circuit for monitoring information on an interconnect
US6553444B1 (en) * 1999-10-28 2003-04-22 Hewlett-Packard Development Company, L.P. Method and system for sensing the proper insertion of a portable memory element
US6564340B1 (en) * 1999-11-18 2003-05-13 Honeywell International Inc. Fault tolerant virtual VMEbus backplane design
US6526528B1 (en) * 2000-01-19 2003-02-25 Bae Systems Controls, Inc. Ticket punch watchdog monitor
US6735715B1 (en) 2000-04-13 2004-05-11 Stratus Technologies Bermuda Ltd. System and method for operating a SCSI bus with redundant SCSI adaptors
US6687851B1 (en) 2000-04-13 2004-02-03 Stratus Technologies Bermuda Ltd. Method and system for upgrading fault-tolerant systems
US6820213B1 (en) 2000-04-13 2004-11-16 Stratus Technologies Bermuda, Ltd. Fault-tolerant computer system with voter delay buffer
US6691257B1 (en) 2000-04-13 2004-02-10 Stratus Technologies Bermuda Ltd. Fault-tolerant maintenance bus protocol and method for using the same
US6708283B1 (en) 2000-04-13 2004-03-16 Stratus Technologies, Bermuda Ltd. System and method for operating a system with redundant peripheral bus controllers
US6633996B1 (en) 2000-04-13 2003-10-14 Stratus Technologies Bermuda Ltd. Fault-tolerant maintenance bus architecture
FR2810426B1 (fr) * 2000-06-16 2006-01-27 Canon Kk Dispositif et procede de controle d'acces de peripherique informatique
US6658599B1 (en) * 2000-06-22 2003-12-02 International Business Machines Corporation Method for recovering from a machine check interrupt during runtime
US6662320B1 (en) * 2000-07-20 2003-12-09 International Business Machines Corporation Method and apparatus for inhibiting an adapter bus error signal following a reset operation
US6892263B1 (en) 2000-10-05 2005-05-10 Sun Microsystems, Inc. System and method for hot swapping daughtercards in high availability computer systems
US7225467B2 (en) * 2000-11-15 2007-05-29 Lockheed Martin Corporation Active intrusion resistant environment of layered object and compartment keys (airelock)
US7213265B2 (en) * 2000-11-15 2007-05-01 Lockheed Martin Corporation Real time active network compartmentalization
US6629048B1 (en) 2000-11-20 2003-09-30 Tektronix, Inc. Measurement test instrument and associated voltage management system for accessory device
US6745345B2 (en) * 2000-12-04 2004-06-01 International Business Machines Corporation Method for testing a computer bus using a bridge chip having a freeze-on-error option
US6766479B2 (en) 2001-02-28 2004-07-20 Stratus Technologies Bermuda, Ltd. Apparatus and methods for identifying bus protocol violations
US20020184576A1 (en) * 2001-03-29 2002-12-05 International Business Machines Corporation Method and apparatus for isolating failing hardware in a PCI recoverable error
US6807596B2 (en) * 2001-07-26 2004-10-19 Hewlett-Packard Development Company, L.P. System for removing and replacing core I/O hardware in an operational computer system
US7096300B2 (en) * 2001-08-31 2006-08-22 American Megatrends, Inc. Method and apparatus for suspending communication with a hard disk drive in order to transfer data relating to the hard disk drive
US7159063B2 (en) * 2001-08-31 2007-01-02 American Megatrends, Inc. Method and apparatus for hot-swapping a hard disk drive
US7007109B2 (en) 2001-08-31 2006-02-28 American Megatrends, Inc. Method and apparatus for suspending communication with a hard disk drive in order to transfer data relating to the hard disk drive
US6963942B2 (en) * 2001-12-04 2005-11-08 Motorola, Inc. High availability system and method for improved intialization
US6904546B2 (en) * 2002-02-12 2005-06-07 Dell Usa, L.P. System and method for interface isolation and operating system notification during bus errors
US7487283B2 (en) * 2002-08-16 2009-02-03 American Megatrends, Inc. Apparatus for bridging two or more data communications interfaces
US7650530B2 (en) * 2002-09-30 2010-01-19 International Business Machines Corporation Initializing a processing system to ensure fail-safe boot when faulty PCI adapters are present
US7146643B2 (en) * 2002-10-29 2006-12-05 Lockheed Martin Corporation Intrusion detection accelerator
US20070061884A1 (en) * 2002-10-29 2007-03-15 Dapp Michael C Intrusion detection accelerator
US20040083466A1 (en) * 2002-10-29 2004-04-29 Dapp Michael C. Hardware parser accelerator
US7080094B2 (en) * 2002-10-29 2006-07-18 Lockheed Martin Corporation Hardware accelerated validating parser
US7051140B2 (en) * 2002-11-13 2006-05-23 International Business Machines Corporation Connector that enables aggregation of independent system resources across PCI/PCI-X bus and interlocked method for aggregating independent system resources across PCI/PCI-X bus
US7664991B1 (en) * 2002-12-17 2010-02-16 Symantec Operating Corporation System and method for distributed file system I/O recovery
US7480831B2 (en) * 2003-01-23 2009-01-20 Dell Products L.P. Method and apparatus for recovering from a failed I/O controller in an information handling system
US20040172234A1 (en) * 2003-02-28 2004-09-02 Dapp Michael C. Hardware accelerator personality compiler
US7103808B2 (en) * 2003-04-10 2006-09-05 International Business Machines Corporation Apparatus for reporting and isolating errors below a host bridge
US20040267969A1 (en) * 2003-05-01 2004-12-30 Takayuki Uchida IEEE 1394 function control apparatus and method of controlling multiple functions
US7577877B2 (en) * 2003-05-22 2009-08-18 Hewlett-Packard Development Company, L.P. Mechanisms to prevent undesirable bus behavior
US7107495B2 (en) * 2003-06-19 2006-09-12 International Business Machines Corporation Method, system, and product for improving isolation of input/output errors in logically partitioned data processing systems
US20050052856A1 (en) * 2003-09-04 2005-03-10 Sun Microsystems, Inc. Method and apparatus having field replaceable units with electrical connectors
US7251753B2 (en) * 2003-09-17 2007-07-31 International Business Machines Corporation Apparatus, system, and method for identifying a faulty communication module
US7657689B1 (en) * 2003-10-07 2010-02-02 Altera Corporation Methods and apparatus for handling reset events in a bus bridge
US20050081080A1 (en) * 2003-10-14 2005-04-14 International Business Machines Corporation Error recovery for data processing systems transferring message packets through communications adapters
US7194663B2 (en) * 2003-11-18 2007-03-20 Honeywell International, Inc. Protective bus interface and method
JP4218538B2 (ja) * 2004-01-28 2009-02-04 日本電気株式会社 コンピュータシステム、バスコントローラ及びそれらに用いるバス障害処理方法
US7415634B2 (en) * 2004-03-25 2008-08-19 International Business Machines Corporation Method for fast system recovery via degraded reboot
US8028189B2 (en) * 2004-11-17 2011-09-27 International Business Machines Corporation Recoverable machine check handling
US7624305B2 (en) * 2004-11-18 2009-11-24 International Business Machines Corporation Failure isolation in a communication system
US20060150010A1 (en) * 2005-01-03 2006-07-06 Stiffler Jack J Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
USRE45632E1 (en) * 2005-01-03 2015-07-28 O'shantel Software L.L.C. Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
US7840768B2 (en) * 2005-12-13 2010-11-23 Reliable Technologies, Inc. Memory-controller-embedded apparatus and procedure for achieving system-directed checkpointing without operating-system kernel support
US7447934B2 (en) * 2005-06-27 2008-11-04 International Business Machines Corporation System and method for using hot plug configuration for PCI error recovery
US7532492B2 (en) * 2005-12-20 2009-05-12 Tektronix, Inc. Host controlled voltage input system for an accessory device
US8032745B2 (en) * 2005-12-20 2011-10-04 International Business Machines Corporation Authentication of I2C bus transactions
CN101331438B (zh) * 2006-02-23 2010-08-18 富士通株式会社 维护指导显示装置、维护指导显示方法
EP1830268B1 (en) * 2006-03-03 2019-05-08 STMicroelectronics (Research & Development) Limited Multiple purpose integrated circuit
TWI297780B (en) * 2006-05-24 2008-06-11 Compal Electronics Inc Crcuit board testing interface and its testing method
JP4728896B2 (ja) * 2006-07-13 2011-07-20 エヌイーシーコンピュータテクノ株式会社 コンピュータシステム
JP5096905B2 (ja) * 2007-12-20 2012-12-12 株式会社日立製作所 サーバ装置及びそのリンク回復処理方法
US7711869B1 (en) * 2007-12-20 2010-05-04 Emc Corporation Method for communicating plural signals generated at a source to a remote destination through a single wire
US8510592B1 (en) * 2009-09-15 2013-08-13 Netapp, Inc. PCI error resilience
US8683108B2 (en) 2010-06-23 2014-03-25 International Business Machines Corporation Connected input/output hub management
US8677180B2 (en) 2010-06-23 2014-03-18 International Business Machines Corporation Switch failover control in a multiprocessor computer system
US8656228B2 (en) * 2010-06-23 2014-02-18 International Business Machines Corporation Memory error isolation and recovery in a multiprocessor computer system
US8615622B2 (en) 2010-06-23 2013-12-24 International Business Machines Corporation Non-standard I/O adapters in a standardized I/O architecture
US8745292B2 (en) 2010-06-23 2014-06-03 International Business Machines Corporation System and method for routing I/O expansion requests and responses in a PCIE architecture
US8645606B2 (en) 2010-06-23 2014-02-04 International Business Machines Corporation Upbound input/output expansion request and response processing in a PCIe architecture
US8918573B2 (en) 2010-06-23 2014-12-23 International Business Machines Corporation Input/output (I/O) expansion response processing in a peripheral component interconnect express (PCIe) environment
US8645767B2 (en) 2010-06-23 2014-02-04 International Business Machines Corporation Scalable I/O adapter function level error detection, isolation, and reporting
US8572294B2 (en) * 2011-05-17 2013-10-29 Ncr Corporation Device start up system and method
US9026842B2 (en) 2012-03-20 2015-05-05 Blackberry Limited Selective fault recovery of subsystems
US9235485B2 (en) * 2013-07-22 2016-01-12 International Business Machines Corporation Moving objects in a primary computer based on memory errors in a secondary computer
KR102183852B1 (ko) * 2013-11-22 2020-11-30 삼성전자주식회사 전자 장치의 무결성 검증을 위한 방법, 저장 매체 및 전자 장치
JP2016197360A (ja) * 2015-04-06 2016-11-24 富士通株式会社 情報処理装置、情報処理装置の制御プログラム及び情報処理装置の制御方法
US9792167B1 (en) * 2016-09-27 2017-10-17 International Business Machines Corporation Transparent north port recovery
US11249872B1 (en) * 2020-06-26 2022-02-15 Xilinx, Inc. Governor circuit for system-on-chip

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2202231A1 (de) * 1972-01-18 1973-07-26 Siemens Ag Verarbeitungssystem mit verdreifachten systemeinheiten
US4453215A (en) * 1981-10-01 1984-06-05 Stratus Computer, Inc. Central processing apparatus for fault-tolerant computing
US4689766A (en) * 1984-11-16 1987-08-25 Zenith Electronics Corporation System for resetting the operation of a signal processing device upon the failure of accessng a predetermined memory location within a predetermined time interval
US4870643A (en) * 1987-11-06 1989-09-26 Micropolis Corporation Parallel drive array storage system
JP2568261B2 (ja) * 1988-11-21 1996-12-25 沖電気工業株式会社 カートリッジ接続回路
JPH02294753A (ja) * 1989-05-09 1990-12-05 Fujitsu Ltd 入出力処理装置の初期化方式
WO1991016678A1 (fr) * 1990-04-13 1991-10-31 Fujitsu Limited Procede de remise a zero d'un module adaptateur suite a une panne et syteme d'ordinateur executant ledit procede
US5317697A (en) * 1991-07-31 1994-05-31 Synernetics Inc. Method and apparatus for live insertion and removal of electronic sub-assemblies
US5379184A (en) * 1991-08-30 1995-01-03 Unisys Corporation Pry-in/pry-out disk drive receptacle
US5333285A (en) * 1991-11-21 1994-07-26 International Business Machines Corporation System crash detect and automatic reset mechanism for processor cards
US5319751A (en) * 1991-12-27 1994-06-07 Intel Corporation Device driver configuration in a computer system
US5345350A (en) * 1992-11-13 1994-09-06 International Business Machines Corporation Dual-purpose picker for automated multimedia library
US5367669A (en) * 1993-03-23 1994-11-22 Eclipse Technologies, Inc. Fault tolerant hard disk array controller
KR960016648B1 (ko) * 1993-12-29 1996-12-19 현대전자산업 주식회사 커먼 컨트롤 중복 스위치 방법
US5721882A (en) * 1994-08-05 1998-02-24 Intel Corporation Method and apparatus for interfacing memory devices operating at different speeds to a computer system bus
JPH0895687A (ja) * 1994-09-26 1996-04-12 Fujitsu Ltd I/oカード、このi/oカードに接続される接続ケーブル及びi/oカードのパワーセーブ方法
US5568610A (en) * 1995-05-15 1996-10-22 Dell Usa, L.P. Method and apparatus for detecting the insertion or removal of expansion cards using capacitive sensing
US5644470A (en) * 1995-11-02 1997-07-01 International Business Machines Corporation Autodocking hardware for installing and/or removing adapter cards without opening the computer system cover

Also Published As

Publication number Publication date
KR100244836B1 (ko) 2000-02-15
JPH09218828A (ja) 1997-08-19
US5815647A (en) 1998-09-29
KR970029043A (ko) 1997-06-26

Similar Documents

Publication Publication Date Title
JP3771649B2 (ja) データ処理システム内の周辺構成要素の分離によるエラー回復
US5644470A (en) Autodocking hardware for installing and/or removing adapter cards without opening the computer system cover
US5875310A (en) Secondary I/O bus with expanded slot capacity and hot plugging capability
US6018810A (en) Fault-tolerant interconnection means in a computer system
EP0974085B1 (en) Method and system for enabling nondisruptive live insertion and removal of feature cards in a computer system
US6487623B1 (en) Replacement, upgrade and/or addition of hot-pluggable components in a computer system
US5664119A (en) Local proactive hot swap request/acknowledge system
US6760868B2 (en) Diagnostic cage for testing redundant system controllers
US5754804A (en) Method and system for managing system bus communications in a data processing system
US7260749B2 (en) Hot plug interfaces and failure handling
US6158015A (en) Apparatus for swapping, adding or removing a processor in an operating computer system
US6898740B2 (en) Computer system having configurable core logic chipset for connection to a fault-tolerant accelerated graphics port bus and peripheral component interconnect bus
US20030110337A1 (en) Apparatus and method of connecting and interfacing active device components
EP0868692B1 (en) Processor independent error checking arrangement
JPH11161625A (ja) コンピュータ・システム
US7000153B2 (en) Computer apparatus and method of diagnosing the computer apparatus and replacing, repairing or adding hardware during non-stop operation of the computer apparatus
EP0772134A1 (en) Adapter card slot isolation for hot plugging
US20030070111A1 (en) Supporting error correction and improving error detection dynamically on the PCI-X bus
US6108732A (en) Method for swapping, adding or removing a processor in an operating computer system
US6718488B1 (en) Method and system for responding to a failed bus operation in an information processing system
US8028189B2 (en) Recoverable machine check handling
US7206973B2 (en) PCI validation
US6901344B2 (en) Apparatus and method for verification of system interconnect upon hot-plugging of electronic field replaceable units
JP2003186697A (ja) 周辺デバイス試験システム及び方法
JP4915113B2 (ja) バスシステム、リセットイニシャライズ回路、及びバスシステムにおける障害復旧方法

Legal Events

Date Code Title Description
RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20051213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060210

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100217

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110217

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110217

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120217

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120217

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130217

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130217

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140217

Year of fee payment: 8

EXPY Cancellation because of completion of term