JP2583023B2 - コンピュータ・システムのローカル・エリア・ネットワークへのフォールト・トレラント接続方法および装置 - Google Patents

コンピュータ・システムのローカル・エリア・ネットワークへのフォールト・トレラント接続方法および装置

Info

Publication number
JP2583023B2
JP2583023B2 JP6250637A JP25063794A JP2583023B2 JP 2583023 B2 JP2583023 B2 JP 2583023B2 JP 6250637 A JP6250637 A JP 6250637A JP 25063794 A JP25063794 A JP 25063794A JP 2583023 B2 JP2583023 B2 JP 2583023B2
Authority
JP
Japan
Prior art keywords
network
controller
lan
pair
primary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP6250637A
Other languages
English (en)
Other versions
JPH07235933A (ja
Inventor
ジェイ ローウェット ケヴィン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tandem Computers Inc
Original Assignee
Tandem Computers Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tandem Computers Inc filed Critical Tandem Computers Inc
Publication of JPH07235933A publication Critical patent/JPH07235933A/ja
Application granted granted Critical
Publication of JP2583023B2 publication Critical patent/JP2583023B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2005Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication controllers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2017Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where memory access, memory control or I/O control functionality is redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Small-Scale Networks (AREA)
  • Computer And Data Communications (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、一般に、コンピュー
タ・システム・ネットワークの構成に関し、具体的に
は、発生する故障(フォールト)に対して許容性(トレ
ラント)を有するネットワーク構成に関する。
【0002】
【従来の技術】フォールト・トレラント・コンピュータ
・システムは、以前から長く知られている。コンピュー
タ・タスクの高い利用性が望まれる環境においては、コ
ンピュータ・システムは、様々なフォールト・トレラン
トの設計を備えている。フォールト・トレラント設計と
して、例えば、冗長なパーツ、素子またはモジュール、
データ・チェック機能、およびスキームの補正等があ
る。フォールト・トレラント・コンピュータ・システム
の一例は、米国特許第4,228,496 号に記載されている。
この特許は、例えば、それぞれが単一の故障箇所に制限
する重複した装備の形態でのフォールト・トレラント機
能を有するマルチプロセッサ・システムを教示してい
る。
【0003】このような高い利用性を有するコンピュー
タ・システムの一つの使用形態として、様々なネットワ
ーク構成(例えば、ローカル・エリア・ネットワーク
(LAN))における「サーバ」がある。このコンピュ
ータ・システムは、そのネットワークに接続されたステ
ーション(例えば、パーソナル・コンピュータ(PC)
・システム)によって使用される様々なリソース(例え
ば、アプリケーション・プログラム、データ等)を記憶
し、保持する。しかし、サーバ・ユニットがたとえ高い
利用性を提供するように構成されていても、ネットワー
クが故障箇所を複数含むという点において、ネットワー
ク自体がその利用性を制限してしまう。例えば、ケーブ
ルが切断され、または不注意に取り外されると、ネット
ワークの通信パスが除去され、おそらく一または複数の
ステーションがサーバから孤立するであろう。
【0004】この問題の解決方法としては、十分余剰な
ネットワークを提供することとされてきた。しかし、こ
の解決方法は、アプリケーション・プログラムを大量に
再書き込みする必要がある。したがって、すぐに使用で
きるアプリケーション・プログラムの使用を事実上妨げ
ることになる。
【0005】
【発明が解決しようとする課題】このように、上述した
米国特許第4,228,496 号のようなマルチプロセッサ・シ
ステムによって提供されるフォールト・トレラントの高
い利用性を、ネットワークに拡張する必要があることは
明らかである。このフォールト・トレラント能力の拡張
は、ワークステーション上またはネットワーク上で実行
されているアプリケーションが、修正または変更される
必要が全くないかほとんどないような方法で行われるべ
きである。
【0006】
【課題を解決するための手段】この発明は、一般に、ネ
ットワーク上で実行されるアプリケーションの変更を必
要としない方法で、高い利用性を提供するフォールト・
トレラント・ネットワークの構成に向けられている。こ
の発明のより特徴的な点は、フォールト・トレラント・
コンピュータ・システムのフォールト・トレラント結合
をネットワーク構成に提供し、コンピュータ・システム
のフォールト・トラレント能力をネットワークに拡張す
ることである。
【0007】この発明のネットワーク構成によると、コ
ンピュータ・システムは、好ましくは、上述の米国特許
第4,228,496 号に教示されているようなものに基づいた
マルチプロセッサ、およびこのシステムのプロセッサ・
ユニットの少なくとも一つの入出力(I/O)バスに結
合された一対のネットワーク・コントローラを備えてい
る。一方、この一対のネットワーク・コントローラのそ
れぞれは、一対のマルチポート・ネットワーク・アクセ
ス装置(好ましくは、コンセントレータ(集線装置)、
すなわちIEEEスタンダード802.3 の10BASET (または10
BASE-T:IEEEの10BASE規格の一つ)配線の仕様を用いた
星型配線のリピータ)の対応する一つに接続されてい
る。他のステーションは、好ましくは2つのネットワー
ク・リンクによってネットワークに接続される。各リン
クは、ステーションをネットワーク・アクセス装置の一
つへ接続する。ネットワーク・アクセス装置自体は、好
ましくは、通信できるように、一対のネットワーク・リ
ンクによって互いに接続される。
【0008】一対のネットワーク・コントローラが接続
されたコンピュータ・システム(すなわち、サーバ)
は、ネットワーク・コントローラの一つを、ネットワー
クへの「プライマリ」な通信パスとして選択し、もう一
方のネットワーク・コントローラを「バックアップ」と
して指定する。したがって、処理システム(サーバ)と
ネットワークとの間のすべての通信は、このプライマリ
として選択されたネットワーク・コントローラを介して
行われる。
【0009】2つのネットワーク・コントローラは、メ
ッセージ・パケット(「ハートビート」メッセージと呼
ばれる)を、ネットワークを介して周期的に互いに送信
する。このメッセージ・パケットは、このパケットを送
信しているコントローラと接続パスとが、いまなお作動
状態であることを示す信号である。他方からハートビー
ト・メッセージを受信するネットワーク・コントローラ
の一方に故障が発生すると、コンピュータ・システム
は、そのコントローラを、「アンペアード」(unpaire
d)、すなわち使用不可能としてマークする。この使用
不可能なネットワーク・コントローラが、たまたまプラ
イマリとして選択されているネットワーク・コントロー
ラであるならば、コンピュータ・システムは、最初にバ
ックアップとして指定されているコントローラを、プラ
イマリとして選択するように切り換え、最初にプライマ
リとして選択されたコントローラがアンペアードである
ことをログに記録する。
【0010】したがって、これらのハートビート・メッ
セージは、2つの重要な機能をもつ。第1に、それら
は、各LANコントローラ26および28がメッセージ・パ
ケットを送信し受信できることを確立するために機能す
る。第2に、それらは、ネットワークが、LANコント
ローラ26および28が、一方がプライマリで、他方がバッ
クアップのペアとして機能するように、構成されること
を確立する。
【0011】この発明によるネットワーク構成は、ある
故障がネットワーク/ワークステーション上を実行され
るアプリケーションに全体的に透明性を有することか
ら、ネットワーク構成自体を再構成できる高い利用性を
有するネットワーク・システムを提供する。
【0012】この発明のこれらの特徴および他の特徴、
ならびに利点は、この技術分野の専門家ならば、この発
明についての以下の詳細な内容を、関連する図面を参照
しながら読むことにより、明らかになるであろう。
【0013】
【実施例】図1には、この発明の好ましい実施例とし
て、ローカル・エリア・ネットワーク(LAN)の構成
の概要が示されている。参照符号10で示されたこのネッ
トワークには、このネットワークのネットワーク・サー
バとして機能するコンピュータ・システム12が含まれて
いる。このネットワークは、通信プロトコルとして、例
えば、FDDI、トークン・リング等の他のプロトコル
を使用することもできるが、ここでは、イーサネット・
プロトコルを使用している。したがって、ネットワーク
10で行われる通信は、従来からあるように、メッセージ
・パケットを使用し、パケット発信ステーションの識別
情報(ソース・アドレス)、受信ステーションの識別情
報(デスティネーション・アドレス)、およびネットワ
ークによって使用され、この特定のプロトコルにより提
供される他の情報を含む。
【0014】コンピュータ・システム12は、上述した米
国特許第4,228,496 号に示されているようにフォールト
・トレラントのマルチプロセッサで構成されていること
が好ましい。この技術分野の専門家ならば、コンピュー
タ・システム12に単一のプロセッサ・システムを使用で
きることを理解するであろう。しかし、この場合には、
一箇所の故障の存在も認められず、このためにシステム
全体のフォールト・トレラント能力が制限される。図に
示すように、処理システム12は、プロセッサ・ユニット
14(14a、14b)を備えている。これらのプロセッサ・
ユニットは、相互に接続され、バス16(個別のバス16a
および16bのペア)によってプロセッサ間通信を行う。
また、各プロセッサ・ユニット14は、プロセッサ14aお
よび14b用に、入出力(I/O)バス20(20a、20b)
をそれぞれ備えている。
【0015】典型的には、特にサーバとして機能する場
合には、処理システム12は、大容量記憶装置、例えばデ
ィスク・ユニット22を備えている。これらのディスク・
ユニットは、デュアル・ポートのディスク・コントロー
ラ24によって制御される。このディスク・コントローラ
24は、一方で、I/Oバス20aおよび20bのそれぞれと
接続されている。
【0016】また、デュアル・ポートのLANコントロ
ーラ26および28が、I/Oバス20aおよび20bに接続さ
れている。一方で、このLANネットワーク・コントロ
ーラ26および28は、一対のLANアクセス装置32および
34にそれぞれ接続され、コンピュータ・システム12をL
ANアクセス装置32および34に接続する。利用できるL
ANコントローラとして、ここでは、代表的に、カリフ
ォルニアのキューパティノ(Cupertino )にあるタンデ
ム・コンピュータ社によって製造された3615LANコン
トローラがある。このようなLANコントローラは、マ
イクロプロセッサをベースとしたマシンという点で、
「インテリジェント」装置と呼ばれるものである。
【0017】LANアクセス装置32および34は、それぞ
れ一対のコンセントレータ(集線装置)、すなわち10BA
SET (または10BASE-T:IEEEの10BASE規格の一つ)配線
を使用した星型配線リピータであることが好ましい。利
用可能なアクセス装置として、カリフォルニアのサンタ
・クララのアンジャーマン・バス社(Ungermann-BassCo
rporation)によって製造された2つの10BASET コンセ
ントレータ・カード(P/N ASM 32012 )を含むACCESS/O
NE(アンジャーマン・バス社の登録商標)のASC 2000キ
ャビネットがある。このLANアクセス装置は、後述す
るように、「ハブ」(hub ) 32 および34と呼ばれる。
この技術分野の専門家ならば明らかであろうが、他のタ
イプのメディア・アクセス装置(例えば、ブリッジ)を
この発明の教示する範囲から逸脱することなく使用する
こともできる。
【0018】このように、LANコントローラ26は、リ
ンク36aを介してLANハブ32の複数のポートの一つと
接続され、LANコントローラ28は、リンク36bによっ
てLANハブ34と接続されている。各LANハブ32およ
び36の一対のポート(例えば、バックボーン・コネクシ
ョン・ポート)は、この二つのLANハブ32および34を
リンク38によって互いに接続し、通信できるようにして
いる。また、LANハブ32および34のそれぞれ1つのポ
ートは、リンク42aおよび42bによりワークステーショ
ン44に接続されている。
【0019】LANコントローラ26および28には、3つ
のメディア・アクセス制御(MAC)アドレスがそれぞ
れ割り当てられている。第1のアドレスは、このコント
ローラを指定するためのユニークなアドレスである。こ
のユニークなアドレスをデスティネーション・アドレス
として含んだメッセージ・パケットは、指定されたLA
Nコントローラによってのみ受信される。第2のアドレ
スは、「ペア・ワイズ」(pair-wise )アドレスであ
り、LANコントローラ26および28のペアを指定するも
のである。このようなペア・ワイズ・アドレスをデステ
ィネーション・アドレスとして含むネットワークのメッ
セージ・パケットは、LANコントローラ26と28の両方
で受信される。第3のアドレスは、グループMACアド
レスである。このグループMACアドレスに設定された
メッセージ・パケットは、グループMACアドレスによ
って指定されるグループの全てのユニットまたはステー
ションによって受信される。LANコントローラ26およ
び28がそのグループに割り当てられているならば、これ
らのコントローラにもこのパケットは受信される。
【0020】各プロセッサ・ユニット14は、オペレーテ
ィング・システム(OS)50の制御の下に処理を行う。
OS50は、利用可能な関連する入出力プロセス(IO
P)・デバイス・ドライバ52を有し、このドライバによ
り、プロセッサ・ユニット14との通信が(プロセッサ・
ユニット14とI/Oバス20とのインタフェースを形成す
るI/Oチャネル54を介して)制御される。IOP52
は、LANコントローラ26および28に介して通信を制御
する。
【0021】各LANコントローラは、LANハブ32、
34およびネットワークと通信するのに必要なMACレイ
ヤ・プロトコルを実行する。LANコントローラ26およ
び28のペアは、グループMACアドレスに、いわゆる
「ハートビート」と呼ばれるメッセージ・パケットを周
期的に送信する。このパケットは、このペアとなってい
る他方のコントローラを含む、ネットワーク上の全ての
他の装置によって受信される。したがって、例えば、L
ANコントローラ26は、その兄弟のLANコントローラ
28に受信されるハートビート・メッセージ・パケットを
周期的に送信する。このハートビート・メッセージ・パ
ケットは、一方のLANコントローラが、その兄弟のL
ANコントローラに、この一方のLANコントローラが
まだ処理状態にあり、かつ、このコントローラのネット
ワーク10(および兄弟のLANネットワーク・コントロ
ーラ)への接続が存続していることを示すものである。
LANコントローラ26および28は、このようなハートビ
ート・メッセージ・パケットが受信されないと、その受
信されないことをIOP52に報告する。IOP52は、そ
れが制御するLANコントローラの状態のログ(経過記
録)を、ソフトウェア状態マシン(図2)の形態で保持
する。
【0022】ハートビート・メッセージ・パケットは、
ソース・アドレスとして、そのパケットを送信したLA
Nコントローラ26および28のユニークな識別アドレスを
含む。受信したLANコントローラは、LAN上の他の
トラフィックの報告だけでなく、その兄弟からのハート
ビート・メッセージを受信したことを周期的に報告す
る。ある特定のLANコントローラ(例えば、LANコ
ントローラ28)がその兄弟(例えば、LANコントロー
ラ26)からのメッセージを受信しなかったならば、この
メッセージが受信されなかったことが、対応するIOP
52に報告される。メッセージを送信しなかった(サイレ
ントな)LANコントローラが、プライマリなものとし
て指定されていたならば、この対応するIOP52は、こ
の指定を切り換える。バックアップとして形式的に指定
されていたLANコントローラが、プライマリなものと
なり、前者のプライマリな(現在はサイレントな)LA
Nコントローラは、「アンペアード」(unpaired)とし
て指定される。この「アンペアード」は、何らかの理由
により、LANコントローラまたはそのネットワーク接
続が適切に機能しなくなったことを示すものである。
【0023】2つのプロセッサ14は、一対のLANコン
トローラ26および28に接続されているので、これらのプ
ロセッサは、いずれがこれらのLANコントローラを制
御するのか、すなわちいずれが「プライマリ」なプロセ
ッサ・ユニットになるのかを、2つのプロセッサ間で決
定しなければならない。他のプロセッサは、バックアッ
プになり、プライマリなものが機能しなくなったときに
のみ、処理を行うことになる(米国特許第4,228,496 号
参照)。
【0024】続いて、プライマリなプロセッサ・ユニッ
ト14のIOP52は、このプロセッサ・ユニット14とネッ
トワーク10との間のプライマリな通信パスとして、LA
Nコントローラ26の一つを(少なくとも最初に、大かれ
少なかれ裁定的な方法で)選択する。したがって、プロ
セッサ・ユニット14とのすべての通信は、(IOP52の
制御の下に)選択された「プライマリ」なLANコント
ローラ26を通じて行われる。一対のLANコントローラ
のもう一方(例えば、LANコントローラ28)は、バッ
クアップとして機能する。このバックアップのLANコ
ントローラが、ネットワークからのメッセージ・パケッ
トを受信するかもしれないが、これらのパケットは、指
定されたプロセッサ・ユニット14には送信されない。
【0025】一方がプライマリであり他方がバックアッ
プ(すなわち、利用可能)であるというLANコントロ
ーラ26および28の状態は、IOP52によってソフトウェ
ア・状態マシンに保持される。IOPにより保持される
状態マシンの状態図(状態遷移図)が、図2に示されて
いる。この図は、5つの個別の状態を示し、これらの状
態は、LANコントローラ26および28によって仮定され
る異なる状況(すなわち、各LANコントローラがプラ
イマリ、バックアップ、および「アンペアード」によっ
て示される利用不可能な状態)を示す。各状態は、次に
示すものである。
【0026】1.コントローラ26がプライマリ、コント
ローラ28がバックアップ 2.コントローラ26がバックアップ、コントローラ28が
プライマリ 3.コントローラ26がプライマリ、コントローラ28がア
ンペアード 4.コントローラ26がアンペアード、コントローラ28が
プライマリ 5.両方ともダウン
【0027】上述した用語「アンペアード」は、LAN
コントローラがバックアップとして利用できないことを
示すものである。この利用できないことは、コントロー
ラ自体が正しく作動しない、または例えばLANコント
ローラ26の場合にリンク36aのようなリンクが正しく接
続されていないことに起因する。
【0028】プライマリとして選ばれたLANコントロ
ーラ26または28は、IOP52が送信すべき全てのメッセ
ージ・パケット・トラフィックを通信のためにネットワ
ーク10へ送信し、ネットワーク10からのメッセージ・ト
ラフィックを受信するものとなる。このIOP52は、バ
ックアップ(または明らかに、アンペアード)のLAN
コントローラを介してネットワークとは通信しない。
【0029】IOPに保持された状態マシンが状態変化
を起こす6つの異なるイベントがある。これらのイベン
トは次の通りである。
【0030】1.ハートビート・メッセージが、LAN
コントローラ26によって送信され、LANコントローラ
28によって受信されたものとして、IOP52に報告され
る(以下に示すテーブルでは、これは“HB msg 26 →2
8”として示されている)。 2.ハートビート・メッセージが、LANコントローラ
28によって送信され、LANコントローラ26によって受
信されたものとして、IOP52に報告される(“HB msg
28 →26”)。 3.LANコントローラ26が、LANコントローラ28か
らのハートビート・メッセージ・パケットではないMA
Cメッセージ・パケット・トラフィックを受信したこと
を報告する(“‘26’rpts MAC”)。 4.LANコントローラ28が、LANコントローラ26か
らのハートビート・メッセージ・パケットではないMA
Cメッセージ・パケット・トラフィックを受信したこと
を報告する(“‘28’rpts MAC”)。 5.LANコントローラ26が、サイレントであること
を、すなわち、ハートビート・メッセージもMACメッ
セージ・パケット・トラフィックも受信されないことを
報告する(“‘26’rpts silence”)。
【0031】6.LANコントローラ28が、サイレント
であるこを報告する(“‘28’rptssilence”)。
【0032】上記のイベント発生の結果として状態マシ
ンで行われる3つの動作がある。これらの動作は、次の
とおりである。
【0033】1.切り換える(すなわち、最初にバック
アップであったLANコントローラをプライマリとして
選択する)。 2.イベントの発生を無視する。 3.イベントの発生を報告する。 もちろん、行われる特定の動作は、IOPが保持する状
態マシンの状態に依存する。以下に示す表1〜表5は、
発生する6つのイベントのそれぞれ対応して、行われる
動作およびこのイベントと現在の状態に依存して状態マ
シンによって取られる新しい状態を示している。各表の
左の列は、イベントである。中央の列は、イベントの発
生により取られる動作である。各表の右の列は、動作の
結果を示している(すなわち、同じ状態の留まるか、ま
たは新しい状態に変化することを示している)。
【0034】
【表1】 状態(1) コントローラ26 プライマリ;コントローラ28 バックアップ ─────────────────────────────────── イベント 動作 新たな状態 (1) HB msg 26 →28 (2)無視 (1)-現状態維持 (2) HB msg 28 →26 (2)無視 (1)-現状態維持 (3)"26" rpts MAC (3)報告 (3)-26 プライマリ;28 アンペアード (4)"28" rpts MAC (1)切り換え (4)-26 アンペアード;28 プライマリ (5)"26" rpts silence (1)切り換え (4)-26 アンペアード;28 プライマリ (6)"28" rpts silence (3)報告 (3)-26 プライマリ;28 アンペアード ───────────────────────────────────
【0035】
【表2】 状態(2) コントローラ26 バックアップ;コントローラ28 プライマリ ─────────────────────────────────── イベント 動作 新たな状態 (1) HB msg 26 →28 (2)無視 (2) HB msg 28 →26 (2)無視 (3)"26" rpts MAC (1)切り換え (3)-26 プライマリ;28 アンペアード (4)"28" rpts MAC (3)報告 (4)-26 アンペアード;28 プライマリ (5)"26" rpts silence (3)報告 (4)-26 アンペアード;28 プライマリ (6)"28" rpts silence (1)切り換え (3)-26 プライマリ;28 アンペアード ───────────────────────────────────
【0036】
【表3】 状態(3) コントローラ26 プライマリ;コントローラ28 アンペアード ─────────────────────────────────── イベント 動作 新たな状態 (1) HB msg 26 →28 (3)報告 (1)-26 プライマリ;28 バックアップ (2) HB msg 28 →26 (3)報告 (1)-26 プライマリ;28 バックアップ (3)"26" rpts MAC (2)無視 (3) (4)"28" rpts MAC (2)無視 (3) (5)"26" rpts silence (3)報告 (5)-双方ダウン (6)"28" rpts silence (2)無視 (3) ───────────────────────────────────
【0037】
【表4】 状態(4) コントローラ26 アンペアード;コントローラ28 プライマリ ─────────────────────────────────── イベント 動作 新たな状態 (1) HB msg 26 →28 (3)報告 (2)-26 バックアップ;28 プライマリ (2) HB msg 28 →26 (3)報告 (2)-26 バックアップ;28 プライマリ (3)"26" rpts MAC (2)無視 (4) (4)"28" rpts MAC (2)無視 (4) (5)"26" rpts silence (2)無視 (4) (6)"28" rpts silence (3)報告 (5)-双方ダウン ───────────────────────────────────
【0038】
【表5】 状態(5) 両コントローラ ダウン ─────────────────────────────────── イベント 動作 新たな状態 (1) HB msg 26 →28 (3)報告 (1)-26 プライマリ;28 バックアップ (2) HB msg 28 →26 (3)報告 (2)-26 バックアップ;28 プライマリ (3)"26" rpts MAC (3)報告 (3)-26 プライマリ;28 アンペアード (4)"28" rpts MAC (3)報告 (4)-26 アンペアード;28 プライマリ (5)"26" rpts silence (2)無視 (5) (6)"28" rpts silence (2)無視 (5) ───────────────────────────────────
【0039】例えば、表1は、この状態マシンが状態1
にあるときに発生するイベントを示している。LANコ
ントローラ26がプライマリとして選択され、LANコン
トローラ28はバックアップである。イベント1(LAN
コントローラ28がLANコントローラ26からハートビー
ト・メッセージ・パケットを受信する)が発生すると、
この動作は無視され(アクション2)、状態マシンは状
態1に留まる。しかし、状態1において、イベント3
(LANコントローラ26が、MACメッセージ・パケッ
トのみを受信しハートビート・メッセージ・パケットを
受信していないことをIOPに報告)が発生すると、こ
のイベントは、LANコントローラ28がおそらく上記で
概説した一つまたは複数の原因により利用できなくなっ
ていることを示している。したがって、状態マシンは、
状態1から状態3に移動し、LANコントローラ26は、
プライマリを維持し、LANコントローラ28は、「アン
ペアード」として指定される。
【0040】IOPが保持する状態マシンが状態を維持
するLANコントローラの処理のもう一つの例が、状態
図(図2)の状態3を示す表3に示されている。この表
3では、LANコントローラ26が処理システム12とLA
Nハブ32および34との間のプライマリのデータ・パスの
状態にあり、LANコントローラ28がもはやバックアッ
プでなく、アンペアードの状態にあるときを示してい
る。LANコントローラ28がLANコントローラ26から
のハートビート・メッセージ・パケットの受信の報告を
開始(イベント1)、またはLANコントローラ26がL
ANコントローラ28からのハートビート・メッセージの
受信を報告する、という2つのイベントの一方または双
方が発生したと仮定する。いずれか一方のイベントの発
生は、LANコントローラ26およびそのネットワーク接
続の双方またはいずれか一方が適切に機能していること
を示す。表3は、これらのイベントの発生のいずれかに
よって行われる動作がそれらを制御するIOP52に報告
することであることを示し、また、状態1へ状態変化す
ることを示している(LANコントローラ26はネットワ
ーク10へのプライマリな接続を維持し続け、LANコン
トローラ28の状態はアンペアードからバックアップに変
化する)。表1〜表5の残りのイベントについても、発
生する上記6つのイベント、およびこれらのイベントの
発生の結果として行われ、状態マシンのそのときの状態
に依存して行われる動作を参照して、同様に解釈するこ
とができる。
【0041】IOPが保持する状態マシンの連続した状
態追跡能力により、IOP52は、LANコントローラ26
または28のいずれがネットワーク10へのプライマリな接
続を行うものになるか、いずれが状態変化によりバック
アップになるかを再構成することができることは注目す
べきである。また、以下の説明で明らかになるが、これ
は、トランスペアレントな(透明性を有する)方法で、
ネットワークの残りの部分のすべてついてなされる。例
えば、LANコントローラ26をプライマリとして、LA
Nコントローラ28をバックアップとして最初にそれぞれ
選択した後に、LANコントローラ28がMACメッセー
ジ・パケット・トラフィックのみの受信の報告を開始す
るか(すなわち、ハートビート・メッセージ・パケット
がLANコントローラ28から受信されていない:イベン
ト4)、またはLANコントローラ26がサイレントであ
ることの報告する(イベント5)かのいずれかを、制御
IOP52が確認したと仮定する。状態図(図2)および
表1が示すように、これらのいずれのイベントの発生に
よっても、状態マシンは、状態1から状態4へ移行し、
LANコントローラ26はアンペアードに指定され、LA
Nコントローラ28はネットワーク10にプライマリ接続に
なる。IOP52は、ネットワーク10との以後のすべての
通信が、LANコントローラ28を通じて行われること
を、そこに見るであろう。
【0042】ネットワーク接続におけるこの変化の透明
性は、LANコントローラ26および28によって使用され
るペア・ワイズ・アドレスによるものである。処理シス
テム12に送信されるすべてのメッセージ・パケットは、
このペア・ワイズ・アドレスを用いる。このアドレス
は、上述したように、両方のLANコントローラで同じ
である。このように、ワークステーション44がメッセー
ジ・パケットをコンピュータ・システム12に送信したと
きに、そのパケットのデスティネーション・アドレス
は、LANコントローラ26および28の双方を指定してい
る。そして、両方のコントローラが、このパケットを受
信する。プライマリとして指定されているLANコント
ローラ26または28のみが、このメッセージ・パケットを
そのプロセッサ・ユニット14(すなわち、プロセッサ14
上で実行されているIOP52)に転送する。したがっ
て、コンピュータ・システム12は、ネットワークの他の
ステーション(例えば、ワークステーション)の補助、
または他のステーションの知識さえも用いることなく、
ネットワーク10に最初にプライマリ接続されたもののど
こかに発生した故障に対処するためにそれ自身を再構成
することができる。
【0043】LANのハブ・ユニット32および34は、IE
EEスタンダード802.1 、特にこのスタンダードの極大木
と学習ブリッジ・アルゴリズム(“Spanning Tree and
Learnig Bridge Algorithm”)を実行するように設計さ
れていることが好ましい。このアルゴリズムにより、L
ANハブ・ユニット32および34は、LANコントローラ
26および28を含むネットワーク上のステーションへのト
ラフィックまたはステーションからのトラフィックに基
づいて、ネットワークの構成およびステーションの配置
を学習することができる。LANハブ・ユニット32およ
び34は、LANコントローラ28へのメッセージ・パケッ
ト・トラフィックおよびLANコントローラ28からのメ
ッセージ・パケット・トラフィックの認識を開始し、そ
れ自身を再構成して、処理システム12のトラフィックを
そのLANコントローラへ転送する。
【0044】また、この発明の好ましい実施例は、2つ
のリンク38を使用し、LANハブ32および34自身を相互
接続する。IEEEスタンダード802.1 に示される極大木と
学習ブリッジ・アルゴリズムは、2つのリンク38の一つ
をプライマリとして、もう一つをバックアップとしてそ
れぞれ選択する。プライマリが故障すると、このアルゴ
リズムは、バックアップを選択する。
【0045】この発明に組み込まれたフォールト・トレ
ラントの思想は、ワークステーション44を2つのLAN
ハブ32および34のそれぞれに接続することにより、ワー
クステーション44をネットワーク10に接続する場合にも
拡張される。これにより、たとえ一方が停止しても、も
う一方の通信パスが提供される。ネットワーク10にワー
クステーション44を接続する2重リンクのためのインタ
フェースが、図3の参照符号60によって示されている。
図に示すように、ネットワーク・インタフェース60は、
マルチプレクサ(MUX)62および従来からあるLAN
制御ロジック64を備えている。実際に実現する場合に、
MUX62は、電気機械式リレーで実現される。このリレ
ーは、LAN制御ロジック64に接続され、2つのネット
ワーク・リンク42のいずれか一方の選択処理を行う。M
UX62は、ワークステーション44の中央処理装置(CP
U)からの選択信号(SEL)の制御の下、処理を行
う。選択されたリンク42は、ワークステーション44のネ
ットワーク10の「プライマリ」な通信リンクになる。
【0046】LAN制御ロジック64は、ウルトラチップ
(Ultrachip )・イーサネット・コントローラのような
従来からあるネットワーク・コントローラ・チップであ
り、部品番号83C790QFで販売され、ニューヨークのハウ
パージ(Haupauge)にあるスタンダード・マイクロシス
テムズ・コーポレーション(Standard MicrosystemsCor
poration )により製造され、利用可能である。このよ
うなネットワーク・コントローラ・デバイスは、一般に
は、LANのリンクをモニタするためのパルス検出回路
を含み、リンクが故障していないことを調べるためにL
ANのリンクに取り付けられている。従来と同様に、L
ANハブ32および34は、リンク保全パルスを、メッセー
ジ・パケット・トラフィックの存在しないときに、ポー
トのそれぞれから周期的に送信する。リンク保全パルス
により、リンク自身(およびリンクに接続されたポー
ト)が良好な状態にあることが示される。このようなリ
ンク保全パルスのいずれかが欠如すると、LAN制御ロ
ジック64は、CPU68に欠如していることを報告する。
【0047】ネットワーク・インタフェース60をネット
ワーク・リンク42にポート接続する場合に、従来のAU
I接続も使用できるが、10BASET タイプの配線接続を用
いることが好ましい。10BASET 配線接続は、リンク保全
パルスの欠如をより早い時間で報告できるので好まし
い。
【0048】最初に、CPU68は、リンク42の一つをプ
ライマリなリンクとして選択し、LAN制御ロジック64
にそのリンクを通知する。その後、ワークステーション
44とネットワーク10との間の全てのトラフィックが、選
択されたリンク42(たとえば、42a)のみで通信され
る。上述したように、LANハブ32、34からのリンク保
全パルスの受信(または欠如)から決定されたプライマ
リ・リンクの保全に関する報告を、CPU68はLAN制
御ロジック64から周期的に受信する。この報告が、プラ
イマリなリンクを指定するものであるならば、CPU68
は、MUX62を切り換え、形式的にはバックアップであ
ったリンク42をLAN制御ロジック64に通知する。
【0049】最初にプライマリとして選択されなかった
リンク(例えば、42b)は、バックアップ・リンクと呼
ばれる。周期的に(例えば、1/2 秒ごとに)、CPU
は、バックアップ・リンク42bを選択し、このリンクを
LAN制御ロジック64に接続し、このリンクがLANハ
ブ34(図1)によって送信されるリンク保全パルスを通
信しているかどうかを判定させる。リンク保全パルスの
欠如が、CPU68に報告されないならば、CPU68は、
何らかの理由により、リンク42bは利用できないものと
決定する。
【0050】図1に戻り、LANコントローラ26、28が
2つのプロセッサ・ユニット14に接続されていることに
着目すると、各プロセッサ・ユニット14は、一対のLA
Nコントローラ26および28に対して一つのIOP52を備
えていることが分かる。一つのプロセッサ・ユニット14
が追加のペアに接続されたならば、追加のIOP52が必
要となるであろう。これは、図4に示されている。この
図は、N個のプロセッサまで有する、より一般化された
マルチ・プロセッサ・システムとしての処理システム12
を示している。米国特許第4,228,496 号のマルチ・プロ
セッサ・システムでは、Nは好ましくは16に制限されて
いる。
【0051】このように、図4に示すように、プロセッ
サ・ユニット14aおよび14bに加えて、プロセッサ・ユ
ニット14nが存在し、追加の一対のLANコントローラ
26’および28’が、I/Oとプロセッサ14b、14nのバ
ス20b、20nとの間に接続されている。LANコントロ
ーラ26’および28’は、LANコントローラ26および28
と同じ接続方法で、ネットワーク・リンク34a’および
34b’によってLANハブ装置32および34にそれぞれ接
続されている。
【0052】プロセッサ・ユニット14nは、(プロセッ
サ・ユニット14nのI/Oチャネル54nを介して)LA
Nコントローラ26’および28’を操作するための入出力
プロセス(IOP)・デバイス・ドライバ52nを備え、
オペレーティング・システム(OS)50nの下で処理を
行う。しかしながら、プロセッサ・ユニット14bは、2
つの個別のIOPデバイス・ドライバを有する。一つの
IOP52bは、LANコントローラ26および28を介して
ネットワーク10と入出力通信を制御するためのものであ
り、これとは別のIOPデバイス・ドライバ52b’は、
第2のLANコントローラのペア26’および28’を介し
て通信を制御するためのものである。
【0053】この発明を、単一のワークステーション44
について説明してきたが、この技術分野の専門家にとっ
ては、実際には、多くの様々なタイプのステーションが
存在することが明らかであろう。これらのステーション
のそれぞれも、ワークステーション44と同じようにLA
Nハブ32、34に接続され、すなわち、個別のリンク接続
になることが好ましい。また、この発明は、図に示すよ
うに、処理システム14により(2つのプロセッサ・ユニ
ット間に接続されたLANコントローラ26および28の各
ペアにより)実現されるが、コンピュータ・システム14
は、マルチプロセッサ・システムによって提供されるフ
ォールト・トレラント能力を避けることができ、単一ポ
ートのLANコントローラがこのプロセッサをネットワ
ークに接続する単一のI/Oバスのみを備えている。こ
の単一プロセッサは、一箇所の故障を提供するが、一対
のLANコントローラおよびネットワーク自身の構成に
よるネットワーク接続は、フォールト・トレラントなネ
ットワーク設計を提供する。
【0054】さらに、この発明の好ましい実施例は、コ
ンピュータ・システム12をネットワーク10に相互接続す
るのに、「インテリジェント」なLANコントローラを
用いるが、場合によってはその必要は必ずしもない。こ
の技術分野の専門家ならば、このようなインテリジェン
トなLANコントローラによって実行される処理の多く
が、コンピュータ・システムの処理時間のコストを必要
とするが、コンピュータ・システム上を実行されるIO
Pによって行われることを知っている。
【0055】特許請求の範囲に記載の発明に加えて以下
の発明を開示する。
【0056】請求項2に記載の方法における送信ステッ
プは、周期的に行われるものであってもよい。
【0057】また、請求項3に記載の方法は、前記第1
および第2のネットワーク・コントローラ手段の最初に
選択された一つからのメッセージ・データの受信の欠如
が前記処理手段に報告されたときに、前記第1および第
2のネットワーク・コントローラ手段のもう一つをプラ
イマリなデータ通信パスとして選択するステップを含む
ことができる。
【0058】請求項1に記載の方法は、前記ハブ手段の
それぞれの前記複数のポートのさらに一つが、それらの
間でデータを通信するために他方に接続され、前記ハブ
手段の間のプライマリなデータ通信パスとして、ハブと
ハブとの間の接続の一つを選択するステップを含むこと
ができる。
【0059】請求項4に記載の装置は、前記第1および
第2のネットワーク・コントローラ手段が、少なくとも
第2および第1のネットワーク・コントローラ手段によ
ってそれぞれ受信されるメッセージ・データを送信する
ための手段を含むことができる。
【0060】また、前記第1および第2のネットワーク
・コントローラ手段は、メッセージ・データの受信が行
われないことを前記処理手段に報告し、前記第1または
第2のネットワーク・コントローラ手段の最初に選択さ
れた一つからのメッセージ・データは受信されないとき
には、前記処理手段は、第1および第2のネットワーク
・コントローラ手段のもう一方をプライマリなデータ通
信パスとして選択するものであってもよい。
【0061】請求項4に記載の装置において、第1およ
び第2のネットワーク・コントローラ手段は、第2およ
び第1のネットワーク・コントローラ手段にそれぞれ受
信されるメッセージ・データを周期的に送信するもので
あり、プライマリな通信パスとして選択された第1また
は第2のネットワーク・コントローラ手段によるメッセ
ージ・データを受信がないときは、第1または第2のネ
ットワーク・コントローラ手段のもう一方をプライマリ
なデータ通信パスとして選択するものであってもよい。
【0062】また、請求項4に記載の装置は、周辺装置
およびこの周辺装置を前記入出力バス手段に接続する周
辺コントローラ手段を含むこともできる。この周辺装置
には、データ記憶手段が含まれる。
【図面の簡単な説明】
【図1】この発明にしたがって構成されたネットワーク
構成の概要を示すブロック図である。
【図2】コンピュータ・システムをネットワークに接続
するネットワーク・コントローラの状態を追跡する図1
のコンピュータ・システムにより保持される状態図であ
る。
【図3】図1に示すワークステーションをアクセス・デ
バイスに接続するために使用されるインタフェース装置
の概要を示すブロック図である。
【図4】より複雑なコンピュータ・システムにおけるこ
の発明の使用を示す、より大規模なコンピュータ・シス
テムのブロック図である。
【符号の説明】
10 ネットワーク 12 コンピュータ・システム 14、14a、14b プロセッサ・ユニット 16、16a、16b バス 20、20a、20b 入出力バス 22 ディスク・ユニット 26、28 LANコントローラ 32、34 ハブ 38 リンク 42a、42b リンク 44 ワークステーション
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−236433(JP,A) 米国特許4527270(US,A) 欧州特許出願公開416943(EP,A)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 データを通信するための入出力バス手段
    を備えた処理手段をネットワークにフォールト・トレラ
    ント接続するための方法であって、 第1および第2のネットワーク・コントローラ手段を前
    記入出力バス手段に接続し、 それぞれが、データを受信または送信するための複数の
    ポートを有する一対のハブ手段であって、前記一対のハ
    ブ手段のそれぞれの前記複数のポートの一つが、対応す
    る前記第1および第2のネットワーク・コントローラ手
    段とデータを送受信するために、対応する前記第1およ
    び第2のネットワーク・コントローラ手段と接続され、
    かつ、前記一対のハブ手段の一つの前記複数のポートの
    もう一つが、前記一対のハブ手段の他方の前記複数のポ
    ートの他の一つに接続されている、ハブ手段を提供し、 少なくとも一つのステーション手段を前記一対のハブ手
    段のそれぞれの前記複数のポートの他の一つに接続し、
    および前記処理手段と前記一対のハブ手段との間のプラ
    イマリなデータ通信パスとして、前記第1または第2の
    ネットワーク・コントローラ手段の一つを選択するステ
    ップ、 を含む方法。
  2. 【請求項2】 前記第2および第1のネットワーク・コ
    ントローラ手段による受信のために、前記第1および第
    2のネットワーク・コントローラ手段からメッセージ・
    データをそれぞれ送信するステップ、 を含む請求項1に記載の方法。
  3. 【請求項3】 前記第1または第2のコントローラ手段
    からのメッセージ・データが、前記第2または第1のコ
    ントローラ手段によりそれぞれ受信されないことが、前
    記プロセッサ手段に報告される、 請求項1に記載の方法。
  4. 【請求項4】 データを通信するための入出力バス手段
    を備えた処理システムをネットワークにフォールト・ト
    レラント接続するための装置であって、 前記入出力バス手段に接続される第1および第2のネッ
    トワーク・コントローラ手段、 それぞれが、データが受信または送信される複数のポー
    トを有する一対の転送手段であって、前記一対の転送手
    段のそれぞれの前記複数のポートの一つが、対応する前
    記第1および第2のネットワーク・コントローラ手段と
    データを送受信するために、対応する前記第1および第
    2のネットワーク・コントローラ手段と接続され、か
    つ、前記一対の転送手段の一つの前記複数のポートのも
    う一つが、前記一対の転送手段の他方の前記複数のポー
    トの他の一つに接続されている、転送手段、 前記一対の転送手段のそれぞれの一つのポートに接続さ
    れた少なくとも一つのステーション手段、および前記処
    理手段から前記一対の転送手段へのプライマリなデータ
    通信パスとして、前記第1または第2のネットワーク・
    コントローラ手段の一つを選択する手段、 を含む接続装置。
  5. 【請求項5】 前記少なくとも一つのステーション手段
    が、前記一対の転送手段のそれぞれの前記複数のポート
    の一つへの接続を、前記ステーション手段とのデータの
    通信のためのプライマリなパスとして選択する手段を含
    むものである、 請求項4に記載の接続装置。
JP6250637A 1993-10-15 1994-10-17 コンピュータ・システムのローカル・エリア・ネットワークへのフォールト・トレラント接続方法および装置 Expired - Fee Related JP2583023B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/137436 1993-10-15
US08/137,436 US5448723A (en) 1993-10-15 1993-10-15 Method and apparatus for fault tolerant connection of a computing system to local area networks

Publications (2)

Publication Number Publication Date
JPH07235933A JPH07235933A (ja) 1995-09-05
JP2583023B2 true JP2583023B2 (ja) 1997-02-19

Family

ID=22477427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6250637A Expired - Fee Related JP2583023B2 (ja) 1993-10-15 1994-10-17 コンピュータ・システムのローカル・エリア・ネットワークへのフォールト・トレラント接続方法および装置

Country Status (6)

Country Link
US (1) US5448723A (ja)
EP (1) EP0649092B1 (ja)
JP (1) JP2583023B2 (ja)
AU (1) AU685497B2 (ja)
CA (1) CA2117619C (ja)
DE (1) DE69414219T2 (ja)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5625825A (en) * 1993-10-21 1997-04-29 Lsi Logic Corporation Random number generating apparatus for an interface unit of a carrier sense with multiple access and collision detect (CSMA/CD) ethernet data network
DE69435090T2 (de) * 1993-12-01 2009-06-10 Marathon Technologies Corp., Stow Rechnersystem mit Steuereinheiten und Rechnerelementen
JP3599364B2 (ja) * 1993-12-15 2004-12-08 富士通株式会社 ネットワーク装置
US5560033A (en) * 1994-08-29 1996-09-24 Lucent Technologies Inc. System for providing automatic power control for highly available n+k processors
JP3375245B2 (ja) * 1995-04-26 2003-02-10 インターナショナル・ビジネス・マシーンズ・コーポレーション 耐障害性マルチメディア・プログラム配布のための装置
US5822512A (en) * 1995-05-19 1998-10-13 Compaq Computer Corporartion Switching control in a fault tolerant system
US5713017A (en) * 1995-06-07 1998-01-27 International Business Machines Corporation Dual counter consistency control for fault tolerant network file servers
US6005884A (en) * 1995-11-06 1999-12-21 Ems Technologies, Inc. Distributed architecture for a wireless data communications system
GB2308040A (en) * 1995-12-09 1997-06-11 Northern Telecom Ltd Telecommunications system
DE19548445A1 (de) * 1995-12-22 1997-07-03 Siemens Ag Archivierungssystem für Prozeßdaten einer Kraftwerksanlage
US6199172B1 (en) * 1996-02-06 2001-03-06 Cabletron Systems, Inc. Method and apparatus for testing the responsiveness of a network device
US6141769A (en) 1996-05-16 2000-10-31 Resilience Corporation Triple modular redundant computer system and associated method
US7148786B2 (en) * 1996-09-30 2006-12-12 Terumo Cardiovascular Systems Corporation Network communication and message protocol for a medical perfusion system
DE19643092C2 (de) * 1996-10-18 1998-07-30 Elan Schaltelemente Gmbh Feld-Datenbussystem
US6499073B1 (en) 1997-05-13 2002-12-24 Micron Electronics, Inc. System using programmable processor for selectively enabling or disabling power to adapter in response to respective request signals
US6269412B1 (en) 1997-05-13 2001-07-31 Micron Technology, Inc. Apparatus for recording information system events
US6304929B1 (en) 1997-05-13 2001-10-16 Micron Electronics, Inc. Method for hot swapping a programmable adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6338150B1 (en) * 1997-05-13 2002-01-08 Micron Technology, Inc. Diagnostic and managing distributed processor system
US6202160B1 (en) 1997-05-13 2001-03-13 Micron Electronics, Inc. System for independent powering of a computer system
US6266721B1 (en) 1997-05-13 2001-07-24 Micron Electronics, Inc. System architecture for remote access and control of environmental management
US6249834B1 (en) 1997-05-13 2001-06-19 Micron Technology, Inc. System for expanding PCI bus loading capacity
US6202111B1 (en) 1997-05-13 2001-03-13 Micron Electronics, Inc. Method for the hot add of a network adapter on a system including a statically loaded adapter driver
US6243773B1 (en) 1997-05-13 2001-06-05 Micron Electronics, Inc. Configuration management system for hot adding and hot replacing devices
US6170028B1 (en) 1997-05-13 2001-01-02 Micron Electronics, Inc. Method for hot swapping a programmable network adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6243838B1 (en) 1997-05-13 2001-06-05 Micron Electronics, Inc. Method for automatically reporting a system failure in a server
US6269417B1 (en) 1997-05-13 2001-07-31 Micron Technology, Inc. Method for determining and displaying the physical slot number of an expansion bus device
US6163849A (en) * 1997-05-13 2000-12-19 Micron Electronics, Inc. Method of powering up or powering down a server to a maintenance state
US6195717B1 (en) 1997-05-13 2001-02-27 Micron Electronics, Inc. Method of expanding bus loading capacity
US6418492B1 (en) 1997-05-13 2002-07-09 Micron Electronics Method for computer implemented hot-swap and hot-add
US6145098A (en) * 1997-05-13 2000-11-07 Micron Electronics, Inc. System for displaying system status
US6249828B1 (en) 1997-05-13 2001-06-19 Micron Electronics, Inc. Method for the hot swap of a mass storage adapter on a system including a statically loaded adapter driver
US6292905B1 (en) * 1997-05-13 2001-09-18 Micron Technology, Inc. Method for providing a fault tolerant network using distributed server processes to remap clustered network resources to other servers during server failure
US6173346B1 (en) 1997-05-13 2001-01-09 Micron Electronics, Inc. Method for hot swapping a programmable storage adapter using a programmable processor for selectively enabling or disabling power to adapter slot in response to respective request signals
US6363497B1 (en) 1997-05-13 2002-03-26 Micron Technology, Inc. System for clustering software applications
US6247080B1 (en) 1997-05-13 2001-06-12 Micron Electronics, Inc. Method for the hot add of devices
US6324608B1 (en) 1997-05-13 2001-11-27 Micron Electronics Method for hot swapping of network components
US6192434B1 (en) 1997-05-13 2001-02-20 Micron Electronics, Inc System for hot swapping a programmable adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6163853A (en) 1997-05-13 2000-12-19 Micron Electronics, Inc. Method for communicating a software-generated pulse waveform between two servers in a network
US6249885B1 (en) 1997-05-13 2001-06-19 Karl S. Johnson Method for managing environmental conditions of a distributed processor system
US6179486B1 (en) 1997-05-13 2001-01-30 Micron Electronics, Inc. Method for hot add of a mass storage adapter on a system including a dynamically loaded adapter driver
US6219734B1 (en) 1997-05-13 2001-04-17 Micron Electronics, Inc. Method for the hot add of a mass storage adapter on a system including a statically loaded adapter driver
US6330690B1 (en) 1997-05-13 2001-12-11 Micron Electronics, Inc. Method of resetting a server
US5892928A (en) * 1997-05-13 1999-04-06 Micron Electronics, Inc. Method for the hot add of a network adapter on a system including a dynamically loaded adapter driver
US6253334B1 (en) 1997-05-13 2001-06-26 Micron Electronics, Inc. Three bus server architecture with a legacy PCI bus and mirrored I/O PCI buses
US6112249A (en) 1997-05-30 2000-08-29 International Business Machines Corporation Non-disruptively rerouting network communications from a secondary network path to a primary path
US5983371A (en) * 1997-07-11 1999-11-09 Marathon Technologies Corporation Active failure detection
US6138179A (en) * 1997-10-01 2000-10-24 Micron Electronics, Inc. System for automatically partitioning and formatting a primary hard disk for installing software in which selection of extended partition size is not related to size of hard disk
US6175490B1 (en) 1997-10-01 2001-01-16 Micron Electronics, Inc. Fault tolerant computer system
US6263387B1 (en) 1997-10-01 2001-07-17 Micron Electronics, Inc. System for automatically configuring a server after hot add of a device
US6199173B1 (en) 1997-10-01 2001-03-06 Micron Electronics, Inc. Method for mapping environmental resources to memory for program access
US6212585B1 (en) 1997-10-01 2001-04-03 Micron Electronics, Inc. Method of automatically configuring a server after hot add of a device
US6223234B1 (en) 1998-07-17 2001-04-24 Micron Electronics, Inc. Apparatus for the hot swap and add of input/output platforms and devices
US6205503B1 (en) 1998-07-17 2001-03-20 Mallikarjunan Mahalingam Method for the hot swap and add of input/output platforms and devices
US6078957A (en) * 1998-11-20 2000-06-20 Network Alchemy, Inc. Method and apparatus for a TCP/IP load balancing and failover process in an internet protocol (IP) network clustering system
US6768720B1 (en) * 1999-09-30 2004-07-27 Conexant Systems, Inc. Verification of link integrity of a home local area network
US6658595B1 (en) * 1999-10-19 2003-12-02 Cisco Technology, Inc. Method and system for asymmetrically maintaining system operability
WO2001086445A1 (en) * 2000-05-11 2001-11-15 Patmos International Corporation Connectionist topology computer/server
US6604030B1 (en) * 2000-06-06 2003-08-05 Ozuna Holdings Incorporated Single fault impervious integrated control and monitoring system
JP2001352335A (ja) 2000-06-07 2001-12-21 Nec Corp Lan二重化システム及びそれに用いるlan二重化方法
US7020709B1 (en) * 2000-06-30 2006-03-28 Intel Corporation System and method for fault tolerant stream splitting
US7318107B1 (en) 2000-06-30 2008-01-08 Intel Corporation System and method for automatic stream fail-over
US7701600B2 (en) * 2003-05-28 2010-04-20 Ricoh Company, Ltd. Image processing apparatus and computer product
US9491084B2 (en) * 2004-06-17 2016-11-08 Hewlett Packard Enterprise Development Lp Monitoring path connectivity between teamed network resources of a computer system and a core network
US7724642B2 (en) * 2004-08-06 2010-05-25 Logic Controls, Inc. Method and apparatus for continuous operation of a point-of-sale system during a single point-of-failure
US7315963B2 (en) * 2004-08-10 2008-01-01 International Business Machines Corporation System and method for detecting errors in a network
JP2007257180A (ja) * 2006-03-22 2007-10-04 Hitachi Ltd ネットワークノード、スイッチ及びネットワーク障害回復方法
US8605573B2 (en) * 2008-06-26 2013-12-10 Shore Microsystems Inc. Autolearning network link protection device

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4527270A (en) 1983-05-04 1985-07-02 Allen-Bradley Company Communications network with stations that detect and automatically bypass faults

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4228496A (en) * 1976-09-07 1980-10-14 Tandem Computers Incorporated Multiprocessor system
US4627048A (en) * 1984-10-09 1986-12-02 At&T Bell Laboratories Routing address bit selection in a packet switching network
US5034966A (en) * 1987-03-09 1991-07-23 Hochstein Peter A Redundant and fault tolerant communication link
US5084816A (en) * 1987-11-25 1992-01-28 Bell Communications Research, Inc. Real time fault tolerant transaction processing system
GB2219172B (en) * 1988-03-30 1992-07-08 Plessey Co Plc A data path checking system
JPH01284035A (ja) * 1988-05-10 1989-11-15 Toshiba Corp データ伝送装置
JP2591128B2 (ja) * 1988-12-20 1997-03-19 日本電気株式会社 通信回線切替方式
US5016244A (en) * 1989-09-08 1991-05-14 Honeywell Inc. Method for controlling failover between redundant network interface modules
US5115235A (en) * 1989-09-25 1992-05-19 Cabletron Systems, Inc. Flexible module interconnect system
US5091847A (en) * 1989-10-03 1992-02-25 Grumman Aerospace Corporation Fault tolerant interface station
US5311593A (en) * 1992-05-13 1994-05-10 Chipcom Corporation Security system for a network concentrator

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4527270A (en) 1983-05-04 1985-07-02 Allen-Bradley Company Communications network with stations that detect and automatically bypass faults

Also Published As

Publication number Publication date
CA2117619A1 (en) 1995-04-16
EP0649092B1 (en) 1998-10-28
DE69414219D1 (de) 1998-12-03
AU7581694A (en) 1995-05-04
CA2117619C (en) 1999-05-11
JPH07235933A (ja) 1995-09-05
DE69414219T2 (de) 1999-04-22
AU685497B2 (en) 1998-01-22
US5448723A (en) 1995-09-05
EP0649092A1 (en) 1995-04-19

Similar Documents

Publication Publication Date Title
JP2583023B2 (ja) コンピュータ・システムのローカル・エリア・ネットワークへのフォールト・トレラント接続方法および装置
US6173411B1 (en) Method and system for fault-tolerant network connection switchover
EP1895724B1 (en) A method for implementing active/standby gateway device in the network and a system thereof
CA2631023C (en) Lightweight node based network redundancy solution leveraging rapid spanning tree protocol (rstp)
EP2290878B1 (en) Fault-tolerant ethernet network
JP4166939B2 (ja) 能動的故障検出
WO2007092132A2 (en) System and method for detecting and recovering from virtual switch link failures
WO2006030623A1 (ja) 冗長化プロトコルと擬似冗長構成手段を用いたネットワーク接続機器の切換方法とネットワークシステム
US7424640B2 (en) Hybrid agent-oriented object model to provide software fault tolerance between distributed processor nodes
CN111343019A (zh) 一种重连方法、装置和存储介质
Huang et al. An open solution to fault-tolerant Ethernet: design, prototyping, and evaluation
US10819628B1 (en) Virtual link trunking control of virtual router redundancy protocol master designation
JPH1185644A (ja) 冗長構成システムの系切替制御方法
JP4340731B2 (ja) ネットワークの障害監視処理システム及び方法
CN114268581B (zh) 一种实现网络设备高可用和负载分担的方法
JP2001344125A (ja) 2重化ノードシステム
Cisco Fault Tolerance
Cisco Configuring Spanning-Tree Protocol
JP2001168899A (ja) ネットワークシステム
JP2000244526A (ja) 多重化したネットワーク接続装置システム
JPH1168790A (ja) Lanエミュレーションサーバ二重化方式
JP4035820B2 (ja) 回線切替装置及びデータ伝送システム及び回線切替方法
JP3415494B2 (ja) 仮想lan対応lanスイッチ二重化方法及び装置
GB2449178A (en) Dynamic switching to a redundant bridge by a node using bridge protoccol data unit (BPDU) messages and the rapid spanning tree protocol (RSTP)
JPH07288533A (ja) Lan切替方式及び電力系統監視制御システム

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081121

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees