JPH0720103B2 - 情報通信システムにおける誤り回復方法 - Google Patents

情報通信システムにおける誤り回復方法

Info

Publication number
JPH0720103B2
JPH0720103B2 JP5090965A JP9096593A JPH0720103B2 JP H0720103 B2 JPH0720103 B2 JP H0720103B2 JP 5090965 A JP5090965 A JP 5090965A JP 9096593 A JP9096593 A JP 9096593A JP H0720103 B2 JPH0720103 B2 JP H0720103B2
Authority
JP
Japan
Prior art keywords
node
frame
error
master
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5090965A
Other languages
English (en)
Other versions
JPH0669931A (ja
Inventor
イアン・ダビッド・ジュド
レジナルド・ビーア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0669931A publication Critical patent/JPH0669931A/ja
Publication of JPH0720103B2 publication Critical patent/JPH0720103B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0078Avoidance of errors by organising the transmitted data in a format specifically designed to deal with errors, e.g. location
    • H04L1/0083Formatting with frames or packets; Protocol or part of protocol for error control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/12Arrangements for detecting or preventing errors in the information received by using return channel
    • H04L1/16Arrangements for detecting or preventing errors in the information received by using return channel in which the return channel carries supervisory signals, e.g. repetition request signals
    • H04L1/18Automatic repetition systems, e.g. Van Duuren systems
    • H04L1/1867Arrangements specially adapted for the transmitter end
    • H04L1/1874Buffer management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Small-Scale Networks (AREA)
  • Communication Control (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はネットワーク内のノード
の間の情報通信の分野に、より詳しくはノード間のデー
タの伝送中に生じる誤りからの回復に関する。
【0002】
【従来の技術】ネットワーク内の相互接続されたノード
の間でデータを伝送するために種々の異なるタイプのネ
ットワーク構成が提案され使用されている。例えば、ロ
ーカル・エリア・ネットワーク(LAN) は通常1つの施設内
に分散されているコンピュータに基づいた幾つかの装置
を備える。LAN は大抵は3つの基本的なトポロジー、即
ち星、バス及びリング型の1つで配列される。ブリッジ
の形式のスイッチ即ち経路指定機能(router)により幾つ
かの異なるLAN を相互接続することによって、より複雑
なネットワーク形成が可能である。
【0003】これらのネットワークはあるタイプの誤り
回復方法を備える。これは誤りを検出する手段及び誤り
を訂正する手段を含む。誤りを検出する手段は一般にバ
イト又は伝送される小量の情報毎のパリティ検査を含
む。通常、パリティ検査は、送信される、例えばバイト
内の、全ビットを簡単に算術合計するために、送信装置
により単一ビットを付加し、偶数パリティでは偶数に奇
数パリティでは奇数にすることである。パリティ検査は
普通は1ビット・エラーを検出するので、主として近距
離の高い完全性の伝送経路に用いられる。
【0004】遠距離、又は低い完全性の伝送経路には、
巡回冗長検査(CRC = cyclic redundancy check)を用い
ることができる。一般にCRC は、バイトのブロック毎に
送られる、例えば各128、256又は512 バイト後に送られ
る2バイトの1つから成る。使用される特定のCRC は、
その計算に用いる多項式により定義される。一般的な多
項式は次の式で与えられる。
【数1】X16 + X15 + X2 + 1
【0005】該データの後に2バイトのうちの最下位の
バイトが取られ送信される。受信装置は到来するデータ
に対して同じ方法を用いて多項式を計算し、その計算結
果と到来CRC とを比較する。偶数の多重ビット誤り、例
えば長い伝送経路に関連する誤りを検出する確率は非常
に高い。
【0006】これらの誤り検出方法は全て、誤りを含む
データのブロックの再送信を受信ノードが要求すること
により誤りを訂正する。そして再送信されたブロックは
最初に送信されたブロックと同じ方法で検査される。受
信ノードがデータの受信を肯定応答しない場合、これら
の方法は送信ノードが訂正処置を行なうことを許さな
い。その結果、受信ノード内のバッファが一杯になるま
で送信ノードはフレームを送信し続けることになる。こ
の欠点は、そのバッファがクリア(clear) されるまで受
信ノードによりデータが拒絶されるから、この時点では
誤り回復を支援するために受信ノードとのこれ以上の通
信ができないことである。そのバッファをクリアするた
めに、受信ノードは不完全なデータを引渡すことがあ
る。もし送られているデータが前のデータの置き換え、
例えば前に記憶されたファイルの更新バージョンであれ
ば、前に記憶されたファイルが不完全なデータにより崩
壊されることがあるので、これはもう1つの欠点であ
る。
【0007】
【発明が解決しようとする課題】送信ノードから受信ノ
ードに複数の経路が存在する場合、故障経路に関連した
バッファをクリアする訂正処置を行なうとともに、不完
全なデータを、受信ノードから引渡すよりはむしろ、破
棄することを保証することができる。通常、この回復は
ネットワーク中の全ての受信ノード及び送信ノードをア
クセスする1つのノードにより調整される。このアクセ
スは他の受信/送信ノードを介することができる。所与
のネットワークに対して、この1つのノード、即ちマス
タ(master)が恒久的に定義される。これは、受信ノード
の1つへの又は送信ノードの1つからの、もう1つのユ
ーザに送られる情報を入力又は出力している、ネットワ
ークのユーザ、例えばアプリケーションが異なるノード
をマスタとして定義したいことがあるという欠点を有す
る。もう1つのの欠点は、マスタ・モードが故障した場
合に、全ネットワークの誤り回復調整が作動しないこと
である。
【0008】
【課題を解決するための手段】本発明の目的は、リンク
で接続された複数のノードを備え、少なくとも、データ
の転送に用いられる第1のフレーム・タイプ及び誤り回
復に用いられる第2のフレーム・タイプを含む所定のタ
イプのフレームで、前記リンクの少なくとも1つを用い
てノード間で情報が転送され、2つ以上のノードにより
情報転送が開始され、それらのノードは少なくとも第1
及び第2の動作モードを有する、情報通信システムで用
いる誤り回復方法を提供することにある。該方法は、第
1及び第2のノードを接続するリンクに誤りを検出する
と誤り回復を制御するマスタ・ノードを定義するステッ
プと、第1及び第2のノードの1つ又は双方を第1の動
作モードから第2の動作モードに切換え、第1のタイプ
のフレームをそのポートの全てにあるノードにより破棄
するとともに第2のタイプのフレームをそのポートのど
れかにあるノードにより受け入れるステップと、第1又
は第2のノードの1つ又は双方により、マスタ・ノード
に第1の誤りを含む第2のフレーム・タイプを送信する
ステップと、情報転送を開始できる全てのノードに、第
2の誤り情報を含む第2のフレーム・タイプを、マスタ
・ノードにより送信するステップと、第1及び第2のノ
ードを接続するリンクを用いて第1のタイプのフレーム
を開始している他のノードにより、第1のタイプのフレ
ームが送られた各ノードに、該送信ステップが良好に終
了したとき、第1のフレーム・タイプを破棄させる命令
を送信するステップと、全てのタイプのフレームが受け
入れられることを、マスタ・ノードにより第1及び第2
のノードのフレームに送信してノードを第1の動作モー
ドに切換えさせるステップと、情報転送を開始できる全
てのノードに、第2の誤り情報を取消す第2のフレーム
・タイプを、マスタ・ノードにより送信するステップと
を含む。
【0009】できれば、マスタ・ノードを定義するステ
ップは、情報転送を開始することができる全てのノード
間の同意によりマスタ・ノードを所定の基準に従って選
択を行うことが望ましい。できれば、情報転送を開始で
きる各ノードは、特定の識別子を有し、前記所定の基準
には、マスタ・ノードが該特定の識別子のうち最高の値
を有するノードを選択するという内容のものであること
が望ましい。
【0010】できれば、誤り回復方法は更に、第1又は
第2のノードの1つ又は双方を第2の動作モードに切換
える前に、第1又は第2のノードにより、それぞれの他
のノードに、誤りが検出されたときに送信されたフレー
ムを再送信するステップと、再送信されたフレームがそ
れぞれの他のノードにより誤りなしに受信されたかどう
かを検査し、もし再送信されたフレームが誤りなしに受
信されれば、誤り回復方法を終了するステップとを含む
ことが望ましい。
【0011】できれば、第1の誤り情報は第1の誤り情
報が送信されたノードのポートの1つで非同期事象が起
きたことを識別し、第2の誤り情報はリンク状態変更が
起きたことを識別することが望ましい。できれば、該方
法は更に、第1のノードが該第1のノードにあるポート
に第3のノードの付加を検出するステップと、第1のノ
ードを第1の動作モードから第2の動作モードに切換
え、第1のタイプのフレームがそのポートの全てにおい
て該ノードにより破棄され、第2のタイプのフレームが
そのポートのどれかで該ノードにより受け入れられるス
テップと、第1のノードが第3の誤り情報を含む第2の
フレーム・タイプをマスタ・ノードに送信するステップ
と、前記送信ステップが良好に終了したとき、該マスタ
の固有の識別を含む第2のフレーム・タイプをマスタ・
ノードにより第3のノードに送信するステップと、マス
タ・ノードにより、第1及び第3のノードに、それらの
ノードに第1の動作モードに切換え全てのタイプのフレ
ームを受け入れられるようにするフレームを送信するス
テップと、マスタ・ノードにより、情報転送を開始でき
る全てのノードに、第3のノードの固有の識別を含む第
2のフレーム・タイプを送信するステップとを含むこと
が望ましい。
【0012】できれば、該リンクは直列リンクであるこ
とが望ましい。
【0013】
【実施例】符号化されないデータ・バイト中のビットは
左から右に7から0の番号を付与され、ビット7は最上
位ビットである。整数の最上位バイトは1である。ビッ
ト値は、例えば1bとして表示され、16進値は、例えばA2
h として表示される。
【0014】本発明で用いられるアドレス指定方式は接
続に従って3つのタイプのノードを識別する。これらは
単一ポート・ノード、二重ポート・ノード及びスイッチ
である(3〜16ポート)。 本発明を用いるネットワークで
は、これらのノードは一般に電子装置、例えばコンピュ
ータ、印刷装置、記憶装置等である。
【0015】図1は直列リンク12,14にそれぞれ接続さ
れた2つのポート16,18を備える二重ポート・ノード10
を示す。また、ポート16,18 をノード機能22に接続する
3ウェイ経路指定機能20も備えられる。アドレス・フィ
ールドにより、経路指定機能20はインバウンド・フレー
ムをノード自身に送るか又は別のポートのアウトバウン
ド回線に送る。ノードは、フレームを生成したいとき、
経路指定機能20に対し指定ポートで該フレームを送信す
るように指示する。特定のコマンドに関する全てのメッ
セージ及びデータ・フレームは同じポートを用いる。
【0016】下記は実現しうるネットワークのタイプで
ある。 (1) 専用接続 図2は2つの単一ポート・ノード30及び32の間の最も簡
単な専用接続のケースを示す。 (2) ストリング 図3はストリングとして知られている二重ポート・ノー
ド36,38,40,42 の線形ネットワークを示す。任意の2つ
のノードの間の制約されない通信を可能にするには、ス
トリング中のノードの最大数はエンド・ノードを含めて
17である。これは、良好な実施例では、ストリング中の
あるノードのアドレスのために、ストリング中の任意の
他のノードに関する1つの16進数字が選択されるためで
ある。例えば、これは1つのアダプタ・ポートに16の装
置を接続することを可能にする。ストリングのどちらか
の先端のノードは単一ポート・ノード34、1つの接続さ
れないポートを有する二重ポート・ノード42又はスイッ
チとなりうる。 (3) ループ ループは図4に示すように二重ポート・ノード44,45,4
6,47,48のみを含む循環ネットワークである。任意の1
つのノードが故障しても残りのノードの任意の対の間の
通信を不通にしえないので、ループはストリングよりも
良好な使用可能度を与える。他のノードの間の通信を妨
げずに、ノードをループに挿入し、又はノードをループ
から取り除くこともできる。これらの使用可能特性を維
持するために、前述のストリング・ネットワークで説明
した理由と同じ理由で、最大ノード数は17に制限され
る。 (4) スイッチ 図5は2つのスイッチ106,114、3つのストリング100,1
02,104;108,110;116,118及びスイッチ114にノード118を
連結する循環経路を含む複合ネットワークを示す。スイ
ッチは多数のノードの相互接続を可能にする。それらは
障害許容度を達成するために代替経路が与えられること
も可能にする。
【0017】[フレーム]ノード間の1つの直列リンクの
反対の端にある2つのポートは、フレームと呼ばれる単
位で通信する。フレームはフラグとして知られる特別な
プロトコル文字により各端で区切られた情報バイトのシ
ーケンスから成る。フレームは図6に示すように3フィ
ールド又は4フィールドのシーケンスに分割される。 ・制御フィールド: 制御フィールドは常に存在し、その
長さは1バイトである。制御フィールドはフレーム・タ
イプを表わす。アプリケーション・フレームは通常の動
作中のメッセージ及びデータの転送に用いられる。特権
(privileged)フレームは形成及び誤り回復に用いられ
る。誤り回復に関連した特権メッセージについては後に
説明する。制御フレームはリセットのために用いられ
る。 ・アドレス・フィールド: アドレス・フィールドは常に
存在し、ネットワークの複雑さと宛先ノードにより実現
されるチャネルの数とに依存し、その長さは1バイトと
6バイトの間で可変である。このフィールドは経路成
分、チャネル成分及びパッド成分に分割される。経路は
ネットワークを介してフレームを宛先ノードに経路指定
する。チャネルは、メッセージを受信するか又は単一デ
ータ転送を受信する、宛先ノード内の機能から成る。メ
ッセージを受信する1つのチャネルが予め定義される。
全ての他のチャネルがデータ転送のために動的に割当て
られる。パッドは、もし必要なら、アドレス・フィール
ドを全バイト数にする単一数字である。宛先ノードはチ
ャネルを割当てているのでそれをアドレス指定するのに
必要な数字の数が分かっているから、パッドの数字の値
は通常は重要ではない。 ・データ・フィールド: データ・フィールドはオプショ
ンであり、その長さは最大128 バイトまで可変である。
このフィールドはアプリケーション・データ又はメッセ
ージを運ぶ。後に定義するメッセージの外は、データ・
フィールドの内容は本発明とは無関係である。 ・CRCフィールド: CRCフィールドは常に存在し、その長
さは2バイトである。 このフィールドは制御、アドレス及びデータ・フィール
ドの標準循環冗長検査である。CRC フィールドが受信さ
れ検査されるまで、宛先はそれらのフィールドのどれも
有効とみなしてはならない。これは通常各ポートが受信
装置内の少なくとも1つのフレームを緩衝記憶すること
を必要とする。制御及びアドレス・フィールドは変化し
ていることがあるから、二重ポート又はスイッチ・ノー
ドにおける経路指定機能はフレームを転送するときCRC
フィールドを生成し直さなければならない。
【0018】アドレス及びデータ・フィールドの最大の
長さは、ネットワーク・サイズ、通信効率及び実現費用
の間の均衡をとるように選択される。
【0019】[層]直列リンクには2つの層、トランスポ
ート層(transport layer) 及びアパー・レベル・プロト
コル(upper-level protocol)がある。トランスポート層
は下記の機能を定義する。 ・プロトコル、例えばフレーム、フロー制御及びアドレ
ス指定; ・リンク管理、例えば緩衝記憶、ポート状態、リセッ
ト、形成及び誤り回復;及び ・物理的な媒体、例えば符号化、変調、クロッキング、
回線駆動装置/受信装置、コネクタ及びケーブル。
【0020】直列リンクの実現の各々は下記を定義する
責任がある。 ・サポートされるデータ速度、即ち10 MB/s又は20 MB/s
又は両者、及び ・各ポート内のフレーム・バッファの形成。
【0021】関連アパー・レベル・プロトコルにより下
記の機能が定義される。 ・ユーザ定義文字の解釈。 ・アプリケーション・フレームにあるデータ・フィール
ドの内容、例えばコマンド、状況及びデータ。
【0022】アパー・レベル・プロトコルはソース・ノ
ードと宛先ノードとの間のメッセージ・フレームを交換
することによってデータ転送を開始する。宛先ノードは
データ・フレームを受信するチャネルを割当てるととも
に、それが現に受け入れできるバイトの数を表示する。
【0023】[応答]必要なフロー制御を実現するため
に、宛先はそれが受信するフレーム毎に、肯定応答、即
ち連続する ACK(肯定応答)プロトコル文字の対、及び受
信装置使用可能(RR = Receiver Ready)、即ち連続する
RRプロトコル文字の対の、2つの応答をソースに送る。
【0024】これらのプロトコル文字は伝送誤りにより
応答が生成されないように保護するために対で用いられ
る。ノードは、それが他の介在する文字なしに対の文字
をどちらも受信したときにのみ応答に反応する。
【0025】ネットワークにおいて、このプロトコルは
各直列リンクで独立して動作する。経路指定機能によっ
て応答が転送されることは決してない。
【0026】[フレーム・タイプ]トランスポート層は下
記のフレームの3つのタイプを識別する。 ・制御フレーム: 制御フレームはリセットに用いられ
る。データ・フィールドの長さは0でなければならず、
さもなければ、受信ノードは該フレームを拒絶する。制
御フレームは宛先ノードにより直に動作される。それら
は送信ポートが特権モード又は通常モードにあるとき送
ることができる。 ・特権フレーム: 特権フレームはトランスポート層によ
り形成及び誤り回復のために用いられる。それらは送信
ポートが特権モード又は通常モードにあるとき送ること
ができる。 ・アプリケーション・フレーム: アパー・レベル・プロ
トコルによってのみアプリケーション・フレームが用い
られる。データ・フィールドの内容はトランスポート層
とは無関係である。ポートが特権モードにあるとき、送
信装置はアプリケーション・フレームを破棄する。
【0027】各フレームのデータ・フィールドの内容は
コマンド、状況又はデータから成る。コマンド毎に、ノ
ードは開始機能 (initiator)、即ち該コマンドを出した
ノード、又は目標(target)、即ち該コマンドを受信した
ノードに区分できる。 ・ポート・モード: ポートは通常モード又は特権モード
で動作できる。通常モードはポートがリンクを介して任
意のタイプのフレームを送ることを可能にする。ポート
がSet_normal_mode (通常モード・セット)メッセージ
(後述)を受信すると、特権モードから通常モードに移行
する。特権モードでは、ポートは制御フレーム及び特権
フレームを遠隔ノードに送るだけである。アプリケーシ
ョン・フレームは送信装置により破棄される。リンクER
P によって回復できないリンク・エラーがあるとき、通
常モードから特権モードが開始される。ポートがリセッ
トされるときも特権モードが開始される。 ・使用禁止状態: ポートは、(例えば電源投入で)リセッ
トされるか又はノードが破滅的な内部エラーをこうむる
と使用禁止される。この状態では、リセット制御フレー
ムの受信以外の全ての通信が使用禁止される。ポート送
信装置は連続してリンクにDIS 文字を送ることにより使
用禁止状態を表示する。ポートは通常、もしリセットさ
れていれば、自動的に使用禁止状態を脱出(exit)する。
【0028】[マスタ]ネットワーク内でちょうど1つの
開始機能がマスタ(master)として指名される。アプリケ
ーションはそれ自身をマスタとして選択できる。あるい
は形成中にトランスポート層により自動的にマスタを選
択することができる。例えば、最高のUnique_ID(固有識
別)を有する開始機能を選択することができる。
【0029】形成プロセス中、マスタは各ノードに順番
に特権メッセージを出すことによりそのロケーションを
全ての他のノードに通知する。次に、各ノードは特権メ
ッセージをマスタに送ることにより非同期事象を報告す
る。 (典型的な事象はトランスポート層によって回復で
きないエラーである。) マスタは互いに開始機能を警告
するために特権メッセージを送るとともに回復動作を調
整する。
【0030】もしマスタ・ノードが故障するか又は切断
されれば、新しいマスタがそれに置き換えられるように
指名されなければならない。そして新しいマスタはあら
ゆる他のノードにそのロケーションを通知すべきであ
る。
【0031】[形成] ・固有識別: ノードが構築されると、全ての開始機能及
びスイッチが固有識別(Unique_ID)を割当てられる。 固
有識別は一般にEPROM(消去可能プログラマブル読取専用
メモリ) に記憶される。これは4バイトのベンダ(vendo
r)識別と、それに続いて製造者により割当てられた4バ
イトのノード識別とから成る。識別はどちらも符号ない
の2進整数である。固有識別は誤り回復中に用いられ、
特定の開始機能から出されたコマンドを識別する。 ・手順: 存在する他のノード及びそれらの経路アドレス
を決定するために、可能性のある開始機能の各々が形成
プロセスを実行しなければならない。 ・構成テーブル: 形成プロセスでは、あらゆる他のノー
ドのエントリを有する構成テーブルをあらゆる開始機能
が構築する。エントリはノードの記述 (保有する作動可
能なポートの数、及びその固有識別) ならびに開始機能
からの経路アドレスを含む。
【0032】電源が投入されると、各開始機能は全ネッ
トワークを形成する。新たなリンクがネットワークに接
続されると、開始機能は追加の部分的な形成も実行しな
ければならない。この場合、後で説明されるように、特
権メッセージにより開始機能の各々が警告される。
【0033】トランスポート層によって回復することが
できないリンク誤りがある場合も、特権メッセージによ
り開始機能の各々が警告される。もしエラーが恒久的で
ある(例えば、リンクが切断されている)ならば、開始機
能の各々は、該エラーの範囲を越えたノードへの経路
を、それらを構成テーブルから削除することにより、形
成除外する。 ・開始機能テーブル: 形成プロセス中、あらゆる目標は
開始機能テーブルを構築する。各テーブル・エントリは
開始機能の固有識別を含み、該目標から当該開始機能に
アドレスを戻す。もし開始機能が同じ目標への代替経路
を使用中であれば、該テーブルは経路毎に1つのエント
リを含む。
【0034】誤り回復中、開始機能テーブルは未決着の
コマンドを静止させるのに用いられる。
【0035】[誤り回復]リンクのトランスポート層は、
最後の1フレーム又は2フレームを再送信することによ
り誤り回復を試みるリンク誤り回復手順(リンクERP) を
含む。
【0036】ここで複数の開始機能を有する複合ネット
ワークにおける誤り回復の方式について説明する。この
方式はデータの完全性を保証するとともに他の動作への
影響を最小にする。例えば、誤りがディスク装置に間違
ったデータが書込まれないようにする。また、誤りが影
響するのは、故障中のリンク又はノードを現に用いてい
るコマンド、開始機能及び目標だけである。
【0037】[リンク誤り] ・ハードウェア誤り: 内部ハードウェアの誤り、例えば
パリティ検査の誤りをポートが検出すると、この誤りが
表示される。 ・回線障害(line fault): 回線駆動装置又は受信装置が
無効電圧を検出しポートが使用禁止状態ではないとき、
この誤りが表示される。この場合、ケーブル回路が開放
又は短絡しているか又は遠隔ノードへの電力供給が遮断
されているかも知れない。 ・肯定応答(ACK) タイムアウト: リセット以外のフレー
ムの後縁フラグ送信後の所定時間内にソース・ポートが
ACK 応答を受信しないとき、この誤りが表示される。
【0038】[受信装置誤り] ・同期の脱落: これは、受信装置内のクロック回復回路
が同期誤りを検出すると表示される。 ・コード違反: 受信装置が ^同期の脱落^ 誤りを検出し
ておらずかつそれが、定義された英字又は文字内にはな
い、パリティ違反を生じる文字を復号する場合、この誤
りが表示される。 ・プロトコル誤り: 上記の受信装置誤りが起こらずかつ
ポートが以下に列挙する有効な文字の間違ったシーケン
スを受信する場合、この誤りが表示される。 (1) 2つのフラグ文字の間に4未満のデータ文字を有す
る短いフレーム。これは雑音による脱落又はフラグ生成
によって生じることがある。 (2) 特権フレーム又はアプリケーション・フレームが使
用可能でバッファは使用可能でない、即ちRR保留(RR_pe
nding)がセットされているとき。 (3) 分離されたRR文字。誤りが検出されずにRR応答が失
われる場合、例えばリンクが遊休状態である間にRR文字
がどちらもフラグ文字に変更される場合、リンクの半分
が停止される。これは殆ど起こりそうもないので、トラ
ンスポート層において回復が与えられない。代わりに、
進行中の動作毎にアプリケーションがタイムアウトを与
えるべきである。 (4) 予期しないACK応答。即ち肯定応答待ち(Waiting_fo
r_ACK)がリセットされるとき。 (5) 分離されたACK文字。ACK応答が脱落する場合、送信
装置もACK タイムアウトを検出する。 (6) 最後のフラグ以来データ文字が介在しない空文字(N
UL)。 (7) 最後のフラグ以来データ文字が介在しない打切り文
字(ABORT)。 (8) 直ぐ後にフラグが続かない打切り文字。 ・CRC誤り: この誤りは、受信されたフレームが間違っ
たCRCを有し、該フレームが打切られず、そして前記の
受信装置誤りがどれも生じていない場合に表示される。 ・シーケンス誤り: 受信されたフレームが受信されたシ
ーケンス番号に等しくないフレーム・シーケンス番号を
有し、該フレームが打切られておらず、該フレームは制
御フレームではなくかつ前記受信装置誤りがとれも生じ
ていないとき、この誤りが表示される。前のフレームは
たぶん失われている。 ・フレーム拒絶: 上記の受信装置誤りを伴わずにフレー
ムが正しく受信され、該フレームが打切られていない
が、該フレームは下記の理由のどれかにより受け入れで
きないとき、この誤りが表示される。 (1) 該フレームは137 よりも多くのデータ文字を含む。
伝送誤り、例えば脱落したフラグがなかったことを検査
するために、受信装置は後縁のフラグまでCRCを累積し
続けなければならない点に注目されたい。 (2) さもなければ、フレームの長さは実現のために受け
入れできない、例えばメッセージ・フレームが長すぎ
る。 (3) 制御フィールドが無効である。 (4) アドレス・フィールドが、実現されないか又は現に
無効である宛先を指定する。 (5) 制御フィールド中のデータ・フィールドの長さが0
ではない。
【0039】このクラス内の誤りは一般にプログラミン
グ、同期又は互換性問題による。
【0040】[リンク誤り回復手順(ERP)]フレーム・レ
ベルでリンクがリンク誤りを回復するために、リンク誤
り回復手順(ERP)が定義される。これは下記の利点を有
する。 (1) 回復はもしそれが成功であれば透明であるから、ア
パー・レベル・プロトコルが簡略化される。 (2) 通常、誤りが生じるとき、動作はどれも終了させる
必要がない。しかしながら、リンクERP にとられた余分
な時間の結果として、限られた緩衝記憶を有する装置が
オーバラン(overrun)することがある。 (3) 遠隔ノードにはアプリケーションの状態についての
不確実さはない。 (4) 異なるリンク実現の互換性が高められる。
【0041】通常はノード・プロセッサ上で走行するフ
ァームウェアでリンクERP が実現されることが予想され
る。しかしながら、該機能は、パフォーマンスが臨界的
である場合、想像ではハードウェア有限状態機械により
実行することができる。
【0042】伝送誤りが生じたとERPが判定する場合、E
RPはそれ自身で該誤りから回復しようと試みる。もし回
復が成功すれば、リンクERP は終了し、アパー・レベル
・プロトコルは該誤りを知らない状態を続ける。ERP は
ある誤り、例えばハードウェア誤り又は恒久的な回線障
害を、透明に回復することができない。ノードがどちら
も常に回復不能誤りを識別し同期状態に留まるように、
ERP は慎重に設計されている。これらの場合には、ERP
は脱出する。可能な場合は、後に説明するように、コマ
ンド再試行により回復が試みられる。
【0043】[原理]リンクERPの基本原理は次のとおり
である。 (1) 故障リンクのみがリンクERP を呼出す。ネットワー
ク中の他のリンクは呼出されない。 (2) リンクERP は特権フレーム及びアプリケーション・
フレームのみを回復する。リンクERP は制御フレームを
回復しない。 (3) 通常の動作では、ACK 応答を受取るまで送信装置は
特権フレーム又はアプリケーション・フレームを破棄し
ない。これは宛先ポートによりフレームが正しく受信さ
れていることを表わす。よって、誤りが生じると、影響
を受けたフレームはなおアパー・レベル・プロトコルを
参照せずに再送信に使用可能である。 (4) 誤りが検出されると、ポートはどちらもリンクERP
を呼出し、リンク・リセットにより状況を交換する。 (5) 回復は回線毎に別個に実行される。各ポートはその
アウトバウンド回線で失われたフレームを回復する責任
がある。送信装置は、それがACK 応答を受信する前に、
別のフレームの送信を開始できるので、最大2フレーム
までの再送信を必要とすることがある。 (6) 通信を再開始する前に、リンクERP はポートを強制
的に使用禁止状態にする。これは両ノードでERP を同期
させ、電源投入時に用いられるのと同じ機構により規則
的な再開始を可能にする。 (7) リンク・プロトコル及びERP は、誤りが生じるとき
フレームが喪失し又は二重化される可能性を最小にする
ように設計される。しかしながら、アパー・レベル・プ
ロトコルは、可能なときは必ず、これらの事象に対して
保護すべきである。例えば、データ転送の終りで0のバ
イト・カウントを検査することができ、失われたメッセ
ージを検出するためにタイム・アウトを用いることがで
きる。
【0044】[リンク状況バイト]誤り回復中、各ノード
内のリンクERP はリンク状況バイトを構築し、それをリ
ンク・リセット・フレームのアドレス・フィールド内の
他のノードに送る。リンク状況バイトは次のように定義
される。
【表1】
【0045】・H/W(ハードウェア)誤り: 1bにセットさ
れると、このビットはポートが内部ハードウェア誤りを
検出したことを表わす。 ・回線障害: 1bにセットされると、このビットは回線ド
ライバ又は受信装置が回線上に障害を検出したことを表
わす。それは診断情報のみに提供され、宛先ノード内の
リンクERP により参照されない。 ・ACK T/O: 1bにセットされると、このビットはACK応答
を待つ間に送信装置がタイムアウトしたことを表わす。
それは診断情報のみに提供され、宛先ノード内のリンク
ERP により参照されない。 ・受信装置誤り: このフィールドは受信装置で検出され
た第1の誤りを識別する下記の3ビット・コードを含
む。 0 0 0 誤りなし 0 0 1 同期の喪失 0 1 0 コード違反 0 1 1 プロトコル誤り 1 0 0 CRC誤り 1 0 1 シーケンス誤り 1 1 0 フレーム拒絶 1 1 1 予備
【0046】同時に2つ以上の誤りが生じると、最低の
数が報告される。・RSN:これはポートにより肯定応答さ
れた最後の特権フレーム又はアプリケーション・フレー
ムの受信シーケンス番号である。それは遠隔ノード内の
リンク ERPにより必要とされる。
【0047】[リンクERPの定義]相互参照を容易にする
ために、ERP が失敗すると、下記の名称で各 ^出口^ が
識別される。
【0048】誤りを検出する第1の(又は唯一の)ポート
がそのリンクERP を呼出す。そしてリンクERP は次のよ
うに進行する。 (1) ERP は送信装置が現在のフレームを、もしあれば、
送信終了するまで待つ。送信装置は現在のフレームの打
切りを任意に選択できる。 (2) そしてERP は、ハードウェアに参照することによ
り、リンク状況バイトを構築する。 (3) もし回線ドライバ又は受信装置が回線障害を検出し
ていれば、ERP は該誤りをリセットしようと試みる。も
しこれが失敗すれば、ERPは脱出し、^恒久的な回線障害
^ を表示する。 (4) ERPは受信装置がDIS文字を検出しているかどうかを
検査する。もしそうなら、遠隔ポートが破滅的な誤りに
より使用禁止状態に入っていることがある。 ERPは脱出
し、^遠隔ポート使用禁止^を表示する。 (5) ERP はリンク状況バイトを含むリンク・リセットを
構築する(下記参照)。次にそれは2つの連続するリンク
・リセット・フレームを遠隔ノードに送る。このような
リンク・リセットの反復はフレームのどれかを雑音によ
り脱落させる。遠隔ポートはここで検査状態を、もしそ
れが既に開始されていなければ、開始すべきである。ど
のみち、それはそのリンクERP を呼出し、遠隔リンク状
況バイトを含む2つのリンク・リセットを返送する。
【0049】下記はリンク・リセット・フレームのフォ
ーマットである。 制御フィールド Message_code = 0CH アドレス・フィールド リンク状況バイト データ・フィールド 不在でなければならない CRCフィールド 正しくなければならない
【0050】リンク・リセットは単一リンクに制限され
る。それは決して1つのリンクから他のリンクに伝播さ
れない。 (6) ERP はリンク・リセットが既に遠隔ノードから受信
されているかどうかを検査する。もし受信されていなけ
れば、ERP はタイムアウトを開始し、リンク・リセット
の受信を待つ。もし局所ノードがもう1つのリンク・リ
セットを送った後1 ms以内にリンク・リセットが受信さ
れていなければ、ERPは脱出し、^リンク・リセット失敗
^を表示する。 (7) もし恒久的な誤りがあれば、実施例はERPルーピン
グ(looping)に対して保護しなければならない。下記は
使用しうる1つの方法の例である。
【0051】ERP の各呼出しは、タイマにより定期的に
0にリセットされる再試行カウンタを増分する。ある最
大値をタイマの1周期中の再試行の数が越える場合、ER
P は脱出し、^再試行制限超過^を表示する。この方式は
ひどい外部雑音の場合に ERPの過剰な使用に対しても保
護する。 (8) ポートのどちらかがハードウェア誤りを検出してい
る場合、ERP は脱出し、^ハードウェア誤り^を表示す
る。 (9) ポートのどちらかが ^フレーム拒絶^ を表示してい
る場合、これ以上の通信は無意味になることがある。ER
P は脱出し、^フレーム拒絶^を表示する。 (10) さもなければ、ERPは肯定応答が未決着であるアウ
トバウンド・フレームの数を計算する。
【0052】ERP は、局所ポートが肯定応答を予期して
いるが遠隔ポートにより受信されていないアウトバウン
ド・フレームの数も計算する。
【0053】もしこれらの検査がどちらも失敗すれば、
ERP は脱出し、^無効再試行状況^を表示する。 (11) さもなければ、ERPは脱落したフレームを再送する
ように手配する。 (12)再送信を必要としないアウトバウンド・バッファは
ここで破棄されなければならない。 (13) ^受信装置誤り^に列挙された誤りのどれかを含む
フレームをポートが受信している場合、適切なインバウ
ンド・バッファが破棄されなければならない。さもなけ
れば、ERP は該インバウンド・バッファを扱わなくても
よい。どれかが一杯である場合、それらはアパー・レベ
ル・プロトコルにより空にされる。 (14) ERP はポートを使用禁止し、ハードウェア誤り、A
CKタイムアウト及び受信装置誤りのラッチの全てをリセ
ットする。 (15) 受信装置がDIS 文字の検出を表示するとき、ERPは
遠隔ポートが使用禁止状態に入るまで待つ。これは2つ
のリンクERP を同期させ、遠隔ポートが通常モードでな
い間に送信装置がフレームを送るのを阻止するために要
求される。
【0054】局所ポートが使用禁止された後 1 ms以内
に受信装置がDIS文字を検出しない場合、ERP は脱出
し、 ^使用禁止状態のタイムアウト待ち^ を表示する。
遠隔ポートは回復できない誤りを表示していることがあ
る。 (16) さもなければ、ERP はポートを使用可能にする。 (17) ERPはポートが使用可能になるのを待つ。これは遠
隔ポートがその回復を終了したことを表わす。
【0055】局所ポートが使用可能状態に入った後 1 m
s 以内にリンクが使用可能にならない場合、ERP は脱出
し、 ^使用可能状況のタイムアウト待ち^ を表示する。
これは、遠隔ノードが電源を遮断されたか又は破局的な
誤りをこうむったことを表わすことがある。 (18) さもなければ、ERP は良好に終了する。
【0056】[非リンクERP誤り回復]リンクERP が失敗
して脱出する場合に各ノードがとるべき動作は、リンク
ERPの範囲外の事象を扱う原始及びいくつかの手順のセ
ットと同様に説明される。これらの事象は次のとおりで
ある。 (A) リンクERP が失敗する。これは一過性の回復不可能
な誤りか又は切断されたリンクのような恒久的な誤りで
あることがある。 (B) 目標ノードがコマンドに応答しない。 (C) 動作しないポートにアドレス指定されるフレームを
経路指定機能が受信する。 (D) ノードは無効メッセージを受信するが、戻りアドレ
スを知らない。 (E) ネットワークに新しいリンクが接続される。
【0057】最初の4事象(A〜D)について、開始機能は
一般に影響を受けたコマンドを終了し、もし必要なら代
替経路を用いて、それらを再試行する。最後のケース
(E) では、コマンドはどれも影響を受けない。
【0058】[特権メッセージの説明]下記のセクション
は誤り回復をサポートするメッセージを定義する。全て
の場合に、制御フィールドは ^特権^ のフレーム・タイ
プを表わす。・セット・マスタ(Set_master): このメッ
セージは、表3に示すように定義され、マスタ(Master)
から、形成プロセス中のネットワーク内の他のあらゆる
ノードに送られる。これはノードがマスタにリンク警告
(Link_alert)メッセージを送りたいときに用いられる戻
りアドレス(Return_address)及びタグ(Tag) を指定す
る。宛先ノードはこの情報を記録し、応答メッセージを
返送する。
【表2】
【0059】・メッセージ・コード: このバイトはメッ
セージをセット・マスタとして識別する。 ・タグ: この2バイト・フィールドは応答メッセージで
返送される。もしノードが次にリンク状態変更を報告す
れば、同じタグがリンク警告メッセージでも用いられ
る。タグはマスタによって指定され、マスタからの現に
活動状態であるタグの間で唯一のものでなければならな
い。タグはノードが別のセット・マスタ・メッセージを
受信するまで活動状態に留まる。 ・戻りアドレス: この4バイト・フィールドは、結果と
して生じる応答メッセージのアドレス・フィールドに入
れられるべき値及びそれに続くリンク警告メッセージを
指定する。もしノードがセット・マスタ・メッセージを
受信し特権モードのノードを有するならば、ノードはセ
ット・マスタ・メッセージの応答を送る前にリンク警告
メッセージをマスタに送るべきである。ノードは受信し
た最新のセット・マスタ・メッセージの戻りアドレス及
びタグだけを記憶する。
【0060】・応答(Response): このメッセージは表4
に示すように定義され、セット・マスタ、マスタ警告、
静止(Quiesce) 及びセット通常モード(Set_normal_mod
e) メッセージに肯定応答するために返送される。原始
メッセージを受信した同じポートに応答が送られる。
【表3】
【0061】・メッセージ・コード: このバイトはメッ
セージを応答として識別する。 ・戻りコード: 原始メッセージが良好に処理された場
合、このバイトは00h にセットされる。他の値はどれも
要求機能を終了できなかったことを表わす。 ・タグ: この2バイト・フィールドは原始メッセージか
らコピーされる。それは肯定応答されようとしているメ
ッセージを識別する。応答メッセージ中のアドレス・フ
ィールドは肯定応答されようとしているメッセージ中の
戻りアドレス・フィールドから得られる。
【0062】・リンク警告: このメッセージは表5のよ
うに定義される。ノードはそのポートの1つにおける非
同期事象をマスタに通知するためにこのメッセージを送
る。マスタは直接には応答しない。
【表4】
【0063】・メッセージ・コード: このバイトはメッ
セージをリンク警告として識別する。 ・タイプ: このタイプは事象を表示するように符号化さ
れる。主な事象のタイプは次の通りである。 ・ポートが現在作動可能である。これは新しいリンクが
接続されていることを表わす。 ・アドレス指定されたポートが作動可能ではない。これ
は経路指定機能がフレームを受信したが転送できなかっ
たことを表わす。 ・メッセージ拒絶。これはノードが無効メッセージを受
信したが戻りアドレスを知らない、例えばメッセージ・
コードが無効であることを表わす。 ・恒久的な障害。これはリンクERP が、例えば、該リン
クが切断されているので、作動しないことを表わす。 ・回復不能誤り。これはリンクERP により回復できなか
った一時的な誤りを表わす。 ・遠隔ポートが応答しない。これはリンクERP の間に遠
隔ポートが応答しなかったことを表わす。 ・遠隔ポートが使用禁止されている。ポートがDIS 文字
を受信したので、リンクERP が開始された。例えば、遠
隔ノードがリセットされているか又は破局的な内部誤り
をこうむっていることがある。 ・タグ: この2バイト・フィールドは最新のセット・マ
スタ・メッセージにより指定されたタグを含む。それは
どのノードがリンク警告を送ったかをマスタが判定する
ことを可能にする。 ・ポート: ビット3:0 は影響を受けたポートを識別する
ための符号なし整数を含む。 リンク警告メッセージ中のアドレス・メッセージは最新
のセット・マスタ・メッセージ中の戻りアドレス・フィ
ールドから得られる。
【0064】・マスタ警告: このメッセージは表6に示
すように定義され、マスタから各々の他の開始機能に送
られる。これは次の2つの用法を有する。 (1) 非同期事象についてリンク警告を転送する。 (2) 例えば誤り回復に続いて、リンクの両ポートが通常
モードに移されていることを表わす。 どちらの場合も、開始機能は応答メッセージをマスタに
返送する。
【表5】
【0065】・メッセージ・コード: このバイトはメッ
セージをマスタ警告として識別する。 ・タイプ: マスタ警告がリンク警告を転送している場
合、このバイトは対応するリンク警告からコピーされ
る。この場合、宛先開始機能は、応答を返送する前に指
定された経路を用いていたコマンドをどれも静止させる
べきである。リンクの両ポートが通常モードに返送され
ていることをマスタが表わしている場合、このバイトは
FFh にセットされる。 ・タグ: これはマスタにより割当てられ、宛先開始機能
からの応答で返送される2バイト・フィールドである。
これはマスタからの現に活動状態の全てのタグの間で唯
一のものでなければならない。 ・戻りアドレス: この4バイト・フィールドは応答メッ
セージのアドレス・フィールドに入れられるべき値を指
定する。 ・経路: この4バイト・フィールドは、マスタ警告を受
信した開始機能に関して、リンク警告を生成したノード
のアドレスを指定する。 ・ポート: 対応するリンク警告メッセージからマスタに
よってビット0:3 がコピーされる。
【0066】・静止: このメッセージは表7に示すよう
に定義され、指定された開始機能からの全てのコマンド
を静止させるために誤り回復中に開始機能から目標に送
られる。目標は、それが影響を受けたコマンドを静止さ
せた後に応答メッセージを返送する。目標は静止された
コマンドの状況を返送しない。
【表6】
【0067】・メッセージ・コード: このバイトはメッ
セージを静止として識別する。 ・タグ: これは開始機能によって割当てられ、目標から
の応答で返送される2バイト・フィールドである。 ・戻りアドレス: この4バイト・フィールドは応答メッ
セージのアドレス・フィールドに入れられるべき値を指
定する。 ・固有識別: これはコマンドが静止されるべき開始機能
の8バイトの固有識別(Unique_ID) である。静止させる
コマンドを選択する前に、目標はその開始機能テーブル
を探索して固有識別を戻りアドレスに変換しなければな
らない。戻りアドレスよりはむしろ固有識別により開始
機能を指定することは、最初の経路がもはや使用できな
い場合に、開始機能が静止のための代替経路を用いるこ
とを可能にする。それは失われている開始機能に代わっ
てマスタが第三者静止を出すことを可能にする。
【0068】・セット通常モード: このメッセージは表
8に示すように定義され、ポートを特権モードから通常
モードに変えるためにマスタにより送られる。宛先モー
ドは応答メッセージを返送する。リンクの両端でポート
が通常モードに変えられたとき、リンクはアプリケーシ
ョン・フレームのために用いることができる。
【表7】
【0069】・メッセージ・コード: このバイトはメッ
セージをセット通常モードとして識別する。 ・ポート: ビット3:0 は通常モードに変更されるポート
を識別する符号なしの整数を含む。 ・タグ: これはマスタにより割当てられ、宛先ノードか
らの応答で返送される2バイト・フィールドである。こ
れはマスタからの現に活動状態の全てのタグの間で唯一
のものでなければならない。 ・戻りアドレス: この4バイト・フィールドは応答メッ
セージのアドレス・フィールドに入れられるべき値を指
定する。
【0070】[回復手順]このセクションは誤り回復中に
以前の概念及び特権メッセージを用いる方法を示す。
【0071】(A) リンクERPが失敗する これはトランスポート層により誤りが回復できなかった
ことを表わす。障害リンクの両ポートは特権モードに入
るので、それらの送信装置はアプリケーション・フレー
ムを破棄する。これは他のトラフィックをハックアップ
しブロッキングするフレームを回避する。これはそれ以
上のデータが影響を受けたリンクにより転送され磁気媒
体に書込まれるのも阻止する。
【0072】もし形成中にセット・マスタにより指定さ
れた返送経路が障害リンクを含むならば、各ノードはマ
スタにリンク警告メッセージを送る。従って、マスタは
1つ又は2つのリンク警告メッセージを受信する。
【0073】そして回復は次のように進行する。 (1) もしリンク警告が ^遠隔ポートが応答しない^ と表
示すれば、マスタは直ちにリセット制御フレームを故障
ノードに出す。
【0074】そしてマスタは影響を受けたリンク及びノ
ードを形成解除する。 (もし故障ノードがリセット後に
回復すれば、隣接ノードは ^ポートは現在作動可能^ を
示す別のリンク警告を生成する。これは影響を受けたリ
ンク及びノードを再形成する。) (2) もしリンク警告が ^遠隔ポートが使用禁止された^
ことを表示すれば、遠隔ノードはリセットされているか
又は破滅的な内部誤りをこうむっていることがある。第
1のケースでは、遠隔ノードは通常はポート自身を再び
使用可能にする。第2のケースでは、該ノードをリセッ
トすることを必要とすることがある。マスタは ^ポート
は現在作動可能である^ ことを表わす隣接ノードから別
のリンク警告を受信するために最大1秒まで待つ。この
リンク警告は該ノードが現在回復していることを表示す
る。もしリンク警告が受信されなければ、マスタは原因
が破滅的な誤りであったと仮定し、該ノードにリセット
制御フレームを出す。この場合、マスタは影響を受けた
リンク及びノードを形成解除する。 (3) もしリンク警告が ^恒久的な障害^ を表示すれば、
マスタは影響を受けたリンク及びノードも形成解除す
る。 (4) マスタは、その形成テーブル内に留まる他の各開始
機能にマスタ警告を出す。 (5) もしマスタ警告が恒久的な障害を表示するか又はノ
ードがリセットされていれば、他の開始機能は影響を受
けたリンク及びノードを形成解除する。 (6) 各開始機能は障害リンク上を進行中であったコマン
ドを識別し、関連したアウトバウンド・データ転送を停
止する。 (7) もし目標が(たぶん代替経路の使用により)形成され
たままであれば、各開始機能は影響を受けたコマンドを
実行中であった各目標に静止メッセージを出す。
【0075】誤りによって前の開始機能がネットワーク
から外されているとマスタが判定する場合、マスタは失
われている開始機能に代わって第三者静止を残りの全て
の目標に出す。
【0076】目標は各静止について応答メッセージを返
送する。影響を受けた目標の全てが静止されていると
き、他の各開始機能はマスタ警告メッセージの応答メッ
セージをマスタに送る。 (8) もしリンクがなお形成されていれば、マスタはセッ
ト通常モードを各ポートに送る。マスタはセット通常モ
ードの応答メッセージを待つ。 (9) 両ポートが現在通常モードであることを表示するた
めに、マスタはマスタ警告メッセージを他の各開始機能
に送る。各開始機能は応答を返送する。 (10)もしリンクがなお形成されているか又は代替経路が
あれば、各開始機能は影響を受けたコマンドを再び出
す。
【0077】(B) 目標が応答しない 開始機能は、目標に出すコマンド毎に反ハング(anti-ha
ng) タイマを開始すると予想される。目標がコマンドの
処理を終了したことを表わす状況を開始機能が受信する
と、タイマは停止される。タイマは目標ノードへの経路
での検出されないリンク障害又は目標自身でのソフトウ
ェア障害に対して保護される。もしタイマが停止される
前に時間切れになれば、開始機能は下記のように動作す
べきである。 (1) 開始機能が特権メッセージを出して隣接ノードで始
まる各中間ノードに順次に質問する。もしモードのどれ
かが返答しなければ、そのノードはハングされていると
想定される。さもなければ、目標ノードがハングされて
いる。 (2) 開始機能はハングされているノードにリセット制御
フレームを出す。これは当該ノードにある全てのポート
を使用禁止する。 (3) 隣接ノードに接続されたポートはこれを検出し、リ
ンクERP を呼出し、そして ^遠隔ポート使用禁止^ を表
示するリンク警告を生成する。これは前述のように処理
される。
【0078】(C) アドレス指定されたポートが作動しな
い 作動しない経路指定機能ポートにフレームが間違ってア
ドレス指定されることがある。これは下記のように処理
される。 (1) 誤りを検出するノードがマスタにリンク警告を送
り、 ^アドレス指定されたポートが作動しない^ ことを
表示する。該ポートは特権モードに留まる。 (2) マスタは他の各開始機能にマスタ警告を出し、 ^ア
ドレス指定されたポートが作動しない^ ことを指定す
る。 (3) 各開始機能は影響を受けたコマンド及び関連アウト
バウンド・データ転送を終了させ、応答を返送する。 (4) 代替経路がある場合、各開始機能は影響を受けたコ
マンドを再び出す。
【0079】(D) 無効メッセージが受信された もし宛先ノードが戻りアドレスを知る (例えば、メッセ
ージが無効パラメータを持った) ならば、非ゼロ戻りコ
ードにより応答を返送する。さもなければ、宛先ノード
は ^メッセージ拒絶^ を指定するリンク警告を生成す
る。これは、ポートが通常モードに留まる場合を除い
て、前述の ^アドレス指定されたポートが作動しない^
場合のように処理される。
【0080】(D) 新しいリンクが接続された ネットワークに新しいリンクが接続されると、既存のノ
ードの1つにあるポートが作動可能になる。 (1) ^ポートは現在作動可能である^と指定するリンク警
告をノードがマスタに送る。 (2) マスタは新しいノードを形成する。 (3) マスタは新しいノードにセット・マスタを出す。各
ノードは応答を返送する。 (4) マスタは、リンク警告及び他の新しいポートを生成
したポートにセット通常モードを出す。各ポートは応答
を返送する。 (5) マスタは、 ^ポートは現在作動可能である^ と指定
するマスタ警告を他の各開始機能を送る。 (6) 他のあらゆる開始機能は新しいノードを形成する。
【0081】[実施例]以上に説明した誤り回復方法は種
々の異なるアプリケーションで用いることができる。そ
のうちの2つの実施例について以下に説明する。本発明
は他のタイプのネットワークでも容易に用いうることが
理解される。図8に示すように、二重ポートの装置のス
トリングは、I/O 装置をパーソナルコンピュータに接続
するのに特に魅力的である。一般にパーソナルコンピュ
ータのシステム装置内に存在するアダプタ50はリンク51
を介してディスク装置52に接続され、ディスク装置52は
リンク53を介してディスク装置54に接続され、ディスク
装置54はリンク55を介して印刷装置56に接続される。ス
トリングの使用は装置当りの接続費用を減らすととも
に、アダプタでの配線の混雑を回避する。本発明の誤り
回復手法の使用は、ディスク装置に間違ったデータが書
込まれ、又は間違ったデータが印刷される結果になる誤
りを阻止する。オプションとしてリンク57を設けること
により、より広い帯域幅又は一定の障害許容度を与える
ループを閉じることができる。誤りは障害リンク又はノ
ードを用いるコマンドのみに影響を与えるので、閉じら
れたループにより、障害ノードを除く全てのノードを依
然としてアクセスできる。
【0082】図9は高い使用可能度のファイル・サーバ
ーとして使用できる典型的なネットワーク構成を示す。
このような共有システムでは高い使用可能度が重要であ
る。このアプリケーションは二重ポートのディスク装置
も必要とするが、ここでは第2のポートを必要とする主
な理由は主要接続経路における障害の場合にバックアッ
プ経路を与えることである。よって、実際には全ての直
列ディスク装置がたぶん二重ポート化される。ディスク
・アレイに関連して、図9に示すように、二重ポートの
ディスク装置は障害点が1つもない構成を可能にする。
この構成では、対のサーバー60及び62が専用リンクを介
して両スイッチ64及び66に接続され、二重ポートのディ
スク装置68、70、72及び74の各ポートがスイッチの1つ
に接続される。各ディスク装置への専用リンクの使用
は、他のディスク装置の動作に影響を与えずに完全に並
行保守を可能にする。
【図面の簡単な説明】
【図1】本発明の手法を用いるネットワークで見出だし
うるような二重ポート・ノードの主要機能構成装置を示
す図である。
【図2】相互接続された単一ポート・ノードの対を含む
簡単なネットワークのブロック図である。
【図3】ノード間の単一伝送経路を有する、相互接続さ
れた単一ポート及び二重ポートのノードのストリングを
含むネットワークのブロック図である。
【図4】ノード間の2つの可能な伝送経路を有するルー
プ構成で相互接続された幾つかの、図1に示すような、
二重ポート・ノードを含むネットワークのブロック図で
ある。
【図5】単一ポート、二重ポート及びスイッチ・ノード
を含む、相互接続されたノードの複合ネットワークのブ
ロック図である。
【図6】図2乃至図5に示すような、ノード間の通信に
用いられる単一フレームのフォーマットを示す図であ
る。
【図7】図6のアドレス・フィールド成分のフォーマッ
トを示す図である。
【図8】本発明を用いうるパーソナルコンピュータ・シ
ステムのブロック図である。
【図9】本発明を用いうるファイル・サーバ・システム
のブロック図である。
【符号の説明】
10 二重ポート・ノード 12 直列リンク 14 直列リンク 16 ポート 18 ポート 20 3ウェイ経路指定機能 22 ノード機能 30 単一ポート・ノード 32 単一ポート・ノード 34 単一ポート・ノード 36 二重ポート・ノード 38 二重ポート・ノード 40 二重ポート・ノード 42 二重ポート・ノード 44 二重ポート・ノード 45 二重ポート・ノード 46 二重ポート・ノード 47 二重ポート・ノード 48 二重ポート・ノード 50 アダプタ 52 ディスク装置 54 ディスク装置 56 印刷装置 57 リンク 60 サーバー 62 サーバー 64 スイッチ 66 スイッチ 68 ディスク装置 70 ディスク装置 72 ディスク装置 74 ディスク装置 100 単一ポート・ノード 102 二重ポート・ノード 104 二重ポート・ノード 106 スイッチ 108 二重ポート・ノード 110 二重ポート・ノード 114 スイッチ 116 二重ポート・ノード 118 二重ポート・ノード
───────────────────────────────────────────────────── フロントページの続き (72)発明者 レジナルド・ビーア イングランド、エス・オー5 1ピー・エ ックス、ハンプシャー州チャンドラーズ・ フォード、クレベランズ・クロース 4

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】リンクによって接続された複数のノードを
    含む情報通信システムにおいて通信誤りを回復する方法
    であって、前記システムは前記情報通信を一以上の前記
    ノードによって開始し、データを転送する第一のタイプ
    のフレームと、誤り回復のための第二のタイプのフレー
    ムの形式で前記ノード間で情報通信し、前記ノードは少
    なくとも第一の動作モードと第二の動作モードとを有す
    るシステムにおける、誤り回復方法であって、 a) 誤り回復を制御するマスタモードを定義するステ
    ップと、 b) 第一のノードと第二のノードを接続するリンクで
    誤りを検出した時に、 前記第一ノードまたは前記第二ノードの少なくとも一方
    を前記第一の動作モードから前記第二の動作モードに切
    り換え、前記第一のタイプのフレームは前記ノードの全
    てのポートにおいて破棄され、前記第二のタイプのフレ
    ームは前記ノードのいずれにおいても受け入れられるス
    テップと、 前記第一のノードまたは前記第二のノードの少なくとも
    一方から前記マスタノードに対して第一の誤り情報を含
    んだ第二のタイプのフレームを転送するステップと、 前記マスタノードから情報転送を開始可能な全てのノー
    ドに対して第二の誤り情報を含んだ第二のタイプのフレ
    ームを転送するステップと、 前記第一のノードと、前記第二のノード間のリンクを使
    用して第一のタイプのフレームの転送を開始した他のノ
    ードが前記第一のタイプのフレームが転送された先の各
    々のノードに対して前記第一のノードを破棄すべき旨の
    命令を転送するステップと、 を含む一連のステップを行い、 c) 前記bの各ステップが成功裡に終了した時に、 前記マスタノードが前記第一のノードと前記第二のノー
    ドに対してこれらのノードを前記第一の動作モードに切
    り換えて、全てのタイプのフレームを受け入れるように
    するステップと、 前記マスタノードが情報転送を開始可能な全てのノード
    に対して第二のタイプのフレームを転送し前記誤り情報
    をキャンセルするステップと、 を含む一連のステップを行う、誤り回復方法。
  2. 【請求項2】前記マスタノードを定義するステップは、
    所定の基準のもとに情報転送が開始可能な全てのノード
    から選出することを含む請求項1の方法。
  3. 【請求項3】前記情報転送が開始可能なノードは固有識
    別を有しており、前記所定の基準は前記識別子が最大の
    ものを選出するものであることを特徴とする請求項2の
    方法。
  4. 【請求項4】d)第一のノードにおいてそのポートに第
    三のノードを付加したことを検出したときに、 前記第一のノードを前記第一の動作モードから前記第二
    の動作モードに変更することによって、前記第一のタイ
    プのフレームが前記第一のノードの全てのポートにおい
    て破棄されるとともに、前記第二のタイプのフレームが
    受け入れられるステップと、 前記第一のノードから前記マスタノードに対して第一の
    誤り情報を含む第二のタイプのフレームを転送するステ
    ップと、 前記マスタノードから前記第三のノードに対して前記マ
    スタノードの前記固有識別を含んだ第二のタイプのフレ
    ームを転送するステップと、 を含む一連のステップを行い、 e)前記dのステップ群が成功裡に終了した時に、 前記マスタノードから前記第一のノードと前記第三のノ
    ードに対してこれらのノードを前記第一の動作モードに
    切り換えるためのフレームを転送することによって、全
    てのタイプのフレームを受け入れるステップと、 前記マスタノードから情報転送を開始可能な全てのノー
    ドに対して前記第三のノードの固有識別子を含む前記第
    二のタイプのフレームを転送するステップと、を含む一
    連のステップをさらに具備する、請求項1、2、または
    3の方法。
JP5090965A 1992-06-20 1993-04-19 情報通信システムにおける誤り回復方法 Expired - Lifetime JPH0720103B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9213151A GB2268373A (en) 1992-06-20 1992-06-20 Error recovery in an information communication system
GB9213151.5 1992-06-20

Publications (2)

Publication Number Publication Date
JPH0669931A JPH0669931A (ja) 1994-03-11
JPH0720103B2 true JPH0720103B2 (ja) 1995-03-06

Family

ID=10717473

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5090965A Expired - Lifetime JPH0720103B2 (ja) 1992-06-20 1993-04-19 情報通信システムにおける誤り回復方法

Country Status (5)

Country Link
US (1) US5958064A (ja)
EP (1) EP0576136A3 (ja)
JP (1) JPH0720103B2 (ja)
CA (1) CA2095054C (ja)
GB (1) GB2268373A (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW401670B (en) * 1994-08-08 2000-08-11 Symbios Logic Inc Movie-on-demand disk storage loop architecture
US5748871A (en) * 1995-08-11 1998-05-05 Symbios Logic Inc. Dual bus architecture for a storage device
US6262993B1 (en) 1996-11-08 2001-07-17 Kevin Kirmse Computer and peripheral networking device permitting the practical use of buffer insertion-based networks while communicating over unshielded twisted pair conductive media
US6480600B1 (en) 1997-02-10 2002-11-12 Genesys Telecommunications Laboratories, Inc. Call and data correspondence in a call-in center employing virtual restructuring for computer telephony integrated functionality
US6104802A (en) 1997-02-10 2000-08-15 Genesys Telecommunications Laboratories, Inc. In-band signaling for routing
US7031442B1 (en) 1997-02-10 2006-04-18 Genesys Telecommunications Laboratories, Inc. Methods and apparatus for personal routing in computer-simulated telephony
US7593321B2 (en) * 1997-02-11 2009-09-22 Cisco Technology, Inc. Method and system for a local and fast non-disruptive path switching in high speed packet switching networks
US6711611B2 (en) 1998-09-11 2004-03-23 Genesis Telecommunications Laboratories, Inc. Method and apparatus for data-linking a mobile knowledge worker to home communication-center infrastructure
US6985943B2 (en) 1998-09-11 2006-01-10 Genesys Telecommunications Laboratories, Inc. Method and apparatus for extended management of state and interaction of a remote knowledge worker from a contact center
USRE46528E1 (en) 1997-11-14 2017-08-29 Genesys Telecommunications Laboratories, Inc. Implementation of call-center outbound dialing capability at a telephony network level
US7907598B2 (en) 1998-02-17 2011-03-15 Genesys Telecommunication Laboratories, Inc. Method for implementing and executing communication center routing strategies represented in extensible markup language
US6332154B2 (en) 1998-09-11 2001-12-18 Genesys Telecommunications Laboratories, Inc. Method and apparatus for providing media-independent self-help modules within a multimedia communication-center customer interface
US6842481B1 (en) * 1998-04-17 2005-01-11 Advanced Micro Devices, Inc. Apparatus and method for secure media independent interface communications by corrupting transmit data on selected repeater port
USRE46153E1 (en) 1998-09-11 2016-09-20 Genesys Telecommunications Laboratories, Inc. Method and apparatus enabling voice-based management of state and interaction of a remote knowledge worker in a contact center environment
US7415009B2 (en) * 1998-11-12 2008-08-19 Genesys Telecommunications Laboratories, Inc. Telephony intelligence in a data packet network
JP2001111518A (ja) * 1999-10-04 2001-04-20 Mitsubishi Electric Corp 通信方法および通信装置
US7929978B2 (en) 1999-12-01 2011-04-19 Genesys Telecommunications Laboratories, Inc. Method and apparatus for providing enhanced communication capability for mobile devices on a virtual private network
IL140047A0 (en) * 2000-03-27 2002-02-10 Good Space Ltd Vehicle related services system and methodology
FI109855B (fi) * 2000-08-25 2002-10-15 Nokia Corp Datavirran suodatus tietoliikenneverkossa
US6839792B2 (en) * 2000-12-15 2005-01-04 Innovative Concepts, Inc. Data modem
US7539746B2 (en) * 2001-02-01 2009-05-26 Emc Corporation Highly available transaction failure detection and recovery for electronic commerce transactions
WO2003019393A1 (en) 2001-08-24 2003-03-06 Intel Corporation A general intput/output architecture, protocol and related methods to implement flow control
US9836424B2 (en) 2001-08-24 2017-12-05 Intel Corporation General input/output architecture, protocol and related methods to implement flow control
US7177971B2 (en) * 2001-08-24 2007-02-13 Intel Corporation General input/output architecture, protocol and related methods to provide isochronous channels
US6766482B1 (en) 2001-10-31 2004-07-20 Extreme Networks Ethernet automatic protection switching
US6868509B2 (en) * 2001-12-07 2005-03-15 Invensys Systems, Inc. Method and apparatus for network fault correction via adaptive fault router
CA2492745C (en) * 2002-07-17 2012-01-03 Shell Canada Limited Forge welding method
US7171525B1 (en) * 2002-07-31 2007-01-30 Silicon Image, Inc. Method and system for arbitrating priority bids sent over serial links to a multi-port storage device
KR100740731B1 (ko) 2003-02-20 2007-07-19 자링크 세미컨덕터, 인크 다수의 패킷 네트워크 상의 클록의 정렬 방법
US7324455B2 (en) 2003-03-14 2008-01-29 International Business Machines Corporation Transfer of error-analysis and statistical data in a fibre channel input/output system
US9008075B2 (en) 2005-12-22 2015-04-14 Genesys Telecommunications Laboratories, Inc. System and methods for improving interaction routing performance
GB0612573D0 (en) * 2006-06-24 2006-08-02 Ibm System and method for detecting routing problems
EP1901489B1 (en) * 2006-09-13 2014-11-05 Yamaha Corporation Network system and audio signal processor
US8004966B2 (en) * 2008-04-25 2011-08-23 Calix, Inc. Efficient management of ring networks
US8218580B2 (en) * 2008-07-15 2012-07-10 Intel Corporation Managing timing of a protocol stack
US20130278412A1 (en) * 2012-04-20 2013-10-24 Detcon, Inc. Networked system and methods for detection of hazardous conditions
US9262270B2 (en) * 2012-12-28 2016-02-16 Intel Corporation Live error recovery
JP2016181756A (ja) * 2015-03-23 2016-10-13 ラピスセミコンダクタ株式会社 半導体装置及びデータの送受信方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4356546A (en) * 1980-02-05 1982-10-26 The Bendix Corporation Fault-tolerant multi-computer system
US4412281A (en) * 1980-07-11 1983-10-25 Raytheon Company Distributed signal processing system
US4438494A (en) * 1981-08-25 1984-03-20 Intel Corporation Apparatus of fault-handling in a multiprocessing system
US4503535A (en) * 1982-06-30 1985-03-05 Intel Corporation Apparatus for recovery from failures in a multiprocessing system
US4862461A (en) * 1987-01-12 1989-08-29 International Business Machines Corp. Packet switch network protocol
JPH03164837A (ja) * 1989-11-22 1991-07-16 Hitachi Ltd 通信制御処理装置の切替方法
GB8928699D0 (en) * 1989-12-20 1990-02-28 Int Computers Ltd Data communications system
US5271013A (en) * 1990-05-09 1993-12-14 Unisys Corporation Fault tolerant computer system
GB2250897A (en) * 1990-12-04 1992-06-17 Ibm Error recovery in data communication systems.
JPH04245751A (ja) * 1991-01-31 1992-09-02 Nec Corp イベント処理分散型網監視システム
US5247664A (en) * 1991-03-28 1993-09-21 Amoco Corporation Fault-tolerant distributed database system and method for the management of correctable subtransaction faults by the global transaction source node
US5325518A (en) * 1991-04-02 1994-06-28 Carnegie Mellon University Adaptive distributed system and method for fault tolerance
US5390326A (en) * 1993-04-30 1995-02-14 The Foxboro Company Local area network with fault detection and recovery

Also Published As

Publication number Publication date
US5958064A (en) 1999-09-28
EP0576136A2 (en) 1993-12-29
CA2095054A1 (en) 1993-12-21
CA2095054C (en) 1999-01-26
GB2268373A (en) 1994-01-05
GB9213151D0 (en) 1992-08-05
EP0576136A3 (en) 1996-06-05
JPH0669931A (ja) 1994-03-11

Similar Documents

Publication Publication Date Title
JPH0720103B2 (ja) 情報通信システムにおける誤り回復方法
EP0513232B1 (en) Method of error recovery in a data communication system
US6581166B1 (en) Network fault detection and recovery
US7876751B2 (en) Reliable link layer packet retry
CN1633647B (zh) 用于管理网络中的数据传送的系统、方法
US6545981B1 (en) System and method for implementing error detection and recovery in a system area network
JP2546950B2 (ja) データ処理入出力システムにおけるノード識別方法
EP0464014A2 (en) Communications systems using a fault tolerant protocol
EP0580281A2 (en) Network addressing
EP0472835B1 (en) Notification and verification of state changes in a data processing input/output system
JPH10510403A (ja) 多プロセッサ環境
JPS5866448A (ja) パケット交換における誤り検出方式
JPH10326261A (ja) 分散コンピュータ・システムのハードウェア要素によりエラーを報告するシステム
JP3101604B2 (ja) 分散コンピュータ・システムのエラーを報告する方法
JPH01105644A (ja) データ伝送制御方法およびデータ通信装置
KR20050002865A (ko) 인피니밴드 채널 어댑터 장애용 리던던시 제공 방법 및 컴퓨터 시스템
JPH09130408A (ja) ネットワークインタフェース装置
US8116210B2 (en) System and program product to recover from node failure/recovery incidents in distributed systems in which notification does not occur
JPH06252895A (ja) データ伝送方式
JP2000165424A (ja) ループ式データ伝送装置
JP2500608B2 (ja) 応答確認方式
JPH01291553A (ja) メッシュネットワークにおける個別通信方式
JPH0556084A (ja) 通信制御装置のデータ送信方法
KR930006033B1 (ko) 전전자 교환 시스템에서의 프로세서간 메세지 송수신 기능 구현방법
JPS6271348A (ja) ル−プ式デ−タ伝送制御方式