JPH11168502A - 通信障害処理装置及び方法 - Google Patents

通信障害処理装置及び方法

Info

Publication number
JPH11168502A
JPH11168502A JP9333930A JP33393097A JPH11168502A JP H11168502 A JPH11168502 A JP H11168502A JP 9333930 A JP9333930 A JP 9333930A JP 33393097 A JP33393097 A JP 33393097A JP H11168502 A JPH11168502 A JP H11168502A
Authority
JP
Japan
Prior art keywords
data
interface mechanism
failure
cluster
communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9333930A
Other languages
English (en)
Inventor
Tomoaki Nagano
知明 長野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Computertechno Ltd
Original Assignee
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Computertechno Ltd filed Critical NEC Computertechno Ltd
Priority to JP9333930A priority Critical patent/JPH11168502A/ja
Publication of JPH11168502A publication Critical patent/JPH11168502A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Monitoring And Testing Of Exchanges (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】 マルチクラスタ型コンピュータシステムにお
いて、通信障害に伴うデータ途絶の発生による障害箇所
以外のインターフェースによるチェックストップ及びシ
ステムの不要な縮態をなくし、且つデータ破壊などの二
次障害を防ぐ。 【解決手段】 データ途絶期間を監視するタイマー6
と、データブロックに含まれるデータ数を初期値からカ
ウントダウンする減算器7と、ダミーデータ発生機構9
と、タイマー値及び減算器7の出力を監視してダミーデ
ータの発生を制御するコントローラ8と、インターフェ
ース外部からのデータを一時的に蓄えるレジスタ10
と、レジスタ10からのデータまたはダミーデータ発生
機構9からのデータの選択を行うセレクタ11と、ロー
カルメモリ12と、演算処理回路13により構成され
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータネッ
トワークにおける通信障害処理装置及び方法に係り、特
にスイッチ接続型のマルチクラスタ型コンピュータネッ
トワークシステムにおけるデータ通信障害処理技術に関
する。
【0002】
【従来の技術】従来、コンピュータのI/Oインターフ
ェース障害においては、演算処理装置に付随した、ロー
カルなインターフェース機構の障害によるデータの中断
についての障害処理方法が数多く提案されている。
【0003】これら従来の障害処理の基本は、インター
フュース機構のチェック信号が点灯し、その点灯をうけ
て演算処理装置若しくは障害処理システムが、データ破
壊やシステム全体のダウンを防ぐために障害処理を行う
ものである。
【0004】このような障害処理の代表的例としては、
チェック信号の点灯に伴い受信中データの受信動作を最
初から無かったことにし、チェック以前に受信したデー
タを破棄する方法や、チェック後に受信するはずのデー
タをダミーのデータにて補完する方法などがあるが、い
ずれの場合も障害処理後においては、チェックを検出し
たインターフェースに対するデータ転送要求を抑止する
ようになっている。
【0005】また、インターフェース機構のチェック信
号を用いない障害処理方法として、データの送受信前に
予めインターフェース障害が起こっていないかを調べ、
タイムアウトなどの異常が事前に検出された場合、デー
タの転送を中断するか、ダミーデータの発生による転送
の強制的な正常終了を行う等の方法がある。
【0006】
【発明が解決しようとする課題】従来の技術における問
題点は、障害処理動作の起動がシステムのローカル性に
着目したものである点である。即ち、マルチクラスタ型
コンピュータシステムでは、受信データの中断の原因と
して、受信側クラスタのインターフェース機構の障害の
他に、送信側クラスタのインターフェース機構の障害
や、クロスバスイッチの障害、またはクロスバスイッチ
の有するインターフェース機構における障害等が考えら
れ、自クラスタに付随したインターフェース機構の障害
以外の原因については、自クラスタの障害処理システム
においては認識不可能であるため、インターフェースチ
ェックによる障害処理動作の起動は難しいという点にあ
る。
【0007】例えば、他クラスタやクロスバの障害など
によるデータの中断で、自クラスタに付随するインター
フェースのチェックを点灯させる方法として、タイムア
ウトの検出によるチェック信号を点灯させる等の方法が
あるが、実際に障害を起こしていない機構をチェックス
トップさせるのは、チェック機構のあり方として妥当で
はなく、この方法では、実際に故障を起こしていない装
置を止めることによるシステムの縮態運転を余儀なくさ
れる上に、保守作業において直接の障害原因が判断しに
くくなり、チェック信号を発行しているすべての装置を
調べる必要が発生するという問題がある。
【0008】一方、別の方法として、クラスタ間通信に
おいて送出側インターフェース機構の障害により、クロ
スバに付随するインターフェース機構においてデータの
中断が発見された場合に、クロスバに付随するインター
フェース機構でもタイムアウトによるチェック信号を発
行するようにしたとすると、送出側インターフェースの
障害なのか、受信側のクロスバに付随するインターフェ
ース機構の障害なのか判別できず、保守時に調査しなく
てはならなくなるという問題がある。
【0009】また、事前に通信障害が発生しているかど
うかを調べる方法では(広域ネットワーク技術などには
よく見られる手法だが)、データ転送中の障害に対する
対処は、やはりインターフェース機構のチェック信号を
起因とする方式でしか行うことが出来ないという問題
(欠点)がある。
【0010】そこで、本発明の目的は、マルチクラスタ
型コンピュータシステムのクラスタ間通信の障害のう
ち、通信データの中断によって発生するデータ破壊の回
避を行い、通信データの中断を引き起こした直接の原因
となった障害箇所以外でのチェックストップによる不要
なシステムの縮態の回避を目的とし、また保守の容易性
を確保することにある。
【0011】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、インターフェース機構の障害処理部動作
として、データブロックの中断が行われた揚合に、デー
タブロックを構成するデータの不足分をダミーデータ発
生機構で発生したデータで補完するように構成したこと
を特徴とするものである。
【0012】以上の動作を実現するため、本発明のシス
テムは、データブロックのデータ途絶期間を監視するタ
イマーと、データブロックに含まれるデータの数を初期
値からカウントダウンするための減算器と、タイマーの
値を監視してデータの中断が発生したことを検出すると
共に、減算器の出力を監視してダミーデータの発生を制
御するコントローラと、コントローラからの指示でダミ
ーデータを発生するダミーデータ発生機構と、インター
フェース機構から送出するデータとしてインターフェー
ス外部からのデータとインターフェース機構内で発生し
たダミーデータとの選択を行うセレタタとを備えて構成
されることを特徴とするものである。さらに、ダミーデ
ータ発生機構では、データブロック中に埋め込むデータ
にダミーデータであることを示すフラグを設けることに
より受信側装置に対し、受信したデータの無効性を通知
し、データの取捨選択を可能としたことを特徴とするも
のである。
【0013】上記発明によれば、データ途絶が起こった
場合に、タイムアウトによるチェックストップを行う必
要がないため、データ中断の直接原因となった障害個所
以外でのチェック信号の発信を抑制することができる。
また、データ途絶が起こったデータブロックに対して
は、データ途絶が検出されたインターフェース機構によ
りダミーデータの補完が行われるため、以降のインター
フェース機構または装置において、データの受け取り動
作を特に変更すること無く、障害発生時のデータを受信
可能であり、障害の他装置への伝播を防止することがで
きる。そして、障害発生時に伝達されるデータには、ダ
ミーデータであることを示すフラグが設けられているた
め、演算処理装置または受信インターフェース機構によ
りデータの無効性をチェックすることが可能であり、ダ
ミーデータを使用して演算またはデータ処理を行うこと
による受信クラスタ側でのデータ破壊を防止することが
可能である。さらに、上記手順により通信は正常に完了
するため、データ途絶を引き起こした直接原因となる障
害を起こしている装置以外では、チェック信号が点灯し
ないため、保守はチェック信号が点灯している装置のみ
で行えばよく、障害を起こしている装置を修復した後
は、障害を起こした装置以外がすべて正常運用されてい
るため、修復された装置を組み込む(取り外して修理し
た後の装置を元に戻す)ことにより、直ちに障害前の運
用状態への復帰が可能である。
【0014】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0015】図1は本発明の通信障害処理装置における
システムの一構成例を示した概略図である。
【0016】図1において、マルチクラスタ型コンピュ
ータシステムを構成する各クラスタ1,2,3,及び4
は、クロスバスイッチ5によりそれぞれ接続されてい
て、各クラスタ間の通信は、クロスバスイッチ5を介し
てそれぞれ行われるようになっていて、各クラスタは独
立したコンピュータシステムとして動作に必要な要素を
備えている。
【0017】クラスタ1,2,3,及び4はクロスバス
イッチ5との通信を行うための対クロスバインターフェ
ース機構を各々備えており、クロスバスイッチ5はクラ
スタ1,2,3,及び4と通信を行うための対クラスタ
インターフェース機構を備えている。尚、本実施の形態
ではクロスバスイッチ5はクラスタ数と同数の通信ポー
トを備えるものとする。
【0018】図2は本発明の通信障害処理装置における
クラスタの一構成例を示したブロック図である。
【0019】図2における対クロスバインターフェース
部(受信側装置に付随するインターフェース機構)は、
データブロックのデータ途絶期間を監視するタイマー6
と、データブロックに含まれるデータの数を初期値から
カウントダウンするための減算器7と、タイマーの値を
監視しデータの中断が発生したことを検出すると共に減
算器7の出力を監視してダミーデータの発生を制御する
コントローラ8と、コントローラからの指示でダミーデ
ータを発生するダミーデータ発生機構9と、インターフ
ェース外部からのデータを一時的に蓄えるレジスタ10
と、インターフェース機構から送出するデータとして、
対クロスバインターフェース部の外部からのデータ、ま
たは、対クロスバインターフェース部(以降単に、イン
ターフェース機構ともいう)内で発生したダミーデータ
との選択を行うセレクタ11により構成される。また、
図2における演算装置部は、ローカルメモリ12と、演
算処理回路13により構成される。
【0020】図3は本発明の通信障害処理装置における
クロスバスイッチの一構成例を示したブロック図であ
る。
【0021】図3における対クラスタインターフェース
部(送信側装置に付随するインターフェース機構)は、
図2の対クロスバインターフェース部(受信側装置に付
随するインターフェース機構)と同一の構成を受信側に
持ち、動作も同一である。クロスバスイッチ5では、ク
ロスバスイッチ5の各ポート毎に対クラスタインターフ
ェースを持ち、図3ではそのうちの一つを示している。
【0022】図4は本発明の通信障害処理装置における
クラスタ間通信で使用されるデータブロックのフォーマ
ットの一例を示した図である。
【0023】図4に示すデータブロックは、システムに
障害が発生しておらず、任意のクラスタ間において、正
常にデータの転送が行われている場合の例であり、デー
タエリアには、すべて“Data”が入っている。デー
タブロックの先頭にはヘッダが挿入されており、データ
ブロックの転送が開始され、このヘッダを受信側インタ
ーフェース部が受け取ると、減算器7により転送データ
におけるデータブロック内に“Data”がいくつ含ま
れているかが検出される。また、各データにはフラグと
して、“データ有効フラグ”及び“障害フラグ”とブロ
ック内に含まれるデータの番号をあらわす“シーケンシ
ヤル番号”がそれぞれ添付されている。
【0024】次に、システムに障害が発生した場合につ
いて説明する。
【0025】図1に示すシステムにおいて、例えば、ク
ラスタAからクラスタCへのデータ転送が行われる場合
を考える。転送データブロックの大きさは、図4のデー
タブロックのフォーマットに従い、1データブロックで
データブロックに内包されるデータ数を20であるとし
て説明を行う。
【0026】いま、データブロックの転送が開始され、
図1で示すところのクロスバスイッチに接続されている
クラスタCに対応した、対クラスタインターフェース部
において障害が発生し、データの転送が途中で中断され
た場合を考える。
【0027】例えば、シーケンシャル番号12のデータ
が送出されたところで、図3のクロスバスイッチ5にお
ける対クラスタインターフェース部に障害が発生したと
すると、図2の対クロスバインターフェース部における
タイマー6は、データが途絶したところからカウントア
ップを開始し、カウンタの値を出力信号bとして出力す
る。ところで、本システムではデータブロック転送中の
データの途絶は1クロックまでしか許されていないた
め、通常動作中にはこのカウンタの値(出力信号b)は
必ず“0”または“1”としてコントローラ8に供給さ
れる。一方、障害発生時には、シーケンシャル番号13
を持つデータはクラスタCの対クロスバインターフェー
ス部に到着しないため、2クロック目に空白(データ途
絶期間)が発生し、タイマー6は出力信号bとしてカウ
ンタの値“2”を出力する。
【0028】カウンタの値“2”(出力信号b)の入力
された減算器7は、データの受信の有無に関わらずカウ
ンタの減算を1クロック毎に行う動作となる。同時に、
カウンタの値“2”(出力信号b)の入力されたコント
ローラ8は、出力信号fを出力セレクタ11に出力し、
出力セレクタ11の入力データを、対クロスバインター
フェース部の外部より供給されたデータから、対クロス
バインターフェース部内のダミーデータ発生機構9より
出力されるダミーデータ(信号e)を選択するように切
り替え制御する。
【0029】この動作により、図4に示す出力セレクタ
11の出力(信号g)は、1クロック以上の空白を開け
ることなく、予定された20個のデータを、図2の演算
装置部に送出する。
【0030】出力セレクタ11より、予定された20個
のデータの演算装置部への送出が完了して、タイマー6
より供給される出力信号bの値が“0”になると、減算
器7は、次のデータ転送が始まるまで出力信号cを
“0”に固定する。また、減算器7の出力(信号c)が
“0”になったことを受けてコントローラ8は、セレタ
タ11の入力をダミーデータ発生機構9からレジスタ1
0側に戻す。これにより、障害が復旧した後、クラスタ
Cの対クロスバインターフェース部は通常のデータ転送
動作を開始する。
【0031】上記動作(障害発生時における動作)が行
われた場合において、クラスタCの演算装置部が受け取
る最終的なデータブロックの内容を図5に示す。図4と
比較して変化のある部分には網掛けがしてある。
【0032】図5に示すデータブロックは見かけ上、有
効なものとして発行される。このため、データ有効フラ
グは20個のデータに対してすべて“1”となってお
り、これによって、受信側装置は、有効データを予定数
受け取ったものと判断する。しかし、図5に示す如く
に、ダミーデータ(網掛け部)に対しては、障害フラグ
“1”が示されており、対応するデータがダミーデータ
であることを同時に示している。
【0033】受信側装置は、この障害フラグを参照する
ことで受信したデータがダミーデータを含んだものであ
ることを検出することが可能であり、例えば、このダミ
ーデータを含んだ受信データを破棄するようにしても良
い。
【0034】なお、ダミーデータは、本システムでは
“A110”としているが、このデータ内に“0”以外
の任意のデータを入れることも勿論可能である。また、
ダミーデータに添付されるシーケンシャル番号は、ダミ
ーデータ発生回路により本物のデータと同じシーケンシ
ャル番号が与えられ、これにより、受信インターフェー
ス側でのチェックなどによって不整合が検出されること
を防いでいる。
【0035】次に、図6を参照して本発明の通信障害処
理装置における通信障害処理動作について説明を行う。
図6は障害発生時の各回路における入出力信号の状態を
示したタイムチャートである。
【0036】図2の対クロスバインターフェース部に対
してデータの転送が開始され、入力信号aのヘッダ部に
より、ブロックに含まれるデータの数が20であること
が検出されると、減算器7はデータの到着毎に残りデー
タの数をカウントし、信号cとして出力する。
【0037】図6の例では、シーケンシャル番号6のデ
ータが受け取られた後、シーケンシャル番号7のデータ
が到着するまで1クロックの空白(データ途絶期間)が
発生する。図2のタイマー6は、シーケンシャル番号6
のデータを受信した後、空白が存在するところでカウン
タの値“1”を出力している(出力信号b)。しかしな
がら、システムのデータ転送条件では、空白は1クロッ
クまで許されているため、コントローラ8は出力をダミ
ーデータに切り替えてはいない(信号f及び信号g)。
【0038】コントローラ8はデータの転送が始まる
と、ダミーデータ発生機構9に、データと同期するよう
にダミーデータの発生を指示している(信号d及び信号
e)。ここで、シーケンシャル番号6のデータの後の1
クロックの空白が発生しているところでは、コントロー
ラ8はダミーデータ発生機構に空白が発生したことを伝
達し(信号d)、ダミーデータ発生機構8は空白に対応
するダミーデータの発生を抑止している(信号e)。
【0039】一方、シーケンシャル番号12のデータが
受け取られた後、システムに障害が発生し、シーケンシ
ャル番号12のデータが受け取られてから2クロック
(以上)の空白(データ途絶期間)が発生する。図2の
タイマー6は、シーケンシャル番号12のデータを受信
した後、空白が存在するところでカウンタの値“1”,
“2”を出力している(出力信号b)。
【0040】これにより、コントローラ8はダミーデー
タ発生機構9に、データと同期するようにダミーデータ
の発生を指示し(信号b及び信号e)、信号fをセレタ
タ11に出力して、セレタタ11の出力をダミーデータ
に切り替える(信号g)。
【0041】以上、クラスタとクロスバスイッチの間に
て、送信側装置に付随するインターフェース機構の障
害、若しくはインターフェース間を接続する線路等の障
害により、受信側装置に付随するインターフェース機構
においてデータブロックの伝送中断が発生した場合に、
受信側装置に付随するインターフェース機構(図2の対
クロスバインターフェース部)においてデータ補完を行
う場合について説明したが、次に、送信側装置の障害に
より送信側装置に接続されたインターフェース部にてデ
ータの途絶が起こった場合において、送信側装置に付随
するインターフェース機構の送信側回路(図8の対クラ
スタインターフェース部)にてデータの補完を行う場合
について説明を行う。
【0042】図7は本発明の通信障害処理装置における
クラスタの他の構成例を示したブロック図である。図8
は本発明の通信障害処理装置におけるクロスバスイッチ
の他の構成例を示したブロック図である。
【0043】本例では、クラスタAからクラスタCへデ
ータ転送が行われる場合を考え、図8に示すクロスバ機
構14に障害が起こった場合について説明を行う。送信
側装置に付随するインターフェース機構としては、クロ
スバスイッチ5に付随したクラスタCに対応するインタ
ーフェース機構を考える。
【0044】また、クロスバスイッチ5に付随したクラ
スタCに対応するインターフェース機構に供給されるデ
ータのフォーマットが、図4で示したものと同一であ
り、送信側インターフェースへのデータの供給もデータ
ブロックのデータ間の空白が2クロック以上空かないも
のであるとすれば、クロスバスイッチ5に付随したクラ
スタCに対応するインターフェース機構(以降、送信側
装置に付随するインターフェース機構の送信側回路とい
う)が有する障害処理のためのダミーデータの補完機構
は、図2の受信側装置に付随するインターフェース機構
における受信側回路が有する障害処理のための機構と同
一の構成をとり得る。
【0045】データブロックの送信がクラスタAにより
行われ、送信データが、クロスバ機構に入力され、送信
側装置に付随するインターフェース機構の送信側回路に
入力が開始された後、図8におけるのクロスバ機構14
の障害により、送信側装置に付随するインターフェース
機構の送信側回路へのデータが途絶した場合、図2の受
信側装置に付随するインターフェース機構の動作と同様
に、送信側装置に付随するインターフェース機構の送信
側回路は、データをダミーデータとして補完して、クラ
スタCへ向けて送出する。
【0046】この場合、クラスタCのインターフェース
機構(図示しない受信側装置に付随するインターフェー
ス機構)では、データが最大1クロックの空白しか持た
ず、予定のデータ数を、データブロックとして受信する
ため、クロスバスイッチにおいて障害が起こったことを
認識する必要はなく、障害処理のための特別な動作なし
に、チェックが起こることもなく、データ受信動作を完
了することが可能である。
【0047】一方、送信側装置に付随するインターフェ
ース機構の送信側回路では、図2の受信側装置に付随す
るインターフェース機構と同様に、ダミーデータに対し
て障害によるダミーデータであることを示すフラグをダ
ミーデータに添付して送出するため、受信側装置がダミ
ーデータを用いることによりデータ破壊を起こすことは
ない。
【0048】これにより、障害が発生した図8における
クロスバ機構14以外では、チェック信号の発信は抑制
され、クロスバ機構以外の装置は通常動作を継続してお
り、保守においてクロスバ機構の修理によりシステムの
復旧が可能となり、また障害によるデータ破壊などが発
生することもない。
【0049】尚、上記説明においては、1つのインター
フェース機構を有する4つのクラスタと、4つのインタ
ーフェース機構を有する1つのクロスバスイッチにより
構成される通信障害処理装置について説明を行ったが、
クラスタの数及びクロスバスイッチの数が変わっても、
本発明が適用可能であることは勿論である。
【0050】また、上記説明では、受信側装置に接続さ
れたインターフェース機構の本発明に関する障害処理機
構と、送信側装置に接続されたインターフェース機構の
本発明に関する障害処理機構の構成は同一であるとした
が、システムのインターフェースの方式によって、送信
側インターフェース機構と受信側インターフェース機構
に異なる障害処理機構を採用することも可能である。
【0051】
【発明の効果】以上述べたように、上記本発明によれ
ば、他装置の障害で転送データの中断が発生した場合で
も、障害を起こした装置の後続のインターフェースが通
常の動作に整合する動作を行うことにより、障害が起こ
ったことを特に意識すること無く他の装置が動作できる
ようにしたので、非障害装置におけるチェック信号の点
灯の防止が行われ、障害伝播の防止ができる。
【0052】また、障害が起こった際のデータは、障害
フラグの存在により簡単にダミーデータとして識別可能
であり、ダミーデータを受信した装置によりデータ破壊
が行われることはない。
【0053】さらに、上記の効果のうち、障害の伝播が
起こらないということから、データの途絶によるタイム
アウトなどの伝播がシステム内で発生しないため、チェ
ック信号が発信されるのは障害が起こった装置にのみに
限定され、保守はチェック信号の点灯している装置にの
み行えばよく、容易に障害個所の特定を行うことが可能
であり、保守性の向上が図れる。
【0054】また、障害を起こした装置以外が障害伝播
によるチェックストップに陥らないため、障害箇所の復
旧をすれば直ちにシステムの運用を障害発生以前の状態
に戻すことができる。
【図面の簡単な説明】
【図1】本発明の通信障害処理装置のシステムの一構成
例を示した概略図である。
【図2】本発明の通信障害処理装置におけるクラスタの
一構成例を示したブロック図である。
【図3】本発明の通信障害処理装置におけるクロスバス
イッチの一構成例を示したブロック図である。
【図4】本発明の通信障害処理装置におけるクラスタ間
通信で使用されるデータブロックのフォーマットの一例
を示した図である。
【図5】障害発生時における動作が行われた場合におい
て、クラスタの演算装置部が受け取る最終的なデータブ
ロックの内容を示した図である。
【図6】障害発生時の各回路の入出力信号の状態を示し
たタイムチャートである。
【図7】本発明の通信障害処理装置におけるクラスタの
他の構成例を示したブロック図である。
【図8】本発明の通信障害処理装置におけるクロスバス
イッチの他の構成例を示したブロック図である。
【符号の説明】
1,2,3,4 システムを構成するクラスタ 5 クロスバスイッチ 6 タイマー 7 減算器 8 コントローラ 9 ダミーデータ発生機構 10 レジスタ 11 セレクタ 12 ローカルメモリ 13 演算処理装置 14 クロスバ機構
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04L 29/14 H04M 3/22 Z H04M 3/22 H04L 13/00 311

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】1以上の演算処理装置と対クロスバスイッ
    チインターフェース機構を有する独立したコンピュータ
    システムをクラスタとし、各クラスタを対クラスタイン
    ターフェース機構を有するクロスバによって接続した、
    マルチクラスタ型コンピュータシステムで、クラスタ間
    の通信がデータブロック転送により行われるコンピュー
    タシステムにおける通信障害処理装置において、 クラスタとクロスバスイッチの間で送信側装置に付随す
    るインターフェース機構の障害、若しくはインターフェ
    ース間を接続する線路の障害により、受信側装置に付随
    するインターフェース機構においてデータブロックの伝
    送中断が発生した場合、前記受信側装置に付随するイン
    ターフェース機構が未受信のデータを補完して補完デー
    タを生成する手段を備えることにより、前記障害によっ
    て前記受信側装置に付随するインターフェース機構の停
    止を防止することを特徴とする通信障害処理装置。
  2. 【請求項2】前記補完データは、ダミーデータであるこ
    とを特徴とする請求項1に記載の通信障害処理装置。
  3. 【請求項3】前記受信側装置に付随するインターフェー
    ス機構は、前記補完データがダミーデータであることを
    示すフラグを前記補完データに付加する手段を備えたこ
    とを特徴とする請求項2に記載の通信障害処理装置。
  4. 【請求項4】前記受信側装置は、ダミーデータを含む受
    信データに対して所定の処理を行う手段を備えたことを
    特徴とする請求項2または3に記載の通信障害処理装
    置。
  5. 【請求項5】前記受信側装置に付随するインターフェー
    ス機構は、 データブロックのデータ途絶期間を監視するタイマー
    と、 データブロックに含まれるデータの数を初期値からカウ
    ントダウンするための減算器と、 前記タイマーの値を監視してデータの中断が発生したこ
    とを検出すると検出信号を出力すると共に、前記減算器
    の出力を監視して制御信号を出力するコントローラと、 前記コントローラから出力される制御信号に基づいてダ
    ミーデータの発生を制御するダミーデータ発生機構と、 前記コントローラから出力される検出信号に基づいて、
    インターフェース機構外部からのデータと前記ダミーデ
    ータ発生機構にて発生したダミーデータとの選択を行
    い、前記受信側装置に対して送出するセレタタと、 を備えたことを特徴とする請求項1,2,3,または4
    に記載の通信障害処理装置。
  6. 【請求項6】前記受信側装置に付随するインターフェー
    ス機構は、受信側クラスタにおける対クロスバインター
    フェース部であることを特徴とする請求項1〜5のいず
    れかに記載の通信障害処理装置。
  7. 【請求項7】1以上の演算処理装置と対クロスバスイッ
    チインターフェース機構を有する独立したコンピュータ
    システムをクラスタとし、各クラスタを対クラスタイン
    ターフェース機構を有するクロスバによって接続した、
    マルチクラスタ型コンピュータシステムで、クラスタ間
    の通信がデータブロック転送により行われるコンピュー
    タシステムにおける通信障害処理装置において、 送信側装置の障害により、送信側装置に付随するインタ
    ーフェース機構へのデータブロックの供給が途絶した場
    合、送信側装置に付随するインターフェース機構が、送
    信するデータブロックの内の前記途絶した不足分のデー
    タを補完し、補完データとして送信する手段を備えるこ
    とにより、受信側装置もしくは受信側装置に付随するイ
    ンターフェース機構にて正常にデータの処理を行うこと
    を可能とし、且つ送信側装置に付随するインターフェー
    ス機構は上記障害により停止しないことを特徴とする通
    信障害処理装置。
  8. 【請求項8】前記補完データは、ダミーデータであるこ
    とを特徴とする請求項7に記載の通信障害処理装置。
  9. 【請求項9】前記送信側装置に付随するインターフェー
    ス機構は、前記補完データがダミーデータであることを
    示すフラグを前記補完データに付加する手段を備えたこ
    とを特徴とする請求項8に記載の通信障害処理装置。
  10. 【請求項10】前記受信側装置は、前記送信側装置より
    受信したダミーデータを含む受信データに対して所定の
    処理を行う手段を備えたことを特徴とする請求項8また
    は9に記載の通信障害処理装置。
  11. 【請求項11】前記送信側装置に付随するインターフェ
    ース機構は、 データブロックのデータ途絶期間を監視するタイマー
    と、 データブロックに含まれるデータの数を初期値からカウ
    ントダウンするための減算器と、 前記タイマーの値を監視してデータの中断が発生したこ
    とを検出すると検出信号を出力すると共に、前記減算器
    の出力を監視して制御信号を出力するコントローラと、 前記コントローラから出力される制御信号に基づいてダ
    ミーデータの発生を制御するダミーデータ発生機構と、 前記コントローラから出力される検出信号に基づいて、
    インターフェース機構外部からのデータと前記ダミーデ
    ータ発生機構にて発生したダミーデータとの選択を行
    い、前記受信側装置に対して送出するセレタタと、 を備えたことを特徴とする請求項7〜10のいずれかに
    記載の通信障害処理装置。
  12. 【請求項12】前記送信側装置に付随するインターフェ
    ース機構は、クロスバにおける送信側の対クラスタイン
    ターフェース部であることを特徴とする請求項7〜11
    のいずれかに記載の通信障害処理装置。
  13. 【請求項13】1以上の演算処理装置と対クロスバスイ
    ッチインターフェース機構を有する独立したコンピュー
    タシステムをクラスタとし、各クラスタを対クラスタイ
    ンターフェース機構を有するクロスバによって接続し
    た、マルチクラスタ型コンピュータシステムで、クラス
    タ間の通信がデータブロック転送により行われるコンピ
    ュータシステムにおける通信障害処理装置において、 クラスタとクロスバスイッチの間で送信側装置に付随す
    るインターフェース機構の障害、若しくはインターフェ
    ース間を接続する線路の障害により、受信側装置に付随
    するインターフェース機構においてデータブロックの伝
    送中断が発生した場合、前記受信側装置に付随するイン
    ターフェース機構が未受信のデータをダミーデータにて
    補完して送信することで、前記障害によって前記受信側
    装置に付随するインターフェース機構の停止を防止する
    ことを特徴とする通信障害処理方法。
  14. 【請求項14】前記受信側装置に付随するインターフェ
    ース機構は、前記補完データがダミーデータであること
    を示すフラグを前記補完データに付加して出力すること
    を特徴とする請求項13に記載の通信障害処理方法。
  15. 【請求項15】1以上の演算処理装置と対クロスバスイ
    ッチインターフェース機構を有する独立したコンピュー
    タシステムをクラスタとし、各クラスタを対クラスタイ
    ンターフェース機構を有するクロスバによって接続し
    た、マルチクラスタ型コンピュータシステムで、クラス
    タ間の通信がデータブロック転送により行われるコンピ
    ュータシステムにおける通信障害処理装置において、 送信側装置の障害により、送信側装置に付随するインタ
    ーフェース機構へのデータブロックの供給が途絶した場
    合、送信側装置に付随するインターフェース機構が、送
    信するデータブロックの内の前記途絶した不足分のデー
    タをダミーデータにて補完して送信することにより、受
    信側装置もしくは受信側装置に付随するインターフェー
    ス機構にて正常にデータの処理を行うことを可能とし、
    且つ送信側装置に付随するインターフェース機構は上記
    障害により停止しないことを特徴とする通信障害処理方
    法。
  16. 【請求項16】前記送信側装置に付随するインターフェ
    ース機構は、前記補完データがダミーデータであること
    を示すフラグを前記補完データに付加して送信すること
    を特徴とする請求項15に記載の通信障害処理方法。
JP9333930A 1997-12-04 1997-12-04 通信障害処理装置及び方法 Pending JPH11168502A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9333930A JPH11168502A (ja) 1997-12-04 1997-12-04 通信障害処理装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9333930A JPH11168502A (ja) 1997-12-04 1997-12-04 通信障害処理装置及び方法

Publications (1)

Publication Number Publication Date
JPH11168502A true JPH11168502A (ja) 1999-06-22

Family

ID=18271570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9333930A Pending JPH11168502A (ja) 1997-12-04 1997-12-04 通信障害処理装置及び方法

Country Status (1)

Country Link
JP (1) JPH11168502A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006173A (ja) * 2001-04-18 2003-01-10 Matsushita Electric Works Ltd 情報処理装置
WO2007096987A1 (ja) * 2006-02-24 2007-08-30 Fujitsu Limited エラー制御装置
KR100762133B1 (ko) * 2001-02-13 2007-10-02 엘지전자 주식회사 데이터 트래픽 중계 방법
EP2610748A1 (en) 2011-12-28 2013-07-03 Fujitsu Limited Information processing apparatus, control program, and control method

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100762133B1 (ko) * 2001-02-13 2007-10-02 엘지전자 주식회사 데이터 트래픽 중계 방법
JP2003006173A (ja) * 2001-04-18 2003-01-10 Matsushita Electric Works Ltd 情報処理装置
WO2007096987A1 (ja) * 2006-02-24 2007-08-30 Fujitsu Limited エラー制御装置
JPWO2007096987A1 (ja) * 2006-02-24 2009-07-09 富士通株式会社 エラー制御装置
KR100995621B1 (ko) 2006-02-24 2010-11-22 후지쯔 가부시끼가이샤 에러 제어 장치
US8264948B2 (en) 2006-02-24 2012-09-11 Fujitsu Limited Interconnection device
EP2610748A1 (en) 2011-12-28 2013-07-03 Fujitsu Limited Information processing apparatus, control program, and control method
US9065706B2 (en) 2011-12-28 2015-06-23 Fujitsu Limited Information processing apparatus, computer-readable recording medium, and control method

Similar Documents

Publication Publication Date Title
CN111585835B (zh) 一种带外管理系统的控制方法、装置和存储介质
JPH0778039A (ja) クロック選択制御方式
JPH11168502A (ja) 通信障害処理装置及び方法
EP0507299B1 (en) Loosely coupled multiplexing control apparatus
KR100212183B1 (ko) 제7모듈 공통선 신호방식에서 메세지전달부 레벨2처리회로팩의 이중화장치 및 그 구현방법
KR0152229B1 (ko) 시스팀의 이중화를 위한 저가형 이중화 노드
JP3261014B2 (ja) データ処理システムにおけるモジュール交換方法および自己診断方法
JP2000020336A (ja) 二重化通信システム
KR20000059718A (ko) 피엘씨 이중화 시스템의 논스톱 운전방법 및 회로
JPH08185329A (ja) データ処理装置
JP2606107B2 (ja) プロセッサ冗長化方式
JP2606144B2 (ja) 二重化装置
JPH1196033A (ja) 情報処理装置
KR100291033B1 (ko) 네트웍 시스템의 클락 이중화 관리 장치 및방법
KR100294407B1 (ko) 전원차단 감지 장치
KR100418472B1 (ko) 교환 시스템의 멀티 씨 피 유 장애 복구장치 및 방법
JP2001175545A (ja) サーバシステムおよび障害診断方法ならびに記録媒体
KR970002883B1 (ko) 다중 프로세서에서의 공통 버스 점유권 요구 방법
KR100825458B1 (ko) 기지국 제어장치 망동기 보드 이중화를 위한 이중화 보드장치
JPH0697989A (ja) 二重系処理装置のプロセス系用回線への切替方法及び装置
JP2508606B2 (ja) 二重化装置
JP2000349900A (ja) 交換装置の障害処理方式
JPH1049450A (ja) 遠隔監視システムの異常時の復旧方式
JPH0250737A (ja) 二重化システム
WO2008050456A1 (fr) Système informatique, dispositif de relais de données, et procédé de commande de système informatique