JPH05347626A - 分散処理システムにおける処理方法 - Google Patents

分散処理システムにおける処理方法

Info

Publication number
JPH05347626A
JPH05347626A JP4106365A JP10636592A JPH05347626A JP H05347626 A JPH05347626 A JP H05347626A JP 4106365 A JP4106365 A JP 4106365A JP 10636592 A JP10636592 A JP 10636592A JP H05347626 A JPH05347626 A JP H05347626A
Authority
JP
Japan
Prior art keywords
address
subsystem
subsystems
transmission
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4106365A
Other languages
English (en)
Other versions
JPH0722290B2 (ja
Inventor
Kinji Mori
欣司 森
Shoji Miyamoto
捷二 宮本
Koichi Ihara
廣一 井原
Hiroshi Matsumaru
宏 松丸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP4106365A priority Critical patent/JPH0722290B2/ja
Publication of JPH05347626A publication Critical patent/JPH05347626A/ja
Publication of JPH0722290B2 publication Critical patent/JPH0722290B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Small-Scale Networks (AREA)

Abstract

(57)【要約】 【構成】 伝送路上のサブシステム100,110…の
いずれかよりアドレストレイン信号106を送信する。
アドレストレイン信号106を受信したサブシステム
は、アドレストレイン信号に自己のアドレスを付加して
伝送路上に送信し、これを受信したサブシステムの少な
くとも1つにおいて、アドレストレインを基にシステム
構成の認識を行なう。 【効果】 システム内のいずれのサブシステムにおいて
もシステム構成を認識することができ、アドレス設定の
正常性を容易に確認することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、情報処理システムに関
し、特に、伝送媒体を介して複数のサブシステムが接続
された分散処理システムにおける処理方法に関する。
【0002】
【従来の技術】分散処理システムにおいては、共通の伝
送路に接続された複数の処理装置が、伝送路を介して相
互にデータの伝送を行ない、各処理装置では伝送路を介
して送られるデータを受信して処理を行なっている。こ
のような分散処理システムにおいて、データの伝送を正
常に行なうには、伝送路上の各処理装置のアドレスが重
複することなく設定されている必要がある。伝送路上に
接続された機器のアドレス設定の正常性を検査する方法
として、従来、特開昭56−91557号公報に記載さ
れるものがある。この方法は、ループ伝送路上のループ
制御装置から診断コマンドを発信し、この診断コマンド
を受信した伝送路上のノードは、受信した診断コマンド
を伝送路に送出すると共に、診断コマンドの終了フラグ
に続けて自己のアドレスを伝送路上に送出する。そし
て、ループ制御装置は、伝送路上を1巡して戻ってきた
診断コマンドを検査して各ノードのアドレス設定の正常
性を確認するものである。
【0003】
【発明が解決しようとする課題】しかし、上記従来技術
では、伝送路上の各ノードがシステム構成を認識し、ア
ドレス設定の正常性を確認することについては全く考慮
されていなかった。
【0004】さらに、上記従来技術においては、伝送路
上のデータの伝送制御、およびシステム内の故障対策
は、伝送路上に唯一設けられたループ制御装置が行なっ
ている。このため、ループ制御装置が故障した場合に
は、システム内のアドレス設定の正常性を確認すること
はもちろん、伝送路を介したデータ伝送そのものが全く
不可能になり、システム全体がダウンしてしまうという
問題を有していた。
【0005】本発明の目的とするところは、上記問題点
を解決し、分散処理システム内の全てのサブシステムに
おいて、アドレス設定の正常性を確認することができる
ようにするとともに、いかなるサブシステムの故障によ
ってもシステムダウンに至ることのない分散処理システ
ムにおける処理方法を提供することにある。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、本発明の処理方法は、伝送媒体を介して接続され
た、複数のサブシステムを有する分散処理システムにお
いて、サブシステムの少なくとも1つから、アドレスト
レイン信号を送信し、各サブシステムでは、アドレスト
レイン信号を受信したとき、自己のアドレスに関連する
情報を次々に付加して伝送媒体に送信し、サブシステム
の少なくとも1つでは、アドレストレイン信号を受信し
て、システム構成を認識するようにしたものである。
【0007】また、好ましくは、前記伝送媒体が共通伝
送路からなり、共通伝送路を2巡して戻ってきたときの
情報を基にアドレス重複を検出するものである。
【0008】さらに、好ましくは、アドレス重複を検出
したときには、そのサブシステムは伝送媒体へのデータ
の伝送を中止するものである。
【0009】
【作用】本発明によれば、伝送媒体を介して伝送される
アドレストレイン信号を受信し、それに含まれるアドレ
ス情報に基づいてシステム構成の認識を行なうので、伝
送媒体上のいずれのサブシステムにおいてもシステム構
成を認識することができ、アドレス設定の正常性の確認
を行なうことができる。
【0010】また、伝送媒体上を2巡して戻ってきたア
ドレストレイン信号を用いることにより、より的確なア
ドレス設定の確認を行なうことができる。
【0011】さらに、アドレス重複を検出したサブシス
テムが、伝送媒体へのデータの送出を中止することによ
り、アドレス設定の誤りによるシステムダウンをなくす
ことができる。
【0012】
【実施例】図1に、従来の分散処理システムにおける故
障の検知および診断とその結果に基づく回復処理の態様
を、後に詳述する本発明における回復処理の態様と対比
して位置付けして示した。図1における縦軸は、故障の
検知および診断の対象を、横軸は前記検知および診断の
結果に基づいて行う回復処理の対象を示すものである。
【0013】図1に示した態様のうち、自サブシステム
内にある故障を、自ら検知しその結果に基づいて、自サ
ブシステムまたは他サブシステムの故障の回復処理を行
う装置は、自己診断型テスタと呼ばれる。この自己診断
型テスタでは、各サブシステムは「他サブシステムがす
べて故障の検知、診断とその結果に基づく回復処理を完
全に行っている。」という前提に立ってシステムが構成
される。従って、各サブシステムが故障の検知,診断ま
たは回復処理に失敗したり、誤ったりした場合には、他
サブシステムがその影響を受けてシステムダウンを生ず
ることになるという問題がある。また他サブシステムの
故障を検知,診断し、その結果、該他サブシステムに対
して回復処理を行わせる装置は、集中型テスタと呼ばれ
る。この集中型テスタの故障検知,診断または回復処理
の失敗や誤りも、直接他サブシステムに影響を与えるも
のであり、システムダウンを生ずることになるという問
題がある。
【0014】これに対して、本発明においては、他サブ
システムの故障を検知,診断して、その結果に基づいて
自サブシステムを該他サブシステムの故障から防護する
如き回復処理を行う、自律型テスタを用いるものであ
る。上記3種のテスタの機能を図2及び図3に示す。
【0015】自己診断型テスタには図2(A),(B)
に示す2種があり、サブシステム1のテスタは、自サブ
システムの故障の検知,診断処理(11または12)の
結果に基づいて、自サブシステム1の回復処理21また
は他サブシステム2,3に対する回復処理(22または
22′)を指示するものである。この処理が正常になさ
れないと(図3(A),(B)に×印として示す)、他
サブシステム2,3に影響(31,32または32′)
してその故障を惹起こす。
【0016】また、図2(D)に示すような集中型テス
タでは、サブシステム1のテスタが、他サブシステム
2,3の故障の検知,診断14,14′を行い、その結
果に基づいて回復処理24,24′をサブシステム2,
3に指示するものである。従って、サブシステム1の故
障は、他サブシステム2,3へ直接波及(34,3
4′)する。
【0017】これに対して、図2(C)に示すような自
律型テスタでは、サブシステム1のテスタは、他サブシ
ステム2,3の故障の検知,診断13,13′を行い、
その結果に基づいて自サブシステムが、他サブシステム
の故障波及を放護する回復処理23を行うものである。
従って、サブシステム1の故障検知、診断または回復処
理の失敗、誤りが他サブシステム2,3に影響すること
はない。
【0018】以下、本発明をループ伝送系に適用した実
施例につき図面に基づいて詳細な説明を行う。
【0019】図4は本発明の一実施例を示す分散処理シ
ステムの全体構成図である。本システムは、互いに逆向
きの伝送方向を有する2重のループ伝送路と、ループ伝
送路上に設けられた対をなす伝送制御装置から成る。対
をなす伝送制御装置100と110,200と210,
・・・はそれぞれ互いに迂回路100A,110A;2
00A,210A;・・・で接続されている。また、破
線で示されているのはサブシステムの範囲であり、例え
ばサブシステム1は、伝送制御装置100,ループ伝送
路1200および迂回路100Aから、サブシステム2
は伝送制御装置200、ループ伝送路2300および迂
回路200Aから構成される。また、サブシステム1は
サブシステム2、同4,同5とのみ接続されている。
【0020】図5はサブシステム1の詳細を示すもの
で、対となる伝送制御装置100,110には対ホスト
伝送路111,211を介して処理装置(ホスト)10
00が接続されている。また、伝送制御装置100,1
10および処理装置1000にはテスタ(BIT)10
0B,110Bおよび1000Bが内蔵されている。該
BITは、伝送制御装置の機能のうちの、他サブシステ
ムの故障の検知,診断および回復処理を行うものであ
る。また、システムの故障個所を認別するテスタ(EX
T)1010を処理装置1000内に設ける。該EXT
1010は、後に詳述する如く、故障個所を表示装置1
020に出力し、保守員に知らせる。なお、図示は省略
したが、他のサブシステム2,3・・・も、上記サブシ
ステム1と全く同様に構成されている。
【0021】以下、前記テスタBIT100B,110
B,1000BおよびEXT1010の動作につき、図
6〜図15を用いて詳細に説明する。なお、以下の説明
においては、伝送制御装置(以下、「NCP」とい
う。)400,410がダウンしているものとする。
【0022】今、図6に示すようにNCP200が伝送
路(「ループ」ともいう。)2300上にメッセージ2
01を送出したとする。該メッセージが一定時間T1
経過しても発信元NCP200に戻って来ない場合、N
CP200は確認のため、同一メッセージを再送する。
再送が一定回数N1以上に達した場合、BIT200B
は伝送路上に故障が発生したと判断する。次いで、BI
T200Bは、隣接サブシステムのNCP300にメッ
セージを伝送できるか否かをチェックするため、小ルー
プチェック信号202を送出する。NCP300のBI
T300Bは、該小ループチェック信号202を伝送路
2300から受信すると、伝送路上のどこかに故障が発
生していると判断し、前記小ループチェック信号202
を対NCP310へ送信すると同時に、自らも小ループ
チェック信号302を伝送路3400上に送出する。
【0023】迂回路300A方向から小ループチェック
信号202を受取ったNCP310は、それをループ3
200上に送出する。ループ3200から前記小ループ
チェック信号202を受信したNCP210のBIT2
10Bは、前述のBIT300Bと同様の処理を行う。
上述の如くして、小ループチェック信号202が発信元
NCP200に戻って来ると、BIT200Bは隣接N
CP300へメッセージを送出できると判断し、以後、
メッセージをループ2300上に送出する。
【0024】一方、BIT200Bは内側ループ上に故
障が発生しているかも知れない旨を、NCP210のB
IT210Bに報知する。これにより、BIT210B
は、前述のBIT200Bと同様に、小ループチェック
信号212を、ループ2100上に送出する。小ループ
チェック信号を受信した各NCPのBITは、上述の操
作と同様にして、順次小ループチェックを行っていく。
この例においては、NCP400,410がダウンして
いると仮定したので、BIT300Bおよび110Bは
小ループチェック信号が戻って来ないことになる。この
様子を図7に示す。
【0025】これにより、BIT300Bは迂回路30
0Aを、BIT110Bは迂回路110Aを構成し、以
後、受信したメッセージをそれぞれ、ループ3400,
1400に送出することなく、前記迂回路300A,1
10Aにのみ送出する。
【0026】迂回路を構成したBIT300B,110
Bは、それぞれ迂回路構成報知信号303,113を送
出する。EXT1010に接続されたNCP100また
は110は、該迂回路構成報知信号303,113を受
信すると、処理装置1000に送信する。この様子を図
8に示す。
【0027】処理装置1000のEXT1010は、前
記迂回路構成報知信号113からは、故障部分を11
3′(図9の右下り斜線の部分)と、また、前記迂回路
構成報知信号303からは、故障部分を303′(図9
の右上り斜線の部分)と診断する。EXT1010は、
上記2つの診断結果を総合し、故障部分は113′と3
03′のどこかにあるとして表示装置1020上に表示
する。
【0028】迂回路を構成したBIT300B,110
Bは、故障が回復したか否かをチェックするため、小ル
ープチェック信号302,112および大ループチェッ
ク信号304,114を交互に周期的に送出する。大ル
ープチェック信号は、どのNCPでも迂回させないの
で、前記大ループチェック信号304がループを一巡し
て発信元に戻って来れば、BIT300Bは、ループ上
の故障が回復したと判断して、自らの迂回路300Aを
解除する。なお、BIT300B,110Bが送出した
小ループチェック信号が戻って来た場合にも、それを送
出したBITは自らの迂回路を解除する。この様子を図
10に示す。
【0029】次に、図11に示すように、迂回路を解除
したBIT300Bは、迂回解除報知信号305を送出
する。EXT1010に接続されたNCP100は、上
記迂回解除報知信号305を受信すると、これをEXT
1010に伝送する。
【0030】EXT1010は、前述の診断結果11
3′および303′に対し、迂回解除報知信号305に
基づいてBIT300Bから迂回報知信号303を解消
し、かつ、ループ4100上の故障診断結果をも解消し
て、故障個所診断結果を図12に右下がり斜線で示す1
13″の範囲に縮小する。
【0031】なお、伝送が正常に行われるためには、各
NCPのアドレスが重複することなく設定されているこ
とが不可欠である。そこで、各BITは、電源立上げ
時、他NCPが自アドレスと同一アドレスを設定してい
ないかどうかのチェックを行う。このチェックの様子を
図13により説明する。
【0032】今、NCP100が起動されたとき、既に
NCP200,300,310,210および110が
起動されているものとすると、起動されたNCP100
のBIT100Bは後に詳述する如きアドレストレイン
106を送出する。該アドレストレイン106は、各N
CPで逐次受信され、それぞれのアドレスを記入した後
送出される。このアドレストレイン106は、伝送路上
を2周した後、発信元のBIT100によりEXT10
10に転送される。アドレストレイン106が、各NC
Pを通過するごとに構成されて行くプロセスを図15に
示した。各BITはアドレス106Aを記入するととも
に、迂回路構成中であれば迂回フラグ106Bを“1”
とする。
【0033】BIT100Bは、上記伝送路上を2周し
たアドレストレイン1068を受信し、自アドレス10
0間における他サブシステムのアドレスが、1周目と2
周目とで同じでないものについては、重複アドレスがあ
るとして、以後、伝送を行わない。また、EXT101
0に接続されたNCP100は、前記アドレストレイン
106を取込み、EXT1010に報知する。EXT1
010は、該アドレストレイン106内の迂回フラグと
アドレスをチェックすることにより、システムの構成は
図14に斜線部で示す106′であると判断し、表示装
置1020に出力する。
【0034】各処理装置内のBITは、NCP100
(または同110)への伝送が不可の場合、対NCP1
10(または同100)へ伝送方向を切換える機能を有
するものである。
【0035】上記実施例においては、本発明をループ伝
送系に適用した例を示したが、本発明はこれに限らず他
の分散処理システム−例ばえライン状、メッシュ状等の
分散処理システムにも同様に適用可能であることは言う
までもない。
【0036】また、上記実施例に示した動作の詳細につ
いては、本出願人が先に提案した「ループ伝送システ
ム」(特願昭55−93924号),「伝送制御装置」
(実願昭56−87835号)等の記載を参考にするこ
とができることを付言しておく。
【0037】
【発明の効果】以上述べた如く、本発明によれば、それ
ぞれが互いに対等の関係にある複数個のサブシステムを
接続して成る分散処理システムにおいて、前記各サブシ
ステムがそれぞれシステム構成および他サブシステムの
故障の診断を行う機能を有するとともに、前記他サブシ
ステムの故障の診断結果に基づいて、自サブシステムの
防護処理を行う如く構成したので、分散処理システムに
おけるシステムダウンを防止し高信頼性を有する分散処
理システムを実現できるという顕著な効果を有するもの
である。
【図面の簡単な説明】
【図1】各種テスタの機能分類を示す図である。
【図2】各種テスタの機能を模式的に示す図である。
【図3】各種テスタの機能を模式的に示す図である。
【図4】本発明の一実施例の概略構成を示す図である。
【図5】本発明の一実施例の概略構成を示す図である。
【図6】実施例の動作を説明するための図である。
【図7】実施例の動作を説明するための図である。
【図8】実施例の動作を説明するための図である。
【図9】実施例の動作を説明するための図である。
【図10】実施例の動作を説明するための図である。
【図11】実施例の動作を説明するための図である。
【図12】実施例の動作を説明するための図である。
【図13】実施例の動作を説明するための図である。
【図14】実施例の動作を説明するための図である。
【図15】アドレストレインを示す図である。
【符号の説明】
1,2,3,4,5:サブシステム、 100,110;200,210;…:NCP、 100B,110B;200B,210B;…:BI
T、 1000:処理装置、1010:EXT、1020:表
示装置。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/16 470 H 9190−5L (72)発明者 松丸 宏 神奈川県川崎市多摩区王禅寺1099番地 株 式会社日立製作所システム開発研究所内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】伝送媒体を介して接続された、複数のサブ
    システムを有する分散処理システムにおいて、前記複数
    のサブシステムのいずれかより、システム構成を認識す
    るためのアドレストレイン信号を送信し、各サブシステ
    ムでは、該アドレストレイン信号を受信したとき、自己
    のアドレスに関連する情報を次々に付加して前記伝送媒
    体に送信し、前記アドレストレイン信号を受信した前記
    サブシステムの少なくとも1つでは、前記情報に基づい
    てシステム構成を認識するようにしたことを特徴とする
    分散処理システムにおける処理方法。
  2. 【請求項2】前記伝送媒体は共通伝送路からなり、前記
    サブシステムの少なくとも1つにおいて、前記アドレス
    トレイン信号が前記共通伝送路を2巡して戻ってきたと
    きの前記アドレスに関連する情報を基にシステムにおけ
    るアドレス重複を検出することを特徴とする請求項1記
    載の分散処理システムにおける処理方法。
  3. 【請求項3】前記アドレス重複の検出は、前記情報中に
    含まれる自サブシステムのアドレスを基準としたアドレ
    ス列に基づいて行なわれることを特徴とする請求項2記
    載の分散処理システムにおける処理方法。
  4. 【請求項4】前記アドレス重複を検出したとき、前記伝
    送媒体へのデータの伝送を中止することを特徴とする請
    求項2記載の分散処理システムにおける処理方法。
JP4106365A 1992-04-24 1992-04-24 分散処理システムにおける処理方法 Expired - Lifetime JPH0722290B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4106365A JPH0722290B2 (ja) 1992-04-24 1992-04-24 分散処理システムにおける処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4106365A JPH0722290B2 (ja) 1992-04-24 1992-04-24 分散処理システムにおける処理方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP57122702A Division JPS5913446A (ja) 1982-07-14 1982-07-14 分散処理システム

Publications (2)

Publication Number Publication Date
JPH05347626A true JPH05347626A (ja) 1993-12-27
JPH0722290B2 JPH0722290B2 (ja) 1995-03-08

Family

ID=14431708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4106365A Expired - Lifetime JPH0722290B2 (ja) 1992-04-24 1992-04-24 分散処理システムにおける処理方法

Country Status (1)

Country Link
JP (1) JPH0722290B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6665717B1 (en) 1998-09-02 2003-12-16 Hitachi, Ltd. Distributed processing system and cooperating method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6665717B1 (en) 1998-09-02 2003-12-16 Hitachi, Ltd. Distributed processing system and cooperating method

Also Published As

Publication number Publication date
JPH0722290B2 (ja) 1995-03-08

Similar Documents

Publication Publication Date Title
US4991174A (en) Fault diagnostic distributed processing method and system
JPH0312772A (ja) 自動的な故障の識別およびバイパス機能を備えたリアル・タイム制御式コンピュータ・ネットワーク・システム
JPH08255115A (ja) 障害検出およびフォルトトレラントディジタルデータ処理方法および装置
JPH0746322B2 (ja) 障害装置特定システム
US20020144181A1 (en) Method for managing an uncorrectable, unrecoverable data error (UE) as the UE passes through a plurality of devices in a central electronics complex
EP0135037B1 (en) Structure detecting method for circular type transmission system
JP3211878B2 (ja) 通信処理制御手段及びそれを備えた情報処理装置
JPH0567974B2 (ja)
JPH05347626A (ja) 分散処理システムにおける処理方法
JP2827713B2 (ja) 二重化装置
JPH0628358B2 (ja) 伝送系のアドレス・チェック方法
JPS6398242A (ja) 直列データ交換装置
JP3291729B2 (ja) 二重化計算機システム
JPH08278924A (ja) アダプタ診断システム
JPS58123255A (ja) 一重ル−プ伝送システムの障害箇所検出方式
JPH0435251A (ja) リングネットワークの障害監視方式
JPH0370418B2 (ja)
JPH05289896A (ja) フォールトトレラントコンピュータ
JPH03269750A (ja) パス診断方式
JPS5847055B2 (ja) 情報処理装置の故障診断方法
JPS607297B2 (ja) プロセス入出力装置故障診断方式
JPH0377546B2 (ja)
JPS5854698B2 (ja) 障害検出方式
JPH01136446A (ja) 2重ループ伝送システムの故障個所検知方式
JPS6046151A (ja) データ伝送システムにおける伝送制御方式