JP2003533128A - 通信システム - Google Patents

通信システム

Info

Publication number
JP2003533128A
JP2003533128A JP2001582969A JP2001582969A JP2003533128A JP 2003533128 A JP2003533128 A JP 2003533128A JP 2001582969 A JP2001582969 A JP 2001582969A JP 2001582969 A JP2001582969 A JP 2001582969A JP 2003533128 A JP2003533128 A JP 2003533128A
Authority
JP
Japan
Prior art keywords
node
communication system
logical
nodes
status
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001582969A
Other languages
English (en)
Other versions
JP4954420B2 (ja
Inventor
スチュアート チャールズ レイ
Original Assignee
マルコニ コミュニケイションズ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マルコニ コミュニケイションズ リミテッド filed Critical マルコニ コミュニケイションズ リミテッド
Publication of JP2003533128A publication Critical patent/JP2003533128A/ja
Application granted granted Critical
Publication of JP4954420B2 publication Critical patent/JP4954420B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3048Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the topology of the computing system or computing system component explicitly influences the monitoring activity, e.g. serial, hierarchical systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/42Loop networks
    • H04L12/437Ring fault isolation or reconfiguration

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computer And Data Communications (AREA)
  • Eye Examination Apparatus (AREA)
  • Selective Calling Equipment (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

(57)【要約】 【課題】 第1ノードが複数の第2ノードに第2ノードの動作の制御のために接続されている通信システムにおいて、第1ノードの第2ノードの制御能力のボトルネックを解消する。 【解決手段】 複数の第2ノードが物理的相互接続のトポロジーとは異なる1つ又は複数の論理的相互接続内に配置されていて、第2ノードの各々がその論理的後側の第2ノードへ状態メッセージを送信する手段及びその論理的前側の第2ノードから受信した状態メッセージを監視してその状態を決定する手段を含む。

Description

【発明の詳細な説明】
【0001】 本発明は、通信システム(分散計算システムを含む)の分野に関し、さらに詳
細には、このような通信システムにおけるノード(又はコンピュータ)の障害処
理のシステムに関する。
【0002】 分散計算システムにおいては、複数の相互接続されたコンピュータの各々がア
プリケーション・プログラムの部分を実行する。アプリケーション・プログラム
の全体は、複数の相互接続されたコンピュータ上で同時に実行される分散ソフト
ウェア・システムにより実現される。コンピュータは通信システム(例えば、イ
ンターネット・プロトコル(IP)ネットワーク内のホスト)により相互接続さ
れるノードを形成する。柔軟性の有る分散システムでは、1つ又は複数のコンポ
ーネント・コンピュータの障害は、アプリケーションにより許容でき、そして別
のコンピュータ(例えば、全く不使用の予備又は予備の能力を持つ現在使用中の
コンピュータ)に置換えられて、それが分散計算システムで障害を発生したコン
ピュータの役割を引き継ぐことができるように適当なコード及びデータをロード
することにより、回復できる。従って、柔軟性の有る分散計算システムの構成は
変化をし、マネージメント・システムにより制御される。
【0003】 典型的に遠隔のコンピュータに位置するマネージメント・システムは、分散ア
プリケーションを実行するコンピュータのオペレーションを監視し、そして、分
散アプリケーション自身のオペレーションを監視する責任を有する。マネージメ
ント・システムは、分散アプリケーションを実行するコンピュータの集まりの中
にどんな新しいコンピュータを導入すること(例えば、全体の処理能力を増大す
るために)、及び必要ならばこの集まりからコンピュータを引退させること(例
えば、ハードウェアのアップグレード又は置換えのために)、に関与する。マネ
ージメント・システムはまた、分散アプリケーションの構成に関与し、そしてど
のコンピュータが特定の処理タスクに割当てられるか及びどのようにコンピュー
タの集まりの中で処理負荷が分配されるかを制御する。このコンピュータの集ま
りの中の1つコンピュータが障害を発生した時、マネージメン・システムはこれ
を通知して、そしてこれを考慮してコンピュータ及び分散アプリケーションを再
構成しなければならない。
【0004】 従って、このような分散システムにおいて、コンピュータの障害を効率的に検
知する必要性がある。この問題への1つの可能な解決は、マネージメント・シス
テムがインターネット・コントロール・メッセージ・プロトコル(ICMP)エ
コー要求メッセージを送ることにより、アプリケーション・コンピュータの各々
を定期的に「ピング」することである。ICMPがメッセージ配達内にエラーを
報告し、トラフイックを再度向け直する等のために使用される。ICMPエコー
要求メッセージ(普通、「ピング」として知られている)は、受取ったコンピュ
ータが直ちにICMPエコー・メッセージ(「ピング応答」)で返事をすること
を要求する。これは、遠隔のコンピュータが合理的に正しく機能しているかどう
か、そして、このような遠隔のコンピュータに使用できるネットワーク経路が利
用可能であるかどうか(すなわち、コンピュータがその到達を必要としているど
んな他のコンピュータへ到達するために使用可能な経路をアクセスできるかどう
か)を決定する使用される。IPインターフェイスが機能しているコンピュータ
は、これらのメッセージに対してICMPエコー返答メッセージで応答すること
が要求される。これは、オペレーティング・システムの低レベルで生じ、そして
、コンピュータが動作しているか否かを見るために普通に使用される。インター
ネット・エンジニアリング・タスク・フォース発行RFC1122「ホスト要件
」1989年10月は、ICMP動作を記載している(3.2.2.6節、42
−43頁参照)。
【0005】 これらのメッセージを頻繁に送ることにより(例えば、1秒間に複数回)、マ
ネージメント・システムはアプリケーション・コンピュータの各々が機能してい
ことを確証する。もし、応答が期限内に受信されない場合、これはコンピュータ
が障害を発生したかもしれないことを示す。しかし、メッセージはネットワーク
内で失われることがあり、これは完全な信頼性がない。もし、いくつかの応答が
到着しない場合、コンピュータ障害はより大きい自信でもって予測できるであろ
う。しかし、ネットワーク障害の可能性があり、そして回復プロセスの一部とし
て探査されるべきである。もし、障害を起こしたと疑われるコンピュータの近辺
のコンピュータからの応答が受信される場合、障害は疑わしいコンピュータ内に
あることが合理的に想像される。一方、いくつかの近辺のコンピュータからの応
答が受信されない場合は、ネットワーク自身が障害を有すると想像することが合
理的である。
【0006】 アプリケーション・コンピュータがマネージメント・システムにより「ピング
」(ICMPエコー要求メッセージ)されるのではない、代替的な解決はアプリ
ケーション・コンピュータ自身が定期的にまだ稼動していることを知らせるメッ
セージ(必ずしも、ICMPメッセージでない)をマネージメント・システムに
送ることである。再度、このように記載されたメッセージのいくつかが来ないと
アプリケーション・コンピュータの障害を示すことになる。
【0007】 困ったことに、上記の両解決は同じ問題を有する。すなわち、各アプリケーシ
ョン・コンピュータの負荷は大変小さいが、マネージメント・システムはアプリ
ケーション・コンピュータ(この数は大きくなり得る)の各々とネットワーク・
トラフイックを交換しなければならないため、ずっと大きな負荷をこうむる。こ
のトラフイックは、マネージメント・システムが他の仕事を実行するための能力
を低下させ、そして全体システムの大きさを制約する重要な要素となり、若しく
は障害回復が所望よりも長い時間を要する重要な要素となるであろう。
【0008】 本発明は、第1ノード及び複数の第2ノードを含む通信システムを提供する。
第1ノードは第2ノードの動作を制御するために複数の第2ノードに接続されて
いる。複数の第2ノードは物理的相互接続されている。複数の第2ノードは1つ
又は複数の論理的相互接続内に配置されていて、1つ又は複数の論理的相互接続
のトポロジーは物理的相互接続のトポロジーとは異なる。第2ノードの各々は、
状態メッセージをその論理的後側第2モードに送信するための手段及びその論理
的前側第2ノードから受取った状態メッセージを監視してその状態を決定するた
めの手段を含む。
【0009】 好適な実施の形態によれば、本発明は、第2ノードの各々がその論理的前側第
2ノードへそれからの状態メッセージを要求するための制御メッセージを定期的
に送信する手段と、その論理的後側ノードからの制御メッセージの受信を検知し
て検知された受信された制御メッセージに応答してその論理的後側ノードへ状態
メッセージを送信する手段とを含んだシステムを提供する。
【0010】 以下に、本発明の実施の形態を添付図面を参照しながら、一例として説明する
【0011】 図1は、IPネットワークを示し、ここではマネージメント・システム(すな
わち、マネージメント・コンピュータ上で実行されるソフトウェア・システム)
がマネージメント・ノード1に設けられていて、そして各々が複数の第2ノード
2の異なる1つに設けられた複数のアプリケーション・コンピュータに、IPネ
ットワーク3により接続されている。IPネットワークは、例えば、星、ツリー
、バス又はメッシュ構成、あるいは、例えば、無線ネットワークの場合の無定形
的に配置された接続媒体(例えば、銅、光ファイバーあるいは無線)を含む。実
際には、IPネットワークは典型的に、これらの媒体の構成のいくつか又は全て
が一緒に接続された組合せである。
【0012】 図2は、図1のシステムと同じ物理的トポロジーを持った分散計算システムで
ある。しかし、第2ノード2は今度は矢印4に示されるように論理的リング内に
配置されている。矢印4は論理的リング内の状態メッセージの流れる方向を示す
【0013】 図2において、コンピュータの物理的配置及び接続は図1のそれから変更され
ていない。しかし、第2ノードの各々のアプリケーション・コンピュータは状態
メッセージを送信することが要求されるその論理的後側(すなわち、論理的リン
グ内で矢印4方向に並んだ次ぎのコンピュータ)を知り、それが状態メッセージ
を受取ることを期待するその論理的前側(すなわち、論理的リング内で反対方向
に並んだ次ぎのコンピュータ)を知ることができるように、マネージメント・シ
ステムにより構成されたソフトウェアによりアプリケーション・コンピュータの
各々は修正されている。論理的リング・トポロジー(すなわち、コンピュータ間
の論理的接続の構成)は、物理的トポロジー(すなわち、コンピュータ間の物理
的接続の構成)とは異なっていることに注意する。
【0014】 図2の実施の形態によれば、各アプリケーション・コンピュータは定期的にリ
ング内のその論理的前側にICMPエコー要求メッセージを送り、そしてそこか
らのICMPエコー応答メッセージを待つ。応答は、論理的リング内でエコー要
求メッセージの流とは反対向きに送られる。もし、有効な応答が所定の時間内に
受信された場合、全てが順調である。もし、そうでなければ、ICMPエコー要
求メッセージを送信したコンピュータはマネージメント・システム(適当なプロ
トコルを使用して)にその前側ノードが障害を起こしたようであることを通知す
る。この適当なプロトコルは、例えば、インターネット・エンジニアリング・タ
スク・フォースにより発行されたRFC1155「マネージメント情報の構造(
SMI)」1990年5月及びRFC1157「シンプル・ネットワーク・マネ
ージメント・プロトコル(SNMP)」1990年5月のシンプル・ネットワー
ク・マネージメント・プロトコル(SNMP)であり、特に、そのプロトコルの
「トラップ」操作がマネージメント・コンピュータによりマネージメント・シス
テムの注意を引くために、そして選択的にある興味有るデータをマネージメント
・システムに配達するために使用される。このように、各アプリケーション・コ
ンピュータが別の特定のアプリケーション・コンピュータに対する監視者として
動作し、そしてコンピュータはそれ自身の障害をマネージメント・システムに警
告するためのメッセージの発生はできないが、正常に機能しているその監視者が
そのようなメッセージを発生できる。マネージメント・システムはまた、「登録
」プロトコルを実行する(典型的には、SNMPを使用して)。これにより、新
規に開始されたホスト・コンピュータにリング内の彼らの場所を知らせ、そして
リング内の既存のホストの前側−後側関係を調節して、新ホストの登場及び既存
のホストの制御された引退(例えば、ハードウェア・アップグレード又は置換え
)の両方を容易にする。このプロセスは、これらのホスト・コンピュータ上の分
散アプリケーションの開始及び停止と密接に同期している。
【0015】 有利的に、本発明はマネージメント・システムへ周期的に監視メッセージを送
信するルーチンを回避する。事実、全てのノードが動作している時(ほとんど、
いつも)、マネージメント・システム上には余分な負荷がない。従って、より安
くてパワフルでないコンピュータがこのマネージメント役割のために完全に十分
に使用できる。
【0016】 本発明によるネットワークは、全体として見れば、従来の解決法と同数のメッ
セージを運んでいる。しかし、実際は、ネットワークはいくつかの「ローカル」
サブネットワークから構成されていて、この場合の仮想リング回りのトラフイッ
クはそれが発生した同じサブネットワーク内で終了し、そしてこれらサブネット
ワーク間で均等に分配されているトラフイックから主としてなる。結果として、
ネットワーク回りのトラフイック負荷は大いに改良される。従って、IPネット
ワークの構造及び通信システム内のネットワーク下部のそれらの支持により、本
発明による要求メッセージ及び対応する応答の大部分は<典型的に、全体のIP
ネットワークの一部に限定され、そしてIPネットワークの他の部分のネットワ
ーク・インフラストラクチャー又は他のコンピュータに僅かな負荷又は負荷を課
さない(各アプリケーション・コンピュータからの全ての障害検知トラフイック
が単一点、すなわち、マネージメント・システム、に集中しなければならなかっ
た従来の解決法とは異なる)。
【0017】 この理由のため、システムは全体として規模が可変である。一方、従来の解決
法はマネージメント・システムに性能のボトルネックを有していた。これは、能
力のボトルネックに達した時、全システムはそれ以上は成長できなかったことを
意味する。本発明によるシステムにおいては、各コンピュータは小さな障害−検
知関連負荷しか有さず、アプリケーション・コンピュータの数によってコンピュ
ータ当りの負荷は大きくならないので、システムの大きさのこのような限界は存
在しない。
【0018】 図3に示される本発明の別の実施の形態によれば、矢印4、5に示されるよう
に、論理的リングは双方向的に動作する。図3の実施の形態によれば、各アプリ
ケーション・コンピュータは周期的にリング内のその論理的前側及び論理的後側
の両方にICMPエコー要求メッセージを送って、それらからのICMPエコー
応答メッセージを待つ。応答は典型的には、論理リング内を対応するエコー要求
メッセージの方向とは反対向きに送られる。図3から理解されるように、別のノ
ードに論理的に隣接した(論理的リング内で)両ノードがその別のノードを監視
して、それが障害を発生したかどうかを検知する。もし、ノードの障害が発生し
た場合、論理的に隣接したノードが独立にマネージメント・システムに通知する
。このようにして、この実施の形態では、マネージメント・システムが実際のノ
ード障害とは異なる単なるメッセージ損失を容易に区別できるため、信頼性を増
すことができるという利点を有する。
【0019】 別の実施の形態によれば、同じ別のノードを検査している2つのノード間の通
信が、マネージメント・システムに通知する前に、この別のノードの状態をより
大きな自信でもって確立することを可能にする。
【0020】 別の実施の形態によれば、第2ノードの各々がアプリケーション・データを含
み、そしてアプリケーション・メッセージが分散システムの部分の障害の際にデ
ータ損失に対する保護方法として、ノード間でアプリケーション・データを転送
するために使用される。この実施の形態によれば、ICMPではなくアプリケー
ション・メッセージが宛先ノードからの応答を要求するために使用され、そして
通常は宛先ノードにより論理的リング構造を使用して承認される。もし、ある時
間間隔にわたりデータ交換される必要が無い場合(すなわち、もし、状態の変化
がない場合)、ナルアプリケーション・メッセージ又は従来のエコー要求が送ら
れる。
【0021】 要求メッセージを送信して有効な応答を待つ代わりに、各ノードは単に規則的
に状態メッセージをその上記の論理的後側へ送信して、そしてその論理的前側か
ら受信された状態メッセージを監視することができる。
【0022】 状態メッセージは、発生したノード状態に関連した情報を含んでよく、又は、
代替的に、状態メッセージの単なる到着をその発生ノードの状態の指示として使
用してもよい。
【0023】 論理的リングの構造及び、特に、論理的リングの回りに配置される第2ノード
の順序は、ノードの物理的配置及び相互接続により一切制限されない。
【0024】 本発明の別の実施の形態によれば、複数の第2ノードはリング以外の形、すな
わち、メッシュ又は他の構成のある形、の論理的相互接続で構成できる。そして
、各第2ノードに対する論理的後側及び論理的前側の識別は、論理的相互接続の
設定の際に割当てられる。論理的相互接続のトポロジー(すなわち、コンピュー
タ間の論理的接続の配置)は物理的トポロジーとは異なる。
【図面の簡単な説明】
【図1】 従来技術による分散計算システムを示す図。
【図2】 本発明による論理的リング内に配置された分散計算システムを示す図。
【図3】 本発明による双方向論理的リングを示す図。
【手続補正書】特許協力条約第34条補正の翻訳文提出書
【提出日】平成14年7月9日(2002.7.9)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0002
【補正方法】変更
【補正の内容】
【0002】 分散計算システムにおいては、複数の相互接続されたコンピュータの各々がア
プリケーション・プログラムの部分を実行する。アプリケーション・プログラム
の全体は、複数の相互接続されたコンピュータ上で同時に実行される分散ソフト
ウェア・システムにより実現される。コンピュータは通信システム(例えば、イ
ンターネット・プロトコル(IP)ネットワーク内のホスト)により相互接続さ
れるノードを形成する。柔軟性の有る分散システムでは、1つ又は複数のコンポ
ーネント・コンピュータの障害は、アプリケーションにより許容でき、そして別
のコンピュータ(例えば、全く不使用の予備又は予備の能力を持つ現在使用中の
コンピュータ)に置換えられて、それが分散計算システムで障害を発生したコン
ピュータの役割を引き継ぐことができるように適当なコード及びデータをロード
することにより、回復できる。従って、柔軟性の有る分散計算システムの構成は
変化をし、マネージメント・システムにより制御される。 柔軟なシステムの一例が、シャーの米国特許第5,390,326号公報に記
載されている。シャーは、各ノードが状態メッセージを送信して、互いのノード
により送信された状態メッセージを監視する通信ネットワークを教示している。
もし、エラーが検知されると、すなわち、時間内に期待される状態メッセージが
受信されないと、エラーを検出した各ノードはこれをマスター・ノードに報告す
る。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正の内容】
【0008】 本発明は、第1ノード及び複数の第2ノードを含む通信システムを提供する。
第1ノードは第2ノードの動作を制御するために複数の第2ノードに接続されて
いる。複数の第2ノードは物理的相互接続されている。複数の第2ノードは1つ
又は複数の論理的相互接続内に配置されていて、1つ又は複数の論理的相互接続
のトポロジーは物理的相互接続のトポロジーとは異なる。第2ノードの各々は、
状態メッセージをその論理的後側第2モードに送信するための手段及びその論理
的前側第2ノードから受取った状態メッセージを監視してその状態を決定するた
めの手段を含む。第2ノードの各々はアプリケーション・データとアプリケーシ
ョン・メッセージの形でアプリケーション・データをその論理的後側ノードと交
換しそして少なくともいくつかのアプリケーション・メッセージが状態メッセー
ジとして機能する手段を含む。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0009
【補正方法】変更
【補正の内容】
【0009】 好適な実施の形態によれば、本発明は、第2ノードの各々がその論理的前側第
2ノードへそれからの状態メッセージを要求するための制御メッセージを定期的
に送信する手段と、その論理的後側ノードからの制御メッセージの受信を検知し
て検知された受信された制御メッセージに応答してその論理的後側ノードへ状態
メッセージを送信する手段とを含んだシステムを提供する。 好適な実施の形態によれば、本発明は、第2ノードの各々が受信された各状態
メッセージを監視して、もし、所定期間内に論理的前側ノードから所定数の有効
な状態メッセージの受信が無い場合は、エラー状態と識別するための手段を含ん
だシステムを提供する。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE,TR),OA(BF ,BJ,CF,CG,CI,CM,GA,GN,GW, ML,MR,NE,SN,TD,TG),AP(GH,G M,KE,LS,MW,MZ,SD,SL,SZ,TZ ,UG,ZW),EA(AM,AZ,BY,KG,KZ, MD,RU,TJ,TM),AE,AG,AL,AM, AT,AU,AZ,BA,BB,BG,BR,BY,B Z,CA,CH,CN,CO,CR,CU,CZ,DE ,DK,DM,DZ,EE,ES,FI,GB,GD, GE,GH,GM,HR,HU,ID,IL,IN,I S,JP,KE,KG,KP,KR,KZ,LC,LK ,LR,LS,LT,LU,LV,MA,MD,MG, MK,MN,MW,MX,MZ,NO,NZ,PL,P T,RO,RU,SD,SE,SG,SI,SK,SL ,TJ,TM,TR,TT,TZ,UA,UG,US, UZ,VN,YU,ZA,ZW

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 第1ノード及び複数の第2ノードを含み、第1ノードが複数
    の第2ノードに接続されていて第2ノードの動作を制御し、複数の第2ノードが
    物理的相互接続されている通信システムであって、 複数の第2ノードが1つ又は複数の論理的相互接続内に配置されており、1つ
    又は複数の論理的相互接続のトポロジーが物理的相互接続のトポロジーとは異な
    り、 第2ノードの各々が、その論理的後側第2ノードへ状態メッセージを送信する
    手段及びその論理的前側第2ノードから受信した状態メッセージを監視してその
    状態を決定する手段を含んでいる通信システム。
  2. 【請求項2】 請求項1に記載の通信システムにおいて、第2ノードの各々
    が、所定の間隔でその論理的後側ノードに状態メッセージを送信する手段を含む
    通信システム。
  3. 【請求項3】 請求項1に記載の通信システムにおいて、第2ノードの各々
    が、論理的前側第2ノードへそこからの状態メッセージを要求するための制御メ
    ッセージを周期的に送信する手段及び論理的後側ノードからの制御メッセージの
    受信を検知して、制御メッセージ受信の各検知に応答して、状態メッセージを論
    理的後側ノードへ送信する手段を含む通信システム。
  4. 【請求項4】 上記請求項のいずれかに記載の通信システムにおいて、第2
    ノードの各々が、受信された各状態メッセージを監視して、もし、所定の間隔内
    で論理的前側ノードから所定数の有効な状態メッセージが受信されない場合は、
    エラー状態を識別するための手段を含む通信システム。
  5. 【請求項5】 上記請求項のいずれかに記載の通信システムにおいて、第2
    ノードの各々が、アプリケーション・データと、アプリケーション・メッセージ
    の形でアプリケーション・データをその論理的後側ノードと交換しそして少なく
    ともいくつかのアプリケーション・メッセージが上記請求項のいずれかの状態メ
    ッセージの目的として機能する手段とを含む通信システム。
  6. 【請求項6】 請求項3に記載の通信システムにおいて、第2ノードの各々
    が、アプリケーション・データと、アプリケーション・メッセージの形でアプリ
    ケーション・データをその論理的前側第2ノードと交換しそして少なくともいく
    つかのアプリケーション・メッセージが請求項3の制御メッセージの目的として
    機能する手段とを含む通信システム。
  7. 【請求項7】 上記請求項のいずれかに記載の通信システムにおいて、第2
    ノードの各々が、その第2ノードの論理的前側ノードの状態を第1ノードに通知
    する手段を含む通信システム。
  8. 【請求項8】 上記請求項のいずれかに記載の通信システムにおいて、少な
    くとも1つの論理的相互接続が第1ノードを含む通信システム。
  9. 【請求項9】 上記請求項のいずれかに記載の通信システムにおいて、1つ
    又は複数の論理的相互接続が1つ又は複数の論理的リングを含む通信システム。
  10. 【請求項10】 上記請求項のいずれかに記載の通信システムにおいて、シ
    ステムがインターネット・プロトコル(IP)ネットワークを含む通信システム
JP2001582969A 2000-05-09 2001-05-01 通信システム Expired - Fee Related JP4954420B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0011021.3 2000-05-09
GB0011021A GB2362230A (en) 2000-05-09 2000-05-09 Delegated fault detection in a network by mutual node status checking
PCT/GB2001/001896 WO2001086874A2 (en) 2000-05-09 2001-05-01 Communications system

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011277098A Division JP2012085339A (ja) 2000-05-09 2011-12-19 通信システム

Publications (2)

Publication Number Publication Date
JP2003533128A true JP2003533128A (ja) 2003-11-05
JP4954420B2 JP4954420B2 (ja) 2012-06-13

Family

ID=9891141

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2001582969A Expired - Fee Related JP4954420B2 (ja) 2000-05-09 2001-05-01 通信システム
JP2011277098A Pending JP2012085339A (ja) 2000-05-09 2011-12-19 通信システム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011277098A Pending JP2012085339A (ja) 2000-05-09 2011-12-19 通信システム

Country Status (10)

Country Link
US (1) US7283485B2 (ja)
EP (1) EP1282953B1 (ja)
JP (2) JP4954420B2 (ja)
CN (1) CN1276615C (ja)
AT (1) ATE456217T1 (ja)
AU (1) AU2001252371A1 (ja)
DE (1) DE60141132D1 (ja)
DK (1) DK1282953T3 (ja)
GB (1) GB2362230A (ja)
WO (1) WO2001086874A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010087308A1 (ja) * 2009-02-02 2010-08-05 日本電気株式会社 通信ネットワーク管理システム、方法、プログラム、及び管理計算機

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030188070A1 (en) * 2002-04-01 2003-10-02 Delaney William P. Method and apparatus for detecting I/O timeouts
JP3737460B2 (ja) * 2002-07-09 2006-01-18 株式会社東京三菱銀行 コンピュータ・システム
US7945909B2 (en) * 2003-05-09 2011-05-17 Sap Aktiengesellschaft Initiating recovery of an executing task using historical information and task information
US6928589B1 (en) * 2004-01-23 2005-08-09 Hewlett-Packard Development Company, L.P. Node management in high-availability cluster
WO2005114961A1 (en) * 2004-05-19 2005-12-01 Computer Associates Think, Inc. Distributed high availability system and method
JP5475130B2 (ja) * 2010-07-09 2014-04-16 富士通株式会社 監視プログラム、監視システム及び監視方法
WO2013097882A1 (en) * 2011-12-29 2013-07-04 Telefonaktiebolaget L M Ericsson (Publ) Technique for handling a status change in an interconnect node
US11025722B2 (en) * 2017-04-15 2021-06-01 Microsoft Technology Licensing, Llc IoT device jobs
DE102018101103A1 (de) * 2018-01-18 2019-07-18 Volkswagen Aktiengesellschaft Verfahren und Computerprogramme für eine Überwachungsinstanz und eine Kommunikationskomponente, Überwachungsinstanz, Kommunikationskomponente, System und Fahrzeug

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0252538A (ja) * 1988-08-16 1990-02-22 Omron Tateisi Electron Co バス型lan
JP2000082053A (ja) * 1998-07-03 2000-03-21 Mitsubishi Electric Corp ネットワ―ク監視装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8422328D0 (en) * 1984-09-04 1984-10-10 Int Computers Ltd Data processing apparatus
EP0290934B1 (de) * 1987-05-14 1994-01-19 Siemens Aktiengesellschaft Verfahren zum Bilden einer Adressentabelle in einem ringförmigen Kommunikationsnetz
US5684807A (en) * 1991-04-02 1997-11-04 Carnegie Mellon University Adaptive distributed system and method for fault tolerance
US5542047A (en) * 1991-04-23 1996-07-30 Texas Instruments Incorporated Distributed network monitoring system for monitoring node and link status
JP3120157B2 (ja) * 1991-07-08 2000-12-25 株式会社日立製作所 環状論理通信路制御方法
JPH05342774A (ja) 1992-06-08 1993-12-24 Canon Inc 誤り率低減回路
US5390326A (en) 1993-04-30 1995-02-14 The Foxboro Company Local area network with fault detection and recovery
CA2145921A1 (en) * 1994-05-10 1995-11-11 Vijay Pochampalli Kumar Method and apparatus for executing a distributed algorithm or service on a simple network management protocol based computer network
KR0174604B1 (ko) * 1995-07-24 1999-04-01 김광호 전자식 교환기에서 프로세서 상태확인 분산처리방법
US6574197B1 (en) * 1998-07-03 2003-06-03 Mitsubishi Denki Kabushiki Kaisha Network monitoring device
US6532088B1 (en) * 1999-09-10 2003-03-11 Alcatel System and method for packet level distributed routing in fiber optic rings

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0252538A (ja) * 1988-08-16 1990-02-22 Omron Tateisi Electron Co バス型lan
JP2000082053A (ja) * 1998-07-03 2000-03-21 Mitsubishi Electric Corp ネットワ―ク監視装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010087308A1 (ja) * 2009-02-02 2010-08-05 日本電気株式会社 通信ネットワーク管理システム、方法、プログラム、及び管理計算機
US9264327B2 (en) 2009-02-02 2016-02-16 Nec Corporation Communication network management system, method and program, and management computer

Also Published As

Publication number Publication date
CN1440606A (zh) 2003-09-03
WO2001086874A3 (en) 2002-04-04
GB0011021D0 (en) 2000-06-28
DE60141132D1 (de) 2010-03-11
WO2001086874A2 (en) 2001-11-15
AU2001252371A1 (en) 2001-11-20
JP2012085339A (ja) 2012-04-26
EP1282953A2 (en) 2003-02-12
EP1282953B1 (en) 2010-01-20
GB2362230A (en) 2001-11-14
ATE456217T1 (de) 2010-02-15
CN1276615C (zh) 2006-09-20
US20040100971A1 (en) 2004-05-27
JP4954420B2 (ja) 2012-06-13
DK1282953T3 (da) 2010-04-12
US7283485B2 (en) 2007-10-16

Similar Documents

Publication Publication Date Title
US10674486B2 (en) System, security and network management using self-organizing communication orbits in distributed networks
JP2012085339A (ja) 通信システム
US7069320B1 (en) Reconfiguring a network by utilizing a predetermined length quiescent state
JP2576762B2 (ja) リング網のノード間情報収集方式
US9237092B2 (en) Method, apparatus, and system for updating ring network topology information
KR100445374B1 (ko) 정상 상태에서 토폴로지 메시지 트래픽 없는 분산형 컴퓨팅 환경에서의 토폴로지 전달
US9385944B2 (en) Communication system, path switching method and communication device
US10911295B2 (en) Server apparatus, cluster system, cluster control method and program
WO2002021276A1 (en) A system and method for managing clusters containing multiple nodes
AU749265B2 (en) Method and apparatus for non-disruptive addition of a new node to an inter-nodal network
JP2004062535A (ja) マルチプロセッサシステムの障害処理方法、マルチプロセッサシステム及びノード
US20030014516A1 (en) Recovery support for reliable messaging
EP1712067B1 (en) A method, apparatus and system of organizing servers
JP2003524334A (ja) 冗長ネットワーク制御による複数ネットワークの耐故障性
US6647430B1 (en) Geographically separated totem rings
US6792558B2 (en) Backup system for operation system in communications system
JP2001308893A (ja) ループ型トポロジネットワークにおけるルーティング情報動的再構成方式
CN115701031A (zh) 一种业务处理方法和相关装置
KR20230083022A (ko) 망관리시스템의 관리명령 처리방법
JP2003244144A (ja) ネットワーク管理方式
JP2016092459A (ja) 通信システム、網管理装置、及び、サービス管理装置
JPH04207731A (ja) オペレーションシステム相互補完処理方式

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20070201

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080501

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110209

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110506

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110513

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110609

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110616

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110706

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110713

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110726

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120213

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120308

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120314

R150 Certificate of patent or registration of utility model

Ref document number: 4954420

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees