JP2012085339A - 通信システム - Google Patents

通信システム Download PDF

Info

Publication number
JP2012085339A
JP2012085339A JP2011277098A JP2011277098A JP2012085339A JP 2012085339 A JP2012085339 A JP 2012085339A JP 2011277098 A JP2011277098 A JP 2011277098A JP 2011277098 A JP2011277098 A JP 2011277098A JP 2012085339 A JP2012085339 A JP 2012085339A
Authority
JP
Japan
Prior art keywords
node
logical
nodes
computer
computers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011277098A
Other languages
English (en)
Inventor
Stuart Charles Wray
スチュアート チャールズ レイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ericsson AB
Original Assignee
Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson AB filed Critical Ericsson AB
Publication of JP2012085339A publication Critical patent/JP2012085339A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3048Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the topology of the computing system or computing system component explicitly influences the monitoring activity, e.g. serial, hierarchical systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/42Loop networks
    • H04L12/437Ring fault isolation or reconfiguration

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)
  • Eye Examination Apparatus (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Selective Calling Equipment (AREA)

Abstract

【課題】第1ノードが複数の第2ノードに第2ノードの動作の制御のために接続されている通信システムにおいて、第1ノードの第2ノードの制御能力のボトルネックを解消する。
【解決手段】複数の第2ノードが物理的相互接続のトポロジーとは異なる1つ又は複数の論理的相互接続内に配置されていて、第2ノードの各々がその論理的後側の第2ノードへ状態メッセージを送信する手段及びその論理的前側の第2ノードから受信した状態メッセージを監視してその状態を決定する手段を含む。
【選択図】図2

Description

本発明は、通信システム(分散計算システムを含む)の分野に関し、さらに詳細には、このような通信システムにおけるノード(又はコンピュータ)の障害処理のシステムに関する。
分散計算システムにおいては、複数の相互接続されたコンピュータの各々がアプリケーション・プログラムの部分を実行する。アプリケーション・プログラムの全体は、複数の相互接続されたコンピュータ上で同時に実行される分散ソフトウェア・システムにより実現される。コンピュータは通信システム(例えば、インターネット・プロトコル(IP)ネットワーク内のホスト)により相互接続されるノードを形成する。柔軟性の有る分散システムでは、1つ又は複数のコンポーネント・コンピュータの障害は、アプリケーションにより許容でき、そして別のコンピュータ(例えば、全く不使用の予備又は予備の能力を持つ現在使用中のコンピュータ)に置換えられて、それが分散計算システムで障害を発生したコンピュータの役割を引き継ぐことができるように適当なコード及びデータをロードすることにより、回復できる。従って、柔軟性の有る分散計算システムの構成は変化をし、マネージメント・システムにより制御される。
典型的に遠隔のコンピュータに位置するマネージメント・システムは、分散アプリケーションを実行するコンピュータのオペレーションを監視し、そして、分散アプリケーション自身のオペレーションを監視する責任を有する。マネージメント・システムは、分散アプリケーションを実行するコンピュータの集まりの中にどんな新しいコンピュータを導入すること(例えば、全体の処理能力を増大するために)、及び必要ならばこの集まりからコンピュータを引退させること(例えば、ハードウェアのアップグレード又は置換えのために)、に関与する。マネージメント・システムはまた、分散アプリケーションの構成に関与し、そしてどのコンピュータが特定の処理タスクに割当てられるか及びどのようにコンピュータの集まりの中で処理負荷が分配されるかを制御する。このコンピュータの集まりの中の1つコンピュータが障害を発生した時、マネージメン・システムはこれを通知して、そしてこれを考慮してコンピュータ及び分散アプリケーションを再構成しなければならない。
特開2000−82053号公報 特開平2−52538号公報
従って、このような分散システムにおいて、コンピュータの障害を効率的に検知する必要性がある。この問題への1つの可能な解決は、マネージメント・システムがインターネット・コントロール・メッセージ・プロトコル(ICMP)エコー要求メッセージを送ることにより、アプリケーション・コンピュータの各々を定期的に「ピング」することである。ICMPがメッセージ配達内にエラーを報告し、トラフイックを再度向け直する等のために使用される。ICMPエコー要求メッセージ(普通、「ピング」として知られている)は、受取ったコンピュータが直ちにICMPエコー・メッセージ(「ピング応答」)で返事をすることを要求する。これは、遠隔のコンピュータが合理的に正しく機能しているかどうか、そして、このような遠隔のコンピュータに使用できるネットワーク経路が利用可能であるかどうか(すなわち、コンピュータがその到達を必要としているどんな他のコンピュータへ到達するために使用可能な経路をアクセスできるかどうか)を決定する使用される。IPインターフェイスが機能しているコンピュータは、これらのメッセージに対してICMPエコー返答メッセージで応答することが要求される。これは、オペレーティング・システムの低レベルで生じ、そして、コンピュータが動作しているか否かを見るために普通に使用される。インターネット・エンジニアリング・タスク・フォース発行RFC1122「ホスト要件」1989年10月は、ICMP動作を記載している(3.2.2.6節、42−43頁参照)。
これらのメッセージを頻繁に送ることにより(例えば、1秒間に複数回)、マネージメント・システムはアプリケーション・コンピュータの各々が機能していことを確証する。もし、応答が期限内に受信されない場合、これはコンピュータが障害を発生したかもしれないことを示す。しかし、メッセージはネットワーク内で失われることがあり、これは完全な信頼性がない。もし、いくつかの応答が到着しない場合、コンピュータ障害はより大きい自信でもって予測できるであろう。しかし、ネットワーク障害の可能性があり、そして回復プロセスの一部として探査されるべきである。もし、障害を起こしたと疑われるコンピュータの近辺のコンピュータからの応答が受信される場合、障害は疑わしいコンピュータ内にあることが合理的に想像される。一方、いくつかの近辺のコンピュータからの応答が受信されない場合は、ネットワーク自身が障害を有すると想像することが合理的である。
アプリケーション・コンピュータがマネージメント・システムにより「ピング」(ICMPエコー要求メッセージ)されるのではない、代替的な解決はアプリケーション・コンピュータ自身が定期的にまだ稼動していることを知らせるメッセージ(必ずしも、ICMPメッセージでない)をマネージメント・システムに送ることである。再度、このように記載されたメッセージのいくつかが来ないとアプリケーション・コンピュータの障害を示すことになる。
困ったことに、上記の両解決は同じ問題を有する。すなわち、各アプリケーション・コンピュータの負荷は大変小さいが、マネージメント・システムはアプリケーション・コンピュータ(この数は大きくなり得る)の各々とネットワーク・トラフイックを交換しなければならないため、ずっと大きな負荷をこうむる。このトラフイックは、マネージメント・システムが他の仕事を実行するための能力を低下させ、そして全体システムの大きさを制約する重要な要素となり、若しくは障害回復が所望よりも長い時間を要する重要な要素となるであろう。
本発明は、第1ノード及び複数の第2ノードを含む通信システムを提供する。第1ノードは第2ノードの動作を制御するために複数の第2ノードに接続されている。複数の第2ノードは物理的相互接続されている。複数の第2ノードは1つ又は複数の論理的相互接続内に配置されていて、1つ又は複数の論理的相互接続のトポロジーは物理的相互接続のトポロジーとは異なる。第2ノードの各々は、状態メッセージをその論理的後側第2モードに送信するための手段及びその論理的前側第2ノードから受取った状態メッセージを監視してその状態を決定するための手段を含む。
好適な実施の形態によれば、本発明は、第2ノードの各々がその論理的前側第2ノードへそれからの状態メッセージを要求するための制御メッセージを定期的に送信する手段と、その論理的後側ノードからの制御メッセージの受信を検知して検知された受信された制御メッセージに応答してその論理的後側ノードへ状態メッセージを送信する手段とを含んだシステムを提供する。
従来技術による分散計算システムを示す図。 本発明による論理的リング内に配置された分散計算システムを示す図。 本発明による双方向論理的リングを示す図。
以下に、本発明の実施の形態を添付図面を参照しながら、一例として説明する。
図1は、IPネットワークを示し、ここではマネージメント・システム(すなわち、マネージメント・コンピュータ上で実行されるソフトウェア・システム)がマネージメント・ノード1に設けられていて、そして各々が複数の第2ノード2の異なる1つに設けられた複数のアプリケーション・コンピュータに、IPネットワーク3により接続されている。IPネットワークは、例えば、星、ツリー、バス又はメッシュ構成、あるいは、例えば、無線ネットワークの場合の無定形的に配置された接続媒体(例えば、銅、光ファイバーあるいは無線)を含む。実際には、IPネットワークは典型的に、これらの媒体の構成のいくつか又は全てが一緒に接続された組合せである。
図2は、図1のシステムと同じ物理的トポロジーを持った分散計算システムである。しかし、第2ノード2は今度は矢印4に示されるように論理的リング内に配置されている。矢印4は論理的リング内の状態メッセージの流れる方向を示す。
図2において、コンピュータの物理的配置及び接続は図1のそれから変更されていない。しかし、第2ノードの各々のアプリケーション・コンピュータは状態メッセージを送信することが要求されるその論理的後側(すなわち、論理的リング内で矢印4方向に並んだ次ぎのコンピュータ)を知り、それが状態メッセージを受取ることを期待するその論理的前側(すなわち、論理的リング内で反対方向に並んだ次ぎのコンピュータ)を知ることができるように、マネージメント・システムにより構成されたソフトウェアによりアプリケーション・コンピュータの各々は修正されている。論理的リング・トポロジー(すなわち、コンピュータ間の論理的接続の構成)は、物理的トポロジー(すなわち、コンピュータ間の物理的接続の構成)とは異なっていることに注意する。
図2の実施の形態によれば、各アプリケーション・コンピュータは定期的にリング内のその論理的前側にICMPエコー要求メッセージを送り、そしてそこからのICMPエコー応答メッセージを待つ。応答は、論理的リング内でエコー要求メッセージの流とは反対向きに送られる。もし、有効な応答が所定の時間内に受信された場合、全てが順調である。もし、そうでなければ、ICMPエコー要求メッセージを送信したコンピュータはマネージメント・システム(適当なプロトコルを使用して)にその前側ノードが障害を起こしたようであることを通知する。この適当なプロトコルは、例えば、インターネット・エンジニアリング・タスク・フォースにより発行されたRFC1155「マネージメント情報の構造(SMI)」1990年5月及びRFC1157「シンプル・ネットワーク・マネージメント・プロトコル(SNMP)」1990年5月のシンプル・ネットワーク・マネージメント・プロトコル(SNMP)であり、特に、そのプロトコルの「トラップ」操作がマネージメント・コンピュータによりマネージメント・システムの注意を引くために、そして選択的にある興味有るデータをマネージメント・システムに配達するために使用される。このように、各アプリケーション・コンピュータが別の特定のアプリケーション・コンピュータに対する監視者として動作し、そしてコンピュータはそれ自身の障害をマネージメント・システムに警告するためのメッセージの発生はできないが、正常に機能しているその監視者がそのようなメッセージを発生できる。マネージメント・システムはまた、「登録」プロトコルを実行する(典型的には、SNMPを使用して)。これにより、新規に開始されたホスト・コンピュータにリング内の彼らの場所を知らせ、そしてリング内の既存のホストの前側−後側関係を調節して、新ホストの登場及び既存のホストの制御された引退(例えば、ハードウェア・アップグレード又は置換え)の両方を容易にする。このプロセスは、これらのホスト・コンピュータ上の分散アプリケーションの開始及び停止と密接に同期している。
有利的に、本発明はマネージメント・システムへ周期的に監視メッセージを送信するルーチンを回避する。事実、全てのノードが動作している時(ほとんど、いつも)、マネージメント・システム上には余分な負荷がない。従って、より安くてパワフルでないコンピュータがこのマネージメント役割のために完全に十分に使用できる。
本発明によるネットワークは、全体として見れば、従来の解決法と同数のメッセージを運んでいる。しかし、実際は、ネットワークはいくつかの「ローカル」サブネットワークから構成されていて、この場合の仮想リング回りのトラフイックはそれが発生した同じサブネットワーク内で終了し、そしてこれらサブネットワーク間で均等に分配されているトラフイックから主としてなる。結果として、ネットワーク回りのトラフイック負荷は大いに改良される。従って、IPネットワークの構造及び通信システム内のネットワーク下部のそれらの支持により、本発明による要求メッセージ及び対応する応答の大部分は<典型的に、全体のIPネットワークの一部に限定され、そしてIPネットワークの他の部分のネットワーク・インフラストラクチャー又は他のコンピュータに僅かな負荷又は負荷を課さない(各アプリケーション・コンピュータからの全ての障害検知トラフイックが単一点、すなわち、マネージメント・システム、に集中しなければならなかった従来の解決法とは異なる)。
この理由のため、システムは全体として規模が可変である。一方、従来の解決法はマネージメント・システムに性能のボトルネックを有していた。これは、能力のボトルネックに達した時、全システムはそれ以上は成長できなかったことを意味する。本発明によるシステムにおいては、各コンピュータは小さな障害−検知関連負荷しか有さず、アプリケーション・コンピュータの数によってコンピュータ当りの負荷は大きくならないので、システムの大きさのこのような限界は存在しない。
図3に示される本発明の別の実施の形態によれば、矢印4、5に示されるように、論理的リングは双方向的に動作する。図3の実施の形態によれば、各アプリケーション・コンピュータは周期的にリング内のその論理的前側及び論理的後側の両方にICMPエコー要求メッセージを送って、それらからのICMPエコー応答メッセージを待つ。応答は典型的には、論理リング内を対応するエコー要求メッセージの方向とは反対向きに送られる。図3から理解されるように、別のノードに論理的に隣接した(論理的リング内で)両ノードがその別のノードを監視して、それが障害を発生したかどうかを検知する。もし、ノードの障害が発生した場合、論理的に隣接したノードが独立にマネージメント・システムに通知する。このようにして、この実施の形態では、マネージメント・システムが実際のノード障害とは異なる単なるメッセージ損失を容易に区別できるため、信頼性を増すことができるという利点を有する。
別の実施の形態によれば、同じ別のノードを検査している2つのノード間の通信が、マネージメント・システムに通知する前に、この別のノードの状態をより大きな自信でもって確立することを可能にする。
別の実施の形態によれば、第2ノードの各々がアプリケーション・データを含み、そしてアプリケーション・メッセージが分散システムの部分の障害の際にデータ損失に対する保護方法として、ノード間でアプリケーション・データを転送するために使用される。この実施の形態によれば、ICMPではなくアプリケーション・メッセージが宛先ノードからの応答を要求するために使用され、そして通常は宛先ノードにより論理的リング構造を使用して承認される。もし、ある時間間隔にわたりデータ交換される必要が無い場合(すなわち、もし、状態の変化がない場合)、ナルアプリケーション・メッセージ又は従来のエコー要求が送られる。
要求メッセージを送信して有効な応答を待つ代わりに、各ノードは単に規則的に状態メッセージをその上記の論理的後側へ送信して、そしてその論理的前側から受信された状態メッセージを監視することができる。
状態メッセージは、発生したノード状態に関連した情報を含んでよく、又は、代替的に、状態メッセージの単なる到着をその発生ノードの状態の指示として使用してもよい。
論理的リングの構造及び、特に、論理的リングの回りに配置される第2ノードの順序は、ノードの物理的配置及び相互接続により一切制限されない。
本発明の別の実施の形態によれば、複数の第2ノードはリング以外の形、すなわち、メッシュ又は他の構成のある形、の論理的相互接続で構成できる。そして、各第2ノードに対する論理的後側及び論理的前側の識別は、論理的相互接続の設定の際に割当てられる。論理的相互接続のトポロジー(すなわち、コンピュータ間の論理的接続の配置)は物理的トポロジーとは異なる。

Claims (1)

  1. 第1ノード及び複数の第2ノードを含み、第1ノードが複数の第2ノードに接続されていて第2ノードの動作を制御し、複数の第2ノードが物理的相互接続されている通信システムであって、
    複数の第2ノードが1つ又は複数の論理的相互接続内に配置されており、1つ又は複数の論理的相互接続のトポロジーが物理的相互接続のトポロジーとは異なり、
    第2ノードの各々が、その論理的後側第2ノードへ状態メッセージを送信する手段及びその論理的前側第2ノードから受信した状態メッセージを監視してその状態を決定する手段を含んでいる通信システム。
JP2011277098A 2000-05-09 2011-12-19 通信システム Pending JP2012085339A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0011021A GB2362230A (en) 2000-05-09 2000-05-09 Delegated fault detection in a network by mutual node status checking
GB0011021.3 2000-05-09

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001582969A Division JP4954420B2 (ja) 2000-05-09 2001-05-01 通信システム

Publications (1)

Publication Number Publication Date
JP2012085339A true JP2012085339A (ja) 2012-04-26

Family

ID=9891141

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2001582969A Expired - Fee Related JP4954420B2 (ja) 2000-05-09 2001-05-01 通信システム
JP2011277098A Pending JP2012085339A (ja) 2000-05-09 2011-12-19 通信システム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2001582969A Expired - Fee Related JP4954420B2 (ja) 2000-05-09 2001-05-01 通信システム

Country Status (10)

Country Link
US (1) US7283485B2 (ja)
EP (1) EP1282953B1 (ja)
JP (2) JP4954420B2 (ja)
CN (1) CN1276615C (ja)
AT (1) ATE456217T1 (ja)
AU (1) AU2001252371A1 (ja)
DE (1) DE60141132D1 (ja)
DK (1) DK1282953T3 (ja)
GB (1) GB2362230A (ja)
WO (1) WO2001086874A2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030188070A1 (en) * 2002-04-01 2003-10-02 Delaney William P. Method and apparatus for detecting I/O timeouts
JP3737460B2 (ja) * 2002-07-09 2006-01-18 株式会社東京三菱銀行 コンピュータ・システム
US7945909B2 (en) * 2003-05-09 2011-05-17 Sap Aktiengesellschaft Initiating recovery of an executing task using historical information and task information
US6928589B1 (en) * 2004-01-23 2005-08-09 Hewlett-Packard Development Company, L.P. Node management in high-availability cluster
US20050259572A1 (en) * 2004-05-19 2005-11-24 Esfahany Kouros H Distributed high availability system and method
WO2010087308A1 (ja) * 2009-02-02 2010-08-05 日本電気株式会社 通信ネットワーク管理システム、方法、プログラム、及び管理計算機
EP2592561A4 (en) * 2010-07-09 2017-12-20 Fujitsu Limited Monitoring program, monitoring method and monitoring device of computer
EP2798782B1 (en) * 2011-12-29 2015-12-23 Telefonaktiebolaget LM Ericsson (Publ) Technique for handling a status change in an interconnect node
US11025722B2 (en) * 2017-04-15 2021-06-01 Microsoft Technology Licensing, Llc IoT device jobs
DE102018101103A1 (de) 2018-01-18 2019-07-18 Volkswagen Aktiengesellschaft Verfahren und Computerprogramme für eine Überwachungsinstanz und eine Kommunikationskomponente, Überwachungsinstanz, Kommunikationskomponente, System und Fahrzeug

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8422328D0 (en) * 1984-09-04 1984-10-10 Int Computers Ltd Data processing apparatus
DE3887199D1 (de) * 1987-05-14 1994-03-03 Siemens Ag Verfahren zum Bilden einer Adressentabelle in einem ringförmigen Kommunikationsnetz.
JPH0252538A (ja) * 1988-08-16 1990-02-22 Omron Tateisi Electron Co バス型lan
US5684807A (en) * 1991-04-02 1997-11-04 Carnegie Mellon University Adaptive distributed system and method for fault tolerance
US5542047A (en) * 1991-04-23 1996-07-30 Texas Instruments Incorporated Distributed network monitoring system for monitoring node and link status
JP3120157B2 (ja) * 1991-07-08 2000-12-25 株式会社日立製作所 環状論理通信路制御方法
JPH05342774A (ja) 1992-06-08 1993-12-24 Canon Inc 誤り率低減回路
US5390326A (en) 1993-04-30 1995-02-14 The Foxboro Company Local area network with fault detection and recovery
CA2145921A1 (en) * 1994-05-10 1995-11-11 Vijay Pochampalli Kumar Method and apparatus for executing a distributed algorithm or service on a simple network management protocol based computer network
KR0174604B1 (ko) * 1995-07-24 1999-04-01 김광호 전자식 교환기에서 프로세서 상태확인 분산처리방법
JP2000082053A (ja) * 1998-07-03 2000-03-21 Mitsubishi Electric Corp ネットワ―ク監視装置
US6574197B1 (en) * 1998-07-03 2003-06-03 Mitsubishi Denki Kabushiki Kaisha Network monitoring device
US6532088B1 (en) * 1999-09-10 2003-03-11 Alcatel System and method for packet level distributed routing in fiber optic rings

Also Published As

Publication number Publication date
DK1282953T3 (da) 2010-04-12
JP4954420B2 (ja) 2012-06-13
CN1276615C (zh) 2006-09-20
DE60141132D1 (de) 2010-03-11
GB2362230A (en) 2001-11-14
WO2001086874A2 (en) 2001-11-15
GB0011021D0 (en) 2000-06-28
ATE456217T1 (de) 2010-02-15
JP2003533128A (ja) 2003-11-05
WO2001086874A3 (en) 2002-04-04
EP1282953B1 (en) 2010-01-20
EP1282953A2 (en) 2003-02-12
US7283485B2 (en) 2007-10-16
US20040100971A1 (en) 2004-05-27
CN1440606A (zh) 2003-09-03
AU2001252371A1 (en) 2001-11-20

Similar Documents

Publication Publication Date Title
JP2012085339A (ja) 通信システム
US10674486B2 (en) System, security and network management using self-organizing communication orbits in distributed networks
US7370223B2 (en) System and method for managing clusters containing multiple nodes
KR100935782B1 (ko) 채널 기반 스위칭 패브릭 분산형 시스템-영역 네트워크에 대한 집중 관리를 제공하는 방법, 채널 기반 스위칭 패브릭 분산형 시스템-영역 네트워크에 대한 집중 관리를 제공하는 시스템 및 컴퓨터 판독가능한 저장 매체
US5968189A (en) System of reporting errors by a hardware element of a distributed computer system
US20030126240A1 (en) Method, system and computer program product for monitoring objects in an it network
US20050066218A1 (en) Method and apparatus for alert failover
CN110958151B (zh) 保活检测方法、装置、节点、存储介质及通信系统
US20030014516A1 (en) Recovery support for reliable messaging
US20050204027A1 (en) Management system for hardware network devices
JPH10326260A (ja) 分散コンピュータ・システムのハードウェア要素によりエラーを報告する方法
US6922793B2 (en) Method for recovering from malfunctions in an agent module of a modular network device
US8036105B2 (en) Monitoring a problem condition in a communications system
JPH09293059A (ja) 分散システム及びその運用管理方法
US5793977A (en) System for obtaining the state of network resources in a distributed computing environment
CN103001832B (zh) 分布式文件系统中节点的检测方法和装置
KR102611301B1 (ko) 전화 교환 시스템의 메시지 전달 장치 및 방법
JP2001308893A (ja) ループ型トポロジネットワークにおけるルーティング情報動的再構成方式
JP2019168739A (ja) 並列計算システム
JP2008259047A (ja) ネットワーク監視システムおよび集中監視装置
WO2006057349A1 (ja) 管理システム及びそれに用いられる装置と、そのプログラムと、管理方法
JPH1188399A (ja) ネットワーク管理方法
CN115701031A (zh) 一种业务处理方法和相关装置
CN115412562A (zh) 一种服务注册及订阅方法、装置及设备
KR20050059489A (ko) 통신망시스템의 관리시스템 및 그 관리방법

Legal Events

Date Code Title Description
A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20130522