JP3880477B2 - ネットワーク調査中に不良ネットワーク構成要素を識別する方法 - Google Patents

ネットワーク調査中に不良ネットワーク構成要素を識別する方法 Download PDF

Info

Publication number
JP3880477B2
JP3880477B2 JP2002206417A JP2002206417A JP3880477B2 JP 3880477 B2 JP3880477 B2 JP 3880477B2 JP 2002206417 A JP2002206417 A JP 2002206417A JP 2002206417 A JP2002206417 A JP 2002206417A JP 3880477 B2 JP3880477 B2 JP 3880477B2
Authority
JP
Japan
Prior art keywords
network
network element
parent
bad
switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002206417A
Other languages
English (en)
Other versions
JP2003134164A (ja
Inventor
カール・エイ・ベンダー
ニコラス・ピー・ラッシュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2003134164A publication Critical patent/JP2003134164A/ja
Application granted granted Critical
Publication of JP3880477B2 publication Critical patent/JP3880477B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/22Arrangements for detecting or preventing errors in the information received using redundant apparatus to increase reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/26Route discovery packet

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、一般にネットワーク調査に関し、詳細には、ネットワーク調査中に1つまたは複数の不良ネットワーク構成要素を決定的かつ正確に識別することに関する。
【0002】
【従来の技術】
分散通信環境は通常、相互接続ネットワークを介して接続された複数のノードを含む。ノード間の通信を確立するために、ネットワークが調査され、様々なネットワーク要素が初期化される。
【0003】
一例では、ネットワークの1ノードが選択され、調査および初期化を行う責任を担う。そのノードは、本明細書ではエクスプローラ・ノード(explorer node)と称し、通常、例えば初期化または状況要求パケットを送ることによってネットワーク要素(エレメント)との通信を確立しようと試みる。エレメントから応答がない場合、エクスプローラは、次の動作方針は再試行することであるか、それともあきらめてそのエレメントまたはそのエレメントへの経路が不良であるとみなすことかを決定しなければならない。
【0004】
調査処理はライブ・システム(すなわち再初期化されているシステム)上でしばしば行われ、ネットワーク輻湊など他の変数を導入することによって処理を複雑にする傾向がある。したがって、応答の遅延または欠落の原因は、一般に分からない。すなわち、パケットが無くなったのか、誤って経路指定されたのか、または他のネットワーク・トラヒックによって遅延したのか、あるいはエクスプローラとターゲット要素(すなわち初期化すべきエレメント)の間の経路に不良があるのか、またはターゲット要素自体が不良なのかが分からない。
【0005】
以前は、再試行プロトコルが使用され、事前定義された時間だけ待ち、あきらめる前にそのパケットを設定された回数再送信する(毎回、事前定義された時間だけ応答を待つ)。しかしこの手法は、いくつかの理由でエラーを起こしやすい。第1に、ネットワークが単純に輻湊する場合、エクスプローラは、処理しなければならないいくつかの応答を最終的には得る。これらの応答は、エクスプローラがかなり進んだ後まで戻らない可能性があり、この時点でエクスプローラは、前の調査の重複としてこれらの応答を区別しそれらの応答を廃棄することができなければならない。第2に、障害がターゲット要素内にはなくて、エクスプローラとターゲット要素の間のどこかにある可能性がある。この手法は、この2つの間の区別ができない。第3に、ターゲットがビジーのためそのターゲットがパケットを廃棄した可能性があり、元の直後に再試行が到着する場合、そのターゲットもまた廃棄される可能性がある。
【0006】
【発明が解決しようとする課題】
したがって、以前の再試行プロトコルの欠陥を克服する調査機能が依然として求められている。特に、ネットワークの調査中に遭遇する1つまたは複数の故障を引き起こした1つまたは複数の不良ネットワーク構成要素を正確に識別する手法が求められている。
【0007】
【課題を解決するための手段】
少なくともネットワークの一部を調査する方法の提供によって、従来技術の欠点が克服され他の利点が提供される。本方法は例えば、ネットワークの選択されたネットワーク要素に、そのネットワークの他の通信のために使用可能なネットワークの通信経路を使用してメッセージを送信してその選択されたネットワーク要素を調査するステップと、およびその選択されたネットワーク要素がメッセージに応答しないことに応答して、ネットワークの不良ネットワーク構成要素を決定するステップとを含む。
【0008】
さらに進んだ一実施形態では、ネットワークを調査する方法が提供される。本方法は例えば、1つまたは複数の通信経路を含むネットワークの1つまたは複数のネットワーク要素を調査することであって、前記調査が1つまたは複数の通信経路の少なくとも1つの通信経路を使用して前記1つまたは複数のネットワーク要素を調査するステップ、および前記調査中に直面した故障に応答して不良ネットワーク構成要素を識別するステップ、を含む。
【0009】
本発明の一態様のさらに進んだ実施形態では、ネットワークを調査する一方法が提供される。本方法は例えば、子ネットワーク要素にメッセージを送って前記子ネットワーク要素を調査するステップと、前記子ネットワーク要素が応答していないと考えられるときに前記子ネットワーク要素の親ネットワーク要素にメッセージを送るステップと、前記親ネットワーク要素が応答して前記子ネットワーク要素が応答しないと考えられるとき、前記親ネットワーク要素と前記子ネットワーク要素の間のリンクが不良であると決定するステップと、前記親ネットワーク要素が応答しないと考えられるときに前記親ネットワーク要素の親を選択して前記親にメッセージを送るステップと、前記選択された親が応答しないと考えられるときに前記選択を1回または複数回繰り返し、それぞれの反復と共に前記選択された親が前記親ネットワーク要素になり、前記新しく選択された親が前記親ネットワーク要素の親であるステップと、および前記親が応答してその親ネットワーク要素が応答しないと考えられるときに前記親ネットワーク要素とその親の間のリンクが不良であると示すステップと、を含む。
【0010】
上記要約した方法に対応するシステムおよびコンピュータ・プログラム製品もまた述べ、本明細書に請求する。
【0011】
有利なことに、ネットワークの調査中に直面する1つまたは複数の故障をもたらす不良ネットワーク構成要素を正確かつ具体的に識別するネットワーク調査機能が提供される。
【0012】
【発明の実施の形態】
本発明の一態様にしたがって、ネットワークの1つまたは複数のエレメントを初期化するネットワーク調査が実行される。ネットワーク調査中に、故障に直面した場合、その故障の原因が正確に識別される。特に、一例では、調査中に故障に直面した場合、前記故障をもたらした不良コンポーネントに関する決定がなされる。実施例としては、不良コンポーネントは、2つのネットワーク要素の間の接続またはリンク、またはネットワーク要素自体あるいはその両方の可能性がある。
【0013】
本発明の諸態様を組込み使用する通信環境の一実施形態を図1に示す。一例として、通信環境は、例えば複数のLANゲート104を介して互いに結合される複数のフレーム102を含む分散コンピューティング環境100である。フレーム102およびLANゲート104を以下に詳細に述べる。
【0014】
一例として、分散コンピューティング環境100は、それぞれが複数の処理ノード106を含む8つのフレームを含む。一例では、各フレームが、16の処理ノード(別称プロセッサ)を含む。各処理ノードは例えば、Unix(R)に基づくオペレーティング・システムであるAIXを実行するRISC/6000コンピュータである。1フレーム内の各処理ノードは、例えば少なくとも1つの内部LAN接続を介して前記フレームの他の処理ノードに結合される。さらに、各フレームは、LANゲート104を介して他のフレームに結合される。
【0015】
実施例として、各LANゲート104は、RISC/6000コンピュータ、LANに対する任意のコンピュータ・ネットワーク接続、またはネットワーク・ルータのいずれかを含む。しかし、これらは実施例に過ぎない。他のタイプのLANゲートがあること、およびフレームを互いに結合するために他の機構もまた使用できることが、当業者には自明であろう。
【0016】
一実施形態では、LANゲート104に、コンピューティング環境100の動作を制御する制御ワークステーション(CWS)108が結合される。制御ワークステーションは、直接アクセス記憶装置(DASD)などの少なくとも1つの記憶媒体110を自分に結合する。記憶媒体は、一例ではシステム共用ディスクと称し、1つまたは複数のシステム・データ・リポジトリ(SDR)ファイルを格納するために使用される。SDRファイルは、環境内にある1組のノードおよびそれらの構成、ならびにノード106のそれぞれに対する1つまたは複数のリソースおよびオブジェクト定義などの情報を含む。1つまたは複数のノード106は、コンピューティング環境100によって処理されるデータを格納するDASD装置112もまた含む。
【0017】
一実施形態では、各フレーム内の諸ノードは、前記フレーム内に配置されるIBM Scalable POWERparallel switch(SPS)114に結合される。各SPSスイッチは、バス116によって他のフレームの1つまたは複数の近隣SPSスイッチ114に結合される。このスイッチは、例えば諸ノード106の一方から他方にメッセージおよびデータを送るために使用される。
【0018】
図1の分散コンピューティング環境は一例に過ぎない。8より多いまたは少ないフレーム、あるいはフレーム毎に16より多いまたは少ないノードを有することが可能である。さらに、処理ノードはAIXを実行するRISC/6000コンピュータでなくてもよい。処理ノードのいくつかまたはすべては、異なるタイプのコンピュータまたは異なるオペレーティング・システムあるいはその両方を含むことができる。さらに、他の実施形態では、1つまたは複数のフレームがSPSスイッチを含まない。その場合、スイッチを有しないフレームの各ノードは、他のフレームのスイッチに結合される(または1つまたは複数のノードはどのスイッチにも接続されない)。さらに、本発明の諸態様は、他のタイプの通信環境で有用である。これらの変形形態のすべておよびその他は、請求される発明の一部と考えられる。
【0019】
SPSスイッチ114に関するさらに詳細を、図2を参照しながら述べる。図2には、一例として、それぞれが複数のノード106に結合された4つのSPSスイッチ114を示す。この一例では、各SPSスイッチがフレームの16のノードに結合される。さらに、各SPSスイッチは、1つまたは複数の他のSPSスイッチに結合される。ここに示す実施例では、各スイッチが3つの他のスイッチに結合される。しかし、これは一例に過ぎない。スイッチは、3つより多いまたは少ないスイッチ(0でもよい)に結合することができる。さらに、各スイッチは、16より多いまたは少ないノードに結合することができる。
【0020】
各スイッチは、1つまたは複数のスイッチング要素200を含み、各スイッチング要素は、1つまたは複数の接続(またはリンク)202を含む。各接続は、ノード(別称、端点)または他のスイッチング要素に対するものである。一例として、各スイッチは8つのスイッチング要素を有し、各スイッチング要素は、そこから8つの接続を有する。再び、これは一例に過ぎない。スイッチは、8より多いまたは少ないスイッチング要素およびエレメント毎に8より多いまたは少ない接続を有することができる。
【0021】
本発明の一態様にしたがって、ネットワーク調査が実行され、この調査は、個々のスイッチング要素など、ネットワークのエレメントを調査することおよび初期化することを含む。調査中に1つまたは複数の故障に直面する可能性がある。そのような故障に直面した場合、どの特定のネットワーク構成要素(例えば、ノード、スイッチング要素などのネットワーク要素、または接続あるいはその両方)が不良であるかに関する決定がなされる。この決定は、本発明の一態様にしたがって不良コンポーネントを見つける体系的な手法を使用することによってなされる。
【0022】
一例として、ネットワーク300(図3)が、少なくとも1つのエクスプローラ・ノード304に結合された複数のネットワーク要素302を含むと仮定する。エクスプローラ・ノードは、調査を担当するために選択されたコンピューティング環境のノードの1つである。
【0023】
一例では、エクスプローラ・ノード304が、接続またはリンク306を介してネットワーク要素1に結合され、そのネットワーク要素は、1つまたは複数の他の接続306を介して1つまたは複数の他のネットワーク要素(例えばネットワーク要素5、6、7および8)に結合され、そのエレメントが今度は、1つまたは複数の他のネットワーク要素に接続される、など。一例として、エクスプローラ・ノードと他のノードである端点の間の各ネットワーク要素は、スイッチング要素である。しかしこれは一例に過ぎない。ネットワーク要素は、スイッチング要素以外でよく、端点が他のノードである必要はない。
【0024】
エクスプローラ・ノードは、ネットワークを介して定義された経路経由でパケットを送ることによって、ネットワークの少なくとも一部の調査を起動する。例えば、経路は、エクスプローラ・ノード304からネットワーク要素1、ネットワーク要素1からネットワーク要素5、ネットワーク要素5からネットワーク要素9、ネットワーク要素9からネットワーク要素13、ネットワーク要素13から端点(例えば、ノード)でよい。(これは、図2内の強調された経路に対応し、一例として図3に提示される。)各ネットワーク要素がパケットを受け取るとき、そのエレメントはエクスプローラに応答する。エレメントが応答し損なった場合、エクスプローラ・ノードは、どのネットワーク構成要素(すなわち、ネットワーク接続またはネットワーク要素あるいはその両方)がそのネットワーク要素に応答させなくしているかを正確に決定するために効率的かつ決定的手法を使用する。
【0025】
この決定的調査機能に関連付けられたロジックの一実施形態を、図4を参照しながら述べる。図4のロジックは、例えばエクスプローラ・ノードによって実行される。
【0026】
一実施形態において図4のロジックは、子ネットワーク要素(すなわち、ネットワーク要素5、9、13など、エクスプローラ・ノード以外の親ネットワーク要素を有するネットワーク要素)が、初期化されていると仮定する。初期化されているネットワーク要素が、エクスプローラ・ノードからパケットを受け取る第1エレメント(例えば、ネットワーク要素1)である場合、(他の実施形態で使用される可能性はあるが)この手順にしたがう必要はない。代わりに、パケットがX(例えば、3)回送られる単純な再試行手順が使用される。再試行制限以内に応答を受け取らない場合、不良ネットワーク構成要素は、エクスプローラ・ノードとネットワーク要素1の間の接続、またはネットワーク要素1あるいはその両方であると仮定される。
【0027】
図4を参照すると、最初に子ネットワーク要素を選択するために幅優先検索(breadth-first-search)が実行される(ステップ400)。知られているように、幅優先検索は、ネットワークをレベルに分割し、1度に各レベルを処理する。したがって、エクスプローラ(例えばネットワーク要素1)に結合された第1エレメントの検索が行われ、次いでネットワーク要素1が接続されるエレメントなどの調査が実行される。
【0028】
この特定の実施例では、幅優先検索がネットワーク要素5(図3)を初期化すべき子エレメントとして選択したと仮定する(この実施形態では、ネットワーク要素1が既に正常に初期化されたと仮定する)。
【0029】
子ネットワーク要素の選択後に、エクスプローラ・ノードから選択された子ネットワーク要素に初期化メッセージが送られる(ステップ402)。初期化メッセージは例えば、子ネットワーク要素を構成するために使用される情報を含む。メッセージは、エクスプローラ・ノードから選択された子ネットワーク要素に特定の経路(例えば、エクスプローラ・ノードからネットワーク要素1を経てネットワーク要素5)を取り、その経路はエクスプローラ・ノードによって記憶される。例えば、この経路の標示は、エクスプローラ・ノードによって格納される。
【0030】
その後、エクスプローラ・ノードが事前定義された時間(例えば、300マイクロ秒)内に選択された子ネットワーク要素から応答を受け取ったかどうかに関する決定がなされる(照会404)。事前定義された時間内に応答を受け取った場合、選択された子ネットワーク要素(すなわち、ターゲット要素)およびそのエレメントへの経路は適切に機能している。しかし、事前定義された時間内に応答がない場合、再試行しきい値を超過したかどうかに関する追加の決定がなされる(照会406)。すなわち、一例では、子ネットワーク要素に選択された回数(例えば、3回)だけ初期化メッセージを送ってから、ネットワーク内に故障があると考える。
【0031】
再試行しきい値が超過した場合、親/子接続が不良とマークされる(ステップ408)。例えば、エクスプローラ・ノードは、調査の一部として、ネットワーク・トポロジのデータ構造(例えば、テーブル)をメンテナンスし、親/子間のリンク(例えば、ネットワーク要素1とネットワーク要素5の間の接続)が不良であるという標示をこの構造内に作る。子エレメント自体が機能していない可能性があるが、この実施形態では、この子に対する複数のリンクが故障していない限りこの子エレメント自体が不良とは考えられない(他の実施形態では、これは異なってよい、すなわち子またはリンクあるいはその両方が不良と考えることができる)。したがって上記実施形態では、不良と決定されるネットワーク構成要素は、少なくとも親と子の間のネットワーク接続である。リンク作成後に、処理はステップ400で続く。
【0032】
照会406に戻ると、再試行しきい値を超過しなかった場合、エクスプローラ・ノードから選択された子ネットワーク要素の親(例えば、ネットワーク要素1)に読取り状態(read-status)メッセージが送られる(ステップ410)。このメッセージは、親エレメントにその子エレメントがあるかどうかを尋ねるメッセージに応答する要求である。
【0033】
次いで、エクスプローラ・ノードは応答を待ち、事前定義された時間(例えば、300マイクロ秒)内に応答を受け取った場合(照会412)、その子ネットワーク要素に初期化メッセージがもう1度送られる(ステップ402)。しかし、事前定義された時間内に応答を受け取らない場合、エクスプローラ・ノードは、エクスプローラ・ノード以外の親があると仮定して、その親の親に逆行する(ステップ414)。(調査がエクスプローラ・ノードに逆行した場合、不良ネットワーク構成要素は、エクスプローラ・ノードとその直接の子との間の接続または直接の子、あるいはその両方である。)エクスプローラ・ノードが逆行するとき、そのエクスプローラ・ノードは、その子ネットワーク要素の親の親ネットワーク要素に読取り状態メッセージを送る。
【0034】
もう1度、事前定義された時間内にこのメッセージに対する応答をエクスプローラ・ノードが受け取ったかどうかに関する決定がなされる(照会416)。そのような応答を受け取っていない場合、上述のように、処理はステップ414で続く。
【0035】
しかし、タイムアウト期間内に応答を受け取った場合、前の親/子リンクは不良とマークされ(ステップ418)、処理は、ステップ400で続いて、初期化すべき次の子ネットワーク要素を選択する。
【0036】
上記の一例は次の通りである。エクスプローラがネットワーク要素9(図3)を初期化しようとしていると仮定する。ロジックを進んで、タイムアウト期間内に応答を受け取らないで(照会404)、再試行しきい値は超過していない(照会406)と仮定する。同様に、ネットワーク要素5に送った読取り状態メッセージに対する応答も、タイムアウト期間内に受け取らなかったと仮定する。したがって、ネットワーク要素5の親であるネットワーク要素1に読取り状態メッセージが送られる。このメッセージに対する応答は受け取ったと仮定する。その場合、ネットワーク要素1とネットワーク要素5の間のリンクが悪いとマークされる。
【0037】
この実施形態では、リンクが不良とマークされるが、特定のネットワーク要素にどの経路からも達することができないと判断された場合、その特定のエレメントが不良と考えられる。
【0038】
本明細書に述べたネットワーク調査機能は、ネットワーク(すなわち、ネットワークの通信経路)を有利に使用して、不良ネットワーク構成要素を決定的かつ正確に識別する。すなわち、一実施形態では、調査機能はネットワークの通常の(未使用の)通信経路を使用する。調査機能は、不良ネットワーク構成要素を決定するために特別なまたは別のサービス・経路を必要としない。
【0039】
本明細書で使用するように、ネットワーク構成要素は、ネットワーク要素(例えば、ノード、スイッチング要素、など)またはネットワーク接続あるいはその両方である。一実施形態では、接続自体は機能しているがその接続に接続されたエレメントが悪い場合でさえ、本明細書では接続が不良と考えられる。
【0040】
有利なことに、本発明の1つまたは複数の態様の調査機能は、ネットワーク内のどこに故障が発生したかを正確に決定するためにネットワーク要素を再試行する決定的機構を含む。一態様では、この調査機能は、輻湊、リンク故障、エレメント故障間の区別をする機能で、故障の分離を可能にする。
【0041】
不良コンポーネントを決定するために、この決定的機能は、ターゲット要素を初期化する試みにおいて使用されたのと同じ経路を使用する。したがって、再試行パケット(例えば、メッセージ)は、輻湊または他のネットワーク遅延による元のメッセージに追い付くことができない。
【0042】
本発明は、例えばコンピュータ使用可能媒体を有する製品(例えば、1つまたは複数のコンピュータ・プログラム製品)内に含めることができる。この媒体はその中に、例えば本発明の機能を提供し容易にするコンピュータ可読プログラム・コード手段を組み入れる。この製品は、コンピュータ・システムの一部として含めるかまたは別に販売することができる。
【0043】
さらに、本発明の機能を実行する、マシンによって実行可能な命令からなる少なくとも1つのプログラムを有形に組み入れる、マシンによって読取り可能な少なくとも1つのプログラム記憶装置を提供することができる。
【0044】
ここに示した流れ図は単なる例である。本発明の精神から逸脱することなく、ここに述べたこれらの図またはステップ(または動作)に対する多数の変形形態があってよい。例えば、異なる順序でステップを実行することができ、あるいはステップを追加、削除、または修正することができる。これらの変形形態のすべては、請求される発明の一部と考えられる。
【0045】
好ましい諸実施形態を本明細書に詳細に示し述べたが、本発明の精神から逸脱することなく、様々な修正、追加、代用等を行うことができることは、当業者には自明であり、したがってこれらは、次の請求の範囲内に定義する本発明の範囲内であると考えられる。
【0046】
まとめとして、本発明の構成に関して以下の事項を開示する。
【0047】
(1)ネットワークの少なくとも一部を調査する方法であって、
ネットワークの他の通信のために使用可能なネットワークの通信経路を使用し、前記ネットワークの選択されたネットワーク要素にメッセージを送信して前記選択されたネットワーク要素を調査するステップと
前記選択されたネットワーク要素が前記メッセージに反応しないことに応答して、前記ネットワークの不良ネットワーク構成要素を決定するステップと
を含む方法。
(2)前記不良ネットワーク構成要素が、前記メッセージを送る際に使用された通信経路中にある、上記(1)に記載の方法。
(3)前記不良ネットワーク構成要素が、前記選択されたネットワーク要素、および前記選択されたネットワーク要素とその親ネットワーク要素の間の接続以外である、上記(2)に記載の方法。
(4)前記不良ネットワーク構成要素が、前記選択されたネットワーク要素、および前記選択されたネットワーク要素とその親ネットワーク要素の接続の少なくとも1つを含む、上記(1)に記載の方法。
(5)前記決定するステップが、
前記通信経路内の1つまたは複数のネットワーク要素の、前記選択されたネットワーク要素に対する応答性をチェックするステップと
前記チェックに基づいて前記不良ネットワーク構成要素を識別するステップと、
を含む、上記(1)に記載の方法。
(6)前記チェックが、事前定義された順序で実行される、上記(5)に記載の方法。
(7)事前定義された順序での前記チェックが、前記選択されたネットワーク要素から通信経路を経て逆行するかのように1つまたは複数のネットワーク要素をチェックすることを含む、上記(6)に記載の方法。
(8)前記チェックが、前記1つまたは複数のネットワーク要素の1つのネットワーク要素が応答するまでチェックすることを含む、上記(5)に記載の方法。
(9)前記不良ネットワーク構成要素が、応答する1つのネットワーク要素とその子ネットワーク要素の間の接続を含む、上記(8)に記載の方法。
(10)ネットワークを調査する方法であって、
1つまたは複数の通信経路を備えるネットワークの1つまたは複数のネットワーク要素を調査し、前記1つまたは複数の通信経路の少なくとも1つの通信経路を使用して、前記1つまたは複数のネットワーク要素を調査するステップと、
前記調査中に直面した故障に応答して、不良ネットワーク構成要素を識別するステップと、
を含む方法。
(11)前記故障が、調査の目標にされた応答しないネットワーク要素を含む、上記(10)に記載の方法。
(12)前記識別するステップが、
前記応答しないネットワーク要素に対する通信経路内の1つまたは複数のネットワーク要素の応答性をチェックするステップと、
前記チェックに基づいて、前記不良ネットワーク構成要素を識別するステップと、
を含む、上記(11)に記載の方法。
(13)前記チェックするステップが、事前定義された順序で実行される、上記(12に記載の方法。
(14)事前定義された順序での前記チェックするステップが、応答しないネットワーク要素から通信経路を経て逆行するかのように1つまたは複数のネットワーク要素をチェックするステップを含む、上記(13)に記載の方法。
(15)前記識別するステップが、前記不良ネットワーク構成要素を識別するために前記ネットワークの1つまたは複数のネットワーク要素を体系的に再試行するステップを含む、上記(10)に記載の方法。
(16)ネットワークを調査する方法であって、
子ネットワーク要素を調査するために前記子ネットワーク要素にメッセージを送るステップと、
前記子ネットワーク要素が応答しないと考えられるときに、前記子ネットワーク要素の親ネットワーク要素にメッセージを送るステップと、
前記親ネットワーク要素が応答して、前記子ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素と前記子ネットワーク要素の間のリンクが不良であると決定するステップと、
前記親ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素の親を選択し前記親にメッセージを送るステップと、
前記選択された親が応答しないと考えられるときに前記選択を1回または複数回繰り返し、それぞれの反復と共に、前記選択された親が前記親ネットワーク要素になり、前記新しく選択された親が前記親ネットワーク要素の親であるステップと、
前記親が応答して、その親ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素とその親の間のリンクが不良であると示すステップと、
を含む方法。
(17)ネットワークの少なくとも一部を調査するシステムであって、
前記選択されたネットワーク要素を調査するためにネットワークの選択されたネットワーク要素にメッセージを送り、前記ネットワークの他の通信のために使用可能な前記ネットワークの通信経路を使用する手段と、
前記選択されたネットワーク要素が前記メッセージに応答しないことに応答して、前記ネットワークの不良ネットワーク構成要素を決定する手段
とを備えるシステム。
(18)前記不良ネットワーク構成要素が、前記メッセージを送る際に使用された通信経路中にある、上記(17)に記載のシステム。
(19)前記不良ネットワーク構成要素が、前記選択されたネットワーク要素、および前記選択されたネットワーク要素とその親ネットワーク要素の間の接続以外である、上記(18)に記載のシステム。
(20)前記不良ネットワーク構成要素が、前記選択されたネットワーク要素、および前記選択されたネットワーク要素とその親ネットワーク要素の間の接続の少なくとも1つを含む、上記(17)に記載のシステム。
(21)前記決定する手段が、
前記選択されたネットワーク要素への通信経路内の1つまたは複数のネットワーク要素の応答性をチェックする手段と、
前記チェックに基づいて、前記不良ネットワーク構成要素を識別する手段、
とを備える、上記(17)に記載のシステム。
(22)前記チェックが、事前定義された順序で実行される、上記(21)に記載のシステム。
(23)事前定義された順序でチェックする前記手段が、前記選択されたネットワーク要素から前記通信経路を経て逆行するかのように1つまたは複数のネットワーク要素をチェックする手段を備える、上記(22)に記載のシステム。
(24)前記チェックする手段が、前記1つまたは複数のネットワーク要素の1つのネットワーク要素が応答するまでチェックする手段を備える、上記(21)に記載のシステム。
(25)前記不良ネットワーク構成要素が、応答する1つのネットワーク要素とその子ネットワーク要素の間の接続を含む、上記(24)に記載のシステム。
(26)ネットワークを調査するシステムであって、
1つまたは複数の通信経路を備えるネットワークの1つまたは複数のネットワーク要素を調査し、前記1つまたは複数のネットワーク要素を調査するために前記1つまたは複数の通信経路の少なくとも1つの通信経路を使用する手段と、
前記調査中に直面した故障に応答して、不良ネットワーク構成要素を識別する手段、
とを備えるシステム。
(27)前記故障が、調査の目標となった応答しないネットワーク要素を含む、上記(26)に記載のシステム。
(28)前記識別する手段が、
前記応答しないネットワーク要素への通信経路内の1つまたは複数のネットワーク要素の応答性をチェックする手段と、
前記チェックに基づいて、前記不良ネットワーク構成要素を識別する手段、
とを備える、上記(27)に記載のシステム。
(29)前記チェックが、事前定義された順序で実行される、上記(28)に記載のシステム。
(30)事前定義された順序でチェックする前記手段が、前記応答しないネットワーク要素から通信経路を経て逆行するかのように1つまたは複数のネットワーク要素をチェックする手段を備える、上記(29)に記載のシステム。
(31)前記識別する手段が、前記不良ネットワーク構成要素を識別するために前記ネットワークの1つまたは複数のネットワーク要素を体系的に再試行する手段を備える、上記(26)に記載のシステム。
(32)ネットワークを調査するシステムであって、
子ネットワーク要素を調査するために前記子ネットワーク要素にメッセージを送る手段と、
前記子ネットワーク要素が応答しないと考えられるときに、前記子ネットワーク要素の親ネットワーク要素にメッセージを送る手段と、
前記親ネットワーク要素が応答して前記子ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素と前記子ネットワーク要素の間のリンクが不良であると決定する手段と、
前記親ネットワーク要素が応答しないと考えられるときに前記親ネットワーク要素の親を選択し、前記親にメッセージを送る手段と、
前記選択された親が応答しないと考えられるときに、前記選択を1回または複数回繰り返す手段であって、それぞれの反復と共に、前記選択された親が前記親ネットワーク要素になり、前記新しく選択された親が前記親ネットワーク要素の親である手段と、
前記親が応答してその親ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素とその親の間のリンクが不良であると示す手段と、
を備えるシステム。
(33)ネットワークの少なくとも一部を調査するシステムであって、
前記選択されたネットワーク要素を調査するために、ネットワークの選択されたネットワーク要素に送られ、前記ネットワークの他の通信のために使用可能なネットワークの通信経路を使用するメッセージと、
前記選択されたネットワーク要素が前記メッセージに応答しないことに応答して、前記ネットワークの不良ネットワーク構成要素を決定するためのエクスプローラ・ノードと、
を備えるシステム。
(34)ネットワークを調査するシステムにおいて、
1つまたは複数の通信経路を備える調査すべきネットワークの1つまたは複数のネットワーク要素であって、前記1つまたは複数のネットワーク要素の調査が、前記1つまたは複数のネットワーク要素を調査するために、前記1つまたは複数の通信経路の少なくとも1つの通信経路を使用するネットワーク要素と、
前記調査中に直面した故障に応答して、不良ネットワーク構成要素を識別する1つまたは複数のネットワーク要素に結合されたエクスプローラ・ノードと、
を備えるシステム。
(35)ネットワークを調査するシステムであって、
子ネットワーク要素を調査するために前記子ネットワーク要素にメッセージを送ること、
前記子ネットワーク要素が応答しないと考えられるときに、前記子ネットワーク要素の親ネットワーク要素にメッセージを送ること、
前記親ネットワーク要素が応答して前記子ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素と前記子ネットワーク要素の間のリンクが不良であると決定すること、
前記親ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素の親を選択し前記親にメッセージを送ること、
前記選択された親が応答しないと考えられるときに前記選択を1回または複数回繰り返し、それぞれの反復と共に、前記選択された親が前記親ネットワーク要素になり、前記新しく選択された親が前記親ネットワーク要素の親であること、および
前記親が応答してその親ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素とその親の間のリンクが不良であると示すこと、
を実行する少なくとも1つのエクスプローラ・ノードを備えるシステム。
(36)ネットワークの少なくとも一部を調査する方法を実行するために、マシンによって実行可能な命令からなる少なくとも1つのプログラムを有形に実施する、マシンによって読取り可能な少なくとも1つのプログラム記憶装置であって、前記方法が、
ネットワークの他の通信のために使用可能なネットワークの通信経路を使用し、前記ネットワークの選択されたネットワーク要素にメッセージを送信して前記選択されたネットワーク要素を調査すること、および
前記選択されたネットワーク要素が前記メッセージに応答しないことに応答して、前記ネットワークの不良ネットワーク構成要素を決定すること、
を含む少なくとも1つのプログラム記憶装置。
(37)前記不良ネットワーク構成要素が、前記メッセージを送る際に使用された通信経路中にある、上記(36)に記載の少なくとも1つのプログラム記憶装置。
(38)前記不良ネットワーク構成要素が、前記選択されたネットワーク要素、および前記選択されたネットワーク要素とその親ネットワーク要素の間の接続以外である、上記(37)に記載の少なくとも1つのプログラム記憶装置。
(39)前記不良ネットワーク構成要素が、前記選択されたネットワーク要素、および前記選択されたネットワーク要素とその親ネットワーク要素の間の接続の少なくとも1つを含む、上記(36)に記載の少なくとも1つのプログラム記憶装置。
(40)前記決定することが、
前記選択されたネットワーク要素への通信経路内の1つまたは複数のネットワーク要素の応答性をチェックすること、および
前記チェックに基づいて、前記不良ネットワーク構成要素を識別すること、
を含む、上記(36)に記載の少なくとも1つのプログラム記憶装置。
(41)前記チェックが、事前定義された順序で実行される、上記(40)に記載の少なくとも1つのプログラム記憶装置。
(42)事前定義された順序での前記チェックが、前記選択されたネットワーク要素から前記通信経路を経て逆行するかのように1つまたは複数のネットワーク要素をチェックすることを含む、上記(41)に記載の少なくとも1つのプログラム記憶装置。
(43)前記チェックが、前記1つまたは複数のネットワーク要素の1つのネットワーク要素が応答するまでチェックすることを含む、上記(40)に記載の少なくとも1つのプログラム記憶装置。
(44)前記不良ネットワーク構成要素が、応答する前記1つのネットワーク要素とその子ネットワーク要素の間の接続を含む、上記(43)に記載の少なくとも1つのプログラム記憶装置。
(45)ネットワークを調査する方法を実行するために、マシンによって実行可能な命令からなる少なくとも1つのプログラムを有形に実施する、マシンによって読取り可能な少なくとも1つのプログラム記憶装置であって、前記方法が、
1つまたは複数の通信経路を備えるネットワークの1つまたは複数のネットワーク要素を調査し、前記1つまたは複数の通信経路の少なくとも1つの通信経路を使用して、前記1つまたは複数のネットワーク要素を調査すること、および
前記調査中に直面した故障に応答して、不良ネットワーク構成要素を識別すること、
を含む、少なくとも1つのプログラム記憶装置。
(46)前記故障が、調査の目標とされた応答しないネットワーク要素を含む、上記(45)に記載の少なくとも1つのプログラム記憶装置。
(47)前記識別が、
前記応答しないネットワーク要素への通信経路内の1つまたは複数のネットワーク要素の応答性をチェックすること、および
前記チェックに基づいて、前記不良ネットワーク構成要素を識別すること、
を含む、上記(46)に記載の少なくとも1つのプログラム記憶装置。
(48)前記チェックが、事前定義された順序で実行される、上記(47)に記載の少なくとも1つのプログラム記憶装置。
(49)事前定義された順序での前記チェックが、前記応答しないネットワーク要素から前記通信経路を経て逆行するかのように1つまたは複数のネットワーク要素をチェックすることを含む、上記(48)に記載の少なくとも1つのプログラム記憶装置。
(50)前記識別が、前記不良ネットワーク構成要素を識別するために前記ネットワークの1つまたは複数のネットワーク要素を体系的に再試行することを含む、上記(45)に記載の少なくとも1つのプログラム記憶装置。
(51)ネットワークを調査する方法を実行するために、マシンによって実行可能な命令からなる少なくとも1つのプログラムを有形に実施する、マシンによって読取り可能な少なくとも1つのプログラム記憶装置であって、前記方法が、
子ネットワーク要素にメッセージを送って前記子ネットワーク要素を調査すること、
前記子ネットワーク要素が応答しないと考えられるときに、前記子ネットワーク要素の親ネットワーク要素にメッセージを送ること、
前記親ネットワーク要素が応答して前記子ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素と前記子ネットワーク要素の間のリンクが不良であると決定すること、
前記親ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素の親を選択し前記親にメッセージを送ること、
前記選択された親が応答しないと考えられるときに前記選択を1回または複数回繰り返し、それぞれの反復と共に、前記選択された親が前記親ネットワーク要素になり、前記新しく選択された親が、前記親ネットワーク要素の親であること、および
前記親が応答してその親ネットワーク要素が応答しないと考えるときに、前記親ネットワーク要素とその親の間のリンクが不良であると示すこと、
を含む少なくとも1つのプログラム記憶装置。
【図面の簡単な説明】
【図1】本発明の1つまたは複数の態様を組込んで使用する通信環境の一実施形態を示す図である。
【図2】本発明の一態様による、図1の複数のノードに結合された複数のネットワーク要素の一実施形態を示す図である。
【図3】本発明の一態様による、エクスプローラ・ノードによって調査される複数のネットワーク要素を図示する一実施形態を示す図である。
【図4】本発明の一態様による、ネットワークを調査するエクスプローラ・ノードによって使用されるロジックの一実施形態を示す図である。
【符号の説明】
300 ネットワーク
302 ネットワーク要素
304 エクスプローラ・ノード
306 リンク

Claims (18)

  1. 分散コンピューティング環境において、ネットワークの少なくとも一部を調査する方法であって、前記分散コンピューティング環境は1つ又は複数のフレームを含み、前記フレームの夫々は複数の処理ノードを含み、前記フレームの夫々はスイッチを含み、前記スイッチはフレーム内の処理ノードの夫々に接続され、前記スイッチは他のスイッチと接続され、前記処理ノードのうちの一つが、前記調査を行う責任を担うエクスプローラ・ノードとして選択され、
    前記方法が、
    前記ネットワークの他の通信のために使用可能なネットワークの通信経路を使用し、前記エクスプローラ・ノードが、前記ネットワークの選択されたネットワーク要素を調査するために前記選択されたネットワーク要素にメッセージを送信するステップであって、前記ネットワーク要素は、処理ノード、スイッチング要素又はネットワーク接続である、前記送信するステップと、
    前記選択されたネットワーク要素が前記メッセージに反応しないことに応答して、前記エクスプローラ・ノードが、前記ネットワークの不良ネットワーク構成要素を決定するステップと
    を含み、
    前記決定するステップが、
    前記選択されたネットワーク要素への前記通信経路における1つまたは複数のネットワーク要素の応答性をチェックするステップであって、前記チェックするステップが、前記選択されたネットワーク要素からの通信経路を経て逆行するかのように1つまたは複数のネットワーク要素をチェックするステップを含むステップと、
    前記チェックに基づいて前記不良ネットワーク構成要素を識別するステップと
    を含む、方法。
  2. 前記不良ネットワーク構成要素が、前記メッセージを送る際に使用された通信経路中にある、請求項1に記載の方法。
  3. 前記不良ネットワーク構成要素が、前記選択されたネットワーク要素、および前記選択されたネットワーク要素とその親ネットワーク要素との間の接続以外である、請求項2に記載の方法。
  4. 前記不良ネットワーク構成要素が、前記選択されたネットワーク要素、および前記選択されたネットワーク要素とその親ネットワーク要素との間の接続の少なくとも1つを含む、請求項1に記載の方法。
  5. 前記チェックが、事前定義された順序で実行される、請求項1に記載の方法。
  6. 前記チェックが、前記1つまたは複数のネットワーク要素の1つのネットワーク要素が応答するまでチェックすることを含む、請求項1に記載の方法。
  7. 前記不良ネットワーク構成要素が、応答する1つのネットワーク要素とその子ネットワーク要素との間の接続を含む、請求項7に記載の方法。
  8. 分散コンピューティング環境において、ネットワークを調査する方法であって、前記分散コンピューティング環境は1つ又は複数のフレームを含み、前記フレームの夫々は複数の処理ノードを含み、前記フレームの夫々はスイッチを含み、前記スイッチはフレーム内の処理ノードの夫々に接続され、前記スイッチは他のスイッチと接続され、前記処理ノードのうちの一つが、前記調査を行う責任を担うエクスプローラ・ノードとして選択され、
    前記方法が、
    前記エクスプローラ・ノードが、1つまたは複数の通信経路を備えるネットワークの1つまたは複数のネットワーク要素を調査するステップであって、前記調査は、前記1つまたは複数の通信経路の少なくとも1つの通信経路を使用し、前記ネットワーク要素は、処理ノード、スイッチング要素又はネットワーク接続である、前記調査するステップと、
    前記エクスプローラ・ノードが、前記調査中に直面した故障に応答して、不良ネットワーク構成要素を識別するステップと
    を含み、
    前記識別するステップが、
    前記応答しないネットワーク要素への通信経路における1つまたは複数のネットワーク要素の応答性をチェックするステップであって、前記チェックするステップが、応答しないネットワーク要素からの通信経路を経て逆行するかのように1つまたは複数のネットワーク要素をチェックするステップを含むステップと、
    前記チェックに基づいて前記不良ネットワーク構成要素を識別するステップと、
    を含む、方法。
  9. 前記故障が、調査の目標にされた応答しないネットワーク要素を含む、請求項8に記載の方法。
  10. 前記チェックが、事前定義された順序で実行される、請求項8に記載の方法。
  11. 前記識別するステップが、前記不良ネットワーク構成要素を識別するために前記ネットワークの1つまたは複数のネットワーク要素を体系的に再試行するステップを含む、請求項8に記載の方法。
  12. 分散コンピューティング環境において、ネットワークを調査する方法であって、前記分散コンピューティング環境は1つ又は複数のフレームを含み、前記フレームの夫々は複数の処理ノードを含み、前記フレームの夫々はスイッチを含み、前記スイッチはフレーム内の処理ノードの夫々に接続され、前記スイッチは他のスイッチと接続され、前記処理ノードのうちの一つが、前記調査を行う責任を担うエクスプローラ・ノードとして選択され、
    前記方法が、
    前記エクスプローラ・ノードが、子ネットワーク要素を調査するために前記子ネットワーク要素にメッセージを送るステップであって、前記子ネットワーク要素は、処理ノード、スイッチング要素又はネットワーク接続である、前記子ネットワーク要素にメッセージを送るステップと、
    前記子ネットワーク要素が応答しないと考えられるときに、前記エクスプローラ・ノードが、前記子ネットワーク要素の親ネットワーク要素にメッセージを送るステップであって、前記親ネットワーク要素は、処理ノード、スイッチング要素又はネットワーク接続である、前記親ネットワーク要素にメッセージを送るステップと、
    前記親ネットワーク要素が応答して、前記子ネットワーク要素が応答しないと考えられるときに、前記エクスプローラ・ノードが、前記親ネットワーク要素と前記子ネットワーク要素との間のリンクが不良であると決定するステップと、
    前記親ネットワーク要素が応答しないと考えられるときに、前記エクスプローラ・ノードが、前記親ネットワーク要素の親を選択し、そして前記親にメッセージを送るステップと、
    前記選択された親が応答しないと考えられるときに、前記エクスプローラ・ノードが、前記選択を1回または複数回繰り返すステップであって、それぞれの反復と共に、前記選択された親が前記親ネットワーク要素になり、そして前記新しく選択された親が前記親ネットワーク要素の親である、前記繰り返すステップと、
    前記親が応答して、その親ネットワーク要素が応答しないと考えられるときに、前記エクスプローラ・ノードが、前記親ネットワーク要素とその親との間のリンクが不良であると示すステップと
    を含む方法。
  13. 分散コンピューティング環境において、ネットワークの少なくとも一部を調査するシステムであって、前記分散コンピューティング環境は1つ又は複数のフレームを含み、前記フレームの夫々は複数の処理ノードを含み、前記フレームの夫々はスイッチを含み、前記スイッチはフレーム内の処理ノードの夫々に接続され、前記スイッチは他のスイッチと接続され、前記処理ノードのうちの一つが、前記調査を行う責任を担うエクスプローラ・ノードとして選択され、
    前記エクスプローラ・ノードが、
    前記ネットワークの他の通信のために使用可能なネットワークの通信経路を使用し、前記ネットワークの選択されたネットワーク要素を調査するために前記選択されたネットワーク要素にメッセージを送信する手段であって、前記ネットワーク要素は、処理ノード、スイッチング要素又はネットワーク接続である、前記送信する手段と、
    前記選択されたネットワーク要素が前記メッセージに応答しないことに応答して、前記ネットワークの不良ネットワーク構成要素を決定する手段と
    とを含み、
    前記決定する手段が、
    前記選択されたネットワーク要素への前記通信経路における1つまたは複数のネットワーク要素の応答性をチェックする手段するであって、前記チェックする段が、前記選択されたネットワーク要素からの通信経路を経て逆行するかのように1つまたは複数のネットワーク要素をチェックする手段を含む、前記応答性をチェックする手段と、
    前記チェックに基づいて前記不良ネットワーク構成要素を識別する手段と
    を含む、システム。
  14. 分散コンピューティング環境において、ネットワークを調査するシステムであって、前記分散コンピューティング環境は1つ又は複数のフレームを含み、前記フレームの夫々は複数の処理ノードを含み、前記フレームの夫々はスイッチを含み、前記スイッチはフレーム内の処理ノードの夫々に接続され、前記スイッチは他のスイッチと接続され、前記処理ノードのうちの一つが、前記調査を行う責任を担うエクスプローラ・ノードとして選択され、
    前記エクスプローラ・ノードが、
    1つまたは複数の通信経路を備えるネットワークの1つまたは複数のネットワーク要素を調査する手段であって、前記調査は、前記1つまたは複数のネットワーク要素を調査するために前記1つまたは複数の通信経路の少なくとも1つの通信経路を使用し、前記ネットワーク要素は、処理ノード、スイッチング要素又はネットワーク接続である、前記調査する手段と、
    前記調査中に直面した故障に応答して、不良ネットワーク構成要素を識別する手段と
    を含み、
    前記識別する手段が、
    前記応答しないネットワーク要素への通信経路における1つまたは複数のネットワーク要素の応答性をチェックする手段であって、前記チェックする手段が、応答しないネットワーク要素からの通信経路を経て逆行するかのように1つまたは複数のネットワーク要素をチェックする手段を含む、前記応答性をチェックする手段と、
    前記チェックに基づいて前記不良ネットワーク構成要素を識別する手段と、
    を含む、システム。
  15. 分散コンピューティング環境において、ネットワークを調査するシステムであって、前記分散コンピューティング環境は1つ又は複数のフレームを含み、前記フレームの夫々は複数の処理ノードを含み、前記フレームの夫々はスイッチを含み、前記スイッチはフレーム内の処理ノードの夫々に接続され、前記スイッチは他のスイッチと接続され、前記処理ノードのうちの一つが、前記調査を行う責任を担うエクスプローラ・ノードとして選択され、
    前記エクスプローラ・ノードが、
    子ネットワーク要素を調査するために前記子ネットワーク要素にメッセージを送る手段であって、前記子ネットワーク要素は、処理ノード、スイッチング要素又はネットワーク接続である、前記子ネットワーク要素にメッセージを送る手段と、
    前記子ネットワーク要素が応答しないと考えられるときに、前記子ネットワーク要素の親ネットワーク要素にメッセージを送る手段であって、前記親ネットワーク要素は、処理ノード、スイッチング要素又はネットワーク接続である、前記親ネットワーク要素にメッセージを送る手段と、
    前記親ネットワーク要素が応答して前記子ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素と前記子ネットワーク要素の間のリンクが不良であると決定する手段と、
    前記親ネットワーク要素が応答しないと考えられるときに前記親ネットワーク要素の親を選択し、そして前記親にメッセージを送る手段と、
    前記選択された親が応答しないと考えられるときに、前記選択を1回または複数回繰り返す手段であって、それぞれの反復と共に、前記選択された親が前記親ネットワーク要素になり、そして前記新しく選択された親が前記親ネットワーク要素の親である、前記繰り返す手段と、
    前記親が応答して、その親ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素とその親との間のリンクが不良であると示す手段と
    を含むシステム。
  16. 分散コンピューティング環境において、ネットワークの少なくとも一部を調査する方法を実行するための少なくとも1つのプログラムであって、前記分散コンピューティング環境は1つ又は複数のフレームを含み、前記フレームの夫々は複数の処理ノードを含み、前記フレームの夫々はスイッチを含み、前記スイッチはフレーム内の処理ノードの夫々に接続され、前記スイッチは他のスイッチと接続され、前記処理ノードのうちの一つが、前記調査を行う責任を担うエクスプローラ・ノードとして選択され、
    前記エクスプローラ・ノードに、
    前記ネットワークの他の通信のために使用可能なネットワークの通信経路を使用し、前記ネットワークの選択されたネットワーク要素を調査するために前記選択されたネットワーク要素にメッセージを送信するステップであって、前記ネットワーク要素は、処理ノード、スイッチング要素又はネットワーク接続である、前記送信するステップと、
    前記選択されたネットワーク要素が前記メッセージに応答しないことに応答して、前記ネットワークの不良ネットワーク構成要素を決定するステップと、
    を実行させ、
    前記決定するステップが、
    前記選択されたネットワーク要素への前記通信経路における1つまたは複数のネットワーク要素の応答性をチェックするステップであって、前記チェックするステップが、前記選択されたネットワーク要素からの通信経路を経て逆行するかのように1つまたは複数のネットワーク要素をチェックするステップを含むステップと、
    前記チェックに基づいて前記不良ネットワーク構成要素を識別するステップと
    を含む、少なくとも1つのプログラム。
  17. 分散コンピューティング環境において、ネットワークを調査する方法を実行する少なくとも1つのプログラムであって、前記分散コンピューティング環境は1つ又は複数のフレームを含み、前記フレームの夫々は複数の処理ノードを含み、前記フレームの夫々はスイ ッチを含み、前記スイッチはフレーム内の処理ノードの夫々に接続され、前記スイッチは他のスイッチと接続され、前記処理ノードのうちの一つが、前記調査を行う責任を担うエクスプローラ・ノードとして選択され、
    前記エクスプローラ・ノードに、
    1つまたは複数の通信経路を備えるネットワークの1つまたは複数のネットワーク要素を調査するステップであって、前記調査は、前記1つまたは複数の通信経路の少なくとも1つの通信経路を使用し、前記ネットワーク要素は、処理ノード、スイッチング要素又はネットワーク接続である、前記調査するステップと、
    前記調査中に直面した故障に応答して、不良ネットワーク構成要素を識別するステップと
    を実行させ、
    前記識別するステップが、
    前記応答しないネットワーク要素への通信経路における1つまたは複数のネットワーク要素の応答性をチェックするステップであって、前記チェックするステップが、応答しないネットワーク要素からの通信経路を経て逆行するかのように1つまたは複数のネットワーク要素をチェックするステップを含むステップと、
    前記チェックに基づいて前記不良ネットワーク構成要素を識別するステップと
    を含む、少なくとも1つのプログラム。
  18. 分散コンピューティング環境において、ネットワークを調査する方法を実行する少なくとも1つのプログラムであって、前記分散コンピューティング環境は1つ又は複数のフレームを含み、前記フレームの夫々は複数の処理ノードを含み、前記フレームの夫々はスイッチを含み、前記スイッチはフレーム内の処理ノードの夫々に接続され、前記スイッチは他のスイッチと接続され、前記処理ノードのうちの一つが、前記調査を行う責任を担うエクスプローラ・ノードとして選択され、
    前記エクスプローラ・ノードに、
    子ネットワーク要素を調査するために前記子ネットワーク要素にメッセージを送るステップであって、前記子ネットワーク要素は、処理ノード、スイッチング要素又はネットワーク接続である、前記子ネットワーク要素にメッセージを送るステップと、
    前記子ネットワーク要素が応答しないと考えられるときに、前記子ネットワーク要素の親ネットワーク要素にメッセージを送るステップであって、前記親ネットワーク要素は、処理ノード、スイッチング要素又はネットワーク接続である、前記親ネットワーク要素にメッセージを送るステップと、
    前記親ネットワーク要素が応答して、前記子ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素と前記子ネットワーク要素との間のリンクが不良であると決定するステップと、
    前記親ネットワーク要素が応答しないと考えられるときに、前記親ネットワーク要素の親を選択し、そして前記親にメッセージを送るステップと、
    前記選択された親が応答しないと考えられるときに、前記選択を1回または複数回繰り返すステップであって、それぞれの反復と共に、前記選択された親が前記親ネットワーク要素になり、そして前記新しく選択された親が前記親ネットワーク要素の親である、前記繰り返すステップと、
    前記親が応答して、その親ネットワーク要素が応答しないと考えるときに、前記親ネットワーク要素とその親との間のリンクが不良であると示すステップと
    を実行させる、少なくとも1つのプログラム。
JP2002206417A 2001-07-17 2002-07-16 ネットワーク調査中に不良ネットワーク構成要素を識別する方法 Expired - Fee Related JP3880477B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/907,422 US7200118B2 (en) 2001-07-17 2001-07-17 Identifying faulty network components during a network exploration
US09/907422 2001-07-17

Publications (2)

Publication Number Publication Date
JP2003134164A JP2003134164A (ja) 2003-05-09
JP3880477B2 true JP3880477B2 (ja) 2007-02-14

Family

ID=25424068

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002206417A Expired - Fee Related JP3880477B2 (ja) 2001-07-17 2002-07-16 ネットワーク調査中に不良ネットワーク構成要素を識別する方法

Country Status (2)

Country Link
US (2) US7200118B2 (ja)
JP (1) JP3880477B2 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7200118B2 (en) * 2001-07-17 2007-04-03 International Business Machines Corporation Identifying faulty network components during a network exploration
US8036104B2 (en) * 2002-07-15 2011-10-11 Qualcomm Incorporated Methods and apparatus for improving resiliency of communication networks
WO2004073264A1 (de) * 2003-02-14 2004-08-26 Siemens Aktiengesellschaft Zugangskontrolle für ein paketorientiertes netz unter berücksichtigung von resilience anforderungen
JP4401899B2 (ja) * 2004-08-26 2010-01-20 パイオニア株式会社 ノードの存在確認方法、及びノードの存在確認装置
WO2006049558A1 (en) * 2004-11-03 2006-05-11 Telefonaktiebolaget Lm Ericsson (Publ) Dynamic network managaement
ES2310806T3 (es) * 2005-08-24 2009-01-16 Abb Technology Ag Control de una red de comunicacion industrial.
US7787765B2 (en) * 2005-12-21 2010-08-31 International Business Machines Corporation Method and apparatus device for initializing an end-to-end link in a fiber optic communications system
US7826745B2 (en) 2005-12-21 2010-11-02 International Business Machines Corporation Open fiber control and loss of light propagation in time division multiplexed inter-system channel link
US8626251B2 (en) * 2006-01-31 2014-01-07 Niels Thybo Johansen Audio-visual system energy savings using a mesh network
US9166812B2 (en) 2006-01-31 2015-10-20 Sigma Designs, Inc. Home electrical device control within a wireless mesh network
US10326537B2 (en) 2006-01-31 2019-06-18 Silicon Laboratories Inc. Environmental change condition detection through antenna-based sensing of environmental change
US20070177576A1 (en) * 2006-01-31 2007-08-02 Niels Thybo Johansen Communicating metadata through a mesh network
US20150187209A1 (en) 2006-01-31 2015-07-02 Sigma Designs, Inc. Method and system for synchronization and remote control of controlling units
US8509790B2 (en) * 2006-01-31 2013-08-13 Tommas Jess Christensen Multi-speed mesh networks
US7680041B2 (en) * 2006-01-31 2010-03-16 Zensys A/S Node repair in a mesh network
US10277519B2 (en) 2006-01-31 2019-04-30 Silicon Laboratories Inc. Response time for a gateway connecting a lower bandwidth network with a higher speed network
US8194569B2 (en) 2006-01-31 2012-06-05 Sigma Designs, Inc. Static update controller enablement in a mesh network
US20080151824A1 (en) * 2006-01-31 2008-06-26 Peter Shorty Home electrical device control within a wireless mesh network
US20080151795A1 (en) * 2006-01-31 2008-06-26 Peter Shorty Home electrical device control within a wireless mesh network
US8300652B2 (en) 2006-01-31 2012-10-30 Sigma Designs, Inc. Dynamically enabling a secondary channel in a mesh network
US8223783B2 (en) * 2006-01-31 2012-07-17 Sigma Designs, Inc. Using battery-powered nodes in a mesh network
US20080154396A1 (en) * 2006-01-31 2008-06-26 Peter Shorty Home electrical device control within a wireless mesh network
US8219705B2 (en) * 2006-01-31 2012-07-10 Sigma Designs, Inc. Silent acknowledgement of routing in a mesh network
US8626178B2 (en) * 2006-01-31 2014-01-07 Niels Thybo Johansen Audio-visual system control using a mesh network
US8516444B2 (en) * 2006-02-23 2013-08-20 International Business Machines Corporation Debugging a high performance computing program
US7697443B2 (en) * 2006-04-13 2010-04-13 International Business Machines Corporation Locating hardware faults in a parallel computer
US20070242611A1 (en) * 2006-04-13 2007-10-18 Archer Charles J Computer Hardware Fault Diagnosis
US7646721B2 (en) * 2006-04-13 2010-01-12 International Business Machines Corporation Locating hardware faults in a data communications network of a parallel computer
US7796527B2 (en) * 2006-04-13 2010-09-14 International Business Machines Corporation Computer hardware fault administration
US9330230B2 (en) * 2007-04-19 2016-05-03 International Business Machines Corporation Validating a cabling topology in a distributed computing system
US7831866B2 (en) * 2007-08-02 2010-11-09 International Business Machines Corporation Link failure detection in a parallel computer
CN102342144B (zh) * 2009-03-04 2015-09-02 思科技术公司 检测网络设备中的过载
JP5229343B2 (ja) * 2011-03-15 2013-07-03 オムロン株式会社 接続異常検出方法、ネットワークシステムおよびマスター装置
US10637681B2 (en) 2014-03-13 2020-04-28 Silicon Laboratories Inc. Method and system for synchronization and remote control of controlling units
US10228995B2 (en) * 2016-07-28 2019-03-12 Hewlett Packard Enterprise Development Lp Last writers of datasets in storage array errors
US10637673B2 (en) 2016-12-12 2020-04-28 Silicon Laboratories Inc. Energy harvesting nodes in a mesh network
US11646955B2 (en) 2019-05-15 2023-05-09 AVAST Software s.r.o. System and method for providing consistent values in a faulty network environment

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1989011764A1 (en) * 1988-05-28 1989-11-30 Alcatel N.V. Communication system and switching element used therein
US5276440A (en) 1989-02-16 1994-01-04 International Business Machines Corporation Network device information exchange
US5371897A (en) 1991-08-27 1994-12-06 International Business Machines Corporation Method for requesting identification of a neighbor node in a data processing I/O system
JPH0637782A (ja) 1992-07-20 1994-02-10 Hitachi Cable Ltd ネットワーク装置
US5668800A (en) 1994-05-02 1997-09-16 International Business Machines Corporation Path testing in communications networks
US5682479A (en) * 1995-05-05 1997-10-28 Silicon Graphics, Inc. System and method for network exploration and access
US5563875A (en) 1995-07-10 1996-10-08 International Business Machines Corporation Wrap-around route testing in packet communications networks
US6199172B1 (en) 1996-02-06 2001-03-06 Cabletron Systems, Inc. Method and apparatus for testing the responsiveness of a network device
US5787074A (en) 1996-06-28 1998-07-28 Mci Communications Corporation System and method for monitoring point activation
US5832196A (en) 1996-06-28 1998-11-03 Mci Communications Corporation Dynamic restoration process for a telecommunications network
US5991264A (en) 1996-11-26 1999-11-23 Mci Communications Corporation Method and apparatus for isolating network failures by applying alarms to failure spans
CA2195893C (en) 1997-01-24 2005-10-04 John C. Burns Switched connections diagnostics in a signalling network
JPH114223A (ja) 1997-06-13 1999-01-06 Hitachi Ltd ネットワーク管理システムおよびデータ記憶媒体
US7200118B2 (en) * 2001-07-17 2007-04-03 International Business Machines Corporation Identifying faulty network components during a network exploration

Also Published As

Publication number Publication date
JP2003134164A (ja) 2003-05-09
US20060268685A1 (en) 2006-11-30
US7200118B2 (en) 2007-04-03
US20030016629A1 (en) 2003-01-23
US7907534B2 (en) 2011-03-15

Similar Documents

Publication Publication Date Title
JP3880477B2 (ja) ネットワーク調査中に不良ネットワーク構成要素を識別する方法
Chow et al. Hyperswitch network for the hypercube computer
US5684807A (en) Adaptive distributed system and method for fault tolerance
US6804712B1 (en) Identifying link failures in a network
EP1817855B1 (en) System and methods for detecting network failure
JP3752150B2 (ja) ストレージ・エリア・ネットワーク(san)内でのエラー処理方法及びデータ処理システム
JP3649580B2 (ja) 分散コンピュータ・システムのエラーを報告するシステム
CN111614505B (zh) 报文处理的方法和网关设备
JP2772367B2 (ja) データ・パケットを送信する方法およびデータ処理システム
JPH10326260A (ja) 分散コンピュータ・システムのハードウェア要素によりエラーを報告する方法
US8929200B2 (en) Communication device, communication system, and communication method
Bermudez et al. On the infiniband subnet discovery process
Chun et al. System area network mapping
Cisco Troubleshooting Bridging Connectivity
Cisco Troubleshooting Bridging Connectivity
Cisco Troubleshooting Bridging Connectivity
Cisco Troubleshooting Bridging Connectivity
Cisco Troubleshooting Bridging Connectivity
Cisco Troubleshooting Bridging Connectivity
Cisco Troubleshooting Bridging Connectivity
Cisco Troubleshooting Bridging Connectivity
Cisco Troubleshooting Bridging Connectivity
CN111130813B (zh) 一种基于网络的信息处理方法及电子设备
Cisco Troubleshooting Bridging Connectivity
Cisco Troubleshooting WAN Connectivity

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051118

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20051118

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20051118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20051118

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060830

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060830

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20061004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20061023

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20061023

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061107

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091117

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101117

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101117

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111117

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111117

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131117

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees