JP5173024B2 - 解除された接続の比率を判定することによりハードウェア障害を検出する方法 - Google Patents

解除された接続の比率を判定することによりハードウェア障害を検出する方法 Download PDF

Info

Publication number
JP5173024B2
JP5173024B2 JP2011524935A JP2011524935A JP5173024B2 JP 5173024 B2 JP5173024 B2 JP 5173024B2 JP 2011524935 A JP2011524935 A JP 2011524935A JP 2011524935 A JP2011524935 A JP 2011524935A JP 5173024 B2 JP5173024 B2 JP 5173024B2
Authority
JP
Japan
Prior art keywords
network
component
network component
failure
components
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011524935A
Other languages
English (en)
Other versions
JP2012501571A (ja
Inventor
トマス ノルリング,
オスカー ジィー,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2012501571A publication Critical patent/JP2012501571A/ja
Application granted granted Critical
Publication of JP5173024B2 publication Critical patent/JP5173024B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/091Measuring contribution of individual network components to actual service level

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、ハードウェアの障害を検出する方法に関し、限定することなく更に詳細に述べると、ネットワーク内のハードウェアの障害を検出する方法に関する。
障害検出は、ネットワークやネットワークに似たシステムにおける共通の課題である。
図1は、その様なシステム10の例である。システム10は、第1の種別の複数の第1の構成要素12a〜12n、第2の種別の複数の第2の構成要素14a〜14n、第3の種別の複数の第3の構成要素16a〜16nといった、3つの異なる種別の構成要素を含んでいる。
例示的なシステム10の運用において、各種別の構成要素は、その機能として、特定のタスクの実行を要求される。図1の実線によってその例が示されている。第1の構成要素12aはタスクを実行し、構成要素14cのための出力を生成している。次に、構成要素14cは、タスクを実行し、構成要素16bのための出力を生成している。この様に、これら3つの構成要素12a、14c、16b間にパスが形成される。
同じ種類の構成要素を2つ以上使用する機能パスが確立される場合もあり得る。例えば、構成要素12a、14c、14d及び16b間でパスが確立され得る(図1には図示せず。)。
このシステム10の利点は、複数種別の複数の構成要素が、任意に選択した様々なパスを可能にすることである。図1には、構成要素12d、14b、16aを使用する他のパスを、点線で示している。実際には、構成要素間のパスは、これら構成要素の最適な利用のために動的に選択される。
その様なシステムの例として、マルチ標準基地局がある。その様な基地局において、ハードウェアは、各標準のために共用され、論理リソース間に強い関係はない。代わりに、リソース間の接続が動的に確立され、特定の機能の処理が完了すると、接続は開放される。
その様な動的なハードウェア配分での問題は障害検出である。図1の点線を例にすると、構成要素14bが障害を起こしている場合、構成要素12d、14b、16aで表されるパスの全機能が失われる。システムのユーザは、パスのどの構成要素が障害を起こしているかといった、パスを確立するための情報を持たない。
1つの障害となった構成要素を含むシステムは、障害となった構成要素を、機能パスにどの様な頻度で選択するかに応じた不安定な障害の挙動を示し、障害となった構成要素を正確に特定することは困難である。
本発明の第1の側面によると、第1のネットワーク構成要素種別の複数の第1のネットワーク構成要素と、第2のネットワーク構成要素種別の複数の第2のネットワーク構成要素とを少なくとも有するネットワークにおける、障害を起こしているネットワーク構成要素を検出する方法が提供される。その方法は、
a)複数の第1のネットワーク構成要素の1つを選択し、複数の第2のネットワーク構成要素の1つを選択するステップと、
b)選択した第1のネットワーク構成要素及び選択した第2のネットワーク構成要素間の接続の設定を試みるステップと、
c)更に選択した第1のネットワーク構成要素及び第2のネットワーク構成要素に対し、ステップa)及びb)を繰り返すステップと、
d)複数の第1のネットワーク構成要素のそれぞれと、複数の第2のネットワーク構成要素のそれぞれについて、障害により解除された接続の数をカウントするステップと、
e)複数の第1のネットワーク構成要素又は複数の第2のネットワーク構成要素の1つの特定のネットワーク構成要素について、特定のネットワーク構成要素の、障害により解除された接続の数に基づき、特定のネットワーク構成要素が障害を起こしているかを判定するステップと、
を含んでいる。
この様に、一実施形態は、ネットワークの障害を起こしている構成要素を特定することに関する。異なる構成要素間の接続の確立を試みることにより、各構成要素の障害により接続を失った(つまり、解除、開放等)接続の数をカウントし、障害を起こしている構成要素を特定する。障害を起こしている構成要素は、障害により落ちた接続の数のカウントが非常に大きくなる。本方法は、中央管理ノード又は各構成要素において行われる。
後者の実施形態において、構成要素は、落ちた接続の合計数(つまり、障害により落ちたものだけではない)のカウントを維持することにより、自身が障害を起こしているかを判定することができる。2つのカウントの比率が1又は1に近い場合、構成要素は障害を起こしていると判定できる。
本発明のより良い理解のために、また、どの様に効果を及ぼすかを明確にするために、以下の例示的な図を参照する。
動的なハードウェア・リソースの配分を行うシステムを示す図。 本発明による方法のフローチャート。 本発明の一実施形態によるシステムにおいて収集した統計のグラフ。 本発明の他の実施形態によるシステムにおいて収集した統計のグラフ。 本発明の一側面によるシステムの構成図。 本発明の更に他の実施形態によるシステムにおいて収集した統計のグラフ。
問題が生じたときの機能回復の最も一般的な方法は、その機能を解除する(切り離す)ことであるため、この“障害回復のための解除”をリソース又は構成要素の障害を発見するための指標として利用できる。これは、各リソース・ユニット(又は構成要素)の種々の障害の解除に対する“障害回復解除カウンタ”を導入することにより行われる。障害回復解除”が開始される度に、その回復に含まれるリソースの回復種別に対応するカウンタを増加する。
障害が、リソース・ユニットのエラーにより生じていると、所定数の障害回復解除の後、そのリソースの“障害回復解除カウンタ”は、他のリソース・ユニットより非常に高い値を持つ。これは、例えば、総てのリソース・ユニットの“障害回復解除カウンタ”の平均値と、各リソース・ユニットのカウンタの値を比較することにより測定できる。その差が閾値を超えている場合、障害のユニットが特定される。
よって、本発明によると、障害の結果、開放(又は解除)された機能パスの各構成要素に対するカウンタが維持される。カウンタは、構成要素において局所的に管理、或いは、構成要素からのシグナリングにより遠隔の場所で管理され得る。
図2は、本発明による方法のフローチャートである。
方法はステップS20で開始し、新しいパス又はグループの構成要素を選択するステップS22に進む。つまり、2つ以上の構成要素を結合してタスクを実行させるためにグループ化が行われる。ある実施形態において、この選択はランダムに行われ、他の実施形態において、各パスが実質的に等しい回数だけ選択されることを確実にする、所定の選択パターンに従い選択が行われる。例えば、所定の選択パターンは、総ての可能なパスを順に選択するものであり得る。これらの両実施形態の利点は、長期間では、各パスが実質的に等しい回数だけ選択されることである。この様に、短期間の統計的な変動は最小化される。更に、他の所謂“スマート”アルゴリズムは、障害の構成要素の選択を避けるかもしれず、分析に歪が生じる。
ランダム又は所定の選択は、システム10を“テスト・モード”等に設定することで開始され得る。当然、本発明は、システムの通常動作時に行うこともできる。
パスが選択されると、ステップS24において、構成要素のパス又はグループの機能が、障害の結果として(つまり、パス又はグループ内の1つ以上の構成要素が障害を起こしていることにより)解除されたか否かが判定される。例えば、グループの機能は、完全に落ちたまま、或いは、落ちた後、再起動する。
機能が解除されていなければ、方法はステップS22に戻り、新しいパスが選択される。機能が解除されていると、方法はステップS26に進み、障害パス又はグループの各構成要素の障害解除カウントが1だけ増加される。その後、方法はステップS22に戻り、新しいパスが選択される。この方法は、1つのパス又はグループを選択し、そのパスの機能テストを、他のパス又はグループの選択前に行うという、本質的に線形の形態で記述されている。しかしながら、他の実施形態においては、2つ以上のパス又はグループを同時に選択してテストする。つまり、あるパス又はグループを、他のパス又はグループの選択前にテストする必要はない。実際、1つ以上のプロセスが並行して動作する。
上述した記載においては、構成要素間に構成されるパスに注目していたが、より一般的に、本発明を、ある機能を実行するためにグループ化される任意の構成要素のグループに適用できることが、当業者には自明である。つまり、ある構成要素が出力を生成し、その出力を“パス”内の次の構成要素に渡すとった線形的な方法である必要はない。むしろ、任意のグループの構成要素を、あるタスクを合同して実行するために結合することができ、グループの2つ以上の構成要素が並行してタスクを実行することができる。その様なグループ又はタスクにおいて、1つの構成要素が障害を起こしていると、グループの結合した機能は、その障害を起こしている構成要素が存在するために解除される。
上述した方法によると、システム10の各構成要素の統計値が生成される。
本発明による方法の更なるステップは、システムのどの構成要素が障害を起こしているかを識別するためにこれらの統計値を使用することである。このステップの詳細について以下に説明する。
図3は、時間経過に対する各構成要素の障害回復解除カウントの値の増加を、つまり、上述した方法により実質的に生成された統計分析を示している。
以下の入力値を使用して、コンピュータ・シミュレーションによりグラフを生成した。例示的なシステムの構成要素は4種類(図3では“リソース種別”で表示)であり、構成要素種別1、3及び4は、20の構成要素を、構成要素種別2は15の構成要素を含んでいる。それらをx軸において“構成要素種別.構成要素番号”で表示している。y軸は繰り返した数を示している。z軸は障害解除カウントの現在値を示している。
他の値は以下の通りである。
・10ユーザ
・各繰り返しにおいてユーザが機能パスを設定する確率=0.6
・各繰り返しにおいてユーザが機能パスを解除する確率=0.8
・構成要素の配分はランダム
・障害を起こしている構成要素は、構成要素種別1の1つの構成要素
グラフから明らかな様に、構成要素種別1の1つの特定の構成要素の障害解除カウントの値は、他の残りの構成要素より極めて高く、よって、この構成要素が障害を起こしていると特定することができる。これは、その構成要素を使用して設定された機能パスは、その障害解除カウントを増加させる(つまり、機能パスが解除される)からである。他の構成要素の障害解除カウントは、それらが、障害を起こしている構成要素を含む機能パスに使用されたときのみ増加する。
この例において、構成要素種別1の総ての他の構成要素の障害解除カウントは零である。
図4は、構成要素種別1の1つの構成要素と、構成要素種別3の1つの構成要素が障害を起こしているシステムの、コンピュータによりシミュレートした統計値のグラフである。他の値は、図3の例と同じである。
図に示す様に、2つの障害を起こしている構成要素の障害解除カウントの値は、他の構成要素より極めて高い。この例において、“ノイズ・フロア”は、障害要素が1つの場合の例より少し高く、特に、構成要素種別1及び3の他の構成要素の障害解除カウントは零ではない。しかしながら、障害を起こしている構成要素は、依然、明らかに識別できる。
よって、システムの障害を起こしている構成要素を特定する種々の方法が存在する。一実施形態によると、最も高い障害解除カウントを有する構成要素が、障害を起こしていると特定される。他の実施形態によると、システムの総ての構成要素の障害解除カウントの平均値を判定し、各構成要素の障害解除カウントの値を、その平均値と比較する。
障害解除カウントが閾値(例えば、パーセンテージ又は絶対値)だけ平均値を超えていると、その構成要素は、障害を起こしていると特定される。後者の実施形態には、2つ以上の障害を起こしている構成要素を判定できるという利点がある。
平均値は、当業者には明らかな多数の方法で判定できる。ある実施形態において、同じ種別の構成要素の総ての障害解除カウントの値を合計し、その種別の構成要素の数で除することにより求める。他の実施形態において、総ての障害解除カウントの値を合計し、総ての構成要素の数で除することにより求める。
上述した方法は、任意の場所にて実行できる。それらは、構成要素が、他の構成要素(例えば、同じ種別の他の構成要素又はネットワーク内の総ての構成要素)の障害解除カウントを知っているのであれば、システムの1つ以上の構成要素において実行できる。他の方法として、統計値を収集して障害を起こしている構成要素を特定するために、外部装置を利用することができる。どちらの場合でも、特定する装置(構成要素又は他の装置)において、障害解除カウントを維持できる様に、特定する装置に対して、現在の障害解除カウントの値、又は、障害の結果として接続が解除されたかを通知する機構が存在する。当業者はこれを実現する種々の方法を考え付く。通信ネットワークにおいては、各構成要素は、外部ユニットに信号を送信でき、新しいメッセージにより構成要素を特定し、情報を通知する既存の標準化されたメッセージを適用することができる。
図5は、本発明の一側面によるシステム又はネットワークを示し、外部装置又は中央管理ノード30は、システム又はネットワーク10の障害を起こしている構成要素を特定する方法を実行する様に構成されている。
上述した様に、外部装置30は、構成要素12、14、16からメッセージを受信し、システム10の障害を起こしている構成要素を特定する様に構成されている。ある実施形態において、これらメッセージは、各構成要素の現在の障害解除カウントを含み、外部装置は、障害を起こしている構成要素の存在を特定するために、これら障害解除カウントを使用することができる。他の実施形態において、これらメッセージは、障害の結果として機能が解除されたかを示す情報を含んでいる。外部装置30は、よって、各構成要素12、14、16の障害解除カウントを維持し、障害を起こしている構成要素の存在を続いて特定する。
本発明の他の側面によると、構成要素は、自身が障害を起こしているか否かを判定することができる。前述した側面においては、構成要素が障害を起こしているか否かを判定するために、システムの総ての構成要素の障害解除カウントの値を知っていることが必要であった。
本発明の更に他の側面によると、各構成要素は、その構成要素の、障害の結果とそれ以外の理由により解除された、総ての接続のカウントを維持する。つまり、一般的に、接続が解除される多くの理由があり、その理由には機能パスにより実行される機能が完了したことが含まれている。
しかしながら、総ての又は殆んど総ての接続の解除は障害が原因である。よって、ある実施形態によると、各構成要素は、全接続解除に対する障害による接続解除の比率を判定する。この比率が1である場合、その構成要素は、障害を起こしていると判定する。
装置の障害が断続的であると、比率は正確に1にはならない。よって、他の実施形態において、装置は、比率が閾値を超えている場合(例えば、0.95)、障害を起こしていると判定する。
図6は、各構成要素が上述した比率を判定するシステムの統計値を示すグラフである。入力値は図3と同じであり、構成要素種別1の1つの構成要素が障害を起こしている。z軸は比率を示し、比率の値−1は、その構成要素を含む機能パスが未だ確立されていないことを示し、よって、蓄積されたデータがないことを示している。
図に示す様に、ある構成要素の比率が急速に1に収束し、他の構成要素の比率は急速に零に収束している。よって、比率が1の構成要素種別1の構成要素が障害を起こしていると特定される。
上述した様に、この側面は、他の構成要素のカウント値を知ること無しに、各構成要素は、自身が障害を起こしているかを判定できる。つまり、この側面は、外部装置又は中央管理ノード30を必要としない。しかしながら、図6に示す様に、幾つかの構成要素の比率は、それらの構成要素が障害ではなくとも1になり、間違った警報を引き起こす。これは、その構成要素を含んで設定された最初の接続が、障害を起こしている構成要素を含む場合に生じる。これは、解除された接続の合計の数がある値となった後に、比率が1又は1に近い値であると、その構成要素を障害と判定するとの要求条件により解決することができる。
上述した例示的なシステム及び方法は、3又は4種類の構成要素種別を持つものであった。しかしながら、2以上の任意の構成要素種別を使用できることを当業者は理解する。
更に、例示的なシステム及び方法のそれぞれは、各構成要素種別について複数の構成要素を有するものであった。各接続が、ある構成要素を通過しなければならないとすると、修正することなく本方法を正確に運用するためには、これは実際に必要な条件である。その構成要素が障害となると、総て(ほとんど)の接続は、障害の結果として解除され、総ての装置が障害と特定される。他の構成要素が障害を起こしているとしても、この単一の構成要素のみが、実際にはそうではないにも拘わらず(つまり、障害の構成要素と同じカウント値である)、障害と特定される。しかしながら、これは、ある構成要素種別の構成要素が1つであることを認識し、方法を適切に修正することで解決できる。例えば、方法は、総ての構成要素の比率が1である場合、構成要素種別の単一の構成要素が障害を起こしていると判定する様に修正することができる。更に、構成要素種別の単一の構成要素から受信した任意の障害警報を無視することもできる。
よって、ネットワークの1つ以上の障害を起こしている構成要素を特定する種々の方法がある。用語“ネットワーク”及び“システム”は広く解釈され、種々の機能パス又は接続に動的に構成される構成要素、リソース、ハードウェア、部品を含む任意のネットワーク、システム、装置を含むものとして解釈される。特定の例は、無線基地局、無線ネットワーク制御装置、ユーザ装置等を含む通信ネットワーク、コンピュータのためのコンピュータ・ネットワーク、構成要素がコンピュータ内部の個々のハードウェア部品に対応するコンピュータ自身である。
上述した実施形態は説明を目的としており、発明を制限するものではなく、当業者は、添付の特許請求の範囲から逸脱しない、多くの置換した実施形態を設計することができる。用語“備える”は、請求項で述べられた以外の要素又はステップの存在を排除せず、“1つの”は、複数の存在を排除せず、単一のプロセッサ又は他のユニットは、請求項で述べられた複数のユニットの機能を満足する。請求項の総ての参照符号は、発明の範囲を制限するものとして解釈すべきではない。
当業者は、上述した装置及び方法は、例えば、ディスク、CD−ROM又はDVD−ROM、読み出し専用メモリ(ファームウェア)の様なプログラムされたメモリの様な記録媒体に記録された、或いは、光又は電気信号搬送媒体の様なデータ搬送媒体上のプロセッサの制御コードにより実現されることを理解する。多くのアプリケーションにおいて、本発明の実施形態は、DSP(デジタル信号プロセッサ)、ASIC(特定用途向け集積回路)又はFPGA(フィールド・プログラマブル・ゲート・アレイ)上で実現される。この様に、コードは、従来のプログラム・コード、マイクロコード、例えば、ASIC又はFPGAを設定又は制御するためのコードを含んでいる。コードは、再構成可能な論理ゲートアレイの様な、再構成可能装置を動的に構成するためのコードも含んでいる。同様に、コードは、Verilog(登録商標)又はVHDL(Very High speed integrated circuit hardware Descritpion Language)の様なハードウェア記述言語を含む。当業者には明らかな様に、コードは、複数の接続された構成要素間の通信により相互に分配される。適切な場所において、実施形態は、アナログ/デジタル・ハードウェアの構成するためにフィールド(再)・プログラマブル・アナログ・アレイの様な装置で動作するコードを使用して実現することができる。

Claims (20)

  1. 第1のネットワーク構成要素種別の複数の第1のネットワーク構成要素(12a、12b、12c、12d・・・)と、第2のネットワーク構成要素種別の複数の第2のネットワーク構成要素(14a、14b、14c、14d・・・)とを少なくとも有するネットワーク(10)における、障害を起こしているネットワーク構成要素を検出する方法であって、
    a)前記複数の第1のネットワーク構成要素(12a、12b、12c、12d・・・)の1つを選択し、前記複数の第2のネットワーク構成要素(14a、14b、14c、14d・・・)の1つを選択するステップと、
    b)前記選択した第1のネットワーク構成要素及び前記選択した第2のネットワーク構成要素間の接続の設定を試みるステップと、
    c)更に選択した第1のネットワーク構成要素及び第2のネットワーク構成要素に対し、前記ステップa)及びb)を繰り返すステップと、
    d)前記複数の第1のネットワーク構成要素(12a、12b、12c、12d・・・)のそれぞれと、前記複数の第2のネットワーク構成要素(14a、14b、14c、14d・・・)のそれぞれについて、障害により解除された接続の数をカウントするステップと、
    e)前記複数の第1のネットワーク構成要素又は前記複数の第2のネットワーク構成要素の1つの特定のネットワーク構成要素について、前記特定のネットワーク構成要素の前記障害により解除された接続の数に基づき、前記特定のネットワーク構成要素が障害を起こしているかを判定するステップと、
    を含むことを特徴とする方法。
  2. 前記ステップe)は、
    障害により解除された接続の平均数を判定するステップと、
    前記障害により解除された接続の平均数と、前記特定のネットワーク構成要素の前記障害により解除された接続の数を比較するステップと、
    を更に含むことを特徴とする請求項1に記載の方法。
  3. 前記特定のネットワーク構成要素が前記第1のネットワーク構成要素種別である場合、前記障害により解除された接続の平均数は、前記複数の第1のネットワーク構成要素(12a、12b、12c、12d・・・)のそれぞれの前記障害により解除された接続の数を合計して前記複数の第1のネットワーク構成要素(12a、12b、12c、12d・・・)の数で除することにより計算したものであり、
    前記特定のネットワーク構成要素が前記第2のネットワーク構成要素種別である場合、前記障害により解除された接続の平均数は、前記複数の第2のネットワーク構成要素(14a、14b、14c、14d・・・)のそれぞれの前記障害により解除された接続の数を合計して前記複数の第2のネットワーク構成要素(14a、14b、14c、14d・・・)の数で除することにより計算したものである、
    ことを特徴とする請求項2に記載の方法。
  4. 前記ステップe)は、
    前記特定のネットワーク構成要素の前記障害により解除された接続の数が、前記障害により解除された接続の平均数を、閾値だけ超えている場合、前記特定のネットワーク構成要素が障害を起こしていると判定するステップを更に含む、
    ことを特徴とする請求項2又は3に記載の方法。
  5. 前記ステップe)は、
    障害により解除された接続の数が最も大きいネットワーク構成要素を特定するステップと、
    前記特定したネットワーク構成要素が障害を起こしていると判定するステップと、
    を更に含むことを特徴とする請求項1に記載の方法。
  6. 前記複数の第1のネットワーク構成要素(12a、12b、12c、12d・・・)のそれぞれと、前記複数の第2のネットワーク構成要素(14a、14b、14c、14d・・・)のそれぞれについて、解除された接続の合計数をカウントするステップを更に含む、
    ことを特徴とする請求項1に記載の方法。
  7. 前記ステップe)は、
    前記特定のネットワーク構成要素について、前記解除された接続の合計数に対する前記障害により解除された接続の数の比率を判定するステップと、
    前記比率に基づき、前記特定のネットワーク構成要素が障害を起こしているかを判定するステップと、
    を更に含むことを特徴とする請求項6に記載の方法。
  8. 前記ステップe)は、
    前記比率が閾値より大きい場合、前記特定のネットワーク構成要素が障害を起こしていると判定するステップを更に含む、
    ことを特徴とする請求項7に記載の方法。
  9. 前記ステップe)は、
    前記比率が1である場合、前記特定のネットワーク構成要素が障害を起こしていると判定するステップを更に含む、
    ことを特徴とする請求項7に記載の方法。
  10. 前記ステップe)は、
    前記解除された接続の合計数が第2の閾値より大きい場合にのみ、前記特定のネットワーク構成要素が障害を起こしていると判定するステップを更に含む、
    ことを特徴とする請求項8又は9に記載の方法。
  11. 前記選択した第1のネットワーク構成要素及び前記選択した第2のネットワーク構成要素は、ランダムに選択されている、
    ことを特徴とする請求項1から10のいずれか1項に記載の方法。
  12. 前記選択した第1のネットワーク構成要素及び前記選択した第2のネットワーク構成要素は、予め決められた選択パターンに従い選択されており、
    前記予め決められた選択パターンは、前記複数の第1のネットワーク構成要素(12a、12b、12c、12d・・・)のそれぞれと、前記複数の第2のネットワーク構成要素(14a、14b、14c、14d・・・)のそれぞれが等しい回数だけ選択されることを確実にするものである、
    ことを特徴とする請求項1から10のいずれか1項に記載の方法。
  13. 前記ネットワークは、第3のネットワーク構成要素種別の複数の第3のネットワーク構成要素(16a、16b、16c、16d・・・)を更に有し、
    前記ステップa)は、前記複数の第3のネットワーク構成要素(16a、16b、16c、16d・・・)の1つをランダムに選択するステップを更に含み、
    前記ステップb)は、前記ランダムに選択した第1のネットワーク構成要素、前記ランダムに選択した第2のネットワーク構成要素及び前記ランダムに選択した第3のネットワーク構成要素間の接続の設定を試みるステップを更に含み、
    前記ステップc)は、更にランダムに選択した第1のネットワーク構成要素、第2のネットワーク構成要素及び第3のネットワーク構成要素に対し、前記ステップa)及びb)を繰り返すステップを更に含み、
    前記ステップd)は、前記複数の第3のネットワーク構成要素(16a、16b、16c、16d・・・)のそれぞれについて、障害により解除された接続の数をカウントするステップを更に含み、
    前記ステップe)は、前記複数の第1のネットワーク構成要素、前記複数の第2のネットワーク構成要素又は前記複数の第3のネットワーク構成要素の1つの特定のネットワーク構成要素について、前記特定のネットワーク構成要素の前記障害により解除された接続の数に基づき、前記特定のネットワーク構成要素が障害を起こしているかを判定するステップを更に含む、
    ことを特徴とする請求項1から12のいずれか1項に記載の方法。
  14. 前記ステップd)は、前記ネットワーク(10)の中央管理ノード(30)が実行する、
    ことを特徴とする請求項1から13のいずれか1項に記載の方法。
  15. 各ネットワーク構成要素は、障害により接続が解除されると、前記中央管理ノード(30)に解除されたことを信号で通知する、
    ことを特徴とする請求項14に記載の方法。
  16. 各ネットワーク構成要素は、障害により解除された接続の現在数を、前記中央管理ノード(30)に信号で通知する、
    ことを特徴とする請求項14に記載の方法。
  17. 前記ステップd)は、各ネットワーク構成要素がそれぞれ実行する、
    ことを特徴とする請求項1から13のいずれか1項に記載の方法。
  18. 請求項1から13及び17のいずれか1項に記載の方法を実行する、
    ことを特徴とするネットワーク構成要素。
  19. 請求項1から13のいずれか1項に記載の方法を実行する、
    ことを特徴とする管理ノード。
  20. 請求項1から17のいずれか1項に記載の方法をコンピュータに実行させる、
    ことを特徴とするプログラム。
JP2011524935A 2008-08-28 2008-08-28 解除された接続の比率を判定することによりハードウェア障害を検出する方法 Expired - Fee Related JP5173024B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/SE2008/050973 WO2010024744A1 (en) 2008-08-28 2008-08-28 Method for detecting hardware faults by determining a ratio of released connections

Publications (2)

Publication Number Publication Date
JP2012501571A JP2012501571A (ja) 2012-01-19
JP5173024B2 true JP5173024B2 (ja) 2013-03-27

Family

ID=41721714

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011524935A Expired - Fee Related JP5173024B2 (ja) 2008-08-28 2008-08-28 解除された接続の比率を判定することによりハードウェア障害を検出する方法

Country Status (4)

Country Link
US (1) US8582444B2 (ja)
EP (1) EP2319212A4 (ja)
JP (1) JP5173024B2 (ja)
WO (1) WO2010024744A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012091641A1 (en) * 2010-12-28 2012-07-05 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for detecting a malfunctioning terminal
JP5712725B2 (ja) * 2011-03-28 2015-05-07 富士通株式会社 管理装置及び方法
TWI453581B (zh) * 2012-04-09 2014-09-21 Asrock Inc 偵測硬體的方法
JP6201678B2 (ja) * 2013-11-21 2017-09-27 富士通株式会社 ネットワーク管理システムにおけるネットワークエレメント、ネットワーク管理システム、及び、ネットワークの管理方法
US10044556B2 (en) 2015-06-23 2018-08-07 International Business Machines Corporation Identifying performance-degrading hardware components in computer storage systems

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8923158D0 (en) 1989-10-13 1989-11-29 Plessey Telecomm Fault detection and bandwidth monitoring means for an atd switch
WO1999023849A1 (en) * 1997-10-30 1999-05-14 Qualcomm Incorporated System and method for analyzing mobile log files
JPH11261471A (ja) * 1998-03-11 1999-09-24 Fujitsu Ltd 移動体通信システムの障害監視装置
EP1259086A1 (fr) 2001-05-15 2002-11-20 Koninklijke Philips Electronics N.V. Reseau de telecommunications radiomobile
ES2341314T3 (es) * 2001-11-05 2010-06-18 Nokia Corporation Envio de resultados de analisis de auto-rendimiento y operacional de una estacion movil a una red en respuesta a un mensaje de solicitud cifrado.
US20040077331A1 (en) * 2002-10-17 2004-04-22 King Kevin H. System and method for tracking dropped calls in a wireless telecommunication system
US7159149B2 (en) * 2002-10-24 2007-01-02 Symantec Corporation Heuristic detection and termination of fast spreading network worm attacks
JP4720295B2 (ja) * 2005-06-02 2011-07-13 日本電気株式会社 異常検出システムおよび保全システム
JP5119951B2 (ja) 2008-01-30 2013-01-16 日本電気株式会社 移動通信システム、ハンドオーバ性能監視方法及び管理装置

Also Published As

Publication number Publication date
US20110188382A1 (en) 2011-08-04
EP2319212A4 (en) 2016-05-11
US8582444B2 (en) 2013-11-12
EP2319212A1 (en) 2011-05-11
WO2010024744A1 (en) 2010-03-04
JP2012501571A (ja) 2012-01-19

Similar Documents

Publication Publication Date Title
JP5173024B2 (ja) 解除された接続の比率を判定することによりハードウェア障害を検出する方法
JP6515424B2 (ja) 装置ラックにおけるスロットの位置を決定するためのシステム
CN108768710B (zh) 一种光传输网络健康的动态权重评估方法、模型及装置
CN111756571B (zh) 一种集群节点故障的处理方法、装置、设备及可读介质
US7487416B2 (en) Self test device and self test method for reconfigurable device mounted board
US7995485B1 (en) Method and apparatus for providing automated diagnostics of networks
US20160191359A1 (en) Reactive diagnostics in storage area networks
US20170168884A1 (en) Generic alarm correlation by means of normalized alarm codes
CN111104239A (zh) 一种分布式存储集群的硬盘故障处理方法、系统及装置
CN112422361A (zh) 一种交换机测试方法、设备及介质
JP2018174451A (ja) 通信システム、バス負荷監視装置、バス負荷監視方法
CN101800672B (zh) 设备检测方法和设备
CN102801575A (zh) 环回检测方法及装置
CN105704187A (zh) 一种集群脑裂的处理方法及装置
CN105656996A (zh) 数据节点存活的检测方法及装置
JP5780553B2 (ja) 障害監視装置及び障害監視方法
CN115037653B (zh) 业务流量监控方法、装置、电子设备和存储介质
CN108512698B (zh) 一种网络容灾方法、装置及电子设备
JP2010134751A (ja) マルチパーティション・コンピュータシステム、障害処理方法及びそのプログラム
CN115150253B (zh) 一种故障根因确定方法、装置及电子设备
JP2020038525A (ja) 異常検知装置
CN111884932B (zh) 一种链路确定方法、装置、设备和计算机可读存储介质
CN109088766A (zh) 一种基于配对测试的互连网络故障检测与定位方法
CN101227346A (zh) 通信设备自动化测试过程中故障监控方法与装置
CN115002001A (zh) 一种检测集群网络亚健康的方法、装置、设备及介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121226

R150 Certificate of patent or registration of utility model

Ref document number: 5173024

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees