JP6670877B2 - 故障判定装置、故障判定システム、故障判定方法、及びプログラム - Google Patents

故障判定装置、故障判定システム、故障判定方法、及びプログラム Download PDF

Info

Publication number
JP6670877B2
JP6670877B2 JP2018057155A JP2018057155A JP6670877B2 JP 6670877 B2 JP6670877 B2 JP 6670877B2 JP 2018057155 A JP2018057155 A JP 2018057155A JP 2018057155 A JP2018057155 A JP 2018057155A JP 6670877 B2 JP6670877 B2 JP 6670877B2
Authority
JP
Japan
Prior art keywords
failure
detected
target
notified
target device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018057155A
Other languages
English (en)
Other versions
JP2019169884A (ja
Inventor
弦 志村
弦 志村
憲一 有永
憲一 有永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Communications Corp
Original Assignee
NTT Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Communications Corp filed Critical NTT Communications Corp
Priority to JP2018057155A priority Critical patent/JP6670877B2/ja
Publication of JP2019169884A publication Critical patent/JP2019169884A/ja
Application granted granted Critical
Publication of JP6670877B2 publication Critical patent/JP6670877B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Maintenance And Management Of Digital Transmission (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、ネットワークを監視し、監視により検出された故障を通知する技術に関連するものである。
複数の装置から構成されるネットワークにより様々なサービスが提供されている。このようなネットワークに対して、監視(NW監視)が行われるのが一般的である。NW監視は、例えば、監視装置からPing等により監視パケットを監視対象の装置に向けて送信し、その返信の有無を確認することにより実施される。
特開2017−153015号公報
NW監視は通常、特定のNW箇所から実施するため、監視装置にネットワーク経路的に近い装置に故障が発生した場合には、その装置を介した通信は断となる。そのため、NW監視により、その装置より下位にある装置について、実際の故障の有無に拠らずに故障が検知される場合がある。これら検知された故障を個々にメール等でユーザに通知する場合、ユーザは、実際に故障が発生した箇所の装置を特定することが難しくなる。
本発明は上記の点に鑑みてなされたものであり、複数の装置を有する監視対象ネットワークにおける通知すべき故障を判定する技術を提供することを目的とする。
開示の技術によれば、複数の装置を有する監視対象ネットワークにおける通知すべき故障を判定する故障判定装置であって、
前記監視対象ネットワークの構成情報を格納するデータベースを参照する手段と、
故障が検知された装置である対象装置についての構成情報を前記データベースから読み出し、当該構成情報に基づいて、当該対象装置に対して検知された故障が通知すべき故障であるか否かを判定する判定手段とを備え、
前記判定手段は、前記対象装置に対して上位の隣接関係にある装置に故障が検知されている場合に、前記対象装置に対して検知された故障は通知すべき故障ではないと判定する
ことを特徴とする故障判定装置が提供される。
開示の技術によれば、複数の装置を有する監視対象ネットワークにおける通知すべき故障を判定する技術が提供される。
本発明の実施の形態におけるシステムの全体構成図である。 故障通知装置の機能の概要を説明するための図である。 故障通知装置の機能構成図である。 故障通知装置のハードウェア構成例を示す図である。 システムの動作の全体の流れを説明するための図である。 監視対象ネットワークの構成例を示す図である。 ネットワークトポロジの例を説明するための図である。 データ格納部に格納されるデータの例を示す図である。 故障通知装置の動作を説明するためのフローチャートである。 通知/抑止の例を示す図である。
以下、図面を参照して本発明の実施の形態(本実施の形態)を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。例えば、以下の説明では、アラート情報の通知をメールで行うこととしているが、これは一例に過ぎない。アラート情報の通知はメール以外の手段(例:SMS、Web、Push、SNS等)で行うこととしてもよい。
(システムの全体構成、動作概要)
図1に本実施の形態におけるシステムの全体構成例を示す。図1に示すように、本実施の形態のシステムは、故障通知装置100、ユーザ端末200、監視対象ネットワーク300を含む。監視対象ネットワーク300は、あるユーザ(顧客)のネットワークであり、ユーザ端末200は、例えば当該ユーザのNW管理者の端末である。
故障通知装置100は、監視対象ネットワーク300の監視結果に基づいて、アラート情報を作成し、当該アラート情報をユーザ端末200に通知(送信)する。監視対象ネットワーク300の監視自体は故障通知装置100が行ってもよいし、故障通知装置100以外の装置が行ってもよいが、本実施の形態では、一例として故障通知装置100が監視とアラート情報の通知を行うこととしている。なお、後述するように、故障通知装置100は、通知すべき故障を判定するので、これを「故障判定装置」と称しても良い。
監視対象ネットワーク300は、ルータやサーバ等の種々の装置が回線で接続された構成を有する。以降、監視対象ネットワーク300を構成する装置を「NW装置」と呼ぶことにする。
図2を参照して、故障通知装置100の動作概要を説明する。図2(a)、(b)において、A〜Fで示す各ノードは、監視対象ネットワーク300における各NW装置のイメージを示している。また、比較のために、図2(a)は想定される従来の技術を示し、図2(b)は本発明の係る技術を示している。
本実施の形態に係る監視対象ネットワーク300を構成する各NW装置は、ネットワーク経路的な関係として、他のNW装置と上位あるいは下位の関係にある。また、各NW装置は、他のNW装置とともに冗長構成を形成する場合がある。図2の例でいえば、例えば、ノードAはノードCよりも上位にあり、ノードAとノードBは冗長構成(ActiveとStandby)を形成している。
故障通知装置100によるNW装置の監視は、Ping等により監視パケットをNW装置に送信し、その返信を確認する、つまり疎通を確認することで実施される。故障通知装置100から送信される監視パケットは、上位のNW装置から下位のNW装置に転送されるので、例えば、図2(a)に示すように、監視対象ネットワーク300のノードA〜Gのうちの、ノードA、Bの側において実際に故障が発生した場合(つまり、ノードAとノードBの両方が通過できない場合)には、故障発生箇所から下位側への監視パケットの疎通ができないため、故障通知装置100は、監視結果として、ノードA〜Fの全てにおいて故障発生(ここでは"DOWN")という監視結果を得る。
図2(a)に示すように、従来技術では、監視の結果、故障発生と判断されたNW装置のそれぞれについて、アラート情報を通知するメールがユーザ端末200に送信される。しかし、図2(a)の例において、ノードC〜Fについては、上位側の故障により、監視パケットの疎通ができないことに起因して、監視上、故障発生との判断がなされたものであるから、これらを、実際の故障発生のアラート情報と同様にユーザ端末200に個別に通知することは適切ではない。これらの通知を受けても、真に故障が発生した箇所を特定できないためである。
また、図2(a)のノードA、Bにように、ActiveのNW装置側とStandbyのNW装置側の両方が断となった場合(両系断となった場合)において、従来技術では、それぞれのアラート情報が独立してユーザ端末200に通知される。ActiveのNW装置とStandbyのNW装置の両方が断となる場合は、「両系断」という1つのイベントに該当する。しかし、従来技術のようにそれぞれのアラート情報が独立してユーザ端末200に通知されると、ユーザは当該事象を1つのイベントとして捉えにくい。
上記のような事象に対し、本実施の形態に係る故障通知装置100は、監視対象ネットワーク300のネットワークトポロジ("構成情報"と称してもよい)を考慮することで、図2(b)に示すように、不必要なアラート情報通知を抑止することを可能としている。
すなわち、図2(a)に示す従来技術の例では、各NW装置のアラート情報を通知するために6通のメールが独立にユーザ端末200に送信される。一方、図2(b)に示す本発明に係る技術の例では、ノードAについてのアラート情報を通知するメールのみがユーザ端末200に送信される。また、当該ノードAについてのアラート情報を通知するメールには、抑止されたアラート情報も記載される。ただし、あるNW装置についてのアラート情報を通知するメールに、抑止されたアラート情報を記載することは必須ではなく、抑止されたアラート情報を記載しないこととしてもよい。
なお、本実施の形態における「通知」とは、最初の通知(初報)であることを想定するが、これは一例である、初報以外の通知に、本実施の形態における「通知」の技術が適用されてもよい。
(故障通知装置100の機能構成)
図3は、故障通知装置100の機能構成図である。図3に示すように、故障通知装置100は、通知判定部110、通知部120、監視部130、データ格納部140を有する。通知判定部110は、データ格納部140に格納されたトポロジ情報(構成情報)、故障情報等に基づいて、監視対象ネットワーク300において故障が検知されたNW装置について、通知すべき故障かどうかを判定し、通知すべき故障についてのアラート情報を作成する。なお、あるNW装置についてのアラート情報を通知するとは、当該NW装置を対象とするアラート情報のメールを通知することである。
通知部120は、通知判定部110により作成されたアラート情報をメールでユーザ端末200に送信する。
監視部130は、監視対象ネットワーク300に対する監視を行う。本実施の形態では、監視部130は、監視対象ネットワーク300を構成する各NW装置に対してPingを実施することにより監視を行う。ただし、これは一例に過ぎない、Ping以外の手法を用いて監視を行ってもよい。
データ格納部140は、監視対象ネットワーク300を構成する各NW装置についての装置名、ID、故障情報(上述した監視結果を示す情報)、及び、ネットワークトポロジに相当する隣接関係情報(構成情報と称してもよい)を格納している。データ格納部140をデータベースと称しても良い。
図3の構成は一例である。例えば、故障通知装置100は、通知判定部110を備え、その他の機能部の一部又は全部を他の装置に備えてもよい。例えば、故障通知装置100の外部に、データ格納部140に相当するデータベースサーバを備え、故障通知装置100は当該データベースサーバにアクセスすることにより処理を実行することとしてもよい。故障通知装置100の外部に、データ格納部140に相当するデータベースサーバを備える場合において、当該故障通知装置100とデータベースサーバとを有する構成を「故障判定システム」と称してもよい。
(ハードウェア構成例)
故障通知装置100は、通知判定部110、通知部120、監視部130、データ格納部140を全部有する構成、及び、これらのうちの一部を含む構成のいずれの場合でも、例えば、コンピュータに、本実施の形態で説明する処理内容を記述したプログラムを実行させることにより実現可能である。すなわち、故障通知装置100が有する機能は、当該コンピュータに内蔵されるCPUやメモリ、ハードディスクなどのハードウェア資源を用いて、故障通知装置100で実施される処理に対応するプログラムを実行することによって実現することが可能である。上記プログラムは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。
図4は、故障通知装置100をコンピュータで実現する場合におけるハードウェア構成例を示す図である。図4に示す装置は、それぞれバスBで相互に接続されているドライブ装置150、補助記憶装置152、メモリ装置153、CPU154、インタフェース装置155、表示装置156、及び入力装置157等を有する。
故障通知装置100での処理を実現するプログラムは、例えば、CD−ROM又はメモリカード等の記録媒体151によって提供される。プログラムを記憶した記録媒体151がドライブ装置150にセットされると、プログラムが記録媒体151からドライブ装置150を介して補助記憶装置152にインストールされる。但し、プログラムのインストールは必ずしも記録媒体151より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置152は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
メモリ装置153は、プログラムの起動指示があった場合に、補助記憶装置152からプログラムを読み出して格納する。CPU154(プロセッサ)は、メモリ装置153に格納されたプログラムに従って故障通知装置100に係る機能を実現する。インタフェース装置155は、ネットワークに接続するためのインタフェースとして用いられる。表示装置156はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置157はキーボード及びマウス、ボタン、又はタッチパネル等で構成され、様々な操作指示を入力させるために用いられる。
なお、故障通知装置100を遠隔のみから操作したり、遠隔のみで表示を行う場合には、表示装置156及び入力装置157を備えないこととしてもよい。
(全体動作例)
次に、図5を参照して、本実施の形態に係るシステムの全体動作例を説明する。図5に示すように、S101において、故障通知装置100の監視部130は、例えば定期的に、監視対象ネットワーク300における各NW装置の監視を行う。前述したように、一例として、監視は、Ping等の監視パケットを用いた疎通確認により実施される。
監視部130は、各NW装置の監視結果をデータ格納部140に記録する。本実施の形態では、一例として、監視の結果、あるNW装置に対する疎通が確認できた場合には、当該NW装置に対応する故障情報として「UP」(異常なしを意味する)を記録し、あるNW装置に対する疎通が確認できない場合には、当該NW装置に対応する故障情報として「DOWN」(故障発生を意味する)を記録する。
S102において、通知判定部110は、監視により故障を検知した各NW装置について、データ格納部140から構成情報を読み出し、当該構成情報に基づいて、アラート情報を通知するか否かを判定するとともに、アラート情報を通知する場合において、通知するアラート情報の作成を行う。図5は、通知するアラート情報がある場合の例を示しており、この場合、S103において、通知部120がアラート情報をユーザ端末200に送信する。
(故障通知装置100の動作例)
次に、故障通知装置100の動作例を詳細に説明する。動作例の説明にあたり、まず、データ格納部140に格納される構成情報(隣接関係情報)の例について説明する。図6に、監視対象ネットワーク300の構成例を示す。図6の例では、図の左側がネットワーク経路的な上位側であり、図の右側がネットワーク経路的な下位側である。例えば、ノードPE1は、ノードCE1の上位である。また、図の上下方向のノードの並びは冗長関係を示している。例えば、ノードCE1とノードCE2とは冗長関係をなしている。
本実施の形態では、図6に示すようなネットワーク構成を、一例として図7(a)、(b)、(c)に示すように分解して考える。
図7(a)は、隣接するノードAとノードBが上位・下位関係にあり、ノードAが上位装置("Parent"と称してもよい)であり、ノードBが下位装置("Child"と称してもよい)であることを示している。
図7(b)は、隣接するノードAとノードBが冗長関係にあり、ノードAがActive装置("Act"と称してもよい)であり、ノードBもActive装置であることを示している。
図7(c)は、隣接するノードAとノードBが冗長関係にあり、ノードAがActive装置であり、ノードBがStandby装置("Sby"と称してもよい)であることを示している。
上記のような関係性に基づいて、データ格納部140には、監視対象ネットワーク300を構成するNW装置毎に、隣接NW装置との関係が構成情報として格納されている。図8に、データ格納部140に格納されるデータ例を示す。なお、図8は、1つのテーブルにデータが格納されているイメージを示しているが、図8に示す情報が複数のテーブルに跨って保持されることとしてもよい。
図8に示すように、データ格納部140には、監視対象ネットワーク300を構成するNW装置毎に、装置名、ID、故障情報、隣接関係情報が格納される。ここでの故障情報は、監視部130による監視結果であり、定期的に更新される。隣接関係情報は、対象NW装置に隣接する各NW装置と、当該対象NW装置との隣接関係を示す情報が格納される。例えば、図8の例において、ID=1のNW装置を対象NW装置とすると、ID=3のNW装置と対象NW装置がAct−Actの冗長関係にあり、両方ともActであることがわかる。
故障通知装置100の通知判定部110は、データ格納部140を参照し、「故障情報」に基づいて、監視上、DOWNと判断されたNW装置のそれぞれに対し、図9のフローチャートの手順に沿った判定を行って、当該NW装置についてアラート情報を通知するかどうかの判定(通知すべき故障かどうかの判定)、及び、通知する場合における、通知するアラート情報の作成等を実行する。
なお、故障通知装置100の処理が、コンピュータ上のプログラムで実現される場合において、通知判定部110が、DOWNと判断されたNW装置のそれぞれについてのプロセスを生成・起動し、当該それぞれのプロセスが図9のフローチャートの手順を実行することとしてもよい。当該プロセスは、通知判定部110内に含まれるものとしてもよい。
例えば、図2に示す例の場合において、A〜Eの6台のNW装置の全てで監視結果はDOWNとなるので、通知判定部110は、A〜Eに対して1つずつ計6つプロセスを生成する。各プロセスは同じアルゴリズム(=図9で説明する手順)で動作し、アラート情報を通知すると判断したプロセスが、通知するアラート情報の生成、及び通知部120への通知指示を行う。アラート情報を通知すると判断しないプロセスは、通知を抑止する。なお、このように、DOWNと判断されたNW装置のそれぞれについてのプロセスを生成する手法は一例である。以下、図9の手順を通知判定部110が実行するものとして、図9の手順を説明する。図9の手順の対象となるNW装置(故障が検知されたNW装置)を「対象NW装置」と呼ぶ。また、以下の手順における故障発生とは、監視の結果(つまり、疎通確認の結果)、故障発生と判断されたことを示し、実際には故障が発生していない場合も含まれる。また、図9で説明する手順では、説明を分かり良くするために、冗長構成は2つのNW装置からなるものとしている。
図9のS201において、通知判定部110は、あるNW装置に故障が発生したことを検知し、当該NW装置を対象NW装置とする。
S202において、通知判定部110は、データ格納部140を参照し、対象NW装置の隣接関係情報(構成情報)を読み出し、当該隣接関係情報に基づいて、当該対象NW装置の上位NW装置を特定し、その故障情報を取得し、当該上位NW装置が故障発生の状態にあるかどうかを判定する。S202の判定結果がYesの場合(上位NW装置の故障発生が確認された場合)、S203に進み、対象NW装置の故障発生の真の原因が当該上位NW装置、又は更に上位のNW装置にあると判断し、当該対象NW装置についてのアラート情報の通知を抑止する。つまり、対象NW装置についての故障は、通知すべき故障ではないと判定する。
S202の判定結果がNoの場合(上位NW装置の故障発生が確認されない場合)、通知判定部110は、対象NW装置の隣接関係情報に基づいて、対象NW装置と冗長関係(並列関係と称してもよい)にあるNW装置(便宜上、これを冗長NW装置と呼ぶ)を特定し、冗長関係の種類(ここでは、Act−Sby又はAct−Act)に応じて、以下の動作を実行する。なお、ここでは、S202の判定結果がNoの場合の対象NW装置には、冗長NW装置が存在するものとしているが、冗長NW装置が存在しない場合もある。その場合、S210に進む。
まず、冗長関係がAct−Sbyである場合について説明する。この場合、図9のS204において、通知判定部110は、対象NW装置の系(Act又はSby)を判断し、ActであればS205に進み、SbyであればS206に進む。
S205(Act−Sby構成であり、かつ対象NW装置がActの場合)において、通知判定部110は、冗長NW装置についての故障発生の有無を確認し、故障があった場合、冗長NW装置及び対象NW装置の故障が真の原因である両系断と判断し、S210に進む。冗長NW装置についての故障がなかった場合、対象NW装置の故障が真の原因である片系断とし判断し、S210に進む。
S206(Act−Sby構成であり、かつ対象NW装置がSbyの場合)において、通知判定部110は、冗長NW装置についての故障発生の有無を確認し、故障があった場合、冗長NW装置及び対象NW装置の故障が真の原因である両系断と判断するが、対象NW装置がSbyのため、当該対象NW装置についてのアラート情報を通知すべきでないと判断し、抑止するとして、処理を終了する。冗長NW装置についての故障がなかった場合、対象NW装置の故障が真の原因である片系断とし判断し、S210に進む。
次に、冗長関係がAct−Actである場合について説明する。この場合、図9のS207において、通知判定部110は、対象NW装置のIDが、冗長NW装置のIDよりも小さい(つまり、対象NW装置のIDが最小である)か否かを判定し、YesであればS208に進み、NoであればS209に進む。
S208(Act−Act構成であり、かつ対象NW装置のIDが最小の場合)において、冗長NW装置に故障があった場合、冗長NW装置及び対象NW装置の故障が真の原因である両系断と判断し、S210に進む。冗長NW装置に故障がない場合、当該対象NW装置の故障が真の原因である片系断と判断し、S210に進む。
S209(Act−Act構成であり、かつ対象NW装置のIDが最小でない場合)、冗長NW装置に故障があった場合、冗長NW装置及び対象NW装置の故障が真の原因である両系断と判断するが、当該対象NW装置のIDが最小でないため、当該対象NW装置についてのアラート情報を通知すべきでないと判断し、抑止とし、処理を終了する。冗長NW装置に故障がない場合、当該対象NW装置の故障が真の原因である片系断と判断し、S210に進む。
S210において、通知判定部110は、データ格納部140を参照し、対象NW装置の隣接関係情報に基づいて、当該対象NW装置の下位のNW装置を特定し、その故障情報を取得し、真の原因(ここでは、対象NW装置の故障)による影響を調査する。ここでの調査とは、例えば、当該下位のNW装置に故障があるかどうかの調査である。
S211において、通知判定部110は、S202〜S210で得られた結果に基づいて、対象NW装置についてのアラート情報を作成し、当該アラート情報の通知を通知部120に指示し、通知部120が対象NW装置についてのアラート情報をユーザ端末200に通知する。
(通知/抑止の例)
図9に示した手順により得られる通知/抑止の例を図10に示す。図10(a)の例は、隣接関係が上位・下位であるNW装置A(Parent)とNW装置B(Child)についての例を示す。図10(a)に示すとおり、下位のNW装置Bについてのアラート情報は、NW装置AがUPかつNW装置BがDOWNの場合のみ通知がなされる。
図10(b)の例は、隣接関係がAct−Sbyの冗長関係であるNW装置A(Act)とNW装置B(Sby)についての例を示す。図10(b)に示すとおり、SbyのNW装置Bについては、NW装置AがUPかつNW装置BがDOWNの場合のみ通知がなされる。
図10(c)の例は、隣接関係がAct−Actの冗長関係であるNW装置A(Act)とNW装置B(Act)についての例を示す。図10(c)に示すように、両方がDOWNの場合、IDの小さいほうのNW装置についての通知がなされ、IDの大きいほうのNW装置については通知は抑止される。
(3台以上の冗長関係における抑止の例)
図9及び図10では、冗長関係について、2台のNW装置における冗長関係の例を示したが、これは一例にすぎない。冗長関係を構成する複数のNW装置の台数は3台以上でもよい。3台以上の場合でも、通知/抑止の判定方法は基本的にこれまでに説明した方法と同じである。
例えば、対象NW装置(故障が検知された装置)と冗長関係を有する冗長NW装置であって、故障が検知された冗長NW装置が1つ又は複数ある場合において、これら対象NW装置と1つ又は複数の冗長NW装置にActive装置とStandby装置が混在しているとする。この場合、対象NW装置がActive装置で、かつ、対象NW装置のIDがActive装置の中で最も小さい場合に、当該対象NW装置についてのアラート情報の通知を行う。それ以外のNW装置については、通知は抑止される。
また、対象NW装置(故障が検知された装置)と冗長関係を有する冗長NW装置であって、故障が検知された冗長NW装置が1つ又は複数ある場合において、これら対象NW装置と1つ又は複数の冗長NW装置が全てActive装置、又は全てStandby装置である場合、対象NW装置のIDが最も小さい場合に、当該対象NW装置についてのアラート情報の通知を行う。それ以外のNW装置については、通知は抑止される。
なお、上記の例では、通知/抑止の判断にIDを使用するが、このIDとはNW装置を識別できるものであればどのようなものでもよい。例えば、IDは、IPアドレスでもよいし、MACアドレスでもよいし、NW装置に付与した何等かのIDであってもよい。また、上記の例では、IDが最小のNW装置について通知を行うようにしているが、これも例に過ぎない。例えば、IDが最大のNW装置について通知を行うようにしても良い。また、予め決められたルールに基づき通知するか抑止するかを決定する方法であれば、これら以外のどのような方法を用いてもよい。
(通知するアラート情報の例)
対象NW装置についてアラート情報を通知する場合において、通知するアラート情報には、例えば、当該対象NW装置についての拠点、NW装置名、状態(例えば"DOWN")、故障の発生日時等が含まれる。
また、対象NW装置についてアラート情報には、当該対象NW装置に対して下位の関係にありアラート情報通知を抑止されたNW装置についての情報や、当該対象NW装置に対して冗長関係にありアラート情報通知を抑止されたNW装置についての情報が含まれていてもよい。
例えば、図10(a)の例における、NW装置AとNW装置Bの両方がDOWNした場合において、NW装置Aについてのアラート情報には、NW装置Aの情報に加えて、NW装置Bの情報(例:装置名、構成(下位装置等)、状態(DOWN等))が記載されることとしてもよい。
また、例えば、図10(b)の例における、NW装置AとNW装置Bの両方がDOWNした場合において、NW装置Aについてのアラート情報には、NW装置Aの情報に加えて、NW装置Bの情報(例:装置名、構成(Sby装置等)、状態(DOWN等))が記載されてもよい。また、図10(b)の例における、NW装置AがDOWNでNW装置BがUPの場合において、NW装置Aについてのアラート情報には、NW装置Aの情報に加えて、NW装置Bの情報(例:装置名、構成(Sby装置等)、状態(UP等))が記載されてもよい。
また、例えば、図10(c)の例における、NW装置AがDOWNでNW装置BがDOWNの場合において、NW装置AがID最小の場合に、NW装置Aについてのアラート情報には、NW装置Aの情報に加えて、NW装置Bの情報(例:装置名、構成(Act装置等)、状態(DOWN等))が記載されることとしてもよい。
(実施の形態のまとめ)
本実施の形態における技術により、ある監視対象ネットワークに対する監視を行う際に、真の故障の影響によって引き起こされる複数の故障が検出される場合でも、迅速に真の原因になる装置の故障を特定することが可能となる。
以上、説明したように、本実施の形態では、複数の装置を有する監視対象ネットワークにおける通知すべき故障を判定する故障判定装置であって、前記監視対象ネットワークの構成情報を格納するデータベースを参照する手段と、故障が検知された装置である対象装置についての構成情報を前記データベースから読み出し、当該構成情報に基づいて、当該対象装置に対して検知された故障が通知すべき故障であるか否かを判定する判定手段とを備えることを特徴とする故障判定装置が提供される。
前記判定手段は、前記構成情報に基づいて、前記対象装置と隣接関係にある装置を特定し、当該装置の故障情報に基づいて、前記対象装置に対して検知された故障が通知すべき故障であるか否かを判定する。
前記判定手段は、前記対象装置に対して上位の隣接関係にある装置に故障が検知されている場合に、前記対象装置に対して検知された故障は通知すべき故障ではないと判定することとしてもよい。
前記判定手段は、前記対象装置に対して冗長構成の隣接関係にある装置に故障が検知されている場合に、当該対象装置のIDと前記隣接関係にある装置のIDとの関係、又は、冗長構成の種類に基づいて、前記対象装置に対して検知された故障が通知すべき故障であるか否かを判定することとしてもよい。
前記故障判定装置は、前記判定手段により通知すべき故障であると判定された故障が検知された装置のアラート情報と、前記判定手段により通知すべき故障ではないと判定された故障が検知された装置のアラート情報とを含む通知をユーザ端末に対して行う通知手段を備えることとしてもよい。
本実施の形態により、前記故障判定装置と、前記データベースとを備えることを特徴とする故障判定システムが提供されてもよい。
また、本実施の形態により、複数の装置を有する監視対象ネットワークにおける通知すべき故障を判定する故障判定装置が実行する故障判定方法であって、前記故障判定装置は、前記監視対象ネットワークの構成情報を格納するデータベースを参照する手段を備え、故障が検知された装置である対象装置についての構成情報を前記データベースから読み出すステップと、読み出した前記構成情報に基づいて、前記対象装置に対して検知された故障が通知すべき故障であるか否かを判定するステップとを備えることを特徴とする故障判定方法が提供される。また、本実施の形態により、コンピュータを、前記故障判定装置における各手段として機能させるためのプログラムが提供される。
(第1項)
複数の装置を有する監視対象ネットワークにおける通知すべき故障を判定する故障判定装置であって、
前記監視対象ネットワークの構成情報を格納するデータベースを参照する手段と、
故障が検知された装置である対象装置についての構成情報を前記データベースから読み出し、当該構成情報に基づいて、当該対象装置に対して検知された故障が通知すべき故障であるか否かを判定する判定手段と
を備えることを特徴とする故障判定装置。
(第2項)
前記判定手段は、前記構成情報に基づいて、前記対象装置と隣接関係にある装置を特定し、当該装置の故障情報に基づいて、前記対象装置に対して検知された故障が通知すべき故障であるか否かを判定する
ことを特徴とする第1項に記載の故障判定装置。
(第3項)
前記判定手段は、前記対象装置に対して上位の隣接関係にある装置に故障が検知されている場合に、前記対象装置に対して検知された故障は通知すべき故障ではないと判定する
ことを特徴とする第2項に記載の故障判定装置。
(第4項)
前記判定手段は、前記対象装置に対して冗長構成の隣接関係にある装置に故障が検知されている場合に、当該対象装置のIDと前記隣接関係にある装置のIDとの関係、又は、冗長構成の種類に基づいて、前記対象装置に対して検知された故障が通知すべき故障であるか否かを判定する
ことを特徴とする第2項に記載の故障判定装置。
(第5項)
前記判定手段により通知すべき故障であると判定された故障が検知された装置のアラート情報と、前記判定手段により通知すべき故障ではないと判定された故障が検知された装置のアラート情報とを含む通知をユーザ端末に対して行う通知手段
を備えることを特徴とする第1項ないし第4項のうちいずれか1項に記載の故障判定装置。
(第6項)
第1項ないし第5項のうちいずれか1項に記載の故障判定装置と、前記データベースとを備えることを特徴とする故障判定システム。
(第7項)
複数の装置を有する監視対象ネットワークにおける通知すべき故障を判定する故障判定装置が実行する故障判定方法であって、
前記故障判定装置は、前記監視対象ネットワークの構成情報を格納するデータベースを参照する手段を備え、
故障が検知された装置である対象装置についての構成情報を前記データベースから読み出すステップと、
読み出した前記構成情報に基づいて、前記対象装置に対して検知された故障が通知すべき故障であるか否かを判定するステップと
を備えることを特徴とする故障判定方法。
(第8項)
コンピュータを、第1項ないし第5項のうちいずれか1項に記載の故障判定装置における各手段として機能させるためのプログラム。
以上、本実施の形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。

100 故障通知装置
110 通知判定部
120 通知部
130 監視部
140 データ格納部
150 ドライブ装置
151 記録媒体
152 補助記憶装置
153 メモリ装置
154 CPU
155 インタフェース装置
156 表示装置
157 入力装置
200 ユーザ端末
300 監視対象ネットワーク

Claims (7)

  1. 複数の装置を有する監視対象ネットワークにおける通知すべき故障を判定する故障判定装置であって、
    前記監視対象ネットワークの構成情報を格納するデータベースを参照する手段と、
    故障が検知された装置である対象装置についての構成情報を前記データベースから読み出し、当該構成情報に基づいて、当該対象装置に対して検知された故障が通知すべき故障であるか否かを判定する判定手段とを備え、
    前記判定手段は、前記対象装置に対して上位の隣接関係にある装置に故障が検知されている場合に、前記対象装置に対して検知された故障は通知すべき故障ではないと判定する
    ことを特徴とする故障判定装置。
  2. 複数の装置を有する監視対象ネットワークにおける通知すべき故障を判定する故障判定装置であって、
    前記監視対象ネットワークの構成情報を格納するデータベースを参照する手段と、
    故障が検知された装置である対象装置についての構成情報を前記データベースから読み出し、当該構成情報に基づいて、当該対象装置に対して検知された故障が通知すべき故障であるか否かを判定する判定手段とを備え、
    前記判定手段は、前記対象装置に対して冗長構成の隣接関係にある装置に故障が検知されている場合に、
    前記対象装置がスタンバイ装置であり、前記隣接関係にある装置がアクティブ装置であれば、前記対象装置に対して検知された故障は通知すべき故障ではないと判定し、
    前記対象装置がアクティブ装置であり、前記隣接関係にある装置もアクティブ装置であれば、前記対象装置のIDと前記隣接関係にある装置のIDとの関係に基づいて、対象装置に対して検知された故障が通知すべき故障であるか否かを判定する
    ことを特徴とする故障判定装置。
  3. 前記判定手段により通知すべき故障であると判定された故障が検知された装置のアラート情報と、前記判定手段により通知すべき故障ではないと判定された故障が検知された装置のアラート情報とを含む通知をユーザ端末に対して行う通知手段
    を備えることを特徴とする請求項1又は2に記載の故障判定装置。
  4. 請求項1ないしのうちいずれか1項に記載の故障判定装置と、前記データベースとを備えることを特徴とする故障判定システム。
  5. 複数の装置を有する監視対象ネットワークにおける通知すべき故障を判定する故障判定装置が実行する故障判定方法であって、
    前記故障判定装置は、前記監視対象ネットワークの構成情報を格納するデータベースを参照する手段を備え、
    故障が検知された装置である対象装置についての構成情報を前記データベースから読み出すステップと、
    読み出した前記構成情報に基づいて、前記対象装置に対して検知された故障が通知すべき故障であるか否かを判定する判定ステップとを備え、
    前記判定ステップにおいて、前記対象装置に対して上位の隣接関係にある装置に故障が検知されている場合に、前記対象装置に対して検知された故障は通知すべき故障ではないと判定する
    ことを特徴とする故障判定方法。
  6. 複数の装置を有する監視対象ネットワークにおける通知すべき故障を判定する故障判定装置が実行する故障判定方法であって、
    前記故障判定装置は、前記監視対象ネットワークの構成情報を格納するデータベースを参照する手段を備え、
    故障が検知された装置である対象装置についての構成情報を前記データベースから読み出すステップと、
    読み出した前記構成情報に基づいて、前記対象装置に対して検知された故障が通知すべき故障であるか否かを判定する判定ステップとを備え、
    前記判定ステップにおいて、前記対象装置に対して冗長構成の隣接関係にある装置に故障が検知されている場合に、
    前記対象装置がスタンバイ装置であり、前記隣接関係にある装置がアクティブ装置であれば、前記対象装置に対して検知された故障は通知すべき故障ではないと判定し、
    前記対象装置がアクティブ装置であり、前記隣接関係にある装置もアクティブ装置であれば、前記対象装置のIDと前記隣接関係にある装置のIDとの関係に基づいて、対象装置に対して検知された故障が通知すべき故障であるか否かを判定する
    ことを特徴とする故障判定方法。
  7. コンピュータを、請求項1ないしのうちいずれか1項に記載の故障判定装置における各手段として機能させるためのプログラム。
JP2018057155A 2018-03-23 2018-03-23 故障判定装置、故障判定システム、故障判定方法、及びプログラム Active JP6670877B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018057155A JP6670877B2 (ja) 2018-03-23 2018-03-23 故障判定装置、故障判定システム、故障判定方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018057155A JP6670877B2 (ja) 2018-03-23 2018-03-23 故障判定装置、故障判定システム、故障判定方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2019169884A JP2019169884A (ja) 2019-10-03
JP6670877B2 true JP6670877B2 (ja) 2020-03-25

Family

ID=68107619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018057155A Active JP6670877B2 (ja) 2018-03-23 2018-03-23 故障判定装置、故障判定システム、故障判定方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6670877B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024127507A1 (ja) * 2022-12-13 2024-06-20 日本電信電話株式会社 学習データ生成装置、学習データ生成方法、及び学習データ生成プログラム

Also Published As

Publication number Publication date
JP2019169884A (ja) 2019-10-03

Similar Documents

Publication Publication Date Title
US8010840B2 (en) Generation of problem tickets for a computer system
Chen et al. When software defined networks meet fault tolerance: a survey
US20090164565A1 (en) Redundant systems management frameworks for network environments
JP2011204192A (ja) スイッチング装置、情報処理装置および障害通知制御プログラム
JP6670877B2 (ja) 故障判定装置、故障判定システム、故障判定方法、及びプログラム
US20090092054A1 (en) Method for providing notifications of a failing node to other nodes within a computer network
WO2013171865A1 (ja) 管理方法及び管理システム
US8671180B2 (en) Method and system for generic application liveliness monitoring for business resiliency
CN109189854B (zh) 提供持续业务的方法及节点设备
JP2017011480A (ja) 経路制御装置、経路制御システムおよび経路制御方法
CN112217718A (zh) 一种业务处理方法、装置、设备及存储介质
JP2011203941A (ja) 情報処理装置、監視方法、および監視プログラム
JP7107789B2 (ja) 情報処理システム、情報処理方法、及び、プログラム
JP2015114952A (ja) ネットワークシステム、監視制御装置およびソフトウェア検証方法
Nasreen et al. A study on Byzantine fault tolerance methods in distributed networks
JP4806382B2 (ja) 冗長化システム
JP2006246152A (ja) パケット転送装置、パケット転送ネットワークシステムおよびパケット転送方法
CN113328933B (zh) 数据流量转发方法及系统
JP5653322B2 (ja) 障害検出装置、ネットワーク構成推定装置および障害検出方法
JP6490167B2 (ja) 通信装置、通信方法、コンピュータプログラムおよび通信システム
JP2005056347A (ja) サーバ機能引継方法およびサーバ機能引継プログラム
WO2014010021A1 (ja) 情報処理装置、情報処理システム、情報処理装置制御方法及び情報処理装置制御プログラム
JP5814842B2 (ja) 電子メール中継装置
JP2016151965A (ja) 冗長構成システム及び冗長構成制御方法
US20240275797A1 (en) Method to provide disaster recovery with reverse proxy across geographically distributed data lakes

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190730

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200302

R150 Certificate of patent or registration of utility model

Ref document number: 6670877

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250