JP2017038112A - 故障被疑箇所推定装置、故障被疑箇所推定プログラム及び故障被疑箇所推定方法 - Google Patents

故障被疑箇所推定装置、故障被疑箇所推定プログラム及び故障被疑箇所推定方法 Download PDF

Info

Publication number
JP2017038112A
JP2017038112A JP2015156626A JP2015156626A JP2017038112A JP 2017038112 A JP2017038112 A JP 2017038112A JP 2015156626 A JP2015156626 A JP 2015156626A JP 2015156626 A JP2015156626 A JP 2015156626A JP 2017038112 A JP2017038112 A JP 2017038112A
Authority
JP
Japan
Prior art keywords
failure
suspected
network
node
service monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015156626A
Other languages
English (en)
Other versions
JP6412473B2 (ja
Inventor
浩行 大西
Hiroyuki Onishi
浩行 大西
愛子 尾居
Aiko Oi
愛子 尾居
直樹 武
Naoki Take
直樹 武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015156626A priority Critical patent/JP6412473B2/ja
Publication of JP2017038112A publication Critical patent/JP2017038112A/ja
Application granted granted Critical
Publication of JP6412473B2 publication Critical patent/JP6412473B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】複数のサービス事業者が複数の事業者ネットワークに跨って通信サービスを提供する通信ネットワークにおいて、事業者ネットワークにおける故障被疑箇所を好適に推定することが可能な故障被疑箇所推定装置を提供する。
【解決手段】故障被疑箇所推定装置40は、事業者ネットワーク10内におけるノードの接続構造及び複数の事業者ネットワーク10間の接続関係を含むネットワークリソース情報が記憶される記憶部41と、複数のサービス事業者サーバ30から、障害が発生している障害発生区間を特定するサービス監視情報を取得するサービス監視情報収集部42aと、サービス監視情報に基づいて記憶部41を参照し、障害発生区間に存在するノードに故障被疑ポイントを加算することをサービス監視情報のそれぞれに含まれる障害発生区間について行い、故障被疑ポイントの最大値を有するノードが故障被疑箇所であると推定する解析部42cと、を備える。
【選択図】図1

Description

本発明は、複数のサービス事業者が複数の事業者ネットワークに跨って通信サービスを提供する通信ネットワークにおいて故障被疑箇所を推定する技術に関する。
サービス事業者がユーザ端末装置間の通信サービスを提供するにあたり、複数の事業者から事業者ネットワークを借り、複数の事業者ネットワークを跨って自社(サービス事業者)のネットワークを構築する、いわゆるB2B2Xモデルが用いられている(非特許文献1参照)。

遠藤他、「ネットワークを支えるオペレーションシステムの概要と展望」、日本信頼性学会誌vol.36 No.7 2014.10月号(通関219号)
このようなB2B2Xモデルの通信サービスでは、複数のサービス事業者が、それぞれ複数の事業者ネットワークに跨って構築された自社のネットワークの範囲内の障害を検知することができる。
しかし、このような障害検知では、事業者ネットワークが提供するネットワークリソースの障害の一部分を複数のサービス事業者が個々に検知しているにすぎないため、事業者ネットワーク内において故障の可能性が高いノード(故障被疑箇所)を推定することは困難であった。
本発明は、前記事情に鑑みて創案されたものであり、複数のサービス事業者が複数の事業者ネットワークに跨って通信サービスを提供する通信ネットワークにおいて、事業者ネットワークにおける故障被疑箇所を好適に推定することが可能な故障被疑箇所推定装置、故障被疑箇所推定プログラム及び故障被疑箇所推定方法を提供することを目的とする。
前記目的を達成するために、本発明の故障被疑箇所推定装置は、複数のサービス事業者が複数の事業者ネットワークに跨って通信サービスを提供する通信ネットワークにおいて、故障被疑箇所を推定する故障被疑箇所推定装置であって、前記事業者ネットワーク内におけるノードの接続構造、及び、複数の前記事業者ネットワーク間の接続関係を含むネットワークリソース情報が記憶される記憶部と、複数のサービス事業者サーバから、障害が発生している障害発生区間を特定するサービス監視情報を取得するサービス監視情報収集部と、前記サービス監視情報に基づいて前記ネットワークリソース情報を参照し、前記障害発生区間に存在するノードに故障被疑ポイントを加算することを、取得された前記サービス監視情報のそれぞれに含まれる前記障害発生区間について行い、前記故障被疑ポイントの最大値を有する前記ノードが前記故障被疑箇所であると推定する解析部と、を備えることを特徴とする。
かかる構成によると、複数のサービス監視サーバからのサービス監視情報に基づいて、障害が発生した通信サービスに最も多く含まれるノードが故障被疑箇所であると推定するので、複数のサービス事業者が複数の事業者ネットワークに跨って通信サービスを提供する通信ネットワークにおいて、事業者ネットワークにおける故障被疑箇所を好適に推定することができる。
前記記憶部に記憶される前記事業者ネットワークは、ツリー構造を呈しており、前記解析部は、一の前記ノードと当該ノードの下位に属する全ての前記ノードが前記故障被疑ポイントの最大値を有する場合には、一の前記ノードが前記故障被疑箇所であると推定する構成であってもよい。
かかる構成によると、一のノードと当該ノードの下位に属する全てのノードが故障被疑ポイントの最大値を有する場合には、一のノードが故障被疑箇所であると推定するので、故障被疑箇所をより好適に推定することができる。
前記記憶部に記憶される前記事業者ネットワークは、ツリー構造を呈しており、前記解析部は、一の前記ノードと当該ノードの下位に属する一部の前記ノードのみが前記故障被疑ポイントの最大値を有する場合には、一部の前記ノードが前記故障被疑箇所であると推定する構成であってもよい。
かかる構成によると、一のノードと当該ノードの下位に属する一部のノードのみが故障被疑ポイントの最大値を有する場合には、一部のノードが故障被疑箇所であると推定するので、故障被疑箇所をより好適に推定することができる。
前記解析部は、推定された前記故障被疑箇所に基づいて、前記事業者ネットワーク内におけるノードの接続構造を推定し、推定された前記接続構造に基づいて、前記記憶部に記憶された前記接続構造を更新する構成であってもよい。
かかる構成によると、推定された故障被疑箇所に基づいて事業者ネットワーク内におけるノードの接続構造を推定し、推定された接続構造に基づいて記憶部に記憶された接続構造を更新するので、その後の故障被疑箇所の推定をより好適に行うことができる。
前記故障障被疑箇所推定装置は、複数の前記事業者ネットワークをそれぞれ管理する複数のネットワーク管理サーバから、前記事業者ネットワークにおける障害対応状況を含むネットワーク情報を取得するネットワーク情報収集部を備え、前記解析部は、推定された前記故障被疑箇所と前記ネットワーク情報とを含む状況報告情報を生成し、生成された前記状況報告情報を複数の前記サービス監視サーバへ送信する構成であってもよい。
かかる構成によると、故障被疑箇所に加えて障害対応状況をサービス監視サーバへ好適に通知することができる。
また、本発明の故障被疑箇所推定プログラムは、複数のサービス事業者が複数の事業者ネットワークに跨って通信サービスを提供する通信ネットワークにおいて、故障被疑箇所を推定するためにコンピュータを、複数のサービス事業者サーバから、障害が発生している障害発生区間を特定するサービス監視情報を取得するサービス監視情報収集手段、前記事業者ネットワーク内におけるノードの接続構造、及び、複数の前記事業者ネットワーク間の接続関係を含むネットワークリソース情報が記憶される記憶手段を前記サービス監視情報に基づいて参照し、前記障害発生区間に存在するノードに故障被疑ポイントを加算することを、取得された前記サービス監視情報のそれぞれに含まれる前記障害発生区間について行い、前記故障被疑ポイントの最大値を有する前記ノードが前記故障被疑箇所であると推定する解析手段、として機能させる。
また、本発明の故障被疑箇所推定方法は、複数のサービス事業者が複数の事業者ネットワークに跨って通信サービスを提供する通信ネットワークにおいて、故障被疑箇所を推定する故障被疑箇所推定方法であって、複数のサービス事業者サーバから、障害が発生している障害発生区間を特定するサービス監視情報を取得するステップと、前記事業者ネットワーク内におけるノードの接続構造、及び、複数の前記事業者ネットワーク間の接続関係を含むネットワークリソース情報が記憶される記憶部を前記サービス監視情報に基づいて参照し、前記障害発生区間に存在するノードに故障被疑ポイントを加算することを、取得された前記サービス監視情報のそれぞれに含まれる前記障害発生区間について行い、前記故障被疑ポイントの最大値を有する前記ノードが前記故障被疑箇所であると推定するステップと、を含むことを特徴とする。
本発明によれば、複数のサービス事業者が複数の事業者ネットワークに跨って通信サービスを提供する通信ネットワークにおいて、事業者ネットワークにおける故障被疑箇所を好適に推定することができる。
本発明の実施形態に係る故障被疑箇所推定装置を備える故障被疑箇所推定システムを示す模式図である。 故障被疑箇所の推定手法を説明するための図であり、(a)は、サービス監視情報に含まれる障害発生区間を示す図、(b)は、障害発生区間を分解した結果を示す図、(c)は、事業者ネットワーク内のノードの接続構造及び事業者ネットワーク間の接続関係、並びに、故障被疑ポイントの付与結果を示す図である。 故障被疑箇所の推定手法を説明するための図であり、(a)は、サービス監視情報に含まれる障害発生区間を示す図、(b)は、障害発生区間を分解した結果を示す図、(c)は、事業者ネットワーク内のノードの接続構造及び事業者ネットワーク間の接続関係、並びに、故障被疑ポイントの加算結果を示す図である。 (a)(b)(c)は、加算された故障被疑ポイントに基づく故障被疑箇所の推定を説明するための図である。 (a)(b)(c)は、事業者ネットワーク内のノードの接続構造の推定手法を説明するための図である。 故障被疑箇所推定システムの動作例を説明するためのシーケンス図である。
続いて、本発明の実施形態について図面を参照して説明する。図1に示すように、本発明の実施形態に係る故障被疑箇所推定システム1は、複数のサービス事業者X,Y,Zが複数の事業者A,B,Cによって提供される複数の事業者ネットワーク10(10A,10B,10C)に跨って通信サービスを提供する通信ネットワーク2において、故障被疑箇所を推定するためのシステムである。故障被疑箇所推定システム1は、複数の事業者ネットワーク10(10A,10B,10C)と、複数のネットワーク管理サーバ20(20A,20B,20C)と、サービス監視サーバ30(30X,30Y,30Z)と、故障被疑箇所推定装置40と、を備える。
<事業者ネットワーク>
事業者ネットワーク10A,10B,10Cは、それぞれ、各ネットワーク事業者A,B,Cが運営するネットワークである。事業者ネットワーク10A,10B,10Cの構造については、後で説明する。
<ネットワーク管理サーバ>
ネットワーク管理サーバ20A,20B,20Cは、それぞれ、ネットワーク事業者A,B,Cごと、すなわち、事業者ネットワーク10A,10B,10Cごとに設けられており、対応する事業者ネットワーク10A,10B,10Cを管理するサーバである。ネットワーク管理サーバ20A,20B,20Cは、対応する事業者ネットワーク10A,10B,10Cにおける障害を検知する障害検知処理を実行しており、対応する事業者ネットワーク10A,10B,10Cに障害が発生した場合に、障害への対応状況、復旧見込み等を含むネットワーク情報を自動又はオペレータの手動によって生成し、生成されたネットワーク情報を故障被疑箇所推定装置40へ送信する。
<サービス監視サーバ>
サービス監視サーバ30X,30Y,30Zは、それぞれ、サービス事業者X,Y,Zごとに設けられており、対応するサービス事業者X,Y,Zが提供する通信サービスを監視するサーバである。サービス監視サーバ30X,30Y,30Zは、提供する通信サービスに障害が発生した場合に、障害発生区間(すなわち、障害が発生した通信サービスの両端点である始点及び終点)を特定するサービス監視情報を生成し、生成されたサービス監視情報を故障被疑箇所推定装置40へ送信する。本実施形態では、サービス監視情報は、サービス監視サーバ30が対応するサービス事業者を特定する情報すなわちサービス事業者IDを含む。サービス監視サーバ30X,30Y,30Zは、故障被疑箇所推定装置40を運営する事業者によって配布されるサービス監視プログラムを実装することによって、又は、サービス事業者X,Y,Zが自ら作成したサービス監視プログラムを実装することによって、前記機能を実現可能である。
<故障被疑箇所推定装置>
故障被疑箇所推定装置40は、記憶部41と、制御部42と、表示部43と、を備える。
<記憶部>
記憶部41は、ネットワークリソース情報DB41aを備える。ネットワークリソース情報DB41aは、ネットワーク事業者A,B,Cが提供する事業者ネットワーク10A,10B,10Cに関する情報が記憶されるデータベースである。ネットワークリソース情報は、事業者ネットワーク10A,10B,10Cのそれぞれにおけるノードの接続構造と、事業者ネットワーク10A,10B,10C間の接続関係と、を含む。
より詳細には、ネットワークリソース情報は、サービス事業者X,Y,Zが提供する通信サービスごとに、事業者ネットワーク10A,10B,10C間の接続関係を含む。
通信サービスごとの事業者ネットワーク10A,10B,10C間の接続関係とは、換言すると、一の通信サービスにおける各事業者ネットワーク内における始点及び終点である。
例えば、図2(b)に示すように、あるサービス事業者によって提供される、始点であるノードAM1と終点であるノードCM4とを繋ぐ通信サービスに関しては、通信サービスごとの事業者ネットワーク間の接続関係として、以下の事項が関連付けて記憶されている。
・サービス事業者ID
・通信サービスの端点であるノードAM1(事業者ネットワーク10A内の始点)
・ノードAM1と同じ事業者ネットワーク10A内の終点であるノードAM2
・ノードAM2と接続されるノードBM2(事業者ネットワーク10B内の始点)
・ノードBM2と同じ事業者ネットワーク10B内の終点であるノードBM3
・ノードBM3と接続されるノードCM3(事業者ネットワーク10C内の始点)
・通信サービスの端点であるノードCM4(事業者ネットワーク10C内の終点)
また、図3(b)に示すように、あるサービス事業者によって提供される、始点であるノードAM3と終点であるノードCM3とを繋ぐ通信サービスに関しては、通信サービスごとの事業者ネットワーク間の接続関係として、以下の事項が関連付けて記憶されている。
・サービス事業者ID
・通信サービスの端点であるノードAM3(事業者ネットワーク10A内の始点)
・ノードAM3と同じ事業者ネットワーク10A内の終点であるノードAM4
・ノードAM4と接続されるノードBM4(事業者ネットワーク10B内の始点)
・ノードBM4と同じ事業者ネットワーク10B内の終点であるノードBM3
・ノードBM3と接続される、通信サービスの端点であるノードCM3(事業者ネットワーク10C内の始点かつ終点)
なお、サービス事業者IDが他の情報と関連付けられているのは、通信サービスの始点及び終点が同じであったとしても、サービス事業者が異なれば、通信サービスの途中の経路が異なることがあるためである。
本実施形態において、各事業者ネットワーク10A,10B,10Cのノードの接続構造は、ツリー構造(すなわち階梯構造)を呈するものと仮定する。図2(c)及び図3(c)に示す例では、各事業者ネットワーク10A,10B,10Cは、下位から上位に向かって、孫ノードの3次階梯、子ノードの2次階梯、親ノードの1次階梯からなる3階梯(M→L→K)のツリー構造を呈する。
ツリー構造において、親ノードAK1(BK1又はCK1)には、2つの子ノードAL1,AL2(BL1,BL2又はCL1,CL2)が通信可能に接続されている。また、子ノードAL1(BL1又はCL1)には、2つの孫ノードAM1,AM2(BM1,BM2又はCM1,CM2)が通信可能に接続されており、子ノードAL2(BL2又はCL2)には、2つの孫ノードAM3,AM4(BM3,BM4又はCM3,CM4)が通信可能に接続されている。
ここで、孫ノードAM1〜AM4,BM1〜BM4,CM1〜CM4は、各事業者ネットワーク10A,10B,10Cにおいて、ユーザ拠点ごとに実際に設置されており、通信サービスを利用するユーザ端末装置と通信可能に接続される中継サーバである。
また、子ノードAL1,AL2,BL1,BL2,CL1,CL2は、各事業者ネットワーク10A,10B,10Cにおいて、例えば都道府県ごとに設置されていると仮定される仮想の中継サーバである。
また、親ノードAK1,AK2,AK3は、各事業者ネットワーク10A,10B,10Cにおいて、子ノードを束ねるように設置されていると仮定される仮想の中継サーバである。
ここで、親ノード及び子ノードが仮想の中継サーバであるのは、各事業者A,B,Cが事業者ネットワーク10A,10B,10Cの詳細なネットワーク構造を明らかにしないことに対応するための措置である。
また、事業者ネットワーク10A,10B,10C間の接続関係としては、例えば、事業者ネットワーク10Aの孫ノードAM1,AM2,AM3,AM4は、事業者ネットワーク10Bの孫ノードBM1,BM2,BM3,BM4とそれぞれ接続されている。また、事業者ネットワーク10Bの孫ノードBM1,BM2,BM3,BM4は、事業者ネットワーク10Cの孫ノードCM1,CM2,CM3,CM4とそれぞれ接続されている。
サービス事業者X,Y,Zによって提供される通信サービスにおいて、一のユーザ端末装置(図示せず)は、一の孫ノードに接続されるとともに、事業者ネットワーク10A,10B,10Cを介して、他の孫ノードに接続された他のユーザ端末装置(図示せず)と通信を行う。
<制御部>
図1に示すように、制御部42は、機能部として、サービス監視情報収集部42aと、ネットワーク情報収集部42bと、解析部42cと、を備える。
サービス監視情報収集部42aは、サービス監視サーバ30X,30Y,30Zから送信されたサービス監視情報を取得し、取得されたサービス監視情報を解析部42cへ出力する。
ネットワーク情報収集部42bは、ネットワーク管理サーバ20A,20B,20Cから送信されたネットワーク情報を取得し、取得されたネットワーク情報を解析部42cへ出力する。
解析部42cは、サービス監視情報収集部42aから出力されたサービス監視情報を取得し、取得されたサービス監視情報に基づいてネットワークリソース情報DB41aに記憶されるネットワークリソース情報を参照し、障害発生区間に存在するノードに故障被疑ポイントを加算することを、取得された全てのサービス監視情報の障害発生区間について行い、故障被疑ポイントが最も大きいノードが故障被疑箇所であると推定する。故障被疑ポイントは、各ノードに対して付与されるポイントであって、初期値が0であり、当該ノードが一のサービス監視情報の障害発生区間に含まれる場合に1ポイントが付与され、全てのサービス監視情報について積算される値である。解析部42cは、故障被疑箇所の推定結果を表示部43へ出力したり、サービス監視サーバ30X,30Y,30Zへ送信したりする。
<故障被疑箇所の推定手法>
事業者ネットワーク10A,10B,10Cのノードに故障が発生した場合には、サービス事業者X,Y、Zによって提供される通信サービスに障害が発生する。サービス監視サーバ30X,30Y,30Zは、障害が発生した通信サービスに関するサービス監視情報を生成し、生成されたサービス監視情報を故障被疑箇所推定装置40へ送信する。
例えば、図2(a)に示すように、一のサービス監視情報が障害発生区間として始点がノードAM1であり終点がノードCM4であることを示す場合には、解析部42cは、サービス監視情報に含まれる始点ノードAM1、終点ノードCM4及びサービス事業者IDを用いてネットワークリソース情報を参照し、始点ノードAM1、終点ノードCM4及び通信サービスIDに該当する通信サービスごとの事業者ネットワーク間の接続関係によって、障害発生区間を事業者ネットワーク10A,10B,10Cごとの区間に分解する。この場合には、図2(b)に示すように、障害発生区間AM1→CM4は、事業者ネットワーク10Aの区間AM1→AM2、事業者ネットワーク10Bの区間BM2→BM3、事業者ネットワーク10Cの区間CM3→CM4に分解される。また、図2(c)に示すように、解析部42cは、事業者ネットワーク10A,10B,10C内におけるノードの接続構造を参照して、障害発生区間AM1→CM4に存在する通過ノードAM1,AL1,AM2,BM2,BL1,BK1,BL2,BM3,CM3,CL2,CM4に、故障被疑ポイントを1ポイント加算する。
続いて、図3(a)に示すように、他のサービス監視情報が障害発生区間として始点がノードAM3であり終点がノードCM3であることを示す場合には、解析部42cは、サービス監視情報に含まれる始点ノードAM3、終点ノードCM3及びサービス事業者IDを用いてネットワークリソース情報を参照し、始点ノードAM3、終点ノードCM3及び通信サービスIDに該当する通信サービスごとの事業者ネットワーク間の接続関係によって、障害発生区間を事業者ネットワーク10A,10B,10Cごとの区間に分解する。この場合には、図3(b)に示すように、障害発生区間AM3→CM3は、事業者ネットワーク10Aの区間AM3→AM4、事業者ネットワーク10Bの区間BM4→BM3、事業者ネットワーク10Cの区間CM3に分解される。また、図3(c)に示すように、解析部42cは、事業者ネットワーク10A,10B,10C内におけるノードの接続構造を参照して、障害発生区間AM3→CM3に存在する通過ノードAM3,AL2,AM4,BM4,BL2,BM3,CM3に、故障被疑ポイントを1ポイント加算する。
図4に示すように、解析部42cは、全てのサービス監視情報に対して前記処理を繰り返し、故障被疑ポイントの最大値を有するノード(図4(a)に示す例では、54ポイントのノードAL2)が故障被疑箇所であると推定する。これは、故障被疑ポイントが最大値を有するノードは、サービス監視情報に含まれる割合が最も高いものであるため、かかるノードの故障によって通信サービスの障害が発生していると推定されるためのである。
なお、図4(b)に示すように、解析部42cは、一のノードAL2と当該ノードAL2の下位に属する全てのノードAM3,AM4が故障被疑ポイントの最大値を有する場合には、一のノードAL2が故障被疑箇所であると推定する。これは、下位ノードAM3,AM4の故障被疑ポイントが高いのは、上位ノードAL2が故障していることの影響であると推定されるためである。
また、図4(c)に示すように、解析部42cは、一のノードAL2と当該ノードAL2の下位に属する一部のノードAM4のみが故障被疑ポイントの最大値を有する場合には、一部のノードAM4が故障被疑箇所であると推定する。これは、上位ノードAL2の故障被疑ポイントが高いのは、下位ノードAM4が故障していることの影響であると推定されるためである。
故障被疑ポイントの加算については、最初に受信したサービス監視情報の受信時刻から所定期間内に受信したサービス監視情報に対して行われ、故障被疑箇所が推定された後にリセットされる構成とすることができる。また、所定間隔で故障被疑ポイントのリセットが行われ、リセットされる直前の故障被疑ポイントに基づいて故障被疑箇所が推定される構成であってもよい。
また、解析部42cは、故障被疑箇所の推定を所定期間実行して記憶部41に記憶させ、ある程度の長さを有する期間内における故障被疑箇所の発生傾向に基づいて、事業者ネットワーク10A,10B,10C内におけるノードの接続構造(すなわち、トポロジー)を推定し、推定された接続構造に基づいてネットワークリソース情報DB内のネットワークリソース情報を更新することができる。
図5(a)に示す事業者ネットワーク10Aにおいて、以下のような故障被疑箇所の発生傾向が生じることが考えられる。
・ノードAL1,AM1,AM2の故障被疑ポイントのみがともに最大値となるような故障(例えば、ノードAL1,AM1,AM2の故障被疑ポイントが54ポイントで最大値、ノードAL2,AM3,AM4の故障被疑ポイントは36ポイント)が発生している
・ノードAL2,AM3,AM4の故障被疑ポイントのみがともに最大値となるような故障(例えば、ノードAL2,AM3,AM4の故障被疑ポイントが54ポイントで最大値、ノードAL1,AM1,AM2の故障被疑ポイントは36ポイント)が発生している
・ノードAL1,AL2,AM1,AM2,AM3,AM4の故障被疑ポイントがともに最大値となるような故障(例えば、ノードAL1,AM1,AM2,AL2,AM3,AM4の故障被疑ポイントが54ポイントで最大値)が発生している
このような場合には、解析部42cは、親ノードAK1と子ノードAL1,AL2との間に、子ノードAL1,AL2を束ねる1.5次階梯となるノードAN1があると推定する(図5(b)参照)。解析部42cは、ノードAN1を有する事業者ネットワーク10Aのトポロジーを用いてネットワークリソース情報を更新する。
また、図5(a)に示す事業者ネットワーク10Aにおいて、以下のような故障被疑箇所の発生傾向が生じることが考えられる。
・ノードAL3,AL4,AM5,AM6,AM7,AM8の故障被疑ポイントがともに最大値となるような故障(例えば、ノードAL3,AM5,AM6,AL4,AM7,AM8の故障被疑ポイントが54ポイントで最大値)が発生している
・ノードAL3,AM5,AM6の故障被疑ポイントのみがともに最大値となるような故障(例えば、ノードAL3,AM5,AM6の故障被疑ポイントが54ポイントで最大値、ノードAL4,AM7,AM8の故障被疑ポイントは36ポイント)は発生していない
・ノードAL4,AM7,AM8の故障被疑ポイントのみがともに最大値となるような故障(例えば、ノードAL4,AM7,AM8の故障被疑ポイントが54ポイントで最大値、ノードAL3,AM5,AM6の故障被疑ポイントは36ポイント)は発生していない
このような場合には、解析部42cは、子ノードAL3,AL4が一つの子ノードAL5であると推定する(図5(c)参照)。解析部42cは、子ノードAL3,AL4に代えて孫ノードAM5,AM6,AM7,AM8を束ねる子ノードAL5を有する事業者ネットワーク10Aのトポロジーを用いてネットワークリソース情報を更新する。
表示部43は、解析部42cから出力された故障被疑箇所の推定結果等を表示するモニタである。
<動作例>
続いて、本発明の実施形態に係る故障被疑箇所推定システム1の動作例について、図6を参照して説明する(適宜図1参照)。サービス事業者X,Y、Zによって提供される通信サービスに障害が発生すると、サービス監視サーバ30X,30Y,30Zは、障害が発生した通信サービスに関するサービス監視情報を生成し、生成されたサービス監視情報を故障被疑箇所推定装置40へ送信する。故障被疑箇所推定装置40のサービス監視情報収集部42aは、サービス監視サーバ30X,30Y,30Zによって送信されたサービス監視情報を収集し(ステップS1)、取得されたサービス監視情報を解析部42cへ出力する。
解析部42cは、取得されたサービス監視情報に基づいてネットワークリソース情報DB41aを参照し、サービス監視情報に含まれる障害発生区間に該当するネットワークリソース情報を収集する(ステップS2)。
続いて、解析部42cは、前記した手法に基づいて、故障被疑箇所を推定する(ステップS3)。
続いて、ネットワーク情報収集部42bは、ネットワーク管理サーバ20A,20B,20Cによって送信されたネットワーク情報を収集し(ステップS4)、取得されたネットワーク情報を解析部42cへ出力する。
ここで、ネットワーク情報の収集に際して、ネットワーク情報収集部42bが、解析部42cによって故障被疑箇所であると推定されたノードを有する事業者ネットワーク10(例えば、10A)に対応するネットワーク管理サーバ20(例えば、20A)に対してネットワーク情報要求信号を送信する構成であってもよい。この場合には、ネットワーク情報要求信号を受信したネットワーク管理サーバ20(例えば、20A)が、ネットワーク情報を送信することができる。
なお、ネットワーク管理サーバ20A,20B,20Cが、ネットワーク情報要求信号の受信によらずにネットワーク情報を送信する場合には、ステップS4におけるネットワーク情報収集は、ステップS1〜ステップS3と並行して実行されてもよい。
解析部42cは、故障被疑箇所の推定結果と取得されたネットワーク情報とに基づいて、状況報告情報を生成し(ステップS5)、生成された状況報告情報をサービス監視サーバ30X,30Y,30Z及びネットワーク管理サーバ20A,20B,20Cへ送信する(ステップS6)。
例えば、故障被疑箇所であると推定されたノードが含まれる事業者ネットワーク10(例えば、10A)に対応するネットワーク管理サーバ20(例えば、20A)からのネットワーク情報が収集されている場合には、解析部42cは、故障被疑箇所であると推定されたノードを示す情報及びネットワーク情報を含む状況報告情報を生成し、生成された状況報告情報を各サービス監視サーバ30X,30Y,30Zへ送信する。
また、故障被疑箇所であると推定されたノードが含まれる事業者ネットワーク10(例えば、10A)に対応するネットワーク管理サーバ20(例えば、20A)からのネットワーク情報が収集されていない場合には、解析部42cは、故障被疑箇所であると推定されたノードを示す情報と事業者ネットワーク10(例えば、10A)における障害の再検知要求とを含む状況報告情報を生成し、生成された状況報告情報を、故障被疑箇所であると推定されたノードが含まれる事業者ネットワーク10(例えば、10A)に対応するネットワーク管理サーバ20(例えば、20A)へ送信する。さらに、解析部42cは、故障被疑箇所について解析中である旨を示す状況報告情報を生成し、生成された状況報告情報を各サービス監視サーバ30X,30Y,30Zへ送信する。
また、故障被疑箇所であると推定されたノードが含まれる事業者ネットワーク10(例えば、10A)に対応するネットワーク管理サーバ20(例えば、20A)以外からのネットワーク情報が収集されている場合には、解析部42cは、当該ネットワーク情報を含む状況報告情報を生成し、生成された状況報告情報を各サービス監視サーバ30X,30Y,30Zへ送信する。
本発明の実施形態に係る故障被疑箇所推定装置40は、複数のサービス監視サーバ30X,30Y,30Zからのサービス監視情報に基づいて、障害が発生した通信サービスに最も多く含まれるノードが故障被疑箇所であると推定するので、複数のサービス事業者が複数の事業者ネットワークに跨って通信サービスを提供する通信ネットワークにおいて、事業者ネットワークにおける故障被疑箇所を好適に推定することができる。
また、故障被疑箇所推定装置40は、一のノードと当該ノードの下位に属する全てのノードが故障被疑ポイントの最大値を有する場合には、一のノードが故障被疑箇所であると推定するので、故障被疑箇所をより好適に推定することができる。
また、故障被疑箇所推定装置40は、一のノードと当該ノードの下位に属する一部のノードのみが故障被疑ポイントの最大値を有する場合には、一部のノードが故障被疑箇所であると推定するので、故障被疑箇所をより好適に推定することができる。
また、故障被疑箇所推定装置40は、推定された故障被疑箇所に基づいて事業者ネットワーク10A,10B,10C内におけるノードの接続構造を推定し、推定された接続構造に基づいてネットワークリソース情報DB41aに記憶された接続構造を更新するので、その後の故障被疑箇所の推定をより好適に行うことができる。
また、故障被疑箇所推定装置40は、推定された故障被疑箇所と収集されたネットワーク情報との組み合わせに鑑みて、故障被疑箇所に加えて障害対応状況をサービス監視サーバへ好適に通知したりすることができる。
以上、本発明の実施形態について説明したが、本発明は前記実施形態に限定されず、本発明の要旨を逸脱しない範囲で適宜変更可能である。
例えば、ネットワークリソース情報DB41aに記憶される事業者ネットワーク10A,10B,10Cは、3階梯のツリー構造に限定されず、2階梯又は4階梯以上のツリー構造であってもよく、メッシュ構造を呈してもよく、ツリー構造とメッシュ構造とを組み合わせた構造を呈してもよい。
また、ネットワークリソース情報DB41aにおいて、サービス事業者が提供する通信サービスごとに、当該通信サービスにおける事業者ネットワークごとの始点及び終点を省略する構成であってもよい。
また、ネットワーク情報収集部42b及び当該ネットワーク情報収集部42bが関与するステップS4〜S6を省略し、解析部42cが故障被疑箇所の推定結果をサービス監視サーバ30X,30Y,30Zへ送信する構成であってもよい。
また、本発明は、コンピュータを故障被疑箇所推定装置40として機能させる故障被疑箇所推定プログラムとしても具現化可能である。
1 故障被疑箇所推定システム
2 通信ネットワーク
10(10A,10B,10C) 事業者ネットワーク
20(20A,20B,20C) ネットワーク管理サーバ
30(30X,30Y,30Z) サービス監視サーバ
40 故障被疑箇所推定装置
41 記憶部
42a サービス監視情報収集部
42b ネットワーク情報収集部
42c 解析部

Claims (7)

  1. 複数のサービス事業者が複数の事業者ネットワークに跨って通信サービスを提供する通信ネットワークにおいて、故障被疑箇所を推定する故障被疑箇所推定装置であって、
    前記事業者ネットワーク内におけるノードの接続構造、及び、複数の前記事業者ネットワーク間の接続関係を含むネットワークリソース情報が記憶される記憶部と、
    複数のサービス事業者サーバから、障害が発生している障害発生区間を特定するサービス監視情報を取得するサービス監視情報収集部と、
    前記サービス監視情報に基づいて前記ネットワークリソース情報を参照し、前記障害発生区間に存在するノードに故障被疑ポイントを加算することを、取得された前記サービス監視情報のそれぞれに含まれる前記障害発生区間について行い、前記故障被疑ポイントの最大値を有する前記ノードが前記故障被疑箇所であると推定する解析部と、
    を備えることを特徴とする故障被疑箇所推定装置。
  2. 前記記憶部に記憶される前記事業者ネットワークは、ツリー構造を呈しており、
    前記解析部は、一の前記ノードと当該ノードの下位に属する全ての前記ノードが前記故障被疑ポイントの最大値を有する場合には、一の前記ノードが前記故障被疑箇所であると推定する
    ことを特徴とする請求項1に記載の故障被疑箇所推定装置。
  3. 前記記憶部に記憶される前記事業者ネットワークは、ツリー構造を呈しており、
    前記解析部は、一の前記ノードと当該ノードの下位に属する一部の前記ノードのみが前記故障被疑ポイントの最大値を有する場合には、一部の前記ノードが前記故障被疑箇所であると推定する
    ことを特徴とする請求項1又は請求項2に記載の故障被疑箇所推定装置。
  4. 前記解析部は、推定された前記故障被疑箇所に基づいて、前記事業者ネットワーク内におけるノードの接続構造を推定し、推定された前記接続構造に基づいて、前記記憶部に記憶された前記接続構造を更新する
    ことを特徴とする請求項1から請求項3のいずれか一項に記載の故障被疑箇所推定装置。
  5. 複数の前記事業者ネットワークをそれぞれ管理する複数のネットワーク管理サーバから、前記事業者ネットワークにおける障害対応状況を含むネットワーク情報を取得するネットワーク情報収集部を備え、
    前記解析部は、推定された前記故障被疑箇所と前記ネットワーク情報とを含む状況報告情報を生成し、生成された前記状況報告情報を複数の前記サービス監視サーバへ送信する
    ことを特徴とする請求項1から請求項4のいずれか一項に記載の故障被疑箇所推定装置。
  6. 複数のサービス事業者が複数の事業者ネットワークに跨って通信サービスを提供する通信ネットワークにおいて、故障被疑箇所を推定するためにコンピュータを、
    複数のサービス事業者サーバから、障害が発生している障害発生区間を特定するサービス監視情報を取得するサービス監視情報収集手段、
    前記事業者ネットワーク内におけるノードの接続構造、及び、複数の前記事業者ネットワーク間の接続関係を含むネットワークリソース情報が記憶される記憶手段を前記サービス監視情報に基づいて参照し、前記障害発生区間に存在するノードに故障被疑ポイントを加算することを、取得された前記サービス監視情報のそれぞれに含まれる前記障害発生区間について行い、前記故障被疑ポイントの最大値を有する前記ノードが前記故障被疑箇所であると推定する解析手段、
    として機能させる故障被疑箇所推定プログラム。
  7. 複数のサービス事業者が複数の事業者ネットワークに跨って通信サービスを提供する通信ネットワークにおいて、故障被疑箇所を推定する故障被疑箇所推定方法であって、
    複数のサービス事業者サーバから、障害が発生している障害発生区間を特定するサービス監視情報を取得するステップと、
    前記事業者ネットワーク内におけるノードの接続構造、及び、複数の前記事業者ネットワーク間の接続関係を含むネットワークリソース情報が記憶される記憶部を前記サービス監視情報に基づいて参照し、前記障害発生区間に存在するノードに故障被疑ポイントを加算することを、取得された前記サービス監視情報のそれぞれに含まれる前記障害発生区間について行い、前記故障被疑ポイントの最大値を有する前記ノードが前記故障被疑箇所であると推定するステップと、
    を含むことを特徴とする故障被疑箇所推定方法。
JP2015156626A 2015-08-07 2015-08-07 故障被疑箇所推定装置、故障被疑箇所推定プログラム及び故障被疑箇所推定方法 Active JP6412473B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015156626A JP6412473B2 (ja) 2015-08-07 2015-08-07 故障被疑箇所推定装置、故障被疑箇所推定プログラム及び故障被疑箇所推定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015156626A JP6412473B2 (ja) 2015-08-07 2015-08-07 故障被疑箇所推定装置、故障被疑箇所推定プログラム及び故障被疑箇所推定方法

Publications (2)

Publication Number Publication Date
JP2017038112A true JP2017038112A (ja) 2017-02-16
JP6412473B2 JP6412473B2 (ja) 2018-10-24

Family

ID=58047933

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015156626A Active JP6412473B2 (ja) 2015-08-07 2015-08-07 故障被疑箇所推定装置、故障被疑箇所推定プログラム及び故障被疑箇所推定方法

Country Status (1)

Country Link
JP (1) JP6412473B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111817901A (zh) * 2020-08-03 2020-10-23 腾讯科技(深圳)有限公司 一种故障工单处理方法、设备和计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006229421A (ja) * 2005-02-16 2006-08-31 Matsushita Electric Ind Co Ltd ネットワーク故障診断装置
JP2008172655A (ja) * 2007-01-15 2008-07-24 Nec Corp ネットワークシステム、通信品質劣化区間の推定方法およびプログラム
JP2011211358A (ja) * 2010-03-29 2011-10-20 Kddi Corp ネットワークの品質劣化箇所推定装置
JP2012182739A (ja) * 2011-03-02 2012-09-20 Oki Electric Ind Co Ltd 異常リンク推定装置、異常リンク推定方法、プログラムおよび異常リンク推定システム
JP2014239315A (ja) * 2013-06-07 2014-12-18 株式会社野村総合研究所 ネットワーク障害解析システムおよびネットワーク障害解析プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006229421A (ja) * 2005-02-16 2006-08-31 Matsushita Electric Ind Co Ltd ネットワーク故障診断装置
JP2008172655A (ja) * 2007-01-15 2008-07-24 Nec Corp ネットワークシステム、通信品質劣化区間の推定方法およびプログラム
JP2011211358A (ja) * 2010-03-29 2011-10-20 Kddi Corp ネットワークの品質劣化箇所推定装置
JP2012182739A (ja) * 2011-03-02 2012-09-20 Oki Electric Ind Co Ltd 異常リンク推定装置、異常リンク推定方法、プログラムおよび異常リンク推定システム
JP2014239315A (ja) * 2013-06-07 2014-12-18 株式会社野村総合研究所 ネットワーク障害解析システムおよびネットワーク障害解析プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111817901A (zh) * 2020-08-03 2020-10-23 腾讯科技(深圳)有限公司 一种故障工单处理方法、设备和计算机可读存储介质
CN111817901B (zh) * 2020-08-03 2024-03-15 腾讯科技(深圳)有限公司 一种故障工单处理方法、设备和计算机可读存储介质

Also Published As

Publication number Publication date
JP6412473B2 (ja) 2018-10-24

Similar Documents

Publication Publication Date Title
US11296923B2 (en) Network fault originator identification for virtual network infrastructure
US8356093B2 (en) Apparatus and system for estimating network configuration
JP6307453B2 (ja) リスク評価システムおよびリスク評価方法
US9372995B2 (en) Vulnerability countermeasure device and vulnerability countermeasure method
JP6097889B2 (ja) 監視システム、監視装置、および検査装置
JP2011076292A (ja) 取得可能な機器情報に応じた障害原因解析ルールの設計方法及び計算機
US20060123278A1 (en) Method and apparatus for generating diagnoses of network problems
JP5423677B2 (ja) 障害解析装置、コンピュータプログラムおよび障害解析方法
JP2011210064A (ja) ログ情報収集システム、装置、方法及びプログラム
US9641595B2 (en) System management apparatus, system management method, and storage medium
JP2016099938A (ja) イベント分析システムおよび方法
JP5342082B1 (ja) ネットワーク障害解析システムおよびネットワーク障害解析プログラム
JP2011204192A (ja) スイッチング装置、情報処理装置および障害通知制御プログラム
JP5560641B2 (ja) データ管理装置、データ管理プログラムおよびデータ管理方法
CN103634166A (zh) 一种设备存活检测方法及装置
JP6412473B2 (ja) 故障被疑箇所推定装置、故障被疑箇所推定プログラム及び故障被疑箇所推定方法
JP5504200B2 (ja) 警報集約装置及び警報集約方法
JPWO2013161522A1 (ja) ログ収集サーバ、ログ収集システム、ログ収集方法
JP2014053658A (ja) 障害部位推定システムおよび障害部位推定プログラム
JP4589939B2 (ja) 接続情報管理方法及び装置及びプログラム
JP6467365B2 (ja) 故障解析装置、故障解析プログラムおよび故障解析方法
JP2014036310A (ja) 影響評価装置及び影響評価方法
JP6835700B2 (ja) 通信障害区間切り分け装置、通信障害区間切り分け方法、及びプログラム
KR101331853B1 (ko) 홈 네트워크 시스템의 오류 처리 프레임워크 및 이를 이용한 오류 처리 방법
CN108322315A (zh) 一种大规模通信网络路由交换设备软件故障诊断方法、系统和设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180717

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180925

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180928

R150 Certificate of patent or registration of utility model

Ref document number: 6412473

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150