JP6595960B2 - ネットワーク監視装置、ネットワーク監視方法及びネットワーク監視プログラム - Google Patents

ネットワーク監視装置、ネットワーク監視方法及びネットワーク監視プログラム Download PDF

Info

Publication number
JP6595960B2
JP6595960B2 JP2016172331A JP2016172331A JP6595960B2 JP 6595960 B2 JP6595960 B2 JP 6595960B2 JP 2016172331 A JP2016172331 A JP 2016172331A JP 2016172331 A JP2016172331 A JP 2016172331A JP 6595960 B2 JP6595960 B2 JP 6595960B2
Authority
JP
Japan
Prior art keywords
monitoring
combination
network
item
monitoring item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016172331A
Other languages
English (en)
Other versions
JP2018038022A (ja
Inventor
愛子 尾居
浩行 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016172331A priority Critical patent/JP6595960B2/ja
Publication of JP2018038022A publication Critical patent/JP2018038022A/ja
Application granted granted Critical
Publication of JP6595960B2 publication Critical patent/JP6595960B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、ネットワークを監視する技術に関する。
本願出願人は、通信ネットワーク上で提供されるE2E(End to End)サービスの性能を評価するために、MIB(Management Information Base)情報を用いて劣化箇所を特定する技術を提案している(特許文献1参照)。
特開2006−33715号公報
しかし、特許文献1に記載の技術は、1事業者内に閉じたE2Eサービスを想定したものであり、他事業者のMIB情報を取得することは困難であるため、複数事業者を跨いだE2Eサービスに対して適用することは困難である。また、特許文献1に記載の技術は、1事業者内に閉じたE2Eサービスであっても、サービスが大規模な場合には、経路上の全ての装置からMIB情報を収集して解析することは難しいという問題を有している。
一方、本願出願人は、複数事業者を跨いだE2Eサービスにおいて故障被疑箇所を推定する技術を提案している(特願2015−156626)。かかる技術では、複数のサービス監視情報に基づいて、障害が発生した通信サービスに最も多く含まれるノードが故障被疑箇所であると推定している。
しかし、かかる技術は、E2Eサービス監視の具体的な手法については言及されていない。また、かかる技術は、単一の故障を対象としており、多重故障を想定したものではない。また、かかる技術は、故障被疑箇所を推定するために、一般的には公開されていないISP網の構成情報(の推定)を必要とする。
これに対し、本願出願人は、複数事業者を跨いだE2Eサービスや大規模なE2Eサービスにおいても故障被疑箇所を好適に推定する技術を提案している(特願2016−033992)。
しかし、かかる技術は、webブラウザの使用を前提としており、例えばデジタルカメラの画像データをクラウド上に保存する等というネットワークには対応していない。そのため、webブラウザの使用以外でもネットワーク監視を行うことが可能な技術が望まれていた。また、かかる技術では、故障被疑箇所を推定するための監視区間が、通信ネットワークの各部位におけるwebページ読込に要する各種処理時間等に対応して予め設定されており、種々のネットワークの構成に対応して監視区間を好適に設定することは困難である。
本発明は、前記事情に鑑みて創案されたものであり、webブラウザの使用以外でもネットワーク監視を行うことができ、かつ、監視区間を好適に設定することが可能なネットワーク監視装置、ネットワーク監視方法及びネットワーク監視プログラムを提供することを課題とする。
前記課題を解決するため、本発明のネットワーク監視装置は、ネットワークを構成するノードの監視項目に対して、当該監視項目の特徴を示すタグを設定するタグ設定部と、設定された前記タグに基づいて、1つ以上の前記監視項目の組み合わせを決定するとともに、前記タグに含まれる監視対象に基づいて、組み合わせが決定された前記監視項目の監視区間を決定する監視項目組み合わせ決定部と、前記ノードから前記監視項目を取得する監視項目取得部と、決定された前記組み合わせに基づいて、取得された前記監視項目を前記監視区間内において組み合わせる監視項目組み合わせ部と、を備えることを特徴とする。
かかる構成によると、監視項目に対して自動又は手動でタグを設定し、設定されたタグに基づいて組み合わせ監視項目及び当該監視項目の監視区間を生成するので、webブラウザの使用以外でもネットワーク監視を行うことができ、かつ、監視区間を好適に設定することができる。
前記タグは、前記監視項目の属性、単位及び取得周期のうち、前記属性を含む少なくとも一つをさらに含み、前記監視項目組み合わせ決定部は、前記属性、前記単位及び前記取得周期のうち、前記属性を含む少なくとも一つに基づいて、2つ以上の前記監視項目を組み合わせるように前記組み合わせを決定する構成であってもよい。
かかる構成によると、様々な監視区間を有する組み合わせ監視項目を得ることができる。
また、前記タグは、必須ペア番号をさらに含み、前記監視項目組み合わせ決定部は、必須ペア番号が同一である2つ以上の前記監視項目を組み合わせるように前記組み合わせを決定する構成であってもよい。
かかる構成によると、様々な監視区間を有する組み合わせ監視項目を得ることができる。
また、本発明のネットワーク監視方法は、ネットワーク監視装置が、ネットワークを構成するノードの監視項目に対して、当該監視項目の特徴を示すタグを設定するタグ設定ステップと、設定された前記タグに基づいて、1つ以上の前記監視項目の組み合わせを決定するとともに、前記タグに含まれる監視対象に基づいて、組み合わせが決定された前記監視項目の監視区間を決定する監視項目組み合わせ決定ステップと、前記ノードから前記監視項目を取得する監視項目取得ステップと、決定された前記組み合わせに基づいて、取得された前記監視項目を前記監視区間内において組み合わせる監視項目組み合わせステップと、を実行することを特徴とする。
かかる構成によると、監視項目に対して自動又は手動でタグを設定し、設定されたタグに基づいて組み合わせ監視項目及び当該監視項目の監視区間を生成するので、webブラウザの使用以外でもネットワーク監視を行うことができ、かつ、監視区間を好適に設定することができる。
前記タグは、前記監視項目の属性、単位及び取得周期のうち、前記属性を含む少なくとも一つをさらに含み、前記監視項目組み合わせ決定ステップにおいて、前記ネットワーク監視装置が、前記属性、前記単位及び前記取得周期のうち、前記属性を含む少なくとも一つに基づいて、2つ以上の前記監視項目を組み合わせるように前記組み合わせを決定する構成であってもよい。
かかる構成によると、様々な監視区間を有する組み合わせ監視項目を得ることができる。
また、前記タグは、必須ペア番号をさらに含み、前記監視項目組み合わせ決定ステップにおいて、前記ネットワーク監視装置が、必須ペア番号が同一である2つ以上の前記監視項目を組み合わせるように前記組み合わせを決定する構成であってもよい。
かかる構成によると、様々な監視区間を有する組み合わせ監視項目を得ることができる。
また、本発明は、コンピュータを前記ネットワーク監視装置として機能させるためのネットワーク監視プログラムとしても具現化可能である。
本発明によると、webブラウザの使用以外でもネットワーク監視を行うことができ、かつ、監視区間を好適に設定することができる。
本発明の実施形態に係るネットワーク監視装置を備えるネットワーク監視システムを模式的に示す図である。 (a)は第一のネットワークを模式的に示す図、(b)は監視項目を模式的に示す図、(c)は組み合わせ監視項目を模式的に示す図である。 第二のネットワークと、その監視項目及び組み合わせ項目と、を模式的に示す図である。 (a)第三のネットワークを模式的に示す図、(b)は故障被疑区間推定の例を模式的に示す図である。
<ネットワーク監視システム>
続いて、本発明の実施形態について図面を参照して説明する。図1に示すように、本発明の実施形態に係るネットワーク監視システム1は、端末装置2とネットワーク3との通信を用いて、ネットワーク3(及び端末装置2)を監視し、ネットワーク3(及び端末装置2)の状態を推定する(ネットワーク3内(及び端末装置2)における故障被疑区間を推定する)ためのシステムである。ネットワーク監視システム1は、ネットワーク3と、ネットワーク監視装置4と、を備える。
<端末装置>
端末装置2は、ユーザによって使用されるコンピュータ、携帯電話、デジタルカメラ等といった端末装置である。端末装置2は、ネットワーク3のいずれかのノードNと通信可能に接続されている。ある種の端末装置2は、当該端末装置2の監視項目を当該監視項目の測定周期ごとに測定し、測定された監視項目をネットワーク監視装置4へ送信する。すなわち、監視項目の測定及び送信を行う端末装置2は、ネットワーク3のノードNであるともいえる。
<ネットワーク>
ネットワーク3は、複数のノードNによって構成されている。複数のノードNは、互いに通信可能に接続されている。ノードNは、当該ノードNの監視項目を当該監視項目の測定周期ごとに測定し、測定された監視項目をネットワーク監視装置4へ送信する。かかるネットワークにおける複数のノードNの接続関係すなわちネットワーク構成情報は、既知である。
なお、端末装置2及びネットワーク3のノードNからネットワーク監視装置4への監視項目の送信に関しては、前記した端末装置2及びノードNによる自発的かつ定期的な送信に限定されない。例えば、端末装置2及びネットワーク3が監視項目を測定して蓄積しておき、ネットワーク監視装置4の監視項目取得部35が監視項目要求信号を端末装置2及びネットワーク3のノードNへ(例えば定期的に)送信し、かかる監視項目要求信号を受信した端末装置2及びノードNが、蓄積された監視項目を送信する構成であってもよい。すなわち、ネットワーク監視装置4が、端末装置2及びノードNへアクセスすることによって、端末装置2及びノードNに蓄積された監視項目を能動的に取得することも可能である。
<ネットワーク監視装置>
ネットワーク監視装置4は、ネットワーク3を監視し、ネットワーク3内における故障被疑区間を推定する装置である。ネットワーク監視装置4は、操作部10と、通知部20と、制御部30と、を備える。
<操作部>
操作部10は、キーボード、マウス等によって構成されている。ユーザによる操作部10の操作結果は、制御部30へ出力される。
<通知部>
通知部20は、ディスプレイ(表示部)、スピーカ(音声出力部)等によって構成されている。通知部20は、制御部30からの出力を、画像、音声等としてユーザへ通知する。
<制御部>
制御部30は、CPU(Central Processing Unit)、ROM(Read-Only Memory)、RAM(Random Access Memory)、入出力回路等によって構成されている。制御部30は、機能部として、記憶部31と、データ管理部32と、タグ設定部33と、監視項目組み合わせ決定部34と、監視項目取得部35と、監視項目組み合わせ部36と、ネットワーク状態推定部37と、を備える。
≪記憶部≫
記憶部31は、ネットワーク構成情報データベース31aと、タグ情報データベース31bと、閾値データベース31cと、監視項目データベース31dと、組み合わせ監視項目データベース31eと、を備える。
≪ネットワーク構成情報データベース≫
ネットワーク構成情報データベース31aには、ネットワーク3におけるノードN(及び端末装置2)の接続関係すなわちネットワーク構成情報が記憶される。
≪タグ情報データベース≫
タグ情報データベース31bには、ノードNと、当該ノードNの監視項目と、当該監視項目の他監視項目との組み合わせの有無、監視対象、属性、単位及び取得周期と、が関連付けて記憶される。監視項目等については、後で詳細に説明する。
すなわち、ノードNから得られる監視項目は既知であり、監視項目にタグを自動で設定する場合には、当該監視項目にどういったタグを設定するかが、タグ設定部33によってタグ情報データベース31bとして事前に設定されている(タグ設定ステップ)。
≪閾値データベース≫
閾値データベース31cには、監視項目及び組み合わせ監視項目(これらの名称及び/又はID)と、当該項目の閾値と、が関連付けて記憶される。組み合わせ監視項目については、後で詳細に説明する。
≪監視項目データベース≫
監視項目データベース31dには、ノードNと、当該ノードNの監視項目(監視項目の名称及び/又はID)と、が関連付けて記憶される。
≪組み合わせ監視項目データベース≫
組み合わせ監視項目データベース31eには、組み合わせ監視項目(組み合わせ監視項目の名称及び/又はID)と、当該組み合わせ監視項目の監視区間と、が関連付けて記憶される。監視区間については、後で詳細に説明する。
≪データ管理部≫
データ管理部32は、ユーザによる操作部10の操作結果に基づいて、ネットワーク構成情報を取得し、取得されたネットワーク構成情報をネットワーク構成情報データベース31aに記憶させる。また、データ管理部32は、ユーザによる操作部10の操作結果に基づいて、ノードNと、当該ノードNの監視項目と、当該監視項目の他監視項目との組み合わせの有無、監視対象、属性、単位及び取得周期と、をタグ情報として取得し、取得されたタグ情報をタグ情報データベース31bに記憶させる。また、データ管理部32は、ユーザによる操作部10の操作結果に基づいて、監視項目及び組み合わせ監視項目と、当該項目の閾値と、を取得し、取得された情報を閾値データベース31cに記憶させる。
≪タグ設定部≫
タグ設定部33は、監視項目に当該監視項目の特徴を示すタグを設定する(タグ設定ステップ)。詳細には、タグ設定部33は、監視項目データベース31dに記憶されたノードNの監視項目(監視項目の名称)に対して、言語解析等の既存技術を適用することによって、タグを自動的に設定し、設定されたタグをタグ情報データベース31bに記憶させる。例えば、タグ設定部33は、監視項目が「DownloadBytes」「Networkin」である場合には、言語解析によって属性を「Ti」に設定することができる。また、タグ設定部33は、設定された属性「Ti」に対して、言語解析によって監視対象を「F」に設定することができる。
また、後記する監視項目取得部35は、CPU使用率として、「"Timestamp": "2016-08-11T14:40:00Z", "Average": 0.17, "Unit": "Percent"」というように、監視項目の取得日時と単位とを含むデータを取得することができる。タグ設定部33は、取得された監視項目から、タグとしての単位を認識して設定したり、連続して取得された2つの監視項目の取得間隔から、タグとしての取得周期を認識して設定したりすることができる。
または、タグ設定部33は、監視項目データベース31dに記憶されたノードNの監視項目を通知部20である表示部に表示させる。そして、タグ設定部33は、そのユーザによる操作部10の操作結果に基づいて、ノードNの監視項目に対してタグを設定し、設定されたタグをタグ情報データベース31bに記憶させる(タグの手動設定)。
監視項目に設定されたタグの内容は、ユーザによる操作部10の操作に基づくタグ情報の入力、又は、ユーザによる操作部10の操作に基づくタグ情報データベースの更新に基づいて、追加、削除、変更等が可能である。
<タグの構成例>
タグとしては、属性、単位、取得周期、及び、監視対象が挙げられる。
1.属性
1番目のタグであり、監視項目の属性を示す。
P:処理(Process)
Rp:読取処理(Read-process)
Wp:書込処理(Write-process)
T:トラヒック(Traffic)
Ti:トラヒック流入量(Traffic-in)
To:トラヒック流出量(Traffic-out)
L:Latency
2.単位
2番目のタグであり、監視項目の単位を示す。
B:バイト(Byte)
C:回数(Count)
P:パーセント(Percent)
S:秒(Second)
3.取得周期
3番目のタグであり、監視項目の取得周期を示す。
S:秒(Second)
M:分(Minute)
H:時間(Hour)
D:日(Days)

取得周期は、数値と前記した単位との組み合わせ(例えば、1M、5M等)である。
4.監視対象
4番目のタグであり、監視項目が、当該監視項目を送信したノードNを基準としてネットワーク3のどの部分を監視対象とするものであるかを示す。
F:自ノードから前段(自ノードを含む)(Forward)
M:自ノード(Myself)
B:自ノードから後段(自ノードを含む)(Backward)
A:自ノードの前段及び後段(自ノードを含む)(Around)
なお、タグとしては、他監視項目との組み合わせの有無、及び、必須ペア番号も利用可能である。
5.他監視項目との組み合わせの有無
5番目のタグであり、監視項目が、他監視項目と組み合わせて用いられるか否かを示す。
0:他監視項目との組み合わせ無し
1:他監視項目との組み合わせ有り
2:他監視項目との組み合わせてもよく、組み合わせなくてもよい
6.必須ペア番号
6番目以降のタグであり、同じ番号の監視項目同士を組み合わせることを示す。
タグ設定部33は、タグ情報データベース31bを参照することによって、属性、単位及び取得周期の少なくとも一つが同じであり、かつ、監視対象をAND条件で組み合わせたものが監視区間となり得る2つ以上の監視項目を組み合わせ、組み合わせられた2つ以上の監視項目に同一の必須ペア番号を設定することができる。また、タグ設定部33は、属性及び単位が異なる2つ以上の監視対象(例えば、属性「Traffc-in」と「Process」等)を組み合わせる場合に、ユーザによる操作部10の操作等によって、組み合わせ対象となる2つ以上の監視対象に同一の必須ペア番号を設定することができる。
≪監視項目組み合わせ決定部≫
監視項目組み合わせ決定部34は、例えばタグ情報データベース31bに記憶された監視項目ごとのタグを参照することによって、1つ以上の監視項目の組み合わせを決定する(例えば、2つ以上の監視項目を組み合わせた組み合わせ監視項目を得ることを決定する)とともに、タグに含まれる監視対象に基づいて、組み合わせが決定された(単独の監視項目、及び、組み合わせ監視項目)の監視区間を決定する(監視項目組み合わせ決定ステップ)。組み合わせ監視項目は、2つ以上の監視項目を組み合わせることによって新たに得られる監視項目である。監視項目組み合わせ決定部34は、組み合わせ監視項目(組み合わせられる監視項目の名称)及び当該監視項目の監視区間を組み合わせ監視項目データベース31eに記憶させる。
監視項目組み合わせ決定部34は、タグに含まれる属性、単位及び取得周期の少なくとも一つに基づいて、(例えば属性、単位及び取得周期の少なくとも一つが同一である)2つ以上の監視項目を組み合わせるように組み合わせを決定する構成であってもよく、必須ペア番号が同一である2つ以上の監視項目を組み合わせるように組み合わせを決定する構成であってもよい。
また、監視項目組み合わせ決定部34は、監視区間が長いほど(換言すると、監視区間のおける直列に接続されたノードの数が多いほど)、当該監視区間内における組み合わせ監視項目のパターンを増やすことが望ましい。これは、監視区間が長くなるにつれて、経由する装置(サーバ)数も多くなり、様々な影響を受けやすくなってノイズが増え、監視が困難になることに対応するためである。
また、監視項目組み合わせ決定部34は、組み合わせの必要がない監視項目、及び、組み合わせ対象が存在しない監視項目を単独の監視項目として用いることに設定する。ここで、監視項目組み合わせ決定部34は、監視項目の監視対象をそのまま当該監視項目の監視区間に設定する。
≪監視項目取得部≫
監視項目取得部35は、ノードNから送信された監視項目(監視項目の名称及び/又はID、並びに、監視項目の値)を取得し、取得された監視項目を監視項目データベース31dに記憶させる、及び/又は、監視項目組み合わせ部36及びネットワーク状態推定部37へ出力する(監視項目取得ステップ)。監視項目は、ネットワーク3を監視してネットワーク3内の故障被疑区間を推定したり、ネットワーク3のサービスの状態(異常具合)を推定したりするために用いられる、ノードN(自ノード及び他ノード)及びノードN間の通信ネットワークの稼働状態等を示すパラメータである。
≪監視項目組み合わせ部≫
監視項目組み合わせ部36は、監視項目データベース31dに記憶された監視項目(監視項目の値)、又は、監視項目取得部35から出力された監視項目(監視項目の値)を、監視項目組み合わせ決定部34によって決定された組み合わせを用いて組み合わせ、組み合わせられた監視項目(組み合わせ監視項目の値)を組み合わせ監視項目データベース31eに記憶させる、及び/又は、ネットワーク状態推定部37へ出力する(監視項目組み合わせステップ)。監視項目組み合わせ部36は、2つ以上の監視項目を、予め設定された数式等を用いて組み合わせることができる。
≪ネットワーク状態推定部≫
ネットワーク状態推定部37は、監視項目データベース31dに記憶された監視項目及び組み合わせ監視項目データベース31eに記憶された組み合わせ監視項目、又は、監視項目取得部35及び監視項目組み合わせ部36から出力された監視項目及び組み合わせ監視項目に基づいて、ネットワーク3の状態を推定する。例えば、ネットワーク状態推定部37は、監視項目データベース31dに記憶された監視項目及び組み合わせ監視項目データベース31eに記憶された組み合わせ監視項目と、閾値データベース31cに記憶された閾値と、を比較することによって、各項目に対応する監視区間が正常であるか故障被疑区間であるかを推定する。
すなわち、ネットワーク状態推定部37は、組み合わせ監視項目に関しては、組み合わせ監視項目に含まれる監視項目の比(例えば、トラヒック流出量/トラヒック流入量)を分析することによって、当該監視項目の監視対象(監視区間)が正常であるか故障被疑区間であるかを推定する。
なお、ネットワーク状態推定部37は、単体の監視項目(CPU使用率、Latency等)に関しては、正規分布、コーシー分布等といった分布を用いて分析したり、平均値又は分散値の変動を分析したりすることによって、当該監視項目の監視対象(監視区間)が正常であるか故障被疑区間であるかを推定する構成であってもよい。
また、ネットワーク状態推定部37は、監視項目及び組み合わせ監視項目の数が少ないほど、監視項目及び組み合わせ監視項目に対して適用する分析手法を多くする構成であってもよい。
また、ネットワーク状態推定部37は、単体の監視項目及び組み合わせ監視項目に基づいて、ネットワーク3のサービスの状態(異常具合)を推定する構成であってもよい。
<第一のネットワークへの適用例>
続いて、本発明の実施形態に係るネットワーク監視システム1を、第一のネットワークに適用した場合を例にとって説明する(適宜図1参照)。
図2(a)に示すように、第一のネットワーク3Aは、直列に接続された3つのノードN11,N12,N13を備える。ノードN11,N12は、ネットワークNW11を介して通信可能に接続されており、ノードN12,N13は、ネットワークNW12を介して通信可能に接続されている。
図2(b)に示すように、監視項目取得部35は、ノード(コンポーネントA)N11の監視項目として、CPU使用率と、トラヒック流入量と、トラヒック流出量と、を取得する。
タグ設定部33は、CPU使用率に対して、「P,P,1M,M」というタグを設定する。タグ設定部33は、トラヒック流入量に対して、「Ti,B,1M,F」というタグを設定する。タグ設定部33は、トラヒック流出量に対して、「To,B,1M,B」というタグを設定する。
また、監視項目取得部35は、ノード(コンポーネントB)N12の監視項目として、Latencyと、トラヒック流入量と、トラヒック流出量と、を取得する。
タグ設定33は、Latencyに対して、「L,S,1M,B」というタグを設定する。タグ設定33は、トラヒック流入量に対して、「Ti,B,1M,F」というタグを設定する。タグ設定33は、トラヒック流出量に対して、「To,B,1M,B」というタグを設定する。
また、監視項目取得部35は、ノード(コンポーネントC)N13の監視項目として、トラヒック流入量を取得する。
タグ設定33は、トラヒック流入量に対して、「Ti,B,1D,F」というタグを設定する。
また、図2(c)に示すように、監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、タグの属性及び単位に基づいて、ノードN11のトラヒック流入量とトラヒック流出量とを組み合わせる。組み合わされたノードN11のトラヒック流入量及びトラヒック流出量(ノードN11のトラヒック流出量/ノードN11のトラヒック流入量)は、ノードN11を監視区間とする組み合わせ監視項目である。
監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、タグの属性及び単位に基づいて、ノードN11のトラヒック流出量とノードN12のトラヒック流入量とを組み合わせる。組み合わされた監視項目(ノードN11のトラヒック流出量/ノードN12のトラヒック流入量)は、ノードN11、ネットワークNW11及びノードN12を監視区間とする組み合わせ監視項目である。
監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、タグの属性及び単位に基づいて、ノードN11のトラヒック流出量とノードN13のトラヒック流入量とを組み合わせる。組み合わされた監視項目(ノードN11のトラヒック流出量/ノードN13のトラヒック流出量)は、ノードN11、ネットワークNW11、ノードN12、ネットワークNW12及びノードN13を監視区間とする組み合わせ監視項目である。ここで、ノードN11のトラヒック流出量の取得周期は、「1M」であり、ノードN13のトラヒック流入量の取得周期は、「1D」である。したがって、監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、ノードN11のトラヒック流出量及びノードN13のトラヒック流入量の一方を他方の取得周期分に換算してから、ノードN11のトラヒック流出量及びノードN13のトラヒック流入量を組み合わせる。
監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、タグの属性及び単位に基づいて、ノードN12のトラヒック流入量とトラヒック流出量とを組み合わせる。組み合されたノードN12のトラヒック流入量及びトラヒック流出量(ノードN12のトラヒック流出量/ノードN12のトラヒック流入量)は、ノードN12を監視区間とする組み合わせ監視項目である。
監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、タグの属性及び単位に基づいて、ノードN12のトラヒック流出量とノードN13のトラヒック流入量とを組み合わせる。組み合わされた監視項目(ノードN12のトラヒック流出量/ノードN13のトラヒック流入量)は、ノードN12、ネットワークNW12及びノードN13を監視区間とする組み合わせ監視項目である。ここで、ノードN12のトラヒック流出量の取得周期は、「1M」であり、ノードN13のトラヒック流入量の取得周期は、「1D」である。したがって、監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、ノードN12のトラヒック流出量及びノードN13のトラヒック流入量の一方を他方の取得周期分に換算してから、ノードN12のトラヒック流出量及びノードN13のトラヒック流入量を組み合わせる。
すなわち、監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、属性が「To」である監視項目を、当該監視項目の後段(同一ノードNを含む)の監視項目のうち、同一単位(単位が「B」)であり属性が「Ti」である監視項目と組み合わせる。換言すると、監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、属性が「Ti」である監視項目を、当該監視項目の前段(同一ノードNを含む)の監視項目のうち、同一単位(単位が「B」)であり属性が「To」である監視項目と組み合わせる。なお、属性が「To」「Ti」である監視項目の組み合わせは、ネットワークNW内における同一サービスのネットワーク内に限定されてもよい。
また、監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、属性が「Rp」である監視項目を、同一サービス内の監視項目のうち、同一単位(単位が「B」)であり属性が「Wp」である監視項目と組み合わせる。換言すると、監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、属性が「Wp」である監視項目を、同一サービス内の監視項目のうち、同一単位(単位が「B」)であり属性が「Rp」である監視項目と組み合わせる。
なお、監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、他監視項目との組み合わせの有無が「1」又は「2」である監視項目のうち、属性、単位及び取得周期の少なくとも一つが同一であり、かつ、監視対象をAND条件で組み合わせたものが監視区間となり得る2つ以上の監視項目を組み合わせることによって、前記した組み合わせ監視項目を得ることができる。
また、監視項目組み合わせ決定部34は、監視対象が「M」であるCPU使用率を、単独の監視項目として用いることに設定する。ここで、監視項目組み合わせ決定部34は、ノードN11のCPU使用率の監視対象であるノードN11を、CPU使用率の監視区間に設定する。
また、監視項目組み合わせ決定部34は、属性が「L」であって組み合わせ対象が存在しないLatencyを、単独の監視項目として用いることに設定する。ここで、監視項目組み合わせ決定部34は、ノードN12のLatencyの監視対象であるノードN12、ネットワークNW12及びノードN13を、Latencyの監視項目に設定する。
<第二のネットワークへの適用例>
続いて、本発明の実施形態に係るネットワーク監視システム1を、第二のネットワークに適用した例について、第一のネットワークに適用した例との相違点を中心に説明する(適宜図1参照)。
図3に示すように、第二のネットワーク3Bは、デジタルカメラである端末装置2から送信された画像データを保存するためのものである。第二のネットワーク3Bは、データ通信の下流側から順に、ネットワーク事業者によるネットワーク(同一サービス内のネットワーク)NW21と、クラウド事業者によるネットワーク(同一サービス内のネットワーク)NW22と、を備える。ネットワークNW22は、データ通信の下流側から順に、ロードバランサ(Elastic Load Balancer)であるノードN21と、画像データを処理する仮想サーバ(Elastic Compute Cloud)であるノードN22,N23と、処理された画像データが保存されるストレージとしてのノードN24と、を備える。ノードN22,N23は、ノードN21とノードN24との間に並列に設けられている。
図3に示すように、監視項目取得部35は、ノードとしての端末装置2から得られる監視項目として、トラヒック流出量(UploadByte)を取得する。かかる監視項目は、デジタルカメラである端末装置2に挿入されているSIM(Subscriber Identity Module)カードから得られる監視項目である。なお、端末装置2から得られる監視項目は、SIMカードが挿入された、ネットワークNW21内のノードとしての無線LANルータからも取得可能である。
監視項目取得部35は、ノードN21から得られる監視項目として、HTTPCode_Backend_4XXと、HTTPCode_ELB_4XXと、Latencyと、HTTPCode_ELB_5XXと、BackendConnectionErrorsと、SpilloverCoutと、SurgeQueueLengthと、HTTPCode_Backend_5XXと、UnHealthyHostCountと、を取得する。
監視項目取得部35は、ノードN22,N23のそれぞれから得られる監視項目として、トラヒック流入量(NetworkIn)と、StatusCheckFailed_Systemと、CPU使用率(CPUUtilization)と、ディスク読取量(DiskReadBytes)と、ディスク書込量(DiskWriteBytes)と、トラヒック流出量(NetworkOut)と、StatusCheckFailed_Instanceと、を取得する。
監視項目取得部35は、ノードN24から得られる監視項目として、トラヒック流入量(BucketSizeBytes)を取得する。
監視項目取得部35は、ネットワークNW21のAPI(Application Programming Interface)を用いて端末装置2からの監視項目を取得周期1分(1M)で取得する。また、監視項目取得部35は、ネットワークNW22のAPIを用いてノードN21〜N23からの監視項目を取得周期1分(1M)で取得する。また、監視項目取得部35は、ネットワークNW22のAPIを用いてノードN24からの監視項目を取得周期1日(1D)で取得する。
タグ設定部33は、監視項目に対して、適宜タグを設定する。
監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、タグの属性「To」「Ti」に基づいて、端末装置2のトラヒック流出量(UploadByte)と、ノードN22のトラヒック流入量(NetworkIn)と、ノードN23のトラヒック流入量(NetworkIn)と、を組み合わせる。組み合わされた監視項目((ノードN22のトラヒック流入量+ノードN23のトラヒック流入量)/端末装置2のトラヒック流出量)は、端末装置2とノードN22及びノードN23との間を監視区間とする組み合わせ監視項目である。
監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、タグの属性「To」「Ti」に基づいて、端末装置2のトラヒック流出量(UploadByte)と、ノードN24のトラヒック流入量(BucketSizeBytes)と、を組み合わせる。かかる組み合わせに際して、端末装置2のトラヒック流出量は、1日分に換算される、又は、ノードN24のトラヒック流入量は、1分に換算される。組み合わされた監視項目は、端末装置2とノードN24との間を監視区間とする組み合わせ監視項目である。
監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、タグの属性「To」「Ti」に基づいて、ノードN22のトラヒック流出量(NetworkOut)とトラヒック流入量(NetworkIn)とを組み合わせる。組み合わされた監視項目(トラヒック流出量/トラヒック流入量)は、ノード22を監視区間とする組み合わせ監視項目である。
監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、タグの属性「To」「Ti」に基づいて、ノードN23のトラヒック流出量(NetworkOut)とトラヒック流入量(NetworkIn)とを組み合わせる。組み合わされた監視項目(トラヒック流出量/トラヒック流入量)は、ノード23を監視区間とする組み合わせ監視項目である。
監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、タグの属性「Rp」「Wp」に基づいて、ノードN22のディスク読取量(DiskReadBytes)とディスク書込量(DiskWriteBytes)とを組み合わせる。組み合わされた監視項目(ディスク読取量/ディスク書込量)は、ノードN22を監視区間とする組み合わせ監視項目である。
監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、タグの属性「Rp」「Wp」に基づいて、ノードN23のディスク読取量(DiskReadBytes)とディスク書込量(DiskWriteBytes)とを組み合わせる。組み合わされた監視項目(ディスク読取量/ディスク書込量)は、ノードN23を監視区間とする組み合わせ監視項目である。
監視項目組み合わせ決定部34は、その他の監視項目を単独の監視項目として用いることに決定する。
HTTPCode_Backend_4XXの監視区間は、端末装置2〜ノードN22及びノードN23に設定される。
すなわち、HTTPCode_Backend_4XXの監視対象は、タグ設定部33によって、自ノードの前段及び自ノードの直後のノードまで、に設定されている。
HTTPCode_ELB_4XXの監視区間は、端末装置2〜ノードN21に設定される。
Latencyの監視区間は、ノードN21〜ノードN22びノードN23に設定される。
すなわち、Latencyの監視対象は、ネットワークNW22内の他の監視項目と同様にネットワークNW22のサービスを用いているため、前記した例とは異なり、タグ設定部33によって、自ノードから自ノードの直後のノードまで、に設定されている。
HTTPCode_ELB_5XXの監視区間は、ノードN21〜ノードN22及びノードN23に設定される。
BackendConnectionErrorsの監視区間は、ノードN21〜ノードN22及びノードN23に設定される。
すなわち、HTTPCode_ELB_5XX、BackendConnectionErrorsの監視対象は、タグ設定部33によって、それぞれ、自ノードから自ノードの直後のノードまで、に設定されている。
SpilloverCoutの監視区間は、ノードN21に設定される。
SurgeQueueLengthの監視区間は、ノードN21〜ノードN22及びノードN23に設定される。
HTTPCode_Backend_5XXの監視区間は、ノードN21〜ノードN22及びノードN23に設定される。
UnHealthyHostCountの監視区間は、ノードN21〜ノードN22及びノードN23に設定される。
すなわち、SurgeQueueLength、HTTPCode_Backend_5XX、UnHealthyHostCountの監視対象は、タグ設定部33によって、それぞれ、自ノードから自ノードの直後のノードまで、に設定されている。
StatusCheckFailed_Systemの監視区間は、ノードN22及びノードN23にそれぞれ設定される。
CPU使用率(CPUUtilization)は、ノードN22及びノードN23にそれぞれ設定される。
StatusCheckFailed_Instanceは、ノードN22及びノードN23にそれぞれ設定される。
なお、タグ設定部33は、端末装置2のトラヒック流出量に必須ペア番号「99」を設定し、ノードN22のトラヒック流入量に必須ペア番号「99_1」を設定し、ノードN23のトラヒック流入量に必須ペア番号「99_2」を設定する構成であってもよい。この場合には、監視項目組み合わせ決定部34は、タグの必須ペア番号「99」「99_1」「99_2」に基づいて、監視装置2のトラヒック流出量と、ノードN22のトラヒック流入量と、ノードN23のトラヒック流入量と、を組み合わせると決定する。組み合わされた監視項目((ノードN22のトラヒック流入量+ノードN23のトラヒック流入量)/端末装置2のトラヒック流出量)は、端末装置2とノードN22及びノードN23との間を監視区間とする組み合わせ監視項目である。
<第三のネットワークへの適用例>
続いて、本発明の実施形態に係るネットワーク監視システム1を、第三のネットワークに適用した例について、第一のネットワークに適用した例との相違点を中心に説明する(適宜図1参照)。
図4(a)に示すように、第三のネットワーク3Cは、ユーザ端末装置2へWebサービスを提供するためのものである。第三のネットワーク3Cは、ユーザ端末装置2側から順に、ネットワーク事業者AによるネットワークNW31と、ネットワーク事業者BによるネットワークNW32と、クラウド事業者によるネットワークNW33と、を備える。かかるネットワーク3Cにおいて、ネットワークNW32は、監視項目をネットワーク監視装置4へ送信していないものとする。
図4(b)に示すように、監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、ノードとしての端末装置2からのトラヒック流出量と、VM(Vertial Machine)及びwebAPL(APpLication)として機能するネットワークNW33のノードN31へのトラヒック流入量と、を組み合わせることによって、ネットワークNW31,NW32,NW33を監視区間WS1とする組み合わせ監視項目を得る。
監視項目組み合わせ決定部34及び監視項目組み合わせ部36は、端末装置2からのトラヒック流出量と、ネットワークNW31からのトラヒック流出量(ネットワークNW31における下流端部のノードのトラヒック流出量)と、を組み合わせることによって、ネットワークNW31を監視区間WS2とする組み合わせ監視項目を得る。
また、監視項目取得部35は、ネットワークNW33を監視区間(監視対象)WS3とするネットワークN33内の遅延時間を取得する。
ネットワーク状態推定部37は、監視区間WS1に故障被疑箇所があり、かつ、監視区間WS2,WS3が正常であると判定した場合に、ネットワークNW32に故障被疑箇所があると推定する。
本発明の実施形態に係るネットワーク監視装置4は、監視項目に対して自動又は手動でタグを設定し、設定されたタグに基づいて組み合わせ監視項目及び当該監視項目の監視区間を生成するので、webブラウザの使用以外でもネットワーク監視を行うことができ、かつ、監視区間を好適に設定することができる。
すなわち、ネットワーク監視装置4は、監視区間の種類を増やすことによってネットワークの適切な監視を実行し、故障被疑区間を好適に推定して保守稼働を削減することができる。
また、ネットワーク監視装置4は、ネットワーク内においてノードNが並列である場合には当該ノードNの監視項目に設定される必須ペア番号において枝番を用いることで、並列なノードNの監視項目を好適に組み合わせることができる。
また、ネットワーク監視装置4が、ネットワークにおいて監視項目が無い区間がある場合においても、他の監視区間の監視結果に基づいて、監視項目が無い区間を間接的に監視することができる。
以上、本発明の実施形態について説明したが、本発明は前記実施形態に限定されず、本発明の要旨を逸脱しない範囲で適宜変更可能である。例えば、本発明は、コンピュータをネットワーク監視装置として機能させる、又は、コンピュータにネットワーク監視方法を実行させるネットワーク監視プログラムとしても具現化可能である。
2 端末装置(ノード)
3 ネットワーク
4 ネットワーク監視装置
33 タグ設定部
34 監視項目組み合わせ決定部
35 監視項目取得部
36 監視項目組み合わせ部
N ノード

Claims (7)

  1. ネットワークを構成するノードの監視項目に対して、当該監視項目の特徴を示すタグを設定するタグ設定部と、
    設定された前記タグに基づいて、1つ以上の前記監視項目の組み合わせを決定するとともに、前記タグに含まれる監視対象に基づいて、組み合わせが決定された前記監視項目の監視区間を決定する監視項目組み合わせ決定部と、
    前記ノードから前記監視項目を取得する監視項目取得部と、
    決定された前記組み合わせに基づいて、取得された前記監視項目を前記監視区間内において組み合わせる監視項目組み合わせ部と、
    を備えることを特徴とするネットワーク監視装置。
  2. 前記タグは、前記監視項目の属性、単位及び取得周期のうち、前記属性を含む少なくとも一つをさらに含み、
    前記監視項目組み合わせ決定部は、前記属性、前記単位及び前記取得周期のうち、前記属性を含む少なくとも一つに基づいて、2つ以上の前記監視項目を組み合わせるように前記組み合わせを決定する
    ことを特徴とする請求項1に記載のネットワーク監視装置。
  3. 前記タグは、必須ペア番号をさらに含み、
    前記監視項目組み合わせ決定部は、必須ペア番号が同一である2つ以上の前記監視項目を組み合わせるように前記組み合わせを決定する
    ことを特徴とする請求項1に記載のネットワーク監視装置。
  4. ネットワーク監視装置が、
    ネットワークを構成するノードの監視項目に対して、当該監視項目の特徴を示すタグを設定するタグ設定ステップと、
    設定された前記タグに基づいて、1つ以上の前記監視項目の組み合わせを決定するとともに、前記タグに含まれる監視対象に基づいて、組み合わせが決定された前記監視項目の監視区間を決定する監視項目組み合わせ決定ステップと、
    前記ノードから前記監視項目を取得する監視項目取得ステップと、
    決定された前記組み合わせに基づいて、取得された前記監視項目を前記監視区間内において組み合わせる監視項目組み合わせステップと、
    を実行することを特徴とするネットワーク監視方法。
  5. 前記タグは、前記監視項目の属性、単位及び取得周期のうち、前記属性を含む少なくとも一つをさらに含み、
    前記監視項目組み合わせ決定ステップにおいて、前記ネットワーク監視装置が、前記属性、前記単位及び前記取得周期のうち、前記属性を含む少なくとも一つに基づいて、2つ以上の前記監視項目を組み合わせるように前記組み合わせを決定する
    ことを特徴とする請求項4に記載のネットワーク監視方法。
  6. 前記タグは、必須ペア番号をさらに含み、
    前記監視項目組み合わせ決定ステップにおいて、前記ネットワーク監視装置が、必須ペア番号が同一である2つ以上の前記監視項目を組み合わせるように前記組み合わせを決定する
    ことを特徴とする請求項4に記載のネットワーク監視方法。
  7. コンピュータを、
    ネットワークを構成するノードの監視項目に対して、当該監視項目の特徴を示すタグを設定するタグ設定手段、
    設定された前記タグに基づいて、1つ以上の前記監視項目の組み合わせを決定するとともに、前記タグに含まれる監視対象に基づいて、組み合わせが決定された前記監視項目の監視区間を決定する監視項目組み合わせ決定手段、
    前記ノードから前記監視項目を取得する監視項目取得手段、
    決定された前記組み合わせに基づいて、取得された前記監視項目を前記監視区間内において組み合わせる監視項目組み合わせ手段、
    として機能させるためのネットワーク監視プログラム。
JP2016172331A 2016-09-02 2016-09-02 ネットワーク監視装置、ネットワーク監視方法及びネットワーク監視プログラム Active JP6595960B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016172331A JP6595960B2 (ja) 2016-09-02 2016-09-02 ネットワーク監視装置、ネットワーク監視方法及びネットワーク監視プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016172331A JP6595960B2 (ja) 2016-09-02 2016-09-02 ネットワーク監視装置、ネットワーク監視方法及びネットワーク監視プログラム

Publications (2)

Publication Number Publication Date
JP2018038022A JP2018038022A (ja) 2018-03-08
JP6595960B2 true JP6595960B2 (ja) 2019-10-23

Family

ID=61567773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016172331A Active JP6595960B2 (ja) 2016-09-02 2016-09-02 ネットワーク監視装置、ネットワーク監視方法及びネットワーク監視プログラム

Country Status (1)

Country Link
JP (1) JP6595960B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7212245B2 (ja) * 2018-09-10 2023-01-25 日本電信電話株式会社 診断装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4183602B2 (ja) * 2003-11-04 2008-11-19 富士通株式会社 障害監視方法及びプログラム
JP2008186086A (ja) * 2007-01-26 2008-08-14 Toshiba Corp 分散監視制御装置

Also Published As

Publication number Publication date
JP2018038022A (ja) 2018-03-08

Similar Documents

Publication Publication Date Title
US9544403B2 (en) Estimating latency of an application
US9774654B2 (en) Service call graphs for website performance
US8355341B2 (en) Delay time measurement apparatus, storage medium storing delay time measurement program and network system
US9246777B2 (en) Computer program and monitoring apparatus
CN107409071B (zh) 获得诊断测试结果的方法、控制模块及计算机可读存储介质
US20150149609A1 (en) Performance monitoring to provide real or near real time remediation feedback
US20160225042A1 (en) Determining a cost of an application programming interface
WO2015154478A1 (zh) 创建性能测量任务、性能测量结果的处理方法及装置
US20170324627A1 (en) Diagnostic testing in networks
US9479414B1 (en) System and method for analyzing computing performance
US20160225043A1 (en) Determining a cost of an application
JP5957419B2 (ja) QoE推定装置、QoE推定方法及びプログラム
JP6595960B2 (ja) ネットワーク監視装置、ネットワーク監視方法及びネットワーク監視プログラム
US20190044830A1 (en) Calculating Service Performance Indicators
US20200265100A1 (en) Cause-based event correlation to virtual page transitions in single page applications
US10756988B2 (en) System and method of isolating QoS fault
CN110677683B (zh) 视频存储、视频访问方法及分布式存储、视频访问系统
US11075977B2 (en) Accurately determining web page visually complete time
JP5974905B2 (ja) 応答時間監視プログラム、方法および応答時間監視装置
JP2017153015A (ja) 故障解析装置、故障解析プログラムおよび故障解析方法
JP6666872B2 (ja) 情報処理装置、情報処理方法およびプログラム
WO2018201864A1 (zh) 一种数据库性能诊断方法、装置、设备以及存储介质
CN113852551A (zh) 一种报文处理方法及装置
JP4668851B2 (ja) 品質クラス決定装置、品質クラス決定方法、およびプログラム
CN111884932A (zh) 一种链路确定方法、装置、设备和计算机可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190702

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190924

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190927

R150 Certificate of patent or registration of utility model

Ref document number: 6595960

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150