JP2014036310A - Apparatus and method for evaluating effect - Google Patents
Apparatus and method for evaluating effect Download PDFInfo
- Publication number
- JP2014036310A JP2014036310A JP2012175992A JP2012175992A JP2014036310A JP 2014036310 A JP2014036310 A JP 2014036310A JP 2012175992 A JP2012175992 A JP 2012175992A JP 2012175992 A JP2012175992 A JP 2012175992A JP 2014036310 A JP2014036310 A JP 2014036310A
- Authority
- JP
- Japan
- Prior art keywords
- network
- unit
- information
- service
- event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
この発明は、影響評価装置及び影響評価方法に関する。 The present invention relates to an influence evaluation apparatus and an influence evaluation method.
従来、ネットワーク(NW:Network)のシステム管理者が障害などのイベントや、イベントの予兆を検出して、その原因を推定するための情報として、NW機器の管理情報が用いられている。例えば、システム管理者は、RFC1156、RFC1213で標準化されているMIB(Management Information Base:管理情報ベース)情報をSNMP(Simple Network Management Protocol)によりNW経由で取得して管理することで、イベントや、イベントの予兆を検出して、原因を推定する。ここで、MIB情報を取得して管理するためのツールは数多く知られており、例えば、TWSNMP Managerなどが知られている。 2. Description of the Related Art Conventionally, NW device management information is used as information for a network (NW) system administrator to detect an event such as a failure or a sign of an event and estimate the cause of the event. For example, a system administrator acquires and manages MIB (Management Information Base) information standardized by RFC1156 and RFC1213 via NW by SNMP (Simple Network Management Protocol), thereby managing events and events. Detect the signs of, and estimate the cause. Here, many tools for acquiring and managing MIB information are known, for example, TWSNMP Manager is known.
また、例えば、システム管理者は、各NW機器のログを収集して管理するSyslogコレクタを用いて、イベントや、イベントの予兆を検出して、原因を推定する。ここで、Syslogコレクタは、システムの動作状況やメッセージなどのログを記録するプログラムとして一般的に利用されているSyslogが備えるログの送受信機能が利用されており、例えば、Kiwi Syslog Serverなどが知られている。なお、ログの送受信機能のプロトコルは、RFC5424によって標準化されている。 In addition, for example, the system administrator uses an Syslog collector that collects and manages logs of each NW device to detect an event or an event precursor and estimate the cause. Here, the Syslog collector uses a log transmission / reception function provided in Syslog, which is generally used as a program for recording logs such as system operation statuses and messages. For example, Kiwi Syslog Server is known. ing. Note that the protocol of the log transmission / reception function is standardized by RFC5424.
さらに、上述したSNMPマネージャやSyslogコレクタによって取得された管理情報をトリガとして、予め設定されたアクションを自動的に実行する技術も実用化されている。例えば、あるSyslogメッセージが観測された場合や、監視しているMIBオブジェクトの値が閾値を超えた場合のアクションとして、Showコマンドを送信して追加情報を取得するように定義しておく。これにより、トリガが発生すると自動的に対象機器の状況をさらに詳細に知るための補足情報が取得される。このような技術としては、例えば、Cisco IOS(登録商標)に搭載されているEEM(Embedded Event Manager)や、JUNOSに搭載されているJUNOScriptなどが知られている。 Furthermore, a technique for automatically executing a preset action using the management information acquired by the SNMP manager or the Syslog collector as a trigger has been put into practical use. For example, when a certain Syslog message is observed or when the value of the monitored MIB object exceeds a threshold value, a Show command is transmitted and additional information is acquired. Thereby, when a trigger occurs, supplementary information for automatically knowing the status of the target device in more detail is acquired. As such a technique, for example, EEM (Embedded Event Manager) installed in Cisco IOS (registered trademark), JUNOScript installed in JUNOS, and the like are known.
しかしながら、上述した従来技術では、イベントがネットワークやサービスに与える影響を評価することが困難であった。例えば、上述した従来技術では、イベントの影響を評価するためには、NW管理者が、イベントの詳細情報に基づいてNW上で影響が及ぶ範囲を推定し、適切な評価手段を選択して評価を行わなければならず、イベントがネットワークやサービスに与える影響を評価することが困難であった。また、例えば、上述した従来技術では、イベントに関する情報のみでなく、管理者がNWの物理構成及び論理構成の情報を把握しておく必要があり、NW管理者にとっては高度な知識が求められる上、多くの稼動が必要となり、イベントがネットワークやサービスに与える影響を評価することが困難であった。 However, with the above-described conventional technology, it has been difficult to evaluate the influence of an event on a network or a service. For example, in the above-described conventional technology, in order to evaluate the influence of an event, the NW administrator estimates the range of influence on the NW based on the detailed information of the event, and selects and evaluates an appropriate evaluation means. It was difficult to assess the impact of events on networks and services. In addition, for example, in the above-described conventional technology, it is necessary for an administrator to grasp not only information related to an event but also information on the physical configuration and logical configuration of the NW, which requires advanced knowledge for the NW administrator. Many operations were required, and it was difficult to evaluate the impact of events on networks and services.
そこで、本願に係る技術は、上述した従来技術の問題に鑑みてなされたものであって、イベントがネットワークやサービスに与える影響を容易に評価することを可能にする影響評価装置及び影響評価方法を提供することを目的とする。 Therefore, the technology according to the present application has been made in view of the above-described problems of the prior art, and an impact evaluation device and an impact evaluation method that enable an event to easily evaluate the impact on a network or service. The purpose is to provide.
上述した課題を解決し、目的を達成するため、本願に係る影響評価装置は、ネットワークに含まれる複数のネットワーク機器に関するログ情報及び前記ネットワークにおける前記複数のネットワーク機器の構成を示す構成情報を取得する取得部と、前記取得部によって取得された前記ログ情報及び前記ネットワークの構成情報に基づいて、前記ネットワークに発生した障害によって影響を受ける当該ネットワーク上の範囲及びサービスを推定する推定部と、前記推定部によって推定された前記ネットワーク上の範囲における前記サービスに対して、前記ネットワークに発生した障害が与える影響の内容を検査する検査部と、前記検査部による検査結果を前記ネットワークの管理者に対して通知する通知部とを備えることを特徴とする。 In order to solve the above-described problems and achieve the object, the impact evaluation apparatus according to the present application acquires log information regarding a plurality of network devices included in a network and configuration information indicating configurations of the plurality of network devices in the network. An estimation unit that estimates a range and a service on the network affected by a failure that has occurred in the network based on the log information and the configuration information of the network acquired by the acquisition unit, and the estimation An inspection unit that inspects the content of the influence of the failure that has occurred on the network for the service in the range on the network estimated by the unit, and the inspection result by the inspection unit to the administrator of the network And a notification unit for notifying.
本願に係る装置は、イベントがネットワークやサービスに与える影響を容易に評価することを可能にする。 The apparatus according to the present application makes it possible to easily evaluate the influence of an event on a network or a service.
以下に添付図面を参照して、本願の開示する影響評価装置及び影響評価方法の実施形態を詳細に説明する。なお、本願の開示する影響評価装置及び影響評価方法は、以下の実施形態により限定されるものではない。 Exemplary embodiments of an impact evaluation apparatus and an impact evaluation method disclosed in the present application will be described below in detail with reference to the accompanying drawings. In addition, the impact evaluation apparatus and the impact evaluation method which this application discloses are not limited by the following embodiment.
[第1の実施形態]
[ネットワークの構成]
まず、第1の実施形態に係る影響評価装置が適用されるネットワークの構成の一例を説明する。図1は、第1の実施形態に係るネットワーク10の構成の一例を示す図である。図1に示すように、ネットワーク10は、中継網11と、ユーザセグメント12aと、ユーザセグメント12bと、サーバセグメント13aと、サーバセグメント13bとを有する。そして、ネットワーク10は、CMDB(Configuration Management DataBase)20、EM(Event Manager)30及び影響評価装置100が接続される。なお、ネットワーク10の構成は、図1に示す例に限定されるものではない。例えば、ユーザセグメント及びサーバセグメントは図示された数に限られず、多数のユーザセグメント及びサーバセグメントが、中継網11に接続されている場合であってもよい。
[First Embodiment]
[Network configuration]
First, an example of a network configuration to which the impact evaluation apparatus according to the first embodiment is applied will be described. FIG. 1 is a diagram illustrating an example of a configuration of a network 10 according to the first embodiment. As shown in FIG. 1, the network 10 includes a relay network 11, a
中継網11は、例えば、図1に示すように、ルータR1〜ルータR4を有し、ユーザセグメント12aと、ユーザセグメント12bと、サーバセグメント13aと、サーバセグメント13bとの間で実行される通信を中継する。なお、図1に示す中継網11はあくまでも一例であり、図1に示す例に限定されるものではない。
For example, as shown in FIG. 1, the relay network 11 includes routers R1 to R4, and performs communication performed between the
ユーザセグメント12a及びユーザセグメント12bは、中継網11を介してサーバセグメント13a及びサーバセグメント13bに含まれるサーバと通信を実行するユーザ端末をそれぞれ有する。また、ユーザセグメント12a及びユーザセグメント12bは、影響評価装置100によって利用されるリファレンスサイトRS1及びリファレンスサイトRS2をそれぞれ有する。
The
リファレンスサイトRS1及びリファレンスサイトRS2は、影響評価装置100によって送信されたテストコマンドを受信して、受信したテストコマンドに対応するプログラムを実行する。具体的には、リファレンスサイトRS1及びリファレンスサイトRS2は、影響評価装置100によって送信されたテストコマンドに基づいて、障害などのイベントによって影響を受けるサービスの品質をテストする。例えば、リファレンスサイトRS1及びリファレンスサイトRS2は、インターネット制御メッセージプロトコル(ICMP:Internet Control Message Protocol)を用いたPingやTrace Routeによる計測や、HTTP(HyperText Transfer Protocol)などを実行することにより、遅延や疎通性などをテストする。リファレンスサイトRS1及びリファレンスサイトRS2は、例えば、セグメントやサーバなどである。
The reference site RS1 and the reference site RS2 receive the test command transmitted by the
サーバセグメント13a及びサーバセグメント13bは、各種サービスを提供するサービス提供サーバS1及びサービス提供サーバS2をそれぞれ有する。サービス提供サーバS1及びサービス提供サーバS2は、ユーザセグメント12a及びユーザセグメント12bに含まれるユーザ端末に対して各種サービスを提供する。
The
ここで、ネットワーク10に含まれる中継網11及び各セグメント(ユーザセグメント12a、12b及びサーバセグメント13a、13b)は、それぞれ共通の管理下において運用されるネットワークの集合「AS(Autonomous System:自律システム)」である。
Here, the relay network 11 and each segment (
また、ネットワーク10に含まれる各ネットワーク機器(例えば、中継網11に含まれるルータR1〜R4や、各セグメントと中継網11を接続するルータなど:以下、NW機器と記す場合がある)は、それぞれSyslogプロトコルが適用され、所定のイベントが発生した場合に、Syslogメッセージを出力し、出力したSyslogメッセージをEM30に送信する。例えば、各ネットワーク機器は、データの中継処理を行った場合や、ポート間のリンクがダウンする事イベントであるリンクダウンが発生した場合や、ポート間のリンクが形成されるイベントであるリンクアップが発生した場合等に、Syslogメッセージを出力する。
In addition, each network device included in the network 10 (for example, routers R1 to R4 included in the relay network 11, routers connecting the segments to the relay network 11, and the like; hereinafter may be referred to as NW devices), respectively, When the Syslog protocol is applied and a predetermined event occurs, a Syslog message is output, and the output Syslog message is transmitted to the
このとき、各NW機器は、「タイムスタンプ」と、「イベントが発生した箇所」と、「発生したイベントの内容」とを含むSyslogメッセージを出力する。ここでいう「タイムスタンプ」とは、例えば、Syslogメッセージを出力した時刻、又は、イベントが発生した時刻等を示す。また、「イベントが発生した箇所」とは、例えば、ルータや、ルータを構成する構成部品等を示す。ルータの構成部品の例としては、ポートや、複数のポートを有するラインカード等が挙げられる。 At this time, each NW device outputs a Syslog message including “time stamp”, “location where the event has occurred”, and “content of the event that has occurred”. Here, the “time stamp” indicates, for example, the time when the Syslog message is output or the time when the event occurs. Further, “location where an event has occurred” indicates, for example, a router, a component constituting the router, or the like. Examples of router components include ports, line cards having a plurality of ports, and the like.
例えば、ルータR1がポート1aを有し、ルータR2がポート2aを有し、ポート1aとポート2aとが接続されていたが、ポート1aとポート2aとの間においてリンクダウンが発生したものとする。かかる場合には、ルータR1は、例えば、「2011年7月15日10時30分10秒 ルータR1 ポート1a リンクダウン」といったSyslogメッセージを出力する。また、ルータR2も同様のSyslogメッセージを出力する。 For example, it is assumed that the router R1 has the port 1a, the router R2 has the port 2a, and the port 1a and the port 2a are connected, but a link down occurs between the port 1a and the port 2a. . In such a case, the router R1 outputs a Syslog message such as “July 15, 2011 10:30:10 router R1 port 1a link down”. Router R2 also outputs a similar Syslog message.
また、各NW機器は、それぞれMIB情報(Management Information Base)を有する。例えば、各NW機器は、RFC1213によって定義された自装置のリソース状況やポートごとの管理情報を有する。一例を挙げると、各NW機器は、システムやインターフェースなどの監視対象グループごとに複数のオブジェクトを有するMIB情報を管理する。ここで、MIB情報は、適宜更新される。 Each NW device has MIB information (Management Information Base). For example, each NW device has the resource status of its own device defined by RFC 1213 and management information for each port. For example, each NW device manages MIB information having a plurality of objects for each monitoring target group such as a system or an interface. Here, the MIB information is updated as appropriate.
さらに、各NW機器は、SyslogメッセージやMIB情報をトリガとして自装置の状態を詳細に調べるためのコマンドを実行するスクリプト(Event Trigger Script:以下、ETSと記す場合がある)がそれぞれ実装されている。例えば、各NW機器は、CISCO EEMや、Juniper scriptなどが実装される。一例を挙げると、各NW機器は、所定のSyslogメッセージ(例えば、リンクダウンなど)やMIB情報(例えば、エラー以外の理由で破棄された受信パケット数が所定の閾値を超えたなど)をトリガとして、Showコマンドを実行して自装置の状態の詳細情報を収集する。 Furthermore, each NW device has a script (Event Trigger Script: hereinafter sometimes referred to as ETS) for executing a command for examining the state of the own device in detail using a Syslog message or MIB information as a trigger. . For example, CISCO EEM, Juniper script, etc. are mounted on each NW device. For example, each NW device uses a predetermined Syslog message (for example, link down) or MIB information (for example, the number of received packets discarded for a reason other than an error exceeds a predetermined threshold) as a trigger. , The Show command is executed to collect detailed information on the status of the device itself.
CMDB20は、各NW機器に設定されている設定情報を各NW機器から取得して、管理する。これにより、CMDB20は、各NW機器が有するポート間の接続関係に関する情報をネットワーク10の構成情報として取得することができる。例えば、CMDB20は、ネットワーク10の構成情報として、ルータR1のポート1aとルータR2のポート2aとが接続されていることを示す情報等を取得することができる。
The
EM30は、Syslogメッセージ収集機能と、Syslogメッセージ以外のシステムログ収集機能と、イベント管理機能とを有する。具体的には、EM30は、Syslogコレクタを有し、各NW機器からSyslogメッセージを収集する。また、EM30は、Syslogメッセージ以外のログ情報であるシステムログ情報として、MIB情報や、ETSの結果(Showコマンドなどによって収集された詳細情報)などを収集する。例えば、EM30がSNMPマネージャを実装し、各NW機器に実装されたSNMPエージェントに対してリクエストコマンドを発行することにより、MIB情報を収集する。また、例えば、EM30は、TFTP(Trivial File Transfer Protocol)が実装され、TFTPリクエストメッセージを各NW装置に対して送信することにより、ETSの結果などを収集する。
The
そして、EM30は、収集したSyslogメッセージやシステムログ情報を統合して、イベント詳細情報として整理して、保持する。例えば、EM30は、「いつ」、「どのNW機器」が、「どのような状態か」を示すイベント詳細情報を保持する。
Then, the
影響評価装置100は、CMDB20によって収集されたネットワーク10の構成情報と、EM30によって収集されたログ情報とを用いて、イベントによって影響を受けるネットワーク上の範囲とサービスとを解析する。
The
[影響評価装置の構成]
以下、図2を用いて、第1の実施形態に係る影響評価装置100の構成について説明する。図2は、第1の実施形態に係る影響評価装置100の構成の一例を示す図である。図2に示すように、影響評価装置100は、I/F(Interface)部110と、入力部120と、表示部130と、通信部140と、記憶部150と、制御部160とを有する。I/F部110は、入力部120、表示部130及び通信部140と、制御部160との各種情報のやり取りを制御する。入力部120は、影響評価装置100の管理者から各種情報の入力操作を受付ける。例えば、入力部120は、後述する制御部160によるリファレンスサイトの実行プログラムの選択に用いられるルール情報の入力操作を受付ける。なお、ルール情報については後に詳述する。表示部130は、各種情報を表示する表示デバイスであり、例えば液晶ディスプレイ等である。
[Configuration of impact assessment equipment]
Hereinafter, the configuration of the
記憶部150は、図2に示すように、ログ情報記憶部151と、構成情報記憶部152と、ルール情報記憶部153と、テスト情報154とを有する。記憶部150は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置などである。
As illustrated in FIG. 2, the
ログ情報記憶部151は、ネットワーク10に含まれるNW機器のログ情報を記憶する。具体的には、ログ情報記憶部151は、後述する制御部160によってEM30から取得されたイベント詳細情報を記憶する。図3は、第1の実施形態に係るログ情報記憶部151によって記憶される情報の一例を示す図である。例えば、ログ情報記憶部151は、図3に示すように、「日付」、「時刻」、「NW機器」及び「状態」を対応付けたイベント詳細情報を記憶する。
The log
ここで、「日付」とは、ネットワーク10においてイベントが発生した日付を示す。また、「時刻」とは、ネットワーク10においてイベントが発生した時刻を示す。また、「NW機器」とは、イベントが発生したNW機器を示す。また、「状態」とは、イベントの内容を示す。すなわち、ログ情報記憶部151によって記憶されるログ情報は、「いつ」、「どの機器」で「どのようなイベント」が発生したかを意味する情報である。
Here, “date” indicates the date on which an event occurred in the network 10. “Time” indicates the time at which an event occurred in the network 10. The “NW device” indicates the NW device in which an event has occurred. The “state” indicates the content of the event. That is, the log information stored by the log
図2に戻って、構成情報記憶部152は、ネットワーク10の構成を示す構成情報を記憶する。具体的には、構成情報記憶部152は、後述する制御部160によってCMDB20から取得された構成情報を記憶する。図4は、第1の実施形態に係る構成情報記憶部152によって記憶される情報の一例を示す図である。例えば、構成情報記憶部152は、図4に示すように、「NW機器」、「構成部品」、「接続先NW機器」及び「構成部品」を対応付けた構成情報を記憶する。
Returning to FIG. 2, the configuration
一例を挙げると、構成情報記憶部152は、図4に示すように、「NW機器:R1、構成部品:ポート1a」に「接続先NW機器:R2、構成部品:ポート2a」が対応付けられた構成情報を記憶する。すなわち、上述した構成情報は、ネットワーク10において、「ルータR1」の「ポート1a」に「ルータR2」の「ポート2a」が接続されていることを意味する。
For example, in the configuration
図2に戻って、ルール情報記憶部153は、後述する制御部160によって実行されるリファレンスサイトの実行プログラムの選択に用いられるルール情報を記憶する。具体的には、ルール情報記憶部153は、リファレンスサイトによって実行されるテスト内容を決定するために予め設定されるルール情報を記憶する。図5は、第1の実施形態に係るルール情報記憶部153によって記憶される情報の一例を示す図である。例えば、ルール情報記憶部153は、図5に示すように、「イベント」、「範囲」、「サービス」及び「テスト内容」を対応付けたルール情報を記憶する。
Returning to FIG. 2, the rule
ここで、「イベント」とは、ネットワーク10において発生しうるイベントの内容を示す。また、「範囲」とは、ネットワーク10において発生したイベントが影響する範囲を示す。また、「サービス」とは、ネットワーク10において発生したイベントが影響するサービスを示す。また、「テスト内容」とは、リファレンスサイトに実行させるテストの内容を示す。すなわち、ルール情報記憶部151によって記憶されるルール情報は、イベント内容と、当該イベントによって影響をうける範囲及びサービス内容との組み合わせごとに、リファレンスサイトにどのようなテストを実行させるかを示す情報である。テスト内容としては、例えば、遅延テストや、疎通性テストなどが挙げられる。
Here, the “event” indicates the content of an event that can occur in the network 10. The “range” indicates a range in which an event occurring in the network 10 affects. The “service” indicates a service affected by an event occurring in the network 10. “Test content” indicates the content of a test to be executed by the reference site. That is, the rule information stored by the rule
図2に戻って、テスト情報記憶部154は、後述する制御部160によってリファレンスサイトに対して送信されるテスト実行コマンドに指定されるテストプログラムの情報を記憶する。図6は、第1の実施形態に係るルール情報記憶部154によって記憶される情報の一例を示す図である。例えば、テスト情報記憶部154は、図6に示すように、「テスト内容」に「プログラム」を対応付けたテスト情報を記憶する。ここで、「テスト内容」とは、リファレンスサイトに実行させるテストの内容を示す。また、「プログラム」とは、テスト内容に対応するプログラムの情報を示す。
Returning to FIG. 2, the test
図2に戻って、制御部160は、取得部161と、推定部162と、検査部163と、解析部164と、通知部165とを有する。ここで、制御部160は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などの電子回路やASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路である。
Returning to FIG. 2, the
取得部161は、ネットワーク10に含まれる複数のネットワーク機器に関するログ情報及びネットワーク10における複数のネットワーク機器の構成を示す構成情報を取得する。具体的には、取得部161は、ログ情報として、Syslogの情報、MIB情報及びShowコマンドの出力情報を含む情報を取得する。例えば、取得部161は、CMDB20から構成情報を取得する。また、取得部161は、EM30からイベント詳細情報を取得する。ここで、取得部161は、例えば、TFTPリクエストを用いて構成情報やイベント詳細情報を取得する。そして、取得部161は、取得したイベント詳細情報をログ情報記憶部151に格納し、構成情報を構成情報記憶部152に格納する。
The
推定部162は、取得部161によって取得されたログ情報及びネットワーク10の構成情報に基づいて、ネットワーク10に発生した障害によって影響を受ける当該ネットワーク10上の範囲及びサービスを推定する。具体的には、推定部162は、ログ情報及び前記ネットワークの構成情報に基づいて、当該ネットワーク上でサービスを提供する複数のサービス提供サーバ及び前記複数のサービス提供サーバからサービス提供を受ける複数のユーザ端末のうち、ネットワーク10に発生した障害によって影響を受けるサービス提供サーバ及びユーザ端末を推定する。
Based on the log information acquired by the
例えば、推定部162は、ログ情報記憶部151によって記憶されたイベント詳細情報を参照して、ネットワーク10に発生したイベントを特定する。そして、推定部162は、構成情報記憶部152によって記憶されたネットワークの構成情報を参照して、特定したイベントごとに、イベントによって影響を受ける範囲と、サービス提供サーバによって提供されるサービスのうちイベントによって影響を受けるサービスとを推定する。
For example, the
検査部163は、推定部162によって推定されたネットワーク10上の範囲におけるサービスに対して、ネットワーク10に発生した障害が与える影響の内容を検査する。具体的には、検査部163は、ネットワーク10に発生した障害と、推定部162によって推定されたネットワーク10上の範囲との組み合わせに基づいて、リファレンスサイトに実行させる検査内容を決定し、決定した検査内容の実行コマンドをリファレンスサイトに実行させることで、サービスに対して障害が与える影響の内容を検査する。
The inspecting
例えば、検査部163は、ルール情報記憶部153によって記憶されたルール情報と、テスト情報記憶部154によって記憶されたテスト情報とを参照して、推定部162によって影響範囲とサービスが推定されたイベントごとに、テスト内容及びプログラムを選択する。そして、検査部163は、選択したプログラムを実行させるテスト実行コマンドをリファレンスサイトRS1及び/又はリファレンスサイトRS2に送信してテストを実行させる。
For example, the
解析部164は、検査部163による検査結果に基づいて、推定部162によって推定されたネットワーク上の範囲におけるサービスに対して、ネットワークに発生した障害が与える影響の内容を解析する。具体的には、解析部164は、リファレンスサイトRS1及び/又はリファレンスサイトRS2のテスト結果を取得して、取得した結果を解析することで、イベントがサービスに対して与える影響を評価する。
Based on the inspection result by the
通知部165は、検査部163による検査結果をネットワークの管理者に対して通知する。具体的には、通知部165は、解析部164による解析結果とイベントとを組み合わせたイベントレポートを生成し、生成したイベントレポートをネットワーク10の管理者に対して通知する。例えば、通知部165は、イベントごとに生成したイベントレポートを表示部130にて表示させることで、ネットワーク10の管理者に検査結果を通知する。
The
以上、第1の実施形態に係る影響評価装置100の構成について説明した。以下、上述した影響評価装置100を含むネットワーク内における処理の流れについて、図7を用いて説明する。図7は、第1の実施形態に係る影響評価装置100を含むネットワーク10内における処理の流れを説明するための模式図である。
The configuration of the
例えば、図7に示すように、ステップ1において、ネットワーク(NW)にイベントが発生すると、EM30は、システムログ収集機能によってMIB情報やShowコマンド出力の情報などを収集する。また、同様に、EM30は、Syslog収集機能によってSyslogメッセージを収集する。そして、ステップ2において、EM30は、イベント管理機能によって、収集したシステムログ情報及びSyslogメッセージの情報とを統合して、「いつ」、「どの機器」が「どのような状態か」を示すイベント詳細情報を生成して保持する。
For example, as shown in FIG. 7, when an event occurs in the network (NW) in
その後、影響評価装置100の取得部161が、CMDB20からネットワークの構成情報を取得するとともに、EM30からイベント詳細情報を取得する。そして、ステップ3において、影響評価装置100の推定部162が、取得部161によって取得されたネットワークの構成情報と、イベント詳細情報とからどの機器・どのサービスがどのように影響を受けるかを推定する。
Thereafter, the
そして、ステップ4において、影響評価装置100の検査部163が、推定部162の推定結果と、ルール情報とを用いて、「どのリファレンスサイトが」、「NWのどの箇所へ」、「どのテストを実施するか」をそれぞれ決定する。そして、検査部163は、リファレンスサイトに対してテスト実行コマンドを送信する。
In step 4, the
テスト実行コマンドを受信したリファレンスサイトは、ステップ5において、テスト実行コマンドで指示された範囲に対して、Ping、Trace Route、Captureなどのテストを実行する。そして、リファレンスサイトは、テスト結果を影響評価装置100に対して送信する。
In step 5, the reference site that has received the test execution command executes tests such as Ping, Trace Route, and Capture for the range designated by the test execution command. Then, the reference site transmits the test result to the
そして、ステップ6において、影響評価装置100がテスト結果を受信すると、解析部164は、テスト結果に基づいて、イベントがサービスに与える影響を解析する。例えば、解析部164は、「遅延」や、「疎通性」などを解析する。
In step 6, when the
そして、ステップ7において、通知部165は、解析部164の解析結果に基づいて、「イベント名」、「イベント詳細」、「影響評価」などの情報を含むイベントレポートを作成して、作成したイベントレポートをNWの管理者に対して通知する。
In step 7, the
以上、影響評価装置100を含むネットワーク内の処理の流れについて説明した。以下、図1に示すネットワーク10のルータR3とルータR4との間にリンク故障が発生した場合の一例について説明する。
The flow of processing in the network including the
上記した場合、推定部162は、取得部161によって取得されたイベント詳細情報からリンク故障の詳細な情報を抽出する。例えば、推定部162は、イベント詳細情報に含まれる「中継網11のルータ4のポートがダウン」とする情報を抽出する。そして、推定部162は、ネットワーク10の構成情報を参照して、中継網11の各NW機器が同一のASに所属していることから、「中継網11の各NW機器においてルートが再計算される可能性がある」と判定する。
In the case described above, the
さらに、推定部162は、構成情報を参照して、ユーザセグメント12a、12b及びサーバセグメント13a、13bの通信が中継網11を介していることから、「ユーザセグメント12aに対する及びユーザセグメント12bに対するサービスサーバS1のサービスが影響を受ける」と推定する。同様に、推定部162は、「ユーザセグメント12aに対する及びユーザセグメント12bに対するサービスサーバS2のサービスが影響を受ける」と推定する。
Further, the
そして、検査部163は、「ルータR4のポートがダウンして、ルータR3との間のリンクが故障している」ことと、「ユーザセグメント12aに対する及びユーザセグメント12bに対するサービスサーバS1のサービスが影響を受ける」及び「ユーザセグメント12aに対する及びユーザセグメント12bに対するサービスサーバS2のサービスが影響を受ける」こととから、ルール情報を用いてテスト内容を決定する。
Then, the
例えば、検査部163は、「サービスサーバS1からユーザセグメント12a及びユーザセグメント12bへの疎通性」を検証するテストと、「サービスサーバS2からユーザセグメント12a及びユーザセグメント12bへの疎通性」を検証するテストと、「サービスサーバS2からユーザセグメント12bへのサービス応答時間」を検証するテストとを実行することを決定する。
For example, the
そして、検証部163は、テスト情報を参照して各テスト内容に対応するプログラムを決定し、該当するリファレンスサイトへ決定したテスト実行コマンドを送信する。例えば、検査部163は、「サービスサーバS1へPingして、応答の有無を記録させるテスト」のテスト実行コマンドをリファレンスサイトRS1に対して送信する。また、検査部163は、「サービスサーバS1へPingして、応答の有無を記録させるテスト」のテスト実行コマンドをリファレンスサイトRS2に対して送信する。また、検査部163は、「サービスサーバS2へPingして、応答の有無と、応答時間とを記録させるテスト」のテスト実行コマンドをリファレンスサイトRS2に対して送信する。
Then, the
そして、解析部163は、各リファレンスサイトから受信したテスト結果を解析して、各サービスに対するイベントの影響を評価する。例えば、テスト結果が、「サービスサーバS1からリファレンスサイトRS1に対する応答が有り」、「サービスサーバS1からリファレンスサイトRS2に対する応答が有り」、「サービスサーバS2からリファレンスサイトRS2に対する応答が有り」、「サービスサーバS2からリファレンスサイトRS2に対する応答時間が所定の時間より長い」であった場合、解析部163は、「ユーザセグメント12bに含まれるユーザ端末に対してサーバS2から提供されるサービスの通信に遅延が発生する」と解析する。
And the
そして、通知部165は、解析部164による解析結果と、イベント詳細情報とからイベントレポートを生成して、ネットワーク10の管理者に対して通知する。図8は、第1の実施形態に係る通知部165によって通知されるイベントレポートの一例を示す図である。例えば、通知部165は、図8に示すように、「イベント名:リンク故障」と、「イベント詳細:中継網11のルータR4のポートがダウンし、ルータR3とルータR4との間のリンク故障」と、「影響:ユーザセグメント12bに含まれるユーザ端末に対してサーバS2によって提供されるサービスの通信に遅延発生」とが記載されたイベントレポートを生成する。そして、通知部165は、表示部130に生成したイベントレポートを表示させる。
Then, the
[影響評価装置による処理の手順]
次に、第1の実施形態に係る影響評価装置100による処理の手順について、図9を用いて説明する。図9は、第1の実施形態に係る影響評価装置100による処理の手順を示すフローチャートである。なお、図9においては、ネットワーク10にイベントが発生して、EM30がイベント詳細情報を生成した後の処理について示す。
[Procedure for processing by impact assessment device]
Next, a processing procedure performed by the
図9に示すように、第1の実施形態に係る影響評価装置100においては、ネットワーク10にイベントが発生すると、取得部161が、イベント詳細情報及びネットワーク10の構成情報を取得する(ステップS101)。そして、推定部162が、取得部161によって取得されたイベント詳細情報及びネットワークの構成情報を用いて、イベントによって影響を受けるNW機器及びサービスを推定する(ステップS102)。
As shown in FIG. 9, in the
そして、検査部163が、推定部162によって推定されたNW機器及びサービスと、イベントの内容とから、ルール情報に基づいて、テスト実行するリファレンスサイト及びテストプログラムを選択する(ステップS103)。そして、検査部163は、選択したリファレンスサイトに対してテスト実行コマンドを送信する(ステップS104)。
Then, the
そして、リファレンスサイトからテスト結果を受信すると(ステップS105 肯定)、解析部164は、サービスに対するイベントの影響を解析する(ステップS106)。そして、通知部165は、解析部164による解析結果からイベントレポートを生成して、NW管理者に通知して(ステップS107)、処理を終了する。なお、ステップS105において、リファレンスサイトからのテスト結果を受信するまで、影響評価装置100は待機状態となる(ステップS105 否定)。
When the test result is received from the reference site (Yes at Step S105), the
[第1の実施形態の効果]
上述したように、第1の実施形態によれば、取得部161は、ネットワーク10に含まれるネットワーク機器のログ情報及びネットワーク10の構成情報を取得する。そして、推定部162は、取得部161によって取得されたログ情報及びネットワーク10の構成情報に基づいて、ネットワーク10に発生したイベントによって影響を受ける当該ネットワーク10上の範囲及びサービスを推定する。そして、検査部163は、推定部162によって推定されたネットワーク10上の範囲におけるサービスに対して、ネットワーク10に発生したイベントが与える影響の内容を検査する。そして。通知部165は、検査部163による検査結果をネットワーク10の管理者に対して通知する。従って、第1の実施形態に係る影響評価装置100は、イベントがネットワークやサービスに与える影響を容易に評価することを可能にする。
[Effect of the first embodiment]
As described above, according to the first embodiment, the
例えば、従来技術では、イベントの影響を評価するためには、NW管理者が、イベントの詳細情報に基づいてNW上で影響が及ぶ範囲を推定し、適切な評価手段を選択して評価を行なっていたが、第1の実施形態に係る影響評価装置100は、イベントに合わせて適切な評価を行うことができ、イベントがネットワークやサービスに与える影響を容易に評価することを可能にする。
For example, in the prior art, in order to evaluate the influence of an event, the NW administrator estimates the range of influence on the NW based on the detailed information of the event, and selects and evaluates an appropriate evaluation means. However, the
また、例えば、従来技術では、イベントに関する情報のみでなく、管理者がNWの物理構成及び論理構成の情報を把握しておく必要があり、NW管理者にとっては高度な知識が求められる上、多くの稼動が必要であったが、第1の実施形態に係る影響評価装置100は、イベント検知からその影響評価までを自動的に実施することができ、イベントがネットワークやサービスに与える影響を容易に評価することを可能にする。
In addition, for example, in the prior art, it is necessary for an administrator to grasp not only information related to an event but also information on the physical configuration and logical configuration of the NW, which requires a high level of knowledge for the NW administrator. However, the
また、第1の実施形態によれば、推定部162は、ログ情報及びネットワーク10の構成情報に基づいて、当該ネットワーク10上でサービスを提供する複数のサービス提供サーバ及び複数のサービス提供サーバからサービス提供を受ける複数のユーザ端末のうち、前記ネットワークに発生した障害によって影響を受けるサービス提供サーバ及びユーザ端末を推定する。従って、第1の実施形態に係る影響評価装置100は、イベントによる影響の範囲を詳細に推定することを可能にする。
Further, according to the first embodiment, the
また、第1の実施形態によれば、検査部163は、ネットワーク10に発生した障害と、推定部162によって推定されたネットワーク上10の範囲との組み合わせに基づいて、リファレンスサイトに実行させる検査内容を決定し、決定した検査内容の実行コマンドをリファレンスサイトに実行させることで、サービスに対して障害が与える影響の内容を検査する。従って、第1の実施形態に係る影響評価装置100は、種々のイベントに対応した適切な検査を実行することを可能にする。
In addition, according to the first embodiment, the
また、第1の実施形態によれば、解析部164は、検査部163による検査結果に基づいて、推定部162によって推定されたネットワーク10上の範囲におけるサービスに対して、ネットワーク10に発生した障害が与える影響の内容を解析する。そして、通知部165は、解析部164による解析結果と障害とを組み合わせたレポートを生成し、生成したレポートをネットワーク10の管理者に対して通知する。従って、第1の実施形態に係る影響評価装置100は、イベントがサービスに与える影響の詳細をネットワーク管理者に提供することができ、ネットワーク管理者が適切かつ迅速にアクションをとることを可能にする。
Further, according to the first embodiment, the
また、第1の実施形態によれば、取得部161は、ログ情報として、Syslogの情報、MIB情報及びShowコマンドの出力情報を含む情報を取得する。従って、第1の実施形態に係る影響評価装置100は、ネットワーク機器の状態に関して種々の情報を取得することができ、様々なイベントを検出することを可能にする。
Further, according to the first embodiment, the
[第2の実施形態]
これまで第1の実施形態について説明したが、本願に係る技術は第1の実施形態に限定されるものではない。すなわち、第1の実施形態は、その他の様々な形態で実施されることが可能であり、種々の省略、置き換え、変更を行うことができる。
[Second Embodiment]
Although the first embodiment has been described so far, the technology according to the present application is not limited to the first embodiment. That is, the first embodiment can be implemented in various other forms, and various omissions, replacements, and changes can be made.
上述した第1の実施形態では、イベントレポートをネットワーク10の管理者に通知する場合について説明した。しかしながら、実施形態はこれに限定されるものではなく、例えば、複数のネットワーク管理者それぞれにイベントレポートを通知する場合であってもよい。例えば、図1に示すユーザセグメント12a及びユーザセグメント12bそれぞれの管理者に対してイベントレポートを通知する場合であってもよい。これにより、例えば、第2の実施形態に係る影響評価装置100は、イベントによって影響を受けるユーザに対して迅速に通知を行うことができる。また、例えば、第2の実施形態に係る影響評価装置100は、各ネットワーク管理者によるネットワークの設計やサーバの構成などをより適切に行わせることを可能にする。
In the first embodiment described above, the case where the event report is notified to the administrator of the network 10 has been described. However, the embodiment is not limited to this. For example, the event report may be notified to each of a plurality of network administrators. For example, the event report may be notified to the managers of the
[システム構成等]
例えば、各装置の分散・統合の具体的形態(例えば、図2の形態)は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合することができる。一例を挙げると、取得部161と推定部162とを一つの処理部として統合してもよく、一方、検査部163を、リファレンスサイト及び検査内容を決定する決定部と、決定された検査内容を決定されたリファレンスサイトに実行させる実行制御部とに分散してもよい。
[System configuration, etc.]
For example, the specific form of distribution / integration of each device (for example, the form shown in FIG. 2) is not limited to the one shown in the figure, and all or a part thereof can be changed in arbitrary units according to various loads and usage conditions. Functionally or physically distributed and integrated. For example, the
また、EM30に備えられたSyslog収集機能、Syslog以外のシステムログ収集機能、イベント詳細情報の管理機能は、同一の装置によって実行される場合であってもよく、或いは、それぞれ異なる装置で実行される場合であってもよい。
Further, the Syslog collection function, the system log collection function other than Syslog, and the event detailed information management function provided in the
これらの実施例やその変形は、本願に係る技術に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。 These embodiments and modifications thereof are also included in the invention according to the claims and equivalents thereof, if included in the technology according to the present application.
10 ネットワーク
11 中継網
12a、12b ユーザセグメント
13a、13b サーバセグメント
20 CMDB
30 EM
100 影響評価装置
161 取得部
162 推定部
163 検査部
164 解析部
165 通知部
10 network 11
30 EM
DESCRIPTION OF
Claims (6)
前記取得部によって取得された前記ログ情報及び前記ネットワークの構成情報に基づいて、前記ネットワークに発生した障害によって影響を受ける当該ネットワーク上の範囲及びサービスを推定する推定部と、
前記推定部によって推定された前記ネットワーク上の範囲における前記サービスに対して、前記ネットワークに発生した障害が与える影響の内容を検査する検査部と、
前記検査部による検査結果を前記ネットワークの管理者に対して通知する通知部と、
を備えたことを特徴とする影響評価装置。 An acquisition unit that acquires log information about a plurality of network devices included in a network and configuration information indicating a configuration of the plurality of network devices in the network;
Based on the log information acquired by the acquisition unit and the configuration information of the network, an estimation unit that estimates a range and service on the network affected by a failure that has occurred in the network;
An inspection unit that inspects the content of the influence of a failure that has occurred in the network on the service in the range on the network estimated by the estimation unit;
A notification unit for notifying the network administrator of the inspection result by the inspection unit;
An impact evaluation apparatus comprising:
前記通知部は、前記解析部による解析結果と前記障害とを組み合わせたレポートを生成し、生成したレポートを前記ネットワークの管理者に対して通知することを特徴とする請求項1〜3のいずれか一つに記載の影響評価装置。 Based on the inspection result by the inspection unit, the service unit in the range estimated on the network by the estimation unit, further comprising an analysis unit for analyzing the content of the effect of the failure that has occurred in the network,
The said notification part produces | generates the report which combined the analysis result by the said analysis part, and the said failure, and notifies the produced | generated report with respect to the administrator of the said network. The impact evaluation apparatus according to one.
前記ネットワークに含まれる複数のネットワーク機器に関するログ情報及び前記ネットワークにおける前記複数のネットワーク機器の構成を示す構成情報を取得する取得工程と、
前記取得工程によって取得された前記ログ情報及び前記ネットワークの構成情報に基づいて、前記ネットワークに発生した障害によって影響を受ける当該ネットワーク上の範囲及びサービスを推定する推定工程と、
前記推定工程によって推定された前記ネットワーク上の範囲における前記サービスに対して、前記ネットワークに発生した障害が与える影響の内容を検査する検査工程と、
前記検査工程による検査結果を前記ネットワークの管理者に対して通知する通知工程と、
を含んだことを特徴とする影響評価方法。 An impact assessment method executed by an impact assessment device that assesses the impact of a failure occurring in a network,
An acquisition step of acquiring log information regarding a plurality of network devices included in the network and configuration information indicating a configuration of the plurality of network devices in the network;
Based on the log information acquired by the acquisition step and the configuration information of the network, an estimation step of estimating a range and a service on the network affected by a failure that has occurred in the network;
An inspection step of inspecting the contents of the influence of a failure occurring in the network with respect to the service in the range on the network estimated by the estimation step;
A notification step of notifying an inspection result of the inspection step to an administrator of the network;
An impact assessment method characterized by including
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012175992A JP2014036310A (en) | 2012-08-08 | 2012-08-08 | Apparatus and method for evaluating effect |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012175992A JP2014036310A (en) | 2012-08-08 | 2012-08-08 | Apparatus and method for evaluating effect |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014036310A true JP2014036310A (en) | 2014-02-24 |
Family
ID=50285047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012175992A Pending JP2014036310A (en) | 2012-08-08 | 2012-08-08 | Apparatus and method for evaluating effect |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014036310A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016034117A (en) * | 2014-07-31 | 2016-03-10 | Kddi株式会社 | Path setting device, path setting method, path setting program, and communication system |
JP2016034116A (en) * | 2014-07-31 | 2016-03-10 | Kddi株式会社 | Path setting device, path setting method, path setting program, and communication system |
-
2012
- 2012-08-08 JP JP2012175992A patent/JP2014036310A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016034117A (en) * | 2014-07-31 | 2016-03-10 | Kddi株式会社 | Path setting device, path setting method, path setting program, and communication system |
JP2016034116A (en) * | 2014-07-31 | 2016-03-10 | Kddi株式会社 | Path setting device, path setting method, path setting program, and communication system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10057136B2 (en) | Method and apparatus for visualized network operation and maintenance | |
US10097433B2 (en) | Dynamic configuration of entity polling using network topology and entity status | |
US8443074B2 (en) | Constructing an inference graph for a network | |
US10425320B2 (en) | Methods, systems, and computer readable media for network diagnostics | |
US9014012B2 (en) | Network path discovery and analysis | |
CN108600051B (en) | BGP Anycast cluster service quality detection method and detection equipment | |
EP2974146B1 (en) | Methods, systems, and computer readable media for assisting with the debugging of conditions associated with the processing of test packets by a device under test | |
Gheorghe et al. | SDN-RADAR: Network troubleshooting combining user experience and SDN capabilities | |
Harrington | Guidelines for Considering Operations and Management of New Protocols and Protocol Extensions | |
JP2008283621A (en) | Apparatus and method for monitoring network congestion state, and program | |
EP2586158A1 (en) | Apparatus and method for monitoring of connectivity services | |
US9866466B2 (en) | Simulating real user issues in support environments | |
CN114401186B (en) | End-to-end fault determination method and system in customized network | |
JP2014036310A (en) | Apparatus and method for evaluating effect | |
JP2008244635A (en) | System, method, and program for monitoring network, and collecting device | |
JP5974905B2 (en) | Response time monitoring program, method, and response time monitoring apparatus | |
US20180375751A1 (en) | Methods, systems, and computer readable media for conducting and validating network route convergence testing | |
Yamada et al. | Developing network configuration management database system and its application—data federation for network management | |
JP2006186829A (en) | Device which collects and analyses network information, creates network composition information, its creation method, and its creation program | |
JP2014155012A (en) | Influence evaluation device, and influence evaluation method | |
JP5968829B2 (en) | Evaluation method, evaluation apparatus, and evaluation program | |
CN111044268A (en) | Method and device for monitoring on-off state of optical fiber | |
JP2018142092A (en) | Operation checking device, operation checking program, operation checking method, and operation checking system | |
NL1041873A (en) | A test device, a testing system, a testing method and a computer program product for testing a network | |
JP4567363B2 (en) | Line bandwidth judgment system, line bandwidth judgment method and program |