JP2018133688A - Service restoration device and service restoration method - Google Patents

Service restoration device and service restoration method Download PDF

Info

Publication number
JP2018133688A
JP2018133688A JP2017025907A JP2017025907A JP2018133688A JP 2018133688 A JP2018133688 A JP 2018133688A JP 2017025907 A JP2017025907 A JP 2017025907A JP 2017025907 A JP2017025907 A JP 2017025907A JP 2018133688 A JP2018133688 A JP 2018133688A
Authority
JP
Japan
Prior art keywords
service
setting change
network
countermeasure
restoration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017025907A
Other languages
Japanese (ja)
Other versions
JP6718398B2 (en
Inventor
直幸 丹治
Naoyuki Tanji
直幸 丹治
直規 立石
Naoki Tateishi
直規 立石
愛 角田
Ai Tsunoda
愛 角田
三郎 瀬戸
Saburo Seto
三郎 瀬戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017025907A priority Critical patent/JP6718398B2/en
Publication of JP2018133688A publication Critical patent/JP2018133688A/en
Application granted granted Critical
Publication of JP6718398B2 publication Critical patent/JP6718398B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To realize automatic restoration of services provided on a network.SOLUTION: A service restoration device 1 that monitors a service by using flow data collected from a plurality of network devices and restores the service if there is service abnormality includes a storage unit 30 for storing a network setting change for restoring the service, a service quality determination unit 13 for determining abnormality of the service by obtaining a degree of departure from continuity obtained from the collected flow data, a measure plan deriving unit 15 for deriving a measure plan obtained by combining one or a plurality of network setting changes contributing to the restoration of the service from the storage unit 30, a measure plan application unit 16 that applies the measure plan derived from the measure plan deriving unit 15 to the network in which the network devices are arranged.SELECTED DRAWING: Figure 2

Description

本発明は、サービス復旧装置およびサービス復旧方法に関する。   The present invention relates to a service restoration apparatus and a service restoration method.

ネットワークの運用管理において、現在提供中のサービスを監視することが非常に重要であり、ネットワーク上で提供されているサービスの異常を検出するさまざまな異常検出方法が従来から知られている。例えば、特許文献1には、「複数のネットワーク装置から収集したフローデータを用いて、サービスを監視するサービス監視装置であって、前記収集したフローデータから、前記サービスに対する、要求トラフィックおよび応答トラフィックを抽出する抽出部と、前記抽出された、要求トラフィックおよび応答トラフィックに基づいて、前記要求トラフィックおよび前記応答トラフィックとの間の定常性を算出する定常性算出部と、特定期間内での前記要求トラフィックおよび前記応答トラフィックとの間の関係性が、前記算出された定常性からどれだけ逸脱しているかによって、前記サービスの品質を判定する判定部と、を備える、ことを特徴とするサービス監視装置」が開示されている。   In network operation management, it is very important to monitor currently provided services, and various abnormality detection methods for detecting abnormalities in services provided on the network have been known. For example, Patent Document 1 states that “a service monitoring apparatus that monitors a service using flow data collected from a plurality of network devices, and requests traffic and response traffic for the service are collected from the collected flow data. An extracting unit for extracting; a continuity calculating unit for calculating continuity between the request traffic and the response traffic based on the extracted request traffic and response traffic; and the request traffic within a specific period. And a determination unit that determines the quality of the service according to how much the relationship between the response traffic and the response traffic deviates from the calculated continuity ” Is disclosed.

特開2016−144153号公報JP 2006-144153 A

しかし、特許文献1によれば、サービスの異常を検出した場合、サービスの復旧のために、異常の原因分析や対策案の検討、実施といったオペレーションを保守者自ら行う必要がある。このため、サービスの復旧には多くの時間を要してしまう。   However, according to Patent Document 1, when a service abnormality is detected, it is necessary for the maintenance person to perform operations such as analysis of the cause of the abnormality, examination of a countermeasure plan, and implementation in order to restore the service. For this reason, it takes a lot of time to restore the service.

このような背景を鑑みて本発明がなされたのであり、本発明は、ネットワーク上で提供されているサービスの自動復旧を実現することを課題とする。   The present invention has been made in view of such a background, and an object of the present invention is to realize automatic restoration of services provided on a network.

前記した課題を解決するため、請求項1に記載の発明は、複数のネットワーク装置から収集したフローデータを用いてサービスを監視し、前記サービスの異常があれば復旧するサービス復旧装置であって、前記サービスを復旧させるためのネットワーク設定変更を記憶する記憶部と、前記収集したフローデータから得られる定常性からの逸脱度合いを求めることによって、前記サービスの異常を判定する判定部と、前記記憶部から、前記サービスの復旧に寄与するネットワーク設定変更を1または複数組み合わせた対策案を導出する対策案導出部と、前記対策案導出部が導出した対策案を、前記ネットワーク装置が配置されるネットワークに適用する対策案適用部と、を備える、ことを特徴とする。   In order to solve the above-mentioned problem, the invention according to claim 1 is a service restoration device that monitors a service using flow data collected from a plurality of network devices and restores if there is an abnormality in the service, A storage unit that stores a network setting change for restoring the service; a determination unit that determines abnormality of the service by obtaining a deviation degree from continuity obtained from the collected flow data; and the storage unit The countermeasure plan derivation unit for deriving a countermeasure plan combining one or more network setting changes that contribute to the restoration of the service, and the countermeasure plan derived by the countermeasure plan derivation unit are transferred to the network in which the network device is arranged. And a countermeasure plan application unit to be applied.

また、請求項3に記載の発明は、複数のネットワーク装置から収集したフローデータを用いてサービスを監視し、前記サービスの異常があれば復旧するサービス復旧装置におけるサービス復旧方法であって、前記サービス復旧装置の記憶部が、前記サービスを復旧させるためのネットワーク設定変更を記憶しており、前記サービス復旧装置は、前記収集したフローデータから得られる定常性からの逸脱度合いを求めることによって、前記サービスの異常を判定する判定ステップと、前記記憶部から、前記サービスの復旧に寄与するネットワーク設定変更を1または複数組み合わせた対策案を導出する対策案導出ステップと、前記対策案導出ステップで導出した対策案を、前記ネットワーク装置が配置されるネットワークに適用する対策案適用ステップと、を実行する、ことを特徴とする。   The invention according to claim 3 is a service restoration method in a service restoration device that monitors a service using flow data collected from a plurality of network devices and restores if there is an abnormality in the service, the service restoration method comprising: The storage unit of the restoration device stores a network setting change for restoring the service, and the service restoration device obtains the degree of deviation from continuity obtained from the collected flow data, thereby A determination step for determining an abnormality of the network, a countermeasure plan derivation step for deriving a countermeasure plan combining one or more network setting changes that contribute to the restoration of the service from the storage unit, and a countermeasure derived in the countermeasure plan derivation step Apply countermeasure plan to apply the plan to the network where the network device is located And step, is executed, characterized in that.

請求項1,3に記載の発明によれば、発生したサービスの異常に対して、予め用意したネットワーク設定変更を種々組み合わせた対策案をネットワークに順次適用することができる。
したがって、ネットワーク上で提供されているサービスの自動復旧を実現することができる。
According to the first and third aspects of the present invention, it is possible to sequentially apply measures proposed by combining various network setting changes prepared in advance to the network in response to a service abnormality that has occurred.
Therefore, automatic restoration of services provided on the network can be realized.

また、請求項2に記載の発明は、請求項1に記載のサービス復旧装置であって、前記対策案が適用され、前記サービスが復旧した場合に、前記記憶部に記憶されているネットワーク設定変更の評価値を、前記サービスの復旧の寄与に応じて増減させる対策案評価部を備える、ことを特徴とする。   Further, the invention according to claim 2 is the service restoration apparatus according to claim 1, wherein the network setting change stored in the storage unit when the countermeasure is applied and the service is restored. A measure plan evaluation unit is provided for increasing or decreasing the evaluation value according to the contribution of restoration of the service.

また、請求項4に記載の発明は、請求項3に記載のサービス復旧方法であって、前記サービス復旧装置は、前記対策案が適用され、前記サービスが復旧した場合に、前記記憶部に記憶されているネットワーク設定変更の評価値を、前記サービスの復旧の寄与に応じて増減させる対策案評価ステップ、を実行する、ことを特徴とする。   The invention according to claim 4 is the service restoration method according to claim 3, wherein the service restoration device stores in the storage unit when the countermeasure is applied and the service is restored. A measure proposal evaluation step is executed to increase or decrease the evaluation value of the network setting change being made according to the contribution of the restoration of the service.

本発明によれば、ネットワーク上で提供されているサービスの自動復旧を実現することができる。   ADVANTAGE OF THE INVENTION According to this invention, the automatic recovery of the service provided on the network is realizable.

ネットワークの全体構成図である。1 is an overall configuration diagram of a network. 本実施形態のサービス復旧装置の機能構成図である。It is a functional lineblock diagram of the service restoration device of this embodiment. 設定変更候補リストのデータ構造図である。It is a data structure figure of a setting change candidate list. 実行済設定変更リストのデータ構造図である。It is a data structure figure of an executed setting change list. 設定変更キューのデータ構造図である。It is a data structure figure of a setting change queue. 本実施形態のサービス復旧装置の処理を示すフローチャートである。It is a flowchart which shows the process of the service recovery apparatus of this embodiment. 図6の対策案導出処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the countermeasure plan derivation | leading-out process of FIG.

<考え方>
SDN(Software Defined Network)、SDWAN(Software-Defined Wide Area Networking)、AWS(Amazon Web Services。「Amazon」は登録商標)に代表されるクラウドサービスは、SoftwareDefinedの形態でサービスの提供がなされる。この場合、装置交換、パッケージ交換、物理配線の差し替え、とった物理的なオペレーションはとらず、ソフトウェア的オペレーションのみで、サービスの異常からの復旧に必要な制御、例えば、NWの構成変更や設定変更などを実現することができる。このため、サービスを異常状態から復旧させるために、必ずしも保守者が、対策案の検討・実施を行う必要はない。本発明では、サービスの異常状態から復旧するまで、予め定義されたNWの設定変更の候補を用いた対策案の導出および適用を行い、サービスの復旧を目指す。NWの設定変更は、単に、「設定変更」または「ネットワーク設定変更」と呼ぶ場合がある。
<Concept>
Cloud services represented by SDN (Software Defined Network), SDWAN (Software-Defined Wide Area Networking), and AWS (Amazon Web Services; “Amazon” is a registered trademark) are provided in the form of Software Defined. In this case, device replacement, package replacement, physical wiring replacement, and physical operation taken are not taken, but only software operation is required, and control necessary for recovery from service abnormality, for example, NW configuration change or setting change Etc. can be realized. For this reason, in order to recover the service from the abnormal state, it is not always necessary for the maintenance person to examine and implement the countermeasure plan. In the present invention, until a recovery from an abnormal state of a service is performed, a countermeasure proposal is derived and applied using a preset candidate for NW setting change, and the service is recovered. The NW setting change may be simply referred to as “setting change” or “network setting change”.

<構成>
図1に示すように、本実施形態のサービス復旧装置1は、ネットワーク装置群Gのネットワーク装置2の各々からフローデータを収集し、収集したフローデータを用いて、サーバ3から端末4へ提供中のサービス(図1中の符号X,Yを付した矢印で表現)を監視する。また、サービス復旧装置1は、監視の結果、サービスの異常が検出された場合は、復旧する。フローデータの収集方法は、NetFlow,sFlowなどといった周知の方法である(例えば、参考文献1:B. Claise, "Cisco Systems NetFlow Services Export Version9," IETF RFC3954, October 2004. http://www.ietf.org/rfc/rfc3954や、参考文献2:P. Phaal, S. Panchen, and N. McKee, "InMon Corporation's sFlow:A Method for Monitoring Traffic in Switched and Routed Networks," IETF RFC3176, September 2001. http://www.ietf.org/rfc/rfc3176、などを参照)。
<Configuration>
As shown in FIG. 1, the service restoration apparatus 1 according to the present embodiment collects flow data from each of the network apparatuses 2 in the network apparatus group G, and provides the collected data to the terminal 4 from the server 3 using the collected flow data. Service (represented by arrows with signs X and Y in FIG. 1). Further, the service recovery device 1 recovers when a service abnormality is detected as a result of monitoring. The flow data collection method is a well-known method such as NetFlow, sFlow, etc. (for example, Reference 1: B. Claise, “Cisco Systems NetFlow Services Export Version 9,” IETF RFC3954, October 2004. http: //www.ietf .org / rfc / rfc3954 and Reference 2: P. Phaal, S. Panchen, and N. McKee, "InMon Corporation's sFlow: A Method for Monitoring Traffic in Switched and Routed Networks," IETF RFC3176, September 2001. http: //www.ietf.org/rfc/rfc3176, etc.)

フローデータは、送信元IPアドレス、宛先IPアドレス(または、送信先IPアドレス)、送信元ポート番号、宛先ポート番号(または、送信先ポート番号)、プロトコルの種類、パケット数、バイト数などの情報を一部または全部含む。フローデータの収集は、所定の時間単位で行われ、収集時刻をフローデータに含めることもできる。なお、フローデータの送信元ポート番号または宛先ポート番号を特定することで、サービス品質を判定したい提供中のサービスを特定することができる。   Flow data includes information such as the source IP address, destination IP address (or destination IP address), source port number, destination port number (or destination port number), protocol type, number of packets, number of bytes, etc. Part or all of Flow data is collected in predetermined time units, and the collection time can be included in the flow data. By specifying the source port number or destination port number of the flow data, it is possible to specify the service being provided for which the service quality is to be determined.

本実施形態のサービス復旧装置1は、例えば、IPFIX(Internet Protocol Flow Information Export)のフローコレクタとして機能し、ネットワーク装置2の各々からフローデータを収集することができる。
ネットワーク装置2は、例えば、ルータ、ブリッジ、リピータ、ゲートウェイである。ネットワーク装置2は、例えば、IPFIXのフローエクスポータとして機能する。なお、ネットワーク装置群Gにおいて、フローエクスポータとして機能しないネットワーク装置2が含まれていてもよい。このようなネットワーク装置2でのトラフィック状態は、フローエクスポータとして機能するネットワーク装置2が提供するフローデータを周知の方法で解析することで間接的に特定することができる。
The service restoration apparatus 1 of the present embodiment functions as, for example, an IPFIX (Internet Protocol Flow Information Export) flow collector and can collect flow data from each of the network apparatuses 2.
The network device 2 is, for example, a router, a bridge, a repeater, or a gateway. The network device 2 functions as, for example, an IPFIX flow exporter. The network device group G may include a network device 2 that does not function as a flow exporter. Such a traffic state in the network device 2 can be indirectly specified by analyzing the flow data provided by the network device 2 functioning as a flow exporter by a known method.

サーバ3は、例えば、DNS(Domain Name System)サーバ3a、Webサーバ3b、DBサーバ3cであり、端末4に所定のサービスを提供する。なお、サーバ3にフローエクスポータの機能を持たせてもよい。
端末4は、ユーザがサービスを利用するために操作する装置である。なお、端末4にフローエクスポータの機能を持たせてもよい。
HMI装置5は、オペレータがサービス復旧装置1を制御するための管理コンソールである。サービス復旧装置1は、ネットワーク装置2から収集したフローデータに基づいて必要に応じて異常通知や復旧通知などをHMI装置5に出力する。
The server 3 is, for example, a DNS (Domain Name System) server 3a, a Web server 3b, and a DB server 3c, and provides a predetermined service to the terminal 4. Note that the server 3 may have a flow exporter function.
The terminal 4 is a device that a user operates to use a service. Note that the terminal 4 may have a flow exporter function.
The HMI device 5 is a management console for the operator to control the service recovery device 1. The service restoration device 1 outputs an abnormality notification, a restoration notification, and the like to the HMI device 5 as necessary based on the flow data collected from the network device 2.

図2に示すように、本実施形態のサービス復旧装置1は、処理部10、入出力部20、および記憶部30を備える。サービス復旧装置1は、処理部10の具体例となるCPUが、記憶部30の具体例となるメモリ上に読み込んだプログラムを実行することにより、各種機能部を動作させる。   As shown in FIG. 2, the service restoration apparatus 1 according to the present embodiment includes a processing unit 10, an input / output unit 20, and a storage unit 30. In the service restoration device 1, the CPU as a specific example of the processing unit 10 causes the various functional units to operate by executing a program read on the memory as a specific example of the storage unit 30.

処理部10は、サービス復旧装置1の処理を司る。処理部10は、トラフィック抽出部11、定常性算出部12、サービス品質判定部13(判定部)、対策案評価部14、対策案導出部15、対策案適用部16、および、結果出力部17、といった機能部を備える。これらの機能部については後記する。
入出力部20は、サービス復旧装置1の入出力インターフェースを構成する。入出力部20は、入力部21および出力部22を備える。入力部21は、HMI装置5からの入力やネットワーク装置2からのフローデータなどの取得を行う。出力部22は、処理部10による処理結果をファイルf等で出力する。
記憶部30は、所定のデータを所定の形式で記憶する。記憶部30は、フローデータ保存部31、定常性データ保存部32、サービス品質低下状況保存部33、設定変更候補リスト34、および、実行済設定変更リスト35といった機能部を備える。これらの機能部については後記する。
The processing unit 10 manages the processing of the service restoration device 1. The processing unit 10 includes a traffic extraction unit 11, a continuity calculation unit 12, a service quality determination unit 13 (determination unit), a countermeasure plan evaluation unit 14, a countermeasure plan derivation unit 15, a countermeasure plan application unit 16, and a result output unit 17. Are provided. These functional units will be described later.
The input / output unit 20 constitutes an input / output interface of the service restoration device 1. The input / output unit 20 includes an input unit 21 and an output unit 22. The input unit 21 acquires input from the HMI device 5 and flow data from the network device 2. The output unit 22 outputs the processing result by the processing unit 10 as a file f or the like.
The storage unit 30 stores predetermined data in a predetermined format. The storage unit 30 includes functional units such as a flow data storage unit 31, a continuity data storage unit 32, a service quality degradation state storage unit 33, a setting change candidate list 34, and an executed setting change list 35. These functional units will be described later.

トラフィック抽出部11は、ネットワーク装置2から収集したフローデータから、提供中の所定のサービスに対する要求トラフィックおよび応答トラフィックを抽出する。   The traffic extraction unit 11 extracts request traffic and response traffic for a predetermined service being provided from the flow data collected from the network device 2.

「要求トラフィック」とは、サービスを利用する端末4からサービスを提供するサーバ3へ向けられた、サービス実現に必要な情報である。要求トラフィックを送信する端末4は、フローデータの送信元IPアドレスから識別できる。要求トラフィックを受信するサーバ3は、フローデータの宛先IPアドレスから識別できる。   The “request traffic” is information necessary for service realization directed from the terminal 4 that uses the service to the server 3 that provides the service. The terminal 4 that transmits the requested traffic can be identified from the source IP address of the flow data. The server 3 that receives the requested traffic can be identified from the destination IP address of the flow data.

「応答トラフィック」とは、サービスを提供するサーバ3からサービスを利用する端末4へ向けられた、サービス実現に必要な情報である。応答トラフィックを送信するサーバ3は、フローデータの送信元IPアドレスから識別できる。応答トラフィックを受信する端末4は、フローデータの宛先IPアドレスから識別できる。   The “response traffic” is information necessary for realizing the service directed from the server 3 that provides the service to the terminal 4 that uses the service. The server 3 that transmits the response traffic can be identified from the source IP address of the flow data. The terminal 4 that receives the response traffic can be identified from the destination IP address of the flow data.

定常性算出部12は、トラフィック抽出部11が抽出した、要求トラフィックおよび応答トラフィックに基づいて、要求トラフィックおよび応答トラフィックとの間の定常性を算出する。サーバ3から端末4へのサービスの提供が正常に行われている場合、要求トラフィックおよび応答トラフィックの間には一定の傾向が発生し、所定の定常状態が形成されると考えられる。定常性算出部12が算出する定常性は、この定常状態を定量的に表現したものである。もし、DoS(Denial of Service attack)攻撃などによりサーバ3がサービスを提供できない場合には、要求トラフィックに対して、応答トラフィックが極端に少なくなり定常性が破綻しているといえる。
なお、定常性算出部12による定常性の算出は、所定の単位時間ごとに行われる。また、定常性の算出方法はさまざまであるが、詳細は、特許文献1に記載されており、説明を省略する。本実施形態では、定常性の算出方法は、特許文献1に記載ものを用いるとするが、これに限定されない。
The stationarity calculation unit 12 calculates stationarity between the request traffic and the response traffic based on the request traffic and the response traffic extracted by the traffic extraction unit 11. When the service is normally provided from the server 3 to the terminal 4, it is considered that a certain tendency occurs between the request traffic and the response traffic, and a predetermined steady state is formed. The stationarity calculated by the stationarity calculation unit 12 is a quantitative expression of this steady state. If the server 3 cannot provide a service due to a DoS (Denial of Service attack) attack or the like, it can be said that the response traffic is extremely small with respect to the request traffic and the continuity is broken.
The continuity calculation by the continuity calculation unit 12 is performed every predetermined unit time. Moreover, although there are various methods for calculating continuity, details are described in Patent Document 1 and description thereof is omitted. In the present embodiment, the calculation method of continuity is assumed to be the one described in Patent Document 1, but is not limited to this.

サービス品質判定部13は、特定期間内での要求トラフィックおよび応答トラフィックの間の関係性が、定常性算出部12が算出した定常性からどれだけ逸脱しているかによって、サービスの品質を判定する。「特定期間」とは、例えば、定常性算出部12が定常性を算出する際に対象とした期間よりも後の期間とすることができる。「要求トラフィックおよび応答トラフィックの間の関係性」は、定常性算出部12が算出した定常性と同じ物理量で表現される。サービス品質判定部13が用いる関係性と、定常性算出部12が算出した定常性との逸脱度合いが大きいほどサービスの品質が低下しているとする。例えば、DoS攻撃などが発生している場合、サービス品質判定部13が用いる関係性が、定常性算出部12が算出した定常性よりも大きく逸脱するため、対象とするサービスの品質は低下していると判定することができる。   The service quality determination unit 13 determines the quality of service according to how much the relationship between request traffic and response traffic within a specific period deviates from the continuity calculated by the continuity calculation unit 12. The “specific period” can be, for example, a period later than the period targeted when the continuity calculation unit 12 calculates the continuity. The “relationship between request traffic and response traffic” is expressed by the same physical quantity as the stationarity calculated by the stationarity calculation unit 12. It is assumed that the quality of service decreases as the degree of deviation between the relationship used by the service quality determination unit 13 and the continuity calculated by the continuity calculation unit 12 increases. For example, when a DoS attack or the like has occurred, the relationship used by the service quality determination unit 13 deviates more than the continuity calculated by the continuity calculation unit 12, so that the quality of the target service decreases. Can be determined.

対策案評価部14は、対策案適用部16が対策案を適用することによって、異常状態であったサービスが正常である(復旧した)と(サービス品質判定部13によって)判定された場合、適用された対策案を評価する。
対策案導出部15は、設定変更候補リスト34を参照して、異常状態のサービスを復旧するための対策案を導出する。
対策案適用部16は、対策案導出部15が導出した対策案を、ネットワーク装置2が配置されるネットワークに適用する。
The measure plan evaluation unit 14 is applied when the measure plan application unit 16 determines that the service in the abnormal state is normal (recovered) (by the service quality determination unit 13) by applying the measure plan. Evaluate the proposed countermeasures.
The countermeasure plan deriving unit 15 refers to the setting change candidate list 34 and derives a countermeasure plan for restoring the service in the abnormal state.
The countermeasure plan application unit 16 applies the countermeasure plan derived by the countermeasure plan deriving unit 15 to the network in which the network device 2 is arranged.

結果出力部17は、サービスの異常からの復旧のために実行した対策案に関する詳細データを出力する。詳細データには、例えば、対象とするサービスを提供しているサーバ3のホスト名、そのサービスを利用する端末4の数、異常を検出した箇所、実行したNWの設定変更の内容など、さまざまなデータが含まれる。HMI装置5は、サービス復旧装置1を制御して、オペレータが所望する詳細データを取得することができる。また、出力部22は、取得した詳細データを処理部10による処理結果としてファイルf等で出力する。   The result output unit 17 outputs detailed data related to the countermeasure plan executed for recovery from the service abnormality. The detailed data includes various information such as the host name of the server 3 that provides the target service, the number of terminals 4 that use the service, the location where the abnormality is detected, and the content of the executed NW setting change. Contains data. The HMI device 5 can acquire the detailed data desired by the operator by controlling the service restoration device 1. Further, the output unit 22 outputs the acquired detailed data as a processing result by the processing unit 10 in a file f or the like.

フローデータ保存部31は、サービス復旧装置1が収集したフローデータを所定の形式で保存する。トラフィック抽出部11は、フローデータ保存部31にアクセスして要求トラフィックおよび応答トラフィックの抽出を行う。
定常性データ保存部32は、定常性算出部12が算出した定常性を所定の形式で保存する。
サービス品質低下状況保存部33は、例えば、サービス品質判定部13によってサービス品質が低下していると判定されたサービスに関する詳細データ(サービス品質低下状況を表現するデータを含む)を所定の形式で保存する。
The flow data storage unit 31 stores the flow data collected by the service restoration device 1 in a predetermined format. The traffic extraction unit 11 accesses the flow data storage unit 31 and extracts request traffic and response traffic.
The stationarity data storage unit 32 stores the stationarity calculated by the stationarity calculation unit 12 in a predetermined format.
For example, the service quality degradation state storage unit 33 stores, in a predetermined format, detailed data (including data representing a service quality degradation state) related to a service for which the service quality determination unit 13 determines that the service quality has deteriorated. To do.

設定変更候補リスト34は、サービスの異常状態を解消するための候補となるNWの設定変更の一覧を保存する。設定変更候補リスト34が保存する設定変更の各々は、対策案導出部15が導出する対策案の構成要素となる。設定変更候補リスト34が保存する設定変更の各々は、例えば、保守者が事前に定義することもできるし、運用時に適宜修正、更新することもできる。   The setting change candidate list 34 stores a list of setting changes of NWs that are candidates for eliminating the abnormal state of the service. Each setting change stored in the setting change candidate list 34 is a constituent element of the countermeasure plan derived by the countermeasure proposal deriving unit 15. Each setting change stored in the setting change candidate list 34 can be defined in advance by, for example, a maintenance person, or can be corrected and updated as appropriate during operation.

図3に示すように、設定変更候補リスト34は、「項番」、「変更内容」、「変更方法」、「制約事項」、「保守者の判断待ちフラグ」、「評価値(優先度)」といった欄を有し、設定変更の種類ごとにエントリが作成されるように構成することができる。
「項番」の欄には、設定変更の各々を識別する番号が登録される。
「変更内容」の欄には、対応する設定変更の説明が登録される。
「変更方法」の欄には、対応する変更内容を実行するためのソフトウェア的オペレーションが登録される。
As shown in FIG. 3, the setting change candidate list 34 includes “item number”, “change contents”, “change method”, “restrictions”, “maintenance decision flag”, “evaluation value (priority)”. And an entry is created for each type of setting change.
In the “item number” column, a number for identifying each setting change is registered.
A description of the corresponding setting change is registered in the “change contents” column.
In the “change method” column, software operations for executing the corresponding change contents are registered.

「制約事項」の欄には、対応する設定変更を実行する際の制約が登録される。
「保守者の判断待ちフラグ」の欄には、対応する設定変更を実行するために保守者の判断を要することを示す値「1:確認要」または保守者の判断を要しないことを示す値「0:確認不要」が登録される。
「評価値(優先度)」の欄には、対応する設定変更に付与された評価値が登録される。登録される評価値は、対策案評価部14が決定する。評価値は、例えば、0〜1の値をとる。
In the “Restrictions” column, restrictions for executing the corresponding setting change are registered.
In the “maintenance personnel determination wait flag” column, a value “1: confirmation required” indicating that the maintenance operator needs to make a corresponding setting change, or a value indicating that the maintenance operator does not need to be determined. “0: Confirmation unnecessary” is registered.
In the “evaluation value (priority)” column, the evaluation value assigned to the corresponding setting change is registered. The measure evaluation unit 14 determines the evaluation value to be registered. The evaluation value takes a value of 0 to 1, for example.

実行済設定変更リスト35は、異常状態のサービスを復旧するために実行したNWの設定変更の一覧を保存する。具体的には、対策案適用部16が適用した対策案を構成する設定変更が実行済設定変更リスト35に保存される。対策案を構成する設定変更は1つでもよいし複数でもよい。   The executed setting change list 35 stores a list of NW setting changes executed to recover a service in an abnormal state. Specifically, the setting changes constituting the countermeasure plan applied by the countermeasure plan application unit 16 are stored in the executed setting change list 35. There may be one or more setting changes constituting the countermeasure plan.

図4に示すように、実行済設定変更リスト35は、「項番」、「日時」、「設定変更内容」といった欄を有し、設定変更内容ごとにエントリが作成されるように構成することができる。
「項番」の欄には、対応する設定変更内容を識別する記号が登録される。
「日時」の欄には、対応する設定変更内容が実行された年月日時分秒(JST:Japan Standard Time)が登録される。
「設定変更内容」の欄には、対策案適用部16が適用した対策案を構成する設定変更の項番(図4の設定変更候補リスト34に示す項番)が登録される。
なお、実行済設定変更リスト35に登録されるエントリは、実行の都度、図4中下部に順次登録されるが、実行される設定変更内容の順番について、図4に示すものは1例であり、これに限らない。
As shown in FIG. 4, the executed setting change list 35 has columns such as “item number”, “date / time”, and “setting change content”, and is configured so that an entry is created for each setting change content. Can do.
In the “item number” column, a symbol for identifying the corresponding setting change content is registered.
In the “date and time” column, the year, month, day, hour, minute and second (JST: Japan Standard Time) in which the corresponding setting change contents are executed are registered.
In the “setting change content” column, the item numbers of the setting changes (item numbers shown in the setting change candidate list 34 in FIG. 4) constituting the countermeasure proposal applied by the countermeasure proposal applying unit 16 are registered.
The entries registered in the executed setting change list 35 are sequentially registered in the lower part of FIG. 4 every time they are executed. However, the order of the setting change contents to be executed is one example shown in FIG. Not limited to this.

対策案導出部15は、対策案を導出する際、設定変更キュー15aを保持することができる。設定変更キュー15aは、設定変更の実行または取り消しに関する情報をまとめたキューである。「設定変更の取り消し」とは、変更がなされた設定を変更前に戻すことをいう。   The countermeasure plan deriving unit 15 can hold the setting change queue 15a when deriving a countermeasure plan. The setting change queue 15a is a queue that collects information related to execution or cancellation of setting changes. “Cancellation of setting change” means to return the changed setting to the state before the change.

図5に示すように、設定変更キュー15aは、項番(設定変更候補リスト34の項番)と、対応する設定変更の扱い(実行、取り消し)の組のデータを1または複数含む。例えば、図5中「項番3:実行」のキューは、項番3の設定変更(Configの切り替え)を指示するキューである。設定変更キュー15aに入力されたデータが古いほど、図6中の下方に位置している。対策案導出部15が設定変更キュー15aを対策案適用部16に送信し、対策案適用部16が設定変更キュー15aを参照することで、該当する設定変更が古いものから順次実行される。
なお、設定変更キュー15aに追加されるキューは、設定変更候補リスト34に合わせて図5中上部に追加されるが、図5に示すものは1例であり、これに限定されない。
As illustrated in FIG. 5, the setting change queue 15 a includes one or a plurality of sets of item numbers (item numbers in the setting change candidate list 34) and corresponding setting change handling (execution and cancellation). For example, the “item number 3: execution” queue in FIG. 5 is a queue for instructing the setting change (configuration switching) of item number 3. The older the data input to the setting change queue 15a, the lower the position in FIG. The countermeasure plan deriving unit 15 transmits the setting change queue 15a to the countermeasure plan applying unit 16, and the countermeasure plan applying unit 16 refers to the setting change queue 15a, so that the corresponding setting changes are sequentially executed from the oldest one.
The queue added to the setting change queue 15a is added to the upper part in FIG. 5 in accordance with the setting change candidate list 34. However, the example shown in FIG. 5 is an example, and the present invention is not limited to this.

<処理>
図6に示すように、本実施形態のサービス復旧装置1は、本実施形態のサービス復旧装置1の処理(全体処理)は以下の通りである。この処理は、ステップS1から開始する。
<Processing>
As shown in FIG. 6, the service recovery device 1 of the present embodiment has the following processing (overall processing) of the service recovery device 1 of the present embodiment. This process starts from step S1.

ステップS1にて、トラフィック抽出部11は、収集したフローデータから、要求トラフィックおよび応答トラフィックを抽出する。ステップS1の後、ステップS2に進む。   In step S1, the traffic extraction unit 11 extracts request traffic and response traffic from the collected flow data. After step S1, the process proceeds to step S2.

ステップS2にて、定常性算出部12は、抽出された、要求トラフィックおよび応答トラフィックの間の定常性を算出する。ステップS2の後、ステップS3に進む。   In step S2, the stationarity calculation unit 12 calculates the stationarity between the extracted request traffic and response traffic. After step S2, the process proceeds to step S3.

ステップS3にて、サービス品質判定部13は、特定期間内での要求トラフィックおよび応答トラフィックとの間の関係性が、定常性算出部12が算出した定常性からどれだけ逸脱しているかによって、サービスの品質を判定する。なお、サービス品質判定部13は、サービス品質判定部13が用いる関係性と、定常性算出部12が算出した定常性との逸脱度合いに関する閾値となる許容誤差を用いてサービスの品質を判定することができる。許容誤差については、特許文献1に記載されており、説明を省略する。ステップS3の後、ステップS4に進む。
に進む。
In step S3, the service quality determination unit 13 determines whether the relationship between the request traffic and the response traffic within the specific period deviates from the continuity calculated by the continuity calculation unit 12. Determine the quality of the. The service quality determination unit 13 determines the quality of the service using an allowable error that is a threshold value regarding the degree of deviation between the relationship used by the service quality determination unit 13 and the continuity calculated by the continuity calculation unit 12. Can do. The allowable error is described in Patent Document 1 and will not be described. After step S3, the process proceeds to step S4.
Proceed to

ステップS4にて、サービスの品質の低下を引き起こす異常があった場合(Yes)、ステップS5に進む。一方、サービスの品質の低下を引き起こす異常が無かった場合(No)、サービスが正常である(サービスが元々正常である、または、異常状態から復旧した)ことを意味し、ステップS6に進む。   In step S4, when there is an abnormality that causes a decrease in service quality (Yes), the process proceeds to step S5. On the other hand, if there is no abnormality that causes a decrease in the quality of the service (No), it means that the service is normal (the service is normally normal or has recovered from the abnormal state), and the process proceeds to step S6.

ステップS5にて、対策案導出部15および対策案適用部16は、対策案実行処理を実行する。対策案実行処理の詳細は、後記する。結果的には、ネットワークに対して、対策案を構成する設定変更が実行される。ステップS5の後、ステップS2に戻る。   In step S5, the countermeasure plan derivation unit 15 and the countermeasure plan application unit 16 execute a countermeasure plan execution process. Details of the countermeasure plan execution process will be described later. As a result, a setting change that constitutes a countermeasure plan is executed for the network. After step S5, the process returns to step S2.

ステップS6にて、対策案評価部14は、サービスの復旧に対して、設定変更候補リスト34に保存されている設定変更を評価する。対策案評価部14は、評価の際、サービス品質低下状況保存部33が保存する詳細データを参照することができる。詳細データの保存、設定変更の評価の詳細については、後記する。結果的には、設定変更候補リスト34に保存されている設定変更の各々の「評価値(優先度)」の欄に登録される値が変更する。ステップS6の後、本処理を終了する。   In step S6, the measure plan evaluation unit 14 evaluates the setting change stored in the setting change candidate list 34 for service restoration. The measure plan evaluation unit 14 can refer to the detailed data stored by the service quality degradation state storage unit 33 during the evaluation. Details of the detailed data storage and setting change evaluation will be described later. As a result, the value registered in the “evaluation value (priority)” column of each setting change stored in the setting change candidate list 34 is changed. After step S6, this process ends.

図6に示す処理によれば、サービスを監視して異常が発見された場合でも自動復旧することができる。   According to the process shown in FIG. 6, even when an abnormality is discovered by monitoring a service, automatic recovery can be performed.

[対策案実行処理の詳細]
図7に示すように、対策案実行処理(図6のステップS5)の詳細は、以下の通りである。この処理は、ステップA1から開始する。
[Details of countermeasure plan execution processing]
As shown in FIG. 7, the details of the countermeasure plan execution process (step S5 in FIG. 6) are as follows. This process starts from step A1.

ステップA1にて、対策案導出部15は、すべての対策案が実行されたか否かの判定となる終了判定を行う。具体的には、全体処理(図6)1回分を通じて実行済設定変更リスト35に登録されたことのあるエントリ(NWの設定変更の組合せからなる対策案。)の数が、設定変更候補リスト34に登録された設定変更を組み合わせて作り出すことができる対策案の数(−1+×2=11)よりも多いか否かを判定する。多い場合、対策案導出部15は、結果出力部17に「適切な対策案の導出が不可能」を示すメッセージをHMI装置5に送信し、保守者に通知し、処理を終了する。当該終了をしない場合は、ステップA2に進む。 In step A1, the countermeasure plan deriving unit 15 performs an end determination that is a determination as to whether or not all the countermeasure plans have been executed. Specifically, the number of entries (measures proposed consisting of combinations of NW setting changes) that have been registered in the executed setting change list 35 throughout the entire process (FIG. 6) is the setting change candidate list 34. It determines greater or not than the number of countermeasures that can be created by combining the configuration changes that have been registered (4 C 1 + 4 C 2 -1+ 3 C 3 × 2 = 11) on. If there are many, the countermeasure plan deriving unit 15 transmits a message indicating that “derivation of an appropriate countermeasure plan is impossible” to the result output unit 17, notifies the maintenance person, and ends the process. If not, the process proceeds to step A2.

ステップA2にて、対策案導出部15は、許容誤差より大きくサービス品質が変動しているネットワーク装置2についての詳細データを、品質低下が発生している箇所の情報として収集し、サービス品質低下状況保存部33に保存する。ステップA2の後、ステップA3に進む。   In step A2, the countermeasure plan deriving unit 15 collects detailed data about the network device 2 whose service quality is fluctuating more than an allowable error as information on the location where the quality degradation has occurred, and the service quality degradation status Save in the storage unit 33. After step A2, the process proceeds to step A3.

ステップA3にて、対策案導出部15は、設定変更のリセット処理を行う。具体的には、実行済設定変更リスト35に登録されたエントリに該当する設定変更の取り消し動作(「項番X:取り消し」で示すキュー(図5参照))を設定変更キュー15aに追加する。ステップA3の処理により、別の対策案を実行する際、以前実行した設定変更の影響を除くことができる。ステップA3の後、ステップA4に進む。   In step A3, the countermeasure plan deriving unit 15 performs a setting change reset process. Specifically, a setting change cancel operation corresponding to the entry registered in the executed setting change list 35 (a queue indicated by “item number X: cancel” (see FIG. 5)) is added to the setting change queue 15a. With the process of step A3, when another countermeasure plan is executed, the influence of the previously executed setting change can be eliminated. After step A3, the process proceeds to step A4.

ステップA4にて、対策案導出部15は、設定変更候補リスト34からN個の設定変更を取得する。Nは自然数であり、初期値は1である。図3に従えば、設定変更のエントリは4つあるので、Nは1〜4の値をとる。   In step A <b> 4, the countermeasure plan deriving unit 15 acquires N setting changes from the setting change candidate list 34. N is a natural number, and the initial value is 1. According to FIG. 3, since there are four setting change entries, N takes a value of 1-4.

例えば、対策案導出部15は、N=1として、設定変更候補リスト34(図3)からN個の設定変更(組合せ)を取得する。本実施形態では、1つの設定変更の取得順として、例えば、「評価値(優先度)」(図3)が高いものを優先的に取得するというポリシを設定することもできるが、これに限定されない。各Nについて、すべての設定変更を取得した後、まだ、異常から復旧できる対策案が無かった場合には、N=N+1としてステップA4の処理を再度行う。Nが2以上の場合、取得される設定変更の組合せの評価値は、該当する各設定変更の「評価値(優先度)」(図3)の合計値とすることができるが、これに限らない。
ステップA4の後、ステップA5に進む。
For example, the measure proposal deriving unit 15 obtains N setting changes (combinations) from the setting change candidate list 34 (FIG. 3), assuming that N = 1. In the present embodiment, as a setting change acquisition order, for example, a policy of preferentially acquiring the “evaluation value (priority)” (FIG. 3) can be set, but the present invention is not limited to this. Not. After acquiring all the setting changes for each N, if there is still no countermeasure that can be recovered from the abnormality, the process of step A4 is performed again with N = N + 1. When N is 2 or more, the evaluation value of the acquired combination of setting changes can be the total value of the “evaluation values (priority)” (FIG. 3) of the corresponding setting changes, but is not limited thereto. Absent.
After step A4, the process proceeds to step A5.

ステップA5にて、対策案導出部15は、取得したN個の設定変更(組合せ)が、全体処理(図6)1回分を通じて実行済設定変更リスト35に登録されたことがあるか否かを判定する。この判定は、実行済設定変更リスト35の登録の履歴を辿るという周知の技術で判定することができる。登録されたことがある場合(ステップA5/Yes)、該当のN個の設定変更はすでに実行済である。よって、重複実行を避けるため、ステップA4に戻り、対策案導出部15は、新たなN個の設定変更を取得する。一方、登録されたこと無い場合(ステップA5/No)、対策案導出部15は、未実行の設定変更として判定し、ステップA6に進む。   In step A5, the measure proposal deriving unit 15 determines whether or not the acquired N setting changes (combinations) have been registered in the executed setting change list 35 throughout the entire process (FIG. 6). judge. This determination can be made by a known technique of tracing the registration history of the executed setting change list 35. If it has been registered (step A5 / Yes), the corresponding N setting changes have already been executed. Therefore, in order to avoid duplicate execution, the process returns to step A4, and the countermeasure plan deriving unit 15 acquires new N setting changes. On the other hand, when it has not been registered (step A5 / No), the countermeasure plan deriving unit 15 determines that the setting change has not been executed, and proceeds to step A6.

ステップA6にて、対策案導出部15は、該当の設定変更の実行動作を設定変更キュー15aに追加する。具体的には、対策案導出部15は、設定変更キュー15aに、ステップA5で未実行と判定された設定変更を実行させるキュー(例:「項目○,○:実行」(図5参照))を追加する。ステップA6の後、ステップA7に進む。   In step A6, the countermeasure plan deriving unit 15 adds the corresponding setting change execution operation to the setting change queue 15a. Specifically, the countermeasure plan deriving unit 15 causes the setting change queue 15a to execute the setting change determined to be unexecuted in step A5 (example: “item ○, ○: execution” (see FIG. 5)). Add After step A6, the process proceeds to step A7.

ステップA7にて、対策案導出部15は、保守者の実施可否確認処理を実行する。具体的には、対策案導出部15は、対象のN個の設定変更について、設定変更候補リスト34の「保守者の判断待ちフラグ」の値が「1:確認要」である設定変更が含まれている場合、保守者からの指示があるまで、対象のN個の設定変更の実行を保留する。保守者からの指示は、例えば、HMI装置5からの入力によって実現することができる。保守者からの指示があった後、ステップA8に進む。   In step A7, the measure plan deriving unit 15 executes a maintenance person's implementation propriety confirmation process. Specifically, the countermeasure plan deriving unit 15 includes setting changes in which the value of the “maintenance personnel determination waiting flag” in the setting change candidate list 34 is “1: confirmation required” for the target N setting changes. If it is, the execution of N target setting changes is suspended until an instruction from the maintenance person is given. The instruction from the maintenance person can be realized by input from the HMI device 5, for example. After an instruction from the maintenance person, the process proceeds to step A8.

ステップA8にて、対策案導出部15は、設定変更キュー15aを対策案適用部16に送信する。ステップA8の後、ステップA9に進む。   In step A8, the measure plan deriving unit 15 transmits the setting change queue 15a to the measure plan applying unit 16. After step A8, the process proceeds to step A9.

ステップA9にて、対策案適用部16は、対策案導出部15から受信した設定変更キュー15aを参照して、該当する設定変更を実行する。ステップA9の後、ステップA10に進む。   In step A9, the measure plan applying unit 16 refers to the setting change queue 15a received from the measure plan deriving unit 15 and executes the corresponding setting change. After step A9, the process proceeds to step A10.

ステップA10にて、対策案適用部16は、実行した設定変更を実行済設定変更リスト35(図4)に登録する。具体的には、実行した変更内容について、「項番」、「日時」、「設定変更内容」を登録する。
ステップA10の後、本処理を終了し、ステップS2(図6)に戻る。
In step A10, the measure proposal applying unit 16 registers the executed setting change in the executed setting change list 35 (FIG. 4). Specifically, “item number”, “date / time”, and “setting change content” are registered for the executed change content.
After step A10, this process ends, and the process returns to step S2 (FIG. 6).

図7に示す処理によれば、サービスの異常からの復旧するための対策案を一通り試行することができる。   According to the processing shown in FIG. 7, it is possible to try all possible countermeasures for recovering from a service abnormality.

<設定変更の評価の詳細>
ステップS6にて、対策案評価部14が設定変更候補リスト34に保存されている設定変更を評価する際、例えば、サービスの復旧に寄与した設定変更内容については、評価値を増加させることができる。また、例えば、サービスの復旧に寄与しなかった設定変更内容については、評価値を減少させることができる。また、評価値は、サービスの異常検出箇所に応じて増減させることができる。
<Details of setting change evaluation>
In step S6, when the measure plan evaluation unit 14 evaluates the setting change stored in the setting change candidate list 34, for example, for the setting change content that contributes to the restoration of the service, the evaluation value can be increased. . Further, for example, the evaluation value can be reduced for the setting change contents that have not contributed to the restoration of the service. Also, the evaluation value can be increased or decreased according to the abnormality detection location of the service.

[評価方法1:固定値の増減]
例えば、以下の規則に従って、評価値を増減する。
規則1:対策案を構成するN個の設定変更の組合せがサービスの復旧に寄与しなかった場合、0.1/Nを、各設定変更の設定値から引く。ただし、評価値が0を下回る場合は、0とする。
規則2:対策案を構成するN個の設定変更の組合せがサービスの復旧に寄与した場合、0.3/Nを、各設定変更の設定値に加える。ただし、評価値が1を上回る場合は、1とする。
[Evaluation method 1: Increase / decrease fixed value]
For example, the evaluation value is increased or decreased according to the following rules.
Rule 1: If the combination of N setting changes constituting the countermeasure proposal does not contribute to the restoration of the service, 0.1 / N 2 is subtracted from the setting value of each setting change. However, when the evaluation value is less than 0, it is set to 0.
Rule 2: When a combination of N setting changes constituting the countermeasure proposal contributes to the restoration of the service, 0.3 / N is added to the setting value of each setting change. However, when the evaluation value exceeds 1, it is 1.

図3に示す設定変更候補リスト34にしたがって、サービスの復旧までに試行した対策案の試行結果の例と、対応する評価値の増減は、以下の通りであったとする。

項番1のみの対策案試行で復旧せず → -0.1/12 = -0.1
項番3のみの対策案試行で復旧せず → -0.1/12 = -0.1
項番4のみの対策案試行で復旧せず → -0.1/12 = -0.1
項番2のみの対策案試行で復旧せず → -0.1/12 = -0.1
項番1、3からなる対策案試行で復旧せず → -0.1/22 = -0.025
項番1、4からなる対策案試行で復旧せず → -0.1/22 = -0.025
項番3、4からなる対策案試行で復旧 → +0.3/2 = +0.15
It is assumed that the example of the trial result of the countermeasure plan tried before the service restoration and the increase / decrease of the corresponding evaluation value according to the setting change candidate list 34 shown in FIG. 3 are as follows.

No recovery after trial of countermeasure for item 1 only → -0.1 / 1 2 = -0.1
No recovery by trial of measure 3 only → -0.1 / 1 2 = -0.1
No recovery by trial of countermeasures for item 4 only → -0.1 / 1 2 = -0.1
No recovery by trial of countermeasures for item 2 only → -0.1 / 1 2 = -0.1
No recovery by trial of countermeasures consisting of item numbers 1 and 3 → -0.1 / 2 2 = -0.025
No recovery by trial of countermeasures consisting of items 1 and 4 → -0.1 / 2 2 = -0.025
Recovered by trial of measures consisting of item numbers 3 and 4 → + 0.3 / 2 = +0.15

このとき、各設定変更(項番1〜4)の評価値の増減値は以下の通りになる。

項番1の設定変更の増減値:-0.1 -0.025 -0.025 = -0.15
項番2の設定変更の増減値:-0.1
項番3の設定変更の増減値:-0.1 -0.025 +0.15 = +0.025
項番4の設定変更の増減値:-0.1 -0.025 +0.15 = +0.025
At this time, the increase / decrease value of the evaluation value of each setting change (item numbers 1 to 4) is as follows.

Increase / decrease value of setting change of No.1: -0.1 -0.025 -0.025 = -0.15
Increase / decrease value of setting change of No. 2: -0.1
Increase / decrease value of setting change of No.3: -0.1 -0.025 +0.15 = +0.025
Increase / decrease value of setting change of No.4: -0.1 -0.025 +0.15 = +0.025

[評価方法2:発生した異常個所に対応する増減]
サービスの異常が発生した箇所の情報に応じて、評価値の増減値を変動させることができる。例えば、異常が発生したネットワーク装置2に収容されているエンドユーザ数に応じて、最終的な評価値の増減値に係数を乗ずることができる。
[Evaluation method 2: Increase / decrease corresponding to the abnormal location that occurred]
The increase / decrease value of the evaluation value can be changed according to the information of the location where the service abnormality has occurred. For example, the final increase / decrease value of the evaluation value can be multiplied by a coefficient according to the number of end users accommodated in the network device 2 in which an abnormality has occurred.

異常検出箇所の収容ユーザ数をM、サービス全体のユーザ数をM_maxとしたとする。
対策案を構成するN個の設定変更の組合せがサービスの復旧に寄与しなかった場合、(0.1/N)×(M/M_max)を、各設定変更の設定値から引く。ただし、評価値が0を下回る場合は、0とする。
一方、対策案を構成するN個の設定変更の組合せがサービスの復旧に寄与した場合、(0.3/N)×(M/M_max)を、各設定変更の設定値に加える。ただし、評価値が1を上回る場合は、1とする。
Assume that the number of accommodated users at the abnormality detection location is M, and the number of users of the entire service is M_max.
When the combination of N setting changes constituting the countermeasure proposal does not contribute to the restoration of the service, (0.1 / N 2 ) × (M / M_max) is subtracted from the setting value of each setting change. However, when the evaluation value is less than 0, it is set to 0.
On the other hand, when a combination of N setting changes constituting the countermeasure proposal contributes to the restoration of the service, (0.3 / N) × (M / M_max) is added to the setting value of each setting change. However, when the evaluation value exceeds 1, it is 1.

上記のように、対策案評価部14が各設定変更について、評価値を更新することで、サービスの異常からの復旧に寄与する設定変更の寄与率を定量的に決定することができる。   As described above, the countermeasure plan evaluation unit 14 can quantitatively determine the contribution rate of the setting change that contributes to the recovery from the service abnormality by updating the evaluation value for each setting change.

<まとめ>
本実施形態によれば、発生したサービスの異常に対して、予め用意したネットワーク設定変更を種々組み合わせた対策案をネットワークに順次適用することができる。
したがって、ネットワーク上で提供されているサービスの自動復旧を実現することができる。
<Summary>
According to the present embodiment, it is possible to sequentially apply measures proposed by various combinations of prepared network setting changes to a network in response to a service abnormality that has occurred.
Therefore, automatic restoration of services provided on the network can be realized.

また、ネットワーク設定変更の各々に評価値を設定することで、サービスの異常からの復旧に寄与するネットワーク設定変更の寄与率を定量的に決定することができる。   In addition, by setting an evaluation value for each network setting change, it is possible to quantitatively determine the contribution rate of the network setting change that contributes to recovery from service abnormality.

≪その他≫
(1):設定変更候補リスト34(図3)に登録される設定変更について、同じ設定変更であっても、サービスの異常発生個所に応じて別々のエントリを作成してもよい。具体的には、設定変更候補リスト34について、「項番」、「変更内容」、「変更方法」、「制約事項」、「保守者の判断待ちフラグ」、「評価値(優先度)」といった欄の他に、「サービスの異常検出箇所」の欄を用意してもよい。これにより、サービスの異常検出箇所ごとに評価値を設定することができ、サービスの異常からの復旧に寄与する設定変更の寄与率をより定量的に決定することができる。
≪Others≫
(1): With respect to the setting changes registered in the setting change candidate list 34 (FIG. 3), even if the setting changes are the same, different entries may be created according to the location where the service abnormality occurs. Specifically, for the setting change candidate list 34, “item number”, “change contents”, “change method”, “restrictions”, “maintenance decision flag”, “evaluation value (priority)”, etc. In addition to the column, a “service abnormality detection location” column may be prepared. Thereby, an evaluation value can be set for each abnormality detection location of the service, and the contribution rate of the setting change that contributes to recovery from the abnormality of the service can be determined more quantitatively.

また、本実施形態で説明した種々の技術を適宜組み合わせた技術を実現することもできる。
また、本実施形態で説明したソフトウェアをハードウェアとして実現することもでき、ハードウェアをソフトウェアとして実現することもできる。
その他、ハードウェア、ソフトウェア、フローチャートなどについて、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
In addition, it is possible to realize a technique in which various techniques described in this embodiment are appropriately combined.
Further, the software described in the present embodiment can be realized as hardware, and the hardware can also be realized as software.
In addition, hardware, software, flowcharts, and the like can be changed as appropriate without departing from the spirit of the present invention.

1 サービス復旧装置
2 ネットワーク装置
3 サーバ
4 端末
5 HMI装置
10 処理部
11 トラフィック抽出部
12 定常性算出部
13 サービス品質判定部(判定部)
14 対策案評価部
15 対策案導出部
15a 設定変更キュー
16 対策案適用部
17 結果出力部
20 入出力部
21 入力部
22 出力部
30 記憶部
31 フローデータ保存部
32 定常性データ保存部
33 サービス品質低下状況保存部
34 設定変更候補リスト
35 実行済設定変更リスト
DESCRIPTION OF SYMBOLS 1 Service restoration apparatus 2 Network apparatus 3 Server 4 Terminal 5 HMI apparatus 10 Processing part 11 Traffic extraction part 12 Stationarity calculation part 13 Service quality determination part (determination part)
DESCRIPTION OF SYMBOLS 14 Countermeasure plan evaluation part 15 Countermeasure plan derivation | leading-out part 15a Setting change queue 16 Countermeasure plan application part 17 Result output part 20 Input / output part 21 Input part 22 Output part 30 Storage part 31 Flow data storage part 32 Stationary data storage part 33 Service quality Decrease status storage unit 34 Setting change candidate list 35 Executed setting change list

Claims (4)

複数のネットワーク装置から収集したフローデータを用いてサービスを監視し、前記サービスの異常があれば復旧するサービス復旧装置であって、
前記サービスを復旧させるためのネットワーク設定変更を記憶する記憶部と、
前記収集したフローデータから得られる定常性からの逸脱度合いを求めることによって、前記サービスの異常を判定する判定部と、
前記記憶部から、前記サービスの復旧に寄与するネットワーク設定変更を1または複数組み合わせた対策案を導出する対策案導出部と、
前記対策案導出部が導出した対策案を、前記ネットワーク装置が配置されるネットワークに適用する対策案適用部と、を備える、
ことを特徴とするサービス復旧装置。
A service recovery device that monitors services using flow data collected from a plurality of network devices and recovers if there is an abnormality in the service,
A storage unit for storing a network setting change for restoring the service;
A determination unit that determines abnormality of the service by obtaining a deviation degree from the continuity obtained from the collected flow data;
A countermeasure plan derivation unit for deriving a countermeasure plan that combines one or more network setting changes that contribute to the restoration of the service from the storage unit;
A countermeasure proposal application section that applies the countermeasure proposal derived by the countermeasure proposal derivation section to a network in which the network device is arranged,
A service recovery device characterized by that.
前記対策案が適用され、前記サービスが復旧した場合に、前記記憶部に記憶されているネットワーク設定変更の評価値を、前記サービスの復旧の寄与に応じて増減させる対策案評価部を備える、
ことを特徴とする請求項1に記載のサービス復旧装置。
When the countermeasure proposal is applied and the service is restored, the countermeasure proposal evaluation section that increases or decreases the evaluation value of the network setting change stored in the storage section according to the contribution of restoration of the service,
The service restoration apparatus according to claim 1.
複数のネットワーク装置から収集したフローデータを用いてサービスを監視し、前記サービスの異常があれば復旧するサービス復旧装置におけるサービス復旧方法であって、
前記サービス復旧装置の記憶部が、前記サービスを復旧させるためのネットワーク設定変更を記憶しており、
前記サービス復旧装置は、
前記収集したフローデータから得られる定常性からの逸脱度合いを求めることによって、前記サービスの異常を判定する判定ステップと、
前記記憶部から、前記サービスの復旧に寄与するネットワーク設定変更を1または複数組み合わせた対策案を導出する対策案導出ステップと、
前記対策案導出ステップで導出した対策案を、前記ネットワーク装置が配置されるネットワークに適用する対策案適用ステップと、を実行する、
ことを特徴とするサービス復旧方法。
A service recovery method in a service recovery device that monitors services using flow data collected from a plurality of network devices and recovers if there is an abnormality in the service,
The storage unit of the service restoration device stores a network setting change for restoring the service,
The service restoration device
A determination step of determining an abnormality of the service by obtaining a degree of deviation from continuity obtained from the collected flow data;
A countermeasure plan derivation step for deriving a countermeasure plan combining one or a plurality of network setting changes that contribute to the restoration of the service from the storage unit;
Executing a countermeasure proposal application step of applying the countermeasure proposal derived in the countermeasure proposal derivation step to a network in which the network device is arranged;
A service recovery method characterized by the above.
前記サービス復旧装置は、
前記対策案が適用され、前記サービスが復旧した場合に、前記記憶部に記憶されているネットワーク設定変更の評価値を、前記サービスの復旧の寄与に応じて増減させる対策案評価ステップ、を実行する、
ことを特徴とする請求項3に記載のサービス復旧方法。
The service restoration device
When the countermeasure plan is applied and the service is restored, a countermeasure plan evaluation step is executed to increase or decrease the evaluation value of the network setting change stored in the storage unit according to the contribution of restoration of the service. ,
The service restoration method according to claim 3.
JP2017025907A 2017-02-15 2017-02-15 Service recovery device and service recovery method Active JP6718398B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017025907A JP6718398B2 (en) 2017-02-15 2017-02-15 Service recovery device and service recovery method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017025907A JP6718398B2 (en) 2017-02-15 2017-02-15 Service recovery device and service recovery method

Publications (2)

Publication Number Publication Date
JP2018133688A true JP2018133688A (en) 2018-08-23
JP6718398B2 JP6718398B2 (en) 2020-07-08

Family

ID=63248673

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017025907A Active JP6718398B2 (en) 2017-02-15 2017-02-15 Service recovery device and service recovery method

Country Status (1)

Country Link
JP (1) JP6718398B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020092332A (en) * 2018-12-05 2020-06-11 アラクサラネットワークス株式会社 Network abnormality detection device, network abnormality detection system, and network abnormality detection method

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293451A (en) * 1999-04-06 2000-10-20 Mitsubishi Electric Corp Distributed data distribution control system and distribution monitoring method
JP2001045009A (en) * 1999-07-27 2001-02-16 Nec Commun Syst Ltd Atm communication network system
JP2001186178A (en) * 1999-12-22 2001-07-06 Nec Corp Method and system for saving transmission line fault, storage medium and router
JP2006197204A (en) * 2005-01-13 2006-07-27 Nec Corp Maintenance method and system for communication equipment
JP2008508760A (en) * 2004-07-30 2008-03-21 アルカテル・ルーセント Communication network management system for automatic fault repair
JP2016144153A (en) * 2015-02-04 2016-08-08 日本電信電話株式会社 Service monitoring device and service monitoring method
JP2016146580A (en) * 2015-02-09 2016-08-12 日本電信電話株式会社 Communication monitoring system, communication monitoring method, and program

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000293451A (en) * 1999-04-06 2000-10-20 Mitsubishi Electric Corp Distributed data distribution control system and distribution monitoring method
JP2001045009A (en) * 1999-07-27 2001-02-16 Nec Commun Syst Ltd Atm communication network system
JP2001186178A (en) * 1999-12-22 2001-07-06 Nec Corp Method and system for saving transmission line fault, storage medium and router
JP2008508760A (en) * 2004-07-30 2008-03-21 アルカテル・ルーセント Communication network management system for automatic fault repair
JP2006197204A (en) * 2005-01-13 2006-07-27 Nec Corp Maintenance method and system for communication equipment
JP2016144153A (en) * 2015-02-04 2016-08-08 日本電信電話株式会社 Service monitoring device and service monitoring method
JP2016146580A (en) * 2015-02-09 2016-08-12 日本電信電話株式会社 Communication monitoring system, communication monitoring method, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020092332A (en) * 2018-12-05 2020-06-11 アラクサラネットワークス株式会社 Network abnormality detection device, network abnormality detection system, and network abnormality detection method
JP7079721B2 (en) 2018-12-05 2022-06-02 アラクサラネットワークス株式会社 Network anomaly detection device, network anomaly detection system and network anomaly detection method

Also Published As

Publication number Publication date
JP6718398B2 (en) 2020-07-08

Similar Documents

Publication Publication Date Title
US9372995B2 (en) Vulnerability countermeasure device and vulnerability countermeasure method
JP6816139B2 (en) Methods, systems, and devices for generating information transmission performance alerts
US7801985B1 (en) Data transfer for network interaction fraudulence detection
JP5418250B2 (en) Abnormality detection apparatus, program, and abnormality detection method
EP1742416B1 (en) Method, computer readable medium and system for analyzing and management of application traffic on networks
US10193908B2 (en) Data transfer for network interaction fraudulence detection
JP7096342B2 (en) Traffic failure detection on the Internet
CN108989368B (en) Link quality control method and monitoring equipment
CN108600051B (en) BGP Anycast cluster service quality detection method and detection equipment
JP6220625B2 (en) Delay monitoring system and delay monitoring method
JP2015535669A (en) Monitoring encrypted sessions
JP2018006792A (en) Control device, test method, test program and communication system
JP6718398B2 (en) Service recovery device and service recovery method
CN107426012B (en) Fault recovery method and device based on super-fusion architecture
JP2016146581A (en) Device and method for collecting traffic information
JP5684748B2 (en) Network quality monitoring apparatus and network quality monitoring method
JP6476853B2 (en) Network monitoring system and method
JP2012169756A (en) Encrypted communication inspection system
JP2016100799A (en) Monitoring system and monitoring method
JP6629174B2 (en) Communication monitoring device, communication monitoring method, and communication monitoring program
JP6179981B2 (en) Information processing system, information processing apparatus, information processing method, and program
CN103457773A (en) Method and device for terminal customer experience management
JP4190508B2 (en) Network control system and network control method
JP4586183B2 (en) BAND MANAGEMENT METHOD, BAND MANAGEMENT DEVICE, AND PROGRAM FOR THE SAME IN COMMUNICATION NETWORK
JP5752021B2 (en) Attack countermeasure device, attack countermeasure method, and attack countermeasure program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200612

R150 Certificate of patent or registration of utility model

Ref document number: 6718398

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150