JP2012186667A - Network fault detection apparatus, network fault detection method of network fault detection apparatus, and network fault detection program - Google Patents

Network fault detection apparatus, network fault detection method of network fault detection apparatus, and network fault detection program Download PDF

Info

Publication number
JP2012186667A
JP2012186667A JP2011048517A JP2011048517A JP2012186667A JP 2012186667 A JP2012186667 A JP 2012186667A JP 2011048517 A JP2011048517 A JP 2011048517A JP 2011048517 A JP2011048517 A JP 2011048517A JP 2012186667 A JP2012186667 A JP 2012186667A
Authority
JP
Japan
Prior art keywords
evaluation value
time
terminal device
network
measurement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011048517A
Other languages
Japanese (ja)
Inventor
Tomoya Fujino
友也 藤野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2011048517A priority Critical patent/JP2012186667A/en
Publication of JP2012186667A publication Critical patent/JP2012186667A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

PROBLEM TO BE SOLVED: To detect a fault that is caused by a network based on communication information and terminal operation information under such condition as routing information is not known.SOLUTION: A response time fluctuation quantitative evaluation part 110 generates a quantitative evaluation value data 193 of PING response time. An operation load weight function calculation part 120 generates a weighting evaluation value data 195 of the PING response time based on a terminal operation value data 192 of each terminal device. A weight consideration fluctuation characteristic classification part 130 generates a terminal device classification data 196 by classifying terminal devices for each group based on the weighting evaluation value data 195 of the respective terminal devices. A network fluctuation extraction part 140 calculates a network fluctuation evaluation value data 197n based on the terminal device classification data 196 and the weighting evaluation value data 195. A network fault evaluation part 150 generates a network fault evaluation result data 181 based on the network fluctuation evaluation value data 197n and past fault content data 199. A fault notification part 160 outputs the network fault evaluation result data 181.

Description

本発明は、例えば、ネットワーク障害を検出するネットワーク障害検出装置、ネットワーク障害検出装置のネットワーク障害検出方法およびネットワーク障害検出プログラムに関するものである。   The present invention relates to, for example, a network failure detection device that detects a network failure, a network failure detection method of the network failure detection device, and a network failure detection program.

様々な業務形態を含み、様々な通信インフラ形態が混在するネットワークを管理する事業者において、提供するサービス品質を維持するためには、異常のプロアクティブな検知による迅速な対処が必要である。
検知後は、その異常の発生源が網内か端末側かによって、対処の初動が分かれる。
特に網内を原因とする障害では、障害が発生した現地に出動し、現地に問題が無い場合にネットワーク側へ問い合わせるという無駄が発生する。このため、障害回復までの時間の遅延と、余分な現地出動が発生するという損失が発生する。
In order to maintain the quality of service provided in a business operator who manages a network including various business forms and various communication infrastructure forms, it is necessary to take prompt measures by proactive detection of abnormalities.
After detection, the initial action depends on whether the source of the abnormality is in the network or the terminal.
In particular, in the case of a failure caused by the inside of the network, there is a waste of being dispatched to the site where the failure has occurred and making an inquiry to the network side when there is no problem on the site. For this reason, the loss of time delay until failure recovery and extra field dispatch occurs.

ネットワークの構成内容を把握している一部の企業では、ネットワークにおけるトラフィックの通過経路情報を元として品質劣化の原因箇所の特定を行う品質劣化箇所推定技術が研究されている。   In some companies that know the contents of the network configuration, quality degradation location estimation technology that identifies the location of the cause of quality degradation based on traffic route information in the network is being researched.

特許文献1では、各端末へのアクセスの可否のみから判定を行い、ネットワーク障害のうちダウン状態の異常のみを検知する手法が開示されている。
特許文献2では、個々の端末への応答時間から通信品質を評価する方式が開示されている。
特許文献3では、個々の端末の稼働情報から個々の端末間の相関係数を求め、過去の観測値からの劣化傾向を評価する方式が開示されている。
Japanese Patent Application Laid-Open No. 2004-133867 discloses a method of determining only from whether or not each terminal can be accessed and detecting only an abnormality in a down state among network failures.
Patent Document 2 discloses a method for evaluating communication quality from response times to individual terminals.
Patent Document 3 discloses a method of obtaining a correlation coefficient between individual terminals from operation information of individual terminals and evaluating a deterioration tendency from past observation values.

特開2009−171009号公報JP 2009-171009 A 特開2007−310762号公報JP 2007-310762 A 特開2006−146668号公報JP 2006-146668 A

従来手法にて品質劣化箇所の推定を行うためには、ネットワークのルーティング情報が必要である。しかし、通信インフラを契約して利用している通信事業者にとってはキャリアが管理するサブネットワークのルーティング情報や構成等は未知であり、詳細なルーティング情報は得られない。
そのため、通信事業者が観測可能な通信情報や端末稼働情報から、未知のサブネットワークを含めたネットワーク全体の状態を推定し、網内の異常と端末の異常との切り分けを行い、網内に起因する障害を検出する必要がある。
In order to estimate the quality degradation location by the conventional method, network routing information is required. However, the telecommunications carrier contracting and using the communication infrastructure does not know the routing information and configuration of the sub-network managed by the carrier, and detailed routing information cannot be obtained.
Therefore, the state of the entire network, including unknown sub-networks, is estimated from communication information and terminal operation information that can be observed by the telecommunications carrier. Need to detect failure.

本発明は、例えば、ルーティング情報が未知の状態にて、通信情報と端末稼働情報とから網内に起因する障害を検出できるようにすることを目的とする。   An object of the present invention is to make it possible to detect a failure caused in a network from communication information and terminal operation information in a state where routing information is unknown, for example.

本発明のネットワーク障害検出装置は、
応答データを要求する応答要求データをネットワークに接続する複数の端末装置へ送信して前記応答要求データを送信してから前記応答データを受信するまでの時間として異なる計測時刻に計測された複数の応答時間と前記複数の応答時間を計測した複数の計測時刻とを対応付けて端末装置毎に記憶する応答時間記憶部と、
各端末装置で異なる測定時刻に測定された複数のリソース使用量と前記複数のリソース使用量を測定した複数の測定時刻とを対応付けて端末装置毎に記憶するリソース使用量記憶部と、
前記応答時間記憶部から複数の応答時間を端末装置毎に取得し、取得した複数の応答時間に基づいて各応答時間の計測時刻毎に当該応答時間の長さに応じた値を計測時刻の応答時間評価値として算出する応答時間評価値算出部と、
前記応答時間評価値算出部によって算出された各計測時刻の応答時間評価値を端末装置毎に記憶する応答時間評価値記憶部と、
前記応答時間評価値記憶部から各計測時刻の応答時間評価値を端末装置毎に取得し、前記リソース使用量記憶部から各測定時刻のリソース使用量を端末装置毎に取得し、取得した各計測時刻の応答時間評価値と各測定時刻のリソース使用量とに基づいて計測時刻毎に応答時間評価値が大きいほど大きく計測時刻に対応する測定時刻のリソース使用量が多いほど小さい値を計測時刻の重み付け評価値として算出する重み付け評価値算出部と、
前記重み付け評価値算出部によって算出された各計測時刻の重み付け評価値を端末装置毎に記憶する重み付け評価値記憶部と、
前記重み付け評価値記憶部に記憶された各端末装置の重み付け評価値に基づいて、前記複数の端末装置を1つ以上の端末装置から成る複数の端末装置グループに分類する端末装置分類部と、
前記端末装置分類部による分類結果に基づいて端末装置グループ毎に端末装置グループに属する各端末装置の重み付け評価値を前記重み付け評価値記憶部から取得し、取得した各端末装置の重み付け評価値に基づいて端末装置グループの重み付け評価値の分布を計測時刻毎に算出し、算出した重み付け評価値の分布に基づいて分布内の重み付け評価値を端末装置グループのネットワーク評価値として計測時刻毎に選択するネットワーク評価値選択部と、
過去の計測時刻を示す複数の過去時刻と各過去時刻のネットワーク評価値とを対応付けて端末装置グループ毎に記憶するネットワーク評価値記憶部と、
前記ネットワークに発生した障害を示す障害内容と前記障害が発生した時刻を示す障害時刻とを対応付けたネットワーク障害データを記憶するネットワーク障害データ記憶部と、
前記ネットワーク評価値選択部によって端末装置グループ毎に選択された各計測時刻のネットワーク評価値と前記ネットワーク評価値記憶部に端末装置グループ毎に記憶された各過去時刻のネットワーク評価値とに基づいて各計測時刻のネットワーク評価値とネットワーク評価値の相関度が高い過去の時間帯を相関時間帯として端末装置グループ毎に判定する相関時間帯判定部と、
前記ネットワーク障害データ記憶部に記憶されたネットワーク障害データと前記相関時間帯判定部によって端末装置グループ毎に判定された相関時間帯とに基づいて端末装置グループ毎に相関時間帯に対応する障害時刻を前記ネットワーク障害データから検索し、当該障害時刻に対応する障害内容を前記ネットワーク障害データから取得し、取得した障害内容と当該端末装置グループを表すグループ情報とを対応付けて出力する検出結果出力部とを備える。
The network failure detection apparatus of the present invention
A plurality of responses measured at different measurement times as a time from when the response request data is transmitted to the plurality of terminal devices connected to the network and the response request data is transmitted until the response data is received. A response time storage unit that stores time and a plurality of measurement times obtained by measuring the plurality of response times in association with each terminal device;
A resource usage storage unit that stores a plurality of resource usages measured at different measurement times in each terminal device and a plurality of measurement times for measuring the plurality of resource usages in association with each terminal device;
A plurality of response times are acquired for each terminal device from the response time storage unit, and a value corresponding to the length of the response time is measured for each response time based on the acquired response times. A response time evaluation value calculation unit for calculating as a time evaluation value;
A response time evaluation value storage unit that stores, for each terminal device, a response time evaluation value at each measurement time calculated by the response time evaluation value calculation unit;
The response time evaluation value at each measurement time is acquired for each terminal device from the response time evaluation value storage unit, and the resource usage at each measurement time is acquired for each terminal device from the resource usage storage unit, and each measurement acquired Based on the response time evaluation value of the time and the resource usage at each measurement time, the larger the response time evaluation value for each measurement time, the larger the smaller the value of the measurement time. A weighted evaluation value calculating unit that calculates the weighted evaluation value;
A weighted evaluation value storage unit that stores a weighted evaluation value of each measurement time calculated by the weighted evaluation value calculation unit for each terminal device;
A terminal device classifying unit that classifies the plurality of terminal devices into a plurality of terminal device groups composed of one or more terminal devices based on the weighted evaluation value of each terminal device stored in the weighted evaluation value storage unit;
Based on the classification result by the terminal device classification unit, the weighted evaluation value of each terminal device belonging to the terminal device group is obtained for each terminal device group from the weighted evaluation value storage unit, and based on the obtained weighted evaluation value of each terminal device Calculating a distribution of weighted evaluation values of the terminal device group at each measurement time, and selecting a weighted evaluation value in the distribution as a network evaluation value of the terminal device group at each measurement time based on the calculated distribution of weighted evaluation values An evaluation value selection unit;
A network evaluation value storage unit that stores a plurality of past times indicating past measurement times and network evaluation values of each past time in association with each terminal device group;
A network failure data storage unit that stores network failure data in which a failure content indicating a failure that has occurred in the network is associated with a failure time that indicates a time at which the failure has occurred;
Based on the network evaluation value at each measurement time selected for each terminal device group by the network evaluation value selection unit and the network evaluation value at each past time stored for each terminal device group in the network evaluation value storage unit. A correlation time zone determination unit that determines, for each terminal device group, a past time zone in which the correlation between the network evaluation value of the measurement time and the network evaluation value is high, as a correlation time zone;
Based on the network failure data stored in the network failure data storage unit and the correlation time zone determined for each terminal device group by the correlation time zone determination unit, the failure time corresponding to the correlation time zone is determined for each terminal device group. A detection result output unit that searches from the network failure data, acquires failure content corresponding to the failure time from the network failure data, and outputs the acquired failure content in association with group information representing the terminal device group; Is provided.

本発明によれば、例えば、ルーティング情報が未知の状態にて、通信情報(応答時間)と端末稼働情報(リソース使用量)とから網内に起因する障害を検出することができる。   According to the present invention, for example, a failure caused in the network can be detected from communication information (response time) and terminal operation information (resource usage amount) in a state where routing information is unknown.

実施の形態1におけるネットワークシステム200の構成例を示す図。1 is a diagram illustrating a configuration example of a network system 200 according to Embodiment 1. FIG. 実施の形態1における網内障害抽出装置100の機能構成図。FIG. 3 is a functional configuration diagram of the in-network fault extraction apparatus 100 according to the first embodiment. 実施の形態1における網内障害抽出装置100の網内障害抽出方法を示すフローチャート。3 is a flowchart showing a network fault extraction method of the network fault extraction apparatus 100 according to the first embodiment. 実施の形態1におけるPING応答時間データ191の一例を示す表。4 is a table showing an example of PING response time data 191 in the first embodiment. 実施の形態1におけるPING応答時間データ191の一例を示すグラフ。6 is a graph showing an example of PING response time data 191 in the first embodiment. 実施の形態1における応答時間変動定量評価部110の主成分分析を示す概要図。FIG. 3 is a schematic diagram illustrating principal component analysis of a response time variation quantitative evaluation unit 110 according to the first embodiment. 実施の形態1におけるPING応答時間の定量評価値(マハラノビス距離)を表す図。The figure showing the quantitative evaluation value (Mahalanobis distance) of the PING response time in Embodiment 1. FIG. 実施の形態1における定量評価値データ193の一例を示す表。A table showing an example of quantitative evaluation value data 193 in the first embodiment. 実施の形態1における定量評価値データ193の一例を示すグラフ。6 is a graph showing an example of quantitative evaluation value data 193 in the first embodiment. 実施の形態1における端末稼働値データ192の一例を示す表。4 is a table showing an example of terminal operating value data 192 in the first embodiment. 実施の形態1における端末稼働値データ192の一例を示すグラフ。3 is a graph showing an example of terminal operating value data 192 in the first embodiment. 実施の形態1における稼働負荷重み関数値データ194を示すグラフ。5 is a graph showing working load weight function value data 194 in the first embodiment. 実施の形態1における重み付け評価値データ195を示すグラフ。6 is a graph showing weighted evaluation value data 195 in the first embodiment. 実施の形態1における重み付け評価値データ195のグラフに端末装置グループを示した図。The figure which showed the terminal device group in the graph of the weighting evaluation value data 195 in Embodiment 1. FIG. 実施の形態1における端末装置分類データ196を示す表。4 is a table showing terminal device classification data 196 in the first embodiment. 実施の形態1における網変動評価値データ197nの生成方法を示す概要図。FIG. 3 is a schematic diagram showing a method for generating network fluctuation evaluation value data 197n in the first embodiment. 実施の形態1における網変動評価値データ197nの一例を示す表。A table showing an example of network fluctuation evaluation value data 197n in the first embodiment. 実施の形態1における網変動評価値データ197nの一例を示すグラフ。6 is a graph showing an example of network fluctuation evaluation value data 197n in the first embodiment. 実施の形態1における過去の網変動評価値データ197oと新たな網変動評価値データ197nとの関係図。FIG. 6 is a relationship diagram between past network fluctuation evaluation value data 197o and new network fluctuation evaluation value data 197n in the first embodiment. 実施の形態1における障害内容データ199の一例を示す表。A table showing an example of failure content data 199 in the first embodiment. 実施の形態1における網内障害抽出装置100のハードウェア資源の一例を示す図。FIG. 3 is a diagram illustrating an example of hardware resources of the in-network failure extraction apparatus 100 according to the first embodiment.

実施の形態1.
ネットワークシステムで発生したネットワーク障害を検出する形態について説明する。
Embodiment 1 FIG.
A mode for detecting a network failure occurring in the network system will be described.

図1は、実施の形態1におけるネットワークシステム200の構成例を示す図である。
実施の形態1におけるネットワークシステム200の構成例について、図1に基づいて説明する。
FIG. 1 is a diagram illustrating a configuration example of a network system 200 according to the first embodiment.
A configuration example of the network system 200 in the first embodiment will be described with reference to FIG.

ネットワークシステム200において、ネットワーク210は複数のサブネットワーク211A−Dを含み、各サブネットワーク211A−Cには複数の端末装置220A−Iが接続されている。
また、サブネットワーク211Dには端末情報収集装置230と網内障害抽出装置100とが接続されている。
In the network system 200, the network 210 includes a plurality of sub-networks 211A-D, and a plurality of terminal devices 220A-I are connected to each sub-network 211A-C.
Further, the terminal information collection device 230 and the in-network failure extraction device 100 are connected to the sub-network 211D.

端末情報収集装置230の応答時間計測部(図示省略)は、所定の計測時間毎にPINGコマンドを実行し、各端末装置220へICMP(Internet Control Message Protocol)の応答要求パケットを送信する。
そして、端末情報収集装置230は各端末装置220から送信されるICMPの応答パケットを受信し、応答要求パケットを送信してから応答パケットを受信するまでの時間を計測し、計測した時間を端末装置220毎に記憶する。
以下、端末情報収集装置230により計測された時間を「PING応答時間(または応答時間)」という。
A response time measurement unit (not shown) of the terminal information collection device 230 executes a PING command every predetermined measurement time, and transmits an ICMP (Internet Control Message Protocol) response request packet to each terminal device 220.
The terminal information collecting device 230 receives the ICMP response packet transmitted from each terminal device 220, measures the time from when the response request packet is transmitted until the response packet is received, and the measured time is the terminal device. Store every 220.
Hereinafter, the time measured by the terminal information collection device 230 is referred to as “PING response time (or response time)”.

また、各端末装置220は、所定の測定時間毎にCPU(Central Processing Unit)やメモリなどのリソースの使用量(以下、リソース使用量という)を測定し、測定したリソース使用量を記憶する。
そして、端末情報収集装置230のリソース使用量収集部(図示省略)は、各端末装置220からリソース使用量を収集し、収集したリソース使用量を端末装置220毎に記憶する。
In addition, each terminal device 220 measures the usage of resources such as a CPU (Central Processing Unit) and a memory (hereinafter referred to as resource usage) for each predetermined measurement time, and stores the measured resource usage.
Then, a resource usage collection unit (not shown) of the terminal information collection device 230 collects the resource usage from each terminal device 220 and stores the collected resource usage for each terminal device 220.

網内障害抽出装置100は、端末情報収集装置230により計測された各端末装置220のPING応答時間(後述するPING応答時間データ191)と、端末情報収集装置230により収集された各端末装置220のリソース使用量(後述する端末稼働値データ192)とに基づいて、ネットワーク障害が発生したサブネットワーク211を検出する。   The network fault extraction apparatus 100 includes the PING response time (PING response time data 191 described later) of each terminal apparatus 220 measured by the terminal information collection apparatus 230, and the terminal apparatus 220 collected by the terminal information collection apparatus 230. Based on the resource usage (terminal operation value data 192 described later), the sub-network 211 in which a network failure has occurred is detected.

但し、ネットワーク210の構成、サブネットワーク211の構成、サブネットワーク211の接続形態、端末装置220の接続形態など、ネットワークシステム200の構成は図1に示す構成に限らない。
また、網内障害抽出装置100が端末情報収集装置230の機能を兼ね備えても構わない。
However, the configuration of the network system 200, such as the configuration of the network 210, the configuration of the subnetwork 211, the connection form of the subnetwork 211, and the connection form of the terminal device 220, is not limited to the configuration shown in FIG.
Further, the in-network fault extraction apparatus 100 may have the function of the terminal information collection apparatus 230.

図2は、実施の形態1における網内障害抽出装置100の機能構成図である。
実施の形態1における網内障害抽出装置100の機能構成について、図2に基づいて説明する。
FIG. 2 is a functional configuration diagram of the in-network fault extraction apparatus 100 according to the first embodiment.
A functional configuration of the in-network fault extraction apparatus 100 according to the first embodiment will be described with reference to FIG.

網内障害抽出装置100(ネットワーク障害検出装置の一例)は、応答時間変動定量評価部110と、稼働負荷重み関数算出部120と、重み考慮変動特性分類部130と、網変動抽出部140と、網障害評価部150と、障害通知部160とを備える。
さらに、網内障害抽出装置100は、装置記憶部190(応答時間記憶部、リソース使用量記憶部、応答時間評価値記憶部、重み付け評価値記憶部、ネットワーク評価値記憶部、ネットワーク障害データ記憶部の一例)を備える。
The network failure extraction device 100 (an example of a network failure detection device) includes a response time variation quantitative evaluation unit 110, an operational load weight function calculation unit 120, a weight-considered variation characteristic classification unit 130, a network variation extraction unit 140, A network failure evaluation unit 150 and a failure notification unit 160 are provided.
Further, the network fault extraction apparatus 100 includes a device storage unit 190 (response time storage unit, resource usage storage unit, response time evaluation value storage unit, weighted evaluation value storage unit, network evaluation value storage unit, network fault data storage unit). Example).

装置記憶部190は、網内障害抽出装置100で使用するデータを記憶媒体を用いて記憶する。
例えば、装置記憶部190は、端末情報収集装置230(図1参照)によって生成されたPING応答時間データ191と端末稼働値データ192とを予め記憶する。
また、装置記憶部190は、網内障害抽出装置100で生成される各種データ(符号193−199、181)を記憶する。
The device storage unit 190 stores data used by the network fault extraction device 100 using a storage medium.
For example, the device storage unit 190 stores in advance PING response time data 191 and terminal operating value data 192 generated by the terminal information collection device 230 (see FIG. 1).
In addition, the device storage unit 190 stores various data (reference numerals 193 to 199 and 181) generated by the in-network failure extraction device 100.

PING応答時間データ191(応答時間データの一例)は、異なる計測時刻に計測された複数の応答時間(PING応答時間)と、複数の応答時間を計測した複数の計測時刻とを対応付けて端末装置毎に示すデータである。応答時間とは、応答データを要求する応答要求データをネットワークに接続する複数の端末装置へ送信して応答要求データを送信してから応答データを受信するまでの時間として計測された時間である。   PING response time data 191 (an example of response time data) is a terminal device in which a plurality of response times (PING response times) measured at different measurement times are associated with a plurality of measurement times at which a plurality of response times are measured. It is the data shown for every. The response time is a time measured as a time from when response request data for requesting response data is transmitted to a plurality of terminal devices connected to the network and the response request data is transmitted until the response data is received.

端末稼働値データ192(リソース使用量データの一例)は、異なる測定時刻に測定された複数のリソース使用量と、複数のリソース使用量を測定した複数の測定時刻とを対応付けて端末装置毎に示すデータである。   The terminal operating value data 192 (an example of resource usage data) is obtained by associating a plurality of resource usages measured at different measurement times with a plurality of measurement times at which a plurality of resource usages are measured for each terminal device. It is the data shown.

応答時間変動定量評価部110(応答時間評価値算出部の一例)は、以下のように応答時間評価値(後述する定量評価値)を算出する(応答時間評価値算出処理)。
応答時間変動定量評価部110は、PING応答時間データ191から複数の応答時間を端末装置毎に取得する。
応答時間変動定量評価部110は、取得した複数の応答時間に基づいて各応答時間の計測時刻毎に当該応答時間の長さに応じた値を計測時刻の応答時間評価値として算出する。
The response time fluctuation quantitative evaluation unit 110 (an example of a response time evaluation value calculation unit) calculates a response time evaluation value (a quantitative evaluation value described later) as follows (response time evaluation value calculation processing).
The response time variation quantitative evaluation unit 110 acquires a plurality of response times from the PING response time data 191 for each terminal device.
The response time variation quantitative evaluation unit 110 calculates a value corresponding to the length of the response time as a response time evaluation value of the measurement time for each measurement time of the response time based on the acquired plurality of response times.

例えば、応答時間変動定量評価部110は、以下のように応答時間評価値を算出する。
応答時間変動定量評価部110は、取得した複数の応答時間を主成分分析し、主成分分析により各応答時間の計測時刻毎に得られる値を計測時刻の応答時間評価値として算出する。
For example, the response time variation quantitative evaluation unit 110 calculates a response time evaluation value as follows.
The response time variation quantitative evaluation unit 110 performs principal component analysis on the acquired plurality of response times, and calculates a value obtained for each measurement time of each response time by the principal component analysis as a response time evaluation value of the measurement time.

例えば、応答時間変動定量評価部110は、以下のように主成分分析を行う。
応答時間変動定量評価部110は、各応答時間の計測時刻毎に計測時刻を含んだ所定長の計測期間に対応する1つ以上の応答時間を応答時間系列として抽出する。
応答時間変動定量評価部110は、各計測時刻の応答時間系列を並べた行列を時系列波形行列として生成し、生成した時系列波形行列を用いて主成分分析を行う。
For example, the response time variation quantitative evaluation unit 110 performs principal component analysis as follows.
The response time variation quantitative evaluation unit 110 extracts one or more response times corresponding to a predetermined measurement period including the measurement time as a response time series for each response time measurement time.
The response time variation quantitative evaluation unit 110 generates a matrix in which response time series at each measurement time are arranged as a time series waveform matrix, and performs principal component analysis using the generated time series waveform matrix.

応答時間変動定量評価部110は、定量評価値データ193を生成する。
定量評価値データ193(応答時間評価値データの一例)は、各計測時刻の応答時間評価値を端末装置毎に示すデータである。
The response time variation quantitative evaluation unit 110 generates quantitative evaluation value data 193.
The quantitative evaluation value data 193 (an example of response time evaluation value data) is data indicating the response time evaluation value at each measurement time for each terminal device.

稼働負荷重み関数算出部120(重み付け評価値算出部の一例)は、以下のように重み付け評価値を算出する(重み付け評価値算出処理)。
稼働負荷重み関数算出部120は、定量評価値データ193から各計測時刻の応答時間評価値を端末装置毎に取得する。
稼働負荷重み関数算出部120は、端末稼働値データ192から各測定時刻のリソース使用量を端末装置毎に取得する。
稼働負荷重み関数算出部120は、取得した各計測時刻の応答時間評価値と各測定時刻のリソース使用量とに基づいて、計測時刻毎に応答時間評価値が大きいほど大きく計測時刻に対応する測定時刻のリソース使用量が多いほど小さい値を計測時刻の重み付け評価値として算出する。
The operating load weight function calculation unit 120 (an example of a weighted evaluation value calculation unit) calculates a weighted evaluation value as follows (weighted evaluation value calculation process).
The operational load weight function calculation unit 120 acquires a response time evaluation value at each measurement time from the quantitative evaluation value data 193 for each terminal device.
The operating load weight function calculation unit 120 acquires the resource usage at each measurement time from the terminal operating value data 192 for each terminal device.
Based on the acquired response time evaluation value at each measurement time and the resource usage at each measurement time, the working load weight function calculation unit 120 performs measurement corresponding to the measurement time as the response time evaluation value increases for each measurement time. A smaller value is calculated as the weighted evaluation value of the measurement time as the amount of resource usage at the time increases.

例えば、稼働負荷重み関数算出部120は、以下のように重み付け評価値を算出する。
稼働負荷重み関数算出部120は、各測定時刻のリソース使用量に基づいて各リソース使用量の測定時刻毎にリソース使用量の大きさに応じた値を測定時刻の重み付け値として算出する(重み付け値算出処理)。
稼働負荷重み関数算出部120は、各計測時刻の応答時間評価値と各測定時刻の重み付け値とに基づいて計測時刻毎に応答時間評価値が大きいほど大きく計測時刻に対応する測定時刻のリソース使用量が多いほど小さい値を計測時刻の重み付け評価値として算出する。
For example, the working load weight function calculation unit 120 calculates a weighted evaluation value as follows.
Based on the resource usage at each measurement time, the operating load weight function calculation unit 120 calculates a value corresponding to the size of the resource usage for each measurement time of each resource usage as a weighting value for the measurement time (weighting value). Calculation process).
The working load weight function calculation unit 120 uses the resource of the measurement time corresponding to the measurement time as the response time evaluation value increases for each measurement time based on the response time evaluation value at each measurement time and the weighted value of each measurement time. A smaller value is calculated as a weighted evaluation value of the measurement time as the amount increases.

稼働負荷重み関数算出部120は、重み付け評価値データ195を生成する。
重み付け評価値データ195は、各計測時刻の重み付け評価値を端末装置毎に示すデータである。
The operating load weight function calculation unit 120 generates weighted evaluation value data 195.
The weighted evaluation value data 195 is data indicating the weighted evaluation value at each measurement time for each terminal device.

重み考慮変動特性分類部130(端末装置分類部の一例)は、以下のように複数の端末装置を複数の端末装置グループに分類する(端末装置分類処理)。
重み考慮変動特性分類部130は、重み付け評価値データ195に示される各端末装置の重み付け評価値に基づいて、複数の端末装置を1つ以上の端末装置から成る複数の端末装置グループに分類する。
The weight-considering variation characteristic classification unit 130 (an example of a terminal device classification unit) classifies a plurality of terminal devices into a plurality of terminal device groups as follows (terminal device classification processing).
Based on the weighted evaluation value of each terminal device indicated in the weighted evaluation value data 195, the weight-considering variation characteristic classifying unit 130 classifies the plurality of terminal devices into a plurality of terminal device groups composed of one or more terminal devices.

例えば、重み考慮変動特性分類部130は、以下のように複数の端末装置を複数の端末装置グループに分類する。
重み考慮変動特性分類部130は、端末装置の複数の組み合わせを生成する。
重み考慮変動特性分類部130は、生成した組み合わせ毎に重み付け評価値の相関度を表す評価値相関値を算出する。
重み考慮変動特性分類部130は、算出した評価値相関値に基づいて複数の端末装置を複数の端末装置グループに分類する。
For example, the weight-considering variation characteristic classification unit 130 classifies a plurality of terminal devices into a plurality of terminal device groups as follows.
The weight-considering variation characteristic classification unit 130 generates a plurality of combinations of terminal devices.
The weight-considering variation characteristic classification unit 130 calculates an evaluation value correlation value that represents the degree of correlation of the weighted evaluation values for each generated combination.
The weight-considering variation characteristic classifying unit 130 classifies the plurality of terminal devices into a plurality of terminal device groups based on the calculated evaluation value correlation values.

重み考慮変動特性分類部130は、端末装置分類データ196を生成する。
端末装置分類データ196は、端末装置グループ毎に端末装置グループに属する端末装置を示すデータである。
The weight-considering variation characteristic classification unit 130 generates terminal device classification data 196.
The terminal device classification data 196 is data indicating terminal devices belonging to the terminal device group for each terminal device group.

網変動抽出部140(ネットワーク評価値選択部の一例)は、以下のようにネットワーク評価値(後述する網変動評価値)を選択する(ネットワーク評価値選択処理)。
網変動抽出部140は、重み考慮変動特性分類部130による分類結果に基づいて、端末装置グループ毎に端末装置グループに属する各端末装置の重み付け評価値を重み付け評価値データ195から取得する。
網変動抽出部140は、取得した各端末装置の重み付け評価値に基づいて、端末装置グループの重み付け評価値の分布を計測時刻毎に算出する。
網変動抽出部140は、算出した重み付け評価値の分布に基づいて分布内の重み付け評価値を端末装置グループのネットワーク評価値として計測時刻毎に選択する。
The network fluctuation extraction unit 140 (an example of a network evaluation value selection unit) selects a network evaluation value (a network fluctuation evaluation value described later) as follows (network evaluation value selection process).
The network fluctuation extraction unit 140 acquires the weighted evaluation value of each terminal device belonging to the terminal device group from the weighted evaluation value data 195 for each terminal device group based on the classification result by the weight-considered variation characteristic classification unit 130.
The network fluctuation extraction unit 140 calculates the distribution of the weighted evaluation values of the terminal device groups for each measurement time based on the obtained weighted evaluation values of the terminal devices.
The network fluctuation extraction unit 140 selects a weighted evaluation value in the distribution as a network evaluation value of the terminal device group for each measurement time based on the calculated distribution of weighted evaluation values.

例えば、網変動抽出部140は、以下のようにネットワーク評価値を選択する。
網変動抽出部140は、重み付け評価値データ195から各計測時刻の重み付け評価値を端末装置毎に取得する。
網変動抽出部140は、取得した各計測時刻の重み付け評価値に基づいて、計測時刻毎に計測時刻を含んだ所定長の対象期間に対応する1つ以上の重み付け評価値を評価値系列として抽出する。
網変動抽出部140は、抽出した評価値系列に基づいて重み付け評価値の分布を表す関数を計測時刻の確率密度関数として算出する(確率密度関数算出処理)。
網変動抽出部140は、各端末装置の確率密度関数に基づいて端末装置グループの確率密度関数(後述する重ね合わせ関数)を算出する。
網変動抽出部140は、算出した端末装置グループの確率密度関数が表す分布内の重み付け評価値をネットワーク評価値として選択する。
例えば、網変動抽出部140は、分布量が最も多い重み付け評価値をネットワーク評価値として選択する。
For example, the network fluctuation extraction unit 140 selects a network evaluation value as follows.
The network fluctuation extraction unit 140 acquires a weighted evaluation value at each measurement time from the weighted evaluation value data 195 for each terminal device.
The network fluctuation extracting unit 140 extracts, as an evaluation value series, one or more weighted evaluation values corresponding to a target period of a predetermined length including the measurement time for each measurement time, based on the acquired weighted evaluation value of each measurement time. To do.
The network fluctuation extraction unit 140 calculates a function representing the distribution of weighted evaluation values as a probability density function at the measurement time based on the extracted evaluation value series (probability density function calculation processing).
The network fluctuation extraction unit 140 calculates a probability density function (superposition function described later) of the terminal device group based on the probability density function of each terminal device.
The network fluctuation extraction unit 140 selects a weighted evaluation value in the distribution represented by the calculated probability density function of the terminal device group as a network evaluation value.
For example, the network fluctuation extraction unit 140 selects the weighted evaluation value with the largest distribution amount as the network evaluation value.

装置記憶部190は、網変動評価値データ197oと障害内容データ199とを記憶する。
網変動評価値データ197o(ネットワーク評価値データの一例)は、過去の計測時刻を示す複数の過去時刻と各過去時刻のネットワーク評価値とを対応付けて端末装置グループ毎に示すデータである。例えば、網変動評価値データ197oは、網変動抽出部140によって過去に生成されたデータである。
障害内容データ199(ネットワーク障害データの一例)は、ネットワークに発生した障害を示す障害内容と障害が発生した時刻を示す障害時刻とを対応付けたデータである。
The device storage unit 190 stores network fluctuation evaluation value data 197o and failure content data 199.
The network fluctuation evaluation value data 197o (an example of network evaluation value data) is data that indicates a plurality of past times indicating past measurement times and network evaluation values at each past time in association with each terminal device group. For example, the network fluctuation evaluation value data 197o is data generated in the past by the network fluctuation extracting unit 140.
The failure content data 199 (an example of network failure data) is data in which a failure content indicating a failure occurring in the network is associated with a failure time indicating a time when the failure occurred.

網障害評価部150(相関時間帯判定部、検出結果出力部の一例)は、以下のように相関時間帯(後述する過去相関期間)を判定する(相関時間帯判定処理)。
網障害評価部150は、網変動抽出部140によって端末装置グループ毎に選択された各計測時刻のネットワーク評価値と網変動評価値データ197oに端末装置グループ毎に示される各過去時刻のネットワーク評価値とに基づいて、各計測時刻のネットワーク評価値とネットワーク評価値の相関度が高い過去の時間帯を相関時間帯として端末装置グループ毎に判定する。
The network failure evaluation unit 150 (an example of a correlation time zone determination unit and a detection result output unit) determines a correlation time zone (a past correlation period to be described later) as follows (correlation time zone determination processing).
The network failure evaluation unit 150 selects the network evaluation value at each measurement time selected for each terminal device group by the network fluctuation extraction unit 140 and the network evaluation value at each past time indicated for each terminal device group in the network fluctuation evaluation value data 197o. Based on the above, a past time zone in which the degree of correlation between the network evaluation value at each measurement time and the network evaluation value is high is determined for each terminal device group as a correlation time zone.

網障害評価部150は、以下のように網障害評価結果データ181(ネットワーク障害検出データの一例)を生成する(ネットワーク障害検出データ生成処理)。
網障害評価部150は、端末装置グループ毎に判定した相関時間帯に基づいて端末装置グループ毎に相関時間帯に対応する障害時刻を障害内容データ199から検索する。
網障害評価部150は、当該障害時刻に対応する障害内容を障害内容データ199から取得する。
網障害評価部150は、取得した障害内容と当該端末装置グループを表すグループ情報(例えば、後述するグループ番号)とを対応付けて網障害評価結果データ181を生成する。
The network failure evaluation unit 150 generates network failure evaluation result data 181 (an example of network failure detection data) as follows (network failure detection data generation processing).
The network failure evaluation unit 150 searches the failure content data 199 for a failure time corresponding to the correlation time zone for each terminal device group based on the correlation time zone determined for each terminal device group.
The network failure evaluation unit 150 acquires the failure content corresponding to the failure time from the failure content data 199.
The network failure evaluation unit 150 generates network failure evaluation result data 181 by associating the acquired failure content with group information (for example, a group number described later) representing the terminal device group.

障害通知部160(検出結果出力部の一例)は、網障害評価部150により生成された網障害評価結果データ181を出力する(ネットワーク障害検出データ出力処理)。   The failure notification unit 160 (an example of the detection result output unit) outputs the network failure evaluation result data 181 generated by the network failure evaluation unit 150 (network failure detection data output process).

図3は、実施の形態1における網内障害抽出装置100の網内障害抽出方法を示すフローチャートである。
実施の形態1における網内障害抽出装置100の網内障害抽出方法について、図3に基づいて説明する。
FIG. 3 is a flowchart showing an in-network fault extracting method of the in-network fault extracting apparatus 100 according to the first embodiment.
The network fault extraction method of the network fault extraction apparatus 100 according to the first embodiment will be described with reference to FIG.

まず、網内障害抽出方法の概要について説明する。   First, an outline of the network fault extraction method will be described.

応答時間変動定量評価部110は、各端末装置のPING応答時間データ191に基づいてPING応答時間の定量評価値データ193を生成する(S110)。
稼働負荷重み関数算出部120は、各端末装置の端末稼働値データ192と定量評価値データ193とに基づいてPING応答時間の重み付け評価値データ195を生成する(S120)。
重み考慮変動特性分類部130は、各端末装置の重み付け評価値データ195に基づいて各端末装置をグループ毎に分類して端末装置分類データ196を生成する(S130)。
網変動抽出部140は、端末装置分類データ196と重み付け評価値データ195とに基づいて、ネットワーク障害に関する新たな網変動評価値データ197nを端末装置グループ毎に算出する(S140)。
網障害評価部150は、新たな網変動評価値データ197nと過去の網変動評価値データ197oと過去の障害内容データ199とに基づいて網障害評価結果データ181を生成する(S150)。
障害通知部160は、網障害評価結果データ181を出力する(S160)。
The response time variation quantitative evaluation unit 110 generates PING response time quantitative evaluation value data 193 based on the PING response time data 191 of each terminal device (S110).
The operating load weight function calculation unit 120 generates weighting evaluation value data 195 of the PING response time based on the terminal operating value data 192 and the quantitative evaluation value data 193 of each terminal device (S120).
The weight-considering variation characteristic classifying unit 130 classifies each terminal device for each group based on the weighted evaluation value data 195 of each terminal device, and generates terminal device classification data 196 (S130).
Based on the terminal device classification data 196 and the weighted evaluation value data 195, the network variation extraction unit 140 calculates new network variation evaluation value data 197n related to the network failure for each terminal device group (S140).
The network failure evaluation unit 150 generates network failure evaluation result data 181 based on the new network variation evaluation value data 197n, the past network variation evaluation value data 197o, and the past failure content data 199 (S150).
The failure notification unit 160 outputs network failure evaluation result data 181 (S160).

次に、網内障害抽出方法の詳細について説明する。   Next, details of the network fault extraction method will be described.

S110において、応答時間変動定量評価部110は、装置記憶部190からPING応答時間データ191を取得する。   In S <b> 110, the response time variation quantitative evaluation unit 110 acquires the PING response time data 191 from the device storage unit 190.

図4は、実施の形態1におけるPING応答時間データ191の一例を示す表である。
図5は、実施の形態1におけるPING応答時間データ191の一例を示すグラフである。
実施の形態1におけるPING応答時間データ191について、図4と図5とに基づいて説明する。
FIG. 4 is a table showing an example of the PING response time data 191 in the first embodiment.
FIG. 5 is a graph showing an example of the PING response time data 191 in the first embodiment.
PING response time data 191 in the first embodiment will be described with reference to FIG. 4 and FIG.

図4に示すように、PING応答時間データ191は、例えば、「日時」と「端末名」と「PING応答時間」とを対応付けたデータである。
「日時」は、PING応答時間が計測された時刻(計測時刻)を示す。
「端末名」は、端末装置を識別する名称(端末装置識別子の一例)を示す。
「PING応答時間」は、PING応答時間を示す。
As illustrated in FIG. 4, the PING response time data 191 is data in which “date and time”, “terminal name”, and “PING response time” are associated with each other, for example.
“Date and time” indicates the time (measurement time) at which the PING response time was measured.
“Terminal name” indicates a name (an example of a terminal device identifier) for identifying a terminal device.
“PING response time” indicates the PING response time.

PING応答時間データ191の「日時」を横軸の値として表し、「PING応答時間」を縦軸の値として表したグラフを図5に示す。   FIG. 5 shows a graph in which “date and time” of the PING response time data 191 is expressed as a value on the horizontal axis and “PING response time” is expressed as a value on the vertical axis.

図3に戻り、S110の説明を続ける。   Returning to FIG. 3, the description of S110 will be continued.

応答時間変動定量評価部110は、PING応答時間データ191に基づいて端末装置毎に時系列波形行列を生成し、生成した時系列波形行列を主成分分析し、各PING応答時間に対応するマハラノビス距離をPING応答時間の定量評価値として算出する。   The response time variation quantitative evaluation unit 110 generates a time series waveform matrix for each terminal device based on the PING response time data 191, performs principal component analysis on the generated time series waveform matrix, and Mahalanobis distance corresponding to each PING response time Is calculated as a quantitative evaluation value of the PING response time.

応答時間変動定量評価部110は、以下のように、PING応答時間データ191に基づいて端末装置毎に時系列波形行列を生成する。
応答時間変動定量評価部110は、PING応答時間データ191から各PING応答時間の計測時刻(日時)毎に当該計測時刻を含んだ所定長の計測期間に対応する1つ以上のPING応答時間を応答時間系列として抽出する。
応答時間変動定量評価部110は、抽出した各計測時刻の応答時間系列を行列の行として並べて時系列波形行列を生成する。
The response time variation quantitative evaluation unit 110 generates a time-series waveform matrix for each terminal device based on the PING response time data 191 as follows.
The response time fluctuation quantitative evaluation unit 110 responds to one or more PING response times corresponding to a predetermined measurement period including the measurement time for each measurement time (date and time) of each PING response time from the PING response time data 191. Extract as a time series.
The response time variation quantitative evaluation unit 110 generates a time series waveform matrix by arranging the extracted response time series at each measurement time as a matrix row.

例えば、応答時間変動定量評価部110は、図4に示したPING応答時間データ191に基づいて、2010年1月1日0時0分から1週間分のPING応答時間「124,130,115,127,・・・」を2010年1月1日0時0分の応答時間系列としてPING応答時間データ191から抽出する。
そして、応答時間変動定量評価部110は、抽出した応答時間系列「124,130,115,127,・・・」を時系列波形行列の第1行に設定する。
また、応答時間変動定量評価部110は、2010年1月1日1時30分から1週間分のPING応答時間「130,115,127,・・・」を2010年1月1日1時0分の応答時間系列としてPING応答時間データ191から抽出し、抽出した応答時間系列「130,115,127,・・・」を時系列波形行列の第2行に設定する。
同様に、応答時間変動定量評価部110は、残りの計測時刻の応答時間系列をPING応答時間データ191から抽出し、抽出した各計測時刻の応答時間系列を時系列波形行列の各行に設定する。
For example, based on the PING response time data 191 shown in FIG. 4, the response time variation quantitative evaluation unit 110 performs the PING response time “124, 130, 115, 127 for one week from 0:00 on January 1, 2010. ,... Are extracted from the PING response time data 191 as a response time sequence of 0:00 on January 1, 2010.
Then, the response time variation quantitative evaluation unit 110 sets the extracted response time series “124, 130, 115, 127,...” In the first row of the time series waveform matrix.
Further, the response time fluctuation quantitative evaluation unit 110 sets the PING response time “130, 115, 127,...” For one week from 1:30 on January 1, 2010 to 0:00 on January 1, 2010. Are extracted from the PING response time data 191 and the extracted response time sequence “130, 115, 127,...” Is set in the second row of the time series waveform matrix.
Similarly, the response time variation quantitative evaluation unit 110 extracts the response time series of the remaining measurement times from the PING response time data 191 and sets the extracted response time series of each measurement time in each row of the time series waveform matrix.

但し、応答時間変動定量評価部110は、全ての計測時刻毎に応答時間系列を抽出しないで応答時間系列を間引いても構わない。例えば、時系列波形行列の第1行に2010年1月1日0時0分の応答時間系列を設定した後、2010年1月2日0時0分の応答時間系列を時系列波形行列の第2行に設定してもよい。
また、応答時間系列に対応する計測期間は1週間より長い期間(または短い期間)であっても構わない。例えば、2日分のPING応答時間を応答時間系列にしても構わないし、1カ月分のPING応答時間を応答時間系列にしても構わない。
However, the response time variation quantitative evaluation unit 110 may thin out the response time series without extracting the response time series at every measurement time. For example, after setting a response time series on January 1, 2010 at 0:00 on the first row of the time series waveform matrix, the response time series on January 2, 2010 at 0:00 is converted into the time series waveform matrix. It may be set in the second row.
In addition, the measurement period corresponding to the response time series may be a period longer than one week (or a shorter period). For example, the PING response time for two days may be a response time series, and the PING response time for one month may be a response time series.

主成分分析とは、複数のデータ(実施の形態ではPING応答時間)の特徴を表す指標値を求める統計処理である。   Principal component analysis is statistical processing for obtaining an index value representing the characteristics of a plurality of data (in the embodiment, PING response time).

図6は、実施の形態1における応答時間変動定量評価部110の主成分分析を示す概要図である。
応答時間変動定量評価部110が実行する主成分分析の概要について、図6に基づいて説明する。
FIG. 6 is a schematic diagram illustrating principal component analysis of the response time variation quantitative evaluation unit 110 in the first embodiment.
An outline of principal component analysis performed by the response time variation quantitative evaluation unit 110 will be described with reference to FIG.

「データ空間」は、データ(PING応答時間)の分布を特定のデータ軸を用いて表した空間(グラフ)である。例えば、時系列波形行列がX行Y列の行列である場合、時系列波形行列はX次元のデータ空間に投影(プロット)したY個の点として扱われる。
このデータ空間(時系列波形行列)に対して主成分分析を行うと、データの特徴を強く反映する主成分軸がデータ空間のデータ軸と同じ数だけ算出される。これら主成分軸で表される空間を「主成分空間」という。
さらに、主成分空間から選択した上位の主成分軸(第1の主成分軸、第2の主成分軸)で表される空間を「特徴空間(または特徴平面)」という。
The “data space” is a space (graph) in which the distribution of data (PING response time) is expressed using a specific data axis. For example, when the time series waveform matrix is a matrix of X rows and Y columns, the time series waveform matrix is handled as Y points projected (plotted) in the X-dimensional data space.
When principal component analysis is performed on this data space (time series waveform matrix), the same number of principal component axes that strongly reflect the characteristics of the data are calculated as the number of data axes in the data space. The space represented by these principal component axes is called “principal component space”.
Furthermore, a space represented by a higher-order principal component axis (first principal component axis, second principal component axis) selected from the principal component space is referred to as a “feature space (or feature plane)”.

図7は、実施の形態1におけるPING応答時間の定量評価値(マハラノビス距離)を表す図である。
図7に示すように、マハラノビス距離(図中の矢印線)は、データ分布の中心(重心)(図中の三角印)からデータ分布に含まれる各点までの距離を表す。
但し、マハラノビス距離は、データ分布に含まれる各点を特徴平面(または特徴空間)に投影して得られる座標値、つまり、各点から特徴平面の主成分軸に対して垂線を引いて得られる座標値を用いて算出される。
また、マハラノビス距離は、データ分布の分散が大きい方向では実際の距離より短い距離で表され、データ分布の分散が小さい方向では実際の距離より長い距離で表される。例えば、図中ではデータ分布の中心からの距離が等しい点Aと点Bとでは、データ分布の分散が小さい方向に位置する点Aの方がマハラノビス距離の値は大きい。
マハラノビス距離が大きい点(例えば、所定の境界線より外側に位置する点A・B)は、通常のデータ分布から外れている点、つまり、他の点と特性が異なる点である。
FIG. 7 is a diagram illustrating a quantitative evaluation value (Mahalanobis distance) of the PING response time in the first embodiment.
As shown in FIG. 7, the Mahalanobis distance (arrow line in the figure) represents the distance from the center (center of gravity) of the data distribution (triangle mark in the figure) to each point included in the data distribution.
However, the Mahalanobis distance is obtained by projecting each point included in the data distribution onto the feature plane (or feature space), that is, by drawing a perpendicular line from each point to the principal component axis of the feature plane. Calculated using coordinate values.
Further, the Mahalanobis distance is expressed as a distance shorter than the actual distance in the direction where the variance of the data distribution is large, and is expressed as a distance longer than the actual distance in the direction where the variance of the data distribution is small. For example, in the figure, at points A and B having the same distance from the center of the data distribution, the value of the Mahalanobis distance is larger at the point A located in the direction in which the distribution of the data distribution is smaller.
A point having a large Mahalanobis distance (for example, points A and B located outside a predetermined boundary line) is a point deviating from the normal data distribution, that is, a point having different characteristics from other points.

応答時間変動定量評価部110は、各PING応答時間に対応するマハラノビス距離をPING応答時間の定量評価値として定量評価値データ193を生成する。   The response time variation quantitative evaluation unit 110 generates quantitative evaluation value data 193 using the Mahalanobis distance corresponding to each PING response time as a quantitative evaluation value of the PING response time.

図8は、実施の形態1における定量評価値データ193の一例を示す表である。
図9は、実施の形態1における定量評価値データ193の一例を示すグラフである。
実施の形態1における定量評価値データ193について、図8と図9とに基づいて説明する。
FIG. 8 is a table showing an example of the quantitative evaluation value data 193 in the first embodiment.
FIG. 9 is a graph showing an example of the quantitative evaluation value data 193 in the first embodiment.
The quantitative evaluation value data 193 according to the first embodiment will be described with reference to FIGS. 8 and 9.

図8に示すように、定量評価値データ193は、例えば、「日時」と「端末名」と「定量評価値」とを対応付けたデータである。
「日時」は、PING応答時間の計測時刻を示す。
「端末名」は、端末装置を識別する名称を示す。
「定量評価値」は、PING応答時間の定量評価値を示す。
As illustrated in FIG. 8, the quantitative evaluation value data 193 is, for example, data in which “date and time”, “terminal name”, and “quantitative evaluation value” are associated with each other.
“Date and time” indicates the measurement time of the PING response time.
“Terminal name” indicates a name for identifying a terminal device.
“Quantitative evaluation value” indicates a quantitative evaluation value of the PING response time.

定量評価値データ193の「日時」を横軸の値として表し、「定量評価値」を縦軸の値として表したグラフを図9に示す。   FIG. 9 shows a graph in which “date and time” of the quantitative evaluation value data 193 is represented as a value on the horizontal axis and “quantitative evaluation value” is represented as a value on the vertical axis.

図3に戻り、S110の説明を続ける。   Returning to FIG. 3, the description of S110 will be continued.

但し、応答時間変動定量評価部110は、主成分分析以外の処理でPING応答時間の定量評価値を算出しても構わない。
また、応答時間変動定量評価部110は、マハラノビス距離以外の値をPING応答時間の定量評価値として算出しても構わない。
例えば、応答時間変動定量評価部110は、PING応答時間を所定の単位時間で表した値をPING応答時間の定量評価値として算出しても構わない。
S110の後、S120に進む。
However, the response time variation quantitative evaluation unit 110 may calculate the quantitative evaluation value of the PING response time by a process other than the principal component analysis.
Further, the response time variation quantitative evaluation unit 110 may calculate a value other than the Mahalanobis distance as a quantitative evaluation value of the PING response time.
For example, the response time variation quantitative evaluation unit 110 may calculate a value representing the PING response time in a predetermined unit time as the quantitative evaluation value of the PING response time.
It progresses to S120 after S110.

S120において、稼働負荷重み関数算出部120は、装置記憶部190から端末稼働値データ192を取得する。   In S <b> 120, the operating load weight function calculation unit 120 acquires the terminal operating value data 192 from the device storage unit 190.

図10は、実施の形態1における端末稼働値データ192の一例を示す表である。
図11は、実施の形態1における端末稼働値データ192の一例を示すグラフである。
実施の形態1における端末稼働値データ192について、図10と図11とに基づいて説明する。
FIG. 10 is a table showing an example of the terminal operating value data 192 in the first embodiment.
FIG. 11 is a graph showing an example of the terminal operating value data 192 in the first embodiment.
The terminal operation value data 192 in the first embodiment will be described based on FIG. 10 and FIG.

図10に示すように、端末稼働値データ192は、例えば、「日時」と「端末名」と「CPU占有率」とを対応付けたデータである。
「日時」は、CPU占有率が測定された時刻(測定時刻)を示す。
「端末名」は、端末装置を識別する名称を示す。
「CPU占有率」は、CPU使用率のうちネットワークに関する処理(例えば、通信処理)で使用したCPU使用率を示す。CPU使用率とはCPUを使用した時間の割合である。
As illustrated in FIG. 10, the terminal operating value data 192 is data in which “date and time”, “terminal name”, and “CPU occupancy” are associated with each other, for example.
“Date and time” indicates the time (measurement time) when the CPU occupancy was measured.
“Terminal name” indicates a name for identifying a terminal device.
“CPU occupancy rate” indicates the CPU usage rate used in network-related processing (for example, communication processing) in the CPU usage rate. The CPU usage rate is the percentage of time spent using the CPU.

端末稼働値データ192の「日時」を横軸の値として表し、「CPU占有率」を縦軸の値として表したグラフを図11に示す。   FIG. 11 shows a graph in which “date and time” of the terminal operating value data 192 is represented as a value on the horizontal axis and “CPU occupancy” is represented as a value on the vertical axis.

但し、CPU占有率はリソース使用量の一例であり、端末装置のCPU使用率、ネットワークに関する処理のメモリ占有率、端末装置のメモリ使用率など、CPU占有率以外のリソース使用量を端末稼働値データ192に設定しても構わない。   However, the CPU occupancy rate is an example of the resource usage amount, and the resource usage amount other than the CPU occupancy rate, such as the CPU usage rate of the terminal device, the memory occupancy rate of processing related to the network, and the memory usage rate of the terminal device, is the terminal operating value data. It may be set to 192.

図3に戻り、S120の説明を続ける。   Returning to FIG. 3, the description of S120 will be continued.

稼働負荷重み関数算出部120は、端末稼働値データ192に基づいて以下のような稼働負荷重み関数を計算して稼働負荷重み関数値を算出し、算出した稼働負荷重み関数値を設定して稼働負荷重み関数値データ194を生成する。
稼働負荷重み関数値データ194は、端末装置毎に各CPU占有率の測定時刻の稼働負荷重み関数値を示すデータである。例えば、稼働負荷重み関数値データ194は「日時(測定時刻)」と「端末名」と「稼働負荷重み関数値」とを対応付けて生成される。
稼働負荷重み関数値は、PING応答時間の定量評価値を重み付けする重み付け値であり、CPU占有率が大きいほど小さくCPU占有率が小さいほど大きい値である。
以下のような稼働負荷重み関数(重み付け関数)は予め定義しておく。
The operating load weight function calculating unit 120 calculates the following operating load weight function based on the terminal operating value data 192 to calculate the operating load weight function value, and sets the calculated operating load weight function value to operate. Load weight function value data 194 is generated.
The operating load weight function value data 194 is data indicating the operating load weight function value at the measurement time of each CPU occupancy for each terminal device. For example, the operating load weight function value data 194 is generated in association with “date and time (measurement time)”, “terminal name”, and “operating load weight function value”.
The working load weighting function value is a weighting value for weighting the quantitative evaluation value of the PING response time, and the smaller the CPU occupancy is, the smaller the CPU occupancy is.
The following operational load weighting functions (weighting functions) are defined in advance.

例えば、稼働負荷重み関数は、CPU占有率が5%以上である時間帯の稼働負荷重み関数値として「0」を出力し、CPU占有率が5%未満である時間帯の稼働負荷重み関数値として「1」を出力する。また、CPU占有率を1分毎に測定しておき、20分以上継続してCPU占有率が5%以上である場合に稼働負荷重み関数値を「0」として、その他の場合に稼働負荷重み関数値を「1」にしてもよい。
このように、「0」または「1」を出力する関数を「0−1関数」と呼ぶ。
For example, the operating load weight function outputs “0” as an operating load weight function value in a time zone in which the CPU occupancy is 5% or more, and an operating load weight function value in a time zone in which the CPU occupancy is less than 5%. “1” is output. In addition, the CPU occupancy rate is measured every minute, the operation load weight function value is set to “0” when the CPU occupancy rate is 5% or more continuously for 20 minutes or more, and the operation load weight in other cases. The function value may be “1”.
A function that outputs “0” or “1” in this way is called a “0-1 function”.

図12は、実施の形態1における稼働負荷重み関数値データ194を示すグラフである。
稼働負荷重み関数として「0−1関数」を用いて場合、稼働負荷重み関数値データ194のグラフは図12のように表される。グラフの横軸は「日時(CPU占有率の測定時刻)」を示し、グラフの縦軸は「稼働負荷重み関数値」を示す。
FIG. 12 is a graph showing the operational load weight function value data 194 in the first embodiment.
When “0-1 function” is used as the operating load weight function, the graph of the operating load weight function value data 194 is expressed as shown in FIG. The horizontal axis of the graph indicates “date and time (CPU occupancy measurement time)”, and the vertical axis of the graph indicates “work load weight function value”.

また、稼働負荷重み関数f(t;x)を以下の式(1)に示すように定義してもよい。
式(1)で使用されているW(t)は「t=0」で値が「1」であり、「t=0」を中心に特定の割合で「1」から「0」に値が減少する「窓関数」である。但し、「−0.9Δ≦t≦0.9Δ」の区間の値を「1」とする。「Δ」はCPU占有率の条件として考慮すべき所定の考慮時間である。
窓関数とは、所定の条件を満たさない場合に「0」を出力する関数である。
Moreover, you may define the working load weight function f (t; x) as shown in the following formula | equation (1).
W (t) used in the equation (1) is “t = 0” and a value is “1”, and a value is changed from “1” to “0” at a specific ratio centering on “t = 0”. It is a “window function” that decreases. However, the value of the section “−0.9Δ ≦ t ≦ 0.9Δ” is “1”. “Δ” is a predetermined consideration time to be considered as a condition of the CPU occupation ratio.
The window function is a function that outputs “0” when a predetermined condition is not satisfied.

Figure 2012186667
Figure 2012186667

図3に戻り、S120の説明を続ける。   Returning to FIG. 3, the description of S120 will be continued.

稼働負荷重み関数算出部120は、定量評価値データ193に設定された定量評価値毎に、定量評価値の計測時刻(日時)に対応する稼働負荷重み関数値を稼働負荷重み関数値データ194から取得する。例えば、定量評価値の計測時刻が「2010年1月1日0時0分」である場合、稼働負荷重み関数算出部120は「2010年1月1日0時0分」または「2010年1月1日0時0分」に最も近い測定時刻(日時)の稼働負荷重み関数値を取得する。
稼働負荷重み関数算出部120は、定量評価値を稼働負荷重み関数値で除算する。以下、定量評価値を稼働負荷重み関数値で除算して得られる値を「重み付け評価値」という。但し、稼働負荷重み関数値が「0」である場合、重み付け評価値は「値無し」または「0」とする。
これにより、CPU占有率を考慮したPING応答時間の定量評価値を重み付け評価値として算出することができる。つまり、CPU占有率が高かったためにPING応答時間が長くなってしまった場合、PING応答時間の定量評価値を小さくした値が重み付け評価値として算出される。
「重み付け評価値」は、定量評価値が大きいほど大きく稼働負荷重み関数値が大きいほど小さい値である。
For each quantitative evaluation value set in the quantitative evaluation value data 193, the operational load weight function calculation unit 120 obtains an operational load weight function value corresponding to the measurement time (date) of the quantitative evaluation value from the operational load weight function value data 194. get. For example, when the measurement time of the quantitative evaluation value is “January 1, 2010 00:00”, the operating load weight function calculation unit 120 sets “January 1, 2010 00:00” or “2010 1 The operation load weight function value at the measurement time (date and time) closest to “Monday 1:00:00” is acquired.
The working load weight function calculation unit 120 divides the quantitative evaluation value by the working load weight function value. Hereinafter, a value obtained by dividing the quantitative evaluation value by the operating load weight function value is referred to as a “weighted evaluation value”. However, when the working load weight function value is “0”, the weight evaluation value is “no value” or “0”.
Thereby, the quantitative evaluation value of the PING response time in consideration of the CPU occupancy can be calculated as the weighted evaluation value. That is, when the PING response time becomes long because the CPU occupation ratio is high, a value obtained by reducing the quantitative evaluation value of the PING response time is calculated as the weighted evaluation value.
The “weighting evaluation value” is larger as the quantitative evaluation value is larger and is smaller as the working load weight function value is larger.

稼働負荷重み関数算出部120は、算出した重み付け評価値を設定して重み付け評価値データ195を生成する。
重み付け評価値データ195は、端末装置毎に各PING応答時間の計測時刻の重み付け評価値を示すデータである。例えば、重み付け評価値データ195は「日時(計測時刻)」と「端末名」と「重み付け評価値」とを対応付けて生成される。
The operating load weight function calculation unit 120 sets the calculated weighted evaluation value and generates weighted evaluation value data 195.
The weighted evaluation value data 195 is data indicating the weighted evaluation value of the measurement time of each PING response time for each terminal device. For example, the weighted evaluation value data 195 is generated in association with “date and time (measurement time)”, “terminal name”, and “weighted evaluation value”.

図13は、実施の形態1における重み付け評価値データ195を示すグラフである。
図13に示すグラフの横軸は「日時(PING応答時間の計測時刻)」を表し、グラフの縦軸は「重み付け評価値」を表している。
また、稼働負荷重み関数値が「0」である時間帯の重み付け評価値を「欠損値(値無し)」として表している。
FIG. 13 is a graph showing the weighted evaluation value data 195 in the first embodiment.
The horizontal axis of the graph shown in FIG. 13 represents “date and time (measurement time of PING response time)”, and the vertical axis of the graph represents “weighted evaluation value”.
In addition, the weighted evaluation value in the time zone in which the working load weight function value is “0” is represented as “missing value (no value)”.

図3に戻り、網内障害抽出方法の説明を続ける。   Returning to FIG. 3, the description of the fault extraction method in the network will be continued.

S120の後、S130に進む。   It progresses to S130 after S120.

S130において、重み考慮変動特性分類部130は、PING応答時間データ191や端末稼働値データ192に示される複数の端末装置を組み合わせて、2つの端末装置から成る端末装置の組み合わせを複数生成する。
重み考慮変動特性分類部130は、端末装置の組み合わせ毎に重み付け評価値データ195を用いて評価値相関関数を計算し、端末装置の組み合わせ毎に評価値相関値を算出する。
In S <b> 130, the weight-considering variation characteristic classification unit 130 generates a plurality of combinations of terminal devices including two terminal devices by combining a plurality of terminal devices indicated in the PING response time data 191 and the terminal operating value data 192.
The weight consideration variation characteristic classifying unit 130 calculates an evaluation value correlation function using the weighted evaluation value data 195 for each combination of terminal devices, and calculates an evaluation value correlation value for each combination of terminal devices.

評価値相関関数は、評価値相関値を出力する相互相関関数である。
評価値相関値は、重み付け評価値の相関度を表す値である。評価値相関値は重み付け評価値の相関度が高いほど大きく、重み付け評価値の相関度が低いほど小さい。
The evaluation value correlation function is a cross-correlation function that outputs an evaluation value correlation value.
The evaluation value correlation value is a value representing the degree of correlation of the weighted evaluation value. The evaluation value correlation value increases as the correlation degree of the weighted evaluation value increases, and decreases as the correlation degree of the weighted evaluation value decreases.

例えば、重み考慮変動特性分類部130は以下の式(2)に示す評価値相関関数f(x,y;k)を計算し、端末装置xと端末装置yとの重み付け評価値の評価値相関値Cor(x,y;k)を算出する。
評価値相関値Cor(x,y;k)は「0以上1以下」の値である。重み付け評価値の相関度が高い場合、評価値相関値Cor(x,y;k)は「1」に近い値であり、重み付け評価値の相関度が低い場合、評価値相関値Cor(x,y;k)は「0」に近い値である。
For example, the weight-considering variation characteristic classifying unit 130 calculates the evaluation value correlation function f (x, y; k) shown in the following equation (2), and evaluates the evaluation value correlation between the weighted evaluation values of the terminal device x and the terminal device y The value Cor (x, y; k) is calculated.
The evaluation value correlation value Cor (x, y; k) is a value of “0 or more and 1 or less”. When the correlation degree of the weighted evaluation value is high, the evaluation value correlation value Cor (x, y; k) is a value close to “1”, and when the correlation degree of the weighted evaluation value is low, the evaluation value correlation value Cor (x, y y; k) is a value close to “0”.

Figure 2012186667
Figure 2012186667

重み考慮変動特性分類部130は、端末装置の組み合わせ毎に評価値相関値(0以上1以下の値)を所定の評価値相関閾値(例えば、0.8)と比較し、評価値相関値が評価値相関閾値より大きい端末装置の組み合わせを判定する。
以下、評価値相関値が評価値相関閾値より大きい端末装置の組み合わせを「相関組み合わせ」という。
The weight-considering variation characteristic classification unit 130 compares the evaluation value correlation value (a value between 0 and 1) for each combination of terminal devices with a predetermined evaluation value correlation threshold (for example, 0.8), and the evaluation value correlation value is A combination of terminal devices larger than the evaluation value correlation threshold is determined.
Hereinafter, a combination of terminal devices whose evaluation value correlation value is larger than the evaluation value correlation threshold is referred to as “correlation combination”.

重み考慮変動特性分類部130は、各相関組み合わせに基づいて端末装置グループを生成し、生成した端末装置グループを表す端末装置分類データ196を生成する。
端末装置グループは、重み付け評価値の相関度が高い複数の端末装置(または1つの端末装置)から成る端末装置の組み合わせである。
The weight-considering variation characteristic classification unit 130 generates a terminal device group based on each correlation combination, and generates terminal device classification data 196 representing the generated terminal device group.
The terminal device group is a combination of terminal devices including a plurality of terminal devices (or one terminal device) having a high degree of correlation of weighted evaluation values.

但し、上記式(2)以外の評価値相関関数を定義して用いても構わない。
例えば、2台の端末装置ではなく3台以上の端末装置を対象にして評価値相関値を出力する評価値相関関数を定義しても構わない。
However, you may define and use evaluation value correlation functions other than said Formula (2).
For example, an evaluation value correlation function that outputs an evaluation value correlation value may be defined not for two terminal devices but for three or more terminal devices.

図14は、実施の形態1における重み付け評価値データ195のグラフに端末装置グループを示した図である。
図15は、実施の形態1における端末装置分類データ196を示す表である。
FIG. 14 is a diagram showing terminal device groups in the graph of the weighted evaluation value data 195 in the first embodiment.
FIG. 15 is a table showing terminal device classification data 196 in the first embodiment.

図14に実線の丸印で示すように、端末Aと端末Cとは重み付け評価値の相関度が高い。また、端末Cと端末Fとは重み付け評価値の相関度が高い。さらに、端末Fと端末Hとは重み付け評価値の相関度が高い。
したがって、端末Aと端末Cと端末Fと端末Hとは一つの端末装置グループ(1)を構成する。
同様に、端末Bと端末Eと端末Gとは端末装置グループ(2)を構成し、端末Dと端末Iとは端末装置グループ(3)を構成する。
As indicated by a solid circle in FIG. 14, terminal A and terminal C have a high degree of correlation between weighted evaluation values. Terminal C and terminal F have a high degree of correlation between the weighted evaluation values. Furthermore, terminal F and terminal H have a high degree of correlation between weighted evaluation values.
Therefore, the terminal A, the terminal C, the terminal F, and the terminal H constitute one terminal device group (1).
Similarly, the terminal B, the terminal E, and the terminal G constitute a terminal device group (2), and the terminal D and the terminal I constitute a terminal device group (3).

図14に示した各端末装置グループ(1)−(3)を表す端末装置分類データ196を図15に示す。   FIG. 15 shows terminal device classification data 196 representing each terminal device group (1)-(3) shown in FIG.

図15に示すように、端末装置分類データ196は、「日時」と「グループ番号」と「端末名」とを対応付けたデータである。
「日時」は、端末装置グループを分類した日時を示す。
「グループ番号」は、端末装置グループを識別する番号(グループ識別子の一例)を示す。例えば、グループ番号は、端末装置グループを構成する各端末装置の端末名(またはその他の端末装置識別子)を入力として所定のハッシュ関数を用いて算出した値である。
「端末名」は、端末装置グループに属する端末装置の名称を示す。
As illustrated in FIG. 15, the terminal device classification data 196 is data in which “date and time”, “group number”, and “terminal name” are associated with each other.
“Date and time” indicates the date and time when the terminal device group is classified.
“Group number” indicates a number (an example of a group identifier) for identifying a terminal device group. For example, the group number is a value calculated using a predetermined hash function with the terminal name (or other terminal device identifier) of each terminal device constituting the terminal device group as an input.
“Terminal name” indicates the name of the terminal device belonging to the terminal device group.

図3に戻り、網内障害抽出方法の説明を続ける。   Returning to FIG. 3, the description of the fault extraction method in the network will be continued.

S130の後、S140に進む。   It progresses to S140 after S130.

S140において、網変動抽出部140は、重み付け評価値データ195から各計測時刻の重み付け評価値を端末装置毎に取得する。
網変動抽出部140は、取得した各計測時刻の重み付け評価値に基づいて、計測時刻毎に計測時刻を含んだ所定長の対象期間に対応する1つ以上の重み付け評価値を評価値系列として抽出する。
網変動抽出部140は、抽出した評価値系列に基づいて重み付け評価値の分布を表す関数を計測時刻の確率密度関数として算出する。
網変動抽出部140は、各端末装置の確率密度関数に基づいて端末装置グループの確率密度関数を算出する。
網変動抽出部140は、算出した端末装置グループの確率密度関数に基づいて分布量が最も多い重み付け評価値を網変動評価値として選択する。但し、網変動抽出部140は、分布量の平均値が最も多い重み付け評価値以外の評価値を網変動評価値として選択しても構わない。例えば、網変動抽出部140は確率密度関数が表す分布内での重み付け評価値の平均値を網変動評価値として選択しても構わない。
In S140, the network fluctuation extracting unit 140 acquires the weighted evaluation value at each measurement time from the weighted evaluation value data 195 for each terminal device.
The network fluctuation extracting unit 140 extracts, as an evaluation value series, one or more weighted evaluation values corresponding to a target period of a predetermined length including the measurement time for each measurement time, based on the acquired weighted evaluation value of each measurement time. To do.
The network fluctuation extraction unit 140 calculates a function representing the distribution of weighted evaluation values as a probability density function at the measurement time based on the extracted evaluation value series.
The network fluctuation extraction unit 140 calculates a probability density function of the terminal device group based on the probability density function of each terminal device.
The network fluctuation extraction unit 140 selects, as the network fluctuation evaluation value, a weighted evaluation value having the largest distribution amount based on the calculated probability density function of the terminal device group. However, the network fluctuation extraction unit 140 may select an evaluation value other than the weighted evaluation value having the largest average value of distribution amounts as the network fluctuation evaluation value. For example, the network fluctuation extraction unit 140 may select the average value of the weighted evaluation values in the distribution represented by the probability density function as the network fluctuation evaluation value.

網変動抽出部140は、端末装置グループ毎に各計測時刻の網変動評価値を示す網変動評価値データ197nを生成する。   The network fluctuation extraction unit 140 generates network fluctuation evaluation value data 197n indicating the network fluctuation evaluation value at each measurement time for each terminal device group.

図16は、実施の形態1における網変動評価値データ197nの生成方法を示す概要図である。
網変動評価値データ197nの生成方法の概要について、図16に基づいて説明する。
FIG. 16 is a schematic diagram showing a method for generating network fluctuation evaluation value data 197n in the first embodiment.
An outline of a method for generating the network fluctuation evaluation value data 197n will be described with reference to FIG.

例えば、網変動抽出部140は、時刻「t」における端末装置グループ(2)の網変動評価値を以下のように算出する。
網変動抽出部140は、時刻「t」を中心の時刻とする所定長の対象期間(図中に示す点線枠)を算出する。
網変動抽出部140は、端末装置グループ(2)に属する各端末装置(B、E、G)の重み付け評価値データ195から対象期間に対応する複数の重み付け評価値(点線枠内の重み付け評価値)を時刻「t」の評価値系列として抽出する。
網変動抽出部140は、端末装置(B、E、G)毎に時刻「t」の評価値系列を用いてカーネル密度推定法により時刻「t」の確率密度関数(カーネル関数ともいう)を算出する。
For example, the network fluctuation extraction unit 140 calculates the network fluctuation evaluation value of the terminal device group (2) at time “t” as follows.
The network fluctuation extraction unit 140 calculates a target period (a dotted frame shown in the drawing) having a predetermined length with the time “t” as the center time.
The network fluctuation extraction unit 140 obtains a plurality of weighted evaluation values (weighted evaluation values within a dotted frame) corresponding to the target period from the weighted evaluation value data 195 of each terminal device (B, E, G) belonging to the terminal device group (2). ) As an evaluation value series at time “t”.
The network fluctuation extraction unit 140 calculates a probability density function (also referred to as a kernel function) at time “t” by a kernel density estimation method using the evaluation value series at time “t” for each terminal device (B, E, G). To do.

カーネル密度推定法とは、確率密度関数を推定する統計処理である。
確率密度関数とは、確率変数(実施の形態では重み付け評価値)のカーネル密度を表す関数である。
カーネル密度とは、確率変数の分布量を表す値である。
図中において、確率密度関数は横軸に重み付け評価値を表し、縦軸にカーネル密度を表す。
The kernel density estimation method is a statistical process for estimating a probability density function.
The probability density function is a function representing the kernel density of a random variable (in the embodiment, a weighted evaluation value).
The kernel density is a value representing the distribution amount of random variables.
In the figure, the probability density function represents the weighted evaluation value on the horizontal axis and the kernel density on the vertical axis.

網変動抽出部140は、各端末装置(B、E、G)の確率密度関数に基づいて重み付け評価値の分布の平均を表す確率密度関数を算出する。以下、各重み付け評価値の分布の平均を表す確率密度関数を「重ね合わせ関数」という。
網変動抽出部140は、重ね合わせ関数が表す重み付け評価値の分布内でカーネル密度が最も大きい重み付け評価値xを網変動評価値として選択する。但し、網変動抽出部140は、カーネル密度が最も大きい重み付け評価値x以外の重み付け評価値を網変動評価値として選択しても構わない。例えば、網変動抽出部140は、分布内のカーネル密度の平均値を網変動評価値として選択しても構わない。
網変動抽出部140は、選択した網変動評価値xを時刻「t」における端末装置グループ(2)の網変動評価値として網変動評価値データ197nに設定する。
図中において、網変動評価値データ197nは横軸に日時(計測時刻)を表し、縦軸に網変動評価値を表す。
The network fluctuation extraction unit 140 calculates a probability density function representing the average of the distribution of weighted evaluation values based on the probability density function of each terminal device (B, E, G). Hereinafter, the probability density function representing the average of the distributions of the respective weighted evaluation values is referred to as “superposition function”.
The network fluctuation extraction unit 140 selects, as the network fluctuation evaluation value, the weighting evaluation value x having the highest kernel density in the distribution of the weighting evaluation values represented by the overlay function. However, the network fluctuation extraction unit 140 may select a weighting evaluation value other than the weighting evaluation value x having the highest kernel density as the network fluctuation evaluation value. For example, the network fluctuation extraction unit 140 may select an average value of kernel densities in the distribution as the network fluctuation evaluation value.
The network fluctuation extraction unit 140 sets the selected network fluctuation evaluation value x in the network fluctuation evaluation value data 197n as the network fluctuation evaluation value of the terminal device group (2) at time “t”.
In the figure, the network fluctuation evaluation value data 197n represents the date and time (measurement time) on the horizontal axis and the network fluctuation evaluation value on the vertical axis.

図17は、実施の形態1における網変動評価値データ197nの一例を示す表である。
図18は、実施の形態1における網変動評価値データ197nの一例を示すグラフである。
FIG. 17 is a table showing an example of the network fluctuation evaluation value data 197n in the first embodiment.
FIG. 18 is a graph showing an example of the network fluctuation evaluation value data 197n in the first embodiment.

図17に示すように、網変動評価値データ197nは、例えば、「日時」と「グループ番号」と「網変動評価値」とを対応付けたデータである。
「日時」は、PING応答時間の計測時刻を示す。
「グループ番号」は、端末装置グループを識別する番号を示す。
「網変動評価値」は、網変動評価値を示す。
As shown in FIG. 17, the network fluctuation evaluation value data 197n is data in which “date and time”, “group number”, and “network fluctuation evaluation value” are associated with each other, for example.
“Date and time” indicates the measurement time of the PING response time.
“Group number” indicates a number for identifying a terminal device group.
“Network fluctuation evaluation value” indicates a network fluctuation evaluation value.

網変動評価値データ197nの「日時」を横軸の値として表し、「網変動評価値」を縦軸の値として表したグラフを図18に示す。   FIG. 18 shows a graph in which “date and time” of the network fluctuation evaluation value data 197n is represented as a value on the horizontal axis and “network fluctuation evaluation value” is represented as a value on the vertical axis.

装置記憶部190に予め記憶される過去の網変動評価値データ197oは、新たな網変動評価値データ197nと同じデータ構造を持つ。   The past network fluctuation evaluation value data 197o stored in advance in the device storage unit 190 has the same data structure as the new network fluctuation evaluation value data 197n.

図3に戻り、網内障害抽出方法の説明を続ける。   Returning to FIG. 3, the description of the fault extraction method in the network will be continued.

S140の後、S150に進む。   After S140, the process proceeds to S150.

S150において、網障害評価部150は、S140で生成された網変動評価値データ197nと過去の網変動評価値を示す網変動評価値データ197oとを装置記憶部190から取得する。
以下、新たな網変動評価値データ197nに示される複数の網変動評価値を「新たな網変動系列」といい、過去の網変動評価値データ197oに示される複数の網変動評価値を「過去の網変動系列」という。
In S150, the network failure evaluation unit 150 acquires the network variation evaluation value data 197n generated in S140 and the network variation evaluation value data 197o indicating the past network variation evaluation value from the device storage unit 190.
Hereinafter, the plurality of network fluctuation evaluation values indicated in the new network fluctuation evaluation value data 197n are referred to as “new network fluctuation series”, and the plurality of network fluctuation evaluation values indicated in the past network fluctuation evaluation value data 197o are referred to as “past network fluctuation evaluation values”. The network fluctuation series.

網障害評価部150は、過去の網変動系列から過去時刻(過去の計測時刻)毎に当該過去時刻を含んだ時間帯であって新たな網変動系列の時間帯と同じ時間長を持つ時間帯に対応する複数の網変動評価値を抽出する。
以下、抽出した複数の網変動評価値を当該過去時刻の「網変動部分系列」という。
The network failure evaluation unit 150 is a time zone including the past time for each past time (past measurement time) from the past network fluctuation sequence, and a time zone having the same time length as the time zone of the new network fluctuation sequence A plurality of network fluctuation evaluation values corresponding to are extracted.
Hereinafter, the plurality of extracted network fluctuation evaluation values are referred to as “network fluctuation subsequences” of the past time.

網障害評価部150は、過去時刻毎に新たな網変動系列と当該過去時刻の網変動部分系列とを用いて網変動相関関数を計算し、過去時刻毎に網変動相関値を算出する。   The network failure evaluation unit 150 calculates a network variation correlation function using a new network variation sequence and a network variation subsequence at the past time for each past time, and calculates a network variation correlation value for each past time.

網変動相関関数は、網変動相関値を出力する相互相関関数である。
網変動相関値は、新たな網変動系列と過去時刻の網変動部分系列との相関度を表す値である。
The network fluctuation correlation function is a cross-correlation function that outputs a network fluctuation correlation value.
The network fluctuation correlation value is a value representing the degree of correlation between a new network fluctuation series and a network fluctuation partial series at a past time.

例えば、網障害評価部150は以下の式(3)に示す網変動相関関数f(j)を計算し、j番目の過去時刻の網変動相関値R(j)を算出する。
網変動相関値R(j)は「0以上1以下」の値である。新たな網変動系列との相関度が高い場合、網変動相関値R(j)は「1」に近い値であり、新たな網変動系列との相関度が低い場合、網変動相関値R(j)は「0」に近い値である。
For example, the network failure evaluation unit 150 calculates a network fluctuation correlation function f (j) expressed by the following equation (3), and calculates a network fluctuation correlation value R (j) at the j-th past time.
The network fluctuation correlation value R (j) is a value “0 to 1”. When the degree of correlation with the new network fluctuation sequence is high, the network fluctuation correlation value R (j) is close to “1”, and when the degree of correlation with the new network fluctuation series is low, the network fluctuation correlation value R ( j) is a value close to “0”.

Figure 2012186667
Figure 2012186667

網障害評価部150は、過去時刻毎に網変動相関値(0以上1以下の値)を所定の網変動閾値(例えば、0.8)と比較し、網変動相関値が網変動閾値より大きい過去時刻を判定する。
以下、網変動相関値が網変動閾値より大きい過去時刻に対応する網変動部分系列の期間(時間帯)を「過去相関期間」という。
The network failure evaluation unit 150 compares the network fluctuation correlation value (a value between 0 and 1) for each past time with a predetermined network fluctuation threshold (for example, 0.8), and the network fluctuation correlation value is greater than the network fluctuation threshold. The past time is determined.
Hereinafter, the period (time zone) of the network fluctuation subsequence corresponding to the past time when the network fluctuation correlation value is larger than the network fluctuation threshold is referred to as “past correlation period”.

網障害評価部150は、過去相関期間を設定して過去相関期間データ198を生成する。
過去相関期間データ198は、端末装置グループ毎に過去相関期間を示すデータである。例えば、過去相関期間データ198は「過去相関期間」と「グループ番号」とを対応付けたデータである。
The network failure evaluation unit 150 sets the past correlation period and generates the past correlation period data 198.
The past correlation period data 198 is data indicating a past correlation period for each terminal device group. For example, the past correlation period data 198 is data in which “past correlation period” and “group number” are associated with each other.

図19は、実施の形態1における過去の網変動評価値データ197oと新たな網変動評価値データ197nとの関係図である。
図19において、新たな網変動評価値データ197nが表す新たな網変動系列と200(=j)番目の過去時刻の網変動部分系列との相関度が高い。
ここで、100(=j)番目の過去時刻の網変動相関値R(j)が「0.07」であり、200(=j)番目の過去時刻の網変動相関値R(j)が「0.86」であり、300(=j)番目の過去時刻の網変動相関値R(j)が「0.06」であったものとする。また、網変動閾値を「0.8」とする。
この場合、網障害評価部150は、200(=j)番目の過去時刻の網変動相関値「0.86」が網変動閾値「0.8」より大きいため、200(=j)番目の過去時刻に対応する網変動部分系列の時間帯「T」を過去相関期間として選択する。
FIG. 19 is a relationship diagram between past network fluctuation evaluation value data 197o and new network fluctuation evaluation value data 197n in the first embodiment.
In FIG. 19, the degree of correlation between the new network fluctuation series represented by the new network fluctuation evaluation value data 197n and the network fluctuation sub-series at the 200th (= j) th past time is high.
Here, the network fluctuation correlation value R (j) at the 100 (= j) th past time is “0.07”, and the network fluctuation correlation value R (j) at the 200 (= j) th past time is “ It is assumed that the network fluctuation correlation value R (j) at the 300th (= j) -th past time is “0.06”. The network fluctuation threshold is set to “0.8”.
In this case, since the network fluctuation correlation value “0.86” at the 200 (= j) th past time is greater than the network fluctuation threshold “0.8”, the network failure evaluation unit 150 determines that the 200 (= j) th past The time zone “T” of the network fluctuation subsequence corresponding to the time is selected as the past correlation period.

図3に戻り、S150の説明を続ける。   Returning to FIG. 3, the description of S150 will be continued.

網障害評価部150は、装置記憶部190から障害内容データ199を取得する。
障害内容データ199は、ネットワーク障害が発生した時刻と発生したネットワーク障害の内容とを示すデータである。
The network failure evaluation unit 150 acquires failure content data 199 from the device storage unit 190.
The failure content data 199 is data indicating the time when a network failure occurs and the content of the network failure that has occurred.

図20は、実施の形態1における障害内容データ199の一例を示す表である。
実施の形態1における障害内容データ199について、図20に基づいて説明する。
FIG. 20 is a table showing an example of the failure content data 199 in the first embodiment.
The failure content data 199 in the first embodiment will be described with reference to FIG.

例えば、障害内容データ199は、「日時」と「グループ番号」と「障害内容」とを対応付けたデータである。
「日時」は、ネットワーク障害が発生した時刻(障害時刻)を示す。
「グループ番号」は、端末装置グループを識別する番号である。例えば、グループ番号は、端末装置グループを構成する各端末装置の端末名(またはその他の識別子)を入力として所定のハッシュ関数を用いて算出した値である。
「障害内容」は、発生したネットワーク障害の内容(障害内容)を示す。
For example, the failure content data 199 is data in which “date and time”, “group number”, and “failure content” are associated with each other.
“Date and time” indicates the time (failure time) when a network failure occurs.
“Group number” is a number for identifying a terminal device group. For example, the group number is a value calculated using a predetermined hash function with the terminal names (or other identifiers) of the terminal devices constituting the terminal device group as inputs.
“Failure content” indicates the content of the network failure that has occurred (failure content).

図3に戻り、S150の説明を続ける。   Returning to FIG. 3, the description of S150 will be continued.

網障害評価部150は、過去相関期間データ198に基づいて端末装置グループ毎に過去相関期間に対応する障害内容を障害内容データ199から検索する。
過去相関期間に対応する障害内容とは、過去相関期間に含まれる時刻(または相関時間帯から所定の許容時間内に含まれる時刻、以下同様)を示す障害時刻と、当該端末装置グループのグループ番号とに対応付けられた障害内容である。
但し、網障害評価部150は、グループ番号に関係無く、過去相関期間に含まれる時刻を示す障害時刻に対応付けられた障害内容を過去相関期間に対応する障害内容として検索しても構わない。
The network failure evaluation unit 150 searches the failure content data 199 for failure contents corresponding to the past correlation period for each terminal device group based on the past correlation period data 198.
The failure contents corresponding to the past correlation period are the failure time indicating the time included in the past correlation period (or the time included within the predetermined allowable time from the correlation time zone, and the same hereinafter), and the group number of the terminal device group The failure content associated with.
However, the network failure evaluation unit 150 may search the failure content associated with the failure time indicating the time included in the past correlation period as the failure content corresponding to the past correlation period regardless of the group number.

網障害評価部150は、過去相関期間に対応する障害内容を設定して網障害評価結果データ181を生成する。
網障害評価結果データ181は、過去相関期間に対応する障害内容が存在する端末装置グループ毎に障害内容と端末装置グループを表すグループ情報とを示すデータである。
例えば、網障害評価結果データ181は、「計測期間(PING応答時間データ191の日時の範囲)」と「障害内容」と「グループ番号(グループ情報の一例)」とを対応付けたデータである。また、網障害評価結果データ181は、グループ番号の代わり又はグループ番号と共に端末装置グループを構成する各端末装置の端末名(またはその他の端末識別子)を含んでも構わない。
S150の後、S160に進む。
The network failure evaluation unit 150 sets the failure content corresponding to the past correlation period and generates network failure evaluation result data 181.
The network failure evaluation result data 181 is data indicating the failure content and group information representing the terminal device group for each terminal device group having the failure content corresponding to the past correlation period.
For example, the network failure evaluation result data 181 is data in which “measurement period (range of date and time of the PING response time data 191)”, “failure content”, and “group number (an example of group information)” are associated with each other. Further, the network failure evaluation result data 181 may include the terminal names (or other terminal identifiers) of the terminal devices that constitute the terminal device group instead of the group number or together with the group number.
After S150, the process proceeds to S160.

S160において、障害通知部160は、装置記憶部190から網障害評価結果データ181を取得し、取得した網障害評価結果データ181を出力する。   In S160, the failure notification unit 160 acquires the network failure evaluation result data 181 from the device storage unit 190, and outputs the acquired network failure evaluation result data 181.

例えば、障害通知部160は、網障害評価結果データ181を表示装置に表示する。
利用者は、表示装置に表示された網障害評価結果データ181を参照することによって、ネットワーク障害が発生したサブネットワークを推定することができる。
一例として、利用者は、網障害評価結果データ181に示されるグループ番号に対応する端末装置グループを特定し、特定した端末装置グループが属するサブネットワークでネットワーク障害が発生したということを判断する。
For example, the failure notification unit 160 displays the network failure evaluation result data 181 on the display device.
The user can estimate the sub-network in which the network failure has occurred by referring to the network failure evaluation result data 181 displayed on the display device.
As an example, the user specifies a terminal device group corresponding to the group number indicated in the network failure evaluation result data 181 and determines that a network failure has occurred in the subnetwork to which the specified terminal device group belongs.

また、障害通知部160は、予防保全システム(図示省略)に網障害評価結果データ181を送信してもよい。
予防保全システムとは、所定の予防保全処理を実行することによってネットワーク障害の発生を抑止し、またはネットワーク障害の影響を小さくする装置である。
例えば、予防保全処理は、ネットワーク内のルータと通信してルータのルーティングテーブルを更新し、またはネットワーク内の端末装置(またはゲートウェイサーバなどのサーバ装置)と通信して端末装置(またはサーバ装置)の制御情報(通信量の上限値など)を更新する。これにより、通信路の多重化やトラフィック制御を実現することができる。
但し、予防保全システムの機能を予防保全部として網内障害抽出装置100に備えても構わない。
Further, the failure notification unit 160 may transmit network failure evaluation result data 181 to a preventive maintenance system (not shown).
The preventive maintenance system is a device that suppresses the occurrence of a network failure or reduces the influence of the network failure by executing a predetermined preventive maintenance process.
For example, the preventive maintenance process communicates with a router in the network to update the routing table of the router, or communicates with a terminal device (or a server device such as a gateway server) in the network to Update control information (such as the upper limit of traffic). Thereby, multiplexing of communication paths and traffic control can be realized.
However, the network failure extraction apparatus 100 may be provided with the function of the preventive maintenance system as a preventive maintenance unit.

S160により、網内障害抽出方法の処理は終了する。   By S160, the processing of the network fault extraction method ends.

網内障害抽出方法(図3参照)のS150において、網障害評価部150は、新たな網変動評価値データ197nがネットワーク障害の発生を示しているか否かを判定し、新たな網変動評価値データ197nがネットワーク障害の発生を示している場合に前記S150の処理を実行してもよい。
また、網障害評価部150は、新たな網変動評価値データ197nに基づいてネットワーク障害が発生している障害発生期間を判定し、判定した障害発生期間に対応する複数の網変動評価値を抽出し、抽出した複数の網変動評価値に対して前記S150の処理を実行してもよい。
例えば、網障害評価部150は、新たな網変動評価値データ197nと過去の網変動評価値データ197oとを統計処理により比較し、新たな網変動評価値データ197nがネットワーク障害の発生を示しているか否かを判定し、又はネットワーク障害が発生している障害発生期間を判定する。
例えば、網障害評価部150は、過去の網変動評価値データ197oに基づいて過去の網変動評価値の「3σ範囲(または95%信頼区間)」を算出し、算出した「3σ範囲(または95%信頼区間)」から外れた網変動評価値を新たな網変動評価値データ197nが含んでいる場合、新たな網変動評価値データ197nがネットワーク障害の発生を示していると判定する。「3σ範囲」は平均値との差が標準偏差の3倍以下である範囲のことである。
また、網障害評価部150は、過去の網変動評価値データ197oの「3σ範囲(または95%信頼区間)」から外れた網変動評価値を新たな網変動評価値データ197nから検索し、検索した網変動評価値に対応する期間を障害発生期間として判定する。
In S150 of the network fault extraction method (see FIG. 3), the network fault evaluation unit 150 determines whether or not the new network fluctuation evaluation value data 197n indicates the occurrence of a network fault, and the new network fluctuation evaluation value. When the data 197n indicates the occurrence of a network failure, the process of S150 may be executed.
Further, the network failure evaluation unit 150 determines a failure occurrence period in which a network failure has occurred based on the new network change evaluation value data 197n, and extracts a plurality of network change evaluation values corresponding to the determined failure occurrence period. Then, the process of S150 may be executed for the extracted plurality of network fluctuation evaluation values.
For example, the network failure evaluation unit 150 compares the new network fluctuation evaluation value data 197n and the past network fluctuation evaluation value data 197o by statistical processing, and the new network fluctuation evaluation value data 197n indicates the occurrence of a network failure. It is determined whether there is a network failure or a failure occurrence period.
For example, the network failure evaluation unit 150 calculates the “3σ range (or 95% confidence interval)” of the past network fluctuation evaluation value based on the past network fluctuation evaluation value data 197o, and calculates the calculated “3σ range (or 95). If the new network fluctuation evaluation value data 197n includes a network fluctuation evaluation value deviating from “% confidence interval)”, it is determined that the new network fluctuation evaluation value data 197n indicates the occurrence of a network failure. The “3σ range” is a range in which the difference from the average value is not more than three times the standard deviation.
Further, the network failure evaluation unit 150 searches the new network fluctuation evaluation value data 197n for a network fluctuation evaluation value that is out of the “3σ range (or 95% confidence interval)” of the past network fluctuation evaluation value data 197o, and performs a search. The period corresponding to the network fluctuation evaluation value is determined as the failure occurrence period.

図21は、実施の形態1における網内障害抽出装置100のハードウェア資源の一例を示す図である。
図21において、網内障害抽出装置100は、CPU901(Central Processing Unit)を備えている。CPU901は、バス902を介してROM903、RAM904、通信ボード905、ディスプレイ装置911、キーボード912、マウス913、ドライブ装置914、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。ドライブ装置914は、FD(Flexible Disk Drive)、CD(Compact Disc)、DVD(Digital Versatile Disc)などの記憶媒体を読み書きする装置である。
FIG. 21 is a diagram illustrating an example of hardware resources of the network fault extraction apparatus 100 according to the first embodiment.
In FIG. 21, the in-network fault extraction apparatus 100 includes a CPU 901 (Central Processing Unit). The CPU 901 is connected to the ROM 903, the RAM 904, the communication board 905, the display device 911, the keyboard 912, the mouse 913, the drive device 914, and the magnetic disk device 920 via the bus 902, and controls these hardware devices. The drive device 914 is a device that reads and writes a storage medium such as an FD (Flexible Disk Drive), a CD (Compact Disc), and a DVD (Digital Versatile Disc).

通信ボード905は、有線または無線で、LAN(Local Area Network)、インターネット、電話回線などの通信網に接続している。   The communication board 905 is wired or wirelessly connected to a communication network such as a LAN (Local Area Network), the Internet, or a telephone line.

磁気ディスク装置920には、OS921(オペレーティングシステム)、プログラム群922、ファイル群923が記憶されている。   The magnetic disk device 920 stores an OS 921 (operating system), a program group 922, and a file group 923.

プログラム群922には、実施の形態において「〜部」として説明する機能を実行するプログラムが含まれる。プログラムは、CPU901により読み出され実行される。すなわち、プログラムは、「〜部」としてコンピュータを機能させるものであり、また「〜部」の手順や方法をコンピュータに実行させるものである。   The program group 922 includes programs that execute the functions described as “units” in the embodiments. The program is read and executed by the CPU 901. That is, the program causes the computer to function as “to part”, and causes the computer to execute the procedures and methods of “to part”.

ファイル群923には、実施の形態において説明する「〜部」で使用される各種データ(入力、出力、判定結果、計算結果、処理結果など)が含まれる。   The file group 923 includes various data (input, output, determination result, calculation result, processing result, etc.) used in “˜part” described in the embodiment.

実施の形態において構成図およびフローチャートに含まれている矢印は主としてデータや信号の入出力を示す。   In the embodiment, arrows included in the configuration diagrams and flowcharts mainly indicate input and output of data and signals.

実施の形態において「〜部」として説明するものは「〜回路」、「〜装置」、「〜機器」であってもよく、また「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」として説明するものは、ファームウェア、ソフトウェア、ハードウェアまたはこれらの組み合わせのいずれで実装されても構わない。   In the embodiment, what is described as “to part” may be “to circuit”, “to apparatus”, and “to device”, and “to step”, “to procedure”, and “to processing”. May be. That is, what is described as “to part” may be implemented by any of firmware, software, hardware, or a combination thereof.

実施の形態2.
複数の端末装置を実施の形態1と異なる方法で分類する形態について説明する。
以下、実施の形態1と異なる事項について主に説明する。説明を省略した事項については実施の形態1と同様である。
Embodiment 2. FIG.
A mode of classifying a plurality of terminal devices by a method different from that in the first embodiment will be described.
Hereinafter, items different from the first embodiment will be mainly described. The matters whose explanation is omitted are the same as those in the first embodiment.

ネットワークシステム200の構成(図1参照)や網内障害抽出装置100の機能構成(図2参照)は実施の形態1と同様である。   The configuration of the network system 200 (see FIG. 1) and the functional configuration of the in-network fault extraction apparatus 100 (see FIG. 2) are the same as those in the first embodiment.

また、網内障害抽出方法の処理の流れ(図3参照)は実施の形態1と同様である。
但し、端末装置分類データ生成処理(S130)が実施の形態1と異なる。
The processing flow (see FIG. 3) of the network fault extraction method is the same as that of the first embodiment.
However, the terminal device classification data generation process (S130) is different from the first embodiment.

以下、端末装置分類データ生成処理(S130)について説明する。
S130において、重み考慮変動特性分類部130は、今回生成された定量評価値データ193と前回生成された端末装置分類データ196とを用いてK−means法によって新たな端末装置分類データ196を生成する。
つまり、重み考慮変動特性分類部130は、現在の端末装置分類データ196を定量評価値データ193に基づいてK−means法によって更新する。
Hereinafter, the terminal device classification data generation process (S130) will be described.
In S <b> 130, the weight-considering variation characteristic classification unit 130 generates new terminal device classification data 196 by the K-means method using the quantitative evaluation value data 193 generated this time and the terminal device classification data 196 generated last time. .
That is, the weight-considering variation characteristic classification unit 130 updates the current terminal device classification data 196 based on the quantitative evaluation value data 193 by the K-means method.

例えば、重み考慮変動特性分類部130は、以下のように端末装置分類データ196を生成(更新)する。
重み考慮変動特性分類部130は、装置記憶部190から定量評価値データ193と端末装置分類データ196とを取得する。
重み考慮変動特性分類部130は、端末装置分類データ196が示す端末装置グループ毎に端末装置グループに属する各端末装置の定量評価値を定量評価値データ193から抽出する。
重み考慮変動特性分類部130は、端末装置グループ毎に定量評価値の平均値をグループ評価値として算出する。
重み考慮変動特性分類部130は、端末装置毎に定量評価値の平均値を端末評価値として算出する。
重み考慮変動特性分類部130は、端末装置毎に端末評価値と各グループ評価値とを比較し、端末評価値に最も近いグループ評価値を選択し、選択したグループ評価値に対応する端末装置グループを該当グループとして選択する。
重み考慮変動特性分類部130は、端末装置毎に端末装置が属する端末装置グループと該当グループとが一致するか否かを判定する。
重み考慮変動特性分類部130は、端末装置グループと該当グループとが一致しない端末装置が存在する場合、当該端末装置が該当グループに属するように端末装置分類データ196を更新する。
重み考慮変動特性分類部130は、端末装置分類データ196を更新した場合、上記の処理を繰り返す。
For example, the weight-considering variation characteristic classification unit 130 generates (updates) the terminal device classification data 196 as follows.
The weight-considering variation characteristic classification unit 130 acquires quantitative evaluation value data 193 and terminal device classification data 196 from the device storage unit 190.
The weight-considering variation characteristic classifying unit 130 extracts, from the quantitative evaluation value data 193, the quantitative evaluation value of each terminal device belonging to the terminal device group for each terminal device group indicated by the terminal device classification data 196.
The weight-considering variation characteristic classification unit 130 calculates an average value of quantitative evaluation values as a group evaluation value for each terminal device group.
The weight-considering variation characteristic classification unit 130 calculates the average value of the quantitative evaluation values as the terminal evaluation value for each terminal device.
The weight-considering variation characteristic classification unit 130 compares the terminal evaluation value with each group evaluation value for each terminal device, selects the group evaluation value closest to the terminal evaluation value, and the terminal device group corresponding to the selected group evaluation value As the appropriate group.
The weight-considering variation characteristic classifying unit 130 determines for each terminal device whether the terminal device group to which the terminal device belongs matches the corresponding group.
When the terminal device group does not match the corresponding group, the weight-considering variation characteristic classifying unit 130 updates the terminal device classification data 196 so that the terminal device belongs to the corresponding group.
The weight-considering variation characteristic classification unit 130 repeats the above process when the terminal device classification data 196 is updated.

網内障害抽出方法のその他の処理(図3参照)については実施の形態1と同様である。   Other processes (see FIG. 3) of the network fault extraction method are the same as those in the first embodiment.

100 網内障害抽出装置、110 応答時間変動定量評価部、120 稼働負荷重み関数算出部、130 重み考慮変動特性分類部、140 網変動抽出部、150 網障害評価部、160 障害通知部、181 網障害評価結果データ、190 装置記憶部、191 PING応答時間データ、192 端末稼働値データ、193 定量評価値データ、194 稼働負荷重み関数値データ、195 重み付け評価値データ、196 端末装置分類データ、197 網変動評価値データ、198 過去相関期間データ、199 障害内容データ、200 ネットワークシステム、210 ネットワーク、211 サブネットワーク、220 端末装置、230 端末情報収集装置、901 CPU、902 バス、903 ROM、904 RAM、905 通信ボード、911 ディスプレイ装置、912 キーボード、913 マウス、914 ドライブ装置、920 磁気ディスク装置、921 OS、922 プログラム群、923 ファイル群。   DESCRIPTION OF SYMBOLS 100 In-network fault extraction apparatus, 110 Response time fluctuation quantitative evaluation part, 120 Working load weight function calculation part, 130 Weight consideration fluctuation characteristic classification part, 140 Network fluctuation extraction part, 150 Network fault evaluation part, 160 Fault notification part, 181 network Failure evaluation result data, 190 device storage unit, 191 PING response time data, 192 terminal operating value data, 193 quantitative evaluation value data, 194 operating load weight function value data, 195 weighted evaluation value data, 196 terminal device classification data, 197 network Fluctuation evaluation value data, 198 past correlation period data, 199 failure content data, 200 network system, 210 network, 211 subnetwork, 220 terminal device, 230 terminal information collection device, 901 CPU, 902 bus, 903 ROM, 904 RAM, 905Shin board, 911 display device, 912 keyboard, 913 mouse, 914 drive, 920 a magnetic disk device, 921 OS, 922 programs, 923 files.

Claims (12)

応答データを要求する応答要求データをネットワークに接続する複数の端末装置へ送信して前記応答要求データを送信してから前記応答データを受信するまでの時間として異なる計測時刻に計測された複数の応答時間と前記複数の応答時間を計測した複数の計測時刻とを対応付けて端末装置毎に記憶する応答時間記憶部と、
各端末装置で異なる測定時刻に測定された複数のリソース使用量と前記複数のリソース使用量を測定した複数の測定時刻とを対応付けて端末装置毎に記憶するリソース使用量記憶部と、
前記応答時間記憶部から複数の応答時間を端末装置毎に取得し、取得した複数の応答時間に基づいて各応答時間の計測時刻毎に当該応答時間の長さに応じた値を計測時刻の応答時間評価値として算出する応答時間評価値算出部と、
前記応答時間評価値算出部によって算出された各計測時刻の応答時間評価値を端末装置毎に記憶する応答時間評価値記憶部と、
前記応答時間評価値記憶部から各計測時刻の応答時間評価値を端末装置毎に取得し、前記リソース使用量記憶部から各測定時刻のリソース使用量を端末装置毎に取得し、取得した各計測時刻の応答時間評価値と各測定時刻のリソース使用量とに基づいて計測時刻毎に応答時間評価値が大きいほど大きく計測時刻に対応する測定時刻のリソース使用量が多いほど小さい値を計測時刻の重み付け評価値として算出する重み付け評価値算出部と、
前記重み付け評価値算出部によって算出された各計測時刻の重み付け評価値を端末装置毎に記憶する重み付け評価値記憶部と、
前記重み付け評価値記憶部に記憶された各端末装置の重み付け評価値に基づいて、前記複数の端末装置を1つ以上の端末装置から成る複数の端末装置グループに分類する端末装置分類部と、
前記端末装置分類部による分類結果に基づいて端末装置グループ毎に端末装置グループに属する各端末装置の重み付け評価値を前記重み付け評価値記憶部から取得し、取得した各端末装置の重み付け評価値に基づいて端末装置グループの重み付け評価値の分布を計測時刻毎に算出し、算出した重み付け評価値の分布に基づいて分布内の重み付け評価値を端末装置グループのネットワーク評価値として計測時刻毎に選択するネットワーク評価値選択部と、
過去の計測時刻を示す複数の過去時刻と各過去時刻のネットワーク評価値とを対応付けて端末装置グループ毎に記憶するネットワーク評価値記憶部と、
前記ネットワークに発生した障害を示す障害内容と前記障害が発生した時刻を示す障害時刻とを対応付けたネットワーク障害データを記憶するネットワーク障害データ記憶部と、
前記ネットワーク評価値選択部によって端末装置グループ毎に選択された各計測時刻のネットワーク評価値と前記ネットワーク評価値記憶部に端末装置グループ毎に記憶された各過去時刻のネットワーク評価値とに基づいて各計測時刻のネットワーク評価値とネットワーク評価値の相関度が高い過去の時間帯を相関時間帯として端末装置グループ毎に判定する相関時間帯判定部と、
前記ネットワーク障害データ記憶部に記憶されたネットワーク障害データと前記相関時間帯判定部によって端末装置グループ毎に判定された相関時間帯とに基づいて端末装置グループ毎に相関時間帯に対応する障害時刻を前記ネットワーク障害データから検索し、当該障害時刻に対応する障害内容を前記ネットワーク障害データから取得し、取得した障害内容と当該端末装置グループを表すグループ情報とを対応付けて出力する検出結果出力部と
を備えたことを特徴とするネットワーク障害検出装置。
A plurality of responses measured at different measurement times as a time from when the response request data is transmitted to the plurality of terminal devices connected to the network and the response request data is transmitted until the response data is received. A response time storage unit that stores time and a plurality of measurement times obtained by measuring the plurality of response times in association with each terminal device;
A resource usage storage unit that stores a plurality of resource usages measured at different measurement times in each terminal device and a plurality of measurement times for measuring the plurality of resource usages in association with each terminal device;
A plurality of response times are acquired for each terminal device from the response time storage unit, and a value corresponding to the length of the response time is measured for each response time based on the acquired response times. A response time evaluation value calculation unit for calculating as a time evaluation value;
A response time evaluation value storage unit that stores, for each terminal device, a response time evaluation value at each measurement time calculated by the response time evaluation value calculation unit;
The response time evaluation value at each measurement time is acquired for each terminal device from the response time evaluation value storage unit, and the resource usage at each measurement time is acquired for each terminal device from the resource usage storage unit, and each measurement acquired Based on the response time evaluation value of the time and the resource usage at each measurement time, the larger the response time evaluation value for each measurement time, the larger the smaller the value of the measurement time. A weighted evaluation value calculating unit that calculates the weighted evaluation value;
A weighted evaluation value storage unit that stores a weighted evaluation value of each measurement time calculated by the weighted evaluation value calculation unit for each terminal device;
A terminal device classifying unit that classifies the plurality of terminal devices into a plurality of terminal device groups composed of one or more terminal devices based on the weighted evaluation value of each terminal device stored in the weighted evaluation value storage unit;
Based on the classification result by the terminal device classification unit, the weighted evaluation value of each terminal device belonging to the terminal device group is obtained for each terminal device group from the weighted evaluation value storage unit, and based on the obtained weighted evaluation value of each terminal device Calculating a distribution of weighted evaluation values of the terminal device group at each measurement time, and selecting a weighted evaluation value in the distribution as a network evaluation value of the terminal device group at each measurement time based on the calculated distribution of weighted evaluation values An evaluation value selection unit;
A network evaluation value storage unit that stores a plurality of past times indicating past measurement times and network evaluation values of each past time in association with each terminal device group;
A network failure data storage unit that stores network failure data in which a failure content indicating a failure that has occurred in the network is associated with a failure time that indicates a time at which the failure has occurred;
Based on the network evaluation value at each measurement time selected for each terminal device group by the network evaluation value selection unit and the network evaluation value at each past time stored for each terminal device group in the network evaluation value storage unit. A correlation time zone determination unit that determines, for each terminal device group, a past time zone in which the correlation between the network evaluation value of the measurement time and the network evaluation value is high, as a correlation time zone;
Based on the network failure data stored in the network failure data storage unit and the correlation time zone determined for each terminal device group by the correlation time zone determination unit, the failure time corresponding to the correlation time zone is determined for each terminal device group. A detection result output unit that searches from the network failure data, acquires failure content corresponding to the failure time from the network failure data, and outputs the acquired failure content in association with group information representing the terminal device group; A network failure detection apparatus comprising:
前記応答時間評価値算出部は、取得した複数の応答時間を主成分分析し、主成分分析により各応答時間の計測時刻毎に得られる値を計測時刻の応答時間評価値として算出する
ことを特徴とする請求項1記載のネットワーク障害検出装置。
The response time evaluation value calculation unit performs a principal component analysis on the obtained plurality of response times, and calculates a value obtained for each measurement time of each response time by the principal component analysis as a response time evaluation value of the measurement time. The network failure detection apparatus according to claim 1.
前記応答時間評価値算出部は、各応答時間の計測時刻毎に計測時刻を含んだ所定長の計測期間に対応する1つ以上の応答時間を応答時間系列として抽出し、各計測時刻の応答時間系列を並べた行列を時系列波形行列として生成し、生成した時系列波形行列を用いて主成分分析を行う
ことを特徴とする請求項2記載のネットワーク障害検出装置。
The response time evaluation value calculation unit extracts, as a response time series, one or more response times corresponding to a predetermined measurement period including the measurement time for each measurement time of each response time, and the response time of each measurement time 3. The network failure detection apparatus according to claim 2, wherein a matrix in which series are arranged is generated as a time series waveform matrix, and principal component analysis is performed using the generated time series waveform matrix.
前記重み付け評価値算出部は、各測定時刻のリソース使用量に基づいて各リソース使用量の測定時刻毎にリソース使用量の大きさに応じた値を測定時刻の重み付け値として算出し、各計測時刻の応答時間評価値と各測定時刻の重み付け値とに基づいて計測時刻毎に応答時間評価値が大きいほど大きく計測時刻に対応する測定時刻のリソース使用量が多いほど小さい値を計測時刻の重み付け評価値として算出する
ことを特徴とする請求項1から請求項3いずれかに記載のネットワーク障害検出装置。
The weighted evaluation value calculation unit calculates a value corresponding to the magnitude of the resource usage for each measurement time of each resource usage based on the resource usage at each measurement time as a weighting value of the measurement time, Based on the response time evaluation value of each measurement time and the weighted value of each measurement time, the larger the response time evaluation value for each measurement time, the larger the resource usage of the measurement time corresponding to the measurement time, the smaller the smaller the value. The network failure detection apparatus according to claim 1, wherein the network failure detection apparatus calculates the value as a value.
前記重み付け評価値算出部は、各測定時刻のリソース使用量に基づいて0または1を出力する0−1関数を用いて各リソース使用量の測定時刻毎に測定時刻の重み付け値を算出し、算出した測定時刻の重み付け値に基づいて重み付け値の測定時刻に対応する計測時刻の応答時間評価値を重み付け値で減算した値を計測時刻の重み付け評価値として算出する
ことを特徴とする請求項4記載のネットワーク障害検出装置。
The weighted evaluation value calculation unit calculates and calculates a weighted value of the measurement time for each measurement time of each resource usage using a 0-1 function that outputs 0 or 1 based on the resource usage at each measurement time. 5. The value obtained by subtracting the response time evaluation value of the measurement time corresponding to the measurement time of the weight value by the weight value based on the weighted value of the measured time is calculated as the weighted evaluation value of the measurement time. Network failure detection device.
前記重み付け評価値算出部は、各測定時刻のリソース使用量に基づいて窓関数を用いて各リソース使用量の測定時刻毎に測定時刻の重み付け値を算出し、算出した測定時刻の重み付け値に基づいて重み付け値の測定時刻に対応する計測時刻の応答時間評価値を重み付け値で減算した値を計測時刻の重み付け評価値として算出する
ことを特徴とする請求項4記載のネットワーク障害検出装置。
The weighted evaluation value calculation unit calculates a weighting value of the measurement time for each measurement time of each resource usage amount using a window function based on the resource usage amount of each measurement time, and based on the calculated weighting value of the measurement time 5. The network failure detection apparatus according to claim 4, wherein a value obtained by subtracting the response time evaluation value at the measurement time corresponding to the measurement time of the weight value by the weight value is calculated as the weight evaluation value at the measurement time.
前記端末装置分類部は、端末装置の複数の組み合わせを生成し、生成した組み合わせ毎に重み付け評価値の相関度を表す評価値相関値を算出し、算出した評価値相関値に基づいて複数の端末装置を複数の端末装置グループに分類する
ことを特徴とする請求項1から請求項6いずれかに記載のネットワーク障害検出装置。
The terminal device classifying unit generates a plurality of combinations of terminal devices, calculates an evaluation value correlation value representing a degree of correlation of weighted evaluation values for each generated combination, and a plurality of terminals based on the calculated evaluation value correlation values 7. The network failure detection device according to claim 1, wherein the device is classified into a plurality of terminal device groups.
前記ネットワーク障害検出装置は、さらに、
端末装置グループ毎に端末装置グループに属する端末装置を示す端末装置分類データを記憶する端末装置分類データ記憶部を備え、
前記端末装置分類部は、各端末装置の重み付け評価値を用いてK−means法により前記端末装置分類データを更新することにより、複数の端末装置を複数の端末装置グループに分類する
ことを特徴とする請求項1から請求項6いずれかに記載のネットワーク障害検出装置。
The network failure detection device further includes:
A terminal device classification data storage unit for storing terminal device classification data indicating terminal devices belonging to the terminal device group for each terminal device group;
The terminal device classification unit classifies a plurality of terminal devices into a plurality of terminal device groups by updating the terminal device classification data by a K-means method using a weighted evaluation value of each terminal device. The network failure detection device according to any one of claims 1 to 6.
前記ネットワーク評価値選択部は、前記重み付け評価値記憶部から各計測時刻の重み付け評価値を端末装置毎に取得し、取得した各計測時刻の重み付け評価値に基づいて計測時刻毎に計測時刻を含んだ所定長の対象期間に対応する1つ以上の重み付け評価値を評価値系列として抽出し、抽出した評価値系列に基づいて重み付け評価値の分布を表す関数を計測時刻の確率密度関数として算出し、各端末装置の確率密度関数に基づいて端末装置グループの確率密度関数を算出し、算出した端末装置グループの確率密度関数が表す分布内の重み付け評価値を前記ネットワーク評価値として選択する
ことを特徴とする請求項1から請求項8いずれかに記載のネットワーク障害検出装置。
The network evaluation value selection unit acquires a weighted evaluation value at each measurement time for each terminal device from the weighted evaluation value storage unit, and includes a measurement time for each measurement time based on the acquired weighted evaluation value at each measurement time. One or more weighted evaluation values corresponding to a target period of a predetermined length are extracted as an evaluation value series, and a function representing a distribution of weighted evaluation values is calculated as a probability density function of measurement time based on the extracted evaluation value series. Calculating a probability density function of the terminal device group based on the probability density function of each terminal device, and selecting a weighted evaluation value in a distribution represented by the calculated probability density function of the terminal device group as the network evaluation value. The network failure detection apparatus according to any one of claims 1 to 8.
前記ネットワーク評価値選択部は、分布量が最も多い重み付け評価値を前記ネットワーク評価値として選択する
ことを特徴とする請求項9記載のネットワーク障害検出装置。
The network failure detection apparatus according to claim 9, wherein the network evaluation value selection unit selects a weighted evaluation value having the largest distribution amount as the network evaluation value.
応答データを要求する応答要求データをネットワークに接続する複数の端末装置へ送信して前記応答要求データを送信してから前記応答データを受信するまでの時間として異なる計測時刻に計測された複数の応答時間と前記複数の応答時間を計測した複数の計測時刻とを対応付けて端末装置毎に記憶する応答時間記憶部と、各端末装置で異なる測定時刻に測定された複数のリソース使用量と前記複数のリソース使用量を測定した複数の測定時刻とを対応付けて端末装置毎に記憶するリソース使用量記憶部と、過去の計測時刻を示す複数の過去時刻と各過去時刻のネットワーク評価値とを対応付けて端末装置グループ毎に記憶するネットワーク評価値記憶部と、前記ネットワークに発生した障害を示す障害内容と前記障害が発生した時刻を示す障害時刻とを対応付けたネットワーク障害データを記憶するネットワーク障害データ記憶部とを備えるネットワーク障害検出装置のネットワーク障害検出方法において、
応答時間評価値算出部は、前記応答時間記憶部から複数の応答時間を端末装置毎に取得し、取得した複数の応答時間に基づいて各応答時間の計測時刻毎に当該応答時間の長さに応じた値を計測時刻の応答時間評価値として算出し、
応答時間評価値記憶部は、前記応答時間評価値算出部によって算出された各計測時刻の応答時間評価値を端末装置毎に記憶し、
重み付け評価値算出部は、前記応答時間評価値記憶部から各計測時刻の応答時間評価値を端末装置毎に取得し、前記リソース使用量記憶部から各測定時刻のリソース使用量を端末装置毎に取得し、取得した各計測時刻の応答時間評価値と各測定時刻のリソース使用量とに基づいて計測時刻毎に応答時間評価値が大きいほど大きく計測時刻に対応する測定時刻のリソース使用量が多いほど小さい値を計測時刻の重み付け評価値として算出し、
重み付け評価値記憶部は、前記重み付け評価値算出部によって算出された各計測時刻の重み付け評価値を端末装置毎に記憶し、
端末装置分類部は、前記重み付け評価値記憶部に記憶された各端末装置の重み付け評価値に基づいて、前記複数の端末装置を1つ以上の端末装置から成る複数の端末装置グループに分類し、
ネットワーク評価値選択部は、前記端末装置分類部による分類結果に基づいて端末装置グループ毎に端末装置グループに属する各端末装置の重み付け評価値を前記重み付け評価値記憶部から取得し、取得した各端末装置の重み付け評価値に基づいて端末装置グループの重み付け評価値の分布を計測時刻毎に算出し、算出した重み付け評価値の分布に基づいて分布内の重み付け評価値を端末装置グループのネットワーク評価値として計測時刻毎に選択し、
相関時間帯判定部は、前記ネットワーク評価値選択部によって端末装置グループ毎に選択された各計測時刻のネットワーク評価値と前記ネットワーク評価値記憶部に端末装置グループ毎に記憶された各過去時刻のネットワーク評価値とに基づいて各計測時刻のネットワーク評価値とネットワーク評価値の相関度が高い過去の時間帯を相関時間帯として端末装置グループ毎に判定し、
検出結果出力部は、前記ネットワーク障害データ記憶部に記憶されたネットワーク障害データと前記相関時間帯判定部によって端末装置グループ毎に判定された相関時間帯とに基づいて端末装置グループ毎に相関時間帯に対応する障害時刻を前記ネットワーク障害データから検索し、当該障害時刻に対応する障害内容を前記ネットワーク障害データから取得し、取得した障害内容と当該端末装置グループを表すグループ情報とを対応付けて出力する
ことを特徴とするネットワーク障害検出装置のネットワーク障害検出方法。
A plurality of responses measured at different measurement times as a time from when the response request data is transmitted to the plurality of terminal devices connected to the network and the response request data is transmitted until the response data is received. A response time storage unit that associates a time with a plurality of measurement times at which the plurality of response times are measured, and stores the same for each terminal device, a plurality of resource usages measured at different measurement times at each terminal device, and the plurality of times A resource usage storage unit that associates and stores a plurality of measurement times for measuring resource usage for each terminal device, a plurality of past times indicating past measurement times, and a network evaluation value of each past time A network evaluation value storage unit for storing each terminal device group, a failure content indicating a failure that has occurred in the network, and a time at which the failure has occurred In the network failure detection method of network failure detection system and a network fault data storing unit for storing a network failure data that associates harm time,
The response time evaluation value calculation unit acquires a plurality of response times for each terminal device from the response time storage unit, and sets the length of the response time for each measurement time of each response time based on the acquired plurality of response times. The corresponding value is calculated as the response time evaluation value of the measurement time,
The response time evaluation value storage unit stores the response time evaluation value at each measurement time calculated by the response time evaluation value calculation unit for each terminal device,
The weighted evaluation value calculation unit obtains a response time evaluation value at each measurement time for each terminal device from the response time evaluation value storage unit, and obtains a resource usage at each measurement time from the resource usage storage unit for each terminal device. The larger the response time evaluation value for each measurement time based on the obtained response time evaluation value at each measurement time and the resource usage at each measurement time, the larger the resource usage at the measurement time corresponding to the measurement time. Calculate the smaller value as the weighted evaluation value of the measurement time,
The weighted evaluation value storage unit stores the weighted evaluation value at each measurement time calculated by the weighted evaluation value calculation unit for each terminal device,
The terminal device classification unit classifies the plurality of terminal devices into a plurality of terminal device groups including one or more terminal devices based on the weighted evaluation value of each terminal device stored in the weighted evaluation value storage unit,
The network evaluation value selection unit acquires the weighted evaluation value of each terminal device belonging to the terminal device group for each terminal device group from the weighted evaluation value storage unit based on the classification result by the terminal device classification unit, and acquires each terminal Based on the weighted evaluation value of the device, the distribution of the weighted evaluation value of the terminal device group is calculated for each measurement time, and based on the calculated distribution of the weighted evaluation value, the weighted evaluation value in the distribution is used as the network evaluation value of the terminal device group Select every measurement time,
The correlation time zone determination unit includes a network evaluation value at each measurement time selected for each terminal device group by the network evaluation value selection unit, and a network at each past time stored for each terminal device group in the network evaluation value storage unit. Based on the evaluation value, the network evaluation value at each measurement time and the past time zone where the degree of correlation between the network evaluation value is high are determined for each terminal device group as a correlation time zone,
The detection result output unit includes a correlation time zone for each terminal device group based on the network failure data stored in the network failure data storage unit and the correlation time zone determined for each terminal device group by the correlation time zone determination unit. The failure time corresponding to the failure time is searched from the network failure data, the failure content corresponding to the failure time is acquired from the network failure data, and the acquired failure content is associated with the group information representing the terminal device group and output. A network failure detection method for a network failure detection apparatus.
応答データを要求する応答要求データをネットワークに接続する複数の端末装置へ送信して前記応答要求データを送信してから前記応答データを受信するまでの時間として異なる計測時刻に計測された複数の応答時間と前記複数の応答時間を計測した複数の計測時刻とを対応付けて端末装置毎に記憶する応答時間記憶部と、各端末装置で異なる測定時刻に測定された複数のリソース使用量と前記複数のリソース使用量を測定した複数の測定時刻とを対応付けて端末装置毎に記憶するリソース使用量記憶部と、過去の計測時刻を示す複数の過去時刻と各過去時刻のネットワーク評価値とを対応付けて端末装置グループ毎に記憶するネットワーク評価値記憶部と、前記ネットワークに発生した障害を示す障害内容と前記障害が発生した時刻を示す障害時刻とを対応付けたネットワーク障害データを記憶するネットワーク障害データ記憶部とを備えるネットワーク障害検出装置を機能させるネットワーク障害検出プログラムにおいて、
前記応答時間記憶部から複数の応答時間を端末装置毎に取得し、取得した複数の応答時間に基づいて各応答時間の計測時刻毎に当該応答時間の長さに応じた値を計測時刻の応答時間評価値として算出する応答時間評価値算出部と、
前記応答時間評価値算出部によって算出された各計測時刻の応答時間評価値を端末装置毎に記憶する応答時間評価値記憶部と、
前記応答時間評価値記憶部から各計測時刻の応答時間評価値を端末装置毎に取得し、前記リソース使用量記憶部から各測定時刻のリソース使用量を端末装置毎に取得し、取得した各計測時刻の応答時間評価値と各測定時刻のリソース使用量とに基づいて計測時刻毎に応答時間評価値が大きいほど大きく計測時刻に対応する測定時刻のリソース使用量が多いほど小さい値を計測時刻の重み付け評価値として算出する重み付け評価値算出部と、
前記重み付け評価値算出部によって算出された各計測時刻の重み付け評価値を端末装置毎に記憶する重み付け評価値記憶部と、
前記重み付け評価値記憶部に記憶された各端末装置の重み付け評価値に基づいて、前記複数の端末装置を1つ以上の端末装置から成る複数の端末装置グループに分類する端末装置分類部と、
前記端末装置分類部による分類結果に基づいて端末装置グループ毎に端末装置グループに属する各端末装置の重み付け評価値を前記重み付け評価値記憶部から取得し、取得した各端末装置の重み付け評価値に基づいて端末装置グループの重み付け評価値の分布を計測時刻毎に算出し、算出した重み付け評価値の分布に基づいて分布内の重み付け評価値を端末装置グループのネットワーク評価値として計測時刻毎に選択するネットワーク評価値選択部と、
前記ネットワーク評価値選択部によって端末装置グループ毎に選択された各計測時刻のネットワーク評価値と前記ネットワーク評価値記憶部に端末装置グループ毎に記憶された各過去時刻のネットワーク評価値とに基づいて各計測時刻のネットワーク評価値とネットワーク評価値の相関度が高い過去の時間帯を相関時間帯として端末装置グループ毎に判定する相関時間帯判定部と、
前記ネットワーク障害データ記憶部に記憶されたネットワーク障害データと前記相関時間帯判定部によって端末装置グループ毎に判定された相関時間帯とに基づいて端末装置グループ毎に相関時間帯に対応する障害時刻を前記ネットワーク障害データから検索し、当該障害時刻に対応する障害内容を前記ネットワーク障害データから取得し、取得した障害内容と当該端末装置グループを表すグループ情報とを対応付けて出力する検出結果出力部として
ネットワーク障害検出装置を機能させることを特徴とするネットワーク障害検出プログラム。
A plurality of responses measured at different measurement times as a time from when the response request data is transmitted to the plurality of terminal devices connected to the network and the response request data is transmitted until the response data is received. A response time storage unit that associates a time with a plurality of measurement times at which the plurality of response times are measured, and stores the same for each terminal device, a plurality of resource usages measured at different measurement times at each terminal device, and the plurality of times A resource usage storage unit that associates and stores a plurality of measurement times for measuring resource usage for each terminal device, a plurality of past times indicating past measurement times, and a network evaluation value of each past time A network evaluation value storage unit for storing each terminal device group, a failure content indicating a failure that has occurred in the network, and a time at which the failure has occurred In the network failure detection a program that causes a network failure detection system and a network fault data storing unit for storing a network failure data that associates harm time,
A plurality of response times are acquired for each terminal device from the response time storage unit, and a value corresponding to the length of the response time is measured for each response time based on the acquired response times. A response time evaluation value calculation unit for calculating as a time evaluation value;
A response time evaluation value storage unit that stores, for each terminal device, a response time evaluation value at each measurement time calculated by the response time evaluation value calculation unit;
The response time evaluation value at each measurement time is acquired for each terminal device from the response time evaluation value storage unit, and the resource usage at each measurement time is acquired for each terminal device from the resource usage storage unit, and each measurement acquired Based on the response time evaluation value of the time and the resource usage at each measurement time, the larger the response time evaluation value for each measurement time, the larger the smaller the value of the measurement time. A weighted evaluation value calculating unit that calculates the weighted evaluation value;
A weighted evaluation value storage unit that stores a weighted evaluation value of each measurement time calculated by the weighted evaluation value calculation unit for each terminal device;
A terminal device classifying unit that classifies the plurality of terminal devices into a plurality of terminal device groups composed of one or more terminal devices based on the weighted evaluation value of each terminal device stored in the weighted evaluation value storage unit;
Based on the classification result by the terminal device classification unit, the weighted evaluation value of each terminal device belonging to the terminal device group is obtained for each terminal device group from the weighted evaluation value storage unit, and based on the obtained weighted evaluation value of each terminal device Calculating a distribution of weighted evaluation values of the terminal device group at each measurement time, and selecting a weighted evaluation value in the distribution as a network evaluation value of the terminal device group at each measurement time based on the calculated distribution of weighted evaluation values An evaluation value selection unit;
Based on the network evaluation value at each measurement time selected for each terminal device group by the network evaluation value selection unit and the network evaluation value at each past time stored for each terminal device group in the network evaluation value storage unit. A correlation time zone determination unit that determines, for each terminal device group, a past time zone in which the correlation between the network evaluation value of the measurement time and the network evaluation value is high, as a correlation time zone;
Based on the network failure data stored in the network failure data storage unit and the correlation time zone determined for each terminal device group by the correlation time zone determination unit, the failure time corresponding to the correlation time zone is determined for each terminal device group. As a detection result output unit that searches from the network failure data, acquires the failure content corresponding to the failure time from the network failure data, and outputs the acquired failure content in association with the group information representing the terminal device group A network failure detection program for causing a network failure detection device to function.
JP2011048517A 2011-03-07 2011-03-07 Network fault detection apparatus, network fault detection method of network fault detection apparatus, and network fault detection program Withdrawn JP2012186667A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011048517A JP2012186667A (en) 2011-03-07 2011-03-07 Network fault detection apparatus, network fault detection method of network fault detection apparatus, and network fault detection program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011048517A JP2012186667A (en) 2011-03-07 2011-03-07 Network fault detection apparatus, network fault detection method of network fault detection apparatus, and network fault detection program

Publications (1)

Publication Number Publication Date
JP2012186667A true JP2012186667A (en) 2012-09-27

Family

ID=47016337

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011048517A Withdrawn JP2012186667A (en) 2011-03-07 2011-03-07 Network fault detection apparatus, network fault detection method of network fault detection apparatus, and network fault detection program

Country Status (1)

Country Link
JP (1) JP2012186667A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014099777A (en) * 2012-11-15 2014-05-29 Hitachi Ltd Network abnormality detection system, measuring device and analyzer
JP2014192873A (en) * 2013-03-28 2014-10-06 Nec Corp Network management device, network management system, network management method and program
JP2017053804A (en) * 2015-09-11 2017-03-16 株式会社東芝 Stochastic weather prediction device, stochastic weather prediction method and program
GB2542830A (en) * 2015-09-30 2017-04-05 British Telecomm Analysis of network performance
US10129128B2 (en) 2015-09-30 2018-11-13 British Telecommunications Public Limited Company Analysis of network performance
US10484902B2 (en) 2017-05-19 2019-11-19 Fujitsu Limited Communication apparatus, data processing system, and communication method
US11784902B2 (en) 2019-07-10 2023-10-10 Panasonic Intellectual Property Management Co., Ltd. Network management device, network management system and network management method

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014099777A (en) * 2012-11-15 2014-05-29 Hitachi Ltd Network abnormality detection system, measuring device and analyzer
JP2014192873A (en) * 2013-03-28 2014-10-06 Nec Corp Network management device, network management system, network management method and program
JP2017053804A (en) * 2015-09-11 2017-03-16 株式会社東芝 Stochastic weather prediction device, stochastic weather prediction method and program
GB2542830A (en) * 2015-09-30 2017-04-05 British Telecomm Analysis of network performance
GB2542830B (en) * 2015-09-30 2017-11-01 British Telecomm Analysis of network performance
US10129128B2 (en) 2015-09-30 2018-11-13 British Telecommunications Public Limited Company Analysis of network performance
US10484902B2 (en) 2017-05-19 2019-11-19 Fujitsu Limited Communication apparatus, data processing system, and communication method
US11784902B2 (en) 2019-07-10 2023-10-10 Panasonic Intellectual Property Management Co., Ltd. Network management device, network management system and network management method

Similar Documents

Publication Publication Date Title
CN107171819B (en) Network fault diagnosis method and device
JP2012186667A (en) Network fault detection apparatus, network fault detection method of network fault detection apparatus, and network fault detection program
US20190204818A1 (en) Data collection system, abnormality detection method, and gateway device
JP6097889B2 (en) Monitoring system, monitoring device, and inspection device
US20170277727A1 (en) Identification of distinguishing compound features extracted from real time data streams
JP2017126363A (en) Operation management device, operation management method, and program
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
CN107124289B (en) Weblog time alignment method, device and host
JP6079243B2 (en) Failure analysis support device, failure analysis support method, and program
JP2011015253A (en) Communication traffic classification method and apparatus, and program
JP6572795B2 (en) Analysis apparatus and analysis program
CN111078513A (en) Log processing method, device, equipment, storage medium and log alarm system
US9235463B2 (en) Device and method for fault management of smart device
JP2009217382A (en) Failure analysis system, failure analysis method, failure analysis server, and failure analysis program
JP2016099938A (en) Event analysis system and method
CN108880838B (en) Service fault monitoring method and device, computer equipment and readable medium
JP2004348640A (en) Method and system for managing network
JP5979185B2 (en) Operation management apparatus, operation management system, information processing method, and operation management program
JP2018014000A (en) Test support program, test support system, and test support method
JP6168209B2 (en) Operation management apparatus, operation management system, information processing method, and operation management program
JP5397192B2 (en) Message classification attribute selection device, message classification attribute selection program, and message classification attribute selection method
CN114297034A (en) Cloud platform monitoring method and cloud platform
US20230336409A1 (en) Combination rules creation device, method and program
JP4934660B2 (en) Communication bandwidth calculation method, apparatus, and traffic management method
CN115552380A (en) Performance event troubleshooting system

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140513