JP5825599B2 - 品質劣化要因推定装置及び方法 - Google Patents

品質劣化要因推定装置及び方法 Download PDF

Info

Publication number
JP5825599B2
JP5825599B2 JP2012190987A JP2012190987A JP5825599B2 JP 5825599 B2 JP5825599 B2 JP 5825599B2 JP 2012190987 A JP2012190987 A JP 2012190987A JP 2012190987 A JP2012190987 A JP 2012190987A JP 5825599 B2 JP5825599 B2 JP 5825599B2
Authority
JP
Japan
Prior art keywords
causal
quality
quality degradation
observation
estimating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012190987A
Other languages
English (en)
Other versions
JP2014049921A (ja
Inventor
石橋 圭介
圭介 石橋
昌平 清水
昌平 清水
竜也 田代
竜也 田代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Osaka University NUC
Original Assignee
Nippon Telegraph and Telephone Corp
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Osaka University NUC filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012190987A priority Critical patent/JP5825599B2/ja
Publication of JP2014049921A publication Critical patent/JP2014049921A/ja
Application granted granted Critical
Publication of JP5825599B2 publication Critical patent/JP5825599B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、品質劣化要因推定装置及び方法に係り、特に、ネットワークサービスの品質が劣化した場合にその要因を特定するための品質劣化要因推定装置及び方法に関する。
近年、ネットワークサービスに対する信頼性の要求が高まっている一方で、ネットワークサービスを提供するネットワーク、サービスの大規模化、構成の複雑化のため、一旦障害、品質劣化が発生した場合の要因特定および復旧が困難となっており、品質劣化要因特定の自動化による障害対応迅速化が求められている。
このような課題に対し、ネットワークサービス品質劣化時の自動要因特定として、予めサーバ、ネットワークの構成情報を取得し、機器からの観測変数間の因果関係を手動で生成しておき、いったん品質劣化が発生した場合は予め生成された因果関係をさかのぼって要因を特定する手法(以下、第1の従来技術と記す)が提案されている(例えば、非特許文献1参照)。
構成情報によらず,複数サーバの依存関係を同一時間ウィンドウ内のトラヒック同時生起関係によってイベント相関モデルとしてあらかじめ生成しておき,品質劣化発生イベント発生時に同モデルによって要因特定する手法(以下、第2の従来技術と記す)が提案されている(例えば、非特許文献2,3参照)。
一般的に因果関係を特定するためには、イベントの時間順序関係によって判断することが一般的である。すなわち品質劣化の発生時刻以前に通常と異なる挙動を示す観測変数を要因として特徴とする方式(以下、第3の従来技術と記す)が提案されている。
He Yan, Lee Breslau, Zihui Ge, Daniel Massey, Dan Pei, Jennifer Yates: G-RCA: a generic root cause analysis platform for service quality management in large IP networks. CoNEXT 2010: 5 Haifeng Chen, Guofei Jiang, Kenji Yoshihira: Monitoring High-Dimensional Data for Failure Detection and Localization in Large-Scale Computing Systems. IEEE Trans. Knowl. Data Eng. 20(1): 13-25 (2008) Paramvir Bahl, Ranveer Chandra, Albert G. Greenberg, Srikanth Kandula, David A. Maltz, Ming Zhang: Towards highly reliable enterprise network services via inference of multi-level dependencies. SIGCOMM 2007: 13-24
しかし、上記の第1の従来技術では、大規模・複雑化したネットワークに対して,すべてのサービスの因果関係を事前に生成することは事実上不可能であるという課題があった。
また、上記第2の従来技術は、あくまで相関モデルであり、因果モデルでない。従って相関があるイベントのどちらが要因かを本モデルから特定することはできず、要因として発生イベントを最も少ない変数で説明できる変数群を要因として推定するという経験的な法則に依存していた。
また、上記第3の従来技術は、トラヒック増大による過負荷による品質劣化など、要因と品質劣化がほぼ同時に発生する場合、観測データのみから時間順序を同定できず、因果を推定することができない。
本発明は、上記の点に鑑みなされたもので、原因と結果が同時に生起した場合でも(時間順序を同定しなくても)、観測値間の因果を推定することによって品質劣化発生時における要因を特定することが可能な品質劣化要因推定装置及び方法を提供することを目的とする。
上記の課題を解決するため、本発明(請求項1)は、ネットワークサービス品質劣化時にその要因を推定する品質劣化要因推定装置であって、
ネットワークサービスの品質、トラヒック、サーバ負荷を観測し、観測された観測値を記憶手段に格納する観測変数測定手段と、
前記記憶手段から前記観測変数測定手段で得られた前記観測値が予め定められた品質閾値より劣化した場合、および時系列変化を検出した場合を、品質劣化発生として検出する品質劣化検出手段と、
前記品質劣化検出手段で品質劣化を検出した場合、前記観測変数測定手段で得られた前記観測値のペアに対して互いに回帰分析残差の独立性検定を行い、残差が独立となる回帰が因果関係であると推定し、該因果関係の最も上位に推論された観測値を、品質劣化要因として推定する因果推論手段と、を有し、
前記因果推論手段は、品質劣化発生時における観測値との相関係数が、予め定められた閾値を上回る観測値群を相関クラスタとして抽出し、当該相関クラスタを対象に因果関係を推定する手段を含む
また、本発明(請求項)は、前記因果推論手段において、
質劣化期間の観測値を対象に因果関係を推定する手段を含む。
また、本発明(請求項)は、前記因果推論手段において、
パラメータを前記観測値から推定可能な非線形関数を用いて非線形回帰分析を実行することにより因果推論を行う手段を含む。
上述のように、本発明によれば、時間順序を用いることなく、観測変数間の因果を推定することによって品質劣化発生時における要因を特定することができる。
本発明の一実施の形態における品質劣化容易印推定装置の構成図である。 本発明の一実施の形態における因果推定の概念図である。 本発明の一実施の形態における相関クラスタ観測変数の概念図である。
以下、図面と共に本発明の実施の形態を説明する。
図1は、本発明の一実施の形態における品質劣化要因推定装置の構成を示す。
同図に示す品質劣化要因推定装置100は、観測変数測定部110、品質劣化検出部120、因果推論部130から構成され、それぞれメモリ(図示せず)を有するものとする。
観測変数測定部110は、ネットワークサービスに関わる各種数値(観測値)を計測する。具体的にはネットワークサービスのレスポンス時間やスループット等の品質、ネットワークのトラヒック量、CPUサーバやメモリ使用量、ディスク使用量などのネットワーク、サーバ機器負荷を計測し、メモリ(図示せず)に格納する。品質計測においては疑似クライアント端末3からサービスを試験的に利用して品質を計測してもよいし、トラヒックを観測して実際のユーザのクライアント端末群2におけるサービス利用状況から計測してもよい。観測トラヒックからの品質計測については、例えば特開2012-39324号公報に示される技術が適用可能である。トラヒックについては実際にネットワークを転送されるパケットを取得し、トラヒック量を算出してもよいし、ネットワーク機器が具備するSNMP(Simple Network Management Protocol)、NetFlow、sFlow等のトラヒック情報出力機能を利用してもよい。ネットワークサービス提供サーバ群1やネットワーク機器の負荷は、それら機器が具備するSNMPなどの負荷情報出力機能を利用する。さらに観測変数測定部110は、これら得られた観測値を一定時間間隔毎の時系列データとしてメモリ(図示せず)に格納する。
品質劣化検出部120は、上記観測変数測定部110で得られた観測値から品質の劣化を検出し、検出データをメモリ(図示せず)に格納する。品質劣化検出部120は、予め定められた品質閾値より劣化した、すなわちレスポンス時間が閾値を上回った、もしくはスループットが閾値を下回ったという事象を品質劣化として検出してもよいし、また、観測変数測定部110で得られた時系列データから統計的に正常範囲を学習しておき、当該範囲を逸脱した場合に品質劣化を検出して検出してもよい。統計的な異常検出手法については、例えば、文献1「原田薫明,川原亮一,森達哉,上山憲昭,廣川裕,山本公洋,"異常トラヒック発生検出および終了判定手法,"信学技報,Vol.106, no.420,IN2006‐133, pp.115‐120, 2006年12月.」の手法が適用可能である。
因果推論部130は、上記品質劣化検出部120で検出された品質時系列データとその他観測変数群の因果関係を、上記観測変数測定部110のメモリ(図示せず)のデータから推定する。因果関係の推定にあたっては、文献2「S. Shimizu, T. Inazumi, Y. Sogawa, A. Hyv¨arinen, Y. Kawahara, T. Washio, P. O. Hoyer, and K. Bollen. DirectLiNGAM: A direct method for learning a linear non-Gaussian structural equation model. Journal of Machine Learning Research, 12:1225-1248, April 2011.」に記載の方式を用いる。
以下、同方式に基づく因果推定を相関クラスタの観測値がX,Yの二つの場合で概説する。図2に因果推定の概念図を示す。X,Yは例えば、トラヒック観測量の時系列データ、品質観測量の時系列データを示す。 3変数以上の場合は、それらから2変数のペアを抽出し、2変数間の因果推定を繰り返し、他のすべての変数に対して原因となる変数を要因として特定すればよい。
ここで、Xが原因であり、Yが結果であるとし、Y は式(1)に従って生成されているものとする(以下、説明を簡単にするため、 X、Yの分散が1に基準化されているとする)。
Y=aX+e 式(1)
ここでaは係数であり、eは外乱ノイズである。本方式ではeに非ガウス性(ガウス分布に従わないこと)、かつXと独立であることを要請する。このとき、YをXで式(2)によって線形回帰したとする。
Y=cov(X,Y)/var(X)*X 式(2)
このとき、corr(X,Y) ≒ aであり、回帰残差であるX-a*Y = (1-a^2) x - a*eはXとYの関係が通常は決定論的でないため、つまりa=corr(X,Y)=1 or -1でないため、必ずXを含む。そして、式(1)でわかる通り、 XはYの生成変数であるため、回帰残差はYと独立でない。このように、回帰残差と説明変数の独立性を比較することによって、回帰の方向と因果の方向が一致しているか否かの検定が可能であり、従って因果順序の推定が可能となる。独立性の検定方法は種々あるが、文献2では相互情報量を用いた検定方法を提案している。
上記因果推論技術を用いた品質劣化要因手法は、品質劣化発生した観測値を含む他のすべての変数に対して原因となる変数を品質劣化要因として特定する。
以下に、因果推論部130の上記以外の因果関係推定手法について説明する。
観測値の数が膨大な場合、上記因果推定をすべての観測変数ペアに対して実施すると計算時間がかかるために実施困難となる場合があり得る。因果関係が存在する場合、一般的には相関関係が存在し、かつ相関係数の計算は簡易に行えるため、因果推論部130では、まず相関関係の有無によって因果関係の可能性がある観測変数を洗い出すことによって計算時間を短縮する。具体的には上記品質劣化検出部120が検出した変数と他の観測変数の相関係数を、予め定められた時間区間の観測値を用いて計算し、相関係数が予め定められた閾値以上となる観測変数群を相関クラスタとして抽出し、抽出した観測値のみを対象に因果推定を実施する(請求項2,6)。図3に相関クラスタ観測変数の概念図を示す。
また、品質劣化期間の観測品質観測変数値を対象に因果関係を推定する方法がある。
変数ペアによっては式(1)で示される線形関係ではなく、非線形の関係になっている可能性もある。例えば、サーバに対する入力トラヒック量とレスポンス時間の関係は線形でなく、入力トラヒック量がサーバ処理能力に近づくにつれて急激にレスポンス時間が劣化する非線形関係となっている。因果推論部130では、そのような場合に対応して、非線形回帰分析による因果推定を行う(請求項4,8)。具体的な非線形関数としては、例えば式(3)で示されるシグモイド関数がある。
f(x) = L +M/(1+exp(-ax)) 式(3)
シグモイド関数を用いた非線形回帰分析は下記の通りである。
Yを従属変数、Xを説明変数とすると、シグモイド関数の逆関数
Figure 0005825599
によって従属変数Yを
Figure 0005825599
変換し、その上でY'とXに関して線形回帰分析を行う。ここでMはYの絶対値の最大値、LはYの最小値によって推定する。その後線形回帰分析と同様に残差と説明変数の独立性検定によって因果推論を行えばよい。
なお、上記の図1に示す品質劣化要因推定装置の各構成要素の動作をプログラムとして構築し、品質劣化推定装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
1 ネットワークサービス提供サーバ群
2 クライアント端末群
3 擬似クライアント端末群
100 品質劣化要因推定装置
110 観測変数測定部
120 品質劣化検出部
130 因果推論部

Claims (6)

  1. ネットワークサービス品質劣化時にその要因を推定する品質劣化要因推定装置であって、
    ネットワークサービスの品質、トラヒック、サーバ負荷を観測し、観測された観測値を記憶手段に格納する観測変数測定手段と、
    前記記憶手段から前記観測変数測定手段で得られた前記観測値が予め定められた品質閾値より劣化した場合、および時系列変化を検出した場合を、品質劣化発生として検出する品質劣化検出手段と、
    前記品質劣化検出手段で品質劣化を検出した場合、前記観測変数測定手段で得られた前記観測値のペアに対して互いに回帰分析残差の独立性検定を行い、残差が独立となる回帰が因果関係であると推定し、該因果関係の最も上位に推論された観測値を、品質劣化要因として推定する因果推論手段と、
    を有し、
    前記因果推論手段は、品質劣化発生時における観測値との相関係数が、予め定められた閾値を上回る観測値群を相関クラスタとして抽出し、当該相関クラスタを対象に因果関係を推定する手段を含むことを特徴とする品質劣化要因推定装置。
  2. 前記因果推論手段は、
    質劣化期間の観測値を対象に因果関係を推定する手段を含む
    請求項記載の品質劣化要因推定装置。
  3. 前記因果推論手段は、
    パラメータを前記観測値から推定可能な非線形関数を用いて非線形回帰分析を実行することにより因果推論を行う手段を含む
    請求項1記載の品質劣化要因推定装置。
  4. ネットワークサービス品質劣化時にその要因を推定する品質劣化要因推定方法であって、
    記憶手段、観測変数測定手段、品質劣化検出手段、因果推論手段を有する装置において、
    前記観測変数測定手段が、ネットワークサービスの品質、トラヒック、サーバ負荷を観測し、観測された観測値を記憶手段に格納する観測変数測定ステップと、
    前記品質劣化検出手段が、前記記憶手段から前記観測変数測定ステップで得られた前記観測値が予め定められた品質閾値より劣化した場合、および時系列変化を検出した場合を、品質劣化発生として検出する品質劣化検出ステップと、
    前記因果推論手段が、前記品質劣化検出ステップで品質劣化を検出した場合、前記観測変数測定ステップで得られた前記観測値のペアに対して互いに回帰分析残差の独立性検定を行い、残差が独立となる回帰が因果関係であると推定し、該因果関係の最も上位に推論された観測値を、品質劣化要因として推定する因果推論ステップと、
    を行い、
    前記因果推論ステップにおいて、品質劣化発生時における観測値との相関係数が、予め定められた閾値を上回る観測値群を相関クラスタとして抽出し、当該相関クラスタを対象に因果関係を推定することを特徴とする品質劣化要因推定方法。
  5. 前記因果推論ステップにおいて、
    質劣化期間の観測値を対象に因果関係を推定する
    請求項記載の品質劣化要因推定方法。
  6. 前記因果推論ステップにおいて、
    パラメータを前記観測値から推定可能な非線形関数を用いて非線形回帰分析を実行することにより因果推論を行う
    請求項記載の品質劣化要因推定方法。
JP2012190987A 2012-08-31 2012-08-31 品質劣化要因推定装置及び方法 Expired - Fee Related JP5825599B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012190987A JP5825599B2 (ja) 2012-08-31 2012-08-31 品質劣化要因推定装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012190987A JP5825599B2 (ja) 2012-08-31 2012-08-31 品質劣化要因推定装置及び方法

Publications (2)

Publication Number Publication Date
JP2014049921A JP2014049921A (ja) 2014-03-17
JP5825599B2 true JP5825599B2 (ja) 2015-12-02

Family

ID=50609178

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012190987A Expired - Fee Related JP5825599B2 (ja) 2012-08-31 2012-08-31 品質劣化要因推定装置及び方法

Country Status (1)

Country Link
JP (1) JP5825599B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018167826A1 (ja) * 2017-03-13 2018-09-20 三菱電機株式会社 因果関係評価装置、因果関係評価システムおよび因果関係評価方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004145536A (ja) * 2002-10-23 2004-05-20 Hitachi Ltd 管理システム
JP4688831B2 (ja) * 2007-03-09 2011-05-25 東日本電信電話株式会社 通信状態分析装置

Also Published As

Publication number Publication date
JP2014049921A (ja) 2014-03-17

Similar Documents

Publication Publication Date Title
JP6160673B2 (ja) 運用管理装置、運用管理方法、及びプログラム
JP6823501B2 (ja) 異常検知装置、異常検知方法及びプログラム
Xie et al. Using Bayesian networks for cyber security analysis
JP4594869B2 (ja) 状態監視装置
JP5767617B2 (ja) ネットワーク障害検出システムおよびネットワーク障害検出装置
US8719636B2 (en) Apparatus method, and storage medium for fault cause extraction utilizing performance values
CN112162878A (zh) 数据库故障发现方法、装置、电子设备及存储介质
US20210081270A1 (en) Adaptive, self-tuning virtual sensing system for cyber-attack neutralization
US20170294112A1 (en) Alarm causality templates for network function virtualization
US20160283307A1 (en) Monitoring system, monitoring device, and test device
Lin et al. Automated anomaly detection and root cause analysis in virtualized cloud infrastructures
US20190164067A1 (en) Method and device for monitoring a process of generating metric data for predicting anomalies
JP2018148350A (ja) 閾値決定装置、閾値決定方法及びプログラム
CN113676360B (zh) 基于格兰杰因果关系检验与图相似技术的链路图修复方法
US20210084056A1 (en) Replacing virtual sensors with physical data after cyber-attack neutralization
JP5825599B2 (ja) 品質劣化要因推定装置及び方法
Gonzalez et al. SLA success probability assessment in networks with correlated failures
JP6954379B2 (ja) 異常箇所特定装置、異常箇所特定方法及びプログラム
Kushnir et al. Causality inference for failures in NFV
Ikeuchi et al. Root-cause diagnosis using logs generated by user actions
Lei et al. Fault location identification for localized intermittent connection problems on CAN networks
Ra A Comparative Analysis on the Performance of Finite Failure NHPP Software Reliability Model Based on Rayleigh-type Lifetime Distribut ion
JP6781776B2 (ja) 特徴量生成装置、特徴量生成方法及びプログラム
Gogunska et al. Tuning optimal traffic measurement parameters in virtual networks with machine learning
US9311210B1 (en) Methods and apparatus for fault detection

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20140623

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151005

R150 Certificate of patent or registration of utility model

Ref document number: 5825599

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees