JP6200076B2 - システムから取得される測定値を評価する方法及びシステム - Google Patents

システムから取得される測定値を評価する方法及びシステム Download PDF

Info

Publication number
JP6200076B2
JP6200076B2 JP2016517418A JP2016517418A JP6200076B2 JP 6200076 B2 JP6200076 B2 JP 6200076B2 JP 2016517418 A JP2016517418 A JP 2016517418A JP 2016517418 A JP2016517418 A JP 2016517418A JP 6200076 B2 JP6200076 B2 JP 6200076B2
Authority
JP
Japan
Prior art keywords
value
forming
function
score
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016517418A
Other languages
English (en)
Other versions
JP2016537702A5 (ja
JP2016537702A (ja
Inventor
ローライン,ベルンハルト
ロスハンデール,メーラン
ケータプダル,ハーメット
シュスラー,マーティン
シャヒン,タジーク
Original Assignee
ドイッチェ テレコム アーゲー
ドイッチェ テレコム アーゲー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドイッチェ テレコム アーゲー, ドイッチェ テレコム アーゲー filed Critical ドイッチェ テレコム アーゲー
Publication of JP2016537702A publication Critical patent/JP2016537702A/ja
Publication of JP2016537702A5 publication Critical patent/JP2016537702A5/ja
Application granted granted Critical
Publication of JP6200076B2 publication Critical patent/JP6200076B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Description

本発明は、エラーのない状態又はエラーのある状態の場合があるシステムSから取得される測定値を評価する方法及びシステムに関する。このシステムは、少なくとも1つの通信ネットワーク、通信システムのネットワーク構成要素、及び/又は通信ネットワークのサービスを備える。
異常な又は非正常な測定値、いわゆる外れ値を検出する分野において、従来技術には、異常な又は非正常な測定値を見つける多数の方法が含まれている。非正常な測定値を見つけることは、「外れ値検出」と呼ばれるか、又は「異常検出」とも呼ばれる。
例えば、非特許文献1では、外れ値検出の使用は、データマイニングの分野における主要なステップのうちの1つとして説明されている。非特許文献1では、用いられる推定のロバスト性が特に注目され、距離測定、クラスター方法、及び空間的方法に基づく外れ値検出の様々な可能性が示されている。
非特許文献2では、外れ値検出の意味が、様々な応用分野及び科学分野の重要な問題として論述されている。
これらの従来技術から知られている外れ値検出方法は、先ず基本的な前提及び要件の観点が異なる。外れ値検出について、幾つかの方法は、基礎を成す分布及びそれらのパラメーターを必要とし、システムSは、これらによって測定値を生成する。さらに、「局所的外れ値確率アルゴリズム(Local Outlier Probability Algorithm)」(LoOP、非特許文献3)によって、「局所的外れ値度アルゴリズム(Local Outlier Factor Algorithm)」(LOF、非特許文献4)又は関連アルゴリズムに関係した確率値を計算する方法もある。
さらに、非特許文献5は、外れ値検出の任意の所望のスコア関数の出力として、スコア値に基づく確率値、すなわち[0,1]の区間にある値に関する変換を得る方法を開示している。この確率値は、集合Vからの測定値が、測定値の基礎を成す集合に対して外れ値である確率を示す。これらの確率は、外れ値である可能性が非常に高いものを含むリストを作成することに用いられる。
特許文献1は、機能的なトレンドライン外れ値バイアスを低減するデータフィルタリングのシステム及び方法に関するものである。
外れ値を検出する従来の方法では、正常な閾値又は制限値が用いられる。例えば、そのような閾値又は制限値の上又は下では、測定値を外れ値又は正常な測定値とみなすことができることを検出することが可能である。
閾値の使用は、そのような閾値を大部分、複雑な試験及び評価によって検出しなければならない点で不利である。さらに、測定値の大部分から非常に大きく逸脱しているが、Sの正常なシステム状態に属する集合Vからの測定値は、システムの状態を判断する割り当てられた確率に従って、それらの測定値を学習集合に入力する可能性もないままに、閾値の使用によってフィルタリング除去される。
米国特許出願公開第2013/046727号
Irad Ben Gal「Outlier detection」, in: Maimon O. and Rockach L. (Eds.)「Data Mining and Knowledge Discovery Handbook: A Complete Guide for Practitioners and Researchers」 Kluwer Academic Publishers, 2005 Varun Chandola, Arindam Banerjee, Vipin Kumar「Outlier Detection: A Survey」, 2007, (http://citeseerx.ist.psu.edu/viewdoc/summary?doi=l0.1.1.108.8502) Hans Peter Kriegel, P. Kroeger, E. Schubert, A. Zimek「LoOP: Local Outlier Probabilities」, in Proceedings of 18th ACM Conference on Information and Knowledge Management (CIKM), 2009 (http://www.dbs.ifi.1mu.de/Publikationen/Papers/LoOP1649.pdf). M. M. Breunig, Hans Peter Kriegel, R.T. Ng, J. Sander「LOF: Identifying Density-based Local Outliers」, in ACM SIGMOD Record. No. 29, 2000, (http://www.dbs.ifi.lmu.de/Publikationen/Papers/LOF.pdf) Hans Peter Kriegel, Peer Kroeger, Erich Schubert, Arthur Zimek「Interpreting and Unifying Outlier Scores」, in Proceedings of 11th SIAM International Conference on Data Mining. 2011, (http://siam.omnibooksonline.com/2011datamining/data/papers/018.pdf).
本発明の目的は、エラーのない状態/正常な状態又はエラーのある状態/非正常な状態の場合があるシステムSから取得される測定値を評価する方法及びシステムを提供することである。
この目的は、独立請求項の特徴によって達成される。従属請求項は、本発明の好ましい実施の形態に関係している。
本発明は、好ましくは機械学習システムL又は統計的学習システムLが、監視されるシステムSからの無標示の測定値vに基づいて測定値を自動的に評価することができるという基本的なアイデアから出発している。非正常な測定値は、システムSがエラーのある状態にあることを示すことができる。無標示は、測定値の観点から、測定値が取得された時点でシステムSがエラーのない状態/エラーのある状態のいずれの状態にあるのかの情報がないことを意味する。
学習システムの使用に先立って、システムSのエラーのある状態に起因する可能性が非常に高い測定値を、測定値の学習集合Vから削除するランダム化された方法/ランダムベースの方法が提供される。したがって、そのような測定値が、学習されたモデルMが、その後の新たな測定値wを評価するときに、システムSのエラーのある状態を正常であると誤って評価するという旨の悪影響を学習システムLの学習プロセスに与えることが防止される。他方、そのような値は、学習システムの学習プロセスには価値があり、可能な場合には(完全に)削除されるべきでないことが知見として考慮される。これに関連して、本発明は、Vが、V内の他の測定値と比較して異常な値を有するが、システムSのエラーのある状態で検出されておらず、したがって、正常であるとみなされるべきである測定値を含む可能性があることを考慮に入れる。
本発明は、エラーのない/正常状態又はエラーのある/非正常状態の場合があるシステムSから取得される測定値を評価する方法に関する。システムSは、少なくとも1つの通信ネットワーク、通信システムのネットワーク構成要素、及び/又は通信ネットワークのサービスを備え、本方法は、好ましくは以下の順序で、以下のステップ、すなわち、(a)システムSからの無標示の測定値vの集合Vを形成するステップと、(b)ランダムベースの方法を用いた集合Vからの測定値の削除及び/又は重み付けによって、学習システムLの測定値v’を含む修正学習集合V’を形成するステップと、(c)システムSからの測定値を評価するモデルMを、学習システムLによって修正学習集合V’から形成するステップと、(d)システムSからの測定値を、モデルMを用いて評価システムBによって評価するステップとを含む。
システムSは、エラーのない/正常な状態及びエラーのある/非正常な状態の2つのシステム状態を有するシステムとすることができる。ただし、本方法は、異なるシステム状態、例えば複数のシステム状態を有する他のシステムSにも適用することができる。
本発明によれば、それぞれの測定値が、システムSがエラーのある状態にある時に測定されたのか又はエラーのない状態にある時に測定されたのかについての信頼できる情報は、システムSの無標示の測定値vを考慮すると、存在する必要はない。測定値は、測定システムSにおいて取得され、システム状態のインジケーターとすることができる。種々のタイプの測定値が存在する場合、測定値のタイプについての情報も、それぞれの測定値に割り当てることができる。測定値が時系列である場合、測定の時点についての情報を、個々の測定値vについて集合Vに追加して割り当てることができる。
本発明の一実施形態によれば、ステップ(b)は、好ましくは以下の順序で、以下のステップ、すなわち、(b1)スコア値qを含むスコア値集合Qを、少なくとも1つのスコア関数F:V→Q,
Figure 0006200076
によって、集合Vから形成するステップと、(b2)確率pを含む確率集合Pを、少なくとも1つの変換関数T:Q→P,
Figure 0006200076
によって、スコア値集合Qから形成するステップと、(b3)修正学習集合V’を測定値から形成するステップとを含み、測定値v∈Vは、p=T(F(v))である1−pのそれぞれの確率で修正学習集合V’内に含められ、及び/又は測定値v∈Vは、少なくとも1つの重み関数Gによってそれぞれの重みを与えられる。
スコア関数Fは、集合Vからの個々の各測定値のスコア値、又は測定値の部分集合のスコア値、例えば、異なるタイプの測定値の場合には、或る時点又は或る特定の段階における測定値の部分集合のスコア値を学習集合Vから形成することができる。一般性を制限することなく、スコア値は実数とすることができる。例えば、低いスコア値は、エラーのない測定値と関連付けることができ、高いスコア値は、エラーのある測定値と関連付けることができる。
変換関数Tは、スコア値に、例えば実数、確率値、例えば[0,1]の区間内の実数を割り当てることができる。例えば、T(v)=0を有する測定値vは、確率0で集合Vから削除することができない。すなわち、修正学習集合V’に安全に移すことができるか又は留まることができる。これとは対照的に、T(v)=1を有する測定値vは、確率1で集合Vから削除することができる。すなわち、学習集合V’に移すことも留まることもできない。
重み関数Gは、測定値vの各確率pの重みを計算することができる。確率pは、Tによって求められる。関連した測定値vの重みは、学習プロセス中/V’への導入中に測定値vを重み付けすべき値を表すことができる。例えば、高い重みを有する測定値は、モデルMに対して相対的に大きな影響を有することができる。この重み関数は、G(p)=1−pによって定義することもできる。
関数F、関数T、及び関数Gは、個々の測定値v及び測定値の集合Vの双方について定義することができる。
本発明の更なる実施の形態によれば、本方法は、システムSがエラーのない状態にあるのか又はエラーのある状態にあるのかを判断するステップを更に含む。
さらに、システムSからの無標示の測定値wの別の集合Wについて、例えば、後の時点において、システムSがそれぞれの時点においてエラーのない状態にあるのか又はエラーのある状態にあるのかを判断することが可能である。この判断は、学習されたモデルM及び/又は評価システムBによって行うことができる。
本発明の更なる実施の形態によれば、スコア関数Fは、スコア値の出力を有する独立した、好ましくは機械学習システムL’及び機械評価システムB’とすることができる。さらに、スコア関数Fは、k最近傍及び/又は四分位間乗率(interquartile multiplying factor)及び/又は局所的外れ値を考慮に入れることによって形成することができる。さらに、スコア関数Fは、集合Vからの測定値vごとに、最も近い近傍までの距離、すなわち、測定値vの最小距離d(v)を形成し、この最小距離をVからの全ての測定値vの平均距離mによって除算し、次の式、すなわち、F:V→Q,
Figure 0006200076
が当てはまるようにすることができる。さらに、変換関数Tは、好ましくは、全ての
Figure 0006200076
について0≦T(x)≦1、特に好ましくは、正規分布、ワイブル分布、ベータ分布、又は連続等分布を有する連続増加関数とすることができる。重み関数Gは、G(p)=1−p=1−T(F(v))として定義することができる。
変換関数Tの連続増加関数は、好ましくは、T(−∞)≧0及びT(+∞)≦1を有するとともに、全ての
Figure 0006200076
について特性0≦T(x)≦1を有することができる。
さらに、測定値の基礎を成す分布を知ることなく動作することができるアルゴリズムをスコア関数Fに用いることができる。スコア関数Fは、局所的外れ値度アルゴリズム又は局所的外れ値確率アルゴリズムも有することができる。
本発明の更なる実施の形態によれば、ステップ(b1)〜(b3)は、反復的に連続して数回実行することができる。
ステップ(b1)〜(b3)を反復的に数回連続して実行することによって、スコア関数Fと、変換関数Tと、Vからの測定値のランダム削除及び/又はVからの測定値の重み付けとを数回連続して適用することができる。
本発明の更なる実施の形態によれば、集合Vを、ステップ(a)において、
Figure 0006200076
である部分集合V_1,...,V_Nに分割することができ、ステップ(b)において、
Figure 0006200076
である修正学習部分集合V_1’,...,V_N’を形成することができ、これらの修正学習部分集合V_1’,...,V_N’から学習集合V’を組み合わせることができる。
したがって、(b1)において、少なくとも1つのスコア関数Fによって、
Figure 0006200076
である対応するスコア値集合Q_1,...,Q_Nも部分集合V_1,...,V_Nから形成することができる。さらに、(b2)において、少なくとも1つの変換関数Tによって、
Figure 0006200076
である対応する確率集合P_1,...,P_Nを、対応するスコア値集合Q_1,...,Q_Nから形成することができる。
本発明の更なる実施の形態によれば、ステップ(b)において、測定値vの削除及び/又は重み付けの間に、測定値vの少なくとも1つの最も近い近傍も集合Vから削除することができる。測定値vの最も近い近傍の削除は、値及び/又は時間の基準に従って実行することができる。例えば、測定値vに匹敵する値を有する最も近い近傍又は測定値vに非常に接近した最も近い近傍を削除することができる。さらに、例えば、最も近い近傍は、測定値に対するその時間的な近さに従って選択することができる。例えば、最も近い近傍は、実際に削除される測定値と同時に又はこの測定値の前後の或る制限時間内に測定されていた可能性がある。
本発明の更なる実施の形態によれば、測定値は、計算ユニットの稼働率、用いられている記憶空間及び空き記憶空間、入力チャネル及び出力チャネルの稼働率及び状態、エラーのないパケット又はエラーのあるパケットの数、送信キューの長さ、エラーのないサービス問い合わせ及びエラーのあるサービス問い合わせ、サービス問い合わせの処理時間を含む群から選択することができる。
本発明は、エラーのない状態又はエラーのある状態の場合があるシステムSから取得される測定値を評価するシステムにも関する。システムSは、少なくとも1つの通信ネットワーク、通信システムのネットワーク構成要素、及び/又は通信ネットワークのサービスを備え、本システムは、システムSからの無標示の測定値vの集合Vを形成するデバイスと、ランダムベースの方法を用いた集合Vからの測定値の削除及び/又は重み付けによって、学習システムLの測定値v’を含む修正学習集合V’を形成するデバイスと、システムSからの測定値を評価するモデルMを、修正学習集合V’から形成することに適した学習システムLと、システムSからの測定値を、モデルMを用いて評価することに適した評価システムBとを備える。
本発明の更なる実施の形態によれば、修正学習集合V’を形成するデバイスは、スコア値qを含むスコア値集合Qを、少なくとも1つのスコア関数F:V→Q,
Figure 0006200076
によって、集合Vから形成するデバイスと、確率pを含む確率集合Pを、少なくとも1つの変換関数T:Q→P,
Figure 0006200076
によって、スコア値集合Qから形成するデバイスとを備えることができる。
修正学習集合V’を形成するデバイスは、p=T(F(v))である1−pの対応する確率で測定値v∈Vを修正学習集合V’内に導入することによって、測定値から修正学習集合V’を形成することに適することができる。さらに、修正学習集合V’を形成するデバイスは、少なくとも1つの重み関数Gによって測定値v∈Vを重み付けすることによって、測定値から修正学習集合V’を形成することに適することができる。
本発明の更なる実施の形態によれば、システムSから取得される測定値を評価するシステムは、システムSがエラーのない状態にあるのか又はエラーのある状態にあるのかを判断するデバイスを更に備えることができる。
本発明の更なる実施の形態によれば、スコア値集合Qを形成するデバイスは、スコア値集合Qを数回形成することに適することができる。さらに、確率集合Pを形成するデバイスは、確率集合を数回形成することに適することができる。さらに、修正学習集合V’を形成するデバイスは、修正学習集合V’を数回形成することに適することができる。
本発明の更なる実施の形態によれば、システムSからの無標示の測定値vの集合Vを形成するデバイスは、集合Vを、
Figure 0006200076
である部分集合V_1,...,V_Nに分割することに適することができる。さらに、修正学習集合V’を形成するデバイスは、
Figure 0006200076
である修正学習部分集合V_1’,...,V_N’を形成し、これらの修正学習部分集合V_1’,...,V_N’から学習集合V’を組み合わせることに適することができる。
本発明の更なる実施の形態によれば、修正学習集合V’を形成するデバイスは、測定値vの削除及び/又は重み付けの間に集合Vからの測定値vの少なくとも1つの最も近い近傍も削除することに適することができる。
本発明は、閾値を必要とせず、その代わりに、ランダム化された方法/ランダムベースの方法を用いる、システムSから取得される測定値を評価する方法を提供する。ランダム化された方法/ランダムベースの方法を用いることによって、ユーザーは、複雑な試験及び評価によって閾値を求める必要がなく、また、測定値の大部分から非常に大きく逸脱しているが、Sの正常なシステム状態に属する集合Vからの測定値は、割り当てられた確率に従って、測定値の学習集合に含められる機会を有する。閾値を用いる方法では、この目的を達成することが困難又は不可能である。本発明による方法は、測定値の基礎を成す分布についての知識を必要としない。しかしながら、この知識は、それにもかかわらず、完全に又は部分的に存在する場合、スコア関数(複数の場合もある)F及び変換関数(複数の場合もある)Tの選択に用いることができる。従来技術の方法とは対照的に、本発明によれば、関数Tを用いてランダム化された方法によって計算された確率は、ランダム化された方法で学習集合を形成するのに用いられる。これに関して、現在の学習集合Vだけでなく、システムSからの測定値の可能な挙動もそれにも増して重要である可能性がある。計算された確率値は、外れ値を含むリストを作成することに(のみに)用いられず、元の学習集合Vからの縮小された学習集合V’を求めるランダム化方法において用いられる。
以下では、例及び図面に基づいて本発明をより詳細に説明する。
従来技術の従来の方法によるシステムから取得される測定値を評価する方法の概略図である。 本発明によるシステムから取得される測定値を評価する方法の好ましい実施形態の概略図である。 本発明によるシステムSから取得される測定値を評価するシステムの好ましい実施形態の概略図である。 本発明によるシステムから取得される測定値を評価する方法の好ましい実施形態の、変換関数として用いられるワイブル分布の概略図である。
図1は、従来技術によるシステムSから取得される測定値を評価する従来方法の概略図である。
システムS、例えばネットワークにおいて、測定値vの集合Vが取得される。この集合Vは、学習システムLの学習集合としての機能を果たすことになる。集合Vからの測定値vは無標示である。すなわち、測定値vがエラーを有するか否か、すなわち、測定値が取得されている間、システムSがエラーのある状態にあるか否かについての記載がなされていない可能性がある。
所定の閾値によって、学習システムLは、測定値の集合V又は測定値vを評価する。本場合には、閾値未満に位置する測定値vが、学習集合から削除され、それ以降考慮されることはない。このように求められた学習集合V’は、閾値よりも上の測定値vのみを含み、学習集合Lによって、モデルMを形成するのに用いられる。このモデルMは、学習された測定値の観点からエラーのないシステムSを表したものである。モデルMに基づくと、今後の新たな測定値wについて、システムSがそれらの新たな測定値wに関してエラーのある状態にあるか否かについての記載がなされることになる。
この目的のために、モデルMは、評価システムBを形成することに用いられる。次に、評価される測定値の新たな集合Wからの測定値wが、この評価システムBに供給される。その後、評価システムBは、測定値の集合Wからの測定値wを評価し、それによって、形成されたモデルMを考慮に入れ、測定値wがエラーを有するか否か、したがって、システムがエラーのある状態にあるか否かについての記載を行う。
図2は、本発明によるシステムSから取得される測定値を評価する方法の好ましい実施形態の概略図である。この好ましい実施形態においても、測定値vは、システムSにおいて取得され、学習集合として意図された測定値vの集合に組み合わされる。これらの測定値vにはスコア関数Fが適用され、したがって、スコア値qを含むスコア値の集合Qが形成される。次に、このスコア値集合Qに変換関数Tが適用され、したがって、確率pを含む確率集合Pが形成される。次に、ランダム選択によって、測定値の修正学習集合V’が形成される。測定値vは、1−pの対応する確率で修正学習集合V’内に含められる。測定値vには、適した重み関数Gによって、対応する重みも(又は重みのみを)与えることができ、したがって、全ての測定値v∈Vは、対応する重みとともに修正学習集合V’内に含められる。
次に、学習集合V’を用いることによって、学習システムLは、適したモデルMを形成し、このモデルMは、エラーのないシステムSを表したものである。
次に、このモデルMを用いることによって、評価システムBが形成される。システムから新たに取得された測定値w∈Wは、評価システムBに提供され、評価システムは、この新たな測定値w∈Wがエラーを有するのか又は正常であるのかを評価し、したがって、システムSがエラーを有する状態にあるのか又は正常な状態にあるのかを評価する。
図3は、本発明によるシステムSから取得される測定値を評価するシステムの好ましい実施形態の概略図である。システムSから取得される測定値を評価するシステム100は、システムSからの無標示の測定値vの集合Vを形成するデバイス110と、修正学習集合V’を形成するデバイス120と、学習システムL 130と、評価システムB 140と、システムSがエラーのある状態にあるのか否かを判断するデバイス150とを備える。
デバイス110は、システムSによって取得された測定値vを受け取り、これらの取得された測定値に基づいて、無標示の測定値vの集合Vを形成する。次に、測定値v’を含む修正学習集合V’が、以下のようにデバイス120において形成される。
デバイス121において、スコア値qを含むスコア値集合Qが、スコア関数Fによって、測定値vを含む集合Vから形成される。次に、デバイス121において、確率pを含む確率集合Pが、変換関数Tによって、スコア値qを含むスコア値集合Qから形成される。その後、デバイス120において、測定値vは、p=T(F(v))である1−pの対応する確率で修正学習集合V’内に含められる。したがって、修正学習集合V’は、最初に取得された集合Vのランダム化/ランダムベースの処置によって得られる。
次に、修正学習集合V’は、学習システムL 130において、システムSのモデルMを形成することに用いられる。このモデルMは、エラーのないシステムSを表したものである。
次に、このモデルMによって、評価されるシステムからの新たな測定値集合Wの測定値wがエラーを有するか否かが評価システムB 140において評価される。評価される測定値wを含む測定値集合Wも、デバイス110によって形成又は測定されている可能性がある。次に、システムSがエラーのない状態にあるのか又はエラーのある状態にあるのかが、デバイス150において、測定値wの評価に基づいて判断される。測定値wがエラーを有するか否か、又はシステムSがエラーのある状態にあるのか若しくはエラーのない状態にあるのかについて適宜判断された結果は、その後、それに応じて、例えば、更なるシステムにおいて更に処理することができる。
図4は、本発明によるシステムから取得される測定値を評価する方法の好ましい実施形態の、変換関数として用いられるワイブル分布の概略図である。現在説明している本発明の実施形態において、以下では、6つの測定値が、システムSにおいて特定の測定量(タイプ)について測定され、後に、学習システムLにおいて入力としての機能を果たすことになる。測定値vの測定値集合Vは、V=(101,102,1,100,103,105)である。
3番目の測定値v=1は、この測定値のリストにおいて外れ値である。しかしながら、学習システムLは、この外れ値がエラーのある測定値であるのか又はエラーのない測定値であるのか、及びこの外れ値がシステムSのエラーのある状態で測定されたのか又はエラーのない状態で測定されたのかを知らない。
学習システムLが、学習集合Vについて、モデルMとして、Vからの測定値の最小値及び最大値を形成していた場合、以下のことが適用される。
−測定値v=1を有する場合:最小値=1、最大値=105
−測定値v=1を有しない場合:最小値=100、最大値=105。
これらの最大値及び最小値が、モデルMとしてエラーのないシステムの記述に用いられた場合、本場合には、測定値1が追加されるか否かに応じて、2つの完全に異なる実現形態が達成される。最小値=1及び最大値=105の場合、新たな測定値の受け入れ範囲は、最小値=100及び最大値=105の場合よりも大きい。
第1の場合には、第2の場合よりも多くの測定値が正常に受け入れられる。
したがって、本発明による本例では、スコア関数F(v)として、むしろ、Vからの測定値vごとに、Vからの最も近い測定値までの距離を形成し、これらの距離をVからの全ての測定値の平均距離mによって除算する関数が用いられる。
d(v)は、他の全ての測定値からの測定値vの最小距離を意味する。したがって、以下のことが適用される。
Figure 0006200076
したがって、平均距離mは、この場合、以下のものとなる。
Figure 0006200076
スコア関数Fによって、次に、Vからの測定値のスコア値を以下のように計算することができる。
Figure 0006200076
本発明によれば、これらのスコア値は、次に、変換関数Tを用いて確率に変換される。本発明による例によれば、いわゆる形状パラメーターであるパラメーターk=2と、いわゆるスケールパラメーターであるパラメーターλ=2とを有するワイブル分布が変換関数として用いられる。
ワイブル分布Tは、以下のように定義される。
Figure 0006200076
ここで、「^」は累乗であり、exp()は指数関数である。
図3は、これらのパラメーターを用いた本発明によるワイブル分布を示している。
Tによって変換されたスコア値は、以下のとおりである。
Figure 0006200076
この時点で、計算された確率値に基づいて、個々の測定値が、ランダムに学習集合Vから削除されるか又は学習集合Vに保持される。
したがって、測定値101、102、100,103、105は、Vに保持される可能性が非常に高く、測定値1は削除される。修正学習集合V’は、したがって、以下の測定値を非常に高い可能性で含む。
Figure 0006200076
次に、学習集合V’を用いることによって、適したモデルMが形成され、その後、このモデルMを用いることによって、評価システムBが形成される。
次に、システムから新たに取得された測定値w∈Wを評価システムBに提供することができ、評価システムBは、この新たな測定値w∈Wがエラーを有するのか又は正常であるのか及びシステムSがそれに応じてエラーのある状態にあるのか又は正常な状態にあるのかを評価することができる。
本発明は、図に基づいて例示され、対応する説明に基づいて詳細に説明されているが、この例示及び詳細な説明は、例示及び例証として理解されるべきであり、本発明を限定するものと理解されるべきではない。当業者であれば、もちろん、添付の特許請求の範囲の範囲及び趣旨から逸脱することなく変更及び補正を行うことができる。特に、本発明は、様々な実施形態を考慮して、上記又は下記で言及又は図示している特徴の任意の組み合わせを含む実施形態も含む。
本発明は、図における個々の特徴が、それらの図において他の特徴と関係して示されている場合であっても、及び/又は上記及び下記において言及されていない場合であっても、これらの特徴も含む。さらに、図及び上記説明並びに個々の代替形態に記載された実施形態の代替形態並びにそれらの特徴は、本発明の主題及び/又は開示した主題から除外することができる。この開示は、特許請求の範囲及び/又は上記例に記載された特徴のみを含む実施形態だけなく、他の特徴を付加的に含むそのような実施形態も含む。

Claims (20)

  1. エラーのない状態又はエラーのある状態の場合があるシステムSから取得される測定値を評価する方法であって、前記システムSは、少なくとも1つの通信ネットワーク、通信システムのネットワーク構成要素、又は通信ネットワークのサービスを備え、該方法は、好ましくは以下の順序で、以下のステップ、すなわち、
    (a)前記システムSからの無標示の測定値vの集合Vを形成するステップと、
    (b)ランダムベースの方法を用いた前記集合Vからの測定値の(i)削除、又は(ii)重み付け、又は(iii)削除及び重み付けによって、学習システムLの測定値v’を含む修正学習集合V’を形成するステップと、
    (c)前記システムSからの測定値を評価するモデルMを、前記学習システムLによって前記修正学習集合V’から形成するステップと、
    (d)前記システムSからの測定値を、前記モデルMを用いて評価システムBによって評価するステップと、
    を含み、
    ステップ(b)において、前記集合Vからの測定値vの(i)削除、又は(ii)重み付け、又は(iii)削除及び重み付けの間に、前記測定値vの少なくとも1つの最も近い近傍が削除される、方法。
  2. ステップ(b)は、以下のステップ、すなわち、
    (b1)スコア値qを含むスコア値集合Qを、少なくとも1つのスコア関数F:V→Q,
    Figure 0006200076
    によって、前記集合Vから形成するステップと、
    (b2)確率pを含む確率集合Pを、少なくとも1つの変換関数T:Q→P,
    Figure 0006200076
    によって、前記スコア値集合Qから形成するステップと、
    (b3)前記修正学習集合V’を測定値から形成するステップと、
    を含み、
    前記測定値v∈Vは、p=T(F(v))である1−pのそれぞれの確率で前記修正学習集合V’内に含められるか、又は
    前記測定値v∈Vは、少なくとも1つの重み関数Gによってそれぞれの重みを与えられる、請求項1に記載の方法。
  3. ステップ(b)は、以下のステップ、すなわち、
    (b1)スコア値qを含むスコア値集合Qを、少なくとも1つのスコア関数F:V→Q,
    Figure 0006200076
    によって、前記集合Vから形成するステップと、
    (b2)確率pを含む確率集合Pを、少なくとも1つの変換関数T:Q→P,
    Figure 0006200076
    によって、前記スコア値集合Qから形成するステップと、
    (b3)前記修正学習集合V’を測定値から形成するステップと、
    を含み、
    前記測定値v∈Vは、p=T(F(v))である1−pのそれぞれの確率で前記修正学習集合V’内に含められ、かつ
    前記測定値v∈Vは、少なくとも1つの重み関数Gによってそれぞれの重みを与えられる、請求項1に記載の方法。
  4. 前記方法は、ステップ(b1)〜(b3)を前記言及した順序で含む、請求項2又は3に記載の方法。
  5. 前記スコア関数Fは、スコア値の出力を有する独立した学習システムL’及び評価システムB’を表すことができる、請求項2〜4のいずれか1項に記載の方法。
  6. 前記スコア関数Fは、スコア値の出力を有する独立した機械学習システムL’及び評価システムB’を表すことができる、請求項5に記載の方法。
  7. 前記スコア関数Fは、次のもの、すなわち、k最近傍、四分位間乗率、局所外れ値度のうちの1つ又は複数を考慮に入れることによって形成される、請求項2〜6のいずれか1項に記載の方法。
  8. 前記変換関数Tは連続増加関数である、請求項2〜7のいずれか1項に記載の方法。
  9. 前記変換関数Tは、全ての
    Figure 0006200076
    について、0≦T(x)≦1を有する連続増加関数である、請求項8に記載の方法。
  10. 前記変換関数Tは、正規分布、ワイブル分布、ベータ分布、又は連続等分布である、請求項8又は9に記載の方法。
  11. 前記重み関数Gは、G(p)=1−p=1−T(F(v))として定義される、請求項2〜10のいずれか1項に記載の方法。
  12. ステップ(b1)〜(b3)は、反復的に連続して数回実行される、請求項2〜11のいずれか1項に記載の方法。
  13. ステップ(a)において、前記集合Vは、
    Figure 0006200076
    である部分集合V_1,...,V_Nに分割され、
    ステップ(b)において、
    Figure 0006200076
    である修正学習部分集合V_1’,...,V_N’が形成され、前記修正学習集合V’は、前記修正学習部分集合V_1’,...,V_N’から組み合わされる、請求項1〜12のいずれか1項に記載の方法。
  14. 測定値は、計算ユニットの稼働率、用いられている記憶空間及び空き記憶空間、入力チャネル及び出力チャネルの稼働率及び状態、エラーのないパケット又はエラーのあるパケットの数、送信キューの長さ、エラーのないサービス問い合わせ及びエラーのあるサービス問い合わせ、サービス問い合わせの処理時間を含む群から選択される、請求項1〜13のいずれか1項に記載の方法。
  15. エラーのない状態又はエラーのある状態の場合があるシステムSから取得される測定値を評価するシステムであって、前記システムSは、少なくとも1つの通信ネットワーク、通信システムのネットワーク構成要素、又は通信ネットワークのサービスを備え、該システムは、
    前記システムSからの無標示の測定値vの集合Vを形成するデバイスと、
    ランダムベースの方法を用いた前記集合Vからの測定値の(i)削除、又は(ii)重み付け、又は(iii)削除及び重み付けによって、学習システムLの測定値v’を含む修正学習集合V’を形成するデバイスであって、前記(i)削除、又は(ii)重み付け、又は(iii)削除及び重み付けの間に、前記測定値vの少なくとも1つの最も近い近傍が削除される、デバイスと、
    前記システムSからの測定値を評価するモデルMを、前記修正学習集合V’から形成することに適した学習システムLと、
    前記システムSからの測定値を、前記モデルMを用いて評価することに適した評価システムBと、
    を備える、システム。
  16. 前記修正学習集合V’を形成するデバイスは、
    スコア値qを含むスコア値集合Qを、少なくとも1つのスコア関数F:V→Q,
    Figure 0006200076
    によって、前記集合Vから形成するデバイスと、
    確率pを有する確率集合Pを、少なくとも1つの変換関数T:Q→P,
    Figure 0006200076
    によって、前記スコア値集合Qから形成するデバイスと、
    を備え、
    前記修正学習集合V’を形成する前記デバイスは、p=T(F(v))である1−pの対応する確率で前記測定値v∈Vを前記修正学習集合V’内に導入するとともに、少なくとも1つの重み関数Gによって前記測定値v∈Vを重み付けすることによって、測定値の前記修正学習集合V’を形成することに適しており、
    修正学習集合V’を形成する前記デバイスは、測定値vの(i)削除、又は(ii)重み付け、又は(iii)削除及び重み付けの間に前記集合Vからの前記測定値vの少なくとも1つの最も近い近傍も削除することに適している、請求項15に記載のシステム。
  17. 前記修正学習集合V’を形成するデバイスは、
    スコア値qを含むスコア値集合Qを、少なくとも1つのスコア関数F:V→Q,
    Figure 0006200076
    によって、前記集合Vから形成するデバイスと、
    確率pを有する確率集合Pを、少なくとも1つの変換関数T:Q→P,
    Figure 0006200076
    によって、前記スコア値集合Qから形成するデバイスと、
    を備え、
    前記修正学習集合V’を形成するデバイスは、前記測定値v∈Vを、p=T(F(v))である1−pの対応する確率で前記修正学習集合V’内に導入するとともに、少なくとも1つの重み関数Gによって前記測定値v∈Vを重み付けすることによって、測定値の前記修正学習集合V’を形成することに適している、請求項15に記載のシステム。
  18. コア値集合Qを形成するデバイスは、前記スコア値集合Qを数回形成することに適しており
    率集合Pを形成するデバイスは、前記確率集合を数回形成することに適しており、
    前記修正学習集合V’を形成する前記デバイスは、前記修正学習集合V’を数回形成することに適している、請求項15〜17のいずれか1項に記載のシステム。
  19. 前記システムSからの無標示の測定値vの集合Vを形成する前記デバイスは、前記集合Vを、
    Figure 0006200076
    である部分集合V_1,...,V_Nに分割することに適しており、
    前記修正学習集合V’を形成するデバイスは、
    Figure 0006200076
    である修正学習部分集合V_1’,...,V_N’を形成し、該修正学習部分集合V_1’,...,V_N’から前記修正学習集合V’を組み合わせることに適している、請求項15〜18のいずれか1項に記載のシステム。
  20. 測定値は、計算ユニットの稼働率、用いられている記憶空間及び空き記憶空間、入力チャネル及び出力チャネルの稼働率及び状態、エラーのないパケット又はエラーのあるパケットの数、送信キューの長さ、エラーのないサービス問い合わせ及びエラーのあるサービス問い合わせ、サービス問い合わせの処理時間を含む群から選択される、請求項15〜19のいずれか1項に記載のシステム。
JP2016517418A 2013-09-27 2014-08-13 システムから取得される測定値を評価する方法及びシステム Active JP6200076B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP13186464.7 2013-09-27
EP13186464.7A EP2854045B1 (de) 2013-09-27 2013-09-27 Verfahren und System zum Bewerten von erhobenen Messwerten eines Systems
PCT/EP2014/067352 WO2015043823A1 (de) 2013-09-27 2014-08-13 Verfahren und system zum bewerten von erhobenen messwerten eines systems

Publications (3)

Publication Number Publication Date
JP2016537702A JP2016537702A (ja) 2016-12-01
JP2016537702A5 JP2016537702A5 (ja) 2017-01-12
JP6200076B2 true JP6200076B2 (ja) 2017-09-20

Family

ID=49303764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016517418A Active JP6200076B2 (ja) 2013-09-27 2014-08-13 システムから取得される測定値を評価する方法及びシステム

Country Status (7)

Country Link
US (1) US20160239753A1 (ja)
EP (1) EP2854045B1 (ja)
JP (1) JP6200076B2 (ja)
KR (1) KR101733708B1 (ja)
CN (1) CN105765563B (ja)
ES (1) ES2568052T3 (ja)
WO (1) WO2015043823A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268979B (zh) * 2018-02-01 2021-11-19 北京科技大学 一种基于演化模糊关联规则的中厚板质量预测方法
US11132403B2 (en) 2019-09-06 2021-09-28 Digital Asset Capital, Inc. Graph-manipulation based domain-specific execution environment
US10915578B1 (en) 2019-09-06 2021-02-09 Digital Asset Capital, Inc. Graph outcome determination in domain-specific execution environment
WO2022014916A1 (ko) * 2020-07-15 2022-01-20 한양대학교 에리카산학협력단 패킷전송 결정 장치 및 패킷전송 스케줄 결정 방법
US11429798B2 (en) * 2020-08-10 2022-08-30 Innolux Corporation Wireless tag location system and method thereof
JP7380654B2 (ja) * 2021-07-15 2023-11-15 株式会社豊田中央研究所 評価装置、評価システム、評価方法及びそのプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3832281B2 (ja) * 2001-06-27 2006-10-11 日本電気株式会社 外れ値ルール生成装置と外れ値検出装置、その外れ値ルール生成方法と外れ値検出方法及びそのプログラム
JP2005181928A (ja) * 2003-12-24 2005-07-07 Fuji Xerox Co Ltd 機械学習システム及び機械学習方法、並びにコンピュータ・プログラム
IL161217A (en) * 2004-04-01 2013-03-24 Cvidya 2010 Ltd Detection of outliers in communication networks
JP5186278B2 (ja) * 2008-05-14 2013-04-17 アズビル株式会社 外れ値検出方法、外れ値検出装置およびプログラム
EP2697695B1 (de) * 2011-06-03 2019-05-08 Siemens Aktiengesellschaft Verfahren zur rechnergestützten generierung eines datengetriebenen modells eines technischen systems, insbesondere einer gasturbine oder windturbine
US9069725B2 (en) * 2011-08-19 2015-06-30 Hartford Steam Boiler Inspection & Insurance Company Dynamic outlier bias reduction system and method
US9659250B2 (en) * 2011-08-31 2017-05-23 Hitachi Power Solutions Co., Ltd. Facility state monitoring method and device for same
CN102436542B (zh) * 2011-09-22 2015-11-04 河南中医学院 一种基于格拉布斯规则和矩阵实验室语言的药学测试数据中异常值的剔除方法
US9349103B2 (en) * 2012-01-09 2016-05-24 DecisionQ Corporation Application of machine learned Bayesian networks to detection of anomalies in complex systems

Also Published As

Publication number Publication date
US20160239753A1 (en) 2016-08-18
EP2854045A1 (de) 2015-04-01
KR101733708B1 (ko) 2017-05-10
EP2854045B1 (de) 2016-04-06
ES2568052T3 (es) 2016-04-27
WO2015043823A1 (de) 2015-04-02
CN105765563B (zh) 2018-06-12
CN105765563A (zh) 2016-07-13
KR20160058891A (ko) 2016-05-25
JP2016537702A (ja) 2016-12-01

Similar Documents

Publication Publication Date Title
JP6200076B2 (ja) システムから取得される測定値を評価する方法及びシステム
JP6571914B2 (ja) 情報の複数のドメインを組合せることによる仕事の実施データ内の異常の検知
US20190095300A1 (en) Anomaly diagnosis method and anomaly diagnosis apparatus
JP2021533474A (ja) ノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラム
JP6183450B2 (ja) システム分析装置、及び、システム分析方法
JPWO2013111560A1 (ja) 運用管理装置、運用管理方法、及びプログラム
JP7346176B2 (ja) データ系列の異常検出におけるビン分割された四分位数間範囲の分析のためのシステム及び方法
JP6636883B2 (ja) 評価装置、評価方法、および評価プログラム
JP5768983B2 (ja) 契約違反予測システム、契約違反予測方法および契約違反予測プログラム
JP2016095751A (ja) 異常機器特定プログラム、異常機器特定方法、及び、異常機器特定装置
KR20140068650A (ko) 중첩 커뮤니티 검출 방법
JPWO2014132611A1 (ja) システム分析装置、及び、システム分析方法
JPWO2018211721A1 (ja) 異常情報推定装置、異常情報推定方法及びプログラム
JP6658507B2 (ja) 負荷推定システム、情報処理装置、負荷推定方法、及び、コンピュータ・プログラム
JP6566049B2 (ja) 電力需要値算出システム、電力需要値算出方法および電力需要値算出プログラム
JPWO2019073512A1 (ja) システム分析方法、システム分析装置、および、プログラム
CN112597699B (zh) 一种融入客观赋权法的社交网络谣言源识别方法
US10372719B2 (en) Episode mining device, method and non-transitory computer readable medium of the same
Denysiuk et al. A new hybrid evolutionary multiobjective algorithm guided by descent directions
JP2014063617A (ja) 蓄電池の残存価値格付け装置およびプログラム
JP6835688B2 (ja) 分析管理システムおよび分析管理方法
US20140355866A1 (en) Method and apparatus for identifying root cause of defect using composite defect map
KR20190123030A (ko) 시스템의 다중 성능 최적화를 위한 효율적인 파레토 집합 선택 방법
JP6508202B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP7325557B2 (ja) 異常診断方法および異常診断装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161027

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161028

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20161028

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20161111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170824

R150 Certificate of patent or registration of utility model

Ref document number: 6200076

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250