WO2021245854A1 - モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム - Google Patents

モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム Download PDF

Info

Publication number
WO2021245854A1
WO2021245854A1 PCT/JP2020/022009 JP2020022009W WO2021245854A1 WO 2021245854 A1 WO2021245854 A1 WO 2021245854A1 JP 2020022009 W JP2020022009 W JP 2020022009W WO 2021245854 A1 WO2021245854 A1 WO 2021245854A1
Authority
WO
WIPO (PCT)
Prior art keywords
observation data
service
abnormality
model
communication network
Prior art date
Application number
PCT/JP2020/022009
Other languages
English (en)
French (fr)
Inventor
洋一 松尾
敬志郎 渡辺
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to JP2022529230A priority Critical patent/JP7414136B2/ja
Priority to PCT/JP2020/022009 priority patent/WO2021245854A1/ja
Priority to US17/927,027 priority patent/US11973658B2/en
Publication of WO2021245854A1 publication Critical patent/WO2021245854A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0853Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence

Definitions

  • the present invention relates to a model building device, an estimation device, a model building method, an estimation method, and a program.
  • Non-Patent Documents 1 to 3 A method of modeling by a network and estimating an abnormality location / factor from observation data at the time of abnormality has been proposed (Non-Patent Documents 1 to 3). As one of such methods, a rule-based method is known.
  • the rule-based method uses the knowledge of experts (for example, operators of communication network systems, etc.) to model the relationship between abnormal locations / factors and changes in observation data.
  • experts for example, operators of communication network systems, etc.
  • a rule that normality / abnormality of a router affects only the observation data of adjacent links is created from the knowledge of an expert, and this rule and the adjacency relationship in the topology of a communication network system are used.
  • Non-Patent Document 2 a proposal is made to facilitate the construction of a causal model by creating an abstract rule called a template.
  • Non-Patent Document 3 a group of devices that are the root of a certain VPN is extracted for a virtual communication network such as a VPN (Virtual Private Network), and the cause of the abnormality generated in the device group is described. It models the relationship between the equipment in which the abnormality occurred and the observation data.
  • VPN Virtual Private Network
  • the conventional method for estimating the abnormal location / factor could not be modeled in an integrated manner, including the relationship with multiple services provided by the communication network system.
  • One embodiment of the present invention has been made in view of the above points, and an object thereof is to construct a causal model for estimating an abnormality location / factor including an abnormality of a plurality of services provided by a communication network system. And.
  • the model building apparatus includes a first collecting unit that collects first observation data regarding a communication network system for which an abnormality location or an abnormality factor is estimated, and the communication network system.
  • a second collecting unit that collects the second observation data related to the plurality of services provided in the above, the first observation data, and the second observation data, the abnormality location or the abnormality factor and the plurality. It is characterized by having a model building unit for constructing a causal model for estimating an abnormal service among the services of the above.
  • a causal model is constructed from observation data in a communication network system, and an estimation device that estimates an abnormality location / factor of the communication network system and an abnormality of a plurality of services provided by the communication network system by this causal model. 10 will be described.
  • the estimation device 10 according to the present embodiment has a "model construction phase” in which a causal model is constructed from past observation data, and an abnormality location / factor (abnormality) from observation data when an abnormality occurs using this causal model.
  • the estimation device 10 in the model construction phase may be referred to as, for example, a "model construction device” or the like.
  • a communication network system is a system that realizes a communication network environment in which various devices (for example, routers, servers, etc.) are used as nodes and communication paths as links, and is called an ICT (Information and Communication Technology) system. May be good.
  • the Bayesian network when a causal model represented by a Bayesian network, which is one of the graphical models, is constructed, the Bayesian network is multi-layered, so that the equipment constituting the communication network system, anomalous factors, etc., and observation data are combined.
  • a causal model that expresses the integrated relationships including the relationships with multiple services provided by the communication network system. This makes it possible to estimate anomalous locations and factors (including services with anomalies) from observation data using this causal model. That is, it is possible to estimate an abnormal location or cause in a communication network system and a service having an abnormality among a plurality of services provided in the communication network system (hereinafter, also referred to as "abnormal service").
  • Examples of services provided on the communication network include VPN and various applications (for example, voice call service by VoIP (Voice over Internet Protocol), file transfer service, video distribution service, etc.).
  • the observation data j related to the communication network is information representing the state of the entire communication network system, and examples thereof include syslog and traffic information.
  • N x is the number of devices constituting the communication network system
  • M y is the number of observation data regarding the communication network.
  • Each x i and y j shall take a value of either 0 (normal state) or 1 (abnormal state). However, it is possible to take a multi-value of 3 or more values instead of a 2-value of 0 or 1, or it is possible to take a continuous value.
  • the observation data j related to the communication network includes, for example, references “Yasuhiro Ikeda, Keisuke Ishibashi, Yuusuke Nakano, Keishiro Watanabe, Ryoichi Kawahara,” Anomaly Detection and Interpretation using Multimodal Auto.
  • the factor degree described in “Optimization”, arXiv: 1812.07136 [stat.ML] may be used.
  • a threshold value is determined from the value of the observation data j in the normal state, and this threshold value is determined.
  • a value greater than or equal to (or less) and a observation data j in the state y j 1 may be 0 the value of the state y j of the other observation data j, it calculates the variance of the normal state of the observation data j, L (where, L is an arbitrary natural number which is previously determined) the value of the state y j of the observed data j deviating sigma above 1, the values of the state y j of the other observation data j may be 0.
  • the state of the service k provided by the communication network system is z k , k ⁇ ⁇ 1, ..., N z ⁇
  • the state of the observation data h related to the service is wh, h ⁇ ⁇ 1, ... , M w ⁇ .
  • the observation data h related to the service is information representing the state of the service provided by the communication network system, and examples thereof include log information related to the service.
  • Nz is the number of services provided by the communication network system
  • Mw is the number of observation data related to the services.
  • Each z k and w h shall take a value of either 0 (normal state) or 1 (abnormal state).
  • the state w h observation data h is service, for example, specific or calculated from the contents of the log information and the like (e.g., the value of the state w h when contained an error message or an error code or the like 1, otherwise It can be set to 0, etc.).
  • the probability P (y j state w h observation data h on the state y j and service observation data j when the state z k of the state x i and the service k equipment i related to the communication network is obtained, w h
  • the service provided by the communication network system communicates using the device included in the communication network system, if there is an abnormality in the device through which the packet related to the service k passes, the service k is also affected. There is, also, impact on the state w h of observation data h related to the service k comes out. Further, even if there is no abnormality in the device constituting the communication network system, if there is abnormality in the service k, it affects the state w h observation data h related to the service k exits. Therefore, the probability of these things P (x i, z k, y j, w h) can be formulated as follows.
  • the probability P (x i, z k, y j, w h) is, the conditional probability P (y j
  • the state x i and state z k and state y j and state w h as each node an example of a graphical model (Bayesian Network) representing the causal model in FIG.
  • This causal model gives the formulation shown in Equation 1 above.
  • Probability P (x i, z k, y j, w h)
  • the actual probability value can be defined in various ways, for example, predetermined constants ⁇ x, ⁇ z, ⁇ y , ⁇ w And ⁇ can be used to define as follows.
  • is a function that returns 1 if it is true, and 0 otherwise.
  • phi xy is a distribution representing the causal relationship x i and y j, if there is relation to the x i and y j the (i, j) th component is 1, otherwise the (i, j) th component is 0 it is a matrix of a N x ⁇ M y.
  • phi xz is a distribution representing the causal relationship x i and z k, if any relationship to the x i and z k (i, k) element is 1, otherwise (i, k) element Is a matrix of N x ⁇ N z where is 0.
  • is represented by the following.
  • phi Xzw is distribution representing the causal relationship x i and z k and w h, if any relationship to the x i and z k and w h (i, k, h ) elements 1, otherwise For example, it is a tensor of N x ⁇ N z ⁇ M w in which the (i, k, h) element is 0.
  • the probability P (x i, z k, y j, w h) it is possible to calculate the, can build a causal model, the observed data j related to the communication network state y j and observation data regarding the service
  • y j , w h ) of the state x i of the device i and the state z k of the service k when the state w h of h is obtained can be calculated from the causal model.
  • the prior probability P (y j, w h) can be calculated from the state w h observation data h on the state y j and service observation data j to a communication network.
  • FIG. 2 is a diagram showing an example of the functional configuration of the estimation device 10 according to the present embodiment.
  • the estimation device 10 includes a network data collection unit 101, a service data collection unit 102, a causal model construction unit 103, an estimation unit 104, a user interface unit 105, and a network. It has a data DB 201, a service data DB 202, and a causal model DB 203.
  • the network data collection unit 101 collects network configuration data and observation data related to the communication network from the communication network system.
  • the network configuration data and observation data collected by the network data collection unit 101 are stored in the network data DB 201.
  • the network configuration data is information representing the topology of the communication network (that is, information representing the connection relationship between the devices constituting the communication network system).
  • the device i, i ⁇ ⁇ 1, ..., N x ⁇ is specified by the network configuration data.
  • the service data collection unit 102 collects service-related data and observation data related to the service from the communication network system.
  • the service-related data and observation data collected by the service data collection unit 102 are stored in the service data DB 202.
  • the service-related data is information (for example, a service ID or the like) representing a service provided by a communication network system.
  • the service k, k ⁇ ⁇ 1, ..., N z ⁇ is specified by the service-related data.
  • the causal model construction unit 103 provides a causal model for calculating the posterior probability of the state of each device and the state of each service when the state of each observation data related to the communication network and the state of each observation data related to the service are obtained. To construct.
  • the causal model constructed by the causal model building unit 103 is stored in the causal model DB 203.
  • the estimation unit 104 estimates the abnormal location or the abnormal factor and the abnormal service of the communication network system by the causal model stored in the causal model DB 203.
  • the user interface unit 105 presents the estimation result (abnormal location or abnormal factor, abnormal service) estimated by the estimation unit 104 and its probability to the user (for example, an operator of a communication network system).
  • FIG. 3 is a flowchart showing an example of the causal model construction process according to the present embodiment.
  • the network configuration data and observation data collected by the network data collection unit 101 are stored in the network data DB 201, and the service-related data and observation data collected by the service data collection unit 102 are stored in the service data DB 202. It is assumed that it is stored in. Further, it is assumed that the value of the state y j of the observation data j collected by the network data collection unit 101 is calculated, and the observation data j and the state y j are associated and stored in the network data DB 201. ..
  • the observation data h collected by the service data collecting unit 102 is calculated or identified value of the condition w h, observation data h and its state w h is stored in the service data DB202 associated It shall be.
  • Step S101 The causal model construction unit 103 inputs the past observation data j and its state y j used for model construction and the network configuration data from the network data DB 201, and the past observation data h and its state used for model construction. and w h and service-related data input from the service data DB202.
  • Step S102 The causal model construction unit 103 uses the input observation data j and state y j and network configuration data and observed data h and the condition w h and service related data in step S101 described above, the probability P
  • This causal model is stored in the causal model DB 203.
  • the estimation device 10 has the relationship between the state x i of the device i constituting the communication network and the state y j of the observation data j, and the service provided by the communication network. and the relationship between state w h of observation data h related to the k state z k and services, and the relationship between state z k of service k and the state x i of equipment i associated with this service k, service k
  • a causal model representing the relationship between the state z k of the above and the state y j of the observation data j is constructed.
  • FIG. 4 is a flowchart showing an example of the abnormality location / factor estimation process according to the present embodiment.
  • the value of the state y j of the observation data j collected by the network data collection unit 101 is calculated, and the observation data j and the state y j are associated and stored in the network data DB 201. ..
  • the observation data h collected by the service data collecting unit 102 is calculated or identified value of the condition w h, observation data h and its state w h is stored in the service data DB202 associated It shall be.
  • Step S201 The estimation unit 104 inputs the observation data j used for estimating the abnormality location / factor (including the abnormality service), its state y j, and the network configuration data from the network data DB 201, and also inputs the abnormality location / factor (abnormality).
  • service inputs the observation data h and the condition w h used for estimation of including) and a service-related data from the service data DB 202.
  • the observation data j and the observation data h are, for example, observation data when some abnormality occurs in the communication network system or some abnormality occurs in the service provided by this communication network system. It is conceivable to input j and observation data h.
  • Step S202 Next, the estimation unit 104 uses a state w h states y j and observation data h observation data j input in step S201 described above, the abnormality by causal models stored in the causal model DB203 Estimate the location / factor or abnormal service. That is, the estimation unit 104, the posterior probability P from the causal model by Bayes' theorem (x i, z k
  • y j, w h) is equipment i (or factors i) corresponding to the x i If the maximum is abnormal portion (or abnormal factor) is estimated that, one z k in the posterior probability P (x i, z k
  • Step S203 The user interface unit 105 outputs the estimation result of step S202 (that is, the abnormality location / factor or the abnormality service and its probability) to a display or the like and presents it to the user.
  • the estimation device 10 can estimate the abnormality location / factor and the abnormality service by the causal model constructed in the model construction phase.
  • a user such as an operator of a communication network system monitors not only the abnormal location / factor of the communication network system but also a plurality of services in an integrated manner, and which service has an abnormality and which service is affected. It becomes possible to grasp whether or not it is out.
  • FIG. 5 is a diagram showing an example of the hardware configuration of the estimation device 10 according to the present embodiment.
  • the estimation device 10 is realized by a general computer or computer system, and includes an input device 301, a display device 302, an external I / F 303, a communication I / F 304, and a processor. It has a 305 and a memory device 306. Each of these hardware is connected so as to be communicable via the bus 307.
  • the input device 301 is, for example, a keyboard, a mouse, a touch panel, or the like.
  • the display device 302 is, for example, a display or the like.
  • the estimation device 10 does not have to have at least one of the input device 301 and the display device 302.
  • the external I / F 303 is an interface with an external device such as a recording medium 303a.
  • the estimation device 10 can read or write the recording medium 303a via the external I / F 303.
  • the recording medium 303a for example, one or more functional units (network data collection unit 101, service data collection unit 102, causal model construction unit 103, estimation unit 104, and user interface unit 105) included in the estimation device 10 are realized.
  • the program may be stored.
  • the recording medium 303a includes, for example, a CD (Compact Disc), a DVD (Digital Versatile Disk), an SD memory card (Secure Digital memory card), a USB (Universal Serial Bus) memory card, and the like.
  • the communication I / F 304 is an interface for connecting the estimation device 10 to the communication network.
  • One or more programs that realize each functional unit of the estimation device 10 may be acquired (downloaded) from a predetermined server device or the like via the communication I / F 304.
  • the processor 305 is, for example, various arithmetic units such as a CPU (Central Processing Unit). Each functional unit included in the estimation device 10 is realized, for example, by a process of causing the processor 305 to execute one or more programs stored in the memory device 306.
  • CPU Central Processing Unit
  • the memory device 306 is, for example, various storage devices such as HDD (Hard Disk Drive), SSD (Solid State Drive), RAM (Random Access Memory), ROM (Read Only Memory), and flash memory.
  • Each DB (network data DB 201, service data DB 202, and causal model DB 203) included in the estimation device 10 can be realized by the memory device 306.
  • a storage device for example, a database server or the like
  • a communication network for example, a communication network.
  • the estimation device 10 can realize the above-mentioned causal model construction process and abnormality location / factor estimation process.
  • the hardware configuration shown in FIG. 5 is an example, and the estimation device 10 may have another hardware configuration.
  • the estimation device 10 may have a plurality of processors 305 or a plurality of memory devices 306.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一実施形態に係るモデル構築装置は、異常箇所又は異常要因の推定対象となる通信ネットワークシステムに関する第1の観測データを収集する第1の収集部と、前記通信ネットワークシステムで提供される複数のサービスに関する第2の観測データを収集する第2の収集部と、前記第1の観測データと前記第2の観測データとを用いて、前記異常箇所又は異常要因と前記複数のサービスのうちの異常サービスとを推定するための因果モデルを構築するモデル構築部と、を有することを特徴とする。

Description

モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム
 本発明は、モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラムに関する。
 通信事業者にとって、通信ネットワークシステム内で発生する異常の状態を把握し、その対応を迅速に行うことは重要な業務である。こうした中で、通信ネットワークシステム内で発生した異常を早期に検知するための手法や異常箇所・要因を推定するための手法等の研究が従来から行われている。
 異常箇所・要因を推定するための手法として、異常箇所・要因とこの異常によって引き起こされる通信ネットワークシステム内のデータ(以下、「観測データ」ともいう。)の変化との関係性を因果モデルとしてベイジアンネットワークによりモデル化し、異常時の観測データから異常箇所・要因を推定する手法が提案されている(非特許文献1~3)。このような手法の1つとして、ルールベース手法が知られている。
 ルールベース手法では、エキスパート(例えば、通信ネットワークシステムのオペレータ等)の知識を用いて、異常箇所・要因と観測データの変化との関係性をモデル化する。例えば、非特許文献1では、ルータの正常・異常は隣接しているリンクの観測データのみに影響するというルールをエキスパートの知識から作成し、このルールと通信ネットワークシステムのトポロジーにおける隣接関係とを用いて因果モデルを構築している。また、非特許文献2では、テンプレートという抽象的なルールを作成することで、因果モデルの構築を容易するための提案がなされている。また、非特許文献3では、VPN(Virtual Private Network)等の仮想的な通信ネットワークを対象として、或るVPNのルートになっている機器群を抽出し、その機器群で発生した異常の要因や異常が発生した機器と観測データとの関係性をモデル化している。
 ところで、通信ネットワークシステムでは、通信機能に加えて、VPNや各種アプリケーション等の様々なサービスが提供されている。特に、近年では、仮想化技術等により通信ネットワークシステムで提供されるサービスの数が増大している。このため、複数のサービスを統合的に監視し、どのサービスで異常が発生し、どのサービスに影響が出ているのかを把握することは通信ネットワークシステムの運用上極めて重要である。これは、サービスによって異常や影響に対する対処方法が異なるためである。
Srikanth Kandula, Dina Katabi, and Jean-philippe Vasseur. Shrink: A tool for failure diagnosis in IP networks. Proceedings of the 2005 ACM SIGCOMM workshop on Mining network data, pages 173-178, 2005. He Yan, Lee Breslau, Zihui Ge, Dan Massey, Dan Pei, and Jennifer Yates. G-RCA: A Generic Root Cause Analysis Platform for Service Quality Management in Large IP Networks. IEEE/ACM Transactions on Networking, 20(6):1734-1747, 2012. Leila Bennacer, Yacine Amirat,Abdelghani Chibani, Abdelham id Mellouk, and Laurent Ciavaglia, Self-diagnosis technique for virtual private networks combining bayesian networks and case-based reasoning, IEEE Transactions on Automation Science and Engineering, vol: 12(1) pp: 354-366, 2015.
 しかしながら、異常箇所・要因を推定するための従来手法では、通信ネットワークシステムで提供される複数のサービスとの関係性も含めて、統合的にモデル化することができなかった。
 本発明の一実施形態は、上記の点に鑑みてなされたもので、通信ネットワークシステムで提供される複数サービスの異常も含めて異常箇所・要因を推定するための因果モデルを構築することを目的とする。
 上記目的を達成するため、一実施形態に係るモデル構築装置は、異常箇所又は異常要因の推定対象となる通信ネットワークシステムに関する第1の観測データを収集する第1の収集部と、前記通信ネットワークシステムで提供される複数のサービスに関する第2の観測データを収集する第2の収集部と、前記第1の観測データと前記第2の観測データとを用いて、前記異常箇所又は異常要因と前記複数のサービスのうちの異常サービスとを推定するための因果モデルを構築するモデル構築部と、を有することを特徴とする。
 通信ネットワークシステムで提供される複数サービスの異常も含めて異常箇所・要因を推定するための因果モデルを構築することができる。
グラフィカルモデルの一例を示す図である。 本実施形態に係る推定装置の機能構成の一例を示す図である。 本実施形態に係る因果モデル構築処理の一例を示すフローチャートである。 本実施形態に係る異常箇所・要因推定処理の一例を示すフローチャートである。 本実施形態に係る推定装置のハードウェア構成の一例を示す図である。
 以下、本発明の一実施形態について説明する。本実施形態では、通信ネットワークシステムにおける観測データから因果モデルを構築し、この因果モデルにより通信ネットワークシステムの異常箇所・要因と当該通信ネットワークシステムで提供される複数のサービスの異常とを推定する推定装置10について説明する。ここで、本実施形態に係る推定装置10には、過去の観測データから因果モデルを構築する「モデル構築フェーズ」と、この因果モデルを用いて異常発生時の観測データから異常箇所・要因(異常があるサービスも含む)を推定する「推定フェーズ」とが存在する。なお、モデル構築フェーズにおける推定装置10は、例えば、「モデル構築装置」等と称されてもよい。また、通信ネットワークシステムは種々の機器(例えば、ルータやサーバ等)をノード、通信経路等をリンクとする通信ネットワーク環境を実現するシステムであり、ICT(Information and Communication Technology)システム等と称されてもよい。
 <理論的構成>
 まず、モデル構築フェーズにおける因果モデル構築と、推定フェーズにおける異常箇所・要因推定との理論的構成について説明する。
 本実施形態では、グラフィカルモデルの1つであるベイジアンネットワークで表される因果モデルを構築する際にベイジアンネットワークを多層化することで、通信ネットワークシステムを構成する機器や異常要因等と観測データとの関係性に加えて、当該通信ネットワークシステムで提供される複数サービスとの関係性も含めた統合的な関係性を表す因果モデルを構築する。これにより、この因果モデルにより観測データから異常箇所・要因(異常があるサービスも含む)の推定を可能にする。すなわち、通信ネットワークシステムにおける異常箇所又は異常要因と当該通信ネットワークシステムで提供される複数のサービスのうちで異常があるサービス(以下、「異常サービス」ともいう。)とを推定することを可能にする。なお、通信ネットワークで提供されるサービスとしては、VPNや各種アプリケーション(例えば、VoIP(Voice over Internet Protocol)による音声通話サービス、ファイル転送サービス、動画配信サービス等)等が挙げられる。
 以降では、一例として、通信ネットワークシステムの異常箇所を推定する場合を想定し、その箇所として異常が発生した機器を推定する場合について説明する。ただし、後述する機器iを要因iとすることで、異常要因を推定する場合についても同様に適用可能である。また、iを機器と要因の両方を表すものとすれば、異常箇所と異常要因の両方を同時に推定することも可能である。
 通信ネットワークシステムの機器iの状態をx,i∈{1,・・・,N}とし、通信ネットワークに関する観測データjの状態をy,j∈{1,・・・,M}とする。通信ネットワークに関する観測データjは通信ネットワークシステム全体の状態等を表す情報であり、例えば、syslogやトラヒック情報等が挙げられる。Nは通信ネットワークシステムを構成する機器の数、Mは通信ネットワークに関する観測データの数である。各x及びyは0(正常状態)又は1(異常状態)のいずれかの値を取るものとする。ただし、0又は1の2値ではなく、3値以上の多値を取るとすることも可能であるし、連続値を取るとすることも可能である。
 なお、通信ネットワークに関する観測データjとしては、syslogやトラヒック情報等以外にも、例えば、参考文献「Yasuhiro Ikeda, Keisuke Ishibashi, Yuusuke Nakano, Keishiro Watanabe, Ryoichi Kawahara, "Anomaly Detection and Interpretation using Multimodal Autoencoder and Sparse Optimization", arXiv:1812.07136 [stat.ML]」中に記載されている要因度が用いられてもよい。
 通信ネットワークに関する観測データjの状態yは、例えば、通信ネットワークに関する観測データj(要因度も含む)が連続値の場合には、正常時の観測データjの値から閾値を決定し、この閾値以上(又は以下)となる観測データjの状態yの値を1、それ以外の観測データjの状態yの値を0としてもよいし、正常時の観測データjの分散を計算し、L(ただし、Lは予め決定された任意の自然数)シグマ以上外れた観測データjの状態yの値を1、それ以外の観測データjの状態yの値を0としてもよい。
 また、通信ネットワークシステムで提供されるサービスkの状態をz,k∈{1,・・・,N}とし、サービスに関する観測データhの状態をw,h∈{1,・・・,M}とする。サービスに関する観測データhは通信ネットワークシステムで提供されるサービスの状態等を表す情報であり、例えば、サービスに関連するログ情報等が挙げられる。Nは通信ネットワークシステムで提供されるサービスの数、Mはサービスに関する観測データの数である。各z及びwは0(正常状態)又は1(異常状態)のいずれかの値を取るものとする。ただし、x及びyと同様に、0又は1の2値ではなく、3値以上の多値を取るとすることも可能であるし、連続値を取るとすることも可能である。サービスに関する観測データhの状態wは、例えば、ログ情報の内容等から特定又は計算(例えば、エラーメッセージやエラーコード等が含まれる場合には状態wの値を1、そうでない場合には0にする等)すればよい。
 本実施形態では、従来の因果モデルで用いられていたx及びyに加えて、サービスに関する変数z及びwも用いて因果モデルを構築する。すなわち、通信ネットワークに関する機器iの状態xとサービスkの状態zとが得られた時の観測データjの状態yとサービスに関する観測データhの状態wの確率P(y,w|x,z)を因果モデルとして構築する。この因果モデルは条件付き確率の定義より、確率P(x,z,y,w)と事前確率P(x)と事前確率P(z)から規定される。実際には、ベイズの定理を用いて、観測データjの状態yとサービスに関する観測データhの状態wとが得られた時の機器iの状態xとサービスkの状態zの事後確率P(x,z|y,w)を計算する。つまり、ベイズの定理により事後確率P(x,z|y,w)を因果モデルから計算する。
 ここで、通信ネットワークシステムで提供されるサービスは、当該通信ネットワークシステムに含まれる機器を使って通信を行うため、サービスkに関連するパケットが通る機器に異常があれば当該サービスkにも影響があり、また、当該サービスkに関連する観測データhの状態wにも影響が出る。また、通信ネットワークシステムを構成する機器に異常がなかった場合にも、サービスkに異常があれば、当該サービスkに関連する観測データhの状態wに影響が出る。したがって、これらのことから確率P(x,z,y,w)は、以下のように定式化することができる。
Figure JPOXMLDOC01-appb-M000001
 このように、確率P(x,z,y,w)は、条件付き確率P(y|x)、P(z|x)及びP(w|x,z)と、事前確率P(z)及びP(x)とで規定することができる。ここで、状態xと状態zと状態yと状態wとをそれぞれノードとして、その因果モデルを表すグラフィカルモデル(ベイジアンネットワーク)の一例を図1に示す。図1に示す例では、状態xをEquipment nodes、状態zをService nodes、状態y及びwをObservation nodesと表している。この因果モデルにより、上記の数1に示す定式化が得られる。
 確率P(x,z,y,w)の実際の確率値は様々な方法で規定することができるが、例えば、予め決められた定数α、α、β、β及びγを用いて、以下のように定義することができる。
Figure JPOXMLDOC01-appb-M000002
 ここで、δは真であれば1、そうでなければ0を返す関数である。φxyはxとyの因果関係を表す分布であり、xとyに関係性があれば(i,j)要素が1、そうでなければ(i,j)要素が0であるN×Mの行列である。同様に、φxzはxとzの因果関係を表す分布であり、xとzに関係性があれば(i,k)要素が1、そうでなければ(i,k)要素が0であるN×Nの行列である。また、Φは以下で表される。
Figure JPOXMLDOC01-appb-M000003
 ただし、
Figure JPOXMLDOC01-appb-M000004
である。また、φxzwはxとzとwの因果関係を表す分布であり、xとzとwに関係性があれば(i,k,h)要素が1、そうでなければ(i,k,h)要素が0であるN×N×Mのテンソルである。
 以上により、確率P(x,z,y,w)を計算することができるため、因果モデルを構築することができ、通信ネットワークに関する観測データjの状態yとサービスに関する観測データhの状態wとが得られたときの機器iの状態xとサービスkの状態zの事後確率P(x,z|y,w)を因果モデルから計算することができる。なお、事前確率P(y,w)は通信ネットワークに関する観測データjの状態yとサービスに関する観測データhの状態wから計算することができる。
 このように、通信ネットワークを構成する機器iの状態xと観測データjの状態yとの関係性だけなく、通信ネットワークで提供されるサービスkの状態zとサービスに関連する観測データhの状態wとの関係性、サービスkの状態zとこのサービスkに関連する機器iの状態xとの関係性、サービスkの状態zと観測データjの状態yとの関係性もベイジアンネットワークでモデル化(つまり、多層のベイジアンネットワークでモデル化)し、このベイジアンネットワークで表される因果モデルを構築する。これにより、通信ネットワークシステムにおける異常機器(又は異常要因)だけなく、異常サービスも推定することが可能となる。
 <機能構成>
 次に、本実施形態に係る推定装置10の機能構成について、図2を参照しながら説明する。図2は、本実施形態に係る推定装置10の機能構成の一例を示す図である。
 図2に示すように、本実施形態に係る推定装置10は、ネットワークデータ収集部101と、サービスデータ収集部102と、因果モデル構築部103と、推定部104と、ユーザインタフェース部105と、ネットワークデータDB201と、サービスデータDB202と、因果モデルDB203とを有する。
 ネットワークデータ収集部101は、ネットワーク構成データと通信ネットワークに関する観測データとを通信ネットワークシステムから収集する。ネットワークデータ収集部101によって収集されたネットワーク構成データ及び観測データはネットワークデータDB201に格納される。ここで、ネットワーク構成データとは、通信ネットワークのトポロジーを表す情報(つまり、通信ネットワークシステムを構成する機器と機器間の接続関係等を表す情報)である。ネットワーク構成データにより機器i,i∈{1,・・・,N}が特定される。
 サービスデータ収集部102は、サービス関連データとサービスに関する観測データとを通信ネットワークシステムから収集する。サービスデータ収集部102によって収集されたサービス関連データ及び観測データはサービスデータDB202に格納される。ここで、サービス関連データとは通信ネットワークシステムが提供するサービスを表す情報(例えば、サービスID等)である。サービス関連データによりサービスk,k∈{1,・・・,N}が特定される。
 因果モデル構築部103は、通信ネットワークに関する各観測データの状態とサービスに関する各観測データの状態とが得られたときの各機器の状態と各サービスの状態の事後確率を計算するための因果モデルを構築する。因果モデル構築部103によって構築される因果モデルは因果モデルDB203に格納される。
 推定部104は、因果モデルDB203に格納されている因果モデルにより通信ネットワークシステムの異常箇所又は異常要因と異常サービスとを推定する。
 ユーザインタフェース部105は、推定部104により推定された推定結果(異常箇所又は異常要因、異常サービス)とその確率とをユーザ(例えば、通信ネットワークシステムのオペレータ等)に提示する。
 <因果モデル構築処理>
 次に、モデル構築フェーズにおいて、本実施形態に係る推定装置10が因果モデルを構築する場合の処理について、図3を参照しながら説明する。図3は、本実施形態に係る因果モデル構築処理の一例を示すフローチャートである。なお、以降では、ネットワークデータ収集部101によって収集されたネットワーク構成データ及び観測データがネットワークデータDB201に格納されていると共に、サービスデータ収集部102によって収集されたサービス関連データ及び観測データがサービスデータDB202に格納されているものとする。また、ネットワークデータ収集部101によって収集された観測データjはその状態yの値が計算され、観測データjとその状態yとが対応付けられてネットワークデータDB201に格納されているものとする。同様に、サービスデータ収集部102によって収集された観測データhはその状態wの値が計算又は特定され、観測データhとその状態wとが対応付けられてサービスデータDB202に格納されているものとする。
 ステップS101:因果モデル構築部103は、モデル構築に用いる過去の観測データj及びその状態yとネットワーク構成データとをネットワークデータDB201から入力すると共に、モデル構築に用いる過去の観測データh及びその状態wとサービス関連データとをサービスデータDB202から入力する。
 ステップS102:そして、因果モデル構築部103は、上記のステップS101で入力した観測データj及びその状態yとネットワーク構成データと観測データh及びその状態wとサービス関連データとを用いて、確率P(y,w|x,z)を因果モデルとして構築する。なお、この因果モデルは因果モデルDB203に格納される。
 以上により、モデル構築フェーズにおいて、本実施形態に係る推定装置10は、通信ネットワークを構成する機器iの状態xと観測データjの状態yとの関係性と、通信ネットワークで提供されるサービスkの状態zとサービスに関連する観測データhの状態wとの関係性と、サービスkの状態zとこのサービスkに関連する機器iの状態xとの関係性と、サービスkの状態zと観測データjの状態yとの関係性とを表す因果モデルを構築する。これにより、通信ネットワークシステムにおける異常機器(又は異常要因)だけなく、異常サービスも推定することが可能な因果モデルを得ることができる。
 <異常箇所・要因推定処理>
 次に、推定フェーズにおいて、本実施形態に係る推定装置10が異常箇所・要因(異常サービスも含む)を推定する場合の処理について、図4を参照しながら説明する。図4は、本実施形態に係る異常箇所・要因推定処理の一例を示すフローチャートである。なお、以降では、ネットワークデータ収集部101によって収集されたネットワーク構成データ及び観測データがネットワークデータDB201に格納されていると共に、サービスデータ収集部102によって収集されたサービス関連データ及び観測データがサービスデータDB202に格納されているものとする。また、ネットワークデータ収集部101によって収集された観測データjはその状態yの値が計算され、観測データjとその状態yとが対応付けられてネットワークデータDB201に格納されているものとする。同様に、サービスデータ収集部102によって収集された観測データhはその状態wの値が計算又は特定され、観測データhとその状態wとが対応付けられてサービスデータDB202に格納されているものとする。
 ステップS201:推定部104は、異常箇所・要因(異常サービスも含む)の推定に用いる観測データj及びその状態yとネットワーク構成データとをネットワークデータDB201から入力すると共に、異常箇所・要因(異常サービスも含む)の推定に用いる観測データh及びその状態wとサービス関連データとをサービスデータDB202から入力する。なお、観測データj及び観測データhとしては、例えば、通信ネットワークシステムで何等かの異常が発生したり、この通信ネットワークシステムで提供されるサービスに何等かの異常が発生したりしたときの観測データj及び観測データhを入力することが考えられる。
 ステップS202:次に、推定部104は、上記のステップS201で入力した観測データjの状態yと観測データhの状態wとを用いて、因果モデルDB203に格納されている因果モデルにより異常箇所・要因又は異常サービスを推定する。すなわち、推定部104は、ベイズの定理によりこの因果モデルから事後確率P(x,z|y,w)を計算し、その確率が最大となる異常箇所・要因又は異常サービスを推定する。なお、或るxで事後確率P(x,z|y,w)が最大となる場合は当該xに対応する機器i(又は要因i)が異常箇所(又は異常要因)と推定され、或るzで事後確率P(x,z|y,w)が最大となる場合は当該zに対応するサービスkが異常サービスと推定される。
 ステップS203:ユーザインタフェース部105は、上記のステップS202の推定結果(つまり、異常箇所・要因又は異常サービスとその確率)をディスプレイ等に出力し、ユーザに提示する。
 以上により、推定フェーズにおいて、本実施形態に係る推定装置10は、モデル構築フェーズで構築した因果モデルにより異常箇所・要因及び異常サービスを推定することができる。これにより、例えば、通信ネットワークシステムのオペレータ等のユーザは、通信ネットワークシステムの異常箇所・要因だけでなく、複数のサービスを統合的に監視し、どのサービスで異常が起きていて、どのサービスに影響が出ているのかを把握することが可能になる。
 <ハードウェア構成>
 最後に、本実施形態に係る推定装置10のハードウェア構成について、図5を参照しながら説明する。図5は、本実施形態に係る推定装置10のハードウェア構成の一例を示す図である。
 図5に示すように、本実施形態に係る推定装置10は一般的なコンピュータ又はコンピュータシステムで実現され、入力装置301と、表示装置302と、外部I/F303と、通信I/F304と、プロセッサ305と、メモリ装置306とを有する。これら各ハードウェアは、それぞれがバス307を介して通信可能に接続されている。
 入力装置301は、例えば、キーボードやマウス、タッチパネル等である。表示装置302は、例えば、ディスプレイ等である。なお、推定装置10は、入力装置301及び表示装置302のうちの少なくとも一方を有していなくてもよい。
 外部I/F303は、記録媒体303a等の外部装置とのインタフェースである。推定装置10は、外部I/F303を介して、記録媒体303aの読み取りや書き込み等を行うことができる。記録媒体303aには、例えば、推定装置10が有する各機能部(ネットワークデータ収集部101、サービスデータ収集部102、因果モデル構築部103、推定部104及びユーザインタフェース部105)を実現する1以上のプログラムが格納されていてもよい。なお、記録媒体303aとしては、例えば、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等がある。
 通信I/F304は、推定装置10を通信ネットワークに接続するためのインタフェースである。なお、推定装置10が有する各機能部を実現する1以上のプログラムは、通信I/F304を介して、所定のサーバ装置等から取得(ダウンロード)されてもよい。
 プロセッサ305は、例えば、CPU(Central Processing Unit)等の各種演算装置である。推定装置10が有する各機能部は、例えば、メモリ装置306に格納されている1以上のプログラムがプロセッサ305に実行させる処理により実現される。
 メモリ装置306は、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ等の各種記憶装置である。推定装置10が有する各DB(ネットワークデータDB201、サービスデータDB202及び因果モデルDB203)は、メモリ装置306により実現可能である。ただし、これら各DBのうちの少なくとも1つのDBが、推定装置10と通信ネットワークを介して接続される記憶装置(例えば、データベースサーバ等)により実現されていてもよい。
 本実施形態に係る推定装置10は、図5に示すハードウェア構成を有することにより、上述した因果モデル構築処理及び異常箇所・要因推定処理を実現することができる。なお、図5に示すハードウェア構成は一例であって、推定装置10は、他のハードウェア構成を有していてもよい。例えば、推定装置10は、複数のプロセッサ305を有していてもよいし、複数のメモリ装置306を有していてもよい。
 本発明は、具体的に開示された上記の実施形態に限定されるものではなく、請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。
 10    推定装置
 101   ネットワークデータ収集部
 102   サービスデータ収集部
 103   因果モデル構築部
 104   推定部
 105   ユーザインタフェース部
 201   ネットワークデータDB
 202   サービスデータDB
 203   因果モデルDB
 301   入力装置
 302   表示装置
 303   外部I/F
 303a  記録媒体
 304   通信I/F
 305   プロセッサ
 306   メモリ装置
 307   バス

Claims (7)

  1.  異常箇所又は異常要因の推定対象となる通信ネットワークシステムに関する第1の観測データを収集する第1の収集部と、
     前記通信ネットワークシステムで提供される複数のサービスに関する第2の観測データを収集する第2の収集部と、
     前記第1の観測データと前記第2の観測データとを用いて、前記異常箇所又は異常要因と前記複数のサービスのうちの異常サービスとを推定するための因果モデルを構築するモデル構築部と、
     を有することを特徴とするモデル構築装置。
  2.  前記モデル構築部は、
     前記通信ネットワークシステムで異常箇所又は異常要因となる箇所又は要因の状態と前記第1の観測データの状態との関係性、前記サービスの状態と前記第2の観測データとの関係性、前記サービスの状態と該サービスに関連する前記箇所又は要因の状態との関係性、及び前記サービスの状態と前記第1の観測データの状態との関係性をベイジアンネットワークによりモデル化した確率モデルを前記因果モデルとして構築する、ことを特徴とする請求項1に記載のモデル構築装置。
  3.  前記因果モデルは、前記第1の観測データの状態と前記第2の観測データの状態とが得られたときにおける前記箇所又は要因の状態と前記サービスの状態とを表す事後確率をベイズの定理により計算可能な確率モデルである、ことを特徴とする請求項2に記載のモデル構築装置。
  4.  異常箇所又は異常要因の推定対象となる通信ネットワークシステムに関する第1の観測データを収集する第1の収集部と、
     前記通信ネットワークシステムで提供される複数のサービスに関する第2の観測データを収集する第2の収集部と、
     前記異常箇所又は異常要因と前記複数のサービスのうちの異常サービスとを推定するための因果モデルを記憶する記憶部と、
     前記第1の観測データと前記第2の観測データとを用いて、前記因果モデルにより前記異常箇所又は異常要因と前記異常サービスとを推定する推定部と、
     を有することを特徴とする推定装置。
  5.  異常箇所又は異常要因の推定対象となる通信ネットワークシステムに関する第1の観測データを収集する第1の収集手順と、
     前記通信ネットワークシステムで提供される複数のサービスに関する第2の観測データを収集する第2の収集手順と、
     前記第1の観測データと前記第2の観測データとを用いて、前記異常箇所又は異常要因と前記複数のサービスのうちの異常サービスとを推定するための因果モデルを構築するモデル構築手順と、
     をコンピュータが実行することを特徴とするモデル構築方法。
  6.  異常箇所又は異常要因の推定対象となる通信ネットワークシステムに関する第1の観測データを収集する第1の収集手順と、
     前記通信ネットワークシステムで提供される複数のサービスに関する第2の観測データを収集する第2の収集手順と、
     前記異常箇所又は異常要因と前記複数のサービスのうちの異常サービスとを推定するための因果モデルを記憶部に記憶する記憶手順と、
     前記第1の観測データと前記第2の観測データとを用いて、前記因果モデルにより前記異常箇所又は異常要因と前記異常サービスとを推定する推定手順と、
     をコンピュータが実行することを特徴とする推定方法。
  7.  コンピュータに、請求項5に記載のモデル構築方法又は請求項6に記載の推定方法を実行させるプログラム。
PCT/JP2020/022009 2020-06-03 2020-06-03 モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム WO2021245854A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022529230A JP7414136B2 (ja) 2020-06-03 2020-06-03 モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム
PCT/JP2020/022009 WO2021245854A1 (ja) 2020-06-03 2020-06-03 モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム
US17/927,027 US11973658B2 (en) 2020-06-03 2020-06-03 Model construction apparatus, estimation apparatus, model construction method, estimation method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/022009 WO2021245854A1 (ja) 2020-06-03 2020-06-03 モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム

Publications (1)

Publication Number Publication Date
WO2021245854A1 true WO2021245854A1 (ja) 2021-12-09

Family

ID=78830700

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/022009 WO2021245854A1 (ja) 2020-06-03 2020-06-03 モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム

Country Status (3)

Country Link
US (1) US11973658B2 (ja)
JP (1) JP7414136B2 (ja)
WO (1) WO2021245854A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007026303A (ja) * 2005-07-20 2007-02-01 Fujitsu Ltd システム性能監視プログラム及びシステム性能監視方法
JP2014134987A (ja) * 2013-01-11 2014-07-24 Hitachi Ltd 情報処理システム監視装置、監視方法、及び監視プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7895146B2 (en) * 2007-12-03 2011-02-22 Microsoft Corporation Time modulated generative probabilistic models for automated causal discovery that monitors times of packets
US10083073B2 (en) * 2015-09-14 2018-09-25 Dynatrace Llc Method and system for real-time causality and root cause determination of transaction and infrastructure related events provided by multiple, heterogeneous agents
CN109598346A (zh) * 2017-09-30 2019-04-09 日本电气株式会社 用于估计观测变量之间的因果关系的方法、装置和系统
US10977154B2 (en) * 2018-08-03 2021-04-13 Dynatrace Llc Method and system for automatic real-time causality analysis of end user impacting system anomalies using causality rules and topological understanding of the system to effectively filter relevant monitoring data
JP6989464B2 (ja) * 2018-08-30 2022-01-05 株式会社日立製作所 ソフトウェア生成方法およびソフトウェア生成システム
JP7235967B2 (ja) * 2019-07-24 2023-03-09 富士通株式会社 ネットワーク分析プログラム、ネットワーク分析装置及びネットワーク分析方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007026303A (ja) * 2005-07-20 2007-02-01 Fujitsu Ltd システム性能監視プログラム及びシステム性能監視方法
JP2014134987A (ja) * 2013-01-11 2014-07-24 Hitachi Ltd 情報処理システム監視装置、監視方法、及び監視プログラム

Also Published As

Publication number Publication date
JP7414136B2 (ja) 2024-01-16
US11973658B2 (en) 2024-04-30
JPWO2021245854A1 (ja) 2021-12-09
US20230208723A1 (en) 2023-06-29

Similar Documents

Publication Publication Date Title
CN110351118B (zh) 根因告警决策网络构建方法、装置和存储介质
Chen et al. Outage prediction and diagnosis for cloud service systems
Kimura et al. Spatio-temporal factorization of log data for understanding network events
US7500142B1 (en) Preliminary classification of events to facilitate cause-based analysis
US9917741B2 (en) Method and system for processing network activity data
US10489232B1 (en) Data center diagnostic information
Kavulya et al. Failure diagnosis of complex systems
JP2006500654A (ja) コンピュータ・システムにおける適応型問題判別及びリカバリー
CN111597247A (zh) 一种数据异常分析方法、装置及存储介质
JP7081741B2 (ja) ネットワークデバイスの状態を判定するための方法及び装置
US9400731B1 (en) Forecasting server behavior
JP2023534696A (ja) ネットワークトポロジーにおけるアノマリー検知
JP6649294B2 (ja) 状態判定装置、状態判定方法及びプログラム
WO2021245853A1 (ja) モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム
WO2021245854A1 (ja) モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム
WO2021002298A1 (ja) 故障影響推定装置、故障影響推定方法、及びプログラム
Matsuo et al. Root-cause diagnosis for rare failures using bayesian network with dynamic modification
CN113342487A (zh) 一种基于在线容错的云计算资源调度方法
JP6835702B2 (ja) 異常推定装置、異常推定方法及びプログラム
JP6787873B2 (ja) 異常種別判定装置、異常種別判定方法及びプログラム
Billal et al. Improving stochastic and dynamic communication networks by optimizing throughput
WO2024034024A1 (ja) 因果モデル構築装置、異常箇所推定装置、因果モデル構築方法、異常箇所推定方法、及びプログラム
JP3895700B2 (ja) 通信網故障頻度計算方法、通信網故障頻度計算装置、通信網故障頻度計算プログラム及びそのプログラムを記録した記録媒体
CN113572639A (zh) 一种载波网络故障的诊断方法、系统、设备和介质
WO2023170760A1 (ja) 異常箇所推定装置、異常箇所推定方法、及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20939051

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022529230

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20939051

Country of ref document: EP

Kind code of ref document: A1