JP2021087222A - 故障根本原因決定方法及び装置並びにコンピュータ記憶媒体 - Google Patents

故障根本原因決定方法及び装置並びにコンピュータ記憶媒体 Download PDF

Info

Publication number
JP2021087222A
JP2021087222A JP2020196836A JP2020196836A JP2021087222A JP 2021087222 A JP2021087222 A JP 2021087222A JP 2020196836 A JP2020196836 A JP 2020196836A JP 2020196836 A JP2020196836 A JP 2020196836A JP 2021087222 A JP2021087222 A JP 2021087222A
Authority
JP
Japan
Prior art keywords
failure
network
entity
knowledge graph
anomalous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020196836A
Other languages
English (en)
Other versions
JP7108674B2 (ja
Inventor
ジョンギュ,ワン
Zhongyu Wang
ユミン,シエ
Yuming Xie
ジェンウェイ,ジャン
Zhenwei Zhang
ユンポン,ガオ
Yunpeng Gao
シン,シァオ
Xin Xiao
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2021087222A publication Critical patent/JP2021087222A/ja
Application granted granted Critical
Publication of JP7108674B2 publication Critical patent/JP7108674B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0627Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time by acting on the notification or alarm source
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

【課題】現在のネットワークにおいて特定する故障根本原因の比較的低い精度の問題を解決する故障根本原因決定方法、装置及びにコンピュータ記憶媒体を提供する。【解決手段】故障根本原因決定方法において、管理デバイスは、故障が発生したターゲットネットワークの故障特徴を取得する。故障特徴は、故障が発生したターゲットネットワークの知識グラフに基づいて決定される。知識グラフは、ネットワークエンティティと異常イベントエンティティとを含む。異常イベントエンティティは、ターゲットネットワークにおいて異常イベントを生成したネットワークエンティティである異常ネットワークエンティティに接続される。異常イベントエンティティは、異常ネットワークエンティティにより生成された異常イベントを示す。ネットワークエンティティのタイプは、ネットワークデバイス、インタフェース、プロトコル又はサービスである。【選択図】図2

Description

この出願は、ネットワーク技術の分野に関し、特に、故障根本原因決定方法及び装置並びにコンピュータ記憶媒体に関する。
現在のネットワークにおける故障原因は比較的複雑である。例えば、データセンターネットワーク(data center network, DCN)では、アドレス解決プロトコル(Address Resolution Protocol, ARP)エントリの超過、デバイス再始動、ルータアイデンティティ(router identity)の競合等がネットワーク故障を引き起こす可能性がある。したがって、ネットワーク故障を特定することは困難である
現在、故障ツリーを使用することによりネットワークで発生した故障の根本原因(以下、略して故障根本原因と呼ばれる)を決定する方式が提案されている。ルールベースの故障ツリーでは、1つの根本原因決定ルールが1つの故障根本原因に対応する可能性がある。故障シナリオで取得されたネットワークデータのパフォーマンスが根本原因決定ルールを満たす場合、故障シナリオを引き起こす故障根本原因は、根本原因決定ルールに対応する故障根本原因であると決定される可能性がある。根本原因決定ルールは、ANDゲート及びORゲートを通じた複数の単一のルールの組み合わせでもよい。
しかし、現在の故障ツリーは、通常では、単一のデバイスの故障伝搬ルールに従って構築され、故障は、実際のネットワークにおいて異なるデバイスの間で伝搬される可能性がある。この場合、故障ツリーは、ネットワークにおいて故障根本原因を正確に特定できない。したがって、ネットワークにおいて故障の故障根本原因を特定するために故障ツリーを使用することは精度が低い。
この出願は、現在のネットワークにおいて特定する故障根本原因の比較的低い精度の問題を解決するための、故障根本原因決定方法及び装置並びにコンピュータ記憶媒体を提供する。
第1の態様によれば、故障根本原因を決定するための方法が提供される。当該方法は、管理デバイスにより、故障が発生したターゲットネットワークの故障特徴を取得するステップであり、故障特徴は、故障が発生したターゲットネットワークの知識グラフに基づいて決定され、知識グラフは、ネットワークエンティティと異常イベントエンティティとを含み、異常イベントエンティティは、異常ネットワークエンティティに接続され、異常ネットワークエンティティは、ターゲットネットワークにおいて異常イベントを生成したネットワークエンティティであり、異常イベントエンティティは、異常ネットワークエンティティにより生成された異常イベントを示すように構成され、ネットワークエンティティのタイプは、ネットワークデバイス、インタフェース、プロトコル又はサービスである、ステップと、管理デバイスにより、故障特徴に基づいて、ターゲットネットワークの故障根本原因を決定するステップとを含む。
この出願では、故障が発生したネットワークの故障特徴は、故障が発生したネットワークの知識グラフに基づいて決定される。知識グラフは全体のネットワークに基づいて生成され、ネットワークの取得された故障特徴も全体のネットワークに基づくので、この出願では、ネットワークの故障根本原因がネットワークの故障特徴に基づいて決定されるとき、デバイスの間の故障伝搬が考慮できる。これは、ネットワークにおける故障根本原因を決定する精度を改善する。
任意選択で、管理デバイスにより、故障特徴に基づいて、ターゲットネットワークの故障根本原因を決定する実現プロセスは、
管理デバイスにより、故障特徴を故障根本原因推定モデルに入力して、故障特徴に基づいて故障根本原因推定モデルにより出力されたターゲットネットワークの故障根本原因を取得することを含み、故障根本原因推定モデルは、既知の故障根本原因の複数の知識グラフサンプルに基づく訓練を通じて取得される。
この出願では、既知の故障根本原因の複数の知識グラフサンプルに基づく訓練を通じて取得された故障根本原因推定モデルが、ネットワークの故障根本原因を決定するために使用されて、ネットワークにおける故障根本原因を正確に決定し、ネットワークにおける故障根本原因の異常表現が故障根本原因として決定されるのを防止し、ネットワークにおける故障根本原因を決定する精度を更に改善する。
任意選択で、管理デバイスにより、故障が発生したターゲットネットワークの故障特徴を取得する実現プロセスは、
管理デバイスにより、故障が発生したターゲットネットワークの知識グラフを取得し、管理デバイスにより、知識グラフに基づいてターゲットネットワークの故障特徴を決定することを含む。
任意選択で、管理デバイスにより、知識グラフに基づいて、ターゲットネットワークの故障特徴を決定する実現プロセスは、
管理デバイスにより、知識グラフと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、知識グラフと故障伝搬関係ライブラリとの間の故障一致度を決定すること、及び/又は知識グラフ上の各異常ネットワークエンティティについて、管理デバイスにより、異常ネットワークエンティティの隣接ネットワークエンティティを取得して、異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得すること、及び/又は知識グラフ上の各異常イベントエンティティについて、管理デバイスにより、知識グラフから、異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得することであり、ターゲット異常イベントエンティティと異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である、ことを含む。
この出願では、ターゲットネットワークの故障特徴は、ターゲットネットワークの知識グラフと故障伝搬関係ライブラリとの間の故障一致度、ターゲットネットワークの知識グラフ上の各異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴、及び/又はターゲットネットワークの知識グラフ上の各異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を含む。
任意選択で、当該方法は、管理デバイスにより、既知の故障根本原因の複数の知識グラフサンプルを取得するステップであり、知識グラフサンプルのそれぞれは、知識グラフサンプルが属するネットワークにおいて故障が発生したとき、知識グラフサンプルが属するネットワークにおいて異常イベントを生成した全ての異常ネットワークエンティティと、異常ネットワークエンティティにより生成された異常イベントを示すために使用される異常イベントエンティティとを識別する、ステップと、管理デバイスにより、複数の知識グラフサンプルに基づいて、知識グラフサンプルのそれぞれが属するネットワークの故障特徴を決定するステップと、管理デバイスにより、知識グラフサンプルのそれぞれが属するネットワークの故障特徴と、知識グラフサンプルのそれぞれに対応する故障根本原因とに基づいた訓練を通じて、故障根本原因推定モデルを取得するステップとを含む。
任意選択で、管理デバイスにより、複数の知識グラフサンプルに基づいて、知識グラフサンプルのそれぞれが属するネットワークの故障特徴を決定する実現プロセスは、
知識グラフサンプルのそれぞれについて、管理デバイスにより、知識グラフサンプルと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、知識グラフサンプルと故障伝搬関係ライブラリとの間の故障一致度を決定すること、及び/又は知識グラフサンプル上の各異常ネットワークエンティティについて、管理デバイスにより、異常ネットワークエンティティの隣接ネットワークエンティティを取得して、異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得すること、及び/又は知識グラフサンプル上の各異常イベントエンティティについて、管理デバイスにより、知識グラフサンプルから、異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得することであり、ターゲット異常イベントエンティティと異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である、ことを含む。
任意選択で、知識グラフサンプルのそれぞれは、故障根本原因に対応する。
第2の態様によれば、故障根本原因決定方法が提供される。当該方法は、管理デバイスにより、故障が発生したターゲットネットワークの知識グラフを取得するステップであり、知識グラフは、ネットワークエンティティと異常イベントエンティティとを含み、異常イベントエンティティは、異常ネットワークエンティティに接続され、異常ネットワークエンティティは、ターゲットネットワークにおいて異常イベントを生成したネットワークエンティティであり、異常イベントエンティティは、異常ネットワークエンティティにより生成された異常イベントを示すように構成され、ネットワークエンティティのタイプは、ネットワークデバイス、インタフェース、プロトコル又はサービスである、ステップと、管理デバイスにより、知識グラフに基づいて、ターゲットネットワークの故障特徴を決定するステップであり、故障特徴は、ターゲットネットワークの故障根本原因を決定するために使用される、ステップとを含む。
任意選択で、管理デバイスにより、知識グラフに基づいて、ターゲットネットワークの故障特徴を決定する実現プロセスは、
管理デバイスにより、知識グラフと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、知識グラフと故障伝搬関係ライブラリとの間の故障一致度を決定すること、及び/又は知識グラフ上の各異常ネットワークエンティティについて、管理デバイスにより、異常ネットワークエンティティの隣接ネットワークエンティティを取得して、異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得すること、及び/又は知識グラフ上の各異常イベントエンティティについて、管理デバイスにより、知識グラフから、異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得することであり、ターゲット異常イベントエンティティと異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である、ことを含む。
第3の態様によれば、故障根本原因決定装置が提供される。当該装置は、複数の機能モジュールを含み、複数の機能モジュールは、第1の態様及び第1の態様の実現方式における方法を実現するように互いに相互作用する。複数の機能モジュールは、ソフトウェア、ハードウェア又はソフトウェアとハードウェアとの組み合わせに基づいて実現されてもよく、複数の機能モジュールは、具体的な実現方式に基づいてランダムに組み合わせられてもよく或いは分割されてもよい。
第4の態様によれば、故障根本原因決定装置が提供される。当該装置は、複数の機能モジュールを含み、複数の機能モジュールは、第2の態様及び第2の態様の実現方式における方法を実現するように互いに相互作用する。複数の機能モジュールは、ソフトウェア、ハードウェア又はソフトウェアとハードウェアとの組み合わせに基づいて実現されてもよく、複数の機能モジュールは、具体的な実現方式に基づいてランダムに組み合わせられてもよく或いは分割されてもよい。
第5の態様によれば、プロセッサ及びメモリを含む故障根本原因決定装置が提供される。
メモリは、コンピュータプログラムを記憶するように構成され、コンピュータプログラムはプログラム命令を含む。
プロセッサは、コンピュータプログラムを呼び出して、第1の態様の実現方式のうちいずれか1つにおける故障根本原因決定方法を実現するように構成される。
第6の態様によれば、プロセッサ及びメモリを含む故障根本原因決定装置が提供される。
メモリは、コンピュータプログラムを記憶するように構成され、コンピュータプログラムはプログラム命令を含む。
プロセッサは、コンピュータプログラムを呼び出して、第2の態様の実現方式のうちいずれか1つにおける故障根本原因決定方法を実現するように構成される。
第7の態様によれば、コンピュータ記憶媒体が提供される。コンピュータ記憶媒体は命令を記憶し、命令がプロセッサにより実行されたとき、第1の態様又は第2の態様のいずれか1つによる故障根本原因決定方法が実現される。
第8の態様によれば、チップが提供される。当該チップは、プログラム可能論理回路及び/又はプログラム命令を含む。チップが動作したとき、第1の態様又は第2の態様及び第1の態様又は第2の態様の実現方式における方法が実現される。
この出願に提供される技術的解決策は、少なくとも以下の有利な効果を有する。
この出願では、故障が発生したネットワークの故障特徴は、故障が発生したネットワークの知識グラフに基づいて決定される。知識グラフは全体のネットワークに基づいて生成され、ネットワークの取得された故障特徴も全体のネットワークに基づくので、この出願では、ネットワークの故障根本原因がネットワークの故障特徴に基づいて決定されるとき、デバイスの間の故障伝搬が考慮できる。これは、ネットワークにおける故障根本原因を決定する精度を改善する。さらに、この出願では、既知の故障根本原因の複数の知識グラフサンプルに基づく訓練を通じて取得された故障根本原因推定モデルが、ネットワークの故障根本原因を決定するために使用されて、ネットワークにおける故障根本原因を正確に決定し、ネットワークにおける故障根本原因の異常表現が故障根本原因として決定されるのを防止し、ネットワークにおける故障根本原因を決定する精度を更に改善する。
この出願の実施形態による故障根本原因決定方法の適用シナリオの概略図である。 この出願の実施形態による故障根本原因決定方法の概略フローチャートである。 この出願の実施形態による知識グラフの概略構造図である。 この出願の実施形態による他の知識グラフの概略構造図である。 この出願の実施形態による、故障が発生したターゲットネットワークの知識グラフの概略図である。 この出願の実施形態による故障根本原因決定装置の概略構造図である。 この出願の実施形態による他の故障根本原因決定装置の概略構造図である。 この出願の他の実施形態による故障根本原因決定装置の概略構造図である。 この出願の実施形態による故障根本原因決定装置のブロック図である。
この出願の目的、技術的解決策及び利点をより明確にするために、以下に、添付の図面を参照して、この出願の実現方式を詳細に更に説明する。
図1は、この出願の実施形態による故障根本原因決定方法の適用シナリオの概略図である。図1に示すように、適用シナリオは、通信ネットワークにおいて管理デバイス101とネットワークデバイス102a〜102c(併せてネットワークデバイス102と呼ばれる)とを含む。図1における管理デバイス及びネットワークデバイスの数は、単に例として使用されており、この出願のこの実施形態において提供される故障根本原因決定方法の適用シナリオに対する限定として使用されない。通信ネットワークは、データセンターネットワーク(data center network, DCN)、メトロポリタンエリアネットワーク、広域ネットワーク、キャンパスネットワーク、仮想ローカルエリアネットワーク(virtual local area network, VLAN)、仮想拡張ローカルエリアネットワーク(virtual extensible local area network, VXLAN)等でもよい。通信ネットワークのタイプは、この出願のこの実施形態では限定されない。
任意選択で、管理デバイス101は、1つのサーバ、又は複数のサーバを含むサーバクラスタ、又はクラウドコンピューティングサービスセンターでもよい。ネットワークデバイス102は、スイッチ、ルータ等でもよい。任意選択で、依然として図1を参照すると、適用シナリオは、制御デバイス103を更に含んでもよい。制御デバイス103は、通信ネットワークにおいてネットワークデバイス102を管理及び制御するように構成される。管理デバイス101は、有線ネットワーク又は無線ネットワークを使用することにより制御デバイス103に接続され、制御デバイス103は、有線ネットワーク又は無線ネットワークを使用することによりネットワークデバイス102に接続される。制御デバイス103は、ネットワークコントローラ、ネットワーク管理デバイス、ゲートウェイ又は制御能力を有する他のデバイスでもよい。制御デバイス103は、1つ以上のデバイスでもよい。
制御デバイス103は、制御デバイス103により管理される通信ネットワークのネットワークトポロジを記憶してもよい。制御デバイス103は、通信ネットワークにおけるネットワークデバイス102のデバイス情報、通信ネットワークにおいて生成された異常イベント等を収集し、通信ネットワークのネットワークトポロジ、ネットワークデバイス102のデバイス情報、通信ネットワークにおいて生成された異常イベント等を管理デバイス101に提供するように更に構成される。ネットワークデバイスのデバイス情報は、ネットワークデバイスのネットワーク構成情報、ルーティングエントリ及び/又は同様のものを含む。ネットワーク構成情報は、一般的に、インタフェース構成情報、プロトコル構成情報、サービス構成情報等を含む。任意選択で、制御デバイス103は、ネットワークデバイス102のデバイス情報と、通信ネットワークにおいて生成された異常イベントとを周期的に収集してもよい。例えば、制御デバイスは、簡易ネットワーク管理プロトコル(simple network management protocol, SNMP)又はネットワーク遠隔測定(network telemetry)技術を使用することにより、ネットワークデバイスの異常情報及び通信ネットワークにおいて生成された異常イベントを収集してもよい。ネットワークデバイス102のデバイス情報が変化したとき、ネットワークデバイス102は、変化したデバイス情報を制御デバイス103に能動的に報告する。通信ネットワークにおいて故障が発生したとき、ネットワークデバイス102は、生成された異常イベントを制御デバイス103に能動的に報告する。明らかに、いくつかの適用シナリオでは、代替として、管理デバイスは、通信ネットワークにおけるネットワークデバイスに直接接続されてもよい。言い換えると、適用シナリオは制御デバイスを含まなくてもよい。これは、この出願のこの実施形態では限定されない。
図2は、この出願の実施形態による故障根本原因決定方法の概略フローチャートである。故障根本原因決定方法は、図1に示す適用シナリオおける管理デバイス101に適用されてもよい。図2に示すように、当該方法は以下のステップを含む。
ステップ201:故障が発生したターゲットネットワークの知識グラフを取得する。
知識グラフは、ネットワークエンティティと異常イベントエンティティとを含み、異常イベントエンティティは、異常ネットワークエンティティに接続され、異常ネットワークエンティティは、ターゲットネットワークにおいて異常イベントを生成したネットワークエンティティであり、異常イベントエンティティは、異常ネットワークエンティティにより生成された異常イベントを示すように構成され、ネットワークエンティティのタイプは、ネットワークデバイス、インタフェース、プロトコル又はサービスである。
任意選択で、ステップ201の実現プロセスは以下を含む。
ステップ2011:故障がターゲットネットワークにおいて発生したとき、管理デバイスはターゲットネットワークにおいて生成された異常イベントを取得する。
異常イベントは、異常イベントを生成したネットワークエンティティの識別子を搬送する。故障がターゲットネットワークにおいて発生することは、故障がターゲットネットワーク上のネットワークデバイスで発生することを示す。ネットワークデバイス上の故障は、インタフェース故障、プロトコル故障(プロトコルパケットを受信又は送信する故障を含む)、サービス故障等でもよい。任意選択で、異常イベントは、アラームログ、状態変化ログ及び異常キーパフォーマンスインジケータ(key performance indicator, KPI)のうち1つ以上を含む。アラームログは、ネットワークデバイスにおける異常ネットワークエンティティのIDとアラームタイプとを含む。状態変化ログは、構成ファイル変化情報及び/又はルーティングエントリ変化情報を含む。例えば、状態変化ログは、例えば、「アクセスサブインタフェースが削除された」及び「宛先IPホストルートが削除された」という情報を含んでもよい。異常キーパフォーマンスインジケータは、ネットワークエンティティの異常インジケータを記述するために使用される。
ステップ2012:管理デバイスは、ターゲットネットワークの初期知識グラフ上で、ターゲットネットワークにおいて異常イベントを生成した異常ネットワークエンティティを識別し、故障が発生したターゲットネットワークの知識グラフを取得する。
この出願のこの実施形態では、管理デバイスが、ターゲットネットワークの初期知識グラフ上で、ターゲットネットワークにおいて異常イベントを生成した異常ネットワークエンティティを識別することは、管理デバイスが、異常イベントエンティティをターゲットネットワークの初期知識グラフに追加し、異常イベントエンティティを、異常イベントエンティティにより示される異常イベントを生成した異常ネットワークエンティティに接続することを意味する。
ターゲットネットワークの初期知識グラフは、ターゲットネットワークのネットワークデータに基づいて生成される。ターゲットネットワークのネットワークデータは、ターゲットネットワークのネットワークトポロジと、ターゲットネットワークにおける複数のネットワークデバイスのデバイス情報とを含む。ネットワークデバイスのデバイス情報は、ネットワークデバイスのネットワーク構成情報を含み、具体的には、インタフェース構成情報、プロトコル構成情報及びサービス構成情報のうち1つ以上を含む。デバイス情報は、ルーティングエントリ等を更に含んでもよい。任意選択で、ネットワークデバイスのインタフェース構成情報は、インタフェースのインターネットプロトコル(Internet Protocol, IP)アドレス、インタフェースによりサポートされるプロトコルタイプ、インタフェースによりサポートされるサービスタイプ等を含む。ネットワークデバイスのプロトコル構成情報は、プロトコルの識別子を含む。プロトコルの識別子は、プロトコルを一意に識別するために使用される。プロトコルの識別子は、記号、文字、数字等を使用することにより表されてもよい。ネットワークデバイスのサービス構成情報は、ネットワークデバイスにより使用されるサービス、例えば、仮想プライベートネットワーク(virtual private network, VPN)サービス及び/又は動的ホスト構成プロトコル(Dynamic Host Configuration Protocol, DHCP)サービスを含む。
任意選択で、故障がターゲットネットワークにおいて発生したとき、管理デバイスは、ターゲットネットワークのネットワークデータを更に取得し、ネットワークデータから複数の知識グラフのトリプレット(triplet)を抽出し、次いで、複数の知識グラフのトリプレットに基づいて初期知識グラフを生成してもよい。各知識グラフのトリプレットは、2つのネットワークエンティティと2つのネットワークエンティティの間の関係とを含む。2つのネットワークエンティティの間の関係は、依存関係、従属関係、ピア関係等でもよい。例えば、ネットワークデバイスとインタフェースとの間の関係は、従属関係であり、言い換えると、インタフェースはネットワークデバイスに属する。他の例では、通信接続が確立された2つのインタフェースの間の関係はピア関係である。
任意選択で、タイプが知識グラフ内のネットワークデバイスであるネットワークエンティティは、ネットワークデバイスの名前、媒体アクセス制御(media access control, MAC)アドレス、ハードウェアアドレス及びオープン・ショーテスト・パス・ファースト(open shortest path first, OSPF)ルータ(略称、OSPF router又はOsRouter、これはOSPFレイヤでネットワークデバイスを一意に識別してもよい)又はネットワークデバイスを一意に識別できる他の識別子により表されてもよい。タイプがインタフェースであるネットワークエンティティは、インタフェースの名前により表されてもよい。タイプがプロトコルであるネットワークエンティティは、プロトコルの識別子により表されてもよい。知識グラフのトリプレットはグラフにより表される。知識グラフのトリプレットは、2つの基本要素、すなわち、ポイント及びエッジを含む。ポイントはネットワークエンティティを表し、エッジは2つのネットワークエンティティの間の関係、例えば、依存関係、従属関係又はピア関係を表す。2つのネットワークエンティティがピア関係にあるとき、無方向性エッジが2つのネットワークエンティティを接続するために使用されてもよい。2つのネットワークエンティティが依存関係又は従属関係にあるとき、方向性エッジ(例えば、矢印)が2つのネットワークエンティティを接続するために使用されてもよく、エッジの方向は、依存するネットワークエンティティから依存されるネットワークエンティティを指すか、或いは、エッジの方向は、取り付けるネットワークエンティティから取り付けられるネットワークエンティティを指す。
任意選択で、管理デバイスは、ターゲットネットワークのネットワークタイプに対応する抽象サービスモデルに基づいて、ネットワークデータから知識グラフのトリプレットに対応する構造化データ(例えば、jsonデータ)を抽出し、例えば、構造化データは、OsRouterと、OSPFレイヤにおけるネットワークセグメント(略称、OsNetwork)と、ネットワークデバイス上の物理インタフェース情報と、OSPF隣接状態変化情報と、ボーダーゲートウェイプロトコル(Border Gateway Protocol, BGP)状態マシンの状態値変化情報とを含んでもよい。次いで、管理デバイスは、抽出された構造化データを解析し、知識グラフのトリプレットに変換する。抽象サービスモデルは、異なるネットワークエンティティの間の関係を反映するために使用される。異なるネットワークタイプは、異なる抽象サービスモデルに対応してもよい。抽象サービスモデルは、本質的に、異なるネットワークエンティティの間の依存関係を定義するために使用されるデータオブジェクトである。例えば、抽象サービスモデルにおいて、各ネットワークデバイスが1つ以上のインタフェース、言い換えると、ネットワークデバイスに属するインタフェースを有すること;インタフェースが転送サービスを搬送してもよいこと、例えば、インタフェースがレイヤ3のIP転送サービスを搬送してもよいこと、言い換えると、インタフェースがインテリアゲートウェイプロトコル(interior gateway protocol, IGP)を使用することによりパケット転送をサポートすること、言い換えると、レイヤ3のIP転送サービス又はIGPがインタフェースに依存すること;VXLANトンネル、トラフィックエンジニアリング(traffic engineering, TE)トンネル及びBGPがレイヤ3のIP転送サービスで搬送できること、言い換えると、VXLANトンネル、TEトンネル及びBGPがレイヤ3のIP転送サービスに依存すること;VPNサービスがTEトンネルで搬送できること、言い換えると、VPNサービスがTEトンネルに依存すること;等が定義されてもよい。VXLANトンネルは、レイヤ3のIP転送サービスで搬送されてもよく、これは、レイヤ3のIP転送サービスを搬送するインタフェースがVXLANトンネルのエンドポイントとして使用されてもよいことを表す。TEトンネルは、レイヤ3のIP転送サービスで搬送でき、これは、レイヤ3のIP転送サービスを搬送するインタフェースがTEトンネルのエンドポイントとして使用できることを表す。BGPは、レイヤ3のIP転送サービスで搬送でき、これは、レイヤ3のIP転送サービスを搬送するインタフェースがBGPベースのプロトコルパケットを送信及び受信できることを表す。VPNサービスはTEトンネルで搬送でき、これは、TEトンネルを搬送するインタフェースがVPNサービスをサポートできることを表す。
任意選択で、管理デバイスは、ネットワークデバイスのネットワーク構成情報から、知識グラフのトリプレットに対応する構造化データを抽出してもよく、或いは、ネットワークデバイスのルーティングエントリに基づいて、知識グラフのトリプレットに対応する構造化データを抽出してもよい。
任意選択で、管理デバイスは、ターゲットネットワークにおけるネットワークデバイスのデバイス情報を周期的に取得し、ターゲットネットワークの初期知識グラフを生成してもよい。ターゲットネットワークの初期知識グラフを生成した後に、管理デバイスは、その後の使用のために、ターゲットネットワークの初期知識グラフを管理デバイス又は管理デバイスに接続された記憶デバイスに更に記憶してもよい。例えば、ターゲットネットワークの初期知識グラフは、ネットワークエンティティの間の故障伝搬関係を決定するための基礎として使用されてもよく、及び/又は、ターゲットネットワークの初期知識グラフは、故障根本原因推定のための基礎として使用されてもよい。例えば、或る期間に故障がターゲットネットワークにおいて発生したとき、管理デバイスは、当該期間に対応する初期知識グラフ上で、異常イベントを生成した異常ネットワークエンティティを識別し、異常ネットワークエンティティを識別する知識グラフを取得してもよい。これは、異常ネットワークエンティティを識別する知識グラフを取得する効率を改善する。
例えば、ターゲットネットワークが2つのネットワークデバイス、すなわち、ネットワークデバイスA及びネットワークデバイスBを含むことを仮定する。ネットワークデバイスAは3つのインタフェースを有し、3つのインタフェースの名前は、それぞれ10GE1/0/1、10GE1/0/2及び10GE1/0/3である。ネットワークデバイスBは4つのインタフェースを有し、4つのインタフェースの名前は、それぞれ10GE3/0/1、10GE3/0/2、10GE3/0/3及び10GE3/0/4である。ネットワークデバイスA及びネットワークデバイスBは、OSPFプロトコルをサポートし、OSPFプロトコルはIGPである。ネットワークデバイスA上のOSPFプロトコルの識別子は、10.89.46.25により伝えられ、ネットワークデバイスA上のOSPFプロトコルは、3つのルートIPアドレス、すなわち、11.11.11.11、11.11.11.12及び11.11.11.13を含む。ネットワークデバイスB上のOSPFプロトコルの識別子は10.89.49.37により表され、ネットワークデバイスB上のOSPFプロトコルは、4つのルートIPアドレス、すなわち、11.12.11.11、11.12.11.12、11.12.11.13及び11.12.11.14を含む。ネットワークデバイスA上のインタフェース10GE1/0/2は、ネットワークデバイスB上のインタフェース10GE3/0/2に接続される。2つのインタフェースは、通信のためにOSPFプロトコルを使用する。ネットワークデバイスA上のインタフェース10GE1/0/2は、ルートIPアドレス11.11.11.11を使用する。ネットワークデバイスB上のインタフェース10GE3/0/2は、ルートIPアドレス11.12.11.14を使用する。したがって、図3に示す初期知識グラフが、上記のネットワークデータに基づいて取得されてもよい。
さらに、故障がネットワークデバイスA上のインタフェース10GE1/0/2に発生した場合、ルートIPアドレス11.11.11.11が到達不可能であるので、故障がターゲットネットワークにおいて発生したとき、インタフェース10GE1/0/2に対応するネットワークエンティティ及びルートIPアドレス11.11.11.11に対応するネットワークエンティティは、図3に示す初期知識グラフ上で異常ネットワークエンティティとして識別されてもよい。図4を参照すると、異常ネットワークエンティティを識別するために、異常イベントエンティティが異常ネットワークエンティティに接続されてもよい。異常イベントエンティティは、特殊な図形又は特殊な色を使用することにより、ネットワークエンティティと区別できる。例えば、図4を参照すると、三角形が、異常イベントエンティティを表すために使用されてもよい。任意選択で、特定の異常イベント、例えば、物理インタフェース故障又はOSPF隣接状態変化が、異常イベントエンティティで更に識別されてもよい。
例えば、図5は、この出願の実施形態による故障が発生したターゲットネットワークの知識グラフの概略図である。図5に示すように、知識グラフは、10個のネットワークエンティティ(ネットワークエンティティA〜J)と、5個の異常イベントエンティティ(異常イベントエンティティa〜e)とを含む。ネットワークエンティティAは異常イベントエンティティaに接続され、ネットワークエンティティBは異常イベントエンティティbに接続され、ネットワークエンティティHは異常イベントエンティティcに接続され、ネットワークエンティティIは異常イベントエンティティdに接続され、ネットワークエンティティJは異常イベントエンティティeに接続される。言い換えると、ネットワークエンティティA、ネットワークエンティティB、ネットワークエンティティH、ネットワークエンティティI及びネットワークエンティティJは全て異常ネットワークエンティティである。
ステップ202:故障が発生したターゲットネットワークの知識グラフに基づいて、ターゲットネットワークの故障特徴を決定する。
任意選択で、ターゲットネットワークの故障特徴は、ターゲットネットワークの知識グラフと故障伝搬関係ライブラリとの間の故障一致度、ターゲットネットワークの知識グラフ上の各異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴、及び/又はターゲットネットワークの知識グラフ上の各異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を含む。
第1の場合、ターゲットネットワークの故障特徴がターゲットネットワークの知識グラフと故障伝搬関係ライブラリとの間の故障一致度を含むとき、ステップ202の実現プロセスは以下を含む。管理デバイスは、知識グラフと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、知識グラフと故障伝搬関係ライブラリとの間の故障一致度を決定する。知識グラフと故障伝搬関係との間の一致度は、知識グラフ内の故障伝搬関係の発生数でもよい。代替として、知識グラフと故障伝搬関係との間の一致度はまた、故障伝搬関係が知識グラフと一致するか否かを表してもよい。故障伝搬関係が知識グラフ内で発生した場合、故障伝搬関係が知識グラフと一致すると決定され、知識グラフと故障伝搬関係との間の一致度は第1の値により表される。故障伝搬関係が知識グラフ内で発生しない場合、故障伝搬関係が知識グラフと一致しないと決定され、知識グラフと故障伝搬関係との間の一致度は第2の値により表される。第1の値及び第2の値は異なる。
知識グラフと故障伝搬関係ライブラリとの間の故障一致度は、知識グラフと故障伝搬関係ライブラリ内の全ての故障伝搬関係との間の一致度の集合を含んでもよい。例えば、故障伝搬関係ライブラリは、故障伝搬関係1と、故障伝搬関係2と、故障伝搬関係3とを含む。知識グラフ内での故障伝搬関係1の発生数は2であり、知識グラフ内での故障伝搬関係2の発生数は0であり、知識グラフ内での故障伝搬関係3の発生数は1である。この場合、知識グラフと故障伝搬関係ライブラリとの間の故障一致度は、{{故障伝搬関係1;2},{故障伝搬関係2;0},{故障伝搬関係3;1}}として表されてもよい。代替として、知識グラフと故障伝搬関係ライブラリとの間の故障一致度は、知識グラフと故障伝搬関係ライブラリ内のターゲット故障伝搬関係との間の一致度の集合を含んでもよく、知識グラフとターゲット故障伝搬関係との間の一致度は0ではない。上記の例を参照すると、知識グラフと故障伝搬関係ライブラリとの間の故障一致度は、{{故障伝搬関係1;2},{故障伝搬関係3;1}}として表されてもよい。
この出願のこの実施形態では、故障伝搬関係は、テキストにより表されてもよく、或いは、グラフにより表されてもよい。例えば、テキスト形式の故障伝搬関係「OsNetwork-L3link-BGPpeer」について、故障伝搬関係は、OsNetwork内の隣接のプロトコル状態故障が、BGPループバックインタフェースのIPアドレスが到達不可能であること(L3link)を引き起こし、最終的にBGPピア(BGP Peer)が切断されることを引き起こすことを示すために使用される。
任意選択で、故障伝搬関係ライブラリ内の故障伝搬関係は手動で決定されてもよく、或いは、複数の知識グラフサンプルに基づいて管理デバイスにより学習されてもよい。管理デバイスは、複数の知識グラフサンプルを取得してもよく、各知識グラフサンプルは、知識グラフサンプルが属するネットワークにおいて故障が発生したとき、異常イベントを生成した全ての異常ネットワークエンティティと、知識グラフサンプルが属するネットワークにおける根本原因故障ネットワークエンティティとを識別する。管理デバイスは、複数の知識グラフサンプルに基づいて、故障伝搬関係を決定する。各知識グラフサンプルは故障ケースであり、知識グラフサンプル内の異常ネットワークエンティティ及び根本原因故障ネットワークエンティティは手動で決定される。任意選択で、管理デバイスは、グラフ埋め込みアルゴリズム等に従って、複数の知識グラフサンプル内の故障伝搬関係を学習してもよい。代替として、同じ知識グラフのトリプレット内の2つのネットワークエンティティが同時に異常である確率が閾値よりも大きいとき、管理デバイスは、故障伝搬が2つのネットワークエンティティの間で実行されると決定してもよい。
例えば、図4に示す知識グラフでは、ネットワークデバイスAのインタフェース10GE1/0/2に故障が発生したとき、インタフェースは通常の通信を実行できず、インタフェースで使用されるルーティングIPアドレス11.111.11.11は到達不可能である。したがって、管理デバイスは、故障伝搬関係のグループを取得でき、具体的には、インタフェース故障がインタフェース上のIPアドレスを到達不可能にする。
任意選択で、知識グラフサンプルが属するネットワークはターゲットネットワークであるか、或いは、知識グラフサンプルが属するネットワークは、ネットワークタイプがターゲットネットワークのものと同じ他のネットワークである。複数の知識グラフサンプルは、同じネットワークに属してもよく、或いは、複数のネットワークに属してもよい。これは、この出願のこの実施形態では限定されない。
故障がターゲットネットワークで発生したとき、通常では、ターゲットネットワークの知識グラフ上に複数の異常ネットワークエンティティが存在する。異常ネットワークエンティティは、故障根本原因により引き起こされる異常を表してもよいが、ターゲットネットワークにおける実際の故障根本原因は、知識グラフに表示される異常ネットワークエンティティに対応する異常イベントではない可能性がある。例えば、ポート輻輳がネットワークにおいて発生したとき、知識グラフに表示される異常イベントは、BGPプロトコル異常とOSPFプロトコル異常とを含むが、ポート輻輳のような根本原因を含まない。他の例では、レイヤ2ループがネットワークにおいて発生したとき、知識グラフに表示される異常イベントは、複数のインタフェース上のトラフィックバースト、複数のインタフェース上のトラフィックストーム抑制、複数のインタフェース上のMACアドレスのばたつき等を含むが、レイヤ2ループのような根本原因を含まない。さらに、故障伝搬関係は知識グラフ上の異なるネットワークエンティティの間の故障伝搬経路を示すために使用されるので、ターゲットネットワークの故障根本原因は、故障伝搬関係ライブラリ内の故障伝搬関係に基づく直接の推定を通じて取得されない可能性がある。
この出願のこの実施形態では、ターゲットネットワークの知識グラフと故障伝搬関係ライブラリとの間の故障一致度は、故障伝搬関係ライブラリに基づく直接の推定を通じて取得されるターゲットネットワークの故障根本原因の確率を反映するために使用される。ターゲットネットワークの知識グラフと故障伝搬関係ライブラリ内の故障伝搬関係との間のより高い一致度は、故障伝搬関係に基づく直接の推定を通じて取得されるターゲットネットワークの故障根本原因のより高い確率を表す。
任意選択で、ターゲットネットワークの知識グラフと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度が一致度閾値未満であるとき、管理デバイスは、この出願のこの実施形態において提供される故障根本原因決定方法を使用することにより、ターゲットネットワークの故障根本原因を決定する。そうでない場合、管理デバイスは、故障伝搬関係ライブラリ内の故障伝搬関係に基づいて、ターゲットネットワークの故障根本原因を決定する。
第2の場合、ターゲットネットワークの故障特徴がターゲットネットワークの知識グラフ上の各異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を含むとき、ステップ202の実現プロセスは以下を含む。知識グラフ上の各異常ネットワークエンティティについて、管理デバイスは、異常ネットワークエンティティの隣接ネットワークエンティティを取得し、異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得する。
異常ネットワークエンティティの隣接ネットワークエンティティは、異常ネットワークエンティティに直接接続されたネットワークエンティティであり、言い換えると、異常ネットワークエンティティと異常ネットワークエンティティの隣接ネットワークエンティティとの間のホップカウントは1に等しい。
任意選択で、グラフ検索の幅パラメータはNであるように構成され、Nは正の整数である。管理デバイスは、幅優先アルゴリズムに従って、異常ネットワークエンティティをヘッドノードとして、知識グラフから異常ネットワークエンティティのN個の隣接ネットワークエンティティを取得する。異常ネットワークエンティティの隣接ネットワークエンティティの数がN以下であるとき、管理デバイスは、異常ネットワークエンティティの全ての隣接ネットワークエンティティを取得する。異常ネットワークエンティティの隣接ネットワークエンティティの数がNよりも大きいとき、管理デバイスは、異常ネットワークエンティティのN個の隣接ネットワークエンティティをランダムに取得する。異常ネットワークエンティティに対応する取得された隣接ネットワークエンティティの特徴の精度を確保するために、管理デバイスが各異常ネットワークエンティティの全ての隣接ネットワークエンティティを取得できるように、グラフ検索の幅パラメータNは十分に大きく設定されてもよい。
例えば、図5に示す知識グラフを参照すると、異常ネットワークエンティティAの隣接ネットワークエンティティは、異常ネットワークエンティティBを含む。異常ネットワークエンティティAに対応する隣接ネットワークエンティティ特徴は、{異常ネットワークエンティティA:{異常ネットワークエンティティB}}として表されてもよい。異常ネットワークエンティティBの隣接ネットワークエンティティは、異常ネットワークエンティティAと異常ネットワークエンティティHとを含む。異常ネットワークエンティティBに対応する隣接ネットワークエンティティ特徴は、{異常ネットワークエンティティB:{異常ネットワークエンティティA,異常ネットワークエンティティH}}として表されてもよい。異常ネットワークエンティティHの隣接ネットワークエンティティは、異常ネットワークエンティティBと、正常ネットワークエンティティCと、正常ネットワークエンティティDと、正常ネットワークエンティティEと、正常ネットワークエンティティFと、正常ネットワークエンティティGと、異常ネットワークエンティティIとを含む。異常ネットワークエンティティHに対応する隣接ネットワークエンティティ特徴は、{異常ネットワークエンティティH:{異常ネットワークエンティティB,正常ネットワークエンティティC,正常ネットワークエンティティD,正常ネットワークエンティティE,正常ネットワークエンティティF,正常ネットワークエンティティG,異常ネットワークエンティティI}}として表されてもよい。異常ネットワークエンティティIの隣接ネットワークエンティティは、異常ネットワークエンティティHと、異常ネットワークエンティティJとを含む。異常ネットワークエンティティIに対応する隣接ネットワークエンティティ特徴は、{異常ネットワークエンティティI:{異常ネットワークエンティティH,異常ネットワークエンティティJ}}として表されてもよい。異常ネットワークエンティティJの隣接ネットワークエンティティは、異常ネットワークエンティティIを含む。異常ネットワークエンティティJに対応する隣接ネットワークエンティティ特徴は、{異常ネットワークエンティティJ:{異常ネットワークエンティティI}}として表されてもよい。明らかに、各異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴も、グラフにより表されてもよい。これは、この出願のこの実施形態では限定されない。
第3の場合、ターゲットネットワークの故障特徴がターゲットネットワークの知識グラフ上の各異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を含むとき、ステップ202の実現プロセスは以下を含む。知識グラフ上の各異常イベントエンティティについて、管理デバイスは、知識グラフから、異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得する。ターゲット異常イベントエンティティと異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である。
任意選択で、グラフ検索の深さパラメータはMであるように構成される。管理デバイスは、深さ優先アルゴリズムに従って、異常イベントエンティティをヘッドノードとして、知識グラフ上の異常イベントエンティティの深さ範囲M内の他の異常イベントエンティティ(すなわち、ターゲット異常イベントエンティティ)を取得する。
例えば、M=3である場合、図5に示す知識グラフを参照すると、異常イベントエンティティaをヘッドノードとして、深さ範囲M内の他の異常イベントエンティティは、異常イベントエンティティbを含む。異常イベントエンティティaに対応する隣接異常イベントエンティティ特徴は、{異常イベントエンティティa-異常ネットワークエンティティA-異常ネットワークエンティティB-異常イベントエンティティb}として表されてもよい。異常イベントエンティティbをヘッドノードとして、深さ範囲M内の他の異常イベントエンティティは、異常イベントエンティティaと、異常イベントエンティティcとを含む。異常イベントエンティティbに対応する隣接異常イベントエンティティ特徴は、{異常イベントエンティティb-異常ネットワークエンティティB-異常ネットワークエンティティA-異常イベントエンティティa;異常イベントエンティティb-異常ネットワークエンティティB-異常ネットワークエンティティH-異常イベントエンティティc}として表されてもよい。異常イベントエンティティcをヘッドノードとして、深さ範囲M内の他の異常イベントエンティティは、異常イベントエンティティbと、異常イベントエンティティdとを含む。異常イベントエンティティcに対応する隣接異常イベントエンティティ特徴は、以下のように、すなわち、{異常イベントエンティティc-異常ネットワークエンティティH-異常ネットワークエンティティB-異常イベントエンティティb;異常イベントエンティティc-異常ネットワークエンティティH-異常ネットワークエンティティI-異常イベントエンティティd}として表されてもよい。異常イベントエンティティdをヘッドノードとして、深さ範囲M内の他の異常イベントエンティティは、異常イベントエンティティcと、異常イベントエンティティeとを含む。異常イベントエンティティdに対応する隣接異常イベントエンティティ特徴は、{異常イベントエンティティd-異常ネットワークエンティティI-異常ネットワークエンティティH-異常イベントエンティティc;異常イベントエンティティd-異常ネットワークエンティティI-異常ネットワークエンティティJ-異常イベントエンティティe}として表されてもよい。異常イベントエンティティeをヘッドノードとして、深さ範囲M内の他の異常イベントエンティティは、異常イベントエンティティdを含む。異常イベントエンティティeに対応する隣接異常イベントエンティティ特徴は、{異常イベントエンティティe-異常ネットワークエンティティJ-異常ネットワークエンティティI-異常イベントエンティティd}として表されてもよい。明らかに、各異常イベントエンティティに対応する隣接異常イベントエンティティ特徴も、グラフにより表されてもよい。これは、この出願のこの実施形態では限定されない。
ステップ203:ターゲットネットワークの故障特徴に基づいて、ターゲットネットワークの故障根本原因を決定する。
任意選択で、管理デバイスは、ターゲットネットワークの故障特徴を故障根本原因推定モデルに入力して、故障特徴に基づいて故障根本原因推定モデルにより出力されたターゲットネットワークの故障根本原因を取得する。故障根本原因推定モデルは、既知の故障根本原因の複数の知識グラフサンプルに基づく訓練を通じて取得される。任意選択で、管理デバイスが故障根本原因推定モデルを取得するプロセスは以下を含む。
ステップ2031:管理デバイスは、既知の故障根本原因の複数の知識グラフサンプルを取得し、知識グラフサンプルのそれぞれは、知識グラフサンプルが属するネットワークにおいて故障が発生したとき、知識グラフサンプルが属するネットワークにおいて異常イベントを生成した全ての異常ネットワークエンティティと、異常ネットワークエンティティにより生成された異常イベントを示すために使用される異常イベントエンティティとを識別する。
任意選択で、知識グラフサンプルのそれぞれは、故障根本原因に対応する。例えば、知識グラフサンプルの概略図については、図5を参照する。
ステップ2032:管理デバイスは、複数の知識グラフサンプルに基づいて、知識グラフサンプルのそれぞれが属するネットワークの故障特徴を決定する。
任意選択で、知識グラフサンプルが属するネットワークの故障特徴は、知識グラフサンプルと故障伝搬関係ライブラリとの間の故障一致度、知識グラフサンプル上の各異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴、及び/又は知識グラフサンプル上の各異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を含む。
知識グラフサンプルのそれぞれについて、管理デバイスは、知識グラフサンプルと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、知識グラフサンプルと故障伝搬関係ライブラリとの間の故障一致度を決定し、及び/又は知識グラフサンプル上の各異常ネットワークエンティティについて、管理デバイスは、異常ネットワークエンティティの隣接ネットワークエンティティを取得して、異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得し、及び/又は知識グラフサンプル上の各異常イベントエンティティについて、管理デバイスは、知識グラフサンプルから、異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得し、ターゲット異常イベントエンティティと異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である。管理デバイスが、知識グラフサンプルに基づいて、知識グラフサンプルが属するネットワークの故障特徴を決定する実現プロセスについては、ステップ202において、管理デバイスがターゲットネットワークの故障特徴を決定する実現プロセスを参照する。この出願のこの実施形態では、詳細はここでは再び説明しない。
ステップ2033:管理デバイスは、知識グラフサンプルのそれぞれが属するネットワークの故障特徴と、知識グラフサンプルのそれぞれに対応する故障根本原因とに基づいた訓練を通じて、故障根本原因推定モデルを取得する。
故障根本原因推定モデルは、本質的に、ネットワークの故障特徴とネットワークの故障根本原因との間の対応関係を反映できるデータオブジェクトである。この出願のこの実施形態では、管理デバイスは、複数の知識グラフサンプルが属するネットワークの故障特徴と、各知識グラフサンプルに対応する故障根本原因(すなわち、ラベル)とに基づいて、教師付き学習アルゴリズムに従った複数回の反復訓練を実行して、故障根本原因推定モデルを取得する。
任意選択で、代替として、故障根本原因推定モデルは、他のデバイスによる訓練を通じて取得され、次いで、管理デバイスに送信されてもよい。これは、この出願のこの実施形態では限定されない。
任意選択で、ターゲットネットワークの故障根本原因を決定した後に、管理デバイスは、OSS又は端末デバイスによる表示のために、ターゲットネットワークの故障根本原因をオペレーションサポートシステム(operations support system, OSS)又は管理デバイスに接続された他の端末デバイスに送信してもよく、それにより、運用及び保守担当者は、ターゲットネットワークの故障根本原因を迅速に取得して、トラブルシューティングの効率を改善し、言い換えると、ネットワークデバイスが故障状態から動作状態に変化する期間を短縮する。ネットワークデバイスが故障状態から動作状態に変化する期間はまた、平均修復時間(mean time to recovery, MTTR)とも呼ばれてもよい。
この出願のこの実施形態では、管理デバイスは1つ以上のデバイスを含んでもよい。管理デバイスが1つのデバイスを含むとき、上記の故障根本原因決定方法に含まれる全てのステップは、当該デバイスにより実行される。代替として、管理デバイスが複数のデバイスを含むとき、例えば、第1のデバイスと、第2のデバイスと、第3のデバイスとを含むとき、第1のデバイスは、故障が発生したターゲットネットワークの知識グラフを生成し、ターゲットネットワークの知識グラフを第2のデバイスに送信してもよい。第2のデバイスは、故障が発生したターゲットネットワークの知識グラフに基づいてターゲットネットワークの故障特徴を決定し、ターゲットネットワークの故障特徴を第3のデバイスに送信する。第3のデバイスは、ターゲットネットワークの故障特徴に基づいて、ターゲットネットワークの故障根本原因を決定する。
この出願のこの実施形態において提供される故障根本原因決定方法におけるステップのシーケンスは、適切に調整されてもよく、ステップはまた、状況に基づいて対応して増加又は減少してもよい。この出願に開示される技術的範囲内で当業者により容易に理解される如何なる変更も、この出願の保護範囲内に含まれるものとする。詳細はここでは説明しない。
要するに、この出願のこの実施形態において提供される故障根本原因決定方法では、故障が発生したネットワークの故障特徴は、故障が発生したネットワークの知識グラフに基づいて決定される。知識グラフは全体のネットワークに基づいて生成され、ネットワークの取得された故障特徴も全体のネットワークに基づくので、この出願のこの実施形態では、ネットワークの故障根本原因がネットワークの故障特徴に基づいて決定されるとき、デバイスの間の故障伝搬が考慮できる。これは、ネットワークにおける故障根本原因を決定する精度を改善する。さらに、この出願では、既知の故障根本原因の複数の知識グラフサンプルに基づく訓練を通じて取得された故障根本原因推定モデルが、ネットワークの故障根本原因を決定するために使用されて、ネットワークにおける故障根本原因を正確に決定し、ネットワークにおける故障根本原因の異常表現が故障根本原因として決定されるのを防止し、ネットワークにおける故障根本原因を決定する精度を更に改善する。
図6は、この出願の実施形態による故障根本原因決定装置の概略構造図である。故障根本原因決定装置は、図1に示す適用シナリオにおいて管理デバイス101に適用されてもよい。図6に示すように、装置60は、
故障が発生したターゲットネットワークの故障特徴を取得するように構成された第1の取得モジュール601であり、故障特徴は、故障が発生したターゲットネットワークの知識グラフに基づいて決定され、知識グラフは、ネットワークエンティティと異常イベントエンティティとを含み、異常イベントエンティティは、異常ネットワークエンティティに接続され、異常ネットワークエンティティは、ターゲットネットワークにおいて異常イベントを生成したネットワークエンティティであり、異常イベントエンティティは、異常ネットワークエンティティにより生成された異常イベントを示すように構成され、ネットワークエンティティのタイプは、ネットワークデバイス、インタフェース、プロトコル又はサービスである、第1の取得モジュール601と、
故障特徴に基づいて、ターゲットネットワークの故障根本原因を決定するように構成された第1の決定モジュール602と
を含む。
要するに、この出願のこの実施形態において提供される故障根本原因決定装置では、故障が発生したネットワークの故障特徴は、故障が発生したネットワークの知識グラフに基づいて決定される。知識グラフは全体のネットワークに基づいて生成され、ネットワークの取得された故障特徴も全体のネットワークに基づくので、この出願のこの実施形態では、ネットワークの故障根本原因がネットワークの故障特徴に基づいて決定されるとき、デバイスの間の故障伝搬が考慮できる。これは、ネットワークにおける故障根本原因を決定する精度を改善する。
任意選択で、第1の決定モジュールは、故障特徴を故障根本原因推定モデルに入力して、故障特徴に基づいて故障根本原因推定モデルにより出力されたターゲットネットワークの故障根本原因を取得するように構成され、故障根本原因推定モデルは、既知の故障根本原因の複数の知識グラフサンプルに基づく訓練を通じて取得される。
任意選択で、第1の取得モジュールは、故障が発生したターゲットネットワークの知識グラフを取得し、知識グラフに基づいてターゲットネットワークの故障特徴を決定するように構成される。
任意選択で、第1の取得モジュールは、知識グラフと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、知識グラフと故障伝搬関係ライブラリとの間の故障一致度を決定し、及び/又は知識グラフ上の各異常ネットワークエンティティについて、異常ネットワークエンティティの隣接ネットワークエンティティを取得して、異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得し、及び/又は知識グラフ上の各異常イベントエンティティについて、知識グラフから、異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得し、ターゲット異常イベントエンティティと異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である、ように更に構成される。
任意選択で、図7に示すように、当該装置60は、
既知の故障根本原因の複数の知識グラフサンプルを取得するように構成された第2の取得モジュール603であり、知識グラフサンプルのそれぞれは、知識グラフサンプルが属するネットワークにおいて故障が発生したとき、知識グラフサンプルが属するネットワークにおいて異常イベントを生成した全ての異常ネットワークエンティティと、異常ネットワークエンティティにより生成された異常イベントを示すために使用される異常イベントエンティティとを識別する、第2の取得モジュール603と、
複数の知識グラフサンプルに基づいて、知識グラフサンプルのそれぞれが属するネットワークの故障特徴を決定するように構成された第2の決定モジュール604と、
知識グラフサンプルのそれぞれが属するネットワークの故障特徴と、知識グラフサンプルのそれぞれに対応する故障根本原因とに基づいた訓練を通じて、故障根本原因推定モデルを取得するように構成された訓練モジュール605とを更に含む。
任意選択で、第2の決定モジュールは、知識グラフサンプルのそれぞれについて、知識グラフサンプルと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、知識グラフサンプルと故障伝搬関係ライブラリとの間の故障一致度を決定し、及び/又は知識グラフサンプル上の各異常ネットワークエンティティについて、異常ネットワークエンティティの隣接ネットワークエンティティを取得して、異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得し、及び/又は知識グラフサンプル上の各異常イベントエンティティについて、知識グラフサンプルから、異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得し、ターゲット異常イベントエンティティと異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である、ように構成される。
任意選択で、知識グラフサンプルのそれぞれは、故障根本原因に対応する。
要するに、この出願のこの実施形態において提供される故障根本原因決定装置では、故障が発生したネットワークの故障特徴は、故障が発生したネットワークの知識グラフに基づいて決定される。知識グラフは全体のネットワークに基づいて生成され、ネットワークの取得された故障特徴も全体のネットワークに基づくので、この出願のこの実施形態では、ネットワークの故障根本原因がネットワークの故障特徴に基づいて決定されるとき、デバイスの間の故障伝搬が考慮できる。これは、ネットワークにおける故障根本原因を決定する精度を改善する。さらに、この出願では、既知の故障根本原因の複数の知識グラフサンプルに基づく訓練を通じて取得された故障根本原因推定モデルが、ネットワークの故障根本原因を決定するために使用されて、ネットワークにおける故障根本原因を正確に決定し、ネットワークにおける故障根本原因の異常表現が故障根本原因として決定されるのを防止し、ネットワークにおける故障根本原因を決定する精度を更に改善する。
図8は、この出願の他の実施形態による故障根本原因決定装置の概略構造図である。故障根本原因決定装置は、図1に示す適用シナリオにおける管理デバイス101に適用されてもよい。図8に示すように、当該装置80は、
故障が発生したターゲットネットワークの知識グラフを取得するように構成された取得モジュール801であり、知識グラフは、ネットワークエンティティと異常イベントエンティティとを含み、異常イベントエンティティは、異常ネットワークエンティティに接続され、異常ネットワークエンティティは、ターゲットネットワークにおいて異常イベントを生成したネットワークエンティティであり、異常イベントエンティティは、異常ネットワークエンティティにより生成された異常イベントを示すように構成され、ネットワークエンティティのタイプは、ネットワークデバイス、インタフェース、プロトコル又はサービスである、取得モジュール801と、
知識グラフに基づいて、ターゲットネットワークの故障特徴を決定するように構成された決定モジュール802であり、故障特徴は、ターゲットネットワークの故障根本原因を決定するために使用される、決定モジュール802と
を含む。
任意選択で、決定モジュールは、知識グラフと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、知識グラフと故障伝搬関係ライブラリとの間の故障一致度を決定し、及び/又は知識グラフ上の各異常ネットワークエンティティについて、異常ネットワークエンティティの隣接ネットワークエンティティを取得して、異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得し、及び/又は知識グラフ上の各異常イベントエンティティについて、知識グラフから、異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得し、ターゲット異常イベントエンティティと異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である、ように構成される。
要するに、この出願のこの実施形態において提供される故障根本原因決定装置では、故障が発生したネットワークの故障特徴は、故障が発生したネットワークの知識グラフに基づいて決定される。知識グラフは全体のネットワークに基づいて生成され、ネットワークの取得された故障特徴も全体のネットワークに基づくので、この出願のこの実施形態では、ネットワークの故障根本原因がネットワークの故障特徴に基づいて決定されるとき、デバイスの間の故障伝搬が考慮できる。これは、ネットワークにおける故障根本原因を決定する精度を改善する。
上記の実施形態における装置について、各モジュールにより動作を実行する具体的な方式は、方法に関係する実施形態において詳細に記載されている。詳細はここでは説明しない。
図9は、この出願の実施形態による故障根本原因決定装置のブロック図である。故障根本原因決定装置は管理デバイスでもよく、管理デバイスは、ネットワークコントローラ、ネットワーク管理デバイス、ゲートウェイ又は制御能力を有する他のデバイスでもよい。図9に示すように、管理デバイス90は、プロセッサ901及びメモリ902を含む。
メモリ902は、コンピュータプログラムを記憶するように構成され、コンピュータプログラムはプログラム命令を含む。
プロセッサ901は、コンピュータプログラムを呼び出して、図2に示す故障根本原因決定方法における1つ以上のステップを実現するように構成される。
任意選択で、管理デバイス90は、通信バス903及び通信インタフェース904を更に含む。
プロセッサ901は、1つ以上の処理コアを含み、プロセッサ901は、コンピュータプログラムを実行することにより、様々な機能アプリケーション及びデータ処理を実行する。
メモリ902は、コンピュータプログラムを記憶するように構成されてもよい。任意選択で、メモリは、少なくとも1つの機能により必要とされるオペレーティングシステム及びアプリケーションプログラムユニットを記憶してもよい。オペレーティングシステムは、リアルタイムオペレーティングシステム(Real Time eXecutive, RTX)、LINUX、UNIX、WINDOWS又はOS Xのようなオペレーティングシステムでもよい。
複数の通信インタフェース904が存在してもよく、通信インタフェース904は、他の記憶デバイス又はネットワークデバイスと通信し、例えば、制御デバイス又はネットワークデバイスと通信するように構成される。
メモリ902及び通信インタフェース904は、通信バス903を使用することにより、プロセッサ901に別々に接続される。
この出願の実施形態は、コンピュータ記憶媒体を更に提供する。コンピュータ記憶媒体は命令を記憶する。命令がプロセッサにより実行されるとき、図2に示す故障根本原因決定方法が実現される。
当業者は、実施形態のステップの全部又は一部が、ハードウェア又は関連するハードウェアに命令するプログラムにより実現されてもよいことを理解し得る。プログラムは、コンピュータ読み取り可能記憶媒体に記憶されてもよい。記憶媒体は、読み取り専用メモリ、磁気ディスク又は光ディスクを含んでもよい。
この出願の実施形態において、「第1」、「第2」及び「第3」という用語は、単に説明の目的のために使用されており、相対的重要度の指示又は意味として理解されないものとする。
この出願における「及び/又は」という用語は、関連する物を記述するための関連付け関係のみを記述し、3つの関係が存在し得ることを表す。例えば、A及び/又はBは、以下の3つの場合、すなわち、Aのみが存在すること、AとBとの双方が存在すること、及びBのみが存在することを表してもよい。さらに、この明細書における「/」という記号は、一般的に、関連する物の間の「又は」の関係を示す。
上記の説明は、この出願の単なる任意選択の実施形態であるが、この出願を限定することを意図するものではない。この出願の概念及び原理から逸脱することなく行われる如何なる修正、等価置換又は改良も、この出願の保護範囲に含まれるべきである。

Claims (21)

  1. 故障根本原因決定方法であって、
    故障が発生したターゲットネットワークの故障特徴を取得するステップであり、前記故障特徴は、前記故障が発生した前記ターゲットネットワークの知識グラフに基づいて決定され、前記知識グラフは、ネットワークエンティティと異常イベントエンティティとを含み、前記異常イベントエンティティは、異常ネットワークエンティティに接続され、前記異常ネットワークエンティティは、前記ターゲットネットワークにおいて異常イベントを生成したネットワークエンティティであり、前記異常イベントエンティティは、前記異常ネットワークエンティティにより生成された前記異常イベントを示すように構成され、前記ネットワークエンティティのタイプは、ネットワークデバイス、インタフェース、プロトコル又はサービスである、ステップと、
    前記故障特徴に基づいて、前記ターゲットネットワークの故障根本原因を決定するステップと
    を含む方法。
  2. 前記故障特徴に基づいて、前記ターゲットネットワークの故障根本原因を決定するステップは、
    前記故障特徴を故障根本原因推定モデルに入力して、前記故障特徴に基づいて前記故障根本原因推定モデルにより出力された前記ターゲットネットワークの前記故障根本原因を取得するステップであり、前記故障根本原因推定モデルは、既知の故障根本原因の複数の知識グラフサンプルに基づく訓練を通じて取得される、ステップを含む、請求項1に記載の方法。
  3. 故障が発生したターゲットネットワークの故障特徴を取得するステップは、
    前記故障が発生した前記ターゲットネットワークの前記知識グラフを取得するステップと、
    前記知識グラフに基づいて前記ターゲットネットワークの前記故障特徴を決定するステップと
    を含む、請求項1又は2に記載の方法。
  4. 前記知識グラフに基づいて、前記ターゲットネットワークの前記故障特徴を決定するステップは、
    前記知識グラフと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、前記知識グラフと前記故障伝搬関係ライブラリとの間の故障一致度を決定するステップ、及び/又は
    前記知識グラフ上の各異常ネットワークエンティティについて、前記異常ネットワークエンティティの隣接ネットワークエンティティを取得して、前記異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得するステップ、及び/又は
    前記知識グラフ上の各異常イベントエンティティについて、前記知識グラフから、前記異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、前記異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得するステップであり、前記ターゲット異常イベントエンティティと前記異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である、ステップ
    を含む、請求項3に記載の方法。
  5. 既知の故障根本原因の複数の知識グラフサンプルを取得するステップであり、前記知識グラフサンプルのそれぞれは、前記知識グラフサンプルが属するネットワークにおいて故障が発生したとき、前記知識グラフサンプルが属する前記ネットワークにおいて異常イベントを生成した全ての異常ネットワークエンティティと、前記異常ネットワークエンティティにより生成された前記異常イベントを示すために使用される前記異常イベントエンティティとを識別する、ステップと、
    前記複数の知識グラフサンプルに基づいて、前記知識グラフサンプルのそれぞれが属する前記ネットワークの故障特徴を決定するステップと、
    前記知識グラフサンプルのそれぞれが属する前記ネットワークの前記故障特徴と、前記知識グラフサンプルのそれぞれに対応する故障根本原因とに基づいた訓練を通じて、前記故障根本原因推定モデルを取得するステップと
    を更に含む、請求項1乃至4のうちいずれか1項に記載の方法。
  6. 前記複数の知識グラフサンプルに基づいて、前記知識グラフサンプルのそれぞれが属する前記ネットワークの故障特徴を決定するステップは、
    前記知識グラフサンプルのそれぞれについて、
    前記知識グラフサンプルと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、前記知識グラフサンプルと前記故障伝搬関係ライブラリとの間の故障一致度を決定するステップ、及び/又は
    前記知識グラフサンプル上の各異常ネットワークエンティティについて、前記異常ネットワークエンティティの隣接ネットワークエンティティを取得して、前記異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得するステップ、及び/又は
    前記知識グラフサンプル上の各異常イベントエンティティについて、前記知識グラフサンプルから、前記異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、前記異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得するステップであり、前記ターゲット異常イベントエンティティと前記異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である、ステップ
    を含む、請求項5に記載の方法。
  7. 前記知識グラフサンプルのそれぞれは、故障根本原因に対応する、請求項5又は6に記載の方法。
  8. 故障根本原因決定方法であって、
    故障が発生したターゲットネットワークの知識グラフを取得するステップであり、前記知識グラフは、ネットワークエンティティと異常イベントエンティティとを含み、前記異常イベントエンティティは、異常ネットワークエンティティに接続され、前記異常ネットワークエンティティは、前記ターゲットネットワークにおいて異常イベントを生成したネットワークエンティティであり、前記異常イベントエンティティは、前記異常ネットワークエンティティにより生成された前記異常イベントを示すように構成され、前記ネットワークエンティティのタイプは、ネットワークデバイス、インタフェース、プロトコル又はサービスである、ステップと、
    前記知識グラフに基づいて、前記ターゲットネットワークの故障特徴を決定するステップであり、前記故障特徴は、前記ターゲットネットワークの故障根本原因を決定するために使用される、ステップと
    を含む方法。
  9. 前記知識グラフに基づいて、前記ターゲットネットワークの故障特徴を決定するステップは、
    前記知識グラフと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、前記知識グラフと前記故障伝搬関係ライブラリとの間の故障一致度を決定するステップ、及び/又は
    前記知識グラフ上の各異常ネットワークエンティティについて、前記異常ネットワークエンティティの隣接ネットワークエンティティを取得して、前記異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得するステップ、及び/又は
    前記知識グラフ上の各異常イベントエンティティについて、前記知識グラフから、前記異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、前記異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得するステップであり、前記ターゲット異常イベントエンティティと前記異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である、ステップ
    を含む、請求項8に記載の方法。
  10. 故障根本原因決定装置であって、
    故障が発生したターゲットネットワークの故障特徴を取得するように構成された第1の取得モジュールであり、前記故障特徴は、前記故障が発生した前記ターゲットネットワークの知識グラフに基づいて決定され、前記知識グラフは、ネットワークエンティティと異常イベントエンティティとを含み、前記異常イベントエンティティは、異常ネットワークエンティティに接続され、前記異常ネットワークエンティティは、前記ターゲットネットワークにおいて異常イベントを生成したネットワークエンティティであり、前記異常イベントエンティティは、前記異常ネットワークエンティティにより生成された前記異常イベントを示すように構成され、前記ネットワークエンティティのタイプは、ネットワークデバイス、インタフェース、プロトコル又はサービスである、第1の取得モジュールと、
    前記故障特徴に基づいて、前記ターゲットネットワークの故障根本原因を決定するように構成された第1の決定モジュールと
    を含む装置。
  11. 前記第1の決定モジュールは、
    前記故障特徴を故障根本原因推定モデルに入力して、前記故障特徴に基づいて前記故障根本原因推定モデルにより出力された前記ターゲットネットワークの前記故障根本原因を取得するように構成され、前記故障根本原因推定モデルは、既知の故障根本原因の複数の知識グラフサンプルに基づく訓練を通じて取得される、請求項10に記載の装置。
  12. 前記第1の取得モジュールは、
    前記故障が発生した前記ターゲットネットワークの前記知識グラフを取得し、
    前記知識グラフに基づいて前記ターゲットネットワークの前記故障特徴を決定するように構成される、請求項10又は11に記載の装置。
  13. 前記第1の取得モジュールは、
    前記知識グラフと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、前記知識グラフと前記故障伝搬関係ライブラリとの間の故障一致度を決定し、及び/又は
    前記知識グラフ上の各異常ネットワークエンティティについて、前記異常ネットワークエンティティの隣接ネットワークエンティティを取得して、前記異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得し、及び/又は
    前記知識グラフ上の各異常イベントエンティティについて、前記知識グラフから、前記異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、前記異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得し、前記ターゲット異常イベントエンティティと前記異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である、
    ように更に構成される、請求項12に記載の装置。
  14. 既知の故障根本原因の前記複数の知識グラフサンプルを取得するように構成された第2の取得モジュールであり、前記知識グラフサンプルのそれぞれは、前記知識グラフサンプルが属するネットワークにおいて故障が発生したとき、前記知識グラフサンプルが属する前記ネットワークにおいて異常イベントを生成した全ての異常ネットワークエンティティと、前記異常ネットワークエンティティにより生成された前記異常イベントを示すために使用される前記異常イベントエンティティとを識別する、第2の取得モジュールと、
    前記複数の知識グラフサンプルに基づいて、前記知識グラフサンプルのそれぞれが属する前記ネットワークの故障特徴を決定するように構成された第2の決定モジュールと、
    前記知識グラフサンプルのそれぞれが属する前記ネットワークの前記故障特徴と、前記知識グラフサンプルのそれぞれに対応する故障根本原因とに基づいた訓練を通じて、前記故障根本原因推定モデルを取得するように構成された訓練モジュールと
    を更に含む、請求項10乃至13のうちいずれか1項に記載の装置。
  15. 前記第2の決定モジュールは、
    前記知識グラフサンプルのそれぞれについて、
    前記知識グラフサンプルと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、前記知識グラフサンプルと前記故障伝搬関係ライブラリとの間の故障一致度を決定し、及び/又は
    前記知識グラフサンプル上の各異常ネットワークエンティティについて、前記異常ネットワークエンティティの隣接ネットワークエンティティを取得して、前記異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得し、及び/又は
    前記知識グラフサンプル上の各異常イベントエンティティについて、前記知識グラフサンプルから、前記異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、前記異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得し、前記ターゲット異常イベントエンティティと前記異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である、
    ように構成される、請求項14に記載の装置。
  16. 前記知識グラフサンプルのそれぞれは、故障根本原因に対応する、請求項14又は15に記載の装置。
  17. 故障根本原因決定装置であって、
    故障が発生したターゲットネットワークの知識グラフを取得するように構成された取得モジュールであり、前記知識グラフは、ネットワークエンティティと異常イベントエンティティとを含み、前記異常イベントエンティティは、異常ネットワークエンティティに接続され、前記異常ネットワークエンティティは、前記ターゲットネットワークにおいて異常イベントを生成したネットワークエンティティであり、前記異常イベントエンティティは、前記異常ネットワークエンティティにより生成された前記異常イベントを示すように構成され、前記ネットワークエンティティのタイプは、ネットワークデバイス、インタフェース、プロトコル又はサービスである、取得モジュールと、
    前記知識グラフに基づいて、前記ターゲットネットワークの故障特徴を決定するように構成された決定モジュールであり、前記故障特徴は、前記ターゲットネットワークの故障根本原因を決定するために使用される、決定モジュールと
    を含む装置。
  18. 前記決定モジュールは、
    前記知識グラフと故障伝搬関係ライブラリ内の各故障伝搬関係との間の一致度に基づいて、前記知識グラフと前記故障伝搬関係ライブラリとの間の故障一致度を決定し、及び/又は
    前記知識グラフ上の各異常ネットワークエンティティについて、前記異常ネットワークエンティティの隣接ネットワークエンティティを取得して、前記異常ネットワークエンティティに対応する隣接ネットワークエンティティ特徴を取得し、及び/又は
    前記知識グラフ上の各異常イベントエンティティについて、前記知識グラフから、前記異常イベントエンティティから各ターゲット異常イベントエンティティへの経路を取得して、前記異常イベントエンティティに対応する隣接異常イベントエンティティ特徴を取得し、前記ターゲット異常イベントエンティティと前記異常イベントエンティティとの間のホップカウントはM以下であり、Mは正の整数である、
    ように構成される、請求項17に記載の装置。
  19. プロセッサ及びメモリを含む故障根本原因決定装置であって、
    前記メモリは、コンピュータプログラムを記憶するように構成され、前記コンピュータプログラムはプログラム命令を含み、
    前記プロセッサは、前記コンピュータプログラムを呼び出して、請求項1乃至7のうちいずれか1項に記載の故障根本原因決定方法を実現するように構成される、装置。
  20. プロセッサ及びメモリを含む故障根本原因決定装置であって、
    前記メモリは、コンピュータプログラムを記憶するように構成され、前記コンピュータプログラムはプログラム命令を含み、
    前記プロセッサは、前記コンピュータプログラムを呼び出して、請求項8又は9に記載の故障根本原因決定方法を実現するように構成される、装置。
  21. コンピュータ記憶媒体であって、当該コンピュータ記憶媒体は命令を記憶し、前記命令がプロセッサにより実行されたとき、請求項1乃至9のうちいずれか1項に記載の故障根本原因決定方法が実現される、コンピュータ記憶媒体。
JP2020196836A 2019-11-30 2020-11-27 故障根本原因決定方法及び装置並びにコンピュータ記憶媒体 Active JP7108674B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201911208147.9A CN112887119B (zh) 2019-11-30 2019-11-30 故障根因确定方法及装置、计算机存储介质
CN201911208147.9 2019-11-30

Publications (2)

Publication Number Publication Date
JP2021087222A true JP2021087222A (ja) 2021-06-03
JP7108674B2 JP7108674B2 (ja) 2022-07-28

Family

ID=73646170

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020196836A Active JP7108674B2 (ja) 2019-11-30 2020-11-27 故障根本原因決定方法及び装置並びにコンピュータ記憶媒体

Country Status (5)

Country Link
US (1) US11362884B2 (ja)
EP (1) EP3882772A1 (ja)
JP (1) JP7108674B2 (ja)
KR (1) KR102480708B1 (ja)
CN (1) CN112887119B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024004351A1 (ja) * 2022-06-30 2024-01-04 株式会社日立製作所 プロセッサシステムおよび不具合診断方法
WO2024057531A1 (en) * 2022-09-16 2024-03-21 Rakuten Mobile, Inc. System, method, and medium for proactive monitoring of a network

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7010268B2 (ja) * 2019-04-19 2022-01-26 オムロン株式会社 通信監視システムおよび通信監視方法
CN114528132A (zh) * 2020-10-30 2022-05-24 伊姆西Ip控股有限责任公司 存储系统故障的深层次原因分析
US11775753B1 (en) * 2021-04-05 2023-10-03 Robert Stanley Grondalski Method for converting parser determined sentence parts to computer understanding state machine states that understand the sentence in connection with a computer understanding state machine
CN113098723B (zh) * 2021-06-07 2021-09-17 新华三人工智能科技有限公司 一种故障根因定位方法、装置、存储介质及设备
CN113572633B (zh) * 2021-06-15 2023-05-19 阿里巴巴新加坡控股有限公司 根因定位方法、系统、设备及存储介质
CN113535449B (zh) * 2021-07-08 2024-05-03 平安科技(深圳)有限公司 异常事件修复处理方法、装置、计算机设备及存储介质
US20230069074A1 (en) * 2021-08-20 2023-03-02 Nec Laboratories America, Inc. Interdependent causal networks for root cause localization
CN115883320A (zh) * 2021-09-27 2023-03-31 中国联合网络通信集团有限公司 网络设备异常分析方法、装置、电子设备及可读存储介质
CN113608916B (zh) * 2021-10-08 2022-01-04 苏州浪潮智能科技有限公司 故障诊断的方法、装置、电子设备及存储介质
CN114024836B (zh) * 2021-11-03 2023-08-25 中盈优创资讯科技有限公司 一种stn网络a环断点确定方法及装置
CN114422325A (zh) * 2021-12-30 2022-04-29 优刻得科技股份有限公司 内容分发网络异常定位方法、装置、设备及存储介质
CN114785674A (zh) * 2022-04-27 2022-07-22 中国电信股份有限公司 故障定位方法及装置、计算机可存储介质
CN114978877B (zh) * 2022-05-13 2024-04-05 京东科技信息技术有限公司 一种异常处理方法、装置、电子设备及计算机可读介质
CN115022153B (zh) * 2022-06-07 2024-04-23 中国工商银行股份有限公司 故障根因分析方法、装置、设备和存储介质
CN117540228A (zh) * 2022-07-29 2024-02-09 中兴通讯股份有限公司 故障处理方法、设备和存储介质
CN116702073B (zh) * 2023-05-18 2024-03-15 德联易控科技(北京)有限公司 一种故障事件的提示方法、装置、电子设备及存储介质
CN117131457B (zh) * 2023-10-26 2024-01-26 杭州海兴泽科信息技术有限公司 基于ai模型的电力大数据采集处理方法及系统
CN117252351B (zh) * 2023-11-20 2024-02-02 上海熠源数据科技有限公司 基于ai大模型的生产质量辅助决策方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002271328A (ja) * 2001-03-09 2002-09-20 Mitsubishi Electric Corp ネットワーク障害解析装置およびネットワーク障害解析方法
JP2005252765A (ja) * 2004-03-05 2005-09-15 Mitsubishi Electric Corp ネットワーク故障判定装置及びネットワーク保守システム及びネットワーク故障判定方法及びプログラム
JP2005269238A (ja) * 2004-03-18 2005-09-29 Fujitsu Ltd ネットワーク障害推定方法及びネットワーク障害推定装置
WO2017109903A1 (ja) * 2015-12-24 2017-06-29 株式会社 東芝 異常原因推定装置及び異常原因推定方法
US20190286504A1 (en) * 2018-03-15 2019-09-19 Ca, Inc. Graph-based root cause analysis

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6393386B1 (en) * 1998-03-26 2002-05-21 Visual Networks Technologies, Inc. Dynamic modeling of complex networks and prediction of impacts of faults therein
US20090055684A1 (en) * 2007-08-23 2009-02-26 Jamjoom Hani T Method and apparatus for efficient problem resolution via incrementally constructed causality model based on history data
US8291263B2 (en) * 2010-07-02 2012-10-16 Oracle International Corporation Methods and apparatus for cross-host diagnosis of complex multi-host systems in a time series with probabilistic inference
US20150170037A1 (en) * 2013-12-16 2015-06-18 Alcatel-Lucent Usa Inc. System and method for identifying historic event root cause and impact in a data center
US9497072B2 (en) * 2014-04-01 2016-11-15 Ca, Inc. Identifying alarms for a root cause of a problem in a data processing system
CN107171819B (zh) * 2016-03-07 2020-02-14 北京华为数字技术有限公司 一种网络故障诊断方法及装置
CN105956665B (zh) * 2016-04-29 2017-06-06 北京清睿智能科技有限公司 一种基于动态不确定因果图的启发式检测系统异常原因的方法
US10977574B2 (en) * 2017-02-14 2021-04-13 Cisco Technology, Inc. Prediction of network device control plane instabilities
WO2018156076A1 (en) * 2017-02-24 2018-08-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and system for fault localization in a cloud environment
US10708152B2 (en) * 2017-03-23 2020-07-07 Cisco Technology, Inc. Predicting application and network performance
US10873794B2 (en) * 2017-03-28 2020-12-22 Cisco Technology, Inc. Flowlet resolution for application performance monitoring and management
US10749883B1 (en) * 2017-05-02 2020-08-18 Hrl Laboratories, Llc Automatic anomaly detector
US10637715B1 (en) * 2017-05-02 2020-04-28 Conviva Inc. Fault isolation in over-the-top content (OTT) broadband networks
US10812318B2 (en) * 2017-05-31 2020-10-20 Cisco Technology, Inc. Associating network policy objects with specific faults corresponding to fault localizations in large-scale network deployment
US10776409B2 (en) * 2017-06-21 2020-09-15 International Business Machines Corporation Recommending responses to emergent conditions
US10902062B1 (en) * 2017-08-24 2021-01-26 Amazon Technologies, Inc. Artificial intelligence system providing dimension-level anomaly score attributions for streaming data
KR101910926B1 (ko) * 2017-09-13 2018-10-23 주식회사 티맥스 소프트 It 시스템의 장애 이벤트를 처리하기 위한 기법
US11106442B1 (en) * 2017-09-23 2021-08-31 Splunk Inc. Information technology networked entity monitoring with metric selection prior to deployment
US10594542B2 (en) * 2017-10-27 2020-03-17 Cisco Technology, Inc. System and method for network root cause analysis
US10666494B2 (en) * 2017-11-10 2020-05-26 Nyansa, Inc. System and method for network incident remediation recommendations
US10616043B2 (en) * 2017-11-27 2020-04-07 Google Llc Real-time probabilistic root cause correlation of network failures
US10761921B2 (en) * 2017-11-30 2020-09-01 Optumsoft, Inc. Automatic root cause analysis using ternary fault scenario representation
CN112074834A (zh) * 2018-05-03 2020-12-11 西门子股份公司 用于运营技术系统的分析装置、方法、系统和存储介质
US20190384255A1 (en) * 2018-06-19 2019-12-19 Honeywell International Inc. Autonomous predictive real-time monitoring of faults in process and equipment
CN110659173B (zh) * 2018-06-28 2023-05-26 中兴通讯股份有限公司 一种运维系统及方法
US10942919B2 (en) * 2018-06-29 2021-03-09 Entigenlogic Llc Generating further knowledge to process query
WO2020014575A1 (en) * 2018-07-12 2020-01-16 Ribbon Communications Telecommunication event object classification based on information from multiple protocols
US10679007B2 (en) * 2018-08-30 2020-06-09 Intelligent Fusion Technology, Inc. Method and system for pattern discovery and real-time anomaly detection based on knowledge graph
EP3633959B1 (en) * 2018-10-05 2024-05-15 Tata Consultancy Services Limited Automation of data analytics in an internet of things (iot) platform
CN109522192B (zh) * 2018-10-17 2020-08-04 北京航空航天大学 一种基于知识图谱和复杂网络组合的预测方法
US11388040B2 (en) * 2018-10-31 2022-07-12 EXFO Solutions SAS Automatic root cause diagnosis in networks
US11126493B2 (en) * 2018-11-25 2021-09-21 Aloke Guha Methods and systems for autonomous cloud application operations
US10915435B2 (en) * 2018-11-28 2021-02-09 International Business Machines Corporation Deep learning based problem advisor
US20200175406A1 (en) * 2018-11-30 2020-06-04 Silot Pte. Ltd. Apparatus and methods for using bayesian program learning for efficient and reliable knowledge reasoning
US11271795B2 (en) * 2019-02-08 2022-03-08 Ciena Corporation Systems and methods for proactive network operations
US11017572B2 (en) * 2019-02-28 2021-05-25 Babylon Partners Limited Generating a probabilistic graphical model with causal information
US11082287B2 (en) * 2019-03-11 2021-08-03 At&T Intellectual Property I, L.P. Data driven systems and methods to isolate network faults
US11531908B2 (en) * 2019-03-12 2022-12-20 Ebay Inc. Enhancement of machine learning-based anomaly detection using knowledge graphs
US11011183B2 (en) * 2019-03-25 2021-05-18 Cisco Technology, Inc. Extracting knowledge from collaborative support sessions
US11275791B2 (en) * 2019-03-28 2022-03-15 International Business Machines Corporation Automatic construction and organization of knowledge graphs for problem diagnoses
CN109992440A (zh) * 2019-04-02 2019-07-09 北京睿至大数据有限公司 一种基于知识图谱和机器学习的it根故障分析识别方法
US11082434B2 (en) * 2019-04-06 2021-08-03 International Business Machines Corporation Inferring temporal relationships for cybersecurity events
US10679133B1 (en) * 2019-06-07 2020-06-09 Peritus.AI, Inc. Constructing and utilizing a knowledge graph for information technology infrastructure
US11115432B2 (en) * 2019-07-08 2021-09-07 Servicenow, Inc. Multi-application recommendation engine for a remote network management platform
US11138163B2 (en) * 2019-07-11 2021-10-05 EXFO Solutions SAS Automatic root cause diagnosis in networks based on hypothesis testing
US11765056B2 (en) * 2019-07-24 2023-09-19 Microsoft Technology Licensing, Llc Techniques for updating knowledge graphs for correlating service events in computer network diagnostics
US10805171B1 (en) * 2019-08-01 2020-10-13 At&T Intellectual Property I, L.P. Understanding network entity relationships using emulation based continuous learning
US11399037B2 (en) * 2019-09-06 2022-07-26 Paypal, Inc. Anomaly behavior detection in interactive networks
US20210103807A1 (en) * 2019-10-07 2021-04-08 Babylon Partners Limited Computer implemented method and system for running inference queries with a generative model
US11640465B2 (en) * 2019-11-13 2023-05-02 Vmware, Inc. Methods and systems for troubleshooting applications using streaming anomaly detection

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002271328A (ja) * 2001-03-09 2002-09-20 Mitsubishi Electric Corp ネットワーク障害解析装置およびネットワーク障害解析方法
JP2005252765A (ja) * 2004-03-05 2005-09-15 Mitsubishi Electric Corp ネットワーク故障判定装置及びネットワーク保守システム及びネットワーク故障判定方法及びプログラム
JP2005269238A (ja) * 2004-03-18 2005-09-29 Fujitsu Ltd ネットワーク障害推定方法及びネットワーク障害推定装置
WO2017109903A1 (ja) * 2015-12-24 2017-06-29 株式会社 東芝 異常原因推定装置及び異常原因推定方法
US20190286504A1 (en) * 2018-03-15 2019-09-19 Ca, Inc. Graph-based root cause analysis

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024004351A1 (ja) * 2022-06-30 2024-01-04 株式会社日立製作所 プロセッサシステムおよび不具合診断方法
WO2024057531A1 (en) * 2022-09-16 2024-03-21 Rakuten Mobile, Inc. System, method, and medium for proactive monitoring of a network

Also Published As

Publication number Publication date
KR102480708B1 (ko) 2022-12-22
CN112887119A (zh) 2021-06-01
CN112887119B (zh) 2022-09-16
KR20210068313A (ko) 2021-06-09
EP3882772A1 (en) 2021-09-22
JP7108674B2 (ja) 2022-07-28
US20210168021A1 (en) 2021-06-03
US11362884B2 (en) 2022-06-14

Similar Documents

Publication Publication Date Title
JP7108674B2 (ja) 故障根本原因決定方法及び装置並びにコンピュータ記憶媒体
CN112787841B (zh) 故障根因定位方法及装置、计算机存储介质
JP7416919B2 (ja) データ処理方法及び装置並びにコンピュータ記憶媒体
WO2022083540A1 (zh) 故障恢复预案确定方法、装置及系统、计算机存储介质
US20060256733A1 (en) Methods and devices for discovering the topology of large multi-subnet LANs
US6944130B1 (en) Method and apparatus for determining a layer 2 path in a switched network
EP3675419A1 (en) Method and apparatus for detecting network fault
EP3190755A1 (en) Identification of the paths taken through a network of interconnected devices
CN108449210B (zh) 一种网络路由故障监测系统
Liang et al. On diagnosis of forwarding plane via static forwarding rules in software defined networks
Kozat et al. On optimal topology verification and failure localization for software defined networks
US20230254244A1 (en) Path determining method and apparatus, and computer storage medium
US20040158780A1 (en) Method and system for presenting neighbors of a device in a network via a graphical user interface
US20230231806A1 (en) Ghost routing
CN116248479A (zh) 网络路径探测方法、装置、设备及存储介质
US11438237B1 (en) Systems and methods for determining physical links between network devices
Andreev et al. An algorithm for building an enterprise network topology using widespread data sources
Gupta et al. NEWS: Towards an Early Warning System for Network Faults.
US20230216763A1 (en) Network reachability verification method and apparatus, and computer storage medium
WO2023094867A1 (en) Method and system for learning and inferencing faults
Andreev et al. Network Topology Discovery: a Problem of Incomplete Data Improvement
CN114519095A (zh) 数据处理方法、装置及系统、计算机存储介质
CN114257516A (zh) 网络可达性验证方法及装置、计算机存储介质
CN116684262A (zh) 获取故障传播关系的方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210105

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220715

R150 Certificate of patent or registration of utility model

Ref document number: 7108674

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150