JP2022547560A - データ処理方法及び装置並びにコンピュータ記憶媒体 - Google Patents

データ処理方法及び装置並びにコンピュータ記憶媒体 Download PDF

Info

Publication number
JP2022547560A
JP2022547560A JP2022515889A JP2022515889A JP2022547560A JP 2022547560 A JP2022547560 A JP 2022547560A JP 2022515889 A JP2022515889 A JP 2022515889A JP 2022515889 A JP2022515889 A JP 2022515889A JP 2022547560 A JP2022547560 A JP 2022547560A
Authority
JP
Japan
Prior art keywords
network
knowledge graph
target network
target
entities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022515889A
Other languages
English (en)
Other versions
JP7416919B2 (ja
Inventor
ワーン,ジョーンユイ
シエ,ユイミーン
ソーン,ウエイ
ジャーン,ジェンウエイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2022547560A publication Critical patent/JP2022547560A/ja
Application granted granted Critical
Publication of JP7416919B2 publication Critical patent/JP7416919B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • H04L41/0853Retrieval of network configuration; Tracking network configuration history by actively collecting configuration information or by backing up configuration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5061Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
    • H04L41/5074Handling of user complaints or trouble tickets

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

データ処理方法及び装置並びにコンピュータ記憶媒体が提供され、ネットワーク技術の分野に属する。管理装置は、ターゲットネットワークのネットワークデータを取得し(201)、ネットワークデータは、ターゲットネットワークのネットワークトポロジと、ターゲットネットワーク内の複数のネットワーク装置の装置情報とを含み、装置情報はインターフェイス構成情報、プロトコル構成情報及びサービス構成情報のうちの1つ以上を含む。管理装置は、ネットワークデータから複数の知識グラフトリプレットを抽出し(202)、各知識グラフトリプレットは2つのネットワークエンティティ及び2つのネットワークエンティティ間の関係を含み、ネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスである。管理装置は、複数の知識グラフトリプレットに基づいてターゲットネットワークの知識グラフを生成する(203)。ターゲットネットワークの知識グラフは、ネットワークデータを可視化するために用いることができる。したがって、ユーザによるネットワーク情報の取得の効率を改善できる。

Description

本願はネットワーク技術の分野に関し、特に、データ処理方法及び装置並びにコンピュータ記憶媒体に関する。
継続的なネットワークの規模拡大に伴い、通信ネットワークにおいてネットワークデータの増加が存在する。大量のネットワークデータから貴重なネットワーク情報をどのように取得するかは、様々な分野の全ての人員にとって課題となっている。
現在、技術者は、手動でコマンドラインを照会することにより、通信ネットワーク内でネットワーク情報を取得し得る。例えば、ネットワーク装置のインターフェイスによってサポートされるルーティングプロトコルに照会する必要がある場合、技術者は、ネットワーク装置のインターフェイス構成に対応するコマンドラインを照会し得る。しかしながら、ネットワーク情報を取得するためにコマンドラインを照会することは非効率的である。
本願は、ネットワーク情報を取得することが非効率であるという既存の課題を解決するために、データ処理方法及び装置並びにコンピュータ記憶媒体を提供する。
第1の態様によれば、データ処理方法が提供される。管理装置は、ターゲットネットワークのネットワークデータを取得し、該ネットワークデータは該ターゲットネットワークのネットワークトポロジと、該ターゲットネットワーク内の複数のネットワーク装置の装置情報とを含み、該装置情報はインターフェイス構成情報、プロトコル構成情報及びサービス構成情報のうちの1つ以上を含む。管理装置は、前記ネットワークデータから複数の知識グラフトリプレットを抽出し、各知識グラフトリプレットは2つのネットワークエンティティと、該2つのネットワークエンティティ間の関係とを含み、該ネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスである。管理装置は、前記複数の知識グラフトリプレットに基づいて、前記ターゲットネットワークの知識グラフを生成する。
本願では、ターゲットネットワークのネットワークデータを取得した後で、管理装置はネットワークデータを処理して、ターゲットネットワークの知識グラフを生成する。ターゲットネットワークの知識グラフは、ターゲットネットワーク内のネットワークエンティティ及び異なるネットワークエンティティ間の関係を直感的に反映することができる。すなわち、ネットワークデータを可視化するために用いることができる。ターゲットネットワークでネットワーク情報を取得する必要がある場合、ユーザは手動でコマンドラインを照会することなく、ターゲットネットワークの知識グラフを見るだけで済む。したがって、ユーザによるネットワーク情報の取得の効率が改善される。
任意で、装置情報はルーティングエントリをさらに含む。すなわち、管理装置は、ネットワーク装置のネットワーク構成情報から知識グラフトリプレットを抽出し得るか又はネットワーク装置のルーティングエントリに基づいて知識グラフトリプレットを取得し得る。
任意で、2つのネットワークエンティティ間の関係は、依存関係、従属関係又は同等関係である。
任意で、管理装置が前記ターゲットネットワークの知識グラフを生成した後に、ターゲットネットワークで障害が起きた場合に、管理装置は前記ターゲットネットワークで発生した異常なイベントをさらに取得し、前記ターゲットネットワークで前記異常なイベントを生じさせた異常なネットワークエンティティを、前記ターゲットネットワークの知識グラフ上で識別し得る。
本願では、ターゲットネットワークの知識グラフ上で異常なネットワークエンティティを識別した後で、管理装置は、OSS又は管理装置に接続されている他の端末装置にターゲットネットワークの知識グラフを送信して、OSS又は端末装置が知識グラフを表示するようにし得る。これは、運用保守エンジニアがターゲットネットワーク内の異常なネットワークエンティティを見るのに役立つ。管理装置は、異常なネットワークエンティティに対応する異常なイベントをOSS又は管理装置に接続された他の端末装置に送信して、OSS又は端末装置が異常なイベントを表示するようにしてもよい。これは、運用保守エンジニアが異常なネットワークエンティティの異常の種類を取得するのに役立つ。
任意で、異常なイベントは、アラームログ、状態変化ログ及び異常キーパフォーマンスインジケータのうちの1つ以上を含む。
任意で、管理装置が、ターゲットネットワークで前記異常なイベントを生じさせた異常なネットワークエンティティを、前記ターゲットネットワークの知識グラフ上で識別した後に、管理装置は、ネットワークエンティティ間の障害伝搬関係に基づいて、前記ターゲットネットワークの知識グラフ上の全ての異常なネットワークエンティティから、1つ以上の根本原因の障害ネットワークエンティティをさらに特定し、前記ターゲットネットワークの知識グラフ上で前記1つ以上の根本原因の障害ネットワークエンティティを識別し得る。
任意で、管理装置は、複数の知識グラフサンプルを取得し、各知識グラフサンプルは、該知識グラフサンプルが属するネットワークで障害が起きた場合に、該知識グラフサンプルが属するネットワークでの異常なイベント及び根本原因の障害ネットワークエンティティを生じさせる全ての異常なネットワークエンティティと同定されている。管理装置は、前記複数の知識グラフサンプルに基づいて、前記障害伝搬関係を特定する。
本願のこの実施形態では、管理装置は、複数の知識グラフサンプルを用いることによってネットワークエンティティ間の障害伝搬関係を学習し、障害伝搬関係に基づいて、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティのうちの根本原因の障害ネットワークエンティティを特定し得る。これは、自動化された推論と、ネットワーク障害の根本原因の特定を実施する。
任意で、前記知識グラフサンプルが属するネットワークは前記ターゲットネットワークであるか又は前記知識グラフサンプルが属するネットワークは、前記ターゲットネットワークと同じネットワークタイプの別のネットワークである。
任意で、管理装置が前記ネットワークデータから複数の知識グラフトリプレットを抽出するプロセスは以下を含む。
前記ターゲットネットワークのネットワークタイプに対応する抽象サービスモデルに基づいて、管理装置は前記ネットワークデータから前記複数の知識グラフトリプレットを抽出し、該抽象サービスモデルは、異なるネットワークエンティティ間の関係を反映するために用いられる。
第2の態様によれば、データ処理装置が提供される。装置は複数の機能モジュールを含み、該複数の機能モジュールは互いに相互に作用して、第1の態様及び第1の態様の実施に係る方法を実施する。複数の機能モジュールはソフトウェア、ハードウェア又はソフトウェアとハードウェアとの組み合わせに基づいて実施されてもよく、複数の機能モジュールは、特定の実施に基づいてランダムに組み合わせら得るか又は分割され得る。
第3の態様によれば、データ処理装置が提供される。装置はプロセッサ及びメモリを含み、
メモリはコンピュータプログラムを記憶するように構成され、コンピュータプログラムはプログラム命令を含み、
プロセッサは前記コンピュータプログラムを呼び出して、第1の態様のいずれかに係るデータ処理方法を実施するように構成されている。
第4の態様によれば、コンピュータ記憶媒体が提供される。コンピュータ記憶媒体は命令を記憶し、該命令がプロセッサによって実行された場合、第1の態様のいずれかに係るデータ処理方法が実施される。
第5の態様によれば、チップが提供される。チップはプログラマブル論理回路及び/又プログラム命令を含む。チップが動作すると、第1の態様のいずれかに係るデータ処理方法が実施される。
本願で提供される技術的解決策によってもたらされる有益な効果は少なくとも以下を含む。
ターゲットネットワークのネットワークデータを取得した後で、管理装置はネットワークデータを処理して、ターゲットネットワークの知識グラフを生成する。ターゲットネットワークの知識グラフは、ターゲットネットワーク内のネットワークエンティティ及び異なるネットワークエンティティ間の関係を直感的に反映することができる。すなわち、ネットワークデータを可視化するために用いることができる。ターゲットネットワークでネットワーク情報を取得する必要がある場合、ユーザは手動でコマンドラインを照会することなく、ターゲットネットワークの知識グラフを見るだけで済む。したがって、ユーザによるネットワーク情報の取得の効率が改善される。加えて、ターゲットネットワークで障害が起きた後に、管理装置は、ターゲットネットワークの異常な位置を直感的に反映するために、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティをさらに識別し得る。また、管理装置は、ネットワークエンティティ間の障害伝搬関係に基づいて、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティのうちの根本原因の障害ネットワークエンティティをさらに特定して、ネットワーク障害の根本原因の自動化された推論及び特定を実施し得る。
図1は、本願の一実施形態に係るデータ処理方法の適用シナリオの概略図である。 図2は、本願の一実施形態に係るデータ処理方法のフローチャートである。 図3は、本願の一実施形態に係る知識グラフトリプレットの概略図である。 図4は、本願の一実施形態に係る知識グラフの概略図である。 図5は、本願の一実施形態に係るデータ処理装置の構造の概略図である。 図6は、本願の一実施形態に係る他のデータ処理装置の構造の概略図である。 図7は、本願の一実施形態に係るさらに別のデータ処理装置の構造の概略図である。 図8は、本願の一実施形態に係るさらに別のデータ処理装置の構造の概略図である。 図9は、本願の一実施形態に係るデータ処理装置のブロック図である。 図10は、本願の一実施形態に係る障害の根本原因の特定装置の構造の概略図である。
本願の目的、技術的解決策及び利点をより明確にするために、添付の図面を参照しながら、本願の実施を以下でさらに詳細に説明する。
図1は、本願の一実施形態に係るデータ処理方法の適用シナリオの概略図である。図1に示すように、適用シナリオは、通信ネットワーク内の管理装置101及びネットワーク装置102a~102c(まとめてネットワーク装置102と呼ぶ)を含む。図1における管理装置及びネットワーク装置の数は一例として用いているにすぎず、本願の実施形態で提供されるデータ処理方法の適用シナリオに対する限定として用いられていない。通信ネットワークは、データセンターネットワーク(data center network、DCN)、大都市エリアネットワーク、ワイドエリアネットワーク、キャンパスネットワーク、仮想ローカルエリアネットワーク(virtual local area network、VLAN)、仮想拡張可能ローカルエリアネットワーク(virtual extensible local area network、VXLAN)等であり得る。通信ネットワークの種類は本願の実施形態では限定されない。
任意で、管理装置101は1つのサーバ又は複数のサーバを含むサーバクラスタであり得るか又はクラウドコンピューティングサービスセンターであり得る。ネットワーク装置102はスイッチ、ルータ等であり得る。任意で、依然図1を参照して、適用シナリオは制御装置103をさらに含み得る。制御装置103は、通信ネットワーク内のネットワーク装置102を管理及び制御するように構成されている。管理装置101は、有線ネットワーク又は無線ネットワークを介して制御装置103に接続され、制御装置103は有線ネットワーク又は無線ネットワークを介してネットワーク装置102に接続されている。制御装置103はネットワークコントローラ、ネットワーク管理装置、ゲートウェイ又は制御能力を有する他の装置であり得る。制御装置103は1つ以上の装置であってもよい。
制御装置103は、制御装置103によって管理される通信ネットワークのネットワークトポロジを記憶し得る。制御装置103は、通信ネットワーク内のネットワーク装置102の装置情報、通信ネットワーク内で生じる異常イベント等を収集し、管理装置101に通信ネットワークのネットワークトポロジ、ネットワーク装置102の装置情報、通信ネットワークで生じる異常イベント等を提供するようにさらに構成されている。ネットワーク装置の装置情報は、ネットワーク装置のネットワーク構成情報、ルーティングエントリ及び/又は等を含む。ネットワーク構成情報は、通常、インターフェイス構成情報、プロトコル構成情報、サービス構成情報等を含む。任意で、制御装置103は、ネットワーク装置102の装置情報及び通信ネットワークで生じる異常イベントを周期的に収集し得る。あるいは、ネットワーク装置102の装置情報が変化した場合、ネットワーク装置102は変化した装置情報を制御装置103に能動的に報告する。通信ネットワークに障害が起きた場合、ネットワーク装置102は、生じた異常イベントを制御装置103に能動的に報告する。もちろん、一部の適用シナリオでは、管理装置は、代替的に、通信ネットワーク内のネットワーク装置に直接接続され得る。つまり、適用シナリオは制御装置を含まなくてもよい。これは、本出願の実施形態で限定されない。
図2は、本願の一実施形態に係るデータ処理方法のフローチャートである。データ処理方法は、図1に示す適用シナリオにおける管理装置101に適用され得る。図2に示すように、本方法は、以下のステップを含む。
ステップ201:ターゲットネットワークのネットワークデータを取得する。
ネットワークデータはターゲットネットワークのネットワークトポロジと、ターゲットネットワーク内の複数のネットワーク装置の装置情報とを含む。ネットワーク装置の装置情報はネットワーク装置のネットワーク構成情報を含み、具体的には、インターフェイス構成情報、プロトコル構成情報及びサービス構成情報のうちの1つ以上を含む。装置情報はルーティングエントリ等をさらに含み得る。任意で、ネットワーク装置のインターフェイス構成情報は、インターフェイスのインターネットプロトコル(Internet Protocol、IP)アドレス、インターフェイスによってサポートされるプロトコルの種類、インターフェイスによってサポートされるサービスの種類等を含む。ネットワーク装置のプロトコル構成情報はプロトコルの識別子を含み、プロトコルの識別子はプロトコルを一意に識別するために用いられ、文字、文字、数字及び/又は等によって表され得る。ネットワーク装置のサービス構成情報は、ネットワーク装置によって用いられるサービス、例えば、仮想プライベートネットワーク(virtual private network、VPN)サービス及び/又は動的ホスト構成プロトコル(Dynamic Host Configuration Protocol、DHCP)サービスを含む。
任意で、ステップ201の実施プロセスは、ターゲットネットワークの制御装置によって送信されるターゲットネットワークのネットワークデータを管理装置が受信することを含む。
ステップ202:ターゲットネットワークのネットワークデータから複数の知識グラフトリプレットを抽出する。
各知識グラフトリプレットは2つのネットワークエンティティ及び2つのネットワークエンティティ間の関係を含む。例えば、2つのネットワークエンティティ間の関係は、依存関係、従属関係又は同等関係である。
本願の実施形態では、ネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスであり得る。例えば、知識グラフトリプレット上の2つのネットワークエンティティがネットワーク装置及びインターフェイスである場合、2つのネットワークエンティティ間の関係は従属関係である。すなわち、インターフェイスはネットワーク装置に属する。別の例として、知識グラフトリプレット上の2つのネットワークエンティティが、通信接続が確立される2つのインターフェイスの場合、2つのネットワークエンティティ間の関係は同等関係である。
任意で、その種類がネットワーク装置であるネットワークエンティティは名前、媒体アクセス制御(media access control、MAC)アドレス又はネットワーク装置のハードウェアアドレス又はネットワーク装置を一意的に特定可能な別の識別子によって表され得る。その種類がインターフェイスであるネットワークエンティティは、インターフェイスの名前によって表現され得る。その種類がプロトコルであるネットワークエンティティは、プロトコルの識別子によって表され得る。知識グラフトリプレットはグラフ形式で表されます。知識グラフトリプレットは2つの基本要素、すなわちポイント及びエッジを含み、ポイントはネットワークエンティティを表し、エッジは2つのネットワークエンティティ間の関係を表す。知識グラフトリプレットのエッジは有向であってもいいし無向であってもよい。知識グラフトリプレット上のエッジは2つのネットワークエンティティ間の特定の関係、例えば依存関係、従属関係又は同等関係を示すためにさらに用いられ得る。例えば、2つのネットワークエンティティが同等関係にある場合、2つのネットワークエンティティを接続するために無向エッジが用いられ得る。2つのネットワークエンティティが依存関係又は従属関係にある場合、2つのネットワークエンティティを接続するために有向エッジ(例えば、矢印)が用いられ、有向エッジは依存ネットワークエンティティから依存されるネットワークエンティティを向くか又は有向エッジは所属するネットワークエンティティから所属されるネットワークエンティティを向く。
例えば、管理装置によって取得されるネットワークデータが、「ネットワーク装置1は、「10GE1/0/6」という名前のインターフェイスを有する」というデータを含むと仮定すると、管理装置は図3に示す知識グラフトリプレットを抽出し得る。図3を参照して、知識グラフトリプレット上では、2つのネットワークエンティティの種類はそれぞれネットワーク装置及びインターフェイスであり、矢印はインターフェイスからネットワーク装置を向く。これは、「10GE1/0/6」というインターフェイスがネットワーク装置1に属していることを示す。つまり、知識グラフトリプレットは、ネットワーク装置1が「10GE1/0/6」というインターフェイスを有することを反映できることを示す。
任意で、ステップ202の実施プロセスは、管理装置が、ターゲットネットワークのネットワークタイプに対応する抽象サービスモデルに基づいて、ネットワークデータから複数の知識グラフトリプレットを抽出することを含み、抽象サービスモデルは異なるネットワークエンティティ間の関係を反映するために用いられる。異なるネットワークタイプは異なる抽象サービスモデルに対応し得る。抽象サービスモデルは、本質的に、異なるネットワークエンティティ間の依存関係を定義するために用いられるデータオブジェクトである。例えば、各ネットワーク装置が1つ以上のインターフェイスを有することが抽象サービスモデルにおいて定義され得る。つまり、インターフェイスはネットワーク装置に属する。インターフェイスはフォワーディングサービスを保持してもよく、例えば、インターフェイスはレイヤ3IPフォワーディングサービスを保持し得る。これは、インターフェイスが内部ゲートウェイプロトコル(interior gateway protocol、IGP)を用いるパケットフォワーディングをサポートすることを意味する。つまり、レイヤ3IPフォワーディングサービス又はIGPはインターフェイスに依存する。レイヤ3IPフォワーディングサービスはVXLANトンネル、トラフィックエンジニアリング(traffic engineering、TE)トンネル及び境界ゲートウェイプロトコル(Border Gateway Protocol、BGP)を保持し得る。つまり、VXLANトンネル、TEトンネル及びBGPは、レイヤ3IPフォワーディングサービスに依存する。TEトンネルはVPNサービスを保持し得る。つまり、VPNサービスはTEトンネルに依存する。レイヤ3IPフォワーディングサービスがVXLANトンネルを保持し得ることは、レイヤ3IPフォワーディングサービスを保持するインターフェイスがVXLANトンネルのエンドポイントとして用いられ得ることを示します。レイヤ3IPフォワーディングサービスがTEトンネルを保持し得ることは、レイヤ3IPフォワーディングサービスを保持するインターフェイスがTEトンネルのエンドポイントとして用いられ得ることを示す。レイヤ3IPフォワーディングサービスがBGPを保持し得ることは、レイヤ3IPフォワーディングサービスを保持するインターフェイスがBGPベースのプロトコルパケットを送受信するように設定され得ることを示す。TEトンネルがVPNサービスを保持し得ることは、TEトンネルを保持するインターフェイスがVPNサービスをサポートし得ることを示す。
任意で、管理装置は、ネットワーク装置のネットワーク構成情報から知識グラフトリプレットを抽出し得るか又はネットワーク装置のルーティングエントリに基づいて知識グラフトリプレットを取得し得る。
例えば、ネットワーク装置のネットワーク構成情報に基づいて管理機器によって抽出された知識グラフトリプレットの内容は、ネットワーク装置1が「10GE1/0/6」という名前のインターフェイスを有し、インターフェイス「10GE1/0/6」はレイヤ3IPフォワーディングサービスをサポートし、インターフェイス「10GE1/0/6」のIPアドレスは192.168.1.1であり、ネットワーク装置1はVXLANトンネルを有し、VXLANトンネルの送信元IPアドレスは192.168.1.1であり、VXLANトンネルの宛先IPアドレスは192.168.10.1であることを含むと仮定する。VXLANトンネルとインターフェイスとの間の関係を特定するために、管理装置は宛先IPアドレスである192.168.10.1を用いてルーティングエントリを検索し得る。ルーティングエントリに基づいて、宛先IPアドレスに到達するアウトバウンドインターフェイスはインターフェイス「10GE1/0/6」であると判定された場合、ルーティングエントリに基づいて管理装置によって取得された知識グラフトリプレットの内容は、VXLANトンネルのエンドポイントはネットワーク装置1のインターフェイス「10GE1/0/6」に位置しているというものである。
ステップ203:複数の知識グラフトリプレットに基づいて、ターゲットネットワークの知識グラフを生成する。
例えば、ターゲットネットワークは、ネットワーク装置A及びネットワーク装置Bという2つのネットワーク装置を含むと仮定する。ネットワーク装置Aは3つのインターフェイスを有し、3つのインターフェイスの名前は10GE1/0/1、10GE1/0/2、10GE1/0/3である。ネットワーク装置Bは4つのインターフェイスを有し、4つのインターフェイスの名前は10GE3/0/1、10GE3/0/2、10GE3/0/3及び10GE3/0/4である。ネットワーク装置A及びネットワーク装置Bの両方は、オープンショーテストパスファースト(open shortest path first、OSPF)プロトコルをサポートし、OSPEがIGPである。ネットワーク装置AでのOSPFプロトコルの識別子は10.89.46.25で表され、ネットワーク装置AでのOSPFプロトコルは、11.11.11.11、11.11.11.12及び11.11.11.13という3つのルートIPアドレスを含む。ネットワーク装置BでのOSPFプロトコルの識別子は10.89.49.37で表され、ネットワーク装置BでのOSPFプロトコルは、11.12.11.11、11.12.11.12、11.12.11.13及び11.12.11.14という4つのルートIPアドレスを含む。ネットワーク装置Aのインターフェイス「10GE1/0/2」はネットワーク装置Bのインターフェイス「10GE3/0/2」に接続され、OSPFプロトコルは、2つのインターフェイス間の通信に用いられる。ネットワーク装置Aのインターフェイス「10GE1/0/2」はルートIPアドレス11.11.11.11を用い、ネットワーク装置Bのインターフェイス「10GE3/0/2」はルートIPアドレス11.12.11.14を用いる。したがって、図4に示す知識グラフは前述のネットワークデータに基づいて取得され得る。図4を参照されたい。ターゲットネットワーク内のネットワーク装置A及びネットワーク装置Bの装置情報は、知識グラフ上でグラフの形式表される。
任意で、ターゲットネットワークの知識グラフを生成した後に、管理装置は、ターゲットネットワークの知識グラフを運用支援システム(operations support system、OSS)又は管理装置に接続された他の端末装置に送信して、OSS又は端末装置が知識グラフを表示するようにしてもよい。もちろん、管理装置が表示機能を有する場合、管理装置は、代替的に、管理装置の表示インターフェイスにターゲットネットワークの知識グラフを直接表示し得る。
本願の実施形態では、ターゲットネットワークのネットワークデータを取得した後に、管理装置は、ネットワークデータを処理してターゲットネットワークの知識グラフを生成する。ターゲットネットワークの知識グラフは、ターゲットネットワーク内のネットワークエンティティ及び異なるネットワークエンティティ間の関係を直感的に反映することができる。すなわち、ネットワークデータを可視化するために用いることができる。ターゲットネットワークでネットワーク情報を取得する必要がある場合、ユーザは手動でコマンドラインを照会することなく、ターゲットネットワークの知識グラフを見るだけで済む。したがって、ユーザによるネットワーク情報の取得の効率が改善される。
任意で、ターゲットネットワークの知識グラフを生成した後で、管理装置は、ターゲットネットワークの知識グラフを後の使用のために管理装置に又は管理装置に接続された記憶装置にさらに記憶し得る。例えば、ターゲットネットワークの知識グラフは、ネットワークエンティティ間の障害伝搬関係を特定するための基礎として及び/又は障害の根本原因を推論のための基礎として用いられ得る。
ステップ204:ターゲットネットワークで障害が起きた場合、ターゲットネットワークで生じた異常なイベントを取得する。
ターゲットネットワークで障害が起こるとは、ターゲットネットワーク内のネットワーク装置に障害が起こることを意味する。ネットワーク装置の障害の種類はインターフェイス障害、プロトコル障害(プロトコルパケットの正常な送受信の障害等を含む)、サービス障害等を含む。任意で、異常なイベントは、アラームログ、状態変化ログ及び異常キーパフォーマンスインジケータのうちの1つ以上を含む。アラームログは、ネットワーク装置における異常なネットワークエンティティの識別子及びアラームタイプを含む。状態変更ログは、構成ファイル変更情報、ルーティングエントリ変更情報及び/又等を含む。例えば、状態変更ログは、「アクセスサブインターフェイスが削除された」や「宛先IPホスト経路が削除された」等の情報を含み得る。異常キーパフォーマンスインジケータは、ネットワークエンティティの異常インジケータを記述するために用いられる。
ステップ205:ターゲットネットワーク内で異常なイベントを生じさせた異常なネットワークエンティティをターゲットネットワークの知識グラフ上で識別する。
任意で、管理装置は、ターゲットネットワーク内の取得された異常なイベントに基づいて異常なネットワークエンティティを特定し、ターゲットネットワークの知識グラフ上の全ての異常なネットワークエンティティを識別し得る。知識グラフ上の異常なネットワークエンティティ及び正常ネットワークエンティティは、異なるパターン及び/又は異なる色を用いることによって区別してもいいし、「異常」等の言葉を異常なネットワークエンティティの近くにマークしてもよい。知識グラフ上で異常なネットワークエンティティを識別する方法は本願のこの実施形態では限定されない。
任意で、ターゲットネットワークの知識グラフ上で異常なネットワークエンティティを識別した後に、管理装置は、OSS又は管理装置に接続されている他の端末装置にターゲットネットワークの知識グラフを送信して、OSS又は端末装置が知識グラフを表示するようにし得る。これは、運用保守エンジニアがターゲットネットワーク内の異常なネットワークエンティティを見るのに役立つ。管理装置は、異常なネットワークエンティティに対応する異常なイベントをOSS又は管理装置に接続された他の端末装置に送信して、OSS又は端末装置が異常なイベントを表示するようにしてもよい。これは、運用保守エンジニアが異常なネットワークエンティティの異常の種類を取得するのに役立つ。
ステップ203で生成された知識グラフは初期知識グラフとも呼ばれ得る。ステップ205で異常なネットワークエンティティが識別される知識グラフは第1の知識グラフとも呼ばれ得る。
ステップ206:ネットワークエンティティ間の障害伝搬関係に基づいて、ターゲットネットワークの知識グラフ上の全ての異常なネットワークエンティティから、1つ以上の根本原因の障害ネットワークエンティティを特定する。
根本原因の障害ネットワークエンティティは、障害の根本原因である異常なネットワークエンティティである。
任意で、管理装置が障害伝搬関係を取得するプロセスは、管理装置が複数の知識グラフサンプルを取得することを含み、各知識グラフサンプルは、該知識グラフサンプルが属するネットワークで障害が起きた場合に、該知識グラフサンプルが属するネットワークでの異常なイベント及び根本原因の障害ネットワークエンティティを生じさせる全ての異常なネットワークエンティティと同定されている。管理装置は、複数の知識グラフサンプルに基づいて、前記障害伝搬関係を特定する。各知識グラフサンプルは障害ケースであり、異常なネットワークエンティティ及び知識グラフサンプル内の根本原因の障害ネットワークエンティティは手動で特定され得る。任意で、管理装置は、グラフ埋め込みアルゴリズム等を用いることにより、複数の知識グラフサンプルにおける障害伝搬関係を学習し得る。あるいは、同じ知識グラフトリプレット上の2つのネットワークエンティティが同時に異常である確率が閾値より大きい場合、管理装置は、2つのネットワークエンティティ間で障害伝搬が行われていると判定し得る。
例えば、図4に示す知識グラフでは、ネットワーク装置Aのインターフェイス「10GE1/0/2」に障害が起きた場合、インターフェイス上で通常の通信ができないため、インターフェイスが用いるルートIPアドレス「11.12.11.14」は到達不能である。したがって、管理装置はインターフェイスの障害により、インターフェイスによって用いられるルートIPアドレスが到達不能になるという障害伝搬関係のグループを取得し得る。インターフェイスの障害を示すために用いられる第1の異常なイベントと、インターフェイスによって用いられるルートIPアドレスが到達不能であることを示すために用いられる第2の異常なイベントを管理装置が取得すると、管理装置は第1の異常なイベントが根本原因の異常なイベントであると判定し、そのインターフェイスが根本原因の障害ネットワークエンティティであると判定する。
任意で、知識グラフサンプルが属するネットワークはターゲットネットワークであるか又は知識グラフサンプルが属するネットワークはターゲットネットワークと同じネットワークタイプの別のネットワークである。複数の知識グラフサンプルが同じネットワークに属していてもいいし、複数のネットワークに属していてもよい。これは、本願のこの実施形態では限定されない。
本願のこの実施形態では、管理装置は、複数の知識グラフサンプルを用いることによりネットワークエンティティ間の障害伝搬関係を学習し、障害伝搬関係に基づいて、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティのうちの根本原因の障害ネットワークエンティティを特定し得る。これは、ネットワーク障害の根本原因の自動化された推論及び探索を実施する。
任意で、ネットワークエンティティ間の障害伝搬関係は、代替的に、別の装置によって特定され、次いで、管理装置に送信され得る。他の装置がネットワークエンティティ間の障害伝搬関係を特定する方法については、管理装置がネットワークエンティティ間の障害伝搬関係を特定する前述の方法を参照されたい。本願のこの実施形態では、詳細については説明しない。
ステップ207:ターゲットネットワークの知識グラフ上で1つ以上の根本原因の障害ネットワークエンティティを識別する。
任意で、ターゲットネットワークの知識グラフ上で根本原因の障害ネットワークエンティティを識別した後で、管理装置は、OSS又は管理装置に接続された他の端末装置にターゲットネットワークの知識グラフを送信して、OSS又は端末装置が知識グラフを表示するようにしてもいい。これは、運用保守エンジニアがターゲットネットワーク内の根本原因の障害ネットワークエンティティを見て、障害を迅速に特定するのに役立ち、障害修復効率が改善される。すなわち、ネットワーク装置が障害状態から動作状態に切り替わるのに要する期間が短縮される。ネットワーク装置が障害状態から動作状態に切り替わるのに要する時間は、平均修復時間(mean time to recovery、MTTR)とも呼ばれる。
任意で、本願のこの実施形態では、管理装置は1つの装置又は複数の装置を含み得る。管理装置が1つの装置を含む場合、ステップ201~ステップ207の全ては該装置によって行われる。あるいは、管理装置が複数の装置を、例えば、第1の装置及び第2の装置を含む場合、ステップ201~ステップ205及びステップ207が第1の装置によって行われ、ステップ206が第2の装置によって行われてもよい。具体的には、第1の装置はターゲットネットワークの知識グラフを生成し、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティを識別し、第1の装置は、異常なネットワークエンティティで特定された知識グラフを第2の装置に送信し、第2の装置は、ネットワークエンティティ間の障害伝搬関係に基づく異常なネットワークエンティティから根本原因の障害ネットワークエンティティを特定し、第2の装置は、根本原因の障害ネットワークエンティティの識別子を第1の装置に送信し、第1の装置は、根本原因の障害ネットワークエンティティの受信した識別子に基づいて、ターゲットネットワークの知識グラフ上の根本原因の障害ネットワークエンティティを識別する。
本願のこの実施形態で提供されるデータ処理方法における一連のステップは適切に調整され、それに対応して、ステップが状況に基づいて追加又は削除され得る。例えば、ステップ207は代替的に行われなくてもよい。ターゲットネットワークの知識グラフ上で根本原因の障害ネットワークエンティティを特定した後に、管理装置は、根本原因の障害ネットワークエンティティに対応する根本原因の異常なイベントを直接出力する。本願に開示された技術的範囲内で当業者が容易に思いつく任意の変更された方法は本願の保護範囲に含まれるものとする。したがって、ここでは詳細について説明しない。
結論として、本願のこの実施形態で提供されるデータ処理方法によれば、ターゲットネットワークのネットワークデータを取得した後で、管理装置はネットワークデータを処理して、ターゲットネットワークの知識グラフを生成する。ターゲットネットワークの知識グラフは、ターゲットネットワーク内のネットワークエンティティ及び異なるネットワークエンティティ間の関係を直感的に反映することができる。すなわち、ネットワークデータを可視化するために用いることができる。ターゲットネットワークでネットワーク情報を取得する必要がある場合、ユーザは手動でコマンドラインを照会することなく、ターゲットネットワークの知識グラフを見るだけで済む。したがって、ユーザによるネットワーク情報の取得の効率が改善される。加えて、ターゲットネットワークで障害が起きた後に、管理装置は、ターゲットネットワークの異常な位置を直感的に反映するために、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティをさらに識別し得る。また、管理装置は、ネットワークエンティティ間の障害伝搬関係に基づいて、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティのうちの根本原因の障害ネットワークエンティティをさらに特定して、ネットワーク障害の根本原因の自動化された推論及び特定を実施し得る。
なお、管理装置は、異なるステップを行うように別々に構成された複数の装置を含み得る。2つの隣接するステップが異なる装置によって行われる場合、前のステップを行う装置は前のステップの実行結果を次のステップを行う装置に送信する。管理装置が装置A及び装置BBを含むと仮定する。一実施では、ステップ201~203が装置Aによって行われ、ステップ204~207が装置Bによって行われ、装置Aはステップ201~203を介して生成された初期知識グラフを装置Bに送信し、装置Bは、装置Aから受信した初期知識グラフに基づいてステップ204~207を行う。別の実施では、ステップ201~205が装置Aによって行われ、ステップ206~207が装置Bによって行われ、装置Aは、ステップ201~205を介して生成された第1の知識グラフを装置Bに送信し、装置Bは、装置Aから受信した第1の知識グラフに基づいてステップ206及び207を行う。
図5は、本願の一実施形態に係るデータ処理装置の構造の概略図である。データ処理装置は、図1に示す適用シナリオにおける管理装置101に適用され得る。図5に示すように、装置50は、
ターゲットネットワークのネットワークデータを取得するように構成された第1の取得モジュール501であって、該ネットワークデータは該ターゲットネットワークのネットワークトポロジと、該ターゲットネットワーク内の複数のネットワーク装置の装置情報とを含み、該装置情報はインターフェイス構成情報、プロトコル構成情報及びサービス構成情報のうちの1つ以上を含む、第1の取得モジュール501と、
ネットワークデータから複数の知識グラフトリプレットを抽出するように構成された抽出モジュール502であって、各知識グラフトリプレットは2つのネットワークエンティティと、該2つのネットワークエンティティ間の関係とを含み、該ネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスである、抽出モジュール502と、
複数の知識グラフトリプレットに基づいて、ターゲットネットワークの知識グラフを生成するように構成された生成モジュール503と、
を含む。
結論として、本願のこの実施形態で提供されるデータ処理装置によれば、第1の取得モジュールを介してターゲットネットワークのネットワークデータを取得した後で、管理装置はネットワークデータを処理して、生成モジュールを介してターゲットネットワークの知識グラフを生成する。ターゲットネットワークの知識グラフは、ターゲットネットワーク内のネットワークエンティティ及び異なるネットワークエンティティ間の関係を直感的に反映することができる。すなわち、ネットワークデータを可視化するために用いることができる。ターゲットネットワークでネットワーク情報を取得する必要がある場合、ユーザは手動でコマンドラインを照会することなく、ターゲットネットワークの知識グラフを見るだけで済む。したがって、ユーザによるネットワーク情報の取得の効率が改善される。
任意で、装置情報はルーティングエントリをさらに含む。
任意で、2つのネットワークエンティティ間の関係は、依存関係、従属関係又は同等関係である。
任意で、図6に示すように、装置50は、
ターゲットネットワークで障害が起きた場合に、ターゲットネットワークで発生した異常なイベントを取得するように構成された第2の取得モジュール504と、
ターゲットネットワークで異常なイベントを生じさせた異常なネットワークエンティティを、ターゲットネットワークの知識グラフ上で識別するように構成された識別モジュール505と、
をさらに含む。
任意で、異常なイベントは、アラームログ、状態変化ログ及び異常キーパフォーマンスインジケータのうちの1つ以上を含む。
任意で、図7に示すように、装置50は、
ネットワークエンティティ間の障害伝搬関係に基づいて、ターゲットネットワークの知識グラフ上の全ての異常なネットワークエンティティから、1つ以上の根本原因の障害ネットワークエンティティを特定するように構成された第1の特定モジュール506、
をさらに含み、
識別モジュール505は、ターゲットネットワークの知識グラフ上で1つ以上の根本原因の障害ネットワークエンティティを識別するようにさらに構成されている。
任意で、図8に示すように、装置50は、
複数の知識グラフサンプルを取得するように構成された第3の取得モジュール507であって、各知識グラフサンプルは、該知識グラフサンプルが属するネットワークで障害が起きた場合に、該知識グラフサンプルが属するネットワークでの異常なイベント及び根本原因の障害ネットワークエンティティを生じさせる全ての異常なネットワークエンティティと同定されている、第3の取得モジュール507と、
複数の知識グラフサンプルに基づいて、障害伝搬関係を特定するように構成された第2の特定モジュール508と、
をさらに含む。
任意で、知識グラフサンプルが属するネットワークはターゲットネットワークであるか又は知識グラフサンプルが属するネットワークは、ターゲットネットワークと同じネットワークタイプの別のネットワークである。
任意で、抽出モジュールは、
ターゲットネットワークのネットワークタイプに対応する抽象サービスモデルに基づいて、ネットワークデータから複数の知識グラフトリプレットを抽出するようにさらに構成され、該抽象サービスモデルは、異なるネットワークエンティティ間の関係を反映するために用いられる。
結論として、本願のこの実施形態で提供されるデータ処理装置によれば、第1の取得モジュールを介してターゲットネットワークのネットワークデータを取得した後で、管理装置はネットワークデータを処理して、生成モジュールを介してターゲットネットワークの知識グラフを生成する。ターゲットネットワークの知識グラフは、ターゲットネットワーク内のネットワークエンティティ及び異なるネットワークエンティティ間の関係を直感的に反映することができる。すなわち、ネットワークデータを可視化するために用いることができる。ターゲットネットワークでネットワーク情報を取得する必要がある場合、ユーザは手動でコマンドラインを照会することなく、ターゲットネットワークの知識グラフを見るだけで済む。したがって、ユーザによるネットワーク情報の取得の効率が改善される。加えて、ターゲットネットワークで障害が起きた後に、管理装置は、ターゲットネットワークの異常な位置を直感的に反映するために、識別モジュールを介してターゲットネットワークの知識グラフ上の異常なネットワークエンティティをさらに識別し得る。また、管理装置は、ネットワークエンティティ間の障害伝搬関係に基づいて、第1の特定モジュールを介してターゲットネットワークの知識グラフ上の異常なネットワークエンティティのうちの根本原因の障害ネットワークエンティティをさらに特定して、ネットワーク障害の根本原因の自動化された推論及び特定を実施し得る。
図9は、本願の一実施形態に係るデータ処理装置のブロック図である。データ処理装置は、図1に示す適用シナリオにおける管理装置であり得る。図9に示すように、管理装置90は、プロセッサ901及びメモリ902を含む。
メモリ902はコンピュータプログラムを記憶するように構成され、コンピュータプログラムはプログラム命令を含む。
プロセッサ901は、図2に示すデータ処理方法を実施するためにコンピュータプログラムを呼び出すように構成されている。
任意で、管理装置90は、通信バス903及び通信インターフェイス904をさらに含む。
プロセッサ901は1つ以上の処理コアを含み、プロセッサ901は、コンピュータプログラムを実行することにより、様々な機能アプリケーション及びデータ処理を実行する。
メモリ902はコンピュータプログラムを記憶するように構成され得る。任意で、メモリは、オペレーティングシステム及び機能によって必要とされる少なくとも1つのアプリケーションプログラムユニットを記憶し得る。オペレーティングシステムは、リアルタイムオペレーティングシステム(Real Time eXecutive、RTX)、Linux、UNIX、Windows、OSX等であり得る。
複数の通信インターフェイス904が存在してもよく、通信インターフェイス904は、例えば、制御装置又はネットワーク装置と通信するように構成されている。
メモリ902及び通信インターフェイス904は、通信バス903を介して別々にプロセッサ901に接続されている。
図10は本願の一実施形態に係る障害の根本原因の特定装置の構造の概略図である。障害の根本原因の特定装置は、図1に示す適用シナリオにおける管理装置101に適用され得る。図10に示すように、装置100は、
障害が起きたターゲットネットワークの第1の知識グラフを取得するように構成された取得モジュール1010であって、該第1の知識グラフは、前記ターゲットネットワークで異常なイベントを生じさせる異常なネットワークエンティティであると特定され、第1の知識グラフ上のネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスであり、具体的には、第1の知識グラフは別の装置から受信され得るか又はステップ203~205を行うことにより生成されてもよく、ターゲットネットワークで異常イベントを生じさせる異常なネットワークエンティティは、第1の知識グラフを取得するために初期知識グラフ上で識別される、取得モジュール1010と、
ネットワークエンティティ間の障害伝搬関係に基づいて、ターゲットネットワークの第1の知識グラフ上の全ての異常なネットワークエンティティから、1つ以上の根本原因の障害ネットワークエンティティを特定するように構成された特定モジュール1020と、
を含む。
装置100は識別モジュール1030をさらに含んでもよく、識別モジュールは、ターゲットネットワークの知識グラフ上の1つ以上の根本原因の障害ネットワークエンティティを識別するように構成されている。
また、取得モジュール1010は、複数の知識グラフサンプルを取得するようにさらに構成され、各知識グラフサンプルは、該知識グラフサンプルが属するネットワークで障害が起きた場合に、該知識グラフサンプルが属するネットワークでの異常なイベント及び根本原因の障害ネットワークエンティティを生じさせる全ての異常なネットワークエンティティと同定されている。それに対応して、特定モジュール1020は、複数の知識グラフサンプルに基づいて、障害伝搬関係を特定するようにさらに構成されている。知識グラフサンプルが属するネットワークはターゲットネットワークであるか又は知識グラフサンプルが属するネットワークはターゲットネットワークと同じネットワークタイプの別のネットワークである。
本願の一実施形態は、コンピュータ記憶媒体をさらに提供する。コンピュータ記憶媒体は命令を記憶する。命令がプロセッサによって実行される場合、図2に示すデータ処理方法が実施される。
当業者であれば、前述の実施形態におけるステップの全て又は一部はハードウェア又は関連するハードウェアを指示するプログラムによって実施され得ることを理解し得る。プログラムは、コンピュータ読み取り可能記憶媒体に記憶され得る。記憶媒体は読み出し専用メモリ、磁気ディスク、光ディスク等であり得る。
本願の実施形態では、「第1」、「第2」及び「第3」という用語は説明のために用いられているにすぎず、相対的な重要性を示すか又は含意すると理解することはできない。「少なくとも1つ」という用語は1つ以上を意味し、「複数の」という用語は、別段の明確な制限がない限り2つ以上を意味する。
本願における「及び/又は」という用語は、関連するオブジェクト間の関連関係のみを記述し、3つの関係が存在し得ることを示す。例えば、A及び/又はBは、Aのみが存在する場合、A及びBの両方が存在する場合、Bのみが存在する場合という3つの場合を示し得る。加えて、本明細書における「/」という記号は、関連するオブジェクト間の「又は」の関係を概して示す。
前述の説明は本願の任意の実施形態にすぎず、本願を限定することを意図していない。本願の概念及び原則の範囲内でなされる任意の修正、同等の置き換え、改良等も本願の保護範囲に含まれるものとする。
本願はネットワーク技術の分野に関し、特に、データ処理方法及び装置並びにコンピュータ記憶媒体に関する。
継続的なネットワークの規模拡大に伴い、通信ネットワークにおいてネットワークデータの増加が存在する。大量のネットワークデータから貴重なネットワーク情報をどのように取得するかは、様々な分野の全ての人員にとって課題となっている。
現在、技術者は、手動でコマンドラインを照会することにより、通信ネットワーク内でネットワーク情報を取得し得る。例えば、ネットワーク装置のインターフェイスによってサポートされるルーティングプロトコルに照会する必要がある場合、技術者は、ネットワーク装置のインターフェイス構成に対応するコマンドラインを照会し得る。しかしながら、ネットワーク情報を取得するためにコマンドラインを照会することは非効率的である。
本願は、ネットワーク情報を取得することが非効率であるという既存の課題を解決するために、データ処理方法及び装置並びにコンピュータ記憶媒体を提供する。
第1の態様によれば、データ処理方法が提供される。管理装置は、ターゲットネットワークのネットワークデータを取得し、該ネットワークデータは該ターゲットネットワークのネットワークトポロジと、該ターゲットネットワーク内の複数のネットワーク装置の装置情報とを含み、該装置情報はインターフェイス構成情報、プロトコル構成情報及びサービス構成情報のうちの1つ以上を含む。管理装置は、前記ネットワークデータから複数の知識グラフトリプレットを抽出し、各知識グラフトリプレットは2つのネットワークエンティティと、該2つのネットワークエンティティ間の関係とを含み、該ネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスである。管理装置は、前記複数の知識グラフトリプレットに基づいて、前記ターゲットネットワークの知識グラフを生成する。
本願では、ターゲットネットワークのネットワークデータを取得した後で、管理装置はネットワークデータを処理して、ターゲットネットワークの知識グラフを生成する。ターゲットネットワークの知識グラフは、ターゲットネットワーク内のネットワークエンティティ及び異なるネットワークエンティティ間の関係を直感的に反映することができる。すなわち、ネットワークデータを可視化するために用いることができる。ターゲットネットワークでネットワーク情報を取得する必要がある場合、ユーザは手動でコマンドラインを照会することなく、ターゲットネットワークの知識グラフを見るだけで済む。したがって、ユーザによるネットワーク情報の取得の効率が改善される。
任意で、装置情報はルーティングエントリをさらに含む。すなわち、管理装置は、ネットワーク装置のネットワーク構成情報から知識グラフトリプレットを抽出し得るか又はネットワーク装置のルーティングエントリに基づいて知識グラフトリプレットを取得し得る。
任意で、2つのネットワークエンティティ間の関係は、依存関係、従属関係又は同等関係である。
任意で、管理装置が前記ターゲットネットワークの知識グラフを生成した後に、ターゲットネットワークで障害が起きた場合に、管理装置は前記ターゲットネットワークで発生した異常なイベントをさらに取得し、前記ターゲットネットワークで前記異常なイベントを生じさせた異常なネットワークエンティティを、前記ターゲットネットワークの知識グラフ上で識別し得る。
本願では、ターゲットネットワークの知識グラフ上で異常なネットワークエンティティを識別した後で、管理装置は、OSS又は管理装置に接続されている端末装置にターゲットネットワークの知識グラフを送信して、OSS又は端末装置が知識グラフを表示するようにし得る。これは、運用保守エンジニアがターゲットネットワーク内の異常なネットワークエンティティを見るのに役立つ。管理装置は、異常なネットワークエンティティに対応する異常なイベントをOSS又は管理装置に接続された端末装置に送信して、OSS又は端末装置が異常なイベントを表示するようにしてもよい。これは、運用保守エンジニアが異常なネットワークエンティティの異常の種類を取得するのに役立つ。
任意で、異常なイベントは、アラームログ、状態変化ログ及び異常キーパフォーマンスインジケータのうちの1つ以上を含む。
任意で、管理装置が、ターゲットネットワークで前記異常なイベントを生じさせた異常なネットワークエンティティを、前記ターゲットネットワークの知識グラフ上で識別した後に、管理装置は、ネットワークエンティティ間の障害伝搬関係に基づいて、前記ターゲットネットワークの知識グラフ上の全ての異常なネットワークエンティティから、1つ以上の根本原因の障害ネットワークエンティティをさらに特定し、前記ターゲットネットワークの知識グラフ上で前記1つ以上の根本原因の障害ネットワークエンティティを識別し得る。
任意で、管理装置は、複数の知識グラフサンプルを取得し、各知識グラフサンプルは、該知識グラフサンプルが属するネットワークで障害が起きた場合に、該知識グラフサンプルが属するネットワークでの異常なイベント及び根本原因の障害ネットワークエンティティを生じさせる全ての異常なネットワークエンティティと同定されている。管理装置は、前記複数の知識グラフサンプルに基づいて、前記障害伝搬関係を特定する。
本願のこの実施形態では、管理装置は、複数の知識グラフサンプルを用いることによってネットワークエンティティ間の障害伝搬関係を学習し、障害伝搬関係に基づいて、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティのうちの根本原因の障害ネットワークエンティティを特定し得る。これは、自動化された推論と、ネットワーク障害の根本原因の特定を実施する。
任意で、前記知識グラフサンプルが属するネットワークは前記ターゲットネットワークであるか又は前記知識グラフサンプルが属するネットワークは、前記ターゲットネットワークと同じネットワークタイプの別のネットワークである。
任意で、管理装置が前記ネットワークデータから複数の知識グラフトリプレットを抽出するプロセスは以下を含む。
前記ターゲットネットワークのネットワークタイプに対応する抽象サービスモデルに基づいて、管理装置は前記ネットワークデータから前記複数の知識グラフトリプレットを抽出し、該抽象サービスモデルは、異なるネットワークエンティティ間の関係を反映するために用いられる。
第2の態様によれば、データ処理装置が提供される。装置は複数の機能モジュールを含み、該複数の機能モジュールは互いに相互に作用して、第1の態様及び第1の態様の実施に係る方法を実施する。複数の機能モジュールはソフトウェア、ハードウェア又はソフトウェアとハードウェアとの組み合わせに基づいて実施されてもよく、複数の機能モジュールは、特定の実施に基づいてランダムに組み合わせら得るか又は分割され得る。
第3の態様によれば、データ処理装置が提供される。装置はプロセッサ及びメモリを含み、
メモリはコンピュータプログラムを記憶するように構成され、コンピュータプログラムはプログラム命令を含み、
プロセッサは前記コンピュータプログラムを呼び出して、第1の態様のいずれかの実施に係るデータ処理方法を実施するように構成されている。
第4の態様によれば、コンピュータ記憶媒体が提供される。コンピュータ記憶媒体は命令を記憶し、該命令がプロセッサによって実行された場合、第1の態様のいずれかの実施に係るデータ処理方法が実施される。
第5の態様によれば、チップが提供される。チップはプログラマブル論理回路及び/又プログラム命令を含む。チップが動作すると、第1の態様のいずれかの実施に係るデータ処理方法が実施される。
本願で提供される技術的解決策によってもたらされる有益な効果は少なくとも以下を含む。
ターゲットネットワークのネットワークデータを取得した後で、管理装置はネットワークデータを処理して、ターゲットネットワークの知識グラフを生成する。ターゲットネットワークの知識グラフは、ターゲットネットワーク内のネットワークエンティティ及び異なるネットワークエンティティ間の関係を直感的に反映することができる。すなわち、ネットワークデータを可視化するために用いることができる。ターゲットネットワークでネットワーク情報を取得する必要がある場合、ユーザは手動でコマンドラインを照会することなく、ターゲットネットワークの知識グラフを見るだけで済む。したがって、ユーザによるネットワーク情報の取得の効率が改善される。加えて、ターゲットネットワークで障害が起きた後に、管理装置は、ターゲットネットワークの異常な位置を直感的に反映するために、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティをさらに識別し得る。また、管理装置は、ネットワークエンティティ間の障害伝搬関係に基づいて、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティのうちの根本原因の障害ネットワークエンティティをさらに特定して、ネットワーク障害の根本原因の自動化された推論及び特定を実施し得る。
図1は、本願の一実施形態に係るデータ処理方法の適用シナリオの概略図である。 図2は、本願の一実施形態に係るデータ処理方法のフローチャートである。 図3は、本願の一実施形態に係る知識グラフトリプレットの概略図である。 図4は、本願の一実施形態に係る知識グラフの概略図である。 図5は、本願の一実施形態に係るデータ処理装置の構造の概略図である。 図6は、本願の一実施形態に係る他のデータ処理装置の構造の概略図である。 図7は、本願の一実施形態に係るさらに別のデータ処理装置の構造の概略図である。 図8は、本願の一実施形態に係るさらに別のデータ処理装置の構造の概略図である。 図9は、本願の一実施形態に係るデータ処理装置のブロック図である。 図10は、本願の一実施形態に係る障害の根本原因の特定装置の構造の概略図である。
本願の目的、技術的解決策及び利点をより明確にするために、添付の図面を参照しながら、本願の実施を以下でさらに詳細に説明する。
図1は、本願の一実施形態に係るデータ処理方法の適用シナリオの概略図である。図1に示すように、適用シナリオは、通信ネットワーク内の管理装置101及びネットワーク装置102a~102c(まとめてネットワーク装置102と呼ぶ)を含む。図1における管理装置及びネットワーク装置の数は一例として用いているにすぎず、本願の実施形態で提供されるデータ処理方法の適用シナリオに対する限定として用いられていない。通信ネットワークは、データセンターネットワーク(data center network、DCN)、大都市エリアネットワーク、ワイドエリアネットワーク、キャンパスネットワーク、仮想ローカルエリアネットワーク(virtual local area network、VLAN)、仮想拡張可能ローカルエリアネットワーク(virtual extensible local area network、VXLAN)等であり得る。通信ネットワークの種類は本願の実施形態では限定されない。
任意で、管理装置101は1つのサーバ又は複数のサーバを含むサーバクラスタであり得るか又はクラウドコンピューティングサービスセンターであり得る。ネットワーク装置102はスイッチ、ルータ等であり得る。任意で、依然図1を参照して、適用シナリオは制御装置103をさらに含み得る。制御装置103は、通信ネットワーク内のネットワーク装置102を管理及び制御するように構成されている。管理装置101は、有線ネットワーク又は無線ネットワークを介して制御装置103に接続され、制御装置103は有線ネットワーク又は無線ネットワークを介してネットワーク装置102に接続されている。制御装置103はネットワークコントローラ、ネットワーク管理装置、ゲートウェイ又は制御能力を有する他の装置であり得る。制御装置103は1つ以上の装置であってもよい。
制御装置103は、制御装置103によって管理される通信ネットワークのネットワークトポロジを記憶し得る。制御装置103は、通信ネットワーク内のネットワーク装置102の装置情報、通信ネットワーク内で生じる異常イベント等を収集し、管理装置101に通信ネットワークのネットワークトポロジ、ネットワーク装置102の装置情報、通信ネットワークで生じる異常イベント等を提供するようにさらに構成されている。ネットワーク装置の装置情報は、ネットワーク装置のネットワーク構成情報、ルーティングエントリ及び/又は等を含む。ネットワーク構成情報は、通常、インターフェイス構成情報、プロトコル構成情報、サービス構成情報等を含む。任意で、制御装置103は、ネットワーク装置102の装置情報及び通信ネットワークで生じる異常イベントを周期的に収集し得る。あるいは、ネットワーク装置102の装置情報が変化した場合、ネットワーク装置102は変化した装置情報を制御装置103に能動的に報告する。通信ネットワークに障害が起きた場合、ネットワーク装置102は、生じた異常イベントを制御装置103に能動的に報告する。もちろん、一部の適用シナリオでは、管理装置は、代替的に、通信ネットワーク内のネットワーク装置に直接接続され得る。つまり、適用シナリオは制御装置を含まなくてもよい。これは、本出願の実施形態で限定されない。
図2は、本願の一実施形態に係るデータ処理方法のフローチャートである。データ処理方法は、図1に示す適用シナリオにおける管理装置101に適用され得る。図2に示すように、本方法は、以下のステップを含む。
ステップ201:ターゲットネットワークのネットワークデータを取得する。
ネットワークデータはターゲットネットワークのネットワークトポロジと、ターゲットネットワーク内の複数のネットワーク装置の装置情報とを含む。ネットワーク装置の装置情報はネットワーク装置のネットワーク構成情報を含み、具体的には、インターフェイス構成情報、プロトコル構成情報及びサービス構成情報のうちの1つ以上を含む。装置情報はルーティングエントリ等をさらに含み得る。任意で、ネットワーク装置のインターフェイス構成情報は、インターフェイスのインターネットプロトコル(Internet Protocol、IP)アドレス、インターフェイスによってサポートされるプロトコルの種類、インターフェイスによってサポートされるサービスの種類等を含む。ネットワーク装置のプロトコル構成情報はプロトコルの識別子を含み、プロトコルの識別子はプロトコルを一意に識別するために用いられ、文字、文字、数字及び/又は等によって表され得る。ネットワーク装置のサービス構成情報は、ネットワーク装置によって用いられるサービス、例えば、仮想プライベートネットワーク(virtual private network、VPN)サービス及び/又は動的ホスト構成プロトコル(Dynamic Host Configuration Protocol、DHCP)サービスを含む。
任意で、ステップ201の実施プロセスは、ターゲットネットワークの制御装置によって送信されるターゲットネットワークのネットワークデータを管理装置が受信することを含む。
ステップ202:ターゲットネットワークのネットワークデータから複数の知識グラフトリプレットを抽出する。
各知識グラフトリプレットは2つのネットワークエンティティ及び2つのネットワークエンティティ間の関係を含む。例えば、2つのネットワークエンティティ間の関係は、依存関係、従属関係又は同等関係である。
本願の実施形態では、ネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスであり得る。例えば、知識グラフトリプレット上の2つのネットワークエンティティがネットワーク装置及びインターフェイスである場合、2つのネットワークエンティティ間の関係は従属関係である。すなわち、インターフェイスはネットワーク装置に属する。別の例として、知識グラフトリプレット上の2つのネットワークエンティティが、通信接続が確立される2つのインターフェイスの場合、2つのネットワークエンティティ間の関係は同等関係である。
任意で、その種類がネットワーク装置であるネットワークエンティティは名前、媒体アクセス制御(media access control、MAC)アドレス又はネットワーク装置のハードウェアアドレス又はネットワーク装置を一意的に特定可能な別の識別子によって表され得る。その種類がインターフェイスであるネットワークエンティティは、インターフェイスの名前によって表現され得る。その種類がプロトコルであるネットワークエンティティは、プロトコルの識別子によって表され得る。知識グラフトリプレットはグラフ形式で表されます。知識グラフトリプレットは2つの基本要素、すなわちポイント及びエッジを含み、ポイントはネットワークエンティティを表し、エッジは2つのネットワークエンティティ間の関係を表す。知識グラフトリプレットのエッジは有向であってもいいし無向であってもよい。知識グラフトリプレット上のエッジは2つのネットワークエンティティ間の特定の関係、例えば依存関係、従属関係又は同等関係を示すためにさらに用いられ得る。例えば、2つのネットワークエンティティが同等関係にある場合、2つのネットワークエンティティを接続するために無向エッジが用いられ得る。2つのネットワークエンティティが依存関係又は従属関係にある場合、2つのネットワークエンティティを接続するために有向エッジ(例えば、矢印)が用いられ、有向エッジは依存ネットワークエンティティから依存されるネットワークエンティティを向くか又は有向エッジは所属するネットワークエンティティから所属されるネットワークエンティティを向く。
例えば、管理装置によって取得されるネットワークデータが、「ネットワーク装置1は、「10GE1/0/6」という名前のインターフェイスを有する」というデータを含むと仮定すると、管理装置は図3に示す知識グラフトリプレットを抽出し得る。図3を参照して、知識グラフトリプレット上では、2つのネットワークエンティティの種類はそれぞれネットワーク装置及びインターフェイスであり、矢印はインターフェイスからネットワーク装置を向く。これは、「10GE1/0/6」というインターフェイスがネットワーク装置1に属していることを示す。つまり、知識グラフトリプレットは、ネットワーク装置1が「10GE1/0/6」というインターフェイスを有することを反映できることを示す。
任意で、ステップ202の実施プロセスは、管理装置が、ターゲットネットワークのネットワークタイプに対応する抽象サービスモデルに基づいて、ネットワークデータから複数の知識グラフトリプレットを抽出することを含み、抽象サービスモデルは異なるネットワークエンティティ間の関係を反映するために用いられる。異なるネットワークタイプは異なる抽象サービスモデルに対応し得る。抽象サービスモデルは、本質的に、異なるネットワークエンティティ間の依存関係を定義するために用いられるデータオブジェクトである。例えば、各ネットワーク装置が1つ以上のインターフェイスを有することが抽象サービスモデルにおいて定義され得る。つまり、インターフェイスはネットワーク装置に属する。インターフェイスはフォワーディングサービスを保持してもよく、例えば、インターフェイスはレイヤ3IPフォワーディングサービスを保持し得る。これは、インターフェイスが内部ゲートウェイプロトコル(interior gateway protocol、IGP)を用いるパケットフォワーディングをサポートすることを意味する。つまり、レイヤ3IPフォワーディングサービス又はIGPはインターフェイスに依存する。レイヤ3IPフォワーディングサービスはVXLANトンネル、トラフィックエンジニアリング(traffic engineering、TE)トンネル及び境界ゲートウェイプロトコル(Border Gateway Protocol、BGP)を保持し得る。つまり、VXLANトンネル、TEトンネル及びBGPは、レイヤ3IPフォワーディングサービスに依存する。TEトンネルはVPNサービスを保持し得る。つまり、VPNサービスはTEトンネルに依存する。レイヤ3IPフォワーディングサービスがVXLANトンネルを保持し得ることは、レイヤ3IPフォワーディングサービスを保持するインターフェイスがVXLANトンネルのエンドポイントとして用いられ得ることを示します。レイヤ3IPフォワーディングサービスがTEトンネルを保持し得ることは、レイヤ3IPフォワーディングサービスを保持するインターフェイスがTEトンネルのエンドポイントとして用いられ得ることを示す。レイヤ3IPフォワーディングサービスがBGPを保持し得ることは、レイヤ3IPフォワーディングサービスを保持するインターフェイスがBGPベースのプロトコルパケットを送受信するように設定され得ることを示す。TEトンネルがVPNサービスを保持し得ることは、TEトンネルを保持するインターフェイスがVPNサービスをサポートし得ることを示す。
任意で、管理装置は、ネットワーク装置のネットワーク構成情報から知識グラフトリプレットを抽出し得るか又はネットワーク装置のルーティングエントリに基づいて知識グラフトリプレットを取得し得る。
例えば、ネットワーク装置のネットワーク構成情報に基づいて管理機器によって抽出された知識グラフトリプレットの内容は、ネットワーク装置1が「10GE1/0/6」という名前のインターフェイスを有し、インターフェイス「10GE1/0/6」はレイヤ3IPフォワーディングサービスをサポートし、インターフェイス「10GE1/0/6」のIPアドレスは192.168.1.1であり、ネットワーク装置1はVXLANトンネルを有し、VXLANトンネルの送信元IPアドレスは192.168.1.1であり、VXLANトンネルの宛先IPアドレスは192.168.10.1であることを含むと仮定する。VXLANトンネルとインターフェイスとの間の関係を特定するために、管理装置は宛先IPアドレスである192.168.10.1を用いてルーティングエントリを検索し得る。ルーティングエントリに基づいて、宛先IPアドレスに到達するアウトバウンドインターフェイスはインターフェイス「10GE1/0/6」であると判定された場合、ルーティングエントリに基づいて管理装置によって取得された知識グラフトリプレットの内容は、VXLANトンネルのエンドポイントはネットワーク装置1のインターフェイス「10GE1/0/6」に位置しているというものである。
ステップ203:複数の知識グラフトリプレットに基づいて、ターゲットネットワークの知識グラフを生成する。
例えば、ターゲットネットワークは、ネットワーク装置A及びネットワーク装置Bという2つのネットワーク装置を含むと仮定する。ネットワーク装置Aは3つのインターフェイスを有し、3つのインターフェイスの名前は10GE1/0/1、10GE1/0/2、10GE1/0/3である。ネットワーク装置Bは4つのインターフェイスを有し、4つのインターフェイスの名前は10GE3/0/1、10GE3/0/2、10GE3/0/3及び10GE3/0/4である。ネットワーク装置A及びネットワーク装置Bの両方は、オープンショーテストパスファースト(open shortest path first、OSPF)プロトコルをサポートし、OSPEがIGPである。ネットワーク装置AでのOSPFプロトコルの識別子は10.89.46.25で表され、ネットワーク装置AでのOSPFプロトコルは、11.11.11.11、11.11.11.12及び11.11.11.13という3つのルートIPアドレスを含む。ネットワーク装置BでのOSPFプロトコルの識別子は10.89.49.37で表され、ネットワーク装置BでのOSPFプロトコルは、11.12.11.11、11.12.11.12、11.12.11.13及び11.12.11.14という4つのルートIPアドレスを含む。ネットワーク装置Aのインターフェイス「10GE1/0/2」はネットワーク装置Bのインターフェイス「10GE3/0/2」に接続され、OSPFプロトコルは、2つのインターフェイス間の通信に用いられる。ネットワーク装置Aのインターフェイス「10GE1/0/2」はルートIPアドレス11.11.11.11を用い、ネットワーク装置Bのインターフェイス「10GE3/0/2」はルートIPアドレス11.12.11.14を用いる。したがって、図4に示す知識グラフは前述のネットワークデータに基づいて取得され得る。図4を参照されたい。ターゲットネットワーク内のネットワーク装置A及びネットワーク装置Bの装置情報は、知識グラフ上でグラフの形式表される。
任意で、ターゲットネットワークの知識グラフを生成した後に、管理装置は、ターゲットネットワークの知識グラフを運用支援システム(operations support system、OSS)又は管理装置に接続された端末装置に送信して、OSS又は端末装置が知識グラフを表示するようにしてもよい。もちろん、管理装置が表示機能を有する場合、管理装置は、代替的に、管理装置の表示インターフェイスにターゲットネットワークの知識グラフを直接表示し得る。
本願の実施形態では、ターゲットネットワークのネットワークデータを取得した後に、管理装置は、ネットワークデータを処理してターゲットネットワークの知識グラフを生成する。ターゲットネットワークの知識グラフは、ターゲットネットワーク内のネットワークエンティティ及び異なるネットワークエンティティ間の関係を直感的に反映することができる。すなわち、ネットワークデータを可視化するために用いることができる。ターゲットネットワークでネットワーク情報を取得する必要がある場合、ユーザは手動でコマンドラインを照会することなく、ターゲットネットワークの知識グラフを見るだけで済む。したがって、ユーザによるネットワーク情報の取得の効率が改善される。
任意で、ターゲットネットワークの知識グラフを生成した後で、管理装置は、ターゲットネットワークの知識グラフを後の使用のために管理装置に又は管理装置に接続された記憶装置にさらに記憶し得る。例えば、ターゲットネットワークの知識グラフは、ネットワークエンティティ間の障害伝搬関係を特定するための基礎として及び/又は障害の根本原因を推論のための基礎として用いられ得る。
ステップ204:ターゲットネットワークで障害が起きた場合、ターゲットネットワークで生じた異常なイベントを取得する。
ターゲットネットワークで障害が起こるとは、ターゲットネットワーク内のネットワーク装置に障害が起こることを意味する。ネットワーク装置の障害の種類はインターフェイス障害、プロトコル障害(プロトコルパケットの正常な送受信の障害等を含む)、サービス障害等を含む。任意で、異常なイベントは、アラームログ、状態変化ログ及び異常キーパフォーマンスインジケータのうちの1つ以上を含む。アラームログは、ネットワーク装置における異常なネットワークエンティティの識別子及びアラームタイプを含む。状態変更ログは、構成ファイル変更情報、ルーティングエントリ変更情報及び/又等を含む。例えば、状態変更ログは、「アクセスサブインターフェイスが削除された」や「宛先IPホスト経路が削除された」等の情報を含み得る。異常キーパフォーマンスインジケータは、ネットワークエンティティの異常インジケータを記述するために用いられる。
ステップ205:ターゲットネットワーク内で異常なイベントを生じさせた異常なネットワークエンティティをターゲットネットワークの知識グラフ上で識別する。
任意で、管理装置は、ターゲットネットワーク内の取得された異常なイベントに基づいて異常なネットワークエンティティを特定し、ターゲットネットワークの知識グラフ上の全ての異常なネットワークエンティティを識別し得る。知識グラフ上の異常なネットワークエンティティ及び正常ネットワークエンティティは、異なるパターン及び/又は異なる色を用いることによって区別してもいいし、「異常」等の言葉を異常なネットワークエンティティの近くにマークしてもよい。知識グラフ上で異常なネットワークエンティティを識別する方法は本願のこの実施形態では限定されない。
任意で、ターゲットネットワークの知識グラフ上で異常なネットワークエンティティを識別した後に、管理装置は、OSS又は管理装置に接続されている端末装置にターゲットネットワークの知識グラフを送信して、OSS又は端末装置が知識グラフを表示するようにし得る。これは、運用保守エンジニアがターゲットネットワーク内の異常なネットワークエンティティを見るのに役立つ。管理装置は、異常なネットワークエンティティに対応する異常なイベントをOSS又は管理装置に接続された端末装置に送信して、OSS又は端末装置が異常なイベントを表示するようにしてもよい。これは、運用保守エンジニアが異常なネットワークエンティティの異常の種類を取得するのに役立つ。
ステップ203で生成された知識グラフは初期知識グラフとも呼ばれ得る。ステップ205で異常なネットワークエンティティが識別される知識グラフは第1の知識グラフとも呼ばれ得る。
ステップ206:ネットワークエンティティ間の障害伝搬関係に基づいて、ターゲットネットワークの知識グラフ上の全ての異常なネットワークエンティティから、1つ以上の根本原因の障害ネットワークエンティティを特定する。
根本原因の障害ネットワークエンティティは、障害の根本原因である異常なネットワークエンティティである。
任意で、管理装置が障害伝搬関係を取得するプロセスは、管理装置が複数の知識グラフサンプルを取得することを含み、各知識グラフサンプルは、該知識グラフサンプルが属するネットワークで障害が起きた場合に、該知識グラフサンプルが属するネットワークでの異常なイベント及び根本原因の障害ネットワークエンティティを生じさせる全ての異常なネットワークエンティティと同定されている。管理装置は、複数の知識グラフサンプルに基づいて、前記障害伝搬関係を特定する。各知識グラフサンプルは障害ケースであり、異常なネットワークエンティティ及び知識グラフサンプル内の根本原因の障害ネットワークエンティティは手動で特定され得る。任意で、管理装置は、グラフ埋め込みアルゴリズム等を用いることにより、複数の知識グラフサンプルにおける障害伝搬関係を学習し得る。あるいは、同じ知識グラフトリプレット上の2つのネットワークエンティティが同時に異常である確率が閾値より大きい場合、管理装置は、2つのネットワークエンティティ間で障害伝搬が行われていると判定し得る。
例えば、図4に示す知識グラフでは、ネットワーク装置Aのインターフェイス「10GE1/0/2」に障害が起きた場合、インターフェイス上で通常の通信ができないため、インターフェイスが用いるルートIPアドレス「11.12.11.14」は到達不能である。したがって、管理装置はインターフェイスの障害により、インターフェイスによって用いられるルートIPアドレスが到達不能になるという障害伝搬関係を取得し得る。インターフェイスの障害を示すために用いられる第1の異常なイベントと、インターフェイスによって用いられるルートIPアドレスが到達不能であることを示すために用いられる第2の異常なイベントを管理装置が取得すると、管理装置は第1の異常なイベントが根本原因の異常なイベントであると判定し、そのインターフェイスが根本原因の障害ネットワークエンティティであると判定する。
任意で、知識グラフサンプルが属するネットワークはターゲットネットワークであるか又は知識グラフサンプルが属するネットワークはターゲットネットワークと同じネットワークタイプの別のネットワークである。複数の知識グラフサンプルが同じネットワークに属していてもいいし、複数のネットワークに属していてもよい。これは、本願のこの実施形態では限定されない。
本願のこの実施形態では、管理装置は、複数の知識グラフサンプルを用いることによりネットワークエンティティ間の障害伝搬関係を学習し、障害伝搬関係に基づいて、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティのうちの根本原因の障害ネットワークエンティティを特定し得る。これは、ネットワーク障害の根本原因の自動化された推論及び探索を実施する。
任意で、ネットワークエンティティ間の障害伝搬関係は、代替的に、別の装置によって特定され、次いで、管理装置に送信され得る。他の装置がネットワークエンティティ間の障害伝搬関係を特定する方法については、管理装置がネットワークエンティティ間の障害伝搬関係を特定する前述の方法を参照されたい。本願のこの実施形態では、詳細については説明しない。
ステップ207:ターゲットネットワークの知識グラフ上で1つ以上の根本原因の障害ネットワークエンティティを識別する。
任意で、ターゲットネットワークの知識グラフ上で根本原因の障害ネットワークエンティティを識別した後で、管理装置は、OSS又は管理装置に接続された端末装置にターゲットネットワークの知識グラフを送信して、OSS又は端末装置が知識グラフを表示するようにしてもいい。これは、運用保守エンジニアがターゲットネットワーク内の根本原因の障害ネットワークエンティティを見て、障害を迅速に特定するのに役立ち、障害修復効率が改善される。すなわち、ネットワーク装置が障害状態から動作状態に切り替わるのに要する期間が短縮される。ネットワーク装置が障害状態から動作状態に切り替わるのに要する時間は、平均修復時間(mean time to repair、MTTR)とも呼ばれる。
任意で、本願のこの実施形態では、管理装置は1つの装置又は複数の装置を含み得る。管理装置が1つの装置を含む場合、ステップ201~ステップ207の全ては該装置によって行われる。あるいは、管理装置が複数の装置を、例えば、第1の装置及び第2の装置を含む場合、ステップ201~ステップ205及びステップ207が第1の装置によって行われ、ステップ206が第2の装置によって行われてもよい。具体的には、第1の装置はターゲットネットワークの知識グラフを生成し、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティを識別し、第1の装置は、異常なネットワークエンティティで特定された知識グラフを第2の装置に送信し、第2の装置は、ネットワークエンティティ間の障害伝搬関係に基づく異常なネットワークエンティティから根本原因の障害ネットワークエンティティを特定し、第2の装置は、根本原因の障害ネットワークエンティティの識別子を第1の装置に送信し、第1の装置は、根本原因の障害ネットワークエンティティの受信した識別子に基づいて、ターゲットネットワークの知識グラフ上の根本原因の障害ネットワークエンティティを識別する。
本願のこの実施形態で提供されるデータ処理方法における一連のステップは適切に調整され、それに対応して、ステップが状況に基づいて追加又は削除され得る。例えば、ステップ207は代替的に行われなくてもよい。ターゲットネットワークの知識グラフ上で根本原因の障害ネットワークエンティティを特定した後に、管理装置は、根本原因の障害ネットワークエンティティに対応する根本原因の異常なイベントを直接出力する。本願に開示された技術的範囲内で当業者が容易に思いつく任意の変更された方法は本願の保護範囲に含まれるものとする。したがって、ここでは詳細について説明しない。
結論として、本願のこの実施形態で提供されるデータ処理方法によれば、ターゲットネットワークのネットワークデータを取得した後で、管理装置はネットワークデータを処理して、ターゲットネットワークの知識グラフを生成する。ターゲットネットワークの知識グラフは、ターゲットネットワーク内のネットワークエンティティ及び異なるネットワークエンティティ間の関係を直感的に反映することができる。すなわち、ネットワークデータを可視化するために用いることができる。ターゲットネットワークでネットワーク情報を取得する必要がある場合、ユーザは手動でコマンドラインを照会することなく、ターゲットネットワークの知識グラフを見るだけで済む。したがって、ユーザによるネットワーク情報の取得の効率が改善される。加えて、ターゲットネットワークで障害が起きた後に、管理装置は、ターゲットネットワークの異常な位置を直感的に反映するために、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティをさらに識別し得る。また、管理装置は、ネットワークエンティティ間の障害伝搬関係に基づいて、ターゲットネットワークの知識グラフ上の異常なネットワークエンティティのうちの根本原因の障害ネットワークエンティティをさらに特定して、ネットワーク障害の根本原因の自動化された推論及び特定を実施し得る。
なお、管理装置は、異なるステップを行うように別々に構成された複数の装置を含み得る。2つの隣接するステップが異なる装置によって行われる場合、前のステップを行う装置は前のステップの実行結果を次のステップを行う装置に送信する。管理装置が装置A及び装置BBを含むと仮定する。一実施では、ステップ201~203が装置Aによって行われ、ステップ204~207が装置Bによって行われ、装置Aはステップ201~203を介して生成された初期知識グラフを装置Bに送信し、装置Bは、装置Aから受信した初期知識グラフに基づいてステップ204~207を行う。別の実施では、ステップ201~205が装置Aによって行われ、ステップ206~207が装置Bによって行われ、装置Aは、ステップ201~205を介して生成された第1の知識グラフを装置Bに送信し、装置Bは、装置Aから受信した第1の知識グラフに基づいてステップ206及び207を行う。
図5は、本願の一実施形態に係るデータ処理装置50の構造の概略図である。データ処理装置50は、図1に示す適用シナリオにおける管理装置101に適用され得る。図5に示すように、装置50は、
ターゲットネットワークのネットワークデータを取得するように構成された第1の取得モジュール501であって、該ネットワークデータは該ターゲットネットワークのネットワークトポロジと、該ターゲットネットワーク内の複数のネットワーク装置の装置情報とを含み、該装置情報はインターフェイス構成情報、プロトコル構成情報及びサービス構成情報のうちの1つ以上を含む、第1の取得モジュール501と、
ネットワークデータから複数の知識グラフトリプレットを抽出するように構成された抽出モジュール502であって、各知識グラフトリプレットは2つのネットワークエンティティと、該2つのネットワークエンティティ間の関係とを含み、該ネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスである、抽出モジュール502と、
複数の知識グラフトリプレットに基づいて、ターゲットネットワークの知識グラフを生成するように構成された生成モジュール503と、
を含む。
結論として、本願のこの実施形態で提供されるデータ処理装置によれば、第1の取得モジュールを介してターゲットネットワークのネットワークデータを取得した後で、管理装置はネットワークデータを処理して、生成モジュールを介してターゲットネットワークの知識グラフを生成する。ターゲットネットワークの知識グラフは、ターゲットネットワーク内のネットワークエンティティ及び異なるネットワークエンティティ間の関係を直感的に反映することができる。すなわち、ネットワークデータを可視化するために用いることができる。ターゲットネットワークでネットワーク情報を取得する必要がある場合、ユーザは手動でコマンドラインを照会することなく、ターゲットネットワークの知識グラフを見るだけで済む。したがって、ユーザによるネットワーク情報の取得の効率が改善される。
任意で、装置情報はルーティングエントリをさらに含む。
任意で、2つのネットワークエンティティ間の関係は、依存関係、従属関係又は同等関係である。
任意で、図6に示すように、装置50は、
ターゲットネットワークで障害が起きた場合に、ターゲットネットワークで発生した異常なイベントを取得するように構成された第2の取得モジュール504と、
ターゲットネットワークで異常なイベントを生じさせた異常なネットワークエンティティを、ターゲットネットワークの知識グラフ上で識別するように構成された識別モジュール505と、
をさらに含む。
任意で、異常なイベントは、アラームログ、状態変化ログ及び異常キーパフォーマンスインジケータのうちの1つ以上を含む。
任意で、図7に示すように、装置50は、
ネットワークエンティティ間の障害伝搬関係に基づいて、ターゲットネットワークの知識グラフ上の全ての異常なネットワークエンティティから、1つ以上の根本原因の障害ネットワークエンティティを特定するように構成された第1の特定モジュール506、
をさらに含み、
識別モジュール505は、ターゲットネットワークの知識グラフ上で1つ以上の根本原因の障害ネットワークエンティティを識別するようにさらに構成されている。
任意で、図8に示すように、装置50は、
複数の知識グラフサンプルを取得するように構成された第3の取得モジュール507であって、各知識グラフサンプルは、該知識グラフサンプルが属するネットワークで障害が起きた場合に、該知識グラフサンプルが属するネットワークでの異常なイベント及び根本原因の障害ネットワークエンティティを生じさせる全ての異常なネットワークエンティティと同定されている、第3の取得モジュール507と、
複数の知識グラフサンプルに基づいて、障害伝搬関係を特定するように構成された第2の特定モジュール508と、
をさらに含む。
任意で、知識グラフサンプルが属するネットワークはターゲットネットワークであるか又は知識グラフサンプルが属するネットワークは、ターゲットネットワークと同じネットワークタイプの別のネットワークである。
任意で、抽出モジュール502は、
ターゲットネットワークのネットワークタイプに対応する抽象サービスモデルに基づいて、ネットワークデータから複数の知識グラフトリプレットを抽出するようにさらに構成され、該抽象サービスモデルは、異なるネットワークエンティティ間の関係を反映するために用いられる。
結論として、本願のこの実施形態で提供されるデータ処理装置によれば、第1の取得モジュールを介してターゲットネットワークのネットワークデータを取得した後で、管理装置はネットワークデータを処理して、生成モジュールを介してターゲットネットワークの知識グラフを生成する。ターゲットネットワークの知識グラフは、ターゲットネットワーク内のネットワークエンティティ及び異なるネットワークエンティティ間の関係を直感的に反映することができる。すなわち、ネットワークデータを可視化するために用いることができる。ターゲットネットワークでネットワーク情報を取得する必要がある場合、ユーザは手動でコマンドラインを照会することなく、ターゲットネットワークの知識グラフを見るだけで済む。したがって、ユーザによるネットワーク情報の取得の効率が改善される。加えて、ターゲットネットワークで障害が起きた後に、管理装置は、ターゲットネットワークの異常な位置を直感的に反映するために、識別モジュールを介してターゲットネットワークの知識グラフ上の異常なネットワークエンティティをさらに識別し得る。また、管理装置は、ネットワークエンティティ間の障害伝搬関係に基づいて、第1の特定モジュールを介してターゲットネットワークの知識グラフ上の異常なネットワークエンティティのうちの根本原因の障害ネットワークエンティティをさらに特定して、ネットワーク障害の根本原因の自動化された推論及び特定を実施し得る。
図9は、本願の一実施形態に係るデータ処理装置90のブロック図である。データ処理装置90は、図1に示す適用シナリオにおける管理装置であり得る。図9に示すように、データ処理装置90は、プロセッサ901及びメモリ902を含む。
メモリ902はコンピュータプログラムを記憶するように構成され、コンピュータプログラムはプログラム命令を含む。
プロセッサ901は、図2に示すデータ処理方法を実施するためにコンピュータプログラムを呼び出すように構成されている。
任意で、データ処理装置90は、通信バス903及び通信インターフェイス904をさらに含む。
プロセッサ901は1つ以上の処理コアを含み、プロセッサ901は、コンピュータプログラムを実行することにより、様々な機能アプリケーション及びデータ処理を実行する。
メモリ902はコンピュータプログラムを記憶するように構成され得る。任意で、メモリは、オペレーティングシステム及び機能によって必要とされる少なくとも1つのアプリケーションプログラムユニットを記憶し得る。オペレーティングシステムは、リアルタイムオペレーティングシステム(Real Time eXecutive、RTX)、Linux、UNIX、Windows、OSX等であり得る。
複数の通信インターフェイス904が存在してもよく、通信インターフェイス904は、例えば、制御装置又はネットワーク装置と通信するように構成されている。
メモリ902及び通信インターフェイス904は、通信バス903を介して別々にプロセッサ901に接続されている。
図10は本願の一実施形態に係る障害の根本原因の特定装置100の構造の概略図である。障害の根本原因の特定装置100は、図1に示す適用シナリオにおける管理装置101に適用され得る。図10に示すように、装置100は、
障害が起きたターゲットネットワークの第1の知識グラフを取得するように構成された取得モジュール1010であって、該第1の知識グラフは、前記ターゲットネットワークで異常なイベントを生じさせる異常なネットワークエンティティであると特定され、第1の知識グラフ上のネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスであり、具体的には、第1の知識グラフは別の装置から受信され得るか又はステップ203~205を行うことにより生成されてもよく、ターゲットネットワークで異常イベントを生じさせる異常なネットワークエンティティは、第1の知識グラフを取得するために初期知識グラフ上で識別される、取得モジュール1010と、
ネットワークエンティティ間の障害伝搬関係に基づいて、ターゲットネットワークの第1の知識グラフ上の全ての異常なネットワークエンティティから、1つ以上の根本原因の障害ネットワークエンティティを特定するように構成された特定モジュール1020と、
を含む。
装置100は識別モジュール1030をさらに含んでもよく、識別モジュールは、ターゲットネットワークの知識グラフ上の1つ以上の根本原因の障害ネットワークエンティティを識別するように構成されている。
また、取得モジュール1010は、複数の知識グラフサンプルを取得するようにさらに構成され、各知識グラフサンプルは、該知識グラフサンプルが属するネットワークで障害が起きた場合に、該知識グラフサンプルが属するネットワークでの異常なイベント及び根本原因の障害ネットワークエンティティを生じさせる全ての異常なネットワークエンティティと同定されている。それに対応して、特定モジュール1020は、複数の知識グラフサンプルに基づいて、障害伝搬関係を特定するようにさらに構成されている。知識グラフサンプルが属するネットワークはターゲットネットワークであるか又は知識グラフサンプルが属するネットワークはターゲットネットワークと同じネットワークタイプの別のネットワークである。
本願の一実施形態は、コンピュータ記憶媒体をさらに提供する。コンピュータ記憶媒体は命令を記憶する。命令がプロセッサによって実行される場合、図2に示すデータ処理方法が実施される。
当業者であれば、前述の実施形態におけるステップの全て又は一部はハードウェア又は関連するハードウェアを指示するプログラムによって実施され得ることを理解し得る。プログラムは、コンピュータ読み取り可能記憶媒体に記憶され得る。記憶媒体は読み出し専用メモリ、磁気ディスク、光ディスク等であり得る。
本願の実施形態では、「第1」、「第2」及び「第3」という用語は説明のために用いられているにすぎず、相対的な重要性を示すか又は含意すると理解することはできない。「少なくとも1つ」という用語は1つ以上を意味し、「複数の」という用語は、別段の明確な制限がない限り2つ以上を意味する。
本願における「及び/又は」という用語は、関連するオブジェクト間の関連関係のみを記述し、3つの関係が存在し得ることを示す。例えば、A及び/又はBは、Aのみが存在する場合、A及びBの両方が存在する場合、Bのみが存在する場合という3つの場合を示し得る。加えて、本明細書における「/」という記号は、関連するオブジェクト間の「又は」の関係を概して示す。
前述の説明は本願の任意の実施形態にすぎず、本願を限定することを意図していない。本願の概念及び原則の範囲内でなされる任意の修正、同等の置き換え、改良等も本願の保護範囲に含まれるものとする。

Claims (26)

  1. データ処理方法であって、
    ターゲットネットワークのネットワークデータを取得することであって、該ネットワークデータは該ターゲットネットワークのネットワークトポロジと、該ターゲットネットワーク内の複数のネットワーク装置の装置情報とを含み、該装置情報は、インターフェイス構成情報、プロトコル構成情報及びサービス構成情報のうちの1つ以上を含む、ことと、
    前記ネットワークデータから複数の知識グラフトリプレットを抽出することであって、各知識グラフトリプレットは2つのネットワークエンティティと、該2つのネットワークエンティティ間の関係とを含み、該ネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスである、ことと、
    前記複数の知識グラフトリプレットに基づいて、前記ターゲットネットワークの知識グラフを生成することと、
    を含む、方法。
  2. 前記装置情報はルーティングエントリをさらに含む、請求項1に記載の方法。
  3. 前記2つのネットワークエンティティ間の関係は、依存関係、従属関係又は同等関係である、請求項1又は2に記載の方法。
  4. 前記ターゲットネットワークの知識グラフを生成することの後に、前記方法は、
    前記ターゲットネットワークで障害が起きた場合に、前記ターゲットネットワークで生じた異常なイベントを取得することと、
    前記ターゲットネットワークで前記異常なイベントを生じさせた異常なネットワークエンティティを、前記ターゲットネットワークの知識グラフ上で識別することと、
    をさらに含む、請求項1乃至3のいずれか一項に記載の方法。
  5. 前記異常なイベントは、アラームログ、状態変化ログ及び異常キーパフォーマンスインジケータのうちの1つ以上を含む、請求項4に記載の方法。
  6. 前記ターゲットネットワークで前記異常なイベントを生じさせた異常なネットワークエンティティを、前記ターゲットネットワークの知識グラフ上で識別することの後に、前記方法は、
    ネットワークエンティティ間の障害伝搬関係に基づいて、前記ターゲットネットワークの知識グラフ上の全ての異常なネットワークエンティティから、1つ以上の根本原因の障害ネットワークエンティティを特定することと、
    前記ターゲットネットワークの知識グラフ上で前記1つ以上の根本原因の障害ネットワークエンティティを識別することと、
    をさらに含む、請求項4又は5に記載の方法。
  7. 前記方法は、
    複数の知識グラフサンプルを取得することであって、各知識グラフサンプルは、該知識グラフサンプルが属するネットワークで障害が起きた場合に、該知識グラフサンプルが属するネットワークでの異常なイベント及び根本原因の障害ネットワークエンティティを生じさせる全ての異常なネットワークエンティティと同定されている、ことと、
    前記複数の知識グラフサンプルに基づいて、前記障害伝搬関係を特定することと、
    をさらに含む、請求項6に記載の方法。
  8. 前記知識グラフサンプルが属するネットワークは前記ターゲットネットワークであるか又は前記知識グラフサンプルが属するネットワークは、前記ターゲットネットワークと同じネットワークタイプの別のネットワークである、請求項7に記載の方法。
  9. 前記ネットワークデータから複数の知識グラフトリプレットを抽出することは、
    前記ターゲットネットワークのネットワークタイプに対応する抽象サービスモデルに基づいて、前記ネットワークデータから前記複数の知識グラフトリプレットを抽出することであって、該抽象サービスモデルは、異なるネットワークエンティティ間の関係を反映するために用いられる、こと、
    を含む、請求項1乃至8のいずれか一項に記載の方法。
  10. データ処理装置であって、
    ターゲットネットワークのネットワークデータを取得するように構成された第1の取得モジュールであって、該ネットワークデータは該ターゲットネットワークのネットワークトポロジと、該ターゲットネットワーク内の複数のネットワーク装置の装置情報とを含み、該装置情報はインターフェイス構成情報、プロトコル構成情報及びサービス構成情報のうちの1つ以上を含む、第1の取得モジュールと、
    前記ネットワークデータから複数の知識グラフトリプレットを抽出するように構成された抽出モジュールであって、各知識グラフトリプレットは2つのネットワークエンティティと、該2つのネットワークエンティティ間の関係とを含み、該ネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスである、抽出モジュールと、
    前記複数の知識グラフトリプレットに基づいて、前記ターゲットネットワークの知識グラフを生成するように構成された生成モジュールと、
    を含む、装置。
  11. 前記装置情報はルーティングエントリをさらに含む、請求項10に記載の装置。
  12. 前記2つのネットワークエンティティ間の関係は、依存関係、従属関係又は同等関係である、請求項10又は11に記載の装置。
  13. 前記装置は、
    前記ターゲットネットワークで障害が起きた場合に、前記ターゲットネットワークで生じた異常なイベントを取得するように構成された第2の取得モジュールと、
    前記ターゲットネットワークで前記異常なイベントを生じさせた異常なネットワークエンティティを、前記ターゲットネットワークの知識グラフ上で識別するように構成された識別モジュールと、
    をさらに含む、請求項10乃至12のいずれか一項に記載の装置。
  14. 前記異常なイベントは、アラームログ、状態変化ログ及び異常キーパフォーマンスインジケータのうちの1つ以上を含む、請求項13に記載の装置。
  15. 前記装置は、
    ネットワークエンティティ間の障害伝搬関係に基づいて、前記ターゲットネットワークの知識グラフ上の全ての異常なネットワークエンティティから、1つ以上の根本原因の障害ネットワークエンティティを特定するように構成された第1の特定モジュール、
    をさらに含み、
    前記識別モジュールは、前記ターゲットネットワークの知識グラフ上で前記1つ以上の根本原因の障害ネットワークエンティティを識別するようにさらに構成されている、請求項13又は14に記載の装置。
  16. 前記装置は、
    複数の知識グラフサンプルを取得するように構成された第3の取得モジュールであって、各知識グラフサンプルは、該知識グラフサンプルが属するネットワークで障害が起きた場合に、該知識グラフサンプルが属するネットワークでの異常なイベント及び根本原因の障害ネットワークエンティティを生じさせる全ての異常なネットワークエンティティと同定されている、第3の取得モジュールと、
    前記複数の知識グラフサンプルに基づいて、前記障害伝搬関係を特定するように構成された第2の特定モジュールと、
    をさらに含む、請求項15に記載の装置。
  17. 前記知識グラフサンプルが属するネットワークは前記ターゲットネットワークであるか又は前記知識グラフサンプルが属するネットワークは、前記ターゲットネットワークと同じネットワークタイプの別のネットワークである、請求項16に記載の装置。
  18. 前記抽出モジュールは、
    前記ターゲットネットワークのネットワークタイプに対応する抽象サービスモデルに基づいて、前記ネットワークデータから前記複数の知識グラフトリプレットを抽出するようにさらに構成され、該抽象サービスモデルは、異なるネットワークエンティティ間の関係を反映するために用いられる、
    請求項10乃至17のいずれか一項に記載の装置。
  19. プロセッサ及びメモリを含むデータ処理装置であって、
    前記メモリはコンピュータプログラムを記憶するように構成され、該コンピュータプログラムはプログラム命令を含み、
    前記プロセッサは、請求項1乃至9のいずれか一項に記載のデータ処理方法を実施するために、前記コンピュータプログラムを呼び出すように構成されている、データ処理装置。
  20. コンピュータ記憶媒体であって、当該コンピュータ記憶媒体は命令を記憶し、該命令がプロセッサによって実行された場合、請求項1乃至9のいずれか一項に記載のデータ処理方法が実施される、コンピュータ記憶媒体。
  21. 障害の根本原因の特定方法であって、
    障害が起きたターゲットネットワークの第1の知識グラフを取得することであって、該第1の知識グラフは、前記ターゲットネットワークで異常なイベントを生じさせる異常なネットワークエンティティと同定され、前記第1の知識グラフ上のネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスである、ことと、
    ネットワークエンティティ間の障害伝搬関係に基づいて、前記ターゲットネットワークの第1の知識グラフ上の全ての異常なネットワークエンティティから、1つ以上の根本原因の障害ネットワークエンティティを特定することと、
    を含む、方法。
  22. 前記障害が起きたターゲットネットワークの第1の知識グラフを取得することは、
    前記ターゲットネットワークで障害が起きた場合に、前記ターゲットネットワークで生じた前記異常なイベントを取得することと、
    前記第1の知識グラフを取得するために、前記ターゲットネットワークにおける前記異常なイベントを生じさせる異常なネットワークエンティティを前記ターゲットネットワークの初期知識グラフ上で識別することであって、該初期知識グラフは前記ターゲットネットワークのネットワークデータに基づいて生成され、前記ネットワークデータは前記ターゲットネットワークのネットワークトポロジと、前記ターゲットネットワーク内の複数のネットワーク装置の装置情報とを含み、該装置情報は、インターフェイス構成情報、プロトコル構成情報及びサービス構成情報のうちの1つ以上を含む、ことと、
    を含む、請求項21に記載の方法。
  23. 障害の根本原因の特定装置であって、
    障害が起きたターゲットネットワークの第1の知識グラフを取得するように構成された取得モジュールであって、該第1の知識グラフは、前記ターゲットネットワークで異常なイベントを生じさせる異常なネットワークエンティティと同定され、前記第1の知識グラフ上のネットワークエンティティの種類は、ネットワーク装置、インターフェイス、プロトコル又はサービスである、取得モジュールと、
    ネットワークエンティティ間の障害伝搬関係に基づいて、前記ターゲットネットワークの第1の知識グラフ上の全ての異常なネットワークエンティティから、1つ以上の根本原因の障害ネットワークエンティティを特定するように構成された特定モジュールと、
    を含む装置。
  24. 前記取得モジュールは、
    前記ターゲットネットワークで障害が起きた場合に、前記ターゲットネットワークで生じた異常なイベントを取得することと、前記第1の知識グラフを取得するために、前記ターゲットネットワークにおける前記異常なイベントを生じさせる前記異常なネットワークエンティティを前記ターゲットネットワークの初期知識グラフ上で識別することを行うように構成され、該初期知識グラフは前記ターゲットネットワークのネットワークデータに基づいて生成され、該ネットワークデータは前記ターゲットネットワークのネットワークトポロジと、前記ターゲットネットワーク内の複数のネットワーク装置の装置情報とを含み、該装置情報は、インターフェイス構成情報、プロトコル構成情報及びサービス構成情報のうちの1つ以上を含む、請求項23に記載の装置。
  25. プロセッサ及びメモリを含む障害の根本原因の特定装置であって、
    前記メモリはコンピュータプログラムを記憶するように構成され、該コンピュータプログラムはプログラム命令を含み、
    前記プロセッサは、請求項21又は22に記載の障害の根本原因の特定方法を実施するために、前記コンピュータプログラムを呼び出すように構成されている、装置。
  26. コンピュータ記憶媒体であって、当該コンピュータ記憶媒体は命令を記憶し、該命令がプロセッサによって実行された場合、請求項21又は22に記載の障害の根本原因の特定方法が実施される、コンピュータ記憶媒体。
JP2022515889A 2019-09-11 2019-11-11 データ処理方法及び装置並びにコンピュータ記憶媒体 Active JP7416919B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910860877.0 2019-09-11
CN201910860877.0A CN112491636B (zh) 2019-09-11 2019-09-11 数据处理方法及装置、计算机存储介质
PCT/CN2019/117248 WO2021047011A1 (zh) 2019-09-11 2019-11-11 数据处理方法及装置、计算机存储介质

Publications (2)

Publication Number Publication Date
JP2022547560A true JP2022547560A (ja) 2022-11-14
JP7416919B2 JP7416919B2 (ja) 2024-01-17

Family

ID=74866911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022515889A Active JP7416919B2 (ja) 2019-09-11 2019-11-11 データ処理方法及び装置並びにコンピュータ記憶媒体

Country Status (6)

Country Link
US (1) US12015519B2 (ja)
EP (1) EP4024770A4 (ja)
JP (1) JP7416919B2 (ja)
CN (2) CN112491636B (ja)
BR (1) BR112022004494A2 (ja)
WO (1) WO2021047011A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113328872B (zh) 2020-02-29 2023-03-28 华为技术有限公司 故障修复方法、装置和存储介质
CN113420162B (zh) * 2021-06-24 2023-04-18 国网天津市电力公司 一种基于知识图谱的设备运行链状态监测方法
CN113595827B (zh) * 2021-07-29 2023-02-21 北京百度网讯科技有限公司 云网络监控方法和装置、电子设备、计算机介质
CN114124859B (zh) * 2021-08-17 2023-04-07 北京邮电大学 一种网络维护平台智能客户服务机器人及维护方法
CN113746950B (zh) * 2021-09-07 2023-11-21 中国联合网络通信集团有限公司 Ip地址冲突预检测方法、系统、计算机设备及存储介质
CN115883320A (zh) * 2021-09-27 2023-03-31 中国联合网络通信集团有限公司 网络设备异常分析方法、装置、电子设备及可读存储介质
CN114710392B (zh) * 2022-03-23 2024-03-12 阿里云计算有限公司 事件信息的获取方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090055684A1 (en) * 2007-08-23 2009-02-26 Jamjoom Hani T Method and apparatus for efficient problem resolution via incrementally constructed causality model based on history data

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11159364B2 (en) * 2013-04-29 2021-10-26 Moogsoft Inc. System in communication with a managed infrastructure
US9668146B2 (en) * 2014-04-25 2017-05-30 The Hong Kong University Of Science And Technology Autonomous robot-assisted indoor wireless coverage characterization platform
CN105871612A (zh) * 2016-03-31 2016-08-17 乐视控股(北京)有限公司 Cdn网络的拓扑结构生成器
CN107749803B (zh) * 2017-10-16 2021-08-31 浙江宇视科技有限公司 一种网络拓扑布局方法及装置
US10776586B2 (en) * 2018-01-10 2020-09-15 International Business Machines Corporation Machine learning to integrate knowledge and augment natural language processing
EP3564091A1 (de) 2018-04-30 2019-11-06 Siemens Aktiengesellschaft Verfahren und anordnung zur fehlerdetektion in einem weichensystem
CN109347798A (zh) * 2018-09-12 2019-02-15 东软集团股份有限公司 网络安全知识图谱的生成方法、装置、设备及存储介质
CN109815230A (zh) * 2018-12-23 2019-05-28 国网浙江省电力有限公司 一种基于知识图谱的全业务数据中心数据审计方法
CN110008288B (zh) * 2019-02-19 2021-06-29 武汉烽火技术服务有限公司 用于网络故障分析的知识图谱库的构建方法及其应用
CN109922075B (zh) * 2019-03-22 2020-06-02 中国南方电网有限责任公司 网络安全知识图谱构建方法和装置、计算机设备
CN110083744A (zh) * 2019-04-24 2019-08-02 厦门无常师教育科技有限公司 一种基于知识图谱的教学问题诊断方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090055684A1 (en) * 2007-08-23 2009-02-26 Jamjoom Hani T Method and apparatus for efficient problem resolution via incrementally constructed causality model based on history data

Also Published As

Publication number Publication date
BR112022004494A2 (pt) 2022-05-31
EP4024770A1 (en) 2022-07-06
US20220200844A1 (en) 2022-06-23
CN112491636B (zh) 2023-04-18
CN112491636A (zh) 2021-03-12
EP4024770A4 (en) 2022-10-05
WO2021047011A1 (zh) 2021-03-18
US12015519B2 (en) 2024-06-18
CN114208128A (zh) 2022-03-18
JP7416919B2 (ja) 2024-01-17

Similar Documents

Publication Publication Date Title
JP7108674B2 (ja) 故障根本原因決定方法及び装置並びにコンピュータ記憶媒体
JP7416919B2 (ja) データ処理方法及び装置並びにコンピュータ記憶媒体
CN112787841B (zh) 故障根因定位方法及装置、计算机存储介质
US10686671B1 (en) Methods, systems, and computer readable media for testing network elements of an in-band network telemetry capable network
US7593352B2 (en) Discovering MPLS VPN services in a network
WO2022083540A1 (zh) 故障恢复预案确定方法、装置及系统、计算机存储介质
Azzouni et al. sOFTDP: Secure and efficient topology discovery protocol for SDN
Azzouni et al. sOFTDP: Secure and efficient OpenFlow topology discovery protocol
CN106452915B (zh) Mpls vpn网络拓扑发现的方法及装置
CN112956158A (zh) 结构数据平面监视
US20230254244A1 (en) Path determining method and apparatus, and computer storage medium
CN113190368A (zh) 实现表项检查的方法、装置及系统、计算机存储介质
US10587488B2 (en) Performance monitoring support for CFM over EVPN
US11652742B2 (en) Ghost routing
CN112751701B (zh) 用于管理网络装置的系统、方法及计算机可读介质
US20230216763A1 (en) Network reachability verification method and apparatus, and computer storage medium
US11570193B2 (en) Malware propagation risk assessment in software defined networks
CN114257516A (zh) 网络可达性验证方法及装置、计算机存储介质
CN116192653A (zh) 一种路由可视化方法、系统、介质及设备
Alasadi Enhancing network scalability by introducing mechanisms, architectures and protocols
CN116781599A (zh) 一种路由监控方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220404

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220404

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240104

R150 Certificate of patent or registration of utility model

Ref document number: 7416919

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150