JP7491381B2 - ネットワーク監視装置、ネットワーク監視方法、および、ネットワーク監視プログラム - Google Patents

ネットワーク監視装置、ネットワーク監視方法、および、ネットワーク監視プログラム Download PDF

Info

Publication number
JP7491381B2
JP7491381B2 JP2022534522A JP2022534522A JP7491381B2 JP 7491381 B2 JP7491381 B2 JP 7491381B2 JP 2022534522 A JP2022534522 A JP 2022534522A JP 2022534522 A JP2022534522 A JP 2022534522A JP 7491381 B2 JP7491381 B2 JP 7491381B2
Authority
JP
Japan
Prior art keywords
monitoring
failure
node
fault
spine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022534522A
Other languages
English (en)
Other versions
JPWO2022009294A1 (ja
Inventor
弘樹 森
諭士 中務
賢 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2022009294A1 publication Critical patent/JPWO2022009294A1/ja
Application granted granted Critical
Publication of JP7491381B2 publication Critical patent/JP7491381B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、通信ネットワークを監視するネットワーク監視装置、ネットワーク監視方法、および、ネットワーク監視プログラムに関する。
従来、大規模な転送容量が必要とされる通信ネットワークでは、大容量かつ高機能を有するシャーシ型装置が採用されてきた。シャーシ型装置は、装置の状態や装置を通過する通信の正常性の監視を装置内部に閉じて行うことができ、故障や異常の検出が容易であるという特徴がある。
一方で、シャーシ型装置は一般に高価であり、また拡張性に乏しく需要変動が激しいデータセンター等のネットワークには適していない。そこで、シャーシ型装置に代えて、複数の汎用スイッチやホワイトボックスなどの安価な装置で構成するファブリックネットワークの採用が進んでいる。ファブリックネットワークは、シャーシ型装置のラインカードの役割を担うLeafノードとスイッチカードの役割を担うSpineノードで構成される複数装置を仮想的に1つの転送基盤として扱い、その基盤上で論理ネットワークを構成する。これにより、ファブリックネットワークは、大型装置と同等の転送性能やルーティング機能を達成しつつ、ネットワークの需要に応じたスケールアウトを安価に実現可能できる。
「Cisco Tetration」、[online]、Cisco、[令和2年6月18日検索]、インターネット<URL:https://www.cisco.com/c/ja_jp/products/data-center-analytics/tetration-analytics/index.html>
ファブリックネットワークは、複数台の装置で構成されるネットワークを1つの基盤として扱うため、基盤としての正常性を確認する必要がある。このとき、従来のシャーシ型装置同等の監視を各装置で行うだけでは不十分であるという課題がある。
例えば、装置のインターフェースが故障して装置としては疎通不可となった場合でも、ネットワーク内に冗長性があれば迂回が可能なので転送基盤としては通信には影響がない。このように、単に装置単体での状態を把握するだけでは、転送基盤としての正常性を判断することはできない。
また、各装置はそれぞれ独立に監視を行っているため、1つの故障をそれぞれの装置の監視によって検出し、大量の通知がされることで、故障箇所の特定しづらくなる場合があるという課題がある。
上述した非特許文献1は、専用のハードウェアを用いて監視用の情報をパケットに埋め込むことにより、論理ネットワークやアプリケーション間の疎通性を監視する技術であるが、独自機能または特定製品の組合せでしか監視をすることができない。また、非特許文献1は、単体の装置のみを監視対象としており、従来のシャーシ型装置と同等の監視は行えていない。
このような点に鑑みて本発明がなされたのであり、本発明は、LeafノードとSpineノードとで構成されるファブリックネットワークにおいてもシャーシ型装置と同等の正常性監視および故障時の影響判定を実現することを課題とする。
本発明に係るネットワーク監視装置は、複数のLeafノードと、複数のSpineノードと、前記Leafノードと前記Spineノードとの間を接続するリンクとを備える通信ネットワークを監視するネットワーク監視装置であって、前記通信ネットワークのネットワーク構成情報を生成するネットワーク構成管理部と、前記ネットワーク構成情報に基づいて、前記通信ネットワーク内の複数種類の監視対象を設定する監視対象設定部と、それぞれの前記監視対象に対する監視実行指示を行い、監視結果を収集する監視実行部と、それぞれの監視対象における前記監視結果を集約し、故障が生じている前記監視対象の種別と発生事象に基づいて、当該故障の故障種別と当該故障の影響度とを判定する故障判定部と、を備え、前記監視対象設定部は、前記Leafノードおよび前記Spineノードが備える物理インターフェースと、前記Leafノードと前記Spineノードとを接続する前記リンクと、前記Spineノードが備える転送機能部と、発側Leafノードと着側Leafノードとの間に設定されたオーバーレイトンネルと、を監視対象に設定し、前記故障判定部は、前記リンクに故障が検出された場合、当該リンクの両端に接続された物理インターフェースのペアの監視結果を参照して前記故障種別を判定し、前記Spineノードの前記転送機能部に故障が検出された場合、当該Spineノードに接続された2つのLeafノードと当該Spineノードとの間の各リンクの監視結果と、前記各リンクの両端に接続された物理インターフェースのペアの監視結果と、を参照して故障種別を判定し、前記オーバーレイトンネルに故障が検出された場合、前記発側Leafノードと前記着側Leafノードとを接続するSpineノードの転送機能部の監視結果と、前記着側Leafノードと当該Spineノードとの間のリンクの監視結果と、当該リンクの両端に接続された物理インターフェースのペアの監視結果と、を参照して故障種別を判定する、ことを特徴とする。
本発明によれば、ファブリックネットワークにおいてもシャーシ型装置と同等の正常性監視および故障時の影響判定を実現することができる。
本実施形態に係るネットワーク監視装置で監視する通信ネットワークの構成を示す図である。 ネットワーク監視装置の機能的構成を示すブロック図である。 通信ネットワーク内の監視対象を示す図である。 監視周期と収集周期の関係を示す説明図である。 故障種別の判定例を示す表である。 故障の影響度合いの判定例を示す表である。 第1の故障状態例を説明する図である。 第2の故障状態例を説明する図である。 第3の故障状態例を説明する図である。 各監視対象における監視結果の参照関係を示す表である。 ping疎通の失敗時における故障原因イベントの判定方法を示す表である。 traceroute疎通の失敗時における故障原因イベントの判定方法を示す表である。 VXLAN OAM疎通の失敗時における故障原因イベントの判定方法を示す表である。 監視結果の不整合発生状態の例を示す表である。 複数の集約結果に基づく故障判定方法を示す図である。 ネットワーク監視装置によるネットワーク監視処理の手順を示すフローチャートである。 本実施形態に係るネットワーク監視装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
次に、本発明を実施するための形態(以下、「本実施形態」と称する。)について説明する。まず、本発明の全体構成について説明する。
<ネットワーク構成>
図1は、本実施形態に係るネットワーク監視装置30で監視する通信ネットワーク20の構成を示す図である。
本実施形態に係るネットワーク監視装置30は、通信ネットワーク20監視対象とする。
通信ネットワーク20は、Spineノードとして機能する複数の通信ノード(以下「Spineノード」という)22と、Leafノードとして機能する複数の通信ノード(以下「Leafノード」という)24と、これらノード間を接続する物理的なリンク26とを備えるファブリックネットワークである。各Spineノード22は、通信ネットワーク20内の全てのLeafノード24とリンク26で接続されている。また、図示は省略するが、ネットワーク監視装置30と各通信ノード22,24とは接続されており、後述する監視対象の監視結果のやり取りが可能となっている。
<ネットワーク監視装置30>
図2は、ネットワーク監視装置30の機能的構成を示すブロック図である。
ネットワーク監視装置30は、1台または複数台のコンピュータ900(図17)が図2に示す各機能部として機能することにより実現する。
ネットワーク監視装置30は、ネットワーク(図中「NW」と表記)構成管理部300、記憶部301、監視対象設定部302、監視実行部303、故障判定部304を備える。
ネットワーク構成管理部300は、通信ネットワーク20のネットワーク構成情報を生成する。
本実施形態では、通信ネットワーク20上でOSPF(Open Shortest Path First)、IS-IS(Intermediate System to Intermediate System)、BGP(Border Gateway Protocol)等のルーティングプロトコルが動作しており、経路情報や論理ネットワークの情報が取得可能であるものとする。また、各通信ノード22,24は、LLDP(Link Layer Discovery Protocol)等によりリンク26の接続状態が取得可能であるものとする。なお、ルーティングプロトコルや各通信ノード22,24へのアクセスによる情報取得ができない通信ネットワークにも本発明は適用可能である。
ネットワーク構成管理部300は、上記ルーティングプロトコルや各通信ノード22,24へのアクセスによって、ネットワークトポロジや遅延情報を取得し、ネットワーク構成情報を生成する。
なお、ネットワーク構成管理部300に対して手動でネットワーク構成情報を入力してもよい。
記憶部301は、ネットワーク構成管理部300で生成されたネットワーク構成情報を記憶する。記憶部301は、ネットワーク構成情報として、例えば物理ネットワーク構成情報301Aや論理ネットワーク構成情報301B等を記憶する。
監視対象設定部302は、ネットワーク構成情報に基づいて、通信ネットワーク20内の複数種類の監視対象を設定する。
図3は、通信ネットワーク20内の監視対象を示す図である。
図3に示すように、監視対象設定部302は、通信ネットワーク20内の以下の4つの箇所を監視対象として設定する。
[第1の監視対象]Leafノード24およびSpineノード22が備える物理インターフェース(IF)41:図3中黒塗り丸
第1の監視対象である物理インターフェース41は、シャーシ型装置におけるUNI(User-Network Interface)または内部配線接続点に相当する。
[第2の監視対象]Leafノード24とSpineノード22とを接続するLeaf‐Spine間リンク(リンク26):図3中実線の両矢印
第2の監視対象であるリンク26は、シャーシ型装置における内部配線に相当する。
[第3の監視対象]Spineノード22が備える転送機能部23
第3の監視対象である転送機能部23は、シャーシ型装置におけるスイッチカードに相当する。
[第4の監視対象]Leafノード24間に設定されたオーバーレイトンネル42:図3中点線の両矢印
第4の監視対象であるオーバーレイトンネル42は、VRF(Virtual Routing and Forwarding)またはVNI(VXLAN Network Identifier)等の論理ネットワークに相当する。
なお、オーバーレイトンネル42は、通信ネットワーク20に設定されている場合のみ監視対象となる。
監視実行部303は、監視対象設定部302が設定したそれぞれの監視対象に対する監視の実行指示(監視実行指示)を行い、監視結果を収集する。
監視実行部303は、所定の監視周期毎に監視実行指示を行っており、本実施形態では、第1~第4の監視対象に対してそれぞれ個別に監視周期および監視タイミングを設定している(図4参照)。監視実行部303は、監視周期毎に各装置に監視の指示を行ってもよいし、各装置が監視周期毎に自律的に監視を実行するように指示してもよい。
第1~第4の監視対象に対する監視は、例えば以下の方法で行う。なお、以下に挙げる方法は一例であり、同等の情報取得や状態確認ができる方法で代替してもよい。
[第1の監視対象]:物理インターフェース41
通信ネットワーク20内で有効な全ての物理インターフェース41に対して、TelemetryやSNMP(Simple Network Management Protocol)を用いてその状態を監視する。
[第2の監視対象]:Leaf-Spine間のリンク26
Leaf-Spine間を直接接続している全てのリンク26について、ICMP(Internet Control Message Protocol) ping(以下、単に「ping」という)を用いて当該リンク26の疎通性を監視する。
[第3の監視対象]:Spineノード22の転送機能部23
転送機能部23で保有する各Leafノード24の物理インターフェース41から他のLeafノード24の物理インターフェース41への全転送経路に対して、ICMP traceroute(以下、単に「traceroute」という)を用いて転送機能部23の転送処理の疎通性を監視する。
[第4の監視対象]:オーバーレイトンネル42
終端点となるノード間のオーバーレイトンネル42に対して、オーバーレイトンネル42を監視する方法(VXLAN(Virtual eXtensible Local Area Network)であればVXLAN OAM(Operation Administration and Maintenance)等)を用いて疎通性を監視する。
また、監視実行部303は、それぞれの監視対象における監視結果を収集する。監視実行部303は、後述する故障判定部304における監視結果の集約タイミングに先立って、各装置から監視対象の監視結果を収集する。なお、本実施形態では、監視結果の収集タイミングと集約タイミングは同時と擬制する。また、監視実行部303は、各装置から監視結果の送信を受けてもよい。
ここで、監視周期と集約周期の関係について説明する。
上述のように、監視実行部303は、所定の監視周期毎に監視実行指示を行っている。また、後述する故障判定部304は、所定の集約周期毎に監視結果の集約を行っている。
本実施形態では、監視結果の集約周期を、各監視対象における監視周期以上に設定する。これは、監視結果の集約を各監視対象の監視結果が少なくとも1回は更新された後に行うようにするためである。
図4は、監視周期と収集周期の関係を説明する図である。
図4の例では、監視結果の集約周期を1分毎、集約タイミングを毎分00秒としている。
また、監視周期および監視タイミングは、第1~第4の監視対象それぞれに対して個別に設定している。同一種類の監視対象については、同一のタイミングで監視を実行するものとする。
具体的には、第1の監視対象である物理インターフェース41の監視周期を1分毎、監視タイミングを毎分10秒、第2の監視対象であるリンク26の監視周期を1分毎、監視タイミングを毎分30秒、第3の監視対象であるSpineノード22の転送機能部23の監視周期を1分毎、監視タイミングを毎分20秒、第4の監視対象であるオーバーレイトンネル42の監視周期を1分毎、監視タイミングを毎分40秒としている。
すなわち、集約周期=第1~第4の監視対象の監視周期となっている。これにより、全ての監視対象の監視結果が更新されたタイミングで監視結果の集約を行うことができ、最新の監視結果を後述する故障判定に反映させ、ネットワーク監視装置30における監視精度を向上させることができる。
なお、図4の例では第1~第4の監視対象の監視周期を同一(1分)としているが、例えば図15に示すようにそれぞれの監視対象において監視周期を異ならせてもよい。
図2の説明に戻り、故障判定部304は、それぞれの監視対象における監視結果を集約し、故障が生じている監視対象の種別と発生事象に基づいて、当該故障の故障種別と通信ネットワーク20に対する当該故障の影響度とを判定する。
より詳細には、故障判定部304は、収集された監視結果に基づいて、1.原因故障箇所、2.故障種別、3.故障の影響度合いを判定する。
1.原因故障箇所
故障判定部304は、収集された監視結果およびネットワーク構成情報に基づいて、物理箇所が同一の監視結果を1つの通知に集約する。このとき、第2~第4の監視対象における監視結果を、発着点となる物理インターフェース41(第1の監視対象)にマッピングする。これにより、故障箇所の把握を容易にすると共に、関連する故障を1つの通知に集約することが可能となる。
例えばping等のアンダーレイ通信やオーバーレイ通信の故障は、端点となる物理インターフェース41間の故障として判定する。複数のレイヤで故障を検出している場合は、より下位レイヤに近い監視結果(第1の監視対象>第2の監視対象>第3の監視対象>第4の監視対象)を原因箇所として判定し、上位レイヤの結果を関連する警報として判定する。
2.故障種別
本実施形態では、故障の種別として「通常故障」、「異常故障」、「他要因故障」の3種類を定義し、各監視対象における故障検出状態から故障種別を判定する。
通常故障とは、物理インターフェース41の故障やリンク26の切断、装置故障等であり、装置での故障検出や切替が正常に行える故障である。
異常故障とは、サイレント故障等、装置での故障検出が正常に行えない故障である。
他要因故障とは、物理インターフェース41の故障によるping失敗等、他の監視対象における故障に起因して発生する故障である。
図5は、故障種別の判定例を示す表である。
例えば、図5の表の第1列(符号a参照)は、第1の監視対象である物理インターフェース41、第2の監視対象であるリンク26および第3の監視対象であるSpineノード22の転送機能部23で故障が検知された場合を示す。この場合、故障判定部304は、物理インターフェース41の故障は通常故障、リンク26および転送機能部23の故障は下位の監視対象における故障に起因する他要因故障と判定する。
また、図5の表の第2列~第4列(符号b参照)は、第2の監視対象であるリンク26、第3の監視対象であるSpineノード22の転送機能部23および第4の監視対象であるオーバーレイトンネル42において、それぞれ単独に(下位の監視対象では故障が検知されることなく)故障が検知された場合を示す。この場合、故障検出が正常に行えていない可能性があるため、故障判定部304は、各監視対象の故障を異常故障と判定する。
3.影響度合い
本実施形態では、故障の影響度合いとして「影響度低状態(瞬断)」、「影響度高状態(全断)」、「要確認状態(異常状態)」の3種類を規定する。
影響度低状態とは、冗長性がある区間で故障が発生し、通信経路の切り替えが可能な状態である。影響度低状態では、通信への影響は生じておらず、即時対応が不要と判定される。
影響度高状態とは、冗長性がない区間で故障が発生して通信経路の切り替えが行えない、または故障により冗長性が全てなくなる(装置が孤立する)状態である。影響度高状態では、通信への影響が生じており、即時対応が必要と判断される。
要確認状態とは、異常故障を検出し、通信に影響が生じる可能性がある状態である。要確認状態では、通信に影響が出ている可能性があるため、即時対応が必要と判断される。
図6は、故障の影響度合いの判定例を示す表である。
冗長性がある区間(冗長区間)で通常故障が生じている場合には、影響度低と判定される。また、冗長性がない区間(非冗長区間)で通常故障が生じている場合には、影響度高と判定される。
また、異常故障が生じている場合には、故障個所が冗長区間または非冗長区間のいずれの場合であっても要確認状態と判定される。
<故障判定の具体例>
図7は、第1の故障状態例を説明する図である。
第1の故障状態例は、冗長区間で物理インターフェース41の故障が生じた場合を示す。
図7下段には、Leafノード24A、Spineノード22A、Leafノード24Bの接続構成を図示している。Leafノード24Aは、Spineノード22Aと対向する物理インターフェース41A(IF-A)および物理インターフェース41C(IF-C)を有する。Spineノード22Aは、Leafノード24Aと対向する物理インターフェース41B(IF-B)および物理インターフェース41D(IF-D)を有するとともに、Leafノード24Bと対向する物理インターフェース41E(IF-E)を有する。Leafノード24Bは、Spineノード22Aと対向する物理インターフェース41F(IF-F)を有する。
Leafノード24AとSpineノード22Aとの間は、物理インターフェース41Aと物理インターフェース41Bとの間を接続するリンク26Aと、物理インターフェース41Cと物理インターフェース41Dとの間を接続するリンク26Bにより接続されている冗長区間である。
Spineノード22AとLeafノード24Bとの間は、物理インターフェース41Eと物理インターフェース41Fとの間を接続するリンク26Cのみで接続されている非冗長区間である。
ここで、冗長区間にある物理インターフェース41Aで故障が発生し、物理インターフェース41Aに対向する物理インターフェース41Bでも故障が検出されるとともに、これら物理インターフェース41A,41B発着のping(第2の監視対象であるリンク26Aの監視方法)およびtraceroute(第3の監視対象であるSpineノード22Aの転送機能部23の監視方法。図中符号44)で故障(疎通失敗)が検出されたものとする。なお、第4の監視対象であるオーバーレイトンネル42(Leafノード24A-Leafノード24B間)の監視方法であるVXLAN OAMは疎通成功しているものとする。
このような場合、監視結果の集約結果は次のようになる(図7の符号c参照)。
故障箇所は、物理インターフェース41A,41Bに集約される。故障種別は、対向する物理インターフェース41A,41Bで故障が検出され、かつその上位レイヤで実行されるpingおよびtracerouteが失敗していることから、物理インターフェース41A,41B(第1の監視対象)で通常故障が生じ、リンク26A(第2の監視対象)およびSpineノード22Aの転送機能部23(第3の監視対象)ではそれに伴って発生する他要因故障が生じていると判定される。
故障の影響度合いは、冗長区間かつ通常故障のため、故障検出により通信経路の切替が行われることから影響度低と判定される。
図8は、第2の故障状態例を説明する図である。
第2の故障状態例は、冗長区間の対向する物理インターフェース41の片方で故障が検出された場合を示す。
図8に示す接続構成は図7と同様である。
ここで、冗長区間にある物理インターフェース41Aで故障が発生し、それ以外では故障の検出がないものとする。
このような場合、監視結果の集約結果は次のようになる(図8の符号d参照)。
故障箇所は、物理インターフェース41Aとなる。故障種別は、対向する物理インターフェース41A,41Bのうち、物理インターフェース41Aのみで故障が検出され、それ以外では故障の検出がない(例えば物理インターフェース41Aが接続するリンク26Aにおけるpingも成功と判定されている)ことから、物理インターフェース41Aで正常な故障検出が行えない異常故障が発生していると判定される。
故障の影響度合いは、冗長区間の故障ではあるが、異常故障であり故障検出による通信経路の切替が正常に行えるか特定できないため、要確認と判定される。
図9は、第3の故障状態例を説明する図である。
第3の故障状態例は、非冗長区間において物理インターフェース41は正常であるもののpingが失敗する場合を示す。
図9に示す接続構成は図7と同様である。
ここで、非冗長区間にある物理インターフェース41E,41Fについて、物理インターフェース41E,41F自体には故障の検出がないが、物理インターフェース41E,41Fを接続するリンク26Cにおけるpingが失敗するものとする。
このような場合、監視結果の集約結果は次のようになる(図9の符号e参照)。
故障箇所は、物理インターフェース41E,41Fに集約される。故障種別は、物理インターフェース41E,41Fが正常であるにも関わらずpingが失敗することから、正常な通信が行えない異常故障が発生していると判定される。
故障の影響度合いは、非冗長区間における異常故障のため、要確認と判定される。
<故障判定の詳細>
より詳細に各監視対象の監視結果に基づく故障判定の詳細について説明する。
第1の監視対象である物理インターフェース41を除く第2~第4の監視対象において、疎通失敗事象が発生した場合、故障判定部304は、他の監視対象の監視結果を参照して失敗の原因がどこに存在するのかを特定した上で最終的に故障原因として特定するイベントを決定する。
図10は、各監視対象における監視結果の参照関係を示す表である。
Leafノード24Cを発側Leafノード、Leafノード24Dを着側Leafノードとし、これらLeafノード24C,24DはSpineノード22Bを介して接続されている。発側Leafノード24Cの物理インターフェース41GとSpineノード22Bの物理インターフェース41Hとを第1の物理インターフェースペアとし、第1の物理インターフェースペア間をつなぐリンクを第1のリンク26Dとする。また、着側Leafノード24Dの物理インターフェース41JとSpineノード22Bの物理インターフェース41Iとを第2の物理インターフェースペアとし、第2の物理インターフェースペア間をつなぐリンクを第2のリンク26Eとする。
図10の表には、左から順に発生イベント(イベント種別、イベント状態、検出位置)、参照先イベント(物理インターフェースペアの状態=第1の監視対象の監視結果、ping疎通状態=第2の監視対象の監視結果、traceroute疎通状態=第3の監視対象の監視結果)を示している。
図10のNo.1は、ping疎通の失敗が第1のリンク26Dで生じた場合、すなわち第2の監視対象であるリンク26に故障が検出された場合を示す。
この場合、故障判定部304は、第1の物理インターフェースペアの状態を参照して故障原因となるイベントを決定する。
より詳細には、pingは個々の物理インターフェースペア毎に実行されるため、故障判定部304は、ping疎通の失敗が生じた発側Leafノード24C側の物理インターフェースペア(第1の物理インターフェースペア)の状態のみを参照して失敗の原因を特定する。
図10のNo.2は、traceroute疎通の失敗が発側Leafノード24C-着側Leafノード24D間で生じた場合、すなわち第3の監視対象であるSpineノード22の転送機能部23に故障が検出された場合を示す。
この場合、故障判定部304は、第1の物理インターフェースペアの状態、第2の物理インターフェースペアの状態、第1のリンク26Dにおけるpingの疎通状態、第2のリンク26Eにおけるpingの疎通状態を参照して故障原因となるイベントを決定する。
より詳細には、tracerouteは、発側Leafノード24C-Spineノード22B間およびSpineノード22B-着側Leafノード24D間の2つの物理インターフェースペアを通過することから、故障判定部304は、各物理インターフェースペアの状態および各物理インターフェースペア間のリンク26におけるping疎通状態を参照して失敗の原因を特定する。
図10のNo.3は、VXLAN OAM疎通の失敗が発側Leafノード24C-着側Leafノード24D間で生じた場合、すなわち第4の監視対象であるオーバーレイトンネル42に故障が検出された場合を示す。なお、発側Leafノード24C-着側Leafノード24D間におけるVNIの設定は任意である。
この場合、故障判定部304は、第2の物理インターフェースペアの状態、第2のリンク26Eにおけるpingの疎通状態、および発側Leafノード24C-着側Leafノード24D間(VXLAN OAMと同経路)におけるtraceroute疎通状態を参照して故障原因となるイベントを決定する。
より詳細には、VXLAN OAMは、tracerouteと同様に、発側Leafノード24C-Spineノード22B-着側Leafノード24D間を通過するが、VXLAN OAMコマンドでは、送信されたデータがSpineノード22Bまで到着しないケースが存在する。データがSpineノード22Bまで到着しないケースは、経由するSpineノード22が特定できないため、集約対象外イベントとなる。データがSpineノード22Bまで到着するケースでは、発側Leafノード24C-Spineノード22B間の通信は正常と考えられることから、残りのSpineノード22B-着側Leafノード24D間の状態(第2の物理インターフェースペアの状態および第2のリンク26Eにおけるpingの疎通状態)および発側Leafノード24C-着側Leafノード24D間のtraceroute疎通状態を参照して、失敗の原因を特定する。
すなわち、故障判定部304は、リンク26(第2の監視対象)に故障が検出された場合、当該リンク26の両端に接続された物理インターフェースのペアの監視結果を参照して故障種別を判定し、Spineノード22の転送機能部23(第3の監視対象)に故障が検出された場合、当該Spineノード22に接続された2つのLeafノード24と当該Spineノード22との間の各リンク26の監視結果と、各リンク26の両端に接続された物理インターフェース41のペアの監視結果と、を参照して故障種別を判定し、オーバーレイトンネル42(第4の監視対象)に故障が検出された場合、発側のLeafノード24と着側のLeafノード24とを接続するSpineノード22の転送機能部23の監視結果と、着側のLeafノード24と当該Spineノード22との間のリンク26の監視結果と、当該リンク26の両端に接続された物理インターフェース41のペアの監視結果と、を参照して故障種別を判定する。
上記図10のNo.1~No.3について、より詳細に説明する。
図11は、ping疎通の失敗時における故障原因イベントの判定方法を示す表である。
図11の表には、左から順に参照先イベント(第1の物理インターフェースペアの状態)、発生イベント(集約時検出イベントおよび故障原因と判定するイベント(イベント名))、故障種別を示している。
上述のように、ping疎通の失敗が発生した場合(図10のNo.1の場合)、故障判定部304は、第1の物理インターフェースペアの状態を参照して故障原因となるイベントを決定する。
図11のNo.1のように、第1の物理インターフェースペアを構成する2つの物理インターフェース(物理インターフェース41Gと物理インターフェース41H)の状態がいずれもup(正常)であるが、ping疎通が失敗する場合、第1の物理インターフェースペアを構成する2つの物理インターフェースで共に物理故障が検出されていないにも関わらずping疎通が失敗しているため、サイレント故障が発生していると考えられる。
よって、故障判定部304は、サイレント故障によるping疎通の失敗が故障原因イベントであると判定し、故障種別を異常故障と判定する。
図11のNo.2のように、第1の物理インターフェースペアを構成する2つの物理インターフェースの状態がいずれもdown(故障発生)の場合、第1の物理インターフェースペア間に物理的な故障が発生しているためにping疎通が失敗していると考えられる。
よって、故障判定部304は、物理インターフェース41の故障によるping疎通の失敗が故障原因イベントであると判定し、故障種別を他要因故障と判定する。
なお、この状態は、図7を用いて説明した第1の故障状態例に対応する。
図11のNo.3のように、第1の物理インターフェースペアを構成する2つの物理インターフェースのうち一方で故障が発生し、他方が正常である場合、すなわちペアとなる物理インターフェース間で監視結果の差分が生じている場合(以下「IF差分」という)、第1の物理インターフェースペア間に物理的な故障が発生しているためping疎通が失敗していると考えられる。
よって、故障判定部304は、物理インターフェース41の故障によるping疎通の失敗が故障原因イベントであると判定し、故障種別を他要因故障と判定する。
図11のNo.4のように、第1の物理インターフェースペアの状態が不明の場合、第1の物理インターフェースペアの状態の情報が得られないため、ping疎通の失敗の原因は不明となる。
よって、故障判定部304は、ping疎通の失敗が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図11のNo.5のように、第1の物理インターフェースペアの監視がオフになっている場合、第1の物理インターフェースペアの状態の情報が得られないため、ping疎通の失敗の原因は不明となる。
よって、故障判定部304は、ping疎通の失敗が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図12は、traceroute疎通の失敗時における故障原因イベントの判定方法を示す表である。
図12の表には、左から順に参照先イベント(第1の物理インターフェースペアの状態、第1の物理インターフェースペア間のリンク26Dにおけるping疎通状態、第2の物理インターフェースペアの状態、第2の物理インターフェースペア間のリンク26Eにおけるping疎通状態)、発生イベント(集約時検出イベントおよび故障原因と判定するイベント(イベント名))、故障種別を示している。
なお、以降の図において表中における「ANY」の表記は、この項目についてはどのような状態であるか問わないことを示す。
上述のように、traceroute疎通の失敗が発生した場合(図10のNo.2の場合)、故障判定部304は、第1の物理インターフェースペアおよび第2の物理インターフェースペアの状態、および第1のリンク26Dおよび第2のリンク26Eにおけるpingの疎通状態を参照して故障原因となるイベントを決定する。
図12のNo.1のように、第1の物理インターフェースペアおよび第2の物理インターフェースペアの状態がいずれもup(正常)であり、第1のリンク26Dおよび第2のリンク26Eでのping疎通がいずれも成功しているが、traceroute疎通が失敗する場合、発側・着側両方の物理インターフェースペアの状態およびping疎通が共に問題ないため、Spineノード22の転送機能部23がtraceroute疎通失敗の原因と考えられる。
よって、故障判定部304は、Spineノード22の転送機能部23の故障(トランジット異常)によるtraceroute疎通の失敗が故障原因イベントであると判定し、故障種別を異常故障と判定する。
図12のNo.2のように、第1の物理インターフェースペアおよび第2の物理インターフェースペアの状態がいずれもup(正常)であり、第1のリンク26Dでのping疎通は成功しているが、第2のリンク26Eでのping疎通が失敗している場合、着側である第2の物理インターフェースペアに発生しているサイレント故障がtraceroute疎通失敗の原因と考えられる。
よって、故障判定部304は、サイレント故障によるtraceroute疎通の失敗が故障原因イベントであると判定し、故障種別を他要因故障と判定する。
図12のNo.3のように、第1の物理インターフェースペアの状態がいずれもup(正常)であり、第1のリンク26Dでのping疎通は成功しているが、第2の物理インターフェースペアの状態がdown(故障発生)またはIF差分が発生している場合、着側である第2の物理インターフェースペアの物理的な故障がtraceroute疎通失敗の原因と考えられる。
よって、故障判定部304は、物理インターフェースの故障によるtraceroute疎通の失敗が故障原因イベントであると判定し、故障種別を他要因故障と判定する。
図12のNo.4のように、第1の物理インターフェースペアの状態がいずれもup(正常)であり、第1のリンク26Dでのping疎通は成功しているが、第2の物理インターフェースペアの状態が不明の場合、第2の物理インターフェースペアの状態の情報が得られないため、traceroute疎通失敗の原因は不明となる。
よって、故障判定部304は、traceroute疎通の失敗が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図12のNo.5のように、第1の物理インターフェースペアおよび第2の物理インターフェースペアの状態がいずれもup(正常)であり、第1のリンク26Dでのping疎通は成功しているが、第2のリンク26Eでのping疎通状態が不明な場合、第2のリンク26Eでのping疎通状態の情報が得られないため、traceroute疎通失敗の原因は不明となる。
よって、故障判定部304は、traceroute疎通の失敗が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図12のNo.6のように、第1の物理インターフェースペアの状態がup(正常)であるが、第1のリンク26D1のping疎通が失敗する場合、発側である第1の物理インターフェースペアにおけるサイレント故障がtraceroute疎通失敗の原因と考えられる。
よって、故障判定部304は、サイレント故障によるtraceroute疎通の失敗が故障原因イベントであると判定し、故障種別を他要因故障と判定する。
図12のNo.7のように、第1の物理インターフェースペアの状態がdown(故障発生)またはIF差分が発生し、第1のリンク26Dでのping疎通が失敗する場合、発側である第1の物理インターフェースペアの物理的な故障がtraceroute疎通失敗の原因と考えられる。
よって、故障判定部304は、物理インターフェースの故障によるtraceroute疎通の失敗が故障原因イベントであると判定し、故障種別を他要因故障と判定する。
図12のNo.8のように、第1の物理インターフェースペアの状態がup(正常)であるが、第1のリンク26Dでのping疎通状態が不明な場合、第1のリンク26Dでのping疎通状態の情報が得られないため、traceroute疎通失敗の原因は不明となる。
よって、故障判定部304は、traceroute疎通の失敗が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図12のNo.9のように、第1の物理インターフェースペアの状態が不明の場合、物理インターフェースペアの状態の情報が得られないため、traceroute疎通失敗の原因は不明となる。
よって、故障判定部304は、traceroute疎通の失敗が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図12のNo.10のように、第1の物理インターフェースペアおよび第2の物理インターフェースペアにおけるping疎通状態の監視がオフになっている場合、ping疎通状態の情報が得られないため、traceroute疎通失敗の原因は不明となる。
よって、故障判定部304は、traceroute疎通の失敗が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図12のNo.11のように、第1の物理インターフェースペアの状態および第2の物理インターフェースペアの状態の監視がオフになっている場合、物理インターフェースペアの状態の情報が得られないため、traceroute疎通失敗の原因は不明となる。
よって、故障判定部304は、traceroute疎通の失敗が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図13は、VXLAN OAM疎通の失敗時における故障原因イベントの判定方法を示す表である。
図13の表には、左から順に参照先イベント(着側である第2の物理インターフェースペアの状態、第2のリンク26Eにおけるping疎通状態、traceroute疎通状態)、発生イベント(集約時検出イベントおよび故障原因と判定するイベント(イベント名))、故障種別を示している。
なお、以降の図において表中の「スキップ」は、監視自体を行わない状態を示す。例えば物理インターフェース41がdоwn状態の場合、当該物理インターフェース41を対象としたpingやtracerouteは実行できないケースがあり、このようなケースで監視自体を行わない状態を「スキップ」として定義している。
上述のように、VXLAN OAM疎通の失敗が発生した場合(図10のNo.3の場合)、故障判定部304は、第2の物理インターフェースペアの状態、第2のリンク26Eにおけるpingの疎通状態および発側Leafノード24C-着側Leafノード24D間におけるtraceroute疎通状態を参照して故障原因となるイベントを決定する。
図13のNo.1のように、第2の物理インターフェースペアの状態がup(正常)であり、第2のリンク26Eでのping疎通が成功またはスキップであり、traceroute疎通も成功しているが、VXLAN OAM疎通が失敗する場合は、発側Leafノード24Cから着側Leafノード24Dまでアンダーレイ上の問題が発生しなかったケースである。よって、VXLAN疎通の失敗は、オーバーレイ(VXLAN)の未構成が原因と考えられる。
よって、故障判定部304は、宛先Leafノード上におけるVXLAN未構成によるVXLAN疎通の失敗(NG)が故障原因イベントであると判定し、故障種別を異常故障と判定する。
図13のNo.2のように、第2の物理インターフェースペアの状態がup(正常)であり、第2のリンク26Eでのping疎通が成功またはスキップであり、traceroute疎通が失敗している場合、発側着側両方の物理インターフェースペアおよびping疎通は共に問題がない。よって、VXLAN疎通の失敗は、Spineノード22の転送機能部23(トランジット)が原因と考えられる。
よって、故障判定部304は、Spineノード22B内のトランジット異常によるVXLAN疎通の失敗(NG)が故障原因イベントであると判定し、故障種別を他要因故障と判定する。
図13のNo.3のように、第2の物理インターフェースペアの状態がup(正常)であり、第2のリンク26Eでのping疎通が成功またはスキップであり、traceroute疎通状態が不明の場合、traceroute疎通状態の情報が得られないため、VXLAN疎通失敗の原因は不明である。
よって、故障判定部304は、VXLAN疎通の失敗(NG)が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図13のNo.4のように、第2の物理インターフェースペアの状態がup(正常)であるが、第2のリンク26Eでのping疎通が失敗する場合、VXLAN疎通の失敗は、着側である第2の物理インターフェースペアに発生しているサイレント故障が原因であると考えられる。
よって、故障判定部304は、サイレント故障によるVXLAN疎通の失敗(NG)が故障原因イベントであると判定し、故障種別を他要因故障と判定する。
図13のNo.5のように、第2の物理インターフェースペアの状態がdown(故障)またはIF差分である場合、VXLAN疎通の失敗は、着側である第2の物理インターフェースペアの物理的な故障が原因であると考えられる。
よって、故障判定部304は、物理インターフェース41の故障によるVXLAN疎通の失敗(NG)が故障原因イベントであると判定し、故障種別を他要因故障と判定する。
図13のNo.6のように、第2の物理インターフェースペアの状態がup(正常)であるが、第2のリンク26Eでのping疎通状態が不明な場合、第2のリンク26Eでのping疎通状態の情報が得られないため、VXLAN疎通失敗の原因は不明である。
よって、故障判定部304は、VXLAN疎通の失敗(NG)が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図13のNo.7のように、第2の物理インターフェースペアの状態が不明な場合、物理インターフェースペアの状態が得られないため、VXLAN疎通失敗の原因は不明である。
よって、故障判定部304は、VXLAN疎通の失敗(NG)が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図13のNo.8のように、発側Leafノード24Cと着側Leafノード24Dとの間のtraceroute疎通状態の監視がオフとなっている場合、traceroute疎通状態の情報が得られないため、VXLAN疎通失敗の原因は不明である。
この場合、故障判定部304は、VXLAN疎通の失敗(NG)が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図13のNo.9のように、第2のリンク26Eでのping疎通状態の監視がオフとなっている場合、第2のリンク26Eでのping疎通状態の情報が得られないため、VXLAN疎通失敗の原因は不明である。
この場合、故障判定部304は、VXLAN疎通の失敗(NG)が故障原因イベントであると判定し、故障種別を特定不可と判定する。
図13のNo.10のように、第2の物理インターフェースペアの状態の監視がオフとなっている場合、第2の物理インターフェースペアの状態の情報が得られないため、VXLAN疎通失敗の原因は不明である。
この場合、故障判定部304は、VXLAN疎通の失敗(NG)が故障原因イベントであると判定し、故障種別を特定不可と判定する。
<監視結果の不整合発生時の対応>
次に、各監視対象における監視結果の不整合が発生する場合について説明する。
同一通信経路上の第1~第4の監視対象の監視結果について検討すると、基本的には、下位のレイヤ(下位レイヤから順に、第1の監視対象、第2の監視対象、第3の監視対象、第4の監視対象となる)で異常が発生している場合には、上位レイヤの監視結果も「失敗」となることが想定される。しかし、監視処理の実行開始や完了のタイミングのズレなどによっては、下位側が失敗の監視結果となっているにも関わらず、上位側の監視結果が成功するケースが存在し得ると考えられる。
図14は、監視結果の不整合発生状態の例を示す表である。
図14の表には、左から順に監視時検知イベントとして、第1の物理インターフェースペアの状態、第1のリンク26Dにおけるping疎通状態、第2の物理インターフェースペアの状態、第2のリンク26Eにおけるping疎通状態、traceroute疎通状態、VXLAN OAM疎通状態を示している。
図14のNo.1~3は、第1の物理インターフェースペアの状態がdown(故障)またはIF差分状態であるが、第1のリンク26Dにおけるping疎通(No.1)、traceroute疎通(No.2)、VXLAN OAM疎通(No.3)の少なくともいずれかが成功している場合を示す。
すなわち、発側である第1の物理インターフェースペアがdownしているが、上位レイヤの監視結果(ping/traceroute/VXLAN OAM)が成功しているケースである。
図14のNo.4~6は、第2の物理インターフェースペアの状態がdown(故障)またはIF差分状態であるが、第2のリンク26Eにおけるping疎通(No.4)、traceroute疎通(No.5)、VXLAN OAM疎通(No.6)の少なくともいずれかが成功している場合を示す。
すなわち、着側である第2の物理インターフェースペアがdownしているが、上位レイヤの監視結果(ping/traceroute/VXLAN OAM)が成功しているケースである。
図14のNo.7~8は、第1の物理インターフェースペアの状態がup(正常)である一方、第1のリンク26Dにおけるping疎通が失敗し、かつtraceroute疎通(No.7)またはVXLAN OAM疎通(No.8)の少なくともいずれかが成功している場合を示す。
すなわち、発側である第1の物理インターフェースペアでのping疎通が失敗しているが、上位レイヤの監視結果(traceroute/VXLAN OAM)が成功しているケースである。
図14のNo.9~10は、第2の物理インターフェースペアの状態がup(正常)である一方、第2のリンク26Eにおけるping疎通が失敗し、かつtraceroute疎通(No.9)またはVXLAN OAM疎通(No.10)の少なくともいずれかが成功している場合を示す。
すなわち、着側である第2の物理インターフェースペアでのping疎通が失敗しているが、上位レイヤの監視結果(traceroute/VXLAN OAM)が成功しているケースである。
図14のNo.11は、traceroute疎通は失敗しているが、VXLAN OAM疎通は成功している場合を示す。
すなわち、同一経路においてtraceroute疎通は失敗しているが、上位レイヤの監視結果(VXLAN OAM)は成功しているケースである。
図14のNo.12は、第1の物理インターフェースペアの状態はup(正常)であるが、第1のリンク26Dにおけるping疎通確認はスキップされている場合を示す。
図14のNo.13は、第2の物理インターフェースペアの状態はup(正常)であるが、第2のリンク26Eにおけるping疎通確認はスキップされている場合を示す。
図14のNo.14は、第1の物理インターフェースペアの状態はup(正常)であるが、traceroute疎通確認はスキップされている場合を示す。
すなわち、図14のNo.12~14は、物理インターフェース状態がup(正常)であるにも関わらず、上位レイヤの監視処理(ping/traceroute)がスキップされているケースである。
図14に示すような監視結果の不整合が生じた場合、故障判定部304は、図15に示すように複数の集約周期における集約結果から故障原因イベントを判定する。
図15は、複数の集約結果に基づく故障判定方法を示す図である。
図15の各記号の意味は、図4の凡例に示したものと同じである。説明の簡略化のため、図15では第3の監視対象および第4の監視対象については記載を省略している。
第1~第4の監視対象に対する監視は、それぞれの監視対象に設定された監視周期毎に行われるため故障発生と故障検出にタイムラグが発生する。例えば、監視対象に対して1分周期で監視行う場合、監視直後に故障が発生すると、故障の検出まで最長1分程度かかる。
また、監視結果の集約は、集約タイミング直前の監視結果を用いて行われるため、1回の監視間隔では正確な判定が行えない可能性がある。
すなわち、各監視対象において故障検出ができていない状態で通知された監視結果を集約することで、異常故障に誤判定される可能性ある。
このため、故障判定部304は、故障判定を1回の集約結果のみで確定せずに、複数周期の集約結果を用いて確定する。これにより、監視周期と集約周期の差分による誤判定を防止することができる。
また、一度故障が検出されたが継続せずに次周期で回復していた場合には、間欠的な故障と判断し、通知結果では故障無しとして扱う。なお、故障検出の継続期間が何周期以内を間欠故障とするかは、個別に設定する。
例えば図15の例では、監視結果の収集周期を1分毎、集約タイミングを毎分00秒とし、第1の監視対象である物理インターフェース41の監視周期を20分毎、監視タイミングを毎分10秒、30秒、50秒とし、第2の監視対象であるLeaf-Spine間のリンク26の監視周期を1分毎、監視タイミングを毎分30秒としている。1回目の集約周期(1分00秒)までの間に、第1の監視対象は3つ、第2の監視対象は1つの監視結果が得られる。
ここで、第1の監視対象の2回目の監視および第2の監視対象の1回目の監視を実行直後(0分30秒過ぎ)に、第1の監視対象で故障が発生した場合について考える。この場合、第2の監視対象についても、下位の第1の監視対象の故障に伴う故障が発生する。
第1の監視対象では、集約タイミングまでの間に更に1回監視が行われ、故障の発生を監視結果に反映することができる。一方、第2の監視対象では、集約タイミングまでの間に新たな監視は行われないので、故障の発生を監視結果に反映することができない。
この場合、故障判定部304は、第1の監視対象は故障、第2の監視対象は正常という監視結果を得ることになり、このタイミング(1回目の集約周期)での集約結果では異常故障が生じていると判定することになる(図15の符号f参照)。
一方、2回目の集約周期では、第1の監視対象の監視結果は継続して故障となるとともに、第2の監視対象においても故障の発生を監視結果に反映することができる。
この場合、故障判定部304は、第1の監視対象および第2の監視対象が共に故障という監視結果を得ることになり、通常故障が生じていると判定することになる(図15の符号g参照)。
このように、故障判定部304において、複数回の監視結果の集約結果に基づいて故障種別と故障の影響度とを判定するようにすれば、監視結果が安定した状態で故障判定を行うことができ、故障判定の精度を向上させることができる。
<フローチャート>
図16は、ネットワーク監視装置30によるネットワーク監視処理の手順を示すフローチャートである。
まず、ネットワーク監視装置30は、ネットワーク構成管理部300により通信ネットワーク20のネットワーク構成情報を生成する(ステップS500)。生成されたネットワーク構成情報は、記憶部301に記録される。
次に、ネットワーク監視装置30は、監視対象設定部302により通信ネットワーク20内の監視対象(第1~第4の監視対象)を設定する(ステップS501)。この時、監視対象設定部302は、各監視対象の監視周期や監視タイミングも併せて設定する。
続いて、各監視対象に設定された監視タイミングになったか否かを判定し(ステップS502)、監視タイミングになると(ステップS502:Yes)、監視実行部303からの監視実行指示に基づいて各装置において監視対象の監視が実行される(ステップS503)。一方、監視タイミングになっていなければ(ステップS502:No)、監視タイミングになるまで待つ。
次に、監視結果の集約タイミングになったか否かを判定し(ステップS504)、集約タイミングになるまでは(ステップS504:Noのループ)、ステップS502に戻り、各監視対象における監視が継続される。監視結果の集約タイミングにとなると(ステップS504:Yes)、監視実行部303は各監視対象における監視結果を収集する(ステップS505)。故障判定部304は、監視結果を集約し(ステップS506)、故障の発生箇所、故障種別、故障の影響度を判定し(ステップS507)、本フローチャートによる処理を終了する。
<ハードウェア構成>
本実施形態に係るネットワーク監視装置30は、例えば図17に示すような構成のコンピュータ900をネットワーク監視装置30として機能させることによって実現される。
図17は、本実施形態に係るネットワーク監視装置30の機能を実現するコンピュータ900の一例を示すハードウェア構成図である。コンピュータ900は、CPU(Central Processing Unit)901、ROM(Read Only Memory)902、RAM903、HDD(Hard Disk Drive)904、入出力I/F(Interface)905、通信I/F906およびメディアI/F907を有する。
CPU901は、ROM902またはHDD904に記憶されたプログラムに基づき作動し、図2に示す各機能的構成部に対応する処理を行う。ROM902は、コンピュータ900の起動時にCPU901により実行されるブートプログラムや、コンピュータ900のハードウェアに係るプログラム等を記憶する。
CPU901は、入出力I/F905を介して、マウスやキーボード等の入力装置910、および、ディスプレイやプリンタ等の出力装置911を制御する。CPU901は、入出力I/F905を介して、入力装置910からデータを取得するともに、生成したデータを出力装置911へ出力する。なお、プロセッサとしてCPU901とともに、GPU(Graphics Processing Unit)等を用いても良い。
HDD904は、CPU901により実行されるプログラムおよび当該プログラムによって使用されるデータ等を記憶する。通信I/F906は、通信網(例えば、通信ネットワーク(NW:Network)20)を介して他の装置からデータを受信してCPU901へ出力し、また、CPU901が生成したデータを、通信網を介して他の装置へ送信する。
メディアI/F907は、記録媒体912に格納されたプログラムまたはデータを読み取り、RAM903を介してCPU901へ出力する。CPU901は、目的の処理に係るプログラムを、メディアI/F907を介して記録媒体912からRAM903上にロードし、ロードしたプログラムを実行する。記録媒体912は、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto Optical disk)等の光磁気記録媒体、磁気記録媒体、半導体メモリ等である。
例えば、コンピュータ900が本発明のネットワーク監視装置30として機能する場合、コンピュータ900のCPU901は、RAM903上にロードされたプログラムを実行することにより、ネットワーク監視装置30の機能を実現する。また、HDD904には、RAM903内のデータが記憶される。CPU901は、目的の処理に係るプログラムを記録媒体912から読み取って実行する。この他、CPU901は、他の装置から通信網(NW920)を介して目的の処理に係るプログラムを読み込んでもよい。
<効果>
以下、本発明に係るネットワーク監視装置の効果について説明する。
本発明に係るネットワーク監視装置30は、複数のLeafノード24と、複数のSpineノード22と、Leafノード24とSpineノード22との間を接続するリンク26とを備える通信ネットワーク20を監視するネットワーク監視装置30であって、通信ネットワーク20のネットワーク構成情報を生成するネットワーク構成管理部300と、ネットワーク構成情報に基づいて、通信ネットワーク20内の複数種類の監視対象を設定する監視対象設定部302と、それぞれの監視対象に対する監視実行指示を行い、監視結果を収集する監視実行部303と、それぞれの監視対象における監視結果を集約し、故障が生じている監視対象の種別と発生事象に基づいて、当該故障の故障種別と通信に対する当該故障の影響度とを判定する故障判定部304と、を備え、監視対象設定部302は、Leafノード24およびSpineノード22が備える物理インターフェース41と、Leafノード24とSpineノードとを接続するリンク26と、Spineノード22が備える転送機能部23と、発側Leafノード24と着側Leafノード24との間に設定されたオーバーレイトンネル42と、を監視対象に設定する、ことを特徴とする。
このように、本発明に係るネットワーク監視装置30は、ネットワーク構成情報を用いて複数装置および複数レイヤにおける監視結果を組み合わせて故障判定を行う。
これにより、Leafノード24とSpineノード22とで構成されるファブリックネットワークにおいても、シャーシ型装置と同等の正常性監視および故障時の影響判定を実現することができる。
また、本発明に係るネットワーク監視装置30は、故障判定部304は、リンク26に故障が検出された場合、当該リンク26の両端に接続された物理インターフェース41のペアの監視結果を参照して故障種別を判定し、Spineノード22の転送機能部23に故障が検出された場合、当該Spineノード22に接続された2つのLeafノード24と当該Spineノード22との間の各リンク26の監視結果と、各リンク26の両端に接続された物理インターフェース41のペアの監視結果とを参照して故障種別を判定し、オーバーレイトンネル42に故障が検出された場合、発側Leafノード24と着側Leafノード24とを接続するSpineノード22の転送機能部23の監視結果と、着側Leafノード24と当該Spineノード22との間のリンク26の監視結果と、当該リンク26の両端に接続された物理インターフェース41のペアの監視結果とを参照して故障種別を判定する、ことを特徴とする。
これにより、複数のレイヤにおける監視情報を組み合わせて故障判定を行い、装置単体での監視では検出できなかったサイレント故障等の異常状態の検出を可能とすることができる。
また、本発明に係るネットワーク監視装置30は、故障判定部304は、故障種別を、Leafノード24またはSpineノード22を構成する装置における故障の検出および通信経路の切り替えを正常に行うことができる通常故障と、Leafノード24またはSpineノード22を構成する装置における故障の検出を正常に行うことができない異常故障と、他の監視対象における故障に起因する故障である他要因故障とに分類し、故障の影響度を、冗長性がある区間での故障であり通信への影響が生じない影響度低状態と、冗長性がない区間での故障または故障により冗長性が失われ通信への影響が生じる影響度高状態と、異常故障が発生し通信への影響が生じる可能性がある要確認状態とに分類する、ことを特徴とする。
これにより、故障発生時の即時対応の要否判断を迅速に行うことができ、通信ネットワーク20を用いた通信サービスへの影響の最小化および保守に要する稼働の削減を図ることができる。
また、本発明に係るネットワーク監視装置30は、監視実行部303は、所定の監視周期毎に監視実行指示を行い、故障判定部304は、所定の集約周期毎に監視結果の集約を行っており、監視結果の集約周期は、監視周期以上に設定される、ことを特徴とする。
これにより、全ての監視対象の監視結果が更新されたタイミングで監視結果を集約することができ、各監視対象の状態をより正確に把握し、故障判定の精度を向上させることができる。
また、本発明に係るネットワーク監視装置30は、故障判定部304は、複数回の監視結果の集約結果に基づいて故障種別と故障の影響度とを判定する、ことを特徴とする。
これにより、監視の実行と故障の発生とのタイムラグに起因して通信ネットワーク20の状態を誤判定するのを防止し、故障判定の精度を向上させることができる。
20 通信ネットワーク
22(22A~22B) Spineノード
23 転送機能部
24(22A~22D) Leafノード
26(26A~26E) リンク
30 ネットワーク監視装置
300 ネットワーク構成管理部
301 記憶部
302 監視対象設定部
303 監視実行部
304 故障判定部
41(41A~41J) 物理インターフェース
42 オーバーレイトンネル

Claims (9)

  1. 複数のLeafノードと、複数のSpineノードと、前記Leafノードと前記Spineノードとの間を接続するリンクとを備える通信ネットワークを監視するネットワーク監視装置であって、
    前記通信ネットワークのネットワーク構成情報を生成するネットワーク構成管理部と、
    前記ネットワーク構成情報に基づいて、前記通信ネットワーク内の複数種類の監視対象を設定する監視対象設定部と、
    それぞれの前記監視対象に対する監視実行指示を行い、監視結果を収集する監視実行部と、
    それぞれの監視対象における前記監視結果を集約し、故障が生じている前記監視対象の種別と発生事象に基づいて、当該故障の故障種別と当該故障の影響度とを判定する故障判定部と、を備え、
    前記監視対象設定部は、
    前記Leafノードおよび前記Spineノードが備える物理インターフェースと、前記Leafノードと前記Spineノードとを接続する前記リンクと、前記Spineノードが備える転送機能部と、発側Leafノードと着側Leafノードとの間に設定されたオーバーレイトンネルと、を監視対象に設定し、
    前記故障判定部は、
    前記リンクに故障が検出された場合、当該リンクの両端に接続された物理インターフェースのペアの監視結果を参照して前記故障種別を判定し、
    前記Spineノードの前記転送機能部に故障が検出された場合、当該Spineノードに接続された2つのLeafノードと当該Spineノードとの間の各リンクの監視結果と、前記各リンクの両端に接続された物理インターフェースのペアの監視結果と、を参照して故障種別を判定し、
    前記オーバーレイトンネルに故障が検出された場合、前記発側Leafノードと前記着側Leafノードとを接続するSpineノードの転送機能部の監視結果と、前記着側Leafノードと当該Spineノードとの間のリンクの監視結果と、当該リンクの両端に接続された物理インターフェースのペアの監視結果と、を参照して故障種別を判定する、
    ことを特徴とするネットワーク監視装置。
  2. 複数のLeafノードと、複数のSpineノードと、前記Leafノードと前記Spineノードとの間を接続するリンクとを備える通信ネットワークを監視するネットワーク監視装置であって、
    前記通信ネットワークのネットワーク構成情報を生成するネットワーク構成管理部と、
    前記ネットワーク構成情報に基づいて、前記通信ネットワーク内の複数種類の監視対象を設定する監視対象設定部と、
    それぞれの前記監視対象に対する監視実行指示を行い、監視結果を収集する監視実行部と、
    それぞれの監視対象における前記監視結果を集約し、故障が生じている前記監視対象の種別と発生事象に基づいて、当該故障の故障種別と当該故障の影響度とを判定する故障判定部と、を備え、
    前記監視対象設定部は、
    前記Leafノードおよび前記Spineノードが備える物理インターフェースと、前記Leafノードと前記Spineノードとを接続する前記リンクと、前記Spineノードが備える転送機能部と、発側Leafノードと着側Leafノードとの間に設定されたオーバーレイトンネルと、を監視対象に設定し、
    前記故障判定部は、
    前記故障種別を、前記Leafノードまたは前記Spineノードを構成する装置における故障の検出および通信経路の切り替えを正常に行うことができる通常故障と、前記Leafノードまたは前記Spineノードを構成する装置における故障の検出を正常に行うことができない異常故障と、他の監視対象における故障に起因する故障である他要因故障とに分類し、
    前記故障の影響度を、冗長性がある区間での故障であり通信への影響が生じない影響度低状態と、前記冗長性がない区間での故障または故障により前記冗長性が失われ通信への影響が生じる影響度高状態と、前記異常故障が発生し通信への影響が生じる可能性がある要確認状態とに分類する、
    ことを特徴とするネットワーク監視装置。
  3. 前記監視実行部は、所定の監視周期毎に前記監視実行指示を行い、
    前記故障判定部は、所定の集約周期毎に前記監視結果の集約を行っており、
    前記監視結果の前記集約周期は、前記監視周期以上に設定される、
    ことを特徴とする請求項1または2に記載のネットワーク監視装置。
  4. 前記故障判定部は、複数回の前記監視結果の集約結果に基づいて前記故障種別と前記故障の影響度とを判定する、
    ことを特徴とする請求項1からのいずれか1項記載のネットワーク監視装置。
  5. 複数のLeafノードと、複数のSpineノードと、前記Leafノードと前記Spineノードとの間を接続するリンクとを備える通信ネットワークを監視するネットワーク監視装置であって、
    前記通信ネットワークのネットワーク構成情報を生成するネットワーク構成管理部と、
    前記ネットワーク構成情報に基づいて、前記通信ネットワーク内の複数種類の監視対象を設定する監視対象設定部と、
    それぞれの前記監視対象に対する監視実行指示を行い、監視結果を収集する監視実行部と、
    それぞれの監視対象における前記監視結果を集約し、故障が生じている前記監視対象の種別と発生事象に基づいて、当該故障の故障種別と当該故障の影響度とを判定する故障判定部と、を備え、
    前記監視対象設定部は、
    前記Leafノードおよび前記Spineノードが備える物理インターフェースと、前記Leafノードと前記Spineノードとを接続する前記リンクと、前記Spineノードが備える転送機能部と、発側Leafノードと着側Leafノードとの間に設定されたオーバーレイトンネルと、を監視対象に設定し、
    前記故障判定部は、
    前記監視結果を集約した結果において、前記監視対象の複数のレイヤで故障が検出されている場合は、より下位のレイヤの監視対象の監視結果を参照して故障種別を判定する、
    ことを特徴とするネットワーク監視装置。
  6. 複数のLeafノードと、複数のSpineノードと、前記Leafノードと前記Spineノードとの間を接続するリンクとを備える通信ネットワークを監視するネットワーク監視装置のネットワーク監視方法であって、
    前記ネットワーク監視装置は、
    前記通信ネットワークのネットワーク構成情報を生成するネットワーク構成管理ステップと、
    前記ネットワーク構成情報に基づいて、前記通信ネットワーク内の複数種類の監視対象を設定する監視対象設定ステップと、
    それぞれの前記監視対象に対する監視実行指示を行い、監視結果を収集する監視実行ステップと、
    それぞれの監視対象における前記監視結果を集約し、故障が生じている前記監視対象の種別と発生事象に基づいて、当該故障の故障種別と当該故障の影響度とを判定する故障判定ステップと、を実行し、
    前記監視対象設定ステップでは、
    前記Leafノードおよび前記Spineノードが備える物理インターフェースと、前記Leafノードと前記Spineノードとを接続するリンクと、前記Spineノードが備える転送機能部と、発側Leafノードと着側Leafノードとの間に設定されたオーバーレイトンネルと、を監視対象に設定し、
    前記故障判定ステップでは、
    前記リンクに故障が検出された場合、当該リンクの両端に接続された物理インターフェースのペアの監視結果を参照して前記故障種別を判定し、
    前記Spineノードの前記転送機能部に故障が検出された場合、当該Spineノードに接続された2つのLeafノードと当該Spineノードとの間の各リンクの監視結果と、前記各リンクの両端に接続された物理インターフェースのペアの監視結果と、を参照して故障種別を判定し、
    前記オーバーレイトンネルに故障が検出された場合、前記発側Leafノードと前記着側Leafノードとを接続するSpineノードの転送機能部の監視結果と、前記着側Leafノードと当該Spineノードとの間のリンクの監視結果と、当該リンクの両端に接続された物理インターフェースのペアの監視結果と、を参照して故障種別を判定する、
    ことを特徴とするネットワーク監視方法。
  7. 複数のLeafノードと、複数のSpineノードと、前記Leafノードと前記Spineノードとの間を接続するリンクとを備える通信ネットワークを監視するネットワーク監視装置のネットワーク監視方法であって、
    前記ネットワーク監視装置は、
    前記通信ネットワークのネットワーク構成情報を生成するネットワーク構成管理ステップと、
    前記ネットワーク構成情報に基づいて、前記通信ネットワーク内の複数種類の監視対象を設定する監視対象設定ステップと、
    それぞれの前記監視対象に対する監視実行指示を行い、監視結果を収集する監視実行ステップと、
    それぞれの監視対象における前記監視結果を集約し、故障が生じている前記監視対象の種別と発生事象に基づいて、当該故障の故障種別と当該故障の影響度とを判定する故障判定ステップと、を実行し、
    前記監視対象設定ステップでは、
    前記Leafノードおよび前記Spineノードが備える物理インターフェースと、前記Leafノードと前記Spineノードとを接続するリンクと、前記Spineノードが備える転送機能部と、発側Leafノードと着側Leafノードとの間に設定されたオーバーレイトンネルと、を監視対象に設定し、
    前記故障判定ステップでは、
    前記故障種別を、前記Leafノードまたは前記Spineノードを構成する装置における故障の検出および通信経路の切り替えを正常に行うことができる通常故障と、前記Leafノードまたは前記Spineノードを構成する装置における故障の検出を正常に行うことができない異常故障と、他の監視対象における故障に起因する故障である他要因故障とに分類し、
    前記故障の影響度を、冗長性がある区間での故障であり通信への影響が生じない影響度低状態と、前記冗長性がない区間での故障または故障により前記冗長性が失われ通信への影響が生じる影響度高状態と、前記異常故障が発生し通信への影響が生じる可能性がある要確認状態とに分類する、
    ことを特徴とするネットワーク監視方法。
  8. 複数のLeafノードと、複数のSpineノードと、前記Leafノードと前記Spineノードとの間を接続するリンクとを備える通信ネットワークを監視するネットワーク監視装置としてのコンピュータに、
    前記通信ネットワークのネットワーク構成情報を生成するネットワーク構成管理手順、
    前記ネットワーク構成情報に基づいて、前記通信ネットワーク内の複数種類の監視対象を設定する監視対象設定手順、
    それぞれの前記監視対象に対する監視実行指示を行い、監視結果を収集する監視実行手順、
    それぞれの監視対象における前記監視結果を集約し、故障が生じている前記監視対象の種別と発生事象に基づいて、当該故障の故障種別と当該故障の影響度とを判定する故障判定手順、を実行させ、
    前記監視対象設定手順では、
    前記Leafノードおよび前記Spineノードが備える物理インターフェースと、前記Leafノードと前記Spineノードとを接続するリンクと、前記Spineノードが備える転送機能部と、発側Leafノードと着側Leafノードとの間に設定されたオーバーレイトンネルと、を監視対象に設定し、
    前記故障判定手順では、
    前記リンクに故障が検出された場合、当該リンクの両端に接続された物理インターフェースのペアの監視結果を参照して前記故障種別を判定し、
    前記Spineノードの前記転送機能部に故障が検出された場合、当該Spineノードに接続された2つのLeafノードと当該Spineノードとの間の各リンクの監視結果と、前記各リンクの両端に接続された物理インターフェースのペアの監視結果と、を参照して故障種別を判定し、
    前記オーバーレイトンネルに故障が検出された場合、前記発側Leafノードと前記着側Leafノードとを接続するSpineノードの転送機能部の監視結果と、前記着側Leafノードと当該Spineノードとの間のリンクの監視結果と、当該リンクの両端に接続された物理インターフェースのペアの監視結果と、を参照して故障種別を判定する、
    ことを実行させるためのネットワーク監視プログラム。
  9. 複数のLeafノードと、複数のSpineノードと、前記Leafノードと前記Spineノードとの間を接続するリンクとを備える通信ネットワークを監視するネットワーク監視装置としてのコンピュータに、
    前記通信ネットワークのネットワーク構成情報を生成するネットワーク構成管理手順、
    前記ネットワーク構成情報に基づいて、前記通信ネットワーク内の複数種類の監視対象を設定する監視対象設定手順、
    それぞれの前記監視対象に対する監視実行指示を行い、監視結果を収集する監視実行手順、
    それぞれの監視対象における前記監視結果を集約し、故障が生じている前記監視対象の種別と発生事象に基づいて、当該故障の故障種別と当該故障の影響度とを判定する故障判定手順、を実行させ、
    前記監視対象設定手順では、
    前記Leafノードおよび前記Spineノードが備える物理インターフェースと、前記Leafノードと前記Spineノードとを接続するリンクと、前記Spineノードが備える転送機能部と、発側Leafノードと着側Leafノードとの間に設定されたオーバーレイトンネルと、を監視対象に設定し、
    前記故障判定手順では、
    前記故障種別を、前記Leafノードまたは前記Spineノードを構成する装置における故障の検出および通信経路の切り替えを正常に行うことができる通常故障と、前記Leafノードまたは前記Spineノードを構成する装置における故障の検出を正常に行うことができない異常故障と、他の監視対象における故障に起因する故障である他要因故障とに分類し、
    前記故障の影響度を、冗長性がある区間での故障であり通信への影響が生じない影響度低状態と、前記冗長性がない区間での故障または故障により前記冗長性が失われ通信への影響が生じる影響度高状態と、前記異常故障が発生し通信への影響が生じる可能性がある要確認状態とに分類する、
    ことを実行させるためのネットワーク監視プログラム。
JP2022534522A 2020-07-06 2020-07-06 ネットワーク監視装置、ネットワーク監視方法、および、ネットワーク監視プログラム Active JP7491381B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/026500 WO2022009294A1 (ja) 2020-07-06 2020-07-06 ネットワーク監視装置、ネットワーク監視方法、および、ネットワーク監視プログラム

Publications (2)

Publication Number Publication Date
JPWO2022009294A1 JPWO2022009294A1 (ja) 2022-01-13
JP7491381B2 true JP7491381B2 (ja) 2024-05-28

Family

ID=79552297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022534522A Active JP7491381B2 (ja) 2020-07-06 2020-07-06 ネットワーク監視装置、ネットワーク監視方法、および、ネットワーク監視プログラム

Country Status (3)

Country Link
US (1) US20230254227A1 (ja)
JP (1) JP7491381B2 (ja)
WO (1) WO2022009294A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024127639A1 (ja) * 2022-12-16 2024-06-20 日本電信電話株式会社 ネットワーク管理装置、ネットワーク管理方法及びネットワーク管理プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180013670A1 (en) 2015-05-27 2018-01-11 Cisco Technology, Inc. Operations, administration and management (oam) in overlay data center environments
US20180367392A1 (en) 2017-06-19 2018-12-20 Cisco Technology, Inc. Detection of overlapping subnets in a network
US20190207839A1 (en) 2017-12-29 2019-07-04 Arista Networks, Inc. System for network event detection and analysis

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9712381B1 (en) * 2014-07-31 2017-07-18 Google Inc. Systems and methods for targeted probing to pinpoint failures in large scale networks
US10536357B2 (en) * 2015-06-05 2020-01-14 Cisco Technology, Inc. Late data detection in data center
US10374956B1 (en) * 2015-09-25 2019-08-06 Amazon Technologies, Inc. Managing a hierarchical network
US10193706B2 (en) * 2015-10-21 2019-01-29 Arris Enterprises Llc Distributed rule provisioning in an extended bridge
US11016832B2 (en) * 2016-11-29 2021-05-25 Intel Corporation Cloud-based scale-up system composition
US11150950B2 (en) * 2016-12-01 2021-10-19 Vmware, Inc. Methods and apparatus to manage workload domains in virtual server racks
US11184271B2 (en) * 2017-04-06 2021-11-23 At&T Intellectual Property I, L.P. Network service assurance system
US20180351821A1 (en) * 2017-05-31 2018-12-06 Cisco Technology, Inc. Generating a network-wide logical model for network policy analysis
US10498608B2 (en) * 2017-06-16 2019-12-03 Cisco Technology, Inc. Topology explorer
US10623259B2 (en) * 2017-06-19 2020-04-14 Cisco Technology, Inc. Validation of layer 1 interface in a network
US11063857B2 (en) * 2018-05-25 2021-07-13 Microsoft Technology Licensing, Llc Monitoring connectivity and latency of a virtual network
US10158545B1 (en) * 2018-05-31 2018-12-18 Tempered Networks, Inc. Monitoring overlay networks
US11218508B2 (en) * 2018-06-27 2022-01-04 Cisco Technology, Inc. Assurance of security rules in a network
US11012320B2 (en) * 2019-02-26 2021-05-18 OasisWorks Inc. Interactive graphical model-based monitoring and control of networked physical assets
US11057301B2 (en) * 2019-03-21 2021-07-06 Cisco Technology, Inc. Using a midlay in a software defined networking (SDN) fabric for adjustable segmentation and slicing
US11916758B2 (en) * 2019-08-02 2024-02-27 Cisco Technology, Inc. Network-assisted application-layer request flow management in service meshes
US11277315B2 (en) * 2020-07-02 2022-03-15 Juniper Networks, Inc. Dashboard for display of state information in a graphic representation of network topology

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180013670A1 (en) 2015-05-27 2018-01-11 Cisco Technology, Inc. Operations, administration and management (oam) in overlay data center environments
US20180367392A1 (en) 2017-06-19 2018-12-20 Cisco Technology, Inc. Detection of overlapping subnets in a network
US20190207839A1 (en) 2017-12-29 2019-07-04 Arista Networks, Inc. System for network event detection and analysis

Also Published As

Publication number Publication date
US20230254227A1 (en) 2023-08-10
WO2022009294A1 (ja) 2022-01-13
JPWO2022009294A1 (ja) 2022-01-13

Similar Documents

Publication Publication Date Title
EP3895388B1 (en) Server redundant network paths
JP3880477B2 (ja) ネットワーク調査中に不良ネットワーク構成要素を識別する方法
JP5033856B2 (ja) ネットワーク構成の想定のための装置、システム
CN113973042B (zh) 用于网络问题的根本原因分析的方法和系统
US20070177523A1 (en) System and method for network monitoring
EP2866378B1 (en) Protection switching in a packet transport network
US9467332B2 (en) Node failure detection for distributed linear protection
JP6020273B2 (ja) 監視装置,情報処理システム,監視方法および監視プログラム
US8625416B2 (en) Verifying communication redundancy in a network
Canini et al. Renaissance: A self-stabilizing distributed SDN control plane
JP2010245710A (ja) ネットワーク管理装置及び通信システム及びネットワーク管理方法及びプログラム
JP7491381B2 (ja) ネットワーク監視装置、ネットワーク監視方法、および、ネットワーク監視プログラム
US20150098317A1 (en) Linear protection switching method and apparatus for protecting network segmented into multi-domain
JP4464256B2 (ja) ネットワーク上位監視装置
US11516073B2 (en) Malfunction point estimation method and malfunction point estimation apparatus
JP5480189B2 (ja) ネットワーク監視装置、ネットワーク試験方法、パス情報管理方法、及びプログラム
Verdi et al. InFaRR: In-Network Fast ReRouting
CN113132140B (zh) 一种网络故障检测方法、装置、设备及存储介质
Basuki et al. Localizing link failures in legacy and SDN networks
JP7498128B2 (ja) 監視装置、障害検知方法および障害検知プログラム
JP6272264B2 (ja) 情報処理装置およびネットワークシステム
Bhuvaneswaran et al. Terminology for benchmarking software-defined networking (SDN) controller performance
JP2015035678A (ja) ネットワークシステム、経路の監視方法、及び中継装置
US7808893B1 (en) Systems and methods for providing redundancy in communications networks
Wu et al. DCFIT: Initial Trigger-Based PFC Deadlock Detection in the Data Plane

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240429

R150 Certificate of patent or registration of utility model

Ref document number: 7491381

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150