JP2023523472A - ネットワーク性能監視方法、ネットワークデバイス、および記憶媒体 - Google Patents

ネットワーク性能監視方法、ネットワークデバイス、および記憶媒体 Download PDF

Info

Publication number
JP2023523472A
JP2023523472A JP2022566251A JP2022566251A JP2023523472A JP 2023523472 A JP2023523472 A JP 2023523472A JP 2022566251 A JP2022566251 A JP 2022566251A JP 2022566251 A JP2022566251 A JP 2022566251A JP 2023523472 A JP2023523472 A JP 2023523472A
Authority
JP
Japan
Prior art keywords
network performance
network
exceptions
exception
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022566251A
Other languages
English (en)
Other versions
JP7500770B2 (ja
Inventor
▲發▼▲遠▼ 李
永健 胡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2023523472A publication Critical patent/JP2023523472A/ja
Application granted granted Critical
Publication of JP7500770B2 publication Critical patent/JP7500770B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/022Capturing of monitoring data by sampling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/062Generation of reports related to network traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • H04L43/0829Packet loss
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • H04L43/087Jitter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0894Packet rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • H04L43/106Active monitoring, e.g. heartbeat, ping or trace-route using time related information in packets, e.g. by adding timestamps
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • H04L43/0847Transmission error
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/20Arrangements for monitoring or testing data switching networks the monitoring system or the monitored elements being virtualised, abstracted or software-defined entities, e.g. SDN or NFV

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本出願は、ネットワーク性能監視方法、ネットワークデバイス、および記憶媒体を提供し、ネットワーク技術の分野に属する。本出願では、転送プレーンは、きめ細かい時間周期に基づいてネットワーク性能データをサンプリングし、ネットワーク性能例外の数を記録し、制御プレーンは、大まかな時間周期に基づいて、転送プレーンによって記録されたネットワーク性能例外の数が閾値よりも大きいときにアラームを生成する。ネットワーク性能監視に関するきめ細かい要件を満たすことに基づいて、制御プレーンは収集されたすべてのネットワーク性能データを報告する必要がないので、制御プレーンによって報告される必要があるデータの量は大幅に削減される。これにより、大量のデータ報告によって引き起こされる主制御CPUの過負荷の問題が解決され、ネットワーク性能監視がデバイスの主制御CPUの性能に依存することが低減される。これにより、大量のデータ報告のために大量の帯域幅リソースが占有されるという問題がさらに解決され、ネットワーク性能監視の帯域幅リソースへの依存が低減され、ライブネットワークに大量の性能監視ノードを展開するための要件を満たすのに役立つ。

Description

本出願は、2020年4月29日に出願された「NETWORK PERFORMANCE MONITORING METHOD, NETWORK DEVICE, AND STORAGE MEDIUM」という名称の中国特許出願第202010359259.0号の優先権を主張し、その全体が参照により本明細書に組み込まれる。
本出願は、ネットワーク技術の分野に関し、特に、ネットワーク性能監視方法、ネットワークデバイス、および記憶媒体に関する。
ユーザはネットワーク性能に対するより高い要件を有するので、ネットワーク性能が劣化したときにキャリアがネットワークを適時に調整できるように、ネットワーク性能を監視する必要がある。
現在、ネットワークデバイスは、ネットワーク性能監視ノードとして機能する。データフロー転送中に、ネットワークデバイスは、事前設定収集周期に基づいてローカルネットワーク性能データを定期的に収集する。ネットワークデバイスがネットワーク性能データを収集するたびに、ネットワークデバイスの主制御中央処理装置(Central Processing Unit、CPU)は、収集されたネットワーク性能データを運用支援システム(Operation Support System、OSS)に報告し、その結果、OSSはデータ分析および提示を実行する。
前述の方法が使用されるとき、報告されたネットワーク性能データのデータ量が大きいため、ネットワークデバイスの主制御CPUに対する要件は非常に高い。これにより、ネットワークデバイスの主制御CPUの過負荷が発生しやすくなる。
本出願の実施形態は、ネットワーク性能監視プロセス中の主制御CPUの性能への依存性を低減するために、ネットワーク性能監視方法、ネットワークデバイス、および記憶媒体を提供する。技術的解決策は以下のとおりである。
第1の態様によれば、ネットワーク性能監視方法が提供される。本方法では、転送プレーンは、第1の時間周期に基づいてネットワーク性能データをサンプリングし、ネットワーク性能例外の数を記録し、各サンプリングによって取得されたネットワーク性能データが事前設定条件を満たすとき、1つのネットワーク性能例外が記録され、第1の時間周期は、転送プレーンがネットワーク性能データを収集するサンプリング周期であり、制御プレーンは、第2の時間周期におけるネットワーク性能例外の数が第1の閾値よりも大きいと判定し、第2の時間周期の持続時間は第1の時間周期の持続時間よりも長く、制御プレーンはアラームを生成する。
本方法によれば、転送プレーンは、きめ細かい時間周期に基づいてネットワーク性能データをサンプリングし、ネットワーク性能例外の数を記録し、制御プレーンは、大まかな時間周期に基づいて、転送プレーンによって記録されたネットワーク性能例外の数が閾値よりも大きいときにアラームを生成する。ネットワーク性能監視に関するきめ細かい要件を満たすことに基づいて、制御プレーンは収集されたすべてのネットワーク性能データを報告する必要がないので、制御プレーンによって報告される必要があるデータの量は大幅に削減される。これにより、大量のデータ報告によって引き起こされる主制御CPUの過負荷の問題が解決され、ネットワーク性能監視がデバイスの主制御CPUの性能に依存することが低減される。これにより、大量のデータ報告のために大量の帯域幅リソースが占有されるという問題がさらに解決され、ネットワーク性能監視の帯域幅リソースへの依存が低減され、ライブネットワークに大量の性能監視ノードを展開するための要件を満たすのに役立つ。
任意選択で、第1の時間周期はミリ秒単位であり、第2の時間周期は少なくとも秒単位である。
この任意選択の方法によれば、転送プレーンは、ネットワーク性能データをサンプリングし、ミリ秒レベルの周期に基づいてネットワーク性能例外の数を記録する。これは、ミリ秒レベルの性能監視に対する顧客の要件を満たすために、ミリ秒レベルの性能監視を実施するのに役立つ。加えて、制御プレーンが少なくとも秒単位の周期に基づいてアラームの生成を決定するため、ミリ秒レベルの性能監視の帯域幅リソースへの依存性およびミリ秒レベルの性能監視の主制御CPUの性能への依存性を低減することができる。
任意選択で、事前設定条件は、各サンプリングによって取得されたネットワーク性能データの値が第2の閾値以上であることを含む。
この任意選択の方法によれば、転送プレーンは、ネットワーク性能の値を閾値と比較することによって、1つのネットワーク性能例外を記録するかどうかを判定し得る。実装が簡単であるため、実用性が高い。
任意選択で、転送プレーンがネットワーク性能例外の数を記録することは、複数の例外レベルの各例外レベルに対応するネットワーク性能例外の数を記録することを含み、複数の例外レベルは複数の事前設定条件にそれぞれ対応し、各サンプリングによって取得されたネットワーク性能データが例外レベルに対応する事前設定条件を満たすとき、例外レベルに対応する1つのネットワーク性能例外が記録される。
この任意選択の方法によれば、転送プレーンは、複数の例外レベルのネットワーク性能を監視するために、各例外レベルのネットワーク性能例外の数を別々に記録する。これにより、ネットワーク性能監視機能をより洗練させることができ、柔軟性が向上する。特に、アラームが例外レベルを搬送するとき、現在のネットワーク性能例外の重大度をユーザが知るのを助けるために、ネットワーク性能例外のどの例外レベルが現在発生しているかを判定することが有用である。
任意選択で、制御プレーンが、第2の時間周期におけるネットワーク性能例外の数が第1の閾値よりも大きいと判定することは、制御プレーンが、第2の時間周期における複数の例外レベルに対応するネットワーク性能例外の数がすべて第1の閾値よりも大きいと判定することを含み、制御プレーンがアラームを生成することは、制御プレーンが複数の例外レベルの中で最も高い例外レベルを示すアラーム情報を生成することを含む。
この任意選択の方法によれば、複数の例外レベルのすべてがアラームトリガ条件を満たすとき、制御プレーンは、最も高い例外レベルのアラーム情報のみを生成し、より低い例外レベルのアラーム情報を抑制する必要がある。これにより、生成する必要があるアラーム情報の量が低減され、過剰に生成されたアラーム情報によって引き起こされるユーザへの干渉が回避される。
任意選択で、例外レベルに対応する事前設定条件は、各サンプリングによって取得されたネットワーク性能データの値が例外レベルに対応する第3の閾値以上であることであって、より高い例外レベルは例外レベルに対応するより高い第3の閾値を示す、ことを含む。
この任意選択の方法によれば、異なる閾値が例外レベルに基づいてネットワーク性能データの値に対して別々に設定されるので、転送プレーンは、異なる値を有するネットワーク性能データに対して、異なる例外レベルに対応する量を別々に記録する。これにより、ネットワーク性能監視機能をより洗練させることができ、柔軟性が向上する。
任意選択で、ネットワーク性能データは、遅延、パケット損失、ジッタ、帯域幅、伝送レート、ビット誤り、および誤りパケットのうちの少なくとも1つを含む。
この任意選択の方法によれば、ネットワーク性能のどの次元が異常であるかを判定することが有用であり、多次元ネットワーク性能監視をサポートすることができるので、ネットワーク性能監視はより包括的であり、より多くの適用シナリオを満たす。
任意選択で、本方法は、転送プレーンが、各サンプリングによって取得されたネットワーク性能データに基づいて第2の時間周期におけるネットワーク性能パラメータを決定するステップと、制御プレーンがネットワーク性能パラメータを取得するステップと、をさらに含む。
この任意選択の方法によれば、ネットワーク性能パラメータに関する統計を収集するための要件が満たされ、ネットワーク性能パラメータに関する統計を収集するためのタスクが転送プレーンにオフロードされるので、ネットワーク性能パラメータに関する統計を収集することによって引き起こされる制御プレーンの処理オーバーヘッドが低減される。
任意選択で、ネットワーク性能パラメータは、最大遅延、最小遅延、平均遅延、パケット損失率、ジッタ、帯域幅、伝送レート、ビット誤り率、およびパケット誤り率のうちの少なくとも1つを含む。
この任意選択の方法によれば、多次元ネットワーク性能パラメータに関する統計を収集するための要件を満たすことができ、その結果、ネットワーク性能監視はより包括的になり、より多くのアプリケーションシナリオを満たす。
任意選択で、制御プレーンがアラームを生成した後、本方法は、制御プレーンがアラームを制御管理デバイスに送信するステップをさらに含む。
この任意選択の方法によれば、制御プレーンはアラームを制御管理デバイスに報告するので、制御プレーンは、性能例外イベントがネットワークで発生したことを適時にキャリアに通知することができる。これは、キャリアがネットワーク状況を適時に調整するのに役立ち、ネットワーク性能例外の問題を適時に解決して、ユーザエクスペリエンスに影響を及ぼすのを回避するのに役立つ。
任意選択で、制御プレーンがアラームを制御管理デバイスに送信した後、本方法は、第2の時間周期の後の複数の連続する第2の時間周期におけるネットワーク性能例外の数がすべて第1の閾値未満である場合、制御プレーンがアラームをキャンセルするステップをさらに含む。
この任意選択の方法によれば、アラームを報告した後、制御プレーンは、複数の連続する周期におけるネットワーク性能例外の数に基づいてアラームをキャンセルし、その結果、生成されたアラームの長期的な残留を回避することができる。加えて、アラームをキャンセルすることによって、制御プレーンは、ネットワーク性能が正常であり、ネットワーク性能例外を引き起こす障害が修正されたことをキャリアに通知することができる。
第2の態様によれば、ネットワーク性能監視方法が提供される。本方法では、制御プレーンは、転送プレーンからネットワーク性能例外の数を取得し、各サンプリングによって取得されたネットワーク性能データが事前設定条件を満たすとき、1つのネットワーク性能例外が記録され、第1の時間周期は、転送プレーンがネットワーク性能データを収集するサンプリング周期であり、制御プレーンは、第2の時間周期におけるネットワーク性能例外の数が第1の閾値よりも大きいと判定し、第2の時間周期の持続時間は第1の時間周期の持続時間よりも長く、制御プレーンはアラームを生成する。
第3の態様によれば、ネットワークデバイスが提供される。ネットワークデバイスは、主制御基板およびインターフェース基板を含む。主制御基板は、第1の態様または第1の態様の任意選択の方法のいずれか1つの制御プレーンに対応する方法を実行するように構成されたモジュールを含む。インターフェース基板は、第1の態様または第1の態様の任意選択の方法のいずれか1つの転送プレーンに対応する方法を実行するように構成されたモジュールを含む。
第4の態様によれば、ネットワークデバイスが提供される。ネットワークデバイスは、主制御基板およびインターフェース基板を含む。主制御基板は、第1のプロセッサおよび第1のメモリを含む。インターフェース基板は、第2のプロセッサ、第2のメモリ、およびインターフェースカードを含む。主制御基板はインターフェース基板に接続される。
第1のメモリは、プログラムコードを格納するように構成され得る。第1のプロセッサは、第1のメモリ内のプログラムコードを呼び出して、第1の時間周期に基づいてネットワーク性能データをサンプリングし、ネットワーク性能例外の数を記録する動作であって、各サンプリングによって取得されたネットワーク性能データが事前設定条件を満たすとき、1つのネットワーク性能例外が記録され、第1の時間周期は、転送プレーンがネットワーク性能データを収集するサンプリング周期である、動作を実行するように構成される。
第2のメモリは、プログラムコードを格納するように構成され得る。第2のプロセッサは、第2のメモリ内のプログラムコードを呼び出して、第2の時間周期におけるネットワーク性能例外の数が第1の閾値よりも大きいと判定する動作であって、第2の時間周期の持続時間が第1の時間周期の持続時間よりも長い、動作と、アラームを生成する動作と、を実行するようにインターフェースカードをトリガするように構成される。
可能な実装形態では、プロセス間通信(inter-process communication、IPC)チャネルが主制御基板とインターフェース基板との間に確立され、主制御基板とインターフェース基板はIPCチャネル上で互いに通信する。
第5の態様によれば、コンピュータ可読記憶媒体が提供される。記憶媒体は少なくとも1つの命令を格納し、命令はプロセッサによって読み取られ、その結果、転送プレーンおよび制御プレーンは、第1の態様または第1の態様の任意選択の方法のいずれか1つで提供されるネットワーク性能監視方法を実行する。
第6の態様によれば、コンピュータプログラム製品が提供される。コンピュータプログラム製品がネットワークデバイス上で動作すると、ネットワークデバイスの転送プレーンおよび制御プレーンは、第1の態様または第1の態様の任意選択の方法のいずれか1つで提供されるネットワーク性能監視方法を実行することが可能になる。
第7の態様によれば、チップが提供される。チップがネットワークデバイス上で動作すると、ネットワークデバイスの転送プレーンおよび制御プレーンは、第1の態様または第1の態様の任意選択の方法のいずれか1つで提供されるネットワーク性能監視方法を実行することが可能になる。
本出願の一実施形態によるシステムアーキテクチャ100の概略図である。 本出願の一実施形態によるネットワーク性能監視方法200のフローチャートである。 本出願の一実施形態によるネットワークデバイス300の構造の概略図である。 本出願の一実施形態によるネットワークデバイス400の構造の概略図である。
本出願の目的、技術的解決策、および利点を明確にするため、これ以降は、添付の図面を参照しながら本出願の実装をさらに詳述する。
以下では、本出願の適用シナリオの例を説明する。
本出願の実施形態で提供されるネットワーク性能監視方法は、ミリ秒レベルのネットワーク性能監視シナリオに適用され得る。以下では、ミリ秒レベルのネットワーク性能監視シナリオを簡単に個別に説明する。
人々の生活水準の向上に伴い、ユーザはネットワーク体験に対するより高い要件を有する。これは、キャリアがリアルタイムでネットワーク性能を監視することを必要とする。キャリアは、ネットワーク性能に基づいてネットワークを適時に調整して、アンバランスなネットワークトラフィックおよびネットワーク輻輳などのネットワーク性能例外によって引き起こされるネットワーク性能低下によるユーザの苦情を回避し得る。しかしながら、現在、実際のネットワークでは、ネットワーク性能監視は秒レベルまたは分レベルで実行される。秒レベルまたは分レベルの統計的周期が過度に長いため、長期的なネットワーク性能統計結果が安定しているが、時折、バーストトラフィックが、サービスの保証された帯域幅またはリンク帯域幅を超えるトラフィックを頻繁に発生させる。その結果、少量のパケットが失われる。ネットワークのリアルタイムのトラフィック状況をより良く反映するために、より正確なミリ秒レベルのネットワーク性能監視機能が必要とされる。
現在のミリ秒レベルの性能監視方法は、秒レベルの性能監視方法を継承する。各性能監視ノード(例えば、デバイスの転送プレーン)は、ミリ秒レベルのサンプリング周期に基づいてネットワーク性能データを収集し、毎回サンプリングされたミリ秒レベルのネットワーク性能データをリアルタイムでデバイスの主制御に報告するか、または特定の周期に基づいて、毎回サンプリングされたミリ秒レベルのネットワーク性能データをデバイスの主制御にパックして報告する。デバイスの主制御は、デバイス間のデータ通信ネットワーク(Data Communication Network、DCN)チャネルまたは帯域外DCNチャネル上で、およびテレメトリ(Telemetry)または簡易ネットワーク管理プロトコル(Simple Network Management Protocol、SNMP)を介して、サンプリングされたすべてのネットワーク性能データをOSSに報告する。そして、OSSは、ネットワーク性能データを解析して提示する。
しかしながら、前述の方法が使用されるとき、データのサンプリングおよび報告はミリ秒レベルで実行されるため、ネットワーク性能データのデータ量は膨大である。したがって、主制御CPUに対する要件は非常に高い。これにより、CPUの過負荷が発生しやすくなる。さらに、収集されたネットワーク性能データのデータ量は膨大であるため、データ報告は大量のDCN帯域幅リソースを占有する必要がある。その結果、ライブネットワークにノードおよびインスタンスを展開することはほとんど不可能である。
これを考慮して、本出願の実施形態は、ネットワーク性能監視方法を提供する。サンプリング周期がミリ秒レベルに設定されると、デバイスの主制御CPUの性能に対するミリ秒レベルのネットワーク性能監視の依存性を低減することができ、ミリ秒レベルのネットワーク性能監視に対する顧客要件を満たすことができる。さらに、ライブネットワーク内に大量のミリ秒レベルの性能監視ノードを展開するための要件を満たすために、DCN帯域幅リソースに対するミリ秒レベルのネットワーク性能監視の依存性を低減することができる。
以下では、本出願の実施形態で提供される技術的解決策を、システムアーキテクチャ、方法、仮想装置、エンティティ装置、および媒体などの複数の観点から説明する。
以下では、本出願の実施形態で提供されるシステムアーキテクチャについて説明する。
図1を参照されたい。本出願の一実施形態は、システムアーキテクチャ100を提供する。システムアーキテクチャ100は、ネットワーク性能監視システムの一例である。システムアーキテクチャ100は、少なくとも1つのネットワークデバイスおよび制御管理デバイスを含む。少なくとも1つのネットワークデバイスの各々は、ネットワーク(例えば、DCN)を介して制御管理デバイスに接続される。
システムアーキテクチャ100内のネットワークデバイスは、アクセスネットワークデバイス、アグリゲーションネットワークデバイス、またはコアネットワークデバイスを含むが、これらに限定されない。ネットワークデバイスのタイプは複数のケースを含む。例えば、ネットワークデバイスは、パケット転送ネットワーク(Packet Transport Network、PTN)デバイス、アジャイル転送ネットワーク(Agile Transport Network、ATN)、光スイッチングネットワーク(Optical Switching Network、OSN)、ルータ、またはスイッチを含むが、これらに限定されず、または、ネットワークデバイスは、性能監視をサポートする別の種類のデバイス、例えば、ミリ秒レベルの性能監視をサポートするデバイスである。ネットワークデバイスのタイプは、この実施形態では限定されない。例えば、図1を参照されたい。ネットワークデバイスは、アクセスネットワークデバイス101、アグリゲーションネットワークデバイス102、アグリゲーションネットワークデバイス103、バックボーンアグリゲーションネットワークデバイス104、バックボーンアグリゲーションネットワークデバイス105、コアネットワークデバイス106、またはコアネットワークデバイス107である。システムアーキテクチャ100内のすべてまたは一部のネットワークデバイスは、性能監視ノードとして機能し、方法200を実行するように構成される。任意選択で、システムアーキテクチャ100内のどのネットワークデバイスが性能監視ノードとして機能するかは、ユーザによって指定される。例えば、ネットワークデバイスが性能監視ノードとして展開される必要があるとき、ユーザは、ネットワークデバイスの性能監視機能を有効にし、ネットワークデバイスは、有効化命令のトリガ下で以下の方法200を実行する。
システムアーキテクチャ100における制御管理デバイスは、ネットワーク管理デバイスまたはコントローラを含むが、これらに限定されない。ネットワーク管理デバイスは、例えば、図1のOSS 110である。コントローラは、例えば、ソフトウェア定義ネットワーク(英語:Software Defined Networking、略称SDN)におけるSDNコントローラ(SDN controller)、または、ネットワーク機能仮想化(英語:Network Function Virtualization、略してNFV)における仮想化ネットワーク機能マネージャ(英語:Network Functions Virtualisation Manager、略してVNFM)である。制御管理デバイスの物理エンティティは、例えば、ホスト、サーバ、パーソナルコンピュータである。本実施形態では、制御管理デバイスの種類は限定されない。
システムアーキテクチャ100におけるネットワークデバイスと制御管理デバイスとの間の通信方法は、複数の実装形態を含む。例えば、ネットワークデバイスは、テレメトリまたはSNMPを介して制御管理デバイスと通信する。もちろん、テレメトリおよびSNMPは、通信を実施するための任意選択の方法である。いくつかの他の実施形態では、ネットワークデバイスは、ネットワーク構成(Network Configuration、NETCONF)プロトコルに基づいて制御管理デバイスと通信する。
以上、システムアーキテクチャ100について説明した。以下では、方法200を使用して、上記で提供されたシステムアーキテクチャに基づくネットワーク性能監視方法の手順の一例を説明する。
図2は、本出願の一実施形態によるネットワーク性能監視方法200のフローチャートである。例えば、方法200は、S201からS205を含む。
任意選択で、方法200は、システムアーキテクチャ100内のネットワークデバイスによって実行され、具体的には、同じネットワークデバイス内の転送プレーンおよび制御プレーンによって実行される。転送プレーンは、S201に対応する処理作業を引き受けるように構成され、制御プレーンは、S202~S205に対応する処理作業を引き受けるように構成される。
S201.転送プレーンが、第1の時間周期に基づいてネットワーク性能データをサンプリングし、ネットワーク性能例外の数を記録する。
第1の時間周期は、転送プレーンがネットワーク性能データを収集するサンプリング周期である。具体的には、転送プレーンは、サンプリングによって取得されたネットワーク性能データに基づいてネットワーク性能例外の数を記録するために、第1の時間周期ごとに1回ネットワーク性能データをサンプリングする。第1の時間周期の粒度または時間長は、複数のケースを含む。任意選択で、第1の時間周期はミリ秒単位である。例えば、第1の時間周期が1ミリ秒である場合、転送プレーンはミリ秒ごとに1回ネットワーク性能データを収集する。転送プレーンは、ミリ秒レベルのサンプリング周期に基づいてネットワーク性能データをサンプリングする。これは、ミリ秒レベルの性能監視を実施するのに役立つ。例えば、ネットワーク性能データは文字pで表される。Nミリ秒が経過するたびに、転送プレーンはサンプリングによってN個のネットワーク性能データを取得し、これらはそれぞれp1,p2,p3,…,およびpnであり、piはi番目のミリ秒に収集されたネットワーク性能データを表し、iは1以上n以下の正の整数である。任意選択で、ネットワーク性能データは、転送プレーンによって内部的に収集されたデータであり、ユーザに提示するためにOSSに報告されない。
ネットワーク性能データは、ネットワーク性能を示し、例えば、転送プレーンの転送性能を示す。任意選択で、ネットワーク性能データは、遅延、パケット損失、ジッタ、帯域幅、伝送レート、ビット誤り、および誤りパケットのうちの少なくとも1つを含む。任意選択で、ネットワーク性能の監視対象は、物理ポート、トンネル、擬似ワイヤ、または仮想インターフェースのうちの少なくとも1つを含み、これに対応して、ネットワーク性能データは、物理ポートのネットワーク性能データ、トンネルのネットワーク性能データ、擬似ワイヤのネットワーク性能データ、または仮想インターフェースのネットワーク性能データのうちの少なくとも1つを含む。任意選択で、転送プレーンの異なる構成要素は、異なる監視対象のネットワーク性能データをサンプリングする役割を担う。例えば、物理ポートのネットワーク性能データは物理インターフェースカードによってサンプリングされ、トンネルのネットワーク性能データおよび擬似ワイヤのネットワーク性能データはNPによってサンプリングされる。
転送プレーンがネットワーク性能例外の数をどのように記録するかは、複数の実装形態を含む。例えば、各サンプリングによってネットワーク性能データを取得した後で、転送プレーンは、サンプリングによって取得されたネットワーク性能データが事前設定条件を満たすかどうか判定する。各サンプリングによって取得されたネットワーク性能データが事前設定条件を満たすとき、転送プレーンは1つのネットワーク性能例外を記録する。
事前設定条件の設定は、複数の実装形態を含む。任意選択で、事前設定条件は、各サンプリングによって取得されたネットワーク性能データの値が第2の閾値以上であることを含む。第2の閾値は、性能閾値交差閾値または性能低下閾値と呼ばれてもよい。事前設定条件が閾値を使用して設定されるとき、ネットワーク性能例外の数は、閾値交差回数とも呼ばれる。第2の閾値は、要件または実際のネットワーク状況に基づいて設定され得る。第2の閾値は、遅延閾値、パケット損失閾値、ジッタ閾値、帯域幅閾値、伝送レート閾値、ビット誤り閾値、および誤りパケット閾値のうちの少なくとも1つを含むが、これらに限定されない。例えば、ネットワーク性能データは伝送レートであり、第2の閾値は70%である。任意選択で、第2の閾値は、ユーザがネットワーク性能監視機能を有効にするときにユーザによって事前設定されるか、または第2の閾値はデフォルト値である。例えば、第1の時間周期は1ミリ秒である。転送プレーンは、ミリ秒ごとに収集されたネットワーク性能データを第2の閾値と比較する。ミリ秒ごとに収集されたネットワーク性能データが第2の閾値以上である場合、転送プレーンは1つのネットワーク性能例外を記録する。
任意選択で、ネットワーク性能監視は複数の例外レベルを有してもよく、転送プレーンは、複数の例外レベルの各例外レベルに対応するネットワーク性能例外の数を記録する。具体的には、複数の例外レベルは複数の事前設定条件にそれぞれ対応し、異なる例外レベルに対応する事前設定条件は異なっていてもよい。各サンプリングによってネットワーク性能データを取得した後で、転送プレーンは、ネットワーク性能データが複数の事前設定条件を満たすかどうかを別々に判定する。複数の例外レベルのうちの1つの例外レベルについて、各サンプリングによって取得されたネットワーク性能データが例外レベルに対応する事前設定条件を満たすとき、転送プレーンは、例外レベルに対応する1つのネットワーク性能例外を記録する。
例外レベルに対して対応する事前設定条件を設定する方法は、複数の実装形態を含む。可能な実装形態では、複数の第3の閾値が複数の例外レベルに対して別々に設定され、第3の閾値は、レベルに対応する性能閾値交差閾値またはレベルに対応する性能低下閾値と呼ばれてもよい。例外レベルに対応する事前設定条件は、各サンプリングによって取得されたネットワーク性能データの値が例外レベルに対応する第3の閾値以上であることを含む。複数の第3の閾値は、複数の例外レベルと1対1に対応してもよい。上述した第3の閾値と第2の閾値とは、同じであってもよいし、異なっていてもよい。各例外レベルに対応する第3の閾値は、ユーザがネットワーク性能監視機能を有効にするときにユーザによって事前設定されるか、または各例外レベルに対応する第3の閾値はデフォルト値である。第3の閾値は、遅延閾値、パケット損失閾値、ジッタ閾値、帯域幅閾値、伝送レート閾値、ビット誤り閾値、および誤りパケット閾値のうちの少なくとも1つを含むが、これらに限定されない。
任意選択で、より高い例外レベルは、例外レベルに対応するより高い第3の閾値を示す。例えば、ネットワーク性能データは物理ポートの伝送レートであり、第3の閾値は物理ポートの伝送レート閾値である。複数の例外レベルに含まれる2つの例外レベルでは、より低い例外レベルに対応する伝送レート閾値は70%であり、より高い例外レベルに対応する伝送レート閾値は85%である。
例えば、第3の閾値は文字Mで表され、ネットワーク性能データは文字pで表され、ネットワーク性能例外の数は文字mumで表される。閾値M1から閾値MnまでのN個の第3の閾値は、例外レベル1から例外レベルnまでのN個の例外レベルに対して設定されてもよい。転送プレーンは、N個の第3の閾値に基づいて、mum1からmumnまでのN個のネットワーク性能例外の数を記録する。Miは例外レベルiに対応する第3の閾値を表し、mumiは例外レベルiに対応するネットワーク性能例外の数を表し、iは1以上n以下の正の整数である。例えば、第1の時間周期は1ミリ秒である。k番目のミリ秒でのサンプリングによってネットワーク性能データpkを取得した後、転送プレーンは、ネットワーク性能データpkを閾値M1から閾値Mnと別々に比較する。閾値Mi<ネットワーク性能データpk<閾値Mi+1の場合、転送プレーンは、数量mumiの値を1だけ増加させる。言い換えれば、複数の例外レベルのうちの2つの隣接する例外レベルについて、サンプリングによって取得された現在のネットワーク性能データの値が前の例外レベルに対応する閾値より大きく、次の例外レベルに対応する閾値より小さい場合、前の例外レベルに対応するネットワーク性能例外の数は1だけ累積される。
任意選択で、転送プレーンは、ネットワーク性能データに基づいてネットワーク性能例外の数を記録するだけでなく、各サンプリングによって得られたネットワーク性能データに基づいて第2の時間周期でネットワーク性能パラメータを決定する。
ネットワーク性能パラメータは、第2の時間周期におけるネットワーク性能データの最大値、第2の時間周期におけるネットワーク性能データの最小値、または第2の時間周期におけるネットワーク性能データの平均値のうちの少なくとも1つを含むが、これらに限定されない。特定のタイプのネットワーク性能データを参照すると、任意選択で、ネットワーク性能パラメータは、最大遅延、最小遅延、平均遅延、パケット損失率、ジッタ、帯域幅、伝送レート、ビット誤り率、およびパケット誤り率のうちの少なくとも1つを含む。
第2の時間周期におけるネットワーク性能データの最大値をどのように計算するかは、複数の実装形態を含む。例えば、第2の時間周期は文字Tで表され、周期Tにおけるネットワーク性能データの最大値は文字Maxで表される。例えば、第1の時間周期は1ミリ秒である。周期Tの各ミリ秒におけるサンプリングによってネットワーク性能データを取得した後、転送プレーンは、今回収集されたネットワーク性能データの値を値Maxと比較する。周期Tにおけるネットワーク性能データの最大値を取得するために、今回収集されたネットワーク性能データの値が記録値Maxより大きい場合、転送プレーンは、記録値Maxを今回収集されたネットワーク性能データの値に更新するか、または、今回収集されたネットワーク性能データの値が記録値Max以下である場合、転送プレーンは記録値Maxを変更せずに保持する。
第2の時間周期におけるネットワーク性能データの最大値をどのように計算するかは、複数の実装形態を含む。例えば、第2の時間周期は文字Tで表され、周期Tにおけるネットワーク性能データの最小値は文字Minで表される。例えば、第1の時間周期は1ミリ秒である。周期Tの各ミリ秒におけるサンプリングによってネットワーク性能データを取得した後、転送プレーンは、今回収集されたネットワーク性能データの値を値Minと比較する。周期Tにおけるネットワーク性能データの最大値を取得するために、今回収集されたネットワーク性能データの値が記録値Minより小さい場合、転送プレーンは、記録値Minを今回収集されたネットワーク性能データの値に更新するか、または、今回収集されたネットワーク性能データの値が記録値Min以上である場合、転送プレーンは記録値Minを変更せずに保持する。
第2の時間周期におけるネットワーク性能データの平均値をどのように計算するかは、複数の実装形態を含む。例えば、第2の時間周期は文字Tで表され、周期Tにおけるネットワーク性能データの平均値は文字Avgで表される。例えば、第1の時間周期は1ミリ秒である。転送プレーンは、周期Tにおけるネットワーク性能データの平均値Avgを取得するために、周期Tにおけるすべてのミリ秒でサンプリングによって取得されたネットワーク性能データの値に対して平均計算を実行する。
S202.制御プレーンは、第2の時間周期におけるネットワーク性能例外の数が第1の閾値よりも大きいと判定する。
第2の時間周期の持続時間は、第1の時間周期の持続時間よりも長い。第2の時間周期の粒度または時間長は、複数のケースを含む。任意選択で、第1の時間周期がミリ秒単位であるとき、第2の時間周期は少なくとも秒単位である。言い換えれば、第2の時間周期の持続時間は1秒以上である。例えば、第2の時間周期は、1秒、10秒、30秒、1分、5分、15分、30分、または1時間である。任意選択で、第2の時間周期の持続時間は、ユーザがネットワーク性能監視機能を有効にするときにユーザによって事前設定されるか、または第2の時間周期の持続時間はデフォルト値である。例えば、デフォルト値は30秒である。
第1の閾値は、アラーム閾値と呼ばれてもよい。任意選択で、第1の閾値は、ユーザがネットワーク性能監視機能を有効にするときにユーザによって事前設定されるか、または第1の閾値はデフォルト値である。第2の時間周期ごとに、制御プレーンは、第2の時間周期におけるネットワーク性能例外の数を第1の閾値と比較する。転送プレーンによって記録されたネットワーク性能例外の数が第1の閾値より大きい場合、制御プレーンはアラームを生成する。例えば、第2の時間周期は文字Tで表され、ネットワーク性能例外の数は文字mumで表され、第1の閾値は文字Alam-numで表される。制御プレーンは、mumとAlam-numとを比較する。mumがAlam-numより大きい場合、具体的には、第2の時間周期におけるネットワーク性能例外の数が第1の閾値よりも大きい回数がアラーム閾値に達した場合、制御プレーンはアラームが生成されたことを報告する。
第1の時間周期と第2の時間周期との間の数量関係から、転送プレーンがデータサンプリングおよび数量記録を行う周期がきめ細かく、制御プレーンが報告を行う周期が大まかであることが分かる。したがって、この実施形態を実施することにより、転送プレーンと制御プレーンとは協働してネットワーク性能を監視する。これは、きめ細かいネットワーク性能監視の要件を満たし、制御プレーンによる大規模データ報告のためのCPUの性能への依存および帯域幅リソースの消費を低減する。
この実施形態では、制御プレーンは、転送プレーンからネットワーク性能例外の数を取得し得る。具体的には、ネットワーク性能例外の数を取得する方法は、複数の実装形態を含む。以下では、説明のための例として実装形態1および実装形態2を使用する。
実装形態1:制御プレーンは、ネットワーク性能例外の数を能動的に読み取る。
任意選択で、ネットワーク性能例外の数を記録した後、転送プレーンはネットワーク性能例外の数をメモリに格納し、制御プレーンはネットワーク性能例外の数をメモリから読み取る。ネットワーク性能例外の数を格納するように構成されたメモリは、複数のケースを含む。例えば、メモリは、転送プレーンが位置するインターフェース基板内のメモリ、例えば、物理インターフェースカード上のレジスタである。別の例では、メモリは、制御プレーンが配置されるインターフェース基板(例えば、主制御基板)内のメモリである。メモリのタイプは、この実施形態では限定されない。
実装形態2:制御プレーンは、転送プレーンによって報告されたネットワーク性能例外の数を受信する。
任意選択で、転送プレーンがネットワーク性能例外の数を記録した後、転送プレーンはネットワーク性能例外の数を制御プレーンに送信し、制御プレーンはネットワーク性能例外の数を受信する。
S203.制御プレーンはアラームを生成する。
制御プレーンによって生成されるアラームは、複数のケースを含む。以下では、説明のための例としてケースAおよびケースBを使用する。
ケースA:制御プレーンによって生成されたアラームは、アラーム指示信号を含み、アラーム指示信号は、アラームインジケータのオン/オフもしくは点滅頻度、またはアラームオーディオなどのデータの形態で出力され得る。例えば、アラーム指示信号はアラートであってもよい。
ケースB:制御プレーンによって生成されたアラームはアラーム情報を含み、アラーム情報は、ネットワーク性能例外の数が第1の閾値よりも大きいことを示す。アラーム情報の内容は、複数のケースを含む。例えば、アラーム情報は、アラームタイプ、アラームソース情報、またはタイムスタンプのうちの少なくとも1つを含む。以下では、いくつかのタイプの情報を詳細に個別に説明する。
アラームタイプは、遅延例外、パケット損失例外、ジッタ例外、帯域幅例外、伝送レート例外、ビット誤り例外、または誤りパケット例外のうちの少なくとも1つを含む。アラーム情報のアラームタイプが遅延例外であるとき、アラーム情報は、遅延例外の数が第1の閾値より大きいことを示す。アラーム情報のアラームタイプが伝送レート例外であるとき、アラーム情報は、伝送レート例外の数が第1の閾値より大きいことを示す。例えば、ポートレートが過度に遅い回数は第1の閾値よりも大きく、他のアラームタイプも同様である。アラームタイプはアラーム情報で搬送される。したがって、特定のネットワーク性能例外イベントを明確に示すことができ、言い換えれば、どのタイプのネットワーク性能データが異常であるかを特定することができる。
アラームソース情報は、アラーム情報を生成するネットワークデバイスを示す。アラームソース情報は、例えば、制御プレーンが位置するネットワークデバイスの名称または制御プレーンが位置するネットワークデバイスのインターネットプロトコル(internet protocol、IP)アドレスである。アラームソース情報は、アラーム情報で搬送される。したがって、ネットワーク内にあり、ネットワーク性能例外を検出するネットワークデバイスを明確に示すことができる。
タイムスタンプは、ネットワーク性能例外の数が第1の閾値より大きい時点を示す。例えば、第2の時間周期におけるネットワーク性能例外の数が第1の閾値よりも大きいと判定したとき、制御プレーンは、現時点のタイムスタンプをアラーム情報に書き込んでもよい。タイムスタンプはアラーム情報で搬送される。したがって、いつ制御プレーンがネットワーク性能例外を検出したかを明確に示すことができる。
任意選択で、複数の例外レベルがネットワーク性能監視のために設定されるとき、アラーム情報は例外レベルをさらに含む。ネットワーク性能例外イベントのどの例外レベルが発生するかを明確に示すのに役立つように、異なる例外レベルのアラーム情報は異なる。例えば、アラーム情報はアラーム名を含み、異なる例外レベルのアラーム情報内のアラーム名は異なる。別の例では、アラーム情報はアラームパラメータを含み、異なる例外レベルのアラーム情報内のアラームパラメータは異なる。
具体的には、制御プレーンは、第2の時間周期における複数の例外レベルに対応するネットワーク性能例外の数を第1の閾値と別々に比較する。複数の例外レベルのうちの1つの例外レベルについて、制御プレーンが、第2の時間周期における例外レベルに対応するネットワーク性能例外の数が第1の閾値よりも大きいと判定した場合、制御プレーンは、例外レベルを示すアラーム情報を生成する。例えば、第2の時間周期は文字Tで表され、例外レベルnに対応するネットワーク性能例外の数は文字numnで表され、第1の閾値は文字Alam-numで表される。制御プレーンは、numnとAlam-numとを比較する。T内でnumnがAlam-numよりも大きいと制御プレーンが判定した場合、制御プレーンはAlamnを生成する。Alamnは、例外レベルnを示すアラーム情報を表す。
任意選択で、制御プレーンが、第2の時間周期における複数の例外レベルに対応するネットワーク性能例外の数がすべて第1の閾値よりも大きいと判定した場合、制御プレーンは、複数の例外レベルの中で最も高い例外レベルを示すアラーム情報を生成する。例えば、第1の閾値は文字Alam-numで表される。例外レベル1に対応するネットワーク性能例外の数がAlam-numより大きく、例外レベル2に対応するネットワーク性能例外の数もAlam-numより大きく、例外レベル3に対応するネットワーク性能例外の数もAlam-numより大きい場合、制御プレーンはAlam3を生成する。Alam3は、例外レベル3を示すアラーム情報を表す。
このようにして、複数の例外レベルが対応する閾値(第3の閾値)を同時に満たす場合、制御プレーンは、上位層のOSSに最も高い例外レベルのアラーム情報のみを報告し、より低い例外レベルのアラーム情報の報告を抑制することができる。このようにして、報告されるアラーム情報の量を減らすことができ、過剰なアラーム情報によって引き起こされるユーザへの干渉を回避することができる。
S204.制御プレーンは、アラームを制御管理デバイスに送信する。
例えば、制御プレーンは、テレメトリまたはSNMPプロトコルを介して、デバイス間のDCNチャネルまたは帯域外DCNチャネルで制御管理デバイスにアラームを報告する。例えば、図1に示されるシステムアーキテクチャ100を参照されたい。制御プレーンが位置するネットワークデバイスは、例えば、アクセスネットワークデバイス101である。アラームを生成した後、アクセスネットワークデバイス101は、アラームをOSS 110に送信する。アラームを受信した後、制御管理デバイスは、アラームを解析して提示してもよい。アラームを制御管理デバイスに報告することにより、制御プレーンは、ネットワーク内で性能例外イベントが発生したことを適時にキャリアに通知することができる。これは、キャリアがネットワーク状況を適時に調整するのに役立ち、ネットワーク性能例外の問題を適時に解決して、ユーザエクスペリエンスに影響を及ぼすのを回避するのに役立つ。
任意選択で、制御プレーンが第2の時間周期においてネットワーク性能パラメータを取得した後、制御プレーンは、ネットワーク性能パラメータを制御管理デバイスにさらに送信し、例えば、第2の時間周期におけるネットワーク性能データの最大値、第2の時間周期におけるネットワーク性能データの最小値、および第2の時間周期におけるネットワーク性能データの平均値を送信する。任意選択で、制御プレーンは、テレメトリまたはSNMPプロトコルを介して、デバイス間のDCNチャネルまたは帯域外DCNチャネルで、ネットワーク性能パラメータを制御管理デバイスに報告する。ネットワーク性能パラメータを受信した後、制御管理デバイスは、ネットワーク性能パラメータを分析して提示し得る。
ネットワーク性能パラメータを報告するための機会またはトリガ条件は、具体的には複数のケースを含む。以下では、説明のための例としてケースIおよびケースIIを使用する。
ケースI:制御プレーンは、第2の時間周期に基づいてネットワーク性能パラメータを報告する。言い換えれば、制御プレーンは、第2の時間周期ごとに1回、ネットワーク性能パラメータを制御管理デバイスに送信する。任意選択で、ケースIでは、ネットワーク性能パラメータの報告はアラームの報告に依存しない。例えば、第2の時間周期におけるネットワーク性能例外の数が第1の閾値よりも大きい、小さい、または等しいとき、制御プレーンは、第2の時間周期においてネットワーク性能パラメータを報告する。
ケースII:制御プレーンは、アラームを報告するときにネットワーク性能パラメータを報告する。言い換えれば、制御プレーンが、第2の時間周期におけるネットワーク性能パラメータが第1の閾値よりも大きいと判定したとき、制御プレーンは、第2の時間周期におけるアラームおよびネットワーク性能パラメータを制御管理デバイスに送信する。
この方法が使用されるとき、第2の時間周期は、制御プレーンがネットワーク性能パラメータを送信する報告周期であってもよい。
S204は任意選択のステップであることを理解されたい。いくつかの他の実施形態では、制御プレーンはS204を実行しない。例えば、制御プレーンは、ネットワーク性能例外が検出されたことをユーザに促すアラートを出力する。
任意選択で、制御プレーンは、ネットワーク性能例外の数をさらに報告する。具体的には、ネットワーク性能例外の数を取得した後、制御プレーンはネットワーク性能例外の数を制御管理デバイスにさらに送信し、制御管理デバイスはネットワーク性能例外の数を受信し、ネットワーク性能例外の数を分析して提示する。ネットワーク性能監視が複数の例外レベルを有するとき、任意選択で、制御プレーンは、複数の例外レベルの各例外レベルに対応するネットワーク性能例外の数を制御管理デバイスに送信する。ネットワーク性能データが遅延、パケット損失、ジッタ、帯域幅、伝送レート、ビット誤り、および誤りパケットのうちの少なくとも1つを含むとき、任意選択で、制御プレーンは、遅延例外の数、パケット損失例外の数、ジッタ例外の数、帯域幅例外の数、伝送レート例外の数、ビット誤り例外の数、および誤りパケット例外の数のうちの少なくとも1つを制御管理デバイスに送信する。
ネットワーク性能例外の数を報告するための機会またはトリガ条件は、具体的には複数のケースを含む。以下では、説明のための例としてケースaおよびケースbを使用する。
ケースa:制御プレーンは、第2の時間周期に基づいてネットワーク性能例外の数を報告する。言い換えれば、制御プレーンは、第2の時間周期ごとに1回、ネットワーク性能例外の数を制御管理デバイスに送信する。任意選択で、ケースaでは、ネットワーク性能例外の数の報告は、アラームの報告に依存しない。例えば、第2の時間周期におけるネットワーク性能例外の数が第1の閾値よりも大きい、小さい、または等しいとき、制御プレーンは、第2の時間周期においてネットワーク性能例外の数を報告する。
ケースb:制御プレーンは、アラームを報告するときにネットワーク性能例外の数を報告する。言い換えれば、制御プレーンが、第2の時間周期におけるネットワーク性能例外の数が第1の閾値より大きいと判定したとき、制御プレーンは、第2の時間周期におけるアラームおよびネットワーク性能例外の数を制御管理デバイスに送信する。
S205.第2の時間周期の後の複数の連続する第2の時間周期におけるネットワーク性能例外の数が第1の閾値未満である場合、制御プレーンはアラームをキャンセルする。
任意選択で、制御プレーンはアラームキャンセル機能をサポートする。具体的には、制御プレーンが、第2の時間周期におけるネットワーク性能例外の数が第1の閾値より大きいと判定し、アラームを生成した後、転送プレーンは、第1の時間周期に基づいてネットワーク性能データをサンプリングし続け、ネットワーク性能例外の数を記録し続ける。制御プレーンは、転送プレーンによって記録されたネットワーク性能例外の数に基づいて、第2の時間周期の後の各第2の時間周期におけるネットワーク性能例外の数が第1の閾値未満であるかどうかを判定し続ける。ネットワーク性能例外が発生する第2の時間周期の後の複数の連続する第2の時間周期におけるネットワーク性能例外の数がすべて第1の閾値未満である場合、制御プレーンはアラームをキャンセルする。任意選択で、アラームをキャンセルする方法は、アラームが消失したことを示す通知メッセージを制御管理デバイスに送信することである。例えば、第2の時間周期は文字Tによって表される。制御プレーンが周期TiにおいてアラームAlamnを報告した後、周期Tiの後に周期Ti+1から周期Ti+NまでのN個の連続する周期において記録されたネットワーク性能例外の数がすべて閾値Alam-num未満である場合、制御プレーンはアラームAlamnが消失したことを報告する。任意選択で、Nは、ユーザがネットワーク性能監視機能を有効にするときにユーザによって事前設定されるか、またはNはデフォルト値である。例えば、Nは3である。アラームを報告した後、制御プレーンは、複数の連続する周期におけるネットワーク性能例外の数に基づいてアラームをキャンセルし、その結果、生成されたアラームの長期的な残留を回避することができる。加えて、アラームをキャンセルすることによって、制御プレーンは、ネットワーク性能が正常であり、ネットワーク性能例外を引き起こす障害が修正されたことをキャリアに通知することができる。S205は任意選択のステップであることを理解されたい。いくつかの他の実施形態では、制御プレーンはS205を実行しない。
本実施形態で提供される方法によれば、転送プレーンは、きめ細かい時間周期に基づいてネットワーク性能データをサンプリングし、ネットワーク性能例外の数を記録し、制御プレーンは、大まかな時間周期に基づいて、転送プレーンによって記録されたネットワーク性能例外の数が閾値よりも大きいときにアラームを生成する。ネットワーク性能監視に関するきめ細かい要件を満たすことに基づいて、制御プレーンは収集されたすべてのネットワーク性能データを報告する必要がないので、制御プレーンによって報告される必要があるデータの量は大幅に削減される。これにより、大量のデータ報告によって引き起こされる主制御CPUの過負荷の問題が解決され、ネットワーク性能監視がデバイスの主制御CPUの性能に依存することが低減される。これにより、大量のデータ報告のために大量の帯域幅リソースが占有されるという問題がさらに解決され、ネットワーク性能監視の帯域幅リソースへの依存が低減され、ライブネットワークに大量の性能監視ノードを展開するための要件を満たすのに役立つ。
上記は、本出願の実施形態における方法200を説明し、以下は、本出願の実施形態におけるネットワークデバイスを説明する。以下に説明するネットワークデバイスは、前述の方法200における転送プレーンおよび制御プレーンの任意の機能を有することを理解されたい。
図3は、本出願の一実施形態によるネットワークデバイス300の構造の概略図である。図3に示すように、ネットワークデバイス300は、S201のサンプリングステップを実行するように構成されたサンプリングモジュール301と、S201の記録ステップを実行するように構成された記録モジュール302と、S202を実行するように構成された判定モジュール303と、S203を実行するように構成された生成モジュール304と、を含む。
任意選択で、ネットワークデバイス300は、S204を実行するように構成された送信モジュールをさらに含む。
任意選択で、ネットワークデバイス300は、S205を実行するように構成されたキャンセリングモジュールをさらに含む。
サンプリングモジュール301および記録モジュール302は、前述の方法200の転送プレーンに対応し、サンプリングモジュール301および記録モジュール302は、方法200の転送プレーンによって実施される様々なステップおよび方法を実施するように構成されることを理解されたい。言い換えれば、サンプリングモジュール301および記録モジュール302は、前述の転送プレーンと同じ概念に属する。サンプリングモジュール301および記録モジュール302の具体的な実施プロセスについては、方法200の転送プレーンに対応する手順を参照されたい。ここでは詳細を繰り返さない。
判定モジュール303、生成モジュール304、送信モジュール、およびキャンセリングモジュールは、前述の方法200の制御プレーンに対応し、判定モジュール303、生成モジュール304、送信モジュール、およびキャンセリングモジュールは、方法200の制御プレーンによって実施される様々なステップおよび方法を実施するように構成されることを理解されたい。言い換えれば、判定モジュール303、生成モジュール304、送信モジュール、およびキャンセリングモジュールは、前述の制御プレーンと同じ概念に属する。判定モジュール303、生成モジュール304、送信モジュール、およびキャンセリングモジュールの具体的な実装プロセスについては、方法200の制御プレーンに対応する手順を参照されたい。ここでは詳細を繰り返さない。
ネットワークデバイス300内の各機能モジュールは、ソフトウェアを使用して実装されることを理解されたい。例えば、サンプリングモジュール301および記録モジュール302は、転送プレーンのプロセッサがプログラムコードを読み取った後に生成される仮想モジュールである。判定モジュール303、生成モジュール304、送信モジュール、およびキャンセリングモジュールは、制御プレーンのプロセッサがプログラムコードを読み取った後に生成される仮想モジュールである。
ネットワークデバイス300がネットワーク性能を監視するとき、前述の機能モジュールの分割は単に説明のための例として使用されるにすぎないことを理解されたい。実際の実装では、前述の機能は、異なるモジュールに割り当てられ、要件に従って実装され得る。言い換えれば、転送プレーンと制御プレーンの内部構造は、上述した機能の全部または一部を実施するために異なる機能モジュールに分割される。
本出願で提供される方法実施形態および仮想装置実施形態に対応して、本出願の一実施形態は、ネットワークデバイス400をさらに提供する。次に、ネットワークデバイス400のハードウェア構成について説明する。
ネットワークデバイス400は、前述の方法200における転送プレーンおよび制御プレーンに対応する。ネットワークデバイス400のハードウェア、モジュール、ならびに上記の他の動作および/または機能は、方法200において転送プレーンおよび制御プレーンによって実施される様々なステップおよび方法を実施するために別々に使用される。ネットワークデバイス400がネットワーク性能をどのように監視するかに関する具体的な手順については、前述の方法200を参照されたい。簡潔にするため、ここでは詳細を再度説明しない。方法200のステップは、ネットワークデバイス400のプロセッサ内のハードウェアの集積論理回路またはソフトウェアの形態の命令を使用して完了される。本出願の実施形態に関連して開示された方法のステップは、ハードウェアプロセッサによって直接実行されてもよく、またはプロセッサ内のハードウェアとソフトウェアモジュールとの組み合わせを使用して実行されてもよい。ソフトウェアモジュールは当技術の成熟した記憶媒体に、例えば、ランダムアクセスメモリ、フラッシュメモリ、読み取り専用メモリ、プログラム可能読み取り専用メモリ、電気的消去可能プログラム可能メモリ、またはレジスタに、配置されてよい。記憶媒体は、メモリ内に配置され、プロセッサは、メモリ内の情報を読み出し、プロセッサのハードウェアと共に前述の方法におけるステップを遂行する。繰り返しを避けるため、ここでは詳細を再度説明しない。
ネットワークデバイス400は、前述の仮想装置の実施形態におけるネットワークデバイス300に対応し、ネットワークデバイス300内の各機能モジュールは、ネットワークデバイス400のソフトウェアを使用して実装される。言い換えれば、ネットワークデバイス300に含まれる機能モジュールは、ネットワークデバイス400のプロセッサがメモリに記憶されたプログラムコードを読み取った後に生成される。
図4は、本出願の例示的な実施形態によるネットワークデバイスの構造の概略図である。ネットワークデバイス400は、主制御基板410とインターフェース基板430とを含む。
主制御基板は、主処理ユニット(main processing unit、MPU)またはルートプロセッサカード(route processor card)とも呼ばれる。主制御基板410は、経路計算、デバイス管理、デバイスメンテナンス、およびプロトコルベースの処理を含む、ネットワークデバイス400内の構成要素を制御および管理するように構成される。主制御基板410は、中央処理装置411およびメモリ412を含む。
インターフェース基板430は、ライン処理ユニット(line processing unit、LPU)、ラインカード(line card)、またはサービス基板とも称される。インターフェース基板430は、種々のサービスインターフェースを提供し、データパケットを転送するように構成される。サービスインターフェースは、イーサネットインターフェース、POS(Packet over SONET/SDH)インターフェースなどを含むが、これらに限定されない。イーサネットインターフェースは、例えば、フレキシブルイーサネットサービスインターフェース(Flexible Ethernet Clients、FlexE Clients)である。インターフェース基板430は、中央処理装置431と、ネットワークプロセッサ432と、転送エントリメモリ434と、物理インターフェースカード(physical interface card、PIC)433とを含む。
インターフェース基板430上の中央処理装置431は、インターフェース基板430を制御および管理し、主制御基板410上の中央処理装置411と通信するように構成される。
ネットワークプロセッサ432は、パケットを転送するように構成される。ネットワークプロセッサ432の形態は、転送チップであってもよい。具体的には、ネットワークプロセッサ432は、転送エントリメモリ434に格納された転送テーブルに基づいて、受信したパケットを転送するように構成される。パケットの宛先アドレスがネットワークデバイス400のアドレスである場合、ネットワークプロセッサ432は、処理のためにパケットをCPU(例えば、中央処理装置411)に送信する。パケットの宛先アドレスがネットワークデバイス400のアドレスでない場合、ネットワークプロセッサ432は、宛先アドレスに基づいて、転送テーブル内の宛先アドレスに対応する次のホップおよびアウトバウンドインターフェースを検索し、宛先アドレスに対応するアウトバウンドインターフェースにパケットを転送する。アップリンクパケット上の処理は、パケットインバウンドインターフェースにおける処理および転送テーブル検索を含む。ダウンリンクパケットに対する処理は、転送テーブル検索などを含む。
物理インターフェースカード433は、物理層相互接続機能を実装するように構成される。元のトラフィックは物理インターフェースカード433からインターフェース基板430に入り、処理されたパケットは物理インターフェースカード433から送出される。サブカードとも呼ばれる物理インターフェースカード433は、インターフェース基板430上に設置されてもよく、光/電信号をパケットに変換し、パケットに対して有効性チェックを実行し、処理のためにパケットをネットワークプロセッサ432に転送する役割を果たす。いくつかの実施形態では、中央処理装置はまた、ネットワークプロセッサ432の機能を実行してもよく、例えば、汎用CPUに基づいてソフトウェア転送を実施してもよい。したがって、物理インターフェースカード433には、ネットワークプロセッサ432は不要である。
任意選択で、ネットワークデバイス400は、複数のインターフェース基板を含む。例えば、ネットワークデバイス400は、インターフェース基板440をさらに含み、インターフェース基板440は、中央処理装置441、ネットワークプロセッサ442、転送エントリメモリ444、および物理インターフェースカード443を含む。
任意選択で、ネットワークデバイス400は、スイッチング基板420をさらに含む。スイッチング基板420は、スイッチファブリックユニット(switch fabric unit、SFU)と呼ばれてもよい。ネットワークデバイスが複数のインターフェース基板430を有するとき、スイッチング基板420は、インターフェース基板間のデータ交換を完了するように構成される。例えば、インターフェース基板430およびインターフェース基板440は、スイッチング基板420を介して互いに通信してもよい。
主制御基板410は、インターフェース基板430に接続される。例えば、主制御基板410、インターフェース基板430、インターフェース基板440、およびスイッチング基板420は、システムバスを介してシステムバックプレーンに接続され、インターワーキングを実現する。可能な実装形態では、プロセス間通信(inter-process communication、IPC)チャネルが主制御基板410とインターフェース基板430との間に確立され、主制御基板410とインターフェース基板430はIPCチャネルを介して互いに通信する。
論理的には、ネットワークデバイス400は、制御プレーンおよび転送プレーンを含む。制御プレーンは、主制御基板410および中央処理装置431を含む。転送プレーンは、転送に使用される構成要素、例えば、転送エントリメモリ434、物理インターフェースカード433、およびネットワークプロセッサ432を含む。制御プレーンは、ルーティング、転送テーブルの生成、シグナリングおよびプロトコルパケットの処理、ならびにデバイス状況の構成および維持などの機能を実行する。制御プレーンは、生成された転送テーブルを転送プレーンに配信する。転送プレーンでは、ネットワークプロセッサ432は、物理インターフェースカード433によって受信されたパケットを転送するために、制御プレーンによって配信された転送テーブルを検索する。制御プレーンによって配信された転送テーブルは、転送エントリメモリ434に格納されてもよい。
方法200を実施するプロセスにおいて、インターフェース基板430またはインターフェース基板440は、転送プレーンに対応するステップを実行するように構成される。例えば、ネットワーク性能の監視対象は物理ポートである。物理インターフェースカード433は、第1の時間周期に基づいて物理インターフェースカード433内の物理ポートのネットワーク性能データをサンプリングし、ネットワーク性能例外の数を記録し、ネットワーク性能例外の数を転送エントリメモリ434に格納する。例えば、ネットワーク性能の監視対象はトンネルである。ネットワークプロセッサ432は、第1の時間周期に基づいてトンネルのネットワーク性能データをサンプリングし、ネットワーク性能例外の数を記録し、ネットワーク性能例外の数を転送エントリメモリ434に格納する。
方法200を実施するプロセスにおいて、主制御基板410は、制御プレーンに対応するステップを実行するように構成される。例えば、中央処理装置431は、転送エントリメモリ434からネットワーク性能例外の数を読み取り、第2の時間周期におけるネットワーク性能例外の数が第1の閾値より大きいと判定し、中央処理装置431はアラームを生成する。
ネットワークデバイス300内のサンプリングモジュール301および記録モジュール302は、ネットワークデバイス400内のインターフェース基板430またはインターフェース基板440と等価であり、ネットワークデバイス300内の判定モジュール303、生成モジュール304、送信モジュール、およびキャンセリングモジュールは、主制御基板410と同等であってもよいことを理解されたい。
インターフェース基板440上の動作は、本出願のこの実施形態におけるインターフェース基板430上の動作と一致することを理解されたい。簡潔にするために、詳細は再度説明されない。
1つまたは複数の主制御基板があってもよく、複数の主制御基板があるとき、主制御基板は、一次主制御基板および二次主制御基板を含んでもよいことに留意されたい。1つまたは複数のインターフェース基板があってもよく、より強いデータ処理能力を有するネットワークデバイスは、より多くのインターフェース基板を提供する。インターフェース基板上には1つまたは複数の物理インターフェースカードがあってよい。スイッチング基板はなくてもよく、1つまたは複数のスイッチング基板があってもよい。複数のスイッチング基板が存在するとき、負荷分散および冗長バックアップが一緒に実施されてもよい。集中型転送アーキテクチャでは、ネットワークデバイスはスイッチング基板を必要としなくてもよく、インターフェース基板は、システム全体においてサービスデータを処理する機能を提供する。分散転送アーキテクチャでは、ネットワークデバイスは少なくとも1つのスイッチング基板を有してもよく、大容量データ交換および処理能力を提供するために、複数のインターフェース基板間のデータ交換はスイッチング基板を使用して実施される。したがって、分散アーキテクチャにおけるネットワークデバイスのデータアクセスおよび処理能力は、集中アーキテクチャにおけるデバイスのデータアクセスおよび処理能力よりも優れている。任意選択で、ネットワークデバイスは、代替として、カードが1つしかない形態であってもよい。具体的には、スイッチング基板はなく、インターフェース基板および主制御基板の機能がカード上に統合される。この場合、インターフェース基板上の中央処理装置と主制御基板上の中央処理装置とが組み合わされてカード上に1つの中央処理装置を形成し、2つの中央処理装置を組み合わせた機能を実行し得る。この形態のデバイス(例えば、ローエンドスイッチまたはルータなどのネットワークデバイス)は、弱いデータ交換および処理能力を有する。使用される特定のアーキテクチャは、特定のネットワーキング展開シナリオに依存する。これは、本明細書では限定されない。
いくつかの可能な実施形態では、転送プレーンおよび制御プレーンは、代替的に、コンピュータプログラム製品を使用して実装されてもよい。具体的には、本出願の一実施形態は、コンピュータプログラム製品を提供する。コンピュータプログラム製品がネットワークデバイス上で実行されると、ネットワークデバイスの転送プレーンおよび制御プレーンは、前述の方法200のネットワーク性能監視方法を別々に実行することが可能になる。
前述の様々な製品形態における転送プレーンおよび制御プレーンはそれぞれ、前述の方法200における転送プレーンおよび制御プレーンの任意の機能を有することを理解されたい。ここでは詳細を繰り返さない。
当業者であれば、本明細書で開示された実施形態に説明された例と組み合わせて、方法のステップおよびユニットが、電子ハードウェア、コンピュータソフトウェア、またはそれらの組み合わせによってされ実装され得ることを認識することができる。ハードウェアとソフトウェアとの間の互換性を明確に説明するために、上記では、機能に従って各実施形態のステップおよび構成を一般的に説明した。機能がハードウェアによって実行されるか、またはソフトウェアによって実行されるかは、技術的解決策の特定の用途および設計制約条件に依存する。当業者は、特定の用途ごとに記載された機能を実装するために様々な方法を使用することができるが、その実装形態が本出願の範囲を超えると考えられるべきではない。
説明を簡便にする目的で、前述のシステム、装置、およびユニットの詳しい作業プロセスについては、前述の方法の実施形態における対応するプロセスを参照するべきことは、当業者によって明確に理解されよう。ここでは詳細を繰り返さない。
本出願において提供されるいくつかの実施形態においては、開示のシステム、装置、および方法が他のやり方で実装されてもよいことを理解されたい。例えば、前述の装置の実施形態は例にすぎない。例えば、ユニットの分割は、論理的な機能の分割にすぎず、実際の実施時には他の分割であってもよい。例えば、複数のユニットまたは構成要素が組み合わされるか、または別のシステムに統合されてもよく、またはいくつかの特徴は無視されてよく、または実行されなくてもよい。加えて、表示または説明された相互接続または直接接続または通信接続は、いくつかのインターフェースを介して実装されてもよい。装置間またはユニット間の間接的接続または通信接続は、電気的形態、機械的形態、またはその他の形態で実装されてもよい。
別々の部分として説明されたユニットは、物理的に別個であってもなくてもよく、また、ユニットとして表示された部分は、物理的なユニットであってもなくてもよく、一箇所に配置されていてもよく、複数のネットワークユニット上に分散されていてもよい。ユニットの一部または全部は、本出願の実施形態における解決策の目的を達成するための実際の要件に基づいて選択されてもよい。
加えて、本出願の実施形態における機能ユニットは、1つの処理ユニットに統合されてもよく、ユニットの各々は物理的に単独で存在してもよく、または2つ以上のユニットが1つのユニットに統合される。統合ユニットは、ハードウェアの形態で実装されてもよく、またはソフトウェア機能ユニットの形態で実装されてもよい。
統合ユニットがソフトウェア機能ユニットの形態で実装されて独立した製品として販売または使用されるときには、統合ユニットがコンピュータ可読記憶媒体に格納されてもよい。そのような理解に基づき、本出願の技術的解決策が本質的に、または従来技術に寄与する部分が、または技術的解決策の全部もしくは一部が、ソフトウェア製品の形態で実装されてもよい。コンピュータソフトウェア製品は、記憶媒体に格納され、コンピュータデバイス(パーソナルコンピュータ、サーバ、ネットワークデバイスなどであってもよい)に、本出願の実施形態で説明されている方法のステップのすべてまたは一部を実行するように指示するためのいくつかの命令を含む。前述の記憶媒体は、USBフラッシュドライブ、リムーバブルハードディスク、読み取り専用メモリ(read-only memory、ROM)、ランダムアクセスメモリ(random access memory、RAM)、磁気ディスク、または光ディスクなど、プログラムコードを格納することができる任意の媒体を含む。
前述の説明は、本出願の特定の実施態様にすぎず、本出願の保護範囲を限定することを意図されていない。本出願で開示された技術範囲内で当業者により容易に想到される均等な修正例または置換例は、本願の保護範囲内に含まれるものとする。したがって、本出願の保護範囲は、特許請求の範囲の保護範囲に従うものとする。
前述の実施形態のすべてまたは一部は、ソフトウェア、ハードウェア、ファームウェア、またはそれらの任意の組み合わせによって実装され得る。ソフトウェアが実施形態を実施するために使用されるとき、実施形態のすべてまたは一部は、コンピュータプログラム製品の形態で実施されてもよい。コンピュータプログラム製品は、1つまたは複数のコンピュータプログラム命令を含む。コンピュータプログラム命令がコンピュータ上でロードされて実行されるとき、本出願の実施形態による手順または機能の全部または一部が生成される。コンピュータは、汎用コンピュータ、専用コンピュータ、コンピュータネットワーク、または他のプログラマブル装置であってもよい。コンピュータ命令はコンピュータ可読記憶媒体に格納されてもよいし、コンピュータ可読記憶媒体から別のコンピュータ可読記憶媒体に伝送されてもよい。例えば、コンピュータプログラム命令は、ウェブサイト、コンピュータ、サーバ、またはデータセンタから別のウェブサイト、コンピュータ、サーバ、またはデータセンタに有線または無線で伝送されてもよい。コンピュータ可読記憶媒体は、コンピュータによってアクセス可能な任意の使用可能媒体、または1つもしくは複数の使用可能媒体を統合するサーバもしくはデータセンタなどのデータ記憶デバイスであってもよい。使用可能な媒体は、磁気媒体(例えば、フロッピーディスク、ハードディスク、または磁気テープ)、光学媒体(例えば、デジタルビデオディスク(digital video disc、DVD))、半導体媒体(例えば、ソリッドステートドライブ)などであってもよい。
当業者は、実施形態のステップの全部または一部がハードウェア、または関連するハードウェアに命令するプログラムによって実施され得ることを理解し得る。プログラムは、コンピュータ可読記憶媒体に格納されてもよい。記憶媒体は、読み取り専用メモリ、磁気ディスク、または光ディスクを含んでもよい。
本出願では、「第1」および「第2」などの用語は、基本的に同じ機能を有する同じ項目または類似の項目を区別するために使用される。「第1」と「第2」との間に論理的または時間的順序の依存関係はなく、数量および実行順序が限定されないことを理解されたい。以下の説明では、「第1」および「第2」などの用語を使用して様々な要素を説明するが、これらの要素はこれらの用語によって限定されるべきではないことをさらに理解されたい。これらの用語は、単に1つの要素を別の要素と区別するために使用される。例えば、様々な例の範囲から逸脱することなく、第1の閾値が第2の閾値と呼ばれてもよく、同様に、第2の閾値が第1の閾値と呼ばれてもよい。第1の閾値および第2の閾値は両方とも閾値であってもよく、場合によっては別々の異なる閾値であってもよい。
本出願において、「少なくとも1つ」という用語は1つまたは複数を意味し、「複数」という用語は2つ以上を意味する。例えば、複数の第2のパケットとは、2つ以上の第2のパケットを意味する。「システム」および「ネットワーク」という用語は、本明細書では互換的に使用され得る。
用語「の場合(if)」は、「のとき」(「when」または「upon」)、「との判定に応じて(in response to determining)」または「の検出に応じて(in response to detecting)」という意味に解釈される場合があることをさらに理解されたい。同様に、文脈に応じて、「と判定される場合(if it is determined that)」または「(記載されている条件もしくは事象)が検出される場合(if(a stated condition or event)is detected)」という表現は、「と判定されるとき(when it is determined that)」、または「との判定に応じて(in response to determining)」、または「(記載されている条件もしくは事象)が検出されるとき(when(a stated condition or event)is detected)」または「(記載されている条件もしくは事象)の検出に応じて(in response to detecting(a stated condition or event))」という意味に解釈される場合がある。
前述の説明は、本出願の単なる所望による実施形態であり、本出願を限定することを意図するものではない。本出願の趣旨および原理から逸脱することなく行われるいかなる修正、同等の置換、または改善も、本出願の保護範囲内に入るものとする。
100 システムアーキテクチャ
101 アクセスネットワークデバイス
102 アグリゲーションネットワークデバイス
103 アグリゲーションネットワークデバイス
104 バックボーンアグリゲーションネットワークデバイス
105 バックボーンアグリゲーションネットワークデバイス
106 コアネットワークデバイス
107 コアネットワークデバイス
110 運用支援システム(OSS)
200 ネットワーク性能監視方法
300 ネットワークデバイス
301 サンプリングモジュール
302 記録モジュール
303 判定モジュール
304 生成モジュール
400 ネットワークデバイス
410 主制御基板
411 中央処理装置
412 メモリ
420 スイッチング基板
430 インターフェース基板
431 中央処理装置
432 ネットワークプロセッサ
433 物理インターフェースカード
434 転送エントリメモリ
440 インターフェース基板
441 中央処理装置
442 ネットワークプロセッサ
443 物理インターフェースカード
444 転送エントリメモリ

Claims (24)

  1. ネットワーク性能監視方法であって、
    転送プレーンにより、第1の時間周期に基づいてネットワーク性能データをサンプリングし、ネットワーク性能例外の数を記録するステップであって、各サンプリングによって取得されたネットワーク性能データが事前設定条件を満たすとき、1つのネットワーク性能例外が記録され、前記第1の時間周期は、前記転送プレーンが前記ネットワーク性能データを収集するサンプリング周期である、ステップと、
    制御プレーンにより、第2の時間周期におけるネットワーク性能例外の数が第1の閾値よりも大きいと判定するステップであって、前記第2の時間周期の持続時間は前記第1の時間周期の持続時間よりも長い、ステップと、
    前記制御プレーンにより、アラームを生成するステップと
    を含む、方法。
  2. 前記第1の時間周期がミリ秒単位であり、前記第2の時間周期が少なくとも秒単位である、請求項1に記載の方法。
  3. 前記事前設定条件が、
    各サンプリングによって取得された前記ネットワーク性能データの値が第2の閾値以上であること
    を含む、請求項1または2に記載の方法。
  4. 転送プレーンにより、ネットワーク性能例外の数を記録する前記ステップが、
    複数の例外レベルの各例外レベルに対応するネットワーク性能例外の数を記録するステップであって、前記複数の例外レベルは複数の事前設定条件にそれぞれ対応し、各サンプリングによって取得された前記ネットワーク性能データが例外レベルに対応する事前設定条件を満たすとき、前記例外レベルに対応する1つのネットワーク性能例外が記録される、ステップ
    を含む、請求項1から3のいずれか一項に記載の方法。
  5. 制御プレーンにより、第2の時間周期におけるネットワーク性能例外の数が第1の閾値よりも大きいと判定する前記ステップが、
    前記制御プレーンにより、前記第2の時間周期における前記複数の例外レベルに対応するネットワーク性能例外の数がすべて前記第1の閾値よりも大きいと判定するステップ
    を含み、
    前記制御プレーンにより、アラームを生成する前記ステップが、
    前記制御プレーンにより、前記複数の例外レベルの中で最も高い例外レベルを示すアラーム情報を生成するステップ
    を含む、請求項4に記載の方法。
  6. 前記例外レベルに対応する前記事前設定条件が、
    各サンプリングによって取得された前記ネットワーク性能データの値が前記例外レベルに対応する第3の閾値以上であることであって、より高い例外レベルは前記例外レベルに対応するより高い第3の閾値を示す、こと
    を含む、請求項4または5に記載の方法。
  7. 前記ネットワーク性能データが、遅延、パケット損失、ジッタ、帯域幅、伝送レート、ビット誤り、および誤りパケットのうちの少なくとも1つを含む、請求項1に記載の方法。
  8. 前記方法が、
    前記転送プレーンにより、各サンプリングによって取得された前記ネットワーク性能データに基づいて前記第2の時間周期におけるネットワーク性能パラメータを決定するステップと、
    前記制御プレーンにより、前記ネットワーク性能パラメータを取得するステップと
    をさらに含む、請求項7に記載の方法。
  9. 前記ネットワーク性能パラメータが、最大遅延、最小遅延、平均遅延、パケット損失率、ジッタ、帯域幅、伝送レート、ビット誤り率、およびパケット誤り率のうちの少なくとも1つを含む、請求項8に記載の方法。
  10. 前記制御プレーンにより、アラームを生成する前記ステップの後に、前記方法が、
    前記制御プレーンにより、前記アラームを制御管理デバイスに送信するステップ
    をさらに含む、請求項1に記載の方法。
  11. 前記制御プレーンにより、前記アラームを制御管理デバイスに送信する前記ステップの後に、前記方法が、
    前記第2の時間周期の後の複数の連続する第2の時間周期におけるネットワーク性能例外の数がすべて前記第1の閾値未満である場合、前記制御プレーンにより、前記アラームをキャンセルするステップ
    をさらに含む、請求項10に記載の方法。
  12. ネットワークデバイスであって、
    第1の時間周期に基づいてネットワーク性能データをサンプリングするように構成されたサンプリングモジュールであって、前記第1の時間周期は、前記ネットワーク性能データが収集されるサンプリング周期である、サンプリングモジュールと、
    ネットワーク性能例外の数を記録するように構成された記録モジュールであって、各サンプリングによって取得されたネットワーク性能データが事前設定条件を満たすとき、1つのネットワーク性能例外が記録される、記録モジュールと、
    第2の時間周期におけるネットワーク性能例外の数が第1の閾値よりも大きいと判定するように構成された判定モジュールであって、前記第2の時間周期の持続時間は前記第1の時間周期の持続時間よりも長い、判定モジュールと、
    アラームを生成するように構成された生成モジュールと
    を備える、デバイス。
  13. 前記第1の時間周期がミリ秒単位であり、前記第2の時間周期が少なくとも秒単位である、請求項12に記載のデバイス。
  14. 前記事前設定条件が、
    各サンプリングによって取得された前記ネットワーク性能データの値が第2の閾値以上であること
    を含む、請求項12または13に記載のデバイス。
  15. 前記記録モジュールが、複数の例外レベルの各例外レベルに対応するネットワーク性能例外の数を記録するように構成され、前記複数の例外レベルは複数の事前設定条件にそれぞれ対応し、各サンプリングによって取得された前記ネットワーク性能データが例外レベルに対応する事前設定条件を満たすとき、前記例外レベルに対応する1つのネットワーク性能例外が記録される、請求項12から14のいずれか一項に記載のデバイス。
  16. 前記判定モジュールが、前記第2の時間周期における前記複数の例外レベルに対応するネットワーク性能例外の数がすべて前記第1の閾値よりも大きいと判定するように構成され、
    前記生成モジュールが、前記複数の例外レベルの中で最も高い例外レベルを示すアラーム情報を生成するように構成される、請求項15に記載のデバイス。
  17. 前記例外レベルに対応する前記事前設定条件が、
    各サンプリングによって取得された前記ネットワーク性能データの値が前記例外レベルに対応する第3の閾値以上であることであって、より高い例外レベルは前記例外レベルに対応するより高い第3の閾値を示す、こと
    を含む、請求項15または16に記載のデバイス。
  18. 前記ネットワーク性能データが、遅延、パケット損失、ジッタ、帯域幅、伝送レート、ビット誤り、および誤りパケットのうちの少なくとも1つを含む、請求項12に記載のデバイス。
  19. 前記判定モジュールが、各サンプリングによって取得された前記ネットワーク性能データに基づいて前記第2の時間周期におけるネットワーク性能パラメータを決定するようにさらに構成される、請求項18に記載のデバイス。
  20. 前記ネットワーク性能パラメータが、最大遅延、最小遅延、平均遅延、パケット損失率、ジッタ、帯域幅、伝送レート、ビット誤り率、およびパケット誤り率のうちの少なくとも1つを含む、請求項19に記載のデバイス。
  21. 前記デバイスが、
    前記アラームを制御管理デバイスに送信するように構成された送信モジュール
    をさらに備える、請求項12に記載のデバイス。
  22. 前記デバイスが、
    前記第2の時間周期の後の複数の連続する第2の時間周期におけるネットワーク性能例外の数がすべて前記第1の閾値未満である場合に、前記アラームをキャンセルするように構成されたキャンセリングモジュール
    をさらに備える、請求項21に記載のデバイス。
  23. ネットワークデバイスであって、前記ネットワークデバイスは、主制御基板およびインターフェース基板を備え、前記主制御基板は、第1のプロセッサを備え、前記第1のプロセッサは、命令を実行して、請求項1から11のいずれか一項に記載の方法における制御プレーンに対応するステップを実行するように構成され、前記インターフェース基板は、第2のプロセッサを備え、前記第2のプロセッサは、命令を実行して、請求項1から11のいずれか一項に記載の方法における転送プレーンに対応するステップを実行するように構成される、ネットワークデバイス。
  24. コンピュータ可読記憶媒体であって、前記コンピュータ可読記憶媒体は少なくとも1つの命令を格納し、前記命令がプロセッサによって読み取られ、その結果、転送プレーンおよび制御プレーンが請求項1から11のいずれか一項に記載の方法を実行する、コンピュータ可読記憶媒体。
JP2022566251A 2020-04-29 2021-04-07 ネットワーク性能監視方法、ネットワークデバイス、および記憶媒体 Active JP7500770B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010359259.0 2020-04-29
CN202010359259.0A CN113572654B (zh) 2020-04-29 2020-04-29 网络性能监控方法、网络设备及存储介质
PCT/CN2021/085816 WO2021218582A1 (zh) 2020-04-29 2021-04-07 网络性能监控方法、网络设备及存储介质

Publications (2)

Publication Number Publication Date
JP2023523472A true JP2023523472A (ja) 2023-06-05
JP7500770B2 JP7500770B2 (ja) 2024-06-17

Family

ID=78158889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022566251A Active JP7500770B2 (ja) 2020-04-29 2021-04-07 ネットワーク性能監視方法、ネットワークデバイス、および記憶媒体

Country Status (5)

Country Link
US (1) US20230041307A1 (ja)
EP (1) EP4131856A4 (ja)
JP (1) JP7500770B2 (ja)
CN (1) CN113572654B (ja)
WO (1) WO2021218582A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115567424A (zh) * 2022-06-22 2023-01-03 中国电信股份有限公司 网络监控方法及系统、计算机可存储介质
CN115174358B (zh) * 2022-09-08 2023-01-17 浪潮电子信息产业股份有限公司 存储集群接口的监测处理方法、系统、设备及存储介质
CN116390155B (zh) * 2023-06-02 2023-08-25 新华三技术有限公司 一种报文收发控制方法、装置、电子设备及存储介质
CN116501551B (zh) * 2023-06-21 2023-09-15 山东远桥信息科技有限公司 一种数据告警产生及恢复处理方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7870243B1 (en) * 2000-04-11 2011-01-11 International Business Machines Corporation Method, system and program product for managing network performance
US7434109B1 (en) 2002-09-26 2008-10-07 Computer Associates Think, Inc. Network fault manager for maintaining alarm conditions
US8477648B2 (en) * 2010-02-16 2013-07-02 Vss Monitoring, Inc. Systems, apparatus, and methods for monitoring network capacity
US10558544B2 (en) * 2011-02-14 2020-02-11 International Business Machines Corporation Multiple modeling paradigm for predictive analytics
US9692775B2 (en) * 2013-04-29 2017-06-27 Telefonaktiebolaget Lm Ericsson (Publ) Method and system to dynamically detect traffic anomalies in a network
CN103259682A (zh) * 2013-05-16 2013-08-21 浪潮通信信息系统有限公司 一种基于多维数据聚合的通信网网元安全评估方法
CN104778111B (zh) * 2014-01-14 2019-03-01 深圳市腾讯计算机系统有限公司 一种进行报警的方法和装置
US10516594B2 (en) * 2014-12-21 2019-12-24 Pismo Labs Technology Limited Systems and methods for changing the frequency of monitoring data
CN106034056B (zh) * 2015-03-18 2020-04-24 北京启明星辰信息安全技术有限公司 一种业务安全分析的方法和系统
US11327737B2 (en) * 2017-04-21 2022-05-10 Johnson Controls Tyco IP Holdings LLP Building management system with cloud management of gateway configurations
CN109392002B (zh) * 2017-08-11 2022-07-12 华为技术有限公司 一种上报网络性能参数的方法及设备
US10673882B2 (en) * 2018-01-15 2020-06-02 International Business Machines Corporation Network flow control of internet of things (IoT) devices
JP2019179395A (ja) * 2018-03-30 2019-10-17 オムロン株式会社 異常検知システム、サポート装置および異常検知方法
CN108768776A (zh) * 2018-05-30 2018-11-06 郑州云海信息技术有限公司 一种基于OpenFlow的网络监控方法及装置
CN109995599A (zh) * 2019-04-28 2019-07-09 武汉烽火技术服务有限公司 一种网络性能异常的智能告警方法

Also Published As

Publication number Publication date
CN113572654A (zh) 2021-10-29
WO2021218582A1 (zh) 2021-11-04
CN113572654B (zh) 2023-11-14
JP7500770B2 (ja) 2024-06-17
EP4131856A4 (en) 2023-09-20
EP4131856A1 (en) 2023-02-08
US20230041307A1 (en) 2023-02-09

Similar Documents

Publication Publication Date Title
JP2023523472A (ja) ネットワーク性能監視方法、ネットワークデバイス、および記憶媒体
US10652078B2 (en) Triggered in-band operations, administration, and maintenance in a network environment
US10601643B2 (en) Troubleshooting method and apparatus using key performance indicator information
JP5643433B2 (ja) プロトコルイベント管理のための方法および装置
CN104798341B (zh) 在电子网络上表征服务水平
EP2866378B1 (en) Protection switching in a packet transport network
EP2681871B1 (en) In-service throughput testing in distributed router/switch architectures
US8619589B2 (en) System and method for removing test packets
JP2006501717A (ja) 電気通信ネットワーク・エレメントの監視
US8634324B2 (en) Method and apparatus for providing signature based predictive maintenance in communication networks
CN106302001B (zh) 数据通信网络中业务故障检测方法、相关装置及系统
JP4464256B2 (ja) ネットワーク上位監視装置
US7958386B2 (en) Method and apparatus for providing a reliable fault management for a network
Senthilkumaran et al. Memory and load-aware traffic rerouting (mltr) in openflow-based sdn
US8571182B2 (en) Systems and methods of masking non-service affecting alarms in a communication system
CN101656621B (zh) 一种告警性能配置方法、系统和网元设备
bin Mohd Shuhaimi et al. The new services in Nagios: Network bandwidth utility, email notification and sms alert in improving the network performance
Kuwabara et al. Adaptive network monitoring system for large-volume streaming services in multi-domain networks
Song et al. Internet router outage measurement: An embedded approach
US20240205141A1 (en) Path Determining Method, Apparatus, Device, and System, and Computer-Readable Storage Medium
JP5475706B2 (ja) 監視装置、通信装置および網監視方法
Lipovac Expert system based network testing
CN111970153A (zh) 基于虚拟网关的故障隔离方法、装置及相关设备
Yang et al. A QoS Approach for Detecting and Managing a Fault Alarm Storm
Huang et al. Network Service Availability Detecting and Reporting System

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221208

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240520

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240605

R150 Certificate of patent or registration of utility model

Ref document number: 7500770

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150