CN113572654A - 网络性能监控方法、网络设备及存储介质 - Google Patents

网络性能监控方法、网络设备及存储介质 Download PDF

Info

Publication number
CN113572654A
CN113572654A CN202010359259.0A CN202010359259A CN113572654A CN 113572654 A CN113572654 A CN 113572654A CN 202010359259 A CN202010359259 A CN 202010359259A CN 113572654 A CN113572654 A CN 113572654A
Authority
CN
China
Prior art keywords
network performance
network
time period
control plane
performance data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010359259.0A
Other languages
English (en)
Other versions
CN113572654B (zh
Inventor
李发远
胡永健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202010359259.0A priority Critical patent/CN113572654B/zh
Priority to EP21796281.0A priority patent/EP4131856A4/en
Priority to JP2022566251A priority patent/JP7500770B2/ja
Priority to PCT/CN2021/085816 priority patent/WO2021218582A1/zh
Publication of CN113572654A publication Critical patent/CN113572654A/zh
Priority to US17/976,491 priority patent/US20230041307A1/en
Application granted granted Critical
Publication of CN113572654B publication Critical patent/CN113572654B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/022Capturing of monitoring data by sampling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/062Generation of reports related to network traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • H04L43/0829Packet loss
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • H04L43/087Jitter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0894Packet rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • H04L43/106Active monitoring, e.g. heartbeat, ping or trace-route using time related information in packets, e.g. by adding timestamps
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • H04L43/0847Transmission error
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/20Arrangements for monitoring or testing data switching networks the monitoring system or the monitored elements being virtualised, abstracted or software-defined entities, e.g. SDN or NFV

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供了一种网络性能监控方法、网络设备及存储介质,属于网络技术领域。本申请中转发面以细粒度的时间周期对网络性能数据进行采样,并记录网络性能异常的次数,通过控制面以粗粒度的时间周期,在转发面记录的网络性能异常的次数大于阈值时生成告警。在满足细粒度对网络性能监控的需求的基础上,由于控制面无需上报采集所有的网络性能数据,因而极大地减少了控制面所需上报的数据量,一方面解决了海量数据上报导致主控CPU过载的问题,减少网络性能监控对设备主控CPU性能的依赖。另一方面解决了海量数据上报导致占用大量带宽资源的问题,减少网络性能监控对带宽资源的依赖,有助于满足现网大量部署性能监控节点的需求。

Description

网络性能监控方法、网络设备及存储介质
技术领域
本申请涉及网络技术领域,特别涉及一种网络性能监控方法、网络设备及存储介质。
背景技术
随着用户对网络性能的要求逐步提高,需要对网络性能进行监控,以便运营商在网络性能下降时及时对网络进行调整。
时下,网络设备会充当网络性能监控节点,在转发数据流的过程中,会按照预先设定的采集周期,周期性采集本端的网络性能数据。每当网络设备采集一次网络性能数据后,网络设备的主控中央处理器(Central Processing Unit,CPU)会将采集的网络性能数据上报至操作支持系统(Operation Support Systems,OSS),以便OSS进行数据分析以及呈现。
采用上述方法时,由于上报的网络性能数据的数据量巨大,对网络设备的主控CPU要求非常高,容易造成网络设备的主控CPU过载。
发明内容
本申请实施例提供了一种网络性能监控方法、网络设备及存储介质,能够减少网络性能的监控过程对主控CPU性能的依赖。所述技术方案如下:
第一方面,提供了一种网络性能监控方法,在该方法中,
转发面基于第一时间周期对网络性能数据进行采样,并记录网络性能异常的次数,其中,每次采样获取的网络性能数据满足预设条件时,记录为一次网络性能异常,所述第一时间周期为所述转发面采集网络性能数据的采样周期;
控制面确定在第二时间周期内所述网络性能异常的次数大于第一阈值;所述第二时间周期的时长大于所述第一时间周期的时长;
所述控制面生成告警。
通过该方法,转发面以细粒度的时间周期对网络性能数据进行采样,并记录网络性能异常的次数,通过控制面以粗粒度的时间周期,在转发面记录的网络性能异常的次数大于阈值时生成告警。在满足细粒度对网络性能监控的需求的基础上,由于控制面无需上报采集所有的网络性能数据,因而极大地减少了控制面所需上报的数据量,一方面解决了海量数据上报导致主控CPU过载的问题,减少网络性能监控对设备主控CPU性能的依赖。另一方面解决了海量数据上报导致占用大量带宽资源的问题,减少网络性能监控对带宽资源的依赖,有助于满足现网大量部署性能监控节点的需求。
可选地,所述第一时间周期的数量级为毫秒级,所述第二时间周期的数量级至少为秒级。
通过这种可选方式,由于转发面基于毫秒级的周期进行网络性能数据的采样和网络性能异常次数的记录,有助于实现毫秒级的性能监控,从而满足客户对毫秒级性能监控的诉求。并且,由于控制面基于至少为秒级的周期来决策告警的生成,能够减少毫秒级性能监控对带宽资源的依赖以及毫秒级性能监控对主控CPU性能的依赖。
可选地,所述预设条件包括:
每次采样获取的网络性能数据的值大于或者等于第二阈值。
通过这种可选方式,转发面通过对网络性能的值和阈值进行比较,即可判定是否记录为一次网络性能异常,实现起来比较简单,因此实用性强。
可选地,所述记录网络性能异常的次数,包括:记录多个异常等级中每个异常等级对应的网络性能异常的次数,所述多个异常等级分别对应多个预设条件,其中,每次采样获取的网络性能数据满足异常等级对应的预设条件时,记录为一次异常等级对应的网络性能异常。
通过这种可选方式,转发面通过分别记录每个异常等级的网络性能异常的次数,从而监控多个异常等级的网络性能,使得网络性能监控的功能更精细化,提高了灵活性。尤其是,在告警携带异常等级的情况下,有助于明确当前出现了哪种异常等级的网络性能异常,从而帮助用户了解当前网络性能异常的严重程度。
可选地,所述控制面确定在第二时间周期内所述网络性能异常的次数大于第一阈值,包括:
所述控制面确定在第二时间周期内所述多个异常等级对应的网络性能异常的次数均大于所述第一阈值;
所述控制面生成告警,包括:
所述控制面生成用于指示所述多个异常等级中最高异常等级的告警信息。
通过这种可选方式,在多个异常等级均满足触发告警的条件时,控制面只需生成最高异常等级的告警信息,而抑制低异常等级的告警信息,从而减少了所需生成的告警信息的数量,避免生成的告警信息过多对用户产生干扰。
可选地,所述异常等级对应的预设条件,包括:每次采样获取的网络性能数据的值大于或者等于所述异常等级对应的第三阈值,所述异常等级越高,所述异常等级对应的第三阈值越高。
通过这种可选方式,由于按照异常等级的高低,为网络性能数据的值分别设置了不同的阈值,使得转发面会为不同取值的网络性能数据分别记录不同异常等级对应的次数,使得网络性能监控的功能更精细化,提高了灵活性。
可选地,所述网络性能数据包括以下或至少一项:时延,丢包,抖动,带宽,传输速率,误码,错包。
通过这种可选方式,有助于明确具体哪一种维度的网络性能出现异常,并且能够支持多种维度的网络性能的监控,使得网络性能的监控更为全面,满足更多的应用场景。
可选地,所述方法还包括:
根据每次采样获取的网络性能数据,所述转发面确定在所述第二时间周期内的网络性能参数;
所述控制面获取所述网络性能参数。
通过这种可选方式,不仅满足了统计网络性能参数的需求,并且由于将统计网络性能参数的任务卸载至转发面上,减少了统计网络性能参数为控制面带来的处理开销。
可选地,所述网络性能参数包括以下至少一项:最大时延;最小时延;平均时延;丢包率;抖动;带宽;传输速率;误码率;以及错包率。
通过这种可选方式,能够满足统计多种维度的网络性能参数的需求,使得网络性能的监控更为全面,满足更多的应用场景。
可选地,所述控制面生成告警之后,所述方法还包括:所述控制面向控制管理设备发送所述告警。
通过这种可选方式,由于控制面向控制管理设备上报告警,能够及时通知运营商网络中出现了性能异常事件,从而有助于运营商及时对网络情况进行调整,因而有助于网络性能异常的问题得到及时解决,从而避免影响用户体验。
可选地,所述控制面向控制管理设备发送所述告警之后,所述方法还包括:
若所述第二时间周期之后的连续多个第二时间周期内所述网络性能异常的次数均小于所述第一阈值,所述控制面取消所述告警。
通过这种可选方式,由于控制面在上报告警之后,根据连续多个周期内的网络性能异常次数取消告警,能够避免已产生的告警长期残留,同时通过取消告警,能够通知运营商网络性能已经正常,引起网络性能异常的故障已经得到恢复。
第二方面,提供了一种网络性能监控方法,在该方法中,
控制面从转发面获取网络性能异常的次数,其中,每次采样获取的网络性能数据满足预设条件时,记录为一次网络性能异常,所述第一时间周期为所述转发面采集网络性能数据的采样周期;
所述控制面确定在第二时间周期内所述网络性能异常的次数大于第一阈值;所述第二时间周期的时长大于所述第一时间周期的时长;
所述控制面生成告警。
第三方面,提供一种网络设备,所述网络设备包括:主控板和接口板,主控板包括用于执行第一方面或第一方面任一种可选方式中控制面对应方法的模块,接口板包括用于执行第一方面或第一方面任一种可选方式中转发面对应方法的模块。
第四方面,提供了一种网络设备,该网络设备包括:主控板和接口板。主控板包括:第一处理器和第一存储器。接口板包括:第二处理器、第二存储器和接口卡。主控板和接口板耦合。
第一存储器可以用于存储程序代码,第一处理器用于调用第一存储器中的程序代码执行如下操作:基于第一时间周期对网络性能数据进行采样,并记录网络性能异常的次数,其中,每次采样获取的网络性能数据满足预设条件时,记录为一次网络性能异常,所述第一时间周期为所述转发面采集网络性能数据的采样周期。
第二存储器可以用于存储程序代码,第二处理器用于调用第二存储器中的程序代码,触发接口卡执行如下操作:确定在第二时间周期内所述网络性能异常的次数大于第一阈值;所述第二时间周期的时长大于所述第一时间周期的时长;生成告警。
在一种可能的实现方式中,主控板和接口板之间建立进程间通信协议(inter-process communication,IPC)通道,主控板和接口板之间通过IPC通道进行通信。
第五方面,提供了一种计算机可读存储介质,该存储介质中存储有至少一条指令,该指令由处理器读取以使转发面和控制面执行上述第一方面或第一方面任一种可选方式所提供的网络性能监控方法。
第六方面,提供了一种计算机程序产品,当该计算机程序产品在网络设备上运行时,使得网络设备的转发面和控制面执行上述第一方面或第一方面任一种可选方式所提供的网络性能监控方法。
第七方面,提供了一种芯片,当该芯片在网络设备上运行时,使得网络设备的转发面和控制面执行上述第一方面或第一方面任一种可选方式所提供的网络性能监控方法。
附图说明
图1是本申请实施例提供的一种系统架构100的示意图;
图2是本申请实施例提供的一种网络性能监控方法200的流程图;
图3是本申请实施例提供的一种网络设备300的结构示意图;
图4是本申请实施例提供的一种网络设备400的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
以下示例性介绍本申请的应用场景。
本申请实施例提供的网络性能监控方法能够应用在毫秒级网络性能监控的场景。下面分别对毫秒级网络性能监控的场景进行简单的介绍。
随着人们生活水平的提高,用户对网络体验效果要求也逐步提高,这就要求运营商对网络性能进行实时的监控,运营商可以根据网络性能及时对网络进行调整,避免由于网络流量不均衡、网络拥塞等网络性能异常的情况造成网络性能下降,导致用户投诉。然而当前实际网络中,网络性能监控都是秒级或分钟级的,由于秒级或分钟级的统计周期过长,经常出现网络性能长期的统计结果表现稳定、但偶尔的瞬时突发流量导致流量超过业务的可保证带宽或链路带宽的情况,进而导致业务会有少量丢包。为了能更好的反映网络的实时流量情况,就需要更精准的毫秒级网络性能监控功能。
目前的毫秒级性能监控方法延用了秒级的性能监控方法,由各个性能监控节点(如设备的转发面)按照毫秒级的采样周期采集网络性能数据,将每次采样的毫秒级网络性能数据实时上报给设备主控,或按一定的周期将每次采样的毫秒级网络性能数据打包上报给设备主控。设备主控通过遥测(Telemetry)或简单网络管理协议(Simple NetworkManagement Protocol,SNMP)把采样的所有网络性能数据通过设备之间的数据通信网(Data Communication Network,DCN)通道或带外DCN通道,上报给OSS,OSS再把网络性能数据分析呈现。
而采用上述方式时,由于是毫秒级的数据采样和上报,网络性能数据的数据量巨大,因此对主控CPU的要求非常高,容易造成CPU过载。并且,由于采集的网络性能数据的数据量巨大,数据上报需要占用大量的DCN带宽资源,导致现网几乎不可能大量部署。
有鉴于此,本申请实施例提供了一种网络性能监控方法,在将采样周期设置为毫秒级的情况下,能够减少毫秒级的网络性能监控对设备主控CPU性能的依赖,同时又能满足客户对毫秒级的网络性能监控的诉求。并且,能够减少毫秒级的网络性能监控对DCN带宽资源的依赖,满足现网大量部署毫秒级性能监控节点的要求。
下面,将从系统架构、方法、虚拟装置、实体装置、介质等多个角度,对本申请实施例提供的技术方案进行描述。
下面介绍本申请实施例提供的系统架构。
参见附图1,本申请实施例提供了一种系统架构100。系统架构100是对网络性能监控系统的举例说明。系统架构100包括至少一个网络设备和控制管理设备。至少一个网络设备中的每个网络设备通过网络(如DCN)与控制管理设备相连。
系统架构100中的网络设备包括而不限于接入网络设备、汇聚网络设备或核心网络设备。网络设备的类型包括多种情况。例如,网络设备包括而不限于是分组传送网(Packet Transport Network,PTN)设备、敏捷传送网(Agile Transport Network,ATN)、光交换网络(Optical Switch Network,OSN)、路由器或交换机;或者,网络设备是其他类型的支持性能监控的设备,例如是支持毫秒级性能监控的设备,本实施例对网络设备的类型不做限定。例如,请参见附图1,网络设备为接入网络设备101、汇聚网络设备102、汇聚网络设备103、骨干汇聚网络设备104、骨干汇聚网络设备105、核心网络设备106或核心网络设备107。其中,系统架构100中的全部或部分网络设备充当性能监控节点,用于执行下述方法200。可选地,系统架构100中的哪些网络设备充当性能监控节点由用户指定。例如,当需要将某台网络设备部署为性能监控节点时,用户使能该网络设备的性能监控功能,则网络设备会在使能指令的触发下,执行下述方法200。
系统架构100中的控制管理设备包括而不限于网管设备或控制器。网管设备例如是附图1中的OSS110。控制器例如是软件定义网络(英文:Software Defined Network,简称:SDN)中的SDN控制器(SDN controller)、网络功能虚拟化(英文:Network FunctionVirtualization,简称:NFV)中的网络功能虚拟化管理器(英文:Network FunctionsVirtualisation Manager,简称:VNFM)等。控制管理设备的物理实体例如是主机、服务器或个人计算机等,本实施例对控制管理设备的类型不做限定。
系统架构100中网络设备与控制管理设备之间的通信方式包括多种实现方式。例如,网络设备与控制管理设备之间通过Telemetry或SNMP进行通信。当然,Telemetry和SNMP是实现通信的可选方式,在另一些实施例中,网络设备与控制管理设备基于网络配置(Network Configuration,NETCONF)协议通信。
以上介绍了系统架构100,以下通过方法200,示例性介绍基于上文提供的系统架构监控网络性能的方法流程。
参见附图2,附图2是本申请实施例提供的一种网络性能监控方法200的流程图。示例性地,方法200包括S201至S205。
可选地,方法200由系统架构100中的网络设备执行,具体由同一个网络设备中的转发面和控制面执行,转发面用于承担S201对应的处理工作,控制面用于承担S202至S205对应的处理工作。
S201、转发面基于第一时间周期对网络性能数据进行采样,并记录网络性能异常的次数。
第一时间周期为转发面采集网络性能数据的采样周期。具体地,转发面每隔一个第一时间周期,对网络性能数据进行一次采样,以便根据采样得到的网络性能数据记录网络性能异常的次数。第一时间周期的粒度或者说时间长度包括多种情况。可选地,第一时间周期的数量级为毫秒级。例如,第一时间周期为1毫秒,转发面会每一毫秒采集一次网络性能数据。转发面通过基于毫秒级的采样周期对网络性能数据进行采样,有助于实现毫秒级的性能监控。示例性地,网络性能数据用字母p表示,每当经过N个毫秒,转发面会采样得到N个网络性能数据,分别为p1、p2、p3……pn,其中pi表示第i个毫秒采集的网络性能数据,i为大于或等于1且小于或等于n的正整数。可选地,网络性能数据为转发面内部采集的数据,不会被上报至OSS呈现给用户。
网络性能数据用于指示网络性能,例如指示转发面的转发性能。可选地,网络性能数据包括以下或至少一项:时延,丢包,抖动,带宽,传输速率,误码,错包。可选地,网络性能的监控对象包括物理端口、隧道、伪线或虚接口中的至少一项,相应地,网络性能数据包括物理端口的网络性能数据、隧道的网络性能数据、伪线的网络性能数据或虚接口的网络性能数据中的至少一项。可选地,不同监控对象的网络性能数据由转发面的不同组件负责采样。例如,物理端口的网络性能数据由物理接口卡进行采样,隧道和伪线的网络性能数据由NP进行采样。
转发面如何记录网络性能异常的次数包括多种实现方式。例如,转发面每次采样获取网络性能数据后,判断采样获取的网络性能数据是否满足预设条件,每次采样获取的网络性能数据满足预设条件时,转发面记录为一次网络性能异常。
预设条件的设置包括多种实现方式。可选地,预设条件包括:每次采样获取的网络性能数据的值大于或者等于第二阈值。其中,第二阈值可以称为性能越限门限或性能劣化门限。在预设条件通过阈值设置的情况下,网络性能异常的次数也称为越限次数。第二阈值可以根据需求或实际的网络情况设置。第二阈值包括而不限于时延阈值,丢包阈值,抖动阈值,带宽阈值,传输速率阈值,误码阈值,错包阈值中的至少一项。例如,网络性能数据为传输速率,第二阈值为70%。可选地,第二阈值由用户在使能网络性能监控功能时预先设定,或者,第二阈值为默认值。以第一时间周期为一个毫秒为例,转发面会将每毫秒采集的网络性能数据与第二阈值进行对比,如果每毫秒采集的网络性能数据大于或者等于第二阈值,则记录一次网络性能异常。
可选地,网络性能的监控可以具有多个异常等级,转发面会记录该多个异常等级中每个异常等级对应的网络性能异常的次数。具体地,多个异常等级分别对应多个预设条件,不同异常等级对应的预设条件可以是不同的,转发面每次采样获取网络性能数据后,会分别判断网络性能数据是否满足多个预设条件。对于多个异常等级中的一个异常等级而言,当每次采样获取的网络性能数据满足该异常等级对应的预设条件时,转发面会记录为一次该异常等级对应的网络性能异常。
如何为异常等级设置对应的预设条件包括多种实现方式。在一种可能的实现中,为多个异常等级分别设置多个第三阈值,第三阈值可以称为级别对应的性能越限门限或级别对应的性能劣化门限。异常等级对应的预设条件,包括:每次采样获取的网络性能数据的值大于或者等于异常等级对应的第三阈值。多个第三阈值和多个异常等级可以是一一对应的。第三阈值和上文涉及的第二阈值可以是相同的,也可以是不同的。每个异常等级对应的第三阈值由用户在使能网络性能监控功能时预先设定,或者,每个异常等级对应的第三阈值为默认值。第三阈值包括而不限于时延阈值,丢包阈值,抖动阈值,带宽阈值,传输速率阈值,误码阈值,错包阈值中的至少一项。
可选地,异常等级越高,异常等级对应的第三阈值越高。例如,网络性能数据为物理端口的传输速率,第三阈值为物理端口的传输速率阈值。在多个异常等级包括的2个异常等级中,低异常等级对应的传输速率阈值为70%,高异常等级对应的传输速率阈值为85%。
示例性地,第三阈值用字母M表示,网络性能数据用字母p表示,网络性能异常的次数用字母mum表示。可以为异常等级1至异常等级n这N个异常等级,设置阈值M1至阈值Mn这N个第三阈值,转发面会根据N个第三阈值,记录mum1至mumn这N个网络性能异常的次数。其中,Mi表示异常等级i对应的第三阈值,mumi表示异常等级i对应的网络性能异常的次数,i为大于或等于1且小于或等于n的正整数。以第一时间周期为1毫秒为例,转发面在第k个毫秒采样获取网络性能数据pk后,会将网络性能数据pk与阈值M1至阈值Mn分别进行比较,如果阈值Mi<网络性能数据pk<阈值Mi+1,则转发面将次数mum i的值加一。换句话说,对于多个异常等级中相邻的2个异常等级而言,如果当前采样获取的网络性能数据的值大于前一个异常等级对应的阈值而小于后一个异常等级对应的阈值,则前一个异常等级对应的网络性能异常的次数会累计加一。
可选地,转发面不仅根据网络性能数据记录网络性能异常的次数,还会根据每次采样获取的网络性能数据,确定在第二时间周期内的网络性能参数。
网络性能参数包括而不限于第二时间周期内网络性能数据的最大值、第二时间周期内网络性能数据的最小值或第二时间周期内网络性能数据的平均值中的至少一项。结合网络性能数据的具体类型,可选地,网络性能参数包括最大时延、最小时延、平均时延、丢包率、抖动、带宽、传输速率、误码率或错包率中的至少一项。
如何计算第二时间周期内网络性能数据的最大值包括多种实现方式。例如,第二时间周期用字母T表示,周期T内网络性能数据的最大值用字母Max表示,以第一时间周期为1毫秒为例,转发面在周期T中的每一毫秒采样获取到网络性能数据后,将本次采集的网络性能数据的值和Max值进行对比,如果本次采集的网络性能数据的值大于已记录的Max值,则转发面将已记录的Max值更新为本次采集的网络性能数据的值,如果本次采集的网络性能数据的值小于或等于已记录的Max值,则转发面保持已记录的Max值不变,从而得到周期T内网络性能数据的最大值。
如何计算第二时间周期内网络性能数据的最小值包括多种实现方式。例如,第二时间周期用字母T表示,周期T内网络性能数据的最小值用字母Min表示,以第一时间周期为1毫秒为例,转发面在周期T中的每一毫秒采样获取到网络性能数据后,将本次采集的网络性能数据的值和Min值进行对比,如果本次采集的网络性能数据的值小于已记录的Min值,则转发面将已记录的Min值更新为本次采集的网络性能数据的值,如果本次采集的网络性能数据的值大于或等于已记录的Min值,则转发面保持已记录的Min值不变,从而得到周期T内网络性能数据的最大值。
如何计算第二时间周期内网络性能数据的平均值包括多种实现方式。例如,第二时间周期用字母T表示,周期T内网络性能数据的平均值用字母Avg表示,以第一时间周期为1毫秒为例,转发面对周期T中的每一毫秒采样获取到网络性能数据的值进行平均计算,得到周期T内网络性能数据的平均值Avg。
S202、控制面确定在第二时间周期内网络性能异常的次数大于第一阈值。
第二时间周期的时长大于第一时间周期的时长。第二时间周期的粒度或者说时间长度包括多种情况。可选地,在第一时间周期的数量级为毫秒级的情况下,第二时间周期的数量级至少为秒级,换句话说,第二时间周期的时长大于或等于一秒,例如,第二时间周期为1秒、10秒、30秒、1分钟、5分钟、15分钟、30分钟或1小时。可选地,第二时间周期的时长由用户在使能网络性能监控功能时预先设定,或者,第二时间周期的时长为默认值,默认值例如是30秒。
第一阈值可以称为告警门限。可选地,第一阈值由用户在使能网络性能监控功能时预先设定,或者,第一阈值为默认值。每隔一个第二时间周期,控制面会对第二时间周期内网络性能异常的次数与第一阈值进行比较,如果转发面记录的网络性能异常的次数大于第一阈值,控制面会产生告警。示例性地,第二时间周期用字母T表示,网络性能异常的次数用字母mum表示,第一阈值用字母Alam-num表示,控制面会对mum与Alam-num比较,如果mum大于Alam-num,即第二时间周期内的网络性能异常的次数大于第一阈值的次数达到了告警门限,则控制面报告产生了告警。
通过第一时间周期和第二时间周期之间的数量关系可以看出,转发面进行数据采样和次数记录的周期是细粒度的,控制面进行上报的周期是粗粒度的,因而转发面和控制面通过实施本实施例以协同监控网络性能,一方面满足了细粒度地对网络性能监控的需求,另一方面减少了控制面海量上报数据对CPU性能的依赖以及对带宽资源的消耗。
本实施例中,控制面可以从转发面获取网络性能异常的次数。具体如何获取网络性能异常的次数包括多种实现方式,以下通过实现方式一至实现方式二举例说明。
实现方式一、控制面主动读取网络性能异常的次数。
可选地,转发面记录网络性能异常的次数后,将网络性能异常的次数保存至存储器中,控制面从存储器读取网络性能异常的次数。其中,用于保存网络性能异常的次数的存储器包括多种情况。例如,该存储器为转发面所在的接口板中的存储器,比如为物理接口卡上的寄存器。又如,该存储器为控制面所在的接口板(如主控板)中的存储器,本实施例对存储器的类型不做限定。
实现方式二、控制面接收转发面上报的网络性能异常的次数。
可选地,转发面记录网络性能异常的次数后,转发面向控制面发送网络性能异常的次数,控制面接收网络性能异常的次数。
S203、控制面生成告警。
控制面生成的告警包括多种情况,以下通过情况A至情况B举例说明。
情况A、控制面生成的告警包括告警指示信号,告警指示信号可以通过报警指示灯的亮灭或闪烁频率、报警音频等数据形式输出,比如,告警指示信号可以是警报。
情况B、控制面生成的告警包括告警信息,告警信息用于指示网络性能异常的次数大于第一阈值。告警信息的内容包括多种情况,例如,告警信息包括告警类型、告警源信息或时间戳中的至少一项,下面对这几种信息分别进行具体说明。
告警类型包括时延异常,丢包异常,抖动异常,带宽异常,传输速率异常,误码异常或错包异常中的至少一项。当告警信息的告警类型为时延异常时,告警信息指示时延异常的次数大于第一阈值。当告警信息的告警类型为传输速率异常时,告警信息指示传输速率异常的次数大于第一阈值。例如端口速率过慢的次数大于第一阈值,其他告警类型与此同理。通过在告警信息中携带告警类型,能够指明具体的网络性能异常事件,即具体哪一种网络性能数据出现了异常。
告警源信息用于指示生成告警信息的网络设备,告警源信息例如是控制面所在网络设备的名称或控制面所在网络设备的互联网协议(internet protocol,IP)地址,通过在告警信息中携带告警源信息能够指明网络中的哪个网络设备监控到了网络性能异常。
时间戳用于指示网络性能异常的次数大于第一阈值的时间点,例如,控制面确定在第二时间周期内网络性能异常的次数大于第一阈值时,可以在告警信息中写入当前时间点的时间戳。通过在告警信息中携带时间戳,能够指明控制面何时监控到了网络性能异常。
可选地,在为网络性能监控设置有多个异常等级的情况下,告警信息还包括异常等级。不同异常等级的告警信息有所区别,以便指明出现了哪种异常等级的网络性能异常事件。例如,告警信息包括告警名称,不同异常等级的告警信息中的告警名称不同。又如,告警信息包括告警参数,不同异常等级的告警信息中的告警参数不同。
具体地,控制面会对第二时间周期内多个异常等级对应的网络性能异常的次数分别与第一阈值进行比较。对于多个异常等级中的一个异常等级而言,如果控制面确定在第二时间周期内该异常等级对应的网络性能异常的次数大于第一阈值,控制面生成用于指示该异常等级的告警信息。示例性地,第二时间周期用字母T表示,异常等级n对应的网络性能异常的次数用字母numn表示,第一阈值用字母Alam-num表示,控制面会对num n与Alam-num比较,如果控制面确定在T内numn大于Alam-num,控制面生成Alamn。其中,Alamn表示用于指示异常等级n的告警信息。
可选地,如果控制面确定在第二时间周期内多个异常等级对应的网络性能异常的次数均大于第一阈值,控制面生成用于指示多个异常等级中最高异常等级的告警信息。例如,第一阈值用字母Alam-num表示,如果异常等级1对应的网络性能异常的次数大于Alam-num,异常等级2对应的网络性能异常的次数也大于Alam-num,异常等级3对应的网络性能异常的次数也大于Alam-num,则控制面生成Alam3。其中,Alam3表示用于指示异常等级3的告警信息。
通过这种方式,如果同时存在多个异常等级满足了对应的阈值(第三阈值),则控制面能够只向上层OSS报告最高异常等级的告警信息,抑制低异常等级的告警信息上报。通过这种方式,能够减少上报的告警信息数量,避免告警信息过多对用户产生干扰。
S204、控制面向控制管理设备发送告警。
例如,控制面通过Telemetry或SNMP协议,将告警通过设备之间的DCN通道或带外DCN通道上报给控制管理设备。例如,请参考附图1所示的系统架构100,控制面所在的网络设备例如是接入网络设备101,接入网络设备101生成告警之后,向OSS110发送告警。控制管理设备接收到告警后,可以对告警进行分析呈现。控制面通过向控制管理设备上报告警,能够及时通知运营商网络中出现了性能异常事件,从而有助于运营商及时对网络情况进行调整,因而有助于网络性能异常的问题得到及时解决,从而避免影响用户体验。
可选地,控制面获取在第二时间周期内的网络性能参数之后,控制面还向控制管理设备发送网络性能参数,例如发送第二时间周期内网络性能数据的最大值、第二时间周期内网络性能数据的最小值和第二时间周期内网络性能数据的平均值。可选地,控制面通过Telemetry或SNMP协议,将网络性能参数通过设备之间的DCN通道或带外DCN通道上报给控制管理设备。控制管理设备接收到网络性能参数后,可以对网络性能参数进行分析呈现。
上报网络性能参数的时机或者说触发条件具体包括多种情况,以下通过情况I至情况II举例说明。
情况I、控制面基于第二时间周期上报网络性能参数。换句话说,每隔一个第二时间周期,控制面向控制管理设备发送一次网络性能参数。可选地,在情况I下,网络性能参数的上报不依赖于告警的上报,例如,当第二时间周期内所述网络性能异常的次数大于、小于或等于第一阈值这几种情况下,控制面均会上报第二时间周期内的网络性能参数。
情况II、控制面在上报告警时上报网络性能参数。换句话说,控制面确定在第二时间周期内所述网络性能参数大于第一阈值时,控制面向控制管理设备发送告警以及第二时间周期内的网络性能参数。
采用这种方式时,第二时间周期可以是控制面发送网络性能参数的上报周期。
应理解,S204为可选步骤,在另一些实施例中,控制面不执行S204。例如,控制面通过输出警报来提示用户监控到了网络性能异常的情况。
可选地,控制面还会上报网络性能异常的次数。具体地,控制面获取网络性能异常的次数后,还会向控制管理设备发送网络性能异常的次数,控制管理设备接收网络性能异常的次数,对网络性能异常的次数进行分析呈现。在网络性能监控具有多个异常等级的情况下,可选地,控制面向控制管理设备发送多个异常等级中每个异常等级对应的网络性能异常的次数。在网络性能数据包括时延,丢包,抖动,带宽,传输速率,误码,错包中的至少一项的情况下,可选地,控制面向控制管理设备发送时延异常的次数、丢包异常的次数、抖动异常的次数、带宽异常的次数、传输速率异常的次数、误码异常的次数、错包异常的次数中的至少一项。
上报网络性能异常的次数的时机或者说触发条件具体包括多种情况,以下通过情况a至情况b举例说明。
情况a、控制面基于第二时间周期上报网络性能异常的次数。换句话说,每隔一个第二时间周期,控制面向控制管理设备发送一次网络性能异常的次数。可选地,在情况a下,网络性能异常的次数的上报不依赖于告警的上报,例如,当第二时间周期内所述网络性能异常的次数大于、小于或等于第一阈值这几种情况下,控制面均会上报第二时间周期内网络性能异常的次数。
情况b、控制面在上报告警时上报网络性能异常的次数。换句话说,控制面确定在第二时间周期内所述网络性能异常的次数大于第一阈值时,控制面向控制管理设备发送告警以及第二时间周期内网络性能异常的次数。
S205、若第二时间周期之后的连续多个第二时间周期内网络性能异常的次数均小于第一阈值,控制面取消告警。
可选地,控制面支持告警取消的功能。具体地,在控制面确定在第二时间周期内网络性能异常的次数大于第一阈值并生成告警之后,转发面会继续基于第一时间周期对网络性能数据进行采样,并继续记录网络性能异常的次数,控制面会根据转发面记录的网络性能异常的次数,继续判断该第二时间周期之后的每个第二时间周期内网络性能异常的次数是否小于第一阈值。若出现网络性能异常的第二时间周期之后的连续多个第二时间周期内网络性能异常的次数均小于第一阈值,控制面取消告警。可选地,取消告警的方式是向控制管理设备发送指示告警消失的通知消息。例如,第二时间周期用字母T表示,控制面在周期Ti上报告警Alamn之后,如果周期Ti之后的连续N个周期Ti+1至周期Ti+N内记录的网络性能异常的次数都小于阈值Alam-num,则控制面报告告警Alamn消失。可选地,N由用户在使能网络性能监控功能时预先设定,或者,N为默认值。例如,N为3。控制面通过在上报告警之后,根据连续多个周期内的网络性能异常次数取消告警,能够避免已产生的告警长期残留,同时通过取消告警,能够通知运营商网络性能已经正常,引起网络性能异常的故障已经得到恢复。应理解,S205为可选步骤,在另一些实施例中,控制面不执行S205。
本实施例提供的方法,通过转发面以细粒度的时间周期对网络性能数据进行采样,并记录网络性能异常的次数,通过控制面以粗粒度的时间周期,在转发面记录的网络性能异常的次数大于阈值时生成告警。在满足细粒度对网络性能监控的需求的基础上,由于控制面无需上报采集所有的网络性能数据,因而极大地减少了控制面所需上报的数据量,一方面解决了海量数据上报导致主控CPU过载的问题,减少网络性能监控对设备主控CPU性能的依赖。另一方面解决了海量数据上报导致占用大量带宽资源的问题,减少网络性能监控对带宽资源的依赖,有助于满足现网大量部署性能监控节点的需求。
以上介绍了本申请实施例的方法200,以下介绍本申请实施例的网络设备,应理解,以下介绍的网络设备具有上述方法200中转发面和控制面的任意功能。
附图3是本申请实施例提供的一种网络设备300的结构示意图,如附图3所示,网络设备300包括:采样模块301,用于执行S201中的采样步骤;记录模块302,用于执行S201中的记录步骤;确定模块303,用于执行S202;生成模块304,用于执行S203。
可选地,网络设备300还包括:发送模块,用于执行S204。
可选地,网络设备300还包括:取消模块,用于执行S205。
应理解,采样模块301和记录模块302对应于上述方法200中的转发面,采样模块301和记录模块302用于实现方法200中的转发面所实施的各种步骤和方法。换句话说,采样模块301和记录模块302与上述转发面属于同一构思,其具体实现过程详见方法200中转发面对应的流程,这里不再赘述。
应理解,确定模块303、生成模块304、发送模块和取消模块对应于上述方法200中的控制面,确定模块303、生成模块304、发送模块和取消模块用于实现方法200中的控制面所实施的各种步骤和方法。换句话说,确定模块303、生成模块304、发送模块和取消模块与上述控制面属于同一构思,其具体实现过程详见方法200中控制面对应的流程,这里不再赘述。
应理解,网络设备300中的每个功能模块采用软件实现。例如,采样模块301和记录模块302是转发面的处理器读取程序代码后生成的虚拟模块。确定模块303、生成模块304、发送模块和取消模块是控制面的处理器读取程序代码后生成的虚拟模块。
应理解,网络设备300在监控网络性能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将转发面或控制面的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
与本申请提供的方法实施例以及虚拟装置实施例相对应,本申请实施例还提供了一种网络设备400,下面对网络设备400的硬件结构进行介绍。
网络设备400对应于上述方法200中的转发面和控制面,网络设备400中的各硬件、模块和上述其他操作和/或功能分别为了实现方法200中的转发面和控制面所实施的各种步骤和方法,关于网络设备400如何对网络性能进行监控的详细流程,具体细节可参见上述方法200,为了简洁,在此不再赘述。其中,方法200的各步骤通过网络设备400处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
网络设备400对应于上述虚拟装置实施例中的网络设备300,网络设备300中的每个功能模块采用网络设备400的软件实现。换句话说,网络设备300包括的功能模块为网络设备400的处理器读取存储器中存储的程序代码后生成的。
参见附图4,附图4示出了本申请一个示例性实施例提供的网络设备的结构示意图,网络设备400包括主控板410和接口板430。
主控板也称为主处理单元(main processing unit,MPU)或路由处理卡(routeprocessor card),主控板410用于对网络设备400中各个组件的控制和管理,包括路由计算、设备管理、设备维护、协议处理功能。主控板410包括:中央处理器411和存储器412。
接口板430也称为线路接口单元卡(line processing unit,LPU)、线卡(linecard)或业务板。接口板430用于提供各种业务接口并实现数据包的转发。业务接口包括而不限于以太网接口、POS(Packet over SONET/SDH)接口等,以太网接口例如是灵活以太网业务接口(Flexible Ethernet Clients,FlexE Clients)。接口板430包括:中央处理器431、网络处理器432、转发表项存储器434和物理接口卡(ph4sical interface card,PIC)433。
接口板430上的中央处理器431用于对接口板430进行控制管理并与主控板410上的中央处理器411进行通信。
网络处理器432用于实现报文的转发处理。网络处理器432的形态可以是转发芯片。具体而言,网络处理器432用于基于转发表项存储器434保存的转发表转发接收到的报文,如果报文的目的地址为网络设备400的地址,则将该报文上送至CPU(如中央处理器411)处理;如果报文的目的地址不是网络设备400的地址,则根据该目的地址从转发表中查找到该目的地址对应的下一跳和出接口,将该报文转发到该目的地址对应的出接口。其中,上行报文的处理包括:报文入接口的处理,转发表查找;下行报文的处理:转发表查找等等。
物理接口卡433用于实现物理层的对接功能,原始的流量由此进入接口板430,以及处理后的报文从该物理接口卡433发出。物理接口卡433也称为子卡,可安装在接口板430上,负责将光电信号转换为报文并对报文进行合法性检查后转发给网络处理器432处理。在一些实施例中,中央处理器也可执行网络处理器432的功能,比如基于通用CPU实现软件转发,从而物理接口卡433中不需要网络处理器432。
可选地,网络设备400包括多个接口板,例如网络设备400还包括接口板440,接口板440包括:中央处理器441、网络处理器442、转发表项存储器444和物理接口卡443。
可选地,网络设备400还包括交换网板420。交换网板420也可以称为交换网板单元(switch fabric unit,SFU)。在网络设备有多个接口板430的情况下,交换网板420用于完成各接口板之间的数据交换。例如,接口板430和接口板440之间可以通过交换网板420通信。
主控板410和接口板430耦合。例如。主控板410、接口板430和接口板440,以及交换网板420之间通过系统总线与系统背板相连实现互通。在一种可能的实现方式中,主控板410和接口板430之间建立进程间通信协议(inter-process communication,IPC)通道,主控板410和接口板430之间通过IPC通道进行通信。
在逻辑上,网络设备400包括控制面和转发面,控制面包括主控板410和中央处理器431,转发面包括执行转发的各个组件,比如转发表项存储器434、物理接口卡433和网络处理器432。控制面执行路由器、生成转发表、处理信令和协议报文、配置与维护设备的状态等功能,控制面将生成的转发表下发给转发面,在转发面,网络处理器432基于控制面下发的转发表对物理接口卡433收到的报文查表转发。控制面下发的转发表可以保存在转发表项存储器434中。
在实施方法200的过程中,接口板430或接口板440用于执行转发面对应的步骤。以网络性能的监控对象为物理端口为例,物理接口卡433基于第一时间周期,对物理接口卡433中物理端口的网络性能数据进行采样,并记录网络性能异常的次数,将网络性能异常的次数保存至转发表项存储器434。以网络性能的监控对象为隧道为例,网络处理器432基于第一时间周期,对隧道的网络性能数据进行采样,并记录网络性能异常的次数,将网络性能异常的次数保存至转发表项存储器434。
在实施方法200的过程中,主控板410用于执行控制面对应的步骤。例如,中央处理器431从转发表项存储器434读取网络性能异常的次数,确定在第二时间周期内所述网络性能异常的次数大于第一阈值,中央处理器431生成告警。
应理解,网络设备300中的采样模块301,记录模块302相当于网络设备400中的接口板430或接口板440;网络设备300中的确定模块303、生成模块304、发送模块和取消模块可以相当于主控板410。
应理解,本申请实施例中接口板440上的操作与接口板430的操作一致,为了简洁,不再赘述。
值得说明的是,主控板可能有一块或多块,有多块的时候可以包括主用主控板和备用主控板。接口板可能有一块或多块,网络设备的数据处理能力越强,提供的接口板越多。接口板上的物理接口卡也可以有一块或多块。交换网板可能没有,也可能有一块或多块,有多块的时候可以共同实现负荷分担冗余备份。在集中式转发架构下,网络设备可以不需要交换网板,接口板承担整个系统的业务数据的处理功能。在分布式转发架构下,网络设备可以有至少一块交换网板,通过交换网板实现多块接口板之间的数据交换,提供大容量的数据交换和处理能力。所以,分布式架构的网络设备的数据接入和处理能力要大于集中式架构的设备。可选地,网络设备的形态也可以是只有一块板卡,即没有交换网板,接口板和主控板的功能集成在该一块板卡上,此时接口板上的中央处理器和主控板上的中央处理器在该一块板卡上可以合并为一个中央处理器,执行两者叠加后的功能,这种形态设备的数据交换和处理能力较低(例如,低端交换机或路由器等网络设备)。具体采用哪种架构,取决于具体的组网部署场景,此处不做任何限定。
在一些可能的实施例中,上述转发面和控制面还可以使用计算机程序产品实现。具体地,本申请实施例提供了一种计算机程序产品,当该计算机程序产品在网络设备上运行时,使得网络设备的转发面和控制面分别执行上述方法200中的网络性能监控方法。
应理解,上述各种产品形态的转发面和控制面,分别具有上述方法200中转发面和控制面的任意功能,此处不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例中描述的各方法步骤和单元,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各实施例的步骤及组成。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域普通技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参见前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
该作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例中方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上描述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机程序指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例中的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机程序指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如,数字视频光盘(digitalvideo disc,DVD)、或者半导体介质(例如固态硬盘)等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。还应理解,尽管以下描述使用术语第一、第二等来描述各种元素,但这些元素不应受术语的限制。这些术语只是用于将一元素与另一元素区别分开。例如,在不脱离各种所述示例的范围的情况下,第一阈值可以被称为第二阈值,并且类似地,第二阈值可以被称为第一阈值。第一阈值和第二阈值都可以是阈值,并且在某些情况下,可以是单独且不同的阈值。
本申请中术语“至少一个”的含义是指一个或多个,本申请中术语“多个”的含义是指两个或两个以上,例如,多个第二报文是指两个或两个以上的第二报文。本文中术语“系统”和“网络”经常可互换使用。
还应理解,术语“如果”可被解释为意指“当...时”(“when”或“upon”)或“响应于确定”或“响应于检测到”。类似地,根据上下文,短语“如果确定...”或“如果检测到[所陈述的条件或事件]”可被解释为意指“在确定...时”或“响应于确定...”或“在检测到[所陈述的条件或事件]时”或“响应于检测到[所陈述的条件或事件]”。
以上描述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (24)

1.一种网络性能监控方法,其特征在于,所述方法包括:
转发面基于第一时间周期对网络性能数据进行采样,并记录网络性能异常的次数,其中,每次采样获取的网络性能数据满足预设条件时,记录为一次网络性能异常,所述第一时间周期为所述转发面采集网络性能数据的采样周期;
控制面确定在第二时间周期内所述网络性能异常的次数大于第一阈值;所述第二时间周期的时长大于所述第一时间周期的时长;
所述控制面生成告警。
2.根据权利要求1所述的方法,其特征在于,所述第一时间周期的数量级为毫秒级,所述第二时间周期的数量级至少为秒级。
3.根据权利要求1或2所述的方法,其特征在于,所述预设条件包括:
每次采样获取的网络性能数据的值大于或者等于第二阈值。
4.根据权利要求1-3任一项所述的方法,其特征在于,
所述记录网络性能异常的次数,包括:记录多个异常等级中每个异常等级对应的网络性能异常的次数,所述多个异常等级分别对应多个预设条件,其中,每次采样获取的网络性能数据满足异常等级对应的预设条件时,记录为一次异常等级对应的网络性能异常。
5.根据权利要求4所述的方法,其特征在于,所述控制面确定在第二时间周期内所述网络性能异常的次数大于第一阈值,包括:
所述控制面确定在第二时间周期内所述多个异常等级对应的网络性能异常的次数均大于所述第一阈值;
所述控制面生成告警,包括:
所述控制面生成用于指示所述多个异常等级中最高异常等级的告警信息。
6.根据权利要求4或5所述的方法,其特征在于,所述异常等级对应的预设条件,包括:每次采样获取的网络性能数据的值大于或者等于所述异常等级对应的第三阈值,所述异常等级越高,所述异常等级对应的第三阈值越高。
7.根据权利要求1所述的方法,其特征在于,所述网络性能数据包括以下或至少一项:时延,丢包,抖动,带宽,传输速率,误码,错包。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
根据每次采样获取的网络性能数据,所述转发面确定在所述第二时间周期内的网络性能参数;
所述控制面获取所述网络性能参数。
9.根据权利要求8所述的方法,其特征在于,所述网络性能参数包括以下至少一项:
最大时延;
最小时延;
平均时延;
丢包率;
抖动;
带宽;
传输速率;
误码率;以及
错包率。
10.根据权利要求1所述的方法,其特征在于,所述控制面生成告警之后,所述方法还包括:
所述控制面向控制管理设备发送所述告警。
11.根据权利要求10所述的方法,其特征在于,所述控制面向控制管理设备发送所述告警之后,所述方法还包括:
若所述第二时间周期之后的连续多个第二时间周期内所述网络性能异常的次数均小于所述第一阈值,所述控制面取消所述告警。
12.一种网络设备,其特征在于,所述网络设备包括:
采样模块,用于基于第一时间周期对网络性能数据进行采样,所述第一时间周期为采集网络性能数据的采样周期;
记录模块,用于记录网络性能异常的次数,其中,每次采样获取的网络性能数据满足预设条件时,记录为一次网络性能异常;
确定模块,用于确定在第二时间周期内所述网络性能异常的次数大于第一阈值;所述第二时间周期的时长大于所述第一时间周期的时长;
生成模块,用于生成告警。
13.根据权利要求12所述的设备,其特征在于,所述第一时间周期的数量级为毫秒级,所述第二时间周期的数量级至少为秒级。
14.根据权利要求12或13所述的设备,其特征在于,所述预设条件包括:
每次采样获取的网络性能数据的值大于或者等于第二阈值。
15.根据权利要求12-14任一项所述的设备,其特征在于,所述记录模块,用于记录多个异常等级中每个异常等级对应的网络性能异常的次数,所述多个异常等级分别对应多个预设条件,其中,每次采样获取的网络性能数据满足异常等级对应的预设条件时,记录为一次异常等级对应的网络性能异常。
16.根据权利要求15所述的设备,其特征在于,所述确定模块,用于确定在第二时间周期内所述多个异常等级对应的网络性能异常的次数均大于所述第一阈值;
所述生成模块,用于生成用于指示所述多个异常等级中最高异常等级的告警信息。
17.根据权利要求15或16所述的设备,其特征在于,所述异常等级对应的预设条件,包括:每次采样获取的网络性能数据的值大于或者等于所述异常等级对应的第三阈值,所述异常等级越高,所述异常等级对应的第三阈值越高。
18.根据权利要求12所述的设备,其特征在于,所述网络性能数据包括以下或至少一项:时延,丢包,抖动,带宽,传输速率,误码,错包。
19.根据权利要求18所述的设备,其特征在于,所述确定模块,还用于根据每次采样获取的网络性能数据,确定在所述第二时间周期内的网络性能参数。
20.根据权利要求19所述的设备,其特征在于,所述网络性能参数包括以下至少一项:
最大时延;
最小时延;
平均时延;
丢包率;
抖动;
带宽;
传输速率;
误码率;以及
错包率。
21.根据权利要求12所述的设备,其特征在于,所述设备还包括:
发送模块,用于向控制管理设备发送所述告警。
22.根据权利要求21所述的设备,其特征在于,所述设备还包括:
取消模块,用于若所述第二时间周期之后的连续多个第二时间周期内所述网络性能异常的次数均小于所述第一阈值,取消所述告警。
23.一种网络设备,其特征在于,所述网络设备包括主控板和接口板,所述主控板包括第一处理器,所述第一处理器用于执行指令以执行如权利要求1至权利要求11中控制面对应的步骤,所述接口板包括第二处理器,所述第二处理器用于执行指令以执行如权利要求1至权利要求11中转发面对应的步骤。
24.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述指令由处理器读取以使转发面和控制面执行如权利要求1至权利要求11中任一项所述的方法。
CN202010359259.0A 2020-04-29 2020-04-29 网络性能监控方法、网络设备及存储介质 Active CN113572654B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202010359259.0A CN113572654B (zh) 2020-04-29 2020-04-29 网络性能监控方法、网络设备及存储介质
EP21796281.0A EP4131856A4 (en) 2020-04-29 2021-04-07 METHOD FOR MONITORING NETWORK PERFORMANCE, NETWORK DEVICE AND STORAGE MEDIUM
JP2022566251A JP7500770B2 (ja) 2020-04-29 2021-04-07 ネットワーク性能監視方法、ネットワークデバイス、および記憶媒体
PCT/CN2021/085816 WO2021218582A1 (zh) 2020-04-29 2021-04-07 网络性能监控方法、网络设备及存储介质
US17/976,491 US20230041307A1 (en) 2020-04-29 2022-10-28 Network Performance Monitoring Method, Network Device, and Storage Medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010359259.0A CN113572654B (zh) 2020-04-29 2020-04-29 网络性能监控方法、网络设备及存储介质

Publications (2)

Publication Number Publication Date
CN113572654A true CN113572654A (zh) 2021-10-29
CN113572654B CN113572654B (zh) 2023-11-14

Family

ID=78158889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010359259.0A Active CN113572654B (zh) 2020-04-29 2020-04-29 网络性能监控方法、网络设备及存储介质

Country Status (5)

Country Link
US (1) US20230041307A1 (zh)
EP (1) EP4131856A4 (zh)
JP (1) JP7500770B2 (zh)
CN (1) CN113572654B (zh)
WO (1) WO2021218582A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115567424A (zh) * 2022-06-22 2023-01-03 中国电信股份有限公司 网络监控方法及系统、计算机可存储介质
CN116501551A (zh) * 2023-06-21 2023-07-28 山东远桥信息科技有限公司 一种数据告警产生及恢复处理方法
WO2024051138A1 (zh) * 2022-09-08 2024-03-14 浪潮电子信息产业股份有限公司 存储集群接口的监测处理方法、系统、设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116390155B (zh) * 2023-06-02 2023-08-25 新华三技术有限公司 一种报文收发控制方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103259682A (zh) * 2013-05-16 2013-08-21 浪潮通信信息系统有限公司 一种基于多维数据聚合的通信网网元安全评估方法
CN104778111A (zh) * 2014-01-14 2015-07-15 深圳市腾讯计算机系统有限公司 一种进行报警的方法和装置
CN108768776A (zh) * 2018-05-30 2018-11-06 郑州云海信息技术有限公司 一种基于OpenFlow的网络监控方法及装置
CN109392002A (zh) * 2017-08-11 2019-02-26 华为技术有限公司 一种上报网络性能参数的方法及设备
CN109995599A (zh) * 2019-04-28 2019-07-09 武汉烽火技术服务有限公司 一种网络性能异常的智能告警方法
CN110322583A (zh) * 2018-03-30 2019-10-11 欧姆龙株式会社 异常探测系统、支持装置以及异常探测方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7870243B1 (en) * 2000-04-11 2011-01-11 International Business Machines Corporation Method, system and program product for managing network performance
US7434109B1 (en) 2002-09-26 2008-10-07 Computer Associates Think, Inc. Network fault manager for maintaining alarm conditions
US8477648B2 (en) * 2010-02-16 2013-07-02 Vss Monitoring, Inc. Systems, apparatus, and methods for monitoring network capacity
US10558544B2 (en) * 2011-02-14 2020-02-11 International Business Machines Corporation Multiple modeling paradigm for predictive analytics
US9692775B2 (en) * 2013-04-29 2017-06-27 Telefonaktiebolaget Lm Ericsson (Publ) Method and system to dynamically detect traffic anomalies in a network
US10516594B2 (en) * 2014-12-21 2019-12-24 Pismo Labs Technology Limited Systems and methods for changing the frequency of monitoring data
CN106034056B (zh) * 2015-03-18 2020-04-24 北京启明星辰信息安全技术有限公司 一种业务安全分析的方法和系统
US11327737B2 (en) * 2017-04-21 2022-05-10 Johnson Controls Tyco IP Holdings LLP Building management system with cloud management of gateway configurations
US10673882B2 (en) * 2018-01-15 2020-06-02 International Business Machines Corporation Network flow control of internet of things (IoT) devices

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103259682A (zh) * 2013-05-16 2013-08-21 浪潮通信信息系统有限公司 一种基于多维数据聚合的通信网网元安全评估方法
CN104778111A (zh) * 2014-01-14 2015-07-15 深圳市腾讯计算机系统有限公司 一种进行报警的方法和装置
CN109392002A (zh) * 2017-08-11 2019-02-26 华为技术有限公司 一种上报网络性能参数的方法及设备
CN110322583A (zh) * 2018-03-30 2019-10-11 欧姆龙株式会社 异常探测系统、支持装置以及异常探测方法
CN108768776A (zh) * 2018-05-30 2018-11-06 郑州云海信息技术有限公司 一种基于OpenFlow的网络监控方法及装置
CN109995599A (zh) * 2019-04-28 2019-07-09 武汉烽火技术服务有限公司 一种网络性能异常的智能告警方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115567424A (zh) * 2022-06-22 2023-01-03 中国电信股份有限公司 网络监控方法及系统、计算机可存储介质
WO2024051138A1 (zh) * 2022-09-08 2024-03-14 浪潮电子信息产业股份有限公司 存储集群接口的监测处理方法、系统、设备及存储介质
CN116501551A (zh) * 2023-06-21 2023-07-28 山东远桥信息科技有限公司 一种数据告警产生及恢复处理方法
CN116501551B (zh) * 2023-06-21 2023-09-15 山东远桥信息科技有限公司 一种数据告警产生及恢复处理方法

Also Published As

Publication number Publication date
JP7500770B2 (ja) 2024-06-17
CN113572654B (zh) 2023-11-14
EP4131856A4 (en) 2023-09-20
US20230041307A1 (en) 2023-02-09
EP4131856A1 (en) 2023-02-08
JP2023523472A (ja) 2023-06-05
WO2021218582A1 (zh) 2021-11-04

Similar Documents

Publication Publication Date Title
CN113572654B (zh) 网络性能监控方法、网络设备及存储介质
US10652078B2 (en) Triggered in-band operations, administration, and maintenance in a network environment
CN110120887B (zh) 一种网络质量信息监控方法、电子设备及存储介质
Markopoulou et al. Characterization of failures in an IP backbone
US8989002B2 (en) System and method for controlling threshold testing within a network
US7774849B2 (en) Methods, systems, and computer program products for detecting and mitigating denial of service attacks in a telecommunications signaling network
US20110270957A1 (en) Method and system for logging trace events of a network device
US9270560B2 (en) Session layer for monitoring utility application traffic
US20070168505A1 (en) Performance monitoring in a network
US8619589B2 (en) System and method for removing test packets
CN110650060A (zh) 流量告警的处理方法、设备及存储介质
CN107888455A (zh) 一种数据检测方法、装置和系统
JP2006501717A (ja) 電気通信ネットワーク・エレメントの監視
US8634324B2 (en) Method and apparatus for providing signature based predictive maintenance in communication networks
WO2021249546A1 (zh) 网络监测方法、电子设备及存储介质
CN111200520A (zh) 网络监控方法、服务器和计算机可读存储介质
US10129086B2 (en) Collection of performance data in a communications network
US8571182B2 (en) Systems and methods of masking non-service affecting alarms in a communication system
Kuwabara et al. Adaptive network monitoring system for large-volume streaming services in multi-domain networks
Lipovac Expert system based network testing
CN118540088A (zh) 一种网络流量处理方法、网络设备及系统
CN117081910A (zh) 一种防火墙的主备切换系统及其方法
KR101107322B1 (ko) 패킷-광 통합 스위치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant