CN115002009A - 一种流量采样方法、装置、系统、电子设备及介质 - Google Patents

一种流量采样方法、装置、系统、电子设备及介质 Download PDF

Info

Publication number
CN115002009A
CN115002009A CN202210535945.8A CN202210535945A CN115002009A CN 115002009 A CN115002009 A CN 115002009A CN 202210535945 A CN202210535945 A CN 202210535945A CN 115002009 A CN115002009 A CN 115002009A
Authority
CN
China
Prior art keywords
target
port
traffic
forwarding
congestion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210535945.8A
Other languages
English (en)
Inventor
何晓明
彭巍
黄旭升
叶玉剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202210535945.8A priority Critical patent/CN115002009A/zh
Publication of CN115002009A publication Critical patent/CN115002009A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请实施例提供了一种流量采样方法、装置、系统、电子设备及介质,涉及数据通信技术领域。本申请实施例的技术方案包括:网络设备通过硬件芯片获取每个转发端口的状态参数,其中状态参数用于表示转发端口的拥塞程度。然后通过硬件芯片针对每个转发端口,基于该转发端口的状态参数,确定该转发端口的转发状态。如果存在转发状态为拥塞状态的目标转发端口,则向采集控制器发送拥塞告警消息。其中,拥塞告警消息用于指示采集控制器,通知指定网络设备,提高对经过目标转发端口的目标流量的检测采样率。从而实现在兼顾资源消耗的基础上,提高测量准确度。

Description

一种流量采样方法、装置、系统、电子设备及介质
技术领域
本发明涉及数据通信技术领域,特别是涉及一种流量采样方法、装置、系统、电子设备及介质。
背景技术
对业务流进行采样检测,能够分析出业务流的丢包和时延等传输情况,从而确定网络的状态和服务水平。目前通常以固定的采样率对业务流进行采样。
以随流测量的采样检测方式为例,如图1所示,图1中的PE1和PE2以及P1-P4均为转发流量的网络设备,PE1连接客户网络1,PE2连接客户网络2。被测流量从左边的客户网络达到PE1时,PE1按照固定的采样率选择被采样流量,并在被采样流量的网际互联协议(Internet Protocol,IP)报文头部插入测量信息,之后将携带测量信息的被采样流量转发给下一个检测设备。后续被采样流量经过其他检测设备时,其他检测设备也将自身检测的测量信息插入被采样流量的IP报文头部,直到被采样流量经过PE2时,PE2将所有的测量信息一起上报给分析器。或者,被采样流量经过的各检测设备可以分别向分析器上报各自的测量信息。
然而,如果设置的采用率过高,例如将经过第一个检测设备的所有流量均作为被采样流量,将消耗检测设备过多的处理和存储资源,使得检测设备对流量的转发效率降低,导致网络性能降低,而且海量的测量数据也将消耗分析器大量的处理和存储资源。反之,过低的采样率将导致有测量数据的时段过少,可能未检测到重要的测量数据,例如在检测设备发生短时拥塞时,很可能没有被采样流量经过,使得没有获取到测量数据,因此测量的准确度较低,不能反映网络的真实状态和服务水平。
发明内容
本发明实施例的目的在于提供一种流量采样方法、装置、系统、电子设备及介质,以实现在兼顾资源消耗的基础上,提高测量准确度。具体技术方案如下:
本申请实施例的第一方面,提供了一种流量采样方法,应用于网络设备,所述方法包括:
通过硬件芯片获取每个转发端口的状态参数,所述状态参数用于表示转发端口的拥塞程度;
通过所述硬件芯片针对每个转发端口,基于该转发端口的状态参数,确定该转发端口的转发状态;
如果存在转发状态为拥塞状态的目标转发端口,则向采集控制器发送拥塞告警消息;所述拥塞告警消息用于指示所述采集控制器,通知指定网络设备,提高对经过所述目标转发端口的目标流量的检测采样率。
可选的,所述状态参数包括:端口流量计数值和/或端口输出队列长度,所述端口流量计数值为转发端口已转发的流量大小的累计值,所述端口输出队列长度为转发端口待转发的流量大小总和;
所述基于该转发端口的状态参数,确定该转发端口的转发状态,包括:
针对该转发端口,如果本次读取的端口流量计数值和上一次读取的端口流量计数值之间的流量计数差值满足第一预设条件,或者本次读取的端口输出队列长度满足第二预设条件,或者所述流量计数差值满足所述第一预设条件且本次读取的端口输出队列长度满足所述第二预设条件,则确定该转发端口的转发状态为拥塞状态;
否则,确定该转发端口的转发状态为正常状态。
可选的,所述第一预设条件为:所述流量计数差值大于等于第一预设阈值;或者,端口流速大于等于第二预设阈值,所述端口流速为所述流量计数差值与端口流量计数值的读取时间间隔之间的比值;或者,端口利用率大于等于第三预设阈值,所述端口利用率为所述端口流速与额定带宽之间的比值;
所述第二预设条件为:本次读取的端口输出队列长度大于等于第四预设阈值;或者,端口输出队列缓存占用率大于等于第五预设阈值,所述端口输出队列缓存占用率为本次读取的端口输出队列长度与最大输出队列之间的比值。
可选的,如果存在转发状态为拥塞状态的目标转发端口,则向采集控制器发送拥塞告警消息,包括:
如果存在转发状态为拥塞状态的目标转发端口,且所述目标转发端口持续指定时长处于拥塞状态,则向所述采集控制器发送所述拥塞告警消息。
可选的,在向采集控制器发送拥塞告警消息之后,所述方法还包括:
如果所述目标转发端口由拥塞状态转换为正常状态,则向所述采集控制器发送拥塞解除消息;其中,所述拥塞解除消息用于指示所述采集控制器通知所述指定网络设备降低对所述目标流量的检测采样率。
可选的,所述指定网络设备为随流检测网络中所述目标流量经过的头节点,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为检测域内需对所述目标流量进行采样检测的各检测设备,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为用于生成所述目标流量的探测设备,所述目标流量包括需要由所述目标转发端口转发的探测报文。
本申请实施例的第二方面,提供了一种流量采样方法,应用于采集控制器,所述方法包括:
接收目标网络设备发送的拥塞告警消息;所述拥塞告警消息为所述目标网络设备通过硬件芯片在基于各转发端口的状态参数,检测到存在转发状态为拥塞状态的目标转发端口的情况下发送的消息;
响应于所述拥塞告警消息,向指定网络设备发送第一通知消息,所述第一通知消息用于通知所述指定网络设备提高对经过所述目标转发端口的目标流量的检测采样率。
可选的,在所述向指定网络设备发送第一通知消息之前,所述方法还包括:
获取预先记录的各被测流量经过的网络设备的转发端口;或者,根据所述被测流量的源地址和目的地址,确定所述被测流量经过的网络设备的转发端口;
根据所述被测流量经过的网络设备的转发端口,从所述被测流量中筛选出经过所述目标转发端口的目标流量;
将对所述目标流量进行采样的网络设备,确定为所述指定网络设备。
可选的,在所述向指定网络设备发送第一通知消息之后,所述方法还包括:
接收所述目标网络设备发送的拥塞解除消息,所述拥塞解除消息为所述目标网络设备在检测到所述目标转发端口由拥塞状态转换为正常状态的情况下发送的消息;
响应于所述拥塞解除消息,向所述指定网络设备发送第二通知消息,所述第二通知消息用于通知所述指定网络设备降低对所述目标流量的检测采用率。
可选的,所述响应于所述拥塞解除消息,向所述指定网络设备发送第二通知消息,包括:
响应于所述拥塞解除消息,在等待预设时长后,向所述指定网络设备发送所述第二通知消息。
可选的,在所述向指定网络设备发送第一通知消息之前,所述方法还包括:
判断所述指定网络设备当前对所述目标流量的检测采样率是否已被提高;若否,则执行所述向指定网络设备发送第一通知消息的步骤;
在所述向所述指定网络设备发送第二通知消息之前,所述方法还包括:
判断所述目标流量经过的各网络设备的转发端口是否均为正常状态,若是,则执行所述向所述指定网络设备发送第二通知消息的步骤。
可选的,所述指定网络设备为随流检测网络中所述目标流量经过的头节点,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为检测域内需对所述目标流量进行采样检测的各检测设备,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为用于生成所述目标流量的探测设备,所述目标流量包括需要由所述目标转发端口转发的探测报文。
本申请实施例的第三方面,提供了一种流量采样装置,应用于网络设备,所述装置包括:
获取模块,用于通过硬件芯片获取每个转发端口的状态参数,所述状态参数用于表示转发端口的拥塞程度;
确定模块,用于通过所述硬件芯片针对每个转发端口,基于获取模块获取的该转发端口的状态参数,确定该转发端口的转发状态;
发送模块,用于如果存在转发状态为拥塞状态的目标转发端口,则向采集控制器发送拥塞告警消息;所述拥塞告警消息用于指示所述采集控制器,通知指定网络设备,提高对经过所述目标转发端口的目标流量的检测采样率。
可选的,所述状态参数包括:端口流量计数值和/或端口输出队列长度,所述端口流量计数值为转发端口已转发的流量大小的累计值,所述端口输出队列长度为转发端口待转发的流量大小总和;
所述确定模块,具体用于:针对该转发端口,如果本次读取的端口流量计数值和上一次读取的端口流量计数值之间的流量计数差值满足第一预设条件,或者本次读取的端口输出队列长度满足第二预设条件,或者所述流量计数差值满足所述第一预设条件且本次读取的端口输出队列长度满足所述第二预设条件,则确定该转发端口的转发状态为拥塞状态;
否则,确定该转发端口的转发状态为正常状态。
可选的,所述第一预设条件为:所述流量计数差值大于等于第一预设阈值;或者,端口流速大于等于第二预设阈值,所述端口流速为所述流量计数差值与端口流量计数值的读取时间间隔之间的比值;或者,端口利用率大于等于第三预设阈值,所述端口利用率为所述端口流速与额定带宽之间的比值;
所述第二预设条件为:本次读取的端口输出队列长度大于等于第四预设阈值;或者,端口输出队列缓存占用率大于等于第五预设阈值,所述端口输出队列缓存占用率为本次读取的端口输出队列长度与最大输出队列之间的比值。
可选的,所述发送模块,具体用于:
如果存在转发状态为拥塞状态的目标转发端口,且所述目标转发端口持续指定时长处于拥塞状态,则向所述采集控制器发送所述拥塞告警消息。
可选的,所述发送模块,还用于在向采集控制器发送拥塞告警消息之后,如果所述目标转发端口由拥塞状态转换为正常状态,则向所述采集控制器发送拥塞解除消息;其中,所述拥塞解除消息用于指示所述采集控制器通知所述指定网络设备降低对所述目标流量的检测采样率。
可选的,所述指定网络设备为随流检测网络中所述目标流量经过的头节点,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为检测域内需对所述目标流量进行采样检测的各检测设备,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为用于生成所述目标流量的探测设备,所述目标流量包括需要由所述目标转发端口转发的探测报文。
本申请实施例的第四方面,提供了一种流量采样装置,应用于采集控制器,该装置包括:接收模块和发送模块;
接收模块,用于接收目标网络设备发送的拥塞告警消息;所述拥塞告警消息为所述目标网络设备通过硬件芯片在基于各转发端口的状态参数,检测到存在转发状态为拥塞状态的目标转发端口的情况下发送的消息;
发送模块,用于响应于所述接收模块接收的所述拥塞告警消息,向指定网络设备发送第一通知消息,所述第一通知消息用于通知所述指定网络设备提高对经过所述目标转发端口的目标流量的检测采样率。
可选的,所述装置还包括:
获取模块,用于在所述向指定网络设备发送第一通知消息之前,获取预先记录的各被测流量经过的网络设备的转发端口;或者,根据所述被测流量的源地址和目的地址,确定所述被测流量经过的网络设备的转发端口;
筛选模块,用于根据所述被测流量经过的网络设备的转发端口,从所述被测流量中筛选出经过所述目标转发端口的目标流量;
确定模块,用于将对所述目标流量进行采样的网络设备,确定为所述指定网络设备。
可选的,所述接收模块,还用于在所述向指定网络设备发送第一通知消息之后,接收所述目标网络设备发送的拥塞解除消息,所述拥塞解除消息为所述目标网络设备在检测到所述目标转发端口由拥塞状态转换为正常状态的情况下发送的消息;
所述发送模块,还用于响应于所述接收模块接收的所述拥塞解除消息,向所述指定网络设备发送第二通知消息,所述第二通知消息用于通知所述指定网络设备降低对所述目标流量的检测采用率。
可选的,所述发送模块,具体用于:
响应于所述拥塞解除消息,在等待预设时长后,向所述指定网络设备发送所述第二通知消息。
可选的,所述装置还包括:
判断模块,用于在所述向所述指定网络设备发送第一通知消息之前,判断所述指定网络设备当前对所述目标流量的检测采样率是否已被提高;若否,则调用所述发送模块执行所述向指定网络设备发送第一通知消息的步骤;
所述判断模块,还用于在所述向所述指定网络设备发送第二通知消息之前,判断所述目标流量经过的各网络设备的转发端口是否均为正常状态,若是,则调用所述发送模块执行所述向所述指定网络设备发送第二通知消息的步骤。
可选的,所述指定网络设备为随流检测网络中所述目标流量经过的头节点,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为检测域内需对所述目标流量进行采样检测的各检测设备,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为用于生成所述目标流量的探测设备,所述目标流量包括需要由所述目标转发端口转发的探测报文。
本申请实施例的第五方面,提供了一种流量采样系统,所述系统包括:多个网络设备和采集控制器,每个网络设备均与所述采集控制器连接;
所述网络设备,用于执行第一方面任一项所述的流量采样方法;
所述采集控制器,用于执行第二方面任一项所述的流量采样方法。
本申请实施例的第六方面,提供了一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面或者第二方面任一项所述的流量采样方法步骤。
本申请实施例的第七方面,提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面或者第二方面任一项所述的流量采样方法步骤。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的流量采样方法。
本申请实施例有益效果:
本申请实施例提供的流量采样方法、装置、系统、电子设备及介质,网络设备可以通过内置的硬件芯片读取各转发端口的状态参数,并以此判断各转发端口是否处于拥塞状态。在存在处于拥塞状态的目标转发端口的情况下,向采集控制器发送拥塞告警消息,使得采集控制器通知指定网络设备提高对经过目标转发端口的目标流量的检测采样率。由于本申请实施例在网络设备的转发端口拥塞时,可以提高对经过该转发端口流量的采样率,以使得指定网络设备使用提高后的检测采样率对目标流量进行采样,避免在转发端口短暂拥塞时未对经过该转发端口的流量进行测量,导致无法检测出该转发端口发生拥塞的问题,可以提高该转发端口拥塞时的测量准确度。而且本申请实施例是在在转发端口拥塞时灵活提高采样率,而不是一直使用较高的采样率,因此能够保证较小的资源消耗。所以本申请实施例实现了在兼顾资源消耗的基础上,提高测量准确度,使得测量结果更能反映网络的真实状态和服务水平。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的实施例。
图1为相关技术中的随流检测系统结构示意图;
图2为本申请实施例提供的一种流量采样系统的结构示意图;
图3为本申请实施例提供的一种流量采样方法的流程图;
图4为本申请实施例提供的一种网络设备与采集控制器交互过程的示例性示意图;
图5为本申请实施例提供的另一种流量采样方法的流程图;
图6为本申请实施例提供的一种确定指定网络设备的方法流程图;
图7为本申请实施例提供的另一种流量采样系统的结构示意图;
图8为本申请实施例提供的另一种流量采样方法的流程图;
图9为本申请实施例提供的一种流量采样装置的结构示意图;
图10为本申请实施例提供的另一种流量采样装置的结构示意图;
图11为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员基于本申请所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例提供的流量采样方法可以应用在流量采样系统中,如图2所示,该系统包括:多个网络设备201和采集控制器202,每个网络设备201均与采集控制器202连接,且网络设备201之间可以根据组网需求相互连接。
网络设备201,用于转发流量。网络设备201可以是路由器或者交换机等能够转发流量的设备。
采集控制器202,用于管理对各流量的采样率。采集控制器202可以是服务器或其他能够进行数据处理以及消息收发的设备。
图2为本申请实施例提供的一种示例,流量采样系统中各设备的数量不限于此。
为了在兼顾资源消耗的基础上,提高测量准确度,本申请实施例提供了一种流量采样方法,该方法应用于图2所示的网络设备,如图3所示,该方法包括如下步骤:
S301、通过硬件芯片获取每个转发端口的状态参数。
其中,状态参数用于表示转发端口的拥塞程度。即,状态参数能够表示转发端口的忙碌程度,也就是转发端口的负载情况。例如,状态参数为转发端口单位时间内转发的流量大小。单位时间内转发的流量越大,转发端口负载越高,因此拥塞程度越高;反之,单位时间内转发的流量越小,转发端口负载越低,因此拥塞程度越低。
本申请实施例中,网络设备内置的硬件芯片可以周期性地读取所在网络设备中各转发端口的状态参数。
S302、通过硬件芯片针对每个转发端口,基于该转发端口的状态参数,确定该转发端口的转发状态。
在本申请实施例中,转发端口的转发状态可以是正常状态或者拥塞状态,其中,拥塞状态表示转发端口的拥塞程度较高,即转发端口的负载较高。反之,正常状态表示转发端口的拥塞程度较低,即转发端口的负载较低。
可选的,可以通过比较状态参数与预设阈值之间的大小关系,来确定该转发端口的转发状态。例如,当转发端口的单位时间内转发的流量大小大于等于预设阈值时,确定该转发端口的转发状态为拥塞状态;当转发端口的单位时间内转发的流量小于预设阈值时,确定该转发端口的转发状态为正常状态。
S303、如果存在转发状态为拥塞状态的目标转发端口,则向采集控制器发送拥塞告警消息。
其中,拥塞告警消息用于指示采集控制器通知指定网络设备,提高对经过目标转发端口的目标流量的检测采样率。
在本申请实施例中,如果存在转发状态为拥塞状态的目标转发端口,则硬件芯片可以向所在网络设备的中央处理器(Central Processing Unit,CPU)发送拥塞信息,以通知CPU目标转发端口处于拥塞状态,例如拥塞信息包括目标转发端口的端口身份标识号(Identity document,ID)。使得CPU可以向采集控制器发送拥塞告警消息。其中,拥塞告警消息携带目标转发端口的端口ID以及该网络设备的设备ID。
采集控制器收到拥塞告警消息后,确定经过该网络设备的目标转发端口的目标流量,并确定对目标流量进行采样的指定网络设备。然后向指定网络设备发送第一通知消息,以通知指定网络设备提高对目标流量的检测采样率,以使得指定网络设备使用提高后的检测采样率对目标流量进行采样。
本申请实施例提供的流量采样方法中,网络设备可以通过内置的硬件芯片读取各转发端口的状态参数,并以此判断各转发端口是否处于拥塞状态。在存在处于拥塞状态的目标转发端口的情况下,向采集控制器发送拥塞告警消息,使得采集控制器通知指定网络设备提高对经过目标转发端口的目标流量的检测采样率。由于本申请实施例在网络设备的转发端口拥塞时,可以提高对经过该转发端口流量的采样率,以使得指定网络设备使用提高后的检测采样率对目标流量进行采样,避免在转发端口短暂拥塞时未对经过该转发端口的流量进行测量,导致无法检测出该转发端口发生拥塞的问题,可以提高该转发端口拥塞时的测量准确度。而且本申请实施例是在在转发端口拥塞时灵活提高采样率,而不是一直使用较高的采样率,因此能够保证较小的资源消耗。所以本申请实施例实现了在兼顾资源消耗的基础上,提高测量准确度,使得测量结果更能反映网络的真实状态和服务水平。
在本申请的一个实施例中,上述转发端口的状态参数包括:端口流量计数值和/或端口输出队列长度。其中,端口流量计数值为转发端口已转发的流量大小的累计值,端口输出队列长度为转发端口待转发的流量大小总和。
如图4所示,本申请实施例中,网络设备包括硬件芯片、CPU和n个转发端口,每个转发端口包括流量计数器和/或存储器,图4中示例性地示出了端口1流量计数器或者存储器,端口2流量计数器或者存储器和端口n的流量计数器或者存储器。硬件芯片可以周期性地读取每个转发端口的流量计数器的计数值,得到端口流量计数值。流量计数器用于记录转发端口已转发的流量大小的累计值。和/或,硬件芯片可以周期性地读取每个转发端口的存储器的使用量,得到端口输出队列长度。存储器用于存储转发端口待转发的流量大小总和。后续硬件芯片可以在存在转发状态为拥塞状态的目标转发端口时,通过网络设备的CPU向采集控制器发送拥塞告警消息。以使得采集控制器向指定网络设备发送第一通知消息。
需要说明的是,发送告警消息的网络设备与对目标流量进行采样的指定网络设备可以是同一个设备,图4以这种情况为例进行说明。
上述S302中网络设备的硬件芯片确定每个转发端口的转发状态的方式,可以实现为:针对该转发端口,如果本次读取的端口流量计数值和上一次读取的端口流量计数值之间的流量计数差值满足第一预设条件,或者本次读取的端口输出队列长度满足第二预设条件,或者流量计数差值满足第一预设条件且本次读取的端口输出队列长度满足第二预设条件,则确定该转发端口的转发状态为拥塞状态。否则,确定该转发端口的转发状态为正常状态。
本次读取的端口流量计数值和上一次读取的端口流量计数值之间的流量计数差值,能够表现本次读取时刻与上一次读取时刻之间的时间段内,转发端口转发的流量大小。流量计数差值越大,转发端口转发的流量越多,因此拥塞程度越高;反之,流量计数差值越小,转发端口转发的流量越少,因此拥塞程度越低。
本次读取的端口输出队列长度为转发端口待转发的流量大小总和,能够表现转发端口待完成的任务量,因此端口输出队列长度越大,转发端口待完成的任务量越多,因此拥塞程度越高;反之,端口输出队列长度越小,转发端口待完成的任务量越少,因此拥塞程度越低。
本申请实施例中,硬件芯片可以实时地读取各转发端口的状态参数,并对转发端口的状态进行判断。由于硬件芯片内置的微处理器能够以毫秒级间隔快速周期性地读取各转发端口的状态参数,并更快速地进行转发状态的判断,因此本申请实施例能够更快速地感知各转发端口的转发状态,以便在转发端口处于拥塞状态时,及时调整经过该转发端口的目标流量的采样率,使得指定网络设备能够使用调整后的检测采样率对目标流量进行采样,从而增加转发端口处于拥塞状态的情况下采集的测量数据,以便分析出更真实的网络状态。
可选的,上述第一预设条件为:流量计数差值大于等于第一预设阈值;或者,端口流速大于等于第二预设阈值,端口流速为流量计数差值与端口流量计数值的读取时间间隔之间的比值;或者,端口利用率大于等于第三预设阈值,端口利用率为端口流速与额定带宽之间的比值。
第一预设阈值、第二预设阈值和第三预设阈值可以根据实际情况设置。例如,当设置每间隔一毫秒读取一次流量计数值时,第一预设阈值可以设置为8兆比特(Megabit,Mbit)。例如,当额定带宽为10吉比特每秒(Gigabit/second,Gb/s)时,第二预设阈值可以设置为8Gb/s。例如,当网络设备的性能较高时,可以设置第三预设阈值为80%。
可选的,上述第二预设条件为:本次读取的端口输出队列长度大于等于第四预设阈值;或者,端口输出队列缓存占用率大于等于第五预设阈值,端口输出队列缓存占用率为本次读取的端口输出队列长度与最大输出队列之间的比值。最大输出队列为转发端口的存储器的最大缓存量。
第四预设阈值和第五预设阈值可以根据实际情况设置。例如,当网络设备的性能较高时,可以设置第四预设阈值为4兆字节(Megabyte,Mb)。当存储器的最大缓存量较高时,可以设置第五预设阈值为60%。
通过设置第一预设条件和第二预设条件,本申请实施例可以基于流量计数差值和或端口输出队列长度,判断出转发端口的转发状态,从而实时地监控各转发端口是否拥塞。
可选的,本申请实施例中,网络设备向采集控制器发送的拥塞告警消息中,还可以包括表示转发端口状态的参数,例如包括流量计数差值、端口流速、端口利用率、端口输出队列长度或者端口输出队列缓存占用率。以使得采集控制器可以基于表示转发端口状态的参数,确定提高后的目标流量的检测采样率,并向指定网络设备发送包括确定的检测采样率的第一通知消息,以便指定网络设备基于第一通知消息包括的检测采样率对目标流量进行采样。
或者,本申请实施例中,指定网络设备中可以预先记录各被测流量的拥塞采样率和常规采样率,其中拥塞采样率大于常规采样率,每种采样率存在对应的标识。这种情况下,采集控制器向指定网络设备发送的第一通知消息中可以包括拥塞采样率的标识,使得指定网络设备可以将目标流量的检测采样率设置为第一通知消息包括的拥塞采样率的标识对应的拥塞采样率,之后基于拥塞采样率对目标流量进行采样。
在本申请的一个实施例中,上述S303中,网络设备的硬件芯片可以在确定存在目标转发端口时,立即通过所在网络设备的CPU向采集控制器发送拥塞告警消息。
或者,在本申请的另一个实施例中,网络设备的硬件芯片可以在确定存在转发状态为拥塞状态的目标转发端口,且目标转发端口持续指定时长处于拥塞状态时,通过该CPU向采集控制器发送拥塞告警消息。
硬件芯片可以针对每个转发端口,在确定该转发端口由正常状态转换为拥塞状态时开始计时,如果计时时长达到指定时长,且该转发端口持续处于拥塞状态,则通过CPU向采集控制器发送拥塞告警消息。
或者,硬件芯片可以针对每个转发端口,记录该转发端口由正常状态转换为拥塞状态的时刻,作为起始拥塞时刻。后续每次确定该转发端口的转发状态时,如果转发状态仍为拥塞状态,则计算当前时刻与起始拥塞时刻之间的时间差,若时间差达到指定时长,则通过CPU向采集控制器发送拥塞告警消息。如果后续确定的该转发接口的转发状态为正常状态,则删除起始拥塞时刻。
本申请实施例可以在转发端口持续处于拥塞状态时,向采集控制器发送拥塞告警消息,减少误报的情况。
在本申请的一个实施例中,在上述S303中网络设备的硬件芯片通过网络设备的CPU向采集控制器发送拥塞告警消息之后,硬件芯片还可以在目标转发端口由拥塞状态转换为正常状态时,通过CPU向采集控制器发送拥塞解除消息。其中,拥塞解除消息用于指示采集控制器通知指定网络设备降低对目标流量的检测采样率。
由于目标转发端口由拥塞状态转换为正常状态时,可以用较低的采样率采集目标转发端口的测量数据,因此可以指示指定网络设备降低对目标流量的检测采样率,使得指定网络设备使用降低后的检测采样率对目标流量进行采样。
本申请实施例可以在网络设备的转发端口的拥塞解除时,降低对经过该端口的流量的采样率,由于拥塞解除后,端口转发状态平稳,因此测量数据之间差别较小,因此可以使用较低的采样率采集测量数据。而且较低的采样率还能节省网络设备采集测量数据消耗的处理资源。
本申请实施例提供的流量采样方法可以应用在各种流量检测场景中,包括主动测量、被动测量和混合测量。不同的检测场景中,对流量进行采样的指定网络设备不同。
在混合测量的随流检测场景中,指定网络设备为随流检测网络中目标流量经过的头节点。这种情况下,目标流量为需要由目标转发端口转发的业务流量,检测采样率为接收到的流量与采样的流量之间的比例,例如检测采样率为1000:1。
在随流检测场景中,目标流量在经过随流检测网络中第一个网络设备时,由该网络设备对目标流量进行采样,该网络设备为头节点。头节点在采样的流量中设置测量标记并在IP报文头部插入测量信息,使得后续网络设备接收到该流量时,能够基于测量标记确定该流量为被采样的流量,并继续往IP报文头部插入测量信息。直至该流量在随流检测网络中经过最后一个网络设备时,由该网络设备往IP报文头部插入测量信息,并将所有的测量信息从IP报文头部剥离,并上报给分析器。
在被动测量场景中,指定网络设备为检测域内需对目标流量进行采样检测的各检测设备。这种情况下,目标流量为需要由目标转发端口转发的业务流量,检测采样率为接收到的流量与采样的流量之间的比例。
在被动测量场景中,可以从已有的网络中选择多个网络设备作为检测设备,构成检测域。检测域内的每个检测设备均可以转发业务流量,同时检测设备还可以对接收到的业务流量进行采样,并转发给分析器。每种业务流量经过至少一个检测设备。
在主动测量场景中,指定网络设备为用于生成目标流量的探测设备。这种情况下,目标流量包括需要由目标转发端口转发的探测报文,检测采样率为发送探测报文的时间间隔,例如检测采样率为10毫秒。
在主动测量场景中,探测服务器可以按照一定的采样率发送探测报文,探测服务器内置有测量功能,例如测量功能为基于双向主动测量协议(Two-Way ActiveMeasurement Protocol,TWAMP)的功能。或者还可以通过外挂有探针的方式进行主动测量。
本申请实施例能够在各种检测场景中控制流量的采样率,因此本申请实施例的应用范围较广,在随流检测、主动测测量和被动测量场景下,均能兼顾资源消耗量和测量准确度。
基于相同的发明构思,本申请实施例还提供了一种流量采样方法,应用于图2所示的采集控制器,如图5所示,该方法包括如下步骤:
S501、接收目标网络设备发送的拥塞告警消息。
其中,拥塞告警消息为目标网络设备通过硬件芯片在基于各转发端口的状态参数,检测到存在转发状态为拥塞状态的目标转发端口的情况下,通过目标网络设备的CPU发送的消息。
S502、响应于拥塞告警消息,向指定网络设备发送第一通知消息。
其中,第一通知消息用于通知指定网络设备提高对经过目标转发端口的目标流量的检测采样率。
拥塞告警消息包括目标网络设备的设备ID和目标转发端口的端口ID,使得采集控制器可以确定目标网络设备中的目标转发端口。然后确定经过目标转发端口的目标流量,并确定对目标流量进行采样的指定网络设备。之后向指定网络设备发送第一通知消息。
可选的,第一通知消息中可以包括采集控制器确定的提高后的检测采样率,以使得指定网络设备按照第一通知消息包括的检测采样率,对目标流量进行采样。其中,采集控制器提高检测采样率的方式可以根据实际需要设置,本申请实施例对此不作具体限定。例如,采集控制器中记录的目标流量的常规采样率为1000:1,即从1000个目标流量中采集一个。采集控制器可以确定一个高于常规采样率的检测采样率,例如10:1。
或者,指定网络设备中可以预先记录每种被测流量的拥塞采样率和常规采样率,其中拥塞采样率大于常规采样率,每种采样率存在对应的标识。这种情况下,采集控制器向指定网络设备发送的第一通知消息中可以包括拥塞采样率的标识,使得指定网络设备可以将目标流量的检测采样率设置为第一通知消息包括的拥塞采样率的标识对应的拥塞采样率。
本申请实施例提供的流量采样方法中,网络设备可以通过内置的硬件芯片读取各转发端口的状态参数,并以此判断各转发端口是否处于拥塞状态。在存在处于拥塞状态的目标转发端口的情况下,向采集控制器发送拥塞告警消息,使得采集控制器通知指定网络设备提高对经过目标转发端口的目标流量的检测采样率。由于本申请实施例在网络设备的转发端口拥塞时,可以提高对经过该转发端口流量的采样率,以使得指定网络设备使用提高后的检测采样率对目标流量进行采样,避免在转发端口短暂拥塞时未对经过该转发端口的流量进行测量,导致无法检测出该转发端口发生拥塞的问题,可以提高该转发端口拥塞时的测量准确度。而且本申请实施例是在在转发端口拥塞时灵活提高采样率,而不是一直使用较高的采样率,因此能够保证较小的资源消耗。所以本申请实施例实现了在兼顾资源消耗的基础上,提高测量准确度,使得测量结果更能反映网络的真实状态和服务水平。
在本申请的一个实施例中,如图6所示,采集控制器在上述S502向指定网络设备发送第一通知消息之前,还需要确定指定网络设备,包括如下步骤:
S601、获取预先记录的各被测流量经过的网络设备的转发端口;或者根据被测流量的源地址和目的地址,确定被测流量经过的网络设备的转发端口。
本申请实施例中,可以在采集控制器中预先记录各被测流量经过的网络设备的转发端口。例如,针对每个被测流量,按照顺序记录该被测流量经过的每个网络设备的ID,以及经过该网络设备的端口ID。
或者,可以在采集控制器中预先记录每个被测流量的源地址和目的地址。采集控制器可以在需要发送第一通知消息之前,收集全网拓扑信息得到全局拓扑视图,并基于内部网关协议(Interior Gateway Protocol,IGP)算法,根据被测流量的源地址和目的地址,确定出该被测流量经过的网络设备,以及经过网络设备的端口。例如,IGP算法可以是开放式最短路径优先(Open Shortest Path First,OSPF)算法。
或者,在随流检测场景中,头节点中可以配置被测业务流量标识,当头节点接收到被测业务流量时,可以获取被测业务流量的源地址和目的地址,并向采集控制器发送该被测业务流量的源地址和目的地址。使得采集控制器可以根据最短路径算法,确定出该被测流量经过的网络设备,以及经过网络设备的端口。
S602、根据被测流量经过的网络设备的转发端口,从被测流量中筛选出经过目标转发端口的目标流量。
每种被测流量存在一条或多条传输路径,本申请实施例可以将任一条传输路径经过目标转发端口的被测流量,作为目标流量。
例如,如图7所示,图7中的PE1和PE2以及P1-P4均为转发流量的网络设备,PE1和PE2以及P1-P4均与采集控制器通信连接,PE1还可以连接客户网络1,PE2还可以连接客户网络2。假设被测流量存在两条传输路径,第一条传输路径经过的端口包括:PE1的端口A、P1的端口B、P2的端口C和PE2的端口D;第二条传输路径经过的端口包括PE1的端口A、P3的端口E、P4的端口F和PE2的端口D。假设目标转发端口为P1的端口B,由于该被测流量的第一条传输路径经过目标转发端口,因此将该被测流量确定为目标流量。
S603、将对目标流量进行采样的网络设备,确定为指定网络设备。
本申请实施例提供的流量采样方法可以应用在各种流量检测场景中,包括主动测量、被动测量和混合测量。不同的检测场景中,对流量进行采样的指定网络设备不同。
在混合测量的随流检测场景中,指定网络设备为随流检测网络中目标流量经过的头节点。在S602获取确定目标流量时,采集控制器能够得到目标流量在随流检测网络中经过的头节点,因此将头节点作为指定网络设备。这种情况下,目标流量为需要由目标转发端口转发的业务流量,检测采样率为接收到的流量与采样的流量之间的比例。
在被动测量场景中,指定网络设备为检测域内需对目标流量进行采样检测的各检测设备。采集控制器中可以预先记录每种被测流量对应的检测设备标识,使得确定目标流量后,采集控制器能够得到目标流量对应的检测设备标识,从而确定出指定网络设备。这种情况下,目标流量为需要由目标转发端口转发的业务流量,检测采样率为接收到的流量与采样的流量之间的比例。
在主动测量场景中,指定网络设备为用于生成目标流量的探测设备。采集控制器中可以预先记录生成被测流量的探测设备,使得确定目标流量后,能够确定出生成目标流量的探测设备。这种情况下,目标流量包括需要由目标转发端口转发的探测报文,检测采样率为发送探测报文的时间间隔。
本申请实施例中,采集控制器能够确定经过目标转发端口的目标流量,并确定对目标流量进行采样的指定网络设备,使得后续可以通知指定网络设备提高对目标流量的采样率,使得指定网络设备使用提高后的检测采样率对目标流量进行采样。而且本申请实施例适用于各种检测场景,使得本申请实施例的应用范围广。
在本申请的一个实施例中,在上述S502采集控制器向指定网络设备发送第一通知消息之后,采集控制器还可以在目标转发端口解除拥塞时,恢复目标流量的采样率。具体方式包括以下两个步骤:
步骤一、接收目标网络设备发送的拥塞解除消息。其中,拥塞解除消息为目标网络设备在检测到目标转发端口由拥塞状态转换为正常状态的情况下发送的消息。
拥塞解除消息可以包括目标网络设备的设备ID和目标转发端口的端口ID,使得采集控制器可以确定目标网络设备中的目标转发端口。进而确定经过目标转发端口的目标流量,并确定对目标流量进行采样的指定网络设备。
步骤二、响应于拥塞解除消息,向指定网络设备发送第二通知消息。其中,第二通知消息用于通知指定网络设备降低对目标流量的检测采用率。
可选的,第二通知消息中可以包括采集控制器确定的降低后的检测采样率,以使得指定网络设备按照第一通知消息包括的检测采样率,对目标流量进行采样。其中,采集控制器降低检测采样率的方式可以根据实际需要设置,本申请实施例对此不作具体限定。例如,采集控制器中记录有目标流量的常规采样率,采集控制器可以将目标流量的常规采样率作为降低后的检测采样率。
或者,指定网络设备中可以预先记录每种被测流量的拥塞采样率和常规采样率,其中拥塞采样率大于常规采样率,每种采样率存在对应的标识。这种情况下,采集控制器向指定网络设备发送的第二通知消息中可以包括常规采样率的标识,使得指定网络设备可以将目标流量的检测采样率设置为第二通知消息包括的常规采样率的标识对应的常规采样率,之后指定网络设备可使用降低后的检测采样率对目标流量进行采样。
在本申请实施例中,采集控制器可以在接收到拥塞解除消息后,立即向指定网络设备发送第二通知消息。或者,采集控制器可以响应于拥塞解除消息,在等待预设时长后,向指定网络设备发送第二通知消息,以实现在目标转发端口恢复为正常状态的一段时间内获取更多的测量数据,从而方便分析端口状态趋势。
本申请实施例可以在网络设备的转发端口的拥塞解除时,降低对经过该端口的流量的采样率,由于拥塞解除后,端口转发状态平稳,因此测量数据之间差别较小,因此可以使用较低的采样率采集测量数据。而且较低的采样率还能节省网络设备采集测量数据消耗的处理资源。
在本申请实施例中,由于被测流量经过多个网络设备的转发端口,而每个网络设备的转发端口均可能处于拥塞状态。
在本申请的一个实施例中,采集控制器可以在接收到任一网络设备发送的拥塞告警消息时,向指定网络设备发送第一通知消息。
这种情况下,采集控制器可以在接收到任一网络设备发送的拥塞解除消息时,向指定网络设备发送第二通知消息。
或者,在本申请的另一个实施例中,采集控制器还可以在接收到目标网络设备发送的拥塞告警消息之后,判断指定网络设备当前对目标流量的检测采样率是否已被提高。若否,则向指定网络设备发送第一通知消息。
即,采集控制器可以在接收到任一网络设备发送的拥塞告警消息之后,判断目标流量经过的其他网络设备在此之前是否已指示提高目标流量的检测采样率,若是,则不重复提高目标流量的检测采样率。若否,则通过发送第二通知消息提高目标流量的检测采样率。
这种情况下,采集控制器可以在接收到目标网络设备发送的拥塞解除消息之后,判断目标流量经过的各网络设备的转发端口是否均为正常状态,若是,则向指定网络设备发送第二通知消息。
即,采集控制器可以在接收到任一网络设备发送的拥塞解除消息之后,判断目标流量经过的所有转发端口均为正常状态。若是,则通过发送第二通知消息降低目标流量的采样率。若否,则不发送第二通知消息。
本申请实施例中,采集控制器可以在目标流量经过的至少一个转发端口处于拥塞状态的情况下,保持指定网络设备使用较高的采样率对目标流量进行采样。在目标流量经过的所有转发端口均处于正常状态的情况下,控制指定网络设备使用较低的采样率对目标流量进行采样。从而在保证资源消耗的基础上,获取更多的目标流量的检测数据,以提高测量准确度。
参见图8,以下结合具体应用场景,对本申请实施例提供的流量采样方法进行说明:
S801、网络设备的硬件芯片周期性地读取每个转发端口的状态参数。
其中,状态参数可以是端口流量计数值或者端口输出队列长度。
S802、硬件芯片判断是否存在处于拥塞状态的目标转发端口。若存在,则执行S803;否则返回S801。
一种实现方式中,硬件芯片可以根据各转发端口的端口流量计数值,计算端口利用率,并判断端口利用率是否达到第三预设阈值;或者根据各转发端口的端口输出队列长度,计算端口输出队列缓存占用率,并判断端口输出队列缓存占用率是否达到第五预设阈值。
S803、硬件芯片判断目标转发端口是否持续指定时长处于拥塞状态。若是,则执行S804;否则返回S801。
S804、硬件芯片向CPU发送拥塞信息。拥塞信息包括目标转发端口的端口ID,以及端口利用率或端口输出队列缓存占用率。
S805、CPU向采集控制器发送拥塞告警消息。其中,拥塞告警消息包括该网络设备的设备ID、目标转发端口的端口ID,以及端口利用率或端口输出队列缓存占用率。
S806、采集控制器响应于拥塞告警消息,向指定网络设备发送第一通知消息。
S807、指定网络设备响应于第一通知消息,使用提高后的检测采样率对目标流量进行采样。
通过上述方法,在网络设备的转发端口拥塞时,可以提高对经过该转发端口流量的采样率,使得指定网络设备使用提高后的检测采样率对目标流量进行采样,避免在转发端口短暂拥塞时未对经过该转发端口的流量进行测量,导致无法检测出该转发端口发生拥塞的问题,可以提高该转发端口拥塞时的测量准确度。而且本申请实施例是在在转发端口拥塞时灵活提高采样率,而不是一直使用较高的采样率,因此能够保证较小的资源消耗。所以本申请实施例实现了在兼顾资源消耗的基础上,提高测量准确度,使得测量结果更能反映网络的真实状态和服务水平。
基于相同的发明构思,对应于上述方法实施例,本申请实施例提供了一种流量采样装置,应用于网络设备,如图9所示,该装置包括:获取模块901、确定模块902和发送模块903;
获取模块901,用于通过硬件芯片获取每个转发端口的状态参数,状态参数用于表示转发端口的拥塞程度;
确定模块902,用于通过硬件芯片针对每个转发端口,基于获取模块901获取的该转发端口的状态参数,确定该转发端口的转发状态;
发送模块903,用于如果存在转发状态为拥塞状态的目标转发端口,则向采集控制器发送拥塞告警消息;拥塞告警消息用于指示采集控制器,通知指定网络设备,提高对经过目标转发端口的目标流量的检测采样率。
可选的,状态参数包括:端口流量计数值和/或端口输出队列长度,端口流量计数值为转发端口已转发的流量大小的累计值,端口输出队列长度为转发端口待转发的流量大小总和;
确定模块902,具体用于:针对该转发端口,如果本次读取的端口流量计数值和上一次读取的端口流量计数值之间的流量计数差值满足第一预设条件,或者本次读取的端口输出队列长度满足第二预设条件,或者流量计数差值满足第一预设条件且本次读取的端口输出队列长度满足第二预设条件,则确定该转发端口的转发状态为拥塞状态;
否则,确定该转发端口的转发状态为正常状态。
可选的,第一预设条件为:流量计数差值大于等于第一预设阈值;或者,端口流速大于等于第二预设阈值,端口流速为流量计数差值与端口流量计数值的读取时间间隔之间的比值;或者,端口利用率大于等于第三预设阈值,端口利用率为端口流速与额定带宽之间的比值;
第二预设条件为:本次读取的端口输出队列长度大于等于第四预设阈值;或者,端口输出队列缓存占用率大于等于第五预设阈值,端口输出队列缓存占用率为本次读取的端口输出队列长度与最大输出队列之间的比值。
可选的,发送模块903,具体用于:
如果存在转发状态为拥塞状态的目标转发端口,且目标转发端口持续指定时长处于拥塞状态,则向采集控制器发送拥塞告警消息。
可选的,发送模块903,还用于在向采集控制器发送拥塞告警消息之后,如果目标转发端口由拥塞状态转换为正常状态,则向采集控制器发送拥塞解除消息;其中,拥塞解除消息用于指示采集控制器通知指定网络设备降低对目标流量的检测采样率。
可选的,指定网络设备为随流检测网络中目标流量经过的头节点,目标流量为需要由目标转发端口转发的业务流量;或者,
指定网络设备为检测域内需对目标流量进行采样检测的各检测设备,目标流量为需要由目标转发端口转发的业务流量;或者,
指定网络设备为用于生成目标流量的探测设备,目标流量包括需要由目标转发端口转发的探测报文。
基于相同的发明构思,对应于上述方法实施例,本申请实施例还提供了一种流量采样装置,应用于采集控制器,如图10所示,该装置包括:接收模块1001和发送模块1002;
接收模块1001,用于接收目标网络设备发送的拥塞告警消息;拥塞告警消息为目标网络设备通过硬件芯片在基于各转发端口的状态参数,检测到存在转发状态为拥塞状态的目标转发端口的情况下发送的消息;
发送模块1002,用于响应于接收模块1001接收的拥塞告警消息,向指定网络设备发送第一通知消息,第一通知消息用于通知指定网络设备提高对经过目标转发端口的目标流量的检测采样率。
可选的,该装置还包括:
获取模块,用于用于在向指定网络设备发送第一通知消息之前,获取预先记录的各被测流量经过的网络设备的转发端口;或者,根据被测流量的源地址和目的地址,确定被测流量经过的网络设备的转发端口;
筛选模块,用于根据被测流量经过的网络设备的转发端口,从被测流量中筛选出经过目标转发端口的目标流量;
确定模块,用于将对目标流量进行采样的网络设备,确定为指定网络设备。
可选的,接收模块1001,还用于在向指定网络设备发送第一通知消息之后,接收目标网络设备发送的拥塞解除消息,拥塞解除消息为目标网络设备在检测到目标转发端口由拥塞状态转换为正常状态的情况下发送的消息;
发送模块1002,还用于响应于接收模块1001接收的拥塞解除消息,向指定网络设备发送第二通知消息,第二通知消息用于通知指定网络设备降低对目标流量的检测采用率。
可选的,发送模块1002,具体用于:
响应于拥塞解除消息,在等待预设时长后,向指定网络设备发送第二通知消息。
可选的,该装置还包括:
判断模块,用于在向指定网络设备发送第一通知消息之前,判断指定网络设备当前对目标流量的检测采样率是否已被提高;若否,则调用发送模块1002执行向指定网络设备发送第一通知消息的步骤;
判断模块,还用于在向指定网络设备发送第二通知消息之前,判断目标流量经过的各网络设备的转发端口是否均为正常状态,若是,则调用发送模块1002执行向指定网络设备发送第二通知消息的步骤。
可选的,指定网络设备为随流检测网络中目标流量经过的头节点,目标流量为需要由目标转发端口转发的业务流量;或者,
指定网络设备为检测域内需对目标流量进行采样检测的各检测设备,目标流量为需要由目标转发端口转发的业务流量;或者,
指定网络设备为用于生成目标流量的探测设备,目标流量包括需要由目标转发端口转发的探测报文。
本发明实施例还提供了一种电子设备,如图11所示,包括处理器1101、通信接口1102、存储器1103和通信总线1104,其中,处理器1101,通信接口1102,存储器1103通过通信总线1104完成相互间的通信,
存储器1103,用于存放计算机程序;
处理器1101,用于执行存储器1103上所存放的程序时,实现上述方法实施例中由网络设备或者采集控制器执行的方法步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一流量采样方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一流量采样方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (27)

1.一种流量采样方法,其特征在于,应用于网络设备,所述方法包括:
通过硬件芯片获取每个转发端口的状态参数,所述状态参数用于表示转发端口的拥塞程度;
通过所述硬件芯片针对每个转发端口,基于该转发端口的状态参数,确定该转发端口的转发状态;
如果存在转发状态为拥塞状态的目标转发端口,则向采集控制器发送拥塞告警消息;所述拥塞告警消息用于指示所述采集控制器,通知指定网络设备,提高对经过所述目标转发端口的目标流量的检测采样率。
2.根据权利要求1所述的方法,其特征在于,所述状态参数包括:端口流量计数值和/或端口输出队列长度,所述端口流量计数值为转发端口已转发的流量大小的累计值,所述端口输出队列长度为转发端口待转发的流量大小总和;
所述基于该转发端口的状态参数,确定该转发端口的转发状态,包括:
针对该转发端口,如果本次读取的端口流量计数值和上一次读取的端口流量计数值之间的流量计数差值满足第一预设条件,或者本次读取的端口输出队列长度满足第二预设条件,或者所述流量计数差值满足所述第一预设条件且本次读取的端口输出队列长度满足所述第二预设条件,则确定该转发端口的转发状态为拥塞状态;
否则,确定该转发端口的转发状态为正常状态。
3.根据权利要求2所述的方法,其特征在于,所述第一预设条件为:所述流量计数差值大于等于第一预设阈值;或者,端口流速大于等于第二预设阈值,所述端口流速为所述流量计数差值与端口流量计数值的读取时间间隔之间的比值;或者,端口利用率大于等于第三预设阈值,所述端口利用率为所述端口流速与额定带宽之间的比值;
所述第二预设条件为:本次读取的端口输出队列长度大于等于第四预设阈值;或者,端口输出队列缓存占用率大于等于第五预设阈值,所述端口输出队列缓存占用率为本次读取的端口输出队列长度与最大输出队列之间的比值。
4.根据权利要求1-3任一项所述的方法,其特征在于,如果存在转发状态为拥塞状态的目标转发端口,则向采集控制器发送拥塞告警消息,包括:
如果存在转发状态为拥塞状态的目标转发端口,且所述目标转发端口持续指定时长处于拥塞状态,则向所述采集控制器发送所述拥塞告警消息。
5.根据权利要求1-3任一项所述的方法,其特征在于,在向采集控制器发送拥塞告警消息之后,所述方法还包括:
如果所述目标转发端口由拥塞状态转换为正常状态,则向所述采集控制器发送拥塞解除消息;其中,所述拥塞解除消息用于指示所述采集控制器通知所述指定网络设备降低对所述目标流量的检测采样率。
6.根据权利要求1-3任一项所述的方法,其特征在于,
所述指定网络设备为随流检测网络中所述目标流量经过的头节点,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为检测域内需对所述目标流量进行采样检测的各检测设备,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为用于生成所述目标流量的探测设备,所述目标流量包括需要由所述目标转发端口转发的探测报文。
7.一种流量采样方法,其特征在于,应用于采集控制器,所述方法包括:
接收目标网络设备发送的拥塞告警消息;所述拥塞告警消息为所述目标网络设备通过硬件芯片在基于各转发端口的状态参数,检测到存在转发状态为拥塞状态的目标转发端口的情况下发送的消息;
响应于所述拥塞告警消息,向指定网络设备发送第一通知消息,所述第一通知消息用于通知所述指定网络设备提高对经过所述目标转发端口的目标流量的检测采样率。
8.根据权利要求7所述的方法,其特征在于,在所述向指定网络设备发送第一通知消息之前,所述方法还包括:
获取预先记录的各被测流量经过的网络设备的转发端口;或者,根据所述被测流量的源地址和目的地址,确定所述被测流量经过的网络设备的转发端口;
根据所述被测流量经过的网络设备的转发端口,从所述被测流量中筛选出经过所述目标转发端口的目标流量;
将对所述目标流量进行采样的网络设备,确定为所述指定网络设备。
9.根据权利要求7或8所述的方法,其特征在于,在所述向指定网络设备发送第一通知消息之后,所述方法还包括:
接收所述目标网络设备发送的拥塞解除消息,所述拥塞解除消息为所述目标网络设备在检测到所述目标转发端口由拥塞状态转换为正常状态的情况下发送的消息;
响应于所述拥塞解除消息,向所述指定网络设备发送第二通知消息,所述第二通知消息用于通知所述指定网络设备降低对所述目标流量的检测采用率。
10.根据权利要求9所述的方法,其特征在于,所述响应于所述拥塞解除消息,向所述指定网络设备发送第二通知消息,包括:
响应于所述拥塞解除消息,在等待预设时长后,向所述指定网络设备发送所述第二通知消息。
11.根据权利要求9所述的方法,其特征在于,在所述向指定网络设备发送第一通知消息之前,所述方法还包括:
判断所述指定网络设备当前对所述目标流量的检测采样率是否已被提高;若否,则执行所述向指定网络设备发送第一通知消息的步骤;
在所述向所述指定网络设备发送第二通知消息之前,所述方法还包括:
判断所述目标流量经过的各网络设备的转发端口是否均为正常状态,若是,则执行所述向所述指定网络设备发送第二通知消息的步骤。
12.根据权利要求7或8所述的方法,其特征在于,
所述指定网络设备为随流检测网络中所述目标流量经过的头节点,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为检测域内需对所述目标流量进行采样检测的各检测设备,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为用于生成所述目标流量的探测设备,所述目标流量包括需要由所述目标转发端口转发的探测报文。
13.一种流量采样装置,其特征在于,应用于网络设备,所述装置包括:
获取模块,用于通过硬件芯片获取每个转发端口的状态参数,所述状态参数用于表示转发端口的拥塞程度;
确定模块,用于通过所述硬件芯片针对每个转发端口,基于获取模块获取的该转发端口的状态参数,确定该转发端口的转发状态;
发送模块,用于如果存在转发状态为拥塞状态的目标转发端口,则向采集控制器发送拥塞告警消息;所述拥塞告警消息用于指示所述采集控制器,通知指定网络设备,提高对经过所述目标转发端口的目标流量的检测采样率。
14.根据权利要求13所述的装置,其特征在于,所述状态参数包括:端口流量计数值和/或端口输出队列长度,所述端口流量计数值为转发端口已转发的流量大小的累计值,所述端口输出队列长度为转发端口待转发的流量大小总和;
所述确定模块,具体用于:针对该转发端口,如果本次读取的端口流量计数值和上一次读取的端口流量计数值之间的流量计数差值满足第一预设条件,或者本次读取的端口输出队列长度满足第二预设条件,或者所述流量计数差值满足所述第一预设条件且本次读取的端口输出队列长度满足所述第二预设条件,则确定该转发端口的转发状态为拥塞状态;
否则,确定该转发端口的转发状态为正常状态。
15.根据权利要求14所述的装置,其特征在于,所述第一预设条件为:所述流量计数差值大于等于第一预设阈值;或者,端口流速大于等于第二预设阈值,所述端口流速为所述流量计数差值与端口流量计数值的读取时间间隔之间的比值;或者,端口利用率大于等于第三预设阈值,所述端口利用率为所述端口流速与额定带宽之间的比值;
所述第二预设条件为:本次读取的端口输出队列长度大于等于第四预设阈值;或者,端口输出队列缓存占用率大于等于第五预设阈值,所述端口输出队列缓存占用率为本次读取的端口输出队列长度与最大输出队列之间的比值。
16.根据权利要求13-15任一项所述的装置,其特征在于,所述发送模块,具体用于:
如果存在转发状态为拥塞状态的目标转发端口,且所述目标转发端口持续指定时长处于拥塞状态,则向所述采集控制器发送所述拥塞告警消息。
17.根据权利要求13-15任一项所述的装置,其特征在于,
所述发送模块,还用于在向采集控制器发送拥塞告警消息之后,如果所述目标转发端口由拥塞状态转换为正常状态,则向所述采集控制器发送拥塞解除消息;其中,所述拥塞解除消息用于指示所述采集控制器通知所述指定网络设备降低对所述目标流量的检测采样率。
18.根据权利要求13-15任一项所述的装置,其特征在于,
所述指定网络设备为随流检测网络中所述目标流量经过的头节点,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为检测域内需对所述目标流量进行采样检测的各检测设备,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为用于生成所述目标流量的探测设备,所述目标流量包括需要由所述目标转发端口转发的探测报文。
19.一种流量采样装置,其特征在于,应用于采集控制器,所述装置包括:
接收模块,用于接收目标网络设备发送的拥塞告警消息;所述拥塞告警消息为所述目标网络设备通过硬件芯片在基于各转发端口的状态参数,检测到存在转发状态为拥塞状态的目标转发端口的情况下发送的消息;
发送模块,用于响应于所述接收模块接收的所述拥塞告警消息,向指定网络设备发送第一通知消息,所述第一通知消息用于通知所述指定网络设备提高对经过所述目标转发端口的目标流量的检测采样率。
20.根据权利要求19所述的装置,其特征在于,所述装置还包括:
获取模块,用于在所述向指定网络设备发送第一通知消息之前,获取预先记录的各被测流量经过的网络设备的转发端口;或者,根据所述被测流量的源地址和目的地址,确定所述被测流量经过的网络设备的转发端口;
筛选模块,用于根据所述被测流量经过的网络设备的转发端口,从所述被测流量中筛选出经过所述目标转发端口的目标流量;
确定模块,用于将对所述目标流量进行采样的网络设备,确定为所述指定网络设备。
21.根据权利要求19或20所述的装置,其特征在于,
所述接收模块,还用于在所述向指定网络设备发送第一通知消息之后,接收所述目标网络设备发送的拥塞解除消息,所述拥塞解除消息为所述目标网络设备在检测到所述目标转发端口由拥塞状态转换为正常状态的情况下发送的消息;
所述发送模块,还用于响应于所述接收模块接收的所述拥塞解除消息,向所述指定网络设备发送第二通知消息,所述第二通知消息用于通知所述指定网络设备降低对所述目标流量的检测采用率。
22.根据权利要求21所述的装置,其特征在于,所述发送模块,具体用于:
响应于所述拥塞解除消息,在等待预设时长后,向所述指定网络设备发送所述第二通知消息。
23.根据权利要求21所述的装置,其特征在于,所述装置还包括:
判断模块,用于在所述向指定网络设备发送第一通知消息之前,判断所述指定网络设备当前对所述目标流量的检测采样率是否已被提高;若否,则调用所述发送模块执行所述向指定网络设备发送第一通知消息的步骤;
所述判断模块,还用于在所述向所述指定网络设备发送第二通知消息之前,判断所述目标流量经过的各网络设备的转发端口是否均为正常状态,若是,则调用所述发送模块执行所述向所述指定网络设备发送第二通知消息的步骤。
24.根据权利要求19或20所述的装置,其特征在于,
所述指定网络设备为随流检测网络中所述目标流量经过的头节点,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为检测域内需对所述目标流量进行采样检测的各检测设备,所述目标流量为需要由所述目标转发端口转发的业务流量;或者,
所述指定网络设备为用于生成所述目标流量的探测设备,所述目标流量包括需要由所述目标转发端口转发的探测报文。
25.一种流量采样系统,其特征在于,所述系统包括:多个网络设备和采集控制器,每个网络设备均与所述采集控制器连接;
所述网络设备,用于执行权利要求1-6任一项所述的方法;
所述采集控制器,用于执行权利要求7-12任一项所述的方法。
26.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6或7-12任一项所述的方法步骤。
27.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6或7-12任一项所述的方法步骤。
CN202210535945.8A 2022-05-17 2022-05-17 一种流量采样方法、装置、系统、电子设备及介质 Pending CN115002009A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210535945.8A CN115002009A (zh) 2022-05-17 2022-05-17 一种流量采样方法、装置、系统、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210535945.8A CN115002009A (zh) 2022-05-17 2022-05-17 一种流量采样方法、装置、系统、电子设备及介质

Publications (1)

Publication Number Publication Date
CN115002009A true CN115002009A (zh) 2022-09-02

Family

ID=83026398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210535945.8A Pending CN115002009A (zh) 2022-05-17 2022-05-17 一种流量采样方法、装置、系统、电子设备及介质

Country Status (1)

Country Link
CN (1) CN115002009A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116032852A (zh) * 2023-03-28 2023-04-28 新华三工业互联网有限公司 基于会话的流量控制方法、装置、系统、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103312566A (zh) * 2013-06-28 2013-09-18 盛科网络(苏州)有限公司 检测报文端口拥塞的方法及装置
CN103379002A (zh) * 2012-04-13 2013-10-30 特克特朗尼克公司 电信网络的自适应监测
JP2016146581A (ja) * 2015-02-09 2016-08-12 日本電信電話株式会社 トラヒック情報収集装置およびトラヒック情報収集方法
CN107070805A (zh) * 2017-03-22 2017-08-18 上海华为技术有限公司 一种流量控制的方法及节点
CN111865716A (zh) * 2020-06-30 2020-10-30 新华三信息技术有限公司 一种端口拥塞检测方法、装置、设备及机器可读存储介质
CN112260899A (zh) * 2020-10-20 2021-01-22 盛科网络(苏州)有限公司 基于mmu的网络监测方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103379002A (zh) * 2012-04-13 2013-10-30 特克特朗尼克公司 电信网络的自适应监测
CN103312566A (zh) * 2013-06-28 2013-09-18 盛科网络(苏州)有限公司 检测报文端口拥塞的方法及装置
JP2016146581A (ja) * 2015-02-09 2016-08-12 日本電信電話株式会社 トラヒック情報収集装置およびトラヒック情報収集方法
CN107070805A (zh) * 2017-03-22 2017-08-18 上海华为技术有限公司 一种流量控制的方法及节点
CN111865716A (zh) * 2020-06-30 2020-10-30 新华三信息技术有限公司 一种端口拥塞检测方法、装置、设备及机器可读存储介质
CN112260899A (zh) * 2020-10-20 2021-01-22 盛科网络(苏州)有限公司 基于mmu的网络监测方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116032852A (zh) * 2023-03-28 2023-04-28 新华三工业互联网有限公司 基于会话的流量控制方法、装置、系统、设备及存储介质
CN116032852B (zh) * 2023-03-28 2023-06-02 新华三工业互联网有限公司 基于会话的流量控制方法、装置、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN108028778B (zh) 生成信息传输性能警告的方法、系统和装置
US8824429B2 (en) Automatic estimation of node location based on trace information
CN100356733C (zh) 记录介质、故障分析设备以及故障分析方法
EP2408154B1 (en) Optimal route selection apparatus, optimal route selection method, and program
EP2081321A2 (en) Sampling apparatus distinguishing a failure in a network even by using a single sampling and a method therefor
CN104584483B (zh) 用于自动确定服务质量降级的原因的方法和设备
US9178794B2 (en) Communication quality monitoring system, communication quality monitoring method and recording medium
JP2013207748A (ja) ネットワークシステム、及びノード装置
EP3682595B1 (en) Obtaining local area network diagnostic test results
JP2008283621A (ja) ネットワーク輻輳状況監視装置、ネットワーク輻輳状況監視方法及びプログラム
CN112260899B (zh) 基于mmu的网络监测方法和装置
CN115002009A (zh) 一种流量采样方法、装置、系统、电子设备及介质
CN112737940B (zh) 一种数据传输的方法和装置
JP2008182433A (ja) ルータ、その方法及びそれを用いた管理サーバ
CN112449252A (zh) 视频流系统的维护方法、装置、无线网桥设备及存储介质
JP4204053B2 (ja) パケット交換網の品質劣化箇所の切り分け方法およびその装置、ならびにそのプログラムと記録媒体
US10680756B2 (en) Packet classification apparatus, packet classification method and storage medium
JP2003037649A (ja) コンテンツ配信完了時刻の推定方法及び記録媒体並びにプログラム
WO2022152230A1 (zh) 信息流识别方法、网络芯片及网络设备
CN113055291B (zh) 一种数据包发送方法、路由器、数据包传输系统
US11265237B2 (en) System and method for detecting dropped aggregated traffic metadata packets
JP4282556B2 (ja) フローレベル通信品質管理装置と方法およびプログラム
JP2008258996A (ja) 統計情報収集装置
JP2001326687A (ja) パケット処理装置およびパケット交換ネットワーク
CN109218119B (zh) 网络丢包诊断方法及网络设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination