CN113055251B

CN113055251B - 一种面向高速网络的流量丢包状态实时感知方法

Info

Publication number: CN113055251B
Application number: CN202110414969.3A
Authority: CN
Inventors: 吴桦; 刘亚; 程光
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2021-04-17
Filing date: 2021-04-17
Publication date: 2022-06-03
Anticipated expiration: 2041-04-17
Also published as: CN113055251A

Abstract

本发明提出了一种面向高速网络的流量丢包状态实时感知方法，该方法能够实时检测出高速网络中使用TCP和UDP传输的服务的丢包状态。方法的具体步骤分为模型训练和模型使用两个场景。模型训练时，在可控的网络环境中进行流量抽样采集；根据传输协议的不同，设置特征Sketch的计数器从而提取出有效特征；根据提取的特征，训练机器学习分类模型，进而得到丢包预测模型。使用该模型时，首先在网络中的流量采集点抽样采集真实流量，并利用特征Sketch实时提取真实流量特征；使用丢包预测模型对真实流量特征进行识别分类，实时检测丢包状态。本发明可用于网络服务提供商在网络中间节点上对网络服务状态进行实时监测，为提高接入服务质量提供依据。

Description

一种面向高速网络的流量丢包状态实时感知方法

技术领域

本发明涉及一种面向高速网络的流量丢包状态实时感知方法技术，属于网络管理领域。

背景技术

近几年，随着Internet的迅速发展，出现了很多新的网络服务，这些网络服务为人们的日常生活提供了极大的便利，同时，这些服务的稳定性也是人们选择网络接入服务商的主要依据。然而，这些网络服务可能遭遇不同类型的网络攻击或通信故障，从而导致数据分组丢失，进一步影响用户的服务体验。因此，监控重要网络服务的流量，并实时检测服务流量丢包状态，对于网络接入服务提供商及时发现安全问题和管理故障，提供优质稳定网络接入服务来说具有重要意义。

当前，学术界对于网络流量的丢包检测已经提出了很多研究方法。根据原始流量数据获取方式的不同，可以将已有的丢包检测方法分为两类：主动丢包检测方法和被动丢包检测方法。虽然学术界提出了大量提高检测精度的主动丢包检测方法，但由于此类方法往往需要发送方和接收方的配合，因而对于网络接入服务商来说很难实现。因此网络接入服务商需要基于被动采集的流量进行监测。被动丢包检测方法主要包括基于概率论的丢包检测方法、基于 NetFlow功能的丢包检测方法和基于TCP头部信息的丢包检测方法，但这些问题均有各自的局限性。

(1)基于概率论的丢包检测方法

这类方法一般使用其他易于检测的特征(例如吞吐量，延迟时间)来推断数据分组的丢失，但这类方法不能定位网络丢包的时间，所以无法满足丢包检测的实时性要求，且准确率相对较低。

(2)基于NetFlow功能的丢包检测方法

这类方法使用网络设备的NetFlow功能来检测网络数据分组丢失。然而，NetFlow功能并不是为丢包检测设计的，其输出的统计流信息中丢失了很多信息，导致使用NetFlow流信息进行丢包检测的检测精度和实时性都不高。

(3)基于TCP头部信息的丢包检测方法

这类方法使用TCP协议的头部关键信息(例如序列号码、确认号等)来推断数据分组是否丢失，基本思想是使用重复数据分组和确认数据分组之间的逻辑关系来确认丢包数目。因为TCP的超时重传机制，这类方法往往是很耗时的，且必须采用全部的分组数据，无法在数据抽样的情况下使用，导致空间和时间耗费都很高。此外，这类方法也不能应用于UDP协议的丢包检测。

发明内容

为解决上述问题，本发明提出了一种面向高速网络的流量丢包状态实时感知方法，该方法能够实时检测出高速网络中使用TCP和UDP传输的服务的丢包状态。该方法的具体步骤分为模型训练和模型使用两个场景。模型训练时，在可控的网络环境中进行流量抽样采集；根据传输协议的不同，设置特征Sketch的计数器从而提取出有效特征；根据提取的特征，训练机器学习分类模型，进而得到丢包预测模型。使用该模型时，首先在网络中的流量采集点抽样采集真实流量，并利用特征Sketch实时提取真实流量特征；使用丢包预测模型对真实流量特征进行识别分类，实时检测丢包状态。本发明可用于网络服务提供商在网络中间节点上对网络服务状态进行实时监测，为提高接入服务质量提供依据。

为实现本发明的目的，本方案具体技术步骤如下：

步骤(1)在可控网络环境中通过数据采集设备进行流量的抽样采集；

步骤(2)根据传输协议的不同，设置特征Sketch的计数器从而提取出有效特征，传输协议分为TCP协议、基于UDP的UDT协议和QUIC协议；

步骤(3)对提取的特征构建数据集，进行机器学习分类模型的训练，训练后的模型即为丢包预测模型；

步骤(4)在网络中数据采集点通过数据采集设备抽样采集真实流量，并利用特征Sketch 实时提取流量的有效特征；

步骤(5)利用步骤(3)中训练好的丢包预测模型对步骤(4)中提取出来的有效特征进行分类，从而进行链路丢包状态的实时检测。

进一步的，所述步骤(1)具体包含如下子步骤：

(1.1)在客户端访问TCP直播，SRT直播(UDT协议)和QUIC视频应用；

(1.2)使用中间节点软路由上的tc模块对下行丢包进行设置，并使用tcpdump进行流量抽样采集，抽样率设为1：p，即每隔p个分组抽取一个分组；

(1.3)tcpdump停止采集，tc模块停止丢包设置，采集下一个丢包率下的应用流量数据；

(1.4)重复(1.1)～(1.3)操作，直到采集到足够多的训练数据。

进一步的，所述步骤(2)具体包含如下子步骤：

(2.1)抽样采集的流量被哈希函数处理后，对特征Sketch桶中的计数器进行插入操作；

(2.2)在插入操作过程中，判断计数器的值是否达到相应的计数器阈值，若达到阈值，则进行步骤(2.3)；若没有达到，则重复(2.1)～(2.2)；

(2.3)计数器达到阈值，进行一次特征提取操作，并将相应计数器值重置为0。

进一步的，所述步骤(2.1)中特征Sketch的TCP计数器和UDP计数器详细信息，如表5 和表6所示：

表5 TCP计数器名称及含义

TCP计数器	含义
		C0	客户端负载等于0的分组
Cd	客户端负载大于0的分组
		Cf	客户端有SYN和PSH标记的分组
Ca1	客户端负载在TCP区间1(0,83]内的分组
		Ca2	客户端负载在TCP区间2(83,375]内的分组
Ca3	客户端负载在TCP区间3(375,1000]内的分组
		S0	服务端负载等于0的分组
Sd	服务端负载大于0的分组
		Sf	服务端有SYN和PSH标记的分组
Sa1	服务端负载在TCP区间1(0,83]内的分组
		Sa2	服务端负载在TCP区间2(83,375]内的分组
Sa3	服务端负载在TCP区间3(375,1000]内的分组
		Csack	客户端分组中可选项中SACKs的个数

表6 UDP计数器名称及含义

UDP计数器	含义
		Ca1	客户端负载在UDP区间1(0,d]内的分组
Ca2	客户端负载在UDP区间2(d,140]内的分组
		Ca3	客户端负载在UDP区间3(140,1000]内的分组
Ca4	客户端负载在UDP区间4(1000,1472]内的分组
		Sa1	服务端负载在UDP区间1(0,d]内的分组
Sa2	服务端负载在UDP区间2(d,140]内的分组
		Sa3	服务端负载在UDP区间3(140,1000]内的分组
Sa4	服务端负载在UDP区间4(1000,1472]内的分组

表6中，传输协议为UDT协议时d取值为20字节，QUIC协议时d取值为32字节

进一步的，所述步骤(2.2)中判断是否达到阈值的TCP计数器为C0，Cd，S0和Sd；UDP计数器为Ca1，Ca2，Ca3，Ca4,Sa1，Sa2，Sa3和Sa4。阈值设置都为100。

进一步的，所述步骤(2.3)提取的TCP特征和UDP特征如表7和表8所示：

表7 TCP特征及含义

表8 UDP特征及含义

特征	含义
		Ca1/Pcs	客户端负载在UDP区间1内的分组个数/总的分组个数
Ca2/Pcs	客户端负载在UDP区间2内的分组个数/总的分组个数
		Ca3/Pcs	客户端负载在UDP区间3内的分组个数/总的分组个数
Ca4/Pcs	客户端负载在UDP区间4内的分组个数/总的分组个数
		Sa1/Pcs	服务端负载在UDP区间1内的分组个数/总的分组个数
Sa2/Pcs	服务端负载在UDP区间2内的分组个数/总的分组个数
		Sa3/Pcs	服务端负载在UDP区间3内的分组个数/总的分组个数
Sa4/Pcs	服务端负载在UDP区间4内的分组个数/总的分组个数
		Cp/Pcs	客户端分组个数/总的分组个数
Sp/Pcs	服务端分组个数/总的分组个数
		spdSD	服务器端字节传输速率
spdSP	服务器端分组传输速率

表7和表8中其他特征可根据基本计数器进行计算，spdSD和spdSD采用以下公式进行计算：

其中，p为抽样间隔，diffT为两次特征提取操作间隔，Num(sa_i)为服务器端负载在区间i 的分组的个数，Len(sa_i)为服务端负载在区间i的分组的长度。

进一步的，所述步骤(3)中机器学习分类模型采用基于决策树的XGBoost集成方法，该方法将模型上次预测(由t-1棵树组合而成的模型)产生的误差作为参考进行下一棵树(第t棵树)的建立。每加入一棵树，模型损失函数不断降低，经过若干轮学习后得到XGBoost算法分类器，即丢包预测模型。

进一步的，所述步骤(4)中具体包括如下子步骤：

(4.1)在网络中间采集节点设置数据分组抽样比，进行流量抽样；

(4.2)使用步骤(2)中设计的特征Sketch结构处理抽样后的数据分组，得到流量特征。

进一步的，所述步骤(5)中，将步骤(4)中实时计算出的特征集输入到步骤(3)中训练完成的丢包预测模型，进行实时丢包检测并输出实时丢包状态

与现有技术相比，本发明具有如下优点和有益效果：

(1)本发明提出了一种面向高速网络的流量丢包状态实时感知方法，可以精确有效地感知网络服务流量的丢包状态，使接入服务商根据丢包情况对网络进行及时的改造维护，保证用户体验质量。

(2)本发明包括使用对分组抽样减少需要处理的数据量，使用特征Sketch提取流量特征，提高了数据分组处理的效率，保证了丢包检测的实时性要求。

(3)本发明提出的面向高速网络的流量丢包状态实时感知方法，可以应用于TCP协议和特定的UDP协议，具有较好的应用前景。

附图说明

图1为面向高速网络的流量丢包状态实时感知方法的框架；

图2为特征Sketch的结构图；

图3-图5为训练完成的模型在三种应用上的混淆矩阵；

图6为抽样比为1/64三种应用的实时丢包检测图。

具体实施方式

以下将结合具体实施例对本发明提供的技术方案进行详细说明，应理解下述具体实施方式仅用于说明本发明而不用于限制本发明的范围。

实施例1：本发明提供的一种面向高速网络的流量丢包状态实时感知方法，其结构框架如图1所示，包括如下步骤：

(1)在可控网络环境中通过数据采集设备进行流量的抽样采集；

本步骤具体过程如下：

(1.1)在客户端访问TCP直播，SRT直播(UDT协议)和QUIC视频应用；

(1.2)使用中间节点软路由上的tc模块对下行丢包进行设置，并使用tcpdump进行流量抽样采集，抽样率设为1/64，即每隔64个分组抽取一个分组；

(1.4)重复(1.1)～(1.3)操作，直到采集到足够多的流量数据。

(2)根据传输协议的不同，设置特征Sketch的计数器从而提取出有效特征，传输协议分为TCP协议、基于UDP的UDT协议和QUIC协议；

本步骤具体过程如下：

(2.1)抽样采集的流量被哈希函数处理后，对特征Sketch桶中的计数器进行插入操作，特征Sketch的结构图如图2所示。特征Sketch的选择TCP计数器和UDP计数器详细信息，如表9和表10所示：

表9 TCP计数器名称及含义

表10 UDP计数器名称及含义

表10中，传输协议为UDT协议时d取值为20字节，QUIC协议时d取值为32字节。

(2.2)在插入操作过程中，判断计数器的值是否达到相应的计数器阈值，若达到阈值，则进行步骤(2.3)；若没有达到，则重复(2.1)～(2.2)。判断是否达到阈值的TCP计数器为 C0，Cd，S0和Sd；UDP计数器为Ca1，Ca2，Ca3，Ca4,Sa1，Sa2，Sa3和Sa4。阈值设置都为100。

(2.3)计数器达到阈值，进行一次特征提取操作，并将相应计数器值重置为0。提取的 TCP特征和UDP特征如表11和表12所示：

表11 TCP特征及含义

表12 UDP特征及含义

特征	含义
		Ca1/Pcs	客户端负载在UDP区间1内的分组个数/总的分组个数
Ca2/Pcs	客户端负载在UDP区间2内的分组个数/总的分组个数
		Ca3/Pcs	客户端负载在UDP区间3内的分组个数/总的分组个数
Ca4/Pcs	客户端负载在UDP区间4内的分组个数/总的分组个数
		Sa1/Pcs	服务端负载在UDP区间1内的分组个数/总的分组个数
Sa2/Pcs	服务端负载在UDP区间2内的分组个数/总的分组个数
		Sa3/Pcs	服务端负载在UDP区间3内的分组个数/总的分组个数
Sa4/Pcs	服务端负载在UDP区间4内的分组个数/总的分组个数
		Cp/Pcs	客户端分组个数/总的分组个数
Sp/Pcs	服务端分组个数/总的分组个数
		spdSD	服务端字节传输速率
spdSP	服务端分组传输速率

表11和表12中其他特征可根据基本计数器进行计算，spdSD和spdSD采用以下公式进行计算：

其中，p为抽样间隔，diffT为两次特征提取操作间隔，Num(sa_i)为服务端负载在区间i 的分组的个数，Len(sa_i)为服务端负载在区间i的分组的长度。

(3)对提取的特征构建数据集，进行机器学习分类模型的训练，训练后的模型即为丢包预测模型。机器学习分类模型采用基于决策树的XGBoost集成方法，该方法将模型上次预测 (由t-1棵树组合而成的模型)产生的误差作为参考进行下一棵树(第t棵树)的建立。每加入一棵树，模型损失函数不断降低，经过若干轮学习后得到XGBoost算法分类器，即丢包预测模型。模型准确率的混淆矩阵如图3-图5所示。其中类别0表示丢包率在5％以下，类别1表示丢包率在5％～20％之间，类别2表示丢包率在20％以上。

(4)在网络中数据采集点通过数据采集设备抽样采集真实流量，并利用特征Sketch实时提取流量的有效特征；

本步骤具体过程如下：

(4.1)在网络中间采集节点设置数据分组抽样比为1/64并进行流量抽样；

(4.2)使用步骤(2)中设计的特征Sketch结构处理抽样后的数据分组，得到流量特征。得到QUIC应用的部分流量特征如表13所示：

表13 QUIC应用部分流量特征

(5)利用步骤(3)中训练好的丢包预测模型对步骤(4.2)中提取出来的有效特征进行分类。三种应用的真实丢包环境设置如表14所示，QUIC应用丢包分类结果如表15所示，类别0表示丢包率在5％以下，类别1表示丢包率在5％～20％之间，类别2表示丢包率在20％以上。当抽样比为1/64时，三种应用的实时丢包检测情况如图6所示，通过与表14中数据对比可以发现，训练好的丢包预测模型可以准确实时地对丢包状态进行检测。

表14三种应用的真实丢包环境设置

表15QUIC应用部分检测结果

本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段，还包括由以上技术特征任意组合所组成的技术方案。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种面向高速网络的流量丢包状态实时感知方法，其特征在于，包括如下步骤：

步骤(4)在网络中数据采集点通过数据采集设备抽样采集真实流量，并利用特征Sketch实时提取流量的有效特征；

步骤(5)利用步骤(3)中训练好的丢包预测模型对步骤(4)中提取出来的有效特征进行分类，从而进行流量丢包状态的实时检测；

所述步骤(1)具体包含如下子步骤：

(1.1)在客户端访问TCP直播，基于UDT协议的SRT直播和QUIC视频应用；

(1.2)使用中间节点软路由上的tc模块对下行丢包进行设置，并使用tcpdump进行流量抽样采集，抽样率设为1：p，即每隔p个包抽取一个包；

(1.4)重复(1.1)～(1.3)操作，直到采集到足够多的训练数据。

2.根据权利要求1所述的一种面向高速网络的流量丢包状态实时感知方法，其特征在于，所述步骤(2)具体包含如下子步骤：

3.根据权利要求2所述的一种面向高速网络的流量丢包状态实时感知方法，其特征在于，所述步骤(2.1)中特征Sketch的TCP计数器和UDP计数器的详细信息，如表1和表2所示：

表1：TCP计数器名称及含义

表2 UDP计数器名称及含义

UDP计数器含义 Ca1 客户端负载在UDP区间1(0,d]内的分组 Ca2 客户端负载在UDP区间2(d,140]内的分组 Ca3 客户端负载在UDP区间3(140,1000]内的分组 Ca4 客户端负载在UDP区间4(1000,1472]内的分组 Sa1 服务端负载在UDP区间1(0,d]内的分组 Sa2 服务端负载在UDP区间2(d,140]内的分组 Sa3 服务端负载在UDP区间3(140,1000]内的分组 Sa4 服务端负载在UDP区间4(1000,1472]内的分组

表2中，传输协议为UDT协议时d取值为20字节，QUIC协议时d取值为32字节。

4.根据权利要求3所述的一种面向高速网络的流量丢包状态实时感知方法，其特征在于，所述步骤(2.2)中判断是否达到阈值的TCP计数器为C0，Cd，S0和Sd；UDP计数器为Ca1，Ca2，Ca3，Ca4,Sa1，Sa2，Sa3和Sa4，阈值设置都为100。

5.根据权利要求4所述的一种面向高速网络的流量丢包状态实时感知方法，其特征在于，所述步骤(2.3)提取的TCP特征和UDP特征如表3和表4所示：

表3 TCP特征及含义

特征含义 Cf/Pcs 客户端有SYN和PSH标记的包个数/总的包个数 Cp/Pcs 客户端包个数/总的包个数 Ca1/Pcs 客户端负载在TCP区间1内的分组个数/总的分组个数 Ca2/Pcs 客户端负载在TCP区间2内的分组个数/总的分组个数 Ca3/Pcs 客户端负载在TCP区间3内的分组个数/总的分组个数 Ca4/Pcs 客户端负载在TCP区间4内的分组个数(Cd-Ca1-Ca2-Ca3)/总的分组个数 Sf/Pcs 服务端有SYN和PSH标记的包个数/总的包个数 Sp/Pcs 服务端包个数/总的包个数 Sa1/Pcs 服务端负载在TCP区间1内的分组个数/总的分组个数 Sa2/Pcs 服务端负载在TCP区间2内的分组个数/总的分组个数 Sa3/Pcs 服务端负载在TCP区间3内的分组个数/总的分组个数 Sa4/Pcs 服务端负载在TCP区间4内的分组个数(Sd-Sa1-Sa2-Sa3)/总的分组个数 Csack 客户端包中可选项中SACKs的个数 spdSD 服务端字节传输速率 spdSP 服务端包传输速率

表4 UDP特征及含义

表中其他特征可根据基本计数器进行计算，spdSD和spdSD采用以下公式进行计算：

其中，p为抽样间隔，diffT为两次特征提取操作间隔，Num(sa_i)为服务端负载在区间i的分组的个数，Len(sa_i)为服务端负载在区间i的分组的长度。

6.根据权利要求1所述的一种面向高速网络的流量丢包状态实时感知方法，其特征在于，所述步骤(3)中机器学习分类模型采用基于决策树的XGBoost集成方法，该方法将模型上次预测，即由t-1棵树组合而成的模型产生的误差作为参考进行下一棵树的建立，每加入一棵树，模型损失函数不断降低，经过若干轮学习后得到XGBoost算法分类器，即丢包预测模型。

7.根据权利要求1所述的一种面向高速网络的流量丢包状态实时感知方法，其特征在于，所述步骤(4)中具体包括如下子步骤：

(4.1)在网络中间采集点设置数据分组抽样比，进行流量的分组抽样；

(4.2)使用步骤(2)中设计的特征Sketch结构来处理抽样后的数据分组，得到流量特征。

8.根据权利要求1所述的一种面向高速网络的流量丢包状态实时感知方法，其特征在于，所述步骤(5)中，将步骤(4)中实时计算出的特征集输入到步骤(3)中训练完成的丢包预测模型，进行实时丢包检测并输出实时丢包状态。