WO2019042305A1

WO2019042305A1 - 网包分类决策树的建立

Info

Publication number: WO2019042305A1
Application number: PCT/CN2018/102845
Authority: WO
Inventors: 徐达维; 任凯; 葛长忠
Original assignee: 新华三技术有限公司
Priority date: 2017-08-31
Filing date: 2018-08-29
Publication date: 2019-03-07
Also published as: EP3661153B1; CN108632235A; US20200195552A1; CN108632235B; JP2020532241A; US11184279B2; EP3661153A1; EP3661153A4; JP6997297B2

Abstract

本发明提供一种用于网包分类决策树建立的方法及装置。根据所述方法的一个示例，根据分类规则集的非模板维度对所述分类规则集进行建树，生成第一类型决策树；根据所述分类规则集的模板维度对所述第一类型决策树中的各叶子节点进行建树，生成第二类型决策树；使所述第一类型决策树中互为同模子集的多个叶子节点关联同一个第二类型决策树。其中，所述互为同模子集的多个叶子节点是指所述多个叶子节点各自包括的分类规则的集合互为同模子集。

Description

网包分类决策树的建立

相关申请的交叉引用

本专利申请要求于2017年8月31日提交的、申请号为201710771899.0、发明名称为“一种网包分类决策树建立方法及装置”的中国专利申请的优先权，该申请的全文以引用的方式并入本文中。

背景技术

网包分类是指根据网包的包头中各不同字段的值查找预先配置的分类规则，得到与之匹配的优先级最高的分类规则，并执行该分类规则配置的操作。许多网络设备提供的诸如访问控制、流量控制、负载均衡或入侵检测等功能，均需要使用网包分类。

基于决策树的多域分割算法是一类典型的网包分类方法，其基本思路是将整个多维空间递归地划分成子空间。递归结束的条件是当前子空间中包含的所有规则在各个维度上填满这个子空间。这个过程可以得到一棵决策树。基于这个决策树对每一个待分类网包进行查找，从而得到网包匹配的分类规则。

实践发现，决策树中节点越多，决策树占用的存储空间也会越多。然而，网络设备的存储空间是有限的。决策树的节点数量过多，会限制网包分类算法支持的分类规则集规模。因此，如何在不影响决策树查找效率的情况下，减少决策树的节点数量成为一个亟待解决的技术问题。

附图说明

图1是本发明实施例提供的一种网包分类决策树建立方法的流程示意图。

图2A是本发明实施例提供的一种网包分类的原理结构示意图。

图2B是本发明实施例提供的一种TreeBuilder的迭代单元的原理示意图。

图3A～3E是本发明实施例提供的决策树的示意图。

图4是本发明实施例提供的网包分类的查找路径示意图。

图5是本发明实施例提供的一种网包分类决策树建立装置的硬件结构示意图。

图6是本发明实施例提供的一种网包分类决策树建立控制逻辑的功能结构图。

具体实施方式

为了使本技术领域的人员更好地理解本发明实施例中的技术方案，下面先对本发明实施例提供的技术方案中涉及的部分概念进行简单说明。

分类规则集包括多条分类规则。一条分类规则包括维度信息、优先级。

其中，每个维度信息由一个取值范围表示。当匹配到分类规则后需要返回匹配结果。优先级为当多条规则满足匹配条件时，用于决定返回哪一条规则的匹配结果。本发明实施例中，以返回优先级最高的分类规则的匹配结果为例。其中，分类规则集的格式可以如表1所示。表1的分类规则集中包含r0-r8共9个分类规则。

表1

	优先级	sip	dip	sport	dport	prot	vlan	sysport
r0	5	*	*	*	80	tcp	*	0x200
r1	10	*	*	>＝12000	*	tcp	*	0x200
r2	15	*	10.1.1.x	>＝10000	>＝10000	udp	*	0x200
r3	6	*	*	*	80	tcp	[10,20)	0x300
r4	11	*	*	>＝12000	*	tcp	[10,20)	0x300
r5	16	*	10.1.1.x	>＝10000	>＝10000	udp	[10,20)	0x300
r6	7	*	*	*	80	tcp	30	*
r7	12	*	*	>＝12000	*	tcp	30	*
r8	17	*	10.1.1.x	>＝10000	>＝10000	udp	30	*

其中，sip(源IP地址)、dip(目的IP地址)、sport(源端口号)、dport(目的端口号)、prot(协议类型)、vlan(Virtual Local Area Network，虚拟局域网)以及sysport(系统端口)为表1所示分类规则的维度信息。维度信息prot可以包括但不限于tcp(Transmission Control Protocol，传输控制协议)或udp(User Datagram Protocol，用户数据报协议等。当某维度信息的取值为“*”时，表明该维度信息的值可以为该维度取值范围内的任意值。例如，对于维度信息dport，其取值范围为“0～(2 ¹⁶-1)”。

分类规则模板为模板项的集合。一个分类规则模板可以包括一个或多个模板项。

模板项包括一个或多个维度信息。其中，包括3个模板项的分类规则模板的格式可以如表2所示：

表2

index	优先级	sip	dip	sport	dport	prot
me0	5	*	*	*	80	tcp
me1	10	*	*	>＝12000	*	tcp
me2	15	*	10.1.1.x	>＝10000	>＝10000	udp

模板维度为模板项中包括的维度。例如，以表1和表2为例，表2所示的模板项包括分类规则中的5个模板维度，分别为sip、dip、sport、dport和prot。

非模板维度为分类规则中除模板维度之外的维度。例如，仍以表1和表2为例，表1所示的分类规则包括2个非模板维度，分别为vlan和sysport。

模板例化是指将分类规则模板应用到一个或多个非模板维度中，以得到一个或多个分类规则。

例如，将表2所示的分类规则模板应用到非模板维度sysport＝0x200中，即可以得到表1所示的分类规则集中的分类规则r0、r1和r2。其中，这三条分类规则的模板维度sip、dip、sport、dport和prot的取值分别对应了表2所示的分类规则模板中相应模板维度的取值，而非模板维度sysport的取值均为0x200。

其中，模板例化可以指定多个非模板维度进行例化。例如，将表2所示的分类规则模板应用到非模板维度vlan＝[10,20)和sysport＝0x300，即可以得到表1所示分类规则集中的分类规则r3、r4和r5。

其中，{r0、r1、r2}、{r3、r4、r5}以及{r6、r7、r8}可以称为表1所示分类规则集中的分类规则子集。

补洞规则(fb_rule)是指所有维度的取值均为“*”的分类规则。补洞规则为优先级最低的分类规则。换言之，分类规则集包括的各分类规则的优先级均高于补洞规则的优先级。

同模子集(Same Pattern Sub Ruleset，简称SPSR)是指将一个分类规则模板应用到多个不同的非模板维度所得到的多个分类规则子集之间互为同模子集。其中，将一个分类规则模板应用到多个不同的非模板维度，可称为对应不同非模板维度例化。

例如，表1所示的分类规则集中，分类规则子集{r0、r1、r2}、{r3、r4、r5}和{r6、r7、r8}互为同模子集。其中，补洞规则与自身互为同模子集。

同模子集组(SPSR_Group)包括互为同模子集的多个分类规则子集。

其中，补洞规则对应的同模子集组仅包括补洞规则这一条分类规则。

为了使本发明实施例的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明实施例中技术方案作进一步详细的说明。

请参见图1，为本发明实施例提供的一种网包分类决策树建立方法的流程示意图。其中，该网包分类决策树建立方法可以应用于网络设备。该网络设备可以包括但不限于交换机、路由器等。如图1所示，该网包分类决策树建立方法可以包括以下步骤：

步骤101、根据分类规则集的非模板维度对分类规则集进行建树，生成第一类型决策树。其中，该第一类型决策树为分类规则集对应非模板维度的决策树。

本发明实施例中，分类规则集并不特指某一固定的分类规则集，而可以是任一用于进行网包分类的分类规则集，后续不再复述。

本发明实施例中，当需要创建分类规则集对应的网包分类决策树时，需要先根据分类规则集的非模板维度对分类规则集进行建树，生成分类规则集对应非模板维度的决策树(本文中称为第一类型决策树，或非模板维度决策树)。

为便于理解，以下将第一类型决策树称为非模板维度决策树进行说明。

在本发明实施例中，网络设备对分类规则集进行建树可采用基于空间分割的方式。

其中，网络设备根据分类规则集的非模板维度对分类规则集进行建树的具体实现，将在下文中结合实例进行说明，在此不做赘述。

值得说明的是，在本发明实施例中，当网络设备根据分类规则集的非模板维度对分类规则集进行建树时，若根据所选择的维度和取值匹配不到分类规则集中的分类规则，则网络设备可以将未匹配到分类规则的叶子节点中包括的分类规则设置为补洞规则。其中，当空间分割得到的子空间中只包含有补洞规则，而不包含任何其他分类规则时，满足结束条件。

步骤102、根据分类规则集的模板维度对第一类型决策树的各叶子节点进行建树，生成第二类型决策树。其中，该第二类型决策树为第一类型决策树的叶子节点对应模板维度的决策树。

本发明实施例中，由于非模板维度决策树仅仅是根据非模板维度对分类规则集中各分类规则进行了空间分割，非模板维度决策树的各叶子节点并未完成空间分割，还需要按照模板维度进一步进行空间分割。

相应地，网络设备建立了分类规则集对应的非模板维度决策树之后，还需要进一步根据分类规则集的模板维度对非模板维度决策树的各叶子节点进行空间分割，以得到非模板维度决策树的各叶子节点对应模板维度的决策树(本文中称为第二类型决策树，或模板维度决策树)。

为便于理解，以下将第二类型决策树称为模板维度决策树进行说明。

其中，由于模板维度决策树是通过对非模板维度决策树的叶子节点进行空间分割得到的，因此，该模板维度决策树可以称为非模板维度决策树的子树。

其中，网络设备根据分类规则集的模板维度对非模板维度决策树的叶子节点进行建树的具体实现，将在下文中结合实例进行说明，在此不做赘述。

值得说明的是，在本发明实施例中，由于补洞规则的各个维度的取值均为“*”，即可以为各个维度的取值范围内的任意值，因此，根据模板维度对补洞规则进行空间分割得到的仍然为补洞规则。相应地，对于非模板维度决策树中包括的分类规则为补洞规则的叶子节点，根据模板维度进行空间分割得到的模板维度决策树仍为补洞规则。

步骤103、使第一类型决策树中互为同模子集的多个叶子节点关联同一个第二类型决策树。

本发明实施例中，互为同模子集的多个分类规则子集包括的模板维度取值相同，这使得：当使用同一个算法根据模板维度对互为同模子集的多个分类规则子集建立决策树时，所得到的多个模板维度决策树的树结构是相同的，而只是叶子节点不同。因此，互为同模子集的多个分类规则子集对应的模板维度决策树可以复用为同一模板维度决策树。

相应地，网络设备建立了非模板维度决策树的各叶子节点对应的模板维度决策树之后，可以对建立的模板维度决策树进行复用，以使非模板维度决策树中互为同模子集的多个叶子节点关联同一个模板维度决策树，以减少模板维度决策树的数量，进而减少分类规则集对应的决策树的节点数量。其中，互为同模子集的多个叶子节点是指所述多个叶子节点各自对应的分类规则子集互为同模子集。叶子节点对应的分类规则子集是指该叶子节点包括的分类规则的集合。分类规则集对应的决策树包括非模板维度决策树和模板维度决策树。

在一种可选的实施方式中，上述使第一类型决策树中互为同模子集的多个叶子节点关联同一个第二类型决策树，可以包括：将互为同模子集的多个不同的分类规则子集划分到同一个同模子集组；建立第一类型决策树中互为同模子集的多个叶子节点各自与对应的分类规则子集所属的同模子集组的标识以及该分类规则子集在该同模子集组中的索引之间的映射关系；将第一类型决策树中互为同模子集的多个叶子节点各自对应的第二类型决策树，合并为同一个第二类型决策树。这样，合并得到的该第二类型决策树的叶子节点包括同模子集组中各索引对应的分类规则子集。其中，叶子节点对应的分类规则子集为该叶子节点包括的分类规则的集合。

在该实施方式中，将同一个分类规则模板对应不同非模板维度例化而得到的多个分类规则子集互为同模子集，互为同模子集的多个分类规则子集构成同模子集组。

以表1所示分类规则集为例，分类规则子集{r0、r1、r2}是将表2所示分类规则模板应用到非模板维度sysport＝0x200得到的，分类规则子集{r3、r4、r5}是将表2所示分类规则模板应用到非模板维度vlan＝[10,20)和sysport＝0x300得到的，分类规则子集{r6、r7、r8}将表2所示分类规则模板应用到非模板维度vlan＝30得到的，因此，分类规则子集{r0、r1、r2}、{r3、r4、r5}和{r6、r7、r8}互为同模子集，且构成一个同模子集组。

在该实施方式中，可以为同模子集组中的各分类规则子集设置该分类规则子集在该同模子集中的索引。这样，可以根据同模子集组的标识(例如，同模子集组的名称)以及在该同模子集组中的索引确定对应的分类规则子集。

例如，假设分类规则子集{r0、r1、r2}、{r3、r4、r5}和{r6、r7、r8}属于同模子集组spsrg1(该同模子集组的标识为spsrg1)，且分类规则子集{r0、r1、r2}、{r3、r4、r5}和{r6、r7、r8}在同模子集组spsrg1中的索引分别为0、1和2，则分类规则子集{r0、r1、r2}可以被映射到同模子集组spsrg1中的索引0，分类规则子集{r3、r4、r5}可以被映射到同模子集组spsrg1中的索引1，分类规则子集{r6、r7、r8}可以被映射到spsrg1中的索引2。

在该实施方式中，网络设备确定了各分类规则子集所属的同模子集组以及各分类规则子集在同模子集组中的索引之后，可以建立非模板维度决策树中互为同模子集的叶子节点与对应的分类规则子集所属的同模子集组的标识以及该分类规则子集在该同模子集组中的索引之间的映射关系。例如，对于互为同模子集的多个叶子节点中的每个叶子节点，在该叶子节点中存储该叶子节点对应的分类规则子集所属的同模子集组的标识，以及该对应的分类规则子集在该同模子集组中的索引。

基于以上举例具体来说，以对应分类规则子集为{r0、r1、r2}的叶子节点为例，可以建立该叶子节点与分类规则子集{r0、r1、r2}所属的同模子集组的标识spsrg1以及分类规则子集{r0、r1、r2}在该同模子集组中的索引0之间的映射关系，并在该叶子节点中存储分类规则子集{r0、r1、r2}所属的同模子集组的标识spsrg1以及分类规则子集{r0、r1、r2}在该同模子集组spsrg1中的索引0。

网络设备可以将同一个同模子集组中多个分类规则子集各自对应的模板维度决策树合并为一个模板维度决策树，并且合并后的模板维度决策树的各叶子节点可以包括该同模子集组中各索引对应的分类规则子集。

在本发明实施例中，互为同模子集的多个分类规则子集各自对应的模板维度决策树的结构相同，而只是叶子节点不同。这样，当非模板维度决策树的叶子节点中存在互为同模子集的多个叶子节点时，该叶子节点对应的模板维度决策树中的各叶子节点将包括由同一模板项对应不同非模板维度例化得到的多条分类规则，而该多条分类规则中仅有优先级最高的分类规则会生效。因此，对于非模板维度决策树的叶子节点中存在的包括互为同模子集的多个分类规则子集的叶子节点，网络设备可以删除该叶子节点中包括的优先级较低的分类规则子集。

在本发明实施例中，网络设备建立了分类规则集对应的决策树(由非模板维度决策树和模板维度决策树组成)之后，当接收到待分类网包时，网络设备可以先根据该待分类网包查找分类规则集对应的非模板维度决策树，以确定该待分类网包对应的非模板维度决策树中的叶子节点(本文中称为第一目标叶子节点)，并获取该第一目标叶子节点中存储的同模子集组(本文中称为目标同模子集组)的标识以及分类规则子集(本文中称为目标分类规则子集)在该目标同模子集组中的索引(本文中称为目标索引)。

然后，网络设备可以根据待分类网包查找该目标同模子集组对应的模板维度决策树(本文中称为目标模板维度决策树)，以确定该待分类网包对应的目标模板维度决策树中的叶子节点(本文中称为第二目标叶子节点)。

最后，网络设备可以将第二目标叶子节点中包括的与目标索引对应的分类规则确定为与待分类网包匹配的分类规则。

为了使本领域技术人员更好地理解本发明实施例提供的技术方案，下面结合具体实例对本发明实施例提供的技术方案进行说明。

如图2A所示，为本发明实施例提供的一种网包分类的原理结构示意图，如图2A所示，CPU(Center Process Unit，中央处理单元)210通过决策树创建单元(Tree Builder) 211将输入的分类规则集编译为决策树，并下发给FPGA(Field Programmable Gate Array，现场可编程门阵列)220。当接收到网包时，FPGA 220通过查找引擎(Lookup Engine)221查找分类规则集对应的决策树，确定匹配的分类规则。

其中，决策树创建单元211可采用迭代的方式完成决策树的建立，其核心是一个基于维度和取值(Dim&Value，简称D&V)的启发式选择器211-1。其中，该启发式选择器输入一个规则集(Rule Set，简称RS)，输出两个规则子集和一个决策树节点(Decision Tree Node，简称DT Node)。该启发式选择器根据输入的规则集，利用启发式算法从输入的维度列表(Dim List)中选择一个维度和取值，然后将输入的规则集按照选择的维度和取值分割为两个子集。若规则对应维度的取值范围小于所选择的取值的，则将该规则划入左子集；若规则对应维度的取值范围大于等于所选择的取值的，则将该规则划入右子集；若规则对应维度的取值范围覆盖住所选择的取值的，则将该规则一分为二，小于部分划入左子集，大于等于部分划入右子集。这样，通过将所选择的维度和取值作为一个决策树节点完成对规则集的一次空间分割。同时，将得到的两个规则子集继续迭代地执行上述操作，直至分类规则子集不能再被划分为止。其中，决策树创建单元211中的迭代单元的原理示意图可以如图2B所示。

基于图2A和图2B，本发明实施例提供的网包分类决策树建立方案的实现流程可以如下：

以表2所示的分类规则模板以及表1所示的分类规则集为例。其中，分类规则集的非模板维度包括vlan和sysport，模板维度包括sip、dip、sport、dport以及prot。

根据非模板维度vlan和sysport对表1所示的分类规则集进行建树，以得到该分类规则集对应的非模板维度决策树。其中，该非模板维度决策树的结构示意图可以如图3A所示。

图3A所示的非模板维度决策树的叶子节点中，非矩形框的叶子节点中均只包含一条补洞规则，而矩形框的叶子节点则包含多条分类规则。

根据模板维度sip、dip、sport、dport以及prot对图3A所示的非模板维度决策树的各叶子节点进行建树，以得到非模板维度决策树的各叶子节点对应的模板维度决策树。

其中，根据模板维度对只包含一条补洞规则的叶子节点进行建树得到的模板维度决策树仅包括一个节点，并且该节点仅包括补洞规则。

对于包括分类规则r0、r1和r2的叶子节点，根据模板维度对该叶子节点进行建树得到的模板维度决策树的示意图可以如图3B所示；

对于包括分类规则r3、r4和r5的叶子节点，根据模板维度对该叶子节点进行建树得到的模板维度决策树的示意图可以如图3C所示。

基于图3B和图3C可以看出，由于分类规则子集{r0、r1、r2}是由表2所示的分类规则模板对应非模板维度sysport＝0x200例化得到的，分类规则子集{r3、r4、r5}是由同一个表2所示的分类规则模板对应非模板维度sysport＝0x300以及vlan＝[10,20)例化得到的，分类规则子集{r0、r1、r2}和{r3、r4、r5}互为同模子集，因此，其对应的模板维度决策树的树结构相同，而只是叶子节点不同。其中，图3B和图3C所示的模板维度决策树中相同位置处的叶子节点分别为同一个模板项对应不同非模板维度例化得到的分类规则。

同理，由于分类规则子集{r6、r7、r8}是由同一个表2所示分类规则模板应用到非模板维度vlan＝30得到的，这使得包括分类规则r6、r7和r8的叶子节点对应的模板维度决策树的结构也与图3B和图3C所示的模板维度决策树相同，且相同位置处的叶子节点也由是相同的模板项例化得到。

值得注意的是，对于图3A所示的非模板维度决策树中包括分类规则r0、r1、r2、r6、r7以及r8的叶子节点，由于{r0、r1、r2}和{r6、r7、r8}互为同模子集，因此，根据模板维度对该叶子节点进行建树得到的模板维度决策树中不含补洞规则的叶子节点均包含2条分类规则，并且这两条规则是由同一模板项对应不同的非模板维度例化得到。具体地，如分类规则r0和r6是由表2所示模板项me0对应不同的非模板维度例化得到的，分类规则r1和r7是由表2所示模板项me1对应不同的非模板维度例化得到的，分类规则r5和r8是由表2所示模板项me2对应不同的非模板维度例化得到的。当网包匹配到包括多个分类规则的叶子节点时，返回的匹配结果为优先级较高的分类规则。因此，对于包括互为同模子集的多个分类规则子集的叶子节点，只需要保留互为同模子集的多个分类规则子集中优先级较高的分类规则子集，而可以将优先级较低的分类规则子集过滤掉，即只保留分类规则子集{r0、r1、r2}，而删除分类规则子集{r6、r7、r8}。进而，该叶子节点对应的模板维度决策树的结构示意图也如图3B所示。

此外，假设补洞规则对应的同模子集组的标识为spsrg0，补洞规则在同模子集组spsrg0中的索引为0；分类规则子集{r0、r1、r2}、{r3、r4、r5}和{r6、r7、r8}对应的同模子集组的标识为spsrg1，并且分类规则子集{r0、r1、r2}、{r3、r4、r5}和{r6、r7、r8}在同模子集组spsrg1中的索引分别为0、1和2。

对于图3A所示的非模板维度决策树上互为同模子集的多个叶子节点中的每一个叶子节点，建立该叶子节点与该叶子节点对应的分类规则子集所属的同模子集组的标识以及该分类规则子集在该同模子集组中的索引之间的映射关系。其中，处理后的非模板维度决策树的示意图可以如图3D所示。

将互为同模子集的多个叶子节点各自对应的模板维度决策树合并为同一个模板维度决策树。其中，合并得到的模板维度决策树中的叶子节点包括同模子集组中各索引对应的分类规则。

其中，由于补洞规则对应的同模子集组中仅包括补洞规则这一条分类规则，因此，补洞规则对应的模板维度决策树中仅包括一个叶子节点，并且该叶子节点中可以直接记录该补洞规则。

最终生成的表1所示分类规则集对应的决策树的结构可以如图3E所示，包括非模板维度决策树310和模板维度决策树320。

下面结合实例对网包分类具体处理流程进行简单说明。

在该实施例中，假设网包1和网包2中各字段的取值分别如表3所示：

表3

	sip	dip	sport	dport	prot	vlan	sysport
网包1	1.1.1.1	10.1.1.10	12000	12000	udp	10	0x200
网包2	1.1.1.1	10.1.1.10	12000	80	tcp	30	0x100

其中，网包1的查找路径可以如图4中实线双箭头所示，其命中的模板维度决策树320中的叶子节点中包括3条分类规则r2、r5和r8；而由于其经过的非模板维度决策树310的叶子节点中的索引为0(图示为spsr:0)，因此，网包1最终命中分类规则r2。

网包2的查找路径可以如图4中虚线双箭头所示，其命中的模板维度决策树320中的叶子节点中包括3条分类规则r0、r3和r6；而由于其经过的非模板维度决策树310的叶子节点中的索引为2(图示为spsr:2)，因此，网包2最终命中分类规则r6。

通过以上描述可以看出，在本发明实施例提供的技术方案中，通过根据分类规则集的非模板维度对分类规则集进行建树生成第一类型决策树，并根据分类规则集的模板维度对第一类型决策树中的各叶子节点进行建树生成第二类型决策树，进而使第一类型决策树中互为同模子集的多个叶子节点关联同一个第二类型决策树，可有效减少模板维度的重复建树以及决策树的规模，从而可提升支持的分类规则集的规模，进而可提升网络设备的存储空间利用率以及网包分类处理能力。

以上对本发明提供的方法进行了描述。下面对本发明提供的装置进行描述：

图5为本发明实施例提供的一种网包分类决策树建立装置的硬件结构示意图。该网包分类决策树建立装置可包括处理器501、存储有机器可执行指令的机器可读存储介质502。处理器501与机器可读存储介质502可经由系统总线503通信。并且，通过读取并执行机器可读存储介质502中与网包分类决策树建立控制逻辑对应的机器可执行指令，处理器501可执行上文描述的网包分类决策树建立方法。

本文中提到的机器可读存储介质502可以是任何电子、磁性、光学或其它物理存储装置，可以包含或存储信息，如可执行指令、数据，等等。例如，机器可读存储介质可以是易失存储器、非易失性存储器或者类似的存储介质。具体地，机器可读存储介质可以是RAM(Radom Access Memory，随机存取存储器)、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘等)或者它们的组合。

在一种可选的实施方式中，上述网包分类决策树建立装置中还可以包括FPGA(未在图中示出)，相应地，处理器501完成决策树建立后，可以将所建立的决策树下发至FPGA，由FPGA执行决策树查找处理。

如图6所示，从功能上划分，上述网包分类决策树建立控制逻辑可以包括第一建树单元601、第二建树单元602和复用单元603。其中：

第一建树单元601，用于根据分类规则集的非模板维度对所述分类规则集进行建树，生成第一类型决策树。其中，所述第一类型决策树为所述分类规则集对应所述非模板维度的决策树。

第二建树单元602，用于根据所述分类规则集的模板维度对所述第一类型决策树中的各叶子节点进行建树，生成第二类型决策树。其中，所述第二类型决策树为所述第一类型决策树的叶子节点对应所述模板维度的决策树。

复用单元603，用于使所述第一类型决策树中互为同模子集的多个叶子节点关联同一个第二类型决策树。其中，互为同模子集的多个叶子节点各自所包括的分类规则的集合互为同模子集。

所述第一建树单元601，还用于当根据所述非模板维度和对应的取值匹配不到所述分类规则集中的分类规则时，将未匹配到分类规则的叶子节点中包括的分类规则设置为补洞规则。其中，所述补洞规则的优先级低于所述分类规则集中所有分类规则的优先级。

所述第二建树单元602，还用于当所述第一类型决策树中存在包括互为同模子集的多个分类规则子集的叶子节点时，删除该叶子节点中包括的优先级较低的分类规则子集。

所述复用单元603，还用于将互为同模子集的多个分类规则子集划分到同一同模子集组；建立所述第一类型决策树上互为同模子集的多个叶子节点中每个叶子节点与对应的分类规则子集所属的同模子集组的标识以及该分类规则子集在该同模子集组中的索引之间的映射关系；将所述第一类型决策树上互为同模子集的多个叶子节点对应的第二类型决策树合并为同一个第二类型决策树。其中，合并得到的第二类型决策树的叶子节点包括该同模子集组中各索引对应的分类规则。

上述网包分类决策树建立控制逻辑还可以包括查找单元604，用于：当接收到待分类网包时，根据所述待分类网包查找所述分类规则集对应的第一类型决策树，以确定所述待分类网包对应的所述第一类型决策树中的第一目标叶子节点；根据所述第一目标叶子节点中存储的同模子集组的标识确定目标第二类型决策树，并根据所述待分类网包查找所述目标第二类型决策树，以确定所述待分类网包对应的所述第二类型决策树中的第二目标叶子节点；根据所述第一目标叶子节点中存储的同模子集组中的索引从所述第二目标叶子节点中查找对应的分类规则，并将该分类规则确定为所述待分类网包匹配的分类规则。

需要说明的是，在本文中，诸如第一和第二等之类的术语前缀仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

一种网包分类决策树建立方法，包括：

根据分类规则集的非模板维度对所述分类规则集进行建树，生成第一类型决策树；

根据所述分类规则集的模板维度对所述第一类型决策树中的各叶子节点进行建树，生成第二类型决策树；

使所述第一类型决策树中互为同模子集的多个叶子节点关联同一个第二类型决策树，其中，所述互为同模子集的多个叶子节点是指所述多个叶子节点各自包括的分类规则的集合互为同模子集。
根据权利要求1所述的方法，其特征在于，根据所述非模板维度对所述分类规则集进行建树，包括：

当根据所述非模板维度和对应的取值匹配不到所述分类规则集中的分类规则时，将未匹配到分类规则的叶子节点中包括的分类规则设置为补洞规则；

其中，所述补洞规则的优先级低于所述分类规则集中各分类规则的优先级。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

当所述第一类型决策树中存在包括互为同模子集的多个分类规则子集的叶子节点时，删除所述叶子节点中包括的优先级较低的分类规则子集。
根据权利要求1所述的方法，其特征在于，使所述第一类型决策树中互为同模子集的多个叶子节点关联同一个第二类型决策树，包括：

将所述多个叶子节点包括的互为同模子集的多个分类规则子集划分到同一个同模子集组；

对于所述多个叶子节点中的每个叶子节点，建立该叶子节点与该同模子集组的标识以及该叶子节点包括的分类规则子集在该同模子集组中的索引之间的映射关系；

将所述多个叶子节点各自对应的所述第二类型决策树合并为一个第二类型决策树，其中，所述合并后的第二类型决策树的叶子节点包括该同模子集组中各分类规则。
根据权利要求4所述的方法，其特征在于，所述方法还包括：

通过查找所述第一类型决策树，确定待分类网包在所述第一类型决策树中对应的第一目标叶子节点；

根据所述第一目标叶子节点中存储的同模子集组的标识确定目标第二类型决策树；

通过查找所述目标第二类型决策树，确定所述待分类网包在所述目标第二类型决策树中对应的第二目标叶子节点；

根据所述第一目标叶子节点中存储的同模子集组中的索引，从所述第二目标叶子节点中查找对应的分类规则；并

将该查找到的分类规则确定为所述待分类网包匹配的分类规则。
一种网包分类决策树建立装置，其特征在于，包括：

第一建树单元，用于根据分类规则集的非模板维度对所述分类规则集进行建树，生成第一类型决策树；

第二建树单元，用于根据所述分类规则集的模板维度对所述第一类型决策树中的各叶子节点进行建树，生成第二类型决策树；

复用单元，用于使所述第一类型决策树中互为同模子集的多个叶子节点关联同一个第二类型决策树，其中，所述互为同模子集的多个叶子节点是指所述多个叶子节点各自包括的分类规则的集合互为同模子集。
根据权利要求6所述的装置，其特征在于，所述第一建树单元，还用于

当根据所述非模板维度和对应的取值匹配不到所述分类规则集中的分类规则时，将未匹配到分类规则的叶子节点中包括的分类规则设置为补洞规则；

其中，所述补洞规则的优先级低于所述分类规则集中各分类规则的优先级。
根据权利要求6所述的装置，其特征在于，所述第二建树单元，还用于

当所述第一类型决策树中存在包括互为同模子集的多个分类规则子集的叶子节点时，删除所述叶子节点中包括的优先级较低的分类规则子集。
根据权利要求6所述的装置，其特征在于，所述复用单元，还用于：

将所述多个叶子节点包括的互为同模子集的多个分类规则子集划分到同一个同模子集组；

对于所述多个叶子节点中的每个叶子节点，建立该叶子节点与该同模子集组的标识以及该叶子节点包括的分类规则子集在该同模子集组中的索引之间的映射关系；

将所述多个叶子节点各自对应的所述第二类型决策树合并为一个第二类型决策树；其中，所述合并后的第二类型决策树的叶子节点包括该同模子集组中各分类规则。
根据权利要求9所述的装置，其特征在于，所述装置还包括查找单元，用于：

通过查找所述第一类型决策树，确定待分类网包在所述第一类型决策树中对应的第一目标叶子节点；

根据所述第一目标叶子节点中存储的同模子集组的标识确定目标第二类型决策树；

通过查找所述目标第二类型决策树，确定所述待分类网包在所述目标第二类型决策树中对应的第二目标叶子节点；

根据所述第一目标叶子节点中存储的同模子集组中的索引，从所述第二目标叶子节点中查找对应的分类规则；并

将该查找到的分类规则确定为所述待分类网包匹配的分类规则。
一种网包分类决策树建立装置，包括：

处理器；和

机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令，所述处理器被所述机器可执行指令促使：

根据分类规则集的非模板维度对所述分类规则集进行建树，生成第一类型决策树；

根据所述分类规则集的模板维度对所述第一类型决策树中的各叶子节点进行建树，生成第二类型决策树；

使所述第一类型决策树中互为同模子集的多个叶子节点关联同一个第二类型决策树，其中，所述互为同模子集的多个叶子节点是指所述多个叶子节点各自包括的分类规则的集合互为同模子集。
根据权利要求11所述的装置，其特征在于，所述处理器还被所述机器可执行指令促使执行：

当根据所述非模板维度和对应的取值匹配不到所述分类规则集中的分类规则时，将未匹配到分类规则的叶子节点中包括的分类规则设置为补洞规则；

其中，所述补洞规则的优先级低于所述分类规则集中各分类规则的优先级。
根据权利要求11所述的装置，其特征在于，所述处理器还被所述机器可执行指令促使执行：

当所述第一类型决策树中存在包括互为同模子集的多个分类规则子集的叶子节点时，删除所述叶子节点中包括的优先级较低的分类规则子集。
根据权利要求11所述的装置，其特征在于，所述处理器还被所述机器可执行指令促使执行：

将所述多个叶子节点包括的互为同模子集的多个分类规则子集划分到同一个同模子集组；

对于所述多个叶子节点中的每个叶子节点，建立该叶子节点与该同模子集组的标识以及该叶子节点包括的分类规则子集在该同模子集组中的索引之间的映射关系；

将所述多个叶子节点各自对应的所述第二类型决策树合并为一个第二类型决策树，其中，所述合并后的第二类型决策树的叶子节点包括该同模子集组中各分类规则。
根据权利要求14所述的装置，其特征在于，所述处理器还被所述机器可执行指令促使执行：

通过查找所述第一类型决策树，确定待分类网包在所述第一类型决策树中对应的第一目标叶子节点；

根据所述第一目标叶子节点中存储的同模子集组的标识确定目标第二类型决策树；

通过查找所述目标第二类型决策树，确定所述待分类网包在所述目标第二类型决策树中对应的第二目标叶子节点；

根据所述第一目标叶子节点中存储的同模子集组中的索引，从所述第二目标叶子节点中查找对应的分类规则；并

将该查找到的分类规则确定为所述待分类网包匹配的分类规则。
根据权利要求15所述的装置，其特征在于，

所述装置还包括现场可编程逻辑门阵列；

所述处理器还被所述机器可执行指令促使：将所述第一类型决策树以及所述第二类型决策树下发至所述现场可编程逻辑门阵列，以由所述现场可编程逻辑门阵列执行决策树查找处理。