CN112232436B

CN112232436B - 一种融合集成决策树与层次注意力机制的可解释网络攻击检测方法

Info

Publication number: CN112232436B
Application number: CN202011217582.0A
Authority: CN
Inventors: 吕明琪; 王琦晖; 邢顺华
Original assignee: Hangzhou Smart Strategy Technology Co ltd
Current assignee: Hangzhou Smart Strategy Technology Co ltd
Priority date: 2020-11-04
Filing date: 2020-11-04
Publication date: 2022-08-05
Anticipated expiration: 2040-11-04
Also published as: CN112232436A

Abstract

一种融合集成决策树与层次注意力机制的可解释网络攻击检测方法，所述方法包括以下步骤：1)解释项抽取：采用集成决策树模型从原始网络流量数据中抽取并构造解释项；2)解释项加权：采用层次注意力机制学习在不同场景下解释项的权重参数；3)实时检测和解释：采用训练好的模型对实时样本进行攻击检测和解释。本发明提供了一种融合集成决策树与层次注意力机制的可解释网络攻击检测方法，融合决策树模型与注意力模型，使得检测模型能够同时具备较强的泛化能力和较好的可解释性；通过集成决策树模型抽取特征组合作为解释项，相比于现有的直接采用特征作为解释项的方法，具有更好的可解释性。

Description

一种融合集成决策树与层次注意力机制的可解释网络攻击检测方法

技术领域

本发明涉及深度学习和网络安全技术，具体涉及一种网络攻击检测方法。

背景技术

随着计算机网络的发展和扩张，针对计算机网络的攻击越来越多。网络攻击的形式包括拒绝服务攻击、恶意软件攻击、APT网络攻击等，给网络安全带来了巨大的威胁。网络攻击检测系统旨在通过监测网络系统数据以发现网络攻击行为，在此基础上对响应组件或网络管理员提供预警。

随着网络流量、网络日志等网络数据的积累，基于机器学习的网络攻击检测方法受到了广泛的重视。用于网络攻击检测的机器学习技术包括传统的浅层学习技术和深度学习技术。其中，深度学习技术由于能够自动学习到复杂的非线性隐藏特征，通常具有更高的准确率和泛化能力。常用于网络攻击检测的深度学习模型包括MLP(多层感知机)、CNN(卷积神经网络)、LSTM(长短期记忆网络)、自动编码机等。

虽然深度学习在网络攻击检测方面已经取得了显著的进展，但由于深度学习模型的非线性运行机制无法被人类理解，因此其本质上是一种黑盒系统，无法为其运行结果提供解释。缺乏可解释性为基于深度学习的网络攻击检测系统的实用造成了很大的阻碍。例如，由于误报是不可避免的，因此网络管理员需要理解网络攻击检测系统的判断依据，在此基础上选择是否相信系统的检测结果。此外，网络管理员需要理解网络攻击检测结果的原因，才能更好地制定防御和应对策略。

发明内容

针对现有技术的不足，本发明提供了一种融合集成决策树与层次注意力机制的可解释网络攻击检测方法，融合决策树模型与注意力模型，使得检测模型能够同时具备较强的泛化能力和较好的可解释性；通过集成决策树模型抽取特征组合作为解释项，相比于现有的直接采用特征作为解释项的方法，具有更好的可解释性。

本发明解决其技术问题所采用的技术方案是：

一种融合集成决策树与层次注意力机制的可解释网络攻击检测方法，所述方法包括以下步骤：

1)解释项抽取：采用集成决策树模型从原始网络流量数据中抽取并构造解释项；

2)解释项加权：采用层次注意力机制学习在不同场景下解释项的权重参数；

3)实时检测和解释：采用训练好的模型对实时样本进行攻击检测和解释。

进一步，所述步骤1)中，给定原始网络流量数据集D，解释项抽取的步骤如下：

(1-1)特征抽取：对D中每条数据，抽取各类网络流量特征，形成训练样本集S；

(1-2)集成决策树模型训练：基于S训练一个包含N颗决策树的集成决策树模型TM，则TM的每颗决策树的每条分枝均代表一个特征组合，可看成一个解释项；

(1-3)解释项抽取：给定一个样本s_i，首先将其输入TM的每颗决策树，s_i会根据其流量特征到达每颗决策树的某个叶子节点，则该叶子节点对应的分枝为s_i的一个解释项；

再进一步，所述步骤2)中，解释项加权的步骤如下：

(2-1)解释项嵌入：可将每颗决策树看成一个类别型特征，每个解释项看成类别型特征的一种取值；然后，采用特征嵌入技术将每一个解释项e_i表示成一个d维的稠密向量x_i；

(2-2)自注意力加权：首先，设置可训练的权重矩阵W^Q、W^K和W^V，计算每一个解释项e_i的查询向量q_i＝x_i·W^Q、键向量k_i＝x_i·W^K和值向量v_i＝x_i·W^V；然后，对每一对解释项e_i和e_j，基于公式(1)计算其自注意力权重α_ij；最后，基于公式(2)计算每一个解释项e_i的语义向量y_i。

(2-3)软注意力加权：设置可训练的权重矩阵W_S、偏移向量b_S和映射向量h_S，基于公式(3)计算解释项e_i的软注意力权重β_i，其中，σ()为激活函数；

(2-4)样本分类：首先，基于公式(4)计算所有解释项的最终表征向量z。然后，在z上采用一个多层感知机作为分类器，输出检测结果，即正常样本或攻击样本；

更进一步，所述步骤3)中，给定样本s_i，网络攻击实时检测和解释的步骤如下：

(3-1)攻击检测：将s_i输入训练好的解释项抽取和加权模型，基于步骤(2-4)输出攻击检测结果；

(3-2)攻击检测结果解释：若检测到网络攻击，首先基于步骤(2-2)和步骤(2-3)输出所有注意力权重，并基于公式(5)计算解释项e_i的总体注意力权重w_i,；然后，选择总体注意力权重最高的若干个解释项，作为攻击检测结果原因的解释；

本发明的有益效果主要表现在：1、融合决策树模型与注意力模型，使得检测模型能够同时具备较强的泛化能力和较好的可解释性。2、通过集成决策树模型抽取特征组合作为解释项，相比于现有的直接采用特征作为解释项的方法，具有更好的可解释性。

附图说明

图1为一种融合集成决策树与层次注意力机制的可解释网络攻击检测方法流程图；

图2为基于集成决策树的解释项抽取示意图；

图3为基于注意力机制的解释项加权示意图。

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1～图3，一种融合集成决策树与层次注意力机制的可解释网络攻击检测方法，所述方法包括以下步骤：

所述步骤1)中，给定原始网络流量数据集D，解释项抽取的步骤如下：

(1-3)解释项抽取：给定一个样本s_i，首先将其输入TM的每颗决策树，s_i会根据其流量特征到达每颗决策树的某个叶子节点，则该叶子节点对应的分枝为s_i的一个解释项；如图2所示，假设N＝3，s_i到达了决策树A的叶子节点3、决策树B的叶子节点2、及决策树C的叶子节点4，则s_i的解释项集为{e₁＝(1,2,3),e₂＝(4,5,6),e₃＝(7,8,9)}。

所述步骤2)中，参照图3，解释项加权的步骤如下：

(2-1)解释项嵌入：可将每颗决策树看成一个类别型特征，每个解释项看成类别型特征的一种取值；如图2所示，可将样本s_i的三个类别型特征表示为三个one-hot编码向量，即<0,0,1,0>、<0,1,0,0>、<0,0,0,1>；然后，采用特征嵌入技术将每一个解释项e_i表示成一个d维的稠密向量x_i；

3)实时检测和解释：采用训练好的模型对实时样本进行攻击检测和解释；

所述步骤3)中，给定样本s_i，网络攻击实时检测和解释的步骤如下：

本说明书的实施例所述的内容仅仅是对发明构思的实现形式的列举，仅作说明用途。本发明的保护范围不应当被视为仅限于本实施例所陈述的具体形式，本发明的保护范围也及于本领域的普通技术人员根据本发明构思所能想到的等同技术手段。

Claims

1.一种融合集成决策树与层次注意力机制的可解释网络攻击检测方法，其特征在于，所述方法包括以下步骤：

所述步骤2)中，解释项加权的步骤如下：

(2-2)自注意力加权：首先，设置可训练的权重矩阵W^Q、W^K和W^V，计算每一个解释项e_i的查询向量q_i＝x_i·W^Q、键向量k_i＝x_i·W^K和值向量v_i＝x_i·W^V；然后，对每一对解释项e_i和e_j，基于公式(1)计算其自注意力权重α_ij；最后，基于公式(2)计算每一个解释项e_i的语义向量y_i；

(2-3)软注意力加权：设置可训练的权重矩阵W_S、偏移向量b_S和映射向量h_S，基于公式(3)计算解释项e_i的软注意力权重β_i，其中，

为激活函数；

(2-4)样本分类：首先，基于公式(4)计算所有解释项的最终表征向量z；然后，在z上采用一个多层感知机作为分类器，输出检测结果，即正常样本或攻击样本；

(3-2)攻击检测结果解释：若检测到网络攻击，首先基于步骤(2-2)和步骤(2-3)输出所有注意力权重，并基于公式(5)计算解释项e_i的总体注意力权重w_i；然后，选择总体注意力权重最高的若干个解释项，作为攻击检测结果原因的解释；