CN113746869B

CN113746869B - 一种基于多层次卷积的运维系统资产入侵探测方法

Info

Publication number: CN113746869B
Application number: CN202111302681.3A
Authority: CN
Inventors: 刘东海; 徐育毅; 庞辉富
Original assignee: Hangzhou Youyun Software Co ltd; Beijing Guangtong Youyun Technology Co ltd
Current assignee: Hangzhou Youyun Software Co ltd; Beijing Guangtong Youyun Technology Co ltd
Priority date: 2021-11-05
Filing date: 2021-11-05
Publication date: 2022-03-08
Anticipated expiration: 2041-11-05
Also published as: CN113746869A

Abstract

本发明提供了一种基于多层次卷积的运维系统资产入侵探测方法，包括：(1)、提取资产交互过程中加密流量的可用原始数据：在确定检测粒度层级后，确认加密流量的可用原始字节，用于后续的表示学习与入侵检测；(2)、通过一维卷积神经网络获得数据包层级的特征表示；(3)、对属于同一条加密会话的数据包表示通过一维卷积神经网络获得会话层级的特征表示；(4)、将单条加密会话的特征表示输入前馈神经网络实现加密流量中的入侵检测。本发明的有益效果为：实现了加密场景下的运维系统资产的入侵检测；充分利用流量原始数据特征；分层卷积神经网络分别在数据包层级与会话层级对加密流量进行表示，实现更好的检测效果。

Description

一种基于多层次卷积的运维系统资产入侵探测方法

技术领域

本发明涉及IT运维系统中的入侵检测技术领域，主要是一种基于多层次卷积的运维系统资产入侵探测方法。

背景技术

随着数字化经济的快速发展与数据中心基础设施的不断扩张，IT环境变得越来越复杂。由此也引发了一系列安全问题。传统的基于边界的安全防护，静态的安全策略配置等安全措施已经无法满足业务发展的实际安全需求，网络安全走向实战化、体系化和常态化，企业亟需建设开放兼容、高效实战的智能安全运维架构。

现如今，传统的安全防护策略难以应对高度动态与充满对抗的网络空间安全环境中。此外，随着各种加密协议如SSL(安全套接字协议)及其改进协议TLS(传输层安全协议)的普及，网络通信的机密性与安全性得以保证。但同时也为网络监管带来了问题。加密流量传输的有效payload不透明，使得攻击者可以利用加密流量隐蔽其恶意行为与威胁活动，例如恶意负载传递、C&C通道以及数据回传等。

IT安全运维中的入侵检测即对恶意流量进行检测识别，从而及早的响应，发现威胁，避免数据泄露以及经济损失。虽然传统的基于规则的各种入侵检测技术已经非常成熟，但由于加密协议的普及以及网络攻击升级日新月异，传统的检测技术难以应对。因此基于人工智能的应对加密流量的资产入侵检测研究十分重要。

专利CN108494810A提出了一种面向攻击的网络安全态势预测方法，通过检测并收集网络对抗环境下的报警数据与网络环境运维信息，评估攻击方能力与防御方水平，建立动态贝叶斯攻击图，结合漏洞平稳标准与资产信息，从时空维度量化网络安全态势值。然而此研究方法是从宏观的角度对IT系统的安全态势进行评估，虽然要收集网络对抗环境下的报警数据，但对于网络中最直接的流量数据并没有进行深入地分析，并且无法应对隐藏在加密流量中的网络威胁，因而难以取得理想的安全态势感知效果。

专利CN107347057B基于原始流量报文分析，与检测规则集合进行规则匹配。其优势在于对规则的匹配与生成进行了更细粒度地划分，具体到产生网络报文的特定文件类型，以及网络报文发送目的地址的外部网络信息，此外还引入了恶意文件的静态检测与沙箱动态运行技术。然而此类方法虽然对原始流量进行了分析，但仍属于规则匹配无法应对未知的网络威胁。

目前有一些专利试图引入人工智能算法来进行网络入侵检测，比如专利CN108650274B提出了一种基于机器学习的网络入侵检测方法，其主要是通过获取大量的网络访问请求记录，并提出了一个完备的访问请求记录的特征集，使用机器学习的方法训练辨别正常记录与入侵记录的分类器，实现智能检测。但是此类方法提取特征需要专家知识，也没有抓住最重要的原始流量内容信息，同时对于加密流量的分析也是缺失的。

发明内容

针对IT系统中网络威胁动态进化以及通过加密协议隐藏难以识别等问题，本发明提出了一种基于多层次卷积的运维系统资产入侵探测方法。

本发明的目的是通过如下技术方案来完成的。一种基于多层次卷积的运维系统资产入侵探测方法，首先分析加密流量中的可用数据信息，对数据包层级的可用原始字节进行卷积。再进一步在会话层级上对各个数据包表示进行卷积，构建加密会话的表示。基于该表示实现针对加密流量的入侵检测；具体步骤包括：

(1)、提取资产交互过程中加密流量的可用原始数据：在确定检测粒度层级后，确认加密流量的可用原始字节，用于后续的表示学习与入侵检测；

(2)、基于步骤(1)中提出加密流量在握手阶段明文传输的数据包可用字节，通过一维卷积神经网络获得数据包层级特征表示；

(3)、在步骤(2)得到数据包层级特征表示的基础上，对属于同一条加密会话的数据包层级特征表示通过一维卷积神经网络获得会话层级的特征表示；

(4)、将步骤(3)中得到的单条加密会话的会话层级的特征表示输入前馈神经网络实现加密流量中的入侵检测。

更进一步的，在步骤(1)中，在进行加密流量的可用原始数据提取时，首先定义检测粒度为单条加密会话session_i，针对单条加密会话session_i提取加密连接建立时的数据包集合HandshakeMessage_i；

(2.1)、加密恶意流量检测的粒度为单条加密会话，加密会话的定义为双向加密网络流，即共享<IP_S,IP_D,PORT_S,PORT_D,Protocol>的单次连接的数据包集合，其中S代表源端，D代表目的端，

能够互换；在单条双向加密网络流中，IP_S为源IP，IP_D为目的IP，PORT_S为源端口，PORT_D为目的端口，Protocol为传输协议。双向加密网络流为加密恶意流量检测中常用的检测粒度层级。

(2.2)、握手信息HandshakeMessage_i为SSL/TLS连接建立之前的握手阶段传输的数据包集合，包含Client Hello,Server Hello,Certificate信息，而每个数据包packet_i为对应的可用字节集合；握手阶段传输的信息可以有效地反映访问加密会话的可信度。是加密恶意流量检测中常用的特征。

其中，

为第i条双向加密网络流的第n个数据包；

为第i条双向加密网络流的第n个数据包中的第m个字节。

更进一步的，在步骤(2)中，首先对数据包层级的原始字节进行预处理，基于一维卷积神经网络处理预处理后的原始字节，学得数据包层级的原始字节数据表示Representation_packet；

Representation_packet＝1DCNN(packet)

＝1DCNN(byte¹,byte²,...,byte^m,...,byte^M)。

其中，1DCNN为一维卷积神经网络操作，packet为单个数据包，byte^m为单个数据包中的第m个原始字节。

更进一步的，在步骤(2)得到加密会话数据包层级特征表示的基础上，通过一维卷积神经网络处理单条会话的所有数据包层级特征表示Representation_packet，学得会话层级的特征表示Representation_session；

其中，

为握手信息中第m个数据包的数据包层级特征表示。

更进一步的，在步骤(3)中获得了单条加密会话的会话层级的特征表示Representation_session，输入多层感知器训练实现网络威胁活动的检测与识别，

Label＝MLP(Representation_session)。

其中Label为最终预测的标签，MLP为多层感知器模型。

本发明的有益效果为：

1、实现了加密场景下的运维系统资产的入侵检测。

2、应用表示学习方法进行流量分析，充分利用流量原始数据特征。

3、分层卷积神经网络分别在数据包层级与会话层级对加密流量进行表示，可以实现更好的检测效果。

附图说明

图1为本发明流程示意图。

图2为数据包原始字节转化为编码的示意图。

图3为加密会话数据包原始字节转化为数据包层级的特征表示的示意图。

图4为网络流构建示意图。

图5为单条加密会话的特征表示输入前馈神经网络实现加密流量中的入侵检测示意图。

具体实施方式

下面将结合附图和实施例对本发明做详细的介绍：

针对目前IT安全运维资产入侵检测系统中缺乏对原始网络流量的分析，需要大量的专家知识以及无法应对加密恶意流量等缺点，本发明提出了一种基于多层次卷积的运维系统资产入侵探测方法，并基于该算法构建了一套入侵检测系统，在多个公开数据集上验证了其有效性。本算法基于加密流量的原始字节，具体分析加密会话握手阶段时明文协商的各种数据，并通过分层的端到端卷积神经网络，分别在数据包与加密会话的层级上获得加密会话的表示，并输入前馈神经网络进行威胁识别。在威胁识别的基础上，对加密恶意流量进行更细粒度的威胁类别划分，具体支持Bruteforce、Web Attack、Infiltration、Bot、DDoS、PortScan、Heartbleed共计7种网络威胁的细粒度划分。

本发明提出的一种基于多层次卷积的运维系统资产入侵探测方法，具体步骤包括：

基于专家知识提取加密流量的可用原始数据：

(1)检测粒度层级确定，在进行加密流量的可用数据提取时，首先需要确定检测的粒度层级。本发明定义检测粒度为单条加密会话，加密会话的定义为双向加密网络流，即共享<IP_S,IP_D,PORT_S,PORT_D,Protocol>的单次连接的数据包集合，其中S代表源端，D代表目的端，源IP、源端口与目的IP、目的端口能够互换。通过对原始流量捕获进行拆分、重组，可以还原单条加密会话Session_i。

(2)加密流量的可用特征提取，针对单条加密会话session_i只保留加密连接建立前握手阶段的数据包，其中握手信息HandshakeMessage_i为SSL/TLS连接建立之前的握手阶段传输的数据包集合，包含Client Hello,Server Hello,Certificate等信息，而每个数据包packet_i为对应的可用字节集合，这里需要对无用的原始字节进行删除。握手阶段传输的信息可以有效地反映访问加密会话的可信度。是加密恶意流量检测中常用的特征。

对每个数据包的原始字节，将对会话层以下的如IP、端口、MAC地址等信息进行匿名化，并转成0-255的编码，如图2所示。

加密会话具有层次结构，从byte到packet再到session，即一个数据包由原始字节组成，一个加密会话又由数据包组成，类似于NLP中短语-句子-文章的文本层次结构。首先，基于每个数据包预处理后的原始字节，通过一维卷积神经网络，堆叠多个卷积池化模块，数据包的字节中提取特征，以完成从字节向量到数据包向量的转换。得到数据包层级的特征表示，如图3所示。

如图4所示，基于得到的数据包层级的特征表示，通过一维卷积神经网络学习会话层级的特征表示。这里由于可用的加密会话数据包仅仅属于握手阶段，数量较少，不需要使用堆叠结构处理数据包。因此，仅使用一层包含多个不同过滤器的卷积池模块来学习来自数据包向量的表示来构建网络流，这样可以提高处理效率。

如图5所示，在获得了单条加密会话的会话层级的特征表示后，送入前馈神经网络，得到流样本的预测类别。实现加密流量的入侵检测。

可以理解的是，对本领域技术人员来说，对本发明的技术方案及发明构思加以等同替换或改变都应属于本发明所附的权利要求的保护范围。

Claims

1.一种基于多层次卷积的运维系统资产入侵探测方法，其特征在于：包括步骤如下：

(4)、将步骤(3)中得到的单条加密会话的会话层级的特征表示输入前馈神经网络实现加密流量中的入侵检测；

在步骤(1)中，在进行加密流量的可用原始数据提取时，首先定义检测粒度为单条加密会话session_i，针对单条加密会话session_i提取加密连接建立时的数据包集合HandshakeMessage_i；

能够互换；在单条双向加密网络流中，IP_S为源IP，IP_D为目的IP，PORT_S为源端口，PORT_D为目的端口，Protocol为传输协议；

(2.2)、握手信息HandshakeMessage_i为SSL/TLS连接建立之前的握手阶段传输的数据包集合，包含Client Hello,Server Hello,Certificate信息，而每个数据包packet_i为对应的可用字节集合；

其中，

为第i条双向加密网络流的第n个数据包；

为第i条双向加密网络流的第n个数据包中的第m个字节；

在步骤(2)中，首先对数据包层级的原始字节进行预处理，基于一维卷积神经网络处理预处理后的原始字节，学得数据包层级的原始字节数据表示Representation_packet；

Representation_packet＝1DCNN(packet)

＝1DCNN(byte¹,byte²,...,byte^m,...,byte^M)；

其中，1DCNN为一维卷积神经网络操作，packet为单个数据包，byte^m为单个数据包中的第m个原始字节；

在步骤(2)得到加密会话数据包层级特征表示的基础上，通过一维卷积神经网络处理单条会话的所有数据包层级特征表示Representation_packet，学得会话层级的特征表示Representation_session；

其中，

为握手信息中第m个数据包的数据包层级特征表示。

2.根据权利要求1所述的基于多层次卷积的运维系统资产入侵探测方法，其特征在于：在步骤(3)中获得了单条加密会话的会话层级的特征表示，输入多层感知器训练实现网络威胁活动的检测与识别，

Label＝MLP(Representation_session)；

其中Label为最终预测的标签，MLP为多层感知器模型。