WO2021082339A1

WO2021082339A1 - 将机器学习和规则匹配相融合的安全检测方法和设备

Info

Publication number: WO2021082339A1
Application number: PCT/CN2020/079972
Authority: WO
Inventors: 姜晓枫; 程思雨; 杨坚; 谭小彬; 张勇东
Original assignee: 中国科学技术大学
Priority date: 2019-10-28
Filing date: 2020-03-18
Publication date: 2021-05-06
Also published as: CN110753064B; US20220368703A1; CN110753064A

Abstract

本申请公开了一种将机器学习和规则匹配相融合的安全检测方法。该方法包括：建立机器学习模型，利用带有标签的合法流量和恶意流量训练所述机器学习模型；采集网络流量；对采集到的网络流量进行预处理；以及采用基于规则匹配的方法从预处理后的网络流量中检测恶意流量；利用训练后的机器学习模型从所述预处理后的网络流量中识别恶意流量，所述识别过程包括：对预处理后的网络流量进行特征提取，并且然后基于所提取的特征，利用训练后的机器学习模型识别恶意流量；以及对采用基于规则匹配的方法检测到的恶意流量和利用训练后的机器学习模型识别出的恶意流量进行融合。该方法既能检测已知恶意流量又能检测未知恶意流量，最大程度的减少入侵检测系统的误报率和漏报率，从而保证计算机网络的安全。

Description

将机器学习和规则匹配相融合的安全检测方法和设备

技术领域

本公开涉及机器学习与信息安全技术领域，尤其涉及一种将机器学习和规则匹配相融合的安全检测方法和设备。

背景技术

当今社会计算机网络应用于各行各业。计算机网络可以满足商业、企业和政府机构的各种需求。但是如今这些计算机网络比以往任何时候都更加脆弱，因为今天的攻击者有良好的组织、充足的时间、专业的知识和大量的资源来发动网络攻击。攻击者像普通用户一样，生成数据并将恶意活动隐藏在TB级的数据之下。由于存储了海量的数据、存在可伸缩性问题和缺乏安全检测等，许多安全机制都无法保证网络的安全。

入侵检测系统(IDS)在20世纪80年代被提出，其根据网络流量数据来判断系统是否执行正常行动。在当今安全的通信和网络基础设施中，IDS是大多数网络的一部分。但是，IDS检测机制只有在具有足够的准确性来区分正常流量与恶意流量时才有用。使用IDS的结果有如下可能：检测到恶意流量、未检测到恶意流量、合法流量被IDS检测为恶意流量和合法流量被IDS检测通过。

优秀的IDS可以检测尽可能多的恶意流量并减少误报。目前有许多商业IDS，如：JuniperNetworks、McAfee、Cisco和Symantec等。商业IDS通常不能提供像宣传一样理想的性能并且可能损害计算机的网络安全。同时也有许多开源IDS可用，如Snort，Suricata和Bro等。Snort是一种具有内联防入侵功能的支持中高速网络的IDS，其包含获取网络数据包模块、解码和分类网络数据包模块以及根据规则集检测恶意数据包模块。Snort通过规则集来检查网络数据包中是否存在恶意流量，并在数据包的有效负载与其中一个规则发生匹配时触发警报。Snort的单线程架构如图1所示。

网络速度和恶意流量的持续增加给IDS带来了严重问题。IDS都必须处理更高的网络流量以检测恶意流量，速度达到约10Gbps。如果IDS无法以所需的速率执行数据包检查，则它们将允许未被检测到的恶意数据包进入计算机网络。

传统的IDS使用规则集来检测已知的恶意流量，如果恶意流量与规则集匹配，则它将触发警报，这种方法效率高且误报率低。

发明内容

本公开的目的是提供一种将机器学习和规则匹配相融合的安全检测方法和设备，该方法和设备既能检测已知恶意流量又能检测未知恶意流量，最大程度地减少入侵检测系统的误报率和漏报率，从而保证计算机网络的安全。

在一方面，本公开的目的是通过一种将机器学习和规则匹配相融合的安全检测方法来实现的，该方法包括：

建立机器学习模型，

利用带有标签的合法流量和恶意流量训练所述机器学习模型；

采集网络流量；

对采集到的网络流量进行预处理；以及

采用基于规则匹配的方法从预处理后的网络流量中检测恶意流量；

利用训练后的机器学习模型从所述预处理后的网络流量中识别恶意流量，所述识别过程包括：对预处理后的网络流量进行特征提取，并且然后基于所提取的特征，利用训练后的机器学习模型识别恶意流量；以及

对采用基于规则匹配的方法检测到的恶意流量和利用训练后的机器学习模型识别出的恶意流量进行融合。

在另一方面，本公开的目的是通过一种将机器学习和规则匹配相融合的安全检测设备来实现的，该设备包括：

处理器；以及

存储器，所述存储器存储指令，所述指令当由所述处理器执行时，使所述处理器：

建立机器学习模型，

采集网络流量；

对采集到的网络流量进行预处理；以及

对采用基于规则匹配的方法检测到的恶意流量和利用训练后的机器学习模型识别

出的恶意流量进行融合。

本公开提供的上述技术方案使用基于规则匹配的方法对已知的恶意流量进行检测，同时使用机器学习方法对未知的恶意流量进行检测，从而降低入侵检测系统的误报率和漏报率，提高了对恶意流量检测的准确率。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本公开的一些实施例。对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些实施例获得其他实施例。

图1为本公开背景技术提供的Snort的单线程架构示意图；

图2为根据本公开实施例的一种将机器学习和规则匹配相融合的安全检测方法的流程图；

图3为根据本公开实施例的一种将机器学习和规则匹配相融合的安全检测系统的架构图；

图4为根据本公开实施例的基于多核CPU的软件式负载分配器的示意图；

图5为根据本公开实施例的安全检测系统的构架图；以及

图6为根据本公开实施例的一种将机器学习和规则匹配相融合的安全检测设备的框图。

具体实施方式

下面结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整的描述。显然，所描述的实施例仅仅是本公开的一部分实施例，而不是全部的实施例。基于本公开的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都落在本公开的保护范围内。

传统IDS不会对未知的恶意流量采取任何的行动，漏报率较高，这是因为传统的基于规则匹配的IDS没有使用机器学习技术，因此无法阻止未知的恶意流量。随着近些年机器学习技术的飞速发展，机器学习技术可以检测未知的恶意流量，从而通过主动应对未知恶意流量来减少IDS的漏报率。现在有多种机器学习算法可用于IDS，如支持向量机、决策树、模糊逻辑、朴素贝叶斯和神经网络等。

因此，本公开实施例提供一种将机器学习和规则匹配相融合的安全检测方法和设备，该方法和设备同时使用基于规则匹配的方法和机器学习方法来对已知和未知的恶意流量进行检测，从而降低入侵检测系统的误报率和漏报率，提高对恶意流量检测的准确率。此外，根据本公开的实施例可使用GPU并行计算技术，以使系统能够满足高通量的需求。

图2示出了根据本公开实施例的一种将机器学习和规则匹配相融合的安全检测方法20。如图2所示，该方法可以包括如下步骤：在步骤S200处，建立机器学习模型；在步骤S202处，利用带有标签的合法流量和恶意流量训练所建立的机器学习模型；在步骤S204处，采集网络流量；在步骤S206处，对采集到的网络流量进行预处理；在步骤S208处，采用基于规则匹配的方法从预处理后的网络流量中检测恶意流量；在步骤S210中，对预处理后的网络流量进行特征提取(步骤S210 ₁)，并且然后基于所提取的特征，利用训练后的机器学习模型来识别恶意流量(步骤S210 ₂)；以及在步骤S212处，对采用基于规则匹配的方法检测到的恶意流量和使用训练后的机器学习模型识别出的恶意流量进行融合。

在一些实施例中，方法20还可以可选地包括：在步骤S203处，使用验证数据集对训练后的机器学习模型进行验证；在步骤S205处，按照指定的采样规则，对采集到的网络流量进行采样；以及在步骤S213处，对融合的结果进行可视化。在方法20包括可选步骤S205的情况下，方法20的步骤S206进一步包括对采样得到的数据流进行预处理。

图3示出了根据本公开实施例的一种将机器学习和规则匹配相融合的示例性安全检测系统30。下面将结合图3所示的安全检测系统30来更详细地描述图2中所示的方法20的步骤。

图3所示的安全检测系统30主要包括离线部分310和在线部分320。方法20的步骤S200和S202以及可选的步骤S203可以在图3所示的离线部分310中执行。也就是说，在离线部分中，建立机器学习模型312，利用带有标签的合法流量和恶意流量作为训练数据集314 来对所建立的机器学习模型312进行训练，以及可选地，使用验证数据集316来验证训练后的机器学习模型。

方法20的步骤S204-S212以及可选的步骤S205和S213可以在图3所示的在线部分320中执行。也就是说，在在线部分中，采集网络流量并进行预处理。然后，并行地或顺序地进行两部分处理：第一部分为，采用基于规则匹配的方法从预处理后的网络流量中检测恶意流量；第二部分为，利用机器学习模型来标识预处理后的网络流量中的恶意流量，该标识过程可以包括从预处理后的网络流量进行特征提取，并且然后，基于提取到的特征，利用在离线部分中训练的机器学习模型来识别恶意流量。最后，融合这两部分处理的结果，从而实现对恶意流量的拦截。

在图3所示的离线部分310中，首先建立机器学习模型312。可选择的机器学习模型包括支持向量机、决策树、模糊逻辑、朴素贝叶斯和神经网络等。然后，将带有标签的合法流量和恶意流量作为训练集314。从该训练集提取基于时间的特征、基于网络层的特征和基于生存时间值(Time To Live，TTL)的特征。然后，基于这些提取到的特征对所建立的机器学习模型310进行模型训练。可以参照传统模型的训练方式来对所建立的机器学习模型进行训练。训练完成之后，可以使用验证数据集314对训练后的机器学习模型进行验证。通过验证的模型即可用于在线部分的处理。

此外，离线部分可以在GPU上进行高速并行运算，从而有效地提高系统的运行速度，满足高通量的需求。

示例性系统30的在线部分320可以包括：

网络流量采集模块321，用于采集网络流量(图2所示的步骤S204)；

流量采样模块322，用于按照指定采样规则，对采集的网络流量进行采样(图2的可选步骤S205)，该流量采样模块324可以是可选的；

数据预处理模块323，用于对采集到的或采样得到的(如果对采集到的网络流量进行采样的话)网络流量进行预处理(图2的步骤206)；

规则匹配模块324，用于采用基于规则匹配的方法从预处理的结果中检测恶意流量(图2中的步骤S208)；

特征提取模块325，用于对预处理的结果进行特征提取；

流量分类模块326，用于基于特征提取模块330所提取的特征，利用在离线部分中训练的机器学习模型来对网络流量进行分类(图2中的步骤S210)，从而识别恶意流量；

结果融合模块327，用于融合通过规则匹配模块检测324到的恶意流量和通过特征提取模块325与流量分类模块326识别出的恶意流量(图2中的步骤S212)，以及

结果显示模块328，用于通过可视化技术来显示融合的结果(图2中的可选步骤S213)。

在上述模块中，规则匹配模块324、特征提取模块325和流量分类模块326可以在GPU上并行地运行，从而提高运算速度并满足对处理高通量的网络流量的需求。

网络入侵检测的前提是对网络流量进行有效的采集。在线实时入侵检测系统经常需要处理高达10～100Gbps的输入流量。因此，高速的数据包捕获技术是进行后续流量识别的前提条件。鉴于上述原因，本公开实施例中采用了一种高性能的数据平面开发套件(Data Plane Development Kit，DPDK)。利用DPDK设计的网络流量采集模块能够基于零拷贝技术，利用直接内存存取(DMA)结构，将数据包从网卡的缓存队列直接复制到用户空间，从而越过中间内核空间的处理部分，节约了大量的IO和内核协议栈的处理时间开销，最终能够达到更高的线速数据包捕获能力。

但是，传统的DPDK以串行的工作方式在CPU上运行，这使得其难以满足抓取高通量数据的需求。为了解决该问题，在本公开实施例中，对传统的数据抓取工具进行修改，使得网络流量采集模块运行在GPU上，以提高网络流量采集效率。

当前，主流的网卡支持将其环形缓冲区分割成多个硬件队列(典型的情况为单网卡支持最多16个队列)。这种特性可以被用于多核CPU的场景，来进行数据包处理。通过使用基于哈希函数的调度方法，输入的海量数据包可以被分发到多个网卡队列来进行负载均衡，这实现了数据流粒度的负载均衡。根据本公开的实施例主要采用基于哈希函数的方法，来将输入的数据流映射到一个专用的队列。这里主要将该数据流中的数据包的四元组(源IP地址、源端口号、目的IP地址和目的端口号)作为输入来获得哈希值。需要注意的是，对于一个交互式的会话，其前向和后向的数据流被作为一条单独的流看待，因为针对它们得到的哈希值是一样的。在多核CPU的场景下，主要有两种方式来捕获数据包：单队列到单核的映射和基于软件式分配器的负载均衡。本公开采用基于软件式分配器的负载均衡的方法。图4示出了根据本公开实施例的基于多核CPU的软件式负载分配器40的示意图。在负载分配器40中，有K个CPU作为负载分配器，剩下的M个CPU作为workers。负载分配器专门用来将数据包从网卡队列中取回，然后将他们分配到空闲的workers上，workers主要负责后续的数据包预处理流程。

由于流经不同系统的数据流量不同，并且不同的系统对于系统安全的需求不同，安全检测系统30设置有流量采样模块。釆样是指按照一定的采样规律，从大量数据中提取部分具有代表性的数据的过程。根据不同的需求设置不同采样函数，以便减轻高速网络中测量设备的内存和CPU的消耗。

两种采样技术被广泛地使用：包采样和流采样。包采样可以在使用很少CPU能力和内存的前提下方便地实现。然而包采样不能准确地推断出流的统计特性。自适应包采样技术可以调整采样速率，从而降低内存消耗或者增加统计的准确度。流采样的出现克服了包采样的局限性，其可以提高准确率，但是需要消耗更多的内存和CPU。为了解决这些问题，特别是为了减少内存和带宽消耗，本公开中采用了一种灵活采样算法。

所述灵活采样算法是一种依赖于网络流量中的数据流大小的数据流记录选择算法。给定一个大小为n的数据流集合S＝{X ₁，…，X _n}，灵活采样算法将以概率P(x _i)，i＝1,…,n从每一个X _i中选择一个大小为x _i的数据流x _i′来形成一个新的数据流集合S′＝{x ₁′，…，x _n′}。灵活采样算法的目标是使通过采样计算出来的总字节数

趋近真实流量的总字节数

其中，i＝1，…，n。

数据预处理是在正式进行检测之前对数据进行一些处理。用相应的插件来检查数据流中的原始数据包，从中发现原始数据的“行为”，如端口扫描，IP碎片等。数据流中的数据包经过预处理后才能传到传统的规则匹配模块和特征提取与流量分类模块。

数据预处理的主要包括：包重组、协议解码和异常检测等。

包重组主要分为分片重组和流重组。分片重组是指数据链路层用MTU(最大传输单元)来限制所能传输的数据包大小。当发送的IP数据报的大小超过了MTU时，IP层就需要对数据进行分片。流重组是指TCP把数据流分割成适当长度的报文段，其中最大报文段大小(MSS)通常受以太网MTU限制。因为TCP使用IP来传递它的报文段，IP不提供重复消除和保证次序正确的功能，所以流重组主要用于处理包失序和包重复等问题。

协议解码是将数据包的协议解码成统一的格式以便于传统的规则匹配模块进行规则匹配的过程。例如，在HTTP报文中，URL有很多种表达格式，如ASCII码和Unicode等。不同的表达格式为恶意流量监测带来了很大的不便。攻击报文往往在一种格式下可被检测到。通过协议解码，预先将各种格式的报文转换成可检测的标准格式，以便于后续的检测。

异常检测包括端口扫描等。端口访问有合法的也有非法的，但是没有一个固定的规则来判断某次端口访问是否合法。如果通过规则匹配来检测，则可能产生较高的误报率与漏报率。因此，数据预处理模块用状态检测的方法对一定时间内的端口访问和目的主机等情况进行统计分析，对超出正常情况的端口访问发出警报。

正常情况下，当数据包通过了异常检测时，预处理的输出是经过包重组与协议解码的数据。但是，针对某些非法流量，如Dos攻击流量等，使用规则匹配来检测Dos可能导致高的误报率和漏报率。因此，本公开在预处理阶段引入异常检测的手段来提前清理出这些非法流量，如果有针对端口的非法访问可以产生警报。

传统的规则匹配模块使用现有的入侵检测系统的规则集和匹配算法来对恶意流量进行检测，如Snort和Hyperscan等。传统的规则匹配算法一般是Aho-Corasick算法与基于正则表达式的匹配算法。当网络流量的有效负载与入侵检测的规则集匹配时，传统的规则匹配算法会将流量标示为恶意流量并触发警报，由此即可发现规则集中已经设定过的恶意流量。但是传统的规则匹配算法在CPU上运行，这使得其无法满足入侵检测系统对高通量与实时性的需求。对此，本公开对传统的规则匹配算法进行改进，使其在GPU上并行运算，从而有效地提升安全检测系统的效率。

在本公开实施例中，使用并行无错阿霍-科拉希克(Parallel Failureless Aho-Corasick,PFAC)算法来实现对恶意流量的检测。PFAC算法有效地利用了AC算法的并行性。PFAC算法为输入数据流的每个字节创建一个单独的线程，以标识从线程起始位置开始的任何模式。所创建的线程数等于输入数据流的长度。PFAC的每个线程仅负责识别从线程起始位置开始的模式。每当线程找不到位于起始位置的任何模式时，线程终止而不以回溯状态机进行故障转换。PFAC的每个最终状态代表一种独特的模式，这能够在不处理多个输出的情况下保持PFAC中每个最终状态的唯一性。虽然PFAC创建了大量的线程，但大多数线程很有可能很早就终止，因为PFAC的线程只负责从其起始位置开始匹配模式。

因此，使用改进后的PFAC算法，将网络流量的有效负载同时并行地与入侵检测的规则集中的多条规则进行匹配验证。如果发生匹配，则将流量标示为恶意流量并触发警报，即可发现规则集中已经设定过的恶意流量。此算法有效地适合GPU并行计算，提升了传统的规则匹配模块的检测效率。

网路数据流量的特征多种多样。特征提取模块325首先要提取出需要统计的相关特征。需要提取的特征包括：源端口、源地址、目的端口、目的地址、ICMP类型、协议标识符、原始数据长度和原始数据等。然后，基于提取到的特征，流量分类模块326利用在离线部分训练的机器学习模型将网络流量分类为合法流量或恶意流量，从而有效识别出使用规则匹配方法检测不到的未知恶意流量。

由于数据包的连续到达，对应于特定数据流的特征数据信息必须在有数据包到达时进行实时更新。考虑到高达100Gbps的海量流量每秒钟可能会包含数以万计活跃的数据流和几百万个数据包，这将会使得在承受如此大量的更新请求下快速检索到目标特征数据极具挑战性。

为了解决这个问题，在本公开实施例中，在特征提取阶段，在GPU中实现一个哈希表，用来维护和追踪对应于每一条活跃数据流的特征数据的索引。每个GPU数据单元特有的哈希值用来确定一条特定的数据流。每一个互斥的哈希条目上使用了原子锁，使得每一个时刻只有一个线程被允许更新其哈希条目。当一个特征数据传输结束时，其对应的数据流会变成非活跃的，这将会触发从哈希表中删除相应数据流所对应的特征数据的操作。对每条数据流而言，最后到达的数据包的时间被记录在哈希表中。采用一种基于阈值的方法来确定非活跃的数据流。具体来说，如果时间间隔超过了某一阈值，此时就认为相应数据流的特征数据是非活跃的。通过设置一个定时任务来输出非活跃数据流的特征数据，以进行深层分析(即，利用在离线部分训练的机器学习模型来进行分类)，或者直接将非活跃数据流的特征数据输出到一个输出文件(即，将特征提取与流量分析模块提取到的流统计信息保存下来)，以进行离线的分析工作。

结果融合模块可以对通过规则匹配模块324检测到的恶意流量和通过特征提取模块325和流量分类模块326识别出的恶意流量进行融合，使得能够对恶意流量进行拦截，同时使合法流量能够顺利通过。结果显示模块可以将拦截到的恶意流量的特征保存到数据库中并通过可视化技术来显示融合的结果，以便实时地显示系统是否遭到了恶意攻击，从而采取相应行动，并对恶意流量做后续的特征分析。

根据本公开实施例提供的上述技术方案主要具有如下有益效果：

1)识别已知恶意流量：通过使用传统的入侵检测系统的规则集进行规则匹配来检测已知的恶意流量。如果恶意流量与规则集匹配，则将触发警报。这种方法效率高且误报率低。

2)识别未知恶意流量：通过提取出的网络流量特征，使用离线训练好的机器学习模型对流量进行检测，从而发现未知的恶意流量，此方法漏报率低。

3)降低误报率与漏报率：通过将基于规则匹配的方法与机器学习方法相融合，既能通过规则集检测出已知的恶意流量又能通过机器学习技术检测出未知的恶意流量，从而降低误报率与漏报率。

4)在线检测：本公开的方法和系统通过离线训练相关的机器学习模型，然后结合传统的规则匹配入侵检测方法在线地进行安全检测，以满足系统的实时性需求。

5)满足高通量要求：本方法在硬件上使用CPU与GPU，充分发挥其各自的优势，离线模式训练机器学习模型、线模式抓取数据包、进行特征提取与分类和规则匹配模块在GPU上进行并行计算，提高系统检测恶意流量的整体效率。

下面结合一个具体示例来对根据上述实施例的安全检测系统进行介绍。

如图5所示，安全检测系统以Snort开源入侵检测系统为主要构架，首先进行Snort的初始化。然后我们利用网络流量抓取工具DPDK进行网络流量采集。为了满足高通量实时性的需求，将DPDK移植到GPU上，以并行地对数据包进行抓取，从而有效提高网络流量采集的效率。然后，为安全检测系统30设置采样函数。由于本系统的设计需要满足实时性与高通量的要求，因此在本示例中，设置了采样函数以使得每通过两个数据包抓取一个数据包。随后，对采样到的数据进行包重组、协议解码和端口检测的预处理。接下来设置两个线程，其中一个使用Snort的规则集和匹配算法来进行规则匹配来识别恶意流量，其中将Snort的规则匹配算法移植到GPU上，以进行并行计算，从而提高规则匹配的效率。另一个线程对数据包的源端口、源地址、目的端口、目的地址、ICMP类型、协议标识符、原始数据长度和原始数据进行特征提取。然后利用训练后的机器学习模型对流量进行分类，以识别出未知的恶意流量。最后，对两个线程得到的结果进行融合，以使恶意流量被有效拦截并且使合法流量顺利通过检测系统。可选地，可以将融合的结果在可视化界面上进行显示，和/或将恶意流量的相关信息存储到数据库中以便后续分析处理。

图6示出了根据本公开实施例的一种融合了机器学习和规则匹配的安全检测设备60的框图。如图6所示，该安全检测设备60可以包括处理器62和存储器64。存储器64存储指令，该指令可由处理器62执行。当该指令由处理器62执行时，使处理器62：建立机器学习模型；利用带有标签的合法流量和恶意流量训练所建立的机器学习模型；采集网络流量；对采集到的网络流量进行预处理；采用基于规则匹配的方法从预处理后的网络流量中检测恶意流量；对预处理后的网络流量进行特征提取，并且然后基于提取到的特征，利用训练后的机器学习模型识别恶意流量；以及对采用基于规则匹配的方法检测到的恶意流量和使用训练后的机器学习模型识别出的恶意流量进行融合。

根据本公开实施例，当所述指令被处理器62执行时，还使处理器62执行图2所示的方法的任何步骤。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现，也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解，上述实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM、U盘、移动硬盘等)中，该非易失性存储介质包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备等)执行本公开各个实施例所述的方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明。在实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将系统的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

以上所述仅为本公开优选的具体实施方式，但本公开的保护范围并不局限于此。任何熟悉本技术领域的技术人员在本公开披露的技术范围内可轻易想到的变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应该以权利要求书的保护范围为准。

Claims

一种将机器学习和规则匹配相融合的安全检测方法(20)，所述方法包括：

建立(200)机器学习模型；

利用带有标签的合法流量和恶意流量来训练(S202)所述机器学习模型；

采集(S204)网络流量；

对采集到的网络流量进行预处理(S206)；

采用基于规则匹配的方法从预处理后的网络流量中检测(S208)恶意流量；

采用所述训练后的机器学习模型来从预处理的网络流量中识别(S210)恶意流量，其中，所述识别过程包括：对预处理后的网络流量进行特征提取(S210 ₁)，并且基于提取到的特征，利用训练后的机器学习模型来识别(S210 ₂)恶意流量；以及

对采用所述基于规则匹配的方法检测到的恶意流量和利用所述训练后的机器学习模型识别出的恶意流量进行融合(S212)。
根据权利要求1所述的安全检测方法(20)，其中，利用带有标签的合法流量和恶意流量来训练所述机器学习模型(S202)包括：

从带有标签的合法流量和恶意流量中提取基于时间的特征、基于网络层的特征和基于TTL的特征(S202 ₁)；以及

基于所提取的特征来训练所述机器学习模型(S202 ₂)；并且

其中，所述安全检测方法(20)还包括使用验证数据集来验证训练后的机器学习模型(S203)。
根据权利要求1所述的安全检测方法(20)，其中，所述安全检测方法(20)还包括：

按照指定采样规则，对采集到的网络流量进行采样(S205)，并且对采集到的网络流量进行预处理(S206)还包括：对采样得到的网络流量进行预处理；并且

其中，所述安全检测方法(20)还包括：通过可视化技术来显示融合的结果(S214)。
根据权利要求1或3所述的安全检测方法(20)，其中，对所述网络流量的采集是在GPU上执行的，并且其中，基于零拷贝技术，利用直接内存存取结构，将网络流量中的数据包从网卡的缓存队列直接复制到用户空间。
根据权利要求3所述的安全检测方法(20)，其中，对采集到的网络流量进行采样(S205)包括：

使用灵活采样算法对所述采集到的网络流量进行采样；

其中，所述灵活采样算法是一种依赖于数据流大小的数据流记录选择算法；给定一个大小为n的数据流集合S＝{X ₁，...，X _n}，所述灵活采样算法将以概率P(x _i)，i＝1,…,n从每一X _i中选择一个大小为x _i的数据流x _i′来形成一个新的数据流集合S′＝{x ₁′，...，x _n′}；所述灵活采样算法的目标是使通过采样计算出的总字节数
趋近真实流量的总字节数
其中，i＝1，...，n。
根据权利要求1或3所述的安全检测方法(20)，其中，对所述采集到的网络流量进行预处理(S206)包括对所述采集到的网络流量中的数据包进行数据包重组、协议解码和/或异常检测；其中，所述数据包重组分为流重组和分片重组，所述协议解码是将数据包的协议解码成统一的格式，所述异常检测至少包括端口扫描；并且其中，当数据包通过异常检测时，预处理的结果是经过数据包重组与协议解码的数据；否则，产生报警。
根据权利要求1或3所述的安全检测方法(20)，其中采用所述基于规则匹配的方法从所述预处理后的网络流量中检测恶意流量(S208)包括：

使用PFAC算法来检测恶意流量；

其中，所述PFAC算法为输入数据流的每个字节创建一个单独的线程，以标识从线程起始位置开始的任何模式，所创建的线程数等于输入数据流的长度；

其中，所述PFAC算法的每个线程仅负责识别从线程起始位置开始的模式，每当线程找不到位于线程起始位置的任何模式时，终止而不以回溯状态机进行故障转换；所述PFAC算法的每个最终状态代表一种独特的模式，从而能够在不处理多个输出的情况下保持PFAC中每个最终状态的唯一性；

其中，通过PFAC算法，将数据流的有效负载同时并行地与入侵检测的规则集中的多条规则进行匹配验证，如果发生匹配，则将数据流标示为恶意流量并触发警报。
根据权利要求1或3所述的安全检测方法(20)，其中，对所述预处理后的网络流量进行特征提取(S210 ₁)包括提取如下特征：源端口、源地址、目的端口、目的地址、ICMP类型、协议标识符、原始数据长度和原始数据。
根据权利要求8所述的安全检测方法(20)，其中，对所述预处理后的网络流量进行特征提取(S210 ₁)包括：

在GPU中实现一个哈希表，所述哈希表用来维护和追踪网络流量中的每一条活跃流量的特征数据的索引，每个数据单元特有的哈希值用来确定一条特定的数据流；

其中，每一个互斥的哈希条目上使用了原子锁，使得每一个时刻只有一个线程被允许更新其哈希条目；当一个特征数据传输结束时，其对应的数据流会变成非活跃的，这将触发从哈希表中删除相应数据流对应的特征数据的操作；对所述网络流量中的每条数据流而言，最后到达的数据包的时间被记录在了哈希表中，

其中，采用一种基于阈值的方法来确定一条非活跃的数据流，所述基于阈值的方法包括当时间间隔超过了阈值时，确定相应数据流的特征数据是非活跃的；

其中，通过设置一个定时任务来输出非活跃数据流的特征数据，并且其中，基于特征数据，利用所述训练后的机器学习模型进行分类。
根据权利要求1所述的安全检测方法(20)，其中，建立和训练所述机器学习模型的步骤是离线地执行的，采集、预处理、检测、识别和融合的步骤是在线地执行的。
一种将机器学习和规则匹配相融合的安全检测设备(60)，包括：

处理器(62)；以及

存储器(64)，所述存储器存储指令，所述指令当由所述处理器(62)执行时，使所述处理器(62)：

建立机器学习模型；

利用带有标签的合法流量和恶意流量来训练所述机器学习模型；

采集网络流量；

对采集到的网络流量进行预处理；

采用基于规则匹配的方法从预处理后的网络流量中检测恶意流量；

采用所述训练后的机器学习模型来从预处理的网络流量中识别恶意流量，其中，所述识别过程包括：对预处理后的网络流量进行特征提取，并且基于提取到的特征，利用训练后的机器学习模型来识别恶意流量；以及

对采用所述基于规则匹配的方法检测到的恶意流量和利用所述训练后的机器学习模型识别出的恶意流量进行融合。
根据权利要求11所述的安全检测设备(60)，其中，所述指令当由所述处理器(62)执行时，还使所述处理器(62)：

从带有标签的合法流量和恶意流量中提取基于时间的特征、基于网络层的特征和基于TTL的特征；

基于所提取的特征来训练所述机器学习模型；以及

使用验证数据集来验证训练后的机器学习模型。
根据权利要求11所述的安全检测设备(60)，其中，所述指令当由所述处理器(62)执行时，还使所述处理器(62)：

按照指定采样规则，对采集到的网络流量进行采样，并且对采样得到的网络流量进行预处理；并且

其中，所述指令当由所述处理器(62)执行时，还使所述处理器(62)通过可视化技术来显示融合的结果。
根据权利要求11或13所述的安全检测设备(60)，其中，对所述网络流量的采集是在GPU上执行的，并且其中，基于零拷贝技术，利用直接内存存取结构，将网络流量中的数据包从网卡的缓存队列直接复制到用户空间。
根据权利要求13所述的安全检测设备(60)，其中，所述指令当由所述处理器(62)执行时，还使所述处理器(62)：

使用灵活采样算法对所述采集到的网络流量进行采样；

其中，所述灵活采样算法是一种依赖于数据流大小的数据流记录选择算法；给定一个大小为n的数据流集合S＝{X ₁，...，X _n}，所述灵活采样算法将以概率P(x _i)，i＝1,…,n从每一X _i中选择一个大小为x _i的数据流x _i′来形成一个新的数据流集合S′＝{x ₁′，...，x _n′}；所述灵活采样算法的目标是使通过采样计算出的总字节数
趋近真实流量的总字节数
其中，i＝1，...，n。
根据权利要求11或13所述的安全检测设备(60)，其中，所述指令当由所述处理器(62)执行时，还使所述处理器(62)：

对所述采集到的网络流量中的数据包进行数据包重组、协议解码和/或异常检测；

其中，所述数据包重组分为流重组和分片重组，所述协议解码是将数据包的协议解码成统一的格式，所述异常检测至少包括端口扫描；并且其中，当数据包通过异常检测时，预处理的结果是经过数据包重组与协议解码的数据；否则，产生报警。
根据权利要求11或13所述的安全检测设备(60)，其中，所述指令当由所述处理器(62)执行时，还使所述处理器(62)：

使用PFAC算法来检测恶意流量；

其中，所述PFAC算法为输入数据流的每个字节创建一个单独的线程，以标识从线程起始位置开始的任何模式，所创建的线程数等于输入数据流的长度；

其中，所述PFAC算法的每个线程仅负责识别从线程起始位置开始的模式，每当线程找不到位于线程起始位置的任何模式时，终止而不以回溯状态机进行故障转换；所述PFAC算法的每个最终状态代表一种独特的模式，从而能够在不处理多个输出的情况下保持PFAC中每个最终状态的唯一性；

其中，通过PFAC算法，将数据流的有效负载同时并行地与入侵检测的规则集中的多条规则进行匹配验证，如果发生匹配，则将数据流标示为恶意流量并触发警报。
根据权利要求11或13所述的安全检测设备(60)，其中，所述指令当由所述处理器(62)执行时，还使所述处理器(62)：

从所述预处理后的网络流量中提取如下特征：源端口、源地址、目的端口、目的地址、ICMP类型、协议标识符、原始数据长度和原始数据。
根据权利要求18所述的安全检测设备(60)，其中，所述指令当由所述处理器(62)执行时，还使所述处理器(62)：

在GPU中实现一个哈希表，所述哈希表用来维护和追踪网络流量中的每一条活跃流量的特征数据的索引，每个数据单元特有的哈希值用来确定一条特定的数据流；

其中，每一个互斥的哈希条目上使用了原子锁，使得每一个时刻只有一个线程被允许更新其哈希条目；当一个特征数据传输结束时，其对应的数据流会变成非活跃的，这将触发从哈希表中删除相应数据流对应的特征数据的操作；对所述网络流量中的每条数据流而言，最后到达的数据包的时间被记录在了哈希表中，

其中，采用一种基于阈值的方法来确定一条非活跃的数据流，所述基于阈值的方法包括当时间间隔超过了阈值时，确定相应数据流的特征数据是非活跃的；

其中，通过设置一个定时任务来输出非活跃数据流的特征数据，并且其中，基于特征数据，利用所述训练后的机器学习模型进行分类。
根据权利要求11所述的安全检测设备(60)，其中，所述指令当由所述处理器(62)执行时，还使所述处理器(62)：

以离线方式执行所述机器学习模型的建立和训练的操作，并且以在线方式执行采集、预处理、检测、识别和融合的操作。
一种存储指令的计算机可读存储介质，所述指令当由处理器执行时，使所述处理器执行根据权利要求1-10中的任一项所述的方法。