CN110532778A

CN110532778A - 基于生成对抗网络的工控协议漏洞挖掘系统

Info

Publication number: CN110532778A
Application number: CN201910625643.8A
Authority: CN
Inventors: 史建琦; 黄滟鸿; 战云龙; 孙文圣; 郭欣; 李志辉
Original assignee: Shanghai Fenglei Information Technology Co Ltd; East China Normal University
Current assignee: Shanghai Fenglei Information Technology Co Ltd; East China Normal University
Priority date: 2019-07-11
Filing date: 2019-07-11
Publication date: 2019-12-03

Abstract

本发明涉及工业控制系统、深度对抗学习、模糊测试领域，特别涉及一种基于生成对抗网络的工控协议漏洞挖掘系统。包括：深度对抗学习模块，生成模糊测试数据；攻击测试模块，把深度对抗学习模块生成的模糊测试数据注入到系统中，并记录系统的异常反馈，挖掘该系统的漏洞。本发明通过将模糊测试技术与深度对抗学习技术相结合，实现高效，自主的学习通讯数据的格式，并生成带有变异的模糊测试数据，这种技术将极大减轻漏洞挖掘中人的负担，做到高效且智能。

Description

基于生成对抗网络的工控协议漏洞挖掘系统

技术领域

本发明涉及工业控制系统、深度对抗学习、模糊测试领域，特别涉及一种基于生成对抗网络的工控协议漏洞挖掘系统。

背景技术

在传统的工控协议系统模糊测试漏洞挖掘技术中，模糊测试数据的设计生成过多的依靠人工的分析和设计，而且这种分析设计非常耗时费力，又容易出错，同时无法有效应对私有协议，或者未知格式的协议的系统进行测试数据生成，以至于工控协议系统的漏洞挖掘不够高效、智能。

发明内容

本发明实施例提供了一种基于生成对抗网络的工控协议漏洞挖掘系统，构造一个可智能快速的学习工控工系统中通讯数据的帧格，并生成正确格式模糊测试数据的漏洞挖掘系统，通过将模糊测试技术与深度对抗学习技术相结合，实现高效，自主的学习通讯数据的格式，并生成带有变异的模糊测试数据，这种技术将极大减轻漏洞挖掘中人的负担，做到高效且智能。

根据本发明实施例的第一方面，一种基于生成对抗网络的工控协议漏洞挖掘系统，包括：

深度对抗学习模块，用于生成模糊测试数据；

攻击测试模块，用于把深度对抗学习模块生成的模糊测试数据注入到系统中，并记录系统的异常反馈，挖掘该系统的漏洞。

还包括数据帧处理模块，用于抓取通讯过程中的通讯数据，并对数据进行预处理。

所述深度对抗学习模块，包括参数设定子模块、模型训练子模块和模型验证子模块，其中：

所述参数设定子模块，用于参数设定模块针对工控系统中数据特点，选择神经网络的结构；

所述模型训练子模块，用于用预处理后的通讯数据作为训练数据集，采用对抗神经网络，训练生成模型和判别模型；

所述模型验证子模块，用于用剩余部分的预处理后的通讯数据处理作为数据集，验证生成模型和判别模型。

攻击测试模块包括重新子训练模块，所述重新训练模块，用于对发现的系统异常行为进行记录，并记录引发该异常的特定数据帧数据，将特定数据帧数据复制后作为训练数据集，采用对抗神经网络，训练所述生成模型和所述判别模型。

所述生成模型激活函数为Relu激活函数。

所述生成模型中，利用权重裁剪，达到保持模型训练稳定。

Wasserstein距离指示模型训练的评价指标。

在判别模型中去掉了sigmoid激活函数。

数据帧处理模块包括数据帧抓取子模块和数据帧预处理子模块，其中：

所述数据帧抓取子模块，用于针对工控通讯系统的特点，抓取通讯过程中的通讯数据；

数据帧预处理子模块，用于对待分析的通讯数据进行预处理。

所述预处理包括数据帧扩增，数据帧聚类、编码操作。

本发明实施例提供的技术方案可以包括以下有益效果：

本发明提出的基于生成对抗网络的工控协议漏洞挖掘系统，实现将深度对抗学习技术应用到工控系统的漏洞挖掘中去，可在无人类智力分析投入的情况下，智能的学习工控系统中的数据帧模式，并生成类似模式的变异数据。同时，系统简单的参数调整即可以针对不同的工控系统进行模糊测试数据生成，来做压力测试挖掘漏洞，极大的减轻了人工分析设计测试数据的负担，提高了系统的智能程度。

基于生成对抗网络，系统将直接从待测试的工控系统中做无监督学习，生成大量测试数据，有效减轻人类的分析设计负担，减少人类的智力投入。

基于生成对抗网络，系统可方便适应不同的工控系统，在面对没有规范的工控系统，或者私有协议系统时候，可以智能地从通讯数据中进行学习，做到高度智能化。

附图说明

此处的附图被并入说明书中并构成本说明书的一模块，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是本发明实施例一基于生成对抗网络的工控协议漏洞挖掘系统模块图；

图2是本发明实施例二基于生成对抗网络的工控协议漏洞挖掘系统模块图；

图3是本发明实施例二基于生成对抗网络的工控协议漏洞挖掘系统的数据帧的处理示意图。

具体实施方式

本发明构造一个可智能地学习生成测试数据对工控系统做漏洞挖掘的技术系统，通过以现有通讯数据帧为基础，训练生成对抗神经网络，得到特定的生成器模型和判别器模型，生成器模型将生成大量类似模式的数据作为测试数据，用这些数据对系统进行挖掘测试,通过模糊测试技术和深度对抗学习技术的结合，实现工控系统漏洞的智能挖掘。

实施例一

如图1所示，本发明提供了一种基于生成对抗网络的工控协议漏洞挖掘系统，包括：

深度对抗学习模块，用于生成模糊测试数据；深度对抗学习模块，用于通过神经对抗训练，可以生成模糊测试数据。

实施例二

如图2、图3所示，本发明提供了一种基于生成对抗网络的工控协议漏洞挖掘系统，具体包括：

数据帧处理模块，用于利用统计学和机器学习技术，对源生数据进行聚类、对齐、格式转换操作；由于所处理的数据为工控系统中的通讯数据，特点是序列式的，有统一的模式，长短不一；通讯数据有固定的协议格式，有模式信息存在，其针对工控通讯系统的特点，抓取通讯过程中的通讯数据，并将十六进制的数据转换为十进制格式，再存储到特定的文件或数据库；

数据帧处理模块包括数据帧抓取子模块和数据帧预处理子模块；

数据帧抓取子模块针对工控通讯系统的特点，抓取通讯过程中的通讯数据；

数据帧预处理子模块对待分析的通讯数据进行预处理，如：数据帧扩增，数据帧聚类等；并对抓到的通讯数据进行编码操作，如：独热编码等；便于后续部分的处理；

深度对抗学习模块基于生成对抗网络(WGAN)，用原始收集的预处理后的正常通讯数处理后作为训练数据集，训练得到生成模型，训练好的生成模型将产生和正常数据具有相同格式但内容存在差异的序列数据，同时训练判别模型对生成的序列数据进行真假判别，如此对抗训练不断调整生成模型和判别模型，最终得到稳定的两个模型；基于生成对抗网络的深度对抗学习模块，利用生成对抗网络，引入生成器模型和判别器模型，做对抗学习，达到无监督学习的效果；

深度对抗学习模块包括参数设定子模块、模型训练子模块和模型验证子模块；

参数设定子模块针对工控系统中数据特点，合理选择神经网络的结构，提高模型训练的速度；根据数据帧的格式的正确率高，选择卷积神经网络；数据帧有时序关系，选择循环神经网络。

模型训练子模块用预处理后的通讯数据处理作为训练数据集，训练得到生成模型，训练好的生成模型将产生和正常数据具有相同格式但内容存在差异的序列数据，同时训练判别模型对生成的序列数据进行真假判别，如此对抗训练不断调整生成模型和判别模型，最终得到稳定的两个模型。

模型验证子模块用剩余部分的预处理后的正常通讯数据处理作为数据集，验证生成模型和判别模型；

所述基于生成对抗网络(WGAN)的深度对抗学习模块,引入Wasserstein距离来衡量两个分布之间的差异，该度量可以有效指示模型训练的好坏，提供了较好的模型评价指标；Wasserstein距离又叫Earth-Mover距离(EM距离)，用于衡量两个分布之间的差异。

处理过后的数据将输入到判别器模型中，叛别器模型是基于全连接的神经网络，将高斯噪声输入到生成器模型中进行处理并输出，该输出将作也作为判别器的输入去判断真假，生成对抗训练模块，在训练过程中两个模型不断调整自己的模型参数形成稳定的模型；

优选的，针对生成对抗网络训练不稳定的特点，在生成模型激活函数的选择上使用了Relu激活函数，减少模型训练的不稳定性；

所述基于生成对抗网络(WGAN)的深度对抗学习模块，在判别模型中去掉了sigmoid激活函数，并在训练中使用权重裁剪对模型的参数进行调整，避免模型训练过程中的模型崩溃，保持生成的测试数据的多样性；

基于生成对抗网络的深度对抗学习模块，对生成模型中，利用权重裁剪方法，达到保持模型训练稳定的效果，避免模型不收敛，模型崩溃；

攻击测试模块，将生成的数据发送注入到目标系统中去，挖掘系统漏洞，并记录引发的异常行为和对应的发送接收过程。

基于生成对抗网络(WGAN)的深度对抗学习模块，其用于对抓取的数据进行模式信息的学习，用学习到的模式指导测试数据的生成；利用生成对抗网络，引入生成模型和对抗模型进行无监督学习，用于解决数据模式挖掘的难点，有效应对不同的协议系统，进行学习；

针对通讯系统数据帧的特点，合理选择全链接神经网络架构作为每个模块的模型基础，进行模型设计；

攻击测试模块，用于把深度对抗学习模块生成的模糊测试数据注入到对应的系统中，并记录系统的异常反馈，以挖掘该系统的漏洞；

将深度对抗学习模块生成的大量数据帧发送给特定的系统进行压力测试，记录发送接收的过程，以发现系统的异常行为；

优选的，攻击测试模块还包括重新训练子模块，重新训练子模块对发现的系统异常行为进行记录，并记录引发该异常的特定数据帧数据，将特定数据帧数据复制后作为训练数据集，采用对抗神经网络，训练生成模型和判别模型。

本发明基于生成对抗网络的工控协议漏洞挖掘系统，实现将深度对抗学习技术和模糊测试技术应用于工控系统的漏洞挖掘中去，可在无人工分析投入的情况下，智能地学习挖掘通讯系统中的数据帧模式。同时，通过简单的参数调整，该系同可以适应其他多中工控系统的漏洞挖掘。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种基于生成对抗网络的工控协议漏洞挖掘系统，其特征在于，包括：

深度对抗学习模块，用于生成模糊测试数据；

2.如权利要求1所述的系统，其特征在于，还包括数据帧处理模块，用于抓取通讯过程中的通讯数据，并对数据进行预处理。

3.如权利要求2所述的系统，其特征在于，所述深度对抗学习模块，包括参数设定子模块、模型训练子模块和模型验证子模块，其中：

4.如权利要求3所述的系统，其特征在于，攻击测试模块包括重新子训练模块，所述重新训练模块，用于对发现的系统异常行为进行记录，并记录引发该异常的特定数据帧数据，将特定数据帧数据复制后作为训练数据集，采用对抗神经网络，训练所述生成模型和所述判别模型。

5.如权利要求3所述的系统，其特征在于，所述生成模型激活函数为Relu激活函数。

6.如权利要求3所述的系统，其特征在于，所述生成模型中，利用权重裁剪，达到保持模型训练稳定。

7.如权利要求3所述的系统，其特征在于，Wasserstein距离指示模型训练的评价指标。

8.如权利要求3所述的系统，其特征在于，在判别模型中去掉了sigmoid激活函数。

9.如权利要求2-8任意一项权利要求所述的系统，其特征在于，数据帧处理模块包括数据帧抓取子模块和数据帧预处理子模块，其中：

10.如权利要求9所述的系统，其特征在于，所述预处理包括数据帧扩增，数据帧聚类、编码操作。