CN110532778A - 基于生成对抗网络的工控协议漏洞挖掘系统 - Google Patents

基于生成对抗网络的工控协议漏洞挖掘系统 Download PDF

Info

Publication number
CN110532778A
CN110532778A CN201910625643.8A CN201910625643A CN110532778A CN 110532778 A CN110532778 A CN 110532778A CN 201910625643 A CN201910625643 A CN 201910625643A CN 110532778 A CN110532778 A CN 110532778A
Authority
CN
China
Prior art keywords
data
model
training
submodule
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910625643.8A
Other languages
English (en)
Inventor
史建琦
黄滟鸿
战云龙
孙文圣
郭欣
李志辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Fenglei Information Technology Co Ltd
East China Normal University
Original Assignee
Shanghai Fenglei Information Technology Co Ltd
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Fenglei Information Technology Co Ltd, East China Normal University filed Critical Shanghai Fenglei Information Technology Co Ltd
Priority to CN201910625643.8A priority Critical patent/CN110532778A/zh
Publication of CN110532778A publication Critical patent/CN110532778A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/57Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
    • G06F21/577Assessing vulnerabilities and evaluating computer system security
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及工业控制系统、深度对抗学习、模糊测试领域,特别涉及一种基于生成对抗网络的工控协议漏洞挖掘系统。包括:深度对抗学习模块,生成模糊测试数据;攻击测试模块,把深度对抗学习模块生成的模糊测试数据注入到系统中,并记录系统的异常反馈,挖掘该系统的漏洞。本发明通过将模糊测试技术与深度对抗学习技术相结合,实现高效,自主的学习通讯数据的格式,并生成带有变异的模糊测试数据,这种技术将极大减轻漏洞挖掘中人的负担,做到高效且智能。

Description

基于生成对抗网络的工控协议漏洞挖掘系统
技术领域
本发明涉及工业控制系统、深度对抗学习、模糊测试领域,特别涉及一种基于生成对抗网络的工控协议漏洞挖掘系统。
背景技术
在传统的工控协议系统模糊测试漏洞挖掘技术中,模糊测试数据的设计生成过多的依靠人工的分析和设计,而且这种分析设计非常耗时费力,又容易出错,同时无法有效应对私有协议,或者未知格式的协议的系统进行测试数据生成,以至于工控协议系统的漏洞挖掘不够高效、智能。
发明内容
本发明实施例提供了一种基于生成对抗网络的工控协议漏洞挖掘系统,构造一个可智能快速的学习工控工系统中通讯数据的帧格,并生成正确格式模糊测试数据的漏洞挖掘系统,通过将模糊测试技术与深度对抗学习技术相结合,实现高效,自主的学习通讯数据的格式,并生成带有变异的模糊测试数据,这种技术将极大减轻漏洞挖掘中人的负担,做到高效且智能。
根据本发明实施例的第一方面,一种基于生成对抗网络的工控协议漏洞挖掘系统,包括:
深度对抗学习模块,用于生成模糊测试数据;
攻击测试模块,用于把深度对抗学习模块生成的模糊测试数据注入到系统中,并记录系统的异常反馈,挖掘该系统的漏洞。
还包括数据帧处理模块,用于抓取通讯过程中的通讯数据,并对数据进行预处理。
所述深度对抗学习模块,包括参数设定子模块、模型训练子模块和模型验证子模块,其中:
所述参数设定子模块,用于参数设定模块针对工控系统中数据特点,选择神经网络的结构;
所述模型训练子模块,用于用预处理后的通讯数据作为训练数据集,采用对抗神经网络,训练生成模型和判别模型;
所述模型验证子模块,用于用剩余部分的预处理后的通讯数据处理作为数据集,验证生成模型和判别模型。
攻击测试模块包括重新子训练模块,所述重新训练模块,用于对发现的系统异常行为进行记录,并记录引发该异常的特定数据帧数据,将特定数据帧数据复制后作为训练数据集,采用对抗神经网络,训练所述生成模型和所述判别模型。
所述生成模型激活函数为Relu激活函数。
所述生成模型中,利用权重裁剪,达到保持模型训练稳定。
Wasserstein距离指示模型训练的评价指标。
在判别模型中去掉了sigmoid激活函数。
数据帧处理模块包括数据帧抓取子模块和数据帧预处理子模块,其中:
所述数据帧抓取子模块,用于针对工控通讯系统的特点,抓取通讯过程中的通讯数据;
数据帧预处理子模块,用于对待分析的通讯数据进行预处理。
所述预处理包括数据帧扩增,数据帧聚类、编码操作。
本发明实施例提供的技术方案可以包括以下有益效果:
本发明提出的基于生成对抗网络的工控协议漏洞挖掘系统,实现将深度对抗学习技术应用到工控系统的漏洞挖掘中去,可在无人类智力分析投入的情况下,智能的学习工控系统中的数据帧模式,并生成类似模式的变异数据。同时,系统简单的参数调整即可以针对不同的工控系统进行模糊测试数据生成,来做压力测试挖掘漏洞,极大的减轻了人工分析设计测试数据的负担,提高了系统的智能程度。
基于生成对抗网络,系统将直接从待测试的工控系统中做无监督学习,生成大量测试数据,有效减轻人类的分析设计负担,减少人类的智力投入。
基于生成对抗网络,系统可方便适应不同的工控系统,在面对没有规范的工控系统,或者私有协议系统时候,可以智能地从通讯数据中进行学习,做到高度智能化。
附图说明
此处的附图被并入说明书中并构成本说明书的一模块,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是本发明实施例一基于生成对抗网络的工控协议漏洞挖掘系统模块图;
图2是本发明实施例二基于生成对抗网络的工控协议漏洞挖掘系统模块图;
图3是本发明实施例二基于生成对抗网络的工控协议漏洞挖掘系统的数据帧的处理示意图。
具体实施方式
本发明构造一个可智能地学习生成测试数据对工控系统做漏洞挖掘的技术系统,通过以现有通讯数据帧为基础,训练生成对抗神经网络,得到特定的生成器模型和判别器模型,生成器模型将生成大量类似模式的数据作为测试数据,用这些数据对系统进行挖掘测试,通过模糊测试技术和深度对抗学习技术的结合,实现工控系统漏洞的智能挖掘。
实施例一
如图1所示,本发明提供了一种基于生成对抗网络的工控协议漏洞挖掘系统,包括:
深度对抗学习模块,用于生成模糊测试数据;深度对抗学习模块,用于通过神经对抗训练,可以生成模糊测试数据。
攻击测试模块,用于把深度对抗学习模块生成的模糊测试数据注入到系统中,并记录系统的异常反馈,挖掘该系统的漏洞。
实施例二
如图2、图3所示,本发明提供了一种基于生成对抗网络的工控协议漏洞挖掘系统,具体包括:
数据帧处理模块,用于利用统计学和机器学习技术,对源生数据进行聚类、对齐、格式转换操作;由于所处理的数据为工控系统中的通讯数据,特点是序列式的,有统一的模式,长短不一;通讯数据有固定的协议格式,有模式信息存在,其针对工控通讯系统的特点,抓取通讯过程中的通讯数据,并将十六进制的数据转换为十进制格式,再存储到特定的文件或数据库;
数据帧处理模块包括数据帧抓取子模块和数据帧预处理子模块;
数据帧抓取子模块针对工控通讯系统的特点,抓取通讯过程中的通讯数据;
数据帧预处理子模块对待分析的通讯数据进行预处理,如:数据帧扩增,数据帧聚类等;并对抓到的通讯数据进行编码操作,如:独热编码等;便于后续部分的处理;
深度对抗学习模块基于生成对抗网络(WGAN),用原始收集的预处理后的正常通讯数处理后作为训练数据集,训练得到生成模型,训练好的生成模型将产生和正常数据具有相同格式但内容存在差异的序列数据,同时训练判别模型对生成的序列数据进行真假判别,如此对抗训练不断调整生成模型和判别模型,最终得到稳定的两个模型;基于生成对抗网络的深度对抗学习模块,利用生成对抗网络,引入生成器模型和判别器模型,做对抗学习,达到无监督学习的效果;
深度对抗学习模块包括参数设定子模块、模型训练子模块和模型验证子模块;
参数设定子模块针对工控系统中数据特点,合理选择神经网络的结构,提高模型训练的速度;根据数据帧的格式的正确率高,选择卷积神经网络;数据帧有时序关系,选择循环神经网络。
模型训练子模块用预处理后的通讯数据处理作为训练数据集,训练得到生成模型,训练好的生成模型将产生和正常数据具有相同格式但内容存在差异的序列数据,同时训练判别模型对生成的序列数据进行真假判别,如此对抗训练不断调整生成模型和判别模型,最终得到稳定的两个模型。
模型验证子模块用剩余部分的预处理后的正常通讯数据处理作为数据集,验证生成模型和判别模型;
所述基于生成对抗网络(WGAN)的深度对抗学习模块,引入Wasserstein距离来衡量两个分布之间的差异,该度量可以有效指示模型训练的好坏,提供了较好的模型评价指标;Wasserstein距离又叫Earth-Mover距离(EM距离),用于衡量两个分布之间的差异。
处理过后的数据将输入到判别器模型中,叛别器模型是基于全连接的神经网络,将高斯噪声输入到生成器模型中进行处理并输出,该输出将作也作为判别器的输入去判断真假,生成对抗训练模块,在训练过程中两个模型不断调整自己的模型参数形成稳定的模型;
优选的,针对生成对抗网络训练不稳定的特点,在生成模型激活函数的选择上使用了Relu激活函数,减少模型训练的不稳定性;
所述基于生成对抗网络(WGAN)的深度对抗学习模块,在判别模型中去掉了sigmoid激活函数,并在训练中使用权重裁剪对模型的参数进行调整,避免模型训练过程中的模型崩溃,保持生成的测试数据的多样性;
基于生成对抗网络的深度对抗学习模块,对生成模型中,利用权重裁剪方法,达到保持模型训练稳定的效果,避免模型不收敛,模型崩溃;
攻击测试模块,将生成的数据发送注入到目标系统中去,挖掘系统漏洞,并记录引发的异常行为和对应的发送接收过程。
基于生成对抗网络(WGAN)的深度对抗学习模块,其用于对抓取的数据进行模式信息的学习,用学习到的模式指导测试数据的生成;利用生成对抗网络,引入生成模型和对抗模型进行无监督学习,用于解决数据模式挖掘的难点,有效应对不同的协议系统,进行学习;
针对通讯系统数据帧的特点,合理选择全链接神经网络架构作为每个模块的模型基础,进行模型设计;
攻击测试模块,用于把深度对抗学习模块生成的模糊测试数据注入到对应的系统中,并记录系统的异常反馈,以挖掘该系统的漏洞;
将深度对抗学习模块生成的大量数据帧发送给特定的系统进行压力测试,记录发送接收的过程,以发现系统的异常行为;
优选的,攻击测试模块还包括重新训练子模块,重新训练子模块对发现的系统异常行为进行记录,并记录引发该异常的特定数据帧数据,将特定数据帧数据复制后作为训练数据集,采用对抗神经网络,训练生成模型和判别模型。
本发明基于生成对抗网络的工控协议漏洞挖掘系统,实现将深度对抗学习技术和模糊测试技术应用于工控系统的漏洞挖掘中去,可在无人工分析投入的情况下,智能地学习挖掘通讯系统中的数据帧模式。同时,通过简单的参数调整,该系同可以适应其他多中工控系统的漏洞挖掘。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种基于生成对抗网络的工控协议漏洞挖掘系统,其特征在于,包括:
深度对抗学习模块,用于生成模糊测试数据;
攻击测试模块,用于把深度对抗学习模块生成的模糊测试数据注入到系统中,并记录系统的异常反馈,挖掘该系统的漏洞。
2.如权利要求1所述的系统,其特征在于,还包括数据帧处理模块,用于抓取通讯过程中的通讯数据,并对数据进行预处理。
3.如权利要求2所述的系统,其特征在于,所述深度对抗学习模块,包括参数设定子模块、模型训练子模块和模型验证子模块,其中:
所述参数设定子模块,用于参数设定模块针对工控系统中数据特点,选择神经网络的结构;
所述模型训练子模块,用于用预处理后的通讯数据作为训练数据集,采用对抗神经网络,训练生成模型和判别模型;
所述模型验证子模块,用于用剩余部分的预处理后的通讯数据处理作为数据集,验证生成模型和判别模型。
4.如权利要求3所述的系统,其特征在于,攻击测试模块包括重新子训练模块,所述重新训练模块,用于对发现的系统异常行为进行记录,并记录引发该异常的特定数据帧数据,将特定数据帧数据复制后作为训练数据集,采用对抗神经网络,训练所述生成模型和所述判别模型。
5.如权利要求3所述的系统,其特征在于,所述生成模型激活函数为Relu激活函数。
6.如权利要求3所述的系统,其特征在于,所述生成模型中,利用权重裁剪,达到保持模型训练稳定。
7.如权利要求3所述的系统,其特征在于,Wasserstein距离指示模型训练的评价指标。
8.如权利要求3所述的系统,其特征在于,在判别模型中去掉了sigmoid激活函数。
9.如权利要求2-8任意一项权利要求所述的系统,其特征在于,数据帧处理模块包括数据帧抓取子模块和数据帧预处理子模块,其中:
所述数据帧抓取子模块,用于针对工控通讯系统的特点,抓取通讯过程中的通讯数据;
数据帧预处理子模块,用于对待分析的通讯数据进行预处理。
10.如权利要求9所述的系统,其特征在于,所述预处理包括数据帧扩增,数据帧聚类、编码操作。
CN201910625643.8A 2019-07-11 2019-07-11 基于生成对抗网络的工控协议漏洞挖掘系统 Pending CN110532778A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910625643.8A CN110532778A (zh) 2019-07-11 2019-07-11 基于生成对抗网络的工控协议漏洞挖掘系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910625643.8A CN110532778A (zh) 2019-07-11 2019-07-11 基于生成对抗网络的工控协议漏洞挖掘系统

Publications (1)

Publication Number Publication Date
CN110532778A true CN110532778A (zh) 2019-12-03

Family

ID=68659675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910625643.8A Pending CN110532778A (zh) 2019-07-11 2019-07-11 基于生成对抗网络的工控协议漏洞挖掘系统

Country Status (1)

Country Link
CN (1) CN110532778A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112073242A (zh) * 2020-09-08 2020-12-11 中国人民解放军陆军工程大学 一种网络协议模糊测试用例的生成及应用方法
CN112364354A (zh) * 2020-11-04 2021-02-12 深圳供电局有限公司 一种云安全漏洞的挖掘分析系统
CN113312891A (zh) * 2021-04-22 2021-08-27 北京墨云科技有限公司 一种基于生成模型的payload自动生成方法、装置、系统
CN114117450A (zh) * 2021-12-01 2022-03-01 湖南大学 一种用于可信计算环境模糊测试的种子生成方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170169357A1 (en) * 2015-12-15 2017-06-15 Deep Instinct Ltd. Methods and systems for data traffic analysis
CN108549597A (zh) * 2018-03-05 2018-09-18 浙江大学 一种基于wgan模型的模糊检测种子集合生成方法及生成器
CN109218134A (zh) * 2018-09-27 2019-01-15 华东师范大学 一种基于神经风格迁移的测试用例生成系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170169357A1 (en) * 2015-12-15 2017-06-15 Deep Instinct Ltd. Methods and systems for data traffic analysis
CN108549597A (zh) * 2018-03-05 2018-09-18 浙江大学 一种基于wgan模型的模糊检测种子集合生成方法及生成器
CN109218134A (zh) * 2018-09-27 2019-01-15 华东师范大学 一种基于神经风格迁移的测试用例生成系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHIHUI LI等: "An Intelligent Fuzzing Data Generation Method Based on Deep Adversarial Learning", 《IEEE AEECSS》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112073242A (zh) * 2020-09-08 2020-12-11 中国人民解放军陆军工程大学 一种网络协议模糊测试用例的生成及应用方法
CN112364354A (zh) * 2020-11-04 2021-02-12 深圳供电局有限公司 一种云安全漏洞的挖掘分析系统
CN113312891A (zh) * 2021-04-22 2021-08-27 北京墨云科技有限公司 一种基于生成模型的payload自动生成方法、装置、系统
CN113312891B (zh) * 2021-04-22 2022-08-26 北京墨云科技有限公司 一种基于生成模型的payload自动生成方法、装置、系统
CN114117450A (zh) * 2021-12-01 2022-03-01 湖南大学 一种用于可信计算环境模糊测试的种子生成方法

Similar Documents

Publication Publication Date Title
CN110417755A (zh) 基于生成对抗网络的工控协议漏洞挖掘方法
CN110532778A (zh) 基于生成对抗网络的工控协议漏洞挖掘系统
Aldosari et al. Fusion in sensor networks with communication constraints
US11699278B2 (en) Mapper component for a neuro-linguistic behavior recognition system
CN111488577B (zh) 一种基于人工智能的模型建立方法和风险评估方法及装置
CN111242171B (zh) 网络故障的模型训练、诊断预测方法、装置以及电子设备
KR102440821B1 (ko) 신경 언어 행동 인식 시스템의 지각 연상 기억
CN108351986A (zh) 学习系统、学习装置、学习方法、学习程序、训练数据生成装置、训练数据生成方法、训练数据生成程序、终端装置以及阈值变更装置
US20080119959A1 (en) Expression of emotions in robot
CN109813542A (zh) 基于生成式对抗网络的空气处理机组的故障诊断方法
CN117435506B (zh) 模糊测试方法、电子设备及计算机可读存储介质
US20240095535A1 (en) Executing a genetic algorithm on a low-power controller
Woźniak et al. Active learning classification of drifted streaming data
CN108630228A (zh) 声品质识别方法、装置、系统、以及车辆
KR102102418B1 (ko) 인공지능 솔루션을 테스트하는 장치 및 방법
CN117667749B (zh) 一种模糊测试用例优化方法及系统
US20210312292A1 (en) Methods and systems for operating applications through user interfaces
Abdelli et al. Breaking boundaries: harnessing unrelated image data for robust risky event classification with scarce state of polarization data
CN109961035A (zh) 一种水稻分蘖期长势智慧监控调节方法
CN109711665A (zh) 一种基于金融风控数据的预测模型构建方法及相关设备
Xu et al. On value discrepancy of imitation learning
CN110380801B (zh) 基于lstm的协作感知算法及多usrp实现的方法
Arifuzzaman et al. Towards generalizable network anomaly detection models
CN113255765B (zh) 一种基于大脑机理的认知学习方法
CN113407945A (zh) 一种基于人机协同的规模化Fuzzing优化系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191203

RJ01 Rejection of invention patent application after publication