CN115664775B - 一种基于gs-dnn模型的无线传感器网络入侵检测方法及系统 - Google Patents

一种基于gs-dnn模型的无线传感器网络入侵检测方法及系统 Download PDF

Info

Publication number
CN115664775B
CN115664775B CN202211291637.1A CN202211291637A CN115664775B CN 115664775 B CN115664775 B CN 115664775B CN 202211291637 A CN202211291637 A CN 202211291637A CN 115664775 B CN115664775 B CN 115664775B
Authority
CN
China
Prior art keywords
data
network
item
information
information influence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211291637.1A
Other languages
English (en)
Other versions
CN115664775A (zh
Inventor
廉佐政
李梦歌
杨双双
王海珍
滕艳平
李敬有
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qiqihar University
Original Assignee
Qiqihar University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qiqihar University filed Critical Qiqihar University
Priority to CN202211291637.1A priority Critical patent/CN115664775B/zh
Publication of CN115664775A publication Critical patent/CN115664775A/zh
Application granted granted Critical
Publication of CN115664775B publication Critical patent/CN115664775B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

一种基于GS‑DNN模型的无线传感器网络入侵检测方法及系统,涉及网络入侵检测技术领域。本发明的技术要点包括:获取网络特征数据集,网络特征数据集包括正常网络行为数据和网络攻击行为数据;并将网络特征数据集划分为训练集和测试集;对网络特征数据集进行数据预处理;根据数据项信息熵计算训练集和测试集的信息影响因子,根据训练集和测试集的信息影响因子计算信息影响相似比,以对预处理后的网络特征数据集进行特征筛选;将筛选后的特征数据集输入到基于深度神经网络的网络入侵检测模型中进行训练,获取训练好的网络入侵检测模型。本发明通过网格搜索法进行最佳特征提取,实现数据降维,不需要数据归一化处理,提高了入侵检测准确率。

Description

一种基于GS-DNN模型的无线传感器网络入侵检测方法及系统
技术领域
本发明涉及网络入侵检测技术领域,具体涉及一种基于GS-DNN模型的无线传感器网络入侵检测方法及系统。
背景技术
随着网络技术的不断发展,网络安全也成为了用户关注的重点,作为物联网关键组成部分的无线传感器网络(Wireless Sensor Network,WSN)的安全问题日益突出,无线传感器网络具有自组织性,部署便捷,适应能力强,体积小,便于携带,因此,被广泛应用到环境监测、军事领域、医疗护理等领域。但受成本限制,传感器节点存在能量、计算能力、内存方面受限问题,而且无线通信易被干扰。因此,WSN易受到安全威胁和攻击,需要采取一些有效的安全措施。目前,已经提出了数据加密机制、密钥管理机制、防火墙等技术,用于改善WSN的安全性。但伴随新型的攻击手段的不断涌现,这些技术已经不能满足WSN的安全需求。
入侵检测技术可以实时地检测网络中的入侵行为,并及时做出响应,减少网络的损失有效地弥补了上述技术的不足。目前,WSN入侵检测技术大多引入了机器学习方法,如决策树(Decision Tree,DT)、随机森林(Random Forest,RF)等,在现实的环境中,网络会基于时间产生高维且非线性的海量数据,机器学习方法无法提取网络数据中最本质的特征,使得入侵检测准确率较低,且算法很复杂、训练的时间长。因此,在WSN入侵检测领域中应用深度学习,显得尤为迫切。
发明内容
鉴于以上问题,本发明提出一种基于GS-DNN模型的无线传感器网络入侵检测方法及系统,以力图解决或者至少缓解上面存在的至少一个问题。
根据本发明的一方面,提供一种基于GS-DNN模型的无线传感器网络入侵检测方法,该方法包括以下步骤:
步骤一、获取网络特征数据集,所述网络特征数据集包括正常网络行为数据和网络攻击行为数据;并将网络特征数据集划分为训练集和测试集;
步骤二、对所述网络特征数据集进行数据预处理;
步骤三、根据数据项信息熵计算训练集和测试集的信息影响因子,根据训练集和测试集的信息影响因子计算信息影响相似比,以对预处理后的网络特征数据集进行特征筛选,获取筛选后的特征数据集;
步骤四、将筛选后的特征数据集输入到基于深度神经网络的网络入侵检测模型中进行训练,获取训练好的网络入侵检测模型;
步骤五、将经过预处理后的待检测网络数据输入训练好的网络入侵检测模型中,获取检测结果。
进一步地,步骤一中所述网络特征数据集为UNSW-NB15数据集,去除其原始标签特征Label,将特征数据项attack_cat作为标签。
进一步地,所述预处理包括:将非数字型的数据项进行数值化处理;将浮点型数据项转换为整数。
进一步地,步骤二中所述预处理还包括:对数值化处理后的特征数据项attack_cat进行独热编码。
进一步地,步骤三的具体过程包括:
步骤三一、根据每项数据项元素出现的次数,按照下述公式计算每项数据项信息熵:
Figure BDA0003899323350000021
其中,j表示每项数据项元素出现的总类数;n表示每类元素出现的次数;m表示数据集数据总条数;
步骤三二、计算信息影响因子和信息影响相似比:信息影响因子表示数据集中每项数据项对标签项的影响,计算方法是数据集每列数据项信息熵与标签项信息熵的比值;信息影响相似比的计算方法为:测试集每项数据项的信息影响因子与训练集每项数据项的信息影响因子的比值;
步骤三三、对于训练集和测试集,均进行以下两步操作,第一步操作为:将信息影响因子向下取整,作为第一次网格搜索法的阈值取值的集合,计算获得所述集合中所有阈值的平均数,记为av1,使用网格搜索法遍历预处理后的训练集或测试集中每个信息影响因子,选取信息影响因子大于av1的数据项,组合成一个新的数据集,记为训练集一或测试集一;第二步操作为:将信息影响相似比向下取整,作为再次进行网格搜索法的阈值取值的集合,计算获得该集合中所有阈值的平均数,记为av2,使用网格搜索法遍历预处理后的训练集或测试集中每个信息影响因子,选取信息影响相似比小于av2的数据项,组合成一个新的数据集,记为训练集二或测试集二;
步骤三四、将训练集一和训练集二合并获得筛选后的特征训练集、测试集一和测试集二合并获得筛选后的特征测试集。
进一步地,将浮点型数据项转为整数的方法为:若特征值大于10000,则按照下述公式计算:
Figure BDA0003899323350000031
若特征值小于1,则按照下述公式计算:
Figure BDA0003899323350000032
式中,Ol-1表示待转换的浮点数,
Figure BDA0003899323350000033
表示上取整,/>
Figure BDA0003899323350000034
表示下取整。
根据本发明的另一方面,提供一种基于GS-DNN模型的无线传感器网络入侵检测系统,该系统包括:
数据获取模块,其配置成获取网络特征数据集,所述网络特征数据集包括正常网络行为数据和网络攻击行为数据;并将网络特征数据集划分为训练集和测试集;
预处理模块,其配置成对所述网络特征数据集进行数据预处理;
特征提取模块,其配置成根据数据项信息熵计算训练集和测试集的信息影响因子,根据训练集和测试集的信息影响因子计算信息影响相似比,以对预处理后的网络特征数据集进行特征筛选,获取筛选后的特征数据集;
模型训练模块,其配置成将筛选后的特征数据集输入到基于深度神经网络的网络入侵检测模型中进行训练,获取训练好的网络入侵检测模型;
检测模块,其配置成将经过预处理后的待检测网络数据输入训练好的网络入侵检测模型中,获取检测结果。
进一步地,所述数据获取模块中所述网络特征数据集为UNSW-NB15数据集,去除其原始标签特征Label,将特征数据项attack_cat作为标签。
进一步地,所述预处理包括:将非数字型的数据项进行数值化处理;将浮点型数据项转换为整数;对数值化处理后的特征数据项attack_cat进行独热编码。
进一步地,所述特征提取模块中对预处理后的网络特征数据集进行特征筛选的具体过程包括:
步骤三一、根据每项数据项元素出现的次数,按照下述公式计算每项数据项信息熵:
Figure BDA0003899323350000035
其中,j表示每项数据项元素出现的总类数;n表示每类元素出现的次数;m表示数据集数据总条数;
步骤三二、计算信息影响因子和信息影响相似比:信息影响因子表示数据集中每项数据项对标签项的影响,计算方法是数据集每列数据项信息熵与标签项信息熵的比值;信息影响相似比的计算方法为:测试集每项数据项的信息影响因子与训练集每项数据项的信息影响因子的比值;
步骤三三、对于训练集和测试集,均进行以下两步操作,第一步操作为:将信息影响因子向下取整,作为第一次网格搜索法的阈值取值的集合,计算获得所述集合中所有阈值的平均数,记为av1,使用网格搜索法遍历预处理后的训练集或测试集中每个信息影响因子,选取信息影响因子大于av1的数据项,组合成一个新的数据集,记为训练集一或测试集一;第二步操作为:将信息影响相似比向下取整,作为再次进行网格搜索法的阈值取值的集合,计算获得该集合中所有阈值的平均数,记为av2,使用网格搜索法遍历预处理后的训练集或测试集中每个信息影响因子,选取信息影响相似比小于av2的数据项,组合成一个新的数据集,记为训练集二或测试集二;
步骤三四、将训练集一和训练集二合并获得筛选后的特征训练集、测试集一和测试集二合并获得筛选后的特征测试集。
本发明的有益技术效果是:
本发明基于综合性的网络攻击流量数据集UNSW-NB15,提出了一种基于DNN模型的WSN入侵检测方法,通过网格搜索法-GridSearchCV进行最佳特征提取,可提取数据集中最本质特征,有利于提高入侵检测准确率;通过特征提取,实现数据降维,不需要数据归一化处理;本发明实现了使用更少、更优的数据项带入DNN模型以达到更高准确率的效果。
附图说明
本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。
图1是本发明实施例一种基于GS-DNN模型的无线传感器网络入侵检测方法的流程图;
图2是传统DNN模型结构图;
图3是本发明实施例中GS-DNN模型结构图;
图4是本发明实施例一种基于GS-DNN模型的无线传感器网络入侵检测系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,在下文中将结合附图对本发明的示范性实施方式或实施例进行描述。显然,所描述的实施方式或实施例仅仅是本发明一部分的实施方式或实施例,而不是全部的。基于本发明中的实施方式或实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式或实施例,都应当属于本发明保护的范围。
本发明实施例提出一种基于GS-DNN模型的无线传感器网络入侵检测方法,如图1所示,该方法包括以下步骤:
步骤一、获取网络特征数据集,所述网络特征数据集包括正常网络行为数据和网络攻击行为数据;并将网络特征数据集划分为训练集和测试集;
步骤二、对所述网络特征数据集进行数据预处理;
步骤三、根据数据项信息熵计算训练集和测试集的信息影响因子,根据训练集和测试集的信息影响因子计算信息影响相似比,以对预处理后的网络特征数据集进行特征筛选,获取筛选后的特征数据集;
步骤四、将筛选后的特征数据集输入到基于深度神经网络的网络入侵检测模型中进行训练,获取训练好的网络入侵检测模型;
步骤五、将经过预处理后的待检测网络数据输入训练好的网络入侵检测模型中,获取检测结果。
本实施例中,优选地,步骤一中所述网络特征数据集为UNSW-NB15数据集,去除其原始标签特征Label,将特征数据项attack_cat作为标签。
本实施例中,优选地,所述预处理包括:将非数字型的数据项进行数值化处理;将浮点型数据项转换为整数。
本实施例中,优选地,步骤二中所述预处理还包括:对数值化处理后的特征数据项attack_cat进行独热编码。
本实施例中,优选地,步骤三的具体过程包括:
步骤三一、根据每项数据项元素出现的次数,按照下述公式计算每项数据项信息熵:
Figure BDA0003899323350000051
其中,j表示每项数据项元素出现的总类数;n表示每类元素出现的次数;m表示数据集数据总条数;
步骤三二、计算信息影响因子和信息影响相似比:信息影响因子表示数据集中每项数据项对标签项的影响,计算方法是数据集每列数据项信息熵与标签项信息熵的比值;信息影响相似比的计算方法为:测试集每项数据项的信息影响因子与训练集每项数据项的信息影响因子的比值;
步骤三三、对于训练集和测试集,均进行以下两步操作,第一步操作为:将信息影响因子向下取整,作为第一次网格搜索法的阈值取值的集合,计算获得所述集合中所有阈值的平均数,记为av1,使用网格搜索法遍历预处理后的训练集或测试集中每个信息影响因子,选取信息影响因子大于av1的数据项,组合成一个新的数据集,记为训练集一或测试集一;第二步操作为:将信息影响相似比向下取整,作为再次进行网格搜索法的阈值取值的集合,计算获得该集合中所有阈值的平均数,记为av2,使用网格搜索法遍历预处理后的训练集或测试集中每个信息影响因子,选取信息影响相似比小于av2的数据项,组合成一个新的数据集,记为训练集二或测试集二;
步骤三四、将训练集一和训练集二合并获得筛选后的特征训练集、测试集一和测试集二合并获得筛选后的特征测试集。
本实施例中,优选地,将浮点型数据项转为整数的方法为:若特征值大于10000,则按照下述公式计算:
Figure BDA0003899323350000061
若特征值小于1,则按照下述公式计算:
Figure BDA0003899323350000062
式中,Ol-1表示待转换的浮点数,
Figure BDA0003899323350000063
表示上取整,/>
Figure BDA0003899323350000064
表示下取整。
本发明另一实施例提出一种基于GS-DNN模型的无线传感器网络入侵检测方法,包括入侵检测方案设计、数据清洗、特征提取、GS-DNN模型设计及训练、模型评价等步骤,具体为:
步骤一、入侵检测方案设计:提出GS-DNN模型的无线传感器网络入侵检测方法。通过网格搜索法进行最佳特征提取,设计模型,并将提取的最佳特征输入到其中进行训练,通过实验进行模型评价,验证本模型的有效性。
步骤二、确定数据集:选取UNSW-NB15数据集,该数据集的原始网络数据包是澳大利亚网络安全中心(ACCS)使用IXIA PerfectStorm工具创造,包括6类共49个特征,其中,标签特征attack_cat包括正常网络行为normal,并包括9类网络攻击行为,即Fuzzers、Analysis、Backdoors、DoS、Exploits、Generic、Reconnaissance、Shellcode和Worms,如表1所示。本发明去除了原始数据的标签特征Label,将attack_cat作为标签,保留其他特征,并按比例3:7确定测试集和训练集。
表1
Figure BDA0003899323350000071
步骤三、数据清洗:将非数字型的数据项进行数值化处理;将浮点型数据项转为整数。
根据本发明实施例,将非数字型的数据项进行数值化处理的方法如下:
①将service,state,proto,attack_cat等非数字的数据项进行数值化处理,取数据集中的部分数据记录如表2所示,state这列数据项均为非数字型,将tcp、udp出现次数作为转换后的数值。
表2
Figure BDA0003899323350000072
②由于特征attack_cat作为标签,在对它转换为数值后,进行独热编码。
根据本发明实施例,将浮点型数据项转为整数的方法为:若特征值大于10000计算公式如式(1)所示,若特征值小于1计算公式如式(2)所示。
Figure BDA0003899323350000081
Figure BDA0003899323350000082
/>
式(1)-(2)中Ol-1表示待转换的浮点数,
Figure BDA0003899323350000083
表示上取整,/>
Figure BDA0003899323350000084
表示下取整,Ol表示Ol-1转换后的整数。
例如,数据集中两条数据记录中,特征djit对应的数据项分别为浮点型数值18953.60073、0.00064,将18953.60073作为Ol-1按照公式(1)进行转化,则转化后的整数Ol为6;将0.00064作为Ol-1按照公式(1)进行转化,则转化后的整数Ol为4。
步骤四、特征提取:python语言有字典类型dict{},创建两个字典分别学习训练集、测试集中每个特征的类别与出现次数,并将学习结果保留在字典中,计算每项数据项信息熵,通过信息熵计算信息影响因子及信息影响相似比。
定义信息影响因子及信息影响相似比,信息影响因子指一个数据集的每项数据项对标签项的影响,是数据集每列数据项信息熵与数据集标签项信息熵的比值;信息影响相似比为测试集每项数据项的信息影响因子与训练集每项数据项的信息影响因子的比值。
根据本发明实施例,依据表2保留在字典中的学习结果为:{'53':[4,315882],'59590':[4,3],'25':[4,28632],'tcp':[5,330378],'udp':[5,354327],'INT':[6,248473],'FIN':[6,326294],'CON':[6,122309]},字典中包含8个数据项,用逗号分隔,每个数据项由键和键值组成,它们由冒号分隔,冒号前的称为键,表示具体特征值,冒号后的内容第一个数表示该特征类别,第二个数表示该特征值在数据集中出现的次数。
提取字典中每项数据项元素出现的次数,计算每项数据项信息熵,计算公式如式(3)所示。
Figure BDA0003899323350000085
其中,j表示每项数据项元素出现的总类数,n表示每类元素出现的次数,m表示每项数据项总元素次数,即数据集数据总条数。
对训练集进行操作一:将训练集求解的信息影响因子向下取整,作为第一次网格搜索法(GridSearchCV)的阈值取值的集合,求集合中所有的阈值的平均数,记为av1,使用网格搜索法遍历训练集中每个信息影响因子,选取信息因子大于av1的数据项,组合成一个新的数据集,记为训练集一。
对测试集进行训练集同样的操作,生成新的数据集,记为测试集一。
对训练集进行操作二:将信息影响相似比向下取整,作为再次进行网格搜索法的阈值取值的集合,求集合中所有阈值的平均数,记为av2,使用网格搜索法遍历训练集中每个信息影响因子,选取信息影响相似比小于av2的数据项,组合成一个新的数据集,记为训练集二。
对测试集进行训练集同样的操作,生成新的数据集,记为测试集二。
将训练集一和训练集二合并得到最终的训练集,测试集一和测试集二合并得到最终的测试集。筛选后的特征数据集如表3所示。
表3
Figure BDA0003899323350000091
步骤五、GS-DNN模型设计及训练。
根据本发明实施例,GS-DNN模型设计时,考虑到DNN模型可以解决复杂的非线性分类问题,但隐含层过多,会出现梯度消失、导致过拟合现象。所以,设计的GS-DNN模型包括输入层、第一隐含层、第二隐含层和输出层,其中输入层是步骤四中GS提取的最佳特征。
分析数据集的特征及入侵检测需求,确定模型各层神经元数目、激活函数及损失函数。模型四层分别由512、256、128、10个神经元组成,输入层、隐含层、输出层的激活函数分别为tanh、leaky relu、softmax,如式(4)-(6)所示。损失函数如式(7)所示。
Figure BDA0003899323350000092
f(x)=max(0,x)+leak*min(0,x) (5)
Figure BDA0003899323350000093
Figure BDA0003899323350000094
式中,leak是一个常数,设置为0.25;n为输出节点个数即分类的类别个数,zi为输出第i分类结果的值;Y为模型标准输出,f(x)为模型训练集输出。
GS-DNN模型使用步骤四中生成的最终训练集、测试集对设计的模型进行训练、测试。
需要说明的是,本发明实施例数据清洗、特征提取过程对其他数据集也适用,且已对收集的数据集进行了处理,并应用到采矿项目中。
进一步通过实验验证本发明的技术效果。
实验使用win 10操作系统,安装Anaconda3,采用Python3.7版本编码。
UNSW-NB15数据集代入传统DNN模型需要最大最小值数据归一化,使用网格搜索法提取特征后的DNN模型无需数据归一化,且可以使用更少的数据项带入DNN模型,求得更高的准确率,传统的DNN模型测试准确率为96.8%,训练集准确率为96.1%;使用网格搜索法提取特征后的DNN模型测试准确率为99%,训练集准确率为98.4%,如表4所示。
表4
Figure BDA0003899323350000101
本发明基于真正(TP),假正(FP),真负(TN),假负(FN)等概念,绘制ROC曲线,来评价模型的有效性。设x轴为假正率,y轴为真正率,绘制传统DNN和GS-DNN模型的ROC曲线,由于ROC曲线下面的面积(AUC)越大,分类器性能越好,所以通过观察ROC曲线,可以看出本发明提出的GS-DNN模型的分类性能更好。
为了更直观地比较传统DNN模型和GS-DNN模型,相关的实验数据如表5所示,通过比较分析可知,GS-DNN模型的宏平均(先计算每个类别的准确率,再进行算术平均得到该测试集的准确率)与微平均(类别预测的准确率)虽然没有变化,但它在判定正常类别、攻击类型1、2、3、5、6、7的ROC曲线的AUC都有提高,只是判别攻击类型8减弱了0.03,且GS-DNN模型收敛速度更快,总体性能提升。
表5
类型 传统DNN模型 GS-DNN模型
微平均 1.00 1.00
宏平均 0.99 0.99
类别0(Fuzzers) 0.99 1.00
类别1(Analysis) 0.99 1.00
类别2(Backdoors) 0.99 1.00
类别3(Dos) 0.99 1.00
类别4(Exploits) 0.99 0.99
类别5(Generic) 0.97 1.00
类别6(Reconnaissance) 0.99 1.00
类别7(Shellcode) 0.98 1.00
类别8(Worms) 0.99 0.96
类别9(normal) 1.00 1.00
本发明另一实施例还提出一种基于GS-DNN模型的无线传感器网络入侵检测系统,如图4所示,该系统包括:
数据获取模块10,其配置成获取网络特征数据集,所述网络特征数据集包括正常网络行为数据和网络攻击行为数据;并将网络特征数据集划分为训练集和测试集;
预处理模块20,其配置成对所述网络特征数据集进行数据预处理;
特征提取模块30,其配置成根据数据项信息熵计算训练集和测试集的信息影响因子,根据训练集和测试集的信息影响因子计算信息影响相似比,以对预处理后的网络特征数据集进行特征筛选,获取筛选后的特征数据集;
模型训练模块40,其配置成将筛选后的特征数据集输入到基于深度神经网络的网络入侵检测模型中进行训练,获取训练好的网络入侵检测模型;
检测模块50,其配置成将经过预处理后的待检测网络数据输入训练好的网络入侵检测模型中,获取检测结果。
本实施例中,优选地,所述数据获取模块10中所述网络特征数据集为UNSW-NB15数据集,去除其原始标签特征Label,将特征数据项attack_cat作为标签。
本实施例中,优选地,所述预处理包括:将非数字型的数据项进行数值化处理;将浮点型数据项转换为整数;对数值化处理后的特征数据项attack_cat进行独热编码。
本实施例中,优选地,所述特征提取模块30中对预处理后的网络特征数据集进行特征筛选的具体过程包括:
步骤三一、根据每项数据项元素出现的次数,按照下述公式计算每项数据项信息熵:
Figure BDA0003899323350000111
其中,j表示每项数据项元素出现的总类数;n表示每类元素出现的次数;m表示数据集数据总条数;
步骤三二、计算信息影响因子和信息影响相似比:信息影响因子表示数据集中每项数据项对标签项的影响,计算方法是数据集每列数据项信息熵与标签项信息熵的比值;信息影响相似比的计算方法为:测试集每项数据项的信息影响因子与训练集每项数据项的信息影响因子的比值;
步骤三三、对于训练集和测试集,均进行以下两步操作,第一步操作为:将信息影响因子向下取整,作为第一次网格搜索法的阈值取值的集合,计算获得所述集合中所有阈值的平均数,记为av1,使用网格搜索法遍历预处理后的训练集或测试集中每个信息影响因子,选取信息影响因子大于av1的数据项,组合成一个新的数据集,记为训练集一或测试集一;第二步操作为:将信息影响相似比向下取整,作为再次进行网格搜索法的阈值取值的集合,计算获得该集合中所有阈值的平均数,记为av2,使用网格搜索法遍历预处理后的训练集或测试集中每个信息影响因子,选取信息影响相似比小于av2的数据项,组合成一个新的数据集,记为训练集二或测试集二;
步骤三四、将训练集一和训练集二合并获得筛选后的特征训练集、测试集一和测试集二合并获得筛选后的特征测试集。
本实施例所述一种基于GS-DNN模型的无线传感器网络入侵检测系统的功能可以由前述一种基于GS-DNN模型的无线传感器网络入侵检测方法说明,因此本实施例未详述部分,可参见以上方法实施例,在此不再赘述。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (8)

1.一种基于GS-DNN模型的无线传感器网络入侵检测方法,其特征在于,包括以下步骤:
步骤一、获取网络特征数据集,所述网络特征数据集包括正常网络行为数据和网络攻击行为数据;并将网络特征数据集划分为训练集和测试集;
步骤二、对所述网络特征数据集进行数据预处理;
步骤三、根据数据项信息熵计算训练集和测试集的信息影响因子,根据训练集和测试集的信息影响因子计算信息影响相似比,以对预处理后的网络特征数据集进行特征筛选,获取筛选后的特征数据集;具体过程包括:
步骤三一、根据每项数据项元素出现的次数,按照下述公式计算每项数据项信息熵:
Figure FDA0004147825050000011
其中,j表示每项数据项元素出现的总类数;n表示每类元素出现的次数;m表示数据集数据总条数;
步骤三二、计算信息影响因子和信息影响相似比:信息影响因子表示数据集中每项数据项对标签项的影响,计算方法是数据集每列数据项信息熵与标签项信息熵的比值;信息影响相似比的计算方法为:测试集每项数据项的信息影响因子与训练集每项数据项的信息影响因子的比值;
步骤三三、对于训练集和测试集,均进行以下两步操作,第一步操作为:将信息影响因子向下取整,作为第一次网格搜索法的阈值取值的集合,计算获得所述集合中所有阈值的平均数,记为av1,使用网格搜索法遍历预处理后的训练集或测试集中每个信息影响因子,选取信息影响因子大于av1的数据项,组合成一个新的数据集,记为训练集一或测试集一;第二步操作为:将信息影响相似比向下取整,作为再次进行网格搜索法的阈值取值的集合,计算获得该集合中所有阈值的平均数,记为av2,使用网格搜索法遍历预处理后的训练集或测试集中每个信息影响相似比,选取信息影响相似比小于av2的数据项,组合成一个新的数据集,记为训练集二或测试集二;
步骤三四、将训练集一和训练集二合并获得筛选后的特征训练集、测试集一和测试集二合并获得筛选后的特征测试集;
步骤四、将筛选后的特征数据集输入到基于深度神经网络的网络入侵检测模型中进行训练,获取训练好的网络入侵检测模型;
步骤五、将经过预处理后的待检测网络数据输入训练好的网络入侵检测模型中,获取检测结果。
2.根据权利要求1所述的一种基于GS-DNN模型的无线传感器网络入侵检测方法,其特征在于,步骤一中所述网络特征数据集为UNSW-NB15数据集,去除其原始标签特征Label,将特征数据项attack_cat作为标签。
3.根据权利要求2所述的一种基于GS-DNN模型的无线传感器网络入侵检测方法,其特征在于,所述预处理包括:将非数字型的数据项进行数值化处理;将浮点型数据项转换为整数。
4.根据权利要求3所述的一种基于GS-DNN模型的无线传感器网络入侵检测方法,其特征在于,步骤二中所述预处理还包括:对数值化处理后的特征数据项attack_cat进行独热编码。
5.根据权利要求3或4所述的一种基于GS-DNN模型的无线传感器网络入侵检测方法,其特征在于,将浮点型数据项转为整数的方法为:若特征值大于10000,则按照下述公式计算:
Figure FDA0004147825050000021
若特征值小于1,则按照下述公式计算:
Figure FDA0004147825050000022
式中,Ol表示Ol-1转换后的整数;Ol-1表示待转换的浮点数,
Figure FDA0004147825050000023
表示上取整,/>
Figure FDA0004147825050000024
表示下取整。
6.一种基于GS-DNN模型的无线传感器网络入侵检测系统,其特征在于,包括:
数据获取模块,其配置成获取网络特征数据集,所述网络特征数据集包括正常网络行为数据和网络攻击行为数据;并将网络特征数据集划分为训练集和测试集;
预处理模块,其配置成对所述网络特征数据集进行数据预处理;
特征提取模块,其配置成根据数据项信息熵计算训练集和测试集的信息影响因子,根据训练集和测试集的信息影响因子计算信息影响相似比,以对预处理后的网络特征数据集进行特征筛选,获取筛选后的特征数据集;对预处理后的网络特征数据集进行特征筛选的具体过程包括:
步骤三一、根据每项数据项元素出现的次数,按照下述公式计算每项数据项信息熵:
Figure FDA0004147825050000025
其中,j表示每项数据项元素出现的总类数;n表示每类元素出现的次数;m表示数据集数据总条数;
步骤三二、计算信息影响因子和信息影响相似比:信息影响因子表示数据集中每项数据项对标签项的影响,计算方法是数据集每列数据项信息熵与标签项信息熵的比值;信息影响相似比的计算方法为:测试集每项数据项的信息影响因子与训练集每项数据项的信息影响因子的比值;
步骤三三、对于训练集和测试集,均进行以下两步操作,第一步操作为:将信息影响因子向下取整,作为第一次网格搜索法的阈值取值的集合,计算获得所述集合中所有阈值的平均数,记为av1,使用网格搜索法遍历预处理后的训练集或测试集中每个信息影响因子,选取信息影响因子大于av1的数据项,组合成一个新的数据集,记为训练集一或测试集一;第二步操作为:将信息影响相似比向下取整,作为再次进行网格搜索法的阈值取值的集合,计算获得该集合中所有阈值的平均数,记为av2,使用网格搜索法遍历预处理后的训练集或测试集中每个信息影响相似比,选取信息影响相似比小于av2的数据项,组合成一个新的数据集,记为训练集二或测试集二;
步骤三四、将训练集一和训练集二合并获得筛选后的特征训练集、测试集一和测试集二合并获得筛选后的特征测试集;
模型训练模块,其配置成将筛选后的特征数据集输入到基于深度神经网络的网络入侵检测模型中进行训练,获取训练好的网络入侵检测模型;
检测模块,其配置成将经过预处理后的待检测网络数据输入训练好的网络入侵检测模型中,获取检测结果。
7.根据权利要求6所述的一种基于GS-DNN模型的无线传感器网络入侵检测系统,其特征在于,所述数据获取模块中所述网络特征数据集为UNSW-NB15数据集,去除其原始标签特征Label,将特征数据项attack_cat作为标签。
8.根据权利要求7所述的一种基于GS-DNN模型的无线传感器网络入侵检测系统,其特征在于,所述预处理包括:将非数字型的数据项进行数值化处理;将浮点型数据项转换为整数;对数值化处理后的特征数据项attack_cat进行独热编码。
CN202211291637.1A 2022-10-20 2022-10-20 一种基于gs-dnn模型的无线传感器网络入侵检测方法及系统 Active CN115664775B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211291637.1A CN115664775B (zh) 2022-10-20 2022-10-20 一种基于gs-dnn模型的无线传感器网络入侵检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211291637.1A CN115664775B (zh) 2022-10-20 2022-10-20 一种基于gs-dnn模型的无线传感器网络入侵检测方法及系统

Publications (2)

Publication Number Publication Date
CN115664775A CN115664775A (zh) 2023-01-31
CN115664775B true CN115664775B (zh) 2023-06-09

Family

ID=84989243

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211291637.1A Active CN115664775B (zh) 2022-10-20 2022-10-20 一种基于gs-dnn模型的无线传感器网络入侵检测方法及系统

Country Status (1)

Country Link
CN (1) CN115664775B (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111901330A (zh) * 2020-07-24 2020-11-06 中移(杭州)信息技术有限公司 集成学习模型构建方法、识别方法及装置、服务器和介质
CN111967343B (zh) * 2020-07-27 2023-07-28 广东工业大学 基于简单神经网络和极端梯度提升模型融合的检测方法
CN114358097A (zh) * 2020-09-27 2022-04-15 中国科学院计算机网络信息中心 基于深度神经网络dnn的入侵检测方法、装置及可读存储介质
CN114554491A (zh) * 2022-02-23 2022-05-27 齐齐哈尔大学 基于改进ssae和dnn模型的无线局域网入侵检测方法

Also Published As

Publication number Publication date
CN115664775A (zh) 2023-01-31

Similar Documents

Publication Publication Date Title
CN113269228B (zh) 一种图网络分类模型的训练方法、装置、系统及电子设备
CN113556319B (zh) 物联网下基于长短期记忆自编码分类器的入侵检测方法
CN113420294A (zh) 基于多尺度卷积神经网络的恶意代码检测方法
CN115277189B (zh) 基于生成式对抗网络的无监督式入侵流量检测识别方法
CN115801374A (zh) 网络入侵数据分类方法、装置、电子设备及存储介质
CN116150509A (zh) 社交媒体网络的威胁情报识别方法、系统、设备及介质
Heinrich et al. Fool me Once, shame on You, Fool me Twice, shame on me: a Taxonomy of Attack and de-Fense Patterns for AI Security.
Shao et al. Deep learning hierarchical representation from heterogeneous flow-level communication data
El-Sayed et al. Zero-day malware classification using deep features with support vector machines
CN115664775B (zh) 一种基于gs-dnn模型的无线传感器网络入侵检测方法及系统
CN117176433A (zh) 网络数据的异常行为检测系统及方法
Xin et al. Research on feature selection of intrusion detection based on deep learning
CN116318925A (zh) 一种多cnn融合入侵检测方法、系统、介质、设备及终端
CN116260565A (zh) 芯片电磁侧信道分析方法、系统及存储介质
Ji Malicious Intrusion Data Mining Algorithm of Wireless Personal Communication Network Supported by Legal Big Data
CN115175192A (zh) 一种基于图神经网络的车联网入侵检测方法
CN114554491A (zh) 基于改进ssae和dnn模型的无线局域网入侵检测方法
Chen et al. Adversarial attack detection based on example semantics and model activation features
Zhang et al. A zero-shot intrusion detection method based on regression model
Wu et al. Intrusion Detection System Using a Distributed Ensemble Design Based Convolutional Neural Network in Fog Computing
Kim et al. AEGuard: Image feature-based independent adversarial example detection model
CN114070416A (zh) 基于跨境电子商务的大数据安全管理系统
Kumari et al. Support Vector Machine with Grid Search Cross-Validation for Network Intrusion Detection in Cloud
Shou et al. An intrusion detection method based on attention mechanism to improve CNN-BILSTM model
Zhang et al. An Intelligent Network Intrusion Detector Using Deep Learning Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Lian Zuozheng

Inventor after: Li Mengge

Inventor after: Yang Shuangshuang

Inventor after: Wang Haizhen

Inventor after: Teng Yanping

Inventor after: Li Jingyou

Inventor before: Wang Haizhen

Inventor before: Li Mengge

Inventor before: Yang Shuangshuang

Inventor before: Lian Zuozheng

Inventor before: Teng Yanping

Inventor before: Li Jingyou

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant