CN115174268A - 基于结构化正则项的入侵检测方法 - Google Patents
基于结构化正则项的入侵检测方法 Download PDFInfo
- Publication number
- CN115174268A CN115174268A CN202211075930.4A CN202211075930A CN115174268A CN 115174268 A CN115174268 A CN 115174268A CN 202211075930 A CN202211075930 A CN 202211075930A CN 115174268 A CN115174268 A CN 115174268A
- Authority
- CN
- China
- Prior art keywords
- data
- structured
- regularization
- intrusion detection
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
- H04L63/1416—Event detection, e.g. attack signature detection
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于入侵检测技术领域,具体涉及一种基于结构化正则项的入侵检测方法,包括如下步骤:数据采集:通过数据包采集工具,从数据集中采集数据;数据预处理,即建立似坐标下降优化算法;特征系数选择;模型分类训练:根据选出的具有被选择的系数的特征,来进行模型分类训练;利用训练的模型进行入侵检测。通过本方法来选择重要特征,同时识别网络数据分类问题中高度相关的特征,从而建立模型来进行入侵检测。
Description
技术领域
本发明属于入侵检测技术领域,具体涉及一种基于结构化正则项的入侵检测方法。
背景技术
随着信息科技的迅速发展,人们对互联网的依赖程度与日俱增。与此同时,各种网络攻击事件层出不穷,并且入侵手段愈来愈复杂,网络攻击的影响范围逐渐扩大。防火墙、用户认证和数据加密等传统的安全防御措施保护着计算机网络系统的安全。入侵检测作为一种主动性的动态安全防御手段,是传统安全技术的有力补充。
在网络入侵检测中,网络数据特征维数高、数据量大。这些大量的特征增加了IDS的负荷,从而影响了系统实时检测的性能。此外,特征集合中一些不相关的或者冗余的特征还会导致检测精度下降。如何有效降低入侵检测的计算消耗,提高检测性能,并选取对入侵检测最重要的特征子集来提高检测的精度和效率就成了入侵检测技术所要面对的最直接的问题。
发明内容
为了解决上述技术问题,本发明提供一种基于结构化正则项的入侵检测方法,通过本方法来选择重要特征,同时识别网络数据分类问题中高度相关的特征,从而建立模型来进行入侵检测。
本发明是这样实现的,提供一种基于结构化正则项的入侵检测方法,包括如下步骤:
1)数据采集:通过数据包采集工具,从数据集中采集数据;
2)数据预处理;
3)建立似坐标下降优化算法:
301)建立基于结构化正则项的目标函数;
302)建立似坐标下降优化算法;
4)特征系数选择;
5)模型分类训练:根据步骤4)中选出的具有被选择的系数的特征,来进行模型分类训练;
6)利用步骤5)训练的模型进行入侵检测。
优选的,所述步骤1)中,数据包采集工具为Linux下的tcpdump,或Windows下的libdump,或软件snort捕捉数据包,数据集为KDD Cup 1999 数据集。
进一步优选,所述步骤2)中,数据预处理具体包括:
201)数据清理:对所述步骤1)中采集的数据进行数据清理,数据清理包括填补空缺的数据值、消除噪音数据和纠正不一致数据;
202)对数据进行标准化处理,即对数据的符号属性进行编码,把符号属性转化为数值属性。
进一步优选,所述步骤301)中,建立基于结构化正则化的目标函数包括如下步骤:
3012)当目标函数(1)包含正则化项时,得到的带有正则化模型的逻辑回归表示为:
其中,表示L1正则化项,表示成对结构化惩罚正则化项,表示自适应项,是变量和变量之间的权重,表示X的第i列,表示X的第列,即表示X的第i个和第个特征,、、表示的相关系数函数,和表示特征前的系数,如果一个特征与响应有很强的相关性,那么相应的就会很小,并且对这个特征应用更少的收缩;如果一个特征与响应的相关性很弱,它将受到严重的惩罚;
3014)因此,基于结构化惩罚逻辑回归的目标函数具有以下完整形式:
进一步优选,所述步骤302)中,建立似坐标下降优化算法包括如下步骤:
3021)结构化惩罚线性回归模型定义为:
将等式(4)重写为:
为了优化结构化的惩罚线性回归模型,在算法中重复应用以表达式(7);由于坐标下降方法不能直接优化基于结构化正则化的目标函数(3),对基于结构化惩罚逻辑回归的目标函数(3)的对数似然函数;求解重新加权的最小二乘模型,具体的,使用基于当前估计量的目标函数(3)的二次近似,如下所示:
进一步优选,所述步骤4)参数选择中:
与现有技术相比,本发明的优点在于:
本发明采用基于结构化正则项的入侵检测方法,在网络入侵检测中,为了降低数据维度,选择与响应更密切相关的特征,并减少相关特征的数量,识别数据中的重要结构,从而降低分类算法的计算复杂度,提高学习性能,提高入侵检测的效率。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
本发明提供一种基于结构化正则项的入侵检测方法,包括如下步骤:
1)数据采集:通过数据包采集工具,从数据集中采集数据;
数据包采集工具为Linux下的tcpdump,或Windows下的libdump,或软件snort捕捉数据包,数据集为KDD Cup 1999 数据集。
KDD Cup 1999 数据集为入侵检测领域广泛使用的经典数据集,分成具有标识的训练数据和未加标识的测试数据,总共约有500万条记录,其中攻击数据约占80%。数据集中共有41个特征属性,可分为基本特征、流量特征和内容特征。该数据集中的数据可分为5大类别,其中攻击类别有4类。
2)数据预处理,具体包括:
201)数据清理:由于采集的数据一般都是不完整的和不一致的,因此对所述步骤1)中采集的数据进行数据清理,数据清理包括填补空缺的数据值、消除噪音数据和纠正不一致数据;
202)对数据进行标准化处理,即对数据的符号属性进行编码,把符号属性转化为数值属性。
3)建立似坐标下降优化算法:
301)建立基于结构化正则项的目标函数,包括如下步骤:
3012)在高维环境中,直接优化目标函数(1) 是不合适的,本方法在网络数据中选择少量的信息特征,适用选择正则化方法。当目标函数(1)包含正则化项时,得到的带有正则化模型的逻辑回归表示为:
其中,表示L1正则化项,表示成对结构化惩罚正则化项,表示自适应项,是变量和变量之间的权重,用于衡量每对变量的相似度,表示X的第i列,表示X的第列,即表示X的第i个和第个特征,、、表示的相关系数函数,和表示特征前的系数,相似性权重允许正则化项根据数据中的结构信息来惩罚系数,如果一个特征与响应有很强的相关性,那么相应的就会很小,并且对这个特征应用更少的收缩;如果一个特征与响应的相关性很弱,它将受到严重的惩罚;
3014)因此,基于结构化惩罚逻辑回归的目标函数具有以下完整形式:
302)建立似坐标下降优化算法;
包括如下步骤:
3021)在本发明中,开发了一种似坐标下降算法来优化目标函数(3)。坐标下降算法是一种简单而有效的方法,它每次求解一个参数,同时保持其他参数不变。首先在线性回归设置中引入结构化惩罚模型的坐标下降算法,然后扩展该算法以解决惩罚逻辑回归问题。
结构化惩罚线性回归模型定义为:
将等式(4)重写为:
为了优化结构化的惩罚线性回归模型,在算法中重复应用以表达式(7);由于坐标下降方法不能直接优化基于结构化正则化的目标函数(3),对基于结构化惩罚逻辑回归的目标函数(3)的对数似然函数;求解重新加权的最小二乘模型,具体的,使用基于当前估计量的目标函数(3)的二次近似,如下所示:
具体的,似坐标下降优化算法描述为:
步骤4:
4)特征系数选择;
5)模型分类训练:根据步骤4)中选出的具有被选择的特征系数的特征,来进行模型分类训练;
6)利用步骤5)训练的模型进行入侵检测。
Claims (6)
1.基于结构化正则项的入侵检测方法,其特征在于,包括如下步骤:
1)数据采集:通过数据包采集工具,从数据集中采集数据;
2)数据预处理;
3)建立似坐标下降优化算法:
301)建立基于结构化正则项的目标函数;
302)建立似坐标下降优化算法;
4)特征系数选择;
5)模型分类训练:根据步骤4)中选出的具有被选择的系数的特征,来进行模型分类训练;
6)利用步骤5)训练的模型进行入侵检测。
2.根据权利要求1所述的基于结构化正则项的入侵检测方法,其特征在于,所述步骤1)中,数据包采集工具为Linux下的tcpdump,或Windows下的libdump,或软件snort捕捉数据包,数据集为KDD Cup 1999 数据集。
3.根据权利要求1所述的基于结构化正则项的入侵检测方法,其特征在于,所述步骤2)中,数据预处理具体包括:
201)数据清理:对所述步骤1)中采集的数据进行数据清理,数据清理包括填补空缺的数据值、消除噪音数据和纠正不一致数据;
202)对数据进行标准化处理,即对数据的符号属性进行编码,把符号属性转化为数值属性。
4.根据权利要求1所述的基于结构化正则项的入侵检测方法,其特征在于,所述步骤301)中,建立基于结构化正则化的目标函数包括如下步骤:
3012)当目标函数(1)包含正则化项时,得到的带有正则化模型的逻辑回归表示为:
其中,表示L1正则化项,表示成对结构化惩罚正则化项,表示自适应项,是变量和变量之间的权重,表示X的第i列,表示X的第列,、、表示的相关系数函数,和表示特征前的系数,如果一个特征与响应有很强的相关性,那么相应的就会很小,并且对这个特征应用更少的收缩;如果一个特征与响应的相关性很弱,它将受到严重的惩罚;
3014)因此,基于结构化惩罚逻辑回归的目标函数具有以下完整形式:
5.根据权利要求4所述的基于结构化正则项的入侵检测方法,其特征在于,所述步骤302)中,建立似坐标下降优化算法包括如下步骤:
3021)结构化惩罚线性回归模型定义为:
将等式(4)重写为:
为了优化结构化的惩罚线性回归模型,在算法中重复应用以表达式(7);由于坐标下降方法不能直接优化基于结构化正则化的目标函数(3),对基于结构化惩罚逻辑回归的目标函数(3)的对数似然函数;求解重新加权的最小二乘模型,具体的,使用基于当前估计量的目标函数(3)的二次近似,如下所示:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211075930.4A CN115174268B (zh) | 2022-09-05 | 2022-09-05 | 基于结构化正则项的入侵检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211075930.4A CN115174268B (zh) | 2022-09-05 | 2022-09-05 | 基于结构化正则项的入侵检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115174268A true CN115174268A (zh) | 2022-10-11 |
CN115174268B CN115174268B (zh) | 2022-11-18 |
Family
ID=83480607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211075930.4A Active CN115174268B (zh) | 2022-09-05 | 2022-09-05 | 基于结构化正则项的入侵检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115174268B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115604025A (zh) * | 2022-11-22 | 2023-01-13 | 武汉纺织大学(Cn) | 一种基于pli4da的网络入侵检测方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108566364A (zh) * | 2018-01-15 | 2018-09-21 | 中国人民解放军国防科技大学 | 一种基于神经网络的入侵检测方法 |
CN108712404A (zh) * | 2018-05-04 | 2018-10-26 | 重庆邮电大学 | 一种基于机器学习的物联网入侵检测方法 |
CN109858245A (zh) * | 2019-02-19 | 2019-06-07 | 上海海事大学 | 一种基于改进深度置信网络的入侵检测方法 |
CN110300095A (zh) * | 2019-05-13 | 2019-10-01 | 江苏大学 | 一种基于改进学习率的深度学习网络入侵检测方法 |
US20200064444A1 (en) * | 2015-07-17 | 2020-02-27 | Origin Wireless, Inc. | Method, apparatus, and system for human identification based on human radio biometric information |
CN111740971A (zh) * | 2020-06-15 | 2020-10-02 | 郑州大学 | 基于类不平衡处理的网络入侵检测模型sgm-cnn |
CN112165464A (zh) * | 2020-09-15 | 2021-01-01 | 江南大学 | 一种基于深度学习的工控混合入侵检测方法 |
CN112528277A (zh) * | 2020-12-07 | 2021-03-19 | 昆明理工大学 | 一种基于循环神经网络的混合入侵检测方法 |
CN113572742A (zh) * | 2021-07-02 | 2021-10-29 | 燕山大学 | 基于深度学习的网络入侵检测方法 |
CN113904881A (zh) * | 2021-12-13 | 2022-01-07 | 北京金睛云华科技有限公司 | 一种入侵检测规则误报处理方法和装置 |
CN114726753A (zh) * | 2022-05-24 | 2022-07-08 | 北京金睛云华科技有限公司 | 一种基于多任务学习的网络加密流量识别方法 |
-
2022
- 2022-09-05 CN CN202211075930.4A patent/CN115174268B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200064444A1 (en) * | 2015-07-17 | 2020-02-27 | Origin Wireless, Inc. | Method, apparatus, and system for human identification based on human radio biometric information |
CN108566364A (zh) * | 2018-01-15 | 2018-09-21 | 中国人民解放军国防科技大学 | 一种基于神经网络的入侵检测方法 |
CN108712404A (zh) * | 2018-05-04 | 2018-10-26 | 重庆邮电大学 | 一种基于机器学习的物联网入侵检测方法 |
CN109858245A (zh) * | 2019-02-19 | 2019-06-07 | 上海海事大学 | 一种基于改进深度置信网络的入侵检测方法 |
CN110300095A (zh) * | 2019-05-13 | 2019-10-01 | 江苏大学 | 一种基于改进学习率的深度学习网络入侵检测方法 |
CN111740971A (zh) * | 2020-06-15 | 2020-10-02 | 郑州大学 | 基于类不平衡处理的网络入侵检测模型sgm-cnn |
CN112165464A (zh) * | 2020-09-15 | 2021-01-01 | 江南大学 | 一种基于深度学习的工控混合入侵检测方法 |
CN112528277A (zh) * | 2020-12-07 | 2021-03-19 | 昆明理工大学 | 一种基于循环神经网络的混合入侵检测方法 |
CN113572742A (zh) * | 2021-07-02 | 2021-10-29 | 燕山大学 | 基于深度学习的网络入侵检测方法 |
CN113904881A (zh) * | 2021-12-13 | 2022-01-07 | 北京金睛云华科技有限公司 | 一种入侵检测规则误报处理方法和装置 |
CN114726753A (zh) * | 2022-05-24 | 2022-07-08 | 北京金睛云华科技有限公司 | 一种基于多任务学习的网络加密流量识别方法 |
Non-Patent Citations (1)
Title |
---|
许倩等: "一种半监督联合模型下的异常流量检测算法", 《小型微型计算机系统》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115604025A (zh) * | 2022-11-22 | 2023-01-13 | 武汉纺织大学(Cn) | 一种基于pli4da的网络入侵检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115174268B (zh) | 2022-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110048827B (zh) | 一种基于深度学习卷积神经网络的类模板攻击方法 | |
CN112308158A (zh) | 一种基于部分特征对齐的多源领域自适应模型及方法 | |
CN110175120B (zh) | 一种基于强化学习的模糊测试用例自适应变异方法和装置 | |
CN106951783A (zh) | 一种基于深度神经网络的伪装入侵检测方法及装置 | |
CN112087447B (zh) | 面向稀有攻击的网络入侵检测方法 | |
CN110674865B (zh) | 面向软件缺陷类分布不平衡的规则学习分类器集成方法 | |
CN115174268B (zh) | 基于结构化正则项的入侵检测方法 | |
CN101833667A (zh) | 一种基于分组稀疏表示的模式识别分类方法 | |
CN115037543B (zh) | 一种基于双向时间卷积神经网络的异常网络流量检测方法 | |
CN112884149B (zh) | 一种基于随机敏感度st-sm的深度神经网络剪枝方法及系统 | |
CN112668630A (zh) | 一种基于模型剪枝的轻量化图像分类方法、系统及设备 | |
CN111259264B (zh) | 一种基于生成对抗网络的时序评分预测方法 | |
CN112231469A (zh) | 一种3drte时间知识图谱的三维旋转嵌入方法 | |
CN111598822A (zh) | 一种基于gfrw与iscm的图像融合方法 | |
Choi et al. | Towards machine unlearning benchmarks: Forgetting the personal identities in facial recognition systems | |
Lu et al. | A robust kernel PCA algorithm | |
CN113378620A (zh) | 监控视频噪声环境下跨摄像头行人重识别方法 | |
CN112115359A (zh) | 一种基于多阶近邻预测的推荐系统及方法 | |
CN115438753B (zh) | 一种基于生成的衡量联邦学习协议数据安全性的方法 | |
CN111737688A (zh) | 基于用户画像的攻击防御系统 | |
CN114997378A (zh) | 归纳式图神经网络剪枝方法、系统、设备及存储介质 | |
CN115526293A (zh) | 一种顾及语义和结构信息的知识图谱推理方法 | |
CN112597890A (zh) | 基于多维泰勒网的人脸识别方法 | |
CN113779385A (zh) | 基于复杂网络图嵌入的好友关注度度量排序方法及系统 | |
CN114298164A (zh) | 基于klms算法和趋势滤波的自适应故障预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |