CN114928478A - 基于核心算法、机器学习和云计算的网络安全检测系统 - Google Patents

基于核心算法、机器学习和云计算的网络安全检测系统 Download PDF

Info

Publication number
CN114928478A
CN114928478A CN202210501331.8A CN202210501331A CN114928478A CN 114928478 A CN114928478 A CN 114928478A CN 202210501331 A CN202210501331 A CN 202210501331A CN 114928478 A CN114928478 A CN 114928478A
Authority
CN
China
Prior art keywords
particle
particles
time
population
unclassified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210501331.8A
Other languages
English (en)
Inventor
罗嗣扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202210501331.8A priority Critical patent/CN114928478A/zh
Publication of CN114928478A publication Critical patent/CN114928478A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Abstract

本发明涉及一种网络安全检测系统,尤其为一种基于核心算法、机器学习和云计算的网络安全检测系统,包括入侵检测模块和检测优化模块,所述入侵检测模块用于支持向量机建立入侵检测模型,并通过入侵检测模型对网络安全进行检测,所述检测优化模块通过改进的万有引力搜索算法对网络安全检测模块采用的支持向量机的惩罚因子和核函数参数进行优化,所述万有引力搜索算法中粒子的适应度值越大,该粒子所在位置的解越优。本发明以群体间个体相互作用、相互影响的思想为核心,在一定的搜索空间区域内,通过万有引力搜索算法搜寻一组向量(C,g,ε),使支持向量机的惩罚因子和核函数参数目标(适应度)函数值达到最小,具有参数设置少、结构简单和全局优化能力强等特点。

Description

基于核心算法、机器学习和云计算的网络安全检测系统
技术领域
本发明涉及一种网络安全检测系统,尤其是一种基于核心算法、机器学习和云计算的网络安全检测系统。
背景技术
对国家发展而言,很多的信息都需要通过计算机进行整合,从而对信息进行归类,使得信息管理有一个完善的管理制度,为此,在国家之间的信息方面,很多的信息都是通过计算机技术的传递。使得计算机网络安全是国家近几年重点研究领域,由于数据库注入、蠕虫病毒等不断变化,对传统计算机网络安全设备造成巨大的威胁。因此,需要以支持向量机为基础降低计算机网络流量处理的不确定性以及误报、漏报率。但是,支持向量机学习参数中的惩罚因子C、核函数参数g和不敏感系数ε对其性能有着关键性影响,惩罚因子C过小,样本惩罚减小,训练误差增大;C过大,则学习精度提高,泛化能力变差。核函数参数g越小,拟合误差越小,训练时间延长,但过小的g会导致模型过拟合而降低其泛化能力。
发明内容
本发明的目的是通过提出一种基于核心算法、机器学习和云计算的网络安全检测系统,以解决上述背景技术中提出的缺陷。
本发明采用的技术方案如下:
提供一种基于核心算法、机器学习和云计算的网络安全检测系统,包括入侵检测模块和检测优化模块,所述入侵检测模块用于支持向量机建立入侵检测模型,并通过入侵检测模型对网络安全进行检测,所述检测优化模块通过改进的万有引力搜索算法对网络安全检测模块采用的支持向量机的惩罚因子和核函数参数进行优化,所述万有引力搜索算法中粒子的适应度值越大,该粒子所在位置的解越优。
作为本发明的一种优选技术方案:所述建立入侵检测模型具体包括:
通过支持向量机分解处理计算机网络流量离散时间序列中的低频信息,使得离散时间序列呈现有规律、周期性变化;
用核函数处理时间序列中的高频部分;
对流量分量进行预测,并根据分量预测结果进行重构,得到在空间嵌入维数的计算机网络流量安全态势分析结果。
作为本发明的一种优选技术方案:所述通过入侵检测模型对网络安全进行检测具体包括:
对计算机网络流量进行预处理,并从计算机网络流量中采集、获取原始数据的时间序列;
运用支持向量机分解原理,将带有差异时间序列的计算机网络流量分解成若干个分量;
将计算机网络流量分量进行归一化处理,并按照区间大小对分量进行相应的算法变动;
运用计算机网络设备中安装的自动化监测数据所采集到的样本数据,在嵌入维数之后进行训练,形成测试样本集,然后按照空间维数对输入计算机以及输出计算机的向量进行设置与支持;
针对按照监测数据频数高低进行突变几率的预测,并按照支持向量机线性核函数,对高频监测数据进行处理;使用支持向量机高斯核函数,对低频监测数据进行非线性处理;
训练安全态势预测模型性能,将支持向量机获取到的参数作为预测模型构建依据,然后进行集体学习与集体测试;
实施归一化措施处理计算机网络流量的分量,并使用反归一法对最终预测结果进行支持向量机转换的重构。
作为本发明的一种优选技术方案:所述对计算机网络流量进行预处理具体为:
Figure BDA0003635555940000021
Figure BDA0003635555940000022
其中,n为最优嵌入维,r为信息获取延时;meany(j)为输入向量Y第j列的算术平均值,stdy(j)为输入向量第列的标准方差,meanx为输入向量x的算术平均值;stdx为输入向量x的标准方差。
作为本发明的一种优选技术方案:所述万有引力搜索算法包括:
初始化各个参数和种群位置;
S1:计算适应度值;
S2:计算粒子的惯性质量、每个粒子的在每个方向的引力、加速度;
S3:更新每个粒子的位置及适应度值和全局最优值;
S4:达到终止条件后结束,输出最优解,否则就返回S3进入下一轮迭代。
作为本发明的一种优选技术方案:所述支持向量机具体为:
Figure BDA0003635555940000023
其中,K(xi,x)=Φ(xi)Φ(x),其中,Φ(xi)Φ(x)为满足Mercer条件的核函数,ai
Figure BDA0003635555940000024
为二次规划中Lagrange乘子,含有l个训练样本的集合为:{(xi,yi),i=1,2…,l},b为常数。
作为本发明的一种优选技术方案:所述核函数Φ(xi)Φ(x)具体为:
K(xi,x)=exp(-g||x-xi||2)
其中,g>0。
作为本发明的一种优选技术方案:所述通过改进的万有引力搜索算法对网络安全检测模块采用的支持向量机的惩罚因子和核函数参数进行优化具体为:
Figure BDA0003635555940000031
其中,yi为第i个样本的实测值,
Figure BDA0003635555940000034
为第i个样本的模拟值。
作为本发明的一种优选技术方案:所述从计算机网络流量中采集、获取原始数据的时间序列包括:
设计算机流量传输为每秒t字节,通过第一个原始数据的簇数在第n秒传输完成的时间作为时间序列的起始点,依次计算下一个时间序列。
作为本发明的一种优选技术方案:所述从计算机网络流量中采集、获取原始数据的时间序列具体为:
Figure BDA0003635555940000032
其中,
Figure BDA0003635555940000033
为第h个时间序列,dn第n秒内传输的字节数,dmin为前面h-1个时间序列传输的最小字节数,Th为第h个时间序列中传输的总簇数。
本发明提供的基于核心算法、机器学习和云计算的网络安全检测系统:
1、本发明引入支持向量机对计算机网络流量进行设定、监测数据的去噪、分解以及支持向量机建模等步骤,可有效提高计算机网络安全态势预测精准度。通过对计算机网络安全态势预测模型的分析后,证明该模型可有效应对大量因素的干扰,极大地提升数据加密、备份、恢复等步骤的安全性,从而满足人们使用计算机网络的要求。
2、本发明通过万有引力搜索算法对网络安全检测模块采用的支持向量机的惩罚因子和核函数参数进行优化,由于支持向量机学习参数中的惩罚因子C、核函数参数g和不敏感系数ε对其性能有着关键性影响,惩罚因子C过小,样本惩罚减小,训练误差增大;C过大,则学习精度提高,泛化能力变差。核函数参数g越小,拟合误差越小,训练时间延长,但过小的g会导致模型过拟合而降低其泛化能力。本发明以群体间个体相互作用、相互影响的思想为核心,在一定的搜索空间区域内,通过万有引力搜索算法搜寻一组向量(C,g,ε),使支持向量机的惩罚因子和核函数参数目标(适应度)函数值达到最小,具有参数设置少、结构简单和全局优化能力强等特点。
3、本优选实施例针对原始GSA算法存在的搜索精度较低以及易陷入局部极值的缺陷,对原始GSA算法进行了改进,在GSA算法的每次迭代更新时,当种群中粒子所在的位置较优或者其距离待更新粒子越近时,其对待更新粒子具有较大的引力值,这些引力值较大的粒子直接影响着待更新粒子的寻优方向,因此,在种群中选取对待更新粒子具有较大引力值的粒子,并对这些引力较大的粒子进行聚类,在计算待更新粒子受到的合力时,当粒子对待更新粒子的引力值较小时,仍采用传统的合力计算方式,从而保持万有引力搜索算法的全局勘探能力,当粒子对待更新粒子的引力值较大时,引入类调节系数调节该引力值在合力中的权值,当所述引力较大的粒子所处的类中拥有较多的粒子时,则减小该粒子的引力值在合力中的权值,从而增加所述合力吸引待更新粒子向着拥有较少粒子的较优区域或最优解区域进行寻优的概率,使得种群中粒子对搜索空间的较优区域搜索的较为均匀,增加种群的局部开发能力,进而提高改进后的GSA算法的寻优精度,并且避免算法陷入局部极值,使得算法收敛到最优解。即本实施例改进后的GSA算法相较于原始GSA算法具有较高的寻优精度,使得采用改进后的GSA算法对支持向量机参数进行寻优时,能够获得支持向量机的最优参数,从而提高建立的入侵检测模型的准确度。
附图说明
图1为本发明优选实施例的整体系统框图;
图2为本发明优选实施例中整体系统建模流程图。
图中:100、入侵检测模块;200、检测优化模块。
具体实施方式
需要说明的是,在不冲突的情况下,本实施例中的实施例及实施例中的特征可以相互组合,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1-2,本发明优选实施例提供了一种基于核心算法、机器学习和云计算的网络安全检测系统,包括入侵检测模块100和检测优化模块200,所述入侵检测模块100用于支持向量机建立入侵检测模型,并通过入侵检测模型对网络安全进行检测,所述检测优化模块200通过改进的万有引力搜索算法对网络安全检测模块采用的支持向量机的惩罚因子和核函数参数进行优化,所述万有引力搜索算法中粒子的适应度值越大,该粒子所在位置的解越优。
支持向量机经过训练后可以形成有关计算机网络流量的解决小样本,在高模式识别方面具有特殊的优势。一方面,支持向量机采用核函数方法,实现空间从低维到高维的转变,另一方面,将特征空间分割为最优的超平面,从而得到最佳学习期。在升维过程中,为降低维数灾难发生率,一般采用核函数,分别为线性核函数、RBF径向基。在利用支持向量机对训练集以及测试集进行去噪以及归一化处理的过程中,在提取数据特征并进行预处理之后,再进行算法的参数初始化,并利用径向基核函数合理筛选惩罚因子的大小,再利用向量机算法对数据分类,以此获得具有较高准确率的分类结果,保障计算机网络安全态势分析的精准性,以此提高支持向量机计算机网络安全态势预测模型应用性能。
还包括监测数据的去噪以及分解,一般采用的是计算机网络设备中安装的自动装置监测到的数据,从而降低噪声对预测模型精准性的影响。在此过程中应用的仍为支持向量机工作原理,分解带有阈值的原始数据,然后利用变换处理分解原始数据出现的噪声信息。首先,对监测数据噪声经历多尺度变换,为得到不同尺度的变换信号做好铺垫工作。其次,保留除去噪声信息的真实值,确保分析数据的真实性,然后使用逆变换处理监测数据真实值的各层分解信号,最终打造降噪目标。最后,运用支持向量机,根据嵌入重构空间维数,对真实信号部分进行增强处理,然后达到吸收引子维数的目的,从而实现低维空间监测数据向高维空间的扩展,为计算机安全态势预测模式的建立奠定良好的数据基础。
最大化结构安全原则为运用支持向量机建立计算机网络安全态势预测模型的主要学习方法,在克服计算机网络混沌性与不确定性时,可有效分析安全态势的走向。具体的,建立入侵检测模型具体包括:
通过支持向量机分解处理计算机网络流量离散时间序列中的低频信息,使得离散时间序列呈现有规律、周期性变化;
用核函数处理时间序列中的高频部分;
对流量分量进行预测,并根据分量预测结果进行重构,得到在空间嵌入维数的计算机网络流量安全态势分析结果。
通过入侵检测模型对网络安全进行检测具体包括:
对计算机网络流量进行预处理,并从计算机网络流量中采集、获取原始数据的时间序列;
运用支持向量机分解原理,将带有差异时间序列的计算机网络流量分解成若干个分量;
将计算机网络流量分量进行归一化处理,并按照区间大小对分量进行相应的算法变动;
运用计算机网络设备中安装的自动化监测数据所采集到的样本数据,在嵌入维数之后进行训练,形成测试样本集,然后按照空间维数对输入计算机以及输出计算机的向量进行设置与支持;
针对按照监测数据频数高低进行突变几率的预测,并按照支持向量机线性核函数,对高频监测数据进行处理;使用支持向量机高斯核函数,对低频监测数据进行非线性处理;
训练安全态势预测模型性能,将支持向量机获取到的参数作为预测模型构建依据,然后进行集体学习与集体测试;
实施归一化措施处理计算机网络流量的分量,并使用反归一法对最终预测结果进行支持向量机转换的重构。
由于计算机网络流量具有非线性、混沌性等特点,在运用支持向量机建立安全态势预测模型之前,需要对实时相空间进行重构处理,并运用虚假最近邻点方法模拟出计算机网络流量的变动轨迹,从而获得重构流量集。其中,对计算机网络流量进行预处理具体为:
Figure BDA0003635555940000061
Figure BDA0003635555940000062
其中,n为最优嵌入维,r为信息获取延时;meany(j)为输入向量Y第j列的算术平均值,stdy(j)为输入向量第列的标准方差,meanx为输入向量x的算术平均值;stdx为输入向量x的标准方差。
作为优选,万有引力搜索算法包括:
初始化各个参数和种群位置;
S1:计算适应度值;
S2:计算粒子的惯性质量、每个粒子的在每个方向的引力、加速度;
S3:更新每个粒子的位置及适应度值和全局最优值;
S4:达到终止条件后结束,输出最优解,否则就返回S3进入下一轮迭代。
但是,万有引力搜索算法通过个体间的万有引力相互作用实现优化信息的共享,引导群体向最优解区域搜索,具有较好的全局搜索能力,但局部搜索能力较弱,易陷入局部极值。由于支持向量机学习参数中的惩罚因子C、核函数参数g和不敏感系数ε对其性能有着关键性影响,惩罚因子C过小,样本惩罚减小,训练误差增大;C过大,则学习精度提高,泛化能力变差。核函数参数g越小,拟合误差越小,训练时间延长,但过小的g会导致模型过拟合而降低其泛化能力。因此,本实施例在一定的搜索空间区域内,通过万有引力搜索算法搜寻一组向量(C,g,ε),使支持向量机的惩罚因子和核函数参数目标(适应度)函数值达到最小。
支持向量机具体为:
Figure BDA0003635555940000071
其中,K(xi,x)=Φ(xi)Φ(x),其中,Φ(xi)Φ(x)为满足Mercer条件的核函数,ai
Figure BDA0003635555940000072
为二次规划中Lagrange乘子,含有l个训练样本的集合为:{(xi,yi),i=1,2…,l},b为常数。
核函数Φ(xi)Φ(x)具体为:
K(xi,x)=exp(-g||x-xi||2)
其中,g>0。
通过改进的万有引力搜索算法对网络安全检测模块采用的支持向量机的惩罚因子和核函数参数进行优化具体为:
Figure BDA0003635555940000073
其中,yi为第i个样本的实测值,
Figure BDA0003635555940000074
为第i个样本的模拟值。
从计算机网络流量中采集、获取原始数据的时间序列包括:
设计算机流量传输为每秒t字节,通过第一个原始数据的簇数在第n秒传输完成的时间作为时间序列的起始点,依次计算下一个时间序列。
从计算机网络流量中采集、获取原始数据的时间序列具体为:
Figure BDA0003635555940000075
其中,
Figure BDA0003635555940000076
为第h个时间序列,dn第n秒内传输的字节数,dmin为前面h-1个时间序列传输的最小字节数,Th为第h个时间序列中传输的总簇数。通过从计算机网络流量中采集、获取原始数据的时间序列,并且以每个时间序列中传输的总簇数来实时改变时间序列的长度,这样可保证时间序列内的数据完整性。
作为另一种优选,选用径向基核函数(RBF)作为网络安全检测模块采用的支持向量机的核函数。
优选的,在原始GSA算法中,每个粒子通过同时向种群中其他所有的粒子进行学习来实现下一时刻的更新,上述更新方式使得原始GSA算法存在下述特性:
(1)该种全局学习机制使得GSA算法具有较强的全局勘探能力的同时,也使得GSA算法的局部开发能力不足,从而使得原始GSA算法的寻优精度较低;
(2)在每次迭代更新时,因为每个粒子所受的合力都是种群中所有其他粒子对其施加的引力和,并朝着合力的方向移动,理想状态下,该合力将带领待更新粒子向着最优解区域移动,然而当种群中粒子分布不均匀时,当一个粒子所处区域并非最优解区域,但该粒子所处区域分布较多粒子,而因为待更新粒子所受的合力为种群中所有其他粒子对其施加的引力和,因此就算该粒子所处区域并非最优解区域,但因该区域分布较多粒子,这些粒子对待更新粒子的引力相加后在合力中所占的比重也将较大,从而影响种群向最优解区域收敛,因此,当种群中粒子分布不均匀时,采用传统方式计算所得的合力将带领种群中粒子向着粒子分布密集的区域移动,加剧种群对搜索空间寻优的不均匀性,进一步减少了种群中粒子的多样性,容易使得算法收敛到次优解,从而陷入局部极值。针对上述缺陷,本实施例利用改进的万有引力搜索算法对网络安全检测模块采用的支持向量机的惩罚因子和核函数参数进行优化,并基于所述支持向量机建立入侵检测模型,设置所述万有引力搜索算法中粒子的适应度值越大,该粒子所在的位置的解越优。
优选的,在改进的万有引力搜索算法中,设在一个D维搜索空间中包含N个粒子,则种群中粒子i在t时刻的位置和速度为:
Figure BDA0003635555940000081
Figure BDA0003635555940000082
其中,i=1,2,...,N,N为种群中的粒子数,Xi(t)和Vi(t)为种群中粒子i在t时刻的位置和速度,
Figure BDA0003635555940000083
Figure BDA0003635555940000084
是t时刻种群中粒子i在第1维度空间的位置和速度,
Figure BDA0003635555940000085
Figure BDA0003635555940000086
是t时刻种群中粒子i在第2维度空间的位置和速度,
Figure BDA0003635555940000087
Figure BDA0003635555940000088
是t时刻种群中粒子i在第D维度空间的位置和速度;
在改进的万有引力搜索算法中,设置粒子i通过下列步骤实现(t+1)时刻的更新:
步骤(1):根据t时刻种群中其他粒子对粒子i的引力对种群中粒子进行预处理;
步骤(2):令粒子i通过向种群中其他(N-1)个粒子进行学习,从而实现(t+1)时刻的更新。
优选的,采用下列方式根据t时刻种群中其他粒子对粒子i的引力对种群中的粒子进行预处理:
定义fij(t)为t时刻种群中粒子j对粒子i的引力数值,且fij(t)的值为:
Figure BDA0003635555940000091
其中,Mi(t)和Mj(t)分别表示种群中粒子i和粒子j在t时刻的质量,G(t)是t时刻的万有引力常数,ε是一个大于0的常数,用于保证分母不为0,Rij(t)是t时刻种群中粒子i和粒子j之间的欧式距离;设Ki(t)为t时刻在种群中选取的用于指导粒子i进行(t+1)时刻更新的主要粒子集合,且
Figure BDA0003635555940000092
Pi(t)为t时刻在种群中选取的用于指导粒子i进行(t+1)时刻更新的普通粒子集合,且
Figure BDA0003635555940000093
其中,fiu(t)表示t时刻种群中粒子u对粒子i的引力数值,fil(t)为t时刻种群中粒子l对粒子i的引力数值,
Figure BDA0003635555940000094
为t时刻种群中其他(N-1)个粒子对粒子i的引力数值的均值,则
Figure BDA0003635555940000095
N表示种群中的粒子数;
采用迭代聚类的方式对主要粒子集合Ki(t)中的粒子进行分类:设Ci,r(t)为对集合Ki(t)中粒子进行第r次迭代聚类所得的类,则类Ci,r(t)中的粒子采用下列方式在集合Ki(t)中选取:
确定类Ci,r(t)的类度量阈值:在集合Ki(t)当前的未分类粒子中选取距离位置Xi(t)最近的粒子作为类Ci,r(t)的类度量粒子,令k′、o′表示集合Ki(t)中的未分类粒子,且
Figure BDA0003635555940000096
Figure BDA0003635555940000097
Xo′(t)为集合Ki(t)中的未分类粒子o′在t时刻的位置,Xi(t)为种群中粒子i在t时刻的位置,未分类粒子k′即为集合Ki(t)当前的未分类粒子中距离位置Xi(t)最近的粒子,将未分类粒子k′加入类Ci,r(t)中,并根据未分类粒子k′确定类Ci,r(t)的类度量阈值Hi,r,k′(t),则Hi,r,k′(t)=yk′(t)*(1-θk′(t)),其中,yk′(t)为t时刻未分类粒子k′在种群中的邻域系数值,且
Figure BDA0003635555940000098
θk′(t)为t时刻未分类粒子k′在种群中的邻域统一系数,且
Figure BDA0003635555940000099
Xk′(t)为集合Ki(t)中的未分类粒子k′在t时刻的位置,Xk′,o(t)为t时刻种群中距离位置Xk′(t)第o近的粒子的位置,yk′,o(t)为t时刻种群中距离位置Xk′(t)第o近的粒子的邻域系数值,c为给定的正整数,c的值可以取5;
根据确定的类度量阈值Hi,r,k′(t)继续在集合Ki(t)当前的未分类粒子中选取粒子加入类Ci,r(t)中,具体为:
分别在集合Ki(t)当前的未分类粒子中和类Ci,r(t)当前的粒子中选取距离最近的两个粒子进行检测,具体的:设Xe′(t)为集合Ki(t)中的未分类粒子e′在t时刻的位置,Xs(t)为类Ci,r(t)中的粒子s在t时刻的位置,Xa′(t)为集合Ki(t)中的未分类粒子a′在t时刻的位置,Xb(t)为类Ci,r(t)中的粒子b在t时刻的位置,当未分类粒子e′和粒子s满足:
Figure BDA0003635555940000101
即未分类粒子e′和粒子s分别为集合Ki(t)当前的未分类粒子中和类Ci,r(t)当前的粒子中距离最近的两个粒子,则对未分类粒子e′和粒子s进行检测,检测方式为:
(1)当未分类粒子e′和粒子s满足:|Xe′(t)-Xs(t)|>Hi,r,k′(t)时,则停止在集合Ki(t)当前的未分类粒子中选取粒子加入类Ci,r(t)中,并对集合Ki(t)当前的未分类粒子进行下一次的迭代聚类;
(2)当未分类粒子e′和粒子s满足:|Xe′(t)-Xs(t)|≤Hi,r,k′(t)时,则将未分类粒子e′加入类Ci,r(t)中,当此时集合Ki(t)中的未分类粒子的个数为0时,则停止对集合Ki(t)中的未分类粒子进行迭代聚类,当此时集合Ki(t)中的未分类粒子的个数不为0时,则继续按照上述方式根据确定的类度量阈值Hi,r,k′(t)继续在集合Ki(t)当前的未分类粒子中选取粒子加入类Ci,r(t)中。
优选的,令粒子i通过向种群中其他(N-1)个粒子进行学习,从而实现(t+1)时刻的更新,具体为:
在第d维度空间中,t时刻粒子i受到的引力为种群中其他(N-1)个粒子对其产生的引力的合力,具体的:定文
Figure BDA0003635555940000102
为t时刻粒子i在第d维度空间受到的引力的合力,则
Figure BDA0003635555940000103
的计算公式为:
Figure BDA0003635555940000104
在上述
Figure BDA0003635555940000111
的计算公式中,
Figure BDA0003635555940000112
为t时刻种群中粒子j在第d维度空间对粒子i所产生的引力,根据万有引力定律的公式计算
Figure BDA0003635555940000113
的值为:
Figure BDA0003635555940000114
其中,Mi(t)和Mj(t)分别表示种群中粒子i和粒子j在t时刻的质量,G(t)是t时刻的万有引力常数,ε是一个大于0的常数,用于保证分母不为0,Rij(t)是t时刻种群中粒子i和粒子j之间的欧式距离,
Figure BDA0003635555940000115
为t时刻种群中粒子i在第d维度空间的位置,
Figure BDA0003635555940000116
为t时刻种群中粒子j在第d维度空间的位置;
在上述
Figure BDA0003635555940000117
的计算公式中,
Figure BDA0003635555940000118
为定义的t时刻种群中粒子j在第d维度空间对粒子i所产生的引力在合力中所占的权值,设置
Figure BDA0003635555940000119
的值采用下列方式确定:
当种群中粒子j在t时刻为集合Pi(t)中的粒子时,则令
Figure BDA00036355559400001110
为一个[0,1]内的随机数;
当种群中粒子j在t时刻为集合Ki(t)中的粒子时,则令
Figure BDA00036355559400001111
为一个
Figure BDA00036355559400001112
内的随机数,其中,
Figure BDA00036355559400001113
为t时刻粒子j在集合Ki(t)中的类调节系数,且
Figure BDA00036355559400001114
设Ci,J(t)为对集合Ki(t)中粒子进行第J次迭代聚类所得的类,且j在t时刻为类Ci,J(t)中的粒子,即j∈Ci,J(t),Ni,J(t)表示类Ci,J(t)中的粒子数,Ni(t)表示集合Ki(t)中的粒子数,
Figure BDA00036355559400001115
表示对集合Ki(t)中粒子进行迭代聚类所得的类中粒子数的分割值,且
Figure BDA00036355559400001116
其中,
Figure BDA00036355559400001117
表示对集合Ki(t)中粒子进行迭代聚类所得的类中粒子数的均值,且
Figure BDA00036355559400001118
σi(t)表示对集合Ki(t)中粒子进行迭代聚类所得的类中粒子数的均方差,且
Figure BDA00036355559400001119
其中,设Ci,r(t)为对集合Ki(t)中粒子进行第r次迭代聚类所得的类,Ni,r(t)表示类Ci,r(t)中的粒子数,R为对集合Ki(t)中粒子进行迭代聚类所得的类的总个数;
则t时刻粒子i在第d维度空间通过向种群中其他(N-1)个粒子学习获得的(t+1)时刻的位置为:
Figure BDA0003635555940000121
Figure BDA0003635555940000122
在上式中,
Figure BDA0003635555940000123
Figure BDA0003635555940000124
为(t+1)时刻种群中粒子i在第d维度空间的位置和速度,
Figure BDA0003635555940000125
Figure BDA0003635555940000126
为t时刻粒子i在第d维度空间的位置和速度,randi是一个[0,1]内的随机数,
Figure BDA0003635555940000127
为根据牛顿第二定律计算所得的t时刻粒子i在第d维度空间的加速度,且
Figure BDA0003635555940000128
其中,Mii(t)为粒子i在t时刻的惯性质量。
本实施例针对原始GSA算法存在的搜索精度较低以及易陷入局部极值的缺陷,对原始GSA算法进行了改进,在GSA算法的每次迭代更新时,当种群中粒子所在的位置较优或者其距离待更新粒子越近时,其对待更新粒子具有较大的引力值,这些引力值较大的粒子直接影响着待更新粒子的寻优方向,因此,在种群中选取对待更新粒子具有较大引力值的粒子,并对这些引力较大的粒子进行聚类,在计算待更新粒子受到的合力时,当粒子对待更新粒子的引力值较小时,仍采用传统的合力计算方式,从而保持万有引力搜索算法的全局勘探能力,当粒子对待更新粒子的引力值较大时,引入类调节系数调节该引力值在合力中的权值,当所述引力较大的粒子所处的类中拥有较多的粒子时,则减小该粒子的引力值在合力中的权值,从而增加所述合力吸引待更新粒子向着拥有较少粒子的较优区域或最优解区域进行寻优的概率,使得种群中粒子对搜索空间的较优区域搜索的较为均匀,增加种群的局部开发能力,进而提高改进后的GSA算法的寻优精度,并且避免算法陷入局部极值,使得算法收敛到最优解。即本实施例改进后的GSA算法相较于原始GSA算法具有较高的寻优精度,使得采用改进后的GSA算法对支持向量机参数进行寻优时,能够获得支持向量机的最优参数,从而提高建立的入侵检测模型的准确度。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (10)

1.一种基于核心算法、机器学习和云计算的网络安全检测系统,其特征在于:包括入侵检测模块(100)和检测优化模块(200),所述入侵检测模块(100)用于支持向量机建立入侵检测模型,并通过入侵检测模型对网络安全进行检测,所述检测优化模块(200)通过改进的万有引力搜索算法对网络安全检测模块采用的支持向量机的惩罚因子和核函数参数进行优化,所述万有引力搜索算法中粒子的适应度值越大,该粒子所在位置的解越优。
2.根据权利要求1所述的基于核心算法、机器学习和云计算的网络安全检测系统,其特征在于:所述建立入侵检测模型具体包括:
通过支持向量机分解处理计算机网络流量离散时间序列中的低频信息,使得离散时间序列呈现有规律、周期性变化;
用核函数处理时间序列中的高频部分;
对流量分量进行预测,并根据分量预测结果进行重构,得到在空间嵌入维数的计算机网络流量安全态势分析结果。
3.根据权利要求2所述的基于核心算法、机器学习和云计算的网络安全检测系统,其特征在于:所述通过入侵检测模型对网络安全进行检测具体包括:
对计算机网络流量进行预处理,并从计算机网络流量中采集、获取原始数据的时间序列;
运用支持向量机分解原理,将带有差异时间序列的计算机网络流量分解成若干个分量;
将计算机网络流量分量进行归一化处理,并按照区间大小对分量进行相应的算法变动;
运用计算机网络设备中安装的自动化监测数据所采集到的样本数据,在嵌入维数之后进行训练,形成测试样本集,然后按照空间维数对输入计算机以及输出计算机的向量进行设置与支持;
针对按照监测数据频数高低进行突变几率的预测,并按照支持向量机线性核函数,对高频监测数据进行处理;使用支持向量机高斯核函数,对低频监测数据进行非线性处理;
训练安全态势预测模型性能,将支持向量机获取到的参数作为预测模型构建依据,然后进行集体学习与集体测试;
实施归一化措施处理计算机网络流量的分量,并使用反归一法对最终预测结果进行支持向量机转换的重构。
4.根据权利要求3所述的基于核心算法、机器学习和云计算的网络安全检测系统,其特征在于:所述对计算机网络流量进行预处理具体为:
Figure FDA0003635555930000021
Figure FDA0003635555930000022
其中,n为最优嵌入维,r为信息获取延时;meany(j)为输入向量Y第j列的算术平均值,stdy(j)为输入向量第列的标准方差,meanx为输入向量x的算术平均值;stdx为输入向量x的标准方差。
5.根据权利要求1所述的基于核心算法、机器学习和云计算的网络安全检测系统,其特征在于:所述万有引力搜索算法包括:
初始化各个参数和种群位置;
S1:计算适应度值;
S2:计算粒子的惯性质量、每个粒子的在每个方向的引力、加速度;
S3:更新每个粒子的位置及适应度值和全局最优值;
S4:达到终止条件后结束,输出最优解,否则就返回S3进入下一轮迭代。
6.根据权利要求1所述的基于核心算法、机器学习和云计算的网络安全检测系统,其特征在于:所述支持向量机具体为:
Figure FDA0003635555930000023
其中,K(xi,x)=Φ(xi)Φ(x),其中,Φ(xi)Φ(x)为满足Mercer条件的核函数,ai
Figure FDA0003635555930000024
为二次规划中Lagrange乘子,含有l个训练样本的集合为:{(xi,yi),i=1,2…,l},b为常数。
7.根据权利要求6所述的基于核心算法、机器学习和云计算的网络安全检测系统,其特征在于:所述核函数Φ(xi)Φ(x)具体为:
K(xi,x)=exp(-g‖x-xi2)
其中,g>0。
8.根据权利要求1所述的基于核心算法、机器学习和云计算的网络安全检测系统,其特征在于:所述通过改进的万有引力搜索算法对网络安全检测模块采用的支持向量机的惩罚因子和核函数参数进行优化具体为:
Figure FDA0003635555930000025
其中,yi为第i个样本的实测值,
Figure FDA0003635555930000031
为第i个样本的模拟值。
9.根据权利要求1所述的基于核心算法、机器学习和云计算的网络安全检测系统,其特征在于:利用改进的万有引力搜索算法对网络安全检测模块采用的支持向量机的惩罚因子和核函数参数进行优化,并基于所述支持向量机建立入侵检测模型,设置所述万有引力搜索算法中粒子的适应度值越大,该粒子所在位置的解越优;在改进的万有引力搜索算法中,设在一个D维搜索空间中包含N个粒子,则种群中粒子i在t时刻的位置和速度为:
Figure FDA0003635555930000032
Figure FDA0003635555930000033
其中,i=1,2,…,N,N为种群中的粒子数,Xi(t)和Vi(t)为种群中粒子i在t时刻的位置和速度,
Figure FDA0003635555930000034
Figure FDA0003635555930000035
是t时刻种群中粒子i在第1维度空间的位置和速度,
Figure FDA0003635555930000036
Figure FDA0003635555930000037
是t时刻种群中粒子i在第2维度空间的位置和速度,
Figure FDA0003635555930000038
Figure FDA0003635555930000039
是t时刻种群中粒子i在第D维度空间的位置和速度;
在改进的万有引力搜索算法中,设置粒子i通过下列步骤实现(t+1)时刻的更新:
步骤(1):根据t时刻种群中其他粒子对粒子i的引力对种群中粒子进行预处理;
步骤(2):令粒子i通过向种群中其他(N-1)个粒子进行学习,从而实现(t+1)时刻的更新;
采用下列方式根据t时刻种群中其他粒子对粒子i的引力对种群中的粒子进行预处理:
定义fij(t)为t时刻种群中粒子j对粒子i的引力数值,且fij(t)的值为:
Figure FDA00036355559300000310
其中,Mi(t)和Mj(t)分别表示种群中粒子i和粒子j在t时刻的质量,G(t)是t时刻的万有引力常数,ε是一个大于0的常数,用于保证分母不为0,Rij(t)是t时刻种群中粒子i和粒子j之间的欧式距离;设Ki(t)为t时刻在种群中选取的用于指导粒子i进行(t+1)时刻更新的主要粒子集合,且
Figure FDA00036355559300000311
Pi(t)为t时刻在种群中选取的用于指导粒子i进行(t+1)时刻更新的普通粒子集合,且
Figure FDA00036355559300000312
其中,fiu(t)表示t时刻种群中粒子u对粒子i的引力数值,fil(t)为t时刻种群中粒子l对粒子i的引力数值,
Figure FDA00036355559300000313
为t时刻种群中其他(N-1)个粒子对粒子i的引力数值的均值,则
Figure FDA00036355559300000314
N表示种群中的粒子数;
采用迭代聚类的方式对主要粒子集合Ki(t)中的粒子进行分类:设Ci,r(t)为对集合Ki(t)中粒子进行第r次迭代聚类所得的类,则类Ci,r(t)中的粒子采用下列方式在集合Ki(t)中选取:
确定类Ci,r(t)的类度量阈值:在集合Ki(t)当前的未分类粒子中选取距离位置Xi(t)最近的粒子作为类Ci,r(t)的类度量粒子,令k′、o′表示集合Ki(t)中的未分类粒子,且
Figure FDA0003635555930000041
Figure FDA0003635555930000042
Xo′(t)为集合Ki(t)中的未分类粒子o′在t时刻的位置,Xi(t)为种群中粒子i在t时刻的位置,未分类粒子k′即为集合Ki(t)当前的未分类粒子中距离位置Xi(t)最近的粒子,将未分类粒子k′加入类Ci,r(t)中,并根据未分类粒子k′确定类Ci,r(t)的类度量阈值Hi,r,k′(t),则Hi,r,k′(t)=yk′(t)*(1-θk′(t)),其中,yk′(t)为t时刻未分类粒子k′在种群中的邻域系数值,且
Figure FDA0003635555930000043
θk′(t)为t时刻未分类粒子k′在种群中的邻域统一系数,且
Figure FDA0003635555930000044
Xk′(t)为集合Ki(t)中的未分类粒子k′在t时刻的位置,Xk′,o(t)为t时刻种群中距离位置Xk′(t)第o近的粒子的位置,yk′,o(t)为t时刻种群中距离位置Xk′(t)第o近的粒子的邻域系数值,c为给定的正整数;
根据确定的类度量阈值Hi,r,k′(t)继续在集合Ki(t)当前的未分类粒子中选取粒子加入类Ci,r(t)中,具体为:
分别在集合Ki(t)当前的未分类粒子中和类Ci,r(t)当前的粒子中选取距离最近的两个粒子进行检测,具体的:设Xe′(t)为集合Ki(t)中的未分类粒子e′在t时刻的位置,Xs(t)为类Ci,r(t)中的粒子s在t时刻的位置,Xa′(t)为集合Ki(t)中的未分类粒子a′在t时刻的位置,Xb(t)为类Ci,r(t)中的粒子b在t时刻的位置,当未分类粒子e′和粒子s满足:
Figure FDA0003635555930000045
即未分类粒子e′和粒子s分别为集合Ki(t)当前的未分类粒子中和类Ci,r(t)当前的粒子中距离最近的两个粒子,则对未分类粒子e′和粒子s进行检测,检测方式为:
(1)当未分类粒子e′和粒子s满足:|Xe′(t)-Xs(t)|>Hi,r,k′(t)时,则停止在集合Ki(t)当前的未分类粒子中选取粒子加入类Ci,r(t)中,并对集合Ki(t)当前的未分类粒子进行下一次的迭代聚类;
(2)当未分类粒子e′和粒子s满足:|Xe′(t)-Xs(t)|≤Hi,r,k′(t)时,则将未分类粒子e′加入类Ci,r(t)中,当此时集合Ki(t)中的未分类粒子的个数为0时,则停止对集合Ki(t)中的未分类粒子进行迭代聚类,当此时集合Ki(t)中的未分类粒子的个数不为0时,则按照上述方式根据确定的类度量阈值Hi,r,k′(t)继续在集合Ki(t)当前的未分类粒子中选取粒子加入类Ci,r(t)中。
10.根据权利要求1所述的基于核心算法、机器学习和云计算的网络安全检测系统,其特征在于:所述从计算机网络流量中采集、获取原始数据的时间序列包括:
设计算机流量传输为每秒t字节,通过第一个原始数据的簇数在第n秒传输完成的时间作为时间序列的起始点,依次计算下一个时间序列;所述从计算机网络流量中采集、获取原始数据的时间序列具体为:
Figure FDA0003635555930000051
其中,
Figure FDA0003635555930000052
为第h个时间序列,dn第n秒内传输的字节数,dmin为前面h-1个时间序列传输的最小字节数,Th为第h个时间序列中传输的总簇数。
CN202210501331.8A 2022-05-10 2022-05-10 基于核心算法、机器学习和云计算的网络安全检测系统 Pending CN114928478A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210501331.8A CN114928478A (zh) 2022-05-10 2022-05-10 基于核心算法、机器学习和云计算的网络安全检测系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210501331.8A CN114928478A (zh) 2022-05-10 2022-05-10 基于核心算法、机器学习和云计算的网络安全检测系统

Publications (1)

Publication Number Publication Date
CN114928478A true CN114928478A (zh) 2022-08-19

Family

ID=82808023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210501331.8A Pending CN114928478A (zh) 2022-05-10 2022-05-10 基于核心算法、机器学习和云计算的网络安全检测系统

Country Status (1)

Country Link
CN (1) CN114928478A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116400028A (zh) * 2023-05-29 2023-07-07 湖南汇湘轩生物科技股份有限公司 一种基于气味传感器的香精质量检测方法、系统及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991011A (zh) * 2019-11-14 2020-04-10 广东电网有限责任公司 一种变压器实时热点温度预测方法
CN111343171A (zh) * 2020-02-19 2020-06-26 重庆邮电大学 一种基于支持向量机的混合特征选择的入侵检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991011A (zh) * 2019-11-14 2020-04-10 广东电网有限责任公司 一种变压器实时热点温度预测方法
CN111343171A (zh) * 2020-02-19 2020-06-26 重庆邮电大学 一种基于支持向量机的混合特征选择的入侵检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PING SONG 等: "Fault diagnosis for missile autopilot based on GSA-SVM", IEEE, 5 October 2016 (2016-10-05) *
陈玉鑫 等: "一种基于GSA-SVM 网络安全态势预测模型", 空军工程大学学报(自然科学版), vol. 19, no. 5, 31 October 2018 (2018-10-31), pages 78 - 82 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116400028A (zh) * 2023-05-29 2023-07-07 湖南汇湘轩生物科技股份有限公司 一种基于气味传感器的香精质量检测方法、系统及介质
CN116400028B (zh) * 2023-05-29 2023-08-22 湖南汇湘轩生物科技股份有限公司 一种基于气味传感器的香精质量检测方法、系统及介质

Similar Documents

Publication Publication Date Title
Caliskan et al. Diagnosis of the parkinson disease by using deep neural network classifier
WO2020167490A1 (en) Incremental training of machine learning tools
CN110875912A (zh) 一种基于深度学习的网络入侵检测方法、装置和存储介质
CN104636449A (zh) 基于lsa-gcc的分布式大数据系统风险识别方法
Zhao et al. Recognition of transportation state by smartphone sensors using deep bi-LSTM neural network
CN113887643B (zh) 一种基于伪标签自训练和源域再训练的新对话意图识别方法
CN110287985B (zh) 一种基于带变异粒子群算法的可变拓扑结构的深度神经网络图像识别方法
CN110633371A (zh) 一种日志分类方法及系统
CN112529638B (zh) 基于用户分类和深度学习的服务需求动态预测方法及系统
CN112819019A (zh) 分类模型生成装置及其分类模型生成方法
CN114928478A (zh) 基于核心算法、机器学习和云计算的网络安全检测系统
Liu et al. Data adaptive functional outlier detection: Analysis of the Paris bike sharing system data
Nie et al. An effective recognition of moving target seismic anomaly for security region based on deep bidirectional LSTM combined CNN
Zhang et al. Smartphone sensors‐based human activity recognition using feature selection and deep decision fusion
CN111652444A (zh) 一种基于K-means和LSTM的日游客量预测方法
Tamrakar et al. Integration of lazy learning associative classification with kNN algorithm
Angelin A roc curve based k-means clustering for outlier detection using dragon fly optimization
CN111222570B (zh) 基于差分隐私的集成学习分类方法
Tulgar et al. A distributed k nearest neighbor classifier for big data
CN114783063A (zh) 一种融合拓展决策和注意力网络的行为动态识别方法
Chen Brain Tumor Prediction with LSTM Method
Eranga Lstm based framework for time series anomaly detection
Heath et al. New global optimization algorithms for model-based clustering
Xu et al. Motion Attitude Prediction Algorithm Based on Data Mining and Intelligent Motion Training Model Construction
CN116647374B (zh) 一种基于大数据的网络流量入侵检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination