CN103095534B - 一种二维k均值熵的网络攻击效果评估方法 - Google Patents

一种二维k均值熵的网络攻击效果评估方法 Download PDF

Info

Publication number
CN103095534B
CN103095534B CN201310062672.0A CN201310062672A CN103095534B CN 103095534 B CN103095534 B CN 103095534B CN 201310062672 A CN201310062672 A CN 201310062672A CN 103095534 B CN103095534 B CN 103095534B
Authority
CN
China
Prior art keywords
entropy
attack
data
cluster
effect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310062672.0A
Other languages
English (en)
Other versions
CN103095534A (zh
Inventor
李千目
戚湧
刘浩
朱长林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BANK OF BEIJING CONSUMER FINANCE COMPANY
Original Assignee
Nanjing University of Science and Technology Changshu Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology Changshu Research Institute Co Ltd filed Critical Nanjing University of Science and Technology Changshu Research Institute Co Ltd
Priority to CN201310062672.0A priority Critical patent/CN103095534B/zh
Publication of CN103095534A publication Critical patent/CN103095534A/zh
Application granted granted Critical
Publication of CN103095534B publication Critical patent/CN103095534B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种利用二维熵分量的K均值聚类攻击效果评估方法。该方法首先对攻击数据进行预处理,计算具体性能指标攻击前后的熵差并利用余弦定理将其映射到二维向量空间,在反映数据本身特点的同时统一标度;然后对K均值效果分级,对预处理后的数据利用改进的K-means算法聚类,以网络攻击效果的分级特性作为启发式信息确定聚类数,通过计算二维向量空间中各数据点的欧几里德距离确定初始聚类中心,经过数轮迭代,选取使距离代价函数最小的聚类结果作为最终输出以评估攻击效果。本发明在满足批量运算效率要求的同时极大地克服了评估过程的主观性。

Description

一种二维K均值熵的网络攻击效果评估方法
技术领域
本发明涉及一种网络攻击效果的评估方法,属于信息安全技术领域。
背景技术
随着信息技术的飞速发展,Internet网络结构日趋复杂并逐步向多元化、融合性的方向演变。随之而来的网络攻击行为也日益增多,因此,有必要开展对不同种类攻击行为的研究,并推进攻击效果评估工作以完善主机抗攻击能力,进而提高信息系统的安全性。
目前针对攻击效果的评估主要是基于层次分析法的评估指标体系建立以及利用模糊粗糙集理论的综合评价。在国内,李雄伟等结合层次分析法和模糊综合评价法对评估指标进行了量化,王会梅基于集对原理提出了一种能有效处理评估结果分级标准边界模糊性的集对评估方法,以粗糙集属性重要性为根据确定指标权重并对网络的抗拒绝服务攻击性能进行集对评估;2004年,张义荣、鲜明等人提出了基于网络熵的攻击效果定量评估模型,从网络受攻击前后安全特性变化的角度分析了网络熵的概念,并根据熵差的特性设计了基于层次分析法的计算机网络攻击效果评估体系。相对于传统的直接利用原始采集数据进行评估计算的方法而言,以熵差来衡量网络受攻击前后性能变化的方法能够以统一的标准将不同种类的采集指标归一化,简化评估过程中的数据预处理步骤,并直观地动态地反映出攻击对系统造成的影响。
发明内容
1、本发明的目的。
本发明为了提高信息系统的安全性,提出了一种基于K均值聚类的攻击效果评估算法。
2、本发明所采用的技术方案。
本发明提出一种基于K均值聚类的攻击效果评估算法,首先引入网络熵的与熵差的概念。
以目标网络受攻击前后的性能变化量为参数,将表征网络性能的指标值归一化为V i ,进而定义其熵为
使用可以用熵差ΔH来计算目标网络遭受攻击前后熵的变化,以分别表示攻击前后的网络熵,则熵差可以通过下式计算:
目标网络遭受攻击之后,指标值的变化越大,通过上式计算出来的熵差也就越大,攻击效果越明显。
然后利用改进过的K-means算法将熵差聚类,进而进行网络攻击效果评估。
首先对攻击数据进行预处理,计算具体性能指标攻击前后的熵差并利用余弦定理将其映射到二维向量空间,在反映数据本身特点的同时统一标度,然后对预处理后的数据利用改进的K-means算法聚类,以网络攻击效果的分级特性作为启发式信息确定聚类数,通过计算二维向量空间中各数据点的欧几里得距离确定初始聚类中心,经过数轮迭代,选取使距离代价函数最小的聚类结果作为最终输出以评估攻击效果。
3、本发明的有益效果。
本发明利用目标网络受攻击前后的熵差将采集数据映射到二维向量空间,并利用启发式信息改进K均值聚类算法对指标数据聚类,以定量化的计算过程得到最终评估结果,在满足批量运算效率要求的同时极大地克服了评估过程的主观性。
具体实施方式
实施例
本发明具体步骤如下:
A.数据预处理
假设有一组指标数据V={V 1 ,V 2, ...,Vk,...},攻击前后V k 的指标熵分别为H k H k ,对于不同标度的指标,尽管熵差的大小可以反映受攻击前后的变化,但是由于不同指标的度量方式不一样,熵差本身的值差别可能很大,例如,对于指标吞吐量和延迟来说,前者数值一般可达到百兆以上,而后者则一般为几十毫秒,仅从数据的大小上无法反映攻击的效果,因此对每个指标在计算中引入最大可能攻击效果熵对指标值规格化,根据实际熵差和理想熵差的比值来确定攻击的程度。定义攻击程度变量,将每组攻击数据描述为,其中分别表示攻击前性能熵、攻击后性能熵以及指标理想最大熵,以熵差公式计算,为攻击程度变量,且
在其定义域上,是单调减函数,越小表示攻击效果越明显,在相等的情况下,实际攻击效果量高低由熵差的数值大小决定。通过以上的处理引进与熵差相关的变量可以将各攻击数据点的单一数据值映射到二维向量空间,对,以熵差的大小表示向量的长度,与x轴的夹角确定向量的方向。
B.K均值效果分级
在对指标数据进行预处理之后,利用改进的K-means算法对数据点聚类以评估攻击效果,具体步骤如下:
Step1:确定聚类中心。首先根据对不同评估对象效果分级的先验知识选取聚类数,例如,对计算机网络攻击效果评估,最终攻击效果集一般为Result={好,较好,一般,差},可根据此信息确定聚类数初始值k 0 =4。根据数据点k的熵差和夹角(ΔH k k )计算点在直角坐标系下的坐标(x k ,y k )=(ΔH k *cosθ k ,ΔH k *sinθ k ),假设初始聚类中心在(x min ,y min )~(x max ,y max )间等距分布,可求出其坐标为,
Step2:划分聚类。分别求出每个数据点到所有聚类中心C i 的欧氏距离,存储到矩阵D 0 中,并将节点划分到有最小欧式距离的聚类中心所属聚类中。计算聚类结果的紧致与分离性效果函数S(U,k) [8]作为距离代价函数,
其中n为数据点总数,k为聚类数,x i 代表第i个数据点,c j 代表第j个聚类中心,为数据点x i 与聚类中心c j 2-范数的平方,在二维向量空间中表示x i c j 的向量距离,r ij x i c j 的隶属度且
可以看到,紧致与分离性效果函数衡量了类内距离与类间距离的比值,类内距离越小、类间距离越大,则效果函数值越小,表示聚类效果越好,反之聚类效果差。
Step3:重算聚类中心。由于聚类过程中需要保证类间距离尽可能小,假定新聚类中心为μ i ,则数据点d k 到新聚类中心的均方差在聚类的过程中需要找到r ki μ i 的最优解以最小化SD
对参数r ki ,显然将其划分到距离最近的聚类中心所属聚类时可以保证SD最小,即
μ i ,将SDμ i 求导,
,求得,即μ i 应取聚类i中所有数据点的平均坐标,计算出μ i 后以μ i 更新聚类中心C i 并重复Step2以新的聚类中心划分聚类,得到新的效果函数S(U,k)’,若S(U,k)’>S(U,k),重复Step3,否则停止算法并输出聚类结果Cluster0;
Step4:一次完整聚类过程结束后,得到聚类结果Cluster0,然后优化聚类数k,由于初始化时聚类数k以经验确定,可能存在聚类数量上的细微偏差,计算新聚类数,以新的聚类数重复聚类过程,得到最后的聚类结果集{Cluster},比较聚类效果并取拥有最小紧致与分离性效果函数的聚类结果作为最终输出。
上述实施例不以任何方式限制本发明,凡是采用等同替换或等效变换的方式获得的技术方案均落在本发明的保护范围内。

Claims (1)

1.一种二维K均值熵的网络攻击效果评估方法,首先对攻击数据进行预处理,计算具体性能指标攻击前后的熵差并利用余弦定理将其映射到二维向量空间,在反映数据本身特点的同时统一标度;然后对K均值效果分级,对预处理后的数据利用改进的K-means算法聚类,以网络攻击效果的分级特性作为启发式信息确定聚类数,通过计算二维向量空间中各数据点的欧几里德距离确定初始聚类中心,经过数轮迭代,选取使距离代价函数最小的聚类结果作为最终输出以评估攻击效果;其特征在于:对攻击数据进行数据预处理,假设有一组指标数据V={V 1 ,V 2, ...,V k ,...},攻击前后V k 的指标熵分别为H k H k ,对每个指标在计算中引入最大可能攻击效果熵对指标值规格化,根据实际熵差和理想熵差的比值来确定攻击的程度,定义攻击程度变量,将每组攻击数据描述为,其中分别表示攻击前性能熵、攻击后性能熵以及指标理想最大熵,以熵差公式计算,为攻击程度变量,且
在其定义域上,是单调减函数,越小表示攻击效果越明显,在相等的情况下,实际攻击效果量高低由熵差的数值大小决定;通过以上的处理引进与熵差相关的变量可以将各攻击数据点的单一数据值映射到二维向量空间,对,以熵差的大小表示向量的长度,与x轴的夹角确定向量的方向。
CN201310062672.0A 2013-02-28 2013-02-28 一种二维k均值熵的网络攻击效果评估方法 Active CN103095534B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310062672.0A CN103095534B (zh) 2013-02-28 2013-02-28 一种二维k均值熵的网络攻击效果评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310062672.0A CN103095534B (zh) 2013-02-28 2013-02-28 一种二维k均值熵的网络攻击效果评估方法

Publications (2)

Publication Number Publication Date
CN103095534A CN103095534A (zh) 2013-05-08
CN103095534B true CN103095534B (zh) 2016-01-20

Family

ID=48207692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310062672.0A Active CN103095534B (zh) 2013-02-28 2013-02-28 一种二维k均值熵的网络攻击效果评估方法

Country Status (1)

Country Link
CN (1) CN103095534B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103368979B (zh) * 2013-08-08 2015-02-04 电子科技大学 一种基于改进K-means算法的网络安全性验证装置
CN104537067A (zh) * 2014-12-30 2015-04-22 广东电网有限责任公司信息中心 一种基于k-means聚类的分箱方法
CN106487547B (zh) * 2015-08-26 2019-06-21 中国移动通信集团公司 一种评估网络性能指标变化趋势的方法及装置
CN108733003B (zh) * 2017-04-20 2020-11-13 南京理工大学 基于kmeans聚类算法的回转类零件工序工时预测方法及系统
CN113743452B (zh) * 2021-07-21 2024-03-01 深圳供电局有限公司 电能质量评估方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102185847A (zh) * 2011-04-22 2011-09-14 南京邮电大学 基于熵值法的恶意代码网络攻击评估方法
CN102254033A (zh) * 2011-08-05 2011-11-23 西安电子科技大学 基于熵权重的全局k-均值聚类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102185847A (zh) * 2011-04-22 2011-09-14 南京邮电大学 基于熵值法的恶意代码网络攻击评估方法
CN102254033A (zh) * 2011-08-05 2011-11-23 西安电子科技大学 基于熵权重的全局k-均值聚类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于信息熵与K均值迭代模型的模糊聚类算法;吴春旭等;《中国管理科学》;20081031;第16卷;第152-156页 *

Also Published As

Publication number Publication date
CN103095534A (zh) 2013-05-08

Similar Documents

Publication Publication Date Title
CN103095534B (zh) 一种二维k均值熵的网络攻击效果评估方法
CN104883278A (zh) 一种利用机器学习对网络设备进行分类的方法
CN102663100A (zh) 一种两阶段混合粒子群优化聚类方法
CN106652460A (zh) 一种高速公路交通状态判别方法及系统
CN109815541B (zh) 轨道交通车辆产品零部件模块划分方法、装置与电子设备
CN104102833B (zh) 基于密集区间发现的税务指标归一化与融合计算方法
CN106022359A (zh) 基于有序信息熵的模糊熵空间聚类分析方法
CN104378371A (zh) 基于MapReduce并行AP聚类的网络入侵检测方法
CN104463210A (zh) 基于面向对象和谱聚类的极化sar图像分类方法
CN115022038A (zh) 一种电网网络异常检测方法、装置、设备及存储介质
CN104778368A (zh) 一种针对高维多目标优化问题的Pareto集个体排序方法
Baswade et al. A comparative study of k-means and weighted k-means for clustering
CN107480426A (zh) 自迭代病历档案聚类分析系统
CN103902706A (zh) 一种基于svm的大数据分类预测方法
CN104881688A (zh) 一种两阶段的基于差分进化和模糊c-均值的聚类算法
CN103065015A (zh) 一种基于内力路径几何形态的承载结构低碳节材设计方法
CN110972060A (zh) 一种在电力通信网面向终端接入的边缘控制中心部署方法
CN107454084B (zh) 基于杂交带的最近邻入侵检测算法
CN102880881A (zh) 一种基于二类支持向量机和遗传算法的轿车车型识别方法
CN106066904B (zh) 一种基于多目标进化算法的高维多目标天线设计方法
CN102855301A (zh) 稀疏模糊c均值聚类方法
CN108717444A (zh) 一种基于分布式结构的大数据聚类方法和装置
CN104391866B (zh) 一种基于高维数据过滤器的近似成员查询方法
CN103544135A (zh) 一种结合限制数据的特征权值量化方法
CN109960703A (zh) 用于大数据挖掘聚类的自适应pso-pfcm聚类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160713

Address after: 100080, Beijing Haidian District Zhongguancun Avenue, China Central Building 22

Patentee after: BANK OF BEIJING CONSUMER FINANCE COMPANY

Address before: The Science Park Research Institute of Jiangsu province Suzhou City Road 215513, Changshou City economic and Technological Development Zone No. 5

Patentee before: Nanjing University Of Science And Technology Changshu Institute Co., Ltd.