CN110197066A - 一种云计算环境下的虚拟机监控方法及监控系统 - Google Patents

一种云计算环境下的虚拟机监控方法及监控系统 Download PDF

Info

Publication number
CN110197066A
CN110197066A CN201910459348.XA CN201910459348A CN110197066A CN 110197066 A CN110197066 A CN 110197066A CN 201910459348 A CN201910459348 A CN 201910459348A CN 110197066 A CN110197066 A CN 110197066A
Authority
CN
China
Prior art keywords
attribute
training set
virtual machine
classification
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910459348.XA
Other languages
English (en)
Other versions
CN110197066B (zh
Inventor
周成成
周贤伟
杨兵强
吴轲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yifei (beijing) Environmental Protection Technology Co Ltd
Original Assignee
Yifei (beijing) Environmental Protection Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yifei (beijing) Environmental Protection Technology Co Ltd filed Critical Yifei (beijing) Environmental Protection Technology Co Ltd
Priority to CN201910459348.XA priority Critical patent/CN110197066B/zh
Publication of CN110197066A publication Critical patent/CN110197066A/zh
Application granted granted Critical
Publication of CN110197066B publication Critical patent/CN110197066B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/552Detecting local intrusion or implementing counter-measures involving long-term monitoring or reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/03Indexing scheme relating to G06F21/50, monitoring users, programs or devices to maintain the integrity of platforms
    • G06F2221/033Test or assess software

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种云计算环境下的虚拟机监控方法及监控系统,能够提高程序分类检测的精度。所述方法包括:建立隐蔽型攻击行为特征库;获取训练集,并从建立的特征库中选取若干个行为特征作为训练集中样本的侯选属性集,其中,训练集包括:异常程序和合法程序;根据获取的训练集及侯选属性集,利用基于属性权重的决策树算法,构建程序分类检测模型,其中,所述程序分类检测模型,用于监控虚拟机程序。本发明涉及云计算领域。

Description

一种云计算环境下的虚拟机监控方法及监控系统
技术领域
本发明涉及云计算领域,特别是指一种云计算环境下的虚拟机监控方法及监控系统。
背景技术
云计算技术在日趋成熟的同时,其自身面临着越来越多的挑战,安全性问题是其中的一个重要方面。由于云计算中数据和应用的集中托管和网络化服务,使其成为高价值的攻击目标,受到大量来自网络的攻击威胁。虚拟机作为云平台的重要基本单元,且虚拟机内承载着大量的服务,成为了攻击的主要对象。而且云平台中,同一台服务器分布着大量的虚拟机,各虚拟机之间彼此连接,如果某个虚拟机被攻击,则攻击者极有可能以此虚拟机为跳板攻击其它虚拟机,其它的虚拟机被攻击的风险则大大增加。
因此虚拟机的安全对整个云平台的安全至关重要,为了保证整个云系统的安全,需要保证单个虚拟机的安全。虚拟机的安全防护离不开监控技术的支撑,通过对系统进行实时监控,在系统内各关键节点部署监控代理,根据获取的监控数据分析系统安全。随着云服务规模的越来越大,系统结构也越来越复杂,对监控的要求也不断提高。如果监控不能及时发现系统安全威胁,随着威胁在系统内的扩散,则可能会造成重大损失。如果系统监控能够及时发现安全威胁,则可及时进行处理,防止威胁蔓延。因此,监控性能的好坏对保障系统安全至关重要。
现有技术中,在利用决策树算法,例如,迭代二叉树3代(Iterative Dichotomiser3,ID3)算法,构建用于监控虚拟机的程序分类检测模型时,在选择分裂属性时存在取值偏向的缺点,会导致程序检测精度低。
发明内容
本发明要解决的技术问题是提供一种云计算环境下的虚拟机监控方法及监控系统,以解决现有技术所存在的决策树算法在选择分裂属性时的取值偏向,导致程序检测精度低的问题。
为解决上述技术问题,本发明实施例提供一种云计算环境下的虚拟机监控方法,包括:
建立隐蔽型攻击行为特征库;
获取训练集,并从建立的特征库中选取若干个行为特征作为训练集中样本的侯选属性集,其中,训练集包括:异常程序和合法程序;
根据获取的训练集及侯选属性集,利用基于属性权重的决策树算法,构建程序分类检测模型,其中,所述程序分类检测模型,用于监控虚拟机程序。
进一步地,所述建立隐蔽型攻击行为特征库包括:
从准备、运行、通信三个阶段对隐蔽型攻击的行为进行分析;
提取出不同于预设的合法程序的行为特征,建立隐蔽型攻击行为特征库。
进一步地,所述根据获取的训练集及侯选属性集,利用基于属性权重的决策树算法,构建程序分类检测模型包括:
S1,创建一个节点N;
S2,若训练集S中的样本都属于同一类别C,则返回N作为叶节点,以类C标记;
S3,若侯选属性集attribute_list为空,则返回N作为叶节点,并标记该节点中类别个数最多的类;
S4,将训练集S中的样本按照类别进行分组,设共分为C1,C2,...,Cm个类;
S5,在所有类中,获取attribute_list中任一属性A的取值,并根据获取的属性A的取值,确定属性A的均值;
S6,根据确定的属性A的均值,通过标准差确定属性A的权重Q;
S7,利用基于属性权重的信息熵公式,确定attribute_list中属性A的信息增益Gain(A);
S8,按照S5-S7确定attribute_list中所有属性的信息增益;
S9,从attribute_list中选择具有最大信息增益的属性作为测试属性test_attribute;
S10,利用test_attribute标记节点N;
S11,对test_attribute的每个值进行分支;
S12,设Sj是test_attribute取值为aj的所有样本的集合,令S=Sj,attribute_list=attribute_list-test_attribute,其中,j=1,2,...,ν,ν表示test_attribute具有ν个不同的值;
S13,返回执行S1,直至完成决策树的构建。
进一步地,所述利用基于属性权重的信息熵公式,确定attribute_list中属性A的信息增益Gain(A)包括:
确定训练集S的信息熵E(S);
利用基于属性权重的信息熵公式,确定侯选属性集中任一属性A的信息熵E(A,Q);
通过公式Gain(A)=E(S)-E(A,Q),确定属性A的信息增益Gain(A)。
进一步地,训练集S的信息熵表示为:
其中,m表示训练集S的类别总数,Pi是训练集中的样本属于Ci的概率,Ci表示第i类;
设一个属性A具有ν个不同的值,通过属性A将训练集S划分为ν个子集{S1,S2,...,Sj,...,Sν},j=1,2,...,ν,则属性A的信息熵E(A,Q)表示为:
其中,Sij为子集Sj中属于Ci类别的样本集;Q表示属性A的权重系数,Pij表示子集Sj中样本属于类别Ci的概率。
本发明实施例还提供一种云计算环境下的虚拟机监控系统,包括:
建立模块,用于建立隐蔽型攻击行为特征库;
获取模块,用于获取训练集,并从建立的特征库中选取若干个行为特征作为训练集中样本的侯选属性集,其中,训练集包括:异常程序和合法程序;
构建模块,用于根据获取的训练集及侯选属性集,利用基于属性权重的决策树算法,构建程序分类检测模型,其中,所述程序分类检测模型,用于监控虚拟机程序。
进一步地,所述建立模块包括:
分析单元,用于从准备、运行、通信三个阶段对隐蔽型攻击的行为进行分析;
建立单元,用于提取出不同于预设的合法程序的行为特征,建立隐蔽型攻击行为特征库。
进一步地,所述构建模块包括:
分组单元,用于创建一个节点N;若训练集S中的样本都属于同一类别C,则返回N作为叶节点,以类C标记;若侯选属性集attribute_list为空,则返回N作为叶节点,并标记该节点中类别个数最多的类;将训练集S中的样本按照类别进行分组,设共分为C1,C2,...,Cm个类;
确定单元,用于在所有类中,获取attribute_list中任一属性A的取值,并根据获取的属性A的取值,确定属性A的均值;根据确定的属性A的均值,通过标准差确定属性A的权重Q;利用基于属性权重的信息熵公式,确定attribute_list中属性A的信息增益Gain(A);
调用单元,用于调用确定单元,确定attribute_list中所有属性的信息增益;
分支单元,用于从attribute_list中选择具有最大信息增益的属性作为测试属性test_attribute;利用test_attribute标记节点N;对test_attribute的每个值进行分支;设Sj是test_attribute取值为aj的所有样本的集合,令S=Sj,attribute_list=attribute_list-test_attribute,其中,j=1,2,...,ν,ν表示test_attribute具有ν个不同的值;返回执行分组单元,直至完成决策树的构建。
进一步地,所述利用基于属性权重的信息熵公式,确定attribute_list中属性A的信息增益Gain(A)包括:
确定训练集S的信息熵E(S);
利用基于属性权重的信息熵公式,确定侯选属性集中任一属性A的信息熵E(A,Q);
通过公式Gain(A)=E(S)-E(A,Q),确定属性A的信息增益Gain(A)。
进一步地,训练集S的信息熵表示为:
其中,m表示训练集S的类别总数,Pi是训练集中的样本属于Ci的概率,Ci表示第i类;
设一个属性A具有ν个不同的值,通过属性A将训练集S划分为ν个子集{S1,S2,...,Sj,...,Sν},j=1,2,...,ν,则属性A的信息熵E(A,Q)表示为:
其中,Sij为子集Sj中属于Ci类别的样本集;Q表示属性A的权重系数,Pij表示子集Sj中样本属于类别Ci的概率。
本发明的上述技术方案的有益效果如下:
上述方案中,建立隐蔽型攻击行为特征库;获取训练集,并从建立的特征库中选取若干个行为特征作为训练集中样本的侯选属性集,其中,训练集包括:异常程序和合法程序;根据获取的训练集及侯选属性集,利用基于属性权重的决策树算法,构建程序分类检测模型,这样,通过构建的基于属性权重的程序分类检测模型对虚拟机程序进行分类检测,能够避免决策树算法在选择分裂属性时的取值偏向,从而提高程序分类检测的精度。
附图说明
图1为本发明实施例提供的云计算环境下的虚拟机监控方法的流程示意图;
图2为本发明实施例提供的云计算环境下的虚拟机监控方法的原理示意图;
图3为本发明实施例提供的云计算环境下的虚拟机监控系统的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有的决策树算法在选择分裂属性时的取值偏向,导致程序检测精度低的问题,提供一种云计算环境下的虚拟机监控方法及监控系统。
实施例一
如图1所示,本发明实施例提供的云计算环境下的虚拟机监控方法,包括:
S101,建立隐蔽型攻击行为特征库;
S102,获取训练集,并从建立的特征库中选取若干个行为特征作为训练集中样本的侯选属性集,其中,训练集包括:异常程序和合法程序;
S103,根据获取的训练集及侯选属性集,利用基于属性权重的决策树算法,构建程序分类检测模型,其中,所述程序分类检测模型,用于监控虚拟机程序。
本发明实施例所述的云计算环境下的虚拟机监控方法,建立隐蔽型攻击行为特征库;获取训练集,并从建立的特征库中选取若干个行为特征作为训练集中样本的侯选属性集,其中,训练集包括:异常程序和合法程序;根据获取的训练集及侯选属性集,利用基于属性权重的决策树算法,构建程序分类检测模型,这样,通过构建的基于属性权重的程序分类检测模型对虚拟机程序进行分类检测,能够避免决策树算法在选择分裂属性时的取值偏向,从而提高程序分类检测的精度。
在前述云计算环境下的虚拟机监控方法的具体实施方式中,进一步地,所述建立隐蔽型攻击行为特征库包括:
从准备、运行、通信三个阶段对隐蔽型攻击的行为进行分析;
提取出不同于预设的合法程序的行为特征,建立隐蔽型攻击行为特征库。
本实施例中的隐蔽型攻击具有很强的隐蔽性,在云平台上来欺骗用户和隐藏自己的活动,甚至对攻击痕迹进行清除。隐蔽型攻击一般会先对目标进行侦查和了解,制作定向的攻击工具,如带有恶意代码的pdf文件,通过邮件、网站(挂马)和U盘等输送到目标虚拟机系统,再针对系统漏洞触发攻击工具运行,窃取用户信息或者篡改信息。这种攻击一般不具备强烈的破坏性,而是隐藏在系统中默默潜伏。
本实施例中,针对某些隐蔽型的攻击,例如,高级持续性威胁(AdvancedPersistent Threat,APT)、暗鼠攻击等,对其特有的行为进行分析归纳,从准备、运行、通信这三个阶段对隐蔽型攻击的行为进行分析,对其与不同于预设的合法程序的行为特征归纳处理,提取出不同于预设的合法程序的行为特征,建立隐蔽型攻击行为特征库。
本实施例中,获取多个异常程序和多个合法程序组成训练集S,并从建立的特征库中选取若干个行为特征作为训练集中样本的侯选属性集(attribute_list),其中,样本为异常程序或合法程序;根据获取的训练集及侯选属性集,引入权重系数,利用基于属性权重的决策树算法(例如,ID3算法),构建程序分类检测模型,能够避免决策树算法在选择分裂属性时的取值偏向,以提高程序分类检测的精度。
本实施例中,决策树中ID3算法主要针对属性选择问题,是决策树中最具影响和最典型的算法。其核心思想是:在决策树各级节点上选择属性时,用信息增益(informationgain)作为属性的分支标准,计算各属性的信息增益,然后选取信息增益最大的属性作为节点,自顶向下生成决策树,所述决策树为程序分类检测模型。
本实施例中,利用基于属性权重的ID3算法,构建程序分类检测模型时,其输入为:侯选属性的训练集、训练集和训练集中每个样本对应的类标号训练集;输出为:决策树。
本实施例中,利用基于属性权重的ID3算法,构建程序分类检测模型具体可以包括以下步骤:
S1,创建一个节点N;
S2,若训练集S中的样本都属于同一类别C,则返回N作为叶节点,以类C标记;
S3,若侯选属性集attribute_list为空,则返回N作为叶节点,并标记该节点中类别个数最多的类;
S4,将训练集S中的样本按照类别进行分组,设共分为C1,C2,...,Cm个类;
S5,在所有类中,获取attribute_list中任一属性A的取值,并根据获取的属性A的取值,确定属性A的均值;
S6,根据确定的属性A的均值,通过标准差确定属性A的权重Q;
S7,利用基于属性权重的信息熵公式,确定attribute_list中属性A的信息增益Gain(A);
S8,按照S5-S7确定attribute_list中所有属性的信息增益;
S9,从attribute_list中选择具有最大信息增益的属性作为测试属性test_attribute;
S10,利用test_attribute标记节点N;
S11,对test_attribute的每个值进行分支;
S12,设Sj是test_attribute取值为aj的所有样本的集合,令S=Sj,attribute_list=attribute_list-test_attribute,其中,j=1,2,...,ν,ν表示test_attribute具有ν个不同的值;
S13,返回执行S1,直至完成决策树的构建。
本实施例中,通过步骤S1-S13,根据训练集的样本,可以建立一个用于程序判定的程序分类检测模型。但在使用该程序分类检测模型进行判定之前,还需要通过验证集测试该程序分类检测模型的性能,因为在实际应用中,训练样本中如果有噪声或者训练样本个数太少,都可能使得生成的程序分类检测模型精度降低,产生错误判断,如图2所示。在这种情况下,就需要考虑采用不同的结构重新进行训练,比如使用更大的训练集。只有在多次训练和调整后,使得程序分类检测模型达到理想或者可接受的准确率,才能将其真正应用于隐蔽型攻击的程序异常判定。
在前述云计算环境下的虚拟机监控方法的具体实施方式中,进一步地,所述利用基于属性权重的信息熵公式,确定attribute_list中属性A的信息增益Gain(A)包括:
确定训练集S的信息熵E(S);
利用基于属性权重的信息熵公式,确定侯选属性集中任一属性A的信息熵E(A,Q);
通过公式Gain(A)=E(S)-E(A,Q),确定属性A的信息增益Gain(A)。
本实施例中,对于一个包含s个样本的训练集S,其类别属性包含有m个不同值,这就对应了m个不同的类别Ci(i∈{1,2,...,m})。假定Ci中的样本个数为Si,则训练集S的信息熵为:
其中,m表示训练集S的类别总数,Pi是训练集中的样本属于Ci的概率,Ci表示第i类,即Pi=Si/S。
本实施例中的程序分类检测问题是一个决策树分类问题(只有2种类别:异常和合法):把用于训练的程序的不同行为特征作为测试属性,根据ID3算法构建一个决策树,用决策树的规则对新的未知程序进行归类。因为每种属性只有2个可能取值:有和没有该行为,用于行为分析的决策树是一棵二叉树。
假设训练集S中有a个异常程序和b个合法程序,同时选取了k个行为特征组成样本的侯选属性集(这里的a、b、k均为正整数),则样本总数S=a+b,类别属性m=2(对应异常程序和合法程序2类,这里用C1表示合法程序,C2表示异常程序),那么C1中的样本个数S1=b,C2中的样本个数S2=a,则训练集S的信息熵为:
其中,P1=S1/S=b/(a+b),P2=S2/S=a/(a+b)。
本实施例中,设一个属性A具有ν个不同的值,则属性A可以把训练集S划分为ν个子集{S1,S2,...,Sν},其中Sj(j=1,2,...,ν)包含了训练集S中属性A取aj值的样本。如果选择属性A作为测试属性,设Sij为子集Sj中属于Ci类别的样本集。设每个属性只有2个不同值:具有和不具有该行为(分别用1和0表示),则每个属性又把训练集S划分为2个子集:S1和S2,其中,S1包含属性取1的样本,S2包含属性取0的样本。
本实施例中,为了克服ID3算法在选择分裂属性时的取值偏向的缺点,在传统ID3算法的基础上引入了属性的权重系数Q,来优化参数,设属性A的权重系数为Q,则属性A的信息熵E(A,Q)表示为:
其中,|S1j|+|S2j|+...+|Smj|/|S|是第j个子集的权,也等于子集中样本个数除以S中的样本总数;Pij=Sij/|Sj|是子集Sj中样本属于类别Ci的概率;其中,信息熵E(A,Q)越小,子集划分的纯度越高。
本实施例中,属性A的信息增益可以表示为:
Gain(A)=E(S)-E(A,Q)
本实施例中,设训练集中共有n个属性A1,A2,...,An,它们所求得的标准差组成向量X=(σ12,...,σn),其中,σi为属性Ai的标准差,将向量X归一化得Q=(Q1,Q2,...,Qn),则属性Ai的权重为Qi
由信息论知识可知,一个系统越是“混乱”信息熵就越高,所以属性A的标准差越大,系统的信息熵就越高,即系统的不确定性越大,则分裂属性A后的系统的不确定性就越小,则属性A的信息增益就越大,即它对分类就越重要,所以它的权重系数就越大。
本实施例中,按照计算属性A的信息增益的方法,可以计算其他k-1个属性的信息增益,比较信息增益大小,选择具有最大信息增益的属性进行分支。
实施例二
本发明还提供一种云计算环境下的虚拟机监控系统的具体实施方式,由于本发明提供的云计算环境下的虚拟机监控系统与前述云计算环境下的虚拟机监控方法的具体实施方式相对应,该云计算环境下的虚拟机监控系统可以通过执行上述方法具体实施方式中的流程步骤来实现本发明的目的,因此上述云计算环境下的虚拟机监控方法具体实施方式中的解释说明,也适用于本发明提供的云计算环境下的虚拟机监控系统的具体实施方式,在本发明以下的具体实施方式中将不再赘述。
如图3所示,本发明实施例还提供一种云计算环境下的虚拟机监控系统,包括:
建立模块11,用于建立隐蔽型攻击行为特征库;
获取模块12,用于获取训练集,并从建立的特征库中选取若干个行为特征作为训练集中样本的侯选属性集,其中,训练集包括:异常程序和合法程序;
构建模块13,用于根据获取的训练集及侯选属性集,利用基于属性权重的决策树算法,构建程序分类检测模型,其中,所述程序分类检测模型,用于监控虚拟机程序。
本发明实施例所述的云计算环境下的虚拟机监控系统,建立隐蔽型攻击行为特征库;获取训练集,并从建立的特征库中选取若干个行为特征作为训练集中样本的侯选属性集,其中,训练集包括:异常程序和合法程序;根据获取的训练集及侯选属性集,利用基于属性权重的决策树算法,构建程序分类检测模型,这样,通过构建的基于属性权重的程序分类检测模型对虚拟机程序进行分类检测,能够避免决策树算法在选择分裂属性时的取值偏向,从而提高程序分类检测的精度。
在前述云计算环境下的虚拟机监控系统的具体实施方式中,进一步地,所述建立模块包括:
分析单元,用于从准备、运行、通信三个阶段对隐蔽型攻击的行为进行分析;
建立单元,用于提取出不同于预设的合法程序的行为特征,建立隐蔽型攻击行为特征库。
在前述云计算环境下的虚拟机监控系统的具体实施方式中,进一步地,所述构建模块包括:
分组单元,用于创建一个节点N;若训练集S中的样本都属于同一类别C,则返回N作为叶节点,以类C标记;若侯选属性集attribute_list为空,则返回N作为叶节点,并标记该节点中类别个数最多的类;将训练集S中的样本按照类别进行分组,设共分为C1,C2,...,Cm个类;
确定单元,用于在所有类中,获取attribute_list中任一属性A的取值,并根据获取的属性A的取值,确定属性A的均值;根据确定的属性A的均值,通过标准差确定属性A的权重Q;利用基于属性权重的信息熵公式,确定attribute_list中属性A的信息增益Gain(A);
调用单元,用于调用确定单元,确定attribute_list中所有属性的信息增益;
分支单元,用于从attribute_list中选择具有最大信息增益的属性作为测试属性test_attribute;利用test_attribute标记节点N;对test_attribute的每个值进行分支;设Sj是test_attribute取值为aj的所有样本的集合,令S=Sj,attribute_list=attribute_list-test_attribute,其中,j=1,2,...,ν,ν表示test_attribute具有ν个不同的值;返回执行分组单元,直至完成决策树的构建。
在前述云计算环境下的虚拟机监控系统的具体实施方式中,进一步地,所述利用基于属性权重的信息熵公式,确定attribute_list中属性A的信息增益Gain(A)包括:
确定训练集S的信息熵E(S);
利用基于属性权重的信息熵公式,确定侯选属性集中任一属性A的信息熵E(A,Q);
通过公式Gain(A)=E(S)-E(A,Q),确定属性A的信息增益Gain(A)。
在前述云计算环境下的虚拟机监控系统的具体实施方式中,进一步地,训练集S的信息熵表示为:
其中,m表示训练集S的类别总数,Pi是训练集中的样本属于Ci的概率,Ci表示第i类;
设一个属性A具有ν个不同的值,通过属性A将训练集S划分为ν个子集{S1,S2,...,Sj,...,Sν},j=1,2,...,ν,则属性A的信息熵E(A,Q)表示为:
其中,Sij为子集Sj中属于Ci类别的样本集;Q表示属性A的权重系数,Pij表示子集Sj中样本属于类别Ci的概率。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种云计算环境下的虚拟机监控方法,其特征在于,包括:
建立隐蔽型攻击行为特征库;
获取训练集,并从建立的特征库中选取若干个行为特征作为训练集中样本的侯选属性集,其中,训练集包括:异常程序和合法程序;
根据获取的训练集及侯选属性集,利用基于属性权重的决策树算法,构建程序分类检测模型,其中,所述程序分类检测模型,用于监控虚拟机程序。
2.根据权利要求1所述的云计算环境下的虚拟机监控方法,其特征在于,所述建立隐蔽型攻击行为特征库包括:
从准备、运行、通信三个阶段对隐蔽型攻击的行为进行分析;
提取出不同于预设的合法程序的行为特征,建立隐蔽型攻击行为特征库。
3.根据权利要求1所述的云计算环境下的虚拟机监控方法,其特征在于,所述根据获取的训练集及侯选属性集,利用基于属性权重的决策树算法,构建程序分类检测模型包括:
S1,创建一个节点N;
S2,若训练集S中的样本都属于同一类别C,则返回N作为叶节点,以类C标记;
S3,若侯选属性集attribute_list为空,则返回N作为叶节点,并标记该节点中类别个数最多的类;
S4,将训练集S中的样本按照类别进行分组,设共分为C1,C2,...,Cm个类;
S5,在所有类中,获取attribute_list中任一属性A的取值,并根据获取的属性A的取值,确定属性A的均值;
S6,根据确定的属性A的均值,通过标准差确定属性A的权重Q;
S7,利用基于属性权重的信息熵公式,确定attribute_list中属性A的信息增益Gain(A);
S8,按照S5-S7确定attribute_list中所有属性的信息增益;
S9,从attribute_list中选择具有最大信息增益的属性作为测试属性test_attribute;
S10,利用test_attribute标记节点N;
S11,对test_attribute的每个值进行分支;
S12,设Sj是test_attribute取值为aj的所有样本的集合,令S=Sj,attribute_list=attribute_list-test_attribute,其中,j=1,2,...,ν,ν表示test_attribute具有ν个不同的值;
S13,返回执行S1,直至完成决策树的构建。
4.根据权利要求3所述的云计算环境下的虚拟机监控方法,其特征在于,所述利用基于属性权重的信息熵公式,确定attribute_list中属性A的信息增益Gain(A)包括:
确定训练集S的信息熵E(S);
利用基于属性权重的信息熵公式,确定侯选属性集中任一属性A的信息熵E(A,Q);
通过公式Gain(A)=E(S)-E(A,Q),确定属性A的信息增益Gain(A)。
5.根据权利要求4所述的云计算环境下的虚拟机监控方法,其特征在于,训练集S的信息熵表示为:
其中,m表示训练集S的类别总数,Pi是训练集中的样本属于Ci的概率,Ci表示第i类;
设一个属性A具有ν个不同的值,通过属性A将训练集S划分为ν个子集{S1,S2,...,Sj,...,Sν},j=1,2,...,ν,则属性A的信息熵E(A,Q)表示为:
其中,Sij为子集Sj中属于Ci类别的样本集;Q表示属性A的权重系数,Pij表示子集Sj中样本属于类别Ci的概率。
6.一种云计算环境下的虚拟机监控系统,其特征在于,包括:
建立模块,用于建立隐蔽型攻击行为特征库;
获取模块,用于获取训练集,并从建立的特征库中选取若干个行为特征作为训练集中样本的侯选属性集,其中,训练集包括:异常程序和合法程序;
构建模块,用于根据获取的训练集及侯选属性集,利用基于属性权重的决策树算法,构建程序分类检测模型,其中,所述程序分类检测模型,用于监控虚拟机程序。
7.根据权利要求6所述的云计算环境下的虚拟机监控系统,其特征在于,所述建立模块包括:
分析单元,用于从准备、运行、通信三个阶段对隐蔽型攻击的行为进行分析;
建立单元,用于提取出不同于预设的合法程序的行为特征,建立隐蔽型攻击行为特征库。
8.根据权利要求6所述的云计算环境下的虚拟机监控系统,其特征在于,所述构建模块包括:
分组单元,用于创建一个节点N;若训练集S中的样本都属于同一类别C,则返回N作为叶节点,以类C标记;若侯选属性集attribute_list为空,则返回N作为叶节点,并标记该节点中类别个数最多的类;将训练集S中的样本按照类别进行分组,设共分为C1,C2,...,Cm个类;
确定单元,用于在所有类中,获取attribute_list中任一属性A的取值,并根据获取的属性A的取值,确定属性A的均值;根据确定的属性A的均值,通过标准差确定属性A的权重Q;利用基于属性权重的信息熵公式,确定attribute_list中属性A的信息增益Gain(A);
调用单元,用于调用确定单元,确定attribute_list中所有属性的信息增益;
分支单元,用于从attribute_list中选择具有最大信息增益的属性作为测试属性test_attribute;利用test_attribute标记节点N;对test_attribute的每个值进行分支;设Sj是test_attribute取值为aj的所有样本的集合,令S=Sj,attribute_list=attribute_list-test_attribute,其中,j=1,2,...,ν,ν表示test_attribute具有ν个不同的值;返回执行分组单元,直至完成决策树的构建。
9.根据权利要求8所述的云计算环境下的虚拟机监控系统,其特征在于,所述利用基于属性权重的信息熵公式,确定attribute_list中属性A的信息增益Gain(A)包括:
确定训练集S的信息熵E(S);
利用基于属性权重的信息熵公式,确定侯选属性集中任一属性A的信息熵E(A,Q);
通过公式Gain(A)=E(S)-E(A,Q),确定属性A的信息增益Gain(A)。
10.根据权利要求9所述的云计算环境下的虚拟机监控系统,其特征在于,训练集S的信息熵表示为:
其中,m表示训练集S的类别总数,Pi是训练集中的样本属于Ci的概率,Ci表示第i类;
设一个属性A具有ν个不同的值,通过属性A将训练集S划分为ν个子集{S1,S2,...,Sj,...,Sν},j=1,2,...,ν,则属性A的信息熵E(A,Q)表示为:
其中,Sij为子集Sj中属于Ci类别的样本集;Q表示属性A的权重系数,Pij表示子集Sj中样本属于类别Ci的概率。
CN201910459348.XA 2019-05-29 2019-05-29 一种云计算环境下的虚拟机监控方法及监控系统 Active CN110197066B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910459348.XA CN110197066B (zh) 2019-05-29 2019-05-29 一种云计算环境下的虚拟机监控方法及监控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910459348.XA CN110197066B (zh) 2019-05-29 2019-05-29 一种云计算环境下的虚拟机监控方法及监控系统

Publications (2)

Publication Number Publication Date
CN110197066A true CN110197066A (zh) 2019-09-03
CN110197066B CN110197066B (zh) 2021-04-20

Family

ID=67753268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910459348.XA Active CN110197066B (zh) 2019-05-29 2019-05-29 一种云计算环境下的虚拟机监控方法及监控系统

Country Status (1)

Country Link
CN (1) CN110197066B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024060767A1 (zh) * 2022-09-20 2024-03-28 华为云计算技术有限公司 异常检测方法及相关装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070136223A1 (en) * 2005-12-09 2007-06-14 Electronics And Telecommunications Research Institute Method for making decision tree using context inference engine in ubiquitous environment
US20130212058A1 (en) * 2012-02-09 2013-08-15 Jeffrey L. Pattillo System and Method for Making Decisions Using Network-Guided Decision Trees With Multivariate Splits
CN103795710A (zh) * 2014-01-10 2014-05-14 河海大学 一种基于CloudStack云平台的入侵检测系统的构建方法
CN103957116A (zh) * 2014-03-31 2014-07-30 昆明理工大学 一种云故障数据的决策方法及系统
CN104820702A (zh) * 2015-05-12 2015-08-05 中国地质大学(武汉) 一种基于决策树的属性加权方法及文本分类方法
CN107203198A (zh) * 2017-05-27 2017-09-26 四川用联信息技术有限公司 改进的制造过程多元质量诊断分类器
CN108364467A (zh) * 2018-02-12 2018-08-03 北京工业大学 一种基于改进型决策树算法的路况信息预测方法
CN108874927A (zh) * 2018-05-31 2018-11-23 桂林电子科技大学 基于超图和随机森林的入侵检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070136223A1 (en) * 2005-12-09 2007-06-14 Electronics And Telecommunications Research Institute Method for making decision tree using context inference engine in ubiquitous environment
US20130212058A1 (en) * 2012-02-09 2013-08-15 Jeffrey L. Pattillo System and Method for Making Decisions Using Network-Guided Decision Trees With Multivariate Splits
CN103795710A (zh) * 2014-01-10 2014-05-14 河海大学 一种基于CloudStack云平台的入侵检测系统的构建方法
CN103957116A (zh) * 2014-03-31 2014-07-30 昆明理工大学 一种云故障数据的决策方法及系统
CN104820702A (zh) * 2015-05-12 2015-08-05 中国地质大学(武汉) 一种基于决策树的属性加权方法及文本分类方法
CN107203198A (zh) * 2017-05-27 2017-09-26 四川用联信息技术有限公司 改进的制造过程多元质量诊断分类器
CN108364467A (zh) * 2018-02-12 2018-08-03 北京工业大学 一种基于改进型决策树算法的路况信息预测方法
CN108874927A (zh) * 2018-05-31 2018-11-23 桂林电子科技大学 基于超图和随机森林的入侵检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张琼声 等: "一种基于属性加权的决策树算法", 《微计算机应用》 *
王楚: "基于改进决策树的入侵检测算法的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024060767A1 (zh) * 2022-09-20 2024-03-28 华为云计算技术有限公司 异常检测方法及相关装置

Also Published As

Publication number Publication date
CN110197066B (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
CN106503558B (zh) 一种基于社团结构分析的Android恶意代码检测方法
CN110298663B (zh) 基于序列宽深学习的欺诈交易检测方法
Tesfahun et al. Intrusion detection using random forests classifier with SMOTE and feature reduction
Goswami et al. An Unsupervised Method for Detection of XSS Attack.
CN107169355B (zh) 一种蠕虫同源性分析方法和装置
CN110263538A (zh) 一种基于系统行为序列的恶意代码检测方法
CN105224600B (zh) 一种样本相似度的检测方法及装置
CN109598124A (zh) 一种webshell检测方法以及装置
CN107944274A (zh) 一种基于宽度学习的Android平台恶意应用离线检测方法
CN112148305B (zh) 一种应用检测方法、装置、计算机设备和可读存储介质
CN105072214A (zh) 基于域名特征的c&c域名识别方法
CN109190371A (zh) 一种基于行为图的Android恶意软件检测方法和技术
CN117081858B (zh) 一种基于多决策树入侵行为检测方法、系统、设备及介质
CN108229170A (zh) 利用大数据和神经网络的软件分析方法和装置
CN111914257A (zh) 文档检测的方法、装置、设备、及计算机存储介质
CN110704841A (zh) 一种基于卷积神经网络的大规模安卓恶意应用检测系统及方法
CN107832611B (zh) 一种动静态特征结合的僵尸程序检测与分类方法
Ahsan-Ul-Haque et al. Sequencing system calls for effective malware detection in android
Harbola et al. Improved intrusion detection in DDoS applying feature selection using rank & score of attributes in KDD-99 data set
CN109450880A (zh) 基于决策树的钓鱼网站检测方法、装置及计算机设备
CN117376228B (zh) 一种网络安全测试工具确定方法及装置
CN110197066A (zh) 一种云计算环境下的虚拟机监控方法及监控系统
CN112765606A (zh) 恶意代码同源性分析方法和装置及设备
CN112016088A (zh) 生成文件检测模型的方法、装置、检测文件的方法及装置
CN112001423A (zh) Apt恶意软件组织的开集识别方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant