CN116010023A - 虚拟机迁移方法、装置、电子设备和介质 - Google Patents

虚拟机迁移方法、装置、电子设备和介质 Download PDF

Info

Publication number
CN116010023A
CN116010023A CN202211532699.7A CN202211532699A CN116010023A CN 116010023 A CN116010023 A CN 116010023A CN 202211532699 A CN202211532699 A CN 202211532699A CN 116010023 A CN116010023 A CN 116010023A
Authority
CN
China
Prior art keywords
index
target
host
state
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211532699.7A
Other languages
English (en)
Inventor
曲文超
徐蕾
王健
徐锐
付迎鑫
刘桥
徐冬冬
槐正
范小将
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN202211532699.7A priority Critical patent/CN116010023A/zh
Publication of CN116010023A publication Critical patent/CN116010023A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种虚拟机迁移方法、装置、电子设备和介质,涉及计算机技术领域。该方法包括:确定目标指标项,获取目标宿主机的所述目标指标项对应的指标数据;利用预设的贝叶斯预警模型对所述指标数据集进行分析,确定所述目标宿主机的预测状态;在确定所述目标宿主机的预测状态为异常状态的情况下,将映射在所述目标宿主机上的虚拟机进行迁移。该实施方式降低了对目标宿主机故障的误判率,提高了虚拟化迁移的精准度,以及避免了因虚拟机迁移导致的目标宿主机上部署的业务中断造成的损失。

Description

虚拟机迁移方法、装置、电子设备和介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种虚拟机迁移方法、装置、电子设备和介质。
背景技术
随着计算机技术的飞速发展,信息网络已经成为社会发展的重要保证。以及,网络社会发展程度的不断提高,使得网络应用的日益普及。人工智能技术的大规模应用,可通过在服务器上部署虚拟化软件,使一台物理服务器可以承担多台服务器的工作,进而可通过整合现有的工作负载并利用剩余的服务器以部署新的应用程序和解决方案,以实现较高的整合率。
现有技术中,对于在传统的硬件资源的虚拟化,以及对虚拟资源、业务资源、用户资源的集中管理运维体系中,会通过定性评估方法来预测虚拟机映射的宿主机(物理机)是否发生故障,在预测到虚拟机映射的宿主机发生异常或故障的情况下货宿主机已经发送异常的情况下,对虚拟机进行迁移。然而,定性评估很难实时、客观的评估宿主机的状态,而且会使得宿主机故障预测的不准确导致误报等情况,一旦误报就需要将该宿主机上映射的虚拟机进行迁移,造成了不必要的迁移,浪费了虚拟资源。
发明内容
有鉴于此,本发明实施例提供一种虚拟机迁移方法、装置、电子设备和介质,能够准确预测部署虚拟机的宿主机的状态,避免误报,在预测出宿主机的状态为异常状态的情况下,及时对宿主机上部署的虚拟机进行迁移,避免业务损失。
根据本发明实施例的第一方面,提供了一种目标宿主机迁移方法,包括:
确定目标指标项,获取目标宿主机的所述目标指标项对应的指标数据;
利用预设的贝叶斯预警模型对所述指标数据集进行分析,确定所述目标宿主机的预测状态;
在确定所述目标宿主机的预测状态为异常状态的情况下,将映射在所述目标宿主机上的虚拟机进行迁移。
可选地,所述确定目标指标项,获取目标宿主机的所述目标指标项对应的指标数据包括:确定目标指标项,并确定所述目标指标项对应的多个阈值区间;针对每一阈值区间,访问目标宿主机的历史日志,从所述历史日志中获取历史指标阈值落在所述阈值区间内的目标指标数据;基于所述多个阈值区间内的目标指标数据,生成指标数据集。
可选地,所述确定目标指标项,并确定所述目标指标项对应的多个阈值区间,包括:确定指标阈值参考值;对所述指标阈值参考值进行增大处理,获得第一阈值,对所述指标阈值参考值进行缩小处理,获得第二阈值;对所述第一阈值和所述第二阈值组成的指标阈值参考值区间进行分割,得到多个阈值区间。
可选地,所述对所述第一阈值和所述第二阈值组成的指标阈值参考值区间进行分割,包括:按照预设步长,对所述第一阈值和所述第二阈值组成的指标阈值参考值区间进行分割。
可选地,所述利用预设的贝叶斯预警模型对所述指标数据集进行分析,确定所述目标宿主机的预测状态,包括:针对每一阈值区间,确定所述阈值区间内的目标指标数据中异常指标数据所占的比例;根据所述异常指标数据所占的比例,确定所述阈值区间对应的第一宿主状态;根据所述多个阈值区间对应的第一宿主状态,确定所述目标宿主机的预测状态。
可选地,所述目标指标项包括以下一项或多项:网络时延、内存使用率、CPU使用率、磁盘占用率、丢包率、风扇状态和电源状态。
可选地,所述根据所述多个阈值区间对应的第一宿主状态,确定所述目标宿主机的预测状态,包括:在所述目标指标项包括多项指标的情况下,针对每项指标,确定所述指标的多个阈值区间对应的第一宿主状态,确定所述指标对应的第二宿主状态;根据所述多项指标对应的第二宿主状态,确定所述目标宿主机的预测状态。
可选地,所述第一宿主状态包括正常状态或异常状态,所述第二宿主状态包括正常状态或异常状态,所述目标宿主机的当前状态包括正常状态或异常状态。
可选地,所述基于所述多个阈值区间内的目标指标数据,生成指标数据集包括:针对每一阈值区间,对所述阈值区间内的目标指标数据进行插值操作,得到指标插值数据;基于所述多个阈值区间对应的指标插值数据,生成指标数据集。
可选地,所述方法还包括:在所述目标宿主机的预测状态为异常状态的情况下,对所述目标宿主机进行异常溯源。
可选地,所述在所述目标宿主机的预测状态为异常状态的情况下,对所述目标宿主机进行异常溯源,包括:在所述目标宿主机的预测状态为异常状态的情况下,根据所述多项指标对应的第二宿主状态,确定是否满足异常溯源条件;在确定满足异常溯源条件的情况下,对所述目标宿主机进行异常溯源。
可选地,对所述目标宿主机进行异常溯源包括:基于预设的多维数据关联和威胁分析模型,对所述目标宿主机进行异常溯源。
根据本发明实施例的第二方面,提供了一种目标宿主机迁移装置,包括:
获取模块,用于确定目标指标项,获取目标宿主机的所述目标指标项对应的指标数据;
状态确定模块,用于利用预设的贝叶斯预警模型对所述指标数据集进行分析,确定所述目标宿主机的预测状态;
迁移模块,用于在确定所述目标宿主机的预测状态为异常状态的情况下,将映射在所述目标宿主机上的虚拟机进行迁移。
可选地,所述获取模块用于:确定目标指标项,并确定所述目标指标项对应的多个阈值区间;针对每一阈值区间,访问目标宿主机的历史日志,从所述历史日志中获取历史指标阈值落在所述阈值区间内的目标指标数据;基于所述多个阈值区间内的目标指标数据,生成指标数据集。
可选地,所述获取模块用于:确定指标阈值参考值;对所述指标阈值参考值进行增大处理,获得第一阈值,对所述指标阈值参考值进行缩小处理,获得第二阈值;对所述第一阈值和所述第二阈值组成的指标阈值参考值区间进行分割,得到多个阈值区间。
可选地,所述获取模块用于:按照预设步长,对所述第一阈值和所述第二阈值组成的指标阈值参考值区间进行分割。
可选地,所述状态确定模块用于:针对每一阈值区间,确定所述阈值区间内的目标指标数据中异常指标数据所占的比例;根据所述异常指标数据所占的比例,确定所述阈值区间对应的第一宿主状态;根据所述多个阈值区间对应的第一宿主状态,确定所述目标宿主机的预测状态。
可选地,所述状态确定模块用于:在所述目标指标项包括多项指标的情况下,针对每项指标,确定所述指标的多个阈值区间对应的第一宿主状态,确定所述指标对应的第二宿主状态;根据所述多项指标对应的第二宿主状态,确定所述目标宿主机的预测状态。
可选地,所述获取模块用于:针对每一阈值区间,对所述阈值区间内的目标指标数据进行插值操作,得到指标插值数据;基于所述多个阈值区间对应的指标插值数据,生成指标数据集。
可选地,所述装置还包括异常溯源模块,用于:在所述目标宿主机的预测状态为异常状态的情况下,对所述目标宿主机进行异常溯源。
可选地,所述异常溯源模块用于:在所述目标宿主机的预测状态为异常状态的情况下,根据所述多项指标对应的第二宿主状态,确定是否满足异常溯源条件;在确定满足异常溯源条件的情况下,对所述目标宿主机进行异常溯源。
可选地,所述异常溯源模块用于:基于预设的多维数据关联和威胁分析模型,对所述目标宿主机进行异常溯源。
根据本发明实施例的第三方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任一实施例的虚拟机迁移方法。
根据本发明实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明任一实施例的虚拟机迁移方法。
上述发明中的一个实施例具有如下优点或有益效果:
本发明实施例通过贝叶斯预警模型对宿主机的指标数据进行定量分析,能够客观地对宿主机的指标数据进行量化,准确预测宿主机的状态,降低了对目标宿主机故障的误判率,提高了虚拟化迁移的精准度,以及避免了因虚拟机迁移导致的目标宿主机上部署的业务中断造成的损失。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1示出了本发明实施例的虚拟机迁移方法的流程图;
图2示出了本发明另一实施例的虚拟机迁移方法的流程图;
图3示出了本发明又一实施例的虚拟机迁移方法的流程图;
图4示出了本发明实施例对异常的宿主机进行异常溯源的流程图;
图5示出了实现了本发明实施例的虚拟机迁移的系统平台的示意图;
图6示出了本发明实施例的虚拟机迁移装置的结构示意图;
图7示出了本发明实施例的电子设备的框图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1示出了本发明实施例的虚拟机迁移方法的流程图,如图1所示,该方法包括:
步骤S101:确定目标指标项,获取目标宿主机的所述目标指标项对应的指标数据。
在本实施例中,目标宿主机可以是网络中任意一个部署有虚拟机的物理机或物理服务器。虚拟机(Virtual Machine)指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。
目标指标项用于衡量目标宿主机的工作状态或性能。作为示例,目标指标项可以包括以下一项或多项:网络时延、内存使用率、CPU使用率、磁盘占用率、丢包率、风扇状态和电源状态。
在本步骤中,可以在目标宿主机启动运行时开启监测程序,实时或定时监测、采集目标宿主机的指标数据,并将采集的指标数据保存在数据库中或写入日志文件。在需要分析预测目标宿主机的状态或性能时,访问数据库或日志文件,从数据库或日志文件中获取目标宿主机的指标数据。
步骤S102:利用预设的贝叶斯预警模型对所述指标数据集进行分析,确定所述目标宿主机的预测状态。
其中,贝叶斯预警模型用于对目标宿主机的指标数据进行定量分析,对目标宿主机的状态进行预测。目标宿主机的预测状态包括异常状态或正常状态。
在可选的实施例中,可以采用贝叶斯算法构建贝叶斯预警模型,贝叶斯预警模型输出目标宿主机的预测状态:异常状态或正常状态。为便于描述,利用R1表示异常状态,R2表示正常状态。步骤S101获取的指标数据表示为T={t1,t2,t3…tn}。
根据条件概率公式,在满足特征值ti的条件下,疑似异常被判为R1的概率表示为:
Figure BDA0003970849840000061
其中,P(ti|R1)表示在指标数据集中的异常指标中出现特征值ti的概率,P(R1)表示整个指标数据集中异常指标所占的比重。
同理,在满足特征值ti的条件下,疑似异常被判为R2的概率表示为:
Figure BDA0003970849840000062
其中,P(ti|R2)表示在指标数据集中的正常指标中出现特征值ti的概率,P(R2)表示整个指标数据集中正常指标所占的比重。
由于贝叶斯的思想,每一个特征值ti之间是相互独立的,根据相对独立事件概率的计算方法,计算出疑似异常被判为正常指标的概率与疑似异常被判为异常指标的概率后,比较两个概率的大小,如果异常指标的概率大于正常指标的概率,则认为所监测的指标异常,反之,则为正常。
在本实施例中,目标指标项包括以下一项或多项:网络时延、内存使用率、CPU使用率、磁盘占用率、丢包率、风扇状态和电源状态。以CPU使用率为例进行说明,假设步骤S101获取的指标数据中包括M个CPU使用率,M为大于1的整数,利用贝叶斯预警模型判断M个CPU使用率中每个CPU使用率被判为异常指标的概率,从而确定每个CPU使用率是否为异常指标。在确定每个CPU使用率是否为异常指标后,根据M个CPU使用率中异常指标的占比,确定目标宿主机的预测状态。例如,在M个CPU使用率中异常指标的占比大于或等于预设值时,确定目标宿主机的预测状态为异常状态。当目标指标项包括多项指标的指标数据,则综合该多项指标中异常指标的占比来确定目标宿主机的预测状态。例如,当步骤S101确定的目标指标项包括四项指标:网络时延、内存使用率、CPU使用率、磁盘占用率。针对每一项指标,分别判断该指标中异常指标的占比,若该四项指标中有两项指标的异常指标的占比超过相应的预设值,则可以确定目标宿主机的预测状态为异常状态。
步骤S103:在确定所述目标宿主机的预测状态为异常状态的情况下,将映射在所述目标宿主机上的虚拟机进行迁移。
在本步骤中,在确定目标宿主机的当前状态为异常状态(或故障状态)的情况下,将映射在目标宿主机上的虚拟机进行线上迁移,将该目标宿主机上部署的虚拟机机迁移到正常的物理机上,以避免目标宿主机上的虚拟机发生业务中断,避免业务损失。
本发明实施例的虚拟机迁移方法,通过贝叶斯预警模型对宿主机的指标数据进行定量分析,能够客观地对宿主机的指标数据进行量化,准确预测宿主机的状态,降低了对目标宿主机故障的误判率,提高了虚拟化迁移的精准度,以及避免了因虚拟机迁移导致的目标宿主机上部署的业务中断造成的损失。
图2示意性示出了本发明另一实施例的虚拟机迁移方法的流程图,如图2所示,该方法包括:
步骤S201:确定目标指标项,并确定所述目标指标项对应的多个阈值区间。
在可选的实施例中,可以根据如下过程确定目标指标项对应的多个阈值区间:
确定指标阈值参考值;
对所述指标阈值参考值进行增大处理,获得第一阈值,对所述指标阈值参考值进行缩小处理,获得第二阈值;
对所述第一阈值和所述第二阈值组成的指标阈值参考值区间进行分割,得到多个阈值区间。
其中,指标阈值参考值可以根据应用场景需求设置。在目标指标项包括多项指标时,可以针对每一项指标设置对应的指标阈值参考值,不同的指标对应的指标阈值参考值可以相同,也可以不同。例如,在目标指标项包括内存使用率和CPU使用率时,可以设置内存使用率对应的指标阈值参考值为第一数值(例如76%),CPU使用率对应的指标阈值参考值为第二数值(例如80%)。
对指标阈值参考值进行增大处理以及缩小处理,是对指标阈值参考值进行上下浮动,得到指标阈值参考值区间。例如,CPU使用率对应的指标阈值参考值为80%,对80%进行上下浮动,浮动的范围为10%,即第一阈值为90%,第二阈值为70%,得到的指标阈值参考值区间为[70%,90%]。在得到指标阈值参考值区间后,可以对该指标阈值参考值区间进行分割,获得多个阈值区间。在对指标阈值参考值区间进行分割时,可以按照预设步长进行分割,即对指标阈值参考值区间进行均分。例如,按照步长为2%对指标阈值参考值区间[70%,90%]进行分割,获得10个阈值区间,分别为:[70%,72%]、(72%,74%]、(74%,76%]、(76%,78%]…(88%,90%]。
在目标指标项包括多项指标的情况下,每项指标的上下浮动范围可以相同,分割的步长也可以相同,例如每项指标都上下浮动10%,都以2%为步长进行分割。
步骤S202:针对每一阈值区间,访问目标宿主机的历史日志,从所述历史日志中获取历史指标阈值落在所述阈值区间内的目标指标数据。
在本发明实施例中,可以在目标宿主机启动运行时开启监测程序,实时或定时监测、采集目标宿主机的指标数据,并将采集的指标数据保存在数据库中或写入日志文件。在监测、采集目标宿主机的同时,可以设置指标阈值(还指标阈值即为历史指标阈值),该指标阈值可以用于判断监测到的指标数据是否正常。例如,对于CPU使用率这一指标,可以设置指标阈值为80%,若监测到的CPU使用率大于或等于80%,则可以判断监测到的CPU使用率异常,若监测到的CPU使用率小于80%,则可以判断监测到的CPU使用率正常。对于不同的指标,其对应的指标阈值可以相同也可以不同,本发明在此不做限制。在监测、采集目标宿主机的指标数据时,还可以对设置的指标阈值灵活变更。例如,在某一时期或某些业务下,CPU使用率对应的指标阈值为80%,在另一个时期或另一业务下,CPU使用率对应的指标阈值为70%。监测采集的指标数据可以表示为{(指标项:指标阈值:采集时间):指标数据、指标数据…},例如{(CPU使用率:80%:11月1日):79%、79%、70%、81%、60%}。
针对每一阈值区间,访问目标宿主机的历史日志,确定落在所述指标阈值区间内的历史指标阈值对应的指标数据,将该指标数据作为该指标阈值区间对应的目标指标数据。例如,对于阈值区间(76%,78%],确定历史指标阈值在(76%,78%]内的指标数据,将该指标数据作为指标阈值区间(76%,78%]对应的目标指标数据。
步骤S203:基于所述多个阈值区间内的目标指标数据,生成指标数据集。
在本步骤中,多个指标阈值区间对应多组目标指标数据,多组目标指标数据构成目标宿主机的指标数据集。例如,假设CPU使用率这一指标对应10个指标阈值区间,则获得10组目标指标数据,对于内存使用率这一指标同样获得10组目标指标数据,CPU使用率对应的10组目标指标数据以及内存使用率对应的10组目标指标数据,构成目标宿主机的指标数据集。
步骤S204:利用预设的贝叶斯预警模型对所述指标数据集进行分析,确定所述目标宿主机的预测状态。
在本步骤中,可以根据如下过程确定目标宿主机的预测状态:
针对每一阈值区间,确定所述阈值区间内的目标指标数据中异常指标数据所占的比例;
根据所述异常指标数据所占的比例,确定所述阈值区间对应的第一宿主状态;
根据所述多个阈值区间对应的第一宿主状态,确定所述目标宿主机的预测状态。
针对每一阈值区间,利用贝叶斯预警模型对该阈值区间对应的目标指标数据进行分析,判断每一目标指标数据是否为异常指标,从而确定该目标指标数据中异常指标数据所占的比例。在异常指标数据所占的比例大于或等于第一比值时,可以确定该阈值区间对应的第一宿主状态为异常状态,在异常指标数据所占的比例小于第一比值时,可以确定该阈值区间内对应的第一宿主状态为正常状态。对于多个阈值区间,若该多个阈值区间中第一宿主状态为异常状态的阈值区间的占比大于或等于第二比值时,可以确定该目标宿主机的预测状态为异常状态。
作为具体的示例,假设目标指标项仅包含CPU使用率一项指标,该项指标对应10个阈值区间,相应的目标指标数据有10组,第一比值为50%,第二比值为30%。对于第一组目标指标数据,若该组目标指标数据中异常指标所占的比例为60%,则确定该组目标指标数据对应的第一宿主状态为异常状态。对于第二组目标指标数据,若该组目标指标数据中异常指标所占的比例为30%,则该组目标指标数据对应的第一宿主状态为正常状态。若10组目标指标数据中,有3组或大于3组的目标指标数据对应的第一宿主状态为异常状态,则该目标宿主机的预测状态为异常状态。
在目标指标项包括多项指标的情况下,可以根据每个指标的目标指标数据对应的第一宿主状态,综合判断目标宿主机的预测状态。具体的,针对每项指标,可以根据指标的多个阈值区间对应的第一宿主状态,确定该指标对应的第二宿主状态;根据多项指标对应的第二宿主状态,确定目标宿主机的预测状态。对于每一指标,可以根据第一宿主状态为异常状态的指标的占比,确定该指标对应的第二宿主状态。例如,当第一宿主状态为异常状态的指标的占比大于或等于第三比值,则确定该指标对应的第二宿主状态为异常状态,当第一宿主状态为异常状态的指标的占比小于第三比值,则确定该指标对应的第二宿主状态为正常状态。根据第二宿主状态为异常状态的指标的占比,确定目标宿主机的预测状态,例如,当第二宿主状态为异常状态的指标的占比大于或等于第四比值,确定目标宿主机的预测状态为异常状态,当第二宿主状态为异常状态的指标的占比小于第四比值,确定目标宿主机的预测状态为正常状态。作为具体的示例,假设目标指标项包括:网络时延、内存使用率、CPU使用率、磁盘占用率、丢包率。每项指标对应10个阈值区间,相应的目标指标数据有10组,第三比值为50%,第四比值为30%。对于网络延时这一指标,若该指标对应的10组目标指标数据中,有5组目标指标数据对应的第一宿主状态为异常状态,则对于该指标,第一宿主状态为异常状态的指标的占比大于第三比值,该指标对应的第二宿主状态为异常状态。若上述五项指标中,有3项指标对应的第二宿主状态为异常状态,则第二宿主状态为异常状态的指标的占比大于第四比值,则确定目标宿主机的预测状态为异常状态。
步骤S205:在确定所述目标宿主机的预测状态为异常状态的情况下,将映射在所述目标宿主机上的虚拟机进行迁移。
在本步骤中,在确定目标宿主机的当前状态为异常状态(或故障状态)的情况下,将映射在目标宿主机上的虚拟机进行线上迁移,以避免目标宿主机上的虚拟机发生业务中断,避免业务损失。
本发明实施例的虚拟机迁移方法,通过设置阈值区间对目标宿主机的指标数据进行网格化划分,然后利用贝叶斯预警模型分别对网格化划分的指标数据进行定量分析,能够客观地对宿主机的指标数据进行量化,准确预测宿主机的状态,降低了对目标宿主机故障的误判率,提高了虚拟化迁移的精准度,以及避免了因虚拟机迁移导致的目标宿主机上部署的业务中断造成的损失。
在可选的实施中,为解决不同目标宿主机获取的指标数据不均匀的问题,可以对目标宿主机的指标数据进行插值处理,以使各个目标宿主机的指标数据的数量相同,从而便于贝叶斯预警模型处理。具体的,该方法可以针对每一阈值区间内的目标指标数据进行插值操作,得到指标插值数据;基于多个阈值区间对应的指标插值数据,生成指标数据集。在可选的实施例中,可以基于二次插值方法对目标指标数据进行插值操作。
图3示出了本发明另一实施例的虚拟机迁移方法的流程图,如图3所示,该方法包括:
步骤S301:确定目标指标项,获取目标宿主机的所述目标指标项对应的指标数据。
步骤S302:利用预设的贝叶斯预警模型对所述指标数据集进行分析,确定所述目标宿主机的预测状态;
步骤S303:在确定所述目标宿主机的预测状态为异常状态的情况下,将映射在所述目标宿主机上的虚拟机进行迁移。
步骤S304:在所述目标宿主机的预测状态为异常状态的情况下,对所述目标宿主机进行异常溯源。
其中,步骤S301-步骤S304可以参考图1-图2所示的实施例,本发明在此不再赘述。
对于步骤S304,在确定目标宿主机的状态为异常状态的情况下,可以直接对目标宿主机进行异常溯源,也可以根据多项指标对应的第二宿主状态,确定是否满足异常溯源条件;在确定满足异常溯源条件的情况下,对目标宿主机进行异常溯源。
其中,异常溯源条件可以预先设置,并灵活变更。作为示例,若网络时延这一指标对应的第二宿主状态为异常状态,且内存使用率、CPU使用率、磁盘占用率中的一项或多项指标对应的第二宿主状态为异常状态,可以确定满足异常溯源条件。
在可选的实施例中,可以基于预设的多维数据关联和威胁分析模型,对目标宿主机进行异常溯源。其中,多维数据关联和威胁分析模型(Multi-dimensional DataAssociation and Threat Analysis,简称MDATA模型或MDATA网络安全知识库)用于解决网络安全态势感知中数据分布广、网络安全知识因具有时空特性而难以表示的难题。
图4示意性示出了根据MDATA模型对的目标宿主机进行异常溯源的流程图,如图4所示,对目标宿主机进行异常溯源包括:
步骤S401:根据目标宿主机标识确定对应的网络安全知识库。在本实施例中,目标宿主机标识可以为宿主机IP。
步骤S402:在所述网络安全知识库中,确定所述目标宿主机相关联的主机资产。
步骤S403:查询所述目标主机资产的漏洞,确定所述漏洞对应的攻击的溯源策略。
在本实施例中,根据异常的目标宿主机IP,查询到对应的MDATA网络安全知识库,以IP关联的主机资产维度为基础,溯源人员可以根据某个疑似被攻击的主机资产,查询该主机资产具有的漏洞,通过漏洞寻找与该漏洞相关联的攻击威胁获取有关攻击的溯源策略。溯源人员执行溯源策略,就可以溯源到攻击源。其中,主机资产可以包括:(1)主机基本信息:包括主机名,主机IP等,还包括主机管理信息(业务组,负责人,机房位置,标签)、固定资产编号;(2)系统硬件清理:包括系统内核,CPU,内存,硬盘,磁盘使用分布等各类硬件信息;(3)所有安装的软件:包括应用程序、驱动程序、实用程序和插件以及各自的版本;(4)虚拟环境细节,包括镜像;(5)批准的用户账户,并记录他们的登录状态;(6)开放的端口。
溯源人员可以以某种攻击威胁为基础,可通过五元组(源地址、目的地址、源端口、目的端口、协议),来确定某种攻击威胁。通过查询MDATA网络安全知识库,执行与该攻击威胁相对应的溯源策略,找出攻击所留下的痕迹和位置,最后定位到被攻击的主机资产。在定位到被攻击的主机资产后,以五元组(源地址、目的地址、源端口、目的端口、协议)为查询条件查询MDATA网络安全知识库,获取该被攻击的主机资产的溯源策略集合S={S1,S2,…,Si}(i≥1),然后遍历该集合。对于每一溯源策略,判断溯源策略的类型是否为关联溯源策略,判断溯源策略的类型是否是关联溯源;若是,以溯源策略的子策略作为参数递归执行溯源算法,得到第一溯源结果;若不是,执行该溯源策略,得到第二溯源结果;根据所述溯源策略的类型输出第一溯源结果或者第二溯源结果。例如,若某个策略S_{i}的类型为工具溯源类型,则首先查询与该溯源策略关联的依赖信息D={D1,D2,…,Dj}(j≥1),即与该溯源策略关联的痕迹和位置,然后把得到的痕迹和位置的信息分别保存到e和d变量中,根据溯源策略的process属性和e、d变量,执行攻击溯源策略,最终将获得的溯源结果Ri,放入溯源结果集R={R1,R2,…,Ri}(i≥1)。若某个策略的类型为关联溯源策略,则首先通过查询MDATA网络安全知识库,获取该策略的子策略集合
Figure BDA0003970849840000141
然后以子策略
Figure BDA0003970849840000142
作为参数,递归执行该溯源算法,获得溯源结果
Figure BDA0003970849840000143
将该溯源结果
Figure BDA0003970849840000144
放入溯源结果集R中,最后返回溯源结果集合R。该算法是以主机资产维度作为溯源起点的。
在本发明实施例中,对异常的宿主机进行异常溯源时,可以根据MDATA网络安全知识库的任何一个维度进行查询,得到相应的溯源策略,判断该溯源策略的类型是否是关联溯源,若是关联溯源,则以子策略为输入递归地执行该算法,否则执行该溯源策略,得到溯源结果,最后根据溯源策略的类型输出溯源结果。
本发明实施例可对异常的宿主机进行溯源,进而确定攻击源,以及识别出有威胁的攻击,使得虚拟机迁移的管理更加智能、有效。
为便于理解本发明实施例的虚拟机迁移方法,以下述示例为例进行说明。
图5示出了实现本发明实施例的虚拟迁移方法的系统平台的示意图,如图5所示,本发明实施例的多云迁移的管理方法实现的系统平台500包括:多云管理平台501、虚拟机迁移平台502,该虚拟机迁移平台用于执行本发明实施例的虚拟机迁移方法。
多云管理平台501用于监测所有部署有虚拟机的宿主机的指标数据。虚拟机迁移平台502执行本发明实施例的虚拟迁移方法,对宿主机的指标数据进行分析,预测宿主机的状态。虚拟机迁移平台502预测宿主机的状态为异常状态的情况下,可以通过云管理平台的openapi(开放接口)将虚拟机迁移到其他健康的宿主机上,从而避免虚拟机上部署的业务中断造成的损失。
图6示出了本发明实施例的虚拟机迁移装置600的结构示意图,如图6所示,该虚拟机迁移装置600包括:
获取模块601,用于确定目标指标项,获取目标宿主机的所述目标指标项对应的指标数据;
状态确定模块602,用于利用预设的贝叶斯预警模型对所述指标数据集进行分析,确定所述目标宿主机的预测状态;
迁移模块603,用于在确定所述目标宿主机的预测状态为异常状态的情况下,将映射在所述目标宿主机上的虚拟机进行迁移。
可选地,所述获取模块用于:确定目标指标项,并确定所述目标指标项对应的多个阈值区间;针对每一阈值区间,访问目标宿主机的历史日志,从所述历史日志中获取历史指标阈值落在所述阈值区间内的目标指标数据;基于所述多个阈值区间内的目标指标数据,生成指标数据集。
可选地,所述获取模块用于:确定指标阈值参考值;对所述指标阈值参考值进行增大处理,获得第一阈值,对所述指标阈值参考值进行缩小处理,获得第二阈值;对所述第一阈值和所述第二阈值组成的指标阈值参考值区间进行分割,得到多个阈值区间。
可选地,所述获取模块用于:按照预设步长,对所述第一阈值和所述第二阈值组成的指标阈值参考值区间进行分割。
可选地,所述状态确定模块用于:针对每一阈值区间,确定所述阈值区间内的目标指标数据中异常指标数据所占的比例;根据所述异常指标数据所占的比例,确定所述阈值区间对应的第一宿主状态;根据所述多个阈值区间对应的第一宿主状态,确定所述目标宿主机的预测状态。
可选地,所述状态确定模块用于:在所述目标指标项包括多项指标的情况下,针对每项指标,确定所述指标的多个阈值区间对应的第一宿主状态,确定所述指标对应的第二宿主状态;根据所述多项指标对应的第二宿主状态,确定所述目标宿主机的预测状态。
可选地,所述获取模块用于:针对每一阈值区间,对所述阈值区间内的目标指标数据进行插值操作,得到指标插值数据;基于所述多个阈值区间对应的指标插值数据,生成指标数据集。
可选地,所述装置还包括异常溯源模块,用于:在所述目标宿主机的预测状态为异常状态的情况下,对所述目标宿主机进行异常溯源。
可选地,所述异常溯源模块用于:在所述目标宿主机的预测状态为异常状态的情况下,根据所述多项指标对应的第二宿主状态,确定是否满足异常溯源条件;在确定满足异常溯源条件的情况下,对所述目标宿主机进行异常溯源。
可选地,所述异常溯源模块用于:基于预设的多维数据关联和威胁分析模型,对所述目标宿主机进行异常溯源。
上述装置可执行本发明实施例所提供的装置,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现如下步骤:确定目标指标项,获取目标宿主机的所述目标指标项对应的指标数据;利用预设的贝叶斯预警模型对所述指标数据集进行分析,确定所述目标宿主机的预测状态;在确定所述目标宿主机的预测状态为异常状态的情况下,将映射在所述目标宿主机上的虚拟机进行迁移。
上述终端提到的通信总线704可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线704可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口702用于上述终端与其他设备之间的通信。
存储器703可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器701的存储装置。
上述的处理器701可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读介质,该计算机可读介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的虚拟机迁移方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的虚拟机迁移方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (15)

1.一种虚拟机迁移方法,其特征在于,包括:
确定目标指标项,获取目标宿主机的所述目标指标项对应的指标数据,生成指标数据集;
利用预设的贝叶斯预警模型对所述指标数据集进行分析,确定所述目标宿主机的预测状态;
在确定所述目标宿主机的预测状态为异常状态的情况下,将映射在所述目标宿主机上的虚拟机进行迁移。
2.根据权利要求1所述的方法,其特征在于,所述确定目标指标项,获取目标宿主机的所述目标指标项对应的指标数据,生成指标数据集,包括:
确定目标指标项,并确定所述目标指标项对应的多个阈值区间;
针对每一阈值区间,访问目标宿主机的历史日志,从所述历史日志中获取历史指标阈值落在所述阈值区间内的目标指标数据;
基于所述多个阈值区间内的目标指标数据,生成指标数据集。
3.根据权利要求2所述的方法,其特征在于,所述确定目标指标项,并确定所述目标指标项对应的多个阈值区间,包括:
确定指标阈值参考值;
对所述指标阈值参考值进行增大处理,获得第一阈值,对所述指标阈值参考值进行缩小处理,获得第二阈值;
对所述第一阈值和所述第二阈值组成的指标阈值参考值区间进行分割,得到多个阈值区间。
4.根据权利要求3所述的方法,其特征在于,所述对所述第一阈值和所述第二阈值组成的指标阈值参考值区间进行分割,包括:按照预设步长,对所述第一阈值和所述第二阈值组成的指标阈值参考值区间进行分割。
5.根据权利要求3所述的方法,其特征在于,所述利用预设的贝叶斯预警模型对所述指标数据集进行分析,确定所述目标宿主机的预测状态,包括:
针对每一阈值区间,确定所述阈值区间内的目标指标数据中异常指标数据所占的比例;
根据所述异常指标数据所占的比例,确定所述阈值区间对应的第一宿主状态;
根据所述多个阈值区间对应的第一宿主状态,确定所述目标宿主机的预测状态。
6.根据权利要求5所述的方法,其特征在于,所述目标指标项包括以下一项或多项:网络时延、内存使用率、CPU使用率、磁盘占用率、丢包率、风扇状态和电源状态。
7.根据权利要求6所述的方法,其特征在于,所述根据所述多个阈值区间对应的第一宿主状态,确定所述目标宿主机的预测状态,包括:
在所述目标指标项包括多项指标的情况下,针对每项指标,确定所述指标的多个阈值区间对应的第一宿主状态,确定所述指标对应的第二宿主状态;
根据所述多项指标对应的第二宿主状态,确定所述目标宿主机的预测状态。
8.根据权利要求7所述的方法,其特征在于,所述第一宿主状态包括正常状态或异常状态,所述第二宿主状态包括正常状态或异常状态。
9.根据权利要求2-7任一项所述的方法,其特征在于,所述基于所述多个阈值区间内的目标指标数据,生成指标数据集包括:
针对每一阈值区间,对所述阈值区间内的目标指标数据进行插值操作,得到指标插值数据;
基于所述多个阈值区间对应的指标插值数据,生成指标数据集。
10.根据权利要求7所述的方法,其特征在于,所述方法还包括:
在所述目标宿主机的预测状态为异常状态的情况下,对所述目标宿主机进行异常溯源。
11.根据权利要求10所述的方法,其特征在于,所述在所述目标宿主机的预测状态为异常状态的情况下,对所述目标宿主机进行异常溯源,包括:
在所述目标宿主机的预测状态为异常状态的情况下,根据所述多项指标对应的第二宿主状态,确定是否满足异常溯源条件;
在确定满足异常溯源条件的情况下,对所述目标宿主机进行异常溯源。
12.根据权利要求10或11所述的方法,其特征在于,对所述目标宿主机进行异常溯源包括:
基于预设的多维数据关联和威胁分析模型,对所述目标宿主机进行异常溯源。
13.一种虚拟机迁移装置,其特征在于,包括:
获取模块,用于确定目标指标项,获取目标宿主机的所述目标指标项对应的指标数据;
状态确定模块,用于利用预设的贝叶斯预警模型对所述指标数据集进行分析,确定所述目标宿主机的预测状态;
迁移模块,用于在确定所述目标宿主机的预测状态为异常状态的情况下,将映射在所述目标宿主机上的虚拟机进行迁移。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一所述的方法。
15.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-12中任一所述的方法。
CN202211532699.7A 2022-11-29 2022-11-29 虚拟机迁移方法、装置、电子设备和介质 Pending CN116010023A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211532699.7A CN116010023A (zh) 2022-11-29 2022-11-29 虚拟机迁移方法、装置、电子设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211532699.7A CN116010023A (zh) 2022-11-29 2022-11-29 虚拟机迁移方法、装置、电子设备和介质

Publications (1)

Publication Number Publication Date
CN116010023A true CN116010023A (zh) 2023-04-25

Family

ID=86020663

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211532699.7A Pending CN116010023A (zh) 2022-11-29 2022-11-29 虚拟机迁移方法、装置、电子设备和介质

Country Status (1)

Country Link
CN (1) CN116010023A (zh)

Similar Documents

Publication Publication Date Title
US10878102B2 (en) Risk scores for entities
EP3745272B1 (en) An application performance analyzer and corresponding method
US9392022B2 (en) Methods and apparatus to measure compliance of a virtual computing environment
US11316851B2 (en) Security for network environment using trust scoring based on power consumption of devices within network
JP5874936B2 (ja) 運用管理装置、運用管理方法、及びプログラム
US20190065738A1 (en) Detecting anomalous entities
US20190095266A1 (en) Detection of Misbehaving Components for Large Scale Distributed Systems
US8949676B2 (en) Real-time event storm detection in a cloud environment
US10938847B2 (en) Automated determination of relative asset importance in an enterprise system
Bhaduri et al. Detecting abnormal machine characteristics in cloud infrastructures
Mallick et al. A resource prediction model for virtualization servers
US10637878B2 (en) Multi-dimensional data samples representing anomalous entities
US9397921B2 (en) Method and system for signal categorization for monitoring and detecting health changes in a database system
JP2015194797A (ja) 監視漏れ特定処理プログラム,監視漏れ特定処理方法及び監視漏れ特定処理装置
RU180789U1 (ru) Устройство аудита информационной безопасности в автоматизированных системах
CN117931589A (zh) 运维故障的识别方法及装置
JP2017199250A (ja) 計算機システム、データの分析方法、及び計算機
US11757736B2 (en) Prescriptive analytics for network services
CN116010023A (zh) 虚拟机迁移方法、装置、电子设备和介质
Sapegin et al. Evaluation of in‐memory storage engine for machine learning analysis of security events
Zhang et al. A security monitoring method based on autonomic computing for the cloud platform
Jha et al. Holistic measurement-driven system assessment
Matsuki et al. A resource contention analysis framework for diagnosis of application performance anomalies in consolidated cloud environments
US11036561B2 (en) Detecting device utilization imbalances
Arefin et al. Cloudinsight: Shedding light on the cloud

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination