CN115827148A - 一种资源管理方法、装置、电子设备及存储介质 - Google Patents

一种资源管理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115827148A
CN115827148A CN202211028516.8A CN202211028516A CN115827148A CN 115827148 A CN115827148 A CN 115827148A CN 202211028516 A CN202211028516 A CN 202211028516A CN 115827148 A CN115827148 A CN 115827148A
Authority
CN
China
Prior art keywords
virtual machine
node
cloud disk
management device
migration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211028516.8A
Other languages
English (en)
Inventor
黄健
陈伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision System Technology Co Ltd
Original Assignee
Hangzhou Hikvision System Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision System Technology Co Ltd filed Critical Hangzhou Hikvision System Technology Co Ltd
Priority to CN202211028516.8A priority Critical patent/CN115827148A/zh
Publication of CN115827148A publication Critical patent/CN115827148A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种资源管理方法、装置、电子设备及存储介质,涉及数据存储技术领域,能够减小IO的网络延迟,当节点故障时,减少虚拟机影响范围,对系统性能影响较小,维护简单。方法应用于超融合系统中的虚拟机管理装置,虚拟机管理装置用于管理超融合系统中至少两个节点上部署的虚拟机,方法包括:响应于创建虚拟机的任务,在至少两个节点中的第一节点上创建第一虚拟机;向超融合系统中的分布式存储管理装置发送第一指示信息,第一指示信息用于指示分布式存储管理装置在第一节点上创建第一云盘;将第一节点中的第一云盘挂载在第一节点中的第一虚拟机上;其中,第一云盘与第一虚拟机之间通过本地磁盘通信协议通信。

Description

一种资源管理方法、装置、电子设备及存储介质
技术领域
本申请涉及数据存储技术领域,尤其涉及一种资源管理方法、装置、电子设备及存储介质。
背景技术
业务上云是当前软件发展的一大主流趋势,越来越多的产品和模块选择部署到公有云或私有云平台上,超融合技术是目前较为先进的云计算技术。超融合是使用软件将计算、存储、网络布属在同一张以太网下,实现生命周期自动化和全网智能运维。一般云平台会提供物理节点异常情况下的虚拟机迁移策略,以保证用户业务的快速恢复和业务的高可用性。而虚拟机的迁移在设计和实现上,对底层存储系统所提供的云盘有着较大的依赖。当前的云平台一般会采购独立的存储局域网络(internet protocol storage areanetwork,IPSAN)存储系统,采用因特网小型计算机系统接口(internet small computersystem interface,iSCSI)协议为云平台的虚拟机提供云盘服务。
当前云平台中,计算资源和存储资源分别由两个系统各自管理,在计算和存储资源的调度上存在割裂。在超融合架构下,云计算系统和存储系统融合部署在一套设备上的时候,会出现节点A上虚拟机所使用的云盘是由节点B上的存储服务提供的,该情况下,虚拟机访问云盘时需要跨节点访问,增加了IO的网络延迟。
另外,当节点B出现故障时,节点B上的虚拟机和云盘均需要根据虚拟机迁移策略进行迁移,此时,除了节点B上的虚拟机受到影响之外,节点A上使用节点B存储服务提供的云盘的虚拟机也会受到影响。也就是说,在超融合架构下,当计算和存储资源的调度上存在一定的割裂时,当节点出现故障,会有较多的虚拟机受到影响,从而对系统性能影响较大,且维护困难。
发明内容
本申请提供了一种资源管理方法、装置、电子设备及存储介质,能够减小IO的网络延迟,当节点故障时,减少虚拟机影响范围,对系统性能影响较小,维护简单。
为实现上述技术目的,本申请采用如下技术方案:
第一方面,本申请实施例提供了一种资源管理方法,该方法应用于超融合系统中的虚拟机管理装置,虚拟机管理装置用于管理至少两个节点上部署的虚拟机,该方法包括:响应于创建虚拟机的任务,在至少两个节点中的第一节点上创建第一虚拟机;向超融合系统中的分布式存储管理装置发送第一指示信息,第一指示信息用于指示分布式存储管理装置在第一节点上创建第一云盘;虚拟机管理装置将第一节点中的第一云盘挂载在第一节点中的第一虚拟机上;其中,第一云盘与第一虚拟机之间通过本地磁盘通信协议通信。
可以理解的是,虚拟机管理装置所管理的虚拟机和云盘的创建位置在同一个节点上,分布式存储管理装置在虚拟机管理装置的指示下,在指定节点创建云盘,该方法使得虚拟机和对应挂载的云盘在同一个节点上,不存在跨节点挂载的现象,使用的是本地磁盘通信协议通信,不需要经过TCP/IP网络,IO路径减少,减小IO的网络延迟。当其中一个节点出现故障时,只有该节点上的虚拟机和该节点上的云盘受到影响,其他节点上的虚拟机不受影响,降低了影响范围,从而降低了维修难度。
在一种可能的实现方式中,虚拟机管理装置在检测到第一节点异常时,确定第一虚拟机迁移策略;其中,第一虚拟机迁移策略用于表征将第一节点上的第一虚拟机迁移到至少两个节点中的第二节点;基于第一虚拟机迁移策略确定第一云盘迁移策略;其中,第一云盘迁移策略用于表征将第一云盘迁移到第二节点;向分布式存储管理装置发送第二指示信息;其中,第二指示信息用于指示按照第一云盘迁移策略在第二节点上创建第一云盘;基于第一虚拟机迁移策略,在第二节点上创建第一虚拟机;将第二节点中的第一云盘挂载在第二节点中的第一虚拟机上。
可以理解的是,当节点出现异常时,需要将节点上的虚拟机和云盘迁移到其他虚拟机上,本方法迁移的思想是将虚拟机和云盘迁移到同一个节点上,有利于虚拟机和云盘通信时,减小IO的网络延迟,当该节点出现故障时,对其他节点虚拟机和云盘不产生影响,降低影响范围。
在另一种可能的实现方式中,在上述向分布式存储管理装置发送第二指示信息之后,方法还包括:接收分布式存储管理装置发送的响应消息;当响应消息用于指示第一虚拟机迁移失败时,确定第二虚拟机迁移策略;其中,第二虚拟机迁移策略用于表征将第一节点上的第一虚拟机迁移到至少两个节点中的第三节点;基于第二虚拟机迁移策略,确定第二云盘迁移策略;其中,第二云盘迁移策略用于表征将第一云盘迁移到第三节点;向分布式存储管理装置发送第三指示信息;其中,第三指示信息用于指示按照第二云盘迁移策略在第三节点上创建第一云盘;基于第二虚拟机迁移策略,在第三节点上创建第一虚拟机;将第三节点中的第一云盘挂载在第三节点中的第一虚拟机上。
可以理解的是,当上述虚拟机迁移过程中,在第二节点创建云盘失败后,该述虚拟机迁移到第二节点失败,此时分布式存储管理装置向虚拟机管理装置发送云盘创建失败的响应消息。该响应消息有助于虚拟机管理装置及时得到云盘创建失败的消息,从而及时确定新的虚拟机迁移策略。该响应消息有利于提高虚拟机迁移效率,降低因节点异常带来的影响。
在另一种可能的实现方式中,向分布式存储管理装置发送第一指示信息,包括:通过资源调度装置向分布式存储管理装置发送第一指示信息;其中,资源调度装置用于管理至少一个分布式存储管理装置以及至少一个虚拟机管理装置。
可以理解的是,通过该资源调度装置,可以打通虚拟机管理装置和分布式存储模块之间的资源调度,达到计算资源和存储资源统一调度的效果,减少各自管理带来的弊端,提高管理效率。
在另一种可能的实现方式中,本地磁盘通信协议包括SCSI通信协议。
可以理解的是,第一虚拟机与第一云盘之间通过SCSI协议进行通信,虚拟机就像使用本地磁盘一样使用云盘,不需要经过TCP/IP网络,IO路径减少,IO数据传输效率提高。
第二方面,本申请实施例提供了一种资源管理方法,该方法应用于超融合系统中的分布式存储管理装置,该方法包括:虚拟机管理装置用于管理超融合系统中至少两个节点上部署的虚拟机,虚拟机管理装置在超融合系统中至少两个节点中的第一节点上创建有第一虚拟机,第一指示信息用于指示分布式存储管理装置在第一节点上创建第一云盘;基于第一指示信息控制第一节点创建第一云盘以由虚拟机管理装置将第一云盘挂载在第一虚拟机上;其中,第一云盘与第一虚拟机之间通过本地磁盘通信协议通信。
可以理解的是,分布式存储管理装置依据虚拟机管理装置发送的指示消息创建云盘,使得系统的计算资源和存储资源统一管理起来,减少各自管理带来的弊端,提高管理效率。
第三方面,本申请提供一种虚拟机管理装置。该虚拟机管理装置包括应用于第一方面或第一方面中任一种可能的设计方式的方法的各个模块。
第四方面,本申请提供一种分布式存储管理装置。该分布式存储管理装置包括应用于第二方面或第二方面中任一种可能的设计方式的方法的各个模块。
第五方面,本申请提供一种电子设备,包括存储器和处理器。存储器和处理器耦合;存储器用于存储计算机程序代码,计算机程序代码包括计算机指令。当处理器执行该计算机指令时,使得该电子设备执行如第一方面及其任一种可能的设计方式的资源管理方法;或者,当处理器执行该计算机指令时,使得该电子设备执行如第二方面及其任一种可能的设计方式的资源管理方法。
第六方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质包括计算机指令。其中,当计算机指令在电子设备上运行时,使得该电子设备执行如第一方面及其任一种可能的设计方式的资源管理方法;或者,当计算机指令在电子设备上运行时,使得该电子设备执行如第二方面及其任一种可能的设计方式的资源管理方法。
第七方面,本申请提供一种计算机程序产品,该计算机程序产品包括计算机指令。其中,当计算机指令在电子设备上运行时,使得该电子设备执行如第一方面及其任一种可能的设计方式的资源管理方法;或者,当计算机指令在电子设备上运行时,使得该电子设备执行如第二方面及其任一种可能的设计方式的资源管理方法。
本申请中第三方面到第七方面及其各种实现方式的具体描述,可以参考第一方面和第二方面及其各种实现方式中的详细描述;并且,第三方面到第七方面及其各种实现方式的有益效果,可以参考第一方面和第二方面及其各种实现方式中的有益效果分析,此处不再赘述。
本申请的这些方面或其他方面在以下的描述中会更加简明易懂。
附图说明
图1为一种虚拟机和云盘对应关系图;
图2为一种节点出现故障时,虚拟机和云盘迁移方法图;
图3为本申请实施例提供的一种资源管理方法所涉及的实施环境示意图;
图4为本申请实施例提供的一种资源管理方法的流程图;
图5为本申请实施例提供的一种超融合系统云平台界面图;
图6为本申请实施例提供的一种云盘挂载方式图;
图7为本申请实施例提供的一种节点异常情况下,虚拟机和云盘迁移流程图;
图8为本申请实施例提供的一种节点异常情况下,虚拟机和云盘迁移方法图;
图9为本申请实施例提供的一种虚拟机和云盘迁移流程图;
图10为本申请实施例提供的一种虚拟机管理装置的结构示意图;
图11为本申请实施例提供的一种分布式存储管理装置的结构示意图;
图12为本申请实施例提供的一种资源调度装置的结构示意图;
图13本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
超融合技术是目前较为先进的云计算技术,在超融合架构下,云计算系统和存储系统融合部署在一套设备上的时候,会出现节点A上虚拟机所使用的云盘是由节点B上的存储服务提供的,该情况下,虚拟机访问云盘时需要跨节点访问,增加了IO的网络延迟。另外,当节点B出现故障时,节点B上的虚拟机和云盘均需要根据虚拟机迁移策略进行迁移,此时,除了节点B上的虚拟机受到影响之外,节点A上使用节点B存储服务提供的云盘的虚拟机也会受到影响。也就是说,在超融合架构下,当计算和存储资源的调度上存在一定的割裂时,当节点出现故障,会有较多的虚拟机受到影响,从而对系统性能影响较大,且维护困难。
在一个示例中,如图1所示,图1中为传统超融合系统下,虚拟机管理装置和分布式存储管理装置互相独立管理,各个节点上的虚拟机通过iSCSI协议随机挂载在其他节点上的云盘上。如果节点出现故障,如图2所示,节点1出现故障时,需要将节点1中的虚拟机1(Virtual Machine 1,VM1)、VM2、云盘3和云盘5进行迁移,节点1中的VM1和VM2根据虚拟机管理装置的迁移策略,迁移到节点2和节点3中,节点1中的云盘3和云盘5根据分布式存储管理装置的迁移策略,迁移到节点2和节点3中,此时,除了VM1和VM2受到影响之外,云盘3挂载的VM3和云盘5挂载的VM5也受到了影响。
基于此,本申请实施例提供了一种资源管理方法,该方法通过超融合系统中的虚拟机管理装置和分布式存储管理装置对至少两个节点的存储资源进行管理。首先虚拟机管理装置根据虚拟机任务在一个节点上创建虚拟机,同时虚拟机管理装置将在该节点创建云盘的信息发送给分布式存储管理装置,使得在该节点上创建云盘,将该节点上的云盘挂载到该节点上的虚拟机上。
可以理解的是,本申请实施例提供的资源管理方法中,虚拟机和对应挂载的云盘在同一个节点上,不存在跨节点挂载的现象,使用的是本地磁盘通信协议通信,不需要经过TCP/IP网络,IO路径减少,减小IO的网络延迟。同时,当其中一个节点出现故障时,只有该节点上的虚拟机和该节点上的云盘受到影响,其他节点上的虚拟机不受影响,降低了影响范围,从而降低了维修难度。
下面将结合附图对本申请实施例的实施方式进行详细描述。
请参考图3,图3为本申请实施例提供的一种资源管理方法所涉及的实施环境示意图,该实施环境可以适用于超融合系统,该实施环境包括:虚拟机管理装置110,分布式存储管理装置120,以及至少两个节点130。
其中,节点130可以包括:虚拟机管理子装置131和块设备网关132。
虚拟机管理装置110用于管理至少两个节点130上部署的虚拟机。其中,管理虚拟机可以包括:创建虚拟机,删除虚拟机,迁移虚拟机,监控虚拟机,将云盘挂载在虚拟机上等。
虚拟机管理装置110可以直接管理节点上部署的虚拟机,也可以间接管理节点上部署的虚拟机(如虚拟机管理装置110通过虚拟机管理子装置131管理节点130上部署的虚拟机)。
分布式存储管理装置120,用于管理至少两个节点130上的存储资源。具体的,在虚拟机管理装置110的指示下,通过节点130上的块设备网关132在节点130上创建云盘。
其中,云盘是一种块存储设备,本申请实施例中,各节点上的云盘是由分布式存储管理装置120通过各节点上的块设备网关132虚拟出来的。
其中,当节点上的云盘挂载在同一个节点上的虚拟机时,块设备网关132可以是SCSI块设备网关,附图中均以块设备网关132具体示SCSI块设备网关(标记为SCSI块设备网关132)为例进行说明。
SCSI块设备网关是一种基于硬件或软件提供SCSI存储协议的网关,SCSI块设备网关是分布式管理模块与云盘之间的桥梁。通过SCSI块设备网关创建的云盘挂载到虚拟机后,虚拟机与该云盘之间通过SCSI协议通信。
其中,挂载指由操作系统使存储设备(诸如硬盘、只读光盘存储器或共享资源)上的计算机文件和目录可供用户通过计算机的文件系统访问的过程。本方法中云盘挂载在虚拟机,即可以通过虚拟机中的文件访问云盘。
在硬件实现上,节点130是物理节点,一个节点可以为一台物理服务器(如x86服务器)。虚拟机管理装置110和分布式存储管理装置120中的任意一个或多个可以独立于节点130,也可以集成在节点130中,本申请实施例对此不进行限定。下文中均以虚拟机管理装置110和分布式存储管理装置120独立于节点130为例进行说明。
可选的,该实施环境还可以包括资源调度装置150。资源调度装置150用于统一管理虚拟机管理装置110和分布式存储管理装置120,建立起两者之间通信桥梁。例如,虚拟机管理装置110可以通过资源调度装置150向分布式存储管理装置120发送创建云盘的指示消息。
在硬件实现上,资源调度装置150可以独立于节点130,也可以集成在节点130中。下文中均以资源调度装置150独立于节点130为例进行说明。
可选的,该系统还可以包括显示器160。显示器160用于显示超融合系统云平台界面。当用户需要在超融合系统中创建虚拟机时,可以通过超融合系统云平台界面进行操作。
本申请实施例对每个节点上可以创建的虚拟机个数、云盘个数以及各模块数量不做限定,由节点的计算资源和存储资源决定。
下面将结合附图对本申请实施例的提出的资源管理方法进行详细描述。
请参考图4,为本申请实施例提供的一种资源管理方法的流程图,该方法可应用于超融合系统,该系统包含虚拟机管理装置、分布式存储管理装置和至少两个节点。虚拟机管理装置用于管理至少两个节点上部署的虚拟机,分布式存储管理装置用于管理至少两个节点上的存储资源。如图4所示,该方法可以包括S101-S104。
S101:虚拟机管理装置响应于创建虚拟机的任务,在至少两个节点中的第一节点上创建第一虚拟机。
创建虚拟机的任务可以由用户在超融合系统中下发给虚拟机管理装置,虚拟机管理装置接收并响应于创建虚拟机的任务。
在一个示例中,客户在超融合系统云平台界面申请创建虚拟机,如图5所示,为超融合系统云平台界面,客户根据需要点击创建虚拟机的任务,虚拟机管理装置接收并响应该创建虚拟机的任务。
具体的,虚拟机管理装置基于至少两个节点的计算资源,以及虚拟机任务需要的计算资源,在至少两个节点中的第一节点上创建第一虚拟机。
虚拟机管理装置接收到虚拟机任务为创建虚拟机后,需要为创建的虚拟机分配计算资源,该计算资源由创建虚拟机的节点提供,因此该节点的剩余计算资源应该大于虚拟机需要分配的计算资源。一般的,如果有多个节点,则基于多个节点的计算资源,选择计算资源充足(即节点的计算资源大于需要为虚拟机分配的计算资源)的节点,若多个节点资源都充足,可以依据负载均衡原则,选择其中一个节点创建虚拟机。
S102:虚拟机管理装置向超融合系统中的分布式存储管理装置发送第一指示信息,第一指示信息用于指示分布式存储管理装置在第一节点上创建第一云盘。
第一指示信息可以包含:第一云盘标识和第一节点标识。
第一指示信息,可以由虚拟机管理装置给分布式存储管理装置发送,可选的,虚拟机管理装置与资源调度装置连接,可以通过资源调度装置向分布式存储管理装置发送。其中,资源调度装置用于管理至少一个分布式存储管理装置以及至少一个虚拟机管理装置。
通过该资源调度装置,可以打通虚拟机管理装置和分布式存储模块之间的资源调度,达到计算资源和存储资源统一调度的效果。
S103:分布式存储管理装置基于第一指示信息在第一节点上创建第一云盘。
具体的,分布式管理模块向SCSI块设备网关发送创建第一云盘的请求。SCSI块设备网关接收到该请求后,在第一节点上创建第一云盘。
当第一节点上的第一云盘创建成功,则第一节点上的SCSI块设备网关向分布式存储管理装置发送第一云盘创建成功的消息,分布式存储管理装置向虚拟机管理装置发送响应消息,响应消息用于指示第一云盘创建成功。
S104:虚拟机管理装置将第一节点中的第一云盘挂载在第一节点中的第一虚拟机上。
第一云盘可以用于存储第一虚拟机运行过程中产生的数据。
虚拟机管理装置接收到第一云盘创建成功的响应后,将第一节点中的第一云盘挂载在第一节点中的第一虚拟机上。启动第一虚拟机,完成第一虚拟机的创建过程。
由于第一虚拟机与第一云盘在同一个节点,因此第一虚拟机与第一云盘之间可以通过本地磁盘通信协议通信,例如SCSI协议。
在一个示例中,如图6所示,该超融合系统中含有3个节点,每个节点上的虚拟机由虚拟机管理子装置管理,虚拟机管理子装置由虚拟机管理装置统一管理;每个节点上的云盘通过SCSI块设备网关创建,SCSI块设备网关由分布式存储管理装置管理。每个节点上的云盘挂载在对应节点的虚拟机上。图6展示了本方案云盘挂载方式。
该方法中,虚拟机和对应挂载的云盘在同一个节点上,不存在跨节点挂载的现象,可以通过SCSI协议进行通信,虚拟机就像使用本地磁盘一样使用云盘,不需要经过TCP/IP网络,IO路径减少,减小IO的网络延迟。另外,当其中一个节点出现故障时,只有该节点上的虚拟机和该节点上的云盘受到影响,其他节点上的虚拟机不受影响,降低了影响范围,从而降低了维修难度。
上述S101-S104为节点上创建虚拟机和云盘的过程。当节点出现异常时,虚拟机和云盘迁移方法如图7和图9所示。图7所示的方法包括以下S201-S207。图9所示的方法包括以下S301-S307。
S201:虚拟机管理装置在检测到第一节点异常时,确定第一虚拟机迁移策略;其中,第一虚拟机迁移策略用于表征将第一节点上的第一虚拟机迁移到至少两个节点中的第二节点。
节点异常可以包括:节点中的某些进程被杀死了,Web管理界面手动关闭节点、或者后台数据调用函数关闭节点、节点宕机、断电或断网等。
S202:虚拟机管理装置基于第一虚拟机迁移策略确定第一云盘迁移策略;其中,第一云盘迁移策略用于表征将第一云盘迁移到第二节点。
也就是说,将第一云盘和第一虚拟机迁移到同一个节点。
S203:虚拟机管理装置向分布式存储管理装置发送第二指示信息;其中,第二指示信息用于指示按照第一云盘迁移策略在第二节点上创建第一云盘。
第二指示信息中可以包含:第一云盘标识和第二节点标识。
S204:分布式存储管理装置基于第二指示信息在第二节点上创建第一云盘。
具体的,分布式存储管理装置接收到第二指示信息后,向第二节点上的SCSI块设备网关发送创建第一云盘的请求。SCSI块设备网关接收到该请求后,在第二节点上创建第一云盘。
S205:分布式存储管理装置向虚拟机管理装置发送响应消息。相应的,虚拟机管理装置接收分布式存储管理装置发送的响应消息。
当虚拟机管理装置接收到第一云盘创建成功的响应,执行S206;
当虚拟机管理装置接收到第一云盘创建失败的响应,执行S301。
S206:虚拟机管理装置基于第一虚拟机迁移策略,在第二节点上创建第一虚拟机。
具体的,虚拟机管理装置接收到第一云盘创建成功的响应后,向第二节点上的虚拟机管理子装置发送创建第一虚拟机的请求。虚拟机管理子装置接收到该请求后,在第二节点上创建第一虚拟机。
虚拟机管理装置在第二节点上创建第一虚拟机的时间可以在第二虚拟机迁移策略制定好之后就创建,也可以在第一云盘在第二节点创建成功后接收到分布式存储管理装置发送的响应消息后,再在第二节点上创建第一虚拟机。本申请实施例对该第一虚拟机创建时间不做限定。
由于第一虚拟机迁移策略确定时,不能确定第一云盘能否在第二节点成功创建,若此时在第二节点创建第一虚拟机,当第一云盘在第二节点创建失败时,第二节点创建的第一虚拟机没有挂载的云盘,此时会造成资源浪费。因此,一般的,虚拟机管理装置可以在接收到第一云盘在第二节点创建成功后的响应消息后,再在第二节点创建第一虚拟机,可以避免浪费资源。
S207:虚拟机管理装置将第二节点中的第一云盘挂载在第二节点中的第一虚拟机上。
挂载,即建立第一云盘和第一虚拟机的对应关系,第一云盘中的文件和目录可供第一虚拟机的文件系统访问。
将第二节点中的第一云盘挂载在第二节点中的第一虚拟机上后,启动虚拟机,完成虚拟机和云盘迁移过程。
至此,第一虚拟机和第一云盘成功迁移到第二节点,本迁移流程结束。
在一个示例中,如图8所示,当节点1出现异常时,节点1上的虚拟机和云盘的迁移过程。根据虚拟机管理装置确定的虚拟机迁移策略和云盘迁移策略,将节点1上的VM1和云盘1迁移到节点3,将节点1上的VM2和云盘2迁移到节点2。从图8中可以看出,该云盘挂载方式,使得当节点出现异常需要迁移VM和云盘时,受到影响的VM只有节点1上VM,其他节点上的VM不受影响。
S301:虚拟机管理装置确定第二虚拟机迁移策略;其中,第二虚拟机迁移策略用于表征将第一节点上的第一虚拟机迁移到至少两个节点中的第三节点。
例如,第一虚拟机迁移失败的原因包含:第一云盘迁移失败。或者,第一云盘迁移失败的原因包含:第二节点存储资源不够,第二节点异常等。
其中,第三节点是除了第一节点和第二节点以外的节点。
如果该第一云盘在第二节点创建失败,则表明第一云盘迁移失败,此时,虚拟机管理装置接收到的分布式存储管理装置发送的响应消息包含第一云盘迁移到第二节点失败的消息。
由于第一云盘迁移失败,导致第一虚拟机没有挂载的磁盘,此时,第一虚拟机也迁移失败,因此该响应消息也包含第一虚拟机迁移失败。
第一虚拟机迁移到第二节点失败后,虚拟机管理装置重新为第一虚拟机制定第二虚拟机迁移策略,该第二虚拟机迁移策略可以包含:第一虚拟机标识和第三节点标识,通过该标识可以确认虚拟机以及虚拟机迁移的节点。
S302:虚拟机管理装置基于第二虚拟机迁移策略,确定第二云盘迁移策略;其中,第二云盘迁移策略用于表征将第一云盘迁移到第三节点。
也就是说,将第一云盘和第一虚拟机迁移到同一个节点。
S303:虚拟机管理装置向分布式存储管理装置发送第三指示信息;其中,第三指示信息用于指示按照第二云盘迁移策略在第三节点上创建第一云盘。
第三指示信息中可以包含:第一云盘标识和第三节点标识。
S304:分布式存储管理装置基于第三指示信息在第三节点上创建第一云盘。
具体的,分布式存储管理装置接收到第三指示信息后,向第三节点上的SCSI块设备网关发送创建第一云盘的请求。SCSI块设备网关接收到该请求后,在第三节点上创建第一云盘。
S305:第一云盘在第三节点创建成功后,分布式存储管理装置向虚拟机管理装置发送第一云盘创建成功的响应消息。相应的,虚拟机管理装置接收分布式存储管理装置发送的响应消息。
S306:虚拟机管理装置基于第二虚拟机迁移策略,在第三节点上创建第一虚拟机。
具体的,虚拟机管理装置接收到第一云盘创建成功的响应后,向第三节点上的虚拟机管理子装置发送创建第一虚拟机的请求。虚拟机管理子装置接收到该请求后,在第三节点上创建第一虚拟机。
S307:虚拟机管理装置将第三节点中的第一云盘挂载在第三节点中的第一虚拟机上。
详细描述参见S104。
至此,第一虚拟机和第一云盘成功迁移到第三节点,本迁移流程结束(如图9所示,为虚拟机和云盘迁移至第三节点流程图)。
本申请实施例提供的一种资源管理方法,该方法通过虚拟机管理装置和分布式存储管理装置对至少两个节点的存储资源进行管理。首先虚拟机管理装置根据虚拟机任务在一个节点上创建虚拟机,同时虚拟机管理装置将在该节点创建云盘的信息发送给分布式存储管理装置,使得在该节点上创建云盘,将该节点上的云盘挂载到该节点上的虚拟机上。本申请实施例提供的资源管理方法中,虚拟机和对应挂载的云盘在同一个节点上,不存在跨节点挂载的现象,使用的是本地磁盘通信协议通信,不需要经过TCP/IP网络,IO路径减少,减小IO的网络延迟。同时,当其中一个节点出现故障时,只有该节点上的虚拟机和该节点上的云盘受到影响,其他节点上的虚拟机不受影响,降低了影响范围,从而降低了维修难度。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术目标应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术目标可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例还提供一种虚拟机管理装置200,该虚拟机管理装置200应用于超融合系统中,管理超融合系统中至少两个节点上部署的虚拟机。如图10所示,为本申请实施例提供的一种虚拟机管理装置200的结构示意图。
其中,虚拟机管理装置200包括:创建模块210,用于响应于创建虚拟机的任务,在至少两个节点中的第一节点上创建第一虚拟机;发送模块220,用于向分布式存储管理装置发送第一指示信息,第一指示信息用于指示在第一节点上创建第一云盘;挂载模块230,用于将第一节点中的第一云盘挂载在第一节点中的第一虚拟机上;其中,第一云盘与第一虚拟机之间通过本地磁盘通信协议通信。
在一种可能的实施例中,虚拟机管理装置还包括确定模块240,用于在检测到第一节点异常时,确定第一虚拟机迁移策略;其中,第一虚拟机迁移策略用于表征将第一节点上的第一虚拟机迁移到至少两个节点中的第二节点。确定模块240还用于,基于第一虚拟机迁移策略确定第一云盘迁移策略;其中,第一云盘迁移策略用于表征将第一云盘迁移到第二节点。发送模块220还用于向分布式存储管理装置发送第二指示信息;其中,第二指示信息用于指示按照第一云盘迁移策略在第二节点上创建第一云盘;创建模块210还用于基于第一虚拟机迁移策略,在第二节点上创建第一虚拟机;挂载模块230还用于将第二节点中的第一云盘挂载在第二节点中的第一虚拟机上。
在另一种可能的实施例中,虚拟机管理装置200还包括接收模块250,接收模块250用于,接收分布式存储管理装置发送的响应消息;确定模块240还用于当响应消息用于指示第一虚拟机迁移失败时,确定第二虚拟机迁移策略;其中,第二虚拟机迁移策略用于表征将第一节点上的第一虚拟机迁移到至少两个节点中的第三节点;基于第二虚拟机迁移策略,确定第二云盘迁移策略;其中,第二云盘迁移策略用于表征将第一云盘迁移到第三节点;发送模块220还用于向分布式存储管理装置发送第三指示信息;其中,第三指示信息用于指示按照第二云盘迁移策略在第三节点上创建第一云盘;创建模块210还用于基于第二虚拟机迁移策略,在第三节点上创建第一虚拟机;挂载模块230还用于将第三节点中的第一云盘挂载在第三节点中的第一虚拟机上。
在另一种可能的实施例中虚拟机管理装置200还与资源调度装置连接,发送模块220具体用于通过资源调度装置向分布式存储管理装置发送第一指示信息;其中,资源调度装置用于管理至少一个分布式存储管理装置以及至少一个虚拟机管理装置200。
在另一种可能的实施例中,本地磁盘通信协议包括SCSI通信协议。
本申请实施例还提供一种分布式存储管理装置300,该分布式存储管理装置300应用于超融合系统中。如图11所示,为本申请实施例提供的一种分布式存储管理装置300的结构示意图。
其中,分布式存储管理装置300包含,接收模块310,用于接收虚拟机管理装置200发送的第一指示信息,虚拟机管理装置200用于管理超融合系统中至少两个节点上部署的虚拟机,虚拟机管理装置200在超融合系统中至少两个节点中的第一节点上创建有第一虚拟机,第一指示信息用于指示分布式存储管理装置在超融合系统中至少两个节点中的第一节点上创建第一云盘;控制模块320,用于基于第一指示信息控制第一节点创建第一云盘以由虚拟机管理装置将第一云盘挂载在第一虚拟机上;其中,第一云盘与第一虚拟机之间通过本地磁盘通信协议通信。
可选的,本申请实施例还提供一种资源调度装置400,如图12所示,为本申请实施例提供的一种资源调度装置400的结构示意图。
资源调度装置400包括接收模块410和发送模块420,接收模块410用于接收虚拟机管理装置200发送的指示信息。虚拟机管理装置200通过资源调度装置400的发送模块420向分布式存储管理装置发送第一指示信息;其中,资源调度装置400用于管理至少一个分布式存储管理装置300以及至少一个虚拟机管理装置200。
当然,本申请实施例提供的虚拟机管理装置200、分布式存储管理装置300和资源调度装置400包括但不限于上述模块。
图13是本申请实施例提供的一种电子设备500的结构示意图。如图13所示,该电子设备500包括处理器501、存储器502和网络接口503。
其中,处理器501包括一个或多个CPU。该CPU可以为单核CPU(single-CPU)或多核CPU(multi-CPU)。
存储器502包括但不限于是RAM、ROM、EPROM、快闪存储器、或光存储器等。
可选地,处理器501通过读取存储器502中保存的指令实现本申请实施例提供的资源管理方法,或者,处理器501通过内部存储的指令实现本申请实施例提供的资源管理方法。在处理器501通过读取存储器502中保存的指令实现上述实施例中的资源管理方法的情况下,存储器502中保存实现本申请实施例提供的资源管理方法的指令。
网络接口503是有线接口(端口),例如FDDI、GE接口。或者,网络接口503是无线接口。应理解,网络接口503包括多个物理端口,网络接口503用于接入网络。
可选地,电子设备还包括总线504,上述处理器501、存储器502、网络接口503通常通过总线504相互连接,或采用其他方式相互连接。
在实际实现时,虚拟机管理装置200的创建模块210、发送模块220和挂载模块230,分布式存储管理装置300的接收模块310和控制模块320,以及,资源调度装置400的接收模块410和发送模块420,可以由处理器调用存储器中的计算机程序代码来实现。其具体的执行过程可参考上述方法部分的描述,这里不再赘述。
本申请另一实施例还提供一种电子设备,包括存储器和处理器。存储器和处理器耦合;存储器用于存储计算机程序代码,计算机程序代码包括计算机指令。其中,当处理器执行该计算机指令时,使得该电子设备执行上述方法实施例所示的方法的各个步骤。
本申请另一实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行上述方法实施例所示的方法流程中电子设备执行的各个步骤。
本申请另一实施例还提供一种芯片系统,该芯片系统应用于电子设备。该芯片系统包括一个或多个接口电路,以及一个或多个处理器。接口电路和处理器通过线路互联。接口电路用于从电子设备的存储器接收信号,并向处理器发送信号,信号包括存储器中存储的计算机指令。当电子设备处理器执行计算机指令时,电子设备执行上述方法实施例所示的方法流程中电子设备执行的各个步骤。
在本申请另一实施例中还提供一种计算机程序产品,该计算机程序产品包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行上述方法实施例所示的方法流程中电子设备执行的各个步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
以上所述,仅为本申请的具体实施方式。熟悉本技术领域的技术人员根据本申请提供的具体实施方式,可想到变化或替换,都应涵盖在本申请的保护范围之内。

Claims (11)

1.一种资源管理方法,其特征在于,应用于超融合系统中的虚拟机管理装置,所述虚拟机管理装置用于管理所述超融合系统中至少两个节点上部署的虚拟机;所述方法包括:
响应于创建虚拟机的任务,在所述至少两个节点中的第一节点上创建第一虚拟机;
向所述超融合系统中的分布式存储管理装置发送第一指示信息,所述第一指示信息用于指示所述分布式存储管理装置在所述第一节点上创建第一云盘;
将所述第一节点中的所述第一云盘挂载在所述第一节点中的所述第一虚拟机上;其中,所述第一云盘与所述第一虚拟机之间通过本地磁盘通信协议通信。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在检测到所述第一节点异常时,确定第一虚拟机迁移策略;其中,所述第一虚拟机迁移策略用于表征将所述第一节点上的所述第一虚拟机迁移到所述至少两个节点中的第二节点;
基于所述第一虚拟机迁移策略确定第一云盘迁移策略;其中,所述第一云盘迁移策略用于表征将所述第一云盘迁移到所述第二节点;
向所述分布式存储管理装置发送第二指示信息;其中,所述第二指示信息用于指示按照所述第一云盘迁移策略在所述第二节点上创建所述第一云盘;
基于所述第一虚拟机迁移策略,在所述第二节点上创建所述第一虚拟机;
将所述第二节点中的所述第一云盘挂载在所述第二节点中的所述第一虚拟机上。
3.根据权利要求2所述的方法,其特征在于,在所述向所述分布式存储管理装置发送第二指示信息之后,所述方法还包括:
接收所述分布式存储管理装置发送的响应消息;
当所述响应消息用于指示所述第一虚拟机迁移失败时,确定第二虚拟机迁移策略;其中,所述第二虚拟机迁移策略用于表征将所述第一节点上的所述第一虚拟机迁移到所述至少两个节点中的第三节点;
基于所述第二虚拟机迁移策略,确定第二云盘迁移策略;其中,所述第二云盘迁移策略用于表征将所述第一云盘迁移到所述第三节点;
向所述分布式存储管理装置发送第三指示信息;其中,所述第三指示信息用于指示按照所述第二云盘迁移策略在所述第三节点上创建所述第一云盘;
基于所述第二虚拟机迁移策略,在所述第三节点上创建所述第一虚拟机;
将所述第三节点中的所述第一云盘挂载在所述第三节点中的所述第一虚拟机上。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述向分布式存储管理装置发送第一指示信息,包括:
通过资源调度装置向所述分布式存储管理装置发送所述第一指示信息;其中,所述资源调度装置用于管理至少一个所述分布式存储管理装置以及至少一个所述虚拟机管理装置。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述本地磁盘通信协议包括小型计算机系统接口SCSI通信协议。
6.一种资源管理方法,其特征在于,应用于超融合系统中的分布式存储管理装置;所述方法包括:
接收所述虚拟机管理装置发送的第一指示信息,所述虚拟机管理装置用于管理所述超融合系统中至少两个节点上部署的虚拟机,所述虚拟机管理装置在所述超融合系统中至少两个节点中的第一节点上创建有第一虚拟机,所述第一指示信息用于指示所述分布式存储管理装置在所述第一节点上创建第一云盘;
基于所述第一指示信息控制所述第一节点创建所述第一云盘以由所述虚拟机管理装置将所述第一云盘挂载在所述第一虚拟机上;其中,所述第一云盘与所述第一虚拟机之间通过本地磁盘通信协议通信。
7.一种虚拟机管理装置,其特征在于,应用于超融合系统中,所述虚拟机管理装置用于管理所述超融合系统中至少两个节点上部署的虚拟机,所述虚拟机管理装置包括:
创建模块,用于响应于创建虚拟机的任务,在所述至少两个节点中的第一节点上创建第一虚拟机;
发送模块,用于向所述超融合系统中的分布式存储管理装置发送第一指示信息,所述第一指示信息用于指示所述分布式存储管理装置在所述第一节点上创建第一云盘;
挂载模块,用于将所述第一节点中的所述第一云盘挂载在所述第一节点中的所述第一虚拟机上;其中,所述第一云盘与所述第一虚拟机之间通过本地磁盘通信协议通信。
8.根据权利要求7所述的虚拟机管理装置,其特征在于,
所述虚拟机管理装置还包括确定模块,用于在检测到所述第一节点异常时,确定第一虚拟机迁移策略;其中,所述第一虚拟机迁移策略用于表征将所述第一节点上的所述第一虚拟机迁移到所述至少两个节点中的第二节点;基于所述第一虚拟机迁移策略确定第一云盘迁移策略;其中,所述第一云盘迁移策略用于表征将所述第一云盘迁移到所述第二节点;所述发送模块还用于向所述分布式存储管理装置发送第二指示信息;其中,所述第二指示信息用于指示按照所述第一云盘迁移策略在所述第二节点上创建所述第一云盘;所述创建模块还用于基于所述第一虚拟机迁移策略,在所述第二节点上创建所述第一虚拟机;所述挂载模块还用于将所述第二节点中的所述第一云盘挂载在所述第二节点中的所述第一虚拟机上;
所述虚拟机管理装置还包括接收模块,所述接收模块用于,接收所述分布式存储管理装置发送的响应消息;所述确定模块还用于当所述响应消息用于指示所述第一虚拟机迁移失败时,确定第二虚拟机迁移策略;其中,所述第二虚拟机迁移策略用于表征将所述第一节点上的所述第一虚拟机迁移到所述至少两个节点中的第三节点;基于所述第二虚拟机迁移策略,确定第二云盘迁移策略;其中,所述第二云盘迁移策略用于表征将所述第一云盘迁移到所述第三节点;所述发送模块还用于向所述分布式存储管理装置发送第三指示信息;其中,所述第三指示信息用于指示按照所述第二云盘迁移策略在所述第三节点上创建所述第一云盘;所述创建模块还用于基于所述第二虚拟机迁移策略,在所述第三节点上创建所述第一虚拟机;所述挂载模块还用于将所述第三节点中的所述第一云盘挂载在所述第三节点中的所述第一虚拟机上;
所述虚拟机管理装置还与资源调度装置连接,所述发送模块,具体用于通过所述资源调度装置向所述分布式存储管理装置发送所述第一指示信息;其中,所述资源调度装置用于管理至少一个所述分布式存储管理装置以及至少一个所述虚拟机管理装置;
所述本地磁盘通信协议包括SCSI通信协议。
9.一种分布式存储管理装置,其特征在于,应用于超融合系统中,所述分布式存储管理装置包括:
接收模块,用于接收所述虚拟机管理装置发送的第一指示信息,所述虚拟机管理装置用于管理所述超融合系统中至少两个节点上部署的虚拟机,所述虚拟机管理装置在所述超融合系统中至少两个节点中的第一节点上创建有第一虚拟机,所述第一指示信息用于指示所述分布式存储管理装置在所述第一节点上创建第一云盘;
控制模块,用于基于所述第一指示信息控制所述第一节点创建所述第一云盘以由所述虚拟机管理装置将所述第一云盘挂载在所述第一虚拟机上;其中,所述第一云盘与所述第一虚拟机之间通过本地磁盘通信协议通信。
10.一种电子设备,其特征在于,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述电子设备执行如权利要求1-6中任意一项所述的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令;其中,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求1-6中任意一项所述的方法。
CN202211028516.8A 2022-08-25 2022-08-25 一种资源管理方法、装置、电子设备及存储介质 Pending CN115827148A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211028516.8A CN115827148A (zh) 2022-08-25 2022-08-25 一种资源管理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211028516.8A CN115827148A (zh) 2022-08-25 2022-08-25 一种资源管理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115827148A true CN115827148A (zh) 2023-03-21

Family

ID=85523213

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211028516.8A Pending CN115827148A (zh) 2022-08-25 2022-08-25 一种资源管理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115827148A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117240917A (zh) * 2023-11-08 2023-12-15 阿里云计算有限公司 缓存型云存储系统与数据读写方法、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117240917A (zh) * 2023-11-08 2023-12-15 阿里云计算有限公司 缓存型云存储系统与数据读写方法、设备及存储介质
CN117240917B (zh) * 2023-11-08 2024-04-05 阿里云计算有限公司 缓存型云存储系统与数据读写方法、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110865867B (zh) 应用拓扑关系发现的方法、装置和系统
JP6224846B2 (ja) プロバイダ定義インターフェイスを介したクライアント構内リソース制御
US10511658B1 (en) Computing resource transition notification and pending state
US20180167456A1 (en) Location of actor resources
EP2724244B1 (en) Native cloud computing via network segmentation
US20170293501A1 (en) Method and system that extends a private data center to encompass infrastructure allocated from a remote cloud-computing facility
WO2020005530A1 (en) Network-accessible computing service for micro virtual machines
JP5708937B2 (ja) 構成情報管理システム、構成情報管理方法、及び構成情報管理用プログラム
CN109168328B (zh) 虚拟机迁移的方法、装置和虚拟化系统
CN112948063B (zh) 云平台的创建方法、装置、云平台以及云平台实现系统
US20190391831A1 (en) Seamless virtual standard switch to virtual distributed switch migration for hyper-converged infrastructure
CN109426544A (zh) 虚拟机部署方法和装置
US11991241B2 (en) Server system and method of managing server system
CN109960579B (zh) 一种调整业务容器的方法及装置
US11360824B2 (en) Customized partitioning of compute instances
CN115827148A (zh) 一种资源管理方法、装置、电子设备及存储介质
US10300386B1 (en) Content item instance scaling based on wait time
US11765098B1 (en) Customized cross-premise resource selection for containerized applications
WO2017082757A1 (en) Computer data processing system and method for communication traffic based optimization of virtual machine communication
CN114647488A (zh) 一种任务训练方法、装置、设备及存储介质
CN110347473B (zh) 一种跨数据中心分布的虚拟化网元虚拟机分配方法及装置
US10824476B1 (en) Multi-homed computing instance processes
US10860347B1 (en) Virtual machine with multiple content processes
US11824943B1 (en) Managed connectivity between cloud service edge locations used for latency-sensitive distributed applications
US11595464B2 (en) Migration of network file copy operations between host computing devices

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination