CN110837451B - 虚拟机高可用的处理方法、装置、设备和介质 - Google Patents

虚拟机高可用的处理方法、装置、设备和介质 Download PDF

Info

Publication number
CN110837451B
CN110837451B CN201810934887.XA CN201810934887A CN110837451B CN 110837451 B CN110837451 B CN 110837451B CN 201810934887 A CN201810934887 A CN 201810934887A CN 110837451 B CN110837451 B CN 110837451B
Authority
CN
China
Prior art keywords
computing nodes
virtual machines
virtual machine
computing node
equal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810934887.XA
Other languages
English (en)
Other versions
CN110837451A (zh
Inventor
谭文贵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Chongqing Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Chongqing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Chongqing Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201810934887.XA priority Critical patent/CN110837451B/zh
Publication of CN110837451A publication Critical patent/CN110837451A/zh
Application granted granted Critical
Publication of CN110837451B publication Critical patent/CN110837451B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明实施例公开了一种虚拟机高可用的处理方法、装置、设备和介质。该方法包括:计算节点监控服务器监控集群中N个计算节点,每个计算节点上都安装有M个虚拟机,其中N为大于1的整数,M为大于1的整数;当计算节点监控服务器监控到存在故障计算节点时,云管理平台将故障计算节点中对应的M个虚拟机分别迁移至S个备选计算节点,S为大于或者等于1,且小于等于M的整数。根据本发明实施例提供的技术方案,采用计算节点和虚拟机分开监控、第一网络和第二网络分开监控的方式,提高了监控的有效性。同时对故障计算节点及时进行迁移,提升了计算节点高可用的有效性,以及也提高了迁移操作的效率和迁移操作的准确性。

Description

虚拟机高可用的处理方法、装置、设备和介质
技术领域
本发明涉及云计算领域,尤其涉及一种虚拟机高可用的处理方法、装置、设备和介质。
背景技术
随着开源软件的大量使用,从成本、性能以及虚拟化技术架构的趋势来看,现有虚拟化资源的提供主要还是交换机(KeyboardVideoMouse、KVM)等虚拟化平台,核心业务上基于云端运算软件Openstack架构下的KVM虚拟化平台使用较少,而KVM虚拟机的高可用方案也不够完善。
现有Openstack架构下KVM虚拟机高可用方案实现上,还存在一些缺点,比如:通过节点间心跳确定计算节点的状态,计算节点状态监控和虚拟机状态监控网络未分离。因此,导致了监控不准确,迁移操作效率和准确性不能得到保证,迁移过程不易把控,以及迁移策略不灵活等等问题。
发明内容
本发明实施例提供一种虚拟机高可用的处理方法、装置、设备和介质,可以实现计算节点监控和虚拟机监控网络的分离,提高监控的准确性,且也提高了迁移操作的效率和迁移操作的准确性。
根据本发明实施例的第一方面,提供一种虚拟机高可用的处理方法,处理方法包括:
计算节点监控服务器监控集群中N个计算节点,每个计算节点上都安装有M个虚拟机,其中N为大于1的整数,M为大于1的整数;
当计算节点监控服务器监控到存在故障计算节点时,云管理平台将故障计算节点中对应的M个虚拟机分别迁移至S个备选计算节点,S为大于或者等于1,且小于等于M的整数;
其中,计算节点均部署在第一网络上,每个虚拟机都注册到虚拟机监控服务器上,计算节点监控服务器和虚拟机监控服务器均部署在第二网络上。
根据本发明实施例的第二方面,提供一种虚拟机高可用的处理装置,处理装置包括:
计算节点监控服务器、虚拟机监控服务器和云管理平台;
计算节点监控服务器,用于监控集群中N个计算节点,每个计算节点上都安装有M个虚拟机,其中N为大于1的整数,M为大于1的整数;
云管理平台,用于当计算节点监控服务器监控到存在故障计算节点时,将故障计算节点中对应的M个虚拟机分别迁移至S个备选计算节点,S为大于或者等于1,且小于等于M的整数;
其中,计算节点均部署在第一网络上,每个虚拟机都注册到虚拟机监控服务器上,计算节点监控服务器和虚拟机监控服务器均部署在第二网络上。
根据本发明实施例的第三方面,提供一种终端设备,包括:
存储器、处理器、通信接口和总线;
存储器、处理器和通信接口通过总线连接并完成相互间的通信;
存储器用于存储程序代码;
处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于执行如第一方面的处理方法。
根据本发明实施例的第四方面,提供一种计算机存储介质,包括指令,当指令在计算机上运行时,使计算机执行如第一方面的处理方法。
根据本发明实施例中的处理方法、装置、设备和介质,采用计算节点和虚拟机分开监控、第一网络和第二网络分开监控的方式,提高了监控的有效性。同时对故障计算节点及时进行迁移,提升了计算节点高可用的有效性,以及也提高了迁移操作的效率和迁移操作的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是示出本发明实施例的虚拟机高可用的网络总体架构示意图;
图2是示出本发明实施例的虚拟机高可用的处理方法的流程图;
图3是示出本发明另一实施例的虚拟机高可用的处理方法的详细流程图;
图4是示出本发明实施例的虚拟机高可用的处理装置的结构示意图;
图5是示出能够实现根据本发明实施例的虚拟机高可用的处理方法和装置的计算设备的示例性硬件架构的结构图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
图1是示出本发明实施例的虚拟机高可用的网络总体架构示意图。
如图1所示,网络总体架构采用网络分离的方式搭建,分为第二网络和第一网络,第二网络可以为管理网络,第一网络可以为生产网络。计算节点监控服务器和虚拟机监控服务器部署在管理网络,采用网络交换机vlan隔离方式。
计算节点部署在生产网络,集群采用网络交换机vlan进行隔离,计算节点监控服务器监控集群中N个计算节点,每个计算节点上都安装有M个虚拟机,每个虚拟机都注册到虚拟机监控服务器上。虚拟机监控服务器用于监控虚拟机的状态,计算节点监控服务器监控计算节点的状态。通过对计算节点和虚拟机分别进行监控,并结合网络状况分析,定位故障原因,最终决定对故障计算节点上的虚拟机进行迁移。
通过采用计算节点和虚拟机分开监控、管理网络和生产网络分开监控的方式,提高了对虚拟机监控的有效性。同时对故障计算节点及时进行迁移,提升了计算节点高可用的有效性,以及也提高了迁移操作的效率和迁移操作的准确性。
需要理解的是,在本发明实施例中高可用(HighAvailability,HA)指的是通过尽量缩短因日常维护操作和突发的系统崩溃所导致的停机时间,以提高系统和应用的可用性。它与被认为是不间断操作的容错技术有所不同。
为了更好的理解本发明,下面将结合附图,详细描述根据本发明实施例的一种虚拟机高可用的处理方法、装置、设备和介质,应注意,这些实施例并不是用来限制本发明公开的范围。
图2是示出本发明实施例的虚拟机高可用的处理方法的流程图。如图2所示,本实施例中的虚拟机高可用的处理方法100包括以下步骤:
步骤S110,计算节点监控服务器监控集群中N个计算节点,每个计算节点上都安装有M个虚拟机,其中N为大于1的整数,M为大于1的整数。
在该步骤中,计算节点监控服务器监控集群中N个计算节点,是通过监测计算节点内部的内存剩余量和中央处理器(CPU),确定计算节点是否发送故障,发生故障的计算节点一般是内存剩余量很少,且CPU运行缓慢。
步骤S120,当计算节点监控服务器监控到存在故障计算节点时,云管理平台将故障计算节点中对应的M个虚拟机分别迁移至S个备选计算节点,S为大于或者等于1,且小于等于M的整数。
其中,计算节点均部署在第一网络上,每个虚拟机都注册到虚拟机监控服务器上,计算节点监控服务器和虚拟机监控服务器均部署在第二网络上。
在该步骤中,当监控到故障计算节点A时,将故障计算节点A上的M个虚拟机迁移到其他的计算节点,使得故障计算节点A上的M个虚拟机可以继续使用。在一示例中,还可以隔离故障计算节点,并记录故障计算节点地址ID。
通过采用计算节点和虚拟机分开监控、管理网络和生产网络分开监控的方式,提高了对虚拟机监控的有效性。同时对故障计算节点及时进行迁移,提升了计算节点高可用的有效性,以及也提高了迁移操作的效率和迁移操作的准确性。
在一实施例中,步骤S120可以包括以下:
步骤S121,当集群开启高可用程序时,根据M个虚拟机中每个虚拟机对应的业务性能,确定M个虚拟机中需要迁移至预标识专属群体的L个虚拟机,L为大于等于1,且小于等于M的整数。
在该步骤中,判断出集群是开启高可用程序的,选择手动方式或者发送短信确认的方式进行迁移,然后根据M个虚拟机中每个虚拟机对应的业务性能,确定每个虚拟机是否需要迁移至高可用的计算节点上。
具体的,根据每个虚拟机需要的备选计算节点的内存剩余量或者CPU性能等确定每个虚拟机是否需要迁移至高可用的备选计算节点上。
若是虚拟机对应的业务性能需求高,则需要迁移至高可用的备选计算节点。
若是虚拟机对应的业务性能需求一般,则不需要迁移至高可用的备选计算节点,只迁移至普通的备选计算节点即可。其中,预标识专属群体是指标识有底层性能高可用的多个计算节点的集合。
步骤S122,当L等于M时,云管理平台将M个虚拟机分别迁移至从预标识专属群体中挑选出的S个备选计算节点上,预标识专属群体是指标识有底层性能高可用的多个计算节点的集合。
在该步骤中,当确定出每个虚拟机对应的业务性能需求高,则需要将这M个虚拟机都迁移至可用的备选计算节点。
需要明白的是,高可用的备选计算节点都带有底层性能标识,且高可用的备选计算节点有可能属于该集群内部的,也可能属于该集群外部的其他集群中的。
步骤S122,当L小于M时,云管理平台将L个虚拟机迁移至从预标识专属群体中挑选出的Z个备选计算节点上,以及将M-L个虚拟机迁移至从非专属群体中挑选出的S-Z个备选计算节点上,非专属群体是指未标识有底层性能高可用的多个计算节点的集合,Z为大于等于1,且小于S的整数。
在该步骤中,当确定出L个虚拟机对应的业务性能需求高,而M-L个虚拟机对应的业务性能需求一般,因此,只需要将该L个虚拟机迁移至高可用的备选计算节点上,而M-L个虚拟机则迁移至一般的备选计算节点上即可。一般的备选计算节点是指未标识有底层性能高可用的多个计算节点的集合。
还需要理解的是,对于一般的备选计算节点,优先在该集群内部的一般的备选计算节点中选择一般的备选计算节点,当该集群内部不存在符合的一般的备选计算节点,则选择该集群外部其他的一般的备选计算节点。
同理,对于高可用的备选计算节点,优先在该集群内部的高可用的备选计算节点中选择一般的备选计算节点,当该集群内部不存在符合的高可用的备选计算节点,则选择该集群外部其他的高可用的备选计算节点。
在本发明实施例中,通过根据虚拟机的业务需求,选择不同性能的计算节点,这样可以避免资源的浪费,同时提升资源使用效率。另外,将虚拟机的业务需求高的迁移至高可用的备选计算节点,虚拟机的业务需求低的迁移至一般的备选计算节点。这样可以提升迁移操作效率和准确性,迁移过程易把控,迁移灵活。
在一实施例中,步骤S122可以包括以下两种情况:
第一种,当第一预标识专属群体中存在大于等于S个备选计算节点时,则云管理平台直接将M个虚拟机分别迁移至从第一预标识专属群体中找出的S个备选计算节点上。
在该步骤中,主要是根据优先选择策略,当M个虚拟机的业务需要求高,且在该集群内部存在足够的高可用的备选计算节点,则直接将这M个虚拟机迁移至该集群内部高可用的备选计算节点。这样可以提升资源使用效率,同时提升迁移操作效率和准确性。
第二种,当第一预标识专属群体中存在W个备选计算节点,且W小于S时,则云管理平台将M个虚拟机分别迁移至W个备选计算节点和从第二预标识专属群体中找出的S-W个备选计算节点上,W为大于等于1,且小于等于S的整数。
在该步骤中,当M个虚拟机的业务需要求高,且在该集群内部不存在足够的高可用的备选计算节点时,需要在该集群外部寻找剩余的高可用备选计算节点。这样可以确保M个虚拟机均对应到高可用备选计算节点,提高了提升迁移操作效率和准确性。
由于有些虚拟机的业务需求相同,因此需要进一步确定每个虚拟机对应的业务类型。确定每个虚拟机对应的业务类型的步骤如下:
确定M个虚拟机中每个虚拟机对应的业务类型。
当M个虚拟机中存在至少2个虚拟机的业务类型相同时,云管理平台将业务类型相同的至少2个虚拟机分别迁移至预标识专属群体中不同机柜的备选计算节点上,一个机柜上对应有多个计算节点。
在该步骤中,确定M个虚拟机中每个虚拟机对应的业务类型,目的是找出是否存在相同业务类型的至少2个虚拟机。
若是存在相同业务类型的至少2个虚拟机,那么需要将这至少2个虚拟机分别迁移至不同的机柜上。这样是为了避免相同业务类型的虚拟机都迁移至同一机柜上,从而避免虚拟机迁移容易造成阻塞,保障了虚拟机的业务连续。
还需要说明的是,在本发明实施例中S个备选计算节点是根据计算节点的内存剩余量和中央处理器CPU负载确定的。而机柜也是按照该机柜中的内存剩余量和中央处理器CPU负载确定的。
在一实施例中,当虚拟机监控服务器监控到某一虚拟机发生故障时,一般是重启该故障的虚拟机。
图3是示出本发明另一实施例的虚拟机高可用的处理方法的详细流程图。
如图3所示,步骤S301,当计算节点监控服务器发现有故障计算节点A时,执行步骤S302,同时还可以隔离该故障计算节点A。
步骤S302,确定故障计算节点A所在的集群是否开启了HA程序,当集群开启了HA程序时,执行步骤S304,当集群未开启HA程序时,执行步骤S303。
步骤S303,发送告警信息给故障计算节点A,并执行步骤S314。
步骤S304,确定该集群选择迁移的虚拟机的方式,当通过手动的方式选择迁移时,执行步骤S305,当选择全自动的方式时,执行步骤S307,当选择半自动的方式时,执行步骤S306。
步骤S305,通过手动的方式迁移故障计算节点A上的虚拟机,执行步骤S308。
步骤S306,发送确定迁移短信给移故障计算节点A,确定该移故障计算节点A上的虚拟机是否执行迁移,当执行迁移时,执行步骤S308,当不执行迁移时,执行步骤S315。
步骤S307,自动迁移故障计算节点A上的虚拟机,执行步骤S308。
步骤S308,选择迁移策略,当该集群内部有足够的备选计算节点,且待迁移的虚拟机的业务需求高时,执行步骤S309;当该集群内部有部分的高可用备选计算节点,且待迁移的虚拟机的业务需求高时,执行步骤S310。当该集群内部没有的高可用备选计算节点,待迁移的虚拟机的业务需求高时,执行步骤S311,当有部分虚拟机的业务需求是一般时,执行步骤S312。
步骤S309,在集群内部查找高可用的备选计算节点,将待迁移的虚拟机迁移至高可用的备选计算节点,执行步骤S315。
步骤S310,先在集群内部查找部分高可用的备选计算节点,然后在集群外部的其他集群也就是第二预标识专属群体中查找高可用的备选计算节点,然后将待迁移的虚拟机迁移至高可用的备选计算节点,执行步骤S315。
步骤S311,在集群内部没有高可用的备选计算节点,直接在集群外部的其他集群也就是第二预标识专属群体中查找高可用的备选计算节点,然后将待迁移的虚拟机迁移至高可用的备选计算节点,执行步骤S315。
步骤S312,先在预标识专属群体中查找出高可用的备选计算节点,然后在集群内部查找一般的备选计算节点,将待迁移的虚拟机迁移至的备选计算节点,执行步骤S315。
步骤S313,确定待迁移的每个虚拟机对应的业务类型,当存在至少2个虚拟机的业务类型相同时,将业务类型相同的至少2个虚拟机分别迁移至预标识专属群体中不同机柜的备选计算节点上,执行步骤S315。
步骤S314,对待迁移的虚拟机进行迁移处理,执行步骤S315。
步骤S315,结束。
本发明实施例通过采用计算节点和虚拟机分开监控、管理网络和生产网络分开监控的方式,提高了对虚拟机监控的有效性。同时对故障计算节点及时进行迁移,提升了计算节点高可用的有效性,以及也提高了迁移操作的效率和迁移操作的准确性。
下面结合附图,详细介绍根据本发明实施例的装置。
图4是示出本发明实施例的虚拟机高可用的处理装置的结构示意图。
如图4所示,虚拟机高可用的处理装置400包括:
计算节点监控服务器410、虚拟机监控服务器420和云管理平台440;
计算节点监控服务器410,用于监控集群中N个计算节点,每个计算节点上都安装有M个虚拟机,其中N为大于1的整数,M为大于1的整数;
云管理平台440,用于当计算节点监控服务器监控到存在故障计算节点时,将故障计算节点中对应的M个虚拟机分别迁移至S个备选计算节点,S为大于或者等于1,且小于等于M的整数;
其中,计算节点均部署在第一网络上,每个虚拟机都注册到虚拟机监控服务器上,计算节点监控服务器410和虚拟机监控服务器420均部署在第二网络上。
在本发明实施例中,通过采用计算节点和虚拟机分开监控、管理网络和生产网络分开监控的方式,提高了对虚拟机监控的有效性。同时对发生故障的计算节点及时进行迁移,提升了计算节点高可用的有效性以及也提高了迁移操作的效率和迁移操作的准确性。
在一实施例中,云管理平台440,具体用于当集群开启高可用程序时,根据M个虚拟机中每个虚拟机对应的业务性能,确定M个虚拟机中需要迁移至预标识专属群体的L个虚拟机,L为大于等于1,且小于等于M的整数。
云管理平台440,当L等于M时,将M个虚拟机分别迁移至从预标识专属群体中挑选出的S个备选计算节点上,预标识专属群体是指标识有底层性能高可用的多个计算节点的集合。
云管理平台440,用于当L小于M时,将L个虚拟机迁移至从预标识专属群体中挑选出的Z个备选计算节点上,以及将M-L个虚拟机迁移至从非专属群体中挑选出的S-Z个备选计算节点上,非专属群体是指未标识有底层性能高可用的多个计算节点的集合,Z为大于等于1,且小于S的整数。
在一实施例中,预标识专属群体,包括:第一预标识专属群体和第二预标识专属群体;第一预标识专属群体是指集群中标识有底层性能高可用的多个计算节点的集合;第二预标识专属群体是指除集群外的其他集群中标识有底层性能高可用的多个计算节点的集合。
在一实施例中,云管理平台440,具体用于当第一预标识专属群体中存在大于等于S个备选计算节点时,则直接将M个虚拟机分别迁移至从所述第一预标识专属群体中找出的所述S个备选计算节点上;
或者,云管理平台440,具体用于当第一预标识专属群体中存在W个备选计算节点,且W小于S时,将M个虚拟机分别迁移至W个备选计算节点和从第二预标识专属群体中找出的S-W个备选计算节点上,W为大于等于1,且小于等于S的整数。
在一实施例中,云管理平台440,具体用于确定M个虚拟机中每个虚拟机对应的业务类型;当M个虚拟机中存在至少2个虚拟机的业务类型相同时,将业务类型相同的所述至少2个虚拟机分别迁移至预标识专属群体中不同机柜的备选计算节点上,一个机柜上对应有多个计算节点。
在一实施例中,S个备选计算节点是根据计算节点的内存剩余量和中央处理器CPU负载确定的。
在一实施例中,虚拟机监控服务器420,还用于监控虚拟机;当存在故障虚拟机时,重启故障虚拟机。
在本发明实施例中,通过根据虚拟机的业务需求,选择不同性能的计算节点,这样是可以避免资源的浪费,同时提升资源使用效率。另外,将虚拟机的业务需求高的迁移至高可用的备选计算节点,虚拟机的业务需求低的迁移至一般的备选计算节点。这样可以提升迁移操作效率和准确性,迁移过程易把控,迁移灵活。
根据本发明实施例的虚拟机高可用的处理装置的其他细节与以上结合图1至图4描述的根据本发明实施例的方法类似,在此不再赘述。
图5是示出能够实现根据本发明实施例的虚拟机高可用的处理方法和装置的计算设备的示例性硬件架构的结构图。
如图5所示,计算设备500包括输入设备501、输入接口502、中央处理器503、存储器504、输出接口505、以及输出设备506。其中,输入接口502、中央处理器503、存储器504、以及输出接口505通过总线510相互连接,输入设备501和输出设备506分别通过输入接口502和输出接口505与总线510连接,进而与计算设备500的其他组件连接。具体地,输入设备501接收来自外部的输入信息,并通过输入接口502将输入信息传送到中央处理器503;中央处理器503基于存储器504中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器504中,然后通过输出接口505将输出信息传送到输出设备506;输出设备506将输出信息输出到计算设备500的外部供用户使用。
在一个实施例中,图5所示的计算设备500可以被实现为一种终端设备,包括:存储器和处理器;存储器用于储存有可执行程序代码;处理器用于读取存储器中存储的可执行程序代码以执行上述实施例的处理方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品或计算机可读存储介质的形式实现。所述计算机程序产品或计算机可读存储介质包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidStateDisk(SSD))等。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (14)

1.一种虚拟机高可用的处理方法,其特征在于,所述处理方法包括:
计算节点监控服务器监控集群中N个计算节点,每个计算节点上都安装有M个虚拟机,其中N为大于1的整数,M为大于1的整数;
当所述计算节点监控服务器监控到存在故障计算节点时,云管理平台将所述故障计算节点中对应的所述M个虚拟机分别迁移至S个备选计算节点,S为大于或者等于1,且小于等于M的整数;
其中,所述计算节点均部署在第一网络上,每个虚拟机都注册到虚拟机监控服务器上,所述计算节点监控服务器和所述虚拟机监控服务器均部署在第二网络上,所述第一网络为生产网络、所述第二网络为管理网络,所述计算节点监控服务器和所述虚拟机监控服务器之间通过网络交换机vlan进行隔离。
2.根据权利要求1所述的处理方法,其特征在于,所述云管理平台将所述故障计算节点中对应的M个虚拟机分别迁移至S个备选计算节点,包括:
当所述集群开启高可用程序时,根据所述M个虚拟机中每个虚拟机对应的业务性能,确定所述M个虚拟机中需要迁移至预标识专属群体的L个虚拟机,L为大于等于1,且小于等于M的整数;
当L等于M时,所述云管理平台将所述M个虚拟机分别迁移至从所述预标识专属群体中挑选出的所述S个备选计算节点上,所述预标识专属群体是指标识有底层性能高可用的多个计算节点的集合;
或者,
当L小于M时,所述云管理平台将所述L个虚拟机迁移至从所述预标识专属群体中挑选出的Z个备选计算节点上,以及将M-L个虚拟机迁移至从非专属群体中挑选出的S-Z个备选计算节点上,所述非专属群体是指未标识有底层性能高可用的多个计算节点的集合,Z为大于等于1,且小于S的整数。
3.根据权利要求2所述的处理方法,其特征在于,所述预标识专属群体,包括:第一预标识专属群体和第二预标识专属群体;所述第一预标识专属群体是指所述集群中标识有底层性能高可用的多个计算节点的集合;所述第二预标识专属群体是指除所述集群外的其他集群中标识有底层性能高可用的多个计算节点的集合。
4.根据权利要求3所述的处理方法,其特征在于,所述当L等于M时,所述云管理平台将所述M个虚拟机分别迁移至从所述预标识专属群体中挑选出的所述S个备选计算节点上,包括:
当所述第一预标识专属群体中存在大于等于S个备选计算节点时,则所述云管理平台直接将所述M个虚拟机分别迁移至从所述第一预标识专属群体中找出的所述S个备选计算节点上;
或者,
当所述第一预标识专属群体中存在W个备选计算节点,且W小于S时,则所述云管理平台将所述M个虚拟机分别迁移至所述W个备选计算节点和从所述第二预标识专属群体中找出的S-W个备选计算节点上,W为大于等于1,且小于等于S的整数。
5.根据权利要求2所述的处理方法,其特征在于,所述云管理平台将所述M个虚拟机分别迁移至从所述预标识专属群体中挑选出的所述S个备选计算节点上,包括:
确定所述M个虚拟机中每个虚拟机对应的业务类型;
当所述M个虚拟机中存在至少2个虚拟机的业务类型相同时,所述云管理平台将业务类型相同的所述至少2个虚拟机分别迁移至所述预标识专属群体中不同机柜的备选计算节点上,一个机柜上对应有多个计算节点。
6.根据权利要求1-5任一所述的处理方法,其特征在于,所述S个备选计算节点是根据计算节点的内存剩余量和中央处理器CPU负载确定的。
7.根据权利要求1所述的处理方法,其特征在于,所述方法还包括:
所述虚拟机监控服务器监控所述虚拟机;
当存在故障虚拟机时,重启所述故障虚拟机。
8.根据权利要求1所述的处理方法,其特征在于,所述当监控到存在故障计算节点时,所述方法还包括:
隔离所述故障计算节点,并记录所述故障计算节点地址ID。
9.一种虚拟机高可用的处理装置,其特征在于,所述处理装置包括:
计算节点监控服务器、虚拟机监控服务器和云管理平台
所述计算节点监控服务器,用于监控集群中N个计算节点,每个计算节点上都安装有M个虚拟机,其中N为大于1的整数,M为大于1的整数;
所述云管理平台,用于当所述计算节点监控服务器监控到存在故障计算节点时,将所述故障计算节点中对应的所述M个虚拟机分别迁移至S个备选计算节点,S为大于或者等于1,且小于等于M的整数;
其中,所述计算节点均部署在第一网络上,每个虚拟机都注册到虚拟机监控服务器上,所述计算节点监控服务器和所述虚拟机监控服务器均部署在第二网络上,所述第一网络为生产网络、所述第二网络为管理网络,所述计算节点监控服务器和所述虚拟机监控服务器之间通过网络交换机vlan进行隔离。
10.根据权利要求9所述的装置,其特征在于,所述云管理平台,具体用于当所述集群开启高可用程序时,根据所述M个虚拟机中每个虚拟机对应的业务性能,确定所述M个虚拟机中需要迁移至预标识专属群体的L个虚拟机,L为大于等于1,且小于等于M的整数;
当L等于M时,将所述M个虚拟机分别迁移至从所述预标识专属群体中挑选出的所述S个备选计算节点上,所述预标识专属群体是指标识有底层性能高可用的多个计算节点的集合;
或者,
用于当L小于M时,将所述L个虚拟机迁移至从所述预标识专属群体中挑选出的Z个备选计算节点上,以及将M-L个虚拟机迁移至从非专属群体中挑选出的S-Z个备选计算节点上,所述非专属群体是指未标识有底层性能高可用的多个计算节点的集合,Z为大于等于1,且小于S的整数。
11.根据权利要求10所述的装置,其特征在于,所述预标识专属群体,包括:第一预标识专属群体和第二预标识专属群体;所述第一预标识专属群体是指所述集群中标识有底层性能高可用的多个计算节点的集合;所述第二预标识专属群体是指除所述集群外的其他集群中标识有底层性能高可用的多个计算节点的集合。
12.根据权利要求11所述的装置,其特征在于,所述云管理平台,具体用于当所述第一预标识专属群体中存在大于等于S个备选计算节点时,直接将所述M个虚拟机分别迁移至从所述第一预标识专属群体中找出的所述S个备选计算节点上;
或者,
用于当所述第一预标识专属群体中存在W个备选计算节点,且W小于S时,将所述M个虚拟机分别迁移至所述W个备选计算节点和从所述第二预标识专属群体中找出的S-W个备选计算节点上,W为大于等于1,且小于等于S的整数。
13.一种终端设备,其特征在于,包括:
存储器、处理器、通信接口和总线;
所述存储器、所述处理器和所述通信接口通过所述总线连接并完成相互间的通信;
所述存储器用于存储程序代码;
所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行如权利要求1至8任一项所述的处理方法。
14.一种计算机存储介质,其特征在于,包括指令,当所述指令在计算机上运行时,使所述计算机执行如权利要求1至8任一项所述的处理方法。
CN201810934887.XA 2018-08-16 2018-08-16 虚拟机高可用的处理方法、装置、设备和介质 Active CN110837451B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810934887.XA CN110837451B (zh) 2018-08-16 2018-08-16 虚拟机高可用的处理方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810934887.XA CN110837451B (zh) 2018-08-16 2018-08-16 虚拟机高可用的处理方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN110837451A CN110837451A (zh) 2020-02-25
CN110837451B true CN110837451B (zh) 2023-08-15

Family

ID=69573220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810934887.XA Active CN110837451B (zh) 2018-08-16 2018-08-16 虚拟机高可用的处理方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN110837451B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102110071A (zh) * 2011-03-04 2011-06-29 浪潮(北京)电子信息产业有限公司 一种虚拟机集群系统及其实现方法
CN103106126A (zh) * 2013-01-16 2013-05-15 浪潮电子信息产业股份有限公司 一种基于虚拟化的高可用计算机系统
CN104184837A (zh) * 2014-09-15 2014-12-03 北京尖峰合讯科技有限公司 高可用云计算一体机
CN107544839A (zh) * 2016-06-27 2018-01-05 腾讯科技(深圳)有限公司 虚拟机迁移系统、方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9282014B2 (en) * 2013-01-23 2016-03-08 International Business Machines Corporation Server restart management via stability time

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102110071A (zh) * 2011-03-04 2011-06-29 浪潮(北京)电子信息产业有限公司 一种虚拟机集群系统及其实现方法
CN103106126A (zh) * 2013-01-16 2013-05-15 浪潮电子信息产业股份有限公司 一种基于虚拟化的高可用计算机系统
CN104184837A (zh) * 2014-09-15 2014-12-03 北京尖峰合讯科技有限公司 高可用云计算一体机
CN107544839A (zh) * 2016-06-27 2018-01-05 腾讯科技(深圳)有限公司 虚拟机迁移系统、方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于云存储方式进行数据备份的研究及实现;谭文贵等;《电子技术与软件工程》;20170907(第17期);192-193 *

Also Published As

Publication number Publication date
CN110837451A (zh) 2020-02-25

Similar Documents

Publication Publication Date Title
CN107526659B (zh) 用于失效备援的方法和设备
US8910172B2 (en) Application resource switchover systems and methods
US8615676B2 (en) Providing first field data capture in a virtual input/output server (VIOS) cluster environment with cluster-aware vioses
CN108923992B (zh) 一种nas集群高可用方法、系统及电子设备和存储介质
US8856585B2 (en) Hardware failure mitigation
CN108347339B (zh) 一种业务恢复方法及装置
EP3306476B1 (en) Method and apparatus for hot cpu removal and hot cpu adding during operation
JP2013535745A (ja) 高可用性仮想機械環境におけるアプリケーションの高可用性の提供
US9223606B1 (en) Automatically configuring and maintaining cluster level high availability of a virtual machine running an application according to an application level specified service level agreement
US20180101413A1 (en) Control device and control method
CN112948063B (zh) 云平台的创建方法、装置、云平台以及云平台实现系统
US11093353B2 (en) Virtual network system, VIM, virtual network control method and recording medium
CN111147567A (zh) 服务调用方法、装置、设备及介质
CN103973470A (zh) 用于无共享集群的集群管理方法和设备
CN110737924B (zh) 一种数据保护的方法和设备
US8661089B2 (en) VIOS cluster alert framework
JP6179119B2 (ja) 管理装置、管理方法、及び管理プログラム
CN107453888B (zh) 高可用性的虚拟机集群的管理方法及装置
EP4006725A1 (en) Virtual machine migration processing and strategy generation method, apparatus and device, and storage medium
CN110837451B (zh) 虚拟机高可用的处理方法、装置、设备和介质
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
CN111309515A (zh) 一种容灾控制方法、装置及系统
CN111385352A (zh) 一种实例的控制方法、节点、终端和分布式存储系统
US9143410B1 (en) Techniques for monitoring guest domains configured with alternate I/O domains
CN113254245A (zh) 一种存储集群的故障检测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant