CN117234799A - 一种云主机高可用的方法、装置、设备及介质 - Google Patents

一种云主机高可用的方法、装置、设备及介质 Download PDF

Info

Publication number
CN117234799A
CN117234799A CN202311161263.6A CN202311161263A CN117234799A CN 117234799 A CN117234799 A CN 117234799A CN 202311161263 A CN202311161263 A CN 202311161263A CN 117234799 A CN117234799 A CN 117234799A
Authority
CN
China
Prior art keywords
cloud host
backup
creating
host
cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311161263.6A
Other languages
English (en)
Inventor
班凌航
黄伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Data Technology Co Ltd
Original Assignee
Jinan Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Data Technology Co Ltd filed Critical Jinan Inspur Data Technology Co Ltd
Priority to CN202311161263.6A priority Critical patent/CN117234799A/zh
Publication of CN117234799A publication Critical patent/CN117234799A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种云主机高可用的方法、装置、设备及可读介质,方法包括:为云主机创建本地存储池,每经过预设时间将云主机的磁盘数据备份到本地存储池中;为云主机设置蓝屏策略,并为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机;响应于云主机发生故障,执行云主机蓝屏策略,并检测云主机的存储端是否可用;响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务。通过使用本发明的方案,能够快速恢复云主机上的业务,达到业务高可用的效果,避免云主机无法开机影响业务的使用,在云主机的后端存储不可用的情况下,可以使用备份云主机先行恢复业务,保障业务的连续性。

Description

一种云主机高可用的方法、装置、设备及介质
技术领域
本发明涉及计算机领域,并且更具体地涉及一种云主机高可用的方法、装置、设备及可读介质。
背景技术
云计算(Cloud Computing)是当今IT界的热门技术,借助云计算,网络服务提供者可以在瞬息之间,处理数以千万计甚至亿计的信息,实现和超级计算机同样强大的效能。云计算系统通常采用云主机软件来构建,也是云计算系统中的核心技术。随着云计算和大数据行业的兴起和发展,各个行业均有涉及,OpenStack(OpenStack是一个开源的云计算管理平台项目,是一系列软件开源项目的组合,为私有云和公有云提供可扩展的弹性的云计算服务。项目目标是提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台)也得到了大力推广,因为OpenStack的资源分配更加灵活,依靠虚拟化技术,可以按需分配到对应用户,比较适应于大数据应用对硬件资源动态变化的需求,因此OpenStack对大数据行业的发展提供了充分的支持。
目前OpenStack处理云主机故障高可用的方案主要是在Masakari检测到云主机进程挂掉之后,通过停止云主机、启动云主机、确认云主机状态为active三步来完成云主机的故障恢复。如果云主机文件由于人为原因受损、内容缺失,或者后端存储磁盘异常等情况,就会导致云主机无法正常启动,就会导致到虚机上所运行的业务长时间中断,进而影响到云主机上所运行业务的使用者,给客户造成一定的经济损失。
发明内容
有鉴于此,本发明实施例的目的在于提出一种云主机高可用的方法、装置、设备及可读介质,通过使用本发明的技术方案,能够快速恢复云主机上的业务,达到业务高可用的效果,避免云主机无法开机影响业务的使用,在云主机的后端存储不可用的情况下,可以使用备份云主机先行恢复业务,保障业务的连续性。
基于上述目的,本发明的实施例的一个方面提供了一种云主机高可用的方法,包括以下步骤:
为云主机创建本地存储池,每经过预设时间将云主机的磁盘数据备份到本地存储池中;
为云主机设置蓝屏策略,并为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机;
响应于云主机发生故障,执行云主机蓝屏策略,并检测云主机的存储端是否可用;
响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务。
根据本发明的一个实施例,还包括:
响应于云主机的存储端不可用,启用在本地存储池中存储的备份云主机以提供服务。
根据本发明的一个实施例,为云主机设置蓝屏策略包括:
响应于检测到云主机发生故障,将云主机进行关机处理。
根据本发明的一个实施例,为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机包括:
统计历史数据中每天每个时间段内云主机的业务量,其中时间段以小时为单位;
基于每个时间段的业务量选择出业务量少的几个时间段;
在业务量少的几个时间段内将云主机的磁盘数据备份到本地存储池中;
在本地存储池中对云主机的磁盘数据进行克隆以得到克隆卷;
在本地存储池中基于克隆卷创建备份云主机;
响应于备份云主机创建完成,将备份云主机进行关机;
响应于备份云主机关机成功,将本地存储池中前一天创建的备份云主机进行删除。
根据本发明的一个实施例,在响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务的步骤之后还包括:
检查云主机的故障原因,并检查新的云主机上的业务运行情况和数据完整性;
响应于检查结果为业务运行正常,将故障的云主机和备份云主机执行删除操作,并对新的云主机创建定时克隆任务。
根据本发明的一个实施例,在响应于云主机的存储端不可用,启用在本地存储池中存储的备份云主机以提供服务的步骤之后还包括:
检查云主机的故障原因,并恢复云主机的存储端;
响应于云主机的存储端恢复正常,将本地存储池中克隆的数据在线迁移到云主机的存储端中;
删除故障的云主机和对应的磁盘数据,并对备份云主机创建定时克隆任务。
根据本发明的一个实施例,为云主机设置蓝屏策略包括:
响应于检测到云主机发生故障,将云主机进行重启处理;
响应于云主机重启完成,检查云主机是否能够正常使用;
响应于云主机不能够正常使用,将云主机进行关机处理。
本发明的实施例的另一个方面,还提供了一种云主机高可用的装置,装置包括:
备份模块,备份模块配置成为云主机创建本地存储池,每经过预设时间将云主机的磁盘数据备份到本地存储池中;
创建模块,创建模块配置成为云主机设置蓝屏策略,并为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机;
检测模块,检测模块配置为响应于云主机发生故障,执行云主机蓝屏策略,并检测云主机的存储端是否可用;
执行模块,执行模块配置为响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务。
本发明的实施例的另一个方面,还提供了一种计算机设备,该计算机设备包括:
至少一个处理器;以及
存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任意一项方法的步骤。
本发明的实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意一项方法的步骤。
本发明具有以下有益技术效果:本发明实施例提供的云主机高可用的方法,通过为云主机创建本地存储池,每经过预设时间将云主机的磁盘数据备份到本地存储池中;为云主机设置蓝屏策略,并为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机;响应于云主机发生故障,执行云主机蓝屏策略,并检测云主机的存储端是否可用;响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务的技术方案,能够快速恢复云主机上的业务,达到业务高可用的效果,避免云主机无法开机影响业务的使用,在云主机的后端存储不可用的情况下,可以使用备份云主机先行恢复业务,保障业务的连续性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为根据本发明一个实施例的云主机高可用的方法的示意性流程图;
图2为根据本发明一个实施例的云主机高可用的方法的示意图;
图3为根据本发明一个实施例的创建定时克隆任务的示意图;
图4为根据本发明一个实施例的处理云主机故障的示意图;
图5为根据本发明一个实施例的云主机高可用的装置的示意图;
图6为根据本发明一个实施例的计算机设备的示意图;
图7为根据本发明一个实施例的计算机可读存储介质的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
基于上述目的,本发明的实施例的第一个方面,提出了一种云主机高可用的方法的一个实施例。图1示出的是该方法的示意性流程图。
如图1中所示,该方法可以包括以下步骤:
S1为云主机创建本地存储池,每经过预设时间将云主机的磁盘数据备份到本地存储池中。配置一个本地存储池rbd_lvm,并对接到当前的OpenStack环境上,主要存放备份云主机和云主机磁盘数据。
S2为云主机设置蓝屏策略,并为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机。蓝屏策略可以设置为如果检测到云主机发生故障,则直接将云主机进行关机处理。还可以设置为如果检测到云主机发生故障,先将云主机进行重启处理,如果云主机重启完成,则检查云主机是否能够正常使用,如果云主机不能够正常使用,再将云主机进行关机处理,将云主机进行关机目的是不影响备份云主机上业务的运行和使用。克隆任务需要在云主机业务量较小的时候进行,需要统计历史数据中每天每个时间段内云主机的业务量,其中时间段以小时为单位,基于每个时间段的业务量选择出业务量少的几个时间段,在业务量少的几个时间段内将云主机的磁盘数据备份到本地存储池中,在本地存储池中对云主机的磁盘数据进行克隆以得到克隆卷,在本地存储池中基于克隆卷创建备份云主机,如果备份云主机创建完成,则将备份云主机进行关机,如果备份云主机关机成功,将本地存储池中前一天创建的备份云主机进行删除,也就是说本地存储池中只保留最新的备份云主机。
S3响应于云主机发生故障,执行云主机蓝屏策略,并检测云主机的存储端是否可用。云主机发生故障时,执行上述的蓝屏策略,并检测云主机的存储端是否可以正常使用。
S4响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务。如图2所示,如果云主机的后端存储可以正常使用,则直接使用云主机的系统卷克隆一个新卷,根据新卷创建新的云主机,使用新的云主机替换故障的云主机。然后检查云主机的故障原因,并检查新的云主机上的业务运行情况和数据完整性,如果检查结果为业务运行正常,则将故障的云主机和备份云主机执行删除操作,并对新的云主机创建定时克隆任务。
通过使用本发明的技术方案,能够快速恢复云主机上的业务,达到业务高可用的效果,避免云主机无法开机影响业务的使用,在云主机的后端存储不可用的情况下,可以使用备份云主机先行恢复业务,保障业务的连续性。
在本发明的一个优选实施例中,还包括:
响应于云主机的存储端不可用,启用在本地存储池中存储的备份云主机以提供服务。如图2所示,如果云主机的后端存储不能正常使用,则启用在本地存储池中存储的备份云主机对外提供服务。然后检查云主机的故障原因,并恢复云主机的存储端,如果云主机的存储端恢复正常,则将本地存储池中克隆的数据在线迁移到云主机的存储端中,并删除故障的云主机和对应的磁盘数据,并对备份云主机创建定时克隆任务。
在本发明的一个优选实施例中,为云主机设置蓝屏策略包括:
响应于检测到云主机发生故障,将云主机进行关机处理。登录OpenStack,为运行了关键业务的云主机VM01设置蓝屏策略为:关机,目的是为了在检测到云主机VM01出现故障时,将云主机VM01执行关机处理,不影响备份云主机上业务的运行和使用。
在本发明的一个优选实施例中,为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机包括:
统计历史数据中每天每个时间段内云主机的业务量,其中时间段以小时为单位;
基于每个时间段的业务量选择出业务量少的几个时间段;
在业务量少的几个时间段内将云主机的磁盘数据备份到本地存储池中;
在本地存储池中对云主机的磁盘数据进行克隆以得到克隆卷;
在本地存储池中基于克隆卷创建备份云主机;
响应于备份云主机创建完成,将备份云主机进行关机;
响应于备份云主机关机成功,将本地存储池中前一天创建的备份云主机进行删除。如图3所示,为云主机VM01的系统盘Volume01创建定时克隆任务,选择每天最少使用业务的时间点来创建,以减少对OpenStack系统的影响,克隆的卷类型选择本地存储池进行创建,将克隆的卷放在本地存储池中备用。使用克隆好的卷Volume02创建备份云主机VM02,并将VM02设置为创建完成后关机,避免对VM01上的业务造成影响。每天创建好新的备份云主机之后,需对前一天创建的备份云主机执行删除操作,仅保留最新的备份云主机。
如图4所示,在第一中场景中,实时监测主云主机VM01的高可用事件及电源状态,当检测到云主机VM01出现故障,触发云主机高可用事件,且云主机状态为关机时,检查云主机VM01所用的存储后端是否正常,如果存储后端正常可用,使用云主机VM01的系统卷Volume01克隆一个新的卷Vloume03,并使用Volume03创建一个备份云主机VM03,创建好之后执行开机操作,从而达到云主机VM01上业务高可用的效果。
在第二中场景中,实时监测主云主机VM01的高可用事件及电源状态,当检测到云主机VM01出现故障,触发云主机高可用事件,且云主机状态为关机时,检查云主机VM01所用的存储后端是否正常,如果存储后端异常,无法执行系统卷的克隆操作时,为避免主云主机VM01上的业务不中断,则给出告警信息,由运维人员评估并选择是否启用创建在本地存储池的备份云主机VM02,如评估可用,则直接对备份云主机VM02执行开机操作,达到恢复主云主机VM01上的业务的效果。
在本发明的一个优选实施例中,在响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务的步骤之后还包括:
检查云主机的故障原因,并检查新的云主机上的业务运行情况和数据完整性;
响应于检查结果为业务运行正常,将故障的云主机和备份云主机执行删除操作,并对新的云主机创建定时克隆任务。在第一场景中,备份云主机VM03运行正常后,检查主云主机VM01的故障原因,及VM03上的业务运行情况和数据完整性,排查完成且业务运行正常后,将主云主机VM01和备份云主机VM02执行删除操作,并对VM03设置定时克隆任务,保障VM03的业务运行高可用性。
在本发明的一个优选实施例中,在响应于云主机的存储端不可用,启用在本地存储池中存储的备份云主机以提供服务的步骤之后还包括:
检查云主机的故障原因,并恢复云主机的存储端;
响应于云主机的存储端恢复正常,将本地存储池中克隆的数据在线迁移到云主机的存储端中;
删除故障的云主机和对应的磁盘数据,并对备份云主机创建定时克隆任务。在第二场景中,检查故障原因,并恢复后端存储rbd01,存储恢复正常后,对本地卷Volume02执行在线迁移操作,将其迁移到rbd01上,并删除主云主机VM01及Volume01,并对VM02设置定时克隆任务,保障VM02的业务运行高可用性。
在本发明的一个优选实施例中,为云主机设置蓝屏策略包括:
响应于检测到云主机发生故障,将云主机进行重启处理;
响应于云主机重启完成,检查云主机是否能够正常使用;
响应于云主机不能够正常使用,将云主机进行关机处理。
通过使用本发明的技术方案,当OpenStack平台上的业务云主机故障时,在后端存储池可用的情况下,可以快速恢复云主机上的业务,达到业务高可用的效果,避免云主机无法开机,影响业务的使用。当OpenStack平台上的业务云主机故障,且后端存储池不可用的情况下,可以使用备份云主机先行恢复业务,保障业务的连续性。
需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,上述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中存储介质可为磁碟、光盘、只读存储器(Read-Only Memory,ROM)或随机存取存储器(Random AccessMemory,RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
此外,根据本发明实施例公开的方法还可以被实现为由CPU执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被CPU执行时,执行本发明实施例公开的方法中限定的上述功能。
基于上述目的,本发明的实施例的第二个方面,提出了一种云主机高可用的装置,如图5所示,装置200包括:
备份模块,备份模块配置成为云主机创建本地存储池,每经过预设时间将云主机的磁盘数据备份到本地存储池中;
创建模块,创建模块配置成为云主机设置蓝屏策略,并为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机;
检测模块,检测模块配置为响应于云主机发生故障,执行云主机蓝屏策略,并检测云主机的存储端是否可用;
执行模块,执行模块配置为响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务。
基于上述目的,本发明实施例的第三个方面,提出了一种计算机设备。图6示出的是本发明提供的计算机设备的实施例的示意图。如图6所示,本发明实施例包括如下装置:至少一个处理器21;以及存储器22,存储器22存储有可在处理器上运行的计算机指令23,指令由处理器执行时实现以下方法:
为云主机创建本地存储池,每经过预设时间将云主机的磁盘数据备份到本地存储池中;
为云主机设置蓝屏策略,并为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机;
响应于云主机发生故障,执行云主机蓝屏策略,并检测云主机的存储端是否可用;
响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务。
在本发明的一个优选实施例中,还包括:
响应于云主机的存储端不可用,启用在本地存储池中存储的备份云主机以提供服务。
在本发明的一个优选实施例中,为云主机设置蓝屏策略包括:
响应于检测到云主机发生故障,将云主机进行关机处理。
在本发明的一个优选实施例中,为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机包括:
统计历史数据中每天每个时间段内云主机的业务量,其中时间段以小时为单位;
基于每个时间段的业务量选择出业务量少的几个时间段;
在业务量少的几个时间段内将云主机的磁盘数据备份到本地存储池中;
在本地存储池中对云主机的磁盘数据进行克隆以得到克隆卷;
在本地存储池中基于克隆卷创建备份云主机;
响应于备份云主机创建完成,将备份云主机进行关机;
响应于备份云主机关机成功,将本地存储池中前一天创建的备份云主机进行删除。
在本发明的一个优选实施例中,在响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务的步骤之后还包括:
检查云主机的故障原因,并检查新的云主机上的业务运行情况和数据完整性;
响应于检查结果为业务运行正常,将故障的云主机和备份云主机执行删除操作,并对新的云主机创建定时克隆任务。
在本发明的一个优选实施例中,在响应于云主机的存储端不可用,启用在本地存储池中存储的备份云主机以提供服务的步骤之后还包括:
检查云主机的故障原因,并恢复云主机的存储端;
响应于云主机的存储端恢复正常,将本地存储池中克隆的数据在线迁移到云主机的存储端中;
删除故障的云主机和对应的磁盘数据,并对备份云主机创建定时克隆任务。
在本发明的一个优选实施例中,为云主机设置蓝屏策略包括:
响应于检测到云主机发生故障,将云主机进行重启处理;
响应于云主机重启完成,检查云主机是否能够正常使用;
响应于云主机不能够正常使用,将云主机进行关机处理。
基于上述目的,本发明实施例的第四个方面,提出了一种计算机可读存储介质。图7示出的是本发明提供的计算机可读存储介质的实施例的示意图。如图7所示,计算机可读存储介质31存储有被处理器执行时执行如下方法的计算机程序32:
为云主机创建本地存储池,每经过预设时间将云主机的磁盘数据备份到本地存储池中;
为云主机设置蓝屏策略,并为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机;
响应于云主机发生故障,执行云主机蓝屏策略,并检测云主机的存储端是否可用;
响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务。
在本发明的一个优选实施例中,还包括:
响应于云主机的存储端不可用,启用在本地存储池中存储的备份云主机以提供服务。
在本发明的一个优选实施例中,为云主机设置蓝屏策略包括:
响应于检测到云主机发生故障,将云主机进行关机处理。
在本发明的一个优选实施例中,为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机包括:
统计历史数据中每天每个时间段内云主机的业务量,其中时间段以小时为单位;
基于每个时间段的业务量选择出业务量少的几个时间段;
在业务量少的几个时间段内将云主机的磁盘数据备份到本地存储池中;
在本地存储池中对云主机的磁盘数据进行克隆以得到克隆卷;
在本地存储池中基于克隆卷创建备份云主机;
响应于备份云主机创建完成,将备份云主机进行关机;
响应于备份云主机关机成功,将本地存储池中前一天创建的备份云主机进行删除。
在本发明的一个优选实施例中,在响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务的步骤之后还包括:
检查云主机的故障原因,并检查新的云主机上的业务运行情况和数据完整性;
响应于检查结果为业务运行正常,将故障的云主机和备份云主机执行删除操作,并对新的云主机创建定时克隆任务。
在本发明的一个优选实施例中,在响应于云主机的存储端不可用,启用在本地存储池中存储的备份云主机以提供服务的步骤之后还包括:
检查云主机的故障原因,并恢复云主机的存储端;
响应于云主机的存储端恢复正常,将本地存储池中克隆的数据在线迁移到云主机的存储端中;
删除故障的云主机和对应的磁盘数据,并对备份云主机创建定时克隆任务。
在本发明的一个优选实施例中,为云主机设置蓝屏策略包括:
响应于检测到云主机发生故障,将云主机进行重启处理;
响应于云主机重启完成,检查云主机是否能够正常使用;
响应于云主机不能够正常使用,将云主机进行关机处理。
此外,根据本发明实施例公开的方法还可以被实现为由处理器执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被处理器执行时,执行本发明实施例公开的方法中限定的上述功能。
此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(DSL)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、DSL或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(CD)、激光盘、光盘、数字多功能盘(DVD)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (10)

1.一种云主机高可用的方法,其特征在于,包括以下步骤:
为云主机创建本地存储池,每经过预设时间将云主机的磁盘数据备份到本地存储池中;
为云主机设置蓝屏策略,并为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机;
响应于云主机发生故障,执行云主机蓝屏策略,并检测云主机的存储端是否可用;
响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务。
2.根据权利要求1所述的方法,其特征在于,还包括:
响应于云主机的存储端不可用,启用在本地存储池中存储的备份云主机以提供服务。
3.根据权利要求1所述的方法,其特征在于,为云主机设置蓝屏策略包括:
响应于检测到云主机发生故障,将云主机进行关机处理。
4.根据权利要求1所述的方法,其特征在于,为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机包括:
统计历史数据中每天每个时间段内云主机的业务量,其中时间段以小时为单位;
基于每个时间段的业务量选择出业务量少的几个时间段;
在业务量少的几个时间段内将云主机的磁盘数据备份到本地存储池中;
在本地存储池中对云主机的磁盘数据进行克隆以得到克隆卷;
在本地存储池中基于克隆卷创建备份云主机;
响应于备份云主机创建完成,将备份云主机进行关机;
响应于备份云主机关机成功,将本地存储池中前一天创建的备份云主机进行删除。
5.根据权利要求1所述的方法,其特征在于,在响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务的步骤之后还包括:
检查云主机的故障原因,并检查新的云主机上的业务运行情况和数据完整性;
响应于检查结果为业务运行正常,将故障的云主机和备份云主机执行删除操作,并对新的云主机创建定时克隆任务。
6.根据权利要求2所述的方法,其特征在于,在响应于云主机的存储端不可用,启用在本地存储池中存储的备份云主机以提供服务的步骤之后还包括:
检查云主机的故障原因,并恢复云主机的存储端;
响应于云主机的存储端恢复正常,将本地存储池中克隆的数据在线迁移到云主机的存储端中;
删除故障的云主机和对应的磁盘数据,并对备份云主机创建定时克隆任务。
7.根据权利要求1所述的方法,其特征在于,为云主机设置蓝屏策略包括:
响应于检测到云主机发生故障,将云主机进行重启处理;
响应于云主机重启完成,检查云主机是否能够正常使用;
响应于云主机不能够正常使用,将云主机进行关机处理。
8.一种云主机高可用的装置,其特征在于,所述装置包括:
备份模块,所述备份模块配置成为云主机创建本地存储池,每经过预设时间将云主机的磁盘数据备份到本地存储池中;
创建模块,所述创建模块配置成为云主机设置蓝屏策略,并为云主机的系统盘创建定时克隆任务,并基于克隆的数据创建对应的备份云主机;
检测模块,所述检测模块配置为响应于云主机发生故障,执行云主机蓝屏策略,并检测云主机的存储端是否可用;
执行模块,所述执行模块配置为响应于云主机的存储端可用,使用云主机的系统卷克隆新卷,并基于克隆的新卷创建新的云主机以提供服务。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-7任意一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述方法的步骤。
CN202311161263.6A 2023-09-08 2023-09-08 一种云主机高可用的方法、装置、设备及介质 Pending CN117234799A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311161263.6A CN117234799A (zh) 2023-09-08 2023-09-08 一种云主机高可用的方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311161263.6A CN117234799A (zh) 2023-09-08 2023-09-08 一种云主机高可用的方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN117234799A true CN117234799A (zh) 2023-12-15

Family

ID=89095912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311161263.6A Pending CN117234799A (zh) 2023-09-08 2023-09-08 一种云主机高可用的方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN117234799A (zh)

Similar Documents

Publication Publication Date Title
CN107179957B (zh) 物理机故障分类处理方法、装置和虚拟机恢复方法、系统
US9652326B1 (en) Instance migration for rapid recovery from correlated failures
Nguyen et al. Availability modeling and analysis of a data center for disaster tolerance
US6785838B2 (en) Method and apparatus for recovering from failure of a mirrored boot device
CN106850315B (zh) 一种自动化容灾系统
CN111327467A (zh) 一种服务器系统及其容灾备份方法和相关设备
EP2856317B1 (en) System and method for disaster recovery of multi-tier applications
US20190324875A1 (en) Method and apparatus for failure recovery of storage device
CN112380062A (zh) 一种基于系统备份点多次快速恢复系统的方法及系统
CN113590049B (zh) 一种存储卷跨节点克隆的方法、装置、设备及可读介质
CN111342986B (zh) 分布式节点管理方法及装置、分布式系统、存储介质
CN113986450A (zh) 一种虚拟机备份方法及装置
CN114035905A (zh) 基于虚拟机的故障迁移方法及装置、电子设备和存储介质
WO2018076696A1 (zh) 一种数据同步方法及带外管理设备
CN113778607A (zh) 虚拟机实现高可用方法及装置、云管理平台、存储介质
CN117234799A (zh) 一种云主机高可用的方法、装置、设备及介质
CN111427721B (zh) 异常恢复方法及装置
CN110968456A (zh) 分布式存储系统中故障磁盘的处理方法及装置
CN112540873B (zh) 容灾方法、装置、电子设备及容灾系统
CN114217905A (zh) 虚拟机高可用恢复处理方法及系统
CN114675998A (zh) 一种监控定时快照任务的方法、装置、设备及介质
CN112269693A (zh) 一种节点自协调方法、装置和计算机可读存储介质
CN107544868B (zh) 数据恢复方法和装置
CN110618951A (zh) 系统高可用存储控制方法、装置、通信设备及存储介质
CN116248484B (zh) 云原生一体机的管理方法和装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination