CN114048074A - 超融合主机的数据恢复方法、系统、电子设备及存储介质 - Google Patents

超融合主机的数据恢复方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN114048074A
CN114048074A CN202111394990.8A CN202111394990A CN114048074A CN 114048074 A CN114048074 A CN 114048074A CN 202111394990 A CN202111394990 A CN 202111394990A CN 114048074 A CN114048074 A CN 114048074A
Authority
CN
China
Prior art keywords
super
disk
data recovery
system configuration
fusion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111394990.8A
Other languages
English (en)
Inventor
张严
肖辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Topsec Technology Co Ltd
Beijing Topsec Network Security Technology Co Ltd
Beijing Topsec Software Co Ltd
Original Assignee
Beijing Topsec Technology Co Ltd
Beijing Topsec Network Security Technology Co Ltd
Beijing Topsec Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Topsec Technology Co Ltd, Beijing Topsec Network Security Technology Co Ltd, Beijing Topsec Software Co Ltd filed Critical Beijing Topsec Technology Co Ltd
Priority to CN202111394990.8A priority Critical patent/CN114048074A/zh
Publication of CN114048074A publication Critical patent/CN114048074A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种超融合主机的数据恢复方法、系统、电子设备及存储介质,涉及网络技术领域。该超融合主机的数据恢复方法包括:获取超融合集群节点和系统盘的健康状态信息;根据所述健康状态信息判断所述系统盘是否异常,若是,则对所示系统盘执行以下处理:根据所述健康状态信息判断所述超融合集群节点是否在线;然后根据所述超融合集群节点是否在线执行对应的数据恢复流程。该超融合主机的数据恢复方法可以恢复超融合系统的配置数据,提高数据恢复效率和便捷性的技术效果。

Description

超融合主机的数据恢复方法、系统、电子设备及存储介质
技术领域
本申请涉及网络技术领域,具体而言,涉及一种超融合主机的数据恢复方法、系统、电子设备及存储介质。
背景技术
目前,超融合基础架构(Hyper Converged Infrastructure,HCI)是指在同一套单元设备中不仅仅具备计算、网络、存储和服务器虚拟化等资源和技术,而且还包括备份软件、快照技术、重复数据删除、在线数据压缩等元素,而多套单元设备可以通过网络聚合起来,实现模块化的无缝横向扩展(scale-out),形成统一的资源池。在超融合主机的系统盘异常或损坏时,需要更换主机的系统盘并恢复到与损坏前一样的配置。
现有技术中,一般是使用第三方的磁盘克隆软件,将旧系统盘的数据克隆到另外一个块新的系统盘上,然后用新的系统盘替换旧的系统盘。磁盘克隆(Disk cloning),亦作磁盘复制,是一种通过计算机软件的方式,把磁盘内容完整的复制(克隆)到另一块磁盘的过程。但是,磁盘克隆技术,不能实时克隆磁盘产生的新数据,磁盘数据发生变化时需重新再克隆一次,必须依赖于主机操作系统正常、旧磁盘正常的条件下才能完成磁盘克隆,替换旧系统盘;而且,克隆的全流程都需要人工参与,耗费时间长、占用存储空间大。
发明内容
本申请实施例的目的在于提供一种超融合主机的数据恢复方法、系统、电子设备及存储介质,可以恢复超融合系统的配置数据,提高数据恢复效率和便捷性的技术效果。
第一方面,本申请实施例提供了一种超融合主机的数据恢复方法,包括:
获取超融合集群节点和系统盘的健康状态信息;
根据所述健康状态信息判断所述系统盘是否异常,若是,则对所示系统盘执行以下处理:
根据所述健康状态信息判断所述超融合集群节点是否在线;
若所述超融合集群节点在线,暂停往所述系统盘里写入数据;
备份所述超融合集群节点的系统配置选项,生成第一系统配置备份文件;
将所述第一系统配置备份文件导入第一新磁盘;
更换所述系统盘为所述第一新磁盘,完成数据恢复流程;
若所述超融合集群节点不在线,更换所述系统盘为第二新磁盘;
根据开机引导镜像获取健康节点上所述系统盘的第二系统配置备份文件;
将所述第二系统配置备份文件导入所述第二新磁盘,完成数据恢复流程。
在上述实现过程中,该超融合主机的数据恢复方法通过健康状态信息监测超融合集群节点和系统盘是否异常,利用超融合集群的高可用特性,即使超融合集群的某一个节点出现了故障,等节点走完恢复流程后,重新上线,即可同步数据保证整个集群数据的完整性;而且,在节点不在线、超融合系统文件损毁无法进入操作界面的情况下,通过复用超融合系统的开机引导镜像(安装镜像),通过界面的图形化操作,完成节点的系统配置恢复流程,使整个恢复流程变得图形化、界面化简单易操作;从而,该方法可以应用于超融合系统已损毁、节点完全离线的场景,恢复超融合系统的配置数据,实现提高数据恢复效率和便捷性的技术效果。
进一步地,在所述获取超融合集群节点和系统盘的健康状态信息的步骤之前,还包括:
定期触发或者手动触发备份主机的系统配置任务;
在触发所述系统配置任务时,备份所述系统盘的配置文件,生成所述第二系统配置备份文件;
将所述第二系统配置备份文件保存至超融合集群的其他节点。
在上述实现过程中,自动定时备份或手动备份超融合集群中所有节点的配置信息,当主机的系统盘异常或损坏时,更换新的磁盘,实现从超融合集群内的其他主机拷贝已备份的系统配置备份文件进行恢复,从而保证超融合集群的稳定运行。
进一步地,所述根据开机引导镜像获取健康节点上所述系统盘的第二系统配置备份文件的步骤,包括:
获取所述健康节点的ip地址信息;
根据所述ip地址信息获取所述第二系统配置备份文件。
在上述实现过程中,在根据开机引导镜像进行异常系统盘的更换和配置恢复过程中,通过健康节点的ip地址信息,可以获取到本节点(异常系统盘)的备份文件信息(即第二系统配置备份文件)。
进一步地,在所述暂停往所述系统盘里写入数据的步骤之前,还包括:
将所述系统盘上的虚拟机迁移到健康系统盘。
第二方面,一种超融合主机的数据恢复系统,包括:
健康获取模块,用于获取超融合集群节点和系统盘的健康状态信息;
异常判断模块,用于根据所述健康状态信息判断所述系统盘是否异常,若是,则对所示系统盘执行以下处理:
节点在线判断模块,用于根据所述健康状态信息判断所述超融合集群节点是否在线;
暂停模块,用于若所述超融合集群节点在线,暂停往所述系统盘里写入数据;
备份模块,用于备份所述超融合集群节点的系统配置选项,生成第一系统配置备份文件;
导入模块,用于将所述第一系统配置备份文件导入第一新磁盘;
更换模块,用于更换所述系统盘为所述第一新磁盘,完成数据恢复流程;
所述更换模块还用于若所述超融合集群节点不在线,更换所述系统盘为第二新磁盘;
备份获取模块,用于根据开机引导镜像获取健康节点上所述系统盘的第二系统配置备份文件;
导入模块还用于将所述第二系统配置备份文件导入所述第二新磁盘,完成数据恢复流程。
进一步地,所述系统还包括:
触发模块,用于定期触发或者手动触发备份主机的系统配置任务;
备份模块还用于在触发所述系统配置任务时,备份所述系统盘的配置文件,生成所述第二系统配置备份文件;
保存模块,用于将所述第二系统配置备份文件保存至超融合集群的其它节点。
进一步地,所述备份获取模块包括:
IP地址单元,用于获取所述健康节点的ip地址信息;
备份获取单元,用于根据所述ip地址信息获取所述第二系统配置备份文件。
进一步地,所述系统还包括迁移模块,所述迁移模块用于将所述系统盘上的虚拟机迁移到健康系统盘。
第三方面,本申请实施例提供的一种电子设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面任一项所述的方法的步骤。
第四方面,本申请实施例提供的一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行如第一方面任一项所述的方法。
第五方面,本申请实施例提供的一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行如第一方面任一项所述的方法。
本申请公开的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本申请公开的上述技术即可得知。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种超融合主机的数据恢复方法的流程示意图;
图2为本申请实施例提供的另一种超融合主机的数据恢复方法的流程示意图;
图3为本申请实施例提供的超融合主机的数据恢复系统的结构框图;
图4为本申请实施例提供的一种电子设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本申请实施例提供了一种超融合主机的数据恢复方法、系统、电子设备及存储介质,可以应用于超融合集群内系统盘的配置更换及恢复;该超融合主机的数据恢复方法通过健康状态信息监测超融合集群节点和系统盘是否异常,利用超融合集群的高可用特性,即使超融合集群的某一个节点出现了故障,等节点走完恢复流程后,重新上线,即可同步数据保证整个集群数据的完整性;而且,在节点不在线、超融合系统文件损毁无法进入操作界面的情况下,通过复用超融合系统的开机引导镜像(安装镜像),通过界面的图形化操作,完成节点的系统配置恢复流程,使整个恢复流程变得图形化、界面化简单易操作;从而,该方法可以应用于超融合系统已损毁、节点完全离线的场景,恢复超融合系统的配置数据,实现提高数据恢复效率和便捷性的技术效果。
请参见图1,图1为本申请实施例提供的一种超融合主机的数据恢复方法的流程示意图,该超融合主机的数据恢复方法包括如下步骤:
S100:获取超融合集群节点和系统盘的健康状态信息;
示例性地,超融合架构即HCI(Hyper Converged Infrastructure),也称为超融合基础架构或者超融合基础设施,是指在同一套单元设备(如x86服务器)中具备计算、网络、存储和服务器虚拟化等资源和技术的架构;高可用集群(High Availability Cluster,HACluster),是指以减少服务中断时间为目的的服务器集群技术,具有高可用特性,通过保护用户的业务程序对外不间断提供的服务,把因软件、硬件、人为造成的故障对业务的影响降低到最小程度;超融合集群就是指将很多个安装了超融合系统的服务器集中起来一起,进行同一种服务。
示例性地,健康状态信息可以显示出超融合集群内各个主机的健康状态,在发现某一节点的系统盘异常时,可进行更换主机的系统盘并恢复到与损坏前一样的配置。
S200:根据健康状态信息判断系统盘是否异常,若是,则对所示系统盘执行以下处理:
S300:根据健康状态信息判断超融合集群节点是否在线;
S311:若超融合集群节点在线,暂停往系统盘里写入数据;
S312:备份超融合集群节点的系统配置选项,生成第一系统配置备份文件;
S313:将第一系统配置备份文件导入第一新磁盘;
S314:更换系统盘为第一新磁盘,完成数据恢复流程。
示例性地,S311-S314是系统盘异常、且节点在线时替换异常的系统盘流程,更换系统盘为第一新磁盘;其中第一新磁盘的数据是即时备份的第一系统配置备份文件。
S321:若超融合集群节点不在线,更换系统盘为第二新磁盘;
S322:根据开机引导镜像获取健康节点上系统盘的第二系统配置备份文件;
具体地,S322的具体操作过程如下:使用开机引导镜像,并利用shell脚本,安装超融合系统到第二新磁盘;然后,输入集群中建康节点的IP,下载该离线节点旧系统盘的第二系统配置文件。
S323:将第二系统配置备份文件导入第二新磁盘,完成数据恢复流程。
示例性地,S321-S323是系统盘异常、且节点不在线时替换异常的系统盘流程,更换系统盘为第二新磁盘;其中第二新磁盘的数据是备份在超融合集群内其他健康节点上的第二系统配置备份文件。
示例性地,开机引导镜像可以是ISO镜像;其中:ISO镜像是电脑上光盘镜像(CDMirror)的存储格式之一,因为其是根据ISO-9660有关CD-ROM文件系统标准存储的文件,所以通常在电脑中以后缀.iso命名,俗称iso镜像文件。
在一些实施场景中,该超融合主机的数据恢复方法通过健康状态信息监测超融合集群节点和系统盘是否异常,利用超融合集群的高可用特性,即使超融合集群的某一个节点出现了故障,等节点走完恢复流程后,重新上线,即可同步数据保证整个集群数据的完整性;而且,在节点不在线、超融合系统文件损毁无法进入操作界面的情况下,通过复用超融合系统的开机引导镜像(安装镜像),通过界面的图形化操作,完成节点的系统配置恢复流程,使整个恢复流程变得图形化、界面化简单易操作;从而,该方法可以应用于超融合系统已损毁、节点完全离线的场景,恢复超融合系统的配置数据,实现提高数据恢复效率和便捷性的技术效果。
请参见图2,图2为本申请实施例提供的另一种超融合主机的数据恢复方法的流程示意图。
示例性地,在S100:获取超融合集群节点和系统盘的健康状态信息的步骤之前,还包括:
S101:定期触发或者手动触发备份主机的系统配置任务;
S102:在触发系统配置任务时,备份系统盘的配置文件,生成第二系统配置备份文件;
S103:将第二系统配置备份文件保存至超融合集群的其他节点。
示例性地,启用周期模块的定时任务,自动定时备份或手动备份超融合集群中所有节点的配置信息;当主机的系统盘异常或损坏时,更换新的磁盘,实现从超融合集群内的其他主机拷贝已备份的系统配置备份文件进行恢复,从而保证超融合集群的稳定运行。
在一些实施方式中,可以采用交叉备份的方式,即保证每个节点有2份系统配置备份文件,做到了双份保障。
在一些实施场景中,手动触发备份主机的系统配置任务的具体流程示意如下:
(1.1)UI(User Interface,人机交互界面)向host-service(主机)服务请求备份系统配置。
(1.2)host-service收到请求后对该请求进行参数检查;
(1.3)host-service处理当本地主机存储备份包目录删除超过30天的备份包;
(1.4)host-service打包需要备份的系统配置;
(1.5)host-service备份配置到相邻的节点;
(1.6)host-service清理相邻主机上的本主机旧备份包;
(1.7)向UI返回备份结果。
示例性地,定时触发备份主机的系统配置任务:在host-service模块中利用定时任务功能添加定时备份配置,定时备份配置流程和手动触发的调用接口进行备份的步骤(1.2)-(1.6)一样。
在一些实施场景中,自动备份采用crond定时任务功能,每天凌晨定时备份;每台主机的系统配置在集群内备份2份,若是2主机的超融合集群则只备份1份,单主机不做备份;主机配置备份位置选择过程中,集群内所有主机排成一个环,以3主机为例,host1备份到host2和host3上、host2备份到host3和host1上、host3备份到host1和host2上;系统配置备份目录可以是:/data/local/home_backup;备份文件命名格式为:hostname_ip_mac_time;此外,本申请实施例的方法还具备自动清理采用crond定时任务功能,每天定时检测备份文件备份时间,将30天前的备份文件清理掉。
示例性地,S322:根据开机引导镜像获取健康节点上系统盘的第二系统配置备份文件的步骤,包括:
S3221:获取健康节点的ip地址信息;
S3222:根据ip地址信息获取第二系统配置备份文件。
示例性地,在根据开机引导镜像(具体过程为:利用shell脚本,安装超融合系统到第二新磁盘中,输入集群中建康节点的IP,下载该离线节点旧系统盘的第二系统配置文件)进行异常系统盘的更换和配置恢复过程中,通过健康节点的ip地址信息,可以获取到本节点(异常系统盘)的备份文件信息(即第二系统配置备份文件)。
示例性地,在S311:暂停往系统盘里写入数据的步骤之前,还包括:
S3101:将系统盘上的虚拟机迁移到健康系统盘。
在一些实施场景中,系统盘异常、节点在线的替换系统盘流程示例如下:
(2.1)异常系统盘所在节点上的虚拟机迁移到健康节点;
(2.2)开启节点维护模式,暂停往异常系统盘里写入数据,以避免二次损毁;
(2.3)在超融合集群的平台软件,点击即时备份系统配置选项,等待备份成功(第一系统配置备份文件);
(2.4)在节点上插入一块容量大小一致已安装了超融合系统的第一新磁盘,导入刚完成的第一系统配置备份文件;
(2.5)节点关机,拔出异常系统盘,把第一新磁盘更换到此位置;
(2.6)节点开机,配置恢复成功,安全替换异常系统盘完成。
在一些实施场景中,系统盘异常、节点不在线的替换系统盘流程示例如下:
(3.1)将节点关机;
(3.2)拔出异常系统盘,在原位置插入第二新磁盘;
(3.3)第二新磁盘拷贝ISO格式的开机引导镜像;
(3.4)节点开机后,按开机引导镜像的引导流程操作,进入到替换系统盘的界面;
(3.5)使用用户账号、密码登陆后,输入其它健康节点的ip地址信息;
(3.6)成功获取到异常节点的备份文件后,导入到第二新磁盘;
(3.7)第二新磁盘导入备份文件成功;
(3.8)重启节点,等待恢复进度条达到100%,安全替换异常系统盘结束。
在一些实施场景中,本申请实施例提供的超融合主机的数据恢复方法的处理流程示例如下:
(4.1)检查硬件是否满足安装条件。代码引用原安装系统模块的non_network_install.sh脚本代码。
(4.2)用户输入主机ip信息和主控ip以及密码,后台校验信息是否可用性。如果信息可用则配置主机网络,如果信息不可用,终端弹出输入框让用户重新输入信息。校验信息部分参考引用系统安装的non_network_install.sh脚本代码。另外用arping命令检测主机哪块eth网卡可以和主控ip连通,如果没一张网卡能连通,则返回让用户确认网卡链接是否有问题和重新输入ip信息。
(4.3)筛选最新备份的配置(通过sshpass ssh远程执行命令):
(4.3.1)通过从每台在线主机中筛选出要恢复主机的最新备份包。如果一份备份包都没找出,则报错记录日志并终端提示用户未能找到备份包。
(4.3.2)根据包名的{now_time}段对比1)中筛选出的备份包,筛选出集群中备份的最新的备份包名以包所在的主机ip,以及/boot/firmware/current链接目录对应的源目录名字。
(4.3.3)打印备份包的时间打印到终端,然后让用户确认是否继续恢复系统配置。
(4.4)下载备份包到主机(通过sshpass scp远程拷贝):如果下载失败,提供“重试下载”按钮选项进行重试下载备份包。如果用户选择取消,则记录日志并终端提示用户下载备份包失败。
(4.5)解压备份包:解压出的文件有:default_conf_backup、version、disk.uuid、backup_sysdisk.md5以及其他领域的备份包;
(4.6)恢复配置前条件校验:对主机信息进行校验,校验信息包括:
(4.6.1)新安装系统的大版本号是否和主控的一致(/sf/version);
(4.6.2)备份包里的version文件大版本信息是否和主控的一致;
(4.7)用户选择新系统盘:根据备份包里的disk.uuid文件筛选新插入的磁盘供用户选择作为新的系统盘。只能筛选出一块盘才是正确的。如果筛选出多块磁盘或没筛选出磁盘都报错。如果新盘SSD盘的寿命低于80%时需要提示用户是否继续用于安装系统。
(4.8)对用户选择的系统盘安装系统:用主控的/boot/firmware/current安装软件(主要包括vm、rd、补丁包),用ISO镜像安装grub;功能实现在replace_system_disk_iso_install.sh脚本,参考引用了原有的iso-install.sh安装系统代码,差异点是用主控的/boot/firmware/current安装软件(主要包括vm、rd、补丁包)。
(4.9)恢复配置:用备份包解压得到的backup_sysdisk.tar.gz文件恢复系统配置,系统恢复配置操作:tar-xzPf backup_sysdisk.tar.gz-C/。
请参见图3,图3为本申请实施例提供的超融合主机的数据恢复系统的结构框图,该超融合主机的数据恢复系统包括:
健康获取模块100,用于获取超融合集群节点和系统盘的健康状态信息;
异常判断模块200,用于根据健康状态信息判断系统盘是否异常,若是,则对所示系统盘执行以下处理:
节点在线判断模块300,用于根据健康状态信息判断超融合集群节点是否在线;
暂停模块400,用于若超融合集群节点在线,暂停往系统盘里写入数据;
备份模块500,用于备份超融合集群节点的系统配置选项,生成第一系统配置备份文件;
导入模块600,用于将第一系统配置备份文件导入第一新磁盘;
更换模块700,用于更换系统盘为第一新磁盘,完成数据恢复流程;
更换模块700还用于若超融合集群节点不在线,更换系统盘为第二新磁盘;
备份获取模块800,用于根据开机引导镜像获取健康节点上系统盘的第二系统配置备份文件;
导入模块600还用于将第二系统配置备份文件导入第二新磁盘,完成数据恢复流程。
示例性地,系统还包括:
触发模块,用于定期触发或者手动触发备份主机的系统配置任务;
备份模块还用于在触发系统配置任务时,备份系统盘的配置文件,生成第二系统配置备份文件;
保存模块,用于将第二系统配置备份文件保存至超融合集群的其它节点。
示例性地,备份获取模块包括:
IP地址单元,用于获取健康节点的ip地址信息;
备份获取单元,用于根据ip地址信息获取第二系统配置备份文件。
示例性地,系统还包括迁移模块,迁移模块用于将系统盘上的虚拟机迁移到健康系统盘。
本申请还提供一种电子设备,请参见图4,图4为本申请实施例提供的一种电子设备的结构框图。电子设备可以包括处理器510、通信接口520、存储器530和至少一个通信总线540。其中,通信总线540用于实现这些组件直接的连接通信。其中,本申请实施例中电子设备的通信接口520用于与其他节点设备进行信令或数据的通信。处理器510可以是一种集成电路芯片,具有信号的处理能力。
上述的处理器510可以是通用处理器,包括中央处理器(CPU,Central ProcessingUnit)、网络处理器(NP,Network Processor)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器510也可以是任何常规的处理器等。
存储器530可以是,但不限于,随机存取存储器(RAM,Random Access Memory),只读存储器(ROM,Read Only Memory),可编程只读存储器(PROM,Programmable Read-OnlyMemory),可擦除只读存储器(EPROM,Erasable Programmable Read-Only Memory),电可擦除只读存储器(EEPROM,Electric Erasable Programmable Read-Only Memory)等。存储器530中存储有计算机可读取指令,当所述计算机可读取指令由所述处理器510执行时,电子设备可以执行上述图1至图2方法实施例涉及的各个步骤。
可选地,电子设备还可以包括存储控制器、输入输出单元。
所述存储器530、存储控制器、处理器510、外设接口、输入输出单元各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通信总线540实现电性连接。所述处理器510用于执行存储器530中存储的可执行模块,例如电子设备包括的软件功能模块或计算机程序。
输入输出单元用于提供给用户创建任务以及为该任务创建启动可选时段或预设执行时间以实现用户与服务器的交互。所述输入输出单元可以是,但不限于,鼠标和键盘等。
可以理解,图4所示的结构仅为示意,所述电子设备还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。
本申请实施例还提供一种存储介质,所述存储介质上存储有指令,当所述指令在计算机上运行时,所述计算机程序被处理器执行时实现方法实施例所述的方法,为避免重复,此处不再赘述。
本申请还提供一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行方法实施例所述的方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种超融合主机的数据恢复方法,其特征在于,包括:
获取超融合集群节点和系统盘的健康状态信息;
根据所述健康状态信息判断所述系统盘是否异常,若是,则对所示系统盘执行以下处理:
根据所述健康状态信息判断所述超融合集群节点是否在线;
若所述超融合集群节点在线,暂停往所述系统盘里写入数据;
备份所述超融合集群节点的系统配置选项,生成第一系统配置备份文件;
将所述第一系统配置备份文件导入第一新磁盘;
更换所述系统盘为所述第一新磁盘,完成数据恢复流程;
若所述超融合集群节点不在线,更换所述系统盘为第二新磁盘;
根据开机引导镜像获取健康节点上所述系统盘的第二系统配置备份文件;
将所述第二系统配置备份文件导入所述第二新磁盘,完成数据恢复流程。
2.根据权利要求1所述的超融合主机的数据恢复方法,其特征在于,在所述获取超融合集群节点和系统盘的健康状态信息的步骤之前,还包括:
定期触发或者手动触发备份主机的系统配置任务;
在触发所述系统配置任务时,备份所述系统盘的配置文件,生成所述第二系统配置备份文件;
将所述第二系统配置备份文件保存至超融合集群的其它节点。
3.根据权利要求2所述的超融合主机的数据恢复方法,其特征在于,所述根据开机引导镜像获取健康节点上所述系统盘的第二系统配置备份文件的步骤,包括:
获取所述健康节点的ip地址信息;
根据所述ip地址信息获取所述第二系统配置备份文件。
4.根据权利要求1所述的超融合主机的数据恢复方法,其特征在于,在所述暂停往所述系统盘里写入数据的步骤之前,还包括:
将所述系统盘上的虚拟机迁移到健康系统盘。
5.一种超融合主机的数据恢复系统,其特征在于,包括:
健康获取模块,用于获取超融合集群节点和系统盘的健康状态信息;
异常判断模块,用于根据所述健康状态信息判断所述系统盘是否异常,若是,则对所示系统盘执行以下处理:
节点在线判断模块,用于根据所述健康状态信息判断所述超融合集群节点是否在线;
暂停模块,用于若所述超融合集群节点在线,暂停往所述系统盘里写入数据;
备份模块,用于备份所述超融合集群节点的系统配置选项,生成第一系统配置备份文件;
导入模块,用于将所述第一系统配置备份文件导入第一新磁盘;
更换模块,用于更换所述系统盘为所述第一新磁盘,完成数据恢复流程;
所述更换模块还用于若所述超融合集群节点不在线,更换所述系统盘为第二新磁盘;
备份获取模块,用于根据开机引导镜像获取健康节点上所述系统盘的第二系统配置备份文件;
导入模块还用于将所述第二系统配置备份文件导入所述第二新磁盘,完成数据恢复流程。
6.根据权利要求5所述的超融合主机的数据恢复系统,其特征在于,所述系统还包括:
触发模块,用于定期触发或者手动触发备份主机的系统配置任务;
备份模块还用于在触发所述系统配置任务时,备份所述系统盘的配置文件,生成所述第二系统配置备份文件;
保存模块,用于将所述第二系统配置备份文件保存至超融合集群的其它节点。
7.根据权利要求6所述的超融合主机的数据恢复系统,其特征在于,所述备份获取模块包括:
IP地址单元,用于获取所述健康节点的ip地址信息;
备份获取单元,用于根据所述ip地址信息获取所述第二系统配置备份文件。
8.根据权利要求5所述的超融合主机的数据恢复系统,其特征在于,所述系统还包括迁移模块,所述迁移模块用于将所述系统盘上的虚拟机迁移到健康系统盘。
9.一种电子设备,其特征在于,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的超融合主机的数据恢复方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行如权利要求1至4任一项所述的超融合主机的数据恢复方法。
CN202111394990.8A 2021-11-23 2021-11-23 超融合主机的数据恢复方法、系统、电子设备及存储介质 Pending CN114048074A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111394990.8A CN114048074A (zh) 2021-11-23 2021-11-23 超融合主机的数据恢复方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111394990.8A CN114048074A (zh) 2021-11-23 2021-11-23 超融合主机的数据恢复方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114048074A true CN114048074A (zh) 2022-02-15

Family

ID=80211215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111394990.8A Pending CN114048074A (zh) 2021-11-23 2021-11-23 超融合主机的数据恢复方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114048074A (zh)

Similar Documents

Publication Publication Date Title
US20210157686A1 (en) Smart dynamic restore for kubernetes based applications
US9454439B2 (en) Disaster recovery validation
JP5535484B2 (ja) 自動ソフトウェアテストフレームワーク
US20130091376A1 (en) Self-repairing database system
US20120174112A1 (en) Application resource switchover systems and methods
US11144401B2 (en) Component aware incremental backup, restore, and reconciliation solution
IE20010675A1 (en) A method and apparatus for updatable flash memory design and recovery with minimal redundancy
TW201306632A (zh) 用於服務之回復服務位置
JP5444178B2 (ja) バックアップ・リストア処理装置とバックアップ・リストア処理方法およびプログラム
EP3474143B1 (en) Method and apparatus for incremental recovery of data
CN103597463A (zh) 恢复服务的自动配置
US11531604B2 (en) Methods and systems for data resynchronization in a replication environment
WO2012116637A1 (zh) 系统拯救的方法及装置
JPWO2014076838A1 (ja) 仮想マシン同期システム
CN109634638B (zh) 一种集群软件升级方法、装置、设备及介质
US11550677B2 (en) Client-less database system recovery
CN107465709B (zh) 分布式镜像构建任务方法及装置、系统
JP5665889B2 (ja) サブバージョンリポジトリをバックアップする方法及び装置
CN112732412B (zh) 一种服务配置文件处理方法、装置、存储介质及电子设备
CN110972497A (zh) 虚拟化平台的容灾方法及装置
US11099770B1 (en) VM protection with true zero RTO
CN114048074A (zh) 超融合主机的数据恢复方法、系统、电子设备及存储介质
CN111737043A (zh) 数据库容灾方法、设备、服务器和存储介质
US20240095230A1 (en) Prechecking for non-disruptive update of a data management system
US20240095011A1 (en) State machine operation for non-disruptive update of a data management system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination