CN111427721A - 异常恢复方法及装置 - Google Patents

异常恢复方法及装置 Download PDF

Info

Publication number
CN111427721A
CN111427721A CN202010148352.7A CN202010148352A CN111427721A CN 111427721 A CN111427721 A CN 111427721A CN 202010148352 A CN202010148352 A CN 202010148352A CN 111427721 A CN111427721 A CN 111427721A
Authority
CN
China
Prior art keywords
virtual machine
nas
virtual
gateway
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010148352.7A
Other languages
English (en)
Other versions
CN111427721B (zh
Inventor
张兆铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Macrosan Technologies Co Ltd
Original Assignee
Macrosan Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Macrosan Technologies Co Ltd filed Critical Macrosan Technologies Co Ltd
Priority to CN202010148352.7A priority Critical patent/CN111427721B/zh
Publication of CN111427721A publication Critical patent/CN111427721A/zh
Application granted granted Critical
Publication of CN111427721B publication Critical patent/CN111427721B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • G06F11/1482Generic software techniques for error detection or fault masking by means of middleware or OS functionality
    • G06F11/1484Generic software techniques for error detection or fault masking by means of middleware or OS functionality involving virtual machines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请提供了异常恢复方法及装置,以在部署于SAN存储设备中的虚拟NAS网关启动异常时,快速将其恢复至可正常启动且可提供NAS服务的状态。在本申请中,在SAN存储设备中的第一存储空间中部署虚拟NAS网关;其中,所述虚拟NAS网关为搭载有NAS服务的虚拟机。当SAN存储设备重启成功后,若监测所述虚拟NAS网关启动正常,则将保存在SAN存储设备中的第二存储空间中的NAS配置文件拷贝到所述虚拟机中,使所述虚拟机恢复NAS服务;若监测所述虚拟NAS网关启动异常,则利用保存在第三存储空间中的虚拟机的备份镜像覆盖所述虚拟机,以使所述虚拟机恢复至可正常启动的状态。

Description

异常恢复方法及装置
技术领域
本申请涉及数据存储技术领域,特别涉及一种异常恢复方法及装置。
背景技术
目前,网络附加存储(Network Attached Storage,NAS)因其复杂度低、成本适中、扩展性好等特点,已被广泛应用于各种场景中。
NAS有多种实现方式,其中一种常见的实现方式为将NAS与存储区域网络(StorageArea Network,SAN)配合部署使用,即在一个存储设备上同时提供SAN和NAS服务,实现SANNAS一体化。在具体实现SANNAS一体化时,可采用在SAN存储设备上部署虚拟NAS网关的方式,这里的虚拟NAS网关是指搭载有NAS服务的虚拟机。
但是,在采用这种方式实现SANNAS一体化时,如果SAN存储设备出现掉电、死机等异常情况,可能会导致上述虚拟机的操作系统损坏而无法正常启动。在这种情况下,目前只能通过人工来使该虚拟机恢复正常启动,且恢复过程中往往需要重新安装虚拟机的操作系统,恢复正常启动后往往需要为该虚拟机重新配置NAS服务,效率较低。
发明内容
本申请提供了异常恢复方法及装置,以在部署于SAN存储设备中的虚拟NAS网关启动异常时,快速将其恢复至可正常启动的状态。本申请提供的技术方案包括:
第一方面,本申请提供一种异常恢复方法,应用于SAN存储设备,包括:
在所述SAN存储设备中的第一存储空间中部署虚拟NAS网关;其中,所述虚拟NAS网关为搭载有NAS服务的虚拟机;
获取所述NAS服务的NAS配置文件,并将所述NAS配置文件保存在所述SAN存储设备中的第二存储空间中;
创建所述虚拟机的备份镜像,并将所述备份镜像保存在所述SAN存储设备中的第三存储空间中;其中,所述备份镜像为表征所述虚拟机可正常启动的初始状态的虚拟机镜像;
响应于针对所述SAN存储设备的设备重启指令,对所述SAN存储设备执行重启,在所述SAN存储设备重启成功后,监测所述虚拟NAS网关是否启动正常,如果所述虚拟NAS网关启动正常,则将所述NAS配置文件拷贝到所述虚拟机中,以使所述虚拟机恢复NAS服务;
如果所述虚拟NAS网关启动异常,则从第三存储空间中拷贝所述备份镜像,并将所述备份镜像的拷贝覆盖所述虚拟机,以使所述虚拟机恢复至可正常启动的初始状态。
第二方面,本申请提供一种异常恢复装置,应用于SAN存储设备,包括:
部署单元,用于在所述SAN存储设备中的第一存储空间中部署虚拟NAS网关;其中,所述虚拟NAS网关为搭载有NAS服务的虚拟机;
配置保存单元,用于获取所述NAS服务的NAS配置文件,并将所述NAS配置文件保存在所述SAN存储设备中的第二存储空间中;
备份保存单元,用于创建所述虚拟机的备份镜像,并将所述备份镜像保存在所述SAN存储设备中的第三存储空间中;其中,所述备份镜像为表征所述虚拟机可正常启动的初始状态的虚拟机镜像;
监测单元,用于响应于针对所述SAN存储设备的设备重启指令,对所述SAN存储设备执行重启,在所述SAN存储设备重启成功后,监测所述虚拟NAS网关是否启动正常,如果所述虚拟NAS网关启动正常,则将所述NAS配置文件拷贝到所述虚拟机中,以使所述虚拟机恢复NAS服务;
异常恢复单元,用于如果所述虚拟NAS网关启动异常,则从第三存储空间中拷贝所述备份镜像,并将所述备份镜像的拷贝覆盖所述虚拟机,以使所述虚拟机恢复至可正常启动的初始状态。
本申请通过在SAN存储设备中的第一存储空间中部署虚拟NAS网关,这里的虚拟NAS网关是指提供NAS服务的虚拟机,在SAN存储设备重启成功后,若虚拟NAS网关启动异常,则利用保存在第三存储空间中的上述虚拟机的备份镜像覆盖该虚拟机,以使其恢复至可正常启动的状态。在虚拟NAS网关启动正常时,将保存在SAN存储设备的第二存储空间中的NAS配置文件拷贝到上述虚拟机中以使该虚拟机恢复NAS服务。由此能够在部署于SAN存储设备中的虚拟NAS网关启动异常时,快速将其恢复至可正常启动且可提供NAS服务的状态。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本申请实施例提供的一种异常恢复方法的流程图;
图2为本申请实施例提供的监测虚拟NAS网关是否启动正常的流程图;
图3为本申请实施例提供的步骤202的实现流程图;
图4为本申请实施例提供的异常恢复装置结构图;
图5为本申请实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
采用在SAN存储设备上部署虚拟NAS网关(搭载有NAS服务的虚拟机)的方式来实现NAS,使该虚拟机的故障只会对NAS服务造成影响,而不会影响到SAN存储设备的功能。而且相比其他的NAS实现方式,这种实现方式具有诸如系统复杂度低、维护难度低、稳定性高等优点,是目前较为常用的NAS实现方式。上述其他的NAS实现方式,可包括:在SAN存储设备上以系统服务的形式提供NAS服务。
当采用这种方式实现NAS时,若SAN存储设备出现掉电、死机等异常情况,可能会导致已部署的虚拟机的操作系统因丢失文件等原因而损坏,进而导致虚拟机无法正常启动。在这种情况下,目前往往需要通过人工重新安装部署虚拟机的操作系统来使虚拟机恢复正常启动。而且由于虚拟机操作系统的损坏可能会导致NAS配置文件读取异常,为使恢复正常启动的虚拟机恢复NAS服务,往往还需要通过人工对NAS服务重新进行配置。整个恢复过程耗时较长且需要借助人工,效率较低。
为此,本申请提供一种异常恢复方法,以在部署于SAN存储设备中的虚拟NAS网关启动异常时,快速将其恢复至可正常启动且可提供NAS服务的状态。为使本申请的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本申请进行详细描述。
参见图1,图1为本申请实施例提供的一种异常恢复方法的流程图。在一个例子中,该方法可应用于SAN存储设备。如图1所示,该流程可包括以下步骤:
步骤101,在SAN存储设备中的第一存储空间中部署虚拟NAS网关;其中,该虚拟NAS网关为搭载有NAS服务的虚拟机。
作为一个实施例,这里的SAN存储设备可包括IPSAN存储设备、FCSAN存储设备中任意一种或组合。其中,IPSAN存储设备为基于小型计算机系统接口(Internet SmallComputer System Interface,iSCSI)协议的SAN存储设备,FCSAN存储设备为基于光纤通道(Fiber Channel,FC)协议的SAN存储设备。
作为一个实施例,本步骤101中搭载有NAS服务的虚拟机可以为KVM虚拟机,也可为诸如Xen虚拟机、Vmare虚拟机或Hyper-v虚拟机等虚拟机。
作为一个实施例,本步骤101中的NAS服务可以为基于服务器信息块(ServerMessage Block,SMB)协议构建的NAS服务。作为另一个实施例,本步骤101中的NAS服务可以为基于通用网络文件系统(Common Internet File System,CIFS)协议构建的NAS服务。
步骤102,获取上述NAS服务的NAS配置文件,并将该NAS配置文件保存在上述SAN存储设备中的第二存储空间中。
在一个例子中,这里的第二存储空间与第一存储空间为不同的存储空间。作为一个实施例,第二存储空间与第一存储空间可以分别属于SAN存储设备上的不同磁盘,比如第二存储空间属于SAN存储设备上的磁盘1,第一存储空间属于SAN存储设备上的磁盘2。作为另一个实施例,第二存储空间与第一存储空间可以分别属于SAN存储设备上同一磁盘的不同磁盘分区,比如第二存储空间属于磁盘1的磁盘分区C,第一存储空间属于磁盘1的磁盘分区D。本步骤102通过将上述NAS服务的NAS配置文件与上述虚拟机的操作系统分别保存在不同的存储空间中,使虚拟机的操作系统的损坏不会影响到NAS配置文件的恢复。
将NAS配置文件保存在上述第二存储空间后,在一个例子中,如果需要对NAS服务的某一配置进行变更,则可对第二存储空间中的NAS配置文件进行修改。作为一个实施例,若某一配置的变更需要对NAS配置文件的多处进行修改,则在对NAS配置文件的多处修改全部完成后保存NAS配置文件,以使配置生效;若对上述多处中任一处的修改失败,则将其他已修改部分全部回退至修改前。由此避免出现需要进行的多处修改中仅部分修改生效,而导致不符合预期配置变更结果的情况。
为便于理解本实施例,下面举一个简单的例子:
以针对某一配置的变更,需要对NAS配置文件中的3处进行修改为例。假设已完成对NAS配置文件第1处和第2处的修改,而对第3处的修改失败,则将已修改的第1处和第2处回退至修改前的状态。由此避免出现NAS配置文件保存后仅对NAS配置文件第1处和第2处的修改生效,对第3处的修改无效而导致不符合预期配置变更结果的情况。
步骤103,创建上述虚拟机的备份镜像,并将该备份镜像保存在上述SAN存储设备中的第三存储空间中;其中,该备份镜像为表征上述虚拟机可正常启动的初始状态的虚拟机镜像。
在一个例子中,创建虚拟机的备份镜像可包括:在虚拟机创建完成后第一次正常启动的初始状态下,对第一存储空间中的虚拟机进行镜像。作为一个实施例,这里对虚拟机进行镜像可包括:对虚拟机的操作系统所在的存储空间进行镜像。作为一个实施例,这里的操作系统所在的存储空间可以为第一存储空间本身,也可以为第一存储空间内划分出的一个存储空间。其中,操作系统是管理虚拟机硬件与软件资源的程序,用于处理诸如管理与配置内存、决定系统资源供需的优先次序、控制输入设备与输出设备、操作网络以及管理文件系统等基本事务。作为一个实施例,创建虚拟机的备份镜像可在为虚拟机部署NAS服务之前进行。
在另一个例子中,创建虚拟机的备份镜像可包括:在虚拟机任一次正常启动后,对第一存储空间中的虚拟机进行镜像。作为一个实施例,可将通过上述两个例子创建的备份镜像分别保存在第三存储空间的不同分区中。
作为一个实施例,本步骤103中的第三存储空间与上述第一存储空间为不同的存储空间。作为一个实施例,本步骤103中的第三存储空间与上述第二存储空间可以为相同的存储空间,也可以为不同的存储空间。
步骤104,响应于针对上述SAN存储设备的设备重启指令,对上述SAN存储设备执行重启,在上述SAN存储设备重启成功后,监测上述虚拟NAS网关是否启动正常;如果该虚拟NAS网关启动正常,则执行步骤105,如果该虚拟NAS网关启动异常,则执行步骤106。
这里的设备重启指令有多种具体的实现形式。作为一个实施例,设备重启指令可为通过命令行接收到的针对SAN存储设备的设备重启的命令。作为另一个实施例,设备重启指令可为指示设备重启的按键输入指令。具体的,这里的按键可包括SAN存储设备提供的指示设备重启的物理按键或者UI界面中的按键,当检测到上述任一按键被按压时,确定接收到指示设备重启的按键输入指令。作为另一个实施例,在SAN存储设备断电后再次上电的情况下,可接收到来自SAN存储设备自身的设备重启指令。这里断电的原因可包括:SAN存储设备响应于关机指令而断电,或SAN存储设备的电源被异常切断等。
响应于上述设备重启指令,对SAN存储设备执行重启并重启成功后,监测部署于SAN存储设备的虚拟NAS网关是否启动正常。在具体实现时,本步骤104中监测虚拟NAS网关是否启动正常有多种实现方式,下文结合图2举例示出其中一种,在此暂不赘述。
作为一个实施例,本步骤104中虚拟NAS网关启动异常的原因为虚拟机的操作系统损坏。
步骤105,将第二存储空间中的NAS配置文件拷贝到上述虚拟机中,以使该虚拟机恢复NAS服务。
本步骤105在虚拟NAS网关启动正常的情况下执行。作为一个实施例,通过本步骤105,虚拟机可访问NAS配置文件的拷贝,并根据该NAS配置文件的拷贝对NAS服务进行配置,以使虚拟机的NAS服务的配置与第二存储空间中的NAS配置文件相对应,由此恢复NAS服务。
在另一些实施例中,虚拟机还可通过指向第二存储空间中的NAS配置文件的链接直接访问该NAS配置文件,并根据该NAS配置文件对NAS服务进行配置。作为一个实施例,这里的链接可为Linux系统下的软链接,也可为Windows系统下的快捷方式。作为一个实施例,这里的链接可预先创建并设置于虚拟机中。
在实际应用时,虚拟机还可通过其他方式来访问NAS配置文件,在此不再一一举例。作为一个实施例,可将上述实施例结合,具体结合方式本实施例并不进行限制。举一个简单的例子,以第二存储空间中保存有两个不同的NAS配置文件(分别记为文件1和文件2)为例,可在虚拟机正常启动后,对于文件1,将其拷贝到虚拟机中以使虚拟机访问文件1的拷贝;对于文件2,创建指向文件2的链接,以使虚拟机通过该链接直接访问文件2。
步骤106,从第三存储空间中拷贝上述备份镜像,并将该备份镜像的拷贝覆盖上述虚拟机,以使该虚拟机恢复至可正常启动的初始状态。
本步骤106在虚拟NAS网关启动异常的情况下执行。作为一个实施例,这里的备份镜像为对可正常启动的、初始状态的虚拟机的操作系统所在的存储空间的镜像。本实施例中,将备份镜像的拷贝覆盖上述虚拟机,包括:从第三存储空间中拷贝该虚拟机的备份镜像,并覆盖第一存储空间中该虚拟机的操作系统所在的存储空间。由此将虚拟机的操作系统恢复至备份镜像所对应的可正常启动的、初始状态的虚拟机的操作系统,进而使虚拟机恢复至可正常启动的初始状态。
通过本步骤106使该虚拟机,即虚拟NAS网关恢复至可正常启动的初始状态后,作为一个实施例,在这种情况下,通过步骤104可监测到该虚拟NAS网关启动正常进而继续执行步骤105,即,将第二存储空间中的NAS配置文件拷贝到该虚拟NAS网关中,由此使该虚拟NAS网关恢复NAS服务。
至此,完成图1所示流程。
图1所示流程通过在SAN存储设备上,将NAS服务的NAS配置文件与虚拟NAS网关保存在不同的存储空间,使虚拟机的操作系统的异常不会影响到保存在其他存储空间中的NAS配置文件。当监测到虚拟NAS网关启动异常时,利用预先建立的虚拟机的备份镜像使虚拟机恢复至可正常启动的状态;当检测到虚拟NAS网关启动正常时,利用保存在上述其他存储空间中的NAS配置文件,使虚拟机恢复NAS服务。由此能够自动快速地将启动异常的虚拟NAS网关恢复至可正常启动、且可提供NAS服务的状态。
下面对上述步骤104中如何监测虚拟NAS网关是否启动正常进行描述:
参见图2,图2为本申请实施例提供的监测虚拟NAS网关是否启动正常的流程图。如图2所示,该流程可包括以下步骤:
步骤201,将上述提供NAS服务的虚拟机上电以启动该虚拟机。
将虚拟机上电有多种实现方式。作为一个实施例,可向该虚拟机发送上电指令以启动该虚拟机。作为另一个实施例,可将该虚拟机设置为上电状态以启动该虚拟机。
步骤202,依据将上述虚拟机上电后的指定时间内,是否接收到上述虚拟机发送的启动成功通知,确定上述虚拟NAS网关是否启动正常。
在一个例子中,可在将上述虚拟机上电后启动计时,在计时时间等于指定时间之前,若未接收到该虚拟机发送的启动成功通知,则确定将上述虚拟机上电后的指定时间内未接收到该虚拟机发送的启动成功通知;在计时时间等于指定时间之前,若接收到虚拟机发送的启动成功通知,则确定将上述虚拟机上电后的指定时间内接收到该虚拟机发送的启动成功通知。作为一个实施例,在确定接收到该虚拟机发送的启动成功通知后停止计时。作为一个实施例,上述启动计时可通过在将虚拟机上电后启动一个计时器来实现。
作为一个实施例,本步骤202中的指定时间可根据一种或多种因素进行设置,比如可根据多个SAN存储设备中的虚拟NAS网关的平均启动时间、同一虚拟NAS网关多次成功启动的平均启动时间、用户的个人需求等因素中的一种或几种进行设置。
本步骤202在具体实现时,有多种实现方式,下面结合图3示出其中一种,在此暂不赘述。
至此,完成图2所示流程。
通过图2所示流程,对上述步骤104中如何监测虚拟NAS网关是否启动正常进行了简要描述。
下面结合图3对上述步骤202的具体实现进行举例描述:
参见图3,图3为本申请实施例提供的步骤202的实现流程图。如图3所示,该流程可包括以下步骤:
步骤2021,若将上述虚拟机上电后的指定时间内,接收到上述虚拟机发送的启动成功通知,则确定上述虚拟NAS网关启动正常;否则,检查上述虚拟NAS网关的当前启动失败次数是否大于阈值,若是,则执行步骤2022,若否,则执行步骤2023。
在一个例子中,这里的启动失败次数可在SAN存储设备重新启动后设置为初始值。作为一个实施例,这里的阈值可根据启动失败次数的初始值及其他因素进行设置,其中,其他因素可以为诸如NAS服务中断造成的影响、用户的个人需求等。
作为一个实施例,若在将虚拟机上电后的指定时间内,未接收到该虚拟机发送的启动成功通知,可直接确定上述虚拟NAS网关启动异常。
步骤2022,确定上述虚拟NAS网关启动异常。
通过本步骤2022确定虚拟NAS网关启动异常后,可继续执行上述步骤106,以将启动异常的虚拟NAS网关恢复至可以正常启动的状态。
步骤2023,将上述当前启动失败次数加一,并将上述虚拟机下电后再次上电,返回步骤2021。
作为一个实施例,这里的当前启动失败次数可由计数器设备来计数。在SAN存储设备重新启动后,计数器设备设置为初始值,每执行一次步骤2023,将计数器的计数值加一。
作为一个实施例,可在将虚拟机下电后的一定时间后,再次将该虚拟机上电。例如,可在将虚拟机下电后的30秒后,再次将该虚拟机上电。由此可避免由于过于频繁的上下电而导致损坏或进一步损坏虚拟机的操作系统,使对虚拟机是否启动正常的确定结果更加准确。
作为一个实施例,在根据上述步骤2021接收到上述虚拟机发送的启动成功通知后,将当前启动失败次数设置为初始值。
为便于理解上述步骤2021-2023,下面以当前启动失败次数为2,阈值为2为例,举一个例子:
根据步骤2021,若在将虚拟机上电后的指定时间内,未接收到该虚拟机发送的启动成功通知,且检查发现当前启动失败次数为2,并未大于阈值,则执行步骤2023。根据步骤2023,将当前启动失败次数加一,得到新的当前启动失败次数为3,并在将虚拟机下电后再次上电后,返回步骤2021。
根据步骤2021,若在再次将虚拟机上电后的指定时间内,未接收到该虚拟机发送的启动成功通知,则可检查发现当前启动失败次数为3,大于阈值,由此执行步骤2022,确定该虚拟NAS网关启动异常。
根据步骤2021,若在再次将虚拟机上电后的指定时间内,接收到该虚拟机发送的启动成功通知,则确定虚拟NAS网关启动正常。可进一步将当前启动失败次数设置为初始值,比如设置为0。
在另一些实施例中,也可在上述步骤2021中,若将虚拟机上电后的指定时间内,未接收到该虚拟机发送的启动成功通知,则将当前启动失败次数加一后,检查当前启动失败次数是否大于第二阈值。而在步骤2023中,不再将当前启动失败次数加一。
在另一些实施例中,还可用对虚拟机的上电次数、或对虚拟机的下电次数来代替上述步骤中的启动失败次数。以“用对虚拟机的上电次数代替上述步骤中的启动失败次数”为例,则在步骤2021中,若将虚拟机上电后的指定时间内未接收到该虚拟机发送的启动成功通知,则检查对该虚拟机的上电次数是否大于第三阈值,若是,则执行步骤2022,若否,则执行步骤2023。
至此,完成对图3所示流程的描述。
通过图3所示流程,对上述步骤202的具体实现进行了举例描述。实现了依据将虚拟机上电后的指定时间内,是否接收到该虚拟机发送的启动成功通知,确定上述虚拟NAS网关是否启动正常。进一步的,通过设置阈值,可在对虚拟机进行多次上电,并且多次上电后都未接收到该虚拟机发送的启动成功通知的情况下,才确定虚拟NAS网关启动异常,由此可一定程度上避免对虚拟NAS网关启动异常的误判,从而避免不必要的异常恢复操作。
以上为对本申请实施例提供的异常恢复方法的描述,本申请实施例还提供一种异常恢复装置,下面进行描述:
参见图4,图4为本申请实施例提供的异常恢复装置结构图。作为一个实施例,该装置可应用于SAN存储设备。如图4所示,该装置包括部署单元401、配置保存单元402、备份保存单元403、监测单元404和异常恢复单元405。
在一个例子中,部署单元401,用于在上述SAN存储设备中的第一存储空间中部署虚拟NAS网关;其中,上述虚拟NAS网关为搭载有NAS服务的虚拟机;
配置保存单元402,用于获取上述NAS服务的NAS配置文件,并将上述NAS配置文件保存在上述SAN存储设备中的第二存储空间中;
备份保存单元403,用于创建上述虚拟机的备份镜像,并将上述备份镜像保存在上述SAN存储设备中的第三存储空间中;其中,上述备份镜像为表征上述虚拟机可正常启动的初始状态的虚拟机镜像;
监测单元404,用于响应于针对上述SAN存储设备的设备重启指令,对上述SAN存储设备执行重启,在上述SAN存储设备重启成功后,监测上述虚拟NAS网关是否启动正常,如果上述虚拟NAS网关启动正常,则将上述NAS配置文件拷贝到上述虚拟机中,以使上述虚拟机恢复NAS服务;
异常恢复单元405,用于从第三存储空间中拷贝上述备份镜像,并将该备份镜像的拷贝覆盖上述虚拟机,以使该虚拟机恢复至可正常启动的初始状态。
在一个例子中,监测单元404监测上述虚拟NAS网关是否启动正常,包括:
将上述虚拟机上电以启动上述虚拟机;
依据将上述虚拟机上电后的指定时间内,是否接收到上述虚拟机发送的启动成功通知,确定上述虚拟NAS网关是否启动正常。
作为一个实施例,监测单元404确定上述虚拟NAS网关是否启动正常,包括:
若将上述虚拟机上电后的指定时间内,接收到上述虚拟机发送的启动成功通知,则确定上述虚拟NAS网关启动正常;否则,检查上述虚拟NAS网关的当前启动失败次数是否大于阈值;
若是,则确定上述虚拟NAS网关启动异常;若否,将上述当前启动失败次数加一,并将上述虚拟机下电后再次上电。
作为一个实施例,监测单元404进一步用于:
接收到上述虚拟机发送的启动成功通知后,将当前启动失败次数设置为初始值。
作为一个实施例,上述SAN存储设备可包括IPSAN存储设备、FCSAN存储设备中任意一种或组合。
作为一个实施例,上述虚拟机可以为KVM虚拟机。
至此,完成对图4所示装置的描述。上述装置中各模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
请参见图5,图5为本申请实施例提供的一种电子设备的硬件结构示意图。该电子设备可以包括处理器501、存储器502和通信总线503。处理器501以及存储器502通过通信总线503完成相互间的通信。其中,存储器502上存放有计算机程序;处理器501可以通过执行存储器502上所存放的程序,执行上文描述的异常恢复方法。
本文中提到的存储器502可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,存储器502可以是:RAM(Radom AccessMemory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
本申请实施例还提供了一种存储有计算机程序的机器可读存储介质,例如图5中的存储器502,所述计算机程序可由图5所示电子设备中的处理器501执行以实现上文中描述的异常恢复方法。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种异常恢复方法,其特征在于,应用于SAN存储设备,所述方法包括:
在所述SAN存储设备中的第一存储空间中部署虚拟NAS网关;其中,所述虚拟NAS网关为搭载有NAS服务的虚拟机;
获取所述NAS服务的NAS配置文件,并将所述NAS配置文件保存在所述SAN存储设备中的第二存储空间中;
创建所述虚拟机的备份镜像,并将所述备份镜像保存在所述SAN存储设备中的第三存储空间中;其中,所述备份镜像为表征所述虚拟机可正常启动的初始状态的虚拟机镜像;
响应于针对所述SAN存储设备的设备重启指令,对所述SAN存储设备执行重启,在所述SAN存储设备重启成功后,监测所述虚拟NAS网关是否启动正常,如果所述虚拟NAS网关启动正常,则将所述NAS配置文件拷贝到所述虚拟机中,以使所述虚拟机恢复NAS服务;
如果所述虚拟NAS网关启动异常,则从第三存储空间中拷贝所述备份镜像,并将所述备份镜像的拷贝覆盖所述虚拟机,以使所述虚拟机恢复至可正常启动的初始状态。
2.根据权利要求1所述的方法,其特征在于,所述监测所述虚拟NAS网关是否启动正常,包括:
将所述虚拟机上电以启动所述虚拟机;
依据将所述虚拟机上电后的指定时间内,是否接收到所述虚拟机发送的启动成功通知,确定所述虚拟NAS网关是否启动正常。
3.根据权利要求2所述的方法,其特征在于,所述确定所述虚拟NAS网关是否启动正常,包括:
若将所述虚拟机上电后的指定时间内,接收到所述虚拟机发送的启动成功通知,则确定所述虚拟NAS网关启动正常;否则,检查所述虚拟NAS网关的当前启动失败次数是否大于阈值;
若是,则确定所述虚拟NAS网关启动异常;若否,将所述当前启动失败次数加一,并将所述虚拟机下电后再次上电。
4.根据权利要求3所述的方法,其特征在于,该方法进一步包括:
接收到所述虚拟机发送的启动成功通知后,将当前启动失败次数设置为初始值。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述SAN存储设备包括IPSAN存储设备、FCSAN存储设备中任意一种或组合。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述虚拟机为KVM虚拟机。
7.一种异常恢复装置,其特征在于,该装置应用于SAN存储设备,包括:
部署单元,用于在所述SAN存储设备中的第一存储空间中部署虚拟NAS网关;其中,所述虚拟NAS网关为搭载有NAS服务的虚拟机;
配置保存单元,用于获取所述NAS服务的NAS配置文件,并将所述NAS配置文件保存在所述SAN存储设备中的第二存储空间中;
备份保存单元,用于创建所述虚拟机的备份镜像,并将所述备份镜像保存在所述SAN存储设备中的第三存储空间中;其中,所述备份镜像为表征所述虚拟机可正常启动的初始状态的虚拟机镜像;
监测单元,用于响应于针对所述SAN存储设备的设备重启指令,对所述SAN存储设备执行重启,在所述SAN存储设备重启成功后,监测所述虚拟NAS网关是否启动正常,如果所述虚拟NAS网关启动正常,则将所述NAS配置文件拷贝到所述虚拟机中,以使所述虚拟机恢复NAS服务;
异常恢复单元,用于如果所述虚拟NAS网关启动异常,则从第三存储空间中拷贝所述备份镜像,并将所述备份镜像的拷贝覆盖所述虚拟机,以使所述虚拟机恢复至可正常启动的初始状态。
8.根据权利要求7所述的装置,其特征在于,所述监测单元监测所述虚拟NAS网关是否启动正常,包括:
将所述虚拟机上电以启动所述虚拟机;
依据将所述虚拟机上电后的指定时间内,是否接收到所述虚拟机发送的启动成功通知,确定所述虚拟NAS网关是否启动正常。
9.根据权利要求8所述的装置,其特征在于,所述监测单元确定所述虚拟NAS网关是否启动正常,包括:
若将所述虚拟机上电后的指定时间内,接收到所述虚拟机发送的启动成功通知,则确定所述虚拟NAS网关启动正常;否则,检查所述虚拟NAS网关的当前启动失败次数是否大于阈值;
若是,则确定所述虚拟NAS网关启动异常;若否,将所述当前启动失败次数加一,并将所述虚拟机下电后再次上电。
10.根据权利要求7-9任一项所述的装置,其特征在于,所述SAN存储设备包括IPSAN存储设备、FCSAN存储设备中任意一种或组合。
CN202010148352.7A 2020-03-05 2020-03-05 异常恢复方法及装置 Active CN111427721B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010148352.7A CN111427721B (zh) 2020-03-05 2020-03-05 异常恢复方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010148352.7A CN111427721B (zh) 2020-03-05 2020-03-05 异常恢复方法及装置

Publications (2)

Publication Number Publication Date
CN111427721A true CN111427721A (zh) 2020-07-17
CN111427721B CN111427721B (zh) 2023-04-28

Family

ID=71547761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010148352.7A Active CN111427721B (zh) 2020-03-05 2020-03-05 异常恢复方法及装置

Country Status (1)

Country Link
CN (1) CN111427721B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020156984A1 (en) * 2001-02-20 2002-10-24 Storageapps Inc. System and method for accessing a storage area network as network attached storage
US20110047340A1 (en) * 2009-08-21 2011-02-24 James Robert Olson Proxy Backup of Virtual Disk Image Files on NAS Devices
US20110113428A1 (en) * 2007-02-16 2011-05-12 Vmware, Inc. SCSI Protocol Emulation for Virtual Storage Device Stored on NAS Device
CN102981931A (zh) * 2012-12-03 2013-03-20 中国联合网络通信集团有限公司 虚拟机备份方法及装置
CN103176831A (zh) * 2011-12-22 2013-06-26 中国移动通信集团公司 一种虚拟机系统及其管理方法
US20130238553A1 (en) * 2010-10-28 2013-09-12 Sk Telecom Co., Ltd. Cloud computing system and data synchronization method
CN104503861A (zh) * 2012-04-20 2015-04-08 华为技术有限公司 一种异常处理方法及系统、代理设备与控制装置
US9547562B1 (en) * 2010-08-11 2017-01-17 Dell Software Inc. Boot restore system for rapidly restoring virtual machine backups
CN107343044A (zh) * 2017-07-04 2017-11-10 郑州云海信息技术有限公司 一种存储区域网络的控制方法及装置
CN108268302A (zh) * 2016-12-30 2018-07-10 华为技术有限公司 实现设备启动的方法和装置
CN108415756A (zh) * 2017-10-25 2018-08-17 国云科技股份有限公司 一种云平台虚拟机的云盘自动恢复方法
US20190384679A1 (en) * 2018-06-13 2019-12-19 EMC IP Holding Company LLC Advanced multiple backup recovery

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020156984A1 (en) * 2001-02-20 2002-10-24 Storageapps Inc. System and method for accessing a storage area network as network attached storage
US20110113428A1 (en) * 2007-02-16 2011-05-12 Vmware, Inc. SCSI Protocol Emulation for Virtual Storage Device Stored on NAS Device
US20110047340A1 (en) * 2009-08-21 2011-02-24 James Robert Olson Proxy Backup of Virtual Disk Image Files on NAS Devices
US9547562B1 (en) * 2010-08-11 2017-01-17 Dell Software Inc. Boot restore system for rapidly restoring virtual machine backups
US20130238553A1 (en) * 2010-10-28 2013-09-12 Sk Telecom Co., Ltd. Cloud computing system and data synchronization method
CN103176831A (zh) * 2011-12-22 2013-06-26 中国移动通信集团公司 一种虚拟机系统及其管理方法
CN104503861A (zh) * 2012-04-20 2015-04-08 华为技术有限公司 一种异常处理方法及系统、代理设备与控制装置
CN102981931A (zh) * 2012-12-03 2013-03-20 中国联合网络通信集团有限公司 虚拟机备份方法及装置
CN108268302A (zh) * 2016-12-30 2018-07-10 华为技术有限公司 实现设备启动的方法和装置
CN107343044A (zh) * 2017-07-04 2017-11-10 郑州云海信息技术有限公司 一种存储区域网络的控制方法及装置
CN108415756A (zh) * 2017-10-25 2018-08-17 国云科技股份有限公司 一种云平台虚拟机的云盘自动恢复方法
US20190384679A1 (en) * 2018-06-13 2019-12-19 EMC IP Holding Company LLC Advanced multiple backup recovery

Also Published As

Publication number Publication date
CN111427721B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
US7644302B2 (en) Restarting method using a snapshot
US8924783B2 (en) Self-managed processing device
US7340638B2 (en) Operating system update and boot failure recovery
WO2018095107A1 (zh) 一种bios程序的异常处理方法及装置
CN111143132B (zh) 一种bios恢复方法、装置、设备及可读存储介质
US20140140135A1 (en) Storage device, recovery method, and recording medium for recovery program
JP6102235B2 (ja) Bios復旧制御装置及びその復旧制御方法、情報処理装置、並びにコンピュータ・プログラム
JP2003099146A (ja) 計算機システムの起動制御方式
CN113190256B (zh) 一种升级方法、装置及设备
KR20080028751A (ko) 정보 처리 장치, 그 제어 장치, 그 제어 방법 및 제어프로그램을 저장한 컴퓨터 판독 가능한 기록 매체
JP6124644B2 (ja) 情報処理装置および情報処理システム
CN113626262A (zh) 一种bmc恢复方法、系统、设备以及介质
CN111427721B (zh) 异常恢复方法及装置
JP2011053780A (ja) 復旧システム、復旧方法及びバックアップ制御システム
US20160004607A1 (en) Information processing apparatus and information processing method
CN111078452A (zh) 一种bmc固件镜像恢复方法与装置
US20240118975A1 (en) Iinformation processing system, management apparatus, management method, and program
JP3087650B2 (ja) 自動復電方式
CN110955556B (zh) 数据库恢复方法及装置、存储介质、数据库系统
CN115469935A (zh) 智能终端的启动方法及相关设备
CN117421156A (zh) 一种固件管理方法、装置、设备及机器可读存储介质
CN115963994A (zh) 数据存储方法、装置、非易失性存储介质及处理器
CN114996055A (zh) 一种双机热备系统控制方法、装置、介质
CN113672341A (zh) 一种提高k8s集群稳定性的方法、系统、装置及存储介质
CN111901415A (zh) 数据处理方法和系统、计算机可读存储介质及处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant