CN114443296B - 一种高可用事件的回迁方法、装置、设备及可读介质 - Google Patents

一种高可用事件的回迁方法、装置、设备及可读介质 Download PDF

Info

Publication number
CN114443296B
CN114443296B CN202210074369.1A CN202210074369A CN114443296B CN 114443296 B CN114443296 B CN 114443296B CN 202210074369 A CN202210074369 A CN 202210074369A CN 114443296 B CN114443296 B CN 114443296B
Authority
CN
China
Prior art keywords
cloud host
state
migration
host
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210074369.1A
Other languages
English (en)
Other versions
CN114443296A (zh
Inventor
朱志文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210074369.1A priority Critical patent/CN114443296B/zh
Publication of CN114443296A publication Critical patent/CN114443296A/zh
Application granted granted Critical
Publication of CN114443296B publication Critical patent/CN114443296B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种高可用事件的回迁方法,包括以下步骤:获取高可用事件的事件状态和故障类型,并判断事件状态是否为成功且故障类型是否为主机故障;响应于事件状态为成功且故障类型为主机故障,则获取高可用事件涉及云主机的云主机状态和疏散状态;若是云主机状态为运行或关闭状态,且疏散状态为疏散成功,则进一步判断云主机是否触发过回迁;以及响应于云主机未触发过回迁,则触发回迁。本发明还公开了一种高可用事件的回迁装置、计算机设备和可读存储介质。本发明对高可用事件进行回迁,方便资源恢复和整理,实现对资源状态的选择判断,以筛选出符合条件的资源进行回迁,并对不符合条件的资源进行提示,操作简单方便,提高系统效率。

Description

一种高可用事件的回迁方法、装置、设备及可读介质
技术领域
本发明涉及云平台技术领域,尤其涉及一种高可用事件的回迁方法、装置、设备及可读介质。
背景技术
云计算平台也称为云平台。云计算平台可以划分为3类:以数据存储为主的存储型云平台,以数据处理为主的计算型云平台以及计算和数据存储处理兼顾的综合云计算平台。服务模式:IaaS:基础设施即服务,例如硬件服务器租用,可随着业务量的多少,零活增加或减少租用量;PaaS:平台即服务,例如软件的个性化定制开发,提供完整的云端开发环境;SaaS:软件即服务,例如阳光云服务,简单讲可以理解为软件放在云端,线上直接使用,不限于电脑,手机也可以登陆,并实时同步。
随着云平台的发展,高可用功能逐渐成为云平台必备的基本功能,高可用是资源池中的某些物理主机出现故障后,故障物理主机上的虚拟机会在资源池内其他正常的物理主机上启动,从而保障资源池安全可靠的持续运行,是服务器虚拟化软件的常见功能。配置高可用的前提是使用共享存储部署虚拟机镜像,启用高可用后,当系统检测到主机故障时,系统将根据配置信息,将故障虚拟机在正常的计算节点上重新创建。高可用有若干配置选项,用户可根据自己的实际业务和组网,配置不同规则保证最大限度的业务连续性。
伴随着高可用事件的发生,云主机会触发疏散,在其他可用节点上重建。但是故障恢复之后,要再把原有的云主机迁移回来就只能对云主机进行迁移操作,不便于资源整理和维护,操作复杂,效率低。
发明内容
有鉴于此,本发明实施例的目的在于提出一种高可用事件的回迁方法、装置、设备及可读介质,主机故障导致高可用事件发生后主机故障恢复的情况下,对高可用事件进行回迁,方便资源恢复和整理,实现对资源状态的选择判断,以筛选出符合条件的资源进行回迁,并对不符合条件的资源进行提示,操作简单方便,提高系统效率。
基于上述目的,本发明实施例的一方面提供了一种高可用事件的回迁方法,包括以下步骤:获取高可用事件的事件状态和故障类型,并判断所述事件状态是否为成功且所述故障类型是否为主机故障;响应于所述事件状态为成功且所述故障类型为主机故障,则获取所述高可用事件涉及云主机的云主机状态和疏散状态;若是所述云主机状态为运行或关闭状态,且所述疏散状态为疏散成功,则进一步判断所述云主机是否触发过回迁;以及响应于所述云主机未触发过回迁,则触发回迁。
在一些实施方式中,方法还包括:响应于所述事件状态不为成功或所述故障类型不为主机故障,则不触发回迁并报错。
在一些实施方式中,方法还包括:若是云主机状态不为运行或关闭状态,则对所述云主机进行修复,并触发回迁。
在一些实施方式中,方法还包括:若是所述云主机状态为运行或关闭状态,且所述疏散状态为疏散失败,则查询数据库以获取疏散失败原因,并判断所述疏散失败原因是否为云主机异常;响应于所述疏散失败原因为云主机异常,则对所述云主机进行修复,并触发回迁。
在一些实施方式中,方法还包括:响应于所述疏散失败原因不为云主机异常,则不触发回迁,并返回原因及建议。
在一些实施方式中,进一步判断所述云主机是否触发过回迁包括:判断所述云主机是否有回迁标识;响应于所述云主机有回迁标识,则确认所述云主机触发过回迁;响应于所述云主机没有回迁标识,则确认所述云主机未触发过回迁。
在一些实施方式中,方法还包括:响应于所述主机触发过回迁,则不触发回迁并提示无法再次回迁。
本发明实施例的另一方面,还提供了一种高可用事件的回迁装置,包括:第一模块,配置用于获取高可用事件的事件状态和故障类型,并判断所述事件状态是否为成功且所述故障类型是否为主机故障;第二模块,配置用于响应于所述事件状态为成功且所述故障类型为主机故障,则获取所述高可用事件涉及云主机的云主机状态和疏散状态;第三模块,配置用于若是所述云主机状态为运行或关闭状态,且所述疏散状态为疏散成功,则进一步判断所述云主机是否触发过回迁;以及第四模块,配置用于响应于所述云主机未触发过回迁,则触发回迁。
在一些实施方式中,第二模块进一步配置用于:响应于所述事件状态不为成功或所述故障类型不为主机故障,则不触发回迁并报错。
在一些实施方式中,第三模块进一步配置用于:若是云主机状态不为运行或关闭状态,则对所述云主机进行修复,并触发回迁。
在一些实施方式中,第三模块进一步配置用于:若是所述云主机状态为运行或关闭状态,且所述疏散状态为疏散失败,则查询数据库以获取疏散失败原因,并判断所述疏散失败原因是否为云主机异常;响应于所述疏散失败原因为云主机异常,则对所述云主机进行修复,并触发回迁。
在一些实施方式中,第三模块进一步配置用于:响应于所述疏散失败原因不为云主机异常,则不触发回迁,并返回原因及建议。
在一些实施方式中,第三模块进一步配置用于:判断所述云主机是否有回迁标识;响应于所述云主机有回迁标识,则确认所述云主机触发过回迁;响应于所述云主机没有回迁标识,则确认所述云主机未触发过回迁。
在一些实施方式中,第四模块进一步配置用于:响应于所述主机触发过回迁,则不触发回迁并提示无法再次回迁。
本发明实施例的再一方面,还提供了一种计算机设备,包括:至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现方法的步骤包括:获取高可用事件的事件状态和故障类型,并判断所述事件状态是否为成功且所述故障类型是否为主机故障;响应于所述事件状态为成功且所述故障类型为主机故障,则获取所述高可用事件涉及云主机的云主机状态和疏散状态;若是所述云主机状态为运行或关闭状态,且所述疏散状态为疏散成功,则进一步判断所述云主机是否触发过回迁;以及响应于所述云主机未触发过回迁,则触发回迁。
在一些实施方式中,步骤还包括:响应于所述事件状态不为成功或所述故障类型不为主机故障,则不触发回迁并报错。
在一些实施方式中,步骤还包括:若是云主机状态不为运行或关闭状态,则对所述云主机进行修复,并触发回迁。
在一些实施方式中,步骤还包括:若是所述云主机状态为运行或关闭状态,且所述疏散状态为疏散失败,则查询数据库以获取疏散失败原因,并判断所述疏散失败原因是否为云主机异常;响应于所述疏散失败原因为云主机异常,则对所述云主机进行修复,并触发回迁。
在一些实施方式中,步骤还包括:响应于所述疏散失败原因不为云主机异常,则不触发回迁,并返回原因及建议。
在一些实施方式中,进一步判断所述云主机是否触发过回迁包括:判断所述云主机是否有回迁标识;响应于所述云主机有回迁标识,则确认所述云主机触发过回迁;响应于所述云主机没有回迁标识,则确认所述云主机未触发过回迁。
在一些实施方式中,步骤还包括:响应于所述主机触发过回迁,则不触发回迁并提示无法再次回迁。
本发明实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上方法步骤的计算机程序。
本发明至少具有以下有益技术效果:主机故障导致高可用事件发生后主机故障恢复的情况下,对高可用事件进行回迁,方便资源恢复和整理,实现对资源状态的选择判断,以筛选出符合条件的资源进行回迁,并对不符合条件的资源进行提示,操作简单方便,提高系统效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明提供的高可用事件的回迁方法的实施例的示意图;
图2为本发明提供的高可用事件的回迁装置的实施例的示意图;
图3为本发明提供的计算机设备的实施例的示意图;
图4为本发明提供的计算机可读存储介质的实施例的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
基于上述目的,本发明实施例的第一个方面,提出了高可用事件的回迁方法的实施例。图1示出的是本发明提供的高可用事件的回迁方法的实施例的示意图。如图1所示,本发明实施例的高可用事件的回迁方法包括如下步骤:
001、获取高可用事件的事件状态和故障类型,并判断事件状态是否为成功且故障类型是否为主机故障;
002、响应于事件状态为成功且故障类型为主机故障,则获取高可用事件涉及云主机的云主机状态和疏散状态;
003、若是云主机状态为运行或关闭状态,且疏散状态为疏散成功,则进一步判断云主机是否触发过回迁;以及
004、响应于云主机未触发过回迁,则触发回迁。
在本实施例中,针对高可用事件的回迁场景,实现事件的整体一键回迁,方便便捷的恢复到故障前的情况。包括选择装置、云主机修复装置和回迁装置。主机故障触发高可用事件完成后,故障恢复,资源可以回迁;资源进入选择装置后,会对事件及云主机状态进行选择,筛选出可以进行回迁的云主机,触发回迁;筛选出不满足的云主机会进入恢复装置,自动化重建修复;满足条件的资源进入回迁装置,在该装置中云主机会经过一系列的状态变化及检查,最终回迁完成。具体包括:
在进行高可用事件回迁之前会先判断该事件的状态及故障类型。只有状态为成功且故障类型为主机故障的事件才可以进行回迁。选择装置会进一步对该事件中涉及到的云主机进行选择,如果云主机状态不是运行或关闭状态,则会进入云主机修复装置,一键修复云主机;接下来会对云主机的回迁状态进行选择,带有evacuate_success标签(代表在高可用事件中疏散成功)的云主机才可以触发云主机回迁;带有evacuate_failed标签(代表在高可用事件中疏散失败)的云主机会自动查询失败原因,并进行修复。修复完和筛选出合适的云主机会进入回迁装置,回迁中的云主机进入revert_pending(等待回迁)、revert_ongoing(正在回迁)、revert_success(回迁成功)/failed(回迁失败)流程。
在本发明的一些实施例中,方法还包括:响应于事件状态不为成功或故障类型不为主机故障,则不触发回迁并报错。
在本发明的一些实施例中,方法还包括:若是云主机状态不为运行或关闭状态,则对云主机进行修复,并触发回迁。
在本发明的一些实施例中,方法还包括:若是云主机状态为运行或关闭状态,且疏散状态为疏散失败,则查询数据库以获取疏散失败原因,并判断疏散失败原因是否为云主机异常;响应于疏散失败原因为云主机异常,则对云主机进行修复,并触发回迁。
在本发明的一些实施例中,方法还包括:响应于疏散失败原因不为云主机异常,则不触发回迁,并返回原因及建议。
在本发明的一些实施例中,进一步判断云主机是否触发过回迁包括:判断云主机是否有回迁标识;响应于云主机有回迁标识,则确认云主机触发过回迁;响应于云主机没有回迁标识,则确认云主机未触发过回迁。
在本发明的一些实施例中,方法还包括:响应于主机触发过回迁,则不触发回迁并提示无法再次回迁。
下面根据具体实施例进一步阐述本发明的具体实施方式。主要包括如下几个步骤:
步骤1.主机故障触发高可用事件完成后,故障恢复,判断高可用事件是否满足条件,选择满足条件的高可用事件进入步骤2。
如果高可用事件是主机故障且事件状态是成功,则可以回迁;如果高可用事件不是主机故障,则不可回迁;如果高可用事件状态不是成功,则不可回迁。
步骤2.判断云主机状态是否为运行或关闭状态,满足条件可进入步骤3,不满足则退出流程。
只有云主机状态为运行或关闭状态支持回迁,其他状态的云主机回迁会导致回迁失败,则对云主机进行修复,并触发回迁。
步骤3.判断进入的云主机的疏散状态,如果疏散状态为evacuate_success,则进入回迁流程;如果是evacuate_failed状态则进入恢复装置,一键修复云主机。
查询云主机的疏散状态,如果疏散状态为evacuate_failed表明云主机疏散失败,则会自动查询失败原因,一键修复云主机;如果该事件中所有云主机疏散状态均为evacuate_success,可以触发云主机回迁。
步骤4.判断进入的云主机的疏散记录是否包含revert_*状态标识,如果包含代表多次触发回迁,则判断为再次触发回迁,报错阻止“cant rollback the notificationagain”。
步骤5.全部满足以上条件的云主机进入回迁装置,进行资源恢复。在这过程中,云主机经历revert_pending(等待回迁)、revert_ongoing正在回迁、revert_success/failed(回迁成功/失败)三个过程。
需要特别指出的是,上述高可用事件的回迁方法的各个实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于高可用事件的回迁方法也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在实施例之上。
基于上述目的,本发明实施例的第二个方面,提出了一种高可用事件的回迁装置。图2示出的是本发明提供的高可用事件的回迁装置的实施例的示意图。如图2所示,本发明实施例的高可用事件的回迁装置包括如下模块:第一模块011,配置用于获取高可用事件的事件状态和故障类型,并判断事件状态是否为成功且故障类型是否为主机故障;第二模块012,配置用于响应于事件状态为成功且故障类型为主机故障,则获取高可用事件涉及云主机的云主机状态和疏散状态;第三模块013,配置用于若是云主机状态为运行或关闭状态,且疏散状态为疏散成功,则进一步判断云主机是否触发过回迁;以及第四模块014,配置用于响应于云主机未触发过回迁,则触发回迁。
在本发明的一些实施例中,第二模块012进一步配置用于:响应于事件状态不为成功或故障类型不为主机故障,则不触发回迁并报错。
在本发明的一些实施例中,第三模块013进一步配置用于:若是云主机状态不为运行或关闭状态,则对云主机进行修复,并触发回迁。
在本发明的一些实施例中,第三模块013进一步配置用于:若是云主机状态为运行或关闭状态,且疏散状态为疏散失败,则查询数据库以获取疏散失败原因,并判断疏散失败原因是否为云主机异常;响应于疏散失败原因为云主机异常,则对云主机进行修复,并触发回迁。
在本发明的一些实施例中,第三模块013进一步配置用于:响应于疏散失败原因不为云主机异常,则不触发回迁,并返回原因及建议。
在本发明的一些实施例中,第三模块013进一步配置用于:判断云主机是否有回迁标识;响应于云主机有回迁标识,则确认云主机触发过回迁;响应于云主机没有回迁标识,则确认云主机未触发过回迁。
在本发明的一些实施例中,第四模块014进一步配置用于:响应于主机触发过回迁,则不触发回迁并提示无法再次回迁。
基于上述目的,本发明实施例的第三个方面,提出了一种计算机设备。图3示出的是本发明提供的计算机设备的实施例的示意图。如图3所示,本发明实施例的计算机设备包括如下装置:至少一个处理器021;以及存储器022,存储器022存储有可在处理器上运行的计算机指令023,指令由处理器执行时实现方法的步骤包括:获取高可用事件的事件状态和故障类型,并判断事件状态是否为成功且故障类型是否为主机故障;响应于事件状态为成功且故障类型为主机故障,则获取高可用事件涉及云主机的云主机状态和疏散状态;若是云主机状态为运行或关闭状态,且疏散状态为疏散成功,则进一步判断云主机是否触发过回迁;以及响应于云主机未触发过回迁,则触发回迁。
在本发明的一些实施例中,步骤还包括:响应于事件状态不为成功或故障类型不为主机故障,则不触发回迁并报错。
在本发明的一些实施例中,步骤还包括:若是云主机状态不为运行或关闭状态,则对云主机进行修复,并触发回迁。
在本发明的一些实施例中,步骤还包括:若是云主机状态为运行或关闭状态,且疏散状态为疏散失败,则查询数据库以获取疏散失败原因,并判断疏散失败原因是否为云主机异常;响应于疏散失败原因为云主机异常,则对云主机进行修复,并触发回迁。
在本发明的一些实施例中,步骤还包括:响应于疏散失败原因不为云主机异常,则不触发回迁,并返回原因及建议。
在本发明的一些实施例中,进一步判断云主机是否触发过回迁包括:判断云主机是否有回迁标识;响应于云主机有回迁标识,则确认云主机触发过回迁;响应于云主机没有回迁标识,则确认云主机未触发过回迁。
在本发明的一些实施例中,步骤还包括:响应于主机触发过回迁,则不触发回迁并提示无法再次回迁。
本发明还提供了一种计算机可读存储介质。图4示出的是本发明提供的计算机可读存储介质的实施例的示意图。如图4所示,计算机可读存储介质031存储有被处理器执行时执行如上方法的计算机程序032。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,高可用事件的回迁方法的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
此外,根据本发明实施例公开的方法还可以被实现为由处理器执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被处理器执行时,执行本发明实施例公开的方法中限定的上述功能。
此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(DSL)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、DSL或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(CD)、激光盘、光盘、数字多功能盘(DVD)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (9)

1.一种高可用事件的回迁方法,其特征在于,包括以下步骤:
获取高可用事件的事件状态和故障类型,并判断所述事件状态是否为成功且所述故障类型是否为主机故障;
响应于所述事件状态为成功且所述故障类型为主机故障,则获取所述高可用事件涉及云主机的云主机状态和疏散状态;
若是所述云主机状态为运行或关闭状态,且所述疏散状态为疏散成功,则进一步判断所述云主机是否触发过回迁;以及
响应于所述云主机未触发过回迁,则触发回迁;
所述进一步判断所述云主机是否触发过回迁包括:
判断所述云主机是否有回迁标识;
响应于所述云主机有回迁标识,则确认所述云主机触发过回迁;
响应于所述云主机没有回迁标识,则确认所述云主机未触发过回迁。
2.根据权利要求1所述的高可用事件的回迁方法,其特征在于,还包括:
响应于所述事件状态不为成功或所述故障类型不为主机故障,则不触发回迁并报错。
3.根据权利要求1所述的高可用事件的回迁方法,其特征在于,还包括:
若是云主机状态不为运行或关闭状态,则对所述云主机进行修复,并触发回迁。
4.根据权利要求1所述的高可用事件的回迁方法,其特征在于,还包括:
若是所述云主机状态为运行或关闭状态,且所述疏散状态为疏散失败,则查询数据库以获取疏散失败原因,并判断所述疏散失败原因是否为云主机异常;
响应于所述疏散失败原因为云主机异常,则对所述云主机进行修复,并触发回迁。
5.根据权利要求4所述的高可用事件的回迁方法,其特征在于,还包括:
响应于所述疏散失败原因不为云主机异常,则不触发回迁,并返回原因及建议。
6.根据权利要求1所述的高可用事件的回迁方法,其特征在于,还包括:
响应于所述主机触发过回迁,则不触发回迁并提示无法再次回迁。
7.一种高可用事件的回迁装置,其特征在于,包括:
第一模块,配置用于获取高可用事件的事件状态和故障类型,并判断所述事件状态是否为成功且所述故障类型是否为主机故障;
第二模块,配置用于响应于所述事件状态为成功且所述故障类型为主机故障,则获取所述高可用事件涉及云主机的云主机状态和疏散状态;
第三模块,配置用于若是所述云主机状态为运行或关闭状态,且所述疏散状态为疏散成功,则进一步判断所述云主机是否触发过回迁;以及
第四模块,配置用于响应于所述云主机未触发过回迁,则触发回迁;
所述第三模块进一步配置用于:
判断所述云主机是否有回迁标识;
响应于所述云主机有回迁标识,则确认所述云主机触发过回迁;
响应于所述云主机没有回迁标识,则确认所述云主机未触发过回迁。
8. 一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-6任意一项所述方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6任意一项所述方法的步骤。
CN202210074369.1A 2022-01-21 2022-01-21 一种高可用事件的回迁方法、装置、设备及可读介质 Active CN114443296B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210074369.1A CN114443296B (zh) 2022-01-21 2022-01-21 一种高可用事件的回迁方法、装置、设备及可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210074369.1A CN114443296B (zh) 2022-01-21 2022-01-21 一种高可用事件的回迁方法、装置、设备及可读介质

Publications (2)

Publication Number Publication Date
CN114443296A CN114443296A (zh) 2022-05-06
CN114443296B true CN114443296B (zh) 2023-11-14

Family

ID=81370512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210074369.1A Active CN114443296B (zh) 2022-01-21 2022-01-21 一种高可用事件的回迁方法、装置、设备及可读介质

Country Status (1)

Country Link
CN (1) CN114443296B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105743696A (zh) * 2016-01-26 2016-07-06 中标软件有限公司 一种云计算平台管理方法
CN109376010A (zh) * 2018-09-28 2019-02-22 上海思询信息科技有限公司 一种基于Openstack实现跨集群资源迁移的方法
CN111176790A (zh) * 2019-12-30 2020-05-19 北京浪潮数据技术有限公司 云平台物理主机的主动维护方法、装置及可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107704314B (zh) * 2017-11-09 2023-09-12 北京百度网讯科技有限公司 用于迁移虚拟机的方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105743696A (zh) * 2016-01-26 2016-07-06 中标软件有限公司 一种云计算平台管理方法
CN109376010A (zh) * 2018-09-28 2019-02-22 上海思询信息科技有限公司 一种基于Openstack实现跨集群资源迁移的方法
CN111176790A (zh) * 2019-12-30 2020-05-19 北京浪潮数据技术有限公司 云平台物理主机的主动维护方法、装置及可读存储介质

Also Published As

Publication number Publication date
CN114443296A (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
CN109901949B (zh) 双活数据中心的应用灾备系统及方法
JP5060485B2 (ja) 複製データの可用性及び最新性を検証するための方法及びシステム。
CN102355368B (zh) 一种网络设备的故障处理方法及系统
CN107800783B (zh) 远程监控服务器的方法及装置
CN111669281B (zh) 告警分析方法、装置、设备及存储介质
CN109756382B (zh) 故障定位方法和装置
CN110088744A (zh) 一种数据库维护方法及其系统
CN112162761A (zh) 自动化部署项目至公有云容器化平台的方法、系统及设备
CN116016123A (zh) 故障处理方法、装置、设备及介质
CN113626314B (zh) 一种云平台资源参数的校验方法、装置、设备及可读介质
CN111988169B (zh) 一种云平台异常磁盘清理修复的方法、系统、设备及介质
CN114443296B (zh) 一种高可用事件的回迁方法、装置、设备及可读介质
TWI774060B (zh) 用於階層式系統之故障排除之裝置、方法及電腦程式產品
US20230004465A1 (en) Distributed database system and data disaster backup drilling method
CN107291575B (zh) 一种数据中心故障时的处理方法和设备
CN111176904B (zh) 一种私有云架构下的数据备份的方法、系统、设备及介质
CN112650624A (zh) 一种集群升级方法、装置、设备及计算机可读存储介质
CN116633766A (zh) 故障处理方法、装置、电子设备及存储介质
CN111737130B (zh) 公有云多租户认证服务测试方法、装置、设备及储存介质
CN113626039A (zh) 一种带外操作系统部署的方法、装置、设备及可读介质
CN112068935A (zh) kubernetes程序部署监控方法、装置以及设备
CN107707402B (zh) 一种分布式系统中服务仲裁的管理系统及其管理方法
CN111966288B (zh) 一种存储池的清理方法、系统、设备以及介质
CN104239182A (zh) 一种集群文件系统脑裂处理方法和装置
US20240179049A1 (en) Systems and methods for device management in a network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant