CN113687987A - 一种基于虚拟化平台的主机资源同步方法、系统及装置 - Google Patents

一种基于虚拟化平台的主机资源同步方法、系统及装置 Download PDF

Info

Publication number
CN113687987A
CN113687987A CN202110873684.6A CN202110873684A CN113687987A CN 113687987 A CN113687987 A CN 113687987A CN 202110873684 A CN202110873684 A CN 202110873684A CN 113687987 A CN113687987 A CN 113687987A
Authority
CN
China
Prior art keywords
resource
host
target
event
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110873684.6A
Other languages
English (en)
Inventor
郑维栋
颜秉珩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Mass Institute Of Information Technology
Original Assignee
Shandong Mass Institute Of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Mass Institute Of Information Technology filed Critical Shandong Mass Institute Of Information Technology
Priority to CN202110873684.6A priority Critical patent/CN113687987A/zh
Publication of CN113687987A publication Critical patent/CN113687987A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种基于虚拟化平台的主机资源同步方法、系统及装置,在检测到虚拟化平台对应的物理主机异常断电时,基于物理主机上的任务运行情况,为物理主机配置资源同步信息,并将资源同步信息保存至预设主机资源同步配置库;在检测到目标主机上线后,判断主机资源同步配置库中是否存在目标主机对应的目标资源同步信息;若是,则根据目标资源同步信息,执行目标主机的同步资源操作,并在同步资源操作成功完成后,允许目标主机上线;若否,则允许目标主机直接上线。可见,本申请可在虚拟化平台对应的物理主机上线后,自动同步主机资源,保证了管理层和主机层的资源一致性,且提高了资源同步效率。

Description

一种基于虚拟化平台的主机资源同步方法、系统及装置
技术领域
本发明涉及虚拟化平台领域,特别是涉及一种基于虚拟化平台的主机资源同步方法、系统及装置。
背景技术
在虚拟化平台中,由虚拟化平台的管理端向虚拟化平台对应的物理主机下发任务,物理主机按照下发的任务执行此任务对应的操作步骤,并在执行完此任务时向平台管理端反馈任务已完成的消息。若物理主机异常断电,则物理主机上正在处于运行状态的任务会执行失败。对于这些执行失败的任务,物理主机可能已经执行了部分创建资源的操作,比如,一任务包含创建磁盘和配置网卡的操作,物理主机在异常断电时,可能已经完成了创建磁盘的操作,但是,在物理主机异常断电后,平台管理端与物理主机便失去了通信,平台管理端只知道物理主机任务执行失败,并不知道物理主机已经完成了创建磁盘的操作,此情况下管理界面显示的主机资源中并没有此任务对应的已创建的磁盘,导致管理层和主机层的资源不一致。目前,当物理主机重新上线后,需要人工干预实现管理层和主机层的资源同步,但人工干预的资源同步方式比较费时,导致资源同步效率较低。
因此,如何提供一种解决上述技术问题的方案是本领域的技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种基于虚拟化平台的主机资源同步方法、系统及装置,可在虚拟化平台对应的物理主机上线后,自动同步主机资源,保证了管理层和主机层的资源一致性,且提高了资源同步效率。
为解决上述技术问题,本发明提供了一种基于虚拟化平台的主机资源同步方法,应用于处理器,包括:
在检测到虚拟化平台对应的物理主机异常断电时,基于所述物理主机上的任务运行情况,为所述物理主机配置资源同步信息,并将所述资源同步信息保存至预设主机资源同步配置库;
在检测到目标主机上线后,判断所述主机资源同步配置库中是否存在所述目标主机对应的目标资源同步信息;其中,所述目标主机为任一所述物理主机;
若是,则根据所述目标资源同步信息,执行所述目标主机的同步资源操作,并在所述同步资源操作成功完成后,允许所述目标主机上线;
若否,则允许所述目标主机直接上线。
优选地,基于所述物理主机上的任务运行情况,为所述物理主机配置资源同步信息的过程,包括:
基于所述物理主机上执行失败的目标任务及所述目标任务已执行的程度,配置表征所述目标任务对应的待同步事件的资源同步事件信息,并为所述待同步事件配置一一表征事件涉及的多个主机资源及资源同步过程的多个事件项信息;其中,所述资源同步事件信息和所述事件项信息共同组成所述资源同步信息。
优选地,所述资源同步事件信息包括所述物理主机的主机id、目标任务id、待同步事件id及事件状态、各所述目标任务的执行顺序及同一所述目标任务内各待同步事件的执行顺序;
则根据所述资源同步事件信息和所述事件项信息,执行所述物理主机的同步资源操作的过程,包括:
根据所述资源同步事件信息内主机id,确定异常断电的物理主机;
根据所述资源同步事件信息内目标任务id,确定所述异常断电的物理主机对应的执行失败的目标任务;
根据所述资源同步事件信息内待同步事件id,确定所述执行失败的目标任务对应的待同步事件;
根据所述待同步事件的事件状态,确定等待执行的待同步事件;
根据各所述目标任务的执行顺序及同一所述目标任务内各待同步事件的执行顺序,确定各所述目标任务对应的所有等待执行的待同步事件的执行顺序;
根据所述所有等待执行的待同步事件的执行顺序及每个所述待同步事件对应的多个事件项信息,依次执行各所述待同步事件。
优选地,所述事件项信息包括资源类型、同步资源所使用的rest接口地址、资源id、事件项优先级、重试次数、超时时间及失败是否跳过;
则根据所述待同步事件对应的多个事件项信息,执行所述待同步事件的过程,包括:
根据目标事件项信息内事件项优先级,确定所述待同步事件对应的各事件项的执行顺序;其中,所述目标事件项信息表示目标事件项对应的事件项信息,所述目标事件项为任一所述事件项;
根据各所述事件项的执行顺序及所述目标事件项对应的资源类型、同步资源所使用的rest接口地址、资源id、重试次数、超时时间、失败是否跳过这一系列信息,依次执行各所述事件项。
优选地,根据所述目标事件项对应的资源类型、同步资源所使用的rest接口地址、资源id、重试次数、超时时间、失败是否跳过这一系列信息,执行所述目标事件项的过程,包括:
根据所述目标事件项信息内资源类型,确定所述目标事件项所涉及的资源类型;
根据所述目标事件项信息内同步资源所使用的rest接口地址,确定同步所述目标事件项所涉及的资源的rest接口;
根据所述目标事件项信息内资源id,确定所述目标事件项对应的待同步资源;
根据所述目标事件项信息内重试次数、超时时间及失败是否跳过,依次确定所述目标事件项允许重复执行的次数、允许的最长执行时间及最终执行失败是否允许直接跳过执行下一事件项;
根据所述目标事件项对应的rest接口、待同步资源、允许重复执行的次数、允许的最长执行时间及最终执行失败是否允许直接跳过执行下一事件项这一系列的信息,执行所述目标事件项。
优选地,所述资源类型包括CPU、内存、虚拟机、存储池、磁盘、网卡及端口;
则根据所述目标事件项信息内资源类型,确定所述目标事件项所涉及的资源类型的过程,包括:
根据所述目标事件项信息内资源类型,从CPU、内存、虚拟机、存储池、磁盘、网卡及端口多个资源类型中确定出所述目标事件项所涉及的资源类型。
优选地,根据所述目标资源同步信息,执行所述目标主机的同步资源操作的过程,包括:
从所述主机资源同步配置库中加载所述目标主机对应的所有资源同步事件信息及事件项信息到待执行队列中;
基于所述待执行队列中的资源同步事件信息及事件项信息,依次执行所述目标主机的同步资源操作。
优选地,所述基于虚拟化平台的主机资源同步方法还包括:
在执行所述目标主机的同步资源操作时,记录资源同步相关日志到预设同步日志库中;
若所述目标主机的同步资源操作失败,则进行人工干预提醒,以使人工根据所述同步日志库中的日志信息完成所述目标主机的同步资源操作。
为解决上述技术问题,本发明还提供了一种基于虚拟化平台的主机资源同步系统,包括:
信息配置模块,用于在检测到虚拟化平台对应的物理主机异常断电时,基于所述物理主机上的任务运行情况,为所述物理主机配置资源同步信息,并将所述资源同步信息保存至预设主机资源同步配置库;
同步判断模块,用于在检测到目标主机上线后,判断所述主机资源同步配置库中是否存在所述目标主机对应的目标资源同步信息;若是,则执行同步上线模块;若否,则执行直接上线模块;其中,所述目标主机为任一所述物理主机;
同步上线模块,用于根据所述目标资源同步信息,执行所述目标主机的同步资源操作,并在所述同步资源操作成功完成后,允许所述目标主机上线;
直接上线模块,用于允许所述目标主机直接上线。
优选地,基于所述物理主机上的任务运行情况,为所述物理主机配置资源同步信息的过程,包括:
基于所述物理主机上执行失败的目标任务及所述目标任务已执行的程度,配置表征所述目标任务对应的待同步事件的资源同步事件信息,并为所述待同步事件配置一一表征事件涉及的多个主机资源及资源同步过程的多个事件项信息。
优选地,所述资源同步事件信息包括所述物理主机的主机id、目标任务id、待同步事件id及事件状态、各所述目标任务的执行顺序及同一所述目标任务内各待同步事件的执行顺序;
所述事件项信息包括资源类型、同步资源所使用的rest接口地址、资源id、事件项优先级、重试次数、超时时间及失败是否跳过。
为解决上述技术问题,本发明还提供了一种基于虚拟化平台的主机资源同步装置,包括:
存储器,用于存储计算机程序;
处理器,用于在执行所述计算机程序时实现上述任一种基于虚拟化平台的主机资源同步方法的步骤。
本发明提供了一种基于虚拟化平台的主机资源同步方法,应用于处理器。在检测到虚拟化平台对应的物理主机异常断电时,基于物理主机上的任务运行情况,为物理主机配置资源同步信息,并将资源同步信息保存至预设主机资源同步配置库;在检测到目标主机上线后,判断主机资源同步配置库中是否存在目标主机对应的目标资源同步信息;若是,则根据目标资源同步信息,执行目标主机的同步资源操作,并在同步资源操作成功完成后,允许目标主机上线;若否,则允许目标主机直接上线。可见,本申请可在虚拟化平台对应的物理主机上线后,自动同步主机资源,保证了管理层和主机层的资源一致性,且提高了资源同步效率。
本发明还提供了一种基于虚拟化平台的主机资源同步系统及装置,与上述主机资源同步方法具有相同的有益效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于虚拟化平台的主机资源同步方法的流程图;
图2为本发明实施例提供的一种基于虚拟化平台的主机断电异常处理流程图;
图3为本发明实施例提供的一种基于虚拟化平台的主机上线资源同步流程图;
图4为本发明实施例提供的一种基于虚拟化平台的主机资源同步系统的结构示意图。
具体实施方式
本发明的核心是提供一种基于虚拟化平台的主机资源同步方法、系统及装置,可在虚拟化平台对应的物理主机上线后,同步主机资源,保证了管理层和主机层的资源一致性,且提高了资源同步效率。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,图1为本发明实施例提供的一种基于虚拟化平台的主机资源同步方法的流程图。
该基于虚拟化平台的主机资源同步方法包括:
步骤S1:在检测到虚拟化平台对应的物理主机异常断电时,基于物理主机上的任务运行情况,为物理主机配置资源同步信息,并将资源同步信息保存至预设主机资源同步配置库。
具体地,虚拟化平台对应的物理主机不止一个。本申请检测虚拟化平台对应的各物理主机是否异常断电,若检测到虚拟化平台对应的一物理主机异常断电,则获取异常断电的物理主机上的任务运行情况,并基于异常断电的物理主机上的任务运行情况,自动为异常断电的物理主机配置用于指导主机资源同步的资源同步信息,然后将资源同步信息自动保存至预设主机资源同步配置库,以为后续同步主机资源提供依据。
更具体地,已知由虚拟化平台的管理端向虚拟化平台对应的物理主机下发任务,物理主机按照管理端下发的任务执行此任务对应的操作步骤,若物理主机异常断电,则物理主机上正在处于运行状态的任务会执行失败,这些执行失败的任务是导致管理层和主机层的资源不一致的关键,则获取异常断电的物理主机上的任务运行情况的过程具体为:获取物理主机在异常断电时正在运行的任务及这些任务已执行的程度,并将这些正在运行的任务确定为异常断电的物理主机对应的执行失败的任务,以基于异常断电的物理主机对应的执行失败的任务及这些任务已执行的程度,为异常断电的物理主机配置资源同步信息。
步骤S2:在检测到目标主机上线后,判断主机资源同步配置库中是否存在目标主机对应的目标资源同步信息;若是,则执行步骤S3;若否,则执行步骤S4。步骤S3:根据目标资源同步信息,执行目标主机的同步资源操作,并在同步资源操作成功完成后,允许目标主机上线。步骤S4:允许目标主机直接上线。
需要说明的是,本申请的目标主机指的是虚拟化平台对应的任一物理主机。
具体地,本申请检测目标主机是否上线,若检测到目标主机上线,则自动判断主机资源同步配置库中是否存在目标主机对应的资源同步信息(称为目标资源同步信息),若主机资源同步配置库中存在目标主机对应的目标资源同步信息,说明有必要同步目标主机的资源,则先根据目标资源同步信息,自动执行目标主机的同步资源操作,然后在目标主机的同步资源操作成功完成后,才允许目标主机上线(资源同步模式→上线模式);若主机资源同步配置库中不存在目标主机对应的目标资源同步信息,说明不必同步目标主机的资源,则允许目标主机直接上线(上线模式)。
可见,本申请可在虚拟化平台对应的物理主机上线后,自动同步主机资源,保证了管理层和主机层的资源一致性,且提高了资源同步效率。
在上述实施例的基础上:
请参照图2及图3,图2为本发明实施例提供的一种基于虚拟化平台的主机断电异常处理流程图,图3为本发明实施例提供的一种基于虚拟化平台的主机上线资源同步流程图。
作为一种可选的实施例,基于物理主机上的任务运行情况,为物理主机配置资源同步信息的过程,包括:
基于物理主机上执行失败的目标任务及目标任务已执行的程度,配置表征目标任务对应的待同步事件的资源同步事件信息,并为待同步事件配置一一表征事件涉及的多个主机资源及资源同步过程的多个事件项信息;其中,资源同步事件信息和事件项信息共同组成资源同步信息。
具体地,本申请的用于指导主机资源同步的资源同步信息的配置过程为:
对于异常断电的任一物理主机,首先确定异常断电的物理主机对应的执行失败的任务(称为目标任务)及目标任务已执行的程度,然后为目标任务配置表征目标任务对应的待同步事件的资源同步事件信息(存入资源同步事件库),同时为目标任务对应的待同步事件,配置一一表征事件涉及的多个主机资源及资源同步过程的多个事件项信息(存入事件项库),即一个事件项信息表征待同步事件所涉及的一个主机资源及此主机资源的同步过程。
比如,物理主机创建虚拟机的任务包括如下步骤:1)配置CPU(中央处理器);2)配置内存;3)创建磁盘1、磁盘2;4)配置网卡1、网卡2。若一物理主机当下只有一个创建第一虚拟机的任务,且在创建完磁盘2、未配置网卡1时异常断电,而平台管理端只知道此物理主机任务执行失败,则为此物理主机配置资源同步信息的过程为:首先确定此物理主机对应的执行失败的目标任务为创建第一虚拟机的任务,及目标任务已执行的程度为创建完磁盘2、未配置网卡1,可以理解的是,目标任务对应的待同步事件为:删除此物理主机在执行创建第一虚拟机的任务时所产生的资源;待同步事件对应4个事件项,分别是释放此物理主机在执行创建第一虚拟机的任务时所产生的CPU资源、释放此物理主机在执行创建第一虚拟机的任务时所产生的内存资源、删除此物理主机在执行创建第一虚拟机的任务时所创建的磁盘1、删除此物理主机在执行创建第一虚拟机的任务时所创建的磁盘2,则以此为目标任务配置资源同步事件信息,同时为待同步事件配置事件项信息。
作为一种可选的实施例,资源同步事件信息包括物理主机的主机id、目标任务id、待同步事件id及事件状态、各目标任务的执行顺序及同一目标任务内各待同步事件的执行顺序;
则根据资源同步事件信息和事件项信息,执行物理主机的同步资源操作的过程,包括:
根据资源同步事件信息内主机id,确定异常断电的物理主机;
根据资源同步事件信息内目标任务id,确定异常断电的物理主机对应的执行失败的目标任务;
根据资源同步事件信息内待同步事件id,确定执行失败的目标任务对应的待同步事件;
根据待同步事件的事件状态,确定等待执行的待同步事件;
根据各目标任务的执行顺序及同一目标任务内各待同步事件的执行顺序,确定各目标任务对应的所有等待执行的待同步事件的执行顺序;
根据所有等待执行的待同步事件的执行顺序及每个待同步事件对应的多个事件项信息,依次执行各待同步事件。
具体地,本申请的资源同步事件信息包括:1)异常断电的物理主机的主机id(Identity document,身份标识号),可通过主机id确定异常断电的物理主机;2)异常断电的物理主机对应的执行失败的目标任务id,可通过目标任务id确定异常断电的物理主机对应的执行失败的目标任务;3)目标任务对应的待同步事件的id及事件状态(默认为待执行),可通过待同步事件id确定目标任务对应的待同步事件,并基于待同步事件的事件状态确定此待同步事件等待执行;4)各目标任务的执行顺序及同一目标任务内各待同步事件的执行顺序,以按照执行顺序,基于每个待同步事件对应的多个事件项信息依次执行各目标任务内各待同步事件。
作为一种可选的实施例,事件项信息包括资源类型、同步资源所使用的rest接口地址、资源id、事件项优先级、重试次数、超时时间及失败是否跳过;
则根据待同步事件对应的多个事件项信息,执行待同步事件的过程,包括:
根据目标事件项信息内事件项优先级,确定待同步事件对应的各事件项的执行顺序;其中,目标事件项信息表示目标事件项对应的事件项信息,目标事件项为任一事件项;
根据各事件项的执行顺序及目标事件项对应的资源类型、同步资源所使用的rest接口地址、资源id、重试次数、超时时间、失败是否跳过这一系列信息,依次执行各事件项。
本实施例在后续实施例中详细叙述,本申请在此不再赘述。
作为一种可选的实施例,根据目标事件项对应的资源类型、同步资源所使用的rest接口地址、资源id、重试次数、超时时间、失败是否跳过这一系列信息,执行目标事件项的过程,包括:
根据目标事件项信息内资源类型,确定目标事件项所涉及的资源类型;
根据目标事件项信息内同步资源所使用的rest接口地址,确定同步目标事件项所涉及的资源的rest接口;
根据目标事件项信息内资源id,确定目标事件项对应的待同步资源;
根据目标事件项信息内重试次数、超时时间及失败是否跳过,依次确定目标事件项允许重复执行的次数、允许的最长执行时间及最终执行失败是否允许直接跳过执行下一事件项;
根据目标事件项对应的rest接口、待同步资源、允许重复执行的次数、允许的最长执行时间及最终执行失败是否允许直接跳过执行下一事件项这一系列的信息,执行目标事件项。
具体地,本申请的事件项信息包括:1)事件项所涉及的资源类型,如事件项为释放CPU资源,则事件项所涉及的资源类型为CPU资源;2)同步资源所使用的rest接口地址(rest接口具体是原子操作rest接口,支持创建资源、同步资源状态、删除资源的功能);3)资源id,可通过资源id确定事件项对应操作的资源(即待同步资源),如事件项为释放在创建第一虚拟机的任务时所产生的CPU资源,则通过资源id可确定事件项对应操作的资源为:创建第一虚拟机的任务时所产生的CPU资源;4)事件项优先级,可通过事件项优先级确定事件项的执行顺序;5)重试次数,其用于设置单个事件项允许失败的次数,可以重复执行直到执行成功;6)超时时间,其用于设置单个事件项的最长执行时间,防止主机长时间处于资源同步模式,无法正常使用;7)失败是否跳过,其用于设置是否允许单个事件项最终执行失败但不影响整个同步事件正常执行结果,即单个事件项最终执行失败是否允许直接跳过执行下一事件项(若失败允许跳过,则在单个事件项最终执行失败后可直接跳过执行下一事件项,如果只有失败允许跳过的事件项执行失败,最终还是认为同步资源操作成功;若失败不允许跳过,则在单个事件项最终执行失败后不再执行下一事件项,直接确定同步资源操作失败),尽可能的保证主机正常上线。需要说明的是,单个事件项最终执行失败的情况是:单个事件项的重复执行的次数超过设置的重试次数,和/或单个事件项的执行时间超过设置的超时时间。
作为一种可选的实施例,资源类型包括CPU、内存、虚拟机、存储池、磁盘、网卡及端口;
则根据目标事件项信息内资源类型,确定目标事件项所涉及的资源类型的过程,包括:
根据目标事件项信息内资源类型,从CPU、内存、虚拟机、存储池、磁盘、网卡及端口多个资源类型中确定出目标事件项所涉及的资源类型。
具体地,待同步事件涉及的资源类型包括CPU(中央处理器)、内存、虚拟机、存储池、磁盘、网卡及端口。
作为一种可选的实施例,根据目标资源同步信息,执行目标主机的同步资源操作的过程,包括:
从主机资源同步配置库中加载目标主机对应的所有资源同步事件信息及事件项信息到待执行队列中;
基于待执行队列中的资源同步事件信息及事件项信息,依次执行目标主机的同步资源操作。
具体地,本申请在根据目标资源同步信息执行目标主机的同步资源操作时,可先从主机资源同步配置库中加载目标主机对应的所有资源同步事件信息及事件项信息到待执行队列中,然后基于待执行队列中的资源同步事件信息及事件项信息,依次执行目标主机的同步资源操作。
作为一种可选的实施例,基于虚拟化平台的主机资源同步方法还包括:
在执行目标主机的同步资源操作时,记录资源同步相关日志到预设同步日志库中;
若目标主机的同步资源操作失败,则进行人工干预提醒,以使人工根据同步日志库中的日志信息完成目标主机的同步资源操作。
进一步地,本申请还可在执行目标主机的同步资源操作时,记录资源同步相关日志到预设同步日志库中。若目标主机的同步资源操作失败,则进入资源同步失败模式,具体是进行人工干预提醒,目的是使人工可根据同步日志库中的日志信息完成目标主机的同步资源操作,并在人工干预处理成功后允许目标主机进入上线模式,此时虚拟化平台可以正常使用目标主机的所有资源。
综上,如图2所示,在主机异常断电后,配置资源同步事件信息至资源同步事件库、配置事件项信息(如事件项1、事件项2、事件项3)至事件项库(资源同步事件库和事件项库共同组成主机资源同步配置库),在配置完成后,事件项状态为待执行。
如图3所示,在主机重新上线后,从主机资源同步配置库中读取资源同步事件信息和事件项信息,执行资源同步事件(包含事件项1、事件项2、事件项3),待同步完成后,记录日志到同步日志库,并检查资源同步结果,若同步成功,则进入主机上线模式;若同步失败,则进入资源同步失败模式,并在修复后手动上线。
请参照图4,图4为本发明实施例提供的一种基于虚拟化平台的主机资源同步系统的结构示意图。
该基于虚拟化平台的主机资源同步系统包括:
信息配置模块1,用于在检测到虚拟化平台对应的物理主机异常断电时,基于物理主机上的任务运行情况,为物理主机配置资源同步信息,并将资源同步信息保存至预设主机资源同步配置库;
同步判断模块2,用于在检测到目标主机上线后,判断主机资源同步配置库中是否存在目标主机对应的目标资源同步信息;若是,则执行同步上线模块3;若否,则执行直接上线模块4;其中,目标主机为任一物理主机;
同步上线模块3,用于根据目标资源同步信息,执行目标主机的同步资源操作,并在同步资源操作成功完成后,允许目标主机上线;
直接上线模块4,用于允许目标主机直接上线。
作为一种可选的实施例,基于物理主机上的任务运行情况,为物理主机配置资源同步信息的过程,包括:
基于物理主机上执行失败的目标任务及目标任务已执行的程度,配置表征目标任务对应的待同步事件的资源同步事件信息,并为待同步事件配置一一表征事件涉及的多个主机资源及资源同步过程的多个事件项信息。
作为一种可选的实施例,资源同步事件信息包括物理主机的主机id、目标任务id、待同步事件id及事件状态、各目标任务的执行顺序及同一目标任务内各待同步事件的执行顺序;
事件项信息包括资源类型、同步资源所使用的rest接口地址、资源id、事件项优先级、重试次数、超时时间及失败是否跳过。
本申请提供的主机资源同步系统的介绍请参考上述主机资源同步方法的实施例,本申请在此不再赘述。
本申请还提供了一种基于虚拟化平台的主机资源同步装置,包括:
存储器,用于存储计算机程序;
处理器,用于在执行计算机程序时实现上述任一种基于虚拟化平台的主机资源同步方法的步骤。
本申请提供的主机资源同步装置的介绍请参考上述主机资源同步方法的实施例,本申请在此不再赘述。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于虚拟化平台的主机资源同步方法,其特征在于,应用于处理器,包括:
在检测到虚拟化平台对应的物理主机异常断电时,基于所述物理主机上的任务运行情况,为所述物理主机配置资源同步信息,并将所述资源同步信息保存至预设主机资源同步配置库;
在检测到目标主机上线后,判断所述主机资源同步配置库中是否存在所述目标主机对应的目标资源同步信息;其中,所述目标主机为任一所述物理主机;
若是,则根据所述目标资源同步信息,执行所述目标主机的同步资源操作,并在所述同步资源操作成功完成后,允许所述目标主机上线;
若否,则允许所述目标主机直接上线。
2.如权利要求1所述的基于虚拟化平台的主机资源同步方法,其特征在于,基于所述物理主机上的任务运行情况,为所述物理主机配置资源同步信息的过程,包括:
基于所述物理主机上执行失败的目标任务及所述目标任务已执行的程度,配置表征所述目标任务对应的待同步事件的资源同步事件信息,并为所述待同步事件配置一一表征事件涉及的多个主机资源及资源同步过程的多个事件项信息;其中,所述资源同步事件信息和所述事件项信息共同组成所述资源同步信息。
3.如权利要求2所述的基于虚拟化平台的主机资源同步方法,其特征在于,所述资源同步事件信息包括所述物理主机的主机id、目标任务id、待同步事件id及事件状态、各所述目标任务的执行顺序及同一所述目标任务内各待同步事件的执行顺序;
则根据所述资源同步事件信息和所述事件项信息,执行所述物理主机的同步资源操作的过程,包括:
根据所述资源同步事件信息内主机id,确定异常断电的物理主机;
根据所述资源同步事件信息内目标任务id,确定所述异常断电的物理主机对应的执行失败的目标任务;
根据所述资源同步事件信息内待同步事件id,确定所述执行失败的目标任务对应的待同步事件;
根据所述待同步事件的事件状态,确定等待执行的待同步事件;
根据各所述目标任务的执行顺序及同一所述目标任务内各待同步事件的执行顺序,确定各所述目标任务对应的所有等待执行的待同步事件的执行顺序;
根据所述所有等待执行的待同步事件的执行顺序及每个所述待同步事件对应的多个事件项信息,依次执行各所述待同步事件。
4.如权利要求3所述的基于虚拟化平台的主机资源同步方法,其特征在于,所述事件项信息包括资源类型、同步资源所使用的rest接口地址、资源id、事件项优先级、重试次数、超时时间及失败是否跳过;
则根据所述待同步事件对应的多个事件项信息,执行所述待同步事件的过程,包括:
根据目标事件项信息内事件项优先级,确定所述待同步事件对应的各事件项的执行顺序;其中,所述目标事件项信息表示目标事件项对应的事件项信息,所述目标事件项为任一所述事件项;
根据各所述事件项的执行顺序及所述目标事件项对应的资源类型、同步资源所使用的rest接口地址、资源id、重试次数、超时时间、失败是否跳过这一系列信息,依次执行各所述事件项。
5.如权利要求4所述的基于虚拟化平台的主机资源同步方法,其特征在于,根据所述目标事件项对应的资源类型、同步资源所使用的rest接口地址、资源id、重试次数、超时时间、失败是否跳过这一系列信息,执行所述目标事件项的过程,包括:
根据所述目标事件项信息内资源类型,确定所述目标事件项所涉及的资源类型;
根据所述目标事件项信息内同步资源所使用的rest接口地址,确定同步所述目标事件项所涉及的资源的rest接口;
根据所述目标事件项信息内资源id,确定所述目标事件项对应的待同步资源;
根据所述目标事件项信息内重试次数、超时时间及失败是否跳过,依次确定所述目标事件项允许重复执行的次数、允许的最长执行时间及最终执行失败是否允许直接跳过执行下一事件项;
根据所述目标事件项对应的rest接口、待同步资源、允许重复执行的次数、允许的最长执行时间及最终执行失败是否允许直接跳过执行下一事件项这一系列的信息,执行所述目标事件项。
6.如权利要求5所述的基于虚拟化平台的主机资源同步方法,其特征在于,所述资源类型包括CPU、内存、虚拟机、存储池、磁盘、网卡及端口;
则根据所述目标事件项信息内资源类型,确定所述目标事件项所涉及的资源类型的过程,包括:
根据所述目标事件项信息内资源类型,从CPU、内存、虚拟机、存储池、磁盘、网卡及端口多个资源类型中确定出所述目标事件项所涉及的资源类型。
7.如权利要求2所述的基于虚拟化平台的主机资源同步方法,其特征在于,根据所述目标资源同步信息,执行所述目标主机的同步资源操作的过程,包括:
从所述主机资源同步配置库中加载所述目标主机对应的所有资源同步事件信息及事件项信息到待执行队列中;
基于所述待执行队列中的资源同步事件信息及事件项信息,依次执行所述目标主机的同步资源操作。
8.如权利要求1-7任一项所述的基于虚拟化平台的主机资源同步方法,其特征在于,所述基于虚拟化平台的主机资源同步方法还包括:
在执行所述目标主机的同步资源操作时,记录资源同步相关日志到预设同步日志库中;
若所述目标主机的同步资源操作失败,则进行人工干预提醒,以使人工根据所述同步日志库中的日志信息完成所述目标主机的同步资源操作。
9.一种基于虚拟化平台的主机资源同步系统,其特征在于,包括:
信息配置模块,用于在检测到虚拟化平台对应的物理主机异常断电时,基于所述物理主机上的任务运行情况,为所述物理主机配置资源同步信息,并将所述资源同步信息保存至预设主机资源同步配置库;
同步判断模块,用于在检测到目标主机上线后,判断所述主机资源同步配置库中是否存在所述目标主机对应的目标资源同步信息;若是,则执行同步上线模块;若否,则执行直接上线模块;其中,所述目标主机为任一所述物理主机;
同步上线模块,用于根据所述目标资源同步信息,执行所述目标主机的同步资源操作,并在所述同步资源操作成功完成后,允许所述目标主机上线;
直接上线模块,用于允许所述目标主机直接上线。
10.一种基于虚拟化平台的主机资源同步装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于在执行所述计算机程序时实现如权利要求1-8任一项所述的基于虚拟化平台的主机资源同步方法的步骤。
CN202110873684.6A 2021-07-30 2021-07-30 一种基于虚拟化平台的主机资源同步方法、系统及装置 Pending CN113687987A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110873684.6A CN113687987A (zh) 2021-07-30 2021-07-30 一种基于虚拟化平台的主机资源同步方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110873684.6A CN113687987A (zh) 2021-07-30 2021-07-30 一种基于虚拟化平台的主机资源同步方法、系统及装置

Publications (1)

Publication Number Publication Date
CN113687987A true CN113687987A (zh) 2021-11-23

Family

ID=78578694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110873684.6A Pending CN113687987A (zh) 2021-07-30 2021-07-30 一种基于虚拟化平台的主机资源同步方法、系统及装置

Country Status (1)

Country Link
CN (1) CN113687987A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103701627A (zh) * 2012-09-27 2014-04-02 北京搜狐新媒体信息技术有限公司 一种云计算平台故障检测方法、装置及解决方法、装置
CN106341496A (zh) * 2016-11-10 2017-01-18 郑州云海信息技术有限公司 一种资源调度的方法及装置
CN106533769A (zh) * 2016-11-24 2017-03-22 华为技术有限公司 一种故障恢复方法及装置
CN110209497A (zh) * 2019-05-21 2019-09-06 深圳供电局有限公司 一种主机资源动态扩缩容的方法及系统
CN110377456A (zh) * 2019-07-05 2019-10-25 苏州浪潮智能科技有限公司 一种虚拟化平台容灾的管理方法及装置
CN110704244A (zh) * 2019-09-29 2020-01-17 苏州浪潮智能科技有限公司 一种磁盘离线处理方法、装置、设备及可读存储介质
WO2020018221A1 (en) * 2018-07-20 2020-01-23 Microsoft Technology Licensing, Llc Opportunistic offlining for faulty devices in datacenters
CN111581000A (zh) * 2020-03-20 2020-08-25 苏州浪潮智能科技有限公司 一种基于windows系统虚拟机磁盘的数据恢复方法及系统
CN112383588A (zh) * 2020-10-23 2021-02-19 汇智点亮科技(北京)有限公司 一种调整资源顺序延迟执行方法、系统及云平台
CN112463549A (zh) * 2020-11-25 2021-03-09 北京浪潮数据技术有限公司 云平台的审计方法、装置、设备及计算机可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103701627A (zh) * 2012-09-27 2014-04-02 北京搜狐新媒体信息技术有限公司 一种云计算平台故障检测方法、装置及解决方法、装置
CN106341496A (zh) * 2016-11-10 2017-01-18 郑州云海信息技术有限公司 一种资源调度的方法及装置
CN106533769A (zh) * 2016-11-24 2017-03-22 华为技术有限公司 一种故障恢复方法及装置
WO2020018221A1 (en) * 2018-07-20 2020-01-23 Microsoft Technology Licensing, Llc Opportunistic offlining for faulty devices in datacenters
CN110209497A (zh) * 2019-05-21 2019-09-06 深圳供电局有限公司 一种主机资源动态扩缩容的方法及系统
CN110377456A (zh) * 2019-07-05 2019-10-25 苏州浪潮智能科技有限公司 一种虚拟化平台容灾的管理方法及装置
CN110704244A (zh) * 2019-09-29 2020-01-17 苏州浪潮智能科技有限公司 一种磁盘离线处理方法、装置、设备及可读存储介质
CN111581000A (zh) * 2020-03-20 2020-08-25 苏州浪潮智能科技有限公司 一种基于windows系统虚拟机磁盘的数据恢复方法及系统
CN112383588A (zh) * 2020-10-23 2021-02-19 汇智点亮科技(北京)有限公司 一种调整资源顺序延迟执行方法、系统及云平台
CN112463549A (zh) * 2020-11-25 2021-03-09 北京浪潮数据技术有限公司 云平台的审计方法、装置、设备及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李忠谕 等: "通过PON接入实现云网融合及端到端故障定位方案", 《电信技术》, no. 5, 31 May 2019 (2019-05-31), pages 79 - 81 *

Similar Documents

Publication Publication Date Title
US6694345B1 (en) External job scheduling within a distributed processing system having a local job control system
US7908521B2 (en) Process reflection
US20050283673A1 (en) Information processing apparatus, information processing method, and program
CN109325016B (zh) 数据迁移方法、装置、介质及电子设备
CN114637475A (zh) 一种分布式存储系统控制方法、装置及可读存储介质
JP2010522932A (ja) インストールシーケンスのためのブックマークおよび構成ファイル
JP2007133544A (ja) 障害情報解析方法及びその実施装置
WO2009089746A1 (fr) Procédé, dispositif et système de réalisation d'une tâche dans un environnement de grappes
US5826078A (en) Job re-execution system and controlling method thereof
CN112231403A (zh) 数据同步的一致性校验方法、装置、设备和存储介质
CN113157411A (zh) 一种基于Celery的可靠可配置任务系统及装置
CN117608653A (zh) 一种操作系统迁移方法及计算设备
CN113687987A (zh) 一种基于虚拟化平台的主机资源同步方法、系统及装置
CN111694724B (zh) 分布式表格系统的测试方法、装置、电子设备及存储介质
CN114841298B (zh) 一种训练算法模型的方法、装置、电子设备和存储介质
CN115292092A (zh) 一种数据回滚方法、装置、设备及其存储介质
CN112596750B (zh) 应用测试方法、装置、电子设备及计算机可读存储介质
CN114020530A (zh) 一种操作系统的自动出厂备份方法和系统
CN113342511A (zh) 一种分布式任务管理系统及方法
JP2003280963A (ja) 文書管理システム、復旧方法、復旧を実行させるためのプログラム、該プログラムを記録した記録媒体
CN110795334A (zh) 一种测试装置和方法
CN110968486A (zh) 一种脚本运行方法及装置
CN112597030B (zh) 一种任务发布方法及装置、执行方法及装置、系统
CN113467994B (zh) 一种数据备份方法、系统及电子设备、存储介质
JPH1040123A (ja) ジョブ管理方式と方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination