CN112783603A - 集群关机控制方法、系统及存储介质 - Google Patents

集群关机控制方法、系统及存储介质 Download PDF

Info

Publication number
CN112783603A
CN112783603A CN202110065136.0A CN202110065136A CN112783603A CN 112783603 A CN112783603 A CN 112783603A CN 202110065136 A CN202110065136 A CN 202110065136A CN 112783603 A CN112783603 A CN 112783603A
Authority
CN
China
Prior art keywords
shutdown
cluster
working state
cluster unit
virtual machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110065136.0A
Other languages
English (en)
Inventor
刘建德
梁宏建
贾承晖
雷洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Consys Technology Co ltd
Original Assignee
Shenzhen Consys Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Consys Technology Co ltd filed Critical Shenzhen Consys Technology Co ltd
Priority to CN202110065136.0A priority Critical patent/CN112783603A/zh
Publication of CN112783603A publication Critical patent/CN112783603A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances

Abstract

本发明公开了一种集群关机控制方法、系统及存储介质,集群关机控制方法包括:服务管理机发送关机指令至多个集群单元;所述集群单元接收并根据所述关机指令执行关机操作;所述服务管理机检测接收所述关机指令的所述集群单元的工作状态;所述服务管理机根据所述集群单元的工作状态执行关机操作。本发明通过服务管理机根据集群单元的工作状态才执行关机操作,以保证集群单元完全关机后再进行关机,防止直接关机导致数据丢失,以提高集群关机时的数据安全。

Description

集群关机控制方法、系统及存储介质
技术领域
本发明涉及虚拟机的技术领域,尤其是涉及一种集群关机控制方法、系统及存储介质。
背景技术
随着大数据和云计算快速发展,虚拟化技术已经深入到计算机应用和信息处理技术多个方面。利用虚拟化技术,完成服务的无缝动态迁移、系统备份、系统状态回复变得更加便捷,虚拟机之间是安全隔离的,单个虚拟机出现故障不影响其它虚拟机正常运行。
多个虚拟机和集群多个单元及其它控制板以网络构建一个局部的集群,局部的多个集群又以网络级联形成小规模集群,集群的资源管理变得尤为重要,尤其是数据中心。逐个关闭单个单元系统步骤繁琐,直接掉电又会导致虚拟机镜像损坏及重要数据丢失,甚至整个集群都无法运行。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种集群关机控制方法,能够一定程度上防止数据丢失。
本发明还提出一种集群关机控制系统。
本发明还提出一种计算机可读存储介质。
第一方面,本发明的一个实施例提供了集群关机控制方法,包括:
服务管理机发送关机指令至多个集群单元;
所述集群单元接收并根据所述关机指令执行关机操作;
所述服务管理机检测接收所述关机指令的所述集群单元的工作状态;
所述服务管理机根据所述集群单元的工作状态执行关机操作。
本发明实施例的集群关机控制方法至少具有如下有益效果:通过服务管理机根据集群单元的工作状态执行关机操作,以保证集群单元完全关机后再进行关机,防止直接关机导致数据丢失,以保证集群关机时的数据安全。
根据本发明的另一些实施例的集群关机控制方法,所述集群单元包括:物理机和虚拟机系统,所述集群单元接收并根据所述关机指令执行关机操作,包括:
所述物理机接收所述关机指令,并发送所述关机指令给虚拟机系统;
实时检测接收所述关机指令的所述虚拟机系统的工作状态;
若所述虚拟机系统的工作状态为已关机,所述物理机执行关机操作;
若所述虚拟机系统的工作状态为预设时间内未关机,强制关闭所述虚拟机系统后所述物理机执行关机操作。
根据本发明的另一些实施例的集群关机控制方法,所述若所述虚拟机系统的工作状态为已关机,所述物理机执行关机操作,包括:
若所述虚拟机系统的工作状态为已关机,所述物理机关闭看门狗后台程序;
所述物理机卸载共享盘,并执行关机操作。
根据本发明的另一些实施例的集群关机控制方法,所述服务管理机检测接收所述关机指令的所述集群单元的工作状态,包括:
所述服务管理机在预设时间内发送多个检测数据包至接收所述关机指令的所述集群单元;
所述服务管理机根据所述集群单元在所述预设时间内是否接收到所述检测数据包确定所述集群单元的工作状态。
根据本发明的另一些实施例的集群关机控制方法,所述检测数据包为ICMP数据包。
根据本发明的另一些实施例的集群关机控制方法,所述服务管理机根据所述集群单元的工作状态执行关机操作,包括:
若所述集群单元的工作状态为已关机,所述服务管理机对已关机的所述集群单元进行标记。
根据本发明的另一些实施例的集群关机控制方法,所述服务管理机根据所述集群单元的工作状态执行关机操作,还包括:
若所述服务管理机连接的多个所述集群单元的工作状态都为已关机,所述服务管理机发送关机指令至其他关联服务管理机;
所述服务管理机停止相关服务并卸载共享盘,执行关机操作。
根据本发明的另一些实施例的集群关机控制方法,包括:
服务管理机,用于发送关机指令;
集群单元,用于接收所述关机指令,并根据所述关机指令执行关机操作,
所述服务管理机包括:
检测模块,用于检测接收所述关机指令的所述集群单元的工作状态;
执行模块,用于根据所述集群单元的工作状态执行关机操作。
第二方面,本发明的一个实施例提供了集群关机控制系统,包括:
服务管理机,用于发送关机指令;
集群单元,用于接收所述关机指令,并根据所述关机指令执行关机操作,
所述服务管理机包括:
检测模块,用于检测接收所述关机指令的所述集群单元的工作状态;
执行模块,用于根据所述集群单元的工作状态执行关机操作。
本发明实施例的集群关机控制系统至少具有如下有益效果:通过服务管理机根据集群单元的工作状态执行关机操作,以保证集群单元完全关机后再进行关机,防止直接关机导致数据丢失,以保证集群关机时的数据安全。
根据本发明的另一些实施例的集群关机控制系统,所述集群单元包括:物理机和虚拟机系统,
所述物理机用于所述物理机接收所述关机指令,并发送所述关机指令至所述虚拟机系统;
所述物理机用于检测到所述虚拟机系统在关机过程卡住,延时预设时间再检测所述虚拟机系统的工作状态;
若所述虚拟机系统的工作状态为已关机,所述物理机执行关机操作;
若所述虚拟机系统的工作状态为未关机,强制关闭所述虚拟机系统。
第三方面,本发明的一个实施例提供了计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面所述的集群关机控制方法。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
图1是本发明实施例中集群关机控制方法的一具体实施例流程示意图;
图2是本发明实施例中集群关机控制方法的另一具体实施例流程示意图;
图3是本发明实施例中集群关机控制方法的另一具体实施例流程示意图;
图4是本发明实施例中集群关机控制方法的另一具体实施例流程示意图;
图5是本发明实施例中集群关机控制方法的另一具体实施例流程示意图;
图6是本发明实施例中集群关机控制系统的一具体实施例模块框图。
附图标记:100、服务管理机;200、集群单元;210、物理机;220、虚拟机系统。
具体实施方式
以下将结合实施例对本发明的构思及产生的技术效果进行清楚、完整地描述,以充分地理解本发明的目的、特征和效果。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,基于本发明的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明保护的范围。
在本发明实施例的描述中,如果涉及到“若干”,其含义是一个以上,如果涉及到“多个”,其含义是两个以上,如果涉及到“大于”、“小于”、“超过”,均应理解为不包括本数,如果涉及到“以上”、“以下”、“以内”,均应理解为包括本数。如果涉及到“第一”、“第二”,应当理解为用于区分技术特征,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
多个虚拟机、多个物理机及其控制板以网络构建一个局部的集群,集群又以网络级联形成小规模集群,集群的资源管理变得尤为重要。其中,要保障集群数据安全,就需要保证集群供电稳定,或者在关机之前核心数据写入到磁盘。其中对于集群的关机操作,主要通过网络将刀片上虚拟机系统关机,然后关闭物理机,最后关闭服务管理机。但是集群按顺序关机时,由于某一个物理机或者虚拟机在关机卡住,且物理机包括服务管理及。服务管理机直接关闭会使数据没有同步到磁盘,导致数据丢失。
基于此,本申请公开了一种集群关机控制方法、系统及存储介质,能够检测集群单元是否关机后服务管理机再进行关机,以防止直接关机导致数据丢失。
第一方面,参照图1,本发明实施例公开了一种集群关机控制方法、系统及存储介质,包括:
S100、服务管理机发送关机指令至多个集群单元;
S200、集群单元根据关机指令执行关机操作;
S300、服务管理机检测接收关机指令的集群单元的工作状态;
S400、服务管理机根据集群单元的工作状态执行关机操作。
在一个局部的集群里面具有一个服务管理机、多个集群单元和多个控制板,服务管理机对多个集群单元进行管理,且局部集群之间又以网络级联形成小规模的集群。其中,集群单元为Host-Guest虚拟化主板,控制板为嵌入式单板,Host-Guest虚拟化主板底层运行的是Linux系统,其上运行的是VirtualBox或KVM等虚拟机系统,虚拟机系统上运行的是用户使用的Windows或Linux系统。
当用户在点击一键关机按钮时,集群单元接收到关机请求并发送至服务管理机。服务管理机接收到关机请求,且服务管理机通过广播分发至该服务管理机所管理的集群单元。集群单元根据关机指令执行关机操作,当集群单元执行关机操作后,由于服务管理机发送完关机指令后便开始实时监测接收关机指令的集群单元的工作状态,并根据集群单元的工作状态后执行关机下一步操作。因此,服务管理机在所有集群单元关闭后数据同步到磁盘上且安全卸载,以确保集群单元关闭后再进行关机操作,防止一键关机时任意一个集群单元没有将数据同步到服务管理机共享的共享盘,以防止数据丢失,从而提高了关机时的数据安全性。
其中,服务管理机接收“一键关机”的关机指令,服务管理机需要同步关机指令到各个级联的服务管理机,在所有集群单元关机后所有服务管理机也要正常关机,同步关机指令以确保所有服务管理机在相近时间段内同时关机。
参照图2,在一些实施例中,集群单元包括:物理机和虚拟机系统,步骤S200包括:
S210、物理机接收关机指令,并发送关机指令给虚拟机系统;
S220、实时检测接收关机指令的虚拟机系统的工作状态;
S230、若虚拟机系统的工作状态为已关机,物理机执行关机操作;
S240、若虚拟机系统的工作状态为预设时间内未关机,强制关闭虚拟机系统后物理机执行关机操作。
当服务管理机以广播方式发布关机指令,服务管理机所管理的集群单元都接收到关机指令,任意一个集群单元接收到关机指令相当于物理机接收到关机指令,且物理机将关机指令发送至虚拟机系统,虚拟机系统执行关机程序。当物理机发送关机指令至虚拟机后通过程序开启实时监测虚拟机系统的工作状态,若工作状态为已关机状态,物理机才执行关机操作。若监测虚拟机的工作状态为未预设时间内虚拟机未执行关机,则执行强制关机,且关闭虚拟机后物理机再执行关机操作。因此,保证虚拟机系统完成关机后再执行物理机的关机操作,以保证虚拟机系统在关机前将核心数据写入到磁盘,防止核心数据因为一键关机丢失。
其中,预设时间在本实施例为150秒,通过设置预设时间为150秒能够给予虚拟机系统足够时间进行关机操作,以确保用户数据完全同步到镜像里面物理机再执行关机操作。
参照图3,在一些实施例中,步骤S230包括:
S231、若虚拟机系统的工作状态为已关机,物理机关闭看门狗后台程序;
S232、物理机卸载共享盘,并执行关机操作。
当物理机检测虚拟机系统的工作状态为已关机,物理机关闭后台运行的看门狗后台程序。通过关闭看门狗后台程序以确保物理机的脚本不会被再次拉起来,然后停掉物理机的其他服务,安全卸载共享盘后再执行关机操作,以确保关机时数据安全,且能在限定时间内有序进行关机。物理机在确保虚拟机系统关机后,关闭看门狗后台程序和卸载共享盘,以确保数据安全同步到磁盘后关机,提高数据保存的安全性。
在一些实施例中,当物理机接收关机指令,虚拟机系统进行关机后物理机再执行关机操作,防止物理机和虚拟机系统未完成关机时,服务管理机直接关闭导致核心业务数据丢失甚至影响整个集群正常运行。因此服务管理机需要检测集群单元是否完成关机。
参照图4,步骤S300包括:
S310、服务管理机在预设时间内发送多个检测数据包至接收关机指令的集群单元;
S320、服务管理机根据集群单元在预设时间内是否接收到检测数据包确定集群单元的工作状态。
其中,检测数据包为ICMP数据包。服务管理机检测集群单元的工作状态主要是发送ICMP数据包至集群单元,若集群单元接收ICMP数据包则证明集群单元的工作状态为运行状态,若检测集群单元未接收ICMP数据包则证明集群单元的工作状态为关机状态。若集群单元处于忙碌状态无法接收ICMP数据包,直接判断集群单元的工作状态为关机状态则会出现错误。因此,在预设时间内发送多个ICMP数据包,若在预设时间内集群单元未接收到,则判断集群单元的工作状态为关机状态,以提高集群单元工作状态判断的准确性。
通常采用发送ping命令以检测集群单元的工作状态,但是ping命令的最小超时时间为1秒钟,在确认单个单元关闭情况下至少需要1秒钟。由于服务管理机管理多个集群单元,若每一个集群单元至少需要1秒钟,则检测集群单元会消耗大量的时间。而采用直接发送ICMP数据包至集群单元,能够让检测的时间缩短至10us,因此服务管理机可以在短时间完成所有集群单元的工作状态的检测,基本在10ms能够完成所有集群单元的检测。因此,采用发送ICMP数据包以检测集群单元的工作状态,能够节省所有集群单元的检测时间,基本上可以实时监测到集群单元的存活。
具体地,由于服务管理机发送ICMP数据包容易丢失,则各个集群单元并不能完全收到ICMP包,可以在1秒内发送10个或多个ICMP数据包至集群单元。预设时间在本实施例为1秒,在1秒内检测10个ICMP数据包都丢失则认为该集群单元的工作状态为关机状态,若在1秒内集群单元接收1个以上的ICMP数据包都证明集群单元的工作状态为启动状态。通过在预设时间内发送多个ICMP数据包以检测集群单元的工作状态,然后统计接收的数据包的比例,使得集群单元的工作状态判断更加准确。
参照图5,在一些实施例中,步骤S400包括:
S410、若集群单元的工作状态为已关机,服务管理机对已关机的集群单元进行标记。
若集群单元的工作状态为关机状态,但是没有对集群单元进行标记,服务管理机下一轮检测又要对该集群单元进行检测,检测最终是基于ICMP包的超时时间,则每轮检测所耗费的时间特别多。因此当检测集群单元的工作状态为已关机时,服务管理机对该集群单元进行标记,以便于下轮检测时服务管理机无需再次检测已关机的集群单元,且检测节省的时间和单元数量成线性关系,因此通过对集群单元进行标记后,能够减少检测的时间。
参照图5,在一些实施例中,步骤S400还包括:
S420、若服务管理机连接的多个集群单元的工作状态都为已关机,服务管理机发送关机指令至其他关联服务管理机;
S430、服务管理机停止相关服务并卸载共享盘,执行关机操作。
假设在集群内设置三个服务管理机且分别定义为第一服务管理机、第二服务管理机和第三服务管理机。第一服务机也就是响应当前用户点击一键关机服务器的管理机,其它均是在级联情况下形成多个服务器集群。当第一服务管理机确保连接的多个集群单元已经关机,开始发送关机同步指令至第二服务管理机和第三服务管理机,以实现第二服务管理机和第三服务管理机同步第一服务管理机的状态。第一服务管理机发送关机同步指令至其他服务管理机后,停止相关的服务并卸载共享盘。第二服务机和第三服务机接收并解析到关机同步指令后,同样需要停止所有后台服务程序并安全卸载共享盘。其中,停止相关服务主要是防止运行后台服务程序会重新拉起其他程序,同时有的后台服务一直运行会导致所有的服务管理机执行关机过程中卡住。而卸载共享盘主要是对远程nfs共享的数据盘卸载,然后将本地挂载的共享盘卸载,确保对共享盘没有读写,因此不会出现卸载共享盘卡住问题。通过将相关服务停止和共享盘安全卸载后,执行关机操作,使得服务管理机正常关机,不会影响数据的丢失。
下面参考图1至图5以一个具体的实施例详细描述根据本发明实施例的集群关机控制方法。值得理解的是,下述描述仅是示例性说明,而不是对发明的具体限制。
当服务管理机以广播方式发布关机指令,物理机接收到关机指令,物理机将关机指令发送至虚拟机系统,虚拟机系统执行关机程序。实时检测接收关机指令的虚拟机系统的工作状态,若检测虚拟机系统的工作状态为在预设时间内未关闭,则强制关闭虚拟机系统,以确保虚拟机系统的最终工作状态为已关机状态,物理机关闭后台运行的看门狗后台程序,以确保物理机的脚本不会被再次拉起来或卡住。然后停掉物理机的其他服务,安全卸载共享盘后执行关机操作,以确保关机时数据安全,且能在限定时间内有序进行关机。服务管理机在1秒内发送10个ICMP数据包至某个集群单元,且预设时间为1秒,在1秒内检测10个ICMP数据包都丢失则认为某个集群单元的工作状态为关机状态,反之则说明某个集群单元的工作状态为运行状态。当检测集群单元的工作状态为已关机时,服务管理机对该集群单元进行标记,当所有的集群单元都关机,服务管理机发送关机指令至其他服务管理机后,所有的服务管理机开始停止相关的服务并卸载共享盘,然后执行关机流程。
综上,通过虚拟机系统完成关机后,物理机确在限定时间内确保虚拟机系统的工作状态为已关机状态,物理机关闭后台运行的看门狗后台程序,然后停掉物理机的其他服务,安全卸载共享盘后执行关机操作;服务管理机在限定时间内完成对所有集群单元的物理机关关机,最后同步发送关机指令至其他的服务管理机后,所有服务管理机开始停止相关服务后卸载共享盘,然后完成关机操作。通过以上步骤可以有效的防止虚拟机系统卡住或服务管理机卡住直接关机导致数据丢失,同时使得集群关机时数据更加安全,关机耗时短,且系统运行更加稳定。
第二方面,参照图6,本发明实施例还公开了集群关机控制系统,包括:服务管理机100和集群单元200,服务管理机100用于发送关机指令;集群单元200用于接收关机指令,并根据关机指令执行关机操作。服务管理机100包括:检测模块和执行模块,检测模块用于检测接收关机指令的集群单元200的工作状态;执行模块用于根据集群单元200的工作状态执行关机操作,以实现多个服务管理机100之间的状态同步。
通过服务管理机100检测集群单元200在接收关机指令后是否正常关机,以保证集群单元200正常关机后再进行关机操作,防止集群单元200未关机直接关闭服务管理机100导致数据丢失。
其中,服务管理机100接收“一键关机”的关机指令,服务管理机100需要同步关机指令到各个级联的服务管理机100,在所有集群单元200关机后所有服务管理机100也要正常关机,同步关机指令以确保所有服务管理机100在相近时间段内同时关机。
在一些实施例中,集群单元200包括:物理机210和虚拟机系统220,物理机210用于物理机210接收关机指令,并发送关机指令给虚拟机系统220;物理机210用于检测到虚拟机系统220在关机过程卡住,延时预设时间再检测虚拟机系统220的工作状态;若虚拟机系统220的工作状态为已关机,物理机210执行关机操作。
物理机210接收关机指令后发送关机指令至虚拟机系统220,以确保虚拟机系统220完成关机后再进行关机,以防止虚拟机系统220进行数据收发时丢失,以保证集群单元200关机时的数据安全。
第三方面,本发明实施例还公开了计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使计算机执行如第一方面的集群关机控制方法。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。此外,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。

Claims (10)

1.集群关机控制方法,其特征在于,包括:
服务管理机发送关机指令至多个集群单元;
所述集群单元接收并根据所述关机指令执行关机操作;
所述服务管理机检测接收所述关机指令的所述集群单元的工作状态;
所述服务管理机根据所述集群单元的工作状态执行关机操作。
2.根据权利要求1所述的集群关机控制方法,其特征在于,所述集群单元包括:物理机和虚拟机系统,所述集群单元接收并根据所述关机指令执行关机操作,包括:
所述物理机接收所述关机指令,并发送所述关机指令给虚拟机系统;
实时检测接收所述关机指令的所述虚拟机系统的工作状态;
若所述虚拟机系统的工作状态为已关机,所述物理机执行关机操作;
若所述虚拟机系统的工作状态为预设时间内未关机,强制关闭所述虚拟机系统后所述物理机执行关机操作。
3.根据权利要求2所述的集群关机控制方法,其特征在于,所述若所述虚拟机系统的工作状态为已关机,所述物理机执行关机操作,包括:
若所述虚拟机系统的工作状态为已关机,所述物理机关闭看门狗后台程序;
所述物理机卸载共享盘,并执行关机操作。
4.根据权利要求1至3任一项所述的集群关机控制方法,其特征在于,所述服务管理机检测接收所述关机指令的所述集群单元的工作状态,包括:
所述服务管理机在预设时间内发送多个检测数据包至接收所述关机指令的所述集群单元;
所述服务管理机根据所述集群单元在所述预设时间内是否接收到所述检测数据包确定所述集群单元的工作状态。
5.根据权利要求4所述的集群关机控制方法,其特征在于,所述检测数据包为ICMP数据包。
6.根据权利要求1至3任一项所述的集群关机控制方法,其特征在于,所述服务管理机根据所述集群单元的工作状态执行关机操作,包括:
若所述集群单元的工作状态为已关机,所述服务管理机对已关机的所述集群单元进行标记。
7.根据权利要求6所述的集群关机控制方法,其特征在于,所述服务管理机根据所述集群单元的工作状态执行关机操作,还包括:
若所述服务管理机连接的多个所述集群单元的工作状态都为已关机,所述服务管理机发送关机指令至其他关联服务管理机;
所述服务管理机停止相关服务并卸载共享盘,执行关机操作。
8.一种集群关机控制系统,其特征在于,包括:
服务管理机,用于发送关机指令;
集群单元,用于接收所述关机指令,并根据所述关机指令执行关机操作,
所述服务管理机包括:
检测模块,用于检测接收所述关机指令的所述集群单元的工作状态;
执行模块,用于根据所述集群单元的工作状态执行关机操作。
9.根据权利要求8所述的集群关机控制系统,其特征在于,所述集群单元包括:物理机和虚拟机系统,
所述物理机用于所述物理机接收所述关机指令,并发送所述关机指令至所述虚拟机系统;
所述物理机用于检测到所述虚拟机系统在关机过程卡住,延时预设时间再检测所述虚拟机系统的工作状态;
若所述虚拟机系统的工作状态为已关机,所述物理机执行关机操作;
若所述虚拟机系统的工作状态为未关机,强制关闭所述虚拟机系统。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7任一项所述的集群关机控制方法。
CN202110065136.0A 2021-01-18 2021-01-18 集群关机控制方法、系统及存储介质 Pending CN112783603A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110065136.0A CN112783603A (zh) 2021-01-18 2021-01-18 集群关机控制方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110065136.0A CN112783603A (zh) 2021-01-18 2021-01-18 集群关机控制方法、系统及存储介质

Publications (1)

Publication Number Publication Date
CN112783603A true CN112783603A (zh) 2021-05-11

Family

ID=75757496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110065136.0A Pending CN112783603A (zh) 2021-01-18 2021-01-18 集群关机控制方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN112783603A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113687867A (zh) * 2021-08-24 2021-11-23 济南浪潮数据技术有限公司 一种云平台集群的关机方法、系统、设备及存储介质
CN114880035A (zh) * 2022-05-07 2022-08-09 矩阵时光数字科技有限公司 一种开关机系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020145983A1 (en) * 2001-04-06 2002-10-10 International Business Machines Corporation Node shutdown in clustered computer system
CN105306225A (zh) * 2015-11-03 2016-02-03 国云科技股份有限公司 一种基于Openstack的物理机远程关机方法
CN111078310A (zh) * 2019-11-13 2020-04-28 国云科技股份有限公司 一种桌面云服务器快速关机的方法
CN111176749A (zh) * 2019-12-17 2020-05-19 苏州浪潮智能科技有限公司 一种高性能计算集群关闭方法与装置
CN111917576A (zh) * 2020-07-28 2020-11-10 星辰天合(北京)数据科技有限公司 存储集群的控制方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020145983A1 (en) * 2001-04-06 2002-10-10 International Business Machines Corporation Node shutdown in clustered computer system
CN105306225A (zh) * 2015-11-03 2016-02-03 国云科技股份有限公司 一种基于Openstack的物理机远程关机方法
CN111078310A (zh) * 2019-11-13 2020-04-28 国云科技股份有限公司 一种桌面云服务器快速关机的方法
CN111176749A (zh) * 2019-12-17 2020-05-19 苏州浪潮智能科技有限公司 一种高性能计算集群关闭方法与装置
CN111917576A (zh) * 2020-07-28 2020-11-10 星辰天合(北京)数据科技有限公司 存储集群的控制方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113687867A (zh) * 2021-08-24 2021-11-23 济南浪潮数据技术有限公司 一种云平台集群的关机方法、系统、设备及存储介质
CN113687867B (zh) * 2021-08-24 2023-12-29 济南浪潮数据技术有限公司 一种云平台集群的关机方法、系统、设备及存储介质
CN114880035A (zh) * 2022-05-07 2022-08-09 矩阵时光数字科技有限公司 一种开关机系统
CN114880035B (zh) * 2022-05-07 2024-05-07 矩阵时光数字科技有限公司 一种开关机系统

Similar Documents

Publication Publication Date Title
CN113064747B (zh) 一种服务器启动过程中的故障定位方法、系统及装置
US9262257B2 (en) Providing boot data in a cluster network environment
CN100492305C (zh) 一种计算机系统的快速恢复方法及设备
EP4083786A1 (en) Cloud operating system management method and apparatus, server, management system, and medium
CN112783603A (zh) 集群关机控制方法、系统及存储介质
CN103152419A (zh) 一种云计算平台的高可用集群管理方法
CN112783444A (zh) 集群磁盘共享方法、系统及存储介质
WO2018095107A1 (zh) 一种bios程序的异常处理方法及装置
WO2017054626A1 (zh) 一种虚拟机故障修复方法和装置
CN111478796B (zh) 一种ai平台的集群扩容异常处理方法
US20150046748A1 (en) Information processing device and virtual machine control method
CN108804129B (zh) 一种软件升级方法及装置
CN111427259B (zh) 一种机框插槽式的主备切换方法、智能设备及存储介质
CN112596371A (zh) 控制卡切换方法、装置、电子设备及存储介质
CN111090537A (zh) 集群启动方法、装置、电子设备及可读存储介质
CN111221683A (zh) 数据中心交换机双flash热备份方法、系统、终端及存储介质
CN201047943Y (zh) 一种计算机系统的快速恢复设备
CN109324834A (zh) 一种分布式存储服务器自动重启的系统及方法
US20220179680A1 (en) Application state control method apparatus, and terminal and computer-readable storage medium
CN115686951A (zh) 一种数据库服务器的故障处理方法和装置
CN110727652B (zh) 一种云存储处理系统及其实现数据处理的方法
CN107783855B (zh) 虚拟网元的故障自愈控制装置及方法
CN111782515A (zh) web应用的状态检测方法、装置、服务器和存储介质
CN104978208A (zh) 一种热重启方法及其装置
CN109815064B (zh) 节点隔离方法、装置、节点设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination