CN113687867B - 一种云平台集群的关机方法、系统、设备及存储介质 - Google Patents

一种云平台集群的关机方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN113687867B
CN113687867B CN202110975142.XA CN202110975142A CN113687867B CN 113687867 B CN113687867 B CN 113687867B CN 202110975142 A CN202110975142 A CN 202110975142A CN 113687867 B CN113687867 B CN 113687867B
Authority
CN
China
Prior art keywords
cloud platform
service
platform cluster
shutdown
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110975142.XA
Other languages
English (en)
Other versions
CN113687867A (zh
Inventor
孙振林
贾峰
周书斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Data Technology Co Ltd
Original Assignee
Jinan Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Data Technology Co Ltd filed Critical Jinan Inspur Data Technology Co Ltd
Priority to CN202110975142.XA priority Critical patent/CN113687867B/zh
Publication of CN113687867A publication Critical patent/CN113687867A/zh
Application granted granted Critical
Publication of CN113687867B publication Critical patent/CN113687867B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/442Shutdown
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances

Abstract

本申请公开了一种云平台集群的关机方法,应用于云平台集群的任一控制节点中,包括:检查云平台集群的存储服务是否异常;如果未异常,则检查云平台集群的主机文件是否正确;如果正确,则运行预设的关机程序,并通过关机程序自动将云平台集群的各个节点关机。应用本申请的方案,可以有效地将云平台集群关机,避免误操作的情况,并且通过检查主机文件是否正确,能够有效地保障关机成功,也有利于进一步地保障系统安全性。通过检查云平台集群的存储服务是否异常,有利于保障数据的安全性。本申请还提供了一种云平台集群的关机系统、设备及存储介质,具有相应技术效果。

Description

一种云平台集群的关机方法、系统、设备及存储介质
技术领域
本发明涉及服务器技术领域,特别是涉及一种云平台集群的关机方法、系统、设备及存储介质。
背景技术
随着云计算、大数据技术的快速发展,云计算产品的需求不断增加,从而导致云平台的规模不断增加,云平台中所使用的服务器数量也不断增加,因此,云平台集群的关机维护变的越来越复杂繁琐。
目前,在进行云平台集群的关机时,由工作人员进行操作,即使工作人员经过了培训,也经常会发生操作错误的情况,从而影响云平台集群中的数据库、消息队列等组件的安全性,稳定性。
综上所述,如何有效地将云平台集群关机,避免误操作的情况,是目前本领域技术人员急需解决的技术问题。
发明内容
本发明的目的是提供一种云平台集群的关机方法、系统、设备及存储介质,以有效地将云平台集群关机,避免误操作的情况。
为解决上述技术问题,本发明提供如下技术方案:
一种云平台集群的关机方法,应用于云平台集群的任一控制节点中,包括:
检查所述云平台集群的存储服务是否异常;
如果未异常,则检查所述云平台集群的主机文件是否正确;
如果正确,则运行预设的关机程序,并通过所述关机程序自动将所述云平台集群的各个节点关机。
优选的,所述运行预设的关机程序,并通过所述关机程序自动将所述云平台集群的各个节点关机,包括:
运行预设的关机程序,并通过所述关机程序自动关闭所述云平台集群中的各个虚拟机;
在各个所述虚拟机均关闭之后,通过所述关机程序自动关闭所述云平台集群的各个节点中的节点高可用性服务;
在各个所述节点高可用性服务均关闭之后,通过所述关机程序自动关闭所述云平台集群的各个节点中的各个非控制服务;
在各个所述非控制服务均关闭之后,通过所述关机程序自动关闭所述云平台集群的各个节点中的各个控制服务;
在各个所述控制服务均关闭之后,通过所述关机程序自动关闭所述云平台集群的各个节点中的操作系统。
优选的,还包括:
当任一虚拟机关闭失败时,重启所述虚拟机并在重启完成之后强制关闭所述虚拟机;
在运行预设的关机程序之后,在通过所述关机程序自动将所述云平台集群的各个节点关机之前,还包括:
将所述云平台集群的数据库和配置文件进行文件备份。
优选的,还包括:
当任一节点高可用性服务关闭失败时,执行预设的第一修复操作以将所述节点高可用性服务关闭;
当任一非控制服务关闭失败时,执行预设的第二修复操作以将所述非控制服务关闭;
当任一控制服务关闭失败时,执行预设的第三修复操作以将所述控制服务关闭。
优选的,所述执行预设的第一修复操作以将所述节点高可用性服务关闭,包括:
将发生了关闭失败情况的所述节点高可用性服务重启,并在重启之后重新关闭所述节点高可用性服务;
所述当任一非控制服务关闭失败时,执行预设的第二修复操作以将所述非控制服务关闭,包括:
将发生了关闭失败情况的所述非控制服务重启,并在重启之后重新关闭所述非控制服务;
所述当任一控制服务关闭失败时,执行预设的第三修复操作以将所述控制服务关闭,包括:
将发生了关闭失败情况的所述控制服务重启,并在重启之后重新关闭所述控制服务。
优选的,还包括:
当任一节点高可用性服务,或者任一非控制服务,或者任一控制服务的重启次数达到了预设阈值时,停止进行所述云平台集群的关机并输出第一提示信息。
优选的,所述检查所述云平台集群的存储服务是否异常,包括:
检查所述云平台集群的存储服务是否启动;
如果未启动,则确定出所述存储服务异常;
如果启动,则在所述存储服务的运行状态和IO状态均正常时,确定所述存储服务未异常。
一种云平台集群的关机系统,应用于云平台集群的任一控制节点中,包括:
存储服务检查模块,用于检查所述云平台集群的存储服务是否异常;
如果未异常,则触发主机文件检查模块,用于检查所述云平台集群的主机文件是否正确;
如果正确,则触发自动关机模块,用于运行预设的关机程序,并通过所述关机程序自动将所述云平台集群的各个节点关机。
一种云平台集群的关机设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现上述任一项所述的云平台集群的关机方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的云平台集群的关机方法的步骤。
应用本发明实施例所提供的技术方案,预设了关机程序,控制节点可以运行该关机程序,进而通过关机程序自动将云平台集群的各个节点关机,因此不会出现误操作的情况,也就有利于保障云平台集群中的数据库、消息队列等组件的安全性,稳定性。并且,考虑到云平台集群的主机文件通常不会发生错误,但如果发生错误,便会导致关机过程出现异常,因此,本申请会检查云平台集群的主机文件是否正确,确定正确之后,才会通过关机程序自动将云平台集群的各个节点关机,从而能够有效地保障关机成功,也有利于进一步地保障系统安全性。此外,本申请还考虑到,如果云平台集群的存储服务异常,则在关机时可能会出现数据错误、丢失等异常情况,因此,本申请会检查云平台集群的存储服务是否异常,只有在未异常时,才能触发后续的关机操作,有利于保障数据的安全性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明中一种云平台集群的关机方法的实施流程图;
图2为本发明中一种云平台集群的关机系统的结构示意图。
具体实施方式
本发明的核心是提供一种云平台集群的关机方法,可以有效地将云平台集群关机,避免误操作的情况,并且通过检查主机文件是否正确,能够有效地保障关机成功,也有利于进一步地保障系统安全性,通过检查云平台集群的存储服务是否异常,有利于保障数据的安全性。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明中一种云平台集群的关机方法的实施流程图,该云平台集群的关机方法可以应用于云平台集群的任一控制节点中,可以包括以下步骤:
步骤S101:检查云平台集群的存储服务是否异常。
如果未异常,则执行步骤S102。
具体的,云平台集群中可以包括多个节点,这些节点可以分为控制节点和非控制节点两类。本申请可以由任一控制节点下载预设的关机程序,从而可以执行后续的关机操作,关机程序需要由工作人员预先进行设定,以使得后续执行该关机程序时,能够实现云平台集群的自动关机。在进行云平台集群的关机时,需要将云平台集群中的每一个节点均关机,即需要将各个控制节点和各个非控制节点均关机。
考虑到数据的安全性,本申请的方案会检查云平台集群的存储服务是否异常,如果异常,则不会触发后续的关机操作,此外,也可以输出相应的提示信息以便工作人员进行处理。而如果确定出云平台集群的存储服务是正常的,便可以执行步骤S102。
检查云平台集群的存储服务是否异常的方式有种,例如在本发明的一种具体实施方式中,考虑到通过运行状态和IO状态,通常可以有效地判定出存储服务是否异常,因此,步骤S101可以具体包括:
检查云平台集群的存储服务是否启动;
如果未启动,则确定出存储服务异常;
如果启动,则在存储服务的运行状态和IO状态均正常时,确定存储服务未异常。
该种实施方式中,首先会检查云平台集群的存储服务是否启动,如果未启动,说明存在异常,如果正常启动了,则只需要检查存储服务的运行状态和IO状态是否均正常,如果是,便可以确定出存储服务未异常,简单方便,并且可以有效地检查出存储服务是否异常。
步骤S102:检查云平台集群的主机文件是否正确。
如果正确,则执行步骤S103。
在通常情况下,云平台集群的主机文件,即hosts文件不会发生错误,但如果由于被篡改等原因导致hosts文件错误,便会导致关机过程出现异常,因此,本申请的方案中,会检查云平台集群的主机文件是否正确。
检查云平台集群的主机文件是否正确的具体方式可以有多种,例如一种简单的方式是在每次更新了云平台集群的主机文件之后,对存储的校验值进行更新,在需要检查云平台集群的主机文件是否正确时,生成被检查的主机文件的校验值,并与当前存储中的校验值比较,当二者一致时,可以认为当前被检查的云平台集群的主机文件是正确的,反之则是不正确的。
当然,如果检查出云平台集群的主机文件不正确,便可以直接结束,即可以停止进行云平台集群的关机,此外还可以输出相应的提示信息,以使得工作人员能够注意到该情况。
步骤S103:运行预设的关机程序,并通过关机程序自动将云平台集群的各个节点关机。
在检查出云平台集群的主机文件正确之后,便可以运行关机程序,从而通过关机程序自动将云平台集群的各个节点关机。可以理解的是,通过关机程序自动将云平台集群的各个节点关机时,具体的各个关机操作需要符合关机要求,有效地保障云平台集群中的数据库、消息队列等组件的安全性,稳定性。
例如在本发明的一种具体实施方式中,步骤S103可以具体包括:
运行预设的关机程序,并通过关机程序自动关闭云平台集群中的各个虚拟机;
在各个虚拟机均关闭之后,通过关机程序自动关闭云平台集群的各个节点中的节点高可用性服务;
在各个节点高可用性服务均关闭之后,通过关机程序自动关闭云平台集群的各个节点中的各个非控制服务;
在各个非控制服务均关闭之后,通过关机程序自动关闭云平台集群的各个节点中的各个控制服务;
在各个控制服务均关闭之后,通过关机程序自动关闭云平台集群的各个节点中的操作系统。
该种实施方式中,先将云平台集群中的各个虚拟机进行关闭,这是考虑到如果在关闭虚拟机之前先关闭了云平台集群中的服务,就容易出现数据丢失等影响云平台集群的安全性,稳定性的情况,因此,该种实施方式会先通过关机程序自动关闭云平台集群中的各个虚拟机。
虚拟机的关闭需要一定的耗时,在实际应用中,可以通过周期性的检测来确定各个虚拟机是否均关闭。相应的,后续确定相应的服务是否均关闭时,也可以进行周期性的判断。
在各个虚拟机均关闭之后,可以通过关机程序自动关闭云平台集群的各个节点中的节点高可用性服务。节点中设置的节点高可用性服务目的是保障云平台集群的高可用性,例如当某个节点异常时,基于节点高可用性服务,该异常节点的功能可以转移到其他节点中。
在各个节点高可用性服务均关闭之后,可以通过关机程序自动关闭云平台集群的各个节点中的各个非控制服务,非控制服务指的是控制服务之外的其他类型的服务,例如数据库服务,网络服务,计算服务等等。
在各个非控制服务均关闭之后,可以通过关机程序自动关闭云平台集群的各个节点中的各个控制服务。各个控制服务是不同类型的服务中最后进行关闭的,有利于保障云平台集群的成功关机。
在各个控制服务均关闭之后,最后可以通过关机程序自动关闭云平台集群的各个节点中的操作系统。
进一步的,在本发明的一种具体实施方式中,还可以包括:
当任一虚拟机关闭失败时,重启虚拟机并在重启完成之后强制关闭虚拟机。
如前文的描述,在实际应用中,可以通过周期性的检测来确定各个虚拟机是否均关闭,但是在部分场合中,可能会出现虚拟机关闭失败的异常情况,此时通过等待便无法解决问题,因此,该种实施方式中会将关闭失败的虚拟机进行重启,并在重启完成之后强制关闭虚拟机,以保障各个虚拟机都能够被关闭,使得关机程序能够继续执行后续的操作。
在本发明的一种具体实施方式中,还可以包括:
当任一节点高可用性服务关闭失败时,执行预设的第一修复操作以将节点高可用性服务关闭;
当任一非控制服务关闭失败时,执行预设的第二修复操作以将非控制服务关闭;
当任一控制服务关闭失败时,执行预设的第三修复操作以将控制服务关闭。
与上文中描述的虚拟机的关闭失败类似,任一节点高可用性服务,任一非控制服务以及任一控制服务也都可能出现关闭失败的情况,因此,该种实施方式中便通过执行预设的第一修复操作,使得关闭失败的节点高可用性服务能够被成功关闭。通过执行预设的第二修复操作,使得关闭失败的非控制服务能够被成功关闭。通过执行预设的第三修复操作,使得关闭失败的控制服务能够被成功关闭。
预设的第一修复操作,第二修复操作,以及第三修复操作的具体内容可以根据实际需要进行设定和调整,例如在本发明的一种具体实施方式中,执行预设的第一修复操作以将节点高可用性服务关闭,可以包括:
将发生了关闭失败情况的节点高可用性服务重启,并在重启之后重新关闭节点高可用性服务;
当任一非控制服务关闭失败时,执行预设的第二修复操作以将非控制服务关闭,包括:
将发生了关闭失败情况的非控制服务重启,并在重启之后重新关闭非控制服务;
当任一控制服务关闭失败时,执行预设的第三修复操作以将控制服务关闭,包括:
将发生了关闭失败情况的控制服务重启,并在重启之后重新关闭控制服务。
该种实施方式中,第一修复操作,第二修复操作,以及第三修复操作的手段都是选择将对应的服务重启之后再重新进行关闭,操作上较为简单方便,易于实施。
当然,在其他实施方式中,可以根据不同的服务类型,相适应地设置针对性的修复操作的具体内容,从而进一步地提高服务关闭的成功率,并不影响本发明的实施,当然,采用这样的方式时,第一修复操作,第二修复操作,以及第三修复操作的复杂度会高一些。
进一步的,在本发明的一种具体实施方式中,当任一节点高可用性服务,或者任一非控制服务,或者任一控制服务的重启次数达到了预设阈值时,停止进行云平台集群的关机并输出第一提示信息。
该种实施方式中,考虑到如果任一节点高可用性服务,或者任一非控制服务,或者任一控制服务的重启次数达到了预设阈值,说明无法通过重启服务的方式进行该服务的关闭,因此,会停止进行云平台集群的关机,避免强制关机导致的数据丢失等异常情况,同时会输出第一提示信息,以使得工作人员能够及时注意并进行人工处理。
在本发明的一种具体实施方式中,在运行预设的关机程序之后,在通过关机程序自动将云平台集群的各个节点关机之前,还可以包括:
将云平台集群的数据库和配置文件进行文件备份。
该种实施方式中,为了进一步的保障云平台集群的安全,稳定性,在通过关机程序自动将云平台集群的各个节点关机之前,会将云平台集群的数据库和配置文件进行文件备份,这样使得即使由于异常因素导致了数据库中的数据丢失,或者配置文件的数据丢失,也能够基于文件备份进行恢复。当然,其他具体场合中,可以针对数据库和配置文件之外的其他的重要数据进行文件备份,根据实际需要进行选择即可。
应用本发明实施例所提供的技术方案,预设了关机程序,控制节点可以运行该关机程序,进而通过关机程序自动将云平台集群的各个节点关机,因此不会出现误操作的情况,也就有利于保障云平台集群中的数据库、消息队列等组件的安全性,稳定性。并且,考虑到云平台集群的主机文件通常不会发生错误,但如果发生错误,便会导致关机过程出现异常,因此,本申请会检查云平台集群的主机文件是否正确,确定正确之后,才会通过关机程序自动将云平台集群的各个节点关机,从而能够有效地保障关机成功,也有利于进一步地保障系统安全性。此外,本申请还考虑到,如果云平台集群的存储服务异常,则在关机时可能会出现数据错误、丢失等异常情况,因此,本申请会检查云平台集群的存储服务是否异常,只有在未异常时,才能触发后续的关机操作,有利于保障数据的安全性。
相应于上面的方法实施例,本发明实施例还提供了一种云平台集群的关机系统,可与上文相互对应参照。
参见图2所示,为本发明中一种云平台集群的关机系统的结构示意图,应用于云平台集群的任一控制节点中,包括:
存储服务检查模块201,用于检查云平台集群的存储服务是否异常;
如果未异常,则触发主机文件检查模块202,用于检查云平台集群的主机文件是否正确;
如果正确,则触发自动关机模块203,用于运行预设的关机程序,并通过关机程序自动将云平台集群的各个节点关机。
在本发明的一种具体实施方式中,自动关机模块203,具体用于:
运行预设的关机程序,并通过关机程序自动关闭云平台集群中的各个虚拟机;
在各个虚拟机均关闭之后,通过关机程序自动关闭云平台集群的各个节点中的节点高可用性服务;
在各个节点高可用性服务均关闭之后,通过关机程序自动关闭云平台集群的各个节点中的各个非控制服务;
在各个非控制服务均关闭之后,通过关机程序自动关闭云平台集群的各个节点中的各个控制服务;
在各个控制服务均关闭之后,通过关机程序自动关闭云平台集群的各个节点中的操作系统。
在本发明的一种具体实施方式中,还包括:
虚拟机重启关闭模块,用于当任一虚拟机关闭失败时,重启虚拟机并在重启完成之后强制关闭虚拟机;
备份模块,用于在自动关机模块203运行预设的关机程序之后,在通过关机程序自动将云平台集群的各个节点关机之前,将云平台集群的数据库和配置文件进行文件备份。
在本发明的一种具体实施方式中,还包括修复模块,用于:
当任一节点高可用性服务关闭失败时,执行预设的第一修复操作以将节点高可用性服务关闭。
当任一非控制服务关闭失败时,执行预设的第二修复操作以将非控制服务关闭;
当任一控制服务关闭失败时,执行预设的第三修复操作以将控制服务关闭。
在本发明的一种具体实施方式中,修复模块,具体用于:
当任一节点高可用性服务关闭失败时,将发生了关闭失败情况的节点高可用性服务重启,并在重启之后重新关闭节点高可用性服务;
当任一非控制服务关闭失败时,将发生了关闭失败情况的非控制服务重启,并在重启之后重新关闭非控制服务;
当任一控制服务关闭失败时,将发生了关闭失败情况的控制服务重启,并在重启之后重新关闭控制服务。
在本发明的一种具体实施方式中,还包括:
停止模块,用于当任一节点高可用性服务,或者任一非控制服务,或者任一控制服务的重启次数达到了预设阈值时,停止进行云平台集群的关机并输出第一提示信息。
在本发明的一种具体实施方式中,存储服务检查模块201,具体用于:
检查云平台集群的存储服务是否启动;
如果未启动,则确定出存储服务异常;
如果启动,则在存储服务的运行状态和IO状态均正常时,确定存储服务未异常。
相应于上面的方法和系统实施例,本发明实施例还提供了一种云平台集群的关机设备以及一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例中的云平台集群的关机方法的步骤,可与上文相互对应参照。这里所说的计算机可读存储介质包括随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。
该云平台集群的关机设备可以包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现上述任一项所述的云平台集群的关机方法的步骤。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (4)

1.一种云平台集群的关机方法,其特征在于,应用于云平台集群的任一控制节点中,包括:
检查所述云平台集群的存储服务是否异常;
如果未异常,则检查所述云平台集群的主机文件是否正确;
如果正确,则运行预设的关机程序,并通过所述关机程序自动将所述云平台集群的各个节点关机;
所述运行预设的关机程序,并通过所述关机程序自动将所述云平台集群的各个节点关机,包括:
运行预设的关机程序,并通过所述关机程序自动关闭所述云平台集群中的各个虚拟机;
在各个所述虚拟机均关闭之后,通过所述关机程序自动关闭所述云平台集群的各个节点中的节点高可用性服务;
在各个所述节点高可用性服务均关闭之后,通过所述关机程序自动关闭所述云平台集群的各个节点中的各个非控制服务;
在各个所述非控制服务均关闭之后,通过所述关机程序自动关闭所述云平台集群的各个节点中的各个控制服务;
在各个所述控制服务均关闭之后,通过所述关机程序自动关闭所述云平台集群的各个节点中的操作系统;
还包括:
当任一虚拟机关闭失败时,重启所述虚拟机并在重启完成之后强制关闭所述虚拟机;
在运行预设的关机程序之后,在通过所述关机程序自动将所述云平台集群的各个节点关机之前,还包括:
将所述云平台集群的数据库和配置文件进行文件备份;
还包括:
当任一节点高可用性服务关闭失败时,执行预设的第一修复操作以将所述节点高可用性服务关闭;
当任一非控制服务关闭失败时,执行预设的第二修复操作以将所述非控制服务关闭;
当任一控制服务关闭失败时,执行预设的第三修复操作以将所述控制服务关闭;
所述执行预设的第一修复操作以将所述节点高可用性服务关闭,包括:
将发生了关闭失败情况的所述节点高可用性服务重启,并在重启之后重新关闭所述节点高可用性服务;
所述当任一非控制服务关闭失败时,执行预设的第二修复操作以将所述非控制服务关闭,包括:
将发生了关闭失败情况的所述非控制服务重启,并在重启之后重新关闭所述非控制服务;
所述当任一控制服务关闭失败时,执行预设的第三修复操作以将所述控制服务关闭,包括:
将发生了关闭失败情况的所述控制服务重启,并在重启之后重新关闭所述控制服务;
还包括:
当任一节点高可用性服务,或者任一非控制服务,或者任一控制服务的重启次数达到了预设阈值时,停止进行所述云平台集群的关机并输出第一提示信息;
所述检查所述云平台集群的存储服务是否异常,包括:
检查所述云平台集群的存储服务是否启动;
如果未启动,则确定出所述存储服务异常;
如果启动,则在所述存储服务的运行状态和IO状态均正常时,确定所述存储服务未异常。
2.一种云平台集群的关机系统,其特征在于,应用于云平台集群的任一控制节点中,包括:
存储服务检查模块,用于检查所述云平台集群的存储服务是否异常;
如果未异常,则触发主机文件检查模块,用于检查所述云平台集群的主机文件是否正确;
如果正确,则触发自动关机模块,用于运行预设的关机程序,并通过所述关机程序自动将所述云平台集群的各个节点关机;
所述自动关机模块,具体用于:
运行预设的关机程序,并通过关机程序自动关闭云平台集群中的各个虚拟机;
在各个虚拟机均关闭之后,通过关机程序自动关闭云平台集群的各个节点中的节点高可用性服务;
在各个节点高可用性服务均关闭之后,通过关机程序自动关闭云平台集群的各个节点中的各个非控制服务;
在各个非控制服务均关闭之后,通过关机程序自动关闭云平台集群的各个节点中的各个控制服务;
在各个控制服务均关闭之后,通过关机程序自动关闭云平台集群的各个节点中的操作系统;
还包括:
虚拟机重启关闭模块,用于当任一虚拟机关闭失败时,重启虚拟机并在重启完成之后强制关闭虚拟机;
备份模块,用于在自动关机模块运行预设的关机程序之后,在通过关机程序自动将云平台集群的各个节点关机之前,将云平台集群的数据库和配置文件进行文件备份;
还包括修复模块,用于:
当任一节点高可用性服务关闭失败时,执行预设的第一修复操作以将节点高可用性服务关闭;
当任一非控制服务关闭失败时,执行预设的第二修复操作以将非控制服务关闭;
当任一控制服务关闭失败时,执行预设的第三修复操作以将控制服务关闭;
所述修复模块,具体用于:
当任一节点高可用性服务关闭失败时,将发生了关闭失败情况的节点高可用性服务重启,并在重启之后重新关闭节点高可用性服务;
当任一非控制服务关闭失败时,将发生了关闭失败情况的非控制服务重启,并在重启之后重新关闭非控制服务;
当任一控制服务关闭失败时,将发生了关闭失败情况的控制服务重启,并在重启之后重新关闭控制服务;
还包括:
停止模块,用于当任一节点高可用性服务,或者任一非控制服务,或者任一控制服务的重启次数达到了预设阈值时,停止进行云平台集群的关机并输出第一提示信息;
所述存储服务检查模块具体用于:
检查云平台集群的存储服务是否启动;
如果未启动,则确定出存储服务异常;
如果启动,则在存储服务的运行状态和IO状态均正常时,确定存储服务未异常。
3.一种云平台集群的关机设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1所述的云平台集群的关机方法的步骤。
4.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1所述的云平台集群的关机方法的步骤。
CN202110975142.XA 2021-08-24 2021-08-24 一种云平台集群的关机方法、系统、设备及存储介质 Active CN113687867B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110975142.XA CN113687867B (zh) 2021-08-24 2021-08-24 一种云平台集群的关机方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110975142.XA CN113687867B (zh) 2021-08-24 2021-08-24 一种云平台集群的关机方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113687867A CN113687867A (zh) 2021-11-23
CN113687867B true CN113687867B (zh) 2023-12-29

Family

ID=78581956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110975142.XA Active CN113687867B (zh) 2021-08-24 2021-08-24 一种云平台集群的关机方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113687867B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115065511A (zh) * 2022-05-30 2022-09-16 济南浪潮数据技术有限公司 一种处理集群异常事件的方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106603696A (zh) * 2016-12-28 2017-04-26 华南理工大学 一种基于超融合基础框架的高可用系统
CN106612314A (zh) * 2015-10-26 2017-05-03 上海宝信软件股份有限公司 基于虚拟机实现软件定义存储的系统
CN107544655A (zh) * 2016-09-30 2018-01-05 河南众联云科工程技术有限公司 Ups断电后计算机系统保护方法
CN107612775A (zh) * 2017-09-19 2018-01-19 郑州云海信息技术有限公司 一种节点二级连服务器的dc测试方法与系统
US10305758B1 (en) * 2014-10-09 2019-05-28 Splunk Inc. Service monitoring interface reflecting by-service mode
CN111078310A (zh) * 2019-11-13 2020-04-28 国云科技股份有限公司 一种桌面云服务器快速关机的方法
CN111917576A (zh) * 2020-07-28 2020-11-10 星辰天合(北京)数据科技有限公司 存储集群的控制方法和装置
CN112783603A (zh) * 2021-01-18 2021-05-11 深圳市科思科技股份有限公司 集群关机控制方法、系统及存储介质
CN112925609A (zh) * 2021-03-01 2021-06-08 浪潮云信息技术股份公司 OpenStack云平台升级方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9614853B2 (en) * 2015-01-20 2017-04-04 Enzoo, Inc. Session security splitting and application profiler
US11526370B2 (en) * 2019-03-10 2022-12-13 Microsoft Technology Licensing, Llc. Cloud resource management using machine learning

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10305758B1 (en) * 2014-10-09 2019-05-28 Splunk Inc. Service monitoring interface reflecting by-service mode
CN106612314A (zh) * 2015-10-26 2017-05-03 上海宝信软件股份有限公司 基于虚拟机实现软件定义存储的系统
CN107544655A (zh) * 2016-09-30 2018-01-05 河南众联云科工程技术有限公司 Ups断电后计算机系统保护方法
CN106603696A (zh) * 2016-12-28 2017-04-26 华南理工大学 一种基于超融合基础框架的高可用系统
CN107612775A (zh) * 2017-09-19 2018-01-19 郑州云海信息技术有限公司 一种节点二级连服务器的dc测试方法与系统
CN111078310A (zh) * 2019-11-13 2020-04-28 国云科技股份有限公司 一种桌面云服务器快速关机的方法
CN111917576A (zh) * 2020-07-28 2020-11-10 星辰天合(北京)数据科技有限公司 存储集群的控制方法和装置
CN112783603A (zh) * 2021-01-18 2021-05-11 深圳市科思科技股份有限公司 集群关机控制方法、系统及存储介质
CN112925609A (zh) * 2021-03-01 2021-06-08 浪潮云信息技术股份公司 OpenStack云平台升级方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
医院高可靠虚拟云平台初探与实现;孙琳;潘登;刘荻;;中国卫生信息管理杂志(第04期);全文 *
高可用集群在医院信息系统中的设计与实现;赵志云;李泰环;杨宏桥;刘震;;中国医疗设备(第08期);全文 *

Also Published As

Publication number Publication date
CN113687867A (zh) 2021-11-23

Similar Documents

Publication Publication Date Title
US9146839B2 (en) Method for pre-testing software compatibility and system thereof
US20160132420A1 (en) Backup method, pre-testing method for environment updating and system thereof
AU2018374925B2 (en) Starting method of energy storage system and energy storage device
US8458510B2 (en) LPAR creation and repair for automated error recovery
JP2014130585A (ja) ファームウェアアップグレードエラー検出および自動ロールバック
CN111800304A (zh) 进程运行的监测方法、存储介质和虚拟装置
CN113687867B (zh) 一种云平台集群的关机方法、系统、设备及存储介质
CN110865907B (zh) 在主服务器与从服务器之间提供服务冗余的方法和系统
CN112099825A (zh) 组件进行升级的方法、装置、设备及存储介质
CN114020509A (zh) 工作负载集群的修复方法、装置、设备及可读存储介质
CN111488246A (zh) 一种cpld升级方法、装置、电子设备和可读存储介质
CN111813592A (zh) 系统故障恢复预案的优化方法、装置及计算机存储介质
CN110708203A (zh) 一种容错方法、装置及设备
CN114217905A (zh) 虚拟机高可用恢复处理方法及系统
CN111124095B (zh) 一种升级电源固件时电源运行状态检测方法及相关装置
CN111475339A (zh) 一种bios固件更新方法、装置、设备及存储介质
CN116991710B (zh) 自动测试方法及其系统、电子设备、存储介质
CN113849432B (zh) 服务器固件数据存储方法、启动方法、装置、设备及介质
CN111625420B (zh) 一种分布式训练任务处理方法、装置、设备及存储介质
CN113849335A (zh) 一种通讯故障自愈方法及系统
CN115373943A (zh) 一种新增资源的检查方法及装置
CN117075977A (zh) 一种处理器的启动方法、装置、电子设备及存储介质
CN114995853A (zh) 软件应用平台的故障修复方法、装置、电子设备及介质
CN117608953A (zh) 一种智能化自检方法、系统、存储介质及电子设备
CN115695154A (zh) 一种主备机的异常恢复方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant