CN112650624B - 一种集群升级方法、装置、设备及计算机可读存储介质 - Google Patents

一种集群升级方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN112650624B
CN112650624B CN202011566653.8A CN202011566653A CN112650624B CN 112650624 B CN112650624 B CN 112650624B CN 202011566653 A CN202011566653 A CN 202011566653A CN 112650624 B CN112650624 B CN 112650624B
Authority
CN
China
Prior art keywords
node
cluster
fault
upgraded
fault node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011566653.8A
Other languages
English (en)
Other versions
CN112650624A (zh
Inventor
董俊明
苏楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN202011566653.8A priority Critical patent/CN112650624B/zh
Publication of CN112650624A publication Critical patent/CN112650624A/zh
Application granted granted Critical
Publication of CN112650624B publication Critical patent/CN112650624B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1433Saving, restoring, recovering or retrying at system level during software upgrading
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/65Updates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Quality & Reliability (AREA)
  • Stored Programmes (AREA)

Abstract

本申请公开了一种集群升级方法、装置、设备及计算机可读存储介质,方法包括:获取集群中各节点的节点信息及待升级版本信息;根据各节点的节点信息判断是否存在故障节点,若是,根据故障节点的节点信息判断故障节点的故障是否在故障允许范围内;若是,将故障节点从集群中删除,并对集群中未升级的节点进行升级;当确定故障节点恢复正常后,对恢复正常的故障节点进行升级,并将恢复正常且升级后的故障节点加入集群中。本申请公开的上述技术方案,对故障节点进行删除并继续对集群进行升级且在故障节点恢复正常并对其进行升级后将其加入集群中,以完成对各节点的升级,并使得集群的升级不再因出现故障节点而发生中断,从而提高集群升级的可靠性。

Description

一种集群升级方法、装置、设备及计算机可读存储介质
技术领域
本申请涉及集群升级技术领域,更具体地说,涉及一种集群升级方法、装置、设备及计算机可读存储介质。
背景技术
在对集群进行升级时,需要让集群中所有节点全部升级成功,以保证整个集群的稳定性。
目前,在对集群进行升级时,是依次对集群中各节点进行升级操作,如果集群中的节点在升级时出现故障,则不仅会导致该节点无法进行升级,而且会导致集群升级的中断,也即会导致集群中未进行升级的节点无法继续完成升级操作。
综上所述,如何提高集群升级的可靠性,是目前本领域技术人员亟待解决的技术问题。
发明内容
有鉴于此,本申请的目的是提供一种集群升级方法、装置、设备及计算机可读存储介质,用于提高集群升级的可靠性。
为了实现上述目的,本申请提供如下技术方案:
一种集群升级方法,包括:
获取集群中各节点的节点信息及待升级版本信息;
根据各所述节点的节点信息判断是否存在故障节点,若存在故障节点,则根据所述故障节点的节点信息判断所述故障节点的故障是否在故障允许范围内;
若所述故障节点的故障在所述故障允许范围内,则将所述故障节点从所述集群中删除,并根据所述待升级版本信息对所述集群中未升级的节点进行升级;
当确定所述故障节点恢复正常后,根据所述待升级版本信息对恢复正常的故障节点进行升级,并将恢复正常且升级后的故障节点加入集群中。
优选的,将恢复正常且升级后的故障节点加入集群中,包括:
根据所述故障节点的节点信息确定所述故障节点在所述集群中所属的存储池,并将恢复正常且升级后的故障节点加入其所属的存储池中。
优选的,确定所述故障节点恢复正常的过程包括:
对所述故障节点的状态进行实时检测,判断所述故障节点的状态是否正常,若是,则确定所述故障节点恢复正常。
优选的,在将所述故障节点从所述集群中删除之后,还包括:
发出所述故障节点被从所述集群中删除的提示。
优选的,确定所述故障节点恢复正常的过程包括:
判断是否接收到所述故障节点恢复正常的指令,若是,则确定所述故障节点恢复正常。
优选的,在将恢复正常且升级后的故障节点加入集群中之前,还包括:
判断所述集群中剩余的节点是否均完成升级;
若是,则执行所述将恢复正常且升级后的故障节点加入集群中的步骤。
优选的,当确定所述故障节点的故障不在所述故障允许范围内时,还包括:
重新对所述集群进行升级。
一种集群升级装置,包括:
获取模块,用于获取集群中各节点的节点信息及待升级版本信息;
第一判断模块,用于根据各所述节点的节点信息判断是否存在故障节点,若存在故障节点,则根据所述故障节点的节点信息判断所述故障节点的故障是否在故障允许范围内;
删除模块,用于若所述故障节点的故障在所述故障允许范围内,则将所述故障节点从所述集群中删除,并根据所述待升级版本信息对所述集群中未升级的节点进行升级;
加入模块,用于当确定所述故障节点恢复正常后,根据所述待升级版本信息对恢复正常的故障节点进行升级,并将恢复正常且升级后的故障节点加入集群中。
一种集群升级设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述任一项所述的集群升级方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的集群升级方法的步骤。
本申请提供了一种集群升级方法、装置、设备及计算机可读存储介质,其中,该方法包括:获取集群中各节点的节点信息及待升级版本信息;根据各节点的节点信息判断是否存在故障节点,若存在故障节点,则根据故障节点的节点信息判断故障节点的故障是否在故障允许范围内;若故障节点的故障在故障允许范围内,则将故障节点从集群中删除,并根据待升级版本信息对集群中未升级的节点进行升级;当确定故障节点恢复正常后,根据待升级版本信息对恢复正常的故障节点进行升级,并将恢复正常且升级后的故障节点加入集群中。
本申请公开的上述技术方案,若根据获取到的集群中各节点的节点信息确定集群中存在故障节点且故障节点的故障在故障允许范围内,则将故障节点从集群中删除,以使得集群中不存在故障节点,在从集群中删除故障节点后,因集群中仅剩余正常的节点,则此时可以根据待升级版本信息对集群中剩余未升级的节点进行升级,以使得升级可以继续进行,并且对于从集群中删除的故障节点而言,若其恢复正常则可以根据待升级版本信息对故障节点进行升级,以使其版本信息可以与集群中已升级节点的版本信息保持一致,之后,将恢复正常且升级后的故障节点加入到集群中,以使得集群中所有的节点均为完成升级的节点,也即通过上述过程使得集群的升级不再因出现故障节点而发生中断,从而提高集群升级的可靠性和效率,保证集群的稳定性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种集群升级方法的流程图;
图2为本申请实施例提供的另一种集群升级方法的流程图;
图3为本申请实施例提供的一种集群升级装置的结构示意图;
图4为本申请实施例提供的一种集群升级设备的结构示意图。
具体实施方式
目前,在对集群进行升级时,是依次对集群中的各节点进行升级,如果集群中的节点在升级过程中出现故障下电或网络断开的情况,则该节点将无法正常进行升级,且如果故障点的问题不能及时得到恢复,则会导致升级在该节点处发生中断,从而导致剩余未升级的节点无法继续进行升级。
为此,本申请提供一种集群升级的技术方案,用于提高集群升级的可靠性。
为了使本领域技术人员更清楚地理解本技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1,其示出了本申请实施例提供的一种集群升级方法的流程图,本申请实施例提供的一种集群升级方法,可以包括:
S11:获取集群中各节点的节点信息及待升级版本信息。
当接收到集群升级指令并对集群进行升级时,可以获取集群中各个节点的节点信息,并同时可以获取集群中各节点进行升级时的待升级版本信息。其中,节点信息可以包括节点IP、节点所属存储池、集群相关信息、状态、当前版本信息等,待升级版本信息中可以包括新版本的版本号、新版本的安装包等版本信息。需要说明的是,集群中可以包含多个存储池,每个存储池中可以包含多个节点。
S12:根据各节点的节点信息判断是否存在故障节点,若存在故障节点,则根据故障节点的节点信息判断故障节点的故障是否在故障允许范围内。若故障节点的故障在故障允许范围内,则执行步骤S13。
在获取各节点的节点信息后,可以根据各节点的节点信息判断集群中是否存在故障节点,如果确定集群中不存在故障节点,则可以继续对集群中的节点进行升级,如果确定集群中存在故障节点,则根据故障节点的节点信息判断故障节点的故障是否在故障允许范围内。其中,故障允许范围可以预先根据集群的升级性能进行确定。
需要说明的是,在确定故障节点的故障在故障允许范围内之后,除了执行步骤S13,还可以将故障节点的节点信息存储在数据库中,以便于后续可以从数据库中获取故障节点的节点信息。
S13:将故障节点从集群中删除,并根据待升级版本信息对集群中未升级的节点进行升级。
如果确定故障节点的故障在故障允许范围内,则表明允许集群继续进行升级,此时,则可以将故障节点从集群中删除,以使得集群中仅剩余未出现故障的正常节点。
在删除故障节点后,可以根据步骤S11获取到的待升级版本信息对集群中剩余未升级的节点进行升级,具体地,可以将集群中剩余节点的当前版本信息与待升级版本信息进行对比,并根据对比结果利用待升级版本信息对未升级的节点进行升级。
S14:当确定故障节点恢复正常后,根据待升级版本信息对恢复正常的故障节点进行升级,并将恢复正常且升级后的故障节点加入集群中。
在将故障节点从集群中删除之后,可以确定故障节点是否恢复正常,若确定故障节点恢复正常,则可以根据步骤S11获取的待升级版本信息对恢复正常的故障节点进行升级,具体可以从数据库中获取故障节点的节点信息并将恢复正常的故障节点的当前版本信息(此时的当前版本信息即为故障节点在发生故障时对应的版本信息)与待升级版本信息进行对比,并根据待升级版本信息对恢复正常的故障节点进行升级,以使得恢复正常且升级后的故障节点的版本信息与集群中已升级节点的版本信息保持一致,具体而言,是使得恢复正常且升级后的故障节点的版本号与集群中已升级节点的版本号保持一致,也即使得恢复正常且升级后的故障节点的版本与集群中已升级节点的版本保持一致。
在对恢复正常的故障节点进行升级之后,可以将恢复正常且升级后的故障节点加入集群中,以使得集群中所有节点均为完成升级的节点,即完成对集群中各节点的升级,以避免因在升级过程中出现故障节点而导致升级发生中断,从而提高集群升级的可靠性。
本申请公开的上述技术方案,若根据获取到的集群中各节点的节点信息确定集群中存在故障节点且故障节点的故障在故障允许范围内,则将故障节点从集群中删除,以使得集群中不存在故障节点,在从集群中删除故障节点后,因集群中仅剩余正常的节点,则此时可以根据待升级版本信息对集群中剩余未升级的节点进行升级,以使得升级可以继续进行,并且对于从集群中删除的故障节点而言,若其恢复正常则可以根据待升级版本信息对故障节点进行升级,以使其版本信息可以与集群中已升级节点的版本信息保持一致,之后,将恢复正常且升级后的故障节点加入到集群中,以使得集群中所有的节点均为完成升级的节点,也即通过上述过程使得集群的升级不再因出现故障节点而发生中断,从而提高集群升级的可靠性和效率,保证集群的稳定性。
本申请实施例提供的一种集群升级方法,将恢复正常且升级后的故障节点加入集群中,可以包括:
根据故障节点的节点信息确定故障节点在集群中所属的存储池,并将恢复正常且升级后的故障节点加入其所属的存储池中。
在将恢复正常且升级后的故障节点加入集群中时,可以先根据故障节点的节点信息确定故障节点在集群中所属的存储池,其中,故障节点的节点信息具体可以从数据库中进行获取。
在确定故障节点所属的存储池且在确定其恢复正常之后,可以将恢复正常的故障节点加入该恢复正常的故障节点原本所属的存储池中,以使得集群功能可以保证正常,并便于提高集群的可靠性和稳定性。
本申请实施例提供的一种集群升级方法,确定故障节点恢复正常的过程可以包括:
对故障节点的状态进行实时检测,判断故障节点的状态是否正常,若是,则确定故障节点恢复正常。
在本申请中,确定故障节点恢复正常的过程具体可以为:对故障节点的状态进行实时检测,并通过检测判断故障节点的状态是否正常,若确定故障节点的状态正常,则可以确定故障节点恢复正常,若确定故障节点的状态不正常,则确定故障节点此时并未恢复正常,因此,可以继续执行对故障节点的状态进行实时检测的步骤。
通过上述过程可以在故障节点恢复正常后及时发现这一现象,从而便于及时对其进行升级操作,以便于提高集群的升级效率。
本申请实施例提供的一种集群升级方法,在将故障节点从集群中删除之后,还可以包括:
发出故障节点被从集群中删除的提示。
在本申请中,在将故障节点从集群中删除之后,可以发出故障节点被从集群中删除的提示,以便于工作人员可以及时根据提示对故障节点进行维修等处理,从而便于故障节点能够及时恢复正常。
本申请实施例提供的一种集群升级方法,确定故障节点恢复正常的过程可以包括:
判断是否接收到故障节点恢复正常的指令,若是,则确定故障节点恢复正常。
在本申请中,除了通过采用实时检测以确定故障节点是否恢复正常外,还可以通过如下方式进行实现:判断是否接收到故障节点恢复正常的指令,其中,该指令具体可以是由工作人员确定故障节点恢复正常之后进行发送的,若确定接收到故障节点恢复正常的指令,则确定故障节点恢复正常,若未接收到故障节点恢复正常的指令,则故障节点可能未恢复正常,此时,可以继续执行判断是否接收到故障节点恢复正常的指令的步骤,这种确定故障节点恢复正常的方式可以减少对资源的占用和浪费。
本申请实施例提供的一种集群升级方法,在将恢复正常且升级后的故障节点加入集群中之前,还可以包括:
判断集群中剩余的节点是否均完成升级;
若是,则执行将恢复正常且升级后的故障节点加入集群中的步骤。
在本申请中,在将恢复正常且升级后的故障节点加入集群中之前,可以判断集群中剩余的节点(具体即为集群中除所删除的故障节点之外剩余的正常的节点)是否均完成升级,如果集群中剩余的节点未完成升级,则继续根据待升级版本信息对这些未升级的节点进行升级,如果集群中剩余的节点均完成升级,则执行将恢复正常且升级后的故障节点加入集群中的步骤,即可以在集群中剩余的节点均完成升级之后才将恢复正常且升级后的故障节点加入集群中,以避免对集群中剩余节点的升级造成影响。
本申请实施例提供的一种集群升级方法,当确定故障节点的故障不在故障允许范围内时,还可以包括:
重新对集群进行升级。
在本申请中,如果确定故障节点的故障不在故障允许范围内,则可以重新对集群进行升级,其具体过程为:重置待升级版本信息,并从集群中的第一个节点开始而利用重置得到的待升级版本信息进行升级,且在升级过程中执行步骤S11及后续相关步骤,直至集群完成升级为止。
对于本申请的上述过程,具体可以参见图2,其示出了本申请实施例提供的另一种集群升级方法的流程图,关于该流程图中相关部分的说明可以参见上述对应部分的详细说明,在此不再赘述。
本申请实施例还提供了一种集群升级装置,参见图3,其示出了本申请实施例提供的一种集群升级装置的结构示意图,可以包括:
获取模块31,用于获取集群中各节点的节点信息及待升级版本信息;
第一判断模块32,用于根据各节点的节点信息判断是否存在故障节点,若存在故障节点,则根据故障节点的节点信息判断故障节点的故障是否在故障允许范围内;
删除模块33,用于若故障节点的故障在故障允许范围内,则将故障节点从集群中删除,并根据待升级版本信息对集群中未升级的节点进行升级;
加入模块34,用于当确定故障节点恢复正常后,根据待升级版本信息对恢复正常的故障节点进行升级,并将恢复正常且升级后的故障节点加入集群中。
本申请实施例提供的一种集群升级装置,加入模块34可以包括:
加入单元,用于根据故障节点的节点信息确定故障节点在集群中所属的存储池,并将恢复正常且升级后的故障节点加入其所属的存储池中。
本申请实施例提供的一种集群升级装置,包括用于确定故障节点恢复正常的第一确定模块,其中,第一确定模块可以包括:
检测单元,用于对故障节点的状态进行实时检测,判断故障节点的状态是否正常,若是,则确定故障节点恢复正常。
本申请实施例提供的一种集群升级装置,还可以包括:
提示模块,用于在将故障节点从集群中删除之后,发出故障节点被从集群中删除的提示。
本申请实施例提供的一种集群升级装置,包括用于确定故障节点恢复正常的第二确定模块,其中,第二确定模块可以包括:
判断单元,用于判断是否接收到故障节点恢复正常的指令,若是,则确定故障节点恢复正常。
本申请实施例提供的一种集群升级装置,还可以包括:
第二判断模块,用于在将恢复正常且升级后的故障节点加入集群中之前,判断集群中剩余的节点是否均完成升级;
执行模块,用于若集群中剩余的节点均完成升级,则执行将恢复正常且升级后的故障节点加入集群中的步骤。
本申请实施例提供的一种集群升级装置,还可以包括:
重新升级模块,用于当确定故障节点的故障不在故障允许范围内时,重新对集群进行升级。
本申请实施例还提供了一种集群升级设备,参见图4,其示出了本申请实施例提供的一种集群升级设备的结构示意图,可以包括:
存储器41,用于存储计算机程序;
处理器42,用于执行存储器41存储的计算机程序时可实现如下步骤:
获取集群中各节点的节点信息及待升级版本信息;根据各节点的节点信息判断是否存在故障节点,若存在故障节点,则根据故障节点的节点信息判断故障节点的故障是否在故障允许范围内;若故障节点的故障在故障允许范围内,则将故障节点从集群中删除,并根据待升级版本信息对集群中未升级的节点进行升级;当确定故障节点恢复正常后,根据待升级版本信息对恢复正常的故障节点进行升级,并将恢复正常且升级后的故障节点加入集群中。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序被处理器执行时可实现如下步骤:
获取集群中各节点的节点信息及待升级版本信息;根据各节点的节点信息判断是否存在故障节点,若存在故障节点,则根据故障节点的节点信息判断故障节点的故障是否在故障允许范围内;若故障节点的故障在故障允许范围内,则将故障节点从集群中删除,并根据待升级版本信息对集群中未升级的节点进行升级;当确定故障节点恢复正常后,根据待升级版本信息对恢复正常的故障节点进行升级,并将恢复正常且升级后的故障节点加入集群中。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例提供的一种集群升级装置、设备及计算机可读存储介质中相关部分的说明可以参见本申请实施例提供的一种集群升级方法中对应部分的详细说明,在此不再赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明,以免过多赘述。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种集群升级方法,其特征在于,包括:
获取集群中各节点的节点信息及待升级版本信息;
根据各所述节点的节点信息判断是否存在故障节点,若存在故障节点,则根据所述故障节点的节点信息判断所述故障节点的故障是否在故障允许范围内;
若所述故障节点的故障在所述故障允许范围内,则将所述故障节点从所述集群中删除,并根据所述待升级版本信息对所述集群中未升级的节点进行升级;
当确定所述故障节点恢复正常后,根据所述待升级版本信息对恢复正常的故障节点进行升级,并将恢复正常且升级后的故障节点加入集群中。
2.根据权利要求1所述的集群升级方法,其特征在于,将恢复正常且升级后的故障节点加入集群中,包括:
根据所述故障节点的节点信息确定所述故障节点在所述集群中所属的存储池,并将恢复正常且升级后的故障节点加入其所属的存储池中。
3.根据权利要求1所述的集群升级方法,其特征在于,确定所述故障节点恢复正常的过程包括:
对所述故障节点的状态进行实时检测,判断所述故障节点的状态是否正常,若是,则确定所述故障节点恢复正常。
4.根据权利要求1所述的集群升级方法,其特征在于,在将所述故障节点从所述集群中删除之后,还包括:
发出所述故障节点被从所述集群中删除的提示。
5.根据权利要求1所述的集群升级方法,其特征在于,确定所述故障节点恢复正常的过程包括:
判断是否接收到所述故障节点恢复正常的指令,若是,则确定所述故障节点恢复正常。
6.根据权利要求1至5任一项所述的集群升级方法,其特征在于,在将恢复正常且升级后的故障节点加入集群中之前,还包括:
判断所述集群中剩余的节点是否均完成升级;
若是,则执行所述将恢复正常且升级后的故障节点加入集群中的步骤。
7.根据权利要求6所述的集群升级方法,其特征在于,当确定所述故障节点的故障不在所述故障允许范围内时,还包括:
重新对所述集群进行升级。
8.一种集群升级装置,其特征在于,包括:
获取模块,用于获取集群中各节点的节点信息及待升级版本信息;
第一判断模块,用于根据各所述节点的节点信息判断是否存在故障节点,若存在故障节点,则根据所述故障节点的节点信息判断所述故障节点的故障是否在故障允许范围内;
删除模块,用于若所述故障节点的故障在所述故障允许范围内,则将所述故障节点从所述集群中删除,并根据所述待升级版本信息对所述集群中未升级的节点进行升级;
加入模块,用于当确定所述故障节点恢复正常后,根据所述待升级版本信息对恢复正常的故障节点进行升级,并将恢复正常且升级后的故障节点加入集群中。
9.一种集群升级设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的集群升级方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的集群升级方法的步骤。
CN202011566653.8A 2020-12-25 2020-12-25 一种集群升级方法、装置、设备及计算机可读存储介质 Active CN112650624B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011566653.8A CN112650624B (zh) 2020-12-25 2020-12-25 一种集群升级方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011566653.8A CN112650624B (zh) 2020-12-25 2020-12-25 一种集群升级方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN112650624A CN112650624A (zh) 2021-04-13
CN112650624B true CN112650624B (zh) 2023-05-16

Family

ID=75363066

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011566653.8A Active CN112650624B (zh) 2020-12-25 2020-12-25 一种集群升级方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112650624B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115658116B (zh) * 2022-11-11 2023-03-28 苏州浪潮智能科技有限公司 一种存储集群升级控制方法、装置、设备及存储介质
CN115904822A (zh) * 2022-12-21 2023-04-04 长春吉大正元信息技术股份有限公司 一种集群修复方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106789193A (zh) * 2016-12-06 2017-05-31 郑州云海信息技术有限公司 一种集群投票仲裁方法及系统
CN108768758A (zh) * 2018-08-31 2018-11-06 郑州云海信息技术有限公司 分布式存储系统在线升级方法、装置、设备及存储介质
CN109729129A (zh) * 2017-10-31 2019-05-07 华为技术有限公司 存储集群的配置修改方法、存储集群及计算机系统
CN111897558A (zh) * 2020-07-23 2020-11-06 北京三快在线科技有限公司 容器集群管理系统Kubernetes升级方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10846079B2 (en) * 2018-11-14 2020-11-24 Nutanix, Inc. System and method for the dynamic expansion of a cluster with co nodes before upgrade

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106789193A (zh) * 2016-12-06 2017-05-31 郑州云海信息技术有限公司 一种集群投票仲裁方法及系统
CN109729129A (zh) * 2017-10-31 2019-05-07 华为技术有限公司 存储集群的配置修改方法、存储集群及计算机系统
CN108768758A (zh) * 2018-08-31 2018-11-06 郑州云海信息技术有限公司 分布式存储系统在线升级方法、装置、设备及存储介质
CN111897558A (zh) * 2020-07-23 2020-11-06 北京三快在线科技有限公司 容器集群管理系统Kubernetes升级方法和装置

Also Published As

Publication number Publication date
CN112650624A (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
JP3826940B2 (ja) 障害復旧装置および障害復旧方法、マネージャ装置並びにプログラム
CN112650624B (zh) 一种集群升级方法、装置、设备及计算机可读存储介质
CN107153559A (zh) 一种电子设备的应用程序升级方法
CN111901176B (zh) 故障确定方法、装置、设备及存储介质
CN114675998A (zh) 一种监控定时快照任务的方法、装置、设备及介质
CN110502399B (zh) 故障检测方法及装置
CN108664255B (zh) 一种软件升级方法及装置
WO2023240944A1 (zh) 数据恢复方法、装置、电子设备及存储介质
CN111078454A (zh) 一种云平台配置恢复方法及装置
CN113687867B (zh) 一种云平台集群的关机方法、系统、设备及存储介质
CN111427718B (zh) 文件备份方法、恢复方法及装置
CN115048238A (zh) 一种节点自动恢复方法、装置、设备及介质
CN111949290B (zh) 一种热补丁管理方法、装置、电子设备及存储介质
CN112612652A (zh) 分布式存储系统异常节点重启方法及系统
CN113900952A (zh) 测试用例执行方法、装置、终端设备和可读存储介质
CN110289977B (zh) 物流仓库系统的故障检测方法及系统、设备和存储介质
CN113778753B (zh) 一种存储恢复后自动修正数据库方法、装置、设备及介质
CN108958827B (zh) 一种处理程序升级故障的方法和系统
CN111897583A (zh) 一种设备启动方法及嵌入式设备
CN110955443A (zh) 批量更新集群crontab的方法、装置、设备及介质
CN111625262A (zh) 一种工作负载资源的回滚方法、系统、设备及存储介质
CN112148463B (zh) 一种业务流程控制方法及装置
CN115309429A (zh) 一种软件更新方法及装置
CN117290157A (zh) 数据恢复方法、通信模组、电子设备及存储介质
CN111625840A (zh) 程序校验方法、程序升级方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant