CN107589951A - 一种集群升级方法及装置 - Google Patents

一种集群升级方法及装置 Download PDF

Info

Publication number
CN107589951A
CN107589951A CN201610526175.5A CN201610526175A CN107589951A CN 107589951 A CN107589951 A CN 107589951A CN 201610526175 A CN201610526175 A CN 201610526175A CN 107589951 A CN107589951 A CN 107589951A
Authority
CN
China
Prior art keywords
upgrade
upgrading
current service
service process
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610526175.5A
Other languages
English (en)
Other versions
CN107589951B (zh
Inventor
张伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Cloud Network Technology Co Ltd
Beijing Kingsoft Cloud Technology Co Ltd
Original Assignee
Beijing Kingsoft Cloud Network Technology Co Ltd
Beijing Kingsoft Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Cloud Network Technology Co Ltd, Beijing Kingsoft Cloud Technology Co Ltd filed Critical Beijing Kingsoft Cloud Network Technology Co Ltd
Priority to CN201610526175.5A priority Critical patent/CN107589951B/zh
Publication of CN107589951A publication Critical patent/CN107589951A/zh
Application granted granted Critical
Publication of CN107589951B publication Critical patent/CN107589951B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Stored Programmes (AREA)

Abstract

本发明实施例公开了一种集群升级方法及装置,应用于云计算集群中的任一节点,该方法包括:接收升级指令,其中,所述升级指令包括升级文件的标识;根据所述升级文件的标识,获取升级文件;根据所述升级文件,进行升级配置;在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级。应用本发明实例,可以提高整个集群的服务能力。

Description

一种集群升级方法及装置
技术领域
本发明涉及云计算技术领域,特别涉及一种集群升级方法及装置。
背景技术
在大规模云计算集群中,整体架构分为控制节点、计算节点、网络节点和存储节点。控制节点接收用户的服务请求,并将任务下发给计算节点、网络节点和存储节点,由位于相应节点中的各服务进程提供实际资源。实际应用中,由于集群架构调整或产品新功能上线等因素需要对集群中的各个节点进行升级,而升级过程中可能会产生异常,导致上述节点无法继续响应用户发起的新服务请求,也就是用户发起的新服务请求被迫异常中断。为保证升级过程中用户发起的新服务请求不被异常中断,对各个节点进行升级时,往往会禁用控制节点中的服务,也就是停止了对用户发起的新服务请求的响应,进而也就不再向计算节点、网络节点和存储节点下发新的任务,这样带来集群服务能力的暂停。
为了解决上述问题,使集群在升级过程中可以继续响应用户发起的新服务请求,可以通过分区滚动升级方式实现集群各个节点的升级。
分区滚动升级方式,是人为地将整个集群所包含的节点划分为多个升级域,每一次升级针对一个升级域。对一个升级域所包含节点进行升级时,该升级域内的节点不接收控制节点下发的新任务,也就是不用于响应用户发起的新服务请求,而是由其他未升级或已升级的升级域中的节点来响应用户发起的新服务请求,这样即使正在升级的升级域产生异常,整个集群仍然可以继续响应用户发起的新服务请求。
使用这种升级方式,虽然可以实现整个集群的整体不间断服务,但是对一个升级域进行升级时,只有该升级域内所有节点均完成升级,才认为完成了针对该升级域的升级,该升级域所包含的节点才可以再次用于响应用户发起的新服务请求。这样对于单个节点而言,处于无法响应用户发起的新服务请求的时间较长,从而降低了整个集群的服务能力。
发明内容
本发明实施例的目的在于提供一种集群升级方法及装置,以提高整个集群的服务能力。
为达到上述目的,本发明实施例公开了一种集群升级方法,应用于云计算集群中的任一节点,所述方法包括步骤:
接收升级指令,其中,所述升级指令包括升级文件的标识;
根据所述升级文件的标识,获取升级文件;
根据所述升级文件,进行升级配置;
在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级。
可选的,所述在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级,包括:
检测当前服务进程是否有任务正在进行;
如果有,在预设时长后返回执行所述检测当前服务进程是否有任务正在进行的步骤;
如果没有,判定所述当前服务进程处于空闲状态,并判断升级配置是否完成,如果否,在预设时长后返回执行所述检测当前服务进程是否有任务正在运行的步骤,如果是,重新启动所述当前服务进程以完成节点升级。
可选的,所述方法还包括:
在重新启动所述当前服务进程后,根据所述升级文件对应的验证文件,验证升级结果。
可选的,
在所述接收升级指令后,还包括:
基于所述升级指令中的信息生成指令文件,并对所述指令文件进行加锁处理;
在所述重新启动所述当前服务进程以完成节点升级后,还包括:
删除所述加锁处理后的指令文件。
可选的,所述根据所述升级文件的标识,获取升级文件,包括:
对加锁处理后的指令文件进行解析,得到所述升级文件的标识;
根据所述升级文件的标识,获取升级文件。
可选的,所述云计算集群还包括数据库;在所述接收升级指令后,还包括:
在所述数据库中注册升级标志。
可选的,所述方法还包括:
在升级配置过程中和/或重新启动所述当前服务进程后,向所述数据库发送升级进度信息,以使所述数据库根据所述升级进度信息更新所述数据库中存储的升级进度信息。
可选的,所述升级指令还包括升级级别;在所述根据所述升级文件的标识,获取升级文件之前,还包括:
根据所述升级级别,判断是否需要进行资源迁出处理;
如果是,进行资源迁出处理。
可选的,所述方法还包括:
在所述进行资源迁出处理后,生成资源迁移记录。
可选的,在所述重新启动所述当前服务进程完成以节点升级后,还包括:
在根据所述升级级别确定需要进行资源迁回处理时,根据所述资源迁移记录,进行资源迁回处理。
可选的,所述重新启动所述当前服务进程以完成节点升级,包括:
结束所述当前服务进程中的父进程;
在检测到所述当前服务进程异常时,重新启动所述当前服务进程完成节点升级。
为达到上述目的,本发明实施例还公开了一种集群升级装置,应用于云计算集群中的任一节点,所述装置包括:
升级指令接收模块,用于接收升级指令,其中,所述升级指令包括升级文件的标识;
升级文件获取模块,用于根据所述升级文件的标识,获取升级文件;
升级配置模块,用于根据所述升级文件,进行升级配置;
重新启动模块,用于在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级。
可选的,所述重新启动模块,包括:
检测子模块,用于检测当前服务进程是否有任务正在进行;如果有,执行第一处理子模块;如果没有,执行第二处理子模块;
所述第一处理子模块,用于在检测出当前服务进程有任务正在进行的情况下,在预设时长后返回执行所述检测子模块;
所述第二处理子模块,用于在检测出当前服务进程没有任务正在进行的情况下,判定所述当前服务进程处于空闲状态,并判断升级配置是否完成,如果否,在预设时长后返回执行所述检测子单元,如果是,重新启动所述当前服务进程以完成节点升级。
可选的,所述装置还包括:
升级结果验证模块,用于在所述重新启动模块重新启动所述当前服务进程后,根据所述升级文件对应的验证文件,验证升级结果。
可选的,所述装置还包括:
指令文件生成模块,用于在所述升级指令接收模块接收到升级指令后,基于所述升级指令中的信息生成指令文件,并对所述指令文件进行加锁处理;
指令文件删除模块,用于在所述重新启动模块重新启动所述当前服务进程以完成节点升级后,删除所述加锁处理后的指令文件。
可选的,所述升级文件获取模块,包括:
文件解析子模块,用于对加锁处理后的指令文件进行解析,得到所述升级文件的标识;
升级文件获取子模块,用于根据所述升级文件的标识,获取升级文件。
可选的,所述云计算集群还包括数据库;所述装置还包括:
升级标志注册模块,用于在所述升级指令接收模块接收到升级指令后,在所述数据库中注册升级标志。
可选的,所述装置还包括:
升级进度信息发送模块,用于在升级配置过程中和/或重新启动所述当前服务进程后,向所述数据库发送升级进度信息,以使所述数据库根据所述升级进度信息更新所述数据库中存储的升级进度信息。
可选的,所述升级指令还包括升级级别;所述装置还包括:
第一判断模块,用于在所述升级文件获取模块获取升级文件之前,根据所述升级级别,判断是否需要进行资源迁出处理;
资源迁出模块,用于在判断出需要进行资源迁出处理的情况下,进行资源迁出处理。
可选的,所述装置还包括:
资源迁移记录生成模块,用于在所述资源迁出模块进行资源迁出处理后,生成资源迁移记录。
可选的,所述装置还包括:
资源迁回模块,用于在根据所述升级级别确定需要进行资源迁回处理时,在所述重新启动模块重新启动所述当前服务进程完成以节点升级后,根据所述资源迁移记录,进行资源迁回处理。
可选的,所述重新启动模块,包括:
父进程结束子模块,用于结束所述当前服务进程中的父进程;
重新启动子模块,用于在检测到所述当前服务进程异常时,重新启动所述当前服务进程完成节点升级。
综上可知,本发明实施例所提供的一种集群升级方法及装置,应用于云计算集群中的任一节点,在进行集群升级时,每个节点根据自身当前服务进程的情况,当完成升级配置后并且在自身的当前服务进程处于空闲状态时,重新启动该节点的当前服务进程,完成该节点的升级过程。与现有技术相比,本发明实施例提供的方案中,每个节点可以灵活自主地确定本节点的当前服务进程重启的时机,在重新启动当前服务进程完成升级之后,该节点的即可再次响应用户发起的新服务请求,而不需要等待本次升级的所有节点都完成升级之后才能再次响应用户发起的新服务请求,从而提高了整个集群的服务能力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为现有技术中的分区滚动升级方式所对应的整体升级时间轴示意图;
图1b为本发明实施例提供的集群升级方法所对应的整体升级时间轴示意图;
图2为本发明实施例提供的第一种集群升级方法的流程示意图;
图3为本发明实施例提供的第二种集群升级方法的流程示意图;
图4为本发明实施例提供的第三种集群升级方法的流程示意图;
图5为本发明实施例提供的第一种集群升级装置的结构示意图;
图6为本发明实施例提供的第二种集群升级装置的结构示意图;
图7为本发明实施例提供的第三种集群升级装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
先对本申请文件中涉及到的技术术语进行简单介绍。
云计算集群,是一种并行或分布式处理系统,将多台计算机或服务器作为独立的节点通过局域网或其他网络相互关联,协同完成用户发起的服务请求所对应的任务,使得每个节点的资源得到有效的利用。云计算集群中的节点按照功能可分为控制节点、计算节点、网络节点、存储节点,各个节点各自带有CPU、内存及独立操作系统等,云计算集群将所有节点的资源统一成一个合集,从用户的角度来看,云计算集群是一个单一的系统,而非计算机群组。其中,云计算集群中为响应用户的服务请求,各个节点完成的任务也叫作云计算集群提供给用户的服务。
在整个云计算集群工作期间,为了满足不断提高的性能要求,需要对云计算集群进行升级来提升集群性能。为了提高用户体验和集群的服务能力,需要云计算集群在升级过程中仍具备提供服务的能力,升级过程可以继续响应用户发起的服务请求,也不影响已有任务的正常运行,即实现服务无间断的升级过程。
下面从与现有技术进行对比的角度对本发明进行说明。
现有的集群升级方法,需要在前端也就是控制节点禁止接收用户发起的新服务请求,再下发升级指令给需要升级的节点,最后集中重启各个节点上的服务进程。
为了避免集群服务能力的暂停,使集群在升级过程中可以继续响应用户发起的新服务请求,常用的升级方法为分区滚动升级,这种方法所对应的整体升级时间轴如图1a所示,其中,云计算集群被人为划分为N个升级域。由于云计算集群被人为划分升级域,依次升级各个升级域,导致集群升级过程中已升级的升级域和未升级的升级域处于不同的版本,这样不利于整个集群对外提供服务,同时延长了整个集群的升级时间,并且对于一个升级域内的单个节点来说,处于无法响应用户发起的新服务请求的时间较长,从而降低了整个集群的服务能力。
本发明实施例提供的集群升级方法所对应的整体升级时间轴如图1b所示,其中,M为云计算集群中节点的个数。由图1b可知,本发明实施例所提供的方案,不是按升级域进行升级,而是使云计算集群中的所有节点并行升级,这样可以缩短整个集群的升级时间。本发明中,各个节点自动检测自身的当前服务进程,在当前服务进程处于空闲状态并且升级配置完成时,重新启动自身的当前服务进程完成节点升级。这种升级方式,将整个集群升级过程中的节点重新启动自身当前服务进程的过程,分解为M个互相独立、不连续的子过程,由于在当前服务进程处于空闲状态并且升级配置完成时重新启动自身的当前服务进程,不会影响节点响应用户发起的新服务请求,因此,不需要在控制节点禁止接收用户发起的新服务请求,也能实现整个集群升级过程的服务无间断。
为解决现有技术问题,本发明实施例提供了一种集群升级方法及装置。下面通过具体实施例,首先对本发明实施例所提供的一种集群升级方法进行详细说明。
图2为本发明实施例提供的集群升级方法的第一种流程示意图,包括:
S201,接收升级指令。
其中,所述升级指令包括升级文件的标识。当然,升级指令中还可以包括该升级文件的保存位置、升级级别等,本申请并不限定升级指令中包含的信息。具体的,可以根据升级任务的具体内容将升级任务分为不同的级别。
例如,可以依据是否需要进行资源迁移将升级任务划分为不同的级别,如表示需要进行资源迁移的级别和表示不需要进行资源迁移的级别;
还可以依据升级任务的重要程度将升级任务划分为不同的级别,如表示重要程度最高的级别、表示重要程度中等的级别、表示重要程度低的级别,这样升级时可以按照级别优先处理重要程度高的升级任务。
当然,本申请只是以上述为例进行说明,实际应用中,还可以以其他信息为依据进行级别划分,本申请并不对此进行限定。
实际应用中,升级指令可以是由云计算集群的平台控制层下发到本集群中所有需要升级的节点。本领域技术人员公知的是,云计算集群的平台控制层可以部署到本集群中的控制节点上,因此,也可以说升级指令是由云计算集群中的控制节点下发到本集群中所有需要升级的节点。
S202,根据升级文件的标识,获取升级文件。
实际应用中,升级文件可以保存在云计算集群中的升级源码库中,该升级源码库为升级管理人员预先设置的升级文件的特定存储位置。
具体的,该升级源码库可以可以设置在本集群中的任一节点上,在一种具体实现方式中,该升级源码库可以设置在云计算集群的平台控制层所在的控制节点上,以便于升级管理人员对升级文件进行相关操作,当然,为了减轻控制节点的工作压力,也可以将上述升级源码库设置在不同于控制节点,也不同于存储节点的一个单独的节点上,本申请并不对此进行限定。
各个节点可以根据接收到的升级指令中包含的升级文件的标识,自行从升级源码库中获取对应的升级文件。在本发明的一种优选实施例中,节点还可以从已经获取了对应的升级文件的节点中获取升级文件,这样可以减轻升级源码库的访问压力,提高各个节点获取升级文件的速度。
S203,根据升级文件,进行升级配置。
在获取到升级文件后,根据升级文件的配置信息对本节点进行升级配置,来更新本节点的相关配置信息。
S204,在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动当前服务进程以完成节点升级。
在本申请中,将升级配置完成并且当前服务进程处于空闲状态的期间,称为空闲时间窗口。节点的当前服务进程处于空闲状态,表示节点当前没有任务正在进行,也就是说,在节点的当前服务进程处于空闲状态并且升级配置已经完成时,即节点处于空闲时间窗口时,重新启动当前服务进程不会影响本节点的服务状态。因此可以在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级。
同时,不同节点的空闲时间窗口是相互独立无关联的,因此也可以说,整个集群升级过程中的重新启动过程被分解为在各个独立的空闲时间窗口内进行,这样不需要在控制节点禁止接收用户发起的新服务请求,也能实现整个集群升级过程的服务无间断,也就是说,整个升级过程,集群可以持续对外提供高可用服务。
具体的,在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级的步骤,包括:
检测当前服务进程是否有任务正在进行;
如果有,在预设时长后返回执行所述检测当前服务进程是否有任务正在进行的步骤;
如果没有,判定所述当前服务进程处于空闲状态,并判断升级配置是否完成,如果否,在预设时长后返回执行所述检测当前服务进程是否有任务正在运行的步骤,如果是,重新启动所述当前服务进程以完成节点升级。
实际应用中,重新启动当前服务进程以完成节点升级的步骤,需要在升级配置已经完成并且当前服务进程处于空闲状态的前提下进行。检测当前服务进程是否处于空闲状态与进行升级配置可以为两个相互独立的过程,也就是说,可以在升级配置前即开始检测当前服务进程是否处于空闲状态,也可以在升级配置过程中开始检测当前服务进程是否处于空闲状态,还可以在升级配置完成后才开始检测当前服务进程是否处于空闲状态,本申请并不对开始检测当前服务进程是否处于空闲状态的时机进行限定。
预设时长可以定义为实时性或周期性,即每隔固定时长;在本发明的一个优选实施例中,预设时长还可以为升级管理人员根据经验而设置的非固定时长,如第一次检测到节点处于非空闲时间窗口时,在1秒后再次检测到节点仍处于非空闲时间窗口则可以在3秒后再次检测,如果此时检测到节点仍处于非空闲时间窗口则在5秒后再次检测。当然,还可以在检测到节点处于非空闲时间窗口时,采用预设的退避算法,根据当前服务进程来确定随机的等待时长,在该等待时长后再次检测节点是否处于非空闲时间窗口。
一种具体实现方式中,检测当前服务进程是否有任务正在进行,还可以为检测当前服务进程中是否有不允许中断的任务正在进行,如果当前服务进程中没有不允许中断的任务正在进行,可以判定节点的当前服务进程处于空闲状态,这样便于节点快速确定节点的空闲时间窗口,从而缩短节点的升级时间。
在本发明的一个优选实施例中,重新启动所述当前服务进程以完成节点升级的步骤,包括:
结束所述当前服务进程中的父进程;
在检测到所述当前服务进程异常时,重新启动所述当前服务进程完成节点升级。
实际应用中,确定空闲时间窗口可以由节点内运行的空闲时间窗口检测线程来实现,具体的,可以在接收到升级指令后任一时刻触发空闲时间窗口检测线程。当空闲时间窗口检测线程检测到空闲时间窗口时,空闲时间窗口检测线程会主动结束掉当前服务进程中的父进程,此时,节点中运行的守护进程会检测到当前服务进程的异常,并主动启动当前服务进程。重新启动当前服务进程的过程可以在秒级完成,提高了节点重新启动当前服务进程的速度。
在本发明的一个优选实施例中,该方法还包括:
在重新启动当前服务进程后,根据升级文件对应的验证文件,验证升级结果。
实际应用中,在重新启动当前服务进程后,可以对升级结果进行检查和验证,以保证升级过程的完整和升级结果的准确。具体的,升级文件是升级管理人员根据自定义的升级目的进行编写的,那么可以根据升级目的编写与升级文件对应的验证文件,根据验证文件来验证升级结果。具体的,可以在上述节点中设置验证任务,在重新启动当前服务进程后,可以通过调用节点验证任务,根据对应的验证文件,验证升级结果。
具体的,上述验证文件中可以包括升级成功后特定参数的取值范围等等,根据验证文件对升级结果进行验证时,判断该特定参数的取值是否在上述取值范围内,如果在,表明升级成功,如果不在,表明升级失败。
当然,本申请只是以上述为例进行说明,实际应用中,上述验证文件中所包含的内容并不仅限于此。
在本发明的一个优选实施例中,云计算集群还包括数据库;在接收升级指令后,还可以在数据库中注册升级标志。
实际应用中,云计算集群中的数据库可以部署在控制节点上,节点在接收到升级指令后,向数据库也就是控制节点注册升级标志,可以使升级管理人员及时了解各个节点是否开始响应该升级指令进行升级。
在本发明的另一个优选实施例中,该方法还可以包括:
在升级配置过程中和/或重新启动当前服务进程后,向数据库发送升级进度信息,以使数据库根据升级进度信息更新数据库中存储的升级进度信息。
具体的,各个节点可以在升级过程中周期性地向数据库发送升级进度信息,也可以在每个升级子步骤完成后向数据库发送升级进度信息。这样,升级管理人员从控制节点读取数据库,即可获取当前所有节点的升级进度信息,从而掌握整个云计算集群的升级进度。
由以上可见,应用本发明实施例,每个节点根据自身当前服务进程的情况,当完成升级配置后并且在自身的当前服务进程处于空闲状态时,重新启动该节点的当前服务进程,完成该节点的升级过程。与现有技术相比,本发明实施例提供的方案中,云计算集群中的各个节点的升级过程是相互独立、不相互关联的,每个节点可以灵活自主地确定本节点的当前服务进程重启的时机,在重新启动当前服务进程完成升级之后,该节点的即可再次响应用户发起的新服务请求,而不需要等待本次升级的所有节点都完成升级之后才能再次响应用户发起的新服务请求,由于每个节点都是在各自的空闲时间窗口重启当前服务进程的,因此整个升级过程集群都可以持续对外提供服务,从而提高了整个集群的服务能力。
更进一步的,图3为本发明实施例所提供的集群升级方法的第二种流程示意图。基于图2所提供的实施例,本发明实施例所提供的一种集群升级方法,还包括以下步骤:
在步骤S201,接收升级指令后,还包括步骤S205:
S205,基于升级指令中的信息生成指令文件,并对指令文件进行加锁处理;
在步骤S204,在重新启动所述当前服务进程以完成节点升级后,还包括步骤S206:
S206,删除加锁处理后的指令文件。
实际应用中,各个节点接收到升级指令后,会基于所述升级指令中的信息生成指令文件,并对所述指令文件进行加锁处理。本领域技术人员可以理解的是,对文件进行加锁处理可以防止其他任何非指定的进程访问该文件,以保证该文件不被误删。因此基于所述升级指令中的信息生成指令文件,并对所述指令文件进行加锁处理,能够保证在升级过程中不会由于异常而丢失指令文件。
同时,在重新启动所述当前服务进程以完成节点升级后,节点会检测到该加锁处理后的指令文件,这时删除该加锁处理后的指令文件,表示本节点已经完成升级。也就是说,只要该加锁处理后的指令文件还存在,说明本节点的升级过程还没有结束。这样,即使出现节点故障导致本节点的升级过程中断,只要在节点故障消除后,本节点检测到该加锁处理后的指令文件,即可根据该加锁处理后的指令文件继续完成升级。当然,节点在删除该加锁处理后的指令文件后,还可以向数据库发送升级进度信息,以使数据库根据升级进度信息更新数据库中存储的升级进度信息,从而使升级管理人员从控制节点读取数据库,及时获取当前所有节点的升级进度信息。
在本发明的一个优选实施例中,步骤S202,根据升级文件的标识,获取升级文件,包括:
S2021,对加锁处理后的指令文件进行解析,得到升级文件的标识;
S2022,根据升级文件的标识,获取升级文件。
实际应用中,节点基于升级指令中的信息生成指令文件,并对指令文件进行加锁处理后,该加锁处理后的指令文件将被保存在节点内。节点在检测到该加锁处理后的指令文件后,解析该加锁处理后的指令文件的内容,得到升级文件的标识。
这种方式可以使节点根据自身当前服务的进度,在任意时刻对加锁处理后的指令文件进行解析,使得节点的升级过程更加灵活。当然,节点还可以在解析该加锁处理后的指令文件的内容后,向数据库注册升级标志,表示该节点当前已经开始响应该升级指令进行升级,并将当前的升级进度信息发送给数据库。
由以上可见,应用本发明实施例,基于升级指令中的信息生成指令文件,并对指令文件进行加锁处理,在重新启动所述当前服务进程以完成节点升级后,删除加锁处理后的指令文件,并且,每个节点根据自身当前服务进程的情况,当完成升级配置后并且在自身的当前服务进程处于空闲状态时,重新启动该节点的当前服务进程,完成该节点的升级过程。与现有技术相比,本发明实施例提供的方案中,生成指令文件并进行加锁处理,保证了在升级过程中不会由于异常而丢失指令文件,并且在出现异常导致本节点的升级过程中断后,还可以根据本节点保存的指令文件继续完成升级;同时由于云计算集群中的各个节点的升级过程是相互独立、不相互关联的,每个节点可以灵活自主地确定本节点的当前服务进程重启的时机,在重新启动当前服务进程完成升级之后,该节点的即可再次响应用户发起的新服务请求,而不需要等待本次升级的所有节点都完成升级之后才能再次响应用户发起的新服务请求,由于每个节点都是在各自的空闲时间窗口重启当前服务进程的,因此整个升级过程集群都可以持续对外提供服务,从而提高了整个集群的服务能力。
更进一步的,图4为本发明实施例所提供的集群升级方法的第三种流程示意图。基于图1所提供的实施例,本发明实施例所提供的一种集群升级方法,还包括:
其中,升级指令还包括升级级别;在步骤S202,在根据所述升级文件的标识,获取升级文件之前,还包括步骤S207和S208:
S207,根据升级级别,判断是否需要进行资源迁出处理;如果是,执行S208;
S208,进行资源迁出处理。
实际应用中,升级任务可以为集群架构调整、产品新功能上线等,其中,集群架构调整等类型的升级可能会涉及节点中硬件的断电重启,因此为了灵活应对不同级别要求的升级或更新需求,本申请预先定义了不同等级的升级任务。根据升级过程是否需要进行资源迁移处理,将升级分为不同的升级级别。例如,低级为不需要进行资源迁移处理的级别,高级为需要进行资源迁移处理的级别。
需要说明的是,升级级别直接影响着节点的空闲时间窗口的判断。如果是不需要进行资源迁移处理的任务级别,则只需要判断节点的当前服务进程是否处于空闲状态并且升级配置是否已经完成;如果是需要进行资源迁移处理的任务级别,那么在判断节点的当前服务进程是否处于空闲状态并且升级配置是否已经完成时,还需要判断需要迁移的资源是否已经迁出处理完毕,如果当前服务进程处于空闲状态并且升级配置已经完成,同时需要迁移的资源已经迁出处理完毕,则判定节点当前处于空闲时间窗口。
在本发明的一个优选实施例中,该方法还可以包括:
在进行资源迁出处理后,生成资源迁移记录。
其中,资源迁移记录中可以包含:需要迁出处理的资源的标识、需要迁出处理的资源的迁出时间、需要迁出处理的资源迁出后的保存位置等等,当然,本申请并不限定资源迁移记录中包含的信息。生成资源迁移记录,便于在需要进行已迁出资源的迁回处理时,迁回对应的资源。
在本发明的另一个优选实施例中,在重新启动当前服务进程完成以节点升级后,该方法还可以包括:
在根据升级级别确定需要进行资源迁回处理时,根据资源迁移记录,进行资源迁回处理。
需要说明的是,升级级别中的高级为需要进行资源迁移处理的级别,进一步的,还可以分为:仅需要进行资源迁出处理的级别,和资源迁出处理后还需要进行资源迁回处理的级别。
对于资源迁出处理后还需要进行资源迁回处理的级别,在重新启动当前服务进程完成以节点升级后,可以根据资源迁移记录,进行资源迁回处理。具体的,可以是在重新启动当前服务进程完成以节点升级后,根据升级级别来判断是否需要进行资源迁回处理,也可以是在根据升级文件的标识获取升级文件之前,根据升级级别,判断是否还需要进行资源迁回处理,本申请并不对判断是否需要进行资源迁回处理的时机进行限定。
由以上可见,应用本发明实施例,根据升级级别判断是否需要进行资源迁出处理,如果判断出需要进行资源迁出处理时进行资源迁出处理,资源迁出后再进行升级配置,并且每个节点根据自身当前服务进程的情况,当完成升级配置后并且在自身的当前服务进程处于空闲状态时,重新启动该节点的当前服务进程,完成该节点的升级过程。与现有技术相比,本发明实施例提供的方案中,预先定义了不同的升级级别,可灵活应对不同的升级要求;云计算集群中的各个节点的升级过程是相互独立、不相互关联的,每个节点可以灵活自主地确定本节点的当前服务进程重启的时机,在重新启动当前服务进程完成升级之后,该节点的即可再次响应用户发起的新服务请求,而不需要等待本次升级的所有节点都完成升级之后才能再次响应用户发起的新服务请求,由于每个节点都是在各自的空闲时间窗口重启当前服务进程的,因此整个升级过程集群都可以持续对外提供服务,从而提高了整个集群的服务能力。
与上述的集群升级方法相对应,本发明实施例还提供了一种集群升级装置。
与图2所示的方法实施例相对应,图5为本发明实施例提供的集群升级装置的第一种结构示意图,该装置应用于云计算集群中的任一节点,包括:升级指令接收模块501,升级文件获取模块502,升级配置模块503,重新启动模块504。
其中,升级指令接收模块501,用于接收升级指令,其中,所述升级指令包括升级文件的标识;
升级文件获取模块502,用于根据所述升级文件的标识,获取升级文件;
升级配置模块503,用于根据所述升级文件,进行升级配置;
重新启动模块504,用于在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级。
优选的,所述重新启动模块504,包括:检测子模块(图中未示出)、第一处理子模块(图中未示出)、第二处理子模块(图中未示出)。
其中,检测子模块,用于检测当前服务进程是否有任务正在进行;如果有,执行第一处理子模块;如果没有,执行第二处理子模块;
所述第一处理子模块,用于在检测出当前服务进程有任务正在进行的情况下,在预设时长后返回执行所述检测子模块;
所述第二处理子模块,用于在检测出当前服务进程没有任务正在进行的情况下,判定所述当前服务进程处于空闲状态,并判断升级配置是否完成,如果否,在预设时长后返回执行所述检测子单元,如果是,重新启动所述当前服务进程以完成节点升级。
优选的,重新启动模块504还可以包括:父进程结束子模块(图中未示出),重新启动子模块(图中未示出)。
其中,父进程结束子模块,用于结束所述当前服务进程中的父进程;
重新启动子模块,用于在检测到所述当前服务进程异常时,重新启动所述当前服务进程完成节点升级。
优选的,该集群升级装置还可以包括:升级结果验证模块(图中未示出)。
其中,升级结果验证模块,用于在所述重新启动模块重新启动所述当前服务进程后,根据所述升级文件对应的验证文件,验证升级结果。
优选的,云计算集群还包括数据库;
该集群升级装置还可以包括:升级标志注册模块(图中未示出),用于在所述升级指令接收模块接收到升级指令后,在所述数据库中注册升级标志。
该集群升级装置还可以包括:升级进度信息发送模块(图中未示出),用于在升级配置过程中和/或重新启动所述当前服务进程后,向所述数据库发送升级进度信息,以使所述数据库根据所述升级进度信息更新所述数据库中存储的升级进度信息。
由以上可见,应用本发明实施例,每个节点根据自身当前服务进程的情况,当完成升级配置后并且在自身的当前服务进程处于空闲状态时,重新启动该节点的当前服务进程,完成该节点的升级过程。与现有技术相比,本发明实施例提供的方案中,云计算集群中的各个节点的升级过程是相互独立、不相互关联的,每个节点可以灵活自主地确定本节点的当前服务进程重启的时机,在重新启动当前服务进程完成升级之后,该节点的即可再次响应用户发起的新服务请求,而不需要等待本次升级的所有节点都完成升级之后才能再次响应用户发起的新服务请求,由于每个节点都是在各自的空闲时间窗口重启当前服务进程的,因此整个升级过程集群都可以持续对外提供服务,从而提高了整个集群的服务能力。
与图3所示的方法实施例相对应,图6为本发明实施例提供的集群升级装置的第二种结构示意图,与图5所示实施例相比,本实施例还包括:指令文件生成模块505,指令文件删除模块506。
其中,指令文件生成模块505,用于在升级指令接收模块501接收到升级指令后,基于升级指令中的信息生成指令文件,并对指令文件进行加锁处理;
指令文件删除模块506,用于在重新启动模块504重新启动当前服务进程以完成节点升级后,删除加锁处理后的指令文件。
优选的,升级文件获取模块502,可以包括:文件解析子模块5021,升级文件获取子模块5022。
其中,文件解析子模块5021,用于对加锁处理后的指令文件进行解析,得到所述升级文件的标识;
升级文件获取子模块5022,用于根据所述升级文件的标识,获取升级文件。
由以上可见,应用本发明实施例,基于升级指令中的信息生成指令文件,并对指令文件进行加锁处理,在重新启动所述当前服务进程以完成节点升级后,删除加锁处理后的指令文件,并且,每个节点根据自身当前服务进程的情况,当完成升级配置后并且在自身的当前服务进程处于空闲状态时,重新启动该节点的当前服务进程,完成该节点的升级过程。与现有技术相比,本发明实施例提供的方案中,生成指令文件并进行加锁处理,保证了在升级过程中不会由于异常而丢失指令文件,并且在出现异常导致本节点的升级过程中断后,还可以根据本节点保存的指令文件继续完成升级;同时由于云计算集群中的各个节点的升级过程是相互独立、不相互关联的,每个节点可以灵活自主地确定本节点的当前服务进程重启的时机,在重新启动当前服务进程完成升级之后,该节点的即可再次响应用户发起的新服务请求,而不需要等待本次升级的所有节点都完成升级之后才能再次响应用户发起的新服务请求,由于每个节点都是在各自的空闲时间窗口重启当前服务进程的,因此整个升级过程集群都可以持续对外提供服务,从而提高了整个集群的服务能力。
与图4所示的方法实施例相对应,图7为本发明实施例提供的集群升级装置的第二种结构示意图,与图5所示实施例相比,升级指令还包括升级级别;本实施例中还包括:第一判断模块507,资源迁出模块508。
第一判断模块507,用于在升级文件获取模块502获取升级文件之前,根据升级级别,判断是否需要进行资源迁出处理;
资源迁出模块508,用于在判断出需要进行资源迁出处理的情况下,进行资源迁出处理。
优选的,该集群升级装置还可以包括:
资源迁移记录生成模块(图中未示出),用于在所述资源迁出模块508进行资源迁出处理后,生成资源迁移记录。
优选的,该集群升级装置还可以包括:资源迁回模块(图中未示出),用于在根据所述升级级别确定需要进行资源迁回处理时,在所述重新启动模块504重新启动所述当前服务进程完成以节点升级后,根据所述资源迁移记录,进行资源迁回处理。
由以上可见,应用本发明实施例,根据升级级别,如果判断出需要进行资源迁出处理时进行资源迁出处理,并且每个节点根据自身当前服务进程的情况,当完成升级配置后并且在自身的当前服务进程处于空闲状态时,重新启动该节点的当前服务进程,完成该节点的升级过程。与现有技术相比,本发明实施例提供的方案中,预先定义了不同的升级级别,可灵活应对不同的升级要求;云计算集群中的各个节点的升级过程是相互独立、不相互关联的,每个节点可以灵活自主地确定本节点的当前服务进程重启的时机,在重新启动当前服务进程完成升级之后,该节点的即可再次响应用户发起的新服务请求,而不需要等待本次升级的所有节点都完成升级之后才能再次响应用户发起的新服务请求,由于每个节点都是在各自的空闲时间窗口重启当前服务进程的,因此整个升级过程集群都可以持续对外提供服务,从而提高了整个集群的服务能力。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (22)

1.一种集群升级方法,其特征在于,应用于云计算集群中的任一节点,所述方法包括步骤:
接收升级指令,其中,所述升级指令包括升级文件的标识;
根据所述升级文件的标识,获取升级文件;
根据所述升级文件,进行升级配置;
在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级。
2.根据权利要求1所述的方法,其特征在于,所述在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级,包括:
检测当前服务进程是否有任务正在进行;
如果有,在预设时长后返回执行所述检测当前服务进程是否有任务正在进行的步骤;
如果没有,判定所述当前服务进程处于空闲状态,并判断升级配置是否完成,如果否,在预设时长后返回执行所述检测当前服务进程是否有任务正在运行的步骤,如果是,重新启动所述当前服务进程以完成节点升级。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在重新启动所述当前服务进程后,根据所述升级文件对应的验证文件,验证升级结果。
4.根据权利要求1所述的方法,其特征在于,
在所述接收升级指令后,还包括:
基于所述升级指令中的信息生成指令文件,并对所述指令文件进行加锁处理;
在所述重新启动所述当前服务进程以完成节点升级后,还包括:
删除所述加锁处理后的指令文件。
5.根据权利要求4所述的方法,其特征在于,所述根据所述升级文件的标识,获取升级文件,包括:
对加锁处理后的指令文件进行解析,得到所述升级文件的标识;
根据所述升级文件的标识,获取升级文件。
6.根据权利要求1所述的方法,其特征在于,所述云计算集群还包括数据库;在所述接收升级指令后,还包括:
在所述数据库中注册升级标志。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
在升级配置过程中和/或重新启动所述当前服务进程后,向所述数据库发送升级进度信息,以使所述数据库根据所述升级进度信息更新所述数据库中存储的升级进度信息。
8.根据权利要求1所述的方法,其特征在于,所述升级指令还包括升级级别;在所述根据所述升级文件的标识,获取升级文件之前,还包括:
根据所述升级级别,判断是否需要进行资源迁出处理;
如果是,进行资源迁出处理。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
在所述进行资源迁出处理后,生成资源迁移记录。
10.根据权利要求9所述的方法,其特征在于,在所述重新启动所述当前服务进程完成以节点升级后,还包括:
在根据所述升级级别确定需要进行资源迁回处理时,根据所述资源迁移记录,进行资源迁回处理。
11.根据权利要求1所述的方法,其特征在于,所述重新启动所述当前服务进程以完成节点升级,包括:
结束所述当前服务进程中的父进程;
在检测到所述当前服务进程异常时,重新启动所述当前服务进程完成节点升级。
12.一种集群升级装置,其特征在于,应用于云计算集群中的任一节点,所述装置包括:
升级指令接收模块,用于接收升级指令,其中,所述升级指令包括升级文件的标识;
升级文件获取模块,用于根据所述升级文件的标识,获取升级文件;
升级配置模块,用于根据所述升级文件,进行升级配置;
重新启动模块,用于在检测到当前服务进程处于空闲状态并且升级配置完成时,重新启动所述当前服务进程以完成节点升级。
13.根据权利要求12所述的装置,其特征在于,所述重新启动模块,包括:
检测子模块,用于检测当前服务进程是否有任务正在进行;如果有,执行第一处理子模块;如果没有,执行第二处理子模块;
所述第一处理子模块,用于在检测出当前服务进程有任务正在进行的情况下,在预设时长后返回执行所述检测子模块;
所述第二处理子模块,用于在检测出当前服务进程没有任务正在进行的情况下,判定所述当前服务进程处于空闲状态,并判断升级配置是否完成,如果否,在预设时长后返回执行所述检测子单元,如果是,重新启动所述当前服务进程以完成节点升级。
14.根据权利要求12所述的装置,其特征在于,所述装置还包括:
升级结果验证模块,用于在所述重新启动模块重新启动所述当前服务进程后,根据所述升级文件对应的验证文件,验证升级结果。
15.根据权利要求12所述的装置,其特征在于,所述装置还包括:
指令文件生成模块,用于在所述升级指令接收模块接收到升级指令后,基于所述升级指令中的信息生成指令文件,并对所述指令文件进行加锁处理;
指令文件删除模块,用于在所述重新启动模块重新启动所述当前服务进程以完成节点升级后,删除所述加锁处理后的指令文件。
16.根据权利要求15所述的装置,其特征在于,所述升级文件获取模块,包括:
文件解析子模块,用于对加锁处理后的指令文件进行解析,得到所述升级文件的标识;
升级文件获取子模块,用于根据所述升级文件的标识,获取升级文件。
17.根据权利要求12所述的装置,其特征在于,所述云计算集群还包括数据库;所述装置还包括:
升级标志注册模块,用于在所述升级指令接收模块接收到升级指令后,在所述数据库中注册升级标志。
18.根据权利要求17所述的装置,其特征在于,所述装置还包括:
升级进度信息发送模块,用于在升级配置过程中和/或重新启动所述当前服务进程后,向所述数据库发送升级进度信息,以使所述数据库根据所述升级进度信息更新所述数据库中存储的升级进度信息。
19.根据权利要求12所述的装置,其特征在于,所述升级指令还包括升级级别;所述装置还包括:
第一判断模块,用于在所述升级文件获取模块获取升级文件之前,根据所述升级级别,判断是否需要进行资源迁出处理;
资源迁出模块,用于在判断出需要进行资源迁出处理的情况下,进行资源迁出处理。
20.根据权利要求19所述的装置,其特征在于,所述装置还包括:
资源迁移记录生成模块,用于在所述资源迁出模块进行资源迁出处理后,生成资源迁移记录。
21.根据权利要求20所述的装置,其特征在于,所述装置还包括:
资源迁回模块,用于在根据所述升级级别确定需要进行资源迁回处理时,在所述重新启动模块重新启动所述当前服务进程完成以节点升级后,根据所述资源迁移记录,进行资源迁回处理。
22.根据权利要求12所述的装置,其特征在于,所述重新启动模块,包括:
父进程结束子模块,用于结束所述当前服务进程中的父进程;
重新启动子模块,用于在检测到所述当前服务进程异常时,重新启动所述当前服务进程完成节点升级。
CN201610526175.5A 2016-07-05 2016-07-05 一种集群升级方法及装置 Active CN107589951B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610526175.5A CN107589951B (zh) 2016-07-05 2016-07-05 一种集群升级方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610526175.5A CN107589951B (zh) 2016-07-05 2016-07-05 一种集群升级方法及装置

Publications (2)

Publication Number Publication Date
CN107589951A true CN107589951A (zh) 2018-01-16
CN107589951B CN107589951B (zh) 2021-01-22

Family

ID=61045697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610526175.5A Active CN107589951B (zh) 2016-07-05 2016-07-05 一种集群升级方法及装置

Country Status (1)

Country Link
CN (1) CN107589951B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108920169A (zh) * 2018-07-26 2018-11-30 郑州云海信息技术有限公司 服务器集群的升级方法和节点服务器
CN109325859A (zh) * 2018-08-28 2019-02-12 平安科技(深圳)有限公司 会员升级处理方法、系统及服务器
CN109413210A (zh) * 2018-12-18 2019-03-01 郑州云海信息技术有限公司 分布式集群系统的目标驱动升级方法、装置、设备及介质
CN110069265A (zh) * 2018-01-19 2019-07-30 华为技术有限公司 服务集群的升级方法、装置及存储介质
CN110311820A (zh) * 2019-07-05 2019-10-08 山东云缦智能科技有限公司 一种不中断服务的微服务集群升级方法
CN112379984A (zh) * 2020-11-16 2021-02-19 神州融安科技(北京)有限公司 执行任务的方法、设备、电子设备及计算机可读存储介质
CN113050973A (zh) * 2021-04-30 2021-06-29 中国银行股份有限公司 数据处理系统的升级方法及装置
WO2021129733A1 (zh) * 2019-12-24 2021-07-01 中兴通讯股份有限公司 云操作系统的管理方法、装置、服务器、管理系统及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060048161A1 (en) * 2004-08-26 2006-03-02 De Rose Cesar Resource allocation method and system
CN102394936A (zh) * 2011-11-11 2012-03-28 青岛海信传媒网络技术有限公司 集群系统无损业务维护方法
CN104660689A (zh) * 2015-02-04 2015-05-27 中国南方电网有限责任公司 分布式计算系统
CN105589697A (zh) * 2016-03-17 2016-05-18 广州杰赛科技股份有限公司 一种云平台的升级方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060048161A1 (en) * 2004-08-26 2006-03-02 De Rose Cesar Resource allocation method and system
CN102394936A (zh) * 2011-11-11 2012-03-28 青岛海信传媒网络技术有限公司 集群系统无损业务维护方法
CN104660689A (zh) * 2015-02-04 2015-05-27 中国南方电网有限责任公司 分布式计算系统
CN105589697A (zh) * 2016-03-17 2016-05-18 广州杰赛科技股份有限公司 一种云平台的升级方法及装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110069265A (zh) * 2018-01-19 2019-07-30 华为技术有限公司 服务集群的升级方法、装置及存储介质
CN110069265B (zh) * 2018-01-19 2021-02-12 华为技术有限公司 服务集群的升级方法、装置及存储介质
CN108920169A (zh) * 2018-07-26 2018-11-30 郑州云海信息技术有限公司 服务器集群的升级方法和节点服务器
CN109325859A (zh) * 2018-08-28 2019-02-12 平安科技(深圳)有限公司 会员升级处理方法、系统及服务器
CN109325859B (zh) * 2018-08-28 2023-08-22 平安科技(深圳)有限公司 会员升级处理方法、系统及服务器
CN109413210A (zh) * 2018-12-18 2019-03-01 郑州云海信息技术有限公司 分布式集群系统的目标驱动升级方法、装置、设备及介质
CN110311820A (zh) * 2019-07-05 2019-10-08 山东云缦智能科技有限公司 一种不中断服务的微服务集群升级方法
WO2021129733A1 (zh) * 2019-12-24 2021-07-01 中兴通讯股份有限公司 云操作系统的管理方法、装置、服务器、管理系统及介质
EP4083786A4 (en) * 2019-12-24 2023-06-14 ZTE Corporation METHOD AND DEVICE FOR MANAGING CLOUD OPERATING SYSTEMS, SERVER, MANAGEMENT SYSTEM AND MEDIUM
CN112379984A (zh) * 2020-11-16 2021-02-19 神州融安科技(北京)有限公司 执行任务的方法、设备、电子设备及计算机可读存储介质
CN113050973A (zh) * 2021-04-30 2021-06-29 中国银行股份有限公司 数据处理系统的升级方法及装置
CN113050973B (zh) * 2021-04-30 2024-01-26 中国银行股份有限公司 数据处理系统的升级方法及装置

Also Published As

Publication number Publication date
CN107589951B (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
CN107589951A (zh) 一种集群升级方法及装置
US11190425B2 (en) Anomaly detection in a network based on a key performance indicator prediction model
US8621278B2 (en) System and method for automated solution of functionality problems in computer systems
EP2453381B1 (en) System for an engine for forecasting cyber threats and method for forecasting cyber threats using the system
US8370802B2 (en) Specifying an order for changing an operational state of software application components
US7117391B1 (en) Checkpoint model building for data mining
US20170322826A1 (en) Setting support program, setting support method, and setting support device
US20220300280A1 (en) Predictive build quality assessment
WO2012120449A1 (en) Configuration based service availability analysis of amf managed systems
US8813229B2 (en) Apparatus, system, and method for preventing infection by malicious code
CN104737134A (zh) 用于操作系统无关的硬件验证的系统和方法
CN111711623A (zh) 一种数据校验的方法及装置
JP2022100301A (ja) ソフトウェア・アップグレードがコンピューティング・デバイスに与える潜在的な影響を判定するための方法、コンピュータ・プログラム、および更新推奨コンピュータ・サーバ(ソフトウェア・アップグレードの安定性の推奨)
CN109450969A (zh) 从第三方数据源服务器中获取数据的方法、装置和服务器
CN110063042A (zh) 一种数据库故障的响应方法及其终端
CN116974874A (zh) 数据库的测试方法、装置、电子设备及可读存储介质
US9973388B2 (en) Server information management apparatus, non-transitory computer-readable recording medium having stored therein server information management program, and server information management method
CN116225622A (zh) 基于Docker的PaaS应用参数模板的测试方法
JP2023044720A (ja) クラッシュしたアプリケーションを修復するためのコンピュータ実装方法、コンピュータプログラム製品、およびリモートコンピュータサーバ(クラッシュしたプロセスのリモート修復)
Cámara et al. Robustness evaluation of the rainbow framework for self-adaptation
Buga et al. Towards modeling monitoring of smart traffic services in a large-scale distributed system
CN115065597A (zh) 一种容器资源配置方法、装置、介质和设备
WO2021096346A1 (en) A computer-implemented system for management of container logs and its method thereof
CN104883273A (zh) 虚拟化服务管理平台中业务影响模型的处理方法和系统
CN105991687A (zh) 一种服务管理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant