CN114356557B - 一种集群扩容方法及装置 - Google Patents

一种集群扩容方法及装置 Download PDF

Info

Publication number
CN114356557B
CN114356557B CN202111545586.6A CN202111545586A CN114356557B CN 114356557 B CN114356557 B CN 114356557B CN 202111545586 A CN202111545586 A CN 202111545586A CN 114356557 B CN114356557 B CN 114356557B
Authority
CN
China
Prior art keywords
capacity expansion
cluster
copies
preset
expansion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111545586.6A
Other languages
English (en)
Other versions
CN114356557A (zh
Inventor
李大伟
于立
李玉光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Chuanyang Technology Co ltd
Original Assignee
Beijing Chuanyang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Chuanyang Technology Co ltd filed Critical Beijing Chuanyang Technology Co ltd
Priority to CN202111545586.6A priority Critical patent/CN114356557B/zh
Priority to JP2022010128A priority patent/JP7079998B1/ja
Publication of CN114356557A publication Critical patent/CN114356557A/zh
Application granted granted Critical
Publication of CN114356557B publication Critical patent/CN114356557B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本公开涉及一种集群扩容方法及装置,获取集群的扩容指标,其中,扩容指标包括:资源申请率、可容纳业务实例副本个数和不可运行业务实例副本个数中的一种或者多种,判断集群的扩容指标是否满足预设扩容条件,其中,不同的扩容指标对应不同的预设扩容条件,在扩容指标满足预设扩容条件的情况下,获取扩容指标满足预设扩容条件的持续时间、以及当前时间和上次扩容时间的时间间隔,在持续时间大于持续标准时间且时间间隔大于冷却时间,则按照预设扩容策略对集群进行扩容处理,由此,可以精确判断集群是否需要进行扩容,以及基于相关扩容策略进行扩容处理,保证解决业务的资源需求的同时节约成本。

Description

一种集群扩容方法及装置
技术领域
本公开涉及计算机技术领域,尤其涉及一种集群扩容方法及装置。
背景技术
目前,集群资源扩容是一种提高应用稳定性,降低企业成本的一种方法,按需扩容可以避免资源浪费,降低运维成本。
相关技术中,都是通过集群当前的内存使用率等来判断是否达到扩容要求,导致扩容延时等情况,以及在进行节点扩容时,选择节点的方式比较简单,比如直接从资源池中获取一台机器进行扩容,导致扩容可能没有解决业务的资源需求,反而还增加成本。
发明内容
为了解决上述技术问题,本公开提供了一种集群扩容方法及装置。
第一方面,本公开实施例提供了一种集群扩容方法,包括:
获取集群的扩容指标,其中,扩容指标包括:资源申请率、可容纳业务实例副本个数和不可运行业务实例副本个数中的一种或者多种;
判断集群的扩容指标是否满足预设扩容条件,其中,不同的扩容指标对应不同的预设扩容条件;
在扩容指标满足预设扩容条件的情况下,获取扩容指标满足预设扩容条件的持续时间、以及当前时间和上次扩容时间的时间间隔;
在持续时间大于持续标准时间且时间间隔大于冷却时间,则按照预设扩容策略对集群进行扩容处理。
第二方面、本公开实施例提供了一种集群扩容装置,包括:
第一获取装置、获取集群的扩容指标;其中,扩容指标包括:资源申请率、可容纳业务实例副本个数和不可运行业务实例副本个数中的一种或者多种;
判断装置、判断集群的扩容指标是否满足预设扩容条件;其中,不同的扩容指标对应不同的预设扩容条件;
第二获取装置、在扩容指标满足预设扩容条件的情况下,获取扩容指标满足预设扩容条件的持续时间、以及当前时间和上次扩容时间的时间间隔;
第一处理装置、在持续时间大于持续标准时间且时间间隔大于冷却时间,则按照预设扩容策略对集群进行扩容处理。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
本公开实施例中,获取集群的扩容指标,其中,扩容指标包括:资源申请率、可容纳业务实例副本个数和不可运行业务实例副本个数中的一种或者多种,判断集群的扩容指标是否满足预设扩容条件,其中,不同的扩容指标对应不同的预设扩容条件,在扩容指标满足预设扩容条件的情况下,获取扩容指标满足预设扩容条件的持续时间、以及当前时间和上次扩容时间的时间间隔,在持续时间大于持续标准时间且时间间隔大于冷却时间,则按照预设扩容策略对集群进行扩容处理,由此,基于资源申请率、可容纳业务实例副本个数和不可运行业务实例副本个数等一个或者多个扩容指标进行判断是否需要扩容,能够精确确定扩容时机,以及基于相关扩容策略进行扩容处理,保证解决业务的资源需求的同时节约成本。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种集群扩容方法流程示意图;
图2为本公开实施例提供的另一种集群扩容方法流程示意图;
图3为本公开实施例提供的又一种集群扩容方法流程示意图;
图4为本公开实施例提供的一种集群扩容装置结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
目前,部分公司也有相关的自动扩容规则,但都是通过集群CPU(CentralProcessing Unit,中央处理器)使用率、集群内存使用率来判断是否达到扩容要求,在节点扩容时,选择节点的方式较简单,例如:
当扩容指标使用集群内存使用率或者CPU使用率时,使用率仅代表了当前时间点内存或者CPU等资源的使用情况并没有考虑到资源的冗余,因此导致应用需要资源时,集群不扩容或者延后扩容,不能及时支撑业务运行;或者直接从资源池中获取一台机器,并不能充分应对大多数场景,如:集群内有多个分组,组与组之间的资源使用是隔离的,此处现有的扩容方法可能会将节点添加到其他分组,导致扩容不能解决业务的资源需求,反而还增加成本。
本公开设计了一种集群自动扩容的方法,通过相应算法得出资源申请率、可容纳业务实例副本数和不可运行业务实例副本个数等多个扩容指标,根据设置的阈值或程序自适应的阈值分组,当实际计算的扩容指标对应的结果低于扩容指标对应设置的阈值或程序自适应的阈值会触发集群扩容,集群会根据分组类别,区域部署信息综合分析得到集群扩容结果。
图1为本公开实施例提供的一种集群扩容方法流程示意图,包括:
步骤101、获取集群的扩容指标,其中,扩容指标包括:资源申请率、可容纳业务实例副本个数和不可运行业务实例副本个数中的一种或者多种。
其中,集群指的是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。
在本公开实施例中,扩容指标包括但不限于资源申请率、可容纳业务实例副本个数,不可运行业务实例副本个数中的一种或者多种。
其中,获取集群的扩容指标的方式有很多种,在一些实施方式中,获取集群的总资源和已申请资源,计算已申请资源和总资源的比值,得到资源申请率。
在另一实施方式中,获取集群总容纳业务实例副本个数和已处理业务实例副本个数,计算总容纳业务实例副本个数和已处理业务实例副本个数的差值,得到可容纳业务实例副本个数。
在又一实施方式中,获取集群的总容纳业务实例副本个数和申请处理业务实例副本个数,计算申请处理业务实例副本个数和总容纳业务实例副本个数的差值,得到不可运行业务实例副本个数。
以上三种方式仅为示例,本公开实施例不对获取集群的扩容指标的具体方式进行限定。
步骤102、判断集群的扩容指标是否满足预设扩容条件。
在本公开实施例中,不同的扩容指标对应不同的预设扩容条件,比如扩容指标为资源申请率时,预设扩容条件为预设申请率阈值;再比如扩容指标为可容纳业务实例副本个数时,预设扩容条件为预设业务实例副本个数第一阈值;又比如扩容指标为不可运行业务实例副本个数时,预设扩容条件为预设业务实例副本个数第二阈值。
需要说明的是,预设申请率阈值、预设业务实例副本个数第一阈值和预设业务实例副本个数第二阈值都可以根据需要设置,或者获取集群对应的当前运行信息进行分析,自动设置符合集群环境的预设申请率阈值、预设业务实例副本个数第一阈值和预设业务实例副本个数第二阈值。
步骤103、在扩容指标满足预设扩容条件的情况下,获取扩容指标满足预设扩容条件的持续时间、以及当前时间和上次扩容时间的时间间隔。
在本公开实施例中,判断集群的扩容指标满足预设扩容条件,比如设置预设业务实例副本个数第一阈值为1,当可容纳业务实例副本个数小于等于1时,则确定扩容指标满足预设扩容条件;在另一些实施例中,判断资源申请率是否小于等于预设申请率阈值百分之三十,当资源申请率小于等于百分之三十时,则确定扩容指标满足预设扩容条件;在又一个实施例中,判断不可运行业务实例副本个数是否大于等于预设业务实例副本个数第二阈值比如3,当不可运行业务实例副本个数大于等于3时,则确定扩容指标满足预设扩容条件。
为了进一步提高扩容时机的精确性,本公开实施例通过持续时间和当前时间和上次扩容时间的时间间隔进行进一步判断是否进行扩容处理,具体地,获取扩容指标满足预设扩容条件的持续时间、以及当前时间和上次扩容时间的时间间隔。
步骤104、在持续时间大于持续标准时间且时间间隔大于冷却时间,则按照预设扩容策略对集群进行扩容处理。
其中,持续时间指的是开始扩容指标满足预设扩容条件到结束扩容指标满足预设扩容条件的时间,比如2021年12月1日10点开始扩容指标满足预设扩容条件到2021年12月1日10点10分结束,则确定持续时间为10分钟。持续标准时间可以根据应用场景需要设置,或者是基于集群环境自动设置,可以理解的是不同集群对应的持续标准时间可以不同;冷却时间指的是本次扩容动作和上一次扩容动作的时间间隔长度。
具体地,在扩容指标满足预设扩容条件的情况下,持续时间大于持续标准时间且时间间隔大于冷却时间,则按照预设扩容策略对集群进行扩容处理。
作为一种示例,资源申请率小于等于预设申请率阈值且可容纳业务实例副本个数小于等于预设业务实例副本个数第一阈值的情况下,持续时间大于持续标准时间且当前时间和上次扩容时间的时间间隔大于冷却时间将会触发集群扩容。例如:设置预设申请率阈值为百分之三十,预设业务实例副本个数第一阈值为10,持续标准时间为5分钟,冷却时间为8分钟,当资源申请率小于等于百分之三十且可容纳业务实例副本个数小于等于10的情况下,持续时间大于5分钟且距离当前时间和上次扩容时间的时间间隔大于8分钟时,将会触发扩容。
在本公开实施例中,按照预设扩容策略对集群进行扩容处理的方式有很多种,在一些实施方式中,获取集群中的目标分组,按照预设步长获取目标机器,将目标机器设置为可用状态并添加到目标分组;在另一些实施方式中,获取集群的区域部署信息,基于区域部署信息确定最少机器部署的目标区域,按照预设步长获取目标机器,将目标机器设置为可用状态并添加到目标区域。
本公开实施例提供的集群扩容方案,获取集群的扩容指标,其中,扩容指标包括:资源申请率、可容纳业务实例副本个数和不可运行业务实例副本个数中的一种或者多种,判断集群的扩容指标是否满足预设扩容条件,其中,不同的扩容指标对应不同的预设扩容条件,在扩容指标满足预设扩容条件的情况下,获取扩容指标满足预设扩容条件的持续时间、以及当前时间和上次扩容时间的时间间隔,在持续时间大于持续标准时间且时间间隔大于冷却时间,则按照预设扩容策略对集群进行扩容处理。采用上述技术方案,可以精准的知晓集群资源使用情况,集群资源申请率,可容纳业务实例副本个数,因资源不足导致不可运行业务实例副本个数,通过对这些指标设置扩容阈值和动作,自动触发集群扩容,本公开基于资源申请率、可容纳业务实例副本个数和不可运行业务实例副本个数等预设扩容条件判断是否需要扩容,同时结合持续时间和冷却时间进一步精确判断是否需要扩容,并基于相关扩容策略进行扩容处理,保证解决业务的资源需求的同时节约成本。
图2为本公开实施例提供的另一种集群扩容方法流程示意图,包括:
步骤201、获取集群的总资源和已申请资源,计算比值得到资源申请率,获取集群总容纳业务实例副本个数和已处理业务实例副本个数,计算差值得到可容纳业务实例副本个数,获取集群的总容纳业务实例副本个数和申请处理业务实例副本个数,计算差值得到不可运行业务实例副本个数。
为了更加清晰的阐述资源申请率、可容纳业务实例副本个数,不可运行业务实例副本个数,在本公开实施例中,若获取的集群总资源为5,已申请资源为2,得到已申请资源与总资源的比值百分之四十即为资源申请率;若获取的集群总容纳业务实例副本个数为3,已处理业务实例副本个数为2,得到总容纳业务实例副本个数与已处理业务实例副本个数的差值1即为可容纳业务实例副本个数;若集群的总容纳业务实例副本个数为3,申请处理业务实例副本个数为6,得到申请处理业务实例副本个数减去总容纳业务实例副本个数3即为不可运行业务实例副本个数。
步骤202、判断资源申请率是否小于等于预设申请率阈值,判断可容纳业务实例副本个数是否小于等于预设业务实例副本个数第一阈值,判断不可运行业务实例副本个数是否大于等于预设业务实例副本个数第二阈值。
具体地,设预设申请率阈值为A,预设业务实例副本个数第一阈值为B,预设业务实例副本个数第二阈值为C,在一些实施例中,若资源申请率小于等于A且可容纳副本个数小于等于B则满足预设扩容条件,将会触发扩容;在另一些实施例中,若资源申请率小于等于A,可容纳副本个数小于等于B并且不可运行业务实例副本个数大于等于C则满足预设扩容条件,将会触发扩容。
步骤203、在扩容指标满足预设扩容条件的情况下,获取扩容指标满足预设扩容条件的持续时间、以及当前时间和上次扩容时间的时间间隔。
需要说明的是,步骤203与上述步骤103相同,具体参见对步骤103的描述,此处不再详述。
步骤204、获取集群中的目标分组,按照预设步长获取目标机器,将目标机器设置为可用状态并添加到目标分组。
步骤205,获取集群的区域部署信息,基于区域部署信息确定最少机器部署的目标区域,按照预设步长获取目标机器,将目标机器设置为可用状态并添加到目标区域。
在执行步骤203后,可以执行步骤204或执行步骤205,根据具体应用需要选择。
在本公开实施例中,可以基于集群中的分组类别按照预设步长获取目标机器进行扩容,具体地,比如集群中存在应用D、E和F对应的三种分组类别,在进行计算扩容指标时,比如可容纳副本个数小于等于对应设置阈值的都是应用D,从而在扩容时,按照预设步长获取目标机器,将目标机器设置为可用状态并添加到应用D对应的目标分组,进一步满足扩容的个性化需求。
在本公开实施例中,还可以基于集群的区域部署信息,基于区域部署信息确定最少机器部署的目标区域,具体地,比如集群存在10台机器,部署在区域X为6台,部署在Y区域为3台和部署在Z区域为1台,确定目标区域为Z区域,从而按照预设步长获取目标机器,将目标机器设置为可用状态并添加到Z区域,在进行扩容时考虑可用区平衡,保证集群的每个区域部署至少有一台机器,进一步提高扩容和稳定性。
在一些实施例中,扩容的预设步长可以设为指定值,如设置步长为1,那么目标机器将按照1,2,3,4,5,6...的顺序依次递增;在另一些实施例中,扩容的预设步长可以设置为倍数,如设置倍数为2时,那么目标机器将按照1,2,4,8,16,32...呈倍数依次递增;最后将目标机器设置为可用的状态并添加到目标分组或者目标区域。
步骤206、接收设置的扩容时间,检测到当前时间满足扩容时间,按照预设扩容策略对集群进行扩容处理。
在本公开实施例中,可根据应用场景需要设置的扩容时间,定时对集群进行扩容,在一实施例中,设置的扩容时间为每日上午9点,设置步长为1,那么当检测到当前时间为上午9点时,则目标机器按照1,2,3,4,5,6...进行扩容处理。
步骤207、生成扩容通知信息,将扩容通知信息发送至目标设备。
具体地,目标机器完成扩容后,可生成扩容通知信息,信息内容可为“2021年12月2日,系统已完成3台目标机器的扩容”可选地,还可以通过语音、电话等方式发送至目标设备。
步骤208、接收扩容终止指令,基于扩容终止指令停止对集群进行扩容处理。
具体地,若接收到扩容终止的指令,则停止对集群进行扩容处理,可选地,还可以设置定时关闭集群扩容,如设置定时关闭扩容的时间为每日18点,则当检测到每日18点时,集群停止扩容。
步骤209、获取扩容状态、扩容时间和扩容原因、将其储存在目标位置。
可选地,扩容状态、扩容时间,扩容原因可作为下次触发扩容的条件。
其中,目标位置可以理解为集群管理服务器的任一存储位置,可以根据应用场景需要选择。
本公开实施例提供的集群扩容方案,获取集群的总资源和已申请资源,计算比值得到资源申请率,获取集群总容纳业务实例副本个数和已处理业务实例副本个数,计算差值得到可容纳业务实例副本个数,获取集群的总容纳业务实例副本个数和申请处理业务实例副本个数,计算差值得到不可运行业务实例副本个数,判断资源申请率是否小于等于预审申请率阈值,判断可容纳业务实例副本个数是否小于等于预设业务实例副本个数第一阈值,判断不可运行业务实例副本个数是否大于预设业务实例副本个数第二阈值,在扩容指标满足预设扩容条件的情况下,获取扩容指标满足预设扩容条件的持续时间、以及当前时间和上次扩容时间的时间间隔,获取集群中的目标分组,按照预设步长获取目标机器,将目标机器设置为可用状态并添加到目标分组,获取集群的区域部署信息,基于区域部署信息确定最少机器部署的目标区域,按照预设步长获取目标机器,将目标机器设置为可用状态并添加到目标区域,接收设置的扩容时间,检测到当前时间满足扩容时间,按照预设扩容策略对集群进行扩容处理接收扩容终止指令,基于扩容终止指令停止对集群进行扩容处理,生成扩容通知信息,将扩容通知信息发送至目标设备,获取扩容状态、扩容时间和扩容原因、将其储存在目标位置。采用上述技术方案,可支持多个扩容指标共同触发扩容,当配置多个指标时,其中任意一个扩容指标满足条件即可触发扩容,同时也可根据需求进行扩容,从而保证集群可以及时扩容以保证业务的正常运行。
图3为本公开实施例提供的又一种集群扩容方法流程示意图,首先计算当前集群/分组资源申请率、可容纳业务实例副本个数和不可运行业务实例副本个数,然后判断资源申请率是否小于等于预设申请率阈值、可容纳业务实例副本个数是否小于等于预设业务实例副本个数第一阈值、不可运行业务实例副本数是否大于等于预设业务实例副本个数第二阈值,其中,资源申请率、可容纳业务实例副本个数及不可运行业务实例副本个数满足其一条件即可触发扩容,同时为了进一步提高扩容时机的准确性,还可根据持续时间是否大于用户设置的持续标准时间以及当前时间和上次扩容时间的时间间隔是否大于冷却时间来进一步判断是否进行扩容处理,最后根据扩容策略选择最合适的目标机器,并将目标机器设置为可用状态。
图4为本公开实施例提供的一种集群扩容装置结构示意图,该装置包括:第一获取装置401、判断装置402、第二获取装置403、第一处理装置404,其中,
第一获取装置401、用于获取集群的扩容指标;其中,扩容指标包括:资源申请率、可容纳业务实例副本个数和不可运行业务实例副本个数中的一种或者多种;
判断装置402、用于判断集群的扩容指标是否满足预设扩容条件;其中,不同的扩容指标对应不同的预设扩容条件;
第二获取装置403、用于在扩容指标满足预设扩容条件的情况下,获取扩容指标满足预设扩容条件的持续时间、以及当前时间和上次扩容时间的时间间隔;
第一处理装置404、用于在持续时间大于持续标准时间且时间间隔大于冷却时间,则按照预设扩容策略对集群进行扩容处理。
可选地,第一获取装置401,具体用于:
获取集群的总资源和已申请资源,计算已申请资源和总资源的比值,得到资源申请率;和/或,
获取集群的总容纳业务实例副本个数和已处理业务实例副本个数,计算总容纳业务实例副本个数和已处理业务实例副本个数的差值,得到可容纳业务实例副本个数;和/或,
获取集群的总容纳业务实例副本个数和申请处理业务实例副本个数,计算申请处理业务实例副本个数和总容纳业务实例副本个数的差值,得到不可运行业务实例副本个数。
可选地,判断装置402,具体用于:
判断资源申请率是否小于等于预设申请率阈值;和/或,
判断可容纳业务实例副本个数是否小于等于预设业务实例副本个数第一阈值;和/或,
判断不可运行业务实例副本个数是否大于预设业务实例副本个数第二阈值。
可选地,第一处理装置404,具体用于,包括:
获取集群中的目标分组;
按照预设步长获取目标机器,将目标机器设置为可用状态并添加到目标分组;
获取集群的区域部署信息;
基于区域部署信息确定最少机器部署的目标区域;
按照预设步长获取目标机器,将目标机器设置为可用状态并添加到目标区域。
可选地,所述装置还包括:
第一生成装置,用于生成扩容通知信息;
第一发送装置。用于将扩容通知消息发送至目标设备。
可选地,所述装置还包括:
第二生成装置,用于生成扩容通知信息;
第二发送装置,用于将扩容通知消息发送至目标设备。
可选地,所述装置还包括:
接收装置,用于接收的扩容终止指令;
第二处理装置,用于基于扩容终止指令停止对集群进行扩容处理。
可选地,所述装置还包括:
第三获取装置,用于获取扩容状态、扩容时间和扩容原因;
存储装置,用于将扩容状态、扩容时间和扩容原因存储在目标位置。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (5)

1.一种集群扩容方法,其特征在于,包括:
获取集群的扩容指标;其中,所述扩容指标包括:资源申请率、可容纳业务实例副本个数和不可运行业务实例副本个数;其中,所述获取集群的扩容指标,包括:获取所述集群的总资源和已申请资源,计算所述已申请资源和所述总资源的比值,得到所述资源申请率、获取所述集群的总容纳业务实例副本个数和已处理业务实例副本个数,计算所述总容纳业务实例副本个数和所述已处理业务实例副本个数的差值,得到所述可容纳业务实例副本个数和获取所述集群的总容纳业务实例副本个数和申请处理业务实例副本个数,计算所述申请处理业务实例副本个数和所述总容纳业务实例副本个数的差值,得到所述不可运行业务实例副本个数;
判断所述集群的扩容指标是否满足预设扩容条件;
在所述扩容指标满足预设扩容条件的情况下,获取所述扩容指标满足预设扩容条件的持续时间、以及当前时间和上次扩容时间的时间间隔;
在所述持续时间大于持续标准时间且所述时间间隔大于冷却时间,则按照预设扩容策略对所述集群进行扩容处理;
其中,所述判断所述集群的扩容指标是否满足预设扩容条件,包括:判断所述资源申请率是否小于等于预设申请率阈值、判断所述可容纳业务实例副本个数是否小于等于预设业务实例副本个数第一阈值和判断所述不可运行业务实例副本个数是否大于等于预设业务实例副本个数第二阈值;
所述按照预设扩容策略对所述集群进行扩容处理,包括:获取所述集群的区域部署信息,基于所述区域部署信息确定最少机器部署的目标区域;按照预设步长获取目标机器,将所述目标机器设置为可用状态并添加到所述目标区域;
在所述按照预设扩容策略对所述集群进行扩容处理之后,还包括:
获取扩容状态、扩容时间和扩容原因;
将所述扩容状态、所述扩容时间和所述扩容原因存储在目标位置。
2.根据权利要求1所述的集群扩容方法,其特征在于,还包括:
接收设置的扩容时间;
检测到当前时间满足所述扩容时间,按照预设扩容策略对所述集群进行扩容处理。
3.根据权利要求1所述的集群扩容方法,其特征在于,还包括:
生成扩容通知信息;
将所述扩容通知消息发送至目标设备。
4.根据权利要求1所述的集群扩容方法,其特征在于,还包括:
接收的扩容终止指令;
基于所述扩容终止指令停止对所述集群进行扩容处理。
5.一种集群扩容装置,其特征在于,包括:
第一获取装置、获取集群的扩容指标;其中,所述扩容指标包括:资源申请率、可容纳业务实例副本个数和不可运行业务实例副本个数;其中,所述获取集群的扩容指标,包括:获取所述集群的总资源和已申请资源,计算所述已申请资源和所述总资源的比值,得到所述资源申请率、获取所述集群的总容纳业务实例副本个数和已处理业务实例副本个数,计算所述总容纳业务实例副本个数和所述已处理业务实例副本个数的差值,得到所述可容纳业务实例副本个数和获取所述集群的总容纳业务实例副本个数和申请处理业务实例副本个数,计算所述申请处理业务实例副本个数和所述总容纳业务实例副本个数的差值,得到所述不可运行业务实例副本个数;
判断装置、判断所述集群的扩容指标是否满足预设扩容条件;
第二获取装置、在所述扩容指标满足预设扩容条件的情况下,获取所述扩容指标满足预设扩容条件的持续时间、以及当前时间和上次扩容时间的时间间隔;
第一处理装置、在所述持续时间大于持续标准时间且所述时间间隔大于冷却时间,则按照预设扩容策略对所述集群进行扩容处理;
其中,所述判断装置、判断所述资源申请率是否小于等于预设申请率阈值、判断所述可容纳业务实例副本个数是否小于等于预设业务实例副本个数第一阈值和判断所述不可运行业务实例副本个数是否大于等于预设业务实例副本个数第二阈值;
所述按照预设扩容策略对所述集群进行扩容处理,包括:获取所述集群的区域部署信息,基于所述区域部署信息确定最少机器部署的目标区域;按照预设步长获取目标机器,将所述目标机器设置为可用状态并添加到所述目标区域;
在所述按照预设扩容策略对所述集群进行扩容处理之后,还包括:
获取扩容状态、扩容时间和扩容原因;
将所述扩容状态、所述扩容时间和所述扩容原因存储在目标位置。
CN202111545586.6A 2021-12-16 2021-12-16 一种集群扩容方法及装置 Active CN114356557B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111545586.6A CN114356557B (zh) 2021-12-16 2021-12-16 一种集群扩容方法及装置
JP2022010128A JP7079998B1 (ja) 2021-12-16 2022-01-26 クラスタの容量拡張方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111545586.6A CN114356557B (zh) 2021-12-16 2021-12-16 一种集群扩容方法及装置

Publications (2)

Publication Number Publication Date
CN114356557A CN114356557A (zh) 2022-04-15
CN114356557B true CN114356557B (zh) 2022-11-25

Family

ID=81099355

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111545586.6A Active CN114356557B (zh) 2021-12-16 2021-12-16 一种集群扩容方法及装置

Country Status (2)

Country Link
JP (1) JP7079998B1 (zh)
CN (1) CN114356557B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114866563A (zh) * 2022-06-16 2022-08-05 中国电信股份有限公司 扩容方法、装置、系统和存储介质
CN115037615A (zh) * 2022-06-23 2022-09-09 新华智云科技有限公司 基于云平台的自适应应用扩容方法
CN116414663A (zh) * 2023-04-24 2023-07-11 山东溯源安全科技有限公司 一种基于容量使用预测的扩容提示方法、装置及存储介质
CN116932231B (zh) * 2023-09-18 2023-12-22 北京睿企信息科技有限公司 一种分布式集群的扩缩容系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108076082A (zh) * 2016-11-09 2018-05-25 阿里巴巴集团控股有限公司 一种应用集群的扩容方法、装置和系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5378946B2 (ja) * 2009-10-26 2013-12-25 株式会社日立製作所 サーバ管理装置およびサーバ管理方法
JP5843459B2 (ja) * 2011-03-30 2016-01-13 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理システム、情報処理装置、スケーリング方法、プログラムおよび記録媒体
KR101540631B1 (ko) * 2012-12-28 2015-07-30 삼성에스디에스 주식회사 가상 클러스터의 동적 확장 시스템, 방법 및 그 프로그램이 저장된 기록매체
US20150229715A1 (en) * 2014-02-13 2015-08-13 Linkedin Corporation Cluster management
WO2017054197A1 (zh) * 2015-09-30 2017-04-06 华为技术有限公司 一种扩展联动的方法、装置及系统
JP2017219972A (ja) * 2016-06-06 2017-12-14 富士通株式会社 コンピュータプログラム、情報処理方法、管理ノードおよび情報処理システム
JP2020126498A (ja) * 2019-02-05 2020-08-20 富士通株式会社 サーバシステム及びサーバ資源割り当てプログラム
CN112363825A (zh) * 2020-10-16 2021-02-12 北京五八信息技术有限公司 一种弹性伸缩方法及装置
CN113051075B (zh) * 2021-03-23 2022-09-09 烽火通信科技股份有限公司 一种Kubernetes智能化扩缩容的方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108076082A (zh) * 2016-11-09 2018-05-25 阿里巴巴集团控股有限公司 一种应用集群的扩容方法、装置和系统

Also Published As

Publication number Publication date
CN114356557A (zh) 2022-04-15
JP2023089891A (ja) 2023-06-28
JP7079998B1 (ja) 2022-06-03

Similar Documents

Publication Publication Date Title
CN114356557B (zh) 一种集群扩容方法及装置
CN108768877B (zh) 一种突发流量的分配方法、装置及代理服务器
CN108810100B (zh) 一种主节点的选举方法、装置及设备
CN106230997B (zh) 一种资源调度方法和装置
CN110659123B (zh) 一种基于消息的分布式任务分发调度方法及装置
US20090157378A1 (en) Method, Apparatus and Computer Program Product for Intelligent Workload Control of Distributed Storage
US10321482B2 (en) Method and device for processing carrier resource of unlicensed carrier and transmission node
CN112346829A (zh) 一种用于任务调度的方法及设备
CN102693177A (zh) 虚拟机故障诊断方法、处理方法及其装置和系统
CN109739527B (zh) 一种客户端灰度发布的方法、装置、服务器和存储介质
CN114356558B (zh) 一种基于集群的缩容处理方法及装置
CN112764920B (zh) 一种边缘应用部署方法、装置、设备和存储介质
CN106095483A (zh) 服务的自动化部署方法及装置
CN113835844B (zh) 一种容器集群的管理方法、装置及云计算平台
CN110933178A (zh) 调整集群系统内的节点配置的方法及服务器
CN112995579B (zh) 一种视频流分发方法、装置、管理服务器及视频监控系统
CN106357704A (zh) 一种基于开发环境的服务调用方法及装置
CN110932926B (zh) 一种容器集群的监控方法、系统及装置
CN114143263A (zh) 一种对用户请求进行限流的方法、设备及介质
CN113190347A (zh) 一种边缘云系统及任务管理方法
CN109522118B (zh) 一种业务处理方法、装置、服务器及可读存储介质
CN112491599B (zh) 一种网络服务对象的部署方法及装置
CN117453665B (zh) 一种数据处理方法、装置、设备及存储介质
CN111258710B (zh) 一种系统维护方法和装置
US20240086296A1 (en) Dynamic allocation and use of ims processing resources

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant