CN113037528B - 一种告警服务节点的弹性扩缩容方法、装置 - Google Patents
一种告警服务节点的弹性扩缩容方法、装置 Download PDFInfo
- Publication number
- CN113037528B CN113037528B CN201911356632.0A CN201911356632A CN113037528B CN 113037528 B CN113037528 B CN 113037528B CN 201911356632 A CN201911356632 A CN 201911356632A CN 113037528 B CN113037528 B CN 113037528B
- Authority
- CN
- China
- Prior art keywords
- alarm
- nodes
- node
- preset
- expansion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0896—Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明实施例提供的一种告警服务节点的弹性扩缩容的方法、装置的技术方案中,根据采集的预设时间段内的告警消息产生数量以及预设时间段,计算出告警产生速率,根据获取的所述告警服务节点的告警服务节点处理速率以及获取的告警服务节点的数量,计算出告警预计处理速率,根据所述告警产生速率、所述告警预计处理速率以及所述告警服务节点处理速率,计算出实际扩展节点数或者实际缩减节点数,并通过根据所述告警产生速率是否大于所述告警预计处理速率的判断结果,对所述告警服务节点的数量进行弹性扩缩容,从而避免了告警服务节点在空闲时间运行,造成了硬件资源的浪费的问题。
Description
【技术领域】
本发明涉及通信网络监控领域,具体地涉及一种告警服务节点的弹性扩缩容方法、装置。
【背景技术】
由于通信设备故障存在不确定性,故障管理系统运行中告警上报数量的波动比较大,特别是发生告警风暴时,告警量在短时间会发生爆发式增长。系统日常运行中,因为告警上报数波动大,目前系统在正常情况下能够快速处理故障告警信息,一旦出现告警上报数量井喷时,因告警上报数据超过故障管理管理系统承载能力时就会出现告警消息积压、告警处理延时的情况。通过横向扩展告警处理服务节点可以很大程度上解决这个问题,而在相关技术中,通常是利用经验预估或者压力测试情况来决定告警服务节点的数量,系统自身不能自动伸缩调整。因此如何避免告警服务节点在空闲时间运行,造成了硬件资源的浪费的问题成为了亟需解决的问题。
【发明内容】
有鉴于此,本发明提供一种告警服务节点的弹性扩缩容方法、装置,能够避免告警服务节点在空闲时间运行,造成了硬件资源的浪费的问题。
一方面,本发明实施例提供了一种告警服务节点的弹性扩缩容方法,包括:
根据采集的预设第一时间段内的告警消息产生数量以及预设第一时间段,计算出告警产生速率;
根据获取的告警服务节点的告警服务节点处理速率以及获取的告警服务节点的数量,计算出告警预计处理速率;
判断所述告警产生速率是否大于所述告警预计处理速率;
若判断出所述告警产生速率大于所述告警预计处理速率,根据所述告警产生速率、所述告警预计处理速率以及所述告警服务节点处理速率,计算出实际扩展节点数;
根据所述实际扩展节点数对所述告警服务节点的数量进行弹性扩容。
可选地,若判断出所述告警产生速率小于所述告警预计处理速率,判断获取的告警消息积压数量是否小于或者等于获取的预设第一时间段内的告警消息处理数量;
若判断出获取的告警消息积压数量小于或者等于获取的预设第一时间段内的告警消息处理数量,则根据所述告警预计处理速率、所述告警产生速率以及所述告警服务节点处理速率,计算出实际缩减节点数;
根据所述实际缩减节点数对所述告警服务节点的数量进行弹性缩容。
可选地,若判断出获取的告警消息积压数量大于获取的预设第一时间段内的告警消息处理数量,将所述告警服务节点的数量加1,并继续执行所述根据采集的预设第一时间段内的告警消息产生数量以及预设第一时间段,计算出告警产生速率的步骤。
可选地,在所述若判断出所述告警产生速率小于所述告警预计处理速率,判断获取的告警消息积压数量是否小于或者等于获取的预设第一时间段内的告警消息处理数量之前,还包括:
根据采集的告警消息产生数量与获取的告警消息处理数量,计算告警消息积压数量。
可选地,所述根据所述告警产生速率、所述告警预计处理速率以及所述告警服务节点处理速率,计算出实际扩展节点数,包括:
通过公式:扩展节点数=(告警产生速率-告警预计处理速率)/告警服务节点处理速率,计算出扩展节点数;
将所述扩展节点数分解为扩展节点整数和扩展节点小数;
判断所述扩展节点小数是否大于或者等于预设第一阈值;
若判断出所述扩展节点小数大于或者等于预设第一阈值,则将所述扩展节点小数清零,且将所述扩展节点整数加1;
将加1后的所述扩展节点整数确定为实际扩展节点数;
若判断出所述扩展节点小数小于预设第一阈值,则将所述扩展节点小数清零;
将所述扩展节点整数确定为实际扩展节点数。
可选地,所述根据所述告警预计处理速率、所述告警产生速率以及所述告警服务节点处理速率,计算出实际缩减节点数,包括:
通过公式:缩减节点数=(告警预计处理速率-告警产生速率)/告警服务节点处理速率,计算出缩减节点数;
将所述缩减节点数分解为缩减节点整数和缩减节点小数;
判断所述缩减节点小数是否大于或者等于预设第二阈值;
若判断出所述缩减节点小数大于或者等于预设第二阈值,则将所述缩减节点小数清零,且将所述缩减节点整数加1;
将加1后的所述缩减节点整数确定为实际缩减节点数;
若判断出所述缩减节点小数小于预设第二阈值,则将所述缩减节点小数清零;
将所述缩减节点整数确定为实际缩减节点数。
可选地,在所述根据所述实际扩展节点数对所述告警服务节点的数量进行弹性扩容之前,还包括:
判断所述实际扩展节点数是否大于或者等于预设弹性节点数;
若判断出所述实际扩展节点数大于或者等于预设弹性节点数,判断所述告警服务节点的数量在预设第二时间段内是否进行过弹性扩容;
若判断出所述告警服务节点的数量在预设第二时间段内未进行过弹性扩容,则继续执行所述根据所述实际扩展节点数对所述告警服务节点的数量进行弹性扩容的步骤;
或者,在所述根据所述实际缩减节点数对所述告警服务节点的数量进行弹性缩容之前,还包括:
判断所述实际缩减节点数是否大于或者等于预设弹性节点数;
若判断出所述实际缩减节点数大于或者等于预设弹性节点数,判断所述告警服务节点的数量在预设第二时间段内是否进行过弹性缩容;
若判断出所述告警服务节点的数量在预设第二时间段内未进行过弹性缩容,则继续执行所述根据所述实际缩减节点数对所述告警服务节点的数量进行弹性缩容的步骤;
或者,在所述将所述告警服务节点的数量加1之前,还包括:
判断所述告警服务节点的数量在预设第二时间段内是否进行过弹性扩容;
若判断出所述告警服务节点的数量在预设第二时间段内未进行过弹性扩容,则继续执行所述将所述告警服务节点的数量加1的步骤。
另一方面,本发明实施例提供了一种告警服务节点的弹性扩缩容装置,所述装置包括:
第一计算模块,用于根据采集的预设第一时间段内的告警消息产生数量以及预设第一时间段,计算出告警产生速率;根据获取的所述告警服务节点的告警服务节点处理速率以及获取的告警服务节点的数量,计算出告警预计处理速率;若判断出所述告警产生速率大于所述告警预计处理速率,根据所述告警产生速率、所述告警预计处理速率以及所述告警服务节点处理速率,计算出实际扩展节点数;
判断模块,用于判断所述告警产生速率是否大于所述告警预计处理速率;
节点数处理模块,用于根据所述实际扩展节点数对所述告警服务节点的数量进行弹性扩容。
另一方面,本发明实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述的告警服务节点的弹性扩缩容方法。
另一方面,本发明实施例提供了一种服务器,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,所述程序指令被处理器加载并执行上述的告警服务节点的弹性扩缩容方法的步骤。
本发明实施例提供的技术方案中,根据采集的预设时间段内的告警消息产生数量以及预设时间段,计算出告警产生速率,根据获取的所述告警服务节点的告警服务节点处理速率以及获取的告警服务节点的数量,计算出告警预计处理速率,根据所述告警产生速率、所述告警预计处理速率以及所述告警服务节点处理速率,计算出实际扩展节点数或者实际缩减节点数,并通过根据所述告警产生速率是否大于所述告警预计处理速率的判断结果,对所述告警服务节点的数量进行弹性扩缩容,从而避免了告警服务节点在空闲时间运行,造成了硬件资源的浪费的问题。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是一种Kubernetes的弹性扩容原理图;
图2是本发明一实施例所提供的一种告警服务节点的弹性扩缩容方法的流程图;
图3是本发明又一实施例所提供的一种告警服务节点的弹性扩缩容方法的流程图;
图4是本发明一实施例所提供的一种告警服务节点的弹性扩缩容装置的结构示意图;
图5为本发明实施例提供的一种服务器的示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,甲和/或乙,可以表示:单独存在甲,同时存在甲和乙,单独存在乙这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
由于本发明实施例涉及Kubernetes的弹性扩容(HPA)的应用,为了便于理解,下面先对本发明实施例Kubernetes的HPA等相关概念进行介绍。
图1为一种Kubernetes的弹性扩容原理图,如图1所示,在Kubernetes中,Pod的负载是通过Heapster进行采集的,或者可通过Metrics Server进行采集,HPA Controller通过定期查询Pod当前系统的负载来自动水平扩容,如果系统负载超过预定值,就开始增加Pod的个数,如果低于某个值,就自动减少Pod的个数。其中,定期轮询的时间通过–horizontal-pod-autoscaler-sync-period选项来设置,默认的时间为30秒。Kubernetes将资源指标包括核心指标(Core metrics)和自定义指标(Custom Metrics),其中Coremetrics由metrics-server提供API metrics.k8s.io,仅提供Node和Pod的CPU和内存使用情况。Custom Metrics由Prometheus Adapter提供API custom.metrics.k8s.io,由此可支持任意Prometheus采集到的指标。
在相关技术中,通常很难通过监控Pod的内存和CPU,获取故障管理系统实时告警处理服务状态,从而很难通过Core metrics(核心指标)监控,从而实现根据告警消息处理服务状态进行节点弹性伸缩的目的。本发明通过将故障处理指标以Custom Metrics方式传入,利用告警服务节点伸缩规则算法计算节点伸缩数量,实现HpaController,从而实现基于业务指标实现服务节点弹性伸缩。一方面,在告警风暴时保障告警及时处理;另一方面,在告警闲时,避免硬件资源浪费。在具体实现方式中,通过利用上层业务代码,调用Kubernetes API,实现对告警服务节点的弹性扩缩容。
图2为本发明一实施例提供的一种告警服务节点的弹性扩缩容方法的流程图,如图2所示,该方法包括:
步骤101、根据采集的预设时间段内的告警消息产生数量以及预设时间段,计算出告警产生速率。
步骤102、根据获取的告警服务节点的告警服务节点处理速率以及获取的告警服务节点的数量,计算出告警预计处理速率。
步骤103、判断告警产生速率是否大于告警预计处理速率。
步骤104、若判断出告警产生速率大于告警预计处理速率,根据告警产生速率、告警预计处理速率以及告警服务节点处理速率,计算出实际扩展节点数。
步骤105、根据实际扩展节点数对告警服务节点的数量进行弹性扩容。
本发明实施例提供的技术方案中,根据采集的预设时间段内的告警消息产生数量以及预设时间段,计算出告警产生速率,根据获取的告警服务节点的告警服务节点处理速率以及获取的告警服务节点的数量,计算出告警预计处理速率,根据告警产生速率、告警预计处理速率以及告警服务节点处理速率,计算出实际扩展节点数或者实际缩减节点数,并通过根据告警产生速率是否大于告警预计处理速率的判断结果,对告警服务节点的数量进行弹性扩缩容,从而避免了告警服务节点在空闲时间运行,造成了硬件资源的浪费的问题。
图3为本发明又一实施例提供的一种告警服务节点的弹性扩缩容方法的流程图,该告警服务节点的弹性扩缩容方法基于告警服务节点的弹性扩缩容系统实现,其中,告警服务节点的弹性扩缩容系统可包括多个告警服务节点。如图3所示,该方法包括:
步骤201、根据采集的预设第一时间段内的告警消息产生数量以及预设第一时间段,计算出告警产生速率。
本发明实施例中,各步骤由服务器执行。
本发明实施例中,预设第一时间段为60秒。通过设定预设第一时间段为60秒,可避免瞬间的告警消息波动对计算弹性扩容的告警服务节点的数量造成影响。
本发明实施例中,采集到的告警消息可存储于告警消息队列中,通过从告警消息队列中获取到预设第一时间段内的告警消息产生数量。例如通过告警消息队列采集到60秒内告警消息产生数量为6000条,因此计算出告警产生速率=6000条/60秒=100条/秒,即每秒产生100条告警消息。
步骤202、根据获取的告警服务节点的告警服务节点处理速率以及获取的告警服务节点的数量,计算出告警预计处理速率。
本发明实施例中,该系统包括多个告警服务节点,其中,每个告警服务节点的处理速率是根据服务器的配置有关,且每个告警服务节点的处理速率是相同的,可根据日常积累的经验值获取,例如,告警处理服务节点处理速率包括告警服务节点在进行压力测试稳定运行时的处理速率。例如,告警服务节点处理速率是600条/秒,系统包括2个告警服务节点,从而可计算出告警预计处理速率=600条/秒*2=1200条/秒。
步骤203、判断告警产生速率是否大于告警预计处理速率,若是,执行步骤204;若否,执行步骤206。
本发明实施例中,若判断出告警产生速率大于告警预计处理速率,表明需要增加告警服务节点的数量,避免部署的告警服务节点的数量不足时,在产生告警风暴时会发生告警消息积压,导致后续业务处理延迟的问题,因此执行步骤204计算出需要增加的实际扩展节点数;若判断出告警产生速率小于告警预计处理速率,表明需要减少告警服务节点的数量,避免告警服务节点在空闲时间运行,造成了硬件资源的浪费。
本发明实施例中,进一步地,步骤203还包括:若判断出告警产生速率等于告警预计处理速率,继续执行步骤201。
本发明实施例中,若判断出告警产生速率等于告警预计处理速率,表明告警消息的产生数量与告警消息的处理数量相同,服务器能够正常处理告警消息,不会发生告警消息积压,导致后续业务处理延迟的问题,因此不需要增加或者减少告警服务节点的数量。
步骤204、根据告警产生速率、告警预计处理速率以及告警服务节点处理速率,计算出实际扩展节点数。
本发明实施例中,步骤204,具体包括:
步骤2041、通过公式:扩展节点数=(告警产生速率-告警预计处理速率)/告警服务节点处理速率,计算出扩展节点数。
本发明实施例中,例如计算出告警产生速率为2000条/秒,告警预计处理速率为1200条/秒,告警服务节点处理速率600条/秒,从而计算出扩展节点数=(2000-1200)/600≈1.3。
步骤2042、将扩展节点数分解为扩展节点整数和扩展节点小数。
本发明实施例中,例如计算出的扩展节点数为1.3,将1.3分解为1和0.3,其中扩展节点整数为1,扩展节点小数为0.3。
步骤2043、判断扩展节点小数是否大于或者等于预设第一阈值,若是,执行步骤2044;若否,执行步骤2046。
本发明实施例中,例如,预设第一阈值为0.2。若判断出扩展节点小数大于或者等于预设第一阈值,表明需要在扩展节点整数对应的告警服务节点的数量的基础上再增加1个告警服务节点;若判断出扩展节点小数小于预设第一阈值,表明不需要在扩展节点整数对应的告警服务节点的数量的基础上增加1个告警服务节点。
步骤2044、将扩展节点小数清零,且将扩展节点整数加1。
本发明实施例中,例如,扩展节点整数为1,扩展节点小数为0.3,由于扩展节点小数0.3大于0.2,因此将扩展节点小数清零,且将扩展节点整数加1之后,加1后的扩展节点整数为2。
步骤2045、将加1后的扩展节点整数确定为实际扩展节点数。
本发明实施例中,加1后的扩展节点整数为2,因此实际需要增加的告警服务节点的数量为2个,通过增加告警服务节点的数量之后,能够提高告警处理速率,有效避免告警风暴时出现告警消息积压的问题。
步骤2046、将扩展节点小数清零。
本发明实施例中,例如,扩展节点整数为1,扩展节点小数为0.1,由于扩展节点小数0.1小于0.2,因此将扩展节点小数清零。
步骤2047、将扩展节点整数确定为实际扩展节点数。
本发明实施例中,扩展节点整数为1,因此实际需要增加的告警服务节点的数量为1个。
步骤205、根据实际扩展节点数对告警服务节点的数量进行弹性扩容。
本发明实施例中,如下表1所示,原有的告警服务器节点的数量为1个,当计算出实际扩展节点数为2个时,需要增加2个告警服务节点。如下表2所示,此时告警服务器节点的数量为3个,通过增加告警服务节点的数量之后,能够提高告警处理速率,有效避免告警风暴时出现告警消息积压的问题。
表1
表2
本发明实施例中,在步骤205之前,还包括:
步骤205a、判断实际扩展节点数是否大于或者等于预设弹性节点数,若是,执行步骤205b;若否,执行步骤201。
本发明实施例中,例如,预设弹性节点数为1个。若判断出实际扩展节点数大于或者等于预设弹性节点数,表明可进行弹性扩容;若判断出实际扩展节点数小于预设弹性节点数,表明不能进行弹性扩容。例如计算出的实际扩展节点数为0个,则不能进行弹性扩容。
步骤205b、判断告警服务节点的数量在预设第二时间段内是否进行过弹性扩容,若是,执行步骤201;若否,执行步骤205。
本发明实施例中,例如,预设第二时间段为5分钟。通过设置预设第二时间段为5分钟,为了避免节点重复扩展或收缩,当前为每5分钟触发一次Kubernetes的弹性扩容。若判断出告警服务节点的数量在预设时间内进行过弹性扩容,表明已经进行过弹性扩容,若重复进行弹性扩容,可能会导致增加过多的告警服务节点,从而造成硬件资源的浪费;若判断出告警服务节点的数量在预设时间内未进行过弹性扩容,表明可执行步骤205,根据实际扩展节点数对告警服务节点的数量进行弹性扩容。
步骤206、根据采集的告警消息产生数量与获取的告警消息处理数量,计算告警消息积压数量。
本发明实施例中,告警消息产生数量可从告警消息队列中获取。告警消息积压数量包括告警消息被延迟处理的数量。当告警消息产生之后,会存储在告警消息队列中,等待被告警服务节点处理。例如,从告警消息队列中获取到告警消息产生数量为10000条,告警消息处理数量为3000条,从而计算出告警消息积压数量为7000条。
本发明实施例中,可选地,还包括:根据获取的预设时间段内的告警消息处理数量以及预设时间段,可计算出告警实际处理速率。
本发明实施例中,预设第一时间段为60秒。通过设定预设第一时间段为60秒,可避免瞬间的告警消息波动对计算弹性扩容的告警服务节点的数量造成影响。
步骤207、判断获取的告警消息积压数量是否小于或者等于获取的预设第一时间段内的告警消息处理数量,若是,执行步骤208;若否,执行步骤210。
本发明实施例中,例如,预设第一时间段为60秒。若判断出告警消息积压数量小于获取的预设时间段内的告警消息处理数量,表明在预设时间段内,积压的告警消息都能够被处理;若判断出告警消息积压数量大于获取的预设时间段内的告警消息处理数量,表明在预设时间段内,积压的告警消息不能被处理,会导致后续业务处理延迟的问题,因此需要增加告警服务节点的数量。
步骤208、根据告警预计处理速率、告警产生速率以及告警服务节点处理速率,计算出实际缩减节点数。
本发明实施例中,步骤208,具体包括:
步骤2081、通过公式:缩减节点数=(告警预计处理速率-告警产生速率)/告警服务节点处理速率,计算出缩减节点数。
本发明实施例中,例如计算出告警产生速率为1000条/秒,告警预计处理速率为2000条/秒,告警服务节点处理速率600条/秒,从而计算出扩展节点数=(2000-1000)/600≈1.6。
步骤2082、将缩减节点数分解为缩减节点整数和缩减节点小数。
本发明实施例中,例如计算出的扩展节点数为1.6,将1.6分解为1和0.6,其中扩展节点整数为1,扩展节点小数为0.6。
步骤2083、判断缩减节点小数是否大于或者等于预设第二阈值,若是,执行步骤2084;若否,执行步骤2086。
本发明实施例中,例如,预设第二阈值为0.8。若判断出缩减节点小数大于或者等于预设第二阈值,表明需要在缩减节点整数对应的告警服务节点的数量的基础上再缩减1个告警服务节点;若判断出缩减节点小数小于预设第一阈值,表明不需要在缩减节点整数对应的告警服务节点的数量的基础上再缩减1个告警服务节点。
步骤2084、将缩减节点小数清零,且将缩减节点整数加1。
本发明实施例中,例如,缩减节点整数为1,缩减节点小数为0.9,由于缩减节点小数0.9大于0.8,因此将缩减节点小数清零,且将缩减节点整数加1之后,加1后的缩减节点整数为2。
步骤2085、将加1后的缩减节点整数确定为实际缩减节点数。
本发明实施例中,加1后的缩减节点整数为2,因此实际需要减少的告警服务节点的数量为2个,通过减少告警服务节点的数量,能够避免告警服务节点在空闲时间运行,造成了硬件资源的浪费的问题,从而提高了系统稳定性,提高了硬件资源利用率。
步骤2086、将缩减节点小数清零。
本发明实施例中,例如,缩减节点整数为1,缩减节点小数为0.6,由于缩减节点小数0.6小于0.2,因此将缩减节点小数清零。
步骤2087、将缩减节点整数确定为实际缩减节点数。
本发明实施例中,扩展节点整数为1,因此实际需要减少的告警服务节点的数量为1个。
步骤209、根据实际缩减节点数对告警服务节点的数量进行弹性缩容。
本发明实施例中,如上表2所示,原有的告警服务器节点的数量为3个,当计算出的实际缩减节点数为1个时,需要减少1个告警服务节点,如下表3所示,此时告警服务器节点的数量为2个。
表3
本发明实施例中,在步骤209之前,还包括:
步骤209a、判断实际缩减节点数是否大于或者等于预设弹性节点数,若是,执行步骤209b;若否,执行步骤201。
本发明实施例中,例如,预设弹性节点数为1个。若判断出实际缩减节点数大于或者等于预设弹性节点数,表明可进行弹性缩容;若判断出实际缩减节点数小于预设弹性节点数,表明不能进行弹性缩容。例如计算出的实际缩减节点数为0个,则不能进行弹性缩容。
步骤209b、判断告警服务节点的数量在预设第二时间段内是否进行过弹性缩容,若是,执行步骤201;若否,执行步骤209。
本发明实施例中,例如,预设第二时间段为5分钟。若判断出告警服务节点的数量在预设时间内进行过弹性缩容,表明已经进行过弹性缩容,若重复进行弹性缩容,可能会导致减少过多的告警服务节点,从而导致告警消息积压数量增多,出现业务延迟处理的问题;若判断出告警服务节点的数量在预设时间内未进行过弹性缩容,表明可执行步骤209,根据实际缩减节点数对告警服务节点的数量进行弹性缩容。
步骤210、将告警服务节点的数量加1,并继续执行步骤201。
本发明实施例中,由于告警消息积压数量大于预设时间段内的告警消息处理数量,导致在预设时间段内,积压的告警消息不能被处理,需要增加告警服务节点的数量。
本发明实施例中,在步骤210之前,还包括:
判断告警服务节点的数量在预设第二时间段内是否进行过弹性缩容,若是,执行步骤201;若否,执行步骤210。
本发明实施例中,若判断出告警服务节点的数量在预设时间内进行过弹性扩容,表明已经进行过弹性扩容,若重复进行弹性扩容,可能会导致增加过多的告警服务节点,从而造成硬件资源的浪费;若判断出告警服务节点的数量在预设时间内未进行过弹性扩容,表明可执行步骤210,根据实际扩展节点数对告警服务节点的数量进行弹性扩容。
本发明实施例提供的技术方案中,根据采集的预设时间段内的告警消息产生数量以及预设时间段,计算出告警产生速率,根据获取的告警服务节点的告警服务节点处理速率以及获取的告警服务节点的数量,计算出告警预计处理速率,根据告警产生速率、告警预计处理速率以及告警服务节点处理速率,计算出实际扩展节点数或者实际缩减节点数,并通过根据告警产生速率是否大于告警预计处理速率的判断结果,对告警服务节点的数量进行弹性扩缩容,从而避免了告警服务节点在空闲时间运行,造成了硬件资源的浪费的问题。
本发明实施例提供的技术方案中,告警消息的实时处理情况,选取核心业务指标结合Kubernetes弹性扩展方案,提高资源利用率,避免了原有分布式集群方案带来的硬件资源浪费的情况,解决了根据实际业务指标进行弹性扩展解决了原有集群方案峰值无法预估的问题。在告警消息积压时进行弹性扩容,解决了原有集群方案节点不够时消息积压的问题;在告警消息较少时进行弹性缩容,解决了原有集群方案为保证峰值处理部署过多节点带来的硬件资源浪费的问题。
图4是本发明一实施例所提供的一种告警服务节点的弹性扩缩容装置的结构示意图,如图4所示,该装置包括:第一计算模块11、第一判断模块12以及节点数处理模块13。
第一计算模块11用于根据采集的预设第一时间段内的告警消息产生数量以及预设第一时间段,计算出告警产生速率。
第一计算模块11还用于根据获取的告警服务节点的告警服务节点处理速率以及获取的告警服务节点的数量,计算出告警预计处理速率。
第一判断模块12用于判断所述告警产生速率是否大于所述告警预计处理速率。
第一计算模块11还用于若第一判断模块12判断出所述告警产生速率大于所述告警预计处理速率,根据所述告警产生速率、所述告警预计处理速率以及所述告警服务节点处理速率,计算出实际扩展节点数。
节点数处理模块13用于根据所述实际扩展节点数对所述告警服务节点的数量进行弹性扩容。
本发明实施例中,该装置还包括:第二判断模块14和第二计算模块15。
第二判断模块14还用于若判断出所述告警产生速率是否小于所述告警预计处理速率,判断获取的告警消息积压数量是否小于或者等于获取的预设第一时间段内的告警消息处理数量。
第二计算模块15用于若第二判断模块14判断出获取的告警消息积压数量小于或者等于获取的预设第一时间段内的告警消息处理数量,则根据所述告警预计处理速率、所述告警产生速率以及所述告警服务节点处理速率,计算出实际缩减节点数。
节点数处理模块13还用于根据所述实际缩减节点数对所述告警服务节点的数量进行弹性缩容。
本发明实施例中,该装置还包括:
节点数处理模块13还用于若第二判断模块14判断出获取的告警消息积压数量大于获取的预设第一时间段内的告警消息处理数量,将所述告警服务节点的数量加1,并触发第一计算模块11继续执行所述根据采集的预设第一时间段内的告警消息产生数量以及预设第一时间段,计算出告警产生速率的步骤。
本发明实施例中,该装置还包括:
第二计算模块15还用于根据采集的告警消息产生数量与获取的告警消息处理数量,计算告警消息积压数量。
本发明实施例中,该装置的第一计算模块11具体包括:计算子模块111、分解子模块112、判断子模块113、处理子模块114以及确定子模块115。
计算子模块111用于通过公式:扩展节点数=(告警产生速率-告警预计处理速率)/告警服务节点处理速率,计算出扩展节点数。
分解子模块112用于将所述扩展节点数分解为扩展节点整数和扩展节点小数。
判断子模块113用于判断所述扩展节点小数是否大于或者等于预设第一阈值。
处理子模块114用于若判断子模块113判断出所述扩展节点小数大于或者等于预设第一阈值,则将所述扩展节点小数清零,且将所述扩展节点整数加1。
确定子模块115用于将加1后的所述扩展节点整数确定为实际扩展节点数。
处理子模块114还用于若判断子模块113判断出所述扩展节点小数小于预设第一阈值,则将所述扩展节点小数清零。
确定子模块115还用于将所述扩展节点整数确定为实际扩展节点数。
本发明实施例中,该装置的第二计算模块15具体包括:计算子模块151、分解子模块152、判断子模块153、处理子模块154以及确定子模块155。
计算子模块151用于通过公式:缩减节点数=(告警预计处理速率-告警产生速率)/告警服务节点处理速率,计算出缩减节点数。
分解子模块152用于将所述缩减节点数分解为缩减节点整数和缩减节点小数。
判断子模块153用于判断所述缩减节点小数是否大于或者等于预设第二阈值。
处理子模块154用于若判断子模块153判断出所述缩减节点小数大于或者等于预设第二阈值,则将所述缩减节点小数清零,且将所述缩减节点整数加1。
确定子模块155用于将加1后的所述缩减节点整数确定为实际缩减节点数。
处理子模块154还用于若判断子模块153判断出所述缩减节点小数小于预设第二阈值,则将所述缩减节点小数清零。
确定子模块155还用于将所述缩减节点整数确定为实际缩减节点数。
本发明实施例中,该装置还包括:第三判断模块16和第四判断模块17。
第三判断模块16用于判断所述实际扩展节点数是否大于或者等于预设弹性节点数。
第四判断模块17用于若第三判断模块16判断出所述实际扩展节点数大于或者等于预设弹性节点数,判断所述告警服务节点的数量在预设第二时间段内是否进行过弹性扩容;若第四判断模块17判断出所述告警服务节点的数量在预设第二时间段内未进行过弹性扩容,则触发节点数处理模块13继续执行所述根据所述实际扩展节点数对所述告警服务节点的数量进行弹性扩容的步骤。
第三判断模块16还用于判断所述实际缩减节点数是否大于或者等于预设弹性节点数。
第四判断模块17还用于若第三判断模块16判断出所述实际缩减节点数大于或者等于预设弹性节点数,判断所述告警服务节点的数量在预设第二时间段内是否进行过弹性缩容;若第四判断模块17判断出所述告警服务节点的数量在预设第二时间段内未进行过弹性缩容,则触发节点数处理模块13继续执行所述根据所述实际缩减节点数对所述告警服务节点的数量进行弹性缩容的步骤。
第四判断模块17还用于判断所述告警服务节点的数量在预设第二时间段内是否进行过弹性扩容;若第四判断模块17判断出所述告警服务节点的数量在预设第二时间段内未进行过弹性扩容,则触发节点数处理模块13继续执行所述将所述告警服务节点的数量加1的步骤。
本发明实施例提供的技术方案中,根据采集的预设时间段内的告警消息产生数量以及预设时间段,计算出告警产生速率,根据获取的所述告警服务节点的告警服务节点处理速率以及获取的告警服务节点的数量,计算出告警预计处理速率,根据所述告警产生速率、所述告警预计处理速率以及所述告警服务节点处理速率,计算出实际扩展节点数或者实际缩减节点数,并通过根据所述告警产生速率是否大于所述告警预计处理速率的判断结果,对所述告警服务节点的数量进行弹性扩缩容,从而避免了告警服务节点在空闲时间运行,造成了硬件资源的浪费的问题。
本发明实施例提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述告警服务节点的弹性扩缩容方法的实施例的各步骤,具体描述可参见上述告警服务节点的弹性扩缩容方法的实施例。
本发明实施例提供了一种服务器,包括存储器和处理器,存储器用于存储包括程序指令的信息,处理器用于控制程序指令的执行,程序指令被处理器加载并执行时实现上述告警服务节点的弹性扩缩容方法的步骤。具体描述可参见上述告警服务节点的弹性扩缩容方法的实施例。
图5为本发明实施例提供的一种服务器的示意图。如图5所示,该实施例的服务器3包括:处理器31、存储器32以及存储在存储32中并可在处理器31上运行的计算机程序33,该计算机程序33被处理器31执行时实现实施例中的应用于告警服务节点的弹性扩缩容方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器31执行时实现实施例中应用于告警服务节点的弹性扩缩容装置中各模型/单元的功能,为避免重复,此处不一一赘述。
服务器3包括,但不仅限于,处理器31、存储器32。本领域技术人员可以理解,图5仅仅是服务器3的示例,并不构成对服务器3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如服务器3还可以包括输入输出设备、网络接入设备、总线等。
所称处理器31可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器32可以是服务器3的内部存储单元,例如服务器3的硬盘或内存。存储器32也可以是服务器3的外部存储设备,例如服务器3上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器32还可以既包括服务器3的内部存储单元也包括外部存储设备。存储器32用于存储计算机程序以及服务器3所需的其他程序和数量。存储器32还可以用于暂时地存储已经输出或者将要输出的数量。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (10)
1.一种告警服务节点的弹性扩缩容方法,其特征在于,包括:
根据采集的预设第一时间段内的告警消息产生数量以及预设第一时间段,计算出告警产生速率;
根据获取的告警服务节点的告警服务节点处理速率以及获取的告警服务节点的数量,计算出告警预计处理速率;
判断所述告警产生速率是否大于所述告警预计处理速率;
若判断出所述告警产生速率大于所述告警预计处理速率,根据所述告警产生速率、所述告警预计处理速率以及所述告警服务节点处理速率,计算出实际扩展节点数;
根据所述实际扩展节点数对所述告警服务节点的数量进行弹性扩容。
2.根据权利要求1所述的方法,其特征在于,还包括:
若判断出所述告警产生速率小于所述告警预计处理速率,判断获取的告警消息积压数量是否小于或者等于获取的预设第一时间段内的告警消息处理数量;
若判断出获取的告警消息积压数量小于或者等于获取的预设第一时间段内的告警消息处理数量,则根据所述告警预计处理速率、所述告警产生速率以及所述告警服务节点处理速率,计算出实际缩减节点数;
根据所述实际缩减节点数对所述告警服务节点的数量进行弹性缩容。
3.根据权利要求2所述的方法,其特征在于,还包括:
若判断出获取的告警消息积压数量大于获取的预设第一时间段内的告警消息处理数量,将所述告警服务节点的数量加1,并继续执行所述根据采集的预设第一时间段内的告警消息产生数量以及预设第一时间段,计算出告警产生速率的步骤。
4.根据权利要求2所述的方法,其特征在于,在所述若判断出所述告警产生速率小于所述告警预计处理速率,判断获取的告警消息积压数量是否小于或者等于获取的预设第一时间段内的告警消息处理数量之前,还包括:
根据采集的告警消息产生数量与获取的告警消息处理数量,计算告警消息积压数量。
5.根据权利要求1所述的方法,其特征在于,所述根据所述告警产生速率、所述告警预计处理速率以及所述告警服务节点处理速率,计算出实际扩展节点数,包括:
通过公式:扩展节点数=(告警产生速率-告警预计处理速率)/告警服务节点处理速率,计算出扩展节点数;
将所述扩展节点数分解为扩展节点整数和扩展节点小数;
判断所述扩展节点小数是否大于或者等于预设第一阈值;
若判断出所述扩展节点小数大于或者等于预设第一阈值,则将所述扩展节点小数清零,且将所述扩展节点整数加1;
将加1后的所述扩展节点整数确定为实际扩展节点数;
若判断出所述扩展节点小数小于预设第一阈值,则将所述扩展节点小数清零;
将所述扩展节点整数确定为实际扩展节点数。
6.根据权利要求2所述的方法,其特征在于,所述根据所述告警预计处理速率、所述告警产生速率以及所述告警服务节点处理速率,计算出实际缩减节点数,包括:
通过公式:缩减节点数=(告警预计处理速率-告警产生速率)/告警服务节点处理速率,计算出缩减节点数;
将所述缩减节点数分解为缩减节点整数和缩减节点小数;
判断所述缩减节点小数是否大于或者等于预设第二阈值;
若判断出所述缩减节点小数大于或者等于预设第二阈值,则将所述缩减节点小数清零,且将所述缩减节点整数加1;
将加1后的所述缩减节点整数确定为实际缩减节点数;
若判断出所述缩减节点小数小于预设第二阈值,则将所述缩减节点小数清零;
将所述缩减节点整数确定为实际缩减节点数。
7.根据权利要求3所述的方法,其特征在于,在所述根据所述实际扩展节点数对所述告警服务节点的数量进行弹性扩容之前,还包括:
判断所述实际扩展节点数是否大于或者等于预设弹性节点数;
若判断出所述实际扩展节点数大于或者等于预设弹性节点数,判断所述告警服务节点的数量在预设第二时间段内是否进行过弹性扩容;
若判断出所述告警服务节点的数量在预设第二时间段内未进行过弹性扩容,则继续执行所述根据所述实际扩展节点数对所述告警服务节点的数量进行弹性扩容的步骤;
或者,在所述根据所述实际缩减节点数对所述告警服务节点的数量进行弹性缩容之前,还包括:
判断所述实际缩减节点数是否大于或者等于预设弹性节点数;
若判断出所述实际缩减节点数大于或者等于预设弹性节点数,判断所述告警服务节点的数量在预设第二时间段内是否进行过弹性缩容;
若判断出所述告警服务节点的数量在预设第二时间段内未进行过弹性缩容,则继续执行所述根据所述实际缩减节点数对所述告警服务节点的数量进行弹性缩容的步骤;
或者,在所述将所述告警服务节点的数量加1之前,还包括:
判断所述告警服务节点的数量在预设第二时间段内是否进行过弹性扩容;
若判断出所述告警服务节点的数量在预设第二时间段内未进行过弹性扩容,则继续执行所述将所述告警服务节点的数量加1的步骤。
8.一种告警服务节点的弹性扩缩容装置,其特征在于,所述装置包括:
第一计算模块,用于根据采集的预设第一时间段内的告警消息产生数量以及预设第一时间段,计算出告警产生速率;根据获取的所述告警服务节点的告警服务节点处理速率以及获取的告警服务节点的数量,计算出告警预计处理速率;若判断出所述告警产生速率大于所述告警预计处理速率,根据所述告警产生速率、所述告警预计处理速率以及所述告警服务节点处理速率,计算出实际扩展节点数;
判断模块,用于判断所述告警产生速率是否大于所述告警预计处理速率;
节点数处理模块,用于根据所述实际扩展节点数对所述告警服务节点的数量进行弹性扩容。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述的告警服务节点的弹性扩缩容方法。
10.一种服务器,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,其特征在于,所述程序指令被处理器加载并执行时实现权利要求1至7任意一项所述的告警服务节点的弹性扩缩容方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911356632.0A CN113037528B (zh) | 2019-12-25 | 2019-12-25 | 一种告警服务节点的弹性扩缩容方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911356632.0A CN113037528B (zh) | 2019-12-25 | 2019-12-25 | 一种告警服务节点的弹性扩缩容方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113037528A CN113037528A (zh) | 2021-06-25 |
CN113037528B true CN113037528B (zh) | 2022-04-29 |
Family
ID=76458845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911356632.0A Active CN113037528B (zh) | 2019-12-25 | 2019-12-25 | 一种告警服务节点的弹性扩缩容方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113037528B (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104601680B (zh) * | 2014-12-31 | 2018-03-16 | 华为技术有限公司 | 一种资源管理方法及装置 |
CN106470219A (zh) * | 2015-08-17 | 2017-03-01 | 阿里巴巴集团控股有限公司 | 计算机集群的扩容和缩容方法及设备 |
CN106528189B (zh) * | 2015-09-10 | 2019-05-28 | 阿里巴巴集团控股有限公司 | 一种启动备份任务的方法、装置及电子设备 |
CN106843745A (zh) * | 2015-12-03 | 2017-06-13 | 南京中兴新软件有限责任公司 | 容量扩展方法及装置 |
CN109729538B (zh) * | 2017-10-31 | 2021-02-09 | 华为技术有限公司 | 移动通信系统扩容方法、设备及存储介质、程序产品 |
-
2019
- 2019-12-25 CN CN201911356632.0A patent/CN113037528B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113037528A (zh) | 2021-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108845910B (zh) | 大规模微服务系统的监控方法、装置及存储介质 | |
CN109412867B (zh) | 一种告警关联合并方法、装置、系统、设备和存储介质 | |
CN107204875B (zh) | 数据上报链路监测方法、装置、电子设备及存储介质 | |
CN104778111A (zh) | 一种进行报警的方法和装置 | |
WO2017193873A1 (zh) | 一种分布式处理系统、数据处理的方法及控制节点设备 | |
EP3399413B1 (en) | Component logical threads quantity adjustment method and device | |
CN103782270A (zh) | 流处理系统的管理方法和相关设备及系统 | |
CN112559154A (zh) | 消息发送量增长的优化方法、系统、设备及可读存储介质 | |
CN111444015A (zh) | 服务器的控制方法、装置、计算机设备及存储介质 | |
CN111277640A (zh) | 用户请求处理方法、装置、系统、计算机设备和存储介质 | |
CN109634747A (zh) | 基于Saltstack的资源扩容方法、装置、计算机设备以及存储介质 | |
CN114490078A (zh) | 一种微服务的动态缩扩容方法、装置及设备 | |
CN114866563A (zh) | 扩容方法、装置、系统和存储介质 | |
CN113037528B (zh) | 一种告警服务节点的弹性扩缩容方法、装置 | |
CN111062503A (zh) | 一种电网监控告警处理方法、系统、终端及存储介质 | |
CN110674013A (zh) | 一种云平台可自定义监控的gpu监控告警系统 | |
CN112667467A (zh) | 集群的自适应限流方法、装置、计算机设备及存储介质 | |
CN117097646A (zh) | 尾延迟调整方法及装置 | |
CN107025148B (zh) | 一种海量数据的处理方法和装置 | |
US10089149B2 (en) | Method for scheduling multiple periodic requests and scheduling device | |
CN112988417B (zh) | 消息处理方法、装置、电子设备及计算机可读介质 | |
CN115361295A (zh) | 基于topsis的资源备份方法、装置、设备及介质 | |
CN110879774B (zh) | 一种网元性能数据告警方法及装置 | |
CN113840229A (zh) | 位置信息上报方法、装置、可读存储介质和计算机设备 | |
CN113900855A (zh) | 一种交换机异常状态的主动热启动方法、系统及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |