CN114090394A - 分布式服务器集群负载异常分析方法 - Google Patents

分布式服务器集群负载异常分析方法 Download PDF

Info

Publication number
CN114090394A
CN114090394A CN202210057072.4A CN202210057072A CN114090394A CN 114090394 A CN114090394 A CN 114090394A CN 202210057072 A CN202210057072 A CN 202210057072A CN 114090394 A CN114090394 A CN 114090394A
Authority
CN
China
Prior art keywords
node
load
serial number
index
load index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210057072.4A
Other languages
English (en)
Other versions
CN114090394B (zh
Inventor
朱海燕
陈婷婷
曹曼曼
王坡
田长福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Zhuolang Testing Co ltd
Original Assignee
Shandong Zhuolang Testing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Zhuolang Testing Co ltd filed Critical Shandong Zhuolang Testing Co ltd
Priority to CN202210057072.4A priority Critical patent/CN114090394B/zh
Publication of CN114090394A publication Critical patent/CN114090394A/zh
Application granted granted Critical
Publication of CN114090394B publication Critical patent/CN114090394B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]

Abstract

本发明涉服务器集群负载异常分析领域,具体涉及分布式服务器集群负载异常分析方法。方法包括:采集分布式服务器集群中各节点的CPU占用率、内存空闲率和CPU温度;所述节点为服务器集群中的服务器;根据各节点的CPU占用率、内存空闲率和CPU温度,计算各节点的负载指数;根据负载指数和CPU占用率,计算不同节点之间负载量特征的差异程度;根据不同节点之间负载量特征的差异程度,利用不同序号对各节点进行标注,将负载量特征的差异程度小于设定差异阈值的节点标注为同一序号;根据各序号对应的各节点的负载指数和CPU占用率,计算各序号的节点的整体负载指数;根据各序号的节点的整体负载指数,判断各序号的节点是否超负载运转。本发明提高了分析效率。

Description

分布式服务器集群负载异常分析方法
技术领域
本发明涉及服务器集群负载异常分析领域,具体涉及分布式服务器集群负载异常分析方法。
背景技术
目前大型应用主要使用分布式服务器集群处理运算任务,在分布式服务器集群中有成百上千个服务器节点,当接收到任务时,负载均衡设备给服务器分配工作,若某服务器超负载,负载均衡设备仍然给该服务器分配过多的任务,可能会导致服务器无法正常运行,甚至瘫痪,降低分布式服务器集群的服务质量,因此保证服务器集群正常运转至关重要,这就需要实时检测分布式服务器集群中每台服务器是否超负载运转。
现有对分布式服务器集群是否超负载运转分析时是对每台服务器是否超负载运转进行单独分析,由于分布式服务器集群包括的服务器个数较多,若对每台服务器是否超负载运转进行单独分析,则会降低对分布式服务器集群是否超负载运转分析的效率。
发明内容
为了解决现有方法存在的对分布式服务器集群是否超负载运转分析的效率较低的问题,本发明的目的在于提供一种分布式服务器集群负载异常分析方法,所采用的技术方案具体如下:
本发明提供了一种分布式服务器集群负载异常分析方法,该方法包括以下步骤:
采集分布式服务器集群中各节点的CPU占用率、内存空闲率和CPU温度;所述节点为服务器集群中的服务器;
根据各节点的CPU占用率、内存空闲率和CPU温度,计算各节点的负载指数;根据各节点的负载指数和CPU占用率,计算不同节点之间负载量特征的差异程度;
根据所述不同节点之间负载量特征的差异程度,利用不同序号对各节点进行标注,将负载量特征的差异程度小于设定差异阈值的节点标注为同一序号;根据各序号对应的各节点的负载指数和CPU占用率,计算各序号对应的节点的整体负载指数;
根据所述各序号对应的节点的整体负载指数,判断各序号对应的节点是否超负载运转。
优选的,采用如下公式计算不同节点之间负载量特征的差异程度:
Figure DEST_PATH_IMAGE001
其中,
Figure 638243DEST_PATH_IMAGE002
为分布式服务器集群中节点X1和节点X2之间负载量特征的类似程度,
Figure 427339DEST_PATH_IMAGE003
为节点X1的CPU占用率,
Figure 764779DEST_PATH_IMAGE004
为节点X2的CPU占用率,
Figure 221299DEST_PATH_IMAGE005
为节点X1和节点X2的CPU占用率的皮尔逊相关系数,
Figure 884362DEST_PATH_IMAGE006
为节点X1的负载指数,
Figure 426333DEST_PATH_IMAGE007
为节点X2的负载指数,
Figure 708410DEST_PATH_IMAGE008
为自然常数。
优选的,所述根据各序号对应的各节点的负载指数和CPU占用率,计算各序号对应的节点的整体负载指数,包括:
根据各序号对应的各节点的负载指数和CPU占用率,计算各序号对应的各节点负载指数指标的权重和CPU占用率指标的权重;
根据所述各序号对应的各节点负载指数指标的权重和CPU占用率指标的权重,计算各序号对应的节点的整体负载指数。
优选的,采用如下公式计算各序号对应的各节点负载指数指标的权重和CPU占用率指标的权重:
Figure 268704DEST_PATH_IMAGE009
Figure 853400DEST_PATH_IMAGE010
其中,
Figure 131935DEST_PATH_IMAGE011
为某序号对应的节点的个数,
Figure 81350DEST_PATH_IMAGE012
为第一系数,j=1时,
Figure 496151DEST_PATH_IMAGE013
为该序号对应的第i个节点负载指数指标的权重,
Figure 517327DEST_PATH_IMAGE014
为该序号对应的第i个节点的负载指数的比重,
Figure 17579DEST_PATH_IMAGE015
为该序号对应的第i个节点的负载指数的归一化值;j=2时,
Figure 251245DEST_PATH_IMAGE016
为该序号对应的第i个节点CPU占用率指标的权重,
Figure 520553DEST_PATH_IMAGE017
为该序号对应的第i个节点的CPU占用率的比重,
Figure 447051DEST_PATH_IMAGE018
为该序号对应的第i个节点的CPU占用率的归一化值。
优选的,采用如下公式计算各序号对应的节点的整体负载指数:
Figure 700178DEST_PATH_IMAGE019
其中,
Figure 127748DEST_PATH_IMAGE020
为某序号对应的节点的整体负载指数,n为该序号对应的节点的个数,
Figure 2295DEST_PATH_IMAGE021
为该序号对应的第i个节点的负载指数,
Figure 614542DEST_PATH_IMAGE022
为该序号对应的第i个节点的CPU占用率,
Figure 840118DEST_PATH_IMAGE013
为该序号对应的第i个节点的负载指数指标的权重,
Figure 930434DEST_PATH_IMAGE016
为该序号对应的第i个节点的CPU占用率指标的权重。
优选的,所述根据各节点的CPU占用率、内存空闲率和CPU温度,计算各节点的负载指数,包括:
计算各节点的CPU占用率与对应的CPU温度的乘积;
计算所述乘积与对应的内存空闲率的比值,将所述比值作为对应节点的负载指数。
优选的,所述根据所述各序号对应的节点的整体负载指数,判断各序号对应的节点是否超负载运转,包括:
统计当前时刻前的设定时间段内各序号对应的节点的整体负载指数大于负载阈值的次数;
判断所述次数是否大于次数阈值,若大于,则判定对应序号对应的节点均超负载运转。
本发明具有如下有益效果:本发明根据分布式服务器集群中每个节点的CPU占用率、内存空闲率和CPU温度,计算了各节点的负载指数;基于各节点的负载指数,得到了不同节点之间负载量特征的差异程度;本发明基于不同节点之间负载能量特征的差异程度,对分布式服务器集群中的节点进行了标注,并计算了不同序号对应的节点的整体负载指数;基于各序号对应的节点的整体负载指数,判断各序号对应的节点是否超负载运转。本发明对每个序号对应的服务器是否超负载运转进行分析,而不是对每台服务器单独进行分析,提高了分布式服务器集群是否超负载运转分析的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明的一种分布式服务器集群负载异常分析方法的流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种分布式服务器集群负载异常分析方法进行详细说明如下。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种分布式服务器集群负载异常分析方法的具体方案。
分布式服务器集群负载异常分析方法实施例
现有方法存在的对分布式服务器集群是否超负载运转分析的效率较低的问题。为了解决上述问题,本实施例提出了分布式服务器集群负载异常分析方法,如图1所示,本实施例的分布式服务器集群负载异常分析方法包括以下步骤:
步骤S1,采集分布式服务器集群中各节点的CPU占用率、内存空闲率和CPU温度;所述节点为服务器集群中的服务器。
分布式服务器集群中的每个服务器都代表着一个节点,在异构集群中,不同节点之间的运算能力是有差异性的,因此为了监控服务器集群的负载情况,需要监控每个节点的运转情况。在服务器集群工作过程中,节点的CPU占用率和内存的空闲率是不同的,当某节点通过负载均衡设备分配的任务增加时,此时的CPU占用率会逐渐升高,内存的空闲率会逐渐降低,如果分配任务超过服务器的负载阈值时,服务器的CPU占用率和内存空闲率就会超过阈值,可能会造成服务器宕机。
本实施例在服务器集群工作过程中,采集服务器集群中每个节点的CPU占用率S及内存的空闲率W,CPU占用率和内存的空闲率每秒更新一次,本实施例记录较长时间段内服务器各项指标,并把这些指标储存起来。
考虑到每个节点的负载情况不一,运算情况不一,每个服务器节点的温度也不一样,本实施例通过监控每个服务器对应的CPU的温度T反映不同节点的负载情况,CPU的温度T较高则说明负载较大,CPU的温度T较低则说明负载较小。CPU的温度通过软件读取,每秒更新一次,无需通过外接传感器来获取,减少了误差,降低了成本。
至此,得到了分布式服务器集群中各节点的CPU占用率、内存空闲率和CPU温度。
步骤S2,根据各节点的CPU占用率、内存空闲率和CPU温度,计算各节点的负载指数;根据各节点的负载指数和CPU占用率,计算不同节点之间负载量特征的类似程度。
节点处理的任务越多,节点的负载越高,意味着节点的CPU占用率S和CPU的温度T越高,内存的空闲率W越低。本实施例基于服务器集群中每个节点的CPU占用率、内存空闲率和CPU温度,计算每个节点的负载指数。
本实施例以5秒为一个单位时间长度,对于一个节点,每个单位时间长度内得到5个S、T、W的数据样本。单位时间长度可根据实际情况,由实施者设定。首先计算这5个S、T、W的数据样本的均值,即CPU占用率的均值、内存的空闲率的均值和CPU温度的均值。CPU占用率的均值越大,说明该节点在这5秒内处理的任务数越多,该节点的负载指数越大; CPU温度的均值越大,说明该节点在这5秒内对应的CPU温度越高,该节点的负载指数越大;内存空闲率的均值越大,说明该节点对应的内存空闲率越高,该节点的负载指数越小;基于此,计算CPU占用率的均值与CPU温度的均值的乘积,接着计算这个乘积与内存空闲率的均值的比值,将这个比值作为该节点的负载指数。至此, 得到分布式服务器集群每个节点的负载指数。
本实施例根据各节点的负载指数和CPU占用率,计算不同节点之间负载量特征的差异程度,具体计算公式为:
Figure 659486DEST_PATH_IMAGE023
其中,
Figure 911476DEST_PATH_IMAGE002
为分布式服务器集群中节点X1和节点X2之间负载量特征的差异程度,
Figure 889927DEST_PATH_IMAGE003
为节点X1的CPU占用率,
Figure 783934DEST_PATH_IMAGE004
为节点X2的CPU占用率,
Figure 898652DEST_PATH_IMAGE005
为节点X1和节点X2的CPU占用率的皮尔逊相关系数,
Figure 587122DEST_PATH_IMAGE006
为节点X1的负载指数,
Figure 177503DEST_PATH_IMAGE007
为节点X2的负载指数,
Figure 625933DEST_PATH_IMAGE008
为自然常数。
皮尔逊相关系数值域为[-1,1],两节点的CPU占用率数值大小和变化情况越相似,皮尔逊相关系数越接近于1,即这两个节点的差异程度越小;当两节点负载情况相差较大时,相关系数越接近于0;当一个节点的负载增加另一个节点负载减小时,数值变化呈相反趋势,相关系数越接近于-1,差异程度越大,两个节点CPU占用率的差值越小,这两个节点的差异程度越小。
至此,得到分布式服务器集群中任意两个节点之间负载量特征的差异程度。
步骤S3,根据所述不同节点之间负载量特征的差异程度,利用不同序号对各节点进行标注,将负载量特征的差异程度小于设定差异阈值的节点标注为同一序号;根据各序号对应的各节点的负载指数和CPU占用率,计算各序号对应的节点的整体负载指数。
为了找到负载特征相似的节点,本实施例基于分布式服务器集群中节点与节点之间负载量特征的差异程度,利用不同的序号对分布式服务器集群中节点进行标注,标注的原则为:将负载量特征的差异程度小于设定差异阈值的节点标注为同一序号。标注完成后,此时负载特征相似的节点被标注为一个序号,若某序号内的节点的整体负载指数偏高则可以通过负载均衡设备将任务分配给其它序号对应的节点,从而降低本序号对应的节点的负载情况,本实施例基于每个序号对应的节点的负载指数和CPU占用率,计算各序号对应的节点的整体负载指数。
同一序号对应的不同节点的负载特征虽然相似,但依然略有差别,因此本实施例给同一序号对应的每个节点的负载情况加以权重,进而得到每个序号对应的整体负载指数。本实施例中用于反映负载情况的特征值为负载指数和CPU占用率;负载指数越大,说明此节点负载越高,该节点在序号对应的节点内所占权重应当越高;CPU占用率越大,说明此节点的运算任务越重,该节点在序号对应的节点内所占权重应当越高。
本实施例利用熵权法计算每序号对应的每个节点负载指数指标的权重和CPU占用率指标权重,具体计算方法如下:
(1)假设某序号对应有n个节点,首先对每个节点负载指数和CPU占用率进行归一化处理,归一化处理公式如下:
Figure 578846DEST_PATH_IMAGE024
其中,j的取值为1和2,j=1时,
Figure 454529DEST_PATH_IMAGE015
为该序号对应的第i个节点的负载指数的归一化值,
Figure 391261DEST_PATH_IMAGE025
为该序号对应的第1个节点的负载指数,
Figure 377803DEST_PATH_IMAGE026
为该序号对应的第n个节点的负载指数;j=2时,
Figure 591747DEST_PATH_IMAGE018
为该序号对应的第i个节点的CPU占用率的归一化值,
Figure 622019DEST_PATH_IMAGE027
为该序号对应的第1个节点的CPU占用率,
Figure 796780DEST_PATH_IMAGE028
为该序号对应的第n个节点的CPU占用率。
(2) 计算该序号对应的第i个节点的第j个指标的比重,具体公式为:
Figure 836280DEST_PATH_IMAGE029
其中,
Figure 514517DEST_PATH_IMAGE030
为该序号对应的第i个节点的第j个指标的比重,即j=1时,
Figure 981271DEST_PATH_IMAGE031
为该序号对应的第i个节点的负载指数的比重,
Figure 767961DEST_PATH_IMAGE032
为该序号对应的第i个节点的CPU占用率的比重。
(3) 计算该序号对应的第i个节点的第j个指标的熵值,具体公式为:
Figure 830726DEST_PATH_IMAGE033
其中,
Figure 878317DEST_PATH_IMAGE034
为该序号对应的第i个节点的第j个指标的熵值。
(4) 本实施例将1与熵值的差值作为该节点的信息熵冗余度(差异),记为
Figure 266704DEST_PATH_IMAGE035
(5) 基于信息熵冗余度,得到该序号对应的第i个节点的第j个指标的权重,具体公式为:
Figure 665324DEST_PATH_IMAGE036
其中,
Figure 543499DEST_PATH_IMAGE037
为该序号对应的第i个节点的第j个指标的权重。
综上所述,通过合并,得到该序号对应的各节点各指标的权重的计算公式为:
Figure 711175DEST_PATH_IMAGE009
Figure 4884DEST_PATH_IMAGE010
其中,
Figure 500588DEST_PATH_IMAGE012
为第一系数,
Figure 420002DEST_PATH_IMAGE038
Figure 192917DEST_PATH_IMAGE013
为该序号对应的第i个节点负载指数指标的权重,
Figure 906795DEST_PATH_IMAGE014
为该序号对应的第i个节点的负载指数的比重,
Figure 30740DEST_PATH_IMAGE015
为该序号对应的第i个节点的负载指数的归一化值;
Figure 753845DEST_PATH_IMAGE016
为该序号对应的第i个节点CPU占用率指标的权重,
Figure 115688DEST_PATH_IMAGE017
为该序号对应的第i个节点的CPU占用率的比重,
Figure 406992DEST_PATH_IMAGE018
为该序号对应的第i个节点的CPU占用率的归一化值。
(6) 根据该序号对应的每个节点负载指数指标的权重和CPU占用率的权重,计算该序号对应的节点的整体负载指数,具体公式为:
Figure DEST_PATH_IMAGE039
其中,
Figure 814971DEST_PATH_IMAGE020
为该序号对应的节点的整体负载指数,
Figure 76188DEST_PATH_IMAGE021
为该序号对应的第i个节点的负载指数,
Figure 558116DEST_PATH_IMAGE022
为该序号对应的第i个节点的CPU占用率,
Figure 879376DEST_PATH_IMAGE013
为该序号对应的第i个节点的负载指数指标的权重,
Figure 712334DEST_PATH_IMAGE016
为该序号对应的第i个节点的CPU占用率指标的权重。
至此,本实施例得到了每个序号对应的节点的整体负载指数。每个序号对应的节点的整体负载指数反映对应序号对应的所有节点的负载指数的综合情况,表征对应序号对应的整体负载水平。整体负载指数越大,说明对应序号对应的负载越高。
步骤S4,根据所述各序号对应的节点的整体负载指数,判断各序号对应的节点是否超负载运转。
不同的分布式服务器集群承受的负载阈值不同,因此,不同的分布式服务器集群的负载阈值是不相同的,负载阈值根据实际情况进行设定。本实施例基于负载阈值判断各序号对应的节点的是否负载过高。
由于服务器的工作特性,每个节点的负载指数是实时波动的,在某个时间段由于任务量剧增致使出现较大幅度的波动,可能会超过设定的负载阈值,但短时间后可能会降到负载阈值以下的正常工作范围内,这种情况不影响服务器的正常工作,因此不能设定序号对应的内整体负载指数超过负载阈值时就通知负载均衡设备降低此序号对应的节点的任务量,这样会降低服务器的工作效率。
本实施例提供了一种触发预警的方法,具体为:每序号对应的节点的整体负载指数每秒更新一次,在设定的一段时间范围内,记录某序号对应的节点的整体负载指数大于负载阈值的次数P,从初始时刻开始,当某序号对应的节点的整体负载指数大于负载阈值的次数P超过k1时,说明该序号对应的节点超负载运转,触发负载过高预警,使得负载均衡设备降低此序号对应的所有节点的任务量,将任务量分配给其它序号对应的内的服务器,同时将次数P清零,继续监控记录。若之后的一段时间内重新记录的整体负载指数大于负载阈值的次数Q超过k2,说明该序号对应的节点超负载运转,再次触发预警降低负载,即将该序号对应的的任务量分配给其它序号对应的内的服务器。同时将次数Q清零,继续监控记录。若之后的一段时间内重新记录的整体负载指数大于负载阈值的次数R超过k3,再次触发预警降低负载,即将该序号对应的任务量分配给其它序号对应的服务器。其中,k1> k2> k3,k1、k2和k3的值根据实际情况进行设定。
本实施例根据分布式服务器集群中每个节点的CPU占用率、内存空闲率和CPU温度,计算了各节点的负载指数;基于各节点的负载指数,得到了不同节点之间负载量特征的差异程度;本发明基于不同节点之间负载能量特征的差异程度,对分布式服务器集群中的节点进行了标注,并计算了不同序号对应的节点的整体负载指数;基于各序号对应的节点的整体负载指数,判断各序号对应的节点是否超负载运转。本发明对每个序号对应的服务器是否超负载运转进行分析,而不是对每台服务器单独进行分析,提高了分布式服务器集群是否超负载运转分析的效率。
需要说明的是:以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种分布式服务器集群负载异常分析方法,其特征在于,该方法包括以下步骤:
采集分布式服务器集群中各节点的CPU占用率、内存空闲率和CPU温度;所述节点为服务器集群中的服务器;
根据各节点的CPU占用率、内存空闲率和CPU温度,计算各节点的负载指数;根据各节点的负载指数和CPU占用率,计算不同节点之间负载量特征的差异程度;
根据所述不同节点之间负载量特征的差异程度,利用不同序号对各节点进行标注,将负载量特征的差异程度小于设定差异阈值的节点标注为同一序号;根据各序号对应的各节点的负载指数和CPU占用率,计算各序号对应的节点的整体负载指数;
根据所述各序号对应的节点的整体负载指数,判断各序号对应的节点是否超负载运转。
2.根据权利要求1所述的一种分布式服务器集群负载异常分析方法,其特征在于,采用如下公式计算不同节点之间负载量特征的差异程度:
Figure 906323DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
为分布式服务器集群中节点X1和节点X2之间负载量特征的类似程度,
Figure 698829DEST_PATH_IMAGE004
为节点X1的CPU占用率,
Figure DEST_PATH_IMAGE005
为节点X2的CPU占用率,
Figure 353933DEST_PATH_IMAGE006
为节点X1和节点X2的CPU占用率的皮尔逊相关系数,
Figure DEST_PATH_IMAGE007
为节点X1的负载指数,
Figure 375241DEST_PATH_IMAGE008
为节点X2的负载指数,
Figure DEST_PATH_IMAGE009
为自然常数。
3.根据权利要求1所述的一种分布式服务器集群负载异常分析方法,其特征在于,所述根据各序号对应的各节点的负载指数和CPU占用率,计算各序号对应的节点的整体负载指数,包括:
根据各序号对应的各节点的负载指数和CPU占用率,计算各序号对应的各节点负载指数指标的权重和CPU占用率指标的权重;
根据所述各序号对应的各节点负载指数指标的权重和CPU占用率指标的权重,计算各序号对应的节点的整体负载指数。
4.根据权利要求3所述的一种分布式服务器集群负载异常分析方法,其特征在于,采用如下公式计算各序号对应的各节点负载指数指标的权重和CPU占用率指标的权重:
Figure DEST_PATH_IMAGE011
Figure DEST_PATH_IMAGE013
其中,
Figure 97602DEST_PATH_IMAGE014
为某序号对应的第i个节点的第j个指标的权重,
Figure DEST_PATH_IMAGE015
为该序号对应的节点的个数,
Figure 574194DEST_PATH_IMAGE016
为第一系数,j=1时,
Figure DEST_PATH_IMAGE017
为该序号对应的第i个节点负载指数指标的权重,
Figure 451014DEST_PATH_IMAGE018
为该序号对应的第i个节点的负载指数的比重,
Figure DEST_PATH_IMAGE019
为该序号对应的第i个节点的负载指数的归一化值;j=2时,
Figure 322018DEST_PATH_IMAGE020
为该序号对应的第i个节点CPU占用率指标的权重,
Figure DEST_PATH_IMAGE021
为该序号对应的第i个节点的CPU占用率的比重,
Figure 600684DEST_PATH_IMAGE022
为该序号对应的第i个节点的CPU占用率的归一化值。
5.根据权利要求3所述的一种分布式服务器集群负载异常分析方法,其特征在于,采用如下公式计算各序号对应的节点的整体负载指数:
Figure 328468DEST_PATH_IMAGE024
其中,
Figure DEST_PATH_IMAGE025
为某序号对应的节点的整体负载指数,n为该序号对应的节点的个数,
Figure 692585DEST_PATH_IMAGE026
为该序号对应的第i个节点的负载指数,
Figure DEST_PATH_IMAGE027
为该序号对应的第i个节点的CPU占用率,
Figure 101701DEST_PATH_IMAGE017
为该序号对应的第i个节点的负载指数指标的权重,
Figure 687403DEST_PATH_IMAGE020
为该序号对应的第i个节点的CPU占用率指标的权重。
6.根据权利要求1所述的一种分布式服务器集群负载异常分析方法,其特征在于,所述根据各节点的CPU占用率、内存空闲率和CPU温度,计算各节点的负载指数,包括:
计算各节点的CPU占用率与对应的CPU温度的乘积;
计算所述乘积与对应的内存空闲率的比值,将所述比值作为对应节点的负载指数。
7.根据权利要求1所述的一种分布式服务器集群负载异常分析方法,其特征在于,所述根据所述各序号对应的节点的整体负载指数,判断各序号对应的节点是否超负载运转,包括:
统计当前时刻前的设定时间段内各序号对应的节点的整体负载指数大于负载阈值的次数;
判断所述次数是否大于次数阈值,若大于,则判定对应序号对应的节点均超负载运转。
CN202210057072.4A 2022-01-19 2022-01-19 分布式服务器集群负载异常分析方法 Active CN114090394B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210057072.4A CN114090394B (zh) 2022-01-19 2022-01-19 分布式服务器集群负载异常分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210057072.4A CN114090394B (zh) 2022-01-19 2022-01-19 分布式服务器集群负载异常分析方法

Publications (2)

Publication Number Publication Date
CN114090394A true CN114090394A (zh) 2022-02-25
CN114090394B CN114090394B (zh) 2022-04-22

Family

ID=80308739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210057072.4A Active CN114090394B (zh) 2022-01-19 2022-01-19 分布式服务器集群负载异常分析方法

Country Status (1)

Country Link
CN (1) CN114090394B (zh)

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090019094A1 (en) * 2007-07-13 2009-01-15 Scott David Lashley Redirected updates on a backup server
CN103227838A (zh) * 2013-05-10 2013-07-31 中国工商银行股份有限公司 一种多重负载均衡处理装置与方法
US20140330976A1 (en) * 2013-05-06 2014-11-06 Jeroen van Bemmel Stateless load balancing of connections
CN104754000A (zh) * 2013-12-30 2015-07-01 国家电网公司 一种负载均衡方法及系统
US20150199250A1 (en) * 2014-01-15 2015-07-16 Ca, Inc. Determining and using power utilization indexes for servers
CN105007337A (zh) * 2015-08-20 2015-10-28 浪潮(北京)电子信息产业有限公司 集群系统负载均衡的方法和系统
CN105141541A (zh) * 2015-09-23 2015-12-09 浪潮(北京)电子信息产业有限公司 一种基于任务的动态负载均衡调度方法及装置
CN105407162A (zh) * 2015-11-27 2016-03-16 国云科技股份有限公司 一种基于SLA服务等级的云计算Web应用资源负载均衡算法
CN107124472A (zh) * 2017-06-26 2017-09-01 杭州迪普科技股份有限公司 负载均衡方法及装置、计算机可读存储介质
CN107277143A (zh) * 2017-06-21 2017-10-20 郑州云海信息技术有限公司 一种资源匹配管理方法及装置
CN107566535A (zh) * 2017-10-27 2018-01-09 武汉大学 一种Web地图服务中基于用户并发访问时序规则的自适应负载均衡策略
CN109995818A (zh) * 2017-12-29 2019-07-09 中移(杭州)信息技术有限公司 一种服务器负载均衡的方法及装置
CN110213358A (zh) * 2019-05-23 2019-09-06 深圳壹账通智能科技有限公司 集群资源调度的方法、节点、设备及存储介质
CN110933139A (zh) * 2019-11-05 2020-03-27 浙江工业大学 一种解决Web服务器高并发的系统及方法
CN110990146A (zh) * 2019-11-01 2020-04-10 北京信安世纪科技股份有限公司 负载均衡方法、设备、系统及存储介质
CN111083232A (zh) * 2019-12-27 2020-04-28 南京邮电大学 一种基于改进一致性哈希的服务器端负载均衡方法
CN112003898A (zh) * 2020-07-27 2020-11-27 珠海许继芝电网自动化有限公司 多节点集群的负载均衡方法及系统
CN113076197A (zh) * 2021-04-20 2021-07-06 北京沃东天骏信息技术有限公司 负载均衡方法及装置、存储介质及电子设备
CN113141317A (zh) * 2021-03-05 2021-07-20 西安电子科技大学 流媒体服务器负载均衡方法、系统、计算机设备、终端
CN113938488A (zh) * 2021-09-24 2022-01-14 浙江理工大学 一种基于动静态加权轮询的负载均衡方法

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090019094A1 (en) * 2007-07-13 2009-01-15 Scott David Lashley Redirected updates on a backup server
US20140330976A1 (en) * 2013-05-06 2014-11-06 Jeroen van Bemmel Stateless load balancing of connections
CN103227838A (zh) * 2013-05-10 2013-07-31 中国工商银行股份有限公司 一种多重负载均衡处理装置与方法
CN104754000A (zh) * 2013-12-30 2015-07-01 国家电网公司 一种负载均衡方法及系统
US20150199250A1 (en) * 2014-01-15 2015-07-16 Ca, Inc. Determining and using power utilization indexes for servers
CN105007337A (zh) * 2015-08-20 2015-10-28 浪潮(北京)电子信息产业有限公司 集群系统负载均衡的方法和系统
CN105141541A (zh) * 2015-09-23 2015-12-09 浪潮(北京)电子信息产业有限公司 一种基于任务的动态负载均衡调度方法及装置
CN105407162A (zh) * 2015-11-27 2016-03-16 国云科技股份有限公司 一种基于SLA服务等级的云计算Web应用资源负载均衡算法
CN107277143A (zh) * 2017-06-21 2017-10-20 郑州云海信息技术有限公司 一种资源匹配管理方法及装置
CN107124472A (zh) * 2017-06-26 2017-09-01 杭州迪普科技股份有限公司 负载均衡方法及装置、计算机可读存储介质
CN107566535A (zh) * 2017-10-27 2018-01-09 武汉大学 一种Web地图服务中基于用户并发访问时序规则的自适应负载均衡策略
CN109995818A (zh) * 2017-12-29 2019-07-09 中移(杭州)信息技术有限公司 一种服务器负载均衡的方法及装置
CN110213358A (zh) * 2019-05-23 2019-09-06 深圳壹账通智能科技有限公司 集群资源调度的方法、节点、设备及存储介质
CN110990146A (zh) * 2019-11-01 2020-04-10 北京信安世纪科技股份有限公司 负载均衡方法、设备、系统及存储介质
CN110933139A (zh) * 2019-11-05 2020-03-27 浙江工业大学 一种解决Web服务器高并发的系统及方法
CN111083232A (zh) * 2019-12-27 2020-04-28 南京邮电大学 一种基于改进一致性哈希的服务器端负载均衡方法
CN112003898A (zh) * 2020-07-27 2020-11-27 珠海许继芝电网自动化有限公司 多节点集群的负载均衡方法及系统
CN113141317A (zh) * 2021-03-05 2021-07-20 西安电子科技大学 流媒体服务器负载均衡方法、系统、计算机设备、终端
CN113076197A (zh) * 2021-04-20 2021-07-06 北京沃东天骏信息技术有限公司 负载均衡方法及装置、存储介质及电子设备
CN113938488A (zh) * 2021-09-24 2022-01-14 浙江理工大学 一种基于动静态加权轮询的负载均衡方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HENDRA RAHMAWAN等: "The simulation of static load balancing algorithms", 《2009 INTERNATIONAL CONFERENCE ON ELECTRICAL ENGINEERING AND INFORMATICS》 *
吴俊鹏等: "一种基于集群的动态负载均衡算法研究", 《电子设计工程》 *
屈威: "服务集成框架的负载均衡研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *

Also Published As

Publication number Publication date
CN114090394B (zh) 2022-04-22

Similar Documents

Publication Publication Date Title
CN108052528B (zh) 一种存储设备时序分类预警方法
CN108415789B (zh) 面向大规模混合异构存储系统的节点故障预测系统及方法
CN112188531B (zh) 异常检测方法、装置、电子设备及计算机存储介质
CN107707431A (zh) 一种面向云平台的数据安全监测方法及系统
CN109491339B (zh) 一种基于大数据的变电站设备运行状态预警系统
CN111538311B (zh) 一种基于数据挖掘的机械设备柔性多状态自适应预警方法及装置
CN109976971B (zh) 硬盘状态监测方法和装置
CN109711664B (zh) 一种基于大数据的输变电设备健康评估系统
CN115186883A (zh) 基于边云协同计算的工业设备健康状态监测系统及方法
CN111309502A (zh) 固态硬盘寿命预测方法
CN115858303B (zh) 一种基于Zabbix的服务器性能监控方法及系统
CN116881200B (zh) 一种多中心分布式电子档案数据安全管理方法及系统
CN112527448A (zh) 基于openstack的动态负载调整方法及其系统
CN111163075B (zh) 电力监控系统设备性能指标阈值动态调整方法
CN113992602B (zh) 一种电缆监测数据上传方法、装置、设备以及存储介质
CN115858794A (zh) 用于网络运行安全监测的异常日志数据识别方法
KR101960755B1 (ko) 미취득 전력 데이터 생성 방법 및 장치
CN114090394B (zh) 分布式服务器集群负载异常分析方法
CN117194177A (zh) 一种提高存储系统慢盘检测准确率的方法
CN113468014A (zh) 一种运维数据的异常检测方法及装置
CN111190790A (zh) 一种基于峰值预测的云计算集群监控方法及系统
CN111614504A (zh) 基于时间序列和故障树分析的电网调控数据中心业务特性故障定位方法及系统
CN111314110A (zh) 一种用于分布式系统的故障预警方法
CN114912638A (zh) 一种有效运行参数上报的数字电缆
CN114429240A (zh) 高速公路设备运行状态监测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant