CN106776214A - 一种服务器健康度评估方法 - Google Patents

一种服务器健康度评估方法 Download PDF

Info

Publication number
CN106776214A
CN106776214A CN201611139559.8A CN201611139559A CN106776214A CN 106776214 A CN106776214 A CN 106776214A CN 201611139559 A CN201611139559 A CN 201611139559A CN 106776214 A CN106776214 A CN 106776214A
Authority
CN
China
Prior art keywords
metrics
network element
thresholds
element index
health degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611139559.8A
Other languages
English (en)
Other versions
CN106776214B (zh
Inventor
李冰
林坚宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Shen Di Computer System Co Ltd
Original Assignee
Guangzhou Shen Di Computer System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shen Di Computer System Co Ltd filed Critical Guangzhou Shen Di Computer System Co Ltd
Priority to CN201611139559.8A priority Critical patent/CN106776214B/zh
Publication of CN106776214A publication Critical patent/CN106776214A/zh
Application granted granted Critical
Publication of CN106776214B publication Critical patent/CN106776214B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种服务器健康度评估方法,包括步骤:S1:获取服务器的网元指标;S2:通过网管的指标阈值监控信息获取每一网元指标的告警等级以及每一告警等级的指标阈值,指标阈值包括指标阈值上限或/和指标阈值下限;S3:实时获取每一网元指标性能值;当网元指标性能值未超出指标阈值上限或未低于指标阈值下限时,根据每一告警等级、每一告警等级的指标阈值以及每一网元指标性能值计算每一网元指标的健康度损减分数;S4:计算服务器的健康度。本发明提供的服务器健康度评估方法,能够更科学,更真实有效的反映服务器的健康度,并且,通过该方法得出的评估结果,能够帮助网管人员快速找出更可能出现告警或者告警严重的服务器。

Description

一种服务器健康度评估方法
技术领域
本发明涉及计算机领域,尤其涉及一种服务器健康度评估方法。
背景技术
不同的服务器工作内容大不相同,很多服务器经常连续不停运转,加上负载不均衡等原因,使得服务器故障层出不穷。较早的服务器监控方法非常简单:针对每台服务器分别下达指令以采集相关指标来判断其运行状况。然而,随着服务器规模的急剧扩大,针对单个服务器通过指令判断故障的方法已经无法满足需求。
为了能有效监控大量服务器,市场上出现了各种服务器性能监控软件。这些软件能够对各个指标进行有效监控,如cpu,内存,磁盘,网络流量等。通过了解各个监控指标的性能以及状态信息,可以快速了解服务器各个部分的运行情况。如果事先为各个指标设立监控指标阈值,当性能值超过指标阈值即可触发告警,并及时发送告警信息通知网管人员维修。这也是目前服务器监控中最普遍的做法。然而,对服务器整体性能做出评估的软件却少之甚少。主要原因在于服务器各有分工,不同的工作任务使得各个指标对不同服务器的重要性也各不相同。对一些服务器而言cpu是一个重要指标,但是对其他服务器而言cpu可能不及内存更重要,因此,在对服务器做整体评估时,不能同一地对待各个指标对服务器总的影响力。这也是很难对整个服务器性能评估的主要原因之一。尽管如此,对服务器整体的性能评估依然很重要,因为只有这样我们才能知道这台服务器是否健康。例如,一些服务器虽未触发告警,但可能各项指标均接近指标阈值,如果不能及时检测出来,很有可能出现服务器运行不稳定,甚至出现系统崩溃的情况。因此,及时了解服务器各项指标的运行情况和服务器整体健康状况是非常重要的。
目前的服务器健康度评估方法中,对各个组件的健康度评估比较武断,服务器健康度量化结果不够细分,且健康度分段过程中指标阈值设定同一化,难以将不同业务下的指标进行有效区分,例如:很多文献直接按照一特定指标阈值将其分为健康、不健康、亚健康。一方面,统一地将组件分为健康、不健康、亚健康太过笼统,很难进一步将评估结果细分。另一方面,这里面的指标阈值设定对少量服务器而言还可操作,但是,面对大量服务器,如何设定合适的指标阈值就是一个难题了。相当多的做法是为各个指标,如cpu占用率,按照经验设定指标阈值,超出90%为不健康,超出80%亚健康,低于80%为健康。这么做虽然操作简单,但是,不同的服务器业务不同,对指标的要求也各不相同,设定同一的指标阈值显然会使结果出现较大误差。当然,有的文献结合告警事件来确定网元指标在触发告警后产生的健康度下降程度,但是也只是将超出指标阈值而触发告警的情况考虑进去,却没有考虑未触发告警的情况下网元指标的健康度问题。即,服务器健康度衡量中普遍认为未触发告警时的服务器是健康的,从而将未触发告警的情况忽略掉。事实上,未触发告警时的健康度问题更为重要。这是因为,大多服务器并未触发告警,如果均不考虑的话,很难将其中接近告警范围却并未触发告警的服务器识别出来。
大多数文献在利用网元指标(或组件)加权求取系统的整体健康度时,要么采用专家经验定权,要么利用图的广度优先遍历算法定权,但是,这样得出的健康度结果很难直接和告警分析结合起来。无论上述哪种权重判定方法,且不管权重设定是否准确,由于未结合告警分析的目标,得出的评估结果很难直接用来辅助告警分析。服务器健康度的评估结果需要直接来判定服务器在告警分析中的严重程度,上述权重均难以达到此种目的。
发明内容
针对现有技术的缺点,本发明的目的是提供一种服务器健康度评估方法。
为了实现上述目的,本发明提供了一种服务器健康度评估方法。包括如下步骤:
S1:获取服务器的网元指标;
S2:通过网管的指标阈值监控信息获取每一网元指标的告警等级以及每一告警等级的指标阈值,指标阈值包括指标阈值上限或/和指标阈值下限;
S3:实时获取每一网元指标性能值;当网元指标性能值未超出指标阈值上限或未低于指标阈值下限时,根据每一告警等级、每一告警等级的指标阈值以及每一网元指标性能值计算每一网元指标的健康度损减分数;
S4:根据每一网元指标的健康度损减分数以及每一网元指标的权重计算服务器的健康度。
本发明提供的服务器健康度评估方法,通过获取服务器的网元指标,通过网管的指标阈值监控信息获取每一网元指标的告警等级以及每一告警等级的指标阈值,数据来源更精确;通过判断网元指标性能值是否超过指标阈值,综合分析网元指标性能值未超过指标阈值及超过指标阈值时服务器的健康度,有效的填补了现有技术仅仅分析网元指标超过指标阈值,发生告警时服务器的健康度的空白,结合每一网元指标的健康度损减分数以及每一网元指标的权重评估服务器的健康度,能够更科学,更真实有效的反映服务器的健康度,并且,通过本发明得出的服务器健康度评估结果,将辅助告警分析,能够帮助网管人员快速找出更可能出现告警或者告警严重的服务器。
根据本发明另一具体实施方式,网元指标包括:CPU占用率、内存占用率、磁盘繁忙度、分区占用率、虚拟内存占用率。
根据本发明另一具体实施方式,告警等级包括四个等级,分别为0、1、2、3,其中:0等级的告警严重程度最高,1等级次之,2等级再次之,3等级的告警严重程度最低。
根据本发明另一具体实施方式,步骤S3还包括步骤S31:
所述步骤S3还包括步骤S31:
当所述网元指标性能值超出所述指标阈值上限或低于指标阈值下限时,将所述告警等级对应的所述网元指标的健康度减损分数设定为SL,触发0等级时,SL=40;触发1等级时,SL=30;触发2等级时,SL=20;触发3等级时,SL=10。
根据本发明另一具体实施方式,当网元指标只设置了一个告警等级,且告警等级的指标阈值包括指标阈值上限和指标阈值下限时,在步骤S3中,通过以下公式计算网元指标未超出阈值范围时的健康度损减分数:
S=(rrd-td)2/(tu-td)2×(4-wl)×10
其中:rrd为网元指标性能值,tu为指标阈值上限,td为指标阈值下限,wl为告警等级。
根据本发明另一具体实施方式,当网元指标只设置了一个告警等级,且告警等级的指标阈值仅包括指标阈值上限时,在步骤S3中,通过以下公式计算网元指标未超出阈值范围时的健康度损减分数:
SL=(rrd)2/(tu)2×(4-wl)×10
其中:rrd为网元指标性能值,tu为指标阈值上限,wl为告警等级。
根据本发明另一具体实施方式,当网元指标设置了多个告警等级,且每一告警等级的指标阈值包括指标阈值上限和指标阈值下限时,在步骤S3中,通过以下公式计算网元指标未超出阈值范围时的健康度损减分数:
SL=(rrd-max(td))2/(min(tu)-max(td))2×(4-wl)×10
其中:rrd为网元指标性能值,tu为指标阈值上限,td为指标阈值下限,wl为告警严重程度最低的告警等级。
根据本发明另一具体实施方式,当网元指标设置了多个告警等级,且每一告警等级的指标阈值仅包括指标阈值上限时,在步骤S3中,通过以下公式计算网元指标未超出阈值范围时的健康度损减分数:
SL=(rrd)2/(min(tu))2×(4-wl)×10
其中:rrd为网元指标性能值,tu为指标阈值上限,wl为告警严重程度最低的告警等级。
根据本发明另一具体实施方式,在步骤S4中,通过以下步骤确定每一网元指标的权重:
S41:根据网元指标性能值是否超出指标阈值上限或低于指标阈值下限,将网元指标分为A类网元指标、B类网元指标,其中,A类网元指标超出指标阈值上限或低于指标阈值下限,B类网元指标未超出指标阈值上限或未低于指标阈值下限;
S42:将A类网元指标权重均设置为1;
S43:在B类网元指标中,将网元指标损减分数最大的权重设置为1,损减分数次之的权重设置为1/2,损减分数大小第3的权重设置为1/3,以此类推;
S44:根据公式S=100-∑SLA-∑SLB/n计算服务器的健康度,其中SLA为A类网元指标健康度损减分数,SLB为B类网元指标健康度损减分数,B类网元指标损减分数最大者n为1,损减分数次之者n为2,损减分数再次之者n为3,以此类推。
与现有技术相比,本发明具备如下有益效果:
本发明通过网管的指标阈值监控信息获取网元指标的告警等级以及每一告警等级的指标阈值范围,数据来源更精确;通过判断网元指标性能值是否超过指标阈值范围,综合分析网元指标性能值未超过指标阈值,及超过指标阈值上限或低于指标阈值下限时服务器的健康度,有效的填补了现有技术仅仅分析网元指标超过指标阈值,发生告警时服务器的健康度的空白,提出了更科学,更能真实反映服务器的健康度的评估方法。本发明在设置网元指标的权重时,将权重的设定与告警分析结合,通过将对服务器健康度影响较大的网元指标,也就是对健康度损减严重的网元指标赋予较大权重,而健康度损减小的赋予较小权重,通过该权重设置方法,能够更准确的反映服务器的告警程度,使得对服务器健康度的评估更加准确。通过本发明得出的服务器健康度评估结果,将辅助告警分析,能够帮助网管人员快速找出更可能出现告警或者告警严重的服务器。
下面结合附图对本发明作进一步的详细说明。
附图说明
图1是实施例1的一种服务器健康度评估方法的流程图;
图2是图1中步骤S4的具体流程图。
具体实施方式
实施例1
本实施例提供了一种服务器健康度评估方法,包括如下步骤:
S1:获取服务器的网元指标。
该步骤用于获取服务器的网元指标。具体实施时,根据实际情况获取服务器的网元指标,网元指标包括但不限于CPU占用率、内存占用率、磁盘繁忙度、分区占用率、虚拟内存占用率,网元指标信息来源于网管监控信息。
S2:通过网管的指标阈值监控信息获取每一网元指标的告警等级以及每一告警等级的指标阈值,所述指标阈值包括指标阈值上限或/和指标阈值下限。
该步骤用于获取每一网元指标的告警等级以及每一告警等级的指标阈值。具体的,告警等级包括四个等级,分别为0、1、2、3,其中:0等级的告警严重程度最高,1等级次之,2等级再次之,3等级的告警严重程度最低。指标阈值包括指标阈值上限或/和指标阈值下限。
每一网元指标的告警等级以及每一告警等级的指标阈值信息均来自于网管的指标阈值监控信息。具体实施时,网管的指标阈值监控信息根据实际情况设置告警等级,例如:有的网元指标分别设置了0、1、2、3四个告警等级,但是也有很多只设置了2一个告警等级,或者设置了2,3两个告警等级;此外,根据监控需要,部分指标阈值设置了指标阈值上限和指标阈值下限,而更多情况下只设置指标阈值上限。为了更好的理解告警等级和指标阈值的设置情况,现举例说明:假设某一服务器的网元指标为CPU占用率、内存占用率、磁盘繁忙度,CPU占用率的告警等级设置了0、1、2、3四个等级,其中:告警等级0、1、2均设置了指标阈值上限和指标阈值下限,告警等级3只设置了指标阈值上限;内存占用率的告警等级设置了2、3两个等级,其中:告警等级2设置了指标阈值上限和指标阈值下限,告警等级3只设置了指标阈值上限,磁盘繁忙度的告警等级设置了2一个等级,其中:告警等级2只设置了指标阈值上限。
S3:实时获取每一网元指标性能值;当网元指标性能值未超出指标阈值上限或未低于指标阈值下限时,根据每一告警等级、每一告警等级的指标阈值以及每一网元指标性能值计算每一网元指标的健康度损减分数。
该步骤用于计算当前网元指标性能值未超过指标阈值上限或未低于指标阈值下限时,该网元指标的健康度损减分数。
具体的,当网元指标只设置了一个告警等级,且告警等级的指标阈值包括指标阈值上限和指标阈值下限时,通过以下公式计算网元指标未超出阈值范围时的健康度损减分数:
S=(rrd-td)2/(tu-td)2×(4-wl)×10
其中:rrd为网元指标性能值,tu为指标阈值上限,td为指标阈值下限,wl为告警等级。
例如:当网元指标为CPU占用率时,设置的告警等级为2,则此时wl=2,该告警等级设置的指标阈值上限为90,指标阈值下限为5,获取到的当前网元指标性能值为83,即通过上述公式计算网元指标未超过阈值范围时的健康度损减分数。
当网元指标只设置了一个告警等级,且告警等级的指标阈值仅包括指标阈值上限时,在步骤S3中,通过以下公式计算网元指标未超出阈值范围时的健康度损减分数:
SL=(rrd)2/(tu)2×(4-wl)×10
其中:rrd为网元指标性能值,tu为指标阈值上限,wl为告警等级。
当网元指标设置了多个告警等级,且每一告警等级的指标阈值包括指标阈值上限和指标阈值下限时,在步骤S3中,通过以下公式计算网元指标未超出阈值时的健康度损减分数:
SL=(rrd-max(td))2/(min(tu)-max(td))2×(4-wl)×10
其中:rrd为网元指标性能值,tu为指标阈值上限,td为指标阈值下限,wl为告警严重程度最低的告警等级。
例如:当网元指标为CPU占用率时,设置的告警等级为0、2、3,告警等级为0时,指标阈值上限为95、指标阈值下限为1;告警等级为2时,指标阈值上限为85,指标阈值下限为10;告警等级为3时,指标阈值上限为80、指标阈值下限为15。假设获取到的当前网元指标(CPU占用率)性能值rrd=78,即获取到的CPU占用率性能值未超过告警严重程度最低的告警等级对应的指标阈值上限,或高于告警严重程度最低的告警等级对应的指标阈值下限(即未触发告警),则wl=3,max(td)=15,min(tu)=80。
当网元指标设置了多个告警等级,且告警等级的指标阈值仅包括指标阈值上限时,在步骤S3中,通过以下公式计算网元指标未超出阈值时的健康度损减分数:
SL=(rrd)2/(min(tu))2×(4-wl)×10
其中:rrd为网元指标性能值,tu为指标阈值上限,wl为告警严重程度最低的告警等级。
具体实施时,当网元指标性能值超出指标阈值上限或者低于阈值下限(即触发告警)时,将告警等级对应的网元指标的健康度减损分数设定为SL,触发0等级时,SL=40;触发1等级时,SL=30;触发2等级时,SL=20;触发3等级时,SL=10。
S4:根据每一网元指标的健康度损减分数以及每一网元指标的权重计算服务器的健康度。
该步骤用于计算服务器的健康度。具体的,参见图2,该步骤通过如下步骤实现:
S41:根据网元指标性能值是否超出指标阈值上限或低于指标阈值下限,将网元指标分为A类网元指标、B类网元指标,其中,A类网元指标超出指标阈值上限或低于阈值下限,B类网元指标未超出指标阈值上限且未低于阈值下限。
具体的,判断实时获取的网元指标性能值是否超出指标阈值上限或低于阈值下限,当网元指标有多个告警等级时,判断实时获取的网元指标性能值是否超过告警严重程度最低的告警等级的指标阈值范围,即判断是否触发告警,将未超出指标阈值,即未触发告警的网元指标设置为A类,将超出指标阈值,即触发告警的网元指标设置为B类。
S42:将A类网元指标权重均设置为1。
具体的,将A类网元指标权重均设置为1的原因是:网元指标性能值超出指标阈值,触发告警对服务器的健康产生的影响是一定存在的。
S43:在B类网元指标中,将网元指标损减分数最大的权重设置为1,损减分数次之的权重设置为1/2,损减分数大小第3的权重设置为1/3,以此类推。
具体的,该步骤中权重设置方法是根据不同损减程度的网元指标对服务器健康度影响不同,损减分数最大的网元指标,虽然暂时没有超出指标阈值范围、触发告警,但是相对其他网元指标而言,它对服务器健康的威胁最大,因此权重也最大。损减分数较小的网元指标,既未超出阈值范围,而且对服务器造成的影响也小,因此权重也较小。
S44:根据公式S=100-∑SLA-∑SLB/n计算服务器的健康度,其中SLA为A类网元指标健康度损减分数,SLB为B类网元指标健康度损减分数,B类网元指标损减分数最大者n为1,损减分数次之者n为2,损减分数再次之者n为3,以此类推。
具体的,分别根据A类网元指标健康度损减分数和B类网元指标健康度损减分数计算服务器的健康度。
本实施例通过网管的指标阈值监控信息获取网元指标的告警等级以及每一告警等级的指标阈值,数据来源更精确;通过判断网元指标性能值是否超过指标阈值,综合分析网元指标性能值未超过指标阈值及超过指标阈值时服务器的健康度,有效的填补了现有技术仅仅分析网元指标超过指标阈值,发生告警时服务器的健康度的空白,提出了更科学,更能真实反映服务器的健康度的评估方法。本实施例在设置网元指标的权重时,将权重的设定与告警分析结合,通过将对服务器健康度影响较大的网元指标,也就是对健康度损减严重的网元指标赋予较大权重,而健康度损减小的赋予较小权重,能够更准确的反映服务器的告警程度,使得对服务器健康度的评估更加准确。通过本实施例得出的服务器健康度评估结果,将辅助告警分析,能够帮助网管人员快速找出更可能出现告警或者告警严重的服务器。
虽然本发明以较佳实施例揭露如上,但并非用以限定本发明实施的范围。任何本领域的普通技术人员,在不脱离本发明的发明范围内,当可作些许的改进,即凡是依照本发明所做的同等改进,应为本发明的范围所涵盖。

Claims (9)

1.一种服务器健康度评估方法,其特征在于,包括如下步骤:
S1:获取所述服务器的网元指标;
S2:通过网管的指标阈值监控信息获取每一所述网元指标的告警等级以及每一所述告警等级的指标阈值,所述指标阈值包括指标阈值上限或/和指标阈值下限;
S3:实时获取每一网元指标性能值;当所述网元指标性能值未超出所述指标阈值上限或未低于指标阈值下限时,根据所述每一告警等级、每一所述告警等级的指标阈值以及每一所述网元指标性能值计算每一所述网元指标的健康度损减分数;
S4:根据每一所述网元指标的健康度损减分数以及每一所述网元指标的权重计算所述服务器的健康度。
2.如权利要求1所述的服务器健康度评估方法,其特征在于,所述网元指标包括:CPU占用率、内存占用率、磁盘繁忙度、分区占用率、虚拟内存占用率。
3.如权利要求1所述的服务器健康度评估方法,其特征在于,所述告警等级包括四个等级,分别为0、1、2、3,其中:0等级的告警严重程度最高,1等级次之,2等级再次之,3等级的告警严重程度最低。
4.如权利要求3所述的服务器健康度评估方法,其特征在于,所述步骤S3还包括步骤S31:
当所述网元指标性能值超出所述指标阈值上限或低于所述指标阈值下限时,将所述告警等级对应的所述网元指标的健康度减损分数设定为SL,触发0等级时,SL=40;触发1等级时,SL=30;触发2等级时,SL=20;触发3等级时,SL=10。
5.如权利要求1所述的服务器健康度评估方法,其特征在于,当所述网元指标只设置了一个告警等级,且所述告警等级的指标阈值包括指标阈值上限和指标阈值下限时,在步骤S3中,通过以下公式计算所述网元指标未超出阈值范围时的健康度损减分数:
S=(rrd-td)2/(tu-td)2×(4-wl)×10
其中:rrd为网元指标性能值,tu为指标阈值上限,td为指标阈值下限,wl为告警等级。
6.如权利要求1所述的服务器健康度评估方法,其特征在于,当所述网元指标只设置了一个告警等级,且所述告警等级的指标阈值仅包括指标阈值上限时,在步骤S3中,通过以下公式计算所述网元指标未超出阈值范围时的健康度损减分数:
SL=(rrd)2/(tu)2×(4-wl)×10
其中:rrd为网元指标性能值,tu为指标阈值上限,wl为告警等级。
7.如权利要求1所述的服务器健康度评估方法,其特征在于,当所述网元指标设置了多个告警等级,且每一所述告警等级的指标阈值均包括指标阈值上限和指标阈值下限时,在步骤S3中,通过以下公式计算所述网元指标未超出阈值范围时的健康度损减分数:
SL=(rrd-max(td))2/(min(tu)-max(td))2×(4-wl)×10
其中:rrd为网元指标性能值,tu为指标阈值上限,td为指标阈值下限,wl为告警严重程度最低的告警等级。
8.如权利要求1所述的服务器健康度评估方法,其特征在于,当所述网元指标设置了多个告警等级,且每一所述告警等级的指标阈值仅包括指标阈值上限时,在步骤S3中,通过以下公式计算所述网元指标未超出阈值范围时的健康度损减分数:
SL=(rrd)2/(min(tu))2×(4-wl)×10
其中:rrd为网元指标性能值,tu为指标阈值上限,wl为告警严重程度最低的告警等级。
9.如权利要求1所述的服务器健康度评估方法,其特征在于,在步骤S4中,通过以下步骤确定每一所述网元指标的权重:
S41:根据所述网元指标性能值是否超出指标阈值上限或低于阈值下限,将所述网元指标分为A类网元指标、B类网元指标,其中,所述A类网元指标超出指标阈值上限或低于指标阈值下限,所述B类网元指标未超出指标阈值上限或未低于指标阈值下限;
S42:将所述A类网元指标权重均设置为1;
S43:在所述B类网元指标中,将所述网元指标损减分数最大的权重设置为1,损减分数次之的权重设置为1/2,损减分数大小第3的权重设置为1/3,以此类推;
S44:根据公式S=100-∑SLA-∑SLB/n计算所述服务器的健康度,其中SLA为所述A类网元指标健康度损减分数,SLB为所述B类网元指标健康度损减分数,所述B类网元指标损减分数最大者n为1,损减分数次之者n为2,损减分数再次之者n为3,以此类推。
CN201611139559.8A 2016-12-12 2016-12-12 一种服务器健康度评估方法 Active CN106776214B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611139559.8A CN106776214B (zh) 2016-12-12 2016-12-12 一种服务器健康度评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611139559.8A CN106776214B (zh) 2016-12-12 2016-12-12 一种服务器健康度评估方法

Publications (2)

Publication Number Publication Date
CN106776214A true CN106776214A (zh) 2017-05-31
CN106776214B CN106776214B (zh) 2019-03-01

Family

ID=58880064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611139559.8A Active CN106776214B (zh) 2016-12-12 2016-12-12 一种服务器健康度评估方法

Country Status (1)

Country Link
CN (1) CN106776214B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107391336A (zh) * 2017-06-21 2017-11-24 华迪计算机集团有限公司 一种用于对服务器的运行状态进行监控的系统及方法
CN107391351A (zh) * 2017-07-04 2017-11-24 云南电网有限责任公司临沧供电局 一种计算机设备健康状态评估方法
CN108388503A (zh) * 2018-02-13 2018-08-10 中体彩科技发展有限公司 数据库性能监控方法、系统、设备及计算机可读存储介质
CN109144816A (zh) * 2018-08-01 2019-01-04 郑州云海信息技术有限公司 一种节点健康度检测方法和系统
CN109542742A (zh) * 2018-11-14 2019-03-29 国网江苏省电力有限公司信息通信分公司 基于专家模型的数据库服务器硬件健康评估方法
CN110166264A (zh) * 2018-02-11 2019-08-23 北京三快在线科技有限公司 一种故障定位方法、装置及电子设备
CN111274087A (zh) * 2020-01-15 2020-06-12 国网湖南省电力有限公司 一种it集中监控的业务系统的健康度评估方法
CN111949498A (zh) * 2020-08-10 2020-11-17 中国工商银行股份有限公司 应用服务器异常预测方法及系统
CN113328885A (zh) * 2021-05-27 2021-08-31 中国工商银行股份有限公司 网络健康度评估方法、装置、电子设备、介质和程序产品
CN113487316A (zh) * 2021-07-22 2021-10-08 银清科技有限公司 分布式支付系统安全处理方法及装置
CN113764025A (zh) * 2020-06-30 2021-12-07 北京沃东天骏信息技术有限公司 一种故障磁盘的处理方法和装置
CN113778627A (zh) * 2021-09-10 2021-12-10 龙坤(无锡)智慧科技有限公司 一种创建云资源的调度方法
CN117312091A (zh) * 2023-10-20 2023-12-29 速度科技股份有限公司 一种基于数据分析的平台端智能监控系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081622A (zh) * 2009-11-30 2011-06-01 中国移动通信集团贵州有限公司 评估系统健康度的方法及系统健康度评估装置
CN102123052A (zh) * 2011-03-30 2011-07-13 北京星网锐捷网络技术有限公司 业务系统可用性评估方法及系统
CN103259682A (zh) * 2013-05-16 2013-08-21 浪潮通信信息系统有限公司 一种基于多维数据聚合的通信网网元安全评估方法
CN105095747A (zh) * 2014-04-15 2015-11-25 阿里巴巴集团控股有限公司 一种Java应用健康度评估方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081622A (zh) * 2009-11-30 2011-06-01 中国移动通信集团贵州有限公司 评估系统健康度的方法及系统健康度评估装置
CN102123052A (zh) * 2011-03-30 2011-07-13 北京星网锐捷网络技术有限公司 业务系统可用性评估方法及系统
CN103259682A (zh) * 2013-05-16 2013-08-21 浪潮通信信息系统有限公司 一种基于多维数据聚合的通信网网元安全评估方法
CN105095747A (zh) * 2014-04-15 2015-11-25 阿里巴巴集团控股有限公司 一种Java应用健康度评估方法及系统

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107391336A (zh) * 2017-06-21 2017-11-24 华迪计算机集团有限公司 一种用于对服务器的运行状态进行监控的系统及方法
CN107391351A (zh) * 2017-07-04 2017-11-24 云南电网有限责任公司临沧供电局 一种计算机设备健康状态评估方法
CN110166264A (zh) * 2018-02-11 2019-08-23 北京三快在线科技有限公司 一种故障定位方法、装置及电子设备
CN108388503A (zh) * 2018-02-13 2018-08-10 中体彩科技发展有限公司 数据库性能监控方法、系统、设备及计算机可读存储介质
CN109144816A (zh) * 2018-08-01 2019-01-04 郑州云海信息技术有限公司 一种节点健康度检测方法和系统
CN109542742A (zh) * 2018-11-14 2019-03-29 国网江苏省电力有限公司信息通信分公司 基于专家模型的数据库服务器硬件健康评估方法
CN111274087A (zh) * 2020-01-15 2020-06-12 国网湖南省电力有限公司 一种it集中监控的业务系统的健康度评估方法
CN111274087B (zh) * 2020-01-15 2023-04-07 国网湖南省电力有限公司 一种it集中监控的业务系统的健康度评估方法
CN113764025A (zh) * 2020-06-30 2021-12-07 北京沃东天骏信息技术有限公司 一种故障磁盘的处理方法和装置
CN111949498A (zh) * 2020-08-10 2020-11-17 中国工商银行股份有限公司 应用服务器异常预测方法及系统
CN113328885A (zh) * 2021-05-27 2021-08-31 中国工商银行股份有限公司 网络健康度评估方法、装置、电子设备、介质和程序产品
CN113328885B (zh) * 2021-05-27 2022-09-27 中国工商银行股份有限公司 网络健康度评估方法、装置、电子设备、介质和程序产品
CN113487316A (zh) * 2021-07-22 2021-10-08 银清科技有限公司 分布式支付系统安全处理方法及装置
CN113487316B (zh) * 2021-07-22 2024-05-03 银清科技有限公司 分布式支付系统安全处理方法及装置
CN113778627A (zh) * 2021-09-10 2021-12-10 龙坤(无锡)智慧科技有限公司 一种创建云资源的调度方法
CN113778627B (zh) * 2021-09-10 2024-03-12 龙坤(无锡)智慧科技有限公司 一种创建云资源的调度方法
CN117312091A (zh) * 2023-10-20 2023-12-29 速度科技股份有限公司 一种基于数据分析的平台端智能监控系统
CN117312091B (zh) * 2023-10-20 2024-09-27 速度科技股份有限公司 一种基于数据分析的平台端智能监控系统

Also Published As

Publication number Publication date
CN106776214B (zh) 2019-03-01

Similar Documents

Publication Publication Date Title
CN106776214A (zh) 一种服务器健康度评估方法
US10878102B2 (en) Risk scores for entities
US11212316B2 (en) Control maturity assessment in security operations environments
CN105282131B (zh) 基于风险项扫描的信息安全评估方法、装置及系统
CN105407103A (zh) 一种基于多粒度异常检测的网络威胁评估方法
CN104809051B (zh) 用于预测计算机应用中的异常和故障的方法和装置
US9070121B2 (en) Approach for prioritizing network alerts
US9692779B2 (en) Device for quantifying vulnerability of system and method therefor
US8874642B2 (en) System and method for managing the performance of an enterprise application
CN105357063B (zh) 一种网络空间安全态势实时检测方法
CN112596990B (zh) 告警风暴的处理方法、装置及终端设备
US11997140B2 (en) Ordering security incidents using alert diversity
CN108228412A (zh) 一种基于系统健康度监测系统故障及隐患的方法及装置
CN108848069A (zh) 一种基于大数据的电力网络信息安全主动防御系统
US20130318609A1 (en) Method and apparatus for quantifying threat situations to recognize network threat in advance
CN103999316B (zh) 用于产生说明在供电网中的摆动的信号的方法
CN106933677A (zh) 系统异常处理方法及装置
CN118041581A (zh) 基于人工智能的网络安全态势预测方法及系统
CN111897700B (zh) 应用指标监控方法及装置、电子设备和可读存储介质
CN113988183A (zh) 一种计算机网络数据流量监测系统及方法
CN105825130B (zh) 一种信息安全预警方法及装置
CN106407488B (zh) 发动机失效风险评估方法和系统
RU2687848C1 (ru) Способ и система вибромониторинга промышленной безопасности динамического оборудования опасных производственных объектов
US20170372334A1 (en) Agent-based monitoring of an application management system
EP3457609B1 (en) System and method for computing of anomalies based on frequency driven transformation and computing of new features based on point anomaly density

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant