CN113821403A - 一种服务器监控方法、装置、电子设备及存储介质 - Google Patents
一种服务器监控方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113821403A CN113821403A CN202111006714.XA CN202111006714A CN113821403A CN 113821403 A CN113821403 A CN 113821403A CN 202111006714 A CN202111006714 A CN 202111006714A CN 113821403 A CN113821403 A CN 113821403A
- Authority
- CN
- China
- Prior art keywords
- server
- alarm information
- operation data
- component
- fault type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000004458 analytical method Methods 0.000 claims abstract description 35
- 230000002159 abnormal effect Effects 0.000 claims abstract description 30
- 238000001514 detection method Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 8
- 108010028984 3-isopropylmalate dehydratase Proteins 0.000 claims 1
- 238000012806 monitoring device Methods 0.000 abstract description 6
- 238000012423 maintenance Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 5
- 238000013024 troubleshooting Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/327—Alarm or error message display
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供了一种服务器监控方法、装置、电子设备及存储介质,方法包括:获取服务器中的Trap告警信息及各部件的运行数据;对Trap告警信息进行解析得到解析结果,对运行数据进行检测,并在运行数据异常时确定运行数据对应部件的故障类型;根据故障类型或解析结果生成对应的告警信息并输出。本发明可自动收集服务器中的Trap告警信息以及各部件的运行数据,并可自动解析和分析Trap告警信息及运行数据,并在确定运行数据存在异常时,针对性地确定异常数据对应部件的故障类型,并根据Trap报警信息的解析结果或故障类型生成对应的告警信息,可实现对服务器的全方位监控,避免人工监控的负担,可有效提升服务器监控效率。
Description
技术领域
本发明涉及服务器领域,特别涉及一种服务器监控方法、装置、电子设备及计算机可读存储介质。
背景技术
服务器监控是服务器运营维护工作中的重要内容,对及时排查服务器故障、保障服务器稳定运行具有重要意义。在大型数据中心中,服务器设备的数量较多,若由运维人员手动收集服务器的运行数据,则会产生繁重的监控工作;同时,服务器内部部件较多,且每一部件都对应了不同类型的运行数据,这进一步加重了运维人员监控服务器运行状态以及排查服务器运行故障的负担。
发明内容
本发明的目的是提供一种服务器监控方法、装置、电子设备及计算机可读存储介质,可自动收集和分析服务器中的Trap告警信息以及各部件的运行数据,并可根据Trap报警信息的解析结果或异常的运行数据生成对应的告警信息,可实现对服务器的全方位监控,避免人工监控的负担,进而有效提升服务器监控效率。
为解决上述技术问题,本发明提供一种服务器监控方法,包括:
获取服务器中的Trap告警信息及各部件的运行数据;
对所述Trap告警信息进行解析得到解析结果,对所述运行数据进行检测,并在所述运行数据异常时确定所述运行数据对应部件的故障类型;
根据所述故障类型或所述解析结果生成对应的告警信息并输出。
可选地,所述获取服务器中各部件的运行数据,包括:
周期性地利用SNMP和/或IPMI协议向所述服务器获取所述运行数据。
可选地,所述获取服务器中各部件的运行数据,包括:
接收所述服务器中的预设代理软件所发送的运行数据。
可选地,当所述运行数据包括运行状态、运行温度及资源占用率时,所述对所述运行数据进行检测,并在所述运行数据异常时确定所述运行数据对应部件的故障类型,包括:
根据所述运行状态判断所述部件是否运行,并在判定所述部件未运行时确定所述故障类型为未启动;
判断所述运行温度是否符合第一预设阈值要求时,并在判定不符合时确定所述故障类型为运行温度异常;
判断所述资源占用率是否符合第二预设阈值要求时,并在判定不符合时确定所述故障类型为资源占用异常。
可选地,所述对所述Trap告警信息进行解析得到解析结果,包括:
根据预设文档对所述Trap告警信息进行解析得到所述解析结果。
可选地,在获取服务器中的Trap告警信息之前,还包括:
在所述服务器中设置预设地址,以使所述服务器向所述预设地址发送所述Trap告警信息;
相应地,所述获取服务器中各部件的运行数据,包括:
通过监听所述预设地址的方式获取所述Trap告警信息。
可选地,在根据所述故障类型或所述解析结果生成对应的告警信息之后,还包括:
将所述告警信息保存至数据库。
本发明还提供一种服务器监控装置,包括:
获取模块,用于获取服务器中的Trap告警信息及各部件的运行数据;
检测模块,用于对所述Trap告警信息进行解析得到解析结果,对所述运行数据进行检测,并在所述运行数据异常时确定所述运行数据对应部件的故障类型;
告警生成模块,用于根据所述故障类型或所述解析结果生成对应的告警信息并输出。
本发明还提供一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述所述的服务器监控方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上述所述的服务器监控方法。
本发明提供了一种服务器监控方法,包括:获取服务器中的Trap告警信息及各部件的运行数据;对所述Trap告警信息进行解析得到解析结果,对所述运行数据进行检测,并在所述运行数据异常时确定所述运行数据对应部件的故障类型;根据所述故障类型或所述解析结果生成对应的告警信息并输出。
可见,本发明首先可自动收集服务器中的Trap告警信息以及各部件的运行数据,并进行自动检测,无需进行人工操作,不仅能够对服务器的运行信息进行全方位监控,同时也能够有效提升服务器监控的效率,避免人工收集及检测服务器运行数据为运营维护人员所带来的负担;同时,本发明可自动解析Trap报警信息的内容,以及在确定运行数据存在异常时,针对性地确定异常运行数据对应部件的故障类型,并根据Trap报警信息的解析结果或故障类型生成对应的告警信息,避免人工排查及分析多种不同类型的运行数据带来的工作负担,可进一步提升运营维护人员监控服务器运行状态及排查服务器运行故障的效率。本发明还提供一种服务器监控装置、电子设备及存储介质,具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的一种服务器监控方法的流程图;
图2为本发明实施例所提供的一种服务器监控系统的结构框图;
图3为本发明实施例所提供的一种服务器监控装置的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
服务器监控是服务器运营维护工作中的重要内容,对及时排查服务器故障、保障服务器稳定运行具有重要意义。在大型数据中心中,服务器设备的数量较多,若由运维人员手动收集服务器的运行数据,则会产生繁重的监控工作;同时,服务器内部部件较多,且每一部件都对应了不同类型的运行数据,这进一步加重了运维人员监控服务器运行状态以及排查服务器运行故障的负担。有鉴于此,本发明提供一种服务器监控方法,可自动收集和分析服务器中的Trap告警信息以及各部件的运行数据,并可根据Trap报警信息的解析结果或异常的运行数据生成对应的告警信息,可实现对服务器的全方位监控,避免人工监控的负担,进而有效提升服务器监控效率。请参考图1,图1为本发明实施例所提供的一种服务器监控方法的流程图,该方法可以包括:
S101、获取服务器中的Trap告警信息及各部件的运行数据。
在本发明实施例中,将会自动向服务器获取两类数据:Trap告警信息及服务器各部件的运行数据,其中Trap告警信息是由服务器在特定事件发生时(如性能异常、网络设备离线等)所自行产生的告警通知信息。换而言之,本发明实施例不仅主动监测服务器的运行数据,同时也监测服务器所自动生成的告警信息,进而能够全方位地监测服务器运行状态,确保服务器平稳运行。
需要说明的是,本发明实施例并不限定Trap告警信息的获取方式,可参考SNMPTrap的相关技术,其中SNMP(Simple Network Management Protocol)为简单网络管理协议。可以理解的是,由于Trap告警信息由服务器主动发送,因此需要为服务器配置指定的地址,以便服务器向该地址发送Trap告警信息,同时也可通过监听该地址的方式获取到Trap告警信息。
在一种可能的情况中,在获取服务器中的Trap告警信息之前,还可以包括:
步骤11:在服务器中设置预设地址,以使服务器向预设地址发送Trap告警信息;
相应地,获取服务器中各部件的运行数据,包括:
步骤21:通过监听预设地址的方式获取Trap告警信息。
需要说明的是,本发明实施例并不限定为服务器配置发送Trap告警信息预设地址的具体方式,同样可参考SNMP的相关技术。
进一步,本发明实施例并不限定主动获取各部件运行数据的方式,例如可通过SNMP协议进行获取,当然也可以通过IPMI协议进行获取,其中IPMI(Intelligent PlatformManagement Interface,智能平台管理接口)是一种工业通信协议。本发明实施例并不限定如何使用SNMP协议获取运行数据,例如可使用SNMP工具(snmputil)以及OID进行获取,其中OID(Object Identifier)为对象标识符,在SNMP协议中通常使用OID唯一标识服务器部件及部件的各种信息(如基本信息及运行数据);本发明实施例也不限定利用IPMI协议获取运行数据的具体方式,例如可采用ipmitool工具进行获取,可参考IPMI的相关技术。
进一步,需要说明的是,本发明实施例并不限定主动获取服务器运行数据的时机,例如可实时获取,也可以周期性获取。在本发明实施例中,为了降低数据获取所造成的运行负荷,将周期性地利用SNMP协议以及IPMI协议向服务器获取运行数据。需要说明的是,本发明实施例并不限定具体的周期数值,可根据实际应用需求进行设定。
在一种可能的情况中,获取服务器中各部件的运行数据,可以包括:
步骤31:周期性地利用SNMP和/或IPMI协议向服务器获取运行数据。
当然,除上述主动获取运行数据的方式外,还可在各台服务器中部署代理软件,并利用代理软件主动上传运行数据。本发明实施例并不限定具体的代理软件,例如可以为ServerAgent、nmon等,其中ServerAgent、nmon均为可在服务器上部署的监控代理插件软件,可参考服务器资源监控工具的相关技术。
在一种可能的情况中,获取服务器中各部件的运行数据,可以包括:
步骤41:接收服务器中的预设代理软件所发送的运行数据。
进一步,可以理解的是,步骤S101可设置单独的采集模块处理,而采集模块的数量可以为多个,以便扩大对服务器的监控范围。
进一步,需要说明的是,本发明实施例并不限定具体的运行数据类型,例如可以为各部件是否运行、具体的运行温度、资源占用率等,可根据实际应用需求进行选择;本发明也不限定具体的部件,例如可以为CPU、磁盘、内存等,同样可根据实际应用需求进行选择。
S102、对Trap告警信息进行解析得到解析结果,对运行数据进行检测,并在运行数据异常时确定运行数据对应部件的故障类型。
在本发明实施例中,在采集到Trap告警信息及运行数据后,会自动对其进行解析和分析,以便及时生成告警信息并提示运维人员。需要说明的是,由于Trap告警信息属于SNMP协议的功能之一,而SNMP使用OID标识各种类型的数据,因此在Trap告警信息中一般包含多个OID信息;同时,不同厂家会使用不同的OID标识不同的运行数据,因此需要根据各厂家所设定的运行数据与OID的对应关系设置预设文档,进而才可利用预设文档对Trap告警信息进行解析,得到Trap告警信息所包含的内容。
在一种可能的情况中,对Trap告警信息进行解析得到解析结果,可以包括:
步骤51:根据预设文档对Trap告警信息进行解析得到解析结果。
进一步,本发明实施例并不限定运行数据的检测方式,该检测方式与运行数据的类型有关,例如当运行数据为标识信息时(如标识部件是否运行的运行状态信息),可根据该标识的具体内容确定其对应的部件状态;当运行数据为具体的数值时(如运行温度、资源占用率等),也可以设置预设阈值,并利用预设阈值进行检测。进一步,考虑到运行状态、运行温度(如CPU温度)及资源占用率(如CPU占用率、内存占用率及磁盘占用率)为一般服务器部件所普遍拥有的数据类型,因此在本发明实施例中,可根据运行状态、运行温度及资源占用率进行检测。
在一种可能的情况中,当运行数据包括运行状态、运行温度及资源占用率时,对运行数据进行检测,并在运行数据异常时确定运行数据对应部件的故障类型,包括:
步骤61:根据运行状态判断部件是否运行,并在判定部件未运行时确定故障类型为未启动;
步骤62:判断运行温度是否符合第一预设阈值要求时,并在判定不符合时确定故障类型为运行温度异常;
需要说明的是,本发明实施例并不限定第一预设阈值的具体数值,可根据实际应用需求进行设置。本发明实施例也不限定如何判断运行温度是否符合第一预设阈值要求时,例如可判断运行温度是否大于第一预设阈值,若大于则判定不符合要求;当然,也可设置多个连续的阈值区间,并根据运行温度所处的阈值区间,确定该运行温度所对应的异常类型,如多级别异常等。
步骤63:判断资源占用率是否符合第二预设阈值要求时,并在判定不符合时确定故障类型为资源占用异常。
需要说明的是,本发明实施例并不限定第二预设阈值的具体数值,可根据实际应用需求进行设置;本发明实施例也不限定如何判断运行温度是否符合第二预设阈值要求时,可参考上述对第一预设阈值的描述。
S103、根据故障类型或解析结果生成对应的告警信息并输出。
需要说明的是,本发明实施例并不限定具体的输出方式,例如可通过邮件、短信的方式,将告警信息发送至运营人员指定的终端设备上;当然,也可以通过可视化图表的形式,输出至前端的可视化页面中。本发明实施例并不限定具体的可视化图表,例如可以为线图,面积图,柱状图和饼图等。
进一步,在得到告警信息后,也可将其保存至数据库中,以便运营人员查阅;当然,也可以将生成告警信息时所对应的运行数据保存至数据库,以便进一步提升运营人员排查服务器故障的效率。本发明实施例并不限定具体的数据库,例如可以为MySQL,其中MySQL为一种关系型数据库;而异常的运行数据可利用InfluxDB时序型数据库进行存储。
在一种可能的情况中,在根据故障类型或解析结果生成对应的告警信息之后,还可以包括:
步骤71:将告警信息保存至数据库。
基于上述实施例,本发明首先可自动收集服务器中的Trap告警信息以及各部件的运行数据,并进行自动检测,无需进行人工操作,不仅能够对服务器的运行信息进行全方位监控,同时也能够有效提升服务器监控的效率,避免人工收集及检测服务器运行数据为运营维护人员所带来的负担;同时,本发明可自动解析Trap报警信息的内容,以及在确定运行数据存在异常时,针对性地确定异常运行数据对应部件的故障类型,并根据Trap报警信息的解析结果或故障类型生成对应的告警信息,避免人工排查及分析多种不同类型的运行数据带来的工作负担,可进一步提升运营维护人员监控服务器运行状态及排查服务器运行故障的效率。
下面基于具体的结构图介绍上述服务器监控方法。请参考图2,图2为本发明实施例所提供的一种服务器监控系统的结构框图。本系统共分为采集模块、分析模块、通知模块和WEB模块四大模块,其中,采集模块包含采集装置、数据转换装置及Trap告警接收器,采集装置用于利用SNMP协议和IPMI协议收集服务器各部件的运行数据,数据转换装置用于转换采集装置所收集的数据,同时也转换由服务器中的代理软件所上传的运行数据,Trap告警接收器用于接收Trap告警信息。分析模块包含数据分析装置和Trap告警分析转换装置,其中分析装置用于分析运行数据,并在确定运行数据异常时,确定故障类型及对应的告警信息,并将告警信息及异常的运行数据(即性能数据)保存至数据库;而Trap告警分析转换装置则用于根据预设文档转换Trap告警信息,得到对应的告警信息,并保存至数据库。通知模块,用于通过邮件及短信的形式通知运营维护人员。页面模块(WEB模块),包含阈值规则配置装置、监控数据展示装置及告警展示装置,其中阈值规则配置装置用于设置数据分析装置所需的阈值信息;监控数据展示装置及告警展示装置均用于数据展示。
下面对本发明实施例提供的服务器监控装置、电子设备及计算机可读存储介质进行介绍,下文描述的服务器监控装置、电子设备及计算机可读存储介质与上文描述的服务器监控方法可相互对应参照。
请参考图3,图3为本发明实施例所提供的一种服务器监控装置的结构框图,该装置可以包括:
获取模块301,用于获取服务器中的Trap告警信息及各部件的运行数据;
检测模块302,用于对Trap告警信息进行解析得到解析结果,对运行数据进行检测,并在运行数据异常时确定运行数据对应部件的故障类型;
告警生成模块303,用于根据故障类型或解析结果生成对应的告警信息并输出。
可选地,获取模块301,可以包括:
第一获取子模块,用于周期性地利用SNMP和/或IPMI协议向服务器获取运行数据。
可选地,获取模块301,可以包括:
第二获取子模块,用于接收服务器中的预设代理软件所发送的运行数据。
可选地,检测模块302,可以包括:
第一判定子模块,用于根据运行状态判断部件是否运行,并在判定部件未运行时确定故障类型为未启动;
第二判定子模块,用于判断运行温度是否符合第一预设阈值要求时,并在判定不符合时确定故障类型为运行温度异常;
第三判定子模块,用于判断资源占用率是否符合第二预设阈值要求时,并在判定不符合时确定故障类型为资源占用异常。
可选地,检测模块302,可以包括:
解析子模块,用于根据预设文档对Trap告警信息进行解析得到解析结果。
可选地,该装置还可以包括:
设置模块,用于在服务器中设置预设地址,以使服务器向预设地址发送Trap告警信息;
相应地,获取模块301,可以包括:
第三获取子模块,用于通过监听预设地址的方式获取Trap告警信息。
可选地,该装置还可以包括:
保存模块,用于将告警信息保存至数据库。
本发明实施例还提供一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行计算机程序时实现如上述的服务器监控方法的步骤。
由于电子设备部分的实施例与服务器监控方法部分的实施例相互对应,因此电子设备部分的实施例请参见服务器监控方法部分的实施例的描述,这里暂不赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述任意实施例的服务器监控方法的步骤。
由于计算机可读存储介质部分的实施例与服务器故障检测方法部分的实施例相互对应,因此存储介质部分的实施例请参见服务器监控方法部分的实施例的描述,这里暂不赘述。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种服务器监控方法、装置、电子设备及存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (10)
1.一种服务器监控方法,其特征在于,包括:
获取服务器中的Trap告警信息及各部件的运行数据;
对所述Trap告警信息进行解析得到解析结果,对所述运行数据进行检测,并在所述运行数据异常时确定所述运行数据对应部件的故障类型;
根据所述故障类型或所述解析结果生成对应的告警信息并输出。
2.根据权利要求1所述的服务器监控方法,其特征在于,所述获取服务器中各部件的运行数据,包括:
周期性地利用SNMP和/或IPMI协议向所述服务器获取所述运行数据。
3.根据权利要求1所述的服务器监控方法,其特征在于,所述获取服务器中各部件的运行数据,包括:
接收所述服务器中的预设代理软件所发送的运行数据。
4.根据权利要求1所述的服务器监控方法,其特征在于,当所述运行数据包括运行状态、运行温度及资源占用率时,所述对所述运行数据进行检测,并在所述运行数据异常时确定所述运行数据对应部件的故障类型,包括:
根据所述运行状态判断所述部件是否运行,并在判定所述部件未运行时确定所述故障类型为未启动;
判断所述运行温度是否符合第一预设阈值要求时,并在判定不符合时确定所述故障类型为运行温度异常;
判断所述资源占用率是否符合第二预设阈值要求时,并在判定不符合时确定所述故障类型为资源占用异常。
5.根据权利要求1所述的服务器监控方法,其特征在于,所述对所述Trap告警信息进行解析得到解析结果,包括:
根据预设文档对所述Trap告警信息进行解析得到所述解析结果。
6.根据权利要求1所述的服务器监控方法,其特征在于,在获取服务器中的Trap告警信息之前,还包括:
在所述服务器中设置预设地址,以使所述服务器向所述预设地址发送所述Trap告警信息;
相应地,所述获取服务器中各部件的运行数据,包括:
通过监听所述预设地址的方式获取所述Trap告警信息。
7.根据权利要求1所述的服务器监控方法,其特征在于,在根据所述故障类型或所述解析结果生成对应的告警信息之后,还包括:
将所述告警信息保存至数据库。
8.一种服务器监控装置,其特征在于,包括:
获取模块,用于获取服务器中的Trap告警信息及各部件的运行数据;
检测模块,用于对所述Trap告警信息进行解析得到解析结果,对所述运行数据进行检测,并在所述运行数据异常时确定所述运行数据对应部件的故障类型;
告警生成模块,用于根据所述故障类型或所述解析结果生成对应的告警信息并输出。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的服务器监控方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如权利要求1至7任一项所述的服务器监控方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111006714.XA CN113821403A (zh) | 2021-08-30 | 2021-08-30 | 一种服务器监控方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111006714.XA CN113821403A (zh) | 2021-08-30 | 2021-08-30 | 一种服务器监控方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113821403A true CN113821403A (zh) | 2021-12-21 |
Family
ID=78913781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111006714.XA Withdrawn CN113821403A (zh) | 2021-08-30 | 2021-08-30 | 一种服务器监控方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113821403A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115827398A (zh) * | 2023-02-24 | 2023-03-21 | 天翼云科技有限公司 | 告警信息分量值的计算方法、装置、电子设备及存储介质 |
-
2021
- 2021-08-30 CN CN202111006714.XA patent/CN113821403A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115827398A (zh) * | 2023-02-24 | 2023-03-21 | 天翼云科技有限公司 | 告警信息分量值的计算方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108989136B (zh) | 业务端到端性能监控方法及装置 | |
CN111611256B (zh) | 设备能耗监测方法、装置、终端设备及存储介质 | |
CN108965049B (zh) | 提供集群异常解决方案的方法、设备、系统及存储介质 | |
CN108282355B (zh) | 云桌面系统中设备巡检装置 | |
CN104022904A (zh) | 分布式机房it设备统一管理平台 | |
CN110231998B (zh) | 分布式定时任务的检测方法、装置及存储介质 | |
CN112636979B (zh) | 一种集群告警方法及相关装置 | |
CN114996090A (zh) | 一种服务器异常检测方法、装置、电子设备及存储介质 | |
CN110929896A (zh) | 一种系统设备的安全分析方法及装置 | |
CN114024834A (zh) | 故障定位方法、装置、电子设备及可读存储介质 | |
CN113077065A (zh) | 车辆生产线故障的处理方法、装置、设备及存储介质 | |
CN113821403A (zh) | 一种服务器监控方法、装置、电子设备及存储介质 | |
CN115760073A (zh) | 一种基于bim模型的变电站设备维护系统和方法 | |
TWI448975B (zh) | 應用於影像監控平台的分散式運算系統 | |
CN110609761B (zh) | 确定故障源的方法、装置、存储介质和电子设备 | |
CN115242686A (zh) | 一种电力二次设备网络通讯故障检测系统及方法 | |
CN115174189A (zh) | 异常检测方法、装置、电子设备及存储介质 | |
CN102567470A (zh) | 系统级性能数据的处理方法及设备 | |
CN111831515A (zh) | 一种应用系统运行状态监控系统及其监控方法 | |
CN111459752A (zh) | 一种对工作设备的运维方法、装置、服务器及操作终端 | |
CN105005523A (zh) | 基于电流量的计算机软件运行监测方法及装置 | |
CN116016261B (zh) | 一种系统运维方法、装置及设备 | |
CN113965486B (zh) | 一种垂直定位故障的线路探测方法及装置 | |
CN113419927B (zh) | 一种监测和管理控制服务器的方法、系统、设备及介质 | |
CN109474672B (zh) | 业务执行状态的确定方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20211221 |
|
WW01 | Invention patent application withdrawn after publication |