CN114064402A - 服务器系统监控方法 - Google Patents

服务器系统监控方法 Download PDF

Info

Publication number
CN114064402A
CN114064402A CN202111301465.7A CN202111301465A CN114064402A CN 114064402 A CN114064402 A CN 114064402A CN 202111301465 A CN202111301465 A CN 202111301465A CN 114064402 A CN114064402 A CN 114064402A
Authority
CN
China
Prior art keywords
information
server
alarm
short message
adopted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111301465.7A
Other languages
English (en)
Inventor
杨荣霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Big Data Service Co ltd
Original Assignee
China Southern Power Grid Big Data Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Big Data Service Co ltd filed Critical China Southern Power Grid Big Data Service Co ltd
Priority to CN202111301465.7A priority Critical patent/CN114064402A/zh
Publication of CN114064402A publication Critical patent/CN114064402A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Abstract

本申请涉及一种服务器系统监控方法。该方法包括:根据预设时长,定时获取服务器集群的运行信息;若未获取到运行信息,则生成第一告警信息,基于第一告警信息发起告警,第一告警信息用于指示服务器集群的监测功能异常;若获取到运行信息,则对运行信息进行分析;若分析结果为异常,则生成第二告警信息,基于第二告警信息发起告警,第二告警信息用于指示服务器集群运行异常。本发明既能够全面监听系统运行状态信息,获取系统完整信息,又提供了对监听信息的处理分析和直观展现,同时对能实现告警的自动发送至指定运维人员,实现自动运维,使得整个系统的健壮性大大提高。

Description

服务器系统监控方法
技术领域
本申请涉及数据运维技术领域,特别是涉及一种服务器系统监控方法、系统、计算机设备、存储介质和计算机程序产品。
背景技术
随着大数据技术的发展,大数据处理集群越来越大,大数据运营人员的日常运维工作愈加繁重。运维人员需及时了解服务器的资源使用情况,例如,中央处理器CPU、内容、磁盘空间及状况等,对资源指标的异常情况进行处理。
在现有技术中,通过人工或者自动化脚本执行相应的系统命令来实现对服务器的监控,半自动的获取汇总监控信息。然而,随着数据处理集群的增大,信息汇总工作量大,人工运维使得问题数据不能被及时发现,降低了运维监控的效率。
发明内容
基于此,有必要针对上述技术问题,提供一种实现运维监控自动化的服务器系统监控方法。
一种服务器系统监控方法,该方法包括:
根据第一预设时长,定时获取服务器集群的运行信息;
若未获取到运行信息,则生成第一告警信息,基于第一告警信息发起告警,第一告警信息用于指示服务器集群的运行监测功能异常;
若获取到运行信息,则对运行信息进行分析;
若分析结果为异常,则生成第二告警信息,基于第二告警信息发起告警,第二告警信息用于指示服务器集群运行异常。
在其中一个实施例中,运行信息包括服务器集群中各个服务器的状态信息;相应地,根据第一预设时长,定时获取服务器集群的运行信息,还包括:
确定服务器集群中各个服务器的操作系统的应用程序编程接口;
基于第一预设时长,通过每个服务器对应的应用程序编程接口,定时采集每个服务器的状态信息,并由每个服务器的状态信息构成运行信息。
在其中一个实施例中,状态信息包括网络连接状态、中央处理器运行时长及内存占用空间大小;相应地,对运行信息进行分析,还包括:
对运行信息进行解包得到服务器集群中各个服务器的状态信息;
将服务器集群中各个服务器的状态信息分别与预设状态信息进行比对;
若存在与预设状态信息不一致的状态信息,则确定分析结果为异常。
在其中一个实施例中,生成第二告警信息,包括:
将与预设状态信息不一致的状态信息所对应的服务器作为目标服务器,根据目标服务器生成第二告警信息。
在其中一个实施例中,基于第一告警信息发起告警,包括:
若采用网络模式且采用短信告警的方式,则将第一告警信息封装为短信格式并发送至运维端;
若采用网络模式且未采用短信告警的方式,则将第一告警信息通过拨号设备拨打语音电话至运维端;
若未采用网络模式且采用短信告警的方式,则将第一告警信息封装为短信格式并发送至运维端;
若未采用网络模式且未采用短信告警的方式,则将第一告警信息通过拨号设备拨打语音电话至运维端。
在其中一个实施例中,基于第二告警信息发起告警,包括:
若采用网络模式且采用短信告警的方式,则将第二告警信息封装为短信格式并发送至运维端;
若采用网络模式且未采用短信告警的方式,则将第二告警信息通过拨号设备拨打语音电话至运维端;
若未采用网络模式且采用短信告警的方式,则将第二告警信息封装为短信格式并发送至运维端;
若未采用网络模式且未采用短信告警的方式,则将第二告警信息通过拨号设备拨打语音电话至运维端。
一种服务器系统监控系统,该系统包括:
服务器监听系统,用于在监测功能开启时,将服务器集群中各个服务器的属性信息注册到信息处理系统;自动匹配服务器集群中各个服务器的操作系统的应用程序编程接口,通过每个服务器对应的应用程序编程接口实时获取服务器集群中各个服务器的状态信息;根据预设时长,对服务器集群中各个服务器的状态信息进行定时采集,并将采集到的服务器集群中各个服务器的状态信息进行打包得到服务器集群的运行信息;若服务器监听系统与服务器端连接正常,则将服务器集群的运行信息发送至信息处理系统;若服务器监听系统与服务器端未建立连接,则继续进行监测;其中,属性信息包含网络连接协议、用途信息及负责人信息;
信息处理系统,用于后台数据处理、发送告警信息、前端信息查询及信息图表呈现;启动接收监控信息服务,接收由服务器监听系统注册的服务器集群中各个服务器的属性信息并存储至监控列表,根据预设时长,定时获取由服务器监听系统发送的服务器集群的运行信息;若未获取到运行信息,则生成第一告警信息并发送第一告警信息至信息交互系统,第一告警信息用于指示服务器监听系统的监测功能异常;若获取到运行信息,则将运行信息保存至待处理列表,并对运行信息进行分析;若分析结果为异常,则生成第二告警信息并发送第二告警信息至信息交互系统,第二告警信息用于指示服务器集群运行异常;
信息交互系统,用于接收第一告警信息或第二告警信息,并将第一告警信息或第二告警信息封装为短信格式或者转换为语音信息;若信息交互系统采用网络模式且采用短信告警的方式,则将第一告警信息或第二告警信息封装为短信格式并发送至运维端;若信息交互系统采用网络模式且未采用短信告警的方式,则将第一告警信息或第二告警信息通过拨号设备拨打语音电话至运维端;若信息交互系统未采用网络模式且采用短信告警的方式,则将第一告警信息或第二告警信息封装为短信格式并发送至运维端;若信息交互系统未采用网络模式且未采用短信告警的方式,则将第一告警信息或第二告警信息通过拨号设备拨打语音电话至运维端。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
根据预设时长,定时获取服务器集群的运行信息;
若未获取到运行信息,则生成第一告警信息,基于第一告警信息发起告警,第一告警信息用于指示服务器集群的监测功能异常;
若获取到运行信息,则对运行信息进行分析;
若分析结果为异常,则生成第二告警信息,基于第二告警信息发起告警,第二告警信息用于指示服务器集群运行异常。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
根据预设时长,定时获取服务器集群的运行信息;
若未获取到运行信息,则生成第一告警信息,基于第一告警信息发起告警,第一告警信息用于指示服务器集群的监测功能异常;
若获取到运行信息,则对运行信息进行分析;
若分析结果为异常,则生成第二告警信息,基于第二告警信息发起告警,第二告警信息用于指示服务器集群运行异常。
一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
根据预设时长,定时获取服务器集群的运行信息;
若未获取到运行信息,则生成第一告警信息,基于第一告警信息发起告警,第一告警信息用于指示服务器集群的监测功能异常;
若获取到运行信息,则对运行信息进行分析;
若分析结果为异常,则生成第二告警信息,基于第二告警信息发起告警,第二告警信息用于指示服务器集群运行异常。
上述服务器系统监控方法,该方法包括:根据预设时长,定时获取服务器集群的运行信息;若未获取到运行信息,则生成第一告警信息,基于第一告警信息发起告警,第一告警信息用于指示服务器集群的监测功能异常;若获取到运行信息,则对运行信息进行分析;若分析结果为异常,则生成第二告警信息,基于第二告警信息发起告警,第二告警信息用于指示服务器集群运行异常。本发明既能够全面监听系统运行状态信息,获取系统完整信息,又提供了对监听信息的处理分析和直观展现,同时对能实现告警的自动发送至指定运维人员,实现自动运维,使得整个系统的健壮性大大提高。
附图说明
图1为一个实施例中一种服务器系统监控方法的流程示意图;
图2为一个实施例中获取服务器集群的运行信息的流程示意图;
图3为一个实施例中一种服务器系统监控系统的结构框图;
图4为一个实施例中服务器监听系统的流程示意图;
图5为一个实施例中信息处理系统的流程示意图;
图6为一个实施例中信息交互系统的流程示意图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
随着大数据技术的发展,大数据处理集群越来越大,大数据运营人员的日常运维工作愈加繁重。运维人员需及时了解服务器的资源使用情况,例如,中央处理器CPU、内容、磁盘空间及状况等,对资源指标的异常情况进行处理。
在现有技术中,通过人工或者自动化脚本执行相应的系统命令来实现对服务器的监控,半自动的获取汇总监控信息。然而,随着数据处理集群的增大,信息汇总工作量大,人工运维使得问题数据不能被及时发现,属于被动式巡检,不利于运维监控自动化,降低了运维监控的效率。因此,目前急需一种新的服务器系统监控方法。
针对上述相关技术中存在的问题,参见图1,本发明实施例提供了一种服务器系统监控方法。以该方法应用于服务器,且执行主体为服务器为例进行说明,该方法包括如下步骤:
101、根据第一预设时长,定时获取服务器集群的运行信息;
102、若未获取到运行信息,则生成第一告警信息,基于第一告警信息发起告警,第一告警信息用于指示服务器集群的监测功能异常;
103、若获取到运行信息,则对运行信息进行分析;
104、若分析结果为异常,则生成第二告警信息,基于第二告警信息发起告警,第二告警信息用于指示服务器集群运行异常。
在上述步骤101中,服务器集群中包含若干个被监控的服务器,服务器集群的运行信息是由服务器集群中各个服务器的状态信息打包得到的,状态信息包括网络连接状态、中央处理器运行时长及内存占用空间大小。
在上述步骤102中,运行信息是对服务器集群运行监控功能得到的,具体地,实施监控功能的过程为基于第一预设时长,通过每个服务器对应的应用程序编程接口,定时采集每个服务器的状态信息,并将每个服务器的状态信息进行打包得到服务器集群的运行信息。
在上述步骤104中,需要说明的是,对运行信息的分析结果为异常,确定运行信息中异常数据对应的服务器并根据异常数据对应的服务器生成第二告警信息,第二告警信息可以对服务器集群中运行异常的服务器进行指示。
本发明实施例提供的方法,由于通过定时获取服务器集群的运行信息,以是否获取到运行信息为判断标准,若未获取到服务器集群的运行信息,生成第一告警信息并基于第一告警信息发起告警;若获取到运行信息,对运行信息进行分析,若分析结果为异常,生成第二告警信息并基于第二告警信息发起告警,从而实现全面监听服务器系统运行状态信息。获取服务器系统的完整信息,又提供了对监听信息的处理分析和直观展现,同时对能实现告警的自动发送至指定运维人员,实现自动运维,使得整个系统的健壮性大大提高。
结合上述实施例的内容,在一些实施例中,参见图2,运行信息包括服务器集群中各个服务器的状态信息,本发明实施例不对根据第一预设时长,定时获取服务器集群的运行信息的方式作具体限定,包括但不限于:
1011、确定服务器集群中各个服务器的操作系统的应用程序编程接口;
1012、基于第一预设时长,通过每个服务器对应的应用程序编程接口,定时采集每个服务器的状态信息,并由每个服务器的状态信息构成运行信息。
在上述步骤1011及步骤1012中,服务器集群中各个服务器基于操作系统运行,各个版本的操作系统对应有应用程序编程接口。具体地,应用程序编程接口又称为应用编程接口,是软件系统不同组成部分衔接的约定,提供应用程序与开发人员以访问一组例程的能力,而又无需访问源码或理解内部工作机制的细节。
本发明实施例提供的方法,由于可以支持基于操作系统Linux/window各个版本的服务器状态信息获取,并确定服务器集群中各个服务器的操作系统的应用程序编程接口,从而通过每个服务器对应的应用程序编程接口,定时采集每个服务器的状态信息,进而实现对服务器系统状态信息的采集,实现通过不同应用程序编程接口进行信息采集的兼容性。
结合上述实施例的内容,在一些实施例中,状态信息包括网络连接状态、中央处理器运行时长及内存占用空间大小,本发明实施例不对运行信息进行分析的方式作具体限定,包括但不限于:
1031、对运行信息进行解包得到服务器集群中各个服务器的状态信息;
1032、将服务器集群中各个服务器的状态信息分别与预设状态信息进行比对;
1033、若存在与预设状态信息不一致的状态信息,则确定分析结果为异常。
在上述步骤1031中,运行信息是由服务器集群中各个服务器的状态信息打包得到的,需要对获得的运行信息进行解包得到服务器集群中各个服务器的状态信息。
在上述步骤1032中,将服务器集群中各个服务器的网络连接状态、中央处理器运行时长及内存占用空间大小的状态信息与预设状态信息进行对比。
例如,预设状态信息为网络处于连接状态、中央处理器运行时长不超过某一个时长及内存占用空间大小不大于90%。
在上述步骤1033中,若服务器集群中各个服务器的网络连接状态、中央处理器运行时长及内存占用空间大小存在与预设状态信息中不一致的数据,确定分析结果为异常。
例如,若服务器集群中任一服务器的网络未建立连接,或者中央处理器运行时长超过预设状态信息中设置的中央处理器运行时长的上限,或者占用空间大小超过90%,则确定分析结果为异常。
本发明实施例提供的方法,由于通过将服务器集群中各个服务器的状态信息分别与预设状态信息作对比,通过不一致的数据信息确定分析结果为异常,从而实现对于问题数据信息的准确分析,进而实现对服务器系统的监控信息是否异常的准确判断。
结合上述实施例的内容,在一些实施例中,本发明实施例不对生成第二告警信息的方式作具体限定,包括但不限于:
将与预设状态信息不一致的状态信息所对应的服务器作为目标服务器,根据目标服务器生成第二告警信息。
在上述步骤中,与预设状态信息不一致的状态信息即为异常信息,通过异常信息确定服务器集群中运行状态异常的服务器,并作为目标服务器。根据目标服务器生成第二告警信息,第二告警信息可以指示服务器集群中运行异常的服务器。
本发明实施例提供的方法,由于可以根据与预设状态信息不一致的状态信息定位所对应的服务器,并根据定位的服务器生成第二告警信息,从而可以对服务器系统中运行异常的服务器进行快速定位并实现告警,提高了服务器系统运维的效率。
结合上述实施例的内容,在一些实施例中,本发明实施例不对基于第一告警信息发起告警的方式作具体限定,包括但不限于:
1021、若采用网络模式且采用短信告警的方式,则将第一告警信息封装为短信格式并发送至运维端;
1022、若采用网络模式且未采用短信告警的方式,则将第一告警信息通过拨号设备拨打语音电话至运维端;
1023、若未采用网络模式且采用短信告警的方式,则将第一告警信息封装为短信格式并发送至运维端;
1024、若未采用网络模式且未采用短信告警的方式,则将第一告警信息通过拨号设备拨打语音电话至运维端。
在上述步骤1021-1024中,采用网络模式下的短信告警是将第一告警信息封装为短信格式并调用短信平台发送至运维端;采用网络模式且未采用短信告警的方式是将第一告警信息转换为语音信息并调用拨号平台拨打语音电话至运维端;未采用网络模式的短信告警又称离线短信告警,是将第一告警信息封装为短信格式并通过短信猫发送至运维端;未采用网络模式且未采用短信告警的方式是将第一告警信息转换为语音信息并通过电话拨号设备拨打语音电话至运维端。
本发明实施例提供的方法,由于可以根据网络是否连接以及是否采用短信告警选择相应的告警信息发送方式,从而在服务器系统运行指标异常时能及时通过短信及电话的方式通知到运维端,进而及时保证了服务器系统的安全,避免运维故障的扩大化。
结合上述实施例的内容,在一些实施例中,本发明实施例不对基于第二告警信息发起告警的方式作具体限定,包括但不限于:
1041、若采用网络模式且采用短信告警的方式,则将第二告警信息封装为短信格式并发送至运维端;
1042、若采用网络模式且未采用短信告警的方式,则将第二告警信息通过拨号设备拨打语音电话至运维端;
1043、若未采用网络模式且采用短信告警的方式,则将第二告警信息封装为短信格式并发送至运维端;
1044、若未采用网络模式且未采用短信告警的方式,则将第二告警信息通过拨号设备拨打语音电话至运维端。
在上述步骤1041-1044中,采用网络模式下的短信告警是将第二告警信息封装为短信格式并调用短信平台发送至运维端;采用网络模式且未采用短信告警的方式是将第二告警信息转换为语音信息并调用拨号平台拨打语音电话至运维端;未采用网络模式的短信告警又称离线短信告警,是将第二告警信息封装为短信格式并通过短信猫发送至运维端;未采用网络模式且未采用短信告警的方式是将第二告警信息转换为语音信息并通过电话拨号设备拨打语音电话至运维端。
本发明实施例提供的方法,由于可以根据网络是否连接以及是否采用短信告警选择相应的告警信息发送方式,从而在服务器系统运行指标异常时能及时通过短信及电话的方式通知到运维端,进而及时保证了服务器系统的安全,避免运维故障的扩大化。
应该理解的是,虽然图1及图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1及图2中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
需要说明的是,上述阐述的技术方案在实际实施过程中可以作为独立实施例来实施,也可以彼此之间进行组合并作为组合实施例实施。另外,在对上述本发明实施例内容进行阐述时,仅基于方便阐述的思路,按照相应顺序对不同实施例进行阐述,而并非是对不同实施例之间的执行顺序进行限定,也不是对实施例内部步骤的执行顺序进行限定。相应地,在实际实施过程中,若需要实施本发明提供的多个实施例,则不一定需要按照本发明阐述实施例时所提供的执行顺序,而是可以根据需求安排不同实施例之间的执行顺序。
基于同样的发明构思,参见图3,本申请实施例还提供了一种用于实现上述所涉及的服务器系统监控方法的服务器系统监控系统,包括:服务器监听系统301、信息处理系统302、信息交互系统303。参见图4,提供了一种服务器监听系统工作流程图,参见图5,提供了一种信息处理系统工作流程图,参见图6,提供了一种信息交互系统工作流程图,其中:
服务器监听系统301,用于在监测功能开启时,将服务器集群中各个服务器的属性信息注册到信息处理系统;自动匹配服务器集群中各个服务器的操作系统的应用程序编程接口,通过每个服务器对应的应用程序编程接口实时获取服务器集群中各个服务器的状态信息;根据预设时长,对服务器集群中各个服务器的状态信息进行定时采集,并将采集到的服务器集群中各个服务器的状态信息进行打包得到服务器集群的运行信息;若服务器监听系统与服务器端连接正常,则将服务器集群的运行信息发送至信息处理系统;若服务器监听系统与服务器端未建立连接,则继续进行监测;其中,属性信息包含网络连接协议、用途信息及负责人信息;
信息处理系统302,用于后台数据处理、发送告警信息、前端信息查询及信息图表呈现;启动接收监控信息服务,接收由服务器监听系统注册的服务器集群中各个服务器的属性信息并存储至监控列表,根据预设时长,定时获取由服务器监听系统发送的服务器集群的运行信息;若未获取到运行信息,则生成第一告警信息并发送第一告警信息至信息交互系统,第一告警信息用于指示服务器监听系统的监测功能异常;若获取到运行信息,则将运行信息保存至待处理列表,并对运行信息进行分析;若分析结果为异常,则生成第二告警信息并发送第二告警信息至信息交互系统,第二告警信息用于指示服务器集群运行异常;
信息交互系统303,用于接收第一告警信息或第二告警信息,并将第一告警信息或第二告警信息封装为短信格式或者转换为语音信息;若信息交互系统采用网络模式且采用短信告警的方式,则将第一告警信息或第二告警信息封装为短信格式并发送至运维端;若信息交互系统采用网络模式且未采用短信告警的方式,则将第一告警信息或第二告警信息通过拨号设备拨打语音电话至运维端;若信息交互系统未采用网络模式且采用短信告警的方式,则将第一告警信息或第二告警信息封装为短信格式并发送至运维端;若信息交互系统未采用网络模式且未采用短信告警的方式,则将第一告警信息或第二告警信息通过拨号设备拨打语音电话至运维端。
关于一种服务器系统监控系统的具体限定可以参见上文中对于一种服务器系统监控方法的限定,在此不再赘述。上述服务器系统监控系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储预设阈值。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于同步缓存的电网监控系统信息跨区方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
根据第一预设时长,定时获取服务器集群的运行信息;
若未获取到运行信息,则生成第一告警信息,基于第一告警信息发起告警,第一告警信息用于指示服务器集群的运行监测功能异常;
若获取到运行信息,则对运行信息进行分析;
若分析结果为异常,则生成第二告警信息,基于第二告警信息发起告警,第二告警信息用于指示服务器集群运行异常。
在一个实施例中,运行信息包括服务器集群中各个服务器的状态信息,处理器在执行计算机程序时实现以下步骤:
确定服务器集群中各个服务器的操作系统的应用程序编程接口;
基于第一预设时长,通过每个服务器对应的应用程序编程接口,定时采集每个服务器的状态信息,并由每个服务器的状态信息构成运行信息。
在一个实施例中,状态信息包括网络连接状态、中央处理器运行时长及内存占用空间大小,处理器在执行计算机程序时实现以下步骤:
对运行信息进行解包得到服务器集群中各个服务器的状态信息;
将服务器集群中各个服务器的状态信息分别与预设状态信息进行比对;
若存在与预设状态信息不一致的状态信息,则确定分析结果为异常。
在一个实施例中,处理器在执行计算机程序时实现以下步骤:
将与预设状态信息不一致的状态信息所对应的服务器作为目标服务器,根据目标服务器生成第二告警信息。
在一个实施例中,处理器在执行计算机程序时实现以下步骤:
若采用网络模式且采用短信告警的方式,则将第一告警信息封装为短信格式并发送至运维端;
若采用网络模式且未采用短信告警的方式,则将第一告警信息通过拨号设备拨打语音电话至运维端;
若未采用网络模式且采用短信告警的方式,则将第一告警信息封装为短信格式并发送至运维端;
若未采用网络模式且未采用短信告警的方式,则将第一告警信息通过拨号设备拨打语音电话至运维端。
在一个实施例中,处理器在执行计算机程序时实现以下步骤:
若采用网络模式且采用短信告警的方式,则将第二告警信息封装为短信格式并发送至运维端;
若采用网络模式且未采用短信告警的方式,则将第二告警信息通过拨号设备拨打语音电话至运维端;
若未采用网络模式且采用短信告警的方式,则将第二告警信息封装为短信格式并发送至运维端;
若未采用网络模式且未采用短信告警的方式,则将第二告警信息通过拨号设备拨打语音电话至运维端。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
根据第一预设时长,定时获取服务器集群的运行信息;
若未获取到运行信息,则生成第一告警信息,基于第一告警信息发起告警,第一告警信息用于指示服务器集群的运行监测功能异常;
若获取到运行信息,则对运行信息进行分析;
若分析结果为异常,则生成第二告警信息,基于第二告警信息发起告警,第二告警信息用于指示服务器集群运行异常。
在一个实施例中,运行信息包括服务器集群中各个服务器的状态信息,计算机程序被处理器执行时实现以下步骤:
确定服务器集群中各个服务器的操作系统的应用程序编程接口;
基于第一预设时长,通过每个服务器对应的应用程序编程接口,定时采集每个服务器的状态信息,并由每个服务器的状态信息构成运行信息。
在一个实施例中,状态信息包括网络连接状态、中央处理器运行时长及内存占用空间大小,计算机程序被处理器执行时实现以下步骤:
对运行信息进行解包得到服务器集群中各个服务器的状态信息;
将服务器集群中各个服务器的状态信息分别与预设状态信息进行比对;
若存在与预设状态信息不一致的状态信息,则确定分析结果为异常。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:
将与预设状态信息不一致的状态信息所对应的服务器作为目标服务器,根据目标服务器生成第二告警信息。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:
若采用网络模式且采用短信告警的方式,则将第一告警信息封装为短信格式并发送至运维端;
若采用网络模式且未采用短信告警的方式,则将第一告警信息通过拨号设备拨打语音电话至运维端;
若未采用网络模式且采用短信告警的方式,则将第一告警信息封装为短信格式并发送至运维端;
若未采用网络模式且未采用短信告警的方式,则将第一告警信息通过拨号设备拨打语音电话至运维端。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:
若采用网络模式且采用短信告警的方式,则将第二告警信息封装为短信格式并发送至运维端;
若采用网络模式且未采用短信告警的方式,则将第二告警信息通过拨号设备拨打语音电话至运维端;
若未采用网络模式且采用短信告警的方式,则将第二告警信息封装为短信格式并发送至运维端;
若未采用网络模式且未采用短信告警的方式,则将第二告警信息通过拨号设备拨打语音电话至运维端。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
根据第一预设时长,定时获取服务器集群的运行信息;
若未获取到运行信息,则生成第一告警信息,基于第一告警信息发起告警,第一告警信息用于指示服务器集群的运行监测功能异常;
若获取到运行信息,则对运行信息进行分析;
若分析结果为异常,则生成第二告警信息,基于第二告警信息发起告警,第二告警信息用于指示服务器集群运行异常。
在一个实施例中,运行信息包括服务器集群中各个服务器的状态信息,计算机程序被处理器执行时实现以下步骤:
确定服务器集群中各个服务器的操作系统的应用程序编程接口;
基于第一预设时长,通过每个服务器对应的应用程序编程接口,定时采集每个服务器的状态信息,并由每个服务器的状态信息构成运行信息。
在一个实施例中,状态信息包括网络连接状态、中央处理器运行时长及内存占用空间大小,计算机程序被处理器执行时实现以下步骤:
对运行信息进行解包得到服务器集群中各个服务器的状态信息;
将服务器集群中各个服务器的状态信息分别与预设状态信息进行比对;
若存在与预设状态信息不一致的状态信息,则确定分析结果为异常。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:
将与预设状态信息不一致的状态信息所对应的服务器作为目标服务器,根据目标服务器生成第二告警信息。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:
若采用网络模式且采用短信告警的方式,则将第一告警信息封装为短信格式并发送至运维端;
若采用网络模式且未采用短信告警的方式,则将第一告警信息通过拨号设备拨打语音电话至运维端;
若未采用网络模式且采用短信告警的方式,则将第一告警信息封装为短信格式并发送至运维端;
若未采用网络模式且未采用短信告警的方式,则将第一告警信息通过拨号设备拨打语音电话至运维端。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:
若采用网络模式且采用短信告警的方式,则将第二告警信息封装为短信格式并发送至运维端;
若采用网络模式且未采用短信告警的方式,则将第二告警信息通过拨号设备拨打语音电话至运维端;
若未采用网络模式且采用短信告警的方式,则将第二告警信息封装为短信格式并发送至运维端;
若未采用网络模式且未采用短信告警的方式,则将第二告警信息通过拨号设备拨打语音电话至运维端。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(FerroelectricRandom Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(StaticRandom Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种服务器系统监控方法,其特征在于,所述方法包括:
根据预设时长,定时获取服务器集群的运行信息;
若未获取到所述运行信息,则生成第一告警信息,基于所述第一告警信息发起告警,所述第一告警信息用于指示所述服务器集群的监测功能异常;
若获取到所述运行信息,则对所述运行信息进行分析;
若分析结果为异常,则生成第二告警信息,基于所述第二告警信息发起告警,所述第二告警信息用于指示所述服务器集群运行异常。
2.根据权利要求1所述的方法,其特征在于,所述运行信息包括所述服务器集群中各个服务器的状态信息;相应地,所述根据预设时长,定时获取服务器集群的运行信息,包括:
确定所述服务器集群中各个服务器的操作系统的应用程序编程接口;
基于所述预设时长,通过每个服务器对应的应用程序编程接口,定时采集每个服务器的状态信息,并由每个服务器的状态信息构成所述运行信息。
3.根据权利要求2所述的方法,其特征在于,所述状态信息包括网络连接状态、中央处理器运行时长及内存占用空间大小;相应地,所述对所述运行信息进行分析,包括:
对所述运行信息进行解包得到所述服务器集群中各个服务器的状态信息;
将所述服务器集群中各个服务器的状态信息分别与预设状态信息进行比对;
若存在与所述预设状态信息不一致的状态信息,则确定分析结果为异常。
4.根据权利要求3所述的方法,其特征在于,所述生成第二告警信息,包括:
将与所述预设状态信息不一致的状态信息所对应的服务器作为目标服务器,根据所述目标服务器生成所述第二告警信息。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第一告警信息发起告警,包括:
若采用网络模式且采用短信告警的方式,则将所述第一告警信息封装为短信格式并发送至运维端;
若采用网络模式且未采用短信告警的方式,则将所述第一告警信息通过拨号设备拨打语音电话至所述运维端;
若未采用网络模式且采用短信告警的方式,则将所述第一告警信息封装为短信格式并发送至所述运维端;
若未采用网络模式且未采用短信告警的方式,则将所述第一告警信息通过拨号设备拨打语音电话至所述运维端。
6.根据权利要求1所述的方法,其特征在于,所述基于所述第二告警信息发起告警,包括:
若采用网络模式且采用短信告警的方式,则将所述第二告警信息封装为短信格式并发送至所述运维端;
若采用网络模式且未采用短信告警的方式,则将所述第二告警信息通过拨号设备拨打语音电话至所述运维端;
若未采用网络模式且采用短信告警的方式,则将所述第二告警信息封装为短信格式并发送至所述运维端;
若未采用网络模式且未采用短信告警的方式,则将所述第二告警信息通过拨号设备拨打语音电话至所述运维端。
7.一种服务器系统监控系统,其特征在于,所述系统包括服务器监听系统、信息处理系统及信息交互系统:
所述服务器监听系统,用于在监测功能开启时,将服务器集群中各个服务器的属性信息注册到所述信息处理系统;自动匹配所述服务器集群中各个服务器的操作系统的应用程序编程接口,通过每个服务器对应的应用程序编程接口实时获取所述服务器集群中各个服务器的状态信息;根据预设时长,对所述服务器集群中各个服务器的状态信息进行定时采集,并将采集到的所述服务器集群中各个服务器的状态信息进行打包得到所述服务器集群的运行信息;若所述服务器监听系统与服务器端连接正常,则将所述服务器集群的运行信息发送至所述信息处理系统;若所述服务器监听系统与服务器端未建立连接,则继续进行监测;其中,所述属性信息包含网络连接协议、用途信息及负责人信息;
所述信息处理系统,用于后台数据处理、发送告警信息、前端信息查询及信息图表呈现;启动接收监控信息服务,接收由所述服务器监听系统注册的所述服务器集群中各个服务器的属性信息并存储至监控列表,根据所述预设时长,定时获取由所述服务器监听系统发送的所述服务器集群的运行信息;若未获取到所述运行信息,则生成第一告警信息并发送所述第一告警信息至所述信息交互系统,所述第一告警信息用于指示所述服务器监听系统的监测功能异常;若获取到所述运行信息,则将所述运行信息保存至待处理列表,并对所述运行信息进行分析;若分析结果为异常,则生成第二告警信息并发送所述第二告警信息至所述信息交互系统,所述第二告警信息用于指示所述服务器集群运行异常;
所述信息交互系统,用于接收所述第一告警信息或所述第二告警信息,并将所述第一告警信息或所述第二告警信息封装为短信格式或者转换为语音信息;若所述信息交互系统采用网络模式且采用短信告警的方式,则将所述第一告警信息或所述第二告警信息封装为短信格式并发送至运维端;若所述信息交互系统采用网络模式且未采用短信告警的方式,则将所述第一告警信息或所述第二告警信息通过拨号设备拨打语音电话至所述运维端;若所述信息交互系统未采用网络模式且采用短信告警的方式,则将所述第一告警信息或所述第二告警信息封装为短信格式并发送至所述运维端;若所述信息交互系统未采用网络模式且未采用短信告警的方式,则将所述第一告警信息或所述第二告警信息通过拨号设备拨打语音电话至所述运维端。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202111301465.7A 2021-11-04 2021-11-04 服务器系统监控方法 Pending CN114064402A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111301465.7A CN114064402A (zh) 2021-11-04 2021-11-04 服务器系统监控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111301465.7A CN114064402A (zh) 2021-11-04 2021-11-04 服务器系统监控方法

Publications (1)

Publication Number Publication Date
CN114064402A true CN114064402A (zh) 2022-02-18

Family

ID=80273960

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111301465.7A Pending CN114064402A (zh) 2021-11-04 2021-11-04 服务器系统监控方法

Country Status (1)

Country Link
CN (1) CN114064402A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115188092A (zh) * 2022-06-14 2022-10-14 珠海格力电器股份有限公司 设备监管方法、系统、计算机设备和存储介质
CN116743791A (zh) * 2022-09-30 2023-09-12 腾讯云计算(北京)有限责任公司 一种地铁云平台云边同步方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115188092A (zh) * 2022-06-14 2022-10-14 珠海格力电器股份有限公司 设备监管方法、系统、计算机设备和存储介质
CN115188092B (zh) * 2022-06-14 2023-11-10 珠海格力电器股份有限公司 设备监管方法、系统、计算机设备和存储介质
CN116743791A (zh) * 2022-09-30 2023-09-12 腾讯云计算(北京)有限责任公司 一种地铁云平台云边同步方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110661659B (zh) 一种告警方法、装置、系统及电子设备
CN110351150B (zh) 故障根源确定方法及装置、电子设备和可读存储介质
CN114064402A (zh) 服务器系统监控方法
WO2019169765A1 (zh) 电子装置、集群环境下状态信息的获取方法、系统及存储介质
EP3567496A1 (en) Systems and methods for indexing and searching
CN109088775B (zh) 异常监控方法、装置以及服务器
CN111309567A (zh) 数据处理方法、装置、数据库系统、电子设备及存储介质
CN108038039B (zh) 记录日志的方法及微服务系统
EP3809269A1 (en) Monitoring a distributed application server environment
CN112162829B (zh) 一种边缘计算场景下的资源监控数据预处理系统
CN105681128A (zh) 一种用于大数据系统状态监控的方法和装置
CN107885634B (zh) 监控中异常信息的处理方法和装置
CN110245052B (zh) 一种数据系统的热点组件确定方法、装置、电子设备及存储介质
CN110717130A (zh) 打点方法、装置、终端及存储介质
CN116405410A (zh) 一种对仿真应用网络监控的方法、装置、设备和介质
CN115525392A (zh) 容器监控方法、装置、电子设备及存储介质
CN115185778A (zh) 数据库的监控方法及装置
CN113868094A (zh) 一种大数据异常信息监控系统
CN114780378A (zh) 基于业务接口的系统稳定性检测溯源方法及相关设备
CN113608982A (zh) 函数执行性能监测方法、装置、计算机设备及存储介质
CN112416896A (zh) 数据异常的报警方法和装置、存储介质、电子装置
CN110955579A (zh) 一种基于Ambari的大数据平台的监测方法
CN110990237A (zh) 一种信息收集系统、方法及存储介质
CN114090382B (zh) 超融合集群健康巡检方法和装置
CN108449343B (zh) Ssh协议文本数据采集方法、采集器及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination