CN114090369A - 服务实例监控方法、装置与存储介质 - Google Patents
服务实例监控方法、装置与存储介质 Download PDFInfo
- Publication number
- CN114090369A CN114090369A CN202111265247.2A CN202111265247A CN114090369A CN 114090369 A CN114090369 A CN 114090369A CN 202111265247 A CN202111265247 A CN 202111265247A CN 114090369 A CN114090369 A CN 114090369A
- Authority
- CN
- China
- Prior art keywords
- service instance
- check result
- service
- result
- port
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 152
- 238000012544 monitoring process Methods 0.000 title claims abstract description 77
- 230000036541 health Effects 0.000 claims abstract description 131
- 230000008569 process Effects 0.000 claims abstract description 91
- 238000007689 inspection Methods 0.000 claims description 19
- 230000002159 abnormal effect Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 5
- 238000012806 monitoring device Methods 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 3
- 230000003862 health status Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/327—Alarm or error message display
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供一种服务实例监控方法、装置与存储介质,所述方法应用于服务实例检查模块,所述方法包括:接收服务实例管理模块发送的各服务实例的运行状态;基于所述各服务实例的进程检查结果、端口检查结果以及运行状态,确定所述各服务实例的健康检查结果;将所述各服务实例的健康检查结果返回给所述服务实例管理模块,以供所述服务实例管理模块基于所述各服务实例的健康检查结果,向服务器发送告警信息。本发明提供的方法、装置与存储介质,通过基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果,实现了所有服务实例的统一监控,并且,提高了服务实例监控的准确性和即时性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种服务实例监控方法、装置与存储介质。
背景技术
随着服务器上运行的服务实例越来越多,对服务实例进行监控和管理变得尤为重要。
目前,最常见的监控方案是通过服务实例提供专用的http(HyperText TransferProtocol,超文本传输协议)方式监控接口来完成的,但是现阶段并不是所有服务实例都是通过http方式提供服务的,因此,此种监控方案无法统一监控所有服务实例。
发明内容
本发明提供一种服务实例监控方法、装置与存储介质,用以解决现有技术中无法统一监控所有服务实例的缺陷,实现所有服务实例的统一监控。
本发明提供一种服务实例监控方法,所述方法应用于服务实例检查模块,所述方法包括:
接收服务实例管理模块发送的各服务实例的运行状态;
基于所述各服务实例的进程检查结果、端口检查结果以及运行状态,确定所述各服务实例的健康检查结果;
将所述各服务实例的健康检查结果返回给所述服务实例管理模块,以供所述服务实例管理模块基于所述各服务实例的健康检查结果,向服务器发送告警信息。
根据本发明提供的一种服务实例监控方法,所述各服务实例的进程检查结果是基于如下步骤确定的:
向所述服务器发送进程查看命令;
接收所述服务器返回的进程信息;
基于所述进程信息,以及所述各服务实例的标识,确定所述各服务实例的进程检查结果。
根据本发明提供的一种服务实例监控方法,所述各服务实例的端口检查结果是基于如下步骤确定的:
向所述服务器发送所述各服务实例对应的端口查看命令;
接收所述服务器返回的所述各服务实例对应的端口信息;
基于所述各服务实例对应的端口信息,确定所述各服务实例的端口检查结果。
根据本发明提供的一种服务实例监控方法,所述基于所述各服务实例的进程检查结果、端口检查结果以及运行状态,确定所述各服务实例的健康检查结果,包括:
当任一服务实例的运行状态为运行时,若所述任一服务实例的进程检查结果为存在,且所述任一服务实例的端口检查结果为畅通,则所述任一服务实例的健康检查结果为正常,否则,所述任一服务实例的健康检查结果为异常。
根据本发明提供的一种服务实例监控方法,所述基于所述各服务实例的进程检查结果、端口检查结果以及运行状态,确定所述各服务实例的健康检查结果,包括:
当任一服务实例的运行状态为停止时,若所述任一服务实例的进程检查结果为不存在,且所述任一服务实例的端口检查结果为断开,则所述任一服务实例的健康检查结果为正常,否则,所述任一服务实例的健康检查结果为异常。
本发明还提供一种服务实例监控方法,所述方法应用于服务实例管理模块,所述方法包括:
获取各服务实例的运行状态,并将所述各服务实例的运行状态发送至服务实例检查模块,以供所述服务实例检查模块基于所述各服务实例的进程检查结果、端口检查结果以及所述运行状态,确定所述各服务实例的健康检查结果并返回给所述服务实例管理模块;
基于所述各服务实例的健康检查结果,向服务器发送告警信息。
根据本发明提供的一种服务实例监控方法,所述获取各服务实例的运行状态,包括:
获取所述服务器上各服务实例的标识;
从第三方系统获取所述各服务实例的标识对应的运行状态。
本发明还提供一种服务实例监控装置,所述装置应用于服务实例检查模块,所述装置包括:
接收单元,用于接收服务实例管理模块发送的各服务实例的运行状态;
检查单元,用于基于所述各服务实例的进程检查结果、端口检查结果以及运行状态,确定所述各服务实例的健康检查结果;
返回单元,用于将所述各服务实例的健康检查结果返回给所述服务实例管理模块,以供所述服务实例管理模块基于所述各服务实例的健康检查结果,向服务器发送告警信息。
本发明还提供一种服务实例监控装置,所述装置应用于服务实例管理模块,所述装置包括:
获取单元,用于获取各服务实例的运行状态,并将所述各服务实例的运行状态发送至服务实例检查模块,以供所述服务实例检查模块基于所述各服务实例的进程检查结果、端口检查结果以及所述运行状态,确定所述各服务实例的健康检查结果并返回给所述服务实例管理模块;
告警单元,用于基于所述各服务实例的健康检查结果,向服务器发送告警信息。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述服务实例监控方法的步骤。
本发明提供的服务实例监控方法、装置与存储介质,通过基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果,实现了支持非http服务实例以及已停止服务实例的健康检查,进而实现了所有服务实例的统一监控,并且,通过应用服务实例管理模块和服务实例检查模块实现所有服务实例的自动健康检查和监控告警,提高了服务实例监控的准确性和即时性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的服务实例监控方法的流程示意图之一;
图2是本发明提供的服务实例监控方法的流程示意图之二;
图3是本发明提供的服务实例监控方法的流程示意图之三;
图4是本发明提供的健康检查结果确定方法的流程示意图;
图5是本发明提供的服务实例监控装置的结构示意图之一;
图6是本发明提供的服务实例监控装置的结构示意图之二;
图7是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,最常见的服务实例监控方案是通过服务实例提供专用的http方式监控接口来完成的,但是现阶段并不是所有服务实例都是通过http方式提供服务的,因此,此种监控方案无法统一监控所有服务实例。另外,现有的服务实例监控方案通常需要运维人员对服务实例进行异常判断,此种人工判断方式主观性较强,缺乏准确性和即时性,且当需要检查的服务器数量较多或者需要检查的服务实例较多时,花费的时间较长,劳动强度高。
对此,本发明实施例提供了一种服务实例监控方法,旨在解决后台服务器上运行的所有服务实例的自动监控告警问题。图1是本发明提供的服务实例监控方法的流程示意图之一,如图1所示,该方法的执行主体为服务实例检查模块,该方法包括:
步骤110,接收服务实例管理模块发送的各服务实例的运行状态;
步骤120,基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果;
步骤130,将各服务实例的健康检查结果返回给服务实例管理模块,以供服务实例管理模块基于各服务实例的健康检查结果,向服务器发送告警信息。
具体地,本发明实施例通过服务实例管理模块获取当前所有服务实例以及所有服务实例的运行状态,并将其发送给服务实例检查模块,再由服务实例检查模块针对所有服务实例进行健康检查,对于每个服务实例,服务实例检查模块可以根据该服务实例的进程检查结果、端口检查结果以及运行状态,确定该服务实例的健康检查结果。随即,服务实例检查模块将每个服务实例的健康检查结果返回给服务实例管理模块,当服务实例管理模块检测到存在服务实例的健康检查结果为异常时,则可以向该服务实例所属的服务器发送告警信息。
此处,服务实例即可执行服务的实例,此处的服务包括但不限定于例如WEB(WorldWide Web,全球广域网)服务、Email(Electronic Mail,电子邮件)服务、FTP(FileTransfer Protocol,文件传输协议)服务以及数据库服务等服务。所有服务实例可以来源于一个服务器,也可以来源于多个服务器,本发明实施例对此不作具体限定。进程检查结果用于表征服务实例的进程状态,例如服务实例是否正在被执行,端口检查结果用于表征服务实例的端口状态,例如服务实例的端口是否畅通,进程检查结果和端口检查结果具体可以通过服务实例检查模块向服务器发送进程查看命令和端口查看命令获取。健康检查结果用于表征服务实例的健康状态。
进一步地,服务实例管理模块可以每隔预设时间定时获取当前所有服务实例以及所有服务实例的运行状态,也可以基于外部触发的方式启动当前所有服务实例以及所有服务实例的运行状态的获取,本发明实施例对此不作具体限定。此处,预设时间可以根据实际需要进行预先设定,也可以根据经验值进行设置,预设时间的单位可以是天、小时等,本发明实施例对此也不作具体限定。
需要说明的是,区别于现有主流的http方式监控方案,本发明实施例根据服务实例的进程检查结果、端口检查结果以及运行状态,确定服务实例的健康检查结果,从而只需要服务实例检查模块通过一些简单的命令就可以实现服务实例的健康检查,无需服务实例提供专用的接口,非http服务实例的健康检查也可以支持,进而可以实现所有服务实例的统一监控。并且,服务实例的运行状态包括服务实例在服务器中是处于运行还是停止,从而实现支持已停止服务实例的健康检查,进而可以及时发现存在误操作和非法占用的服务实例,避免其对系统造成影响。另外,本发明实施例通过应用服务实例管理模块和服务实例检查模块实现所有服务实例的自动健康检查和监控告警,相比于人工的监控方案,提高了检查结果的准确性,极大地提高了服务实例的监控效率,同时大大降低了运维人员的工作压力。
本发明实施例提供的方法,通过基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果,实现了支持非http服务实例以及已停止服务实例的健康检查,进而实现了所有服务实例的统一监控,并且,通过应用服务实例管理模块和服务实例检查模块实现所有服务实例的自动健康检查和监控告警,提高了服务实例监控的准确性和即时性。
基于上述任一实施例,各服务实例的进程检查结果是基于如下步骤确定的:
向服务器发送进程查看命令;
接收服务器返回的进程信息;
基于进程信息,以及各服务实例的标识,确定各服务实例的进程检查结果。
具体地,各个服务实例的进程检查结果可以通过如下方式得到的:首先,服务实例检查模块向服务器发送进程查看命令,服务器对进程查看命令进行响应,将所有正在运行的进程信息返回给服务实例检查模块,在此基础上,服务实例检查模块即可接收到该进程信息,并在该进程信息中查找各个服务实例的标识,由此确定该进程信息中是否存在各个服务实例对应的进程信息:如果查找到了某个服务实例的标识,即该进程信息中存在该服务实例对应的进程信息,则可以确定该服务实例的进程检查结果为存在;如果没有查找到某个服务实例的标识,即该进程信息中不存在该服务实例对应的进程信息,则可以确定该服务实例的进程检查结果为不存在。
此处,进程查看命令例如可以是ps(Process Status,进程状态)命令、top命令等。服务实例的标识可以是服务实例的ID(Identity document,身份标识号),也可以是其他可唯一识别该服务实例的标记,本发明实施例对此不作具体限定。
基于上述任一实施例,各服务实例的端口检查结果是基于如下步骤确定的:
向服务器发送各服务实例对应的端口查看命令;
接收服务器返回的各服务实例对应的端口信息;
基于各服务实例对应的端口信息,确定各服务实例的端口检查结果。
具体地,各个服务实例的端口检查结果可以通过如下方式得到的:首先,服务实例检查模块向服务器发送针对各个服务实例进行端口检查的端口查看命令,服务器对各个服务实例对应的端口查看命令进行响应,将各个服务实例对应的端口信息返回给服务实例检查模块,在此基础上,服务实例检查模块即可接收到各个服务实例对应的端口信息,并由此确定出各个服务实例的端口检查结果。
此处,端口查看命令例如可以是telnet命令、nmap(Network Mapper,网络映射器)命令等,本发明实施例对此不作具体限定。端口信息即可以推断出端口状态的信息,例如,端口查看命令为telnet命令,端口信息为“无法打开到主机的连接”,则对应服务实例的端口检查结果为断开。
基于上述任一实施例,步骤120包括:
当任一服务实例的运行状态为运行时,若该服务实例的进程检查结果为存在,且该服务实例的端口检查结果为畅通,则该服务实例的健康检查结果为正常,否则,该服务实例的健康检查结果为异常。
具体地,当任意一个服务实例的运行状态为运行时,如果确定出该服务实例的进程检查结果为存在,且该服务实例的端口检查结果为畅通,则说明该服务实例为正常运行,此时服务实例检查模块即可确定该服务实例的健康检查结果为正常,否则,即该服务实例的进程检查结果为不存在,或者该服务实例的端口检查结果为断开,则可以确定该服务实例的健康检查结果为异常。
基于上述任一实施例,步骤120包括:
当任一服务实例的运行状态为停止时,若该服务实例的进程检查结果为不存在,且该服务实例的端口检查结果为断开,则该服务实例的健康检查结果为正常,否则,该服务实例的健康检查结果为异常。
具体地,当任意一个服务实例的运行状态为停止时,如果确定出该服务实例的进程检查结果为不存在,且该服务实例的端口检查结果为断开,则说明该服务实例为正常停止,此时服务实例检查模块即可确定该服务实例的健康检查结果为正常,否则,即该服务实例的进程检查结果为存在,或者该服务实例的端口检查结果为畅通,则可以确定该服务实例的健康检查结果为异常。
基于上述任一实施例,本发明实施例提供了一种服务实例监控方法。图2是本发明提供的服务实例监控方法的流程示意图之二,如图2所示,该方法的执行主体为服务实例管理模块,该方法包括:
步骤210,获取各服务实例的运行状态,并将各服务实例的运行状态发送至服务实例检查模块,以供服务实例检查模块基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果并返回给服务实例管理模块;
步骤220,基于各服务实例的健康检查结果,向服务器发送告警信息。
具体地,本发明实施例通过服务实例管理模块获取当前所有服务实例以及所有服务实例的运行状态,并将其发送给服务实例检查模块,再由服务实例检查模块针对所有服务实例进行健康检查,对于每个服务实例,服务实例检查模块可以根据该服务实例的进程检查结果、端口检查结果以及运行状态,确定该服务实例的健康检查结果。随即,服务实例检查模块将每个服务实例的健康检查结果返回给服务实例管理模块,当服务实例管理模块检测到存在服务实例的健康检查结果为异常时,则可以向该服务实例所属的服务器发送告警信息。
此处,服务实例即可执行服务的实例,此处的服务包括但不限定于例如WEB服务、Email服务、FTP服务以及数据库服务等服务。所有服务实例可以来源于一个服务器,也可以来源于多个服务器,本发明实施例对此不作具体限定。进程检查结果用于表征服务实例的进程状态,例如服务实例是否正在被执行,端口检查结果用于表征服务实例的端口状态,例如服务实例的端口是否畅通,进程检查结果和端口检查结果具体可以通过服务实例检查模块向服务器发送进程查看命令和端口查看命令获取。健康检查结果用于表征服务实例的健康状态。
进一步地,服务实例管理模块可以每隔预设时间定时获取当前所有服务实例以及所有服务实例的运行状态,也可以基于外部触发的方式启动当前所有服务实例以及所有服务实例的运行状态的获取,本发明实施例对此不作具体限定。此处,预设时间可以根据实际需要进行预先设定,也可以根据经验值进行设置,预设时间的单位可以是天、小时等,本发明实施例对此也不作具体限定。
需要说明的是,区别于现有主流的http方式监控方案,本发明实施例根据服务实例的进程检查结果、端口检查结果以及运行状态,确定服务实例的健康检查结果,从而只需要服务实例检查模块通过一些简单的命令就可以实现服务实例的健康检查,无需服务实例提供专用的接口,非http服务实例的健康检查也可以支持,进而可以实现所有服务实例的统一监控。并且,服务实例的运行状态包括服务实例在服务器中是处于运行还是停止,从而实现支持已停止服务实例的健康检查,进而可以及时发现存在误操作和非法占用的服务实例,避免其对系统造成影响。另外,本发明实施例通过应用服务实例管理模块和服务实例检查模块实现所有服务实例的自动健康检查和监控告警,相比于人工的监控方案,提高了检查结果的准确性,极大地提高了服务实例的监控效率,同时大大降低了运维人员的工作压力。
本发明实施例提供的方法,通过基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果,实现了支持非http服务实例以及已停止服务实例的健康检查,进而实现了所有服务实例的统一监控,并且,通过应用服务实例管理模块和服务实例检查模块实现所有服务实例的自动健康检查和监控告警,提高了服务实例监控的准确性和即时性。
基于上述任一实施例,步骤210中,获取各服务实例的运行状态,包括:
获取服务器上各服务实例的标识;
从第三方系统获取各服务实例的标识对应的运行状态。
具体地,考虑到服务实例的运行状态通常保存在第三方系统中,该第三方系统用于维护服务实例的运行状态,对此,服务实例管理模块可以先获取服务器上各个服务实例的标识,再根据各个服务实例的标识在第三方系统中进行查询,从而得到各个服务实例的标识对应的运行状态,用于后续提供给服务实例检查模块进行服务实例健康检查。
基于上述任一实施例,图3是本发明提供的服务实例监控方法的流程示意图之三,如图3所示,该方法的具体流程如下:启动定时任务,服务实例管理模块每隔预设时间获取当前所有服务实例并组成服务实例列表,将服务实例列表分发给服务实例检查模块,交由服务实例检查模块来执行所有服务实例的健康检查;另外,在服务实例检查模块执行健康检查之前,服务实例管理模块还会获取所有服务实例的运行状态并将发送给服务实例检查模块,以供服务实例检查模块基于所有服务实例的运行状态来执行所有服务实例的健康检查,并将所有服务实例的健康检查结果返回给服务实例管理模块;当服务实例管理模块检测到存在服务实例的健康检查结果为异常时,则可以向该服务实例所属的服务器发送告警信息,从而能够及时提醒服务器相关负责人员对异常状况进行处理。
进一步地,服务实例管理模块和服务实例检查模块可以部署在同一个告警管理服务器上,该告警管理服务器可以用于监控管理多个服务器,当服务实例管理模块获取到多个服务器上的服务实例之后,可以将所有服务实例按照所属的服务器分发给服务实例检查模块,以供服务实例检查模块针对各个服务器的服务实例进行健康检查。
基于上述任一实施例,图4是本发明提供的健康检查结果确定方法的流程示意图,如图4所示,服务实例检查模块可以获取所有服务实例的运行状态,并对各个服务实例进行ps检查和telnet检查,具体可以将ps命令和telnet命令组装起来统一发给服务器,服务器返回这些命令的执行结果,在此基础上,服务实例检查模块即可得到各个服务实例的ps进程检查结果和telnet端口检查结果,随即,根据各个服务实例的ps进程检查结果、telnet端口检查结果以及运行状态,确定各个服务实例的健康检查结果。此处,在确定健康检查结果的过程中可能存在如下几种情形:
当任意一个服务实例的运行状态为运行时,如果确定出该服务实例的ps进程检查结果为存在,且该服务实例的telnet端口检查结果为畅通,则服务实例检查模块可以将该服务实例判断为正常运行,此时即可确定该服务实例的健康检查结果为正常;
当任意一个服务实例的运行状态为停止时,如果确定出该服务实例的ps进程检查结果为不存在,且该服务实例的telnet端口检查结果为断开,则服务实例检查模块可以将该服务实例判断为正常停止,此时也可确定该服务实例的健康检查结果为正常;
反之,即除了上述两种情形之外的情形,则服务实例检查模块均可以确定该服务实例的健康检查结果为异常。
本发明实施例提供的方法,通过基于ps检查和telnet检查进行服务实例健康状态的判断,从而得到服务实例的健康检查结果,实现了所有服务实例的统一监控,同时,提高了服务实例监控的准确性和即时性。
下面对本发明提供的服务实例监控装置进行描述,下文描述的服务实例监控装置与上文描述的服务实例监控方法可相互对应参照。
基于上述任一实施例,本发明实施例提供一种服务实例监控装置,图5是本发明提供的服务实例监控装置的结构示意图之一,如图5所示,该装置应用于服务实例检查模块,该装置包括:
接收单元510,用于接收服务实例管理模块发送的各服务实例的运行状态;
检查单元520,用于基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果;
返回单元530,用于将各服务实例的健康检查结果返回给服务实例管理模块,以供服务实例管理模块基于各服务实例的健康检查结果,向服务器发送告警信息。
本发明实施例提供的装置,通过基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果,实现了支持非http服务实例以及已停止服务实例的健康检查,进而实现了所有服务实例的统一监控,并且,通过应用服务实例管理模块和服务实例检查模块实现所有服务实例的自动健康检查和监控告警,提高了服务实例监控的准确性和即时性。
基于上述任一实施例,各服务实例的进程检查结果是基于如下步骤确定的:
向服务器发送进程查看命令;
接收服务器返回的进程信息;
基于进程信息,以及各服务实例的标识,确定各服务实例的进程检查结果。
基于上述任一实施例,各服务实例的端口检查结果是基于如下步骤确定的:
向服务器发送各服务实例对应的端口查看命令;
接收服务器返回的各服务实例对应的端口信息;
基于各服务实例对应的端口信息,确定各服务实例的端口检查结果。
基于上述任一实施例,检查单元520包括运行检查子单元,用于:
当任一服务实例的运行状态为运行时,若该服务实例的进程检查结果为存在,且该服务实例的端口检查结果为畅通,则该服务实例的健康检查结果为正常,否则,该服务实例的健康检查结果为异常。
基于上述任一实施例,检查单元520包括停止检查子单元,用于:
当任一服务实例的运行状态为停止时,若该服务实例的进程检查结果为不存在,且该服务实例的端口检查结果为断开,则该服务实例的健康检查结果为正常,否则,该服务实例的健康检查结果为异常。
基于上述任一实施例,本发明实施例提供一种服务实例监控装置,图6是本发明提供的服务实例监控装置的结构示意图之二,如图6所示,该装置应用于服务实例管理模块,该装置包括:
获取单元610,用于获取各服务实例的运行状态,并将各服务实例的运行状态发送至服务实例检查模块,以供服务实例检查模块基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果并返回给服务实例管理模块;
告警单元620,用于基于各服务实例的健康检查结果,向服务器发送告警信息。
本发明实施例提供的装置,通过基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果,实现了支持非http服务实例以及已停止服务实例的健康检查,进而实现了所有服务实例的统一监控,并且,通过应用服务实例管理模块和服务实例检查模块实现所有服务实例的自动健康检查和监控告警,提高了服务实例监控的准确性和即时性。
基于上述任一实施例,获取各服务实例的运行状态,包括:
获取服务器上各服务实例的标识;
从第三方系统获取各服务实例的标识对应的运行状态。
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行服务实例监控方法,该方法应用于服务实例检查模块,该方法包括:接收服务实例管理模块发送的各服务实例的运行状态;基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果;将各服务实例的健康检查结果返回给服务实例管理模块,以供服务实例管理模块基于各服务实例的健康检查结果,向服务器发送告警信息;
或者,以执行服务实例监控方法,该方法应用于服务实例管理模块,该方法包括:获取各服务实例的运行状态,并将各服务实例的运行状态发送至服务实例检查模块,以供服务实例检查模块基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果并返回给服务实例管理模块;基于各服务实例的健康检查结果,向服务器发送告警信息。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的服务实例监控方法,该方法应用于服务实例检查模块,该方法包括:接收服务实例管理模块发送的各服务实例的运行状态;基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果;将各服务实例的健康检查结果返回给服务实例管理模块,以供服务实例管理模块基于各服务实例的健康检查结果,向服务器发送告警信息;
或者,执行上述各方法所提供的服务实例监控方法,该方法应用于服务实例管理模块,该方法包括:获取各服务实例的运行状态,并将各服务实例的运行状态发送至服务实例检查模块,以供服务实例检查模块基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果并返回给服务实例管理模块;基于各服务实例的健康检查结果,向服务器发送告警信息。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的服务实例监控方法,该方法应用于服务实例检查模块,该方法包括:接收服务实例管理模块发送的各服务实例的运行状态;基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果;将各服务实例的健康检查结果返回给服务实例管理模块,以供服务实例管理模块基于各服务实例的健康检查结果,向服务器发送告警信息;
或者,以执行服务实例监控方法,该方法应用于服务实例管理模块,该方法包括:获取各服务实例的运行状态,并将各服务实例的运行状态发送至服务实例检查模块,以供服务实例检查模块基于各服务实例的进程检查结果、端口检查结果以及运行状态,确定各服务实例的健康检查结果并返回给服务实例管理模块;基于各服务实例的健康检查结果,向服务器发送告警信息。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种服务实例监控方法,其特征在于,所述方法应用于服务实例检查模块,所述方法包括:
接收服务实例管理模块发送的各服务实例的运行状态;
基于所述各服务实例的进程检查结果、端口检查结果以及运行状态,确定所述各服务实例的健康检查结果;
将所述各服务实例的健康检查结果返回给所述服务实例管理模块,以供所述服务实例管理模块基于所述各服务实例的健康检查结果,向服务器发送告警信息。
2.根据权利要求1所述的服务实例监控方法,其特征在于,所述各服务实例的进程检查结果是基于如下步骤确定的:
向所述服务器发送进程查看命令;
接收所述服务器返回的进程信息;
基于所述进程信息,以及所述各服务实例的标识,确定所述各服务实例的进程检查结果。
3.根据权利要求1所述的服务实例监控方法,其特征在于,所述各服务实例的端口检查结果是基于如下步骤确定的:
向所述服务器发送所述各服务实例对应的端口查看命令;
接收所述服务器返回的所述各服务实例对应的端口信息;
基于所述各服务实例对应的端口信息,确定所述各服务实例的端口检查结果。
4.根据权利要求1所述的服务实例监控方法,其特征在于,所述基于所述各服务实例的进程检查结果、端口检查结果以及运行状态,确定所述各服务实例的健康检查结果,包括:
当任一服务实例的运行状态为运行时,若所述任一服务实例的进程检查结果为存在,且所述任一服务实例的端口检查结果为畅通,则所述任一服务实例的健康检查结果为正常,否则,所述任一服务实例的健康检查结果为异常。
5.根据权利要求1所述的服务实例监控方法,其特征在于,所述基于所述各服务实例的进程检查结果、端口检查结果以及运行状态,确定所述各服务实例的健康检查结果,包括:
当任一服务实例的运行状态为停止时,若所述任一服务实例的进程检查结果为不存在,且所述任一服务实例的端口检查结果为断开,则所述任一服务实例的健康检查结果为正常,否则,所述任一服务实例的健康检查结果为异常。
6.一种服务实例监控方法,其特征在于,所述方法应用于服务实例管理模块,所述方法包括:
获取各服务实例的运行状态,并将所述各服务实例的运行状态发送至服务实例检查模块,以供所述服务实例检查模块基于所述各服务实例的进程检查结果、端口检查结果以及所述运行状态,确定所述各服务实例的健康检查结果并返回给所述服务实例管理模块;
基于所述各服务实例的健康检查结果,向服务器发送告警信息。
7.根据权利要求6所述的服务实例监控方法,其特征在于,所述获取各服务实例的运行状态,包括:
获取所述服务器上各服务实例的标识;
从第三方系统获取所述各服务实例的标识对应的运行状态。
8.一种服务实例监控装置,其特征在于,所述装置应用于服务实例检查模块,所述装置包括:
接收单元,用于接收服务实例管理模块发送的各服务实例的运行状态;
检查单元,用于基于所述各服务实例的进程检查结果、端口检查结果以及运行状态,确定所述各服务实例的健康检查结果;
返回单元,用于将所述各服务实例的健康检查结果返回给所述服务实例管理模块,以供所述服务实例管理模块基于所述各服务实例的健康检查结果,向服务器发送告警信息。
9.一种服务实例监控装置,其特征在于,所述装置应用于服务实例管理模块,所述装置包括:
获取单元,用于获取各服务实例的运行状态,并将所述各服务实例的运行状态发送至服务实例检查模块,以供所述服务实例检查模块基于所述各服务实例的进程检查结果、端口检查结果以及所述运行状态,确定所述各服务实例的健康检查结果并返回给所述服务实例管理模块;
告警单元,用于基于所述各服务实例的健康检查结果,向服务器发送告警信息。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述服务实例监控方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111265247.2A CN114090369A (zh) | 2021-10-28 | 2021-10-28 | 服务实例监控方法、装置与存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111265247.2A CN114090369A (zh) | 2021-10-28 | 2021-10-28 | 服务实例监控方法、装置与存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114090369A true CN114090369A (zh) | 2022-02-25 |
Family
ID=80298063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111265247.2A Pending CN114090369A (zh) | 2021-10-28 | 2021-10-28 | 服务实例监控方法、装置与存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114090369A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116795650A (zh) * | 2023-06-29 | 2023-09-22 | 浙江海得智慧能源有限公司 | 一种储能系统运行状态监测方法、系统及设备 |
-
2021
- 2021-10-28 CN CN202111265247.2A patent/CN114090369A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116795650A (zh) * | 2023-06-29 | 2023-09-22 | 浙江海得智慧能源有限公司 | 一种储能系统运行状态监测方法、系统及设备 |
CN116795650B (zh) * | 2023-06-29 | 2024-05-03 | 浙江海得智慧能源有限公司 | 一种储能系统运行状态监测方法、系统及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100536403C (zh) | 一种通信网络智能巡检的方法及设备 | |
US20120297059A1 (en) | Automated creation of monitoring configuration templates for cloud server images | |
CN102195813A (zh) | 一种智能创建运维工单的方法和装置 | |
WO2013071125A1 (en) | Systems and methods for automatic replacement and repair of communications network devices | |
EP2800024A1 (en) | System and methods for identifying applications in mobile networks | |
CN105450472A (zh) | 一种自动获取服务器物理部件状态的方法及装置 | |
CN107800783B (zh) | 远程监控服务器的方法及装置 | |
CN111510325B (zh) | 报警信息推送方法、服务器、客户端及系统 | |
CN103414916A (zh) | 一种故障诊断系统及方法 | |
CN108199901B (zh) | 硬件报修方法、系统、设备、硬件管理服务器与存储介质 | |
CN109240891A (zh) | 一种sr整机柜服务器的监控方法及装置 | |
CN106993043A (zh) | 基于代理的数据通信系统和方法 | |
CN104796283A (zh) | 一种监控报警的方法 | |
CN114090369A (zh) | 服务实例监控方法、装置与存储介质 | |
CN110275793B (zh) | 一种用于MongoDB数据分片集群的检测方法及设备 | |
CN115001974A (zh) | 集群系统一致性检测方法、装置、系统、设备和存储介质 | |
CN112631687B (zh) | 一种服务集群的配置方法、装置及设备 | |
CN110784358A (zh) | 网络调用关系拓扑图的构建方法及装置 | |
CN110224872B (zh) | 一种通信方法、装置及存储介质 | |
CN107612755A (zh) | 一种云资源的管理方法及其装置 | |
CN116737444A (zh) | 一种数据库服务器故障处理方法及系统 | |
CN116594843A (zh) | 服务监测方法、装置、系统及电子设备 | |
CN105550094B (zh) | 一种高可用系统状态自动监控方法 | |
CN115225534A (zh) | 一种监控服务器的运行状态监控方法 | |
CN114363150A (zh) | 服务器集群的网卡连通性监控方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |