CN111737085A - 服务器的监控方法、装置和系统及电子设备 - Google Patents

服务器的监控方法、装置和系统及电子设备 Download PDF

Info

Publication number
CN111737085A
CN111737085A CN202010583851.9A CN202010583851A CN111737085A CN 111737085 A CN111737085 A CN 111737085A CN 202010583851 A CN202010583851 A CN 202010583851A CN 111737085 A CN111737085 A CN 111737085A
Authority
CN
China
Prior art keywords
application
server
monitoring
interface
registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010583851.9A
Other languages
English (en)
Inventor
董桂林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Cloud Network Technology Co Ltd
Original Assignee
Beijing Kingsoft Cloud Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Cloud Network Technology Co Ltd filed Critical Beijing Kingsoft Cloud Network Technology Co Ltd
Priority to CN202010583851.9A priority Critical patent/CN111737085A/zh
Publication of CN111737085A publication Critical patent/CN111737085A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3041Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is an input/output interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提供了服务器的监控方法、装置和系统及电子设备,涉及云计算领域。上述方法包括:应用服务器将包含有应用参数的注册信息发送至监控服务器,以使监控服务器保存应用参数进行注册,并将注册成功信息反馈至应用服务器;此时,应用服务器按照预先设置的第一时间间隔将状态信息上报至监控服务器,以使监控服务器根据状态信息对应用服务器进行监控。因此,本申请中监控服务器和每个应用服务器之间彼此耦合,网络结构简单,避免了应用服务器相互影响,且,应用服务器主动将状态信息上报至监控服务器,当增加新的应用服务器时,监控服务器无需更新配置,从而减少了维护成本。

Description

服务器的监控方法、装置和系统及电子设备
技术领域
本申请涉及云计算技术领域,尤其是涉及服务器的监控方法、装置和系统及电子设备。
背景技术
在实际应用中,应用健康检查装置主要用于监控设置有应用程序的应用服务器的健康状态,配合告警系统,当出现状态异常时,如应用程序掉线、应用服务器无法连接数据库、应用程序所在磁盘已满、应用程序应用依赖接口不可用和API(ApplicationProgramming Interface,应用程序编程接口)调用等,能够及时感知并进行相应的处理。目前,广泛通过Spring Boot Actuator对应用服务器进行应用健康检查,具体地,应用服务器通过暴露HTTP(HyperText Transfer Protocol,超文本传输协议)或者JMX(JavaManagement Extensions,Java管理扩展)接口的方式,以便监控系统主动调用接口获取应用服务器的健康状态。
现有的方法大都在应用服务器处部署节点,结合监控系统,且,监控系统预先设置各个应用服务器的健康检查接口地址,当启动定时任务时,周期性的调用接口获取应用服务器的健康状态,这种方法虽然可以实现应用服务器的健康状态检查,但是部分应用服务器响应超时会对其余应用服务器造成影响,导致不能及时发现异常节点,且,当增加新的应用服务器时,还需对监控系统进行更新,增加了维护成本。
发明内容
有鉴于此,本申请的目的在于提供服务器的监控方法、装置和系统及电子设备,解决了上述问题,且,监控系统和应用服务器之间彼此耦合,应用服务器主动上报状态信息,网络结构、依赖变得简单,以及,应用服务器更改时,监控系统无需更新配置,减少了维护成本。
第一方面,本申请实施例提供了一种服务器的监控方法,应用于部署有应用程序的应用服务器,应用服务器与监控系统的监控服务器通信连接;该方法包括:
如果监测到监控服务器反馈的注册成功信息,获取当前应用服务器的状态信息;
按照预先设置的第一时间间隔将状态信息上报至监控服务器,以使监控服务器对应用服务器进行监控。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,监控服务器中设置有应用注册接口、应用下线接口和状态上报接口,该方法还包括:
响应于应用程序的启动信号,调用应用注册接口;
按照预设的第二时间间隔通过应用注册接口向监控服务器发送包含有应用参数的注册信息;其中,应用参数包括应用程序的名称信息和应用程序所在的主机信息;
如果接收到监控服务器根据注册信息发送的反馈信号,则确定监测到监控服务器反馈的注册成功信息。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第二种可能的实施方式,其中,按照预先设置的第一时间间隔将状态信息上报至监控服务器的步骤包括:
启动定时任务;
按照预先设置的第一时间间隔调用监控服务器的状态上报接口,以通过状态上报接口将状态信息上报至监控服务器。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中,状态信息包括以下信息中的一种或多种:应用程序是否掉线、应用服务器是否连接至指定的数据库、应用程序所在的磁盘是否已满、应用程序依赖的接口是否可用和API调用是否超时等。
第二方面,本申请实施例还提供一种服务器的监控方法,应用于监控系统的监控服务器,监控服务器与部署有应用程序的应用服务器通信连接,该方法包括:
响应于应用服务器发送的包含有应用参数的注册信息,保存应用参数,并向应用服务器反馈注册成功信息;
接收应用服务器按照预先设置的第一时间间隔上报的状态信息,并根据状态信息对应用服务器进行监控。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,监控服务器中设置有应用注册接口、应用下线接口和状态上报接口,该方法还包括:
如果接收到应用服务器通过调用应用注册接口发送的包含有应用参数的注册信息,则确定监测到应用服务器发送的包含有应用参数的注册信息,并将应用参数存储至预设的数据库。
结合第二方面的第一种可能的实施方式,本申请实施例提供了第二方面的第二种可能的实施方式,其中,接收应用服务器按照预先设置的第一时间间隔上报的状态信息的步骤包括:
通过状态上报接口接收应用服务器按照预先设置的第一时间间隔上报的状态信息。
结合第二方面的第一种可能的实施方式,本申请实施例提供了第二方面的第三种可能的实施方式,其中,该方法还包括:
响应于用户的移除操作指令,调用所述应用下线接口;
通过所述应用下线接口移除所述移除操作指令对应的注册信息。
第三方面,本申请实施例还提供一种服务器的监控装置,应用于部署有应用程序的应用服务器,应用服务器与监控系统的监控服务器通信连接;该装置包括:
获取模块,用于如果监测到监控服务器反馈的注册成功信息,获取当前应用服务器的状态信息;
上报模块,用于按照预先设置的第一时间间隔将状态信息上报至监控服务器,以使监控服务器对应用服务器进行监控。
结合第三方面,本申请实施例提供了第三方面的第一种可能的实施方式,其中,监控服务器中设置有应用注册接口、应用下线接口和状态上报接口,该装置还用于:
响应于应用程序的启动信号,调用应用注册接口;
按照预设的第二时间间隔通过应用注册接口向监控服务器发送包含有应用参数的注册信息;其中,应用参数包括应用程序的名称信息和应用程序所在的主机信息;
如果接收到监控服务器根据注册信息发送的反馈信号,则确定监测到监控服务器反馈的注册成功信息。
结合第三方面的第一种可能的实施方式,本申请实施例提供了第三方面的第二种可能的实施方式,其中,上报模块还用于:
启动定时任务;
按照预先设置的第一时间间隔调用监控服务器的状态上报接口,以通过状态上报接口将状态信息上报至监控服务器。
结合第三方面,本申请实施例提供了第三方面的第三种可能的实施方式,其中,上述状态信息包括以下信息中的一种或多种:应用程序是否掉线、应用服务器是否连接至指定的数据库、应用程序所在的磁盘是否已满、应用程序依赖的接口是否可用和API调用是否超时等。
第四方面,本申请实施例还提供一种服务器的监控装置,应用于监控系统的监控服务器,监控服务器与部署有应用程序的应用服务器通信,该装置包括:
保存模块,用于响应于应用服务器发送的包含有应用参数的注册信息,保存应用参数,并向应用服务器反馈注册成功信息;
监控模块,用于接收应用服务器按照预先设置的第一时间间隔上报的状态信息,并根据状态信息对应用服务器进行监控。
结合第四方面,本申请实施例提供了第四方面的第一种可能的实施方式,其中,监控服务器中设置有应用注册接口、应用下线接口和状态上报接口,该装置还用于:
如果接收到应用服务器通过调用应用注册接口发送的包含有应用参数的注册信息,则确定监测到应用服务器发送的包含有应用参数的注册信息,并将应用参数存储至预设的数据库。
结合第四方面的第一种可能的实施方式,本申请实施例提供了第四方面的第二种可能的实施方式,其中,上述监控模块还用于:
通过状态上报接口接收应用服务器按照预先设置的第一时间间隔上报的状态信息。
结合第四方面的第一种可能的实施方式,本申请实施例提供了第四方面的第三种可能的实施方式,其中,该装置还用于:
响应于用户的移除操作指令,调用应用下线接口;
通过应用下线接口移除上述移除操作指令对应的注册信息。第五方面,本申请实施例还提供一种服务器的监控系统,该系统包括监控服务器和应用服务器;监控服务器和应用服务器通信;
其中,应用服务器配置有第三方面的服务器的监控装置,监控服务器配置有第四方面的服务器的监控装置。
第六方面,本申请实施例还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现第一方面和第二方面的服务器的监控方法。
第七方面,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现第一方面和第二方面的服务器的监控方法。
本申请实施例带来了以下有益效果:
本申请实施例提供了服务器的监控方法、装置和系统及电子设备,在应用服务器处,如果监测到监控服务器反馈的注册成功信息,获取当前应用服务器的状态信息;按照预先设置的第一时间间隔将状态信息上报至监控服务器,以使监控服务器对应用服务器进行监控;在监控服务器处,响应于应用服务器发送的包含有应用参数的注册信息,保存应用参数,并向应用服务器反馈注册成功信息;接收应用服务器按照预先设置的第一时间间隔上报的状态信息,并根据状态信息对应用服务器进行监控。本申请中监控系统和应用服务器之间彼此耦合,应用服务器主动上报状态信息,网络结构、依赖变得简单,以及,应用服务器更改时,监控系统无需更新配置,减少了维护成本。
本申请的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种应用健康检查装置的示意图;
图2为本申请实施例提供的另一种应用健康检查装置的示意图;
图3为本申请实施例提供的一种服务器的监控方法的应用场景图;
图4为本申请实施例提供的一种服务器的监控方法的流程图;
图5为本申请实施例提供的另一种服务器的监控方法的流程图;
图6为本申请实施例提供的另一种服务器的监控方法的流程图;
图7为本申请实施例提供的另一种服务器的监控方法的流程图;
图8为本申请实施例提供的一种服务器的监控装置的示意图;
图9为本申请实施例提供的另一种服务器的监控装置的示意图;
图10为本申请实施例提供的一种电子设备的示意图。
图标:
1-监控系统;10-监控服务器;11-健康检查配置接口;21-第一应用服务器;22-第二应用服务器;23-第三应用服务器;24-nginx服务器;81-获取模块;82-上报模块;91-保存模块;92-监控模块;101-处理器;102-存储器;103-总线;104-通信接口。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有的应用健康检查方法大都在应用服务器处部署节点,结合监控系统,且,监控系统预先设置各个应用服务器的健康检查接口地址,当启动定时任务时,周期性的调用接口获取应用服务器的健康状态,比如监控系统每隔1分钟调用接口获取应用服务器的应用健康状态,以及,当出现状态异常时,发出警告。
当在应用服务器仅部署一个节点时,如图1所示,在监控系统1中设置有监控服务器10,且,监控服务器设置有健康检查配置接口11,第一应用服务器21、第二应用服务器22和第三应用服务器23均通过健康检查配置接口与监控系统通信。如果监控系统每隔1分钟通过健康检查配置接口去调用应用服务器的健康检查接口,如果某个应用服务器的健康检查接口响应超时,如第一应用服务器的健康检查接口超时时长为20秒,则监控系统无法保证在1分钟内调用完所有应用服务器的健康检查接口,即部分应用服务器响应超时会对其余应用服务器造成影响,对于应用服务器较多的情况,这种现象越明显。此外,如果需要增加应用服务器,则需要对健康检查配置接口进行更新,在实际应用中,监控系统一般作为一个公共的应用,还配置有与其连接的多个微服务,因此,此时对监控系统进行更新比较困难,也增加了监控系统的维护成本。
此外,当在应用服务器仅部署多个节点时,如图2所示,第一应用服务器21部署了三个节点,分别为节点a、节点b和节点c,且,在第一应用服务器之前增加一个服务器架构nginx服务器24,即监控系统和应用服务器之间隔离,监控系统中监控服务器配置的访问地址为nginx服务器的nginx地址,并在nginx服务器中配置第一应用服务器的访问地址。此时,如果节点a处的第一应用服务器出现异常状态,如应用程序所在磁盘已满,监控系统每隔1分钟调用一次nginx服务器,以获取第一应用服务器的健康状态,此时,nginx服务器以轮询或者随机的方式把请求转发至节点a、节点b和节点c,例如,nginx服务器第1分钟转发至节点a,得到节点a处的第一应用服务器状态异常;nginx服务器第2分钟转发至节点b,得到节点b处的第一应用服务器状态正常,以此类推,nginx服务器第4分钟重新转发至节点a,得到节点a处的第一应用服务器状态异常,此时监控系统得到的第一应用服务器的状态信息出现时而正常时而异常的情况,且,无法及时感知异常对应的节点,只有nginx服务器轮询时可以感知到出现异常的节点a。此外,当增加新的应用服务器时,还需对nginx服务器进行重新配置,且,当nginx服务器负载均衡时,如果请求分发还会导致状态抖动,从而导致监控系统不能及时发现异常节点,以及,部分应用服务器或者节点响应超时会对其余应用服务器或者节点造成影响。
针对上述问题,本申请实施例提供了一种服务器的监控方法、装置和系统及电子设备,解决了上述问题,且,监控系统和应用服务器之间彼此耦合,应用服务器主动上报状态信息,网络结构、依赖变得简单,以及,应用服务器更改时,监控系统无需更新配置,减少了维护成本。
为便于对本实施例进行理解,下面首先对本申请实施例提供的一种服务器的监控方法进行详细介绍。
实施例一:
本申请实施例提供了一种服务器的监控方法,如图3所示,应用服务器与监控系统的监控服务器通信连接,从而实现监控系统和应用服务器之间彼此耦合,便于应用服务器主动上报状态信息。图4为本申请实施例提供的一种服务器的监控方法的流程图,应用于部署有应用程序的应用服务器,如图4所示,该方法包括以下步骤:
步骤S402,如果监测到监控服务器反馈的注册成功信息,获取当前应用服务器的状态信息;
在实际应用中,对于图4中的各个应用服务器,当设置在应用服务器中的应用程序启动时,监控系统中的监控服务器可能还未启动,或者,应用服务器与监控服务器不能通信,此时,应用服务器需要首先注册至监控系统中的监控服务器,例如,向监控服务器发送注册信息,并根据监控服务器反馈的信息判断是否注册成功,如果没有注册成功,则按照预设的时间间隔如1分钟,继续注册,直至注册成功为止;当监测到监控服务器反馈的注册成功信息时,则应用服务器开始获取当前应用服务器的状态信息,其中,状态信息包括以下信息中的一种或多种:应用程序是否掉线、应用服务器是否连接至指定的数据库、应用程序所在的磁盘是否已满、应用程序依赖的接口是否可用和API调用是否超时等。
步骤S404,按照预先设置的第一时间间隔将状态信息上报至监控服务器,以使监控服务器对应用服务器进行监控。
应用服务器获取到状态信息后,按照预先设置的第一时间间隔将状态信息上报至监控服务器,以使监控服务器对应用服务器进行监控。因此,本申请中的应用服务器主动向监控系统的监控服务器上报状态信息,且,每个应用服务器之间的上报动作互不影响,从而避免了现有的方法中部分应用服务器或者节点响应超时会对其余应用服务器或者节点造成影响,进而便于及时确认出现异常的应用服务器,提高了服务器的监控精度。
本申请实施例提供的服务器的监控方法,在应用服务器处,如果监测到监控服务器反馈的注册成功信息,获取当前应用服务器的状态信息;按照预先设置的第一时间间隔将状态信息上报至监控服务器,以使监控服务器对应用服务器进行监控。因此,本申请中监控系统和应用服务器之间彼此耦合,应用服务器主动上报状态信息,网络结构、依赖变得简单,以及,应用服务器更改时,监控系统无需更新配置,减少了维护成本。
进一步的,如图3所示,本申请实施例中监控服务器中设置有应用注册接口、应用下线接口和状态上报接口,代替了现有方法中监控服务器中的健康检查配置接口,以便于实现应用服务器主动向监控系统的监控服务器上报状态信息。在此基础上,本申请实施例还提供了另一种服务器的监控方法,图5为本申请实施例提供的另一种服务器的监控方法的流程图,如图5所示,该方法包括以下步骤:
步骤S502,响应于应用程序的启动信号,调用应用注册接口;
具体地,当应用服务器监测到应用程序的启动信号时,调用监控服务器中的应用注册接口,以便通过应用注册接口实现该应用服务器注册至监控服务器。此外,在实际应用中,当增加或者减少某个应用服务器时,或者某个应用服务器中的应用程序需要扩大容量或者缩减容量时,此时,监控服务器并不需要进行更新配置,即本申请中监控服务器具有一次开发、稳定运行的优点,从而减少了维护成本。
步骤S504,按照预设的第二时间间隔通过应用注册接口向监控服务器发送包含有应用参数的注册信息;
其中,应用参数包括应用程序的名称信息和应用程序所在的主机信息;这里应用程序的名称信息包括应用程序的中文名称和英文名称,可选的,这里应用程序的英文名称可以采用serviceNameEn表示,中文名称则可以采用serviceNameCn表示,以及,采用host表示应用程序所在的主机信息。
步骤S506,如果接收到监控服务器根据注册信息发送的反馈信号,则确定监测到监控服务器反馈的注册成功信息;
步骤S508,获取当前应用服务器的状态信息;
步骤S510,按照预先设置的第一时间间隔将状态信息上报至监控服务器,以使监控服务器对应用服务器进行监控。
进一步的,在图3的基础上,本申请实施例还提供了另一种服务器的监控方法,图6为本申请实施例提供的另一种服务器的监控方法的流程图,如图6所示,该方法包括以下步骤:
步骤S602,如果监测到监控服务器反馈的注册成功信息,获取当前应用服务器的状态信息;
步骤S604,启动定时任务;
步骤S606,按照预先设置的第一时间间隔调用监控服务器的状态上报接口,以通过状态上报接口将状态信息上报至监控服务器,以使监控服务器对应用服务器进行监控。
具体地,获取到当前应用服务器的状态信息后,应用服务器启动定时任务,并按照预先设置的第一时间间隔调用监控服务器的状态上报接口,例如,第一时间间隔可以设置为1分钟,然后应用服务器每隔1分钟调用监控服务器的状态上报接口,并通过状态上报接口将状态信息上报至监控服务器,以便监控服务器对应用服务器进行监控,从而实现监控系统定时监控应用服务器。
实施例二:
在上述实施例的基础上,本申请实施例还提供了另一种服务器的监控方法,应用于监控系统的监控服务器,监控服务器与部署有应用程序的应用服务器通信连接,图7为本申请实施例提供的另一种服务器的监控方法的流程图,如图7所示,该方法包括以下步骤:
步骤S702,响应于应用服务器发送的包含有应用参数的注册信息,保存应用参数,并向应用服务器反馈注册成功信息;
步骤S704,接收应用服务器按照预先设置的第一时间间隔上报的状态信息,并根据状态信息对应用服务器进行监控。
本申请实施例提供的服务器的监控方法,在监控服务器处,如果监测到应用服务器发送的包含有应用参数的注册信息,保存应用参数,并向应用服务器反馈注册成功信息;接收应用服务器按照预先设置的第一时间间隔上报的状态信息,并根据状态信息对应用服务器进行监控。本申请中监控系统和应用服务器之间彼此耦合,应用服务器主动上报状态信息,网络结构、依赖变得简单,以及,应用服务器更改时,监控系统无需更新配置,减少了维护成本。
在其中一种可能的实施例中,监控服务器中设置有应用注册接口、应用下线接口和状态上报接口,该方法还包括:如果监控服务器接收到应用服务器通过调用应用注册接口发送的包含有应用参数的注册信息,则确定监测到应用服务器发送的包含有应用参数的注册信息,并将应用参数存储至预设的数据库。
在另一种可能的实施例中,上述接收应用服务器按照预先设置的第一时间间隔上报的状态信息的步骤包括:监控服务器通过状态上报接口接收应用服务器按照预先设置的第一时间间隔上报的状态信息。
在另一种可能的实施例中,监控服务器响应于用户的移除操作指令,调用应用下线接口;并通过应用下线接口移除该移除操作指令对应的注册信息。具体地,当监控服务器无需再监测某个应用服务器时,此时,用户通过监控服务器提供的页面进行移除操作,即监控服务器响应于用户的移除操作指令,在页面中显示应用下线接口,并通过该应用下线接口移除该移除操作指令对应的注册信息,从而实现该应用服务器下线,即无法主动向监控服务器主动上报状态信息,且,在该移除过程中,不会对其余的应用服务器造成影响,以及无需监控服务器修改配置问题,从而减少了维护成本。
实施例三
在上述实施例的基础上,本申请实施例还提供了一种服务器的监控装置,应用于部署有应用程序的应用服务器,应用服务器与监控系统的监控服务器通信连接,图8为本申请实施例提供的一种服务器的监控装置的示意图,如图8所示,该装置包括:
获取模块81,用于如果监测到监控服务器反馈的注册成功信息,获取当前应用服务器的状态信息;
上报模块82,用于按照预先设置的第一时间间隔将状态信息上报至监控服务器,以使监控服务器对应用服务器进行监控。
本申请实施例提供了服务器的监控装置,在应用服务器处,如果监测到监控服务器反馈的注册成功信息,获取当前应用服务器的状态信息;按照预先设置的第一时间间隔将状态信息上报至监控服务器,以使监控服务器对应用服务器进行监控。本申请中监控系统和应用服务器之间彼此耦合,应用服务器主动上报状态信息,网络结构、依赖变得简单,以及,应用服务器更改时,监控系统无需更新配置,减少了维护成本。
在其中一种可能的实施例中,上述监控服务器中设置有应用注册接口、应用下线接口和状态上报接口,上述装置还用于:响应于应用程序的启动信号,调用应用注册接口;按照预设的第二时间间隔通过应用注册接口向监控服务器发送包含有应用参数的注册信息;其中,应用参数包括应用程序的名称信息和应用程序所在的主机信息;如果接收到监控服务器根据注册信息发送的反馈信号,则确定监测到监控服务器反馈的注册成功信息。
在另一种可能的实施例中,上述上报模块82还用于:启动定时任务;按照预先设置的第一时间间隔调用监控服务器的状态上报接口,以通过状态上报接口将状态信息上报至监控服务器。
在另一种可能的实施例中,上述状态信息包括以下信息中的一种或多种:所述应用程序是否掉线、所述应用服务器是否连接至指定的数据库、所述应用程序所在的磁盘是否已满、所述应用程序依赖的接口是否可用、API调用是否超时等。
实施例四
在上述实施例的基础上,本申请实施例还提供了另一种服务器的监控装置,应用于监控系统的监控服务器,监控服务器与部署有应用程序的应用服务器通信连接,图9为本申请实施例提供的另一种服务器的监控装置的示意图,如图9所示,该装置包括:
保存模块91,用于响应于应用服务器发送的包含有应用参数的注册信息,保存应用参数,并向应用服务器反馈注册成功信息;
监控模块92,用于接收应用服务器按照预先设置的第一时间间隔上报的状态信息,并根据状态信息对应用服务器进行监控。
本申请实施例提供的服务器的监控装置,在监控服务器处,如果监测到应用服务器发送的包含有应用参数的注册信息,保存应用参数,并向应用服务器反馈注册成功信息;接收应用服务器按照预先设置的第一时间间隔上报的状态信息,并根据状态信息对应用服务器进行监控。本申请中监控系统和应用服务器之间彼此耦合,应用服务器主动上报状态信息,网络结构、依赖变得简单,以及,应用服务器更改时,监控系统无需更新配置,减少了维护成本。
在其中一种可能的实施例中,监控服务器中设置有应用注册接口、应用下线接口和状态上报接口,该装置还用于:如果接收到应用服务器通过调用应用注册接口发送的包含有应用参数的注册信息,则确定监测到应用服务器发送的包含有应用参数的注册信息,并将应用参数存储至预设的数据库。
在另一种可能的实施例中,上述监控模块92还用于:通过状态上报接口接收应用服务器按照预先设置的第一时间间隔上报的状态信息。
在另一种可能的实施例中,该装置还用于:响应于用户的移除操作指令,调用应用下线接口;通过应用下线接口移除该移除操作指令对应的注册信息。
本申请实施例提供的服务器的监控装置,其实现原理及产生的技术效果和前述服务器的监控方法实施例相同,为简要描述,服务器的监控装置的实施例部分未提及之处,可参考前述服务器的监控方法实施例中相应内容。
进一步的,在上述实施例的基础上,本申请实施例还提供了一种服务器的监控系统,该系统包括监控服务器和应用服务器,且,监控服务器和应用服务器通信;其中,应用服务器配置有上述实施例三的服务器的监控装置,监控服务器则配置有上述实施例四的服务器的监控装置,这里应用服务器可以为一个也可以为多个,关于应用服务器的数量,可以根据实际应用场景进行设置,本申请实施例在此不作限制说明。
本申请实施例提供的服务器的监控系统,在应用服务器处,如果监测到监控服务器反馈的注册成功信息,获取当前应用服务器的状态信息;按照预先设置的第一时间间隔将状态信息上报至监控服务器,以使监控服务器对应用服务器进行监控;在监控服务器处,响应于应用服务器发送的包含有应用参数的注册信息,保存应用参数,并向应用服务器反馈注册成功信息;接收应用服务器按照预先设置的第一时间间隔上报的状态信息,并根据状态信息对应用服务器进行监控。本申请中监控系统和应用服务器之间彼此耦合,应用服务器主动上报状态信息,网络结构、依赖变得简单,以及,应用服务器更改时,监控系统无需更新配置,减少了维护成本。
本申请实施例还提供一种电子设备,如图10所示,为该电子设备的结构示意图,其中,该电子设备包括处理器101和存储器102,该存储器102存储有能够被该处理器101执行的机器可执行指令,该处理器101执行该机器可执行指令以实现上述服务器的监控方法。
在图10示出的实施方式中,该电子设备还包括总线103和通信接口104,其中,处理器101、通信接口104和存储器102通过总线连接。
其中,存储器102可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口104(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器101可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器101中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器101可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processor,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器101读取存储器102中的信息,结合其硬件完成前述实施例的服务器的监控方法的步骤。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述服务器的监控方法。
本申请实施例所提供的计算机程序产品,包括存储了程序代码的计算机可读存储介质,程序代码包括的指令可用于执行前面方法实施例中的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本申请实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本申请的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (19)

1.一种服务器的监控方法,其特征在于,应用于部署有应用程序的应用服务器,所述应用服务器与监控系统的监控服务器通信连接;所述方法包括:
如果监测到所述监控服务器反馈的注册成功信息,获取当前应用服务器的状态信息;
按照预先设置的第一时间间隔将所述状态信息上报至所述监控服务器,以使所述监控服务器对所述应用服务器进行监控。
2.根据权利要求1所述的服务器的监控方法,其特征在于,所述监控服务器中设置有应用注册接口、应用下线接口和状态上报接口,所述方法还包括:
响应于所述应用程序的启动信号,调用所述应用注册接口;
按照预设的第二时间间隔通过所述应用注册接口向所述监控服务器发送包含有应用参数的注册信息;其中,所述应用参数包括所述应用程序的名称信息和所述应用程序所在的主机信息;
如果接收到所述监控服务器根据所述注册信息发送的反馈信号,则确定监测到所述监控服务器反馈的注册成功信息。
3.根据权利要求2所述的服务器的监控方法,其特征在于,所述按照预先设置的第一时间间隔将所述状态信息上报至所述监控服务器的步骤包括:
启动定时任务;
按照预先设置的第一时间间隔调用所述监控服务器的所述状态上报接口,以通过所述状态上报接口将所述状态信息上报至所述监控服务器。
4.根据权利要求1~3任一项所述的服务器的监控方法,其特征在于,所述状态信息包括以下信息中的一种或多种:所述应用程序是否掉线、所述应用服务器是否连接至指定的数据库、所述应用程序所在的磁盘是否已满、所述应用程序依赖的接口是否可用、API调用是否超时。
5.一种服务器的监控方法,其特征在于,应用于监控系统的监控服务器,所述监控服务器与部署有应用程序的应用服务器通信连接,所述方法包括:
响应于所述应用服务器发送的包含有应用参数的注册信息,保存所述应用参数,并向所述应用服务器反馈注册成功信息;
接收所述应用服务器按照预先设置的第一时间间隔上报的状态信息,并根据所述状态信息对所述应用服务器进行监控。
6.根据权利要求5所述的服务器的监控方法,其特征在于,所述监控服务器中设置有应用注册接口、应用下线接口和状态上报接口,所述方法还包括:
如果接收到所述应用服务器通过调用所述应用注册接口发送的包含有应用参数的注册信息,则确定监测到所述应用服务器发送的包含有应用参数的注册信息,并将所述应用参数存储至预设的数据库。
7.根据权利要求6所述的服务器的监控方法,其特征在于,接收所述应用服务器按照预先设置的第一时间间隔上报的状态信息的步骤包括:
通过所述状态上报接口接收所述应用服务器按照预先设置的第一时间间隔上报的所述状态信息。
8.根据权利要求6所述的服务器的监控方法,其特征在于,所述方法还包括:
响应于用户的移除操作指令,调用所述应用下线接口;
通过所述应用下线接口移除所述移除操作指令对应的注册信息。
9.一种服务器的监控装置,其特征在于,应用于部署有应用程序的应用服务器,所述应用服务器与监控系统的监控服务器通信连接;所述装置包括:
获取模块,用于如果监测到所述监控服务器反馈的注册成功信息,获取当前应用服务器的状态信息;
上报模块,用于按照预先设置的第一时间间隔将所述状态信息上报至所述监控服务器,以使所述监控服务器对所述应用服务器进行监控。
10.根据权利要求9所述的服务器的监控装置,其特征在于,所述监控服务器中设置有应用注册接口、应用下线接口和状态上报接口,所述装置还用于:
响应于所述应用程序的启动信号,调用所述应用注册接口;
按照预设的第二时间间隔通过所述应用注册接口向所述监控服务器发送包含有应用参数的注册信息;其中,所述应用参数包括所述应用程序的名称信息和所述应用程序所在的主机信息;
如果接收到所述监控服务器根据所述注册信息发送的反馈信号,则确定监测到所述监控服务器反馈的注册成功信息。
11.根据权利要求10所述的服务器的监控装置,其特征在于,所述上报模块还用于:
启动定时任务;
按照预先设置的第一时间间隔调用所述监控服务器的所述状态上报接口,以通过所述状态上报接口将所述状态信息上报至所述监控服务器。
12.根据权利要求9~11任一项所述的服务器的监控装置,其特征在于,所述状态信息包括以下信息中的一种或多种:所述应用程序是否掉线、所述应用服务器是否连接至指定的数据库、所述应用程序所在的磁盘是否已满、所述应用程序依赖的接口是否可用、API调用是否超时。
13.一种服务器的监控装置,其特征在于,应用于监控系统的监控服务器,所述监控服务器与部署有应用程序的应用服务器通信连接,所述装置包括:
保存模块,用于响应于所述应用服务器发送的包含有应用参数的注册信息,保存所述应用参数,并向所述应用服务器反馈注册成功信息;
监控模块,用于接收所述应用服务器按照预先设置的第一时间间隔上报的状态信息,并根据所述状态信息对所述应用服务器进行监控。
14.根据权利要求13所述的服务器的监控装置,其特征在于,所述监控服务器中设置有应用注册接口、应用下线接口和状态上报接口,所述装置还用于:
如果接收到所述应用服务器通过调用所述应用注册接口发送的包含有应用参数的注册信息,则确定监测到所述应用服务器发送的包含有应用参数的注册信息,并将所述应用参数存储至预设的数据库。
15.根据权利要求14所述的服务器的监控装置,其特征在于,所述监控模块还用于:
通过所述状态上报接口接收所述应用服务器按照预先设置的第一时间间隔上报的所述状态信息。
16.根据权利要求14所述的服务器的监控装置,其特征在于,所述装置还用于:
响应于用户的移除操作指令,调用所述应用下线接口;
通过所述应用下线接口移除所述移除操作指令对应的注册信息。
17.一种服务器的监控系统,其特征在于,所述系统包括监控服务器和应用服务器;所述监控服务器和所述应用服务器通信;
其中,所述应用服务器配置有上述权利要求9~12任一项所述的服务器的监控装置,所述监控服务器配置有上述权利要求13~16任一项所述的服务器的监控装置。
18.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至8任一项所述的服务器的监控方法。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现权利要求1至8任一项所述的服务器的监控方法。
CN202010583851.9A 2020-06-23 2020-06-23 服务器的监控方法、装置和系统及电子设备 Pending CN111737085A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010583851.9A CN111737085A (zh) 2020-06-23 2020-06-23 服务器的监控方法、装置和系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010583851.9A CN111737085A (zh) 2020-06-23 2020-06-23 服务器的监控方法、装置和系统及电子设备

Publications (1)

Publication Number Publication Date
CN111737085A true CN111737085A (zh) 2020-10-02

Family

ID=72651654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010583851.9A Pending CN111737085A (zh) 2020-06-23 2020-06-23 服务器的监控方法、装置和系统及电子设备

Country Status (1)

Country Link
CN (1) CN111737085A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113032216A (zh) * 2021-03-26 2021-06-25 山东英信计算机技术有限公司 一种监控方法、装置、设备和介质
CN113641558A (zh) * 2021-08-31 2021-11-12 合众人寿保险股份有限公司 一种健康检查方法、装置及电子设备
CN114640607A (zh) * 2022-05-12 2022-06-17 武汉四通信息服务有限公司 监控服务注册方法、装置、计算机设备和存储介质
CN114640656A (zh) * 2020-12-01 2022-06-17 博泰车联网科技(上海)股份有限公司 更新数据的方法、装置及介质
CN114697985A (zh) * 2020-12-28 2022-07-01 中国联合网络通信集团有限公司 无线运维系统注册方法、装置、电子设备及存储介质
US20220360503A1 (en) * 2021-04-09 2022-11-10 Samsung Electronics Co., Ltd. Method and system for monitoring application services in a network

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114640656A (zh) * 2020-12-01 2022-06-17 博泰车联网科技(上海)股份有限公司 更新数据的方法、装置及介质
CN114697985A (zh) * 2020-12-28 2022-07-01 中国联合网络通信集团有限公司 无线运维系统注册方法、装置、电子设备及存储介质
CN113032216A (zh) * 2021-03-26 2021-06-25 山东英信计算机技术有限公司 一种监控方法、装置、设备和介质
CN113032216B (zh) * 2021-03-26 2023-04-25 山东英信计算机技术有限公司 一种监控方法、装置、设备和介质
US20220360503A1 (en) * 2021-04-09 2022-11-10 Samsung Electronics Co., Ltd. Method and system for monitoring application services in a network
US11792089B2 (en) * 2021-04-09 2023-10-17 Samsung Electronics Co., Ltd. Method and system for monitoring application services in a network
CN113641558A (zh) * 2021-08-31 2021-11-12 合众人寿保险股份有限公司 一种健康检查方法、装置及电子设备
CN114640607A (zh) * 2022-05-12 2022-06-17 武汉四通信息服务有限公司 监控服务注册方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN111737085A (zh) 服务器的监控方法、装置和系统及电子设备
JP7362650B2 (ja) タスク処理方法、装置及びシステム
CN109344014B (zh) 一种主备切换方法、装置及通信设备
CN110830283B (zh) 故障检测方法、装置、设备和系统
CN110336715B (zh) 状态检测方法、主节点和集群管理系统
US8943191B2 (en) Detection of an unresponsive application in a high availability system
CN113067875B (zh) 基于微服务网关动态流控的访问方法和装置以及设备
CN110618864A (zh) 一种中断任务恢复方法及装置
CN110968356A (zh) 配置信息获取的方法和装置
JP2017058751A (ja) 情報処理装置、ログ取得方法およびログ取得プログラム
CN114884840B (zh) 应用健康状态检查方法及电子设备
CN114615310A (zh) 一种维护tcp连接的方法、装置及电子设备
CN113364852B (zh) 文件的传输方法、装置和服务器
CN111737060A (zh) 处理组件异常的方法、装置及电子设备
CN116886490A (zh) 服务器巡检方法、装置及计算机可读存储介质
CN114168071B (zh) 一种分布式集群扩容方法、分布式集群扩容装置及介质
CN115766715A (zh) 一种高可用的超融合集群监控方法和系统
CN116126457A (zh) 容器迁移方法和服务器集群
CN115174660A (zh) 服务注册和发现的方法、装置、电子设备和存储介质
CN111064609A (zh) 消息系统的主从切换方法、装置、电子设备及存储介质
CN111064608A (zh) 消息系统的主从切换方法、装置、电子设备及存储介质
CN110650059A (zh) 故障群集检测方法、装置、计算机设备和存储介质
CN110784554B (zh) web微服务集群服务错误的处理方法和装置
CN112769889B (zh) 服务数据的推送方法、装置、存储介质以及电子装置
CN113157615B (zh) 一种服务总线通信方法、电子设备以及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination