CN110888780A - 应用监控方法、装置、设备及存储介质 - Google Patents

应用监控方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110888780A
CN110888780A CN201911134139.4A CN201911134139A CN110888780A CN 110888780 A CN110888780 A CN 110888780A CN 201911134139 A CN201911134139 A CN 201911134139A CN 110888780 A CN110888780 A CN 110888780A
Authority
CN
China
Prior art keywords
preset
application
request
monitored
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911134139.4A
Other languages
English (en)
Inventor
周振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Taikang Online Property Insurance Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Taikang Online Property Insurance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd, Taikang Online Property Insurance Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN201911134139.4A priority Critical patent/CN110888780A/zh
Publication of CN110888780A publication Critical patent/CN110888780A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供一种应用监控方法、装置、设备及存储介质,该方法包括:实时获取待监控应用中的监控探针采集的待监控应用当前的运行状态参数;将所述监控应用当前的运行状态参数存储至预设数据库中;根据预设时间间隔,从所述预设数据库中获取所述待监控应用当前时间段的运行状态参数;统计所述待监控应用当前时间段的运行状态参数,得到所述待监控应用的目标运行参数;在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户对应的终端设备发送报警信息。本实施例提供的方法能够实现对待监控应用的有效监控,及时发现问题且能够将及时发现的问题通过报警信息通知对应的用户,保证报警的及时性,进而使得用户可以及时处理。

Description

应用监控方法、装置、设备及存储介质
技术领域
本发明实施例涉及监控技术领域,尤其涉及一种应用监控方法、装置、设备及存储介质。
背景技术
web服务通常使用两层(web服务器和数据库)或三层(web服务器,应用服务器和数据库)架构。随着互联网的发展,需要支持大量的并发连接,并且需要将功能和服务有机结合,形成更加复杂的软件栈组合,比如,比三层层次更多的n层架构变得更加普遍。
由于架构的复杂性,如果问题发生在n层架构中,就需要调查大量的组件和服务器,但是,随着在线业务量的快速增长,应用的复杂性不断提升,出现的失败和性能问题难以快速定位以及报警处理。
因此,现有技术无法解决对应用的有效监控,进而不能及时报警处理的问题。
发明内容
本发明实施例提供一种应用监控方法、装置、设备及存储介质,以克服现有技术中无法对应用进行有效监控,进而不能及时报警处理的问题。
第一方面,本发明实施例提供一种应用监控方法,包括:
实时获取待监控应用中的监控探针采集的所述待监控应用当前的运行状态参数,所述待监控应用为配置有监控探针的web应用服务器,所述运行状态参数包括内存使用率、CPU使用率、请求响应时间、请求开始调用时间、调用异常的时间节点;
将所述监控应用当前的运行状态参数存储至预设数据库中;
根据预设时间间隔,从所述预设数据库中获取所述待监控应用当前时间段的运行状态参数;
统计所述待监控应用当前时间段的运行状态参数,得到所述待监控应用的目标运行参数;
在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户对应的终端设备发送报警信息。
可选地,所述统计所述待监控应用当前时间段的运行状态参数,得到所述待监控应用的目标运行参数,包括:
将所述待监控应用当前时间段的请求响应时间分别与预设请求响应时间阈值比较,确定所述请求响应时间对应的请求是否为慢请求,并得到所述待监控应用当前时间段的服务请求总次数、请求失败次数、请求失败率、慢请求次数、慢请求比例;
根据所述待监控应用当前时间段的请求开始调用时间,确定所述待监控应用当前时间段的被调用的慢请求次数、被调用的慢请求比例、被调用的总次数;
根据所述待监控应用当前时间段的每个调用异常的时间节点,确定所述待监控应用当前时间段的被调用的请求错误次数、被调用的请求错误率;
其中,所述目标运行参数包括服务请求总次数、请求失败次数、请求失败率、慢请求次数、慢请求比例、被调用的慢请求次数、被调用的慢请求比例、被调用的总次数、被调用的请求错误次数、被调用的请求错误率。
可选地,所述预设报警条件包括所述服务请求总次数大于预设服务请求总次数、所述请求失败次数大于预设请求失败次数、所述请求失败率大于预设请求失败率、所述慢请求次数大于预设慢请求次数、所述慢请求比例大于预设慢请求比例、所述被调用的慢请求次数大于预设被调用的慢请求次数、所述被调用的慢请求比例大于预设被调用的慢请求比例、所述被调用的总次数大于预设被调用的总次数、所述被调用的请求错误次数大于预设被调用的请求错误次数、所述被调用的请求错误率大于预设被调用的请求错误率;
所述在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户发送报警信息之前,所述方法还包括:
将所述目标运行参数中各个参数与所述预设服务请求总次数、预设请求失败次数、预设请求失败率、预设慢请求次数、预设慢请求比例、预设被调用的慢请求次数、预设被调用的慢请求比例、预设被调用的总次数、预设被调用的请求错误次数、预设被调用的请求错误率比较,若所述目标运行参数中任一个参数满足所述预设报警条件中至少一项,则确定所述目标运行参数满足预设报警条件。
可选地,若所述目标运行参数中存在不满足预设报警条件的第一运行参数时,所述方法还包括:
将所述第一运行参数存储至预设延时表中,对所述第一运行参数进行监控并记录监控时间;
为所述第一运行参数分配第一预设监控时间;
若所述预设延时表中的所述监控时间等于第一预设监控时间,则确定所述第一运行参数是否满足所述预设报警条件;
若所述第一运行参数中存在不满足所述预设报警条件的第二运行参数,则将监控所述第二运行参数的所述第一预设监控时间延长为第二预设监控时间。
可选地,所述在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户发送报警信息,包括:
在确定所述目标运行参数满足预设报警条件时,从所述目标运行参数中获取满足所述预设报警条件的目标参数;
根据所述目标参数,从预设数据库中获取与所述目标参数匹配的维护人员和所述维护人员对应的终端设备的通信地址;
根据所述通信地址,通过预设第三方应用程序,将所述报警信息发送至所述维护人员对应的终端设备;
其中,所述维护人员为与所述待监控应用关联的用户。
可选地,在所述根据所述通信地址,将所述报警信息发送至所述维护人员对应的终端设备之前,所述方法还包括:
根据所述目标参数和所述目标参数满足所述预设报警条件的目标报警条件,生成所述报警信息;
其中,所述报警信息包括报警类型和报警时所述目标参数中各个参数的值,所述报警信息用于指示所述维护人员对所述目标参数进行监控和维护。
可选地,在所述实时获取所述待监控应用中的监控探针采集的所述待监控应用当前的运行状态参数之前,所述方法还包括:
接收用户端发送的登录验证请求,所述登录验证请求中包含用户端的用户信息;
响应于所述登录验证请求,若登录验证请求通过,则向用户端发送验证通过的指示信息,并根据所述用户信息,确定所述待监控应用。
第二方面,本发明实施例提供一种应用监控装置,包括:
采集模块,用于实时获取待监控应用中的监控探针采集的所述待监控应用当前的运行状态参数,所述待监控应用为配置有监控探针的web应用服务器,所述运行状态参数包括内存使用率、CPU使用率、请求响应时间、请求开始调用时间、调用异常的时间节点;
存储模块,用于将所述监控应用当前的运行状态参数存储至预设数据库中;
获取模块,用于根据预设时间间隔,从所述预设数据库中获取所述待监控应用当前时间段的运行状态参数;
统计模块,用于统计所述待监控应用当前时间段的运行状态参数,得到所述待监控应用的目标运行参数;
报警信息发送模块,用于在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户对应的终端设备发送报警信息。
第三方面,本发明实施例提供一种应用监控设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的应用监控方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的应用监控方法。
本实施例提供的应用监控方法、装置、设备及存储介质,先实时获取待监控应用中的监控探针采集的所述待监控应用当前的运行状态参数,所述待监控应用为配置有监控探针的web应用服务器,所述运行状态参数包括内存使用率、CPU使用率、请求响应时间、请求开始调用时间、调用异常的时间节点,对每个时刻的待监控应用的运行状态参数进行监控,首先将所述监控应用当前的运行状态参数存储至预设数据库中,等待预设时间间隔,然后从所述预设数据库中获取当前这一时间段内的各个运行状态参数,再对待监控应用当前这一时间段内的各个运行状态参数进行统计,得到该待监控应用的目标运行参数,然后通过目标运行参数中的各个参数与预设报警条件进行匹配,若该目标运行参数满足预设报警条件,则向与所述待监控应用关联的用户对应的终端设备发送报警信息,实现对待监控应用的有效监控,能够及时发现问题,且能够将及时发现的问题通过报警信息通知对应的用户,保证报警的及时性,进而使得用户可以及时处理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的应用监控方法的交互示意图;
图2为本发明实施例提供的应用监控方法的流程示意图;
图3为本发明又一实施例提供的应用监控方法的流程示意图;
图4为本发明再一实施例提供的应用监控方法的流程示意图;
图5为本发明另一实施例提供的应用监控方法的流程示意图;
图6为本发明实施例提供的应用监控装置的结构示意图;
图7为本发明实施例提供的应用监控设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例,例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
现有技术中,如果问题发生在n层架构中,就需要调查大量的组件和服务器,但是,随着在线业务量的快速增长,应用的复杂性不断提升,出现的失败和性能问题难以快速定位以及报警处理。为了解决上述技术问题,本发明实施例提供一种应用监控方法以解决上述问题。
图1为本发明实施例提供的应用监控方法的交互示意图,服务器20以及用户端10即终端设备,所述服务器用于监控应用的运行状态参数,并将达到预设报警条件的参数进行上报给对应的用户端10,用户端10根据上报的报警信息进行处理。
本实施例的执行主体可以为服务器,在实际应用中,在服务器配置的pinpoint(开源在github上的一款APM监控工具)中,核心数据结构是由交换端口分析器Span、Trace和TraceId组成,其中,Span是远程过程调用协议(Remote Procedure Call Protocol,RPC)跟踪的基本单元。当一个RPC调用到达时指示工作已经处理完成并包含跟踪数据,其中,在服务器的配置中Span携带有SpanEvent标签的子结构作为数据结构,每个Span包含一个TraceId;Trace是多个Span的集合,由关联的RPC(Spans)组成,在同一个trace中的span共享相同的交易ID(TransactionId)。Trace通过SpanId和ParentSpanId整理为继承树结构;TraceId是由TransactionId、SpanId和ParentSpanId组成的标识的集合,TransactionId是指消息ID,而SpanId和ParentSpanId表示RPC的父-子关系。其中,TransactionId(TxId)是在分布式系统中单个事务发送/接收的消息的ID,TransactionId是跨整个服务器集群的全局唯一。SpanId:当收到RPC消息时处理的工作的ID,是在RPC请求到达节点时生成。ParentSpanId(pSpanId):发起RPC调用的父span的SpanId,如果节点是事务的起点,这里将没有父span,对于这种情况,通过-1来表示这个span是事务的根span。
为了识别PRC之间的关系,需要SpanId和ParentSpanId(pSpanId).假设一个节点是Tomcat,可以将SpanId作为为处理HTTP请求的线程,ParentSpanId代表发起这个RPC调用的SpanId,使用TransactionId,Pinpoint可以发现关联的n个Span,并使用SpanId和ParentSpanId将这n个span排列为继承树结构。SpanId和ParentSpanId可以是64位长度的整型。
其中,当虚拟机启动时用户创建的ID是服务器集群中全局唯一,虚拟机启动时间需要用来保证从0开始的序号的唯一性,当用户错误的创建了重复的ID时这个值可以用来预防ID冲突。序号:Pinpoint agent(监控探针)生成的ID,从0开始连续自增,为每个消息生成一个。
本申请中,通过上述配置好的服务器,可以参见图2,图2为本发明实施例提供的应用监控方法的流程示意图。所述应用监控方法,包括:
S101、实时获取待监控应用中的监控探针采集的所述待监控应用当前的运行状态参数,所述待监控应用为配置有监控探针的web应用服务器,所述运行状态参数包括内存使用率、CPU使用率、请求响应时间、请求开始调用时间、调用异常的时间节点。
本实施例中,实时采集待监控应用当前的运行状态参数,其中,所述运行状态参数可以包括内存使用率、CPU使用率、请求响应时间、请求开始调用时间、调用异常的时间节点。具体地,通过配置在待监控应用上的监控探针agent来实时采集待监控应用的运行状态参数,比如内存使用率、CPU使用率、请求响应时间、请求开始调用时间、调用异常的时间节点。并通过监控探针端将获取到的待监控应用当前的运行状态参数推送给服务器,服务器实时接收或采集待监控应用当前的运行状态参数。
S102、将所述监控应用当前的运行状态参数存储至预设数据库中;
S103、根据预设时间间隔,从所述预设数据库中获取所述待监控应用当前时间段的运行状态参数;
S104、统计所述待监控应用当前时间段的运行状态参数,得到所述待监控应用的目标运行参数。
本实施例中,服务器将实时采集到的待监控应用当前的运行状态参数存储至预设数据库中,比如Hbase,然后定期从预设数据库中取数据,比如5s取一次数据,每次取的数据为过去5s这个时间段内的agent端推送过来的数据并进行统计。其中,服务器在存储数据的时候可以是将运行状态参数对应的报警类型进行分类存储,比如将属于安全类数据的存储为一类,将属于核算类数据的存储为一类等等。
具体地,服务器统计分类过去5s内的收集器即collector端收集存放在hbase数据库中的各类型的待报警信息,collector端在存放agent采集回来的数据的时已经按照待监控应用的编号、待监控应用的虚拟机jvm、cpu等分类存储。因此,服务器在统计时只需要从hbase中读取,然后进行统计即可。
S105、在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户对应的终端设备发送报警信息。
本实施例中,比对服务器中配置的推送消息的阈值,这里的阈值包括预设服务请求总次数、预设请求失败次数、预设请求失败率、预设慢请求次数、预设慢请求比例、预设被调用的慢请求次数、预设被调用的慢请求比例、预设被调用的总次数、预设被调用的请求错误次数、预设被调用的请求错误率等,服务器中还配置有一个预设第三方应用程序发送报警信息的阈值监控器,阈值监控器会实时对比服务器统计出来的各类型的报警参数(即目标运行参数),一旦目标运行参数超过对应的阈值,服务器会自动触发给预设的警报信息接收组的人员推送报警信息。其中,报警的信息包括报警类型和报警时参数达到的值。这些信息可以以用户组为单位推送给整个组的每个人。
在实际应用中,服务器可以配置为基于字节码插桩实现的分布式监控系统,在待监控应用的服务器上添加agent监控探针,然后,由服务器的collector端收集并存储agent端推送过来的待监控应用的服务请求总次数、请求失败次数、请求失败率、慢请求次数、慢请求比例、被调用的慢请求次数、被调用的慢请求比例、被调用的总次数、被调用的请求错误次数、被调用的请求错误率、虚拟机的内存使用率、CPU使用率,这些参数都会传送给collector收集端,最后会在服务器的web端进行汇总信息并展示,展示待监控应用的调用关系及调用次数,还可以跟踪每个请求具体做了什么操作。具体地,接入监控过程:1)需要对应用程序中的tomcat服务器添加探针配置。2)服务器添加完探针配置之后,需要重启应用服务器,然后agent就会监听重启之后的应用服务器。接入应用过程:根据监控接入配置的待监控应用的名称,由管理员在监控展示平台也就是监控平台的web端进行报警条件的配置,以及接收报警信息的用户组的配置;监控展示端查看被监控的应用的运行状态,根据加入的待监控的应用的监控探针配置,在监控展示端选中新添加的待监控应用,可以看到新加的待监控应用的运行状态。
本实施例中,先实时采集待监控应用当前的运行状态参数,对每个时刻的待监控应用的运行状态参数进行监控,首先将所述监控应用当前的运行状态参数存储至预设数据库中,等待预设时间间隔,然后从所述预设数据库中获取当前这一时间段内的各个运行状态参数,再对待监控应用当前这一时间段内的各个运行状态参数进行统计,得到该待监控应用的目标运行参数,然后通过目标运行参数中的各个参数与预设报警条件进行匹配,若该目标运行参数满足预设报警条件,则向与所述待监控应用关联的用户对应的终端设备发送报警信息,实现对待监控应用的有效监控,能够及时发现问题,且能够将及时发现的问题通过报警信息通知对应的用户,保证报警的及时性,进而使得用户可以及时处理。
如何得到所述待监控应用的目标运行参数,参见图3所示,图3为本发明又一实施例提供的应用监控方法的流程示意图。本实施例在上述实施例的基础上,比如,在图1所示的实施例的基础上,对S104进行了详细说明。所述统计所述待监控应用当前时间段的运行状态参数,得到所述待监控应用的目标运行参数,包括:
S201、将所述待监控应用当前时间段的请求响应时间分别与预设请求响应时间阈值比较,确定所述请求响应时间对应的请求是否为慢请求,并得到所述待监控应用当前时间段的服务请求总次数、请求失败次数、请求失败率、慢请求次数、慢请求比例;
S202、根据所述待监控应用当前时间段的请求开始调用时间,确定所述待监控应用当前时间段的被调用的慢请求次数、被调用的慢请求比例、被调用的总次数;
S203、根据所述待监控应用当前时间段的每个调用异常的时间节点,确定所述待监控应用当前时间段的被调用的请求错误次数、被调用的请求错误率;其中,所述目标运行参数包括服务请求总次数、请求失败次数、请求失败率、慢请求次数、慢请求比例、被调用的慢请求次数、被调用的慢请求比例、被调用的总次数、被调用的请求错误次数、被调用的请求错误率。
本实施例中,待监控应用当前时间段内的请求响应时间的个数可以为至少一个,因此,服务器针对监控应用当前时间段内的至少一个请求响应时间中的每个请求响应时间,将每个请求响应时间分别与预设请求响应时间阈值比较,首先判断该请求响应时间对应的请求是否是慢请求,其中,若请求响应时间大于预设请求响应时间,则说明该请求响应时间对应的请求是慢请求,若请求响应时间为0,则说明请求失败,并统计至少一个请求响应时间中服务请求总次数、请求失败次数、请求失败率、慢请求次数、慢请求比例。
待监控应用当前时间段内的请求开始调用时间的个数可以为至少一个,因此,服务器针对监控应用当前时间段内的至少一个请求开始调用时间中的每个请求开始调用时间,根据每个请求开始调用时间,确定该请求开始调用时间对应的请求是否是被调用的慢请求,若是被调用的慢请求,则统计至少一个请求开始调用时间中被调用的慢请求次数、被调用的慢请求比例并统计被调用的总次数。
待监控应用当前时间段内的调用异常的时间节点的个数可以为至少一个,因此,服务器针对监控应用当前时间段内的至少一个调用异常的时间节点中被调用的请求错误次数、被调用的请求错误率。其中,服务请求总次数、请求失败次数、请求失败率、慢请求次数、慢请求比例、被调用的慢请求次数、被调用的慢请求比例、被调用的总次数、被调用的请求错误次数、被调用的请求错误率均为目标运行参数。
可选地,所述预设报警条件包括所述服务请求总次数大于预设服务请求总次数、所述请求失败次数大于预设请求失败次数、所述请求失败率大于预设请求失败率、所述慢请求次数大于预设慢请求次数、所述慢请求比例大于预设慢请求比例、所述被调用的慢请求次数大于预设被调用的慢请求次数、所述被调用的慢请求比例大于预设被调用的慢请求比例、所述被调用的总次数大于预设被调用的总次数、所述被调用的请求错误次数大于预设被调用的请求错误次数、所述被调用的请求错误率大于预设被调用的请求错误率;所述在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户发送报警信息之前,所述方法还包括:
将所述目标运行参数中各个参数与所述预设服务请求总次数、预设请求失败次数、预设请求失败率、预设慢请求次数、预设慢请求比例、预设被调用的慢请求次数、预设被调用的慢请求比例、预设被调用的总次数、预设被调用的请求错误次数、预设被调用的请求错误率比较,若所述目标运行参数中任一个参数满足所述预设报警条件中至少一项,则确定所述目标运行参数满足预设报警条件。
本实施例中,如何确定所述目标运行参数是否满足预设报警条件,可以通过将所述目标运行参数中各个参数与目标运行参数中各个参数对应的阈值进行比较,即将所述目标运行参数中各个参数与所述预设服务请求总次数、预设请求失败次数、预设请求失败率、预设慢请求次数、预设慢请求比例、预设被调用的慢请求次数、预设被调用的慢请求比例、预设被调用的总次数、预设被调用的请求错误次数、预设被调用的请求错误率比较,若所述目标运行参数中任一个参数满足所述预设报警条件中至少一项,比如待监控应用当前时间段的服务请求总次数大于预设服务请求总次数,则说明该待监控应用的目标运行参数满足预设报警条件,可以针对监控应用当前时间段的服务请求总次数超过对应的阈值进行报警。
为了防止一个警报未达到阈值时一直占用发送报警信息的阈值监控器的工作时间,可以参见图4所示,图4为本发明再一实施例提供的应用监控方法的流程示意图,本实施例在上述实施例的基础上,本实施例对应用监控方法进行了详细说明。若所述目标运行参数中存在不满足预设报警条件的第一运行参数时,所述方法还包括:
S301、将所述第一运行参数存储至预设延时表中,对所述第一运行参数进行监控并记录监控时间;
S302、为所述第一运行参数分配第一预设监控时间;
S303、若所述预设延时表中的所述监控时间等于第一预设监控时间,则确定所述第一运行参数是否满足所述预设报警条件;
S304、若所述第一运行参数中存在不满足所述预设报警条件的第二运行参数,则将监控所述第二运行参数的所述第一预设监控时间延长为第二预设监控时间。
本实施例中,为了防止一个警报未达到阈值时一直占用发送报警信息的阈值监控器的工作时间,会把未达到阈值的第一运行参数放置到预设延时表中,每次服务器中的监控器会先看预设延时表中第一运行参数是否到了监控时间,到达监控时间才会进行阈值对比操作,如果阈值对比还是未达到会延长要监控的时间节点即将第一预设监控时间延长为第二预设监控时间,可以防止服务器资源的浪费。
如何向与所述待监控应用关联的用户发送报警信息,参见图5所示,图5为本发明另一实施例提供的应用监控方法的流程示意图,本实施例在上述实施例的基础上,对S105进行了详细说明。所述在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户发送报警信息,包括:
S401、在确定所述目标运行参数满足预设报警条件时,从所述目标运行参数中获取满足所述预设报警条件的目标参数;
S402、根据所述目标参数,从预设数据库中获取与所述目标参数匹配的维护人员和所述维护人员对应的终端设备的通信地址;
S403、根据所述通信地址,通过预设第三方应用程序,将所述报警信息发送至所述维护人员对应的终端设备;其中,所述维护人员为与所述待监控应用关联的用户。
可选地,在所述根据所述通信地址,将所述报警信息发送至所述维护人员对应的终端设备之前,所述方法还包括:
根据所述目标参数和所述目标参数满足所述预设报警条件的目标报警条件,生成所述报警信息;其中,所述报警信息包括报警类型和报警时所述目标参数中各个参数的值,所述报警信息用于指示所述维护人员对所述目标参数进行监控和维护。
本实施例中,预设数据库中存储有待监控应用的名称、ID、各个报警类型对应的维护人员以及维护人员对应的终端设备的通信地址。当确定目标运行参数满足预设报警条件时,首先获取满足所述预设报警条件的目标参数,该目标参数是目标运行参数中满足预设报警条件的参数,然后根据目标参数,确定报警类型,根据报警类型,从预设数据库中获取与该报警类型匹配的维护人员和所述维护人员对应的终端设备的通信地址,最后根据通信地址,通过预设第三方应用程序,比如微信,将该含有报警类型和报警时所述目标参数中各个参数的值的报警信息发送至维护人员对应的终端设备,并指示所述维护人员对所述目标参数进行监控和维护,实现对待监控应用的有效监控,能够及时发现问题,且能够将及时发现的问题通过报警信息通知对应的用户,保证报警的及时性,进而使得用户可以及时处理。
可选地,在所述实时获取所述待监控应用中的监控探针采集的所述待监控应用当前的运行状态参数之前,所述方法还包括:
接收用户端发送的登录验证请求,所述登录验证请求中包含用户端的用户信息;响应于所述登录验证请求,若登录验证请求通过,则向用户端发送验证通过的指示信息,并根据所述用户信息,确定所述待监控应用。
在实际应用中,监控以及报警流程可以为:用户登录服务器;对用户进行验证,如果验证失败,则指示用户密码或者账号错误;如果验证成功且是普通用户,服务器监控该普通用户主界面,并确定要查看的待监控的应用,查看该待监控应用的运行状态参数;如果验证成功且是管理员,服务器监控该管理员主页面,配置用户组以及用户,然后配置预设报警条件(或推送消息的阈值)和推送报警信息的规则,比如微信推送等,然后统计过去5s这个时间段内的agent端推送过来的数据并进行统计,将得到目标运行状态参数中各个参数的值,比对服务器中配置的推送消息的阈值进行比较,某一参数超过阈值,则服务器触发发送微信信息给对应组的人推送报警信息,如果未超过阈值,则将未超过阈值的参数存储至预设延时表中,等待下一次与阈值比较。
因此,本发明可以应用在各个分布式应用系统中监控系统的慢请求数、慢请求比例、请求失败数、请求失败率、总请求数量、被调用的慢请求数量、被调用的慢请求比例、被调用的请求错误数、被调用的错误率、被调用的总数量、内存使用率、CPU使用率等系统指标,当这些指标超过预设的阈值(推送消息的阈值)时触发发送推送信息,可以使相关人员及时知晓系统(应用)异常情况,可大大压缩发现系统异常的时间,快速定位问题并及时解决,能够实现单点登陆及用户权限的控制,可以增强监控系统的安全性,无需对被监控的系统(应用)做过多的代码修改及配置,直接可以对运行的容器进行简单的配置就可以实现对应用的监控。
为了实现所述应用监控方法,本实施例提供了一种应用监控装置。参见图6,图6为本发明实施例提供的应用监控装置的结构示意图;所述应用监控装置60,包括:采集模块601、存储模块602、获取模块603、统计模块604、报警信息发送模块605;采集模块601,用于实时获取待监控应用中的监控探针采集的所述待监控应用当前的运行状态参数,所述待监控应用为配置有监控探针的web应用服务器,所述运行状态参数包括内存使用率、CPU使用率、请求响应时间、请求开始调用时间、调用异常的时间节点;存储模块602,用于将所述监控应用当前的运行状态参数存储至预设数据库中;获取模块603,用于根据预设时间间隔,从所述预设数据库中获取所述待监控应用当前时间段的运行状态参数;统计模块604,用于统计所述待监控应用当前时间段的运行状态参数,得到所述待监控应用的目标运行参数;报警信息发送模块605,用于在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户对应的终端设备发送报警信息。
本实施例中通过采集模块601、存储模块602、获取模块603、统计模块604、报警信息发送模块605,用于实时获取待监控应用中的监控探针采集的所述待监控应用当前的运行状态参数,所述待监控应用为配置有监控探针的web应用服务器,所述运行状态参数包括内存使用率、CPU使用率、请求响应时间、请求开始调用时间、调用异常的时间节点,对每个时刻的待监控应用的运行状态参数进行监控,首先将所述监控应用当前的运行状态参数存储至预设数据库中,等待预设时间间隔,然后从所述预设数据库中获取当前这一时间段内的各个运行状态参数,再对待监控应用当前这一时间段内的各个运行状态参数进行统计,得到该待监控应用的目标运行参数,然后通过目标运行参数中的各个参数与预设报警条件进行匹配,若该目标运行参数满足预设报警条件,则向与所述待监控应用关联的用户对应的终端设备发送报警信息,实现对待监控应用的有效监控,能够及时发现问题,且能够将及时发现的问题通过报警信息通知对应的用户,保证报警的及时性,进而使得用户可以及时处理。
本实施例提供的装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
可选地,统计模块604,具体用于:
将所述待监控应用当前时间段的请求响应时间分别与预设请求响应时间阈值比较,确定所述请求响应时间对应的请求是否为慢请求,并得到所述待监控应用当前时间段的服务请求总次数、请求失败次数、请求失败率、慢请求次数、慢请求比例;根据所述待监控应用当前时间段的请求开始调用时间,确定所述待监控应用当前时间段的被调用的慢请求次数、被调用的慢请求比例、被调用的总次数;根据所述待监控应用当前时间段的调用异常的时间节点,确定所述待监控应用当前时间段的被调用的请求错误次数、被调用的请求错误率;其中,所述目标运行参数包括服务请求总次数、请求失败次数、请求失败率、慢请求次数、慢请求比例、被调用的慢请求次数、被调用的慢请求比例、被调用的总次数、被调用的请求错误次数、被调用的请求错误率。
可选地,所述预设报警条件包括所述服务请求总次数大于预设服务请求总次数、所述请求失败次数大于预设请求失败次数、所述请求失败率大于预设请求失败率、所述慢请求次数大于预设慢请求次数、所述慢请求比例大于预设慢请求比例、所述被调用的慢请求次数大于预设被调用的慢请求次数、所述被调用的慢请求比例大于预设被调用的慢请求比例、所述被调用的总次数大于预设被调用的总次数、所述被调用的请求错误次数大于预设被调用的请求错误次数、所述被调用的请求错误率大于预设被调用的请求错误率;所述装置还包括:判断模块;判断模块,用于在向与所述待监控应用关联的用户发送报警信息之前,将所述目标运行参数中各个参数与所述预设服务请求总次数、预设请求失败次数、预设请求失败率、预设慢请求次数、预设慢请求比例、预设被调用的慢请求次数、预设被调用的慢请求比例、预设被调用的总次数、预设被调用的请求错误次数、预设被调用的请求错误率比较,若所述目标运行参数中任一个参数满足所述预设报警条件中至少一项,则确定所述目标运行参数满足预设报警条件。
可选地,所述装置还包括:处理模块;处理模块,用于在所述目标运行参数中存在不满足预设报警条件的第一运行参数时,将所述第一运行参数存储至预设延时表中,对所述第一运行参数进行监控并记录监控时间;为所述第一运行参数分配第一预设监控时间;若所述预设延时表中的所述监控时间等于第一预设监控时间,则确定所述第一运行参数是否满足所述预设报警条件;若所述第一运行参数中存在不满足所述预设报警条件的第二运行参数,则将监控所述第二运行参数的所述第一预设监控时间延长为第二预设监控时间。
可选地,报警信息发送模块605,具体用于:在确定所述目标运行参数满足预设报警条件时,从所述目标运行参数中获取满足所述预设报警条件的目标参数;根据所述目标参数,从预设数据库中获取与所述目标参数匹配的维护人员和所述维护人员对应的终端设备的通信地址;根据所述通信地址,通过预设第三方应用程序,将所述报警信息发送至所述维护人员对应的终端设备;其中,所述维护人员为与所述待监控应用关联的用户。
可选地,所述装置还包括:验证模块和待监控应用确定模块;验证模块,用于在所述实时获取所述待监控应用中的监控探针采集的所述待监控应用当前的运行状态参数之前,接收用户端发送的登录验证请求,所述登录验证请求中包含用户端的用户信息;待监控应用确定模块,用于响应于所述登录验证请求,若登录验证请求通过,则向用户端发送验证通过的指示信息,并根据所述用户信息,确定所述待监控应用。
可选地,所述装置还包括:报警信息生成模块;报警信息生成模块,用于在所述根据所述通信地址,将所述报警信息发送至所述维护人员对应的终端设备之前,根据所述目标参数和所述目标参数满足所述预设报警条件的目标报警条件,生成所述报警信息;其中,所述报警信息包括报警类型和报警时所述目标参数中各个参数的值,所述报警信息用于指示所述维护人员对所述目标参数进行监控和维护。
为了实现所述应用监控方法,本实施例提供了一种应用监控设备。图7为本发明实施例提供的应用监控设备的结构示意图。如图7所示,本实施例的应用监控设备70包括:处理器701以及存储器702;其中,存储器702,用于存储计算机执行指令;处理器701,用于执行存储器存储的计算机执行指令,以实现上述实施例中所执行的各个步骤。具体可以参见前述方法实施例中的相关描述。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上所述的应用监控方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。应理解,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(PeripheralComponent,PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本发明附图中的总线并不限定仅有一根总线或一种类型的总线。上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称:ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种应用监控方法,其特征在于,包括:
实时获取待监控应用中的监控探针采集的所述待监控应用当前的运行状态参数,所述待监控应用为配置有监控探针的web应用服务器,所述运行状态参数包括内存使用率、CPU使用率、请求响应时间、请求开始调用时间、调用异常的时间节点;
将所述监控应用当前的运行状态参数存储至预设数据库中;
根据预设时间间隔,从所述预设数据库中获取所述待监控应用当前时间段的运行状态参数;
统计所述待监控应用当前时间段的运行状态参数,得到所述待监控应用的目标运行参数;
在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户对应的终端设备发送报警信息。
2.根据权利要求1所述的方法,其特征在于,所述统计所述待监控应用当前时间段的运行状态参数,得到所述待监控应用的目标运行参数,包括:
将所述待监控应用当前时间段的请求响应时间分别与预设请求响应时间阈值比较,确定所述请求响应时间对应的请求是否为慢请求,并得到所述待监控应用当前时间段的服务请求总次数、请求失败次数、请求失败率、慢请求次数、慢请求比例;
根据所述待监控应用当前时间段的请求开始调用时间,确定所述待监控应用当前时间段的被调用的慢请求次数、被调用的慢请求比例、被调用的总次数;
根据所述待监控应用当前时间段的调用异常的时间节点,确定所述待监控应用当前时间段的被调用的请求错误次数、被调用的请求错误率;
其中,所述目标运行参数包括服务请求总次数、请求失败次数、请求失败率、慢请求次数、慢请求比例、被调用的慢请求次数、被调用的慢请求比例、被调用的总次数、被调用的请求错误次数、被调用的请求错误率。
3.根据权利要求2所述的方法,其特征在于,所述预设报警条件包括所述服务请求总次数大于预设服务请求总次数、所述请求失败次数大于预设请求失败次数、所述请求失败率大于预设请求失败率、所述慢请求次数大于预设慢请求次数、所述慢请求比例大于预设慢请求比例、所述被调用的慢请求次数大于预设被调用的慢请求次数、所述被调用的慢请求比例大于预设被调用的慢请求比例、所述被调用的总次数大于预设被调用的总次数、所述被调用的请求错误次数大于预设被调用的请求错误次数、所述被调用的请求错误率大于预设被调用的请求错误率;
所述在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户发送报警信息之前,所述方法还包括:
将所述目标运行参数中各个参数与所述预设服务请求总次数、预设请求失败次数、预设请求失败率、预设慢请求次数、预设慢请求比例、预设被调用的慢请求次数、预设被调用的慢请求比例、预设被调用的总次数、预设被调用的请求错误次数、预设被调用的请求错误率比较,若所述目标运行参数中任一个参数满足所述预设报警条件中至少一项,则确定所述目标运行参数满足预设报警条件。
4.根据权利要求2所述的方法,其特征在于,若所述目标运行参数中存在不满足预设报警条件的第一运行参数时,所述方法还包括:
将所述第一运行参数存储至预设延时表中,对所述第一运行参数进行监控并记录监控时间;
为所述第一运行参数分配第一预设监控时间;
若所述预设延时表中的所述监控时间等于第一预设监控时间,则确定所述第一运行参数是否满足所述预设报警条件;
若所述第一运行参数中存在不满足所述预设报警条件的第二运行参数,则将监控所述第二运行参数的所述第一预设监控时间延长为第二预设监控时间。
5.根据权利要求2所述的方法,其特征在于,所述在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户发送报警信息,包括:
在确定所述目标运行参数满足预设报警条件时,从所述目标运行参数中获取满足所述预设报警条件的目标参数;
根据所述目标参数,从预设数据库中获取与所述目标参数匹配的维护人员和所述维护人员对应的终端设备的通信地址;
根据所述通信地址,通过预设第三方应用程序,将所述报警信息发送至所述维护人员对应的终端设备;
其中,所述维护人员为与所述待监控应用关联的用户。
6.根据权利要求5所述的方法,其特征在于,在所述根据所述通信地址,将所述报警信息发送至所述维护人员对应的终端设备之前,所述方法还包括:
根据所述目标参数和所述目标参数满足所述预设报警条件的目标报警条件,生成所述报警信息;
其中,所述报警信息包括报警类型和报警时所述目标参数中各个参数的值,所述报警信息用于指示所述维护人员对所述目标参数进行监控和维护。
7.根据权利要求1-6任一项所述的方法,其特征在于,在所述实时获取所述待监控应用中的监控探针采集的所述待监控应用当前的运行状态参数之前,所述方法还包括:
接收用户端发送的登录验证请求,所述登录验证请求中包含用户端的用户信息;
响应于所述登录验证请求,若登录验证请求通过,则向用户端发送验证通过的指示信息,并根据所述用户信息,确定所述待监控应用。
8.一种应用监控装置,其特征在于,包括:
采集模块,用于实时获取待监控应用中的监控探针采集的所述待监控应用当前的运行状态参数,所述待监控应用为配置有监控探针的web应用服务器,所述运行状态参数包括内存使用率、CPU使用率、请求响应时间、请求开始调用时间、调用异常的时间节点;
存储模块,用于将所述监控应用当前的运行状态参数存储至预设数据库中;
获取模块,用于根据预设时间间隔,从所述预设数据库中获取所述待监控应用当前时间段的运行状态参数;
统计模块,用于统计所述待监控应用当前时间段的运行状态参数,得到所述待监控应用的目标运行参数;
报警信息发送模块,用于在确定所述目标运行参数满足预设报警条件时,向与所述待监控应用关联的用户对应的终端设备发送报警信息。
9.一种应用监控设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至7任一项所述的应用监控方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至7任一项所述的应用监控方法。
CN201911134139.4A 2019-11-19 2019-11-19 应用监控方法、装置、设备及存储介质 Pending CN110888780A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911134139.4A CN110888780A (zh) 2019-11-19 2019-11-19 应用监控方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911134139.4A CN110888780A (zh) 2019-11-19 2019-11-19 应用监控方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN110888780A true CN110888780A (zh) 2020-03-17

Family

ID=69747923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911134139.4A Pending CN110888780A (zh) 2019-11-19 2019-11-19 应用监控方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110888780A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400129A (zh) * 2020-03-06 2020-07-10 广东电网有限责任公司 一种分布式应用性能监控及瓶颈定位系统、方法及设备
CN111541590A (zh) * 2020-07-08 2020-08-14 广州市玄武无线科技股份有限公司 链路监控方法、告警方法、系统、终端及存储介质
CN111953558A (zh) * 2020-07-10 2020-11-17 泰康保险集团股份有限公司 敏感信息的监控方法、装置、电子设备及存储介质
CN112256548A (zh) * 2020-11-06 2021-01-22 微医云(杭州)控股有限公司 异常数据的监听方法、装置、服务器及存储介质
CN112527620A (zh) * 2020-12-24 2021-03-19 北京百度网讯科技有限公司 数据库性能分析方法及装置、电子设备、介质、产品
CN112559292A (zh) * 2020-12-18 2021-03-26 北京北方华创微电子装备有限公司 设备应用监控方法、半导体工艺设备
CN112822095A (zh) * 2021-01-26 2021-05-18 广州欢网科技有限责任公司 基于api网关的报警装置和api网关
CN112968933A (zh) * 2021-01-29 2021-06-15 北京达佳互联信息技术有限公司 数据传输方法、装置、服务器及存储介质
CN113254310A (zh) * 2021-05-25 2021-08-13 北京搜房科技发展有限公司 服务器监控系统及方法
CN113377610A (zh) * 2021-06-07 2021-09-10 北京博睿宏远数据科技股份有限公司 性能监测方法、装置、计算机设备及存储介质
CN113778778A (zh) * 2020-08-25 2021-12-10 北京沃东天骏信息技术有限公司 一种预警方法和装置
CN113941901A (zh) * 2020-07-17 2022-01-18 智能云科信息科技有限公司 机床刀具监控方法、监控装置及电子设备
CN114143165A (zh) * 2020-08-14 2022-03-04 北京达佳互联信息技术有限公司 业务报警方法、装置、服务器、存储介质及程序产品
CN114185734A (zh) * 2021-11-26 2022-03-15 北京百度网讯科技有限公司 一种监控集群的方法、装置及电子设备
CN114338368A (zh) * 2021-12-30 2022-04-12 南京中孚信息技术有限公司 基于单向导入设备的网络监管方法、设备及介质
CN114328088A (zh) * 2021-12-09 2022-04-12 泰康保险集团股份有限公司 一种采集数据的方法、装置及电子设备
CN114489835A (zh) * 2022-01-06 2022-05-13 国网山东省电力公司泰安供电公司 一种移动应用性能体验度量方法及系统
CN115118575A (zh) * 2022-06-23 2022-09-27 奇安信科技集团股份有限公司 一种监控方法、装置、电子设备及存储介质
CN115311825A (zh) * 2022-07-07 2022-11-08 深圳市大族数控科技股份有限公司 Pcb设备报警数据推送方法、装置、计算机设备及存储介质
EP4160418A1 (en) * 2021-10-01 2023-04-05 Sap Se Issue detection system
CN117112366A (zh) * 2023-09-14 2023-11-24 国能大渡河大数据服务有限公司 一种基于esb的数据交换监控方法及系统
CN112559292B (zh) * 2020-12-18 2024-06-21 北京北方华创微电子装备有限公司 设备应用监控方法、半导体工艺设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339296A (zh) * 2016-08-31 2017-01-18 虎扑(上海)文化传播股份有限公司 服务状态监测方法和装置
CN106534242A (zh) * 2015-09-14 2017-03-22 阿里巴巴集团控股有限公司 一种分布式系统中请求的处理方法以及装置
CN106815115A (zh) * 2017-01-13 2017-06-09 郑州云海信息技术有限公司 一种服务器运行状态监控系统
CN107171828A (zh) * 2017-04-18 2017-09-15 北京思特奇信息技术股份有限公司 一种应对远程调用依赖的超时熔断方法和系统
CN108132868A (zh) * 2018-01-15 2018-06-08 政采云有限公司 一种数据监控方法、装置、计算设备及存储介质
CN108243239A (zh) * 2016-12-27 2018-07-03 阿里巴巴集团控股有限公司 一种提供网页应用服务的方法、装置、电子设备及系统
CN109343987A (zh) * 2018-08-20 2019-02-15 科大国创软件股份有限公司 It系统故障诊断及修复方法、装置、设备、存储介质
CN109739727A (zh) * 2019-01-03 2019-05-10 优信拍(北京)信息科技有限公司 微服务架构中的服务监控方法及装置
CN109739718A (zh) * 2018-11-30 2019-05-10 贵阳朗玛信息技术股份有限公司 日志报警方法及装置
CN109976935A (zh) * 2019-03-14 2019-07-05 北京三快在线科技有限公司 微服务架构、微服务节点及其熔断恢复方法、装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106534242A (zh) * 2015-09-14 2017-03-22 阿里巴巴集团控股有限公司 一种分布式系统中请求的处理方法以及装置
CN106339296A (zh) * 2016-08-31 2017-01-18 虎扑(上海)文化传播股份有限公司 服务状态监测方法和装置
CN108243239A (zh) * 2016-12-27 2018-07-03 阿里巴巴集团控股有限公司 一种提供网页应用服务的方法、装置、电子设备及系统
CN106815115A (zh) * 2017-01-13 2017-06-09 郑州云海信息技术有限公司 一种服务器运行状态监控系统
CN107171828A (zh) * 2017-04-18 2017-09-15 北京思特奇信息技术股份有限公司 一种应对远程调用依赖的超时熔断方法和系统
CN108132868A (zh) * 2018-01-15 2018-06-08 政采云有限公司 一种数据监控方法、装置、计算设备及存储介质
CN109343987A (zh) * 2018-08-20 2019-02-15 科大国创软件股份有限公司 It系统故障诊断及修复方法、装置、设备、存储介质
CN109739718A (zh) * 2018-11-30 2019-05-10 贵阳朗玛信息技术股份有限公司 日志报警方法及装置
CN109739727A (zh) * 2019-01-03 2019-05-10 优信拍(北京)信息科技有限公司 微服务架构中的服务监控方法及装置
CN109976935A (zh) * 2019-03-14 2019-07-05 北京三快在线科技有限公司 微服务架构、微服务节点及其熔断恢复方法、装置

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400129A (zh) * 2020-03-06 2020-07-10 广东电网有限责任公司 一种分布式应用性能监控及瓶颈定位系统、方法及设备
CN111400129B (zh) * 2020-03-06 2022-02-11 广东电网有限责任公司 一种分布式应用性能监控及瓶颈定位系统、方法及设备
CN111541590A (zh) * 2020-07-08 2020-08-14 广州市玄武无线科技股份有限公司 链路监控方法、告警方法、系统、终端及存储介质
CN111953558A (zh) * 2020-07-10 2020-11-17 泰康保险集团股份有限公司 敏感信息的监控方法、装置、电子设备及存储介质
CN113941901B (zh) * 2020-07-17 2024-04-23 智能云科信息科技有限公司 机床刀具监控方法、监控装置及电子设备
CN113941901A (zh) * 2020-07-17 2022-01-18 智能云科信息科技有限公司 机床刀具监控方法、监控装置及电子设备
CN114143165A (zh) * 2020-08-14 2022-03-04 北京达佳互联信息技术有限公司 业务报警方法、装置、服务器、存储介质及程序产品
CN113778778A (zh) * 2020-08-25 2021-12-10 北京沃东天骏信息技术有限公司 一种预警方法和装置
CN112256548A (zh) * 2020-11-06 2021-01-22 微医云(杭州)控股有限公司 异常数据的监听方法、装置、服务器及存储介质
CN112256548B (zh) * 2020-11-06 2022-08-09 微医云(杭州)控股有限公司 异常数据的监听方法、装置、服务器及存储介质
CN112559292A (zh) * 2020-12-18 2021-03-26 北京北方华创微电子装备有限公司 设备应用监控方法、半导体工艺设备
CN112559292B (zh) * 2020-12-18 2024-06-21 北京北方华创微电子装备有限公司 设备应用监控方法、半导体工艺设备
CN112527620A (zh) * 2020-12-24 2021-03-19 北京百度网讯科技有限公司 数据库性能分析方法及装置、电子设备、介质、产品
CN112822095A (zh) * 2021-01-26 2021-05-18 广州欢网科技有限责任公司 基于api网关的报警装置和api网关
CN112968933A (zh) * 2021-01-29 2021-06-15 北京达佳互联信息技术有限公司 数据传输方法、装置、服务器及存储介质
CN112968933B (zh) * 2021-01-29 2023-03-14 北京达佳互联信息技术有限公司 数据传输方法、装置、服务器及存储介质
CN113254310A (zh) * 2021-05-25 2021-08-13 北京搜房科技发展有限公司 服务器监控系统及方法
CN113377610A (zh) * 2021-06-07 2021-09-10 北京博睿宏远数据科技股份有限公司 性能监测方法、装置、计算机设备及存储介质
CN113377610B (zh) * 2021-06-07 2024-05-31 北京博睿宏远数据科技股份有限公司 性能监测方法、装置、计算机设备及存储介质
US11636018B1 (en) 2021-10-01 2023-04-25 Sap Se Issue detection system
EP4160418A1 (en) * 2021-10-01 2023-04-05 Sap Se Issue detection system
CN114185734B (zh) * 2021-11-26 2023-11-14 北京百度网讯科技有限公司 一种监控集群的方法、装置及电子设备
CN114185734A (zh) * 2021-11-26 2022-03-15 北京百度网讯科技有限公司 一种监控集群的方法、装置及电子设备
CN114328088A (zh) * 2021-12-09 2022-04-12 泰康保险集团股份有限公司 一种采集数据的方法、装置及电子设备
CN114338368A (zh) * 2021-12-30 2022-04-12 南京中孚信息技术有限公司 基于单向导入设备的网络监管方法、设备及介质
CN114489835A (zh) * 2022-01-06 2022-05-13 国网山东省电力公司泰安供电公司 一种移动应用性能体验度量方法及系统
US12021725B1 (en) 2022-05-20 2024-06-25 Cisco Technology, Inc. Anomaly driven telemetry sampling using intelligent tracers and parent spans
CN115118575A (zh) * 2022-06-23 2022-09-27 奇安信科技集团股份有限公司 一种监控方法、装置、电子设备及存储介质
CN115118575B (zh) * 2022-06-23 2024-05-03 奇安信科技集团股份有限公司 一种监控方法、装置、电子设备及存储介质
CN115311825A (zh) * 2022-07-07 2022-11-08 深圳市大族数控科技股份有限公司 Pcb设备报警数据推送方法、装置、计算机设备及存储介质
CN115311825B (zh) * 2022-07-07 2024-06-07 深圳市大族数控科技股份有限公司 Pcb设备报警数据推送方法、装置、计算机设备及存储介质
CN117112366A (zh) * 2023-09-14 2023-11-24 国能大渡河大数据服务有限公司 一种基于esb的数据交换监控方法及系统

Similar Documents

Publication Publication Date Title
CN110888780A (zh) 应用监控方法、装置、设备及存储介质
US9672085B2 (en) Adaptive fault diagnosis
US8271632B2 (en) Remote access providing computer system and method for managing same
CN112631913B (zh) 应用程序的运行故障监控方法、装置、设备和存储介质
CN110543409B (zh) 硬件数据采集方法、装置、计算机设备和存储介质
EP2479698A1 (en) Systems and methods for detecting fraud associated with systems application processing
JP2018533280A (ja) トラブルシューティング方法及び装置
US7451206B2 (en) Send of software tracer messages via IP from several sources to be stored by a remote server
US20070168201A1 (en) Formula for automatic prioritization of the business impact based on a failure on a service in a loosely coupled application
CN112737800B (zh) 服务节点故障定位方法、调用链生成方法及服务器
CN112732405B (zh) Jvm线程监控方法、装置及电子设备
CN110049028B (zh) 监控域控管理员的方法、装置、计算机设备及存储介质
CN112256542A (zh) 基于eBPF的微服务系统性能检测方法、装置和系统
CN104866296A (zh) 数据处理方法和装置
CN114363151A (zh) 故障检测方法和装置、电子设备和存储介质
US20100138533A1 (en) Method of identifying a root cause of a network event
CN115858221A (zh) 存储设备的管理方法、装置、存储介质及电子设备
CN113965576A (zh) 基于容器的大数据采集方法、装置、存储介质和设备
CN110011845B (zh) 日志采集方法及系统
JP2017199250A (ja) 計算機システム、データの分析方法、及び計算機
CN115314289A (zh) 受攻击执行体识别方法、输出表决器、设备及存储介质
CN110995500A (zh) 节点日志管控方法、系统及相关组件
CN116886445B (zh) 过滤结果的处理方法及装置、存储介质、电子设备
CN111708689B (zh) 一种修改ab实验的方法、装置及电子设备
CN113360419B (zh) 一种应用的数据处理方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination