CN111385123A - Web服务分布式智能监控方法、装置、计算机设备及存储介质 - Google Patents

Web服务分布式智能监控方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111385123A
CN111385123A CN201811638563.8A CN201811638563A CN111385123A CN 111385123 A CN111385123 A CN 111385123A CN 201811638563 A CN201811638563 A CN 201811638563A CN 111385123 A CN111385123 A CN 111385123A
Authority
CN
China
Prior art keywords
content
interface
server
abnormal
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811638563.8A
Other languages
English (en)
Inventor
梅小伟
林凯滨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Baiguoyuan Information Technology Co Ltd
Original Assignee
Guangzhou Baiguoyuan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Baiguoyuan Information Technology Co Ltd filed Critical Guangzhou Baiguoyuan Information Technology Co Ltd
Priority to CN201811638563.8A priority Critical patent/CN111385123A/zh
Publication of CN111385123A publication Critical patent/CN111385123A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/508Network service management, e.g. ensuring proper service fulfilment according to agreements based on type of value added network service under agreement
    • H04L41/5083Network service management, e.g. ensuring proper service fulfilment according to agreements based on type of value added network service under agreement wherein the managed service relates to web hosting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种WEB服务分布式智能监控方法、装置、计算机设备及存储介质,包括下述步骤:向目标服务器集群发送异步请求,其中,所述目标服务器集群包括一个或多个服务器接口;获取所述服务器集群的返回内容,其中,所述返回内容为所述服务器接口响应所述异步请求并返回的与所述异步请求内容相对应的返回数据;根据预设的校验规则判断所述返回内容是否异常;当判断所述返回内容异常时,触发预设的提醒指令。这种智能监控方法能够及时发现问题并上报错误,通过问题信息进行定位,提供故障排查依据,保证在较短时间内完成故障修复,减小问题的影响,提高服务的稳定性。

Description

WEB服务分布式智能监控方法、装置、计算机设备及存储介质
技术领域
本发明涉及服务器监控技术领域,特别是涉及一种WEB服务分布式智能监控方法、装置、计算机设备及存储介质。
背景技术
在日常生产环境中,存在接口的不稳定导致APP/WEB端上的超时抛错,而资源级监控不能达到业务健康状况监控、服务器众多,手工部署war包时存在漏上应用或者没有部署成功、某一服务宕机之后不能及时发现、依赖的其他接口异常导致己方系统不可用等问题。为了保证线上服务的稳定运行,除了线上关键服务的资源类监控外,各服务之间的对应接口也非常重要。
伴随着各系统微服务化的演进,服务数量、机器规模不断增长,线上环境也变得日益复杂,工程师们每天都会面临着诸多苦恼。例如:线上应用出现故障问题时无法第一时间感知;面对线上应用产生的海量日志,排查故障问题时一筹莫展;应用系统内部及系统间的调用链路产生故障问题时难以定位等等。
综上所述,线上应用的性能问题和异常错误已经成为困扰开发人员和运维人员最大的挑战,而排查这类问题往往需要几个小时甚至几天的时间,严重影响了效率和业务发展。
发明内容
本发明实施例能够提供一种操作简单、能及时发现错误的WEB服务分布式智能监控方法、装置、计算机设备及存储介质。
为解决上述技术问题,本发明创造的实施例采用的一个技术方案是:提供一种WEB服务分布式智能监控方法,包括以下步骤:
向目标服务器集群发送异步请求,其中,所述目标服务器集群包括一个或多个服务器接口;
获取所述服务器集群的返回内容,其中,所述返回内容为所述服务器接口响应所述异步请求并返回的与所述异步请求内容相对应的返回数据;
根据预设的校验规则判断所述返回内容是否异常;
当判断所述返回内容异常时,触发预设的提醒指令。
可选地,所述向目标服务器集群发送异步请求的步骤,包括以下步骤:
在预设的接口数据库中获取存储的所有接口参数,其中,所述接口参数包括服务器地址,所述接口数据库中存储有一个或多个服务器接口的接口参数;
根据所述服务器地址向对应的服务器接口分别发送异步请求。
可选地,补充所述接口数据库内容的步骤,包括以下步骤:
获取监控平台录入的接口数据;
将所述接口数据输入所述接口数据库,生成对应的接口参数。
可选地,所述返回内容包括所述服务器接口响应请求的应答时间,所述根据预设的校验规则判断所述返回内容是否异常的步骤,包括以下步骤:
将所述应答时间与预设的第一阈值进行对比;
判断所述应答时间是否大于所述第一阈值;
当所述应答时间大于所述第一阈值时,确定所述返回内容异常。
可选地,所述返回内容包括服务器接口返回指定状态码的成功率,所述根据预设的校验规则判断所述返回内容是否异常的步骤,包括下述步骤:
将所述成功率与预设的第二阈值进行对比;
判断所述成功率是否低于所述第二阈值;
当所述成功率低于所述第二阈值时,确定所述返回内容异常。
可选地,所述返回内容包括所述服务器接口根据所述异步请求返回的校验信息,所述根据预设的校验规则判断所述返回内容是否异常的步骤,包括下述步骤:
将所述校验信息与预设的目标内容进行对比;
当所述校验信息与所述目标内容不一致时,确定所述返回内容异常。
可选地,所述向目标服务器集群发送异步请求的步骤之后,包括下述步骤:
获取所述异步请求的请求时间;
根据所述请求时间和预设的时间间隔确定所述异步请求的预计返回时间段;
当所述预计返回时间段内未获取到所述返回内容,确定所述异步请求所对应的服务器接口异常,触发预设的提醒指令。
为解决上述技术问题,本发明实施例还提供一种WEB服务分布式智能监控装置,包括:
请求模块,用于向目标服务器集群发送异步请求,其中,所述目标服务器集群包括一个或多个服务器接口;
获取模块,用于获取所述服务器集群的返回内容,其中,所述返回内容为所述服务器接口响应所述异步请求并返回的与所述异步请求内容相对应的返回数据;
处理模块,用于根据预设的校验规则判断所述返回内容是否异常;
执行模块,用于当判断所述返回内容异常时,触发预设的提醒指令。
为解决上述技术问题,本发明实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述WEB服务分布式智能监控方法的步骤。
为解决上述技术问题,本发明实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述WEB服务分布式智能监控方法的步骤。
本发明实施例的有益效果是:通过同时向所有的服务器接口发送异步请求,在接口数量较多时,请求的进程之间相互间不受影响,同时异步请求也不会阻塞当前进程,即使需要监控的接口数量庞大,也可以在短时间内完成请求。在完成请求时准确记录请求响应的信息并与请求的内容一起返回到监控平台,通过预设的校验方法判断返回内容是否异常,从而反映出接口是否存在问题,在发现接口异常时及时提醒。这种智能监控方法能够及时发现问题并发出警报,保证在较短时间内完成故障排查,减小问题的影响,提高服务器的稳定性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例WEB服务分布式智能监控方法的基本流程示意图;
图2为本发明实施例发送异步请求的流程示意图;
图3为本发明实施例录入接口参数的流程示意图;
图4为本发明实施例通过应答时间判断返回内容是否异常的流程示意图;
图5为本发明实施例通过指定状态码的成功率判断返回内容是否异常的流程示意图;
图6为本发明实施例通过校验内容判断返回内容是否异常的流程示意图;
图7为本发明实施例触发提醒指令的流程示意图;
图8为本发明实施例WEB服务分布式智能监控装置的基本结构框图;
图9为本发明实施例计算机设备基本结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunicationsService,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(PersonalDigitalAssistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(GlobalPositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(MobileInternetDevice,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
具体地请参阅图1,图1为本实施例WEB服务分布式智能监控方法的基本流程示意图。
如图1所示,一种WEB服务分布式智能监控方法,包括以下步骤:
S1100、向目标服务器集群发送异步请求,其中,所述目标服务器集群包括一个或多个服务器接口;
管理或开发人员在后台录入接口数据,例如:请求url,请求方法,请求参数,业务服务器IP,接口返回数据校验规则等,但不限于此,将录入的接口数据作为接口参数保存在接口数据库中。监控平台通过获取接口数据库中的接口参数,根据设定的时间间隔(如1分钟)向获取到的接口参数所对应的服务器接口发送请求,在一些实施方式中,发送请求可以利用PHP的swoole异步http请求,多进程的对所有接口进行http请求。为了满足多个http接口同时请求的目的,程序中开启多个进程,每个接口开启一个进程去处理,然后在每个进程中使用PHP的swoole扩展进行http异步请求,提高CPU使用效率。可同时对上多个http接口进行请求并且互相不受影响。
S1200、获取所述服务器集群的返回内容,其中,所述返回内容为所述服务器接口响应所述异步请求并返回的与所述异步请求内容相对应的返回数据;
监控平台中对每个接口都开启一个进程去处理,异步请求可以不阻塞当前线程,在短时间内将所有的请求塞入缓冲区,然后哪一个请求先完成就处理哪一个请求。服务器接口在处理异步请求时,根据请求中的校验数据等内容生成对应的校验内容,并携带请求的响应时长等数据,一同作为返回内容。
S1300、根据预设的校验规则判断所述返回内容是否异常;
根据返回内容中所的携带的信息与预设的校验规则判断接口是否存在问题。具体地,返回内容中包括有对应服务器接口响应本次请求的响应时长、服务器接口返回指定状态码的成功率或者对应的服务器根据请求内容反馈的校验内容等,但不限于此。通过根据预设的校验规则对返回内容进行校验,例如响应时长是否大于某个预设的阈值(例如10ms),当响应时长大于设定值时确定接口异常;返回指定状态码的成功率是否小于预设的阈值(例如90%),当成功率小于设定值时确定接口异常;将返回的校验内容与预设的目标内容进行对比,判断两者是否一致,当两者不一致时,确定接口异常。
S1400、当判断所述返回内容异常时,触发预设的提醒指令;
当判断返回内容异常时,根据异常数据中携带的信息对问题进行定位,确定发生异常的服务器接口,生成对应的提示信息,触发提醒指令,将提示信息反馈至监控平台,以引导管理人员对故障进行排查或修复。在一些实施方式中,监控平台中记录了其下所有服务器接口的设备信息,在判断异常之后,根据返回内容中的服务器接口地址确定对应的设备。
具体地,通过预设的校验规则判断返回内容异常时,根据返回内容获取到其所对应的接口参数,提取其中的信息,例如对应的设置信息,其中,设置信息包括设备名称、设备编号和位置等,但不限于此。然后根据返回内容的异常判断确定服务器接口可能存在的问题,例如当响应时长超过预设阈值而判断接口异常时,对应的问题为“响应时长较长”,当返回的校验内容与目标内容不一致时,对应的问题为“校验内容错误”,根据上述信息生成提醒信息,例如“监测到XX服务器异常,异常问题为‘校验内容错误’,对应设备a,设备编号001,设备所在位置b楼c室,请维护人员尽快排查故障。”
将生成的提醒信息发送至监管平台,在一些实施方式中,提醒信息中包含有触发提醒指令的触发数据,例如指定的字符段,根据实际应用场景的不同可以设定不同的触发数据。监管平台在收到提醒信息后,解析其中的内容,当其中包含有指定的触发数据段时,触发预设的提醒指令,其中,提醒指令可以是声音提醒或者消息提醒等方式。触发提醒指令后将所述提醒信息展示给维护人员,例如在显示终端中显示或者通过语音播报的方式,或者将提醒信息转发至维护人员所使用的移动终端。
如图2所示,步骤S1100具体包括以下步骤:
S1110、在预设的接口数据库中获取存储的所有接口参数,其中,所述接口参数包括服务器地址,所述接口数据库中存储有一个或多个服务器接口的接口参数;
每一个监管平台对应一个数据库用于存储分配至该监管平台的服务器的接口参数,其中,数据库可以是监管平台本地存储中的指定存储区域,或者是该监管平台对应的一个上级服务器中的指定存储区域。该数据库的接口参数中包含了用于向服务器接口发送异步请求的必要数据,以及用于确定接口是否异常的对应数据,例如请求url,请求方法,请求参数,服务器地址,接口返回数据校验规则等,但不限于此。当监管平台需要对服务器进行监控时,获取该数据库中存储的所有接口参数,以备后续使用。
S1120、根据所述服务器地址向对应的服务器接口分别发送异步请求;
根据获取到的接口参数,并行地向所有的服务器接口发送异步请求。在一些实施方式中,在监管平台中开始多个进程,每一个接口开启一个进程去处理,然后在一个进程中使用PHP的swoole扩展进行http异步请求,在短时间内对所有的接口进行请求而保证相互之间不受影响,并将所有的请求转入缓冲区,不阻塞当前进程。
通过上述方法发送异步请求,即使需要监控的接口数量较大,也可以在短时间内完成所有请求,并发性高,效率显著,实现实时监控。
如图3所示,还包括以下步骤:
S2100、获取监控平台录入的接口数据;
监控平台分配到需要监控的服务器之后,开发或管理人员在后台直接录入对应的接口数据,例如请求url,请求方法,请求参数,服务器地址,接口返回数据校验规则等,但不限于此。根据录入的数据生成对应的接口参数,用于监控平台向对应的服务器接口发送请求和进行校验,以保证对服务器的监控。在一些实施方式中,接口数据的录入也可以通过获取其他位置的存储内容并解析得到接口数据,例如通过U盘等移动存储设备将对应的接口数据输入到监控平台中,或者监控平台向上级服务器发送请求,由上级服务器响应后反馈对应的接口数据。
S2200、将所述接口数据输入所述接口数据库,生成对应的接口参数;
在获取到接口参数之后,生成完整的数据包并输入到接口数据库中,作为对应的接口参数。在一些实施方式中,每一份接口参数都具备一个对应的识别码或校验码,以作区分,在监控平台需要调取接口参数时,仅需要根据识别码对各接口参数进行精准抓取,而不需要对接口参数进行解码再根据内容对接口参数进行区分。
通过上述方法对接口数据库进行补充,在监控平台分配到新的需要监控的服务器之后,开发或管理人员可以通过较为简便的方式将服务器的接口参数录入到数据库中,相比于传统的通过编写脚本进行监控的方式,本实施例的方法入门简单,容易上手,对操作人员没有代码门槛,并且可以同时录入量的接口参数,提高了接口参数的录入效率,省去了编写脚本的时间和人力成本。
如图4所示,步骤S1300具体包括以下步骤:
S1311、将所述应答时间与预设的第一阈值进行对比;
返回内容中包括服务器接口响应本次请求的应答时间,在获取到返回内容之后,解析其中的应答时间,将得到的应答时间与预设的第一阈值进行对比,其中,第一阈值为正常应答时间的一个最大值,例如10ms,但第一阈值的取值不限于此,根据实际应用情况的不同,第一阈值的取值可以适当的进行调整,例如连接情况较优,一般响应时间较短时,可以降低第一阈值的取值,当服务器性能较差或者连接情况较不稳定时,可以提高第一阈值的取值。
S1312、判断所述应答时间是否大于所述第一阈值;
根据数值的大小判断应答时间是否大于第一阈值,例如当第一阈值的设定值为10ms,而返回的应答时间为12ms时,则确定应答时间大于第一阈值,而当应答时间与预设的阈值相同时,确定应答时间与第一阈值相等,也不大于第一阈值。
S1313、当所述应答时间大于所述第一阈值时,确定所述返回内容异常;
当应答时间大于第一阈值时,说明服务器响应对应请求所使用的时间已经超出了正常范围,可能存在计算量或连接稳定性上的问题,即服务器可能存在故障,因此,确定返回内容异常,以启动后续的警报流程。
如图5所示,步骤S1300具体包括下述步骤:
S1321、将所述成功率与预设的第二阈值进行对比;
返回内容中包括服务器接口返回指定状态码的成功率,该成功率为一定时间段内返回指定状态码的比例,例如在10分钟内,返回指定状态码的次数为19次,总的返回次数为20次,即上述成功率为19/20*100%=95%。成功率还可以是一定次数内返回指定状态码的次数,例如前20次请求中返回指定状态码为19次,即上述成功率为19/20*100%=95%。成功率的定义数据可以根据实际情况进行调整,例如延长或减少上述时间段,增加或减少上述一定返回次数。
所述预设的第二阈值为正常应答时返回指定的状态码的成功率最小值,例如90%,但第二阈值的取值不限于此,根据实际应用情况的不同,第二阈值的取值可以适当的进行调整,例如当连接环境不太稳定或者进程处理能力较差时,降低所第二阈值的取值,当连接环境较为稳定时,提高第二阈值的取值。
在一些实施方式中,所述的状态码为http的状态码“200OK”,用于表示请求已成功,请求所希望的响应头或数据体将随此响应返回。出现此状态码是表示正常状态。
S1322、判断所述成功率是否低于所述第二阈值;
根据数值的大小判断成功率是否低于第二阈值,例如当第二阈值的设定值为90%,而返回的成功率为85%时,则确定成功率小于第二阈值,而当成功率与预设的阈值相同时,确定成功率与第二阈值相等,也不低于第一阈值。
S1323、当所述成功率低于所述第二阈值时,确定所述返回内容异常;
当成功率低于第二阈值时,说明服务器正常响应对应请求的概率达不到正常范围,可能存在计算量或连接稳定性上的问题,即服务器可能存在故障,因此,确定返回内容异常,以启动后续的警报流程。
如图6所示,步骤S1300具体包括下述步骤:
S1331、将所述校验信息与预设的目标内容进行对比;
服务器响应对应的请求后的返回内容中包含有校验信息,校验信息为根据请求内容生成的对应校验内容,服务器在获取到请求后,获取其中的对应请求内容,根据预设的加密算法对请求内容进行解析,然后转变为特定的校验信息。监管平台中预设有对应的目标内容,即根据请求内容和相同的加密算法计算得到的内容,将获取到的校验信息与监管平台中的目标内容进行对比,判断两者是否一致。
S1332、当所述校验信息与所述目标内容不一致时,确定所述返回内容异常;
当校验信息与目标内容不一致时,说明服务器的计算量或者程序设定可能存在问题,或者可能传输不稳定导致在传输过程中丢失数据,因此可以通过返回信息反映出服务器接口的异常,以启动后续的提醒流程。
如图7所示,步骤S1100之后还包括下述步骤:
S1130、获取所述异步请求的请求时间;
在监控平台向服务器集群发送异步请求之后,记录下向服务器集群中各个服务器接口发送异步请求的请求时间,统计所有异步请求的请求时间,以备后续使用。
S1140、根据所述请求时间和预设的时间间隔确定所述异步请求的预计返回时间段;
在一些实施方式中,时间间隔的确定依据为当前网络环境下服务器接口的正常响应返回时间。在需要确定时间间隔时,获取当前服务器集中所有正常接口响应请求的返回时间,统计所有正常的返回时间,并根据返回时间的长短进行排序,取其中时长最长的一个时间作为参考时间,以参考时间为基数增加一定的参照比例作为上述时间间隔,例如参考时间为1S,参照比例为20%,即时间间隔为1.2S,参照比例可以根据实际情况进行调整,当前连接环境较好时可以适当的降低参照比例,当返回时间波动较大时可以提高参照比例。
在获取到请求时间之后,将请求时间之后时间间隔以内的时间段作为预计返回时间段,例如发送的时间为20点00分00秒,确定的时间间隔为1秒,即预计返回时间段为20点00分00秒-20点00分01秒。
S1150、当所述预计返回时间段内未获取到所述返回内容,确定所述异步请求所对应的服务器接口异常,触发预设的提醒指令;
在预设返回时间段内没有获取到返回内容,即说明对应的服务器接口不能及时处理请求并返回信息,服务器可能存在问题或者连接线路可能存在问题,需要进一步的排查并修复问题,判断对应的服务器接口异常。获取对应服务器接口的设备信息,包括设备名称、设备编号和设备所处位置等,但不限于此,根据获取到的设备信息生成对应的通知信息,触发预设的提醒指令,提醒指令可以是声音提醒或者消息提醒等方式。触发提醒指令后将通知信息展示给维护人员,例如在显示终端中显示或者通过语音播报的方式,或者将提醒信息转发至维护人员所使用的移动终端,为维护人员进行进一步排查提供依据。
利用预设时间间隔判断服务器是否异常的方法,可以对服务器的情况进行预判断,当服务器接口不能正常处理并返回内容时,及时发现服务器可能存在的问题,提醒维护人员进行排查和修复,保证异常情况播报的及时性,减小问题的影响面。
为解决上述技术问题,本发明实施例还提供一种WEB服务分布式智能监控装置。具体请参阅图8,图8为本实施WEB服务分布式智能监控装置的基本结构框图。
如图8所示,WEB服务分布式智能监控装置,包括:请求模块2100、获取模块2200、处理模块2300和执行模块2400。其中,请求模块用于向目标服务器集群发送异步请求,其中,所述目标服务器集群包括一个或多个服务器接口;获取模块用于获取所述服务器集群的返回内容,其中,所述返回内容为所述服务器接口响应所述异步请求并返回的与所述异步请求内容相对应的返回数据;处理模块用于根据预设的校验规则判断所述返回内容是否异常;执行模块用于当判断所述返回内容异常时,触发预设的提醒指令。
通过同时向所有的服务器接口发送异步请求,在接口数量较多时,请求的进程之间相互间不受影响,同时异步请求也不会阻塞当前进程,即使需要监控的接口数量庞大,也可以在短时间内完成请求。在完成请求时准确记录请求响应的信息并与请求的内容一起返回到监控平台,通过预设的校验方法判断返回内容是否异常,从而反映出接口是否存在问题,在发现接口异常时及时提醒。这种智能监控方法能够及时发现问题并发出警报,保证在较短时间内完成故障排查,减小问题的影响,提高服务器的稳定性。
在一些实施方式中,WEB服务分布式智能监控装置还包括:第一获取子模块、第一请求子模块。其中第一获取子模块用于在预设的接口数据库中获取存储的所有接口参数,其中,所述接口参数包括服务器地址,所述接口数据库中存储有一个或多个服务器接口的接口参数;第一请求子模块用于根据所述服务器地址向对应的服务器接口分别发送异步请求。
在一些实施方式中,WEB服务分布式智能监控装置还包括:第二获取子模块、第一输入子模块。其中,第二获取子模块用于获取监控平台录入的接口数据;第一输入子模块用于将所述接口数据输入所述接口数据库,生成对应的接口参数。
在一些实施方式中,WEB服务分布式智能监控装置还包括:第一对比子模块、第一判断子模块、第一执行子模块。其中,第一对比子模块用于将所述应答时间与预设的第一阈值进行对比;第一判断子模块用于判断所述应答时间是否大于所述第一阈值;第一执行子模块用于当所述应答时间大于所述第一阈值时,确定所述返回内容异常。
在一些实施方式中,WEB服务分布式智能监控装置还包括:第二对比子模块、第二判断子模块、第二执行子模块。其中,第二对比子模块用于将所述成功率与预设的第二阈值进行对比;第二判断子模块用于判断所述成功率是否低于所述第二阈值;第二执行子模块用于当所述成功率低于所述第二阈值时,确定所述返回内容异常。
在一些实施方式中,WEB服务分布式智能监控装置还包括:第三对比子模块、第三执行子模块。其中,第三对比子模块用于将所述校验信息与预设的目标内容进行对比;第三执行子模块用于当所述校验信息与所述目标内容不一致时,确定所述返回内容异常。
在一些实施方式中,WEB服务分布式智能监控装置还包括:第三获取子模块、第一处理子模块、第四执行子模块。其中,第三获取子模块用于获取所述异步请求的请求时间;第一处理子模块用于根据所述请求时间和预设的时间间隔确定所述异步请求的预计返回时间段;第四执行子模块用于当所述预计返回时间段内未获取到所述返回内容,确定所述异步请求所对应的服务器接口异常,触发预设的提醒指令。
为解决上述技术问题,本发明实施例还提供一种计算机设备。具体请参阅图9,图9为本实施例计算机设备基本结构框图。
如图9所示,计算机设备的内部结构示意图。如图9所示,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种WEB服务分布式智能监控方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种WEB服务分布式智能监控方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图8中请求模块2100、获取模块2200、处理模块2300和执行模块2400的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有WEB服务分布式智能监控装置中执行所有子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本发明还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例所述WEB服务分布式智能监控方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)等非易失性存储介质,或随机存储记忆体(RandomAccessMemory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种WEB服务分布式智能监控方法,其特征在于,包括以下步骤:
向目标服务器集群发送异步请求,其中,所述目标服务器集群包括一个或多个服务器接口;
获取所述服务器集群的返回内容,其中,所述返回内容为所述服务器接口响应所述异步请求并返回的与所述异步请求内容相对应的返回数据;
根据预设的校验规则判断所述返回内容是否异常;
当判断所述返回内容异常时,触发预设的提醒指令。
2.如权利要求1所述的WEB服务分布式智能监控方法,其特征在于,所述向目标服务器集群发送异步请求的步骤,包括以下步骤:
在预设的接口数据库中获取存储的所有接口参数,其中,所述接口参数包括服务器地址,所述接口数据库中存储有一个或多个服务器接口的接口参数;
根据所述服务器地址向对应的服务器接口分别发送异步请求。
3.如权利要求2所述的WEB服务分布式智能监控方法,其特征在于,补充所述接口数据库内容的步骤,包括以下步骤:
获取监控平台录入的接口数据;
将所述接口数据输入所述接口数据库,生成对应的接口参数。
4.如权利要求1所述的WEB服务分布式智能监控方法,其特征在于,所述返回内容包括所述服务器接口响应请求的应答时间,所述根据预设的校验规则判断所述返回内容是否异常的步骤,包括以下步骤:
将所述应答时间与预设的第一阈值进行对比;
判断所述应答时间是否大于所述第一阈值;
当所述应答时间大于所述第一阈值时,确定所述返回内容异常。
5.如权利要求1所述的WEB服务分布式智能监控方法,其特征在于,所述返回内容包括服务器接口返回指定状态码的成功率,所述根据预设的校验规则判断所述返回内容是否异常的步骤,包括下述步骤:
将所述成功率与预设的第二阈值进行对比;
判断所述成功率是否低于所述第二阈值;
当所述成功率低于所述第二阈值时,确定所述返回内容异常。
6.如权利要求1所述的WEB服务分布式智能监控方法,其特征在于,所述返回内容包括所述服务器接口根据所述异步请求返回的校验信息,所述根据预设的校验规则判断所述返回内容是否异常的步骤,包括下述步骤:
将所述校验信息与预设的目标内容进行对比;
当所述校验信息与所述目标内容不一致时,确定所述返回内容异常。
7.如权利要求1所述的WEB服务分布式智能监控方法,其特征在于,所述向目标服务器集群发送异步请求的步骤之后,包括下述步骤:
获取所述异步请求的请求时间;
根据所述请求时间和预设的时间间隔确定所述异步请求的预计返回时间段;
当所述预计返回时间段内未获取到所述返回内容,确定所述异步请求所对应的服务器接口异常,触发预设的提醒指令。
8.一种WEB服务分布式智能监控装置,其特征在于,包括:
请求模块,用于向目标服务器集群发送异步请求,其中,所述目标服务器集群包括一个或多个服务器接口;
获取模块,用于获取所述服务器集群的返回内容,其中,所述返回内容为所述服务器接口响应所述异步请求并返回的与所述异步请求内容相对应的返回数据;
处理模块,用于根据预设的校验规则判断所述返回内容是否异常;
执行模块,用于当判断所述返回内容异常时,触发预设的提醒指令。
9.一种计算机设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述权利要求1-7任意一项所述的WEB服务分布式智能监控方法。
10.一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种WEB服务分布式智能监控方法,所述方法包括上述权利要求1-7任意一项所述的WEB服务分布式智能监控方法。
CN201811638563.8A 2018-12-29 2018-12-29 Web服务分布式智能监控方法、装置、计算机设备及存储介质 Pending CN111385123A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811638563.8A CN111385123A (zh) 2018-12-29 2018-12-29 Web服务分布式智能监控方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811638563.8A CN111385123A (zh) 2018-12-29 2018-12-29 Web服务分布式智能监控方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN111385123A true CN111385123A (zh) 2020-07-07

Family

ID=71218163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811638563.8A Pending CN111385123A (zh) 2018-12-29 2018-12-29 Web服务分布式智能监控方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN111385123A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930822A (zh) * 2020-09-11 2020-11-13 山东钢铁集团日照有限公司 一种异步分布式信息协同控制的软件构架装置及方法
CN112835794A (zh) * 2021-01-29 2021-05-25 成都环宇知了科技有限公司 一种基于Swoole的代码执行问题的定位监测方法及系统
CN113760635A (zh) * 2020-09-21 2021-12-07 北京沃东天骏信息技术有限公司 连接异常的确定方法、装置、电子设备和存储介质
CN114143114A (zh) * 2022-01-12 2022-03-04 福建省海峡信息技术有限公司 一种基于智能终端的网络安全通信方法
CN114200877A (zh) * 2021-11-12 2022-03-18 珠海大横琴科技发展有限公司 一种用电设备的监控方法和装置
CN114389970A (zh) * 2021-12-03 2022-04-22 浙江时空道宇科技有限公司 一种链路监控方法及装置
CN114840306A (zh) * 2022-04-25 2022-08-02 北京永信至诚科技股份有限公司 服务资源可用性监控方法、装置、设备及可读存储介质
CN116016646A (zh) * 2022-11-07 2023-04-25 中国工商银行股份有限公司 业务访问控制方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106357430A (zh) * 2016-08-29 2017-01-25 桂林浩新科技服务有限公司 一种云计算集群服务状态监控方法和系统
CN106982247A (zh) * 2017-02-23 2017-07-25 成都谷辘信息技术有限公司 一种基于web的图片分布式存储系统
CN107295080A (zh) * 2017-06-19 2017-10-24 北京百度网讯科技有限公司 应用于分布式服务器集群的数据存储方法和服务器
CN107872437A (zh) * 2016-09-27 2018-04-03 阿里巴巴集团控股有限公司 一种用于业务请求的方法、装置及服务器
CN108833355A (zh) * 2018-05-21 2018-11-16 深圳云之家网络有限公司 数据处理方法、装置、计算机设备和计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106357430A (zh) * 2016-08-29 2017-01-25 桂林浩新科技服务有限公司 一种云计算集群服务状态监控方法和系统
CN107872437A (zh) * 2016-09-27 2018-04-03 阿里巴巴集团控股有限公司 一种用于业务请求的方法、装置及服务器
CN106982247A (zh) * 2017-02-23 2017-07-25 成都谷辘信息技术有限公司 一种基于web的图片分布式存储系统
CN107295080A (zh) * 2017-06-19 2017-10-24 北京百度网讯科技有限公司 应用于分布式服务器集群的数据存储方法和服务器
CN108833355A (zh) * 2018-05-21 2018-11-16 深圳云之家网络有限公司 数据处理方法、装置、计算机设备和计算机可读存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930822A (zh) * 2020-09-11 2020-11-13 山东钢铁集团日照有限公司 一种异步分布式信息协同控制的软件构架装置及方法
CN113760635A (zh) * 2020-09-21 2021-12-07 北京沃东天骏信息技术有限公司 连接异常的确定方法、装置、电子设备和存储介质
CN112835794A (zh) * 2021-01-29 2021-05-25 成都环宇知了科技有限公司 一种基于Swoole的代码执行问题的定位监测方法及系统
CN112835794B (zh) * 2021-01-29 2023-06-23 成都环宇知了科技有限公司 一种基于Swoole的代码执行问题的定位监测方法及系统
CN114200877A (zh) * 2021-11-12 2022-03-18 珠海大横琴科技发展有限公司 一种用电设备的监控方法和装置
CN114200877B (zh) * 2021-11-12 2024-02-27 珠海大横琴科技发展有限公司 一种用电设备的监控方法和装置
CN114389970A (zh) * 2021-12-03 2022-04-22 浙江时空道宇科技有限公司 一种链路监控方法及装置
CN114143114A (zh) * 2022-01-12 2022-03-04 福建省海峡信息技术有限公司 一种基于智能终端的网络安全通信方法
CN114840306A (zh) * 2022-04-25 2022-08-02 北京永信至诚科技股份有限公司 服务资源可用性监控方法、装置、设备及可读存储介质
CN116016646A (zh) * 2022-11-07 2023-04-25 中国工商银行股份有限公司 业务访问控制方法、装置、设备及介质
CN116016646B (zh) * 2022-11-07 2024-05-28 中国工商银行股份有限公司 业务访问控制方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN111385123A (zh) Web服务分布式智能监控方法、装置、计算机设备及存储介质
CN109726072B (zh) WebLogic服务器的监控告警方法、装置、系统及计算机存储介质
EP3386150B1 (en) Terminal failure processing method, device and system
CN110730246A (zh) 一种微服务架构下的分布式链路跟踪方法
CN111193609B (zh) 应用异常的反馈方法、装置及应用异常的监控系统
CN111143163B (zh) 数据监控方法、装置、计算机设备和存储介质
CN111385122B (zh) 分布式系统链路跟踪方法、装置、计算机设备及存储介质
CN105159964A (zh) 一种日志监控方法及系统
CN113672475B (zh) 告警处理方法、装置、计算机设备和存储介质
US11799748B2 (en) Mitigating failure in request handling
CN113704065A (zh) 监控方法、装置、设备及计算机存储介质
CN110347694B (zh) 一种基于物联网的设备监控方法、装置及系统
CN114996085A (zh) 一种基于Prometheus的实时业务监控方法和系统
CN114500343B (zh) 业务链条运行监控方法及其装置、设备、介质、产品
CN104581806A (zh) 一种监测业务系统的方法及终端
CN107885634B (zh) 监控中异常信息的处理方法和装置
CN114500316A (zh) 一种物联网设备巡检方法和系统
CN110611576B (zh) 一种数据质量监测方法、装置、设备及存储介质
CN112069027A (zh) 一种接口数据处理方法、装置、电子设备及存储介质
CN112101810A (zh) 风险事件控制方法、装置及系统
CN110750366A (zh) 消息处理方法、装置、计算机设备和存储介质
CN112835780A (zh) 一种业务检测方法及装置
CN111611139B (zh) 监测数据分析方法、装置、计算机设备和存储介质
CN110662242A (zh) 天馈系统检测方法、网管设备及计算机可读存储介质
CN115333920B (zh) 告警测试的方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200707