CN111756579A - 异常预警方法、装置、设备以及存储介质 - Google Patents

异常预警方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN111756579A
CN111756579A CN202010590326.XA CN202010590326A CN111756579A CN 111756579 A CN111756579 A CN 111756579A CN 202010590326 A CN202010590326 A CN 202010590326A CN 111756579 A CN111756579 A CN 111756579A
Authority
CN
China
Prior art keywords
early warning
request
statistical
requests
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010590326.XA
Other languages
English (en)
Inventor
郭少卿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010590326.XA priority Critical patent/CN111756579A/zh
Publication of CN111756579A publication Critical patent/CN111756579A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例公开了异常预警方法、装置、设备以及存储介质,涉及云计算、异常预警技术领域。该方法的一具体实施方式包括:从应用程序接口API网关日志中定期获取对应周期内的请求的事件记录;基于事件记录计算统计指标;确定统计指标与历史统计指标的差异;若差异超过差异阈值,发送异常预警信息。该实施方式提供了一种后端服务异常预警机制,通过定期分析API网关上的日志,统计相应的指标,及时发现可能存在异常的后端服务,并发送异常预警信息,以便于相关人员及时介入,进一步减少异常的发生。

Description

异常预警方法、装置、设备以及存储介质
技术领域
本申请实施例涉及计算机技术领域,具体涉及云计算、异常预警技术领域,尤其设置异常预警方法、装置、设备以及存储介质。
背景技术
后端服务器提供的服务可以通过API(Application Programming Interface,应用程序接口)形式对外开放,通常会借助API网关服务器提供给终端设备使用。因此,其整体网络链路上存在3个节点:终端设备、API网关服务器和后端服务器。其中,API网关服务器提供诸如认证、鉴权、流量控制等功能。
后端服务以API形式对外开放时,API网关服务器通常会通过各种手段来确保后端服务的可用性,从而确保整体服务正常。在API网关层面,也提供了若干功能对后端服务进行保护,例如,流量控制、访问控制等等。总体而言,这些功能的原理基本是提前归纳一些规则,过滤掉可能会导致后端服务异常的请求,但在异常发生时,无论是API网关服务器还后端服务其器都无法立即发现或提前预知,一般依赖于用户的反馈。
发明内容
本申请实施例提出了异常预警方法、装置、设备以及存储介质。
第一方面,本申请实施例提出了一种异常预警方法,包括:从应用程序接口API网关日志中定期获取对应周期内的请求的事件记录;基于事件记录计算统计指标;确定统计指标与历史统计指标的差异;若差异超过差异阈值,发送异常预警信息。
第二方面,本申请实施例提出了一种异常预警装置,包括:记录获取模块,被配置成从应用程序接口API网关日志中定期获取对应周期内的请求的事件记录;指标计算模块,被配置成基于事件记录计算统计指标;差异确定模块,被配置成确定统计指标与历史统计指标的差异;异常预警模块,被配置成若差异超过差异阈值,发送异常预警信息。
第三方面,本申请实施例提出了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面中任一实现方式描述的方法。
本申请实施例提供的异常预警方法、装置、设备以及存储介质,首先从应用程序接口API网关日志中定期获取对应周期内的请求的事件记录;之后基于事件记录计算统计指标;然后确定统计指标与历史统计指标的差异;最后若差异超过差异阈值,发送异常预警信息。提供了一种后端服务异常预警机制,通过定期分析API网关上的日志,统计相应的指标,及时发现可能存在异常的后端服务,并发送异常预警信息,以便于相关人员及时介入,进一步减少异常的发生。此外,异常预警信息中还可以带有具体的异常项和发生地域,以便于快速定位到潜在问题。无需在每一次的请求中都进行一次异常检测,而是定期地进行异常检测。同时,在请求进入API网关服务器后,除了在日志中加入少量内容外,并且这部分内容在大部分API网关服务器中是本身就会打印的,无其他业务逻辑,整体性能消耗较小。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请可以应用于其中的示例性系统架构;
图2是API调用网络链路图;
图3是根据本申请的异常预警方法的一个实施例的流程图;
图4是根据本申请的异常预警方法的又一个实施例的流程图;
图5是根据本申请的异常预警装置的一个实施例的结构示意图;
图6是用来实现本申请实施例的异常预警方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的异常预警方法或异常预警装置的实施例的示例性系统架构100。
如图1所示,系统架构100中可以包括终端设备101、API网关服务器102、后端服务器103和预警服务器104。后端服务器103提供的服务可以通过API形式对外开放,通常会借助API网关服务器102提供给终端设备101使用。此外,API网关服务器102还可以定期监控其上的日志,并在发现异常时向预警服务器104发送异常预警信息,由预警服务器104通知相关人员及时介入。
终端设备101可以是硬件,也可以是软件。当终端设备101为硬件时,可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101为软件时,可以安装在上述电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
API网关服务器102、后端服务器103和预警服务器104可以是硬件,也可以是软件。当API网关服务器102、后端服务器103和预警服务器104为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当API网关服务器102、后端服务器103和预警服务器104为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本申请实施例所提供的异常预警方法一般由API网关服务器102执行,相应地,异常预警装置一般设置于API网关服务器102中。
应该理解,图1中的终端设备、API网关服务器、后端服务器和预警服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、API网关服务器、后端服务器和预警服务器。
实践中,后端服务器提供的服务可以通过API形式对外开放,通常会借助API网关服务器提供给终端设备使用。因此,其整体网络链路上存在3个节点:终端设备、API网关服务器和后端服务器。若终端设备需要使用后端服务器提供的服务,需要将请求发送至API网关服务器,API网关服务器再将请求转发至后端服务器。
在实际使用中,后端服务器通常是多地域部署的,而发起请求的终端设备也同样来自全国各地,因此API网关服务器同样是多地域部署的。为了便于理解,图2示出了API调用网络链路图。如图2所示,终端设备的请求转发至哪个地域的API网关服务器,通常由运营商的地址解析策略决定,而API网关服务器的请求转发至哪个地域的后端服务器,通常由API网关的拥有者在API网关服务器中进行配置。通常而言,总体的转发策略会选择就近转发,即北京的请求转发至北京的API网关服务器,再转发至北京的后端服务器。当然,也可以通过配置实现特定的转发逻辑,例如,广州的请求转发至南京的API网关服务器,再转发至杭州的后端服务器。而不同的转发逻辑均适用于本申请实施例提供的异常预警方法,这里不对转发逻辑进行限定。
继续参考图3,其示出了根据本申请的异常预警方法的一个实施例的流程300。该异常预警方法包括以下步骤:
步骤301,从应用程序接口API网关日志中定期获取对应周期内的请求的事件记录。
在本实施例中,后端服务器提供的服务可以通过API形式对外开放,通常会借助API网关服务器提供给终端设备使用。因此,其整体网络链路上存在3个节点:终端设备、API网关服务器和后端服务器。若终端设备需要使用后端服务器提供的服务,需要将请求发送至API网关服务器,API网关服务器再将请求转发至后端服务器。随后,后端服务器将基于请求的响应返回至API网关服务器,API网关服务器将响应转发至终端设备。在此过程中,API网关服务器还会生成请求的事件记录,并记录在API网关日志中。这样,API网关服务器就可以从API网关日志中定期获取对应周期内的请求的事件记录。其中,周期可以由API网关服务器的拥有者指定,默认为1分钟。
步骤302,基于事件记录计算统计指标。
在本实施例中,API网关服务器可以基于对应周期内的请求的事件记录计算统计指标。通常,请求的事件记录中会有请求是否成功等相关信息,API网关服务器可以基于这些信息统计相应的指标。
步骤303,确定统计指标与历史统计指标的差异。
在本实施例中,API网关服务器可以确定统计指标与历史统计指标的差异,并与差异阈值进行比较。若超过差异阈值,则执行步骤304;若不超过差异阈值,则返回继续执行步骤301。其中,历史统计指标可以是API网关服务器在之前的周期内统计出的指标。
步骤304,若差异超过差异阈值,发送异常预警信息。
在本实施例中,若差异超过差异阈值,API网关服务器可以发送异常预警信息。通常,API网关服务器可以将异常预警信息发送给预警服务器,再由预警服务器转发给相关人员,例如API网关服务器的拥有者。
此外,通过将特定的异常预警模块部署在各个地域的API网关服务器上,使得异常预警信息中带有具体的异常项和发生地域,异常预警机制分区域,这种更细粒度的异常预警机制可以实现潜在问题的快速定位。
本申请实施例提供的异常预警方法,首先从应用程序接口API网关日志中定期获取对应周期内的请求的事件记录;之后基于事件记录计算统计指标;然后确定统计指标与历史统计指标的差异;最后若差异超过差异阈值,发送异常预警信息。提供了一种后端服务异常预警机制,通过定期分析API网关上的日志,统计相应的指标,及时发现可能存在异常的后端服务,并发送异常预警信息,以便于相关人员及时介入,进一步减少异常的发生。此外,异常预警信息中还可以带有具体的异常项和发生地域,以便于快速定位到潜在问题。无需在每一次的请求中都进行一次异常检测,而是定期地进行异常检测。同时,在请求进入API网关服务器后,除了在日志中加入少量内容外,并且这部分内容在大部分API网关服务器中是本身就会打印的,无其他业务逻辑,整体性能消耗较小。
进一步参考图4,其示出了根据本申请的异常预警方法的又一个实施例的流程400。该异常预警方法包括以下步骤:
步骤401,从应用程序接口API网关日志中定期获取对应周期内的请求的事件记录。
在本实施例中,后端服务器提供的服务可以通过API形式对外开放,通常会借助API网关服务器提供给终端设备使用。因此,其整体网络链路上存在3个节点:终端设备、API网关服务器和后端服务器。若终端设备需要使用后端服务器提供的服务,需要将请求发送至API网关服务器,API网关服务器再将请求转发至后端服务器。随后,后端服务器将基于请求的响应返回至API网关服务器,API网关服务器将响应转发至终端设备。在此过程中,API网关服务器还会生成请求的事件记录,并记录在API网关日志中。这样,API网关服务器就可以从API网关日志中定期获取对应周期内的请求的事件记录。
通常,每次请求的事件记录中会有一些必要信息,以便于指标统计。
具体地,单次请求的事件记录中的必要信息如下:
1、时间戳:请求到达API网关服务器的时间,通常使用UTC(CoordinatedUniversal Time,协调世界时)时间。
2、API唯一标识符:通常使用二元组{URL,后端IP},即API的URL(UniformResource Locator,统一资源定位符)和后端服务器的IP(Internet Protocol,网际互连协议)地址。
3、若请求成功返回,则记录:
a)HTTP(Hyper Text Transfer Protocol,超文本传输协议)状态码;
b)请求响应时间:响应返回API网关服务器的时间与请求从API网关服务器发出的时间之差。
4、若请求未成功返回,则记录:
a)无响应标志:一个可让异常预警程序识别的字符串,例如:“No response”;
b)无响应原因:根据TCP(Transmission Control Protocol,传输控制协议)连接是否建立可分为TCP连接无响应或HTTP请求无响应。
通常,无响应原因不参与统计,主要用于异常出现后的异常排查。
5、若服务器收到单个复位帧(TCP RST帧),则记录一个复位帧和这个复位帧的来源IP。
步骤402a,基于事件记录统计无响应请求次数和请求总次数。
步骤403a,计算无响应请求次数与请求总次数的比值,得到无响应比例,作为统计指标。
在本实施例中,单位时间内无响应比例可以通过如下公式计算:
单位时间内无响应比例=Count(NR)/Count(ALL)。
其中,Count(NR)为单位时间内无响应请求次数,即单位时间内包含无响应标志的事件记录数。Count(ALL)为单位时间内进入API网关服务器的请求总次数,即单位时间内事件记录总数。API网关日志的检测周期就是单位时间。
步骤402b,从事件记录中提取请求的响应时间,以及统计请求总次数。
步骤403b,计算提取的所有请求的响应时间的和与请求总次数的比值,得到平均响应时间,作为统计指标。
在本实施例中,单位时间内平均响应时间可以通过如下公式计算:
单位时间内平均响应时间=Sum(Time(rq1),Time(rq2),Time(rq3)……Time(rqN))/Count(ALL)。
其中,rqN为单位时间内第N个请求,Time(rqN)为单位时间内第N个请求的响应时间,即单位时间内请求成功的事件记录中的请求响应时间。Sum(Time(rq1)……Time(rqN))为单位时间内所有请求的响应时间的总和。
步骤402c,从事件记录中统计业务逻辑正常的请求次数和请求总次数。
步骤403c,计算业务逻辑正确的请求次数与请求总次数的比值,得到正常请求比例,作为统计指标。
在本实施例中,业务逻辑正确的请求对应的HTTP状态码是2xx,2xx是以2开头的状态码,包括但不限于200OK、201Created、202Accepted、203Non-AuthoritativeInformation、204No Content、205Reset Content等等。
2xx请求比例可以通过如下公式计算:
2xx请求比例=Count(2xx)/Count(ALL)。
其中,Count(2xx)为单位时间内成功响应且HTTP状态码以2开头的请求次数,即单位时间内HTTP状态码为2xx的事件记录数。
步骤402d,从事件记录中统计业务逻辑异常的请求次数和请求总次数。
步骤403d,计算业务逻辑异常的请求次数与请求总次数的比值,得到异常请求比例,作为统计指标。
在本实施例中,业务逻辑异常的请求对应的HTTP状态码是4xx和5xx。4xx是以4开头的状态码,包括但不限于400Bad Request、401Unauthorized、402Payment Required、403Forbidden、404Not Found、405Method Not Allowed、406Not Acceptable等等。5xx是以5开头的状态码,包括但不限于500Internal Server Error、501Not Implemented、502BadGateway、503Service Unavailable、504Gateway Timeout、505HTTP Version NotSupported等等。
4xx和5xx请求比例可以通过如下公式计算:
4xx和5xx请求比例=[Count(4xx)+Count(5xx)]/Count(ALL)。
其中,Count(4xx)为单位时间内成功响应且HTTP状态码以4开头的请求次数,即单位时间内HTTP状态码为4xx的事件记录数。Count(5xx)为单位时间内成功响应且HTTP状态码以5开头的请求次数,即单位时间内HTTP状态码为5xx的事件记录数。
步骤402e,从事件记录中统计复位帧个数,作为统计指标。
在本实施例中,API网关服务器可以统计单位时间内TCP RST帧个数,即单位时间内记录TCP RST帧的事件记录数。
步骤404,将统计指标从统计指标队列的队尾插入。
在本实施例中,对于每一种统计指标,对应维护一个统计指标队列,用于存储连续预设数目个周期对应的统计指标。其中,统计指标队列中存储的统计指标个数等于统计指标队列的长度。例如,对于长度为5的统计指标队列,存储最近5次计算的统计指标。
步骤405,计算统计指标队列中除队尾元素之外的其他元素的平均值。
在本实施例中,API网关服务器可以计算统计指标队列中除队尾元素之外的其他元素的平均值,作为历史统计指标。
步骤406,计算队尾元素与平均值的差值比例,得到差异。
在本实施例中,API网关服务器可以计算队尾元素与平均值的差值比例,得到统计指标与历史统计指标的差异。
步骤407a,若差异超过差异阈值,发送业务连通性异常预警信息。
在本实施例中,若无响应比例对应的差异超过差异阈值,API网关服务器可以发送业务连通性异常预警信息。
步骤407b,若差异超过差异阈值,发送业务平响增加预警信息。
在本实施例中,若平均响应时间对应的差异超过差异阈值,API网关服务器可以发送业务平响增加预警信息。
步骤407c,若差异超过差异阈值,发送业务正常请求减少预警信息。
在本实施例中,若正常请求比例对应的差异超过差异阈值,API网关服务器可以发送业务正常请求减少预警信息。
步骤408d,若差异超过差异阈值,发送业务异常请求增加预警信息。
在本实施例中,若异常请求比例对应的差异超过差异阈值,API网关服务器可以发送业务异常请求增加预警信息。
步骤409e,若差异超过差异阈值,发送异常传输控制协议TCP连接增加预警信息。
在本实施例中,若复位帧个数对应的差异超过差异阈值,API网关服务器可以发送异常TCP连接增加预警信息。
此外,异常预警信息中还可以包括报警地域和异常指标取值,以便于快速定位到潜在问题。
需要说明的是,步骤402a-403a、步骤402b-403b、步骤402c-403c、步骤402d-403d和步骤402e可以是通过5个并行的进程来5种执行指标统计方法。在实际应用中,也可以仅执行图4中的部分指标统计方法。当然,也可以新增进程执行其他指标统计方法,这里不进行具体限定。
从图4中可以看出,与图3对应的实施例相比,本实施例中的异常预警方法的流程400突出了指标统计步骤和差异确定步骤。由此,在本实施例描述的方案中,基于API网关日志中记录的不同数据计算不同类型的统计指标,从而发送不同类型的异常预警信息,这种更细粒度的异常预警机制可以基于异常预警信息的内容快速定位异常。此外,将统计指标存入队列,便于分析当前统计指标与历史统计指标的差异。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种异常预警装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的异常预警装置500可以包括:记录获取模块501、指标计算模块502、差异确定模块503和异常预警模块504。其中,记录获取模块501,被配置成从应用程序接口API网关日志中定期获取对应周期内的请求的事件记录;指标计算模块502,被配置成基于事件记录计算统计指标;差异确定模块503,被配置成确定统计指标与历史统计指标的差异;异常预警模块504,被配置成若差异超过差异阈值,发送异常预警信息。
在本实施例中,异常预警装置500中:记录获取模块501、指标计算模块502、差异确定模块503和异常预警模块504的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-204的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,差异确定模块503进一步被配置成:将统计指标从统计指标队列的队尾插入,其中,统计指标队列用于存储连续预设数目个周期对应的统计指标;计算统计指标队列中除队尾元素之外的其他元素的平均值;计算队尾元素与平均值的差值比例,得到差异。
在本实施例的一些可选的实现方式中,指标计算模块502进一步被配置成:基于事件记录统计无响应请求次数和请求总次数;计算无响应请求次数与请求总次数的比值,得到无响应比例,作为统计指标;以及异常预警模块504进一步被配置成:发送业务连通性异常预警信息。
在本实施例的一些可选的实现方式中,指标计算模块502进一步被配置成:从事件记录中提取请求的响应时间,以及统计请求总次数;计算提取的所有请求的响应时间的和与请求总次数的比值,得到平均响应时间,作为统计指标;以及异常预警模块504进一步被配置成:发送业务平响增加预警信息。
在本实施例的一些可选的实现方式中,指标计算模块502进一步被配置成:从事件记录中统计业务逻辑正常的请求次数和请求总次数;计算业务逻辑正确的请求次数与请求总次数的比值,得到正常请求比例,作为统计指标;以及异常预警模块504进一步被配置成:发送业务正常请求减少预警信息。
在本实施例的一些可选的实现方式中,指标计算模块502进一步被配置成:从事件记录中统计业务逻辑异常的请求次数和请求总次数;计算业务逻辑异常的请求次数与请求总次数的比值,得到异常请求比例,作为统计指标;以及异常预警模块504进一步被配置成:发送业务异常请求增加预警信息。
在本实施例的一些可选的实现方式中,指标计算模块502进一步被配置成:从事件记录中统计复位帧个数,作为统计指标;以及异常预警模块504进一步被配置成:发送异常传输控制协议TCP连接增加预警信息。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图6所示,是根据本申请实施例异常预警方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的异常预警方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的异常预警方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的异常预警方法对应的程序指令/模块(例如,附图5所示的记录获取模块501、指标计算模块502、差异确定模块503和异常预警模块504)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的异常预警方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据异常预警方法的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至异常预警方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
异常预警方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与异常预警方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请的技术方案,首先从应用程序接口API网关日志中定期获取对应周期内的请求的事件记录;之后基于事件记录计算统计指标;然后确定统计指标与历史统计指标的差异;最后若差异超过差异阈值,发送异常预警信息。提供了一种后端服务异常预警机制,通过定期分析API网关上的日志,统计相应的指标,及时发现可能存在异常的后端服务,并发送异常预警信息,以便于相关人员及时介入,进一步减少异常的发生。此外,异常预警信息中还可以带有具体的异常项和发生地域,以便于快速定位到潜在问题。无需在每一次的请求中都进行一次异常检测,而是定期地进行异常检测。同时,在请求进入API网关服务器后,除了在日志中加入少量内容外,并且这部分内容在大部分API网关服务器中是本身就会打印的,无其他业务逻辑,整体性能消耗较小。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (16)

1.一种异常预警方法,包括:
从应用程序接口API网关日志中定期获取对应周期内的请求的事件记录;
基于所述事件记录计算统计指标;
确定所述统计指标与历史统计指标的差异;
若所述差异超过差异阈值,发送异常预警信息。
2.根据权利要求1所述的方法,其中,所述确定所述统计指标与历史统计指标的差异,包括:
将所述统计指标从统计指标队列的队尾插入,其中,所述统计指标队列用于存储连续预设数目个周期对应的统计指标;
计算所述统计指标队列中除队尾元素之外的其他元素的平均值;
计算所述队尾元素与所述平均值的差值比例,得到所述差异。
3.根据权利要求1所述的方法,其中,所述基于所述事件记录计算统计指标,包括:
基于所述事件记录统计无响应请求次数和请求总次数;
计算所述无响应请求次数与所述请求总次数的比值,得到无响应比例,作为所述统计指标;以及
所述发送异常预警信息,包括:
发送业务连通性异常预警信息。
4.根据权利要求1所述的方法,其中,所述基于所述事件记录计算统计指标,包括:
从所述事件记录中提取请求的响应时间,以及统计请求总次数;
计算提取的所有请求的响应时间的和与所述请求总次数的比值,得到平均响应时间,作为所述统计指标;以及
所述发送异常预警信息,包括:
发送业务平响增加预警信息。
5.根据权利要求1所述的方法,其中,所述基于所述事件记录计算统计指标,包括:
从所述事件记录中统计业务逻辑正常的请求次数和请求总次数;
计算所述业务逻辑正确的请求次数与所述请求总次数的比值,得到正常请求比例,作为所述统计指标;以及
所述发送异常预警信息,包括:
发送业务正常请求减少预警信息。
6.根据权利要求1所述的方法,其中,所述基于所述事件记录计算统计指标,包括:
从所述事件记录中统计业务逻辑异常的请求次数和请求总次数;
计算所述业务逻辑异常的请求次数与所述请求总次数的比值,得到异常请求比例,作为所述统计指标;以及
所述发送异常预警信息,包括:
发送业务异常请求增加预警信息。
7.根据权利要求1所述的方法,其中,所述基于所述事件记录计算统计指标,包括:
从所述事件记录中统计复位帧个数,作为所述统计指标;以及
所述发送异常预警信息,包括:
发送异常传输控制协议TCP连接增加预警信息。
8.一种异常预警装置,包括:
记录获取模块,被配置成从应用程序接口API网关日志中定期获取对应周期内的请求的事件记录;
指标计算模块,被配置成基于所述事件记录计算统计指标;
差异确定模块,被配置成确定所述统计指标与历史统计指标的差异;
异常预警模块,被配置成若所述差异超过差异阈值,发送异常预警信息。
9.根据权利要求8所述的装置,其中,所述差异确定模块进一步被配置成:
将所述统计指标从统计指标队列的队尾插入,其中,所述统计指标队列用于存储连续预设数目个周期对应的统计指标;
计算所述统计指标队列中除队尾元素之外的其他元素的平均值;
计算所述队尾元素与所述平均值的差值比例,得到所述差异。
10.根据权利要求8所述的装置,其中,所述指标计算模块进一步被配置成:
基于所述事件记录统计无响应请求次数和请求总次数;
计算所述无响应请求次数与所述请求总次数的比值,得到无响应比例,作为所述统计指标;以及
所述异常预警模块进一步被配置成:
发送业务连通性异常预警信息。
11.根据权利要求8所述的装置,其中,所述指标计算模块进一步被配置成:
从所述事件记录中提取请求的响应时间,以及统计请求总次数;
计算提取的所有请求的响应时间的和与所述请求总次数的比值,得到平均响应时间,作为所述统计指标;以及
所述异常预警模块进一步被配置成:
发送业务平响增加预警信息。
12.根据权利要求8所述的装置,其中,所述指标计算模块进一步被配置成:
从所述事件记录中统计业务逻辑正常的请求次数和请求总次数;
计算所述业务逻辑正确的请求次数与所述请求总次数的比值,得到正常请求比例,作为所述统计指标;以及
所述异常预警模块进一步被配置成:
发送业务正常请求减少预警信息。
13.根据权利要求8所述的装置,其中,所述指标计算模块进一步被配置成:
从所述事件记录中统计业务逻辑异常的请求次数和请求总次数;
计算所述业务逻辑异常的请求次数与所述请求总次数的比值,得到异常请求比例,作为所述统计指标;以及
所述异常预警模块进一步被配置成:
发送业务异常请求增加预警信息。
14.根据权利要求8所述的装置,其中,所述指标计算模块进一步被配置成:
从所述事件记录中统计复位帧个数,作为所述统计指标;以及
所述异常预警模块进一步被配置成:
发送异常传输控制协议TCP连接增加预警信息。
15.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
16.一种计算机可读介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN202010590326.XA 2020-06-24 2020-06-24 异常预警方法、装置、设备以及存储介质 Pending CN111756579A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010590326.XA CN111756579A (zh) 2020-06-24 2020-06-24 异常预警方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010590326.XA CN111756579A (zh) 2020-06-24 2020-06-24 异常预警方法、装置、设备以及存储介质

Publications (1)

Publication Number Publication Date
CN111756579A true CN111756579A (zh) 2020-10-09

Family

ID=72677141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010590326.XA Pending CN111756579A (zh) 2020-06-24 2020-06-24 异常预警方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN111756579A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112491589A (zh) * 2020-11-09 2021-03-12 苏州浪潮智能科技有限公司 一种对象存储网络预警方法、系统、终端及存储介质
CN112527601A (zh) * 2020-12-17 2021-03-19 航天信息股份有限公司 一种监控预警方法及装置
CN112527748A (zh) * 2020-12-24 2021-03-19 北京百度网讯科技有限公司 用于分析用户操作行为的方法、装置、设备以及存储介质
CN113114490A (zh) * 2021-03-30 2021-07-13 海信集团控股股份有限公司 一种api调用异常告警方法、装置、设备及介质
CN113127319A (zh) * 2021-04-06 2021-07-16 北京大米科技有限公司 一种信息监控方法、相关装置及计算机存储介质
CN113256942A (zh) * 2021-05-18 2021-08-13 中海石油深海开发有限公司 异常事件的超前预警方法、装置、电子设备及介质
CN113312321A (zh) * 2021-05-31 2021-08-27 中国民航信息网络股份有限公司 一种业务量的异常监测方法及相关设备
CN113343064A (zh) * 2021-06-18 2021-09-03 北京百度网讯科技有限公司 数据处理方法、装置、设备、存储介质以及计算机程序产品
CN113420082A (zh) * 2021-05-28 2021-09-21 济南浪潮数据技术有限公司 一种数据同步的异常检测方法和装置
CN114024831A (zh) * 2021-11-08 2022-02-08 中国工商银行股份有限公司 一种异常事件预警方法、装置和系统
CN115776435A (zh) * 2022-10-24 2023-03-10 华能信息技术有限公司 一种基于api网关的预警方法
CN116208513A (zh) * 2021-11-30 2023-06-02 中移动信息技术有限公司 网关的健康度预测方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109617750A (zh) * 2019-01-31 2019-04-12 国网电子商务有限公司 一种服务预警方法及网关
CN109634818A (zh) * 2018-10-24 2019-04-16 中国平安人寿保险股份有限公司 日志分析方法、系统、终端及计算机可读存储介质
CN109933508A (zh) * 2019-03-25 2019-06-25 北京百度网讯科技有限公司 用于发送信息的方法和装置
CN110442498A (zh) * 2019-06-28 2019-11-12 平安科技(深圳)有限公司 异常数据节点的定位方法、装置、存储介质及计算机设备
US20190377652A1 (en) * 2018-06-06 2019-12-12 Vmware, Inc. Application health monitoring based on historical application health data and application logs
CN110661659A (zh) * 2019-09-23 2020-01-07 上海艾融软件股份有限公司 一种告警方法、装置、系统及电子设备
CN110677304A (zh) * 2019-10-11 2020-01-10 广州趣丸网络科技有限公司 一种分布式问题追踪系统及设备
CN111212038A (zh) * 2019-12-23 2020-05-29 江苏国泰新点软件有限公司 基于大数据人工智能的开放数据api网关系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190377652A1 (en) * 2018-06-06 2019-12-12 Vmware, Inc. Application health monitoring based on historical application health data and application logs
CN109634818A (zh) * 2018-10-24 2019-04-16 中国平安人寿保险股份有限公司 日志分析方法、系统、终端及计算机可读存储介质
CN109617750A (zh) * 2019-01-31 2019-04-12 国网电子商务有限公司 一种服务预警方法及网关
CN109933508A (zh) * 2019-03-25 2019-06-25 北京百度网讯科技有限公司 用于发送信息的方法和装置
CN110442498A (zh) * 2019-06-28 2019-11-12 平安科技(深圳)有限公司 异常数据节点的定位方法、装置、存储介质及计算机设备
CN110661659A (zh) * 2019-09-23 2020-01-07 上海艾融软件股份有限公司 一种告警方法、装置、系统及电子设备
CN110677304A (zh) * 2019-10-11 2020-01-10 广州趣丸网络科技有限公司 一种分布式问题追踪系统及设备
CN111212038A (zh) * 2019-12-23 2020-05-29 江苏国泰新点软件有限公司 基于大数据人工智能的开放数据api网关系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李伟章,杨海江, 中国铁道出版社 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112491589B (zh) * 2020-11-09 2023-01-24 苏州浪潮智能科技有限公司 一种对象存储网络预警方法、系统、终端及存储介质
CN112491589A (zh) * 2020-11-09 2021-03-12 苏州浪潮智能科技有限公司 一种对象存储网络预警方法、系统、终端及存储介质
CN112527601A (zh) * 2020-12-17 2021-03-19 航天信息股份有限公司 一种监控预警方法及装置
CN112527748A (zh) * 2020-12-24 2021-03-19 北京百度网讯科技有限公司 用于分析用户操作行为的方法、装置、设备以及存储介质
CN112527748B (zh) * 2020-12-24 2024-04-09 北京百度网讯科技有限公司 用于分析用户操作行为的方法、装置、设备以及存储介质
CN113114490A (zh) * 2021-03-30 2021-07-13 海信集团控股股份有限公司 一种api调用异常告警方法、装置、设备及介质
CN113114490B (zh) * 2021-03-30 2023-10-27 海信集团控股股份有限公司 一种api调用异常告警方法、装置、设备及介质
CN113127319A (zh) * 2021-04-06 2021-07-16 北京大米科技有限公司 一种信息监控方法、相关装置及计算机存储介质
CN113256942A (zh) * 2021-05-18 2021-08-13 中海石油深海开发有限公司 异常事件的超前预警方法、装置、电子设备及介质
CN113420082A (zh) * 2021-05-28 2021-09-21 济南浪潮数据技术有限公司 一种数据同步的异常检测方法和装置
CN113312321A (zh) * 2021-05-31 2021-08-27 中国民航信息网络股份有限公司 一种业务量的异常监测方法及相关设备
CN113343064B (zh) * 2021-06-18 2023-07-28 北京百度网讯科技有限公司 数据处理方法、装置、设备、存储介质以及计算机程序产品
CN113343064A (zh) * 2021-06-18 2021-09-03 北京百度网讯科技有限公司 数据处理方法、装置、设备、存储介质以及计算机程序产品
CN114024831A (zh) * 2021-11-08 2022-02-08 中国工商银行股份有限公司 一种异常事件预警方法、装置和系统
CN114024831B (zh) * 2021-11-08 2024-01-26 中国工商银行股份有限公司 一种异常事件预警方法、装置和系统
CN116208513A (zh) * 2021-11-30 2023-06-02 中移动信息技术有限公司 网关的健康度预测方法及装置
CN115776435A (zh) * 2022-10-24 2023-03-10 华能信息技术有限公司 一种基于api网关的预警方法
CN115776435B (zh) * 2022-10-24 2024-03-01 华能信息技术有限公司 一种基于api网关的预警方法

Similar Documents

Publication Publication Date Title
CN111756579A (zh) 异常预警方法、装置、设备以及存储介质
US11082313B2 (en) Scalable end-to-end quality of service monitoring and diagnosis in software defined networks
US10560465B2 (en) Real time anomaly detection for data streams
JP5474177B2 (ja) 分散アプリケーションの監視
US11093349B2 (en) System and method for reactive log spooling
CN111858248A (zh) 应用监控方法、装置、设备以及存储介质
US20180123922A1 (en) Correlating performance outliers and network performance impacting event metric
US10536505B2 (en) Intelligent data transmission by network device agent
CN112527748A (zh) 用于分析用户操作行为的方法、装置、设备以及存储介质
CN112532972B (zh) 直播业务的故障检测方法、装置、电子设备及可读存储介质
CN111897694A (zh) 小程序中消息处理方法及装置、设备、存储介质
CN111224843B (zh) 资源链路监控方法、装置、设备和存储介质
CN112491617B (zh) 一种链路跟踪方法、装置、电子设备和介质
CN111831512A (zh) 用于排查运维异常的方法、装置、电子设备及存储介质
CN111309574A (zh) 信息处理方法、装置及设备
CN110958250B (zh) 一种端口监控方法、装置和电子设备
CN111865720A (zh) 用于处理请求的方法、装置、设备以及存储介质
CN114091704B (zh) 一种告警压制方法和装置
CN111177513A (zh) 异常访问地址的确定方法、装置、电子设备及存储介质
US10305762B2 (en) Techniques for determining queue backlogs, active counts, and external system interactions in asynchronous systems
CN111464637B (zh) 无人车数据处理方法、装置、设备和介质
US10644971B2 (en) Graph search in structured query language style query
CN110659184B (zh) 健康状态检查方法、装置及系统
CN113825170A (zh) 用于确定网络通道的方法和装置
US20180121329A1 (en) Uninstrumented code discovery

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201009

RJ01 Rejection of invention patent application after publication