CN111786821A - 异常定位方法、服务器及存储介质 - Google Patents

异常定位方法、服务器及存储介质 Download PDF

Info

Publication number
CN111786821A
CN111786821A CN202010554302.9A CN202010554302A CN111786821A CN 111786821 A CN111786821 A CN 111786821A CN 202010554302 A CN202010554302 A CN 202010554302A CN 111786821 A CN111786821 A CN 111786821A
Authority
CN
China
Prior art keywords
abnormal
index
time
level
anomaly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010554302.9A
Other languages
English (en)
Other versions
CN111786821B (zh
Inventor
谭银菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wangsu Science and Technology Co Ltd
Original Assignee
Wangsu Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wangsu Science and Technology Co Ltd filed Critical Wangsu Science and Technology Co Ltd
Priority to CN202010554302.9A priority Critical patent/CN111786821B/zh
Publication of CN111786821A publication Critical patent/CN111786821A/zh
Application granted granted Critical
Publication of CN111786821B publication Critical patent/CN111786821B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions

Abstract

本申请实施例涉及通信技术领域,特别涉及一种异常定位方法、服务器及存储介质。异常定位方法,包括:获取客户端的异常指标;根据所述异常指标和预设的异常检测模型,获取内容分发网络中与所述异常指标对应的异常层级,和所述异常层级中出现所述异常指标时的时间,其中,所述异常检测模型通过历史的客户指标训练得到;根据所述异常指标、所述异常层级和所述异常层级中出现所述异常指标时的时间,确定异常事件的发生位置。采用本申请的实施例,能够快速确定内容分发网络中发生的异常事件的发生位置,有助于提升解决异常事件的效率。

Description

异常定位方法、服务器及存储介质
技术领域
本申请实施例涉及通信技术领域,特别涉及一种异常定位方法、服务器及存储介质。
背景技术
内容分发网络(Content Delivery Network,CDN)是通过在网络各处放置的节点所构成的网络基础之上增加的一层智能虚拟网络,CDN能够将用户的请求导向离用户最近的节点上,使得用户可就近取得所请求的内容,解决网络拥挤的状况,提高用户访问响应速度。当CDN中发生异常事件时,会影响用户访问网络的体验。然而发明人发现相关技术中存在如下问题:相关技术中,CDN的运营方通常是根据用户反馈的不够精确的信息,依赖人工手动去庞大的网络数据库中查找发生的异常事件和异常事件发生的位置,这样会耗费较多的时间,导致运营方解决异常事件的效率较低,用户访问网络的体验受到持续影响。
发明内容
本申请实施例的目的在于提供一种异常定位方法、服务器及存储介质,能够快速确定内容分发网络中发生的异常事件的发生位置,有助于提升解决异常事件的效率。
为解决上述问题,本申请的实施例提供了一种异常定位方法,包括:获取客户端的异常指标;根据所述异常指标和预设的异常检测模型,获取内容分发网络中与所述异常指标对应的异常层级,和所述异常层级中出现所述异常指标时的时间,其中,所述异常检测模型通过历史的客户指标训练得到;根据所述异常指标、所述异常层级和所述异常层级中出现所述异常指标时的时间,确定异常事件的发生位置。
本申请的实施例还提供了一种服务器,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的异常定位方法。
本申请的实施例还提供了一种计算机存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的异常定位方法。
本申请实施例相对于现有技术而言,获取客户端的异常指标;根据所述异常指标和预设的异常检测模型,获取内容分发网络中与所述异常指标对应的异常层级,和所述异常层级中出现所述异常指标时的时间,其中,所述异常检测模型通过历史的客户指标训练得到;根据所述异常指标、所述异常层级和所述异常层级中出现所述异常指标时的时间,确定异常事件的发生位置。由于内容分发网络中,数据是在层级之间传输的,如果数据在层级之间传输时遇到了异常事件,那么异常事件在一定时间内会至少影响到一个层级的正常运作,因此根据异常指标、异常层级和出现异常指标的时间能够快速定位异常事件的发生位置;又由于通过上述方式,能够根据反映异常事件发生的异常指标和经训练的异常检测模型,自动获取到异常指标对应的异常层级和异常层级出现异常指标的时间,从而无需依赖人工手动检索去确定异常层级和异常层级出现异常指标的时间,有效提升了对异常事件进行定位的效率,减少了定位异常事件的耗时,有助于运营方快速解决发生的异常,以保障运营方能够为客户端提供正常的服务。
另外,所述根据所述异常指标,所述异常层级和所述异常层级中出现所述异常指标时的时间,确定异常事件的发生位置,包括:如果存在不同的异常层级对应有相同异常指标,且所述不同的异常层级中出现所述相同异常指标时的时间相同,则确定异常事件的发生位置包括所述不同的异常层级之间。上述提供了一种确定异常事件的发生位置的具体方式,异常检测模型的输出说明在存在同一异常事件在同时间影响到了不同层级的正常运行,则将不同层级中同一时间出现的相同异常指标进行串联,确定异常事件的发生位置包括这两个不同的异常层级之间,也就是数据在这两个不同的异常层级之间传输时遇到了问题。
另外,所述根据所述异常指标,所述异常层级和所述异常层级中出现所述异常指标时的时间,确定异常事件的发生位置,包括:如果所述异常层级的个数为1,所述异常层级对应有不同异常指标,且所述异常层级中出现所述不同异常指标时的时间相同,则确定异常事件的发生位置包括所述异常层级之中。上述提供了一种确定异常事件的发生位置的具体方式,异常检测模型的输出说明在同一时间存在不同的异常事件影响到了一个层级的正常运行,则将同一个异常层级中出现的不同异常指标串联起来,确定异常事件的发生位置包括该异常层级之中,也就是数据传输到该一个异常层级之中时到了问题。
另外,在所述确定异常事件的发生位置包括所述不同的异常层级之间后,还包括:获取所述不同的异常层级所包括的节点中,出现所述相同异常指标的节点对应的异常指标值;根据所述异常指标值的大小,确定所述异常事件发生的节点。可以理解的是,根据出现相同异常指标的节点对应的异常指标值的大小,可以得到异常指标出现较为集中的节点,从而能够较易确定异常事件发生的节点。
另外,所述获取客户端的异常指标,包括:获取客户端上传的异常现象;根据预设的异常现象与异常指标的对应关系,获取与所述异常现象对应的异常指标,作为所述客户端的异常指标。通过上述方式,根据客户端上传的异常现象自动对应到已预设好的异常指标,也就直接得到了关于异常的较为精确的信息,而无需再一步步引导客户端的用户将精确的信息反馈出来,从而可以快速地根据异常指标进行异常事件的排查,提升了异常事件定位的效率。
另外,所述根据所述异常指标和预设的异常检测模型,获取内容分发网络中与所述异常指标对应的异常层级,和所述异常层级中出现所述异常指标时的时间,包括:根据所述异常指标和预设的异常检测模型,获取内容分发网络中与所述异常指标对应的异常层级,和所述异常层级中出现所述异常指标时的时间点;如果在预设的时间窗口内,所述异常层级中出现所述异常指标时的时间点的个数超过预设阈值,则根据所述预设的时间窗口,确定所述异常层级中出现所述异常指标时的时间段,作为所述异常层级中出现所述异常指标时的时间。通过上述方式,将出现异常指标时的时间点收敛为时间段,相较于零散的时间点,时间段作为一个整体能够更为明显地表示一段异常事件发生的时间,更有助于异常确认异常时间的发生位置。
另外,在所述根据所述异常指标和预设的异常检测模型,获取内容分发网络中与所述异常指标对应的异常层级,和所述异常层级中出现所述异常指标时的时间前,还包括:获取所述客户端的标识信息;根据预设的标识信息与异常检测模型的对应关系,获取与所述标识信息对应的异常检测模型,作为所述预设的异常检测模型。通过上述方式,为不同的客户端预先训练了不同的异常检测模型,根据客户端的标识信息能够较易地获取到与客户端对应的异常检测模型,使得异常检测模型的输出结果更贴合其对应的客户端的需求。
另外,所述异常指标包括以下之一或任意组合:异常状态码、异常平均下载速度、异常平均响应时间、异常首屏响应时间、异常卡顿率。上述提供了若干种异常指标,可以理解的是,异常状态码、异常平均下载速度、异常平均响应时间、异常首屏响应时间、异常卡顿率等均能够直观反映响应请求异常、或网络未正常运行等异常现象。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。
图1是根据本申请第一实施例中异常定位方法的流程图;
图2是根据本申请第二实施例中异常定位方法的流程图;
图3是根据本申请第三实施例中服务器的结构方框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的各实施例进行详细的阐述。然而,本领域的普通技术人员可以理解,在本申请各实施例中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施例的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本申请的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
本申请的第一实施例涉及一种异常定位方法,具体流程如图1所示,包括:
步骤101,获取客户端的异常指标;
步骤102,根据异常指标和预设的异常检测模型,获取内容分发网络中与异常指标对应的异常层级,和异常层级中出现异常指标时的时间;
步骤103,根据异常指标,异常层级和异常层级中出现异常指标时的时间,确定异常事件的发生位置。
下面对本实施例的异常定位方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
在步骤101中,服务器获取客户端的异常指标;本实施例中,异常指标可以是以下之一或任意组合:异常状态码、异常平均下载速度、异常平均响应时间、异常首屏响应时间、异常卡顿率,等等。以状态码为例,状态码通常是一个三位数字,不同的数字开头表示了对访问请求的不同响应状态;本实施例中,可以将4开头的状态码(通常表示请求可能出错)、5开头的状态码(通常表示在尝试处理请求时发生内部错误)、或者是0状态码(通常表示请求失败)等等视为异常状态码;以平均下载速度、平均响应时间、首屏响应时间和卡顿率等为例,这些指标都是与客户端实际体验相挂钩的可量化指标,因此可以预设平均下载速度、平均响应时间、首屏响应时间和卡顿率等等的正常数值,将数值超过预设的正常数值的指标视为异常指标。可以理解的是,上述关于异常指标的内容仅为举例说明,并不构成具体的限制。
本实施例中,服务器可以监测客户端收发数据的情况,来获取客户端的指标,并从中获取到异常指标。例如,服务器可以监测客户端在发送访问请求后收到的状态码、客户端接收数据时的平均下载速度、客户端打开首屏的响应时间等等,作为客户端的指标,并根据状态码的数字开头、平均下载速度等的数值大小来确认异常指标。
本实施例中,在步骤101获取客户端的异常指标中,服务器还可以通过步骤1011至步骤1012所示的流程来获取客户端的异常指标,包括:
步骤1011,获取客户端上传的现象;
步骤1012,根据预设的异常现象与异常指标的对应关系,获取与异常现象对应的异常指标,作为客户端的异常指标。
具体地说,服务器可以通过客户端以交互界面的形式提供若干可选择的异常现象给客户端的用户,用户通过交互界面选择在使用客户端的过程中遇到的异常现象,并上传至服务器;服务器根据预设的异常现象与异常指标的对应关系,获取到与客户端上传的异常现象对应的异常指标。例如,预设的异常现象与异常指标的对应关系可以如下表1所示:
Figure BDA0002543674130000051
其中,同一个异常现象可能对应有多个异常指标,则将多个异常指标都获取为客户端的异常指标。通过上述方式,根据客户端上传的异常现象自动对应到已预设好的异常指标,也就直接得到了关于异常的较为精确的信息,而无需再一步步引导客户端的用户将精确的信息反馈出来,从而可以快速地根据异常指标进行异常事件的排查,提升了异常事件定位的效率。
在步骤102中,服务器根据异常指标和预设的异常检测模型,获取内容分发网络中与异常指标对应的异常层级,和异常层级中出现异常指标时的时间。具体地说,服务器可以获取与异常指标对应的第一时间,将第一时间和异常指标作为异常检测模型的输入,得到异常检测模型的输出;异常检测模型的输出包括异常指标、异常层级和异常层级中出现异常指标的时间,三者可以呈以下形式的对应关系:
①异常指标1—异常层级A—时间xx1A……
②异常指标1—异常层级B—时间xx1B……
③异常指标2—异常层级B—时间xx2B……
④异常指标3—异常层级C—时间xx3C……
其中,关于与异常指标对应的第一时间,可以是客户端上传的,也可以是服务器计算出的;例如,客户端可以在向服务器上传异常现象时,还向服务器上传时间,用于表示客户端出现异常现象的时间,服务器接收到客户端上传的时间作为第一时间;又例如,服务器在获取到客户端的异常指标后,以获取到异常指标的时间为结束时间,向前反推一定的时间,将反推后得到的时间作为第一时间;第一时间用于给出一个异常检测的时间范围,能够有助于异常检测模型更高效的进行检测。
可以理解的是,上述关于第一时间的内容仅为举例说明,并不构成具体的限制。
其中,内容分发网络中的异常层级包括:源层级、父层级和边缘层级;本实施例中,异常检测模型输出的异常层级即可以包括异常源层级、异常父层级或异常边缘层级。
其中,异常检测模型输出的异常层级中出现异常指标的时间,可以是以时间点的形式呈现的(例如时间xx1A为10:00,时间xx1B为10:05,等),也可以是以时间段的形式呈现的(例如时间xx1A为10:00—10:05,等);服务器获取到的第一时间和异常检测模型输出的异常层级中出现异常指标的时间并不一定相同。
在实例中,当异常检测模型输出的结果包括:“503状态码—异常边缘层级—(10:00—10:15)”时,可以认为表示在10:00-10:15的时间段内,边缘层级为异常层级,边缘层级中出现的异常指标为503状态码。
具体地说,本实施例中的异常检测模型通过历史的客户指标训练得到;下面对异常检测模型的一种训练方式进行举例说明,但并不构成对异常检测模型的具体限制。
首先,取一段历史时间内各时间点出现指标的数据,确定出指标趋势;例如,在历史时间内,边缘层级中,在10:01出现了200个503状态码,在10:02出现了201个503状态码,10:03出现了200个503状态码……则根据每1分钟出现状态码的数值进行画图,得到边缘层级中出现503状态码的趋势,作为503状态码的参考指标趋势;又例如,客户侧反应出的每1分钟内的首屏耗时均值为:10:01为30ms,10:02为50ms……则根据每1分钟的首屏耗时均值进行画图,得到首屏耗时的趋势,作为首屏耗时的参考指标趋势。
然后,向待训练的模型输入训练样本,训练样本包括异常/非异常指标、异常/非异常指标对应的层级和层级中出现异常/非异常指标的时间,其中异常指标作为正样本,非异常指标作为负样本;训练过程中,待训练的模型根据输入的训练样本,得到训练样本中异常/非异常指标的趋势,并与前文中历史时间内各指标的趋势进行比较;其中,异常指标的趋势与参考指标趋势之间的变化幅度(即差异)大于或等于预设变化幅度,非异常指标的趋势与参考指标趋势之间的变化幅度(即差异)小于预设变化幅度;同时待训练的模型对异常指标对应的异常层级也进行学习。训练完成后,向异常检测模型输入异常指标和与异常指标对应的第一时间,得到异常检测模型的输出,包括异常指标、异常层级和异常层级中出现异常指标的时间。可以理解的是,上述举例中提到的数值,可以是原始数值,也可以是对原始数值处理得到的均值、标准差等,在此不做具体限制。
更具体地说,异常检测模型输出的可以是与异常指标对应的异常层级,和异常层级中出现异常指标的时间点;如果在预设的时间窗口内,异常层级中出现异常指标时的时间点的个数超过预设阈值,则根据预设的时间窗口,确定异常层级中出现异常指标时的时间段,作为异常层级中出述异常指标时的时间;通过上述方式,对异常检测模型输出的时间点进行了收敛,得到时间段;相较于零散的时间点,时间段作为一个整体能够更为明显地表示一段异常事件发生的时间,更有助于异常确认异常事件的发生位置。例如,异常检测模型输出的结果包括:“503状态码—异常边缘层级—(10:00、10:02、10:03、10:05、10:09、10:10、10:12、10:13、10:19、10:25、10:27)”,预设的时间窗口为15分钟,预设阈值为5;首先根据预设的时间窗口,获取到“10:00-10:15”的时间段内,存在8个异常边缘层级出现503状态码的时间点,大于预设阈值,则确定“10:00-10:15”的时间段为异常边缘层级中出现503状态码的时间段;再根据预设的时间窗口,获取到“10:16-10:31”的时间段内,存在3个异常边缘层级出现503状态码的时间点,小于预设阈值,则不将“10:16-10:31”的时间段作为异常边缘层级中出现503状态码的时间段。
另外,考虑到不同客户端之间可能存在的需求差别,本实施例中可以训练与不同(类型)的客户端对应的异常检测模型,以贴合不同客户端的需求;并预设客户端的标识信息与异常检测模型的对应关系,这样服务器可以获取到客户端的标识信息,并根据客户端的标识信息获取到与客户端对应的异常检测模型,再通过与客户端对应的异常检测模型得到异常层级等的输出,从而使得异常检测模型的输出是贴合客户端的需求的。
在步骤103中,服务器根据异常指标、异常层级和异常层级中出现异常指标的时间,确定异常事件的发生位置。本实施例中给出了若干种确定异常事件的发生位置的情况,下面进行详细说明,但并不构成具体的限制。
(1)如果存在不同异常层级对应有相同异常指标,且该不同的异常层级中出现相同异常指标时的时间相同,则确定异常事件的发生位置包括该不同的异常层级之间。
具体地说,以两个异常层级为例,如果异常检测模型输出的结果中,存在异常指标、异常层级和异常层级中出现异常指标的时间为如下的关系时:
①异常指标1—异常层级A—时间t;
②异常指标1—异常层级B—时间t;
即在同一时间,内容分发网络中有两个异常层级出现了相同的异常指标,则说明存在同一异常事件在同时间影响到了这两个异常层级的正常运行,则将两个异常层级串联起来,确定异常事件的发生位置包括这两个不同的异常层级之间,也就是数据在这两个不同的异常层级之间传输时遇到了问题。例如,得到异常检测模型的输出为:
①503状态码—异常父层级—时间xx1、时间xx2、时间xx3
②503状态码—异常边缘层级—时间xx1、时间xx2、时间xx3
根据异常检测模型的输出可知,在相同的时间xx1、时间xx2、时间xx3下,内容分发网络中的父层级和边缘层级处于异常状态,且异常父层级和异常边缘层级都出现了异常指标:503状态码,则将异常父层级和异常边缘层级串联起来,确定异常事件的发生位置包括该异常父层级和异常边缘层级之间。
(2)如果异常层级的个数为1,该异常层级对应有不同异常指标,且该异常层级出现不同异常指标时的时间相同,则确定异常事件的发生位置包括该异常层级之中。
具体地说,如果异常检测模型输出的结果中,仅存在一个异常层级,且异常指标、异常层级和异常层级中出现异常指标的时间为如下的关系时:
①异常指标1—异常层级A—时间t
②异常指标2—异常层级B—时间t
即在同一时间,内容分发网络中仅存在一个异常层级,且该一个异常层级中出现了不同的异常指标,则说明存在不同的异常事件影响到了该异常层级的正常运行,则将该同一个异常层级中出现的不同异常指标串联起来,确定异常事件的发生位置包括该异常层级之中,也就是数据传输到该一个异常层级之中时到了问题。例如,得到异常检测模型的输出为:
①0状态码—异常边缘层级—时间xx1、时间xx2、时间xx3
②503状态码—异常边缘层级—时间xx1、时间xx2、时间xx3
根据异常检测模型的输出可知,在相同的时间xx1、时间xx2、时间xx3下,内容分发网络中仅有边缘层级处于异常状态,且异常边缘层级中出现不同的异常指标:0状态码和503状态码,则将异常边缘层级中的0状态码和503状态码串联起来,确定异常事件的发生位置包括该异常边缘层级之中。
更具体地说,当一个异常层级中出现了不同的异常指标时,可以读取异常层级所包括的节点的访问日志,根据访问日志确定异常事件的发生位置。例如,上述异常边缘层级中出现了0状态码和503状态码,通过读取异常边缘层级所包括的节点的访问日志得知,squid软件对应于0状态码,shark软件对应于503状态码,则确定异常事件的发生位置为异常边缘层级的shark软件至squid软件之中。
(3)如果异常层级中出现异常指标的时间不同,则可以认为异常事件是在不同的时间分别发生的,因此可以就异常层级中出现异常指标的情况单独判断异常事件的发生位置。
例如,得到异常检测模型的输出为:
①异常指标1—异常边缘层级—时间t1
②异常指标1—异常边缘层级—时间t2
即边缘层级均处于异常状态,出现的异常指标相同,但出现异常指标的时间并不相同,则确定在时间t1时和时间t2时异常事件分别的发生在异常边缘层级中,表现为异常指标1。
(4)如果异常层级中出现的异常指标不相同,且出现异常指标的时间也不相同,则可以认为不同的异常事件是在不同的时间分别发生的,因此可以就异常层级中出现异常指标的情况单独判断异常事件的发生位置;另还存在其他情况,同样可以就异常层级中出现异常指标的情况单独判断异常事件的发生位置,此处不再赘述。
在确定异常事件的发生位置后,运营方就可以快速对层级包括的节点进行排查并解决异常事件导致的网络访问问题。
本实施例相对于现有技术而言,获取客户端的异常指标;根据异常指标和预设的异常检测模型,获取内容分发网络中与异常指标对应的异常层级,和异常层级中出现异常指标时的时间,其中,异常检测模型通过历史的客户指标训练得到;根据异常指标、异常层级和异常层级中出现异常指标时的时间,确定异常事件的发生位置。由于内容分发网络中,数据是在层级之间传输的,如果数据在层级之间传输时遇到了异常事件,那么异常事件在一定时间内会至少影响到一个层级的正常运作,因此根据异常指标、异常层级和出现异常指标的时间能够快速定位异常事件的发生位置;又由于通过上述方式,能够根据反映异常事件发生的异常指标和经训练的异常检测模型,自动获取到异常指标对应的异常层级和异常层级出现异常指标的时间,从而无需依赖人工手动检索去确定异常层级和异常层级出现异常指标的时间,有效提升了对异常事件进行定位的效率,减少了定位异常事件的耗时,有助于运营方快速解决发生的异常,以保障运营方能够提供为客户端提供正常的服务。
本申请第二实施例涉及一种异常定位方法,第二实施例在第一实施例的基础上,在确定了异常事件的发生位置之后,还根据与异常层级所包括的节点的相关信息,确定异常事件发生的节点,从而更明确了异常事件的发生位置。本申请第二实施例中的异常定位方法的流程图如图2所示,下面进行详细说明。
步骤201,获取客户端的异常指标;此步骤与步骤101大致相同,此处不再赘述。
步骤202,根据异常指标和预设的异常检测模型,获取内容分发网络中与异常指标对应的异常层级,和异常层级中出现异常指标时的时间;此步骤与步骤202大致相同,此处不再赘述。
步骤203,根据异常指标,异常层级和异常层级中出现异常指标时的时间,确定异常事件的发生位置;此步骤与步骤203大致相同,此处不再赘述。
步骤204,当确定异常事件的发生位置包括不同的异常层级之间时,获取不同的异常层级所包括的节点中,出现相同异常指标的节点对应的异常指标值;
步骤205,根据异常指标值的大小,确定异常事件发生的节点。
具体地说,本实施例中以异常事件的发生位置包括不同的异常层级之间为例进行说明。首先,服务器读取获取不同的异常层级所包括的节点(也可以理解为异常层级所包括的cache组,即缓存组)的访问日志,从访问日志中获取出现相同异常指标的节点对应的异常指标值。
常见的节点的访问日志可以理解为http访问日志,其中通常包括以下字段:响应时间、状态码、流入带宽、流出带宽、访问端的IP地址、访问请求的URL地址、回父IP地址、回源IP地址等等。
在一个实例中,确定异常事件的发生位置包括边缘层级和父层级之间,异常指标为503状态码,则读取边缘层级和父层级所包括的节点的访问日志,获取边缘层级所包括的节点和父层级所包括的节点中出现503状态码的节点对应的指标值;本实例中,出现503状态码的节点对应的指标值可以包括:节点中出现的相同异常指标个数、第一比例(表示节点中出现的相同异常指标个数占异常层级中出现异常指标时的时间(下文简称为异常时间)内相同异常指标总数(即所有节点出现的相同指标个数的总和)的比例)、第二比例(表示节点中出现的相同异常指标个数占异常时间内节点总访问请求数的比例)、第三比例(节点中出现的相同异常指标个数占节点总访问请求数的比例)等等;边缘层级所包括的节点和父层级所包括的节点中出现503状态码的节点对应的指标值可如下表所示:
Figure BDA0002543674130000101
Figure BDA0002543674130000111
由上表可知,边缘层级中的节点回父层级时发生了异常,相同异常指标集中出现在边缘层级的xx1节点和xx2节点,则确定异常事件发生在边缘层级的xx1节点和xx2节点,从而运营方可以对xx1节点和xx2节点进行处理,以解除异常事件所造成的影响。可以理解的是,上述关于节点对应的异常指标值和根据异常指标值的大小确定异常事件发生的节点仅为举例说明,并不构成具体的限制。
本实施例相对于现有技术而言,在确定异常事件的发生位置包括不同的异常层级之间后,还获取不同的异常层级所包括的节点中,出现相同异常指标的节点对应的异常指标值,并根据异常指标值的大小,可以得到异常指标出现较为集中的节点,从而能够较易确定异常事件发生的节点。
本发明的第三实施例涉及一种服务器,如图3所示,包括:至少一个处理器301;以及,与至少一个处理器301通信连接的存储器302;其中,存储器302存储有可被至少一个处理器301执行的指令,指令被至少一个处理器301执行,以使至少一个处理器301能够执行上述异常定位方法。
其中,存储器302和处理器301采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器302的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器301处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器301。
处理器301负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器302可以被用于存储处理器301在执行操作时所使用的数据。
本发明的第四实施例涉及一种计算机存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述异常定位方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施例是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (10)

1.一种异常定位方法,其特征在于,包括:
获取客户端的异常指标;
根据所述异常指标和预设的异常检测模型,获取内容分发网络中与所述异常指标对应的异常层级,和所述异常层级中出现所述异常指标时的时间,其中,所述异常检测模型通过历史的客户指标训练得到;
根据所述异常指标、所述异常层级和所述异常层级中出现所述异常指标时的时间,确定异常事件的发生位置。
2.根据权利要求1所述的异常定位方法,其特征在于,所述根据所述异常指标,所述异常层级和所述异常层级中出现所述异常指标时的时间,确定异常事件的发生位置,包括:
如果存在不同的异常层级对应有相同异常指标,且所述不同的异常层级中出现所述相同异常指标时的时间相同,则确定异常事件的发生位置包括所述不同的异常层级之间。
3.根据权利要求1所述的异常定位方法,其特征在于,所述根据所述异常指标,所述异常层级和所述异常层级中出现所述异常指标时的时间,确定异常事件的发生位置,包括:
如果所述异常层级的个数为1,所述异常层级对应有不同异常指标,且所述异常层级中出现所述不同异常指标时的时间相同,则确定异常事件的发生位置包括所述异常层级之中。
4.根据权利要求2所述的异常定位方法,其特征在于,在所述确定异常事件的发生位置包括所述不同的异常层级之间后,还包括:
获取所述不同的异常层级所包括的节点中,出现所述相同异常指标的节点对应的异常指标值;
根据所述异常指标值的大小,确定所述异常事件发生的节点。
5.根据权利要求1所述的异常定位方法,其特征在于,所述获取客户端的异常指标,包括:
获取客户端上传的异常现象;
根据预设的异常现象与异常指标的对应关系,获取与所述异常现象对应的异常指标,作为所述客户端的异常指标。
6.根据权利要求1所述的异常定位方法,其特征在于,所述根据所述异常指标和预设的异常检测模型,获取内容分发网络中与所述异常指标对应的异常层级,和所述异常层级中出现所述异常指标时的时间,包括:
根据所述异常指标和预设的异常检测模型,获取内容分发网络中与所述异常指标对应的异常层级,和所述异常层级中出现所述异常指标时的时间点;
如果在预设的时间窗口内,所述异常层级中出现所述异常指标时的时间点的个数超过预设阈值,则根据所述预设的时间窗口,确定所述异常层级中出现所述异常指标时的时间段,作为所述异常层级中出现所述异常指标时的时间。
7.根据权利要求1所述的异常定位方法,其特征在于,在所述根据所述异常指标和预设的异常检测模型,获取内容分发网络中与所述异常指标对应的异常层级,和所述异常层级中出现所述异常指标时的时间前,还包括:
获取所述客户端的标识信息;
根据预设的标识信息与异常检测模型的对应关系,获取与所述标识信息对应的异常检测模型,作为所述预设的异常检测模型。
8.根据权利要求1-5中任一项所述的异常定位方法,其特征在于,所述异常指标包括以下之一或任意组合:异常状态码、异常平均下载速度、异常平均响应时间、异常首屏响应时间、异常卡顿率。
9.一种服务器,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-8中任一项所述的异常定位方法。
10.一种计算机存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的异常定位方法。
CN202010554302.9A 2020-06-17 2020-06-17 异常定位方法、服务器及存储介质 Active CN111786821B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010554302.9A CN111786821B (zh) 2020-06-17 2020-06-17 异常定位方法、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010554302.9A CN111786821B (zh) 2020-06-17 2020-06-17 异常定位方法、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN111786821A true CN111786821A (zh) 2020-10-16
CN111786821B CN111786821B (zh) 2023-05-26

Family

ID=72756728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010554302.9A Active CN111786821B (zh) 2020-06-17 2020-06-17 异常定位方法、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN111786821B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113360310A (zh) * 2021-06-02 2021-09-07 北京百度网讯科技有限公司 网络模型异常的处理方法、装置、设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102647299A (zh) * 2012-04-24 2012-08-22 网宿科技股份有限公司 基于内容分发网络的层次化报警分析方法和系统
US20130051248A1 (en) * 2011-08-30 2013-02-28 Dan Pei Hierarchical anomaly localization and prioritization
CN111130912A (zh) * 2019-12-31 2020-05-08 网宿科技股份有限公司 内容分发网络的异常定位方法、服务器及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130051248A1 (en) * 2011-08-30 2013-02-28 Dan Pei Hierarchical anomaly localization and prioritization
CN102647299A (zh) * 2012-04-24 2012-08-22 网宿科技股份有限公司 基于内容分发网络的层次化报警分析方法和系统
CN111130912A (zh) * 2019-12-31 2020-05-08 网宿科技股份有限公司 内容分发网络的异常定位方法、服务器及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113360310A (zh) * 2021-06-02 2021-09-07 北京百度网讯科技有限公司 网络模型异常的处理方法、装置、设备和存储介质
CN113360310B (zh) * 2021-06-02 2023-08-04 北京百度网讯科技有限公司 网络模型异常的处理方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN111786821B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
CN110971444B (zh) 告警管理方法、装置、服务器及存储介质
CN111130912B (zh) 内容分发网络的异常定位方法、服务器及存储介质
CN109412870B (zh) 告警监控方法及平台、服务器、存储介质
CN113010374B (zh) 一种基于监控平台的量子设备监控的方法、系统
US20180219808A1 (en) Optimizing evaluation of effectiveness for multiple versions of electronic messages
CN112380089A (zh) 一种数据中心监控预警方法及系统
KR20200128144A (ko) 네트워크 장치의 상태를 결정하는 방법 및 장치
CN111709124A (zh) 产品fmeca分析方法、装置、计算机设备和存储介质
CN110363381B (zh) 一种信息处理方法和装置
CN110311975B (zh) 一种数据请求处理方法及装置
CN111930306A (zh) 一种数据处理方法和装置
CN111786821A (zh) 异常定位方法、服务器及存储介质
CN112860512B (zh) 接口监控的优化方法、装置、计算机设备及存储介质
US20100131497A1 (en) Method for determining which of a number of test cases should be run during testing
CN108023740B (zh) 监控中异常信息的风险提示方法和装置
CN115296979B (zh) 一种故障处理方法、装置、设备及存储介质
CN113706739B (zh) 远程故障诊断处理方法、平台及系统
CN111124805A (zh) 数据采集方法、装置、设备及存储介质
CN115357011A (zh) 一种机器人故障处理方法、装置、介质以及电子设备
CN115499302A (zh) 业务系统的监测方法、装置、可读存储介质及电子设备
CN111752786A (zh) 压力测试过程中的数据存储方法、汇总方法、设备及介质
EP3772834B1 (en) A method of predicting the time course of a plurality of data relative to a telephony infrastructure for network function virtualization
CN116545941B (zh) 一种指令发送方法、系统、智能终端及存储介质
CN115442209B (zh) 一种故障检测方法、装置、电子设备及存储介质
CN114398281A (zh) 一种应用接口耗时测试方法、系统和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant