CN111130912A - 内容分发网络的异常定位方法、服务器及存储介质 - Google Patents

内容分发网络的异常定位方法、服务器及存储介质 Download PDF

Info

Publication number
CN111130912A
CN111130912A CN201911421242.7A CN201911421242A CN111130912A CN 111130912 A CN111130912 A CN 111130912A CN 201911421242 A CN201911421242 A CN 201911421242A CN 111130912 A CN111130912 A CN 111130912A
Authority
CN
China
Prior art keywords
abnormal
preset
distribution network
content distribution
abnormality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911421242.7A
Other languages
English (en)
Other versions
CN111130912B (zh
Inventor
陈芹浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wangsu Science and Technology Co Ltd
Original Assignee
Wangsu Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wangsu Science and Technology Co Ltd filed Critical Wangsu Science and Technology Co Ltd
Priority to CN201911421242.7A priority Critical patent/CN111130912B/zh
Publication of CN111130912A publication Critical patent/CN111130912A/zh
Application granted granted Critical
Publication of CN111130912B publication Critical patent/CN111130912B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例涉及通信技术领域,特别涉及一种内容分发网络的异常定位方法、服务器及存储介质。内容分发网络的异常定位方法,包括:获取单位时间内内容分发网络中的各边缘节点的状态信息;如果存在N个所述边缘节点的状态信息满足预设条件,则获取N个所述边缘节点的异常信息;至少根据所述异常信息,确定异常发生的位置;如果确定所述异常发生在所述内容分发网络中,则依次判断所述边缘节点、父节点、源站的异常信息以确定所述异常发生的位置,并发出告警信息;其中,N为大于或等于预设告警个数的整数。采用本发明的实施例有助于快速对内容分发网络中出现的异常进行定位,以保障网络的正常运行。

Description

内容分发网络的异常定位方法、服务器及存储介质
技术领域
本发明实施例涉及通信技术领域,特别涉及一种内容分发网络的异常定位方法、服务器及存储介质。
背景技术
内容分发网络(Content Delivery Network,CDN)是通过在网络各处放置的节点所构成的网络基础之上增加的一层智能虚拟网络,CDN能够将用户的请求导向离用户最近的节点上,使得用户可就近取得所请求的内容,解决网络拥挤的状况,提高用户访问响应速度;CDN的节点包括边缘节点、父节点和源站,当CDN的节点出现异常时,会影响用户访问网络的体验质量。然而发明人发现相关技术中存在如下问题:相关技术中,通常是在用户上报无法正常访问网络时,或是运维人员发现节点无法返回用户请求的内容时,运维人员才发现CDN出现异常,且并不能迅速的确定发生异常的具体位置,因此还需等待运维人员排查出异常发生的位置后再进行维修,导致解决异常的效率较低,用户访问网络的体验质量受到持续影响,网络无法正常运行的可能性增大。
发明内容
本发明实施例的目的在于提供一种内容分发网络的异常定位方法、服务器及存储介质,有助于快速对内容分发网络中出现的异常进行定位,以保障网络的正常运行。
为解决上述问题,本发明的实施例提供了一种内容分发网络的异常定位方法,包括:获取单位时间内内容分发网络中的各边缘节点的状态信息;如果存在N个所述边缘节点的状态信息满足预设条件,则获取N个所述边缘节点的异常信息;至少根据所述异常信息,确定异常发生的位置;如果确定所述异常发生在所述内容分发网络中,则依次判断所述边缘节点、父节点、源站的异常信息以确定所述异常发生的位置,并发出告警信息;其中,N为大于或等于预设告警个数的整数。
本发明的实施例还提供了一种服务器,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的内容分发网络的异常定位方法。
本发明的实施例还提供了一种计算机存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述的内容分发网络的异常定位方法。
本发明实施例相对于现有技术而言,获取单位时间内内容分发网络中的各边缘节点的状态信息;如果存在N个所述边缘节点的状态信息满足预设条件,则获取N个所述边缘节点的异常信息;至少根据所述异常信息,确定异常发生的位置;如果确定所述异常发生在所述内容分发网络中,则依次判断所述边缘节点、父节点、源站的异常信息以确定所述异常发生的位置,并发出告警信息;其中,N为大于或等于预设告警个数的整数。由于边缘节点是内容分发网络中最靠近访问端的节点,边缘节点的状态信息能够切实有效地反映边缘节点在单位时间内是否正常为访问端提供了服务;如果有大于或等于预设告警个数的边缘节点的状态信息满足预设条件,说明有较多边缘节点在单位时间内未能正常运行,也就是内容分发网络中可能存在异常,存在的异常导致了较多边缘节点的非正常运行,因此获取N个边缘节点的异常信息,来确定异常发生的位置;如果异常发生在内容分发网络中,则依次判断内容分发网络中边缘节点、父节点及源站的异常信息来确定异常发生的位置,并发出告警信息,以提示运维人员及时地对异常发生的位置进行排查维修;通过上述方式能够快速主动地在边缘节点非正常运行时定位异常发生的位置并进行告警,有助于及时对内容分发网络中出现的异常进行排查维修,并非要等待发现网络中断后再进行异常的定位排查,使得解决内容分发网络中的异常的效率得到了提升,有利于保障网络的正常运行。
另外,所述至少根据所述异常信息,确定异常发生的位置,包括:根据所述状态信息,所述异常信息和预设阈值,确定异常发生的位置;其中,所述状态信息包括:异常流入带宽增长值、异常流出带宽下降值;所述异常信息包括:第一异常比例和第二异常比例,或第一异常比例、第二异常比例和第三异常比例;所述第一异常比例用于表征所述边缘节点的异常状态码对应的IP段中,数量最多的IP段占所有IP段的比例;所述第二异常比例用于表征所述边缘节点的所述异常状态码对应的URL地址中,数量最多的URL地址占所有URL地址的比例;所述第三异常比例用于表征所述边缘节点的所述异常状态码对应的回父IP地址中,数量最多的回父IP地址占所有回父IP地址的比例;所述预设阈值包括预设集中阈值,预设非集中阈值和预设变化阈值,所述预设集中阈值大于所述预设非集中阈值。上述方式中,根据异常的边缘节点,从多个角度对异常发生的位置进行判定,其中,异常流入带宽增长值能够反映异常的边缘节点是否受到了访问端的访问攻击,异常流出带宽下降值能够反映异常的边缘节点是否正常返回了访问端请求的内容,对IP段、URL地址及回父IP地址的统计得到的第一异常比例至第三异常比例能够反映异常的边缘节点受到访问以及响应请求的情况。
另外,所述根据所述状态信息,所述异常信息和预设阈值,确定异常发生的位置,包括:如果N个所述边缘节点的所述异常流入带宽增长值均大于所述预设变化阈值,所述第一异常比例均大于所述预设集中阈值,且所述第二异常比例均小于所述预设非集中阈值,则确定异常发生的位置为访问端;所述方法还包括:发出表征所述异常发生的位置为访问端的告警信息。由于异常的边缘节点的异常流入带宽增长值均大于预设变化阈值,且访问端的IP段集中,同时访问端请求的内容分散,说明边缘节点受到了来自相同IP段的多次访问,导致流入流量明显突增,存在异常的边缘节点被访问端进行攻击访问的可能性,因此确定异常发生的位置为访问者端,并发出告警信息以提示运维人员对访问端进行排查维修。
另外,如果确定所述异常发生在所述内容分发网络中,所述确定所述异常发生的位置,包括:如果N个所述边缘节点的所述异常流出带宽下降值均大于所述预设变化阈值,所述第一异常比例均小于所述预设非集中阈值,且所述第二异常比例均大于所述预设集中阈值,则确定所述异常发生的位置为父节点或源站。由于异常的边缘节点的异常流出带宽下降值均大于预设变化阈值,且访问端请求的内容集中,同时访问端的IP段分散,说明异常的边缘节点接收到了不同IP段的访问端对同一个内容的多次访问请求,且异常的边缘节点未能正常返回该内容,也就是说异常的边缘节点未能成功从父节点或是源站请求到该内容,因此确定异常发生的位置为父节点或源站,从而提示运维人员对异常的边缘节点的父节点或是源站进行排查维修。
另外,在确定所述异常发生的位置为父节点或源站之后,还包括:如果N个所述边缘节点的所述第三异常比例均大于所述预设集中阈值,且所述数量最多的回父IP地址均相同,则确定所述异常发生的位置为父节点。可以理解的是,由于异常的边缘节点的回父IP地址集中,且数量最多的回父IP地址均相同,说明存在多个异常的边缘节点未能成功从父节点请求到访问端请求的内容,因此确定异常发生的位置为父节点,从而提示运维人员对父节点进行排查维修。
另外,在所述确定所述异常发生的位置为父节点或源站之后,还包括:如果N个所述边缘节点的所述第三异常比例均小于所述预设非集中阈值,且所述数量最多的回父IP地址均不相同,则确定所述异常发生的位置为源站;所述发出告警信息,包括:发出表征所述异常发生在源站存储的文件的告警信息。可以理解的是,由于异常的边缘节点的回父IP地址不集中,且数量最多的回父IP地址均不相同,说明产生异常的位置并不在异常的边缘节点的父节点,而是源站,且是由于源站存储的文件存在异常,导致异常的边缘节点或是其父节点无法从源站请求到访问端请求的内容,因此确定异常发生的位置为源站,并发出告警信息以提示运维人员对源站存储的文件进行排查,也就是对不同的访问端多次请求的同一个内容进行排查维修。
另外,如果确定所述异常发生在所述内容分发网络中,所述确定所述异常发生的位置,包括:如果N个所述边缘节点的所述第一异常比例和所述第二异常比例均小于所述预设非集中阈值,所述第三异常比例大于所述预设集中阈值,且所述数量最多的回父IP地址均相同,则确定所述异常发生的位置为父节点。由于异常的边缘节点的访问端的IP段分散,访问端请求的内容也分散,于是进一步对异常的边缘节点的回父IP地址进行分析,当异常的边缘节点的回父IP地址集中,且数量最多的回父IP地址均相同,说明存在多个异常的边缘节点未能成功从父节点请求到访问端请求的内容,因此确定异常发生的位置为父节点,从而提示运维人员对父节点进行排查维修。
另外,所述状态信息还包括:回源IP地址;如果确定所述异常发生在所述内容分发网络中,所述确定所述异常发生的位置,包括:如果N个所述边缘节点的所述第一异常比例、所述第二异常比例和所述第三异常比例均小于所述预设非集中阈值,所述数量最多的回父IP地址均不相同,且所述回源IP地址均相同,则确定异常发生的位置为源站。由于异常的边缘节点的访问端的IP端、访问端请求的内容以及回父IP地址均不集中,回父IP地址也不相同,说明异常的分布普遍且分散,因此进一步对异常的边缘节点的回源IP地址进行分析,当异常的边缘节点的回源IP地址均相同时,说明是源站发生了异常,因此确定异常发生的位置为源站,并发出告警信息以提示运维人员对源站进行排查维修。
另外,所述状态信息还包括:异常响应时间的比例、异常状态码的比例;所述状态信息满足预设条件,包括:所述异常响应时间的比例或所述异常状态码的比例大于预设异常阈值,且所述异常流入带宽增长值或异常流出带宽下降值大于所述预设变化阈值。上述提供了一种判断边缘节点是否异常的具体实现方式。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。
图1是根据本发明第一实施例中内容分发网络的异常定位方法的流程图;
图2是根据本发明第二实施例中内容分发网络的异常定位方法的流程图;
图3是根据本发明第三实施例中的服务器的结构方框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施例进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施例中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施例的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
本发明的第一实施例涉及一种内容分发网络的异常定位方法,具体流程如图1所示,包括:
步骤101,获取单位时间内内容分发网络中的各边缘节点的状态信息;
步骤102,如果存在N个边缘节点的状态信息满足预设条件,则获取N个边缘节点的异常信息;
步骤103,至少根据异常信息,确定异常发生的位置;
步骤104,如果确定异常发生在内容分发网络中,则依次判断边缘节点、父节点、源站的异常信息以确定异常发生的位置,并发出告警信息。
下面对本实施例的内容分发网络的异常定位方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
在步骤101中,服务器获取单位时间内,内容分发网络中各边缘节点的状态信息;由于边缘节点是内容分发网络中最靠近访问端的节点,边缘节点的访问记录中记录有访问端的每一次访问的情况以及节点运行数据等,对于节点服务质量的分析十分关键,因此本实施例中各边缘节点的状态信息可以理解为从边缘节点的访问记录中统计分析得到的状态信息。
具体地说,常见的边缘节点的访问日志可以理解为http访问日志,其中通常包括以下字段:响应时间、状态码、流入带宽、流出带宽、访问端的IP地址、访问请求的URL地址、回父IP地址、回源IP地址等等;其中,响应时间表示从访问端向节点发起访问请求至访问端收到响应所经过的时间,状态码表示节点对访问请求的响应状态,流入带宽表示节点接收到的访问请求流量带宽,流出带宽表示节点反馈出去的流量带宽,等。根据访问日志中的字段统计分析得到的状态信息可以包括:异常流入带宽增长值、异常流出带宽下降值、异常响应时间的比例、异常状态码的比例;下面对上述状态信息进行详细说明,但上述状态信息仅为举例,并不构成具体的限制。
(1)异常流入带宽增长值,能够辅助判断边缘节点是否受到了访问端的攻击访问,可以是异常流入带宽的同比增长值,也可以是异常流入带宽的环比增长值。在实例中,在计算一确定边缘节点的异常流入带宽的同比增长值时,记录单位时间内获取到异常流入带宽A0时的时刻,并获取该边缘节点在一个月前的同一时刻的异常流入带宽A1,当A0大于A1时,计算A0和A1的差值作为该边缘节点的异常流入带宽的同比增长值;在计算该边缘节点的异常流入带宽的环比增长值时,获取该边缘节点在十分钟前的异常流入带宽A2,当A0大于A2时,计算A0和A2的差值作为该边缘节点的异常流入带宽的环比增长值。
(2)异常流出带宽下降值,能够反映边缘节点是否正常返回了访问端请求的内容,可以是异常流出带宽的同比下降值,也可以是异常流出带宽的环比下降值。在实例中,在计算一确定边缘节点的异常流出带宽的同比下降值时,记录单位时间内获取到异常流出带宽B0的时刻,并获取该边缘节点在一个月前的同一时刻的异常流出带宽B1,当B0小于B1时,计算B1和B0的差值作为该边缘节点的异常流出带宽的同比下降值;在计算该边缘节点的异常流出带宽的环比下降值时,获取该边缘节点在十分钟前的异常流出带宽B2,当B0小于B2时,计算B2和B0的差值作为该边缘节点的异常流出带宽的环比下降值。
可以理解的是,上述实例中的“一个月前”和“十分钟前”均为方便理解进行的举例,并不构成实际的限定,也就是计算较长时间范围内的变化值作为同比变化值,有利于排除一部分季节因素对于访问数据和返回数据的影响;计算较短时间范围内的变化值作为环比变化值,有利于直观表明短时间内访问数据和返回数据的连续变化。
(3)异常响应时间的比例,表示单位时间内获取到的异常响应时间的个数和获取到的总响应时间的个数的比值。在实例中,服务器从边缘节点的访问记录中获取到单位时间内的10个响应时间,将其中4个大于3秒的响应时间判定为异常响应时间,则计算得到异常响应时间的比例为(4/10)×(100%)=40%。
(4)异常状态码的比例,表示单位时间内获取到的异常状态码的个数和获取到的总状态码的个数的比值。状态码通常是一个三位数字,不同的数字开头表示了节点对访问请求的不同响应状态,例如1开头的状态码通常表示节点接收并继续处理请求,2开头的状态码通常表示节点已成功接收并理解了请求,3开头的状态码通常表示节点需要进一步操作才能完成请求,4开头的状态码通常表示请求可能出错,5开头的状态码通常表示节点在尝试处理请求时发生内部错误等。在实例中,服务器从边缘节点的访问记录中获取到单位时间内的10个状态码,将其中3个以4开头或以5开头的状态码判定为异常状态码,则计算得到异常状态码的比例为(3/10)×(100%)=30%。
在步骤102中,如果服务器判定存在N个边缘节点的状态信息满足预设条件,则获取这N个边缘节点的异常信息,其中,N为大于或等于预设告警个数的整数,并不做具体限制。本实施例中,边缘节点的状态信息满足预设条件,包括:异常响应时间的比例或异常状态码的比例大于预设异常阈值,且异常流入带宽增长值或异常流出带宽下降值大于预设变化阈值;下面以步骤101中提到的状态信息为例,进行详细说明。
(1)异常响应时间的比例或异常状态码的比例大于预设异常阈值,例如,预设异常阈值为50%,异常响应时间的比例>50%或异常状态码的比例>50%;
(2)异常流入带宽增长值或异常流出带宽下降值大于预设变化阈值,例如,预设变化阈值为30%,异常流入带宽增长值>30%或异常流出带宽下降值>30%。
当N个边缘节点的状态信息均满足上述预设条件时,则可将这N个边缘节点判定为异常的边缘节点,并获取这N个边缘节点的异常信息,以进一步确定异常发生的位置。
在步骤103中,至少根据异常信息,确定异常发生的位置,例如,根据边缘节点的状态信息、异常信息以及预设阈值来确定异常发生的位置。
本实施例中,边缘节点的异常信息可以包括第一异常比例和第二异常比例,或第一异常比例、第二异常比例和第三异常比例。
其中,第一异常比例用于表征边缘节点的异常状态码对应的IP段中,数量最多的IP段占所有IP段的比例;在实例中,服务器获取到单位时间内,异常的边缘节点的2000个异常状态码对应的IP地址,这些IP地址分属于若干个IP段,其中有一个数量最多的IP段对应有1000个异常状态码,则计算得到第一异常比例为(1000/2000)×(100%)=50%。
具体地说,采用计算IP段所占比例的方式,相对于直接计算IP地址所占比例的方式,更容易集中异常数据,减少了分散、遗漏异常数据的情况;例如,分别计算异常状态码对应的IP地址1.1.1.0、1.1.1.1和1.1.1.2占所有IP地址的比例时,可能三个异常的IP地址所占比例均达不到预设的阈值,从而导致了异常数据的统计遗漏;如果将IP地址1.1.1.0、1.1.1.1和1.1.1.2均划分到IP段1.1.1.X中,也就是将异常的IP地址集合起来,从而异常的IP段所占比例更容易达到预设的阈值,也就减少了分散、遗漏异常数据的情况,使得对于异常比例的计算更为准确。
其中,第二异常比例用于表征边缘节点的异常状态码对应的URL地址中,数量最多的URL地址占所有URL地址的比例;在实例中,服务器获取到单位时间内,异常的边缘节点的2000个异常状态码对应的URL地址,其中有一个数量最多的URL地址对应有1500个异常状态码,则计算得到第二异常比例为(1500/2000)×(100%)=75%。
其中,第三异常比例用于表征边缘节点的异常状态码对应的回父IP地址中,数量最多的回父IP地址占所有回父IP地址的比例;在实例中,服务器获取到单位时间内,异常的边缘节点的2000个异常状态码对应的回父IP地址,其中有一个数量最多的回复IP地址对应有1800个,则计算得到第三异常比例为(1800/2000)×(100%)=90%。
预设阈值包括预设集中阈值,预设非集中阈值和预设变化阈值,预设集中阈值大于预设非集中阈值;在实例中,预设集中阈值可以为80%,预设非集中阈值可以为30%,预设变化阈值可以为步骤102中的30%。
在一种情况中,根据边缘节点的状态信息、异常信息以及预设阈值来确定异常发生的位置,可以理解为:
如果N个边缘节点的异常流入带宽增长值均大于预设变化阈值,第一异常比例均大于预设集中阈值,且第二异常比例均小于预设非集中阈值,则确定异常发生的位置为访问端;另外,还发出表征异常发生的位置为访问端的告警信息。
具体地说,由于异常的边缘节点的异常流入带宽增长值均大于预设变化阈值,且访问端的IP段集中,同时访问端请求的内容分散,说明边缘节点受到了来自相同IP段的多次访问,导致流入流量明显突增,存在异常的边缘节点被访问端进行攻击访问的可能性,因此确定异常发生的位置为访问者端,并发出告警信息以提示运维人员对访问端进行排查维修。
在一个实例中,如果10个边缘节点状态信息满足预设条件,这10个边缘节点的异常流入带宽增长值均大于30%,第一异常比例均大于80%,第二异常比例均小于30%,则确定异常发生的位置为访问端,并发出“访问端异常”的告警信息。
在步骤104中,如果确定异常发生在内容分发网络中,则依次判断边缘节点、父节点、源站的异常信息以确定异常发生的位置,并发出告警信息。
具体地说,如果异常并非发生在访问端,则可以确定异常发生在内容分发网络中;由于内容分发网络是由边缘节点、父节点和源站构成的,因此依次判断边缘节点、父节点和源站的异常信息以确定异常发生的,并发出告警信息,以提示运维人员及时地对异常发生的位置进行排查维修。
本实施例相对于现有技术而言,获取单位时间内内容分发网络中的各边缘节点的状态信息;如果存在N个边缘节点的状态信息满足预设条件,则获取N个边缘节点的异常信息;至少根据异常信息,确定异常发生的位置;如果确定异常发生在内容分发网络中,则依次判断边缘节点、父节点、源站的异常信息以确定异常发生的位置,并发出告警信息;其中,N为大于或等于预设告警个数的整数。由于边缘节点是内容分发网络中最靠近访问端的节点,边缘节点的状态信息能够切实有效地反映边缘节点在单位时间内是否正常为访问端提供了服务;如果有大于或等于预设告警个数的边缘节点的状态信息满足预设条件,说明有较多边缘节点在单位时间内未能正常运行,也就是内容分发网络中可能存在异常,存在的异常导致了较多边缘节点的非正常运行,因此获取N个边缘节点的异常信息,来确定异常发生的位置;如果异常发生在内容分发网络中,则依次判断内容分发网络中边缘节点、父节点及源站的异常信息来确定异常发生的位置,并发出告警信息,以提示运维人员及时地对异常发生的位置进行排查维修;通过上述方式能够快速主动地在边缘节点非正常运行时定位异常发生的位置并进行告警,有助于及时对内容分发网络中出现的异常进行排查维修,并非要等待发现网络中断后再进行异常的定位排查,使得解决内容分发网络中的异常的效率得到了提升,有利于保障网络的正常运行。
本发明第二实施例涉及一种内容分发网络的异常定位方法,第二实施例在第一实施例的基础上,提供在确定异常发生在内容分发网络中的情况下,确定异常发生的位置,并发出告警信息的具体实现方式。本发明第二实施例中的内容分发网络的异常定位方法的流程图如图2所示,下面进行详细说明。
步骤201,获取单位时间内内容分发网络中的各边缘节点的状态信息;此步骤与步骤101大致相同,此处不再赘述。
步骤202,如果存在N个边缘节点的状态信息满足预设条件,则获取N个边缘节点的异常信息;此步骤与步骤102大致相同,此处不再赘述。
步骤203,至少根据异常信息,确定异常发生的位置;此步骤与步骤103大致相同,此处不再赘述。
步骤204,如果确定异常发生在内容分发网络中,则依次判断边缘节点、父节点、源站的异常信息以确定异常发生的位置,并发出告警信息。本实施例中提供了若干种确定异常发生的位置的情况,下面进行说明;为了便于说明,下文中将第一异常比例以R1代替,第二异常比例R2代替,第三异常比例以R3代替。
情况一:如果N个边缘节点的异常流出带宽下降值均大于预设变化阈值,第一异常比例均小于预设非集中阈值,且第二异常比例均大于预设集中阈值,则确定异常发生的位置为父节点或源站。
由于异常的边缘节点的异常流出带宽下降值均大于预设变化阈值,且访问端请求的内容集中,同时访问端的IP段分散,说明异常的边缘节点接收到了不同IP段的访问端对同一个内容的多次访问请求,且异常的边缘节点未能正常返回该内容,也就是说异常的边缘节点未能成功从父节点或是源站请求到该内容,因此确定异常发生的位置为父节点或源站,从而提示运维人员对异常的边缘节点的父节点或是源站进行排查维修。
在一个实例中,如果10个异常的边缘节点的异常流出带宽下降值均大于30%,R1均小于30%,R2均大于80%,则确定异常发生的位置为父节点或源站。
由于在情况一中的目的是提示运维人员对异常的边缘节点的父节点或是源站进行排查维修,因此在确定异常发生的位置为父节点或源站后,还包括如下两种子情况:
(1)子情况1:如果N个边缘节点的第三异常比例均大于预设集中阈值,且数量最多的回父IP地址均相同,则确定异常发生的位置为父节点。
由于异常的边缘节点的回父IP地址集中,且数量最多的回父IP地址均相同,说明存在多个异常的边缘节点未能成功从父节点请求到访问端请求的内容,因此确定异常发生的位置为父节点,从而提示运维人员对父节点进行排查维修。
在实例中,如果10个异常的边缘节点的R1均小于30%,R2均大于80%,R3均大于80%,且10个异常的边缘节点的数量最多的回父IP地址均相同,则确定发生异常的位置为父节点,也就是该数量最多的回父IP地址指向的父节点。
(2)子情况2:如果N个边缘节点的第三异常比例均小于预设非集中阈值,且数量最多的回父IP地址均不相同,则确定异常发生的位置为源站;发出告警信息,包括:发出表征异常发生在源站存储的文件的告警信息。
由于异常的边缘节点的回父IP地址不集中,且数量最多的回父IP地址均不相同,说明产生异常的位置并不在异常的边缘节点的父节点,而是源站,且是由于源站存储的文件存在异常,导致异常的边缘节点或是其父节点无法从源站请求到访问端请求的内容,因此确定异常发生的位置为源站,并发出告警信息以提示运维人员对源站存储的文件进行排查,也就是对不同的访问端多次请求的同一个内容进行排查维修。
在实例中,如果10个异常的边缘节点的R1均小于30%,R2均大于80%,R3均小于30%,且10个异常的边缘节点的数量最多的回父IP地址均不相同,则确定发生异常的位置为源站,具体为源站存储的文件存在异常。
情况二:如果N个边缘节点的第一异常比例和第二异常比例均小于预设非集中阈值,第三异常比例大于预设集中阈值,且数量最多的回父IP地址均相同,则确定异常发生的位置为父节点。
由于异常的边缘节点的访问端的IP段分散,访问端请求的内容也分散,于是进一步对异常的边缘节点的回父IP地址进行分析,当异常的边缘节点的回父IP地址集中,且数量最多的回父IP地址均相同,说明存在多个异常的边缘节点未能成功从父节点请求到访问端请求的内容,因此确定异常发生的位置为父节点,从而提示运维人员对父节点进行排查维修。
在一个实例中,如果10个异常的边缘节点的R1和R2均小于30%,R3均大于80%,且10个异常的边缘节点的数量最多的回父IP地址均相同,则确定异常发生的位置为父节点。
情况三:如果N个边缘节点的第一异常比例、第二异常比例和第三异常比例均小于预设非集中阈值,数量最多的回父IP地址均不相同,且回源IP地址均相同,则确定异常发生的位置为源站。
由于异常的边缘节点的访问端的IP端、访问端请求的内容以及回父IP地址均不集中,回父IP地址也不相同,说明异常的分布普遍且分散,因此进一步对异常的边缘节点的回源IP地址进行分析,当异常的边缘节点的回源IP地址均相同时,说明是源站发生了异常,因此确定异常发生的位置为源站,并发出告警信息以提示运维人员对源站进行排查维修。
在实例中,如果10个异常的边缘节点的R1、R2和R3均小于30%,且10个异常的边缘节点的数量最多的回父IP地址均不相同,但回源IP地址均相同,则确定异常发生的位置为源站。
本实施例相对于现有技术而言,提供在确定异常发生在内容分发网络中的情况下,确定异常发生的位置,并发出告警信息的具体实现方式,有利于辅助运维人员根据告警信息快速定位产生异常的位置,以进行异常的排查维修。
本发明的第三实施例涉及一种服务器,如图3所示,包括:至少一个处理器301;以及,与至少一个处理器301通信连接的存储器302;其中,存储器302存储有可被至少一个处理器301执行的指令,指令被至少一个处理器301执行,以使至少一个处理器301能够执行上述内容分发网络的异常定位方法。
其中,存储器302和处理器301采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器和存储器302的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器301处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器301。
处理器301负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器302可以被用于存储处理器301在执行操作时所使用的数据。
本发明的第四实施例涉及一种计算机存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述内容分发网络的异常定位方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施例是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (11)

1.一种内容分发网络的异常定位方法,其特征在于,包括:
获取单位时间内内容分发网络中的各边缘节点的状态信息;
如果存在N个所述边缘节点的状态信息满足预设条件,则获取N个所述边缘节点的异常信息;
至少根据所述异常信息,确定异常发生的位置;
如果确定所述异常发生在所述内容分发网络中,则依次判断所述边缘节点、父节点、源站的异常信息以确定所述异常发生的位置,并发出告警信息;
其中,N为大于或等于预设告警个数的整数。
2.根据权利要求1所述的内容分发网络的异常定位方法,其特征在于,所述至少根据所述异常信息,确定异常发生的位置,包括:
根据所述状态信息,所述异常信息和预设阈值,确定异常发生的位置;
其中,所述状态信息包括:异常流入带宽增长值、异常流出带宽下降值;
所述异常信息包括:第一异常比例和第二异常比例,或第一异常比例、第二异常比例和第三异常比例;
所述第一异常比例用于表征所述边缘节点的异常状态码对应的IP段中,数量最多的IP段占所有IP段的比例;
所述第二异常比例用于表征所述边缘节点的所述异常状态码对应的URL地址中,数量最多的URL地址占所有URL地址的比例;
所述第三异常比例用于表征所述边缘节点的所述异常状态码对应的回父IP地址中,数量最多的回父IP地址占所有回父IP地址的比例;
所述预设阈值包括预设集中阈值,预设非集中阈值和预设变化阈值,所述预设集中阈值大于所述预设非集中阈值。
3.根据权利要求2所述的内容分发网络的异常定位方法,其特征在于,所述根据所述状态信息,所述异常信息和预设阈值,确定异常发生的位置,包括:
如果N个所述边缘节点的所述异常流入带宽增长值均大于所述预设变化阈值,所述第一异常比例均大于所述预设集中阈值,且所述第二异常比例均小于所述预设非集中阈值,则确定异常发生的位置为访问端;
所述方法还包括:发出表征所述异常发生的位置为访问端的告警信息。
4.根据权利要求2所述的内容分发网络的异常定位方法,其特征在于,如果确定所述异常发生在所述内容分发网络中,所述确定所述异常发生的位置,包括:
如果N个所述边缘节点的所述异常流出带宽下降值均大于所述预设变化阈值,所述第一异常比例均小于所述预设非集中阈值,且所述第二异常比例均大于所述预设集中阈值,则确定所述异常发生的位置为父节点或源站。
5.根据权利要求4所述的内容分发网络的异常定位方法,其特征在于,在所述确定所述异常发生的位置为父节点或源站之后,还包括:
如果N个所述边缘节点的所述第三异常比例均大于所述预设集中阈值,且所述数量最多的回父IP地址均相同,则确定所述异常发生的位置为父节点。
6.根据权利要求4所述的内容分发网络的异常定位方法,其特征在于,在所述确定所述异常发生的位置为父节点或源站之后,还包括:
如果N个所述边缘节点的所述第三异常比例均小于所述预设非集中阈值,且所述数量最多的回父IP地址均不相同,则确定所述异常发生的位置为源站;
所述发出告警信息,包括:发出表征所述异常发生在源站存储的文件的告警信息。
7.根据权利要求2所述的内容分发网络的异常定位方法,其特征在于,如果确定所述异常发生在所述内容分发网络中,所述确定所述异常发生的位置,包括:
如果N个所述边缘节点的所述第一异常比例和所述第二异常比例均小于所述预设非集中阈值,所述第三异常比例大于所述预设集中阈值,且所述数量最多的回父IP地址均相同,则确定所述异常发生的位置为父节点。
8.根据权利要求2所述的内容分发网络的异常定位方法,其特征在于,所述状态信息还包括:回源IP地址;如果确定所述异常发生在所述内容分发网络中,所述确定所述异常发生的位置,包括:
如果N个所述边缘节点的所述第一异常比例、所述第二异常比例和所述第三异常比例均小于所述预设非集中阈值,所述数量最多的回父IP地址均不相同,且所述回源IP地址均相同,则确定异常发生的位置为源站。
9.根据权利要求2所述的内容分发网络的异常定位方法,其特征在于,所述状态信息还包括:异常响应时间的比例、异常状态码的比例;
所述状态信息满足预设条件,包括:
所述异常响应时间的比例或所述异常状态码的比例大于预设异常阈值,且所述异常流入带宽增长值或异常流出带宽下降值大于所述预设变化阈值。
10.一种服务器,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-9中任一项所述的内容分发网络的异常定位方法。
11.一种计算机存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-9中任一项所述的内容分发网络的异常定位方法。
CN201911421242.7A 2019-12-31 2019-12-31 内容分发网络的异常定位方法、服务器及存储介质 Active CN111130912B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911421242.7A CN111130912B (zh) 2019-12-31 2019-12-31 内容分发网络的异常定位方法、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911421242.7A CN111130912B (zh) 2019-12-31 2019-12-31 内容分发网络的异常定位方法、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN111130912A true CN111130912A (zh) 2020-05-08
CN111130912B CN111130912B (zh) 2022-11-18

Family

ID=70507532

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911421242.7A Active CN111130912B (zh) 2019-12-31 2019-12-31 内容分发网络的异常定位方法、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN111130912B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111556080A (zh) * 2020-05-18 2020-08-18 网易(杭州)网络有限公司 网络节点监控方法、装置、介质及电子设备
CN111786821A (zh) * 2020-06-17 2020-10-16 网宿科技股份有限公司 异常定位方法、服务器及存储介质
CN112383409A (zh) * 2020-10-15 2021-02-19 新浪网技术(中国)有限公司 一种网络状态码聚合报警方法及系统
CN113094239A (zh) * 2021-04-27 2021-07-09 上海哔哩哔哩科技有限公司 直播异常原因的确定方法及服务器
CN113360310A (zh) * 2021-06-02 2021-09-07 北京百度网讯科技有限公司 网络模型异常的处理方法、装置、设备和存储介质
CN115190001A (zh) * 2022-07-22 2022-10-14 天翼云科技有限公司 一种网络异常状态分析方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142989A (zh) * 2010-12-24 2011-08-03 华为技术有限公司 内容分发网络中的故障定位方法及装置
US20130051248A1 (en) * 2011-08-30 2013-02-28 Dan Pei Hierarchical anomaly localization and prioritization
CN107911240A (zh) * 2017-11-14 2018-04-13 北京知道创宇信息技术有限公司 一种故障检测方法以及装置
CN109769023A (zh) * 2019-01-16 2019-05-17 网宿科技股份有限公司 一种数据传输方法、相关服务器和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142989A (zh) * 2010-12-24 2011-08-03 华为技术有限公司 内容分发网络中的故障定位方法及装置
US20130051248A1 (en) * 2011-08-30 2013-02-28 Dan Pei Hierarchical anomaly localization and prioritization
CN107911240A (zh) * 2017-11-14 2018-04-13 北京知道创宇信息技术有限公司 一种故障检测方法以及装置
CN109769023A (zh) * 2019-01-16 2019-05-17 网宿科技股份有限公司 一种数据传输方法、相关服务器和存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111556080A (zh) * 2020-05-18 2020-08-18 网易(杭州)网络有限公司 网络节点监控方法、装置、介质及电子设备
CN111786821A (zh) * 2020-06-17 2020-10-16 网宿科技股份有限公司 异常定位方法、服务器及存储介质
CN112383409A (zh) * 2020-10-15 2021-02-19 新浪网技术(中国)有限公司 一种网络状态码聚合报警方法及系统
CN113094239A (zh) * 2021-04-27 2021-07-09 上海哔哩哔哩科技有限公司 直播异常原因的确定方法及服务器
CN113360310A (zh) * 2021-06-02 2021-09-07 北京百度网讯科技有限公司 网络模型异常的处理方法、装置、设备和存储介质
CN113360310B (zh) * 2021-06-02 2023-08-04 北京百度网讯科技有限公司 网络模型异常的处理方法、装置、设备和存储介质
CN115190001A (zh) * 2022-07-22 2022-10-14 天翼云科技有限公司 一种网络异常状态分析方法及装置
CN115190001B (zh) * 2022-07-22 2024-03-08 天翼云科技有限公司 一种网络异常状态分析方法及装置

Also Published As

Publication number Publication date
CN111130912B (zh) 2022-11-18

Similar Documents

Publication Publication Date Title
CN111130912B (zh) 内容分发网络的异常定位方法、服务器及存储介质
CN110971444B (zh) 告警管理方法、装置、服务器及存储介质
CN110784355B (zh) 一种故障识别方法及装置
CN109167812B (zh) 评估服务质量、确定调整策略的方法、服务器及存储介质
EP3222004B1 (en) Diagnostic testing in networks
CN113824768B (zh) 负载均衡系统中的健康检查方法及装置和流量转发方法
US7933211B2 (en) Method and system for providing prioritized failure announcements
CN107306200B (zh) 网络故障预警方法和用于网络故障预警的网关
CN110688277A (zh) 用于微服务框架的数据监控方法及装置
CN109617750A (zh) 一种服务预警方法及网关
CN112491719A (zh) 网络节点的选择方法、设备及存储介质
KR20200128144A (ko) 네트워크 장치의 상태를 결정하는 방법 및 장치
CN110072199B (zh) 一种监控短消息发送异常的方法及系统
CN116760655B (zh) Sd-wan应用中提供cpe最优接入的pop点方法
EP1622310A2 (en) Administration system for network management systems
CN111949421B (zh) Sdk调用方法、装置、电子设备和计算机可读存储介质
CN110177075B (zh) 异常访问拦截方法、装置、计算机设备及存储介质
CN108156086B (zh) 一种策略规则下发方法及装置
CN111786821B (zh) 异常定位方法、服务器及存储介质
EP3607767B1 (en) Network fault discovery
EP4044033A1 (en) Method and apparatus for acquiring data
CN113079063A (zh) 充电设备的离线判断方法、系统、设备及计算机存储介质
CN111200520A (zh) 网络监控方法、服务器和计算机可读存储介质
CN113039751A (zh) 故障通知方法、装置及设备
CN110852537A (zh) 服务质量检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant