CN110166271B - 一种检测网络节点异常的方法和装置 - Google Patents

一种检测网络节点异常的方法和装置 Download PDF

Info

Publication number
CN110166271B
CN110166271B CN201810151837.4A CN201810151837A CN110166271B CN 110166271 B CN110166271 B CN 110166271B CN 201810151837 A CN201810151837 A CN 201810151837A CN 110166271 B CN110166271 B CN 110166271B
Authority
CN
China
Prior art keywords
network node
current
user
alternative
state data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810151837.4A
Other languages
English (en)
Other versions
CN110166271A (zh
Inventor
赵明
梁运韬
孙卫
范超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201810151837.4A priority Critical patent/CN110166271B/zh
Publication of CN110166271A publication Critical patent/CN110166271A/zh
Application granted granted Critical
Publication of CN110166271B publication Critical patent/CN110166271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0888Throughput
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/091Measuring contribution of individual network components to actual service level

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种检测网络节点异常的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括采集用户访问当前网络节点时的状态数据;在用户访问所述当前网络节点的过程中,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常。该实施方式能够提高对于网络节点异常的检测准确率。

Description

一种检测网络节点异常的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种检测网络节点异常的方法和装置。
背景技术
互联网的网络质量、故障修复以及服务的质量、故障修复在对于用户体验有非常重要的影响。目前在对网络节点进行故障检测时,通常是对网络节点的流量进行监控,若流量发生突降则认为网络节点本身或网络节点与用户之间的链路发生了问题。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有检测网络节点故障的方法只能根据网络节点流量宏观地检测,在一些场景下会导致检测结果不准确。
发明内容
有鉴于此,本发明实施例提供一种检测网络节点异常的方法和装置,能够提高对于网络节点异常的检测准确率。
为实现上述目的,根据本发明实施例的一个方面,提供了一种检测网络节点异常的方法,包括:
采集用户访问当前网络节点时的状态数据;
在用户访问所述当前网络节点的过程中,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常。
可选的,所述状态数据包括故障数和流量;通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常的步骤包括:
根据用户访问当前网络节点的历史状态数据生成历史状态基线;其中,所述历史状态基线记录的数据包括在粒度时长的时间区间内,用户访问所述当前网络节点时发生的故障数的历史平均值和所述当前网络节点流量的历史平均值;
通过将用户访问当前网络节点时的当前状态数据与所述历史状态基线进行对比,判断所述当前网络节点是否发生异常。
可选的,通过将用户访问当前网络节点时的当前状态数据与所述历史状态基线进行对比,判断所述当前网络节点是否发生异常的步骤包括:
根据所述历史状态基线判断用户在当前粒度时长的时间区间内,访问所述当前网络节点时发生的故障数是否大于故障数阈值且大于第一比例阈值;其中,所述第一比例阈值为所述历史状态基线中,与当前时间区间相对应的时间区间内故障数的历史平均值乘以第一比例系数的结果;
若大于故障数阈值且大于第一比例阈值,则根据所述历史状态基线判断在当前时间点之前粒度时长的时间区间内,所述当前网络节点的流量是否小于流量阈值;
若小于流量阈值,则判定所述当前网络节点发生异常;
若不小于流量阈值,则判定所述当前网络节点没有发生异常;或者,根据所述历史状态基线判断用户在从当前时间区间开始的n个连续的粒度时长的时间区间内,访问所述当前网络节点时发生的故障数是否均大于第二比例阈值;其中,n为正整数,所述第二比例阈值为所述历史状态基线中,与当前时间区间相对应的时间区间内故障数的历史平均值乘以第二比例系数的结果,所述第二比例系数大于所述第一比例系数;
若均大于第二比例阈值,则判定所述当前网络节点发生异常。
可选的,还包括:
预先保存用户类别与当前网络节点、备选网络节点的对应关系;其中,所述用户类别根据地理位置和网络运营商类型中的至少一项确定;
在接收到用户的访问请求后,根据所述访问请求确定所述用户的用户类别;
根据所述对应关系和所述用户类别确定与所述用户对应的当前网络节点和备选网络节点;
向所述用户发送包括与其对应的当前网络节点和备选网络节点地址的控制指令,以便所述用户根据所述控制指令分别向与其对应的当前网络节点和备选网络节点发送探测请求;
采集当前网络节点和备选网络节点响应所述探测请求时的数据作为状态数据。
可选的,所述方法还包括:
采集用户访问备选网络节点时的状态数据;
根据用户访问备选网络节点时的当前状态数据,计算所述备选网络节点的当前质量评分;
根据所述当前质量评分选择当前最优的备选网络节点;
若确定所述当前网络节点发生异常,则控制用户访问所述当前最优的备选网络节点。
可选的,所述状态数据包括故障数和性能数据;所述性能数据包括响应时间、域名解析时间、安全套接层认证时间和连接到服务器的时间中的至少一项;根据用户访问备选网络节点时的当前状态数据,计算所述备选网络节点的当前质量评分的步骤包括:
根据各备选网络节点的当前状态数据中的故障数,计算各备选网络节点的故障率;
对各备选网络节点的当前状态数据的性能数据中的各项进行加权求和,以得到各备选网络节点的当前基础评价值;
将各备选网络节点的所述当前基础评价值与所述故障率相加,以得到各备选网络节点的当前质量评分;
根据所述当前质量评分选择当前最优的备选网络节点的步骤包括:
从故障率低于故障率阈值的备选网络节点中,选择当前质量评分最低的作为当前最优的备选网络节点。
可选的,所述状态数据包括故障数和性能数据;所述性能数据包括响应时间、域名解析时间、安全套接层认证时间和连接到服务器的时间中的至少一项,所述用户有多个;根据用户访问备选网络节点时的当前状态数据,计算所述备选网络节点的当前质量评分的步骤包括:根据各备选网络节点的当前状态数据中的故障数,计算各备选网络节点的故障率;
对各备选网络节点的当前状态数据的性能数据中的各项进行加权求和,以得到各备选网络节点的当前第一评价值;
根据与所述用户的用户类别相同的全部用户的当前第一评价值计算节点TPx值,根据全部备选网络节点的第一评价值计算综合TPx值;使用节点TPx值除以综合TPx值以得到当前第二评价值;其中,TPx的取值满足在全部参与计算的值中,x%以上的值优于TPx值;
将各备选网络节点的所述当前第二评价值与所述故障率相加,以得到各备选网络节点的当前质量评分;
根据所述当前质量评分选择当前最优的备选网络节点的步骤包括:
从故障率低于故障率阈值的备选网络节点中,选择当前质量评分最低的作为当前最优的备选网络节点。
可选的,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常的步骤包括:
根据用户访问当前网络节点时的当前状态数据,计算所述当前网络节点的当前质量评分;
根据所述当前网络节点和所述备选网络节点的当前质量评分判断所述当前网络节点是否为当前最优的网络节点;
若当前网络节点不是当前最优的网络节点,则判定所述当前网络节点发生异常。
可选的,控制用户访问所述当前最优的备选网络节点的步骤还包括:
判断当前最优的备选网络节点在之前的m个连续的粒度时长的时间区间内,是否均为最优的备选网络节点;其中,m为正整数;
若是,则控制用户访问所述当前最优的备选网络节点。
为实现上述目的,根据本发明实施例的另一个方面,提供了一种检测网络节点异常的装置,包括:
数据采集模块,采集用户访问当前网络节点时的状态数据;
异常检测模块,在用户访问所述当前网络节点的过程中,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常。
可选的,所述状态数据包括故障数和流量;所述异常检测模块还用于:
根据用户访问当前网络节点的历史状态数据生成历史状态基线;其中,所述历史状态基线记录的数据包括在粒度时长的时间区间内,用户访问所述当前网络节点时发生的故障数的历史平均值和所述当前网络节点流量的历史平均值;
通过将用户访问当前网络节点时的当前状态数据与所述历史状态基线进行对比,判断所述当前网络节点是否发生异常。
可选的,所述异常检测模块还用于:
根据所述历史状态基线判断用户在当前粒度时长的时间区间内,访问所述当前网络节点时发生的故障数是否大于故障数阈值且大于第一比例阈值;其中,所述第一比例阈值为所述历史状态基线中,与当前时间区间相对应的时间区间内故障数的历史平均值乘以第一比例系数的结果;
若大于故障数阈值且大于第一比例阈值,则根据所述历史状态基线判断在当前时间点之前粒度时长的时间区间内,所述当前网络节点的流量是否小于流量阈值;
若小于流量阈值,则判定所述当前网络节点发生异常;
若不小于流量阈值,则判定所述当前网络节点没有发生异常;或者,根据所述历史状态基线判断用户在从当前时间区间开始的n个连续的粒度时长的时间区间内,访问所述当前网络节点时发生的故障数是否均大于第二比例阈值;其中,n为正整数,所述第二比例阈值为所述历史状态基线中,与当前时间区间相对应的时间区间内故障数的历史平均值乘以第二比例系数的结果,所述第二比例系数大于所述第一比例系数;
若均大于第二比例阈值,则判定所述当前网络节点发生异常。
可选的,所述数据采集模块还用于:
预先保存用户类别与当前网络节点、备选网络节点的对应关系;其中,所述用户类别根据地理位置和网络运营商类型中的至少一项确定;
在接收到用户的访问请求后,根据所述访问请求确定所述用户的用户类别;
根据所述对应关系和所述用户类别确定与所述用户对应的当前网络节点和备选网络节点;
向所述用户发送包括与其对应的当前网络节点和备选网络节点地址的控制指令,以便所述用户根据所述控制指令分别向与其对应的当前网络节点和备选网络节点发送探测请求;
采集当前网络节点和备选网络节点响应所述探测请求时的数据作为状态数据。
可选的,所述装置还包括:
访问调度模块,用于采集用户访问备选网络节点时的状态数据;根据用户访问备选网络节点时的当前状态数据,计算所述备选网络节点的当前质量评分;根据所述当前质量评分选择当前最优的备选网络节点;若确定所述当前网络节点发生异常,则控制用户访问所述当前最优的备选网络节点。
可选的,所述状态数据包括故障数和性能数据;所述性能数据包括响应时间、域名解析时间、安全套接层认证时间和连接到服务器的时间中的至少一项;所述访问调度模块还用于:
根据各备选网络节点的当前状态数据中的故障数,计算各备选网络节点的故障率;
对各备选网络节点的当前状态数据的性能数据中的各项进行加权求和,以得到各备选网络节点的当前基础评价值;
将各备选网络节点的所述当前基础评价值与所述故障率相加,以得到各备选网络节点的当前质量评分;
从故障率低于故障率阈值的备选网络节点中,选择当前质量评分最低的作为当前最优的备选网络节点。
可选的,所述状态数据包括故障数和性能数据;所述性能数据包括响应时间、域名解析时间、安全套接层认证时间和连接到服务器的时间中的至少一项,所述用户有多个;根据用户访问备选网络节点时的当前状态数据,计算所述备选网络节点的当前质量评分的步骤包括:所述访问调度模块还用于:
对各备选网络节点的当前状态数据的性能数据中的各项进行加权求和,以得到各备选网络节点的当前第一评价值;
根据与所述用户的用户类别相同的全部用户的当前第一评价值计算节点TPx值,根据全部备选网络节点的第一评价值计算综合TPx值;使用节点TPx值除以综合TPx值以得到当前第二评价值;其中,TPx的取值满足在全部参与计算的值中,x%以上的值优于TPx值;
将各备选网络节点的所述当前第二评价值与所述故障率相加,以得到各备选网络节点的当前质量评分;
从故障率低于故障率阈值的备选网络节点中,选择当前质量评分最低的作为当前最优的备选网络节点。
可选的,所述异常检测模块还用于:
根据用户访问当前网络节点时的当前状态数据,计算所述当前网络节点的当前质量评分;
根据所述当前网络节点和所述备选网络节点的当前质量评分判断所述当前网络节点是否为当前最优的网络节点;
若当前网络节点不是当前最优的网络节点,则判定所述当前网络节点发生异常。
可选的,所述访问调度模块还用于:
判断当前最优的备选网络节点在之前的m个连续的粒度时长的时间区间内,是否均为最优的备选网络节点;其中,m为正整数;
若是,则控制用户访问所述当前最优的备选网络节点。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种检测网络节点异常的电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器至少实现:
采集用户访问当前网络节点时的状态数据;
在用户访问所述当前网络节点的过程中,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常。
为实现上述目的,根据本发明实施例的又一个方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时至少实现:
采集用户访问当前网络节点时的状态数据;
在用户访问所述当前网络节点的过程中,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常。
上述发明中的一个实施例具有如下优点或有益效果:因为采用通过采集用户访问网络节点时的状态数据,将历史状态数据与当前状态数据进行对比从而判断当前网络节点是否发生异常的技术方案,从而可以更加准确地识别网络节点可能出现的问题,达到提高检测节点异常时的准确率的技术效果。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的检测网络节点异常的方法的主要步骤的示意图;
图2是根据本发明实施例的检测网络节点异常的方法中故障判断的主要步骤的示意图;
图3是根据本发明实施例的检测网络节点异常的装置的主要模块的示意图;
图4是本发明实施例可以应用于其中的示例性系统架构图;
图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的检测网络节点异常的方法的主要步骤的示意。
如图1所示,本发明实施例提供一种检测网络节点异常的方法,包括:
S100,采集用户访问当前网络节点时的状态数据。
S101,在用户访问所述当前网络节点的过程中,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常。
在进行对比之前,可以对历史状态数据进行预处理,以提高对比的效率和准确度。本发明实施例根据历史状态数据生成了历史状态基线,以便于进行对比。
本发明实施例因为采用通过采集用户访问网络节点时的状态数据,将历史状态数据与当前状态数据进行对比从而判断当前网络节点是否发生异常的技术方案,从而可以更加准确地识别网络节点可能出现的问题,达到提高检测节点异常时的准确率的技术效果。
下面根据一个结合使用场景的实施例对本发明中的异常检测方法进行说明。在本实施例中,网络节点为CDN(Content Delivery Network,内容分发网络)节点或者VIP(Virtual IP,虚拟IP地址)节点,具体而言是指提供相应服务的节点服务器。其中,CDN节点主要用于存放静态资源,例如图片、流媒体等,VIP节点用于提供接口访问服务,其提供的业务数据部分需要实时计算。在将本发明中的异常检测方法分别应用于上述两种网络节点时,采用的检测原理相同,只需要根据业务需求和经验值对部分参数进行适应性调整。
本实施例包含了数据采集、网络状态分析和用户调度三个部分的内容,下面分别对其进行说明。
1.数据采集
数据采集是指收集用户在访问网络节点时的性能数据、故障数据,作为网络状态分析的原始数据。本实施例中的数据采集包括两种方式:
(1)访问过程中的数据采集
在用户访问网络节点的过程中,抓取网络访问的性能数据,并收集用户上报的故障作为故障数据;此外,还会对网络节点的流量数据进行采集和上报。该过程可以基于网络节点的基本功能实现。
(2)用户主动探测
方式(1)中的数据采集具备样本数量大的优点,采集到的数据可以代表大多数用户的真实情况。但是,方式(1)中的数据采集也存在一些弊端,例如它是基于用户日常使用网络节点时进行的,每一次用户与网络节点之间通信的数据量都可能不同,从而影响采集到的数据、特别是性能数据的准确性。在方式(2)中,采用用户主动探测的方式进行,以保证数据的准确性。具体包括以下步骤:
步骤101,服务器端接收用户的访问请求,根据所述访问请求确定用户的用户类别。用户类别由用户所在的地理位置以及其网络运营商类型共同确定,例如前面提到的“上海联通”、“浙江联通”、“江苏联通”就是三个不同的用户类别。访问请求是用户在访问网络节点之前向服务器端发送的请求,通常情况下,服务器端会根据该请求对用户进行校验(基于用户名和密码等),并在校验通过后向用户返回可接入的网络节点的地址。在接收到用户发送的访问请求后,可以根据访问请求中包含的用户IP地址,识别出用户的地理位置和网络运营商类型。服务器端预先保存有各用户类型与当前网络节点及备选网络节点之间的对应关系,其中,当前网络节点是指该用户类型中的用户通常连接至的网络节点,一般情况下为距离最近的、运营商相同的网络节点;备选网络节点是指在当前网络节点发生异常时,用户可连接至的网络节点,通常选择多个距离用户较近、运营商相同的网络节点作为备选网络节点。
步骤102,服务器端向用户发送包括与其对应的当前网络节点和备选网络节点地址的控制指令,以便所述用户根据所述控制指令分别向与其对应的当前网络节点和备选网络节点发送探测请求。其中,当前网络节点是指用户正常情况下会访问的网络节点,例如对于上海联通用户,其当前网络节点为上海联通节点;备选网络节点是指在当前网络节点出现问题的情况下用户会选择访问的网络节点,例如对于上海联通用户,其备选网络节点可以包括江苏联通节点和浙江联通节点等。
步骤103,采集当前网络节点和备选网络节点响应所述探测请求时的数据作为状态数据。状态数据包括故障数据和性能数据。探测请求中不携带额外的数据,只要求网络节点对探测请求进行相应,从而可以得到网络节点准确的性能数据。本步骤采集的性能数据包括响应时间、域名解析时间、SSL(Secure Sockets Layer安全套接层)认证时间及链接到服务器的时间等。若探测请求未被正常相应,也可以根据发生的故障生成故障数据。
2.网络状态分析
网络状态分析一方面指根据所收集到的故障数据,对用户访问网络节点时的故障率等进行分析;另一方面指根据收集到的性能数据对各网络节点的性能进行评价。网络状态分析包括以下几个部分的内容:
(1)基线生成
本实施例中的基线是指以一定的粒度时长作为基本单位,根据采集到的历史状态数据中包含的故障数据和流量数据,分别计算各粒度时长中的故障数和节点流量的历史平均值,从而得到的对应于各用户类型的用户的“故障数-时间”曲线(故障基线)和对应于各网络节点的“流量-时间”曲线(流量基线)。此外,为了便于后续步骤中对节点进行性能评价,还可以生成对各网络节点的“评分-时间”曲线(评分基线)。以上各类基线统称为历史状态基线。
故障基线用于表示各用户类别的用户在访问当前网络节点和备选网络节点时的故障情况,例如对于上海联通的用户,可以分别生成“上海联通用户-上海联通节点”、“上海联通用户-江苏联通节点”、“上海联通用户-浙江联通节点”三条基线。流量基线针对于各网络节点,对于每一个网络节点通常生成一条;若网络节点为多个类型的用户提供服务,也可以生成多条,例如“上海联通用户-上海联通节点”、“江苏联通用户-上海联通节点”。评分基线反应各用户类别的用户在访问当前网络节点和备选网络节点时的性能评分,其分类方式与故障基线类似。
需要说明的是,本实施例中各步骤在执行故障判断或性能评价的时间均发生在一个粒度时长的时间区间的结束位置,文中所指的“当前”,“当前时间区间”等是指在该时间区间中的故障数的累计值、流量的时间平均值或者性能数据的平均值;因此,若缩小粒度时长,则可以提高检测频率,提高检测时效性,但是对于用户较少的情况可能出现漏检或者误检的问题;若加长粒度时长,则可以提高判断的准确度,但是会对应降低时效性,具体取值可以根据业务实际进行确定,通常可以设置为1分钟左右,并根据需要进行调整,例如30秒,2分钟,5分钟等。例如,对于CDN节点,由于通常保存静态数据,内容不会经常发生变化,对于时效性要求较低,因此可以采用较长的粒度时长进行检测;对于VIP节点,由于需要请求数据,对于时效性的要求较高,因此可以采用较短的粒度时长进行检测。
本实施例中的“历史”、“历史时间区间”等是指当前时间区间之前的时间区间。在进行故障检测时,用来作为对比的数据是历史状态基线中对应时间区间中数据的历史平均值,例如,若当前时间区间为2017年1月1日12:00-12:01,则历史故障基线中对应于“1日12:00-12:01”这一时间区间的故障数可以根据2016年7月至2016年12月每个月中1日12:00-12:01发生的故障数求平均值得到;也可以根据2017年1月1日之前一定天数时间内发生的故障数求平均值得到,或者根据需求采用其他方式进行计算。而在进行性能评价时,需要使用到的是当前时间区间之前的多个连续的时间区间中的性能数据,在后续步骤中会具体进行说明。
故障数基线主要根据上述用户主动探测采集到的故障数据生成,从而可以更加准确地体现各网络节点的故障发生情况。流量基线可以根据网络节点实际检测到的流量生成。性能基线根据用户主动探测采集到的状态数据中的性能数据生成。
(2)故障判定
本实施例通过将用户当前发生的故障数与历史状态基线中的历史故障数进行对比,从数量和比例两个方面进行判断,从而提高故障判定的准确率。
图2是根据本发明实施例的检测网络节点异常的方法中故障判断的主要步骤的示意图。如图2所示,故障判断的主要步骤包括:
S201,经过一个粒度时长,执行检测。
S202,根据所述历史状态基线判断用户在当前粒度时长的时间区间内,访问所述当前网络节点时发生的故障数是否大于故障数阈值且大于第一比例阈值,若大于故障数阈值且大于第一比例阈值转至S203,否则转至S201;其中,所述第一比例阈值为所述历史状态基线中,与当前时间区间相对应的时间区间内故障数的历史平均值乘以第一比例系数的结果。故障数阈值是根据经验确定的一个固定数值,例如可以设置为1500个;第一比例系数也是一个固定值,例如可以设置为150%。
该步骤中,通过故障数阈值和第一比例阈值,可以在一些特定情境下避免误检。例如在深夜的某个时间区间中,历史状态基线记录的平均故障数为400个,某一个用户(公司)由于某种原因无法正常连接至网络节点,导致当前时间区间的故障数达到了1000个,若仅使用比例阈值判断(150%),则应当判定为发生故障,但是这种情况并不具有普遍性,可以是因为该公司自身问题导致,所以导致误检;而通过设置故障数阈值和第一比例阈值,可以从绝对值及相对值两方面均进行判断,从而避免发生误检。
S203,根据所述历史状态基线判断在当前时间点之前粒度时长的时间区间内,所述当前网络节点的流量是否小于流量阈值,若小于,则转至S205,否则转至S204。流量阈值是根据历史状态曲线中的流量曲线计算得到的,具体为历史状态曲线中对应时间区间内的流量历史平均值乘以流量比例阈值,流量比例阈值可以根据经验值确定,例如确定为90%。
该步骤中,通过进一步判断网络节点的流量是否下降来确定网络节点是否发生了故障。若节点流量相对于同期有较大下降,说明大部分用户无法正常访问网络节点,可以确定发生了故障;若节点流量相对于同期没有明显下降,则说明可能是少部分用户的节点访问出现了问题,需要后续步骤进一步判断。在一些可选的实施例中,若节点流量相对于同期没有明显下降,也可以判定为节点正常,转至S201。
S204,根据所述历史状态基线判断用户在从当前时间区间开始的n个连续的粒度时长的时间区间内,访问所述当前网络节点时发生的故障数是否均大于第二比例阈值,若均大于,则转至S205,否则转至S01。其中,n为正整数,所述第二比例阈值为所述历史状态基线中,与当前时间区间相对应的时间区间内故障数的历史平均值乘以第二比例系数的结果,所述第二比例系数大于所述第一比例系数。第二比例系数大于第一比例系数,例如可以设置为250%。若满足S204中的判断条件,说明虽然少部分用户发生了故障,但是故障数已经远远超出了历史同期的平均值,且持续了一定的时间(n个时间区间,n的取值取决于粒度时长,通常n可以为10-15)。这种情况下基本可以排除因为网络抖动和少量用户自身问题导致的故障,从而判定是网络节点本身或者网络节点的链路发生了故障。
S205,确定网络节点发生故障。需说明的是,网络节点发生故障包括网络节点的节点服务器本身发生故障,还包括网络节点与用户的链路发生故障。
(3)性能分析、最优调度
若经过故障判定后,确定网络节点发生故障,则需要对访问该网络节点的用户进行调度,使其访问其他的备选网络节点。根据用户主动探测后采集到的性能数据,可以对各备选网络节点的性能质量进行评分,从而选择最优的备选网络节点作为访问调度的目标。进行性能分析及最优调度的主要步骤包括:
步骤301,采集用户访问备选网络节点时的状态数据。
步骤302,对各备选网络节点的当前状态数据的性能数据中的各项进行加权求和,以得到各备选网络节点的当前第一评价值。其中,所述性能数据包括响应时间、域名解析时间、安全套接层认证时间和连接到服务器的时间中的至少一项;对于不同的业务需求,可以为性能数据中的各项分别设置不同的权重。
步骤303,根据与所述用户的用户类别相同的全部用户的当前第一评价值计算节点TPx值,根据全部备选网络节点的第一评价值计算综合TPx值;使用节点TPx值除以综合TPx值以得到当前第二评价值;其中,TPx的取值满足在全部参与计算的值中,x%以上的值优于TPx值。TPx值是对于互联网领域性能评价的一个指标,例如,对于100个用户的某项网络性能按照由低到高的顺序进行排序,那么第90个用户的性能值就是该网络性能的TP90,换言之,若能够达到该网络性能,则可以使90%的用户正常进行业务。为了保证准确,x通常取90,也可以根据需要进行调整。本实施例中,用来评价网络节点质量的指标均为时间消耗,因此最终得到的第二评价值是两个时间长度的比值,用于评价当前用户类别的用户在访问与其对应的各节点时在耗时方面的性能。
步骤304,将各备选网络节点的所述当前第二评价值与所述故障率相加,以得到各备选网络节点的当前质量评分。可见,当前质量评分由两份数据决定,其一是第二评价值,用于描述用户在访问某网络节点时在时间消耗方面的性能;其二是用户访问该网络节点时的故障率。可见,当前质量评分越低,代表时间消耗越少、故障率越低,说明该网络节点对于此用户而言性能越优。
步骤305,从故障率低于故障率阈值的备选网络节点中,选择当前质量评分最低的作为当前最优的备选网络节点。在计算时,会排除掉故障率过高的备选网络节点,以避免对用户的正常访问造成影响。故障率阈值通常设置为3%-5%。
步骤306,若确定所述当前网络节点发生异常,则控制用户访问所述当前最优的备选网络节点。
步骤306中的异常除了表示网络节点发生故障之外,还可以表示该网络节点并非性能最佳的节点。具体而言可以采用如下步骤进行判断以及调度:
步骤401,根据用户访问当前网络节点时的当前状态数据,计算所述当前网络节点的当前质量评分。
步骤402,根据所述当前网络节点和所述备选网络节点的当前质量评分判断所述当前网络节点是否为当前最优的网络节点。
步骤403,若当前网络节点不是当前最优的网络节点,则判定所述当前网络节点发生异常。根据前面步骤中的计算,若当前网络节点的质量评分大于备选网络节点,则说明当前网络节点并非最优的网络节点。
步骤404,判断当前最优的备选网络节点在之前的m个连续的粒度时长的时间区间内,是否均为最优的备选网络节点,若是,则执行步骤405;其中,m为正整数。由于本步骤中的节点异常并不影响用户正常访问当前网络节点,只是在访问时的性能并非最优,因此在调整时需要更加谨慎地判断备选网络节点是否稳定;若当前最优的备选网络节点在之前的多个连续的时间区间中均为最优网络节点,则可以说明该备选网络节点的性能较为稳定,可以进行调度。
步骤405,控制用户访问所述当前最优的备选网络节点。
图3是根据本发明实施例的检测网络节点异常的装置的主要模块的示意图。
如图3所示,本实施例提供的一种检测网络节点异常的装置300,包括:
数据采集模块301,采集用户访问当前网络节点时的状态数据;
异常检测模块302,在用户访问所述当前网络节点的过程中,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常。
本实施提供的装置因为采用通过采集用户访问网络节点时的状态数据,将历史状态数据与当前状态数据进行对比从而判断当前网络节点是否发生异常的技术方案,从而可以更加准确地识别网络节点可能出现的问题,达到提高检测节点异常时的准确率的技术效果。
在一些可选的实施例中,所述状态数据包括故障数和流量;所述异常检测模块302还用于:
根据用户访问当前网络节点的历史状态数据生成历史状态基线;其中,所述历史状态基线记录的数据包括在粒度时长的时间区间内,用户访问所述当前网络节点时发生的故障数的历史平均值和所述当前网络节点流量的历史平均值;
通过将用户访问当前网络节点时的当前状态数据与所述历史状态基线进行对比,判断所述当前网络节点是否发生异常。
在一些可选的实施例中,所述异常检测模块302还用于:
根据所述历史状态基线判断用户在当前粒度时长的时间区间内,访问所述当前网络节点时发生的故障数是否大于故障数阈值且大于第一比例阈值;其中,所述第一比例阈值为所述历史状态基线中,与当前时间区间相对应的时间区间内故障数的历史平均值乘以第一比例系数的结果;
若大于故障数阈值且大于第一比例阈值,则根据所述历史状态基线判断在当前时间点之前粒度时长的时间区间内,所述当前网络节点的流量是否小于流量阈值;
若小于流量阈值,则判定所述当前网络节点发生异常;
若不小于流量阈值,则判定所述当前网络节点没有发生异常;或者,根据所述历史状态基线判断用户在从当前时间区间开始的n个连续的粒度时长的时间区间内,访问所述当前网络节点时发生的故障数是否均大于第二比例阈值;其中,n为正整数,所述第二比例阈值为所述历史状态基线中,与当前时间区间相对应的时间区间内故障数的历史平均值乘以第二比例系数的结果,所述第二比例系数大于所述第一比例系数;
若均大于第二比例阈值,则判定所述当前网络节点发生异常。
在一些可选的实施例中,所述数据采集模块301还用于:
预先保存用户类别与当前网络节点、备选网络节点的对应关系;其中,所述用户类别根据地理位置和网络运营商类型中的至少一项确定;
在接收到用户的访问请求后,根据所述访问请求确定所述用户的用户类别;
根据所述对应关系和所述用户类别确定与所述用户对应的当前网络节点和备选网络节点;
向所述用户发送包括与其对应的当前网络节点和备选网络节点地址的控制指令,以便所述用户根据所述控制指令分别向与其对应的当前网络节点和备选网络节点发送探测请求;
采集当前网络节点和备选网络节点响应所述探测请求时的数据作为状态数据。
在一些可选的实施例中,所述装置300还包括:
访问调度模块303,用于采集用户访问备选网络节点时的状态数据;根据用户访问备选网络节点时的当前状态数据,计算所述备选网络节点的当前质量评分;根据所述当前质量评分选择当前最优的备选网络节点;若确定所述当前网络节点发生异常,则控制用户访问所述当前最优的备选网络节点。
在一些可选的实施例中,所述状态数据包括故障数和性能数据;所述性能数据包括响应时间、域名解析时间、安全套接层认证时间和连接到服务器的时间中的至少一项;所述访问调度模块303还用于:
根据各备选网络节点的当前状态数据中的故障数,计算各备选网络节点的故障率;
对各备选网络节点的当前状态数据的性能数据中的各项进行加权求和,以得到各备选网络节点的当前基础评价值;
将各备选网络节点的所述当前基础评价值与所述故障率相加,以得到各备选网络节点的当前质量评分;
从故障率低于故障率阈值的备选网络节点中,选择当前质量评分最低的作为当前最优的备选网络节点。
在一些可选的实施例中,所述状态数据包括故障数和性能数据;所述性能数据包括响应时间、域名解析时间、安全套接层认证时间和连接到服务器的时间中的至少一项,所述用户有多个;根据用户访问备选网络节点时的当前状态数据,计算所述备选网络节点的当前质量评分的步骤包括:所述访问调度模块303还用于:
对各备选网络节点的当前状态数据的性能数据中的各项进行加权求和,以得到各备选网络节点的当前第一评价值;
根据与所述用户的用户类别相同的全部用户的当前第一评价值计算节点TPx值,根据全部备选网络节点的第一评价值计算综合TPx值;使用节点TPx值除以综合TPx值以得到当前第二评价值;其中,TPx的取值满足在全部参与计算的值中,x%以上的值优于TPx值;
将各备选网络节点的所述当前第二评价值与所述故障率相加,以得到各备选网络节点的当前质量评分;
从故障率低于故障率阈值的备选网络节点中,选择当前质量评分最低的作为当前最优的备选网络节点。
在一些可选的实施例中,所述异常检测模块302还用于:
根据用户访问当前网络节点时的当前状态数据,计算所述当前网络节点的当前质量评分;
根据所述当前网络节点和所述备选网络节点的当前质量评分判断所述当前网络节点是否为当前最优的网络节点;
若当前网络节点不是当前最优的网络节点,则判定所述当前网络节点发生异常。
在一些可选的实施例中,所述访问调度模块303还用于:
判断当前最优的备选网络节点在之前的m个连续的粒度时长的时间区间内,是否均为最优的备选网络节点;其中,m为正整数;
若是,则控制用户访问所述当前最优的备选网络节点。
图4示出了可以应用本发明实施例的检测网络节点异常的方法或检测网络节点异常的装置的示例性系统架构400。
如图4所示,系统架构400可以包括终端设备401、402、403,网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备401、402、403通过网络404与服务器405交互,以接收或发送消息等。终端设备401、402、403可以安装有用于访问网络节点的用户端软件。
终端设备401、402、403可以是具有通信功能的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器405可以是提供各种服务的服务器,例如对用户利用终端设备401、402、403访问网络节点时产生的数据进行采集和处理的后台服务器。
需要说明的是,本发明实施例所提供的检测网络节点异常的方法一般由服务器405执行,相应地,检测网络节点异常的装置一般设置于服务器405中。
应该理解,图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
根据本发明的实施例,本发明还提供了一种电子设备和一种可读存储介质。
图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
下面参考图5,其示出了适于用来实现本发明实施例的终端设备的计算机系统500的结构示意图。图5示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明的实施例,上文主要步骤的示意图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤的示意图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括数据采集模块和异常检测模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,异常检测模块还可以被描述为“用于在用户访问所述当前网络节点的过程中,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:
采集用户访问当前网络节点时的状态数据;
在用户访问所述当前网络节点的过程中,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常。
根据本发明实施例的技术方案,因为采用通过采集用户访问网络节点时的状态数据,将历史状态数据与当前状态数据进行对比从而判断当前网络节点是否发生异常的技术方案,从而可以更加准确地识别网络节点可能出现的问题,达到提高检测节点异常时的准确率的技术效果。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (18)

1.一种检测网络节点异常的方法,其特征在于,包括:
采集用户访问当前网络节点时的状态数据;
在用户访问所述当前网络节点的过程中,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常;
所述状态数据包括故障数和流量;
所述通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常的步骤包括:
根据用户访问当前网络节点的历史状态数据生成历史状态基线;其中,所述历史状态基线记录的数据包括在粒度时长的时间区间内,用户访问所述当前网络节点时发生的故障数的历史平均值和所述当前网络节点流量的历史平均值;
通过将用户访问当前网络节点时的当前状态数据与所述历史状态基线进行对比,判断所述当前网络节点是否发生异常,包括:
根据所述历史状态基线判断用户在当前粒度时长的时间区间内,访问所述当前网络节点时发生的故障数是否大于故障数阈值且大于第一比例阈值;其中,所述第一比例阈值为所述历史状态基线中,与当前时间区间相对应的时间区间内故障数的历史平均值乘以第一比例系数的结果;若大于故障数阈值且大于第一比例阈值,则根据所述历史状态基线判断在当前时间点之前粒度时长的时间区间内,所述当前网络节点的流量是否小于流量阈值;若小于所述流量阈值,则判定所述当前网络节点发生异常。
2.根据权利要求1所述的方法,其特征在于,若不小于所述流量阈值,则判定所述当前网络节点没有发生异常;或者,根据所述历史状态基线判断用户在从当前时间区间开始的n个连续的粒度时长的时间区间内,访问所述当前网络节点时发生的故障数是否均大于第二比例阈值;其中,n为正整数,所述第二比例阈值为所述历史状态基线中,与当前时间区间相对应的时间区间内故障数的历史平均值乘以第二比例系数的结果,所述第二比例系数大于所述第一比例系数;
若均大于第二比例阈值,则判定所述当前网络节点发生异常。
3.根据权利要求1所述的方法,其特征在于,还包括:
预先保存用户类别与当前网络节点、备选网络节点的对应关系;其中,所述用户类别根据地理位置和网络运营商类型中的至少一项确定;
在接收到用户的访问请求后,根据所述访问请求确定所述用户的用户类别;
根据所述对应关系和所述用户类别确定与所述用户对应的当前网络节点和备选网络节点;
向所述用户发送包括与其对应的当前网络节点和备选网络节点地址的控制指令,以便所述用户根据所述控制指令分别向与其对应的当前网络节点和备选网络节点发送探测请求;
采集当前网络节点和备选网络节点响应所述探测请求时的数据作为状态数据。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
采集用户访问备选网络节点时的状态数据;
根据用户访问备选网络节点时的当前状态数据,计算所述备选网络节点的当前质量评分;
根据所述当前质量评分选择当前最优的备选网络节点;
若确定所述当前网络节点发生异常,则控制用户访问所述当前最优的备选网络节点。
5.根据权利要求4所述的方法,其特征在于,所述状态数据包括故障数和性能数据;所述性能数据包括响应时间、域名解析时间、安全套接层认证时间和连接到服务器的时间中的至少一项;根据用户访问备选网络节点时的当前状态数据,计算所述备选网络节点的当前质量评分的步骤包括:
根据各备选网络节点的当前状态数据中的故障数,计算各备选网络节点的故障率;
对各备选网络节点的当前状态数据的性能数据中的各项进行加权求和,以得到各备选网络节点的当前基础评价值;
将各备选网络节点的所述当前基础评价值与所述故障率相加,以得到各备选网络节点的当前质量评分;
根据所述当前质量评分选择当前最优的备选网络节点的步骤包括:
从故障率低于故障率阈值的备选网络节点中,选择当前质量评分最低的作为当前最优的备选网络节点。
6.根据权利要求4所述的方法,其特征在于,所述状态数据包括故障数和性能数据;所述性能数据包括响应时间、域名解析时间、安全套接层认证时间和连接到服务器的时间中的至少一项,所述用户有多个;根据用户访问备选网络节点时的当前状态数据,计算所述备选网络节点的当前质量评分的步骤包括:根据各备选网络节点的当前状态数据中的故障数,计算各备选网络节点的故障率;
对各备选网络节点的当前状态数据的性能数据中的各项进行加权求和,以得到各备选网络节点的当前第一评价值;
根据与所述用户的用户类别相同的全部用户的当前第一评价值计算节点TPx值,根据全部备选网络节点的第一评价值计算综合TPx值;使用节点TPx值除以综合TPx值以得到当前第二评价值;其中,TPx的取值满足在全部参与计算的值中,x%以上的值优于TPx值;
将各备选网络节点的所述当前第二评价值与所述故障率相加,以得到各备选网络节点的当前质量评分;
根据所述当前质量评分选择当前最优的备选网络节点的步骤包括:
从故障率低于故障率阈值的备选网络节点中,选择当前质量评分最低的作为当前最优的备选网络节点。
7.根据权利要求4所述的方法,其特征在于,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常的步骤包括:
根据用户访问当前网络节点时的当前状态数据,计算所述当前网络节点的当前质量评分;
根据所述当前网络节点和所述备选网络节点的当前质量评分判断所述当前网络节点是否为当前最优的网络节点;
若当前网络节点不是当前最优的网络节点,则判定所述当前网络节点发生异常。
8.根据权利要求7所述的方法,其特征在于,控制用户访问所述当前最优的备选网络节点的步骤还包括:
判断当前最优的备选网络节点在之前的m个连续的粒度时长的时间区间内,是否均为最优的备选网络节点;其中,m为正整数;
若是,则控制用户访问所述当前最优的备选网络节点。
9.一种检测网络节点异常的装置,其特征在于,包括:
数据采集模块,采集用户访问当前网络节点时的状态数据;
异常检测模块,在用户访问所述当前网络节点的过程中,通过对比用户访问当前网络节点时的当前状态数据和历史状态数据,判断所述当前网络节点是否发生异常;
所述状态数据包括故障数和流量;
异常检测模块,还用于根据用户访问当前网络节点的历史状态数据生成历史状态基线;其中,所述历史状态基线记录的数据包括在粒度时长的时间区间内,用户访问所述当前网络节点时发生的故障数的历史平均值和所述当前网络节点流量的历史平均值;
所述异常检测模块还用于根据所述历史状态基线判断用户在当前粒度时长的时间区间内,访问所述当前网络节点时发生的故障数是否大于故障数阈值且大于第一比例阈值;其中,所述第一比例阈值为所述历史状态基线中,与当前时间区间相对应的时间区间内故障数的历史平均值乘以第一比例系数的结果;若大于故障数阈值且大于第一比例阈值,则根据所述历史状态基线判断在当前时间点之前粒度时长的时间区间内,所述当前网络节点的流量是否小于流量阈值;若小于所述流量阈值,则判定所述当前网络节点发生异常。
10.根据权利要求9所述的装置,其特征在于,所述异常检测模块还用于:
若不小于所述流量阈值,则判定所述当前网络节点没有发生异常;或者,根据所述历史状态基线判断用户在从当前时间区间开始的n个连续的粒度时长的时间区间内,访问所述当前网络节点时发生的故障数是否均大于第二比例阈值;其中,n为正整数,所述第二比例阈值为所述历史状态基线中,与当前时间区间相对应的时间区间内故障数的历史平均值乘以第二比例系数的结果,所述第二比例系数大于所述第一比例系数;
若均大于第二比例阈值,则判定所述当前网络节点发生异常。
11.根据权利要求9所述的装置,其特征在于,所述数据采集模块还用于:
预先保存用户类别与当前网络节点、备选网络节点的对应关系;其中,所述用户类别根据地理位置和网络运营商类型中的至少一项确定;
在接收到用户的访问请求后,根据所述访问请求确定所述用户的用户类别;
根据所述对应关系和所述用户类别确定与所述用户对应的当前网络节点和备选网络节点;
向所述用户发送包括与其对应的当前网络节点和备选网络节点地址的控制指令,以便所述用户根据所述控制指令分别向与其对应的当前网络节点和备选网络节点发送探测请求;
采集当前网络节点和备选网络节点响应所述探测请求时的数据作为状态数据。
12.根据权利要求9所述的装置,其特征在于,还包括:
访问调度模块,用于采集用户访问备选网络节点时的状态数据;根据用户访问备选网络节点时的当前状态数据,计算所述备选网络节点的当前质量评分;根据所述当前质量评分选择当前最优的备选网络节点;若确定所述当前网络节点发生异常,则控制用户访问所述当前最优的备选网络节点。
13.根据权利要求12所述的装置,其特征在于,所述状态数据包括故障数和性能数据;所述性能数据包括响应时间、域名解析时间、安全套接层认证时间和连接到服务器的时间中的至少一项;所述访问调度模块还用于:
根据各备选网络节点的当前状态数据中的故障数,计算各备选网络节点的故障率;
对各备选网络节点的当前状态数据的性能数据中的各项进行加权求和,以得到各备选网络节点的当前基础评价值;
将各备选网络节点的所述当前基础评价值与所述故障率相加,以得到各备选网络节点的当前质量评分;
从故障率低于故障率阈值的备选网络节点中,选择当前质量评分最低的作为当前最优的备选网络节点。
14.根据权利要求12所述的装置,其特征在于,所述状态数据包括故障数和性能数据;所述性能数据包括响应时间、域名解析时间、安全套接层认证时间和连接到服务器的时间中的至少一项,所述用户有多个;根据用户访问备选网络节点时的当前状态数据,计算所述备选网络节点的当前质量评分的步骤包括:所述访问调度模块还用于:
对各备选网络节点的当前状态数据的性能数据中的各项进行加权求和,以得到各备选网络节点的当前第一评价值;
根据与所述用户的用户类别相同的全部用户的当前第一评价值计算节点TPx值,根据全部备选网络节点的第一评价值计算综合TPx值;使用节点TPx值除以综合TPx值以得到当前第二评价值;其中,TPx的取值满足在全部参与计算的值中,x%以上的值优于TPx值;
将各备选网络节点的所述当前第二评价值与所述故障率相加,以得到各备选网络节点的当前质量评分;
从故障率低于故障率阈值的备选网络节点中,选择当前质量评分最低的作为当前最优的备选网络节点。
15.根据权利要求12所述的装置,其特征在于,所述异常检测模块还用于:
根据用户访问当前网络节点时的当前状态数据,计算所述当前网络节点的当前质量评分;
根据所述当前网络节点和所述备选网络节点的当前质量评分判断所述当前网络节点是否为当前最优的网络节点;
若当前网络节点不是当前最优的网络节点,则判定所述当前网络节点发生异常。
16.根据权利要求15所述的装置,其特征在于,所述访问调度模块还用于:
判断当前最优的备选网络节点在之前的m个连续的粒度时长的时间区间内,是否均为最优的备选网络节点;其中,m为正整数;
若是,则控制用户访问所述当前最优的备选网络节点。
17.一种检测网络节点异常的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。
18.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8中任一所述的方法。
CN201810151837.4A 2018-02-14 2018-02-14 一种检测网络节点异常的方法和装置 Active CN110166271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810151837.4A CN110166271B (zh) 2018-02-14 2018-02-14 一种检测网络节点异常的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810151837.4A CN110166271B (zh) 2018-02-14 2018-02-14 一种检测网络节点异常的方法和装置

Publications (2)

Publication Number Publication Date
CN110166271A CN110166271A (zh) 2019-08-23
CN110166271B true CN110166271B (zh) 2023-05-30

Family

ID=67635523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810151837.4A Active CN110166271B (zh) 2018-02-14 2018-02-14 一种检测网络节点异常的方法和装置

Country Status (1)

Country Link
CN (1) CN110166271B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112804599A (zh) * 2019-11-14 2021-05-14 中盈优创资讯科技有限公司 网络质差点确定方法、装置、计算机设备及可读存储介质
CN111200543A (zh) * 2020-01-16 2020-05-26 福建奇点时空数字科技有限公司 一种基于主动服务探测引擎技术的加密协议识别方法
CN113157077B (zh) * 2020-01-23 2024-08-23 Oppo广东移动通信有限公司 模式控制方法及相关产品
CN111953533B (zh) * 2020-07-30 2021-06-15 腾讯科技(深圳)有限公司 目标网络节点的工作时长调控方法、装置、设备及存储介质
CN112202875B (zh) * 2020-09-28 2024-07-02 北京八分量信息科技有限公司 基于区块链节点权重进行安全检测的方法、装置及相关产品
CN112565227B (zh) * 2020-11-27 2023-05-19 深圳前海微众银行股份有限公司 异常任务的检测方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034507A (ja) * 2009-08-05 2011-02-17 Fujitsu Ltd 動作履歴収集装置、動作履歴収集方法およびプログラム
CN102932204A (zh) * 2012-11-09 2013-02-13 北京奇虎科技有限公司 内容分发网络的监控方法和监控系统
CN104954192A (zh) * 2014-03-27 2015-09-30 东华软件股份公司 一种网络流量监测方法和设备
CN106506242A (zh) * 2016-12-14 2017-03-15 北京东方棱镜科技有限公司 一种网络异常行为和流量监测的精确定位方法与系统
CN107579986A (zh) * 2017-09-21 2018-01-12 北京工业大学 一种复杂网络中网络安全检测的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034507A (ja) * 2009-08-05 2011-02-17 Fujitsu Ltd 動作履歴収集装置、動作履歴収集方法およびプログラム
CN102932204A (zh) * 2012-11-09 2013-02-13 北京奇虎科技有限公司 内容分发网络的监控方法和监控系统
CN104954192A (zh) * 2014-03-27 2015-09-30 东华软件股份公司 一种网络流量监测方法和设备
CN106506242A (zh) * 2016-12-14 2017-03-15 北京东方棱镜科技有限公司 一种网络异常行为和流量监测的精确定位方法与系统
CN107579986A (zh) * 2017-09-21 2018-01-12 北京工业大学 一种复杂网络中网络安全检测的方法

Also Published As

Publication number Publication date
CN110166271A (zh) 2019-08-23

Similar Documents

Publication Publication Date Title
CN110166271B (zh) 一种检测网络节点异常的方法和装置
CN108900388B (zh) 用于监控网络质量的方法、设备及介质
CN111124819B (zh) 全链路监控的方法和装置
US7328127B2 (en) Computer-readable recording medium recording system performance monitoring program, and system performance monitoring method and apparatus
US10102097B2 (en) Transaction server performance monitoring using component performance data
WO2019007306A1 (zh) 一种用户异常行为检测方法、装置和系统
US8886795B2 (en) Method and system for determining response time of a server
CN109167812B (zh) 评估服务质量、确定调整策略的方法、服务器及存储介质
US10230602B2 (en) Endpoint web monitoring system and method for measuring popularity of a service or application on a web server
JP6220625B2 (ja) 遅延監視システムおよび遅延監視方法
US10536505B2 (en) Intelligent data transmission by network device agent
KR102469441B1 (ko) 가상 게이트웨이 클러스터 전역 장애에 대한 모니터링 방법 및 장치
CN112702198B (zh) 异常根因定位方法、装置、电子设备及存储介质
CN111769997A (zh) 网络监测的方法、服务器、设备和计算机可读介质
CN107766224B (zh) 测试方法和测试装置
CN110569424A (zh) 一种信息推介的方法和装置
CN112737897A (zh) 一种链路监测调度方法、装置、设备及存储介质
CN117221148A (zh) 多类型网络应用服务质量评估系统和方法
CN111064802A (zh) 一种网络请求的处理方法、装置、电子设备及存储介质
CN116932505A (zh) 一种数据查询方法、数据写入方法、相关装置和系统
CN107315672B (zh) 用于监控服务器的方法和装置
US20160050101A1 (en) Real-Time Network Monitoring and Alerting
CN112702229A (zh) 数据传输方法、装置、电子设备以及存储介质
CN114465919B (zh) 一种网络服务测试方法、系统、电子设备及存储介质
CN110852537B (zh) 服务质量检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant