CN108377201B - 网络异常感知方法、装置、设备及计算机可读存储介质 - Google Patents

网络异常感知方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN108377201B
CN108377201B CN201810135120.0A CN201810135120A CN108377201B CN 108377201 B CN108377201 B CN 108377201B CN 201810135120 A CN201810135120 A CN 201810135120A CN 108377201 B CN108377201 B CN 108377201B
Authority
CN
China
Prior art keywords
dial
dial testing
result
testing
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810135120.0A
Other languages
English (en)
Other versions
CN108377201A (zh
Inventor
陈虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810135120.0A priority Critical patent/CN108377201B/zh
Publication of CN108377201A publication Critical patent/CN108377201A/zh
Application granted granted Critical
Publication of CN108377201B publication Critical patent/CN108377201B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Mining & Analysis (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供了一种网络异常感知方法、装置、设备及计算机可读存储介质,属于网络技术领域。方法包括:获取拨测对象在预设时间段内的拨测结果,拨测对象为至少一个;根据拨测对象在预设时间段内的拨测结果计算拨测对象的画像,拨测对象的画像至少包括告警阈值及动态基线,告警阈值用于描述拨测结果的正常范围,动态基线用于描述拨测结果的标准随时间变化的情况;根据拨测对象的画像确定网络是否异常。本发明通过计算拨测对象的画像,且由于该画像包括用于描述拨测结果的正常范围的告警阈值,以及用于描述拨测结果的标准随时间变化的情况的动态基线,从而根据拨测对象的画像确定网络是否异常时,确定的结果准确性更高。

Description

网络异常感知方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及网络技术领域,特别涉及一种网络异常感知方法、装置、设备及计算机可读存储介质。
背景技术
随着科技的高速发展,网络的普及以及覆盖面的增加,有关网络的日常维护工作已经越来越重要。为保障网络的正常运行,首先需要获取网络异常情况。
相关技术中,在确定网络异常时,需要建立拨测任务,以该拨测任务进行定时拨测,同时收集拨测结果,根据拨测结果是否成功来实现基于拨测确定网络异常情况。
在实现本发明的过程中,发明人发现相关技术至少存在以下问题:
相关技术在收集拨测任务的拨测结果,根据拨测结果是否成功来实现基于拨测确定网络是否异常时,确定网络异常的准确性较低。
发明内容
本发明提供了一种网络异常感知方法、装置、设备及计算机可读存储介质,可解决上述相关技术中的问题。所述技术方案如下:
一方面,提供了一种网络异常的感知方法,所述方法包括:
获取拨测对象在预设时间段内的拨测结果,所述拨测对象为至少一个;
根据所述拨测对象在预设时间段内的拨测结果计算所述拨测对象的画像,所述拨测对象的画像至少包括告警阈值及动态基线,所述告警阈值用于描述拨测结果的正常范围,所述动态基线用于描述拨测结果的标准随时间变化的情况;
根据所述拨测对象的画像确定网络是否异常。
一方面,提供了一种网络异常的感知装置,所述装置包括:
获取模块,用于获取拨测对象在预设时间段内的拨测结果,所述拨测对象为至少一个;
计算模块,用于根据所述拨测对象在预设时间段内的拨测结果计算所述拨测对象的画像,所述拨测对象的画像至少包括告警阈值及动态基线,所述告警阈值用于描述拨测结果的正常范围,所述动态基线用于描述拨测结果的标准随时间变化的情况;
确定模块,用于根据所述拨测对象的画像确定网络是否异常。
一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被所述处理器执行时实现如上所述的网络异常的感知方法。
一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被执行时实现如上所述的网络异常的感知方法。
本发明实施例提供的技术方案带来的有益效果是:
通过计算拨测对象的画像,且由于该画像包括用于描述拨测结果的正常范围的告警阈值,以及用于描述拨测结果的标准随时间变化的情况的动态基线,从而根据拨测对象的画像确定网络是否异常时,确定的结果准确性更高。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种网络异常的感知系统结构示意图;
图2是根据一示例性实施例示出的一种拨测系统的结构示意图;
图3是根据一示例性实施例示出的一种网络异常的感知方法流程图;
图4是根据一示例性实施例示出的一种网络异常的感知方法流程图;
图5是根据一示例性实施例示出的一种拨测结果示意图;
图6为根据一示例性实施例示出的一种拨测结果的存储结构示意图;
图7为根据一示例性实施例示出的一种拨测对象的画像结构示意图;
图8是根据一示例性实施例示出的一种网络异常的感知方法流程图;
图9是根据一示例性实施例示出的一种网络异常的感知装置的结构框图;
图10是根据一示例性实施例示出的一种网络异常的感知装置的结构框图;
图11是根据一示例性实施例示出的一种网络异常的感知装置的结构框图;
图12是根据一示例性实施例示出的一种网络异常的感知设备的结构框图。
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
随着网络的日常维护工作越来越重要,为保障网络的正常运行,网络异常的感知显的尤为重要。为此,本发明实施例提供了一种网络异常的感知方法,该方法能够对网络中的不同对象进行拨测感知基线刻画,针对性强;此外,还可以针对网络异常进行告警,告警时可自定义配置关联策略,避免误报,准确性高。
在对本发明实施例提供的方法进行介绍之前,先描述下实施该方法的系统架构。参见图1,为本发明实施例提供的网络异常的感知系统的结构示意图,在该系统架构中,各模块介绍如下:
存储模块101:用来存储拨测任务,也用来存储告警规则、拨测结果、每个拨测对象(例如:机房或网络之间互连的协议(英文:Internet Protocol;简称IP)) 以及拨测对象的画像,该画像主要包含但不限于告警阈值及动态基线中的至少一种。其中,该存储模块101可以为数据库(英文:Data Base;简称:DB)。告警阈值用于描述拨测结果的正常范围,动态基线用于描述拨测结果的标准随时间变化的情况。
任务分发模块102:从存储模块101中定期获取拨测对象,并跟进任务生成模块103数量,将拨测对象进行平均分发;
任务生成模块103:收取任务分发模块102发送过来的拨测对象,生成拨测任务,下发给拨测模块104;
拨测模块104:对拨测对象使用设置的拨测方法进行拨测,拨测结果存入计算模块105对应的存储介质。拨测模块104使用多台部署在不同地域的拨测机对拨测对象进行拨测。
计算模块105:对拨测模块104的拨测结果进行存储,并根据每个拨测对象的历史拨测结果,离线计算出每个拨测对象的画像,画像主要包括告警阈值和动态基线;例如,基于正态分布的3西格玛原则,计算拨测对象的画像。
告警模块106:对计算模块105的拨测结果进行处理,基于处理结果,根据配置的告警规则进行告警。
基于上述系统架构,在本发明实施例中,在进行网络异常感知时,首先任务分发模块102需要从存储模块101中获取拨测信息,该拨测信息包括拨测对象、拨测方式以及拨测时长,之后任务分发模块102根据配置环境中任务生成模块103的数量将拨测对象进行分组,并向每个任务生成模块103发送拨测信息。
需要说明的是,根据该任务生成模块103的数量将拨测对象进行的分组一般为平均分组。示例地,任务生成模块103的数量为N个,任务分发模块102 将拨测对象分为N组,并向每个任务生成模块103发送该组的拨测信息。其中,以该拨测对象包括机房或IP为例。
任务生成模块103接收任务分发模块102发送的拨测信息,并且根据该拨测对象和拨测时长计算得到拨测次数,再结合拨测方式,向对应拨测模块104 发送对应的拨测任务,该拨测任务包括:拨测对象,拨测方式以及拨测次数等。示例地,该拨测方式包括探测包探测的方式,如采用因特网包探索器(英文: Packet Internet Groper;简称:PING)探测的方式。
拨测模块104接收对应的拨测任务,并对收到的拨测任务进行一次拨测,同时接收拨测结果,将该拨测结果存储在存储模块101中。在本发明实施例中,以一次拨测任务默认是1分钟时长为例。
可选地,拨测模块105还包括根据每个拨测任务进行一次拨测,确定拨测结果,任务分发模块102收集同一拨测对象的拨测结果,将最优的拨测结果发送至存储模块101中,由存储模块101存储该最优的拨测结果。例如,将拨测成功率从高到低顺序进行排列,取成功率最高的结果作为最优的拨测结果存储在存储模块101中,也可以根据平均时延从大到小的顺序进行排列,取平均时延最小的作为最优的拨测结果存储在存储模块101中。
接下来,在固定的预设时刻时,计算模块105从存储模块101中获取预设历史时间内的每个拨测对象的拨测结果,每个拨测对象在第一单位时间(一次拨测任务)有一条拨测结果。该拨测结果包括:拨测成功次数,拨测次数和拨测延时等,该拨测延时是指一次拨测成功中,在拨测模块104和拨测对象之间传输探测包(如PING包)的延时。示例地,每个IP每分钟有一条拨测结果,包括拨测成功次数,拨测次数和拨测延时。
在本发明实施例中,以第二单位时间为基准,针对每个拨测对象,计算得到该预设历史时间段内该拨测对象的拨测成功率均值,将该拨测成功率平均值作为拨测成功率基线,其中,拨测成功率为预设历史时间段内拨测成功次数与拨测次数的比值;针对每个拨测对象,计算得到该预设历史时间段内该拨测对象拨测成功时的拨测延时平均值,将该拨测延时平均值作为拨测延时基线。针对每个拨测对象,计算得到该预设历史时间段内该拨测对象的拨测成功率平均值,再减去3倍拨测成功率标准差,可得到拨测成功率阈值。针对每个拨测对象,计算得到该预设历史时间段内该拨测对象拨测成功时的拨测延时平均值,将该拨测延时平均值与3倍拨测延迟标准差的差值作为延时阈值。
在本发明实施例中,告警模块106存储有告警规则,可从存储模块101中获得拨测任务的拨测结果,同时获取拨测对象的画像,根据该告警规则进行告警。
此外,对于上述涉及的拨测流程,还可参考图2所示的拨测系统的结构示意图。图2中,BoCe102’相当于任务分发模块102,BoCeInterface(拨测任务分发接口)103’相当于任务生成模块103,BoCeServer(拨测机)104’相当于拨测模块104;BoCeInterface103’负责向BoCeServer104’下发拨测任务,每个拨测任务进行一次拨测;BoCeServer104’根据收到的拨测任务进行实际拨测; DB101’相当于存储模块101,是存储拨测任务的DB,也用来存储告警规则、拨测结果、每个拨测对象(例如:机房或IP)以及拨测对象的画像。计算模块105 根据每个拨测对象历史拨测数据计算出拨测对象的告警阈值和动态基线;告警模块106从DB101中获取拨测结果,并跟进DB101’中配置的告警规则进行告警。
基于上述图1所示的系统架构,以及图2所示的拨测流程,本发明实施例提供了一种网络异常的感知方法,如图3所示,该方法流程包括:
在步骤301中,获取拨测对象在预设时间段内的拨测结果,拨测对象为至少一个。
本发明实施例提供的方法可以按照周期来执行,预设时间段可以为一个周期内的时间段,该周期可以预先设置。例如,以一天为一个周期,每天早上8 点来执行该方法,当前时间为2018年2月2日早8点,则预设时间段为2月1 日早8点到2月2日早8点。
当然,除了按照上述方式确定预设时间段外,该预设时间段可以为任意历史时间段,本发明实施例不对预设时间段进行限定。
其中,拨测对象包括但不限于包括云平台在内的多种机房或者IP。为了能够基于拨测结果进行网络异常的感知,本发明实施例提供的方法可以定期对拨测对象进行拨测,并对得到的拨测结果进行存储,从而在执行本发明实施例提供的方法时,从存储的拨测结果中获取拨测对象在预设时间段内的拨测结果。
在步骤302中,根据拨测对象在预设时间段内的拨测结果计算拨测对象的画像,拨测对象的画像至少包括告警阈值及动态基线。
其中,拨测结果至少包括拨测延时,和/或,拨测次数及拨测成功数;告警阈值包括拨测成功率阈值及延时阈值中的至少一种,动态基线包括拨测成功率基线和拨测延时基线中的至少一种。
该方法中,参考正态分布(也称“常态分布”、“高斯分布”)中的三西格玛(3σ) 准则。其中,正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此经常称之为钟形曲线。具体地,若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度,同时,当μ=0,σ=1时的正态分布是标准正态分布。
三西格玛准则又称为拉依达准则,它是先假设一组检测数据只含有随机误差,对其进行计算处理得到标准偏差,按一定概率确定一个区间,认为凡超过这个区间的误差,就不属于随机误差而是粗大误差,含有该误差的数据应予以剔除。
在正态分布中σ代表标准差,μ代表均值。x=μ即为图像的对称轴,3σ原则为:
数值分布在(μ-σ,μ+σ)中的概率为0.6826;
数值分布在(μ-2σ,μ+2σ)中的概率为0.9544;
数值分布在(μ-3σ,μ+3σ)中的概率为0.9974;
可以认为,数值的取值几乎全部集中在(μ-3σ,μ+3σ)区间内,超出这个范围的可能性仅占不到0.3%,因此,以该方式计算得到的告警阈值符合绝大多数拨测结果,若某一拨测结果在此之外,则可以认为该拨测结果有误,也即是该网络出现异常。
基于上述内容,接下来针对不同情况的计算方式分别进行介绍:
1)拨测结果至少包括拨测次数及拨测成功数,当拨测对象的画像包括告警阈值,且告警阈值包括拨测成功率阈值时,根据拨测对象在预设时间段内的拨测结果计算拨测对象的画像,包括:
根据拨测对象在预设时间段内的拨测结果中的拨测次数及拨测成功数,计算拨测对象在预设时间段内的拨测成功率平均值,根据拨测成功率平均值与拨测成功率标准差获取拨测成功率阈值。
其中,标准差(Standard Deviation)又常称均方差,是离均差平方的算术平均数的平方根,用σ表示。标准差是方差的算术平方根,标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。拨测成功率标准差可以采用上述介绍的三西格玛准则进行计算得到,本发明实施例不对拨测成功率标准差的计算方式进行限定。
根据拨测成功率平均值与拨测成功率标准差获取拨测成功率阈值时,包括但不限于将拨测成功率平均值减去3倍拨测成功率标准差,得到的差值作为拨测成功率阈值。
2)拨测结果至少包括拨测延时,当拨测对象的画像包括告警阈值,且告警阈值包括延时阈值时,根据拨测对象在预设时间段内的拨测结果计算拨测对象的画像,包括:
根据拨测对象在预设时间段内的拨测结果中的拨测延时,计算拨测对象在预设时间段内的拨测延时平均值,根据拨测延时平均值与拨测延时标准差获取延时阈值。
其中,拨测延时标准差可以采用三西格玛准则进行计算得到,本发明实施例不对拨测延时标准差的计算方式进行限定。
根据拨测延时平均值与拨测延时标准差获取延时阈值时,包括但不限于将拨测延时平均值减去3倍拨测延时标准差,得到的差值作为延时阈值。
3)拨测结果至少包括拨测次数及拨测成功数,当拨测对象的画像包括动态基线,且动态基线包括拨测成功率基线时,根据拨测对象在预设时间段内的拨测结果计算拨测对象的画像,包括:
根据拨测对象在预设时间段内的拨测结果中的拨测次数及拨测成功数,计算拨测对象在预设时间段内的拨测成功率平均值,将拨测成功率平均值作为拨测对象的拨测成功率基线。
4)拨测结果至少包括拨测平均时延,当拨测对象的画像包括动态基线,且动态基线包括拨测延时基线时,根据拨测对象在预设时间段内的拨测结果计算拨测对象的画像,包括:
根据拨测对象在预设时间段内的拨测结果中的拨测延时基线,计算拨测对象在预设时间段内的拨测延时平均值,将拨测延时平均值作为拨测对象的拨测延时基线。
示例地,拨测对象S在预设时间段T内进行拨测,可得到如下拨测结果:拨测次数均为20,拨测成功数依次为15、10、14、8,拨测延时为2.546、1.689、 1.895、2.695,可得拨测成功率分别为0.75、0.5、0.7、0.4,可得拨测延时平均值为2.20625,可知该拨测延时平均值为该拨测对象的拨测延时基线,也即是该拨测延时基线为2.20625;根据该拨测成功率可得拨测成功率平均值为0.5875,可知该拨测成功率平均值为该拨测对象的拨测成功率基线,也即是该拨测成功率基线为0.5875;以根据三西格玛准则可得到拨测成功率标准差为0.1652,根据三西格玛准则可得拨测延时标准差为0.48947为例,将该拨测成功率平均值与该拨测成功率标准差的差值作为拨测成功率阈值,可知拨测成功率阈值为 0.0919,将该拨测延时平均值与该拨测延时标准差的差值作为延时阈值,可知延时阈值为0.73784。
在步骤303中,根据拨测对象的画像确定网络是否异常。
在一种实现方式中,获取拨测对象的参考信息,根据拨测对象的画像及参考信息确定网络是否异常。其中,参考信息包括拨测对象的网络信息和配置的基本信息中的至少一种信息。例如,网络信息可以为是否封堵、设备是否关机等信息。通过结合参考信息来确定网络是否异常,可以使得确定结果的准确性更高。
在一种实现方式中,为了在感知网络异常时,本发明实施例提供的方法还包括:
当根据拨测对象的画像确定网络异常后,进行告警处理。
例如,当确定网络异常后,可以向告警终端发送告警信息(如包含网络异常等提示内容的信息),该告警终端可以将告警信息进行显示,以提示相关人员采取处理措施。
此外,在一种实现方式中,本发明实施例提供的方法还支持自定义告警策略,例如,由用户根据自身需求定制告警方式。具体实施时,可以提供告警策略设置界面,该设置界面上可以显示预先定义好的几种告警形式,如给用户固定终端发消息,或者采取提示音等等,之后,获取用户选择的告警形式,由此生成告警策略。可选地,还可以在该设置界面上显示输入框,获取用户在该输入框内输入的告警形式,由此生成告警策略。
无论采用哪种方式获取告警策略后,为了便于后续实施报警,本发明实施例提供的方法还将该告警策略进行存储,例如,可以将该告警策略与拨测结果一并存储。
本发明实施例提供的方法,通过计算拨测对象的画像,且由于该画像包括用于描述拨测结果的正常范围的告警阈值,以及用于描述拨测结果的标准随时间变化的情况的动态基线,从而根据拨测对象的画像确定网络是否异常时,确定的结果准确性更高。
另外,根据拨测对象的画像及参考信息确定网络是否异常,可以进一步提高结果的准确性。
当确定网络异常后,通过采用自定义告警策略进行告警,可以满足用户的个性化需求,使得网络的日常维护更为便捷。
基于上述图1所示的系统架构,以及图2所示的拨测流程,本发明实施例提供了一种网络异常的感知方法,如图4所示,该方法流程包括:
在步骤401中,获取拨测对象,根据拨测对象生成拨测任务。
在步骤402中,基于拨测任务,对拨测对象进行拨测,得到拨测结果。
如图5所示的拨测结果为例,拨测结果中:
IP指拨测对象,如图5中的59.37.110.47。
拨测次数指一分钟拨测时长内拨测机BoCeServer向目标发送多少PING拨测请求包,即一分钟拨测的总次数是多少,此处以20次为例。
拨测成功数是指进行了20次拨测中有多少次是拨测成功的。
拨测延时是指进行了成功拨测的次数中,PING包在拨测机和目标IP网络上传输时延的均值,如上图中的time=2.82为一次拨测延时。
在步骤403中,将拨测结果存储至数据库中,数据库中存储有不同拨测对象不同时间段内的拨测结果。
对于每一个拨测IP,都会有M组拨测结果,根据拨测成功率从高到低顺序 (拨测成功率相同,看拨测平均时延,平均时延小的结果最优)取最优结果存储在DB中,存储结构可以如图6所示。在图6中,“time”表示拨测时间,“IP”表示拨测对象,“Type”表示业务类型,“UrlName”表示为业务名称,“Max”表示最大拨测时延,“Min”表示最小拨测时延,“PingTotal”表示拨测次数,“PingSucc”表示拨测成功数,“Avg”表示拨测平均时延。
在步骤404中,从数据库中获取拨测对象在预设时间段内的拨测结果,拨测对象为至少一个。
在步骤405中,根据拨测对象在预设时间段内的拨测结果计算拨测对象的画像,拨测对象的画像至少包括告警阈值及动态基线。
例如,基于上述步骤403的例子,该步骤405得到的画像可以如图7所示。
该步骤405可参考上述步骤302的实现方式,此处不再赘述。
在步骤406中,根据拨测对象的画像确定网络是否异常。
该步骤406可参考上述步骤303的实现方式,此处不再赘述。
基于上述内容,结合图1和图2所示的示意图,如图8所示,本发明实施例提供的方法包括如下几个步骤:
(1)BoCe从DB中获取所有要拨测的IP(每分钟读取一次,设为N个)。
(2)BoCe根据已配置的BoCeInterface进程的数量(现网是4个)将拨测对象IP分成N组,向每台BoCeServer下发一次拨测任务(拨测任务包括:IP,拨测方式,拨测次数)。
(3)BoCeServer收到拨测任务后,在一分钟时间内对这次拨测任务进行拨测(PING拨测),生成拨测结果(拨测结果:IP,拨测次数,拨测成功数,拨测平均时延),并向拨测结果返回给BoCeInterface。
(4)BoCeInterface收到拨测结果后,立即将拨测结果返回给BoCe。
(5)BoCe收到多台BoCeServer的拨测结果后,对于每一个拨测IP,都会有M组拨测结果,BoCe根据拨测成功率从高到低顺序(拨测成功率相同,看拨测平均时延,平均时延小的结果最优)取最优结果存储在DB中。
(6)计算模块每天定时对前一天每个拨测对象的拨测结果数据进行基线计算,计算出某个对象的拨测基线以及阈值,基线和阈值的粒度是小时级别。
(7)对于写入到DB的实时拨测结果,告警模块会逐条处理,获取该对象小时粒度的基线和告警阈值,根据偏离基线的程度以及告警阈值综合判断是否需要发告警出来。
(8)进行下一轮拨测,如此循环。
本发明实施例提供的方法能够快速发现系统在防护或者流量压制上存在的漏水情况;另一方面也能够及时感知现网网络异常,能够自证防护效果,消除业务误解。此外,可支持包括云平台在内的多种机房或者IP拨测,基于每个对象进行基线刻画,感知结果准确度高;可快速定制感知策略,秒级下发至本系统,快速生效,扩展性强,满足不同客户的定制化需求。此外,支持客户定制化的告警策略,客户可以根据自身需求定制拨测告警形式,方便客户或者运维同学进行日常运维。
本发明实施例提供的方法,通过计算拨测对象的画像,且由于该画像包括用于描述拨测结果的正常范围的告警阈值,以及用于描述拨测结果的标准随时间变化的情况的动态基线,从而根据拨测对象的画像确定网络是否异常时,确定的结果准确性更高。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
本发明实施例提供了一种网络异常的感知装置,该装置用于执行上述网络异常的感知方法,如图9所示,该装置包括:
获取模块901,用于获取拨测对象在预设时间段内的拨测结果,拨测对象为至少一个;
计算模块902,用于根据拨测对象在预设时间段内的拨测结果计算拨测对象的画像,拨测对象的画像至少包括告警阈值及动态基线,告警阈值用于描述拨测结果的正常范围,动态基线用于描述拨测结果的标准随时间变化的情况;
确定模块903,用于根据拨测对象的画像确定网络是否异常。
在一种实现方式中,拨测结果至少包括拨测次数及拨测成功数;
计算模块902,用于当拨测对象的画像包括告警阈值,且告警阈值包括拨测成功率阈值时,根据拨测对象在预设时间段内的拨测结果中的拨测次数及拨测成功数,计算拨测对象在预设时间段内的拨测成功率平均值,根据拨测成功率平均值与拨测成功率标准差获取拨测成功率阈值。
在一种实现方式中,拨测结果至少包括拨测延时;
计算模块902,用于当拨测对象的画像包括告警阈值,且告警阈值包括延时阈值时,根据拨测对象在预设时间段内的拨测结果中的拨测延时,计算拨测对象在预设时间段内的拨测延时平均值,根据拨测延时平均值与拨测延时标准差获取延时阈值。
在一种实现方式中,拨测结果至少包括拨测次数及拨测成功数;
计算模块902,用于当拨测对象的画像包括动态基线,且动态基线包括拨测成功率基线时,根据拨测对象在预设时间段内的拨测结果中的拨测次数及拨测成功数,计算拨测对象在预设时间段内的拨测成功率平均值,将拨测成功率平均值作为拨测对象的拨测成功率基线。
在一种实现方式中,拨测结果至少包括拨测延时;
计算模块902,用于当拨测对象的画像包括动态基线,且动态基线包括拨测延时基线时,根据拨测对象在预设时间段内的拨测结果中的拨测延时,计算拨测对象在预设时间段内的拨测延时平均值,将拨测延时平均值作为拨测对象的拨测延时基线。
在一种实现方式中,参见图10,该装置还包括:
生成模块904,用于获取拨测对象,根据拨测对象生成拨测任务;
拨测模块905,用于基于拨测任务,对拨测对象进行拨测,得到拨测结果;
存储模块906,用于将拨测结果存储至数据库中,数据库中存储有不同拨测对象不同时间段内的拨测结果;
获取模块901,用于从数据库中获取拨测对象在预设时间段内的拨测结果。
在一种实现方式中,确定模块903,用于获取拨测对象的参考信息,参考信息包括拨测对象的网络信息和配置的基本信息中的至少一种信息;根据拨测对象的画像及参考信息确定网络是否异常。
在一种实现方式中,参见图10,装置还包括:
告警模块907,用于当根据拨测对象的画像确定网络异常后,进行告警处理。
本发明实施例提供的装置,通过计算拨测对象的画像,且由于该画像包括用于描述拨测结果的正常范围的告警阈值,以及用于描述拨测结果的标准随时间变化的情况的动态基线,从而根据拨测对象的画像确定网络是否异常时,确定的结果准确性更高。
需要说明的是:上述实施例提供的网络异常的感知装置在确定网络是否异常时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的网络异常的感知装置与网络异常的感知方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图12,其示出了本发明实施例所涉及的网络异常的感知设备结构示意图,该设备可以用于实施上述实施例中提供的网络异常的感知方法。具体来讲:
该服务器1200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1222(例如,一个或一个以上处理器)和存储器1232,一个或一个以上存储应用程序1242或数据1244 的存储介质1230(例如一个或一个以上海量存储设备)。其中,存储器1232和存储介质1230可以是短暂存储或持久存储。存储在存储介质1230的程序可以包括一个或一个以上模块(图12未示出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1222可以设置为与存储介质1230通信,在服务器1200上执行存储介质1230中的一系列指令操作。
服务器1200还可以包括一个或一个以上电源1226,一个或一个以上有线或无线网络接口1250,一个或一个以上输入输出接口1258,一个或一个以上键盘 1256,和/或,一个或一个以上操作系统1241,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
服务器1200可以包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行一个或者一个以上程序包含用于进行上述网络异常的感知方法。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集在被执行时实现上述的网络异常的感知方法。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种网络异常的感知方法,其特征在于,所述方法包括:
获取拨测对象,根据所述拨测对象生成拨测任务;
基于所述拨测任务,对所述拨测对象进行多次拨测,得到多组拨测结果;
在所述多组拨测结果中选取最优结果存储至数据库中,所述最优结果为拨测成功率最高的拨测结果或者拨测平均时延最小的拨测结果;
周期性地从所述数据库中获取拨测对象在预设时间段内的拨测结果,所述数据库中存储有不同拨测对象不同时间段内的拨测结果,所述拨测对象为至少一个,所述预设时间段为一个周期内的时间段;
根据所述拨测对象在预设时间段内的拨测结果离线计算所述拨测对象的画像,所述拨测对象的画像至少包括告警阈值及动态基线,所述告警阈值用于描述拨测结果的正常范围,所述动态基线用于描述拨测结果的标准随时间变化的情况;
对于写入到所述数据库中的所述拨测对象的实时拨测结果,根据所述拨测对象的画像确定网络是否异常。
2.根据权利要求1所述的方法,其特征在于,所述拨测结果至少包括拨测次数及拨测成功数;
所述根据所述拨测对象在预设时间段内的拨测结果离线计算所述拨测对象的画像,包括:
当所述拨测对象的画像包括告警阈值,且所述告警阈值包括拨测成功率阈值时,根据所述拨测对象在预设时间段内的拨测结果中的拨测次数及拨测成功数,计算所述拨测对象在所述预设时间段内的拨测成功率平均值,根据所述拨测成功率平均值与拨测成功率标准差获取拨测成功率阈值。
3.根据权利要求1所述的方法,其特征在于,所述拨测结果至少包括拨测延时;
所述根据所述拨测对象在预设时间段内的拨测结果离线计算所述拨测对象的画像,包括:
当所述拨测对象的画像包括告警阈值,且所述告警阈值包括延时阈值时,根据所述拨测对象在预设时间段内的拨测结果中的拨测延时,计算所述拨测对象在所述预设时间段内的拨测延时平均值,根据所述拨测延时平均值与拨测延时标准差获取延时阈值。
4.根据权利要求1所述的方法,其特征在于,所述拨测结果至少包括拨测次数及拨测成功数;
所述根据所述拨测对象在预设时间段内的拨测结果离线计算所述拨测对象的画像,包括:
当所述拨测对象的画像包括动态基线,且所述动态基线包括拨测成功率基线时,根据所述拨测对象在预设时间段内的拨测结果中的拨测次数及拨测成功数,计算所述拨测对象在所述预设时间段内的拨测成功率平均值,将所述拨测成功率平均值作为所述拨测对象的拨测成功率基线。
5.根据权利要求1所述的方法,其特征在于,所述拨测结果至少包括拨测延时;
所述根据所述拨测对象在预设时间段内的拨测结果离线计算所述拨测对象的画像,包括:
当所述拨测对象的画像包括动态基线,且所述动态基线包括拨测延时基线时,根据所述拨测对象在预设时间段内的拨测结果中的拨测延时,计算所述拨测对象在所述预设时间段内的拨测延时平均值,将所述拨测延时平均值作为所述拨测对象的拨测延时基线。
6.根据权利要求1-5中任一所述的方法,其特征在于,所述对于写入到所述数据库中的所述拨测对象的实时拨测结果,根据所述拨测对象的画像确定网络是否异常,包括:
获取所述拨测对象的参考信息,所述参考信息包括所述拨测对象的网络信息和配置的基本信息中的至少一种信息;
对于所述实时拨测结果,根据所述拨测对象的画像及所述参考信息确定网络是否异常。
7.一种网络异常的感知装置,其特征在于,所述装置包括:
生成模块,用于获取拨测对象,根据所述拨测对象生成拨测任务;
拨测模块,用于基于所述拨测任务,对所述拨测对象进行多次拨测,得到多组拨测结果;
存储模块,用于在所述多组拨测结果中选取最优结果存储至数据库中,所述最优结果为拨测成功率最高的拨测结果或者拨测平均时延最小的拨测结果;
获取模块,用于周期性地从所述数据库中获取拨测对象在预设时间段内的拨测结果,所述数据库中存储有不同拨测对象不同时间段内的拨测结果,所述拨测对象为至少一个,所述预设时间段为一个周期内的时间段;
计算模块,用于根据所述拨测对象在预设时间段内的拨测结果离线计算所述拨测对象的画像,所述拨测对象的画像至少包括告警阈值及动态基线,所述告警阈值用于描述拨测结果的正常范围,所述动态基线用于描述拨测结果的标准随时间变化的情况;
确定模块,用于对于写入到所述数据库中的所述拨测对象的实时拨测结果,根据所述拨测对象的画像确定网络是否异常。
8.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被所述处理器执行时实现如权利要求1至6任一项所述的网络异常的感知方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被执行时实现如权利要求1至6任一项所述的网络异常的感知方法。
CN201810135120.0A 2018-02-09 2018-02-09 网络异常感知方法、装置、设备及计算机可读存储介质 Active CN108377201B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810135120.0A CN108377201B (zh) 2018-02-09 2018-02-09 网络异常感知方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810135120.0A CN108377201B (zh) 2018-02-09 2018-02-09 网络异常感知方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN108377201A CN108377201A (zh) 2018-08-07
CN108377201B true CN108377201B (zh) 2021-03-26

Family

ID=63017563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810135120.0A Active CN108377201B (zh) 2018-02-09 2018-02-09 网络异常感知方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN108377201B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111124844B (zh) * 2018-10-30 2023-07-21 安碁资讯股份有限公司 检测作业系统的异常操作的异常检测的方法及装置
CN112152833B (zh) * 2019-06-29 2023-06-06 北京金山云网络技术有限公司 一种网络异常报警方法、装置及电子设备
CN112444678B (zh) * 2019-09-02 2022-11-22 深南电路股份有限公司 Pcb板插入损耗的监控方法、监控系统以及装置
CN113935261A (zh) * 2020-07-14 2022-01-14 深南电路股份有限公司 插损评估方法、装置、计算机设备及存储介质
CN112260858A (zh) * 2020-09-30 2021-01-22 福建天泉教育科技有限公司 一种可自动化检测的告警方法及终端
CN115297037A (zh) * 2021-04-19 2022-11-04 中国移动通信集团安徽有限公司 拨测方法、装置、设备及存储介质
CN114124749B (zh) * 2021-11-10 2023-10-20 云知声(上海)智能科技有限公司 一种基于防抖窗口判定IoT设备上下线的方法
CN114422403A (zh) * 2021-12-23 2022-04-29 中国人民解放军63921部队 一种基于数据基线的时延越限告警方法
CN115801583A (zh) * 2022-11-16 2023-03-14 天翼数字生活科技有限公司 链路情况感知方法、装置及计算机设备
CN117793764A (zh) * 2023-12-27 2024-03-29 广东宜通衡睿科技有限公司 5g专网软探针拨测数据完整性校验和补全方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001013653A1 (en) * 1999-08-19 2001-02-22 Armillaire Technologies, Inc. Resource management
CN103905227A (zh) * 2012-12-26 2014-07-02 中国移动通信集团辽宁有限公司 一种服务器能耗控制方法及系统
CN104243235A (zh) * 2014-09-16 2014-12-24 中国联合网络通信集团有限公司 拨测的方法及装置
CN105610647A (zh) * 2015-12-30 2016-05-25 华为技术有限公司 一种探测业务异常的方法和服务器
CN105704483A (zh) * 2016-01-15 2016-06-22 北京市博汇科技股份有限公司 一种有线互动电视业务拨测方法和系统
CN106603340A (zh) * 2016-12-28 2017-04-26 成都网丁科技有限公司 一种cdn质量的主动拨测方法及系统
CN107566665A (zh) * 2017-08-15 2018-01-09 携程旅游信息技术(上海)有限公司 话务异常检测方法及其设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001013653A1 (en) * 1999-08-19 2001-02-22 Armillaire Technologies, Inc. Resource management
CN103905227A (zh) * 2012-12-26 2014-07-02 中国移动通信集团辽宁有限公司 一种服务器能耗控制方法及系统
CN104243235A (zh) * 2014-09-16 2014-12-24 中国联合网络通信集团有限公司 拨测的方法及装置
CN105610647A (zh) * 2015-12-30 2016-05-25 华为技术有限公司 一种探测业务异常的方法和服务器
CN105704483A (zh) * 2016-01-15 2016-06-22 北京市博汇科技股份有限公司 一种有线互动电视业务拨测方法和系统
CN106603340A (zh) * 2016-12-28 2017-04-26 成都网丁科技有限公司 一种cdn质量的主动拨测方法及系统
CN107566665A (zh) * 2017-08-15 2018-01-09 携程旅游信息技术(上海)有限公司 话务异常检测方法及其设备

Also Published As

Publication number Publication date
CN108377201A (zh) 2018-08-07

Similar Documents

Publication Publication Date Title
CN108377201B (zh) 网络异常感知方法、装置、设备及计算机可读存储介质
CN111181801B (zh) 节点集群测试方法、装置、电子设备及存储介质
US6901442B1 (en) Methods, system and computer program products for dynamic filtering of network performance test results
CN108989136B (zh) 业务端到端性能监控方法及装置
CN108900388B (zh) 用于监控网络质量的方法、设备及介质
CN109005085A (zh) 一种服务可用性监控系统、方法、装置及设备
CN110659109B (zh) 一种openstack集群虚拟机监控系统及方法
CN111427336A (zh) 一种工业控制系统的漏洞扫描方法、装置及设备
US11283696B2 (en) Diagnostic testing in networks
US20070025389A1 (en) Abnormality indicator of a desired group of resource elements
CN113824768B (zh) 负载均衡系统中的健康检查方法及装置和流量转发方法
CN110071829A (zh) Dns隧道检测方法、装置及计算机可读存储介质
US11669374B2 (en) Using machine-learning methods to facilitate experimental evaluation of modifications to a computational environment within a distributed system
CN107306200B (zh) 网络故障预警方法和用于网络故障预警的网关
CN113726607A (zh) 一种网络探测方法、装置、电子设备及存储介质
CN108964947A (zh) 后台服务质量检测方法和装置、计算机设备
Yu et al. A visualization analysis tool for DNS amplification attack
CN108390770B (zh) 一种信息生成方法、装置及服务器
CN114978945B (zh) 基于边缘节点的网络拨测方法、服务器集群及相关设备
CN113300914A (zh) 网络质量监测方法、装置、系统、电子设备和存储介质
CN111641535B (zh) 网络监控方法、装置、电子设备和介质
Lavrova et al. Detection of cyber threats to network infrastructure of digital production based on the methods of Big Data and multifractal analysis of traffic
CN111901174A (zh) 一种服务状态通知的方法、相关装置及存储介质
Horvat et al. Real-time WSN communication for access control applications
US9311210B1 (en) Methods and apparatus for fault detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant