CN111049691A - 网络故障定位方法、服务器、采集探针和存储介质 - Google Patents

网络故障定位方法、服务器、采集探针和存储介质 Download PDF

Info

Publication number
CN111049691A
CN111049691A CN201911360145.1A CN201911360145A CN111049691A CN 111049691 A CN111049691 A CN 111049691A CN 201911360145 A CN201911360145 A CN 201911360145A CN 111049691 A CN111049691 A CN 111049691A
Authority
CN
China
Prior art keywords
network
acquisition
data
operator
probe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911360145.1A
Other languages
English (en)
Other versions
CN111049691B (zh
Inventor
黎宇
张园
陈孟尝
莫俊彬
叶晓斌
潘俊斌
吴浩
陈彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201911360145.1A priority Critical patent/CN111049691B/zh
Publication of CN111049691A publication Critical patent/CN111049691A/zh
Application granted granted Critical
Publication of CN111049691B publication Critical patent/CN111049691B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种网络故障定位方法、服务器、采集探针和存储介质,该方法包括:向目标采集探针发送采集请求,以使所述目标采集探针根据所述采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得所述用户边缘设备根据所述数据获取请求,向所述目标采集探针返回当前时刻的客户网络数据,以及使得所述运营商边缘设备根据所述数据获取请求,向所述目标采集探针返回当前时刻的运营商网络数据;所述目标采集探针部署于客户网络中;接收所述目标采集探针发送的所述客户网络数据和所述运营商网络数据;根据所述客户网络数据和所述运营商网络数据,进行网络故障定位。本案能够实现网络故障定位。

Description

网络故障定位方法、服务器、采集探针和存储介质
技术领域
本发明涉及网络技术领域,尤其涉及一种网络故障定位方法、服务器、采集探针和存储介质。
背景技术
随着网络技术的不断发展,多协议标签交换虚拟专网技术(Multiprotocol LabelSwitching Virtual Private Network,简称MPLS VPN)得到了广泛的发展和应用。
现有技术中,在MPLS VPN网络中,客户可通过租用运营商的虚拟专用网络(Virtual Private Network)专线,将自身客户网络组成一张子网,子网通过VPN专线互相连通,并可以访问互联网。
然而现有技术中,当发生网络故障时,如何进行网络故障定位则成为当今亟需解决的问题。
发明内容
本发明提供一种网络故障定位方法、服务器、采集探针和存储介质,能够实现网络故障定位。
第一方面,本发明提供一种网络故障定位方法,应用于服务器,包括:
向目标采集探针发送采集请求,以使所述目标采集探针根据所述采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得所述用户边缘设备根据所述数据获取请求,向所述目标采集探针返回当前时刻的客户网络数据,以及使得所述运营商边缘设备根据所述数据获取请求,向所述目标采集探针返回当前时刻的运营商网络数据;所述目标采集探针部署于客户网络中;
接收所述目标采集探针发送的所述客户网络数据和所述运营商网络数据;
根据所述客户网络数据和所述运营商网络数据,进行网络故障定位。
进一步地,根据所述客户网络数据和所述运营商网络数据,进行网络故障定位,包括:
根据所述客户网络数据,确定所述客户网络对应的各服务等级协议指标;以及根据所述运营商网络数据,确定运营商网络对应的各服务等级协议指标;
根据所述客户网络对应的各服务等级协议指标,确定所述客户网络是否出现故障;根据所述运营商网络对应的各服务等级协议指标,确定所述运营商网络是否出现故障。
进一步地,所述向目标采集探针发送采集请求,包括:
根据采集周期,向所述目标采集探针发送采集请求;
在确定所述客户网络对应的各服务等级协议指标之后,还包括:
根据当前所确定的所述客户网络对应的各服务等级协议指标、以及上一次所确定的所述客户网络对应的各服务等级协议指标,确定所述客户网络的网络质量变化趋势;
根据所述客户网络的网络质量变化趋势,对所述采集周期进行更新。
进一步地,在所述向目标采集探针发送采集请求之前,还包括:
从所管理的多个采集探针中,确定未处于宕机状态的采集探针;
获取每一未处于宕机状态的采集探针所对应的当前中央处理器使用率、当前内存使用率、以及预设内存分配空间;
根据每一未处于宕机状态的采集探针所对应的当前中央处理器使用率、当前内存使用率、以及预设内存分配空间,确定每一未处于宕机状态的采集探针所对应的负载评分值;
确定负载评分值最高的未处于宕机状态的采集探针,为所述目标采集探针。
进一步地,服务等级协议指标包括以下中的任一项:延迟、抖动率、吞吐量、丢包率。
第二方面,本发明提供一种网络故障定位方法,应用于采集探针,所述采集探针部署于客户网络中;所述方法,包括:
接收服务器发送的采集请求;
根据所述采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得所述用户边缘设备根据所述数据获取请求,向所述采集探针返回当前时刻的客户网络数据,以及使得所述运营商边缘设备根据所述数据获取请求,向所述采集探针返回当前时刻的运营商网络数据;
向所述服务器发送所述客户网络数据和所述运营商网络数据,以使所述服务器根据所述客户网络数据和所述运营商网络数据,进行网络故障定位。
第三方面,本发明提供一种服务器,包括:
发送单元,用于向目标采集探针发送采集请求,以使所述目标采集探针根据所述采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得所述用户边缘设备根据所述数据获取请求,向所述目标采集探针返回当前时刻的客户网络数据,以及使得所述运营商边缘设备根据所述数据获取请求,向所述目标采集探针返回当前时刻的运营商网络数据;所述目标采集探针部署于客户网络中;
接收单元,用于接收所述目标采集探针发送的所述客户网络数据和所述运营商网络数据;
处理单元,用于根据所述客户网络数据和所述运营商网络数据,进行网络故障定位。
进一步地,所述处理单元,具体用于根据所述客户网络数据,确定所述客户网络对应的各服务等级协议指标;以及根据所述运营商网络数据,确定运营商网络对应的各服务等级协议指标;根据所述客户网络对应的各服务等级协议指标,确定所述客户网络是否出现故障;根据所述运营商网络对应的各服务等级协议指标,确定所述运营商网络是否出现故障。
进一步地,所述发送单元,具体用于根据采集周期,向所述目标采集探针发送采集请求;
所述处理单元,还用于在确定所述客户网络对应的各服务等级协议指标之后,根据当前所确定的所述客户网络对应的各服务等级协议指标、以及上一次所确定的所述客户网络对应的各服务等级协议指标,确定所述客户网络的网络质量变化趋势;根据所述客户网络的网络质量变化趋势,对所述采集周期进行更新。
进一步地,所述服务器,还包括:
确定单元,用于在所述发送单元向采集探针发送采集请求之前,从所管理的多个采集探针中,确定未处于宕机状态的采集探针;获取每一未处于宕机状态的采集探针所对应的当前中央处理器使用率、当前内存使用率、以及预设内存分配空间;根据每一未处于宕机状态的采集探针所对应的当前中央处理器使用率、当前内存使用率、以及预设内存分配空间,确定每一未处于宕机状态的采集探针所对应的负载评分值;确定负载评分值最高的未处于宕机状态的采集探针,为所述目标采集探针。
进一步地,服务等级协议指标包括以下中的任一项:延迟、抖动率、吞吐量、丢包率。
第四方面,本发明提供一种采集探针,所述采集探针部署于客户网络中;所述采集探针,包括:
接收单元,用于接收服务器发送的采集请求;
第一发送单元,用于根据所述采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得所述用户边缘设备根据所述数据获取请求,向所述采集探针返回当前时刻的客户网络数据,以及使得所述运营商边缘设备根据所述数据获取请求,向所述采集探针返回当前时刻的运营商网络数据;
第二发送单元,用于向所述服务器发送所述客户网络数据和所述运营商网络数据,以使所述服务器根据所述客户网络数据和所述运营商网络数据,进行网络故障定位。
第五方面,本发明提供一种服务器,包括:存储器和处理器;
所述存储器,用于存储计算机程序;
其中,所述处理器执行所述存储器中的计算机程序,以实现如第一方面任一实施方式中的方法。第六方面,本发明提供一种,包括:存储器和处理器;
所述存储器,用于存储计算机程序;
其中,所述处理器执行所述存储器中的计算机程序,以实现如第一方面任一实施方式中的方法。
第七方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如第一方面或第二方面任一实施方式中的方法。
本发明提供一种网络故障定位方法、服务器、采集探针和存储介质,该方法应用于服务器,通过向目标采集探针发送采集请求,以使目标采集探针根据采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,从而使得用户边缘设备根据数据获取请求,向目标采集探针返回当前时刻的客户网络数据,以及使得运营商边缘设备根据数据获取请求,向目标采集探针返回当前时刻的运营商网络数据,其中,目标采集探针部署于客户网络中;然后接收目标采集探针发送的客户网络数据和运营商网络数据,从而根据客户网络数据和运营商网络数据,进行网络故障定位。本案通过在客户网络中部署采集探针,通过采集探针从用户边缘设备获取客户网络数据,以及从运营商边缘设备获取运营商网络数据,从而在发生网络故障时,根据客户网络数据和运营商网络数据,能够实现网络故障定位。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本发明实施例一提供的网络故障定位方法的流程图;
图2为本发明实施例二提供的网络故障定位方法的流程图;
图3为本发明实施例三提供的网络故障定位方法的信令图;
图4为本发明实施例四提供的网络故障定位方法的流程图;
图5为本发明实施例五提供的服务器的结构示意图;
图6为本发明实施例六提供的服务器的结构示意图;
图7为本发明实施例七提供的采集探针的结构示意图;
图8为本发明实施例八提供的服务器的结构示意图;
图9为本发明实施例九提供的采集探针的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
首先对本发明所涉及的名词进行解释:
核心设备(Provide,简称P):是指运营商骨干路由器,其相当于标签交换路由器。
用户边缘设备(Customer Edge,简称CE):是指服务提供商所连接的用户端路由器,通过连接一个或多个运营商网络设备为用户提供服务接入。用户边缘设备通常是一台网际互连协议(Internet Protocol,简称IP)路由器,其与连接的运营商边缘设备建立邻接关系。
运营商边缘设备(Provider Edge,简称PE):是指服务提供商骨干网的边缘路由器,其相当于标签边缘路由器。运营商边缘设备连接用户边缘设备和核心设备,是最重要的网络节点。
服务等级协议(Service-Level Agreement,简称SLA)最根本形式是协议双方(服务提供者和用户)签订的一个合约或协议,这个合约规范了双方的商务关系或部分商务关系。
图1为本发明实施例一提供的网络故障定位方法的流程图,以该方法应用于服务器进行说明,如图1所示,该方法包括:
步骤101:向目标采集探针发送采集请求,以使目标采集探针根据采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得用户边缘设备根据数据获取请求,向目标采集探针返回当前时刻的客户网络数据,以及使得运营商边缘设备根据数据获取请求,向目标采集探针返回当前时刻的运营商网络数据;目标采集探针部署于客户网络中。
其中,目标采集探针可以是嵌入式设备或者是计算机等等。在本实施例中,可预先在客户网络中部署目标采集探针,其中,在一种实现方式中,目标采集探针部署于客户网络中指的是:目标采集探针的实际物理位置是位于运营商网络中,但是其部署在客户网络中,为客户网络提供服务。
在本实施例中,当需要采集数据时,服务器向目标采集探针发送采集请求,通过该采集请求驱动目标采集探针分别向用户边缘设备CE和运营商边缘设备PE发送数据获取请求,从而CE在接收到数据获取请求之后,向目标采集探针返回当前时刻的客户网络数据,以及PE在接收到数据获取请求之后,向目标采集探针返回当前时刻的运营商网络数据。
示例性的,目标采集探针可基于Internet控制报文协议(Internet ControlMessage Protocol,简称ICMP)分别向CE和PE发送数据获取请求。
步骤102:接收目标采集探针发送的客户网络数据和运营商网络数据。
在本实施例中,目标采集探针将从CE返回的客户网络数据、以及从PE返回的运营商网络数据发送给服务器,从而服务器可接收目标采集探针所发送的客户网络数据和运营商网络数据。
步骤103:根据客户网络数据和运营商网络数据,进行网络故障定位。
在本实施例中,服务器可根据客户网络数据和运营商网络数据,进行网络故障定位,以在发生网络故障时,根据客户网络数据和运营商网络数据,能够确定出是客户网络出现了故障,还是运营商网络出现了故障,亦或是客户网络和运营商网络均出现了故障。具体的,在一种实现方式中,可根据客户网络数据,确定客户网络是否出现了网络故障;根据运营商网络数据,确定运营商网络是否出现了网络故障,以此实现网络故障定位。
本申请提供一种网络故障定位方法,通过向目标采集探针发送采集请求,以使目标采集探针根据采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,从而使得用户边缘设备根据数据获取请求,向目标采集探针返回当前时刻的客户网络数据,以及使得运营商边缘设备根据数据获取请求,向目标采集探针返回当前时刻的运营商网络数据,其中,目标采集探针部署于客户网络中;然后接收目标采集探针发送的客户网络数据和运营商网络数据,从而根据客户网络数据和运营商网络数据,进行网络故障定位。本案通过在客户网络中部署采集探针,通过采集探针从用户边缘设备获取客户网络数据,以及从运营商边缘设备获取运营商网络数据,从而在发生网络故障时,根据客户网络数据和运营商网络数据,能够实现网络故障定位。
图2为本发明实施例二提供的网络故障定位方法的流程图,以该方法应用于服务器进行说明,如图2所示,该方法包括:
步骤201:根据采集周期,向目标采集探针发送采集请求,以使目标采集探针根据采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得用户边缘设备根据数据获取请求,向目标采集探针返回当前时刻的客户网络数据,以及使得运营商边缘设备根据数据获取请求,向目标采集探针返回当前时刻的运营商网络数据;目标采集探针部署于客户网络中。
在本实施例中,服务器可按照设置的采集周期,定时向目标采集探针发送采集请求,以实现对客户网络和运营商网络的监控,便于及时发现网络问题,及时进行网络故障定位,从而提升客户运维效率,促进运营商网络质量提升,节省运维成本,进而形成多方面共赢的局面。其中,可根据实际需求将采集周期设定为固定值,或者是,根据实际客户网络的网络质量对采集周期进行不断更新。
在本实施例中,服务器可管理多个采集探针,那么服务器在向目标采集探针发送采集请求之前,还可包括如下步骤:
第一步骤、从所管理的多个采集探针中,确定未处于宕机状态的采集探针;
第二步骤、获取每一未处于宕机状态的采集探针所对应的当前中央处理器使用率、当前内存使用率、以及预设内存分配空间;
第三步骤、根据每一未处于宕机状态的采集探针所对应的当前中央处理器使用率、当前内存使用率、以及预设内存分配空间,确定每一未处于宕机状态的采集探针所对应的负载评分值;
第四步骤、确定负载评分值最高的未处于宕机状态的采集探针,为目标采集探针。
在本实施例中,各采集探针(即采集probe)可以是嵌入式设备或者是计算机等等,对此本发明不作限制。其中,各采集probe的实际物理位置位于运营商网络中,各采集probe预先可部署于同一个客户网络中,也可部署于不同的客户网络中。各采集probe预先注册到服务器上,那么服务器可根据所管理的各采集probe的负载情况,从多个采集probe中确定出一个或多个较优的采集probe,并将各较优的采集probe均作为目标采集probe,以通过目标采集probe实现对运营商网络和当前的客户网络之间的故障定位。
具体的,首先,服务器从所管理的多个采集probe中确定未处于宕机状态的采集probe,或者是说从多个采集probe中确定处于存活状态的采集probe,其中,在一种实现方式中,服务器可向每个采集probe发送报文,若在一定时间内接收到采集probe返回的回包,则确定该采集probe未处于宕机状态,若在一定时间内未接收到采集probe返回的回包,则可确定该采集probe处于宕机状态。然后,服务器针对每一未处于宕机状态的采集probe,从每一未处于宕机状态的采集probe中获取其当前中央处理器(central processing unit,简称CPU)使用率、当前内存使用率、以及预设内存分配空间。之后,服务器可根据每一未处于宕机状态的采集probe中所对应的当前CPU使用率、当前内存使用率、以及预设内存分配空间,计算每一未处于宕机状态的probe的负载评分值。其中,在一种实现方式中,针对每一未处于宕机状态的采集probe,可将该未处于宕机状态的采集probe所对应的当前CPU使用率、当前内存使用率、以及预设内存分配空间的加权之和,作为该未处于宕机状态的采集probe的负载评分值。最后,服务器在确定每一未处于宕机状态的采集probe所对应的负载评分值之后,可将负载评分值最高的未处于宕机状态的采集probe,确定为目标采集probe。上述仅是以确定一个目标采集probe为例,还可将负载评分值相对最高的前M个未处于宕机状态的采集probe均作为目标采集probe,其中,M为大于1的正整数,M的值可根据实际需求预先进行设置。从而服务器可向目标采集probe发送采集请求,其中,采集请求中也可携带有需要采集的指标参数,以使得目标采集probe在向CE和PE发送数据获取请求时,将采集请求中所携带的指标参数携带早数据获取请求中,以使得CE和PE根据数据获取请求中所携带的指标参数,向目标采集probe返回当前时刻的客户网络数据、运营商网络数据。优选的,目标采集probe可以ping操作的形式分别向CE和PE发送数据获取请求。
另外,为提高处理效率,可仅在客户网络发生较大布局变化时,且在向目标采集probe发送采集请求之前,服务器执行上述第一步骤至第四步骤,以确定新的目标采集probe,接下来服务器向新的目标采集probe发送采集请求,以驱动新的目标采集probe向客户网络侧的CE和运营商网络侧的PE分别发送数据获取请求。
步骤202:接收目标采集探针发送的客户网络数据和运营商网络数据。
步骤203:根据客户网络数据,确定客户网络对应的各服务等级协议指标,以及根据运营商网络数据,确定运营商网络对应的各服务等级协议指标。
实际应用中,服务等级协议(Service-Level Agreement,简称SLA)指标包括以下中的任一项:延迟、抖动率、吞吐量、丢包率。其中,客户网络对应的部分SLA指标可基于所获取到的客户网络数据,直接获取到,如客户网络对应的吞吐量、丢包率;而客户网络对应的一些SLA指标需要基于客户网络数据进行计算,如客户网络对应的延迟、抖动率。同理,运营商网络对应的部分SLA指标可基于所获取到的运营商网络数据,直接获取到,如运营商网络对应的吞吐量、丢包率;而运营商网络对应的一些SLA指标需要基于运营商网络数据进行计算,如运营商网络对应的延迟、抖动率。下面对各SLA指标进行解释,针对延迟和抖动率可通过如下对应的公式计算得到。
其中,吞吐量是指单位时间内,某个节点发送和接收的数据量,单位一般是b/s。
丢包率(Loss Tolerance或packet loss rate):指测试中所丢失数据包数量占所发送数据包的比率,通常在吞吐量范围内测试。丢包率与数据包长度以及包发送频率相关。通常,千兆网卡在流量大于200Mbps时,丢包率小于万分之五;百兆网卡在流量大于60Mbps时,丢包率小于万分之一。
延迟是指数据包的接收时间与发送时间之差;接收端节点N[2]接收到数据包的时间减去发送端节点N[1]发出数据包的时间,就是端到端延迟,其公式为,端到端延迟=数据包的接收时间-数据包的发送时间。
抖动率=(数据包P[j]的延迟-数据包P[i]的延迟)/(数据包P[j]的序号j-数据包P[i]的序号i);其中,数据包P[j]的延迟=数据包P[j]的接收时间-数据包P[j]的发送时间;数据包P[i]的延迟=数据包P[i]的接收时间-数据包P[i]的发送时间。
步骤204:根据客户网络对应的各服务等级协议指标,确定客户网络是否出现故障;根据运营商网络对应的各服务等级协议指标,确定运营商网络是否出现故障。
在本实施例中,在确定出客户网络对应的各SLA指标,可根据客户网络所对应的各SLA指标,确定客户网络是否出现故障。具体的,可根据客户网络所对应的各SLA指标、以及在客户网络下各SLA指标分别对应的指标门限值,确定客户网络是否出现故障,其中,在一种实现方式中,当客户网络所对应的各SLA指标中,只要存在一个SLA指标小于(也可能是大于等于,具体的判断标准应以具体得SLA指标而定)相应的指标门限值时,则确定客户网络出现故障,举例来说,针对丢包率,若丢包率大于等于客户网络下丢包率所对应的指标门限值,则可确定客户网络出现了故障。在确定出运营商网络对应的各SLA指标,可根据运营商网络所对应的各SLA指标,确定运营商网络是否出现故障。具体的,可根据运营商网络所对应的各SLA指标、以及在运营商网络下各SLA指标分别对应的指标门限值,确定运营商网络是否出现故障,其中,在一种实现方式中,当运营商网络所对应的各SLA指标中,只要存在一个SLA指标小于(也可能是大于等于,具体的判断标准应以具体得SLA指标而定)相应的指标门限值时,则确定运营商网络出现故障,举例来说,针对丢包率,若丢包率大于等于运营商网络下丢包率所对应的指标门限值,则可确定运营商网络出现了故障。上述仅是给出一种示例,本发明并不局限于此。
在本实施例中,在确定客户网络对应的各服务等级协议指标之后,还可包括以下步骤:
第一步骤、根据当前所确定的所述客户网络对应的各服务等级协议指标、以及上一次所确定的所述客户网络对应的各服务等级协议指标,确定所述客户网络的网络质量变化趋势;
第二步骤、根据所述客户网络的网络质量变化趋势,对所述采集周期进行更新。
在本实施例中,为及时发现网络故障,减轻网络压力,可根据客户网络的网络质量对采集周期进行更新。具体的,根据当前所确定的客户网络对应的各SLA指标与上一次所确定的客户网络对应的相应SLA指标之间的比较结果,确定客户网络的网络质量变化趋势。其中,在一种实现方式中,当客户网络的网络质量变化趋势呈上升时,可适当增加采集周期,如之前采集周期为40秒,现在将采集周期调整至50秒,其中,采集周期的最大粒度为1小时;当客户网络的网络质量变化趋势呈下降时,可适当缩短采集周期,如之前采集周期为40秒,现在将采集周期调整至30秒。另外,当确定客户网络出现故障时,可直接将采集周期调整为最小周期,其中,最小周期可根据实际情况进行设置,如最小周期为10秒,并进行报警处理。
本实施例通过按照采集周期,定时向目标采集探针发送采集请求,以实现对客户网络和运营商网络的监控,便于及时发现网络问题,及时进行网络故障定位,从而提升客户运维效率,促进运营商网络质量提升,节省运维成本,进而形成多方面共赢的局面;以及根据客户网络的网络质量对采集周期进行不断更新,可在减轻网络压力、不影响网络质量的情况下,实现对客户网络和运营商网络的网络质量监控。
图3为本发明实施例三提供的网络故障定位方法的信令图,如图3所示,该方法包括:
步骤301:服务器根据采集周期,向采集探针发送采集请求。
步骤302:采集探针根据采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求。
步骤303:用户边缘设备根据数据获取请求,向采集探针返回当前时刻的客户网络数据;运营商边缘设备根据数据获取请求,向采集探针返回当前时刻的运营商网络数据。
步骤304:采集探针向服务器发送客户网络数据和运营商网络数据。
步骤305:服务器根据客户网络数据,确定客户网络对应的各服务等级协议指标,以及根据运营商网络数据,确定运营商网络对应的各服务等级协议指标。
步骤306:服务器根据客户网络对应的各服务等级协议指标,确定客户网络是否出现故障;根据运营商网络对应的各服务等级协议指标,确定运营商网络是否出现故障。
在本实施例中,上述步骤301至步骤306,具体可参照实施例一或实施例二中的解释,此处不再赘述。
图4为本发明实施例四提供的网络故障定位方法的流程图,以该方法应用于采集探针进行说明,如图4所示,该方法包括:
步骤401:接收服务器发送的采集请求,并根据采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得用户边缘设备根据数据获取请求,向采集探针返回当前时刻的客户网络数据,以及使得运营商边缘设备根据数据获取请求,向采集探针返回当前时刻的运营商网络数据;
步骤402:向服务器发送客户网络数据和运营商网络数据,以使服务器根据客户网络数据和运营商网络数据,进行网络故障定位。
本申请提供一种网络故障定位方法,在接收到服务器发送的采集请求后,根据采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,从而使得用户边缘设备根据数据获取请求,向采集探针返回当前时刻的客户网络数据,以及使得运营商边缘设备根据数据获取请求,向采集探针返回当前时刻的运营商网络数据,其中,采集探针部署于客户网络中;然后将客户网络数据和运营商网络数据发送给服务器,从而使得服务器根据客户网络数据和运营商网络数据,进行网络故障定位。本案通过在客户网络中部署采集探针,通过采集探针从用户边缘设备获取客户网络数据,以及从运营商边缘设备获取运营商网络数据,从而在发生网络故障时,根据客户网络数据和运营商网络数据,能够实现网络故障定位。
图5为本发明实施例五提供的服务器的结构示意图,如图5所示,该装置包括:
发送单元501,用于向目标采集探针发送采集请求,以使目标采集探针根据采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得用户边缘设备根据数据获取请求,向目标采集探针返回当前时刻的客户网络数据,以及使得运营商边缘设备根据数据获取请求,向目标采集探针返回当前时刻的运营商网络数据;目标采集探针部署于客户网络中;
接收单元502,用于接收目标采集探针发送的客户网络数据和运营商网络数据;
处理单元503,用于根据客户网络数据和运营商网络数据,进行网络故障定位。
本实施例提供的服务器,同于实现前述实施例一提供的网络故障定位方法中的技术方案,其实现原理和技术效果类似,不再赘述。
图6为本发明实施例六提供的服务器的结构示意图,在实施例五的基础上,如图6所示,
处理单元503,具体用于根据客户网络数据,确定客户网络对应的各服务等级协议指标;以及根据运营商网络数据,确定运营商网络对应的各服务等级协议指标;根据客户网络对应的各服务等级协议指标,确定客户网络是否出现故障;根据运营商网络对应的各服务等级协议指标,确定运营商网络是否出现故障。
优选的,发送单元501,具体用于根据采集周期,向目标采集探针发送采集请求;
处理单元503,还用于在确定客户网络对应的各服务等级协议指标之后,根据当前所确定的客户网络对应的各服务等级协议指标、以及上一次所确定的客户网络对应的各服务等级协议指标,确定客户网络的网络质量变化趋势;根据客户网络的网络质量变化趋势,对采集周期进行更新。
优选的,服务器,还包括:
确定单元601,用于在发送单元501向采集探针发送采集请求之前,从所管理的多个采集探针中,确定未处于宕机状态的采集探针;获取每一未处于宕机状态的采集探针所对应的当前中央处理器使用率、当前内存使用率、以及预设内存分配空间;根据每一未处于宕机状态的采集探针所对应的当前中央处理器使用率、当前内存使用率、以及预设内存分配空间,确定每一未处于宕机状态的采集探针所对应的负载评分值;确定负载评分值最高的未处于宕机状态的采集探针,为目标采集探针。
优选的,服务等级协议指标包括以下中的任一项:延迟、抖动率、吞吐量、丢包率。
本实施例提供的服务器,同于实现前述实施例二提供的网络故障定位方法中的技术方案,其实现原理和技术效果类似,不再赘述。
图7为本发明实施例七提供的采集探针的结构示意图,如图7所示,该装置包括:
接收单元701,用于接收服务器发送的采集请求;
第一发送单元702,用于并根据采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得用户边缘设备根据数据获取请求,向目标采集探针返回当前时刻的客户网络数据,以及使得运营商边缘设备根据数据获取请求,向目标采集探针返回当前时刻的运营商网络数据;
第二发送单元703,用于向服务器发送客户网络数据和运营商网络数据,以使服务器根据客户网络数据和运营商网络数据,进行网络故障定位。
本实施例提供的采集探针,同于实现前述实施例四提供的网络故障定位方法中的技术方案,其实现原理和技术效果类似,不再赘述。
图8为本申请实施例八提供的服务器的结构示意图,如图8所示,包括:存储器801和处理器802;
存储器801,用于存储计算机程序;
其中,处理器802执行存储器801中的计算机程序,以实现实施例一或实施例二中的方法。
图9为本申请实施例九提供的采集探针的结构示意图,如图9所示,包括:存储器901和处理器902;
存储器901,用于存储计算机程序;
其中,处理器902执行存储器901中的计算机程序,以实现任一实施例的方法。
本申请提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行以实现实施例四中的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (14)

1.一种网络故障定位方法,其特征在于,应用于服务器,所述方法,包括:
向目标采集探针发送采集请求,以使所述目标采集探针根据所述采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得所述用户边缘设备根据所述数据获取请求,向所述目标采集探针返回当前时刻的客户网络数据,以及使得所述运营商边缘设备根据所述数据获取请求,向所述目标采集探针返回当前时刻的运营商网络数据;所述目标采集探针部署于客户网络中;
接收所述目标采集探针发送的所述客户网络数据和所述运营商网络数据;
根据所述客户网络数据和所述运营商网络数据,进行网络故障定位。
2.根据权利要求1所述的方法,其特征在于,根据所述客户网络数据和所述运营商网络数据,进行网络故障定位,包括:
根据所述客户网络数据,确定所述客户网络对应的各服务等级协议指标;以及根据所述运营商网络数据,确定运营商网络对应的各服务等级协议指标;
根据所述客户网络对应的各服务等级协议指标,确定所述客户网络是否出现故障;根据所述运营商网络对应的各服务等级协议指标,确定所述运营商网络是否出现故障。
3.根据权利要求2所述的方法,其特征在于,所述向目标采集探针发送采集请求,包括:根据采集周期,向所述目标采集探针发送采集请求;
在确定所述客户网络对应的各服务等级协议指标之后,还包括:
根据当前所确定的所述客户网络对应的各服务等级协议指标、以及上一次所确定的所述客户网络对应的各服务等级协议指标,确定所述客户网络的网络质量变化趋势;
根据所述客户网络的网络质量变化趋势,对所述采集周期进行更新。
4.根据权利要求1-3任一项所述的方法,其特征在于,在所述向目标采集探针发送采集请求之前,还包括:
从所管理的多个采集探针中,确定未处于宕机状态的采集探针;
获取每一未处于宕机状态的采集探针所对应的当前中央处理器使用率、当前内存使用率、以及预设内存分配空间;
根据每一未处于宕机状态的采集探针所对应的当前中央处理器使用率、当前内存使用率、以及预设内存分配空间,确定每一未处于宕机状态的采集探针所对应的负载评分值;
确定负载评分值最高的未处于宕机状态的采集探针,为所述目标采集探针。
5.根据权利要求2或3所述的方法,其特征在于,服务等级协议指标包括以下中的任一项:延迟、抖动率、吞吐量、丢包率。
6.一种网络故障定位方法,其特征在于,应用于采集探针,所述采集探针部署于客户网络中;所述方法,包括:
接收服务器发送的采集请求;
根据所述采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得所述用户边缘设备根据所述数据获取请求,向所述采集探针返回当前时刻的客户网络数据,以及使得所述运营商边缘设备根据所述数据获取请求,向所述采集探针返回当前时刻的运营商网络数据;
向所述服务器发送所述客户网络数据和所述运营商网络数据,以使所述服务器根据所述客户网络数据和所述运营商网络数据,进行网络故障定位。
7.一种服务器,其特征在于,包括:
发送单元,用于向目标采集探针发送采集请求,以使所述目标采集探针根据所述采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得所述用户边缘设备根据所述数据获取请求,向所述目标采集探针返回当前时刻的客户网络数据,以及使得所述运营商边缘设备根据所述数据获取请求,向所述目标采集探针返回当前时刻的运营商网络数据;所述目标采集探针部署于客户网络中;
接收单元,用于接收所述目标采集探针发送的所述客户网络数据和所述运营商网络数据;
处理单元,用于根据所述客户网络数据和所述运营商网络数据,进行网络故障定位。
8.根据权利要求7所述的服务器,其特征在于,所述处理单元,具体用于根据所述客户网络数据,确定所述客户网络对应的各服务等级协议指标;以及根据所述运营商网络数据,确定运营商网络对应的各服务等级协议指标;根据所述客户网络对应的各服务等级协议指标,确定所述客户网络是否出现故障;根据所述运营商网络对应的各服务等级协议指标,确定所述运营商网络是否出现故障。
9.根据权利要求8所述的服务器,其特征在于,所述发送单元,具体用于根据采集周期,向所述目标采集探针发送采集请求;
所述处理单元,还用于在确定所述客户网络对应的各服务等级协议指标之后,根据当前所确定的所述客户网络对应的各服务等级协议指标、以及上一次所确定的所述客户网络对应的各服务等级协议指标,确定所述客户网络的网络质量变化趋势;根据所述客户网络的网络质量变化趋势,对所述采集周期进行更新。
10.根据权利要求7-9任一项所述的服务器,其特征在于,所述服务器,还包括:
确定单元,用于在所述发送单元向采集探针发送采集请求之前,从所管理的多个采集探针中,确定未处于宕机状态的采集探针;获取每一未处于宕机状态的采集探针所对应的当前中央处理器使用率、当前内存使用率、以及预设内存分配空间;根据每一未处于宕机状态的采集探针所对应的当前中央处理器使用率、当前内存使用率、以及预设内存分配空间,确定每一未处于宕机状态的采集探针所对应的负载评分值;确定负载评分值最高的未处于宕机状态的采集探针,为所述目标采集探针。
11.一种采集探针,其特征在于,所述采集探针部署于客户网络中,所述采集探针,包括:
接收单元,用于接收服务器发送的采集请求;
第一发送单元,用于根据所述采集请求,分别向用户边缘设备和运营商边缘设备发送数据获取请求,使得所述用户边缘设备根据所述数据获取请求,向所述采集探针返回当前时刻的客户网络数据,以及使得所述运营商边缘设备根据所述数据获取请求,向所述采集探针返回当前时刻的运营商网络数据;
第二发送单元,用于向所述服务器发送所述客户网络数据和所述运营商网络数据,以使所述服务器根据所述客户网络数据和所述运营商网络数据,进行网络故障定位。
12.一种服务器,其特征在于,包括:存储器和处理器;
所述存储器,用于存储计算机程序;
其中,所述处理器执行所述存储器中的计算机程序,以实现如权利要求1-5任一项所述的方法。
13.一种采集探针,其特征在于,包括:存储器和处理器;
所述存储器,用于存储计算机程序;
其中,所述处理器执行所述存储器中的计算机程序,以实现如权利要求6所述的方法。
14.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-6任一项所述的方法。
CN201911360145.1A 2019-12-25 2019-12-25 网络故障定位方法、服务器、采集探针和存储介质 Active CN111049691B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911360145.1A CN111049691B (zh) 2019-12-25 2019-12-25 网络故障定位方法、服务器、采集探针和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911360145.1A CN111049691B (zh) 2019-12-25 2019-12-25 网络故障定位方法、服务器、采集探针和存储介质

Publications (2)

Publication Number Publication Date
CN111049691A true CN111049691A (zh) 2020-04-21
CN111049691B CN111049691B (zh) 2022-06-10

Family

ID=70239752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911360145.1A Active CN111049691B (zh) 2019-12-25 2019-12-25 网络故障定位方法、服务器、采集探针和存储介质

Country Status (1)

Country Link
CN (1) CN111049691B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112152879A (zh) * 2020-09-18 2020-12-29 腾讯科技(深圳)有限公司 网络质量确定方法、装置、电子设备和可读存储介质
CN112242937A (zh) * 2020-10-13 2021-01-19 腾讯科技(深圳)有限公司 一种网络测速方法、装置及计算机可读介质
CN113839834A (zh) * 2021-09-26 2021-12-24 云智慧(北京)科技有限公司 一种微信小程序数据采集探针
CN113965512A (zh) * 2021-10-14 2022-01-21 杭州东方通信软件技术有限公司 一种面向mpls vpn客户的网络质量测量方法及电子设备
CN114826979A (zh) * 2022-04-07 2022-07-29 中国联合网络通信集团有限公司 网络链路质量获取方法、装置、系统、设备及存储介质
CN115396336A (zh) * 2022-08-01 2022-11-25 南京网元通信技术有限公司 一种基于软件仿真的mpls vpn集客专线主动测试方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080222282A1 (en) * 2007-03-05 2008-09-11 Cisco Technology, Inc. Analyzing virtual private network failures
CN103929341A (zh) * 2014-04-30 2014-07-16 北京瑞汛世纪科技有限公司 网络性能的测量方法、服务器、网络探针和系统
CN103929342A (zh) * 2014-04-30 2014-07-16 北京瑞汛世纪科技有限公司 一种网络性能的测量方法、设备和系统
CN107835098A (zh) * 2017-11-28 2018-03-23 车智互联(北京)科技有限公司 一种网络故障检测方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080222282A1 (en) * 2007-03-05 2008-09-11 Cisco Technology, Inc. Analyzing virtual private network failures
CN103929341A (zh) * 2014-04-30 2014-07-16 北京瑞汛世纪科技有限公司 网络性能的测量方法、服务器、网络探针和系统
CN103929342A (zh) * 2014-04-30 2014-07-16 北京瑞汛世纪科技有限公司 一种网络性能的测量方法、设备和系统
CN107835098A (zh) * 2017-11-28 2018-03-23 车智互联(北京)科技有限公司 一种网络故障检测方法及系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112152879A (zh) * 2020-09-18 2020-12-29 腾讯科技(深圳)有限公司 网络质量确定方法、装置、电子设备和可读存储介质
WO2022057727A1 (zh) * 2020-09-18 2022-03-24 腾讯科技(深圳)有限公司 网络质量确定方法、装置、电子设备和可读存储介质
CN112152879B (zh) * 2020-09-18 2023-05-26 腾讯科技(深圳)有限公司 网络质量确定方法、装置、电子设备和可读存储介质
CN112242937A (zh) * 2020-10-13 2021-01-19 腾讯科技(深圳)有限公司 一种网络测速方法、装置及计算机可读介质
CN112242937B (zh) * 2020-10-13 2024-03-08 腾讯科技(深圳)有限公司 一种网络测速方法、装置、电子设备及计算机可读介质
CN113839834A (zh) * 2021-09-26 2021-12-24 云智慧(北京)科技有限公司 一种微信小程序数据采集探针
CN113965512A (zh) * 2021-10-14 2022-01-21 杭州东方通信软件技术有限公司 一种面向mpls vpn客户的网络质量测量方法及电子设备
CN114826979A (zh) * 2022-04-07 2022-07-29 中国联合网络通信集团有限公司 网络链路质量获取方法、装置、系统、设备及存储介质
CN114826979B (zh) * 2022-04-07 2023-08-15 中国联合网络通信集团有限公司 网络链路质量获取方法、装置、系统、设备及存储介质
CN115396336A (zh) * 2022-08-01 2022-11-25 南京网元通信技术有限公司 一种基于软件仿真的mpls vpn集客专线主动测试方法

Also Published As

Publication number Publication date
CN111049691B (zh) 2022-06-10

Similar Documents

Publication Publication Date Title
CN111049691B (zh) 网络故障定位方法、服务器、采集探针和存储介质
US11799793B2 (en) Adaptive private network with dynamic conduit process
US10917322B2 (en) Network traffic tracking using encapsulation protocol
US10033602B1 (en) Network health management using metrics from encapsulation protocol endpoints
US11722391B2 (en) Dynamic prediction and management of application service level agreements
US9980163B2 (en) Admission control for allowing or rejecting a measurement request between a first and a second device
EP3295612B1 (en) Uplink performance management
US9584396B2 (en) Label-based measurement method, apparatus, and system
EP2681871B1 (en) In-service throughput testing in distributed router/switch architectures
US20220278904A1 (en) Method, Apparatus, and System for Sending Packet and Receiving Packet to Perform OAM
WO2007073649A1 (fr) Procede et systeme pour obtenir une unite de transfert maximale de voie dans un reseau
US10623278B2 (en) Reactive mechanism for in-situ operation, administration, and maintenance traffic
WO2018103665A1 (zh) 基于l2tp的设备管理方法、设备及系统
WO2011123003A1 (en) An operations, administrations and management proxy and a method for handling operations, administrations and management messages
EP2279589A1 (en) Methods and apparatus for advertising a route for transmitting data packets
CN106797330A (zh) 用于监测内容递送网络(cdn)的方法、业务监测器(tm)、请求路由器(rr)和系统
CN108924011A (zh) 用于ospf+路由协议的监测系统、相关设备、方法及介质
JP5942660B2 (ja) フレームロス測定装置、伝送装置、通信システム及び性能測定方法
CN107295119A (zh) 一种基于异构网络的信息采集系统及方法
CN109688031B (zh) 一种网络监控方法及相关设备
EP4195763A1 (en) Packet processing method and related device
Baek et al. An enhancement of mSCTP handover with an adaptive primary path switching scheme
CN114698003A (zh) 一种网络性能检测的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant