CN104221327B - 用于网络可用性分析的方法和装置 - Google Patents

用于网络可用性分析的方法和装置 Download PDF

Info

Publication number
CN104221327B
CN104221327B CN201380018852.7A CN201380018852A CN104221327B CN 104221327 B CN104221327 B CN 104221327B CN 201380018852 A CN201380018852 A CN 201380018852A CN 104221327 B CN104221327 B CN 104221327B
Authority
CN
China
Prior art keywords
network
measurement
router
routing
flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380018852.7A
Other languages
English (en)
Other versions
CN104221327A (zh
Inventor
克拉伦斯·菲尔斯菲斯
大卫·沃德
克里斯托弗尔·Y·梅特茨
彼得·德·韦瑞恩德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cisco Technology Inc
Original Assignee
Cisco Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cisco Technology Inc filed Critical Cisco Technology Inc
Publication of CN104221327A publication Critical patent/CN104221327A/zh
Application granted granted Critical
Publication of CN104221327B publication Critical patent/CN104221327B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/70Routing based on monitoring results
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions

Abstract

在一个实施例中,一种方法包括:在网络设备处接收来自多个路由器的路由收敛测量和流量需求测量;以及基于所述测量在所述网络设备处计算网络可用性。所述路由收敛测量与路由器处的路由计算相关,并且所述流量需求测量包括与路由器相关的需求矩阵的部分。本文还公开了一种装置和逻辑。

Description

用于网络可用性分析的方法和装置
相关申请声明
本申请要求于2012年4月9日提交的题为“NETWORK AVAILABILITY ANALYTICS”(网络可用性分析)的美国临时申请No.61/621811(代理人案号No.CISCP1224+)的优先权。该临时申请的全部内容被通过引用结合于此。
技术领域
本公开一般涉及通信网络,并且更详细地,涉及网络可用性(availability)测量和计算。
背景技术
对于网络(例如那些提供高端服务的网络)而言,网络可用性变得越来越重要。需要高可用性网络以实现质量目标、提供有竞争力的服务以及最小化持续运营开销。在传统网络中,网络收敛和可用性测量经常涉及遍及网络注射探针。该技术不能很好地测量并且受到精确性和完整性问题的困扰。
附图说明
图1示出了本文所述的实施例可在其中实现的网络示例。
图2示出了可用于实现本文所述的实施例的网络设备示例。
图3是示出了根据一个实施例的用于计算网络可用性的过程概述的流程图。
图4是示出了根据一个实施例的在图1的网络中的离线工具和路由器上的网络可用性应用编程接口的组件的框图。
图5示出了本文所述的实施例可在其中实现的网络的另一示例。
贯穿附图的多个视图,相应的参考字符指示相应的部分。
具体实施方式
概述
在一个实施例中,一种方法一般包括:在网络设备处接收来自多个路由器的路由收敛(route convergence)测量和流量需求(traffic demand)测量;以及基于所述测量计算网络可用性。所述路由收敛测量与路由器处的路由计算相关,并且所述流量需求测量包括与路由器相关的需求矩阵的部分。
在另一实施例中,一种装置一般包括:用于在路由器上生成路由收敛测量和流量需求测量的处理器;用于存储所述路由收敛测量和所述流量需求测量的存储器;以及用于向可操作为从网络中的多个路由器收集多个所述路由收敛测量和流量需求测量并基于所述测量计算网络可用性的网络设备提供所述路由收敛测量和所述流量需求测量的应用编程接口。
在另一实施例中,逻辑被编码在一个或多个有形计算机可读介质上以用于执行,当被执行时该逻辑可操作来:生成路由收敛测量;以及向可操作来从网络中的多个路由器收集多个所述路由收敛测量和流量需求测量、并基于测量计算网络可用性的网络设备提供所述路由收敛测量。所述路由收敛测量与路由器处的路由计算相关,并且所述流量需求测量包括与路由器相关的需求矩阵的部分。
示例性实施例
给出以下说明以使本领域普通技术人员达成并使用实施例。具体实施例和应用的说明仅作为示例提供,且对本领域技术人员而言,显然可对其进行各种修改。在不脱离实施例的范围的情况下,本文所述的一般原则可应用于其它应用。因此,实施例不限于所示实施例,而要符合与本文所述的原则和特征一致的最广范围。为简洁起见,关于在与实施例相关的技术领域中所熟知的技术材料的细节未详细说明。
高网络可用性和较快速的收敛需求导致对网络性能的监测和评估的需求。由于网络规模大、测量参数小、收敛事件的不可预测性以及正确评估收敛性能所需的细节等级,从而导致监测网络收敛的难度升高。传统系统经常遍及网络注入探针来测量关键度量。但是,该技术不能很好地测量并且受到精确性问题的困扰。例如,在毫秒时间尺度测量所提供的探针不足。由于探针不能被发送到网络所有可能的路径上,因此还存在完整性问题。另一缺陷是探针只可报告问题,不能标识其位置或提供分析问题起因所需的细节。此外,需要网络可用性信息的应用不得不与多个系统交互,该多个系统甚至不能提供正确计算网络可用性所需的数据。
本文所述的实施例采用路由器提供的路由收敛和流量需求测量来计算网络可用性。详细说明如下,离线工具(应用)可被用于收集路由收敛和流量需求测量。在一个实施例中,该信息通过应用编程接口提供。网络可用性API可被用于从一个或多个网络中的源提取网络可用性信息。之前传统系统不可用的运营统计在组织清晰的数据库中提供,数据库具有明确定义的API以允许第三方应用开发。例如,网络可用性API可允许其它应用记录其对于指定位置(例如,特定消费者端口或目的地)或服务的可用性数据的兴趣(interest)。这可使各种应用被告知网络服务的可用性并采取任何必要的措施来提高网络服务的可用性。统一编程接口促进了能够利用精确的网络可用性信息的多个应用的开发和实现。
现在参考附图,首先参考图1,本文所述的实施例可在其中实现的网络的示例被示出。为简化起见,只示出了少量节点。实施例在包括多个网络设备的数据通信网络的环境下实施。网络可包括通过任意数量的节点进行通信的任意数量的网络设备(例如,路由器、交换机或其它网络设备),该网络设备促进了网络中数据的通过。
示于图1的示例中的网络15包括:源10、目的地12和通过链路16连接的多个路由器14(R1、R2、R3、R4、R5、R6)。路由器14可为配置为执行路由功能的任意网络设备(例如,路由器、交换机/路由器)。路由器14可位于例如,服务提供商网络或任意其它网络。源节点和目的地节点10、12可为边缘路由器或任意其它网络设备。在一个实施例中,网络可用性(NA)API 18位于一个或多个路由器上。在图1所示的示例中,每个路由器10、12、14配置为用于网络可用性分析(NAA);但是,网络中可能存在一个或多个路由器未配置为用于NAA。
离线规划工具(OT)20可位于与路由器相同的网络中或另一网络中的网络设备21(管理站、服务器或其它网络设备)上。离线工具20还可分布于两个或更多网络设备中。如下面关于图4的说明,离线工具20可包括网络可用性分析应用或其它位于网络设备21的应用。离线工具20在网络可用性计算中,使用路由收敛和流量需求测量。网络可用性计算可用于例如,对于任意流通在几毫秒的精度标识以端到端(end-to-end)方式的运营网络中的网络收敛和网络可用性。
在一个实施例中,网络可用性是使用路由收敛监测和诊断(RCMD)以及分布需求矩阵(DDM)数据来计算的。RCMD和DDM数据的收集和计算的示例将在下面进一步说明。在一个示例中,网络可用性是基于由所有路由收敛事件引起的流量丢失量和指定时间周期内进入网络的流量量来计算的。路由收敛事件的示例下面相对于图1进行说明。
在图1所示的示例中,在网络故障之前,数据包(例如,从源10到目的地12的流量或流量的子集)遵循第一路径22。在T0时刻,在路由器R6和目的地12之间发生了链路故障。在T1时刻,网络中的一个或多个路由器14识别该链路故障,并通知故障的重路由路由器。在T2时刻,网络收敛且所有流量到达目的地12。端到端网络收敛指的是网络中所有路由器适应拓扑结构的变化所用的时间。在一个实施例中,路由器R4将流量从路径22重路由到路径24上。在此示例中,拓扑结构中的路由器14一旦将流量从路径22重路由到路径24上,需求(S,D)的连通性损失就结束。
如图1的示例所示,网络15可包括用于从源10到目的地12传输数据的任意数量的替换路径。网络可基于例如,带宽或链路开销,收敛于一个或多个路径。详细说明如下,离线工具20可采用交互过程来发现端到端路径何时变为有效。离线工具20可选择特定事件(例如,路由器R6和目的地12之间的链路故障)和特定需求(例如,从源10到目的地12的流量)并且计算对于从源到目的地的流通的端到端收敛,因此得到从源10看的目的地12的网络可用性。然后对于每个事件的每个需求重复同一过程。如上所述,离线工具20可用于定期计算网络可用性。
应该理解的是,图1所示的网络只是示例,并且在不脱离实施例的范围的情况下,可使用包含不同数量或类型的网络设备或拓扑的网络。
图2示出了可用于实现本文所述的实施例的网络设备30(例如,路由器)的示例。在一个实施例中,网络设备30是可在硬件、软件或其任意组合中实现的可编程机器。网络设备30包括一个或多个处理器32、存储器34、网络接口36、NA(Network Availability,网络可用性)API 18、RCMD模块38和DDM模块39。
存储器34可为存储各种应用、操作系统、模块和处理器32用于执行和使用的数据的易失性存储器或非易失性存储设备。NA API模块18、RCMD模块38和DDM模块39可包括例如,软件或存储于存储器34中的代码。
逻辑可在一个或多个有形媒介中编码以由处理器32知行。例如,处理器32可执行存储于计算机可读媒介(例如,存储器34)中的代码。计算机可读媒介可为例如,电子的(例如,RAM(randomaccess memory,随机存取存储器)、ROM(read-only memory,只读存储器)、EPROM(erasable programmable read-only memory,可擦除可编程只读存储器))、磁的、光学的(例如,CD、DVD)、电磁的、半导体技术或任意其它适当的媒介。
网络接口36可包括用于接收数据或向其它设备发送数据的任意数量的接口(线卡、端口)。网络接口36可包括例如,用于连接到计算机或网络的以太网接口。
应该理解的是,图2所示及上述网络设备30只是示例,且可采用网络设备的不同配置。例如,网络设备30可进一步包括硬件、软件、算法、处理器、设备、组件或可操作以促进上述功能的元件的任意适当的组合。
包括离线工具20的网络设备21(图1)也可包括如上所述的处理器、存储器和网络接口。
图3是示出了根据一个实施例的用于计算网络可用性的过程概述的流程图。在步骤40,网络设备(例如,图1中包括离线工具/应用20的网络设备21)从多个路由器(例如,图1中的路由器10、12、14)接收路由收敛和流量需求测量。路由收敛测量与路由器上的路由计算相关联,并且流量需求测量包括与路由器相关联的需求矩阵的部分。每个配置为生成网络可用性数据的路由器可提供路由收敛测量、流量需求测量、或路由收敛测量和流量需求测量二者。例如,如果路由器不是边缘设备,则它只可提供路由收敛测量。此外,一些测量可在一个或多个路由器上收集并传递给网络设备21。
在步骤42,网络设备21计算网络可用性。网络可用性可包括网络服务的可用性、网络收敛时间或任意其它网络可用性统计。例如,网络设备21可选择特定事件和需求,并计算对于从源到目的地的流通的端到端收敛,并对每个事件的每个需求重复该过程。网络设备21可请求对于特定资源、服务或需求的网络可用性数据,并基于周期计算网络广泛可用性。
再次参考图1,以下示例说明了离线工具20如何计算对于从源10到目的地12的流通的端到端收敛时间并得到从源看的目的地的网络可用性。
离线工具20设置T0为路由器R6和目的地12之间的链路故障的时刻。如下所述,该信息可从路由收敛测量(例如,RCMD数据)获得。离线工具20设置Top1为恰好在T0时刻之前的拓扑结构。在恰好在故障之前的拓扑结构Top1中从源10到目的地12的最短路径被标识为SPT(SD,Top1)。在此示例中,SPT(SD,Top1)是源->R4->R5->R6->目的地的路径。
SPT(SD,Top1)中的路由器一旦将去往目的地12(原先在路由1上(例如,路径22))的流量重路由到有效路径(路由2(例如,路径24))上,需求[S,D]的连通性损失就结束。离线工具20在收集的RCMD数据中查找路由1。一旦R4、R5或R6各自重路由它们到目的地12的路径,经由节点到目的地的端到端路径即为有效。这是因为它们各自的邻居中的每一个采用的到目的地的路径独立于路由器R6与目的地之间的的链路的状态。例如,R1到目的地的路径为R1->R2->R3->目的地,而R2到目的地的路径为R2->R3->目的地。在这种情况下,新路径的有效性是明确的。
离线工具对于路由2的验证需要交互的过程。在一个实施例中,路由器R3和目的地之间的链路的开销为30,而其它链路的开销为8。在这种情况下,从R1和R2到目的地的路径分别是R1->R5->R6->目的地和R2->R6->目的地。对于R4或R5经由R1重路由,或对于R6经由R2重路由已不再满足需要。在此示例中,当[R4,R1,R2]全部收敛时、当[R5,R1,R2]全部收敛时或当[R6,R2]全部收敛时,应存在端到端收敛。因此,离线工具对于新路径的有效性验证是递归的过程。离线工具20需要检查新路径是否依赖于故障的路径。只要存在依赖关系,离线工具需要不断使用路由收敛数据来发现相关的端到端路径何时变为有效。一旦邻居将到目的地的路径重路由到不依赖故障链路的路径上,该过程即停止。
下面说明根据一个实施例的用于得到网络广泛可用性的递归过程。在一个实施例中,离线工具20按月(或另一时间周期)计算网络可用性为:
(流量-损失)/流量
其中:
损失=由该时间周期内的所有路由收敛事件引起的丢失的流量量;以及
流量=在该时间周期内进入网络的流量量。
对于每个路由事件,离线工具20计算损失为在该事件期间收集的需求矩阵的所有需求中丢失流量的总和。以每个路由事件的每个请求为基础,离线工具计算每个请求的丢失流量为:
需求*(该需求对于目的地的收敛时间)
该需求对于目的地的收敛时间的计算如上述示例中对于端到端收敛的计算。
当节点或SRLG(Shared Risk Link Group,共享风险链路组)故障时,拓扑结构的多个元件改变。离线工具的对于目的地的收敛时间的计算过程延长以考虑到所有这些故障。收敛的起始定义为到目的地的路径上的链路故障的时刻,而收敛的终止定义为在该路径上的路由器重路由到有效路径的时刻,其中有效性考虑到节点或SRLG事件的所有故障的元件。
当链路、节点或SRLG出现时,可能生成环路(uloop,微环路)。离线工具20能够利用路由收敛和需求矩阵测量来计算由循环引发了多少损失。
存在多种方法(例如,SNMP(Simple Network Management Protocol,简单网络管理协议)、NetFlow、BGP(Border Gateway Protocol,边界网关协议)、XML(ExtensibleMarkup Language,可扩展标记语言)等等)可被应用用于从网络中的路由器请求和取回网络数据。但是,对于单独的应用选择和实现特定方法是低效和复杂的。它还使得不同应用向新平台的移植变得困难,并且给应用开发者增加了额外的负担,这些应用开发者必须关心在托管他们的应用的实体和网络中的路由器之间的“通信”。
在一个实施例中,网络可用性应用编程接口(NA API)用于提取一个或多个上述方法到编程接口中,应用开发者能够使用编程接口来记录其在网络可用性数据的兴趣,请求对于特定资源(例如,在拓扑结构中的前缀)的网络可用性数据以及接收从网络中的路由器馈送的网络可用性数据。API还隐藏用于在应用和路由器之间传输网络可用性数据的方法。应用开发者只需遵守NA API的语义。
网络设备可配置为自动设置NA数据的收集,不需要从外部设备的输入,因此网络设备能够向提出数据请求的设备提供网络可用性分析数据。
图4是示出了安装在路由器14上与离线工具20上的网络可用性API26通信的网络可用性仪器API 18的示例的框图。NA API 18可安装在网络中任意数量的路由器14上。此外,路由器14上的每个NA API 18可与任意数量的NA API 26通信。离线工具20上的任意数量的应用可与路由器14上的任意数量的NA API 18交互,因此使得应用能够与一个或多个路由器通信,以便请求和接收网络可用性信息。
NA API 18可于提供标准API的第三方应用一同使用,其允许其它应用记录它们对于一些消费者端口(例如,源自特定边缘路由器的指定端口的所有需求)或者指定目的地或服务的可用性状态的兴趣。通过NA API的使用,应用被通知网络服务可用性,因此能够采取任意必要的措施来提高该可用性。行动可包括:例如,转换服务提供商或使用其它数据中心来托管其服务的部分。服务请求基于本文所述的网络可用性分析计算而得到满足。
统一编程接口促进了能够利用精确的网络可用性信息的多个应用的开发和实现。例如,规划应用48能够定期计算网络广泛可用性并使用该网络广泛可用性作为当设计网络资源或改进服务的最优利用时的一个因素。监测和故障排除应用50可使用网络可用性信息来检查(近似实时或回放模式中的)网络可用性以便查明导致问题的根源。分析应用52可处理多个信息馈送,例如,路由协议、SNMP、NetFlow和网络可用性数据,并且使用这些信息来呈现不同时段网络健康状况的精确图像。该网络健康状况的总览帮助操作者管理网络并且能够用于将网络价值货币化。
应该理解的是,图4所示及上文所述的应用48、50、52只是示例,且在不脱离实施例的范围的情况下,其它应用可使用网络可用性信息。
路由器14上的网络可用性API 18与一个或多个被配置为生成并收集网络数据的子系统(例如,RCMD模块38、DDM模块39、NetFlow数据54、拓扑数据56)进行交互。应该理解的是,这些只是可被监测或收集的数据的示例,且其它数据(例如,数据包丢失情况)可用于提供网络可用性的指示。应用层协议可用于通过如图4所示的链路/路径58传输网络可用性信息。
图5示出了包括用于提供路由收敛和流量需求测量的RCMD(Route ConvergenceMonitoring and Diagnostics,路由收敛监测和诊断)和DDM(Distributed DemandMatrix,分布需求矩阵)组件64的路由器60的示例。图5中所示的示例包括边缘路由器A、B、C、D和核心路由器E。DDM/RCDM组件64可包括:例如,RCMD模块38、DDM模块39或RCMD模块和DDM模块二者。
在一个实施例中,RCMD在网络65中的路由器60上实现来测量各种路由协议和扩展(例如,ISIS(Intermediate System-to-Intermediate System,中间系统到中间系统)、OSPF(Open Shortest Path First,开放式最短路径优先)、BGP(Border GatewayProtocol,边界网关协议)、TE(Traffic Engineering,流量工程)、LDP(LableDistribution Protocol,标签分发协议)、LFA(Loop Free Alternate,无环路替换)、PIM(Protocol Independent Multicast,协议无关组播)、mLDP(multicast LableDistribution Protocol,组播标签分发协议))的收敛行为。RCMD用于收集和报告关于路由收敛的数据。RCMD提供收敛事件的“路由器内”视角。数据能够被离线工具20输出(例如,通过XML(Extensible Markup Language,可扩展标记语言))、关联和利用。RCMD能够在监测模式中操作以检测事件及测量收敛,以及在诊断模式中操作以额外收集不正常事件的调试信息。RCMD标识所有导致给定路由表重计算(路由计算)的原因(即,触发原因)。该标识策略考虑到所有路由收敛测量中的相关性。在一个实施例中,RCMD的作用如2013年2月4日提交的题为“Route Convergence Monitoring and Diagnostics”(路由收敛监测和诊断)的美国专利申请No.13/758501中所述,其全部内容被通过引用结合于此。
RCMD可用于测量从网络发生变化到路由器调整其硬件以适应该变化所用的时间(T2-T0)。实施例还可用于测量接收到变化信息的任意路由器在其硬件中做出改变从而该信息当前被用于转发数据包所用的时间(T2-T1)。(T2-T1)时间段在路由器上的许多组件涉及导致硬件改变的操作的情况下非常显著。
当如图1所示及上文所述的链路故障时,该故障在路由器中的一个路由上被检测到,并且该被检测到的故障向整个网络洪泛。洪泛测量标识故障消息在检测路由器上生成的时刻与故障消息在重路由路由器上接收的时刻之间的时间间隔(T1-T0)。在一个实施例中,时间戳用于记录变化发生(例如,链路故障)的时刻T0。路由器传输路由信息(例如,ISIS中的链路状态数据包(LSP)或OSPF中的链路状态广播(LSA))。路由器向指示时刻(T0)的时间戳添加该路由器生成了新的路由信息。重路由路由器在时刻T1接收该信息并更新其路由信息。
更新测量标识重路由路由器接收到故障通知的时刻(T1)与在所有重路由路由器的线卡上安装最重要的前缀的时刻(T2)之间的时间间隔。在一个实施例中,路由器14的收敛时间(T2-T1)使用标记来进行测量。该标记是附加到与从网络接收到的拓扑信息相关的内部路由信息的标识。当内部路由信息在路由器的软件内从一个路由组件传播到下一个时,该标记被追踪。当任意组件接收到标记时,该组件保存与特定标记相关的时间戳。最后更改硬件的组件保存时刻为T2的时间戳。为提供可扩展性,只有精选的路由被追踪。路由的选择可基于策略,例如,优先级。因此,路由组件作用于有限数量的标记而不是每个被处理的路由。这大大降低了追踪穿过路由组件的路由所需的工作量及需要存储的追踪数据量。
系统中的测量组件收集路由器上的追踪信息,并通过比较保存的时间戳(T0和T2),测量组件能够找到端到端收敛。路由器本地的问题可通过检查从T1到T2的时间间隔来识别。
RCMD可用于ISIS和OSPF收敛测量以及收集SPF(Shortest Path First,最短路径优先)运行的细节和向所有路由器上的线卡供应路由和LDP(Label DistributionProtocol,标签分发协议)标签所用的时间。RCMD还可用于提供在每个SPF运行的最后可用的LFA(Loop Free Alternate,无环路替换)覆盖的信息,以及BGP(Border GatewayProtocol,边界网关协议)和TE(Traffic Engineering,流量工程)信息。因为RCMD用于监测各种路由收敛事件,因此其实现被嵌入路由子系统组件中,包括:例如,ISIS、OSPF、RIB(Routing Information Base,路由信息库)、LDP、LSD(Label Switching Database,标签交换数据库)和FIB(Forwarding Information Base,转发信息库)。
在一个实施例中,流量需求测量包括路由器的需求矩阵份额,如2013年1月29日提交的题为“Distributed Demand Matrix Computations”(代理人案号No.CISCP1237)的美国专利申请序号No.13/752926中所述,其全部内容被通过引用结合于此。需求表示在网络中的任意两个边缘设备之间流动的流量。可能存在任意数量的流量流穿过网络。需求矩阵(流量矩阵、流量需求矩阵)描述了在网络边缘上的流的集合。需求是与网络中的源和目的地相关的需求矩阵的一个元素(单元格)。因此,每个需求是需求矩阵中的一个条目,其标识在一个点进入网络而在另一个点离开网络的流量量。例如,流量可在路由器A进入网络,并沿路径穿过网络直到它到达路由器B,在路由器B离开网络。为了构造需求矩阵,关于所有流量及其如何进入和离开网络的信息被收集。流量测量映射到单独的需求。
对于如图5所示的四个互连的边缘设备A、B、C、D的需求矩阵可如下表示:
[[AA AB AC AD]
[BA BB BC BD]
[CA CB CC CD]
[DA DB DC DD]]
上面的需求矩阵的每行包括对应于在边缘设备中的一个处接收到的流量的单元格(cell)。例如,第一行包括对应于在路由器A处接收并将在路由器A(AA)、路由器B(AB)、路由器C(AC)和路由器D(AD)离开网络的流量的单元格。同样地,第二行包括对应于在路由器B处接收并将在路由器A(BA)、路由器B(BB)、路由器C(BC)和路由器D(BD)离开网络的流量的单元格,第三行和第四行分别包括对应于在路由器C和D处进入网络的流量。来自每个路由器的本地需求(需求矩阵的部分)可在一个或多个路由器或另一设备(例如,离线工具20)上收集,从而生成了完整的需求矩阵。
网络中的一个或多个路由器可包括配置为计算所有需求矩阵的[X,Y]单元格的DDM模块39,其中X是DDM模块所在路由器。路由器进一步包括由DDM模块维护的需求数据库。来自每个线卡的DDM测量在一段特定时间周期内存储于数据库中。数据库中的需求可被取回以用于由容量规划应用或其它应用操作应用在离线工具20上运行。来自数据库的需求还可向参与DDM过程的其它路由器广告。
每个DDM模块39也配置为用于同步定期测量存档。例如,每个数据库包括多个计算且存储一段时间周期的需求。所有用在每个边缘设备上的时间周期具有共同的倍数。该时间规则使得结合不同路由器的分布的测量以及保证可以简单地将不同单元格重组到关于特定时间周期的矩阵中是可能的。此外,虽然路由器能够以很小的周期(T=15分钟)操作,以便维护其本地DDM数据库,但是它能够以较低的频率(例如,每60分钟)发送其BGP DDM更新。
应该理解的是,上述RCMD和DDM测量只是可用于计算本文所述的网络可用性的路由收敛测量和流量需求测量的示例。
虽然方法和装置是根据所示实施例说明的,但是本领域普通技术人员很容易识别,在不脱离实施例的范围的情况下可做出变化。因此,其意图是以上描述中所包含的以及附图中所示的所有事项应解释为说明性而非限制性意义。

Claims (17)

1.一种用于网络可用性分析的方法,包括:
在网络设备处接收来自多个路由器的路由收敛测量和流量需求测量,其中所述路由收敛测量和流量需求测量无需注入探针;以及
基于所述路由收敛测量和所述流量需求测量,在所述网络设备处计算网络可用性;
其中,所述路由收敛测量与所述路由器处的路由计算相关,并且所述流量需求测量包括与所述路由器相关的需求矩阵的部分,其中所述需求矩阵的所述部分包括来自每个路由器的本地需求。
2.如权利要求1所述的方法,其中接收所述路由收敛测量和流量需求测量包括:在应用编程接口处接收所述测量。
3.如权利要求2所述的方法,其中所述测量被针对网络中的位置而接收。
4.如权利要求2所述的方法,其中所述测量被针对服务而接收。
5.如权利要求2所述的方法,进一步包括:标识所述测量中针对资源的兴趣。
6.如权利要求1所述的方法,其中计算网络可用性包括:计算针对从源到目的地的流的端到端收敛。
7.如权利要求1所述的方法,其中计算网络可用性包括:计算对于时间段的网络广泛可用性。
8.如权利要求1所述的方法,其中所述网络可用性在规划应用处被计算。
9.如权利要求1所述的方法,其中所述网络可用性被监测和故障排除应用所使用。
10.如权利要求1所述的方法,其中所述网络可用性在可操作来处理网络可用性和网络流数据的分析应用处被计算。
11.如权利要求1所述的方法,其中与所述路由器相关的所述需求矩阵的所述部分在所述路由器处被计算。
12.一种用于网络可用性分析的装置,包括:
处理器,所述处理器用于在路由器处生成路由收敛测量和流量需求测量,其中所述路由收敛测量和流量需求测量无需注入探针;
存储器,所述存储器用于存储所述路由收敛测量和所述流量需求测量;以及
应用编程接口,所述应用编程接口用于向网络设备提供所述路由收敛测量和所述流量需求测量,所述网络设备可操作来从网络中的多个路由器收集多个所述路由收敛测量和所述流量需求测量、并基于所述测量计算网络可用性。
13.如权利要求12所述的装置,其中所述路由收敛测量与所述路由器处的路由计算相关,并且所述流量需求测量包括与所述路由器相关的需求矩阵的部分。
14.如权利要求12所述的装置,其中所述处理器被进一步配置为:标识网络可用性数据中针对所述网络设备的兴趣。
15.如权利要求14所述的装置,其中网络可用性数据中的所述兴趣包括:所述测量中针对资源的兴趣。
16.如权利要求12所述的装置,其中所述处理器被进一步配置为:在应用层协议中传输所述路由收敛测量和所述流量需求测量。
17.如权利要求12所述的装置,其中生成所述流量需求测量包括在数据库中存储需求,包括针对时间段计算的、且对应于所述需求矩阵的单元格的多个需求,所述单元格与在所述路由器处进入网络的流量相关,其中对应于与在所述路由器之外的路由器处进入网络的流量相关的所述需求矩阵的单元格的需求被计算和存储在所述路由器之外的路由器上。
CN201380018852.7A 2012-04-09 2013-04-09 用于网络可用性分析的方法和装置 Active CN104221327B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261621811P 2012-04-09 2012-04-09
US61/621,811 2012-04-09
US13/780,253 US9479403B2 (en) 2012-04-09 2013-02-28 Network availability analytics
US13/780,253 2013-02-28
PCT/US2013/035689 WO2013155023A1 (en) 2012-04-09 2013-04-09 Network availability analytics

Publications (2)

Publication Number Publication Date
CN104221327A CN104221327A (zh) 2014-12-17
CN104221327B true CN104221327B (zh) 2019-05-10

Family

ID=49292230

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201380018940.7A Active CN104221328B (zh) 2012-04-09 2013-04-08 分布式需求矩阵计算
CN201380018852.7A Active CN104221327B (zh) 2012-04-09 2013-04-09 用于网络可用性分析的方法和装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201380018940.7A Active CN104221328B (zh) 2012-04-09 2013-04-08 分布式需求矩阵计算

Country Status (4)

Country Link
US (3) US9106510B2 (zh)
EP (2) EP2837137B1 (zh)
CN (2) CN104221328B (zh)
WO (2) WO2013155021A2 (zh)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8549176B2 (en) * 2004-12-01 2013-10-01 Cisco Technology, Inc. Propagation of routing information in RSVP-TE for inter-domain TE-LSPs
US9137101B2 (en) * 2011-11-23 2015-09-15 Avaya Inc. Multi-layer network diagnostic tracing
US20140044129A1 (en) * 2012-08-10 2014-02-13 Duane Edward MENTZE Multicast packet forwarding in a network
US10397101B1 (en) 2012-12-27 2019-08-27 Sitting Man, Llc Routing methods, systems, and computer program products for mapping identifiers
US10404583B1 (en) 2012-12-27 2019-09-03 Sitting Man, Llc Routing methods, systems, and computer program products using multiple outside-scope identifiers
US10447575B1 (en) 2012-12-27 2019-10-15 Sitting Man, Llc Routing methods, systems, and computer program products
US10374938B1 (en) 2012-12-27 2019-08-06 Sitting Man, Llc Routing methods, systems, and computer program products
US10411997B1 (en) 2012-12-27 2019-09-10 Sitting Man, Llc Routing methods, systems, and computer program products for using a region scoped node identifier
US10587505B1 (en) 2012-12-27 2020-03-10 Sitting Man, Llc Routing methods, systems, and computer program products
US10404582B1 (en) 2012-12-27 2019-09-03 Sitting Man, Llc Routing methods, systems, and computer program products using an outside-scope indentifier
US10419334B1 (en) 2012-12-27 2019-09-17 Sitting Man, Llc Internet protocol routing methods, systems, and computer program products
US10212076B1 (en) 2012-12-27 2019-02-19 Sitting Man, Llc Routing methods, systems, and computer program products for mapping a node-scope specific identifier
US10397100B1 (en) 2012-12-27 2019-08-27 Sitting Man, Llc Routing methods, systems, and computer program products using a region scoped outside-scope identifier
US10476787B1 (en) 2012-12-27 2019-11-12 Sitting Man, Llc Routing methods, systems, and computer program products
US10411998B1 (en) 2012-12-27 2019-09-10 Sitting Man, Llc Node scope-specific outside-scope identifier-equipped routing methods, systems, and computer program products
US10904144B2 (en) 2012-12-27 2021-01-26 Sitting Man, Llc Methods, systems, and computer program products for associating a name with a network path
US10419335B1 (en) 2012-12-27 2019-09-17 Sitting Man, Llc Region scope-specific outside-scope indentifier-equipped routing methods, systems, and computer program products
US10084650B2 (en) * 2013-07-09 2018-09-25 Tail-f Systems AB Graphical user interface for customizing graphical representations based on registry data
US9686581B2 (en) 2013-11-07 2017-06-20 Cisco Technology, Inc. Second-screen TV bridge
US20150281050A1 (en) * 2014-03-31 2015-10-01 Alcatel-Lucent Usa Inc. Method for Adjacency Status Synchronization in Label Distribution Protocol
US10222935B2 (en) 2014-04-23 2019-03-05 Cisco Technology Inc. Treemap-type user interface
US10448246B2 (en) 2014-04-29 2019-10-15 Hewlett Packard Enterprise Development Lp Network re-convergence point
CN105024927A (zh) * 2014-04-30 2015-11-04 中国电信股份有限公司 一种计算路由收敛能力的方法和系统
WO2016014086A1 (en) * 2014-07-25 2016-01-28 Hewlett-Packard Development Company, L.P. Software-defined sensing
US9529531B2 (en) 2014-10-06 2016-12-27 Barefoot Networks, Inc. Proxy hash table
JP6299640B2 (ja) * 2015-03-23 2018-03-28 横河電機株式会社 通信装置
US10250562B1 (en) * 2015-03-31 2019-04-02 Juniper Networks, Inc. Route signaling driven service management
US9985875B1 (en) 2015-03-31 2018-05-29 Juniper Networks, Inc. Route signalling based resilient application overlay network
WO2016175874A1 (en) * 2015-04-30 2016-11-03 Hewlett Packard Enterprise Development Lp Reducing flooding of route updates of a dynamic routing protocol
US9729427B2 (en) * 2015-05-08 2017-08-08 Arista Networks, Inc. Method and system for route hardware programming in network devices
US9491282B1 (en) * 2015-05-13 2016-11-08 Cisco Technology, Inc. End-to-end call tracing
CN107086924B (zh) * 2016-02-16 2020-02-14 华为技术有限公司 一种报文传输方法及装置
US10063457B2 (en) * 2016-03-29 2018-08-28 Juniper Networks, Inc. Method, system, and apparatus for improving forwarding capabilities during route convergence
US11025485B2 (en) 2016-09-15 2021-06-01 At&T Intellectual Property I, L.P. Telecommunication network analytics platform
CN106506258A (zh) * 2016-10-12 2017-03-15 重庆金美通信有限责任公司 一种通信网络分布式路由协议收敛时间测试的方法、系统和设备
CN106549825A (zh) * 2016-10-13 2017-03-29 重庆金美通信有限责任公司 一种通信网络路由转发表正确性测试的方法、系统和设备
US10372520B2 (en) 2016-11-22 2019-08-06 Cisco Technology, Inc. Graphical user interface for visualizing a plurality of issues with an infrastructure
US10739943B2 (en) 2016-12-13 2020-08-11 Cisco Technology, Inc. Ordered list user interface
US10158573B1 (en) * 2017-05-01 2018-12-18 Barefoot Networks, Inc. Forwarding element with a data plane load balancer
US20180365571A1 (en) * 2017-06-14 2018-12-20 Microsoft Technology Licensing, Llc Dynamic Converging Times for Real-Time Data Monitoring
US10608913B2 (en) * 2017-06-23 2020-03-31 Keysight Technologies Singapore (Sales) Pte. Ltd. Methods, systems, and computer readable media for conducting and validating network route convergence testing
US10636423B2 (en) * 2018-02-21 2020-04-28 Motorola Solutions, Inc. System and method for managing speech recognition
US10862867B2 (en) 2018-04-01 2020-12-08 Cisco Technology, Inc. Intelligent graphical user interface
CN112995750B (zh) * 2019-12-17 2024-04-30 天翼数字生活科技有限公司 家庭路由器场景下实现iptv组播服务的方法及系统
FR3106027A1 (fr) * 2020-01-06 2021-07-09 Orange Procédé de gestion du routage de données dans un système de communication et dispositifs pour la mise en œuvre du procédé
US11290941B2 (en) * 2020-02-28 2022-03-29 At&T Intellectual Property I, L.P. Selectively using a co-processor to process network routing information in a fifth generation (5G) or other next generation network
WO2022256264A1 (en) * 2021-06-03 2022-12-08 Nile Global, Inc. Methods and systems for service-level agreement (sla) network availability, network coverage, network capacity management
US11617107B2 (en) 2021-06-03 2023-03-28 Nile Global, Inc. Methods and systems for service-level agreement (SLA) network coverage management
CN114039859B (zh) * 2021-11-03 2023-05-30 中盈优创资讯科技有限公司 一种stn网络设备链改环方法及装置
CN116094942B (zh) * 2023-04-06 2023-10-27 北京航天万源科技有限公司 分布式智能设备协同工作的方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1522524A (zh) * 2001-02-16 2004-08-18 ӡ�����Ƽ��ɷ����޹�˾ 具有冲突解决方法的数据流分配的电路结构
CN1778068A (zh) * 2003-03-20 2006-05-24 思科技术公司 通信/数据网络中的数据流动的辅助确定

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3063721B2 (ja) * 1997-04-30 2000-07-12 日本電気株式会社 トポロジー情報交換装置及びプログラムを記録した機械読み取り可能な記録媒体
US6857026B1 (en) * 1999-12-14 2005-02-15 Nortel Networks Limited Using alternate routes for fail-over in a communication network
US7002960B1 (en) 2001-10-30 2006-02-21 At&T Corp. Traffic matrix computation for packet networks
US7743139B1 (en) 2001-10-30 2010-06-22 At&T Intellectual Property Ii, L.P. Method of provisioning a packet network for handling incoming traffic demands
US7027396B1 (en) * 2002-02-13 2006-04-11 At&T Corp. Traffic matrix computation for a backbone network supporting virtual private networks
GB0220660D0 (en) * 2002-09-05 2002-10-16 Nokia Corp Signal propogation delay routing
US7646706B2 (en) * 2003-03-31 2010-01-12 Alcatel-Lucent Usa Inc. Restoration time in mesh networks
US7436838B2 (en) * 2004-12-29 2008-10-14 Cisco Technology, Inc. Automatic prioritization of BGP next-hop in IGP
US7433320B2 (en) * 2005-02-01 2008-10-07 Cisco Technology, Inc. System and methods for network path detection
US7532631B2 (en) * 2005-04-13 2009-05-12 Cisco Technology, Inc. Method and apparatus for accelerating border gateway protocol convergence
WO2006130840A2 (en) 2005-06-02 2006-12-07 Georgia Tech Research Corporation System and method for data streaming
US7627290B2 (en) * 2005-07-07 2009-12-01 Cisco Technology, Inc. Route convergence monitoring system and method
JP2007104536A (ja) * 2005-10-07 2007-04-19 Sony Corp 無線端末及びプログラム
US7904586B1 (en) * 2005-12-29 2011-03-08 At&T Intellectual Property Ii, L.P. Traffic engineering method with tunable inter-domain egress selection
US7817549B1 (en) * 2006-06-30 2010-10-19 Extreme Networks, Inc. Flexible flow-aging mechanism
US7831700B2 (en) * 2006-10-16 2010-11-09 Futurewei Technologies, Inc. Distributed PCE-based system and architecture in multi-layer network
US20080165685A1 (en) * 2007-01-09 2008-07-10 Walter Weiss Methods, systems, and computer program products for managing network bandwidth capacity
US7898973B2 (en) 2007-05-30 2011-03-01 Cisco Technology, Inc. Convergence measurement in computer network
US8427970B2 (en) * 2008-11-14 2013-04-23 Laris Benkis Apparatus and method for determining a service interruption time measurement
US7796514B2 (en) * 2008-12-11 2010-09-14 At&T Intellectual Property I, L.P. System and method for multi-services packet network traffic engineering
CN101848160B (zh) * 2010-05-26 2012-07-18 钱叶魁 在线检测和分类全网络流量异常的方法
CN102143042B (zh) * 2010-07-09 2014-04-16 华为技术有限公司 虚拟集群路由器系统及其流量分担方法、控制器和子路由器

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1522524A (zh) * 2001-02-16 2004-08-18 ӡ�����Ƽ��ɷ����޹�˾ 具有冲突解决方法的数据流分配的电路结构
CN1778068A (zh) * 2003-03-20 2006-05-24 思科技术公司 通信/数据网络中的数据流动的辅助确定

Also Published As

Publication number Publication date
US9479403B2 (en) 2016-10-25
CN104221328A (zh) 2014-12-17
CN104221328B (zh) 2017-11-17
WO2013155021A3 (en) 2014-01-03
US9106510B2 (en) 2015-08-11
EP2837136A1 (en) 2015-02-18
CN104221327A (zh) 2014-12-17
EP2837137B1 (en) 2019-07-24
US9237075B2 (en) 2016-01-12
EP2837136B1 (en) 2019-12-18
WO2013155021A2 (en) 2013-10-17
EP2837137A2 (en) 2015-02-18
US20130265905A1 (en) 2013-10-10
US20130265894A1 (en) 2013-10-10
WO2013155023A1 (en) 2013-10-17
US20130265881A1 (en) 2013-10-10

Similar Documents

Publication Publication Date Title
CN104221327B (zh) 用于网络可用性分析的方法和装置
Ramanathan et al. Towards a debugging system for sensor networks
CN101151847A (zh) 用于识别网络路径性能的系统和方法
Natu et al. Active probing approach for fault localization in computer networks
CN107005437A (zh) 网络断层扫描的方法和装置
Gheorghe et al. SDN-RADAR: Network troubleshooting combining user experience and SDN capabilities
CN104348678A (zh) 以太网性能测量方法、装置及系统
EP3134999A1 (en) Network tomography through selection of probing paths
CN103281256B (zh) 基于网络层析的端到端路径丢包率探测方法
Vaton et al. Joint minimization of monitoring cost and delay in overlay networks: optimal policies with a Markovian approach
CN104935458A (zh) 一种基于分布式自动化测量的性能瓶颈分析方法及装置
CN102739527A (zh) 网络丢包率探测方法
US10547524B2 (en) Diagnostic transparency for on-premise SaaS platforms
Cho et al. CBR-based network performance management with multi-agent approach
De Donato et al. HoBBIT: a platform for monitoring broadband performance from the user network
Abushagur et al. Hybrid software-defined network monitoring
Ma et al. BOND: exploring hidden bottleneck nodes in large-scale wireless sensor networks
Cuong et al. Service composition with quality of service management in environmental sensor networks
Jeliazkova et al. UPerfsonarUI-a standalone graphical user interface for querying perfSONAR services
Su et al. CFlam: Cost-effective Flow Latency Monitoring System for Software Defined Networks
Wang et al. Fault diagnosis based on evidences screening in virtual network
Park et al. RCV: Network Monitoring and Diagnostic System with Interactive User Interface
Tang et al. Community-base fault diagnosis using incremental belief revision
Steinert et al. Observing software-defined networks using a decentralized link monitoring approach
Tang et al. Probabilistic and reactive fault diagnosis for dynamic overlay networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant