CN106464531A - 网络故障的主动处理 - Google Patents

网络故障的主动处理 Download PDF

Info

Publication number
CN106464531A
CN106464531A CN201580030009.XA CN201580030009A CN106464531A CN 106464531 A CN106464531 A CN 106464531A CN 201580030009 A CN201580030009 A CN 201580030009A CN 106464531 A CN106464531 A CN 106464531A
Authority
CN
China
Prior art keywords
network
fault
faults
equipment
predetermined maximum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580030009.XA
Other languages
English (en)
Other versions
CN106464531B (zh
Inventor
R·马哈詹
张铭
S·坎杜拉
刘洪强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN106464531A publication Critical patent/CN106464531A/zh
Application granted granted Critical
Publication of CN106464531B publication Critical patent/CN106464531B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0888Throughput
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/25Flow control; Congestion control with rate being modified by the source upon detecting a change of network conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/149Network analysis or design for prediction of maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

在此所描述的技术和/或系统实现了故障处理服务,其能够确保只要没有多于预定的最大故障数目,网络的至少一部分就能够避免拥塞(例如,超过容量的链路)。故障处理服务基于网络拓扑对可能故障的不同组合建模并且然后计算经由个体路径要被传递的业务量,使得只要发生的实际故障的数目小于或等于预定的最大故障数目,拥塞就被避免。

Description

网络故障的主动处理
背景技术
随着电子服务(例如,搜索服务、电子邮件服务、社交联网服务、云计算服务等)通过服务更多用户并且提供更多内容而继续扩展,电子服务的提供商必须继续维护和升级设备的网络以提供扩展的电子服务。然而,设备和互连设备并且在个体网络内传递数据的链路可能发生故障或者引起故障,其可能导致网络拥塞(例如,超过通信容量的链路)。因此,网络可能经历可能影响网络的效率和可靠性的分组损失。
发明内容
本文所描述的技术和/或系统实现了故障处理服务,其能够确保只要没有多于预定的最大故障数目,网络的至少一部分就能够避免拥塞(例如,超过容量的链路)。故障处理服务基于网络拓扑对可能故障的不同组合建模并且然后计算经由个体路径要被传递的业务量,使得只要发生的实际故障数目小于或等于预定的最大故障数目,就避免拥塞。
提供该发明内容以引入以在具体实现中下文进一步描述的简化形式的概念的选择。该发明内容不旨在标识所要求保护的主题的关键特征或必要特征,其也不旨在用于限制所要求保护的主题的范围。
附图说明
参考附图呈现了详细描述。在附图中,参考数字中的最左边的(一个或多个)数字标识参考数字首次出现的附图。不同的附图中的相同参考数字的使用指示相似或相同的项。
图1图示了根据各个实施例的其中故障处理服务将网络配置为处理多达预定的最大故障数目的示图。
图2图示了根据各个实施例的示出被配置为处理多达预定的最大链路故障数目的示例网络的示图。
图3图示了根据各个实施例的示出被配置为处理多达预定的最大控制故障数目的示例网络的示图。
图4图示了根据各个实施例的示出实现故障处理服务的示例环境的示图。
图5图示了根据各个实施例的配置网络使得预定的最大故障数目能够出现而不引起链路上的拥塞的示例过程。
图6图示了根据各个实施例的使用排序网络方法使得故障处理服务能够有效地求解与可能故障的不同组合相关联的约束的示例过程。
图7图示了根据各个实施例的示出被用于实现故障处理服务的示例排序网络的示图。
具体实施方式
本文所描述的技术和/或系统实现了针对网络的故障处理服务。故障处理服务主动地将网络配置为处理多达预定的最大故障数目。例如,故障处理服务可以接收允许的故障的指定数目(例如,预定的最大故障数目)和网络的至少一部分的拓扑作为输入。该拓扑可以包括至少(i)网络部件(诸如设备和设备之间的链路)的布置和(ii)与在网络内或网络的一部分内的一个或多个个体流相关联的信息。基于输入,故障处理服务被配置为针对个体流计算在一个或多个路径中要被传递的业务量,使得网络拥塞被避免,只要在网络中实际发生的故障的数目小于或等于预定的最大故障数目。然后,故障处理服务对网络的部件进行配置(例如,发布指令),使得在故障在网络中实际发生之前基于计算来分布流。因此,故障处理服务主动地对网络进行配置,使得其针对多达预定的最大故障数目(例如,保证拥塞将不发生)是鲁棒的。
网络故障可以包括数据平面故障或控制平面故障。数据平面故障在链路(例如,网络中的两个设备之间的直接链路)发生故障时或当设备发生故障时而发生。在本文所讨论的各个实现中,与网络故障相关联的设备可以是交换设备,例如,负责在网络内转发数据分组(例如,在网络中传递的业务)。因此,数据平面故障可以包括对分组转发产生影响的链路故障或交换故障。控制平面故障在网络中的交换设备未能以及时的方式重新配置或接收更新时(例如,完全的重新配置故障、延迟的重新配置等)而发生。因此,即使交换设备继续转发分组并且尚未发生故障,故障也仍然可能发生,这是因为交换设备将基于先前的或旧的配置而非更新的或新的配置来转发分组。控制平面故障可能起因于远程过程调用(RPC)故障、交换设备固件或软件中的错误、交换设备中的存储器的缺乏等。因此,本文所讨论的故障处理服务将网络配置为主动地处理数据平面故障和/或控制平面故障,使得故障处理服务确保网络拥塞(例如,网络中的链路上的业务将不超过容量)将不发生,只要实际发生的故障的数目小于预定的最大故障数目。
传统地,业务工程控制器响应于检测到故障而对网络进行重新配置。因此,传统方法在故障已经实际发生之后并且在故障被检测到之后减少网络拥塞,并且因此,网络拥塞可能已经发生并且需要被改正。在许多情况下,业务工程控制器不能够对引起网络性能中断或减小的故障有效地做出反应,例如,由于分组损失(例如,反应或改正可能花费数十秒)。例如,如果并且当网络中的链路发生故障(例如,故障发生)时,网络中的交换设备被配置为通常地将业务移动到其他可用的路径(例如,重新调整业务)。然而,移动不考虑链路容量约束,并且因此移动常常导致然后必须反应性地改正的链路拥塞。
图1图示了其中本文所描述的故障处理服务102将网络104配置为处理多达预定的最大故障数目(例如,一、二、三、四、十、二十、一百或任何其他数目)的示例图100。可以通过操作故障处理服务102的实体或者管理网络104或网络104的特定功能(诸如分组转发)(例如,业务工程应用或控制器)的实体来设定预定的最大故障数目。如上文所讨论的,故障处理服务102实现处理网络104中的故障的主动方法。例如,故障处理服务102可以计算经由与流相关联的一个或多个路径要被传递的业务量,使得来自拥塞的自由度实现多达预定的最大故障数目。换句话说,故障处理服务102传播网络中的业务,使得没有拥塞发生,例如,链路不超过带宽容量,只要发生的故障总数小于或等于预定的最大允许故障数目。
网络104可以包括各种设备106和直接链路108(例如,网络104中的两个设备106之间的链路)。直接链路108可以是连接两个设备的通信路径的至少一部分。例如,入口交换设备可以是其中业务起源的源设备,并且出口交换设备可以是其中业务结束的目的地设备。入口交换设备可以被配置或被指示为建立一个或多个通信路径并且经由一个或多个通信路径将流(例如,业务)传递给出口交换设备。如本文所讨论的,通信路径还可以被称为通过两个或两个以上设备(例如,包括入口交换设备和出口交换设备)的通信隧道或隧道。
在各个实施例中,网络104可以是大型生产网络,诸如数据中心网络(DCN)、因特网服务提供商(ISP)网络、企业网络(例如云服务)或可以在实体(例如,操作和维护执行故障处理服务102的设备的实体)的控制下的任何其他管理域。设备106可以是物理网络设备(诸如交换设备(交换机)、路由设备(路由器)、网关设备(网关)、桥接设备(网络桥接器)、集线器设备(网络集线器)、防火墙设备、网络地址转换器设备(NAT)、多路复用设备(多路复用器)、无线接入点设备(WAP)、代理服务设备、文件服务器设备、数据库服务器设备、存储设备等)。设备106还可以是能够连接到网络104的终端用户设备。例如,终端用户设备可以包括移动或便携式设备,诸如智能电话、蜂窝电话、个人数字助理(PDA)、电子书设备、膝上型计算设备、平板计算设备、个人媒体播放器设备,等等。或者,终端用户设备可以包括固定设备,诸如桌面计算设备、游戏控制台设备、数字视频记录设备(DVR)、机顶盒设备,等等。因此,网络104可以包括连接到彼此以包括域或管理网络的数十、数百或数千个设备。
在本文所讨论的各个示例中,可以根据基于隧道的转发来实现故障处理服务102。基于隧道的转发可以使用在网络的业务工程中。在基于隧道的转发中,一个或多个隧道(例如,通信路径)被建立以在入口-出口交换设备对之间传递流并且所传递的业务可以被称为流。如上文所讨论的,流可以跨越多个隧道传播或在多个隧道之间分布。因此,故障处理服务102可以利用权重将入口交换设备配置为确定流如何跨越多个隧道分割。
故障处理服务102被配置为接收或者访问网络104的拓扑并且基于拓扑和预定的最大允许故障数目来生成模型(例如,方程组)。模型表示在网络中可能潜在地发生的可能故障的不同组合(例如,故障的类型、故障的位置等)。例如,如果预定的最大允许故障数目是一,则可能故障的组合与其中一个允许故障可能发生的网络中的单个位置相关联(例如,针对交换机故障的每个交换设备)。因此,可能故障的组合可以包括单个故障。在另一示例中,如果预定的最大允许故障数目是二,则可能故障的组合与其中两个故障可能发生的网络中的两个位置相关联。在其他示例中,预定的最大允许故障数目可以是任何数目(诸如三、五、十、二十、五十、一百等)。
故障处理服务102然后使用模型计算经由网络中的路径要被传递的业务量。所计算的业务量提供针对附加业务的空间(例如,可用空间),以在没有超过通信容量的链路的情况下到达链路(例如,作为响应于故障的业务重新调整过程的一部分),只要发生的故障的数目小于或等于预定的最大故障数目。也就是说,计算确保作为故障的任何组合(例如,其中故障数目小于或等于预定的最大故障数目的组合)的结果,可以到达链路的附加业务小于针对链路的可用或空闲容量,并且因此,链路拥塞被避免。在各个实施例中,入口交换设备可以响应于故障实现成比例的重新调整,使得入口交换设备禁能(例如,由故障影响的)一个或多个故障隧道,并且划分经由跨越针对流建立的其他隧道(例如剩余隧道)的一个或多个故障隧道传递的业务。
在各个实现中,网络104可以包括多个设备(例如,数十、数百、数千等)和/或两个设备之间的链路。因此,确定可能故障的不同组合和对不同组合进行建模可能提出计算挑战(例如,大量的约束)。因此,故障处理服务102可以编码出现的大量的约束并且然后使用排序网络方法有效地求解约束(例如,计算针对一个或多个流的业务分布),如在本文中进一步讨论的。在一些示例中,故障处理服务102可以使用排序网络方法对(例如,与最影响网络业务的故障相关联的)减少数目的约束进行排序。
如上文所提到的,网络故障可以包括数据平面故障和/或控制平面故障。图1图示了链路故障110、交换机故障112和控制故障114。链路故障110和交换机故障112是可以至少影响基于隧道的转发的数据平面故障的每个示例,这是因为链路或交换设备可能不能够处理流或流的一部分,并且因此,网络104中的业务被要求重新调整。控制故障114是还可以至少引起网络拥塞的控制平面故障的示例,这是因为沿着隧道的交换设备可以继续每次在当期望根据新或更新的配置路由流时根据旧或先前的配置来路由业务。
在将网络104配置为主动地处理故障之前,故障处理服务102被配置为确定(例如,访问或接收)一个或多个故障保护等级116。故障保护等级116可以指示预定的最大允许链路故障数目(例如,以下讨论中的ke)、预定的最大允许交换机故障数目(例如,以下讨论中的kv)和/或预定的最大允许控制故障数目(例如,以下讨论中的kc)。
基于(一个或多个)故障保护等级116,故障处理服务102被配置为计算确保网络拥塞被避免的业务量,只要发生的故障总数小于或等于预定的最大允许故障数目。故障处理服务102可以然后将配置设置118提供给网络104,使得网络104被配置为基于计算传递(例如,分布)业务。
作为示例,图2图示了示出故障处理服务102如何将网络配置为处理多达预定的的最大链路故障数目ke的示图200,其中在图2中的示例中,ke=1。因此,图2涉及数据平面故障,并且图示了在链路故障之前对网络的业务分布建模的第一配置202和在链路故障之后对相同网络的业务分布建模的第二配置204。网络包括第一交换设备206(1)、第二交换设备206(2)、第三交换设备206(3)和第四交换设备206(4)。网络中的任何两个设备之间的每个链路具有如果被超过则可能使得链路变得拥塞的通信容量或带宽限制(例如在图2的示例中十个单位)。
在第一配置202中:第一隧道208(1)(隧道在图2中被示出为虚线)经由交换设备206(1)将1.5个业务单位(例如,每秒吉比特Gbps)从交换设备206(2)传递给交换设备206(4),第二隧道208(2)经由交换设备206(1)将1.5个业务单位从交换设备206(3)传递给交换设备206(4),第三隧道208(3)将7个业务单位从交换设备206(3)直接传递给交换设备206(4),以及第四隧道208(4)将7个业务单位从交换设备206(2)直接传递给交换设备206(4)。因此,隧道208(1)和隧道208(4)可以与其中交换设备206(2)是入口交换设备并且交换设备206(4)是出口交换设备的流相关联。此外,隧道208(2)和隧道208(3)可以与其中交换设备206(3)是入口交换设备并且交换设备206(4)是出口交换设备的另一流相关联。故障处理服务102基于指定ke=1的故障保护等级116来计算业务量(例如,图2中所图示的单位)。
因此,如果链路故障210(例如,数据平面故障)发生在如第二配置204中所示的交换设备206(2)与交换设备206(4)之间的位置处,则网络重新调整业务,使得第一隧道212(1)经由交换设备206(1)将8.5个业务单位从交换设备206(2)传递给交换设备206(4),第二隧道212(2)经由交换设备206(1)将1.5个业务单位从交换设备206(3)传递给交换设备206(4),以及第三隧道212(3)将7个业务单位从交换设备206(3)直接传递给交换设备206(4)。
如所示出的,来自第一配置202的隧道208(2)和隧道208(3)通过重新调整过程而保持不变。然而,第二配置204中的隧道212(1)是重新调整为处理来自第一配置202的隧道208(1)和隧道208(4)的组合流,作为链路故障210的结果的隧道。在第二配置204中,从交换设备206(1)到交换设备206(4)的直接链路上的负载总计十个单位(即,8.5+1.5),其在链路的最大容量处或其内。
虽然图2示出了链路故障发生在交换设备206(2)与交换设备206(4)之间,但是第一配置202中(例如,如由故障处理服务102计算的)指定的单位可以主动地处理网络中的其他地方的单个链路故障并且拥塞将仍然被避免,只要存在不超过单个链路故障(ke=1)。例如,如果交换设备206(1)与交换设备206(3)之间的链路发生故障,而不是交换设备206(2)与交换206(4)之间的链路,则经由隧道208(2)传递的1.5个单位可以被添加到经由隧道208(3)传递的7个单位,使得总计8.5个单位经由重新调整的配置中的交换设备206(3)与交换设备206(4)之间的链路传递(例如,8.5个单位小于针对链路的十个单位容量)。
此外,第一配置202可以在不引起拥塞的情况下处理单个交换机故障(例如,kv=1)。例如,如果交换设备206(1)发生故障,则经由隧道208(1)传递的1.5个单位可以重新调整为经由隧道208(4)传递(例如,7+1.5<10个单位),并且经由隧道208(2)传递的1.5个单位可以经由隧道208(3)传递(例如,7+1.5<10个单位)。
因此,故障处理服务102被配置为计算针对流的业务量,并且基于所计算的业务量(例如,如在第一配置202中所示)主动地配置网络,使得存在足够的可用或空闲容量,以吸收由于在网络被配置为针对故障鲁棒(例如,如在第二配置204中所示)之后发生的链路故障而可能到达链路的重新调整的流(例如,成比例重新调整)。
作为另一示例,图3图示了示出故障处理服务102如何将网络配置为处理多达最大控制故障数目kc的示图300。因此,图3涉及控制平面故障并且图示了对网络或网络的一部分建模的第一业务工程(TE)配置302和第二TE配置304。预定的最大允许控制平面故障数目等于一(例如,kc=1)。在第一TE配置302和第二TE配置304中,通过或者经由在图3的示例中的第一交换设备306(1)、第二交换设备306(2)、第三交换设备306(3)和第四交换设备306(4)传递业务。在该示例中,链路容量是十个单位。链路和设备的布置和链路容量以及在第一TE配置302中传递的业务可以由通过故障处理服务102可访问的网络拓扑来表示。
在第一TE配置302中:第一隧道308(1)(隧道在图3中也被示出为虚线)将10个业务单位从交换设备306(1)直接传递给交换设备306(2),第二隧道308(2)将10个业务单位从交换设备306(1)直接传递给交换设备306(3),第三隧道308(3)将7个业务单位从交换设备306(2)直接传递给交换设备306(4),第四隧道308(4)将7个业务单位从交换设备306(3)直接传递给交换设备306(4),第五隧道308(5)经由交换设备306(1)将3个业务单位从交换设备306(2)传递给交换设备306(4),以及第六隧道308(6)经由交换设备306(1)将3个业务单位从交换设备306(3)传递给交换设备306(4)。
在该示例中,故障处理服务102或业务工程控制器想要更新交换设备以调节如在第二TE配置304中所示的新的隧道310。因此,故障处理服务102可以尝试利用新的配置(例如,新的分配权重)更新交换设备306(2),使得隧道312(1)经由第一TE配置302中的隧道308(3)和308(5)传递先前传递的组合的业务(例如,7+3=10个单位)。而且,故障处理服务102或业务工程控制器可以尝试利用新的配置更新交换设备306(3),使得隧道312(2)经由第一TE配置302中的隧道308(2)和308(4)传递先前传递的组合的业务(例如,7+3=10个单位)。第二TE配置304中的隧道312(3)和隧道312(4)是从第一TE配置302中的隧道308(1)和308(2)未改变的。
因此,如果控制故障314(例如,控制平面故障)在交换设备306(2)处发生(例如,尝试更新交换设备发生故障或被延迟并且不以及时的方式实现),如在第二TE配置304中所示,则交换设备306(2)将根据第一TE配置302继续路由业务。因此,隧道312(1)将不被成功地配置为采取来自隧道308(5)的三个业务单位。然而,故障处理服务102被配置为计算针对隧道310的七个单位的业务量,这确保即使多达一个交换设备发生故障,链路拥塞也不会发生。例如,即使利用来自隧道308(5)的旧的配置业务和新的隧道310,交换设备306(1)与交换设备306(4)之间的链路的容量也不多于十单位容量(例如,3+7≤10个单位)。
虽然图3示出了控制故障在交换设备306(2)处发生(例如,可能故障的第一组合),但是图3中的TE配置可以主动地处理网络中的其他地方的控制故障,例如,在交换设备306(3)处(例如,可能故障的第二组合)。
图4是示出实现上文所描述的故障处理服务102的示例环境400的示图。在各个实施例中,可以经由一个或多个设备402实现故障处理服务102。设备402可以包括固定设备,诸如桌面计算设备、服务器计算设备等。设备402可以备选地包括移动或便携式设备,诸如膝上型计算设备、平板计算设备、智能电话设备、蜂窝电话设备、个人数字助理(PDA)设备、电子书设备等。
(一个或多个)设备402包括被配置为实现本文所描述的技术的故障处理服务102。设备402可以单独地且分离地包括一个或多个处理器404和存储器406。(一个或多个)处理器404可以是单个处理单元或多个单元,其中的每一个可以包括多个不同的处理单元。(一个或多个)处理器404可以包括微处理器、微型计算机、微控制器、数字信号处理器、中央处理单元(CPU)、图形处理单元(GPU)、安全处理器等。备选地或者附加地,可以至少部分通过一个或多个硬件逻辑部件执行本文所描述的技术中的一些或全部。例如并且非限制性地,可以使用的说明性的硬件逻辑部件的类型包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、状态机、复杂可编程逻辑设备(CPLD)、其他逻辑电路、片上系统(SoC)和/或基于指令执行操作的任何其他设备。在其他能力之间,(一个或多个)处理器404被配置为获取并执行存储在存储器406中的计算机可读指令。
存储器406可以包括计算机可读介质之一或组合。如本文所使用的,“计算机可读介质”包括计算机存储介质和通信介质。
计算机存储介质包括以用于信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的存储的任何方法或技术实现的易失性和非易失性、可移除和不可移除的介质。计算机存储介质包括但不限于相变存储器(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦可编程ROM(EEPROM)、闪速存储器或其他存储器技术、压缩盘ROM(CD-ROM)、数字多用光盘(DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备或可以被用于存储用于由设备访问的信息的任何其他介质。
相反,通信介质包括计算机可读指令、数据结构、程序模块、调制数据信号(诸如载波)中的其他数据。如本文所定义的,计算机存储介质不包括通信介质。
存储器406可以包括操作系统,其被配置成为了其他模块、部件和设备而管理在设备内和耦合到设备的硬件和服务。在一些实例中,可以在操作系统内或通过操作系统实现故障处理服务102的至少一部分。
故障处理服务102包括以下各项中的一个或多个:监视模块408、计算模块410和配置模块412。如本文所使用的,出于讨论的目的,术语“模块”旨在表示软件的示例划分,并且不旨在表示任何类型的要求或所要求的方法、方式或组织。因此,虽然讨论了各种“模块”,但是其功能和/或类似功能可以不同地布置(例如,被组合成较少数目的模块、被分解成较大数目的模块等)。进一步地,虽然某些功能和模块在本文中中被描述为由在跨越一个或多个设备的一个或多个处理器上可执行的软件和/或固件实现,但是在其他实施例中,模块中的任何或全部模块可以由硬件(例如,作为ASIC、专用处理单元等)全部或部分实现以执行所描述的功能。在其他实例中,功能和/或模块被实现为设备驱动器、固件等的一部分。
在各个实施例中,监视模块408被配置为观察(例如,网络的至少一部分的)网络拓扑和/或将网络拓扑存储在网络拓扑存储库414中。网络拓扑是网络的各个部件的布置(例如,设备位置、设备类型、设备功能、设备对之间的链路等)。网络拓扑可以包括表示网络部件的放置的物理拓扑和表示网络内的数据流的逻辑拓扑。因此,监视模块208被配置为观察并且存储从各个源设备(例如,入口交换机)传递给各个目的地设备(例如,出口交换机)的通信流。监视模块408可以根据周期性调度和/或响应于特定事件而实时确定网络拓扑。
网络拓扑还可以包括其他网络设置,例如,针对网络中的个体链路的最大链路容量(例如,带宽)、网络上的流的容量需求。如上文所讨论的,故障处理服务102计算业务量,使得确保链路将不被拥塞(例如,最大链路容量将不被超过),只要实际故障数目不多于预定的最大允许故障数目。
计算模块410被配置为计算配置设置118。计算模块410可以确定(例如,接收或者访问)来自网络拓扑存储库414的当前或最新网络拓扑。此外,计算模块410被配置为确定(例如,接收或者访问)来自故障保护等级存储库416的一个或多个故障保护等级116。故障保护等级116可以指定针对网络的预定的最大允许故障数目(例如,针对链路故障、交换机故障和/或控制故障中的一个或多个的预定最大数目)。故障保护等级存储库416可以存储由计算模块410在不同的场景中可访问的不同的故障保护等级。例如,故障处理服务102可以基于不同的时间段(例如,针对特定时区的白天对夜晚)、对网络的不同的需求等来实现不同的等级保护。
基于网络拓扑和故障保护等级,计算模块410生成表示在网络中可能潜在地发生的可能故障的不同组合(例如,故障类型、故障位置等)的模型(例如,方程组)。计算模块410可以然后使用模型计算业务量,例如作为配置设置118。如上文所讨论的,所计算的业务量允许附加业务在链路没有超过通信容量的情况下到达链路(例如,作为响应于一个或多个故障的业务重新调整过程的一部分),只要发生的故障的数目小于或等于预定的最大故障数目(例如,如针对故障类型所定义的)。在各个实现中,保护模块410可以基于可能故障的不同组合对约束进行编码,并且然后使用排序网络方法有效地求解约束,如在本文中进一步讨论的。
配置模块412被配置为发布指令,其对网络104进行配置,使得可以避免由于故障(例如,尚未发生的未知故障)的拥塞和数据分组损失。例如,配置模块412可以生成应用到网络中的交换设备的特定指令(例如,设备特定指令),使得基于由计算模块410计算的业务量来传递和/或分布业务。
在各个实施例中,故障处理服务102可以被实现为业务工程控制器的一部分。备选地,故障处理服务102可以被配置为与业务工程控制器对接。因此,设备402可以包括一个或多个通信单元418。(一个或多个)通信单元418可以被配置为促进对一个或多个网络(例如,网络104)、由各个服务或内容提供商操作的应用和/或其他设备的有线和/或无线连接。因此,(一个或多个)通信单元418可以实现各种通信或网络连接协议中的一种或多种。
图5和图6图示了被描绘为逻辑流程图的示例过程,其表示可以以硬件、软件、固件或其组合的操作序列。在软件的上下文中,操作表示当由一个或多个处理器执行时将计算设备配置为执行所记载的操作的计算机可执行指令。通常,计算机可执行指令包括例程、程序、对象、组件、数据结构等,其将计算设备配置为执行特定功能或者实现特定抽象数据类型。在一些实施例中,操作中的任何或全部操作可以全部或部分由硬件实现(例如,作为ASIC、专用处理单元等)以执行所描述的功能。在一些实例中,功能和/或模块被实现为操作系统的一部分。在其他实例中,功能和/或模块被实现为设备驱动器、固件等的一部分。
描述操作的顺序不旨在被解释为限制的,并且任何数目的描述操作可以以任何顺序组合和/或并行以实现过程。
图5图示了对网络进行配置使得其针对多达预定的最大故障数目鲁棒(例如,保证链路将不被拥塞)的示例过程500。可以参考图1至图4中的任一幅图中所图示的模块、部件和/或元件来描述图5中的示例操作。
在502处,观察模块408可以观察并存储网络拓扑(例如,在网络拓扑存储库414中)。例如,网络拓扑可以提供与网络的各个部件的布置有关的信息(例如,设备位置、设备类型、设备功能、设备对之间的链路等)。在各个实现中,所观察和所存储的网络拓扑可以包括描述网络的流的业务需求矩阵(例如,针对流的源或入口设备、针对流的目的地或出口设备、针对流的总业务量、针对流的业务的隧道分布等)。
在504处,计算模块410可以确定指定预定的最大故障数目的一个或多个故障处理等级。例如,计算模块410可以访问故障保护等级存储库416或者从管理网络的实体接收故障保护等级。在各个实现中,故障保护等级可以指示特定类型(例如,链路故障、交换机故障或控制故障)的预定的最大故障数目。因此,计算模块410可以根据网络将针对链路故障(ke)、交换设备故障(kv)、控制故障(kc)、两种类型的故障的组合或全部三种类型的故障的组合是否是鲁棒的,通过计算业务量使网络保护的等级变化。
在506处,计算模块410可以基于网络拓扑和故障保护等级来生成捕获可能故障的不同组合的模型。例如,计算模块410可以访问网络拓扑存储库414和故障保护等级存储库416中的信息。在各个实现中,模型是包括与潜在故障相关联的变量(例如,由拓扑所描述的网络布置中的故障的位置)的方程组。
在508处,计算模块410可以计算针对在网络中的链路上要被传递的个体流的业务量。例如,计算模块410可以求解方程组,使得所计算的业务量允许附加流在链路没有超过通信容量的情况下到达链路(例如,作为响应于一个或多个故障的成比例的流重新调整过程的一部分),只要发生的故障的数目小于或等于预定的最大故障数目(例如,如针对故障类型所定义的)。
在510处,配置模块410可以基于所计算的业务量生成配置设置并且将配置设置(例如,指令、命令等)提供给网络。
图6图示了使用排序网络方法使得故障处理服务可以有效地求解与可能故障的不同组合相关联的约束的示例过程600。可以参考图1至图5中的任一幅图中所图示的模块、部件、元件和/或操作来描述图6中的示例操作。例如,可以根据图5中的操作506和/或操作508实现示例过程600。
在602处,计算模块410可以基于由模型(例如,方程组)捕获的可能故障的不同组合,确定待求解的第一约束数目。如上文所讨论的,可以存在其中第一约束数目足够大使得故障处理服务102呈现有在求解约束中的计算挑战的场景。
在604处,计算模块410可以使用排序网络将第一约束数目减少到第二约束数目。这允许利用较小的计算开销来执行计算。
在606处,计算模块410可以求解第二约束数目并且计算在网络中要被传递的业务量。
在本文中提供了确定流的业务分布所执行的示例计算,使得网络针对多达预定的最大故障数目是鲁棒的。如上文所讨论的,网络104可以包括大量的设备(例如,数十、数百、数千等)。因此,由于计算和求解与可能故障的不同组合相关联的大量的约束所要求的大量的开销,因而确定可能故障的不同组合(例如,多达预定的最大数目的多个故障的位置)提出计算挑战。如果多达k个故障被允许(例如,预定最大数目),则能够经历n个可能故障(例如,位于网络104中的各个交换机之一处的交换机故障110,位于网络104中的各个链路之一处的链路故障112,网络104中的各个交换机之一处的控制故障114)的网络的计算挑战可以在式(1)中被表示如下:
使用式(1),如果n=1000(例如,大型网络中的合理的链路数目)并且k=3,则其中多达三个故障跨网络部件发生的不同组合的数目超过109。这要求求解大量的计算开销。
计算模块410被配置为通过将与可能故障的不同组合相关联的大量约束转换为“有界的M和(bounded M-sum)”问题(例如,N个变量当中的任何M的和是有界的)来减少计算开销。因此,问题中的大量约束能够被减少到对于最大或最小的M个变量的单个约束。计算模块410可以使用排序网络方法将有界的M和问题有效地编码为O(kn)线性约束,如在本文中进一步讨论的。计算模块410基于以下各项对可能故障的不同组合进行建模:(i)如果交换设备未能利用新的配置更新(例如,控制故障),则交换设备使用旧的配置;(ii)如果链路发生故障(例如,链路故障),则入口交换设备确定性地重新调整业务(例如,成比例的重新调整)。
本文所提供的讨论使用故障处理服务102保护网络免受与业务工程(TE)有关的示例实现中的故障影响。表1提供与网络的业务工程相关联使用的符号。
表1
因此,业务工程实现中的故障处理服务102的输入可以是图形G=(V;E),其中V是交换设备集合并且E是直接链路集合,其中每个直接链路在两个交换设备之间被建立。图形G可以表示由监视模块408所确定且所存储的网络拓扑的至少一部分。E中的每个链路e可以具有容量ce(例如,预定容量,诸如在图2和图3的示例中所提供的十个单位)。计算模块410可以将网络上的业务需求表示为流集合,其中每个流f是从入口交换设备传递给出口交换设备的业务的聚合。流程工程(TE)间隔中的f的带宽需求是df,并且流可以跨预先建立的隧道集合Tf传播。
在该示例实现中,计算模块410被配置为计算每个流的输出带宽分配和流中的多少可以遍历每个隧道计算模块410可以基于路径约束的多商品流问题求解(例如,计算)(例如针对DCN或WAN)带宽分配如下:
max ∑f∈Fbf 式(2)
式(2)被公式化为最大化网络吞吐量。式(3)指示在网络中没有链路将被过载。在式(3)中,l[t,e]是表示隧道t是否遍历链路e的二进制变量。式(3)指示跨隧道的流的分配的和将不小于被分配给流的速率。式(4)指示对流准许的带宽不超过流的需求并且变量是非负的。在一些实现中,计算模块410可以更新流和入口交换机的速率限制器{bf},使得它们使用在式(6)中所提供的业务分割权重:
在各个实施例中,为了对控制平面故障(例如,控制故障114)进行建模,计算模块410可以计算新的配置({bf},{af,t}),使得没有拥塞(例如,在链路处)发生,只要kc或更少的交换设备未能更新旧的配置({b’f},{a’f,t})。如本文所使用的,(i)λv=1表示针对关于入口交换机v的流中的至少一个流的配置故障,并且(ii)λv=0表示针对在入口交换机v处开始的所有流的配置已经成功。计算模块410可以通过指示每个交换设备的状态的向量λ=[λv|v∈V]来表示网络中的控制平面故障。因此,为了确保所计算的网络配置对于kc个故障是鲁棒的,网络不能在由式(7)表示的情况集合的情况下具有过载链路:
计算模块410可以在如下式(8)中捕获式(7)的要求:
在式(8)中,如果不存在如由式(9)所表示的配置故障,则是从在交换设备v处开始的流可以到达链路e的总流:
在式(9)中,s[t,v]是表示针对隧道t的源交换设备是否是v的二进制变量。
在式(8)中,是当故障发生(例如,λv=1)时从在v处开始的流的链路e的流的上限。
在式(10)中,βf,t是当故障针对f发生时隧道t上的流f的业务的上限。在其中速率限制器中的更新成功的实例中,f,t可以在式(11)中被建模为如下:
在式(11)中,w′f,t是在旧的配置中(例如,其可以由监视模块408已知或观察)的隧道t的流的分割权重。
因此,使用式(8-11),计算模块410可以找到对kc个控制平面故障鲁棒的TE配置。换句话说,网络能够处理多达数目kc个控制平面故障,而不引起网络拥塞(例如,超过其容量的链路)。
在各个实施例中,为了对数据平面故障(例如,交换机故障110或链路故障112)进行建模,计算模块410可以计算流分配使得没有拥塞发生,只要(i)故障链路的数目小于或等于ke并且(ii)发生故障交换设备的数目小于或等于kv。这可以应用于不是发生故障的交换设备上的事件的链路故障。计算模块410可以单独地考虑交换设备故障和链路故障,这是因为交换设备可能具有大量的事件链路。发生故障的链路e可以北表示为μe=1,并且发生故障的交换机可以被表示为ηv=1。如果链路或交换机尚未发生故障,则前述语句中的变量可以是零。计算模块410可以然后将数据平面故障表示为向量(μ,η),其中向量μ=[μe|e∈E]和向量η=[ηv|v∈V]。为了确保业务工程配置对于ke个链路故障和kv个交换机故障是鲁棒的并且要求在如由式(12)指定的硬件故障情况的集合下不存在过载链路:
数据平面故障可能引起拥塞,这是因为在入口交换设备重新调整流时数据平面故障更改网络上的业务分布(例如,将流从受影响的隧道移动到剩余隧道)。因此,给定故障情况(μ,η),计算模块410知道每个流f的、没有遍历故障链路和/或故障交换机的剩余隧道并且流f的剩余隧道必须能够保持如由式(13)所表示的分配速率:
在其中流f不具有剩余隧道(例如,)的情况下,在故障情况(μ,η)的情况下,流大小bf可以固定到零。因此,式(13)可以确保没有链路被超载。
查看式(13),随着剩余隧道的数目增加,网络吞吐量也增加。因此,在各个实施例中,网络拓扑可以(例如,通过故障处理服务、通过另一业务工程控制器等)被配置为通过对隧道进行布局来改善网络吞吐量,使得如果故障发生,则针对流的隧道的损失(例如,隧道损失的数目)被最小化。例如,可以基于(p,q)链路-交换机不相交隧道来配置网络,使得对于个体流而言,至多p个隧道可以遍历链路并且至多q个隧道可以遍历交换设备。参数p和q可以由故障处理服务102和/或业务工程控制器定义并且可以是流特定的。
如上文所讨论的,为了求解由于对针对网络的可能故障的不同组合进行建模的大量约束,计算模块410被配置为将约束转换为有界的M和问题并且然后使用排序网络方法来编码有界的M和问题。可以对有界的M和问题进行定义,使得给定N个变量的集合,那些变量中的任何M个变量的和应当小于或大于边界B。因此,如果NM是具有基数≤M的所有变量子集的集合,那么有界的M和问题可以在式(14)中被表示如下:
在式(14)中,S表示不同的可能故障组合。如果nj是针对N个第j个最大变量的表达,并且如果式(15)成立,则保持以上所有约束:
因此,计算模块410可以找到N个变量中的最大的M个变量的有效(线性)表达,并且因此,计算模块410可以利用可以更有效地被求解的经减少的约束数目(例如,一个约束)来替换原始约束(例如,大量的约束)。
在控制平面故障的情况下,式(8)可以被改写为式(16)以将约束转换为有界的M和问题:
利用dj是D中的第j个最大的元素,并且由于因而式(16)等同于如下式(17):
因此,计算模块410可以使用式(16)和(17)将原始个约束转换为|E|个约束(例如,针对每个链路的一个约束)。
在数据平面故障的情况下,流f的隧道可以被表示为(pf,qf)链路-交换机不相交。因此,对于数据平面故障情况而言,剩余隧道的数目不小于τf=|Tf|-kepf-kvqf。如果是Af={af,t|t∈Tf}中的第j个最小元素,那么式(18)确保式(13)中的所有约束被满足:
计算模块410可以确保所有约束被满足,这是因为式(18)中的左边是在中的任何情况下流f从其剩余隧道可以具有的最差情况的带宽分配。
计算模块410然后基于排序网络将最大的M个变量表达为线性约束。排序网络是可以对任何N个值的阵列进行排序的比较和交换运算符的网络。在图7中示出了对四个输入值702(例如,x1=6、x2=8、x3=4、x4=9)进行排序的示例排序网络700。该示例网络700基于合并排序算法,其中每个比较和交换运算符采用来自左边的两个输入、比较两个输入并且向上移动两个输入中的较大的并且向下移动两个输入中的较小的。排序网络的特性在于,比较和交换操作的顺序独立于输入而被实现。该特性允许计算模块410针对最大到最小变量中的每个变量将其计算编码为线性表达。因此,示例网络700的输出704(例如,y1、y2、y3、y4)以排序的顺序(例如,9>8>6>4)。
由于最大的M个变量将被排序,则计算模块410可以使用具有O(NM)运算符的部分网络。在各个实现中,计算模块410可以使用在若干阶段产生最大的M个值之后终止的冒泡排序来实现排序网络。
示例实现
实现A,一种方法,包括:确定针对网络的至少一部分的预定的最大故障数目;确定网络的至少一部分的一个或多个流;通过一个或多个硬件处理器并且至少部分地基于预定的最大故障数目,生成针对网络的至少一部分的一个或多个故障的不同组合的模型;至少部分地基于模型并且针对一个或多个流中的个体流,计算经由一个或多个单独路径要被传递的业务量,使得如果在网络的至少一部分中发生的实际故障的数目小于或等于预定的最大故障数目,则拥塞被避免;并且针对一个或多个流中的个体流,至少部分地基于在一个或多个个体路径上要被传递的业务量,使得业务被分布在网络的至少一部分中。
实现B,根据实现A的方法,其中一个或多个流将业务从源设备单独地传递给目的地设备并且一个或多个流遍历网络拓扑,该网络拓扑表示:网络的至少一部分中的多个设备的布置和多个设备之间的多个链路;和针对多个链路中的个体链路的容量,其中计算确保只要预定的最大故障数目不被超过,多个链路中的个体链路的容量就不被超过。
实现C,根据实现B的方法,其中计算经由一个或多个个体路径要被传递的业务量提供多个链路中的个体链路上的带宽可用性,使得如果附加流响应于不多于最大故障数目的发生而到达,则容量将不被超过。
实现D,根据实现A或实现B的方法,还包括观察网络的至少一部分的网络拓扑以对一个或多个故障的不同组合进行建模。
实现E,根据实现A到D中的任一个的方法,其中该模型包括与针对网络的至少一部分的一个或多个故障的不同组合相关联的第一约束数目,该方法还包括在计算经由一个或多个单独路径要被传递的业务量之前,使用排序网络将第一约束数目减少到小于第一约束数目的第二约束数目。
实现F,根据实现A到E中的任一个的方法,其中预定的最大故障数目与控制故障相关联,在控制故障中,一个或多个交换设备未能将当前配置从旧的配置更新到新的配置或者在将当前配置从旧的配置更新到新的配置时被延迟。
实现G,根据实现A到E中的任一个的方法,其中预定的最大故障数目与交换机故障相关联,在交换机故障中,一个或多个交换设备未能并且不能够传递业务。
实现H,根据实现A到E中的任一个的方法,其中预定的最大故障数目与链路故障相关联,在链路故障中,一个或多个链路未能并且不能够传递业务。
实现I,根据实现A到H中的任一个的方法,其中针对个体流使得业务被分布在网络的至少一部分中包括:将分布指令发布给一个或多个交换设备。
实现J,一个或多个计算机存储介质,其存储计算机可执行指令,计算机可执行指令当由一个或多个处理器执行时对一个或多个处理器进行编程以:确定针对网络的至少一部分的预定的最大故障数目;针对一个或多个个体链路,确定针对网络的至少一部分中的一个或多个链路的通信容量;计算针对网络的至少一部分的业务配置,使得只要在网络中实际发生的故障的数目小于或等于预定的最大故障数目,个体链路将不超过通信容量;以及至少部分地基于业务配置,对网络的至少一部分进行配置。
实现K,根据实现J的一个或多个计算机存储介质,其中可执行指令还对一个或多个处理器进行编程以:至少部分地基于网络的至少一部分的拓扑和预定的最大故障数目,生成可能故障的不同组合的模型,其中模型包括与针对网络的至少一部分的可能故障的不同组合相关联的第一约束数目;以及在计算针对网络的至少一部分的业务配置之前,使用排序网络将第一约束数目减少到小于第一约束数目的第二约束数目。
实现L,根据实现J或实现K的一个或多个计算机存储介质,其中预定的最大故障数目与控制故障相关联,在控制故障中,一个或多个交换设备未能将当前配置从旧的配置更新到新的配置或者在将当前配置从旧的配置更新到新的配置时被延迟。
实现M,根据实现J或实现K的一个或多个计算机存储介质,其中预定的最大故障数目与交换机故障相关联,在交换机故障中,一个或多个交换设备未能并且不能够传递业务。
实现N,根据实现J或实现K的一个或多个计算机存储介质,其中预定的最大故障数目与链路故障相关联,在链路故障中,一个或多个链路未能并且不能够传递业务。
实现O,一个或多个设备,包括:一个或多个处理器;一个或多个存储器;计算模块,其被存储在一个或多个存储器上并且由一个或多个处理器执行,以访问网络拓扑并且至少部分地基于网络拓扑计算针对网络的至少一部分的业务配置,使得只要在网络的至少一部分中实际上发生的故障的数目小于或等于预定的最大允许故障数目,网络的至少一部分中的个体链路将不超过通信容量;以及配置模块,其被存储在一个或多个存储器上并且由一个或多个处理器执行以至少部分地基于所计算的业务配置来对网络进行配置。
实现P,根据实现O的一个或多个设备,其中预定的最大故障数目与控制故障相关联,在控制故障中,一个或多个交换设备未能将当前配置从旧的配置更新到新的配置或在将当前配置从旧的配置更新到新的配置时被延迟。
实现Q,根据实现O的一个或多个设备,其中预定的最大故障数目与交换机故障相关联,在交换机故障中,一个或多个交换设备未能并且不能够传递业务。
实现R,根据实现O的一个或多个设备,其中预定的最大故障数目与链路故障相关联,在链路故障中,一个或多个链路未能并且不能够传递业务。
实现S,根据实现O到R中的任一个的一个或多个设备,其中计算模块还:至少部分地基于网络拓扑和预定的最大故障数目,生成可能故障的不同组合的模型,其中模型包括与针对网络的至少一部分的可能故障的不同组合相关联的第一约束数目;以及在计算业务配置之前,使用排序网络将第一约束数目减少到小于第一约束数目的第二约束数目。
实现T,根据实现O到S中的任一个的一个或多个设备,其中配置模块通过向一个或多个交换设备提供流分配权重来对网络进行配置。
结论
虽然本公开可以使用特定于结构特征和/或方法动作的语言,但是本发明不限于本文所描述的特定特征或动作。相反,特定特征和动作被公开为实现本发明的说明性形式。

Claims (10)

1.一个或多个计算机存储介质,存储计算机可执行指令,所述计算机可执行指令当由一个或多个处理器执行时对所述一个或多个处理器编程以:
确定针对网络的至少一部分的预定的最大故障数目;
针对一个或多个个体链路,确定针对所述网络的所述至少一部分中的一个或多个链路的通信容量;
计算针对所述网络的所述至少一部分的业务配置,使得只要在所述网络中实际发生的故障的数目小于或等于所述预定的最大故障数目,个体链路就将不超过所述通信容量;以及
至少部分地基于所述业务配置,来配置所述网络的所述至少一部分。
2.根据权利要求1所述的一个或多个计算机存储介质,其中所述可执行指令还对所述一个或多个处理器编程以:
至少部分地基于所述网络的所述至少一部分的拓扑和所述预定的最大故障数目,生成可能故障的不同组合的模型,其中所述模型包括与针对所述网络的所述至少一部分的可能故障的所述不同组合相关联的第一约束数目;以及
在计算针对所述网络的所述至少一部分的所述业务配置之前,使用排序网络将所述第一约束数目减少到小于所述第一约束数目的第二约束数目。
3.根据权利要求1所述的一个或多个计算机存储介质,其中所述预定的最大故障数目与控制故障相关联,在所述控制故障中,一个或多个交换设备未能将当前配置从旧的配置更新到新的配置或者在将所述当前配置从所述旧的配置更新到所述新的配置中被延迟。
4.根据权利要求1所述的一个或多个计算机存储介质,其中所述预定的最大故障数目与交换机故障相关联,在所述交换机故障中,一个或多个交换设备未能并且不能够传递业务。
5.根据权利要求1所述的一个或多个计算机存储介质,其中所述预定的最大故障数目与链路故障相关联,在所述链路故障中,一个或多个链路未能并且不能够传递业务。
6.一个或多个设备,包括:
一个或多个处理器;
一个或多个存储器;
计算模块,所述计算模块被存储在所述一个或多个存储器上并且由所述一个或多个处理器执行,以访问网络拓扑并且至少部分地基于所述网络拓扑来计算针对网络的至少一部分的业务配置,使得只要在所述网络的所述至少一部分中实际发生的故障的数目小于或等于预定的最大允许故障数目,所述网络的所述至少一部分中的个体链路就将不超过通信容量;以及
配置模块,所述配置模块被存储在所述一个或多个存储器上并且由所述一个或多个处理器执行,以至少部分地基于计算出的所述业务配置来配置所述网络。
7.根据权利要求6所述的一个或多个设备,其中所述计算模块还:
至少部分地基于所述网络拓扑和所述预定的最大故障数目,生成可能故障的不同组合的模型,其中所述模型包括与针对所述网络的所述至少一部分的可能故障的所述不同组合相关联的第一约束数目;以及
在计算所述业务配置之前,使用排序网络将所述第一约束数目减少到小于所述第一约束数目的第二约束数目。
8.根据权利要求6所述的一个或多个设备,其中所述配置模块通过向一个或多个交换设备提供流分布权重来配置所述网络。
9.一种方法,包括:
确定针对网络的至少一部分的预定的最大故障数目;
确定所述网络的所述至少一部分的一个或多个流;
由一个或多个硬件处理器至少部分地基于所述预定的最大故障数目生成针对所述网络的所述至少一部分的一个或多个故障的不同组合的模型;
至少部分地基于所述模型并且针对所述一个或多个流中的个体流,计算经由一个或多个个体路径要被传递的业务量,使得如果在所述网络的所述至少一部分中发生的实际故障的数目小于或等于所述预定的最大故障数目,则拥塞被避免;以及
针对所述一个或多个流中的个体流,至少部分地基于在所述一个或多个个体路径上要被传递的所述业务量,使得业务被分布在所述网络的所述至少一部分中。
10.根据权利要求9所述的方法,其中所述一个或多个流单独地将业务从源设备传递到目的地设备并且所述一个或多个流遍历网络拓扑,所述网络拓扑表示:
所述网络的所述至少一部分中的多个设备的布置和所述多个设备之间的多个链路;以及
针对所述多个链路中的个体链路的容量,其中所述计算确保只要所述预定的最大故障数目没有被超过,所述多个链路中的个体链路的所述容量就不被超过,其中所述计算经由所述一个或多个个体路径要被传递的所述业务量提供所述多个链路中的个体链路上的带宽可用性,使得如果附加流响应于不多于所述故障最大数目的发生而到达,则所述容量将不被超过。
CN201580030009.XA 2014-06-06 2015-06-04 用于故障处理的方法、系统和设备 Active CN106464531B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/298,820 US9602351B2 (en) 2014-06-06 2014-06-06 Proactive handling of network faults
US14/298,820 2014-06-06
PCT/US2015/034088 WO2015187893A1 (en) 2014-06-06 2015-06-04 Proactive handling of network faults

Publications (2)

Publication Number Publication Date
CN106464531A true CN106464531A (zh) 2017-02-22
CN106464531B CN106464531B (zh) 2019-06-18

Family

ID=53499072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580030009.XA Active CN106464531B (zh) 2014-06-06 2015-06-04 用于故障处理的方法、系统和设备

Country Status (6)

Country Link
US (1) US9602351B2 (zh)
EP (1) EP3152867B1 (zh)
JP (1) JP6527584B2 (zh)
KR (1) KR102342063B1 (zh)
CN (1) CN106464531B (zh)
WO (1) WO2015187893A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109428841A (zh) * 2017-08-30 2019-03-05 英特尔公司 针对自动化网络拥塞管理的技术
CN115250225A (zh) * 2022-07-25 2022-10-28 济南浪潮数据技术有限公司 一种基于故障域检测的网络健康监测方法、装置及介质

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10693705B2 (en) 2016-03-23 2020-06-23 Arista Networks, Inc. Show command service aka CLI relay
US10187286B2 (en) * 2016-05-23 2019-01-22 Arista Networks, Inc. Method and system for tracking network device information in a network switch
US10917284B2 (en) 2016-05-23 2021-02-09 Arista Networks, Inc. Method and system for using an OpenConfig architecture on network elements
US10812318B2 (en) * 2017-05-31 2020-10-20 Cisco Technology, Inc. Associating network policy objects with specific faults corresponding to fault localizations in large-scale network deployment
US20180351788A1 (en) 2017-05-31 2018-12-06 Cisco Technology, Inc. Fault localization in large-scale network policy deployment
KR102364386B1 (ko) * 2017-11-30 2022-02-17 재단법인대구경북과학기술원 사이버 물리 시스템의 전자 장치 및 제어 방법
WO2020040755A1 (en) * 2018-08-22 2020-02-27 Bae Systems Information And Electronic Systems Integration Inc. Wireless resilient routing reconfiguration linear program
US11178018B2 (en) 2018-09-28 2021-11-16 Arista Networks, Inc. Method and system for managing real network systems using simulation results
US11251245B1 (en) * 2019-01-21 2022-02-15 Xsight Labs Ltd. Responding to a failure of a main die of a switch data-plane device
US10880166B2 (en) 2019-02-21 2020-12-29 Arista Networks, Inc. Multi-cluster management plane for network devices
KR102287151B1 (ko) 2019-11-07 2021-08-05 데니스 아나톨예비치 필라트 배터리 충전 시스템
KR102330486B1 (ko) 2019-11-11 2021-11-23 마리아 메이 리 마스크에 탈부착 가능한 탈부착 모듈
US11057275B1 (en) 2020-09-18 2021-07-06 Arista Networks, Inc. Method and system for achieving high availability of a primary network controller in a network controller cluster using distributed network device state information
KR102683265B1 (ko) * 2021-12-02 2024-07-10 (주)위니텍 지하공동구 통합관제를 위한 시스템 및 데이터 전송방법
CN115933565B (zh) * 2022-12-23 2023-10-20 广东职业技术学院 一种agv任务交换方法、装置、系统和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7839789B2 (en) * 2008-12-15 2010-11-23 Verizon Patent And Licensing Inc. System and method for multi-layer network analysis and design
CN103138960A (zh) * 2011-11-24 2013-06-05 百度在线网络技术(北京)有限公司 网络故障处理方法及装置
CN103200027A (zh) * 2013-03-01 2013-07-10 中国工商银行股份有限公司 一种定位网络故障的方法、装置及系统
US20130227103A1 (en) * 2012-02-23 2013-08-29 Infosys Limited End-to-end network service assurance solution

Family Cites Families (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5537580A (en) 1994-12-21 1996-07-16 Vlsi Technology, Inc. Integrated circuit fabrication using state machine extraction from behavioral hardware description language
CA2161847A1 (en) 1995-10-31 1997-05-01 Wayne D. Grover Method for preconfiguring a network to withstand anticipated failures
US6078741A (en) 1997-02-05 2000-06-20 Firsttel Systems Corporation Automatic generation of reconfiguration scripts for telecommunication devices
US6724722B1 (en) 1999-03-19 2004-04-20 Lucent Technologies Inc. Managing congestion and potential traffic growth in an information network
GB2362481B (en) * 2000-05-09 2004-12-01 Rolls Royce Plc Fault diagnosis
US7073143B1 (en) 2000-11-06 2006-07-04 Cadence Design Systems, Inc. Solving constraint satisfiability problem for circuit designs
US20020130872A1 (en) 2001-03-15 2002-09-19 Elena Novikova Methods and systems for conflict resolution, summation, and conversion of function curves
US7415038B2 (en) 2001-03-29 2008-08-19 International Business Machines Corporation Method and system for network management providing access to application bandwidth usage calculations
US20030014644A1 (en) 2001-05-02 2003-01-16 Burns James E. Method and system for security policy management
WO2003015000A1 (en) 2001-08-08 2003-02-20 Trivium Systems Inc. Workflow engine for automating business processes in scalable multiprocessor computer platforms
US20030106062A1 (en) 2001-12-05 2003-06-05 Koninklijke Philips Electronics N.V. Home network environment as a state machine
US7221945B2 (en) 2002-05-03 2007-05-22 Leapstone Systems, Inc. System and method for establishing and controlling access to network resources
US7324981B2 (en) 2002-05-16 2008-01-29 Microsoft Corporation System and method of employing efficient operators for Bayesian network search
US7552205B2 (en) 2002-05-21 2009-06-23 Accenture Global Services Gmbh Distributed transaction event matching
US8140569B2 (en) 2003-05-29 2012-03-20 Microsoft Corporation Dependency network based model (or pattern)
GB0301707D0 (en) * 2003-01-24 2003-02-26 Rolls Royce Plc Fault diagnosis
US7610386B1 (en) 2003-04-29 2009-10-27 Blue Titan Software, Inc. Stateful messaging gateway
US7539741B2 (en) 2003-04-30 2009-05-26 Nokia Siemens Networks Oy System, apparatus and method for supporting constraint based routing for multi-protocol label switching traffic engineering in policy-based management
US7680055B1 (en) * 2003-09-26 2010-03-16 At&T Intellectual Property Ii, L.P. Method and apparatus for increasing survivability in IP networks
US20050076339A1 (en) 2003-10-03 2005-04-07 Nortel Networks Limited Method and apparatus for automated negotiation for resources on a switched underlay network
US8312145B2 (en) 2003-12-22 2012-11-13 Rockstar Consortium US L.P. Traffic engineering and bandwidth management of bundled links
US7564780B2 (en) 2004-01-15 2009-07-21 Fujitsu Limited Time constrained failure recovery in communication networks
US8146160B2 (en) 2004-03-24 2012-03-27 Arbor Networks, Inc. Method and system for authentication event security policy generation
US7558215B2 (en) 2004-09-24 2009-07-07 Alcatel-Lucent Usa Inc. Method for optimizing the frequency of network topology parameter updates
US7796500B1 (en) 2004-10-26 2010-09-14 Sprint Communications Company L.P. Automated determination of service impacting events in a communications network
JP4438064B2 (ja) 2004-11-15 2010-03-24 キヤノン株式会社 データ処理装置および印刷設定処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム
US7469392B2 (en) 2004-12-09 2008-12-23 Synopsys, Inc. Abstraction refinement using controllability and cooperativeness analysis
US8494539B1 (en) 2005-06-30 2013-07-23 Alcatel Lucent Congestion management in radio access networks
US7426524B2 (en) 2005-09-27 2008-09-16 International Business Machines Corporation Update processes in an enterprise planning system
US7539133B2 (en) 2006-03-23 2009-05-26 Alcatel-Lucent Usa Inc. Method and apparatus for preventing congestion in load-balancing networks
US7746784B2 (en) 2006-03-23 2010-06-29 Alcatel-Lucent Usa Inc. Method and apparatus for improving traffic distribution in load-balancing networks
US7769727B2 (en) 2006-05-31 2010-08-03 Microsoft Corporation Resolving update-delete conflicts
EP1946502B2 (en) 2006-07-12 2017-09-13 Huawei Technologies Co., Ltd. Method for controlling congestion
US8135990B2 (en) * 2006-08-11 2012-03-13 Opnet Technologies, Inc. Multi-variate network survivability analysis
US8826032B1 (en) 2006-12-27 2014-09-02 Netapp, Inc. Systems and methods for network change discovery and host name resolution in storage network environments
US7853675B2 (en) 2007-03-02 2010-12-14 International Business Machines Corporation Automatically enforcing change control in operations performed by operational management products
US7730364B2 (en) * 2007-04-05 2010-06-01 International Business Machines Corporation Systems and methods for predictive failure management
US7873592B2 (en) 2007-04-20 2011-01-18 Microsoft Corporation Type inference for object-oriented languages
US20080271022A1 (en) 2007-04-27 2008-10-30 Motorola, Inc. Utilizing graphs to detect and resolve policy conflicts in a managed entity
CN101304350B (zh) 2007-05-11 2013-02-13 华为技术有限公司 访问家庭网络设备的方法、系统和家庭网络接入设备
US8117606B2 (en) 2007-06-04 2012-02-14 Infosys Technologies Ltd. System and method for application migration in a grid computing environment
WO2009012019A1 (en) 2007-07-18 2009-01-22 Bobby Ninan Tuning routing metrics to reduce maximum link utilization and/or provide failure resiliency
EP2073478B1 (en) 2007-12-20 2011-11-16 Electronics and Telecommunications Research Institute Encryption communication apparatus and method for controlling transfer period of key resynchronization information
US8447859B2 (en) 2007-12-28 2013-05-21 International Business Machines Corporation Adaptive business resiliency computer system for information technology environments
EP2245835A2 (en) 2008-02-08 2010-11-03 Ecrio, Inc. System, method and apparatus for controlling multiple applications and services on a digital electronic device
US9098479B2 (en) 2008-02-15 2015-08-04 Edyt Inc. Methods and apparatus for improved navigation among controlled terms in one or more user documents
US8191075B2 (en) 2008-03-06 2012-05-29 Microsoft Corporation State management of operating system and applications
US8140461B2 (en) 2008-03-24 2012-03-20 Hewlett-Packard Development Company, L.P. System and method for identifying conflicting network access rules and creating a resolved consequence
US8086701B2 (en) 2008-04-28 2011-12-27 Microsoft Corporation Platform for managing and configuring network state
US8374987B2 (en) 2008-06-30 2013-02-12 Sap Ag Stateful, continuous evaluation of rules by a state correlation engine
TR201901706T4 (tr) 2008-09-18 2019-02-21 Koninklijke Philips Nv Bir sistemin ve sinyal işleme sisteminin kontrol edilmesine yönelik yöntem.
US7996719B2 (en) * 2008-10-24 2011-08-09 Microsoft Corporation Expressing fault correlation constraints
US8175846B2 (en) * 2009-02-05 2012-05-08 Honeywell International Inc. Fault splitting algorithm
US7904540B2 (en) 2009-03-24 2011-03-08 International Business Machines Corporation System and method for deploying virtual machines in a computing environment
US8144594B2 (en) 2009-03-25 2012-03-27 Comcast Cable Communications, Llc Congestion management in a shared network
US8270313B2 (en) 2009-11-13 2012-09-18 Mitsubishi Electric Research Laboratories, Inc. Ranking nodes in networks with topologies arranged as directed acyclic graphs
US9264321B2 (en) 2009-12-23 2016-02-16 Juniper Networks, Inc. Methods and apparatus for tracking data flow based on flow state values
US8364909B2 (en) 2010-01-25 2013-01-29 Hewlett-Packard Development Company, L.P. Determining a conflict in accessing shared resources using a reduced number of cycles
US8489765B2 (en) 2010-03-19 2013-07-16 Cisco Technology, Inc. Dynamic directed acyclic graph (DAG) adjustment
US9141625B1 (en) 2010-06-22 2015-09-22 F5 Networks, Inc. Methods for preserving flow state during virtual machine migration and devices thereof
US9009530B1 (en) 2010-06-30 2015-04-14 Purdue Research Foundation Interactive, constraint-network prognostics and diagnostics to control errors and conflicts (IPDN)
US8743888B2 (en) 2010-07-06 2014-06-03 Nicira, Inc. Network control apparatus and method
US8887132B1 (en) 2010-09-03 2014-11-11 Christopher R. Hunter Application runtime environment and framework
US8819220B2 (en) * 2010-09-09 2014-08-26 Hitachi, Ltd. Management method of computer system and management system
US20120101980A1 (en) 2010-10-26 2012-04-26 Microsoft Corporation Synchronizing online document edits
US20120163178A1 (en) 2010-12-23 2012-06-28 Telefonaktiebolaget L M Ericsson (Publ) Multiple-Algorithm Congestion Management
US9277422B2 (en) 2011-02-15 2016-03-01 Tata Consultancy Services Limited Dynamic self configuration engine for cognitive networks and networked devices
JP5672063B2 (ja) 2011-02-24 2015-02-18 富士通株式会社 送信制御プログラム、通信装置および送信制御方法
US20120323702A1 (en) 2011-06-16 2012-12-20 Emmanuel Puentes System and method for client-server cooperation in selecting content for display
US8661449B2 (en) 2011-06-17 2014-02-25 Microsoft Corporation Transactional computation on clusters
US8612583B2 (en) 2011-07-29 2013-12-17 Cisco Technology, Inc. Network management system scheduling for low power and lossy networks
US8898676B2 (en) 2011-08-26 2014-11-25 Vmware, Inc. Management of software updates for software components in a virtualized environment of a datacenter using dependency relationships
US9203701B2 (en) 2011-10-25 2015-12-01 Nicira, Inc. Network virtualization apparatus and method with scheduling capabilities
US9277482B2 (en) 2011-11-10 2016-03-01 Cisco Technology, Inc. Adaptive reoptimization rate for unstable network topologies
WO2013071965A1 (en) 2011-11-16 2013-05-23 Nokia Siemens Networks Oy Network coordination apparatus
DE102012003977A1 (de) * 2012-02-28 2013-08-29 Vodafone Holding Gmbh Verfahren zum Untersuchen eines Datentransportnetzwerks und Computerprogrammprodukt
US20130294250A1 (en) 2012-05-01 2013-11-07 Qualcomm Iskoot, Inc. Exchanging data between a user equipment and one or more servers over a communications network
US8995339B2 (en) 2012-06-08 2015-03-31 At&T Intellectual Property I, L.P. Network control of applications using application states
US8984480B2 (en) 2012-07-10 2015-03-17 International Business Machines Corporation Automating and/or recommending data sharing coordination among applications in mobile devices
JP2015533049A (ja) * 2012-09-20 2015-11-16 株式会社Nttドコモ ネットワークにおけるトポロジ及びパス検証のための方法及び装置
US9203759B2 (en) 2012-11-07 2015-12-01 Broadcom Corporation Switch state reporting
US9382865B2 (en) * 2014-03-26 2016-07-05 GM Global Technology Operations LLC Diagnostic systems and methods using model predictive control
AT512003A3 (de) 2013-01-23 2014-05-15 Avl List Gmbh Verfahren zur Ermittlung eines regelungstechnischen Beobachters für den SoC
US20140244218A1 (en) * 2013-02-25 2014-08-28 International Business Machines Corporation Architecture optimization
US9141682B1 (en) 2013-03-25 2015-09-22 Amazon Technologies, Inc. Resolving conflicts within saved state data
US9571304B2 (en) 2013-07-08 2017-02-14 Nicira, Inc. Reconciliation of network state across physical domains
US9929918B2 (en) 2013-07-29 2018-03-27 Alcatel Lucent Profile-based SLA guarantees under workload migration in a distributed cloud
US9454382B2 (en) 2013-10-14 2016-09-27 International Business Machines Corporation Verification of UML state machines
US9613074B2 (en) 2013-12-23 2017-04-04 Sap Se Data generation for performance evaluation
SG11201606302TA (en) 2014-02-04 2016-08-30 Tactual Labs Co Low-latency visual response to input via pre-generation of alternative graphical representations of application elements and input handling on a graphical processing unit
US9110524B1 (en) 2014-06-09 2015-08-18 Xilinx, Inc. High throughput finite state machine
US9892185B2 (en) 2014-08-19 2018-02-13 Projectwizards Gmbh Method and system for syncing data structures

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7839789B2 (en) * 2008-12-15 2010-11-23 Verizon Patent And Licensing Inc. System and method for multi-layer network analysis and design
CN103138960A (zh) * 2011-11-24 2013-06-05 百度在线网络技术(北京)有限公司 网络故障处理方法及装置
US20130227103A1 (en) * 2012-02-23 2013-08-29 Infosys Limited End-to-end network service assurance solution
CN103200027A (zh) * 2013-03-01 2013-07-10 中国工商银行股份有限公司 一种定位网络故障的方法、装置及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RUI ZHANG-SHEN,NICK MCKEOWN: "Designing a Fault-Tolerant Network Using Valiant Load-Balancing", 《IEEE INFOCOM 2008-THE 27TH CONFERENCE ON COMPUTER COMMUNICATION》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109428841A (zh) * 2017-08-30 2019-03-05 英特尔公司 针对自动化网络拥塞管理的技术
CN115250225A (zh) * 2022-07-25 2022-10-28 济南浪潮数据技术有限公司 一种基于故障域检测的网络健康监测方法、装置及介质

Also Published As

Publication number Publication date
JP6527584B2 (ja) 2019-06-05
US20150358200A1 (en) 2015-12-10
WO2015187893A1 (en) 2015-12-10
EP3152867B1 (en) 2020-04-01
EP3152867A1 (en) 2017-04-12
BR112016027284A2 (pt) 2017-08-15
JP2017518720A (ja) 2017-07-06
US9602351B2 (en) 2017-03-21
CN106464531B (zh) 2019-06-18
BR112016027284A8 (pt) 2021-07-13
KR20170017903A (ko) 2017-02-15
KR102342063B1 (ko) 2021-12-21

Similar Documents

Publication Publication Date Title
CN106464531B (zh) 用于故障处理的方法、系统和设备
CN101485156B (zh) 用于通过网络交换流量的系统和方法
CN103516632B (zh) 用于在分布式交换机中提供服务的方法和装置
CN104363159B (zh) 一种基于软件定义网络的开放虚拟网络构建系统和方法
CN102571553B (zh) 多跳分布控制面和单跳数据面交换结构系统的方法和装置
CN102783097B (zh) 分组转发系统、控制设备、转发设备以及用于准备处理规则的方法
CN106464530B (zh) 网络更新的动态调度的方法和系统
CN103812778B (zh) 流表项生成方法以及装置
CN104717098B (zh) 一种数据处理方法及装置
US8619785B2 (en) Pre-computing alternate forwarding state in a routed ethernet mesh network
CN104202264A (zh) 云化数据中心网络的承载资源分配方法、装置及系统
CN106464589A (zh) Ip网络中的部分软件定义网络交换机替换
CN107666412A (zh) 服务功能链的虚拟网络功能部署方法
CN104937572A (zh) 业务和/或工作负荷处理
CN103348638A (zh) 通信系统、控制装置、通信节点以及通信方法
CN107453992A (zh) 一种虚拟网络内的数据转发方法及系统
CN106416157A (zh) 在传输网络虚拟化中提供弹性的方法
CN105634974B (zh) 软件定义网络中的路由确定方法和装置
CN104704772A (zh) 通信系统、虚拟网络管理装置、虚拟网络管理方法和程序
CN106533966A (zh) 一种网络服务的资源编排方法及装置
CN104639437A (zh) 堆叠系统中广播报文的转发方法及装置
CN104158739A (zh) 一种ip流量工程管理方法以及装置
CN106104503B (zh) 使用统一api对用于转发的服务器和架构编程以用于细粒度网络优化
CN103873367B (zh) 路由数据分组以及确定路由的方法和装置、胖树网络
CN104469846B (zh) 一种报文处理方法及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant