CN105900378B - 使用基于早期学习机器的故障预测来触发重新路由的方法和装置 - Google Patents

使用基于早期学习机器的故障预测来触发重新路由的方法和装置 Download PDF

Info

Publication number
CN105900378B
CN105900378B CN201580003767.2A CN201580003767A CN105900378B CN 105900378 B CN105900378 B CN 105900378B CN 201580003767 A CN201580003767 A CN 201580003767A CN 105900378 B CN105900378 B CN 105900378B
Authority
CN
China
Prior art keywords
network
node
network element
element fails
occur
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580003767.2A
Other languages
English (en)
Other versions
CN105900378A (zh
Inventor
让-菲利普·瓦瑟尔
格雷戈瑞·莫穆德
素格力·达斯古普塔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cisco Technology Inc
Original Assignee
Cisco Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cisco Technology Inc filed Critical Cisco Technology Inc
Publication of CN105900378A publication Critical patent/CN105900378A/zh
Application granted granted Critical
Publication of CN105900378B publication Critical patent/CN105900378B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0836Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability to enhance reliability, e.g. reduce downtime
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/20Hop count for routing purposes, e.g. TTL
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0894Packet rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/70Routing based on monitoring results
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W40/00Communication routing or communication path finding
    • H04W40/02Communication route or path selection, e.g. power-based or shortest path routing
    • H04W40/18Communication route or path selection, e.g. power-based or shortest path routing based on predicted events
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W40/00Communication routing or communication path finding
    • H04W40/24Connectivity information management, e.g. connectivity discovery or connectivity update
    • H04W40/30Connectivity information management, e.g. connectivity discovery or connectivity update for proactive routing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Environmental & Geological Engineering (AREA)

Abstract

收集并分析网络度量。通过使用机器学习基于经收集并分析的网络度量来预测是否很可能发生网络元件故障。响应于预测到很可能发生网络元件故障,网络中的流量被重新路由以便避免网络元件故障。该应用被应用于低功率有损网络(LLN)。

Description

使用基于早期学习机器的故障预测来触发重新路由的方法和 装置
相关申请
本申请要求由Vasseur等人于2014年1月6日递交的、题为“基于学习机器的预测性和主动性计算机联网和关联的监控(LEARNING-MACHINE-BASED PREDICTIVE ANDPROACTIVE COMPUTER NETWORKING AND ASSOCIATED MONITORING)”、美国临时专利申请号为61/923,910,以及由Vasseur等人于2014年1月27日递交的、题为“使用基于早期学习机器的故障预测来触发重新路由(TRIGGERING REROUTES USING EARLY LEARNING MACHINE-BASED PREDICTION OF FAILURES)”、美国临时专利申请号为14/164,567的优先权的权益,其全部内容通过引用被结合于此。
技术领域
本公开一般地涉及计算机网络,更具体地涉及计算机网络内使用学习机器。
背景技术
低功率有损网络(LLN)(例如,物联网(IoT)网络)具有大量的应用(例如,传感器网络、智能电网和智能城市)。LLN面临各种挑战,例如有损链路、低带宽、低质量收发机、电池操作、低存储和/或处理能力等。大量的节点(大于“传统”IP网络的数量级)恶化了这些网络的具有挑战性的属性,因此很少提及路由、服务质量(QoS)、安全性、网络安排和极具挑战的流量工程。
机器学习(ML)涉及算法的开发和设计,这些算法将经验数据(例如,网络统计和性能指标)作为输入,并且识别这些数据中的复杂模式。然后通常使用这些模式来自动做出决定(即,闭环控制)或帮助做出决定。ML是用来处理非常难的问题(例如,计算机视觉、机器人学、数据挖掘、搜索引擎等)的非常宽泛的规则,但是最常见的任务为以下各项:线性和非线性回归、分类、聚集、降维、异常检测、最优化、关联规则学习。
ML算法中的一个非常常见的模式是使用下层模型M,该下层模型M的参数被优化,用于将与给定输入数据的M相关联的成本函数最小化。例如,在分类的情境下,模型M可以是将数据分成两类的直线,以使得M=a*x+b*y+c并且成本函数将是误分类点的数量。ML算法然后包括调整参数a、b、c,以使得误分类点的数量最小。在该优化阶段(或学习阶段)之后,模型M可以被非常容易地用来对新的数据点进行分类。M通常是统计模型,并且成本函数与给定输入数据的M的似然成反比。
学习机器(LM)是依赖于一个或多个ML算法的计算实体,该ML算法用于执行这些计算实体还未被准确编程以执行的任务。特别地,LM能够根据其环境来调整其行为。在LLN的情境下,更普遍地在IoT(或万联网,IoE)的情境下,由于网络将面临变化的条件和需求,并且网络将变得太大以至于网络操作者不能有效地进行管理,因此这种能力将非常重要。
到目前为止,尽管LLN整体水平比较复杂,但在(基于已知算法的)“经典”方法是无效率的情况下,或者当数据量多至人们无法处理来预测考虑一定数量的参数的网络行为时,LM还未普遍用于LLN中。
附图说明
通过参照以下结合附图的描述可以更好地理解本文的实施例,其中相似的参考标号指示相同的或功能类似的元件,其中:
图1示出了示例通信网络;
图2示出了示例网络设备/节点;
图3示出了图1的通信网络中的示例有向无环图(DAG);
图4示出了示例贝叶斯(Bayesian)网络;
图5示出了针对线性回归的示例Bayesian网络;
图6示出了用以使用基于早期LM的故障预测来触发重新路由的方法的示例;以及
图7示出了用于使用基于早期学习机器的故障预测来触发重新路由的示例简化过程。
具体实施方式
概述
根据本公开的一个或多个实施例,在具有由通信链路互连的节点的网络中,收集并分析网络度量。然后,基于经收集并分析的网络度量来预测是否很可能发生网络元件故障。响应于预测很可能发生网络元件故障,主动地对网络中的流量重新进行路由,以便在可能发生网络元件故障之前避免这种情况。
说明
计算机网络是由通信链路互连的节点和用于在末端节点(例如,个人计算机和工作站,或者诸如传感器等之类的其他设备)之间传输数据的区段的地理分布式集合。许多类型的网络是可用的,其网络类型的范围从局域网(LAN)到广域网(WAN)。LAN通常通过专用的私有通信链路来连接位于相同的一般物理位置(例如,建筑或校园)中的节点。另一方面,WAN通常通过长距离通信链路(例如,公用载波电话线、光学光路、同步光学网络(SONET)、同步数字体系(SDH)链路或电力线通信(PLC)(例如,IEEE 61334、IEEE P1901.2及其他))来连接地理上分散的节点。此外,移动自适应(Ad-Hoc)网络(MANET)是一种无线自适应网络,其通常被认为是由无线链路连接的移动路由器(和相关联的主机)的自配置的网络,其联合形成了任意拓扑。
特别地,智能对象网络(例如,传感器网络)是特定类型的、具有空间分布式的自主设备(例如,传感器、致动器等)的网络,这些空间分布式的自主设备以合作的方式监控不同位置处的物理或环境条件(例如,能量/功率消耗、资源消耗(例如,用于高级计量基础设施或“AMI”应用的水/气等)、温度、压力、振动、声音、辐射、运动、污染等)。其他类型的智能对象包括,例如负责打开/关断引擎或者执行任意其他动作的致动器。传感器网络(一种类型的智能对象网络)通常是共享介质网络(例如,无线网络或PLC网络)。就是说,除了一个或多个传感器之外,传感器网络中的每一传感器设备(节点)一般地可以被装备有无线电收发机或者其他通信端口(例如,PLC、微控制器和能源(比如,电池))。智能对象网络经常被认为是场域网(FAN)、邻域网(NAN)、个人局域网(PAN)等。一般地,智能对象节点(例如,传感器)的大小和成本约束导致相应的资源(例如,能量、存储器、计算速度和带宽)的约束。
图1是示例计算机网络100的示意框图,该示例计算机网络100示意性地包括由各种通信方法互连的节点/设备110(例如,如所示出的标记为“根”、“11”、“12”、…、“45”,以及如下面图2中所描述的)。例如,链路105可以是有线链路或者共享介质(例如,无线链路、PLC链路等),其中某些节点110(例如,路由器、传感器、计算机等)可以例如基于距离、信号强度、当前操作状态、位置等来与其他节点110进行通信。示意性的根节点(例如,FAN的场域路由器(FAR))可以将本地网络与WAN 130互连,该示意性的根节可以容纳一个或多个其他相关设备,例如管理设备或服务器150(例如,网络管理服务器(NMS)、动态主机配置协议(DHCP)服务器、受限制的应用协议(CoAP)服务器等)。本领域技术人员将理解到,在计算机网络中可以使用任意数量的节点、设备、链路等,并且本文所示的视图是为了简单起见。此外,本领域技术人员还将理解到,尽管网络以某一方向被示出(尤其具有“根”节点),但是网络100仅仅是示例图示,且不旨在限制本公开。
数据分组140(例如,流量和/或消息)可以使用预定义的网络通信协议(例如,某些已知的有线协议、无线协议(比如,IEEE Std.802.15.4、WiFi、等)、PLC协议、或者其他适当的介质共享协议)来在计算机网络100的节点/设备之间进行交换。在该上下文中,协议包括一组定义节点如何相互交互的规则。
图2是示例节点/设备200的示意框图,该示例节点/设备200可由本文所述的一个或多个实施例用作例如上面图1中所示的任意节点或设备。设备可以包括由系统总线250互连的一个或多个网络接口210(例如,有线的、无线的、PLC等)、至少一个处理器220和存储器240以及电源260(例如,电池、插件等)。
(一个或多个)网络接口210包含用于通过耦合到网络100的链路105来传送数据的机械电路、电子电路和信令电路。网络接口可以被配置为使用各种不同的通信协议来发送和/或接收数据。注意的是,节点还可以具有两种不同类型的网络连接210(例如,无线连接和有线/物理连接),并且本文中的视图只是示意性的。此外,尽管网络接口210独立于电源260示出,但对于PLC(其中,PLC信号可以被耦合至注入电源的电力线),网络接口210可以通过电源260进行通信,或者可以是电源的整体组件。
存储器240包括多个可由处理器220和网络接口210寻址的存储位置,用于存储与本文所述的实施例相关联的软件程序和数据结构。注意的是,某些设备可能具有有限的存储器或者没有存储器(例如,除了用于在设备和相关联的缓存上进行操作的程序/进程的存储器之外没有用于存储的存储器)。处理器220可以包括适于执行软件程序和操纵数据结构245的硬件元件或硬件逻辑。操作系统242的某些部分通常位于存储器240中并且由处理器执行,通过(除了其他之外)调用支持设备上执行的软件进程和/或服务来对设备进行功能组织。这些软件进程和/或服务可以包括路由处理/服务244和示意性的“学习机器”处理248,该示意性的“学习机器”处理248可以如本文所描述的那样依据网络100内的特定节点/设备被配置具有从智能学习机器算法到仅与智能学习机器进行通信的功能性范围。还注意到,尽管学习机器处理248在集中式存储器240中被示出,但替代的实施例提供在网络接口210内特定地操作该处理。
对本领域的技术人员显而易见的是,其他处理器和存储器类型(包括各种计算机可读介质)可以被用于存储和执行适于本文所述技术的程序指令。此外,尽管说明书示出了各种处理,但明确地认识到各种处理可以被实施为模块,该模块被配置为根据本文中的技术(例如,根据相似处理的功能)进行操作。此外,尽管这些处理已经被单独示出,但本领域的技术人员将认识到这些处理可以是其他处理内的例程或模块。
路由处理(服务)244包含由处理器220执行的计算机可执行指令以执行由一个或多个路由协议(例如,如本领域技术人员将了解的主动式或反应式路由协议)提供的功能。这些功能可以在有能力的设备上被配置为管理路由/转发表(数据结构245),路由/转发表包含例如用于做出路由/转发决策的数据。特别地,在主动式路由中,在计算到网络中任意目的地的路由之前,连接被发现并且是已知的,例如链路状态路由(比如,开放最短路径优先(OSPF)、或中间系统到中间系统(ISIS)、或最优链路状态路由(OLSR))。另一方面,反应式路由发现邻居(即,不具有网络拓扑的先验知识),并且响应于到目的地所需要的路由来将路由请求发送至网络,以确定哪个相邻节点可以被用于到达所期望的目的地。示例反应式路由协议可以包括:Ad-hoc按需式距离向量(AODV)、动态源路由(DSR)、动态MANET按需式路由(DYMO)等。值得注意的是,在不能或未被配置为存储路由条目的设备上,路由处理244可以仅包括提供源路由技术所需的机制。就是说,对于源路由,网络中的其他设备可以确切地告诉具有较少能力的设备将分组发送到哪里,并且告诉具有较少能力的设备简单地按照指示来转发分组。
值得注意的是,网状网络近年来已变得越来越流行和实用。特别地,共享媒体的网状网络(例如,无线的或PLC网络等)通常在被称为低功率有损网络(LLN)的网络上,LLN是路由器及其互连二者都受到限制的一类网络:LLN路由器根据约束(例如,处理功率、存储器和/或能源(电池))进行操作,并且LLN路由器的互连示意性地以高损耗率、低数据速率和/或不稳定性为特征。LLN包括从几十到高达几千或者甚至几百万的任意数量的LLN路由器,并且支持点到点流量(LLN内部的设备之间)、点到多点流量(从如在根节点处的中央控制点到LLN内部的设备的子集)以及多点到点流量(从LLN内部的设备到中央控制点)。
LLN的示例实现方式是“物联网”网络。宽松地来说,术语“物联网”或“IoT”(或“万联网”或“IoE”)可由本领域技术人员用于指代唯一可标识的对象(事物)及其在基于网络的架构中的虚拟表示。特别地,互联网演进的下一前沿是不只连接计算机和通信设备的能力,而是连接一般“对象”(例如,灯、装置、车辆、HVAC(采暖、通风和空调)、窗和遮光窗帘以及百叶窗、门、锁等)的能力。因此“物联网”一般指代诸如传感器和执行器之类的对象(例如,智能对象)通过计算机网络(例如,IP)的互连,其中计算机网络可以是公共网络或私有网络。这样的设备通常以非IP或私有协议的形式在工业领域中使用了几十年,这些非IP或私有协议以协议转换网关的方式被连接到IP网络。随着诸如智能电网、智能城市、以及建筑和工业自动化以及汽车(例如,其可以互连用于感测像电能质量、轮胎压力以及温度等之类的事物的上百万对象并且可以驱动引擎和灯)之类的大量应用的出现,对于这些网络扩展IP协议组已经极为重要。
在由Winter等人(2012年3月)提出的题为“RPL:用于低功率有损网络的IPv6路由协议(RPL:IPv6Routing Protocol for Low Power and Lossy Networks)”的互联网工程任务组(IETF)提议标准、请求注解(RFC)6550中规定的示例协议提供了这样的机制:支持从LLN内部的设备到中央控制点(例如,一般是LLN边界路由器(LBR)、FAR或“根节点/设备”)的多点到点(MP2P)流量,以及从中央控制点到LLN内部的设备的点到多点(P2MP)流量(以及点到点或“P2P”流量)。RPL(发音为“ripple”)通常可以被描述为距离向量路由协议,该距离向量路由协议除了定义限制控制流量、支持修复等的一组特征之外,还构建用于路由流量/分组140的有向无环图(DAG)。值得注意的是,如本领域技术人员可以理解的,RPL还支持多拓扑路由(MTR)的概念,从而多个DAG可以根据个体需求而被构建以载送流量。
此外,有向无环图(DAG)是具有以下属性的有向图:所有的边缘以期望不存在任何循环(回路)的方式定向。所有的边缘都被包含在指向并且终止于一个或多个根节点(例如,“簇头节点(clusterhead)”或“汇聚节点(sink)”)的路径中,通常用以将DAG的设备与较大的基础设施(例如,互联网、广域网或其他域)互连。此外,面向目的地的DAG(DODAG)是植根于单个目的地(即,植根于没有向外的边缘的单个DAG根)的DAG。DAG内的特定节点的“父”节点是该特定节点在朝向DAG根的路径上的直接后继者,以使得父节点具有比该特定节点本身更低的“等级”,其中节点的等级标识了节点相对于DAG根的位置(例如,节点离根越远,该节点的等级越高)。还注意到,树是一种DAG,其中DAG中的每一设备/节点一般都具有一个父节点或者一个优选的父节点。通常可以基于目标函数(OF)(例如,通过DAG处理和/或路由处理244)构建DAG。目标函数的作用通常是指定关于如何构建DAG的规则(例如,父节点、备用父节点等的数量)。
图3示出了示例简化DAG,该示例简化DAG可以(例如,通过以上所描述的技术)在图1的网络100内被创建。例如,可以针对每一节点选择某些链路105以与特定的父节点进行通信(并且因此,如果存在子节点,则相反地与子节点进行通信)。这些选定的链路形成了从根节点向一个或多个叶节点(没有子女的节点)延伸的DAG 310(如粗线所示)。流量/分组140(图1中所示)然后可以如本文中所特别描述的那样以向根节点的向上的方向或者向叶节点的向下的方向来遍历DAG 310。
RPL支持用于维护和使用向下的路径的两种模式的操作:
1)存储模式:RPL路由器将DAO消息直接单播至其DAG父节点。进而,RPL路由器维持其路由表中的每一DAG子节点的可达的IPv6地址。因为中间的RPL路由器存储向下的路由状态,所以该模式被称为存储模式。
2)非存储模式:RPL路由器将DAO消息直接单播至DAG根。DAO消息还包括源的DAG父节点的IPv6地址。通过从网络中的每一RPL路由器接收DAO消息,DAG根获得关于DAG拓扑的信息,并且可以使用源路由来递送数据报。不同于存储模式,非存储模式中的中间RPL路由器不维护任何向下的路径。
(一个或多个)学习机器技术
如上所述,机器学习(ML)涉及算法的设计和开发,这些算法将经验数据(例如,网络统计和性能指示器)当作输入,并且识别这些数据中的复杂模式。ML算法中的一种非常常见的模式是使用下层模型M,该下层模型M的参数被优化以用于将与给定输入数据的M相关联的成本函数最小化。例如,在分类的情境下,模型M可以是将数据分成两级的直线,以使得M=a*x+b*y+c并且成本函数将是误分类的点的数量。然后ML算法包括调整参数a、b、c,以使得误分类的点的数量最小。在该优化阶段(或学习阶段)之后,模型M可以被非常容易地用来对新的数据点进行分类。M通常是统计模型,并且成本函数与给定输入数据的M的似然成反比。
如上所述,学习机器(LM)是依赖于一个或多个ML算法的计算实体,该ML算法用于执行这些计算实体还未被准确编程以执行的任务。特别地,LM能够根据其环境来调整其行为。在LLN的情境下,更普遍地在IoT(或万联网,IoE)的情境下,由于网络将面临变化的条件和需求,并且网络将变得太大以至于网络操作者不能有效地进行管理,因此这种能力将是非常重要的。到目前为止,尽管LLN整体水平比较复杂,但在(基于已知算法的)“经典”方法是无效率的情况下,或者当数据量多至人们无法处理来预测考虑一定数量的参数的网络行为时,LM还未普遍用于LLN中。
特别地,许多LM可以以概率图模型(还称为贝叶斯网络(BN))的形式进行表达。BN是图G=(V,E),其中V为顶点集,并且E为边缘集。顶点为随机变量,例如X、Y和Z(参见图4),其联合分布P(X,Y,Z)由条件概率的乘积给出:
(公式1)p(X,Y,Z)=P(Z|X,Y)P(Y|X)p(X)
公式1中的条件概率由图4中的图形的边缘给出。在LM的情境下,BN被用于构建模型M及其参数。
为了估算节点I(或链路)的网络属性(示为xi(例如,跳数、等级、固件版本等))与给定联网度量Mi之间的关系,可以执行线性回归。更具体地说,给出以下公式:
(公式2)Mi=F(xi)=bTxi
其中,xi是所观测数据的d-空间向量(例如,终端节点属性(比如,等级、跳数、到FAR的距离等)),并且Mi是目标度量(例如,加入网络的时间),有时还以yi表示。构建这种已知所观测特征集的性能度量的模型对于执行根本原因分析、网络监控和配置是关键的:例如,作为节点等级、链路质量等的函数的路径延时可以随后被用来确定网络中是否出现异常现象,并且由此采取一些适当的动作来处理该问题。在上面的等式(公式2)中,术语ε是用来对估值Mi的不确定性和/或噪声进行建模的高斯随机变量。线性回归包括找出满足最大似然准则的权向量b(当ε为高斯随机变量时,b符合最小二乘准则)。特别地,最优的b必须将均方误差(MSE)最小化:
(公式3)MSE=∑i(bTxi-yi)2/N
其中,N是输入数据点的总数目,即,i=1,…,N。
换言之,b是每一所观测的值xi的权重集,并被用于计算提供F的值的函数F。MSE是被用于计算模型函数F的“质量”的度量。
求解公式(2)的常用方法是最小二乘法(OLS)等式,其涉及“d x d”矩阵求逆,其中d是尺寸的数量。立即出现了三个主要的问题:(1)xi的维度可能较大,因此使得OLS在计算开销(近似O(d3))方面花费过高,(2)存在线性对应(即,当若干节点属性被紧密关联时,例如,如针对跳数和ETX的情况下),OLS在数字上变得不稳定(即,四舍五入和截断误差被放大,使得MSE以指数方式增长),(3)OLS本质上是非概率的(即,OLS不负责其成分变量的整体分布,而只追踪平均值),OLS不能很好地处理噪声和极端值,并且只有当ε是高斯随机变量时,OLS才适用。
为了克服这些限制,问题可以被表述为BN(参见图5)。现在,即使此时所有变量均被观测,但该所有变量都被看作是随机变量:输入变量xi和输出变量yi均为实验数据,并且此时b是BN的(非概率)参数。通过进一步推进该方法,可以将b也转变为随机变量,并且尝试根据实验数据(也就是,xi和yi的观测值)来推断b。然而,该推理问题是有意义的,尤其当该学习算法中的一个期望特征是能够标识x的非相关维度(也就是,与输出x弱相关的输入尺寸)并且自动将b中相对应的权重设置为0(或很小的)值时。
通过一个最近提出的算法(称为可变贝叶斯最小二乘法(VBLS)回归(Ting、D'Souza、Vijayakumar和Schaal,2010))来解决该问题。也就是,该算法允许对高维度的回归问题进行有效地学习和特征选择,同时避免了使用昂贵并且数字上脆性的矩阵求逆。VBLS添加一系列不可观测的随机变量zij,该zij可以被视为因子bj·xij的有噪声的、拟造的目标,并且zij的和∑jzij为yi的估值。进而,权重bj被模型化为随机变量,从而允许自动的特征检测,即,如果在不同的xij和yi之间不存在相关性,则bj的平均值快速收敛至0。
VBLS使用一种对后验分布进行变分近似的最大期望算法的变体来对不可观测的变量zi和b的分布进行估算,这两个变量是不可解析控制的。因为VBLS是完全贝叶斯方法,所以除了隐藏参数的初始(之前)分布之外其不需要任何参数化,这些隐藏参数以不提供信息的方式被设置,即具有导致使分布变平的非常大的方差。
使用基于早期LM的故障预测来触发重新路由
处理网络故障毋庸置疑是重要的网络功能,并且已经提出了关于在网络元件故障时进行流量重新路由的多个技术。所有这些技术都是反应式的,即,在检测到故障时使用替换路径(其可以被预计算或者实时计算)。在低速网络(例如,LLN)的情况下,该问题由于以下原因被加重:与传统IP/MPLS网络相比,控制平面必须是极轻重量级的、欠反应式的(由于链路/节点频繁地故障),并且很难检测到故障(已经提出多个策略来避免使用昂贵的持续作用机制)。
因此,与现有方法相比,本文中的技术依赖于使用预测性方法,该预测性方法使用通过使用时间序列分析的学习机器(LM)来预测网络元件的故障,以使得即使在检测到故障之前可以对流量进行重新路由。
换句话说,与网络恢复的所有已知方法相比,本文中的技术提供重新路由,该重新路由(在检测到故障之前)由于通过托管于路由器或网络控制器的学习机器来计算预测模型而主动式地发生。一旦(本地)主动式重新路由触发集已经由LM计算,则网络中的每一节点将考虑到服务类型、替换路径的路径成本消耗以及故障的可能性来预计算替换路径。此后,只要由LM计算的触发的条件一经满足,流量就将主动式地并在本地进行重新路由,因此极大地提高了LLN的弹性,在该LLN中反应式和数据驱动的重新路由被认为是非常没有效率的。可选地,持续作用消息在预测的时间段期间被用来捕捉发现的可疑故障并且将具有用来改善预测模型的数据的反馈发送至LM,使得该方法可自适应。最后的组件在于依靠特定区域中的集体重新路由通知来避免疑似故障的网络元件集的能力。
在使用光学第1层基础设施或SONET/SDH的传统IP/MPLS网络中,故障是高度可预测的,这是因为这些网络的更为确定的性质。故障命运共享的概念与共享风险链路组(SRLG)共同存在,其中链路Li已知另一链路Lj有故障的故障概率Pij可以被计算并且在实践中被设置为1。更先进的研究已经表明,可以利用P<1的值计算这种相互依赖性,以便计算避免网络元件的替换(备份)路径。话虽如此,但使用快速持续作用的所有恢复机制(路由或协议,例如BFD)仍然是反应式的;不幸地是,这种方法不适用于LLN;此外,由于可以被观测的特征的数量并且因为这些网络是高度随机的,所以本文中的技术指定了一种方法,通过该方法,学习机器(LM)被用于根据所估算的故障概率来构建用于触发主动式重新路由的预测模型。
操作上,时间序列可以被表示为一系列值xl、x2、x3、…、xk。注意到,当这些值表示被LM用来预测故障概率的多个网络属性(或特征)时,这些值为向量。替换地,可以将时间序列表示为时间x(t)的函数,当在t=1、t=2、t=3,…,t=k时刻采样时,x(t)产生序列xl、x2、x3,…,xk。当前,所谓特征向量的这种给定序列主要表示在给定时刻t处的网络元件的状态,并且这些状态的序列原则上可以包括潜在的未来故障的线索。作为示例,链路的ETX和RSSI都突然丢弃的事实(表明其在不到5秒内丢弃25%)可以表明故障的概率为95%。
LM可以预测网络元件故障的方法是通过分析历史数据。
本文中的技术的第一组件包括计算以下参数集的学习机器(LM):
1)T是已经被LM选为/计算为故障概率的相关指示器的特征集。例如,T可以是{RSSI,ETX},其将被节点用来计算特征向量xT=[-94,1.4]。
2)Cond(xT)是依据xT的条件语句,如果Cond(xT)为真,则其指示具有概率P和(可选的)估算的持续时间D的即时故障。
由于LLN可以根据节点类型、位置、链路层类型等展现各种不同的行为,因此Cond、T、P和D的值可以为节点、面积或网络范围。为了达到该目的,本文中的技术指定由LM发送的新定义的IPv6消息,该LM可以位于NMS、场域路由器(FAR)或网络控制器,将新定义的IPv6消息发送至使用单播消息或多播消息的节点集(如果链路层不支持多播,则该消息可以被广播)。被称为PF()(预测故障)的消息包括以下组件:
*特征集T;
*条件语句Cond;
*概率P;以及
*(可选地)估算的持续时间D。
为了说明,参考图6,托管LM的FAR可以根据以下规则来将消息PF()多播至网络中的所有节点:假设RSSI<R_min,ETX>E_Max,P=0.8,D=15mn。注意到,被用作预测触发器的兴趣特征可以在本地被计算。注意到,在某种程度上随机网络的特征在于可以不被度量所捕获的临时现象,考虑到这些属性的易失性,这些度量被路由协议使用或者被提供给NMS。例如,在捕获RSSI的短暂而严苛的变量(越过一些阈值的RSSI()的二次导数)时,LM可以请求节点在本地捕获这些高度可变特征中的一些并且对它们进行监控,以便被用作指示网络元件故障的触发。注意到,使用由网络元件(例如,LM)所指定的本地变量是本文中的关键特征。回到以上示例,节点E可以开始监控两个变量RSSI和ETX(其属于向量T)。
在收到消息PF()时,网络中的每一节点将触发以下动作集:
1)激活对向量T中所列出的特征的监控。在一个实施例中,如果节点已经监控一些特征,则它将继续这么做,除非将监控不同的特征,则停止对那些特征的监控而开始针对新特征的监控。
2)在一个实施例中,节点可以依靠修复,在这种情况下,节点可以使用新定义的触发来在触发回到正值(重新路由流量)时,依靠路由协议来沿着所计算的替换路径对流量重新进行路由。在另一实施例中,节点将通过之前计算的替换路径来使用保护机制。在这种情况下,每一节点将预计算避免可能故障的网络元件的、可接受的替换路径,该网络元件可能故障的概率为P。注意到,考虑到路径成本的消耗和故障的概率,替换路径可以随可能被挤满的流量的CoS而变化。为了说明,考虑节点E,路由/发起服务等级为C1、C2和C3的流量;已由LM提供的两个变量被用作触发(被称为V1和V2),表明如果V1和/或V2越过一些阈值则下一跳E2的故障概率为P。节点可以计算避免E2的替换路径,然后确定存在两个路径:B1(具有路径成本消耗PCS(B1)和PCS(B2))。在一个实施例中,节点可以使用概率P以便决定是否激活流量的重新路由。在另一实施例中,节点可以根据针对相关的CoS的SLA和路径成本消耗(PCS)来确定每一流量应该使用哪个替换路径。
3)根据本地政策(由于新定义的网络管理消息而在注册时所接收的或者在节点上预配置的政策、或者DHCP),节点可以简单地决定忽略消息。这种情况还可能在以下情形下发生:节点上的资源应该是不充足的或者节点不应该要求流量的任意预测重新路由(例如,如果节点是叶节点,则重新路由/发起非关键流量)。
示例:
-考虑到P,由于P太低或者PCS太高,因此将不对等级C1的流量进行重新路由。
-考虑到PCS(B1),将使用B1(E-D-A)对等级C2的流量进行重新路由。
-考虑到PCS(B2),将使用B2(E-B-A)对等级C3的流量进行重新路由。
主动式重新路由:是流量通过其来在发生实际故障之前围绕可能已故障的元件进行路由的过程。主动式重新路由可以使用不同的机制。一旦节点确定等级Ci的流量必须在替换路径Pi上被重新路由,则在一个实施例中该节点可以将流量重新定向至替换父节点(B1的节点D),或者节点可以替换地使用例如RFC6554中所指定的源路由头部来明确对IP分组进行源路由。
如果D>0(D由LLM指定),则节点E使用可逆重新路由方法;在D期满之后,流量被返回至其原始路径,此时,节点主动监控分组成功率R持续D+Delta秒。可选地,由于被称为PFF(预测故障反馈)的新定义的单播IPv6消息在时间段D期满之后指示分组递送速率R,因此节点然后可以将信号发送回LM。LM使用这种方法来改善其预测模型并且还可能调整持续时间D。
与临时邻居持续作用:可选地,一旦主动式重新路由被激活,则节点可以开始与其下一跳的时间段为T2的低额持续作用,并且计算在时段D期间针对所发送的探测的分组递送速率。使用这样的值以便确认预测是正确的,并且该值由于以上所指定的新定义的消息PFF()而被返回。
本文中技术的另一(可选的)组件在于使用附近的节点集之间所共享的本地链路的触发。如果区域中的节点集已经接收到相似的消息PF(),则当为每一节点触发重新路由以便适当地对选定的替换路径上的流量重新进行路由时,这些节点可以使用新定义的PR()(主动式重新路由)来共享信号。例如,如果节点E确定了流量必须被重新路由(特征Ti已经越过阈值),则其可以将本地链路的IPv6消息PR()发送至附近的所有节点。一经接收到PR()消息,节点随后就可以确定最合适的替换路径并且避免整个区域与下一跳相反。回到示例,如果E和F都发送包括疑似即将发生故障的链路的PR()消息,则E可以主动式地将流量重新路由至完全不同的路径(E-F-G-H-I),以便避免网络元件的整个列表都被疑似故障。
图7示出了用于使用基于早期学习机器的故障预测来触发重新路由的示例简化过程。过程700可以在步骤705处开始,并且进行到步骤710,以此类推。
在步骤710处,在具有由通信链路互连的节点的网络中收集并分析网络度量。然后,在步骤715处,基于经收集并分析的网络度量来预测是否很可能发生网络元件故障。在步骤720处,响应于预测到很可能发生网络元件故障,网络中的流量被重新路由以便在可能发生网络元件故障之前避免这种情况。过程700可以示意性地在步骤725处结束。可以执行过程700的步骤的技术以及辅助的过程和参数在上面被详细描述。
应该注意到,图7中所示的步骤仅是用于说明的示例,并且可以根据需要包括或排除某些其他步骤。此外,尽管示出了步骤的特定顺序,但该顺序仅仅是示意性的,并且在不脱离本文实施例的范围的情况下可以利用对这些步骤的任意适当的安排。
因此,本文所描述的技术提供了使用基于早期LM的故障预测来触发重新路由的方法。特别地,本文中的技术:
1.在QoS(即对常见故障的恢复能力)很关键的LLN环境中,主动式地对流量进行重新路由。
2.由于对所检测的故障的反映不涉及信令,因此阻止了过载控制平面(路由协议)。
3.由于流量在发生故障事件时继续围绕有故障的元件流动,因此显著地改善了约束网络的弹性。
4.与LM计算实体共享预测的效力以持续改善将来的预测和主动式触发。
5.通过可逆行为来确保主动式改变不是永久的,并且LM实体在未来做决定时有机会进行改善。
注意到,本文中的技术同样可应用于反应式路由协议,例如Load-ng或者之后针对IoT所指定的其他路由协议。
示意性地,本文所述的每一个技术都可以由硬件、软件和/或固件例如根据学习机处理248来执行,该学习机器处理248可以包括由处理器220(或者接口210的独立处理器)执行的计算机可执行指令,以例如可选地结合其他处理来执行与本文所描述的技术有关的功能。例如,本文中技术的某些方面可以被视为对传统协议(例如,各种通信协议(比如,路由处理244))的扩展,并且因此相应地可以由本领域中所理解的、执行那些协议的相似的组件来处理。此外,尽管本文中技术的某些方面可以从单个节点/设备的角度进行描述,但本文所描述的实施例可以被执行为分布式智能,也被称为边缘/分布式计算,例如除了托管服务器150内的智能之外或者作为托管服务器150内的智能的替换还托管场域网的节点110内的智能。
尽管示意性地示出和描述了提供基于学习机器的预测和主动式计算机联网和相关联的监控的实施例,但通常应该理解的是,在本文中实施例的精神和范围内可以做出各种其他的改进和修改。例如,与LLN和相关协议有关的实施例已在本文中被示出和描述。然而,其更广意义中的实施例并不是限制性的,并且实际上可以与其他类型的通信网络和/或协议一起使用。此外,尽管在通信网络的具体上下文中与学习机器有关的实施例已被示出和描述,但如本领域技术人员将了解的,某些技术和/或技术的某些方面一般可以适用于学习机器,而无需与通信网络有关。
以上说明书是针对具体的实施例。然而显而易见的是,可以针对所描述的实施例做出其他改变和修改,并获得其优点中的某些或全部。例如,明确地认识到,本文中所描述的组件和/或元件可以被实现为存储于有形的(非暂态的)计算机可读介质(例如,磁盘/CD/RAM/EEPROM等)的软件,其具有在计算机、硬件、固件或其组合上执行的程序指令。因此,该说明书只以示例的方式示出并且不以其他方式限制本文中实施例的范围。因此,所附权利要求的目的是为了覆盖进入本文中实施例的真正精神和范围内的所有这些改变和修改。

Claims (23)

1.一种用于触发网络中的流量的重路由的方法,包括:
在具有由通信链路互连的节点的网络中,由运行时间序列分析的机器学习设备收集并分析网络度量;
通过所述时间序列分析的所述机器学习设备基于经收集并分析的网络度量来预测是否可能发生所述网络中其他节点中任意节点的网络元件故障;
由所述机器学习设备生成指令并将该指令发送至所述网络中的其他节点中任意节点,以预计算每个节点相应的本地替换通信路径,其中所述指令指示所述其他节点中任意节点考虑至少服务类别、替代路径的路径成本消耗和故障的可能性来预计算每个节点相应的本地替换通信路径;以及
响应于预测到可能发生所述网络中其他节点中任意节点的网络元件故障,由所述机器学习设备主动式地对所述网络中的流量进行重新路由以便在可能发生所述网络元件故障之前避免该网络元件故障。
2.如权利要求1所述的方法,还包括:
接收关于所述网络中的节点的替换通信路径的信息;以及
基于所述节点的所述替换通信路径来对所述网络中的所述流量进行重新路由。
3.如权利要求1所述的方法,其中,对流量进行重新路由是基于以下各项中的一个或多个:流量类型、替换通信路径的路径成本和网络元件故障的概率。
4.如权利要求1所述的方法,还包括:
计算网络元件故障的概率;以及
当所计算的概率超过预定的阈值时,预测可能发生所述网络元件故障。
5.如权利要求1所述的方法,其中,所述网络元件故障包括有故障的节点和有故障的通信链路中的一个或多个。
6.如权利要求1所述的方法,还包括:
确定所述网络的路由拓扑;以及
基于所确定的路由拓扑来对所述网络中的所述流量进行重新路由。
7.如权利要求1所述的方法,还包括:
基于经收集并分析的网络度量以及过去预测的结果来构建预测模型,其中,
所述预测是否可能发生所述网络元件故障还基于所述预测模型。
8.如权利要求7所述的方法,还包括:
接收关于所述预测模型的准确度的反馈;以及
基于所接收的反馈来改善所述预测模型,其中,
所述反馈包括实际上是否发生所预测的网络元件故障,或者响应于在预定的持续时间期满时被发送至所述网络中的节点的探测的信息。
9.如权利要求1所述的方法,其中,经收集并分析的网络度量是网络元件故障的指标。
10.如权利要求1所述的方法,其中,经收集并分析的网络度量包括以下各项中的一个或多个:电池寿命、天气情况、交通量、通信链路质量、信号强度、节点或通信链路的位置、通信链路的距离以及传输成功率。
11.如权利要求1所述的方法,其中,所述预测是否可能发生所述网络元件故障由学习机器(LM)执行。
12.一种用于触发网络中的流量的重路由的装置,包括:
一个或多个网络接口,所述一个或多个网络接口与网络进行通信;
处理器,所述处理器被耦合至所述一个或多个网络接口并且被配置为执行进程;以及
存储器,所述存储器被配置为存储包括可由所述处理器执行的所述进程的程序指令,所述进程包括:
在具有由通信链路互连的节点的所述网络中,收集并分析网络度量;
通过时间序列分析来基于经收集并分析的网络度量来预测是否可能发生所述网络中其他节点中任意节点的网络元件故障;
生成指令并将该指令发送至所述网络中的其他节点中任意节点,以预计算每个节点相应的本地替换通信路径,其中所述指令指示所述其他节点中任意节点考虑至少服务类别、替代路径的路径成本消耗和故障的可能性来预计算每个节点相应的本地替换通信路径;以及
响应于预测到可能发生所述网络中的其他节点中任意节点的网络元件故障,主动式地对所述网络中的流量进行重新路由以便在可能发生所述网络元件故障之前避免该网络元件故障。
13.如权利要求12所述的装置,其中,所述进程还包括:
接收关于所述网络中的节点的替换通信路径的信息;以及
基于所述节点的所述替换通信路径来对所述网络中的所述流量进行重新路由。
14.如权利要求12所述的装置,其中,对流量进行重新路由是基于以下各项中的一个或多个:流量类型、替换通信路径的路径成本和网络元件故障的概率。
15.如权利要求12所述的装置,其中,所述进程还包括:
计算网络元件故障的概率;以及
当所计算的概率超过预定的阈值时,预测可能发生所述网络元件故障。
16.如权利要求12所述的装置,其中,所述网络元件故障涉及有故障的节点和有故障的通信链路中的一个或多个。
17.如权利要求12所述的装置,其中,所述进程还包括:
确定所述网络的路由拓扑;以及
基于所确定的路由拓扑来对所述网络中的所述流量进行重新路由。
18.如权利要求12所述的装置,其中,所述进程还包括:
基于经收集并分析的网络度量以及过去预测的结果来构建预测模型,其中,
所述预测是否可能发生所述网络元件故障还基于所述预测模型。
19.如权利要求18所述的装置,其中,所述进程还包括:
接收关于所述预测模型的准确度的反馈;以及
基于所接收的反馈来改善所述预测模型,其中,
所述反馈包括实际上是否发生所预测的网络元件故障,或者响应于在预定的持续时间期满时被发送至所述网络中的节点的探测的信息。
20.如权利要求12所述的装置,其中,经收集并分析的网络度量是网络元件故障的指标。
21.如权利要求12所述的装置,其中,经收集并分析的网络度量包括以下各项中的一个或多个:电池寿命、天气情况、交通量、通信链路质量、信号强度、节点或通信链路的位置、通信链路的距离以及传输成功率。
22.如权利要求12所述的装置,其中,所述装置是学习机器(LM)。
23.一种存储有程序指令的有形非暂态计算机可读介质,所述程序指令在被计算机运行时使得所述计算机执行步骤,所述步骤包括:
在具有由通信链路互连的节点的网络中,收集并分析网络度量;
通过时间序列分析来基于经收集并分析的网络度量来预测是否可能发生所述网络中其他节点中任意节点的网络元件故障;
生成指令并将该指令发送至所述网络中的其他节点中任意节点,以预计算每个节点相应的本地替换通信路径,其中所述指令指示所述其他节点中任意节点考虑至少服务类别、替代路径的路径成本消耗和故障的可能性来预计算每个节点相应的本地替换通信路径;以及
响应于预测到可能发生所述网络中的其他节点中任意节点的网络元件故障,主动式地对所述网络中的流量进行重新路由以便在可能发生所述网络元件故障之前避免该网络元件故障。
CN201580003767.2A 2014-01-06 2015-01-05 使用基于早期学习机器的故障预测来触发重新路由的方法和装置 Active CN105900378B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201461923910P 2014-01-06 2014-01-06
US61/923,910 2014-01-06
US14/164,567 2014-01-27
US14/164,567 US9774522B2 (en) 2014-01-06 2014-01-27 Triggering reroutes using early learning machine-based prediction of failures
PCT/US2015/010146 WO2015103534A1 (en) 2014-01-06 2015-01-05 Triggering reroutes using early learning machine-based prediction of failures

Publications (2)

Publication Number Publication Date
CN105900378A CN105900378A (zh) 2016-08-24
CN105900378B true CN105900378B (zh) 2019-07-12

Family

ID=52462397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580003767.2A Active CN105900378B (zh) 2014-01-06 2015-01-05 使用基于早期学习机器的故障预测来触发重新路由的方法和装置

Country Status (4)

Country Link
US (1) US9774522B2 (zh)
EP (1) EP3092745A1 (zh)
CN (1) CN105900378B (zh)
WO (1) WO2015103534A1 (zh)

Families Citing this family (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3015989A4 (en) * 2013-06-25 2017-06-07 Nec Corporation System analysis device, system analysis method and system analysis program
US9426602B2 (en) * 2013-11-19 2016-08-23 At&T Mobility Ii Llc Method, computer-readable storage device and apparatus for predictive messaging for machine-to-machine sensors
US9575854B1 (en) * 2014-01-08 2017-02-21 Google Inc. Cascade failure resilient data storage
US10176032B2 (en) 2014-12-01 2019-01-08 Uptake Technologies, Inc. Subsystem health score
EP3041283B1 (en) 2014-12-30 2019-05-29 Comptel Corporation Prediction of failures in cellular radio access networks and scheduling of preemptive maintenance
US10911353B2 (en) 2015-06-17 2021-02-02 Extreme Networks, Inc. Architecture for a network visibility system
US10129088B2 (en) 2015-06-17 2018-11-13 Extreme Networks, Inc. Configuration of rules in a network visibility system
US10771475B2 (en) 2015-03-23 2020-09-08 Extreme Networks, Inc. Techniques for exchanging control and configuration information in a network visibility system
US9866478B2 (en) 2015-03-23 2018-01-09 Extreme Networks, Inc. Techniques for user-defined tagging of traffic in a network visibility system
US9838317B1 (en) * 2015-04-10 2017-12-05 Juniper Networks, Inc. Policy-based selective traffic reroute based on predicted traffic loss
US10530688B2 (en) 2015-06-17 2020-01-07 Extreme Networks, Inc. Configuration of load-sharing components of a network visibility router in a network visibility system
US10057126B2 (en) 2015-06-17 2018-08-21 Extreme Networks, Inc. Configuration of a network visibility system
US10601661B2 (en) 2015-06-22 2020-03-24 Arista Networks, Inc. Tracking state of components within a network element
FR3039344B1 (fr) * 2015-07-24 2018-07-27 Sagemcom Energy & Telecom Sas Procede de selection de dispositif nœud parent dans un reseau de communication sous forme d'arbre
KR101806360B1 (ko) * 2015-07-30 2018-01-11 (주)이프라임 환경감시기반 등급별 장애 예측 데이터를 생성하는 광신호 송수신 네트워크 단말장치 및 그를 포함하는 광 네트워크 이더넷 시스템
EP3131234B1 (en) 2015-08-14 2018-05-02 Accenture Global Services Limited Core network analytics system
US11635994B2 (en) 2015-10-28 2023-04-25 Qomplx, Inc. System and method for optimizing and load balancing of applications using distributed computer clusters
US11032323B2 (en) 2015-10-28 2021-06-08 Qomplx, Inc. Parametric analysis of integrated operational technology systems and information technology systems
US11757849B2 (en) 2015-10-28 2023-09-12 Qomplx, Inc. Detecting and mitigating forged authentication object attacks in multi-cloud environments
US11757920B2 (en) 2015-10-28 2023-09-12 Qomplx, Inc. User and entity behavioral analysis with network topology enhancements
US11055630B2 (en) 2015-10-28 2021-07-06 Qomplx, Inc. Multitemporal data analysis
US11968235B2 (en) 2015-10-28 2024-04-23 Qomplx Llc System and method for cybersecurity analysis and protection using distributed systems
US11005824B2 (en) 2015-10-28 2021-05-11 Qomplx, Inc. Detecting and mitigating forged authentication object attacks using an advanced cyber decision platform
US10681074B2 (en) 2015-10-28 2020-06-09 Qomplx, Inc. System and method for comprehensive data loss prevention and compliance management
US11089045B2 (en) 2015-10-28 2021-08-10 Qomplx, Inc. User and entity behavioral analysis with network topology enhancements
US11055451B2 (en) 2015-10-28 2021-07-06 Qomplx, Inc. System and methods for multi-language abstract model creation for digital environment simulations
US11055601B2 (en) 2015-10-28 2021-07-06 Qomplx, Inc. System and methods for creation of learning agents in simulated environments
CN106685674B (zh) * 2015-11-05 2020-01-10 华为技术有限公司 网络事件预测以及建立网络事件预测模型的方法和装置
US10382322B2 (en) * 2015-11-20 2019-08-13 Sap Se Data routing for electronic devices
US9954877B2 (en) * 2015-12-21 2018-04-24 Ebay Inc. Automatic detection of hidden link mismatches with spoofed metadata
US10243813B2 (en) 2016-02-12 2019-03-26 Extreme Networks, Inc. Software-based packet broker
US10396375B2 (en) 2016-03-24 2019-08-27 International Busniess Machines Corporation System and method for condition monitoring of redox flow batteries using data analytics
US10999200B2 (en) 2016-03-24 2021-05-04 Extreme Networks, Inc. Offline, intelligent load balancing of SCTP traffic
US20170339022A1 (en) * 2016-05-17 2017-11-23 Brocade Communications Systems, Inc. Anomaly detection and prediction in a packet broker
US10404548B2 (en) * 2016-08-29 2019-09-03 Cisco Technology, Inc. Control of network nodes in computer network systems
US10567259B2 (en) 2016-10-19 2020-02-18 Extreme Networks, Inc. Smart filter generator
US10747606B1 (en) * 2016-12-21 2020-08-18 EMC IP Holding Company LLC Risk based analysis of adverse event impact on system availability
US20180204129A1 (en) * 2017-01-13 2018-07-19 Cisco Technology, Inc. Predicting a user experience metric for an online conference using network analytics
US10749786B2 (en) 2017-03-01 2020-08-18 Cisco Technology, Inc. Path optimization based on reducing dominating set membership to essential parent devices
WO2018160121A1 (en) * 2017-03-02 2018-09-07 Saab Ab A communication system, a communication controller and a node agent for connection control based on performance monitoring
US10116523B1 (en) * 2017-04-12 2018-10-30 Fisher-Rosemount Systems, Inc. Predictive connectivity diagnostics for a wireless mesh network in a process control system
US10819591B2 (en) 2017-05-30 2020-10-27 At&T Intellectual Property I, L.P. Optical transport network design system
US10333961B2 (en) 2017-06-27 2019-06-25 Intel Corporation Malware detection system attack prevention
US10901832B2 (en) 2017-07-26 2021-01-26 Hitachi, Ltd. System for maintenance recommendation based on failure prediction
US10425345B2 (en) 2017-09-29 2019-09-24 Juniper Networks, Inc. Methods and apparatus for detecting a signal degradation using the pre-forward error correction bit error rate at an optical transponder
WO2019070290A1 (en) * 2017-10-06 2019-04-11 Hitachi, Ltd. MANAGEMENT AND EXECUTION OF A REPAIR
EP3704449A1 (en) * 2017-10-31 2020-09-09 ABB Schweiz AG An augmented flowmeter with a system for simulating fluid parameters
CN108055676B (zh) * 2017-11-06 2021-04-13 中通服咨询设计研究院有限公司 基于终端级别和节点数量的4g系统d2d路由选择方法
CN108092794A (zh) * 2017-11-08 2018-05-29 北京百悟科技有限公司 网络故障处理方法和装置
US11128546B2 (en) 2017-12-07 2021-09-21 Cisco Technology, Inc. Dynamic bypass tunnel instantiation based on analytical health risk heatmap
US10454780B2 (en) * 2017-12-07 2019-10-22 Cisco Technology, Inc. Optimizing source routing using machine learning
US10958506B2 (en) 2017-12-07 2021-03-23 Cisco Technology, Inc. In-situ OAM (IOAM) network risk flow-based “topo-gram” for predictive flow positioning
WO2019142331A1 (ja) * 2018-01-19 2019-07-25 株式会社日立製作所 障害予測システムおよび障害予測方法
US20190273649A1 (en) * 2018-03-02 2019-09-05 Nxp B.V. Vehicle quality of service device
US10813169B2 (en) 2018-03-22 2020-10-20 GoTenna, Inc. Mesh network deployment kit
EP3547622A1 (en) * 2018-03-29 2019-10-02 Mitsubishi Electric R&D Centre Europe B.V. Method for network management and apparatus for implementing the same
CN112740290B (zh) * 2018-06-29 2022-06-10 微软技术许可有限责任公司 多阶段云服务节点错误预测
US10644792B2 (en) 2018-07-16 2020-05-05 Juniper Networks, Inc. Methods and apparatus for adaptively detecting signal degradation in an optical communication system using the pre-forward error correction bit error rate
US11361237B2 (en) 2018-07-27 2022-06-14 Conduent Business Services, Llc Methods and systems for performing predictive maintenance on vehicle components to prevent cascading failure in a transportation system
CA3107919A1 (en) 2018-07-27 2020-01-30 GoTenna, Inc. Vinetm: zero-control routing using data packet inspection for wireless mesh networks
CN109442677B (zh) * 2018-09-18 2022-09-09 平安科技(深圳)有限公司 空调系统的故障控制方法、电子设备
US11039364B2 (en) 2018-09-28 2021-06-15 Google Llc Methods and apparatus for proactively switching between available networks
US11362837B2 (en) * 2018-12-10 2022-06-14 Cisco Technology, Inc. Generating trustable RPL messages having root-signed rank values
US11178157B2 (en) * 2019-02-05 2021-11-16 Centurylink Intellectual Property Llc Data and source validation for equipment output data or equipment failure prediction using blockchains
US10812388B2 (en) 2019-02-07 2020-10-20 Cisco Technology, Inc. Preventing damage to flows in an SDN fabric by predicting failures using machine learning
US11159447B2 (en) 2019-03-25 2021-10-26 Cisco Technology, Inc. Predictive routing using machine learning in SD-WANs
US11256562B2 (en) * 2019-03-27 2022-02-22 Honeywell International Inc. Augmented exception prognosis and management in real time safety critical embedded applications
US11006430B2 (en) 2019-04-04 2021-05-11 Cisco Technology, Inc. Event-driven radio resource management triggering
US11044191B2 (en) 2019-04-24 2021-06-22 Cisco Technology, Inc. Coupling reactive routing with predictive routing in a network
US11153178B2 (en) 2019-05-03 2021-10-19 Cisco Technology, Inc. Piggybacking control and data plane telemetry for machine learning-based tunnel failure prediction
US11474894B2 (en) * 2019-06-03 2022-10-18 Cisco Technology, Inc. Partial reroute of traffic onto a backup tunnel using predictive routing
US11063861B2 (en) * 2019-06-03 2021-07-13 Cisco Technology, Inc. Ensuring backup path performance for predictive routing in SD-WANs
CN114128230B (zh) 2019-08-13 2023-03-24 华为技术有限公司 损伤感知光网络的控制与管理
WO2021059650A1 (ja) * 2019-09-25 2021-04-01 日本電気株式会社 運用管理装置、システム、方法及びプログラムが格納された非一時的なコンピュータ可読媒体
US11577859B1 (en) 2019-10-08 2023-02-14 Rockwell Collins, Inc. Fault resilient airborne network
CN116232986A (zh) * 2019-11-01 2023-06-06 华为技术有限公司 一种路径保护方法和网络节点
US11343171B2 (en) * 2020-04-23 2022-05-24 Cisco Technology, Inc. Using a flappiness metric to limit traffic disruption in wide area networks
US11398959B2 (en) 2020-08-12 2022-07-26 Cisco Technology, Inc. Proactive routing using predicted path seasonality and trends for enhanced application experience
US11210150B1 (en) * 2020-08-18 2021-12-28 Dell Products L.P. Cloud infrastructure backup system
TWI770646B (zh) * 2020-10-23 2022-07-11 遠傳電信股份有限公司 物聯網設備管理系統及物聯網設備管理方法
CN112636998B (zh) * 2020-11-24 2022-03-08 鹏城实验室 一种基于机器学习的域内故障检测方法、终端及存储介质
US11606265B2 (en) 2021-01-29 2023-03-14 World Wide Technology Holding Co., LLC Network control in artificial intelligence-defined networking
WO2022228659A1 (en) 2021-04-27 2022-11-03 NEC Laboratories Europe GmbH A method for operating a network and a corresponding network
US11916752B2 (en) * 2021-07-06 2024-02-27 Cisco Technology, Inc. Canceling predictions upon detecting condition changes in network states
US11894872B2 (en) * 2021-11-16 2024-02-06 Cisco Technology, Inc. Route selection in optical networks based on machine learning
US11811644B2 (en) 2021-12-13 2023-11-07 Cisco Technology, Inc. Distributed predictive routing using lightweight state tracking
US11892903B2 (en) 2021-12-17 2024-02-06 Bank Of America Corporation System and method for continuous failure prediction and remediation within a computational environment using independent execution units
US11782780B2 (en) 2021-12-17 2023-10-10 Bank Of America Corporation Automatic remediation of failures within a computational environment using independent execution units

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101164289A (zh) * 2004-11-15 2008-04-16 哈里公司 包括相关系统和方法的预测性移动自组织组网

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6973034B1 (en) 1999-06-29 2005-12-06 Cisco Technology, Inc. Technique for collecting operating information from network elements, and for controlling network element behavior in a feedback-based, adaptive data network
US6446121B1 (en) 1998-05-26 2002-09-03 Cisco Technology, Inc. System and method for measuring round trip times in a network using a TCP packet
US6421720B2 (en) 1998-10-28 2002-07-16 Cisco Technology, Inc. Codec-independent technique for modulating bandwidth in packet network
US6785239B1 (en) 1999-06-01 2004-08-31 Cisco Technology, Inc. Reducing delays in a communication network using a re-fragmentation pipeline
US6577597B1 (en) 1999-06-29 2003-06-10 Cisco Technology, Inc. Dynamic adjustment of network elements using a feedback-based adaptive technique
US6539427B1 (en) 1999-06-29 2003-03-25 Cisco Technology, Inc. Dynamically adaptive network element in a feedback-based data network
US6662223B1 (en) 1999-07-01 2003-12-09 Cisco Technology, Inc. Protocol to coordinate network end points to measure network latency
US6961573B1 (en) 2000-12-22 2005-11-01 Cisco Technology, Inc. System and method for routing communications based on wireless communication link quality
US6694471B1 (en) 2000-12-27 2004-02-17 Cisco Technology, Inc. System and method for periodic retransmission of messages
US7568045B1 (en) 2001-03-30 2009-07-28 Cisco Technology, Inc. Method and apparatus for estimating periodic worst-case delay under actual and hypothetical conditions using a measurement based traffic profile
US7035937B2 (en) * 2001-04-25 2006-04-25 Cornell Research Foundation, Inc. Independent-tree ad hoc multicast routing
US6954617B2 (en) * 2003-03-31 2005-10-11 Sony Corporation Apparatus and method to improve goodput in unreliable networks
US7382765B2 (en) * 2003-04-30 2008-06-03 Harris Corporation Predictive routing in a moble ad hoc network
US7453864B2 (en) 2003-04-30 2008-11-18 Harris Corporation Predictive route maintenance in a mobile ad hoc network
US7606895B1 (en) 2004-07-27 2009-10-20 Cisco Technology, Inc. Method and apparatus for collecting network performance data
US7680047B2 (en) 2005-11-22 2010-03-16 Cisco Technology, Inc. Maximum transmission unit tuning mechanism for a real-time transport protocol stream
US8547855B1 (en) 2006-03-21 2013-10-01 Cisco Technology, Inc. Method and apparatus to schedule multiple probes for active or passive monitoring of networks
US7894488B2 (en) 2006-04-13 2011-02-22 Cisco Technology, Inc. Apparatus and method for monitoring quality metrics associated with a wireless network
US7613128B2 (en) 2006-05-31 2009-11-03 Cisco Technology, Inc. Node exclusion within a network
US8369213B2 (en) 2006-12-22 2013-02-05 Cisco Technology, Inc. Optimization of distributed tunnel rerouting in a computer network with path computation at an intermediate node
US7724676B2 (en) 2007-03-21 2010-05-25 Cisco Technology, Inc. Proactive protection mechanism based on advanced failure warning
US8005000B1 (en) 2007-04-06 2011-08-23 Cisco Technology, Inc. Effective measurement/notification of SLA in a service oriented networked environment
US9491077B2 (en) 2007-07-13 2016-11-08 Cisco Technology, Inc. Network metric reporting system
US7957295B2 (en) 2007-11-02 2011-06-07 Cisco Technology, Inc. Ethernet performance monitoring
US7948910B2 (en) 2008-03-06 2011-05-24 Cisco Technology, Inc. Monitoring quality of a packet flow in packet-based communication networks
JP5095823B2 (ja) * 2008-08-11 2012-12-12 株式会社日立製作所 トランスポート制御サーバ、ネットワークシステム及びトランスポート制御方法
US8638778B2 (en) 2009-09-11 2014-01-28 Cisco Technology, Inc. Performance measurement in a network supporting multiprotocol label switching (MPLS)
US8730819B2 (en) 2009-10-14 2014-05-20 Cisco Teechnology, Inc. Flexible network measurement
EP2375637A1 (en) * 2010-03-22 2011-10-12 British Telecommunications Public Limited Company Network routing adaptation based on failure prediction
US20110267962A1 (en) * 2010-04-29 2011-11-03 HP Development Company LP Method and system for predictive designated router handover in a multicast network
US8634314B2 (en) 2010-07-30 2014-01-21 Cisco Technology, Inc. Reporting statistics on the health of a sensor node in a sensor network
US8605591B2 (en) 2010-12-14 2013-12-10 Cisco Technology, Inc. System and method for optimizing packet routing in a mesh network
US8787392B2 (en) 2010-12-17 2014-07-22 Cisco Technology, Inc. Dynamic routing metric adjustment
EP2469756A1 (en) 2010-12-24 2012-06-27 British Telecommunications Public Limited Company Communications network management
US9143422B2 (en) 2011-03-08 2015-09-22 Cisco Technology, Inc. Determining network node performance data based on location and proximity of nodes
US8885501B2 (en) 2011-06-01 2014-11-11 Cisco Technology, Inc. Reachability rate computation without link layer acknowledgments
US9072100B2 (en) 2011-07-20 2015-06-30 Cisco Technology, Inc. Sub-slotting to improve packet success rate in carrier sense multiple access networks
US9847889B2 (en) 2011-07-20 2017-12-19 Cisco Technology, Inc. Packet trains to improve packet success rate in carrier sense multiple access networks
US9218216B2 (en) 2011-07-22 2015-12-22 Cisco Technology, Inc. Centrally driven performance analysis of low power and Lossy Networks
US8699368B2 (en) 2011-07-26 2014-04-15 Cisco Technology, Inc. Link reliability metrics in communication networks
US8630291B2 (en) 2011-08-22 2014-01-14 Cisco Technology, Inc. Dynamic multi-path forwarding for shared-media communication networks
US9277482B2 (en) 2011-11-10 2016-03-01 Cisco Technology, Inc. Adaptive reoptimization rate for unstable network topologies
US9166908B2 (en) 2011-12-20 2015-10-20 Cisco Technology, Inc. Assisted intelligent routing for minimalistic connected object networks
US8996666B2 (en) 2011-12-20 2015-03-31 Cisco Technology, Inc. Quality of service (QoS) configuration in low-power and lossy networks
US9407542B2 (en) 2011-12-20 2016-08-02 Cisco Technology, Inc. Network architecture for minimalistic connected objects
US9054831B2 (en) * 2012-01-05 2015-06-09 Ciena Corporation Optical communication network path restoration
US8630177B2 (en) 2012-02-27 2014-01-14 Cisco Technology, Inc. Dynamic directed acyclic graph (DAG) root bypass for computer networks
US9331931B2 (en) 2012-02-28 2016-05-03 Cisco Technology, Inc. Path selection based on hop metric distributions
US9030939B2 (en) 2012-03-23 2015-05-12 Cisco Technology, Inc. Building alternate routes in reactive routing networks
US9197508B2 (en) 2012-06-15 2015-11-24 Cisco Technology, Inc. Time-based scheduling for tunnels computed by a stateful path computation element
US9059929B2 (en) 2012-06-15 2015-06-16 Cisco Technology, Inc. Reliable on-demand distributed data management in a sensor-actuator fabric
US20140092753A1 (en) 2012-09-28 2014-04-03 Cisco Technology, Inc. Traffic-based quality of service (qos) monitoring in highly constrained networks

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101164289A (zh) * 2004-11-15 2008-04-16 哈里公司 包括相关系统和方法的预测性移动自组织组网

Also Published As

Publication number Publication date
US9774522B2 (en) 2017-09-26
US20150195192A1 (en) 2015-07-09
EP3092745A1 (en) 2016-11-16
CN105900378A (zh) 2016-08-24
WO2015103534A1 (en) 2015-07-09

Similar Documents

Publication Publication Date Title
CN105900378B (zh) 使用基于早期学习机器的故障预测来触发重新路由的方法和装置
US9426040B2 (en) Mixed distributed/centralized routing techniques based on closed-loop feedback from a learning machine to avoid dark zones
US10171332B2 (en) Probing technique for predictive routing in computer networks
US9338065B2 (en) Predictive learning machine-based approach to detect traffic outside of service level agreements
CN105052205B (zh) 提供无服务中断的备份网络拓扑
CN105075179B (zh) 用于基于学习机器对异常网络性能的检测的方法和装置
US9491076B2 (en) Learning end-to-end delays in computer networks from sporadic round-trip delay probing
US9565111B2 (en) Mixed centralized/distributed algorithm for risk mitigation in sparsely connected networks
US9443204B2 (en) Distributed architecture for machine learning based computation using a decision control point
CN105075180A (zh) 使用分布式学习机器反馈来动态调整一组被监控的网络属性
US9544220B2 (en) Binary search-based approach in routing-metric agnostic topologies for node selection to enable effective learning machine mechanisms
CN106416183B (zh) 使用分布式分类器的投票策略优化
EP3138247A1 (en) Centralized predictive routing using delay predictability measurements
US9553773B2 (en) Learning machine based computation of network join times
US20150326598A1 (en) Predicted attack detection rates along a network path

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant