CN108028775B - 网络环境中的触发式带内操作、管理和维护的方法和装置 - Google Patents

网络环境中的触发式带内操作、管理和维护的方法和装置 Download PDF

Info

Publication number
CN108028775B
CN108028775B CN201680054358.XA CN201680054358A CN108028775B CN 108028775 B CN108028775 B CN 108028775B CN 201680054358 A CN201680054358 A CN 201680054358A CN 108028775 B CN108028775 B CN 108028775B
Authority
CN
China
Prior art keywords
packet
network
data
nodes
data collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680054358.XA
Other languages
English (en)
Other versions
CN108028775A (zh
Inventor
戴维·D·沃德
卡洛斯·M·皮格纳塔鲁
弗兰克·布罗克纳斯
世维莎·赛布雷·班得瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cisco Technology Inc
Original Assignee
Cisco Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cisco Technology Inc filed Critical Cisco Technology Inc
Publication of CN108028775A publication Critical patent/CN108028775A/zh
Application granted granted Critical
Publication of CN108028775B publication Critical patent/CN108028775B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/40Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4633Interconnection of networks using encapsulation techniques, e.g. tunneling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4641Virtual LANs, VLANs, e.g. virtual private networks [VPN]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/54Store-and-forward switching systems 
    • H04L12/56Packet switching systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/34Signalling channels for network management communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/34Signalling channels for network management communication
    • H04L41/342Signalling channels for network management communication between virtual entities, e.g. orchestrators, SDN or NFV entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/022Capturing of monitoring data by sampling
    • H04L43/024Capturing of monitoring data by sampling by adaptive sampling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/20Arrangements for monitoring or testing data switching networks the monitoring system or the monitored elements being virtualised, abstracted or software-defined entities, e.g. SDN or NFV
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/50Routing or path finding of packets in data switching networks using label swapping, e.g. multi-protocol label switch [MPLS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/54Store-and-forward switching systems 
    • H04L12/56Packet switching systems
    • H04L12/5601Transfer mode dependent, e.g. ATM
    • H04L2012/5625Operations, administration and maintenance [OAM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0686Additional information in the notification, e.g. enhancement of specific meta-data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/34Signalling channels for network management communication
    • H04L41/344Out-of-band transfers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • H04L43/0829Packet loss
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • H04L43/087Jitter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Mining & Analysis (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本公开的实施例涉及基于触发事件来激活带内OAM。实施例的各个方面涉及:接收指示网络中的问题的第一通知;在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能;评估包括由数据收集功能扩充的数据的后续分组;以及基于被扩充至后续分组的数据确定网络中的问题。

Description

网络环境中的触发式带内操作、管理和维护的方法和装置
相关申请的交叉引用
本申请根据35 U.S.C.§119(e)要求于2015年10月20日递交的、题为“TRIGGEREDIN-BAND OPERATIONS,ADMINISTRATION,AND MAINTENANCE IN A NETWORK ENVIRONMENT(网络环境中的触发式带内操作、管理和维护)”的美国临时专利申请No.62/244,095的优先权,其全部内容通过引用被完整结合于此。
技术领域
本公开总体涉及网络领域,并且更具体地,涉及网络环境中的触发式带内操作、管理和维护。
背景技术
随着网络持续不断地大幅增长与其规模的持续扩大,需对大规模执行操作、管理和维护(OAM)、遥测、和服务水平协议(SLA)验证和报告的方式的界限进行测试与延伸。在计算机网络中,OAM包括被设计用于监视和管理网络操作的过程、功能、活动、工具等,以便检测网络故障、隔离所述故障以及测量网络性能。带内OAM可作为“永开启”服务被使用,该服务可将转发路径信息或服务路径信息以及其他信息和/或统计信息添加至网络流量。带内OAM是还可包含被动OAM和/或网络遥测(INT)的术语。所述信息可以是关于网络中每个分组所经历的状态或转发行为的非常详细的信息。如果针对网络中每个分组对于所有特征都启用带内OAM,则可能会创建大量数据。
带内OAM可以针对被应用该带内OAM的每个客户分组创建记录或数据报。也就是说,在所有流量都使用带内OAM的情况下,可以针对每个分组创建OAM数据记录。
附图说明
为了提供对本公开及其特征和优点的更完整理解,对结合附图所做的以下描述进行参考,其中,相似标号表示相似部分,其中:
图1是根据本公开的至少一个实施例示出的网络环境中的具有触发式带内操作、管理和维护(OAM)的通信系统中的示例场景的简化框图;
图2是根据本公开的至少一个实施例示出的具有触发式带内OAM的通信系统中的另一示例场景的简化框图;以及
图3是根据本公开的至少一个实施例示出的具有触发式带内OAM的通信系统中的又一示例场景的简化框图。
图4是根据本公开的实施例的用于触发网络环境中的带内操作、管理和维护的过程流程图。
图5是根据本公开的实施例的用于利用带内操作、管理和维护(iOAM)信息来扩充分组的过程流程图。
具体实施方式
实施例的各个方面涉及:接收指示网络中的问题的第一通知;在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能;评估包括由数据收集功能扩充的数据的后续分组;以及基于被扩充至后续分组的数据确定网络中的问题。
在一些实施例中,第一通知指示第一分组未通过服务平面验证,并且其中,数据收集功能包括应用于后续第二分组的分组跟踪功能,数据收集功能用包括对应于第一分组的源和目的地信息的源和目的地信息的数据来扩充第二分组。
一些实施例还可包括:接收指示第二分组未通过网络中的服务平面验证的第二通知,其中,第二通知包括与第二分组遍历网络中的一个或多个节点中的至少一者有关的分组跟踪信息。
在一些实施例中,分组跟踪信息包括导致第二分组未能通过服务平面验证的故障状况。
一些实施例可以包括识别第一分组未通过服务平面验证的原因,该识别是基于包括在与第二分组相关联的分组跟踪信息中的故障状况进行的。
在一些实施例中,第一通知是从网络中的节点或从网络外部的源接收的。
在一些实施例中,节点包括包含带内操作、管理、和维护(OAM)节点的服务节点。
在一些实施例中,在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能包括使数据被扩充至后续分组的子集,并且其中,评估包括由数据收集功能扩充的数据的后续分组包括针对所述数据来评估分组的子集。
在一些实施例中,在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能包括触发数据收集功能用关于节点或网络路径的元数据来扩充携带数据流量的分组。
在一些实施例中,在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能包括对包含标记有带内操作、管理和维护(iOAM)标签的测探数据的后续分组触发数据收集功能。
在一些实施例中,iOAM标签是使用IPv6或VxLAN-GPE报头中的一者进行传输的。
在一些实施例中,iOAM标签包括延迟相关数据、分组丢失数据、遥测数据、分组路由信息、服务功能信息、或带宽相关数据中的一者或多者。
在一些实施例中,第一通知指示等于或高于阈值的分组丢失,该等于或高于阈值的分组丢失触发iOAM监视。
在一些实施例中,第一通知指示等于或高于阈值的抖动率,该等于或高于阈值的抖动率触发iOAM监视。
一种包括硬件处理器的网络元件,该硬件处理器被配置为:接收指示网络中的问题的第一通知;在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能;评估包括由数据收集功能扩充的数据的后续分组;以及基于被扩充至后续分组的数据确定网络中的问题。
在一些实施例中,第一通知指示第一分组未通过服务平面验证,并且其中,数据收集功能包括应用于后续第二分组的分组跟踪功能,数据收集功能用包括对应于第一分组的源和目的地信息的源和目的地信息的数据来扩充第二分组。
在一些实施例中,网络元件可被配置为接收指示第二分组未通过网络中的服务平面验证的第二通知,其中,第二通知包括与第二分组遍历网络中的一个或多个节点中的至少一者有关的分组跟踪信息。
在一些实施例中,分组跟踪信息包括导致第二分组未能通过服务平面验证的故障状况。
在一些实施例中,网络元件可被配置为识别第一分组未通过服务平面验证的原因,该识别是基于包括在与第二分组相关联的分组跟踪信息中的故障状况进行的。
在一些实施例中,第一通知是从网络中的节点或从网络外部的源接收的。
在一些实施例中,服务节点包括包含带内操作、管理、和维护(OAM)节点。
在一些实施例中,在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能包括使数据被扩充至后续分组的子集,并且其中,评估包括由数据收集功能扩充的数据的后续分组包括针对所述数据来评估分组的子集。
在一些实施例中,在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能包括触发数据收集功能以用关于节点或网络路径的元数据来扩充携带数据流量的分组。
在一些实施例中,在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能包括对包含标记有带内操作、管理和维护(iOAM)标签的测探数据的后续分组触发数据收集功能。
实施例的各个方面涉及一种包括网络元件的系统,该网络元件被配置为:从网络位置接收分组并且将该分组发送到另一网络位置,该网络元件被配置为识别分组进行网络遍历中的错误;以及向网络控制器或入口节点或可触发iOAM监视的另一节点发送关于该错误的通知。网络控制器可以被配置为从网络元件接收关于错误的通知;以及指示网络的一个或多个网络元件激活数据收集功能。
在一些实施例中,网络控制器被配置为针对将遍历网络的分组来配置带内操作、管理和维护(iOAM)路径跟踪。
在一些实施例中,网络元件包括被配置为检查到达网络元件的分组的服务链验证者(SCV)网络元件;针对该分组验证一个或多个策略;以及通知网络控制器关于未通过的策略。
在一些实施例中,网络元件被配置为用与一个或多个分组专用或网络专用的策略有关的带内操作、管理和维护(iOAM)信息来扩充携带数据流量的分组。
在一些实施例中,网络元件被配置为从网络位置接收包括带内操作、管理和维护(iOAM)信息的分组;基于该iOAM信息确定该分组的路径跟踪;以及向网络控制器转发具有来自分组的路径跟踪信息的通知。
实施例的各方面涉及一种具有指令的非暂态计算机可读介质,这些指令在被运行时可进行操作用以:接收指示网络中的问题的第一通知;在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能;评估包括由数据收集功能扩充的数据的后续分组;以及基于被扩充至后续分组的数据确定网络中的问题。
在一些实施例中,第一通知指示第一分组未通过服务平面验证,并且其中,数据收集功能包括应用于后续第二分组的分组跟踪功能,数据收集功能用包括对应于第一分组的源和目的地信息的源和目的地信息的数据来扩充第二分组。
一些实施例还可包括:接收指示第二分组未通过网络中的服务平面验证的第二通知,其中,第二通知包括与第二分组遍历网络中的一个或多个节点中的至少一者有关的分组跟踪信息。
在一些实施例中,分组跟踪信息包括导致第二分组未能通过服务平面验证的故障状况。
一些实施例可以包括识别第一分组未通过服务平面验证的原因,该识别是基于包括在与第二分组相关联的分组跟踪信息中的故障状况进行的。
在一些实施例中,第一通知是从网络中的节点或从网络外部的源接收的。
在一些实施例中,节点包括包含带内操作、管理、和维护(OAM)节点的服务节点。
在一些实施例中,在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能包括使数据被扩充至后续分组的子集,并且其中,评估包括由数据收集功能扩充的数据的后续分组包括针对所述数据评估分组的子集。
在一些实施例中,在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能包括触发数据收集功能以用关于节点或网络路径的元数据来扩充携带数据流量的分组。
在一些实施例中,在网络中的一个或多个节点上针对遍历该一个或多个节点的后续分组触发数据收集功能包括对包含标记有带内操作、管理和维护(iOAM)标签的测探数据的后续分组触发数据收集功能。
在一些实施例中,iOAM标签是使用IPv6或VxLAN-GPE报头中的一者进行传输的。
在一些实施例中,iOAM标签包括延迟相关数据、分组丢失数据、遥测数据、分组路由信息、服务功能信息、或带宽相关数据中的一者或多者。
在一些实施例中,第一通知指示等于或高于阈值的分组丢失,该等于或高于阈值的分组丢失触发iOAM监视。
在一些实施例中,第一通知指示等于或高于阈值的抖动率,该等于或高于阈值的抖动率触发iOAM监视。
为了说明本文所公开的带内操作、管理和维护(OAM)系统的某些示例技术,重要的是理解可遍历网络进行的通信和用于实现这种通信的协议。以下基本信息可以被视为可恰当解释本公开的基础。
带内OAM(iOAM)对流量是如何转发的进行记录。为了实现这点,可以使用例如互联网协议版本6(IPv6)中可用的扩展报头、网络服务报头、分段路由、VxLAN-GPE、MPLS等来将诸如元数据或其他关联数据之类的信息直接插入网络流量中。这些信息可用于故障排除、规划、和路径或服务链验证,并可被插入到任何网络流量中,而不仅仅只是探测流量。信息可以在选定的节点处被插入并从出口设备进行撷取。信息是广泛分布的路径和节点或服务数据。信息的示例可以包括但不限于入口或出口接口标识符、时间戳、节点或服务标识符、描述服务或网络元件的秘密共享、序号、通用应用元数据、CPU利用率、和/或接口统计信息(例如,下降百分比、利用率等)。
在一个场景中,带内OAM可以用于路径或服务链验证。该验证可以证明某些流量(例如,与由所使用的源IP地址、目的地IP地址、端口、和协议识别的应用相关联的流量)遍历特定的流量链或路径。在另一示例场景中,带内OAM可用于进行流量通过网络的跟踪并检测有问题的路径。而且,应用特定的分组也可以被跟踪。应用特定的信息可在每个节点处被包括在分组中。
如果iOAM“永开启”并且针对网络中的每一分组针对所有特征都要被启用,则生成大量数据的可能性是非常高的。并非对所有流量都要“永开启”所有的OAM数据生成,通过在需要时启用iOAM提高了iOAM的效率,在这种情况下,能以最少量的开销来提供最大量的可用网络洞察。
上述由iOAM针对所有流量创建的可操作数据的总量是一个所关心的方面。另一关心方面可包括iOAM的使用会导致转发元件上成本的提高。例如,iOAM的重度使用或“永开启”使用可导致转发元件的CPU负载非常高(因为数据的处理与插入不是无偿的,特别是在不在基于软件的转发器上进行数据的处理和插入时)或性能的下降。另外,并非所有的带内OAM功能都具有相同的特性,例如,由于服务/路径验证需要对每个分组进行读-计算-写操作,因此相比例如在仅嵌入节点ID时对流量的影响是不同的。
类似地,时间戳数据的添加(取决于时钟查找的效率)可能比添加入口或出口链接等数据的代价更大,所有的这些都使得人们并不希望所有iOAM功能在所有时刻都处于被开启状态。要考虑的另一“问题”是所收集的元数据的大小。添加的元数据量越大,需要的开销就越多。这意味着如果在网络中使用iOAM,则应用的有效路径MTU(最大传输单元)可能会更少。
触发式OAM可以在若干实例中使用。通常,所使用的是对失败进行信号告知的传统带外OAM。一些示例包括接入点控制协议(ANCP)OAM,用于触发本地环路上异步传输模式(ATM)(F4/F5)环回信元的生成。此外,多协议标签交换(MPLS)OAM或网络虚拟化覆盖(NVO3)OAM可作为保护式触发被使用。在另一示例中,Y.1731/以太网连接故障管理(CFM)(802.1ag)OAM部署也可以采用触发式OAM。
Y.1731的示例包括警报指示信号(AIS)和远程故障指示(RDI)警报之类警报。这些触发式警报指示带外OAM的使用,而非触发式带内OAM。此外,这些警报元件是在运输层进行操作的,而不是在服务平面上操作的。
本文描述的实施例可以解决与带内OAM相关的前述问题(其他问题)。本文公开的实施例提供了一种具有触发式带内OAM能力的通信系统,这种系统可根据需要来动态地创建详细信息。通信系统可以包括多个节点,这些节点可以由在网络环境中通传的分组进行遍历。通信系统还可以包括与多个节点进行通信的控制器。在具有触发式带内OAM功能的通信系统中创建的详细信息可在指示故障或提示潜在问题的情况下被生成。本文公开的用于针对互联网协议(IP)和覆盖技术(VxLan-GPE、SH、MPLS等)的触发式带内OAM的实施例在网络的服务路径上进行操作并且使用户的注意力集中在对实际的网络行为的分析上。通信系统的第一实施例提供了在外部事件或带内OAM自身情况下触发的选择性多级带内OAM。通信系统的第二实施例提供了(可以是单级的)带内探测式的带内触发。通信系统的第三实施例提供了带内OAM采样。
本文公开的实施例提供了若干优点。首先,本文公开的实施例针对网络地址转换提供了高可扩展性和优化。本文公开的实施例可以减少由带内OAM生成的数据量,并聚焦于针对用户(例如,网络运营商或管理员)感兴趣的信息所创建的数据。本文公开的实施例还就数据平面以及后处理分析方面实现了相应扩展。此外,实施例对于真实数据是真正带内的,而不使用发送错误消息或F4/F5报警的互联网控制消息协议(ICMP)。例如,触发式带内OAM不仅仅用于警报信号传递,还可以以触发的方式用于性能度量。此外,实施例涉及服务路径层面的触发式OAM,其有效地创建了触发式服务遥测。此外,本文公开的实施例提供了灵活性并可提高仪器和遥测的信噪比。
第一实施例提供了一种具有多级触发式OAM的通信系统,其中,带内OAM的一个或多个数据收集能力是基于触发被启用的。触发的数据源可以是带内OAM本身,也可以是其他外部事件。在示例场景中,网络异常可以被网络节点检测到。在检测到异常后,可以针对特定的一组流来启用特定的一组带内OAM功能,以提供进一步的洞察。在一些实施例中,检测到异常的网络节点可以直接向一组入口节点发送触发,或者可以将该异常报告给控制器,控制器随后决定哪些iOAM功能应该在哪些网络节点上被启用。事件与要被触发的特定iOAM数据收集之间的关联可以由语义推理器来驱动,其中,所述语义推理器是由触发应用所知的网络模型驱动的。
在一些实施例中,触发可以以不同方式被通传。例如,检测到异常的节点可以发送触发以使之在诸如服务路径之类的通信路径内转发,从而使所述异常根据特定上下文(即,服务链的环境情况、检测到异常的节点、数据分组的内容等)被解释。该节点还可以将触发发送到预定义的汇聚点、代理点等。在任何情况下,触发的接收器都可以激活iOAM数据收集。
现提供具有多级触发式带内OAM的通信系统的示例场景。用户(例如,网络运营商或管理员等)可以使用带内OAM来验证服务A、B和C的服务链的正确运作。例如,针对IPv6的iOAM在数据分组中携带中转证明(proof-of-transit)数据。服务节点(例如,服务节点C)可以充当验证者。如果服务节点C检测到策略外分组,用户可能就会想知道为什么分组未通过路径/服务验证。例如,分组可能错过了特定的服务和/或节点。iOAM中的中转证明数据可指示服务链没有进行正确遍历,但不能识别发生故障的位置。
多级触发式带内OAM可以实现对系统中发生故障的位置的识别。首先,诸如服务节点C之类的验证服务节点检测到特定分组X的故障,并将该故障报告给控制器。控制器针对服务链上的与分组X具有相同源和目的地的所有分组触发(例如,启用、促进、开启、启动等)带内OAM流跟踪。在至少一些实施例中,触发可以作为Netconf通知被执行或者也可以是Netflow/IPFIX记录、Kafka消息缓存代理(broker)客户端、Google协议缓冲区等。当带内OAM流跟踪被触发时,服务节点C报告每个具有与分组X相同的源和目的地的分组的详细路径信息。这被称为“多级”,其中,(例如用户)所选的要求得以遵循,并且不同的带内OAM功能被启用或禁用。
当下一次验证失败时,控制器不仅接收到分组未通过服务链验证的通知,而且还接收到详细的流跟踪信息。例如,假设跟踪表明分组X访问了服务节点A、Z和C,但没有访问服务节点B。有了这些信息,用户现在可以专注于对服务节点B的调试。
作为多级iOAM的一个示例可以包括:
-级别0:首先,不涉及iOAM;可包括虽检测到网络问题但还达不到可受益于iOAM监视的情况;
-级别1:活跃OAM(例如,ping)的失败触发利用粗采样和序号进行的iOAM。
-级别2:语义推理器不检测序号上的异常,即使语义推理器应该这样做:可以触发序号的细粒度采样。丢失/重排序可被检测到。
-级别3:触发对似乎会经历偶尔发生丢失的分组进行详细跟踪(节点和时间戳记录)-以便识别出问题根源的节点。
每个级别都可以自动激活。
图1-图3根据至少一个实施例示出了网络环境中的具有带内OAM的示例通信系统。图1示出了网络100中的带内OAM的正常操作。控制器102在服务节点A 104、B 106和C 110上配置服务链/路径验证(SCV)。服务节点C 110可以充当验证者。当分组遍历服务链114时,服务节点C 110提供连续监视并检查分组是否已经正确地遍历服务链。网络100还包括节点Z108。每个节点(或网络元件)可以经由通信路径(例如,通信路径112)被耦合。
图2示出了在通信系统200中发生的异常/失常以及使用多级触发式带内OAM来识别关于所述异常/失常的相关信息的示例场景。在图2中,分组X未通过服务链验证(即对分组X的验证失败)。验证者(例如,本示例中的服务节点C 110)向控制器102发送触发/通知(例如,Netconf通知)与关于失败的信息(即,关于未通过的分组X的细节)。该通知的接收可使控制器配置附加带内OAM功能。在图2的示例中,要被配置的附加带内OAM功能是针对看起来像分组X的分组的路径跟踪。在一个示例中,路径跟踪可以包括针对例如具有与分组X相同的源和目的地信息(例如,网络地址、端口、协议)的分组记录节点和进入/外出接口信息。
图3示出了在通信系统中配置附加带内OAM功能之后再次发生异常/失常的示例场景300。在图3的示例中,在发生异常/失常和附加带内OAM功能的动态配置之后,可针对与分组X具有相同源和目的地的后续分组生成详细信息。在一个示例中,该详细信息可因在通信系统100的一个或多个节点中进行的路径跟踪的动态配置而被生成。如图3所示,分组“X+1”经由服务节点A 104、节点Z 106和服务节点C 110并绕过服务节点B 106来遍历通信系统。分组X+1到达服务节点C 110并且未通过服务链验证。但是,由于路径跟踪的配置,分组X+l包含iOAM6路径跟踪信息。控制器(继而用户)可知晓SCV失败可能是由于分组绕过服务节点B 106而引起的。
在触发式带内OAM的另一示例中,用户在访问实时网络应用时对抖动进行观察。用户可以通过门户来登录,以便进行所述观察。抖动可转换为用于针对特定用户和应用触发带内OAM而进行评估的事件。该事件评估可致使触发带内OAM功能来收集时间戳和路径分组计数器,以便识别问题的原因。所收集的数据可以给出引起网络中延迟、分组重排序和/或分组丢失的点的详细信息。
基于网络状况,某些带内OAM能力被启用或禁用。这允许所收集的操作数据集中于基于特定实现方式、偏好和/或需求所期望或需要的特定数据。任何没有用途的数据可以通过不被生成或收集来避免。这样可使数据创建过程和数据后处理期间的性能受益。这也促使对可由于更高级别的编程网络调试而立即采取纠正措施的应用的使用。
第二实施例提供了一种具有带内触发式探测(probing)的通信系统。通过依靠用带内OAM标记的探测数据可减少所创建的OAM信息的总量。这是单级触发式带内OAM。
为了调试或分析某些网络场景,用户可能希望向网络发送特定的探测数据。这种数据不同于ping或跟踪数据,至少部分是因为探测数据可以类似于正常的应用数据。这可确保网络以与常规流量相同的方式来处理和转发探测数据。
在至少一个实施例中,带内OAM可被配置为使带内OAM信息仅被添加至探测数据。目前可使用特定的探测数据来确定网络的健康状况。通过带内触发式探测所提供的附加信息可有助于对特定故障及其原因的识别。
在至少一个实施例中,取代使用类似于网络数据的探测分组,真实的网络分组可被使用。例如,我们可以在入口(无论哪种粒度)处配置分类器来专注于特定的流(例如,铂金服务、风险/额外安全检查所需的流等),并在入口处将这些分组标记在iOAM报头中。接着,下游节点可基于分组中携带的元数据(标签)以触发式iOAM方式对报头执行操作。带内OAM的带内触发的另一示例是设置在分类器处的特定流量模式或标志。
第三实施例提供了一种具有使用顺序和/或时间触发的采样OAM的通信系统。采样带内OAM数据可以减少呈现给分析系统的数据量。可通过使用采样减少数据量来增加可扩展性。在至少一个实施例中,(1)仅每第n个分组包括所添加的带内OAM信息,或者(2)在出口节点处仅分析来自每第n个分组的信息。此外,每第n个分组的采样可以通过分组着色(例如,通过使用访问控制列表(ACL))进行源控制或基于本地资源阈值(例如,缓冲、带宽等)由网络元件控制。
采样率和算法的其他示例可以根据所触发的信息进行调整。例如,如果观察到网络中的分组丢失,则可打开iOAM以向分组添加序号来对分组丢失量进行检测。如果采样过于粗糙,则该采样可能无法正确示出分组丢失问题(例如,如果每第10个分组出现丢失,但采样仅对每第1000个分组进行查看,则就有可能无法检测到丢失)。iOAM可被触发来对采样进行缩放,以便更好地检测分组丢失。
在至少一个实施例中,“n”可以是函数而不是固定值。例如,采样率可以是关于流长度的函数:流持续时间越长,标记有带内OAM信息的分组越少。在其他实施方式中,采样率可以是时间触发的函数。采样率可以基于触发(例如,流长度阈值)进行调整。
本文描述的几个实施例(例如,由外部事件、带内探测、带内采样触发的多级带内OAM)以触发的方式提供了对可操作元数据的创建。对于服务事件,真正的带内OAM被触发会使信噪比提高。带内OAM在服务路径上进行操作,并且可根据某些条件或警报被启用。在至少一个实施例中,警报可以是带内的(例如,信号/标志、特定流量模式)。触发的数据源可以是带内OAM本身,也可以是其他外部事件。此外,分组着色可以是控制采样的动作。最后,本文描述的几个实施例的任何合适的组合可被提供来(例如在状况指示网络故障或提示潜在问题时)动态地创建详细的信息。
图4是根据本公开的实施例的用于触发网络环境中的带内操作、管理和维护的过程流程图400。控制器可以在网络中的一个或多个服务节点上配置带内OAM服务链验证。分组遍历该服务链。在一些实施例中,节点可以充当检查分组是否已对服务链进行了正确遍历的服务链验证者(SCV)。
网络元件(例如,SCV)可以确定网络中的问题(402)。例如,网络元件可以确定服务功能未被应用于分组、分组未通过服务链校验或验证、网络异常、或其他问题。触发的数据源可以是带内OAM本身,也可以是其他外部事件。
网络元件可以在网络的其他节点中触发带内OAM数据收集功能(404)。在检测到异常情况后,将针对一组特定流启用一组特定的带内OAM功能,以提供进一步的洞察。通常情况下,检测到异常的节点直接向一组入口节点发送触发,或者只是向控制器报告异常情况,然后控制器会决定哪些iOAM功能应在哪些网络节点上被启用。事件与要被触发的特定iOAM数据收集之间的关联可以由语义推理器来驱动,其中,语义推理器是由触发应用所知的网络模型驱动的。
网络元件可以从网络位置接收另一分组。网络元件可以确定该分组是否仍反映之前检测到的网络异常(406)。该分组可以包括与其所遍历的节点有关的附加信息(例如,iOAM信息)以及其他网络信息。
网络元件可基于来自第二分组的iOAM信息来确定网络问题或异常(408)。在一个示例中,如果第二分组未通过验证,则在下一次验证失败时,网络元件可以向控制器提供关于分组未通过服务链验证的通知,并且还接收详细的流跟踪信息。在路径验证场景中,假设跟踪示出分组只访问了节点A和节点C但没有访问节点B,则网络元件可识别出在节点B处的问题。网络元件可以将该问题报告给操作者,操作者现在可特别关注对节点B的调试。
图5是根据本公开的实施例的用于利用带内操作、管理和维护(iOAM)信息来扩充分组的过程流程图500。诸如网络节点之类的网络元件可以接收用以激活数据收集功能(例如,iOAM数据收集功能)的指令(502)。网络元件可以从网络位置接收数据分组(504)。网络元件可以用iOAM信息(例如,关于节点、网络、服务功能、策略、或其他网络信息的信息)来扩充数据分组(506)。接着,网络元件可以将数据分组发送到网络中的下一跳位置(508)。
变形和实现
在本公开的上下文中,本文所指的网络表示用于接收和发送通过网络地址转换系统传播的信息的分组的互连通信路径的一系列点、节点、或网络元件。网络提供源、目的地、和中间节点之间的通信接口,并且可以是任何局域网(LAN)、无线局域网(WLAN)、虚拟专用网(VPN)或根据网络拓扑促进网络环境中的通信的任意其他适合的架构或系统。网络可包括通过通信介质耦合到彼此(并且彼此进行通信)的任何数目的硬件和/或软件元件。
网络环境中的通信在本文被称为“网络流量”或“流量”(可包括分组)。分组是格式化的数据单元,并且可以包含控制信息(例如,源和目的地地址等)和数据(也被称为有效载荷)。网络流量可以根据任何合适的通信消息协议来发送和接收。合适的通信消息协议可以包括诸如开放系统互连(OSI)模型之类的多层方案或其任何衍生或变体(例如,传输控制协议/IP(TCP/IP)、用户数据报协议/IP(UDP/IP))等)。本文使用的术语“数据”是指任何类型的二进制、数字、语音、视频、文本、或脚本数据,或任何类型的源或目标代码,或可从电子设备和/或网络的一点被通传至另一点的任何适当格式的任何其他合适的信息。此外,消息、请求、响应、回复、查询等都是网络流量的形式,因此可以包括分组。
本文描述的通信系统的节点、服务节点和控制器可以是网络环境中的网络元件。如本文所使用的,术语“网络元件”意味着包括路由器、交换机、网关、桥接器、负载平衡器、服务设备、防火墙、服务器、处理器、模块(其中任何一者可以物理地或虚拟地在物理硬件上实现)或可操作以在网络环境中交换信息的任何其他合适的设备、组件、元件、专有设备或对象。网络元件可包括便于进行其操作的任何合适的硬件、软件、组件、模块、接口或对象。这可包括允许数据或信息的有效交换的合适的算法和通信协议。
在至少一个示例实施方式中,具有本文描述的触发式带内OAM能力的网络元件包括实现(或促进)如本文所概述的活动的逻辑。注意,在至少一个示例中,这些元件中的每一者可具有内部结构(例如,处理器、存储器元件、网络接口卡等)以便于进行本文描述的一些操作。在一些实施例中,这些活动可以在这些元件的外部执行,或者包括在某个其他网络元件中以实现该预期的功能。在至少一个实施例中,这些网络元件可以包括可与其他网络元件协调以实现如本文所概述的操作的逻辑(或往复式逻辑)。此外,一个或多个设备可以包括促进其操作的任何合适的算法、硬件、固件、软件、组件、模块、接口、或对象。
在某些示例性实施方式中,本文概述的触发式带内OAM能力可通过在一个或多个有形介质(例如,在专用集成电路(ASIC)、数字信号处理器(DSP)指令、要被一个或多个处理器或其他类似机器运行的软件(可能包括目标代码和源代码)、软件、硬件、固件、或它们的组合中的指令中提供的嵌入式逻辑)中编码的逻辑来实现。在至少一个实施例中,该有形介质可以是非暂态的。在这些实例的一些中,一个或多个存储器元件可存储用于本文所述的操作的数据。这包括能够存储软件、逻辑、代码、和/或处理器指令的存储器元件,这些指令被执行以执行本文所述的动作。处理器可运行与数据相关联的任意类型的指令。在一个示例中,处理器可将元素或物品(例如,数据)从一个状态或事物转换到另一状态或事物。在另一示例中,本文概述的活动可采用固定逻辑或可编程逻辑(例如,由处理器运行的软件/计算机指令)来实现,并且本文标识的元件可以是某种类型的可编程处理器、可编程数字逻辑(例如,现场可编程门阵列(FPGA)、可擦可编程只读存储器(EPROM)、电可擦可编程ROM(EEPROM)),或包括数字逻辑、软件、代码、电子指令的ASIC,或它们任意合适的组合。
如本文所概述的,这些网络元件中的任一者或多者都可以包括用于存储要用于实现触发式带内OAM能力的信息的存储器。此外,这些网络元件可以包括至少一个处理器,其可以运行软件、算法、或其他指令以执行(如本文所公开的)触发式带内OAM操作。这些网络元件还可以在适当的情况下并根据特定需求将要用于实现如本文所讨论的触发式带内OAM能力的信息保存在任何合适的存储器元件(三态内容寻址存储器(TCAM)、随机存取存储器(RAM)、只读存储器(ROM)、EPROM、EEPROM、ASIC等)、软件、硬件、或任何其他合适的组件、设备、元件、或对象中。本文讨论的任何存储器项目(例如,存储库、存储器、数据库、表格、缓存、缓冲器等)应该被解释为包含在广义术语“存储器元件”内。类似地,本文描述的任何可能的处理元件、模块、和机器应被解释为被包含在广义术语“处理器”内。每个网络元件还可包括用于在网络环境中接收、发送、和/或以其他方式传输数据或信息的适当接口。
需要注意的是,根据本文提供的示例,可用两个、三个或四个元件来对交互进行描述。然而,这样做仅是为了清楚和举例的目的。在某些情况下,通过只参考有限数目的网络元件能够更容易地描述给定流集的一个或多个功能。应当认识到,本文描述的系统是可轻易扩展的并且可容纳大量数目的组件以及更复杂/精巧的布置与配置。因此,所提供的示例不应该限制触发式带内OAM的各种实施例的范围或抑制其可能被应用于很多其他架构中的广泛教导。
如本文所使用的,除非相反地指明,否则短语“至少一个”的使用是指的是指定元件、条件或活动的任意组合。例如,“X、Y和Z中的至少一者”意在表示以下任何一项:1)X,而不是Y也不是Z;2)Y,而不是X也不是Z;3)Z,而不是X也不是Y;4)X和Y,而不是Z;5)X和Z,而不是Y;6)Y和Z,而不是X;或者7)X,Y和Z。此外,除非相反地指明,否则术语“第一”、“第二”、“第三”等旨在区分它们修饰的特定名词(例如,元件、条件、模块、活动、操作等)。除非相反地指明,否则这些术语的使用并不意味着至少所修饰名词的任何类型的顺序、级别、重要性、时间序列、或层级。例如,“第一X”和“第二X”旨在指定两个不同的X元素,它们不必受到这两个元素的任何顺序、级别、重要性、时间序列或层级的限制。
同样重要的是要注意,本文中所示出和所描述的活动、交互和操作仅说明了可由具有触发式带内OAM能力的节点或在该节点中运行的一些可能的互操作性场景和模式。这些活动、交互和/或操作中的一些可在适当时被删除或移除,或者在不背离本公开的范围的情况下可进行适当修改或改变。此外,许多这样的活动、交互和/或操作可以和一个或多个额外活动、交互和/或操作同时执行或并行执行。但是,这些活动、交互和/或操作的时序可会进行适当的更改。提供上面的操作流程用于举例和论述的目的。具有触发式带内OAM能力的网络元件提供的实质的灵活性在于:在不背离本公开的教导的情况下,可设置任何合适的布置、发生顺序、配置、和时序机制。此外,这些活动可以通过各种模块和/或组件来实现,其中,这些模块和/或组件可以基于特定配置和/或设置需求以任何适当的方式进行适当组合,或以任何适当的方式进行分割。
虽然已经参考特定布置和配置详细描述了本公开,但是在不脱离本公开的范围的情况下,这些示例配置和布置可以被显著地改变。而且,根据特定的需求和实施方式,可以对某些组件进行组合、分割、消除或增添。此外,尽管本文中的实施例已参照特定元件和协议进行了说明,但是这些元件和协议可以被实现本文所公开的触发式带内OAM的预期功能的任何合适的架构、协议和/或过程所替代。

Claims (12)

1.一种用于网络中的网络元件的方法,所述方法包括:
接收指示网络中的第一分组未通过服务平面验证的第一通知;
在所述网络中的一个或多个节点上针对遍历所述一个或多个节点的后续分组触发数据收集功能,其中,所述数据收集功能包括应用于后续第二分组的分组跟踪功能,所述数据收集功能用包括对应于所述第一分组的源和目的地信息的源和目的地信息的数据来扩充所述第二分组;
接收指示所述第二分组未通过所述网络中的所述服务平面验证的第二通知,其中,所述第二通知包括与所述第二分组遍历所述网络中的所述一个或多个节点中的至少一者有关的分组跟踪信息,其中,所述分组跟踪信息包括导致所述第二分组未能通过所述服务平面验证的故障状况;
评估包括由所述数据收集功能扩充的所述数据的所述第二分组;以及
识别所述第一分组未通过所述服务平面验证的原因,所述识别是基于包括在与所述第二分组相关联的分组跟踪信息中的故障状况进行的。
2.根据权利要求1所述的方法,其中,所述第一通知是从所述网络中的节点或从所述网络外部的源接收的。
3.根据权利要求2所述的方法,其中,所述节点包括包含带内操作、管理、和维护OAM节点的服务节点。
4.根据权利要求1所述的方法,其中,所述在所述网络中的一个或多个节点上针对遍历所述一个或多个节点的后续分组触发数据收集功能包括使数据被扩充至所述后续分组的子集,并且其中,
所述方法还包括评估所述后续分组的子集。
5.根据权利要求1所述的方法,其中,所述在所述网络中的一个或多个节点上针对遍历所述一个或多个节点的后续分组触发数据收集功能包括触发数据收集功能以用关于由所述后续分组遍历的所述一个或多个节点或网络路径的元数据来扩充携带数据流量的分组。
6.根据权利要求1所述的方法,所述在所述网络中的一个或多个节点上针对遍历所述一个或多个节点的后续分组触发数据收集功能包括对包含标记有带内操作、管理和维护iOAM标签的测探数据的后续分组触发数据收集功能。
7.根据权利要求6所述的方法,其中,所述iOAM标签是使用IPv6或VxLAN-GPE报头中的一者进行传输的。
8.根据权利要求6所述的方法,其中,所述iOAM标签包括延迟相关数据、分组丢失数据、遥测数据、分组路由信息、服务功能信息、或带宽相关数据中的一者或多者。
9.一种包括硬件处理器的网络元件,该硬件处理器被配置为:
接收指示网络中的第一分组未通过服务链验证的第一通知;以及
在所述网络中的一个或多个节点上针对遍历所述一个或多个节点的后续分组触发数据收集功能,其中,所述数据收集功能包括应用于后续第二分组的分组跟踪功能,所述数据收集功能用包括对应于所述第一分组的源和目的地信息的源和目的地信息的数据来扩充所述第二分组;
接收指示所述第二分组未通过所述网络中的所述服务链验证的第二通知,其中,所述第二通知包括与所述第二分组遍历所述网络中的所述一个或多个节点中的至少一者有关的分组跟踪信息,其中,所述分组跟踪信息包括导致所述第二分组未能通过所述服务链验证的故障状况;
评估包括由所述数据收集功能扩充的所述数据的所述第二分组;以及
识别所述第一分组未通过所述服务链验证的原因,所述识别是基于包括在与所述第二分组相关联的分组跟踪信息中的故障状况进行的。
10.根据权利要求9所述的网络元件,其中,所述第一通知是从所述网络中的服务节点或从所述网络外部的源接收的。
11.根据权利要求10所述的网络元件,其中,所述节点包括包含带内操作、管理、和维护OAM节点的服务节点。
12.一种包括用于扩充网络服务报头的元数据的一个或多个指令的计算机可读非暂态介质,这些指令在处理器上运行时将所述处理器配置为:
接收指示网络中的第一分组未通过服务平面验证的第一通知;
在所述网络中的一个或多个节点上针对遍历所述一个或多个节点的后续分组触发数据收集功能,其中,所述数据收集功能包括应用于后续第二分组的分组跟踪功能,所述数据收集功能用包括对应于所述第一分组的源和目的地信息的源和目的地信息的数据来扩充所述第二分组;
接收指示所述第二分组未通过所述网络中的所述服务平面验证的第二通知,其中,所述第二通知包括与所述第二分组遍历所述网络中的所述一个或多个节点中的至少一者有关的分组跟踪信息,其中,所述分组跟踪信息包括导致所述第二分组未能通过所述服务平面验证的故障状况;
评估包括由所述数据收集功能扩充的所述数据的所述第二分组;以及
识别所述第一分组未通过所述服务平面验证的原因,所述识别是基于包括在与所述第二分组相关联的分组跟踪信息中的故障状况进行的。
CN201680054358.XA 2015-10-20 2016-10-16 网络环境中的触发式带内操作、管理和维护的方法和装置 Active CN108028775B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562244095P 2015-10-20 2015-10-20
US62/244,095 2015-10-20
US15/148,864 2016-05-06
US15/148,864 US9992056B2 (en) 2015-10-20 2016-05-06 Triggered in-band operations, administration, and maintenance in a network environment
PCT/US2016/057250 WO2017070023A1 (en) 2015-10-20 2016-10-16 Triggered in-band operations, administration, and maintenance in a network environment

Publications (2)

Publication Number Publication Date
CN108028775A CN108028775A (zh) 2018-05-11
CN108028775B true CN108028775B (zh) 2021-03-26

Family

ID=58526316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680054358.XA Active CN108028775B (zh) 2015-10-20 2016-10-16 网络环境中的触发式带内操作、管理和维护的方法和装置

Country Status (4)

Country Link
US (3) US9992056B2 (zh)
EP (2) EP4099645A1 (zh)
CN (1) CN108028775B (zh)
WO (1) WO2017070023A1 (zh)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106330506B (zh) * 2015-06-29 2019-08-16 华为技术有限公司 一种业务故障定位方法及装置
US9992056B2 (en) 2015-10-20 2018-06-05 Cisco Technology, Inc. Triggered in-band operations, administration, and maintenance in a network environment
JP6601232B2 (ja) * 2016-01-21 2019-11-06 富士通株式会社 分析方法、分析装置、及び分析プログラム
US10374922B2 (en) * 2016-02-24 2019-08-06 Cisco Technology, Inc. In-band, health-based assessments of service function paths
US10158565B2 (en) * 2016-08-26 2018-12-18 Cisco Technology, Inc. Network services across non-contiguous subnets of a label switched network separated by a non-label switched network
US10404548B2 (en) * 2016-08-29 2019-09-03 Cisco Technology, Inc. Control of network nodes in computer network systems
US10454828B2 (en) * 2016-12-21 2019-10-22 Cisco Technology, Inc. Machine learning-derived entropy path graph from in-situ OAM (iOAM) data
CN108737269B (zh) 2017-04-13 2021-11-26 中兴通讯股份有限公司 一种封装方法、装置和节点
CN108737124B (zh) * 2017-04-13 2022-07-19 中兴通讯股份有限公司 一种信息通告方法及装置
US10560554B2 (en) * 2017-05-12 2020-02-11 Futurewei Technologies, Inc. In-situ OAM sampling and data validation
CN108964943B (zh) * 2017-05-18 2022-01-28 中兴通讯股份有限公司 一种实现ioam封装的方法及装置
CN108965204B (zh) * 2017-05-18 2022-01-25 中兴通讯股份有限公司 一种自动实现ioam封装的方法及装置
CN111490923B (zh) * 2017-06-16 2021-10-01 华为技术有限公司 基于bras系统的报文封装方法、装置及系统
US10588012B2 (en) * 2017-07-28 2020-03-10 Cisco Technology, Inc. In-situ operations, administration and management proxy
CN108259344B (zh) * 2017-11-29 2020-12-29 新华三技术有限公司 遥测Telemetry方法和装置
US10992562B2 (en) * 2017-12-29 2021-04-27 Arista Networks, Inc. System for network event detection and analysis
US10516551B2 (en) * 2018-01-15 2019-12-24 Futurewei Technologies, Inc. In-band telemetry with limited extra bytes
ES2950584T3 (es) * 2018-02-19 2023-10-11 Telefonica Sa Procedimiento y sistema para validar la prueba ordenada de tránsito de paquetes de tráfico en una red
CN110224916B (zh) * 2018-03-01 2021-10-26 中兴通讯股份有限公司 报文的处理方法、装置及报文的封装方法、装置和系统
US10498639B2 (en) * 2018-03-13 2019-12-03 Futurewei Technologies, Inc. Collecting network OAM flow data using out-of-band messages
CN109688055B (zh) * 2018-03-30 2022-01-25 新华三技术有限公司 报文处理方法和装置
US10887209B2 (en) * 2018-06-04 2021-01-05 Cisco Technology, Inc. In-Situ OAM for multicast path, telemetry data collection and receive-only service function proof of transit
CN116208525A (zh) 2018-06-06 2023-06-02 华为技术有限公司 一种数据报文的检测方法、设备及系统
US11019075B2 (en) * 2018-06-26 2021-05-25 Cisco Technology, Inc. Providing processing and network efficiencies in protecting internet protocol version 6 segment routing packets and functions using security segment identifiers
US10819571B2 (en) * 2018-06-29 2020-10-27 Cisco Technology, Inc. Network traffic optimization using in-situ notification system
US10284429B1 (en) 2018-08-08 2019-05-07 Cisco Technology, Inc. System and method for sharing subscriber resources in a network environment
US11716264B2 (en) 2018-08-13 2023-08-01 Cisco Technology, Inc. In situ triggered function as a service within a service mesh
US20200067792A1 (en) * 2018-08-21 2020-02-27 Argela Yazilim Ve Bilisim Teknolojileri San Ve Tic A S System and method for in-band telemetry target selection
US11032193B2 (en) * 2018-09-11 2021-06-08 Cisco Technology, Inc. In-situ operation, administration, and maintenance in segment routing with multiprotocol label switching networks
US10917340B2 (en) 2018-09-11 2021-02-09 Cisco Technology, Inc. In-situ passive performance measurement in a network environment
US11558288B2 (en) * 2018-09-21 2023-01-17 Cisco Technology, Inc. Scalable and programmable mechanism for targeted in-situ OAM implementation in segment routing networks
US10511590B1 (en) * 2018-10-23 2019-12-17 Cisco Technology, Inc. System and method of verifying network communication paths between applications and services
US10972377B2 (en) * 2018-11-02 2021-04-06 Cisco Technology, Inc. Coordinated offloaded recording of in-situ operations, administration, and maintenance (IOAM) data to packets traversing network nodes
US11005756B2 (en) 2018-11-08 2021-05-11 Cisco Technology, Inc. Signaling among entities of a virtualized packet processing apparatus using in-band operations data included in packets being processed
CN109412859A (zh) * 2018-11-15 2019-03-01 盛科网络(苏州)有限公司 一种vxlan隧道的oam方法及系统
CN109309605B (zh) * 2018-11-26 2020-08-25 北京邮电大学 带内网络遥测系统及方法
CN111327445B (zh) * 2018-12-17 2023-09-12 中兴通讯股份有限公司 报文采样方法及解封装方法、节点、系统及存储介质
CN111385121B (zh) * 2018-12-29 2021-08-03 华为技术有限公司 一种操作管理维护iOAM报文的传输方法及相应装置
CN111614477B (zh) * 2019-02-22 2023-05-12 华为技术有限公司 定位网络故障的方法和装置
US11909650B2 (en) * 2019-02-22 2024-02-20 Juniper Networks, Inc. Internet protocol operations and management option
US11343261B2 (en) * 2019-04-05 2022-05-24 Cisco Technology, Inc. Technologies for proving packet transit through uncompromised nodes
CN114553746A (zh) * 2019-05-16 2022-05-27 华为技术有限公司 一种报文的检测方法、设备及系统
US11122491B2 (en) 2019-09-05 2021-09-14 Cisco Technology, Inc. In-situ best path selection for mobile core network
CN112866042B (zh) * 2019-11-12 2023-07-18 中兴通讯股份有限公司 网络质量检测方法、装置、计算机设备和计算机可读介质
CN112804075B (zh) * 2019-11-14 2022-10-11 华为技术有限公司 发送报文、接收报文以进行oam的方法、装置及系统
CN110933002B (zh) * 2019-11-25 2021-12-28 苏州盛科科技有限公司 一种mpls带内检测oam的交换芯片实现方法及装置
CN113328902B (zh) * 2020-02-29 2023-10-24 华为技术有限公司 网络性能检测方法、装置及网络设备
CN113949650A (zh) * 2020-07-17 2022-01-18 华为技术有限公司 随流检测方法及相关设备
CN114053292A (zh) * 2020-07-31 2022-02-18 高志玲 烟酰胺核苷芳甲酸酯类化合物及其组合物的用途以及化合物晶型
US11765278B2 (en) 2021-04-09 2023-09-19 Microsoft Technology Licensing, Llc Replay agent for delivering charging event messages from a message broker in a mobile telecommunications network
US11929917B2 (en) * 2021-07-30 2024-03-12 Cisco Technology, Inc. Systems and methods for determining problematic paths between interest points in a multi-cloud environment
CN113810229B (zh) * 2021-09-16 2023-12-05 烽火通信科技股份有限公司 一种基于时序调度的ioam质量性能数据分析方法和装置
US11818028B2 (en) * 2021-09-30 2023-11-14 Docusign, Inc. Network diagnostic sampling in a distributed computing environment
US20230171172A1 (en) * 2021-11-30 2023-06-01 Cisco Technology, Inc. Cross-layer, in-band monitoring of tunnels
US11818141B2 (en) 2021-12-09 2023-11-14 Cisco Technology, Inc. Path validation checks for proof of security

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7990888B2 (en) * 2005-03-04 2011-08-02 Cisco Technology, Inc. System and methods for network reachability detection
CN104322043A (zh) * 2012-04-13 2015-01-28 适应性频谱和信号校正股份有限公司 基于线路数据分布分析的双绞电话线路诊断方法
US8976680B2 (en) * 2010-03-15 2015-03-10 Juniper Networks, Inc. Operations, administration, and management fields for packet transport
CN104702522A (zh) * 2013-12-06 2015-06-10 智梵网络科技有限公司 软件定义网络(sdn)中基于性能的路由

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9019997B1 (en) * 2009-11-30 2015-04-28 Pmc-Sierra Us, Inc. Method and system for transporting constant bit rate clients across a packet interface
US9444675B2 (en) 2013-06-07 2016-09-13 Cisco Technology, Inc. Determining the operations performed along a service path/service chain
US9456444B2 (en) 2013-07-17 2016-09-27 Cisco Technology, Inc. OAM and time slot control in a deterministic ARC chain topology network
US9917745B2 (en) 2013-09-27 2018-03-13 Futurewei Technologies, Inc. Validation of chained network services
US9992056B2 (en) 2015-10-20 2018-06-05 Cisco Technology, Inc. Triggered in-band operations, administration, and maintenance in a network environment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7990888B2 (en) * 2005-03-04 2011-08-02 Cisco Technology, Inc. System and methods for network reachability detection
US8976680B2 (en) * 2010-03-15 2015-03-10 Juniper Networks, Inc. Operations, administration, and management fields for packet transport
CN104322043A (zh) * 2012-04-13 2015-01-28 适应性频谱和信号校正股份有限公司 基于线路数据分布分析的双绞电话线路诊断方法
CN104702522A (zh) * 2013-12-06 2015-06-10 智梵网络科技有限公司 软件定义网络(sdn)中基于性能的路由

Also Published As

Publication number Publication date
US9992056B2 (en) 2018-06-05
CN108028775A (zh) 2018-05-11
EP3366006A1 (en) 2018-08-29
US20200336360A1 (en) 2020-10-22
WO2017070023A1 (en) 2017-04-27
US20180227168A1 (en) 2018-08-09
US20170111209A1 (en) 2017-04-20
EP4099645A1 (en) 2022-12-07
US11038744B2 (en) 2021-06-15
US10652078B2 (en) 2020-05-12
EP3366006B1 (en) 2022-09-21

Similar Documents

Publication Publication Date Title
CN108028775B (zh) 网络环境中的触发式带内操作、管理和维护的方法和装置
Tan et al. In-band network telemetry: A survey
US11621896B2 (en) Network embedded real time service level objective validation
US10320824B2 (en) Anomaly detection using network traffic data
Duffield et al. A framework for packet selection and reporting
Shirali-Shahreza et al. Efficient implementation of security applications in openflow controller with flexam
US10218727B2 (en) Sanity check of potential learned anomalies
US10129115B2 (en) Method and system for network monitoring using signature packets
US20180205746A1 (en) Network traffic analysis for malware detection and performance reporting
US20110270957A1 (en) Method and system for logging trace events of a network device
Dimolianis et al. A multi-feature DDoS detection schema on P4 network hardware
CN115733727A (zh) 用于企业网络的网络管理系统及方法和存储介质
Feldmann et al. NetCo: Reliable routing with unreliable routers
Alkenani et al. Network Monitoring Measurements for Quality of Service: A Review.
Polverini et al. Investigating on black holes in segment routing networks: Identification and detection
US11765059B2 (en) Leveraging operation, administration and maintenance protocols (OAM) to add ethernet level intelligence to software-defined wide area network (SD-WAN) functionality
Silva et al. A modular sampling framework for flexible traffic analysis
Nguyen et al. Suspicious traffic detection based on edge gateway sampling method
Duggan et al. Application of fault management to information-centric networking
US20220103420A1 (en) Network management method, network system, aggregated analysis apparatus, terminal apparatus and program
FANKAM MAMEKONG Detecting network anomalies in Ethernet/MPLS/IP networks using Ethernet OAM performance data
Kassing Performance Evaluation of Networked Systems
Marco et al. A modular sampling framework for flexible traffic analysis
Valentini et al. Ipv4 and ipv6 troubleshooting enhancement through reverse path discovery
Chou et al. Network fault management systems using multiple mobile agents for multihomed networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant