CN114128231A - 全网络覆盖的自适应带内网络遥测 - Google Patents

全网络覆盖的自适应带内网络遥测 Download PDF

Info

Publication number
CN114128231A
CN114128231A CN201980098529.2A CN201980098529A CN114128231A CN 114128231 A CN114128231 A CN 114128231A CN 201980098529 A CN201980098529 A CN 201980098529A CN 114128231 A CN114128231 A CN 114128231A
Authority
CN
China
Prior art keywords
int
sampling rate
controller
user data
head node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980098529.2A
Other languages
English (en)
Inventor
宋浩宇
周天然
刘敏
李振斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN114128231A publication Critical patent/CN114128231A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/22Parsing or analysis of headers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/02Traffic management, e.g. flow control or congestion control
    • H04W28/0231Traffic management, e.g. flow control or congestion control based on communication conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/022Capturing of monitoring data by sampling
    • H04L43/024Capturing of monitoring data by sampling by adaptive sampling

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Mining & Analysis (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

公开了一种通过网络控制器自适应地执行带内网络遥测(in‑band network telemetry,INT)的机制。所述机制包括:从采集器接收一个或多个拥塞指示符;生成调整采样率,其中,所述调整采样率是根据所述拥塞指示符生成,是INT指令头插入的指定速率;将所述调整采样率发送给头节点,其中,所述头节点用于通过对用户数据包插入指令头执行INT。

Description

全网络覆盖的自适应带内网络遥测
技术领域
本申请涉及网络遥测,具体涉及通信网络中带内网络遥测(In-band NetworkTelemetry,INT)系统的自适应管理。
背景技术
操作、管理和维护(operations,administration,and maintenance,OAM)包括用于操作、管理和维护系统(如电信网络)的过程、活动、工具及标准。为了执行OAM,系统应该能够访问关于整个网络的状态以及网络各组成部分的状态的精确实时数据。此类信息可以用于支持通信监控、网络路由、错误诊断、故障转移管理等。因此,可以通过提高网络状态数据的准确性、及时性和粒度来提高OAM在电信网络中的有效性。
发明内容
在一个实施例中,本申请包括一种方法,所述方法包括:控制器的接收器从采集器接收一个或多个拥塞指示符。所述方法还包括:所述控制器的处理器根据所述拥塞指示符生成通过插入指令头执行带内网络遥测(in-band network telemetry,INT)的调整采样率。所述方法还包括:所述控制器的发送器将所述调整采样率发送给头节点,其中,所述头节点用于通过对用户数据包插入指令头执行INT。例如,在一些系统中,通过在用户数据包中插入指令头在头尾节点执行INT。指令头指示路径中的每个节点采集指示的遥测数据,并将此类遥测报告回采集器。此类系统可以采用预配置的采样率。如果采样率设置过高,可能会导致丢包;如果采样率设置过低,则可能导致遥测数据粒度降低。在此类系统中,头尾节点可能无法访问允许头尾节点确定或甚至建议适当采样率的数据。本实施例包括一种根据当前网络条件,利用拥塞指示符来动态调整INT采样率的机制。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:所述拥塞指示符包括延迟、丢包、缓冲区大小、显式拥塞通知或其组合。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:所述调整采样率指示对每个用户数据包插入指令头的概率。在本实施例中,所述采样率实现为概率。所述头尾节点可以采用伪随机数生成来确定是否应该为流中的每个用户数据包添加指令头。这使得有一定比例的用户数据包接收指令头,采样率与数据包顺序之间没有紧密相关性。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:所述调整采样率指示对每个用户数据包插入指令头的频率。在本实施例中,所述采样率实现为频率。这使得用户数据包集合以基于百分比的一致顺序接收指令头(例如,25%为每四个数据包,50%为每隔一个数据包,75%为四个数据包中的三个数据包,等等)。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:所述调整采样率是周期性生成并发送的。在本实施例中,根据在预定义的周期内存在或不存在拥塞指示符,分别提高或降低采样率。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:将生成并发送所述调整采样率的周期设置为所述头节点与尾节点之间用户数据包的往返时间。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:所述调整采样率是基于先前采样率和所述拥塞指示符,根据和式增加和积式减少生成。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:还包括所述发送器向所述头节点发送指令以执行基于明信片的INT。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:还包括所述发送器向所述头节点发送指令以执行基于护照的INT。
在一个实施例中,本申请包括一种控制器,所述控制器包括:接收器,用于从采集器接收一个或多个拥塞指示符。所述控制器还包括:处理器,用于从所述接收器接收所述拥塞指示符,并接收计算机指令,其中,所述计算机指令在执行时指示所述控制器根据所述拥塞指示符生成用于通过插入指令头执行INT的调整采样率。所述控制器还包括:发送器,用于从所述处理器接收所述调整采样率,并将所述调整采样率发送给头节点,其中,所述头节点用于通过对用户数据包插入指令头执行INT。例如,在一些系统中,通过在用户数据包中插入指令头在头尾节点执行INT。指令头指示路径中的每个节点采集指示的遥测数据,并将此类遥测报告回采集器。此类系统可以采用预配置的采样率。如果采样率设置过高,这可能会导致丢包;如果采样率设置过低,则可能导致遥测数据粒度降低。在此类系统中,头尾节点可能无法访问允许头尾节点确定或甚至建议适当采样率的数据。本实施例包括一种根据当前网络条件,利用拥塞指示符来动态调整INT采样率的机制。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:所述拥塞指示符包括延迟、丢包、缓冲区大小、显式拥塞通知或其组合。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:所述调整采样率指示对每个用户数据包插入指令头的概率。在本实施例中,所述采样率实现为概率。所述头尾节点可以采用伪随机数生成来确定是否应该为流中的每个用户数据包添加指令头。这使得有一定比例的用户数据包接收指令头,采样率与数据包顺序之间没有紧密相关性。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:所述调整采样率指示对每个用户数据包插入指令头的频率。在本实施例中,所述采样率实现为频率。这使得用户数据包集合以基于百分比的一致顺序接收指令头(例如,25%为每四个数据包,50%为每隔一个数据包,75%为四个数据包中的三个数据包,等等)。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:所述调整采样率是周期性生成并发送的。在本实施例中,根据在预定义的周期内存在或不存在拥塞指示符,分别提高或降低采样率。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:将生成并发送所述调整采样率的周期设置为所述头节点与尾节点之间用户数据包的往返时间。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:所述调整采样率是基于先前采样率和所述拥塞指示符,根据和式增加和积式减少生成。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:所述发送器还用于向所述头节点发送指令以执行基于明信片的INT。
可选地,在上述任一方面中,提供了所述方面的另一种实现方式:所述发送器还用于向所述头节点发送指令以执行基于护照的INT。
在一个实施例中,本申请包括一种非瞬时性计算机可读介质,包括供视频编码设备使用的计算机程序产品,其中,所述计算机程序产品包括存储在所述非瞬时性计算机可读介质中的计算机可执行指令,当处理器执行所述计算机可执行指令时,所述视频编码设备执行上述任一方面的方法。
在一个实施例中,本申请包括一种控制器,所述控制器包括:接收模块,用于从采集器接收一个或多个拥塞指示符。所述控制器还包括:采样调整模块,用于根据所述拥塞指示符生成通过插入指令头执行INT的调整采样率。所述控制器还包括:发送模块,用于将所述调整采样率发送给头节点,其中,所述头节点用于通过对用户数据包插入指令头执行INT。
可选地,在任一上述方面中,提供了所述方面的另一种实现方式:所述控制器还用于执行上述任一方面的方法。
为了清楚起见,上述任一实施例可以与上述其它实施例中的任意一个或多个实施例结合,在本申请的范围内产生新的实施例。
根据以下详细说明结合附图和权利要求将能更清楚地理解这些和其它特征。
附图说明
图1为在通信网络中运行的示例性INT系统的示意图;
图2为INT系统中示例性网元的示意图;
图3为根据网络拥塞自适应调整INT系统的采样率的示例性方法的流程图;
图4为根据网络拥塞自适应调整INT系统的采样率的示例性控制器的示意图。
具体实施方式
首先应理解,尽管下文提供了一个或多个实施例的说明性实现方式,但所公开的系统和/或方法可使用任何数量的技术来实现,无论该技术是当前已知还是现有的。本申请决不应限于下文所说明的说明性实现方式、附图和技术,包括本文所说明并描述的示例性设计和实现方式,而是可在所附权利要求书的范围以及其等效物的完整范围内修改。
用户数据包以流的形式在通信网络中传输。一种示例性机制是检查流沿转发路径的数据包踪迹,它提供了详细的数据包和流可视性,从而支持有效的网络OAM。此类路径相关数据可以反映每个流数据包的实时经历的状态和状况。此类数据还可以为网络监控、测量和诊断提供有价值的信息。例如,路径相关数据可以包括流的详细转发路径、流在每个网络节点处的时间戳和/或延迟等。可编程数据平面设备可以实现甚至更复杂数据的检索。所有此类数据都可以认为是路径相关流数据,只能通过测量实时用户数据包来导出。此类数据可以与通过间接的被动和主动采集和测量(如网络流(network flow,NETFLOW)和因特网控制消息协议(Internet Control Message Protocol,ICMP))获得的其它数据互补。
INT是支持从实时用户数据包收集遥测的示例性机制/系统。带内OAM(in-situOAM,iOAM)和基于明信片的遥测(postcard based telemetry,PBT)是因特网工程任务组(internet engineering task force,IETF)所描述的INT的示例性实现方式。INT通过增加线路用户数据包使用的数据包报头来操作。具体地,头节点增加包含指令的用户数据包报头,其中,所述指令指示沿流路径的每个网络节点应执行的遥测测量。可以将所得测量数据插入用户数据包中并随用户数据包一起传输。然后,流路径的尾节点可以剥离数据踪迹和对应的测量数据,并将测量数据输出到采集器供OAM系统分析。这种方法也可以称为基于护照的INT。PBT是INT的变型。在PBT中,不会将测量数据插入对应的用户数据包中。而是直接通过称为明信片的专用输出数据包将测量数据发送给采集器。
INT的一个缺点是,INT在网络节点上增加了额外的数据包处理、数据采集和输出需求。与INT相关的额外工作负载可能会对网络数据平面的性能造成负面影响,从而会导致网络拥塞、丢包和/或测量数据不准确。出现此问题的一个原因是,头节点会选择是否将INT报头添加到特定数据包/流中,但是头节点可能不了解应该添加INT报头的时间和/或频率。例如,将INT头添加到过多的数据包中可能会耗尽网络资源,导致用户流量延迟和/或用户数据包丢弃。在另一个示例中,将INT报头添加到过少的数据包中可能导致网络测量的准确性、及时性和粒度降低,从而无法达到INT系统的目的。
本文公开了动态调整INT采样率以适应网络条件的机制。这既允许在网络中最大化INT覆盖,而不会对用户流量转发产生负面影响。网络可以通过使用与网络节点通信的控制器和采集器来实现INT。控制器可以指示流的头节点开始以某一采样率将INT指令头添加到用户数据包中。采样率表示每隔预定义的用户数据包组接收INT指令头的用户数据包的数量。根据示例,采样率可以表示为概率和/或频率。可以将采样率设置为从0%到100%的值(包括端点)。然后,沿流路径的节点执行INT指令头并执行遥测测量。将遥测测量作为来自路径节点的明信片或作为来自尾节点的护照等沿流路径转发给采集器。然后,采集器可以分析明信片/护照的拥塞指示符。此类拥塞指示符可以包括延迟、丢包、缓冲区大小、显式拥塞通知或其组合。然后,采集器可以将拥塞指示符转发给控制器。然后,控制器可以根据拥塞指示符来调整采样率,并将调整采样率转发给头节点,以改变INT指令头插入的速率。例如,采样率可以初始化为100%。在预定义的周期(如流中与用户数据包相关的往返时间(round trip time,RTT))内,在接收到拥塞指示符时,可以调低采样率;在没有接收到拥塞指示符时,可以回调采样率。在一个具体示例中,控制器可以采用和式增加和积式减少(additive increase and multiplicative decrease,AIMD)机制。在AIMD中,每个周期的采样率增加预定义的增量值,然后减少乘数值,如四分之一、二分之一等。该方法在没有拥塞时缓慢升高采样率,在检测到拥塞时快速降低采样率,以尽量减少INT对通信网络的转发平面有明显影响的情况。然而,AIMD仅是一个示例,可以在本申请的范围内使用许多其它的采样率调整机制。
图1为在通信网络110中运行的示例性INT系统100的示意图。通信网络110是通过链路连接的一组网络节点,所述链路能够支持网络边缘处的入口点与出口点进行通信。通信网络110可以支持许多同时通信,其中一些通信是双向的。因此,节点可以作为不同通信的入口点、出口点或入口点和出口点。可以作为通信网络110中的入口点或出口点的节点可以称为边缘节点。通信网络110中的节点是能够沿路径接收、创建、存储和/或发送数据的连接点。节点可以指具有处理器、收发器、存储器等的硬件组件等,和/或在这类硬件中运行的抽象逻辑连接点。例如,节点可以包括路由器、交换机、网桥、软件定义节点等。各节点通过链路连接,其中,所述链路是物理和/或逻辑网络组件,能够使节点和/或主机互连,以支持各节点之间的传输。例如,链路可以包括光链路、电链路和/或无线链路。
通信可以在数据面中穿过通信网络110,并且可以由管理面控制。如图1所示,示例性数据面通信用实线箭头表示,示例性管理面通信用虚线箭头表示。在一个示例中,通信网络110可以用作在网络边缘之间转发用户通信的传送网络。此类用户通信包括组织成流的用户数据包121的流量。流为公共源与公共目的地之间的用户数据包121的流量。从源主机接收进入网络的流的边缘节点可以称为头节点111。将流从网络转发至目的主机的边缘节点可以称为尾节点115。流经由穿过各个路径节点113的路径从头节点111穿过通信网络110到尾节点115,所述路径节点113可以是内部节点和/或外部节点的任意组合。路径可以由控制器133事先确定,控制器充当管理面,在流开始穿越通信网络110之前对其进行设置。为了简化描述,图1描绘了从上游方向朝下游方向行进的单向流。然而,流可以是双向的,因此,尾节点115可以作为沿相反方向行进的流的相关部分的头节点111。
INT是一种用于收集与通信网络110的运行相关的遥测数据的机制。遥测是从远端点收集测量和/或数据的过程。遥测还可以指通过此类测量收集的任何测量结果和/或数据。如上所述,遥测数据可用于支持OAM。例如,管理面可以使用遥测数据来路由和/或重新路由流、报告设备故障以支持维修、纠正错误配置、支持通信调度等。可以将此类遥测报告给采集器131并由控制器133作用。
采集器131为管理平面中的节点,用于从通信网络110的数据面中的节点接收、解释和/或报告遥测数据。控制器133为管理面中的节点,用于控制通信网络110、通信网络110的子域和/或其组件的运行。采集器131和控制器133可以实现为具有处理器、收发器和存储器的硬件组件。采集器131和控制器133也可以实现为在包含此类硬件的多个机器中分布(例如,动态分布)的相关功能的抽象组。采集器131和控制器133在实际应用中可以具有许多功能,其中一些功能不在本申请的范围内。在一个实施例中,采集器131和控制器133一起工作以管理通信网络110中的INT。
当执行INT时,头节点111接收进入通信网络110的用户数据包121,并沿相关流路径向尾节点115转发用户数据包121。在执行这种转发的同时,头节点111还将INT指令头插入用户数据包121的子集中。包含在INT指令头中的INT指令被引导到沿流路径的一个或多个节点。当头节点111、路径节点113和/或尾节点115接收、处理和/或转发用户数据包121时,这类节点执行INT指令。INT指令指示节点收集和输出遥测数据。INT指令可以针对特定节点以及特定遥测测量。例如,INT指令可以指示路径中的所有节点执行一个或多个指定的遥测测量。在另一示例中,INT指令可以指示指定节点执行指定的遥测测量。在这种情况下,未指定的节点转发用户分组121而不执行此类测量。在又一示例中,可以指示不同的节点执行不同的遥测测量。因此,INT可高度配置成多种潜在的遥测收集排列。遥测测量的选择也可高度配置,但是可以包括基于流的测量、基于用户数据包121的测量和/或基于节点硬件的测量等。在一个非限制性示例中,此类遥测测量可以包括抖动、丢包、延迟、缓冲区占用、响应时间、吞吐量、资源可用性、包间延迟、带宽数据、乱序发送,和/或与节点、流和/或用户数据包121相关联的其它状况和/或错误指示符。指定节点执行INT指令所指示的遥测测量,输出得到的遥测数据,并沿路径转发用户数据包121。尾节点115在将用户数据包121从通信网络110转发出去之前移除插入的INT指令。因此,从用户数据包121的角度,INT可以通过这种透明的方式执行。
如上所述,执行遥测的节点应输出所采集的遥测数据。输出机制可以在INT指令中预先配置和/或定义。INT可以用于在输出时采用护照机制和/或明信片机制。为了简化描述,下文对护照和明信片INT的描述假设所有节点都采用遥测数据。在基于护照的INT中,头节点111、路径节点113和尾节点115测量用户数据包121的INT指令头所指示的遥测,将得到的遥测数据添加至用户数据包121,并沿流路径转发用户数据包121(例如,向下游转发)。因此,尾节点115接收用户数据包121,所述用户数据包121包含沿对应流路径的每个节点的遥测列表。尾节点115在转发对应的用户数据包121之前移除遥测数据列表和INT指令头。然后,尾节点115包含称为护照124的管理面通信(例如,数据包)中的路径中的节点(例如,头节点111、路径节点113和尾节点115)的遥测数据列表。尾节点115将护照124发送给采集器131。因此,护照124为尾节点115与采集器131之间的通信,包含与沿流路径接收和/或发送用户数据包121的节点对应的完整的遥测数据集合。
基于明信片的INT与基于护照的INT类似,但采用的输出机制不同。在基于明信片的INT中,节点不将遥测数据添加至用户数据包121,而是分别将明信片123发送给包含遥测数据的采集器131。例如,每个节点都可以针对每个具有INT指令头的用户数据包121发送一个明信片123。因此,明信片123为指定节点(例如,头节点111、路径节点113或尾节点115)与采集器131之间的通信,包含在转发用户数据包121和/或流时由指定节点测量的遥测数据集合。
各种INT机制都可高度配置,并且可以将大量遥测数据转发给采集器131。这可能对OAM有益,但也可能对数据面造成压力。具体地,管理INT指令头、执行测量和发送护照124和/或明信片123会使用头节点111、路径节点113和尾节点115处的资源,而这些资源本可以用于转发更多的用户数据包121。因此,将INT指令头应用于所有用户数据包121可能会导致拥塞和延迟增加,甚至更多的用户数据包121被丢弃,降低了通信网络110的运行有效性。此外,将INT指令头应用于相对较少的用户数据包121会导致频率降低,降低了遥测的质量,从而无法执行INT。某些INT系统仅限于根据用户输入设置INT使用量。然而,该解决方案没有提供如何有效分配INT使用的方法,特别是因为INT使用的最佳分配可能随着用户对通信网络110的要求的变化而变化,其中,变化的形式为在不同日期和时间,在通信网络110中穿越的用户数据包121的数量变化。
为了解决这一问题,采集器131用于向控制器133提供拥塞指示符141。拥塞指示符141是网络状态数据,表示通信网络110的组件处理用户数据包121的速度减缓的证据。在一个示例中,拥塞指示符141可以包括延迟、丢包、缓冲区大小、显式拥塞通知或其组合。在设置和/或调整与INT相关联的采样率143时,控制器133可以使用拥塞指示符141。例如,控制器133可以向通信网络110中每个流的头节点111发送采样率143,以控制接收INT指令头的用户数据包121的数量。采样率143表示接收INT指令头的用户数据包121的比例。可以将采样率143设置为从0%到100%的值(包括端点)。这便于以任何粒度对待定义的流执行采样。最大粒度包括向所有入口用户数据包121(例如,来自头节点111和尾节点115的所有数据包)添加INT指令头。根据拥塞指示符141,通过当前网络状况确定采样率143的值。
采样率143可以使用几种机制实现。例如,采样率143可以包括对每个用户数据包121执行INT指令头插入的概率。在这种情况下,头节点111可以针对每个用户数据包121生成伪随机值,并且对伪随机值小于采样率143的用户数据包121应用INT指令头。这样一来,指定百分比的用户数据包121接收INT指令头。在另一示例中,采样率143可以包括对每个用户数据包121组执行INT指令头插入的频率。在这种情况下,头节点111可以以与所请求的百分比采样率143对应的频率将INT指令头应用于用户数据包121(例如,每个数据包为百分之百,每五个数据包为百分之二十五,等等)。
可以响应拥塞指示符141调整采样率143,如下所述。例如,处理INT指令头的每个节点可以用于采用较高优先级来转发用户数据包121,采用较低优先级来通过明信片123和/或护照124输出INT数据。当通信网络110变得拥塞时,由于优先级设置,INT数据可能在影响用户数据包121之前就已经丢失。此类INT数据可能由于明信片123和/或护照124被丢弃而丢失。当拥塞严重时,一些用户数据包121也可能会被丢弃。这两种情况都表明对应的节点当前太忙而无法执行INT处理。INT数据的丢失和/或丢弃数据包的指示可用作拥塞指示符141,以降低INT采样率143。因此,采集器131向控制器133通知任何拥塞指示符141(例如,实际或预测的数据丢失的检测)。然后,控制器133计算调整采样率143,并用调整采样率143配置一个或多个头节点111。
采集器131可以通过多种方式确定数据丢失。例如,在基于明信片的INT中,当采集器131从上游节点接收用户数据包121的某些INT数据,而没有沿路径从一个或多个下游节点接收某些INT数据时,采集器131可以意识到INT数据丢失了。在另一示例中,可以为每个INT报头添加序列号。当接收到的INT数据中缺少序列号时,采集器131可以确定用户数据包121被丢弃,导致某些INT数据丢失。
许多机制也可以用于响应接收到拥塞指示符141调整采样率143,其中,所述拥塞指示符141指示实际数据丢失(例如,丢弃的数据包)或预测的数据丢失(例如,节点状态指示符(如缓冲区占用率)超过阈值)。例如,可以采用基于机器学习/强化学习的解决方案。另一示例包括使用AIMD。在AIMD中,当接收到拥塞指示符141时,每个周期的采样率143增加预定义的增量值,然后减少乘数值,如四分之一、二分之一等。该方法在没有拥塞时缓慢升高采样率143,在检测到拥塞时快速降低采样率143,以尽量减少INT对通信网络110的转发面有明显影响的情况。当使用AIMD时,生成/调整采样率143并周期性发送。例如,可以将生成/调整和发送采样率143的周期设置为头节点111与尾节点115之间用户数据包121的往返时间(round trip time,RTT)。在这种情况下,在没有接收到拥塞指示符141时,针对用户数据包121的每个RTT,都提高采样率143;在接收到拥塞指示符141时,在每个周期(或立即)内都降低采样率143。
图2为INT系统中示例性网元200的示意图。网元200适用于实现本文描述的所公开示例/实施例。网元200包括下行端口220、上行端口250,和/或收发单元(Tx/Rx)210,其中,所述收发单元包括用于通过网络在上游和/或下游传输数据的发送器和/或接收器。网元200还包括:处理器230,包括用于处理数据的逻辑单元和/或中央处理单元(centralprocessing unit,CPU);和用于存储数据的存储器232。网元200还可以包括与上行端口250和/或下行端口220耦合的电子组件、光电(optical-to-electrical,OE)组件、电光(electrical-to-optical,EO)组件,和/或无线通信组件,用于通过电、光或无线通信网络进行数据通信。
处理器230通过硬件和软件实现。处理器230可以实现为一个或多个CPU芯片、核(例如,多核处理器)、现场可编程门阵列(field-programmable gate array,FPGA)、专用集成电路(application specific integrated circuit,ASIC)和数字信号处理器(digitalsignal processor,DSP)。处理器230与下行端口220、Tx/Rx 210、上行端口250和存储器232通信。处理器230包括INT采样模块214。INT采样模块214实现上述公开的实施例,如下文所述的方法300。INT采样模块214还可以在控制器133、采集器131、头节点111、路径节点113、尾节点115和/或控制器400中实现INT采样相关的机制。例如,INT采样模块214可以从采集器接收拥塞指示,根据拥塞指示符生成调整采样率,并将调整采样率发送给头节点,以自适应地控制通信网络中采用的INT机制的应用速率。INT采样模块214还可以实现本文描述的任何其它方法/机制。因此,INT采样模块214使网元200在管理通信网络时提供附加功能和/或灵活性。因此,INT采样模块214改进了网元200的功能,并解决了电信领域特有的问题。此外,INT采样模块214可以将网元200变换到不同的状态。或者,INT采样模块214可以实现为存储在存储器232中并由处理器230执行的指令(例如,作为计算机程序产品,包括存储在非瞬时性介质中的计算机指令,所述计算机指令在执行时指示设备执行对应方法的步骤)。
存储器232包括一个或多个存储器类型,如磁盘、磁带机、固态驱动器、只读存储器(read only memory,ROM)、随机存取存储器(random access memory,RAM)、闪存、三元内容可寻址存储器(ternary content-addressable memory,TCAM)、静态随机存取存储器(static random-access memory,SRAM)等。存储器232可用作溢出数据存储设备,以在选择程序执行时存储此类程序,并存储在程序执行期间读取的指令和数据。
图3为根据网络拥塞自适应调整INT系统的采样率的示例性方法300的流程图。例如,方法300可以在控制器133和/或网元200中实现,用于管理通信网络110中的INT机制。
方法300在控制器确定对流实施INT时开始。例如,可以在建立新的用户数据包流时开始方法300。在另一示例中,可以响应管理员请求(例如确定网络中错误来源的请求)而开始方法300。在步骤301中,根据示例,控制器将指令发送给流的头节点,以执行基于明信片的INT和/或基于护照的INT。执行INT的指令可以包括初始采样率(在某些情况下也称为先前采样率)。例如,可以将初始采样率设置为100%,这表示应该在与流关联的所有用户数据包中添加INT指令头。然后,方法300可以重复和/或周期性完成步骤303、305和307,以根据网络拥塞的变化自适应地改变INT过程的采样率。
在步骤303中,所述控制器可以从采集器接收一个或多个拥塞指示符。拥塞指示符可以包括延迟、丢包、缓冲区大小、显式拥塞通知或其组合。拥塞指示符指示实际或预测的数据丢失,从而指示应该与INT相关任务分开分配网络资源,以减少INT对数据平面功能网络性能的影响(例如,减少或消除与INT相关的观察者效应)。
在步骤305中,所述控制器根据在步骤303中接收的拥塞指示符,和/或根据先前采样率(如在步骤301中使用的初始采样率),和/或在方法300的先前迭代/周期中使用的其它先前采样率,生成用于插入指令头执行INT的调整采样率。在一个具体示例中,控制器可以基于拥塞指示符,根据和式增加和积式减少生成调整采样率。这可能涉及根据在一段时间、周期、通信等内,拥塞指示符的存在或不存在,加性增加先前采样率和乘性减少先前采样率。如本文所述,也可以使用用于调整采样率的其它机制。
在步骤307中,所述控制器将在步骤305中生成的所述调整采样率发送给所述头节点,其中,所述头节点用于通过在用户数据包中插入指令头执行INT。方法300然后可返回到步骤303。在一些示例中,调整采样率可以指示对每个用户数据包插入指令头的概率。在一些示例中,调整采样率可以指示对每个用户数据包组插入指令头的频率。如上所述,通过重复执行步骤303、305和307,周期性生成并发送调整采样率。步骤303、305和307的每次迭代可以看作一个周期。例如,可以将通过执行步骤303、305和307将生成并发送调整采样率的周期设置为在头节点与尾节点之间用户数据包的往返时间。可以根据需要添加延迟,以使方法300符合指定的周期。也可以根据示例使用其它周期。
图4为根据网络拥塞自适应调整INT系统的采样率的示例性控制器400的示意图。例如,控制器400可以由控制器133和/或网元200实现以执行方法300。控制器400包括:接收模块411,用于从采集器接收一个或多个拥塞指示符。控制器400还包括:采样调整模块413,用于根据拥塞指示符生成通过插入指令头执行INT的调整采样率。控制器400还包括:发送模块415,用于将调整采样率发送给头节点,其中,所述头节点用于通过对用户数据包插入指令头执行INT。控制器400的模块也可以用于执行上文关于方法300所述的任何步骤/项目。
当第一组件与第二组件之间除了线、迹线或其它介质之外没有中间组件时,所述第一组件与所述第二组件直接耦合。当第一组件与第二组件之间除了线、迹线或其它介质之外还有中间组件时,第一组件与第二组件间接耦合。术语“耦合”及其变型包括直接耦合和间接耦合。除非另有说明,否则使用术语“约”意指包括后续数字±10%的范围。
虽然本申请中已提供若干实施例,但可以理解,在不脱离本申请的精神或范围的情况下,所公开的系统和方法可以以许多其它特定形式来体现。本示例应被视为说明性而非限制性的,且本申请并不限于本文所给出的细节。例如,可以在另一系统中结合或集成各种元件或组件,或者可以省略或不实现某些特征。
此外,在不脱离本申请范围的情况下,各种实施例中描述和说明为离散或单独的技术、系统、子系统和方法可以与其它系统、组件、技术或方法进行组合或集成。变化、替换和变更的其它实例可由本领域技术人员确定,并可在不脱离本文公开的精神和范围的情况下举例。

Claims (21)

1.一种方法,其特征在于,包括:
控制器的接收器从采集器接收一个或多个拥塞指示符;
所述控制器的处理器根据所述拥塞指示符生成用于通过插入指令头执行带内网络遥测(in-band network telemetry,INT)的调整采样率;
所述控制器的发送器将所述调整采样率发送给头节点,其中,所述头节点用于通过对用户数据包插入指令头执行INT。
2.根据权利要求1所述的方法,其特征在于,所述拥塞指示符包括延迟、丢包、缓冲区大小、显式拥塞通知或其组合。
3.根据权利要求1或2所述的方法,其特征在于,所述调整采样率指示对每个用户数据包插入指令头的概率。
4.根据权利要求1或2所述的方法,其特征在于,所述调整采样率指示对每个用户数据包组插入指令头的频率。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述调整采样率是周期性生成并发送的。
6.根据权利要求1至5中任一项所述的方法,其特征在于,将生成并发送所述调整采样率的周期设置为所述头节点与尾节点之间用户数据包的往返时间。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述调整采样率是基于先前采样率和所述拥塞指示符,根据和式增加和积式减少生成。
8.根据权利要求1至7中任一项所述的方法,其特征在于,还包括:所述发送器向所述头节点发送指令以执行基于明信片的INT。
9.根据权利要求1至7中任一项所述的方法,其特征在于,还包括:所述发送器向所述头节点发送指令以执行基于护照的INT。
10.一种控制器,其特征在于,包括:
接收器,用于从采集器接收一个或多个拥塞指示符;
处理器,用于从所述接收器接收所述拥塞指示符,并接收计算机指令,其中,所述计算机指令在执行时指示所述控制器根据所述拥塞指示符生成通过插入指令头执行带内网络遥测(in-band network telemetry,INT)的调整采样率;
发送器,用于从所述处理器接收所述调整采样率,并将所述调整采样率发送给头节点,其中,所述头节点用于通过对用户数据包插入指令头执行INT。
11.根据权利要求10所述的控制器,其特征在于,所述拥塞指示符包括延迟、丢包、缓冲区大小、显式拥塞通知或其组合。
12.根据权利要求10或11所述的控制器,其特征在于,所述调整采样率指示对每个用户数据包插入指令头的概率。
13.根据权利要求10或11所述的控制器,其特征在于,所述调整采样率指示对每个用户数据包组插入指令头的频率。
14.根据权利要求10至13中任一项所述的控制器,其特征在于,所述调整采样率是周期性生成并发送的。
15.根据权利要求10至14中任一项所述的控制器,其特征在于,将生成并发送所述调整采样率的周期设置为所述头节点与尾节点之间用户数据包的往返时间。
16.根据权利要求10至15中任一项所述的控制器,其特征在于,所述调整采样率是基于先前采样率和所述拥塞指示符,根据和式增加和积式减少生成。
17.根据权利要求10至16中任一项所述的控制器,其特征在于,所述发送器还用于向所述头节点发送指令以执行基于明信片的INT。
18.根据权利要求10至17中任一项所述的控制器,其特征在于,所述发送器还用于向所述头节点发送指令以执行基于护照的INT。
19.一种非瞬时性计算机可读存储介质,其特征在于,包括供视频编码设备使用的计算机程序产品,其中,所述计算机程序产品包括存储在所述非瞬时性计算机可读存储介质中的计算机可执行指令,当处理器执行所述计算机可执行指令时,所述视频编码设备执行根据权利要求1至9中任一项所述的方法。
20.一种控制器,其特征在于,包括:
接收模块,用于从采集器接收一个或多个拥塞指示符;
采样调整模块,用于根据所述拥塞指示符生成通过插入指令头执行带内网络遥测(in-band network telemetry,INT)的调整采样率;
发送模块,用于将所述调整采样率发送给头节点,其中,所述头节点用于通过对用户数据包插入指令头执行INT。
21.根据权利要求20所述的控制器,其特征在于,所述控制器还用于执行根据权利要求1至9中任一项所述的方法。
CN201980098529.2A 2019-09-13 2019-09-13 全网络覆盖的自适应带内网络遥测 Pending CN114128231A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2019/051075 WO2021050083A1 (en) 2019-09-13 2019-09-13 Adaptive in-band network telemetry for full network coverage

Publications (1)

Publication Number Publication Date
CN114128231A true CN114128231A (zh) 2022-03-01

Family

ID=68069915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980098529.2A Pending CN114128231A (zh) 2019-09-13 2019-09-13 全网络覆盖的自适应带内网络遥测

Country Status (4)

Country Link
US (2) US11463905B2 (zh)
EP (1) EP4014439A1 (zh)
CN (1) CN114128231A (zh)
WO (1) WO2021050083A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277698A (zh) * 2022-07-20 2022-11-01 福州大学 基于可靠性的遥测收集方案部署方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11343162B2 (en) * 2020-01-09 2022-05-24 Arista Networks, Inc. Systems and methods for flow-based inband telemetry
US11258684B2 (en) * 2020-01-09 2022-02-22 Arista Networks, Inc. Interval flow-based inband telemetry
US11470007B2 (en) 2021-01-19 2022-10-11 Mellanox Technologies, Ltd. Bandwidth-control policers in a network adapter
US11310163B1 (en) * 2021-02-10 2022-04-19 Mellanox Technologies, Ltd. Network flow sampling fairness
US11956136B2 (en) * 2021-03-24 2024-04-09 Arista Networks, Inc. System and method for scalable and accurate flow rate measurement
CN113242142B (zh) * 2021-04-13 2022-04-29 清华大学 带内网络遥测方法、装置、电子设备及存储介质
CN114567575B (zh) * 2022-04-29 2022-07-22 南京邮电大学 基于int的丢包检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104469562A (zh) * 2013-09-18 2015-03-25 上海贝尔股份有限公司 支持onu间交互的onu和远程节点
CN105592564A (zh) * 2015-08-12 2016-05-18 中山大学 无线Mesh网络中基于活跃节点数估计的自适应接入机制
US20180034740A1 (en) * 2015-02-11 2018-02-01 Telefonaktiebolaget Lm Ericsson (Publ) Ethernet congestion control and prevention
CN109672591A (zh) * 2019-01-21 2019-04-23 中国科学技术大学 实时可编程的抽样带内网络遥测的方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2337292A1 (en) * 2001-02-15 2002-08-15 Linmor Technologies Inc. Dynamically adaptive network element telemetry system
US9270489B1 (en) * 2012-03-19 2016-02-23 Google Inc. Explicit congestion notification in mixed fabric networks
US9106546B1 (en) * 2012-07-26 2015-08-11 Google Inc. Explicit congestion notification in mixed fabric network communications
US9648560B2 (en) * 2013-10-16 2017-05-09 At&T Intellectual Property I, L.P. Utilizing explicit congestion notification for network selection
US9749718B1 (en) * 2016-07-20 2017-08-29 Cisco Technology, Inc. Adaptive telemetry based on in-network cross domain intelligence
JP6801409B2 (ja) * 2016-12-02 2020-12-16 富士通株式会社 経路探索システム、経路探索方法及び経路探索プログラム
US10911355B2 (en) * 2018-12-06 2021-02-02 Cisco Technology, Inc. Multi-site telemetry tracking for fabric traffic using in-band telemetry
US11343261B2 (en) * 2019-04-05 2022-05-24 Cisco Technology, Inc. Technologies for proving packet transit through uncompromised nodes
US11405325B2 (en) * 2019-06-05 2022-08-02 Dell Products L.P. In-band-telemetry-based path MTU size determination system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104469562A (zh) * 2013-09-18 2015-03-25 上海贝尔股份有限公司 支持onu间交互的onu和远程节点
US20180034740A1 (en) * 2015-02-11 2018-02-01 Telefonaktiebolaget Lm Ericsson (Publ) Ethernet congestion control and prevention
CN105592564A (zh) * 2015-08-12 2016-05-18 中山大学 无线Mesh网络中基于活跃节点数估计的自适应接入机制
CN109672591A (zh) * 2019-01-21 2019-04-23 中国科学技术大学 实时可编程的抽样带内网络遥测的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BO LU, .ETC: "iFIT: Intelligent Flow Information Telemetry", SIGCOMM POSTERS AND DEMOS \'19: PROCEEDINGS OF THE ACM SIGCOMM 2019 CONFERENCE POSTERS AND DEMOS, 19 August 2019 (2019-08-19), pages 2 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277698A (zh) * 2022-07-20 2022-11-01 福州大学 基于可靠性的遥测收集方案部署方法
CN115277698B (zh) * 2022-07-20 2024-01-16 福州大学 基于可靠性的遥测收集方案部署方法

Also Published As

Publication number Publication date
WO2021050083A1 (en) 2021-03-18
US20210084530A1 (en) 2021-03-18
EP4014439A1 (en) 2022-06-22
US11463905B2 (en) 2022-10-04
US11924681B2 (en) 2024-03-05
US20230017175A1 (en) 2023-01-19

Similar Documents

Publication Publication Date Title
US11924681B2 (en) Adaptive in-band network telemetry for full network coverage
US10644977B2 (en) Scalable distributed end-to-end performance delay measurement for segment routing policies
US11621896B2 (en) Network embedded real time service level objective validation
US9674071B2 (en) High-precision packet train generation
EP3735762B1 (en) In-band telemetry with limited extra bytes
US9413625B2 (en) Automatic capture of the network delay components
US9847925B2 (en) Accurate measurement of distributed counters
Konda et al. RAPID: Shrinking the congestion-control timescale
US20090003225A1 (en) Method and apparatus for probing of a communication network
CN105245399B (zh) 一种端到端网络通信路径中瓶颈链路的度量方法
IL182111A (en) Application of hardware for network communication testing and monitoring of the execution of a communication network device
EP3295612B1 (en) Uplink performance management
US11057305B2 (en) Congestion notification reporting for a responsive network
US20230171175A1 (en) Real-time network-wide link latency monitoring with in-network int sampling and aggregation
KR102455886B1 (ko) 서비스 기능 체이닝 혼잡 피드백
US10181994B2 (en) Probing a network
US20160373322A1 (en) Controlling generation of filtered result packets
WO2023197498A1 (zh) 操作维护管理信息处理方法、网络节点和存储介质
US11558310B2 (en) Low-latency delivery of in-band telemetry data
CN112262554B (zh) 包可编程流遥测剖析和分析
Konda et al. Shrinking the timescales at which congestioncontrol operates
Dong Available Bandwidth Measurement Method of High-Speed Network Based on Link Idle Probability
ZHANG et al. SaHaD: A Fine-grained In-network Latency Measurement for Datacenter Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination