CN113472697A - 网络信息传输系统 - Google Patents
网络信息传输系统 Download PDFInfo
- Publication number
- CN113472697A CN113472697A CN202110335151.2A CN202110335151A CN113472697A CN 113472697 A CN113472697 A CN 113472697A CN 202110335151 A CN202110335151 A CN 202110335151A CN 113472697 A CN113472697 A CN 113472697A
- Authority
- CN
- China
- Prior art keywords
- network information
- connection
- network
- packets
- rdma
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 20
- 238000012546 transfer Methods 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000005538 encapsulation Methods 0.000 claims description 11
- 230000003362 replicative effect Effects 0.000 claims description 2
- 230000002776 aggregation Effects 0.000 description 9
- 238000004220 aggregation Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000004171 remote diagnosis Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/06—Answer-back mechanisms or circuits
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/30—Peripheral units, e.g. input or output ports
- H04L49/3009—Header conversion, routing tables or routing tags
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/382—Information transfer, e.g. on bus using universal interface adapter
- G06F13/385—Information transfer, e.g. on bus using universal interface adapter for adaptation of a particular data processing system to different peripheral devices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/46—Interconnection of networks
- H04L12/4633—Interconnection of networks using encapsulation techniques, e.g. tunneling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/58—Association of routers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/20—Support for services
- H04L49/208—Port mirroring
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/16—Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
- H04L69/169—Special adaptations of TCP, UDP or IP for interworking of IP based networks with other networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/30—Definitions, standards or architectural aspects of layered protocol stacks
- H04L69/32—Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
- H04L69/322—Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
- H04L69/325—Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the network layer [OSI layer 3], e.g. X.25
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2212/00—Encapsulation of packets
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
一种网络信息传输系统。该网络信息传输系统包括分组处理设备,该分组处理设备包括:控制平面,其被配置为打开与网络信息传输系统外部的目标的远程直接存储器访问(RDMA)连接;封装器,其被配置为将遍历分组处理设备的一个或多个分组进行封装,以产生一个或多个经封装的分组;以及发射器,其被配置为经由RDMA连接将一个或多个经封装的分组发射到网络信息传输系统外部的目标。还描述了相关的装置和方法。
Description
技术领域
本发明总体上涉及联网系统,并且特别但非排他地涉及将信息发送到远程系统的联网系统,进一步特别涉及对联网系统中的问题进行远程诊断。
背景技术
已知将信息发送到远程系统的某些系统,在某些情况下用于远程诊断发送信息的系统中的问题。
发明内容
将网络信息发送到远离网络或远离网络组件的位置的系统在本文中也被称为“网络遥测系统”(以各种语法形式)。术语“网络遥测系统”并不旨在限于“遥测”本身,而是应根据前述定义来理解。在不限制前述普遍性的情况下,这样的信息可以包括对于诊断网络系统中的难题,状态或问题有用的信息。经由网络遥测系统发送的网络信息在本文中也被称为“网络遥测信息”(以各种语法形式)。
在某些示例性实施方式中,本发明试图提供用于网络系统诊断的改进的系统和方法,包括改进的网络遥测系统。
因此,根据本发明的示例性实施方式,提供了一种网络信息传输系统,包括:分组处理设备,其包括控制平面,其被配置为打开与所述网络信息传输系统外部的目标的远程直接存储器访问(RDMA)连接;封装器,其被配置为封装遍历所述分组处理设备的一个或多个分组,以产生一个或多个封装的分组;以及发射器,其被配置为经由所述RDMA连接将所述一个或多个封装的分组发射到所述网络信息传输系统外部的目标。
进一步根据本发明的示例性实施方式,所述分组处理设备包括以下之一:交换机和路由器。
更进一步根据本发明的示例性实施方式,所述一个或多个封装的分组包括遥测信息。
另外,根据本发明的示例性实施方式,所述分组处理设备还包括镜像决定单元,所述镜像决定单元被配置为将所述一个或多个分组在其封装之前进行复制,并且所述封装器封装所述一个或多个复制的分组。
此外,根据本发明的示例性实施方式,所述RDMA连接经过互联网协议(IP)网络。
进一步根据本发明的示例性实施方式,所述RDMA连接包括聚合以太网上的RDMA(RoCE)连接。
仍进一步根据本发明的示例性实施方式,所述RoCE连接包括以下之一:不可靠连接(UC);以及可靠连接。
另外,根据本发明的示例性实施方式,所述RoCE连接包括RoCEv2连接。
此外,根据本发明的示例性实施方式,所述网络信息传输系统外部的所述目标包括收集器系统。
进一步根据本发明的示例性实施方式,所述收集器系统包括网络元件和收集器存储器。
仍然根据本发明的示例性实施方式,所述网络元件包括网络接口控制器(NIC)。
根据本发明的另一示例性实施方式,还提供了一种网络信息传输方法,该方法包括在网络信息传输系统的分组处理设备中,打开与所述网络信息传输系统外部的目标的远程直接存储器访问(RDMA)连接,封装遍历所述分组处理设备的一个或多个分组,产生一个或多个封装的分组,并且经由所述RDMA连接将所述一个或多个封装的分组发射到所述网络信息传输系统外部的目标。
进一步根据本发明的示例性实施方式,所述一个或多个封装的分组包括遥测信息。
仍然进一步根据本发明的示例性实施方式,方法还包括将所述一个或多个分组在其封装之前进行复制,并且其中封装所述一个或多个复制的分组。
另外,根据本发明的示例性实施方式,所述RDMA连接经过互联网协议(IP)网络。
此外,根据本发明的示例性实施方式,所述RDMA连接包括聚合以太网上的RDMA(RoCE)连接。
进一步根据本发明的示例性实施方式,所述RoCE连接包括以下之一:不可靠连接(UC);以及可靠连接。
更进一步根据本发明的示例性实施方式,所述网络信息传输系统外部的所述目标包括收集器系统。
另外,根据本发明的示例性实施方式,所述收集器系统包括网络元件和收集器存储器。
此外,根据本发明的示例性实施方式,所述网络元件包括网络接口控制器(NIC)。
附图说明
本发明从以下结合附图的详细描述中将更充分地理解和领会本发明,其中:
图1A是根据本发明的示例性实施方式构造和操作的网络信息传输系统的简化框图;
图1B是分路汇聚系统的部分图示、部分框图,用于理解图1A的示例性实施方式的某些操作模式;
图2是图1的系统的示例性操作方法的简化流程图;以及
图3是图2的方法的一部分的示例性操作方法的简化流程图。
具体实施方式
通过普遍介绍,相信以下讨论代表了网络信息传输系统的普遍概述(遥测系统被用作特定的非限制性示例);然而,此处所做的任何陈述均不代表该领域中的已知技术的特征:
在某些网络中,网络信息被频繁或持续收集,并可以作为网络遥测信息进行发送,以便诊断和处理网络中可能出现的问题。网络遥测信息的这种收集和发送可以在许多不同的时间尺度上完成,这些时间尺度被选择以便解决各种问题。例如,在没有限制上述内容的普遍性的情况下,小时数据可以被存储和分析以监视系统健康,而第二分辨率数据可以用于警告链路故障等。此类网络中的一个可能的配置是用于本地交换机CPU,其使用循环直接存储器访问(DMA)来“消化”遥测事件并将这些事件发送到一些收集器(通常在收集器处进行分析)。虽然为了简化描述的目的,在此使用交换机的示例,但是应当理解,经适当修改后路由器可以在某些示例性实施方式中替代地使用。这个配置提出了较高的交换机CPU负载要求的问题并受到交换CPU中分组处理的可用带宽的约束。
在另一可能的配置中,所有遥测事件通过隧道作为流量传输到某个收集器,该收集器需要消化接收到的流量并将该流量存储在某个位置。在这种配置下,存在收集器中高CPU负载的问题,并且需要不断地由收集器拉取数据以免丢失任何必需的数据(通常存储在非循环存储器中)。
两种配置都会导致遥测数据的处理速度慢,并且无法处理高分辨率数据。
此外,在收集器侧,非循环存储器需要不断地被“拉取”(读取),以便不丢失相关数据。
为了改进上面刚刚讨论的系统的类型(例如,作为非限制性示例,以使得能够执行微突发分析和实时拥塞控制),可能需要以微秒的分辨率来收集网络信息。据信与网络信息传输系统有关的当前解决方案不能应付所需的时间分辨率(微秒)和需要发射的每秒分组(pps)的所需数目。
在本发明的一些示例性实施方式中,如本文进一步所述,可以使用适当的交换机(例如,作为非限制性示例,可以从Mellanox科技公司购得的以太网交换机ASIC)以使用远程直接存储器访问(RDMA)(例如,通过非限制性示例,聚合以太网上的RDMA(RoCE))流式传输相关事件(例如,作为非限制性示例,遥测事件);这样可以实现必要的pps并管理延迟要求,同时将CPU资源从处理网络中释放出来。在不限制前述内容的普遍性的情况下,在某些示例性实施方式中,可以替代地使用非以太网交换机,例如无限宽带交换机(例如,也可以从Mellanox科技公司购得)。
在本发明的一些示例性实施方式中,使用硬件处理的RoCE来启用事件(作为非限制性示例,例如遥测事件)的处理,该硬件可以包括RoCE不可靠连接(UC)。如本文所使用的,术语“硬件处理的”涉及通信,其中(在打开连接之后,这可能涉及软件的使用)经由硬件发送分组而无需软件干预。在Kagan等人的美国专利7,013,419中描述了这种系统的一个非限制性示例,该专利的公开内容通过引用合并于此。
如上面在遥测系统的总体概述中所述,某些此类基于交换机的系统被认为使用了交换机的一个或多个CPU以轮询循环直接存储器访问(DMA)缓冲区,分析(“消化”)结果,以及将分析的结果发送到收集器。这种方法被认为会占用大量的CPU(在交换机和收集器上),并且会导致相对较慢的分组处理;在本上下文中,“慢”是指以每秒数十万个分组的速率,也许每秒高达几百万个分组的速率处理分组。在使用(如上所述)硬件处理的RoCE连接的本发明的一些示例性实施方式中,可以使交换机能够每秒处理比上述方法多两个甚至三个数量级的分组,而无需在收集器或交换机侧上使用CPU来发送分组(通常,只需要在收集器上使用少量的CPU以将分组“拉”出本地存储器)。
由于RDMA的性质,其中远程(收集器)存储器被直接访问,在存储时无需分析(“消化”)信息;当处理先前存储的信息时,分析可能完全在收集器侧进行。因此,该解决方案对于提供微秒分辨率遥测或其他事件的报告是可行的,其可以用于(通过非限制性示例)处理拥塞控制,处理缓冲区问题以及处理微突发。一个具体的非限制性例子是分路聚合,其中一个交换机可以从多个地方(主机,CPU等)收集信息。如本领域中已知的,在分路聚合中,每个交换机产生数据,该数据被发送到分路聚合器。分路聚合器通常是交换机,其执行聚合(在某些情况下,仅执行聚合),然后向前发送聚合的分组。在本发明的某些示例性实施方式中,如上文和下文所述,在启用分路聚合的情况下,可以使用RDMA实现改进的性能。
现在参考图1A,其是根据本发明的示例性实施方式构造和操作的网络信息传输系统的简化的方框示意图。图1的系统包括交换机105,该交换机105包括用于交换分组的逻辑流水线109。(如上所述,交换机的示例是非限制的;本领域技术人员将理解,路由器也可以在本发明的某些示例性实施方式中使用。这里可以使用术语“分组处理设备”来指定交换机或路由器。)逻辑流水线109被示为包括多个流水线块120;为了简化描述和描述,仅示出了四个这样的流水线块120,应当理解,在交换机105中可以包括更多(或更小)数目的流水线块120。
图1的交换机105还包括以下元件,其操作在下面描述:
镜像决定单元130;
封装器140;
发射器142。
图1的交换机105被示为经由网络连接145与收集器150通信。应当理解,在本发明的某些示例性实施方式中,网络连接145和收集器150在该示例性实施方式外部,使得包括交换机105的子组合包括本发明的示例性实施方式。
图1的收集器150包括网络元件,例如(作为非限制性示例)在收集器侧上的网络接口控制器(NIC)160。用于这种连接的适当NIC的一个非限制性示例是可从Mellanox科技公司购买的ConnectX NIC。
图1的收集器150还包括直接存储器访问(DMA)通道170和收集器存储器180。
现在简要描述图1的系统的示例性操作模式。交换机105(特别是通常与收集器的控制平面152通信的交换机的控制平面102)经由RoCE(通常但不一定使用RoCEv2,已知其使用不可靠连接)通过网络连接145打开到收集器150的不可靠连接(UC)。虽然在这里使用UC的示例,但是应当理解,可以替代地使用可靠的连接。
通常,经由网络接口控制器160从交换机到收集器150打开UC。在一些示例性实施方式中,可以在使用的软件和适当的软件堆栈(例如,作为非限制性示例,SoftRoCE(可经由万维网在github.com/SoftRoCE获得其版本)中完成打开这种UC;应特别理解,在这种上下文下的软件示例(尤其是SoftRoCE)并不意味着限制。
一旦打开了如上刚刚所述的UC,就可以将分组从交换机105发送到收集器150。通常,要发送的分组由封装器140适当地封装(例如,对于RoCEv2来说是已知的)以便发送。发射器142经由UC将封装的分组发送到收集器150。
现在另外参考图1B,其是分路汇聚系统的部分图示、部分框图,用于理解图1A的示例性实施方式的某些操作模式。
除了这里所描述的,总体上以182表示的图1B的分路汇聚系统通常可以类似于本领域中公知的分路汇聚系统,其中多个叶子交换机184(为了描述的简化,示为叶子交换机1,叶子交换机2和叶子交换机n,应当理解,可以使用更少或更多数目的叶子交换机)产生在网络分路186处汇聚的数据,以向前传输到一个或多个收集器系统188(再次,为了描述的简化,示出了三个收集器系统188,应当理解,可以使用更少或更多数目的收集器系统)。
在示例性实施方式中,网络分路186包括诸如参考图1A示出和描述的网络信息传输系统,因此将理解以上参考图1A描述的功能和优点可以在分路聚合系统的情况中实现。
现在另外参考图2,其是图1的系统的示例性操作方法的简化流程图。
如上所述,从交换机100到收集器150打开RoCE连接(步骤210)。
参数被配置用于分组封装(步骤220)。在不限制前述普遍性的情况下,参数由控制平面(例如,图1A的交换机控制平面102)配置。适当的封装参数的以下特定的非限制性示例涉及RoCEv2:
为初始封装配置了以下参数,这些参数在RoCE领域中是众所周知的:
·BTH报头:
(基本)虚拟地址,源/目标队列对,分区键
·RETH报头:
远程密钥
·IP/UDP报头:
源/目标IP,源/目标端口
·DMA长度(每个会话可配置)
众所周知,交换机通常具有流水线架构。通常,进入交换机流水线的任何分组都可以被“镜像”;在本发明的示例性实施方式的情况下,可以进行镜像以将镜像的分组发送到远程收集器。
尽管本文描述了分组的镜像,并且本文描述了封装和发送镜像的分组,但这仅是本发明的某些示例性实施方式的一个非限制性示例。例如,可以选择分组(如在镜像的情况下将在下面立即描述的),并且改变其目标,以便例如在没有镜像的情况下封装和发送分组。
分组可能被镜像以发送到远程收集器的示例性情况的非限制性列表包括:
基于流的原因(作为非限制性示例,基于匹配动作表中的匹配;作为非限制性示例,此类原因可能包括:输入端口;关联的VLAN;通常用户定义的规则;目标IP地址5元组[流标识符]等);
在丢弃分组的情况下;
在达到缓冲区阈值的情况下(例如,达到低剩余缓冲区空间水平);
在达到延迟阈值的情况下(例如,延迟过高);
在分组经由特定的入口端口进入交换机或经由特定的出口端口离开交换机的情况下(在示例性情况下,该特定端口是预先确定的或动态确定的);以及
在分组是控制分组的情况下。
进入交换机的分组基于定义的标准被镜像(例如,根据以上刚刚描述的示例性情况),并且镜像的分组通过封装经由RoCE被发送到收集器150(步骤230)。分组继续被发送;交换机150跟踪附加分组被发送的事实;并且交换机相应地更新放置在后续分组的报头中的信息,更新报头信息以及在收集器150处的DMA的虚拟地址信息(步骤240)。
在本发明的示例性实施方式中,当第一(初始)分组在交换机处被镜像以用于封装并传输到收集器时,通常根据上述用于初始封装的参数来封装第一分组。
在后续分组被镜像以进行封装并传输到收集器时,在封装之前RoCE报头字段由交换机根据以下内容进行更新(根据上述示例):
通过发送的每个分组递增PSN(分组序列号);
虚拟地址(在收集器处)被更新如下:
[基地址+(PSN*DMA长度)]%DMA_COUNT
在紧接以上的虚拟地址更新方程式中,DMA_COUNT指示可放入可用存储器空间中的最大分组数目,由此当可用空间已满时,必须“包装”。
然后,每个后续分组都经由IP网络发送到收集器。应当理解,在本发明的示例性实施方式中,IP网络和收集器不包括在示例性实施方式中。
现在另外参考图3,其是图2的方法的一部分的示例性操作方法的简化流程图,具体包括经由RoCE通过(IP)网络连接145封装和发送分组。
使用诸如以上参考RoCEv2描述的那些的初始连接报头字段来封装初始分组(步骤310)。初始分组经由网络连接145被发送到收集器150(步骤320)。
如上所述,利用更新的PSN和更新的虚拟地址(步骤330)对随后的分组进行封装,并且经由IP网络145发送到收集器150(步骤330)。然后,该方法在步骤330处继续用于下一分组。没有示出图3的方法的显式端部,其指示可以从交换机105向收集器150发送基本上无限数目的分组,实际上应当理解,某种情况下可以停止分组的发送。
应当理解,如果需要,本发明的软件组件可以以ROM(只读存储器)形式实现。如果需要,通常可以使用常规技术以硬件实现软件组件。还应当理解,软件组件可以例如作为计算机程序产品或在有形介质上被实例化。尽管在本发明的某些实施方式中可以不包括这样的实例化,但是在某些情况下,可以将软件组件实例化为可由适当的计算机解释的信号。
应当理解,为清楚起见,在分开的实施方式的上下文中描述的本发明的各种特征也可以在单个实施方式中组合提供。相反,为简洁起见,在单个实施方式的上下文中描述的本发明的各种特征也可以单独地或以任何合适的子组合来提供。
本领域技术人员将理解,本发明不限于上文已经具体示出和描述的内容。而是,本发明的范围由所附权利要求书及其等同物限定。
Claims (20)
1.一种网络信息传输系统,包括:
分组处理设备,包括:
控制平面,所述控制平面被配置为打开与所述网络信息传输系统外部的目标的远程直接存储器访问(RDMA)连接;
封装器,所述封装器被配置为将遍历所述分组处理设备的一个或多个分组进行封装,以产生一个或多个经封装的分组;以及
发射器,所述发射器被配置为经由所述RDMA连接将所述一个或多个经封装的分组发射到所述网络信息传输系统外部的所述目标。
2.根据权利要求1所述的网络信息传输系统,其中所述分组处理设备包括以下之一:交换机;和路由器。
3.根据权利要求1所述的网络信息传输系统,其中所述一个或多个经封装的分组包括遥测信息。
4.根据权利要求1所述的网络信息传输系统,其中所述分组处理设备还包括镜像决定单元,所述镜像决定单元被配置为将所述一个或多个分组在其封装之前进行复制,并且
所述封装器封装所述一个或多个经复制的分组。
5.根据权利要求1所述的网络信息传输系统,其中所述RDMA连接经过互联网协议(IP)网络。
6.根据权利要求5所述的网络信息传输系统,其中所述RDMA连接包括聚合以太网上的RDMA(RoCE)连接。
7.根据权利要求6所述的网络信息传输系统,其中所述RoCE连接包括以下之一:不可靠连接(UC);以及可靠连接。
8.根据权利要求7所述的网络信息传输系统,其中所述RoCE连接包括RoCEv2连接。
9.根据权利要求1所述的网络信息传输系统,其中所述网络信息传输系统外部的所述目标包括收集器系统。
10.根据权利要求9所述的网络信息传输系统,其中所述收集器系统包括网络元件和收集器存储器。
11.根据权利要求10所述的网络信息传输系统,其中所述网络元件包括网络接口控制器(NIC)。
12.一种网络信息传输方法,包括:
在网络信息传输系统的分组处理设备中:
打开与所述网络信息传输系统外部的目标的远程直接存储器访问(RDMA)连接;
将遍历所述分组处理设备的一个或多个分组进行封装,产生一个或多个经封装的分组;以及
经由所述RDMA连接将所述一个或多个经封装的分组发射到所述网络信息传输系统外部的所述目标。
13.根据权利要求12所述的方法,其中所述一个或多个经封装的分组包括遥测信息。
14.根据权利要求12所述的方法,还包括将所述一个或多个分组在其封装之前进行复制,
并且其中封装所述一个或多个经复制的分组。
15.根据权利要求12所述的方法,其中所述RDMA连接经过互联网协议(IP)网络。
16.根据权利要求15所述的方法,其中所述RDMA连接包括聚合以太网上的RDMA(RoCE)连接。
17.根据权利要求16所述的方法,其中所述RoCE连接包括以下之一:不可靠连接(UC);以及可靠连接。
18.根据权利要求12所述的方法,其中所述网络信息传输系统外部的所述目标包括收集器系统。
19.根据权利要求18所述的方法,其中所述收集器系统包括网络元件和收集器存储器。
20.根据权利要求19所述的方法,其中所述网络元件包括网络接口控制器(NIC)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310859388.XA CN117176486A (zh) | 2020-03-30 | 2021-03-29 | 网络信息传输系统 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/833,715 US20210306166A1 (en) | 2020-03-30 | 2020-03-30 | Network information transmission systems |
US16/833,715 | 2020-03-30 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310859388.XA Division CN117176486A (zh) | 2020-03-30 | 2021-03-29 | 网络信息传输系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113472697A true CN113472697A (zh) | 2021-10-01 |
Family
ID=75277802
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310859388.XA Pending CN117176486A (zh) | 2020-03-30 | 2021-03-29 | 网络信息传输系统 |
CN202110335151.2A Pending CN113472697A (zh) | 2020-03-30 | 2021-03-29 | 网络信息传输系统 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310859388.XA Pending CN117176486A (zh) | 2020-03-30 | 2021-03-29 | 网络信息传输系统 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210306166A1 (zh) |
EP (1) | EP3890279A1 (zh) |
CN (2) | CN117176486A (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11212219B1 (en) * | 2020-06-26 | 2021-12-28 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | In-band telemetry packet size optimization |
US11811867B2 (en) * | 2020-09-01 | 2023-11-07 | International Business Machines Corporation | Data transmission routing based on replication path capability |
US11637739B2 (en) * | 2021-01-10 | 2023-04-25 | Mellanox Technologies, Ltd. | Direct memory access (DMA) engine for diagnostic data |
US11936726B2 (en) * | 2021-10-12 | 2024-03-19 | Pensando Systems Inc. | Methods and systems for implementing traffic mirroring for network telemetry |
US11876691B2 (en) | 2022-01-28 | 2024-01-16 | Nokia Solutions And Networks Oy | End-to-end RDMA telemetry system |
US11765237B1 (en) | 2022-04-20 | 2023-09-19 | Mellanox Technologies, Ltd. | Session-based remote direct memory access |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120287944A1 (en) * | 2011-05-09 | 2012-11-15 | Emulex Design & Manufacturing Corporation | RoCE PACKET SEQUENCE ACCELERATION |
CN105472023A (zh) * | 2014-12-31 | 2016-04-06 | 华为技术有限公司 | 一种远程直接存储器存取的方法及装置 |
US20170171075A1 (en) * | 2015-12-10 | 2017-06-15 | Cisco Technology, Inc. | Co-existence of routable and non-routable rdma solutions on the same network interface |
CN107690778A (zh) * | 2015-05-29 | 2018-02-13 | 微软技术许可有限责任公司 | 使用镜像探测分组测量网络的性能 |
US20190280982A1 (en) * | 2018-03-07 | 2019-09-12 | Fujitsu Limited | Information processing apparatus and information processing system |
US20190280978A1 (en) * | 2018-03-06 | 2019-09-12 | International Business Machines Corporation | Flow management in networks |
CN110313163A (zh) * | 2017-02-21 | 2019-10-08 | 微软技术许可有限责任公司 | 分布式计算系统中的负载平衡 |
CN110704361A (zh) * | 2019-08-28 | 2020-01-17 | 阿里巴巴集团控股有限公司 | Rdma数据发送及接收方法、电子设备及可读存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8051212B2 (en) | 2001-04-11 | 2011-11-01 | Mellanox Technologies Ltd. | Network interface adapter with shared data send resources |
US9747249B2 (en) * | 2014-12-29 | 2017-08-29 | Nicira, Inc. | Methods and systems to achieve multi-tenancy in RDMA over converged Ethernet |
US11403137B2 (en) * | 2018-10-10 | 2022-08-02 | Intel Corporation | Method and apparatus for secure data center bridging in a multi-tenant system |
US10725948B2 (en) * | 2018-10-17 | 2020-07-28 | Cisco Technology, Inc. | RoCE over wireless |
US11184295B2 (en) * | 2018-12-28 | 2021-11-23 | Vmware, Inc. | Port mirroring based on remote direct memory access (RDMA) in software-defined networking (SDN) environments |
US11018973B2 (en) * | 2019-05-31 | 2021-05-25 | Microsoft Technology Licensing, Llc | Distributed sonic fabric chassis |
US10999084B2 (en) * | 2019-05-31 | 2021-05-04 | Microsoft Technology Licensing, Llc | Leveraging remote direct memory access (RDMA) for packet capture |
US11296987B2 (en) * | 2020-04-20 | 2022-04-05 | Hewlett Packard Enterprise Development Lp | Congestion management mechanism |
-
2020
- 2020-03-30 US US16/833,715 patent/US20210306166A1/en not_active Abandoned
-
2021
- 2021-03-26 EP EP21165309.2A patent/EP3890279A1/en active Pending
- 2021-03-29 CN CN202310859388.XA patent/CN117176486A/zh active Pending
- 2021-03-29 CN CN202110335151.2A patent/CN113472697A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120287944A1 (en) * | 2011-05-09 | 2012-11-15 | Emulex Design & Manufacturing Corporation | RoCE PACKET SEQUENCE ACCELERATION |
CN105472023A (zh) * | 2014-12-31 | 2016-04-06 | 华为技术有限公司 | 一种远程直接存储器存取的方法及装置 |
CN107690778A (zh) * | 2015-05-29 | 2018-02-13 | 微软技术许可有限责任公司 | 使用镜像探测分组测量网络的性能 |
US20170171075A1 (en) * | 2015-12-10 | 2017-06-15 | Cisco Technology, Inc. | Co-existence of routable and non-routable rdma solutions on the same network interface |
CN110313163A (zh) * | 2017-02-21 | 2019-10-08 | 微软技术许可有限责任公司 | 分布式计算系统中的负载平衡 |
US20190280978A1 (en) * | 2018-03-06 | 2019-09-12 | International Business Machines Corporation | Flow management in networks |
US20190280982A1 (en) * | 2018-03-07 | 2019-09-12 | Fujitsu Limited | Information processing apparatus and information processing system |
CN110704361A (zh) * | 2019-08-28 | 2020-01-17 | 阿里巴巴集团控股有限公司 | Rdma数据发送及接收方法、电子设备及可读存储介质 |
Non-Patent Citations (2)
Title |
---|
YANGFANG: "《RoGUE : RDMA over Generic Unconverged Ethernet》", 《SOCC ’18, OCTOBER 11–13, 2018, CARLSBAD, CA, USA © 2018 ASSOCIATION FOR COMPUTING MACHINERY》 * |
YIBO ZHU: "《packet-level telemetry in large datacenter networks》", 《PROCEEDINGS OF THE 2015 ACM CONFERENCE ON SPECIAL INTEREST GROUP ON DATA COMMUNICATION》 * |
Also Published As
Publication number | Publication date |
---|---|
US20210306166A1 (en) | 2021-09-30 |
CN117176486A (zh) | 2023-12-05 |
EP3890279A1 (en) | 2021-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113472697A (zh) | 网络信息传输系统 | |
USRE48645E1 (en) | Exporting real time network traffic latency and buffer occupancy | |
US10735325B1 (en) | Congestion avoidance in multipath routed flows | |
US8170025B2 (en) | Switch port analyzers | |
US8149705B2 (en) | Packet communications unit | |
US10778588B1 (en) | Load balancing for multipath groups routed flows by re-associating routes to multipath groups | |
US10693790B1 (en) | Load balancing for multipath group routed flows by re-routing the congested route | |
US20030076850A1 (en) | Determining packet size in networking | |
CN108667898B (zh) | 网元和用于提供网元中的缓冲器内容的快照的方法 | |
US11818022B2 (en) | Methods and systems for classifying traffic flows based on packet processing metadata | |
US20120300772A1 (en) | Sharing of internal pipeline resources of a network processor with external devices | |
US10110715B2 (en) | Providing efficient routing of an operations, administration and maintenance (OAM) frame received at a port of an ethernet switch | |
US11943128B1 (en) | Path telemetry data collection | |
JP5518754B2 (ja) | ネットワークノード | |
CN113328956B (zh) | 一种报文处理方法及装置 | |
CN106230660B (zh) | sFlow采样的方法及装置 | |
US11671281B1 (en) | Handling interface clock rate mismatches between network devices | |
US7009973B2 (en) | Switch using a segmented ring | |
US20030169764A1 (en) | Network device for sampling a packet | |
CN112311618B (zh) | 网络交换设备的测试方法与测试设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220309 Address after: Yoknam, Israel Applicant after: Mellanox Technologies, Ltd. Address before: Israel Lai Ananna Applicant before: Mellanox Technologies TLV Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211001 |