CN116566763A - 网络系统、通信方法、网络节点和存储介质 - Google Patents

网络系统、通信方法、网络节点和存储介质 Download PDF

Info

Publication number
CN116566763A
CN116566763A CN202310530889.3A CN202310530889A CN116566763A CN 116566763 A CN116566763 A CN 116566763A CN 202310530889 A CN202310530889 A CN 202310530889A CN 116566763 A CN116566763 A CN 116566763A
Authority
CN
China
Prior art keywords
rdma
virtualized
network
protocol header
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310530889.3A
Other languages
English (en)
Inventor
秦超
张彭城
冯飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202310530889.3A priority Critical patent/CN116566763A/zh
Publication of CN116566763A publication Critical patent/CN116566763A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4641Virtual LANs, VLANs, e.g. virtual private networks [VPN]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4641Virtual LANs, VLANs, e.g. virtual private networks [VPN]
    • H04L12/4645Details on frame tagging

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请实施例提供了网络系统、通信方法、网络节点和存储介质。该网络系统包括:多个网络节点,每个网络节点上包括一个或多个虚拟化节点;两个虚拟化节点之间的RDMA信令包用于建立两个虚拟化节点之间的RDMA连接,RDMA信令包的封装中包括RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部和物理网络IP协议头部,RDMA信令包的虚拟化协议头部中包括发送RDMA信令包的虚拟化节点的虚拟化标识,不同的虚拟化标识用于标识不同的虚拟网络;两个虚拟化节点之间的RDMA数据包用于在建立RDMA连接后进行数据传输,RDMA数据包的封装中包括RDMA协议头部和物理网络IP协议头部,RDMA数据包的物理网络IP协议头部中包括发送RDMA数据包的虚拟化节点的虚拟化标识,降低了数据传输开销。

Description

网络系统、通信方法、网络节点和存储介质
技术领域
本申请涉及网络技术领域,并且更具体地,涉及网络系统、通信方法、网络节点和存储介质。
背景技术
常用的虚拟化技术有虚拟机(Virtual Machine)和容器(Container)等,通过虚拟化技术在网络系统的物理网络节点上创建虚拟化节点,例如虚拟机节点和/或容器节点,虚拟化节点之间可以基于虚拟网络和物理网络进行通信。
在虚拟化节点之间采用远程直接数据存取(Remote Direct Memory Access,RDMA)的方式进行数据传输的场景中,现有的网络虚拟化及和隔离技术会过多地引入对数据的额外封装,使得传输开销过大。
发明内容
本申请提供了网络系统、通信方法、网络节点和存储介质,以减少网络系统中数据的传输开销。
第一方面,本申请提供了一种网络系统,包括:多个网络化节点,每个网络节点上包括一个或多个虚拟化节点,所述虚拟化节点包括容器节点和/或虚拟机节点,两个虚拟化节点之间基于远程直接数据存取RDMA进行通信;其中,
两个虚拟化节点之间的RDMA信令包用于建立所述两个虚拟化节点之间的RDMA连接,所述RDMA信令包的封装中包括RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部和物理网络IP协议头部,所述RDMA信令包的虚拟化协议头部中包括发送所述RDMA信令包的虚拟化节点的虚拟化标识,不同的虚拟化标识用于标识不同的虚拟网络;
所述两个虚拟化节点之间的RDMA数据包用于在建立RDMA连接后进行数据传输,所述RDMA数据包的封装中包括RDMA协议头部和物理网络IP协议头部,所述RDMA数据包的物理网络IP协议头部中包括发送所述RDMA数据包的虚拟化节点的虚拟化标识。
在一种实现方式中,所述虚拟化标识为虚拟扩展局域网网络标识符VNI。
在一种实现方式中,所述虚拟网络IP协议头部为IPv4协议头部或IPv6协议头部,所述物理网络IP协议头部为IPv4协议头部或IPv6协议头部。
在一种实现方式中,所述物理网络IP协议头部为IPv6协议头部,所述RDMA数据包的物理网络IP协议头部中的虚拟化标识被编码在网络节点的物理网卡IPv6地址中。
在一种实现方式中,所述网络节点通过邻居发现ND协议报文,触发所述网络系统中的网关设备对所述网络节点的物理网卡IPv6地址进行解析以得到对应于所述网络节点的转发表项。
在一种实现方式中,所述RDMA数据包的物理网络IP协议头部中包括发送所述RDMA数据包的虚拟化节点和/或虚拟化节点所在的网络节点的流控信息。
在一种实现方式中,所述RDMA协议头部是基于所述虚拟化节点的RDMA网络标识生成的,所述虚拟化节点的RDMA网络标识基于所述虚拟化节点的虚拟话标识和所述虚拟化节点所在的网络节点的物理网卡IP地址生成。
第二方面,本申请提供一种通信方法,应用于网络系统中,所述网络系统包括多个网络节点,每个网络节点上包括一个或多个虚拟化节点,所述虚拟化节点包括虚拟化节点和/或虚拟机节点,两个虚拟化节点之间基于远程直接数据存取RDMA进行通信,所述方法包括:
两个虚拟化节点之间通过RDMA信令包建立RDMA连接,所述RDMA信令包的封装中包括RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部和物理网络IP协议头部,所述RDMA信令包的虚拟化协议头部中包括发送所述RDMA信令包的虚拟化节点的虚拟化标识,不同的虚拟化标识用于标识不同的虚拟网络;
所述两个虚拟化节点在建立RDMA连接后,通过RDMA数据包进行数据传输,所述RDMA数据包的封装中包括RDMA协议头部和物理网络IP协议头部,所述RDMA数据包的物理网络IP协议头部中包括发送所述RDMA数据包的虚拟化节点的虚拟化标识。
第三方面,本申请提供一种通信方法,应用于网络系统中的第一网络节点上的第一虚拟化节点,所述网络系统包括多个网络节点,每个网络节点上包括一个或多个虚拟化节点,所述虚拟化节点包括容器节点和/或虚拟机节点,两个虚拟化节点之间基于远程直接数据存取RDMA进行通信,所述方法包括:
通过RDMA信令包与第二虚拟化节点建立RDMA连接,所述RDMA信令包的封装中包括RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部和物理网络IP协议头部,所述RDMA信令包的虚拟化协议头部中包括所述第一虚拟化节点的虚拟化标识,不同的虚拟化标识用于标识不同的虚拟网络;
在与所述第二虚拟化节点建立RDMA连接后,通过RDMA数据包向所述第二虚拟化节点发送数据,所述RDMA数据包的封装中包括RDMA协议头部和物理网络IP协议头部,所述RDMA数据包的物理网络IP协议头部中包括所述第一虚拟化节点的虚拟化标识。
第四方面,本申请提供了一种网络节点,包括:存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述存储器中存储的计算机程序,所述计算机程序运行时使得所述处理器执行第三方面所述的方法。
第五方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序被处理器执行时,使得所述处理器执行如第三方面所述的方法。
在本申请提供的网络系统、通信方法、网络节点和存储介质中,该网络系统中,网络节点上的虚拟化节点基于RDMA进行通信,其中,用于建立RDMA连接的RDMA信令包的封装包括RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部以及物理网络IP协议头部,虚拟化协议头部中包括发送该RDMA信令包的虚拟化节点的虚拟化标识,不同的虚拟化标识用于标识不同的虚拟网络,而对于建立RDMA连接之后虚拟化节点之间传输的RDMA数据包,其封装中包括RDMA协议头部和物理网络IP协议头部,同时,为了保证虚拟化节点的虚拟网络隔离,将虚拟化节点的虚拟化标识携带在RDMA数据包的物理网络的IP协议头部中,从而在实现了RDMA数据传输的同时,减少RDMA数据包的封装所占用的传输开销,提升了网络性能。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网络系统的示意图;
图2是本申请实施例提供的一种网络系统的虚拟化节点的实现示意图;
图3是本申请实施例提供的一种RDMA信令包和RDMA数据包的封装示意图;
图4是本申请实施例提供的一种通信方法的流程示意图一;
图5是本申请实施例提供的一种通信方法的流程示意图二;
图6是本申请实施例提供的一种网络节点的结构示意图;
图7是本申请实施例提供的网络节点的示意性框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
网络虚拟化的实现方案有多种,以覆盖(Overlay)网络为例来说,Overlay网络和底层(Underlay)网络是一组相对概念,Overlay网络是建立在Underlay网络上的逻辑网络,也就是虚拟网络,而Underlay网络则是底层物理基础,是由多个类型设备互联而成的物理网络,负责设备之间的数据包传输。采用网络虚拟化技术在Underlay网络之上创建虚拟的Overlay网络,在Overlay网络中,虚拟化节点之间可以通过逻辑链路,按照需求完成互联形成Overlay拓扑。相互连接的Overlay网络中的虚拟化节点之间建立隧道,数据在传输时被封装上内层的Overlay网络IP协议头部、隧道头部以及外层的Underlay网络IP协议头部。
Overlay网络有着各种网络协议和标准,以虚拟扩展局域网(Virtual eXtensibleLocal Area Network,VXLAN)协议为例,虚拟化节点之间建立VXLAN隧道,数据在传输时被封装上内层的Overlay网络IP协议头部、VXLAN协议头部以及外层的Underlay网络IP协议头部,其中,VXLAN头部中包括了VXLAN网络标识符(VXLAN Network Identifier,VNI),也就是一种虚拟化标识,不同的VNI代表不同的虚拟网络,通过虚拟化标识实现了虚拟化节点的Overlay网络的隔离。也就是说,在网络虚拟化的场景中,虚拟化节点的数据会被封装上虚拟网络IP协议头部、虚拟化协议头部以及物理网络IP协议头部,虚拟化协议头部即前述的隧道头部,例如VXLAN协议头部。
在上述网络虚拟化的前提下,虚拟化节点之间还可以采用RDMA的方式进行数据传输,也就是虚拟化节点之间通过建立RDMA连接来进行数据传输。RDMA意为远程直接内存访问,可以实现零拷贝、内核旁路(Bypass)以及中央处理器(Central Processing Unit,CPU)卸载,其中,零拷贝指的是不需要在用户空间和内核空间中来回复制数据,内核Bypass指的是数据读写流程可以绕过内核,即在用户层就可以把数据准备好并通知硬件准备发送和接收,CPU卸载指的是可以在远端节点CPU不参与通信的情况下对内存进行读写。RDMA协议有多种具体的实现方式,在实际使用中,需要先按照RDMA协议对数据进行封装,之后再进行前述的虚拟网络IP协议头部、虚拟化协议头部以及物理网络IP协议头部的封装。可以看出,虚拟化节点之间的数据需要经过层层协议的封装,这导致数据传输开销过大,影响网络系统的性能。
有鉴于此,本申请实施例中提出一种网络系统,该网络系统中的每个网络节点上包括一个或多个虚拟化节点,网络系统中的虚拟化节点基于RDMA进行通信,即虚拟化节点之间通过RDMA连接形成RDMA网络,虚拟化节点之间先基于虚拟网络的TCP/IP连接来建立RDMA连接,之后基于RDMA连接传输数据,由于RDMA连接的建立依赖于虚拟网络的TCP/IP连接,因此,用于建立RDMA连接的RDMA信令的封装仍需要在进行RDMA协议封装后,再进行虚拟网络的IP头部、虚拟化协议头部以及物理网络IP协议头部的封装,而对于建立RDMA连接之后传输的RDMA数据,为了避免额外的封装,在对RDMA数据进行RDMA协议封装之后直接对其进行物理网络的IP协议头部封装,同时,为了保证虚拟网络的隔离,将虚拟化节点的虚拟化标识携带在物理网络IP协议头部中,从而在实现了RDMA数据传输的同时,减少RDMA数据包的封装所占用的传输开销。以下通过具体实施例进行说明。
图1是本申请实施例提供的一种网络系统的示意图。如图1所示,该网络系统包括:多个网络节点,每个网络节点上包括一个或多个虚拟化节点,虚拟化节点包括容器节点和/或虚拟机节点,虚拟化节点之间基于RDMA进行通信。其中,
两个虚拟化节点之间的RDMA信令包用于建立两个虚拟化节点之间的RDMA连接,RDMA信令包的封装中包括RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部和物理网络IP协议头部,RDMA信令包的虚拟化协议头部中包括发送RDMA信令包的虚拟化节点的虚拟化标识,不同的虚拟化标识用于标识不同的虚拟网络。
两个虚拟化节点之间的RDMA数据包用于在建立RDMA连接后进行数据传输,RDMA数据包的封装中包括RDMA协议头部和物理网络IP协议头部,RDMA数据包的物理网络IP协议头部中包括发送RDMA数据包的虚拟化节点的虚拟化标识。
本申请实施例中,网络节点上的虚拟化节点按照通信需求建立RDMA连接,形成RDMA网络。该网络系统中的虚拟化节点之间传输的RDMA信令和RDMA数据采用不同的封装,将RDMA信令进行封装后称为RDMA信令包,将RDMA数据进行封装后称为RDMA数据包。
RDMA网络中的虚拟化节点具有RDMA网络标识,虚拟化节点之间可以通过RDMA网络标识来标识一条RDMA连接,RDMA网络标识可以是在RDMA连接建立时生成或分配的。RDMA协议头部是基于虚拟化节点的RDMA网络标识生成的,需要说明的是,RDMA协议头部可以是基于虚拟化节点的RDMA网络标识以及其他信息共同生成的。虚拟化节点的RDMA网络标识可以基于虚拟化节点的虚拟话标识和虚拟化节点所在的网络节点的物理网卡IP地址生成。需要说明的是,RDMA网络标识可以是基于前述的虚拟话标识、物理网卡IP地址以及其他信息共同生成的。
由于RDMA连接的建立依赖于虚拟网络的TCP/IP连接,因此,用于建立RDMA连接的RDMA信令包的封装中包括了RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部以及物理网络IP协议头部,以虚拟网络采用Overlay网络和VXLAN的实现方式来说,RDMA信令包的封装中包括了RDMA协议头部、Overlay网络IP协议头部、VXLAN协议头部以及Underlay网络IP协议头部。其中,VXLAN协议头部中包括了虚拟化节点的虚拟化标识,虚拟化标识为VNI。
而相较于RDMA信令包,本申请实施例中对RDMA数据包的封装减少了虚拟网络IP协议头部和虚拟化协议头部,并且将虚拟化节点的虚拟化标识携带在物理网络的IP头部中,RDMA数据包的封装中包括RDMA协议头部和携带了虚拟化标识的物理网络IP协议头部,这样,在保证了虚拟化节点的虚拟网络隔离的前提下,减少了RDMA数据包的封装层数,从而降低了传输开销,提高了网络性能。
本申请实施例中,网络系统中的物理网络以及虚拟网络所采用的IP协议并不限定,且物理网络和虚拟网络所采用的IP协议可以一致也可以不一致,也就是说,物理网络和虚拟网络均可以根据应用需要选择采用IPv4协议或IPv6协议,两者之间并无关联。例如,物理网络采用IPv4协议的情况下,虚拟网络可以采用IPv4协议或IPv6协议;类似的,物理网络采用IPv6协议的情况下,虚拟网络可以采用IPv4协议或IPv6协议。基于物理网络和虚拟网络所采用的IP协议,前述实施例中的虚拟网络IP协议头部可以为IPv4协议头部或IPv6协议头部,物理网络IP协议头部可以为IPv4协议头部或IPv6协议头部。
对于RDMA数据包,其中包含的虚拟化节点的虚拟化标识携带在物理网络IP协议头部中,可选的,物理网络IP协议头部为IPv6协议头部的情况下,物理网络IP协议头部中包括虚拟化节点所在的网络节点的物理网卡IPv6地址,RDMA数据包的物理网络IP协议头部中的虚拟化标识可以被编码在该网络节点的物理网卡IPv6地址中,也就是说,可以利用网络节点的物理网卡IPv6地址中的空间,例如取其中的24位(bit),作为虚拟化标识的编码空间,通过将虚拟化标识编码在网络节点的物理网卡IPv6地址中,实现了通过物理网络IP协议头部携带虚拟化节点的虚拟化标识。可选的,物理网络IP协议头部为IPv6协议头部的情况下,也可以采用IPv6协议头部中的其他字段,例如保留字段或特定的标识字段等来携带虚拟化节点的虚拟化标识,或者,也可以采用IPv6协议的扩展头部来携带虚拟化节点的虚拟化标识。对于物理网络IP协议头部为IPv4协议头部的情况下,与前述类似的,也可以采用IPv4协议头部中的保留字段或特定的标识字段等来携带虚拟化节点的虚拟化标识。
本申请实施例中对于RDMA数据包的物理网络IP协议头部中虚拟化标识所占用的具体字段或虚拟化标识的编码方式等不做限定,只要将虚拟化节点的虚拟化标识携带在物理网络IP协议头部中即可。
需要说明的是,在将虚拟化节点的虚拟化标识编码在其所在的网络节点的物理网卡IPv6地址中的场景中,网络节点通过邻居发现(Neighbor Discovery,ND)协议报文,触发网络系统中的网关设备,例如交换机、路由器,对网络节点的物理网卡IPv6地址进行解析以得到对应于网络节点的转发表项,以实现对采用上述编码的IPv6地址的RDMA数据包的正确传输。
可选的,为了提高网络系统性能,本申请实施例中的RDMA数据包的物理网络IP协议头部中还可以包括发送RDMA数据包的虚拟化节点和/或虚拟化节点所在的网络节点的流控信息,通过该流控信息实现对RDMA数据包的流量控制。可选的,流控信息可用于指示RDMA数据包的传输优先级。
图2是本申请实施例提供的一种网络系统的虚拟化节点的实现示意图。图2中的Pod为一种容器节点,图中以容器中运行人工智能(Artificial Intelligence,AI)应用为例进行示意。Eth0为容器节点的虚拟网络的IP网卡,分配有相应的IP地址。物理网卡中示意的物理功能(Physical Function,PF)、虚拟功能(Virtual Function,VF)、虚拟交换机仅用于示意一种实现方式,而不是用于对物理网卡进行限定。
本申请实施例中,将容器节点的网络类型(Network Type)配置为RDMA,可选的,基于RDMA协议的不同,网络类型也可以进一步划分,例如RDMA协议为基于融合以太网的RDMA(RDMA over Converged Ethernet,RoCE)协议,对应的网络类型为RDMA-RoCE,又如RDMA协议为Solar-RDMA协议,对应的网络类型为RDMA-solar。在基于TCP/IP的RDMA信令网(RDMAover TCP/IP)建立RDMA连接,分配容器节点的RDMA网络标识,例如RDMA网络标识为队列对上下文(Queue Pair Context,QPC)或连接标识(Conn-id),在RDMA数据网,基于RDMA连接封装数据包进行数据传输。
对于容器节点,本申请实施例中定义新的RDMA网卡,图中以rd0进行示例,将rd0插入Pod命名空间(namespace)中。
容器网络管理系统将同一容器节点在虚拟网络的地址信息同步到地址管理功能组件,包括IP网络地址信息和RDMA网络地址信息。容器网络管理系统将容器节点的虚拟化标识和容器节点所在网络节点的物理网卡IP地址进行关联存入RDMA流表中,并且针对内嵌虚拟化标识的物理网卡IP地址代理与网关设备之间的ND协议交互。
RDMA驱动从容器网络管理系统获取容器节点的虚拟化标识以及容器节点所在网络节点的物理网卡IP地址,提供给用户侧RDMA软件栈,用于RDMA建连,并在建连后将RDMA网络标识所包括的表项下发至物理网卡硬件缓存(cache)的RDMA流表中。RDMA网络标识所包括的表项中可以包括RDMA网络地址。物理网卡硬件封装RDMA数据包并进行报文传输。图3中示意了RDMA信令包和RDMA数据包的封装。
图4是本申请实施例提供的一种通信方法的流程示意图一。该方法应用于网络系统中,网络系统包括多个网络节点,每个网络节点上包括一个或多个虚拟化节点,虚拟化节点包括虚拟化节点和/或虚拟机节点,两个虚拟化节点之间基于远程直接数据存取RDMA进行通信。如图4所示,该方法包括:
S401、两个虚拟化节点之间通过RDMA信令包建立RDMA连接,RDMA信令包的封装中包括RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部和物理网络IP协议头部,RDMA信令包的虚拟化协议头部中包括发送RDMA信令包的虚拟化节点的虚拟化标识,不同的虚拟化标识用于标识不同的虚拟网络。
S402、两个虚拟化节点在建立RDMA连接后,通过RDMA数据包进行数据传输,RDMA数据包的封装中包括RDMA协议头部和物理网络IP协议头部,RDMA数据包的物理网络IP协议头部中包括发送RDMA数据包的虚拟化节点的虚拟化标识。
本申请实施例的方法应用于前述实施例中的网络系统,其实现原理和技术效果参见前述实施例的描述,此处不再赘述。
图5是本申请实施例提供的一种通信方法的流程示意图二。该方法应用于网络系统中的第一网络节点上的第一虚拟化节点,网络系统包括多个网络节点,每个网络节点上包括一个或多个虚拟化节点,虚拟化节点包括容器节点和/或虚拟机节点,两个虚拟化节点之间基于远程直接数据存取RDMA进行通信。如图5所示,该方法包括:
S501、通过RDMA信令包与第二虚拟化节点建立RDMA连接,RDMA信令包的封装中包括RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部和物理网络IP协议头部,RDMA信令包的虚拟化协议头部中包括第一虚拟化节点的虚拟化标识,不同的虚拟化标识用于标识不同的虚拟网络。
S502、在与第二虚拟化节点建立RDMA连接后,通过RDMA数据包向第二虚拟化节点发送数据,RDMA数据包的封装中包括RDMA协议头部和物理网络IP协议头部,RDMA数据包的物理网络IP协议头部中包括第一虚拟化节点的虚拟化标识。
本申请实施例的方法应用于前述实施例中的网络系统中的虚拟化节点,其实现原理和技术效果参见前述实施例的描述,此处不再赘述。
图6是本申请实施例提供的一种网络节点的结构示意图。如图6所示,该网络节点600包括:
建联模块601,通过RDMA信令包与第二虚拟化节点建立RDMA连接,RDMA信令包的封装中包括RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部和物理网络IP协议头部,RDMA信令包的虚拟化协议头部中包括第一虚拟化节点的虚拟化标识,不同的虚拟化标识用于标识不同的虚拟网络。
传输模块602,用于在与第二虚拟化节点建立RDMA连接后,通过RDMA数据包向第二虚拟化节点发送数据,RDMA数据包的封装中包括RDMA协议头部和物理网络IP协议头部,RDMA数据包的物理网络IP协议头部中包括第一虚拟化节点的虚拟化标识。
在一种实现方式中,虚拟化标识为虚拟扩展局域网网络标识符VNI。
在一种实现方式中,虚拟网络IP协议头部为IPv4协议头部或IPv6协议头部,物理网络IP协议头部为IPv4协议头部或IPv6协议头部。
在一种实现方式中,物理网络IP协议头部为IPv6协议头部,RDMA数据包的物理网络IP协议头部中的虚拟化标识被编码在网络节点的物理网卡IPv6地址中。
在一种实现方式中,网络节点600包括发现模块,用于通过邻居发现ND协议报文,触发网络系统中的网关设备对网络节点的物理网卡IPv6地址进行解析以得到对应于网络节点的转发表项。
在一种实现方式中,RDMA数据包的物理网络IP协议头部中包括发送RDMA数据包的虚拟化节点和/或虚拟化节点所在的网络的流控信息。
在一种实现方式中,RDMA协议头部是基于虚拟化节点的RDMA网络标识生成的,虚拟化节点的RDMA网络标识基于虚拟化节点的虚拟化标识和虚拟化节点所在的网络节点的物理网卡IP地址生成。
本申请实施例的装置用于实现前述实施例中网络节点实现的方法,其实现原理和技术效果类似,此处不再赘述。
图7是本申请实施例提供的网络节点的示意性框图。如图7所示,该网络节点700可以包括至少一个处理器701,用于实现本申请实施例提供的通信方法。
可选地,该网络节点700还包括至少一个存储器702,用于存储程序指令和/或数据。存储器702和处理器701耦合。本申请实施例中的耦合是装置、单元或模块之间的间接耦合或通信连接,可以是电性,机械或其它的形式,用于装置、单元或模块之间的信息交互。处理器701可能和存储器702协同操作。处理器701可能执行存储器702中存储的程序指令。该至少一个存储器中的至少一个可以包括于处理器中。
可选地,该网络节点700还包括通信接口703,用于通过传输介质和其它设备进行通信,从而用于分布式系统节点700可以和其它设备进行通信。该通信接口703例如可以是收发器、接口、总线、电路或者能够实现收发功能的装置。处理器701可利用通信接口703收发数据和/或信息,并用于实现本申请实施例提供的方法。具体参见前文实施例中的详细描述,此处不做赘述。
本申请实施例中不限定上述处理器701、存储器702以及通信接口703之间的具体连接介质。本申请实施例在图7中以处理器701、存储器702以及通信接口703之间通过总线704连接。总线704在图7中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
应理解,本申请实施例中的处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(digitalsignal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
还应理解,本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本申请还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序(也可以称为代码,或指令)。当该计算机程序被运行时,使得计算机执行如前述任一实施例中的方法。
本说明书中使用的术语“单元”、“模块”等,可用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各种说明性逻辑块(illustrative logical block)和步骤(step),能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。在本申请所提供的几个实施例中,应该理解到,所揭露的装置、设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
该作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,各功能单元的功能可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令(程序)。在计算机上加载和执行该计算机程序指令(程序)时,全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字视频光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘(solidstate disk,SSD))等。
该功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种网络系统,其特征在于,包括:多个网络节点,每个网络节点上包括一个或多个虚拟化节点,所述虚拟化节点包括容器节点和/或虚拟机节点,虚拟化节点之间基于远程直接数据存取RDMA进行通信;其中,
两个虚拟化节点之间的RDMA信令包用于建立所述两个虚拟化节点之间的RDMA连接,所述RDMA信令包的封装中包括RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部和物理网络IP协议头部,所述RDMA信令包的虚拟化协议头部中包括发送所述RDMA信令包的虚拟化节点的虚拟化标识,不同的虚拟化标识用于标识不同的虚拟网络;
所述两个虚拟化节点之间的RDMA数据包用于在建立RDMA连接后进行数据传输,所述RDMA数据包的封装中包括RDMA协议头部和物理网络IP协议头部,所述RDMA数据包的物理网络IP协议头部中包括发送所述RDMA数据包的虚拟化节点的虚拟化标识。
2.根据权利要求1所述的网络系统,其特征在于,所述虚拟化标识为虚拟扩展局域网网络标识符VNI。
3.根据权利要求1所述的网络系统,其特征在于,所述虚拟网络IP协议头部为IPv4协议头部或IPv6协议头部,所述物理网络IP协议头部为IPv4协议头部或IPv6协议头部。
4.根据权利要求3所述的网络系统,其特征在于,所述物理网络IP协议头部为IPv6协议头部,所述RDMA数据包的物理网络IP协议头部中的虚拟化标识被编码在网络节点的物理网卡IPv6地址中。
5.根据权利要求4所述的网络系统,其特征在于,所述网络节点通过邻居发现ND协议报文,触发所述网络系统中的网关设备对所述网络节点的物理网卡IPv6地址进行解析以得到对应于所述网络节点的转发表项。
6.根据权利要求1所述的网络系统,其特征在于,所述RDMA数据包的物理网络IP协议头部中包括发送所述RDMA数据包的虚拟化节点和/或虚拟化节点所在的网络节点的流控信息。
7.根据权利要求1所述的网络系统,其特征在于,所述RDMA协议头部是基于所述虚拟化节点的RDMA网络标识生成的,所述虚拟化节点的RDMA网络标识基于所述虚拟化节点的虚拟化标识和所述虚拟化节点所在的网络节点的物理网卡IP地址生成。
8.一种通信方法,其特征在于,应用于网络系统中,所述网络系统包括多个网络节点,每个网络节点上包括一个或多个虚拟化节点,所述虚拟化节点包括虚拟化节点和/或虚拟机节点,两个虚拟化节点之间基于远程直接数据存取RDMA进行通信,所述方法包括:
两个虚拟化节点之间通过RDMA信令包建立RDMA连接,所述RDMA信令包的封装中包括RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部和物理网络IP协议头部,所述RDMA信令包的虚拟化协议头部中包括发送所述RDMA信令包的虚拟化节点的虚拟化标识,不同的虚拟化标识用于标识不同的虚拟网络;
所述两个虚拟化节点在建立RDMA连接后,通过RDMA数据包进行数据传输,所述RDMA数据包的封装中包括RDMA协议头部和物理网络IP协议头部,所述RDMA数据包的物理网络IP协议头部中包括发送所述RDMA数据包的虚拟化节点的虚拟化标识。
9.一种通信方法,其特征在于,应用于网络系统中的第一网络节点上的第一虚拟化节点,所述网络系统包括多个网络节点,每个网络节点上包括一个或多个虚拟化节点,所述虚拟化节点包括容器节点和/或虚拟机节点,两个虚拟化节点之间基于远程直接数据存取RDMA进行通信,所述方法包括:
通过RDMA信令包与第二虚拟化节点建立RDMA连接,所述RDMA信令包的封装中包括RDMA协议头部、虚拟网络IP协议头部、虚拟化协议头部和物理网络IP协议头部,所述RDMA信令包的虚拟化协议头部中包括所述第一虚拟化节点的虚拟化标识,不同的虚拟化标识用于标识不同的虚拟网络;
在与所述第二虚拟化节点建立RDMA连接后,通过RDMA数据包向所述第二虚拟化节点发送数据,所述RDMA数据包的封装中包括RDMA协议头部和物理网络IP协议头部,所述RDMA数据包的物理网络IP协议头部中包括所述第一虚拟化节点的虚拟化标识。
10.一种网络节点,其特征在于,包括:存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器中存储的计算机程序,所述计算机程序运行时使得所述处理器执行权利要求9所述的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序被处理器执行时,使得所述处理器执行如权利要求9所述的方法。
CN202310530889.3A 2023-05-11 2023-05-11 网络系统、通信方法、网络节点和存储介质 Pending CN116566763A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310530889.3A CN116566763A (zh) 2023-05-11 2023-05-11 网络系统、通信方法、网络节点和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310530889.3A CN116566763A (zh) 2023-05-11 2023-05-11 网络系统、通信方法、网络节点和存储介质

Publications (1)

Publication Number Publication Date
CN116566763A true CN116566763A (zh) 2023-08-08

Family

ID=87496023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310530889.3A Pending CN116566763A (zh) 2023-05-11 2023-05-11 网络系统、通信方法、网络节点和存储介质

Country Status (1)

Country Link
CN (1) CN116566763A (zh)

Similar Documents

Publication Publication Date Title
CN113411313B (zh) 数据传输方法、装置和系统
EP2477428B1 (en) Method for anonymous communication, method for registration, method and system for transmitting and receiving information
CN108111523B (zh) 数据传输方法和装置
CN110417840B (zh) 一种信息处理方法及装置
US10187296B2 (en) Access node device for forwarding data packets
US8724630B2 (en) Method and system for implementing network intercommunication
CN108848025B (zh) 数据处理方法、智能网关、物联网系统
CN111786867B (zh) 一种数据传输方法及服务器
CN109196842B (zh) 一种会话保持方法、设备及存储介质
CN104993993B (zh) 一种报文处理方法、设备和系统
CN111786869B (zh) 一种服务器之间的数据传输方法及服务器
CN109936492A (zh) 一种通过隧道传输报文的方法、装置和系统
CN113364660B (zh) Lvs负载均衡中的数据包处理方法及装置
CN110086839B (zh) 一种远端设备的动态接入方法及装置
CN111788812B (zh) 用于分组数据转换的技术
CN107733765B (zh) 映射方法、系统和相关设备
CN108093041A (zh) 单通道vdi代理服务系统及实现方法
CN108064441B (zh) 一种加速网络传输优化方法以及系统
CN111786870B (zh) 数据传输方法及strongswan服务器
CN116488958A (zh) 网关处理方法、虚拟接入网关、虚拟业务网关及相关设备
CN113596192B (zh) 一种基于网闸组网的通信方法、装置、设备及介质
CN116566763A (zh) 网络系统、通信方法、网络节点和存储介质
EP3364624A1 (en) A method of distributing a sub-flow associated with a session and a network apparatus
CN113067910A (zh) 一种nat穿越方法、装置、电子设备和存储介质
CN113839909B (zh) 数据报文处理的方法、装置和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination