CN115314437B - 容器虚拟网络通信方法和容器虚拟网络 - Google Patents

容器虚拟网络通信方法和容器虚拟网络 Download PDF

Info

Publication number
CN115314437B
CN115314437B CN202210681562.1A CN202210681562A CN115314437B CN 115314437 B CN115314437 B CN 115314437B CN 202210681562 A CN202210681562 A CN 202210681562A CN 115314437 B CN115314437 B CN 115314437B
Authority
CN
China
Prior art keywords
virtual network
network addressing
container
information
physical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210681562.1A
Other languages
English (en)
Other versions
CN115314437A (zh
Inventor
秦超
陈菲
庞立祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202210681562.1A priority Critical patent/CN115314437B/zh
Publication of CN115314437A publication Critical patent/CN115314437A/zh
Application granted granted Critical
Publication of CN115314437B publication Critical patent/CN115314437B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/64Routing or path finding of packets in data switching networks using an overlay routing layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/58Association of routers
    • H04L45/586Association of routers of virtual routers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing
    • H04L45/741Routing in networks with a plurality of addressing schemes, e.g. with both IPv4 and IPv6

Abstract

公开了一种容器虚拟网络通信方法和容器虚拟网络。所述方法包括:发送端将虚拟网络寻址信息嵌入物理网络寻址字段的空闲位,得到物理网络寻址格式的报文并发送所述报文;接收端基于所述物理网络寻址字段中物理网络寻址信息接收所述报文,从所述空闲位中取出所述虚拟网络寻址信息,并将所述报文信息送入与所述虚拟网络寻址信息相对应的容器。本发明的容器间通信方案利用IPv6地址编程能力,在发送端将上层虚拟网络的寻址信息嵌入底层物理网络地址中携带,并在接收端恢复成所需的虚拟网络寻址格式用于虚拟网络寻址,由此通过underlay的传输开销实现容器间的overlay通信,将underlay和overlay网络的优点合一,在实际提供虚拟网络层通信能力的同时避免封装带来的通信性能损耗。

Description

容器虚拟网络通信方法和容器虚拟网络
技术领域
本公开涉及网络技术,尤其涉及一种容器虚拟网络通信方法和容器虚拟网络。
背景技术
随着数据中心的服务器虚拟化程度快速提高,其敏捷性和灵活性也得以显著提高。网络虚拟化和从物理网络分离出虚拟网络使得管理、自动化和编排变得更简单。服务器虚拟化后,一台物理服务器中可以承载多个容器,每个容器可以具有独立的IP地址和MAC地址,相当于接入数据中心的服务器成倍扩大了。
容器是将操作系统层虚拟化后得到的通常用于表示软件的一个标准化单元。目前用于容器间通信的容器网络方案分为underlay(底层)模式和overlay(覆盖)模式两大类。underlay模式下容器间流量通过IaaS层网络转发,网络性能优秀但网络资源供给依赖基础网络,会面临资源供给弹性和兼容性不足等问题。overlay模式则通过overlay网络技术构建,容器网络与IaaS层网络资源解耦,带来弹性优势和良好适用性,但overlay传输封装的包头开销巨大,影响网络性能。
为此,需要一种改善的容器间通信方案。
发明内容
本公开要解决的一个技术问题是提供一种容器虚拟网络通信方法,以及利用该方法进行通信的容器虚拟网络。本发明的容器间通信方案利用IPv6地址编程能力,在发送端将上层虚拟网络的寻址信息嵌入底层物理网络地址中携带,并在接收端恢复成所需的虚拟网络寻址格式用于虚拟网络寻址,由此实现容器间的overlay通信,并将underlay和overlay网络的优点合一,在实际提供虚拟网络层通信能力的同时避免封装带来的通信性能损耗。
根据本公开的第一个方面,提供了一种容器虚拟网络通信方法,包括:发送端将虚拟网络寻址信息嵌入物理网络寻址字段的空闲位,得到物理网络寻址格式的报文并发送所述报文;接收端基于所述物理网络寻址字段中物理网络寻址信息接收所述报文,从所述空闲位中取出所述虚拟网络寻址信息,并将所述报文信息送入与所述虚拟网络寻址信息相对应的容器。
可选地,发送端将虚拟网络寻址信息嵌入物理网络寻址字段的空闲位包括:发送端容器将虚拟网络寻址字段提供给发送端节点;所述发送端节点基于所述虚拟网络寻址字段获取所述虚拟网络寻址信息,并将所述虚拟网络寻址信息嵌入物理网络寻址字段的空闲位。
可选地,所述方法还包括:所述发送端节点基于映射表,将所述虚拟网络寻址字段中的容器前缀地址转化为节点地址,并作为所述物理网络寻址字段中物理网络寻址信息。
可选地所述物理网络寻址格式是基于IPv6的格式,并且在所述虚拟网络基于IPv6格式寻址时,所述发送端节点将所述虚拟网络寻址字段中的容器ID作为所述虚拟网络寻址信息嵌入物理网络寻址字段的所述空闲位;以及在所述虚拟网络基于IPv4格式寻址时,所述发送端节点将所述虚拟网络寻址字段作为所述虚拟网络寻址信息嵌入物理网络寻址字段的所述空闲位。
可选地,接收端基于所述物理网络寻址字段中物理网络寻址信息接收所述报文,从所述空闲位中取出所述虚拟网络寻址信息,并将所述报文信息送入与所述虚拟网络寻址信息相对应的容器包括:在所述虚拟网络基于IPv6格式寻址时,接收端节点基于映射表将所述物理网络寻址字段中物理网络寻址信息从节点地址转换为容器前缀地址,将从所述空闲位中取出所述虚拟网络寻址信息作为容器ID,以复原包括所述容器前缀地址和所述容器ID的所述虚拟网络寻址字段用于接收端节点的寻址。
可选地,接收端基于所述物理网络寻址字段中物理网络寻址信息接收所述报文,从所述空闲位中取出所述虚拟网络寻址信息,并将所述报文信息送入与所述虚拟网络寻址信息相对应的容器包括:在所述虚拟网络基于IPv4格式寻址时,接收端节点将从所述空闲位中取出所述虚拟网络寻址信息作为所述虚拟网络寻址字段用于接收端节点的寻址。
可选地,所述方法还包括:在所述虚拟网络寻址字段的目的地地址对应于任播(anycast)地址空间时,所述发送端节点从所述任播地址空间中选定一个成员(member),并将所述成员的地址作为在所述虚拟网络寻址字段的新目的地地址。
可选地,所述方法还包括:所述发送端在所述物理网络寻址字段的第二空闲位插入所述虚拟网络寻址格式的指示;以及所述接收端基于所述指示还原出符合所述虚拟网络寻址格式的虚拟网络寻址字段。
根据本公开的第二个方面,提供了一种容器虚拟网络,包括:发送端容器,用于生成虚拟网络寻址字段;发送端节点,用于将虚拟网络寻址字段中的的虚拟网络寻址信息嵌入物理网络寻址字段的空闲位,得到物理网络寻址格式的报文并向底层转发网络发送所述报文;所述底层转发网络,用于转发所述报文;接收端容器,用于基于所述物理网络寻址字段中物理网络寻址信息从所述底层转发网络接收所述报文,从所述空闲位中取出所述虚拟网络寻址信息,并将所述报文信息送入与所述虚拟网络寻址信息相对应的接收端容器;以及所述接收端容器,用于接收所述报文信息。
根据本公开的第三个方面,提供了一种计算设备,包括:处理器;以及存储器,其上存储有可执行代码,当可执行代码被处理器执行时,使处理器执行如上述第一方面所述的方法。
根据本公开的第四个方面,提供了一种非暂时性机器可读存储介质,其上存储有可执行代码,当可执行代码被电子设备的处理器执行时,使处理器执行如上述第一方面所述的方法。
由此,本发明的容器间通信方案利用IPv6地址编程能力,在发送端将上层虚拟网络的寻址信息嵌入底层物理网络地址中携带,并在接收端恢复成所需的虚拟网络寻址格式用于虚拟网络寻址,由此将underlay和overlay网络的优点合一,在实际提供虚拟网络层通信能力的同时避免封装带来的通信性能损耗。
附图说明
通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
图1示出了根据本发明一个实施例的容器虚拟网络通信方法。
图2示出了现有技术中使用的容器地址组成例。
图3A和图3B分别示出了虚拟网络基于IPv6和IPv4格式寻址时的嵌入方法。
图4A和图4B分别示出了IPv6和IPv4格式下的地址变换例。
图5A和图5B示出了根据本发明进行嵌入虚拟网络地址信息的物理网络地址发送和接收的例子。
图6示出了根据本发明一个实施例的容器虚拟网络的组成示意图。
图7示出了根据本发明一实施例可用于实现上述容器间通信方法的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
目前用于容器间通信的容器网络方案分为underlay(底层)模式和overlay(覆盖)模式两大类。
underlay模式依托underlay网络。underlay网络是物理网络,是由现实的物理基础层网络设备组成的网络,也是数据中心基础转发架构的网络。以太网最初设计成一个分布式的网络架构,没有中心控制节点,网络中的节点通过协议传递学习网络的可达性信息。underlay是数据中心场景的基础物理设施,保证任何两个点路由可达,其中包含了传统的网络技术。
overlay模式依托overlay网络。顾名思义,overlay是一个基于物理网络之上构建的网络,是一个虚拟网络(同时也是一个逻辑网络)。overlay在网络技术领域指的是一种网络架构上叠加的虚拟化技术模式,overlay网络也建立在Underlay网络之上的虚拟网络,overlay网络节点通过虚拟或者逻辑链路进行通信。
underlay网络和overlay网络通常用于云服务的不同层面。云服务通常可以分成三大类:IaaS(基础设施即服务,Infrastructure-as-a-service)、PaaS(平台即服务,Platform-as-a-service)以及SaaS(软件即服务,Software-as-a-service)。
IaaS是云服务的最下层(即,底层),指把IT基础设施作为一种服务通过网络对外提供,并根据用户对资源的实际使用量或占用量进行计费的一种服务模式。PaaS层把服务器平台作为一种服务提供的商业模式,通过网络进行程序提供的服务称之为SaaS,而云计算时代相应的服务器平台或者开发环境作为服务进行提供就成为了PaaS。
容器网络是提供容器间互通的PaaS层网络,分为overlay和underlay模式。underlay模式下,容器间流量通过IaaS层网络转发,网络性能优秀但网络资源供给(如,IPv4地址资源)依赖基础网络,会面临资源供给弹性和兼容性不足等问题。overlay模式则通过overlay网络技术在IaaS层网络之上构建,容器网络与IaaS层网络资源解耦,在PaaS层进行虚拟网络通信,能够来弹性优势和良好适用性,但overlay传输封装的包头开销巨大,影响网络性能。
overlay和underlay网络之前都通过IPv4(网际协议第4版)进行通信。随着IaaS层IPv4地址资源不足和安全需求等原因,越来越多的国家和企业开始从IPv4向IPv6模式过渡。IPv6(网际协议第6版)是网际协议的最新版本,用作互联网的协议。用它来取代IPv4主要是为了解决IPv4地址枯竭问题,同时它也在其他方面对于IPv4有许多改进。具体地,IPv6地址空间从IPv4的32位扩展到128位,在提供大量可用IPv6地址的同时,也带来了地址可编程能力技术。本发明的容器间通信方案利用IPv6地址编程能力,将虚拟网络IPv4/v6编址信息在IaaS层IPv6地址中进行携带,由此overlay与underlay网络的优点合一,在提供PaaS层虚拟网络的同时避免封装带来的性能损耗。
图1示出了根据本发明一个实施例的容器虚拟网络通信方法。
在步骤S110,发送端将虚拟网络寻址信息嵌入物理网络寻址字段的空闲位,得到物理网络寻址格式的报文并发送所述报文。在此,虚拟网络尤其指代overlay网络,物理网络尤其指代underlay网络;虚拟网络寻址信息尤其指代overlay网络寻址信息,例如,基于overlay技术的容器IP信息。而物理网络寻址信息则尤其可以指代underlay网络寻址信息,例如,基于underlay技术的物理节点IP信息。
相应地,在步骤S120,接收端基于所述物理网络寻址字段中物理网络寻址信息接收所述报文,从所述空闲位中取出所述虚拟网络寻址信息,并将所述报文信息送入与所述虚拟网络寻址信息相对应的容器。
由上,通过发送端在物理网络寻址字段的物理网络寻址信息之外的空闲位中嵌入虚拟网络寻址信息,可以直接通过物理网络进行传输,即,在发送端和接收端之间的容器网络上传输的报文仅仅包括用于IaaS层解析的物理网络寻址字段,而无需包括在PaaS层解析的额外封装的包头,由此降低了网络传输的开销。而传输的物理网络寻址字段在接收端IaaS层解析后,可以基于约定格式,从原本的物理网络空闲字段中解析出虚拟网络寻址信息,由此可以在接收端的IaaS层(对应于如下所述的接收端的物理节点层)还原出最初的虚拟网络寻址字段,由此寻址至目的地容器。
换句话说,本发明以物理网络寻址的传输开销,事实上实现了容器间基于虚拟网络寻址的overlay网络通信,即,实现了容器虚拟网络通信。
在本发明中,由于需要在所述报文的物理网络寻址字段的空闲位进行信息嵌入,因此所述物理网络寻址格式是基于IPv6的格式(因为相比于IPv4,IPv6具有128位的地址空间),容间间通信的网络是基于IPv6的网络,尤其可以是SRv6(基于IPv6转发平面的段路由)网络。SRv6结合SR(Segment Routing,段路由)和IPv6技术,是新一代IP承载协议,其采用现有的IPv6转发技术,通过灵活的IPv6扩展头,实现网络可编程。
由于物理网络寻址的目标是物理节点,而非节点上实现的一个个容器,因此发送端嵌入虚拟网络寻址信息的报文的生成,需要发送端的容器(即,源容器)和以及该容器所在节点(即,发送端节点)两者的参与。为此,发送端将虚拟网络寻址信息嵌入物理网络寻址字段的空闲位包括:发送端容器将虚拟网络寻址字段提供给发送端节点;所述发送端节点基于所述虚拟网络寻址字段获取所述虚拟网络寻址信息,并将所述虚拟网络寻址信息嵌入物理网络寻址字段的空闲位。
虽然发送端节点可以基于自身的节点ID来对所述物理网络寻址字段中源地址的物理网络寻址信息进行填充,但发送端节点通常并不知晓虚拟网络寻址字段中目的地地址的容器前缀对应于哪个物理节点。因此,为了正确生成物理网络寻址字段中目的地地址的物理网络寻址信息,发送端节点需要基于映射表,将所述虚拟网络寻址字段中的容器前缀地址(尤其是目的地容器的容器前缀地址)转化为节点地址,并作为所述物理网络寻址字段中物理网络寻址信息。其中,映射表由容器系统经控制面分发各个节点,并且包括节点ID和容器前缀的映射关系。
如前所示,实施本发明的报文转发网络需要基于IPv6格式,但本发明的容器间通信方法通过巧妙设计,可以兼容IPv4和IPv6两种格式的虚拟网络寻址。
在所述虚拟网络基于IPv6格式寻址时,所述发送端节点将所述虚拟网络寻址字段中的容器ID作为所述虚拟网络寻址信息嵌入物理网络寻址字段的所述空闲位。而在所述虚拟网络基于IPv4格式寻址时,所述发送端节点将所述虚拟网络寻址字段作为所述虚拟网络寻址信息嵌入物理网络寻址字段的所述空闲位。
如图将结合图2~图4B,描述本发明的发送端如何将虚拟网络寻址信息嵌入物理网络寻址字段。
图2示出了现有技术中使用的容器地址组成例。
图2上部示出了在物理网络中,例如,用于IaaS层网络中物理服务器(后续简称“节点”或“Node”)的节点IP格式(基于IPv6)。节点地址在利用underlay技术传输时,仅仅需要64位或小于64位的数据来表示节点ID(即,NodeID),后续64位为空闲位。
图2中部示出了在虚拟网络中,容器IP基于IPv6的组成格式。在这128位的地址空间中,前64位是由Cluster ID(簇ID,也可称服务ID)和NodeID(节点ID)组成的容器前缀(例如,PodPrefix)。该前缀是从容器网络集群IPv6地址大段中,位每一个节点分配的一个前缀(默认64位),作为该节点(如上所述,对应于物理服务器)上各个容器(例如,Pod)的地址池;后64位则对应于包括空闲位和32位容器ID(例如,容器集群范围内全局唯一的PodID)的接口ID。
图2下部则示出了在虚拟网络中,容器IP基于IPv4的组成格式。在这32位的地址空间中,前m位是由Cluster ID(簇ID,也可称服务ID)和NodeID(节点ID)组成的网络位。该网络位是从容器网络集群IPv4地址大段中,位每一个节点分配的一个前缀(默认26位),作为该节点(如上所述,对应于物理服务器)上各个容器(例如,Pod)的地址池;后n位则对应于用于标识容器ID(例如,PodID)的主机位。
本发明的通信方法优选可以基于如Kubernetes(K8s)进行容器资源部署和管理。容器荚(Pod)是K8s中能够创建和部署的最小单元,是K8s集群中的一个应用实例,总是部署在同一个物理节点上。容器荚(Pod)中包含一个或多个容器,还包括了存储、网络等各容器共享的资源。容器荚(Pod)可以支持多种容器环境,例如当前流行的容器环境Docker等。在此,节点(例如,发送端节点和接收端节点)可以是部署有Pod的物理节点,Pod则对应于可经由本发明的通信方案进行寻址的容器。
在需要使用图2上部所示的128位节点IP地址空间来复用容器IP地址时,需要根据容器IP是基于IPv4还是IPv6来选择不同的嵌入方法。图3A和图3B分别示出了虚拟网络基于IPv6和IPv4格式寻址时的嵌入方法。
如图3A所示,当容器的虚拟网络寻址字段(即,容器IP)也包括128位时,需要进行前64位从容器前缀到节点前缀的转换,并将后32位的容器ID嵌入节点IP的后32位。在图示的实施例中,剩余的32位可用作指示位,用于指示当前的嵌入时基于IPv6的映射还是经由IPv4的映射。应该理解的是,在其他实施例中,也可以在节点IP之外的其他位置进行如上的指示。
如图3B所示,当容器的虚拟网络寻址字段(即,容器IP)包括32位时,需要进行前m位从容器前缀到节点前缀的转换,并且可以将32位的容器IP直接嵌入节点IP的后32位。同样地,剩余的32位可用作指示位,用于指示当前的嵌入时基于IPv6的映射还是经由IPv4的映射。
进一步地,为了方便理解,图4A和图4B分别示出了IPv6和IPv4格式下的地址变换例。
如图4A所示,源容器(图示Node中加粗的Pod)对应的128位容器IP地址为2001:db8:0:100::1234:0,需要将数据(对应于上部虚线框的负载)发送给目的地容器,目的地容器对应的128位的IP地址为2001:db8:0:200::abcd:0。为了在物理层进行传播,需要对如上虚拟网络格式的容器IP地址进行改写。将源容器的Pod前缀对应于本机物理节点的地址,将目的地容器的Pod前缀对应于目的地容器所在物理节点的地址。源地址的改写无需查找映射表,可直接基于本机物理地址和Pod前缀获取。但目的地地址的改写则需查找映射表。由此,可以将2001:db8:0:100改写为fc00:cafe:1:a作为物理网络传输Packet(分组)的源地址,PodID则原位嵌入,用于后续接收端节点的处理。类似地,可以将2001:db8:0:200改写为fc00:beef:1:b作为物理网络传输Packet(分组)的目的地地址,PodID则原位嵌入,用于后续接收端节点的处理。另外,还可以在对应的32位的空闲位(第二空闲位)中添加指示符8001,以指示发送的节点IP地址中嵌入的是IPv6格式的虚拟网络地址信息。
如图4B所示,源容器(图示Node中加粗的Pod)对应的32位容器IP地址为192.168.10.10,需要将数据(对应于上部虚线框的负载)发送给目的地容器,目的地容器对应的32位的IP地址为192.168.20.20。为了在物理层进行传播,需要对如上虚拟网络格式的容器IP地址进行改写。将源容器的Pod前缀对应于本机物理节点的地址,将目的地容器的Pod前缀对应于目的地容器所在物理节点的地址。源地址的改写无需查找映射表,可直接基于本机物理地址和Pod前缀获取。但目的地地址的改写则需查找映射表。由此,可以将192.168.10.0改写为fc00:cafe:1:a作为物理网络传输Packet(分组)的源地址,32位源容器IP地址为192.168.10.10整体作为Pod ID嵌入到源地址最后,用于后续接收端节点的处理。类似地,可以将192.168.20.0改写为fc00:beef:1:b作为物理网络传输Packet(分组)的目的地地址,32位目的地容器IP地址为192.168.20.20整体作为Pod ID嵌入到源地址最后,用于后续接收端节点的处理。另外,还可以在对应的32位的空闲位(第二空闲位)中添加指示符8002,以指示发送的节点IP地址中嵌入的是IPv4格式的虚拟网络地址信息。
与发送端类似,接收端也包括接收端物理节点(即,接收端节点)以及位于物理节点上的接收端容器,例如,目的地Pod。接收端节点基于所述物理网络寻址字段中物理网络寻址信息接收所述报文,从对应的所述空闲位中取出所述虚拟网络寻址信息,并将所述报文信息送入与所述虚拟网络寻址信息相对应的容器。具体地,在所述虚拟网络基于IPv6格式寻址时,接收端节点基于映射表将所述物理网络寻址字段中物理网络寻址信息从节点地址转换为容器前缀地址,将从所述空闲位中取出所述虚拟网络寻址信息作为容器ID,以复原包括所述容器前缀地址和所述容器ID的所述虚拟网络寻址字段用于接收端节点的寻址。而在所述虚拟网络基于IPv4格式寻址时,接收端节点将从所述空闲位中取出所述虚拟网络寻址信息作为所述虚拟网络寻址字段用于接收端节点的寻址。
由此,基于发送端节点和接收端节点的配合,实现了在发送端节点,由虚拟网络寻址字段到物理网络寻址字段的转换(但物理网络寻址字段中包含了虚拟网络寻址的信息),发送端节点到接收端节点的物理网络寻址,以及在接收端节点,由物理网络寻址字段到虚拟网络寻址字段的逆转换。这样,就能够以物理网络寻址字段的网络传输开销(即,不需要额外包括虚拟网络寻址字段的封装包头)实际上实现从发送端容器到接收端容器的容器间虚拟网络传输(即,虚拟网络寻址字段实际上从发送端容器传递到了接收端容器),实现了容器虚拟网络的通信。
如上基于图2~图4B给出的例子中,容器IP都对应于容器地址空间。容器地址空间为容器在不部署时所归属的overlay网络地址空间(后续可简称为PodCIDR);该地址空间设计为每个节点分配独立的IPv6/IPv4地址段,作为各节点本地Pod地址池,容器所获取的容纳IP(Pod IP)不可跨节点迁移。
在其他实施例中,还可以实现目的地地址指向Anycast(任播)地址空间的容器间传播。在任播地址空间,容器网络集群全局范围内,保留IPv6/IPv4地址段,作为容器服务地址(ClusterIP),当多个容器提供相同服务时,可以通过该服务地址对外提供服务;服务地址一旦创建,将在容器网络所有节点部署。因此,在本发明中,在所述虚拟网络寻址字段的目的地地址对应于任播(anycast)地址空间时,所述发送端节点从所述任播地址空间中选定一个成员(member),并将所述成员的地址作为在所述虚拟网络寻址字段的新目的地地址。
如下将结合图5A和图5B对基于本发明的容器通信的收发过程进行说明。图5A和图5B示出了根据本发明进行嵌入虚拟网络地址信息的物理网络地址发送和接收的例子。为了简明,图5A示出了基于IPv6的容器地址空间寻址的例子。图5B示出了基于IPv4的任播地址空间寻址的例子。
如图5A所示,容器系统的控制面(例如,K8s的控制面)维护Node Prefix和PodPrefix之间的映射表,并将其存储在控制面的etcd模块中。控制面还可以包括API服务器和控制服务器等模块。具体地,可以经由API服务器向所在容器网络的所有节点推送(push)映射表。映射表中包括Node Prefix和Pod Prefix之间的映射关系,并且可以包括本地项目,例如Pods列表。在使用SRv6进行分组传播时,发送端节点可以结合SID表,基于映射表完成如上结合图4A所示的地址转换。转换后的分组经由SRv6网络进行传播。接收端节点由于同样分发有映射表,因此IP为fc00:beef:1:b的节点可以接收上述分组,基于指示符8001的指示,基于IPv6的规则重构容器IP。具体地,可以将节点前缀转换回容器前缀,即,将源节点前缀fc00:cafe:1:a转换为源容器前缀2001:db8:0:100,将目的地节点前缀fc00:beef:1:b转换为源容器前缀2001:db8:0:200,并将物理网络地址中后32位的PodID放回到容器IP最后,由此得到与发送端容器给出的容器IP相同的容器IP,用于接收端节点上目的地容器的寻址。
应该注意到,可以为物理网络发送的报文额外添加路由类型(RoutingType)和分段对齐(Segmentleft=0)的指示,以便将分组以符合SRv6的方式传送。
如图5B所示,覆盖网络通信是基于IPv4的通信,并且源容器寻址的是任播地址空间。如图所示,源容器IP是确定且唯一的IP192.168.10.10,但目的地IP指代的并非是如图4B所示的目的地容器,而是包括多个成员的任播地址。由于Anycast地址为服务地址,后端关联实际提供服务的一组容器;所以可以创建服务表(Service Table)集中维护ClusterIP(簇IP,也称服务IP)、Member(成员)和Node prefix(节点前缀)之间的关系。服务表同样可以存储在控制面的etcd中并由API服务器发送到各个节点。
于是,发送端节点可以准确查找服务表,基于预定算法(例如,通过图示的首包hash、装载表项)从ClusterIP对应的多个member中选择一个对应member的容器IP,同时找到对应Node Prefix IP;将对应Node Prefix IP作为目的地节点IP,将容器IP作为PodID来得到物理网络IP,以实现容器网络编址信息在IaaS层基础网络中传递。如图所示,源容器发出的目的地IP指向一个ClusterIP 198.51.100.100,通过查找服务表发现198.51.100.100包括多个member,如图中示出的192.168.20.20和192.168.30.30。经过计算,确定其中的一个member 192.168.20.20作为目的地容器,此时,可以将该member对应的节点前缀fc00:beef:1:b作为目的地节点的节点前缀并将member地址嵌入到物理网络地址最后,以得到fc00:beef:1:b:8002::192.168.20.20作为发送端节点出构造的物理网络寻址字段中的内容。相应地,接收端同样维护映射表,因此如图所示,地址为192.168.30.30的membe由于未被选中而无法接收报文,而地址为192.168.20.20的member所在节点基于fc00:beef:1:b接收到报文,并将接收到的报文寻址信息转换成SA 192.168.10.10,DA 192.168.20.20提供给对应容器。
由此,本发明实现了在IaaS层基础网络为IPv6编址场景中,对Overlay模式转发性能的优化,避免了额外新增封装带来的性能影响;
本发明还可以实现为一种容器虚拟网络。该容器虚拟网络能够执行如上所述的本发明的容器间通信方法。图6示出了根据本发明一个实施例的容器虚拟网络的组成示意图。该网络包括发送端节点611、底层转发网络620和接收端节点631。发送端的物理节点611上实现有多个容器,包括源容器612和其他容器613,类似地,接收端节点631上也可以实现有多个容器,其中包括目的地容器632和其他容器633。在一个实施例中,该容器网络(虚拟网络)实际上包括源容器612、发送端节点611、底层转发网络620、接收端节点631和目的地容器632。
发送端容器生成虚拟网络寻址字段。发送端节点611用于从源容器612生成的虚拟网络寻址字段中获取虚拟网络寻址信息,并将其嵌入物理网络寻址字段的空闲位,得到物理网络寻址格式的报文并向底层转发网络发送所述报文。底层转发网络620优选为SRv6网络,用于转发所述报文。接收端节点631用于基于所述物理网络寻址字段中物理网络寻址信息从所述底层转发网络接收所述报文,从所述空闲位中取出所述虚拟网络寻址信息,并将所述报文信息送入与所述虚拟网络寻址信息相对应的目的地容器632。在一个优选实施例中,接收端节点631可以从接收到的物理网络寻址字段中复原出源容器612提供的虚拟网络寻址字段,并将其提供给目的地容器632。由此,以物理网络寻址字段的通信开销实现了虚拟网络寻址字段从源容器612到目的地容器632的实际传输,实现了容器间的虚拟网络通信。
应该理解的是,容器网络600中可以包括多个节点,每个节点可以包括多个容器。当某一个节点上的某一个容器向另一个节点上的另一个容器发送消息时,就可以作为本发明的发送端来进行虚拟地址到物理地址的转换,被寻址的节点所在容器则可以执行物理地址到虚拟地址的逆转换,由此通过将overlay网络编址信息嵌入IPv6编址中转发,避免了额外新增overlay封装带来的性能影响;
图7示出了根据本发明一实施例可用于实现上述容器间通信方法的计算设备的结构示意图。
参见图7,计算设备700包括存储器710和处理器720。
处理器720可以是一个多核的处理器,也可以包含多个处理器。在一些实施例中,处理器720可以包含一个通用的主处理器以及一个或多个特殊的协处理器,例如图形处理器(GPU)、数字信号处理器(DSP)等等。在一些实施例中,处理器720可以使用定制的电路实现,例如特定用途集成电路(ASIC,Application Specific Integrated Circuit)或者现场可编程逻辑门阵列(FPGA,Field Programmable Gate Arrays)。
存储器710可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM),和永久存储装置。其中,ROM可以存储处理器720或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器710可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器710可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器710上存储有可执行代码,当可执行代码被处理器720处理时,可以使处理器720执行上文述及的容器间通信方法。
上文中已经参考附图详细描述了根据本发明的容器间通信方法和容器系统。本发明的容器间通信方案利用IPv6地址编程能力,在发送端将上层虚拟网络的寻址信息嵌入底层物理网络地址中携带,并在接收端恢复成所需的虚拟网络寻址格式用于虚拟网络寻址,由此将Underlay和Overlay网络的优点合一,在实际提供虚拟网络层通信能力的同时避免封装带来的通信性能损耗。
此外,根据本发明的方法还可以实现为一种计机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本发明的上述方法中限定的上述各步骤的计算机程序代码指令。
或者,本发明还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质),其上存储有可执行代码(或计算机程序、或计算机指令代码),当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或计算设备、服务器等)的处理器执行时,使所述处理器执行根据本发明的上述方法的各个步骤。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。
附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (9)

1.一种容器虚拟网络通信方法,包括:
发送端将虚拟网络寻址信息嵌入物理网络寻址字段的空闲位,得到物理网络寻址格式的报文并发送所述报文;
接收端基于所述物理网络寻址字段中物理网络寻址信息接收所述报文,从所述空闲位中取出所述虚拟网络寻址信息,并将所述报文信息送入与所述虚拟网络寻址信息相对应的容器,
其中,发送端将虚拟网络寻址信息嵌入物理网络寻址字段的空闲位包括:
发送端容器将虚拟网络寻址字段提供给发送端节点;
所述发送端节点基于所述虚拟网络寻址字段获取所述虚拟网络寻址信息,并将所述虚拟网络寻址信息嵌入物理网络寻址字段的空闲位,
其中,所述物理网络寻址格式是基于IPv6的格式,并且
在所述虚拟网络基于IPv6格式寻址时,所述发送端节点将所述虚拟网络寻址字段中的容器ID作为所述虚拟网络寻址信息嵌入物理网络寻址字段的所述空闲位;以及
在所述虚拟网络基于IPv4格式寻址时,所述发送端节点将所述虚拟网络寻址字段作为所述虚拟网络寻址信息嵌入物理网络寻址字段的所述空闲位。
2.如权利要求1所述的方法,还包括:
所述发送端节点基于映射表,将所述虚拟网络寻址字段中的容器前缀地址转化为节点地址,并作为所述物理网络寻址字段中物理网络寻址信息。
3.如权利要求1所述的方法,其中,接收端基于所述物理网络寻址字段中物理网络寻址信息接收所述报文,从所述空闲位中取出所述虚拟网络寻址信息,并将所述报文信息送入与所述虚拟网络寻址信息相对应的容器包括:
在所述虚拟网络基于IPv6格式寻址时,接收端节点基于映射表将所述物理网络寻址字段中物理网络寻址信息从节点地址转换为容器前缀地址,将从所述空闲位中取出所述虚拟网络寻址信息作为容器ID,以复原包括所述容器前缀地址和所述容器ID的所述虚拟网络寻址字段用于接收端节点的寻址。
4.如权利要求1所述的方法,其中,接收端基于所述物理网络寻址字段中物理网络寻址信息接收所述报文,从所述空闲位中取出所述虚拟网络寻址信息,并将所述报文信息送入与所述虚拟网络寻址信息相对应的容器包括:
在所述虚拟网络基于IPv4格式寻址时,接收端节点将从所述空闲位中取出所述虚拟网络寻址信息作为所述虚拟网络寻址字段用于接收端节点的寻址。
5.如权利要求1所述的方法,还包括:
在所述虚拟网络寻址字段的目的地地址对应于任播地址空间时,所述发送端节点从所述任播地址空间中选定一个成员,并将所述成员的地址作为在所述虚拟网络寻址字段的新目的地地址。
6.如权利要求1所述的方法,还包括:
所述发送端在所述物理网络寻址字段的第二空闲位插入所述虚拟网络寻址格式的指示;以及
所述接收端基于所述指示还原出符合所述虚拟网络寻址格式的虚拟网络寻址字段。
7.一种容器虚拟网络,包括:
发送端容器,用于生成虚拟网络寻址字段;
发送端节点,用于将虚拟网络寻址字段中的虚拟网络寻址信息嵌入物理网络寻址字段的空闲位,得到物理网络寻址格式的报文并向底层转发网络发送所述报文;
所述底层转发网络,用于转发所述报文;
接收端容器,用于基于所述物理网络寻址字段中物理网络寻址信息从所述底层转发网络接收所述报文,从所述空闲位中取出所述虚拟网络寻址信息,并将所述报文信息送入与所述虚拟网络寻址信息相对应的接收端容器;以及
所述接收端容器,用于接收所述报文信息,
其中,所述物理网络寻址格式是基于IPv6的格式,并且
在所述虚拟网络基于IPv6格式寻址时,所述发送端节点将所述虚拟网络寻址字段中的容器ID作为所述虚拟网络寻址信息嵌入物理网络寻址字段的所述空闲位;以及
在所述虚拟网络基于IPv4格式寻址时,所述发送端节点将所述虚拟网络寻址字段作为所述虚拟网络寻址信息嵌入物理网络寻址字段的所述空闲位。
8.一种计算设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1至6中任何一项所述的方法。
9.一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1至6中任何一项所述的方法。
CN202210681562.1A 2022-06-16 2022-06-16 容器虚拟网络通信方法和容器虚拟网络 Active CN115314437B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210681562.1A CN115314437B (zh) 2022-06-16 2022-06-16 容器虚拟网络通信方法和容器虚拟网络

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210681562.1A CN115314437B (zh) 2022-06-16 2022-06-16 容器虚拟网络通信方法和容器虚拟网络

Publications (2)

Publication Number Publication Date
CN115314437A CN115314437A (zh) 2022-11-08
CN115314437B true CN115314437B (zh) 2024-03-01

Family

ID=83855259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210681562.1A Active CN115314437B (zh) 2022-06-16 2022-06-16 容器虚拟网络通信方法和容器虚拟网络

Country Status (1)

Country Link
CN (1) CN115314437B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102047245A (zh) * 2008-03-31 2011-05-04 亚马逊技术有限公司 配置计算机节点之间的通信
US9282027B1 (en) * 2010-03-31 2016-03-08 Amazon Technologies, Inc. Managing use of alternative intermediate destination computing nodes for provided computer networks
CN105900407A (zh) * 2014-01-08 2016-08-24 微软技术许可有限责任公司 在虚拟网络之间路由消息
WO2017173142A1 (en) * 2016-03-31 2017-10-05 Alibaba Group Holding Limited Interworking between physical network and virtual network
US9825822B1 (en) * 2014-02-13 2017-11-21 Amazon Technologies, Inc. Group networking in an overlay network
CN110071900A (zh) * 2018-01-23 2019-07-30 华为技术有限公司 数据发送的方法及设备
CN110633127A (zh) * 2018-06-25 2019-12-31 华为技术有限公司 一种数据处理方法及相关设备
WO2020212998A1 (en) * 2019-04-17 2020-10-22 Telefonaktiebolaget Lm Ericsson (Publ) Network address allocation in a virtual layer 2 domain spanning across multiple container clusters
CN112637037A (zh) * 2021-03-10 2021-04-09 北京瑞莱智慧科技有限公司 跨地域容器通讯系统、方法、存储介质及计算机设备
CN113242269A (zh) * 2021-07-12 2021-08-10 北京宇创瑞联信息技术有限公司 基于虚拟化网络的数据传输方法、系统和网络安全设备
CN113852573A (zh) * 2021-10-18 2021-12-28 杭州安恒信息技术股份有限公司 一种容器跨宿主机的通信方法、装置、设备及介质
CN114237812A (zh) * 2021-11-10 2022-03-25 上海浦东发展银行股份有限公司 容器网络管理系统
CN114338832A (zh) * 2021-12-17 2022-04-12 上海道客网络科技有限公司 一种容器云平台的网络协议转换方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8046480B2 (en) * 2008-03-31 2011-10-25 Amazon Technologies, Inc. Embedding overlay virtual network addresses in underlying substrate network addresses
US8224931B1 (en) * 2010-03-31 2012-07-17 Amazon Technologies, Inc. Managing use of intermediate destination computing nodes for provided computer networks
US10757076B2 (en) * 2017-07-20 2020-08-25 Nicira, Inc. Enhanced network processing of virtual node data packets
US11070515B2 (en) * 2019-06-27 2021-07-20 International Business Machines Corporation Discovery-less virtual addressing in software defined networks

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102047245A (zh) * 2008-03-31 2011-05-04 亚马逊技术有限公司 配置计算机节点之间的通信
CN103401952A (zh) * 2008-03-31 2013-11-20 亚马逊技术有限公司 配置计算机节点之间的通信
US9282027B1 (en) * 2010-03-31 2016-03-08 Amazon Technologies, Inc. Managing use of alternative intermediate destination computing nodes for provided computer networks
CN105900407A (zh) * 2014-01-08 2016-08-24 微软技术许可有限责任公司 在虚拟网络之间路由消息
US9825822B1 (en) * 2014-02-13 2017-11-21 Amazon Technologies, Inc. Group networking in an overlay network
WO2017173142A1 (en) * 2016-03-31 2017-10-05 Alibaba Group Holding Limited Interworking between physical network and virtual network
CN110071900A (zh) * 2018-01-23 2019-07-30 华为技术有限公司 数据发送的方法及设备
CN110633127A (zh) * 2018-06-25 2019-12-31 华为技术有限公司 一种数据处理方法及相关设备
WO2020212998A1 (en) * 2019-04-17 2020-10-22 Telefonaktiebolaget Lm Ericsson (Publ) Network address allocation in a virtual layer 2 domain spanning across multiple container clusters
CN112637037A (zh) * 2021-03-10 2021-04-09 北京瑞莱智慧科技有限公司 跨地域容器通讯系统、方法、存储介质及计算机设备
CN113242269A (zh) * 2021-07-12 2021-08-10 北京宇创瑞联信息技术有限公司 基于虚拟化网络的数据传输方法、系统和网络安全设备
CN113852573A (zh) * 2021-10-18 2021-12-28 杭州安恒信息技术股份有限公司 一种容器跨宿主机的通信方法、装置、设备及介质
CN114237812A (zh) * 2021-11-10 2022-03-25 上海浦东发展银行股份有限公司 容器网络管理系统
CN114338832A (zh) * 2021-12-17 2022-04-12 上海道客网络科技有限公司 一种容器云平台的网络协议转换方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IPv6物联网层次转发体系中的地址压缩;肖融;孙波;陈文龙;肖永康;魏云刚;;计算机研究与发展(04);全文 *

Also Published As

Publication number Publication date
CN115314437A (zh) 2022-11-08

Similar Documents

Publication Publication Date Title
CN107566441B (zh) 用于虚拟机与云服务计算设备之间的快速路由传输的方法及系统
CN107645444B (zh) 用于虚拟机与云服务计算设备之间的快速路由传输的系统、设备和方法
US10887276B1 (en) DNS-based endpoint discovery of resources in cloud edge locations embedded in telecommunications networks
US8351430B2 (en) Routing using global address pairs
US11095534B1 (en) API-based endpoint discovery of resources in cloud edge locations embedded in telecommunications networks
CN102948121B (zh) 用于ipv4应用的4-到-6网络堆栈
US7245622B2 (en) Allowing IPv4 clients to communicate over an IPv6 network when behind a network address translator with reduced server workload
CN101800781B (zh) 一种穿越nat的隧道过渡方法及系统
CN105208048A (zh) 全局迁移管理器、网关、虚拟机迁移系统及其方法
CN102938795B (zh) 通过隧道和地址转换实现IPv6地址访问IPv4资源的方法
CN106464564A (zh) 网络分组封装和路由
CN102724101B (zh) 报文转发方法及系统与中继代理设备
US11202252B2 (en) Inclusion of a message proxy in a service based architecture
TW200934198A (en) Method and apparatus for dynamically configuring virtual internet protocol addresses
CN107645433B (zh) 报文转发方法及装置
US20230179652A1 (en) Distributed resilient load-balancing for multipath transport protocols
CN102394947B (zh) IPv4与IPv6的地址翻译方法、装置、系统及ALG设备
CN102572008A (zh) 通信业务处理方法与系统、网关设备
CN108600074A (zh) 组播数据报文的转发方法及装置
CN111930757B (zh) 数据处理方法、系统、封装节点和解封装节点
CN102821165A (zh) Ip地址转换方法及装置
CN105007238A (zh) 轻量级跨平台消息中间件的实现方法及系统
US11743325B1 (en) Centralized load balancing of resources in cloud edge locations embedded in telecommunications networks
CN113141400B (zh) 一种网络服务的访问方法及装置
CN107483628B (zh) 基于dpdk的单向代理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant