CN107113233A - 用于支持多租户集群环境中的分区感知路由的系统和方法 - Google Patents

用于支持多租户集群环境中的分区感知路由的系统和方法 Download PDF

Info

Publication number
CN107113233A
CN107113233A CN201580058088.5A CN201580058088A CN107113233A CN 107113233 A CN107113233 A CN 107113233A CN 201580058088 A CN201580058088 A CN 201580058088A CN 107113233 A CN107113233 A CN 107113233A
Authority
CN
China
Prior art keywords
node
subregion
interchanger
route
leaf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580058088.5A
Other languages
English (en)
Other versions
CN107113233B (zh
Inventor
F·扎西德
E·G·格兰
B·博格丹斯基
B·D·约翰森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oracle International Corp
Oracle America Inc
Original Assignee
Oracle International Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oracle International Corp filed Critical Oracle International Corp
Publication of CN107113233A publication Critical patent/CN107113233A/zh
Application granted granted Critical
Publication of CN107113233B publication Critical patent/CN107113233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/58Association of routers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/44Star or tree networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • H04L45/04Interdomain routing, e.g. hierarchical routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/10Packet switching elements characterised by the switching fabric construction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/356Switches specially adapted for specific applications for storage area networks
    • H04L49/358Infiniband Switches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Abstract

系统和方法可以支持多租户集群环境中的分区感知的路由。示例性方法可以支持多租户集群环境内的一个或多个租户。该方法可以将一个或多个租户中的每个租户与多个分区中的分区关联。然后该方法可以将多个分区中的每个分区与多个节点中的一个或多个节点关联,多个节点中的每个节点与多个交换机中的叶子交换机关联,多个交换机包括多个叶子交换机和多个根交换机。最后,该方法能够生成一个或多个线性转发表,这一个或多个线性转发表提供多个分区之间的隔离,其中多个节点中的每个节点与分区次序关联。

Description

用于支持多租户集群环境中的分区感知路由的系统和方法
版权声明
本专利文档公开的一部分包含受版权保护的素材。版权拥有者不反对任何人对专利文档或专利公开按照在专利商标局的专利文件或记录中出现那样进行的传真复制,但是除此之外在任何情况下都保留所有版权。
技术领域
本发明一般而言涉及计算机系统,并且具体而言,涉及多租户(multi-tenant)集群环境。
背景技术
多租赁允诺对可用系统资源的高利用率,并且有助于维护服务提供商的成本有效(cost effective)的操作。然而,多租户高性能计算(HPC)基础设施带来了独特的挑战,这些挑战与向租户提供性能隔离以及实现跨网络架构的高效负载平衡这二者关联。
发明内容
系统和方法可以支持多租户集群环境中的分区感知(partition-aware)路由。示例性方法可以支持多租户集群环境内的一个或多个租户。该方法可以将一个或多个租户中的每个租户与多个分区中的分区关联。然后该方法可以将该多个分区中的每个分区与多个节点中的一个或多个节点关联,该多个节点中的每个节点与多个交换机中的一叶子交换机关联,该多个交换机包括多个叶子交换机和多个根交换机。最后,该方法可以生成一个或多个线性转发表,这一个或多个线性转发表提供多个分区之间的隔离,其中这多个节点中的每个节点与一分区次序关联。
根据实施例,在多租户HPC系统中,每个租户可以经历可预测的网络性能,而不受其他租户的工作负载的影响。
附图说明
图1示出了根据实施例的多租户集群环境的图示。
图2示出了在其中可以实践本公开的实施例的网络环境中的树形拓扑的图示。
图3示出了在其中可以实践本公开的实施例的多租户集群环境中的路由的图示。
图4示出了在其中可以实践本公开的实施例的多租户集群环境中的路由的图示。
图5示出了根据实施例的支持多租户集群环境中的分区感知路由的图示。
图6示出了根据实施例的支持多租户集群环境中的分区感知路由的图示。
图7示出了根据实施例的支持多租户集群环境中的分区感知路由的图示。
图8示出了根据实施例的支持多租户集群环境中的分区感知路由的图示。
图9示出了根据实施例的用于支持多租户集群环境中的分区感知路由的方法的图示。
具体实施方式
在下面的详细描述中,将通过举例而不是限制的方式在附图的图中说明本发明。应当指出,在本公开中对“一”或“一个”或“一些”实施例的引用不一定是对相同的实施例,并且这种引用意味着至少一个实施例。虽然讨论了具体的实现,但是应当理解,具体实现仅仅是为了说明的目的而提供的。相关领域的技术人员将认识到,在不背离本发明的范围和精神的情况下,可以使用其它部件和配置。
在整个附图和详细描述中,使用共同的引用标号来指示相同的元件;因此,如果在其它地方对元件进行了描述,则图中所使用的引用标号可以在特定于这个图的具体描述中引用,或者可以不在特定于这个图的具体描述中引用。
本发明的以下描述使用InfinibandTM(IB)网络作为高性能网络的示例。对于本领域技术人员将清楚的是,可以使用其它类型的高性能网络而不受限制。以下描述还使用胖树拓扑作为架构拓扑的示例。对于本领域技术人员将清楚的是,可以使用其它类型的架构拓扑而不受限制。
InfiniBandTM
InfiniBandTM(IB)是由InfiniBandTM贸易协会开发的开放标准无损网络技术。该技术基于提供高吞吐量和低延迟通信的串行点对点全双工互连,尤其适用于HPC应用和数据中心。
InfiniBandTM体系结构(IBA)支持双层拓扑划分。在下层,IB网络被称为子网,其中子网可以包括使用交换机和点对点链路互连的一组主机。在上层,IB架构构成一个或多个子网,该一个或多个子网可以使用路由器互连。
在子网内,使用交换机和点对点链路来连接主机。此外,存在一个主管理实体——子网管理器(SM),它驻留在子网中的指定的子网设备上。子网管理器负责配置、激活和维护IB子网。此外,子网管理器(SM)可以负责执行IB架构中的路由表计算。在这里,例如,IB网络的路由的目的在于本地子网中的所有源和目的地对之间的恰当的负载平衡。
通过子网管理接口,子网管理器与子网管理代理(SMA)交换被称为子网管理数据包(SMP)的控制数据包。子网管理代理驻留在每个IB子网设备上。通过使用SMP,子网管理器能够发现架构,配置端节点和交换机,以及接收来自SMA的通知。
一般而言,除主子网管理器之外的所有其它子网管理器都在待机模式下起作用以用于容错。然而,在主子网管理器发生故障的情景中,由待机的子网管理器协商新的主子网管理器。主子网管理器还执行对子网的周期性扫描(sweep),以检测任何拓扑变化并相应地重新配置网络。
此外,子网内的主机和交换机可以使用本地标识符(LID)来寻址,并且单个子网可以被限制为49151个LID。除了作为在子网内有效的本地地址的LID,每个IB设备还可以具有被烧录到其非易失性存储器中的64位全局唯一标识符(GUID)。GUID可以被用于形成全局标识符(GID),全局标识符是IB层三(L3)地址。可以通过将64位子网标识符(ID)与64位GUID串接以形成类似于IPv6的128位地址来创建GID。例如,可以将不同的端口GUID指派给连接到IB架构的端口。
在网络初始化时,SM可以计算路由表(即,树内的每对节点之间的连接/路由)。此外,无论何时拓扑改变,路由表都可以被更新,以便确保连接性和最佳性能。在正常操作期间,SM可以执行对网络的周期性轻扫描(light sweep)以检查拓扑变化。如果在轻扫描期间发现变化,或者如果SM接收到发信号通知网络变化的信息(陷阱),则SM可以根据所发现的变化重新配置网络。
例如,当网络拓扑改变时,诸如当链路断开时、当添加设备时或者当链路被移除时,SM可以重新配置网络。重新配置步骤可以包括在网络初始化期间执行的步骤。此外,重新配置可以具有限于在其中发生网络变化的子网的局部范围。而且,使用路由器对大型架构的分段会限制重新配置的范围。
IB系统中的多租赁
从联网角度来看,经由分区的多租赁可以提供对网络资源的高利用率,并有助于维护服务提供商的成本有效的操作。然而,多租户基础设施还强加了若干重要的安全问题,最具挑战性的安全问题之一是与为租户提供性能隔离关联的。应当向每个租户提供可预测的网络性能,而不受系统中其他租户的工作负载的影响。IB系统中的网络隔离可以通过分区来提供。
根据实施例,分区是端口的逻辑组,使得组的成员只能与同一组的其他成员通信。在主机通道适配器(HCA)和交换机处,可以使用分区成员资格信息来过滤数据包以实施隔离。数据包一到达传入端口,就可以丢弃具有无效分区信息的数据包。在多租户IB系统中,分区可以被用于创建租户集群。在分区实施到位的情况下,节点不可以与属于不同租户集群的其它节点通信。以这种方式,即使在存在受损租户节点或恶意租户节点的情况下,也可以保证系统的安全性。
IB路由一般可以基于存储在交换机中的线性转发表(LFT)。LFT是由子网管理器(SM)在不考虑分区信息的情况下计算的。因此,中间网络链路可能携带属于不同分区的流量。中间链路的这种共享可能导致分区干扰。因此,租户体验不可预测的网络性能。此外,在分区的子网中路由算法的平衡特征也受到影响。这是因为,即使跨越分区边界的链路不用于用户流量,这些链路也与其它起作用的链路以相同的方式被路由(并且因此在平衡中被考虑)。变差的平衡会导致缩减的有效带宽和次优的网络利用率。
IB一般提供服务质量(QoS)特征,该服务质量特征可以被用于向每个分区保证可用带宽的份额而无论其它分区中的节点如何。然后通过给每个分区指派被称为服务层级(SL)的可用的差异化的流量类别来提供带宽保证。然后根据SL到虚拟道(virtual lane,VL)映射表将每个SL映射到链路上可用的十五个VL中的一个。
在将SL指派给分区时可能出现问题,这是因为系统只可以利用15个VL在网络中创建不同的分区,而IB网络一般可以具有大量的分区(例如,每个端口可以是最多达32768个分区的成员)。此外,在现有的IB硬件中,常见的是只支持九个VL(包括为子网管理保留的一个VL)。另外,由于SL是稀缺资源,所以可能期望尽可能多地留出它们以用于其它目的,例如,用以在网络中提供容错或服务差异化。
IB体系结构
根据实施例,IB是由IBTA(InfiniBand Trade Association,InfiniBand贸易协会)开发的开放标准无损网络技术。该技术定义了提供高吞吐量和低延迟通信的串行点对点全双工互连。IB网络可以由使用路由器互连的一个或多个子网组成。在子网内,使用交换机和点对点链路连接主机。在每个IB子网内,可以存在一个主管理实体——驻留在任何指定的子网设备上的子网管理器(SM),该子网管理器配置、激活和维护该IB子网。
通过子网管理接口,SM与驻留在每个IB设备上的子网管理代理(SMA)交换被称为子网管理数据包(SMP)的控制数据包。通过使用SMP,SM能够发现架构、配置端节点和交换机,以及接收来自SMA的通知。SM还可以执行对子网的周期性轻扫描,以检测任何拓扑变化并相应地重新配置网络。
根据实施例,IB网络中的子网内路由可以基于存储在交换机中的LFT。LFT由SM根据使用中的路由机制计算。在子网中,所有交换机以及端节点上的所有HCA端口都使用本地标识符(LID)来寻址。LFT中的每个条目由目的地LID(DLID)和输出端口组成。支持表中每个LID仅一个条目。当数据包到达交换机时,它的输出端口是通过在该交换机的转发表中查找DLID来确定的。路由是确定性的,因为数据包在给定的源-目的地对(LID对)之间采用网络中的相同的路径。
根据实施例,分区是由IB支持的、用于提供共享网络架构的系统的逻辑组的隔离的安全机制。架构中的节点上的每个HCA端口可以是一个或多个分区的成员。分区成员资格由集中式分区管理器管理,该集中式分区管理器可以是SM的一部分。SM可以将关于每个端口的分区成员资格信息配置为16位分区键(P键)的表。SM还可以利用包含与LID关联的P键信息的分区实施表来配置交换机和路由器。
根据实施例,对于节点之间的通信,除了管理队列对(QP0和QP1)之外,可以将队列对(QP)和端到端上下文(EEC)指派给特定分区。然后可以将P键信息添加到所发送的每个IB传送数据包。当数据包到达HCA端口或交换机时,可以对照由SM配置的表验证该数据包的P键值。如果找到无效的P键值,则立即丢弃数据包。以这种方式,仅在共享分区的端口之间允许通信。
图1中示出了IB分区的示例,图1示出了根据实施例的多租户集群环境的图示。在图1中所示的示例中,节点A-E即101-105使用InfiniBand架构100经由相应的主机信道适配器111-115进行通信。节点A-E被布置成分区,即分区1 110、分区2 120和分区3 130。分区1包括节点A 101和节点D 104。分区2包括节点A 101、节点B102和节点C 103。分区3包括节点C 103和节点E 105。由于分区的布置,节点D 104和节点E 105不允许通信,因为这些节点不共享分区。同时,例如,节点A 101和节点C 103被允许通信,因为这些节点两者都是分区2120的一部分。
根据实施例,IB是分层体系结构,其中可以使用VL将每个物理链路划分成多个虚拟链路。每个VL可以具有自己的缓冲、流量控制和拥塞管理资源。可以通过一组差异化的流量类别(SL)来提供QoS。SL表示数据包可以在网络中接收的服务的类别。每个SL基于所配置的SL到VL映射表而映射到链路上的VL。IB支持最多达16个VL。然而,最后一个VL是为子网管理流量保留的并且一般不被用户应用使用。
胖树(FTree)拓扑和路由
根据实施例,基于IB的HPC系统中的一些采用胖树拓扑以利用胖树提供的有用属性。这些属性包括由于每个源-目的地对之间的多个路径的可用性而产生的固有的容错和完全的二分带宽。胖树背后的最初想法是,当树朝向拓扑的根移动时,在节点之间采用具有更多的可用带宽的较胖的链路。较胖的链路可以帮助避免上层交换机中的拥塞并且二分带宽被维持。
图2示出了其中可以实践本公开的实施例的网络环境中的树形拓扑的图示。如图2中所示,在网络架构200中可以连接一个或多个端节点201-204。网络架构200可以基于胖树拓扑,该胖树拓扑包括多个叶子交换机211-214以及多个脊交换机或根交换机231-234。此外,网络架构200可以包括一个或多个中间交换机,诸如交换机221-224。
还如图2中所示,端节点201-204中的每一个可以是多宿主节点,即,通过多个端口连接到网络架构200的两个或更多个部分的单个节点。例如,节点201可以包括端口H1和H2,节点202可以包括端口H3和H4,节点203可以包括端口H5和H6,并且节点204可以包括端口H7和H8。
此外,每个交换机可以具有多个交换机端口。例如,根交换机231可以具有交换机端口1-2,根交换机232可以具有交换机端口3-4,根交换机233可以具有交换机端口5-6,并且根交换机234可以具有交换机端口7-8。
根据实施例,胖树路由机制是用于基于IB的胖树拓扑的最流行的路由算法之一。胖树路由机制也在OFED(开放架构企业分发——用于构建和部署基于IB的应用的标准软件堆栈)子网管理器OpenSM中实现。
胖树路由机制的目的在于生成跨网络架构中的链路均匀散布最短路径路由的LFT。该机制按索引次序遍历架构并将端节点的目标LID(以及因此对应的路由)指派给每个交换机端口。对于连接到相同叶子交换机的端节点,索引次序可以取决于端节点所连接到的交换机端口(即,端口编号顺序)。对于每个端口,该机制可以维护端口使用计数器,并且可以在每次添加新路由时使用这个端口使用计数器来选择最少使用的端口。
如上面所提到的,在分区的子网中,不允许不是共同分区的成员的节点进行通信。在实践中,这意味着由胖树路由算法指派的路由中的一些不用于用户流量。当胖树路由机制以与该胖树路由机制针对其它起作用的路径相同的方式为这些路由生成LFT时,会出现问题。这种行为会导致链路上的变差的平衡,因为节点是以索引的次序路由的。由于路由是在不注意(oblivious)分区的情况下进行的,所以胖树路由的子网一般在分区间提供不佳的隔离。
图3示出了其中可以实践本公开的实施例的多租户集群环境中的路由的图示。更具体而言,图3详细说明了变差的负载平衡和不佳的隔离的问题。
图3示出了在三个重叠分区中具有四个交换机(根交换机325-326和叶子交换机320-321)以及六个端节点(节点A-F,301-306)的二级胖树拓扑。分区1包括节点B 302和节点C 303。分区2包括节点A 301、节点C 303、节点D 304和节点F 306。最后,分区3包括节点D304和节点E 305。
根据实施例,分区1和分区3分别被完全限制在叶子交换机320和321(即,单叶子交换机分区)内。因此,分区1和分区3中的节点之间的通信通过它们对应的叶子交换机进行,而不会将流量移动到根交换机325或326。当这个拓扑通过胖树路由机制路由时,朝向连接到叶子交换机320和叶子交换机321的节点的路由被指派根交换机,因此叶子交换机间(inter-leaf switch)的流可以到达它们的目的地。为了负载平衡,朝向A和C的路由被指派根交换机325(在图上示为链路p),而根交换机326路由朝向节点B的流量(在图上示为链路q)。类似地,对于叶子交换机321,朝向叶子交换机间的分区2中的节点D和节点F的流量经由根交换机325被路由(在图上示为链路r),并且朝向节点E的流量经由根交换机326被路由(在图上示为链路s)。
根据实施例,根交换机上的端端口(end port)选择被示为图中具有节点标识符的小圆圈。由于路由是(使用胖树路由机制)在不考虑分区信息的情况下进行的,所以子网中的路径不是恰当地平衡的。链路p和链路r被超额订阅,而永远没有叶子交换机内(intra-leaf switch)的流会使用链路q或链路s。所指派的朝向节点B和节点E的路由不被利用(除了相对较低的管理流量),因为这两个节点由于它们的分区而都不能从其叶子交换机外部接收任何通信。当分区的通信仅限于拓扑中的一些层级时,这种平衡问题也会在胖树中发生。
现在参考图4,图4示出了其中可以实践本公开的实施例的多租户集群环境中的路由的图示。更具体而言,图4详细说明了与胖树中不佳的隔离关联的问题。
图4示出了具有四个交换机(根交换机425-426和叶子交换机420-421)以及八个端节点(节点A-G,401-408)的二级胖树拓扑。同样,端节点被划分成两个分区。分区1包括节点A 401、节点B402、节点G 407和节点H 408。分区2包括节点C 403、节点D 404、节点E 405和节点F 406。
这些分区中的每一个具有连接到两个叶子交换机中的每一个的两个节点。如图所示,胖树路由机制指派根交换机425和根交换机426上的向下端口。由于胖树路由机制的本质,每个根交换机路由朝向属于两个分区的节点的流量,这提供了不佳的隔离,这在分区环境中是不期望的。例如,朝向节点A和节点C的流量在共享链路p上被路由。不同分区的节点之间的对中间链路的共享会造成它们之间的干扰。尽管网络在根层级处具有足够的资源以在提供分区之间的完全隔离,但是胖树路由机制不提供所期望的隔离。
分区感知的胖树(pFTree)路由
根据实施例,分区感知的胖树路由机制(在本文不同地称为pFTree)可以实现与IB网络中的多租赁关联的期望目标。例如,pFTree机制可以通过跨树中的链路均匀分布路由来为胖树拓扑提供良好平衡的线性转发表。此外,在维持链路上的路由平衡的同时,pFTree可以去除属于不同分区的路径之间的争用。
根据实施例,pFTree机制可以使用关于子网的分区信息来确保分区中的节点接收不受其它分区中运行的工作负载影响的可预测的网络性能。在拓扑没有足够链路可用于在每个层级处提供分区隔离(而不损害负载平衡)的情景中,pFTree可以指派VL以减少争用的影响。
根据实施例,pFTree机制可以递归地工作,以便为与每个端节点关联的LID在所有相关的交换机上设置LFT。这在下面的伪代码(本文中称为清单1)中示出:
根据实施例,ROUTEDOWNGOINGBYASCENDING()在下面的伪代码(本文中称为清单2)中例示:
根据实施例,ROUTEUPGOINGBYDESCENDING()在下面的伪代码(本文中称为清单3)中例示:
根据实施例,ASSIGNVIRTUALLANES()在下面的伪代码(在本文中不同地被称为清单4)中例示:
根据实施例,在滤除单叶子交换机分区(即,可以完全在单个叶子交换机内通信的那些分区)之后,对于每个叶子交换机,该机制可以按特定于分区的次序对连接的端节点进行分类(上面清单1的行4)(例如,经由具有唯一分区次序号的每个分区)。这种排序可以辅助确保在考虑在叶子交换机处的上行端口的可用数量的情况下根据节点的分区对节点进行路由。然后,pFTree机制可以调用诸如ROUTEDOWNGOINGBYASCENDING(上面清单1的行9)的函数,并在树中向上移动,以选择下一层级处的路由LID的端口,如清单2中所示。
根据实施例,端口选择是基于最少数量的已经指派的路由。这可以帮助确保负载跨可用的路径散布。然而,当具有相同负载的若干端口可用时,该函数可以遍历这些最少负载的端口,并且选择连接到已经被正被路由的节点的分区键标记的交换机的端口(清单2的行3-行9)。如果没有交换机被标记(这可以指示这个分区的第一个节点正被路由),则系统可以默认选择具有最大全局唯一标识符(GUID)的端口(清单2的行2)。当交换机被第一次选择用于分区时,用分区键在向下方向上标记该交换机(清单2的行11)。
根据实施例,在为LID设置交换机处的下行端口之后,该机制可以通过下降树调用来在所有连接的向下交换机上为它指派向上端口(清单3的ROUTEUPGOINGBYDESCENDING)。同样,上行端口的选择可以首先基于负载准则,并且然后基于在向上方向上远程交换机的分区标记。然后,可以通过向上移动到树中的下一层级来重复该过程,直到所有LFT都被设置。注意到,可以使用多个分区键标记交换机。pFTree机制可以为每个交换机维护表,从而为每个分区存储所路由的节点的计数。如果具有标记的分区的若干交换机可用于路由节点,则该计数器可以被用于决定端口的选择。可以选择具有分区的最大数量的已经路由的节点的交换机。
根据实施例,一旦生成了路由表,保持分区隔离准则,该机制就可以继续以检查链路中的一些是否正被用于朝向不同分区中的节点的流。对于这些情况,该机制可以将VL指派给干扰分区以提供隔离。清单4中示出了VL指派机制的示例。
根据实施例,VL指派机制可以遍历分区并检查由分区中的节点使用的任何中间通信链路是否与尚未被指派单独VL的另一个分区共享中间链路。如果遇到这种情景,则可以指派新的VL。pFTree路由机制可以支持用于VL选择的两种模式:严格模式和正常模式。
根据实施例,在严格模式中,如果用于pFTree路由的所需的VL的数量超过系统中的可用VL,则路由会失败(清单4的行10)。
根据实施例,在正常模式中,算法可以从VL1起重新开始将VL指派给分区(清单4的行8)。
根据实施例,提供了用于基于IB的胖树网络(不同地称为pFTree)的高效的分区感知路由机制。pFTree机制可以为胖树拓扑提供分区的网络范围的隔离。此外,pFTree为交换机产生良好平衡的LFT。给定足够的网络资源,pFTree可以仅在物理链路层级处对分区进行隔离。例如,如果胖树具有两个不重叠的相等大小的分区,则pFTree可以基于路由本身将中间网络链路划分成两个相等大小的逻辑子网络。此外,如果网络没有足够的可用资源来提供完全的分区隔离,则pFTree可以采用与物理隔离相结合而起作用的补充的基于VL的隔离方案。
根据实施例,pFTree路由机制的目的在于实现两个主要目标。首先,通过跨树中的链路均匀地分布路由,该机制可以为胖树拓扑生成良好平衡的LFT。其次,在维护链路上的路由平衡的同时,pFTree去除属于不同分区的路径之间的争用。pFTree可以使用关于子网的分区信息,并确保分区中的节点接收可预测的网络性能而不受其它分区中运行的工作负载的影响。如果拓扑没有足够的链路可用于在每个层级处提供分区隔离(而不损害负载平衡),则pFTree可以使用VL来减少争用的影响。
根据实施例,pFTree机制可以递归地工作,以为与每个端节点关联的LID在所有相关的交换机上设置LFT。在滤除单叶子交换机分区之后,对于每个叶子交换机,该机制可以按特定于分区的次序对连接的端节点进行排序。这种排序确保在考虑在叶子交换机处的上行端口的可用数量的情况下根据节点的分区对节点进行路由。在每个层级处的端口选择可以基于最少数量的已经指派的路由,以确保负载跨可用路径散布。然而,当具有相同负载的若干端口可用时,该函数遍历这些最少负载的端口,并选择连接到已经用正在被路由的节点的分区键标记的交换机的端口。如果没有交换机被标记(即,路由特定分区的第一个节点),则pFTree可以落到具有最大全局唯一标识符(GUID)的端口的默认选择。当交换机被第一次选择用于分区时,可以使用分区键来标记该交换机。以这种方式,该机制可以帮助确保给定足够的可用于平衡的路径,属于一个分区的节点将路由通过相同的交换机和对应的链路。一旦生成了路由表,保持分区隔离准则,该机制就可以继续以检查链路中的一些是否正用于朝向不同分区中的节点的流。对于那些情况,该机制可以将VL指派给干扰分区以提供隔离。
现在参考图5-图8,这些图是根据实施例的支持多租户集群环境中的分区感知路由的图示。
根据实施例,在图5-图8中通过超额订阅的胖树网络的简单部分示出pFTree路由中的端口选择机制。
现在参考图5,图5示出了具有四个交换机(根交换机525-526和叶子交换机520-521)以及八个端节点(节点A-G,501-508)的二级胖树拓扑。同样,端节点被划分成两个分区。分区1包括节点A401、节点D 504、节点G 507和节点H 508。分区2包括节点B 502、节点C503、节点E 505和节点F 506。
根据实施例,如图5中所示,示例部分由两个叶子交换机(520和521)组成,每个叶子交换机分别连接到四个端节点和在叶子交换机上方的下一层级处的两个交换机,即根交换机(525和526)。图中还指示了down和max变量,它们分别表示在向下方向上指派的路由的数量以及为了确保每个链路上的恰当平衡而可以被路由的节点的最大数量。
根据实施例,给定在每个叶子交换机处存在两个上行端口,其中要路由四个端节点,上行链路中的每一个应当向下路由两个端节点,以确保链路是平衡的(即,max=2)。
根据实施例,对于叶子交换机520,前两个节点(节点A和节点B)的路由在图6中示出。路由机制可以选择根交换机525来路由朝向节点A的流量,并且使用节点A的分区键标记该交换机,在图中被示为“(分区1)”。类似地,对于节点B,可以选择根交换机526并且用节点B的分区键标记根交换机526,在图中被示为“(分区2)”。变量down也被更新,以对两个向下链路中的每一个上的单个被路由的节点进行计数。
根据实施例,对于节点C和节点D,可以选择已经用对应的分区键标记的交换机,如图7中给出的。得出的路由通过经过根交换机525的相同链路流向属于第一分区的节点(即,节点A和D)。类似地,可以经过根交换机526向下路由第二分区的节点(即,节点B和节点C)。路由的这种分离避免两个分区的流量流之间的干扰。注意到,在每个链路上向下路由的节点的数量不超过max变量,这意味着路由仍然是平衡的。
最后,根据实施例,图8示出了用于连接到叶子交换机521的端节点的路由。而且在这里,由于第二层级的交换机已经根据第一叶子交换机路由用分区键进行标记,因此对应的交换机可以被选择以路由每个节点(即,节点E、F、G和G)。如图中所示,最终的路由可以通过基于路由将中间网络链路划分成两个相等大小的逻辑子网络来隔离两个分区。
图9示出了根据实施例的用于支持多租户集群环境中的分区感知路由的方法的图示。示例性方法900可以在支持多租户集群环境中的一个或多个租户的步骤901处开始。在步骤902处,示例性方法可以将一个或多个租户中的每个租户与多个分区的一分区关联。在步骤903处,该方法可以将多个分区中的每个分区与多个节点中的一个或多个节点关联,这多个节点中的每个节点与多个交换机中的一叶子交换机关联,这多个交换机包括多个叶子交换机和在其它层级处的多个交换机。最后,在步骤904处,该方法可以生成一个或多个线性转发表,这一个或多个线性转发表提供这多个分区之间的隔离,其中这多个节点中的每个节点与一分区次序关联。
本发明的许多特征可以在硬件、软件、固件或其组合中执行,利用硬件、软件、固件或其组合执行,或者在硬件、软件、固件或其组合的辅助下执行。因此,本发明的特征可以利用(例如,包括一个或多个处理器的)处理系统来实现。
本发明的特征可以在计算机程序产品中实现,利用计算机程序产品实现,或者在计算机程序产品的辅助下实现,其中计算机程序产品是其上/其中存储有可用来编程处理系统以执行本文所呈现的任何特征的指令的存储介质或计算机可读介质。存储介质可以包括但不限于任何类型的盘(包括软盘、光盘、DVD、CD-ROM、微驱动器、以及磁光盘)、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、闪存存储器设备、磁卡或光卡、纳米系统(包括分子存储器IC)、或适于存储指令和/或数据的任何类型的媒介或设备。
存储在任何一种(一个或多个)机器可读介质中,本发明的特征可以被结合到软件和/或固件中,以用于控制处理系统的硬件,并且用于使处理系统能够利用本发明的结果与其它机制交互。这种软件或固件可以包括但不限于应用代码、设备驱动程序、操作系统和执行环境/容器。
本发明的特征也可以利用例如诸如专用集成电路(ASIC)的硬件部件在硬件中实现。实现硬件状态机以便执行本文所描述的功能对相关领域的技术人员将是显然的。
此外,本发明可以方便地利用一个或多个常规的通用或专用数字计算机、计算设备、机器或微处理器来实现,这些数字计算机、计算设备、机器或微处理器包括一个或多个处理器、存储器和/或根据本公开的教导编程的计算机可读存储介质。如对软件领域的技术人员将清楚的,适当的软件编码可以容易地由熟练的程序员基于本公开的教导来准备。
虽然以上已经描述了本发明的各种实施例,但是应该理解,它们已通过示例而不是限制给出。对相关领域的技术人员将清楚的是,在不背离本发明的精神和范围的情况下,其中可以做出各种形式和细节上的变化。
本发明已经借助说明指定功能及其关系的执行的功能构建块进行了描述。这些功能构建块的边界在本文中通常是为了方便描述而任意定义的。可以定义可替代的边界,只要指定的功能及其关系被适当地执行。任何这种可替代的边界因此在本发明的范围和精神之内。
本发明的以上描述是为了说明和描述的目的而提供的。它不旨在是穷尽的或者要把本发明限定到所公开的精确形式。本发明的广度和范围不应该由任何上述示例性实施例来限制。许多修改和变化对本领域技术人员来说将是清楚的。修改和变化包括所公开特征的任何相关组合。实施例的选择与描述是为了最好地解释本发明的原理及其实践应用,从而使本领域其他技术人员能够理解用于各种实施例的本发明以及具有适于预期特定用途的各种修改的本发明。本发明的范围旨在由以下权利要求及其等价物来定义。

Claims (20)

1.一种用于支持多租户集群环境中的分区感知路由的方法,包括:
支持所述多租户集群环境内的一个或多个租户;
将所述一个或多个租户中的每个租户与多个分区中的分区关联;
将所述多个分区中的每个分区与多个节点中的一个或多个节点关联,所述多个节点中的每个节点与多个交换机中的叶子交换机关联,所述多个交换机包括多个叶子交换机和在其它层级处的多个交换机;
生成一个或多个线性转发表,所述一个或多个线性转发表提供所述多个分区之间的隔离;及
其中所述多个节点中的每个节点与分区次序关联。
2.如权利要求1所述的方法,其中生成一个或多个线性转发表包括:
对于所述多个叶子交换机中的每个叶子交换机,根据与每个节点关联的所述分区次序对所述多个节点进行排序,从而得出节点的次序;及
按所述节点的次序路由所述多个端节点,所述路由包括:
为每个节点选择至少一个下行端口和至少一个上行端口,所述选择基于选自由负载准则和交换机的分区标记组成的组中的至少一个因素。
3.如权利要求2所述的方法,还包括:
在根据与每个节点关联的所述分区次序对所述多个节点进行排序之前,过滤单叶子交换机分区。
4.如权利要求1至3中任一项所述的方法,其中提供所述多个分区之间的隔离包括:
确保与不同分区关联的节点之间的通信不共享所述多个交换机中的交换机之间的路由。
5.如权利要求1至4中任一项所述的方法,还包括:
允许所述多个交换机和所述多个节点以树形拓扑布置。
6.如权利要求5所述的方法,其中所述树形拓扑是胖树拓扑。
7.如权利要求1至6中任一项所述的方法,其中所述多租户集群环境包括InfiniBand网络。
8.一种支持多租户集群环境中的分区感知路由的系统,所述系统包括:
一个或多个微处理器;及
在所述一个或多个微处理器上运行的处理器,其中所述处理器操作以执行包括以下操作的步骤:
支持所述多租户集群环境内的一个或多个租户;
将所述一个或多个租户中的每个租户与多个分区中的分区关联;
将所述多个分区中的每个分区与多个节点中的一个或多个节点关联,所述多个节点中的每个节点与多个交换机中的叶子交换机关联,所述多个交换机包括多个叶子交换机和在其它层级处的多个交换机;以及
生成一个或多个线性转发表,所述一个或多个线性转发表提供所述多个分区之间的隔离;
其中所述多个节点中的每个节点与分区次序关联。
9.如权利要求8所述的系统,其中生成一个或多个线性转发表包括:
对于所述多个叶子交换机中的每个叶子交换机,根据与每个节点关联的所述分区次序对所述多个节点进行排序,从而得出节点的次序;及
按所述节点的次序路由所述多个端节点,所述路由包括:
为每个节点选择至少一个下行端口和至少一个上行端口,所述选择基于选自由负载准则和交换机的分区标记组成的组中的至少一个因素。
10.如权利要求9所述的系统,所述步骤还包括:
在根据与每个节点关联的所述分区次序对所述多个节点进行排序之前,过滤单叶子交换机分区。
11.如权利要求8至10中任一项所述的系统,其中提供所述多个分区之间的隔离包括:
确保与不同分区关联的节点之间的通信不共享所述多个交换机中的交换机之间的路由。
12.如权利要求8至11中任一项所述的系统,其中所述多个交换机和所述多个节点以树形拓扑布置。
13.如权利要求12所述的系统,其中所述树形拓扑是胖树拓扑。
14.如权利要求8至13中任一项所述的系统,其中所述多租户集群环境包括InfiniBand网络。
15.一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质具有存储在其上的指令以用于在多租户集群环境中支持分区感知路由,所述指令在被执行时,使系统执行以下包括以下操作的步骤:
支持多租户集群环境内的一个或多个租户;
将所述一个或多个租户中的每个租户与多个分区中的分区关联;
将所述多个分区中的每个分区与多个节点中的一个或多个节点关联,所述多个节点中的每个节点与多个交换机中的叶子交换机关联,所述多个交换机包括多个叶子交换机和在其它层级处的多个交换机;
生成一个或多个线性转发表,所述一个或多个线性转发表提供所述多个分区之间的隔离;
其中所述多个节点中的每个节点与分区次序关联。
16.如权利要求15所述的非暂时性机器可读存储介质,其中生成一个或多个线性转发表包括:
对于所述多个叶子交换机中的每个叶子交换机,根据与每个节点关联的所述分区次序对所述多个节点进行排序,从而得出节点的次序;及
按所述节点的次序路由所述多个端节点,所述路由包括:
为每个节点选择至少一个下行端口和至少一个上行端口,所述选择基于选自由负载准则和交换机的分区标记组成的组中的至少一个因素。
17.如权利要求16所述的非暂时性机器可读存储介质,所述步骤还包括:
在根据与每个节点关联的所述分区次序对所述多个节点进行排序之前,过滤单叶子交换机分区。
18.如权利要求15至17中任一项所述的非暂时性机器可读存储介质,其中提供所述多个分区之间的隔离包括:
确保与不同分区关联的节点之间的通信不共享所述多个交换机中的交换机之间的路由。
19.如权利要求15至18中任一项所述的非暂时性机器可读存储介质,所述步骤还包括:
允许所述多个交换机和所述多个节点以树形拓扑布置。
20.如权利要求19所述的非暂时性机器可读存储介质,其中所述树形拓扑是胖树拓扑。
CN201580058088.5A 2014-10-31 2015-10-29 用于支持多租户集群环境中的分区感知路由的系统和方法 Active CN107113233B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201462073615P 2014-10-31 2014-10-31
US62/073,615 2014-10-31
US201462074443P 2014-11-03 2014-11-03
US62/074,443 2014-11-03
US201462076961P 2014-11-07 2014-11-07
US62/076,961 2014-11-07
US201562133187P 2015-03-13 2015-03-13
US62/133,187 2015-03-13
PCT/US2015/058118 WO2016069927A1 (en) 2014-10-31 2015-10-29 System and method for supporting partition-aware routing in a multi-tenant cluster environment

Publications (2)

Publication Number Publication Date
CN107113233A true CN107113233A (zh) 2017-08-29
CN107113233B CN107113233B (zh) 2020-06-23

Family

ID=54479014

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580058088.5A Active CN107113233B (zh) 2014-10-31 2015-10-29 用于支持多租户集群环境中的分区感知路由的系统和方法

Country Status (6)

Country Link
US (1) US9807003B2 (zh)
EP (1) EP3213471B1 (zh)
JP (1) JP6653699B2 (zh)
KR (1) KR102340683B1 (zh)
CN (1) CN107113233B (zh)
WO (1) WO2016069927A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019105360A1 (zh) * 2017-11-30 2019-06-06 华为技术有限公司 数据传输方法、相关装置及网络
CN109981364A (zh) * 2019-03-25 2019-07-05 联想(北京)有限公司 网络的管理方法和系统
CN110012125A (zh) * 2019-04-01 2019-07-12 优刻得科技股份有限公司 集群网络通信方法、装置、存储介质和设备
CN110611621A (zh) * 2019-09-26 2019-12-24 上海依图网络科技有限公司 树型结构的多集群间的路由控制方法及集群森林
CN111526113A (zh) * 2019-02-02 2020-08-11 中兴通讯股份有限公司 协议处理方法及装置、存储介质
CN115459968A (zh) * 2022-08-25 2022-12-09 中国人民解放军国防科技大学 用于高性能计算机系统的隔离方法及高性能计算机系统

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3025384B1 (fr) * 2014-09-03 2016-09-16 Bull Sas Procede de surveillance et d'alerte de configuration de routage dans un cluster comprenant des liens de communication statiques et programme d'ordinateur mettant en oeuvre ce procede
JP6420354B2 (ja) * 2015-02-18 2018-11-07 インテル・コーポレーション 優先度および帯域幅割り当てに基づくトラフィッククラスアービトレーション
US10033647B2 (en) * 2015-10-13 2018-07-24 Oracle International Corporation System and method for efficient network isolation and load balancing in a multi-tenant cluster environment
US10659340B2 (en) 2016-01-28 2020-05-19 Oracle International Corporation System and method for supporting VM migration between subnets in a high performance computing environment
US10333894B2 (en) 2016-01-28 2019-06-25 Oracle International Corporation System and method for supporting flexible forwarding domain boundaries in a high performance computing environment
US10630816B2 (en) 2016-01-28 2020-04-21 Oracle International Corporation System and method for supporting shared multicast local identifiers (MILD) ranges in a high performance computing environment
US10348847B2 (en) 2016-01-28 2019-07-09 Oracle International Corporation System and method for supporting proxy based multicast forwarding in a high performance computing environment
US10348649B2 (en) 2016-01-28 2019-07-09 Oracle International Corporation System and method for supporting partitioned switch forwarding tables in a high performance computing environment
US10536334B2 (en) 2016-01-28 2020-01-14 Oracle International Corporation System and method for supporting subnet number aliasing in a high performance computing environment
US10616118B2 (en) 2016-01-28 2020-04-07 Oracle International Corporation System and method for supporting aggressive credit waiting in a high performance computing environment
US10666611B2 (en) 2016-01-28 2020-05-26 Oracle International Corporation System and method for supporting multiple concurrent SL to VL mappings in a high performance computing environment
US10374926B2 (en) 2016-01-28 2019-08-06 Oracle International Corporation System and method for monitoring logical network traffic flows using a ternary content addressable memory in a high performance computing environment
US10355972B2 (en) 2016-01-28 2019-07-16 Oracle International Corporation System and method for supporting flexible P_Key mapping in a high performance computing environment
CN108604199B (zh) * 2016-08-23 2022-08-23 甲骨文国际公司 计算环境中支持快速混合重新配置的系统和方法、介质
US10355939B2 (en) * 2017-04-13 2019-07-16 International Business Machines Corporation Scalable data center network topology on distributed switch
US10574755B2 (en) * 2018-03-28 2020-02-25 Wipro Limited Method and high performance computing (HPC) switch for optimizing distribution of data packets
KR102070936B1 (ko) * 2018-11-02 2020-01-29 한림대학교 산학협력단 슬롯프레임 파티셔닝 기반 셀 스케쥴링 방법, 장치 및 프로그램
FR3126576A1 (fr) * 2021-09-01 2023-03-03 Latelec Procédé de détermination d’une topologie d’interconnexion entre commutateurs d’un réseau de communication, produit programme d’ordinateur et dispositif correspondants.

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102333115A (zh) * 2011-09-01 2012-01-25 杭州湾云计算技术有限公司 一种将已有Web应用转化为SaaS多租户应用的方法和装置
CN102859949A (zh) * 2010-04-30 2013-01-02 惠普发展公司,有限责任合伙企业 用于在胖树网络中路由数据分组的方法
US20140101336A1 (en) * 2012-10-09 2014-04-10 Cisco Technology, Inc. System and method for implementing a multilevel data center fabric in a network environment
CN103813288A (zh) * 2012-11-06 2014-05-21 中兴通讯股份有限公司 基于移动网络的租户网络业务实现方法、系统及网元
CN104067565A (zh) * 2012-01-20 2014-09-24 思科技术公司 用于多租户访问网络的连接系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4430993C1 (de) * 1994-08-31 1995-10-26 Siemens Ag Verfahren zur adaptiven Wegesuche in einem Kommunikationsnetz
JP5167243B2 (ja) * 2006-04-04 2013-03-21 パーマビット テクノロジー コーポレイション 拡張性及び耐障害性を有する記憶システムのための記憶領域割当て及び消去符号化技法
US20080189432A1 (en) 2007-02-02 2008-08-07 International Business Machines Corporation Method and system for vm migration in an infiniband network
US20080186990A1 (en) 2007-02-02 2008-08-07 International Business Machines Corporation Translation module, method and computer program product for providing multiple infiniband address support for vm migration using infiniband address translation
US8737399B2 (en) 2010-01-05 2014-05-27 Futurewei Technologies, Inc. Enhanced hierarchical virtual private local area network service (VPLS) system and method for Ethernet-tree (E-Tree) services
JP5476261B2 (ja) * 2010-09-14 2014-04-23 株式会社日立製作所 マルチテナント型情報処理システム、管理サーバ及び構成管理方法
US9270650B2 (en) 2011-06-03 2016-02-23 Oracle International Corporation System and method for providing secure subnet management agent (SMA) in an infiniband (IB) network
US9014201B2 (en) * 2011-11-09 2015-04-21 Oracle International Corporation System and method for providing deadlock free routing between switches in a fat-tree topology
US9225624B2 (en) * 2012-12-20 2015-12-29 Dell Products L.P. Systems and methods for topology discovery and application in a border gateway protocol based data center
US9264351B2 (en) * 2013-09-07 2016-02-16 Cisco Technology, Inc. System and method for utilization of a segmentation identification to support transmission of data to a destination node
CN104954265B (zh) * 2014-03-25 2018-06-15 华为技术有限公司 发送组播报文的方法及交换机
US10033647B2 (en) * 2015-10-13 2018-07-24 Oracle International Corporation System and method for efficient network isolation and load balancing in a multi-tenant cluster environment

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102859949A (zh) * 2010-04-30 2013-01-02 惠普发展公司,有限责任合伙企业 用于在胖树网络中路由数据分组的方法
CN102333115A (zh) * 2011-09-01 2012-01-25 杭州湾云计算技术有限公司 一种将已有Web应用转化为SaaS多租户应用的方法和装置
CN104067565A (zh) * 2012-01-20 2014-09-24 思科技术公司 用于多租户访问网络的连接系统
US20140101336A1 (en) * 2012-10-09 2014-04-10 Cisco Technology, Inc. System and method for implementing a multilevel data center fabric in a network environment
CN103813288A (zh) * 2012-11-06 2014-05-21 中兴通讯股份有限公司 基于移动网络的租户网络业务实现方法、系统及网元

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019105360A1 (zh) * 2017-11-30 2019-06-06 华为技术有限公司 数据传输方法、相关装置及网络
CN111526113A (zh) * 2019-02-02 2020-08-11 中兴通讯股份有限公司 协议处理方法及装置、存储介质
US11863653B2 (en) 2019-02-02 2024-01-02 Zte Corporation Protocol processing method and storage medium
CN109981364A (zh) * 2019-03-25 2019-07-05 联想(北京)有限公司 网络的管理方法和系统
CN110012125A (zh) * 2019-04-01 2019-07-12 优刻得科技股份有限公司 集群网络通信方法、装置、存储介质和设备
CN110012125B (zh) * 2019-04-01 2022-02-01 优刻得科技股份有限公司 集群网络通信方法、装置、存储介质和设备
CN110611621A (zh) * 2019-09-26 2019-12-24 上海依图网络科技有限公司 树型结构的多集群间的路由控制方法及集群森林
CN110611621B (zh) * 2019-09-26 2020-12-15 上海依图网络科技有限公司 树型结构的多集群间的路由控制方法及集群森林
CN115459968A (zh) * 2022-08-25 2022-12-09 中国人民解放军国防科技大学 用于高性能计算机系统的隔离方法及高性能计算机系统

Also Published As

Publication number Publication date
EP3213471A1 (en) 2017-09-06
US20160127236A1 (en) 2016-05-05
KR20170078626A (ko) 2017-07-07
CN107113233B (zh) 2020-06-23
EP3213471B1 (en) 2018-08-29
KR102340683B1 (ko) 2021-12-20
US9807003B2 (en) 2017-10-31
JP6653699B2 (ja) 2020-02-26
WO2016069927A1 (en) 2016-05-06
JP2017533668A (ja) 2017-11-09

Similar Documents

Publication Publication Date Title
CN107113233A (zh) 用于支持多租户集群环境中的分区感知路由的系统和方法
CN107533486B (zh) 用于多租户集群环境中的高效网络隔离和负载平衡的系统和方法
US11212210B2 (en) Selective route exporting using source type
JP6470838B2 (ja) ソフトウェア定義型ネットワーキングにおけるデータ転送方法、装置、およびシステム
CN104426681B (zh) 端点的分布式多播
US20230353507A1 (en) System and method for supporting efficient load-balancing in a high performance computing (hpc) environment
CN107925622A (zh) 用于在高性能计算环境中允许多个全局标识符(gid)子网前缀值同时用于传入分组处理的系统和方法
CN107005479B (zh) 软件定义网络sdn中数据转发的方法、设备和系统
CN101330411B (zh) 一种模拟大规模网络拓扑的方法和系统
CN108400922A (zh) 虚拟局域网络配置系统与方法及其计算机程序产品
Ho Traffic engineering techniques for data center networks.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant