CN114422419B - 网络设备连接方法及装置 - Google Patents

网络设备连接方法及装置 Download PDF

Info

Publication number
CN114422419B
CN114422419B CN202111553840.7A CN202111553840A CN114422419B CN 114422419 B CN114422419 B CN 114422419B CN 202111553840 A CN202111553840 A CN 202111553840A CN 114422419 B CN114422419 B CN 114422419B
Authority
CN
China
Prior art keywords
target
line
topology
switch
cross
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111553840.7A
Other languages
English (en)
Other versions
CN114422419A (zh
Inventor
任志晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202111553840.7A priority Critical patent/CN114422419B/zh
Publication of CN114422419A publication Critical patent/CN114422419A/zh
Application granted granted Critical
Publication of CN114422419B publication Critical patent/CN114422419B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/12Shortest path evaluation
    • H04L45/121Shortest path evaluation by minimising delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/12Shortest path evaluation
    • H04L45/122Shortest path evaluation by minimising distances, e.g. by selecting a route with minimum of number of hops
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/12Shortest path evaluation
    • H04L45/125Shortest path evaluation based on throughput or bandwidth

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本说明书实施例提供网络设备连接方法及装置,其中所述网络设备连接方法包括:接收目标处理设备发送的设备连接请求,其中,所述设备连接请求包括与所述目标处理设备连接的外部设备数量;基于所述外部设备数量确定目标交换机中的目标芯片组,并基于所述设备连接请求选取与所述目标芯片组连接的目标外部设备;在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路;基于所述目标拓扑线路,将所述目标处理设备与所述目标外部设备之间建立连接关系。

Description

网络设备连接方法及装置
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种网络设备连接方法。
背景技术
高速串行计算机总线标准(peripheral component interconnect express,PCIe)总线作为一种高速串行计算机扩展总线被广泛应用在诸多领域。在数据中心池化网络的演进下,需要将各个组件池化,包括存储池化、异构计算池化等池化需求的出现。目前,PCIe是当前系统中的默认互连总线协议,即在同一个服务器内的设备一般是通过PCIe和CPU互联的,但是PCIe协议一般用于服务器内部,基于当前的池化方法则无法对PCIe设备进行池化,也无法实现服务器内部的CPU能够与任意一个设备之间通过PCIe进行互联。
发明内容
有鉴于此,本说明书施例提供了一种网络设备连接方法。本说明书一个或者多个实施例同时涉及一种网络设备连接装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种网络设备连接方法,包括:
接收目标处理设备发送的设备连接请求,其中,所述设备连接请求包括与所述目标处理设备连接的外部设备数量;
基于所述外部设备数量确定目标交换机中的目标芯片组,并基于所述设备连接请求选取与所述目标芯片组连接的目标外部设备;
在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路;
基于所述目标拓扑线路,将所述目标处理设备与所述目标外部设备之间建立连接关系。
根据本说明书实施例的第二方面,提供了一种网络设备连接装置,包括:
请求接收模块,被配置为接收目标处理设备发送的设备连接请求,其中,所述设备连接请求包括与所述目标处理设备连接的外部设备数量;
设备选择模块,被配置为基于所述外部设备数量确定目标交换机中的目标芯片组,并基于所述设备连接请求选取与所述目标芯片组连接的目标外部设备;
线路选择模块,被配置为在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路;
线路连接模块,被配置为基于所述目标拓扑线路,将所述目标处理设备与所述目标外部设备之间建立连接关系。
根据本说明书实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,其中,所述处理器执行所述计算机可执行指令时实现所述网络设备连接方法的步骤。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现任意一项所述网络设备连接方法的步骤。
根据本说明书实施例的第五方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述网络设备连接方法的步骤。
本说明书一个实施例通过接收目标处理设备发送的设备连接请求,其中,所述设备连接请求包括与所述目标处理设备连接的外部设备数量;基于所述外部设备数量确定目标交换机中的目标芯片组,并基于所述设备连接请求选取与所述目标芯片组连接的目标外部设备;在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路;基于所述目标拓扑线路,将所述目标处理设备与所述目标外部设备之间建立连接关系。
具体的,通过确定与目标处理设备连接的外部设备的数量,进而确定目标交换机中的目标芯片组,并根据该目标芯片组选取外部设备,进而在预设线路拓扑图中确定出满足带宽条件的拓扑线路,不仅能够实现服务器内部的目标处理设备与任意一个外部设备之间实现相互连接,同时通过选择满足预设带宽条件的拓扑线路,也能保证设备之间尽可能使用带宽较大。
附图说明
图1是本说明书一个实施例提供的一种网络设备连接方法应用于网络设备连接系统的系统结构示意图;
图2是本说明书一个实施例提供的一种网络设备连接方法中设备互联拓扑架构图;
图3是本说明书一个实施例提供的一种网络设备连接方法的流程图;
图4是本说明书一个实施例提供的一种网络设备连接装置的结构示意图;
图5是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
PCI Express(PCIe):PCI扩展协议。
PCIe SW:支持PCIe交换能力的芯片。
Root Complex(RC):根复杂体,CPU/内存和PCIE子系统的接口。
Endpoint(EP):端点,可能是一个PF或者VF。
Physical Function(PF):PF包含SR-IOV功能的完整PCIe设备,PF作为普通的PCIe设备被发现、管理和配置。PF通过分配VF来配置和管理SR-IOV功能。
Virtual Function(VF):VF是轻量级PCIe功能(I/O处理)的PCIe设备,每个VF都是通过PF来生成管理的,一个PF的所有VF具有相同的类型,每个VF都具有一个PCI内存空间,用于映射其寄存器集。
Point to Point(p2p):在GPU场景下,EP(GPU)到EP(GPU)之间的数据拷贝。
Host to Device(h2d):在GPU场景下,Host(CPU)到Device(GPU)之间的数据拷贝。
Device to Host(d2h):在GPU场景下,Device(GPU)到Host(CPU)之间的数据拷贝。
在数据中心池化网络的演进下的,需要将各个组件池化,包括存储的池化、异构计算的池化等池化需求的出现。而目前PCIe是当前系统中的默认互连总线协议,即在同一个服务器内的设备一般是通过PCIe跟CPU互联的。但是PCIe协议一般用于服务器内部,按之前的池化思路无法进行PCIe设备的池化,基于此,本说明书实施例提出了一种PCIe交换网络方案,使用服务器外部的大型PCIe交换网络进行服务器间的通信。本说明书实施例提供的网络设备连接方法是基于外部设备大型PCIe交换网络架构设计的设备与设备间互联与带宽的可行性与优化方案。
在本说明书中,提供了一种网络设备连接方法,本说明书同时涉及一种网络设备连接装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,在下面的实施例中逐一进行详细说明。
图1示出了根据本说明书一个实施例提供的一种网络设备连接方法应用于网络设备连接系统的系统结构示意图。
需要说明的是,本说明书实施例提供的目标处理设备以目标CPU设备为例进行说明,但并不仅限于CPU设备。
图1中包括服务器内部CPU设备A、交换机B以及外部设备C,其中,外部设备C包括外部设备1、外部设备2以及外部设备3。具体实施时,服务器内部的CPU设备可以通过PCIe交换网络架构,基于交换机连接外部设备,通过对交换机中的接口的选择,可以选择满足连接需求的外部设备,同时,通过在预先建立的线路拓扑图中,可选择出保证设备之间的可用带宽尽可能大地实现数据传输的拓扑线路。实际应用中,交换机B可以为单设备交换机,也可以为双设备交换机,在确定单设备交换机中所连接的外部设备无法满足当前外部设备数量连接需求的情况下,可通过跨交换机选择对应的外部设备,实现网络设备连接,其中,双设备交换机之间具有横联线实现连接。
本说明书实施例提供的网络设备连接方法,通过交换机可实现CPU设备与任意一个外部设备实现通信连接,同时基于预先建立的线路拓扑图通过拓扑线路的选择,以实现设备之间的线路中可用带宽尽可能地较大,实现线路中负载均衡的目的。
需要说明的是,本说明书实施例提供的网络设备连接方法是基于预先建立的交换网络架构,实现设备与设备之间互联,以及连接带宽的可行性与优化方法。
参见图2,图2示出了本说明书实施例提供的网络设备连接方法中设备互联拓扑架构图。
图2预先建立的拓扑图中,有三种设备:1)机头CPU设备(图中为C0、C1、C2等);2)机尾EP设备(图中为G0、G1、G2等);3)交换机中的PCIe SW(图中为sw d0左、sw d1左、sw u0左、sw u1左等)其中,sw u左表示这个PCIe SW芯片是左边上层的PCIe SW,sw u右表示这个PCIe SW芯片是右边上层的PCIe SW,sw d左表示这个PCIe SW芯片是左边下层的PCIe SW,sw d右表示这个PCIe SW芯片是右边下层的PCIe SW。
需要说明的是,EP设备可以理解为区别于服务器内部的外部设备;图2中交换机以第一交换机以及第二交换机为例,进行说明,但在实际应用中,对于交换机设备的数量可根据具体的应用需求设置,在此不做具体限定。
此外,拓扑内的互联线均为PCIe延展线,其中,PCIe延展线具有方向区别,分为上行端口、下行端口,一个下行端口只能被分配到一个上行端口上,且所有线路的带宽均一样大。
基于此,本说明书实施例提供的网络设备连接方法在预先建立的交换网络机构中,能实现机头中CPU设备在任意情况下,都能连接至任意一个未被占用的机尾GPU设备,且在实现网络设备连接之后,尽量使得连接至一个外部设备之间的可用带宽尽可能大,其中,h2d带宽可以理解为CPU至GPU的带宽,p2p带宽可以理解为GPU至GPU的带宽。
参见图3,图3示出了本说明书一个实施例提供的一种网络设备连接方法的流程图,具体包括以下步骤。
需要说明的是,本说明书实施例提供的网络设备连接方法是基于预先建立的设备互联拓扑架构图,设备与设备之间互联方案以及连接带宽的可行性及优化方法。
步骤302:接收目标处理设备发送的设备连接请求,其中,所述设备连接请求包括与所述目标处理设备连接的外部设备数量。
实际应用中,服务器在实现CPU设备与外部设备互联之前,不仅可接收到需要互联的CPU设备,并将该CPU设备可作为目标处理设备,还可接收到与该目标处理设备所需连接的外部设备的数量;基于此,服务器接收到目标处理设备发送的设备连接请求,其中,该设备连接请求包括与目标处理设备连接的外部设备数量。
步骤304:基于所述外部设备数量确定目标交换机中的目标芯片组,并基于所述设备连接请求选取与所述目标芯片组连接的目标外部设备。
其中,目标芯片组可以理解为交换机中的与所选择的外部设备相连接的芯片组,比如,需要连接的外部设备为机尾0中的G0和G1,则第一交换机中的sw d0左为目标芯片组。
目标外部设备可以理解为与目标芯片组相连接的外部设备,或者是确定与目标处理设备连接的外部设备。
实际应用中,服务器根据外部设备数量确定目标交换机中的目标芯片组,并基于接收到的设备连接请求选择与该目标芯片组所连接的目标外部设备,以实现目标处理设备与目标外部设备相连接。
需要说明的是,对于目标外部设备的选择方法可分为两种方案,第一种为单设备路由方案,即仅具有单个交换机的设备选择,第二种为双设备路由方案,即具有两个交换机的设备选择。
在单设备路由方案中,为了实现对目标外部设备的选择,可通过外部设备数量确定与交换机中的目标芯片组相连的芯片组的个数,进而确定出目标芯片组;具体的,所述基于所述外部设备数量确定目标交换机中的目标芯片组,包括:
基于所述外部设备数量在第一目标交换机中确定待分配芯片组的数量,并基于所述待分配芯片组的数量按照预设分配顺序为所述目标处理设备分配待分配芯片组;
将所述待分配芯片组作为所述第一目标交换机的目标芯片组。
其中,第一目标交换机可以理解为单设备路由方案中的单个交换机;待分配芯片组可以理解为该单个交换机中当前可用待分配的芯片组,也可以理解为还未被其他线路占用的芯片组,可以通过该芯片组连接外部设备的芯片组。
实际应用中,服务器可根据外部设备数量在第一目标交换机中确定可用的待分配芯片组的数量,并根据待分配芯片组的数量按照预设分配顺序,为目标处理设备分配待分配芯片组,比如,在确定外部设备数量为3时,确定待分配芯片组数量的方法可以为“外部设备数量/2,并向下取整”,即3/2并向下取整后为1,则确定待分配芯片组数量为1;即按照分配顺序将第一目标交换机中顺序确定的一个待分配芯片组作为目标芯片组。
本说明书实施例提供的网络设备连接方法,基于外部设备数量在第一目标交换机中确定待分配芯片组数量,并基于待分配芯片组数量在第一目标交换机中按照分配顺序确定待分配芯片组,进而确定目标芯片组,便于后续通过目标芯片组选择对应的外部设备。
在第一目标交换机中确定目标芯片组之后,可在目标芯片组中空闲的外部设备中选取目标外部设备;具体的,所述基于所述设备连接请求选取与所述目标芯片组连接的目标外部设备,包括:
基于所述设备连接请求在所述第一目标交换机的目标芯片组中确定待连接外部设备;
在所述待连接外部设备中选取与所述外部设备数量相同的外部设备,作为第一目标交换机中的目标外部设备。
实际应用中,第一目标交换机中的目标芯片组所连接的外部设备中,可能存在被占用的情况,因此需要先确定第一目标交换机的目标芯片组中的待连接外部设备,在待连接外部设备中选取与外部设备数量相同的外部设备,作为第一目标交换机中的目标外部设备。比如,在第一目标交换机中确定的目标芯片组为两个,那么在上述设备互联拓扑图中可确定两个目标芯片组对应的外部设备有4个,分别为G0、G1、G2、G3,则可确定待连接外部设备为为G0、G1、G2、G3,在确定外部设备数量为3时,在G0、G1、G2、G3设备中选取3个外部设备,作为第一目标交换机中的目标外部设备。
本说明书实施例提供的网络设备连接方法,通过在目标芯片组中确定待连接外部设备,则可在待连接外部设备中进一步选择与外部设备数量相同的外部设备,能够保证交换机中的芯片组最大化地利用。
进一步地,还有一种例外情况,若在目标芯片组的待连接外部设备中,剩余可用的外部设备数量无法满足外部设备数量时,不仅可选择目标芯片组中的外部设备,还可选择当前交换机中的其他剩余的目标芯片组,进而连接其他目标芯片组所连接的外部设备;具体的,所述基于所述设备连接请求在所述第一目标交换机的目标芯片组中确定待连接外部设备之后,还包括:
在确定所述待连接外部设备的数量小于所述外部设备数量的情况下,选取所述第一目标交换机的目标芯片组以外的芯片组作为备选芯片组;
确定与所述备选芯片组连接的备选外部设备,并将所述备选外部设备以及所述待连接外部设备作为第一目标交换机中的目标外部设备。
其中,备选芯片组可以理解为交换机中与目标芯片组不同的剩余可用的芯片组,比如,在确定第一目标交换机中的目标芯片组为sw d0、sw d1,那么备选芯片组可以为swd2和/或sw d3。
实际应用中,在第一目标交换机中待连接外部设备的数量无法满足外部设备数量的分配时,可选取第一目标交换机的目标芯片组以外的芯片组作为备选芯片组,并确定备选芯片组的备选外部设备,进而,可将备选外部设备与目标芯片组对应的待连接外部设备一起作为第一目标交换机选取的目标外部设备。
需要说明的是,单设备路由方案中外部设备分配过程为,通过输入的“需要EP个数”,确定剩余的EP是否满足需求,并确定需要使用到的sw d组的个数,计算方式为EP个数/2并向下取整,分配剩余sw d组,以满足需求的sw d组的个数,分配剩余的EP,若无法完全满足sw d组个数时,则直接顺序分配EP即可,若满足sw d组个数,并且剩余EP需要分配(一定剩余一个EP需要分配),此时若之前有sw d组下有已经分配了一个EP的,就分配此EP,若无,则顺序分配。
例如,情况1:第一目标交换机中目标芯片组中的外部设备无占用,若需要3个外部设备,计算可得需要一个sw d组,和一个独立的EP,则可分配G0、G1、G2;情况2:之前已经占用G0,若需要3个外部设备,则顺序分配G1、G2、G3;情况3:之前占用了G0、G2、G4、G6,若需要3个外部设备,则可分配G1、G3、G5。
步骤306:在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路。
其中,预设线路拓扑图可以理解为本说明书实施例提供的设备互联拓扑图,该拓扑图可提供CPU与交换机之间的线路、交换机自身之间的线路、交换机与交换机之间的线路、交换机中的芯片组与外部设备之间的线路。
实际应用中,服务器可在预设线路拓扑图中选择出目标处理设备与目标外部设备之间,满足带宽条件的目标拓扑线路,在保证与所连接的外部设备的数量满足预设外部设备数量时,也能使得设备之间的线路中可用的带宽尽可能较大,保证线路不拥挤,各条线路之间满足负载均衡的原则。
进一步地,在确定目标外部设备之后,可确定与目标外部设备相连的线路中,使用时延、跳数较少或者带宽负载较小的拓扑线路,作为目标拓扑线路,实现设备与设备之间的建立连接关系;具体的,所述在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路,包括:
在预设线路拓扑图中,确定与所述目标处理设备相连接的第一目标交换机中的初始芯片组,将所述目标处理设备与所述初始芯片组相连接的拓扑线路确定为第一拓扑线路;
在预设线路拓扑图中,将所述第一目标交换机中确定的所述目标芯片组与所述初始芯片组相连接的拓扑线路确定为第二拓扑线路;
在预设线路拓扑图中,将所述目标芯片组与所述目标外部设备相连的拓扑线路确定为第三拓扑线路;
在确定所述第一拓扑线路、所述第二拓扑线路以及所述第三拓扑线路满足预设带宽条件的情况下,基于所述第一拓扑线路、所述第二拓扑线路以及所述第三拓扑线路确定所述目标处理设备的目标拓扑线路。
其中,初始芯片组可以理解为在第一目标交换机中与目标芯片组相连接的sw u层的芯片组。
需要说明的是,h2d的跳数可以理解为跨交换机跳数+2的跳数,p2p的跳数可以理解为EP1连接到公共PCIe sw的跳数+EP2连接到公共PCIe sw的跳数;h2d的带宽可以理解为被复用最多的链路的平均链路带宽,p2p的带宽可以理解为被复用最多的链路的平均链路带宽。
其中,第一拓扑线路可以理解为目标处理设备与第一目标交换机中sw u层之间的拓扑线路;第二拓扑线路可以理解为第一目标交换机中sw u层与sw d层之间的拓扑线路;第三拓扑线路可以理解为第一目标交换机中sw d层与外部设备之间的拓扑线路。
实际应用中,为了满足各个拓扑线路所负载的外部设备数量均衡,可在预设线路拓扑图中,选择第一拓扑线路、第二拓扑线路以及第三拓扑线路,并在确定第一拓扑线路、第二拓扑线路以及第三拓扑线路满足预设带宽条件的情况下,进而基于第一拓扑线路、第二拓扑线路以及第三拓扑线路确定出目标处理设备连接外部设备的目标拓扑线路。
本说明书实施例提供的网络设备连接方法,通过在第一目标交换机中确定目标芯片组,可在预设线路拓扑图中,选择出第一拓扑线路、第二拓扑线路以及第三拓扑线路,并在确定三条拓扑线路满足预设带宽条件时,可确定出最终目标处理设备与外部设备相连接的目标拓扑线路,便于后续基于目标拓扑线路建立目标处理设备与目标外部设备之间的连接关系。
步骤308:基于所述目标拓扑线路,将所述目标处理设备与所述目标外部设备之间建立连接关系。
实际应用中,在确定出目标处理设备与目标外部设备之间的目标拓扑线路之后,将目标处理设备与目标外部设备之间按照该目标拓扑线路建立连接关系,进而确定的目标拓扑线路的方法,无需关心中间PCIe sw间的互联链路,即可在此拓扑下获得满足要求的连接,即在任何前提下互联至任意的EP设备,同时,也无需关心中间PCIe sw间的互联链路,即可选择出最符合要求的EP设备。
此外,在双设备路由方案中,对于目标外部设备的选择以及拓扑线路的选择与上述单设备路由方案有所区别,但在实际应用中,先根据单设备路由方案分配外部设备的步骤进行本地交换机的外部设备的分配,不需要跨交换机进行分配,若需要分配的外部设备数量在单设备路由方案中无法实现时,即需要跨交换机进行外部设备分配;具体的,可参见下述针对双设备路由方案的描述。
在双设备路由方案需要跨交换机进行网络设备连接的情况下,可通过确定交换机之间的横联线,进而确定最终的目标芯片组;具体的,所述基于所述外部设备数量确定目标交换机中的目标芯片组,包括:
基于所述外部设备数量在所述第一目标交换机与第二目标交换机之间确定期望横联线数量;
基于所述期望横联线数量确定所述目标处理设备的目标横联线,并基于所述目标横联线确定所述第二目标交换机中的目标芯片组。
其中,期望横联线数量可以理解为在第一目标交换机与第二目标交换机之间所需使用到的横联线的数量。
目标横联线可以理解为在第一目标交换机与第二目标交换机之间所确定使用的横联线。
需要说明的是,机头0、机头1、机头2、机头3所连接到机尾2以及机尾3时所使用的横联线与机头4、机头5、机头6、机头7所连接待机尾0以及机尾1时所使用的横联线不同,例如,从左侧的CPU设备连接到右侧的EP设备时,左边连接右边的横联线可以为sw u0左--swu0右;sw u2左--sw u2右;sw d0左--sw d0右;sw d2左--sw d2右,其中,每个目标CPU设备最多借用3根横联线,相反,从右侧的CPU设备连接到左侧的EP设备时,横联线可参考上述方式推导得知。
实际应用中,服务器可根据外部设备数量在第一目标交换机与第二目标交换机之间确定期望横联线数量,其中,具体的计算方式可以为(需要跨ISW使用的EP数量)/2,并向下取整,若大于三根按三根计算;并根据期望横联线数量确定目标CPU设备的目标横联线,最后再根据目标横联线确定第二交换机中的目标芯片组。
本说明书实施例提供的设备选择方法,通过外部设备数量在第一目标交换机与第二目标交换机之间确定期望横联线数量,进而在第一目标交换机与第二目标交换机之间确定目标横联线,以实现确定目标芯片组,便于后续基于目标芯片组选择目标外部设备。
进一步地,在第一目标交换机与第二目标交换机之间确定的目标横联线可能有两种情况,第一种情况是考虑使用第一目标交换机与第二目标交换机之间的sw d层横联线;第二种情况是考虑使用第一目标交换机与第二目标交换机之间的sw u层横联线;根据不同的类型的横联线对于后续的外部设备的选择、拓扑线路的选择均不同;具体的,所述基于所述期望横联线数量确定所述目标CPU设备的目标横联线,包括:
基于所述期望横联线数量在所述第一目标交换机以及所述第二目标交换机之间,确定与所述期望横联线数量相同的第一目标横联线,将所述第一目标横联线作为所述目标处理设备的目标横联线。
其中,第一目标横联线可以理解为第一目标交换机与第二目标交换机之间的sw d层横联线。需要说明的是,在双设备路由方案中,优先考虑sw d层横联线,实现网络设备连接,在sw d层横联线无法实现网络设备连接时,再考虑sw u层的横联线。
实际应用中,在服务器确定期望横联线数量之后,可在第一目标交换机与第二目标交换机之间确定与期望横联线数量相同的第一目标横联线,并将该第一目标横联线作为目标处理设备与外部设备连接时,中间跨交换机连接的目标横联线。比如,确定的期望横联线数量为1条,那么可先确定第一目标交换机与第二目标交换机之间的sw d层的横联线中是否有1条横联线可使用,若有可用的sw d层的横联线,则可将1条sw d层的横联线作为目标处理设备与外部设备连接的目标横联线。
本说明书实施例提供的设备选择方法,基于期望横联线数量确定第一目标横联线,便于后续基于第一目标横联线,快速地确定可用的外部设备,以实现目标处理设备与外部设备之间建立连接关系。
在使用sw d层横联线之后,若无法按期望横联线数量连接到需求数量的情况下,则可使用sw u层横联线确定目标横联线;具体的,所述基于所述期望横联线数量确定所述目标处理设备的目标横联线,包括:
在确定所述第一目标横联线连接的目标外部设备的数量不满足所述外部设备数量的情况下,在所述第一目标交换机以及所述第二目标交换机之间确定第二目标横联线;
将所述第二目标横联线作为所述目标处理设备的目标横联线。
其中,第二目标横联线可以理解为第一目标交换机与第二目标交换机之间的sw u层横联线。
实际应用中,使用sw d层横联线时,若无法按期望横联线根数连接到需求的外部设备时,可使用sw u层横联线,因为在sw u层横联线下所能负载的外部设备的数量比sw d层所直接连接的外部设备的数量多,进而可满足连接到外部设备的数量。在确定可用的第一目标横联线的数量不满足期望横联线数量的情况下,可在第一目标交换机以及第二目标交换机之间确定第二目标横联线,并将该第二目标横联线作为目标处理设备的目标横联线。
本说明书实施例提供的网络设备连接方法,在确定sw d层的横联线无法满足连接到期望的外部设备数量的情况下,可考虑使用sw u层的横联线,作为目标横联线,通过sw u层横联线能够负载更多的外部设备,以实现能够连接的外部设备数量更多,进而满足期望连接的外部设备数量。
更进一步地,所述将所述第二目标横联线作为所述目标处理设备的目标横联线之后,还包括:
在确定所述第二目标横联线无法使用的情况下,将所述第一目标交换机以及所述第二目标交换机之间除所述第一目标横联线以外的其他第一目标横联线,作为所述目标处理设备的目标横联线。
实际应用中,服务器在确定sw u层的横联线被其他CPU设备连接的情况所占用时,则无法使用sw u层的横联线,那么可考虑第一目标交换机以及第二目标交换机之间除了第一目标横联线以外的其他第一目标横联线,即sw d层横联线;并将后续确定的sw d层横联线作为目标处理设备的目标横联线。
本说明书实施例提供的网络设备连接方法,在确定sw u层的横联线无法使用时,还可考虑使用sw d层的其他横联线,实现对外部设备的选择,能够保证选择的外部设备的数量满足预先输入的外部设备数量。
基于目标横联线确定出第二目标交换机的目标芯片组之后,可基于该目标芯片组中确定待连接外部设备,进而选择出与外部设备数量相同的外部设备;具体的,所述基于所述设备连接请求选取与所述目标芯片组连接的目标外部设备,包括:
基于所述设备连接请求在所述第二目标交换机的目标芯片组中确定待连接外部设备;
在所述待连接外部设备中选取与所述外部设备数量相同的外部设备,作为第二目标交换机中的目标外部设备。
实际应用中,服务器还可基于设备连接请求在第二目标交换机中,确定与目标芯片组相连接的待连接外部设备,且在该待连接外部设备中选取与预先需求的外部设备数量相同的外部设备,作为第二目标交换机中的目标外部设备。需要说明的是,选择外部设备的原则,尽可能地先选择已经被占用sw d的芯片组下的外部设备,进而再选择空闲的sw d芯片组下的外部设备。
本说明书实施例提供的网络设备连接方法,通过在确定的目标芯片组中确定待连接外部设备,再从待连接外部设备中选取与所需数量的外部设备,进而能够快速地实现满足预先外部设备数量的设备选择。
进一步地,在确定的目标横联线不同的情况下,所确定的目标处理设备与外部设备之间的拓扑线路有所不同;具体的,所述在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路,包括:
在预设线路拓扑图中,确定与所述目标处理设备相连接的第一目标交换机中的初始芯片组,将所述目标处理设备与所述初始芯片组相连接的拓扑线路确定为第四拓扑线路;
在预设线路拓扑图中,将所述第一目标交换机中确定的所述目标芯片组与所述初始芯片组相连接的拓扑线路确定为第五拓扑线路;
在预设线路拓扑图中,在确定所述目标横联线为第一目标横联线的情况下,将所述第一目标横联线确定为第六拓扑线路;
在预设线路拓扑图中,将所述目标芯片组与所述目标外部设备相连接的拓扑线路确定为第七拓扑线路;
在确定所述第四拓扑线路、所述第五拓扑线路、所述第六拓扑线路以及所述第七拓扑线路满足预设带宽条件的情况下,基于所述第四拓扑线路、所述第五拓扑线路、所述第六拓扑线路以及所述第七拓扑线路确定所述目标处理设备的目标拓扑线路。
实际应用中,在确定目标横联线为第一目标横联线的情况下,即为sw d层横联线时,目标处理设备与外部设备之间的拓扑线路可由四条线路确定,其中,目标处理设备与第一目标交换机中的初始芯片组所连接的拓扑线路为第四拓扑线路,第一目标交换机中确定的初始芯片组与目标芯片组相连接的拓扑线路为第五拓扑线路,第一交换机与第二交换机之间相连接的拓扑线路为第六拓扑线路,最后,将第二目标交换机中的目标芯片组与目标外部设备相连接的拓扑线路为第七拓扑线路,进而,在确定第四拓扑线路、第五拓扑线路、第六拓扑线路以及第七拓扑线路满足预设带宽条件的情况下,可基于第四拓扑线路、第五拓扑线路、第六拓扑线路以及第七拓扑线路组成的拓扑线路确定为目标处理设备的目标拓扑线路。
本说明书实施例提供的网络设备连接方法,通过在预设线路拓扑图中,选择满足预设带宽条件的拓扑线路在,作为目标拓扑线路,便于后续基于确定的目标拓扑线路实现目标处理设备与外部设备之间的连接。
此外,在确定的目标横联线为sw u层横联线时,在预设线路拓扑图中确定的拓扑线路与目标横联线为sw d层横联线确定的拓扑线路有所不同;具体的,所述在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路,包括:
在预设线路拓扑图中,确定与所述目标处理设备相连接的第一目标交换机中的第一初始芯片组,将所述目标处理设备与所述第一初始芯片组相连接的拓扑线路确定为第四拓扑线路;
在预设线路拓扑图中,在确定所述目标横联线为第二目标横联线的情况下,将所述第一目标横联线确定为第五拓扑线路;
在预设线路拓扑图中,基于所述第二目标横联线在所述第二目标交换机中确定第二初始芯片组,将所述第二目标交换机中确定的所述目标芯片组与所述第二初始芯片组相连接的拓扑线路确定为第六拓扑线路;
在预设线路拓扑图中,将所述目标芯片组与所述目标外部设备相连接的拓扑线路确定为第七拓扑线路;
在确定所述第四拓扑线路、所述第五拓扑线路、所述第六拓扑线路以及所述第七拓扑线路满足预设带宽条件的情况下,基于所述第四拓扑线路、所述第五拓扑线路、所述第六拓扑线路以及所述第七拓扑线路确定所述目标处理设备的目标拓扑线路。
其中,第一初始芯片组可以理解为第一目标交换机中的sw u层芯片组,第二初始芯片组可以理解为第二目标交换机中的sw u层芯片组。
实际应用中,在确定目标横联线为sw u层横联线时,目标处理设备与外部设备之间的拓扑线路可由四条拓扑线路确定,其中,目标处理设备与第一目标交换机中的第一初始芯片组所连接的拓扑线路为第四拓扑线路,第一目标交换机与第二目标交换机之间的横联线的拓扑线路为第五拓扑线路,第二目标交换机中的第二初始芯片组与第二目标交换机中的目标芯片组相连接的拓扑线路为第六拓扑线路,第二目标交换机的目标芯片组与外部设备相连接的拓扑线路为第七拓扑线路;进而,在确定第四拓扑线路、第五拓扑线路、第六拓扑线路以及第七拓扑线路满足预设带宽条件的情况下,可基于第四拓扑线路、第五拓扑线路、第六拓扑线路以及第七拓扑线路组成的拓扑线路确定为目标处理设备的目标拓扑线路。
本说明书实施例提供的网络设备连接方法,通过在预设线路拓扑图中,选择满足预设带宽条件的拓扑线路在,作为目标拓扑线路,便于后续基于确定的目标拓扑线路实现目标处理设备与外部设备之间的连接。
综上,本说明书实施例提供的网络设备连接方法,通过确定外部设备数量,在目标交换机中确定可用的目标芯片组,进而可在目标芯片组所连接的外部设备中选择目标外部设备,最后可在预设线路拓扑图中的多条连接线路中选择出满足预设带宽条件的目标拓扑线路,能够实现各个线路中负载的外部设备数量均衡,进而基于目标拓扑线路实现服务器内部的CPU设备可任意连接与交换机接口相连接的外部设备,使得服务器无需关心中间PCIeSW间的互联链路,即可在预先建立的线路拓扑图下获得满足要求的连接,即在任何前提下互联至任意的EP设备;同时也无需关心中间PCIeSW间的互联链路,即可选择出最符合要求的EP设备。
进一步,基于跳数选择EP方案的原则为:减少h2d的跳数,减少EP的所跨ISW(交换机芯片组)的数量;为减少P2P的跳数,尽量使得EP的分布在尽可能少的sw d上;为减少P2P的跳数,跨交换机芯片组的EP,尽量使用sw d到sw d的连线。基于带宽的EP选择方案的原则为:单机情况下不会出现带宽不足的情况;单机情况下,考虑P2P带宽情况下,尽量使得EP分布在尽可能少的sw d上;跨ISW情况下,对端本地分配时,建议对于与跨ISW连接的sw u连接RC,尽量不要分配已被对端占用的EP对应的sw d层交换机下的剩余的EP超过分配的一半向上取整;跨ISW情况下,除了上面这类情况,带宽瓶颈都在中间线路,这个问题需要减少跨ISW分配EP的方式来解决。
单设备路由方案中,拓扑有如下特点:1.RC出两根线,建议全部使用以扩展带宽;2.sw-u层PCIeSW,上联4端口,下联4端口,收敛比1:1;3.sw-u层到sw-d层设备fullmesh连接;4.sw-d层PCIeSW,上联4端口,下联2端口,收敛比2:1。基于此,在这个拓扑环境下,使用RC出的两根线,到达n个EP设备,可以实现理论最大收敛比2:n;即可以实现在任何已经连接的环境下,可以实现任何CPU连接到任意EP设备。
进一步地,此时已知分配的EP位置,则单ISW连线步骤:1.RC至sw-u层,分配全部两根线路;2.sw-d层至EP,根据使用EP,分配sw-d至EP的线路;3.sw-u层至sw-d层:3.1若sw-d组分配了两个EP,则使用两个sw-u分别连接一根线至该sw-d;3.2若sw-d组分配了一个EP,则均匀的分配到两个sw-u上。
例如,情况1:分配G0,连线情况:C0--sw-u0--sw-d0--G0,C0--sw-u1;情况2:分配G0,G1,连线情况:C0--sw-u0--sw-d0--G0,C0--sw-u1--sw-d0--G1;情况3:分配G0-G3,连线情况:C0--sw-u0--sw-d0--G0,C0--sw-u1--sw-d0--G1,C0--sw-u0--sw-d1--G2,C0--sw-u1--sw-d1--G3。
双设备路由方案中,与单设备路由方案的不同点在于:1)中间互联线较少,所以在尽量减少性能损失的情况下使用尽量少的线实现所需互联;2)使用sw u层PCIe sw连接到对端后,可以连接所有的对端GPU;3)使用sw d层PCIe sw连接到对端后,若希望经过三跳PCIe sw设备连接到GPU,则只能连接到单独一个sw d层PCIe sw下的GPU。基于此,双设备间的互联线有如下原则:1)由于sw u层互联线路可以连接到所有的GPU,所以在分配GPU时,连线是优先分配sw d层互联线路;2)剩余的GPU使用sw u层互联线连接;其中,使用数量原则:现有互联线与下联GPU之间的比值为2:1,所以单RC当跨ISW互联的GPU数量为m,则使用m/2根连线。
进一步地,在使用双设备路由之间互联线时,对CPU设备RC本地拓扑互联影响:1)若使用sw u层互联线路,sw u互联的PCIe sw上,没有占用下联端口,此时不会对本地其他连接有影响;2)若使用sw d层互联线路,sw d互联的PCIe sw上,没有占用下联端口,此时不会对本地有影响。在使用双设备路由之间互联线时,对CPU设备RC对端拓扑互联影响:1)若使用sw u层互联线路,sw u互联的PCIe sw上,此时必定占用2个以上的下联口,此sw u层PCIe sw的上下联口的数量就不是1:1了,此时部分连接无法实现跟单机一样端到端收敛比,这个问题可以在控制器上分配GPU时加以调整;若使用sw d层互联线路,上下行收敛比为5:2,所以收敛比变优了,此时也不会对本地造成影响。
更进一步地,在双设备路由方案中,外部设备分配的步骤,可先根据单设备EP分配步骤进行本地交换机内的EP分配,即不需要跨交换机进行分配;此时优先分配不会被对方通过sw d横联线借用到的sw d组;若需要的EP个数,在上一步无法分配完,即需要跨交换机分配EP;第一步:确认使用的横联线:具体的,确认期望横联线数量:(需要跨交换机使用的EP数量)/2,并向下取整,若大于三根按三根计算;从剩余的sw d层横连线开始分配;若无法按期望横联根数连接到需求数量,则使用sw u层横连线;若sw u层横联线无法使用,尝试使用其他的sw d层互联线进行分配;跨交换机分配EP后,进行本地分配:此外,特殊情况为:跨交换机使用sw u层连接,并占用G0,G2,G4,本地占用G6,此时需要从非sw u横联线下联到的sw d上优先选择EP。
例如,情况1:需要分配对端1个EP,横联线之前无占用,对端EP之前无占用,使用"sw-d0左--sw-d0右"横联线,分配对端G0。
情况2:需要分配对端3个EP,横联线之前无占用,对端EP之前无占用,使用"sw-u0左--sw-u0右"横联线,分配对端G0-G2。
情况3:需要分配对端3个EP,横联线之前占用"sw-u0左--sw-u0右",对端EP之前占用G2,G3,G6,使用"sw-d0左--sw-d0右","sw-d2左--sw-d2右"横联线,分配对端G0,G1,G4。
情况4:之前占用横联线"sw-u0左--sw-u0右",占用G0,G2,G4,本地占用G6,需要本地分配2个:分配G1,G7。
进而,在已知确定好的目标横联线之后,若使用了sw d层横连线:此次连接本地连线特殊操作为将借用的EP加上本地sw d上分配的EP数量>=2,使用两个sw u分别连接一根线至该sw d,并平均分配EP至这两根线上;针对此次连接对端连线特殊操作:无;针对此次连接之后对端本地连接特殊操作:无;针对此次连接之后对端借用本地连接特殊操作:无。
若使用了sw u层横连线:针对此次连接本地连线特殊操作:无;针对此次连接对端连线特殊操作:无;针对此次连接之后对端本地连接特殊操作:由于借用之后部分sw u至swd连线被占用,在平均分配sw u至sw d连线时,另一个sw u优先分配被横联线占用的sw d连线;针对此次连接之后对端借用本地连接特殊操作:无。
例如,情况1:分配G0,G1,对端G0,G1,连线情况:C0--sw-u0--sw-d0--G0,C0--sw-u0--sw-d0--G1,C0--sw-u1左--sw-d0左--sw-d0右--G0,C0--sw-u1左--sw-d0左--sw-d0右--G1右。
情况2:之前使用横联线"sw-u0左--sw-u0右",已分配G0,G2,G6,G7右,现在C0右,分配G1,G3-G5,连线情况:C0--sw-u1--sw-d0--G1,C0--sw-u1--sw-d1--G3,C0--sw-u0--sw-d2--G4,C0--sw-u0--sw-d2--G5。
本说明书实施例提供的网络设备连接方法,通过一种新型拓扑下的路由方案,使得无需关心中间PCIe sw间的互联链路,即可在此拓扑下获得满足要求的连接,即在任何前提下互联至任意的EP设备;同时也无需关心中间PCIe sw间的互联链路,即可选择出最符合要求的EP设备。
与上述方法实施例相对应,本说明书还提供了对象处理装置实施例,图4示出了本说明书一个实施例提供的一种网络设备连接装置的结构示意图。如图4所示,该装置包括:
请求接收模块402,被配置为接收目标处理设备发送的设备连接请求,其中,所述设备连接请求包括与所述目标处理设备连接的外部设备数量;
设备选择模块404,被配置为基于所述外部设备数量确定目标交换机中的目标芯片组,并基于所述设备连接请求选取与所述目标芯片组连接的目标外部设备;
线路选择模块406,被配置为在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路;
线路连接模块408,被配置为基于所述目标拓扑线路,将所述目标处理设备与所述目标外部设备之间建立连接关系。
可选地,所述设备选择模块404,进一步被配置为:
基于所述外部设备数量在第一目标交换机中确定待分配芯片组的数量,并基于所述待分配芯片组的数量按照预设分配顺序为所述目标处理设备分配待分配芯片组;
将所述待分配芯片组作为所述第一目标交换机的目标芯片组;或者
基于所述外部设备数量在所述第一目标交换机与第二目标交换机之间确定期望横联线数量;
基于所述期望横联线数量确定所述目标处理设备的目标横联线,并基于所述目标横联线确定所述第二目标交换机中的目标芯片组。
可选地,所述设备选择模块404,进一步被配置为:
基于所述设备连接请求在所述第一目标交换机的目标芯片组中确定待连接外部设备;
在所述待连接外部设备中选取与所述外部设备数量相同的外部设备,作为第一目标交换机中的目标外部设备。
可选地,所述设备选择模块404,进一步被配置为:
在确定所述待连接外部设备的数量小于所述外部设备数量的情况下,选取所述第一目标交换机的目标芯片组以外的芯片组作为备选芯片组;
确定与所述备选芯片组连接的备选外部设备,并将所述备选外部设备以及所述待连接外部设备作为第一目标交换机中的目标外部设备。
可选地,所述线路选择模块406,进一步被配置为:
在预设线路拓扑图中,确定与所述目标处理设备相连接的第一目标交换机中的初始芯片组,将所述目标处理设备与所述初始芯片组相连接的拓扑线路确定为第一拓扑线路;
在预设线路拓扑图中,将所述第一目标交换机中确定的所述目标芯片组与所述初始芯片组相连接的拓扑线路确定为第二拓扑线路;
在预设线路拓扑图中,将所述目标芯片组与所述目标外部设备相连的拓扑线路确定为第三拓扑线路;
在确定所述第一拓扑线路、所述第二拓扑线路以及所述第三拓扑线路满足预设带宽条件的情况下,基于所述第一拓扑线路、所述第二拓扑线路以及所述第三拓扑线路确定所述目标处理设备的目标拓扑线路。
可选地,所述线路选择模块406,进一步被配置为:
基于所述期望横联线数量在所述第一目标交换机以及所述第二目标交换机之间,确定与所述期望横联线数量相同的第一目标横联线,将所述第一目标横联线作为所述目标处理设备的目标横联线。
可选地,所述线路选择模块406,进一步被配置为:
在确定所述第一目标横联线连接的目标外部设备的数量不满足所述外部设备数量的情况下,在所述第一目标交换机以及所述第二目标交换机之间确定第二目标横联线;
将所述第二目标横联线作为所述目标处理设备的目标横联线。
可选地,所述线路选择模块406,进一步被配置为:
在确定所述第二目标横联线无法使用的情况下,将所述第一目标交换机以及所述第二目标交换机之间除所述第一目标横联线以外的其他第一目标横联线,作为所述目标处理设备的目标横联线。
可选地,所述设备选择模块404,进一步被配置为:
基于所述设备连接请求在所述第二目标交换机的目标芯片组中确定待连接外部设备;
在所述待连接外部设备中选取与所述外部设备数量相同的外部设备,作为第二目标交换机中的目标外部设备。
可选地,所述线路选择模块406,进一步被配置为:
在预设线路拓扑图中,确定与所述目标处理设备相连接的第一目标交换机中的初始芯片组,将所述目标处理设备与所述初始芯片组相连接的拓扑线路确定为第四拓扑线路;
在预设线路拓扑图中,将所述第一目标交换机中确定的所述目标芯片组与所述初始芯片组相连接的拓扑线路确定为第五拓扑线路;
在预设线路拓扑图中,在确定所述目标横联线为第一目标横联线的情况下,将所述第一目标横联线确定为第六拓扑线路;
在预设线路拓扑图中,将所述目标芯片组与所述目标外部设备相连接的拓扑线路确定为第七拓扑线路;
在确定所述第四拓扑线路、所述第五拓扑线路、所述第六拓扑线路以及所述第七拓扑线路满足预设带宽条件的情况下,基于所述第四拓扑线路、所述第五拓扑线路、所述第六拓扑线路以及所述第七拓扑线路确定所述目标处理设备的目标拓扑线路。
可选地,所述线路选择模块406,进一步被配置为:
在预设线路拓扑图中,确定与所述目标处理设备相连接的第一目标交换机中的第一初始芯片组,将所述目标处理设备与所述第一初始芯片组相连接的拓扑线路确定为第四拓扑线路;
在预设线路拓扑图中,在确定所述目标横联线为第二目标横联线的情况下,将所述第一目标横联线确定为第五拓扑线路;
在预设线路拓扑图中,基于所述第二目标横联线在所述第二目标交换机中确定第二初始芯片组,将所述第二目标交换机中确定的所述目标芯片组与所述第二初始芯片组相连接的拓扑线路确定为第六拓扑线路;
在预设线路拓扑图中,将所述目标芯片组与所述目标外部设备相连接的拓扑线路确定为第七拓扑线路;
在确定所述第四拓扑线路、所述第五拓扑线路、所述第六拓扑线路以及所述第七拓扑线路满足预设带宽条件的情况下,基于所述第四拓扑线路、所述第五拓扑线路、所述第六拓扑线路以及所述第七拓扑线路确定所述目标处理设备的目标拓扑线路。
本说明书提供的网络设备连接装置,通过确定与目标处理设备连接的外部设备的数量,进而确定目标交换机中的目标芯片组,并根据该目标芯片组选取外部设备,进而在预设线路拓扑图中确定出满足带宽条件的拓扑线路,不仅能够实现服务器内部的目标处理设备与任意一个外部设备之间实现相互连接,同时通过选择满足预设带宽条件的拓扑线路,也能保证设备之间尽可能使用带宽较大。
上述为本实施例的一种网络设备连接装置的示意性方案。需要说明的是,该网络设备连接装置的技术方案与上述的网络设备连接方法的技术方案属于同一构思,网络设备连接装置的技术方案未详细描述的细节内容,均可以参见上述网络设备连接方法的技术方案的描述。
图5示出了根据本说明书一个实施例提供的一种计算设备500的结构框图。该计算设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接,数据库550用于保存数据。
计算设备500还包括接入设备540,接入设备540使得计算设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备500的上述部件以及图5中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图5所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备500可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备500还可以是移动式或静止式的服务器。
其中,处理器520用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述网络设备连接方法的步骤。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的对象处理方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述网络设备连接方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述网络设备连接方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的网络设备连接方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述网络设备连接方法的技术方案的描述。
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述网络设备连接方法的步骤。
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的网络设备连接方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述网络设备连接方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims (14)

1.一种网络设备连接方法,包括:
接收目标处理设备发送的设备连接请求,其中,所述设备连接请求包括与所述目标处理设备连接的外部设备数量;
基于所述外部设备数量确定目标交换机中的目标芯片组,并基于所述设备连接请求选取与所述目标芯片组连接的目标外部设备;
在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路,其中,所述预设线路拓扑图包括CPU与交换机之间的线路、交换机与交换机之间的线路、交换机中的芯片组与外部设备之间的线路;
基于所述目标拓扑线路,将所述目标处理设备与所述目标外部设备之间建立连接关系。
2.根据权利要求1所述的网络设备连接方法,所述基于所述外部设备数量确定目标交换机中的目标芯片组,包括:
基于所述外部设备数量在第一目标交换机中确定待分配芯片组的数量,并基于所述待分配芯片组的数量按照预设分配顺序为所述目标处理设备分配待分配芯片组;
将所述待分配芯片组作为所述第一目标交换机的目标芯片组;或者
基于所述外部设备数量在所述第一目标交换机与第二目标交换机之间确定期望横联线数量;
基于所述期望横联线数量确定所述目标处理设备的目标横联线,并基于所述目标横联线确定所述第二目标交换机中的目标芯片组。
3.根据权利要求2所述的网络设备连接方法,所述基于所述设备连接请求选取与所述目标芯片组连接的目标外部设备,包括:
基于所述设备连接请求在所述第一目标交换机的目标芯片组中确定待连接外部设备;
在所述待连接外部设备中选取与所述外部设备数量相同的外部设备,作为第一目标交换机中的目标外部设备。
4.根据权利要求3所述的网络设备连接方法,所述基于所述设备连接请求在所述第一目标交换机的目标芯片组中确定待连接外部设备之后,还包括:
在确定所述待连接外部设备的数量小于所述外部设备数量的情况下,选取所述第一目标交换机的目标芯片组以外的芯片组作为备选芯片组;
确定与所述备选芯片组连接的备选外部设备,并将所述备选外部设备以及所述待连接外部设备作为第一目标交换机中的目标外部设备。
5.根据权利要求4所述的网络设备连接方法,所述在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路,包括:
在预设线路拓扑图中,确定与所述目标处理设备相连接的第一目标交换机中的初始芯片组,将所述目标处理设备与所述初始芯片组相连接的拓扑线路确定为第一拓扑线路;
在预设线路拓扑图中,将所述第一目标交换机中确定的所述目标芯片组与所述初始芯片组相连接的拓扑线路确定为第二拓扑线路;
在预设线路拓扑图中,将所述目标芯片组与所述目标外部设备相连的拓扑线路确定为第三拓扑线路;
在确定所述第一拓扑线路、所述第二拓扑线路以及所述第三拓扑线路满足预设带宽条件的情况下,基于所述第一拓扑线路、所述第二拓扑线路以及所述第三拓扑线路确定所述目标处理设备的目标拓扑线路。
6.根据权利要求2所述的网络设备连接方法,所述基于所述期望横联线数量确定所述目标处理设备的目标横联线,包括:
基于所述期望横联线数量在所述第一目标交换机以及所述第二目标交换机之间,确定与所述期望横联线数量相同的第一目标横联线,将所述第一目标横联线作为所述目标处理设备的目标横联线。
7.根据权利要求6所述的网络设备连接方法,所述基于所述期望横联线数量确定所述目标处理设备的目标横联线,包括:
在确定所述第一目标横联线连接的目标外部设备的数量不满足所述外部设备数量的情况下,在所述第一目标交换机以及所述第二目标交换机之间确定第二目标横联线;
将所述第二目标横联线作为所述目标处理设备的目标横联线。
8.根据权利要求7所述的网络设备连接方法,所述将所述第二目标横联线作为所述目标处理设备的目标横联线之后,还包括:
在确定所述第二目标横联线无法使用的情况下,将所述第一目标交换机以及所述第二目标交换机之间除所述第一目标横联线以外的其他第一目标横联线,作为所述目标处理设备的目标横联线。
9.根据权利要求8所述的网络设备连接方法,所述基于所述设备连接请求选取与所述目标芯片组连接的目标外部设备,包括:
基于所述设备连接请求在所述第二目标交换机的目标芯片组中确定待连接外部设备;
在所述待连接外部设备中选取与所述外部设备数量相同的外部设备,作为第二目标交换机中的目标外部设备。
10.根据权利要求9所述的网络设备连接方法,所述在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路,包括:
在预设线路拓扑图中,确定与所述目标处理设备相连接的第一目标交换机中的初始芯片组,将所述目标处理设备与所述初始芯片组相连接的拓扑线路确定为第四拓扑线路;
在预设线路拓扑图中,将所述第一目标交换机中确定的所述目标芯片组与所述初始芯片组相连接的拓扑线路确定为第五拓扑线路;
在预设线路拓扑图中,在确定所述目标横联线为第一目标横联线的情况下,将所述第一目标横联线确定为第六拓扑线路;
在预设线路拓扑图中,将所述目标芯片组与所述目标外部设备相连接的拓扑线路确定为第七拓扑线路;
在确定所述第四拓扑线路、所述第五拓扑线路、所述第六拓扑线路以及所述第七拓扑线路满足预设带宽条件的情况下,基于所述第四拓扑线路、所述第五拓扑线路、所述第六拓扑线路以及所述第七拓扑线路确定所述目标处理设备的目标拓扑线路。
11.根据权利要求9所述的网络设备连接方法,所述在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路,包括:
在预设线路拓扑图中,确定与所述目标处理设备相连接的第一目标交换机中的第一初始芯片组,将所述目标处理设备与所述第一初始芯片组相连接的拓扑线路确定为第四拓扑线路;
在预设线路拓扑图中,在确定所述目标横联线为第二目标横联线的情况下,将所述第一目标横联线确定为第五拓扑线路;
在预设线路拓扑图中,基于所述第二目标横联线在所述第二目标交换机中确定第二初始芯片组,将所述第二目标交换机中确定的所述目标芯片组与所述第二初始芯片组相连接的拓扑线路确定为第六拓扑线路;
在预设线路拓扑图中,将所述目标芯片组与所述目标外部设备相连接的拓扑线路确定为第七拓扑线路;
在确定所述第四拓扑线路、所述第五拓扑线路、所述第六拓扑线路以及所述第七拓扑线路满足预设带宽条件的情况下,基于所述第四拓扑线路、所述第五拓扑线路、所述第六拓扑线路以及所述第七拓扑线路确定所述目标处理设备的目标拓扑线路。
12.一种网络设备连接装置,包括:
请求接收模块,被配置为接收目标处理设备发送的设备连接请求,其中,所述设备连接请求包括与所述目标处理设备连接的外部设备数量;
设备选择模块,被配置为基于所述外部设备数量确定目标交换机中的目标芯片组,并基于所述设备连接请求选取与所述目标芯片组连接的目标外部设备;
线路选择模块,被配置为在预设线路拓扑图中选择所述目标处理设备与所述目标外部设备之间满足预设带宽条件的目标拓扑线路,其中,所述预设线路拓扑图包括CPU与交换机之间的线路、交换机与交换机之间的线路、交换机中的芯片组与外部设备之间的线路;
线路连接模块,被配置为基于所述目标拓扑线路,将所述目标处理设备与所述目标外部设备之间建立连接关系。
13.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1-11任意一项所述网络设备连接方法的步骤。
14.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1-11任意一项所述网络设备连接方法的步骤。
CN202111553840.7A 2021-12-17 2021-12-17 网络设备连接方法及装置 Active CN114422419B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111553840.7A CN114422419B (zh) 2021-12-17 2021-12-17 网络设备连接方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111553840.7A CN114422419B (zh) 2021-12-17 2021-12-17 网络设备连接方法及装置

Publications (2)

Publication Number Publication Date
CN114422419A CN114422419A (zh) 2022-04-29
CN114422419B true CN114422419B (zh) 2024-05-28

Family

ID=81268154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111553840.7A Active CN114422419B (zh) 2021-12-17 2021-12-17 网络设备连接方法及装置

Country Status (1)

Country Link
CN (1) CN114422419B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7009934B1 (en) * 1999-03-01 2006-03-07 Ciena Corporation Method and apparatus for rerouting an optical network upon fault
CN103444138A (zh) * 2011-03-23 2013-12-11 日本电气株式会社 通信控制系统、交换节点以及通信控制方法
US10325343B1 (en) * 2017-08-04 2019-06-18 EMC IP Holding Company LLC Topology aware grouping and provisioning of GPU resources in GPU-as-a-Service platform
CN110389843A (zh) * 2019-07-29 2019-10-29 广东浪潮大数据研究有限公司 一种业务调度方法、装置、设备及可读存储介质
CN110995591A (zh) * 2019-12-06 2020-04-10 苏州浪潮智能科技有限公司 基于链路层发现协议选择最优路径的方法、设备及介质
CN113452731A (zh) * 2020-03-25 2021-09-28 阿里巴巴集团控股有限公司 资源分配方法、装置、电子设备及计算机可读存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160080501A1 (en) * 2014-09-15 2016-03-17 International Business Machines Corporation On demand customer private network connectivity between cloud data centers
US9979627B2 (en) * 2015-02-06 2018-05-22 Dell Products, L.P. Systems and methods for bare-metal network topology discovery
US10896064B2 (en) * 2017-03-27 2021-01-19 International Business Machines Corporation Coordinated, topology-aware CPU-GPU-memory scheduling for containerized workloads
US10623422B2 (en) * 2018-04-30 2020-04-14 Hewlett Packard Enterprise Development Lp Protocol to detect a foreign device connected between network modules
US10747280B2 (en) * 2018-11-27 2020-08-18 International Business Machines Corporation Reconfigurble CPU/GPU interconnect to mitigate power/thermal throttling
US11637773B2 (en) * 2020-02-11 2023-04-25 Fungible, Inc. Scaled-out transport as connection proxy for device-to-device communications

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7009934B1 (en) * 1999-03-01 2006-03-07 Ciena Corporation Method and apparatus for rerouting an optical network upon fault
CN103444138A (zh) * 2011-03-23 2013-12-11 日本电气株式会社 通信控制系统、交换节点以及通信控制方法
US10325343B1 (en) * 2017-08-04 2019-06-18 EMC IP Holding Company LLC Topology aware grouping and provisioning of GPU resources in GPU-as-a-Service platform
CN110389843A (zh) * 2019-07-29 2019-10-29 广东浪潮大数据研究有限公司 一种业务调度方法、装置、设备及可读存储介质
CN110995591A (zh) * 2019-12-06 2020-04-10 苏州浪潮智能科技有限公司 基于链路层发现协议选择最优路径的方法、设备及介质
CN113452731A (zh) * 2020-03-25 2021-09-28 阿里巴巴集团控股有限公司 资源分配方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN114422419A (zh) 2022-04-29

Similar Documents

Publication Publication Date Title
US10110499B2 (en) QoS in a system with end-to-end flow control and QoS aware buffer allocation
US9130856B2 (en) Creating multiple NoC layers for isolation or avoiding NoC traffic congestion
CN113098773B (zh) 数据处理方法、装置及系统
CN105022717B (zh) 附加请求数优先级的片上网络资源仲裁方法及仲裁单元
CN116501681B (zh) Cxl数据传输板卡及控制数据传输的方法
US20230161638A1 (en) Reconfigurable computing pods using optical networks
CN112867088A (zh) 一种“云-边-端”通信架构的动态调节方法及系统
EP3285173A1 (en) Cpu interconnecting apparatus, system and control method, control apparatus therefor
US20180183672A1 (en) System and method for grouping of network on chip (noc) elements
CN114422419B (zh) 网络设备连接方法及装置
US10419300B2 (en) Cost management against requirements for the generation of a NoC
JP6946955B2 (ja) 情報処理装置、演算処理装置及び情報処理装置の制御方法
CN104601346A (zh) 管理交换机的网络连接的方法和装置
CN112636949A (zh) 一种电磁暂态实时并行仿真数据的通信方法及装置
US9762474B2 (en) Systems and methods for selecting a router to connect a bridge in the network on chip (NoC)
CN110611613B (zh) 一种基于网络设备的多路径路由方法及装置
CN103379031A (zh) 设备连接方法、系统及装置
CN114500413B (zh) 设备连接方法及装置、设备连接芯片
CN115334378B (zh) 一种用于资源池化的全光网络系统、装置及控制方法
CN114553361B (zh) 全光波长转换器的确定方法和装置、存储介质及电子设备
CN115297065B (zh) 处理设备通信互连方法、装置、计算机设备和存储介质
KR0171015B1 (ko) 고성능 ipc 네트워크의 고장감내형 트래픽 분산제어 노드장치
CN118606254A (zh) 数据传输方法、装置、设备及存储介质
CN116049079A (zh) 多芯片集群服务器互联的方法、系统、设备和存储介质
JPH08204676A (ja) 波長多重光通信網の光パス設定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant