CN108845970A - 一种自由切换gpu服务器拓扑的装置及方法 - Google Patents
一种自由切换gpu服务器拓扑的装置及方法 Download PDFInfo
- Publication number
- CN108845970A CN108845970A CN201810542386.7A CN201810542386A CN108845970A CN 108845970 A CN108845970 A CN 108845970A CN 201810542386 A CN201810542386 A CN 201810542386A CN 108845970 A CN108845970 A CN 108845970A
- Authority
- CN
- China
- Prior art keywords
- pcie
- plate
- gpu
- switch boards
- switch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/173—Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
- G06F15/17337—Direct connection machines, e.g. completely connected computers, point to point communication networks
- G06F15/17343—Direct connection machines, e.g. completely connected computers, point to point communication networks wherein the interconnection is dynamically configurable, e.g. having loosely coupled nearest neighbor architecture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/40—Bus structure
- G06F13/4004—Coupling between buses
- G06F13/4022—Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5012—Processor sets
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2213/00—Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F2213/0026—PCI express
Abstract
本发明涉及服务器架构技术领域,提供一种自由切换GPU服务器拓扑的装置及方法,装置包括CPU板、GPU板、PCIE板和切换板,切换板上设置有PCIE Switch,PCIE Switch上引出有四个PCIE接口用于与CPU板、GPU板及PCIE板连接,切换板通过切换工作模式改变四个PCIE接口之间的连接关系,实现GPU服务器拓扑结构的改变。本发明通过引入切换板,配置切换板的工作模式,实现PCIE互联架构动态可调,使用户在免开箱的情况下,不用改变服务器内部架构便可实现两种拓扑架构之间的切换,满足不同场景的计算需求,提高数据中心的运维效率。
Description
技术领域
本发明实施例涉及服务器架构技术领域,具体涉及一种自由切换GPU服务器拓扑的装置及方法。
背景技术
人工智能技术(简称AI)是未来的十大科技之一,AI对计算精度和计算复杂性的要求极高,这对其硬件载体的性能和可靠性提出了严峻挑战。GPU服务器集成了高密度的GPU群组,能够提供更高效的计算资源,因此广泛用于AI领域。GPU服务器采用CPU+GPU异构的计算架构,通常由CPU承担下发指令、控制计算等核心工作,GPU作为协处理器,接受CPU发来的数据在其内部进行计算,然后把结果反馈给CPU。GPU服务器的特性在于CPU和GPU之间需要频繁通讯,不同的AI场景其计算模式不尽相同,因此如何实现灵活的拓扑,满足不同应用场景的需求,是AI对其硬件载体提出的一个挑战。
现有技术中,GPU服务器的拓扑架构有负载均衡式拓扑结构和P2P式拓扑结构。负载均衡式拓扑结构的特点在于系统内的PCIE设备通信负荷被两个CPU均分,这种模式能够充分利用两个CPU资源,但是两个GPU板上的GPU设备在进行互访时,需要经过UPI总线,因此会影响到计算速度。P2P式拓扑结构的特点在于一个CPU集中与GPU进行通讯,另一个CPU集中负责外插网卡,所有的GPU设备都挂在一个CPU下,相互通讯时不需要经过UPI,GPU之间的通信效率有所提高。但其缺点在于某些情况下,两个CPU其中一方通信频繁、另一方闲置,出现负载差异较大的现象,导致CPU资源不能得到充分的利用。
基于上述问题,本发明提出一种自由切换GPU服务器拓扑的装置及方法,在免开箱的情况下实现两种拓扑架构间的自由切换,满足客户的使用需求。
发明内容
本发明实施例提供一种自由切换GPU服务器拓扑的装置及方法,在不用改变服务器内部架构的情况下实现两种拓扑架构的切换,满足不同场景的计算需求,提高数据中心的运维效率。
为解决上述技术问题,本发明公开了如下技术方案:
本发明第一方面提供了一种自由切换GPU服务器拓扑的装置,包括CPU板、GPU板和PCIE板,还包括有切换板,所述切换板上设置有PCIE Switch,PCIE Switch上引出有四个PCIE接口用于与CPU板、GPU板及PCIE板连接,所述切换板通过切换工作模式改变四个PCIE接口之间的连接关系,实现GPU服务器拓扑结构的改变。
基于上述方案,本装置做如下优化:
作为一种优化,所述切换板上的四个PCIE接口呈矩形排列,当呈平行分布的两列PCIE接口相互连通时,装置呈负载均衡式拓扑结构;当呈对角分布的两对PCIE接口相互连通时,装置呈P2P式拓扑结构。
进一步的,所述CPU板上设有CPU0和CPU1,CPU0和CPU1通过UPI互联,CPU0和CPU1分别引出两条X16PCIE链路,并在CPU板上引出对应的四个PCIE接口;
所述GPU板包括GPU1板和GPU2板,GPU1板和GPU2板左右对称布置,每个GPU板上设有用于把两路X16PCIE链路扩展为四路的PCIE Switch;
所述PCIE板设置于GPU1板和GPU2板之间,并扩展出4路PCIE X16。
如上所述的自由切换GPU服务器拓扑的装置,所述切换板设置于PCIE板与CPU板之间,切换板靠近PCIE板一侧的两个PCIE接口分别与PCIE板上的接口及GPU2板上的接口连接,切换板靠近CPU板一侧的两个PCIE接口分别与CPU0上的接口及CPU1上的接口连接。
本发明第二方面提供了一种自由切换GPU服务器拓扑的方法,所述方法包括以下步骤:
在硬件系统中设置切换板,并将切换板置于PCIE板与CPU板之间的位置;
在切换板上设置PCIE Switch,并在PCIE Switch上引出四个PCIE接口与CPU板、GPU板及PCIE板连接;
设置切换板的工作模式改变四个PCIE接口之间的连接关系,实现GPU服务器拓扑结构的改变。
进一步的,所述设置切换板的工作模式改变四个PCIE接口之间的连接关系,具体包括如下步骤:
将切换板设置为直通和交叉两种工作模式;
将PCIE Switch上引出的四个PCIE接口设置为矩形排列;
当将切换板设置为直通工作模式时,呈平行分布的两列PCIE接口相互连通,GPU服务器呈负载均衡式拓扑结构;当将切换板设置为交叉工作模式时,呈对角分布的两对PCIE接口相互连通,GPU服务器呈P2P式拓扑结构
如上所述的自由切换GPU服务器拓扑的方法,在所述CPU板上设置有CPU0和CPU1,CPU0和CPU1通过UPI互联分别引出两条X16PCIE链路,并在CPU板上引出对应的四个PCIE接口;将所述GPU板设置为GPU1板和GPU2板,每个GPU板上设有把两路X16PCIE链路扩展为四路的PCIE Switch;将所述PCIE板设置于GPU1板和GPU2板之间,并扩展出4路PCIE X16;将所述切换板靠近PCIE板一侧的两个PCIE接口分别与PCIE板上的接口及GPU2板上的接口连接,切换板靠近CPU板一侧的两个PCIE接口分别与CPU0上的接口及CPU1上的接口连接。
本申请的实施例提供的技术方案包括以下有益效果:
本申请实施例提供的一种自由切换GPU服务器拓扑的装置,包括CPU板、GPU板、PCIE板和切换板,切换板上设置有PCIE Switch,PCIE Switch上引出有四个PCIE接口与CPU板、GPU板及PCIE板连接,切换板通过切换工作模式改变四个PCIE接口之间的连接关系,实现GPU服务器拓扑结构的改变。本申请实施例的装置,通过引入切换板,配置切换板的工作模式,实现PCIE互联架构动态可调,使用户在免开箱的情况下,且不用改变服务器内部架构便可实现两种拓扑架构之间的切换,满足不同场景的计算需求,节省人工维护时间,提高数据中心的运维效率。
本发明第一方面提供的自由切换GPU服务器拓扑的装置,能够实现第二方面的自由切换GPU服务器拓扑的方法,并取得相同的效果。
附图说明
此处的附图被并入说明书中并构成说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为实施例提供的一种自由切换GPU服务器拓扑装置的结构示意图;
图2为图1中装置呈负载均衡式拓扑架构的结构示意图;
图3为图1中装置呈P2P式拓扑架构的结构示意图;
图4为实施例提供的一种自由切换GPU服务器拓扑方法的流程示意图。
附图标记:
1-GPU1板,2-PCIE板,3-GPU2板,4-CPU板,5-切换板。
具体实施方式
为使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
图1为本申请实施例提供的一种自由切换GPU服务器拓扑装置的结构示意图,由图1可知,本实施例的拓扑装置包括CPU板4、GPU板、PCIE板2和切换板5,所述切换板上设置有PCIE Switch,PCIE Switch上引出有四个PCIE接口用于与CPU板4、GPU板及PCIE板2连接,切换板5设置为直通和交叉两种工作模式,通过切换工作模式改变四个PCIE接口之间的连接关系,实现GPU服务器拓扑结构的改变。
具体而言,如图1所示,CPU板4上设有CPU0和CPU1,CPU0和CPU1通过UPI互联,CPU0和CPU1分别引出两条X16PCIE链路,并在CPU板上引出对应的四个PCIE接口。GPU板包括GPU1板1和GPU2板3,GPU1板1和GPU2板3左右对称布置,每个GPU板上设有用于把两路X16PCIE链路扩展为四路的PCIE Switch。PCIE板2设置于GPU1板1和GPU2板3之间,并扩展出4路PCIEX16。切换板5设置于PCIE板与CPU板之间,切换板5上的四个PCIE接口呈矩形排列,切换板5靠近PCIE板一侧的两个PCIE接口分别与PCIE板上的接口及GPU2板上的接口连接,切换板靠近CPU板一侧的两个PCIE接口分别与CPU0上的接口及CPU1上的接口连接。
如图1、图2所示,当切换板为直通工作模式时,呈平行分布的两列PCIE接口相互连通,即图1中的⑼、⑾接口相通,⑽、⑿接口相通,即图1中的⑷与⒁连接,⑻与⒂连接,GPU服务器呈图2所示的负载均衡式拓扑结构,此种拓扑结构相比于P2P式拓扑结构,可更充分的利用两个CPU资源。
如图1、图3所示,当切换板为交叉工作模式时,呈对角分布的两对PCIE接口相互连通,即图1中的⑼、⑿接口相通,⑽、⑾接口相通,即图1中的⑷与⒂连接,⑻与⒁连接,GPU服务器呈图3所示的P2P式拓扑结构,此种拓扑结构相比于负载均衡式拓扑结构,更好的提高了GPU之间的通信效率。
如上所述,通过配置切换板PCIE switch的不同模式,可以实现服务器两种拓扑架构之间的免开箱切换,满足不同应用场景下的计算需求,进而更好的满足客户需求。
图4为本申请实施例提供的一种自由切换GPU服务器拓扑方法的流程示意图,由图4可知,本实施例的拓扑方法包括以下步骤:
S1、在硬件系统中设置切换板,并将切换板置于PCIE板与CPU板之间的位置;
S2、在切换板上设置PCIE Switch,并在PCIE Switch上引出四个PCIE接口与CPU板、GPU板及PCIE板连接;
S3、设置切换板的工作模式改变四个PCIE接口之间的连接关系,实现GPU服务器拓扑结构的改变。
进一步的,所述步骤S3中设置切换板的工作模式改变四个PCIE接口之间的连接关系,具体包括如下步骤:
将切换板设置为直通和交叉两种工作模式;
将PCIE Switch上引出的四个PCIE接口设置为矩形排列;
当切换板为直通工作模式时,呈平行分布的两列PCIE接口相互连通,GPU服务器呈负载均衡式拓扑结构;当切换板为交叉工作模式时,呈对角分布的两对PCIE接口相互连通,GPU服务器呈P2P式拓扑结构。
具体而言,如上所述的一种自由切换GPU服务器拓扑的方法,在所述CPU板上设置有CPU0和CPU1,CPU0和CPU1通过UPI互联分别引出两条X16PCIE链路,并在CPU板上引出对应的四个PCIE接口;将所述GPU板设置为GPU1板和GPU2板,每个GPU板上设有把两路X16PCIE链路扩展为四路的PCIE Switch;将所述PCIE板设置于GPU1板和GPU2板之间,并扩展出4路PCIE X16;将所述切换板靠近PCIE板一侧的两个PCIE接口分别与PCIE板上的接口及GPU2板上的接口连接,切换板靠近CPU板一侧的两个PCIE接口分别与CPU0上的接口及CPU1上的接口连接。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (9)
1.一种自由切换GPU服务器拓扑的装置,包括CPU板、GPU板和PCIE板,其特征在于,还包括切换板,所述切换板上设置有PCIE Switch,PCIE Switch上引出有四个PCIE接口用于与CPU板、GPU板及PCIE板连接,所述切换板通过切换工作模式改变四个PCIE接口之间的连接关系,实现GPU服务器拓扑结构的改变。
2.根据权利要求1所述的一种自由切换GPU服务器拓扑的装置,其特征在于,所述切换板上的四个PCIE接口呈矩形排列,当呈平行分布的两列PCIE接口相互连通时,装置呈负载均衡式拓扑结构;当呈对角分布的两对PCIE接口相互连通时,装置呈P2P式拓扑结构。
3.根据权利要求2所述的一种自由切换GPU服务器拓扑的装置,其特征在于,所述CPU板上设有CPU0和CPU1,CPU0和CPU1通过UPI互联,CPU0和CPU1分别引出两条X16PCIE链路,并在CPU板上引出对应的四个PCIE接口。
4.根据权利要求3所述的一种自由切换GPU服务器拓扑的装置,其特征在于,所述GPU板包括GPU1板和GPU2板,GPU1板和GPU2板左右对称布置,每个GPU板上设有用于把两路X16PCIE链路扩展为四路的PCIE Switch。
5.根据权利要求4所述的一种自由切换GPU服务器拓扑的装置,其特征在于,所述PCIE板设置于GPU1板和GPU2板之间,并扩展出4路PCIE X16。
6.根据权利要求5所述的一种自由切换GPU服务器拓扑的装置,其特征在于,所述切换板设置于PCIE板与CPU板之间,切换板靠近PCIE板一侧的两个PCIE接口分别与PCIE板上的接口及GPU2板上的接口连接,切换板靠近CPU板一侧的两个PCIE接口分别与CPU0上的接口及CPU1上的接口连接。
7.一种自由切换GPU服务器拓扑的方法,其特征在于,包括以下步骤:
在硬件系统中设置切换板,并将切换板置于PCIE板与CPU板之间的位置;
在切换板上设置PCIE Switch,并在PCIE Switch上引出四个PCIE接口与CPU板、GPU板及PCIE板连接;
设置切换板的工作模式改变四个PCIE接口之间的连接关系,实现GPU服务器拓扑结构的改变。
8.根据权利要求7所述的一种自由切换GPU服务器拓扑的方法,其特征在于,所述设置切换板的工作模式改变四个PCIE接口之间的连接关系,具体包括如下步骤:
将切换板设置为直通和交叉两种工作模式;
将PCIE Switch上引出的四个PCIE接口设置为矩形排列;
当切换板为直通工作模式时,呈平行分布的两列PCIE接口相互连通,GPU服务器呈负载均衡式拓扑结构;当切换板为交叉工作模式时,呈对角分布的两对PCIE接口相互连通,GPU服务器呈P2P式拓扑结构。
9.根据权利要求8所述的一种自由切换GPU服务器拓扑的方法,其特征在于,在所述CPU板上设置有CPU0和CPU1,CPU0和CPU1通过UPI互联分别引出两条X16PCIE链路,并在CPU板上引出对应的四个PCIE接口;将所述GPU板设置为GPU1板和GPU2板,每个GPU板上设有把两路X16PCIE链路扩展为四路的PCIE Switch;将所述PCIE板设置于GPU1板和GPU2板之间,并扩展出4路PCIE X16;将所述切换板靠近PCIE板一侧的两个PCIE接口分别与PCIE板上的接口及GPU2板上的接口连接,切换板靠近CPU板一侧的两个PCIE接口分别与CPU0上的接口及CPU1上的接口连接。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810542386.7A CN108845970B (zh) | 2018-05-30 | 2018-05-30 | 一种自由切换gpu服务器拓扑的装置及方法 |
PCT/CN2018/112003 WO2019227837A1 (zh) | 2018-05-30 | 2018-10-26 | 一种自由切换gpu服务器拓扑的装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810542386.7A CN108845970B (zh) | 2018-05-30 | 2018-05-30 | 一种自由切换gpu服务器拓扑的装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108845970A true CN108845970A (zh) | 2018-11-20 |
CN108845970B CN108845970B (zh) | 2021-07-27 |
Family
ID=64209867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810542386.7A Active CN108845970B (zh) | 2018-05-30 | 2018-05-30 | 一种自由切换gpu服务器拓扑的装置及方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108845970B (zh) |
WO (1) | WO2019227837A1 (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110347625A (zh) * | 2019-09-06 | 2019-10-18 | 深圳市同泰怡信息技术有限公司 | 一种无线缆切换gpu拓扑的方法、装置以及设备 |
CN110377556A (zh) * | 2019-06-26 | 2019-10-25 | 苏州浪潮智能科技有限公司 | 基于Retimer的通用计算模块与异构计算模块的适配装置及方法 |
CN110377537A (zh) * | 2019-06-25 | 2019-10-25 | 苏州浪潮智能科技有限公司 | 一种基于高速信号切换芯片的数据传输方法、装置及介质 |
CN110389928A (zh) * | 2019-06-25 | 2019-10-29 | 苏州浪潮智能科技有限公司 | 一种基于高速信号切换芯片的数据传输方法、装置及介质 |
CN110401466A (zh) * | 2019-06-25 | 2019-11-01 | 苏州浪潮智能科技有限公司 | 一种基于高速信号切换芯片的数据传输方法、装置及介质 |
CN110442389A (zh) * | 2019-08-07 | 2019-11-12 | 北京技德系统技术有限公司 | 一种多桌面环境共享使用gpu的方法 |
CN110515723A (zh) * | 2019-08-09 | 2019-11-29 | 苏州浪潮智能科技有限公司 | 一种双路服务器及其cpu负载均衡系统 |
CN111352787A (zh) * | 2020-03-13 | 2020-06-30 | 浪潮商用机器有限公司 | 一种gpu拓扑连接检测方法、装置、设备及存储介质 |
CN111563058A (zh) * | 2020-05-13 | 2020-08-21 | 浪潮商用机器有限公司 | 一种服务器内转接PCIE Gen4的装置 |
CN111737181A (zh) * | 2020-06-19 | 2020-10-02 | 苏州浪潮智能科技有限公司 | 异构处理设备、系统、端口配置方法、装置及存储介质 |
CN111737184A (zh) * | 2020-05-29 | 2020-10-02 | 苏州浪潮智能科技有限公司 | 一种ai服务器计算单元架构及实现方法 |
WO2020258917A1 (zh) * | 2019-06-28 | 2020-12-30 | 华为技术有限公司 | 一种数据交换芯片及服务器 |
CN112905331A (zh) * | 2019-11-19 | 2021-06-04 | 上海商汤智能科技有限公司 | 任务处理系统、方法及装置、电子设备和存储介质 |
CN113194048A (zh) * | 2021-04-16 | 2021-07-30 | 山东英信计算机技术有限公司 | 一种动态切换cpu与gpu拓扑的装置及使用方法 |
WO2022021298A1 (en) * | 2020-07-31 | 2022-02-03 | Nvidia Corporation | Multi-format graphics processing unit docking board |
CN114282487A (zh) * | 2021-11-25 | 2022-04-05 | 苏州浪潮智能科技有限公司 | 一种pcb板上upi兼容pcie的方法、系统和装置 |
CN114500413A (zh) * | 2021-12-17 | 2022-05-13 | 阿里巴巴(中国)有限公司 | 设备连接方法及装置、设备连接芯片 |
CN116909980A (zh) * | 2023-09-12 | 2023-10-20 | 苏州浪潮智能科技有限公司 | 拓扑结构的识别装置及服务器 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110109638A1 (en) * | 2009-10-05 | 2011-05-12 | Duluk Jr Jerome F | Restart index that sets a topology |
CN103336756A (zh) * | 2013-07-19 | 2013-10-02 | 中国人民解放军信息工程大学 | 一种数据计算节点的生成装置 |
US20140132612A1 (en) * | 2012-04-19 | 2014-05-15 | Nvidia Corporation | Boot display device detection and selection techniques in multi-gpu devices |
CN104750167A (zh) * | 2015-03-30 | 2015-07-01 | 福州瑞芯微电子有限公司 | 一种动态时钟拓扑结构的配置方法及装置 |
CN106325779A (zh) * | 2016-08-31 | 2017-01-11 | 浪潮电子信息产业股份有限公司 | 一种SAS Switch/JBOD拓扑的设计方案 |
CN107102964A (zh) * | 2017-05-19 | 2017-08-29 | 郑州云海信息技术有限公司 | 一种利用高速率连接器进行gpu集群拓展的方法 |
EP3242218A1 (en) * | 2016-05-06 | 2017-11-08 | Quanta Computer Inc. | Dynamic pcie switch reconfiguration mechanism |
CN107590101A (zh) * | 2017-09-06 | 2018-01-16 | 郑州云海信息技术有限公司 | 一种与gpu整机箱互联的服务器装置 |
CN107632953A (zh) * | 2017-09-14 | 2018-01-26 | 郑州云海信息技术有限公司 | 一种gpu箱pcie扩展互连拓扑装置 |
CN107992438A (zh) * | 2017-11-24 | 2018-05-04 | 郑州云海信息技术有限公司 | 一种服务器及在服务器内灵活配置PCIe拓扑的方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8335884B2 (en) * | 2009-07-10 | 2012-12-18 | Brocade Communications Systems, Inc. | Multi-processor architecture implementing a serial switch and method of operating same |
CN206147604U (zh) * | 2016-07-26 | 2017-05-03 | 浪潮电子信息产业股份有限公司 | 一种基于Openpower平台自动匹配GPU的PCIE切换模块 |
-
2018
- 2018-05-30 CN CN201810542386.7A patent/CN108845970B/zh active Active
- 2018-10-26 WO PCT/CN2018/112003 patent/WO2019227837A1/zh active Application Filing
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110109638A1 (en) * | 2009-10-05 | 2011-05-12 | Duluk Jr Jerome F | Restart index that sets a topology |
US20140132612A1 (en) * | 2012-04-19 | 2014-05-15 | Nvidia Corporation | Boot display device detection and selection techniques in multi-gpu devices |
CN103336756A (zh) * | 2013-07-19 | 2013-10-02 | 中国人民解放军信息工程大学 | 一种数据计算节点的生成装置 |
CN104750167A (zh) * | 2015-03-30 | 2015-07-01 | 福州瑞芯微电子有限公司 | 一种动态时钟拓扑结构的配置方法及装置 |
EP3242218A1 (en) * | 2016-05-06 | 2017-11-08 | Quanta Computer Inc. | Dynamic pcie switch reconfiguration mechanism |
CN106325779A (zh) * | 2016-08-31 | 2017-01-11 | 浪潮电子信息产业股份有限公司 | 一种SAS Switch/JBOD拓扑的设计方案 |
CN107102964A (zh) * | 2017-05-19 | 2017-08-29 | 郑州云海信息技术有限公司 | 一种利用高速率连接器进行gpu集群拓展的方法 |
CN107590101A (zh) * | 2017-09-06 | 2018-01-16 | 郑州云海信息技术有限公司 | 一种与gpu整机箱互联的服务器装置 |
CN107632953A (zh) * | 2017-09-14 | 2018-01-26 | 郑州云海信息技术有限公司 | 一种gpu箱pcie扩展互连拓扑装置 |
CN107992438A (zh) * | 2017-11-24 | 2018-05-04 | 郑州云海信息技术有限公司 | 一种服务器及在服务器内灵活配置PCIe拓扑的方法 |
Non-Patent Citations (4)
Title |
---|
JESUS MARTINEZ-FRUTOS ET AL: "Large-scale robust topology optimization using multi-GPU systems", 《COMPUTER METHODS IN APPLIED MECHANICS AND ENGINEERING》 * |
MARCELO AMARAL ET AL: "Topology-aware GPU scheduling for learning workloads in cloud environments", 《PROCEEDINGS OF THE INTERNATIONAL CONFERENCE FOR HIGH PERFORMANCE COMPUTING, NETWORKING, STORAGE AND ANALYSIS》 * |
WILLIAM TSU: "HGX-2 Fuses HPC and AI Computing Architectures", 《HTTPS://DEVELOPER.NVIDIA.COM/BLOG/HGX-2-FUSES-AI-COMPUTING/》 * |
韩琪等: "基于GPU的大规模拓扑优化问题并行计算方法", 《计算机仿真》 * |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110377537A (zh) * | 2019-06-25 | 2019-10-25 | 苏州浪潮智能科技有限公司 | 一种基于高速信号切换芯片的数据传输方法、装置及介质 |
CN110389928A (zh) * | 2019-06-25 | 2019-10-29 | 苏州浪潮智能科技有限公司 | 一种基于高速信号切换芯片的数据传输方法、装置及介质 |
CN110401466A (zh) * | 2019-06-25 | 2019-11-01 | 苏州浪潮智能科技有限公司 | 一种基于高速信号切换芯片的数据传输方法、装置及介质 |
CN110377556A (zh) * | 2019-06-26 | 2019-10-25 | 苏州浪潮智能科技有限公司 | 基于Retimer的通用计算模块与异构计算模块的适配装置及方法 |
WO2020258917A1 (zh) * | 2019-06-28 | 2020-12-30 | 华为技术有限公司 | 一种数据交换芯片及服务器 |
CN110442389A (zh) * | 2019-08-07 | 2019-11-12 | 北京技德系统技术有限公司 | 一种多桌面环境共享使用gpu的方法 |
CN110442389B (zh) * | 2019-08-07 | 2024-01-09 | 北京技德系统技术有限公司 | 一种多桌面环境共享使用gpu的方法 |
CN110515723A (zh) * | 2019-08-09 | 2019-11-29 | 苏州浪潮智能科技有限公司 | 一种双路服务器及其cpu负载均衡系统 |
CN110347625A (zh) * | 2019-09-06 | 2019-10-18 | 深圳市同泰怡信息技术有限公司 | 一种无线缆切换gpu拓扑的方法、装置以及设备 |
CN112905331A (zh) * | 2019-11-19 | 2021-06-04 | 上海商汤智能科技有限公司 | 任务处理系统、方法及装置、电子设备和存储介质 |
CN111352787A (zh) * | 2020-03-13 | 2020-06-30 | 浪潮商用机器有限公司 | 一种gpu拓扑连接检测方法、装置、设备及存储介质 |
CN111352787B (zh) * | 2020-03-13 | 2023-08-18 | 浪潮商用机器有限公司 | 一种gpu拓扑连接检测方法、装置、设备及存储介质 |
CN111563058A (zh) * | 2020-05-13 | 2020-08-21 | 浪潮商用机器有限公司 | 一种服务器内转接PCIE Gen4的装置 |
CN111737184A (zh) * | 2020-05-29 | 2020-10-02 | 苏州浪潮智能科技有限公司 | 一种ai服务器计算单元架构及实现方法 |
CN111737184B (zh) * | 2020-05-29 | 2022-08-12 | 苏州浪潮智能科技有限公司 | 一种ai服务器计算单元架构及实现方法 |
CN111737181A (zh) * | 2020-06-19 | 2020-10-02 | 苏州浪潮智能科技有限公司 | 异构处理设备、系统、端口配置方法、装置及存储介质 |
WO2022021298A1 (en) * | 2020-07-31 | 2022-02-03 | Nvidia Corporation | Multi-format graphics processing unit docking board |
CN113194048A (zh) * | 2021-04-16 | 2021-07-30 | 山东英信计算机技术有限公司 | 一种动态切换cpu与gpu拓扑的装置及使用方法 |
CN114282487A (zh) * | 2021-11-25 | 2022-04-05 | 苏州浪潮智能科技有限公司 | 一种pcb板上upi兼容pcie的方法、系统和装置 |
CN114282487B (zh) * | 2021-11-25 | 2024-02-02 | 苏州浪潮智能科技有限公司 | 一种pcb板上upi兼容pcie的方法、系统和装置 |
CN114500413A (zh) * | 2021-12-17 | 2022-05-13 | 阿里巴巴(中国)有限公司 | 设备连接方法及装置、设备连接芯片 |
CN114500413B (zh) * | 2021-12-17 | 2024-04-16 | 阿里巴巴(中国)有限公司 | 设备连接方法及装置、设备连接芯片 |
CN116909980B (zh) * | 2023-09-12 | 2024-01-23 | 苏州浪潮智能科技有限公司 | 拓扑结构的识别装置及服务器 |
CN116909980A (zh) * | 2023-09-12 | 2023-10-20 | 苏州浪潮智能科技有限公司 | 拓扑结构的识别装置及服务器 |
Also Published As
Publication number | Publication date |
---|---|
WO2019227837A1 (zh) | 2019-12-05 |
CN108845970B (zh) | 2021-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108845970A (zh) | 一种自由切换gpu服务器拓扑的装置及方法 | |
CN104077138B (zh) | 一种集成网络路由器的众核处理器系统及其集成方法和实现方法 | |
CN103092807B (zh) | 节点控制器、并行计算服务器系统以及路由方法 | |
CN104169878A (zh) | 可升级的虚拟设备云 | |
He et al. | EasyNet: 100 Gbps network for HLS | |
CN109522114A (zh) | 虚拟化框架的雷达数据高速通信处理模块 | |
CN103106173A (zh) | 多核处理器核间互联的方法 | |
CN108337179A (zh) | 链路流量控制方法及装置 | |
CN107480094A (zh) | 一种融合架构的池化服务器系统架构 | |
DE112019000965T5 (de) | Technologien zur reduzierung der nic-anschlüsse mit beschleunigter schaltung | |
CN208903299U (zh) | 一种ai智能专用计算卡及其构成的边缘网络 | |
CN106776457A (zh) | 一种服务器跨板共享信号的控制系统及方法 | |
He et al. | Accl: Fpga-accelerated collectives over 100 gbps tcp-ip | |
Kaplan et al. | Unveiling the interplay between global link arrangements and network management algorithms on dragonfly networks | |
CN108810109B (zh) | 一种基于能耗优化的虚拟数据中心放置方法 | |
CN109410117A (zh) | 图形处理器系统 | |
CN109120539B (zh) | 一种实现数据传输处理的方法及装置 | |
Redžović et al. | Implementation and performance comparison of high-capacity software routers | |
CN208046650U (zh) | 一种混合交换板卡 | |
CN109308210B (zh) | 一种在多核服务器上优化nfv转发服务链性能的方法 | |
CN110493040A (zh) | 航空机载网络的设计方法和装置 | |
Nomura et al. | Performance analysis of the multi-gpu system with expether | |
Xie et al. | mtcloudsim: A flow-level network simulator for multi-tenant cloud | |
CN206331335U (zh) | 计算机主板和计算机 | |
Ueno et al. | VCSN: Virtual circuit-switching network for flexible and simple-to-operate communication in HPC FPGA cluster |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |