CN207965873U - 人工智能加速卡及服务器 - Google Patents

人工智能加速卡及服务器 Download PDF

Info

Publication number
CN207965873U
CN207965873U CN201820376596.9U CN201820376596U CN207965873U CN 207965873 U CN207965873 U CN 207965873U CN 201820376596 U CN201820376596 U CN 201820376596U CN 207965873 U CN207965873 U CN 207965873U
Authority
CN
China
Prior art keywords
accelerator card
artificial intelligence
server
interface
circuit plate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201820376596.9U
Other languages
English (en)
Inventor
刘超
王伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Shenzhen Tencent Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd, Shenzhen Tencent Computer Systems Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201820376596.9U priority Critical patent/CN207965873U/zh
Application granted granted Critical
Publication of CN207965873U publication Critical patent/CN207965873U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

本申请公开了人工智能加速卡及服务器。一种人工智能加速卡,所述加速卡包括条形电路板,所述条形电路板包括:设置在所述条形电路板的一端的导电触片式接口,用于插入机架服务器中接口交换器的插槽阵列内任一个插槽中;用于人工智能计算的智能处理芯片,与所述导电触片式接口耦接;以及存储器,与所述智能处理芯片耦接。

Description

人工智能加速卡及服务器
技术领域
本申请涉及人工智能技术领域,尤其涉及人工智能加速卡及服务器。
背景技术
随着人工智能(Artificial Intelligence,简称AI)技术的发展,AI芯片逐渐被应用在深度学习等各种智能计算领域。包含AI芯片的AI计算模块通常布置在服务器设备内部。然而,目前的AI计算模块在硬件部署的扩展性方面有待提高。
发明内容
本申请提出了一种人工智能加速卡方案,能够提高服务器在AI计算方面的硬件扩展性。
根据本申请一个方面,提供一种人工智能加速卡,所述加速卡包括条形电路板,所述条形电路板包括:设置在所述条形电路板的一端的导电触片式接口,用于插入机架服务器中接口交换器的插槽阵列内任一个插槽中;用于人工智能计算的智能处理芯片,与所述导电触片式接口耦接;以及存储器,与所述智能处理芯片耦接。
在一些实施例中,所述加速卡还包括容置所述条形电路板的壳体。
在一些实施例中,所述加速卡还包括用于将所述加速卡从所述机架服务器拔出的拉手条,所述拉手条铰接在所述壳体上。
在一些实施例中,所述加速卡还包括设置在所述壳体上的散热风扇。
在一些实施例中,所述导电触片式接口包括外围组件快速互联接口。
在一些实施例中,所述智能处理芯片包括用于人工智能计算的现场可编程门阵列芯片。
在一些实施例中,所述智能处理芯片包括人工智能计算的专用集成电路芯片。
根据本申请另一个方面,一种服务器,包括:机箱;处于所述机箱内的接口交换器,设置有插槽阵列;一个或多个如权利要求1所述的人工智能加速卡,从所述机箱的前面板的开口处插接到所述插槽阵列。
在一些实施例中,所述插槽阵列中各插槽并列竖直布置。
在一些实施例中,所述插槽阵列中每个插槽包括一个或两个PCIE x4插接口。
综上,根据本申请的技术方案可以使得人工智能加速卡能够以热插拔方式安装在服务器上。这样,服务器可以根据需要调节人工智能加速卡的安装数量。这里,服务器通过热插拔方式安装人工智能加速卡,能够方便地调节人工智能计算的资源池的规模。
附图说明
为了更清楚地说明本申请实例中的技术方案,下面将对实例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本申请一些实施例的服务器100的示意图;
图2和图3分别示出了根据本申请实施例的条形电路板的示意图;
图4示出了根据本申请一个实施例的壳体400和条形电路板200的示意图;
图5示出了根据本申请一个实施例的壳体400的示意图;以及
图6示出了根据本申请一些实施例的服务器架构图。
具体实施方式
下面将结合本申请实例中的附图,对本申请实例中的技术方案进行清楚、完整地描述,显然,所描述的实例仅是本申请一部分实例,而不是全部的实例。基于本申请中的实例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实例,都属于本申请保护的范围。
图1示出了根据本申请一些实施例的服务器100的示意图。服务器100例如为机架式服务器。在一个应用场景中,服务器机柜可以部署多个服务器100。服务器100例如可以是1U、2U或4U等规格。其中,U是一种表示服务器高度尺寸的单位,是unit的缩略语。例如,1U=1.75英寸。
如图1所示,服务器100可以包括机箱110和处于机箱110内的接口交换器(图1未示出)。其中,接口交换器设置有插槽阵列。接口交换器例如为外围组件快速互联(PeripheralComponent Interconnect Express,缩写为PCIE)交换器(即,PCIE Switch)。这里,插槽阵列例如可以并列竖直布置。另外,服务器100可以包括一个或多个人工智能加速卡(也可以称为AI加速卡),例如图1所标出的人工智能加速卡120。这里,人工智能加速卡120可以是各种进行AI计算的硬件模块,本申请对此不做限制。人工智能加速卡120可以从机箱110前面板111的开口处插接到插槽阵列。实际上,插槽阵列中每个插槽均可以用于安装一个人工智能加速卡120。当安装有多个人工智能加速卡120时,服务器100可以形成关于人工智能计算的资源池。需要说明的是,人工智能加速卡120能够以热插拔方式安装在服务器110上。这样,服务器110可以根据需要调节人工智能加速卡120的安装数量。这里,服务器110通过热插拔方式安装人工智能加速卡120,能够方便地调节人工智能计算的资源池的规模。
另外说明的是,基于机箱110的高度,人工智能加速卡120可以配置有相应的导电触片式接口(也可以称为金手指)。导电触片式接口例如为外围组件快速互联接口(即,PCIE接口)。在一个实施例中,机箱110的高度为1U。人工智能加速卡120的PCIE接口为PCIE x4接口。在另一个实施例中,机箱110的高度为2U。人工智能加速卡120的PCIE接口为2个PCIE x4接口或者一个PCIE x8接口。
另外说明的是,接口交换器可以耦接服务器100的中央处理器(CPU)。另外,接口交换器还可以与多个服务器节点(未示出)耦接。这样,与接口交换器耦接的每个服务器节点可以利用服务器100上安装的人工智能加速卡120进行计算。例如,服务器节点可以利用人工智能加速卡120执行深度学习等计算任务。由此可见,服务器100可以集中维护关于人工智能计算的资源池,并支持与接口交换器耦接的服务器节点通过人工智能加速卡120进行各种计算任务。
另外说明的是,服务器100上安装的人工智能加速卡120还可以被替换为其他具有相同接口的硬件模块(例如固态硬盘模块)。例如,服务器100可以灵活地将人工智能加速卡120更换为固态硬盘模块。或者,服务器100可以将固态硬盘模块更换为人工智能加速卡120,由此可见,人工智能加速卡120由于可以被配置为与固态硬盘一致的接口规格,可以极大提高服务器100的兼容性。
下面对人工智能加速卡120的结构进行进一步说明。人工智能加速卡120可以包括条形电路板。条形电路板可以包括设置在条形电路板的一端的导电触片式接口(即,金手指)、智能处理芯片和存储器。这里,导电触片式接口例如设置为条形电路板的一个短边处。导电触片式接口例如外围组件快速互联(PCIE)接口,用于插入机架服务器(例如服务器100)中接口交换器的插槽阵列内任一个插槽中。用于人工智能计算的智能处理芯片,与导电触片式接口耦接。存储器与智能处理芯片耦接。图2和图3分别示出了根据本申请实施例的条形电路板的示意图。
如图2所示,条形电路板200可以包括智能处理芯片210、存储器220和导电触片式接口230。智能处理芯片210例如可以是用于人工智能计算的现场可编程门阵列(FieldProgrammable Gate Array,缩写为FPGA)芯片、用于人工智能计算的专用集成电路(Application Specific Integrated Circuit,缩写为ASIC)芯片或者图形处理器(Graphics Processing Unit,缩写为GPU)芯片等等。在一个实施例中,存储器220可以包括动态随机存储器(Dynamic Random Access Memory,缩写为DRAM)。在一个实施例中,存储器220可以包括非线性宏单元闪存(Nand Flash),但不限于此。需要说明的是,智能处理芯片210和存储器220可以采用各种合适的互连方式,本申请对此不做限制。导电触片式接口230例如为PCIE x4接口。这里,条形电路板200可以插入1U高度的服务器中。在一个实施例中,条形电路板200符合M.2(即Next Generation Form Factor,简称NGFF)尺寸标准。在另一个实施例中,条形电路板200符合M.3尺寸标准。M.3是在M.2基础上的改进的NVMe(Non-Volatile Memory express)SSD模块的标准。NVMe是一种建立在M.2接口上的类似AHCI(Serial ATA Advanced Host Controller Interface,串行ATA高级主控接口)的一种协议,是专门为闪存类存储器设计的协议。条形电路板200的尺寸为30mm x 110mm,但不限于此。在另一个实施例中,条形电路板200可以符合U.2接口规范。这里,U.2接口也可以称为SFF-8639,是由固态硬盘形态工作组织(SSD Form Factor Work Group)推出的接口规范。应当理解,条形电路板200还可以采用使得该条形电路板200能够部署在服务器100上的其他接口规范,这里不再赘述。
如图3所示,条形电路板300可以包括智能处理芯片310、存储器320和导电触片式接口330。智能处理芯片310和存储器320可以分别与智能处理芯片210和存储器220一致,这里不再赘述。导电触片式接口330可以包括接口331和接口332。这里,接口331和接口332均可以是PCIE x4接口。这里,条形电路板300可以插入2U高度的服务器中。在一个实施例中,导电触片式接口330可以是一个PCIE x8接口。
由图2和图3的示例可知,本申请的条形电路板可以根据服务器100的高度规格进行相应的配置,从而可以充分利用服务器100的空间部署人工智能加速卡。
在一个实施例中,人工智能加速卡120还可以包括容置条形电路板的壳体。图4示出了根据本申请一个实施例的壳体400和条形电路板200的示意图。如图4所示,条形电路板200可以固定在壳体400上。
在图5所示的实施例中,人工智能加速卡120还可以包括铰接在壳体400上的拉手条410。拉手条410便于将人工智能加速卡120从机架服务器(例如服务器100)拔出。在一个实施例中,人工智能加速卡120还可以包括设置在壳体400上的散热风扇(未示出)。另外,壳体400还可以布置显示灯(未示出)和控制按钮(未示出)。显示灯的功能例如是显示人工智能加速卡120是否工作正常。控制按钮可以根据人工智能加速卡120的具体结构进行配置,例如可以启动或者关闭人工智能加速卡120。
图6示出了根据本申请一些实施例的服务器架构图。如图6所示,服务器600可以包括中央处理器610、接口交换器620和多个人工智能加速卡,例如图6所示人工智能加速卡630、640和650。这里,接口交换器620例如为PCIE Switch等桥接设备。接口交换器620可以与中央处理器610耦接。在一个实施例中,接口交换器620可以通过根复用(root complex)器件与中央处理器610耦接。人工智能加速卡630、640和650均可以是人工智能加速卡200或者人工智能加速卡300。这样,服务器600可以形成执行人工智能计算的资源池。这里,服务器500可以作为服务器集群中一个人工智能计算节点,从而向服务器集群中各服务器节点提供人工智能的计算资源。
以上所述仅为本申请的较佳实例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种人工智能加速卡,其特征在于,所述加速卡包括条形电路板,所述条形电路板包括:
设置在所述条形电路板的一端的导电触片式接口,用于插入机架服务器中接口交换器的插槽阵列内任一个插槽中;
用于人工智能计算的智能处理芯片,与所述导电触片式接口耦接;以及
存储器,与所述智能处理芯片耦接。
2.如权利要求1所述的加速卡,其特征在于,所述加速卡还包括容置所述条形电路板的壳体。
3.如权利要求2所述的加速卡,其特征在于,所述加速卡还包括用于将所述加速卡从所述机架服务器拔出的拉手条,所述拉手条铰接在所述壳体上。
4.如权利要求2所述的加速卡,其特征在于,所述加速卡还包括设置在所述壳体上的散热风扇。
5.如权利要求1所述的加速卡,其特征在于,所述导电触片式接口包括外围组件快速互联接口。
6.如权利要求1所述的加速卡,其特征在于,所述智能处理芯片包括用于人工智能计算的现场可编程门阵列芯片。
7.如权利要求1所述的加速卡,其特征在于,所述智能处理芯片包括人工智能计算的专用集成电路芯片。
8.一种服务器,其特征在于,包括:
机箱;
处于所述机箱内的接口交换器,设置有插槽阵列;
一个或多个如权利要求1所述的人工智能加速卡,从所述机箱的前面板的开口处插接到所述插槽阵列。
9.如权利要求8所述的服务器,其特征在于,所述插槽阵列中各插槽并列竖直布置。
10.如权利要求8所述的服务器,其特征在于,所述插槽阵列中每个插槽包括一个或两个PCIE x4插接口。
CN201820376596.9U 2018-03-20 2018-03-20 人工智能加速卡及服务器 Active CN207965873U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201820376596.9U CN207965873U (zh) 2018-03-20 2018-03-20 人工智能加速卡及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201820376596.9U CN207965873U (zh) 2018-03-20 2018-03-20 人工智能加速卡及服务器

Publications (1)

Publication Number Publication Date
CN207965873U true CN207965873U (zh) 2018-10-12

Family

ID=63724864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201820376596.9U Active CN207965873U (zh) 2018-03-20 2018-03-20 人工智能加速卡及服务器

Country Status (1)

Country Link
CN (1) CN207965873U (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344109A (zh) * 2018-10-23 2019-02-15 江苏华存电子科技有限公司 基于固态硬盘的大数据中加速人工智能计算的系统及方法
CN109656476A (zh) * 2018-12-05 2019-04-19 青岛镕铭半导体有限公司 一种硬件加速模块及视频处理设备
CN110083558A (zh) * 2019-06-03 2019-08-02 苏州长江睿芯电子科技有限公司 一种用于自适应可编程存储计算加速卡装置
CN110708185A (zh) * 2019-09-03 2020-01-17 中国科学院计算技术研究所 用于人工智能处理器的数据互联方法、系统、芯片和装置
WO2021031619A1 (zh) * 2019-08-22 2021-02-25 华为技术有限公司 存储设备、分布式存储系统以及数据处理方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344109A (zh) * 2018-10-23 2019-02-15 江苏华存电子科技有限公司 基于固态硬盘的大数据中加速人工智能计算的系统及方法
CN109344109B (zh) * 2018-10-23 2022-07-26 江苏华存电子科技有限公司 基于固态硬盘的大数据中加速人工智能计算的系统及方法
CN109656476A (zh) * 2018-12-05 2019-04-19 青岛镕铭半导体有限公司 一种硬件加速模块及视频处理设备
CN110083558A (zh) * 2019-06-03 2019-08-02 苏州长江睿芯电子科技有限公司 一种用于自适应可编程存储计算加速卡装置
WO2021031619A1 (zh) * 2019-08-22 2021-02-25 华为技术有限公司 存储设备、分布式存储系统以及数据处理方法
US12001681B2 (en) 2019-08-22 2024-06-04 Huawei Technologies Co., Ltd. Distributed storage system and data processing method
CN110708185A (zh) * 2019-09-03 2020-01-17 中国科学院计算技术研究所 用于人工智能处理器的数据互联方法、系统、芯片和装置
CN110708185B (zh) * 2019-09-03 2021-06-29 中国科学院计算技术研究所 用于人工智能处理器的数据互联方法、系统、芯片和装置

Similar Documents

Publication Publication Date Title
CN207965873U (zh) 人工智能加速卡及服务器
US6654252B2 (en) Server system with removable server cartridges
US10162786B2 (en) Storage node based on PCI express interface
US20080259555A1 (en) Modular blade server
US20110222227A1 (en) Server auxiliary operating system
US20090248937A1 (en) System debug of input/output virtualization device
KR102403627B1 (ko) Fpga 기반의 aic ssd를 지원하는 장치 및 방법
CN102478949B (zh) 伺服器
US10200309B2 (en) Two-headed switch including a drive bay for fabric-attached devices
CN111324189A (zh) 散热装置及应用所述散热装置的服务器
CN103034302B (zh) 伺服器
CN104597973B (zh) 云服务器系统
CN109683679A (zh) 一种通用型服务器
JP2024019348A (ja) ストレージ装置のための装置
CN102281740B (zh) 一种散热装置及方法
CN210573518U (zh) 一种基于PCIe Switch的扩展存储卡
CN109271337A (zh) 一种基于hgx-2的gpu-box系统架构
CN102637064B (zh) 小型机及小型机系统
CN208314678U (zh) 电脑机箱主板支架
CN206003023U (zh) 一种计算机主板固定装置
CN205608596U (zh) 无风扇低噪声计算机主板结构及计算机
CN104991610B (zh) 虚拟仪器平台
CN212845507U (zh) 一种多功能测试装置
RU208803U1 (ru) Модуль центрального процессора
CN201876765U (zh) 双层转接板装置

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant