CN111651399A - 一种ai板卡及主机 - Google Patents
一种ai板卡及主机 Download PDFInfo
- Publication number
- CN111651399A CN111651399A CN202010481830.6A CN202010481830A CN111651399A CN 111651399 A CN111651399 A CN 111651399A CN 202010481830 A CN202010481830 A CN 202010481830A CN 111651399 A CN111651399 A CN 111651399A
- Authority
- CN
- China
- Prior art keywords
- chip
- board
- processing
- processing chip
- host
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 53
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 5
- 238000013461 design Methods 0.000 claims abstract description 4
- 238000003860 storage Methods 0.000 claims abstract description 4
- 238000004519 manufacturing process Methods 0.000 abstract description 5
- 238000007405 data analysis Methods 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 description 26
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 101100498818 Arabidopsis thaliana DDR4 gene Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/40—Bus structure
- G06F13/4004—Coupling between buses
- G06F13/4022—Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2213/00—Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F2213/0026—PCI express
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Information Transfer Systems (AREA)
Abstract
本发明揭示了一种AI板卡及主机,其中,所述AI板卡,应用于主机,包括:处理芯片,用于编码和解码,芯片的型号包括HI3559A;存储芯片,用于暂存数据,供处理芯片调用;PCIE SWITCH,用于连接处理芯片和主机的CPU;处理芯片的数量为八个,且八个处理芯片采取并联堆叠设计;各处理芯片均连接两颗存储芯片;PCIE SWITCH包括9个PCIE接口,8个为X2带宽的下游端口,与处理芯片连接,1个为X16带宽的上行端口,与主机的CPU连接。与现有技术相比,本发明的板卡具备强大的数据编解码能力,以及数据分析和推理能力。此外,本发明采用国产海思HI3559A芯片,价格远低于英伟达等外国厂商的芯片,在保证板卡性能的前提下,大幅降低AI板卡生产成本。
Description
技术领域
本发明涉及到计算机领域,特别是涉及到一种AI板卡及主机。
背景技术
随着信息技术的发展,各行各业都在涉及AI(Artificial Intelligence,人工智能)。芯片是AI领域的硬件核心。在该领域中,美国公司英伟达是行业龙头。这家国外公司主要出售图形显卡芯片及其各种形态的AI,图形处理,深度学习等板卡及其设备;不仅仅是安防领域,其它诸如汽车行业智能驾驶,大气分析,机器学习等,都会用到这家公司生产的硬件设备;而且这家公司占用市场近70%的市场份额,绝对处于垄断地位。因此,英伟达所有的硬件设备,价格高昂,而且牢牢把握话语权。而且,另外一家国外公司AMD,也是生产图形显卡和芯片的公司,占据剩下20%的市场份额。由于芯片的被国外公司垄断,芯片价格高昂,导致现有AI板卡生产成本高。
发明内容
本发明的主要目的为提供一种AI板卡,旨在解决降低现有AI板卡生产成本高的技术问题。
本发明提出一种AI板卡,应用于主机,包括:
处理芯片,用于编码和解码,芯片的型号包括HI3559A;
存储芯片,用于暂存数据,供处理芯片调用;
PCIE SWITCH,用于连接处理芯片和主机的CPU;
处理芯片的数量为八个,且八个处理芯片采取并联堆叠设计;
各处理芯片均连接预设数量的存储芯片;
PCIE SWITCH包括9个PCIE接口,8个为X2带宽的下游端口,与处理芯片连接,1个为X16带宽的上行端口,与主机的CPU连接。
优选的,AI板卡还包括时钟拓展模块;
时钟拓展模块的信号输出端分别连接各处理芯片和PCIE SWITCH,给处理芯片和PCIE SWITCH提供频率为100MHz的时钟信号。
优选的,AI板卡还包括I2C设备;
处理芯片具有I2C接口;
将八个处理芯片的I2C接口连接到一总线;
I2C设备连接至总线,使得处理芯片与I2C设备通信连接。
优选的,I2C设备包括I2C温度传感器。
优选的,I2C设备还包括I2C功率检测器件。
优选的,I2C设备还包括数字ID芯片。
优选的,I2C设备还包括现场可更换单元。
优选的,AI板卡AI板卡的高度包括111.15mm,板卡的长度包括267mm。
本发明还提供一种主机,包含上述的AI板卡。
本发明的有益效果在于:本发明的板卡具备强大的数据编解码能力,以及数据分析和推理能力。此外,本发明采用国产海思HI3559A芯片,价格远低于英伟达等外国厂商的芯片,在保证板卡性能的前提下,大幅降低AI板卡生产成本。
附图说明
图1为本发明一种AI板卡的第一结构示意图;
图2为图1中AI板卡的工作示意图;
图3为本发明一种AI板卡的第二结构示意图;
图4为图1中AI板卡的时钟拓展模块的工作示意图;
图5为图1中的AI板卡连接外设的结构示意图。
标号说明:
1、处理芯片;2、存储芯片;3、PCIE SWITCH;4、时钟拓展模块。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1至图3,本发明提供一种AI板卡,应用于主机,包括:
处理芯片1,用于编码和解码,芯片的型号包括HI3559A;
存储芯片2,用于暂存数据,供处理芯片1调用;
PCIE SWITCH3,用于连接处理芯片和主机的CPU;
处理芯片1的数量为八个,且八个处理芯片1采取并联堆叠设计;
各处理芯片1均连接预设数量的存储芯片2,预设数量包括二、四和八;
PCIE SWITCH3包括9个PCIE接口,8个为X2带宽的下游端口,与处理芯片1连接,1个为X16带宽的上行端口,与主机的CPU连接。
在本发明实施例中,AI板卡包括处理芯片1、存储芯片2和PCIE SWITCH3,其中,处理芯片1的型号包括华为海思的HI3559A,存储芯片2包括DDR4 SDRAM,HI3559A这颗SOC内集成了内存控制器,支持2个Memory通道;Memory内存颗粒跟HI3559A内部的内存控制器通信。该款芯片具有强大的编解码处理能力,支持16路1080P解码能力,同时内置NINE神经网络加速引擎,具有4T浮点运算能力,同时支持标准PCIE 2.0x2接口(配置为端点设备)用来传递数据。正是基于HI3559A强大的编、解码能力和具有PCIE通信的特点,架构中采用PCIESWITCH。PCIE SWITCH上游端口采用PCIE X16链路带宽与主机的CPU进行数据通信,PCIESWITCH配置8个下游端口,分别与8个HI3559A进行数据通信,HI3559A全部配置成PCIE设备。本板卡通过8颗处理芯片1并联堆叠,具有强大的算力,可以支持图像识别解码分析,数据推理等运用。本板卡突破原有HI3559A的应用领域,主要通过PCIE(peripheral componentinterconnect express,高速串行计算机扩展总线标准)接口来获取通信数据,具体过程包括主机系统通过PCIE总线枚举到本板卡的8颗海思HI3559A,根据主机系统的应用软件调度,把需要分析或是需要进行编、解码的数据通过PCIE总线传递给处理芯片1,处理芯片1利用内部强大的编解码引擎,对数据进行编码或解码,或是其它分析;分析完后,对数据进行封包处理,然后根据应用软件调度,把这些处理好的数据送往具体的单元(例如SSD或硬盘),同时本板卡可通过PCIE接口上报与处理芯片1通信连接的外设信息(如温度和功耗等信息)。
在本发明实施例中,本板卡的数据应用模式如下:1、本板卡是PCIE板卡,插入主机板中使用,其中,主机可以是ARM架构,也可是X86架构;2、不再使用PCIE中的CMOS传感器进行图像数据采集,而是采用PCIE进行数据采集和传输;3、当本板卡插入到主机中,主机系统在应用软件的调度下,把需要的数据通过PCIE接口,把数据传输到本发明的板卡;4、本发明板卡在接收到PCIE数据后,根据系统和驱动软件的拆包后,根据指令,对这些数据进行编码或是解码;5、把经过处理后的数据再次封装成PCIE格式的包,传送给系统应用端;6、最后、主机系统根据软件应用,进行分发调度。
此外,在本发明实施例中,具备8颗HI3559A芯片的板卡,可用SOC内部强大的编解码能力,可以并发处理多任务,图形解码或是编码;同时输出数据接口采用PCIE 2.0x 16(单向8GB的带宽能力),可以快速的传递数据,在诸多领域,比如图像对比,人脸识别等应用领域可以实现快速的比对;另外,HI3559A芯片集成了加速引擎NNIE,且8颗芯片并行运算,实现一些深度学习,应用在一些图片分类,目标检测等场景。
综上,本发明的板卡具备强大的数据编解码能力,以及数据分析和推理能力。此外,本发明采用国产海思HI3559A芯片,价格远低于英伟达等外国厂商的芯片,在保证板卡性能的前提下,大幅降低AI板卡生产成本。
参照图4,AI板卡还包括时钟拓展模块4;
时钟拓展模块4的信号输出端分别连接各处理芯片1和PCIE SWITCH3,给处理芯片1和PCIE SWITCH3提供频率为100MHz的时钟信号。
在本发明实施例中,在PCIE规范中,100MHZ时钟是PCIE设备的基准时钟;PCIE设备利用这个基准时钟,进行内部倍频,同时,PCIE芯片RX端进行数据恢复后,参考该时钟进行数据位编码。
参照图5,AI板卡还包括I2C设备;
处理芯片1具有I2C接口;
将八个处理芯片1的I2C接口连接到一总线;
I2C设备连接至总线,使得处理芯片1与I2C设备通信连接。
在本发明实施例中,为了拓展本AI板卡的功能,处理芯片1会通过I2C接口连接外部设备。I2C设备包括I2C温度传感器、I2C功率检测器件、数字ID芯片和现场可更换单元。综上,本板卡可以通过PCIE总线上报温度,功耗,数字ID等。
进一步地,板卡的高度包括111.15mm,板卡的长度包括267mm。
在本发明实施例中,板卡的高度包括111.15mm,板卡的长度包括267mm该尺寸采用全高全长板卡形态,适用于现有应用环境。
进一步地,本发明还提供一种主机,包含上述的板卡。
在本发明实施例中,包含上述板卡的主机具备图像对比,人脸识别、深度学习和目标检测等功能。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (9)
1.一种AI板卡,其特征在于,应用于主机,包括:
处理芯片,用于编码和解码,所述芯片的型号包括HI3559A;
存储芯片,用于暂存数据,供所述处理芯片调用;
PCIE SWITCH,用于连接处理芯片和所述主机的CPU;
所述处理芯片的数量为八个,且八个所述处理芯片采取并联堆叠设计;
各所述处理芯片均连接预设数量的存储芯片;
所述PCIE SWITCH包括9个PCIE接口,8个为X2带宽的下游端口,与所述处理芯片连接,1个为X16带宽的上行端口,与所述主机的CPU连接。
2.根据权利要求1所述的AI板卡,其特征在于,还包括时钟拓展模块;
所述时钟拓展模块的信号输出端分别连接各所述处理芯片和所述PCIE SWITCH,给所述处理芯片和所述PCIE SWITCH提供频率为100MHz的时钟信号。
3.根据权利要求1所述的AI板卡,其特征在于,还包括I2C设备;
所述处理芯片具有I2C接口;
将八个所述处理芯片的I2C接口连接到一总线;
所述I2C设备连接至所述总线,使得所述处理芯片与所述I2C设备通信连接。
4.根据权利要求3所述的AI板卡,其特征在于,所述I2C设备包括I2C温度传感器。
5.根据权利要求3所述的AI板卡,其特征在于,所述I2C设备还包括I2C功率检测器件。
6.根据权利要求3所述的AI板卡,其特征在于,所述I2C设备还包括数字ID芯片。
7.根据权利要求3所述的AI板卡,其特征在于,所述I2C设备还包括现场可更换单元。
8.根据权利要求1至7任意一项所述的AI板卡,其特征在于,所述板卡的高度包括111.15mm,所述板卡的长度包括267mm。
9.一种主机,其特征在于,包含权利要求1至8任意一项所述的AI板卡。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010481830.6A CN111651399A (zh) | 2020-05-28 | 2020-05-28 | 一种ai板卡及主机 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010481830.6A CN111651399A (zh) | 2020-05-28 | 2020-05-28 | 一种ai板卡及主机 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111651399A true CN111651399A (zh) | 2020-09-11 |
Family
ID=72348734
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010481830.6A Pending CN111651399A (zh) | 2020-05-28 | 2020-05-28 | 一种ai板卡及主机 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111651399A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112261460A (zh) * | 2020-10-19 | 2021-01-22 | 天津津航计算技术研究所 | 一种基于pcie的多路视频解码方案设计方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN206178579U (zh) * | 2016-07-13 | 2017-05-17 | 无锡市同芯恒通科技有限公司 | 基于申威411处理器和申威套片的vpx计算机主板 |
CN208766660U (zh) * | 2018-10-30 | 2019-04-19 | 北京旷视科技有限公司 | 处理板卡 |
-
2020
- 2020-05-28 CN CN202010481830.6A patent/CN111651399A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN206178579U (zh) * | 2016-07-13 | 2017-05-17 | 无锡市同芯恒通科技有限公司 | 基于申威411处理器和申威套片的vpx计算机主板 |
CN208766660U (zh) * | 2018-10-30 | 2019-04-19 | 北京旷视科技有限公司 | 处理板卡 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112261460A (zh) * | 2020-10-19 | 2021-01-22 | 天津津航计算技术研究所 | 一种基于pcie的多路视频解码方案设计方法 |
CN112261460B (zh) * | 2020-10-19 | 2022-09-27 | 天津津航计算技术研究所 | 一种基于pcie的多路视频解码方案设计方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110471872B (zh) | 一种基于zynq芯片实现m-lvds总线数据交互系统和方法 | |
CN103841316A (zh) | 数据处理装置及其相关的数据处理方法 | |
CN108255776B (zh) | 一种兼容apb总线的i3c主设备、主从系统及通信方法 | |
KR20130042370A (ko) | Ufs 인터페이스의 테스트 방법 및 이의 테스트 방법으로 테스트를 수행하는 메모리 장치 | |
CN105208034A (zh) | 一种spi总线与can总线协议转换电路及方法 | |
CN211956463U (zh) | 一种基于飞腾处理器的i/o桥片 | |
CN104850516B (zh) | 一种ddr变频设计方法和装置 | |
CN111651399A (zh) | 一种ai板卡及主机 | |
CN111124985A (zh) | 一种移动终端只读控制方法及装置 | |
CN114817114A (zh) | 一种mipi接口、及其控制方法、装置及介质 | |
CN114327975A (zh) | 片上系统 | |
CN101246465A (zh) | 通用串行总线芯片 | |
WO2016127953A1 (zh) | 基于软硬架构的高端容错计算机fpga专用调试方法及其装置 | |
CN205263807U (zh) | 一种PCIe接口的双路FC电路结构 | |
US7779314B2 (en) | System and related method for chip I/O test | |
CN115454881A (zh) | Risc-v架构的调试系统及调试方法 | |
CN115587059A (zh) | 一种数据转换系统 | |
CN213581897U (zh) | 一种新型显示控制计算模块 | |
CN112131168B (zh) | 一种多芯片组及控制方法 | |
CN112948303B (zh) | 一种以u.2为传输接口适配服务器的音视频解码设备及方法 | |
CN215450217U (zh) | 一种图像处理模块 | |
CN1841270A (zh) | 一种用于智能卡仿真调试系统的接口 | |
CN202372977U (zh) | 基于fpga实现的usb主设备端接口结构 | |
US8412916B2 (en) | Computing system having CPU and bridge operating using CPU frequency | |
CN115617722B (zh) | 实现多pcie设备共享dma链表的系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200911 |