CN111651399A - 一种ai板卡及主机 - Google Patents

一种ai板卡及主机 Download PDF

Info

Publication number
CN111651399A
CN111651399A CN202010481830.6A CN202010481830A CN111651399A CN 111651399 A CN111651399 A CN 111651399A CN 202010481830 A CN202010481830 A CN 202010481830A CN 111651399 A CN111651399 A CN 111651399A
Authority
CN
China
Prior art keywords
chip
board
processing
processing chip
host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010481830.6A
Other languages
English (en)
Inventor
赵勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tongtaiyi Information Technology Co ltd
Original Assignee
Shenzhen Tongtaiyi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tongtaiyi Information Technology Co ltd filed Critical Shenzhen Tongtaiyi Information Technology Co ltd
Priority to CN202010481830.6A priority Critical patent/CN111651399A/zh
Publication of CN111651399A publication Critical patent/CN111651399A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4004Coupling between buses
    • G06F13/4022Coupling between buses using switching circuits, e.g. switching matrix, connection or expansion network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0026PCI express

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Systems (AREA)

Abstract

本发明揭示了一种AI板卡及主机,其中,所述AI板卡,应用于主机,包括:处理芯片,用于编码和解码,芯片的型号包括HI3559A;存储芯片,用于暂存数据,供处理芯片调用;PCIE SWITCH,用于连接处理芯片和主机的CPU;处理芯片的数量为八个,且八个处理芯片采取并联堆叠设计;各处理芯片均连接两颗存储芯片;PCIE SWITCH包括9个PCIE接口,8个为X2带宽的下游端口,与处理芯片连接,1个为X16带宽的上行端口,与主机的CPU连接。与现有技术相比,本发明的板卡具备强大的数据编解码能力,以及数据分析和推理能力。此外,本发明采用国产海思HI3559A芯片,价格远低于英伟达等外国厂商的芯片,在保证板卡性能的前提下,大幅降低AI板卡生产成本。

Description

一种AI板卡及主机
技术领域
本发明涉及到计算机领域,特别是涉及到一种AI板卡及主机。
背景技术
随着信息技术的发展,各行各业都在涉及AI(Artificial Intelligence,人工智能)。芯片是AI领域的硬件核心。在该领域中,美国公司英伟达是行业龙头。这家国外公司主要出售图形显卡芯片及其各种形态的AI,图形处理,深度学习等板卡及其设备;不仅仅是安防领域,其它诸如汽车行业智能驾驶,大气分析,机器学习等,都会用到这家公司生产的硬件设备;而且这家公司占用市场近70%的市场份额,绝对处于垄断地位。因此,英伟达所有的硬件设备,价格高昂,而且牢牢把握话语权。而且,另外一家国外公司AMD,也是生产图形显卡和芯片的公司,占据剩下20%的市场份额。由于芯片的被国外公司垄断,芯片价格高昂,导致现有AI板卡生产成本高。
发明内容
本发明的主要目的为提供一种AI板卡,旨在解决降低现有AI板卡生产成本高的技术问题。
本发明提出一种AI板卡,应用于主机,包括:
处理芯片,用于编码和解码,芯片的型号包括HI3559A;
存储芯片,用于暂存数据,供处理芯片调用;
PCIE SWITCH,用于连接处理芯片和主机的CPU;
处理芯片的数量为八个,且八个处理芯片采取并联堆叠设计;
各处理芯片均连接预设数量的存储芯片;
PCIE SWITCH包括9个PCIE接口,8个为X2带宽的下游端口,与处理芯片连接,1个为X16带宽的上行端口,与主机的CPU连接。
优选的,AI板卡还包括时钟拓展模块;
时钟拓展模块的信号输出端分别连接各处理芯片和PCIE SWITCH,给处理芯片和PCIE SWITCH提供频率为100MHz的时钟信号。
优选的,AI板卡还包括I2C设备;
处理芯片具有I2C接口;
将八个处理芯片的I2C接口连接到一总线;
I2C设备连接至总线,使得处理芯片与I2C设备通信连接。
优选的,I2C设备包括I2C温度传感器。
优选的,I2C设备还包括I2C功率检测器件。
优选的,I2C设备还包括数字ID芯片。
优选的,I2C设备还包括现场可更换单元。
优选的,AI板卡AI板卡的高度包括111.15mm,板卡的长度包括267mm。
本发明还提供一种主机,包含上述的AI板卡。
本发明的有益效果在于:本发明的板卡具备强大的数据编解码能力,以及数据分析和推理能力。此外,本发明采用国产海思HI3559A芯片,价格远低于英伟达等外国厂商的芯片,在保证板卡性能的前提下,大幅降低AI板卡生产成本。
附图说明
图1为本发明一种AI板卡的第一结构示意图;
图2为图1中AI板卡的工作示意图;
图3为本发明一种AI板卡的第二结构示意图;
图4为图1中AI板卡的时钟拓展模块的工作示意图;
图5为图1中的AI板卡连接外设的结构示意图。
标号说明:
1、处理芯片;2、存储芯片;3、PCIE SWITCH;4、时钟拓展模块。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1至图3,本发明提供一种AI板卡,应用于主机,包括:
处理芯片1,用于编码和解码,芯片的型号包括HI3559A;
存储芯片2,用于暂存数据,供处理芯片1调用;
PCIE SWITCH3,用于连接处理芯片和主机的CPU;
处理芯片1的数量为八个,且八个处理芯片1采取并联堆叠设计;
各处理芯片1均连接预设数量的存储芯片2,预设数量包括二、四和八;
PCIE SWITCH3包括9个PCIE接口,8个为X2带宽的下游端口,与处理芯片1连接,1个为X16带宽的上行端口,与主机的CPU连接。
在本发明实施例中,AI板卡包括处理芯片1、存储芯片2和PCIE SWITCH3,其中,处理芯片1的型号包括华为海思的HI3559A,存储芯片2包括DDR4 SDRAM,HI3559A这颗SOC内集成了内存控制器,支持2个Memory通道;Memory内存颗粒跟HI3559A内部的内存控制器通信。该款芯片具有强大的编解码处理能力,支持16路1080P解码能力,同时内置NINE神经网络加速引擎,具有4T浮点运算能力,同时支持标准PCIE 2.0x2接口(配置为端点设备)用来传递数据。正是基于HI3559A强大的编、解码能力和具有PCIE通信的特点,架构中采用PCIESWITCH。PCIE SWITCH上游端口采用PCIE X16链路带宽与主机的CPU进行数据通信,PCIESWITCH配置8个下游端口,分别与8个HI3559A进行数据通信,HI3559A全部配置成PCIE设备。本板卡通过8颗处理芯片1并联堆叠,具有强大的算力,可以支持图像识别解码分析,数据推理等运用。本板卡突破原有HI3559A的应用领域,主要通过PCIE(peripheral componentinterconnect express,高速串行计算机扩展总线标准)接口来获取通信数据,具体过程包括主机系统通过PCIE总线枚举到本板卡的8颗海思HI3559A,根据主机系统的应用软件调度,把需要分析或是需要进行编、解码的数据通过PCIE总线传递给处理芯片1,处理芯片1利用内部强大的编解码引擎,对数据进行编码或解码,或是其它分析;分析完后,对数据进行封包处理,然后根据应用软件调度,把这些处理好的数据送往具体的单元(例如SSD或硬盘),同时本板卡可通过PCIE接口上报与处理芯片1通信连接的外设信息(如温度和功耗等信息)。
在本发明实施例中,本板卡的数据应用模式如下:1、本板卡是PCIE板卡,插入主机板中使用,其中,主机可以是ARM架构,也可是X86架构;2、不再使用PCIE中的CMOS传感器进行图像数据采集,而是采用PCIE进行数据采集和传输;3、当本板卡插入到主机中,主机系统在应用软件的调度下,把需要的数据通过PCIE接口,把数据传输到本发明的板卡;4、本发明板卡在接收到PCIE数据后,根据系统和驱动软件的拆包后,根据指令,对这些数据进行编码或是解码;5、把经过处理后的数据再次封装成PCIE格式的包,传送给系统应用端;6、最后、主机系统根据软件应用,进行分发调度。
此外,在本发明实施例中,具备8颗HI3559A芯片的板卡,可用SOC内部强大的编解码能力,可以并发处理多任务,图形解码或是编码;同时输出数据接口采用PCIE 2.0x 16(单向8GB的带宽能力),可以快速的传递数据,在诸多领域,比如图像对比,人脸识别等应用领域可以实现快速的比对;另外,HI3559A芯片集成了加速引擎NNIE,且8颗芯片并行运算,实现一些深度学习,应用在一些图片分类,目标检测等场景。
综上,本发明的板卡具备强大的数据编解码能力,以及数据分析和推理能力。此外,本发明采用国产海思HI3559A芯片,价格远低于英伟达等外国厂商的芯片,在保证板卡性能的前提下,大幅降低AI板卡生产成本。
参照图4,AI板卡还包括时钟拓展模块4;
时钟拓展模块4的信号输出端分别连接各处理芯片1和PCIE SWITCH3,给处理芯片1和PCIE SWITCH3提供频率为100MHz的时钟信号。
在本发明实施例中,在PCIE规范中,100MHZ时钟是PCIE设备的基准时钟;PCIE设备利用这个基准时钟,进行内部倍频,同时,PCIE芯片RX端进行数据恢复后,参考该时钟进行数据位编码。
参照图5,AI板卡还包括I2C设备;
处理芯片1具有I2C接口;
将八个处理芯片1的I2C接口连接到一总线;
I2C设备连接至总线,使得处理芯片1与I2C设备通信连接。
在本发明实施例中,为了拓展本AI板卡的功能,处理芯片1会通过I2C接口连接外部设备。I2C设备包括I2C温度传感器、I2C功率检测器件、数字ID芯片和现场可更换单元。综上,本板卡可以通过PCIE总线上报温度,功耗,数字ID等。
进一步地,板卡的高度包括111.15mm,板卡的长度包括267mm。
在本发明实施例中,板卡的高度包括111.15mm,板卡的长度包括267mm该尺寸采用全高全长板卡形态,适用于现有应用环境。
进一步地,本发明还提供一种主机,包含上述的板卡。
在本发明实施例中,包含上述板卡的主机具备图像对比,人脸识别、深度学习和目标检测等功能。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种AI板卡,其特征在于,应用于主机,包括:
处理芯片,用于编码和解码,所述芯片的型号包括HI3559A;
存储芯片,用于暂存数据,供所述处理芯片调用;
PCIE SWITCH,用于连接处理芯片和所述主机的CPU;
所述处理芯片的数量为八个,且八个所述处理芯片采取并联堆叠设计;
各所述处理芯片均连接预设数量的存储芯片;
所述PCIE SWITCH包括9个PCIE接口,8个为X2带宽的下游端口,与所述处理芯片连接,1个为X16带宽的上行端口,与所述主机的CPU连接。
2.根据权利要求1所述的AI板卡,其特征在于,还包括时钟拓展模块;
所述时钟拓展模块的信号输出端分别连接各所述处理芯片和所述PCIE SWITCH,给所述处理芯片和所述PCIE SWITCH提供频率为100MHz的时钟信号。
3.根据权利要求1所述的AI板卡,其特征在于,还包括I2C设备;
所述处理芯片具有I2C接口;
将八个所述处理芯片的I2C接口连接到一总线;
所述I2C设备连接至所述总线,使得所述处理芯片与所述I2C设备通信连接。
4.根据权利要求3所述的AI板卡,其特征在于,所述I2C设备包括I2C温度传感器。
5.根据权利要求3所述的AI板卡,其特征在于,所述I2C设备还包括I2C功率检测器件。
6.根据权利要求3所述的AI板卡,其特征在于,所述I2C设备还包括数字ID芯片。
7.根据权利要求3所述的AI板卡,其特征在于,所述I2C设备还包括现场可更换单元。
8.根据权利要求1至7任意一项所述的AI板卡,其特征在于,所述板卡的高度包括111.15mm,所述板卡的长度包括267mm。
9.一种主机,其特征在于,包含权利要求1至8任意一项所述的AI板卡。
CN202010481830.6A 2020-05-28 2020-05-28 一种ai板卡及主机 Pending CN111651399A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010481830.6A CN111651399A (zh) 2020-05-28 2020-05-28 一种ai板卡及主机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010481830.6A CN111651399A (zh) 2020-05-28 2020-05-28 一种ai板卡及主机

Publications (1)

Publication Number Publication Date
CN111651399A true CN111651399A (zh) 2020-09-11

Family

ID=72348734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010481830.6A Pending CN111651399A (zh) 2020-05-28 2020-05-28 一种ai板卡及主机

Country Status (1)

Country Link
CN (1) CN111651399A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112261460A (zh) * 2020-10-19 2021-01-22 天津津航计算技术研究所 一种基于pcie的多路视频解码方案设计方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN206178579U (zh) * 2016-07-13 2017-05-17 无锡市同芯恒通科技有限公司 基于申威411处理器和申威套片的vpx计算机主板
CN208766660U (zh) * 2018-10-30 2019-04-19 北京旷视科技有限公司 处理板卡

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN206178579U (zh) * 2016-07-13 2017-05-17 无锡市同芯恒通科技有限公司 基于申威411处理器和申威套片的vpx计算机主板
CN208766660U (zh) * 2018-10-30 2019-04-19 北京旷视科技有限公司 处理板卡

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112261460A (zh) * 2020-10-19 2021-01-22 天津津航计算技术研究所 一种基于pcie的多路视频解码方案设计方法
CN112261460B (zh) * 2020-10-19 2022-09-27 天津津航计算技术研究所 一种基于pcie的多路视频解码方案设计方法

Similar Documents

Publication Publication Date Title
CN110471872B (zh) 一种基于zynq芯片实现m-lvds总线数据交互系统和方法
CN103841316A (zh) 数据处理装置及其相关的数据处理方法
CN108255776B (zh) 一种兼容apb总线的i3c主设备、主从系统及通信方法
KR20130042370A (ko) Ufs 인터페이스의 테스트 방법 및 이의 테스트 방법으로 테스트를 수행하는 메모리 장치
CN105208034A (zh) 一种spi总线与can总线协议转换电路及方法
CN211956463U (zh) 一种基于飞腾处理器的i/o桥片
CN104850516B (zh) 一种ddr变频设计方法和装置
CN111651399A (zh) 一种ai板卡及主机
CN111124985A (zh) 一种移动终端只读控制方法及装置
CN114817114A (zh) 一种mipi接口、及其控制方法、装置及介质
CN114327975A (zh) 片上系统
CN101246465A (zh) 通用串行总线芯片
WO2016127953A1 (zh) 基于软硬架构的高端容错计算机fpga专用调试方法及其装置
CN205263807U (zh) 一种PCIe接口的双路FC电路结构
US7779314B2 (en) System and related method for chip I/O test
CN115454881A (zh) Risc-v架构的调试系统及调试方法
CN115587059A (zh) 一种数据转换系统
CN213581897U (zh) 一种新型显示控制计算模块
CN112131168B (zh) 一种多芯片组及控制方法
CN112948303B (zh) 一种以u.2为传输接口适配服务器的音视频解码设备及方法
CN215450217U (zh) 一种图像处理模块
CN1841270A (zh) 一种用于智能卡仿真调试系统的接口
CN202372977U (zh) 基于fpga实现的usb主设备端接口结构
US8412916B2 (en) Computing system having CPU and bridge operating using CPU frequency
CN115617722B (zh) 实现多pcie设备共享dma链表的系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200911