CN101527010A - 人工神经网络算法的硬件实现方法及其系统 - Google Patents
人工神经网络算法的硬件实现方法及其系统 Download PDFInfo
- Publication number
- CN101527010A CN101527010A CN200810034313A CN200810034313A CN101527010A CN 101527010 A CN101527010 A CN 101527010A CN 200810034313 A CN200810034313 A CN 200810034313A CN 200810034313 A CN200810034313 A CN 200810034313A CN 101527010 A CN101527010 A CN 101527010A
- Authority
- CN
- China
- Prior art keywords
- neural network
- algorithm
- neuron
- pulse
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Devices For Executing Special Programs (AREA)
Abstract
本发明提供一种人工神经网络算法的硬件实现方法及其系统,克服了现有的硬件实现技术的昂贵与占用硬件资源过大的缺陷;它包括顶层模块,所述顶层模块由若干神经元模块组成,所述神经元模块的脉冲输入端输入给定的权值乘积,其输出端通过正态分布随机发生器和非线性变换器拟合成神经网络的Sigmoid函数,再经过脉冲转换器,转换成脉冲输出;本发明的神经网络算法的硬件实现方法及其系统和现有的实现技术相比,克服以往软件实现中的串行方式来完成并行计算的尴尬,取代了软件实现的弊端;又由于进行了算法优化,节省了大量硬件资源,在FPGA平台上实现,成本较低,利用优化的算法,避开了Sigmoid函数用硬件难以实现的困境,又使用了累加方式,节省了硬件资源。
Description
技术领域
本发明涉及一种人工神经网络算法,特别涉及一种通过FPGA硬件的人工神经网络算法的硬件实现方法及其系统。
背景技术
人工神经网络是一种模拟人的直观性的思维,是一个非线性动力学系统,其特点在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单,功能有限,但大量神经元构成的网络系统所能实现的行为却是极其丰富多彩的。人工神经网络的研究就是有效的利用了人大脑的这一特性,属于一门新兴的边缘和交叉科学,对神经网络的研究,必定会对计算机科学和智能科学产生深刻的影响,提高计算机的智能水平。
人工神经网络的实现技术主要可以分为软件实现和硬件实现两种类型。软件实现依托于目前的高性能计算机,通过程序编制来模拟实现神经网络,随着计算机处理能力的不断增强,这种技术的应用范围也越来越广。而硬件实现就是借助于微电子、光电子技术用硬件直接实现神经网络。
软件实现人工神经网络的局限性在于软件实现人工神经网络是由支撑软件运行的平台决定的,而目前的软件都是运行在单处理器的计算机或者工作站上,这些计算机都是采用串行计算的方式来完成任务,因此其运算速度远未达到实现实时神经网络的要求。虽然现在不断出现的多级流水线结构的专用数字信号处理芯片从某种程度上为实现人工神经网络的并行处理提供了可能,但是其单计算单元和总线冲突控制的限制使其不可能在同一时间完成多个神经元加权和计算。
人工神经网络的硬件实现是基于不断发展的半导体技术的;所谓硬件实现是指物理上的处理单元及通讯通道与一个实际应用的神经网络模型中的神经元及连接一一对应。因此,要采用硬件实现的方式实现一个较大规模的人工神经网络,需要耗费大量的硬件资源。
近几十年来,半导体工艺的发展一直遵循摩尔定律,面积不断增大的晶圆、宽度不断减小的连线、更加先进的蚀刻工艺等都使得我们可以在一块芯片上集成更多的晶体管,因而可以实现更大规模、更加复杂的神经网络。
尽管许多通过电脑程序的人工神经网络模拟已经被人们实现了,但电脑硬件不是为神经网络处理而最优化的,同时微处理器和DSP并不合适于并行设计。全并行的模块也可以使用ASIC或VLSI来实现,但由于其开发的昂贵性和时间消耗太大,加之人工神经网络设计是仅针对一个目标的设计,所以并不是很适合用于人工神经网络的开发。
发明内容
本发明的目的在于提供一种人工神经网络算法的硬件实现方法及其系统,克服了现有的硬件实现技术的昂贵与占用硬件资源过大的缺陷,用VHDL实现,便于硬件实现并且可以节省硬件资源。
本发明所解决的技术问题可以采用以下技术方案来实现:
一种人工神经网络算法的硬件实现方法,其特征在于,它包括如下的步骤:
(1)进行人工神经网络算法将算法结果拟合成神经元的Sigmoid函数;
(2)用硬件描述语言VHDL实现步骤(1)所述的算法。
所述的算法为将输入值看成随机脉冲,在给点标准脉冲输入的情况下,输入的随机脉冲与标准脉冲之间的距离可看作是一系列随机事件,并服从正态分布,将这些脉冲累加,拟合成神经元的Sigmoid函数。
所述人工神经网络算法的硬件实现方法还包括验证步骤,所述步骤为输入(0,0)(0,1)(1,0)(1,1)对应的脉冲序列和权值,在输出端得到相应的输出脉冲,与标准脉冲比较后,是否与异或算法的输出脉冲相符。
一种人工神经网络算法的系统,其特征在于,它包括顶层模块,所述顶层模块由若干神经元模块组成,所述神经元模块的脉冲输入端输入给定的权值乘积,其输出端通过正态分布随机发生器和非线性变换器拟合成神经元的Sigmoid函数,再经过脉冲转换器,转换成脉冲输出。
所述人工神经网络算法的系统采用3-2-1网络,所述顶层模块包括3个输入神经元、2个隐含层神经元、1个输出层神经元。
所述神经元模块由乘法器和累加器组成,在时钟同步信号的控制下从上层神经元的输入串行进入神经元并和其权值相乘,相乘结果在累加器中累加。
所述神经元模块完成任务的时钟周期等于其连接上层网络的连接数目。
所述神经元模块是并行处理的,其从公共输入线上得到一个输入。
本发明的神经网络算法的硬件实现方法及其系统和现有的实现技术相比,克服以往软件实现中的串行方式来完成并行计算的尴尬,取代了软件实现的弊端;又由于进行了算法优化,节省了大量硬件资源,在FPGA平台上实现,成本较低,利用优化的算法,避开了Sigmoid函数用硬件难以实现的困境,又使用了累加方式,节省了硬件资源。
附图说明
图1为本发明的结构示意图;
图2为本发明的模块结构图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。
如图1、图2所示,一种人工神经网络算法的系统,它包括顶层模块xor_s,顶层模块xor_s由若干神经元模块NY3_s组成。神经元模块NY3_s由乘法器Multiplier_s和累加器Adder_s组成,在时钟同步信号的控制下从上层神经元的输入串行进入神经元并和其权值相乘,相乘结果在累加器Adder_s中累加。
所述人工神经网络算法的系统采用3-2-1网络,顶层模块xor_s包括3个输入神经元、2个隐含层神经元、1个输出层神经元。
参见图1,整个神经网络可以由3个3输入1输出的神经元模块NY3_s构成(阴影部分)。每个神经元模块NY3_s的模型可以用图1和图2所阐述的数学模型代替,其中每个神经元模块NY3_s的3个输入脉冲经过给定的权值乘积,输入到累加器Adder_s中,再由正态分布随机发生器LFSR_s产生对应的随机数,拟合成Sigmoid函数,完成相应的函数变换功能后,再经过脉冲转换器,转换成脉冲输出。
(1)数据表示:
在开始一个人工神经网络设计之前,关于输入、权重、和激活函数等数据格式(定点,浮点等问题)必须考虑,但提高设计元素的精度会显著地增加资源消耗。在学习阶段数据精度必须尽可能地高,而在传播阶段,较低精度也是可以接受的。在解决异或(XOR)问题中我们规定输入值在0和1之间,训练结果产生的权值必须在0和1之间。我们选择带符号位的8位精度来覆盖[0,1]的范围。
(2)网络结构:
在FPGA上实现全并行神经网络,在全并行的网络中每个神经元模块NY3_s的乘法器Multiplier_s的数目和到此神经元模块NY3_s的连接数是相等的,而且所有的输出必须求和。累加器Adder_s的数目为和连接到上层的连接的数目减1,见图1。
(3)神经元模块NY3_s结构:
每个神经元模块NY3_s有一个乘法器Multiplier_s和累加器Adder_s,处理时,在时钟同步信号的控制下从上层神经元的输入串行进入神经元并和其权值相乘,每个神经元模块NY3_s有它自己保存权值的地方,相乘结果在累加器Adder_s中累加。每个神经元模块NY3_s完成任务的时钟周期等于其连接上层网络的连接数目。
(4)层次结构:
所有的神经元模块NY3_s都是并行处理的,它们从公共输入线上得到一个输入,乘以相应的权值再累加其输出,不计输入层的神经元,把隐含层和输出层的神经元共有3个,为使算法简单,每个设计元设计成3输入1输出。这样在编程的时候底层模块可以分别调用3个神经元。
(5)激活函数:
将输入脉冲加权后累加可以得到Sigmoid函数的拟合,这和传统的查表法编程相比,可以节省大量硬件资源。
图2是各个主要VHDL程序在QuartusII生成的Block图,其中xor_s是顶层模块,由三个神经元模块NY3_s组成。
所述人工神经网络算法的硬件实现方法,它包括如下的步骤:
(1)进行人工神经网络算法将算法结果拟合成神经网络的Sigmoid函数;
(2)用硬件描述语言VHDL实现步骤(1)所述的算法。
所述的算法为将输入值看成随机脉冲,在给点标准脉冲输入的情况下,输入的随机脉冲与标准脉冲之间的距离可看作是一系列随机事件,并服从正态分布,将这些脉冲累加,即正态分布的积分,拟合成神经网络的Sigmoid函数。
所述人工神经网络算法的硬件实现方法还包括验证步骤,所述步骤为输入(0,0)(0,1)(1,0)(1,1)对应的脉冲序列和权值(10位2进制数),在输出端得到相应的输出脉冲,与标准脉冲比较后,是否与异或算法的输出脉冲相符。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内,本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (7)
1、一种人工神经网络算法的系统,其特征在于,它包括顶层模块,所述顶层模块由若干神经元模块组成,所述神经元模块的脉冲输入端输入给定的权值乘积,其输出端通过正态分布随机发生器和非线性变换器拟合成神经网络的Sigmoid函数,再经过脉冲转换器,转换成脉冲输出。
2、如权利要求1所述的系统,其特征在于:所述人工神经网络算法的系统采用3-2-1网络,所述顶层模块包括3个输入神经元、2个隐含层神经元、1个输出层神经元。
3、如权利要求1所述的系统,其特征在于:所述神经元模块由乘法器和累加器组成,在时钟同步信号的控制下从上层神经元的输入串行进入神经元并和其权值相乘,相乘结果在累加器中累加。
4、如权利要求1所述的系统,其特征在于:所述神经元模块完成任务的时钟周期等于其连接上层网络的连接数目。
5、一种人工神经网络算法的硬件实现方法,其特征在于,它包括如下的步骤:
(1)进行人工神经网络算法将算法结果拟合成神经网络的Sigmoid函数;
(2)用硬件描述语言VHDL实现步骤(1)所述的算法。
6、如权利要求5所述的实现方法,其特征在于:所述的算法为将输入值看成随机脉冲,在给点标准脉冲输入的情况下,输入的随机脉冲与标准脉冲之间的距离可看作是一系列随机事件,并服从正态分布,将这些脉冲累加,即正态分布的积分,拟合成神经网络的Sigmoid函数。
7、如权利要求5所述的实现方法,其特征在于:所述人工神经网络算法的硬件实现方法还包括验证步骤,所述步骤为输入(0,0)(0,1)(1,0)(1,1)对应的脉冲序列和权值,在输出端得到相应的输出脉冲,与标准脉冲比较后,是否与异或算法的输出脉冲相符。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100343133A CN101527010B (zh) | 2008-03-06 | 2008-03-06 | 人工神经网络算法的硬件实现方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100343133A CN101527010B (zh) | 2008-03-06 | 2008-03-06 | 人工神经网络算法的硬件实现方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101527010A true CN101527010A (zh) | 2009-09-09 |
CN101527010B CN101527010B (zh) | 2011-12-07 |
Family
ID=41094869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008100343133A Expired - Fee Related CN101527010B (zh) | 2008-03-06 | 2008-03-06 | 人工神经网络算法的硬件实现方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101527010B (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104484703A (zh) * | 2014-12-30 | 2015-04-01 | 合肥工业大学 | 一种基于列梅兹逼近算法的sigmoid函数拟合硬件电路 |
CN106529668A (zh) * | 2015-11-17 | 2017-03-22 | 中国科学院计算技术研究所 | 加速深度神经网络算法的加速芯片的运算装置及方法 |
CN106815638A (zh) * | 2017-01-20 | 2017-06-09 | 清华大学 | 输入权重拓展的神经元信息处理方法和系统 |
CN106991477A (zh) * | 2016-01-20 | 2017-07-28 | 南京艾溪信息科技有限公司 | 一种人工神经网络压缩编码装置和方法 |
CN107545303A (zh) * | 2016-01-20 | 2018-01-05 | 南京艾溪信息科技有限公司 | 计算装置和方法 |
CN107688853A (zh) * | 2016-08-05 | 2018-02-13 | 北京中科寒武纪科技有限公司 | 一种用于执行神经网络运算的装置及方法 |
WO2018058426A1 (zh) * | 2016-09-29 | 2018-04-05 | 清华大学 | 硬件神经网络转换方法、计算装置、编译方法和神经网络软硬件协作系统 |
CN108021537A (zh) * | 2018-01-05 | 2018-05-11 | 南京大学 | 一种基于硬件平台的softmax实现方式 |
CN108416426A (zh) * | 2018-02-05 | 2018-08-17 | 深圳市易成自动驾驶技术有限公司 | 数据处理方法、装置及计算机可读存储介质 |
CN108509179A (zh) * | 2018-04-04 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 用于生成模型的方法和装置 |
CN108734281A (zh) * | 2017-04-21 | 2018-11-02 | 上海寒武纪信息科技有限公司 | 处理装置、处理方法、芯片及电子装置 |
CN109086880A (zh) * | 2017-06-13 | 2018-12-25 | 上海寒武纪信息科技有限公司 | 一种运算装置和方法 |
CN109492761A (zh) * | 2018-10-30 | 2019-03-19 | 深圳灵图慧视科技有限公司 | 实现神经网络的fpga加速装置、方法和系统 |
CN109754066A (zh) * | 2017-11-02 | 2019-05-14 | 三星电子株式会社 | 用于生成定点型神经网络的方法和装置 |
US10338925B2 (en) | 2017-05-24 | 2019-07-02 | Microsoft Technology Licensing, Llc | Tensor register files |
US10372456B2 (en) | 2017-05-24 | 2019-08-06 | Microsoft Technology Licensing, Llc | Tensor processor instruction set architecture |
CN110209472A (zh) * | 2018-08-29 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 任务数据处理方法和板卡 |
TWI684141B (zh) * | 2017-10-12 | 2020-02-01 | 英屬開曼群島商意騰科技股份有限公司 | 人工神經元中以非零封包加速乘法運算的裝置及方法 |
TWI684140B (zh) * | 2017-03-29 | 2020-02-01 | 英屬開曼群島商意騰科技股份有限公司 | 適用於人工神經元的處理裝置及其方法 |
CN111340200A (zh) * | 2016-01-20 | 2020-06-26 | 中科寒武纪科技股份有限公司 | 用于执行人工神经网络正向运算的装置和方法 |
TWI750541B (zh) * | 2018-11-22 | 2021-12-21 | 南京大學 | 光電計算單元、光電計算陣列及光電計算方法 |
US11531541B2 (en) | 2017-04-19 | 2022-12-20 | Shanghai Cambricon Information Technology Co., Ltd | Processing apparatus and processing method |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715283B (zh) * | 2015-04-08 | 2018-09-11 | 兰州理工大学 | 一种模拟神经元互连系统及采用该系统的可编程神经元阵列芯片 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5517667A (en) * | 1993-06-14 | 1996-05-14 | Motorola, Inc. | Neural network that does not require repetitive training |
CN1204530C (zh) * | 2002-09-10 | 2005-06-01 | 西安交通大学 | 一种混沌信号和一般噪声的辨识方法 |
CN1529353A (zh) * | 2003-09-29 | 2004-09-15 | 复旦大学 | 超大规模集成电路中组合电路的等价验证方法 |
CN1300838C (zh) * | 2004-03-12 | 2007-02-14 | 中国科学院计算技术研究所 | 包含黑盒的电路设计验证与错误诊断方法 |
CN1331092C (zh) * | 2004-05-17 | 2007-08-08 | 中国科学院半导体研究所 | 模式识别专用神经网络计算机系统 |
-
2008
- 2008-03-06 CN CN2008100343133A patent/CN101527010B/zh not_active Expired - Fee Related
Cited By (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104484703A (zh) * | 2014-12-30 | 2015-04-01 | 合肥工业大学 | 一种基于列梅兹逼近算法的sigmoid函数拟合硬件电路 |
CN104484703B (zh) * | 2014-12-30 | 2017-06-30 | 合肥工业大学 | 一种基于列梅兹逼近算法的sigmoid函数拟合硬件电路 |
CN106529668A (zh) * | 2015-11-17 | 2017-03-22 | 中国科学院计算技术研究所 | 加速深度神经网络算法的加速芯片的运算装置及方法 |
WO2017084330A1 (zh) * | 2015-11-17 | 2017-05-26 | 中国科学院计算技术研究所 | 加速深度神经网络算法的加速芯片的运算装置及方法 |
US11488000B2 (en) | 2015-11-17 | 2022-11-01 | Intitute of Computing Technology, Chinese Academy of Sciences | Operation apparatus and method for acceleration chip for accelerating deep neural network algorithm |
CN106529668B (zh) * | 2015-11-17 | 2018-12-04 | 中国科学院计算技术研究所 | 加速深度神经网络算法的加速芯片的运算装置及方法 |
CN111340200B (zh) * | 2016-01-20 | 2024-05-03 | 中科寒武纪科技股份有限公司 | 用于执行人工神经网络正向运算的装置和方法 |
CN107563497A (zh) * | 2016-01-20 | 2018-01-09 | 南京艾溪信息科技有限公司 | 计算装置和方法 |
CN107545303A (zh) * | 2016-01-20 | 2018-01-05 | 南京艾溪信息科技有限公司 | 计算装置和方法 |
CN107563497B (zh) * | 2016-01-20 | 2021-03-19 | 中科寒武纪科技股份有限公司 | 用于稀疏人工神经网络的计算装置和运算方法 |
CN106991477A (zh) * | 2016-01-20 | 2017-07-28 | 南京艾溪信息科技有限公司 | 一种人工神经网络压缩编码装置和方法 |
CN106991477B (zh) * | 2016-01-20 | 2020-08-14 | 中科寒武纪科技股份有限公司 | 一种人工神经网络压缩编码装置和方法 |
CN111340200A (zh) * | 2016-01-20 | 2020-06-26 | 中科寒武纪科技股份有限公司 | 用于执行人工神经网络正向运算的装置和方法 |
CN107688853A (zh) * | 2016-08-05 | 2018-02-13 | 北京中科寒武纪科技有限公司 | 一种用于执行神经网络运算的装置及方法 |
CN107688853B (zh) * | 2016-08-05 | 2020-01-10 | 中科寒武纪科技股份有限公司 | 一种用于执行神经网络运算的装置及方法 |
WO2018058426A1 (zh) * | 2016-09-29 | 2018-04-05 | 清华大学 | 硬件神经网络转换方法、计算装置、编译方法和神经网络软硬件协作系统 |
US11544539B2 (en) | 2016-09-29 | 2023-01-03 | Tsinghua University | Hardware neural network conversion method, computing device, compiling method and neural network software and hardware collaboration system |
CN106815638B (zh) * | 2017-01-20 | 2020-03-27 | 北京灵汐科技有限公司 | 输入权重拓展的神经元信息处理方法和系统 |
CN106815638A (zh) * | 2017-01-20 | 2017-06-09 | 清华大学 | 输入权重拓展的神经元信息处理方法和系统 |
TWI684140B (zh) * | 2017-03-29 | 2020-02-01 | 英屬開曼群島商意騰科技股份有限公司 | 適用於人工神經元的處理裝置及其方法 |
US11734002B2 (en) | 2017-04-19 | 2023-08-22 | Shanghai Cambricon Information Technology Co., Ltd | Counting elements in neural network input data |
US11531541B2 (en) | 2017-04-19 | 2022-12-20 | Shanghai Cambricon Information Technology Co., Ltd | Processing apparatus and processing method |
US11720353B2 (en) | 2017-04-19 | 2023-08-08 | Shanghai Cambricon Information Technology Co., Ltd | Processing apparatus and processing method |
US11698786B2 (en) | 2017-04-19 | 2023-07-11 | Shanghai Cambricon Information Technology Co., Ltd | Processing apparatus and processing method |
US11531540B2 (en) | 2017-04-19 | 2022-12-20 | Cambricon (Xi'an) Semiconductor Co., Ltd. | Processing apparatus and processing method with dynamically configurable operation bit width |
CN108734281A (zh) * | 2017-04-21 | 2018-11-02 | 上海寒武纪信息科技有限公司 | 处理装置、处理方法、芯片及电子装置 |
US11507350B2 (en) | 2017-04-21 | 2022-11-22 | Cambricon (Xi'an) Semiconductor Co., Ltd. | Processing apparatus and processing method |
US10338925B2 (en) | 2017-05-24 | 2019-07-02 | Microsoft Technology Licensing, Llc | Tensor register files |
US10372456B2 (en) | 2017-05-24 | 2019-08-06 | Microsoft Technology Licensing, Llc | Tensor processor instruction set architecture |
CN109086880A (zh) * | 2017-06-13 | 2018-12-25 | 上海寒武纪信息科技有限公司 | 一种运算装置和方法 |
TWI684141B (zh) * | 2017-10-12 | 2020-02-01 | 英屬開曼群島商意騰科技股份有限公司 | 人工神經元中以非零封包加速乘法運算的裝置及方法 |
CN109754066B (zh) * | 2017-11-02 | 2024-05-14 | 三星电子株式会社 | 用于生成定点型神经网络的方法和装置 |
CN109754066A (zh) * | 2017-11-02 | 2019-05-14 | 三星电子株式会社 | 用于生成定点型神经网络的方法和装置 |
CN108021537A (zh) * | 2018-01-05 | 2018-05-11 | 南京大学 | 一种基于硬件平台的softmax实现方式 |
CN108021537B (zh) * | 2018-01-05 | 2022-09-16 | 南京大学 | 一种基于硬件平台的softmax函数计算方法 |
CN108416426A (zh) * | 2018-02-05 | 2018-08-17 | 深圳市易成自动驾驶技术有限公司 | 数据处理方法、装置及计算机可读存储介质 |
CN108509179A (zh) * | 2018-04-04 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 用于生成模型的方法和装置 |
CN110209472A (zh) * | 2018-08-29 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 任务数据处理方法和板卡 |
CN109492761A (zh) * | 2018-10-30 | 2019-03-19 | 深圳灵图慧视科技有限公司 | 实现神经网络的fpga加速装置、方法和系统 |
TWI750541B (zh) * | 2018-11-22 | 2021-12-21 | 南京大學 | 光電計算單元、光電計算陣列及光電計算方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101527010B (zh) | 2011-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101527010B (zh) | 人工神经网络算法的硬件实现方法及其系统 | |
CN107862374A (zh) | 基于流水线的神经网络处理系统和处理方法 | |
CN102629189B (zh) | 基于fpga的流水浮点乘累加方法 | |
CN110543939B (zh) | 一种基于fpga的卷积神经网络后向训练的硬件加速实现装置 | |
CA2957695A1 (en) | System and method for building artificial neural network architectures | |
CN103793562A (zh) | 基于fpga的有源配电网暂态实时仿真系统设计方法 | |
CN111814626B (zh) | 一种基于自注意力机制的动态手势识别方法和系统 | |
CN104933481B (zh) | 用于电力系统评估与渐进规划的参考电网模型及求解方法 | |
CN100583769C (zh) | 椭圆曲线密码系统的倍点系统 | |
CN105930591A (zh) | 寄存器聚类在时钟树综合中的实现方法 | |
CN106373030A (zh) | 一种流域梯级水电站优化调度的方法及装置 | |
WO2023070997A1 (zh) | 利用比特级稀疏性的深度学习卷积加速方法及处理器 | |
Peng et al. | An Accelerating Solution for N‐Body MOND Simulation with FPGA‐SoC | |
CN107092462B (zh) | 一种基于fpga的64位异步乘法器 | |
CN101286185A (zh) | 基于线性插值结构的数字频率合成电路编译器实现方法 | |
CN104731709A (zh) | 一种基于jcudasa_bp算法的软件缺陷预测方法 | |
CN101976044A (zh) | 一种基于神经网络的风电系统建模及dsp实现方法 | |
Khan et al. | An Efficient 16-Bit Multiplier based on Booth Algorithm | |
Esmaeilzadeh et al. | Physically accurate learning-based performance prediction of hardware-accelerated ml algorithms | |
CN108959815A (zh) | 高拱坝导流洞尺寸的优化设计方法 | |
CN101540504A (zh) | 一种基于变步长神经网络的潮流分析装置及方法 | |
CN114580627A (zh) | 一种基于变参递归神经网络的fpga实现方法 | |
CN110489798B (zh) | 面向有源配电网实时仿真的解算器细粒度高效设计方法 | |
CN107436380A (zh) | 电能脉冲产生方法及装置 | |
CN101667164A (zh) | 一种片上总线仲裁器及处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111207 Termination date: 20150306 |
|
EXPY | Termination of patent right or utility model |