CN110210612B - 基于自适应分段线性逼近曲线的集成电路加速方法及系统 - Google Patents

基于自适应分段线性逼近曲线的集成电路加速方法及系统 Download PDF

Info

Publication number
CN110210612B
CN110210612B CN201910397846.6A CN201910397846A CN110210612B CN 110210612 B CN110210612 B CN 110210612B CN 201910397846 A CN201910397846 A CN 201910397846A CN 110210612 B CN110210612 B CN 110210612B
Authority
CN
China
Prior art keywords
data
curve
lookup table
temporary register
curve activation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910397846.6A
Other languages
English (en)
Other versions
CN110210612A (zh
Inventor
王成
龙舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Linyi Zhongke Ruihe Intelligent Technology Co.,Ltd.
Original Assignee
Beijing Zhongke Huicheng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongke Huicheng Technology Co ltd filed Critical Beijing Zhongke Huicheng Technology Co ltd
Priority to CN201910397846.6A priority Critical patent/CN110210612B/zh
Publication of CN110210612A publication Critical patent/CN110210612A/zh
Application granted granted Critical
Publication of CN110210612B publication Critical patent/CN110210612B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means

Abstract

本发明属于人工智能技术领域,尤其涉及一种基于自适应分段线性逼近曲线的集成电路加速方法及系统,包括:通过查表法确定输入的曲线激活数据相应的直线方程相关系数,通过直线方程相关系数形成曲线激活数据相应的逼近直线,通过逼近直线的拟合形成曲线激活函数的分段线性逼近曲线,本发明解决了现有技术存在现有人工智能算法存在曲线激活函数计算速度慢且计算结果精度低的问题,具有曲线计算速度快,计算结果精度高,占用硬件资源少,运算实时性,适合任意一种曲线的特点的有益技术效果。

Description

基于自适应分段线性逼近曲线的集成电路加速方法及系统
技术领域
本发明属于人工智能技术领域,尤其涉及一种基于自适应分段线性逼近曲线的集成电路加速方法及系统。
背景技术
在人工神经网络的研究领域内,线性激活函数只是把输入线性组合再输出,无法实现对复杂函数的逼近,多层神经网络和单层无异。曲线激活函数对深层神经网络的函数逼近能力起着至关重要的作用。人工智能算法经常采用曲线激活函数,比如sigmoid函数或者tanh函数,由于集成电路不容易实现指数运算或者三角函数运算等等曲线计算,而且没有统一的公式计算各个不同的曲线激活函数,以串行架构为主的传统处理器无法同时进行大规模的曲线函数计算,因此,研究如何高速地计算曲线激活函数具有十分重要的意义,现有技术存在现有人工智能算法存在曲线激活函数计算速度慢且计算结果精度低的问题。
发明内容
本发明提供一种基于自适应分段线性逼近曲线的集成电路加速方法及系统,以解决上述背景技术中提出现有技术存在现有人工智能算法存在曲线激活函数计算速度慢且计算结果精度低的问题。
本发明所解决的技术问题采用以下技术方案来实现:一种基于自适应分段线性逼近曲线的集成电路加速方法,包括:
通过查表法确定输入的曲线激活数据相应的直线方程相关系数,通过直线方程相关系数形成曲线激活数据相应的逼近直线,通过逼近直线的拟合形成曲线激活函数的分段线性逼近曲线。
进一步,所述查表法包括精确查表法和粗略查表法,所述精确查表法通过查找精准查找表,所述粗略查表法通过查找粗略查找表。
进一步,所述方法还包括:
在正常运行阶段;
通过精粗决定规则确定选择精准查找表或粗略查找表,通过索引建立规则在确定的精准查找表或粗略查找表内确定曲线激活数据相应的直线方程的斜率系数和偏置系数,通过曲线激活函数值计算函数和曲线激活函数值运算方法确定最逼近曲线的直线段。
进一步,所述曲线激活函数值计算函数为:
y=kx+b;
其中;
所述x为输入的曲线激活数据;
所述y为曲线激活数据的计算函数值;
所述k为曲线激活数据的斜率系数;
所述b为曲线激活数据的偏置系数。
进一步,所述精粗决定规则包括:
若输入的曲线激活数据的高位地址是精准查找表地址且精准查找表已更新完成,则选择精准查找表,否则选择粗略查找表。
进一步,所述索引建立规则包括:
若选择精准查找表,则将输入的曲线激活数据的低位地址为精准查找表索引值;
若选择粗略查找表,则将输入的曲线激活数据的高位地址为粗略查找表索引值。
进一步,所述曲线激活函数值运算方法包括:
将输入的曲线激活数据输入乘法器,将乘法器运算后的输入的曲线激活数据与曲线激活数据的斜率系数的中间乘积高速串行通过缓冲器并行输入相应的加法器,将相应的加法器运算后的中间乘积与曲线激活数据的偏置系数之和并行输出。
进一步,其中,所述曲线激活函数值运算方法具体方法为:
若输入一个8位曲线激活数据A和另一个8位曲线激活数据B;
其中;
一个8位曲线激活数据A的数据位由高到低顺序排列为:数据位A1、数据位A2、数据位A3、数据位A4、数据位A5、数据位A6、数据位A7、数据位A8;
另一个8位曲线激活数据B的数据位由高到低顺序排列为:数据位B1、数据位B2、数据位B3、数据位B4、数据位B5、数据位B6、数据位B7、数据位 B8;
则:
构建第一级流水线,所述第一级流水线包括:
第一左移数据AL1:将一个8位曲线激活数据A左移1位;
第二左移数据AL2:将一个8位曲线激活数据A左移2位;
第三左移数据AL3:将一个8位曲线激活数据A左移3位;
第四左移数据AL4:将一个8位曲线激活数据A左移4位;
第五左移数据AL5:将一个8位曲线激活数据A左移5位;
第六左移数据AL6:将一个8位曲线激活数据A左移6位;
第七左移数据AL7:将一个8位曲线激活数据A左移7位;
第八左移数据AL8:一个8位曲线激活数据A不左移;
构建8个临时寄存器依次为第一临时寄存器R1、第二临时寄存器R2、第三临时寄存器R3、第四临时寄存器R4、第五临时寄存器R5、第六临时寄存器R6、第七临时寄存器R7、第八临时寄存器R8;
若数据位B1等于0,则第一临时寄存器R1等于0,否则第一临时寄存器 R1等于第一左移数据AL1;
若数据位B2等于0,则第二临时寄存器R2等于0,否则第二临时寄存器 R2等于第二左移数据AL2;
若数据位B3等于0,则第三临时寄存器R3等于0,否则第三临时寄存器 R3等于第三左移数据AL3;
若数据位B4等于0,则第四临时寄存器R4等于0,否则第四临时寄存器R4等于第四左移数据AL4;
若数据位B5等于0,则第五临时寄存器R5等于0,否则第五临时寄存器 R5等于第五左移数据AL5;
若数据位B6等于0,则第六临时寄存器R6等于0,否则第六临时寄存器 R6等于第六左移数据AL6;
若数据位B7等于0,则第七临时寄存器R7等于0,否则第七临时寄存器R7等于第七左移数据AL7;
若数据位B8等于0,则第八临时寄存器R8等于0,否则第八临时寄存器 R8等于第八左移数据AL8;
构建第二级流水线,所述第二级流水线包括:
第一临时寄存器T1=第一临时寄存器R1+第二临时寄存器R2;
第二临时寄存器T2=第三临时寄存器R3+第四临时寄存器R4;
第三临时寄存器T3=第五临时寄存器R5+第六临时寄存器R6;
第四临时寄存器T4=第七临时寄存器R7+第八临时寄存器R8;
构建第三级流水线,所述第三级流水线包括:
第一临时寄存器Y1=第一临时寄存器T1+第二临时寄存器T2;
第二临时寄存器Y2=第三临时寄存器T3+第四临时寄存器T4;
构建第四级流水线,所述第四级流水线包括:
临时寄存器X=第一临时寄存器Y1+第二临时寄存器Y2;
输出最终结果临时寄存器X。
进一步,所述方法还包括:
在初始化阶段;
建立曲线逼近数据库:遍历并计算曲线激活函数所有的相邻两点对应的直线方程的斜率系数和偏置系数并将其相应写入曲线逼近数据库;
初始化精准查找表:将曲线逼近数据库中部分曲线激活函数的区间确定为精准区间,将精准区间内相应的直线方程参数写入精准查找表;
初始化粗略查找表:遍历并计算曲线激活函数所有的经划分的粗略区间的起始点和结束点对应的直线方程的斜率系数和偏置系数并将其相应写入粗略查找表。
进一步,所述方法还包括:
所述建立曲线逼近数据库还包括:分别通过相应的精确逼近直线穿过曲线激活函数的所有的相邻两个点,将相应的精确逼近直线对应的直线方程的斜率系数和偏置系数分别写入曲线逼近数据库;
所述初始化精准查找表还包括:将曲线逼近数据库中曲线激活函数的任意点确定为精准区间的起始地址,从精准区间的起始地址开始依次将精准区间的所有直线方程参数写入精准查找表;
所述初始化粗略查找表还包括:分别通过相应的粗略逼近直线穿过曲线激活函数的所有的经划分的粗略区间的起始点和结束点,将相应的粗略逼近直线对应的直线方程的斜率系数和偏置系数分别写入粗略查找表。
进一步,所述方法还包括:
在正常运行阶段;
重新确定精准查找表:
地址阈值计数:粗略区间经划分后,通过将输入的曲线激活数据的高位地址计数确定最频繁访问的地址区间;
请求仲裁:若计数达到阈值以后,则通过数据仲裁访问曲线逼近数据库;
更新精准查找表:若数据仲裁通过,则将当前输入的曲线激活数据的高位地址确定为曲线激活函数的精准区间起始地址,从精准区间的起始地址开始依次将精准区间的所有直线方程参数更新精准查找表。
进一步,所述方法还包括:所述数据仲裁采用round-robin轮循调度策略。
同时,本发明还提供一种基于自适应分段线性逼近曲线的集成电路加速系统,所述系统包括:
曲线逼近数据库、仲裁器、若干并行计算单元;
所述仲裁器用于若输入的曲线激活数据的高位地址计数达到阈值以后,则通过round-robin轮循调度策略的数据仲裁访问曲线逼近数据库;
所述计算单元用于实现上述所述的基于自适应分段线性逼近曲线的集成电路加速方法。
进一步,所述系统还包括:
所述计算单元包括动态反馈调整模块,所述动态反馈调整模块包括:
地址阈值计数器:用于粗略区间经划分后,通过将输入的曲线激活数据的高位地址计数确定最频繁访问的地址区间;
查找表选择器:用于若输入的曲线激活数据的高位地址是精准查找表地址且精准查找表已更新完成,则选择精准查找表,否则选择粗略查找表;
更新查找表请求器:用于若数据仲裁通过,则将当前输入的曲线激活数据的高位地址确定为曲线激活函数的精准区间起始地址,从精准区间的起始地址开始依次将精准区间的所有直线方程参数更新精准查找表。
进一步,所述系统还包括:
所述计算单元还包括直线方程运算模块,所述直线方程运算模块包括单周期高速乘法器、加法器;
所述直线方程运算模块用于将输入的曲线激活数据输入单周期高速乘法器,将单周期高速乘法器运算后的输入的曲线激活数据与曲线激活数据的斜率系数的中间乘积高速串行通过缓冲器并行输入相应的加法器,将相应的加法器运算后的中间乘积与曲线激活数据的偏置系数之和并行输出。
进一步,所述系统还包括:
所述直线方程运算模块还包括查找表模块,所述查找表模块包括:
精准查找表模块:用于若选择精准查找表,则将输入的曲线激活数据的低位地址为精准查找表索引值,通过精准查找表索引值在确定的精准查找表内确定曲线激活数据相应的直线方程的斜率系数和偏置系数,通过曲线激活函数值计算函数和曲线激活函数值运算方法确定最逼近曲线的直线段;
粗略查找表模块:用于若选择粗略查找表,则将输入的曲线激活数据的高位地址为粗略查找表索引值,通过粗略查找表索引值在确定的粗略查找表内确定曲线激活数据相应的直线方程的斜率系数和偏置系数,通过曲线激活函数值计算函数和曲线激活函数值运算方法确定最逼近曲线的直线段。
有益技术效果
本专利采用通过查表法确定输入的曲线激活数据相应的直线方程相关系数,通过直线方程相关系数形成曲线激活数据相应的逼近直线,通过逼近直线的拟合形成曲线激活函数的分段线性逼近曲线,由于人工智能算法经常采用曲线激活函数,比如sigmoid函数或者tanh函数,由于集成电路不容易实现指数运算或者三角函数运算等等曲线计算,而且没有统一的公式计算各个不同的曲线激活函数,以串行架构为主的传统处理器无法同时进行大规模的曲线计算,因此,如何快速完成激活函数的曲线计算就是需要解决的重要问题,由于逼近曲线激活函数的原理是用一系列折线来逼近曲线,将曲线激活函数划分成若干段曲线,每一段曲线用一条直线来近似,直线段越密集,越逼近对应的那段曲线,本发明采用多个计算单元同时处理多个输入数据,利用查找表,计算直线方程,输出多个曲线激活函数值,根据输入数据的变化自适应调整精准查找表的内容,以达到提高计算精度的目的,本发明具有曲线计算速度快,计算结果精度高,占用硬件资源少,运算实时性,适合任意一种曲线的特点。
附图说明
图1是本发明一种基于自适应分段线性逼近曲线的集成电路加速方法的总流程图;
图2是本发明一种基于自适应分段线性逼近曲线的集成电路加速方法的具体流程图;
图3是本发明一种基于自适应分段线性逼近曲线的集成电路加速方法的多个计算单元通过仲裁器访问曲线逼近数据库的结构图;
图4是本发明一种基于自适应分段线性逼近曲线的集成电路加速方法的实施例二中Sigmoid曲线与曲线逼近数据库中对应的逼近直线结合的示意图;
图5是本发明一种基于自适应分段线性逼近曲线的集成电路加速方法的实施例二中Sigmoid曲线与精准查找表对应的中对应的逼近直线结合的示意图;
图6是本发明一种基于自适应分段线性逼近曲线的集成电路加速方法的实施例二中Sigmoid曲线与粗略查找表中对应的逼近直线结合的示意图;
图7是本发明一种基于自适应分段线性逼近曲线的集成电路加速方法的实施例二中Sigmoid曲线激活函数的示意图;
图8是本发明一种基于自适应分段线性逼近曲线的集成电路加速系统的框架图;
图9是本发明一种基于自适应分段线性逼近曲线的集成电路加速系统的整体架构图;
图10是本发明一种基于自适应分段线性逼近曲线的集成电路加速系统的计算单元的具体结构图;
图11是本发明一种基于自适应分段线性逼近曲线的集成电路加速系统的单周期高速乘法器结构图;
具体实施方式
以下结合附图对本发明做进一步描述:
图中:
S101-通过查表法确定输入的曲线激活数据相应的直线方程相关系数;
S102-通过直线方程相关系数形成曲线激活数据相应的逼近直线;
S103-通过逼近直线的拟合形成曲线激活函数的分段线性逼近曲线;
S201-建立曲线逼近数据库;
S202-初始化精准查找表;
S203-初始化粗略查找表;
S204-输入的曲线激活数据;
S205-通过精粗决定规则确定选择精准查找表或粗略查找表;
S206-通过索引建立规则在确定的精准查找表或粗略查找表内确定曲线激活数据相应的直线方程的斜率系数和偏置系数;
S207-通过曲线激活函数值计算函数和曲线激活函数值运算方法确定最逼近曲线的直线段;
S208-粗略区间经划分后,通过将输入的曲线激活数据的高位地址计数确定最频繁访问的地址区间;
S209-若计数达到阈值以后,则通过数据仲裁访问曲线逼近数据库;
S210-若数据仲裁通过,则将当前输入的曲线激活数据的高位地址确定为曲线激活函数的精准区间起始地址,从精准区间的起始地址开始依次将精准区间的所有直线方程参数更新精准查找表;
实施例:
实施例一:如图1所示,一种基于自适应分段线性逼近曲线的集成电路加速方法,包括:
通过查表法确定输入的曲线激活数据S204相应的直线方程相关系数S101,通过直线方程相关系数形成曲线激活数据相应的逼近直线S102,通过逼近直线的拟合形成曲线激活函数的分段线性逼近曲线S103。
由于采用通过查表法确定输入的曲线激活数据相应的直线方程相关系数,通过直线方程相关系数形成曲线激活数据相应的逼近直线,通过逼近直线的拟合形成曲线激活函数的分段线性逼近曲线,由于人工智能算法经常采用曲线激活函数,比如sigmoid函数或者tanh函数,由于集成电路不容易实现指数运算或者三角函数运算等等曲线计算,而且没有统一的公式计算各个不同的曲线激活函数,以串行架构为主的传统处理器无法同时进行大规模的曲线计算,因此,如何快速完成激活函数的曲线计算就是需要解决的重要问题,由于逼近曲线激活函数的原理是用一系列折线来逼近曲线,将曲线激活函数划分成若干段曲线,每一段曲线用一条直线来近似,直线段越密集,越逼近对应的那段曲线,本发明采用多个计算单元同时处理多个输入数据,利用查找表,计算直线方程,输出多个曲线激活函数值,根据输入数据的变化自适应调整精准查找表的内容,以达到提高计算精度的目的,本发明具有曲线计算速度快,计算结果精度高,占用硬件资源少,运算实时性,适合任意一种曲线的特点。
如图2所示,所述查表法包括精确查表法和粗略查表法,所述精确查表法通过查找精准查找表,所述粗略查表法通过查找粗略查找表。
由于采用所述查表法包括精确查表法和粗略查表法,所述精确查表法通过查找精准查找表,所述粗略查表法通过查找粗略查找表,精准查找表和粗略查找表步长间距不一样,精准查找表步长间距小,逼近曲线的精准度高,只能覆盖一小部分曲线激活函数,不能完整的覆盖曲线激活函数,粗略查找表步长间距大,逼近曲线的精准度低,能够完整的覆盖曲线激活函数,精准查找表的数据来自曲线逼近数据库,粗略查找表的数据不是来自曲线逼近数据库,在初始化阶段计算出来的,在正常运行阶段,系统根据输入的数据和查找表,计算相应的曲线激活函数值,因此,精准查找表覆盖的地址范围小,粗略查找表覆盖的地址范围大,精准查找表里面的内容会动态改变,粗略查找表里面的内容固定不变,计算单元使用精准查找表可以得到精准的计算结果,计算单元使用粗略查找表可以得到粗略的计算结果,由于使用2种分段方法划分曲线激活函数,即方法一:把全部地址划分成若干个区间。这个方法能够完整的覆盖曲线激活函数,但是逼近曲线的精准度低。使用方法一构造粗略查找表,初始化以后粗略查找表的内容不会改变;方法二:按照精准查找表地址选取选取一段地址区间,把这个区间的数据库的数据写入精准查找表。这个方法只能覆盖一小部分曲线激活函数,不能完整的覆盖曲线激活函数,但是逼近曲线的精准度高。使用方法二构造精准查找表,初始化以后精准查找表的内容会不停的改变。初始化阶段精准查找表地址可以选取任意值。
所述方法还包括:
在正常运行阶段;
通过精粗决定规则确定选择精准查找表或粗略查找表S205,通过索引建立规则在确定的精准查找表或粗略查找表内确定曲线激活数据相应的直线方程的斜率系数和偏置系数S206,通过曲线激活函数值计算函数和曲线激活函数值运算方法确定最逼近曲线的直线段S207。
由于采用在正常运行阶段,通过精粗决定规则确定选择精准查找表或粗略查找表,通过索引建立规则在确定的精准查找表或粗略查找表内确定曲线激活数据相应的直线方程的斜率系数和偏置系数,通过曲线激活函数值计算函数和曲线激活函数值运算方法确定最逼近曲线的直线段,由于输入的数据分为两部分:高位地址,低位地址,当输入新的数据时,首先通过分割地址,即输入的数据作为曲线函数的地址,分为两部分(即高位地址和低位地址),根据地址读查找表,根据高位地址决定选择精准查找表还是粗略查找表,以输入的数据作为索引,在查找表里读取数据,获取直线方程的斜率系数k和偏置系数b,从而选择最逼近曲线的直线段,计算曲线激活函数值,根据输入的数据x、斜率系数k和偏置系数b,计算相应的曲线激活函数值y,其计算公式是y=k*x+b,输入的数据x,斜率系数k输入乘法器,其结果和偏置系数b输入加法器,产生最终结果,输出最终结果,通过上述处理,能够同时快速计算多个曲线激活函数值,同时输入多个数据,在固定的时钟周期以后,输出对应的多个曲线激活函数值。
所述曲线激活函数值计算函数为:
y=kx+b;
其中;
所述x为输入的曲线激活数据;
所述y为曲线激活数据的计算函数值;
所述k为曲线激活数据的斜率系数;
所述b为曲线激活数据的偏置系数。
由于采用所述曲线激活函数值计算函数为:y=kx+b,其中,所述x为输入的曲线激活数据,所述y为曲线激活数据的计算函数值,所述k为曲线激活数据的斜率系数,所述b为曲线激活数据的偏置系数,由于逼近曲线激活函数的原理是用一系列折线来逼近曲线,将曲线激活函数划分成若干段曲线,每一段曲线用一条直线来近似。直线段越密集,越逼近对应的那段曲线,直线段可以用代数直线方程表示:y=k*x+b,其中,k代表直线方程的斜率系数,b代表直线方程的偏置系数,计算曲线激活函数值:根据输入的数据x,斜率系数k和偏置系数b,计算相应的曲线激活函数值y,计算公式是y=k*x+b,输入的数据x,斜率系数k 输入乘法器,其结果和偏置系数b输入加法器,产生最终结果。
所述精粗决定规则包括:
若输入的曲线激活数据S204的高位地址是精准查找表地址且精准查找表已更新完成,则选择精准查找表,否则选择粗略查找表。
由于采用所述精粗决定规则包括若输入的曲线激活数据的高位地址是精准查找表地址且精准查找表已更新完成,则选择精准查找表,否则选择粗略查找表,由于判断高位地址是否同时满足这两个条件,决定选择精准查找表还是粗略查找表,只有同时满足这两个条件,才可以选择精准查找表,条件一:判断是不是精准查找表地址,条件二:判断是否完成更新精准查找表,查找表输出直线方程的斜率系数和直线方程的偏置系数。
所述索引建立规则包括:
若选择精准查找表,则将输入的曲线激活数据S204的低位地址为精准查找表索引值;
若选择粗略查找表,则将输入的曲线激活数据S204的高位地址为粗略查找表索引值。
由于采用所述索引建立规则包括:若选择精准查找表,则将输入的曲线激活数据的低位地址为精准查找表索引值;若选择粗略查找表,则将输入的曲线激活数据的高位地址为粗略查找表索引值,由于如果选择精准查找表,低位地址提供精准查找表索引值,如果选择粗略查找表,高位地址提供粗略查找表索引值,查找表输出直线方程的斜率系数和直线方程的偏置系数,计算曲线激活函数值的方法是:输入的数据乘以直线方程的斜率系数,然后加上直线方程的偏置系数,输出最后的结果。
所述曲线激活函数值运算方法包括:
将输入的曲线激活数据S204输入乘法器,将乘法器运算后的输入的曲线激活数据S204与曲线激活数据的斜率系数的中间乘积高速串行通过缓冲器并行输入相应的加法器,将相应的加法器运算后的中间乘积与曲线激活数据的偏置系数之和并行输出。
其中,所述曲线激活函数值运算方法具体方法为:
若输入一个8位曲线激活数据A和另一个8位曲线激活数据B;
其中;
一个8位曲线激活数据A的数据位由高到低顺序排列为:数据位A1、数据位A2、数据位A3、数据位A4、数据位A5、数据位A6、数据位A7、数据位A8;
另一个8位曲线激活数据B的数据位由高到低顺序排列为:数据位B1、数据位B2、数据位B3、数据位B4、数据位B5、数据位B6、数据位B7、数据位 B8;
则:
构建第一级流水线,所述第一级流水线包括:
第一左移数据AL1:将一个8位曲线激活数据A左移1位;
第二左移数据AL2:将一个8位曲线激活数据A左移2位;
第三左移数据AL3:将一个8位曲线激活数据A左移3位;
第四左移数据AL4:将一个8位曲线激活数据A左移4位;
第五左移数据AL5:将一个8位曲线激活数据A左移5位;
第六左移数据AL6:将一个8位曲线激活数据A左移6位;
第七左移数据AL7:将一个8位曲线激活数据A左移7位;
第八左移数据AL8:一个8位曲线激活数据A不左移;
构建8个临时寄存器依次为第一临时寄存器R1、第二临时寄存器R2、第三临时寄存器R3、第四临时寄存器R4、第五临时寄存器R5、第六临时寄存器R6、第七临时寄存器R7、第八临时寄存器R8;
若数据位B1等于0,则第一临时寄存器R1等于0,否则第一临时寄存器 R1等于第一左移数据AL1;
若数据位B2等于0,则第二临时寄存器R2等于0,否则第二临时寄存器 R2等于第二左移数据AL2;
若数据位B3等于0,则第三临时寄存器R3等于0,否则第三临时寄存器 R3等于第三左移数据AL3;
若数据位B4等于0,则第四临时寄存器R4等于0,否则第四临时寄存器R4等于第四左移数据AL4;
若数据位B5等于0,则第五临时寄存器R5等于0,否则第五临时寄存器 R5等于第五左移数据AL5;
若数据位B6等于0,则第六临时寄存器R6等于0,否则第六临时寄存器 R6等于第六左移数据AL6;
若数据位B7等于0,则第七临时寄存器R7等于0,否则第七临时寄存器 R7等于第七左移数据AL7;
若数据位B8等于0,则第八临时寄存器R8等于0,否则第八临时寄存器 R8等于第八左移数据AL8;
构建第二级流水线,所述第二级流水线包括:
第一临时寄存器T1=第一临时寄存器R1+第二临时寄存器R2;
第二临时寄存器T2=第三临时寄存器R3+第四临时寄存器R4;
第三临时寄存器T3=第五临时寄存器R5+第六临时寄存器R6;
第四临时寄存器T4=第七临时寄存器R7+第八临时寄存器R8;
构建第三级流水线,所述第三级流水线包括:
第一临时寄存器Y1=第一临时寄存器T1+第二临时寄存器T2;
第二临时寄存器Y2=第三临时寄存器T3+第四临时寄存器T4;
构建第四级流水线,所述第四级流水线包括:
临时寄存器X=第一临时寄存器Y1+第二临时寄存器Y2;
输出最终结果临时寄存器X。
由于采用将输入的曲线激活数据输入乘法器,将乘法器运算后的输入的曲线激活数据与曲线激活数据的斜率系数的中间乘积高速串行通过缓冲器并行输入相应的加法器,将相应的加法器运算后的中间乘积与曲线激活数据的偏置系数之和并行输出,由于高速乘法器采用了树式架构,按照2的指数展开为多级流水线,多个加法器并行运算,一个周期以后就可以输出结果,因为运算的中间结果锁存在流水线触发器里,所以即使还没有输出上一个乘法计算结果,还是可以立刻开始下一个乘法计算,因此,具有结构简单、运算速度快的优点且适合大量的使用在计算单元里,具体的运算过程如下图所示:
(1)2个输入的数据,标记为A,B。
(2)2个输入的数据宽度都是8位,由高位到低位,按顺序标记为:
A1,A2,A3,A4,A5,A6,A7,A8;
B1,B2,B3,B4,B5,B6,B7,B8;
(3)总共构建4级流水线;
(4)构建第1级流水线;
数据A左移1位,标记为AL1,数据A左移2位,标记为AL2,数据 A左移3位,标记为AL3,数据A左移4位,标记为AL4,数据A左移5位,标记为AL5,数据A左移6位,标记为AL6,数据A左移7 位,标记为AL7.数据A不左移,标记为AL8;
(5)构建8个临时寄存器,标记为R1,R2,R3,R4,R5,R6,R7,R8.
(6)如果B1等于0,R1=0,否则R1=AL1。如果B2等于0,R2=0,否则 R2=AL2,如果B3等于0,R3=0,否则R3=AL3,如果B4等于0,R4=0, 否则R4=AL4,如果B5等于0,R5=0,否则R5=AL5,如果B6等于0, R6=0,否则R6=AL6,如果B7等于0,R7=0,否则R7=AL7,如果B8等于0,R8=0,否则R8=AL8;
(7)构建第2级流水线;
(8)构建4个临时寄存器,标记为T1,T2,T3,T4;
(9)第1级流水线8个临时寄存器编成4组加法:
T1=R1+R2,T2=R3+R4,T3=R5+R6,T4=R7+R8;
(10)构建第3级流水线;
(11)构建2个临时寄存器,标记为Y1,Y2;
(12)第2级流水线4个临时寄存器编成2组加法:Y1=T1+T2,Y2=T3+T4;
(13)构建第4级流水线;
(14)构建最后结果寄存器,标记为X;
(15)第3级流水线2个临时寄存器编成1组加法:X=Y1+Y2;
输出最后结果X。
所述方法还包括:
在初始化阶段;
建立曲线逼近数据库S201:遍历并计算曲线激活函数所有的相邻两点对应的直线方程的斜率系数和偏置系数并将其相应写入曲线逼近数据库;
初始化精准查找表S202:将曲线逼近数据库中部分曲线激活函数的区间确定为精准区间,将精准区间内相应的直线方程参数写入精准查找表;
初始化粗略查找表S203:遍历并计算曲线激活函数所有的经划分的粗略区间的起始点和结束点对应的直线方程的斜率系数和偏置系数并将其相应写入粗略查找表。
所述方法还包括:
所述建立曲线逼近数据库S201还包括:分别通过相应的精确逼近直线穿过曲线激活函数的所有的相邻两个点,将相应的精确逼近直线对应的直线方程的斜率系数和偏置系数分别写入曲线逼近数据库;
所述初始化精准查找表S202还包括:将曲线逼近数据库中曲线激活函数的任意点确定为精准区间的起始地址,从精准区间的起始地址开始依次将精准区间的所有直线方程参数写入精准查找表;
所述初始化粗略查找表S203还包括:分别通过相应的粗略逼近直线穿过曲线激活函数的所有的经划分的粗略区间的起始点和结束点,将相应的粗略逼近直线对应的直线方程的斜率系数和偏置系数分别写入粗略查找表。
由于采用在初始化阶段,建立曲线逼近数据库:遍历并计算曲线激活函数所有的相邻两点对应的直线方程的斜率系数和偏置系数并将其相应写入曲线逼近数据库;初始化精准查找表:将曲线逼近数据库中部分曲线激活函数的区间确定为精准区间,将精准区间内相应的直线方程参数写入精准查找表;初始化粗略查找表:遍历并计算曲线激活函数所有的经划分的粗略区间的起始点和结束点对应的直线方程的斜率系数和偏置系数并将其相应写入粗略查找表,由于建立曲线逼近数据库:首先,在初始化阶段,系统选择曲线激活函数的相邻两个点,构造一条直线穿过两个点,计算出对应的直线方程的斜率系数和偏置系数,写入曲线逼近数据库,以此类推,遍历曲线激活函数所有的相邻两个点,完成建立曲线逼近数据库,其次,初始化精准查找表:选取任意值作为精准查找表地址,作为地址区间的起始地址,把这个区间的数据库的数据写入精准查找表。这个方法只能覆盖一小部分曲线激活函数,不能完整的覆盖曲线激活函数,但是逼近曲线的精准度高,最后,初始化粗略查找表:把全部地址划分成若干个区间,选取每一个区间的起始点,结束点,构造一条直线穿过两个点,计算出对应的直线方程的斜率系数和偏置系数,写入粗略查找表。
如图2所示,所述方法还包括:
在正常运行阶段;
重新确定精准查找表:
地址阈值计数:粗略区间经划分后,通过将输入的曲线激活数据S204的高位地址计数确定最频繁访问的地址区间S208;
请求仲裁:若计数达到阈值以后,则通过数据仲裁访问曲线逼近数据库 S209;
更新精准查找表:若数据仲裁通过,则将当前输入的曲线激活数据S204的高位地址确定为曲线激活函数的精准区间起始地址,从精准区间的起始地址开始依次将精准区间的所有直线方程参数更新精准查找表S210。
由于采用在正常运行阶段,重新确定精准查找表:地址阈值计数:粗略区间经划分后,通过将输入的曲线激活数据的高位地址计数确定最频繁访问的地址区间;请求仲裁:若计数达到阈值以后,则通过数据仲裁访问曲线逼近数据库;更新精准查找表:若数据仲裁通过,则将当前输入的曲线激活数据的高位地址确定为曲线激活函数的精准区间起始地址,从精准区间的起始地址开始依次将精准区间的所有直线方程参数更新精准查找表,由于地址阈值计数器,发现最频繁访问的地址区间:分割地址以后,高位地址送入地址阈值计数器,对当前的高位地址进行计数。它的目的是发现最频繁访问的地址区间,给出反馈,及时更新精准查找表,请求仲裁器,访问曲线逼近数据库:计数器达到阈值以后,请求仲裁器,要求访问曲线逼近数据库,根据动态反馈,更新精准查找表:仲裁器授权以后, 把当前的高位地址设置为精准查找表地址,更新精准查找表,选取曲线逼近数据库的高位地址的数据写入精准查找表,更新精准查找表需要一段时间,期间计算单元只能使用粗略查找表,曲线逼近数据库有完整的曲线函数值,但是数据量太大,计算单元有许多个,如果每一个计算单元都配备一个曲线逼近数据库会占用庞大的存储空间,所以只能选取一部分数据写入精准查找表。
本发明跟随输入数据的变化,动态修改精准查找表地址,自适应调整精准查找表的内容,尽量使用精准查找表计算,以达到提高计算精度的目的。
如图3所示,所述方法还包括:所述数据仲裁采用round-robin轮循调度策略。
由于采用所述数据仲裁采用round-robin轮循调度策略,由于多个计算单元可以同时处理多个输入数据。多个计算单元同时请求访问一个曲线逼近数据库,通过仲裁器给其中一个计算单元授权。仲裁器采用了轮循round-robin的调度策略。
如图8所示,同时,本发明还提供一种基于自适应分段线性逼近曲线的集成电路加速系统,所述系统包括:
曲线逼近数据库、仲裁器、若干并行计算单元;
所述仲裁器用于若输入的曲线激活数据S204的高位地址计数达到阈值以后,则通过round-robin轮循调度策略的数据仲裁访问曲线逼近数据库;
所述计算单元用于实现上述所述的基于自适应分段线性逼近曲线的集成电路加速方法。
如图9所示,所述系统还包括:
所述计算单元包括动态反馈调整模块,所述动态反馈调整模块包括:
地址阈值计数器:用于粗略区间经划分后,通过将输入的曲线激活数据S204 的高位地址计数确定最频繁访问的地址区间S208;
查找表选择器:用于若输入的曲线激活数据S204的高位地址是精准查找表地址且精准查找表已更新完成,则选择精准查找表,否则选择粗略查找表;
更新查找表请求器:用于若数据仲裁通过,则将当前输入的曲线激活数据 S204的高位地址确定为曲线激活函数的精准区间起始地址,从精准区间的起始地址开始依次将精准区间的所有直线方程参数更新精准查找表S210。
如图10所示,所述系统还包括:
所述计算单元还包括直线方程运算模块,所述直线方程运算模块包括单周期高速乘法器、加法器;
所述直线方程运算模块用于将输入的曲线激活数据S204输入单周期高速乘法器,将单周期高速乘法器运算后的输入的曲线激活数据S204与曲线激活数据的斜率系数的中间乘积高速串行通过缓冲器并行输入相应的加法器,将相应的加法器运算后的中间乘积与曲线激活数据的偏置系数之和并行输出。
所述系统还包括:
所述直线方程运算模块还包括查找表模块,所述查找表模块包括:
精准查找表模块:用于若选择精准查找表,则将输入的曲线激活数据S204 的低位地址为精准查找表索引值,通过精准查找表索引值在确定的精准查找表内确定曲线激活数据相应的直线方程的斜率系数和偏置系数,通过曲线激活函数值计算函数和曲线激活函数值运算方法确定最逼近曲线的直线段S207;
粗略查找表模块:用于若选择粗略查找表,则将输入的曲线激活数据S204 的高位地址为粗略查找表索引值,通过粗略查找表索引值在确定的粗略查找表内确定曲线激活数据相应的直线方程的斜率系数和偏置系数,通过曲线激活函数值计算函数和曲线激活函数值运算方法确定最逼近曲线的直线段S207。
由于采用所述系统包括:曲线逼近数据库、仲裁器、若干并行计算单元;所述仲裁器用于若输入的曲线激活数据的高位地址计数达到阈值以后,则通过 round-robin轮循调度策略的数据仲裁访问曲线逼近数据库;所述计算单元用于实现上述所述的基于自适应分段线性逼近曲线的集成电路加速方法,系统包括曲线逼近数据库,仲裁器,多个计算单元,每一个计算单元包括动态反馈调整模块, 直线方程运算模块,动态反馈调整模块包括地址阈值计数器,查找表选择器,更新查找表请求器,直线方程运算模块包括单周期高速乘法器,加法器,查找表,查找表包括精准查找表,粗略查找表。根据一定规则不断更新精准查找表,每一个计算单元包括动态反馈调整模块,直线方程运算模块,输入1个数据,在固定的时钟周期以后,输出对应的1个曲线激活函数值,达到阈值的多个计算单元同时请求访问一个曲线逼近数据库,通过仲裁器给其中一个计算单元授权,仲裁器采用了轮循round-robin的调度策略,每一个计算单元以输入的数据x作为索引,在查找表里读取出直线方程的斜率系数k和偏置系数b,计算相应的曲线激活函数值y,计算公式是y=k*x+b,输入的数据x,斜率系数k输入乘法器,其结果和偏置系数b输入加法器,产生最终结果,高速乘法器利用多级流水线,多个加法器并行运算,一个周期以后就可以输出结果,因为运算的中间结果锁存在流水线触发器里,所以即使还没有输出上一个乘法计算结果,还是可以立刻开始下一个乘法计算,查找表包括两个,即精准查找表和粗略查找表,步长间距不一样,系统跟随输入数据的变化,动态修改精准查找表地址,自适应调整精准查找表的内容,尽量使用精准查找表计算。
实施例二:
如图8、9、10、11以下是以计算Sigmoid曲线激活函数为例来说明一种基于自适应分段线性逼近曲线的集成电路加速算法及系统,如下:
步骤1:建立曲线逼近数据库:在初始化阶段,把全部地址划分成8个区间。系统选择曲线激活函数的相邻2个点A0,A1,构造一条直线穿过2个点,计算出对应的直线方程的斜率系数和偏置系数,写入曲线逼近数据库。系统选择曲线激活函数的相邻2个点A1,A2,构造一条直线穿过2个点,计算出对应的直线方程的斜率系数和偏置系数,写入曲线逼近数据库。选择2个点A2,A3,构造一条直线穿过2个点,计算出对应的直线方程的斜率系数和偏置系数,写入曲线逼近数据库。选择2个点A3,A4,构造一条直线穿过2个点,计算出对应的直线方程的斜率系数和偏置系数,写入曲线逼近数据库。选择2个点A4,A5,构造一条直线穿过2个点,计算出对应的直线方程的斜率系数和偏置系数,写入曲线逼近数据库。选择2个点A5,A6,构造一条直线穿过2个点,计算出对应的直线方程的斜率系数和偏置系数,写入曲线逼近数据库。选择2个点A6,A7,构造一条直线穿过2个点,计算出对应的直线方程的斜率系数和偏置系数,写入曲线逼近数据库。选择2个点A7,A8,构造一条直线穿过2个点,计算出对应的直线方程的斜率系数和偏置系数,写入曲线逼近数据库。点A0的X轴地址是000。点A1 的X轴地址是001。点A2的X轴地址是010。点A3的X轴地址是011。点 A4的X轴地址是100。点A5的X轴地址是101。点A6的X轴地址是110。点A7的X轴地址是111。请参考附图4。完成建立曲线逼近数据库。
步骤2:初始化精准查找表:选取任意值0作为精准查找表地址,作为地址区间的起始地址,区间长度设置为4,这个区间有5个点A0,A1,A2,A3,A4,有4条直线穿过这5个点,把数据库里对应的直线方程的数据写入精准查找表。请参考附图5。
步骤3:初始化粗略查找表:把全部地址划分成2个区间。选取第1个区间的起始点B0,结束点B1,构造一条直线穿过这2个点,计算出对应的直线方程的斜率系数和偏置系数,写入粗略查找表。选取第2个区间的起始点B1,结束点B2,构造一条直线穿过这2个点,计算出对应的直线方程的斜率系数和偏置系数,写入粗略查找表。点B0的X轴地址是000。点B1的X轴地址是100。点B2的X轴地址是111。穿过点B0点B1的直线方程对应的索引是0。穿过点B1点B2的直线方程对应的索引是1。请参考附图6。
步骤4:输入新的数据101。
步骤5:分割地址:输入的数据101作为曲线函数的地址,高位地址选择1 位,低位地址选择2位,分为2部分:高位地址是1,低位地址是01。
步骤6:根据地址读查找表:根据高位地址1决定选择粗略查找表。因为精准查找表地址是011,高位地址是0。以高位地址1作为索引,在粗略查找表里读取数据,选择穿过点B1点B2的直线方程的斜率系数和偏置系数。
步骤7:获取直线方程的斜率系数k和偏置系数b:选择最逼近曲线的直线段:穿过点B1点B2的直线。
步骤8:计算曲线激活函数值:根据输入的数据x,斜率系数k和偏置系数b,计算相应的曲线激活函数值y。计算公式是y=k*x+b。
步骤9:输出最终结果。
步骤10:分割地址以后,高位地址送入地址阈值计数器,对当前的高位地址进行计数。发现最频繁访问的地址是1,不是0:
步骤11:计数器达到阈值,请求仲裁器,要求访问曲线逼近数据库。
步骤12:仲裁器授权以后,把当前的高位地址1设置为精准查找表地址,更新精准查找表。选取曲线逼近数据库的高位地址对应的数据写入精准查找表。因为点A0的X轴地址是000。点A1的X轴地址是001。点A2的X轴地址是 010。点A3的X轴地址是011。点A4的X轴地址是100。点A5的X轴地址是101。点A6的X轴地址是110。点A7的X轴地址是111。所以选择点 A4,点A5,点A6,点A7,把穿过这些点的直线方程的斜率系数k和偏置系数 b写入精准查找表。
举个例子,图7是Sigmoid曲线激活函数,其中包括一条Sigmoid曲线;
图6中Sigmoid曲线可以分成两段曲线,用两条直线来近似;
参考图6,该图中包括Sigmoid曲线和两条直线,该两条直线对应的直线方程的斜率系数和偏置系数保存在粗略查找表。
参考图5,该图中包括Sigmoid曲线的一部分曲线和用四条直线来近似;
参考图4,该图中包括Sigmoid曲线和八条直线,该八条直线更加的逼近曲线,该八条直线对应的直线方程的斜率系数和偏置系数因为数据量庞大,只能保存一部分在精准查找表。
工作原理:
本专利通过查表法确定输入的曲线激活数据相应的直线方程相关系数,通过直线方程相关系数形成曲线激活数据相应的逼近直线,通过逼近直线的拟合形成曲线激活函数的分段线性逼近曲线,由于人工智能算法经常采用曲线激活函数,比如sigmoid函数或者tanh函数,由于集成电路不容易实现指数运算或者三角函数运算等等曲线计算,而且没有统一的公式计算各个不同的曲线激活函数,以串行架构为主的传统处理器无法同时进行大规模的曲线计算,因此,如何快速完成激活函数的曲线计算就是需要解决的重要问题,由于逼近曲线激活函数的原理是用一系列折线来逼近曲线,将曲线激活函数划分成若干段曲线,每一段曲线用一条直线来近似,直线段越密集,越逼近对应的那段曲线,本发明采用多个计算单元同时处理多个输入数据,利用查找表,计算直线方程,输出多个曲线激活函数值,根据输入数据的变化自适应调整精准查找表的内容,以达到提高计算精度的目的,本发明解决了现有技术存在现有人工智能算法存在曲线激活函数计算速度慢且计算结果精度低的问题,具有曲线计算速度快,计算结果精度高,占用硬件资源少,运算实时性,适合任意一种曲线的特点的有益技术效果。
利用本发明的技术方案,或本领域的技术人员在本发明技术方案的启发下,设计出类似的技术方案,而达到上述技术效果的,均是落入本发明的保护范围。

Claims (9)

1.一种基于自适应分段线性逼近曲线的集成电路加速方法,其特征在于,包括:
通过查表法确定输入的曲线激活数据相应的直线方程相关系数,通过直线方程相关系数形成曲线激活数据相应的逼近直线,通过逼近直线的拟合形成曲线激活函数的分段线性逼近曲线;
所述查表法包括精确查表法和粗略查表法,所述精确查表法通过查找精准查找表,所述粗略查表法通过查找粗略查找表;
在正常运行阶段,通过精粗决定规则确定选择精准查找表或粗略查找表,通过索引建立规则在确定的精准查找表或粗略查找表内确定曲线激活数据相应的直线方程的斜率系数和偏置系数,通过曲线激活函数值计算函数和曲线激活函数值运算方法确定最逼近曲线的直线段;
所述曲线激活函数值计算函数为:
y=kx+b;
其中;
所述x为输入的曲线激活数据;
所述y为曲线激活数据的计算函数值;
所述k为曲线激活数据的斜率系数;
所述b为曲线激活数据的偏置系数;
所述精粗决定规则包括:
若输入的曲线激活数据的高位地址是精准查找表地址且精准查找表已更新完成,则选择精准查找表,否则选择粗略查找表;
所述索引建立规则包括:
若选择精准查找表,则将输入的曲线激活数据的低位地址为精准查找表索引值;
若选择粗略查找表,则将输入的曲线激活数据的高位地址为粗略查找表索引值。
2.根据权利要求1所述的方法,其特征在于,所述曲线激活函数值运算方法包括:
将输入的曲线激活数据输入乘法器,将乘法器运算后的输入的曲线激活数据与曲线激活数据的斜率系数的中间乘积高速串行通过缓冲器并行输入相应的加法器,将相应的加法器运算后的中间乘积与曲线激活数据的偏置系数之和并行输出;
其中,所述曲线激活函数值运算方法具体方法为:
若输入一个8位曲线激活数据A和另一个8位曲线激活数据B;
其中;
一个8位曲线激活数据A的数据位由高到低顺序排列为:数据位A1、数据位A2、数据位A3、数据位A4、数据位A5、数据位A6、数据位A7、数据位A8;
另一个8位曲线激活数据B的数据位由高到低顺序排列为:数据位B1、数据位B2、数据位B3、数据位B4、数据位B5、数据位B6、数据位B7、数据位B8;
则:
构建第一级流水线,所述第一级流水线包括:
第一左移数据AL1:将一个8位曲线激活数据A左移1位;
第二左移数据AL2:将一个8位曲线激活数据A左移2位;
第三左移数据AL3:将一个8位曲线激活数据A左移3位;
第四左移数据AL4:将一个8位曲线激活数据A左移4位;
第五左移数据AL5:将一个8位曲线激活数据A左移5位;
第六左移数据AL6:将一个8位曲线激活数据A左移6位;
第七左移数据AL7:将一个8位曲线激活数据A左移7位;
第八左移数据AL8:一个8位曲线激活数据A不左移;
构建8个临时寄存器依次为第一临时寄存器R1、第二临时寄存器R2、第三临时寄存器R3、第四临时寄存器R4、第五临时寄存器R5、第六临时寄存器R6、第七临时寄存器R7、第八临时寄存器R8;
若数据位B1等于0,则第一临时寄存器R1等于0,否则第一临时寄存器R1等于第一左移数据AL1;
若数据位B2等于0,则第二临时寄存器R2等于0,否则第二临时寄存器R2等于第二左移数据AL2;
若数据位B3等于0,则第三临时寄存器R3等于0,否则第三临时寄存器R3等于第三左移数据AL3;
若数据位B4等于0,则第四临时寄存器R4等于0,否则第四临时寄存器R4等于第四左移数据AL4;
若数据位B5等于0,则第五临时寄存器R5等于0,否则第五临时寄存器R5等于第五左移数据AL5;
若数据位B6等于0,则第六临时寄存器R6等于0,否则第六临时寄存器R6等于第六左移数据AL6;
若数据位B7等于0,则第七临时寄存器R7等于0,否则第七临时寄存器R7等于第七左移数据AL7;
若数据位B8等于0,则第八临时寄存器R8等于0,否则第八临时寄存器R8等于第八左移数据AL8;
构建第二级流水线,所述第二级流水线包括:
第一临时寄存器T1=第一临时寄存器R1+第二临时寄存器R2;
第二临时寄存器T2=第三临时寄存器R3+第四临时寄存器R4;
第三临时寄存器T3=第五临时寄存器R5+第六临时寄存器R6;
第四临时寄存器T4=第七临时寄存器R7+第八临时寄存器R8;
构建第三级流水线,所述第三级流水线包括:
第一临时寄存器Y1=第一临时寄存器T1+第二临时寄存器T2;
第二临时寄存器Y2=第三临时寄存器T3+第四临时寄存器T4;
构建第四级流水线,所述第四级流水线包括:
临时寄存器X=第一临时寄存器Y1+第二临时寄存器Y2;
输出最终结果临时寄存器X。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在初始化阶段;
建立曲线逼近数据库:遍历并计算曲线激活函数所有的相邻两点对应的直线方程的斜率系数和偏置系数并将其相应写入曲线逼近数据库;
初始化精准查找表:将曲线逼近数据库中部分曲线激活函数的区间确定为精准区间,将精准区间内相应的直线方程参数写入精准查找表;
初始化粗略查找表:遍历并计算曲线激活函数所有的经划分的粗略区间的起始点和结束点对应的直线方程的斜率系数和偏置系数并将其相应写入粗略查找表。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
所述建立曲线逼近数据库还包括:分别通过相应的精确逼近直线穿过曲线激活函数的所有的相邻两个点,将相应的精确逼近直线对应的直线方程的斜率系数和偏置系数分别写入曲线逼近数据库;
所述初始化精准查找表还包括:将曲线逼近数据库中曲线激活函数的任意点确定为精准区间的起始地址,从精准区间的起始地址开始依次将精准区间的所有直线方程参数写入精准查找表;
所述初始化粗略查找表还包括:分别通过相应的粗略逼近直线穿过曲线激活函数的所有的经划分的粗略区间的起始点和结束点,将相应的粗略逼近直线对应的直线方程的斜率系数和偏置系数分别写入粗略查找表。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在正常运行阶段;
重新确定精准查找表:
地址阈值计数:粗略区间经划分后,通过将输入的曲线激活数据的高位地址计数确定最频繁访问的地址区间;
请求仲裁:若计数达到阈值以后,则通过数据仲裁访问曲线逼近数据库;
更新精准查找表:若数据仲裁通过,则将当前输入的曲线激活数据的高位地址确定为曲线激活函数的精准区间起始地址,从精准区间的起始地址开始依次将精准区间的所有直线方程参数更新精准查找表。
6.一种基于自适应分段线性逼近曲线的集成电路加速系统,其特征在于,所述系统包括:
曲线逼近数据库、仲裁器、若干并行计算单元;
所述仲裁器用于若输入的曲线激活数据的高位地址计数达到阈值以后,则通过round-robin轮循调度策略的数据仲裁访问曲线逼近数据库;
所述计算单元用于实现如权利要求1~权利要求4任一项所述的基于自适应分段线性逼近曲线的集成电路加速方法。
7.根据权利要求6所述的系统,其特征在于,所述系统还包括:
所述计算单元包括动态反馈调整模块,所述动态反馈调整模块包括:
地址阈值计数器:用于粗略区间经划分后,通过将输入的曲线激活数据的高位地址计数确定最频繁访问的地址区间;
查找表选择器:用于若输入的曲线激活数据的高位地址是精准查找表地址且精准查找表已更新完成,则选择精准查找表,否则选择粗略查找表;
更新查找表请求器:用于若数据仲裁通过,则将当前输入的曲线激活数据的高位地址确定为曲线激活函数的精准区间起始地址,从精准区间的起始地址开始依次将精准区间的所有直线方程参数更新精准查找表。
8.根据权利要求6所述的系统,其特征在于,所述系统还包括:
所述计算单元还包括直线方程运算模块,所述直线方程运算模块包括单周期高速乘法器、加法器;
所述直线方程运算模块用于将输入的曲线激活数据输入单周期高速乘法器,将单周期高速乘法器运算后的输入的曲线激活数据与曲线激活数据的斜率系数的中间乘积高速串行通过缓冲器并行输入相应的加法器,将相应的加法器运算后的中间乘积与曲线激活数据的偏置系数之和并行输出。
9.根据权利要求8所述的系统,其特征在于,所述系统还包括:
所述直线方程运算模块还包括查找表模块,所述查找表模块包括:
精准查找表模块:用于若选择精准查找表,则将输入的曲线激活数据的低位地址为精准查找表索引值,通过精准查找表索引值在确定的精准查找表内确定曲线激活数据相应的直线方程的斜率系数和偏置系数,通过曲线激活函数值计算函数和曲线激活函数值运算方法确定最逼近曲线的直线段;
粗略查找表模块:用于若选择粗略查找表,则将输入的曲线激活数据的高位地址为粗略查找表索引值,通过粗略查找表索引值在确定的粗略查找表内确定曲线激活数据相应的直线方程的斜率系数和偏置系数,通过曲线激活函数值计算函数和曲线激活函数值运算方法确定最逼近曲线的直线段。
CN201910397846.6A 2019-05-14 2019-05-14 基于自适应分段线性逼近曲线的集成电路加速方法及系统 Active CN110210612B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910397846.6A CN110210612B (zh) 2019-05-14 2019-05-14 基于自适应分段线性逼近曲线的集成电路加速方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910397846.6A CN110210612B (zh) 2019-05-14 2019-05-14 基于自适应分段线性逼近曲线的集成电路加速方法及系统

Publications (2)

Publication Number Publication Date
CN110210612A CN110210612A (zh) 2019-09-06
CN110210612B true CN110210612B (zh) 2021-04-16

Family

ID=67787123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910397846.6A Active CN110210612B (zh) 2019-05-14 2019-05-14 基于自适应分段线性逼近曲线的集成电路加速方法及系统

Country Status (1)

Country Link
CN (1) CN110210612B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112331143A (zh) * 2020-11-26 2021-02-05 中国科学院微电子研究所 一种用于硅基oled微显示器的分段可调伽马校正方法
CN114546330B (zh) * 2022-04-26 2022-07-12 成都登临科技有限公司 函数实现方法、逼近区间分段方法、芯片、设备及介质
CN115983354B (zh) * 2023-02-02 2023-08-22 大连理工大学 一种高精度可调整的通用激活函数实现方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126481A (zh) * 2016-06-29 2016-11-16 华为技术有限公司 一种计算引擎和电子设备
CN107589935A (zh) * 2017-09-01 2018-01-16 中国科学院计算技术研究所 一种非线性函数计算装置及方法
CN107861916A (zh) * 2017-11-10 2018-03-30 中国科学院计算技术研究所 一种用于针对神经网络执行非线性运算的方法和装置
CN108537332A (zh) * 2018-04-12 2018-09-14 合肥工业大学 一种基于Remez算法的Sigmoid函数硬件高效率实现方法
CN109726806A (zh) * 2017-10-30 2019-05-07 上海寒武纪信息科技有限公司 信息处理方法及终端设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170169132A1 (en) * 2015-12-15 2017-06-15 Analog Devices, Inc. Accelerated lookup table based function evaluation
CN105893159B (zh) * 2016-06-21 2018-06-19 北京百度网讯科技有限公司 数据处理方法和装置
CN106227291A (zh) * 2016-07-26 2016-12-14 中国科学院自动化研究所 基于分段式查表法的反正切函数的实现方法及实现装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126481A (zh) * 2016-06-29 2016-11-16 华为技术有限公司 一种计算引擎和电子设备
CN107589935A (zh) * 2017-09-01 2018-01-16 中国科学院计算技术研究所 一种非线性函数计算装置及方法
CN109726806A (zh) * 2017-10-30 2019-05-07 上海寒武纪信息科技有限公司 信息处理方法及终端设备
CN107861916A (zh) * 2017-11-10 2018-03-30 中国科学院计算技术研究所 一种用于针对神经网络执行非线性运算的方法和装置
CN108537332A (zh) * 2018-04-12 2018-09-14 合肥工业大学 一种基于Remez算法的Sigmoid函数硬件高效率实现方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Accurate and Efficient Hyperbolic Tangent Activation Function on FPGA using the DCT Interpolation Filter;Ahmed M. Abdelsalam,et al.;《arXiv》;20160925;全文 *
神经网络激活函数及其导数的FPGA实现;张智明,张仁杰;《现代电子技术》;20081231;全文 *

Also Published As

Publication number Publication date
CN110210612A (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
CN110210612B (zh) 基于自适应分段线性逼近曲线的集成电路加速方法及系统
WO2021098588A1 (zh) 一种基于脉冲神经网络的类脑计算芯片
CN107301453B (zh) 支持离散数据表示的人工神经网络正向运算装置和方法
CN108021537B (zh) 一种基于硬件平台的softmax函数计算方法
JP6528893B1 (ja) 学習プログラム、学習方法、情報処理装置
EP3444757B1 (en) Discrete data representation supported device and method for forward operation of artificial neural network
US5255216A (en) Reduced hardware look up table multiplier
CN111353579A (zh) 利用反向传播为深度神经网络选择量化参数的方法和系统
CN107301454A (zh) 支持离散数据表示的人工神经网络反向训练装置和方法
CN111353578A (zh) 信息处理装置、神经网络程序和用于神经网络的处理方法
GB2554167B (en) Approximating functions
Hussain et al. An efficient and fast softmax hardware architecture (EFSHA) for deep neural networks
WO2019220692A1 (ja) 演算装置
US9766601B2 (en) System and method for explicit model predictive control
US20210097397A1 (en) Information processing apparatus and information processing method
JP3461525B2 (ja) データを正規化する手段を含むニューラル・プロセッサ
CN107220025A (zh) 处理乘加运算的装置和处理乘加运算的方法
JP6064435B2 (ja) 演算回路、演算処理装置、及び除算方法
JP2020166674A (ja) 情報処理装置、情報処理方法、情報処理プログラム
Parameswaran et al. Design and investigation of low-complexity Anurupyena Vedic multiplier for machine learning applications
JP6995629B2 (ja) 演算回路
Kim et al. Applying piecewise linear approximation for DNN non-linear activation functions to Bfloat16 MACs
CN113570053A (zh) 一种神经网络模型的训练方法、装置以及计算设备
Jency Rubia et al. FIR filter design using floating point column bypassing technique
US20230185571A1 (en) Integrated circuit comprising a hardware calculator and corresponding calculation method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210928

Address after: 276023 floor 3, Yimeng cloud Valley, 200m west of the intersection of Zhimadun Hefei Road and Volvo, economic development zone, Linyi City, Shandong Province

Patentee after: Linyi Zhongke Ruihe Intelligent Technology Co.,Ltd.

Address before: Room d100-078, 1st floor, building D, No.2-2, Beijing Shichuang hi tech Development Corporation

Patentee before: BEIJING ZHONGKE HUICHENG TECHNOLOGY Co.,Ltd.