CN102693118B - 一种标量浮点运算加速器 - Google Patents

一种标量浮点运算加速器 Download PDF

Info

Publication number
CN102693118B
CN102693118B CN201110315230.3A CN201110315230A CN102693118B CN 102693118 B CN102693118 B CN 102693118B CN 201110315230 A CN201110315230 A CN 201110315230A CN 102693118 B CN102693118 B CN 102693118B
Authority
CN
China
Prior art keywords
function
scalar floating
point operation
main control
operation accelerator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110315230.3A
Other languages
English (en)
Other versions
CN102693118A (zh
Inventor
鞠怡明
葛明艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Gelin Machinery Co ltd
Original Assignee
SUZHOU GALAXY ELECTRONIC TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUZHOU GALAXY ELECTRONIC TECHNOLOGY Co Ltd filed Critical SUZHOU GALAXY ELECTRONIC TECHNOLOGY Co Ltd
Priority to CN201110315230.3A priority Critical patent/CN102693118B/zh
Publication of CN102693118A publication Critical patent/CN102693118A/zh
Application granted granted Critical
Publication of CN102693118B publication Critical patent/CN102693118B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Advance Control (AREA)

Abstract

本发明公开了一种标量浮点运算加速器,目的在于解决现有技术所存在的单片机或嵌入式系统硬件电路实现函数计算时所实现函数单一、过多占用系统资源等技术问题,提供一种标量浮点运算加速器,它采用分段可变参数曲线拟合方式使所有函数运算通过硬件电路实现,它包括主控处理器,运算器,接口控制电路,接口寄存器,指令部件,接口控制电路连接接口寄存器,指令部件连接接口寄存器,运算器连接接口寄存器,主控处理器连接接口控制电路,运算器对于单变量函数使用一元二次曲线拟合处理、对于双变量函数采用二元二次曲面拟合处理,拟合处理时对函数进行分段拟合。

Description

一种标量浮点运算加速器
技术领域
本发明涉及一种运算器,尤其涉及一种使用硬件电路实现标量浮点数运算的运算器。
背景技术
所谓标量浮点数是指一个浮点数,而不是一组浮点数。标量浮点运算一般采用高级语言的函数库做处理,处理起来运算时间长,速度慢,因此,在单片机或嵌入式系统中为加快运算速度往往使用硬件电路完成此类计算。为节省这类运算电路占用更多的系统资源和芯片空间,一般只采用一两种线性函数的运算电路,然而在嵌入式系统中的高端应用领域,像工业控制、POS机、网络设备、图像处理等应用中,要求有较强的数据处理能力,导致较多的硬件运算电路需求,致使处理器芯片面积增加、占用处理器硬件资源增加。
公开日为2011年04月20日、公开号为CN102023839A的专利文献公开了这样的技术方案,一种运算器,包括两个3通道选1通道选择器、一加法器、一减法器、两个乘法器、三个锁存器、一二进制转十进制器、一循环移位器;所述3通道选1通道选择器用于实现并行输入转串行功能;所述加法器、减法器、乘法器用于实现运算功能X=(X1*C+X2*(A-C))/A,所述锁存器用于实现串行转并行输出;所述二进制转十进制器和循环移位器用于实现控制输入和输出,有效地减小了大量芯片面积。该方案不足之处是运算函数单一,对于单变量多次函数及多变量函数计算无法实现。
发明内容
本发明主要是解决现有技术所存在的单片机或嵌入式系统硬件电路实现函数计算时所实现函数单一、过多占用系统资源等技术问题,提供一种标量浮点运算加速器,它采用分段可变参数曲线拟合方式使所有函数运算通过硬件电路实现,在硬件连接上该标量浮点运算加速器被视为一个存储器。
本发明针对现有技术问题主要是通过下述技术方案得以解决的,一种标量浮点运算加速器,包括主控处理器,运算器,还包括接口控制电路,接口寄存器,指令部件,接口控制电路连接接口寄存器,指令部件连接接口寄存器,运算器连接接口寄存器,主控处理器连接接口控制电路,运算器对于单变量函数使用一元二次曲线拟合处理、对于双变量函数采用二元二次曲面拟合处理,拟合处理时对函数进行分段拟合。
其中,接口控制电路处理指令、数据传输的时序控制及状态指示,接口寄存器保存有多个操作数及指令、计算结果和状态寄存器,指令部件根据不同的指令产生相应的控制逻辑,运算器执行函数计算。
该方案为主控处理器配置一个标量浮点运算加速器,以提高科学计算的能力。标量浮点运算加速器将C语言的数学库硬件化,相当于有一个硬件数学库连接在主控处理器上。
主控处理器将标量浮点运算加速器作为一个外部存储器进行连接,在使用标量浮点运算加速器之前先看其忙闲标志是否为空闲,如果为空闲,则可以使用标量浮点运算加速器,否则要等待。
标量浮点运算加速器计算结束后主动向主控处理器发送一个完成中断信号,主控处理器也可以查询标量浮点运算加速器忙闲状态标志,如果处于空闲状态,就说明计算结束。
因为C语言数学库的函数种类很多,而且每种函数的计算都非常复杂。如果针对每种函数设计一套硬件逻辑实现,那硬件设计会非常复杂,甚至到了无法实现的地步。所以本方案采用分段式拟合方式即利用分段曲线、曲面拟合的方法来实现各种函数。对于单变量函数,如求平方根、三角函数等,使用一元二次曲线拟合;对于双变量函数,如除法,采用二元二次曲面拟合。通过分段拟合计算最后得到计算结果。
作为优选,拟合处理单变量函数为一元二次函数:
Y=a0+a1*x+a2*x2=a0+x*(a1+a2*x)
拟合处理双变量函数为二元二次函数:
Yz=a0+a1*x+a2*x2+a3*y+a4*y2+a5*x*y
  =a0+x*(a1+a2*x)+a0+y*(a1+a2*y)+a5*x*y
其中a0,a1,a2,a3,a4,a5是参数,不同的分段采用不同的参数,使得函数拟合的精确度提高。
在拟合函数式中有一个通用的计算式,形式是(a1+a2*x),是通用的乘、加模式。
作为优选,拟合函数中的参数由计算机事先计算出,通过加载参数指令从主控处理器传送到参数表中。计算函数时先根据变量值在参数表中查找相应段内的各个参数,然后利用这些参数做拟合函数的计算,最后得到计算结果。
作为优选,接口控制电路与主控处理器之间采用存储器总线连接。采用通用的存储器总线进行指令、数据传输,占用主控处理器资源少、传输速率高、可靠性高、使用方便。
作为优选,主控处理器是单片机。本方案采用单片机作为主控处理器,标量浮点运算加速器通过存储器总线与单片机连接。
作为优选,运算器包括参数表、一多路选择器,一乘法器,一加法器,一多路选择器、一乘法器、一加法器连接成为乘加模式运算器。拟合函数式中的通用计算式(a1+a2*x)是通用的乘、加模式,因此,使用乘加模式运算器即可满足要求。由计算机计算出的参数存放在参数表中,根据选用的一元二次函数式Y=a0+x*(a1+a2*x)或二元二次函数式Yz=a0+x*(a1+a2*x)+a0+y*(a1+a2*y)+a5*x*y,将操作数通过多路选择器输入乘法器,根据操作数在参数表中选择出对应的参数值送入乘法器、加法器,再将乘法器的计算结果送入加法器等操作,最后计算出结果值。
本发明带来的有益效果是,采用分段可变参数曲线拟合技术使所有标量浮点计算式统一,大大简化了标量浮点运算加速器的设计复杂性,大幅提高了科学计算速度,采用分段拟合方式降低了拟合误差,采用存储器总线方式连接使标量浮点运算加速器接口通用性强、占用主控处理器资源少、使用方便。
附图说明
图1是标量浮点运算加速器的一种结构框图;
图2是单片机与标量浮点运算加速器的一种连接框图;
图3是运算器的一种结构框图。
图中:1是接口控制电路,2是接口寄存器,3是指令部件,4是运算器,5是单片机,6是标量浮点运算加速器,7是存储器总线,8是忙闲状态信号线,9是完成中断信号线,10是参数表,11是乘法器,12是加法器,13是多路选择开器。
具体实施方式
下面通过实施例,并结合附图,对本发明的技术方案作进一步具体说明。
实施例:如图1、图2所示,本发明是一种标量浮点运算加速器,包括单片机5,运算器4,接口控制电路1,接口寄存器2,指令部件3,接口控制电路1连接接口寄存器2,指令部件3连接接口寄存器2,运算器4连接接口寄存器2,单片机5连接接口控制电路1,运算器4对于单变量函数使用一元二次曲线拟合处理、对于双变量函数采用二元二次曲面拟合处理,拟合处理时对函数进行分段拟合,一元二次函数采用Y=a0+x*(a1+a2*x),二元二次函数采用Yz=a0+x*(a1+a2*x)+a0+y*(a1+a2*y)+a5*x*y,变量操作数存放在接口寄存器中,参数存放在运算器4的参数表中。
标量浮点运算加速器6与单片机5之间连接存储器总线7进行指令和数据传输;忙闲状态信号线8用于单片机5查询标量浮点运算加速器6处于忙状态还是空闲状态;标量浮点运算加速器6在计算任务完成时,通过完成中断信号线9通知单片机5。
图3所示为运算器4的结构框图,参数表10中存放根据拟合函数由计算机计算出的参数,计算时依据分段从中选择并读取参数,多路选择器13控制操作数、中间结果的选择输入及输入时序,乘法器11、加法器12对选定的拟合函数(Y=a0+x*(a1+a2*x)或Yz=a0+x*(a1+a2*x)+a0+y*(a1+a2*y)+a5*x*y)进行计算,最终计算结果送往接口寄存器2。
所以本发明具有使用分段可变参数曲线拟合技术使所有标量浮点计算式统一,大大简化了标量浮点运算加速器的设计复杂性,大幅提高了科学计算速度,采用分段拟合方式降低了拟合误差,采用存储器总线方式连接使标量浮点运算加速器接口通用性强、占用主控处理器资源少、使用方便等特征。

Claims (5)

1.一种标量浮点运算加速器,包括主控处理器,运算器,其特征在于:还包括接口控制电路,接口寄存器,指令部件,所述接口控制电路连接接口寄存器,指令部件连接接口寄存器,运算器连接接口寄存器,主控处理器连接接口控制电路,运算器对于单变量函数使用一元二次曲线拟合处理、对于双变量函数采用二元二次由面拟合处理,拟合处理时对函数进行分段拟合,不同的分段采用不同的参数;接口寄存器保存有多个操作数、计算结果和状态寄存器,指令部件根据不同的指令产生相应的控制逻辑,运算器执行函数计算;所述运算器包括参数表、一多路选择器,一乘法器,一加法器,所述一多路选择器、一乘法器、一加法器运接成为乘加模式运算器。
2.根据权利要求1 所述一种标量浮点运算加速器,其特征在于:所述拟合处理,单变量函数为一元二次函数
Y=aO+al*x+a2*x 2=aO+x*(al+a2*x)
所述拟合处理,双变量函数为二元二次函数
Y Z=aO+al*x+a2*x 2+a3*y+a4*y 2+a5*x*y
=aO+x*(al+a2*x)+aO+y*(al+a2*y)+a5*x*y
其中aO,al,a2,a3,a4,a5是参数。
3.根据权利要求1或2所述一种标量浮点运算加速器,其特征在于:所述拟合处理,拟合函数中的参数由计算机事先计算出,通过加载参数指令从主控处理器传送到参数表中。
4.根据权利要求1所述一种标量浮点运算加速器,其特征在于:所述接口控制电路与主控处理器之间采用存储器总线连接。
5.根据权利要求1或4所述一种标量浮点运算加速器,其特征在于:所述主控处理器是单片机。
CN201110315230.3A 2011-10-18 2011-10-18 一种标量浮点运算加速器 Active CN102693118B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110315230.3A CN102693118B (zh) 2011-10-18 2011-10-18 一种标量浮点运算加速器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110315230.3A CN102693118B (zh) 2011-10-18 2011-10-18 一种标量浮点运算加速器

Publications (2)

Publication Number Publication Date
CN102693118A CN102693118A (zh) 2012-09-26
CN102693118B true CN102693118B (zh) 2015-05-13

Family

ID=46858604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110315230.3A Active CN102693118B (zh) 2011-10-18 2011-10-18 一种标量浮点运算加速器

Country Status (1)

Country Link
CN (1) CN102693118B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104714773B (zh) * 2015-03-04 2018-04-20 中国航天科技集团公司第九研究院第七七一研究所 用于旋转角计算的基于plb总线的嵌入式ip软核及旋转角计算方法
CN110389746B (zh) * 2019-07-29 2021-04-23 中国电子科技集团公司第二十四研究所 硬件加速电路、微控制芯片及系统
CN117369707B (zh) * 2023-12-04 2024-03-19 杭州米芯微电子有限公司 一种数字信号监测电路及芯片

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1034078A (zh) * 1988-01-09 1989-07-19 北京信通电脑技术公司 直接处理接近数学公式的“机器表达式”的计算机系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7707236B2 (en) * 2004-08-13 2010-04-27 Analog Devices, Inc. Methods and apparatus for an efficient floating point ALU

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1034078A (zh) * 1988-01-09 1989-07-19 北京信通电脑技术公司 直接处理接近数学公式的“机器表达式”的计算机系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种曲面拟合的方法;郭有思;《物理实验》;19840720;第4卷(第04期);189-191 *
基于单片机的传感器曲线拟合;黄长征等;《传感器技术》;20040420;第23卷(第04期);70-72 *

Also Published As

Publication number Publication date
CN102693118A (zh) 2012-09-26

Similar Documents

Publication Publication Date Title
US10387319B2 (en) Processors, methods, and systems for a configurable spatial accelerator with memory system performance, power reduction, and atomics support features
US10380063B2 (en) Processors, methods, and systems with a configurable spatial accelerator having a sequencer dataflow operator
US10515046B2 (en) Processors, methods, and systems with a configurable spatial accelerator
EP3726389A1 (en) Apparatuses, methods, and systems for memory interface circuit allocation in a configurable spatial accelerator
CN106325810B (zh) 微处理器
EP3719654A1 (en) Apparatuses, methods, and systems for operations in a configurable spatial accelerator
US20190095383A1 (en) Processors, methods, and systems for debugging a configurable spatial accelerator
EP3343388A1 (en) Processors, methods, and systems with a configurable spatial accelerator
JP2021192257A (ja) プログラム可能な最適化を有するメモリネットワークプロセッサ
US20190005161A1 (en) Processors, methods, and systems for a configurable spatial accelerator with performance, correctness, and power reduction features
WO2020005448A1 (en) Apparatuses, methods, and systems for unstructured data flow in a configurable spatial accelerator
CN103150146B (zh) 基于可扩展处理器架构的专用指令集处理器及其实现方法
US20170097824A1 (en) Chained split execution of fused compound arithmetic operations
US10678724B1 (en) Apparatuses, methods, and systems for in-network storage in a configurable spatial accelerator
US8892620B2 (en) Computer for Amdahl-compliant algorithms like matrix inversion
CN102339217B (zh) 一种浮点数乘加器融合处理装置及方法
JP7183197B2 (ja) 高スループットプロセッサ
CN102693118B (zh) 一种标量浮点运算加速器
US11907713B2 (en) Apparatuses, methods, and systems for fused operations using sign modification in a processing element of a configurable spatial accelerator
CN102682232B (zh) 一种高性能超标量椭圆曲线密码处理器芯片
CN115310037A (zh) 矩阵乘法计算单元、加速单元、计算系统和相关方法
CN107092462B (zh) 一种基于fpga的64位异步乘法器
CN102411490B (zh) 一种针对动态可重构处理器的指令集的优化方法
CN202281998U (zh) 一种标量浮点运算加速器
CN203746056U (zh) 多操作数四则混合定点算术运算控制器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201130

Address after: 226500 Jiangsu city of Nantong province Rugao City Jiang Zhen Dong Yue Road No. 1

Patentee after: JIANGSU BEICHEN ENVIRONMENT SCIENCE & TECHNOLOGY Co.,Ltd.

Address before: Eswell road 215163 high tech Zone in Suzhou City, Jiangsu province No. 2 garden room M1-203 micro system

Patentee before: SUZHOU GALAXY ELECTRONIC TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220621

Address after: No. 9, Zhennan Road, Jiang'an Town, Rugao City, Nantong City, Jiangsu Province, 226500

Patentee after: JIANGSU GELIN MACHINERY CO.,LTD.

Address before: No.1, Dongyue Road, Jiang'an Town, Rugao City, Nantong City, Jiangsu Province, 226500

Patentee before: JIANGSU BEICHEN ENVIRONMENT SCIENCE & TECHNOLOGY CO.,LTD.