CN1013070B - 直接处理接近数学公式的″机器表达式″的计算机系统 - Google Patents
直接处理接近数学公式的″机器表达式″的计算机系统Info
- Publication number
- CN1013070B CN1013070B CN 88100021 CN88100021A CN1013070B CN 1013070 B CN1013070 B CN 1013070B CN 88100021 CN88100021 CN 88100021 CN 88100021 A CN88100021 A CN 88100021A CN 1013070 B CN1013070 B CN 1013070B
- Authority
- CN
- China
- Prior art keywords
- unit
- note
- called
- formulas
- classes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Images
Landscapes
- Complex Calculations (AREA)
- Multi Processors (AREA)
Abstract
本发明系直接处理接近数学公式的“机器表达式”的计算机系统,是一种新的计算机设计系统。目前高性能的向量机和阵列机,造价高研制维修难,编程序难。本发明是设计一种面向VLSI技术,具有并行、流水、数据流特点的树型多处理器系统,由于采用允许冲突的多级互连网络,把向量运算和标量运算统一到”机器表达式”。运算速度大幅度提高。对高级语言只要求把其“表达式”转化为“机器表达式”。本发明适用于大型机和巨型机系统。
Description
本发明是一种新的计算机设计系统。
在气象、石油勘探以及科技、国防等领域中使用的计算机,一般都采用高性能的向量机和阵列机。但是,这种结构计算机的主要问题是造价高、研制维修难、编程序难。
本发明是设计一种面向VLSI技术,具有并行、流水、数据流特点的树型多处理器系统。其特点是可直接处理接近数学公式的“机器表达式”,由于该系统能够把向量运算和标量运算统一到接近数学公式的“机器表达式”中,因此,用户不用为并行处理浪费时间,不用为安排向量操作和标量运算,就能高效地并行、流水操作,从而使运算速度大幅度提高。本系统采用了允许冲突的多级互连网络,编程序不必考虑将取数据的冲突问题。本系统是对“机器表达式”的高度并行、流水处理中取得高性能,因此对操作系统和高级语言无特殊要求,对高级语言只要求把高级语言“表达式”转换成“机器表达式”。
一、系统结构
本系统主要由下述四部分组成,系统框图参见图1。
1.主控制机1:在系统中承担运行操作系统,执行外设管理,通信网络处理和配合高速处理部件2执行用户程序。主控制机可选用现有的中、小型机或超级微型机。
2.高速处理部件2:是本发明的关键部件、其功能是高速并行、流水处理“机器表达式”。
3.接口部件3:完成主控制机和高速处理部件之间的连系和同步。接口部件由指令、数据缓冲寄存器、忙/闲标志寄存器和一些控制线路组成。
4.内存贮器4:主控制机和高速处理部件共享内存4,内存采用多体交叉按模工作方式,本文说明中选16个存贮体。
系统中还有外围设备6和总线5。
二、系统工作方式
本系统指令分为两大类:主控制机指令和高速处理部件指令,用指令的高4位“标志码”加以区别。主控制机负责从内存取指令,送往接口部件,该部件根据指令的“标志码”判别是主控制机指令还是高速处理部件指令,然后分别交给主控制机或高速处理部件去执行。用户程序如附图2所示,图中A表示主控制机指令,B表示高速处理部件指令,而且是“机器表达式”指令,图中第n,n+1条指令都由主控制机执行,第n+2条指令由高速处理部件执行,这条指令指向“机器表达式”所在单元始地址,高速处理部件取出“机器表达式”并执行,第n+3条指令由主控制机去执行。
三、高速处理部件:
是本发明的关键,其结构如图3所示,它是由指令变址部件7、运算部件8、先行缓冲器部件9和互连网络10组成。它通过接口部件与主控制机相连,并与主控制机共享内存4。
1.高速处理部件各部件的功能
a)指令变址部件7:执行变址运算指令,负责从内存取“机器表达式”并进行扩散,使之适于运算部件执行“机器表达式”规定的运算。计算操作数地址和送运算结果地址,执行取操作数和送运算结果给内存。
b)运算部件8:从先行缓冲器中取运算符和操作数按并行、流水、数据流方式进行运算。运算包括定点运算、浮点运算、逻辑运算、关系运算、位逻辑运算和一些超越、非超越函数运算。运算结果要送内存时通知指令变址部件执行送数操作。
c)先行缓冲器部件9:为了平滑提供数据和运算,设置了先行缓冲器,该部件用于存放运算符和操作数,供运算部件使用。
d)互连网络10:指令变址部件从多体存贮器系统中取“机器表达式”、操作数以及送运算结果去内存都必须通过互连网络。互连网络采用允许冲突的多级移位网络,用户用不着考虑并行存、取数时的冲突问题。
2.高速处理部件的结构:
a)指令变址部件7:是由EIR指令寄存器RD、RB、RA寄存器、L计数器、变址运算器、B扩散器、A扩散器及控制线路组成。参见附图4
ETR:寄存由接口部件来的高速处理部件指令。
RD:从互连网络接收数据送入变址单元,或从变址单元取数或地址交给互连网络。
RB:由互连网络来的“机器表达式”经过B扩散器寄存到RB中,根据RB寄存器内容进行地址运算。
RA:“机器表达式”的送数地址经过A扩散器寄存到RA中,根据RA的内容进行送数地址运算。
变址运算器:执行变址运算,可用现有的32位微处理器,例如68020作为变址运算器,把其内部寄存器可当作变址单元,系统设置了多个地址运算器,例如16个,并行工作。
L计数器:“机器表达式”的执行一般是循环执行过程,由L计数器计算循环次数。
b)运算部件8:把多个处理器(例如16个)排列成二叉树型结构,高度并行、流水按数据流方式工作。每个处理器结构如图5所示,是由CPU、运算符寄存器、位逻辑器、数据寄存器R1和R2,一些位标志如TK1、TK2、TE1、TE2、T.1、T.2、T.′、CC1、CC2、控制线路和运算符寄存器组成。
CPU:可采用现成的高挡微处理器和协处理器,例如68020、68881。CPU执行定、浮点算术运算、关系运算、逻辑运算、位逻辑运算和一些函数运算、函数运算可包括sin、cos、tg、sin-1、cos-1、tg-1、
、SH、CH、tn、tn-1、ex、2x、lnx+1、ex-1、10x、log2x、lgx、lnx等,
R1,R2数据寄存器:由前一级处理器送来的或从先行缓冲器中取来的操作数寄存到R1、R2中,供CPU使用。
TK1、TK2:当其为1时,表示前一级已把操作数送入相应的R1和R2中,当其为0时,表示相应的操作数还没有准备就绪。
TE1、TE2:用于表示R1、R2中操作数是否有效,1表示无效、0表示有效。TE1对应于R1、TE2对应于R2。
T.1=1表示R1中的数或CC1条件位是要送内存的内容。
T.2=2表示R2中的数或CC2条件位是要送内存的内容。
Rθ运算符寄存器:用于存放运算符,控制器根据Rθ实现控制运算。
TCC1、TCC2为条件位,位逻辑器对它们进行∧、∨、
、>等操作,结果送入后一级的TCC1(i=1、2)中。
控制器:控制器包括PROM、PROM地址计数器和控制线路。主要功能是把“机器表达式”的运算符通过PROM转换成CPU能执行的指令形式,交给CPU去执行,有的指令直接在位处理器中执行。
运算部件每一个处理器的运算过程如下:
当运算符所需的操作数已准备好了时,由CPU或位逻辑器执行运算,操作数是由前一级运算部件或先行缓冲器送来,用TK1、TK2、TE1、TE2来判别操作数是否已准备好了,是否有效。运算结束时,如果后一级的数据寄存器“空”,则送入其中,同时传送相应的位标志即TK1、TK2、TE1、TE2。如果送到后一级的是准备送入内存的数(其标志是T.′=1),则把后一级相应的T.置1。如果本级的T.=1,则不再执行运算,准备送数到内存。
c)先行缓冲器部件9:它是由寄存器单元、读地址计数器、写地址计数器、同步控制线路组成。由互连网络来的数据和由指令变址部件来的运算符送入先行缓冲器中,交运算部件使用。读和写是随机过程、由读、写地址计数器和读/写同步控制机构去完成。
d)互连网络10:互连网络采用允许冲突的多级移位网络,而且每两级合并成一级。移位单元取2n=N,n为正整数,下面我们取N=16,移位信
息的结构由图6所示,由D、Y和T组成。D为数据或者地址,Y为移位控制信息,T为有效位。
(n-2)/2
Yj (i)=∑(2·yj 2j+1(h)+yj 2j(i)2j 2
i表示第i移位单元,j表示第j级、第i移位单元第j级的移位受yj(i) 2j+1及yj(i) 2j的控制。Yj(i) 2j+1和Yj(i) 2j的译码如图7所示。
第i单元第j级被移位信息的各位的输出决定于如下4个控制信号:
1Cj 0(i)=1:取第i单元
2Cj 1(i-22j):取第i-22j单元
3Cj 2(i-2·22j):取第i-2·22j单元
4Cj 3(i-3·22j):取第i-3·22j单元
这里i-1·22j=L1=1~3当L取负值时取16+L单元。
当4个控制信号中两个以上为1时,按优先权次序取,而其余的被淘汰,序号为1的优先权最高,4最低。
工作过程如下:
①根据Tj(i),yj 2j+1(i),Yj 2j(i)译码产生Cj 0(i),Cj 1(i),Cj 2(i),Cj 3(i)
②对于Cj 0(i),Cj 1(i-22j),Cj 2(i-2·22j),Cj 3(i-3·22j)进行优先权编码,得到二进码输出及有效位标志Ti+1 (1)。
③根据优先权编码器的输出,可用4取一多路器,先取4个移位单元之一,附图8中给出了示意图,其中多路器是只给了1位的情况,其他位都相同,
④根据移位之前的有效标志位T(i)和移位之后产生的T*(i)判别移位中被淘汰情况,
T(i) T*(i)
0 X无效
1 0移位过程中被淘汰
1 1有效
对于被淘汰的部分重新进行移位,重复上述过程直到全部移位为止,如无碰头则移一次就结束,
3.高速处理部件工作方法
指令变址部件从接口部件取得高速处理部件指令,通过忙/闲标志和主控制机同步。高速处理部件有两类,一是变址运算指令,直接由变址指令部件执行,一是“机器表达式”指令,由运算部件执行。“机器表达式”指令执行过程如下:
指令变址部件计算出“机器表达式”所在单元始地址,通过互连网络从内存中取出“机器表达式”,经过B扩散器寄存到RB寄存器中,送数地址经过A扩散器寄存到RA寄存器中,而循环参数寄存到L计数器中,根据RB内容由变址运算器计算出操作数地址,通过互连网络从内存中取操作数,送入先行缓冲器中,运算符从指令变址部件送入先行缓冲器中,运算部件从先行缓冲器中取出运算符和操作数并行、流水按数据流方式执行所规定的运算,运算结果送入内存。当然也通过线连网络。而送数地址是由指令变址部件根据RA寄存器内容计算而得。“机器表达式”指令形式如图4所示。I为指令“标志码”,由它来区分出主控制机指令,还是高速处理部件指令,操作:指出那一类,那一级“机器表达式”;A:指出“机器表达式”在内存中始地址。
4.关于“机器表达式”
“机器表达式”由“机器表达式”基本形构成,其特点如下:
1)它是由运算符、操作数和“括号”组成。运算符包括整数算术运算符、浮点数运算符、关系运算符、逻辑运算符、位逻辑运算符、空操作符和一些函数符。函数符可包括:sin、sin-1、cos、cos-1、tg、tg-1、SH、CH、tH、tn-1、
、lx、ln(x+1)、lx-1、2x、10x、logx 2、lgx、lnx等。操作数有四种,立即数、内存中数、寄存器中数和空操作数。计算顺序由括号决定,但括号并不存入内存,因此称它为“虚括号”。
2)“虚括号”特点如下:
a)“虚括号”有级别,编号为0级、1级、2级……等,0级为最内层,级别号大者在外层。同一级“虚括号”中的运算相互独立地并行执行,不同级之间可重迭工作。
b)每一个“虚括号”只允许包含一个运算符和两个操作数或它比低一级的两个“虚括号”。
c)运算符两边的“虚括号”必须是同级。
“机器表达式”共分5类,都由基本形组成。
第一类:
θ为运算符,例如+、-、×、
、sin……等。
称作一类2级式,记作I-2。
{[(aiθ1bi)θ2(ciθ3di)]θ4[(eiθ5fi)θ6(giθ7hi)]}
称作一类3级式,记作I-3。
以此可推出:
第二类:
Ai=ai i=0~n称作二类0级式,记作Ⅱ-0,
Ai=(aiθbi) i=0~n称作二类1级式,记作Ⅱ-1,
Ai=[(aiθ1bi)θ2(ciθ3di)] i=0~n称作二类2级式,记作Ⅱ-2,
同理可推出
Ai={[……]θ[……]} i=0~n称作二类3级式,记作Ⅱ-3,
Ai={[……]θ[……]} i=0~n称作二类4级式,记作Ⅱ-4,
第三类:
A,B,C,……=(aθ1b),(cθ2d),(eθ3f)……称作三类1级式,记作Ⅲ-1,
等号左边地址不许出现在等号右边,所有第三类“机器表达式”都要遵守这个规定。另外,对Ⅲ-1而言,等号左边项数不许超过8个。
Ⅲ-1的含意是并行执行,即:
A=(aθ1b)
B=(cθ2d)
C=(eθ3f)
A,B,C,……=[(aθ1b)θ2(cθ3d)],[……],[……],……称作三类2级式,记作Ⅲ-2,
等号左边项数不许超过4个,
A,B={……},{……}称作三类3级式,记作Ⅲ-3,
等号左边项数不许超过2个,
A={……}θ{……}称作三类4级式,记作Ⅲ-4,
第四类:
ri+1=[f(ri)……]称作四类2级式,记作Ⅳ-2,
f表示函数关系,但限定在本系统给的运算方式之内。
ri+1={f(ri)……}称作四类3级式,记作Ⅳ-3,
第五类(算数、关系、位逻辑运算)其特点:
1、运算结果为位运算,
2、至少有一个关系运算,
3、运算次序必须为算术、关系、位逻辑运算、不许颠倒,
4、关系运算结果不许再参加关系运算,
Ai=(aiθbi) i=0~n称作五类1级式,记作Ⅴ-1,
θ必须满足上述4条运算规则。
Ai=[(aiθ1bi)θ2(ciθ3di)] i=0~n称作五类2级式,记作
V-2,
Ai=[……]θ[……] i=0~n称作五类3级式,记作
V-3,
Ai={……}θ{……} i=0~n称作五类4级式,记作Ⅴ-4。
附图说明
附图1:系统总图
附图2:系统中指令执行程序图
附图3:高速处理部件图
附图4:指令变址部件图
附图5:运算部件每个处理器结构图
附图6:互连网络移位信息结构图
附图7:互连网络移位控制码译码图
附图8:互连网络第i单元第j级连接图
本系统的优点概括如下:
由于直接处理接近数学公式的“机器表达式”,因此对于操作系统,高级语言没有并行化,向量化
等特殊要求,充分发挥计算题目所固有的并行流水操作,提高了机器的实际性能。
互连网络采用允许冲突的多级移位网络,高速并行存取数据,而且用户不必考虑并行存取的冲突问题。
系统采用VLSI技术,体积为超微型机规模,但性能可达到大型机、小巨型机的性能,提高了性能/价格比。
Claims (1)
1、本发明是一种直接处理接近数学表达式的“机器表达式”的计算机系统,由主控制机,接口部件,存储器系统和高速处理部件四大部件组成,其特征在于高速处理部件,该部件由指令变址部件、先行缓冲器(包括数据和运算符)、互连网络和运算部件所组成,
指令变址部件用于加工高速处理部件指令、计算“机器表达式”所在单元开始地址、取“机器表达式”、并进行扩散,使之适于运算部件执行“机器表达式”规定的运算、计算操作数地址和运算结果地址、取操作数、执行变址操作、送运算结果到内存,它有n个执行单元并行操作,
指令变址部件由EIR指令寄存器,RA、RB、RD寄存器,A扩散器,B扩散器,地址运算器,L计数器和变址寄存单元等组成,
EIR用于寄存高速处理部件指令,
RA寄存器用于寄存A扩散器送来的“机器表达式”的送数地址,
RB用于存放B扩散器扩散成的适于运算部件处理的格式信息,RB有n个分量,并行操作,
地址运算的结果通过RD寄存器送往互连网络,再送内存,而内存送往变址单元的数据通过互连网络先送RD,再送变址单元,
地址运算器可采用现有的,如“MC68020”微处理器来实现,它执行变址运算,它的内部寄存器可作为变址单元,本系统采用了n个地址运算器,并行工作,
通常“机器表达式”的执行是一个循环的执行过程,L计数器用来计算循环次数,并控制循环进程,
互连网络是指令变址部件从多体交叉存取的存储器系统中取“机器表达式”、操作数,送运算结果的必经的通道,本系统采用的互连网络是允许冲突的多级移位网络,它把相邻两级移位电路合并成一级,对用户程序透明,
移位单元取2n=N,n为正整数,这里取N=16,被移位信息由D、Y和T组成,D为数据或地址,Y为移位控制信息,T为有效位,则
(n-2)/2
Yi(i)=Σ(2·Yj 2j+1(i)+Yj 2j(i))22j
式中i表示第i移位单元,j表示多级移位网的第j级,显然第i移位单元第j级移位受Yj 2j+1(i)·Yj 2j(i)及Tj(i)的控制,据此译码产生Cj o(i)~Cj 3(i)
Y2j+1(i) Y2j(i) Tj(i) 输出(1/0)
0 0 1 Cj 0(i)
0 1 1 Cj 1(i)
1 0 1 Cj 2(i)
1 1 1 Cj 3(i)
第i单元第j级被移位信息的各位的输出决定于如下4个控制信号
①Cj 0(i)=1取第i单元
②Cj 1(i-22j)=1取第i-22j单元
③Cj 2(i-2·22j)=1取第i-2、22j单元
④Cj 3(i-3·22j)=1取第i-3·22j单元
这里i-L·22j=LL=1~3当L取负值时取16+L单元,
当4个控制信号中两个以上为1时按优先权次序取,其它被淘汰,序号为1的优先权最高,4最低,
工作过程如下:
①根据Tj(i),Yj 2j+1(i),Yj 2j(i)译码产生Cj 0(i),Cj 1(i),Cj 2(i),Cj 3(i)
②对于Cj 0(i),Cj 1(i-22j),Cj 2(i-2·22j),Cj 3(i-3·22j)进行优先权编码得到二进码输出及有效位标志Tj+1(i)
③根据优先编码器的输出取4个移动单元之一,用4取1的多路器,附图4中表示的是1位的情况,其它各位都相同,
④根据移位之前的有效标志位T(i)和移位之后产生的T*(i)判别移位中被淘汰情况,
T(i) T*(i)
0 X无效
1 0移位过程中被淘汰
1 1有效
对于被淘汰的部分重新进行移位,重复上述过程直到全部移位为止,如无碰头则移一次就结束,
运算部件是由多个处理器(可取16)排列成的二叉树型结构,它从先行缓冲器取运算符和操作数,高速并行,流水,按数据流方式工作,运算结果要送内存时,通知指令变址部件执行送数操作,
各处理器由CPU、运算符寄存器、位逻辑器、R1和R2数据寄存器、标志寄存器(TK1,TK2,TE1,TE2,T·1,T·2,TCC1,TCC2等)和控制器组成,
CPU可用现成的高档微处理器和能执行浮点运算和初等函数运算的协处理器,例如“MC68020”和“MC68881”构成,
R1、R2数据寄存器用于寄存本级处理器的操作数,或前级处理器的运算结果,
运算符寄存器供存放运算符用,控制器据此控制处理器操作,
控制器包括PROM、PROM地址计数器PC、时钟发生器和控制线路,它通过PROM把“机器表达式”的运算符转换成CPU能执行的指令,交给CPU去执行,
TK1、TK2、TE1、TE2分别标志由前一级处理器或先行缓冲器送来的操作数是否准备就绪,是否有效,当位标志To=1时,表明与其对应的数据寄存器中的内容应送内存,
“机器表达式”由运算符、操作数和“括号”组成,运算符包括整数算术运算符、浮点运算符、关系运算符、逻辑运算符、位逻辑运算符、空操作符和函数符,操作数可由立即数、存储器地址、寄存器号和空操作数四种方式给出,
计算次序由括号决定,但括号并不存入内存,是虚的,可称之为“虚括号”,“虚括号”分0级、1级、2级……等级别,0级为最内层,级别号大者在外层,在运算部件中,同级“虚括号”内的运算独立并行执行,不同级“虚括号”之间可重迭工作,每一“虚括号”只含有一个运算符和两个操作数,或比它低一级的两个“虚括号”,运算符两边的“虚括号”必须是同级,
第一类机器表达式
式中A为结果单元地址,∑表示泛指的一种运算符,例如Max,Min,|Max|,|Min|,∑,∏等,
θ为运算符,可以是+、-、×、÷、或其它函数符等,
称作一类2级式,记作Ⅰ-2,
{[(aiθ1bi)θ2(ciθ3di)]θ4[(eiθ5fi)θ6(giθ7hi)]}
称作一类3级式,记作Ⅰ-3,
由此可推出
{……}θ{……}称作一类4级式,记作I-4,
第二类:
Ai=aii=0~n称作二类0级式,记作Ⅱ-0,
Ai=(aiθbi)i=0~n称作二类1级式,记作Ⅱ-1,
Ai=[(aiθ1bi)θ2(ciθ3di)]i=0~n称作二类2级式,记作Ⅱ-2,
同理可推出
Ai={[……]θ[……]}i=0~n称作二类3级式,记作Ⅱ-3,
Ai={……}θ{……}i=0~n称作二类4级式,记作Ⅱ-4,
第三类:
A,B,C……=(aθ1b),(cθ2d),(eθ3f)……称作三类1级式,记作Ⅲ-1,
等号左边项数不许超过8个,此式表示并行执行,即:
A=(aθ1b)
b=(cθ2d)
C=(eθ3f)
A,B,C……=[(aθ1b)θ2(cθ3d)],[……],[……],…称作三类2级式,记作Ⅲ-2,
等号左边项数不许超过4个,
A,B={……},{……}称作三类3级式,记作Ⅲ-3,
等号左边项数不许超过2个,
A={……}θ{……}称作三类4级式,记作Ⅲ-4,
第四类:
ri+1=[f(ri)…]f表示的函数关系为限定的θ运算方式之内,称作四类2级式,记作Ⅳ-2级式,
ri+1={f(ri)…}称作四类3级式,记作Ⅳ-3级式,
第五类(算术、关系、位逻辑运算)其特点:
①运算结果为位值(1或0),
②至少有一个关系运算,
③运算次序必须为算术、关系、位逻辑运算、不许颠倒,
④关系运算结果不许再参加关系运算,
Ai=aiθbii=0~n称作五类1级式,记作Ⅴ-1,
Ai=(aiθ1bi)θ2(ciθ3di)i=0~n称作五类2级式,记作Ⅴ-2,
Ai=[……]θ[……]i=0~n称作五类3级式,记作Ⅴ-3,
Ai={……}θ{……}i=0~n称作五类4级式,记作Ⅴ-4。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 88100021 CN1013070B (zh) | 1988-01-09 | 1988-01-09 | 直接处理接近数学公式的″机器表达式″的计算机系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 88100021 CN1013070B (zh) | 1988-01-09 | 1988-01-09 | 直接处理接近数学公式的″机器表达式″的计算机系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1034078A CN1034078A (zh) | 1989-07-19 |
CN1013070B true CN1013070B (zh) | 1991-07-03 |
Family
ID=4831127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 88100021 Expired CN1013070B (zh) | 1988-01-09 | 1988-01-09 | 直接处理接近数学公式的″机器表达式″的计算机系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1013070B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4082706B2 (ja) * | 2005-04-12 | 2008-04-30 | 学校法人早稲田大学 | マルチプロセッサシステム及びマルチグレイン並列化コンパイラ |
CN102693118B (zh) * | 2011-10-18 | 2015-05-13 | 苏州科雷芯电子科技有限公司 | 一种标量浮点运算加速器 |
CN107729990B (zh) * | 2017-07-20 | 2021-06-08 | 上海寒武纪信息科技有限公司 | 支持离散数据表示的用于执行正向运算的装置及方法 |
-
1988
- 1988-01-09 CN CN 88100021 patent/CN1013070B/zh not_active Expired
Also Published As
Publication number | Publication date |
---|---|
CN1034078A (zh) | 1989-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Linderman et al. | Merge: a programming model for heterogeneous multi-core systems | |
Gong et al. | MALOC: A fully pipelined FPGA accelerator for convolutional neural networks with all layers mapped on chip | |
Wolf et al. | Multiprocessor system-on-chip (MPSoC) technology | |
CN1274085C (zh) | 集成电路器件及其设计方法 | |
Sun et al. | Dissecting tensor cores via microbenchmarks: Latency, throughput and numeric behaviors | |
CN1229741C (zh) | 借助并行定序器的数字电路实现 | |
Wang et al. | SODA: Software defined FPGA based accelerators for big data | |
CN1142484C (zh) | 微处理器向量处理方法 | |
CN1781092A (zh) | 数据流机 | |
CN87100507A (zh) | 微处理器芯片上的堆栈式超高速缓冲存储器 | |
CN1434380A (zh) | 图像处理装置和方法以及用于该装置的编译程序 | |
CN101055535A (zh) | 并行计算机和定位并行计算机中硬件故障的方法 | |
CN1653446A (zh) | 具有可配置执行单元的高性能混合处理器 | |
CN1250906A (zh) | 使用组合的数据处理器系统和指令系统 | |
CN1834922A (zh) | 程序变换方法及程序变换系统 | |
CN1655118A (zh) | 处理器和编译器 | |
CN1226699A (zh) | 高性能的推测性字符串/多重操作 | |
CN1013070B (zh) | 直接处理接近数学公式的″机器表达式″的计算机系统 | |
CN1740963A (zh) | 扩展精度的整数除的方法 | |
Podobas et al. | Empowering OpenMP with automatically generated hardware | |
CN1203402C (zh) | 一种16位微处理器的系统结构 | |
CN1297889C (zh) | 信息处理装置以及机器语言程序变换装置 | |
Zhang et al. | High-performance and energy-efficient fpga-gpu-cpu heterogeneous system implementation | |
Lin et al. | Hierarchical coarse-grained stream compilation for software defined radio | |
Podobas | Accelerating parallel computations with openmp-driven system-on-chip generation for fpgas |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C13 | Decision | ||
GR02 | Examined patent application | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |