CN103984524B - 一种面向risc处理器的三端口浮点寄存器文件 - Google Patents

一种面向risc处理器的三端口浮点寄存器文件 Download PDF

Info

Publication number
CN103984524B
CN103984524B CN201410206420.5A CN201410206420A CN103984524B CN 103984524 B CN103984524 B CN 103984524B CN 201410206420 A CN201410206420 A CN 201410206420A CN 103984524 B CN103984524 B CN 103984524B
Authority
CN
China
Prior art keywords
enable
reading
write
depositor
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410206420.5A
Other languages
English (en)
Other versions
CN103984524A (zh
Inventor
陈庆宇
吴龙胜
段青亚
盛廷义
唐威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
771 Research Institute of 9th Academy of CASC
Original Assignee
771 Research Institute of 9th Academy of CASC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 771 Research Institute of 9th Academy of CASC filed Critical 771 Research Institute of 9th Academy of CASC
Priority to CN201410206420.5A priority Critical patent/CN103984524B/zh
Publication of CN103984524A publication Critical patent/CN103984524A/zh
Application granted granted Critical
Publication of CN103984524B publication Critical patent/CN103984524B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Multi Processors (AREA)
  • Executing Machine-Instructions (AREA)

Abstract

本发明公开了一种面向RISC处理器的三端口浮点寄存器文件,通过在寄存器文件的输入信号中,增加源操作数和目标操作数的精度标志位,寄存器阵列的控制逻辑根据精度标志位和读写标志位,对源操作数和目标操作数地址指定的寄存器及与它地址相邻的寄存器同时进行读写操作,可以单周期完成双精度、四精度浮点数的读取和回写,解决了浮点运算过程中面临的SRAM带宽问题。

Description

一种面向RISC处理器的三端口浮点寄存器文件
技术领域
本发明专利属于微处理器体系结构领域,涉及一种面向RISC处理器的三端口浮点寄存器文件。
背景技术
精简指令集(RISC)处理器的大部分指令操作都在寄存器之间进行,必须由专门的访存指令完成外部存储器的读写操作。为了加快指令的执行速度,RISC处理器内部都有寄存器文件,指令执行过程中从寄存器文件取得源操作数,并将执行结果(目标操作数)写回到寄存器文件。一般情况下,RISC处理器的指令使用两个源操作数,计算得到一个目标操作数,基于此,寄存器文件应具有三个端口,具体包括两个读端口和一个写端口。
当前,三端口的寄存器文件的主要设计方法有两种,第一种为针对特殊应用要求(如抗辐照)的全定制设计,此类方法并不适用于通用处理器的寄存器文件实现。另一种基于单元库的半定制设计,即利用两块单元库中提供的双端口SRAM构造三端口的寄存器文件,如Atmel公司的AT697E、AT697F系列处理器,Gaisler研究所的LEON系列处理器及UT699系列处理器等。
文献“UT699LEON3FT/SPARCV8MicroProcessorFunctionalManual”公开了UT699处理器中寄存器文件的设计方法,通过两块256x48的双端口SRAM构造一个168x39的三端口寄存器文件,构造方法如图1所示,将目标操作数同时回写到两块SRAM中,以保证两块SRAM中数据的一致性,两个源操作数则是通过分别向两块SRAM请求数据获得。
基于单元库的半定制设计主要存在以下不足:(1)硬件资源浪费,增大了设计的功耗。该方法至少需要2倍于实际寄存器文件大小的SRAM存储单元,忽略SRAM存储单元中的行浪费,UT699中为3倍(2x256÷169);(2)带宽限制。当处理器进行大于单精度的浮点运算时,其所需的源操作数需要多个周期获得,影响处理器性能(同一时刻,SRAM只能译码一个读地址,也只能给出一个存储单元的数据)。
中国专利“一种用于浮点协处理器的寄存器文件分组编址、读写控制方法”(ZL201010261146.3)解决了浮点运算时SRAM带宽限制的问题,该方法通过将原来两块的SRAM分成两组,每组又分为四个小组,通过处理器对八个小组分别提供读写控制信号实现对输入、输出128位数据的控制。由于该方法基于单元库中SRAM,可能不存在合适大小的SRAM而造成更大的资源浪费,增加了功耗,另外该设计需要处理器产生8组控制信号,增加了处理器设计复杂性及后端布线的难度。
发明内容
本发明解决的技术问题在于提供一种面向RISC处理器的三端口浮点寄存器文件,通过使用寄存器阵列代替单元库中的SRAM作为三端口寄存器文件的存储单元,避免了硬件资源的浪费,降低了功耗。
本发明专利是通过以下技术方案来实现:
一种面向RISC处理器的三端口浮点寄存器文件,包括:
写地址译码模块,输入为寄存器文件写使能和写地址,当写使能有效时,置与写地址对应的寄存器AR的写使能w_en有效,并将其分别输出至写控制模块和写数据互连网络;
写控制模块,根据输入的写使能w_en和端口的输入写操作精度标志位,决定寄存器AR下面相邻的寄存器的写使能是否有效;输出m位写使能至寄存器阵列中m个寄存器的写使能端;
写数据互连网络,在写使能w_en控制下,将输入的寄存器文件128位写数据从低位到高位,以32位一组分为a、b、c、d四组;输出为m个32位的数据,分别连接至寄存器阵列中m个寄存器的数据输入端:将a组连接到寄存器AR的数据输入端datai;将b、c、d三组分别依次连接至AR下面相邻的三个寄存器的数据输入端datai,除a、b、c、d四组之外其余m-4组均为0;
寄存器阵列,为线性编址的一维寄存器阵列,大小为m×32,阵列的宽等于浮点寄存器的位宽,阵列的深度m等于浮点寄存器的个数,阵列中每一个寄存器有写使能,其每个寄存器的写使能和数据输入端分别来自写控制模块和数据互连网络,寄存器阵列有m个32位输出,全部连接至读数据互连网络;当某个寄存器写使能有效时,其输入的数据在时钟上升沿写入该寄存器,阵列中寄存器的输出恒有效;
第一读地址译码模块,输入为源操作数1的读使能1和读地址1,当读使能1有效时,置与读地址对应的寄存器AR的读使能r_en0有效,并将其输出至第一读控制模块;
第一读控制模块,输出为4位读使能r_en0、r_en1、r_en2、r_en3,全部连接至读数据互连网络;该模块根据输入读操作1精度标志位和读使能1,决定AR下面相邻的寄存器的读使能是否有效;
第二读地址译码模块,输入为源操作数2的读使能2和读地址2,当读使能2有效时,置与读地址对应的寄存器AR的读使能r_en0有效,并将其输出至第二写读控制模块;
第二读控制模块,输出为4位读使能r_en0、r_en1、r_en2、r_en3,全部连接至读数据互连网络;该模块根据输入读操作2精度标志位和读使能2,决定AR下面相邻的寄存器的读使能是否有效;
读数据互连网络,根据输入寄存器阵列的m个32位的输出和第二读控制模块的四位读使能的信号,生成1个128位的数据进行输出;
根据输入寄存器阵列的m个32位的输出和第一读控制模块的四位读使能的信号,生成1个128位的数据进行输出。
所述的写控制模块,根据写使能w_en和端口的输入写操作精度标志位进行如下判断:
如果写操作的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器的写使能w_en置有效;
如果写操作的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器的写使能w_en全部置有效(高电平);
如果写操作的精度标志位为单精度,只保持AR的写使能w_en有效。
所述的第一读控制模块进行以下判断:
如果读操作1的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器的读使能r_en1置有效;
如果读操作1的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器的读使能r_en1、r_en2、r_en3全部置有效;
如果读操作1的精度标志位为单精度,只保持AR的读使能r_en0有效。
所述的第二读控制模块进行以下判断:
如果读操作2的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器的读使能r_en1置有效;
如果读操作2的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器的读使能r_en1、r_en2、r_en3全部置有效;
如果读操作2的精度标志位为单精度,只保持AR的读使能r_en0有效。
所述的寄存器阵列对m个32位寄存器实行线性编址,构成一维寄存器阵列,地址范围0~m-1。
所述的读数据互连网络输出的128位的数据是由从低到高的a、b、c、d四组32位数据组成,a组的读使能对应读控制模块产生的r_en0,b组的读使能对应读控制模块产生的r_en1,c组的读使能对应读控制模块产生的r_en2,d组的读使能对应读控制模块产生的r_en3,若a、b、c、d中任一组的读使能有效,则该组数据为对应寄存器的数据输出,否则该组对应的数据为32位的0。
与现有技术相比,本发明具有以下有益的技术效果:
本发明提供的一种面向RISC处理器的三端口浮点寄存器文件,通过在寄存器文件的输入信号中,增加源操作数和目标操作数的精度标志位,寄存器阵列的控制逻辑根据精度标志位和读写标志位,对源操作数和目标操作数地址指定的寄存器及与它地址相邻的寄存器同时进行读写操作,可以单周期完成双精度、四精度浮点数的读取和回写,解决了浮点运算过程中面临的SRAM带宽问题。
本发明提供的一种面向RISC处理器的三端口浮点寄存器文件,使用寄存器阵列代替单元库中的SRAM作为三端口寄存器文件的存储单元,可以由设计者在不依赖单元库的基础上,根据处理器架构的要求,控制寄存器阵列的大小,避免了SRAM硬件资源的浪费,降低了功耗。
本发明提供的一种面向RISC处理器的三端口浮点寄存器文件,不需要改变处理器任何控制逻辑,不需要提供额外的读写控制信号,仅需处理器给出寄存器文件读写操作时的精度标志位,控制较为简单。
本发明提供的一种面向RISC处理器的三端口浮点寄存器文件,可以在单周期内完成双、四精度浮点数据的读取和回写,效率较高,提高了处理器性能。
附图说明
图1为现有的半定制三端口寄存器文件的结构图;
图2为基于本发明的寄存器阵列框图,其中图(a)为寄存器阵列中的任意一个n位寄存器示意图,图(b)为一维线性编址的寄存器阵列框图;
图3为基于本发明的三端口寄存器文件的电路结构图;
图4为读过程中的数据处理示意图。
具体实施方式
下面结合附图对本发明专利做进一步详细描述,所述是对本发明的解释而不是限定。
如图2、图3所示,一种面向RISC处理器的三端口浮点寄存器文件,包括写地址译码模块、写控制模块、写数据互连网络、寄存器阵列、第一读地址译码模块、第二读地址译码模块、第一读控制模块、第二读控制模块、读数据互连网络;
所述写地址译码模块,输入为寄存器文件写使能和写地址,当写使能有效时(高电平),置与写地址对应的寄存器AR的写使能w_en有效,并将其输出至写控制模块和写数据互连网络。
所述写控制模块,输出为m位写使能,分别连接至寄存器阵列中m个寄存器的写使能端。该模块根据写使能w_en和端口的输入写操作精度标志位,决定AR下面相邻的寄存器的写使能是否有效;如果写操作的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器(AR的地址加1)的写使能w_en置有效(高电平);如果写操作的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器(AR的地址加1,加2,加3对应的三个寄存器)的写使能w_en全部置有效(高电平),其余情况(单精度)只保持AR的写使能w_en有效。
所述写数据互连网络,输出为m个32位的数据,分别连接至寄存器阵列中m个寄存器的数据输入端。该模块在AR的写使能控制下,将寄存器文件的128写位数据从低位到高位,以32位一组,分为a、b、c、d四组,将a组连接到寄存器AR的数据输入端datai;将b、c、d三组分别依次连接至AR下面相邻的三个寄存器的数据输入端datai。
所述的寄存器阵列,如图2所示,线性编址的一维寄存器阵列,大小为m×32,阵列的宽(32)等于浮点寄存器的位宽,阵列的深度m等于浮点寄存器的个数,阵列中每一个寄存器有写使能,当某个寄存器写使能有效时,那么数据在时钟上升沿写入该寄存器,阵列中寄存器的输出恒有效。其每个寄存器的写使能和数据输入端分别来自写控制模块和数据互连网络,寄存器阵列有m个32位输出,全部连接至读数据互连网络。
所述的第一读地址译码模块,输入为源操作数1的读使能1和读地址1,当读使能1有效时(高电平),置与读地址对应的寄存器AR的读使能r_en0有效,并将其输出至第一读控制模块。
所述的第一读控制模块,输出为4位读使能r_en0、r_en1、r_en2、r_en3,全部连接至读数据互连网络。该模块根据输入读操作1精度标志位和读使能1,决定AR下面相邻的寄存器的读使能是否有效;如果读操作1的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器(AR的地址加1)的读使能r_en1置有效(高电平);如果读操作的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器(AR的地址加1,加2,加3对应的三个寄存器)的读使能r_en1、r_en2、r_en3全部置有效(高电平),其余只保持AR的读使能r_en0有效。
所述的第二读地址译码模块,输入为源操作数2的读使能2和读地址2,当读使能2有效时(高电平),置与读地址对应的寄存器AR的读使能r_en0有效,并将其输出至写读控制模块2。
所述的第二读控制模块,输出为4位读使能r_en0、r_en1、r_en2、r_en3,全部连接至读数据互连网络。该模块根据输入读操作2精度标志位和读使能2,决定AR下面相邻的寄存器的读使能是否有效;如果读操作2的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器(AR的地址加1)的读使能r_en1置有效(高电平);如果读操作的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器(AR的地址加1,加2,加3对应的三个寄存器)的读使能r_en1、r_en2、r_en3全部置有效(高电平),其余只保持AR的读使能r_en0有效。
所述读数据互连网络,输入为寄存器阵列的m个32位的输出、第二读控制模块的四位读使能,根据上述输入信号生成1个128位的数据进行输出;
输入为寄存器阵列的m个32位的输出,第一读控制模块的四位读使能,根据上述输入信号,生成1个128位的数据进行输出。
如图4所示,所述的读数据互连网络输出的128位的数据是由从低到高的a、b、c、d四组32位数据组成,a组的读使能对应读控制模块产生的r_en0,b组的读使能对应读控制模块产生的r_en1,c组的读使能对应读控制模块产生的r_en2,d组的读使能对应读控制模块产生的r_en3,若a、b、c、d中任一组的读使能有效,则该组数据为对应寄存器的数据输出,否则该组对应的数据为32位的0。
基于本发明实现的三端口浮点寄存器文件已经应用在一款SPARCV8架构的处理器中。相对于基本单元库的半定制设计方法,本发明使设计者根据处理器架构的要求,自主控制寄存器阵列的大小,避免了单元库中SRAM硬件资源的浪费;本发明不需要改变处理器任何控制逻辑,仅需处理器给出寄存器文件读写操作时的精度标志位,控制较为简单;本发明三端口浮点寄存器文件,可以使处理器在单周期内完成双、四精度浮点数据的读取和回写,效率较高,提高了处理器性能。

Claims (6)

1.一种面向RISC处理器的三端口浮点寄存器文件,其特征在于,包括:
写地址译码模块,输入为寄存器文件写使能和写地址,当写使能有效时,置与写地址对应的寄存器AR的写使能w_en有效,并将其分别输出至写控制模块和写数据互连网络;
写控制模块,根据输入的写使能w_en和端口的输入写操作精度标志位,决定寄存器AR下面相邻的寄存器的写使能是否有效;输出m位写使能至寄存器阵列中m个寄存器的写使能端;
写数据互连网络,在写使能w_en控制下,将输入的寄存器文件128位写数据从低位到高位,以32位一组分为a、b、c、d四组;输出为m个32位的数据,分别连接至寄存器阵列中m个寄存器的数据输入端:将a组连接到寄存器AR的数据输入端datai;将b、c、d三组分别依次连接至AR下面相邻的三个寄存器的数据输入端datai,除a、b、c、d四组之外其余m-4组均为0;
寄存器阵列,为线性编址的一维寄存器阵列,大小为m×32,阵列的宽等于浮点寄存器的位宽,阵列的深度m等于浮点寄存器的个数,阵列中每一个寄存器有写使能,其每个寄存器的写使能和数据输入端分别来自写控制模块和写数据互连网络,寄存器阵列有m个32位输出,全部连接至读数据互连网络;当某个寄存器写使能有效时,其输入的数据在时钟上升沿写入该寄存器,阵列中寄存器的输出恒有效;
第一读地址译码模块,输入为源操作数1的读使能1和读地址1,当读使能1有效时,置与读地址1对应的寄存器AR的读使能r_en0有效,并将其输出至第一读控制模块;
第一读控制模块,输出为4位读使能r_en0、r_en1、r_en2、r_en3,全部连接至读数据互连网络;该模块根据输入读操作1精度标志位和读使能1,决定AR下面相邻的寄存器的读使能是否有效;
第二读地址译码模块,输入为源操作数2的读使能2和读地址2,当读使能2有效时,置与读地址2对应的寄存器AR的读使能r_en0有效,并将其输出至第二读控制模块;
第二读控制模块,输出为4位读使能r_en0、r_en1、r_en2、r_en3,全部连接至读数据互连网络;该模块根据输入读操作2精度标志位和读使能2,决定AR下面相邻的寄存器的读使能是否有效;
读数据互连网络,根据寄存器阵列的m个32位的输出和第二读控制模块的四位读使能的信号,生成1个128位的数据进行输出;
根据寄存器阵列的m个32位的输出和第一读控制模块的四位读使能的信号,生成1个128位的数据进行输出。
2.如权利要求1所述的面向RISC处理器的三端口浮点寄存器文件,其特征在于,所述的写控制模块,根据写使能w_en和端口的输入写操作精度标志位进行如下判断:
如果写操作的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器的写使能w_en置有效;
如果写操作的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器的写使能w_en全部置有效,即高电平;
如果写操作的精度标志位为单精度,只保持AR的写使能w_en有效。
3.如权利要求1所述的面向RISC处理器的三端口浮点寄存器文件,其特征在于,所述的第一读控制模块进行以下判断:
如果读操作1的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器的读使能r_en1置有效;
如果读操作1的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器的读使能r_en1、r_en2、r_en3全部置有效;
如果读操作1的精度标志位为单精度,只保持AR的读使能r_en0有效。
4.如权利要求1所述的面向RISC处理器的三端口浮点寄存器文件,其特征在于,所述的第二读控制模块进行以下判断:
如果读操作2的精度标志位为双精度,则将寄存器阵列中AR的下一个寄存器的读使能r_en1置有效;
如果读操作2的精度标志位为四精度,则将寄存器阵列中AR的下三个寄存器的读使能r_en1、r_en2、r_en3全部置有效;
如果读操作2的精度标志位为单精度,只保持AR的读使能r_en0有效。
5.如权利要求1所述的面向RISC处理器的三端口浮点寄存器文件,其特征在于,所述的寄存器阵列对m个32位寄存器实行线性编址,构成一维寄存器阵列,地址范围0~m-1。
6.如权利要求1所述的面向RISC处理器的三端口浮点寄存器文件,其特征在于,所述的读数据互连网络输出的128位的数据是由从低到高的a、b、c、d四组32位数据组成,a组的读使能对应读控制模块产生的r_en0,b组的读使能对应读控制模块产生的r_en1,c组的读使能对应读控制模块产生的r_en2,d组的读使能对应读控制模块产生的r_en3,若a、b、c、d中任一组的读使能有效,则该组数据为对应寄存器的数据输出,否则该组对应的数据为32位的0。
CN201410206420.5A 2014-05-15 2014-05-15 一种面向risc处理器的三端口浮点寄存器文件 Active CN103984524B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410206420.5A CN103984524B (zh) 2014-05-15 2014-05-15 一种面向risc处理器的三端口浮点寄存器文件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410206420.5A CN103984524B (zh) 2014-05-15 2014-05-15 一种面向risc处理器的三端口浮点寄存器文件

Publications (2)

Publication Number Publication Date
CN103984524A CN103984524A (zh) 2014-08-13
CN103984524B true CN103984524B (zh) 2016-07-06

Family

ID=51276518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410206420.5A Active CN103984524B (zh) 2014-05-15 2014-05-15 一种面向risc处理器的三端口浮点寄存器文件

Country Status (1)

Country Link
CN (1) CN103984524B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111683077B (zh) * 2020-06-02 2021-05-04 硅谷数模(苏州)半导体有限公司 虚拟现实设备及数据的处理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5771368A (en) * 1990-10-29 1998-06-23 Sun Microsystems, Inc. Memory addressing scheme for increasing the number of memory locations available in a computer for storing higher precision numbers
CN1334525A (zh) * 2000-06-30 2002-02-06 英特尔公司 用于校准的单指令多数据的通用寄存器文件结构
CN101539850A (zh) * 2008-03-21 2009-09-23 富士通株式会社 单精度浮点数据存储方法和处理器
CN101930356A (zh) * 2010-08-24 2010-12-29 中国航天科技集团公司第九研究院第七七一研究所 用于浮点协处理器的寄存器文件分组编址、读写控制方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6343356B1 (en) * 1998-10-09 2002-01-29 Bops, Inc. Methods and apparatus for dynamic instruction controlled reconfiguration register file with extended precision
JP3697711B2 (ja) * 2001-07-04 2005-09-21 日本電気株式会社 Ppp終端装置、ネットワーク装置及びlcpエコー要求応答方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5771368A (en) * 1990-10-29 1998-06-23 Sun Microsystems, Inc. Memory addressing scheme for increasing the number of memory locations available in a computer for storing higher precision numbers
CN1334525A (zh) * 2000-06-30 2002-02-06 英特尔公司 用于校准的单指令多数据的通用寄存器文件结构
CN101539850A (zh) * 2008-03-21 2009-09-23 富士通株式会社 单精度浮点数据存储方法和处理器
CN101930356A (zh) * 2010-08-24 2010-12-29 中国航天科技集团公司第九研究院第七七一研究所 用于浮点协处理器的寄存器文件分组编址、读写控制方法

Also Published As

Publication number Publication date
CN103984524A (zh) 2014-08-13

Similar Documents

Publication Publication Date Title
CN103020002B (zh) 可重构多处理器系统
CN105912501B (zh) 一种基于大规模粗粒度可重构处理器的sm4-128加密算法实现方法及系统
US9390212B2 (en) Methods and apparatus for synthesizing multi-port memory circuits
CN111433758A (zh) 可编程运算与控制芯片、设计方法及其装置
CN102541749B (zh) 多粒度并行存储系统
Sadredini et al. eAP: A scalable and efficient in-memory accelerator for automata processing
CN102610269A (zh) 一种多读单写片内存储器
CN109614145B (zh) 一种处理器核心结构及数据访存方法
CN103984524B (zh) 一种面向risc处理器的三端口浮点寄存器文件
CN103412848A (zh) 一种四核处理器系统共享单一程序存储器的方法
CN117271953A (zh) 一种用于优化快速傅里叶变换的存内计算加速电路及方法
Gan et al. Solving mesoscale atmospheric dynamics using a reconfigurable dataflow architecture
CN101930356B (zh) 用于浮点协处理器的寄存器文件分组编址、读写控制方法
CN106133838A (zh) 一种可扩展可配置的fpga存储结构和fpga器件
WO2016063667A1 (ja) 再構成可能デバイス
CN102289424B (zh) 一种动态可重构阵列处理器的构令流工作方法
US20070067380A2 (en) Floating Point Intensive Reconfigurable Computing System for Iterative Applications
CN102622318B (zh) 一种存储器控制电路及其控制的向量数据寻址方法
Öztekin et al. Using FPGA-based content-addressable memory for mnemonics instruction searching in assembler design
CN111625368A (zh) 一种分布式计算系统、方法及电子设备
CN112486904A (zh) 可重构处理单元阵列的寄存器堆设计方法及装置
CN105843589B (zh) 一种应用于vliw类型处理器的存储器装置
CN106709187B (zh) 基于模型建立cpu的方法及装置
Winkler et al. FPGA processing of decision tree ensembles stored in external DRAM
Patan et al. Design and implementation of optimized register file for streaming applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant