CN103984530A - 一种提高store指令执行效率的流水线结构及方法 - Google Patents

一种提高store指令执行效率的流水线结构及方法 Download PDF

Info

Publication number
CN103984530A
CN103984530A CN201410206731.1A CN201410206731A CN103984530A CN 103984530 A CN103984530 A CN 103984530A CN 201410206731 A CN201410206731 A CN 201410206731A CN 103984530 A CN103984530 A CN 103984530A
Authority
CN
China
Prior art keywords
module
write
register
address
decoding module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410206731.1A
Other languages
English (en)
Other versions
CN103984530B (zh
Inventor
陈庆宇
吴龙胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
771 Research Institute of 9th Academy of CASC
Original Assignee
771 Research Institute of 9th Academy of CASC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 771 Research Institute of 9th Academy of CASC filed Critical 771 Research Institute of 9th Academy of CASC
Priority to CN201410206731.1A priority Critical patent/CN103984530B/zh
Publication of CN103984530A publication Critical patent/CN103984530A/zh
Application granted granted Critical
Publication of CN103984530B publication Critical patent/CN103984530B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Advance Control (AREA)

Abstract

本发明公开了一种提高store指令执行效率的流水线结构及方法,该流水线结构由译码模块、执行模块、访存模块、提交模块及四端口寄存器文件组成,其中各模块通过流水级间寄存器依次相连接,所有的流水级间寄存器有统一的使能信号,使能信号控制流水线的阻塞和推进,其中译码模块可以在单周期内同时请求store指令执行所需的三个操作数,提高了store指令读取操作数的并行性,最终使双周期store指令作为单周期指令执行,将store指令的执行效率提高了一倍。该流水线结构控制简单可靠、适用于标量和超标量处理器的设计,可以显著提高处理器性能。

Description

一种提高store指令执行效率的流水线结构及方法
技术领域
本发明属于微处理器流水线结构技术领域,涉及一种提高store类指令执行效率的流水线结构及方法。
背景技术
store指令是指对数据执行写操作的一类指令。基于RISC架构的处理器仅能通过store指令将数据输出到存储器,即通过store指令将指令指定的数据写入到指令指定的存储器单元,其执行主要分为两个阶段:一、计算存储器单元地址;二、取出执行写操作的操作数,并将其写入到第一步计算得出的存储器单元中。ARM、PowerPC、SPARC等典型的RISC架构均支持store指令的寄存器寻址,即计算存储器地址的两个操作数和被写的操作数均保存在寄存器文件内。
据文献“UT699Micro-Processor Functional Manual”、“Rad-Hard32bitSPARC V8Processor:AT697E”及“龙芯2号处理器设计和性能分析”可知,在标量和超标量处理器中仅为访存操作(load/store)流水线分配两读一写三个寄存器文件端口,这种机制导致store类指令执行所需的三个操作数无法在一个时钟周期内完成,因此,store(写单字)指令都被作为双周期指令处理,即store指令的执行时间开销相当于两条单周期指令。具体如图1所示,流水级的上标表示第几条指令,下标表示该流水级的第几个周期,无下标的则代表单周期指令,图1的时空图给出了store单字指令在一个七级流水线处理器中的执行情况,一条双周期的store指令被当作两条单周期指令来处理,其中e级的00周期用于计算访存地址,01周期用于取出待存储的字。
上述文献中store类指令的多周期实现方式使store类指令的执行兼容其它的单周期指令,保证其它流水线结构的完整复用性;但其控制复杂,需要设计状态机严格控制其执行状态,并且会处理器的指令并行度,严重影响处理器性能。
发明内容
本发明解决的问题在于提供一种提高store指令执行效率的流水线结构及方法,通过对指令译码逻辑和寄存器文件的优化,提高store指令读取操作数的并行性,将store指令作为单周期指令执行,使其执行效率提高了一倍。
本发明是通过以下技术方案来实现:
一种提高store指令执行效率的流水线结构,包括通过流水级间寄存器依次相连接的译码模块、执行模块、访存模块和提交模块,提交模块、译码模块还分别与四端口寄存器文件相连接,提交模块向四端口寄存器文件写入操作数,译码模块向四端口寄存器文件同时请求store指令所需的三个操作数;
所述的译码模块与四端口寄存器文件之间设有三套请求/返回操作数的数据线,每套请求/返回操作数的数据线进行一个操作数的传输;译码模块中还设有三套相同的相关判断逻辑,分别对三个操作数进行相关性判断;
所述的四端口寄存器文件包括一个与提交模块相连接的写端口和与译码模块相连接的三个读端口,写端口中的写地址、写使能分别与写地址译码模块相连接,写端口中的写数据与寄存器阵列相连接;寄存器阵列与数据选择模块相连接,数据选择模块还通过读地址译码模块分别与三个读端口相连接,数据选择模块根据读端口发出的读控制信号读取寄存器阵列中的操作数。
所有的流水级间寄存器设有统一的使能信号,使能信号控制流水线的阻塞和推进;store类指令在进入该流水线结构后经过四级执行完毕。
所述的译码模块分别接收来自提交模块、访存模块和执行模块的执行信息,执行信息包括各模块中的指令执行状态及执行结果;译码模块收到执行信息后利用相关判断逻辑进行计算地址所需的两个操作数与待写操作数是否相关的判断;若相关则通过旁路进行执行结果的传输,若不相关则同时向四端口寄存器文件请求数据,四端口寄存器文件将所请求的操作数通过寄存器文件读数据总线单向传递给译码模块。
所述的四端口寄存器文件中,当提交模块发出的写控制信号中的写使能有效时,写地址译码模块产生与写地址对应的寄存器的写使能,写地址译码模块将产生的写实能连接至寄存器阵列中对应的寄存器,进行写操作,将写控制信号中的32位写数据写入寄存器阵列;
当译码模块发出的读控制信号的读使能有效时,读地址译码模块产生与读地址对应的寄存器的读使能,连接至数据选择模块,数据选择模块选择对应的数据驱动32位读数据总线,将操作数发送给译码模块。
一种提高store指令执行效率的流水线控制方法,包括以下操作:
Step1:将来自指令分发单元或取指模块的指令送入译码模块进行译码;
Step2:译码模块对指令类型进行甄别,如果当前指令为store类指令,译码模块根据其接收来自提交模块、访存模块和执行模块的执行信息,利用相关判断逻辑进行计算地址所需的两个操作数与待写操作数是否相关的判断;
若相关则通过旁路进行执行结果的传输,若不相关则根据store类指令的编码格式,同时向四端口寄存器文件请求三个操作数,其中两个操作数用于计算写地址,一个操作数为待写的数据;四端口寄存器文件则将提交模块写入的与store类指令相对应的操作数通过寄存器文件读数据总线返回给译码模块,译码模块将获取的操作数通过流水级间寄存器传递给执行模块;
如果当前指令为非store类指令,则保持原有译码逻辑不变;
Step3:执行模块根据用于计算写地址的操作数计算访存操作的地址,并将访存操作的地址和待写的数据继续通过流水级间寄存器向访存模块传递;
Step4:访存模块首先检查访存操作的地址是否对齐,如果地址对齐,则发起写存储器的操作;如果地址不对齐则放弃访存,置异常标志位有效并通过流水级间寄存器向提交模块传递;
Step5:提交模块检查异常标志位,若收到异常标志位有效,则进行异常处理;或者提交模块将异常信息提交到重排序单元进行相关的异常处理;否则不进行任何操作。
所述若store指令所需要的三个操作数的读地址与所接收的执行信息所包含的写地址一致时,则为相关,通过旁路将所标注的执行结果分别传递给信号rs1、rs2和rd;否则为不相关,则通过寄存器文件读控制信号向四端口寄存器文件请求数据,四端口寄存器文件的输出通过寄存器文件读数据总线单向传递给译码模块。
所述当提交模块发出的写控制信号中的写使能有效时,写地址译码模块产生与写地址对应的寄存器的写使能,写地址译码模块将产生的写实能连接至寄存器阵列中对应的寄存器,进行写操作,将写控制信号中的32位写数据写入寄存器阵列;
当读控制信号的读使能有效时,读地址译码模块产生与读地址对应的寄存器的读使能,连接至数据选择模块,数据选择模块选择对应的数据驱动32位读数据总线,将操作数发送给译码模块。
与现有技术相比,本发明具有以下有益的技术效果:
(1)本发明提出的一种提高store指令执行效率的流水线结构,可单周期完成公知的双周期store指令,提高了处理器的性能;适用于标量和超标量的store指令的执行优化。
(2)本发明提出的流水线结构适用于单发射和超标量处理器的访存流水线设计,为自主可控高性能处理器的开发提供了一种设计参考;
(3)本发明采用寄存器阵列构建三读一写的四端口寄存器文件,方法简单,易于实现,并且支持EDA工具自动插入门控时钟,可降低功耗;
(4)译码模块中额外使用的相关判断电路,可以复用原有的相关判断电路,无设计风险,即通过极小的代价即可换取处理器性能的提升。
本发明提出的store流水线结构,保持load指令原有的执行逻辑不变,优化了store指令的执行过程。在请求操作数的过程中,必须先对三个操作数分别进行相关判断,之后决定是否向寄存器堆请求数据;三读一写四端口的寄存器文件通过寄存器阵列进行构建,基于寄存器阵列的寄存器文件设计过程中,端口的增加不会带来设计难度的提升。
本发明保持load指令原有的执行逻辑不变,通过同时请求store指令所需的三个操作数,将双周期的store指令转变为单周期指令,该方法可适用于优化store类指令的执行,store类指令指对数据执行写操作的指令,具体如store单字、store半字、store字节、store多字及原子交换指令等。
附图说明
图1为现有的store双周期指令时空图;
图2为本发明的访存流水线结构;
图3为寄存器文件存储阵列的组成和基本单元示意图;
图4为四端口寄存器文件的逻辑原理图。
具体实施方式
下面结合附图对本发明专利做进一步详细描述,所述是对本发明的解释而不是限定。
在SPARC V8兼容型处理器中采用了本发明提出的提高store指令执行效率的流水线结构,其访存流水线结构如图2所示,该流水结构由译码模块、执行模块、访存模块、提交模块及四端口寄存器文件组成,其中各模块通过流水级间寄存器依次相连接,所有的流水级间寄存器有统一的使能信号hold,使能信号hold决定流水线的阻塞和推进;重排序单元不属于本流水结构,为了结构的完整性,图中以虚线给出。
所述的译码模块用以同时请求store指令所需的三个操作数,其接收来自提交模块、访存模块和执行模块的执行信息,执行信息包括各模块中的指令执行状态及执行结果;译码模块收到执行信息后利用相关判断逻辑进行计算地址所需的两个用于计算地址的操作数与待写操作数是否相关的判断:
store指令所需要的三个操作数(两个用于计算地址的操作数与待写操作数)的读地址与执行信息112、111、110所包含的写地址一致时,则为相关;否则为不相关
具体的,当输入的指令为store类型时,根据执行模块、访存模块、提交模块输入的执行信息112、111、110和store指令对应计算地址所需的两个操作数(分别包含于信号rs1、rs2中)和一个待写操作数(包含于信号rd中)进行相关判断,若相关,则通过旁路将110、111、和112所标注的执行结果分别传递给信号rs1、rs2和rd;如若不相关,则通过寄存器文件读控制信号104、105和106向四端口寄存器文件请求数据,四端口寄存器文件的输出通过寄存器文件读数据总线107、108和109单向传递给译码模块。
译码功能完成后,将rs1、rs2、rd和其它控制信息oth向流水级间寄存器传递。
110、111、和112分别来自提交模块、访存模块和执行模块,包括各模块的指令执行状态及执行结果,用于译码模块的相关判断。读控制信号104、105和106分别为rs1、rs2和rd对应的寄存器文件的读使能和读地址,其读出的数据分别由数据总线107、108和109返回。
所述的执行模块,对来自译码模块的rs1和rs2执行加法运算,得到写操作的地址addr,同时将addr、rd和其它控制信息oth向流水级间寄存器传递。
所述的访存模块,检查addr是否符合对齐模式,如果地址对齐,则将rd写入到addr指定的存储单元中;否则,放弃访存,置异常标志位有效并向流水级间寄存器传递。
所述的提交模块,检查异常标志位,如果异常标志位有效,则进行异常处理,保存必要的处理器信息、指令PC等,否则不进行任何操作。
所述的四端口寄存器文件,包括三个读端口和一个写端口,其存储阵列由寄存器构成,阵列中的寄存器有各自的写使能,当某寄存器写使能有效时,数据在时钟上升沿写入该寄存器,阵列中寄存器的输出恒有效,阵列中的寄存器实行0~167的线性编址,寄存器阵列及组成单元如图3所示。
寄存器文件的逻辑原理如图4所示,包括写地址译码模块、读地址译码模块、数据选择模块和寄存器阵列组成。
当提交模块发出的写控制信号103中的写使能有效时,写地址译码模块产生与写地址对应的寄存器的写使能,写地址译码模块将产生的写使能连接至寄存器阵列中对应的寄存器,进行写操作(将写控制信号103中的32位写数据datai写入寄存器阵列,写数据datai是由前级流水发送给提交模块的);
当读控制信号104、105和106的读使能有效时,读地址译码模块产生与读地址对应的寄存器的读使能,连接至数据选择模块,数据选择模块选择对应的数据驱动32位读数据总线107、108和109,将操作数发送给译码模块。
一种提高store指令执行效率的流水线控制方法,包括以下操作:
Step1:将来自指令分发单元或取指模块的指令送入译码模块进行译码;
Step2:译码模块对指令类型进行甄别,如果当前指令为store类指令,译码模块根据其接收来自提交模块、访存模块和执行模块的执行信息,利用相关判断逻辑进行计算地址所需的两个操作数与待写操作数是否相关的判断;
若相关则通过旁路进行执行结果的传输,若不相关则根据store类指令的编码格式,同时向四端口寄存器文件请求三个操作数,其中两个操作数用于计算写地址,一个操作数为待写的数据;四端口寄存器文件则将提交模块写入的与store类指令相对应的操作数通过寄存器文件读数据总线返回给译码模块,译码模块将获取的操作数通过流水级间寄存器传递给执行模块;
如果当前指令为非store类指令,则保持原有译码逻辑不变;
Step3:执行模块根据用于计算写地址的操作数计算访存操作的地址,并将访存操作的地址和待写的数据继续通过流水级间寄存器向访存模块传递;
Step4:访存模块首先检查访存操作的地址是否对齐,如果地址对齐,则发起写存储器的操作;如果地址不对齐则放弃访存,置异常标志位有效并通过流水级间寄存器向提交模块传递;
Step5:提交模块检查异常标志位,若收到异常标志位有效,则进行异常处理;或者提交模块将异常信息提交到重排序单元进行相关的异常处理;否则不进行任何操作。
所述若store指令所需要的三个操作数的读地址与所接收的执行信息所包含的写地址一致时,则为相关,通过旁路将所标注的执行结果分别传递给信号rs1、rs2和rd;否则为不相关,则通过寄存器文件读控制信号向四端口寄存器文件请求数据,四端口寄存器文件的输出通过寄存器文件读数据总线单向传递给译码模块。
本发明提出的一种提高store指令执行效率的流水线结构,可单周期完成公知的双周期store指令,提高了处理器的性能;适用于标量和超标量的store指令的执行优化。

Claims (7)

1.一种提高store指令执行效率的流水线结构,其特征在于,包括通过流水级间寄存器依次相连接的译码模块、执行模块、访存模块和提交模块,提交模块、译码模块还分别与四端口寄存器文件相连接,提交模块向四端口寄存器文件写入操作数,译码模块向四端口寄存器文件同时请求store指令所需的三个操作数;
所述的译码模块与四端口寄存器文件之间设有三套请求/返回操作数的数据线,每套请求/返回操作数的数据线进行一个操作数的传输;译码模块中还设有三套相同的相关判断逻辑,分别对三个操作数进行相关性判断;
所述的四端口寄存器文件包括一个与提交模块相连接的写端口和与译码模块相连接的三个读端口,写端口中的写地址、写使能分别与写地址译码模块相连接,写端口中的写数据与寄存器阵列相连接;寄存器阵列与数据选择模块相连接,数据选择模块还通过读地址译码模块分别与三个读端口相连接,数据选择模块根据读端口发出的读控制信号读取寄存器阵列中的操作数。
2.如权利要求1所述的提高store指令执行效率的流水线结构,其特征在于,所有的流水级间寄存器设有统一的使能信号,使能信号控制流水线的阻塞和推进;store类指令在进入该流水线结构后经过四级执行完毕。
3.如权利要求1所述的提高store指令执行效率的流水线结构,其特征在于,所述的译码模块分别接收来自提交模块、访存模块和执行模块的执行信息,执行信息包括各模块中的指令执行状态及执行结果;译码模块收到执行信息后利用相关判断逻辑进行计算地址所需的两个操作数与待写操作数是否相关的判断;若相关则通过旁路进行执行结果的传输,若不相关则同时向四端口寄存器文件请求所需的三个操作数,四端口寄存器文件将所请求的操作数通过寄存器文件读数据总线单向传递给译码模块。
4.如权利要求1所述的提高store指令执行效率的流水线结构,其特征在于,所述的四端口寄存器文件中,当提交模块发出的写控制信号中的写使能有效时,写地址译码模块产生与写地址对应的寄存器的写使能,写地址译码模块将产生的写实能连接至寄存器阵列中对应的寄存器,进行写操作,将写控制信号中的32位写数据写入寄存器阵列;
当译码模块发出的读控制信号的读使能有效时,读地址译码模块产生与读地址对应的寄存器的读使能,连接至数据选择模块,数据选择模块选择对应的数据驱动32位读数据总线,将操作数发送给译码模块。
5.一种提高store指令执行效率的流水线控制方法,其特征在于,包括以下操作:
Step1:将来自指令分发单元或取指模块的指令送入译码模块进行译码;
Step2:译码模块对指令类型进行甄别,如果当前指令为store类指令,译码模块根据其接收来自提交模块、访存模块和执行模块的执行信息,利用相关判断逻辑进行计算地址所需的两个操作数与待写操作数是否相关的判断;
若相关则通过旁路进行执行结果的传输,若不相关则根据store类指令的编码格式,同时向四端口寄存器文件请求三个操作数,其中两个操作数用于计算写地址,一个操作数为待写的数据;四端口寄存器文件则将提交模块写入的与store类指令相对应的操作数通过寄存器文件读数据总线返回给译码模块,译码模块将获取的操作数通过流水级间寄存器传递给执行模块;
如果当前指令为非store类指令,则保持原有译码逻辑不变;
Step3:执行模块根据用于计算写地址的操作数计算访存操作的地址,并将访存操作的地址和待写的数据继续通过流水级间寄存器向访存模块传递;
Step4:访存模块首先检查访存操作的地址是否对齐,如果地址对齐,则发起写存储器的操作;如果地址不对齐则放弃访存,置异常标志位有效并通过流水级间寄存器向提交模块传递;
Step5:提交模块检查异常标志位,若收到异常标志位有效,则进行异常处理;或者提交模块将异常信息提交到重排序单元进行相关的异常处理;否则不进行任何操作。
6.如权利要求5所述的提高store指令执行效率的流水线控制方法,其特征在于,若store指令所需要的三个操作数的读地址与所接收的执行信息所包含的写地址一致时,则为相关,通过旁路将所标注的执行结果分别传递给信号rs1、rs2和rd;否则为不相关,通过寄存器文件读控制信号向四端口寄存器文件请求操作数,四端口寄存器文件的输出通过寄存器文件读数据总线单向传递给译码模块。
7.如权利要求5所述的提高store指令执行效率的流水线控制方法,其特征在于,当提交模块发出的写控制信号中的写使能有效时,写地址译码模块产生与写地址对应的寄存器的写使能,写地址译码模块将产生的写实能连接至寄存器阵列中对应的寄存器,进行写操作,将写控制信号中的32位写数据写入寄存器阵列;
当读控制信号的读使能有效时,读地址译码模块产生与读地址对应的寄存器的读使能,连接至数据选择模块,数据选择模块选择对应的数据驱动32位读数据总线,将操作数发送给译码模块。
CN201410206731.1A 2014-05-15 2014-05-15 一种提高store指令执行效率的流水线结构及方法 Active CN103984530B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410206731.1A CN103984530B (zh) 2014-05-15 2014-05-15 一种提高store指令执行效率的流水线结构及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410206731.1A CN103984530B (zh) 2014-05-15 2014-05-15 一种提高store指令执行效率的流水线结构及方法

Publications (2)

Publication Number Publication Date
CN103984530A true CN103984530A (zh) 2014-08-13
CN103984530B CN103984530B (zh) 2016-08-17

Family

ID=51276524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410206731.1A Active CN103984530B (zh) 2014-05-15 2014-05-15 一种提高store指令执行效率的流水线结构及方法

Country Status (1)

Country Link
CN (1) CN103984530B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156195A (zh) * 2014-08-19 2014-11-19 中国航天科技集团公司第九研究院第七七一研究所 扩展双精度的80位浮点处理单元在处理器中的集成系统及方法
CN105426160A (zh) * 2015-11-10 2016-03-23 北京时代民芯科技有限公司 基于sprac v8指令集的指令分类多发射方法
CN108287730A (zh) * 2018-03-14 2018-07-17 武汉市聚芯微电子有限责任公司 一种处理器流水线结构
CN110825435A (zh) * 2018-08-10 2020-02-21 北京百度网讯科技有限公司 用于处理数据的方法和装置
WO2020233387A1 (zh) * 2019-05-17 2020-11-26 上海寒武纪信息科技有限公司 指令处理方法、装置及相关产品
CN112596791A (zh) * 2020-12-11 2021-04-02 中国科学院计算技术研究所 一种异构流水线的通用处理器及其执行方法
CN112905995A (zh) * 2021-02-05 2021-06-04 电子科技大学 一种处理器内部寄存器组异常行为实时检测方法及系统
CN113946368A (zh) * 2021-10-29 2022-01-18 西安微电子技术研究所 一种基于risc-v指令集的三级流水线架构、处理器及数据处理方法
CN116450570A (zh) * 2023-06-19 2023-07-18 先进能源科学与技术广东省实验室 基于fpga的32位risc-v处理器及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5459845A (en) * 1990-12-20 1995-10-17 Intel Corporation Instruction pipeline sequencer in which state information of an instruction travels through pipe stages until the instruction execution is completed
CN1224871A (zh) * 1998-01-30 1999-08-04 国际商业机器公司 在一个处理系统中处理多条存储指令完成的方法和系统
CN102707988A (zh) * 2011-04-07 2012-10-03 威盛电子股份有限公司 执行模式备份寄存器的模拟
US20130305118A1 (en) * 2005-12-23 2013-11-14 Steven R. King Performing a cyclic redundancy checksum operation responsive to a user-level instruction

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5459845A (en) * 1990-12-20 1995-10-17 Intel Corporation Instruction pipeline sequencer in which state information of an instruction travels through pipe stages until the instruction execution is completed
CN1224871A (zh) * 1998-01-30 1999-08-04 国际商业机器公司 在一个处理系统中处理多条存储指令完成的方法和系统
US20130305118A1 (en) * 2005-12-23 2013-11-14 Steven R. King Performing a cyclic redundancy checksum operation responsive to a user-level instruction
CN102707988A (zh) * 2011-04-07 2012-10-03 威盛电子股份有限公司 执行模式备份寄存器的模拟

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冉计全等: "RISC微处理器中存取部件设计的一种优化方法", 《计算机工程与应用》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156195B (zh) * 2014-08-19 2016-08-24 中国航天科技集团公司第九研究院第七七一研究所 扩展双精度的80位浮点处理单元在处理器中的集成系统及方法
CN104156195A (zh) * 2014-08-19 2014-11-19 中国航天科技集团公司第九研究院第七七一研究所 扩展双精度的80位浮点处理单元在处理器中的集成系统及方法
CN105426160A (zh) * 2015-11-10 2016-03-23 北京时代民芯科技有限公司 基于sprac v8指令集的指令分类多发射方法
CN105426160B (zh) * 2015-11-10 2018-02-23 北京时代民芯科技有限公司 基于sprac v8指令集的指令分类多发射方法
CN108287730A (zh) * 2018-03-14 2018-07-17 武汉市聚芯微电子有限责任公司 一种处理器流水线结构
CN108287730B (zh) * 2018-03-14 2023-12-29 武汉市聚芯微电子有限责任公司 一种处理器流水线装置
CN110825435B (zh) * 2018-08-10 2023-01-24 昆仑芯(北京)科技有限公司 用于处理数据的方法和装置
CN110825435A (zh) * 2018-08-10 2020-02-21 北京百度网讯科技有限公司 用于处理数据的方法和装置
WO2020233387A1 (zh) * 2019-05-17 2020-11-26 上海寒武纪信息科技有限公司 指令处理方法、装置及相关产品
CN112596791A (zh) * 2020-12-11 2021-04-02 中国科学院计算技术研究所 一种异构流水线的通用处理器及其执行方法
CN112905995A (zh) * 2021-02-05 2021-06-04 电子科技大学 一种处理器内部寄存器组异常行为实时检测方法及系统
CN112905995B (zh) * 2021-02-05 2022-08-05 电子科技大学 一种处理器内部寄存器组异常行为实时检测方法及系统
CN113946368A (zh) * 2021-10-29 2022-01-18 西安微电子技术研究所 一种基于risc-v指令集的三级流水线架构、处理器及数据处理方法
CN113946368B (zh) * 2021-10-29 2024-04-30 西安微电子技术研究所 一种基于risc-v指令集的三级流水线架构、处理器及数据处理方法
CN116450570A (zh) * 2023-06-19 2023-07-18 先进能源科学与技术广东省实验室 基于fpga的32位risc-v处理器及电子设备
CN116450570B (zh) * 2023-06-19 2023-10-17 先进能源科学与技术广东省实验室 基于fpga的32位risc-v处理器及电子设备

Also Published As

Publication number Publication date
CN103984530B (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
CN103984530A (zh) 一种提高store指令执行效率的流水线结构及方法
US10417175B2 (en) Apparatus, methods, and systems for memory consistency in a configurable spatial accelerator
US10445250B2 (en) Apparatus, methods, and systems with a configurable spatial accelerator
US10445234B2 (en) Processors, methods, and systems for a configurable spatial accelerator with transactional and replay features
Fang et al. swdnn: A library for accelerating deep learning applications on sunway taihulight
US20190004955A1 (en) Processors, methods, and systems for a configurable spatial accelerator with memory system performance, power reduction, and atomics support features
CN102750133B (zh) 支持simd的32位三发射的数字信号处理器
JP7481069B2 (ja) 連鎖タイル演算を実施するためのシステムおよび方法
CN106575218A (zh) 持久性存储屏障处理器、方法、系统和指令
CN109144573A (zh) 基于risc-v指令集的二级流水线架构
CN107077334A (zh) 从多维阵列预取多维元素块的硬件装置和方法
CN107250993A (zh) 向量缓存行写回处理器、方法、系统和指令
CN109313556A (zh) 可中断和可重启矩阵乘法指令、处理器、方法和系统
CN100361072C (zh) 流水线处理一系列处理指令的方法和设备
KR102556033B1 (ko) 패킹된 데이터 정렬 플러스 계산 명령어, 프로세서, 방법, 및 시스템
CN104050026A (zh) 使对共享存储器存取的同步松弛的处理器、方法及系统
CN102184092A (zh) 基于流水线结构的专用指令集处理器
CN110119362A (zh) 存储器写日志存储处理器、方法、系统和指令
EP3757814A1 (en) Apparatuses, methods, and systems for time-multiplexing in a configurable spatial accelerator
CN104049937A (zh) 裸露向量管线之间的链接
CN105247479A (zh) 指令次序实施指令对、处理器、方法和系统
CN104008021A (zh) 针对多数据体系结构的精确的异常信号发送
CN101211256A (zh) 一种专用双流水线risc指令系统及其操作方法
CN101739383B (zh) 一种可配置处理器体系结构和控制方法
CN104991844B (zh) 一种基于半定制寄存器文件的处理器及其容错方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant