CN107506329A - 一种自动支持循环迭代流水线的粗粒度可重构阵列及其配置方法 - Google Patents
一种自动支持循环迭代流水线的粗粒度可重构阵列及其配置方法 Download PDFInfo
- Publication number
- CN107506329A CN107506329A CN201710712367.XA CN201710712367A CN107506329A CN 107506329 A CN107506329 A CN 107506329A CN 201710712367 A CN201710712367 A CN 201710712367A CN 107506329 A CN107506329 A CN 107506329A
- Authority
- CN
- China
- Prior art keywords
- streamline
- configuration
- arrays
- iteration
- array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 14
- 238000003491 array Methods 0.000 claims abstract description 89
- 230000006870 function Effects 0.000 claims description 15
- 239000000203 mixture Substances 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 claims description 5
- 238000006073 displacement reaction Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 2
- 241000544061 Cuculus canorus Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7867—Architectures of general purpose stored program computers comprising a single central processing unit with reconfigurable architecture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3824—Operand accessing
- G06F9/3826—Bypassing or forwarding of data results, e.g. locally between pipeline stages or within a pipeline stage
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Abstract
本发明公开了一种自动支持循环迭代流水线的粗粒度可重构阵列及其配置方法,该系统包括流水线配置控制器、粗粒度算子mesh阵列、多级缓存系统,流水线配置控制器在配置码的控制下,用于完成流水线重构和运行时的迭代控制;mesh阵列在配置码的控制下,按照数据流图的定义,完成流水线中各环节的计算和数据交换;流水线存储器在配置码的控制下,按照数据流图的定义对流水线中变量进行读写控制,并完成数据迭代的控制。本发明所述支持自动循环迭代流水线的粗粒度可重构阵列及其配置方法,具有支持流水线类型多,流水线中的迭代环节采用硬件直接控制,与软件流水线相比具有配置时间短和能量开销低的优势,提高粗粒度可重构阵列执行流水线的速度和能量效率。
Description
技术领域
本发明涉及嵌入式可重构系统领域,具体地,涉及一种自动支持循环迭代流水线的粗粒度可重构阵列及其配置方法。
背景技术
由于包括特殊的可重构处理单元,可重构阵列在取得性能和功耗的优势条件下还能够保持应用的灵活性,因此是专用领域计算中的理想模式。可重构阵列在重构方面有两个特征:第一,从重构发生时间上划分,可重构阵列属于动态重构类型;第二,可重构阵列与系统中的处理器为松耦合关系,重构由其自身控制,不由外部处理器进行操作。
粗粒度可重构阵列包括可重构控制器和可重构数据通路。在不增加阵列规模的条件下,提高可重构阵列处理速度的方法主要有以下几点:第一,提高数据通路中计算的并行性,采用操作级并行和数据级并行进行数据计算处理。第二,提高流水线的硬件利用率,减少数据读写延迟造成的流水线尤其是迭代型流水线中的空转。第三,减少可重构阵列的重构时间开销。
针对以上的性能需求目前主要的技术手段包括:第一,提高可重构阵列的重构速度,可通过提高配置码的信息密度和提高重构码配置带宽实现。第二,提高存储器的数据带宽,通过提高存储器的工作频率和增加存储器数据位宽,使得存储器与数据通路同频,存储器数据宽度等于数据通路一次处理的最大位宽。第三,采用软件流水的方式进行加速可重构阵列运算。但是可重构阵列的配置带宽和数据带宽受到工艺的限制,配置码密度受到算子规格的限制,而采用软件流水的方式不能完全发挥可重构阵列数据通路的并行处理能力。
综上所述,在实现本发明的过程中,申请人发现现有可重构阵列不能高效处理循环迭代流水线计算,从而限制了可重构阵列性能提升。
发明内容
本发明的目的在于,针对上述现有技术存在的问题和不足,提出一种支持自动循环迭代流水线的粗粒度可重构阵列,能够有效提高可重构数据中数据处理并行度并提高流水线执行效率。
为实现上述目的,本发明采用的技术方案是:一种支持自动循环迭代流水线的粗粒度可重构阵列,包括流水线配置控制器:用于完成粗粒度可重构阵列中流水线的控制和配置,可以为粗粒度mesh阵列提供高速的配置带宽资源,支持可重构数据通路功能的高速切换,实现动态重构功能;可重构阵列中流水线mesh阵列:由同构的运算单元(PE)阵列以及它们之间的互联单元组成,相邻的两行PE单元之间通过一个基于置换的网络单元进行互联,可以灵活的支持各种拓扑结构DFG图;可重构阵列中流水线存储器:用于完成数据通路中的数据存储、数据交换和数据同步。
所述可重构阵列中的可重构控制器包括:流水线迭代配置存储器:用来存储流水线循环迭代的配置码,配置码包含了可以进行单层和多层循环迭代配置信息,该循环迭代支持带有分支或者无分支的完美或者非完美循环;流水线数据通路配置存储器,用来存储流水线数据通路的配置码,配置码包含了可重构阵列中mesh阵列PE的计算配置信息和mesh阵列中PE间互联的信息,配置解析和控制单元:依据配置码存储地址信息、内容信息和mesh阵列的运行状态决定对mesh阵列进行配置的时间和配置码内容,并将确定的配置码发送给mesh阵列。
所述可重构阵列中流水线mesh阵列,由同构的运算单元(PE)阵列以及它们之间的互联单元组成。相邻的两行PE单元之间通过一个基于置换的网络单元进行互联,可以灵活的支持各种拓扑结构DFG图。这样的阵列在数据通路中有n个(n大小为从1到4)。
可重构阵列中流水线存储器:用于完成数据通路中的数据存储、数据交换和数据同步,包括多级缓存系统。
其中,所述多级缓存系统包括:
初级缓存:位于两个相连接的PE单元之间,用于mesh阵列内部流水线中的数据缓存和数据交换,采用寄存器实现。
次级缓存:位于相连接的mesh阵列之间,用于多个mesh阵列组成的流水线中数据缓存和数据交换,也可用于mesh阵列间非流水线数据的缓存和数据交换,具有2n(n为mesh阵列数量)个读端口和2n个写端口,可同时被所有mesh阵列访问,采用寄存器堆实现。
接口缓存:位于mesh阵列和可重构阵列接口之间,用于阵列和外部进行数据交换。
其中,在mesh阵列中相邻两行的PE单元之间有信号线连接。
其中,所述的mesh阵列内部的流水线:mesh阵列内m(m值在1-8)行PE单元和PE之间的互联逻辑在配置程序的控制下,可形成m级流水线。流水线中各级的运算功能由PE单元完成,流水线的互联关系由PE之间的互联逻辑完成。
其中,所述的多个mesh阵列组成的流水线:n(n值在1-4)个mesh阵列,每个阵列内有m(m值在1-8)行PE单元,可形成n*m级流水线,流水线各级的运算功能由PE单元完成,mesh阵列中流水线的互联关系由PE之间的互联逻辑完成,mesh阵列之间的互联通过对2级缓存的地址访问完成。
其中,多级缓存的配置码功能为:对第初级缓存,由可重构阵列PE配置码控制PE之间互联关系,同时也完成了初级缓存控制;对次级缓存,由mesh阵列中缓存控制器进行控制,该控制器根据mesh阵列配置码,按时钟周期精度对次级缓存进行读写。
本发明还提供了一种自动循环迭代流水线的粗粒度可重构阵列的配置方法,包括如下步骤:
步骤1)首先对流水线迭代信息进行配置,如果该流水线是单层迭代流水线,则将该流水线的迭代次数或者停止迭代条件作为流水线迭代信息进行配置。如果该流水线是多层迭代型流水线,也就是有流水线的迭代嵌套,则配置控制器中相应的迭代层次中设置迭代条件。流水线迭代层次受到硬件配置控制器中迭代层次的限制。
步骤2)为每一次层次中的流水线设置数据通路配置码。配置码包括mesh阵列中PE的功能配置码和PE之间数据通路的配置码。
步骤3)为流水线在一次迭代中的每周期PE单元设置存储器读写配置码,这样流水线的每个环节可在迭代中每个周期访存不同地址的流水线用缓存。
有益效果:本发明的技术方案通过一种支持自动循环迭代流水线的粗粒度可重构阵列及其控制方法,提高了能够有效提高可重构数据中数据处理并行度并提高流水线执行效率,改变了传统可重构阵列中采用软件流水线线提高性能的优化方法,直接在可重构阵列内部完成多层次嵌套型流水线的控制和配置,从而提高了可重构阵列的运行效率,降低了配置开销。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为支持自动循环迭代流水线的粗粒度可重构阵列结构示意图;
图2为支持自动循环迭代流水线的粗粒度可重构阵列配置方法图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
如图1所示,本实施例的自动支持循环迭代流水线的粗粒度可重构阵列包括粗粒度算子mesh阵列(在本文部分地方简写为mesh阵列):一种支持自动循环迭代流水线的粗粒度可重构阵列,包括流水线配置控制器:用于完成粗粒度可重构阵列中流水线的控制和配置,可以为流水线mesh阵列提供高速的配置带宽资源,支持可重构数据通路功能的高速切换,实现的动态重构功能;可重构阵列中流水线mesh阵列:由同构的运算单元(PE)阵列以及它们之间的互联单元组成,相邻的两行PE单元之间通过一个基于置换的网络单元进行互联,可以灵活的支持各种拓扑结构DFG图;可重构阵列中流水线存储器:用于完成数据通路中的数据存储、数据交换和数据同步。
所述可重构阵列中的可重构控制器包括:流水线迭代配置存储器:用来存储流水线循环迭代的配置码,配置码包含了可以进行单层和多层循环迭代配置信息,该循环迭代支持带有分支或者无分支的完美或者非完美循环;流水线数据通路配置存储器,用来存储流水线数据通路的配置码,配置码包含了可重构阵列中mesh阵列PE的计算配置信息和mesh阵列中PE间互联的信息,配置解析和控制单元:依据配置码存储地址信息、内容信息和mesh阵列的运行状态决定对mesh阵列进行配置的时间和配置码内容,并将确定的配置码发送给mesh阵列。
所述可重构阵列中流水线mesh阵列,由同构的运算单元(PE)阵列以及它们之间的互联单元组成。相邻的两行PE单元之间通过一个基于置换的网络单元进行互联,可以灵活的支持各种拓扑结构DFG图。这样的阵列在数据通路中有n个(n大小为从1到4)。
可重构阵列中流水线存储器:用于完成数据通路中的数据存储、数据交换和数据同步,包括多级缓存系统。
其中,所述多级缓存系统包括:
初级缓存:位于两个相连接的PE单元之间,用于mesh阵列内部流水线中的数据缓存和数据交换,采用寄存器实现。
次级缓存:位于相连接的mesh阵列之间,用于多个mesh阵列组成的流水线中数据缓存和数据交换,也可用于mesh阵列间非流水线数据的缓存和数据交换,具有2n(n为mesh阵列数量)个读端口和2n个写端口,可同时被所有mesh阵列访问,采用寄存器堆实现。
接口缓存:位于mesh阵列和可重构阵列接口之间,用于阵列和外部进行数据交换。
其中,在mesh阵列中相邻两行的PE单元之间有信号线连接。
其中,所述的mesh阵列内部的流水线:mesh阵列内m(m值在1-8)行PE单元和PE之间的互联逻辑在配置程序的控制下,可形成m级流水线。流水线中各级的运算功能由PE单元完成,流水线的互联关系由PE之间的互联逻辑完成。
其中,所述的多个mesh阵列组成的流水线:n(n值在1-4)个mesh阵列,每个阵列内有m(m值在1-8)行PE单元,可形成n*m级流水线,流水线各级的运算功能由PE单元完成,mesh阵列中流水线的互联关系由PE之间的互联逻辑完成,mesh阵列之间的互联通过对2级缓存的地址访问完成。
其中,多级缓存的配置码功能为:对第初级缓存,由可重构阵列PE配置码控制PE之间互联关系,同时也完成了初级缓存控制;对次级缓存,由mesh阵列中缓存控制器进行控制,该控制器根据mesh阵列配置码,按时钟周期精度对次级缓存进行读写。
本发明还提供了一种自动循环迭代流水线的粗粒度可重构阵列的配置方法,包括如下步骤:
步骤1)首先对流水线迭代信息进行配置,如果该流水线是单层迭代流水线,则将该流水线的迭代次数或者停止迭代条件作为流水线迭代信息进行配置。如果该流水线是多层迭代型流水线,也就是有流水线的迭代嵌套,则配置控制器中相应的迭代层次中设置迭代条件。流水线迭代层次受到硬件配置控制器中迭代层次的限制。
步骤2)为每一次层次中的流水线设置数据通路配置码。配置码包括mesh阵列中PE的功能配置码和PE之间数据通路的配置码。
步骤3)为流水线在一次迭代中的每周期PE单元设置存储器读写配置码,这样流水线的每个环节可在迭代中每个周期访存不同地址的流水线用缓存。
如图2所示,第一步对流水线迭代信息进行配置,在完整功能中共有4个流水线,迭代层次为两层。其中流水线2和流水线3分别迭代m和n次,并且该两个流水线依次迭代运行后,会联合进行k次迭代。为此在配置控制器中对以上流水线迭代接口进行配置控制。第二步,对每个流水线分别进行数据通路配置,以流水线2为例,其DFG流图用到2个mesh阵列。第三步,对每个流水线的存储的访存进行配置。由于用到2个mesh阵列,所以分别对初级缓存和次级缓存的读写进行配置。配置完成后,以上三步的配置码全部被一次配置完成,可重构阵列在外部不干预的情况下可独立完成4个流水线组成的完整功能。
Claims (7)
1.一种自动支持循环迭代流水线的粗粒度可重构阵列,其特征在于该阵列由流水线配置控制器、粗粒度算子mesh阵列、多级缓存系统组成,所述粗粒度可重构阵列的配置信息由流水线循环迭代控制信息、流水线数据通路信息和流水线对存储器的访存信息组成;
所述流水线配置控制器,用于完成粗粒度可重构阵列中流水线的控制和配置,为粗粒度算子mesh阵列提供配置功能,支持可重构数据通路功能的高速切换,实现动态重构功能;
所述粗粒度算子mesh阵列用于组成流水线中的计算环节和数据传输通路,并在配置码的控制下,按照数据流图的定义对可重构多级缓存系统进行访存;
可重构多级缓存系统,用于完成数据通路中的数据存储、数据交换和数据同步。
2.根据权利要求1所述的自动支持循环迭代流水线的粗粒度可重构阵列,其特征在于所述的流水线配置控制器包括:
流水线迭代配置存储器:用来存储流水线循环迭代的配置码,该配置码包含了进行单层和多层循环迭代配置信息,该循环迭代支持带有分支或者无分支的完美或者非完美循环;
流水线数据通路配置存储器:用来存储流水线数据通路的配置码,该配置码包含了可重构阵列中mesh阵列PE的计算配置信息和mesh阵列中PE间互联的信息。
配置解析和控制单元:依据配置码存储地址信息、内容信息和mesh阵列的运行状态决定对mesh阵列进行配置的时间和配置码内容,并将确定的配置码发送给mesh阵列。
3.根据权利要求1所述的自动支持循环迭代流水线的粗粒度可重构阵列,其特征在于所述的粗粒度算子mesh阵列由同构的粗粒度运算单元阵列以及它们之间的互联单元组成,所述的粗粒度运算单元主要由ALU单元及存储临时数据的寄存器组成,每个运算单元独立的执行配置单元指定的运算功能,每个运算单元的基本粒度是8比特,同一行内相邻的4个PE单元组成一个32比特位宽的可重构单元组,支持32比特位宽的运算操作,相邻的两行PE单元之间通过一个基于置换的网络单元进行互联,支持拓扑结构DFG图。
4.根据权利要求1所述的自动支持循环迭代流水线的粗粒度可重构阵列,其特征在于所述的多级缓存系统包括:
初级缓存:位于两个相连接的PE单元之间,用于mesh阵列内部流水线中的数据缓存和数据交换,采用寄存器实现;
次级缓存:位于相连接的mesh阵列之间,用于多个mesh阵列组成的流水线中数据缓存和数据交换,也用于mesh阵列间非流水线数据的缓存和数据交换,具有2n个读端口和2n个写端口,n为mesh阵列数量,可同时被所有mesh阵列访问,采用寄存器堆实现;
接口缓存:位于mesh阵列和可重构阵列接口之间,用于阵列和外部进行数据交换。
5.根据权利要求4所述的自动支持循环迭代流水线的粗粒度可重构阵列,其特征在于对初级缓存,由可重构阵列PE配置码控制PE之间互联关系,同时也完成了初级缓存控制;对次级缓存,由mesh阵列中缓存控制器进行控制,该控制器根据mesh阵列配置码,按时钟周期精度对次级缓存进行读写。
6.根据权利要求1所述的自动支持循环迭代流水线的粗粒度可重构阵列,其特征在于所述流水线迭代配置信息中包括流水线循环次数和结束循环条件、流水线中的分支运行信息和流水线嵌套信息;
所述流水线数据通路信息包括流水线中每个PE的配置信息,PE间的数据互联信息;
所述流水线对存储器的访存信息包括每个周期流水线对存储器的读写操作信息。
7.一种如权利要求1-6中任意一项所述自动循环迭代流水线的粗粒度可重构阵列的配置方法,包括如下步骤:
步骤1)首先对流水线迭代信息进行配置,如果该流水线是单层迭代流水线,则将该流水线的迭代次数或者停止迭代条件作为流水线迭代信息进行配置;如果该流水线是多层迭代型流水线,也就是有流水线的迭代嵌套,则配置控制器中相应的迭代层次中设置迭代条件,流水线迭代层次受到硬件配置控制器中迭代层次的限制;
步骤2)为每一次层次中的流水线设置数据通路配置码,配置码包括mesh阵列中PE的功能配置码和PE之间数据通路的配置码;
步骤3)为流水线在一次迭代中的每周期PE单元设置存储器读写配置码,这样流水线的每个环节可在迭代中每个周期访存不同地址的流水线用缓存。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710712367.XA CN107506329B (zh) | 2017-08-18 | 2017-08-18 | 一种自动支持循环迭代流水线的粗粒度可重构阵列及其配置方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710712367.XA CN107506329B (zh) | 2017-08-18 | 2017-08-18 | 一种自动支持循环迭代流水线的粗粒度可重构阵列及其配置方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107506329A true CN107506329A (zh) | 2017-12-22 |
CN107506329B CN107506329B (zh) | 2018-06-19 |
Family
ID=60692329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710712367.XA Expired - Fee Related CN107506329B (zh) | 2017-08-18 | 2017-08-18 | 一种自动支持循环迭代流水线的粗粒度可重构阵列及其配置方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107506329B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112463717A (zh) * | 2020-11-05 | 2021-03-09 | 上海交通大学 | 一种粗粒度可重构架构下条件分支实现方法 |
CN112486903A (zh) * | 2020-12-18 | 2021-03-12 | 清华大学 | 可重构处理单元、可重构处理单元阵列及其运行方法 |
CN112486907A (zh) * | 2020-12-18 | 2021-03-12 | 清华大学 | 可重构处理器上多层循环任务的硬件实现方法 |
CN113934681A (zh) * | 2021-12-15 | 2022-01-14 | 北京清微智能信息技术有限公司 | 一种可重构计算阵列及构建方法 |
WO2022199459A1 (zh) * | 2021-03-24 | 2022-09-29 | 珠海一微半导体股份有限公司 | 一种可重构处理器及配置方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1990007610A1 (de) * | 1988-12-23 | 1990-07-12 | Allgemeine Baugesellschaft-A.Porr Aktiengesellschaft | Sanierungssystem für oberflächen und verschleissplatte hiefür |
JPH051306A (ja) * | 1991-06-21 | 1993-01-08 | Nippon Steel Corp | ベル式高炉へのコークス装入方法 |
US6526480B1 (en) * | 1998-12-10 | 2003-02-25 | Fujitsu Limited | Cache apparatus and control method allowing speculative processing of data |
CN1860468A (zh) * | 2003-09-30 | 2006-11-08 | 原子能委员会 | 具有动态地可再配置结构的部件 |
CN102289424A (zh) * | 2011-08-09 | 2011-12-21 | 清华大学 | 一种动态可重构阵列处理器的构令流工作方法 |
CN102508816A (zh) * | 2011-11-15 | 2012-06-20 | 东南大学 | 一种应用于粗粒度可重构阵列的配置方法 |
CN103646005A (zh) * | 2012-03-16 | 2014-03-19 | 三星电子株式会社 | 基于微核的可重构处理器、调度设备及其方法 |
CN103761213A (zh) * | 2014-02-14 | 2014-04-30 | 上海交通大学 | 基于循环流水计算的片上阵列系统 |
CN103914404A (zh) * | 2014-04-29 | 2014-07-09 | 东南大学 | 一种粗粒度可重构系统中的配置信息缓存装置及压缩方法 |
CN105975251A (zh) * | 2016-05-19 | 2016-09-28 | 东南大学—无锡集成电路技术研究所 | 一种基于粗粒度可重构架构的des算法轮迭代系统及迭代方法 |
CN107003853A (zh) * | 2014-12-24 | 2017-08-01 | 英特尔公司 | 用于数据推测执行的系统、装置和方法 |
-
2017
- 2017-08-18 CN CN201710712367.XA patent/CN107506329B/zh not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1990007610A1 (de) * | 1988-12-23 | 1990-07-12 | Allgemeine Baugesellschaft-A.Porr Aktiengesellschaft | Sanierungssystem für oberflächen und verschleissplatte hiefür |
JPH051306A (ja) * | 1991-06-21 | 1993-01-08 | Nippon Steel Corp | ベル式高炉へのコークス装入方法 |
US6526480B1 (en) * | 1998-12-10 | 2003-02-25 | Fujitsu Limited | Cache apparatus and control method allowing speculative processing of data |
CN1860468A (zh) * | 2003-09-30 | 2006-11-08 | 原子能委员会 | 具有动态地可再配置结构的部件 |
CN102289424A (zh) * | 2011-08-09 | 2011-12-21 | 清华大学 | 一种动态可重构阵列处理器的构令流工作方法 |
CN102508816A (zh) * | 2011-11-15 | 2012-06-20 | 东南大学 | 一种应用于粗粒度可重构阵列的配置方法 |
CN103646005A (zh) * | 2012-03-16 | 2014-03-19 | 三星电子株式会社 | 基于微核的可重构处理器、调度设备及其方法 |
CN103761213A (zh) * | 2014-02-14 | 2014-04-30 | 上海交通大学 | 基于循环流水计算的片上阵列系统 |
CN103914404A (zh) * | 2014-04-29 | 2014-07-09 | 东南大学 | 一种粗粒度可重构系统中的配置信息缓存装置及压缩方法 |
CN107003853A (zh) * | 2014-12-24 | 2017-08-01 | 英特尔公司 | 用于数据推测执行的系统、装置和方法 |
CN105975251A (zh) * | 2016-05-19 | 2016-09-28 | 东南大学—无锡集成电路技术研究所 | 一种基于粗粒度可重构架构的des算法轮迭代系统及迭代方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112463717A (zh) * | 2020-11-05 | 2021-03-09 | 上海交通大学 | 一种粗粒度可重构架构下条件分支实现方法 |
CN112463717B (zh) * | 2020-11-05 | 2022-07-22 | 上海交通大学 | 一种粗粒度可重构架构下条件分支实现方法 |
CN112486903A (zh) * | 2020-12-18 | 2021-03-12 | 清华大学 | 可重构处理单元、可重构处理单元阵列及其运行方法 |
CN112486907A (zh) * | 2020-12-18 | 2021-03-12 | 清华大学 | 可重构处理器上多层循环任务的硬件实现方法 |
WO2022199459A1 (zh) * | 2021-03-24 | 2022-09-29 | 珠海一微半导体股份有限公司 | 一种可重构处理器及配置方法 |
CN113934681A (zh) * | 2021-12-15 | 2022-01-14 | 北京清微智能信息技术有限公司 | 一种可重构计算阵列及构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107506329B (zh) | 2018-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107590085B (zh) | 一种具有多级缓存的动态可重构阵列数据通路及其控制方法 | |
CN107506329B (zh) | 一种自动支持循环迭代流水线的粗粒度可重构阵列及其配置方法 | |
CN108805266B (zh) | 一种可重构cnn高并发卷积加速器 | |
CN108564168B (zh) | 一种对支持多精度卷积神经网络处理器的设计方法 | |
CN111178519A (zh) | 卷积神经网络加速引擎、卷积神经网络加速系统及方法 | |
CN111433758B (zh) | 可编程运算与控制芯片、设计方法及其装置 | |
CN110516801A (zh) | 一种高吞吐率的动态可重构卷积神经网络加速器架构 | |
CN105912501B (zh) | 一种基于大规模粗粒度可重构处理器的sm4-128加密算法实现方法及系统 | |
CN102541774B (zh) | 多粒度并行存储系统与存储器 | |
CN102508643A (zh) | 一种多核并行数字信号处理器及并行指令集的运行方法 | |
CN105335331A (zh) | 一种基于大规模粗粒度可重构处理器的sha256实现方法及系统 | |
CN105468439A (zh) | 在cpu-gpu异构框架下遍历固定半径内邻居的自适应并行算法 | |
CN102497411A (zh) | 面向密集运算的层次化异构多核片上网络架构 | |
CN103927270A (zh) | 一种面向多个粗粒度动态可重构阵列的共享数据缓存装置及控制方法 | |
CN103761072A (zh) | 一种粗粒度可重构层次化的阵列寄存器文件结构 | |
US20230075069A1 (en) | Memory processing unit architectures and configurations | |
CN108647777A (zh) | 一种实现并行卷积计算的数据映射系统及方法 | |
US10275392B2 (en) | Data processing device | |
CN113157638B (zh) | 一种低功耗存储器内计算处理器和处理运算方法 | |
CN103455367B (zh) | 用于实现可重构系统中多任务调度的管理单元和方法 | |
CN105955896A (zh) | 一种可重构dbf算法硬件加速器及控制方法 | |
Shang et al. | LACS: A high-computational-efficiency accelerator for CNNs | |
Ashby et al. | The impact of global communication latency at extreme scales on Krylov methods | |
CN113222129A (zh) | 一种基于多级缓存循环利用的卷积运算处理单元及系统 | |
CN101021830A (zh) | 一种流处理器中多核扩展的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180619 Termination date: 20190818 |