CN105677582B - 基于可重构系统配置多模式传输的可控缓存实现系统 - Google Patents
基于可重构系统配置多模式传输的可控缓存实现系统 Download PDFInfo
- Publication number
- CN105677582B CN105677582B CN201610098958.8A CN201610098958A CN105677582B CN 105677582 B CN105677582 B CN 105677582B CN 201610098958 A CN201610098958 A CN 201610098958A CN 105677582 B CN105677582 B CN 105677582B
- Authority
- CN
- China
- Prior art keywords
- configuration information
- reconfigurable
- pattern
- configuration
- cache controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0806—Multiuser, multiprocessor or multiprocessing cache systems
- G06F12/0811—Multiuser, multiprocessor or multiprocessing cache systems with multilevel cache hierarchies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0877—Cache access modes
- G06F12/0884—Parallel mode, e.g. in parallel with main memory or CPU
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Memory System Of A Hierarchy Structure (AREA)
- Microcomputers (AREA)
Abstract
本发明公开了一种基于大规模嵌入式粗粒度可重构系统配置多模式传输的可控缓存实现方法,其包括系统总线、配置信息总线、外部存储器、片外存储接口、中断控制器、微处理器、共享存储器(即第三级配置缓存控制器)、多可重构处理器、片内外数据传输控制器、片外配置信息存储器、处理单元重构控制器,该处理方法在原有的缓存结构上增加了层次化多模式的配置传输控制器,控制可重构处理器进行配置的传输。本发明通过缓存控制器层次化结构优化了存储资源利用率,且通过多模式传输降低了配置管理复杂度。
Description
技术领域
本发明涉及一种基于大规模嵌入式粗粒度可重构系统配置多模式传输的可控缓存实现系统,嵌入式可重构设计技术领域。
背景技术
可重构架构作为一种兼具灵活性和高性能的硬件结构,国内外的很多科研机构和公司都进行了深入、广泛的研究和应用,目前已有多种用于高性能信号处理、移动通信、媒体处理和加解密等领域的可重构处理器。
可重构处理器的配置管理可以从多方面入手,目前最常用的提高重构效率的配置管理方法有优化重构序列和缩减重构数据规模。优化重构序列是利用配置信息流的时间局部性,优化配置信息调度过程,从而减少重构时间。缩减重构数据规模则是利用配置信息流的空间局部性,减少重构时所需的配置信息量,进而减少配置信息传输时间,提高重构效率。
优化重构序列利用了多数计算密集型应用的配置信息重复利用率较高的特点,将最近一段时间频繁使用的配置信息缓存在片上,以减少访问外部存储器的次数,加快配置信息的传输速度。
此外,一些可重构处理器采用了分布式配置缓存结构以加速重构。每个阵列都对应一个重构控制器。每个重构控制器内都有一块配置缓。但是,这样的分布式配置缓存虽然功能独立、灵活性高,但是存储开销非常大,而且当存储单元中存储的内容相近或相同时,存储资源利用率也会较低。此外,硬件资源较多时,管理方法也会比较复杂。近年来,随着可重构处理器计算资源的不断增加,当处理器中有多个可重构单元或可重构阵列时,配置缓存逐渐形成了层次化的结构。
针对存储资源利用率低,管理方法复杂的问题,目前尚未提出有效的解决方案。
发明内容
发明目的:针对现有技术中存在的问题与不足,本发明提供一种基于大规模嵌入式粗粒度可重构系统配置多模式传输的可控缓存实现系统,对配置信息分级管理,通过多模式传输控制配置信息在各级之间的流通,以提高资源利用率,降低配置管理方法的复杂度。
技术方案:一种基于大规模嵌入式粗粒度可重构系统配置多模式传输的可控缓存实现系统,基于传统的嵌入式缓存结构,增加了缓存控制器,用于实现配置信息的多模式传输。
所述缓存控制器,为分级组织形式,共分为三级,其中,可重构阵列与第一级配置缓存控制器紧耦合,第二级配置缓存控制器与第三级配置缓存控制器紧耦合,第三级配置缓存控制器与片外配置信息存储器之间通过配置信息总线互联。三级缓存控制器同构,包括传输模式设置单元、配置信息存储控制单元、配置信息存储单元、配置信息输出单元和配置信息输入单元。
传输模式设置单元用于配置固定的传输模式,每套配置信息根据算法的特征和配置信息之间的逻辑结构,提前预存好配置信息的传输模式,传输模式设置单元读取预存信息,完成配置信息存储控制单元的配置;
配置信息存储控制单元用于对配置信息输出单元和配置信息输入单元进行配置,控制输入配置信息的来源和存放地址,并配置输出配置信息的内容和对象;
配置信息存储单元用于存储配置信息内容;
配置信息输出单元根据传输模式设置单元的配置信息,控制配置信息的输出内容、输出对象和输出模式;
配置信息输入单元用于控制配置信息的输入来源和输入内容。
所述传输模式共计5种,包括:模式一,所有阵列配置信息不同,并行计算;模式二,所有阵列配置信息相同,并行计算;模式三,同一可重构处理器内的阵列配置信息相同,并行计算;模式四,所有可重构阵列顺序执行,串行计算;模式五,可重构处理器之间并行计算,可重构处理器内的阵列串行计算。
优选地,可重构系统架构包括4个可重构处理器,每个可重构处理器包括4个可重构阵列和4个第一级配置缓存控制器,1个第二级配置缓存控制器,第二级配置缓存控制器与第一级配置缓存控制器之间采用广播互联,第一级配置缓存控制器之间采用单向直线互联。
传输模式的具体解释如下:
模式一,16个可重构阵列引用的配置信息均不同,可重构阵列间并行计算;
模式二,16个可重构阵列引用的配置信息均相同,可重构阵列间并行计算;
模式三,同一可重构处理器内的4个可重构阵列之间的配置信息均相同,4个可重构处理器之间可重构阵列之间的配置信息不同,可重构阵列并行计算;
模式四,16个可重构阵列之间顺序执行,串行计算,配置信息依次配置;
模式五,4个可重构处理器之间并行计算,可重构处理器内4个可重构阵列串行计算。
配置信息存储控制单元对配置缓存控制器中的配置流传输控制步骤如下:
(1)对整体算法进行子算法切割,解析算法内容,获得子算法之间的逻辑关系,确定执行顺序,从而得出配置信息之间的执行逻辑顺序,确定配置信息的传输模式;
(2)根据上一步的分析结果,赋值传输模式设置单元,传输模式设置单元根据传输模式设置配置信息存储控制单元,对于配置信息存储单元,模式一至模式五均对应不同的存储模式;
(3)配置信息存储单元控制配置信息输入的来源和配置信息的存储方式,并响应配置信息输出单元的访问请求,根据存储模式的不同输出相应的配置信息。
附图说明
图1为大规模嵌入式粗粒度可重构系统架构图;
图2为配置缓存控制器分级组织系统示意图;
图3为配置缓存控制器内部架构图;
图4为大规模嵌入式粗粒度可重构系统配置调度流程图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
图1为大规模嵌入式粗粒度可重构系统架构图,其包括系统总线、配置信息总线、外部存储器、片外存储接口、中断控制器、微处理器、共享存储器(即第三级配置缓存控制器)、多可重构处理器、片内外数据传输控制器、片外配置信息存储器、处理单元重构控制器。
图2为配置缓存控制器分级组织系统示意图,缓存控制器共分为三级,其中,可重构阵列与第一级配置缓存控制器紧耦合,第二级配置缓存控制器与第三级配置缓存控制器紧耦合,第三级配置缓存控制器与片外配置信息存储器之间通过配置信息总线互联。如图2所示,可重构架构包含N个可重构处理器,其中,N>1,每个可重构处理器包含4个可重构阵列;四个第一级配置缓存控制器共享1个第二级配置缓存控制器,从第二级配置缓存控制器中读取配置,第一级配置缓存控制器之间可按顺序单向读取配置;所有第二级配置信息缓存控制器共享一个第三级配置缓存控制器,第二级配置缓存控制器只能从第三级配置缓存控制器中读取配置。
优选地,可重构架构包括4个可重构处理器,每个可重构处理器包括4个可重构阵列和4个第一级配置缓存控制器,1个第二级配置缓存控制器,第二级配置缓存控制器与第一级配置缓存控制器之间采用广播互联,第一级配置缓存控制器之间采用单向直线互联。
图3为配置缓存控制器内部架构图,缓存控制器包括:传输模式设置单元、配置信息存储控制单元、配置信息存储单元、配置信息输出单元和配置信息输入单元;其中,传输模式设置单元用于配置固定的传输模式,根据算法的特征和配置信息之间的逻辑结构,对配置信息存储控制单元进行配置,配置信息存储控制单元用于输入和输出调度,对配置信息输出单元和配置信息输入单元进行配置,控制输入配置信息的来源和存放地址,并配置输出配置信息的内容和对象,配置信息存储单元用于存储配置信息内容,配置信息输出单元用于根据传输模式设置单元的配置信息,控制配置信息的输出内容、输出对象和输出模式,配置信息输入单元用于控制配置信息的输入。
图4为大规模嵌入式粗粒度可重构系统配置调度流程图,实现的传输模式包括:模式一,所有阵列配置信息不同,并行计算;模式二,所有阵列配置信息相同,并行计算;模式三,同一可重构处理器内的阵列配置信息相同,并行计算;模式四,所有可重构阵列顺序执行,串行计算;模式五,可重构处理器之间并行计算,可重构处理器内的阵列串行计算。配置信息的调度传输步骤包括判断配置模式,将模式一的配置写入传输模式设置单元的条件为配置模式并行且同一可重构架构内可重构阵列的配置信息不同;将模式二的配置写入传输模式设置单元的条件为配置模式并行、同一可重构架构内可重构阵列的配置信息相同且不同可重构架构内可重构阵列的配置不同;将模式三的配置写入传输模式设置单元的条件为配置模式并行、同一可重构架构内可重构阵列的配置信息相同且不同可重构架构内可重构阵列的配置不相同;将模式四的配置写入传输模式设置单元的条件为配置模式串行;将模式五的配置写入传输模式设置单元的条件为配置模式非并行也非串行;以模式五(可重构处理器之间并行计算,可重构处理器内的阵列串行计算)为例,其配置信息的调度传输步骤为:
(1)解析算法内容,分析配置信息之间的逻辑关系,确定配置信息的传输模式为五;
(2)按模式五配置传输模式设置单元,控制配置的存取和可重构阵列的计算;
(3)先将配置写入每个可重构处理器的第一级配置缓存控制器#0中,第一级配置缓存控制器#0将配置写入可重构阵列#0中,使其开始计算;
(4)可重构阵列#0计算完成后,将配置信息写入第一级配置缓存控制器#1中,继续上述步骤,直至可重构阵列#3计算完成。
Claims (4)
1.一种基于大规模嵌入式粗粒度可重构系统配置多模式传输的可控缓存实现系统,其特征在于:基于嵌入式缓存结构,增加了缓存控制器,用于实现配置信息的多模式传输;
所述缓存控制器,为分级组织形式,共分为三级,其中,可重构阵列与第一级配置缓存控制器紧耦合,第二级配置缓存控制器与第三级配置缓存控制器紧耦合,第三级配置缓存控制器与片外配置信息存储器之间通过配置信息总线互联;
三级缓存控制器同构,包括传输模式设置单元、配置信息存储控制单元、配置信息存储单元、配置信息输出单元和配置信息输入单元;
传输模式设置单元用于配置固定的传输模式,根据算法的特征和配置信息之间的逻辑结构,对配置信息存储控制单元进行配置;
配置信息存储控制单元用于对配置信息输出单元和配置信息输入单元进行配置,控制输入配置信息的来源和存放地址,并配置输出配置信息的内容和对象;
配置信息存储单元用于存储配置信息内容;
配置信息输出单元根据传输模式设置单元的配置信息,控制配置信息的输出内容、输出对象和输出模式;
配置信息输入单元用于控制配置信息的输入来源和输入内容;
控制配置信息传输的步骤如下:
(1)对整体算法进行子算法切割,解析算法内容,获得子算法之间的逻辑关系,确定执行顺序,从而得出配置信息之间的执行逻辑顺序,确定配置信息的传输模式;
(2)根据上一步的分析结果,赋值传输模式设置单元,传输模式设置单元根据传输模式设置配置信息存储控制单元,对于配置信息存储单元,模式一至模式五均对应不同的存储模式;
(3)配置信息存储单元控制配置信息输入的来源和配置信息的存储方式,并控制配置信息的输出内容和输出对象。
2.如权利要求1所述的基于可重构系统配置多模式传输的可控缓存实现系统,其特征在于:
所述传输模式共计5种,包括:模式一,所有阵列配置信息不同,并行计算;模式二,所有阵列配置信息相同,并行计算;模式三,同一可重构处理器内的阵列配置信息相同,并行计算;模式四,所有可重构阵列顺序执行,串行计算;模式五,可重构处理器之间并行计算,可重构处理器内的阵列串行计算。
3.如权利要求1所述的基于可重构系统配置多模式传输的可控缓存实现系统,其特征在于:可重构架构包括4个可重构处理器,每个可重构处理器包括4个可重构阵列和4个第一级配置缓存控制器,1个第二级配置缓存控制器,第二级配置缓存控制器与第一级配置缓存控制器之间采用广播互联,第一级配置缓存控制器之间采用单向直线互联。
4.如权利要求3所述的基于可重构系统配置多模式传输的可控缓存实现系统,其特征在于:
传输模式的具体解释如下:
模式一, 16个可重构阵列引用的配置信息均不同,可重构阵列间并行计算;
模式二,16个可重构阵列引用的配置信息均相同,可重构阵列间并行计算;
模式三,同一可重构处理器内的4个可重构阵列之间的配置信息均相同,4个可重构处理器之间可重构阵列之间的配置信息不同,可重构阵列并行计算;
模式四,16个可重构阵列之间顺序执行,串行计算,配置信息依次配置;
模式五,4个可重构处理器之间并行计算,可重构处理器内4个可重构阵列串行计算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610098958.8A CN105677582B (zh) | 2016-02-24 | 2016-02-24 | 基于可重构系统配置多模式传输的可控缓存实现系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610098958.8A CN105677582B (zh) | 2016-02-24 | 2016-02-24 | 基于可重构系统配置多模式传输的可控缓存实现系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105677582A CN105677582A (zh) | 2016-06-15 |
CN105677582B true CN105677582B (zh) | 2018-06-19 |
Family
ID=56305790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610098958.8A Active CN105677582B (zh) | 2016-02-24 | 2016-02-24 | 基于可重构系统配置多模式传输的可控缓存实现系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105677582B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590085B (zh) * | 2017-08-18 | 2018-05-29 | 浙江大学 | 一种具有多级缓存的动态可重构阵列数据通路及其控制方法 |
CN108616348B (zh) * | 2018-04-19 | 2019-08-23 | 清华大学无锡应用技术研究院 | 使用可重构处理器实现安全算法、解密算法的方法及系统 |
CN110597739A (zh) * | 2019-06-03 | 2019-12-20 | 上海云盾信息技术有限公司 | 一种配置的管理方法、系统及设备 |
CN111475205B (zh) * | 2020-03-02 | 2023-03-17 | 上海交通大学 | 一种基于数据流解耦合的粗粒度可重构阵列结构设计方法 |
CN112540950B (zh) * | 2020-12-18 | 2023-03-28 | 清华大学 | 基于配置信息共享存储的可重构处理器及其共享存储方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103034617A (zh) * | 2012-12-13 | 2013-04-10 | 东南大学 | 用于实现可重构系统配置信息存储的缓存结构和管理方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8972680B2 (en) * | 2012-01-23 | 2015-03-03 | International Business Machines Corporation | Data staging area |
-
2016
- 2016-02-24 CN CN201610098958.8A patent/CN105677582B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103034617A (zh) * | 2012-12-13 | 2013-04-10 | 东南大学 | 用于实现可重构系统配置信息存储的缓存结构和管理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105677582A (zh) | 2016-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105677582B (zh) | 基于可重构系统配置多模式传输的可控缓存实现系统 | |
EP3242210B1 (en) | Work stealing in heterogeneous computing systems | |
CN108563808A (zh) | 基于fpga的异构可重构图计算加速器系统的设计方法 | |
KR20190044567A (ko) | 프로세서 타일들 간의 동기화 | |
US20120079155A1 (en) | Interleaved Memory Access from Multiple Requesters | |
CN107122244A (zh) | 一种基于多gpu的图数据处理系统及方法 | |
KR20190044570A (ko) | 복수-타일 프로세싱 구성에서의 동기화 | |
KR20190044569A (ko) | 복수-쓰레드 프로세서에서의 복수 쓰레드들의 상태들의 결합 | |
CN104317770B (zh) | 用于众核处理系统的数据存储结构及数据访问方法 | |
CN104115093A (zh) | 包括多个处理元件之间的功率和性能平衡的用于能效和节能的方法、装置和系统 | |
CN102193830B (zh) | 面向众核环境的分治映射/归约并行编程模型 | |
CN110222818A (zh) | 一种用于卷积神经网络数据存储的多bank行列交织读写方法 | |
CN109739833A (zh) | 一种基于fpga的国产平台数据库加速系统及方法 | |
US20220043770A1 (en) | Neural network processor, chip and electronic device | |
CN1444154A (zh) | 多处理机系统 | |
KR20190044566A (ko) | 복수-타일 프로세싱 구성에서의 동기화 | |
CN100489830C (zh) | 面向科学计算的64位流处理器芯片 | |
US20240272939A1 (en) | System and method for maintaining dependencies in a parallel process | |
CN111653317B (zh) | 基因比对加速装置、方法及系统 | |
CN107729057A (zh) | 一种在多核dsp下的数据块多缓冲流水处理方法 | |
CN109117949A (zh) | 用于人工智能设备的灵活数据流处理器和处理方法 | |
CN105718990B (zh) | 细胞阵列计算系统以及其中细胞之间的通信方法 | |
CN105718991B (zh) | 细胞阵列计算系统 | |
Ausavarungnirun | Techniques for shared resource management in systems with throughput processors | |
CN111863139B (zh) | 一种基于近内存计算结构的基因比对加速方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |