CN112558861B - 一种面向多核处理器阵列的数据加载和存储系统及方法 - Google Patents

一种面向多核处理器阵列的数据加载和存储系统及方法 Download PDF

Info

Publication number
CN112558861B
CN112558861B CN202011053379.4A CN202011053379A CN112558861B CN 112558861 B CN112558861 B CN 112558861B CN 202011053379 A CN202011053379 A CN 202011053379A CN 112558861 B CN112558861 B CN 112558861B
Authority
CN
China
Prior art keywords
data
module
modules
loading
core processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011053379.4A
Other languages
English (en)
Other versions
CN112558861A (zh
Inventor
张朋朋
欧阳鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qingwei Intelligent Technology Co ltd
Original Assignee
Beijing Qingwei Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qingwei Intelligent Technology Co ltd filed Critical Beijing Qingwei Intelligent Technology Co ltd
Priority to CN202011053379.4A priority Critical patent/CN112558861B/zh
Priority to PCT/CN2021/079111 priority patent/WO2022068149A1/zh
Publication of CN112558861A publication Critical patent/CN112558861A/zh
Priority to US17/484,850 priority patent/US20220100521A1/en
Application granted granted Critical
Publication of CN112558861B publication Critical patent/CN112558861B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0656Data buffering arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/20Handling requests for interconnection or transfer for access to input/output bus
    • G06F13/28Handling requests for interconnection or transfer for access to input/output bus using burst mode transfer, e.g. direct memory access DMA, cycle steal
    • G06F13/287Multiplexed DMA
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0685Hybrid storage combining heterogeneous device types, e.g. hierarchical storage, hybrid arrays
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开一种面向多核处理器阵列的数据加载和存储系统及方法,属于多核处理器阵列数据加载和存储技术技术领域。包括:一个存储模块、一个缓存模块、一个控制模块、若干个数据加载模块、若干个数据存储模块和一个多核处理器阵列模块。数据在DDR中是连续存储的,多核处理器计算的数据可能是连续排列,也可能是按照一定的规律排列,在DMA利用BURST模式将数据读入到DATA_BUF后,为支持快速将数据加载到多核处理器阵列而设计数据加载模块20,即load模块;相反的,为了将多核处理器阵列计算的结果按照一定的规律快速存储到DATA_BUF而设计数据存储模块30,即store模块。本发明解决了现有技术中粗粒度可重构计算不能满足各种计算需求,不能支持多核处理器阵列的数据加载和存储的问题。

Description

一种面向多核处理器阵列的数据加载和存储系统及方法
技术领域
本发明属于多核处理器阵列数据加载和存储技术技术领域,尤其涉及一种面向多核处理器阵列的数据加载和存储系统及方法。
背景技术
粗粒度可重构架构提供了比通用处理器更高的性能,比专用集成电路更好的灵活性。粗粒度可重构架构内部通过互联组成多核处理器阵列,可以并行处理逻辑或算术运算。现有的粗粒度可重构计算不能满足各种计算需求,不能支持多核处理器阵列的数据加载和存储。
发明内容
本发明的目的是提供一种面向多核处理器阵列的数据加载和存储系统及方法,以解决现有技术中粗粒度可重构计算不能满足各种计算需求,不能支持多核处理器阵列的数据加载和存储的问题。
为了实现上述目的,本发明提供如下技术方案:
一种面向多核处理器阵列的数据加载和存储系统,包括:
一个存储模块,其能够存储配置指令代码和数据。
一个缓存模块,其包括一个指令缓存模块和一个数据缓存模块;所述指令缓存模块缓存存储模块中的配置指令,所述数据缓存模块缓存存储模块中的数据;
一个控制模块,控制模块能够输出触发信号。
若干个数据加载模块,配置为判断是否接收到触发信号,若是,所述数据加载模块能够读取对应的所述指令缓存模块的配置指令,并根据配置指令生成数据地址,读取数据缓存模块中的数据;
一个多核处理器阵列模块,其配置为能够接收所述数据加载模块的数据,并计算接收到的所述数据;
若干个数据存储模块,数据存储模块能够接收多核处理器阵列模块输出的结果数据并存储。
数据缓存模块能够接收多核处理器阵列模块输出的结果数据并缓存输出的结果数据,同时将结果数据写回到存储模块中。
在上述技术方案的基础上,本发明还可以做如下改进:
进一步地,若干个数据加载模块和若干个数据存储模块分别具有若干个对应的取指模块,取指模块配置为能够生成读取配置指令的地址。
进一步地,若干个数据加载模块和若干个数据存储模块分别具有若干个对应的译码模块,译码模块配置为能够接收取指模块输出的配置指令。
译码模块能够解析配置指令的参数,译码模块能够保存参数。
进一步地,若干个数据加载模块和若干个数据存储模块分别具有若干个对应的地址生成模块,配置为能够接收译码模块输出的配置指令的参数。
进一步地,还包括若干个寄存器,寄存器通过控制模块配置。
进一步地,数据加载模块和数据存储模块能够支持间接寻址和立即数寻址。
当数据加载模块和数据存储模块间接寻址时,基地址根据配置指令对应字段的参数选择寄存器。
当数据加载模块和数据存储模块直接寻址时,基地址来自配置指令。
进一步地,地址生成模块支持基地址间接寻址和直接寻址的基础上,支持地址变换、地址取模和正常模式。
数据加载模块和数据存储模块根据多核处理器阵列模块的规格分配个数。
进一步地,数据加载模块和数据存储模块内置FFT专用地址生成器。
在读取的数据加载模块和数据存储模块模式使用时,数据加载模块可以从不同的数据缓存模块中加载数据和旋转因子,生成地址取决于FFT的级数和当前级数。
进一步地,数据存储模块将多核处理器阵列计算后的结果存储到数据缓存模块中,用于下一级FFT计算。
一种面向多核处理器阵列的数据加载和存储方法,其特征在于,包括:
S101,一个存储模块,其能够存储配置指令代码和数据;
S102,一个缓存模块,其包括一个指令缓存模块和一个数据缓存模块;所述指令缓存模块缓存存储模块中的配置指令,所述数据缓存模块缓存存储模块中的数据;
S103,一个控制模块,所述控制模块能够输出触发信号;
S104,若干个数据加载模块,配置为判断是否接收到触发信号,若是,所述数据加载模块能够读取对应的所述指令缓存模块的配置指令,并根据配置指令生成数据地址,读取数据缓存模块中的数据;
S105,一个多核处理器阵列模块,其配置为能够接收所述数据加载模块的数据,并计算接收到的所述数据;
S106,若干个数据存储模块,所述数据存储模块能够接收所述多核处理器阵列模块输出的结果数据并存储;
S107,所述数据缓存模块能够接收所述多核处理器阵列模块输出的结果数据并缓存输出的结果数据,同时将结果数据写回到所述存储模块中。
本发明具有如下优点:
本发明中的面向多核处理器阵列的数据加载和存储系统及方法,数据在DDR中是连续存储的,多核处理器计算的数据可能是连续排列,也可能是按照一定的规律排列。在DMA利用BURST模式将数据读入到数据缓存模块后,为支持快速将数据加载到多核处理器阵列而设计数据加载模块,即load模块。为了将多核处理器阵列计算的结果按照一定的规律快速存储到DATA BUF而设计数据存储模块,即store模块。通过数据加载模块和数据存储模块将参加计算的数据送到多核处理器阵列模块,并将多核处理器阵列模块计算后的结果放到存储模块。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为面向多核处理器阵列的数据加载和存储方法流程图。
图2为面向多核处理器阵列的数据加载和存储系统整体架构示意图。
图3为面向多核处理器阵列的数据加载和存储系统的Load模块示意图。
图4为面向多核处理器阵列的数据加载和存储系统的store模块示意图。
标号说明
缓存模块10,指令缓存模块101,数据缓存模块102,数据加载模块20,数据存储模块30,多核处理器阵列模块40,取指模块50,译码模块60,地址生成模块70。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1-4所示,本发明实施例提供了一种面向多核处理器阵列的数据加载和存储系统及方法,包括:一个存储模块、一个缓存模块10、一个控制模块、若干个数据加载模块20(即load模块)、若干个数据存储模块30(即store模块)和一个多核处理器阵列模块40。缓存模块10包括一个指令缓存模块101(即CSPM_BUF模块)和一个数据缓存模块102(即DATA_BUF模块)。
数据在DDR中是连续存储的,多核处理器计算的数据可能是连续排列,也可能是按照一定的规律排列,在DMA利用BURST模式将数据读入到DATA_BUF后,为支持快速将数据加载到多核处理器阵列而设计数据加载模块20,即load模块。相反的,为了将多核处理器阵列计算的结果按照一定的规律快速存储到DATA_BUF而设计数据存储模块30,即store模块。
DDR(Double DataRate双倍速率同步动态随机存储器),DDR运用先进的同步电路,使指定地址、数据的输送和输出主要步骤既独立执行,又保持与CPU完全同步。DDR使用了DLL(Delay Locked Loop)延时锁定回路提供一个数据滤波信号技术,当数据有效时,存储控制器可使用这个数据滤波信号来精确定位数据,每16次输出一次,并重新同步来自不同存储器模块的数据。
DDR本质上不需要提高时钟频率就能加倍提高SDRAM的速度,它允许在时钟脉冲的上升沿和下降沿读出数据。DDR为184针脚,主要包含了新的控制、时钟、电源和接地等信号。DDR内存采用的是支持2.5V电压的SSTL2标准。
DMA(Direct Memory Access,直接存储器访问)是所有现代电脑的重要特色,它允许不同速度的硬件装置来沟通,而不需要依赖于CPU的大量中断负载。DMA传输将数据从一个地址空间复制到另外一个地址空间。当CPU初始化这个传输动作,传输动作本身是由DMA控制器来实行和完成。典型的例子就是移动一个外部内存的区块到芯片内部更快的内存区。像是这样的操作并没有让处理器工作拖延,反而可以被重新排程去处理其他的工作。DMA传输对于高效能嵌入式系统算法和网络是很重要的。
在实现DMA传输时,是由DMA控制器直接掌管总线,因此,存在着一个总线控制权转移问题。即DMA传输前,CPU要把总线控制权交给DMA控制器,而在结束DMA传输后,DMA控制器应立即把总线控制权再交回给CPU。一个完整的DMA传输过程必须经过DMA请求、DMA响应、DMA传输、DMA结束4个步骤。
存储模块能够存储配置指令代码和数据。
缓存模块10包括一个指令缓存模块101和一个数据缓存模块102;所述指令缓存模块101缓存存储模块中的配置指令,所述数据缓存模块102缓存存储模块中的数据;
指令缓存模块101(即CSPM_BUF模块),能够存储待计算的数据。数据缓存模块102(即DATA_BUF模块),能够存储待执行的指令。CSPM_BUF对乒乓和连续模式的支持:CSPM_BUF由两块缓存组成,load模块根据上层控制信号,实现对CSPM_BUF的乒乓读取和连续读取;
配置指令中包含该load模块和store模块待加载数据基地址、待存储数据基地址、待加载数据大小、待存储数据大小、待加载数据排列方式和带存储数据排列方式。配置指令的缓存CSPM_BUF支持乒乓操作和连续操作,用以提高配置指令的访问的效率。
一个控制模块,控制模块能够输出触发信号。
数据加载模块20,配置为判断是否接收到触发信号,若是,所述数据加载模块20能够读取对应的所述指令缓存模块101的配置指令,并根据配置指令生成数据地址,读取数据缓存模块102中的数据;
数据加载模块20接收到控制模块的触发信号后,可独立读取其对应指令缓存模块101中的配置指令。若干个数据加载模块20具有若干个对应的取指模块50,取指模块50配置为能够生成读取配置指令的地址,取指模块50将配置指令发给译码模块6060。
译码模块60能够解析配置指令的参数,译码模块60能够保存参数,用于数据地址的生成。
load模块支持间接寻址和立即数寻址。在间接寻址中,基地址根据配置指令对应字段的参数选择寄存器,这些寄存器可由控制模块配置。在立即数寻址数寻址中,基地址来自配置指令。
load/store指令中有地址模式字段,根据该字段说明本条指令是间接寻址还是立即数寻址;同时在间接寻址的模式下寄存器字段指示基地址所在的寄存器.
若干个数据加载模块20具有若干个对应的地址生成模块70,配置为能够接收译码模块60输出的配置指令的参数。
地址生成模块70在支持基地址间接寻址和直接寻址的基础上,支持地址变换、地址取模和正常模式。load/store模块可以根据多核处理器阵列的规格分配个数。
load/store指令中有地址模式字段,支持间接寻址下的地址变换、地址取模、正常模式和直接寻址下的地址变换、地址取模、正常模式以及FFT地址生成共7种模式,地址模式字段用3bits的字段完成对以上的模式的编码。
load模块除了支持以上模式外,内置FFT专用地址生成器。在读取的loade指令FFT模式使用时,load模块可以从不同的数据缓存DATA_BUF中加载数据和旋转因子,而且生成地址取决于FFT的级数和当前级数。
数据存储模块30,配置为判断是否接收到触发信号,若是,数据存储模块30能够读取对应的数据缓存模块102的数据信息。数据存储模块30接收到控制模块的触发信号后,可独立读取其对应指令缓存模块101中的配置指令。若干个数据存储模块30具有若干个对应的取指模块50,取指模块50配置为能够生成读取配置指令的地址。取指模块50将配置指令发给译码模块60。
若干个数据存储模块30具有若干个对应的译码模块60,译码模块60配置为能够接收取指模块50输出的配置指令。译码模块60能够解析配置指令的参数,译码模块60能够保存参数,用于数据地址的生成。
store模块支持间接寻址和立即数寻址。在间接寻址中,基地址根据配置指令对应字段的参数选择寄存器,这些寄存器可由控制模块配置。在立即数寻址数寻址中,基地址来自配置指令。
若干个数据存储模块30具有若干个对应的地址生成模块70,配置为能够接收译码模块60输出的配置指令的参数。
地址生成模块70在支持基地址间接寻址和直接寻址的基础上,支持地址变换、地址取模和正常模式。store模块可以根据多核处理器阵列的规格分配个数。
store模块除了支持以上模式外,内置FFT专用地址生成器。在读取的store指令FFT模式使用时,store模块则将计算后的结果存储到数据缓存DATA_BUF中,用于下一级FFT计算。
优选的,1024点的FFT,一共需要做10级(2^10),load/store每次做1级,也就是需要执行1,2,3...9,10,共10级。FFT地址生成根据FFT的点数(1024点)以及当前的级数生成对应的地址。
一个多核处理器阵列模块40,其配置为能够接收所述数据加载模块20的数据,并计算接收到的所述数据;
多核处理器阵列模块40包括多个处理器核,处理器核1、处理器核2、…、处理器核N,其每个处理器核为单个处理器单元。多核处理器阵列模块40从指令缓存模块101读取指令代码,从数据缓存模块102读取数据,执行指令代码进行数据计算。
一种面向多核处理器阵列的数据加载和存储方法,其特征在于,包括:
S101,配置一个存储模块。
本步骤中,配置一个存储模块,其能够存储配置指令代码和数据。
S102,配置一个缓存模块。
本步骤中,配置一个缓存模块10,其包括一个指令缓存模块101和一个数据缓存模块102。指令缓存模块101能够从存储模块中读取指令代码并缓存,数据缓存模块102能够从存储模块中读取数据并缓存。
S103,配置一个控制模块。
本步骤中,配置一个控制模块,控制模块能够输出触发信号。
S104,配置若干个能够读取对应的指令缓存模块中配置指令的数据加载模块。
本步骤中,配置若干个数据加载模块20,配置为判断是否接收到触发信号,若是,数据加载模块20能够读取对应的指令缓存模块101的配置指令。
S105,配置一个多核处理器阵列模块。
本步骤中,配置一个多核处理器阵列模块40,从数据加载模块20读取配置指令,从数据存储装置读取数据,执行配置指令进行数据计算。
S106,配置若干个能够接收多核处理器阵列模块输出的结果数据并存储的数据存储模块。
本步骤中,配置若干个数据存储模块,数据存储模块30能够接收多核处理器阵列模块40输出的结果数据并存储。
S107,数据缓存模块能够接收多核处理器阵列模块输出的结果数据并缓存且能够将结果数据写回到存储模块中。
本步骤中,数据缓存模块102能够接收多核处理器阵列模块40输出的结果数据并缓存输出的结果数据,同时将结果数据写回到存储模块中。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制。尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种面向多核处理器阵列的数据加载和存储系统,其特征在于,包括:
一个存储模块,其能够存储配置指令代码和数据;
一个缓存模块,其包括一个指令缓存模块和一个数据缓存模块;所述指令缓存模块缓存存储模块中的配置指令,所述数据缓存模块缓存存储模块中的数据;
一个控制模块,所述控制模块能够输出触发信号;
若干个数据加载模块,配置为判断是否接收到触发信号,若是,所述数据加载模块能够读取对应的所述指令缓存模块的配置指令,并根据配置指令生成数据地址,读取数据缓存模块中的数据;
一个多核处理器阵列模块,其配置为能够接收所述数据加载模块的数据,并计算接收到的所述数据;
若干个数据存储模块,所述数据存储模块能够接收所述多核处理器阵列模块输出的结果数据并存储;
所述数据缓存模块能够接收所述多核处理器阵列模块输出的结果数据并缓存输出的结果数据,同时将结果数据写回到所述存储模块中;
所述数据缓存模块设置为多个所述数据缓存模块;
所述数据加载模块和所述数据存储模块内置FFT专用地址生成器;
在读取的数据加载模块和所述数据存储模块模式使用时,数据加载模块可以从不同的数据缓存模块中加载数据和旋转因子,生成地址取决于FFT的级数和当前级数。
2.如权利要求1所述的面向多核处理器阵列的数据加载和存储系统,其特征是,若干个所述数据加载模块和若干个所述数据存储模块分别具有若干个对应的取指模块,所述取指模块配置为能够生成读取所述配置指令的地址。
3.如权利要求2所述的面向多核处理器阵列的数据加载和存储系统,其特征是,若干个所述数据加载模块和若干个所述数据存储模块分别具有若干个对应的译码模块,所述译码模块配置为能够接收所述取指模块输出的配置指令;
所述译码模块能够解析配置指令的参数,所述译码模块能够保存所述参数。
4.如权利要求3所述的面向多核处理器阵列的数据加载和存储系统,其特征是,若干个所述数据加载模块和若干个所述数据存储模块分别具有若干个对应的地址生成模块,配置为能够接收所述译码模块输出的配置指令的参数。
5.如权利要求4所述的面向多核处理器阵列的数据加载和存储系统,其特征是,还包括若干个寄存器,所述寄存器通过所述控制模块配置。
6.如权利要求5所述的面向多核处理器阵列的数据加载和存储系统,其特征是,所述数据加载模块和所述数据存储模块能够支持间接寻址和立即数寻址;
当所述数据加载模块和所述数据存储模块间接寻址时,基地址根据所述配置指令对应字段的参数选择寄存器;
当所述数据加载模块和所述数据存储模块直接寻址时,基地址来自配置指令。
7.如权利要求6所述的面向多核处理器阵列的数据加载和存储系统,其特征在是,所述地址生成模块支持基地址间接寻址和直接寻址的基础上,支持地址变换、地址取模和正常模式;
所述数据加载模块和所述数据存储模块根据多核处理器阵列模块的规格分配个数。
8.如权利要求1所述的面向多核处理器阵列的数据加载和存储系统,其特征是,所述数据存储模块将多核处理器阵列计算后的结果存储到数据缓存模块中,用于下一级FFT计算。
9.一种面向多核处理器阵列的数据加载和存储方法,其特征在于,包括:
S101,一个存储模块,其能够存储配置指令代码和数据;
S102,一个缓存模块,其包括一个指令缓存模块和一个数据缓存模块;所述指令缓存模块缓存存储模块中的配置指令,所述数据缓存模块缓存存储模块中的数据;
S103,一个控制模块,所述控制模块能够输出触发信号;
S104,若干个数据加载模块,配置为判断是否接收到触发信号,若是,所述数据加载模块能够读取对应的所述指令缓存模块的配置指令,并根据配置指令生成数据地址,读取数据缓存模块中的数据;
S105,一个多核处理器阵列模块,其配置为能够接收所述数据加载模块的数据,并计算接收到的所述数据;
S106,若干个数据存储模块,所述数据存储模块能够接收所述多核处理器阵列模块输出的结果数据并存储;
S107,所述数据缓存模块能够接收所述多核处理器阵列模块输出的结果数据并缓存输出的结果数据,同时将结果数据写回到所述存储模块中;
所述数据缓存模块设置为多个所述数据缓存模块;
所述数据加载模块和所述数据存储模块内置FFT专用地址生成器;
在读取的数据加载模块和所述数据存储模块模式使用时,数据加载模块可以从不同的数据缓存模块中加载数据和旋转因子,生成地址取决于FFT的级数和当前级数。
CN202011053379.4A 2020-09-29 2020-09-29 一种面向多核处理器阵列的数据加载和存储系统及方法 Active CN112558861B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202011053379.4A CN112558861B (zh) 2020-09-29 2020-09-29 一种面向多核处理器阵列的数据加载和存储系统及方法
PCT/CN2021/079111 WO2022068149A1 (zh) 2020-09-29 2021-03-04 数据加载和存储系统及方法
US17/484,850 US20220100521A1 (en) 2020-09-29 2021-09-24 Data loading and storage system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011053379.4A CN112558861B (zh) 2020-09-29 2020-09-29 一种面向多核处理器阵列的数据加载和存储系统及方法

Publications (2)

Publication Number Publication Date
CN112558861A CN112558861A (zh) 2021-03-26
CN112558861B true CN112558861B (zh) 2023-03-10

Family

ID=75042662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011053379.4A Active CN112558861B (zh) 2020-09-29 2020-09-29 一种面向多核处理器阵列的数据加载和存储系统及方法

Country Status (2)

Country Link
CN (1) CN112558861B (zh)
WO (1) WO2022068149A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117271427A (zh) * 2022-06-14 2023-12-22 北京有竹居网络技术有限公司 处理器以及用于数据处理的方法、设备和存储介质
CN116881183A (zh) * 2023-09-06 2023-10-13 北京融为科技有限公司 译码数据处理方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1030654A (zh) * 1987-07-01 1989-01-25 数字设备公司 利用存取和故障逻辑信号保护主存储器单元的设备和方法
CN102141905A (zh) * 2010-01-29 2011-08-03 上海芯豪微电子有限公司 一种处理器体系结构
CN102375801A (zh) * 2011-08-23 2012-03-14 孙瑞琛 一种多核处理器存储系统装置及方法
CN202217274U (zh) * 2011-08-23 2012-05-09 江苏中科芯核电子科技有限公司 一种多核处理器存储系统装置
CN105740164A (zh) * 2014-12-10 2016-07-06 阿里巴巴集团控股有限公司 支持缓存一致性的多核处理器、读写方法、装置及设备
CN105786758A (zh) * 2016-02-26 2016-07-20 同济大学 一种具有数据缓存功能的处理器装置及其数据读写方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101625671B (zh) * 2008-07-08 2014-01-01 中兴通讯股份有限公司 Ahb互连矩阵接口及其数据处理方法
US10877886B2 (en) * 2018-03-29 2020-12-29 Intel Corporation Storing cache lines in dedicated cache of an idle core

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1030654A (zh) * 1987-07-01 1989-01-25 数字设备公司 利用存取和故障逻辑信号保护主存储器单元的设备和方法
CN102141905A (zh) * 2010-01-29 2011-08-03 上海芯豪微电子有限公司 一种处理器体系结构
CN102375801A (zh) * 2011-08-23 2012-03-14 孙瑞琛 一种多核处理器存储系统装置及方法
CN202217274U (zh) * 2011-08-23 2012-05-09 江苏中科芯核电子科技有限公司 一种多核处理器存储系统装置
CN105740164A (zh) * 2014-12-10 2016-07-06 阿里巴巴集团控股有限公司 支持缓存一致性的多核处理器、读写方法、装置及设备
CN105786758A (zh) * 2016-02-26 2016-07-20 同济大学 一种具有数据缓存功能的处理器装置及其数据读写方法

Also Published As

Publication number Publication date
WO2022068149A1 (zh) 2022-04-07
CN112558861A (zh) 2021-03-26

Similar Documents

Publication Publication Date Title
US9836277B2 (en) In-memory popcount support for real time analytics
TWI454909B (zh) 減少記憶體裝置之功率消耗之記憶體裝置、方法及系統
JP4026753B2 (ja) 半導体集積回路
JP3811427B2 (ja) ループバッファを利用したループ命令の処理方法を備えるデータ処理装置。
CN112558861B (zh) 一种面向多核处理器阵列的数据加载和存储系统及方法
JP3406744B2 (ja) 制御されたバーストメモリアクセスを備えたデータプロセッサおよびその方法
KR101076245B1 (ko) 상대 주소 발생
US6925643B2 (en) Method and apparatus for thread-based memory access in a multithreaded processor
JPH07134701A (ja) シングルチップマイクロコンピュータ
US5710913A (en) Method and apparatus for executing nested loops in a digital signal processor
CN113495861A (zh) 用于计算的系统和方法
JP2010277180A (ja) 情報処理システム及びデータ転送方法
US8015329B2 (en) Data transfer coherency device and methods thereof
US20220100521A1 (en) Data loading and storage system and method
JP2004501470A (ja) スキームレジスタを用いたメモリアドレスの生成
TWI320141B (en) Apparatus and system for reducing snoop accesses and method for reductiing snoop accesses performed by an electronic apparatus
CN111158753A (zh) 具有数据预取功能的Flash控制器结构及其实现方法
CN111459857A (zh) 一种tcm控制器及数据缓存读取方法
US4884198A (en) Single cycle processor/cache interface
CN114924792A (zh) 指令译码单元、指令执行单元及相关装置和方法
US20030154347A1 (en) Methods and apparatus for reducing processor power consumption
CN114721464A (zh) 片上系统和计算装置
JP4404373B2 (ja) 半導体集積回路
US7606991B2 (en) Dynamic clock switch mechanism for memories to improve performance
US9378782B1 (en) Apparatus with write-back buffer and associated methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant