CN1828773A - 多维数组在动态随机存取存储器上的快速读写方法及装置 - Google Patents

多维数组在动态随机存取存储器上的快速读写方法及装置 Download PDF

Info

Publication number
CN1828773A
CN1828773A CN 200510051442 CN200510051442A CN1828773A CN 1828773 A CN1828773 A CN 1828773A CN 200510051442 CN200510051442 CN 200510051442 CN 200510051442 A CN200510051442 A CN 200510051442A CN 1828773 A CN1828773 A CN 1828773A
Authority
CN
China
Prior art keywords
row
address
read
column
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200510051442
Other languages
English (en)
Other versions
CN100538886C (zh
Inventor
莫志锋
韩承德
王贞松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XIAOSHAN INDUSTRY RESEARCH INSTITUTE
Original Assignee
Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Computing Technology of CAS filed Critical Institute of Computing Technology of CAS
Priority to CNB200510051442XA priority Critical patent/CN100538886C/zh
Publication of CN1828773A publication Critical patent/CN1828773A/zh
Application granted granted Critical
Publication of CN100538886C publication Critical patent/CN100538886C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Dram (AREA)

Abstract

本发明公开一种二维数组在DRAM上的快速读写方法,先根据DRAM一行的容量C及数据按行和按列的读写次数比I/J,确定二维数组分成的多个相同大小子矩阵的列数A=(CI/J) 1/2和行数B=(CJ/I) 1/2;在DRAM上按行或列写入二维数组时,将相关的每个A×B子矩阵属于该行或列的数据按顺序分别写在DRAM的一行上;在DRAM上按行或列读取二维数组时,通过地址变化按顺序逐一选择DRAM上相关的行,每次将一行中所有需要的数据读出,再选下一行。本发明DRAM的控制逻辑单元中包括一个地址产生器,由该地址产生器根据参数值产生在DRAM上读写二维数组所需的地址。本发明也可用于多维数组读写,可节省了转置所需的空间和时间,提高读写速度。

Description

多维数组在动态随机存取存储器上的快速读写方法及装置
技术领域
本发明涉及动态随机存取存储器(Dynamic Random Access Memory,缩写为DRAM)的读写方法,尤其涉及二维及二维以上数组在动态随机存取存储器上的读写方法。
背景技术
在当前的计算机应用中,常常要对二维数组进行处理,如图像处理、雷达和声纳数字信号处理、机器视觉与图像跟踪、合成孔径雷达成像、坐标转换等。二维数组目前在计算机的存储系统上一般以一维形式存放的,即从存储系统的物理地址上看,如果二维数组的行方向的数据是连续存放的,则列方向的数据是非连续存放的。这种非连续存放使得对该方向的数据读写不能采用某些速度快的读写方式,如存储器的突发(burst)读写和磁盘的块(block)读写,导致系统整体性能的下降。
传统的解决办法是采用矩阵转置。因为通常二维处理可分解为多次的一维处理,如二维FFT可转换为行列两个方向的一维FFT。在进行列方向处理前,通过转置把非连续存放的列方向数据变成连续存放,使处理时数据的存取速度加快;处理后再通过逆转置转回原来正确的方向。然而转置不仅需要大量的暂存空间,还要占用不少的时间。另外,转置时同样存在读写非连续数据造成读写效率低下的可能。而且某些二维处理并不能分解为多次的一维处理,如图像压缩,它是分块处理,转置对它并不适用。
随着应用的发展,该问题将会越来越严重,因为图像的分辨率将会越来越高,幅面越来越大,其对应的二维数组的规模将不断地增大,给存储器的读写带来很大的压力。虽然存储器的容量增长很快,但它的读写速度却增长缓慢(相对于处理器速度的增长),动态随机存取存储器的读写速度远跟不上处理器的速度增长,成为系统的瓶颈,不得不采用多级缓存(cache)、超线程等技术来弥补。
对二维数组的处理来说,该问题更为严重。因为二维数组的处理往往是数据流型的,即不断地有大量的数据在cache中流入流出,cache中的数据往往只使用几次就会被替换出去,因此cache的命中率不高,cache和DRAM之间的数据交换速度显得很重要。而且这种情况数据之间相关性少,处理时相对简单,程序容易优化,可以使用大量的并行和流水技术来缩短处理的时间,相形之下,数据的读写越发成为系统的瓶颈。因此,提高大型二维数组在DRAM上的存取速度是急待解决的问题。
发明内容
本发明要解决的技术问题是提供一种二维数组在动态随机存取存储器上的快速读写方法,能够明显提高二维数组在动态随机存取存储器上的读写速度。本发明还要提供一种可以实现该方法的动态随机存取存储器。
为了解决上述技术问题,本发明提供了一种二维数组在动态随机存取存储器上的快速读写方法,包括以下步骤:
(a)根据系统中动态随机存取存储器一行能存放的数据个数C以及具体应用中数据按行和按列的读写次数比I/J,确定M×N二维数组划分成的多个相同大小的子矩阵的列数A=(CI/J)1/2和行数B=(CJ/I)1/2
(b)在动态随机存取存储器上按行或按列写入二维数组时,通过地址变化,将与要写入的行或列相关的每个A×B子矩阵属于该行或列的数据按顺序分别写在动态随机存取存储器的一行上,直到写完为止;
(c)在动态随机存取存储器上按行或按列读取二维数组时,通过地址变化,按顺序逐一选择动态随机存取存储器上包含要读取的行或列的数据的行,选中一行时将该行中所有属于要读取行或列的数据读出,再选下一行,直到选完为止。
进一步地,上述快速读写方法还可具有以下特点:所述步骤(a)当计算的A和B的值不是整数时,是取接近计算值的整数,并保证A×B≤C。
进一步地,上述快速读写方法还可具有以下特点:所述步骤(a)当M不能被A整除或N不能被B整除时,是增加二维数组的规模M或N使之能被整除,并且记住原来二维数组的规模,读取时根据原来二维数组的规模舍弃后面添加的无效数据。
进一步地,上述快速读写方法还可具有以下特点:读或写一行时,地址变化如下:将行地址置为该行第一个数的行地址并保持一段时间,在保持期间列地址从该行第一个数的列地址开始递增A-1次,递增值为1或B,逐次将行地址递增M/A-1次,递增值为N/B或1,每次递增后行地址均保持一段时间,在该保持期间列地址始终按相同方式变化。
进一步地,上述快速读写方法还可具有以下特点:读或写一列时,地址变化如下:将行地址置为该行第一个数的行地址并保持一段时间,在保持期间列地址从该行第一个数的列地址开始递增B-1次,相应递增值为A或1,逐次将行地址递增N/B-1次,相应递增值为1或M/A,每次递增后行地址均保持一段时间,在该保持期间列地址按相同方式变化。
进一步地,上述快速读写方法还可具有以下特点:读写一行或一列时,行、列地址由动态随机存取存储器内部的地址产生器按地址变化规则产生的,所需参数:第一个数的行地址、列地址,以及行地址和列地址的递增值和递增次数或者其中的部分参数由外部逻辑单元赋值。
本发明要解决的技术问题是提供一种多维数组在动态随机存取存储器上的快速读写方法,能够明显提高多维数组在动态随机存取存储器上的读写速度。本发明还要提供一种可以实现该方法的动态随机存取存储器。
为了解决上述技术问题,本发明提供了一种多维数组在动态随机存取存储器上的快速读写方法,包括以下步骤:
(a)确定多维数组划分成的多个相同大小的小的多维数组的各维长度,使小的多维数组的各维长度的比例等于原多维数组沿各维方向读写数据的次数比,使小的多维数组的大小等于动态随机存取存储器一行能存放的数据个数;
(b)在动态随机存取存储器上写入多维数组某维上的一排数据时,通过地址变化,将相关的每个小的多维数组属于该排的数据按顺序分别写在动态随机存取存储器的一行上,直到写完为止;
(c)在动态随机存取存储器上读取多维数组某维上的一排数据时,通过地址变化,按顺序逐一选择动态随机存取存储器上包含要读取的数据的行,选中一行时将该行中所有属于要读取的该排的数据读出,再选下一行,直到选完为止。
进一步地,上述快速读写方法还可具有以下特点:假设n维数组在应用中,沿第i维方向读写数据的次数为Ii,(1≤i≤n),假设划分的小的多维数组的第i维的长度为Ai,Ai由下面两个等式算出:
Π i = 1 n A i = C
A1∶A2∶Λ∶An-1∶An=I1∶I2∶Λ∶In-1∶In
如果Ai的值不是整数时,取接近计算值的整数,并保证 Π i = 1 n A i ≤ C .
进一步地,上述快速读写方法还可具有以下特点:假设原n维数组第i维长度为Mi,沿第i维方向读写一排数据时,地址变化如下:将行地址置为该排第一个数的行地址并保持一段时间,在保持期间列地址从该排第一个数的列地址开始递增Ai-1次,递增值为column_index,逐次将行地址递增Mi/Ai-1次,递增值为row_index,每次递增后行地址均保持一段时间,在该保持期间列地址始终按相同方式变化,其中:
column _ index = Π j = 1 i - 1 A j , 且当i=1时,取column_index=1;
row _ index = Π j = i + 1 n ( M j A j ) , 当i=n时,row_index=1。
进一步地,上述快速读写方法还可具有以下特点:读写多维数组某一排时,行、列地址由动态随机存取存储器内部的地址产生器按地址变化规则产生的,所需参数:第一个数的行地址、列地址,以及行地址和列地址的递增值和递增次数,或者其中的部分参数由外部逻辑单元赋值。
本发明提供的一种动态随机存取存储器,包含控制逻辑单元、存储单元阵列和缓存单元,所述控制逻辑单元中包括一个地址产生器,该地址产生器包括保存外部逻辑单元所赋参数值的若干寄存器,根据所述参数值产生在动态随机存取存储器上读写二维或多维数据所需的地址。
进一步地,上述动态随机存取存储器还可具有以下特点:所述地址产生器中包括了初始行地址和初始列地址、行地址和列地址递增值、行地址和列地址递增次数的参数保存或设置单元,与这些单元连接的完成行地址和列地址累加、计数的累加器和计数器,以及输出行地址和列地址的锁存单元。
进一步地,上述动态随机存取存储器还可具有以下特点:所述地址产生器在收到可开始读或写一行或一列数据的信号并完成所述参数设置后,先输出初始行地址和初始列地址,让列地址按其递增值递增设定次数,然后行地址累加上其递增值,再让列地址按相同规则变化,每次在列地址递增了设定次数后对行地址累加一次,直到行地址累加了设定次数后,完成对一行或一列数据的读或写。
进一步地,上述动态随机存取存储器还可具有以下特点:所述缓存单元为乒乓结构的形式,包括两个行缓存,以及分别连接到该两个行缓存一端的两个多路选择器。
进一步地,上述动态随机存取存储器还可具有以下特点:还包括一个带使能端的双路复用器,该双路复用器和动态随机存取存储器控制器之间设有一对握手信号ctrl_ready和data_valid,信号ctrl_ready表示其控制器准备好读写数据,信号data_valid表示动态随机存取存储器可以读写,当前传送的数据有效。
进一步地,上述动态随机存取存储器还可具有以下特点:所述控制逻辑单元与外部之间设有信号set_addr,若信号set_addr为1,表示可设置地址参数寄存器,若set_addr为0,表示可读写数据。
由上可知,本发明根据DRAM的读写规律,克服以往二维或多维数组在DRAM上以一维形式存放的缺点,设计了一种具有新的存放结构的DRAM以及相应的存取方法,使得二维或多维数组的列读写的速度有大幅的提高,而行读写的速度只有微少的降低。列读写和行读写的速度相当,可以免去转置,从而节省系统的存储空间和总的处理时间。
附图说明
图1是DRAM的结构图。
图2是DDR芯片随机读时序。
图3是本发明实施例优化的存放结构的简单示例。
图4是本发明实施例适合二维(多维)数组快速存取的DRAM芯片结构示意。
图5是本发明实施例地址产生器的结构。
具体实施方式
先分析一下DRAM的读写规律。每个DRAM芯片一般有2个或4个bank,每个bank是一个以行列方式组织的存储单元阵列。DRAM访问包括三个部分:行选、列选和precharge(预充电)。行选是给DRAM芯片一个active(激活)命令和行地址,经过tRCD时间,行地址代表的那行数据将被拷到芯片内部的行缓存(row buffer)。列选是根据列地址读写行缓存上的数据。因为列选时读写都在行缓存上,所以速度很快,不管给的列地址是否连续,数据管腿可以一个时钟周期传送一个数(DDR可以一个时钟周期传送两个数),如图1和图2所示,但前提是所要访问的数据在当前打开的DRAM行。如果要访问的数据不在当前打开的DRAM行,则必须插入precharge命令,经过tRP时间,把行缓存上的数据写回bank里相应的位置,再插入active命令打开数据所在的DRAM行,然后才能访问到数据。
目前提高DRAM读写速度的技术,如DDR、DDR2和Rambus,只是提高处理器到DRAM芯片中行缓存的接口速度,使数据总线的一个时钟周期能传多个数据,但因为DRAM的核心部分-bank中的存储单元的结构变化不大,存储单元阵列和行缓存之间交互数据时仍然是一个充放电过程,所以active的延迟tRCD及precharge的延迟tRP很难减少,目前都是20ns左右。因此只有增加DRAM同行读写的概率,尽可能地减少因为异行读写而引起active和precharge的次数,才能提高DRAM的存取效率,DDR和Rambus的技术优势就才能充分显露。
根据上面所述的DRAM读写规律能解释传统以一维方式存放大型二维数组的弊端:二维数组中同一列的各个数据都分散到DRAM的各行,列读写时每读写一个数都必须插入active和precharge操作,以切换不同的DRAM行。传统的存放方式虽然使行读写时DRAM行切换次数最少,但却使列读写时DRAM行切换的次数成倍增加,总的切换次数也就成倍增加。因此必须根据列读写在所有读写中占的比例,让同一列的数据适当集中,使得DRAM行切换的总次数减少,从而减少DRAM访问的总时间,提高DRAM存取的速度。
为此,本实施例采用了以下快速的存取结构:
假设二维数组的规模是M×N(M为列数,N为行数),DRAM一行的存储单元能存C=A×B个数据。先把二维数组划分为(M/A)×(N/B)子矩阵,每个子矩阵大小是A×B(A为列数,B为行数)。存放数据时,保证每个子矩阵存放到DRAM的一行中,而且为了以后存取时地址容易产生,最好按照一定次序存放。
例如,将第(0,0)个子矩阵存在DRAM的第0行,第(0,1)个子矩阵存在DRAM的第1行,...,第(i,j)个子矩阵存在DRAM的第(i*N/B+j)行,其中0≤i≤(M/A)-1,0≤j≤(N/B)-1),...,直到最后的第((M/A)-1,(N/B)-1)个子矩阵存在DRAM的第((M/A)×(N/B)-1)行。图3是一个简单的示例,图中的矩阵是按多个子矩阵的形式表示的。
这种存放方式是通过写地址的有规律变化来实现的,下面将对读写一行或一列的伪码进行详细描述。
假设二维数组中一行或一列的第一个数在DRAM中的行列地址为(row_address[0],column_address[0]),读或写一行的过程的伪码描述如下:
    row_address=row_address[0];//设行地址为该行第一个数的行地址

    for(i=0;i<(M/A);i++)//循环计数值i初始为0,每循环一次i加

                            1,i=M/A时直接退出循环

    {

        active(row_address);//激活当前行

        column_address=column_address[0];//设列地址为该行第一个

                                          数的列地址

        for(j=0;j<A;j++)//循环计数值j初始为0,每循环一次j加1,

                            j=A时直接退出循环

        {

             read_or_write(column_address);//按当前列地址读或写数据

             column_address++;//列地址加1

        }

        precharge;//预充电

        row_address=row_address+(N/B);//行地址加上N/B

    }
用文字简单描述读或写一行时的地址变化如下:将行地址置为该行第一个数的行地址并保持一段时间,在保持期间列地址从该行第一个数的列地址开始递增A-1次,递增值为1,逐次将行地址递增M/A-1次,递增值为N/B,每次递增后行地址均保持一段时间,在该保持期间列地址始终按相同方式变化。按这种读写方式,从存放后DRAM行的顺序看时,是依次放一列上的子矩阵,放完一列后再放下一列,从存放后DRAM行中的数据顺序看,是依次放子矩阵上一行的数据,放完后再放下一行。但本发明不局限于此,也可以让行地址的递增值为1,从存放后DRAM行的顺序看时,相当于是依次放一行上的子矩阵,放完一行后再放下一行;或/及让列地址的递增值为B,从存放后DRAM行中的数据顺序看,相当于是依次放子矩阵上一列的数据,放完后再放下一列。
读或写一列的过程的伪码描述如下:
    row_address=row_address[0];//设行地址为该行第一个数的行地
址

    for(i=0;i<(N/B);i++)//循环计数值i初始为0,每循环一次i加

                            1,i=N/B时直接退出循环

    {
        active(row_address);//激活当前行

        column_address=column_address[0];//设列地址为该行第一个数

                                           的列地址

        for(j=0;j<B;j++)//循环计数值j初始为0,每循环一次j加1,

                           j=B时直接退出循环

        {

            read_or_write(column_address);//按当前列地址读或写数
据

            column_address=column_address+A;//将列地址加A

        }

        precharge;//预充电

        row_address++;//行地址加1

    }
用文字简单描述读或写一列时的地址变化如下:将行地址置为该行第一个数的行地址并保持一段时间,在保持期间列地址从该行第一个数的列地址开始递增B-1次,递增值为A,逐次将行地址递增N/B-1次,递增值为1,每次递增后行地址均保持一段时间,在该保持期间列地址按相同方式变化。该地址变化是对应于上述实施例中的读或写一行的地址变化。在其它可能的情况下,如读或写一行时行地址递增值为1时,相应地,读或写一列时的行地址递增值应为M/A,如读或写一行时列地址递增值为B时,相应地,读或写一列时的列地址递增值应为1。
下面将讨论A和B的值如何设定,才能使发生的行切换active和precharge的总次数最小化。
由上述行和列的读写过程看,读写一行需要打开DRAM的(M/A)行;读写一列需要打开DRAM的(N/B)行。假设处理时二维数组的每个数据要按行读写I次,按列读写J次,则DRAM行切换的总次数为:
Z=(M/A)*N*I+(N/B)*M*J                               (1)
把B=C/A代入,并对A求导得:
dZ/dA=M*N*(J/C-I/A2)
因此A=(CI/J)1/2,B=(CJ/I)1/2时,总次数Z最少。此时A/B=I/J,可见分块矩阵的长宽比最佳等于行列读写次数的比值,跟二维数组的规模M和N值无关。
在实际设计时,A和B必须是整数,因此A不一定取(CI/J)1/2,只要取接近(CI/J)1/2的C的因子即可。DRAM芯片一行的容量C通常是2的幂数,因此A和B也取2的幂数。如果M和N不能分别被A和B整除,只需适当增加二维数组的规模M和N,使之能被整除即可,但在数组扩展时要记住原来二维数组的规模,以区分有效数据和无效数据,读取时根据原来二维数组的规模舍弃后面添加的无效数据。
以二维FFT为例,假设DRAM一行能存C=1024个数据,做行向FFT时,数据按行读1次,写1次,即I=2;做列向FFT时,按列读1次,写1次,即J=2,则A=(CI/J)1/2=32,即每个DRAM能存32×32大小的子矩阵。如果二维数组的规模是16384×16384,则图像分成512×512个大小为32×32的子矩阵,由公式(1),做二维FFT DRAM行切换的总次数Z=16,777,216。如果不采用这种快速存取结构,按传统的方式存放,相当于取A=1024,那么DRAM行切换的总次数Z=268,697,600,是快速存取结构的16倍,可见采用快速存取结构理论上能减少DRAM行切换的次数。
采用上述快速存取方案后地址产生很有规律,如果在DRAM芯片中加入简单的地址产生器,可做成专用于二维(多维)数组快速存取的DRAM芯片。如图4所示,该DRAM芯片包括:包含地址产生器的控制逻辑单元、DRAM存储单元阵列、由两个行缓存和两端的多路选择器构成的乒乓结构形式的缓存单元、双向FIFO缓冲以及带使能端的多路复用器。地址产生器的行地址线连接到DRAM存储单元阵列,列地址线连接到两个行缓存。
地址产生器结构如图5所示,为了使这种DRAM芯片更为灵活,更为通用,包括了初始行地址和初始列地址、行地址和列地址递增值、行地址递增次数等5个参数寄存器,列地址的递增次数根据左边的加法器溢出确定。图中还示出了与这些单元连接的加法器、计数器和锁存器。参数的设置如下表所示:
   表1地址产生器各设置参数说明
  参数   说明
  row_address[0]   起始数据的行地址
  row_index   行地址的递增值
  row_count   行地址的递增次数
  Column_address[0]   起始数据的列地址
  Column_index   列地址的递增值
  column_count   列地址的递增次数
这些参数的设置是根据具体应用编写相应的程序,由CPU或其他有计算能力的逻辑单元执行程序,完成参数计算后写入DRAM的。设好6个参数寄存器后,左右两个锁存器的初始值分别是column_address[0]和row_address[0],即第一个数据的列地址和行地址;左边的累加器先工作,按列地址的递增值依次算出接下来各个数据的列地址,直到达到了设定的列地址递增次数;因而下一个数据不在该DRAM行,将行地址在右边的累加器加上其递增值输出,切换DRAM行,计数器row_count减1。这样每次在列地址递增了设定次数后,使能右边的累加器,计算出下一个行地址,并使计数器row_count减1;如此循环,直到row_count等于0,即行地址累加了设定次数后为止。
根据上述参数,对于上文中的两个伪码描述,均可用以下伪码实现:
    row_address=row_address[0];//设行地址为该行或列起始数据的行地
址

    for(i=0;i<row_count;i++)//循环计数值i初始为0,每循环一次i

                                加1,i等于行地址递增次数时直接退出

                                循环

    {

        active(row_address);//激活当前行

        column_address=column_address[0];//设列地址为该行或列起

                                           始数据的列地址

        for(j=0;j<column_count;j++)//循环计数值j初始为0,每循环

              一次j加1,j等于列地址递增次数时直接退出循环

        {

            read_or_write(column_address);//按当前列地址读或写数
据

            column_address=column_address+column_index;∥将列地址

                                               加上其递增值

        }

        precharge;//预充电

        row_address=row_address+row_index;//将行地址加上其递增值

    }
如此,只要设定相应的参数值,即可完成二维数组的行读写或者列读写。若把row_index和column_index都设为1,即为普通的一维数组的读写。对于多维数组的访问,通过设定相应的参数值能完成对某一维的读写,达到灵活、通用的要求。
考虑到在读写的中途可能会遇到DRAM芯片在刷新、active和precharge等不能读写的状态,因此应在DRAM芯片和DRAM控制器之间添加一对握手信号ctrl_ready和data_valid,该对信号从DRAM控制器连接到DRAM芯片上的带使能端的双路复用器,分别表示DRAM控制器准备好读写数据和DRAM芯片可以读写,当前传送的数据有效。读数时,DRAM芯片只有看到ctrl_ready有效时才往数据线写数,DRAM控制器只有看到data_valid有效时才读数;写数时,DRAM控制器只有看到dara_valid有效时才写数,DRAM芯片只有看到ctrl_ready有效时才读数。
因为通过数据管腿设定参数,有管腿复用的问题,本实施例增加了一个连接到控制逻辑单元的set_addr信号,当ctrl_ready为1时,表示DRAM控制器准备好,若set_addr为1,设置地址参数寄存器,若set_addr为0,读写数据,读写数据时,地址产生器产生相应的行地址和列地址。
另外,为了提高DRAM的读写效率,增加一个行缓存,两个行缓存的两端再分别与一个多路选择器(MUX)相连,形成乒乓结构(Ping-Pong)。当一个行缓存在列读写时,另一个行缓存做precharge、active和刷新。在DRAM芯片的数据接口处适当增加双向FIFO作为缓存。
这样,该DRAM芯片通过数据线设定好地址产生器中各项参数后,地址在DRAM芯片内部产生,一行或一列数据就源源从数据线送出,可以省去地址线,减少DRAM芯片的管腿和PCB板布线,可节省芯片封装成本和PCB板布线成本;DRAM芯片也无需等待地址总线稳定后再读数,接口速度可相应提高。
总的来说,相对于目前市面上普通的DRAM芯片,本实施例适合二维数组快速存储的DRAM芯片具有如下特点和优点:
1)内含地址产生器,以支持本发明提到的二维数组的快速存取技术,工作模式也从原来的给一个地址读写一个数,变成设定若干寄存器读写一串数,使得对二维数组处理时无需转置也有很高的读写速度,对一维数组和多维数组也同样适用。
2)行读写或列读写的地址全部由内部的地址产生器产生,地址管腿可全部省掉,用于区分行访问和列访问的信号管腿CAS#和RAS#也可省掉;减少DRAM芯片的管腿和PCB板布线,可节省成本。
3)增加ctrl_ready和data_valid信号管腿用于握手,增加set_addr信号管脚用于数据管腿复用;
4)增加一个行缓存做Ping-Pong,克服了DRAM芯片在active、precharge和刷新时不能读写的缺点,使之读写速度跟SRAM相同,而容量比SRAM大得多。
设计该DRAM是为了避免二维数组转置的同时,要求二维数组的列方向数据也能快速地存取,以提高处理的速度,因此该DRAM是专用于存取二维数组的,使用时需要有SRAM配合,缓存三维数组的一行或一列的数据。目前高速的DSP和FPGA芯片内部都有SRAM(如TITMS320C6416和Xilinx Vertex II),处理核心对内部SRAM的访问通常有较高的带宽和较低的延迟,而访问外部的DRAM延迟很大,因此高速的处理核心通常不直接处理DRAM上的数据,而是先通过DMA控制器把DRAM的数据读入内部的SRAM,对SRAM的数据处理后,再通过DMA控制器把数据写回DRAM。如此DRAM只起到数据存取的作用,类似于硬盘,因此针对二维数组设计在DRAM上的快速的存取结构和专用的DRAM芯片是合理的。
本发明同样适合于多维数组在DRAM上的快速读写方法,对于三维和三维以上的数组,上述存放结构和地址变化规则也同样适用,只要把多维数组划分为若干小的相同的多维数组,每个小的多维数组存于DRAM中的一行,并按一定次序存放。因此小的多维数组的大小应等于DRAM中一行的容量;并且使小的多维数组的各维长度的比例等于原多维数组沿各维方向读写数据的次数比。具体来说,假设n维数组在应用中,沿第i维方向读写数据的次数为Ii,(1≤i≤n),假设划分的小的多维数组的第i维的长度为Ai,Ai由下面两个等式算出:
Π i = 1 n A i = C - - - ( 2 )
A1∶A2∶Λ∶An-1∶An=I1∶I2∶Λ∶In-1∶In    (3)
如果Ai的值不是整数时,取接近计算值的整数,并保证 Π i = 1 n A i ≤ C .
总的目标也是让读写多维数组时,DRAM行切换总次数最少。
在动态随机存取存储器上写入多维数组某维上的一排数据时,通过地址变化,将相关的每个小的多维数组属于该排的数据按顺序分别写在动态随机存取存储器的一行上,直到写完为止;
在动态随机存取存储器上读取多维数组某维上的一排数据时,通过地址变化,按顺序逐一选择动态随机存取存储器上包含要读取的数据的行,选中一行时将该行中所有属于要读取的该排的数据读出,再选下一行,直到选完为止。
具体的伪码描述和上文中第3个相同,只是6个参数需相应变化。假设原n维数组第i维长度为Mi,沿第i维方向读写一排数据时,地址变化如下:将行地址置为该排第一个数的行地址并保持一段时间,在保持期间列地址从该排第一个数的列地址开始递增Ai-1次,递增值为column_index,逐次将行地址递增Mi/Ai-1次,递增值为row_index,每次递增后行地址均保持一段时间,在该保持期间列地址始终按相同方式变化,其中:
column _ index = Π j = 1 i - 1 A j , 且当i=1时,取column_index=1;
row _ index = Π j = i + 1 n ( M j A j ) , 当i=n时,row_index=1。
读写多维数据某一排时,行、列地址由动态随机存取存储器内部的地址产生器按地址变化规则产生的,所需的参数,即第一个数的行地址、列地址,以及行地址和列地址的递增值和递增次数,或者其中的部分参数由外部逻辑单元赋值。

Claims (16)

1、一种二维数组在动态随机存取存储器上的快速读写方法,包括以下步骤:
(a)根据系统中动态随机存取存储器一行能存放的数据个数C以及具体应用中数据按行和按列的读写次数比I/J,确定M×N二维数组划分成的多个相同大小的子矩阵的列数A=(CI/J)1/2和行数B=(CJ/I)1/2
(b)在动态随机存取存储器上按行或按列写入二维数组时,通过地址变化,将与要写入的行或列相关的每个A×B子矩阵属于该行或列的数据按顺序分别写在动态随机存取存储器的一行上,直到写完为止;
(c)在动态随机存取存储器上按行或按列读取二维数组时,通过地址变化,按顺序逐一选择动态随机存取存储器上包含要读取的行或列的数据的行,选中一行时将该行中所有属于要读取行或列的数据读出,再选下一行,直到选完为止。
2、如权利要求1所述的快速读写方法,其特征在于,所述步骤(a)当计算的A和B的值不是整数时,是取接近计算值的整数,并保证A×B≤C。
3、如权利要求1所述的快速读写方法,其特征在于,所述步骤(a)当M不能被A整除或N不能被B整除时,是增加二维数组的规模M或N使之能被整除,并且记住原来二维数组的规模,读取时根据原来二维数组的规模舍弃后面添加的无效数据。
4、如权利要求1所述的快速读写方法,其特征在于,读或写一行时地址变化如下:将行地址置为该行第一个数的行地址并保持一段时间,在保持期间列地址从该行第一个数的列地址开始递增A-1次,递增值为1或B,逐次将行地址递增M/A-1次,递增值为N/B或1,每次递增后行地址均保持一段时间,在该保持期间列地址始终按相同方式变化。
5、如权利要求4所述的快速读写方法,其特征在于,读或写一列时,地址变化如下:将行地址置为该行第一个数的行地址并保持一段时间,在保持期间列地址从该行第一个数的列地址开始递增B-1次,相应递增值为A或1,逐次将行地址递增N/B-1次,相应递增值为1或M/A,每次递增后行地址均保持一段时间,在该保持期间列地址按相同方式变化。
6、如权利要求4或5所述的快速读写方法,其特征在于,读写一行或一列时,行、列地址由动态随机存取存储器内部的地址产生器按地址变化规则产生的,所需参数:第一个数的行地址、列地址,以及行地址和列地址的递增值和递增次数或者其中的部分参数由外部逻辑单元赋值。
7、一种动态随机存取存储器,包含控制逻辑单元、存储单元阵列和缓存单元,其特征在于,所述控制逻辑单元中包括一个地址产生器,该地址产生器包括保存外部逻辑单元所赋参数值的若干寄存器,根据所述参数值产生在动态随机存取存储器上读写二维或多维数据所需的地址。
8、如权利要求7所述的动态随机存取存储器,其特征在于,所述地址产生器中包括了初始行地址和初始列地址、行地址和列地址递增值、行地址和列地址递增次数的参数保存或设置单元,与这些单元连接的完成行地址和列地址累加、计数的累加器和计数器,以及输出行地址和列地址的锁存单元。
9、如权利要求8所述的动态随机存取存储器,其特征在于,所述地址产生器在收到可开始读或写一行或一列数据的信号并完成所述参数设置后,先输出初始行地址和初始列地址,让列地址按其递增值递增设定次数,然后行地址累加上其递增值,再让列地址按相同规则变化,每次在列地址递增了设定次数后对行地址累加一次,直到行地址累加了设定次数后,完成对一行或一列数据的读或写。
10、如权利要求7所述的动态随机存取存储器,其特征在于,所述缓存单元为乒乓结构的形式,包括两个行缓存,以及分别连接到该两个行缓存一端的两个多路选择器。
11、如权利要求7所述的动态随机存取存储器,其特征在于,还包括一个带使能端的双路复用器,该双路复用器和动态随机存取存储器控制器之间设有一对握手信号ctrl_ready和data_valid,信号ctrl_ready表示其控制器准备好读写数据,信号data_valid表示动态随机存取存储器可以读写,当前传送的数据有效。
12、如权利要求7所述的动态随机存取存储器,其特征在于,所述控制逻辑单元与外部之间设有信号set_addr,若信号set_addr为1,表示可设置地址参数寄存器,若set_addr为0,表示可读写数据。
13、一种多维数组在动态随机存取存储器上的快速读写方法,包括以下步骤:
(a)确定多维数组划分成的多个相同大小的小的多维数组的各维长度,使小的多维数组的各维长度的比例等于原多维数组沿各维方向读写数据的次数比,使小的多维数组的大小等于动态随机存取存储器一行能存放的数据个数;
(b)在动态随机存取存储器上写入多维数组某维上的一排数据时,通过地址变化,将相关的每个小的多维数组属于该排的数据按顺序分别写在动态随机存取存储器的一行上,直到写完为止;
(c)在动态随机存取存储器上读取多维数组某维上的一排数据时,通过地址变化,按顺序逐一选择动态随机存取存储器上包含要读取的数据的行,选中一行时将该行中所有属于要读取的该排的数据读出,再选下一行,直到选完为止。
14、如权利要求13所述的快速读写方法,其特征在于,假设n维数组在应用中,沿第i维方向读写数据的次数为Ii,(1≤i≤n),假设划分的小的多维数组的第i维的长度为Ai,Ai由下面两个等式算出:
Π i = 1 n A i = C
A1∶A2∶Λ∶An-1∶An=I1∶I2∶Λ∶In-1∶In
如果Ai的值不是整数时,取接近计算值的整数,并保证 Π i = 1 n A i = C .
15、如权利要求14所述的快速读写方法,其特征在于,假设原n维数组第i维长度为Mi,沿第i维方向读写一排数据时,地址变化如下:将行地址置为该排第一个数的行地址并保持一段时间,在保持期间列地址从该排第一个数的列地址开始递增Ai-1次,递增值为column_index,逐次将行地址递增Mi/Ai-1次,递增值为row_index,每次递增后行地址均保持一段时间,在该保持期间列地址始终按相同方式变化,其中:
column _ index = Π j = 1 i - 1 A j , 且当i=1时,取column_index=1;
row _ index = Π j = i + 1 n ( M j A j ) , 当i=n时,row_index=1。
16、如权利要求15所述的快速读写方法,其特征在于,读写多维数组某一排时,行、列地址由动态随机存取存储器内部的地址产生器按地址变化规则产生的,所需参数:第一个数的行地址、列地址,以及行地址和列地址的递增值和递增次数,或者其中的部分参数由外部逻辑单元赋值。
CNB200510051442XA 2005-03-04 2005-03-04 多维数组在动态随机存取存储器上的快速读写方法和装置 Expired - Fee Related CN100538886C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB200510051442XA CN100538886C (zh) 2005-03-04 2005-03-04 多维数组在动态随机存取存储器上的快速读写方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB200510051442XA CN100538886C (zh) 2005-03-04 2005-03-04 多维数组在动态随机存取存储器上的快速读写方法和装置

Publications (2)

Publication Number Publication Date
CN1828773A true CN1828773A (zh) 2006-09-06
CN100538886C CN100538886C (zh) 2009-09-09

Family

ID=36947092

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200510051442XA Expired - Fee Related CN100538886C (zh) 2005-03-04 2005-03-04 多维数组在动态随机存取存储器上的快速读写方法和装置

Country Status (1)

Country Link
CN (1) CN100538886C (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102023944A (zh) * 2010-12-18 2011-04-20 浙江大学 一种存储器多模访问控制方法及其片上sram存储器控制系统
CN102279726A (zh) * 2010-06-11 2011-12-14 联芯科技有限公司 一种对数据的寻址控制方法和装置
CN103226487A (zh) * 2013-04-25 2013-07-31 中国人民解放军信息工程大学 面向异构众核多级存储结构的数据分布与局部性优化方法
CN103677655A (zh) * 2012-09-26 2014-03-26 北京信威通信技术股份有限公司 一种二维数组数据流在存储器上的读写方法及装置
CN104679690A (zh) * 2015-01-22 2015-06-03 中国人民解放军国防科学技术大学 用于gpdsp的基于乒乓机制支持数据乱序返回的dma矩阵转置传输方法
CN105431831A (zh) * 2014-02-17 2016-03-23 联发科技股份有限公司 数据存取方法和利用相同方法的数据存取装置
CN106909320A (zh) * 2017-02-20 2017-06-30 北京中科睿芯科技有限公司 一种多维数据扩充传输的方法、装置以及系统
CN107908427A (zh) * 2011-12-23 2018-04-13 英特尔公司 用于多维数组中的元素偏移量计算的指令
CN108509386A (zh) * 2018-04-19 2018-09-07 武汉轻工大学 生成可逆模m矩阵的方法和装置
CN112631545A (zh) * 2020-12-21 2021-04-09 北京时代民芯科技有限公司 一种高速fifo存储器
CN114721983A (zh) * 2022-04-13 2022-07-08 山东浪潮科学研究院有限公司 一种ddr4加速读写装置
WO2022161147A1 (zh) * 2021-01-27 2022-08-04 华为技术有限公司 译码方法、装置、设备以及计算机可读存储介质
CN115373645A (zh) * 2022-10-24 2022-11-22 济南新语软件科技有限公司 一种基于可动态定义的复杂数据包操作方法及系统
CN115185859B (zh) * 2022-09-13 2023-06-27 北京天地一格科技有限公司 一种雷达信号处理系统及低延迟矩阵转置处理装置和方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5293596A (en) * 1990-02-21 1994-03-08 Matsushita Electric Industrial Co., Ltd. Multidimensional address generator and a system for controlling the generator
JPH10144071A (ja) * 1996-11-01 1998-05-29 Oki Electric Ind Co Ltd 半導体記憶装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279726A (zh) * 2010-06-11 2011-12-14 联芯科技有限公司 一种对数据的寻址控制方法和装置
CN102279726B (zh) * 2010-06-11 2013-06-19 联芯科技有限公司 一种对数据的寻址控制方法和装置
CN102023944A (zh) * 2010-12-18 2011-04-20 浙江大学 一种存储器多模访问控制方法及其片上sram存储器控制系统
CN107908427A (zh) * 2011-12-23 2018-04-13 英特尔公司 用于多维数组中的元素偏移量计算的指令
CN103677655A (zh) * 2012-09-26 2014-03-26 北京信威通信技术股份有限公司 一种二维数组数据流在存储器上的读写方法及装置
CN103226487A (zh) * 2013-04-25 2013-07-31 中国人民解放军信息工程大学 面向异构众核多级存储结构的数据分布与局部性优化方法
CN103226487B (zh) * 2013-04-25 2016-01-13 中国人民解放军信息工程大学 面向异构众核多级存储结构的数据分布与局部性优化方法
CN105431831A (zh) * 2014-02-17 2016-03-23 联发科技股份有限公司 数据存取方法和利用相同方法的数据存取装置
CN105431831B (zh) * 2014-02-17 2018-10-02 联发科技股份有限公司 数据存取方法和利用相同方法的数据存取装置
CN104679690A (zh) * 2015-01-22 2015-06-03 中国人民解放军国防科学技术大学 用于gpdsp的基于乒乓机制支持数据乱序返回的dma矩阵转置传输方法
CN106909320B (zh) * 2017-02-20 2020-01-21 北京中科睿芯科技有限公司 一种多维数据扩充传输的方法、装置以及系统
CN106909320A (zh) * 2017-02-20 2017-06-30 北京中科睿芯科技有限公司 一种多维数据扩充传输的方法、装置以及系统
CN108509386A (zh) * 2018-04-19 2018-09-07 武汉轻工大学 生成可逆模m矩阵的方法和装置
CN108509386B (zh) * 2018-04-19 2022-04-08 武汉轻工大学 生成可逆模m矩阵的方法和装置
CN112631545A (zh) * 2020-12-21 2021-04-09 北京时代民芯科技有限公司 一种高速fifo存储器
WO2022161147A1 (zh) * 2021-01-27 2022-08-04 华为技术有限公司 译码方法、装置、设备以及计算机可读存储介质
CN114721983A (zh) * 2022-04-13 2022-07-08 山东浪潮科学研究院有限公司 一种ddr4加速读写装置
CN114721983B (zh) * 2022-04-13 2023-06-16 山东浪潮科学研究院有限公司 一种ddr4加速读写装置
CN115185859B (zh) * 2022-09-13 2023-06-27 北京天地一格科技有限公司 一种雷达信号处理系统及低延迟矩阵转置处理装置和方法
CN115373645A (zh) * 2022-10-24 2022-11-22 济南新语软件科技有限公司 一种基于可动态定义的复杂数据包操作方法及系统
CN115373645B (zh) * 2022-10-24 2023-02-03 济南新语软件科技有限公司 一种基于可动态定义的复杂数据包操作方法及系统

Also Published As

Publication number Publication date
CN100538886C (zh) 2009-09-09

Similar Documents

Publication Publication Date Title
CN1828773A (zh) 多维数组在动态随机存取存储器上的快速读写方法及装置
CN104699631B (zh) Gpdsp中多层次协同与共享的存储装置和访存方法
US9836277B2 (en) In-memory popcount support for real time analytics
Jing et al. An energy-efficient and scalable eDRAM-based register file architecture for GPGPU
CN101556534A (zh) 一种众核结构的大规模数据并行计算方法
Xia et al. DWC: Dynamic write consolidation for phase change memory systems
CN110647719B (zh) 基于fpga的三维fft计算装置
US20210382691A1 (en) In-Memory Near-Data Approximate Acceleration
Syu et al. High-endurance hybrid cache design in CMP architecture with cache partitioning and access-aware policy
CN109408411A (zh) 基于数据访问次数的GPGPU的L1 Cache管理方法
CN105393210A (zh) 用于模拟共享存储器结构的存储器单元
WO2013097236A1 (zh) 多粒度并行fft计算装置
WO2013097228A1 (zh) 多粒度并行存储系统
US8825729B1 (en) Power and bandwidth efficient FFT for DDR memory
Ma et al. An efficient direct memory access (DMA) controller for scientific computing accelerators
US9268744B2 (en) Parallel bit reversal devices and methods
Wang et al. MAC: Memory access coalescer for 3D-stacked memory
Tanabe et al. A memory accelerator with gather functions for bandwidth-bound irregular applications
Okamoto et al. Fabcache: Cache design automation for heterogeneous multi-core processors
CN104317554B (zh) 用于simd处理器的寄存器文件数据读写装置和方法
US20230195624A1 (en) Cache Memory with Randomized Eviction
Chen et al. Optimal dynamic data layouts for 2D FFT on 3D memory integrated FPGA
Chen et al. DRAM row activation energy optimization for stride memory access on FPGA-based systems
Li et al. CCC: crossbar connected caches for reducing energy consumption of on-chip multiprocessors
Zhang et al. Small area high speed configurable FFT processor

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: XIAOSHAN INDUSTRY INSTITUTE

Free format text: FORMER OWNER: INSTITUTE OF COMPUTING TECHNOLOGY, CHINESE ACADEMY OF SCIENCES

Effective date: 20130402

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100080 HAIDIAN, BEIJING TO: 311215 HANGZHOU, ZHEJIANG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20130402

Address after: 311215, Hangzhou, Zhejiang province Xiaoshan District, Ning Town, civilization Road, No. 328, Jiangning building, east block, 7 floor

Patentee after: XIAOSHAN INDUSTRY RESEARCH INSTITUTE

Address before: 100080 Haidian District, Zhongguancun Academy of Sciences, South Road, No. 6, No.

Patentee before: Institute of Computing Technology, Chinese Academy of Sciences

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090909

Termination date: 20160304