CN103116555A

CN103116555A - 基于多体并行缓存结构的数据访问方法

Info

Publication number: CN103116555A
Application number: CN2013100698659A
Authority: CN
Inventors: 徐金波; 董德尊; 赖明澈; 陆平静; 王绍刚; 徐炜遐; 肖立权; 庞征斌; 王克非; 夏军; 童元满; 陈虎; 张峻; 齐星云; 王桂彬; 常俊胜; 张建民; 罗章
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2013-03-05
Filing date: 2013-03-05
Publication date: 2013-05-22
Anticipated expiration: 2033-03-05
Also published as: CN103116555B

Abstract

一种基于多体并行缓存结构的数据访问方法，步骤为：(1)、将数据存入主存储器M；二维Cache阵列C以二维矩阵形式组织，记Cache体的个数为a×b个；(2)、处理部件P将所需a×b数据块的虚拟地址发送到地址映射表AT，地址映射表AT将虚拟地址转换为a×b数据块中每个数据在二维Cache阵列C的相应体中的物理地址；(3)、将步骤(2)得到的物理地址并行发送到二维Cache阵列C中的a×b个体，将a×b数据块的所有数据从二维Cache阵列C中并行读出，送入处理部件P；(4)、地址映射表更新部件ATU负责对地址映射表AT的表项进行更新。本发明可保证访存地址灵活性和高带宽，提高数据存取效率，降低存储层次间的数据传输次数和传输延迟。

Description

基于多体并行缓存结构的数据访问方法

技术领域

本发明主要涉及到缓存结构的设计领域，特指一种基于多体并行缓存结构的数据访问方法。

背景技术

在计算机结构中，存储系统负责存储数据、以及接收并处理其它计算机部件对数据的访问请求。存储系统的设计技术与处理器结构的演进同步发展，以减小访问延迟、提高访问效率，从而匹配处理器的能力和需求。存储系统可以采用多体并行或多体交叉并行存储技术以适应程序访存的顺序特性，或者采用宽字访问、顺序交叉访问主存模块的方式以获得高访存带宽，又或者基于程序访存的时间局部性和空间局部性原理构造层次存储器系统，使层次系统的速度接近最高一级存储器的速度，容量和价格接近最低一级存储器的容量和价格。

层次存储器结构通过设计存储器之间数据块的映射机制、数据块的替换算法以及数据一致性的维护策略来实现对数据的高效调度。

基于程序访问的局部性特点把存储器组织成层次结构，在较高层次的存储器中存放进程空间局部性和时间局部性所确定的工作集，从而支持程序的运行并有较高的命中率和效率。记程序x的虚拟地址空间为V_x＝{0，1，...，n-1}，在[t，t+Δ]期间访问的虚地址空间或工作集为W(t，Δ)，则W(t，Δ)是进程运行时间的函数，且|W(t，Δ)|＜＜|V_x|。利用程序访存的局部性原理，把程序x的虚拟地址V_x＝{0，1，...，n-1}与Cache的子集M_x的物理地址M_x＝{0，1，...，m-1}动态建立映射关系，即提供一种机制，将程序在[t，t+Δ]期间所要访问V_x中的局部地址即工作集W(t，Δ)按照映射关系f_x：V_x→M_x∪M从主存M调入M_x中，Cache中的M_x即可支持程序x的运行。

当访问Cache失效时，从主存M中调入失效单元所在的数据块到Cache中进行数据更新或替换。随机替换策略从Cache中随机选取一个数据块进行替换；先进先出策略会替换Cache中最早调入的数据块；最常用的近期最少使用策略(Least Recently Used，LRU)则记录近期每块被访问情况，用计数器定量反映未被访问的时间，计数值最大的数据块将被替换。

层次存储系统不同层次之间的数据集具有包含关系。当一级Cache的数据块由于写操作而更新时，通过数据一致性维护策略来保证读取任何一级存储器都能获得最新的结果。可以通过写通过法和写回法保证存储器数据的一致性，写通过法在更新Cache的同时对主存也进行更新，写回法则只在进行块替换时才将块内容集中写回主存。

发明内容

本发明要解决的技术问题就在于：针对现有技术存在的技术问题，本发明提供一种能够保证访存地址灵活性和高带宽、可避免存储体的访存冲突、提高存储器数据存取效率、降低存储层次间的数据传输次数和传输延迟的基于多体并行缓存结构的数据访问方法。

为解决上述技术问题，本发明采用以下技术方案：

一种基于多体并行缓存结构的数据访问方法，当处理某个数据W(t，Δ)时，该数据将以每次访存W字节的传输速度从主存储器M读出并写入二维Cache阵列C；其步骤为：

(1)、将数据存入主存储器M；所述二维Cache阵列C以二维矩阵形式组织，记Cache体的个数为a×b个，二维Cache阵列C位于主存储器M和处理部件P之间，记二维Cache阵列C和主存储器M之间的带宽为W字节，二维Cache阵列C和处理部件P之间的带宽为a×b字节；

(2)、处理部件P将所需a×b数据块的虚拟地址发送到地址映射表AT，地址映射表AT将虚拟地址转换为a×b数据块中每个数据在二维Cache阵列C的相应体中的物理地址；

(3)、将步骤(2)得到的物理地址并行发送到二维Cache阵列C中的a×b个体，从而将a×b数据块的所有数据从二维Cache阵列C中并行读出，送入处理部件P；

(4)、在将数据由主存储器M向二维Cache阵列C传送时，地址映射表更新部件ATU对地址映射表AT的表项进行更新。

作为本发明的进一步改进：

所述步骤(1)的具体步骤为：

(1.1)数据划分：初始时，程序x的虚拟地址空间V_x保存在线性编址且字长为W字节的主存储器M中，大小为A×B，将V_x划分为

个a×b矩形数据块；

(1.2)数据选择：对于数据W(t，Δ)，选定它的以a×b数据块为单位的矩形闭包L；

(1.3)存储体映射：定义L中任意位置(i，j)的a×b数据块B(i，j)为：

B(i，j)＝{I(i+p，j+q)|0≤p≤a，0≤q≤b}，i_L≤i≤i′_L-a，j_L≤j≤j′_L-b，

其中，(i_L，j_L)和(i′_L，j′_L)分别为矩形闭包L左上角和右下角元素在V_x中的坐标；通过一个存储体分配函数m_p，q(i，j)来描述V_x中(i，j)位置的数据与二维Cache阵列C中某个Cache体(p，q)的映射关系，其中0≤p＜a，0≤q＜b，把存储体分配函数m_p，q(i，j)分割为两个正交的函数m_p(i)和m_q(j)，对于某个体(p，q)：

m_p(i)＝(i-p)moda， (1a)

m_q(j)＝(j-q)modb. (1b)

(i，j)保存在使m_p(i)和m_q(j)均为0的存储体(p，q)中；

(1.4)地址映射：通过寻址机制确定B(i，j)在每个体中的偏移地址。

所述步骤(1.4)的具体步骤为：

(1.4.1)虚拟地址计算：首先确定B(i，j)的虚拟地址，通过虚拟地址计算函数A_p，q(i，j)确定B(i，j)中每个元素在某个体(p，q)中的虚拟地址，把该函数分割为两个正交的函数A_p(i)和A_q(j)：

A_p(i)＝idiva-i_Ldiva+c_i， (2a)

A_q(j)＝jdivb-j_Ldivb+c_j， (2b)

其中，

c_{i} = \{\begin{matrix} 1, & i \mod a > p \\ 0, & otherwise . \end{matrix}

c_{j} = \{\begin{matrix} 1, & j \mod b > q \\ 0, & otherwise . \end{matrix};

(1.4.2)虚拟地址转换为物理地址：通过对地址映射表AT进行查找操作T(A_p(i)，A_q(j))将虚拟地址转换为对应的物理地址。

所述步骤(2)的具体步骤为：

(2.1)地址映射表划分：将地址映射表AT划分成以2×2矩阵形式组织的4个子表，用来并行地把每个a×b数据块对应的共4个虚拟地址映射为物理地址；地址映射表AT中元素的个数与单个Cache体的容量相同，称imoda＝0且jmodb＝0的a×b数据块为对齐数据块，处于同一个对齐数据块内的所有元素具有相同的虚拟地址(i_A，j_A)＝(idiva-i_Ldiva，jdivb-j_Ldivb)，其中i_L≤i≤i′_L-a，j_L≤j≤j′_L-b，

0 \leq i_{A} \leq \frac{i_{L}^{'} - i_{L}}{a} - 1,

0 \leq j_{A} \leq \frac{j_{L}^{'} - j_{L}}{b} - 1;

将虚拟地址数组(i_A，j_A)看成大小为

\frac{i_{L}^{'} - i_{L}}{a} \times \frac{j_{L}^{'} - j_{L}}{b}

的二维矩阵，与这些虚拟地址对应的地址映射表项分布在4个AT子表中；

(2.2)地址映射表子表定位：使用子表分配函数m′_p，q′(i_A，j_A)将虚拟地址(i_A，j_A)映射到某个子表(p′，q′)上，其中0≤p′＜2，0≤q′＜2；把该函数分割为两个正交的函数m′_p′(i_A)和m′_q′(j_A)，对于每个子表(p′，q′)：

m′_P′(i_A)＝(i_A-p′)mod2 (3a)

m′_q′(j_A)＝(j_A-q′)mod2 (3b)

(2.3)地址映射表子表寻址：通过子表寻址函数A′_p′，q′(i_A，j_A)确定虚拟地址(i_A，j_A)在子表(p′，q′)中所对应的偏移地址：

其中，

c_{i_{A}} = \{\begin{matrix} 1, & i_{A} \mod 2 > p^{'} \\ 0, & otherwise . \end{matrix}

c_{j_{A}} = \{\begin{matrix} 1, & j_{A} \mod 2 > q^{'} \\ 0, & otherwise . \end{matrix}

A′_p，q′(i_A，j_A)中所保存的信息即为物理地址信息。

与现有技术相比，本发明的优点在于：

1、本发明可以对位于W(t，Δ)内任意位置固定大小的矩形数据块进行无冲突并行存取。因此能够保证访存地址灵活性和高带宽的同时避免存储体的访存冲突，提高对存储器数据的存取效率，降低存储层次问的数据传输次数和传输延迟。

2、本发明的寻址机制是基于一个地址映射表结构对多个Cache体进行动态寻址，而不是基于传统的固定寻址函数，在保证编址一致性的前提下提高了不同W(t，Δ)之间数据的重用性。由于地址映射表内容对于不同W(t，Δ)是实时更新的，因此该寻址机制保证了W(t，Δ)随时间发生变化时Cache体内数据的实时更新。

附图说明

图1是应用本发明方法后的多体并行Cache结构示意图。

图2是基于地址映射表AT的Cache地址映射结构示意图。

图3是地址映射表AT的更新机制的原理示意图。

图4是二维Cache阵列C与主存储器M的接口以及地址映射表更新部件ATU的结构示意图。

具体实施方式

以下将结合说明书附图和具体实施例对本发明做进一步详细说明。

如图1所示，为应用本发明方法后的多体并行Cache结构示意图，该多体并行Cache结构包括主存储器M、二维Cache阵列C、地址映射表AT、地址映射表更新部件ATU以及处理部件P。二维Cache阵列C以二维矩阵形式组织，记Cache体的个数为a×b个，二维Cache阵列C位于主存储器M和处理部件P之间，记二维Cache阵列C和主存储器M之间的带宽为W字节，二维Cache阵列C和处理部件P之间的带宽为a×b字节。地址映射表AT与二维Cache阵列C和处理部件P均相连。

在处理某个W(t，Δ)时，数据将会以每次访存W字节的传输速度从主存储器M读出并写入二维Cache阵列C中。处理部件P将所需a×b数据块的虚拟地址发送到地址映射表AT，地址映射表AT将虚拟地址转换为a×b数据块中每个数据在二维Cache阵列C的相应体中的物理地址，然后将这些物理地址并行发送到二维Cache阵列C中的a×b个体，从而将a×b数据块的所有数据从二维Cache阵列C中并行读出，送入处理部件P。地址映射表更新部件ATU与地址映射表AT连接，对于每个W(t，Δ)，在将数据由主存储器M向二维Cache阵列C传送时，地址映射表更新部件ATU负责对地址映射表AT的表项进行更新。

在具体应用实例中，本发明的基于多体并行缓存结构的数据访问方法，其具体执行流程为：

1、对于某个W(t，Δ)，将数据存入二维Cache阵列C。

1.1.数据划分：初始时，程序x的虚拟地址空间V_x保存在线性编址且字长为W字节的主存储器M中，大小为A×B。将V_x划分为

个a×b矩形数据块。

1.2.数据选择：对于工作集W(t，Δ)，选定它的以a×b数据块为单位的矩形闭包L。

1.3.存储体映射：定义L中任意位置(i，j)的a×b数据块B(i，j)为：

其中，(i_L，j_L)和(i′_L，j′_L)分别为矩形闭包L左上角和右下角元素在V_x中的坐标。本发明通过一个存储体分配函数m_p，q(i，j)来描述V_x中(i，j)位置的数据与二维Cache阵列C中某个Cache体(p，q)(0≤p＜a，0≤q＜b)的映射关系。把存储体分配函数m_p，q(i，j)分割为两个正交的函数m_p(i)和m_q(j)，对于某个体(p，q)：

m_p(i)＝(i-p)moda， (1a)

m_q(j)＝(j-q)modb. (1b)

(i，j)保存在使m_p(i)和m_q(j)均为0的存储体(p，q)中。

1.4.地址映射：本发明通过一种寻址机制确定B(i，j)在每个体中的偏移地址。

1.4.1.虚拟地址计算：首先确定B(i，j)的虚拟地址，通过虚拟地址计算函数A_p，q(i，j)确定B(i，j)中每个元素在某个体(p，q)中的虚拟地址，把该函数分割为两个正交的函数A_p(i)和A_q(j)：

A_p(i)＝idiva-i_Ldiva+c_i， (2a)

A_q(j)＝jdivb-j_Ldivb+c_j， (2b)

其中，

c_{i} = \{\begin{matrix} 1, & i \mod a > p \\ 0, & otherwise . \end{matrix}

c_{j} = \{\begin{matrix} 1, & j \mod b > q \\ 0, & otherwise . \end{matrix}

1.4.2.虚拟地址转换为物理地址：通过对地址映射表AT进行查找操作T(A_p(i)，A_q(j))将虚拟地址转换为对应的物理地址。

2、处理部件P将所需a×b数据块的虚拟地址发送到地址映射表AT，地址映射表AT将虚拟地址转换为a×b数据块中每个数据在二维Cache阵列C的相应体中的物理地址。

2.1.地址映射表划分：将地址映射表AT划分成以2×2矩阵形式组织的4个子表，用来并行地把每个a×b数据块对应的共4个虚拟地址映射为物理地址。地址映射表AT中元素的个数与单个Cache体的容量相同。称imoda＝0且jmodb＝0的a×b数据块为对齐数据块，处于同一个对齐数据块内的所有元素具有相同的虚拟地址(i_A，j_A)＝(idiva-i_Ldiva，jdivb-j_Ldivb)，其中i_L≤i≤i′_L-a，j_L≤j≤j′_L-b，

0 \leq i_{A} \leq \frac{i_{L}^{'} - i_{L}}{a} - 1,

0 \leq j_{A} \leq \frac{j_{L}^{'} - j_{L}}{b} - 1 .

将虚拟地址数组(i_A，j_A)看成大小为

\frac{i_{L}^{'} - i_{L}}{a} \times \frac{j_{L}^{'} - j_{L}}{b}

的二维矩阵，与这些虚拟地址对应的地址映射表项分布在4个AT子表中。

2.2.地址映射表子表定位：使用子表分配函数m′_p′，q′(i_A，j_A)将虚拟地址(i_A，j_A)映射到某个子表(p′，q′)上，其中0≤p′＜2，0≤q′＜2。把该函数分割为两个正交的函数m′_p′(i_A)和m′_q′(j_A)，对于每个子表(p′，q′)：

m′_p′(i_A)＝(i_A-p′)mod2 (3a)

m′_q′(j_A)＝(j_A-q′)mod2 (3b)

2.3.地址映射表子表寻址：通过子表寻址函数A′_p′，q′(i_A，j_A)确定虚拟地址(i_A，j_A)在子表(p′，q′)中所对应的偏移地址：

其中，

c_{i_{A}} = \{\begin{matrix} 1, & i_{A} \mod 2 > p^{'} \\ 0, & otherwise . \end{matrix}

c_{j_{A}} = \{\begin{matrix} 1, & j_{A} \mod 2 > q^{'} \\ 0, & otherwise . \end{matrix}

A′_p′，q′(i_A，j_A)中所保存的信息即为物理地址信息。

3、将这些物理地址并行发送到二维Cache阵列C中的a×b个体，从而将a×b数据块的所有数据从二维Cache阵列C中并行读出，送入处理部件P。

如图2所示，为基于地址映射表AT的Cache地址映射结构示意图。在访问一个a×b数据块B(i，j)时，

3.1.首先计算虚拟地址(i_A，j_A)；

3.2.然后根据上述公式(4)计算A′_p′，q′(i_A，j_A)，A′_p′，q′(i_A，j_A)可以表示成i方向和j方向的两个函数的和，即A′_p′，q′(i_A，j_A)＝Ai′_p′(i_A)+Aj′_q′(j_A)。4个子表的地址通过图2中上半部分所示的结构产生；

3.3.每个子表从地址A′_p′，q′(i_A，j_A)处输出对应虚拟地址i_A，j_A)的物理地址。全部4个物理地址被送入一个由4个4路选择器所组成的分配器，该分配器决定哪一个物理地址应该送入哪一个Cache存储体。对于分配器的控制，首先使用地址映射表AT的子表分配函数R′_i(i_A)＝i_Amod2和R′_j(j_A)＝j_Amod2以及二维Cache阵列C的模块分配函数R_i(i)＝imoda和R_j(j)＝jmodb计算出B(i，j)的左上角元素(i，j)所对应的子表以及该元素所在的Cache存储体，进而判断出地址映射表AT中子表与Cache存储体之间的对应关系，从而控制物理地址信号的路由。

3.4.B(i，j)的a×b个元素从a×b个存储体中并行读出后，图2中所示的由多个多路选择器组成的shuffle部件将输出的a×b个数值重新排列成正确的顺序。shuffle部件的控制方式类似于分配器的控制方式，由R_i(i)和R_j(j)控制。

4、在将数据由主存储器M向二维Cache阵列C传送时，地址映射表更新部件ATU负责对地址映射表AT表项进行更新。

如图3所示，为地址映射表AT的更新机制的原理示意图。对于两个工作集W(t0，Δ0)和W(t1，Δ1)的矩形数据块闭包L₀和L₁，当L₀中的数据已经保存在C中，P开始对L₁进行处理时，只将L₁中与L₀没有重叠的数据从M写入C，而重叠数据不进行替换。同时，对AT的内容进行更新。AT中的每个元素包含三个数据域：i_AT、j_AT与addr_phy，其中i_AT和j_AT表示当前元素的虚拟地址所对应数据在V_x中的坐标，addr_phy为该数据在C存储体中的物理地址。

记L₀、L₁以及它们的重叠区域左上角与右下角的坐标为(i_L0，j_L0)、(i′_L0，j′_L0)、(j_L1，j_L1)、(i′_L1，j′_L1)、(i_C，j_C)和(i′_C，j′_C)，对于L₁中的每个对齐数据块B(i，j)：

●如果B(i，j)不是重叠数据块，将B(i，j)中的数据写入C的a×b个存储体。

■在数据传送之前，在每个C存储体中找出具有相同偏移量的空闲地址，空闲地址是指没有保存重叠区域数据的地址。通过判断尚未更新的AT中某个元素的i_AT和j_AT信息与(i_C，j_C)和(i′_C，j′_C)的位置关系来确定该元素对应的物理地址addr_phy是否为空闲地址。如果i_C≤i_AT＜i′_C，并且j_C≤j_AT＜j′_C，那么对应的addr_phy不是空闲地址；否则，是空闲地址。

■一旦确定一个空闲地址，就开始并行的向C中每个存储体的该空闲地址写入B(i，j)中的一个数据。同时，对AT进行更新，更新方式如下：新的i_AT＝i、j_AT＝j和addr_phy被写入AT中一个新的根据公式(3a)、(3b)、(4)计算出的地址，计算时公式中的(i_L0，j_L0)和(i′_L0，j′_L0)被替换为(i_L1，j_L1)和(i′_L1，j′_L1)；

●如果B(i，j)是重叠数据块，则不传送B(i，j)中的数据，只将地址映射表AT中对应于i_AT＝i和j_AT＝j的元素写入一个根据公式(3a)、(3b)、(4)计算出的新地址。

如图4所示，为二维Cache阵列C与主存储器M的接口以及地址映射表更新部件ATU的结构示意图。本发明中构建双AT结构：Table0和Table1来解决在地址映射表AT更新过程中由于AT中元素的地址迁移导致的写后读相关问题。每个AT结构拥有独立的读写控制电路，为了便于说明，图4中在Table0上只注明读控制电路，在Table1中只注明写控制电路。当L₀已处理完毕，开始对L₁进行处理时，二维Cache阵列C中保存的是L₀中的数据，而其中一个AT(假定为Table0)中保存对应的地址映射信息。该结构的工作流程如下：

(1).对于Table0，Rd_Addr_Gen部件在Next_En信号的控制下，每次产生一个地址，每4次令地址加1，从而在4个Table0子表中依次循环读取结点数据，MUX部件从Table0输出的数据中每次选择一个送入FIFO保存。

(2).在准备处理L₁中一个对齐数据块B(i，j)时，首先检查FIFO的状态，若FIFO不空，则从FIFO中读出一个AT表项，将其送入Addr_Info_Updater部件，该部件将AT表项中的(i_AT，j_AT)同(i_C，j_C)和(i′_C，j′_C)进行比较，判断该AT表项所指向的物理地址addr_phy是否为空闲地址。

(2.1).如果addr_phy不是空闲地址，将B(i，j)的处理过程挂起，转而处理B(i_AT，j_AT)。B(i_AT,j_AT)已保存在二维Cache阵列C中，不需要重新传送，只将Table0中的对应表项Addr_Info写入Table1中的一个新地址。Addr_Info_Updater部件将i_AT和j_AT送入Table1的地址计算部件生成写地址。写使能信号Wr_En用来对写操作进行控制。B(i，j)维持挂起状态直到找到一个可用的空闲地址。

(2.2).如果addr_phy是空闲地址，MM_Addr_Gen部件根据(i，j)信息生成读地址Rd_Addr送入主存储器M，从主存储器M中将B(i，j)数据读出。同时，Addr_Info_Updater部件和MM_Addr_Gen部件一起生成写使能信号Wr_En控制B(i，j)的写操作。AT的更新过程也同时进行：用i和j替换掉i_AT和j_AT完成AT表项Addr_Info的更新，i和j同时送入Table1的地址计算部件生成写地址。

(3).对于对齐数据块B(i，j)，MM_Addr_Gen部件通常顺序生成(a·b/W)个主存储器M地址。V_x在主存储器M中以线性方式顺序保存，这(a·b/W)个地址的定义为：

A_MM(i，j)＝(i+k)·B+j+l·W， (5)

其中，k＝0，1，...，a-1；读出的数据被并行写入二维Cache阵列C的如下存储体中：

(p，q)＝(k，l·W)，(k，l·W+1)，...，(k，l·W+W-1) (6)

且地址相同，均为addr_phy。

(4).在数据传送与AT更新过程完成后，Table1成为活动AT。在以后的不同W(t，Δ)的处理过程中，Table0和Table1交替成为活动AT。

以上仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，应视为本发明的保护范围。

Claims

1.一种基于多体并行缓存结构的数据访问方法，当处理某个数据W(t，Δ)时，该数据将以每次访存W字节的传输速度从主存储器M读出并写入二维Cache阵列C，其特征在于，步骤为：

2.根据权利要求1所述的基于多体并行缓存结构的数据访问方法，其特征在于，所述步骤(1)的具体步骤为：

个a×b矩形数据块；

m_p(i)＝(i-p)moda， (1a)

m_q(j)＝(j-q)modb. (1b)

(i，j)保存在使m_p(i)和m_q(j)均为0的存储体(p，q)中；

3.根据权利要求2所述的基于多体并行缓存结构的数据访问方法，其特征在于，所述步骤(1.4)的具体步骤为：

A_p(i)＝idiva-i_Ldiva+c_i， (2a)

A_q(j)＝jdivb-i_Ldivb+c_j， (2b)

其中，

c_{i} = \{\begin{matrix} 1, & i \mod a > p \\ 0, & otherwise . \end{matrix}

c_{j} = \{\begin{matrix} 1, & j \mod b > q \\ 0, & otherwise . \end{matrix};

4.根据权利要求1或2或3所述的基于多体并行缓存结构的数据访问方法，其特征在于，所述步骤(2)的具体步骤为：

0 \leq i_{A} \leq \frac{i_{L}^{'} - i_{L}}{a} - 1,

0 \leq j_{A} \leq \frac{j_{L}^{'} - j_{L}}{b} - 1;

将虚拟地址数组(i_A，j_A)看成大小为

\frac{i_{L}^{'} - i_{L}}{a} \times \frac{j_{L}^{'} - j_{L}}{b}

(2.2)地址映射表子表定位：使用子表分配函数m′_p′，q′(i_A，j_A)将虚拟地址(i_A，j_A)映射到某个子表(p′，q′)上，其中0≤p′＜2，0≤q′＜2；把该函数分割为两个正交的函数m′_p′(i_A)和m′_q′(j_A)，对于每个子表(p′，q′)：

m′_q′(i_A)＝(i_A-p′)mod2 (3a)

m′_q′(j_A)＝(j_A-q′)mod2 (3b)

其中，

c_{i_{A}} = \{\begin{matrix} 1, & i_{A} \mod 2 > p^{'} \\ 0, & otherwise . \end{matrix}

c_{j_{A}} = \{\begin{matrix} 1, & j_{A} \mod 2 > q^{'} \\ 0, & otherwise . \end{matrix}

A′_p′，q′(i_A，j_A)中所保存的信息即为物理地址信息。