WO2015067195A1

WO2015067195A1 - 一种可重构缓存组织结构

Info

Publication number: WO2015067195A1
Application number: PCT/CN2014/090481
Authority: WO
Inventors: 林正浩
Original assignee: 上海芯豪微电子有限公司
Priority date: 2013-11-08
Filing date: 2014-11-06
Publication date: 2015-05-14
Also published as: CN104636268A; CN104636268B

Abstract

一种可重构缓存组织结构，应用于处理器领域时能根据配置提供不同数目路组结构的缓存，并将连续地址的指令或数据存储在同一个路组中，便于处理器核获取指令或数据，以减少标签匹配次数。

Description

一种可重构缓存组织结构

技术领域

本发明涉及计算机，通讯及集成电路领域。

背景技术

现有的处理器体系结构普遍采用缓存将更低级存储器中的部分内容复制在其中，使这些内容能被更高级存储器或处理器核快速存取，以保证流水线的持续运行。基本的缓存结构通常在缓存缺失之后，才将低级存储媒介中的内容填充到缓存中，使得流水线不得不暂停以等待缺失部分被填充到缓存中。一些新的缓存结构，如：牺牲缓存、跟踪缓存以及预取等都是基于上述基本缓存结构并改善上述结构。然而，随着日渐扩大的处理器 / 存储器速度鸿沟，现行体系结构，特别是多种缓存缺失，已成为是制约现代处理器性能提升的最严重瓶颈。

为了提高性能，在现代处理器系统中通常采用缓存暂存主存储器中的指令或数据。存储在缓存中的指令或数据的地址一般分为三个部分：标签（ TAG ）、索引号（ index ）和块内偏移量（ offset ）。缓存一般由标签存储器和数据存储器构成，两者一一对应。其中数据存储器的每一个存储块存储了一个主存块（即指令块或数据块），标签存储器则存储了对应的存储块地址的标签。按组织形式的不同，缓存通常有三种形式：直接映射（ direct map ）、全相联（ fully associative ）和组相联 (way-set associative) 。

在直接映射的缓存结构里，主存中的每个主存块在高速缓存中只能出现在唯一位置上。在直接映射的情况下，由于每个主存块在高速缓存中仅存在一个位置，因而地址的比较次数仅为一次。直接映射把主存储器分成若干页，主存储器的每一页与高速缓存的容量大小相同，且对应一个标签。根据主存块的地址中的索引号读出对应的标签，并与主存块地址中的标签部分比较，即可确定该索引号对应的存储块中存储的是否就是所述主存块地址对应的主存块。直接映射的缓存结构简单，实现容易，但每个索引号只对应一个存储块，因此直接映射的缓存中无法同时存储两个具有相同索引号的主存块。

在全相联的缓存结构里，一个主存块可以被放到高速缓存中的任何一个地方，即存储块之间，以及存储顺序或保存的存储器地址之间没有直接的关系。高速缓存中可以保存互不相关的数据块，且必须对每个主存块及其自身的地址加以存储。当请求数据时，缓存控制器必须把主存块地址同所有存储在标签存储器中的块地址加以比较，进行确认。

组相联是介于全相联和直接映射之间的一种结构。这种结构将高速缓存分成若干个路组 (way-set) ，在路组内实现直接映射，而路组与路组间采用全相联方式。这样对于某一个给定的索引号，可以允许有几个块位置，因而可以增加命中率和系统效率。

技术问题

在上述三种组织结构中，全相联的缓存需要大量的比较器用于比较标签，电路结构复杂导致速度不高；且因所有比较器均同时进行比较，功耗非常大，在现代处理器的大容量缓存中无法实现。直接映射的缓存则因为每个索引号只对应一个存储块的局限，导致频繁替换，效率很低。只能有一个 INDEX

组相联的缓存则是现代处理器中最常用的缓存结构。通常路组数越多，缓存的性能越好，但需要同时读出、比较的标签也越多，导致功耗越高，且用于选择数据的选择器也越复杂，导致时延越大；敏感放大器和 Y 译码器所占的面积都很大，单靠分割位线（ bit line ）增加路组数代价很高。此外，有些程序由于其本身的特点，较低路组数的缓存就能实现不错的性能。因此，在组相联的缓存结构中，由于不知道会执行什么样的程序，因此很难在缓存性能与硬件成本之间作出平衡的选择。

最后，在直接映射缓存结构及组相联结构的每个路组中，各个存储块的索引号是连续的，且每个索引号只能对应一个存储块，不够灵活。

技术解决方案

本发明提出的可重构缓存组织结构能直接解决上述或其他的一个或多个困难。

本发明提出了一种可重构缓存组织结构，其特征在于，缓存的指令或数据存储器中的多个存储块可以构成一个组，且对应同一个标签，形成按组可重构结构；当本次寻址地址与上次寻址地址对应同一个组时，可以省略本次寻址地址的标签比较，直接在该组中找到对应的指令或数据。

可选的，可以将所述缓存中的存储块配置为大小相等或不等的组。

可选的，所述本次寻址地址和上次寻址地址是：两条地址连续的指令本身的地址；或两条被先后执行的数据访问指令分别对应的数据地址；或同一条数据访问指令先后被执行时分别对应的数据地址。

可选的，当进行连续地址或相近地址寻址，且地址中的标签部分相同时，即可判定本次寻址地址与上次寻址地址对应同一个组。

可选的，可以根据所述本次寻址地址与上次寻址地址中的索引号部分的差值，以及上次寻址地址对应的指令或数据在缓存中的位置，确定本次寻址地址对应的指令或数据在缓存中的位置。

可选的，可以根据寻址地址中的标签、索引号高位部分的匹配结果，以及索引号低位部分的译码结果在缓存中找到相应指令或数据。

可选的，可以通过选择线将寻址地址中的标签、索引号高位部分的匹配结果送往用于索引号低位部分译码的译码器；仅在匹配成功项对应的译码器中对索引号低位部分进行译码。

可选的，可以先将选择线上的匹配结果编码后通过总线传输，经解码后再送到对应的译码器。

可选的，还可以将所述缓存中的若干存储块配置为组相联结构，形成按组可重构结构及组相联结构共存的混合结构。

可选的，所述缓存组织结构可以构成组相联缓存结构；其中每组（ group ）存储块均可以被分配给任意一个组（ set ）构成其的一个路（ way ）；且最大组（ set ）数目与最大路（ way ）数目的乘积大于存储块组（ group ）的数目。

可选的，在所述缓存组织结构中，所有存储块共享同一组位线。

可选的，在所述缓存组织结构中，包括一个二维表；所述二维表的行对应组（ set ），且至少包含一行；所述二维表的列对应路（ way ），且至少包含一列；所述二维表的表项内容包括：标签、有效位和组号。

可选的，在所述缓存组织结构中，根据存储器地址中的索引号从所述二维表中读出相应行中所有的有效标签值与存储器地址中的标签进行匹配；根据匹配成功项中的组号在缓存中找到该存储器地址对应组（ group ）；根据存储器地址中的偏移地址在所述组（ group ）中访问相应指令或数据。

可选的，在所述缓存组织结构中，还包括至少一个独立标签模块；当一个独立标签模块被分配给一个组（ set ）时，在所述独立标签模块中存储了所述组（ set ）对应的索引号值和标签值。

可选的，在所述缓存组织结构中，当需要对一个组（ set ）分配新的路（ way ），且所述二维表中该组（ set ）对应行中的全部表项均有效时，若尚有未被占用的独立标签模块存在，在将该独立标签模块分配给该组（ set ）使用；若所有独立标签模块均被占用，则根据替换算法从部分或全部独立标签模块，以及所述二维表中该组（ set ）对应的路（ way ）中确定一个用于替换。

可选的，在所述缓存组织结构中，当根据一个存储器地址在所述缓存中寻址时，根据所述存储器地址中的索引号从所述二维表的相应行中读出所有有效标签值，并从存储了所述索引号的所有独立标签模块中读出标签值与所述存储器地址中的标签进行匹配；根据匹配成功项中的组号在缓存中找到该存储器地址对应组（ group ）；根据存储器地址中的偏移地址在所述组（ group ）中访问相应指令或数据。

对于本领域专业人士，还可以在本发明的说明、权利要求和附图的启发下，理解、领会本发明所包含其他方面内容。

有益效果

本发明所述的可重构缓存组织结构可以提供一种可变大小的按组分配的缓存组织结构。每组中的存储块对应的主存地址是连续的，使得处理器核在获取连续地址的指令或数据时，所述缓存只需要经过简单的计算即可直接确定所述指令或数据在缓存中的位置，从而避免了标签匹配，降低了功耗。

本发明所述的可重构缓存组织结构还可以按需配置为按组分配 / 组相联混合的缓存结构，将连续地址的指令或数据，以及不连续地址的指令或数据分别存储在按组分配的缓存部分及组相联结构的缓存部分中，使得缓存系统在兼容现有缓存结构的前提下，更好地支持连续地址的指令或数据读取。

本发明所述的可重构缓存组织结构提供了一种介于组相联和全相联之间的缓存形式，可以根据程序运行时的客观需求，对不同索引号给予不同的路组数，用相当于组相联的硬件代价，实现了全相联的性能。

对于本领域专业人士而言，本发明的其他优点和应用是显见的。

附图说明

图 1 是现有组相联缓存结构中标签比较的一个实施例；

图 2 是本发明所述可重构缓存中标签比较的一个实施例；

图 3 是本发明所述可重构缓存中标签比较的另一个实施例；

图 4 是本发明所述可重构缓存中一个组的实施例；

图 5 是本发明所述可重构缓存中标签比较的另一个实施例；

图 6 是本发明所述可重构缓存中标签比较的另一个实施例；

图 7 是本发明所述可重构缓存配置情况的一个实施例；

图 8A 是本发明所述可重构缓存的实施例；

图 8B 是本发明所述可重构缓存中地址格式和表项格式的一个实施例；

图 8C 是本发明所述可重构缓存的一个运行状态实施例；

图 8D 是本发明所述可重构缓存的另一个运行状态实施例；

图 9 是本发明所述可重构缓存的另一个实施例。

本发明的最佳实施方式

图 3 显示了本发明的最佳实施方式。

本发明的实施方式

以下结合附图和具体实施例对本发明提出的高性能缓存系统和方法作进一步详细说明。根据下面说明和权利要求书，本发明的优点和特征将更清楚。需说明的是，附图均采用非常简化的形式且均使用非精准的比例，仅用以方便、明晰地辅助说明本发明实施例的目的。

需要说明的是，为了清楚地说明本发明的内容，本发明特举多个实施例以进一步阐释本发明的不同实现方式，其中，该多个实施例是列举式并非穷举式。此外，为了说明的简洁，前实施例中已提及的内容往往在后实施例中予以省略，因此，后实施例中未提及的内容可相应参考前实施例。

虽然该发明可以以多种形式的修改和替换来扩展，说明书中也列出了一些具体的实施图例并进行详细阐述。应当理解的是，发明者的出发点不是将该发明限于所阐述的特定实施例，正相反，发明者的出发点在于保护所有基于由本权利声明定义的精神或范围内进行的改进、等效转换和修改。同样的元器件号码可能被用于所有附图以代表相同的或类似的部分。

本发明提供了一种可重构缓存组织结构，应用于处理器领域时能根据配置提供不同数目路组结构的缓存，并将连续地址的指令或数据存储在同一个路组中，便于处理器核获取指令或数据，以减少标签匹配次数。在本说明书中，以数据缓存为例进行说明，但本发明所述结构和方法也适用于指令缓存。

请参考图 1 ，其为现有组相联缓存结构中标签比较的一个实施例。图中显示了一个路组的标签比较过程。其中，标签存储器 101 中的每行（ line ）对应一个索引号，其中存储了主存块地址中的标签部分。当需要从缓存中读取数据时，总线 105 上的数据寻址地址中的索引号 107 被送往译码器 111 ，而标签 109 则被送往比较器 113 。

译码器 111 对接收到的索引号 107 进行译码，得到相应的字线（ word line ）。所述字线被用于选中标签存储器 101 中与索引号 107 对应的行，并输出其中存储的标签经敏感放大器 103 放大后送往比较器 113 。比较器 113 比较敏感放大器 103 送来的标签 115 和标签 109 并通过总线 117 输出比较结果。若比较结果相等，说明在该路组中，标签 115 所在行对应的存储块（ memory block ）中存储的就是所述数据所在的数据块。若比较结果不相等，则表示在该路组中不存在所述数据所在的数据块。通过对缓存中所有路组进行如上操作，即可确定所述数据所在的数据块是否已经存储在缓存中，以及当已经存储在缓存中时的位置。这样，当比较结果为相等时，根据索引号 107 译码得到的相应字线从数据存储器 121 中读出的数据就是所述数据寻址地址对应的数据，并经敏感放大器 123 放大后经总线 119 送往处理器核。

本发明所述的可重构缓存用新的结构和方法替代了图 1 实施例中的标签比较过程。请参考图 2 ，其为本发明所述可重构缓存中标签比较的一个实施例。在本实施例中，每个路组中的标签存储器和数据存储器均被分为相应的若干组（ group ），每组对应连续索引号的相同数目行，且对应同一个标签。即，每个组中存储了对应同一个标签的连续地址的若干个数据块。

以一个路组为例，如图 2 所示，标签存储器 201 被分为两个组，每组含一行内容寻址存储器（ CAM ），即存储一个标签（如标签 203 和标签 205 ）。相应地，数据存储器 211 也被分为两个组，每个组含四个存储块，且这四个存储块中的数据块地址连续，并对应同一个标签。具体地，组 213 中包含存储块 221 、 223 、 225 和 227 ，这四个存储块中的数据块地址连续，且均对应标签 203 ；组 215 中包含存储块 231 、 233 、 235 和 237 ，这四个存储块中的数据块地址连续，且均对应标签 205 。需要说明的是，在本发明中，并不要求组 213 中四个数据块和组 215 中四个数据块的起始地址一致。在本实施例中，每组标签及相应组存储块还对应一个寄存比较器和一个译码器。如标签 203 对应寄存比较器 217 和译码器 229 ，标签 205 对应寄存比较器 219 和译码器 239 。所述寄存比较器中包含一个寄存器和一个比较器。其中，所述寄存器存储了该组存储块起始地址中的索引号的高位部分。

所述数据寻址地址中的标签部分被送到标签存储器 201 中的所有内容寻址存储器进行匹配，所有匹配成功的内容寻址存储器均向对应的寄存比较器中的寄存器输出一个使能信号。所述比较器则在该使能信号有效的情况下将外部送来的数据寻址地址中索引号的高位部分经总线 243 与所述寄存器中存储的索引号高位部分值进行比较，从而对相应组数据块地址进行部分（即所述索引号高位部分）匹配。所述译码器则在寄存比较器输出匹配成功的情况下，对总线 245 上的数据寻址地址中索引号的低位部分进行译码，并根据译码结果从相应组数据块中选出一个输出。这样，通过寄存比较器和译码器的匹配、译码及寻址，即可从数据存储器 211 中读出索引号与数据寻址地址中索引号相同的数据块。若所有内容寻址存储器均匹配不成功，或所有参与比较的比较器均匹配不成功时，则说明所述数据寻址地址对应的数据尚未存储在缓存的该路组中。这样，按同样方法并行对所有路组进行如上操作，即可在缓存中找到所需数据经敏感放大器 123 放大后由总线 247 输出，或得到缓存缺失的结果。

由于内容寻址存储器的比较线（ Match Line ）必须先充电，才能进行标签匹配，而充电、匹配过程耗电较多，在本实施例中同时在所有内容寻址存储行中匹配标签功耗较大。因此，还可以改进地址匹配的顺序，以进一步降低功耗。具体地，先将所述数据寻址地址中的索引号高位部分通过总线 243 送到所有寄存比较器中与存储的索引号高位部分值进行比较，并根据比较结果，只对匹配成功项对应的内容寻址存储行的比较线进行充电、与经总线 241 送来的标签匹配，并由匹配成功的内容寻址存储行向译码器输出使能信号。后续操作与前述相同。这样，减少了内容寻址存储行的匹配数目，降低了功耗。

在本实施例中，只需要对寄存比较器中的寄存器存入相应的索引号高位值，即可对缓存进行重构。例如，可以在两个相邻的寄存比较器中存入连续的索引号高位值，使得这两个寄存比较器对应的索引号也连续。这样，所述相邻的两个组就被合并为一个更大的组以容纳连续地址的数据块。

请参考图 3 ，其为本发明所述可重构缓存中标签比较的另一个实施例。同样以一个路组为例，其结构与图 2 实施例中的类似，不同之处在于本实施例中的标签存储器 301 的每组不但有一行内容寻址存储器，还包含了随机访问存储器（ RAM ）。其中，标签存储器 301 每一组中的内容寻址存储器与数据存储器 211 中相应组内的第一个存储块对应，而其他的各行随机访问存储器分别与相应组内的其他存储块对应，使得数据存储器 211 中的每个存储块都有对应的标签。此外，在本实施例中，译码器（如译码器 329 和 339 ）可以根据需要，对完整的索引号进行译码，或如图 2 实施例中的译码器 229 和 239 那样，只对索引号低位进行译码。

在本实施例中，所述可重构缓存就可以按需被配置为传统形式的组相联缓存，或本发明所述的按组可重构缓存。当配置为组相联缓存时，每个路组中的存储块对应连续的索引号，但不必对应相同的标签。此时，标签存储器中的内容寻址存储器被视为随机访问存储器，和其他随机访问存储器一起分别存储了对应的存储块中数据块的标签。同时，每个寄存比较器（如寄存比较器 217 、 219 ）的输出被配置为固定输出' 1 '。这样，数据寻址地址中的索引号经译码器的匹配、译码和寻址后，就可以在标签存储器 301 和数据存储器 211 中分别找到该索引号对应的标签和存储块。所述标签经敏感放大器 307 放大后在比较器 113 中与数据寻址地址中的标签比较及后续过程与图 1 实施例中相同，从而确定所述数据所在的数据块是否已经存储在缓存中，以及当已经存储在缓存中时读出对应数据块。

当配置为按组可重构缓存时，每个组内的随机访问存储器被忽略，每个寄存比较器中的寄存器都存放了索引号高位部分，而译码器只对索引号的低位部分进行译码，这样本实施例所示结构就具备了和图 2 实施例的的相同功能，即可按图 2 实施例所述方法进行操作。

请参考图 4 ，其为本发明所述可重构缓存中一个组的实施例。在本实施例中，假设索引号共有 4 位，其中高位部分和低位部分均为 2 位。

图 4 中所显示的就是图 3 中一个组（如标签 205 对应的组）的具体结构。其中，标签存储器部分包含一个内容寻址存储行 401 （即存储了标签 205 ）和三个随机访问存储行 403 、 405 和 407 。数据存储器部分则相应地存储了四个存储块 411 、 413 、 415 和 417 。译码器 429 和 439 分别对索引号的高位部分和低位部分进行译码，两者一同实现了图 3 实施例中的译码器 239 的功能。

在本实施例中，当该组缓存被配置为组相联缓存时，开关 421 、 423 、 425 和 427 均呈如图所示形式，即将译码器 409 中各个与门的输出连通到相应的标签存储器行中。此时，如图 3 实施例所述，比较器 219 的输出固定为' 1 '，其结果被送到本组中的所有与门作为一个输入。索引号的高位部分经总线 451 由译码器 429 译码后选中一个组（即向该组中的所有与门输出一个有效信号），而低位部分则经经总线 453 由译码器 439 译码后选中该组中的一个与门，即给予该与门一个有效信号（' 1 '），并给予其他所有与门一个无效信号（' 0 '）。假设在此情况下，译码器 429 选中图 4 所示的组，且译码器 439 选中与门 433 ，则在与门 433 输出信号的控制下，随机访问存储行 403 中的标签被读出并经敏感放大器 307 放大后在比较器 113 中与数据寻址地址中的标签进行比较，并从存储块 413 中读出对应的数据块送往选择 / 放大模块 419 。若本路组比较相等，则说明存储块 413 中读出的数据块就是该数据寻址地址对应的数据块，根据总线 441 上的数据寻址地址中的块内偏移量即可选出对应的数据放大并从总线 445 输出。若本路组比较不相等，但其他某个路组输出的标签比较相等，则那个路组输出的数据块就是该数据寻址地址对应的数据块，根据数据寻址地址中的块内偏移量即可选出对应的数据。若所有路组比较都不相等，则说明该数据寻址地址对应的数据块尚未存储在缓存中。

当该组缓存被配置为按组可重构缓存时，开关 421 、 423 、 425 和 427 均接地，即将各个与门的输出与相应的标签存储器行断开，且对所有标签存储器行均不做选取；并强制译码器 429 的所有输出固定为' 1 '。此时，如之前实施例所述，数据寻址地址中的索引号高位部分经总线 243 被送到寄存比较器 219 进行匹配，并对匹配成功项对应的内容寻址存储行充电，使该内容寻址存储行中存储的标签与由位线 455 送来的数据寻址地址的标签进行匹配。若标签匹配不成功，则本组中没有包含所述数据寻址地址对应的数据。若标签匹配成功，则输出有效信号 443 到本组中的各个与门。此时，译码器 429 的输出固定为' 1 '，且索引号的低位部分经经总线 453 由译码器 439 译码后选中一个与门。假设在此情况下，比较器 219 及译码器 429 均选中图 4 所示的组，且译码器 439 选中与门 435 ，则在与门 435 输出信号的控制下，读出存储块 415 中的数据块送往选择 / 放大模块 419 。选择 / 放大模块 419 则直接根据数据寻址地址中的块内偏移量 441 ，直接从该数据块中选出对应的数据并由总线 445 输出。在此过程中，标签存储器内各个随机访问存储行均没有参与操作。虽然本实施例以数据读取为例进行说明，但对于数据存储而言，也可以用类似方法实现。不同之处仅在于进行数据读取时，从数据缓存 211 中匹配的存储块中经位线 457 读出数据块经放大选择后输出相应数据，而进行数据存储时，直接将需要存储的数据（或数据块）经位线 457 写入数据缓存 211 中匹配的存储块中。

此外，还可以将所述缓存中的译码器（如译码器 329 和 339 ）改为只指向数据存储器 211 中的存储块，并增加一套译码器用于指向标签存储器 201 中的内容寻址存储行。这样，如果标签存储器 201 和数据存储器 211 物理位置相隔较远时，依然可以实现本发明所述缓存的功能。

请参考图 5 ，其为本发明所述可重构缓存中标签比较的另一个实施例。在本实施例中，增加了译码器 529 和 539 。其中，译码器 529 的结构和功能与译码器 329 相同，两者均接收寄存比较器 217 送出的比较结果；译码器 539 的结构和功能与译码器 339 相同，两者均接收寄存比较器 219 送出的比较结果。这样就可以不必如图 4 实施例那样将译码器 329 和 339 输出的字线同时送往数据存储器 211 ，并经开关（如开关 421 ）送往标签存储器 201 。以译码器 329 及对应的译码器 529 为例，当所述缓存被配置为组相联缓存时，译码器 329 和译码器 529 同时对数据寻址地址中的索引号译码，并分别根据译码输出的字线从数据存储器 201 读出数据块及从标签存储器 201 中读出标签，以进行后续操作。当所述缓存被配置为按组可重构缓存时，译码器 529 不工作，按前述方法仅由相应的寄存比较器及内容寻址存储行进行匹配，以确定数据在哪个组中，并将匹配结果通过总线送往相应译码器（即，寄存比较器 217 及内容寻址存储行 203 的匹配结果经选择线 517 送往译码器 329 ）；并根据译码器 329 对总线 345 上的数据寻址指令中索引号的低位部分，译码得到的字线在该组中找到对应的数据块，以进行后续操作。其他的译码器（如译码器 339 和 539 ）也按相同方法运行，例如寄存比较器 219 及内容寻址存储行 205 的匹配结果经选择线 527 送往译码器 339 等。当因缓存被分为很多组，导致所述传递到译码器的匹配结果很多时，可以先将所述匹配结果进行编码后通过总线传输到数据存储器一侧，经解码后再分别送往对应的译码器，从而减少选择线（如选择线 517 、 527 ）的数目。例如， 16 条选择线可以由 4 条总线代替。

需要说明的时，在图 2 、图 3 和图 4 实施例中，采用寄存比较器的结构实现了对索引号高位部分的匹配。当然也可以用内容寻址存储器代替所述寄存比较器实现同样功能。对于图 2 实施例，只需要增加标签存储器 201 中的每个内容寻址存储器的位宽，使得标签和索引号高位部分都能被存储在所述内容寻址存储器并参与匹配，即可实现所述功能。对于图 3 和图 4 实施例，则在增加标签存储器 301 中的每个内容寻址存储器的位宽的同时，保持随机访问存储器不变即可。请参考图 6 ，其为本发明所述可重构缓存中标签比较的另一个实施例。仍然以一个路组为例，本实施例与图 3 实施例结构相似，不同之处在于增加了标签存储器 301 中的每个内容寻址存储器的位宽，以代替寄存比较器。内容寻址存储器增加的部分中存储了就是相应的索引号高位部分。

在本实施例中，当缓存被配置为组相联缓存时，数据寻址地址中的索引号的高位部分经位线 243 被送到标签存储器 481 中所有内容寻址存储器新增加的部分进行匹配，而匹配成功项对应的译码器则对索引号的低位部分进行译码，从而在标签存储器 481 和数据存储器 211 中分别找到该索引号对应的标签和存储块。后续操作过程与图 3 施例中相同，在此不再赘述。当缓存被配置为按组可重构缓存时，每个组内的随机访问存储器被忽略，数据寻址地址中的标签和索引号高位部分被送到标签存储器 481 各个内容寻址存储器匹配，并由匹配成功项对应的译码器对索引号低位部分译码。后续操作过程与图 3 施例中相同，在此不再赘述。这样，采用本发明所述缓存结构，可以在不增加敏感放大器和 Y 译码器的情况下，很方便地将一个路组中的存储块分割为多个组，每个组起到了一个路组的作用。

请参考图 7 ，其为本发明所述可重构缓存配置情况的一个实施例。为了便于说明，在图 7 中只显示了标签存储器和译码器，省略了其他部分。本实施例的缓存具有四个路组（如路组 501 、 503 、 505 和 507 ），每路则被分为四个组（如路组 501 中的组 511 、 513 、 515 和 517 ），每组中则可以包含若干个用于存放数据块的存储块。因此，在所有 16 个组中就可以最多存放对应 16 个标签的连续地址的数据块。

根据本发明技术方案，可以用路组号及路组内号码一同构成一个对标签存储器（及数据存储器）中的每个组进行唯一识别的组号码。如图 7 中标签存储器每组上的数字所示，前两位为路组号，后两位为路组内的组号。即，路组 501 的路组号为' 00 '，路组 503 的路组号为' 01 '，路组 505 的路组号为' 10 '，路组 507 的路组号为' 11 '。而每个路组中的各个组从上往下的路组内号码依次为' 00 '、' 01 '、' 10 '和' 11 '。因此，组 511 对应的组号码就是' 0000 '，组 513 对应的组号码就是' 0001 '，组 515 对应的组号码就是' 0010 '，组 517 对应的组号码就是' 0011 '，以此类推。这样，当一个数据寻址地址在某组中匹配成功时，就可以用相应的组号码及组内偏移量（用以指明组内的哪个数据块以及该数据块中的哪个数据）代替该数据寻址地址，使得下一次重复访问该数据时不必再次进行标签匹配。

进一步地，当程序中的数据读取指令（或数据存储指令）依次访问相邻或相近位置的数据时，可以根据前后两个数据寻址地址的差值，及前一个数据寻址地址对应的组号码，直接推算出本次数据寻址地址对应的组号码，以避免标签匹配。

例如，假设前一次数据读取指令的数据寻址地址对应的组号码是' 1110 '，即所述数据寻址地址对应的数据位于组 545 对应的存储块中。将本次数据读取指令的数据寻址地址中的标签和索引号分别减去所述前一次数据寻址地址中的标签和索引号。若标签相减的结果为' 0 '，即表示本次数据寻址地址与上次数据寻址地址的标签相同，因此位于同一个组 545 内，即本次数据寻址地址对应的组号码也是' 1110 '。根据索引号相减的结果则可以确定本次数据寻址地址对应存储块与上次数据寻址地址对应的存储块之间的位置关系。具体地，若索引号相减的结果为' 0 '，则本次数据寻址地址对应存储块就是上次数据寻址地址对应的存储块，并可根据数据寻址地址中的块内偏移量从该存储块中选出对应的数据；若索引号相减的结果为正，则本次数据寻址地址对应存储块位于上次数据寻址地址对应的存储块之后；若索引号相减的结果为负，则本次数据寻址地址对应存储块位于上次数据寻址地址对应的存储块之前。对于后两种情况，索引号相减得到的差值的绝对值就是所述两个存储块的间隔距离。例如，索引号相减得到的差值为' 2 '，表示本次数据寻址地址对应的存储块位于上次数据寻址地址对应的存储块之后的第二个存储块。又如，索引号相减得到的差值为' -1 '，表示本次数据寻址地址对应的存储块位于上次数据寻址地址对应的存储块之前的第一个存储块。这样，不需要经过任何标签比较，就可以确定本次数据寻址地址对应的数据块在缓存中的位置。

此外，当连续的数据块超过单个组的容量时，还可以将这些数据块存储在组号码连续的两个组中。例如，当组 513 和 515 对应同样的标签，且组 515 对应的索引号高位部分等于组 513 对应的索引号高位部分加' 1 '时，不但组 513 和 515 中各自存储的数据块的地址是连续的，组 513 中最后一个数据块和组 515 中第一个数据块的地址也是连续的。这样，构成了组与组之间的连接关系，即组 513 是组 515 的前导（ previous ）组，而组 515 是组 513 的后续（ next ）组，从而能够根据索引号差值直接从一个组找到位于另一个组中的数据位置。

当然，若标签相减的结果不为' 0 '，则可以使用之前实施例所述方法，在标签存储器中对本次数据寻址地址进行匹配，以找到对应的组。

此外，在本发明中，还可以将各个组配置成不同大小，例如可以将图 7 实施例中的路组 501 配置成四个组（即组 511 、 513 、 515 和 517 ），并将路组 503 配置成一个组，以及将路组 505 和 507 配置成传统形式的组相联结构。在这种情况下，路组 501 中最多包含四个不同的标签，而路组 503 中只包含一种标签。路组 505 和 507 则如现有二路组缓存那样，各自可包含的最多标签数等于对应的存储块的数量（及路组本身的行数），相邻的存储块可以对应不同的标签。采用如此配置的缓存，可以根据程序的特点，将数据寻址地址连续（即标签相同）的大量数据存储在路组 503 中，并将多组数据寻址地址连续的少量数据存储在路组 501 的各个组中。对于数据寻址地址不连续的数据，则被存储在路组 505 或 507 中。这样，所述缓存即具备了缓存中数据存放的灵活性和便于替换的特点，又能在进行连续地址的数据访问时省去大量的标签比较操作。

以上的实施例均针对数据缓存进行说明。由于指令缓存的结构与数据缓存相似，因此完全可以用同样的结构实现，在此不再赘述。

根据本发明技术方案，还可以对缓存中的标签部分进行改进，实现路组数可变的可重构缓存。请参考图 8A ，其为本发明所述可重构缓存的实施例。在本实施例中，可重构缓存由标签部分 801 和数据存储部分 803 组成，其中数据存储部分 803 中的所有存储块共享同一组位线（ bit line ），并按之前实施例中的数据存储器 211 的分组方法，被分为 6 个组（ group ）： A 、 B 、 C 、 D 、 E 和 F ，因此组号为 3 位，例如：组 A 对应组号' 000 '、组 B 对应组号' 001 '、……、组 F 对应组号' 101 '。每个组（ group ）中包含多个存储块，而每个存储块中包含多条指令或多个数据。标签部分 801 中则以一个二维表 825 的形式存储了各个组（ group ）对应的标签、组号等信息。如图 8B 所示，表项内容 807 可以包含标签 811 、有效位 817 和组号 819 。在本发明中，有效位 817 为' 1 '表示该表项是有效表项；有效位 817 为' 0 '表示该表项是无效表项。此外，二维表 825 的列数对应所述缓存所支持的最大路数，行数则表示同一路（ way ）中最大支持的组数，即同一路（ way ）中最大支持的索引号值。在此，二维表 825 有 4 行 4 列，其中 4 列表示所述缓存最多支持 4 个路（ way ）； 4 行则表示缓存可以分为 4 个组（ set ），索引号的范围为' 0 '到' 3 '，即索引号的位数为 2 位。存储器地址中的索引号与缓存中的组（ set ）一一对应。

此外，比较模块 821 由多个比较器构成，比较器的数目与二维表 825 的列数相等。比较模块 821 对标签部分 801 中根据索引号 813 读出的所有有效标签与存储器地址 805 中的标签 811 进行比较，比较结果则被送到选择模块 823 作为控制信号。选择模块 823 由多个传输门组成，传输门的数目与二维表 825 的列数相等。每个传输门的输入为对应的二维表列输出的表项内容中的组号 819 。这样，根据所述比较结果，即可选出匹配成功表项对应的组号 819 。

如图 8B 所示，存储器地址 805 被分为三个部分：标签 811 、索引号 813 和偏移地址 815 。其中，索引号 813 对应二维表 825 的行数，即位数为 2 位；而偏移地址 815 对应指令或数据在组（ group ）内的位置，其位数固定。例如，假设每个组（ group ）包含 8 个存储块，每个存储块包含 16 个字节指令或数据，对于 32 位长的存储器地址，偏移地址 815 共 7 位（即每组 8 个存储块共 128 字节指令或数据）；索引号 813 为 2 位，其余 23 位为标签。

这样，根据所述索引号 813 读出所述二维表中对应行中存储的所有有效表项，并将这些表项中存储的标签与存储器地址 805 中的标签 811 同时比较。若均不匹配，则表示缓存缺失。若有匹配，则匹配项中存储的组号就是所述存储器地址 805 对应的组（ group ）。即，将存储器地址 805 中的标签 811 和索引号 813 转换为组号 819 ，从而由组号 819 和偏移地址 815 构成缓存寻址地址 809 。根据寻址地址 809 中的组号 819 即可在缓存中找到相应的组（ group ），并根据寻址地址 809 中的偏移地址 815 从该组（ group ）中访问相应指令或数据。

需要注意的是，现有的组相联缓存中，每个索引号对应的标签存储位置的数目相同，即等于路（ way ）数。例如，在一个 4 路（ way ）缓存中，索引号 M 和索引号 N 都对应 4 个标签。但在本实施例的缓存结构中，每个索引号对应的标签存储位置的数目可以不同。例如，在本实施例所述的最多支持 4 路（ way ）的缓存中，索引号 M 可以只对应 2 个标签，即 2 路（ 2 way ）；但索引号 N 对应 4 个标签，即 4 路（ 4 way ）。

以下结合图 8A ，以具体实施例进行说明。请参考图 8C ，其为本发明所述可重构缓存的一个运行状态实施例。在本实施例中只显示了标签部分 801 中存储的标签值。在本实施例中，假设在某一时刻，所述缓存已经为索引号' 00 '分配了四个组（ group ）： B 、 C 、 D 、 E ，并为索引号' 10 '分配了组 A ；组 F 尚未被分配。当根据存储器地址 805 寻找对应指令或数据时，根据其中索引号 813 读出二维表 825 中相应行的所有表项内容并将其中的标签和有效位送往比较器模块 821 。其中，接收到的有效位为' 0 '的比较器的比较输出均为' 0 '（即不匹配）；接收到的有效位为' 1 '的比较器对接收到的标签与存储器地址中的标签 811 进行比较，并输出比较结果。

具体地，若存储器地址 805 中的索引号值是' 01 '或' 11 '，则二维表 825 中的对应行没有有效表项，因此均不匹配，比较模块 821 输出缓存缺失信号到总线 829 上。以该索引号值是' 11 '为例，缓存分配一个可用组 F 给索引号' 11 '。即，将该存储器地址 805 中的标签及组号 F 存储到二维表 825 第 2 行中的一个无效表项中，并将该表项设为有效。此时，二维表 825 中的状态如图 8C 所示。

之后，若存储器地址 805 中的索引号值是' 00 '，则对应的第 0 行中的所有表项内容均被读出。由于这些表项均有效，因此这些标签被送往比较器模块 821 分别与存储器地址中的标签 811 进行比较，所有比较器的比较结果由逻辑门 827 进行'或'操作后输出。同时读出内容中的组号（ B 、 C 、 D 或 E ）则被送往选择模块 823 作为传输门的输入。这样，若匹配成功，则比较模块 821 输出缓存命中信号到总线 829 上，且选择模块 823 输出匹配成功项对应的组号 819 输出。所述组号 819 与偏移地址 815 一同构成缓存寻址地址 809 ，之后利用该寻址地址 809 即可直接从数据存储部分 803 中访问相应指令或数据。

若匹配均不成功，则比较模块 821 输出缓存缺失信号到总线 829 上。由于索引号' 00 '对应的 4 个路（ way ）均已被占用，因此可以根据替换算法（如 LRU 算法），从对应的 4 个组（ group ）： B 、 C 、 D 、 E 中选择一个合适的组（ group ）分配给该存储器地址 805 使用。

若存储器地址 805 中的索引号值是' 10 '，则对应的第 2 行中的所有表项内容被读出，其中的有效位和标签被送往比较器模块 821 ，组号则被送往选择模块 823 作为相应传输门的输入。由于只有一个表项有效，若该表项中的标签匹配成功，则比较模块 821 输出缓存命中信号到总线 829 上，且选择模块 823 输出该表项对应的组号 A 。所述组号与偏移地址 815 一同构成缓存寻址地址 809 ，之后利用该寻址地址 809 即可直接从数据存储部分 803 中访问相应指令或数据。

若该表项中的标签匹配不成功，则比较模块 821 输出缓存缺失信号到总线 829 上。由于索引号' 10 '对应的路（ way ）中只有 1 个被占用，因此可以根据替换算法（如 LRU 算法），从所有 6 个组（ group ）中选择一个合适的组（ group ）分配给该存储器地址 805 使用。此时，若选择得到的被替换组（ group ）不是组 A （例如是组 C ），则该组（ group ）原对应的索引号（例如索引号' 00 '）相应减少 1 路（ way ），而索引号' 10 '相应增加 1 路（ way ）。这样，可以在程序运行过程中根据程序需求，自动地对不同索引号给予不同数目的路（ way ），灵活分配缓存资源，从而提高缓存命中率。

请参考图 8D ，其为本发明所述可重构缓存的另一个运行状态实施例。在本实施例中，假设在某一时刻，所述缓存已经为每个索引号均分配了一个组（ group ），分别是 D 、 A 、 B 、 C ；组 E 、 F 尚未被分配。这样，当根据存储器地址 805 寻找对应指令或数据时，如果索引号 813 对应的标签匹配成功，则可按之前实施例所述方法由选择模块 823 输出对应的组号。若匹配不成功，则根据替换算法分配一个可用组（ group ）给该索引号 813 。例如，根据程序运行需求，先后分配了组 E 和 F 给索引号' 01 '和' 10 '使用，使得二维表 825 的状态如图 8D 所示。本实施例中的具体运行过程与图 8C 实施例中类似，在此不再赘述。

传统的缓存其地址标签部分与数据存储部分对称（ Symmetrical ）且对应，其结构是固定的。如：一共有 8 个存储块组（ group ），其组织方式可以是 1 路 8 组， 2 路 4 组， 4 路 2 组，以及 8 路 1 组（全相联）；但是其组织形式是固定的，在设计时选定后即不可更改。

本实施例所示的缓存其地址标签部分与数据存储部分不对称，成可变的映射关系，因而其结构不是固定的。其地址标签部分的地址空间大于缓存存储块组能占据的空间。如：数据存储部分 803 在传统缓存中固定是一个 1 路 6 组（ 1 way ， 6 set ）的存储器。在本实施例中，该 6 个存储块组（ group ）可以按需要被映射到标签部分 801 中 4 路 4 组（ 4 way ， 4 set ）共 16 个地址位置中，构成不同组合的多种路组缓存器。在本实施例中，组（ set ）可以被转换成路（ way ）。另一方面，如果有两个数据存储部分 803 ，在传统缓存内为 2 路（ way ），那么分别在两个不同数据存储部分中的存储块组（ group ）可以被映射到同一路（ way ）中的不同组（ set ）。即，路（ way ）被转换为组（ set ）。这样，组（ set ）和路（ way ）可以相互交换，因此可以将这视为一种新型的路 - 组交换缓存（ way-set exchange cache ）。如果二维表 825 再增加 2 列，并在比较模块 821 和选择模块 823 中增加相应的比较器和选择器，则可以按需实现 6 路 1 组（ 6 way ， 1 set ）的全相联缓存。

此外，还可以用更灵活的结构实现所述可重构缓存。请参考图 9 ，其为本发明所述可重构缓存的另一个实施例。本实施例中的数据存储部分与图 8A 实施例的相同，也包含 6 个组（ group ）。为了便于说明，在图 9 中只显示了标签部分。本实施例所述标签部分中的比较器 921 和选择器 923 分别与图 8A 实施例中比较模块 821 中的比较器及选择模块 823 中的选择器相同。图 8A 实施例中的二维表 825 包含译码器 901 和 4 个标签列，每列有 4 个表项，而本实施例中则只包含译码器 901 和 1 个标签列 903 ，且该标签列 903 中的每个表项对应一个索引号。因此，输入的索引号 813 先经译码器 901 译码得到字线（ word line ）后，再根据该字线选择标签列 903 中的相应表项的内容读出。此外，本实施例的标签部分还包括若干结构相同的独立标签模块（如图 9 中的独立标签模块 905 、 907 和 909 ）。

以独立标签模块 905 为例，包含索引号寄存器 911 、标签寄存器 913 、比较器 915 、传输门 917 和选择器 919 。其中，标签寄存器 913 中存储的内容与二维表 825 的表项内容相同，包含标签、有效位和组号；选择器 919 的输入来源于译码器 901 的输出字线；索引号寄存器 911 存储了该独立标签模块对应的索引号，该索引号被用做选择器 919 的控制信号，对相应字线进行选择。这样，只有当译码器 901 的输入索引号值等于索引号寄存器 911 存储的索引号值时，选择器 919 的输出为' 1 '，否则输出为' 0 '。该输出被用于控制标签寄存器 913 是否输出其中存储的标签到比较器 915 与存储器地址 805 中的标签 811 进行比较。具体地，若选择器 919 输出为' 1 '，则表示独立标签模块 905 对应存储器地址 805 中的索引号 813 ，在标签寄存器 913 中有效位为' 1 '的情况下，存储的标签被送到比较器 915 与存储器地址 805 中的标签 811 进行比较，否则不进行比较。比较器 915 的比较结果被送到总线 829 上与比较器 921 及其他独立标签模块输出的比较结果进行'或'操作，得到缓存命中或缺失的结果。传输门 917 则与选择器 923 中的传输门类似，其输入为标签寄存器 913 中的组号，在比较器 915 输出比较结果为匹配的情况下，输出该组号 819 ，与存储器地址 805 中的偏移地址 815 一同构成缓存寻址地址 809 。

这样，除了可以按图 8A 实施例所述方法对标签列 903 进行配置，实现可重构缓存外，还可以对所述独立标签模块进行配置，将这些独立标签模块分配给相应的索引号对应的存储器地址使用，以达到更好的灵活性。

例如，当标签列 903 中对应某个索引号的那个表项已经有效，且又发生基于该索引号对应的新存储器地址的指令或数据访问，若尚有未被占用的独立标签模块存在，则可以不对该标签列 903 中的该表项进行替换，而是使用独立标签模块存储该新地址中的标签，起到增加一个路（ way ）的效果。若所有独立标签模块也都被占用，则可以根据替换算法从这些独立标签模块中分配一个用于替换。这样，在本实施例中，可以利用这些独立标签模块，随着程序的运行实时分配路组，使得某些索引号能够对应超过一个路（ way ），而另一些索引号只对应一个路（ way ）或不对应路（ way ），以更合理有效地利用缓存，提高性能。

根据本发明技术方案和构思，还可以有其他任何合适的改动。对于本领域普通技术人员来说，所有这些替换、调整和改进都应属于本发明所附权利要求的保护范围。

工业实用性

本发明提出的装置和方法可以被用于各种与缓存相关的应用中，可以提高处理器系统的效率。

序列表自由内容

Claims

一种可重构缓存组织结构，其特征在于，缓存的指令或数据存储器中的多个存储块可以构成一个组，且对应同一个标签，形成按组可重构结构；和

当本次寻址地址与上次寻址地址对应同一个组时，可以省略本次寻址地址的标签比较，直接在该组中找到对应的指令或数据。
根据权利要求1所述结构，其特征在于，可以将所述缓存中的存储块配置为大小相等或不等的组。
根据权利要求 2 所述结构，其特征在于，所述本次寻址地址和上次寻址地址是：

两条地址连续的指令本身的地址；或

两条被先后执行的数据访问指令分别对应的数据地址；或

同一条数据访问指令先后被执行时分别对应的数据地址。
根据权利要求2所述结构，其特征在于，当进行连续地址或相近地址寻址，且地址中的标签部分相同时，即可判定本次寻址地址与上次寻址地址对应同一个组。
根据权利要求4所述结构，其特征在于，可以根据所述本次寻址地址与上次寻址地址中的索引号部分的差值，以及上次寻址地址对应的指令或数据在缓存中的位置，确定本次寻址地址对应的指令或数据在缓存中的位置。
根据权利要求5所述结构，其特征在于，可以根据寻址地址中的标签、索引号高位部分的匹配结果，以及索引号低位部分的译码结果在缓存中找到相应指令或数据。
根据权利要求6所述结构，其特征在于，可以通过选择线将寻址地址中的标签、索引号高位部分的匹配结果送往用于索引号低位部分译码的译码器；和

仅在匹配成功项对应的译码器中对索引号低位部分进行译码。
根据权利要求7所述结构，其特征在于，可以先将选择线上的匹配结果编码后通过总线传输，经解码后再送到对应的译码器。
根据权利要求6所述结构，其特征在于，还可以将所述缓存中的若干存储块配置为组相联结构，形成按组可重构结构及组相联结构共存的混合结构。
根据权利要求1所述结构，其特征在于，可以构成组相联缓存结构；其中每组（group）存储块均可以被分配给任意一个组（set）构成其的一个路（way）；且最大组（set）数目与最大路（way）数目的乘积大于存储块组（group）的数目。
根据权利要求10所述结构，其特征在于，所有存储块共享同一组位线。
根据权利要求10所述结构，其特征在于，包括一个二维表；所述二维表的行对应组（set），且至少包含一行；所述二维表的列对应路（way），且至少包含一列；所述二维表的表项内容包括：标签、有效位和组号。
根据权利要求12所述结构，其特征在于，根据存储器地址中的索引号从所述二维表中读出相应行中所有的有效标签值与存储器地址中的标签进行匹配；

根据匹配成功项中的组号在缓存中找到该存储器地址对应组（group）；

根据存储器地址中的偏移地址在所述组（group）中访问相应指令或数据。
根据权利要求13所述结构，其特征在于，还包括至少一个独立标签模块；当一个独立标签模块被分配给一个组（set）时，在所述独立标签模块中存储了所述组（set）对应的索引号值和标签值。
根据权利要求14所述结构，其特征在于，当需要对一个组（set）分配新的路（way），且所述二维表中该组（set）对应行中的全部表项均有效时，

若尚有未被占用的独立标签模块存在，在将该独立标签模块分配给该组（set）使用；

若所有独立标签模块均被占用，则根据替换算法从部分或全部独立标签模块，以及所述二维表中该组（set）对应的路（way）中确定一个用于替换。
根据权利要求15所述结构，其特征在于，当根据一个存储器地址在所述缓存中寻址时，根据所述存储器地址中的索引号从所述二维表的相应行中读出所有有效标签值，并从存储了所述索引号的所有独立标签模块中读出标签值与所述存储器地址中的标签进行匹配；

根据匹配成功项中的组号在缓存中找到该存储器地址对应组（group）；

根据存储器地址中的偏移地址在所述组（group）中访问相应指令或数据。