CN108132893A

CN108132893A - 一种支持流水的常量Cache

Info

Publication number: CN108132893A
Application number: CN201711280911.4A
Authority: CN
Inventors: 牛少平; 魏艳艳; 韩鹏; 韩一鹏; 郝冲; 邓艺
Original assignee: Xian Aeronautics Computing Technique Research Institute of AVIC
Current assignee: Xian Aeronautics Computing Technique Research Institute of AVIC
Priority date: 2017-12-06
Filing date: 2017-12-06
Publication date: 2018-06-08

Abstract

本发明涉及计算机硬件技术领域，尤其涉及一种支持流水的常量Cache，包含：PLRU算法模块2根据各个Cache块的历史访问信息，产生要更新的Cache块地址，发送给标签控制模块1；标签控制模块1用来判断当前的cache请求是否命中，并将判断结果发送至PLRU算法模块2，若命中，则直接从存储器模块4中读取内存映射到常量Cache中的数据，返回给请求发起方；如若未命中，则将参数地址缓存至FIFO模块3，等待从内存中取回数据后，根据所述要更新的Cache块地址将所述数据写入存储器模块4，再从FIFO模块3中读出所述参数地址处理；FIFO模块3用来存储没有命中的参数地址；存储器模块4用于存放映射到常量Cache中的数据，以待命中常量Cache后的读取。

Description

一种支持流水的常量Cache

技术领域

本发明涉及计算机硬件技术领域，尤其涉及一种支持流水的常量Cache。

背景技术

随着计算机系统的迅速发展,现代计算机系统越来越受主存储器性能的限制。处理器的性能以每年60％的速度在增长，而主存储器芯片带宽仅仅以每年10％的速度在增长。在速度方面，主存储器和处理器一直保持了大约一个数量级的差距。由于CPU和存储器的速度差距越来越大，于是出现了Cache，介于CPU与主存之间，他的存取速度接近于CPU速度，但是容量小，价格高昂。

Cache的出现是一种无奈的妥协，也成为了影响系统性能的关键因素之一。如今嵌入式系统正成为计算机工业中的重要组成部分，在汽车电子、音视频处理、工业自动化等领域都有着广泛的应用。嵌入式系统的一个重要特征就是它的实时性，需要对数据进行实时的传输和处理，因此对于cache结构的组织和设计也有着更高的要求。如果一次访存的数据在cache中命中，那么只需要1或2个处理器周期就能够得到数据；但如果所需要的数据不在cache中，那么往往需要高一个数量级的处理器周期来得到数据。

所以，设计实现高性能指令Cache有着深远意义。

发明内容

本发明公开了一种支持流水的常量Cache，不但能够提升命中概率，还能在保证性能的情况下，简化常量Cache的设计难度。

本发明的技术解决方案是：

一种支持流水的常量Cache，包含标签控制模块1、PLRU算法模块2、FIFO模块3和存储器模块4；

所述的PLRU算法模块2根据各个Cache块的历史访问信息，产生要更新的Cache块地址，发送给标签控制模块1；

所述的标签控制模块1用来判断当前的cache请求是否命中，并将判断结果发送至PLRU算法模块2，若命中，则直接从存储器模块4中读取内存映射到常量Cache中的数据，返回给请求发起方；如若未命中，则将参数地址缓存至FIFO模块3，等待从内存中取回数据后，根据所述要更新的Cache块地址将所述数据写入存储器模块4，再从FIFO模块3中读出所述参数地址处理；

所述的FIFO模块3用来存储没有命中的参数地址；

所述的存储器模块4用于存放映射到常量Cache中的数据，以待命中常量Cache后的读取。

映射采用二路组相联的地址映射方式。

所述二路组相联映射方式将参数地址空间按照Cache大小等分成区，再将Cache空间与参数地址空间中的每一个区等分成大小相同的组。

本发明的技术效果是：

通常来讲，已有的Cache设计实现方案多是通过增大Cache的容量或者优化替换算法等以减小Cache的缺失率。考虑到Cache容量增加带来的成本问题，以及指令Cache在整个处理器运行中所处的重要地位，本发明通过优化替换算法、优化标签控制逻辑、支持流水操作、采用组相联的地址映射方式，在不增加Cache容量的前提下提升性能，控制成本，还一定程度上降低了设计难度。

附图说明

图1是本发明结构示意图；

图2是本发明一种支持流水的常量Cache的设计实现结构图。

具体实施方式

下面结合附图和具体实施例，对本发明的技术方案进行清楚、完整地表述。显然，所表述的实施例仅是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提所获得的所有其它实施例，都属于本发明的保护范围。

一种支持流水的常量Cache，如图1所示，包含标签控制模块1、PLRU算法模块2、FIFO模块3和存储器模块4；

所述PLRU算法模块2，是利用访问Cache块的历史信息来预测未来的数据使用情况，产生要更新的Cache块地址，发送给标签控制模块1，将最长时间内没有被访问的Cache块替换掉。相较于LRU算法，本预测算法相对简单，简化了设计复杂度。

所述的标签控制模块1用来判断当前的cache请求是否命中，并将判断结果发送至PLRU算法模块2，若命中，则直接从存储器模块4中读取内存映射到常量Cache中的数据，返回给请求发起方；如若未命中，则将参数地址缓存至FIFO模块3，等待从内存中取回数据后，根据所述要更新的Cache块地址将所述数据写入存储器模块4，再从FIFO模块3中读出所述参数地址处理。

所述的FIFO模块3用来存储没有命中的参数地址；当检测到FIFO非空时，逻辑会读出FIFO中的参数访问地址，进行第二次的cache命中检测，若命中，则直接访问存储器模块读取数据并返回；若不命中，则向参数空间发出读请求并等待返回数据。对于未直接命中的请求，进行了两次比较，增加了命中概率，提升了Cache性能；

映射采用二路组相联的地址映射方式。

所述二路组相联映射方式将参数地址空间按照Cache大小等分成区，再将Cache空间与参数地址空间中的每一个区等分成大小相同的组，这样参数地址空间各区中某一组均可以直接映射装入Cache对应组的对应位置上。这种映射方式较为灵活，Cache块冲突概率较低、空间利用率较高，实现难度较低。

实施例

如图1所示，当常数Cache接收到参数请求时，标签控制模块会将参数请求的地址与标签寄存器中保存的映射地址进行比较，如若命中，则直接从存储器中读取数据，返回给请求方；如若未命中，则将该请求保存至FIFO中。一旦检测到FIFO模块非空，标签寄存器模块就会读取FIFO，进行第二次比较，若仍未命中，则产生对参数空间的读请求，待读回数据后，根据PLRU算法产生的更新地址，更新相应的存储器和标签寄存器。在进行上述过程时，Cache仍可接收参数请求，未命中的请求将保存在FIFO中，等候处理。

而对于PLRU模块，通过使用MRU(Most Recently Used)位来标记每个组每个Cache块的历史访问情况，Cache中的块与参数空间中的每个区每个组中的块按相对地址一一对应，当需要进行Cache替换时，选择在相对地址相同的Cache块中进行更新，再根据历史访问情况，选择最长时间未被访问的Cache块进行替换。

最后应说明的是，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各实施例记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种支持流水的常量Cache，其特征在于：包含标签控制模块(1)、PLRU算法模块(2)、FIFO模块(3)和存储器模块(4)；

所述的PLRU算法模块(2)根据各个Cache块的历史访问信息，产生要更新的Cache块地址，发送给标签控制模块(1)；

所述的标签控制模块(1)用来判断当前的cache请求是否命中，并将判断结果发送至PLRU算法模块(2)，若命中，则直接从存储器模块(4)中读取内存映射到常量Cache中的数据，返回给请求发起方；如若未命中，则将参数地址缓存至FIFO模块(3)，等待从内存中取回数据后，根据所述要更新的Cache块地址将所述数据写入存储器模块(4)，再从FIFO模块(3)中读出所述参数地址处理；

所述的FIFO模块(3)用来存储没有命中的参数地址；

所述的存储器模块(4)用于存放映射到常量Cache中的数据，以待命中常量Cache后的读取。

2.根据权利要求1所述的支持流水的常量Cache，其特征在于：映射采用二路组相联的地址映射方式。

3.根据权利要求2所述的支持流水的常量Cache，其特征在于：所述二路组相联映射方式将参数地址空间按照Cache大小等分成区，再将Cache空间与参数地址空间中的每一个区等分成大小相同的组。