CN102662862A - 实现混合预取的方法及相应的装置 - Google Patents

实现混合预取的方法及相应的装置 Download PDF

Info

Publication number
CN102662862A
CN102662862A CN2012100775839A CN201210077583A CN102662862A CN 102662862 A CN102662862 A CN 102662862A CN 2012100775839 A CN2012100775839 A CN 2012100775839A CN 201210077583 A CN201210077583 A CN 201210077583A CN 102662862 A CN102662862 A CN 102662862A
Authority
CN
China
Prior art keywords
partial failure
address stream
memory access
failure address
pointer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100775839A
Other languages
English (en)
Other versions
CN102662862B (zh
Inventor
程旭
党向磊
王箫音
佟冬
陆俊林
易江芳
王克义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIDA ZHONGZHI MICROSYSTEM SCIENCE AND TECHNOLOGY Co Ltd BEIJING
Original Assignee
BEIDA ZHONGZHI MICROSYSTEM SCIENCE AND TECHNOLOGY Co Ltd BEIJING
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIDA ZHONGZHI MICROSYSTEM SCIENCE AND TECHNOLOGY Co Ltd BEIJING filed Critical BEIDA ZHONGZHI MICROSYSTEM SCIENCE AND TECHNOLOGY Co Ltd BEIJING
Priority to CN201210077583.9A priority Critical patent/CN102662862B/zh
Publication of CN102662862A publication Critical patent/CN102662862A/zh
Application granted granted Critical
Publication of CN102662862B publication Critical patent/CN102662862B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Memory System Of A Hierarchy Structure (AREA)

Abstract

本发明涉及一种在处理器中实现混合预取的方法及相应的装置,使用全局历史缓冲器按时间顺序保存一份失效地址历史信息,并使用多个索引表和全局历史缓冲器中的多组指针实现多种数据预取方法。在查找可重复的访存模式并产生预取请求时,本发明按照某种顺序逐个使用各预取方法查找相应的局部失效地址流。为减少查找的时间和能耗开销,本发明在某种预取方法下找到可重复的访存模式时,即停止查找并产生预取请求,不再查找其余预取方法的局部失效地址流。本发明能够以较低的存储开销和能耗开销同时实现多种数据预取方法,从而结合利用程序运行过程中的多种访存规律提高预取的性能。

Description

实现混合预取的方法及相应的装置
技术领域
本发明涉及现代微处理器访存性能优化方法,尤其涉及一种实现混合预取的方法及相应的装置。
背景技术
随着处理器与存储器之间性能差距的不断扩大,访存延迟逐渐成为制约处理器性能的关键因素。数据预取技术在处理器访问数据之前预测其访存地址并提前发出访存请求,以隐藏访存延迟。数据预取技术主要可分为软件预取技术和硬件预取技术。其中,硬件预取技术通过捕获程序运行过程中可重复的访存模式(Memory Access Pattern)来预测后续的访存地址并自动发起预取请求。
所有缓存失效地址按时间顺序组成全局失效地址流(Miss AddressStream)。因程序行为的复杂性,全局失效地址流的规律性较差,通常的做法是对其进行局部化(Localization),即按照某种属性将其划分成局部失效地址流,并在每个局部失效地址流中捕获跨距(Stride)、地址相关(Address Correlation)、差值相关(Delta Correlation)等可重复访存模式,以预测后续的访存地址并发出预取请求。常见的局部化策略主要有两种。PC(Program Counter)局部化策略将访存指令PC相同的所有失效地址划分为一个局部失效地址流,从而可以利用一条访存指令产生的不同访存地址之间的访存规律。存储区域(MemoryRegion)局部化策略将物理地址空间划分为大小相同的存储区域并将属于同一存储区域的所有失效地址划分为一个局部失效地址流,从而可以利用不同访存指令对同一存储区域的访问规律。
但是,一种局部化策略只能利用程序运行过程中的某一种访存规律,而程序运行过程中往往同时存在多种不同的访存规律,单一的局部化策略并不能充分利用这些访存规律,这限制了数据预取的范围。因此,如何以较低的开销结合利用多种访存规律以预取更多有用数据是提高预取性能的关键。
发明内容
本发明要解决的技术问题是:提出一种实现混合预取的方法及相应的装置,能够同时利用程序运行过程中的多种访存规律来预取更多有用数据,以提高预取的性能。
本发明所采用的技术方案为:一种实现混合预取的方法,包括:
本发明使用全局历史缓冲器按时间顺序保存所有失效地址,使用索引表按照数据预取方法的局部化策略划分局部失效地址流,并使用指针将属于同一局部失效地址流的失效地址链接起来。
本发明在保持全局历史缓冲器中保存的失效地址不变的基础上,通过多个索引表和多组指针来同时实现多种数据预取方法。每增加一种数据预取方法(比如预取方法1、预取方法2、…、预取方法N),只需要增加一个索引表和一组指针。在将新的失效地址存入全局历史缓冲器时,本发明逐个更新索引表中的指针,以将新的失效地址链接到按照每个预取方法的局部化策略划分的局部失效地址流中。
在查找可重复的访存模式并产生预取请求时,本发明按照某种顺序(比如从预取方法1到预取方法N)逐个查找各预取方法的局部失效地址流。
为减少查找的时间和能耗开销,本发明在某种预取方法下找到可重复的访存模式时,即停止查找并产生预取请求,不再查找其余预取方法的局部失效地址流。
同时,本发明还提供了一种实现混合预取的预取器装置,包括:
多个索引表(Index Table),用于按照不同的局部化策略将全局失效地址流划分成局部失效地址流,以实现多种不同的数据预取方法。每个索引表使用一种局部化策略划分全局失效地址流,与一种数据预取方法相对应,含有全相联或组相联结构的多个表项,每个表项保存一个局部失效地址流的历史访存信息,并将该局部化策略的关键字作为标签位进行索引查找,每一表项包含如下各个域:
有效位,用于标识该表项是否保存有效信息;
标签域,用于在索引表所对应的数据预取方法中标识不同的局部失效地址流;
指针域,用于在索引表所对应的数据预取方法中指向全局历史缓冲器中属于该局部失效地址流的失效地址链。
进一步地,该装置还包括:
包含多组指针的全局历史缓冲器(Global History Buffer,GHB),用于按时间顺序保存所有的缓存失效地址,并使用多组指针按照不同的局部化策略将属于同一局部失效地址流的所有地址链接起来。其中,每一组指针对应一种数据预取方法,按照该数据预取方法的局部化策略,将属于同一局部失效地址流的所有失效地址链接起来,以在查找可重复访存模式时,顺着指针读出局部失效地址流的所有失效地址。
本发明的有益效果是:本发明能够以较低的存储开销和能耗开销同时实现多种数据预取方法,从而结合利用程序运行过程中的多种访存规律预取更多有用数据以提高预取的性能。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明的实现混合预取的预取器装置实施例的内部结构图。
具体实施方式
现在结合附图和优选实施例对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
如图1所示,是本发明的实现混合预取的预取器装置实施例的内部结构图,包括对应多种数据预取方法的多个索引表,其中:
对应多种数据预取方法的多个索引表(比如索引表1、索引表2、…、索引表N),用于按照不同的局部化策略将全局失效地址流划分成局部失效地址流,以实现多种不同的数据预取方法(比如预取方法1、预取方法2、…、预取方法N)。每个索引表使用一种局部化策略划分全局失效地址流,与一种数据预取方法相对应,含有全相联或组相联结构的多个表项,每个表项保存一个局部失效地址流的历史访存信息,并将该局部化策略的关键字作为标签位进行索引查找,每一表项包含如下3个域:
有效位(V),用于标识该表项是否保存有效信息;
标签域(比如Tag1、Tag2、…、TagN),用于在索引表所对应的数据预取方法中标识不同的局部失效地址流;
指针域(比如Ptr1、Ptr2、…、PtrN),用于在索引表所对应的数据预取方法中指向全局历史缓冲器中属于该局部失效地址流的失效地址链。
上述预取器装置实施例还包括包含多组指针的全局历史缓冲器(GHB),其中:
包含多组指针的全局历史缓冲器,用于按时间顺序保存所有的缓存失效地址,并使用多组指针按照不同的局部化策略将属于同一局部失效地址流的所有地址链接起来。其中,每一组指针对应一种数据预取方法,按照该数据预取方法的局部化策略,将属于同一局部失效地址流的所有失效地址链接起来,以在查找可重复访存模式时,顺着指针读出局部失效地址流的所有失效地址。每个全局历史缓冲器表项包含如下多个域:
失效地址域(MissAddr),用于保存缓存失效地址;
多个指针域(比如Ptr1、Ptr2、…、PtrN),用于按照所对应的数据预取方法的局部化策略将属于同一局部失效地址流的所有失效地址链接起来。
在上述预取器装置实施例中,
在将新的失效地址存入全局历史缓冲器时,本发明逐个更新索引表中的指针(比如Ptr1、Ptr2、…、PtrN),以将新的失效地址链接到按照每个预取方法的局部化策略划分的局部失效地址流中。
在查找可重复的访存模式并产生预取请求时,本发明按照某种顺序(比如从预取方法1到预取方法N)逐个查找各预取方法的局部失效地址流。在查找某种预取方法的某个局部失效地址流时,本发明顺着该预取方法的指针域(比如Ptr1、Ptr2、…、PtrN)逐个读出属于该局部失效地址流的所有失效地址,并尝试捕捉跨距(Stride)、地址相关(Address Correlation)、差值相关(DeltaCorrelation)等可重复访存模式。为减少查找的时间和能耗开销,本发明在某种预取方法下找到可重复的访存模式时,即停止查找并产生预取请求,不再查找其余预取方法的局部失效地址流。
以上说明书中描述的只是本发明的具体实施方式,各种举例说明不对本发明的实质内容构成限制,所属技术领域的普通技术人员在阅读了说明书后可以对以前所述的具体实施方式做修改或变形,而不背离发明的实质和范围。

Claims (8)

1.一种实现混合预取的方法,其特征在于:使用全局历史缓冲器按时间顺序保存一份失效地址历史信息,并使用多个索引表和全局历史缓冲器中的多组指针实现多种数据预取方法。
2.如权利要求1所述的实现混合预取的方法,其特征在于:使用索引表按照数据预取方法的局部化策略划分局部失效地址流,并使用指针将属于同一局部失效地址流的失效地址链接起来。
3.如权利要求1所述的实现混合预取的方法,其特征在于:每增加一种数据预取方法,需要增加一个索引表和一组指针;在将新的失效地址存入全局历史缓冲器时,逐个更新索引表中的指针,以将新的失效地址链接到按照每个预取方法的局部化策略划分的局部失效地址流中。
4.如权利要求1所述的实现混合预取的方法,其特征在于:在查找可重复的访存模式并产生预取请求时,按照顺序逐个查找各预取方法的局部失效地址流。
5.如权利要求1所述的实现混合预取的方法,其特征在于:在某种预取方法下找到可重复的访存模式时,即停止查找并产生预取请求,不再查找其余预取方法的局部失效地址流。
6.一种实现混合预取的预取器装置,其特征在于:多个索引表,用于按照不同的局部化策略将全局失效地址流划分成局部失效地址流,以实现多种不同的数据预取方法;每个索引表使用一种局部化策略划分全局失效地址流,与一种数据预取方法相对应,含有全相联或组相联结构的多个表项,每个表项保存一个局部失效地址流的历史访存信息,并将该局部化策略的关键字作为标签位进行索引查找,每一表项包含如下各个域:
有效位,用于标识该表项是否保存有效信息;
标签域,用于在索引表所对应的数据预取方法中标识不同的局部失效地址流;
指针域,用于在索引表所对应的数据预取方法中指向全局历史缓冲器中属于该局部失效地址流的失效地址链。
7.如权利要求6所述的实现混合预取的预取器装置,其特征在于:还包含多组指针的全局历史缓冲器,用于按时间顺序保存所有的缓存失效地址,并使用多组指针按照不同的局部化策略将属于同一局部失效地址流的所有地址链接起来。
8.如权利要求7所述的实现混合预取的预取器装置,其特征在于:每一组指针对应一种数据预取方法,按照该数据预取方法的局部化策略,将属于同一局部失效地址流的所有失效地址链接起来,以在查找可重复访存模式时,顺着指针读出局部失效地址流的所有失效地址。
CN201210077583.9A 2012-03-22 2012-03-22 实现混合预取的方法及相应的装置 Active CN102662862B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210077583.9A CN102662862B (zh) 2012-03-22 2012-03-22 实现混合预取的方法及相应的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210077583.9A CN102662862B (zh) 2012-03-22 2012-03-22 实现混合预取的方法及相应的装置

Publications (2)

Publication Number Publication Date
CN102662862A true CN102662862A (zh) 2012-09-12
CN102662862B CN102662862B (zh) 2015-01-21

Family

ID=46772358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210077583.9A Active CN102662862B (zh) 2012-03-22 2012-03-22 实现混合预取的方法及相应的装置

Country Status (1)

Country Link
CN (1) CN102662862B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890722A (zh) * 2012-10-25 2013-01-23 国家电网公司 应用于时序历史数据库的索引方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321301B1 (en) * 1999-05-06 2001-11-20 Industrial Technology Research Institute Cache memory device with prefetch function and method for asynchronously renewing tag addresses and data during cache miss states
CN101105773A (zh) * 2007-08-20 2008-01-16 杭州华三通信技术有限公司 一种利用缓存实现数据存储的方法和装置
US20100030973A1 (en) * 2008-08-04 2010-02-04 International Business Machines Corporation Cache directed sequential prefetch
CN101751246A (zh) * 2008-12-15 2010-06-23 国际商业机器公司 预取数据的系统和方法
CN102163144A (zh) * 2011-05-05 2011-08-24 浙江大学 嵌入式处理器的硬件数据预取方法
CN102214146A (zh) * 2011-07-28 2011-10-12 中国人民解放军国防科学技术大学 步长自适应的Cache预取方法及其系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321301B1 (en) * 1999-05-06 2001-11-20 Industrial Technology Research Institute Cache memory device with prefetch function and method for asynchronously renewing tag addresses and data during cache miss states
CN101105773A (zh) * 2007-08-20 2008-01-16 杭州华三通信技术有限公司 一种利用缓存实现数据存储的方法和装置
US20100030973A1 (en) * 2008-08-04 2010-02-04 International Business Machines Corporation Cache directed sequential prefetch
CN101751246A (zh) * 2008-12-15 2010-06-23 国际商业机器公司 预取数据的系统和方法
CN102163144A (zh) * 2011-05-05 2011-08-24 浙江大学 嵌入式处理器的硬件数据预取方法
CN102214146A (zh) * 2011-07-28 2011-10-12 中国人民解放军国防科学技术大学 步长自适应的Cache预取方法及其系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
沈立: "基于控制流的混合指令预取", 《电子学报》 *
王箫音: "一种高效能的面相单发射按序处理器的预执行机制", 《电子学报》 *
肖俊华: "片上多处理器中基于步长和指针的预取", 《计算机工程》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102890722A (zh) * 2012-10-25 2013-01-23 国家电网公司 应用于时序历史数据库的索引方法
CN102890722B (zh) * 2012-10-25 2015-03-11 国家电网公司 应用于时序历史数据库的索引方法

Also Published As

Publication number Publication date
CN102662862B (zh) 2015-01-21

Similar Documents

Publication Publication Date Title
CN103885728B (zh) 一种基于固态盘的磁盘缓存系统
US20170083452A1 (en) Memory management for a hierarchical memory system
CN101571835B (zh) 基于程序的需求来改变Cache组相联度的实现方法
CN100478918C (zh) 微处理器中分段高速缓存的设计方法及分段高速缓存
US9582282B2 (en) Prefetching using a prefetch lookup table identifying previously accessed cache lines
CN103294822B (zh) 一种基于主动哈希和布隆过滤器的高效缓存方法
CN102110073B (zh) 一种片上共享高速缓存的替换装置和方法以及相应处理器
CN102306093A (zh) 实现现代处理器间接转移预测的装置及方法
CN101944068A (zh) 一种共享高速缓存的性能优化方法
WO2015075673A4 (en) Systems and methods for reducing first level cache energy by eliminating cache address tags
CN102521158B (zh) 一种实现数据预取的方法及装置
CN102662869A (zh) 虚拟机中的内存访问方法和装置及查找器
CN101694640B (zh) 多核架构下共享二级Cache的替换策略的实现方法
CN109815167A (zh) 用于高效虚拟标记的高速缓存实现的系统和方法
CN104536911A (zh) 一种多路组相联的高速缓冲存储器及其处理方法
CN104572845A (zh) 文件分发方法、装置、设备及系统
CN103176914B (zh) 一种低缺失率、低缺失惩罚的缓存方法和装置
CN103207772A (zh) 一种优化实时任务wcet的指令预取内容选取方法
CN105359142B (zh) 哈希连接方法和装置
CN103019959A (zh) 一种指令高速缓冲存储器
CN102999443A (zh) 一种计算机缓存系统的管理方法
US9836410B2 (en) Burst translation look-aside buffer
CN102662862B (zh) 实现混合预取的方法及相应的装置
CN104731720A (zh) 组相连的二级内存管理装置
CN104850508B (zh) 基于数据局部性的访存方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant