CN109558093A - 一种针对图像处理型负载的混合内存页面迁移方法 - Google Patents

一种针对图像处理型负载的混合内存页面迁移方法 Download PDF

Info

Publication number
CN109558093A
CN109558093A CN201811554119.8A CN201811554119A CN109558093A CN 109558093 A CN109558093 A CN 109558093A CN 201811554119 A CN201811554119 A CN 201811554119A CN 109558093 A CN109558093 A CN 109558093A
Authority
CN
China
Prior art keywords
page
dram
pcm
memory
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811554119.8A
Other languages
English (en)
Other versions
CN109558093B (zh
Inventor
付方发
牛娜
王进祥
苑嘉才
来逢昌
王永生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201811554119.8A priority Critical patent/CN109558093B/zh
Publication of CN109558093A publication Critical patent/CN109558093A/zh
Application granted granted Critical
Publication of CN109558093B publication Critical patent/CN109558093B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/0647Migration mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0688Non-volatile semiconductor memory arrays

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

一种针对图像处理型负载的混合内存页面迁移方法,本发明涉及混合内存页面迁移方法。本发明目的是为了解决现有混合内存使用寿命低、性能受损的问题。时刻t,当有写操作发生在PCM页面且该页面的写操作次数大于等于n且该页面的脏位为1时,在DRAM中或DRAM缓存中寻找替换页面,启动迁移,请求计数器加1。请求计数器每隔内存引用距离的整数倍重新开始计数,同时将PCM缓存中页面的脏位全部置0。然后令t=t+1,重新执行以上步骤。本发明用于针对图像处理型负载的混合内存页面迁移领域。

Description

一种针对图像处理型负载的混合内存页面迁移方法
技术领域
本发明涉及混合内存页面迁移方法,特别涉及适用于针对图像处理型负载的混合内存迁移算法。
背景技术
为了满足现代嵌入式系统运行图像处理型负载对存储器内存的大容量和低功耗的要求,DRAM与非易失性存储器构成的混合型内存得到了广泛的应用。在非易失存储器中相变存储器PCM(Phase Change Memory)已经成为学术界和工业界的新宠。相比于传统DRAM,PCM持久性内存具有静态功率低,存储密度高,按字节寻址的能力和数据持久力高等优点,这些优点为存储器的高效性能带来了巨大的挑战和机遇。尽管PCM优点众多,但其较高的写入延时和较低的写耐受力限制了PCM的使用寿命。在PCM和DRAM的混合主存储器设计中,混合主存利用DRAM的低延迟和高耐受性来弥补PCM在这方面的缺陷。如何提高平行混合架构中PCM的使用寿命成为目前的研究热点。页面迁移算法是被广泛采用的用于提高混合存储器耐受性的一种方法。对于混合存储器,先前的页面替换方案明显的存在2个问题:(1)先前的分配策略总是提出针对通用型负载的页面迁移方案。然而,很少进行以图像处理型负载为研究对象的特定页面迁移策略。(2)以前的分配策略对未来的写预测并不十分准确,有可能导致不必要的页面迁移,这可能会增加页面管理的开销。
综上,针对图片处理型负载,现有的混合内存页面迁移算法中存在写预测准确率不高,非必要迁移次数较高的问题,从而导致了混合内存使用寿命低、性能受损的现象频繁产生。
发明内容
本发明目的是为了解决现有混合内存使用寿命低、性能受损的问题,而提出一种针对图像处理型负载的混合内存页面迁移方法。
上述的发明目的是通过以下技术方案实现的:
步骤1、t时刻,当有页面P被访存时,首先判断该操作发生在哪种存储介质中:
如果发生在DRAM中,页面P的dirty_bit置1,进入步骤5;
如果发生在PCM中,进入步骤2;
所述DRAM为动态随机存取存储器;
所述PCM为非易失存储器中相变存储器;
步骤2、如果发生在PCM中的操作是读操作,进入步骤5;
如果发生在PCM中的的操作是写操作,判断当前的写操作发生页面P的写计数器是否大于等n并且页面P的dirty_bit是否为1,如果条件满足,进入步骤3,如不满足,进入步骤5;
步骤3、在DRAM中寻找替换页面,如果存在替换页面V,则进入步骤4,否则进入步骤5;
步骤4、将页面P与页面V进行交换,进入步骤5;
步骤5、存储器请求计数器加1;进入步骤6;
步骤6、如果存储器请求计数器是inter-reference distance的整数倍,则PCM中所有页面的dirty_bit全部置0,令t=t+1,重新执行步骤1至步骤6;
如果存储器请求计数器不是inter-reference distance的整数倍且页面P在PCM中,则将页面P的dirty_bit置1,令t=t+1,重新执行步骤1至步骤6;
如果存储器请求计数器不是inter-reference distance的整数倍且页面P不在PCM中,令t=t+1,重新执行步骤1至步骤6;
所述inter-reference distance为内部引用距离。
本发明的有益效果为:
本发明针对图像处理型负载,利用内部引用距离inter-reference distance及页面访存次数来预测未来页面写操作热度,使得系统使用有限的页面迁移次数,准确的选出写热页面,使大量的写操作发生在DRAM中,减少了PCM中的写操作数量,延长了混合内存使用寿命。避免了现有的混合内存页面迁移算法中写预测准确率不高,非必要迁移次数较高,而导致的混合内存使用寿命低、性能受损的问题。
实验结果表明,相较于传统的RaPP算法和无迁移算法,本发明使在PCM中的写入操作分别平均减少了33.69%和86.85%。本发明的迁移计数仅为RaPP的49.44%,而平均每次迁移减少的写次数是RaPP算法的2.57倍。对于每个迁移过的页面,该页面在迁移后平均被访存次数是RaPP的1.46倍。同时,与RaPP相比,本发明使得PCM的有效页面访问时间平均降低了21.91%。
附图说明
图1为本发明一种针对图像处理型负载的混合内存页面迁移方法WIRD和传统RaPP算法的平均迁移次数对比图;
图2为本发明一种针对图像处理型负载的混合内存页面迁移方法WIRD和传统RaPP算法每一次迁移减少的PCM写操作数目对比图;
图3为本发明一种针对图像处理型负载的混合内存页面迁移方法WIRD和传统RaPP算法迁移页的平均访存次数对比图;
图4a为采用本发明一种针对图像处理型负载的混合内存页面迁移方法WIRD、传统RaPP算法、无迁移算法对dikkstra图片处理型负载的PCM内存访问平均延时对比图;
图4b为采用本发明一种针对图像处理型负载的混合内存页面迁移方法WIRD、传统RaPP算法、无迁移算法对FFT图片处理型负载的PCM内存访问平均延时对比图;
图4c为采用本发明一种针对图像处理型负载的混合内存页面迁移方法、传统RaPP算法、无迁移算法对h264enc图片处理型负载的PCM内存访问平均延时对比图;
图4d为采用本发明一种针对图像处理型负载的混合内存页面迁移方法WIRD、传统RaPP算法、无迁移算法对jpeg_dec图片处理型负载的PCM内存访问平均延时对比图;
图4e为采用本发明一种针对图像处理型负载的混合内存页面迁移方法WIRD、传统RaPP算法、无迁移算法对jpeg_enc图片处理型负载的PCM内存访问平均延时对比图;
图4f为采用本发明一种针对图像处理型负载的混合内存页面迁移方法WIRD、传统RaPP算法、无迁移算法对mpeg2dec图片处理型负载的PCM内存访问平均延时对比图。
具体实施方式
具体实施方式一:本实施方式一种针对图像处理型负载的混合内存页面迁移方法具体过程为:
步骤1、t时刻,当有页面P被访存时,首先判断该操作发生在哪种存储介质中:
如果发生在DRAM中,页面P的dirty_bit置1,进入步骤5;
如果发生在PCM中,进入步骤2;
所述DRAM(Dynamic Random Access Memory)为动态随机存取存储器;
所述PCM为非易失存储器中相变存储器;
步骤2、如果发生在PCM中的操作是读操作,进入步骤5;
如果发生在PCM中的的操作是写操作,判断当前的写操作发生页面P的写计数器是否大于等n并且页面P的dirty_bit是否为1,如果条件满足,进入步骤3,如不满足,进入步骤5;
步骤3、在DRAM中寻找替换页面,如果存在替换页面V,则进入步骤4,否则进入步骤5;
步骤4、将页面P与页面V进行交换,进入步骤5;
步骤5、存储器请求计数器加1;进入步骤6;
步骤6、如果存储器请求计数器是inter-reference distance的整数倍,则PCM中所有页面(如过步骤3不发生就是p,发生了就是v)的dirty_bit全部置0,令t=t+1,重新执行步骤1至步骤6;
所述dirty bit为重要标识位;
如果存储器请求计数器不是inter-reference distance的整数倍且页面P在PCM中,则将页面P的dirty_bit置1,令t=t+1,重新执行步骤1至步骤6;
如果存储器请求计数器不是inter-reference distance的整数倍且页面P不在PCM中,令t=t+1,重新执行步骤1至步骤6;
所述inter-reference distance为内部引用距离。
一种针对图像处理型负载的混合内存页面迁移方法伪代码为:
具体实施方式二:本实施方式与具体实施方式一不同的是,所述步骤2中5≤n≤20。
其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是,所述步骤3中在DRAM中寻找替换页面,具体过程为:
判断DRAM中是否存在空页面:
若存在空页面,该DRAM中空页面作为替换页面,若不存在空页面,判断DRAM中是否存在没有被访存过的页面:
若存在没有被访存过的页面,该DRAM中没有被访存过的页面作为替换页面,若不存在没有被访存过的页面,判断DRAM中是否存在连续m次没有被访存过的页面:
若存在连续m次没有被访存过的页面,该DRAM中连续m次没有被访存过的页面作为替换页面,若不存在连续m次没有被访存过的页面,则不存在替换页面。
其它步骤及参数与具体实施方式一或二相同。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是,所述1≤m≤20。
其它步骤及参数与具体实施方式一至三之一相同。
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是,所述步骤六中50≤inter-reference distance≤3000。
其它步骤及参数与具体实施方式一至四之一相同。
采用以下实施例验证本发明的有益效果:
实施例一:
本实施例具体是按照以下步骤制备的:
本发明使用Gem5-Nvmain系统模拟器对dikkstra,FFT,mpeg2dec,h264enc,jpeg_enc,jpeg_dec这六种常用的图片处理型负载进行测试,这些负载来自mediabench或Mibench。主存储器的详细仿真配置列于表1中。
表1:仿真配置
如图1、2、3所示,对于图片处理型负载,本发明的平均迁移次数是RaPP的49.44%(如图1所示),但是对于每一次迁移减少的PCM写操作数目是RaPP的2.57倍(如图2所示),迁移过的页的平均访存次数是RaPP的1.46倍(如图3所示)。这说明迁移上去的是写热度较高的页面,迁移次数的减少在降低迁移开销的同时屏蔽了没有必要的迁移,实现了对写频繁页面较为精准的预测和有限高效的迁移。
图4a、4b、4c、4d、4e、4f显示了对于不同负载的PCM内存访问平均延时,分别为:DRAM平均读操作排队延时T1、DRAM平均读操作处理延时T2、DRAM平均写操作排队延时T3、DRAM平均写操作处理延时T4、PCM平均读操作排队延时T5、PCM平均读操作处理延时T6、PCM平均写操作排队延时T7、PCM平均写操作处理延时T8。如图4a、4b、4c、4d、4e、4f所示,本发明将PCM的有效页面访问延时降低至RaPP的78.09%。
本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (5)

1.一种针对图像处理型负载的混合内存页面迁移方法,其特征在于:所述方法具体过程为:
步骤1、t时刻,当有页面P被访存时,首先判断该操作发生在哪种存储介质中:
如果发生在DRAM中,页面P的dirty_bit置1,进入步骤5;
如果发生在PCM中,进入步骤2;
所述DRAM为动态随机存取存储器;
所述PCM为非易失存储器中相变存储器;
步骤2、如果发生在PCM中的操作是读操作,进入步骤5;
如果发生在PCM中的的操作是写操作,判断当前的写操作发生页面P的写计数器是否大于等n并且页面P的dirty_bit是否为1,如果条件满足,进入步骤3,如不满足,进入步骤5;
步骤3、在DRAM中寻找替换页面,如果存在替换页面V,则进入步骤4,否则进入步骤5;
步骤4、将页面P与页面V进行交换,进入步骤5;
步骤5、存储器请求计数器加1;进入步骤6;
步骤6、如果存储器请求计数器是inter-reference distance的整数倍,则PCM中所有页面的dirty_bit全部置0,令t=t+1,重新执行步骤1至步骤6;
如果存储器请求计数器不是inter-reference distance的整数倍且页面P在PCM中,则将页面P的dirty_bit置1,令t=t+1,重新执行步骤1至步骤6;
如果存储器请求计数器不是inter-reference distance的整数倍且页面P不在PCM中,令t=t+1,重新执行步骤1至步骤6;
所述inter-reference distance为内部引用距离。
2.根据权利要求1所述一种针对图像处理型负载的混合内存页面迁移方法,其特征在于:所述步骤2中5≤n≤20。
3.根据权利要求1或2所述一种针对图像处理型负载的混合内存页面迁移方法,其特征在于:所述步骤3中在DRAM中寻找替换页面,具体过程为:
判断DRAM中是否存在空页面:
若存在空页面,该DRAM中空页面作为替换页面,若不存在空页面,判断DRAM中是否存在没有被访存过的页面:
若存在没有被访存过的页面,该DRAM中没有被访存过的页面作为替换页面,若不存在没有被访存过的页面,判断DRAM中是否存在连续m次没有被访存过的页面:
若存在连续m次没有被访存过的页面,该DRAM中连续m次没有被访存过的页面作为替换页面,若不存在连续m次没有被访存过的页面,则不存在替换页面。
4.根据权利要求3所述一种针对图像处理型负载的混合内存页面迁移方法,其特征在于:所述1≤m≤20。
5.根据权利要求4所述一种针对图像处理型负载的混合内存页面迁移方法,其特征在于:所述步骤六中50≤inter-reference distance≤3000。
CN201811554119.8A 2018-12-19 2018-12-19 一种针对图像处理型负载的混合内存页面迁移方法 Active CN109558093B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811554119.8A CN109558093B (zh) 2018-12-19 2018-12-19 一种针对图像处理型负载的混合内存页面迁移方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811554119.8A CN109558093B (zh) 2018-12-19 2018-12-19 一种针对图像处理型负载的混合内存页面迁移方法

Publications (2)

Publication Number Publication Date
CN109558093A true CN109558093A (zh) 2019-04-02
CN109558093B CN109558093B (zh) 2022-04-15

Family

ID=65870461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811554119.8A Active CN109558093B (zh) 2018-12-19 2018-12-19 一种针对图像处理型负载的混合内存页面迁移方法

Country Status (1)

Country Link
CN (1) CN109558093B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543433A (zh) * 2019-08-30 2019-12-06 中国科学院微电子研究所 一种混合内存的数据迁移方法及装置
CN112181870A (zh) * 2020-09-17 2021-01-05 重庆大学 内存页面管理方法、装置、设备及可读存储介质
CN113608698A (zh) * 2021-08-05 2021-11-05 上海理工大学 一种基于DRAM牺牲Cache的异构内存页迁移系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317739A (zh) * 2014-10-28 2015-01-28 清华大学 一种混合内存页面调度方法及装置
US20150143037A1 (en) * 2011-04-06 2015-05-21 P4tents1, LLC System, method and computer program product for multi-thread operation involving first memory of a first memory class and second memory of a second memory class
CN104899154A (zh) * 2015-06-10 2015-09-09 山东大学 基于嵌入式系统混合主存的页面管理方法
US20160085585A1 (en) * 2013-05-31 2016-03-24 Huawei Technologies Co., Ltd. Memory System, Method for Processing Memory Access Request and Computer System
CN107193646A (zh) * 2017-05-24 2017-09-22 中国人民解放军理工大学 一种基于混合主存架构的高效动态页面调度方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150143037A1 (en) * 2011-04-06 2015-05-21 P4tents1, LLC System, method and computer program product for multi-thread operation involving first memory of a first memory class and second memory of a second memory class
US20160085585A1 (en) * 2013-05-31 2016-03-24 Huawei Technologies Co., Ltd. Memory System, Method for Processing Memory Access Request and Computer System
CN104317739A (zh) * 2014-10-28 2015-01-28 清华大学 一种混合内存页面调度方法及装置
CN104899154A (zh) * 2015-06-10 2015-09-09 山东大学 基于嵌入式系统混合主存的页面管理方法
CN107193646A (zh) * 2017-05-24 2017-09-22 中国人民解放军理工大学 一种基于混合主存架构的高效动态页面调度方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
VIDYADHAR PHALKE,BHASKARPILLAI GOPINATH: "An inter-reference gap model for temporal locality in program behavior", 《ACM》 *
何爱华等: "PCM混合主存系统的写感知主存管理算法", 《CNKI》 *
刘巍: "基于空间局部性的PCM和DRAM混合内存页面调度算法", 《中国科技论文》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110543433A (zh) * 2019-08-30 2019-12-06 中国科学院微电子研究所 一种混合内存的数据迁移方法及装置
CN110543433B (zh) * 2019-08-30 2022-02-11 中国科学院微电子研究所 一种混合内存的数据迁移方法及装置
CN112181870A (zh) * 2020-09-17 2021-01-05 重庆大学 内存页面管理方法、装置、设备及可读存储介质
CN112181870B (zh) * 2020-09-17 2022-10-28 重庆大学 内存页面管理方法、装置、设备及可读存储介质
CN113608698A (zh) * 2021-08-05 2021-11-05 上海理工大学 一种基于DRAM牺牲Cache的异构内存页迁移系统及方法
CN113608698B (zh) * 2021-08-05 2024-02-23 上海理工大学 一种基于DRAM牺牲Cache的异构内存页迁移系统及方法

Also Published As

Publication number Publication date
CN109558093B (zh) 2022-04-15

Similar Documents

Publication Publication Date Title
CN104090847B (zh) 一种固态存储设备的地址分配方法
CN101105772B (zh) 控制计算机可读存储器的方法和管理数据单元的装置
CN109558093A (zh) 一种针对图像处理型负载的混合内存页面迁移方法
CN103019955B (zh) 基于pcram主存应用的内存管理方法
CN105117285B (zh) 一种基于移动虚拟化系统的非易失性存储器调度优化方法
CN104503703A (zh) 缓存的处理方法和装置
CN104346284A (zh) 一种内存管理方法及内存管理设备
CN104699424A (zh) 一种基于页面热度的异构内存管理方法
CN103412884A (zh) 一种异构存储介质下嵌入式数据库的管理方法
CN102136993A (zh) 一种数据迁移的方法、装置和系统
CN105094709A (zh) 一种固态盘存储系统的动态数据压缩方法
CN107817945A (zh) 一种混合内存结构的数据读取方法和系统
CN108572799B (zh) 一种双向哈希链表的异构内存系统数据页迁移方法
CN109918450A (zh) 基于分析类场景下的分布式并行数据库及存储方法
CN103198021B (zh) 一种提高固态硬盘数据传输效率的方法
CN116501249A (zh) 一种减少gpu内存重复数据读写的方法及相关设备
CN102567225A (zh) 一种管理系统内存的方法及装置
Hong et al. Improving SSD performance using adaptive restricted-copyback operations
CN102411543B (zh) 缓存地址的处理方法和装置
Chang et al. FastRead: Improving read performance for multilevel-cell flash memory
CN109656482A (zh) 一种基于存储器访问的写热页面预测方法
CN111078143B (zh) 基于段映射进行数据布局和调度的混合存储方法及系统
CN104765572A (zh) 一种节能的虚拟存储服务器系统及其调度方法
CN108563586A (zh) 一种分离固态盘中垃圾回收数据与用户数据的方法
JP2012185764A (ja) メモリアクセス処理システム、制御方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant