CN109542803A - 一种基于深度学习的混合多模式热数据缓存策略 - Google Patents

一种基于深度学习的混合多模式热数据缓存策略 Download PDF

Info

Publication number
CN109542803A
CN109542803A CN201811385060.4A CN201811385060A CN109542803A CN 109542803 A CN109542803 A CN 109542803A CN 201811385060 A CN201811385060 A CN 201811385060A CN 109542803 A CN109542803 A CN 109542803A
Authority
CN
China
Prior art keywords
data
deep learning
cache
dsc data
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811385060.4A
Other languages
English (en)
Inventor
张卫山
房凯
任鹏程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Zhiyong New Material Technology Co ltd
Original Assignee
Qingdao Zhiyong New Material Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Zhiyong New Material Technology Co ltd filed Critical Qingdao Zhiyong New Material Technology Co ltd
Priority to CN201811385060.4A priority Critical patent/CN109542803A/zh
Publication of CN109542803A publication Critical patent/CN109542803A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0893Caches characterised by their organisation or structure
    • G06F12/0895Caches characterised by their organisation or structure of parts of caches, e.g. directory or tag array

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

本发明提出一种基于深度学习的混合多模式热数据缓存策略。在索引缓存层快速响应大部分的查询请求,减少持久存储层的访问次数,提高索引系统的整体性能是分层式索引模型的设计目标。但缓存的容量毕竟是有限的,如何选择一种合适的缓存替换策略,在使用尽量少的缓存情况下,提高其命中率成为提升索引系统整体性能的一个重要研究问题,因此我们提出基于深度学习的混合多模式热数据缓存替换策略。在原有的多模式热数据敏感的缓存策略基础上,通过支撑平台提供的查询趋势预测服务,对查询任务进行预测,采用深度学习中的DBN预测算法来预测在完成一次查询任务后,下一次可能的查询任务,将与预测到的查询任务相关的索引记录加载至缓存层中,从而增大缓存中索引记录的命中率,提高查询效率。

Description

一种基于深度学习的混合多模式热数据缓存策略
技术领域
本发明涉及缓存替换策略,智能预测和深度学习,具体涉及到一种基于深度学习的智能预测方法。
背景技术
通过在索引缓存层快速响应大部分的查询请求,以减少持久存储层的访问次数,从而提高索引系统的整体性能。由于缓存的容量是有限的,需要选择一种合适的缓存替换策略,在使用尽量少的缓存情况下,提高其命中率,提升索引系统的整体性能。在内存索引服务进程中,使频繁访问的数据能够贮存在索引缓存层,从而更有效地利用内存空间并提升索引查询性能。最接近本发明的技术有:
(1)、最不经常使用(LFU)算法:LFU(Least Frequently Used,最不经常使用)算法将一段时间内被访问次数最少的那个块替换出去。每块设置一个计数器,从0开始计数,每访问一次,被访块的计数器就增1。当需要替换时,将计数值最小的块换出,同时将所有块的计数器都清零。这种算法将计数周期限定在对这些特定块两次替换之间的间隔时间内,不能严格反映近期访问情况,新调入的块很容易被替换出去。
(2)、近期最少使用(LRU)算法:LRU(Least Recently Used,近期最少使用)算法是把CPU近期最少使用的块替换出去。这种替换方法需要随时记录Cache中各块的使用情况,以便确定哪个块是近期最少使用的块。每块也设置一个计数器,Cache每命中一次,命中块计数器清零,其他各块计数器增1。当需要替换时,将计数值最大的块换出。LRU算法相对合理,但实现起来比较复杂,系统开销较大。这种算法保护了刚调入Cache的新数据块,具有较高的命中率。LRU算法不能肯定调出去的块近期不会再被使用,所以这种替换算法不能算作最合理、最优秀的算法。但是研究表明,采用这种算法可使Cache的命中率达到90%左右。
(3)、随机替换:随机替换算法完全不管Cache的情况,简单地根据一个随机数选择一块替换出去。随机替换算法在硬件上容易实现,且速度也比前两种算法快。缺点则是降低了命中率和Cache工作效率。
(4)、基于近期最少使用(LRU)算法的缓存替换策略:使用指数平滑方法来预测索引记录的热度,在替换时根据预测热度值来决定当前替换的内容。首先,按照热度预测公式对所有的索引记录进行热度预测。然后根据预测热度值对记录进行排序。最后按预测热度值从高到低将索引记录缓存到内存中,直到内存缓存用满为止。
为了能够更加精准的选择加载至缓存中的索引,在原有的多模式热数据敏感的缓存策略基础上,通过支撑平台提供的查询趋势预测服务,对查询任务进行预测。在查询趋势预测服务中,采用深度学习中的DBN预测算法来预测在完成一次查询任务后,下一次可能的查询任务,将与预测到的查询任务相关的索引记录加载至缓存层中,从而增大缓存中索引记录的命中率,提高查询效率,作为多模式热数据敏感的缓存替换策略的补充和加强。
发明内容
为解决现有技术中的缺点和不足,本发明提出了基于深度学习的混合多模式热数据缓存策略,采用深度学习中的DBN预测算法作为多模式热数据敏感的缓存替换策略的补充。
本发明的技术方案为:
一种基于深度学习的混合多模式热数据缓存策略,其特征在于,在原有的多模式热数据敏感的缓存策略基础上,采用深度学习中的DBN预测算法作为多模式热数据敏感的缓存替换策略的补充和加强,包括以下步骤:
步骤(1)、聚合数据;
步骤(2)、对(1)的数据进行差分变换以降低数据的线性度,归一化数据,分析数据内部的自相关和自回归特性;
步骤(3)、按照从下到上的顺序逐层训练RBM,并通过BP算法优化整体网络结构;
步骤(4)、使用前一步训练出的网络对云属性进行长短期预测;
步骤(5)、将(4)中的预测结果进行与(2)相反的逆变换,得到原数据的预测值。
本发明的有益效果:
(1)在索引缓存层快速响应大部分的查询请求,减少持久存储层的访问次数,提高索引系统的整体性能;
(2)在使用尽量少的缓存情况下,提高其命中率;
(3)在内存索引服务进程中,使频繁访问的数据能够贮存在索引缓存层,从而更有效地利用内存空间并提升索引查询性能;
(4)采用深度学习中的DBN预测算法来预测在完成一次查询任务后,下一次可能的查询任务,将与预测到的查询任务相关的索引记录加载至缓存层中,从而增大缓存中索引记录的命中率,提高查询效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于深度学习中DBN算法的模型图。
图2为本发明基于DBN算法的智能预测过程。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,基于深度学习DBN算法的智能预测方法的过程主要包括3个部分:对数据进行预处理、DBN预训练和BP算法的优化和预测结果的后处理。
下面结合图1与图2,对基于深度学习的智能预测方法的具体流程进行详细说明:
步骤(1)、聚合数据;
步骤(2)、对(1)的数据进行差分变换以降低数据的线性度,归一化数据,分析数据内部的自相关和自回归特性;
步骤(3)、按照从下到上的顺序逐层训练RBM,并通过BP算法优化整体网络结构;
步骤(4)、使用前一步训练出的网络对云属性进行长短期预测;
步骤(5)、将(4)中的预测结果进行与(2)相反的逆变换,得到原数据的预测值。
本发明的基于深度学习的热数据敏感的缓存替换策略,可以预测数据的使用情况,并按热度由高到低确定保留在内存中索引,能较好地适应不同的应用场景并有效地将热数据缓存在内存中,从而进一步提高了分层式索引系统的查询效率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种基于深度学习的混合多模式热数据缓存策略,其特征在于,在原有的多模式热数据敏感的缓存策略基础上,采用深度学习中的DBN预测算法作为多模式热数据敏感的缓存替换策略的补充和加强,包括以下步骤:
步骤(1)、聚合数据;
步骤(2)、对(1)的数据进行差分变换以降低数据的线性度,归一化数据,分析数据内部的自相关和自回归特性;
步骤(3)、按照从下到上的顺序逐层训练RBM,并通过BP算法优化整体网络结构;
步骤(4)、使用前一步训练出的网络对云属性进行长短期预测;
步骤(5)、将(4)中的预测结果进行与(2)相反的逆变换,得到原数据的预测值。
CN201811385060.4A 2018-11-20 2018-11-20 一种基于深度学习的混合多模式热数据缓存策略 Pending CN109542803A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811385060.4A CN109542803A (zh) 2018-11-20 2018-11-20 一种基于深度学习的混合多模式热数据缓存策略

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811385060.4A CN109542803A (zh) 2018-11-20 2018-11-20 一种基于深度学习的混合多模式热数据缓存策略

Publications (1)

Publication Number Publication Date
CN109542803A true CN109542803A (zh) 2019-03-29

Family

ID=65848872

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811385060.4A Pending CN109542803A (zh) 2018-11-20 2018-11-20 一种基于深度学习的混合多模式热数据缓存策略

Country Status (1)

Country Link
CN (1) CN109542803A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334036A (zh) * 2019-06-28 2019-10-15 京东数字科技控股有限公司 一种实现缓存数据调度的方法和装置
CN112817540A (zh) * 2021-02-23 2021-05-18 上海交通大学 一种基于磁盘阵列扩展的数据块重分布方法及装置
CN112948289A (zh) * 2021-03-03 2021-06-11 上海天旦网络科技发展有限公司 一种基于机器学习的缓存预测调度方法、系统及介质
CN113050894A (zh) * 2021-04-20 2021-06-29 南京理工大学 一种基于布谷鸟算法的农业光谱混合存储系统缓存替换算法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678169A (zh) * 2013-11-11 2014-03-26 华中科技大学 一种高效利用固态盘缓存的方法和系统
CN104954185A (zh) * 2015-06-09 2015-09-30 中国石油大学(华东) 一种基于深度置信网的云计算负载预测方法
US20180314249A1 (en) * 2017-04-28 2018-11-01 Intel Corporation Storage management for machine learning at autonomous machines
CN108833352A (zh) * 2018-05-17 2018-11-16 北京邮电大学 一种缓存方法及系统
CN108833564A (zh) * 2018-06-26 2018-11-16 广东技术师范学院 一种基于深度学习的5g epc网络主动缓存方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678169A (zh) * 2013-11-11 2014-03-26 华中科技大学 一种高效利用固态盘缓存的方法和系统
CN104954185A (zh) * 2015-06-09 2015-09-30 中国石油大学(华东) 一种基于深度置信网的云计算负载预测方法
US20180314249A1 (en) * 2017-04-28 2018-11-01 Intel Corporation Storage management for machine learning at autonomous machines
CN108833352A (zh) * 2018-05-17 2018-11-16 北京邮电大学 一种缓存方法及系统
CN108833564A (zh) * 2018-06-26 2018-11-16 广东技术师范学院 一种基于深度学习的5g epc网络主动缓存方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334036A (zh) * 2019-06-28 2019-10-15 京东数字科技控股有限公司 一种实现缓存数据调度的方法和装置
CN112817540A (zh) * 2021-02-23 2021-05-18 上海交通大学 一种基于磁盘阵列扩展的数据块重分布方法及装置
CN112817540B (zh) * 2021-02-23 2022-11-04 上海交通大学 一种基于磁盘阵列扩展的数据块重分布方法及装置
CN112948289A (zh) * 2021-03-03 2021-06-11 上海天旦网络科技发展有限公司 一种基于机器学习的缓存预测调度方法、系统及介质
CN113050894A (zh) * 2021-04-20 2021-06-29 南京理工大学 一种基于布谷鸟算法的农业光谱混合存储系统缓存替换算法

Similar Documents

Publication Publication Date Title
CN109542803A (zh) 一种基于深度学习的混合多模式热数据缓存策略
CN107632784A (zh) 一种存储介质和分布式存储系统的缓存方法、装置及设备
CN104063330B (zh) 数据预取方法及装置
CN104834675A (zh) 一种基于用户行为分析的查询性能优化方法
CN109032964A (zh) 缓存替换方法及其装置、异构多核系统
CN104077242B (zh) 一种缓存管理方法和装置
CN105975402B (zh) 一种混合内存环境下淘汰数据感知的缓存方法与系统
CN101944068A (zh) 一种共享高速缓存的性能优化方法
CN107247675B (zh) 一种基于分类预测的缓存选择方法和系统
CN104156323B (zh) 一种高速缓冲存储器的数据块长度自适应读取方法及装置
CN106844740A (zh) 基于内存对象缓存系统的数据预读方法
CN106528451B (zh) 针对小文件的二级缓存预取的云存储框架及构建方法
CN101989236A (zh) 一种指令缓存锁实现方法
US10853250B2 (en) Storage management method, electronic device and computer program product
CN103902260A (zh) 一种对象文件系统的预取方法
CN108845957A (zh) 一种置换和回写自适应的缓冲区管理方法
On et al. FD-buffer: a buffer manager for databases on flash disks
CN108459972B (zh) 一种多通道固态硬盘的高效缓存管理设计方法
CN115640313A (zh) 智能查询计划缓存大小管理
CN108829343B (zh) 一种基于人工智能的缓存优化方法
CN108173974A (zh) 一种基于分布式缓存Memcached的HC Model内部缓存数据淘汰方法
CN104166596B (zh) 一种内存分配方法及节点
CN102722448B (zh) 管理高速存储器的方法和装置
CN105045894A (zh) 一种面向分布式顺序表的缓存方法及系统
Zhou et al. LEA: A lazy eviction algorithm for SSD cache in cloud block storage

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190329

WD01 Invention patent application deemed withdrawn after publication