CN114153760B - 基于权重的健值存储缓存淘汰方法、系统及存储介质 - Google Patents

基于权重的健值存储缓存淘汰方法、系统及存储介质 Download PDF

Info

Publication number
CN114153760B
CN114153760B CN202111473168.0A CN202111473168A CN114153760B CN 114153760 B CN114153760 B CN 114153760B CN 202111473168 A CN202111473168 A CN 202111473168A CN 114153760 B CN114153760 B CN 114153760B
Authority
CN
China
Prior art keywords
weight
data
candidate
value
elimination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111473168.0A
Other languages
English (en)
Other versions
CN114153760A (zh
Inventor
戈素梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Lexun Technology Co ltd
Original Assignee
Beijing Lexun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Lexun Technology Co ltd filed Critical Beijing Lexun Technology Co ltd
Priority to CN202111473168.0A priority Critical patent/CN114153760B/zh
Publication of CN114153760A publication Critical patent/CN114153760A/zh
Application granted granted Critical
Publication of CN114153760B publication Critical patent/CN114153760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0891Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches using clearing, invalidating or resetting means

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

本发明公开一种基于权重的健值存储缓存淘汰方法、系统及存储介质,其方法包括:响应于缓存淘汰触发信号,获取多个候选淘汰数据以及每一所述候选淘汰数据的权重影响因素;根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值;将所述候选淘汰数据的权重值按照由小到大的顺序排列,选择排在前n名内的候选淘汰数据作为最终淘汰数据;删除所述最终淘汰数据。本方案依据候选淘汰数据的权重影响因素如对象大小、命中次数等对候选淘汰数据的权重值进行计算,最终选择出权重值最低的n个候选淘汰数据作为最终淘汰数据,具有更好的命中率,同时能够适用于存储对象大小不同、负载多变等情况,适用于KV缓存系统的特点。

Description

基于权重的健值存储缓存淘汰方法、系统及存储介质
技术领域
本发明涉及大数据存储系统设计领域,特别涉及一种基于权重的健值存储缓存淘汰方法、系统及存储介质。
背景技术
缓存淘汰方法是缓存系统的核心,是缓存命中率的决定因素。目前业界常用的缓存淘汰方法是基于LRU(Least Recently Used,最近最少使用),LFU(Least frequentlyused,最不经常使用)以及由LRU/LFU衍生出来的一些组合或者局部优化算法。当前广泛应用于工业界的KV(Key-Value,键值存储)缓存系统主要有Redis,Memcached等等。Redis支持随机采样的LRU算法,同时也支持LFU算法。Memcached淘汰策略是基于LRU到期失效,到期失效采用的是延迟模式,在访问key的时候触发。使用单独的缓存淘汰策略,存在的问题是只能在一些特定的工作负载表现较好,具体如下:(1)基于LRU的算法在热点访问的模式下有较高的命中率,但是偶发性的、周期性的批量操作和扫描会导致LRU命中率急剧下降,缓存污染情况比较严重。(2)基于LFU的算法可以有效解决扫描带来的缓存污染问题,但是LFU需要更长时间来适用新的访问模式,计算开销比LRU大。
因此业界有一些关于融合LRU和LFU的衍生算法,例如广泛应用的ARC算法,根据工作负载自适应调整LRU和LFU的比例,能适应较多的工作负载。由于KV缓存系统,具有如下特点:(1)存储的对象大小不一,object(一个object包含一个Key-Value)的大小区间可能是从几个Byte到几十MB。(2)工作负载多变,KV系统可能用于缓存数据库,图片,视频等多种应用数据。这些特点给目前常用的缓存淘汰方法带来了一些技术挑战。对于KV缓存系统来说,这些淘汰算法普遍存在以下问题:
(1)目前的淘汰算法中都是假设object的大小区间是相同的,该假设会降低KV缓存命中率;(2)不能适用于多种负载,无法做到自适应,当工作负载发生变化时,需要一些人工的调参来达到较高的缓存命中率;(3)无法支持用户指定object优先级,不能灵活支持用户的一些特殊需求。例如在同时支持多种应用的缓存系统,用户可能需要优先缓存一些最重要的数据;(4)一些算法实现采用的数据结构需要全局的同步,可扩展性不高,存在性能瓶颈。
基于上述原因,需要提出一种适用于KV缓存系统的缓存淘汰方法。
发明内容
本发明要解决的技术问题是现有缓存淘汰方法不适用于KV缓存系统中的问题,为此,本发明提出了一种基于权重的健值存储缓存淘汰方法、系统及存储介质。
针对上述技术问题,本发明提供如下技术方案:
本发明一些实施例中提供一种基于权重的健值存储缓存淘汰方法,包括如下步骤:
响应于缓存淘汰触发信号,获取多个候选淘汰数据以及每一所述候选淘汰数据的权重影响因素;
根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值;
将所述候选淘汰数据的权重值按照由小到大的顺序排列,选择排在前n名内的候选淘汰数据作为最终淘汰数据;
删除所述最终淘汰数据。
本发明一些实施例中所述的基于权重的健值存储缓存淘汰方法,响应于缓存淘汰触发信号,获取多个候选淘汰数据以及每一所述候选淘汰数据的权重影响因素的步骤之前还包括:
获取存储系统的水位线,若所述水位线超过设定阈值,则生成所述缓存淘汰触发信号。
本发明一些实施例中所述的基于权重的健值存储缓存淘汰方法,所述响应于缓存淘汰触发信号,获取多个候选淘汰数据以及每一所述候选淘汰数据的权重影响因素的步骤中:
通过预设采样策略选择候选淘汰数据,所述预设采样策略包括随机采样策略、全局扫描策略或部分扫描策略;
所述权重影响因素包括所述候选淘汰数据的对象大小、访问次数、时间戳、命中次数和优先级。
本发明一些实施例中所述的基于权重的健值存储缓存淘汰方法,根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值的步骤中,通过如下算法确定所述权重值:
WeightTotal=K*(R*WeightLRU+(1-R)*WeightLFU)+MAX_VALUE*Priorityuser
其中,K为权重系数,取值范围为(0,1),K的取值随所述候选淘汰数据的对象大小的增大而减小;R是LRU算法权重的比例,取值范围为[0,1];(1-R)为LFU算法权重的比例;WeightLRU和WeightLFU的取值区间均为[0,255];MAX_VALUE的取值为255;Priorityuser的取值为正整数。
本发明一些实施例中所述的基于权重的健值存储缓存淘汰方法,所述根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值的步骤中:
WeightLRU根据当前时间Tcurrent和所述候选淘汰数据的最近一次访问时间Tlast的差值Δ得到,其算法公式为:
Figure BDA0003388630310000031
Δ=Tcurrent-Tlast
其中,C1、C2、C3、C4为常数值;K1、K2、K3、K4为系数;以及a1、a2和a3为常数值,其中:C2=C1-K1*a1;C3=C2-K2*a2;C4=C3-K3*a3
本发明一些实施例中所述的基于权重的健值存储缓存淘汰方法,所述根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值的步骤中:
WeightLFU的算法公式为:
WeightLFU=Val(morriscounter)-(Tcurrent-Tlast)/Tdecay
其中,morris-counter的取值区间在[0,255],数据的每一次被访问,morris-counter的计数按设定规则增加;Tdecay为可配置常数。
本发明一些实施例中所述的基于权重的健值存储缓存淘汰方法,根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值的步骤中,权重系数K的算法公式为:
Figure BDA0003388630310000041
其中:m为常数,m的取值范围为[4,32]KB;object size为对象大小。
本发明一些实施例中所述的基于权重的健值存储缓存淘汰方法,根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值的步骤中,LRU算法权重的比例R通过如下方式进行设定:
获取用户输入的指定值;或,
确定存储系统的工作负载模式,根据所述工作负载模式选取适应的比例。
本发明一部分实施例中还提供一种基于权重的健值存储缓存淘汰系统,包括:
数据存储组件,用于将存储系统收到的KV数据部分进行存储;
元数据存储组件,用于将所述数据存储组件中KV数据的元数据进行存储,所述元数据包括权重影响因素;
淘汰算法执行组件,包括采样/扫描模块、权重计算和选择模块、权重调整模块和执行模块,其中:
所述采样/扫描模块,用于根据通过预设采样策略从所述数据存储组件和所述元数据存储组件中选择候选淘汰数据和权重影响因素;
所述权重计算和选择模块,根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值;将所述候选淘汰数据的权重值按照由小到大的顺序排列,选择排在前n名内的候选淘汰数据作为最终淘汰数据;
所述权重调整模块,用于调整所述候选淘汰数据的权重值运算过程中LRU算法和LFU算法权重的比例;
所述执行模块,删除所述数据存储组件中的所述最终淘汰数据以及所述元数据存储组件中与所述最终淘汰数据相关的元数据。
本发明一部分实施例中还提供一种存储介质,所述存储介质中存储有程序信息,计算机读取所述程序信息后执行以上任一项所述的基于权重的健值存储缓存淘汰方法。
本发明的技术方案相对现有技术具有如下技术效果:
本发明提供的基于权重的健值存储缓存淘汰方法、系统及存储介质,在获取候选淘汰数据后,再次依据候选淘汰数据的权重影响因素(如对象大小、命中次数等)对候选淘汰数据的权重值进行计算,最终选择出权重值最低的n个候选淘汰数据作为最终淘汰数据,删除最终淘汰数据。本方案中,相比于现有比LRU淘汰算法和LFU淘汰算法及二者的简单结合,具有更好的命中率,同时能够适用于存储对象大小不同、负载多变等情况,是一种更加适用于KV缓存系统的缓存淘汰方案。
附图说明
下面将通过附图详细描述本发明中优选实施例,将有助于理解本发明的目的和优点,其中:
图1为本发明一个实施例所述基于权重的健值存储缓存淘汰方法的流程图;
图2为本发明另一个实施例所述基于权重的健值存储缓存淘汰方法的流程图;
图3为本发明一个实施例所述基于权重的健值存储缓存淘汰系统的硬件结构连接示意图;
图4为本发明另一个实施例所述基于权重的健值存储缓存淘汰系统的结构框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本实施例提供一种基于权重的健值存储缓存淘汰方法,可应用于KV缓存系统中,如图1所示,包括如下步骤:
S101:响应于缓存淘汰触发信号,获取多个候选淘汰数据以及每一所述候选淘汰数据的权重影响因素。缓存淘汰发触发信号可以是用户预先保存的淘汰启动条件,根据系统性能进行设定即可。在获取候选淘汰数据时,可以依据随机采样或者基于某种扫描策略对缓存中的数据进行筛选,筛选出的候选淘汰数据一般需要多余真正需要淘汰的数据大小。优选地,通过预设采样策略选择候选淘汰数据,所述预设采样策略包括随机采样策略、全局扫描策略或部分扫描策略。
S102:根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值。权重影响因素可以包含多种因素,依据KV缓存系统的特性设定权重影响因素,例如,考虑到KV缓存系统中的数据对象大小不一,因此可以将数据对象的大小作为权重影响因素,考虑到用户自身的需求,可以将用户预先设定的优先级作为权重影响因素等。优选地,所述权重影响因素包括所述候选淘汰数据的对象大小、访问次数、时间戳、命中次数和优先级。
S103:将所述候选淘汰数据的权重值按照由小到大的顺序排列,选择排在前n名内的候选淘汰数据作为最终淘汰数据。n的取值需要满足:将n个最终淘汰数据删除后,KV缓存系统中的剩余数据存储量已经满足正常的要求。
S104:删除所述最终淘汰数据。
以上实施例中的方案,在获取候选淘汰数据后,再次依据候选淘汰数据的权重影响因素(如对象大小、命中次数等)对候选淘汰数据的权重值进行计算,最终选择出权重值最低的n个候选淘汰数据作为最终淘汰数据,删除最终淘汰数据。本方案中,相比于现有比LRU淘汰算法和LFU淘汰算法及二者的简单结合,具有更好的命中率,同时能够适用于存储对象大小不同、负载多变等情况,是一种更加适用于KV缓存系统的缓存淘汰方案。
进一步地,以上方案中,所述步骤S101之前还包括:获取存储系统的水位线,若所述水位线超过设定阈值,则生成所述缓存淘汰触发信号。即,本实施例中以系统水位线作为是否执行缓存淘汰算法的判断依据。例如:系统水位线可以包括存储数据所占用的存储空间,假设系统水位线达到了预设空间大小,则可以执行缓存淘汰算法,将缓存中的数据删除一部分,释放足够的空间。
具体地,如图2所示,KV缓存系统中数据存储及淘汰的完整流程包括:
S201:对KV缓存系统进行KV读写操作。
S202:通过KV缓存系统的读写操作确定需要存储的数据对象,进行相应的KV存储操作。
S203:更新KV缓存系统中存储数据对象的元数据,可以采用延迟更新方法,其中的元数据主要包括数据的对象大小(object size),命中次数(在历史执行淘汰算法过程中被扫描作为候选淘汰数据的次数),时间戳等信息,这些信息将作为本方案中淘汰算法的权重影响因素。
S204:筛选出多个候选淘汰数据,例如:KV缓存系统的后台进程会定期检查系统水位线,当系统水位线超过一定阈值时,触发缓存淘汰算法的流,通过随机采样或者扫描策略选取候选淘汰数据。
S205:获取每一候选淘汰数据的权重值。本发明实施例提供一种全新的淘汰算法,计算出所有候选淘汰数据的权重值。
S206:通过最小堆数据结构选出n个权重值最小的候选淘汰数据作为最终淘汰数据。
S207:删除所述n个最终淘汰数据。
具体地,以上方案中的步骤S205中,根据WLRFU淘汰算法(Weighted LRU&LFU,本申请提出的一种全新的淘汰算法)计算候选淘汰数据的权重值,WLRFU淘汰算法是基于数据对象级别的,每一轮缓存淘汰过程中都会选择权重值最小的n个候选淘汰数据并淘汰,权重值的影响因素主要有数据的对象大小,历史命中信息,用户配置的优先级等信息,优选地,其通过如下算法确定所述权重值:
WeightTotal=K*(R*WeightLRU+(1-R)*WeightLFU)+MAX_VALUE*Priorityuser
其中,上述公式中各个参数的含义如下:
1.K为权重系数
K的取值范围为(0,1),K的取值随所述候选淘汰数据的对象大小的增大而减小,即K值和数据的对象大小是负相关的关系,数据对象越大,K值越小,数据对象越大,说明数据对象占用的系统资源越多,在其他同等条件下,应该被优先淘汰,因此权重值应当越小。优选地,权重系数K的算法公式为:
Figure BDA0003388630310000091
其中:m为常数,m的取值范围为[4,32]KB;object size为对象大小。
2.R是LRU算法权重的比例
R的取值范围为[0,1];(1-R)为LFU算法权重的比例;R值的设定支持两种方式:(1)获取用户输入的指定值,即用户指定默认值;满足特定workload的需求。(2)确定存储系统的工作负载模式,根据所述工作负载模式选取适应的比例。即自适应调整的方式,KV缓存系统可以通过机器学习的方法识别KV缓存系统的工作负载模式,然后选取适应该模式的比例值,保证在不同工作负载下都达到较高的缓存命中率。
3.WeightLRU
WeightLRU根据当前时间Tcurrent和所述候选淘汰数据的最近一次访问时间Tlast的差值Δ得到,其算法公式为:
Figure BDA0003388630310000092
Δ=Tcurrent-Tlast
其中,C1、C2、C3、C4为常数值;K1、K2、K3、K4为系数;以及a1、a2和a3为常数值,其中:C2=C1-K1*a1;C3=C2-K2*a2;C4=C3-K3*a3。具体地,为了实现LRU算法的权重和LFU的权重算法具有对等性,C1可取值255,C2、C3、C4的取值算法公式能够满足证分段函数取值的连续性。
4.WeightLFU
WeightLFU的算法公式为:
WeightLFU=Val(morriscounter)-(Tcurrent-Tlast)/Tdecay
其中,morris-counter的取值区间在[0,255],数据的每一次被访问,morris-counter的计数按设定规则增加;Tdecay为可配置常数。WeightLFU可使用一个8bit的morris-counter来表示。WeightLFU的取值区间也为[0,255],可以保证LRU和LFU的权重区间是对等的,可以理解为归一化。每次数据对象被访问时,morris-counter的计数可以按照log的方式递增(通过随机数模拟log方式递增),在LFU算法的一些实现上,“历史”高频访问的数据对象很难被淘汰,就会导致这类数据在扫描时的命中率的下降,因此本方案中引入一种机制,随着时间推移,morris-counter逐渐衰减,能够保证“历史”高频访问数据所占的影响因素逐渐降低,morris-counter会根据当前时间和最近访问时间的差值进行补偿矫正,以上公式中,通过val()函数将morris-counter转变为数值型数据,从而实现运算。
5.用户定义优先级
WLRFU算法支持用户自定义优先级,通过加上MAX_VALUE(值为255)和Priorityuser(值为正整数)的乘积来保证优先级低的最高权重比高优先级的最低权重小,因此可以优先淘汰低优先级的候选淘汰数据。
通过上述分析,可以确定,本方案中提出的全新的WLRFU算法,应用于KV缓存系统中时,至少具有如下优势:
(1)融合了LRU算法和LFU算法的优点,在热点访问模式下表现良好,同时具备一定的抗扫描性;(2)融合了数据的对象大小和历史命中情况等因子,相比LRU算法和LFU算法有更好的命中率;(3)灵活支持用户定义的优先级,满足特定需求;(4)没有全局的数据结构,消除了全局锁同步开销,性能高;(5)支持随机采样,低内存开销,O空间复杂度。
如图3所示,本申请的一些实施例提供一种执行WLRFU算法的电子设备,其包括一个或多个处理器301以及存储器302,图3中以一个处理器301为例。上述电子设备还可以包括:输入装置303和输出装置304。处理器301、存储器302、输入装置303和输出装置304可以通过总线或者其他方式连接,图3中以通过总线连接为例。
存储器302作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。处理器301通过运行存储在存储器302中的非易失性软件程序、指令以及模块,从而执行各种功能应用以及数据处理,即实现上述方法实施例的WLRFU算法。
本申请实施例中还提供一种基于权重的健值存储缓存淘汰系统,如图4所示,包括:
数据存储组件401,用于将存储系统收到的KV数据部分进行存储;即,所述数据存储组件401负责缓存系统中Key-Value数据部分的存储,只包含用户传给系统的实际数据。
元数据存储组件402,用于将所述数据存储组件中KV数据的元数据进行存储,所述元数据包括权重影响因素;其中,所述元数据主要包括KV的大小,访问次数,历史命中次数,时间戳,用户定义的优先级等相关信息。
淘汰算法执行组件403,负责淘汰算法的实现,其包括采样/扫描模块4031、权重计算和选择模块4032、权重调整模块4033和执行模块4034,其中:
所述采样/扫描模块4031,用于根据通过预设采样策略从所述数据存储组件401和所述元数据存储组件402中选择候选淘汰数据和权重影响因素;选取一些要被淘汰的候选淘汰数据时可支持不同策略,例如随机采样,全局扫描,部分扫描等。
所述权重计算和选择模块4032,根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值;将所述候选淘汰数据的权重值按照由小到大的顺序排列,选择排在前n名内的候选淘汰数据作为最终淘汰数据;根据方法实施例中所提出的WLRFU淘汰算法计算所述采样/扫描模块4031选取的多个候选淘汰数据的权重值,然后选取出权重值最小的原则选出最终淘汰数据。
所述权重调整模块4033,用于调整所述候选淘汰数据的权重值运算过程中LRU算法和LFU算法权重的比例;用于调整LRU算法和LFU算法权重所占的比例,可以通过机器学习的方法识别缓存系统的工作负载模式,然后根据负载模式选取适应该模式的比例,从而可以达到自适应调整,满足多种工作负载。
所述执行模块4034,删除所述数据存储组件中的所述最终淘汰数据以及所述元数据存储组件中与所述最终淘汰数据相关的元数据。
以上系统中,提出了基于权重的方式来融合LRU算法和LFU算法,既可以支持用户配置权重比例,也可以支持通过一些方法如机器学习等来自动调整,满足不同的工作负载需求。本方法在传统LRU和LFU的基础上,融合了数据对象大小等影响因素,提高了扫描数据的命中率。而且,本系统支持用户设置缓存数据被淘汰的优先级,满足特殊应用需求。
本申请实施例中还提供一种存储介质,所述存储介质中存储有程序信息,计算机读取所述程序信息后执行以上任一项方法实施例中所述的基于权重的健值存储缓存淘汰方法。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明的保护范围之中。

Claims (7)

1.一种基于权重的健值存储缓存淘汰方法,其特征在于,包括如下步骤:
响应于缓存淘汰触发信号,获取多个候选淘汰数据以及每一所述候选淘汰数据的权重影响因素;
根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值;
将所述候选淘汰数据的权重值按照由小到大的顺序排列,选择排在前n名内的候选淘汰数据作为最终淘汰数据;
删除所述最终淘汰数据;
根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值的步骤中,通过如下算法确定所述权重值:
WeightTotal=K*(R*WeightLRU+(1-R)*WeightLFU)+MAX_VALUE*Priorityuser
其中,K为权重系数,取值范围为(0,1),K的取值随所述候选淘汰数据的对象大小的增大而减小;R是LRU算法权重的比例,取值范围为[0,1];(1–R)为LFU算法权重的比例;WeightLRU和WeightLFU的取值区间均为[0,255];MAX_VALUE的取值为255;Priorityuser的取值为正整数;
根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值的步骤中:
WeightLRU根据当前时间Tcurrent和所述候选淘汰数据的最近一次访问时间Tlast的差值Δ得到,其算法公式为:
Figure FDA0003695387270000011
Δ=Tcurrent-Tlast
其中,C1、C2、C3、C4为常数值;K1、K2、K3、K4为系数;以及a1、a2和a3为常数值,其中:C2=C1-K1*a1;C3=C2-K2*a2;C4=C3-K3*a3
WeightLFU的算法公式为:
WeightLFU=Val(morriscounter)-(Tcurrent-Tlast)/Tdecay
其中,morriscounter的取值区间在[0,255],数据的每一次被访问,morriscounter的计数按设定规则增加;Tdecay为可配置常数。
2.根据权利要求1所述的基于权重的健值存储缓存淘汰方法,其特征在于,响应于缓存淘汰触发信号,获取多个候选淘汰数据以及每一所述候选淘汰数据的权重影响因素的步骤之前还包括:
获取存储系统的水位线,若所述水位线超过设定阈值,则生成所述缓存淘汰触发信号。
3.根据权利要求2所述的基于权重的健值存储缓存淘汰方法,其特征在于,所述响应于缓存淘汰触发信号,获取多个候选淘汰数据以及每一所述候选淘汰数据的权重影响因素的步骤中:
通过预设采样策略选择候选淘汰数据,所述预设采样策略包括随机采样策略、全局扫描策略或部分扫描策略;
所述权重影响因素包括所述候选淘汰数据的对象大小、访问次数、时间戳、命中次数和优先级。
4.根据权利要求1-3任一项所述的基于权重的健值存储缓存淘汰方法,其特征在于,根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值的步骤中,权重系数K的算法公式为:
Figure FDA0003695387270000021
其中:m为常数,m的取值范围为[4,32]KB;object size为对象大小。
5.根据权利要求4所述的基于权重的健值存储缓存淘汰方法,其特征在于,根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值的步骤中,LRU算法权重的比例R通过如下方式进行设定:
获取用户输入的指定值;或,
确定存储系统的工作负载模式,根据所述工作负载模式选取适应的比例。
6.一种基于权重的健值存储缓存淘汰系统,其特征在于,包括:
数据存储组件,用于将存储系统收到的KV数据部分进行存储;
元数据存储组件,用于将所述数据存储组件中KV数据的元数据进行存储,所述元数据包括权重影响因素;
淘汰算法执行组件,包括采样/扫描模块、权重计算和选择模块、权重调整模块和执行模块,其中:
所述采样/扫描模块,用于根据通过预设采样策略从所述数据存储组件和所述元数据存储组件中选择候选淘汰数据和权重影响因素;
所述权重计算和选择模块,根据每一所述候选淘汰数据的权重影响因素得到每一所述候选淘汰数据的权重值;将所述候选淘汰数据的权重值按照由小到大的顺序排列,选择排在前n名内的候选淘汰数据作为最终淘汰数据;通过如下算法确定所述权重值:
WeightTotal=K*(R*WeightLRU+(1-R)*WeightLFU)+MAX_VALUE*Priorityuser
其中,K为权重系数,取值范围为(0,1),K的取值随所述候选淘汰数据的对象大小的增大而减小;R是LRU算法权重的比例,取值范围为[0,1];(1–R)为LFU算法权重的比例;WeightLRU和WeightLFU的取值区间均为[0,255];MAX_VALUE的取值为255;Priorityuser的取值为正整数;
WeightLRU根据当前时间Tcurrent和所述候选淘汰数据的最近一次访问时间Tlast的差值Δ得到,其算法公式为:
Figure FDA0003695387270000041
Δ=Tcurrent-Tlast
其中,C1、C2、C3、C4为常数值;K1、K2、K3、K4为系数;以及a1、a2和a3为常数值,其中:C2=C1-K1*a1;C3=C2-K2*a2;C4=C3-K3*a3
WeightLFU的算法公式为:
WeightLFU=Val(morriscounter)-(Tcurrent-Tlast)/Tdecay
其中,morriscounter的取值区间在[0,255],数据的每一次被访问,morriscounter的计数按设定规则增加;Tdecay为可配置常数;
所述权重调整模块,用于调整所述候选淘汰数据的权重值运算过程中LRU算法和LFU算法权重的比例;
所述执行模块,删除所述数据存储组件中的所述最终淘汰数据以及所述元数据存储组件中与所述最终淘汰数据相关的元数据。
7.一种存储介质,其特征在于,所述存储介质中存储有程序信息,计算机读取所述程序信息后执行权利要求1-5任一项所述的基于权重的健值存储缓存淘汰方法。
CN202111473168.0A 2021-12-02 2021-12-02 基于权重的健值存储缓存淘汰方法、系统及存储介质 Active CN114153760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111473168.0A CN114153760B (zh) 2021-12-02 2021-12-02 基于权重的健值存储缓存淘汰方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111473168.0A CN114153760B (zh) 2021-12-02 2021-12-02 基于权重的健值存储缓存淘汰方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN114153760A CN114153760A (zh) 2022-03-08
CN114153760B true CN114153760B (zh) 2022-07-29

Family

ID=80453107

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111473168.0A Active CN114153760B (zh) 2021-12-02 2021-12-02 基于权重的健值存储缓存淘汰方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN114153760B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116541430B (zh) * 2023-07-06 2023-09-26 江苏网进科技股份有限公司 一种数据自适应缓存方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106973088A (zh) * 2017-03-16 2017-07-21 中国人民解放军理工大学 一种基于位置变动的联合lru与lfu的缓存更新方法及网络
US10558583B1 (en) * 2019-01-31 2020-02-11 The Florida International University Board Of Trustees Systems and methods for managing cache replacement with machine learning
CN111240593A (zh) * 2020-01-06 2020-06-05 苏州浪潮智能科技有限公司 一种动态自适应调度的数据迁移方法、装置、设备和介质
CN113076067A (zh) * 2021-04-16 2021-07-06 北京沃东天骏信息技术有限公司 淘汰缓存数据的方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3244590B1 (en) * 2016-05-13 2018-09-26 Koninklijke KPN N.V. Network node, endpoint node and method of receiving an interest message
CN108763110B (zh) * 2018-03-22 2021-01-26 新华三技术有限公司 一种数据缓存方法及装置
US10387330B1 (en) * 2018-04-30 2019-08-20 Lenovo Enterprise Solutions (Singapore) Pte. Ltd Less recently and frequently used (LRAFU) cache replacement policy
CN112764681B (zh) * 2021-01-21 2024-02-13 上海七牛信息技术有限公司 一种带权重判断的缓存淘汰方法、装置和计算机设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106973088A (zh) * 2017-03-16 2017-07-21 中国人民解放军理工大学 一种基于位置变动的联合lru与lfu的缓存更新方法及网络
US10558583B1 (en) * 2019-01-31 2020-02-11 The Florida International University Board Of Trustees Systems and methods for managing cache replacement with machine learning
CN111240593A (zh) * 2020-01-06 2020-06-05 苏州浪潮智能科技有限公司 一种动态自适应调度的数据迁移方法、装置、设备和介质
CN113076067A (zh) * 2021-04-16 2021-07-06 北京沃东天骏信息技术有限公司 淘汰缓存数据的方法和装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A hybrid cache replacement policy for heterogeneous multi-cores;K.M. AnandKumar.etc;《2014 International Conference on Advances in Computing, Communications and Informatics (ICACCI)》;20141201;594-599 *
K.M. AnandKumar.etc.A hybrid cache replacement policy for heterogeneous multi-cores.《2014 International Conference on Advances in Computing, Communications and Informatics (ICACCI)》.2014,594-599. *
一种基于缓存对象未来价值的淘汰算法;任飞;《陕西理工大学学报( 自然科学版)》;20190630;第35卷(第3期);46-53 *

Also Published As

Publication number Publication date
CN114153760A (zh) 2022-03-08

Similar Documents

Publication Publication Date Title
KR102043886B1 (ko) 프로파일링 캐시 대체
US8176258B2 (en) System and method for cache management
EP3229142B1 (en) Read cache management method and device based on solid state drive
CN107729535B (zh) 一种键值数据库内布隆过滤器的配置方法
CN108829344A (zh) 数据存储方法、装置及存储介质
RU2438165C2 (ru) Устройство и способы для уменьшения вытеснений в многоуровневой иерархии кэша
US9971698B2 (en) Using access-frequency hierarchy for selection of eviction destination
JP4317531B2 (ja) 複数のメモリ・バッファ・サイズを均衡させるためのシステムおよび方法
US20170371807A1 (en) Cache data determining method and apparatus
CN107368437B (zh) 一种末级缓存管理方法及系统
CN104156323B (zh) 一种高速缓冲存储器的数据块长度自适应读取方法及装置
EP4321980A1 (en) Method and apparatus for eliminating cache memory block, and electronic device
US20170010830A1 (en) Semiconductor Device and Cache Memory Control Method
CN111857592A (zh) 基于对象存储系统的数据存储方法及装置、电子设备
US12038844B2 (en) Solid state drive cache eviction policy by an unsupervised reinforcement learning scheme
CN104657286A (zh) 一种分级存储方法及装置
CN109144431B (zh) 数据块的缓存方法、装置、设备及存储介质
CN114153760B (zh) 基于权重的健值存储缓存淘汰方法、系统及存储介质
US7769953B2 (en) Variable cache data retention system
US12066935B2 (en) Cache line compression prediction and adaptive compression
CN116955213A (zh) 一种基于Caffeine优化的缓存方法及装置
CN110413228A (zh) 一种映射表管理方法、系统及电子设备和存储介质
US9311988B2 (en) Storage control system and method, and replacing system and method
CN112445794B (zh) 一种大数据系统的缓存方法
CN115203072A (zh) 一种基于访问热度的文件预读缓存分配方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant