WO2022213871A1

WO2022213871A1 - 缓存装置、方法及系统

Info

Publication number: WO2022213871A1
Application number: PCT/CN2022/084333
Authority: WO
Inventors: 胥皇; 单卫华
Original assignee: 华为云计算技术有限公司
Priority date: 2021-04-06
Filing date: 2022-03-31
Publication date: 2022-10-13
Also published as: CN115168411A

Abstract

一种缓存装置、方法及系统，所述缓存装置（200）包括控制模块（210）及存储模块（220），所述控制模块（210）用于：根据候选对象的历史访问信息，对候选对象进行标注；将标注后的候选对象加入到当前训练集中；使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在当前训练集中的候选对象的数量大于或等于数量阈值时使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型。在缓存装置（200）运行过程中，自动对候选对象进行标注后加入到当前训练集中，并使用当前训练集对当前周期的概率预测模型进行训练，从而能够实现缓存装置（200）的在线自监督学习。

Description

缓存装置、方法及系统

技术领域

本申请涉及计算机技术领域，尤其涉及一种缓存装置、方法及系统。

背景技术

为了降低数据访问时延，通常会在数据库、内容分发网络、数据存储等业务系统中设置缓存，例如设置缓存组件、缓存子系统等，用于暂时保存业务系统中近期可能会被重复访问的数据。

目前，缓存通常为采用预设准入及淘汰规则的启发式缓存，或者为基于离线机器学习的缓存。然而，在业务系统的业务场景或数据访问模式发生变化时，启发式缓存及基于离线机器学习的缓存均存在业务适应性差、维护成本高等问题。

发明内容

有鉴于此，提出了一种缓存装置、方法及系统。

第一方面，本申请的实施例提供了一种缓存装置，所述缓存装置包括控制模块及存储模块，所述控制模块用于：根据候选对象的历史访问信息，对所述候选对象进行标注；其中，所述候选对象为全部或者部分的目标对象，所述目标对象为所述缓存装置接收的读请求中指示的对象，或者所述目标对象为所述缓存装置接收的写请求中指示的对象，或者所述目标对象为所述存储模块中待淘汰的对象；将标注后的候选对象加入到当前训练集中；使用所述当前训练集对所述当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在所述当前训练集中的候选对象的数量大于或等于数量阈值时使用所述当前训练集对所述当前周期的概率预测模型进行训练来得到下一周期的概率预测模型。

本申请的实施例，能够在缓存装置运行过程中，自动对候选对象进行标注，并将标注后的候选对象加入当前训练集中，然后使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在当前训练集中的候选对象的数量大于或等于数量阈值时使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，从而能够实现概率预测模型的在线自监督学习(即在线运行过程中自动进行样本标注及训练)，进而实现缓存装置的在线自监督学习。

通过这种方式，不仅能够不断优化缓存装置的缓存准入及淘汰决策，提高缓存命中率，而且使得缓存装置能够自动感知并适应多种业务场景以及业务场景或数据访问模式的变化，在提高缓存装置的业务适应性的同时，还能降低缓存装置的维护成本。

根据第一方面，在所述缓存装置的第一种可能的实现方式中，所述控制模块，用于：在所述候选对象的历史访问信息中确定参考位置；将所述历史访问信息中在所述参考位置之前的信息，标注为所述候选对象的参考访问信息；将所述历史访问信息中在所述参考位置之后的信息，标注为所述候选对象的参考访问概率。

本申请的实施例，通过在候选对象的历史访问信息中确定参考位置，并将候选对象的历史访问信息中在参考位置之前的信息，标注为候选对象的参考访问信息，同时将候选对象的历史访问信息中在参考位置之后的信息，标注为候选对象的参考访问概率，从而能够在缓存装置运行过程中，根据历史访问信息对候选对象进行自动标注，进而提高标注效率。

根据第一方面或第一方面的第一种可能的实现方式，在所述缓存装置的第二种可能的实现方式中，所述控制模块，用于：如果所述目标对象为所述缓存装置接收的写请求中指示的对象，将所述目标对象的历史访问信息作为所述当前周期的概率预测模型的输入，通过所述当前周期的概率预测模型预测所述目标对象被访问的概率；在预测的概率大于或等于第一概率阈值时，将所述目标对象存储到所述存储模块。

本申请的实施例，在目标对象为缓存装置接收的写请求中指示的对象的情况下，控制模块能够通过当前周期的概率预测模型预测目标对象被访问的概率，并根据预测的概率进行缓存准入，从而提高缓存准入的准确性。

根据第一方面、第一方面的第一种可能的实现方式及第一方面的第二种可能的实现方式种的任意一种，在所述缓存装置的第三种可能的实现方式中，所述控制模块，用于：如果所述目标对象为所述存储模块中待淘汰的对象，将所述目标对象的历史访问信息作为所述当前周期的概率预测模型的输入，通过所述当前周期的概率预测模型预测所述目标对象被访问的概率；在预测的概率小于或等于第二概率阈值时，将所述目标对象从所述存储模块中淘汰。

本申请的实施例，在目标对象为存储模块中待淘汰的对象的情况下，控制模块能够通过当前周期的概率预测模型预测目标对象被访问的概率，并根据预测的概率进行缓存淘汰，从而提高缓存淘汰的准确性。

根据第一方面或第一方面的第一种可能的实现方式至第一方面的第三种可能的实现方式中的任意一种，在所述缓存装置的第四种可能的实现方式中，所述控制模块，用于：如果所述目标对象为所述缓存装置接收的写请求中指示的对象，且没有所述目标对象的历史访问信息，将所述目标对象存储到所述存储模块。

本申请的实施例，在目标对象为缓存装置接收的写请求中指示的对象且没有目标对象的历史访问信息的情况下，将目标对象存储到存储模块，能够避免没有历史访问信息的目标对象无法写入缓存装置的情况，从而提高缓存装置对业务场景变化或数据访问模式变化的适应性。

根据第一方面或第一方面的第一种可能的实现方式至第一方面的第四种可能的实现方式中的任意一种，在所述缓存装置的第五种可能的实现方式中，所述控制模块，用于：从多个所述目标对象中采样得到一个或多个所述候选对象。

本申请的实施例，通过从多个目标对象中采样得到一个或多个候选对象，能够减少候选对象的数量，从而提高处理效率。

根据第一方面或第一方面的第一种可能的实现方式至第一方面的第五种可能的实现方式中的任意一种，在所述缓存装置的第六种可能的实现方式中，所述控制模块，用于：将所述候选对象存储到所述存储模块。

本申请的实施例，将候选对象存储在存储模块中，从而能够继续更新候选对象的历史访问信息。

根据第一方面或者第一方面的多种可能的实现方式中的一种或几种，在所述缓存装置的第七种可能的实现方式中，与所述目标对象的历史访问信息对应的时间段包括多个子时段，所述目标对象的历史访问信息包括所述目标对象在各个子时段内的访问频率等级。

本申请的实施例，通过目标对象在各个子时段内的访问频率等级记录目标对象的历史访问信息，不仅可以节省存储空间及计算资源，而且能够按照时序记录目标对象的访问行为，从而实现缓存装置中大量对象的访问行为的在线感知。

第二方面，本申请的实施例提供了一种缓存方法，所述方法包括：根据候选对象的历史访问信息，对所述候选对象进行标注；其中，所述候选对象为全部或者部分的目标对象，所述目标对象为缓存装置接收的读请求中指示的对象，或者所述目标对象为缓存装置接收的写请求中指示的对象，或者所述目标对象为缓存装置的存储模块中待淘汰的对象；将标注后的候选对象加入到当前训练集中；使用所述当前训练集对所述当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在所述当前训练集中的候选对象的数量大于或等于数量阈值时使用所述当前训练集对所述当前周期的概率预测模型进行训练来得到下一周期的概率预测模型；其中，所述方法应用于所述缓存装置的控制模块。

根据第二方面，在所述缓存方法的第一种可能的实现方式中，所述根据候选对象的历史访问信息，对所述候选对象进行标注，包括：在所述候选对象的历史访问信息中确定参考位置；将所述历史访问信息中在所述参考位置之前的信息，标注为所述候选对象的参考访问信息；将所述历史访问信息中在所述参考位置之后的信息，标注为所述候选对象的参考访问概率。

根据第二方面或第二方面的第一种可能的实现方式，在所述缓存方法的第二种可能的实现方式中，所述方法还包括：如果所述目标对象为所述缓存装置接收的写请求中指示的对象，将所述目标对象的历史访问信息作为所述当前周期的概率预测模型的输入，通过所述当前周期的概率预测模型预测所述目标对象被访问的概率；在预测的概率大于或等于第一概率阈值时，将所述目标对象存储到所述存储模块。

根据第二方面、第二方面的第一种可能的实现方式及第二方面的第二种可能的实现方式中的任意一种，在所述缓存方法的第三种可能的实现方式中，所述方法还包括：如果所述目标对象为所述存储模块中待淘汰的对象，将所述目标对象的历史访问信息作为所述当前周期的概率预测模型的输入，通过所述当前周期的概率预测模型预测所述目标对象被访问的概率；在预测的概率小于或等于第二概率阈值时，将所述目标对象从所述存储模块中淘汰。

根据第二方面或第二方面的第一种可能的实现方式至第二方面的第三种可能的实现方式中的任意一种，在所述缓存方法的第四种可能的实现方式中，所述方法，还包括：如果所述目标对象为所述缓存装置接收的写请求中指示的对象，且没有所述目标对象的历史访问信息，将所述目标对象存储到所述存储模块。

根据第二方面或第二方面的第一种可能的实现方式至第二方面的第四种可能的实现方式中的任意一种，在所述缓存方法的第五种可能的实现方式中，所述方法还包括：从多个所述目标对象中采样得到一个或多个所述候选对象。

根据第二方面或第二方面的第一种可能的实现方式至第二方面的第五种可能的实现方式中的任意一种，在所述缓存方法的第六种可能的实现方式中，所述方法还包括：将所述候选对象存储到所述存储模块。

根据第二方面或者第二方面的多种可能的实现方式中的一种或几种，在所述缓存方法的第七种可能的实现方式中，与所述目标对象的历史访问信息对应的时间段包括多个子时段，所述目标对象的历史访问信息包括所述目标对象在各个子时段内的访问频率等级。

第三方面，本申请的实施例提供了一种芯片，所述芯片用于部署上述第一方面或者第一方面的多种可能的实现方式中的一种或几种的缓存装置。

本申请的实施例，能够在缓存装置运行过程中，自动对候选对象进行标注，并将标注后的候选对象加入当前训练集中，然后使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在当前训练集中的候选对象的数量大于或等于数量阈值时使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，从而能够实现概率预测模型的在线自监督学习(即在线运行过程中自动进行候选对象标注及训练)，进而实现缓存装置的在线自监督学习。

第四方面，本申请的实施例提供了一种缓存系统，包括：缓存装置，用于缓存对象，所述缓存装置为上述第一方面或者第一方面的多种可能的实现方式中的一种或几种的缓存装置；数据处理设备，用于向所述缓存装置发送所述对象的读请求或写请求；数据存储设备，用于存储所述对象。

本申请的实施例，缓存系统包括缓存装置、数据处理设备及数据存储设备，数据处理设备可以向缓存装置发送对象的读请求或写请求，缓存装置在接收到对象的读请求或写请求时，执行相对应的处理，例如，对象读操作、缓存准入处理等。

同时，缓存装置能够运行过程中，自动对候选对象进行标注，并将标注后的候选对象加入当前训练集中，然后使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在当前训练集中的候选对象的数量大于或等于数量阈值时使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，从而能够实现概率预测模型的在线自监督学习，进而实现缓存装置的在线自监督学习。通过这种方式，不仅能够不断优化缓存装置的缓存准入及淘汰决策，提高缓存命中率，而且使得缓存装置能够自动感知并适应多种业务场景以及业务场景或数据访问模式的变化，在提高缓存装置的业务适应性的同时，还能降低缓存装置的维护成本。

第五方面，本申请的实施例提供了一种缓存系统，包括：数据处理设备，所述数据处理设备包括处理器及用于缓存对象的缓存装置，其中，所述处理器用于向所述缓存装置发送所述对象的读请求或写请求，所述缓存装置为上述第一方面或者第一方面的多种可能的实现方式中的一种或几种的的缓存装置；数据存储设备，用于存储所述对象。

本申请的实施例，缓存系统包括数据处理设备及数据存储设备，数据处理设备包括处理器及缓存装置，处理器可以向缓存装置发送对象的读请求或写请求，缓存装置在接收到对象的读请求或写请求时，执行相对应的处理，例如，对象读操作、缓存准入处理等。

同时，缓存装置在运行过程中，能够自动对候选对象进行标注，并将标注后的候选对象加入当前训练集中，然后使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在当前训练集中的候选对象的数量大于或等于数量阈值时使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，从而能够实现概率预测模型的在线自监督学习，进而实现缓存装置的在线自监督学习。通过这种方式，不仅能够不断优化缓存装置的缓存准入及淘汰决策，提高缓存命中率，而且使得缓存装置能够自动感知并适应多种业务场景以及业务场景或数据访问模式的变化，在提高缓存装置的业务适应性的同时，还能降低缓存装置的维护成本。

第六方面，本申请的实施例提供了一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器，其中，所述处理器被配置为执行所述指令时实现上述第二方面或者第二方面的多种可能的实现方式中的一种或几种的缓存方法。

本申请的实施例，能够在缓存装置运行过程中，自动对候选对象进行标注，并将标注后的候选对象加入当前训练集中，然后使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在当前训练集中的候选对象的数量大于或等于数量阈值时使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，从而能够实现概率预测模型的在线自监督学习，进而实现缓存装置的在线自监督学习。

第七方面，本申请的实施例提供了一种非易失性计算机可读存储介质，其上存储有计算机程序指令，其特征在于，所述计算机程序指令被处理器执行时实现上述第二方面或者第二方面的多种可能的实现方式中的一种或几种的缓存方法。

第八方面，本申请的实施例提供了一种计算机程序产品，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，当所述计算机可读代码在电子设备中运行时，所述电子设备中的处理器执行上述第二方面或者第二方面的多种可能的实现方式中的一种或几种的缓存法。

本申请的这些和其他方面在以下(多个)实施例的描述中会更加简明易懂。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本申请的示例性实施例、特征和方面，并且用于解释本申请的原理。

图1a示出根据本申请一实施例的缓存装置的应用场景的示意图。

图1b示出根据本申请一实施例的缓存装置的应用场景的示意图。

图2示出根据本申请一实施例的缓存装置的框图。

图3示出根据本申请一实施例的精简知识存储结构的示意图。

图4示出根据本申请一实施例的缓存装置的控制模块的处理过程的示意图。

图5a示出根据本申请一实施例的候选对象的标注示意图。

图5b示出根据本申请一实施例的候选对象的标注示意图。

图6a示出根据本申请一实施例的缓存装置的缓存准入的处理过程的示意图。

图6b示出根据本申请一实施例的缓存装置的缓存准入的处理过程的示意图。

图7示出根据本申请一实施例的缓存装置的缓存淘汰的处理过程的示意图。

图8示出根据本申请一实施例的缓存方法的流程图。

具体实施方式

以下将参考附图详细说明本申请的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本申请，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本申请同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本申请的主旨。

在业务系统(也可认为是应用系统)中，缓存通常用于暂时保存近期可能会被重复访问的数据，以减少由于重复访问相同数据带来的磁盘读写开销、网络请求开销等，从而降低数据访问时延。缓存通常以对象作为最小单位来管理数据。一个对象可包括缓存中的一段数据及其对应的描述信息(也可称为元信息)。缓存介质是缓存中用于存储数据的物理介质，例如内存、磁盘等。缓存介质通常访问速度快，但存储容量小。

业务系统通过请求缓存获取数据，如果数据在缓存中，则缓存命中；如果数据不在缓存中，则缓存未命中。缓存命中的数据占所有被请求的数据的比例，称为缓存命中率。缓存命中率越高，业务系统的数据访问速度越快，其性能就越好。

通常情况下，缓存命中率主要是由缓存准入及缓存淘汰机制决定的。缓存准入是指缓存在接收到写请求时，判断是否将写请求指示的对象写入缓存介质的过程。例如，在对象进入缓存介质之前，判断对象是否有缓存的价值，如果对象有缓存的价值，则将该对象写入缓存介质；如果对象没有缓存的价值，则不将该对象写入缓存介质。

由于缓存介质的存储容量小，缓存通常需要不断淘汰旧的对象，为新的对象腾出存储空间，缓存淘汰就是指缓存删除或覆盖缓存介质中的对象的过程。缓存淘汰算法通常倾向于保留新对象，淘汰旧对象，例如淘汰最近最少使用(least recently used，LRU)的对象、对象先进先出(first in first out，FIFO)等。

在一些技术方案中，缓存采用了基于规则的准入和淘汰方法，这类缓存可称为启发式缓存。当前主流的应用级缓存系统(或缓存子系统)大多为启发式缓存。例如阿帕奇流量服务器(apache traffic server，ATS)、分布式内存对象缓存系统(memcached)、鱿鱼缓存代理服务器(squid cache)等均为启发式缓存。

启发式缓存的准入方法通常包括第二次准入(second hit)、基于统计信息的准入等。第二次准入是指近期第一次被访问的对象不写入缓存，近期第二次或更多次被访问的对象才写入缓存。基于统计信息的准入是指分别统计每个对象的近期访问次数，将访问次数超过访问次数阈值的对象写入缓存，否则不写入缓存。启发式缓存的淘汰方法通常包括LRU、FIFO、最不经常使用(least frequency used，LFU)以及与LRU、FIFO、LFU类似的方法等。

在启发式缓存的实际应用中，还可以在基于规则的缓存准入及淘汰的基础上，引入统计模块，用于统计对象短期内被访问的频率，并基于统计模块的统计结果进行缓存准入及淘汰的决策。

由于启发式缓存遵循固定的准入及淘汰规则，在业务系统运行之前，需要预先制定缓存准入及淘汰规则。然而，预先制定的缓存准入及淘汰规则，通常难以适应业务系统实际的数据访问模式(例如数据访问分布)，也难以适应业务系统各种不同的业务场景。例如，假设缓存准入规则指定小于1MB的数据不满足准入条件，即不准入缓存，但在业务系统运行时，由于存在数据分片等机制，数据可能均小于1MB或均大于1MB，在该情况下，固定的缓存准入规则无法达到预期效果。因此，启发式缓存的业务适应性较差。

此外，使用启发式缓存时，运维人员(一般是领域专家)不仅需要针对业务系统的不同业务场景，制定不同的缓存准入及淘汰规则，而且，在业务系统运行过程中，运维人员还需要在业务场景发生变化或数据访问模式发生变化的情况下，根据变化人工调整缓存准入及淘汰规则，不仅应对速度慢，而且维护成本高。

在另一些技术方案中，使用了基于离线机器学习的缓存。例如，在缓存中引入用于预测对象被访问概率的机器学习模型，并根据机器学习模型的预测结果，进行缓存准入及淘汰的决策。该方案中，机器学习模型的应用方式为离线训练-在线部署。也就是说，在缓存中引入机器学习模型后，通常需要采集业务系统访问的数据，并对采集的数据进行离线标注，然后使用标注后的数据，离线训练机器学习模型，训练结束后，再将机器学习模型部署上线。

然而，在各个业务系统的业务场景(即业务模式)不同或数据访问模式不一致的情况下，该方案需要为各个业务系统分别离线训练不同的机器学习模型，从而带来高昂的业务-模型适配成本。例如，对于内容分发网络(content delivery network，CDN)，其部署在不同地域的缓存系统通常面对的是不同的业务场景，需要为不同的业务场景，分别离线训练不同的机器学习模型，而不能使用一组训练数据及机器学习模型，适应不同的业务场景，否则会导致预测准确率降低，缓存决策效果差。

而且，在业务系统的业务场景或数据访问模式发生变化时，例如,业务系统的业务场景发生切换或者出现新的业务时，离线预训练的机器学习模型难以自动适应变化后的业务场景，预测准确率下降。通常的解决方式是在观察到业务场景或对象访问模式发生变化时，运维人员需要人工识别当前部署的机器学习模型是否适用该变化，如果不适用，则需要重新进行数据采集，离线训练机器学习模型，再部署上线。这种解决方式不仅应对速度慢，而且重新离线训练机器学习模型，还会增加机器学习模型的更新维护成本。

因此，采用预设准入及淘汰规则的启发式缓存以及基于离线机器学习的缓存，均存在业务适应性差、维护成本高等问题。

为了解决上述技术问题，本申请提供了一种缓存装置。本申请实施例的缓存装置包括控制模块及存储模块，控制模块用于：根据候选对象的历史访问信息，对候选对象进行标注，其中，候选对象为全部或者部分的目标对象，目标对象为缓存装置接收的读请求中指示的对象，或者目标对象为缓存装置接收的写请求中指示的对象，或者目标对象为存储模块中待淘汰的对象；将标注后的候选对象加入到当前训练集中；使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在当前训练集中的候选对象的数量大于或等于数量阈值时使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型。

通过这种方式，能够在缓存装置运行过程中，自动对候选对象进行标注，并将标注后的候选对象加入当前训练集中，然后使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在当前训练集中的候选对象的数量大于或等于数量阈值时使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，从而能够实现概率预测模型的在线自监督学习(即在线运行过程中自动进行样本标注及训练)，进而实现缓存装置的在线自监督学习。

本申请实施例的缓存装置，通过引入对象行为驱动的、可在线自动督学习的概率预测模型，实现了缓存装置的在线自监督学习，不仅能够不断优化缓存装置的缓存准入及淘汰决策，提高缓存命中率，而且使得缓存装置能够自动感知并适应多种业务场景以及业务场景或数据访问模式的变化，在提高缓存装置的业务适应性的同时，还能降低缓存装置的维护成本。

图1a示出根据本申请一实施例的缓存装置的应用场景的示意图。如图1a所示，提供了一种缓存系统，包括数据处理设备100、用于缓存对象的缓存装置200及用于存储对象的数据存储设备300。缓存装置200位于数据处理设备100的外部。数据处理设备100可以向缓存装置200发送对象的读请求或写请求，缓存装置200在接收到对象的读请求或写请求时，执行相对应的处理，例如，对象读操作、缓存准入处理等

举例来说，数据处理设备100读取对象时，首先向缓存装置200发送读请求，如果缓存装置200中存在数据处理设备100请求的对象，则缓存命中，数据处理设备100直接从缓存装置200中读取对象；若缓存装置200中不存在数据处理设备100请求的对象，则缓存未命中，数据处理设备100从数据存储设备300中读取对象。

其中，数据处理设备100用于对数据存储设备300中存储的对象进行处理。在一些实施例中，数据处理设备100可以为内容分发网络、数据存储等业务系统中的服务器、终端设备等设备。需要说明的是，数据处理设备100也可以为其他数据处理设备，本申请对此不作限制。

缓存装置200用于暂时保存近期可能会被数据处理设备100重复访问的对象，以降低数据处理装置100的数据访问时延，提高数据访问效率。

数据处理设备100也可以向缓存装置200发送对象的写请求，缓存装置200在接收到对象的写请求时，启动缓存准入的处理过程，以确定是否允许写请求指示的对象写入缓存装置。

图1b示出根据本申请一实施例的缓存装置的应用场景的示意图。如图1b所示，提供了一种缓存系统，包括数据处理设备100及用于存储对象的数据存储设备300。数据处理设备100包括处理器110及缓存装置200，即缓存装置200位于数据处理设备100的内部。处理器110可向缓存装置200发送对象的读请求或写请求。缓存装置200接收到对象的读请求或写请求时，执行相对应的处理，例如，对象读操作、缓存准入处理等。

在一种可能的实现方式中，在缓存装置200应用于业务系统中时，缓存装置可以实现为业务系统中的独立的缓存子系统(如图1a所示的应用场景)，也可以实现为业务系统中服务器等设备的缓存组件(如图1b所示的应用场景)。需要说明的是，本领域技术人员可根据实际情况设置缓存装置的具体实现方式，本申请对此不作限制。

图2示出根据本申请一实施例的缓存装置的框图。如图2所示，缓存装置200包括控制模块210及存储模块220。控制模块210用于实现缓存准入、缓存淘汰、候选对象自动标注、概率预测模型在线训练等功能；存储模块220是缓存装置200的缓存介质(例如内存、磁盘、网络介质等)，用于存储数据。

其中，控制模块210可通过处理器实现。处理器可以包括一个或多个处理单元，例如：处理器可以包括中央处理器(central process unit，CPU)，应用处理器(application processor，AP)，调制解调处理器，图形处理器(graphics processing unit，GPU)，图像信号处理器(image signal processor，ISP)，控制器，视频编解码器，数字信号处理器(digital signal processor，DSP)，基带处理器，和/或神经网络处理器(neural-network processing unit，NPU)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。本申请对处理器的具体类型不作限制。

在一种可能的实现方式中，缓存装置200以对象为单位对缓存的数据进行管理。控制模块210可记录各个对象的历史访问信息。对象的历史访问信息可包括对象被访问的时刻、对象被访问的次数、对象写入缓存装置200的时刻等。控制模块210在记录对象的历史访问信息时，可以直接记录对象被访问的时刻、对象被访问的次数、对象写入缓存装置200的时刻等原始访问信息；也可以对对象的原始访问信息进行处理后再记录，本申请对此不作限制。

对象的历史访问信息可通过哈希表、有序数组等方式进行记录。存储时，对象的历史访问信息可以附加在对象的数据结构上，与对象一起存储，也可以独立存储。本申请对缓存装置中对象的历史访问信息的记录方式及存储方式均不作限制。

在对象写入存储模块220(即缓存介质)后，控制模块210开始记录其历史访问信息。在对象被读取、对象从存储模块220中淘汰或对象再次写入存储模块220等情况下，控制模块210会实时更新对象的历史访问信息。

需要说明的是，本领域技术人员可根据实际情况设置对象的历史访问信息的更新条件，本申请对此不作限制。例如，可设置对象从存储模块中淘汰后，停止更新其历史访问信息，在该对象再次写入存储模块后，继续更新其历史访问信息，中间停止更新的时间段对应的历史访问信息以预设值(例如0)填充。

在一种可能的实现方式中，可预设对象的历史访问信息的时间长度。例如，假设需要记录对象最近15天内的历史访问信息，可将对象的历史访问信息的时间长度设置为15天。可选的，可根据缓存装置中各个对象的缓存周期，确定历史访问信息的时间长度。对象的缓存周期是指从对象写入缓存装置的存储模块开始至对象从缓存装置的存储模块中淘汰的时间段。为了更好地记录对象的历史访问信息，可设置历史访问信息的时间长度大于缓存装置中各个对象的缓存周期的平均值。此外，设置历史访问信息的时间长度时，还可以考虑业务系统的业务场景、数据访问模式等。本申请对历史访问信息的时间长度的设置依据及具体取值均不作限制。

控制模块记录对象的历史访问信息时，随着当前时刻的向前推移，对象的历史访问信息也不断更新。例如，可将历史访问信息的时间长度看作一个可以向前滑动的时间窗口，随着当前时刻的前移，时间窗口也随之向前滑动，同时，控制模块会根据对象的访问情况，不断更新对象的历史访问信息，使得对象的历史访问信息能够随着当前时刻的前移而不断更新。滑出时间窗口的历史访问信息，可以被覆盖或删除，也可以存储在预设区域，以便后续继续使用，或者进行统计分析等其他处理。

在一种可能的实现方式中，可将与对象的历史访问信息对应的时间段(该时间段的长度为历史访问信息的时间长度)划分为多个子时段，对象的历史访问信息可包括对象在各个子时段内的访问频率等级。对象的历史访问信息可通过精简知识存储结构进行记录。精简知识存储结构可通过预设长度的存储空间(例如4字节)记录对象在各个子时段内的访问频率等级。对象写入存储模块后，控制模块可为该对象建立对应的精简知识存储结构，以记录其历史访问信息。

使用精简知识存储结构记录对象的历史访问信息时，可首先将与对象的历史访问信息对应的时间段划分为多个子时段，同时将精简知识存储结构的存储空间划分为多个子空间，其中，子空间的数量可以与子时段的数量相同，即子空间与子时段一一对应，每个子空间存储对象在对应子时段内的历史访问信息，或者子空间的数量也可以大于子时段的数量，每个子时段对应一个子空间，剩余的子空间可用于存储对象的其他状态信息，例如，对象是否为重要对象、对象是否为上一个缓存周期保留的对象(即上一个缓存周期需要淘汰但未淘汰的对象)等；然后可根据预设的访问频率等级划分规则及对象在各个子时段内的访问次数，确定对象在各个子时段内的访问频率等级，并将访问频率等级记录在对应的子空间中。

也就是说，对象的精简知识存储结构可包括多个子空间，相应的，与对象的历史访问信息对应的时间段也可包括多个子时段，每个子时段对应精简知识存储结构中的一个子空间。对象的历史访问信息可包括对象在各个子时段内的访问频率等级，可将对象在各个子时段内的访问频率等级存储在精简知识存储结构的对应子空间中。

图3示出根据本申请一实施例的精简知识存储结构的示意图。如图3所示，对象的精简知识存储结构的存储空间为32比特位(bit)，可将该精简知识存储结构划分为16个子空间，每个子空间的大小为2bit，按照从第0位到第31位的顺序，对16个子空间依次进行编号：第1个子空间为第0-1位，第2个子空间为第2-3位，……，第16个子空间为第30-31位，同时，将与该对象的历史访问信息对应的时间段划分为15个子时段，按照与当前时刻的距离由近及远的顺序，对15个子时段进行编号：第1个子时段为当前时刻之前且与当前时刻相邻的子时段，第2个子时段为第1个子时段之前且与第1个子时段相邻的子时段，……，第15个子时段为第14个子时段之前且与第14个子时段相邻的子时段。其中，子时段与子空间按照编号进行对应：第1个子时段与第1个子空间相对应，第2个子时段与第2个子空间相对应，……，第15个子时段与第15个子空间相对应。

然后根据预设的访问频率等级划分规则及对象在各个子时段内的访问次数，确定对象在各个子时段内的访问频率等级。由于每个子空间的大小为2bit，可以使用00、01、10、11表示4个状态或等级，可预设访问频率等级划分规则为：若对象在子时段内的访问次数小于第一访问次数阈值(例如50)，则将对象在该子时段内的访问频率等级设置为0级，在子空间内使用00表示；若对象在子时段内的访问次数大于或等于第一访问次数阈值(例如50)且小于第二访问次数阈值(例如200)，则将对象在该子时段内的访问频率等级设置为1级，在子空间内使用01表示；若对象在子时段内的访问次数大于或等于第二访问次数阈值(例如200)且小于第三访问次数阈值(例如500)，则将对象在该子时段内的访问频率等级设置为2级，在子空间内使用10表示；若对象在子时段内的访问次数大于或等于第三访问次数阈值(例如500)，则将对象在该子时段内的访问频率等级设置为3级，在子空间内使用11表示。

通过上述方式确定出对象在各个子时段内的访问频率等级后，可将访问频率等级存储在精简知识存储结构的对应子空间中。

精简知识存储结构的第16个子空间可用于存储对象的其他状态信息，例如，可使用第30位表示该对象是否为重要对象，若对象为重要对象，则将第30位设为1，若对象不是重要对象，则将第30位设为0；可使用第31位表示该对象是否为上一个缓存周期保留的对象，若对象为上一个缓存周期保留的对象，则将第31位设为1,若对象不是上一个缓存周期保留的对象，则将第31位设为0。

如图3所示，对象的精简知识存储结构中，第1-3个子空间内存储的值为11，表示对象在第1-3个子时段内的访问频率等级为3级，可认为对象在第1-3个子时段内存在大量访问，对象的热度等级为最热；第4-9个子空间内存储的值为10，表示对象在第4-9个子时段内的访问频率等级为2级，可认为对象在第4-9个子时段内存在较多访问，对象的热度等级为热；第10-13个子空间内存储的值为01，表示对象在第10-13个子时段内的访问频率等级为1级，可认为对象在第10-13个子时段内存在少量访问，对象的热度等级为温；第14-15个子空间内存储的值为00，表示对象在第14-15个子时段内的访问频率等级为0级，可认为对象在第14-15个子时段内基本无访问，对象的热度等级为冷。第16个子空间内存储的值为00，表示对象不是重要对象，也不是上一个缓存周期保留的对象。

由图3所示的精简知识存储结构可以看出，与该精简知识存储结构对应的对象的访问频率等级逐渐变高，可知，该对象的访问次数呈上升趋势，其热度也逐渐上升。

需要说明的是，以上仅以图3作为示例，对精简知识存储结构进行了示例性说明，本领域技术人员可根据实际情况对精简知识存储结构的存储空间的大小、子区域的划分、与对象的历史访问信息对应的时间段的子时段的划分、子区域与子时段的对应关系、访问频率等级划分规则等进行设置，本申请对此均不作限制。

在预设长度的精简知识存储结构中，以访问频率等级的方式记录对象的历史访问信息，不仅可以节省存储空间及计算资源，而且能够按照时序记录对象的访问行为，从而实现大量对象的访问行为的在线感知，以提高对象的未来访问概率的预测准确性。此外，通过在线感知大量对象的访问行为，控制模块不仅能够感知业务系统的业务场景，而且能够感知业务系统的业务场景或数据访问模式的变化，以便缓存装置进行自适应调整。

在一种可能的实现方式中，可在缓存装置中部署概率预测模型，例如在缓存装置的控制模块上部署概率预测模型。该概率预测模型可用于预测缓存装置接收的写请求中指示的对象被访问的概率，或者预测缓存装置的存储模块中待淘汰的对象被访问的概率。概率预测模型可以是逻辑回归模型、神经网络、基于树的模型、支持向量机(support vector machine,SVM)等机器学习模型。本申请对概率预测模型的具体类型不作限制。

由于需要对概率预测模型进行在线自监督学习，可根据概率预测模型的更新周期，将缓存装置的运行过程划分为多个周期。下面以当前周期作为示例，对控制模块的处理过程做示例性地说明。

图4示出根据本申请一实施例的缓存装置的控制模块的处理过程的示意图。如图4所示，控制模块的处理过程包括：

步骤S401，根据候选对象的历史访问信息，对所述候选对象进行标注。

其中，候选对象为全部或者部分的目标对象，目标对象为缓存装置接收的读请求中指示的对象，或者目标对象为缓存装置接收的写请求中指示的对象，或者目标对象为存储模块中待淘汰的对象中的部分对象。需要说明的是，本领域技术人员可根据实际情况设置候选对象及目标对象包括的具体对象(即候选对象及目标对象的范围)，本申请对此不作限制。

例如，在业务系统的业务场景或数据访问模式中，如果数据读取占比很大(例如数据读取占比为95％)，则可设置目标对象为缓存装置接收的读请求中指示的对象，候选对象为全部或者部分的目标对象；在业务系统的业务场景或数据访问模式中，如果数据读取及数据写入相对均衡，则可设置目标对象包括缓存装置接收的读请求中指示的对象以及缓存装置接收的写请求中指示的对象，候选对象为全部或者部分的目标对象。在一些实施例中，目标对象还可以为存储模块中待淘汰的对象，候选对象可以为部分目标对象，即候选对象为存储模块中待淘汰的对象中的部分对象。

在一种可能的实现方式中，控制模块可从多个目标对象中采样得到一个或多个候选对象。例如，控制模块可根据采样规则，从多个目标对象中采样得到一个或多个候选对象，其中，采样规则可以为根据采样比例进行随机采样；采样规则也可以为根据采样比例及目标对象的标识符(identity，ID)进行采样，例如，可按照采样比例，对目标对象的ID进行取模运算，根据取模运算的结果进行采样。需要说明的是，本领域技术人员可根据实际情况对采样规则的具体内容进行设置，本申请对此不作限制。

通过从多个目标对象中采样得到一个或多个候选对象，能够减少候选对象的数量，从而提高处理效率。

在一种可能的实现方式中，控制模块对候选对象进行标注时，可将候选对象的历史访问信息中的一部分信息标注为候选对象的参考访问信息，作为训练概率预测模型时的输入，即作为决策依据；将候选对象的历史访问信息中的另一部分信息用于确定候选对象的参考访问概率，该参考访问概率可作为训练概率预测模型时的参考输出。

由于候选对象的历史访问信息具有时序性，控制模块对候选对象进行标注时，可首先在候选对象的历史访问信息中确定参考位置。其中，参考位置可用于指示候选对象的历史访问信息中，作为候选对象的参考访问信息的信息与用于确定候选对象的参考访问概率的信息的分界位置。

例如，假设候选对象的历史访问信息通过32bit的精简知识存储结构进行记录，该精简知识存储结构包括16个子空间，可将第4个子空间与第5个子空间的分界位置，设置为参考位置。也可根据与精简知识存储结构对应的多个子时段，设置参考位置。本申请对参考位置的设置方式及具体位置均不作限制。

控制模块在候选对象的历史访问信息中确定出参考位置后，可将候选对象的历史访问信息中在参考位置之前的信息，标注为候选对象的参考访问信息，作为训练概率预测模型时的输入。例如，假设候选对象的历史访问信息通过32bit的精简知识存储结构进行记录，该精简知识存储结构包括16个子空间(第16个子空间用于记录状态信息)，参考位置为第4个子空间与第5个子空间的分界位置，可将候选对象的历史访问信息中在参考位置之前的信息，即精简知识存储结构中第5-15个子空间存储的信息，标注为候选对象的参考访问信息。

可将候选对象的历史访问信息中在参考位置之后的信息，标注为候选对象的参考访问概率。例如，假设概率预测模型为回归模型，候选对象的历史访问信息通过32bit的精简知识存储结构进行记录，该精简知识存储结构包括16个子空间(第16个子空间用于记录状态信息)，参考位置为第4个子空间与第5个子空间的分界位置，可将该精简知识存储结构中，第1-4个子空间中存储的二进制数值(即第0-7位)，转换为十进制数值，并进行归一化处理，然后将归一化处理后的值，标注为候选对象的参考访问概率。

在概率预测模型为分类模型的情况下，可通过与上述回归模型类似的方式，确定候选对象的参考访问概率，此处不再赘述。在确定候选对象的参考访问概率后，还可对候选对象进行正负样本标注。例如，可将参考访问概率大于分类阈值(例如0.5)的候选对象标注为正样本，将参考访问概率小于或等于分类阈值(例如0.5)的候选对象标注为负样本。

需要说明的是，本领域技术人员可根据实际情况对候选对象的参考访问概率的标注方式进行设置，本申请对此不作限制。

图5a示出根据本申请一实施例的候选对象的标注示意图。如图5a所示，候选对象A的历史访问信息通过32bit的精简知识存储结构400进行记录。精简知识存储结构400包括16个子空间(第16个子空间用于记录状态信息)，候选对象A的历史访问信息中的参考位置为第4个子空间与第5个子空间的分界位置，通过图5a中的虚线420示出。

对候选对象A进行标注时，可将精简知识存储结构400中在虚线420左侧的信息，即第5-15个子空间存储的信息，标注为候选对象A的参考访问信息；可将精简知识存储结构400中在虚线420右侧的信息，即第1-4个子空间存储的信息，标注为候选对象A的参考访问概率。

如图5a所示，在精简知识存储结构400的下方，示出了与精简知识存储结构400中存储的信息对应的候选对象A的访问频率曲线410。从访问频率曲线410可以看出，候选对象A的访问频率逐渐降低，即候选对象A的热度逐渐降低。

图5b示出根据本申请一实施例的候选对象的标注示意图。如图5b所示，候选对象B的历史访问信息通过32bit的精简知识存储结构430进行记录。精简知识存储结构430包括16个子空间(第16个子空间用于记录状态信息)，候选对象B的历史访问信息中的参考位置为第3个子空间与第4个子空间的分界位置，通过图5b中的虚线440示出。

对候选对象B进行标注时，可将精简知识存储结构430中在虚线440左侧的信息，即第4-15个子空间存储的信息，标注为候选对象B的参考访问信息；可将精简知识存储结构430中在虚线440右侧的信息，即第1-3个子空间存储的信息，标注为候选对象B的参考访问概率。

如图5b所示，在精简知识存储结构430的下方，示出了与精简知识存储结构430中存储的信息对应的候选对象B的访问频率曲线450。从访问频率曲线450可以看出，候选对象B 的访问频率逐渐升高，即候选对象B的热度逐渐升高。

通过在候选对象的历史访问信息中确定参考位置，并将候选对象的历史访问信息中在参考位置之前的信息，标注为候选对象的参考访问信息，同时将候选对象的历史访问信息中在参考位置之后的信息，标注为候选对象的参考访问概率，从而能够在缓存装置运行过程中，根据历史访问信息对候选对象进行自动标注，进而提高标注效率。

步骤S402，将标注后的候选对象加入到当前训练集中。

其中，当前训练集用于对当前周期的概率预测模型进行训练，以得到下一周期的概率预测模型。

在一种可能的实现方式中，在将标注后的候选对象加入当前训练集的同时，如果候选对象为缓存装置接收的写请求中指示的对象，控制模块可直接将候选对象存储到存储模块，即对候选对象进行直接准入。如果候选对象为缓存装置的存储模块中待淘汰的对象，控制模块也可直接将候选对象存储到存储模块，即不淘汰候选对象。通过这种方式，能够将候选对象存储在存储模块中，以便继续更新候选对象的历史访问信息。

步骤S403，使用所述当前训练集对所述当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在所述当前训练集中的候选对象的数量大于或等于数量阈值时使用所述当前训练集对所述当前周期的概率预测模型进行训练来得到下一周期的概率预测模型。

在一种可能的实现方式中，控制模块将标注后的候选对象加入到当前训练集中后，可使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，从而实现概率预测模型的在线增量训练。该训练为异步增量训练，不影响当前周期的概率预测模型的在线运行。

在一种可能的实现方式中，控制模块将标注后的候选对象加入到当前训练集中后，也可判断当前训练集中的候选对象的数量是否大于或等于数量阈值(例如1000、2000等)。如果当前训练集中的候选对象的数量小于数量阈值，控制模块可重复执行步骤S401及步骤S402，不断对候选对象进行自动标注，加入到当前训练集中。如果当前训练集中的候选对象的数量大于或等于数量阈值，控制模块可使用当前训练集对当前周期的概率预测模型进行训练来得到下一周期的概率预测模型。该训练也为异步增量训练，不影响当前周期的概率预测模型的在线运行。

在一种可能的实现方式中，对当前周期的概率预测模型进行训练时，可使用随机梯度下降算法等支持参数增量训练更新的训练算法。支持参数增量训练更新的训练算法能够根据小部分候选对象，计算概率预测模型的损失函数对其参数的梯度，并以一定的速率往负梯度方向更新概率预测模型的参数，如误差反传算法，从而减小概率预测模型在候选对象上的误差。

通过各个周期的训练集对概率预测模型的增量训练，使得概率预测模型可以不断更新。当候选对象的分布发生变化时，概率预测模型在候选对象上的损失函数值增大，梯度增加，会以更剧烈的方式更新概率预测模型的参数。当候选对象分布稳定时，通过多次迭代训练，概率预测模型的参数逐渐收敛到稳定的值。

本申请实施例的缓存装置，能够通过异步增量训练的方法，即每次训练仅采用一个小的训练集，并将训练后的参数更新至在线运行的概率预测模型，从而能够把训练过程的计算和存储开销平摊到缓存装置的运行过程中，实现轻量的在线自监督学习。同时，通过在线增量训练，缓存装置能够自动适应业务场景的变化及数据访问模式的变化。

本申请实施例的缓存装置，通过引入对象行为驱动的、可在线自动督学习的概率预测模型，实现了缓存装置的在线自监督学习，不仅能够不断优化缓存装置的缓存准入及淘汰决策，提高缓存命中率，而且使得缓存装置能够自动感知并适应业务系统的多种业务场景以及业务场景或数据访问模式的变化，在提高缓存装置的业务适应性的同时，还能降低缓存装置的维护成本。

在一种可能的实现方式中，在缓存装置运行过程中，控制模块除了实现图4所示的处理过程外，还同时进行目标对象的缓存准入及缓存淘汰。

举例来说，如果目标对象为缓存装置接收的写请求中指示的对象，控制模块可将目标对象的历史访问信息作为当前周期的概率预测模型的输入，通过当前周期的概率预测模型预测目标对象被访问的概率，并判断预测的概率是否大于或等于第一概率阈值。如果预测的概率大于或等于第一概率阈值，则进行缓存写入，将目标对象存储到存储模块。如果预测的概率小于第一概率阈值，则终止缓存写入，不允许目标对象存储到存储模块。通过这种方式，控制模块能够根据预测的目标对象被访问的概率进行缓存准入，从而提高缓存准入的准确性。

如果目标对象为缓存装置接收的写请求中指示的对象，且没有目标对象的历史访问信息，控制模块可将目标对象存储到存储模块，即进行缓存写入。通过这种方式，能够避免没有历史访问信息的目标对象无法写入缓存装置的情况，从而提高缓存装置对业务场景变化或数据访问模式变化的适应性。

如果目标对象为存储模块中待淘汰的对象，控制模块可将目标对象的历史访问信息作为当前周期的概率预测模型的输入，通过当前周期的概率预测模型预测目标对象被访问的概率，并判断预测的概率是否小于或等于第二概率阈值。如果预测的概率小于或等于第二概率阈值，则进行缓存淘汰，将该目标对象从存储模块中淘汰。如果预测的概率大于第二概率阈值，则不淘汰该目标对象，将该目标保留在存储模块中。通过这种方式，控制模块能够根据预测的目标对象被访问的概率进行缓存淘汰，从而提高缓存淘汰的准确性。

需要说明的是，上述第一概率阈值及第二概率阈值可根据业务场景、数据访问模式、既有经验等进行设置。第一概率阈值及第二概率阈值可以为固定值，也可以为浮动值。第二概率阈值可以与第一概率阈值相同，也可以小于第一概率阈值。本领域技术人员可根据实际情况对第一概率阈值及第二概率阈值的具体取值进行设置，本申请对此不作限制。

下面对本申请实施例的缓存装置的数据访问过程进行示例性说明，并结合图6a、图6b及图7，对本申请实施例的缓存装置的缓存准入及淘汰过程进行示例性地说明。

缓存装置在接收到数据处理设备针对目标对象C的读请求的情况下(即目标对象C为缓存装置接收的读请求中指示的对象)，可查找存储模块中是否存在目标对象C。

如果存储模块中存在目标对象C，则缓存命中，数据处理设备从缓存装置的存储模块中读取目标对象C。同时，缓存装置的控制模块更新目标对象C的历史访问信息。且如果目标对象C为候选对象，控制模块还可根据目标对象C的历史访问信息，对目标对象C进行标注，并将标注后的目标对象C到当前训练集中。通过这种方式，能够使得当前训练集中包括读请求相关的候选对象。

在存储模块中不存在目标对象C的情况下，则缓存未命中，数据处理设备从缓存装置中读取目标对象C失败。数据处理设备则从数据存储设备中读取目标对象C。

图6a示出根据本申请一实施例的缓存装置的缓存准入的处理过程的示意图。图6a所示的缓存装置的缓存准入的处理过程中，候选对象为全部的目标对象，目标对象为缓存装置接收的写请求中指示的对象。

如图6a所示，缓存装置在步骤S601中接收到了针对目标对象D1的写请求。在接收到针对目标对象D1的写请求的情况下，控制模块启动缓存准入过程。

控制模块可在步骤S602中，判断目标对象D1(即缓存装置接收的写请求中指示的对象)是否有历史访问信息。如果目标对象D1没有历史访问信息，则执行步骤S607，将目标对象D1存储到存储模块，同时，由于目标对象D1没有历史访问信息，控制模块可为目标对象D1建立对应的精简知识存储结构，用于记录目标对象D1的历史访问信息。通过这种方式，能够避免没有历史访问信息的目标对象无法写入缓存装置的情况，提高缓存装置对业务场景变化或数据访问模式变化的适应性。

若目标对象D1有历史访问信息，则执行步骤S603，获取目标对象D1的历史访问信息，并在步骤S604中，将目标对象D1作为候选对象，然后同时执行步骤S608及步骤S605：

在步骤S608中，将候选对象(即目标对象D1)存储到存储模块，实现目标对象D1的缓存准入，同时更新目标对象D1的历史访问信息；

在步骤S605中，根据候选对象的历史访问信息，对候选对象进行标注，并在步骤S606中，将标注后的候选对象加入当前训练集中。通过这种方式，能够使得当前训练集中包括与写请求相关的候选对象。

图6b示出根据本申请一实施例的缓存装置的缓存准入的处理过程的示意图。图6b所示的缓存装置的缓存准入的处理过程中，候选对象为部分的目标对象，目标对象为缓存装置接收的写请求中指示的对象。

如图6b所示，缓存装置在步骤S611中接收到了针对目标对象D2的写请求。在接收到针对目标对象D2的写请求的情况下，控制模块启动缓存准入过程。

控制模块可在步骤S612中，判断目标对象D2是否有历史访问信息。如果目标对象D2没有历史访问信息，则执行步骤S617，将目标对象D2存储到存储模块，同时，由于目标对象D2没有历史访问信息，控制模块可为目标对象D2建立对应的精简知识存储结构，用于记录目标对象D2的历史访问信息。

若目标对象D2有历史访问信息，则执行步骤S613，获取目标对象D2的历史访问信息，并在步骤S614中，判断目标对象D2是否为候选对象。如果目标对象D2为候选对象，则同时执行步骤S620及步骤S618：

在步骤S620中，将候选对象(即目标对象D2)存储到存储模块，从而完成目标对象D2为候选对象的情况下的缓存准入；

在步骤S618中，根据候选对象的历史访问信息，对候选对象进行标注，并在步骤S619中，将标注后的候选对象加入到当前训练集中。通过这种方式，能够使得当前训练集中包括与写请求相关的候选对象。

如果目标对象D2不为候选对象，则执行步骤S615，将目标对象D2的历史访问信息作为当前周期的概率预测模型的输入，通过当前周期的概率预测模型预测目标对象D2被访问的概率，并在步骤S616中，判断预测的概率是否大于或等于第一概率阈值。

如果预测的目标对象D2被访问的概率大于或等于第一概率阈值，则执行步骤S617，将目标对象D2存储到存储模块，实现目标对象D2的缓存准入，同时更新目标对象D2的历史访问信息。

如果预测的目标对象D2被访问的概率小于预设的第一概率阈值，则执行步骤S621，终止缓存写入，即目标对象D2不满足缓存准入要求，不将目标对象D2写入存储模块。

在缓存装置的存储模块(即缓存介质)存满、对象保存时间超期等情况下，缓存装置的控制模块可启动缓存淘汰的处理过程。

例如，在缓存装置的存储模块未存满的情况下，可直接将目标对象D1或目标对象D2存储到存储模块；而在缓存装置的存储模块存满的情况下，即在存储模块的可用空间小于目标对象D1或目标对象D2所占用的存储空间的情况下，为了给目标对象D1或目标对象D2腾出存储空间，需要从存储模块中淘汰一个或多个对象。

图7示出根据本申请一实施例的缓存装置的缓存淘汰的处理过程的示意图。图7所示的缓存装置的缓存淘汰的处理过程中，候选对象为部分的目标对象，目标对象为存储模块中待淘汰的对象。

如图7所示，控制模块可在步骤S701中，确定存储模块中待淘汰的目标对象E，目标对象E可以为一个或多个。对于任一目标对象E，可在步骤S702中，获取目标对象E的历史访问信息，并在步骤S703中，判断目标对象E是否为候选对象。

如果目标对象E为候选对象，则同时执行步骤S710及步骤S708：

在步骤S710中，将候选对象(即目标对象E)保留在存储模块中，即不淘汰目标对象E；

在步骤S708中，根据候选对象(即目标对象E)的历史访问信息，对候选对象进行标注，并在步骤S709中，将标注后的候选对象加入到当前训练集中。通过这种方式，能够使得当前训练集中包括存储模块中待淘汰的候选对象，从而提高当前训练集中候选对象的多样性。

如果目标对象E不为候选对象，则执行步骤S704，将目标对象E的历史访问信息作为当前周期的概率预测模型的输入，通过当前周期的概率预测模型预测目标对象E被访问的概率，并在步骤S705中，判断预测的目标对象E被访问的概率是否小于或等于第二概率阈值。

如果预测的目标对象E被访问的概率小于或等于第二概率阈值，则执行步骤S706，将目标对象E从存储模块中淘汰，即删除或覆盖目标对象E，同时更新目标对象E的历史访问信息。

如果预测的目标对象E被访问的概率大于第二概率阈值，则执行步骤S707，将目标对象E保留在存储模块中，即不淘汰目标对象E，同时更新目标对象E的历史访问信息。

需要说明的是，以上仅分别以缓存装置接收的写请求中指示的对象未来被访问概率的预测值、存储模块中待淘汰的对象未来被访问概率的预测值作为依据，来进行缓存准入及缓存淘汰的决策。在一些实施例中，缓存准入在考虑写请求中指示的对象未来被访问概率的预测值的情况下，还可考虑业务系统的业务要求、安全规则、缓存装置的负载等其他条件；缓存淘汰在考虑需要存储模块中待淘汰的对象未来被访问概率的预测值的情况下，还可考虑存储模块中其他对象未来被访问概率的预测值、缓存介质(即存储模块)的写入速率限制等其他条件。本领域技术人员可根据实际情况确定缓存准入及缓存淘汰的决策条件，本申请对此不作限制。

本申请实施例的缓存装置，通过引入对象行为驱动的、可在线自动督学习的概率预测模型，不仅能够自动感知和适应应用系统多样的业务场景及数据访问分布的变化，还能在线完成概率预测模型的增量训练，在此基础上完成缓存准入及淘汰决策，从而能够提升缓存命中率，实现长期无人干预的稳定运行。此外，本申请实施例的缓存装置，使用精简知识存储结构记录对象的历史访问信息，还能够节省存储资源和计算资源。

在一种可能的实现方式中，本申请实施例的技术方案，还可以扩展到其它数据驱动的场景，例如搜索引擎结果排序、个性化推荐系统等。本申请的技术方案应用于搜索引擎结果排序时，可以根据用户对搜索结果的点击情况，自动标注关键词对应结果的排名，在线自监督训练排序模型，从而适应数据及用户喜好的变化。本申请的技术方案应用于个性化推荐系统时，可以根据用户对推荐结果的采纳情况，自动标注推荐结果的好与差，在线自监督训练个性化推荐模型，从而提高推荐的精准性。

图8示出根据本申请一实施例的缓存方法的流程图。所述缓存方法可应用于缓存装置中的控制模块，所述缓存方法包括：

步骤S810，根据候选对象的历史访问信息，对所述候选对象进行标注；其中，所述候选对象为全部或者部分的目标对象，所述目标对象为缓存装置接收的读请求中指示的对象，或者所述目标对象为缓存装置接收的写请求中指示的对象，或者所述目标对象为缓存装置的存储模块中待淘汰的对象；

步骤S820，将标注后的候选对象加入到当前训练集中；

步骤S830，使用所述当前训练集对所述当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在所述当前训练集中的候选对象的数量大于或等于数量阈值时使用所述当前训练集对所述当前周期的概率预测模型进行训练来得到下一周期的概率预测模型。

在一种可能的实现方式中，步骤S810可包括：在所述候选对象的历史访问信息中确定参考位置；将所述历史访问信息中在所述参考位置之前的信息，标注为所述候选对象的参考访问信息；将所述历史访问信息中在所述参考位置之后的信息，标注为所述候选对象的参考访问概率。

在一种可能的实现方式中，所述方法还包括：如果所述目标对象为所述缓存装置接收的写请求中指示的对象，将所述目标对象的历史访问信息作为所述当前周期的概率预测模型的输入，通过所述当前周期的概率预测模型预测所述目标对象被访问的概率；在预测的概率大于或等于第一概率阈值时，将所述目标对象存储到所述存储模块。

在一种可能的实现方式中，所述方法还包括：如果所述目标对象为所述存储模块中待淘汰的对象，将所述目标对象的历史访问信息作为所述当前周期的概率预测模型的输入，通过所述当前周期的概率预测模型预测所述目标对象被访问的概率；在预测的概率小于或等于第二概率阈值时，将所述目标对象从所述存储模块中淘汰。

在一种可能的实现方式中，所述方法还包括：如果所述目标对象为所述缓存装置接收的写请求中指示的对象，且没有所述目标对象的历史访问信息，将所述目标对象存储到所述存储模块。

在一种可能的实现方式中，所述方法还包括：从多个所述目标对象中采样得到一个或多个所述候选对象。

在一种可能的实现方式中，所述方法还包括：将所述候选对象存储到所述存储模块。

本申请的实施例提供了一种芯片，所述芯片用于部署上述任意一种缓存装置。

本申请的实施例提供了一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器，其中，所述处理器被配置为执行所述指令时实现上述方法。

本申请的实施例提供了一种非易失性计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现上述方法。

本申请的实施例提供了一种计算机程序产品，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，当所述计算机可读代码在电子设备的处理器中运行时，所述电子设备中的处理器执行上述方法。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(Random Access Memory，RAM)、只读存储器(Read Only Memory，ROM)、可擦式可编程只读存储器(Electrically Programmable Read-Only-Memory，EPROM或闪存)、静态随机存取存储器(Static Random-Access Memory，SRAM)、便携式压缩盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、数字多功能盘(Digital Video Disc，DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。

这里所描述的计算机可读程序指令或代码可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本申请操作的计算机程序指令可以是汇编指令、指令集架构(Instruction Set Architecture，ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(Local Area Network，LAN)或广域网(Wide Area Network，WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或可编程逻辑阵列(Programmable Logic Array，PLA)，该电子电路可以执行计算机可读程序指令，从而实现本申请的各个方面。

这里参照根据本申请实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本申请的多个实施例的装置、系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。

也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行相应的功能或动作的硬件(例如电路或ASIC(Application Specific Integrated Circuit，专用集成电路))来实现，或者可以用硬件和软件的组合，如固件等来实现。

尽管在此结合各实施例对本发明进行了描述，然而，在实施所要求保护的本发明过程中，本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书，可理解并实现所述公开实施例的其它变化。在权利要求中，“包括”(comprising)一词不排除其他组成部分或步骤，“一”或“一个”不排除多个的情况。单个处理器或其它单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施，但这并不表示这些措施不能组合起来产生良好的效果。

以上已经描述了本申请的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

一种缓存装置，其特征在于，所述缓存装置包括控制模块及存储模块；

所述控制模块，用于：

根据候选对象的历史访问信息，对所述候选对象进行标注；其中，所述候选对象为全部或者部分的目标对象，所述目标对象为所述缓存装置接收的读请求中指示的对象，或者所述目标对象为所述缓存装置接收的写请求中指示的对象，或者所述目标对象为所述存储模块中待淘汰的对象；

将标注后的候选对象加入到当前训练集中；

使用所述当前训练集对所述当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在所述当前训练集中的候选对象的数量大于或等于数量阈值时使用所述当前训练集对所述当前周期的概率预测模型进行训练来得到下一周期的概率预测模型。
根据权利要求1所述的装置，其特征在于，所述控制模块，用于：

在所述候选对象的历史访问信息中确定参考位置；

将所述历史访问信息中在所述参考位置之前的信息，标注为所述候选对象的参考访问信息；

将所述历史访问信息中在所述参考位置之后的信息，标注为所述候选对象的参考访问概率。
根据权利要求1或2所述的装置，其特征在于，所述控制模块，用于：

如果所述目标对象为所述缓存装置接收的写请求中指示的对象，将所述目标对象的历史访问信息作为所述当前周期的概率预测模型的输入，通过所述当前周期的概率预测模型预测所述目标对象被访问的概率；

在预测的概率大于或等于第一概率阈值时，将所述目标对象存储到所述存储模块。
根据权利要求1至3中任意一项所述的装置，其特征在于，所述控制模块，用于：

如果所述目标对象为所述存储模块中待淘汰的对象，将所述目标对象的历史访问信息作为所述当前周期的概率预测模型的输入，通过所述当前周期的概率预测模型预测所述目标对象被访问的概率；

在预测的概率小于或等于第二概率阈值时，将所述目标对象从所述存储模块中淘汰。
根据权利要求1至4中任意一项所述的装置，其特征在于，所述控制模块，用于：

如果所述目标对象为所述缓存装置接收的写请求中指示的对象，且没有所述目标对象的历史访问信息，将所述目标对象存储到所述存储模块。
根据权利要求1至5中任意一项所述的装置，其特征在于，所述控制模块，用于：

从多个所述目标对象中采样得到一个或多个所述候选对象。
根据权利要求1至6中任意一项所述的装置，其特征在于，所述控制模块，用于：

将所述候选对象存储到所述存储模块。
一种缓存方法，其特征在于，所述方法包括：

根据候选对象的历史访问信息，对所述候选对象进行标注；其中，所述候选对象为全部或者部分的目标对象，所述目标对象为缓存装置接收的读请求中指示的对象，或者所述目标对象为缓存装置接收的写请求中指示的对象，或者所述目标对象为缓存装置的存储模块中待淘汰的对象；

将标注后的候选对象加入到当前训练集中；

使用所述当前训练集对所述当前周期的概率预测模型进行训练来得到下一周期的概率预测模型，或者在所述当前训练集中的候选对象的数量大于或等于数量阈值时使用所述当前训练集对所述当前周期的概率预测模型进行训练来得到下一周期的概率预测模型；

其中，所述方法应用于所述缓存装置的控制模块。
根据权利要求8所述的方法，其特征在于，所述根据候选对象的历史访问信息，对所述候选对象进行标注，包括：

在所述候选对象的历史访问信息中确定参考位置；

将所述历史访问信息中在所述参考位置之前的信息，标注为所述候选对象的参考访问信息；

将所述历史访问信息中在所述参考位置之后的信息，标注为所述候选对象的参考访问概率。
根据权利要求8或9所述的方法，其特征在于，所述方法还包括：

如果所述目标对象为所述缓存装置接收的写请求中指示的对象，将所述目标对象的历史访问信息作为所述当前周期的概率预测模型的输入，通过所述当前周期的概率预测模型预测所述目标对象被访问的概率；

在预测的概率大于或等于第一概率阈值时，将所述目标对象存储到所述存储模块。
根据权利要求8至10中任意一项所述的方法，其特征在于，所述方法还包括：

如果所述目标对象为所述存储模块中待淘汰的对象，将所述目标对象的历史访问信息作为所述当前周期的概率预测模型的输入，通过所述当前周期的概率预测模型预测所述目标对象被访问的概率；

在预测的概率小于或等于第二概率阈值时，将所述目标对象从所述存储模块中淘汰。
根据权利要求8至11中任意一项所述的方法，其特征在于，所述方法，还包括：

如果所述目标对象为所述缓存装置接收的写请求中指示的对象，且没有所述目标对象的历史访问信息，将所述目标对象存储到所述存储模块。
根据权利要求8至12中任意一项所述的方法，其特征在于，所述方法还包括：

从多个所述目标对象中采样得到一个或多个所述候选对象。
根据权利要求8至13中任意一项所述的方法，其特征在于，所述方法还包括：

将所述候选对象存储到所述存储模块。
一种芯片，其特征在于，所述芯片用于部署权利要求1至7中任意一项所述的缓存装置。
一种缓存系统，其特征在于，包括：

缓存装置，用于缓存对象，所述缓存装置为权利要求1至7中任意一项所述的缓存装置；

数据处理设备，用于向所述缓存装置发送所述对象的读请求或写请求；

数据存储设备，用于存储所述对象。
一种缓存系统，其特征在于，包括：

数据处理设备，所述数据处理设备包括处理器及用于缓存对象的缓存装置，其中，所述处理器用于向所述缓存装置发送所述对象的读请求或写请求，所述缓存装置为权利要求1至7中任意一项所述的缓存装置；

数据存储设备，用于存储所述对象。
一种缓存装置，其特征在于，包括：

控制模块；

用于存储所述控制模块的可执行指令的存储模块；

其中，所述控制模块被配置为执行所述指令时实现权利要求8至14中任意一项所述的方法。
一种非易失性计算机可读存储介质，其上存储有计算机程序指令，其特征在于，所述计算机程序指令被处理器执行时实现权利要求8至14中任意一项所述的方法。
一种计算机程序产品，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，当所述计算机可读代码在电子设备中运行时，所述电子设备中的处理器执行权利要求8至14中任意一项所述的方法。