CN109413694A

CN109413694A - 一种基于内容流行度预测的小小区缓存方法及装置

Info

Publication number: CN109413694A
Application number: CN201811049097.XA
Authority: CN
Inventors: 王冬宇; 王晓湘; 黄大纯; 兰延文
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2018-09-10
Filing date: 2018-09-10
Publication date: 2019-03-01
Anticipated expiration: 2038-09-10
Also published as: CN109413694B

Abstract

本发明实施例提供了一种基于内容流行度预测的小小区缓存方法及装置。所述方法包括：获取小小区中距离未来周期最近的预设数量个历史周期内所有内容的第一请求次数；对每一内容对应的第一请求次数，采用差分自回归移动平均模型对每一内容在小小区未来周期内的第二请求次数进行预测，得到每一内容对应的预测请求次数；获取小小区中所有内容对应的最近一次请求时间间隔；对每一内容对应的预测请求次数及每一内容对应的最近一次请求时间间隔，使用内容流行度计算公式，计算小小区中每一内容对应的流行度预测值；基于每一内容对应的流行度预测值，对小小区中的内容进行缓存。应用本发明实施例，以提高小小区缓存内容的缓存命中率及缓存空间的利用率。

Description

一种基于内容流行度预测的小小区缓存方法及装置

技术领域

本发明涉及无线通信技术领域，特别是涉及一种基于内容流行度预测的小小区缓存方法及装置。

背景技术

随着移动通信网络的不断发展与丰富，超密集网络应运而生，小小区的密集部署作为解决超密集网络中移动数据流量激增问题的有效方案而被大众广泛接受。超密集网络中，主要应用包含内容的分发与共享，该内容例如可以是视频文件、新闻、快讯等。在用户请求内容对应的业务高峰期时，用户向小小区基站请求内容对应的业务数据信息，然后小小区基站通过回传链路到核心网进行用户请求内容对应业务数据的下载，这一过程中，使得业务高峰期时，业务数据传输的速率受到有限回传链路的制约。基于此，可以提前在小小区基站上缓存内容，当用户请求内容、且所请求的内容在小小区基站上已缓存时，小小区基站直接服务用户，不用再通过回传链路到核心网进行用户请求内容对应业务数据的下载，以减轻回传链路的压力、降低用户请求内容获取的时延。

现有非业务高峰期时，小小区基站提前通过回传链路到核心网下载内容，进而将内容进行主动缓存，以减轻业务高峰期时回传链路压力，同时充分利用非业务高峰期的带宽资源。现有在小小区基站上非业务高峰期提前对内容进行缓存的方法有：使用LRU(LeastRecently Used，最近最少使用)策略提前对内容进行缓存，该策略是基于用户访问的时间特性实现的，策略记录内容的最近一次访问时间间隔，然后，按照内容的最近一次访问时间间隔从小到大的顺序对内容进行缓存；当小小区基站的缓存空间不足时，使用最近一次访问时间间隔较小对应的内容替换小小区基站已缓存的内容中最近一次访问时间间隔较大对应的内容。

然而，上述缓存的方法是以用户访问的时间特性为依据，对内容进行缓存，并在缓存空间不足时对小小区基站中已缓存的内容进行替换。实际应用中，以用户访问时间特性为依据对内容进行缓存的方法，使得小小区基站中所缓存的内容受用户对内容的最近一次访问时间间隔的影响较大；并且，所缓存的最近一次访问时间间隔较小对应的内容，并不一定是用户所需的内容，进一步导致缓存的内容可能不是用户选择命中率高的内容，造成缓存空间在一定程度上的浪费。

发明内容

本发明实施例的目的在于提供一种基于内容流行度预测的小小区缓存方法及装置，以提高小小区缓存内容的缓存命中率及缓存空间的利用率。具体技术方案如下：

第一方面，本发明实施例提供了一种基于内容流行度预测的小小区缓存方法，所述方法包括：

获取小小区中距离未来周期最近的预设数量个历史周期内所有内容的第一请求次数；其中，所述所有内容包括：所述小小区中已缓存的内容及所述小小区记录的用户请求过但未缓存的内容，所述历史周期在所述未来周期之前；

对每一内容对应的第一请求次数，采用差分自回归移动平均模型对每一内容在所述小小区未来周期内的第二请求次数进行预测，得到所述每一内容对应的预测请求次数；

获取所述小小区中所有内容对应的最近一次请求时间间隔；

对所述每一内容对应的预测请求次数及每一内容对应的最近一次请求时间间隔，使用内容流行度计算公式，计算所述小小区中每一内容对应的流行度预测值；

基于所述每一内容对应的流行度预测值，对所述小小区中的内容进行缓存。

可选的，所述对每一内容对应的第一请求次数，采用差分自回归移动平均模型对每一内容在所述小小区未来周期内的第二请求次数进行预测，得到所述每一内容对应的预测请求次数的步骤包括：

将所述每一内容对应的第一请求次数，生成每一内容对应的内容请求次数时间序列；

对每一内容对应的内容请求次数时间序列，若该内容请求次数时间序列不平稳，则对所述内容请求次数时间序列进行差分，得到平稳的内容请求次数时间序列以及差分变换参数；

计算每一所述平稳的内容请求次数时间序列的自相关函数及偏相关函数；

利用每一所述平稳的内容请求次数时间序列的自相关函数及偏相关函数，分别确定自回归过程阶数和移动平均过程阶数；

利用所述差分变换参数、自回归过程阶数和移动平均过程阶数，确定差分自回归移动平均模型；

将预设时间序列应用到所述差分自回归移动平均模型中，计算所述预设时间序列的方差及标准差，并利用所述方差及标准差，对所述差分自回归移动平均模型进行检验；

若检验不通过，则返回执行计算每一所述平稳的内容请求次数时间序列的自相关函数及偏相关函数的步骤；

若检验通过，则使用所述差分自回归移动平均模型，对所述每一内容的所述第二请求次数进行预测，得到所述每一内容对应的预测请求次数。

可选的，所述对所述每一内容对应的预测请求次数及每一内容对应的最近一次请求时间间隔，使用内容流行度计算公式，计算所述小小区中每一内容对应的流行度预测值的步骤，包括：

对所述每一内容对应的预测请求次数进行归一化，得到归一化后的每一内容对应的预测请求次数；

对所述每一内容对应的最近一次请求时间间隔进行归一化，得到归一化后的每一内容对应的最近一次请求时间间隔；

对所述归一化后的每一内容对应的预测请求次数及所述归一化后的每一内容对应的最近一次请求时间间隔，使用内容流行度计算公式，计算所述小小区中每一内容对应的流行度预测值。

可选的，采用如下第一归一化公式，对所述每一内容对应的预测请求次数进行归一化：

所述第一归一化公式为：

Fⁱ _normal＝Fⁱ/F_max

其中，Fⁱ表示内容i对应的预测请求次数，F_max表示预测请求次数的最大值，Fⁱ _normal表示归一化后的内容i对应的预测请求次数；

采用如下第二归一化公式，对所述每一内容对应的最近一次请求时间间隔进行归一化：

所述第二归一化公式为：

其中，Tⁱ _interval表示内容i对应的最近一次请求时间间隔，T_{interval_max}表示最近一次请求时间间隔中的最大值，Tⁱ _{interval_normal}表示归一化后的内容i对应的最近一次请求时间间隔；Tⁱ _interval通过公式Tⁱ _interval＝Tⁱ _cur-Tⁱ _last计算得到，Tⁱ _cur表示内容i所处的当前时刻，Tⁱ _last表示内容i最近一次被访问的时刻；

所述内容流行度计算公式为：

其中，P(i)表示内容i的流行度预测值。

可选的，所述基于所述每一内容对应的流行度预测值，对所述小小区中的内容进行缓存的步骤，包括：

判断所述小小区的缓存空间是否已满；

若所述小小区的缓存空间未满时，则将所述所有内容中除在小小区中已缓存内容外的内容缓存至所述小小区中；

若所述小小区的缓存空间已满时，则对所述所有内容中每一内容对应的流行度预测值按照从大到小的顺序进行排序，将流行度预测值排序中前Q/T个流行度预测值对应的内容缓存至所述小小区中；其中，Q表示所述小小区的缓存容量，T表示内容的大小，Q/T表示所述小小区能够缓存内容的数量。

可选的，所述将流行度预测值排序中前Q/T个流行度预测值对应的内容缓存至所述小小区中的步骤，包括：

判断所述流行度预测值排序中前Q/T个流行度预测值对应的内容是否在小小区中已缓存；

若所述前Q/T个流行度预测值对应的内容在小小区中未缓存，则将所述小小区中已缓存的内容删除，将所述前Q/T个流行度预测值对应的内容缓存至所述小小区中；

若所述前Q/T个流行度预测值中有Q/T-H个流行度预测值对应的内容在小小区中已缓存，H个流行度预测值对应的内容在小小区中未缓存，则将所述小小区中已缓存的内容中流行度预测值排序靠后的H个内容删除，将所述前Q/T个流行度预测值中未缓存的H个流行度预测值对应的内容进行缓存。

第二方面，本发明实施例还提供了一种基于内容流行度预测的小小区缓存装置，所述装置包括：

第一获取模块，用于获取小小区中距离未来周期最近的预设数量个历史周期内所有内容的第一请求次数；其中，所述所有内容包括：所述小小区中已缓存的内容及所述小小区记录的用户请求过但未缓存的内容，所述历史周期在所述未来周期之前；

预测模块，用于对每一内容对应的第一请求次数，采用差分自回归移动平均模型对每一内容在所述小小区未来周期内的第二请求次数进行预测，得到所述每一内容对应的预测请求次数；

第二获取模块，用于获取所述小小区中所有内容对应的最近一次请求时间间隔；

计算模块，用于对所述每一内容对应的预测请求次数及每一内容对应的最近一次请求时间间隔，使用内容流行度计算公式，计算所述小小区中每一内容对应的流行度预测值；

缓存模块，用于基于所述每一内容对应的流行度预测值，对所述小小区中的内容进行缓存。

可选的，所述预测模块，具体用于：

可选的，所述计算模块，包括：

第一归一化子模块，用于对所述每一内容对应的预测请求次数进行归一化，得到归一化后的每一内容对应的预测请求次数；

第二归一化子模块，用于对所述每一内容对应的最近一次请求时间间隔进行归一化，得到归一化后的每一内容对应的最近一次请求时间间隔；

计算子模块，用于对所述归一化后的每一内容对应的预测请求次数及所述归一化后的每一内容对应的最近一次请求时间间隔，使用内容流行度计算公式，计算所述小小区中每一内容对应的流行度预测值。

所述第一归一化公式为：

Fⁱ _normal＝Fⁱ/F_max

所述第二归一化公式为：

所述内容流行度计算公式为：

其中，P(i)表示内容i的流行度预测值。

可选的，所述缓存模块，包括：

第一判断子模块，用于判断所述小小区的缓存空间是否已满；

第一缓存子模块，用于在所述小小区的缓存空间未满时，将所述所有内容中除在小小区中已缓存内容外的内容缓存至所述小小区中；

第二缓存子模块，用于在所述小小区的缓存空间已满时，对所述所有内容中每一内容对应的流行度预测值按照从大到小的顺序进行排序，将流行度预测值排序中前Q/T个流行度预测值对应的内容缓存至所述小小区中；其中，Q表示所述小小区的缓存容量，T表示内容的大小，Q/T表示所述小小区能够缓存内容的数量。

可选的，所述第二缓存子模块，包括：

第三缓存子模块，用于在所述前Q/T个流行度预测值对应的内容在小小区中未缓存时，将所述小小区中已缓存的内容删除，将所述前Q/T个流行度预测值对应的内容缓存至所述小小区中；

第四缓存子模块，用于所述前Q/T个流行度预测值中有Q/T-H个流行度预测值对应的内容在小小区中已缓存，H个流行度预测值对应的内容在小小区中未缓存时，将所述小小区中已缓存的内容中流行度预测值排序靠后的H个内容删除，将所述前Q/T个流行度预测值中未缓存的H个流行度预测值对应的内容进行缓存。

第三方面，本发明实施例还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述第一方面所述的一种基于内容流行度预测的小小区缓存方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面所述的一种基于内容流行度预测的小小区缓存方法。

第五方面，本发明实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面所述的一种基于内容流行度预测的小小区缓存方法。

本发明实施例提供的一种基于内容流行度预测的小小区缓存方法及装置，获取小小区中距离未来周期最近的预设数量个历史周期内所有内容的第一请求次数；对每一内容对应的第一请求次数，采用差分自回归移动平均模型对每一内容在小小区未来周期内的第二请求次数进行预测，得到每一内容对应的预测请求次数；获取小小区中所有内容对应的最近一次请求时间间隔；对每一内容对应的预测请求次数及每一内容对应的最近一次请求时间间隔，使用内容流行度计算公式，计算小小区中每一内容对应的流行度预测值；基于每一内容对应的流行度预测值，对小小区中的内容进行缓存。

本发明实施例中，基于小小区中距离未来周期最近的预设数量个历史周期内所有内容的第一请求次数，预测未来周期内每一内容对应的预测请求次数，然后，综合考虑每一内容对应的预测请求次数以及每一内容对应的最近一次请求时间间隔，计算每一内容对应的流行度预测值，最后，根据计算得到的每一内容对应的流行度预测值对小小区中的内容进行缓存。内容对应的预测请求次数越多，表明该内容将会处于高热度时期，在未来周期内可能会被更多的用户需求；内容对应的最近一次请求时间间隔越短，表明该内容的新鲜度越高。本发明实施例综合考虑了每一内容对应的预测请求次数以及最近一次请求时间间隔，计算得到每一内容对应的流行度预测值，使得新鲜度越高同时热度越高的内容具有越高的流行度预测值，基于该内容的流行度预测值对小小区中的内容进行缓存，可以更好地满足用户的请求，进一步提高小小区缓存内容的缓存命中率及缓存空间的利用率。

当然，实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于内容流行度预测的小小区缓存方法的流程图；

图2为图1所示实施例中步骤S102的一种实施方式流程图；

图3为图1所示实施例中步骤S104的一种实施方式流程图；

图4为图1所示实施例中步骤S105的一种实施方式流程图；

图5为图4所示实施例中步骤S1053的一种实施方式流程图；

图6为本发明实施例提供的不同缓存方法用户请求命中率仿真图；

图7为本发明实施例提供的用户请求次数仿真图；

图8为本发明实施例提供的流行度预测值与缓存命中率仿真图；

图9为本发明实施例提供的不同缓存方法用户获取内容时延仿真图；

图10为本发明实施例提供的不同缓存方法对核心网流量消耗仿真图；

图11为本发明实施例提供的一种基于内容流行度预测的小小区缓存装置的结构示意图；

图12为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了解决现有技术问题，本发明实施例提供了一种基于内容流行度预测的小小区缓存方法及装置，以提高小小区缓存内容的缓存命中率及缓存空间的利用率。

下面首先对本发明实施例所提供的一种基于内容流行度预测的小小区缓存方法进行介绍。

如图1所示，图1为本发明实施例提供的一种基于内容流行度预测的小小区缓存方法的流程图，该方法可以包括：

S101，获取小小区中距离未来周期最近的预设数量个历史周期内所有内容的第一请求次数；其中，所有内容包括：小小区中已缓存的内容及小小区记录的用户请求过但未缓存的内容，历史周期在未来周期之前。

本发明实施例中一种可选的实现方式为：针对某一小小区，统计并获取到该小小区中距离未来周期最近的预设数量个历史周期内所有内容的第一请求次数。其中，上述的所有内容包括：小小区中已缓存的内容及小小区记录的用户请求过但未缓存的内容；上述的历史周期在未来周期之前。

可以理解的是，距离未来周期最近的预设数量个历史周期，即为在未来周期之前的最近的预设数量个历史周期，且该预设数量个历史周期为连续的周期。示例性地，当预设数量为L个时，可以统计并获取某一小小区中连续L个历史周期内所有内容的第一请求次数，其对应的未来周期即为第L+1个周期。具体的，上述的周期，可以为工作日的一周或两周等，本领域技术人员可根据实际需求进行设置，本申请在此不作限制；针对上述预设数量的数值，本领域技术人员可根据实际需求进行设置，本申请在此不作限制。

S102，对每一内容对应的第一请求次数，采用差分自回归移动平均模型对每一内容在小小区未来周期内的第二请求次数进行预测，得到每一内容对应的预测请求次数。

本发明实施例中，每一内容对应的第一请求次数，即为所获取的小小区中距离未来周期最近的预设数量个历史周期内每一内容对应的请求次数。每一内容在小小区中未来周期内的第二请求次数为：基于所获取的小小区中距离未来周期最近的预设数量个历史周期内每一内容对应的请求次数，对每一内容在未来周期内的请求次数的预测，可以理解为与将要得到的每一内容对应的预测请求次数等同概念。具体的，采用差分自回归移动平均模型对每一内容在小小区未来周期内的第二请求次数进行预测，得到每一内容对应的预测请求次数的实现过程在下文进行详细介绍。

示例性地，在获取某一小小区中连续L个历史周期内所有内容的第一请求次数之后，可以采用差分自回归移动平均模型对每一内容在小小区第L+1个周期内的第二请求次数进行预测，得到每一内容对应的预测请求次数。其中，所获取的L个历史周期内所有内容的第一请求次数为真实数据，使用所获取到的真实的数据，来对每一内容在小小区第L+1个周期内的第二请求次数进行预测，得到的每一内容对应的预测请求次数为预测数据。

S103，获取小小区中所有内容对应的最近一次请求时间间隔。

本发明实施例中一种可选的实现方式为：针对某一小小区，统计并获取到该小小区中所有内容对应的最近一次请求时间间隔。该所有内容包括：小小区中已缓存的内容及小小区记录的用户请求过但未缓存的内容。示例性地，针对于所有内容中用户请求过的内容，获取该内容对应的最近一次请求时间间隔；针对于所有内容中用户未请求过的内容，其对应的最近一次请求时间间隔即为零。其中，内容对应的最近一次请求时间间隔为：当前此刻与该内容最近一次被访问时刻之间的时间差。

S104，对每一内容对应的预测请求次数及每一内容对应的最近一次请求时间间隔，使用内容流行度计算公式，计算小小区中每一内容对应的流行度预测值。

本发明实施例中，每一内容对应的预测请求次数，即为对每一内容在未来周期内的请求次数进行预测得到的结果。每一内容对应的流行度预测值为：基于每一内容对应的预测请求次数及最近一次请求时间间隔，针对每一内容在未来周期内的流行度进行计算得到的预测值。具体的，使用内容流行度计算公式，计算小小区中每一内容对应的流行度预测值的实现过程在下文进行详细介绍。

S105，基于每一内容对应的流行度预测值，对小小区中的内容进行缓存。

计算得到小小区中每一内容对应的流行度预测值之后，可以根据得到的每一内容对应的流行度预测值，对小小区中的内容进行缓存。具体的，基于每一内容对应的流行度预测值，对小小区中的内容进行缓存的实现过程在下文进行详细介绍。

本发明实施例提供的一种基于内容流行度预测的小小区缓存方法，基于小小区中距离未来周期最近的预设数量个历史周期内所有内容的第一请求次数，预测未来周期内每一内容对应的预测请求次数，然后，综合考虑每一内容对应的预测请求次数以及每一内容对应的最近一次请求时间间隔，计算每一内容对应的流行度预测值，最后，根据计算得到的每一内容对应的流行度预测值对小小区中的内容进行缓存。内容对应的预测请求次数越多，表明该内容将会处于高热度时期，在未来周期内可能会被更多的用户需求；内容对应的最近一次请求时间间隔越短，表明该内容的新鲜度越高。本发明实施例综合考虑了每一内容对应的预测请求次数以及最近一次请求时间间隔，计算得到每一内容对应的流行度预测值，使得新鲜度越高同时热度越高的内容具有越高的流行度预测值，基于该内容的流行度预测值对小小区中的内容进行缓存，可以更好地满足用户的请求，进一步提高小小区缓存内容的缓存命中率及缓存空间的利用率。

在图1所示实施例的基础上，如图2所示，图2为图1所示实施例中步骤S102的一种实施方式流程图，该方式可以包括：

S1021，将每一内容对应的第一请求次数，生成每一内容对应的内容请求次数时间序列。

在获取到小小区中距离未来周期最近的预设数量个历史周期内所有内容的第一请求次数之后，将每一内容对应的第一请求次数，生成每一内容对应的内容请求次数时间序列。

示例性地，在获取到某一小小区中连续L个历史周期内所有内容的第一请求次数之后，假设该小小区中所有内容总量为K，所有内容的集合表示为C，C＝{1，2，3...K}，F_i ^j表示为内容i在第j个周期内的请求次数，j＝1，2，3...，L。则将每一内容i(i＝1，2，3...，K)在L个周期内的请求次数，可以看作是随着时间推移而形成的一个内容请求次数时间序列F_i。即将每一内容对应的第一请求次数，生成每一内容对应的内容请求次数时间序列。

S1022，对每一内容对应的内容请求次数时间序列，若该内容请求次数时间序列不平稳，则对内容请求次数时间序列进行差分，得到平稳的内容请求次数时间序列以及差分变换参数。

针对所生成的每一内容对应的内容请求次数时间序列，判断每一内容对应的内容请求次数时间序列的平稳性，若该内容请求次数时间序列不平稳，则对内容请求次数时间序列进行差分，进一步得到平稳的内容请求次数时间序列以及差分变换参数。

示例性的，判断每一内容对应的内容请求次数时间序列的平稳性的实现方式至少可以采用如下三种实现方式：

第一种判断每一内容对应的内容请求次数时间序列的平稳性的实现方式可以为：针对每一内容对应的内容请求次数时间序列，计算该内容请求次数时间序列的自相关函数及偏相关函数，然后，通过观察内容请求次数时间序列的自相关函数及偏相关函数曲线，判断该内容请求次数时间序列是否平稳，具体通过观察内容请求次数时间序列的自相关函数及偏相关函数曲线，判断该内容请求次数时间序列是否平稳可参见现有技术的实现，本申请在此不作赘述。

第二种判断每一内容对应的内容请求次数时间序列的平稳性的实现方式可以为：计算每一内容对应的内容请求次数时间序列的均值、方差以及标准差，观察该内容请求次数时间序列在均值附近的波动情况以及周期性，判断该内容请求次数时间序列是否平稳，具体通过观察该内容请求次数时间序列在均值附近的波动情况以及周期性，判断该内容请求次数时间序列是否平稳可参见现有技术的实现，本申请在此不作赘述。

第三种判断每一内容对应的内容请求次数时间序列的平稳性的实现方式可以为：计算每一内容对应的内容请求次数时间序列是否存在单位根，如果存在单位根则说明该内容请求次数时间序列是非平稳的；如果不存在单位根则说明该内容请求次数时间序列是平稳的。

当然，本申请只是以上述实现方式进行说明，具体的，判断每一内容对应的内容请求次数时间序列的平稳性的实现方式，并不仅限于此。在实际应用中，上述三种判断每一内容对应的内容请求次数时间序列的平稳性的实现方式，可以单独使用，也可以一起使用，本领域技术人员可根据实际需求进行选择，本申请在此不作限制。

当判断得到某一内容对应的内容请求次数时间序列不平稳时，则对该内容请求次数时间序列进行差分，至该内容请求次数时间序列为一平稳序列为止，得到平稳的内容请求次数时间序列，将差分的次数确定为差分变换参数。当判断得到某一内容对应的内容请求次数时间序列平稳时，不作处理，并且该内容请求次数时间序列对应的差分变换参数即为零。具体的，对内容请求次数时间序列进行差分的过程可参见现有技术的实现，本申请在此不作赘述。

S1023，计算每一平稳的内容请求次数时间序列的自相关函数及偏相关函数。

S1024，利用每一平稳的内容请求次数时间序列的自相关函数及偏相关函数，分别确定自回归过程阶数和移动平均过程阶数。

针对每一平稳的内容请求次数时间序列，计算每一平稳的内容请求次数时间序列的自相关函数及偏相关函数，并根据计算结果，分别确定自回归过程阶数和移动平均过程阶数。

示例性地，计算每一平稳的内容请求次数时间序列的自相关函数及偏相关函数，然后，根据每一平稳的内容请求次数时间序列的自相关函数和偏相关函数的截尾情况选择模型。具体的，如果自相关函数是拖尾的，而偏自相关函数是截尾的，则该内容请求次数时间序列符合AR(Autoregressive，自回归)模型；如果自相关函数是截尾的，而偏自相关函数是拖尾的，则该内容请求次数时间序列符合MA(Moving Average，移动平均)模型；如果偏自相关函数和自相关函数都是拖尾的，则该内容请求次数时间序列符合ARMA(Autoregressive Moving Average，自回归移动平均)模型。再根据每一平稳的内容请求次数时间序列的自相关函数和偏相关函数的截尾情况对模型进行参数估计，分别确定自回归过程阶数和移动平均过程阶数，具体的，确定自回归过程阶数和移动平均过程阶数的过程可参见现有技术的实现，本申请在此不作赘述。

S1025，利用差分变换参数、自回归过程阶数和移动平均过程阶数，确定差分自回归移动平均模型。

在确定差分变换参数、自回归过程阶数和移动平均过程阶数之后，利用所确定的差分变换参数、自回归过程阶数和移动平均过程阶数，进一步确定差分自回归移动平均模型。

S1026，将预设时间序列应用到差分自回归移动平均模型中，计算预设时间序列的方差及标准差，并利用方差及标准差，对差分自回归移动平均模型进行检验。

在确定差分自回归移动平均模型之后，将预设时间序列应用到该差分自回归移动平均模型中，然后，计算预设时间序列的方差及标准差，并利用所计算的方差及标准差，对差分自回归移动平均模型进行检验。该预设时间序列可以是现有的一组用来检验差分自回归移动平均模型的数据，具体的，该预设时间序列可参见现有技术进行选择，利用所计算的方差及标准差，对差分自回归移动平均模型进行检验的过程可参见现有技术的实现，本申请在此不作赘述。

S1027，若检验不通过，则返回执行步骤S1023。

当检验不通过时，需要重新利用每一平稳的内容请求次数时间序列的自相关函数及偏相关函数，确定自回归过程阶数和移动平均过程阶数，进一步重新确定差分自回归移动平均模型。

S1028，若检验通过，则使用差分自回归移动平均模型，对每一内容的第二请求次数进行预测，得到每一内容对应的预测请求次数。

当检验通过时，则可以使用该确定的差分自回归移动平均模型，对每一内容的第二请求次数进行预测，得到每一内容对应的预测请求次数。当步骤S1022中内容请求次数时间序列进行了差分时，在对每一内容的第二请求次数进行预测的过程中，需要先对该内容请求次数时间序列进行差分还原，然后，对每一内容的第二请求次数进行预测，得到每一内容对应的预测请求次数。具体的，对内容请求次数时间序列进行差分还原，以及对每一内容的第二请求次数进行预测，得到每一内容对应的预测请求次数的过程可参见现有技术的实现，本申请在此不作赘述。

本发明实施例中，对每一内容对应的第一请求次数，采用差分自回归移动平均模型对每一内容在小小区未来周期内的第二请求次数进行预测，得到每一内容对应的预测请求次数，将每一内容在小小区未来周期内的第二请求次数、与每一内容在小小区中距离未来周期最近的预设数量个历史周期内的第一请求次数之间的关联关系考虑在内，使得预测得到的每一内容对应的预测请求次数更为客观、准确。

在图1所示实施例的基础上，如图3所示，图3为图1所示实施例中步骤S104的一种实施方式流程图，该方式可以包括：

S1041，对每一内容对应的预测请求次数进行归一化，得到归一化后的每一内容对应的预测请求次数。

在得到每一内容对应的预测请求次数之后，对每一内容对应的预测请求次数进行归一化，得到归一化后的每一内容对应的预测请求次数。可选地，对每一内容对应的预测请求次数进行归一化所采用的第一归一化公式可以为：

Fⁱ _normal＝Fⁱ/F_max

其中，Fⁱ表示内容i对应的预测请求次数，F_max表示预测请求次数的最大值，Fⁱ _normal表示归一化后的内容i对应的预测请求次数。

S1042，对每一内容对应的最近一次请求时间间隔进行归一化，得到归一化后的每一内容对应的最近一次请求时间间隔。

在获取到每一内容对应的最近一次请求时间间隔之后，对每一内容对应的最近一次请求时间间隔进行归一化，得到归一化后的每一内容对应的最近一次请求时间间隔。可选地，对每一内容对应的最近一次请求时间间隔进行归一化所采用的第二归一化公式可以为：

其中，Tⁱ _interval表示内容i对应的最近一次请求时间间隔，T_{interval_max}表示最近一次请求时间间隔中的最大值，Tⁱ _{interval_normal}表示归一化后的内容i对应的最近一次请求时间间隔；Tⁱ _interval通过公式Tⁱ _interval＝Tⁱ _cur-Tⁱ _last计算得到，Tⁱ _cur表示内容i所处的当前时刻，Tⁱ _last表示内容i最近一次被访问的时刻。

S1043，对归一化后的每一内容对应的预测请求次数及归一化后的每一内容对应的最近一次请求时间间隔，使用内容流行度计算公式，计算小小区中每一内容对应的流行度预测值。

对每一内容对应的预测请求次数以及每一内容对应的最近一次请求时间间隔分别进行归一化之后，使用内容流行度计算公式，计算小小区中每一内容对应的流行度预测值。可选地，所使用的内容流行度计算公式为：

其中，P(i)表示内容i的流行度预测值。

本发明实施例中，Tⁱ _interval越小表示内容i所处的当前时刻距离最近一次被请求时刻的时间间隔越短，说明内容i的新鲜度越高，将来被再次访问的概率越大。Fⁱ是未来周期内内容i的预测请求次数，Fⁱ数值越大，说明内容i在未来周期内被请求的次数可能越多，说明该内容i将会处于高热度时期，在未来周期内可能会被更多的用户需求。如果只考虑内容对应的预测请求次数来计算内容的流行度预测值，则当内容对应的预测请求次数相差不大时得到的内容流行度预测值更多地受到最近一次请求时间间隔的影响，故只考虑内容对应的预测请求次数会使得得到的内容流行度预测值精度所欠缺。本发明实施例中，综合考虑每一内容对应的预测请求次数及最近一次请求时间间隔，使得计算得到的每一内容对应的流行度预测值，具体较高新鲜度的同时热度也越高。

在图1所示实施例的基础上，如图4所示，图4为图1所示实施例中步骤S105的一种实施方式流程图，该方式可以包括：

S1051，判断小小区的缓存空间是否已满。

在得到每一内容对应的流行度预测值之后，对小小区中的内容进行缓存的过程中，可以先判断该小小区的缓存空间是否已满。本发明实施例中一种可选的实现方式为：本领域技术人员可以对小小区的缓存空间的大小进行设置。

S1052，若小小区的缓存空间未满时，将所有内容中除在小小区中已缓存内容外的内容缓存至小小区中。

当判断小小区的缓存空间未满时，将所有内容中除在小小区中已缓存内容外的内容缓存至小小区中。即当小小区还有一定的缓存空间时，将所有内容中除在小小区中已缓存内容外的新的内容缓存至小小区中。

S1053，若小小区的缓存空间已满时，对所有内容中每一内容对应的流行度预测值按照从大到小的顺序进行排序，将流行度预测值排序中前Q/T个流行度预测值对应的内容缓存至小小区中；其中，Q表示小小区的缓存容量，T表示内容的大小，Q/T表示小小区能够缓存内容的数量。

当判断小小区的缓存空间已满时，对所有内容中每一内容对应的流行度预测值按照从大到小的顺序进行排序，然后，将流行度预测值排序中前Q/T个流行度预测值对应的内容缓存至小小区中，使得流行度预测值较高的内容缓存在小小区中，以便用户请求内容时，小小区中所缓存内容的请求命中率相对较高。

在图4所示实施例的基础上，如图5所示，图5为图4所示实施例中步骤S1053的一种实施方式流程图，该方式可以包括：

S1053a，判断流行度预测值排序中前Q/T个流行度预测值对应的内容是否在小小区中已缓存。

在将流行度预测值排序中前Q/T个流行度预测值对应的内容缓存至小小区的过程中，判断流行度预测值排序中前Q/T个流行度预测值对应的内容是否在小小区中已缓存，以便更好的将流行度预测值较高的内容缓存至小小区中。

S1053b，若前Q/T个流行度预测值对应的内容在小小区中未缓存，则将小小区中已缓存的内容删除，将前Q/T个流行度预测值对应的内容缓存至小小区中。

如果前Q/T个流行度预测值对应的内容在小小区中未缓存，则直接将小小区中已缓存的内容删除，将前Q/T个流行度预测值对应的内容缓存至小小区中，以替换小小区中原有缓存的内容。

S1053c，若前Q/T个流行度预测值中有Q/T-H个流行度预测值对应的内容在小小区中已缓存，H个流行度预测值对应的内容在小小区中未缓存，则将小小区中已缓存的内容中流行度预测值排序靠后的H个内容删除，将前Q/T个流行度预测值中未缓存的H个流行度预测值对应的内容进行缓存。

如果前Q/T个流行度预测值中有Q/T-H个流行度预测值对应的内容在小小区中已缓存，有H个流行度预测值对应的内容在小小区中未缓存，则将小小区中已缓存的内容中流行度预测值排序靠后的H个内容删除，将前Q/T个流行度预测值中未缓存的H个流行度预测值对应的内容进行缓存，即使用流行度预测值较高的内容替换小小区中原有缓存的流行度预测值较低的内容。

本发明实施例中一种可选的实现方式可以为：针对上述每一实施例可以周期性的执行，以便小小区中所缓存的内容一直保持有较高的流行度预测值，该周期性执行的过程所选取的周期，可以为一周或一个月，具体的本领域技术人员可根据实际需求进行设置，本申请在此不作限制。

示例性地，本发明实施例中将小小区的内容使用不同的缓存方法进行缓存，得到的仿真图分别如图6至至图10所示。其中，LFU(Least Frequently Used，最不常用)策略缓存方法为：基于用户访问的频率特性特性实现的，该策略记录内容一段时间内的访问次数，作为该段时间内内容的访问频率，然后，按照内容的访问频率从大到小的顺序对内容进行缓存，当小小区基站的缓存空间不足时，使用内容访问频率较大对应的内容替换内容中访问频率最小对应的内容。图中所提策略即为本申请中的缓存方法。

其中，图6为本发明实施例提供的不同缓存方法用户请求命中率仿真图，图中显示了三种不同缓存方法使得小小区中缓存内容的用户请求命中率不同，对比可见，本申请的缓存方法使得用户请求命中率相对较高。图7为本发明实施例提供的用户请求次数仿真图，图中的访问次数即为对内容的请求次数，其显示了使用本申请的方法在10个周期内，预测数据与真实数据之间的关系，可见，本申请中预测请求次数相对校准确。图8为本发明实施例提供的流行度预测值与缓存命中率仿真图，Zipf为齐夫分布，α为内容对应的流行度预测值，本图为使用一组真实的用户请求数据，根据该数据的统计结果拟合而成，图中显示了内容对应的流行度预测值越高，用户请求命中率越高。图9为本发明实施例提供的不同缓存方法用户获取内容时延仿真图，图中显示了三种不同缓存方法下小小区中缓存内容与用户平均获取内容时延之间的关系，可见，本申请的缓存方法使得的用户请求命中率高，即用户平均获取内容时延较小。图10为本发明实施例提供的不同缓存方法对核心网流量消耗仿真图，该图对应的是在业务高峰期时，三种不同缓存方法下小小区中缓存内容与移动核心网流量消耗之间的关系，可见，本申请的缓存方法使得在业务高峰期时，移动核心网流量消耗较低。

本发明实施例综合考虑了每一内容对应的预测请求次数以及最近一次请求时间间隔，计算得到每一内容对应的流行度预测值，使得新鲜度越高同时热度越高的内容具有越高的流行度预测值，基于该内容的流行度预测值对小小区中的内容进行缓存，可以更好地满足用户的请求，进一步提高小小区缓存内容的缓存命中率及缓存空间的利用率。

相应于上述方法实施例，本发明实施例提供了一种基于内容流行度预测的小小区缓存装置，如图11所示，所述装置可以包括：

第一获取模块111，用于获取小小区中距离未来周期最近的预设数量个历史周期内所有内容的第一请求次数；其中，所述所有内容包括：所述小小区中已缓存的内容及所述小小区记录的用户请求过但未缓存的内容，所述历史周期在所述未来周期之前；

预测模块112，用于对每一内容对应的第一请求次数，采用差分自回归移动平均模型对每一内容在所述小小区未来周期内的第二请求次数进行预测，得到所述每一内容对应的预测请求次数；

第二获取模块113，用于获取所述小小区中所有内容对应的最近一次请求时间间隔；

计算模块114，用于对所述每一内容对应的预测请求次数及每一内容对应的最近一次请求时间间隔，使用内容流行度计算公式，计算所述小小区中每一内容对应的流行度预测值；

缓存模块115，用于基于所述每一内容对应的流行度预测值，对所述小小区中的内容进行缓存。

本发明实施例提供的一种基于内容流行度预测的小小区缓存装置，基于小小区中距离未来周期最近的预设数量个历史周期内所有内容的第一请求次数，预测未来周期内每一内容对应的预测请求次数，然后，综合考虑每一内容对应的预测请求次数以及每一内容对应的最近一次请求时间间隔，计算每一内容对应的流行度预测值，最后，根据计算得到的每一内容对应的流行度预测值对小小区中的内容进行缓存。内容对应的预测请求次数越多，表明该内容将会处于高热度时期，在未来周期内可能会被更多的用户需求；内容对应的最近一次请求时间间隔越短，表明该内容的新鲜度越高。本发明实施例综合考虑了每一内容对应的预测请求次数以及最近一次请求时间间隔，计算得到每一内容对应的流行度预测值，使得新鲜度越高同时热度越高的内容具有越高的流行度预测值，基于该内容的流行度预测值对小小区中的内容进行缓存，可以更好地满足用户的请求，进一步提高小小区缓存内容的缓存命中率及缓存空间的利用率。

需要说明的是，本发明实施例的装置是与图1所示的一种基于内容流行度预测的小小区缓存方法对应的装置，图1所示的一种基于内容流行度预测的小小区缓存方法的所有实施例均适用于该装置，且均能达到相同的有益效果。

可选的，所述预测模块，具体用于：

可选的，所述计算模块，包括：

所述第一归一化公式为：

Fⁱ _normal＝Fⁱ/F_max

所述第二归一化公式为：

所述内容流行度计算公式为：

其中，P(i)表示内容i的流行度预测值。

可选的，所述缓存模块，包括：

可选的，所述第二缓存子模块，包括：

本发明实施例还提供了一种电子设备，如图12所示，包括处理器121、通信接口122、存储器123和通信总线124，其中，处理器121，通信接口122，存储器123通过通信总线124完成相互间的通信，

存储器123，用于存放计算机程序；

处理器121，用于执行存储器123上所存放的程序时，实现本发明实施例所提供的方法。

本发明实施例提供的一种电子设备，基于小小区中距离未来周期最近的预设数量个历史周期内所有内容的第一请求次数，预测未来周期内每一内容对应的预测请求次数，然后，综合考虑每一内容对应的预测请求次数以及每一内容对应的最近一次请求时间间隔，计算每一内容对应的流行度预测值，最后，根据计算得到的每一内容对应的流行度预测值对小小区中的内容进行缓存。内容对应的预测请求次数越多，表明该内容将会处于高热度时期，在未来周期内可能会被更多的用户需求；内容对应的最近一次请求时间间隔越短，表明该内容的新鲜度越高。本发明实施例综合考虑了每一内容对应的预测请求次数以及最近一次请求时间间隔，计算得到每一内容对应的流行度预测值，使得新鲜度越高同时热度越高的内容具有越高的流行度预测值，基于该内容的流行度预测值对小小区中的内容进行缓存，可以更好地满足用户的请求，进一步提高小小区缓存内容的缓存命中率及缓存空间的利用率。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的一种基于内容流行度预测的小小区缓存方法，以获取相同的技术效果。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的的一种基于内容流行度预测的小小区缓存方法，以获取相同的技术效果。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个......”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置/电子设备实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种基于内容流行度预测的小小区缓存方法，其特征在于，包括：

获取所述小小区中所有内容对应的最近一次请求时间间隔；

2.根据权利要求1所述的方法，其特征在于，所述对每一内容对应的第一请求次数，采用差分自回归移动平均模型对每一内容在所述小小区未来周期内的第二请求次数进行预测，得到所述每一内容对应的预测请求次数的步骤包括：

3.根据权利要求1所述的方法，其特征在于，所述对所述每一内容对应的预测请求次数及每一内容对应的最近一次请求时间间隔，使用内容流行度计算公式，计算所述小小区中每一内容对应的流行度预测值的步骤，包括：

4.根据权利要求3所述的方法，其特征在于，采用如下第一归一化公式，对所述每一内容对应的预测请求次数进行归一化：

所述第一归一化公式为：

Fⁱ _normal＝Fⁱ/F_max

所述第二归一化公式为：

所述内容流行度计算公式为：

其中，P(i)表示内容i的流行度预测值。

5.根据权利要求1所述的方法，其特征在于，所述基于所述每一内容对应的流行度预测值，对所述小小区中的内容进行缓存的步骤，包括：

判断所述小小区的缓存空间是否已满；

6.根据权利要求5所述的方法，其特征在于，所述将流行度预测值排序中前Q/T个流行度预测值对应的内容缓存至所述小小区中的步骤，包括：

7.一种基于内容流行度预测的小小区缓存装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，所述计算模块，包括：

9.根据权利要求7所述的装置，其特征在于，所述缓存模块，包括：

10.根据权利要求9所述的装置，其特征在于，所述第二缓存子模块，包括：