CN110381540A

CN110381540A - 基于dnn的实时响应时变文件流行度的动态缓存更新方法

Info

Publication number: CN110381540A
Application number: CN201910659927.9A
Authority: CN
Inventors: 杨嘉琛; 门垚
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2019-07-22
Filing date: 2019-07-22
Publication date: 2019-10-25
Anticipated expiration: 2039-07-22
Also published as: CN110381540B

Abstract

本发明涉及一种基于DNN的实时响应时变文件流行度的动态缓存更新方法，包括下列步骤：动态文件库建模；适应用户请求分布变化的部分缓存更新，整个缓存更新问题分为两个阶段：第一阶段静态完全缓存更新问题，第二阶段动态部分缓存更新问题；深度学习方法求解动态缓存更新问题:实现实时响应时变文件流行度的动态缓存更新，以适应用户请求分布不断变化，即期望在已知当前文件流行度以及上一时刻的基站文件缓存概率的情况下，优化当前时刻基站文件缓存概率，使用多层神经网络来求解动态缓存更新问题。

Description

基于DNN的实时响应时变文件流行度的动态缓存更新方法

技术领域

本发明属于无线异质网络边缘缓存技术领域，涉及一种动态缓存更新方法。

背景技术

伴随5G通信时代的临近，对回程链路带宽占用较多的视频流量成为移动数据流量的主要形式，移动端硬件设备所需的数据流量呈现指数式爆炸增长，这导致基站与核心网之间的回程链路在数据流量峰值时不堪重负，超密度多层异质网络(UDHNs)和网络边缘缓存技术是满足日益增长的无线数据需求的关键技术。

基于随机几何为多层超密度异质网络进行建模，使得对于多层异质网络的分析简单化，并且更易于获得相应的解析特性。通常采用泊松点分布对宏基站的分布进行精确的建模，并引入泊松聚类过程以刻画基站和用户的聚类特性。

网络边缘缓存的作用类似于一个局域代理服务器，即在基站中存储一部分较流行的(使用率较高的)文件，当用户请求的文件被基站所缓存时(该情况称为缓存命中)，基站直接将缓存命中的文件发送给用户即可，无需通过回程链路向核心网请求文件。关于网络边缘缓存的研究需要考虑一种动态的长期的演进模型，即在文件流行度不断演进的情况下，更新基站文件缓存，这就需要对于文件流行度作出精确预测，以具备适应未来一段时间内用户请求的能力。潮汐流量问题是关于文件流行度周期性演进的典型例子：白天的用户移动数据流量远高于凌晨的移动数据流量。

发明内容

由于基站的缓存能力相对有限，而待缓存的文件库通常是无限的，本发明提出了一种基于DNN的实时响应时变文件流行度的动态缓存更新方法，希望最大化利用基站的缓存容量以实现最大可能的系统性能。技术方案如下：

一种基于DNN的实时响应时变文件流行度的动态缓存更新方法，包括下列步骤：

第一步：动态文件库建模

对动态文件库进行建模，即用数学模型表示基站文件缓存概率：考虑超密度多层异质网络，认为各层的基站分布为独立均匀泊松点过程，第k层基站激活密度表示为λ_k；对一个含有F个文件的动态文件库按照文件流行度的递减顺序排列，然后对文件大小做归一化处理，设不同的用户集群中同一文件的流行度各不相同，第e个集群中的文件库在时间t的第f个文件表示为则基于用户聚类的多集群模型中，具有K层基站的文件缓存概率可以表示为如下的概率矩阵：

其中表示k层中的文件的文件缓存概率；

第二步：适应用户请求分布变化的部分缓存更新

整个缓存更新问题分为两个阶段：

(1)第一阶段静态完全缓存更新问题目标是在可以无限制利用回程链路的高峰时段实现基站所缓存文件完全任意的更新：给定第e个集群中第f个文件的初始的文件库流行度需要优化第k层基站激活密度λ_ke和初始文件缓存概率

(2)第二阶段动态部分缓存更新问题目标是在用户请求分布不断变化并且回程链路资源匮乏情况下的基站文件缓存动态更新，即使用一定量的回程链路带宽来追踪文件流行度的变化，基于第一阶段完全缓存更新问题对基站中缓存的文件进行微调，抽象为数学模型为：给定第e个集群中第f个文件当前的文件流行度以及上一时刻的基站文件缓存概率即第一阶段优化中所获得的基站文件缓存概率，优化当前时刻的基站文件缓存概率

第三步：深度学习方法求解动态缓存更新问题

实现实时响应时变文件流行度的动态缓存更新，以适应用户请求分布不断变化，即期望在已知当前文件流行度以及上一时刻的基站文件缓存概率的情况下，优化当前时刻基站文件缓存概率，使用多层神经网络来求解动态缓存更新问题方法为：

(1)为每一个集群构建其独有的全连接层深度神经网络DNN，神经元的激活函数采用sigmoid函数；损失函数定义为平均绝对值误差；

(2)优化问题的输入为当前的文件流行度以及上一时刻的基站文件缓存概率输出为当前时刻的基站文件缓存概率

(3)对DNN的输出做归一化处理，然后乘以缓存容量得到最终结果，即当前时刻基站文件缓存概率。

本发明提出的基于动态的文件流行度的基站缓存更新方法，为每一个cluster构造一个DNN结构来学习文件缓存概率的模式。这一方法不仅能够节约计算资源，同时可以保证基站中的文件缓存概率能够紧紧追踪文件库文件流行度的变化。为满足日益增长的以视频数据为代表的无线数据需求提出了一种行之有效的解决方案。数值模拟的结果(见附图2)显示DNN具有良好的泛化能力，能够提供对测试数据的精确的近似，实现对于文件流行度的精准的追踪。

附图说明

图1：DNN网络结构。网络具有1层输入层，4层隐藏层，1层输出层。

图2：DNN方法对于时变文件流行度追踪的数值模拟结果。证明DNN网络对于测试数据的精确追踪能力。

具体实施方式

第一步：动态文件库建模

对动态文件库进行建模，主要包括基站激活密度和文件缓存概率：认为各层的基站分布为独立均匀泊松点过程，第k层基站激活密度表示为λ_k；对一个含有F个文件的动态文件库按照文件流行度的递减顺序排列，然后对文件大小做归一化处理，假设不同的cluster中同一文件的流行度各不相同，第e个cluster中的文件库在时间t的第f个文件表示为则基于用户聚类的多cluster模型(mCP)中的具有K层基站的文件缓存概率可以表示为如下的概率矩阵：

其中表示k层中的文件的文件缓存概率。

第二步：多cluster缓存更新第一阶段完全缓存更新模型

对基站激活密度和文件缓存概率进行动态联合优化，分为两个阶段：

(1)第一阶段静态完全缓存更新问题实现在可以无限制利用回程链路的高峰时段实现基站所缓存文件完全任意的更新，抽象为数学模型为：给定第e个cluster中第f个文件的初始的文件库流行度需要优化第k层基站激活密度λ_ke和初始文件缓存概率即：

(2)第二阶段动态部分缓存更新问题实现在用户请求分布不断变化并且回程链路资源匮乏情况下的基站文件缓存动态更新，即使用一定量的回程链路带宽来追踪文件流行度的变化，基于第一阶段完全缓存更新问题对基站中缓存的文件进行微调，抽象为数学模型为：给定第e个cluster中第f个文件当前的文件流行度以及上一时刻的基站文件缓存概率即第一阶段优化中所获得的基站文件缓存概率，优化当前时刻的基站文件缓存概率即：

第三步：深度学习方法求解动态缓存更新问题

为了适应用户请求分布不断变化，希望在已知当前文件流行度以及上一时刻的基站文件缓存概率的情况下，预测当前时刻基站文件缓存概率，即可实现实时响应时变文件流行度的动态缓存更新。

本发明使用多层神经网络来解决上述问题，即学习优化问题的输入和输出之间的映射关系，具体步骤为：

(1)为每一个cluster构建其独有的全连接层深度神经网络(DNN)。对于每一个cluster，采用的DNN结构含有4层隐藏层，1层输入层，1层输出层；神经元的激活函数采用sigmoid函数；损失函数定义为平均绝对值误差。

(2)优化问题的输入为当前的文件流行度以及上一时刻的基站文件缓存概率利用CVX工具箱产生的数据作为神经网络的训练数据，所使用的文件流行度为随机产生的Zipf分布；输出为当前时刻的基站文件缓存概率

(3)由于基站的缓存容量限制，最后需要对DNN的输出做归一化处理，然后乘以缓存容量得到最终结果，即当前时刻基站文件缓存概率。实现实时响应时变文件流行度的动态缓存更新。

Claims

1.一种基于DNN的实时响应时变文件流行度的动态缓存更新方法，包括下列步骤：

第一步：动态文件库建模

其中表示k层中的文件的文件缓存概率；

第二步：适应用户请求分布变化的部分缓存更新

整个缓存更新问题分为两个阶段：

第三步：深度学习方法求解动态缓存更新问题