CN113326128A

CN113326128A - 移动边缘计算网络中基于无监督循环联邦学习的隐私保护流行度预测方法

Info

Publication number: CN113326128A
Application number: CN202110594483.2A
Authority: CN
Inventors: 黄永明; 郑冲; 刘升恒
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2021-08-31

Abstract

本发明公开了移动边缘计算网络中基于无监督循环联邦学习的隐私保护流行度预测方法，通过对每个用户的局部动态流行度模型的构建，以及对全局动态流行度模型的推导，将系统中的内容流行度预测问题建模成一个分布式预测问题；通过结合循环神经网络、自编码器以及联邦学习架构，提出了一种无监督循环联邦学习；最后通过迭代训练，获得了隐私保护约束下的流行度预测方案设计；本发明有助于实现边缘无线网络中用户隐私保护约束下的流行度预测，并且相比于传统的流行度预测算法，本发明不仅能够保护用户隐私还能够获得更低的预测误差。

Description

移动边缘计算网络中基于无监督循环联邦学习的隐私保护流行度预测方法

技术领域

本发明涉及流行度预测技术领域，特别是涉及移动边缘计算网络中基于无监督循环联邦学习的隐私保护流行度预测方法。

背景技术

移动边缘计算技术将缓存和计算资源同时部署在网络边缘，是提供物联网，车联网和智慧城市等业务的有效框架，可以缓解数据中心不断增长的流量负担。移动边缘计算网络中边缘节点的密集部署，例如无线电接入点或微基站等，能够允许对用户近端接入并访问移动边缘计算服务器上的丰富计算资源与缓存资源。但是，缓存资源的有效利用还得进一步依赖于一个有效地缓存策略。边缘缓存被认为是一种经济有效的方法，可以解决回程瓶颈问题并减少内容检索和切换延迟。一个边缘缓存策略的性能很大在很大程度上取决于流行数据的选择机制，该选择必须能够从巨大的数据洪流中选择出值得被缓存的内容，这就需要依赖于对用户的主观兴趣或需求进行一个精准的预测，也称之为流行度预测。

近年来，许多研究工作对动态流行度预测进行了研究，并提出了包括时序预测，社交驱动的预测和基于统计信息的预测等多种流行度预测方法。但是这些预测方法往往都非常依赖于用户的隐私数据，因而会对用户的隐私安全保护带来巨大的隐患。事实上，在当今很多行业，特别是在电子医疗和自动驾驶等相关行业，用户私有数据泄漏可能会导致灾难性的后果，如危及用户生命安全以及或者给数据提供商造成严重的财产损失。以此，充分利用移动边缘计算网络的计算优势，在保护用户隐私的进行下进行流行度预测将是真正可用于实际的研究方向。针对以上描述，本发明提出了一种移动边缘计算网络中基于无监督循环联邦学习的隐私保护流行度预测方法。

发明内容

有鉴于此，本发明的目的在于提供一种移动边缘计算网络中基于无监督循环联邦学习的隐私保护流行度预测方法，用以解决背景技术中提及的技术问题，本发明通过对每个用户的局部动态流行度模型的构建，以及对全局动态流行度模型的推导，将系统中的内容流行度预测问题建模成一个分布式预测问题；通过结合循环神经网络、自编码器以及联邦学习架构，提出了一种无监督循环联邦学习，最后通过迭代训练，获得了隐私保护约束下的流行度预测方案设计。

为了达到上述目的，本发明采用如下技术方案：

移动边缘计算网络中基于无监督循环联邦学习的隐私保护流行度预测方法，所述预测方法基于移动边缘计算系统，该系统包括服务器端和多个用户端，所述服务器端和所述用户端之间实现通信连接；所述预测方法包括如下步骤：

步骤S1、构建用户端的文件请求概率模型，通过考虑用户端主观兴趣的变化性来构建每个用户端文件请求的动态流行度模型，根据每个用户端的局部流行度得到服务这些用户端的服务器端的动态全局流行度模型；

步骤S2、利用用户端的历史请求，在保护用户的隐私约束下，构建局部流行度和全局流行度的分布式预测模型；

步骤S3、采用联邦学习框架，训练学习迭代得出在用户隐私保护约束下的各流行度分布式预测方案。

进一步的，考虑一个典型的单接入节点服务I个用户的移动边缘计算系统，其中服务内容库包含N个文件，表示为

任意用户i在时刻t的产生内容请求记为Fⁱ(t)。我们假设

的概率为λ_i(t)，若该时刻用户i不产生内容请求，则表示为

当

时，我们假设此时用户i的内容流行度服从参数为αⁱ(t)的Zipf分布，记为

因此，用户i在时刻t的内容请求概率模型可以表示为：

公式(1)中，

表示为

情况下用户i在时刻t请求内容库中第n个文件F_n的概率。

进一步的，在所述步骤S1中，通过动态变化的αⁱ(t)来表示用户i主观兴趣的变化性，同时考虑到用户兴趣在时间上的前后相关性以及复杂性，我们将αⁱ(t)的动态性建模成一个包含

个状态的无模型马尔科夫链，其中集合

为用户i所有可能的Zipf分布参数集。αⁱ(t)的动态性具体建模为：

公式(2)中，

为αⁱ(t)转移到

的转移概率，且在无模型马尔科夫链链中该状态转移概率是未知的。

进一步的，在所述步骤S1中，所述每个用户端文件请求的动态流行度模型的表达式为：

公式(3)中，

N表示为移动边缘计算系统中的服务内容库包含N个文件，n为内容库中第n个文件F_n的索引号。

进一步的，在所述步骤S1中，所述动态全局流行度模型在时刻t的表达式可以推导得出：

进一步的，在所述步骤S2中，在每个用户端，以长短期记忆神经元作为最小单元，搭建一个结构完全相同的自编码器神经网络。第i个用户端所部署的神经网络的网络参数可表示为

其中

为编码器的网络参数，

为解码器的网络参数。通过将用户端的历史文件请求数据投喂给所述自编码器神经网络，来进行局部流行度预测网络模型的无监督训练，其中编码器的输出向量为用户端的本地流行度预测值；

在服务器端，部署与所述自编码器神经网络中的编码器结构相同的网络作为全局流行度的预测网络模型。

进一步的，在所述步骤S2中，任意一个用户端i在t+1时刻的局部流行度预测值的表达式为：

公式(5)中，Rⁱ(t)＝{Fⁱ(t-H),Fⁱ(t-H+1),…,Fⁱ(t)}为用户端i的一个提取器用于提取连续H个时刻内的历史请求信息，

为用户端i的局部流行度预测网络模型，

为局部流行度预测网络模型的参数；

服务器端在时刻t+1的全局流行度预测值的表达式为：

公式(6)中，

为服务器端所部署的全局流行度预测网络模型，Θ^G为全局流行度预测网络模型的参数，

为服务器在时刻t所收到的内容请求。

进一步的，所述保护用户的隐私约束具体包括：所述服务器端在时刻t结束之前必须删除所收到的用户内容请求信息R^G(t)，用以保障用户端的隐私安全。

进一步的，所述步骤S3具体包括；

步骤S301、每个用户端的历史请求数据表示为

其中

为保存在用户端i的历史请求数据，并且每个用户端的

都只保存在自身的本地设备上，且不允许外界访问；

步骤S302、在用户端，每个用户端部署的神经网络预测模型进行独立训练；

步骤S303、对于用户端i,每次训练，通过提取器Rⁱ(t)从

中随机提取S个用于训练的迷你批

其中t_s是在时刻t的随机采样点，(x^s,x^s)为一个样本点，x^s表示为样本。利用平均MSE作为损失函数来训练各个客户端的局部流行度预测网络，表达式为：

公式(7)中，

为用户端i的自编码器的输出，Θⁱ表示为局部流行度预测网络的模型参数，S为该批次用于训练的样本总数，s为第s个批的索引号。

步骤S304、每个用户端在进行了T次训练之后，就向服务器端上传一次最近的网络模型参数Θⁱ；

步骤S305、在服务器端，服务器端将所有收到的用户端的网络模型参数堆叠成

然后服务器端对用户端的网络模型参数Θⁱ进行参数聚合，表达式为：

公式(8)中，ω_i反映每个用户端的网络模型参数在全局流行度预测网络模型上的重要性,I为用户的总数。

步骤S306、更新全局流行度预测网络的模型参数，表达式为：

公式(9)中，Θ^G表示为全局流行度预测网络的模型参数，I为用户的总数。

步骤S307、一旦步骤S305中的参数聚合操作完成，服务器端将通过边缘节点将新的参数Θ^AE广播给服务区内所有用户端；

步骤S308、用户端在收到参数Θ^AE之后，将局部流行度预测网络的模型参数进行更新Θⁱ＝Θ^AE，然后接着进行新一轮的本地训练，直到训练到最大迭代次数。

本发明的有益效果是：

本发明提供的移动边缘计算网络中一种基于无监督循环联邦学习的隐私保护流行度预测方法，能够在保护用户隐私数据的同时，有效地降低流行度的预测误差。仿真结果表明，相比于其它预测算法，本发明提出的移动边缘计算网络中一种基于无监督循环联邦学习的隐私保护流行度预测方法能提供额外的预测准确度增益。

附图说明

图1为本发明实施例中提出的无监督循环联邦学习算法的网络架构图。

图2为本发明实施例中提出的基于长短期记忆元的自编码器神经网络的架构图。

图3为本发明实施例中各个用户端的局部流行度预测误差结果示意图。

图4为不同算法在移动边缘计算服务器端的全局流行度预测性能的对比示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

参见图1-图4，本实施例提供一种移动边缘计算网络中基于无监督循环联邦学习的隐私保护流行度预测方法，具体步骤如下：

考虑一个典型的单接入节点服务I各用户的移动边缘计算系统，其中服务内容库包含N个文件，表示为

此外，接入节点上配备有移动边缘计算服务器，能够进行一定量的内容缓存，假设能缓存M₀个文件，服务器在时刻t所缓存的文件集合记为

同时任意用户i的本地设备也具有一定的缓存能力，能缓存M_i个文件，用户i的本地设备在时刻t对应的缓存文件为

假设任意用户i在时刻t的产生内容请求

的概率为λ_i(t)，若该时刻用户i不产生内容请求，则表示为

当

时，我们假设此时用户i的内容流行度服从参数为αⁱ(t)的Zipf分布，记为Fⁱ(t)～Zipf(αⁱ(t))。因此，用户i在时刻t的内容请求概率模型可以表示为：

其中，

为

情况下用户i在时刻t请求文件F_n的概率，具体表示为:

用向量

表示在时刻t用户i端的局部流行度。

用动态变化的αⁱ(t)来反映用户i主观兴趣的变化性，同时考虑到用户兴趣在时间上的前后相关性以及复杂性，将αⁱ(t)的动态性建模成一个包含

个状态的无模型马尔科夫链，其中集合

为用户i所有可能的Zipf分布参数集。

因此，αⁱ(t)的动态性可以建模成

其中，

为αⁱ(t)转移到

用向量

表示t时刻移动边缘计算服务器端的文件全局流行度，其中

为服务器的整个服务范围内，文件F_n在时刻t被请求的概率，可以表示为：

因此，时刻t的全局流行度可以表示为：

可以看出，局部流行度的动态性涉及到αⁱ(t)的无模型马尔科夫链转移，在实际中，表现为用户主观兴趣的变化，因此很难先验给出。同样，从全局流行度表达式可以看出，全局流行度取决于整个区域内的所有用户的局部流行度，以及所有用户的请求到达率λ_i(t)。然而，用户的局部流行度和请求到达率都是时变的，很难先验给出。而且这两个属性作为用户的隐私敏感信息，在隐私保护的系统中也是要防止被包括边缘接入节点等在内的外界环境所窥视的。另一方面，准确的局部流行度和全局流行度，对于提升用户的缓存资源利用率和移动边缘计算服务器的缓存资源利用率具有极其重要的。

因此，本实施例考虑隐私保护约束下的局部和全局流行度分布式预测，以帮助提升系统中的缓存资源利用效率。

具体地，任意用户i在t+1时刻的局部流行度预测值可以表示为

其中，Rⁱ(t)＝{Fⁱ(t-H),Fⁱ(t-H+1),…,Fⁱ(t)}作为用户i的一个提取器用于提取连续H个时刻内的历史请求信息，

为用户i的本地预测模型，

为预测模型的参数。

在本实施例中，采用基于自编码器神经网络来构建预测模型从而解决训练过程中训练标签Pⁱ(αⁱ(t+1),t+1)的无法获取的技术瓶颈。因此，用户i的本地设备上部署的本地神经网络模型参数可表示为

其中

为编码器的网络参数，

为解码器的网络参数。相似地，移动边缘计算服务器端在时刻t+1的全局流行度预测值可以表示为：

其中

为服务器端所部署的神经网络预测模型，Θ^G为网络参数，

移动边缘计算服务器在服务区内时刻t所收到的内容请求。同时，考虑到系统的隐私保护约束，本实施例要求移动边缘计算服务器必须在时刻t结束之前必须删除用户的内容请求信息R^G(t)，以保障用户的隐私安全。因此，服务器端的全局流行度预测模型将不存在可供训练的数据集。

具体的说，在本实施例中，所有用户的局部流行度预测问题以及服务器端的全局流行度预测问题是在用户隐私保护约束下进行分布式并行预测的，因此，本实施例提出一种无监督循环联邦学习(Unsupervised recurrent federated learning,URFL)算法来进行解决。

具体地，系统中UFRL算法的网络架构图，如图1所示。其中，在每个用户的本地设备端，分别部署网络结构完全一样的、基于长短期记忆元的自编码器神经网络(Long short-term memory auto encoder,LSTM-A)用于实时预测各自的局部流行度。

在移动边缘计算服务器端，则只部署与LSTM-AE中编码器相同结构的神经网络作为全局流行度实时预测网络。

具体的说，循环神经网络(Recurrent neural network,RNN)能够对复杂的时间任务执行分层处理，因此，它能够自然地捕捉时间序列中的底层时间依赖关系。而长短期记忆元(Long short-term memory,LSTM)作为循环神经网络中的一个重要基本单元，被用于本实施例中的自编码器框架下，能够挖掘出长历史请求序列Rⁱ(t)和R^G(t)中所存在的短期时序依赖关系。

更具体的说，LSTM-AE网络地详细架构，如图2所示。其中x^t,h^t,C^t分别为LSTM单元在时刻t的输入、输出和记忆状态，σ为控制门，通常采用Sigmoid函数实现，f,i,o分别表示表示遗忘门的输出，输入门的输出和输出门的输出。

更具体的说，本实施例中采用的基于联邦学习的分布式训练具体步骤为：

每个用户的历史请求数据表示为

其中

为保存在用户i的历史请求数据。由于隐私保护约束，每个用户的

都只保存在自身的本地设备上，且不允许外界访问。在URFL的线下训练阶段，每个用户上的LSTM-AE模型都是独立训练。

对于用户i,通过提取器Rⁱ(t)从

中随机提取S个用于训练的一个批

其中t_s是在时刻t的随机采样点。(x^s,x^s)为一个样本点，x^s表示为样本。利用平均MSE作为损失函数来本地训练LSTM-AE，表示为：

公式中，

为用户端i的自编码器的输出，Θⁱ表示为局部流行度预测网络的模型参数，S为该批次用于训练的样本总数。每个用户在T次本地之后，就上传一次最近的网络模型参数Θⁱ。

在移动边缘计算服务器端，服务器将所有收到的用户本地模型参数堆叠成

然后服务器端对本地模型参数进行参数聚合，表示为：

其中ω_i反映每个用户的本地参数在全局模型上的重要性。在本实施例中不考虑用户的优先级问题，因此设置

更新全局模型参数，表达式为：

一旦参数聚合操作完成，移动边缘计算服务器将会通过边缘节点将新的参数Θ^AE广播给服务区内所有用户。

本地用户在收到参数Θ^AE之后，会将本地的LSTM-AE模型参数进行更新Θⁱ＝Θ^AE,然后接着进行新一轮的本地训练。

算法总结如下表

综上，针对本实施例中考虑隐私保护约束的移动边缘计算通信系统，本实施例限制所有用户的历史请求数据均不可被外界访问。同时移动边缘计算服务器每次所接收到的用户请求信息，也必须被及时删除，不允许保留超过一个时隙。基于此，本实施例在考虑用户隐私保护限制条件下，解决了局部与全局内容流行度的分布式预测问题。本实施例通过结合循环神经网络在时序相关信息挖掘上的优势，自编码器在无监督学习上的去标签训练优势以及联邦学习架构在隐私保护上的优势，提出了一种在无监督循环联邦学习算法。最后通过分布式的迭代训练得到隐私保护下的流行度预测方法。

仿真示例

本发明实施例中，对于一种移动边缘计算网络中基于无监督循环联邦学习的隐私保护流行度预测方法，本实施例采用python进行仿真。仿真中，内容文件总数N＝24，用户的请求信息提取器窗口长度H＝10，所有学习算法训练时的学习率统一设置为10^-4。本地训练的迭代次数设置为T＝32。

图3描述了本发明所提出的一种移动边缘计算网络中基于无监督循环联邦学习的隐私保护流行度预测方法在用户端地实验结果。从图3左侧可以发现所提出的流行度预测方法下，每个用户预测自己局部流行度时，预测误差都能够稳定收敛与一个满意的水平。同时，我们从图3左侧可以观察到，在所提方法下，不同用户在各自局部流行度预测误差上存在一定的差异。这是因为在本实施例提出的系统中，每个用户的兴趣都是非独立同分布的，体现在每个用户的流行度模型参数

和Pⁱ都是随机生成的。因此，对于那些兴趣爱好变化更为复杂的用户来说，所提方法的预测性能会有降低。

但是，通过图3右侧的仿真结果可以发现，所提流行度预测方法在任意用户(图中以用户7为例)上的预测性能，依旧始终是优于用户的自我训练(Self-train)方案。这表明，本实施例所提方法在进行用户端的流行度预测时，能够保护用户隐私的同时，提高局部流行度的预测准确率。

图4仿真对比了不同算法在在移动边缘计算服务器端的全局流行度预测性能。从图4可以发现，所提出的基于无监督循环联邦学习流行度预测方法在实现隐私保护的同时，其预测准确率还优于其它所有的基线流行度预测算法。这是因为，所提流行度预测方法的参数聚合过程推动了移动边缘计算服务器深入而准确地学习其覆盖范围内所有用户的底层特征。相比之下，基线方法不仅需要大量的用户私有数据，而且还无法从大量的、混合所有用户在时间和空间上的历史请求数据中精确地提取有用特征。

综上，本实施例分别从用户本地的局部流行度预测和移动边缘服务器端的全局流行度预测两个角度进行仿真验证。同时，本实施例仿真对比了所提算法同奇异值分解(SVD,singular value decomposition)算法、单层全连接自编码器联邦学习(SDAEFL,singledense auto-encoder federated learning)算法、深度全连接自编码器联邦学习(DDAEFL,deep dense auto-encoder federated learning)算法和深度循环自编码器学习(DRAEL,deep recurrent auto-encoder learning)算法之间性能差异。其中，SVD和DRAEL集中式地部署在移动边缘计算服务器上，没有任何隐私保护约束。对于SDAEFL和DDAEFL,都采用联邦学习架构进行数据隐私保护，但是这两个基线分别采用单层全连接的自编码器神经网络结构和深度全连接的自编码器神经网络结构来证明所提出的URFL中LSTM单元所带来的性能增益。

本发明未详述之处，均为本领域技术人员的公知技术。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。