CN117272370B

CN117272370B - 下一个兴趣点隐私保护推荐方法、系统、电子设备及介质

Info

Publication number: CN117272370B
Application number: CN202311189893.4A
Authority: CN
Inventors: 王伟; 吕红梅; 祝咏升; 郝玉蓉; 刘鹏睿; 胡福强; 陈政; 李超; 段莉
Original assignee: Beijing Jiaotong University
Current assignee: Beijing Jiaotong University
Priority date: 2023-09-14
Filing date: 2023-09-14
Publication date: 2024-03-22
Anticipated expiration: 2043-09-14
Also published as: CN117272370A

Abstract

本说明书实施例提供了一种基于用户轨迹序列的下一个兴趣点隐私保护推荐方法及系统，其中，方法包括：捕捉用户签到行为中复杂的序列转移模式和动态偏好，根据所述序列转移模式和动态偏好，基于序列模型建立融合用户长短期偏好特征的轨迹预测模型；将所述轨迹预测模型设置为联邦推荐训练形式，在轨迹数据不出当前地区范围的前提下，通过协调多个用户设备共同优化所述轨迹预测模型，并在优化过程中通过差分隐私机制对模型参数进行加噪保护。

Description

下一个兴趣点隐私保护推荐方法、系统、电子设备及介质

技术领域

本文件涉及计算机技术领域，尤其涉及一种基于用户轨迹序列的下一个兴趣点隐私保护推荐方法、系统、电子设备及存储介质。

背景技术

兴趣点(Point of Interest，POI)推荐利用用户在社交平台上产生的签到数据和其他多模态信息为其推荐感兴趣的地点，旨在缓解位置信息过载问题。在实际场景中，签到数据所包含的信息不仅局限于一般的用户与兴趣点交互，还隐含着复杂的时空转移特征，这些特征能够反映用户日常生活中的移动模式和规律。下一个兴趣点推荐的目标在于挖掘用户轨迹序列中时空序列特性，进而根据当前时空信息为用户推荐下一个可能访问的兴趣点。因此，下一个兴趣点推荐不仅关注用户的一般偏好，还着重分析行为轨迹中的规律性变化，以捕捉用户的序列转移模式。

由于轨迹数据具有序列性，故在对签到行为序列进行建模时需要采用适合处理序列特征的方法。基于循环神经网络的模型由于其处理顺序数据的能力较强，已成为该任务的主要解决方案。当前最先进的下一个兴趣点推荐算法需要收集大量的用户行为轨迹数据和上下文信息以训练高质量推荐模型。然而，现有针对该项技术的研究仍然面临着严峻挑战。首先，用于建模的用户签到数据高度稀疏，且用户兴趣偏好呈现出的复杂性和动态性，使得对用户偏好特征的有效建模极为困难；其次，位置数据属于高度敏感信息，而当前仅关注于推荐性能提升的大多数研究往往忽略了用户的隐私保护需求。

现有的隐私保护下一个兴趣的推荐方法是基于联邦学习的隐私保护移动预测框架PMF。该框架遵循标准的联邦设置，采用RNN模型作为移动预测模型，并且采用联邦学习框架进行训练。同时，设计了一种组优化方法保护用户隐私。现有技术中的基本方法是：

第一步：构建移动预测模型。采用LSTM模型进行序列建模，以对下一个兴趣点进行预测。

第二步：隐私保护组优化机制。对模型中的子模块根据隐私泄露风险等级进行分组，并使用不同的数据进行训练。具体地，有隐私泄露风险的模块组使用加噪的数据进行训练，无隐私问题的模块组使用正常数据进行训练。

第三步：全局优化。移动设备在本地训练模型后，上传训练好的局部模型权值，中心化服务器需要对其进行聚合，得到最优的全局模型。

上述方法存在的缺点是：基于LSTM模型的移动预测模型只能对用户的短期行为进行建模，而无法捕捉到复杂的移动规律和长期偏好，使得预测性能低。此外，其采用直接对原始数据加噪的方式进行进一步的隐私保护，加剧了推荐准确率的下降，并且其分组训练的方式仅对嵌入模块进行加噪训练，而默认LSTM模块不会泄露隐私，这是不成立的。

发明内容

本发明的目的在于提供一种基于用户轨迹序列的下一个兴趣点隐私保护推荐方法、系统、电子设备及存储介质，旨在解决现有技术中的上述问题。

本发明提供一种基于用户轨迹序列的下一个兴趣点隐私保护推荐方法，包括：

捕捉用户签到行为中复杂的序列转移模式和动态偏好，根据所述序列转移模式和动态偏好，基于序列模型建立融合用户长短期偏好特征的轨迹预测模型；

将所述轨迹预测模型设置为联邦推荐训练形式，在轨迹数据不出当前地区范围的前提下，通过协调多个用户设备共同优化所述轨迹预测模型，并在优化过程中通过差分隐私机制对模型参数进行加噪保护，具体包括：

步骤1，通过推荐服务器初始化轨迹预测模型，并协调各个用户设备参与模型训练和优化，开启联邦训练过程；

步骤2，在每轮全局训练过程中，通过推荐服务器随机选择该轮参与训练的用户设备，并将模型参数下发到各个参与用户设备；

步骤3，通过各个参与用户设备下载模型参数，构建本地模型，并基于本地轨迹序列数据进行更新和优化，在更新和优化过程中，对模型参数进行加噪；

步骤4，通过各个参与用户设备将加噪后的模型参数上传至推荐服务器；

步骤5，通过推荐服务器聚合各个客户端上传的模型参数，更新轨迹预测模型；

步骤6，重复所述步骤1-5，直到轨迹预测模型收敛或达到训练次数。

本发明提供一种基于用户轨迹序列的下一个兴趣点隐私保护推荐系统，包括：

建立模块，用于捕捉用户签到行为中复杂的序列转移模式和动态偏好，根据所述序列转移模式和动态偏好，基于序列模型建立融合用户长短期偏好特征的轨迹预测模型；

优化模块，用于将所述轨迹预测模型设置为联邦推荐训练形式，在轨迹数据不出当前地区范围的前提下，通过协调多个用户设备共同优化所述轨迹预测模型，并在优化过程中通过差分隐私机制对模型参数进行加噪保护，所述优化模块具体包括：

推荐服务器，用于初始化轨迹预测模型，并协调各个用户设备参与模型训练和优化，开启联邦训练过程；在每轮全局训练过程中，通过推荐服务器随机选择该轮参与训练的用户设备，并将模型参数下发到各个参与用户设备；

用户设备，用于下载模型参数，构建本地模型，并基于本地轨迹序列数据进行更新和优化，在更新和优化过程中，对模型参数进行加噪，将加噪后的模型参数上传至推荐服务器；

所述推荐服务器进一步用于：聚合各个客户端上传的模型参数，更新轨迹预测模型，直到轨迹预测模型收敛或达到训练次数。

本发明实施例还提供一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现上述基于用户轨迹序列的下一个兴趣点隐私保护推荐方法的步骤。

本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有信息传递的实现程序，所述程序被处理器执行时实现上述基于用户轨迹序列的下一个兴趣点隐私保护推荐方法的步骤。

采用本发明实施例，基于用户轨迹序列的下一个兴趣点隐私保护推荐方法，充分利用轨迹数据中丰富的上下文信息，在保护用户隐私的前提下兼顾模型的推荐性能，更好地实现了性能与隐私的平衡。既能充分挖掘用户轨迹序列中隐含的复杂关联关系，又能充分保护用户轨迹数据隐私的下一个兴趣点推荐。

附图说明

为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的基于用户轨迹序列的下一个兴趣点隐私保护推荐方法的流程图；

图2是本发明实施例的基于用户轨迹序列的下一个兴趣点隐私保护推荐方法的整体框架设计的示意图；

图3是本发明实施例的用户轨迹预测模型设计的示意图；

图4是本发明实施例的基于用户轨迹序列的下一个兴趣点隐私保护推荐系统的示意图；

图5是本发明实施例的电子设备的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案，下面将结合本说明书一个或多个实施例中的附图，对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书的一部分实施例，而不是全部的实施例。基于本说明书一个或多个实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本文件的保护范围。

方法实施例

根据本发明实施例，提供了一种基于用户轨迹序列的下一个兴趣点隐私保护推荐方法，在对本发明实施例的技术方案进行详细说明之前，对涉及到的概念进行解释说明。

在本发明实施例中，为了保证下一个兴趣点推荐任务中隐私性和效用性，使用序列模型设计融合长短期偏好的轨迹预测机制，以有效捕捉用户签到行为中复杂的序列转移模式和动态偏好，同时，考虑到轨迹序列数据的敏感性，将上述模型拓展到联邦学习框架下，并采用差分隐私机制对中间模型参数进行加噪保护，以防止恶意服务器的推理攻击，进一步实现隐私保护与模型性能的平衡。

定义1：下一个兴趣点推荐。本发明实施例中，定义下一个兴趣点推荐系统中包含m个基于位置的社交网络平台用户集合U＝{u₁,u₂,...,u_m}以及n个兴趣点集合L＝{l₁,l₂,...,l_n}。假设r_k＝<u_i,l_j,t_k>是用户的一条签到记录，表示用户u_i在时间t_k时访问了兴趣点l_j，则代表用户u_i的历史轨迹序列，则下一个兴趣点推荐的目标是基于轨迹序列/>为用户预测k个最有可能被该用户在下一个时间t访问的兴趣点列表/>

定义2：联邦学习。本发明实施例中，定义联邦学习范式下有m个客户端，分别标号为1,…,m，与m个用户相对应。Θ_i表示当前训练轮次客户端i对全局模型训练后的本地模型参数。联邦学习过程包括以下几个步骤：(1)全局模型的初始化(2)客户端本地模型的训练(3)中心参数服务器聚合所有客户端的本地模型参数来生成和分发新一轮的全局联邦学习模型。

定义3：差分隐私。差分隐私提供了一种可量化的方式来衡量隐私保护的程度，即通过引入“扰动”来改变个体数据，使得攻击者无法推断出某个个体的隐私信息。给定ε≥0，对于所有相邻数据集及所有事件/>若Pr[M(X)∈Y]≤e^ε·Pr[M(X′)∈Y]，则称随机算法/>满足ε-差分隐私。

定义4：高斯机制。给定任意查询全局敏感度为GS(q)，那么对于任意的δ∈(0,1)，给定服从高斯分布的随机噪声ω～Gauss(0,σ²)，则随机算法M_G＝q(X)+ω满足(ε,δ)-差分隐私，其中/>

在下一个兴趣点推荐场景中，用户行为模式的复杂性和动态性使得从轨迹序列中准确发掘潜在的时空依赖关系和兴趣偏好特征变得极为困难，并且，用户行为轨迹中包含着极为敏感的隐私信息，这导致传统集中式收集数据以构建预测模型的方式面临着用户隐私信息泄露的风险。

针对上述问题，本发明实施例首先基于序列模型设计融合长短期偏好的轨迹预测机制，以有效捕捉用户签到行为中复杂的序列转移模式和动态偏好。然后，将上述模型拓展到联邦学习范式中，实现在轨迹数据不出本地的前提下协同建模，从而避免集中式存储带来的隐私泄露问题。最后，采用差分隐私机制对模型参数进行加噪保护，防止恶意服务器的推理攻击。

图1是本发明实施例的基于用户轨迹序列的下一个兴趣点隐私保护推荐方法的流程图，如图1所示，根据本发明实施例的基于用户轨迹序列的下一个兴趣点隐私保护推荐方法具体包括：

步骤S101，捕捉用户签到行为中复杂的序列转移模式和动态偏好，根据所述序列转移模式和动态偏好，基于序列模型建立融合用户长短期偏好特征的轨迹预测模型；其中，基于序列模型建立融合用户长短期偏好特征的轨迹预测模型具体包括：

根据所述序列转移模式和动态偏好，基于GRU模型和注意力模型融合用户长短期偏好特征同时进行建模，得到轨迹预测模型。具体包括：

对于用户轨迹序列S_u，按照访问时间顺序将其划分成多条历史轨迹序列S_h＝{S₁,S₂,…,S_n-1}和当前轨迹序列S_n＝{(u,l₁,t₁),…,(u,l_k,t_k)}；将用户轨迹序列中位置和时间信息转换为低维密集的嵌入表示，设置兴趣点l和时间t的嵌入表示分别为和其中d表示为兴趣点嵌入空间的维数，将时间嵌入的维数设置为48，在训练过程中与整个模型一起优化；

使用GRU模型提取当前轨迹序列S_n的序列特征，即将兴趣点嵌入表示e^l和时间嵌入表示e^t进行拼接得到时空嵌入表示s_t＝[e^l；e^t]，将其输入到GRU模型中，逐级输出隐藏状态，这些隐藏状态为当前移动状态h_t，更新公式1至公式4：

h_t＝(1-f_t)·c_t+f_t·h_t-1公式4；

其中，s_t表示时间t时的输入，h_t-1表示GRU单元的上一个隐藏状态输出，包含了之前节点的相关信息，f_t为控制更新的门控，即更新门；r_t为控制重置的门控，即重置门，σ表示激活函数sigmoid；c_t表示候选状态；h_t是输出结果即当前移动状态，矩阵W表示不同门的参数，向量b是不同部分的偏置向量，是更新门中输入部分的权值参数，/>表示更新门中隐藏状态部分的权值参数，b_f表示更新门的偏置向量，/>表示重置门中输入部分的权值参数，/>表示重置门中隐藏状态部分的权值参数，b_r表示重置门的偏置向量，/>表示候选状态中输入部分的权值参数，/>表示候选状态中隐藏状态部分的权值参数，b_c表示候选状态的偏置向量；

采用注意力机制计算当前轨迹与历史轨迹之间的相似性，捕捉用户的长期的多层次周期性特征，即根据公式5-7选择与当前移动状态h_t最相关的上下文向量c_t来进行兴趣点推荐：

c_t＝∑α_is_i公式5；

α_i＝σ(f(h_t,s_i))公式6；

f(h_t,s_i)＝tanh(h_tW_s)公式7；

其中，s_i是历史轨迹特征，W_s为权重更新矩阵，h_t是当前移动状态，f表示评分函数，c_t为上下文向量，表示与当前移动状态相关的周期性特征，α_i表示当前移动状态与历史轨迹特征的归一化评分概率；

结合当前移动状态及其上下文向量完成预测：通过融合用户长短期偏好特征x_k＝[c_t；h_t]，对当前轨迹的下一个兴趣点做出推荐，即：其中，矩阵W表示不同门的参数，向量b是不同部分的偏置向量。

步骤S102，将所述轨迹预测模型设置为联邦推荐训练形式，在轨迹数据不出当前地区范围的前提下，通过协调多个用户设备共同优化所述轨迹预测模型，并在优化过程中通过差分隐私机制对模型参数进行加噪保护。具体包括：

步骤1，通过推荐服务器初始化轨迹预测模型，并协调各个用户设备参与模型训练和优化，开启联邦训练过程；具体包括：

根据联邦推荐机制，通过推荐服务器维护下一个兴趣点推荐任务的轨迹预测模型Θ_S，并在训练开始时初始化轨迹预测模型的参数开始联邦训练流程，协调各个用户设备参与轨迹预测模型的训练和优化。

步骤2，在每轮全局训练过程中，通过推荐服务器随机选择该轮参与训练的用户设备，并将模型参数下发到各个参与用户设备；具体包括：

在每轮全局训练过程中，通过推荐服务器随机选择该轮参与训练的用户设备，并将当前的模型参数下发到各个参与用户设备，即在第t轮训练时，推荐服务器选择用户设备集合U_t参与模型协同训练，并下发当前的模型参数Θ^(t)。

步骤3，通过各个参与用户设备下载模型参数，构建本地模型，并基于本地轨迹序列数据进行更新和优化，在更新和优化过程中，对模型参数进行加噪；具体包括：

通过各个参与用户设备维护本地模型Θ_u，并从推荐服务器获取最新的模型参数对于被选中的用户设备u，在本地使用用户轨迹序列S_u＝{S₁,S₂,...,S_n}对/>进行E轮的本地优化，并在模型更新过程中，使用高斯机制对模型参数进行加噪保护。具体包括：

按照时间窗口对用户轨迹序列进行划分，得到子序列对于其中的第i个子轨迹，将其前k个兴趣点作为输入，预测第k+1个要访问的兴趣点y_k+1；

初始化本地训练轮次e＝0，其对应的本地模型为进入本地模型更新过程，通过各个用户设备在本地更新过程中对中间梯度添加高斯噪声，具体地：对于第e轮本地训练：采用子采样的方式随机选择训练样本，即每轮的训练集由整个训练集的一个随机子集构成，所述随机子集由概率为q＝G/n的不放回采样选取，其中G为子集的大小，n表示所选用户的样本总数，得到训练样本子集G_e；在进行梯度计算时，对于客户端每一个样本即历史轨迹特征s_i，对其梯度进行裁剪，将其限制在固定的范围[-C,C]，以将单个样本对差分隐私保证的影响限定在预定义的截断阈值C内，将裁剪后的梯度更新为：对裁剪后的梯度添加高斯噪声ω～Gauss(0,σ²C²I)，得到满足差分隐私的梯度数据，即有/>使用该梯度数据更新本地模型，即其中，/>表示第e轮梯度更新值，ω表示所添加的高斯噪声，σ表示噪声标准差，I表示单位向量，保证高斯噪声为向量形式，η表示学习率；

通过本地E轮训练，通过各个用户设备完成添加差分隐私的本地训练流程，得到当前本地模型参数

步骤4，通过各个参与用户设备将加噪后的模型参数上传至推荐服务器；具体包括：

通过各个参与用户设备将加噪训练后的模型参数上传到推荐服务器进行模型聚合。

步骤5，通过推荐服务器聚合各个客户端上传的模型参数，更新轨迹预测模型；具体包括：

通过推荐服务器聚合各个用户设备的模型参数，进行轨迹预测模型更新，即其中，U_t表示每轮选择的用户子集，n_i表示用户i的本地样本数，n表示所选用户的样本总数，/>表示第t+1轮轨迹预测模型更新。

步骤6，重复上述步骤1-5，直到轨迹预测模型收敛或达到训练次数。

综上所述，本发明实施例提出了一种基于用户轨迹序列的下一个兴趣点隐私保护推荐方法，能够很好地捕捉用户的序列转移模式和移动规律，同时能够满足用户的隐私保护需求。传统方法需要集中式收集大量的用户轨迹数据及其他信息，加剧了用户隐私泄露的风险，并且现有的隐私保护方法(如加密、匿名性等)存在着效率低，适用性差等问题。本发明实施例所使用的方法是基于序列模型设计融合长短期偏好的轨迹预测机制，并通过将其拓展到联邦学习范式中，实现根源上杜绝用户原始数据转移的可能性。然后采用差分隐私机制对中间参数进行加噪保护，进一步增强推荐方法的隐私保护能力。

以下结合附图，对本发明实施例的技术方案进行详细说明

本发明实施例设计的整体框架如图2所示，具体包括：基于序列模型建立融合长短期偏好的轨迹预测机制；将轨迹预测模型设计为联邦推荐训练形式，通过协调多个用户设备共同优化模型；设计差分隐私机制对客户端中间模型参数进行加噪保护。

具体包括如下处理步骤：

步骤1：融合用户长短期偏好特征，设计全局的轮轨迹预测模型。

步骤2：推荐服务器初始化全局模型即轮轨迹预测模型，并协调各个客户端参与模型训练和优化，开启联邦训练过程。

步骤3：在每轮全局训练过程中，推荐服务器随机选择该轮参与训练的客户端，并将当前全局模型参数即上述模型参数下发到各个参与客户端。

步骤4：各个参与客户端下载全局模型参数，构建本地模型，并基于本地轨迹序列数据进行更新和优化。在训练过程中，对中间模型参数进行加噪，以实现差分隐私保护。

步骤5：各个参与客户端将加噪后的模型参数上传至推荐服务器。

步骤6：推荐服务器聚合各个客户端上传的模型参数，更新全局模型。

重复上述步骤3-6，直到轮轨迹预测模型收敛或达到训练次数。

对于步骤1：为了有效学习用户移动模式和动态兴趣偏好，设计了融合长短期偏好的轨迹预测机制。如图3所示，该机制基于GRU模型和注意力模型对用户的长短期偏好同时进行建模，以实现充分捕捉用户的行为模式和移动规律。

具体过程如下：对于用户轨迹序列S_u，按照访问时间顺序将其划分成多条历史轨迹序列S_h＝{S₁,S₂,…,S_n-1}和当前轨迹序列S_n＝{(u,l₁,t₁),…,(u,l_k,t_k)}；将用户轨迹序列中位置和时间信息转换为低维密集的嵌入表示，设置兴趣点l和时间t的嵌入表示分别为和/>其中d表示为兴趣点嵌入空间的维数，将时间嵌入的维数设置为48，在训练过程中与整个模型一起优化；然后使用GRU模型提取当前轨迹S_n的序列特征，即将兴趣点嵌入表示e^l和时间嵌入表示e^t进行拼接得到时空嵌入表示s_t＝[e^l；e^t]，将其输入到GRU模型中，逐级输出隐藏状态，这些隐藏状态被称为当前移动状态h_t，更新公式如下：

h_t＝(1-f_t)·c_t+f_t·h_t-1

同时，采用注意力机制计算当前轨迹与历史轨迹之间的相似性，以捕捉用户的长期的多层次周期性特征。如果一条历史轨迹与当前轨迹的转换模式更相似，那么它将被赋予更大的注意力权重，即选择与当前移动状态h_t最相关的上下文向量c_t来进行兴趣点推荐，计算公式如下所示。

c_t＝∑α_is_i

α_i＝σ(f(h_t,s_i))

f(h_t,s_i)＝tanh(h_tW_s)

其中，s_i是历史轨迹特征，W为权重参数，h_t是查询向量，即当前移动状态，f表示评分函数，c_t为上下文输出，表示与当前移动状态相关的周期性特征。

最后，结合当前移动状态及其上下文向量完成预测。通过融合长短期偏好特征x_k＝[c_t；h_t]，对当前轨迹的下一个兴趣点做出推荐。即：

对于步骤2：联邦推荐机制中，推荐服务器维护下一个兴趣点推荐任务的轨迹预测模型Θ_S，并在训练开始时初始化上述全局模型参数之后，开始联邦训练流程，协调各个客户端参与模型的训练和优化。

对于步骤3：在每轮全局训练过程中，推荐服务器随机选择该轮参与训练的客户端，并将当前全局模型参数下发到各个参与客户端。即在第t轮训练时，服务器选择客户端集合U_t参与模型协同训练，并下发当前全局模型参数Θ^(t)。

对于步骤4：各个参与客户端维护本地模型Θ_u，并从推荐服务器获取最新模型参数对于被选中的客户端u，其会在本地使用轨迹序列S_u＝{S₁,S₂,...,S_n}对/>进行E轮的本地优化，并在模型更新过程中，使用高斯机制进行加噪保护，以最大限度地减少敏感信息泄露。具体过程如下：

首先，按照时间窗口对轨迹序列进行划分，得到子序列对于其中的第i个子轨迹，将其前k个兴趣点作为输入，预测第k+1个要访问的兴趣点y_k+1。

接着，初始化本地训练轮次e＝0，其对应本地模型为进入本地模型更新过程。为了防止不可信服务器对中间模型参数的推理攻击，每个客户端在本地更新过程中对中间梯度添加高斯噪声，以保护客户端的数据隐私。具体地，对于第e轮本地训练：(1)采用子采样的方式随机选择训练样本，即每轮的训练集由整个训练集的一个随机子集构成，该子集由概率为q＝G/n的不放回采样选取，其中G为子集的大小，得到训练样本子集G_e。

(2)在进行梯度计算时，对于客户端每一个样本s_i，对其梯度进行裁剪，将其限制在固定的范围[-C,C]，以将单个样本对差分隐私保证的影响限定在预定义的截断阈值C内。此时，裁剪后的梯度更新为：

(3)对裁剪后的梯度添加高斯噪声ω～Gauss(0,σ²C²I)，以得到满足差分隐私的梯度数据。即有使用该梯度数据更新本地模型，即/>

最后，通过本地E轮训练，各个客户端完成了添加差分隐私的本地训练流程，得到当前本地模型参数

对于步骤5：各个客户端将加噪训练后的模型参数上传到推荐服务器进行模型聚合。

对于步骤6：推荐服务器聚合各个客户端模型参数，从而进行全局模型更新，即这里由于各个客户端的模型参数均满足客户端更新参数满足(ò,δ)-差分隐私，因此，各个客户端模型更新没有泄露用户信息，从而有效防止了推荐服务器的推理攻击。

重复上述步骤3-6，直到模型收敛。

现有的隐私保护下一个兴趣点推荐方法主要通过用数据泛化、差分隐私和数据加密等方式对用户隐私数据进行保护。这些方法通过对用户原始数据进行处理，隐藏其敏感属性，然后将其上传到服务器进行训练，以确保服务器无法获得敏感信息。这些方法会大大降低推荐效率和准确性。

本发明能够实现的有益效果：

(1)支持长期和短期偏好建模，充分捕捉用户移动规律和转换模式，提升了模型性能

(2)支持用户轨迹数据不出本地的情况下模型协同优化，实现从源头上保证用户数据隐私。

(3)有效实现对联邦推荐机制中隐私推理攻击的防御。

系统实施例

根据本发明的实施例，提供了一种基于用户轨迹序列的下一个兴趣点隐私保护推荐系统，图4是本发明实施例的基于用户轨迹序列的下一个兴趣点隐私保护推荐系统的示意图，如图4所示，根据本发明实施例的基于用户轨迹序列的下一个兴趣点隐私保护推荐系统具体包括：

建立模块40，用于捕捉用户签到行为中复杂的序列转移模式和动态偏好，根据所述序列转移模式和动态偏好，基于序列模型建立融合用户长短期偏好特征的轨迹预测模型；具体用于：

根据所述序列转移模式和动态偏好，基于GRU模型和注意力模型融合用户长短期偏好特征同时进行建模，得到轨迹预测模型。具体地，

h_t＝(1-f_t)·c_t+f_t·h_t-1公式4；

c_t＝∑α_is_i公式5；

α_i＝σ(f(h_t,s_i))公式6；

f(h_t,s_i)＝tanh(h_tW_s)公式7；

优化模块42，用于将所述轨迹预测模型设置为联邦推荐训练形式，在轨迹数据不出当前地区范围的前提下，通过协调多个用户设备共同优化所述轨迹预测模型，并在优化过程中通过差分隐私机制对模型参数进行加噪保护。具体包括：

推荐服务器，用于初始化轨迹预测模型，并协调各个用户设备参与模型训练和优化，开启联邦训练过程；在每轮全局训练过程中，通过推荐服务器随机选择该轮参与训练的用户设备，并将模型参数下发到各个参与用户设备；所述推荐服务器具体用于：

用户设备，用于下载模型参数，构建本地模型，并基于本地轨迹序列数据进行更新和优化，在更新和优化过程中，对模型参数进行加噪，将加噪后的模型参数上传至推荐服务器；所述用户设备具体用于：

通过各个参与用户设备维护本地模型Θ_u，并从推荐服务器获取最新的模型参数对于被选中的用户设备u，在本地使用用户轨迹序列S_u＝{S₁,S₂,...,S_n}对/>进行E轮的本地优化，并在模型更新过程中，使用高斯机制对模型参数进行加噪保护。具体地，

所述用户设备具体用于：

所述推荐服务器具体用于：

通过推荐服务器聚合各个用户设备的模型参数，从而进行轨迹预测模型更新，即其中，U_t表示每轮选择的用户子集，，n_i表示用户i的本地样本数，n表示所选用户的样本总数，/>表示第t+1轮轨迹预测模型更新。

本发明实施例是与上述方法实施例对应的系统实施例，各个模块的具体操作可以参照方法实施例的描述进行理解，在此不再赘述。

装置实施例一

本发明实施例提供一种电子设备，如图5所示，包括：存储器50、处理器52及存储在所述存储器50上并可在所述处理52上运行的计算机程序，所述计算机程序被所述处理器52执行时实现如方法实施例中所述的步骤。

装置实施例二

本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有信息传输的实现程序，所述程序被处理器52执行时实现如方法实施例中所述的步骤。

本实施例所述计算机可读存储介质包括但不限于为：ROM、RAM、磁盘或光盘等。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于用户轨迹序列的下一个兴趣点隐私保护推荐方法，其特征在于，包括：

捕捉用户签到行为中序列转移模式和动态偏好，根据所述序列转移模式和动态偏好，基于序列模型建立融合用户长短期偏好特征的轨迹预测模型；

步骤6，重复所述步骤1-5，直到轨迹预测模型收敛或达到训练次数；

其中，所述根据所述序列转移模式和动态偏好，基于序列模型建立融合用户长短期偏好特征的轨迹预测模型具体包括：

根据所述序列转移模式和动态偏好，基于GRU模型和注意力模型融合用户长短期偏好特征同时进行建模，得到轨迹预测模型，具体包括：

对于用户轨迹序列，按照访问时间顺序将其划分成多条历史轨迹序列和当前轨迹序列/>，其中，u表示用户设备；将用户轨迹序列中位置和时间信息转换为低维密集的嵌入表示，设置兴趣点/>和时间/>的嵌入表示分别为/>和/>，其中/>表示为兴趣点嵌入空间的维数，将时间嵌入的维数设置为48，在训练过程中与整个模型一起优化；

使用GRU模型提取当前轨迹序列的序列特征，即将兴趣点嵌入表示/>和时间嵌入表示/>进行拼接得到时空嵌入表示/>，将其输入到GRU模型中，逐级输出隐藏状态，这些隐藏状态为当前移动状态/>；

采用注意力机制计算当前轨迹与历史轨迹之间的相似性，捕捉用户的长期的多层次周期性特征，即根据公式5-7选择与当前移动状态最相关的上下文向量/>来进行兴趣点推荐：

公式5；

公式6；

公式7；

其中，是历史轨迹特征，/>为权重更新矩阵，/>是当前移动状态，/>表示评分函数，/>为上下文向量，表示与当前移动状态相关的周期性特征，/>表示当前移动状态与历史轨迹特征的归一化评分概率；

结合当前移动状态及其上下文向量完成预测：通过融合用户长短期偏好特征，对当前轨迹的下一个兴趣点做出推荐，即：/>，其中，矩阵/>表示不同门的参数，向量/>是不同部分的偏置向量。

2.根据权利要求1所述的方法，其特征在于，所述通过推荐服务器初始化轨迹预测模型，并协调各个用户设备参与模型训练和优化，开启联邦训练过程具体包括：

根据联邦推荐机制，通过推荐服务器维护下一个兴趣点推荐任务的轨迹预测模型，并在训练开始时初始化轨迹预测模型的参数/>，开始联邦训练流程，协调各个用户设备参与轨迹预测模型的训练和优化。

3.根据权利要求2所述的方法，其特征在于，在每轮全局训练过程中，通过推荐服务器随机选择该轮参与训练的用户设备，并将模型参数下发到各个参与用户设备具体包括：

在每轮全局训练过程中，通过推荐服务器随机选择该轮参与训练的用户设备，并将当前的模型参数下发到各个参与用户设备，即在第t轮训练时，推荐服务器选择用户设备集合参与模型协同训练，并下发当前的模型参数/>。

4.根据权利要求3所述的方法，其特征在于，所述通过各个参与用户设备下载模型参数，构建本地模型，并基于本地轨迹序列数据进行更新和优化，在更新和优化过程中，对模型参数进行加噪具体包括：

通过各个参与用户设备维护本地模型，并从推荐服务器获取最新的模型参数/>，对于被选中的用户设备/>，在本地使用用户轨迹序列/>对/>进行/>轮的本地优化，并在模型更新过程中，使用高斯机制对模型参数进行加噪保护。

5.根据权利要求4所述的方法，其特征在于，所述通过各个参与用户设备维护本地模型，并从推荐服务器获取最新的模型参数/>，对于被选中的用户设备/>，在本地使用用户轨迹序列/>对/>进行/>轮的本地优化，并在模型更新过程中，使用高斯机制对模型参数进行加噪保护具体包括：

按照时间窗口对用户轨迹序列进行划分，得到子序列，对于其中的第/>个子轨迹，将其前/>个兴趣点作为输入，预测第/>个要访问的兴趣点/>；

初始化本地训练轮次，其对应的本地模型为/>，进入本地模型更新过程，通过各个用户设备在本地更新过程中对中间梯度添加高斯噪声，具体地：对于第/>轮本地训练：采用子采样的方式随机选择训练样本，即每轮的训练集由整个训练集的一个随机子集构成，所述随机子集由概率为/>的不放回采样选取，其中/>为子集的大小，n表示所选用户的样本总数，得到训练样本子集/>；在进行梯度计算时，对于客户端每一个样本即历史轨迹特征/>，对其梯度进行裁剪，将其限制在固定的范围/>，以将单个样本对差分隐私保证的影响限定在预定义的截断阈值/>内，将裁剪后的梯度更新为：；对裁剪后的梯度添加高斯噪声/>，得到满足差分隐私的梯度数据，即有/>，使用该梯度数据更新本地模型，即/>；其中，/>表示第e轮梯度更新值，/>表示所添加的高斯噪声，/>表示噪声标准差，/>表示单位向量，保证高斯噪声为向量形式，/>表示学习率；

通过本地轮训练，通过各个用户设备完成添加差分隐私的本地训练流程，得到当前本地模型参数/>。

6.根据权利要求5所述的方法，其特征在于，所述通过各个参与用户设备将加噪后的模型参数上传至推荐服务器具体包括：

7.根据权利要求6所述的方法，其特征在于，所述通过推荐服务器聚合各个客户端上传的模型参数，更新轨迹预测模型具体包括：

通过推荐服务器聚合各个用户设备的模型参数，进行轨迹预测模型更新，即，其中，/>表示每轮选择的用户子集，/>表示用户i的本地样本数，n表示所选用户的样本总数，/>表示第t+1轮轨迹预测模型更新。

8.一种基于用户轨迹序列的下一个兴趣点隐私保护推荐系统，其特征在于，包括：

所述推荐服务器进一步用于：聚合各个客户端上传的模型参数，更新轨迹预测模型，直到轨迹预测模型收敛或达到训练次数；

所述建立模块具体用于：

根据所述序列转移模式和动态偏好，基于GRU模型和注意力模型融合用户长短期偏好特征同时进行建模，得到轨迹预测模型；

所述建立模块具体用于：

公式5；

公式6；

公式7；

9.根据权利要求8所述的系统，其特征在于，所述推荐服务器具体用于：

10.根据权利要求9所述的系统，其特征在于，所述推荐服务器具体用于：

11.根据权利要求10所述的系统，其特征在于，所述用户设备具体用于：

12.根据权利要求11所述的系统，其特征在于，所述用户设备具体用于：

13.根据权利要求12所述的系统，其特征在于，所述用户设备具体用于：

14.根据权利要求13所述的系统，其特征在于，所述推荐服务器具体用于：

15.一种电子设备，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于用户轨迹序列的下一个兴趣点隐私保护推荐方法的步骤。

16.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有信息传递的实现程序，所述程序被处理器执行时实现如权利要求1至7中任一项所述的基于用户轨迹序列的下一个兴趣点隐私保护推荐方法的步骤。