CN114003821B

CN114003821B - 一种基于联邦学习的个性化行为推荐方法

Info

Publication number: CN114003821B
Application number: CN202111638487.2A
Authority: CN
Inventors: 翟晓东; 汝乐; 王意洲; 凌涛; 凌婧
Original assignee: Jiangsu Austin Photoelectric Technology Co ltd
Current assignee: Jiangsu Austin Photoelectric Technology Co ltd
Priority date: 2021-12-30
Filing date: 2021-12-30
Publication date: 2022-05-13
Anticipated expiration: 2041-12-30
Also published as: CN114003821A

Abstract

本发明公开了一种基于联邦学习的个性化行为推荐方法，包括如下步骤：步骤1，采集用户行为特征数据，对用户行为特征数据进行分类，并根据用户行为特征数据的类别划分本地客户端；对用户行为特征数据进行标准化处理，再将标准化处理后的用户行为特征数据构建成特征矩阵形式；步骤2，在本地客户端建立本地模型；步骤3，基于服务器端与客户端用户的互动，在联邦学习算法中加入双重主观逻辑模型，量化本地模型的声誉值，最终将训练好的的模型参数及其声誉值上传至服务器上。有利于隐私安全，将用户的隐私保存在本地客户端；还可以实现在个人用户的推荐基础上，进行团体推荐。

Description

一种基于联邦学习的个性化行为推荐方法

技术领域

本发明涉及机器学习领域，具体为一种基于联邦学习的个性化行为推荐方法。

背景技术

近年来,随着互联网技术的发展，社会进入了一个信息爆炸的时代，海量的信息同时出现，人们的隐私一方面很容易被触及和侵犯，另一方面又需要学习人们的行为习惯，从而形成针对性的推荐系统。因此，联邦学习被设计出来，用于在不触及数据的前提下，分析数据。但是，现有的联邦学习算法对个性化的分析功能仍然欠缺，而这一领域却是十分具有商业价值的。

申请号为202121739511.7的专利，公开了一种可灵活组合的液晶屏智能展示系统，是一种展示信息展示系统，具有服务器和终端的中心式网络结构，可以用于大数据挖掘和学习。可以用于组合式动作识别和学习工作任务，这一任务的目的是为了提高文化适应性和满足个性化需求，例如肯德基、麦当劳进入中国后，就依据中国人的特点，进行了口味改良，它们在四川、湖南等地，其口味偏辣，在江苏、浙江、广东，其口味偏淡，从而提高了销售额。进一步的，对于动作而言，也是如此，本发明的方法的目的是能够学习不同地区不同人群的手势、行为习惯和穿着等。对于不同年龄段、不同人种、不同地区文化和不同的集会，都会有不同的集会特征。例如年轻人的街舞和中老年人打招呼手势等。这些不同地区的行为特征会有所不同，即使是同一个地区的年轻人对于同一种音乐的理解不同，那么编排的舞蹈动作就会存在不同。对于这些问题，严重阻碍了文化交流和信息传播。而现有的个性化行为推荐算法，都是在移动客户端进行私人推荐，很难在团体行动是形成一定的统一行为。与此同时，现有的针对个人的推荐算法，都或多或少的侵犯了用户的隐私安全，这与时代发展背道而驰。本申请将现有的推荐方法存在的以下两点不足总结如下：

问题1：尚未解决在保护用户隐私的问题。而现有的法律已经不允许企业随意获取用户的私人信息，因而需要考虑在保护用户的隐私基础上完成个性化推荐，国内外的法律现在都是命令禁止企业和个人非法利用私人数据。

问题2：现有的推荐方法主要是针对于个人进行推荐，而不是针对于一个年龄段或者是一个团体进行推荐，推荐的效率较为低下，且团体活动针对于一群人需要统一的动作、穿着或口号等。

发明内容

为了解决上述两个技术问题本发明提出了一种基于联邦学习的个性化行为推荐方法，具体包括如下步骤；

步骤1，采集用户行为特征数据，对用户行为特征数据进行分类，并根据用户行为特征数据的类别划分本地客户端；对用户行为特征数据进行标准化处理，再将标准化处理后的用户行为特征数据构建成特征矩阵形式；

具体的，是将用户行为特征数据按肤色和年龄段进行划分，并依此划分客户端；

步骤2，在本地客户端建立本地模型；

步骤3，基于服务器端与客户端用户的互动，在联邦学习算法中加入双重主观逻辑模型，量化本地模型的声誉值，最终将训练好的模型参数及其声誉值上传至服务器上。

进一步的，步骤1中对用户行为特征数据进行标准化处理，具体过程为；

采用标准化函数将用户行为特征数据映射到[0，1]之间；

标准化函数如下：

其中X_t是t时刻未标准化的用户行为特征向量，X_max是用户行为特征向量最大值，X_min是用户行为特征向量最小值，

是t时刻的标准化后的用户行为特征向量的结果。

进一步的，步骤1中将标准化处理后的用户行为特征数据构建成特征矩阵形式，具体为：

将标准化后的用户行为特征数据构建为特征矩阵P_t，

P_t＝[(x₁，y₁)，(x₂，y₂)，(x₃，y₃)，…(x₁₈，y₁₈)，(x₁₉，0)，…(x₂₅，0)]

其中，特征矩阵P_t中前18组特征数据均为用户运动特征关节节点坐标，x₁₉表示用户参与活动的时长；x₂₀表示用户的时装特征；x₂₁表示用户的年龄特征；x₂₂表示用户的性别；x₂₃表示用户的肤色特征；x₂₄表示用户的身高特征；x₂₅表示用户的体重特征。

进一步的，步骤2中本地模型的网络结构包括指针卷积模块、LSTM网络模块、卷积模块、特征融合模块和全连接层；

指针卷积模块对所述用户特征数据进行分类，分为时序特征矩阵和非时序特征矩阵，其中时序特征数据输入到LSTM网络，进行时间点关键特征提取，得到时序特征数据模块；非时序特征数据输入到卷积模块进行特征提取，得到非时序特征数据模块，将卷积提取的非时许特征模块和LSTM网络提取的时序特征模块经特征融合模块进行特征拼接融合，输出至全连接层，建立本地模型。

进一步的，步骤3中基于服务器端与客户端用户的互动，在联邦学习算法中加入双重主观逻辑模型，量化本地模型的声誉值，最终将训练好的模型参数及其声誉值上传至服务器上；具体为：

双重主观逻辑模型是指服务器端对本地模型进行聚合，并下发推荐模型以及该推荐模型的声誉值到本地客户端，本地客户端将推荐模型的声誉值与当前本地模型的声誉值对比，若声誉值相同，则当前客户端不改变声誉值大小；

若声誉值不同，根据公式(9)的形式发送给本地客户端的边缘节点，边缘节点更新推荐模型的声誉值；

其中f→e_i表示客户端f向边缘节点e_i发送请求信息；q(·)为函数，time是时间戳，sig是数据请求用户的签名，H(Evi)函数是对请求数据做哈希运算，

为可能参与的客户端f向边缘节点e_i发送请求信息；边缘节点选择声誉值高的模型数据推荐给数据请求用户；

在交互过程中再利用双重主观逻辑模型计算推荐模型的声誉值，最终将推荐模型的声誉值和推荐模型参数上传至服务器上。

进一步的，步骤3中采用双重主观逻辑模型量化本地模型的声誉值，声誉值包括直接声誉值和间接声誉值，计算方法如下：

步骤3.1.1直接声誉值的计算方法

边缘节点e_i对服务器端η_j的直接声誉值通过声誉矢量来表示公式(10)：

其中

代表边缘节点e_i对服务器端η_j的信任度，

代表边缘节点e_i对服务器端η_j的不信任度，

代表边缘节点e_i对服务器端η_j的不确定度；且三个系数取值范围在0到1之间，满足下面的公式(11)：

基于主观逻辑模型，得到公式(12)：

这里的α，β各自代表边缘节点e_i对服务器端η_j是每次任务中交互的积极事件和消极事件次数；

为成功传输数据模型参数的概率，即在无线网络中的通信质量决定了边缘节点数对候选某类行为特征的不确定度；

结合主观逻辑模型的矢量值，得到直接声誉值为公式(13)：

μ指的是不确定度对声誉值影响的相对系数，

为直接声誉值；

为了减少自私节点或者恶意节点的攻击，增加消极交互事件对声誉值影响的权重，即

θ是参与联邦学习的某类行为特征正确传输模型参数后，与边缘节点完成积极交互的权重系数；

是消极交互的权重系数；则直接声誉值公式更新为下面的公式：

在模型中考虑了交互时效性影响因子；定义时效衰落函数来描述时间对声誉的影响(15)：

t(γ)＝F^Z-z，F∈(0，1) (15)

其中F是交互新鲜度的衰退参数，z∈(0，Z]是决定交互新鲜度的时隙；Z表示交互总时间；

根据时效衰落函数将一段时间γ内的直接声誉值公式更新为公式(16)：

则该时间段内的直接声誉为式(17)：

即该时间段γ内某一时隙的直接声誉值为公式(18)：

步骤3.1.2间接声誉值的计算

每个数据请求用户对数据提供用户的声誉值用公式(10)中的声誉矢量来表示；为了衡量其他请求者提供的间接声誉值的重要性，利用下式来计算其他数据请求用户的间接声誉值的权重因子，见公式(19)：

其他数据请求用户e_y∈E，E是其他数据请求用户的集合且有公式(20)：

式(20)为其他边缘节点e_y对服务器端η_j的熟悉度，意味着其他边缘节点e_y与服务器端η_j的交互越频繁，则

越大；在间接意见处考虑熟悉度参数，使边缘节点e_i获得对服务器端η_j可靠性更高的声誉计算结果；其他边缘节点e_y对服务器端η_j的间接声誉值通过矢量表示为公式(21)：

根据主观逻辑模型，形成的间接声誉值为公式(22)：

步骤3.1.3，声誉值的计算

结合间接声誉值和直接声誉值形成对数据提供用户最终的声誉值；最终的声誉值表示为公式(23)：

因此，边缘节点e_y更新对服务器端η_j的最终声誉综合值为公式(24)：

进一步的，步骤3中还包括鉴于Recall的评价标准，将声誉值的计算结果进行百分制计算，本地模型达到设定的声誉值评分时，将其聚合到服务器端聚合，聚合完成后再返回给各个本地客户端；

recall的公式如下：

其中

为综合声誉值得分，

为负的综合声誉值。

有益效果；

1，本发明提出了一种基于联邦学习的个性化行为推荐方法，有利于隐私安全，将用户的隐私保存在本地客户端，在进行用户的手势、行为习惯和穿着等推荐的时候，联邦学习

在云端联合建模，将大部分用户喜欢的模型泛化训练一个新的模型，推荐给用户能获得较好的预期效果；

2，在传统联邦学习的基础上加入个性化推荐，本发明采用LSTM长短期记忆(LongShort-Term Memory，LSTM)网络，在个人用户的推荐基础上，进行团体推荐。对此本发明在联邦学习划分客户端的时候，采用年龄段、肤色来划分客户端。根据不同人种和不同年龄段分别进行本地客户端的建模，将针对个人的推荐改变为针对年龄段的推荐，每个年龄段在联合建模时构建边缘节点来进行评判声誉值，根据声誉值进行推荐打分。在原本的LSTM针对个人用户进行推荐的基础上，本发明采用指针卷积，将时序特征和固有特征进行分离。时序特征在经过LSTM网络处理之后，与原本的卷积神经网络提取的特征进行信息融合，能够个性化建立本地模型，在此基础上进行分年龄段的个性化推荐。针对于年龄段的个性化推荐，本发明在传统联邦学习的基础上，增加一层模型边缘节点层，无论哪类年龄段建立的模型，彼此的边缘节点都有一定的相关性，将声誉值存放在客户端和服务器端之间，根据声誉值的好坏，来完成最终的模型建立和模型的下发。在联合训练泛化模型的时候，对于较好的声誉值给予更多的权重。在保护用户的隐私基础上，能够充分考虑到用户的个性化需求，根据声誉值分配权重进行建立联合模型，进而提高个性化推荐的效果。

附图说明

图1是传统联邦学习算法示意图。

图2是本发明传统联邦学习方法示意图。

图3是LSTM网络结构图。

图4是本地模型网络结构图。

图5是本发明流程图。

具体实施方式

本发明的一种基于联邦学习的个性化行为推荐方法，如图5所示，包括如下步骤：

步骤1，采集用户行为特征数据及对数据预处理；

步骤1.1，采集用户行为特征数据

收集不同地区用户的行为特征数据，所述的特征数据写成向量形式为X＝{x₁，x₂，x₃，…，x₂₄，x₂₅}.其中x₁表示用户的发型特征；x₂表示用户的左眼动作特征；x₃表示用户的右眼动作特征；x₄表示用户的嘴部动作特征；x₅表示用户的脖子左右动作特征；x₆表示用户的脖子前后动作特征；x₇表示用户的胸部动作特征；x₈表示用户的左肩膀动作特征；x₉表示用户的右肩膀动作特征；x₁₀表示用户的左手臂动作特征；x₁₁表示用户的右手臂动作特征；x₁₂表示用户的左手手势动作特征；x₁₃表示用户的右手手势动作特征；x₁₄表示用户的臀部特征；x₁₅表示用户的左膝盖动作特征；x₁₆表示用户的右膝盖动作特征；x₁₇表示用户的左脚动作特征；x₁₈表示用户的右脚动作特征；x₁₉表示用户参与活动的时长；x₂₀表示用户的时装特征；x₂₁表示用户的年龄特征；x₂₂表示用户的性别；x₂₃表示用户的肤色特征；x₂₄表示用户的身高特征；x₂₅表示用户的体重特征。其中，特征向量x₁到x₁₈均为运动特征节点。

步骤1.2，根据用户行为特征数据划分本地客户端

根据用户行为特征数据中的肤色特征和年龄特征划分本地客户端，肤色特征分为黄色、白色和黑色，以区分不同人种，肤色的划分依据在液晶屏上设定色阈，进行自动划分；

年龄特征分为儿童f₁(16岁以下)、青少年f₂(16岁-28岁)、壮年f₃(28岁到45岁)、中年f₄(45岁到65岁)和老年f₅(65岁以上)，至此可以划分出十五个本地客户端；

步骤1.3，将用户行为特征数据分为训练集D₁、测试集D₂和验证集D₂，基中训练集D₁和测试集D₂用于训练和测试本地模型，验证集D₃在服务器端，其用来进行验证服务器端模型的准确率。

步骤1.4，对用户行为特征数据进行标准化处理

理论上用户行为特征数据不统一，差值较大，因而这些数据需要进行归一化处理。

一般而言，当深度学习算法的输入端数据接近于“0”平均值时，学习效率最佳。对于采集的用户行为特征数据采用最大值最小值标准化，将数据映射到[0，1]之间，标准化函数如下：

是t时刻的标准化后的用户行为特征向量的结果。

步骤1.5，将标准化后的用户行为特征数据构建为特征矩阵。

将标准化后的用户行为特征数据构建为特征矩阵P_t，

P_t＝[(x₁，y₁)，(x₂，y₂)，(x₃，y₃)，…(x₂₄，y₂₄)，(x₂₅，y₂₅)]

其中，特征矩阵P_t中前18组特征数据均为运动特征关节节点坐标，第19-25特征数据中的y值均采用0填补。

特征矩阵P_t具体可写为，

步骤2，在本地客户端建立本地模型，如图4所示，本地模型的网络结构包括指针卷积模块、LSTM网络模块、卷积模块、特征融合模块和全连接层。

预处理后的用户特征数据输入到本地模型中，指针卷积模块对所述用户特征数据进行分类，分为时序特征矩阵和非时序特征矩阵，其中时序特征数据输入到LSTM网络，进行时间点关键特征提取，得到时序特征数据模块；非时序特征数据输入到卷积模块进行特征提取，得到非时序特征数据模块，将卷积提取的非时许特征模块和LSTM网络提取的时序特征模块经特征融合模块进行特征拼接融合，输出至全连接层，建立本地模型。

具体的，本地模型数据处理步骤如下：

步骤2.1，指针卷积模块对所述用户特征矩阵进行分类；分为时序特征矩阵和非时序特征矩阵。

特征矩阵P_t中(x₁₉，0)，…(x₂₅，0)与时序的信息关联度不大，在训练网络模型时，为了减少计算量本发明设置了指针卷积模块，采用1*1的卷积核，利用指针操作，选出特征矩阵P_t中前18个坐标，特征矩阵P_t变为新的特征矩阵P′_t即P′_t＝[(x₁，y₁)，(x₂，y₂)，(x₃，y₃)，…(x₁₈，y₁₈)]，将CNN提取出来的信息，当作单独的特征信息进行保留，指针卷积输出两类特征矩阵，包括时序特征矩阵和非时序特征矩阵。

假设卷积核大小为1*1，步长为1，d为1时，即填充“0”权值个数为0，则卷积公式如下：

步骤2.2，将时序特征矩阵输入到LSTM网络进行特征提取，时序特征数据输入到LSTM网络，进行时间点关键特征提取，得到时序特征数据模块；非时序特征数据输入到卷积模块进行特征提取，得到非时序特征数据模块。

如图3所示，将时序特征矩阵输入到LSTM网络，基于时序的动作推荐需要充分利用时间和其他参数之间的相关性。LSTM解决了传统的循环神经网络的梯度消失和梯度爆炸的问题，能够保留更久的时间信息。附图4中t时刻的输入信息包括当前输入值P′_t，P′_t为t时刻的输入到LSTM网络中的数据，上一时刻LSTM网络的输出值h_t-1。LSTM网络提供了遗忘门f_t、输入门i_t和输出门O_t。输入门i_t主要用于控制当前时刻信息的流入量，见公式(3)：

i_t＝σ(W_ii·P_t+b_ii+W_iih_t-1+b_ii) (3)

其中σ(·)为sigmoid激活函数，W_ii为输入门输入值权重参数，b_ii为输入门输入值偏置。

遗忘门f_t用于控制上一时刻累积的历史信息C_t-1的流入量，见公式(4)：

f_t＝σ(W_if·P_t+b_if+W_hfh_t-1+b_hf) (4)

其中σ(·)表示sigmod激活函数，W_if为遗忘门当前时刻输入值的权重参数，W_hf为遗忘门上一时刻输入值的权重参数，b_if为遗忘门当前时刻输入值的偏置，b_hf为遗忘门上一时刻输入值的偏置。输出门O_t主要用于控制当前时刻信息的流出量，见公式(5)：

O_t＝σ(W_ioP_t+b_io+W_hoh_t-1+b_ho) (5)

其中σ(·)表示sigmod激活函数，W_io为输出门当前时刻输入值的权重参数，W_ho为输出门上一时刻输入值的权重参数，b_io为输出门当前时刻输入值的偏置，b_h0为输出门上一时刻输入值的偏置。g_t代表当前时刻信息的更新值，它由上一时刻的输出值h_t-1和当前时刻的输入值P_t决定，见公式(6)：

gt＝tanh(W_igP_t+b_ig+W_hgh_t-1+b_hg) (6)

其中tanh(·)为激活函数，W_ig为输入门当前时刻更新值的权重参数，b_ig为输入门当前时刻更新值的偏置，W_hg为输出值与当前时刻更新值的权重参数，b_hg输出值与当前时刻更新值的偏置。

C_t表示隐藏层单元携带的信息，类似于细胞的状态。它是由输入门和遗忘门控制，每一时刻都在更新并直接决定当前输出。当前时刻输出值h_t是由输出门O_t对C_t进行筛选后得到的输出结果，见公式(7)和(8)：

C_t＝f_t*C_t-1+i_t*g_t (7)

h_t＝O_t*tanhC_t (8)

LSTM网络的输出数据维度可以自行设置，假设输出的数据维度与输入维度相同。

非时序特征数据输入到卷积模块进行特征提取，得到非时序特征数据模块。

步骤2.3，模型融合

将卷积模块的特征提取和LSTM网络提取的特征进行融合，并输入到全连接层，利用各自的训练集D1和测试集D2进行本地模型训练，完成本地模型构建，定义本地模型参数为w_locals。

步骤3，基于服务器端与客户端用户的互动，在联邦学习算法中加入双重主观逻辑模型，用于量化本地模型的声誉值，最终将训练好的模型参数及其声誉值上传至服务器上。如图1所示是传统联邦学习算法的示意图，如图2所示是本发明联邦学习算法的示意图。具体包括如下步骤：

步骤3.1，服务器端对本地模型进行聚合，并下发推荐模型以及该推荐模型的声誉值到本地客户端，本地客户端将推荐模型的声誉值与当前本地模型的声誉值对比，若声誉值相同，则当前客户端不改变声誉值大小；

若声誉值不同，根据公式(9)的形式发送给本地客户端的边缘节点，边缘节点更新推荐模型的声誉值。

为可能参与的客户端f向边缘节点e_i发送请求信息。边缘节点选择声誉值高的模型数据推荐给数据请求用户。

具体的，声誉值包括直接声誉值和间接声誉值，计算方法如下：

步骤3.1.1直接声誉值的计算方法

其中

代表边缘节点e_i对服务器端η_j的信任度，

代表边缘节点e_i对服务器端η_j的不信任度，

代表边缘节点e_i对服务器端η_j的不确定度。且三个系数取值范围在0到1之间，满足下面的公式(11)：

基于主观逻辑模型，得到公式(12)：

这里的α，β各自代表边缘节点e_i对服务器端η_j是每次任务中交互的积极事件和消极事件次数。

为成功传输数据模型参数的概率，即在无线网络中的通信质量决定了边缘节点数对服务器端η_j候选某类行为特征的不确定度。

结合主观逻辑模型的矢量值，可以得到直接声誉值为公式(13)：

μ指的是不确定度对声誉值影响的相对系数，

为直接声誉值。

考虑到实际情况中，很多因素会影响边缘节点对候选某类行为特征的声誉值。因此，本申请的模型中考虑了双方交互时效的影响和正负交互因素的影响。为了减少自私节点或者恶意节点的攻击，增加消极交互事件对声誉值影响的权重，即

θ是参与联邦学习的某类行为特征正确传输模型参数后，与边缘节点完成积极交互的权重系数。

是消极交互的权重系数。则声誉值公式更新为下面的公式：

随着时间的推移，参与数据共享的某类行为特征不可能总是高度可信的，由于无线网络和不确定性因素的存在，所以在模型中考虑了交互时效性影响因子。定义时效衰落函数来描述时间对声誉的影响(15)：

t(γ)＝F^Z-z，F∈(0，1) (15)

其中F是交互新鲜度的衰退参数，z∈(0，Z]是决定交互新鲜度的时隙。Z表示交互总时间。

则时间段γ内的直接声誉为式(17)：

即时间段γ内某一时隙的直接声誉值为公式(18)：

3.1.2间接声誉值的计算

间接声誉值是由其他数据请求用户对数据提供用户形成的，在现实的无线移动网络中，作为提供视频软件的数据提供用户不会只服务一个任务。所以，每一个任务都会有一个数据请求用户对应多个数据提供用户。随着时间的推移，一个数据提供用户完成了与多个数据请求用户之间的交互，当有新的任务发布时，当前数据请求用户就从其他数据请求用户那里获取他们对数据提供用户的声誉值。每个数据请求用户对数据提供用户的声誉值都会用公式(10)中的声誉矢量来表示。为了衡量其他请求者提供的间接声誉值的重要性，利用下式来计算其他数据请求用户的间接声誉值的权重因子，见公式(19)：

越大。在间接意见处考虑熟悉度参数，使边缘节点e_i获得对服务器端η_j可靠性更高的声誉计算结果。其他边缘节点e_y对服务器端η_j的间接声誉值通过矢量表示为公式(21)：

根据主观逻辑模型，形成的间接声誉值为公式(22)：

3.1.3声誉值的计算

为了及时查询核对参与数据共享过程中节点的声誉值，所以每一个边缘节点都会有一个本地声誉存储池，根据交互历史存储对各个客户端的边缘节点的直接声誉值。同时为了避免其他数据请求者作弊，要结合间接意见和直接声誉值形成对数据提供用户最终的声誉值。最终的声誉值表示为公式(23)：

因此，边缘节点e_y更新对η_j的最终声誉综合值为公式(24)：

在上述步骤中进行声誉计算后，当声誉综合值大于预先定义的阈值时，边缘节点e_i选择具有高精度和可靠数据的高声誉候选服务器端η_j作为联邦学习任务的模型培训工人。每一个边缘节点都有义务在更新其对各服务器端的声誉值后，将声誉值上传到区块链上以作为其他数据请求者的参考意见。这种方案能挑选出了可靠性高且具有高精度数据的候选某类行为特征。于此同时我们根据上述步骤计算出负的声誉值

计算方法和步骤同步骤3.1.1-3-1.3，这里依据用户不喜欢的操作进行声誉值打分。

在交互过程中再利用双重主观逻辑模型计算候选某种视频的声誉，最终将某种视频的声誉值和训练的模型参数上传至服务器上

为了激励高质量的数据贡献者积极参与联邦学习，联合训练某类行为特征开发者还利用区块链技术准确无误的为高质量的数据贡献者支付奖励。激励机制不是本申请重点，不展开详细阐述。

步骤3.2，鉴于Recall的评价标准，将声誉值的计算结果进行百分制计算，则t-recall的公式如下：

其中

为综合声誉值得分，

为负的综合声誉值。

步骤3.3，本地模型达到设定的声誉值评分时，声誉值设置为70分，将基于CNN+LSTM网络的联合训练模型聚合到服务器端聚合，聚合完成后再返回给各个本地客户端，操作流程如附图2。

本发明的方法可用于申请号为202121739511.7的液晶屏智能展示系统，在播放舞蹈视频时，大家一起随动作模板进行舞蹈动作。采用了本发明方法的液晶屏智能展示系统同时可以用于反向从他们的动作中学习个性化内容，然后在同一组行为序列中，聚合依据不同人员特征从而带有动作个性化的动作模板，提高其适应性。

Claims

1.一种基于联邦学习的个性化行为推荐方法，其特征在于，包括如下步骤：

步骤1，采集用户行为特征数据，对用户行为特征数据进行分类，并根据用户行为特征数据的类别划分本地客户端；

对用户行为特征数据进行标准化处理，再将标准化处理后的用户行为特征数据构建成特征矩阵形式；

步骤2，在本地客户端建立本地模型；

本地模型的网络结构包括指针卷积模块、LSTM网络模块、卷积模块、特征融合模块和全连接层；

指针卷积模块对所述用户行为特征数据进行分类，分为时序特征矩阵和非时序特征矩阵，其中时序特征数据输入到LSTM网络，进行时间点关键特征提取，得到时序特征数据模块；非时序特征数据输入到卷积模块进行特征提取，得到非时序特征数据模块，将卷积提取的非时序特征模块和LSTM网络提取的时序特征模块经特征融合模块进行特征拼接融合，输出至全连接层，建立本地模型；

步骤3，基于服务器端与客户端用户的互动，在联邦学习算法中加入双重主观逻辑模型，量化本地模型的声誉值，最终将训练好的模型参数及其声誉值上传至服务器上；

若声誉值不同，根据公式9的形式发送给本地客户端的边缘节点，边缘节点更新推荐模型的声誉值；