CN114003821B - 一种基于联邦学习的个性化行为推荐方法 - Google Patents

一种基于联邦学习的个性化行为推荐方法 Download PDF

Info

Publication number
CN114003821B
CN114003821B CN202111638487.2A CN202111638487A CN114003821B CN 114003821 B CN114003821 B CN 114003821B CN 202111638487 A CN202111638487 A CN 202111638487A CN 114003821 B CN114003821 B CN 114003821B
Authority
CN
China
Prior art keywords
reputation
reputation value
user
data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111638487.2A
Other languages
English (en)
Other versions
CN114003821A (zh
Inventor
翟晓东
汝乐
王意洲
凌涛
凌婧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Austin Photoelectric Technology Co ltd
Original Assignee
Jiangsu Austin Photoelectric Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Austin Photoelectric Technology Co ltd filed Critical Jiangsu Austin Photoelectric Technology Co ltd
Priority to CN202111638487.2A priority Critical patent/CN114003821B/zh
Publication of CN114003821A publication Critical patent/CN114003821A/zh
Application granted granted Critical
Publication of CN114003821B publication Critical patent/CN114003821B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于联邦学习的个性化行为推荐方法,包括如下步骤:步骤1,采集用户行为特征数据,对用户行为特征数据进行分类,并根据用户行为特征数据的类别划分本地客户端;对用户行为特征数据进行标准化处理,再将标准化处理后的用户行为特征数据构建成特征矩阵形式;步骤2,在本地客户端建立本地模型;步骤3,基于服务器端与客户端用户的互动,在联邦学习算法中加入双重主观逻辑模型,量化本地模型的声誉值,最终将训练好的的模型参数及其声誉值上传至服务器上。有利于隐私安全,将用户的隐私保存在本地客户端;还可以实现在个人用户的推荐基础上,进行团体推荐。

Description

一种基于联邦学习的个性化行为推荐方法
技术领域
本发明涉及机器学习领域,具体为一种基于联邦学习的个性化行为推荐方法。
背景技术
近年来,随着互联网技术的发展,社会进入了一个信息爆炸的时代,海量的信息同时出现,人们的隐私一方面很容易被触及和侵犯,另一方面又需要学习人们的行为习惯,从而形成针对性的推荐系统。因此,联邦学习被设计出来,用于在不触及数据的前提下,分析数据。但是,现有的联邦学习算法对个性化的分析功能仍然欠缺,而这一领域却是十分具有商业价值的。
申请号为202121739511.7的专利,公开了一种可灵活组合的液晶屏智能展示系统,是一种展示信息展示系统,具有服务器和终端的中心式网络结构,可以用于大数据挖掘和学习。可以用于组合式动作识别和学习工作任务,这一任务的目的是为了提高文化适应性和满足个性化需求,例如肯德基、麦当劳进入中国后,就依据中国人的特点,进行了口味改良,它们在四川、湖南等地,其口味偏辣,在江苏、浙江、广东,其口味偏淡,从而提高了销售额。进一步的,对于动作而言,也是如此,本发明的方法的目的是能够学习不同地区不同人群的手势、行为习惯和穿着等。对于不同年龄段、不同人种、不同地区文化和不同的集会,都会有不同的集会特征。例如年轻人的街舞和中老年人打招呼手势等。这些不同地区的行为特征会有所不同,即使是同一个地区的年轻人对于同一种音乐的理解不同,那么编排的舞蹈动作就会存在不同。对于这些问题,严重阻碍了文化交流和信息传播。而现有的个性化行为推荐算法,都是在移动客户端进行私人推荐,很难在团体行动是形成一定的统一行为。与此同时,现有的针对个人的推荐算法,都或多或少的侵犯了用户的隐私安全,这与时代发展背道而驰。本申请将现有的推荐方法存在的以下两点不足总结如下:
问题1:尚未解决在保护用户隐私的问题。而现有的法律已经不允许企业随意获取用户的私人信息,因而需要考虑在保护用户的隐私基础上完成个性化推荐,国内外的法律现在都是命令禁止企业和个人非法利用私人数据。
问题2:现有的推荐方法主要是针对于个人进行推荐,而不是针对于一个年龄段或者是一个团体进行推荐,推荐的效率较为低下,且团体活动针对于一群人需要统一的动作、穿着或口号等。
发明内容
为了解决上述两个技术问题本发明提出了一种基于联邦学习的个性化行为推荐方法,具体包括如下步骤;
步骤1,采集用户行为特征数据,对用户行为特征数据进行分类,并根据用户行为特征数据的类别划分本地客户端;对用户行为特征数据进行标准化处理,再将标准化处理后的用户行为特征数据构建成特征矩阵形式;
具体的,是将用户行为特征数据按肤色和年龄段进行划分,并依此划分客户端;
步骤2,在本地客户端建立本地模型;
步骤3,基于服务器端与客户端用户的互动,在联邦学习算法中加入双重主观逻辑模型,量化本地模型的声誉值,最终将训练好的模型参数及其声誉值上传至服务器上。
进一步的,步骤1中对用户行为特征数据进行标准化处理,具体过程为;
采用标准化函数将用户行为特征数据映射到[0,1]之间;
标准化函数如下:
Figure GDA0003514178750000021
其中Xt是t时刻未标准化的用户行为特征向量,Xmax是用户行为特征向量最大值,Xmin是用户行为特征向量最小值,
Figure GDA0003514178750000022
是t时刻的标准化后的用户行为特征向量的结果。
进一步的,步骤1中将标准化处理后的用户行为特征数据构建成特征矩阵形式,具体为:
将标准化后的用户行为特征数据构建为特征矩阵Pt
Pt=[(x1,y1),(x2,y2),(x3,y3),…(x18,y18),(x19,0),…(x25,0)]
其中,特征矩阵Pt中前18组特征数据均为用户运动特征关节节点坐标,x19表示用户参与活动的时长;x20表示用户的时装特征;x21表示用户的年龄特征;x22表示用户的性别;x23表示用户的肤色特征;x24表示用户的身高特征;x25表示用户的体重特征。
进一步的,步骤2中本地模型的网络结构包括指针卷积模块、LSTM网络模块、卷积模块、特征融合模块和全连接层;
指针卷积模块对所述用户特征数据进行分类,分为时序特征矩阵和非时序特征矩阵,其中时序特征数据输入到LSTM网络,进行时间点关键特征提取,得到时序特征数据模块;非时序特征数据输入到卷积模块进行特征提取,得到非时序特征数据模块,将卷积提取的非时许特征模块和LSTM网络提取的时序特征模块经特征融合模块进行特征拼接融合,输出至全连接层,建立本地模型。
进一步的,步骤3中基于服务器端与客户端用户的互动,在联邦学习算法中加入双重主观逻辑模型,量化本地模型的声誉值,最终将训练好的模型参数及其声誉值上传至服务器上;具体为:
双重主观逻辑模型是指服务器端对本地模型进行聚合,并下发推荐模型以及该推荐模型的声誉值到本地客户端,本地客户端将推荐模型的声誉值与当前本地模型的声誉值对比,若声誉值相同,则当前客户端不改变声誉值大小;
若声誉值不同,根据公式(9)的形式发送给本地客户端的边缘节点,边缘节点更新推荐模型的声誉值;
Figure GDA0003514178750000031
其中f→ei表示客户端f向边缘节点ei发送请求信息;q(·)为函数,time是时间戳,sig是数据请求用户的签名,H(Evi)函数是对请求数据做哈希运算,
Figure GDA0003514178750000032
为可能参与的客户端f向边缘节点ei发送请求信息;边缘节点选择声誉值高的模型数据推荐给数据请求用户;
在交互过程中再利用双重主观逻辑模型计算推荐模型的声誉值,最终将推荐模型的声誉值和推荐模型参数上传至服务器上。
进一步的,步骤3中采用双重主观逻辑模型量化本地模型的声誉值,声誉值包括直接声誉值和间接声誉值,计算方法如下:
步骤3.1.1直接声誉值的计算方法
边缘节点ei对服务器端ηj的直接声誉值通过声誉矢量来表示公式(10):
Figure GDA0003514178750000033
其中
Figure GDA0003514178750000034
代表边缘节点ei对服务器端ηj的信任度,
Figure GDA0003514178750000035
代表边缘节点ei对服务器端ηj的不信任度,
Figure GDA0003514178750000036
代表边缘节点ei对服务器端ηj的不确定度;且三个系数取值范围在0到1之间,满足下面的公式(11):
Figure GDA0003514178750000041
基于主观逻辑模型,得到公式(12):
Figure GDA0003514178750000042
这里的α,β各自代表边缘节点ei对服务器端ηj是每次任务中交互的积极事件和消极事件次数;
Figure GDA0003514178750000043
为成功传输数据模型参数的概率,即在无线网络中的通信质量决定了边缘节点数对候选某类行为特征的不确定度;
结合主观逻辑模型的矢量值,得到直接声誉值为公式(13):
Figure GDA0003514178750000044
μ指的是不确定度对声誉值影响的相对系数,
Figure GDA0003514178750000045
为直接声誉值;
为了减少自私节点或者恶意节点的攻击,增加消极交互事件对声誉值影响的权重,即
Figure GDA0003514178750000046
θ是参与联邦学习的某类行为特征正确传输模型参数后,与边缘节点完成积极交互的权重系数;
Figure GDA0003514178750000047
是消极交互的权重系数;则直接声誉值公式更新为下面的公式:
Figure GDA0003514178750000048
在模型中考虑了交互时效性影响因子;定义时效衰落函数来描述时间对声誉的影响(15):
t(γ)=FZ-z,F∈(0,1) (15)
其中F是交互新鲜度的衰退参数,z∈(0,Z]是决定交互新鲜度的时隙;Z表示交互总时间;
根据时效衰落函数将一段时间γ内的直接声誉值公式更新为公式(16):
Figure GDA0003514178750000051
则该时间段内的直接声誉为式(17):
Figure GDA0003514178750000052
即该时间段γ内某一时隙的直接声誉值为公式(18):
Figure GDA0003514178750000053
步骤3.1.2间接声誉值的计算
每个数据请求用户对数据提供用户的声誉值用公式(10)中的声誉矢量来表示;为了衡量其他请求者提供的间接声誉值的重要性,利用下式来计算其他数据请求用户的间接声誉值的权重因子,见公式(19):
Figure GDA0003514178750000054
其他数据请求用户ey∈E,E是其他数据请求用户的集合且有公式(20):
Figure GDA0003514178750000055
式(20)为其他边缘节点ey对服务器端ηj的熟悉度,意味着其他边缘节点ey与服务器端ηj的交互越频繁,则
Figure GDA0003514178750000056
越大;在间接意见处考虑熟悉度参数,使边缘节点ei获得对服务器端ηj可靠性更高的声誉计算结果;其他边缘节点ey对服务器端ηj的间接声誉值通过矢量表示为公式(21):
Figure GDA0003514178750000057
根据主观逻辑模型,形成的间接声誉值为公式(22):
Figure GDA0003514178750000061
步骤3.1.3,声誉值的计算
结合间接声誉值和直接声誉值形成对数据提供用户最终的声誉值;最终的声誉值表示为公式(23):
Figure GDA0003514178750000062
因此,边缘节点ey更新对服务器端ηj的最终声誉综合值为公式(24):
Figure GDA0003514178750000063
进一步的,步骤3中还包括鉴于Recall的评价标准,将声誉值的计算结果进行百分制计算,本地模型达到设定的声誉值评分时,将其聚合到服务器端聚合,聚合完成后再返回给各个本地客户端;
recall的公式如下:
Figure GDA0003514178750000064
其中
Figure GDA0003514178750000065
为综合声誉值得分,
Figure GDA0003514178750000066
为负的综合声誉值。
有益效果;
1,本发明提出了一种基于联邦学习的个性化行为推荐方法,有利于隐私安全,将用户的隐私保存在本地客户端,在进行用户的手势、行为习惯和穿着等推荐的时候,联邦学习
在云端联合建模,将大部分用户喜欢的模型泛化训练一个新的模型,推荐给用户能获得较好的预期效果;
2,在传统联邦学习的基础上加入个性化推荐,本发明采用LSTM长短期记忆(LongShort-Term Memory,LSTM)网络,在个人用户的推荐基础上,进行团体推荐。对此本发明在联邦学习划分客户端的时候,采用年龄段、肤色来划分客户端。根据不同人种和不同年龄段分别进行本地客户端的建模,将针对个人的推荐改变为针对年龄段的推荐,每个年龄段在联合建模时构建边缘节点来进行评判声誉值,根据声誉值进行推荐打分。在原本的LSTM针对个人用户进行推荐的基础上,本发明采用指针卷积,将时序特征和固有特征进行分离。时序特征在经过LSTM网络处理之后,与原本的卷积神经网络提取的特征进行信息融合,能够个性化建立本地模型,在此基础上进行分年龄段的个性化推荐。针对于年龄段的个性化推荐,本发明在传统联邦学习的基础上,增加一层模型边缘节点层,无论哪类年龄段建立的模型,彼此的边缘节点都有一定的相关性,将声誉值存放在客户端和服务器端之间,根据声誉值的好坏,来完成最终的模型建立和模型的下发。在联合训练泛化模型的时候,对于较好的声誉值给予更多的权重。在保护用户的隐私基础上,能够充分考虑到用户的个性化需求,根据声誉值分配权重进行建立联合模型,进而提高个性化推荐的效果。
附图说明
图1是传统联邦学习算法示意图。
图2是本发明传统联邦学习方法示意图。
图3是LSTM网络结构图。
图4是本地模型网络结构图。
图5是本发明流程图。
具体实施方式
本发明的一种基于联邦学习的个性化行为推荐方法,如图5所示,包括如下步骤:
步骤1,采集用户行为特征数据及对数据预处理;
步骤1.1,采集用户行为特征数据
收集不同地区用户的行为特征数据,所述的特征数据写成向量形式为X={x1,x2,x3,…,x24,x25}.其中x1表示用户的发型特征;x2表示用户的左眼动作特征;x3表示用户的右眼动作特征;x4表示用户的嘴部动作特征;x5表示用户的脖子左右动作特征;x6表示用户的脖子前后动作特征;x7表示用户的胸部动作特征;x8表示用户的左肩膀动作特征;x9表示用户的右肩膀动作特征;x10表示用户的左手臂动作特征;x11表示用户的右手臂动作特征;x12表示用户的左手手势动作特征;x13表示用户的右手手势动作特征;x14表示用户的臀部特征;x15表示用户的左膝盖动作特征;x16表示用户的右膝盖动作特征;x17表示用户的左脚动作特征;x18表示用户的右脚动作特征;x19表示用户参与活动的时长;x20表示用户的时装特征;x21表示用户的年龄特征;x22表示用户的性别;x23表示用户的肤色特征;x24表示用户的身高特征;x25表示用户的体重特征。其中,特征向量x1到x18均为运动特征节点。
步骤1.2,根据用户行为特征数据划分本地客户端
根据用户行为特征数据中的肤色特征和年龄特征划分本地客户端,肤色特征分为黄色、白色和黑色,以区分不同人种,肤色的划分依据在液晶屏上设定色阈,进行自动划分;
年龄特征分为儿童f1(16岁以下)、青少年f2(16岁-28岁)、壮年f3(28岁到45岁)、中年f4(45岁到65岁)和老年f5(65岁以上),至此可以划分出十五个本地客户端;
步骤1.3,将用户行为特征数据分为训练集D1、测试集D2和验证集D2,基中训练集D1和测试集D2用于训练和测试本地模型,验证集D3在服务器端,其用来进行验证服务器端模型的准确率。
步骤1.4,对用户行为特征数据进行标准化处理
理论上用户行为特征数据不统一,差值较大,因而这些数据需要进行归一化处理。
一般而言,当深度学习算法的输入端数据接近于“0”平均值时,学习效率最佳。对于采集的用户行为特征数据采用最大值最小值标准化,将数据映射到[0,1]之间,标准化函数如下:
Figure GDA0003514178750000081
其中Xt是t时刻未标准化的用户行为特征向量,Xmax是用户行为特征向量最大值,Xmin是用户行为特征向量最小值,
Figure GDA0003514178750000082
是t时刻的标准化后的用户行为特征向量的结果。
步骤1.5,将标准化后的用户行为特征数据构建为特征矩阵。
将标准化后的用户行为特征数据构建为特征矩阵Pt
Pt=[(x1,y1),(x2,y2),(x3,y3),…(x24,y24),(x25,y25)]
其中,特征矩阵Pt中前18组特征数据均为运动特征关节节点坐标,第19-25特征数据中的y值均采用0填补。
特征矩阵Pt具体可写为,
Pt=[(x1,y1),(x2,y2),(x3,y3),…(x18,y18),(x19,0),…(x25,0)]
步骤2,在本地客户端建立本地模型,如图4所示,本地模型的网络结构包括指针卷积模块、LSTM网络模块、卷积模块、特征融合模块和全连接层。
预处理后的用户特征数据输入到本地模型中,指针卷积模块对所述用户特征数据进行分类,分为时序特征矩阵和非时序特征矩阵,其中时序特征数据输入到LSTM网络,进行时间点关键特征提取,得到时序特征数据模块;非时序特征数据输入到卷积模块进行特征提取,得到非时序特征数据模块,将卷积提取的非时许特征模块和LSTM网络提取的时序特征模块经特征融合模块进行特征拼接融合,输出至全连接层,建立本地模型。
具体的,本地模型数据处理步骤如下:
步骤2.1,指针卷积模块对所述用户特征矩阵进行分类;分为时序特征矩阵和非时序特征矩阵。
特征矩阵Pt中(x19,0),…(x25,0)与时序的信息关联度不大,在训练网络模型时,为了减少计算量本发明设置了指针卷积模块,采用1*1的卷积核,利用指针操作,选出特征矩阵Pt中前18个坐标,特征矩阵Pt变为新的特征矩阵P′t即P′t=[(x1,y1),(x2,y2),(x3,y3),…(x18,y18)],将CNN提取出来的信息,当作单独的特征信息进行保留,指针卷积输出两类特征矩阵,包括时序特征矩阵和非时序特征矩阵。
假设卷积核大小为1*1,步长为1,d为1时,即填充“0”权值个数为0,则卷积公式如下:
Figure GDA0003514178750000091
步骤2.2,将时序特征矩阵输入到LSTM网络进行特征提取,时序特征数据输入到LSTM网络,进行时间点关键特征提取,得到时序特征数据模块;非时序特征数据输入到卷积模块进行特征提取,得到非时序特征数据模块。
如图3所示,将时序特征矩阵输入到LSTM网络,基于时序的动作推荐需要充分利用时间和其他参数之间的相关性。LSTM解决了传统的循环神经网络的梯度消失和梯度爆炸的问题,能够保留更久的时间信息。附图4中t时刻的输入信息包括当前输入值P′t,P′t为t时刻的输入到LSTM网络中的数据,上一时刻LSTM网络的输出值ht-1。LSTM网络提供了遗忘门ft、输入门it和输出门Ot。输入门it主要用于控制当前时刻信息的流入量,见公式(3):
it=σ(Wii·Pt+bii+Wiiht-1+bii) (3)
其中σ(·)为sigmoid激活函数,Wii为输入门输入值权重参数,bii为输入门输入值偏置。
遗忘门ft用于控制上一时刻累积的历史信息Ct-1的流入量,见公式(4):
ft=σ(Wif·Pt+bif+Whfht-1+bhf) (4)
其中σ(·)表示sigmod激活函数,Wif为遗忘门当前时刻输入值的权重参数,Whf为遗忘门上一时刻输入值的权重参数,bif为遗忘门当前时刻输入值的偏置,bhf为遗忘门上一时刻输入值的偏置。输出门Ot主要用于控制当前时刻信息的流出量,见公式(5):
Ot=σ(WioPt+bio+Whoht-1+bho) (5)
其中σ(·)表示sigmod激活函数,Wio为输出门当前时刻输入值的权重参数,Who为输出门上一时刻输入值的权重参数,bio为输出门当前时刻输入值的偏置,bh0为输出门上一时刻输入值的偏置。gt代表当前时刻信息的更新值,它由上一时刻的输出值ht-1和当前时刻的输入值Pt决定,见公式(6):
gt=tanh(WigPt+big+Whght-1+bhg) (6)
其中tanh(·)为激活函数,Wig为输入门当前时刻更新值的权重参数,big为输入门当前时刻更新值的偏置,Whg为输出值与当前时刻更新值的权重参数,bhg输出值与当前时刻更新值的偏置。
Ct表示隐藏层单元携带的信息,类似于细胞的状态。它是由输入门和遗忘门控制,每一时刻都在更新并直接决定当前输出。当前时刻输出值ht是由输出门Ot对Ct进行筛选后得到的输出结果,见公式(7)和(8):
Ct=ft*Ct-1+it*gt (7)
ht=Ot*tanhCt (8)
LSTM网络的输出数据维度可以自行设置,假设输出的数据维度与输入维度相同。
非时序特征数据输入到卷积模块进行特征提取,得到非时序特征数据模块。
步骤2.3,模型融合
将卷积模块的特征提取和LSTM网络提取的特征进行融合,并输入到全连接层,利用各自的训练集D1和测试集D2进行本地模型训练,完成本地模型构建,定义本地模型参数为wlocals
步骤3,基于服务器端与客户端用户的互动,在联邦学习算法中加入双重主观逻辑模型,用于量化本地模型的声誉值,最终将训练好的模型参数及其声誉值上传至服务器上。如图1所示是传统联邦学习算法的示意图,如图2所示是本发明联邦学习算法的示意图。具体包括如下步骤:
步骤3.1,服务器端对本地模型进行聚合,并下发推荐模型以及该推荐模型的声誉值到本地客户端,本地客户端将推荐模型的声誉值与当前本地模型的声誉值对比,若声誉值相同,则当前客户端不改变声誉值大小;
若声誉值不同,根据公式(9)的形式发送给本地客户端的边缘节点,边缘节点更新推荐模型的声誉值。
Figure GDA0003514178750000111
其中f→ei表示客户端f向边缘节点ei发送请求信息;q(·)为函数,time是时间戳,sig是数据请求用户的签名,H(Evi)函数是对请求数据做哈希运算,
Figure GDA0003514178750000112
为可能参与的客户端f向边缘节点ei发送请求信息。边缘节点选择声誉值高的模型数据推荐给数据请求用户。
具体的,声誉值包括直接声誉值和间接声誉值,计算方法如下:
步骤3.1.1直接声誉值的计算方法
边缘节点ei对服务器端ηj的直接声誉值通过声誉矢量来表示公式(10):
Figure GDA0003514178750000113
其中
Figure GDA0003514178750000114
代表边缘节点ei对服务器端ηj的信任度,
Figure GDA0003514178750000115
代表边缘节点ei对服务器端ηj的不信任度,
Figure GDA0003514178750000116
代表边缘节点ei对服务器端ηj的不确定度。且三个系数取值范围在0到1之间,满足下面的公式(11):
Figure GDA0003514178750000121
基于主观逻辑模型,得到公式(12):
Figure GDA0003514178750000122
这里的α,β各自代表边缘节点ei对服务器端ηj是每次任务中交互的积极事件和消极事件次数。
Figure GDA0003514178750000123
为成功传输数据模型参数的概率,即在无线网络中的通信质量决定了边缘节点数对服务器端ηj候选某类行为特征的不确定度。
结合主观逻辑模型的矢量值,可以得到直接声誉值为公式(13):
Figure GDA0003514178750000124
μ指的是不确定度对声誉值影响的相对系数,
Figure GDA0003514178750000125
为直接声誉值。
考虑到实际情况中,很多因素会影响边缘节点对候选某类行为特征的声誉值。因此,本申请的模型中考虑了双方交互时效的影响和正负交互因素的影响。为了减少自私节点或者恶意节点的攻击,增加消极交互事件对声誉值影响的权重,即
Figure GDA0003514178750000126
θ是参与联邦学习的某类行为特征正确传输模型参数后,与边缘节点完成积极交互的权重系数。
Figure GDA0003514178750000127
是消极交互的权重系数。则声誉值公式更新为下面的公式:
Figure GDA0003514178750000128
随着时间的推移,参与数据共享的某类行为特征不可能总是高度可信的,由于无线网络和不确定性因素的存在,所以在模型中考虑了交互时效性影响因子。定义时效衰落函数来描述时间对声誉的影响(15):
t(γ)=FZ-z,F∈(0,1) (15)
其中F是交互新鲜度的衰退参数,z∈(0,Z]是决定交互新鲜度的时隙。Z表示交互总时间。
根据时效衰落函数将一段时间γ内的直接声誉值公式更新为公式(16):
Figure GDA0003514178750000131
则时间段γ内的直接声誉为式(17):
Figure GDA0003514178750000132
即时间段γ内某一时隙的直接声誉值为公式(18):
Figure GDA0003514178750000133
3.1.2间接声誉值的计算
间接声誉值是由其他数据请求用户对数据提供用户形成的,在现实的无线移动网络中,作为提供视频软件的数据提供用户不会只服务一个任务。所以,每一个任务都会有一个数据请求用户对应多个数据提供用户。随着时间的推移,一个数据提供用户完成了与多个数据请求用户之间的交互,当有新的任务发布时,当前数据请求用户就从其他数据请求用户那里获取他们对数据提供用户的声誉值。每个数据请求用户对数据提供用户的声誉值都会用公式(10)中的声誉矢量来表示。为了衡量其他请求者提供的间接声誉值的重要性,利用下式来计算其他数据请求用户的间接声誉值的权重因子,见公式(19):
Figure GDA0003514178750000134
其他数据请求用户ey∈E,E是其他数据请求用户的集合且有公式(20):
Figure GDA0003514178750000135
式(20)为其他边缘节点ey对服务器端ηj的熟悉度,意味着其他边缘节点ey与服务器端ηj的交互越频繁,则
Figure GDA0003514178750000136
越大。在间接意见处考虑熟悉度参数,使边缘节点ei获得对服务器端ηj可靠性更高的声誉计算结果。其他边缘节点ey对服务器端ηj的间接声誉值通过矢量表示为公式(21):
Figure GDA0003514178750000141
根据主观逻辑模型,形成的间接声誉值为公式(22):
Figure GDA0003514178750000142
3.1.3声誉值的计算
为了及时查询核对参与数据共享过程中节点的声誉值,所以每一个边缘节点都会有一个本地声誉存储池,根据交互历史存储对各个客户端的边缘节点的直接声誉值。同时为了避免其他数据请求者作弊,要结合间接意见和直接声誉值形成对数据提供用户最终的声誉值。最终的声誉值表示为公式(23):
Figure GDA0003514178750000143
因此,边缘节点ey更新对ηj的最终声誉综合值为公式(24):
Figure GDA0003514178750000144
在上述步骤中进行声誉计算后,当声誉综合值大于预先定义的阈值时,边缘节点ei选择具有高精度和可靠数据的高声誉候选服务器端ηj作为联邦学习任务的模型培训工人。每一个边缘节点都有义务在更新其对各服务器端的声誉值后,将声誉值上传到区块链上以作为其他数据请求者的参考意见。这种方案能挑选出了可靠性高且具有高精度数据的候选某类行为特征。于此同时我们根据上述步骤计算出负的声誉值
Figure GDA0003514178750000145
计算方法和步骤同步骤3.1.1-3-1.3,这里依据用户不喜欢的操作进行声誉值打分。
在交互过程中再利用双重主观逻辑模型计算候选某种视频的声誉,最终将某种视频的声誉值和训练的模型参数上传至服务器上
为了激励高质量的数据贡献者积极参与联邦学习,联合训练某类行为特征开发者还利用区块链技术准确无误的为高质量的数据贡献者支付奖励。激励机制不是本申请重点,不展开详细阐述。
步骤3.2,鉴于Recall的评价标准,将声誉值的计算结果进行百分制计算,则t-recall的公式如下:
Figure GDA0003514178750000151
其中
Figure GDA0003514178750000152
为综合声誉值得分,
Figure GDA0003514178750000153
为负的综合声誉值。
步骤3.3,本地模型达到设定的声誉值评分时,声誉值设置为70分,将基于CNN+LSTM网络的联合训练模型聚合到服务器端聚合,聚合完成后再返回给各个本地客户端,操作流程如附图2。
本发明的方法可用于申请号为202121739511.7的液晶屏智能展示系统,在播放舞蹈视频时,大家一起随动作模板进行舞蹈动作。采用了本发明方法的液晶屏智能展示系统同时可以用于反向从他们的动作中学习个性化内容,然后在同一组行为序列中,聚合依据不同人员特征从而带有动作个性化的动作模板,提高其适应性。

Claims (6)

1.一种基于联邦学习的个性化行为推荐方法,其特征在于,包括如下步骤:
步骤1,采集用户行为特征数据,对用户行为特征数据进行分类,并根据用户行为特征数据的类别划分本地客户端;
对用户行为特征数据进行标准化处理,再将标准化处理后的用户行为特征数据构建成特征矩阵形式;
步骤2,在本地客户端建立本地模型;
本地模型的网络结构包括指针卷积模块、LSTM网络模块、卷积模块、特征融合模块和全连接层;
指针卷积模块对所述用户行为特征数据进行分类,分为时序特征矩阵和非时序特征矩阵,其中时序特征数据输入到LSTM网络,进行时间点关键特征提取,得到时序特征数据模块;非时序特征数据输入到卷积模块进行特征提取,得到非时序特征数据模块,将卷积提取的非时序特征模块和LSTM网络提取的时序特征模块经特征融合模块进行特征拼接融合,输出至全连接层,建立本地模型;
步骤3,基于服务器端与客户端用户的互动,在联邦学习算法中加入双重主观逻辑模型,量化本地模型的声誉值,最终将训练好的模型参数及其声誉值上传至服务器上;
双重主观逻辑模型是指服务器端对本地模型进行聚合,并下发推荐模型以及该推荐模型的声誉值到本地客户端,本地客户端将推荐模型的声誉值与当前本地模型的声誉值对比,若声誉值相同,则当前客户端不改变声誉值大小;
若声誉值不同,根据公式9的形式发送给本地客户端的边缘节点,边缘节点更新推荐模型的声誉值;
Figure FDA0003518107890000011
其中f→ei表示客户端f向边缘节点ei发送请求信息;q(·)为函数,time是时间戳,sig是数据请求用户的签名,H(Evi)函数是对请求数据做哈希运算,
Figure FDA0003518107890000012
为可能参与的客户端f向边缘节点ei发送请求信息;边缘节点选择声誉值高的模型数据推荐给数据请求用户;
在交互过程中再利用双重主观逻辑模型计算推荐模型的声誉值,最终将推荐模型的声誉值和推荐模型参数上传至服务器上。
2.根据权利要求1所述一种基于联邦学习的个性化行为推荐方法,其特征在于,将用户行为特征数据按肤色和年龄段进行划分,并依此划分客户端。
3.根据权利要求1或2所述一种基于联邦学习的个性化行为推荐方法,其特征在于,步骤1中对用户行为特征数据进行标准化处理,具体过程为;
采用标准化函数将用户行为特征数据映射到[0,1]之间;
标准化函数如下:
Figure FDA0003518107890000021
其中Xt是t时刻未标准化的用户行为特征向量,Xmax是用户行为特征向量最大值,Xmin是用户行为特征向量最小值,
Figure FDA0003518107890000022
是t时刻的标准化后的用户行为特征向量的结果。
4.根据权利要求1或2所述一种基于联邦学习的个性化行为推荐方法,其特征在于,步骤1中将标准化处理后的用户行为特征数据构建成特征矩阵形式,具体为:
将标准化后的用户行为特征数据构建为特征矩阵Pt
Pt=[(x1,y1),(x2,y2),(x3,y3),…(x18,y18),(x19,0),…(x25,0)]
其中,特征矩阵Pt中前18组特征数据均为用户运动特征关节节点坐标,x19表示用户参与活动的时长;x20表示用户的时装特征;x21表示用户的年龄特征;x22表示用户的性别;x23表示用户的肤色特征;x24表示用户的身高特征;x25表示用户的体重特征。
5.根据权利要求1所述一种基于联邦学习的个性化行为推荐方法,其特征在于,步骤3中采用双重主观逻辑模型量化本地模型的声誉值,声誉值包括直接声誉值和间接声誉值,计算方法如下:
步骤3.1.1直接声誉值的计算方法
边缘节点ei对服务器端ηj的直接声誉值通过声誉矢量来表示公式(10):
Figure FDA0003518107890000023
其中
Figure FDA0003518107890000024
代表边缘节点ei对服务器端ηj的信任度,
Figure FDA0003518107890000025
代表边缘节点ei对服务器端ηj的不信任度,
Figure FDA0003518107890000026
代表边缘节点ei对服务器端ηj的不确定度;且三个系数取值范围在0到1之间,满足下面的公式(11):
Figure FDA0003518107890000027
基于主观逻辑模型,得到公式(12):
Figure FDA0003518107890000031
这里的α,β各自代表边缘节点ei对服务器端ηj是每次任务中交互的积极事件和消极事件次数;
Figure FDA0003518107890000032
为成功传输数据模型参数的概率,即在无线网络中的通信质量决定了边缘节点数对候选某类行为特征的不确定度;
结合主观逻辑模型的矢量值,得到直接声誉值为公式(13):
Figure FDA0003518107890000033
μ指的是不确定度对声誉值影响的相对系数,
Figure FDA0003518107890000034
为直接声誉值;
为了减少自私节点或者恶意节点的攻击,增加消极交互事件对声誉值影响的权重,即
Figure FDA0003518107890000035
θ是参与联邦学习的某类行为特征正确传输模型参数后,与边缘节点完成积极交互的权重系数;
Figure FDA0003518107890000036
是消极交互的权重系数;则直接声誉值公式更新为下面的公式:
Figure FDA0003518107890000037
在模型中考虑了交互时效性影响因子;定义时效衰落函数来描述时间对声誉的影响(15):
t(γ)=FZ-z,F∈(0,1) (15)
其中F是交互新鲜度的衰退参数,z∈(0,Z]是决定交互新鲜度的时隙;Z表示交互总时间;
根据时效衰落函数将一段时间γ内的直接声誉值公式更新为公式(16):
Figure FDA0003518107890000041
则时间段γ内的直接声誉式为(17):
Figure FDA0003518107890000042
即时间段γ内某一时隙的直接声誉值为公式(18):
Figure FDA0003518107890000043
步骤3.1.2间接声誉值的计算
每个数据请求用户对数据提供用户的声誉值用公式(10)中的声誉矢量来表示;
为了衡量其他请求者提供的间接声誉值的重要性,利用下式来计算其他数据请求用户的间接声誉值的权重因子,见公式(19):
Figure FDA0003518107890000044
其他数据请求用户ey∈E,E是其他数据请求用户的集合且有公式(20):
Figure FDA0003518107890000045
式(20)为其他边缘节点ey对服务器端ηj的熟悉度,意味着其他边缘节点ey与服务器端ηj的交互越频繁,则
Figure FDA0003518107890000046
越大;在间接意见处考虑熟悉度参数,使边缘节点ei获得对服务器端ηj可靠性更高的声誉计算结果;其他边缘节点ey对服务器端ηj的间接声誉值通过矢量表示为公式(21):
Figure FDA0003518107890000047
根据主观逻辑模型,形成的间接声誉值为公式(22):
Figure FDA0003518107890000051
步骤3.1.3,声誉值的计算
结合间接声誉值和直接声誉值形成对数据提供用户最终的声誉值;最终的声誉值表示为公式(23):
Figure FDA0003518107890000052
因此,边缘节点ey更新对服务器端ηj的最终声誉综合值为公式(24):
Figure FDA0003518107890000053
6.根据权利要求1所述一种基于联邦学习的个性化行为推荐方法,其特征在于,步骤3中还包括鉴于Recall的评价标准,将声誉值的计算结果进行百分制计算,本地模型达到设定的声誉值评分时,将其聚合到服务器端聚合,聚合完成后再返回给各个本地客户端;
recall的公式如下:
Figure FDA0003518107890000054
其中
Figure FDA0003518107890000055
为综合声誉值得分,
Figure FDA0003518107890000056
为负的综合声誉值。
CN202111638487.2A 2021-12-30 2021-12-30 一种基于联邦学习的个性化行为推荐方法 Active CN114003821B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111638487.2A CN114003821B (zh) 2021-12-30 2021-12-30 一种基于联邦学习的个性化行为推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111638487.2A CN114003821B (zh) 2021-12-30 2021-12-30 一种基于联邦学习的个性化行为推荐方法

Publications (2)

Publication Number Publication Date
CN114003821A CN114003821A (zh) 2022-02-01
CN114003821B true CN114003821B (zh) 2022-05-13

Family

ID=79932478

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111638487.2A Active CN114003821B (zh) 2021-12-30 2021-12-30 一种基于联邦学习的个性化行为推荐方法

Country Status (1)

Country Link
CN (1) CN114003821B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115600219B (zh) * 2022-12-15 2023-03-14 湖南工商大学 候选任务工作者声誉值的确定方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020147965A1 (en) * 2019-01-18 2020-07-23 Huawei Technologies Co., Ltd. Enhanced privacy federated learning system
CN111866954A (zh) * 2020-07-21 2020-10-30 重庆邮电大学 一种基于联邦学习的用户选择和资源分配方法
CN111966698A (zh) * 2020-07-03 2020-11-20 华南师范大学 一种基于区块链的可信联邦学习方法、系统、装置及介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020147965A1 (en) * 2019-01-18 2020-07-23 Huawei Technologies Co., Ltd. Enhanced privacy federated learning system
CN111966698A (zh) * 2020-07-03 2020-11-20 华南师范大学 一种基于区块链的可信联邦学习方法、系统、装置及介质
CN111866954A (zh) * 2020-07-21 2020-10-30 重庆邮电大学 一种基于联邦学习的用户选择和资源分配方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Federated Learning of User Verification ModelsWithout Sharing Embeddings;Hossein Hosseini 等;《arXiv》;20210707;第1页-第9页 *
面向用户隐私保护的联邦安全树算法;张君如 等;《CODEN JYIIDU》;20201010;第40卷(第10期);第2980页-第2985页 *

Also Published As

Publication number Publication date
CN114003821A (zh) 2022-02-01

Similar Documents

Publication Publication Date Title
US11896888B2 (en) Systems, devices, and methods employing the same for enhancing audience engagement in a competition or performance
US20230084466A1 (en) Multimedia resource classification and recommendation
US20190104197A1 (en) Discovering signature of electronic social networks
CN103530540B (zh) 基于人机交互行为特征的用户身份属性检测方法
CN109241440A (zh) 一种基于深度学习的面向隐式反馈推荐方法
CN110807150A (zh) 信息处理方法及装置、电子设备和计算机可读存储介质
CN109902912B (zh) 一种基于性格特征的个性化图像美学评价方法
KR102510023B1 (ko) 사용자의 행동 데이터 또는 입력 데이터를 이용하여 사용자의 심리 상태를 판별하는 방법 및 컴퓨터 프로그램
CN113283948B (zh) 预测模型的生成方法、装置、设备和可读介质
TW202040517A (zh) 產生模擬使用者的三維臉部模型的方法及裝置
JPWO2019116658A1 (ja) 情報処理装置、情報処理方法、およびプログラム
CN114003821B (zh) 一种基于联邦学习的个性化行为推荐方法
WO2023284516A1 (zh) 基于知识图谱的信息推荐方法、装置、设备、介质及产品
CN112116589A (zh) 虚拟形象的评测方法、装置、设备及计算机可读存储介质
CN116701706B (zh) 一种基于人工智能的数据处理方法、装置、设备及介质
Zhong A convolutional neural network based online teaching method using edge-cloud computing platform
CN114528490A (zh) 一种基于用户长短期兴趣的自监督序列推荐方法
CN110147497B (zh) 一种面向青少年群体的个性化内容推荐方法
Aydin et al. Using machine learning techniques to predict esthetic features of buildings
CN113327212A (zh) 人脸驱动、模型的训练方法、装置、电子设备及存储介质
Goree et al. Correct for whom? subjectivity and the evaluation of personalized image aesthetics assessment models
CN114692098B (zh) 基于区块链和联邦学习的软件行为智能管控方法
CN113761784A (zh) 数据处理方法、数据处理模型的训练方法及装置
CN112749332A (zh) 数据处理方法、装置以及计算机可读介质
CN106682204B (zh) 一种基于众包的语义提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant