CN112416986A - 基于分层个性化联邦学习的用户画像实现方法及系统 - Google Patents

基于分层个性化联邦学习的用户画像实现方法及系统 Download PDF

Info

Publication number
CN112416986A
CN112416986A CN202011320485.4A CN202011320485A CN112416986A CN 112416986 A CN112416986 A CN 112416986A CN 202011320485 A CN202011320485 A CN 202011320485A CN 112416986 A CN112416986 A CN 112416986A
Authority
CN
China
Prior art keywords
user
model
emb
client
global
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011320485.4A
Other languages
English (en)
Other versions
CN112416986B (zh
Inventor
刘淇
陈恩红
吴金泽
黄振亚
易津锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202011320485.4A priority Critical patent/CN112416986B/zh
Publication of CN112416986A publication Critical patent/CN112416986A/zh
Application granted granted Critical
Publication of CN112416986B publication Critical patent/CN112416986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于分层个性化联邦学习的用户画像实现方法及系统,针对不同客户端的用户数据,各个客户端独自使用一个用户模型建模用户特质,对用户进行建模。客户端分成分地将用户模型提交给服务器,并实现敏感信息的隐藏。服务器分成分地加权各个模型的参数,得到全局用户模型。最终客户端结合全局用户模型更新局部用户模型以更好的利用各个不一致的客户端的数据信息和模型,并且保持数据隐私,最终更加准确的追踪建模用户特质。弥补了现有方法泄露隐私信息,不适应不一致客户端等弊端。

Description

基于分层个性化联邦学习的用户画像实现方法及系统
技术领域
本发明涉及用户画像技术领域,尤其涉及一种基于分层个性化联邦学习的用户画像实现方法及系统。
背景技术
用户画像是一个重要的基础性工作,其目的在于帮助研究人员利用个人数据获取有用的潜在特征。用户画像已经应用于多个典型的任务,为具有各种需求的用户提供适当的用户模型,例如用户的能力或偏好。例如,在教育系统中,用户画像在认知诊断任务中辅助建模学生能力,而在电子商务的推荐系统中,用户画像负责建模客户的偏好。
一般情况下,用户画像是一个使用集中的数据进行集中培训的过程,这会导致隐私泄露。针对这一困境,联邦用户画像因其具有安全的分布式用户画像的潜力而受到广泛关注。它旨在基于隔离的私有数据建立和聚合用户模型,以保持数据的隐私性。
然而,目前的联邦学习框架是为一致的客户端设计的,在实际的用户画像场景中,不可避免的会遇到不一致的客户端。因此,联邦用户画像面临着客户端不一致的困境。
1)统计异质性。与传统场景中假设的数据为独立同分布的不同,用于用户画像的个人记录通常是非独立同分布的,这导致在客户端之间存在统计差异和个性化。基于一致的全局模型训练客户端的本地模型,不可避免地消除了客户端的个性化,降低了描述用户特征的能力。因此,需要对用户模型的个性化信息进行整合,以适应统计异质性。
2)隐私异质性。根据相关研究,不同的数据信息具有不同程度的隐私性。一方面,在联邦学习的过程中,轻率地共享表示会带来隐私暴露的风险。另一方面,为了保护隐私而丢弃敏感信息会导致信息的丢失。因此,应该灵活地对隐私异构的信息应用专门的联邦学习设置,以便在用户模型之间平衡需要保护或共享的信息。
3)模型异质性。主流的联邦学习方法期望建立一个通用的全局模型来建模所有的客户端。然而,在实际的用户画像应用程序中,由于私有数据的属性不同,不同客户端之间的用户模型结构往往不同。因此,在联邦学习中处理异构用户模型的策略也需要仔细设计。
联邦学习的主要思想是基于跨多个设备存储的数据构建机器学习模型,首先进行多个客户端本地模型的训练,在本地模型构建和训练过程中不涉及到其他客户端数据的交互。在本地模型聚合步骤,只涉及模型参数的传递和聚合。从而防止了数据泄漏,保护了数据隐私。从技术角度来看,现有的联邦学习算法主要分为,水平联邦学习,垂直联邦学习和联邦迁移学习三类。
然而,目前的联邦学习是基于客户端一致的假设提出的,并为所有客户端提供了一个统一的模型,这是脱离实际场景的。此外,上述方法还存在隐私泄露的风险,特别是当提交的模型包含敏感表示信息时,如用户模型中的用户表示。不幸的是,常用的隐私保护方法如差分隐私联邦学习,面临着保密性和准确性不能兼得的困境。因此,在实际应用中应用联邦学习仍然存在一些困难。
发明内容
本发明的目的是提供一种基于分层个性化联邦学习的用户画像实现方法及系统,考虑用户画像过程中用户客户端的不一致性,为多个客户端提供具有层次化信息(公开信息与私有信息)的个性化用户模型,产生的用户模型能够充分利用隔离的不一致的私密数据,较为准确合理的实现用户画像。
本发明的目的是通过以下技术方案实现的:
一种基于分层个性化联邦学习的用户画像实现方法,包括:
各客户端各自搜集内部的用户数据;
各客户端利用客户端内的所有用户数据,使用一个用户模型建模用户特质,并分成分的将模型参数发送至服务器;
服务器接收所有客户端发送的模型参数后,分成分的进行加权或者聚合处理,获得全局用户模型,并分成分的将全局模型参数分发至各客户端;
各客户端结合全局用户模型的参数更新本地用户模型的参数,并以此实现各用户的用户画像。
一种基于分层个性化联邦学习的用户画像系统,用于前述的方法,该系统包括:多个客户端与服务器;其中:
各客户端各自搜集内部的用户数据,之后,各客户端利用客户端内的所有用户数据,使用一个用户模型建模用户特质,并分成分的将模型参数发送至服务器;
服务器接收所有客户端发送的模型参数后,分成分的进行加权或者聚合处理,获得全局用户模型,并分成分的将全局模型参数分发至各客户端;
各客户端结合全局用户模型的参数更新本地用户模型的参数,并以此实现各用户的用户画像。
由上述本发明提供的技术方案可以看出,运用用户模型对本地用户的特质进行建模;最终服务器分成分地加权平均各个模型的参数,得到全局用户模型,进而更好的利用不一致客户端的私有数据,并且保持数据隐私,最终更加准确的建模用户,弥补了现有方法泄露隐私信息,难以适应不一致客户端的弊端。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种基于分层个性化联邦学习的用户画像实现方法的流程图;
图2为本发明实施例提供的一种基于分层个性化联邦学习的用户画像系统的示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种基于分层个性化联邦学习的用户画像实现方法,如图1所示,其主要包括:
步骤1、各客户端各自搜集内部的用户数据。
本发明实施例中,用户数据可以从Movielens或ASSITments获得,主要包括:项目、用户对项目反馈情况(即,交互结果)以及项目所涉及的属性。
本发明实施例中,确定了搜集数据的客户端范围,其中包含了|C|个隔离的客户端。对于一个客户端,包含Uc个用户以及Vc个项目,定义一个用户数据为一个三元组(u,v,g),其中,u表示用户信息(例如,用户ID),v表示项目信息,g表示对应的交互结果(训练阶段作为模型的预测目标),各项目均被预先标注为不同的属性,属性总数记为K。
在不同领域,上述信息的内容有所不同。在教育领域,项目、用户分别对应了试题和学生,交互结果是学生对试题的回答结果,项目所涉及的属性即试题的包含的知识点信息。另外,在电商推荐领域,项目、用户分别对应了商品和客户,交互结果是客户对商品的评价,项目所涉及的属性是商品的类别等信息。
步骤2、各客户端利用客户端内的所有用户数据,使用一个用户模型建模用户特质,并分成分的将模型参数发送至服务器。
本发明实施例中,每一客户端独自利用客户端内的用户数据,即对于|C|个隔离的客户端,各自利用客户端内的用户数据使用通用的用户模型进行建模,各客户端执行过程完全相同。各客户端使用的是通用的用户模型,虽然结构上是同构的,但是,由于各客户端所涉及的用户数据不同,最终用户模型的各项参数、维度都是不一致的。此外,基于本发明实施例的方案,客户端无需考虑是否一致的问题,客户端可以是一致的,也可以不一致,都不影响最终的实现。
本步骤主要包括两个部分:第一部分为构建本地用户画像模型,第二部分为分成分地将模型参数发送至服务器。具体来说:
1、构建本地用户画像模型。
各客户端,对于每一用户数据,首先进行独热编码,即对于三元组(u,v,g)的用户信息u与项目信息v分进行one-hot编码,获得用户的嵌入表示Embu和项目的嵌入表示Embv;并使用映射矩阵KMu、KMv对应的处理用户的嵌入表示Embu、项目的嵌入表示Embv,以得到用户表征、项目表征。
本发明实施例中,映射矩阵KMu、KMv各自由一系列的知识向量构成,通过随机初始化得到;两个映射矩阵的大小相同均为K*L,但是,矩阵含义是不同的。其中,K是指用户数据中项目的属性数目,一个属性对应一个知识向量;L为自定义的纬度值,L的数值可根据实际情况设定。例如,某个客户端中项目属性共有10个,维度设为5;则构建10*5的映射矩阵。
2、为分成分地将模型参数发送至服务器。
本发明实施例中,映射矩阵KMu与KMv作为公开成分直接发送至服务器。
所有用户及对应项目的嵌入表示均为私有成分,通过聚类操作后,产生的聚类中心作为一种被保护的私有成分(即一种模糊的私有成分表示)发送至服务器,实现了敏感信息的保护。
通过以上两部分,实现了客户端本地功能的设计,并将获得的信息传输给服务器。
步骤3、服务器接收所有客户端发送的模型参数后,分成分的进行加权或者聚合处理,获得全局用户模型,并分成分的将全局模型参数分发至各客户端。
如上个步骤的说明,服务器接收的模型参数包括公开成分与私有成分。
1)对于公开成分,服务器将所有客户端中同一属性的知识向量进行加权聚合,最终得到全局用户模型的公开成分;具体来说:按照所有客户端发送的映射矩阵的类型以及映射矩阵中知识向量对应的属性,进行知识向量的融合,并引用知识向量对应属性的迭代次数,以及各个客户端针对属性的本地验证准确性,得到全局知识向量,表示为:
Figure BDA0002792741270000051
其中,|C|表示客户端总数,i为客户端索引;
Figure BDA0002792741270000052
表示客户端i中针对属性k的知识向量,k=1,…,K;
Figure BDA0002792741270000053
表示客户端i中针对属性k的迭代次数,
Figure BDA0002792741270000054
表示客户端i中针对属性k的本地验证准确性;p为阈值,当
Figure BDA0002792741270000055
低于p时,
Figure BDA0002792741270000056
否则,
Figure BDA0002792741270000057
Figure BDA0002792741270000058
实现过滤掉比较差的参与者;
根据所有客户端发送的映射矩阵KMu与KMv,结合以上方式进行处理,获得各个映射矩阵中各属性的全局知识向量,由全局知识向量组成的两个映射矩阵即为全局用户模型的公开成分。
本发明实施例上述方案中,两类映射矩阵都是按照上述操作进行,因此,进行了统一的描述,上述描述所涉及的
Figure BDA0002792741270000059
可以是KMu的知识向量,也可以是KMv中的知识向量,对于所有客户端,采用上述公式计算时,所有
Figure BDA00027927412700000510
都应来自相同类型的映射矩阵。类似的,在各客户端进行后续映射矩阵更新时,客户端也使用来自服务器的相同类型映射矩阵的全局知识向量更新本地的相应映射矩阵。
2)对于私有成分,服务器通过聚类操作后,产生的聚类中心作为全局用户模型的私有成分。
步骤4、各客户端结合全局用户模型的参数更新本地用户模型的参数,并以此实现各用户的用户画像。
各客户端接收全局用户模型的参数包括:全局用户模型的公开成分与私有成分。
1)基于全局用户模型的公开成分,更新本地用户模型的公开成分,具体来说,客户端i对于每一映射矩阵,都基于本地测试准确度
Figure BDA0002792741270000061
并结合映射矩阵中的属性知识向量
Figure BDA0002792741270000062
和对应的全局属性知识
Figure BDA0002792741270000063
来加权更新知识向量,公式为:
Figure BDA0002792741270000064
其中,
Figure BDA0002792741270000065
分别为更新前、后客户端i中针对属性k的知识向量;
Figure BDA0002792741270000066
为客户端针对属性k的本地验证准确性,
Figure BDA0002792741270000067
为来自服务器的针对属性k的全局知识向量;
基于上述方式对映射矩阵KMu、KMv的知识向量进行更新,获得更新后的映射矩阵KMu′、KMv′。
2)基于全局用户模型的私有成分,客户端i基于距离加权全局用户模型的私有成分
Figure BDA0002792741270000068
和本地的嵌入表示Embj,i,更新过程表示为:
Figure BDA0002792741270000069
Emb′j,i=Embj,i×Acci+Embg×(1-Acci)
其中,N为全局用户模型的私有成分中聚类中心的数目,n与m均为聚类中心的索引,Acci是一个准确度向量,表示客户端i中每个属性的本地测试精度;Embg是针对嵌入表示计算得到的加权全局成分;Embj,i、Emb′j,i分别为更前、后的本地嵌入表示;Embj,i为更新前的用户的嵌入表示Embu或者项目的嵌入表示Embv,Emb′j,i为更新后的用户的嵌入表示Embu或者项目的嵌入表示Embv
通过上述方式,客户端完成公开成分与私有成分的更新,得到更新后的本地用户模型的参数;之后,可以利用更新后的本地用户模型的参数计算用户和项目特质的表征Ru与Rv
Ru=Embu·Embc T·KMu
Rv=Embv·Embc T·KMv
其中,Embc是项目属性的嵌入表示,具体来说,可以项目属性进行独热编码后,再通过一个K*K映射矩阵,获得的一个综合性的属性的嵌入表示;
再利用用户和项目特质的表征Ru与Rv,获得用户对项目的偏好信息,从而实现用户画像:
Puv=Ru-Rv
进一步来说,基于上述方案实现用户画像后,可以通过一个线性层对偏好信息Puv进行转换(可通过常规技术实现),从而实现交互结果的预测,例如:应用于教育系统,可以实现学生对试题的回答结果的预测(从而进一步预测学生成绩);应用于电子商务,可以对用户评价进行预测;在预测结果的基础上,可以得知用户的知识掌握情况、商品喜好,从而进行试题、商品的个性化推荐。
本发明实施例上述方案,针对不同客户端的用户数据,各个客户端独自使用一个用户模型建模用户特质,对用户进行建模。客户端分成分地将用户模型提交给服务器,并实现敏感信息的隐藏。服务器分成分地加权各个模型的参数,得到全局用户模型。最终客户端结合全局用户模型更新局部用户模型,以更好的利用各个不一致的客户端的数据信息和模型,并且保持数据隐私,最终更加准确的追踪建模用户特质。弥补了现有方法泄露隐私信息,不适应不一致客户端等弊端。
本发明另一实施例还提供一种基于分层个性化联邦学习的用户画像系统,该系统用于实现前述实施例提供的方法,如图2所示,该系统主要包括:多个客户端与服务器;其中:
各客户端各自搜集内部的用户数据,之后,各客户端利用客户端内的所有用户数据,使用一个用户模型建模用户特质,并分成分的将模型参数发送至服务器;
服务器接收所有客户端发送的模型参数后,分成分的进行加权或者聚合处理,获得全局用户模型,并分成分的将全局模型参数分发至各客户端;
各客户端结合全局用户模型的参数更新本地用户模型的参数,并以此实现各用户的用户画像。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (9)

1.一种基于分层个性化联邦学习的用户画像实现方法,其特征在于,包括:
各客户端各自搜集内部的用户数据;
各客户端利用客户端内的所有用户数据,使用一个用户模型建模用户特质,并分成分的将模型参数发送至服务器;
服务器接收所有客户端发送的模型参数后,分成分的进行加权或者聚合处理,获得全局用户模型,并分成分的将全局模型参数分发至各客户端;
各客户端结合全局用户模型的参数更新本地用户模型的参数,并以此实现各用户的用户画像。
2.根据权利要求1所述的一种基于分层个性化联邦学习的用户画像实现方法,其特征在于,对于一个客户端,包含Uc个用户以及Vc个项目,定义一个用户数据为一个三元组(u,v,g),其中,u表示用户信息,v表示项目信息,g表示对应的交互结果,各项目均被预先标注为不同的属性;应用于教育系统,项目信息为试题信息,项目属性为试题包含的知识点信息,交互结果为试题的回答结果;应用于电商推荐系统,项目信息为商品信息,项目属性为商品的类别信息,交互结果为商品的评价。
3.根据权利要求2所述的一种基于分层个性化联邦学习的用户画像实现方法,其特征在于,各客户端,对于每一用户数据,首先进行独热编码,获得用户的嵌入表示Embu和项目的嵌入表示Embv;并使用映射矩阵KMu、KMv对应的处理用户的嵌入表示Embu、项目的嵌入表示Embv,以得到用户表征、项目表征;其中,映射矩阵KMu、KMv各自由一系列的知识向量构成,通过随机初始化得到,大小均为K*L,K是指用户数据中项目的属性数目,一个属性对应一个知识向量,L为自定义的纬度值;
其中,映射矩阵KMu与KMv作为公开成分直接发送至服务器;所有用户及对应项目的嵌入表示均为私有成分,通过聚类操作后,产生的聚类中心作为一种被保护的私有成分发送至服务器。
4.根据权利要求3所述的一种基于分层个性化联邦学习的用户画像实现方法,其特征在于,服务器接收的模型参数包括公开成分与私有成分;
对于公开成分,服务器将所有客户端中同一属性的知识向量进行加权聚合,最终得到全局用户模型的公开成分;
对于私有成分,服务器通过聚类操作后,产生的聚类中心作为全局用户模型的私有成分。
5.根据权利要求4所述的一种基于分层个性化联邦学习的用户画像实现方法,其特征在于,服务器按照所有客户端发送的映射矩阵的类型以及映射矩阵中知识向量对应的属性,进行知识向量的融合,并引用知识向量对应属性的迭代次数,以及各个客户端针对属性的本地验证准确性,得到全局知识向量,表示为:
Figure FDA0002792741260000021
其中,|C|表示客户端总数,i为客户端索引;
Figure FDA0002792741260000022
表示客户端i中针对属性k的知识向量,k=1,...,K;
Figure FDA0002792741260000023
表示客户端i中针对属性k的迭代次数,
Figure FDA0002792741260000024
表示客户端i中针对属性k的本地验证准确性;p为阈值,当
Figure FDA0002792741260000025
低于p时,
Figure FDA0002792741260000026
否则,
Figure FDA0002792741260000027
Figure FDA0002792741260000028
根据所有客户端发送的映射矩阵KMu与KMv,结合以上方式进行处理,获得各个映射矩阵中各属性的全局知识向量,由全局知识向量组成的两个映射矩阵即为全局用户模型的公开成分。
6.根据权利要求3或5所述的一种基于分层个性化联邦学习的用户画像实现方法,其特征在于,各客户端接收全局用户模型的参数包括:全局用户模型的公开成分与私有成分;
客户端i对于每一映射矩阵,都基于本地测试准确度
Figure FDA0002792741260000029
并结合映射矩阵中的知识向量
Figure FDA00027927412600000210
和对应的全局属性知识
Figure FDA00027927412600000211
来加权更新知识向量,公式为:
Figure FDA00027927412600000212
其中,
Figure FDA00027927412600000213
分别为更新前、后客户端i中针对属性k的知识向量;
Figure FDA00027927412600000214
为客户端针对属性k的本地验证准确性,
Figure FDA00027927412600000215
为来自服务器的针对属性k的全局知识向量;
基于上述方式对映射矩阵KMu、KMv的知识向量进行更新,获得更新后的映射矩阵KMu′、KMv
基于全局用户模型的私有成分,客户端i基于距离加权全局用户模型的私有成分
Figure FDA00027927412600000216
和嵌入表示Embj,i,更新过程表示为:
Figure FDA00027927412600000217
Emb′j,i=Embj,i×Acci+Embg×(1-Acci)
其中,N为全局用户模型的私有成分中聚类中心的数目,n与m均为聚类中心的索引,Acci是一个准确度向量,表示客户端i中每个属性的本地测试精度;Embg是针对嵌入表示计算得到的加权全局成分;Embj,i、Emb′j,i分别为更前、后的本地嵌入表示;Embj,i为更新前的用户的嵌入表示Embu或者项目的嵌入表示Embv,Emb′j,i为更新后的用户的嵌入表示Embu或者项目的嵌入表示Embv
7.根据权利要求2或3或5所述的一种基于分层个性化联邦学习的用户画像实现方法,其特征在于,各客户端利用更新后的本地用户模型的参数计算用户和项目特质的表征Ru与Rv
Ru=Embu·Embc T·KMu
Rv=Embv·Embc T·KMv
其中,Embc是项目属性的嵌入表示;KMu′、KMv′各自对应为更新后的映射矩阵KMu、KMv,Embu、Embv各自对应为更新后的嵌入表示Embu、Embv
之后,利用用户和项目特质的表征Ru与Rv,获得用户对项目的偏好信息:
Puv=Ru-Rv
8.根据权利要求1或7所述的一种基于分层个性化联邦学习的用户画像实现方法,其特征在于,根据得到用户的偏好信息,为用户进行个性化推荐。
9.一种基于分层个性化联邦学习的用户画像系统,其特征在于,用于实现权利要求1~8任一项所述的方法,该系统包括:多个客户端与服务器;其中:
各客户端各自搜集内部的用户数据,之后,各客户端利用客户端内的所有用户数据,使用一个用户模型建模用户特质,并分成分的将模型参数发送至服务器;
服务器接收所有客户端发送的模型参数后,分成分的进行加权或者聚合处理,获得全局用户模型,并分成分的将全局模型参数分发至各客户端;
各客户端结合全局用户模型的参数更新本地用户模型的参数,并以此实现各用户的用户画像。
CN202011320485.4A 2020-11-23 2020-11-23 基于分层个性化联邦学习的用户画像实现方法及系统 Active CN112416986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011320485.4A CN112416986B (zh) 2020-11-23 2020-11-23 基于分层个性化联邦学习的用户画像实现方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011320485.4A CN112416986B (zh) 2020-11-23 2020-11-23 基于分层个性化联邦学习的用户画像实现方法及系统

Publications (2)

Publication Number Publication Date
CN112416986A true CN112416986A (zh) 2021-02-26
CN112416986B CN112416986B (zh) 2024-03-29

Family

ID=74777256

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011320485.4A Active CN112416986B (zh) 2020-11-23 2020-11-23 基于分层个性化联邦学习的用户画像实现方法及系统

Country Status (1)

Country Link
CN (1) CN112416986B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113872756A (zh) * 2021-09-16 2021-12-31 国科量子通信网络有限公司 基于联邦学习的量子保密通信服务画像实现方法
CN113919508A (zh) * 2021-10-15 2022-01-11 河南工业大学 一种基于移动式服务器的联邦学习系统及方法
CN114357526A (zh) * 2022-03-15 2022-04-15 中电云数智科技有限公司 抵御推断攻击的医疗诊断模型差分隐私联合训练方法
CN115587633A (zh) * 2022-11-07 2023-01-10 重庆邮电大学 一种基于参数分层的个性化联邦学习方法
CN116485281A (zh) * 2023-06-16 2023-07-25 国网信息通信产业集团有限公司 基于纵向联邦学习和知识图谱的员工画像方法及系统
CN116935143A (zh) * 2023-08-16 2023-10-24 中国人民解放军总医院 基于个性化联邦学习的dfu医学图像分类方法及系统
WO2024114640A1 (zh) * 2022-11-30 2024-06-06 北京航天数据股份有限公司 一种基于用户画像的用户服务系统、方法及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016054908A1 (zh) * 2014-10-10 2016-04-14 中兴通讯股份有限公司 基于物联网大数据平台的智能用户画像方法及装置
CN111461442A (zh) * 2020-04-07 2020-07-28 中国科学技术大学 基于联邦学习的知识追踪的方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016054908A1 (zh) * 2014-10-10 2016-04-14 中兴通讯股份有限公司 基于物联网大数据平台的智能用户画像方法及装置
CN111461442A (zh) * 2020-04-07 2020-07-28 中国科学技术大学 基于联邦学习的知识追踪的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈国润;母美荣;张蕊;孙丹;钱栋军;: "基于联邦学习的通信诈骗识别模型的实现", 电信科学, no. 1 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113872756A (zh) * 2021-09-16 2021-12-31 国科量子通信网络有限公司 基于联邦学习的量子保密通信服务画像实现方法
CN113919508A (zh) * 2021-10-15 2022-01-11 河南工业大学 一种基于移动式服务器的联邦学习系统及方法
CN113919508B (zh) * 2021-10-15 2022-07-19 河南工业大学 一种基于移动式服务器的联邦学习系统及方法
CN114357526A (zh) * 2022-03-15 2022-04-15 中电云数智科技有限公司 抵御推断攻击的医疗诊断模型差分隐私联合训练方法
CN115587633A (zh) * 2022-11-07 2023-01-10 重庆邮电大学 一种基于参数分层的个性化联邦学习方法
WO2024114640A1 (zh) * 2022-11-30 2024-06-06 北京航天数据股份有限公司 一种基于用户画像的用户服务系统、方法及电子设备
CN116485281A (zh) * 2023-06-16 2023-07-25 国网信息通信产业集团有限公司 基于纵向联邦学习和知识图谱的员工画像方法及系统
CN116935143A (zh) * 2023-08-16 2023-10-24 中国人民解放军总医院 基于个性化联邦学习的dfu医学图像分类方法及系统
CN116935143B (zh) * 2023-08-16 2024-05-07 中国人民解放军总医院 基于个性化联邦学习的dfu医学图像分类方法及系统

Also Published As

Publication number Publication date
CN112416986B (zh) 2024-03-29

Similar Documents

Publication Publication Date Title
CN112416986A (zh) 基于分层个性化联邦学习的用户画像实现方法及系统
Deveci et al. Personal mobility in metaverse with autonomous vehicles using Q-rung orthopair fuzzy sets based OPA-RAFSI model
CN112733967B (zh) 联邦学习的模型训练方法、装置、设备及存储介质
Imran et al. PLORS: a personalized learning object recommender system
CN111461442B (zh) 基于联邦学习的知识追踪的方法及系统
Bobadilla et al. Collaborative filtering adapted to recommender systems of e-learning
Wang et al. Attribute‐level and pattern‐level classification consistency and accuracy indices for cognitive diagnostic assessment
Weiss et al. AHP design issues for large‐scale systems
Sukhija et al. The recent state of educational data mining: A survey and future visions
Endozo et al. Teachers' experiences towards usage of Learning Management System: CANVAS
Yu et al. A user-based cross domain collaborative filtering algorithm based on a linear decomposition model
CN114429212A (zh) 智能学习知识能力跟踪方法、电子设备及存储介质
CN114372871A (zh) 信用评分值的确定方法及其装置、电子设备及存储介质
de Araújo et al. Applying computational intelligence techniques to improve the decision making of business game players
Lim et al. Predicting the influence of digital leadership on performance of private higher education institutions: Evidence from Malaysia
Reiser et al. A comparison of Bootstrap confidence intervals for multi-level longitudinal data using monte-carlo simulation
CN117094773A (zh) 基于区块链隐私计算的在线迁移学习方法及系统
CN116383504A (zh) 基于梯度混洗的信息推荐方法及相关设备
Masrom et al. Machine learning with task-technology fit theory factors for predicting students’ adoption in video-based learning
CN113158088A (zh) 一种基于图神经网络的位置推荐方法
CN102768751A (zh) 学习资源推送系统和方法
CN113158089B (zh) 一种社交网位置向量化建模方法
Bhavana et al. Model of using new media technology in higher education learning
Wang Research on Online Education Resources Recommendation Based on Deep Learning
US20240153025A1 (en) Student migration visualization tool

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant