CN114625976A - 一种基于联邦学习的数据推荐方法、装置、设备及介质 - Google Patents

一种基于联邦学习的数据推荐方法、装置、设备及介质 Download PDF

Info

Publication number
CN114625976A
CN114625976A CN202210527021.3A CN202210527021A CN114625976A CN 114625976 A CN114625976 A CN 114625976A CN 202210527021 A CN202210527021 A CN 202210527021A CN 114625976 A CN114625976 A CN 114625976A
Authority
CN
China
Prior art keywords
recommendation
data
training
recommendation model
aggregation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210527021.3A
Other languages
English (en)
Other versions
CN114625976B (zh
Inventor
邢家辉
黄毓桦
李宫怀
谢浩龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Hongbo Information Technology Co ltd
Original Assignee
Shenzhen Hongbo Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Hongbo Information Technology Co ltd filed Critical Shenzhen Hongbo Information Technology Co ltd
Priority to CN202210527021.3A priority Critical patent/CN114625976B/zh
Publication of CN114625976A publication Critical patent/CN114625976A/zh
Application granted granted Critical
Publication of CN114625976B publication Critical patent/CN114625976B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据处理领域,揭露一种基于联邦学习的数据推荐方法,所述方法包括:获取多个本地客户端的本地数据,利用每个本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型;将多个训练模型同态加密后上传至中央服务器,通过中央服务器对训练推荐模型进行梯度聚合,得到聚合推荐模型,将聚合推荐模型加密后分发给每个本地客户端;利用每个本地客户端对加密后的聚合推荐模型进行解密,得到多个解密推荐模型,通过解密推荐模型,更新训练推荐模型的推荐参数,得到更新训练推荐模型;根据更新训练推荐模型,将待推荐数据推荐至本地客户端中的终端用户。本发明可以提高数据推荐的安全性。

Description

一种基于联邦学习的数据推荐方法、装置、设备及介质
技术领域
本发明涉及数据处理领域,尤其涉及一种基于联邦学习的数据推荐方法、装置、电子设备以及存储介质。
背景技术
数据推荐是指通过分析用户的历史记录了解用户的喜好,从而主动为用户推荐其感兴趣的数据信息的一个过程,通过数据推荐可以满足用户的个性化推荐需求。
目前,数据推荐方法主要是协同过滤算法实现,即通过分析用户的历史行为数据实现数据推荐,但通过这样的方法容易存在将用户历史行为数据暴露的现象,从而使得用户数据被窃取,使得数据推荐的安全性不高。
发明内容
为了解决上述问题,本发明提供了一种基于联邦学习的数据推荐方法、装置、电子设备以及计算机可读存储介质,可以保障数据推荐的安全性。
第一方面,本发明提供了一种基于联邦学习的数据推荐方法,包括:
获取多个本地客户端的本地数据,利用每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型;
将所述多个训练模型同态加密后上传至所述中央服务器,通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,将所述聚合推荐模型加密后分发给每个所述本地客户端;
利用每个所述本地客户端对加密后的所述聚合推荐模型进行解密,得到多个解密推荐模型,通过所述解密推荐模型,更新所述训练推荐模型的推荐参数,得到更新训练推荐模型;
根据所述更新训练推荐模型,将待推荐数据推荐至所述本地客户端中的终端用户。
在第一方面的一种可能实现方式中,所述利用每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型,包括:
提取所述本地数据中的用户行为特征;
分析所述用户行为特征中的行为偏好特征,通过所述行为偏好特征,生成偏好搜索参数;
根据所述偏好搜索参数,更新所述预先在中央服务器中构建的数据推荐模型的推荐参数,得到所述训练推荐模型。
在第一方面的一种可能实现方式中,所述将所述多个训练模型同态加密后上传至所述中央服务器,包括:
利用同态加密算法对所述本地数据进行数据加密,得到加密数据;
获取所述加密数据对应本地客户端的第一配置文件,及所述中央服务器的第二配置文件;
根据所述第一配置文件和所述第二配置文件,构建所述本地客户端和所述中央服务器的数据传输通道,根据所述数据传输通道,将所述加密数据上传所述中央服务器。
在第一方面的一种可能实现方式中,所述通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,包括:
在所述中央服务器中搭建所述训练推荐模型的安全计算环境;
在所述安全计算环境下通过梯度聚合函数对所述训练推荐模型进行梯度聚合计算,得到所述聚合推荐模型。
在第一方面的一种可能实现方式中,所述梯度聚合函数包括:
Figure 100002_DEST_PATH_IMAGE001
其中
Figure 947672DEST_PATH_IMAGE002
表示所述聚合推荐模型,M表示参与联合建模的数据持有方的数量,ω表示训练推荐模型的当前参数,
Figure 279296DEST_PATH_IMAGE003
表示均方差函数。
在第一方面的一种可能实现方式中,所述将所述聚合推荐模型加密后分发给每个所述本地客户端,包括:
利用联邦线性算法对所述聚合推荐模型进行数据加密,得到线性加密数据;
根据所述聚合推荐模型与每个所述本地客户端的数据传输通道,将所述线性加密数据传输给每个所述本地客户端。
在第一方面的一种可能实现方式中,所述联邦线性算法包括:
W=
Figure 861587DEST_PATH_IMAGE004
其中,w表示线性加密数据,u表示所述聚合推荐模型的参数,
Figure 878828DEST_PATH_IMAGE005
表示所述聚合推荐模型的特征,
Figure 899874DEST_PATH_IMAGE006
表示聚合推荐模型的标签,N表示数据的数量,
Figure 430212DEST_PATH_IMAGE007
表示模型损失函数。
第二方面,本发明提供了一种基于联邦学习的数据推荐装置,所述装置包括:
模型训练模块,用于获取多个本地客户端的本地数据,利用每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型;
模型梯度聚合模块,用于将所述多个训练模型同态加密后上传至所述中央服务器,通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,将所述聚合推荐模型加密后分发给每个所述本地客户端;
模型更新模块,用于利用每个所述本地客户端对加密后的所述聚合推荐模型进行解密,得到多个解密推荐模型,通过所述解密推荐模型,更新所述训练推荐模型的推荐参数,得到更新训练推荐模型;
数据推荐模块,用于根据所述更新训练推荐模型,将待推荐数据推荐至所述本地客户端中的终端用户。
第三方面,本发明提供一种电子设备,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,以使所述至少一个处理器能够执行如上述第一方面中任意一项所述的基于联邦学习的数据推荐方法。
第四方面,本发明提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任意一项所述的基于联邦学习的数据推荐方法。
与现有技术相比,本方案的技术原理及有益效果在于:
本发明实施例首先通过每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型,可以通过本地数据训练获取多个所述训练推荐模型;其次,本发明实施例通过将所述多个训练模型同态加密后上传至所述中央服务器,通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,将所述聚合推荐模型加密后分发给每个所述本地客户端,可以通过所述中央服务器对所述训练推荐模型进行处理计算得到聚合推荐模型,使得模型推荐功能更加精准,同时加密分发给每个所述本地客户端同样增加数据隐私性;进一步地,本发明实施例通过每个所述本地客户端对加密后的所述聚合推荐模型进行解密,得到多个解密推荐模型,通过所述解密推荐模型,更新所述训练推荐模型的推荐参数,得到更新训练推荐模型,可以通过所述解密推荐模型更改所述训练推荐模型推荐参数从而提高所述训练推荐模型的推荐效率和推荐安全性,最后根据所述更新训练推荐模型,将待推荐数据推荐至所述本地客户端中的终端用户提高数据推荐效率。因此,本发明实施例提出的一种基于联邦学习的数据推荐方法、装置、电子设备以及计算机可读存储介质,可以提高数据推荐的安全性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种基于联邦学习的数据推荐方法的流程示意图;
图2为本发明一实施例中图1提供的一种基于联邦学习的数据推荐方法的其中一个步骤的流程示意图;
图3为本发明一实施例中图1提供的一种基于联邦学习的数据推荐方法的另外一个步骤的流程示意图;
图4为本发明一实施例提供的一种基于联邦学习的数据推荐装置的模块示意图;
图5为本发明一实施例提供的实现基于联邦学习的数据推荐方法的电子设备的内部结构示意图。
具体实施方式
应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供一种基于联邦学习的数据推荐方法,所述基于联邦学习的数据推荐方法的执行主体包括但不限于服务端、终端等能够被配置为执行本发明实施例提供的该方法的电子设备中的至少一种。换言之,所述基于联邦学习的数据推荐方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参阅图1所示,是本发明一实施例提供的基于联邦学习的数据推荐方法的流程示意图。其中,图1中描述的基于联邦学习的数据推荐方法包括:
S1、获取多个本地客户端的本地数据,利用每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型。
本发明实施例中,所述本地数据是指所述本地客户端对应服务器中存储的数据;例如京东商城服务器中存储的所有商品、商店、客户信息。所述中央服务器是指用来收集所述本地客户端数据,并通过计算将计算结果反馈给所述本地客户端,来达到训练所述本地客户端推荐模型的第三方服务器。
作为本发明的一个实施例,参阅图2所示,所述利用每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型,包括:
S201、提取所述本地数据中的用户行为特征;
S202、分析所述用户行为特征中的行为偏好特征,通过所述行为偏好特征,生成偏好搜索参数;
S203、根据所述偏好搜索参数,更新所述预先在中央服务器中构建的数据推荐模型的推荐参数,得到所述训练推荐模型。
其中,所述用户行为是指所述客户端用户在日常使用客户端时操作记录,例如所述客户端用户购买商品、阅读文章等,所述用户行为特征是指通过所述用户行为分析出所述本地客户端用户经常做的动作,例如,所述客户端用户多次购买苹果、多次浏览球鞋等,所述偏好搜索参数是指用来匹配用所述本地客户端用户的偏好信息所设置的搜索参数。
S2、将所述多个训练模型同态加密后上传至所述中央服务器,通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,将所述聚合推荐模型加密后分发给每个所述本地客户端。
本发明实施例通过将所述训练模型同态加密上传至所述多个本地客户端对应的中央服务器,可以有效地对数据进行隐私保护的同时将数据上传给所述中央服务器。
作为本发明的一个实施例,所述将所述多个训练模型同态加密后上传至所述中央服务器,包括:利用同态加密算法对所述本地数据进行数据加密,得到加密数据;获取所述加密数据对应本地客户端的第一配置文件,及所述中央服务器的第二配置文件,根据所述第一配置文件和所述第二配置文件,构建所述本地客户端和所述中央服务器的数据传输通道,根据所述数据传输通道,将所述加密数据上传所述中央服务器。
其中所述加密数据是指对所述本地数据进行加密处理后的数据;配置文件:IP、端口、地址等
进一步地,本发明一可选实施例中,所述同态加密算法,包括:
f(En(m1),En(m2),…,En(mk))=En(f(m1,m2,…,mk))
其中,f(En(m1),En(m2),…,En(mk))表示加密数据,f(m1,m2,…,mk)表示本地数据,En表示加密运算函数。
进一步地,本发明实施例通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,所述中央服务器可以更新出新的推荐模型从而提高信息推荐的准确性。其中,所述聚合推荐模型是指所述中央服务器通过收集的多个所述训练推荐模型进行聚合计算更新出的新的信息推荐模型。
作为本发明的一个实施例,参阅图3所示,所述通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,包括:
S301、在所述中央服务器中搭建所述训练推荐模型的安全计算环境;
S302、在所述安全计算环境下通过梯度聚合函数对所述训练推荐模型进行梯度聚合计算,得到所述聚合推荐模型。
进一步地,本发明一可选实施例中,所述梯度聚合函数,包括:
Figure 573618DEST_PATH_IMAGE001
其中
Figure 454986DEST_PATH_IMAGE002
表示所述聚合推荐模型,M表示参与联合建模的数据持有方的数量,ω表示训练推荐模型的当前参数
Figure 76460DEST_PATH_IMAGE003
表示均方差函数。
进一步地,本发明实施例通过将所述聚合推荐模型加密后分发给每个所述本地客户端,通过加密可以有效保护数据隐私,进而可以保障后续数据推荐的安全性。
作为本发明的一个实施例,所述将所述聚合推荐模型加密后分发给每个所述本地客户端,包括:利用联邦线性算法对所述聚合推荐模型进行数据加密,得到线性加密数据;根据所述聚合推荐模型与每个所述本地客户端的数据传输通道,将所述线性加密数据传输给每个所述本地客户端。
其中,所述线性加密数据是指对所述聚合推荐模型进行加密后的数据。
进一步地,本发明一可选实施例中,所述联邦线性算法包括:
W=
Figure 726884DEST_PATH_IMAGE004
其中,w表示线性加密数据,u表示所述聚合推荐模型的参数,
Figure 11497DEST_PATH_IMAGE005
表示所述聚合推荐模型的特征,
Figure 380162DEST_PATH_IMAGE006
表示聚合推荐模型的标签,N表示数据的数量,
Figure 743010DEST_PATH_IMAGE007
表示模型损失函数。
S3、利用每个所述本地客户端对加密后的所述聚合推荐模型进行解密,得到多个解密推荐模型,通过所述解密推荐模型,更新所述训练推荐模型的推荐参数,得到更新训练推荐模型。
本发明实施例通过利用每个所述本地客户端对加密后的所述聚合推荐模型进行解密,可以保证隐私数据的同时得到了所述中央服务器更新后的信息推荐模型参数;其中,所述解密推荐模型是指对加密后的所述聚合推荐模型进行解密得到的模型数据。
作为本发明的一个实施例,所述利用每个所述本地客户端对加密后的所述聚合推荐模型进行解密,得到多个解密推荐模型,包括:获取每个所述本地客户端的加密公钥及解密私钥;根据所述加密公钥及所述解密私钥,计算加密后的所述聚合推荐模型的密文参数;根据所述密文参数,对所述加密后的所述聚合推荐模型进行解密,得到所述解密推荐模型;
其中,所述加密公钥及所述解密私钥指的是公开的密钥及不公开所述客户端私有的密钥;所述密文参数是指通过计算后得到用来进行解密计算的数据参数。
进一步地,本发明实施例通过所述解密推荐模型,更新所述训练推荐模型的推荐参数,得到更新训练推荐模型并根据所述信息推荐模型参数对所述训练推荐模型进行更新达到更好的信息推荐效果。其中,所述推荐参数是指所述训练推荐模型中用来计算推荐信息的数据,例如浏览量、点击率、搜率次数等数据。
作为本发明的一个实施例,所述通过所述解密推荐模型,更新所述训练推荐模型的推荐参数,得到更新训练推荐模型,包括:获取所述解密推荐模型的解密推荐参数;对所述解密进行数据整理,得到整理推荐参数;根据所述整理推荐参数对所述训练推荐模型的推荐参数进行更新,得到所述更新训练推荐模型。
其中所述解密推荐参数是指所述聚合推荐模型中用来计算推荐信息的数据参数,所述整理推荐参数是指对所述解密推荐参数进行一系列向数据归纳、数据删除等操作得到的数据。
进一步地,本发明一可选实施例中,对所述解密进行数据整理,得到整理推荐参数可以通过MATLAB数据处理工具完成。
S4、根据所述更新训练推荐模型,将待推荐数据推荐至所述本地客户端中的终端用户。
本发明实施例通过根据所述更新训练推荐模型,将待推荐数据推荐至所述本地客户端中的终端用户,可以更加准确的推荐用户感兴趣的信息;其中,所述待推荐数据是指通过所述更新训练推荐模型计算得到准备给用户推荐的信息。
作为本发明的一个实施例,所述根据所述更新训练推荐模型,将待推荐数据推荐至所述本地客户端中的终端用户,包括:利用所述更新训练推荐模型获取所述终端用户的用户地址;利用所述更新训练推荐模型通过所述用户地址建立用来传输数据的虚拟连接;通过所述虚拟连接,将所述待推荐数据推荐至所述本地客户端中的终端用户。
其中,所述用户地址是指所述终端用户ip位置;所述虚拟连接是指用来向所述终端用户传输数据的通道。
进一步地,本发明一可选实施例中,所述利用所述更新训练推荐模型通过所述用户地址建立用来传输数据的虚拟连接可以通过Java消息服务(JMS)技术实现。
可以看出,本发明实施例首先通过每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型,可以通过本地数据训练获取多个所述训练推荐模型;其次,本发明实施例通过将所述多个训练模型同态加密后上传至所述中央服务器,通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,将所述聚合推荐模型加密后分发给每个所述本地客户端,可以通过所述中央服务器对所述训练推荐模型进行处理计算得到聚合推荐模型,使得模型推荐功能更加精准,同时加密分发给每个所述本地客户端同样增加数据隐私性;进一步地,本发明实施例通过每个所述本地客户端对加密后的所述聚合推荐模型进行解密,得到多个解密推荐模型,通过所述解密推荐模型,更新所述训练推荐模型的推荐参数,得到更新训练推荐模型,可以通过所述解密推荐模型更改所述训练推荐模型推荐参数从而提高所述训练推荐模型的推荐效率和推荐安全性,最后根据所述更新训练推荐模型,将待推荐数据推荐至所述本地客户端中的终端用户提高数据推荐效率。因此,本发明实施例提出的一种基于联邦学习的数据推荐方法可以提高数据推荐的安全性。
如图4所示,是本发明基于联邦学习的数据推荐装置功能模块图。
本发明所述基于联邦学习的数据推荐装置400可以安装于电子设备中。根据实现的功能,所述基于联邦学习的数据推荐装置可以包括模型训练模块401、模型梯度聚合模块402、模型更新模块403以及数据推荐模块404。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本发明实施例中,关于各模块/单元的功能如下:
所述模型训练模块401,用于获取多个本地客户端的本地数据,利用每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型;
所述模型梯度聚合模块402,用于将所述多个训练模型同态加密后上传至所述中央服务器,通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,将所述聚合推荐模型加密后分发给每个所述本地客户端;
所述模型更新模块403,用于利用每个所述本地客户端对加密后的所述聚合推荐模型进行解密,得到多个解密推荐模型,通过所述解密推荐模型,更新所述训练推荐模型的推荐参数,得到更新训练推荐模型;
所述数据推荐模块404,用于根据所述更新训练推荐模型,将待推荐数据推荐至所述本地客户端中的终端用户。
详细地,本发明实施例中所述基于联邦学习的数据推荐装置400中的所述各模块在使用时采用与上述的图1至图3中所述的基于联邦学习的数据推荐方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图5所示,是本发明实现基于联邦学习的数据推荐方法的电子设备的结构示意图。
所述电子设备可以包括处理器50、存储器51、通信总线52以及通信接口53,还可以包括存储在所述存储器51中并可在所述处理器50上运行的计算机程序,如基于联邦学习的数据推荐程序。
其中,所述处理器50在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器50是所述电子设备的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器51内的程序或者模块(例如执行基于联邦学习的数据推荐程序等),以及调用存储在所述存储器51内的数据,以执行电子设备的各种功能和处理数据。
所述存储器51至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器51在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器51在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card, SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器51不仅可以用于存储安装于电子设备的应用软件及各类数据,例如数据库配置化连接程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述通信总线52可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器51以及至少一个处理器50等之间的连接通信。
所述通信接口53用于上述电子设备5与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,所述用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
图5仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图5示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器50逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利发明范围上并不受此结构的限制。
所述电子设备中的所述存储器51存储的数据库配置化连接程序是多个计算机程序的组合,在所述处理器50中运行时,可以实现:
获取多个本地客户端的本地数据,利用每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型;
将所述多个训练模型同态加密后上传至所述中央服务器,通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,将所述聚合推荐模型加密后分发给每个所述本地客户端;
利用每个所述本地客户端对加密后的所述聚合推荐模型进行解密,得到多个解密推荐模型,通过所述解密推荐模型,更新所述训练推荐模型的推荐参数,得到更新训练推荐模型;
根据所述更新训练推荐模型,将待推荐数据推荐至所述本地客户端中的终端用户。
具体地,所述处理器50对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个非易失性计算机可读取存储介质中。所述存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取多个本地客户端的本地数据,利用每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型;
将所述多个训练模型同态加密后上传至所述中央服务器,通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,将所述聚合推荐模型加密后分发给每个所述本地客户端;
利用每个所述本地客户端对加密后的所述聚合推荐模型进行解密,得到多个解密推荐模型,通过所述解密推荐模型,更新所述训练推荐模型的推荐参数,得到更新训练推荐模型;
根据所述更新训练推荐模型,将待推荐数据推荐至所述本地客户端中的终端用户。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于联邦学习的数据推荐方法,其特征在于,所述方法包括:
获取多个本地客户端的本地数据,利用每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型;
将所述多个训练模型同态加密后上传至所述中央服务器,通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,将所述聚合推荐模型加密后分发给每个所述本地客户端;
利用每个所述本地客户端对加密后的所述聚合推荐模型进行解密,得到多个解密推荐模型,通过所述解密推荐模型,更新所述训练推荐模型的推荐参数,得到更新训练推荐模型;
根据所述更新训练推荐模型,将待推荐数据推荐至所述本地客户端中的终端用户。
2.根据权利要求1所述的方法,其特征在于,所述利用每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型,包括:
提取所述本地数据中的用户行为特征;
分析所述用户行为特征中的行为偏好特征,通过所述行为偏好特征,生成偏好搜索参数;
根据所述偏好搜索参数,更新所述预先在中央服务器中构建的数据推荐模型的推荐参数,得到所述训练推荐模型。
3.根据权利要求1所述的方法,其特征在于,所述将所述多个训练模型同态加密后上传至所述中央服务器,包括:
利用同态加密算法对所述本地数据进行数据加密,得到加密数据;
获取所述加密数据对应本地客户端的第一配置文件,及所述中央服务器的第二配置文件;
根据所述第一配置文件和所述第二配置文件,构建所述本地客户端和所述中央服务器的数据传输通道,根据所述数据传输通道,将所述加密数据上传所述中央服务器。
4.根据权利要求1所述的方法,其特征在于,所述通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,包括:
在所述中央服务器中搭建所述训练推荐模型的安全计算环境;
在所述安全计算环境下通过梯度聚合函数对所述训练推荐模型进行梯度聚合计算,得到所述聚合推荐模型。
5.根据权利要求4所述的方法,其特征在于,所述梯度聚合函数包括:
Figure DEST_PATH_IMAGE001
其中
Figure 828864DEST_PATH_IMAGE002
表示所述聚合推荐模型,M表示参与联合建模的数据持有方的数量,ω表示训练推荐模型的当前参数,
Figure 372978DEST_PATH_IMAGE003
表示均方差函数。
6.根据权利要求1所述的方法,其特征在于,所述将所述聚合推荐模型加密后分发给每个所述本地客户端,包括:
利用联邦线性算法对所述聚合推荐模型进行数据加密,得到线性加密数据;
根据所述聚合推荐模型与每个所述本地客户端的数据传输通道,将所述线性加密数据传输给每个所述本地客户端。
7.根据权利要求6中所述的方法,其特征在于,所述联邦线性算法包括:
W=
Figure 989904DEST_PATH_IMAGE004
其中,w表示线性加密数据,u表示所述聚合推荐模型的参数,
Figure 437328DEST_PATH_IMAGE005
表示所述聚合推荐模型的特征,
Figure 176614DEST_PATH_IMAGE006
表示聚合推荐模型的标签,N表示数据的数量,
Figure 348969DEST_PATH_IMAGE007
表示模型损失函数。
8.一种基于联邦学习的数据推荐方法装置,其特征在于,所述装置包括:
模型训练模块,用于获取多个本地客户端的本地数据,利用每个所述本地数据对预先在中央服务器中构建的数据推荐模型进行训练,得到多个训练推荐模型;
模型梯度聚合模块,用于将所述多个训练模型同态加密后上传至所述中央服务器,通过所述中央服务器对所述训练推荐模型进行梯度聚合,得到聚合推荐模型,将所述聚合推荐模型加密后分发给每个所述本地客户端;
模型更新模块,用于利用每个所述本地客户端对加密后的所述聚合推荐模型进行解密,得到多个解密推荐模型,通过所述解密推荐模型,更新所述训练推荐模型的推荐参数,得到更新训练推荐模型;
数据推荐模块,用于根据所述更新训练推荐模型,将待推荐数据推荐至所述本地客户端中的终端用户。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的基于联邦学习的数据推荐方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的基于联邦学习的数据推荐方法。
CN202210527021.3A 2022-05-16 2022-05-16 一种基于联邦学习的数据推荐方法、装置、设备及介质 Active CN114625976B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210527021.3A CN114625976B (zh) 2022-05-16 2022-05-16 一种基于联邦学习的数据推荐方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210527021.3A CN114625976B (zh) 2022-05-16 2022-05-16 一种基于联邦学习的数据推荐方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN114625976A true CN114625976A (zh) 2022-06-14
CN114625976B CN114625976B (zh) 2022-12-09

Family

ID=81907247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210527021.3A Active CN114625976B (zh) 2022-05-16 2022-05-16 一种基于联邦学习的数据推荐方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114625976B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114782176A (zh) * 2022-06-23 2022-07-22 浙江数秦科技有限公司 一种基于联邦学习的信贷业务推荐方法
CN115238065A (zh) * 2022-09-22 2022-10-25 太极计算机股份有限公司 一种基于联邦学习的公文智能推荐方法
CN117493662A (zh) * 2023-10-09 2024-02-02 上海及未科技有限公司 一种基于联邦学习的个性化推荐方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378049A (zh) * 2021-06-10 2021-09-10 平安科技(深圳)有限公司 信息推荐模型的训练方法、装置、电子设备及存储介质
CN113420232A (zh) * 2021-06-02 2021-09-21 杭州电子科技大学 一种面向隐私保护的图神经网络联邦推荐方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420232A (zh) * 2021-06-02 2021-09-21 杭州电子科技大学 一种面向隐私保护的图神经网络联邦推荐方法
CN113378049A (zh) * 2021-06-10 2021-09-10 平安科技(深圳)有限公司 信息推荐模型的训练方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王健宗等: "联邦学习算法综述", 《大数据》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114782176A (zh) * 2022-06-23 2022-07-22 浙江数秦科技有限公司 一种基于联邦学习的信贷业务推荐方法
CN114782176B (zh) * 2022-06-23 2022-10-25 浙江数秦科技有限公司 一种基于联邦学习的信贷业务推荐方法
CN115238065A (zh) * 2022-09-22 2022-10-25 太极计算机股份有限公司 一种基于联邦学习的公文智能推荐方法
CN115238065B (zh) * 2022-09-22 2022-12-20 太极计算机股份有限公司 一种基于联邦学习的公文智能推荐方法
CN117493662A (zh) * 2023-10-09 2024-02-02 上海及未科技有限公司 一种基于联邦学习的个性化推荐方法和系统

Also Published As

Publication number Publication date
CN114625976B (zh) 2022-12-09

Similar Documents

Publication Publication Date Title
CN114625976B (zh) 一种基于联邦学习的数据推荐方法、装置、设备及介质
US11399079B2 (en) Zero-knowledge environment based networking engine
US10333909B2 (en) Methods and systems for broadcasting targeted advertisements to mobile device
WO2021208695A1 (zh) 目标物推荐方法、装置、电子设备及计算机可读存储介质
CN110909383A (zh) 一种电子发票管理方法、装置及电子设备和存储介质
EP3195179A1 (en) Apparatus and methods for data matching and anonymization
US10929870B1 (en) Advertisement impression verification using blockchain
CN114389889B (zh) 基于区块链技术的文件全生命周期管理方法及装置
CN114826553A (zh) 一种群签名和同态加密的云存储数据安全保护方法及装置
CN115758399A (zh) 基于医联网的智慧医疗信息管理方法、装置、设备及介质
CN114417374A (zh) 基于区块链的智能合约名片方法、装置、设备及存储介质
CN108347629A (zh) 视频文件处理方法、装置、服务器及存储介质
CN107005576A (zh) 从服务器日志生成用于链接标识符的桥接匹配标识符
CN113806776A (zh) 基于区块链的医疗档案查询方法、装置、电子设备及介质
CN112217639B (zh) 数据的加密共享方法、装置、电子设备及计算机存储介质
CN115643090A (zh) 基于隐私检索的纵向联邦分析方法、装置、设备及介质
WO2022116422A1 (zh) 产品推荐方法、装置、电子设备及计算机可读存储介质
CN112286703B (zh) 用户分类方法、装置、客户端设备及可读存储介质
CN113792323A (zh) 一种基于农产品的敏感数据加密方法、装置及电子设备
CN114298211A (zh) 特征分箱方法、装置、电子设备及存储介质
CN112182598A (zh) 公有样本id识别方法、装置、服务器及可读存储介质
CN111260415A (zh) 广告推荐方法、装置
CN116684077B (zh) 一种基于碳平台的碳排放监测方法及装置
CN113434365B (zh) 数据特征监控方法、装置、电子设备及存储介质
JP2019046261A (ja) 管理装置、管理方法、及び管理プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant