CN114461994A - 联邦学习推荐系统、方法、存储介质及电子设备 - Google Patents

联邦学习推荐系统、方法、存储介质及电子设备 Download PDF

Info

Publication number
CN114461994A
CN114461994A CN202210111416.5A CN202210111416A CN114461994A CN 114461994 A CN114461994 A CN 114461994A CN 202210111416 A CN202210111416 A CN 202210111416A CN 114461994 A CN114461994 A CN 114461994A
Authority
CN
China
Prior art keywords
user
scoring matrix
user scoring
matrix
confused
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210111416.5A
Other languages
English (en)
Inventor
李晋杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhixing Technology Co Ltd
Original Assignee
Shenzhen Zhixing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhixing Technology Co Ltd filed Critical Shenzhen Zhixing Technology Co Ltd
Priority to CN202210111416.5A priority Critical patent/CN114461994A/zh
Publication of CN114461994A publication Critical patent/CN114461994A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/12Protecting executable software
    • G06F21/14Protecting executable software against software analysis or reverse engineering, e.g. by obfuscation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/70Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer
    • G06F21/71Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure computing or processing of information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种联邦学习推荐系统、方法、存储介质及电子设备。所述联邦学习推荐方法包括:通过混淆函数,将用户评分矩阵映射到混淆后用户评分矩阵,其中,所述用户评分矩阵的各个元素以二元化取值指示多个用户各自对多个商品是否分别做出评分;和利用所述混淆后用户评分矩阵生成联邦学习推荐结果,该联邦学习推荐结果与所述用户评分矩阵相关联。其中,所述混淆函数通过满足预设约束条件的优化得到,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素。如此在加强对用户隐私保护同时也具有较好的整体的计算效率和资源占用率。

Description

联邦学习推荐系统、方法、存储介质及电子设备
技术领域
本申请涉及机器学习技术领域,尤其涉及数据安全和隐私保护技术领域,具体涉及一种联邦学习推荐系统、方法、存储介质及电子设备。
背景技术
随着机器学习技术的发展,推荐系统(Recommender System,RS)以及相关的信息过滤、个性化推荐、协同过滤等技术取得了巨大的进步,并在例如电子商务、新闻、影视、餐饮、金融服务等各种行业获得了广泛应用。RS的基本原理是将用户的评分(也可以指的是偏好、打分、选择等能体现用户兴趣或需求的信息)发送给推荐服务器后由推荐服务器利用这些用户评分来提供个性化的服务,例如使用推荐算法或者特征信息匹配算法来找到用户可能感兴趣的或者用户可能会给出高评分的推荐对象。因此,RS的基本运作涉及到收集用户的评分以及可能还收集用户的购物记录、浏览历史等其它信息,并进行分析和预测。但是,这样收集的用户的评分以及其它信息,可能被用来推测用户的个人隐私例如用来推测用户的性别、年龄等。因此,RS在应用中往往还结合隐私保护技术来保护用户个人隐私,例如对用户的评分等数据进行加密后再上传给推荐服务器,又例如通过差分隐私(differentialprivacy,DP)技术降低识别出用户数据的概率。但是,对用户数据进行加密后再上传的方式需要额外的加密服务的提供者且带来巨大的通信和计算开销,而基于DP技术的方式则面临推理攻击的风险也就是存在被破解及泄露用户隐私的风险。其中,RS与联邦学习(federated learning,FL)技术的结合取得了较好的应用,也就是基于联邦学习技术的推荐系统或者叫做联邦学习推荐系统。其中,联邦学习矩阵分解(federated matrixfactorization,FedMF)结合了机器学习技术的矩阵分解算法和联邦学习技术,通过使得用户数据不出本地而是交换加密后中间结果来做到联合模型训练。
但是,FedMF以及相关的衍生技术,必然涉及到交换加密后中间结果例如交换加密后的梯度,而这样会面临推理攻击的风险,也就是说可能存在利用交换的加密后的梯度来破解并导致用户隐私被泄露的风险。其中一个原因是被交换的加密后梯度一般仅针对实际上被用户选择的事项,或者说,被交换的加密后梯度可用于推测用户的评分这样的隐私数据。但是现有的技术难以在确保用户隐私和避免过高的时间资源占用两者之间确定平衡。为此,需要一种联邦学习推荐系统、方法、存储介质及电子设备,不仅能够应对推理攻击的风险及保护用户隐私,而且能具有较低的资源占用和通信计算开销。
发明内容
第一方面,本申请实施例提供了一种联邦学习推荐方法。所述联邦学习推荐方法包括:通过混淆函数,将用户评分矩阵映射到混淆后用户评分矩阵,其中,所述用户评分矩阵的各个元素以二元化取值指示多个用户各自对多个商品是否分别做出评分;和利用所述混淆后用户评分矩阵生成联邦学习推荐结果,该联邦学习推荐结果与所述用户评分矩阵相关联。其中,所述混淆函数通过满足预设约束条件的优化得到,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素。
第一方面所描述的技术方案,通过基于所述用户评分矩阵和所述混淆后用户评分矩阵之间的差异来设计预设约束条件并且完成带有约束的优化,有利于在信息损失和计算效率之间达到较佳平衡点,从而在加强对用户隐私保护同时也具有较好的整体的计算效率和资源占用率,同时也利用混淆函数保存了用户评分矩阵自身的稀疏性特点从而有利于后续处理的简化。
根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素,包括:该预设约束条件包括第一约束条件和第二约束条件。该第一约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置的第一元素,该第一元素在所述用户评分矩阵上的二元化取值指示第一用户没有对第一商品做出评分,该第一元素在所述混淆后用户评分矩阵上的二元化取值指示该第一用户对该第一商品做出评分。该第二约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置的第二元素,该第二元素在所述用户评分矩阵上的二元化取值指示第二用户对第二商品做出评分,该第二元素在所述混淆后用户评分矩阵上的二元化取值指示该第二用户没有对该第二商品做出评分。
根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,该第一约束条件包括基于该第一元素的第一测度的数学期望值小于第一阈值,该第二约束条件包括基于该第二元素的第二测度的数学期望值小于第二阈值。
根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述混淆函数通过满足预设约束条件的优化得到,包括:所述混淆函数通过满足该第一约束条件和该第二约束条件的前提下最小化所述混淆后用户评分矩阵和隐私对象之间的互信息函数而得到。
根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述多个用户通过聚类算法划分为多个用户组,所述用户评分矩阵的各个元素以二元化取值指示所述多个用户组下的用户各自对多个商品是否分别做出评分。
根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素,包括:该预设约束条件基于第一测度和第二测度。所述第一测度基于所述用户评分矩阵上的第一元素和在所述混淆后用户评分矩阵上的与该第一元素具有相同位置的元素,该第一元素的二元化取值指示第一用户没有对第一商品做出评分,在所述混淆后用户评分矩阵上的与该第一元素具有相同位置的元素的二元化取值指示该第一用户对该第一商品做出评分。所述第二测度基于所述用户评分矩阵上的第二元素和在所述混淆后用户评分矩阵上的与该第二元素具有相同位置的元素,该第二元素的二元化取值指示第二用户对第二商品做出评分,在所述混淆后用户评分矩阵上的与该第二元素具有相同位置的元素的二元化取值指示该第二用户没有对该第二商品做出评分。
根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述混淆后用户评分矩阵被添加差分隐私DP噪声后利用不经意传输OT安全协议发送给服务器,该服务器用于生成所述联邦学习推荐结果。
根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述用户评分矩阵基于n个用户对m个商品做出的评分,其中n和m都是大于一的正整数。
根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述二元化取值包括0和1。
根据第一方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述联邦学习推荐方法用于电子商务、新闻、影视、餐饮或者金融服务行业。
第二方面,本申请实施例提供了一种非瞬时性计算机可读存储介质。所述计算机可读存储介质存储有计算机指令,该计算机指令被处理器执行时实现根据第一方面中任一项所述的方法。
第二方面所描述的技术方案,通过基于所述用户评分矩阵和所述混淆后用户评分矩阵之间的差异来设计预设约束条件并且完成带有约束的优化,有利于在信息损失和计算效率之间达到较佳平衡点,从而在加强对用户隐私保护同时也具有较好的整体的计算效率和资源占用率,同时也利用混淆函数保存了用户评分矩阵自身的稀疏性特点从而有利于后续处理的简化。
第三方面,本申请实施例提供了一种电子设备。所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器通过运行所述可执行指令以实现根据第一方面中任一项所述的方法。
第三方面所描述的技术方案,通过基于所述用户评分矩阵和所述混淆后用户评分矩阵之间的差异来设计预设约束条件并且完成带有约束的优化,有利于在信息损失和计算效率之间达到较佳平衡点,从而在加强对用户隐私保护同时也具有较好的整体的计算效率和资源占用率,同时也利用混淆函数保存了用户评分矩阵自身的稀疏性特点从而有利于后续处理的简化。
第四方面,本申请实施例提供了一种计算机程序。所述计算机程序通过被处理器执行从而使得所述处理器执行根据第一方面中任一项所述的方法。
第四方面所描述的技术方案,通过基于所述用户评分矩阵和所述混淆后用户评分矩阵之间的差异来设计预设约束条件并且完成带有约束的优化,有利于在信息损失和计算效率之间达到较佳平衡点,从而在加强对用户隐私保护同时也具有较好的整体的计算效率和资源占用率,同时也利用混淆函数保存了用户评分矩阵自身的稀疏性特点从而有利于后续处理的简化。
第五方面,本申请实施例提供了一种联邦学习推荐系统。所述联邦学习推荐系统应用于服务器,所述联邦学习推荐系统包括:接收模块,用于接收混淆后用户评分矩阵,其中,所述混淆后用户评分矩阵通过利用混淆函数将用户评分矩阵映射得到,其中,所述用户评分矩阵的各个元素以二元化取值指示多个用户各自对多个商品是否分别做出评分;和生成模块,用于利用所述混淆后用户评分矩阵生成联邦学习推荐结果,该联邦学习推荐结果与所述用户评分矩阵相关联。其中,所述混淆函数通过满足预设约束条件的优化得到,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素。
第五方面所描述的技术方案,通过基于所述用户评分矩阵和所述混淆后用户评分矩阵之间的差异来设计预设约束条件并且完成带有约束的优化,有利于在信息损失和计算效率之间达到较佳平衡点,从而在加强对用户隐私保护同时也具有较好的整体的计算效率和资源占用率,同时也利用混淆函数保存了用户评分矩阵自身的稀疏性特点从而有利于后续处理的简化。
根据第五方面的技术方案的一种可能的实现方式,本申请实施例还提供了,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素,包括:该预设约束条件包括第一约束条件和第二约束条件。该第一约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置的第一元素,该第一元素在所述用户评分矩阵上的二元化取值指示第一用户没有对第一商品做出评分,该第一元素在所述混淆后用户评分矩阵上的二元化取值指示该第一用户对该第一商品做出评分。该第二约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置的第二元素,该第二元素在所述用户评分矩阵上的二元化取值指示第二用户对第二商品做出评分,该第二元素在所述混淆后用户评分矩阵上的二元化取值指示该第二用户没有对该第二商品做出评分。
根据第五方面的技术方案的一种可能的实现方式,本申请实施例还提供了,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素,包括:该预设约束条件基于第一测度和第二测度。所述第一测度基于所述用户评分矩阵上的第一元素和在所述混淆后用户评分矩阵上的与该第一元素具有相同位置的元素,该第一元素的二元化取值指示第一用户没有对第一商品做出评分,在所述混淆后用户评分矩阵上的与该第一元素具有相同位置的元素的二元化取值指示该第一用户对该第一商品做出评分。所述第二测度基于所述用户评分矩阵上的第二元素和在所述混淆后用户评分矩阵上的与该第二元素具有相同位置的元素,该第二元素的二元化取值指示第二用户对第二商品做出评分,在所述混淆后用户评分矩阵上的与该第二元素具有相同位置的元素的二元化取值指示该第二用户没有对该第二商品做出评分。
根据第五方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述混淆后用户评分矩阵被添加差分隐私DP噪声后利用不经意传输OT安全协议发送给所述服务器。
根据第五方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述混淆后用户评分矩阵被添加差分隐私DP噪声后利用不经意传输OT安全协议发送给所述服务器。
根据第五方面的技术方案的一种可能的实现方式,本申请实施例还提供了,所述联邦学习推荐系统用于电子商务、新闻、影视、餐饮或者金融服务行业。
附图说明
为了说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1示出了本申请实施例提供的多个用户对多个商品做出评分的示意图。
图2示出了本申请实施例提供的联邦学习推荐方法的流程示意图。
图3示出了本申请实施例提供的用于图2所示的联邦学习推荐方法的电子设备的框图。
图4示出了本申请实施例提供的联邦学习推荐系统的框图。
具体实施方式
本申请实施例为了解决如何不仅能够应对推理攻击的风险及保护用户隐私而且能具有较低的资源占用和通信计算开销,这样的技术难题,提出了一种联邦学习推荐系统、方法、存储介质及电子设备。所述联邦学习推荐方法包括:通过混淆函数,将用户评分矩阵映射到混淆后用户评分矩阵,其中,所述用户评分矩阵的各个元素以二元化取值指示多个用户各自对多个商品是否分别做出评分;和利用所述混淆后用户评分矩阵生成联邦学习推荐结果,该联邦学习推荐结果与所述用户评分矩阵相关联。其中,所述混淆函数通过满足预设约束条件的优化得到,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素。本申请实施例具有以下有益技术效果:通过基于所述用户评分矩阵和所述混淆后用户评分矩阵之间的差异来设计预设约束条件并且完成带有约束的优化,有利于在信息损失和计算效率之间达到较佳平衡点,从而在加强对用户隐私保护同时也具有较好的整体的计算效率和资源占用率,同时也利用混淆函数保存了用户评分矩阵自身的稀疏性特点从而有利于后续处理的简化。
本申请实施例可用于以下应用场景,包括但是不限于,多方安全计算、与联邦学习有关的机器学习模型训练、数据安全、隐私保护或者应用隐私计算框架或算法的其它应用场景等。
本申请实施例可以依据具体应用环境进行调整和改进,此处不做具体限定。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请的实施例进行描述。
图1示出了本申请实施例提供的多个用户对多个商品做出评分的示意图。如图1所示,5个用户分别为用户1、用户2、用户3、用户4和用户5,对6个商品分别做出评分。这6个商品分别为商品1、商品2、商品3、商品4、商品5和商品6。这里,某个用户对某个商品的评分以0或者1来表示,其中1表示该用户对该商品做出了评分,而0表示该用户对该商品没有做出评分。也就是说,图1所示的评分以0和1的二元化方式来体现某个用户是否对某个商品做出了评分。但是用户对商品做出的具体评分值是可以根据实际需要调整的。例如以百分制为满分对商品打分,用户可以给商品打分80分或者70分,但是这两个打分都会在图1中体现为1。图1仅示意性示出了用户是否做出过评分,而并不涉及具体的评分内容。另外,图1所示的用户对商品评分的情况,可以适用于RS在各行业的应用,例如对餐饮、金融服务或者保险服务做出的评价,又例如在电子商务上购买过商品的记录等。通过图1可知,不同用户对不同的商品的评分情况具有较高的复杂度,如果设有n个用户对m个商品做出评分,则所有的可能组合有n乘以2的m次幂种可能的组合,也就是说复杂度是n乘以2的m次幂。上面提到,FedMF以及相关的衍生技术必然涉及到交换加密后中间结果例如交换加密后的梯度。这里,如果仅将用户实际上做出过评分的商品的相关梯度进行加密后上传,则可以有利于后续处理降低计算复杂度。以图1为例,用户1仅对商品1和商品2做出评分,而对其它的商品3、商品4、商品5和商品6都未做出过评分。如果仅对用户1对商品1和商品2做出的评分的相关梯度(例如对评分内容或者打分值进行协同训练或应用而涉及到的相关中间参数如梯度)进行加密后上传,也就是仅对用户做出过评分的商品的相关梯度或中间参数进行加密后上传,则可以节省有关的通信和计算开销,但是这样选择性加密及上传部分中间参数的做法容易招致推理攻击。换句话说,如果仅上传有评分的商品的相关中间参数,则通过推理攻击或者类似手段可以推测出用户的隐私。这是因为,尽管对相关中间参数如梯度进行了加密如同态加密,但是仍然会泄露一些隐私信息,而这些隐私信息结合其它的情报可能导致攻击方推测出用户的性别年龄等隐私。但是,如果对所有的商品的相关梯度都进行加密后上传,而无论用户是否做出过评分,例如将图1中用户1对所有商品的评分都进行加密后上传,这里面必然包括评分为0的情况例如用户1对商品3的评分为0。这种用户没有做出评分或者评分为0的情况可以用零梯度或者某个固定梯度来统一替代,而因为加密算法如同态加密算法固有的随机性,同样都是评分为0的商品如用户1对商品3和商品4的评分均为零,但是加密后的结果可能不一致。这样全体加密及上传所有中间参数的做法虽然克服了推理攻击的问题,但是带来了对零梯度或者固定梯度进行随机加密的负担,会对整体的计算效率和资源占用带来很大的挑战。而且,实际应用中,例如电子商务上通过RS来实现对商品的导购,用于预测的消费者的购物记录中绝大多数的条目都是空白的也就是说某个用户对绝大多数商品都是没有评分或者购物记录,这意味着如图1所示的示意图上会有大部分位置都是0。如果将多个用户对多个商品做出的评分的情况以图1的方式整理成矩阵,则该矩阵的稀疏性或者说其中的为0的元素所占的位置可用于压缩算法或者其它提高计算效率的工具,但是如果对零梯度进行随机加密则无法利用这种稀疏性。这样也就使得全体加密及上传所有中间参数的做法难以降低算法复杂度。为此,本申请实施例提供了联邦学习推荐方法和联邦学习推荐系统的实施例,针对n个用户对m个商品做出评分这样的应用下,不仅能够保护用户隐私和克服推理攻击风险而且具有较好的计算效率和较低的算法复杂度,下面详细说明。
图2示出了本申请实施例提供的联邦学习推荐方法的流程示意图。如图2所示,联邦学习推荐方法包括以下步骤。
步骤S202:通过混淆函数,将用户评分矩阵映射到混淆后用户评分矩阵,其中,所述用户评分矩阵的各个元素以二元化取值指示多个用户各自对多个商品是否分别做出评分。
步骤S204:利用所述混淆后用户评分矩阵生成联邦学习推荐结果,该联邦学习推荐结果与所述用户评分矩阵相关联。
其中,所述混淆函数通过满足预设约束条件的优化得到,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素。
请参阅图2,混淆函数的作用是提供混淆操作(obfuscation)从而将用户评分矩阵映射到混淆后用户评分矩阵,这样使得服务器或者其它接收混淆后用户评分矩阵的参与方无法从中反向推演出用户隐私信息。在一种可能的实施方式中,用户评分矩阵可以是矩阵X,矩阵X上的元素可以表示为xij。也就是说,用户评分矩阵X上的第i行第j列的位置上的元素是xij,而以图1为例,该元素xij可以表示第i个用户对第j个商品是否做出评分。这里,用户评分矩阵上的各个元素以二元化取值的方式来指示某个用户是否对某个商品做出评分,例如以图1所示的用1表示做出评分而用0表示没有做出评分。例如用户1对商品1做出评分,则意味着元素x11是1;用户1对商品4没有做出评分,则意味着元素x14是0。如此,可以将以图1为例的多个用户对多个商品做出评分的情况,以用户评分矩阵的形式来表示。设有n个用户对m个商品做出评分,则意味着对应的用户评分矩阵有n行m列或者说维度是n乘以m的形式。并且,以图1为例,考虑到实际中某个用户对绝大多数商品都是没有评分,也就是说这样生成的用户评分矩阵具有相当的稀疏性,其中的大部分位置的元素应为0。上面提到,如果仅对用户做出过评分的商品的相关梯度或中间参数进行加密后上传,则意味着将用户评分矩阵上为1的元素也就是指示做出过评分的元素都进行加密后上传。但是这样做会导致推理攻击的风险,也就是说仅上传为1的的元素或者不为零的元素可能导致用户的隐私如年龄性别等被泄露。另一方面,如果对所有的商品的相关梯度都进行加密后上传也就是将用户评分矩阵上的所有元素都进行加密后上传,则带来了对零梯度或者固定梯度进行随机加密的负担,会对整体的计算效率和资源占用带来很大的挑战,而且也无法利用用户评分矩阵自身的稀疏性特点。
为此,本申请实施例提供的联邦学习推荐方法在步骤S202中,通过混淆函数将用户评分矩阵X映射到混淆后用户评分矩阵
Figure BDA0003495168730000061
这意味着用户评分矩阵X上的某个元素可能被映射到另一个位置上而原来位置上的元素也被其它元素替代。这样得到的混淆后用户评分矩阵
Figure BDA0003495168730000062
上的某个元素也指示了某个用户是否对某个商品做出评分,例如混淆后用户评分矩阵
Figure BDA0003495168730000063
上的第i行第j列的元素也指示了第i个用户是否对第j个商品做出评分,但是因为混淆函数的作用,混淆后用户评分矩阵上的信息是与真实情况下用户做出的评分有差异的,这样就使得推理攻击难从混淆后用户评分矩阵推演出真实信息,从而保护了用户隐私。
在构建混淆函数时,也就是确定如何将用户评分矩阵映射到混淆后用户评分矩阵时,需要考虑的关键因素是如何最小化通过推理攻击从混淆后用户评分矩阵推演出用户隐私的概率,而基于对该关键因素的考量可以设计如何优化该混淆函数。具体地,所述混淆函数通过满足预设约束条件的优化得到,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素。上面提到,因为混淆函数的作用,混淆后用户评分矩阵上的信息是与真实情况下用户做出的评分有差异,也就是说,可能存在所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素。例如,以图1为例,用户1对商品1做出评分,因此所述用户评分矩阵上的元素x11是1;但是经过混淆函数作用后,所述混淆后用户评分矩阵上位于相同位置的元素也就是第1行第1列的元素可能具有不同的二元化取值也即0。通过比较所述用户评分矩阵和所述混淆后用户评分矩阵可以识别出具有相同位置但是不同二元化取值的元素(所述用户评分矩阵上为1而所述混淆后用户评分矩阵上为0,或者相反)。这样就可以识别出所述用户评分矩阵和所述混淆后用户评分矩阵上的差异,或者说,通过混淆函数而引起的混淆后用户评分矩阵上的信息与真实信息之间的差异。通过基于这种差异来设计预设约束条件并且完成带有约束的优化,有利于在信息损失和计算效率之间达到较佳平衡点,从而在加强对用户隐私保护同时也具有较好的整体的计算效率和资源占用率,同时也利用混淆函数保存了用户评分矩阵自身的稀疏性特点从而有利于后续处理的简化。
上面提及的通过比较所述用户评分矩阵和所述混淆后用户评分矩阵可以识别出具有相同位置但是不同二元化取值的元素,从而识别出所述用户评分矩阵和所述混淆后用户评分矩阵上的差异。这种差异可以分成两种情况,一种情况对应第一约束条件(下面详细说明),指的是所述用户评分矩阵上为0而所述混淆后用户评分矩阵上为1,这种情况对应例如虚假点击的场景也就是用户实质上没有选择或评分某商品(没有点击该商品)但是在所述混淆后用户评分矩阵上体现为用户做出了评分。还有一种情况对应第二约束条件(下面详细说明),指的是所述用户评分矩阵上为1而所述混淆后用户评分矩阵上为0,这种情况对应例如漏点击的场景也就是用户实质上选择了或者评分了某商品(点击了该商品)但是在所述混淆后用户评分矩阵上体现为用户没有评分。这两种不同的情况都对通过混淆函数而引起的混淆后用户评分矩阵上的信息与真实信息之间的差异做出了贡献,但是有不同的效果。漏点击的情况也就是所述用户评分矩阵上为1而所述混淆后用户评分矩阵上为0的情况,会带来推荐损失也就是可能导致失去了一些有用的信息。而虚假点击的情况也就是所述用户评分矩阵上为0而所述混淆后用户评分矩阵上为1的情况,则会造成额外的时间损耗因为其增加了无用的虚假信息。为了达到更好的优化混淆函数的效果,需要针对这两种情况分别设计约束条件。而优化混淆函数的目的是为了最小化通过推理攻击从混淆后用户评分矩阵推演出用户隐私的概率,这种概率表示为所述混淆后用户评分矩阵和隐私对象之间的互信息函数。在一种可能的实施方式中,该互信息函数满足以下公式(1)所示的数学关系。
Figure BDA0003495168730000071
其中,
Figure BDA0003495168730000072
是所述混淆后用户评分矩阵且所述混淆后用户评分矩阵的元素是
Figure BDA0003495168730000073
Y是所述隐私对象且所述隐私对象的元素是y。公式(1)中单变量的p函数代表了边缘概率分布函数或者说边缘概率,双变量的p函数代表了联合概率分布函数或者说联合概率。而互信息函数
Figure BDA0003495168730000074
则定义了两个随机变量之间相互依赖性的量度,也就是所述混淆后用户评分矩阵和隐私对象之间的互依赖性的量度,因此可用于衡量通过推理攻击从混淆后用户评分矩阵推演出用户隐私的概率。而对公式(1)所示出的互信息函数求解最小化的过程,需要满足上面提及的预设约束条件。在一种可能的实施方式中,预设约束条件包括第一约束条件和第二约束条件。并且,所述混淆函数通过满足预设约束条件的优化得到,包括:所述混淆函数通过满足该第一约束条件和该第二约束条件的前提下最小化所述混淆后用户评分矩阵和隐私对象之间的互信息函数而得到。这里,第一约束条件和第二约束条件分别用于对应上面提及的两种情况。
在一些实施例中,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素,包括:该预设约束条件包括第一约束条件和第二约束条件。其中,该第一约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置的第一元素,该第一元素在所述用户评分矩阵上的二元化取值指示第一用户没有对第一商品做出评分,该第一元素在所述混淆后用户评分矩阵上的二元化取值指示该第一用户对该第一商品做出评分。其中,该第二约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置的第二元素,该第二元素在所述用户评分矩阵上的二元化取值指示第二用户对第二商品做出评分,该第二元素在所述混淆后用户评分矩阵上的二元化取值指示该第二用户没有对该第二商品做出评分。这里,第一约束条件对应虚假点击的情况也就是所述用户评分矩阵上为0(没有做出评分)而所述混淆后用户评分矩阵上为1(做出评分)的情况;第二约束条件对应漏点击的情况也就是所述用户评分矩阵上为1(做出评分)而所述混淆后用户评分矩阵上为0(没有做出评分)的情况。另外,因为分别在所述用户评分矩阵和所述混淆后用户评分矩阵上,各个元素均用二元化取值。所以分别在所述用户评分矩阵和所述混淆后用户评分矩阵上,做出评分的用户和没有做出评分的用户彼此之间没有交集。也就是说,在所述用户评分矩阵上的第一用户没有对第一商品做出评分,而在所述用户评分矩阵上的第二用户对第二商品做出评分,这里的第一用户与第一商品的配对与第二用户与第二商品的配对一定不相同。换句话说,第一元素和第二元素的分布彼此不重叠。这样有利于简化整体的计算过程。
在一些实施例中,该第一约束条件包括基于该第一元素的第一测度的数学期望值小于第一阈值,该第二约束条件包括基于该第二元素的第二测度的数学期望值小于第二阈值。这意味着通过第一阈值和第二阈值可以分别针对第一约束条件和第二约束条件以及各自对应的虚假点击和漏点击的情况做出优化。并且,第一测度和第二测度可以基于任意合适的数学公式或者数学关系。一种示例性的实例中,第一测度针对第一约束条件也就是虚假点击情况而设计,这时第一测度被设计以体现因为虚假点击而导致的通讯损耗例如第一测度用于测量因为虚假点击而导致新增加的需要提供梯度的物品而这些新增加的物品在没有虚假点击的情况下其梯度不需要被提供。另一种示例性的实例中,第二测度针对第二约束条件也就是漏点击的情况而设计,这时第二测度用于的测量因为漏点击而导致的推荐损失例如因为漏点击而导致原本其梯度应该被需要而最后却没有传输其梯度的物品。例如,第一测度和第二测度可以通过减法运算、绝对值和占比等数学工具或者任意合适的组合来进行测度。例如,第一测度可以表示为对分别位于所述用户评分矩阵和所述混淆后用户评分矩阵上的相同位置的元素,先求绝对值再进行相减运算,最后求解相对于所述用户评分矩阵上的元素的绝对值的占比。再例如,可以先进行相减运算再求绝对值,然后求解相对于所述用户评分矩阵上的元素的差距,最后再求解该差距相对于所述用户评分矩阵上的元素的绝对值的占比。这些具体的数学组合可以根据实际需要调整,在此不做具体限定。
在一些实施例中,所述多个用户通过聚类算法划分为多个用户组,所述用户评分矩阵的各个元素以二元化取值指示所述多个用户组下的用户各自对多个商品是否分别做出评分。这里,通过聚类算法,可以将原本n个用户对m个商品做出评分转化成k个用户组对m个商品做出评分,从而降低计算复杂度。并且,相应地,可以将该互信息函数在通过聚类算法简化计算后设定为满足以下公式(2)所示的数学关系。
Figure BDA0003495168730000081
其中,
Figure BDA0003495168730000082
是所述混淆后用户评分矩阵且所述混淆后用户评分矩阵的元素是
Figure BDA0003495168730000083
Y是所述隐私对象且所述隐私对象的元素是y。这里,经过聚类算法简化计算后,所述混淆后用户评分矩阵
Figure BDA0003495168730000084
代表了k个用户组。也就是说,只要相应地用所述混淆后用户评分矩阵
Figure BDA0003495168730000085
来替代所述混淆后用户评分矩阵
Figure BDA0003495168730000086
就可以利用聚类算法进一步简化整体计算复杂度。
在一些实施例中,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素,包括:该预设约束条件基于第一测度和第二测度。其中,所述第一测度基于所述用户评分矩阵上的第一元素和在所述混淆后用户评分矩阵上的与该第一元素具有相同位置的元素,该第一元素的二元化取值指示第一用户没有对第一商品做出评分,在所述混淆后用户评分矩阵上的与该第一元素具有相同位置的元素的二元化取值指示该第一用户对该第一商品做出评分。所述第二测度基于所述用户评分矩阵上的第二元素和在所述混淆后用户评分矩阵上的与该第二元素具有相同位置的元素,该第二元素的二元化取值指示第二用户对第二商品做出评分,在所述混淆后用户评分矩阵上的与该第二元素具有相同位置的元素的二元化取值指示该第二用户没有对该第二商品做出评分。这里,第一约束条件对应虚假点击的情况也就是所述用户评分矩阵上为0(没有做出评分)而所述混淆后用户评分矩阵上为1(做出评分)的情况;第二约束条件对应漏点击的情况也就是所述用户评分矩阵上为1(做出评分)而所述混淆后用户评分矩阵上为0(没有做出评分)的情况。这样有利于简化整体的计算过程。
在一些实施例中,所述混淆后用户评分矩阵被添加差分隐私DP噪声后利用不经意传输OT安全协议发送给服务器,该服务器用于生成所述联邦学习推荐结果。如此,通过DP噪声和OT安全协议进一步提升了安全性。
在一些实施例中,所述二元化取值包括0和1。所述联邦学习推荐方法用于电子商务、新闻、影视、餐饮或者金融服务行业。
应当理解的是,上述方法可以通过相应的执行主体或者载体来实现。在一些示例性实施例中,一种非瞬时性计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,该计算机指令被处理器执行时实现上述方法以及上述任意实施例、实施方式或者它们的组合。在一些示例性实施例中,一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器通过运行所述可执行指令以实现上述方法以及上述任意实施例、实施方式或者它们的组合。在一些示例性实施例中,一种计算机程序,所述计算机程序通过被处理器执行从而使得所述处理器执行上述方法以及上述任意实施例、实施方式或者它们的组合。
图3示出了本申请实施例提供的用于图2所示的联邦学习推荐方法的电子设备的框图。如图3所示,电子设备包括主处理器302,内部总线304,网络接口306,主存储器308,以及辅助处理器310和辅助内存312,还有辅助处理器320和辅助内存322。其中,主处理器302与主存储器308连接,主存储器308可用于存储主处理器302可执行的计算机指令,从而可以实现图2所示的联邦学习推荐方法,包括其中部分或者全部步骤,也包括其中步骤的任意可能的组合或结合以及可能的替换或者变体。网络接口306用于提供网络连接以及通过网络收发数据。内部总线304用于提供在主处理器302、网络接口306、辅助处理器310以及辅助处理器320之间的内部的数据交互。其中,辅助处理器310与辅助内存312连接并一起提供辅助计算能力,而辅助处理器320与辅助内存322连接并一起提供辅助计算能力。辅助处理器310和辅助处理器320可以提供相同或者不同的辅助计算能力,包括但是不限于,针对特定计算需求进行优化的计算能力如并行处理能力或者张量计算能力,针对特定算法或者逻辑结构进行优化的计算能力例如迭代计算能力或者图计算能力等。辅助处理器310和辅助处理器320可以包括特定类型的一个或者多个处理器,如数字信号处理器(DSP),专用集成电路(ASIC),现场可编程门阵列(FPGA)等,从而可以提供定制化的功能和结构。在一些示例性实施例中,电子设备可以不包括辅助处理器,可以包括仅一个辅助处理器,还可以包括任意数量的辅助处理器且各自具有相应的定制化功能及结构,在此不做具体限定。图3中所示出的两个辅助处理器的架构仅为说明性而不应解释为限制性。另外,主处理器302可以包括单核或者多核的计算单元,用于提供本申请实施例所必需的功能和操作。另外,主处理器302和辅助处理器(如图3中的辅助处理器310和辅助处理器320)可以具有不同的架构,也就是电子设备可以是基于异构架构的系统,例如主处理器302可以是基于指令集操作体系的通用型处理器如CPU,而辅助处理器可以是适合并行化计算的图形处理器GPU或者是适合神经网络模型相关运算的专用加速器。辅助内存(例如图3所示的辅助内存312和辅助内存322)可以用于配合各自对应的辅助处理器来实现定制化功能及结构。而主存储器308用于存储必要的指令、软件、配置、数据等从而可以配合主处理器302提供本申请实施例所必需的功能和操作。在一些示例性实施例中,电子设备可以不包括辅助内存,可以包括仅一个辅助内存,还可以包括任意数量的辅助内存,在此不做具体限定。图3中所示出的两个辅助内存的架构仅为说明性而不应解释为限制性。主存储器308以及可能的辅助内存可以包括以下一个或多个特征:易失性,非易失性,动态,静态,可读/写,只读,随机访问,顺序访问,位置可寻址性,文件可寻址性和内容可寻址性,并且可以包括随机存取存储器(RAM),闪存,只读存储器(ROM),可擦可编程只读存储器(EPROM),电可擦可编程只读存储器(EEPROM),寄存器,硬盘,可移动磁盘,可记录和/或可重写光盘(CD),数字多功能光盘(DVD),大容量存储介质设备或任何其他形式的合适存储介质。内部总线304可以包括不同总线结构中的任何一种或不同总线结构的组合,例如存储器总线或存储器控制器,外围总线,通用串行总线和/或利用多种总线体系结构中的任何一种的处理器或本地总线。应当理解的是,图3所示的电子设备,其所示的结构并不构成对有关装置或系统的具体限定,在一些示例性实施例中,电子设备可以包括比具体实施例和附图更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者具有不同的部件布置。
图4示出了本申请实施例提供的联邦学习推荐系统的框图。如图4所示,所述联邦学习推荐系统应用于服务器。所述联邦学习推荐系统包括:接收模块410,用于接收混淆后用户评分矩阵,其中,所述混淆后用户评分矩阵通过利用混淆函数将用户评分矩阵映射得到,其中,所述用户评分矩阵的各个元素以二元化取值指示多个用户各自对多个商品是否分别做出评分;和生成模块420,用于利用所述混淆后用户评分矩阵生成联邦学习推荐结果,该联邦学习推荐结果与所述用户评分矩阵相关联。其中,所述混淆函数通过满足预设约束条件的优化得到,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素。这里,服务器可以是用于收集用户的评分以及可能还收集用户的购物记录、浏览历史等其它信息,并进行分析和预测的服务器,也就是用于维持RS运行的服务器。例如,在电子商务应用下,服务器可以是各个用户如消费者访问的购物平台或者电子商务平台。通过比较所述用户评分矩阵和所述混淆后用户评分矩阵可以识别出具有相同位置但是不同二元化取值的元素(所述用户评分矩阵上为1而所述混淆后用户评分矩阵上为0,或者相反)。这样就可以识别出所述用户评分矩阵和所述混淆后用户评分矩阵上的差异,或者说,通过混淆函数而引起的混淆后用户评分矩阵上的信息与真实信息之间的差异。通过基于这种差异来设计预设约束条件并且完成带有约束的优化,有利于在信息损失和计算效率之间达到较佳平衡点,从而在加强对用户隐私保护同时也具有较好的整体的计算效率和资源占用率,同时也利用混淆函数保存了用户评分矩阵自身的稀疏性特点从而有利于后续处理的简化。
在一些示例性实施例中,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素,包括:该预设约束条件包括第一约束条件和第二约束条件。其中,该第一约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置的第一元素,该第一元素在所述用户评分矩阵上的二元化取值指示第一用户没有对第一商品做出评分,该第一元素在所述混淆后用户评分矩阵上的二元化取值指示该第一用户对该第一商品做出评分。其中,该第二约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置的第二元素,该第二元素在所述用户评分矩阵上的二元化取值指示第二用户对第二商品做出评分,该第二元素在所述混淆后用户评分矩阵上的二元化取值指示该第二用户没有对该第二商品做出评分。
在一些示例性实施例中,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素,包括:该预设约束条件基于第一测度和第二测度。其中,所述第一测度基于所述用户评分矩阵上的第一元素和在所述混淆后用户评分矩阵上的与该第一元素具有相同位置的元素,该第一元素的二元化取值指示第一用户没有对第一商品做出评分,在所述混淆后用户评分矩阵上的与该第一元素具有相同位置的元素的二元化取值指示该第一用户对该第一商品做出评分。所述第二测度基于所述用户评分矩阵上的第二元素和在所述混淆后用户评分矩阵上的与该第二元素具有相同位置的元素,该第二元素的二元化取值指示第二用户对第二商品做出评分,在所述混淆后用户评分矩阵上的与该第二元素具有相同位置的元素的二元化取值指示该第二用户没有对该第二商品做出评分。
请参阅图2至图4,应当理解的是,二元化取值可以适用任意合适的二值化操作或者实际数值。本申请实施例用0和1来表示二元化取值,在另一种实施方式中也可以采用合适的其它取值,只要能有利于保持所述用户评分矩阵的稀疏性特性。
本申请提供的具体实施例可以用硬件,软件,固件或固态逻辑电路中的任何一种或组合来实现,并且可以结合信号处理,控制和/或专用电路来实现。本申请具体实施例提供的设备或装置可以包括一个或多个处理器(例如,微处理器,控制器,数字信号处理器(DSP),专用集成电路(ASIC),现场可编程门阵列(FPGA)等),这些处理器处理各种计算机可执行指令从而控制设备或装置的操作。本申请具体实施例提供的设备或装置可以包括将各个组件耦合在一起的系统总线或数据传输系统。系统总线可以包括不同总线结构中的任何一种或不同总线结构的组合,例如存储器总线或存储器控制器,外围总线,通用串行总线和/或利用多种总线体系结构中的任何一种的处理器或本地总线。本申请具体实施例提供的设备或装置可以是单独提供,也可以是系统的一部分,也可以是其它设备或装置的一部分。
本申请提供的具体实施例可以包括计算机可读存储介质或与计算机可读存储介质相结合,例如能够提供非暂时性数据存储的一个或多个存储设备。计算机可读存储介质/存储设备可以被配置为保存数据,程序器和/或指令,这些数据,程序器和/或指令在由本申请具体实施例提供的设备或装置的处理器执行时使这些设备或装置实现有关操作。计算机可读存储介质/存储设备可以包括以下一个或多个特征:易失性,非易失性,动态,静态,可读/写,只读,随机访问,顺序访问,位置可寻址性,文件可寻址性和内容可寻址性。在一个或多个示例性实施例中,计算机可读存储介质/存储设备可以被集成到本申请具体实施例提供的设备或装置中或属于公共系统。计算机可读存储介质/存储设备可以包括光存储设备,半导体存储设备和/或磁存储设备等等,也可以包括随机存取存储器(RAM),闪存,只读存储器(ROM),可擦可编程只读存储器(EPROM),电可擦可编程只读存储器(EEPROM),寄存器,硬盘,可移动磁盘,可记录和/或可重写光盘(CD),数字多功能光盘(DVD),大容量存储介质设备或任何其他形式的合适存储介质。
以上是本申请实施例的实施方式,应当指出,本申请具体实施例描述的方法中的步骤可以根据实际需要进行顺序调整、合并和删减。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。可以理解的是,本申请实施例以及附图所示的结构并不构成对有关装置或系统的具体限定。在本申请另一些实施例中,有关装置或系统可以包括比具体实施例和附图更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者具有不同的部件布置。本领域技术人员将理解,在不脱离本申请具体实施例的精神和范围的情况下,可以对具体实施例记载的方法和设备的布置,操作和细节进行各种修改或变化;在不脱离本申请实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本申请的保护范围。

Claims (14)

1.一种联邦学习推荐方法,其特征在于,所述联邦学习推荐方法包括:
通过混淆函数,将用户评分矩阵映射到混淆后用户评分矩阵,其中,所述用户评分矩阵的各个元素以二元化取值指示多个用户各自对多个商品是否分别做出评分;和
利用所述混淆后用户评分矩阵生成联邦学习推荐结果,该联邦学习推荐结果与所述用户评分矩阵相关联,
其中,所述混淆函数通过满足预设约束条件的优化得到,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素。
2.根据权利要求1所述的联邦学习推荐方法,其特征在于,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素,包括:
该预设约束条件包括第一约束条件和第二约束条件,
其中,该第一约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置的第一元素,该第一元素在所述用户评分矩阵上的二元化取值指示第一用户没有对第一商品做出评分,该第一元素在所述混淆后用户评分矩阵上的二元化取值指示该第一用户对该第一商品做出评分,
其中,该第二约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置的第二元素,该第二元素在所述用户评分矩阵上的二元化取值指示第二用户对第二商品做出评分,该第二元素在所述混淆后用户评分矩阵上的二元化取值指示该第二用户没有对该第二商品做出评分。
3.根据权利要求2所述的联邦学习推荐方法,其特征在于,该第一约束条件包括基于该第一元素的第一测度的数学期望值小于第一阈值,该第二约束条件包括基于该第二元素的第二测度的数学期望值小于第二阈值。
4.根据权利要求3所述的联邦学习推荐方法,其特征在于,所述混淆函数通过满足预设约束条件的优化得到,包括:
所述混淆函数通过满足该第一约束条件和该第二约束条件的前提下最小化所述混淆后用户评分矩阵和隐私对象之间的互信息函数而得到。
5.根据权利要求4所述的联邦学习推荐方法,其特征在于,所述互信息函数满足以下关系:
Figure FDA0003495168720000011
其中,
Figure FDA0003495168720000012
是所述混淆后用户评分矩阵且所述混淆后用户评分矩阵的元素是
Figure FDA0003495168720000013
Y是所述隐私对象且所述隐私对象的元素是y,单变量的p函数表示边缘概率分布,双变量的p函数表示联合概率分布。
6.根据权利要求4所述的联邦学习推荐方法,其特征在于,所述多个用户通过聚类算法划分为多个用户组,所述用户评分矩阵的各个元素以二元化取值指示所述多个用户组下的用户各自对多个商品是否分别做出评分。
7.根据权利要求6所述的联邦学习推荐方法,其特征在于,所述互信息函数满足以下关系:
Figure FDA0003495168720000021
其中,
Figure FDA0003495168720000022
是所述混淆后用户评分矩阵且所述混淆后用户评分矩阵的元素是
Figure FDA0003495168720000023
Y是所述隐私对象且所述隐私对象的元素是y,单变量的p函数表示边缘概率分布,双变量的p函数表示联合概率分布。
8.根据权利要求1所述的联邦学习推荐方法,其特征在于,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素,包括:
该预设约束条件基于第一测度和第二测度,
其中,所述第一测度基于所述用户评分矩阵上的第一元素和在所述混淆后用户评分矩阵上的与该第一元素具有相同位置的元素,该第一元素的二元化取值指示第一用户没有对第一商品做出评分,在所述混淆后用户评分矩阵上的与该第一元素具有相同位置的元素的二元化取值指示该第一用户对该第一商品做出评分,
所述第二测度基于所述用户评分矩阵上的第二元素和在所述混淆后用户评分矩阵上的与该第二元素具有相同位置的元素,该第二元素的二元化取值指示第二用户对第二商品做出评分,在所述混淆后用户评分矩阵上的与该第二元素具有相同位置的元素的二元化取值指示该第二用户没有对该第二商品做出评分。
9.根据权利要求1所述的联邦学习推荐方法,其特征在于,所述混淆后用户评分矩阵被添加差分隐私DP噪声后利用不经意传输OT安全协议发送给服务器,该服务器用于生成所述联邦学习推荐结果。
10.一种非瞬时性计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,该计算机指令被处理器执行时实现根据权利要求1至9中任一项所述的方法。
11.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现根据权利要求1至9中任一项所述的方法。
12.一种联邦学习推荐系统,其特征在于,所述联邦学习推荐系统应用于服务器,所述联邦学习推荐系统包括:
接收模块,用于接收混淆后用户评分矩阵,其中,所述混淆后用户评分矩阵通过利用混淆函数将用户评分矩阵映射得到,其中,所述用户评分矩阵的各个元素以二元化取值指示多个用户各自对多个商品是否分别做出评分;和
生成模块,用于利用所述混淆后用户评分矩阵生成联邦学习推荐结果,该联邦学习推荐结果与所述用户评分矩阵相关联,
其中,所述混淆函数通过满足预设约束条件的优化得到,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素。
13.根据权利要求12所述的联邦学习推荐系统,其特征在于,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素,包括:
该预设约束条件包括第一约束条件和第二约束条件,
其中,该第一约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置的第一元素,该第一元素在所述用户评分矩阵上的二元化取值指示第一用户没有对第一商品做出评分,该第一元素在所述混淆后用户评分矩阵上的二元化取值指示该第一用户对该第一商品做出评分,
其中,该第二约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置的第二元素,该第二元素在所述用户评分矩阵上的二元化取值指示第二用户对第二商品做出评分,该第二元素在所述混淆后用户评分矩阵上的二元化取值指示该第二用户没有对该第二商品做出评分。
14.根据权利要求12所述的联邦学习推荐系统,其特征在于,该预设约束条件基于所述用户评分矩阵和所述混淆后用户评分矩阵之间具有相同位置但是不同二元化取值的元素,包括:
该预设约束条件基于第一测度和第二测度,
其中,所述第一测度基于所述用户评分矩阵上的第一元素和在所述混淆后用户评分矩阵上的与该第一元素具有相同位置的元素,该第一元素的二元化取值指示第一用户没有对第一商品做出评分,在所述混淆后用户评分矩阵上的与该第一元素具有相同位置的元素的二元化取值指示该第一用户对该第一商品做出评分,
所述第二测度基于所述用户评分矩阵上的第二元素和在所述混淆后用户评分矩阵上的与该第二元素具有相同位置的元素,该第二元素的二元化取值指示第二用户对第二商品做出评分,在所述混淆后用户评分矩阵上的与该第二元素具有相同位置的元素的二元化取值指示该第二用户没有对该第二商品做出评分。
CN202210111416.5A 2022-01-29 2022-01-29 联邦学习推荐系统、方法、存储介质及电子设备 Pending CN114461994A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210111416.5A CN114461994A (zh) 2022-01-29 2022-01-29 联邦学习推荐系统、方法、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210111416.5A CN114461994A (zh) 2022-01-29 2022-01-29 联邦学习推荐系统、方法、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN114461994A true CN114461994A (zh) 2022-05-10

Family

ID=81411734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210111416.5A Pending CN114461994A (zh) 2022-01-29 2022-01-29 联邦学习推荐系统、方法、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN114461994A (zh)

Similar Documents

Publication Publication Date Title
TWI689841B (zh) 資料加密、機器學習模型訓練方法、裝置及電子設備
US20210173711A1 (en) Integrated value chain risk-based profiling and optimization
CN109964228B (zh) 用于数据双重匿名化的方法和系统
US20210112101A1 (en) Data set and algorithm validation, bias characterization, and valuation
Maroofi et al. An investigation of initial trust in mobile banking
EP3089069B1 (en) System for privacy-preserving monetization of big data and method for using the same
US20160048766A1 (en) Method and system for generating and aggregating models based on disparate data from insurance, financial services, and public industries
US11188678B2 (en) Detection and prevention of privacy violation due to database release
CN112132676B (zh) 联合训练目标模型的贡献度的确定方法、装置和终端设备
US9235814B2 (en) Machine learning memory management and distributed rule evaluation
JP7529951B2 (ja) 初期機密データセットからアバターを作成するための方法、コンピュータプログラム
JP2016511891A (ja) 大規模データへの妨害攻撃に対するプライバシー
US12061671B2 (en) Data compression techniques for machine learning models
CN113407987A (zh) 保护隐私的确定业务数据特征有效值的方法及装置
US20240231909A1 (en) System and method for universal computer asset normalization and configuration management
CA3163408A1 (en) Creating predictor variables for prediction models from unstructured data using natural language processing
JP7505570B2 (ja) 秘密決定木テスト装置、秘密決定木テストシステム、秘密決定木テスト方法、及びプログラム
CN113158047A (zh) 推荐模型训练、信息推送方法、装置、设备及介质
CN113516253A (zh) 一种联邦学习中数据加密优化方法及装置
CN116028964B (zh) 一种信息安全风险管理系统
CN112948681A (zh) 一种融合多维度特征的时间序列数据推荐方法
CN114461994A (zh) 联邦学习推荐系统、方法、存储介质及电子设备
CN116702220A (zh) 基于加密特征分析的数据比对方法及系统
Thurow et al. Assessing the multivariate distributional accuracy of common imputation methods
Cui et al. Digital marketing program design based on abnormal consumer behavior data classification and improved homomorphic encryption algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination