CN112182399A - 一种联邦学习的多方安全计算方法及装置 - Google Patents
一种联邦学习的多方安全计算方法及装置 Download PDFInfo
- Publication number
- CN112182399A CN112182399A CN202011112386.7A CN202011112386A CN112182399A CN 112182399 A CN112182399 A CN 112182399A CN 202011112386 A CN202011112386 A CN 202011112386A CN 112182399 A CN112182399 A CN 112182399A
- Authority
- CN
- China
- Prior art keywords
- data
- object set
- model
- node
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 claims abstract description 35
- 239000013598 vector Substances 0.000 claims description 16
- 238000012821 model calculation Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 19
- 238000012549 training Methods 0.000 abstract description 12
- 238000010801 machine learning Methods 0.000 abstract description 4
- 239000011159 matrix material Substances 0.000 description 21
- 230000002787 reinforcement Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000006399 behavior Effects 0.000 description 11
- 238000003745 diagnosis Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例涉及机器学习领域,尤其涉及一种联邦学习的多方安全计算方法及装置,用以在保护多方计算过程中数据安全性的基础上,提高模型训练效率和准确性。本发明实施例包括:数据节点将数据节点中的所有个体对象,按照分类标准划分至多个对象集合中;针对每一个对象集合,数据节点根据对象集合中所有个体对象的特征数据,确定对象集合的特征数据;数据节点将对象集合的特征数据向模型节点发送,以使模型节点根据多个数据节点发送的对象集合的特征数据,将同一对象集合的所有特征数据进行样本对齐得到对象集合的样本数据,并依据所有对象集合的样本数据对联邦学习模型进行训练;多个数据节点中划分个体对象的分类标准相同。
Description
技术领域
本发明涉及机器学习领域,尤其涉及一种联邦学习的多方安全计算方法及装置。
背景技术
联邦学习是一个机器学习框架,能帮助不同机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据联合使用和建模。具体地说,联邦学习要解决这样一个问题:在企业各自数据不出本地的前提下,通过加密机制下的参数交换与优化,建立一个虚拟的共有模型。这个共有模型的性能类似于将各方数据聚合到一块训练出来的模型。该数据联合建模方案不泄露用户隐私且符合数据安全保护的原则。
当前联邦学习对模型进行建模训练时,主要是采用数据端-模型端的架构方案。模型端负责初始化模型参数,然后将模型参数下发到数据端。数据端对接收到的模型参数在本地进行参数更新,再返回给模型端。模型端之后做参数的聚合,通常是进行平均运算。更新后的模型重新下发到数据端,循环往复,直到收敛为止。
现有技术中,一般为一个模型端对应多个数据端,每个数据端对应一个平台,平台分别采集各自客户的个人数据。但是不同平台之间,由于用户重叠度低,存在数据有效率差,计算效率低,多方数据价值难以充分挖掘的问题。
发明内容
本申请提供一种联邦学习的多方安全计算方法及装置,用以降低模型参数有损压缩带来的误差,提高联邦学习模型的准确性。
本发明实施例提供的一种联邦学习的多方安全计算方法,包括:
数据节点将所述数据节点中的所有个体对象,按照分类标准划分至多个对象集合中;
针对每一个对象集合,所述数据节点根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据;
所述数据节点将对象集合的特征数据向模型节点发送,以使所述模型节点根据多个数据节点发送的对象集合的特征数据,将同一对象集合的所有特征数据进行样本对齐得到所述对象集合的样本数据,并依据所有对象集合的样本数据对联邦学习模型进行训练;
所述多个数据节点中划分个体对象的分类标准相同。
可选的,所述个体对象的特征数据包括连续型特征数据,所述数据节点根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据,包括:
所述数据节点计算所有个体对象的连续型特征数据的均值,作为所述对象集合的第一特征数据。
可选的,所述个体对象的特征数据包括离散型特征数据,所述数据节点根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据,包括:
所述数据节点利用热独编码,将所述个体对象的离散型特征数据转换为特征向量;
利用所述对象集合中所有个体对象的特征向量,确定所述对象集合的特征数据。
可选的,所述数据节点将对象集合的特征数据向模型节点发送之后,还包括:
所述数据节点接收所述模型节点发送的模型计算结果,所述模型计算结果中包含对象集合与推荐集合的对应关系;所述对象集合与推荐集合的对应关系为所述模型节点利用所述联邦学习模型确定的;
所述数据节点根据目标个体对象的属性数据,确定所述目标个体对象对应的目标对象集合;
所述数据节点根据所述目标对象集合对应的推荐集合,确定所述目标个体对象的推荐内容。
本发明实施例还提供一种联邦学习的多方安全计算方法,包括:
模型节点接收多个数据节点发送的对象集合的特征数据,所述多个数据节点按照相同的分类标准将个体对象划分至不同的对象集合中;
所述模型节点将同一对象集合的所有特征数据进行样本对齐得到所述对象集合的样本数据;
所述模型节点依据所有对象集合的样本数据对联邦学习模型进行训练。
本发明实施例还提供一种联邦学习的多方安全计算装置,包括:
划分单元,用于将数据节点中的所有个体对象,按照分类标准划分至多个对象集合中;
计算单元,用于针对每一个对象集合,根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据;
收发单元,用于将对象集合的特征数据向模型节点发送,以使所述模型节点根据多个数据节点发送的对象集合的特征数据,将同一对象集合的所有特征数据进行样本对齐得到所述对象集合的样本数据,并依据所有对象集合的样本数据对联邦学习模型进行训练;
其中,多个数据节点中划分个体对象的分类标准相同。
可选的,所述计算单元,具体用于:
计算所有个体对象的连续型特征数据的均值,作为所述对象集合的第一特征数据。
可选的,所述计算单元,具体用于:
利用热独编码,将所述个体对象的离散型特征数据转换为特征向量;
利用所述对象集合中所有个体对象的特征向量,确定所述对象集合的特征数据。
可选的,所述收发单元,还用于接收所述模型节点发送的模型计算结果,所述模型计算结果中包含对象集合与推荐集合的对应关系;所述对象集合与推荐集合的对应关系为所述模型节点利用所述联邦学习模型确定的;
还包括推荐单元,用于根据目标个体对象的属性数据,确定所述目标个体对象对应的目标对象集合;根据所述目标对象集合对应的推荐集合,确定所述目标个体对象的推荐内容。
本发明实施例还提供一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
本发明实施例还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上所述的方法。
本发明实施例的联邦学习系统中包含模型节点和多个数据节点,每个数据节点收集个体对象的特征数据,处理后向模型节点发送,模型节点中存储有联邦学习模型,根据接收到的特征数据进行模型训练。具体的,每个数据节点将数据节点中的所有个体对象按照分类标准划分至多个对象集合中,其中,多个数据节点中划分个体对象的分类标准相同。针对每个对象集合,数据节点根据该对象集合中所有个体对象的特征数据,确定该对象集合的特征数据。每个数据节点将对象集合的特征数据向模型节点发送。模型节点可以根据多个数据节点发送的对象集合的特征数据,将同一对象集合的所有特征数据进行样本对齐,得到对象集合的样本数据,并依据所有对象集合的样本数据对联邦学习模型进行训练。本申请实施例中将个体对象划分至多个对象集合中,根据对象集合中所有个体对象的特征数据确定每个对象集合的特征数据,模型节点将多个数据节点的对象集合的特征数据进行样本对齐,得到对象集合的样本数据,之后依据对象集合的样本数据对联邦学习模型进行训练,解决了由于不同数据节点之间用户重合度低导致的数据稀疏问题,增加了模型训练的准确性。同时,由于每个数据节点将特征数据向模型节点发送之前,根据个体对象的特征数据计算得到对象集合的特征数据,这样数据节点发送对象集合的特征数据过程中,以及模型节点处理对象集合的特征数据过程中,无法根据对象集合的特征数据推导出每一个个体对象的特征数据,从而可以较好的保护多方计算过程中数据的隐私和安全。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种可能的系统构架的结构示意图;
图2为本发明实施例提供的一种联邦学习的多方安全计算方法的流程示意图;
图3为本发明具体实施例提供的模型节点将特征数据进行样本对齐的示意图;
图4为本发明实施例一提供的一种联邦学习的多方安全计算方法的流程示意图;
图5为本发明实施例二提供的一种联邦学习的多方安全计算方法的流程示意图;
图6为本发明实施例提供的一种联邦学习的多方安全计算装置的结构示意图;
图7为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明实施例所适用的一种系统架构,包括模型节点服务器101以及多个数据节点服务器102。其中,数据节点服务器102获取个体对象的特征数据,按照分类标准将不同个体对象划分至对象集合中。数据节点服务器102根据对象集合中所有个体对象的特征数据,确定对象集合的特征数据,通常可以是平均运算等。每个数据节点服务器102将对象集合的特征数据向模型节点服务器101发送,从而模型节点服务器101可以根据多个数据节点服务器102的对象集合的特征数据,得到对象集合的样本数据,并依据所有对象集合的样本数据对联邦学习模型进行训练。
模型节点服务器101可以是计算机等网络设备。模型节点服务器101可以是一个独立的设备,也可以是多个服务器所形成的服务器集群。优选地,模型节点服务器101可以采用云计算技术进行信息处理。数据节点服务器102可以是一个独立的设备,也可以是多个服务器所形成的服务器集群。优选地,模型节点服务器101可以采用云计算技术进行信息处理。
数据节点服务器102可以通过INTERNET网络与模型节点服务器101进行通信,也可以通过全球移动通信系统(Global System for MobileCommunications,简称GSM)、长期演进(long term evolution,简称LTE)系统等移动通信系统与模型节点服务器101进行通信。
基于上述架构,本发明实施例提供了一种联邦学习的多方安全计算方法,如图2所示,本发明实施例提供的联邦学习的多方安全计算方法包括以下步骤:
步骤201、数据节点将所述数据节点中的所有个体对象,按照分类标准划分至多个对象集合中。
步骤202、针对每一个对象集合,所述数据节点根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据。
步骤203、数据节点将对象集合的特征数据向模型节点发送。
步骤204、模型节点根据多个数据节点发送的对象集合的特征数据,将同一对象集合的所有特征数据进行样本对齐,得到所述对象集合的样本数据,并依据所有对象集合的样本数据对联邦学习模型进行训练。
其中,多个数据节点中划分个体对象的分类标准相同。
本发明实施例的联邦学习系统中包含模型节点和多个数据节点,每个数据节点收集个体对象的特征数据,处理后向模型节点发送,模型节点中存储有联邦学习模型,根据接收到的特征数据进行模型训练。具体的,每个数据节点将数据节点中的所有个体对象按照分类标准划分至多个对象集合中,其中,多个数据节点中划分个体对象的分类标准相同。针对每个对象集合,数据节点根据该对象集合中所有个体对象的特征数据,确定该对象集合的特征数据。每个数据节点将对象集合的特征数据向模型节点发送。模型节点可以根据多个数据节点发送的对象集合的特征数据,将同一对象集合的所有特征数据进行样本对齐,得到对象集合的样本数据,并依据所有对象集合的样本数据对联邦学习模型进行训练。本申请实施例中将个体对象划分至多个对象集合中,根据对象集合中所有个体对象的特征数据确定每个对象集合的特征数据,模型节点将多个数据节点的对象集合的特征数据进行样本对齐,得到对象集合的样本数据,之后依据对象集合的样本数据对联邦学习模型进行训练,解决了由于不同数据节点之间用户重合度低导致的数据稀疏问题,增加了模型训练的准确性。同时,由于每个数据节点将特征数据向模型节点发送之前,根据个体对象的特征数据计算得到对象集合的特征数据,这样数据节点发送对象集合的特征数据过程中,以及模型节点处理对象集合的特征数据过程中,无法根据对象集合的特征数据推导出每一个个体对象的特征数据,从而可以较好的保护多方计算过程中数据的隐私和安全。
本发明实施例中,对于数据节点,一个数据节点对应一个商户平台,个体对象可以为商户平台的用户,数据节点获取对应商户平台的用户的特征数据。需要说明的是,本发明实施例中的个体对象可以为用户,也可以为其它对象,例如终端设备、软件应用等,本发明实施例中仅以用户为例进行介绍,这里不做限制。
数据节点获取对应商户平台中用户的画像特征数据,例如年龄、性别、职业等,以及交互行为特征数据,例如点击、推荐、评分等。不同数据节点之间商议确定分类标准,按照统一的分类标准,将用户按照画像特征数据划分至不同的用户集合中。为了便于分辨不同的用户集合,还可以为每个用户集合分配集合标识,即集合ID。例如,设置用户集合ID=1的划分标准为“年龄20~30,女性,金融业,上海徐汇区”,则A平台将该平台上满足上述划分标准的用户划入A平台的ID=1的用户集合中,B平台将该平台上满足上述划分标准的用户划入B平台的ID=1的用户集合中。
通过统一的划分标准,可以将不同数据节点的用户划分至不同用户集合,对于同一用户集合,不同数据节点可以收集相同的交互行为特征,也可以收集不同的交互行为特征。例如A平台获取用户的点击次数、推送次数,B平台获取用户的评价分数。
由于数据一般分为连续型特征数据和离散型特征数据,针对不同类型的数据,本发明实施例采取不同的处理方式。
对于个体对象的特征数据为连续型特征数据,所述数据节点根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据,包括:
所述数据节点计算所有个体对象的连续型特征数据的均值,作为所述对象集合的第一特征数据。
具体实施过程中,对于用户的单值特征,如点击率,浏览时间等特征数据,若用户被分至同一用户集合,则采用均值处理来表征同一用户集合的特征数据,即:
其中,Fgroup为用户集合的特征数据,F个体为该用户集合中每一个用户的特征数据。
对于个体对象的特征数据为离散型特征数据,所述数据节点根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据,包括:
所述数据节点利用热独编码,将所述个体对象的离散型特征数据转换为特征向量;
利用所述对象集合中所有个体对象的特征向量,确定所述对象集合的特征数据。
具体实施过程中,对于用户的离散特征,如医疗场景中去过哪些医院等,先将其个体特征采用onehot(独热)向量表达,如用户去过华山医院、中山医院、瑞金医院,则其onehot向量表达为FA=(1华山,0中山,0瑞金)。
对于用户集合,则为用户集合中各个用户对应的个体特征onehot向量表达的平均表征:
本发明实施例中,每个数据节点通过上述操作,首先生成用户列表。例如针对ID=1的用户集合,A平台生成用户列表:
A平台{用户UA1+特征列表FA1,用户UA2+特征列表FA2,用户UA3+特征列表FA3…};
B平台生成用户列表:
B平台{用户UB1+特征列表FB1,用户UB2+特征列表FB2,用户UB3+特征列表FB3…}。
进而,通过平台特征值的处理,通过对用户集合中各个用户的特征数据的处理,形成ID=1的用户集合对应的A平台和B平台的平均特征数据。例如,FA=(特征列表FA1+特征列表FA2+特征列表FA3+…+特征列表FAN)/N
……公式3
FB=(特征列表FB1+特征列表FB2+特征列表FB3+…+特征列表FBM)/M
……公式4
其中,FA为A平台中ID=1的用户集合的特征数据,N为A平台中ID=1的用户集合中的用户个数;FB为B平台中ID=1的用户集合的特征数据,M为B平台中ID=1的用户集合中的用户个数。
通过上述操作,对所有用户集合中的用户特征数据进行上述操作,由不同的数据节点分别计算得到各个用户集合的平均特征矩阵。例如,A平台和B平台分别得到特征矩阵XA={IDA,FA},以及特征矩阵XB={IDB,FB}。
进一步地,本发明实施例中,每个数据节点将特征数据发送给模型节点之后,模型节点接收多个数据节点发送的对象集合的特征数据;
所述模型节点将同一对象集合的所有特征数据进行样本对齐得到所述对象集合的样本数据;
所述模型节点依据所有对象集合的样本数据对联邦学习模型进行训练。
具体实施过程中,对象集合基于同一分配的ID,可以方便模型节点将接收到的所有特征数据进行样本对齐,如图3所示。例如,对于A平台(云闪付)和B平台(美团),模型节点将ID相同的对象集合的特征数据进行合并,作为该ID的特征数据。
举例来说,A平台的数据节点经过数据处理后,得到点击数据特征矩阵和营销推送策略矩阵。对于每一类用户集合,可以获得商户的点击数据特征矩阵,其特征矩阵结构如表1所示,矩阵每行的值为固定的所有商户某一天内已有人群对其的点击次数、频率等相关特征。
表1
推送策略矩阵如表2所示,该矩阵表示在不同营销方案下,对于各类用户集合推送的各商户次数、平均推送频率等,在联合建模中,该矩阵将作为特征输入,最终在强化学习框架中获取其推送优化策略。
表2
B平台的数据节点经过数据处理后,得到点评数据特征矩阵,如表3所示。该矩阵表示在B平台中,各类人群对各商户的点评平均分,该评分能够量化用户对商户的喜好程度,在联合建模中,该评分与点击行为共同作为用户反馈,作为强化学习训练中的奖励值。
表3
模型节点中的联邦学习模型可以为各种模型,如支持向量机(Support VectorMachine,SVM)、逻辑回归(logistics regression,LR)等线性模型,也可以支持深度神经网络(Deep Neural Network,DNN)模型等,这里不做限制。
将样本对齐后对象集合的样本数据,作为联邦学习模型的训练样本,建立强化学习的模型框架。
综合A平台的平均点击量矩阵分量U和B平台的人群平均评分矩阵分量P,设定强化学习的奖励值函数R=U·P,该奖励指标综合考虑了用户的点击访问倾向偏好和商户的评价指标,以该奖励值为强化学习的学习目标,选择合适的营销策略。
模型节点利用接收到的各数据节点的数据,进行联邦学习模型的建立和训练。例如,综合A平台的商户点评数据和B平台的用户点击数据,生成强化学习的奖励值指标,依据A平台提供的不同样本下的营销策略矩阵作为学习的行动特征(Action)建立模型,学习出最优营销策略,即对于每一类人群的商户最佳推送权重矩阵。
在模型节点中,各方数据通过联邦学习第三方协调方分发强化学习模型,分布式加密计算,保证数据不向外泄漏。在基础的联邦学习框架机器学习的第三方协调计算梯度的基础上,考虑到奖励值函数为综合了A平台的点击和B平台的点评的函数值,一方可以根据该值和自身值对对方数据进行反解,该参数必须以梯度分发至各数据源,而不可以直接向两方输出。
具体的实现过程如下:
A平台和B平台按照用户类抽取各自特征,A平台侧生成各用户类在不同营销策略下用户对于所有商户的点评数据特征矩阵,作为强化学习的奖励值(Reward)计算分量样本输入;B平台侧生成各用户类在不同营销策略下的商户推送特征矩阵作为强化学习的行动输入(Action),将用户类对各商户的点击行为特征作为强化学习奖励值(Reward)计算分量样本输入。
模型节点建立联邦学习模型,对齐各用户集合的ID,通过第三方协调方分发联邦强化学习模型,各方数据源根据强化学习框架上送数据至模型计算分布式的梯度,包括特征自学习梯度和奖励值在各方的梯度分量:
其中,
通过分量调度协调实现模型的分布式派发和计算,最终获得针对各用户类的最优商户推荐矩阵,即每个用户集合对应的商户集合作为其召回选品池。
进一步地,所述数据节点将对象集合的特征数据向模型节点发送之后,还包括:
所述数据节点接收所述模型节点发送的模型计算结果,所述模型计算结果中包含对象集合与推荐集合的对应关系;所述对象集合与推荐集合的对应关系为所述模型节点利用所述联邦学习模型确定的;
所述数据节点根据目标个体对象的属性数据,确定所述目标个体对象对应的目标对象集合;
所述数据节点根据所述目标对象集合对应的推荐集合,确定所述目标个体对象的推荐内容。
具体实施过程中,通过上述步骤可以获取各用户集合下用户的个性化推荐商户池,针对每一个用户,结合其移动端的设备信息和实时行为特征,进一步降推荐细化为用户粒度,为每个用户做个性化的推荐。
例如,A平台基于用户交易行为,为用户进行用户画像刻画,对商户进行商户化画像刻画,根据用户分类标准字段将用户分群。根据用户的历史交易数据及A平台的历史行为数据,根据场景需求制定召回策略,计算各个召回策略下用户的召回商户列表。通过联邦强化学习得到的营销策略作为点评偏好召回商户,由于其不考虑用户的实时性行为,因此通过强化联邦模型召回的商户具有拓展性,不同的场景下均适用。由于推荐系统的特性,大多数推荐场景的目的是为了提升用户与平台的交互,用户可以通过翻页来实现与推荐系统的多轮交互,在此过程中,需要推荐系统能够感知用户的实时行为,理解用户的意图,每一次翻页即为一次强化学习反馈。
为了更清楚地理解本发明,下面以具体实施例对上述流程进行详细描述,具体实施例一的过程如图4所示,包括:
用户打开应用后,推荐系统完成以下操作:
传回实时用户画像、实时商户画像、实时用户特征(上一次刷新与此次刷新期间的曝光、点击、收藏等行为,所处商圈等)、用户群标签,推荐系统召回其偏好商户,根据实时特征对召回商户进行排序,根据用户所处位置、持卡情况等条件进行结果调整,并将推荐结果呈现给用户。
以用户传回的实时点击率作为奖励值,计算模型推荐效果,更新强化联邦学习模型,实时调整用户群推送策略,并根据用户实时画像更新用户群标签。
通过以上过程,为用户进行个性化推荐,既能够在保护用户隐私情况下结合多方数据召回用户的点评偏好商户,又保证了推荐的多样性,使推荐系统能够更好的理解用户意图,提升用户体验。
具体实施例二的场景为基于用户群对齐的联邦学习用于医疗调度系统的研发,目的是在满足用户诊疗满意度的同时,减少用户的等待时间,为用户推荐最合适的医院和科室进行挂号,最大化用户的整体满意度。与各个医院合作进行多联邦学习,即保护了用户的隐私,也能够合理分配社会医疗资源。过程如图5所示,包括:
将支付(银联)侧和医院侧的用户根据基础属性(年龄、性别、区域、购买力等)和诊疗属性(诊疗项目、诊疗时间、诊疗地点、诊疗结果等)双方协商的属性细分为多个用户群,为每个用户群分配群ID,对各个用户群抽取特征形成特征数据矩阵。其中,医院侧的数据来源于用户挂号就诊数据,支付侧的数据来源于挂号就诊的支付信息。数值型特征采用最大值作为用户群特征值,类别型特征采用onehot向量表达。
在某些分类下会存在用户较少的现象,即存在泄露用户隐私的隐患,因此双方数据融合建模前,依然需要对双方数据进行加密对齐。
各方数据融合后进行联邦双模型协同训练:
根据用户的病历特征和医院属性特征,训练联邦回归模型,得到用户在当前医院和诊室下的诊疗满意度;
根据用户基础属性和历史预约情况,训练联邦分类模型,得到用户对于不同程度下的预约情况是否可接受;
融合诊疗满意度和预约可接受情况进行多标签、双模型协同训练,损失函数为最大化用户的整体满意度为:
R(用户满意度)=f(诊疗满意度,预约可接受)
保存模型用于处理用户实时请求,通过实时请求计算基础属性特征及诊疗特征,获取用户对于不同医院、不同诊室的整体满意度预测。
当用户通过云闪付医疗频道查看各个医院和诊室时,首先获取用户的基础属性信息,填写即时病情说明和请求就医项目,计算用户特征并通过模型计算用户对于各个医院和诊室的整体满意度,取前N个诊室作为候选诊疗列表,再根据距离等信息进行筛选,为用户推荐最合适的就诊医院和诊室。
本发明实施例还提供了一种联邦学习的多方安全计算装置,如图6所示,包括:
划分单元601,用于将数据节点中的所有个体对象,按照分类标准划分至多个对象集合中;
计算单元602,用于针对每一个对象集合,根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据;
收发单元603,用于将对象集合的特征数据向模型节点发送,以使所述模型节点根据多个数据节点发送的对象集合的特征数据,将同一对象集合的所有特征数据进行样本对齐得到所述对象集合的样本数据,并依据所有对象集合的样本数据对联邦学习模型进行训练;
其中,多个数据节点中划分个体对象的分类标准相同。
可选的,所述计算单元602,具体用于:
计算所有个体对象的连续型特征数据的均值,作为所述对象集合的第一特征数据。
可选的,所述计算单元602,具体用于:
利用热独编码,将所述个体对象的离散型特征数据转换为特征向量;
利用所述对象集合中所有个体对象的特征向量,确定所述对象集合的特征数据。
可选的,所述收发单元603,还用于接收所述模型节点发送的模型计算结果,所述模型计算结果中包含对象集合与推荐集合的对应关系;所述对象集合与推荐集合的对应关系为所述模型节点利用所述联邦学习模型确定的;
还包括推荐单元604,用于根据目标个体对象的属性数据,确定所述目标个体对象对应的目标对象集合;根据所述目标对象集合对应的推荐集合,确定所述目标个体对象的推荐内容。
基于相同的原理,本发明还提供一种电子设备,如图7所示,包括:
包括处理器701、存储器702、收发机703、总线接口704,其中处理器701、存储器702与收发机703之间通过总线接口704连接;
所述处理器701,用于读取所述存储器702中的程序,执行下列方法:
将所述数据节点中的所有个体对象,按照分类标准划分至多个对象集合中;
针对每一个对象集合,根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据;
将对象集合的特征数据向模型节点发送,以使所述模型节点根据多个数据节点发送的对象集合的特征数据,将同一对象集合的所有特征数据进行样本对齐,得到所述对象集合的样本数据,并依据所有对象集合的样本数据对联邦学习模型进行训练;
所述多个数据节点中划分个体对象的分类标准相同。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
Claims (11)
1.一种联邦学习的多方安全计算方法,其特征在于,包括:
数据节点将所述数据节点中的所有个体对象,按照分类标准划分至多个对象集合中;
针对每一个对象集合,所述数据节点根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据;
所述数据节点将对象集合的特征数据向模型节点发送,以使所述模型节点根据多个数据节点发送的对象集合的特征数据,将同一对象集合的所有特征数据进行样本对齐,得到所述对象集合的样本数据,并依据所有对象集合的样本数据对联邦学习模型进行训练;
所述多个数据节点中划分个体对象的分类标准相同。
2.如权利要求1所述的方法,其特征在于,所述个体对象的特征数据包括连续型特征数据,所述数据节点根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据,包括:
所述数据节点计算所有个体对象的连续型特征数据的均值,作为所述对象集合的第一特征数据。
3.如权利要求1所述的方法,其特征在于,所述个体对象的特征数据包括离散型特征数据,所述数据节点根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据,包括:
所述数据节点利用热独编码,将所述个体对象的离散型特征数据转换为特征向量;
利用所述对象集合中所有个体对象的特征向量,确定所述对象集合的特征数据。
4.如权利要求1所述的方法,其特征在于,所述数据节点将对象集合的特征数据向模型节点发送之后,还包括:
所述数据节点接收所述模型节点发送的模型计算结果,所述模型计算结果中包含对象集合与推荐集合的对应关系;所述对象集合与推荐集合的对应关系为所述模型节点利用所述联邦学习模型确定的;
所述数据节点根据目标个体对象的属性数据,确定所述目标个体对象对应的目标对象集合;
所述数据节点根据所述目标对象集合对应的推荐集合,确定所述目标个体对象的推荐内容。
5.一种联邦学习的多方安全计算方法,其特征在于,包括:
模型节点接收多个数据节点发送的对象集合的特征数据,所述多个数据节点按照相同的分类标准将个体对象划分至不同的对象集合中;
所述模型节点将同一对象集合的所有特征数据进行样本对齐得到所述对象集合的样本数据;
所述模型节点依据所有对象集合的样本数据对联邦学习模型进行训练。
6.一种联邦学习的多方安全计算装置,其特征在于,包括:
划分单元,用于将数据节点中的所有个体对象,按照分类标准划分至多个对象集合中;
计算单元,用于针对每一个对象集合,根据所述对象集合中所有个体对象的特征数据,确定所述对象集合的特征数据;
收发单元,用于将对象集合的特征数据向模型节点发送,以使所述模型节点根据多个数据节点发送的对象集合的特征数据,将同一对象集合的所有特征数据进行样本对齐得到所述对象集合的样本数据,并依据所有对象集合的样本数据对联邦学习模型进行训练;
其中,多个数据节点中划分个体对象的分类标准相同。
7.如权利要求6所述的装置,其特征在于,所述计算单元,具体用于:
计算所有个体对象的连续型特征数据的均值,作为所述对象集合的第一特征数据。
8.如权利要求6所述的装置,其特征在于,所述计算单元,具体用于:
利用热独编码,将所述个体对象的离散型特征数据转换为特征向量;
利用所述对象集合中所有个体对象的特征向量,确定所述对象集合的特征数据。
9.如权利要求6所述的装置,其特征在于,
所述收发单元,还用于接收所述模型节点发送的模型计算结果,所述模型计算结果中包含对象集合与推荐集合的对应关系;所述对象集合与推荐集合的对应关系为所述模型节点利用所述联邦学习模型确定的;
还包括推荐单元,用于根据目标个体对象的属性数据,确定所述目标个体对象对应的目标对象集合;根据所述目标对象集合对应的推荐集合,确定所述目标个体对象的推荐内容。
10.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4任一所述的方法。
11.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1~4任一所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011112386.7A CN112182399A (zh) | 2020-10-16 | 2020-10-16 | 一种联邦学习的多方安全计算方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011112386.7A CN112182399A (zh) | 2020-10-16 | 2020-10-16 | 一种联邦学习的多方安全计算方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112182399A true CN112182399A (zh) | 2021-01-05 |
Family
ID=73950667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011112386.7A Pending CN112182399A (zh) | 2020-10-16 | 2020-10-16 | 一种联邦学习的多方安全计算方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112182399A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023142490A1 (zh) * | 2022-01-28 | 2023-08-03 | 中国银联股份有限公司 | 基于分布式图嵌入的联邦图聚类方法、装置及可读存储介质 |
WO2023197467A1 (zh) * | 2022-04-13 | 2023-10-19 | 上海阵方科技有限公司 | 一种使安全多方计算与联邦学习数据互联的系统 |
TWI832701B (zh) * | 2023-02-14 | 2024-02-11 | 國立成功大學 | 具有叢集架構的聯邦式學習預約平台、預約系統及其預約方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190227980A1 (en) * | 2018-01-22 | 2019-07-25 | Google Llc | Training User-Level Differentially Private Machine-Learned Models |
CN110175283A (zh) * | 2019-05-10 | 2019-08-27 | 深圳前海微众银行股份有限公司 | 一种推荐模型的生成方法及装置 |
CN110210626A (zh) * | 2019-05-31 | 2019-09-06 | 京东城市(北京)数字科技有限公司 | 数据处理方法、装置和计算机可读存储介质 |
CN110232130A (zh) * | 2019-05-20 | 2019-09-13 | 平安科技(深圳)有限公司 | 元数据管理谱系生成方法、装置、计算机设备和存储介质 |
CN110245510A (zh) * | 2019-06-19 | 2019-09-17 | 北京百度网讯科技有限公司 | 用于预测信息的方法和装置 |
CN110633806A (zh) * | 2019-10-21 | 2019-12-31 | 深圳前海微众银行股份有限公司 | 纵向联邦学习系统优化方法、装置、设备及可读存储介质 |
CN111310204A (zh) * | 2020-02-10 | 2020-06-19 | 北京百度网讯科技有限公司 | 数据处理的方法及装置 |
CN111461874A (zh) * | 2020-04-13 | 2020-07-28 | 浙江大学 | 一种基于联邦模式的信贷风险控制系统及方法 |
CN111477326A (zh) * | 2020-04-13 | 2020-07-31 | 深圳前海微众银行股份有限公司 | 传染病毒携带者检测方法、系统、装置、设备和介质 |
CN111553745A (zh) * | 2020-05-08 | 2020-08-18 | 深圳前海微众银行股份有限公司 | 基于联邦的模型更新方法、装置、设备及计算机存储介质 |
-
2020
- 2020-10-16 CN CN202011112386.7A patent/CN112182399A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190227980A1 (en) * | 2018-01-22 | 2019-07-25 | Google Llc | Training User-Level Differentially Private Machine-Learned Models |
CN110175283A (zh) * | 2019-05-10 | 2019-08-27 | 深圳前海微众银行股份有限公司 | 一种推荐模型的生成方法及装置 |
CN110232130A (zh) * | 2019-05-20 | 2019-09-13 | 平安科技(深圳)有限公司 | 元数据管理谱系生成方法、装置、计算机设备和存储介质 |
CN110210626A (zh) * | 2019-05-31 | 2019-09-06 | 京东城市(北京)数字科技有限公司 | 数据处理方法、装置和计算机可读存储介质 |
CN110245510A (zh) * | 2019-06-19 | 2019-09-17 | 北京百度网讯科技有限公司 | 用于预测信息的方法和装置 |
CN110633806A (zh) * | 2019-10-21 | 2019-12-31 | 深圳前海微众银行股份有限公司 | 纵向联邦学习系统优化方法、装置、设备及可读存储介质 |
CN111310204A (zh) * | 2020-02-10 | 2020-06-19 | 北京百度网讯科技有限公司 | 数据处理的方法及装置 |
CN111461874A (zh) * | 2020-04-13 | 2020-07-28 | 浙江大学 | 一种基于联邦模式的信贷风险控制系统及方法 |
CN111477326A (zh) * | 2020-04-13 | 2020-07-31 | 深圳前海微众银行股份有限公司 | 传染病毒携带者检测方法、系统、装置、设备和介质 |
CN111553745A (zh) * | 2020-05-08 | 2020-08-18 | 深圳前海微众银行股份有限公司 | 基于联邦的模型更新方法、装置、设备及计算机存储介质 |
Non-Patent Citations (1)
Title |
---|
李健萌: "基于联邦学习的大数据风险控制技术研究与应用", 《中国优秀博硕士论文全文数据库(硕士)信息科技辑》, no. 8, 15 August 2020 (2020-08-15), pages 3 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023142490A1 (zh) * | 2022-01-28 | 2023-08-03 | 中国银联股份有限公司 | 基于分布式图嵌入的联邦图聚类方法、装置及可读存储介质 |
WO2023197467A1 (zh) * | 2022-04-13 | 2023-10-19 | 上海阵方科技有限公司 | 一种使安全多方计算与联邦学习数据互联的系统 |
TWI832701B (zh) * | 2023-02-14 | 2024-02-11 | 國立成功大學 | 具有叢集架構的聯邦式學習預約平台、預約系統及其預約方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jayasinghe et al. | Data centric trust evaluation and prediction framework for IOT | |
US20190295114A1 (en) | Digital banking platform and architecture | |
CN112182399A (zh) | 一种联邦学习的多方安全计算方法及装置 | |
CN111966904B (zh) | 基于多用户画像模型的信息推荐方法和相关装置 | |
US11379715B2 (en) | Deep learning based distribution of content items describing events to users of an online system | |
Marudhadevi et al. | A trust evaluation model for cloud computing using service level agreement | |
WO2022100518A1 (zh) | 一种基于用户画像的物品推荐方法和装置 | |
CN110020022B (zh) | 数据处理方法、装置、设备及可读存储介质 | |
CN111553744A (zh) | 联邦产品推荐方法、装置、设备及计算机存储介质 | |
CN115270001B (zh) | 基于云端协同学习的隐私保护推荐方法及系统 | |
WO2024114640A1 (zh) | 一种基于用户画像的用户服务系统、方法及电子设备 | |
WO2023284516A1 (zh) | 基于知识图谱的信息推荐方法、装置、设备、介质及产品 | |
CN111429161A (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
Shafik et al. | Recommendation system comparative analysis: internet of things aided networks | |
Huang et al. | A reliable and fair federated learning mechanism for mobile edge computing | |
CN109829593B (zh) | 目标对象的信用度确定方法、装置、存储介质及电子装置 | |
CN102385586B (zh) | 多方协同过滤方法和系统 | |
CN110765350A (zh) | 一种会员积分的数据融合方法和装置 | |
CN114819197B (zh) | 基于区块链联盟的联邦学习方法、系统、装置及存储介质 | |
CN116245603A (zh) | 用户标签的处理方法、装置、云服务器和可读存储介质 | |
Luo et al. | DeepAttr: Inferring demographic attributes via social network embedding | |
CN114463063A (zh) | 数据处理方法及相关装置 | |
CN115345635A (zh) | 推荐内容的处理方法、装置、计算机设备和存储介质 | |
CN113887740A (zh) | 联合更新模型的方法、装置及系统 | |
CN113378033A (zh) | 一种推荐模型的训练方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |