CN114418380A - 基于联邦学习的用户评分方法、服务器及存储介质 - Google Patents
基于联邦学习的用户评分方法、服务器及存储介质 Download PDFInfo
- Publication number
- CN114418380A CN114418380A CN202210048632.XA CN202210048632A CN114418380A CN 114418380 A CN114418380 A CN 114418380A CN 202210048632 A CN202210048632 A CN 202210048632A CN 114418380 A CN114418380 A CN 114418380A
- Authority
- CN
- China
- Prior art keywords
- user
- party
- evaluation model
- encrypted
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013077 scoring method Methods 0.000 title claims abstract description 23
- 238000013210 evaluation model Methods 0.000 claims abstract description 321
- 238000012549 training Methods 0.000 claims abstract description 88
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000003062 neural network model Methods 0.000 claims abstract description 19
- 230000008569 process Effects 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims description 25
- 238000012216 screening Methods 0.000 claims description 19
- 238000007477 logistic regression Methods 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 abstract description 17
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 230000015654 memory Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000012502 risk assessment Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于联邦学习的用户评分方法、服务器及存储介质,涉及人工智能技术领域。该方法包括:获取第一业务系统存储的当前用户的第一用户特征;将第一用户特征输入至第一用户评价模型,得到第一用户评分;调用第二用户评价模型对当前用户的第二用户特征进行处理,得到第二用户评分,第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型;根据第一用户评分和第二用户评分确定当前用户的目标用户评分。能够结合第一方数据和第二方数据,提高用户评价的准确性。采用联邦学习训练第一用户评价模型和第二用户评价模型能够保证在第一方和第二方的真实数据不被暴露的情况下对模型进行训练,提高数据安全。
Description
技术领域
本发明实施例涉及人工智能技术,尤其涉及一种基于联邦学习的用户评分方法、服务器及存储介质。
背景技术
随着人工智能的发展,越来越多的场景需要通过人工智能为生产提供有效信息服务。目前的用户分析模型通常由一个金融服务主体根据用户特征进行预测。然而通过一个金融附图主体得到的用户评分不够准确。如何能够对用户进行准确评价,提高用户评价准确性,成为亟待解决的问题。
发明内容
本发明提供一种基于联邦学习的用户评分方法、服务器及存储介质,以实现提高用户评价准确性。
第一方面,本发明实施例提供了一种基于联邦学习的用户评分方法,应用于第一方服务器,包括:
获取第一业务系统存储的当前用户的第一用户特征;
将第一用户特征输入至第一用户评价模型,得到第一用户评分;
调用第二用户评价模型对当前用户的第二用户特征进行处理,得到第二用户评分,第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型,第二用户特征为第二业务系统存储当前用户的用户特征;
根据第一用户评分和第二用户评分确定当前用户的目标用户评分。
第二方面,本发明实施例还提供了一种基于联邦学习的用户评分方法,应用于第二方服务器,包括:
一种基于联邦学习的用户评分方法,其特征在于,应用于第二方服务器,包括:
获取第二业务系统存储的当前用户的第二用户特征;
响应于第一方服务器发起的对第二用户评价模型的调用请求,将第二用户特征输入至第二用户评价模型,得到第二用户评分;第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型;
将第二用户评分发送至第一方服务器,以便第一方服务器根据第二用户评分和第一用户评分确定当前用户的目标用户评分,第一用户评分为根据第一用户评价模型得到。
第三方面,本发明实施例还提供了一种基于联邦学习的用户评分装置,应用于第一方服务器,包括:
第一用户特征获取模块,用于获取第一业务系统存储的当前用户的第一用户特征;
第一用户评分确定模块,用于将第一用户特征输入至第一用户评价模型,得到第一用户评分;
第二用户评分调用模块,用于调用第二用户评价模型对当前用户的第二用户特征进行处理,得到第二用户评分,第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型,第二用户特征为第二业务系统存储当前用户的用户特征;
目标用户评分确定模块,用于根据第一用户评分和第二用户评分确定当前用户的目标用户评分。
第四方面,本发明实施例还提供了一种基于联邦学习的用户评分装置,应用于第二方服务器,包括:
第二用户特征确定模块,用于获取第二业务系统存储的当前用户的第二用户特征;
第二用户评分响应模块,用于响应于第一方服务器发起的对第二用户评价模型的调用请求,将第二用户特征输入至第二用户评价模型,得到第二用户评分;第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型;
第二用户评分发送模块,用于将第二用户评分发送至第一方服务器,以便第一方服务器根据第二用户评分和第一用户评分确定当前用户的目标用户评分,第一用户评分为根据第一用户评价模型得到。
第五方面,本发明实施例还提供了一种第一方服务器,第一方服务器包括:
一个或多个第一处理器;
第一存储装置,用于存储一个或多个程序,
当一个或多个程序被一个或多个第一处理器执行,使得一个或多个处理器实现如第一方面所示的基于联邦学习的用户评分方法。
第六方面,本发明实施例还提供了一种第二方服务器,其特征在于,第二方服务器包括:
一个或多个第二处理器;
第二存储装置,用于存储一个或多个程序,
当一个或多个程序被一个或多个第二处理器执行,使得一个或多个处理器实现如第二方面所示的基于联邦学习的用户评分方法。
第七方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行如本申请实施例所示的基于联邦学习的用户评分方法。
本发明提供的基于联邦学习的用户评分方法,第一方服务器获取第一业务系统存储的当前用户的第一用户特征;将第一用户特征输入至第一用户评价模型,得到第一用户评分;调用第二用户评价模型对当前用户的第二用户特征进行处理,得到第二用户评分,第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型,第二用户特征为第二业务系统存储当前用户的用户特征;根据第一用户评分和第二用户评分确定当前用户的目标用户评分。本发明提供的基于联邦学习的用户评分方法,由于联邦学习能够在第一用户评价模型和第二用户评价模型的基础上,使用第一业务系统和第二业务系统的数据对第一用户评价模型和第二用户评价模型进行训练,因此根据第一用户评价模型得到的第一用户评价以及第二用户评价模型得到的第二用户评价确定当前用户的目标用户评分,能够结合第一业务系统数据和第二业务系统数据,提高用户评价的准确性。此外,采用联邦学习训练第一用户评价模型和第二用户评价模型能够保证在第一业务系统和第二业务系统的真实数据不被暴露的情况下对模型进行训练,提高数据安全。
附图说明
图1是本发明实施例一中的基于联邦学习的用户评分方法的流程图;
图2是本发明实施例一中的联邦学习的示意图;
图3是本发明实施例二中的基于联邦学习的用户评分方法的流程图;
图4是本发明实施例三中的一个基于联邦学习的用户评分装置的结构示意图;
图5是本发明实施例三中的另一个基于联邦学习的用户评分装置的结构示意图;
图6是本发明实施例四中的一个基于联邦学习的用户评分装置的结构示意图;
图7是本发明实施例四中的另一个基于联邦学习的用户评分装置的结构示意图;
图8是本发明实施例五中的第一方服务器的结构示意图;
图9是本发明实施例六中的第二方服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
本方案通过联邦学习的方式,实现使用第一业务系统和第二业务系统的数据共同对第一用户评价模型和第二用户评价模型进行训练,得到的第一用户评价模型和第二用户评价模型能够通过结合的方式对用户进行评价,对于评价结果较差的客户的快贷申请不予通过,从而降低银行坏账率。本发明可以应用于在存在数据保密的双方之间,建立联合的模型的场景,该模型可用于进行联合风控或营销推荐。联合风控包括用户快贷风险评价等,营销推荐包括向用户推荐商品信息等。示例性的,用户快贷风险评价的场景中,第一方可以为银行方,第一业务系统为银行方使用的业务系统,第二方可以为公积金方,第二业务系统为公积金方使用的业务系统。第一方通过第一用户评价模型得到第一用户评分,调用第二用户评价模型获取第二用户模型,然后根据第一用户评分和第二用户评分确定目标用户评分,目标用户评分用于确定是否批准用户的快贷申请。
示例性的,营销推荐场景中,第一方可以为银行方,第二方可以为公积金方。第一方通过第一用户评价模型得到第一用户推荐信息,调用第二用户评价模型获取第二用户推荐信息,然后根据第一用户推荐信息和第二用户推荐信息确定目标用户推荐信息。下面以用户快贷风险为例,对本发明技术方案进行说明。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
实施例一
图1为本发明实施例一提供的基于联邦学习的用户评分方法的流程图,本实施例可适用于对用户进行快贷风险评价的情况,该方法可以由第一方服务器来执行,具体包括如下步骤:
步骤110、获取第一业务系统存储的当前用户的第一用户特征。
第一用户评价模型使用的第一用户特征可以包括用户名称、用户年龄、用户历史办理银行卡的刷领及金额等。上述第一用户特征来自于第一业务系统。第一用户评价模型经过训练后其输入的第一用户特征类型是固定的。当用户发起快贷等金融业务请求时,从第一业务系统的业务数据中获取第一用户特征。
步骤120、将第一用户特征输入至第一用户评价模型,得到第一用户评分。
第一方服务器维护有第一用户评价模型,将步骤110获取的第一用户特征输入至第一用户评价模型。第一用户评价模型的输入为多个第一用户特征,输出为第一用户评分。
步骤130、调用第二用户评价模型对当前用户的第二用户特征进行处理,得到第二用户评分。
其中,第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型,第二用户特征为第二业务系统存储当前用户的用户特征。
当用户发起金融业务时,用户授权第二方对用户个人安全数据进行处理。第二方服务器接收到该授权后,具有通过第二业务系统获取第二用户特征的权限。
第二方服务器响应于第一方服务器发起的对第二用户评价模型的调用请求,根据第二用户评价模型对当前用户的第二用户特征进行处理,得到第二用户评分。示例性的,第二用户评价模型的输入为多个第二用户特征,输出为第二用户评分。第二方服务器将得到的第二用户评分发送至第一方服务器。第二用户评价模型输入的多个第二用户特征与第一用户评价模型输入的多个第一用户特征可以为不同特征。
步骤140、根据第一用户评分和第二用户评分确定当前用户的目标用户评分。
将第一用户评分与第二用户评分相加,得到当前用户的目标用户评分。
示例性的,第一用户评价模型和第二用户评价模型使用的逻辑回归算法如下所示:
z1=θa1xa1+θa2xa2+…+θaxxax+θb1xb1+…+θbn-1xbn-+θbnxbn
其中,θa1~θax表示第一用户评价模型通过训练得出的x个模型参数,θb1~θbn表示第二用户评价模型通过训练得出的n-x个模型参数,xa1~xax表示第一方提供的x个特征变量,xb1~xbn表示第二方提供的n-x个特征变量。其中,第一方提供的特征变量xa1~xax,和第二方提供的xb1~xbn均为转换为转换为数值型的变量。
示例性的,第一评分为θa1xa1+θa2xa2+…+θaxxax,
第二评分为θb1xb1+…+θbn-xbn-+θbnxbn。
将第一评分和第二评分代入到上述逻辑回归公式计算出目标用户评分。
进一步的,在步骤110、根据第一用户评价模型获取第一用户特征之前,还包括:
根据联邦学习,结合第二用户评价模型对第一用户评价模型进行训练。
联邦学习能够在第二用户评价模型和第一用户评价模型之间进行加密数据的交互,使得第一业务系统的真实数据不会被第二方知晓,第二业务系统的真实数据不会被第一方知晓。实现在保护第一方和第二方数据安全点同时,使用同一组训练集对第一用户评价模型和第二用户评价模型进行训练,提高数据安全性。
图2为本发明实施例一提供的联邦学习的示意图。包括协作者服务器201、第一用户评价模型202和第二用户评价模型203。协作者服务器201为第三方,也可以为联邦学习的发起方,如第一方。在联邦学习的架构中,首先由协作者服务器201向第一用户评价模型202和第二用户评价模型203发送第一公钥,第一用户评价模型202和第二用户评价模型203使用第一公钥对模型中间结果进行加密并进行交互,第一用户评价模型202和第二用户评价模型203各自根据加密的中间结果确定加密的梯度,将加密梯度发送至协作者服务器201,协作者服务器201根据第一私钥对加密的梯度进行解密,将解密后的梯度反馈至第一用户评价模型202和第二用户评价模型203,以便第一用户评价模型202和第二用户评价模型203进行更新跌倒,直至满足训练截止条件。
在一种实现方式中,根据联邦学习,结合第二用户评价模型对第一用户评价模型进行训练,可以通过下述方式实施:
1)接收协作者服务器发送的第一公钥;
2)对第一用户评价模型的模型参数进行初始化;
3)根据第一用户评价模型的模型参数和目标样本确定第一方中间结果;
4)根据第一公钥对第一方中间结果和目标样本的用户标签进行加密;
5)接收第二方服务器发送的加密后的第二方中间结果;
6)根据加密的第一方中间结果、加密的用户标签以及加密后的第二方中间结果,确定残差;
7)将残差发送至第二方服务器;
8)根据残差计算加密的第一方梯度;
9)将加密的第一方梯度发送至协作者服务器,以便协作者服务器根据第一私钥对加密的第一方梯度进行解密,得到第一方梯度,第一私钥与第一公钥匹配;
10)接收协作者服务器发送的解密后的第一方梯度;
11)根据解密后的第一方梯度对第一用户评价模型的模型参数进行迭代更新,直至达到训练截止条件。
通过上述方式由于协作者持有第一公钥以及第一私钥,第一方服务器和第二方服务器只持有第一公钥,且第一方服务器与第二方服务器之间传输的数据均为使用第一公钥加密的,因此能够在加密条件下实现第一用户评价模型和第二用户评价模型的训练。
在上述实施方式的基础上,在对第一用户评价模型的模型参数进行初始化之前,还包括:
1)将第二公钥发送至第二方服务器;
2)接收第二方服务器发送的第一加密数据,第一加密数据包括使用第二公钥加密的随机数以及哈希加密的第二方样本;
3)根据第二私钥对使用公钥加密的随机数进行解密,得到随机数,第二私钥与第二公钥匹配;
4)根据第二私钥对哈希加密的第二方样本进行私钥签名,得到签名数据;
5)对第一方样本进行哈希加密,根据第二私钥对加密的第一方样本进行私钥签名,对私钥签名的第一方样本进行哈希加密,得到第一方样本加密数据;
6)将签名数据和第一方样本加密数据发送至第二方服务器;
7)接收第二方服务器发送的目标样本加密数据,目标样本加密数据包括加密的第一方样本与第二方样本的交集;
8)根据哈希算法以及第二私钥对目标加密数据进行解密,得到目标样本。
上述实施方式能够在在第二方服务器与第一方服务器之间使用第二公钥对样本进行加密,通过对加密后的数据进行比较,能够得到加密后的样本交集,即目标样本加密数据。进而实现在进行模型训练之前,对第一用户评价模型和第二用户评价模型的训练集中的目标样本进行对齐,进而提高模型训练的准确性。
在上述实施方式的基础上,在对第一用户评价模型的模型参数进行初始化之前,还包括:
将第一方原始用户特征中的字符串转换为数值型变量;对转换后的第一方原始用户特征和第二方原始用户特征进行筛选,确定目标用户特征;根据目标用户特征对原始第一方用户数据进行过滤,得到第一方样本。
在对第一方原始用户特征和第二方原始用户特征进行筛选之前,需要对原始用户特征进行预处理,包括:
可选的,删除身份证号码重复的客户申请数据。可选的,查看数据缺失情况和异常值情况,对连续型特征变量使用特征的均值替换缺失值和异常值、对离散型特征变量使用众数进行填充和替换。可选的,对数据类型进行转换。将字符串类型变量转换为数值型变量,例如:将有序变量使用0~n的数字进行映射变换,将无序变量使用one-hot编码进行处理。可选的,删除常量特征。
可以通过下属方式对原始用户特征进行筛选。对原始用户特征进行证据权重WOE(Weight of Evidence,WOE)分箱,计算WOE值和单调性。计算信息量(Information Value,IV)值。计算特征之间的皮尔森相关性。利用随机森林算法计算特征重要性。
将WOE不单调的,IV值低的,重要性低的,强相关的特征进行删除。并剔除没有建模意义的特征变量,如文本、日期类特征。此外,可以进行专家回选,将专家认为重要性高的特征加入模型训练。进而完成原始用户特征的筛选,得到目标用户特征。
示例性的,可以根据表1所示的筛选方式进行筛选。
表1
根据目标用户特征对原始第一方用户数据进行过滤能够得到第一用户评价模型使用的第一方样本。
通过上述方式能够筛除无用的用户特征,保留对联邦学习有益的特征,提高联邦学习的训练效率。
在另一种实现方式中,根据联邦学习,结合第二用户评价模型对第一用户评价模型进行训练,可通过下述方式实施:
作为数据提供方根据秘钥对第一方样本进行加密,得到加密的第一方样本。
作为数据提供方将秘钥和加密的第一方样本发送至可致信环境服务器,以便可致信服务器根据秘钥对加密的第一方样本解密,得到第一方样本。
作为函数提供方,向可致信环境服务器发送逻辑回归函数,获取可致信环境服务器反馈的逻辑回归函数标识。
作为任务方,使用逻辑回归函数标识指定数据提供方,创建训练任务。
作为数据提供方,将训练任务与第一方样本绑定,以便可致信环境服务基于联邦学习对第一用户评价模型和第二用户评价模型进行训练,得到第一用户评价模型的模型参数和第二用户评价模型的模型参数。
接收可致信环境服务器发送的第一用户评价模型的模型参数,根据第一用户评价模型的模型参数生成第一用户评价模型。
可以构造可致信环境,可致信环境包括数据提供方、结果获取方、任务方和函数提供方。第一方服务器可以作为数据提供方、结果获取方、任务方和函数提供方。第二方可以作为数据提供方。
数据提供方向可信执行环境提供联邦学习使用的训练集(第一方样本以及第二方样本),函数提供方向可执行环境提供进行第一用户评价模型和第二用户评价模型的模型函数。任务方用于向可致信环境发起训练任务。当可致信环境中对模型训练完毕后,将第一用户评价模型的模型参数发送至第一方服务器,将第二用户评价模型的模型参数发送至第二方服务器。由于第一方和第二方均不可以访问可致信环境内的数据,因此通过可致信环境能够更加完全的对第一用户评价模型以及第二用户评价模型进行训练。
在上述实施方式的基础上,根据第一用户评分和第二用户评分确定目标用户评分,可实施为:
根据第一用户评分和第二用户评分确定联邦学习评分;
根据可致信环境确定可致信环境评分;
根据联邦学习评分、联邦学习评分的权重、可致信环境评分以及可致信环境评分的权重确定目标用户评分。
上述实施方式能够为可致信环境和联邦学习配置相应的权重,进而通过两个模型的结合更加准确的进行目标用户评分的确定,提高目标用户评分的准确性。
进一步的,可致信执行环境中可以采用联邦学习以外的机器学习算法建立用户评分模型。例如建立一个逻辑回归模型,其模型参数用于分别与每个第二用户特征和第一方特诊参数向乘,以得到用户评分的逻辑回归。示例性的,表示未使用可致信环境得到联邦学习评分,如使用联邦学习得到的模型得出的联邦学习评分。表示使用可致信环境得到的可致信环境评分。
本发明提供的基于联邦学习的用户评分方法,第一方服务器获取第一业务系统存储的当前用户的第一用户特征;将第一用户特征输入至第一用户评价模型,得到第一用户评分;调用第二用户评价模型对当前用户的第二用户特征进行处理,得到第二用户评分,第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型,第二用户特征为第二业务系统存储当前用户的用户特征;根据第一用户评分和第二用户评分确定当前用户的目标用户评分。本发明提供的基于联邦学习的用户评分方法,由于联邦学习能够在第一用户评价模型和第二用户评价模型的基础上,使用第一业务系统和第二业务系统的数据对第一用户评价模型和第二用户评价模型进行训练,因此根据第一用户评价模型得到的第一用户评价以及第二用户评价模型得到的第二用户评价确定当前用户的目标用户评分,能够结合第一业务系统数据和第二业务系统数据,提高用户评价的准确性。此外,采用联邦学习训练第一用户评价模型和第二用户评价模型能够保证在第一业务系统和第二业务系统的真实数据不被暴露的情况下对模型进行训练,提高数据安全。
实施例二
图3为本发明实施例二提供的基于联邦学习的用户评分方法的流程图,本实施例可适用于对用户进行快贷风险评价的情况,该方法可以由第二方服务器来执行,具体包括如下步骤:
步骤310、获取第二业务系统存储的当前用户的第二用户特征。
第二方服务器中运行有第二用户评价模型。可以根据第二用户评价模型的输入特征通过第二业务系统获取当前用户的第二用户特征。第二方服务器可以访问第二业务系统,根据第二用户评价模型的输入要求获取第二用户特征。
步骤320、响应于第一方服务器发起的对第二用户评价模型的调用请求,将第二用户特征输入至第二用户评价模型,得到第二用户评分。
其中,第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型。第一方服务器向第二方服务器发起调用请求,第二方服务器将第二用户特征输入至第二用户评价模型。第二用户评价模型输出第二用户评分。
步骤330、将第二用户评分发送至第一方服务器,以便第一方服务器根据第二用户评分和第一用户评分确定当前用户的目标用户评分。
其中,第一用户评分为根据第一用户评价模型得到。
进一步的,在步骤310、根据第二用户评价模型获取第二用户特征之前,还包括:
根据联邦学习,结合第一用户评价模型对第二用户评价模型进行训练。
在一种实现方式中,根据联邦学习,结合第一用户评价模型对第二用户评价模型进行训练,可通过下述方式实施:
1)接收协作者服务器发送的第一公钥;
2)对第二用户评价模型的模型参数进行初始化;
3)根据第二用户评价模型的模型参数和目标样本确定第二方中间结果;
4)根据第一公钥对第二方中间结果进行加密;
5)将加密后的第二方中间结果发送至第一方服务器,以便第一方服务器根据加密的第一方中间结果、加密的用户标签以及加密后的第二方中间结果,确定残差;
6)接收第一方服务器发送的残差,根据残差计算加密的第二方梯度;
7)将加密的第二方梯度发送至协作者服务器,以便协作者服务器根据第一私钥对加密的第二方梯度进行解密,得到第二方梯度,第一私钥与第一公钥匹配;
8)接收协作者服务器发送的第二方梯度;
9)根据第二方对第二用户评价模型的模型参数进行迭代更新,直至达到训练截止条件。
通过上述方式第二方服务器只持有第一公钥,且第二方服务器与第一方服务器之间传输的数据均为使用第一公钥加密的,因此能够在加密条件下实现第一用户评价模型和第二用户评价模型的训练。
在上述实施方式的基础上,在对第二用户评价模型的模型参数进行初始化之前,还包括:
1)接收第一方服务器发送的第二公钥;
2)对第二方样本进行哈希加密,根据第二公钥对随机数进行加密;
3)将加密的随机数与哈希加密的第二方样本相乘,得到第一加密数据;
4)将第一加密数据发送至第一方服务器;
5)接收第一方服务器发送的签名数据和第一方样本加密数据;
6)去除签名数据中的随机数;
7)对签名数据进行哈希加密,得到第二方样本加密数据;
8)根据第二方样本加密数据和第一方样本加密数据的交集确定目标样本加密数据;
9)将目标样本加密数据发送至第一方服务器。
上述实施方式能够在在第二方服务器与第一方服务器之间使用第二公钥对样本进行加密,通过对加密后的数据进行比较,能够得到加密后的样本交集,即目标样本加密数据。进而实现在进行模型训练之前,对第一用户评价模型和第二用户评价模型的训练集中的目标样本进行对齐,进而提高模型训练的准确性。
可选的,在对第二用户评价模型的模型参数进行初始化之前,还包括:
将第二方原始用户特征中的字符串转换为数值型变量;对第一方原始用户特征和第二方原始用户特征进行筛选,确定目标用户特征;根据目标用户特征对原始第二方用户数据进行过滤,得到第二方样本。
在对第二方原始用户特征和第二方原始用户特征进行筛选之前,需要对原始用户特征进行预处理,包括:
可选的,删除身份证号码重复的客户申请数据。可选的,查看数据缺失情况和异常值情况,对连续型特征变量使用特征的均值替换缺失值和异常值、对离散型特征变量使用众数进行填充和替换。可选的,对数据类型进行转换。将字符串类型变量转换为数值型变量,例如:将有序变量使用0~n的数字进行映射变换,将无序变量使用one-hot编码进行处理。可选的,删除常量特征。可以参照实施例一种表1所示的方式进行筛选。
在另一种实现方式中,根据联邦学习,结合第一用户评价模型对第二用户评价模型进行训练,可通过下述方式实施:
1)作为数据提供方使用秘钥对第二方样本进行加密,得到加密的第二方样本;
2)作为数据提供方将秘钥和加密的第二方样本发送至可致信环境服务器,以便可致信服务器根据秘钥对加密的第二方样本解密,得到第二方样本;
3)作为数据提供方,将训练任务与第二方样本绑定,以便可致信环境服务基于联邦学习对第一用户评价模型和第二用户评价模型进行训练,得到第一用户评价模型的模型参数和第二用户评价模型的模型参数;
4)接收可致信环境服务器发送的第二用户评价模型的模型参数,根据第二用户评价模型的模型参数生成第二用户评价模型。
本发明实施例提供的基于联邦学习的用户评分方法,第二方服务器获取第二业务系统存储的当前用户的第二用户特征;响应于第一方服务器发起的对第二用户评价模型的调用请求,将第二用户特征输入至第二用户评价模型,得到第二用户评分;第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型;将第二用户评分发送至第一方服务器,以便第一方服务器根据第二用户评分和第一用户评分确定当前用户的目标用户评分。本发明实施例提供的基于联邦学习的用户评分方法,第二方服务器在联邦学习的训练过程中,能够在保护数据真实数据不被查看的情况下,实现第二用户评价模型与第一用户评价模型进行基于联邦学习的训练。得到的第二用户评价模型能够与第一用户评价模型共同对用户进行评分,实现第二用户评价模型为第一用户评价模型提供第二用户评分,提高第一方用户评价的准确性,同时保护了第二方的真实数据,提高数据安全性。
实施例三
图4为本发明实施例三提供的基于联邦学习的用户评分装置的结构示意图,本实施例可适用于对用户进行快贷风险评价的情况,该装置可以由第一方服务器来执行,具体包括:第一用户特征获取模块410、第一用户评分确定模块420、第二用户评分获取模块430以及目标用户评分确定模块440。
第一用户特征获取模块410,用于根据第一用户评价模型获取第一用户特征;
第一用户评分确定模块420,用于将第一用户特征输入至第一用户评价模型,得到第一用户评分;
第二用户评分获取模块430,用于调用第二用户评价模型对第二用户特征进行处理,得到第二用户评分,第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的;
目标用户评分确定模块440,用于根据第一用户评分和第二用户评分确定当前用户的目标用户评分。
在上述实施方式基础上,如图5所示,还包括第一方训练模块450。第一方训练模块450用于:
根据联邦学习,结合第二用户评价模型对第一用户评价模型进行训练。
在上述实施方式基础上,第一方训练模块450用于:
接收协作者服务器发送的第一公钥;
对第一用户评价模型的模型参数进行初始化;
根据第一用户评价模型的模型参数和目标样本确定第一方中间结果;
根据第一公钥对第一方中间结果和目标样本的用户标签进行加密;
接收第二方服务器发送的加密后的第二方中间结果;
根据加密的第一方中间结果、加密的用户标签以及加密后的第二方中间结果,确定残差;
将残差发送至第二方服务器;
根据残差计算加密的第一方梯度;
将加密的第一方梯度发送至协作者服务器,以便协作者服务器根据第一私钥对加密的第一方梯度进行解密,得到第一方梯度,第一私钥与第一公钥匹配;
接收协作者服务器发送的第一方梯度;
根据第一方梯度对第一用户评价模型的模型参数进行迭代更新,直至达到训练截止条件。
在上述实施方式基础上,还包括第一方样本对齐模块460。第一方样本对齐模块460用于:
将第二公钥发送至第二方服务器;
接收第二方服务器发送的第一加密数据,第一加密数据包括使用第二公钥加密的随机数以及哈希加密的第二方样本;
根据第二私钥对使用公钥加密的随机数进行解密,得到随机数,第二私钥与第二公钥匹配;
根据第二私钥对哈希加密的第二方样本进行私钥签名,得到签名数据;
对第一方样本进行哈希加密,根据第二私钥对加密的第一方样本进行私钥签名,对私钥签名的第一方样本进行哈希加密,得到第一方样本加密数据;
将签名数据和第一方样本加密数据发送至第二方服务器;
接收第二方服务器发送的目标样本加密数据,目标样本加密数据包括加密的第一方样本与第二方样本的交集;
根据哈希算法以及第二私钥对目标加密数据进行解密,得到目标样本。
在上述实施方式基础上,还包括第一方特征筛选模块470。第一方特征筛选模块470用于:
将第一方原始用户特征中的字符串转换为数值型变量;
对第一方原始用户特征和第二方原始用户特征进行筛选,确定目标用户特征;
根据目标用户特征对原始第一方用户数据进行过滤,得到第一方样本。
在上述实施方式基础上,第一方训练模块450用于:
作为数据提供方根据秘钥对第一方样本进行加密,得到加密的第一方样本;
作为数据提供方将秘钥和加密的第一方样本发送至可致信环境服务器,以便可致信服务器根据秘钥对加密的第一方样本解密,得到第一方样本;
作为函数提供方,向可致信环境服务器发送逻辑回归函数,获取可致信环境服务器反馈的逻辑回归函数标识;
为任务方,使用逻辑回归函数标识指定数据提供方,创建训练任务;
作为数据提供方,将训练任务与第一方样本绑定,以便可致信环境服务基于联邦学习对第一用户评价模型和第二用户评价模型进行训练,得到第一用户评价模型的模型参数和第二用户评价模型的模型参数;
接收可致信环境服务器发送的第一用户评价模型的模型参数,根据第一用户评价模型的模型参数生成第一用户评价模型。
在上述实施方式基础上,目标用户评分确定模块440用于:
根据第一用户评分和第二用户评分确定联邦学习评分;
根据可致信环境确定可致信环境评分;
根据联邦学习评分、联邦学习评分的权重、可致信环境评分以及可致信环境评分的权重确定目标用户评分。
本发明提供的基于联邦学习的用户评分装置,第一用户特征获取模块410获取第一业务系统存储的当前用户的第一用户特征;第一用户评分确定模块420将第一用户特征输入至第一用户评价模型,得到第一用户评分;第二用户评分获取模块430调用第二用户评价模型对当前用户的第二用户特征进行处理,得到第二用户评分,第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型,第二用户特征为第二业务系统存储当前用户的用户特征;目标用户评分确定模块440根据第一用户评分和第二用户评分确定当前用户的目标用户评分。由于联邦学习能够在第一用户评价模型和第二用户评价模型的基础上,使用第一业务系统和第二业务系统的数据对第一用户评价模型和第二用户评价模型进行训练,因此根据第一用户评价模型得到的第一用户评价以及第二用户评价模型得到的第二用户评价确定当前用户的目标用户评分,能够结合第一业务系统数据和第二业务系统数据,提高用户评价的准确性。此外,采用联邦学习训练第一用户评价模型和第二用户评价模型能够保证在第一业务系统和第二业务系统的真实数据不被暴露的情况下对模型进行训练,提高数据安全。
本发明实施例所提供的基于联邦学习的用户评分装置可执行本发明任意实施例所提供的基于联邦学习的用户评分方法,具备执行方法相应的功能模块和有益效果。
实施例四
图6为本发明实施例四提供的基于联邦学习的用户评分装置的结构示意图,本实施例可适用于对用户进行快贷风险评价的情况,该装置可以由第二方服务器来执行,具体包括:第二用户特征确定模块510、第二用户评分响应模块520以及第二用户评分发送模块530。
第二用户特征确定模块510,用于获取第二业务系统存储的当前用户的第二用户特征;
第二用户评分响应模块520,用于响应于第一方服务器发起的对第二用户评价模型的调用请求,将第二用户特征输入至第二用户评价模型,得到第二用户评分;第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型;
第二用户评分发送模块530,用于将第二用户评分发送至第一方服务器,以便第一方服务器根据第二用户评分和第一用户评分确定当前用户的目标用户评分,第一用户评分为根据第一用户评价模型得到。
在上述实施方式基础上,如图7所示,还包括第二方训练模块540。第二方训练模块540用于:
根据联邦学习,结合第一用户评价模型对第二用户评价模型进行训练。
在上述实施方式基础上,第二方训练模块540用于:
接收协作者服务器发送的第一公钥;
对第二用户评价模型的模型参数进行初始化;
根据第二用户评价模型的模型参数和目标样本确定第二方中间结果;
根据第一公钥对第二方中间结果进行加密;
将加密后的第二方中间结果发送至第一方服务器,以便第一方服务器根据加密的第一方中间结果、加密的用户标签以及加密后的第二方中间结果,确定残差;
接收第一方服务器发送的残差,根据残差计算加密的第二方梯度;
将加密的第二方梯度发送至协作者服务器,以便协作者服务器根据第一私钥对加密的第二方梯度进行解密,得到第二方梯度,第一私钥与第一公钥匹配;
接收协作者服务器发送的第二方梯度;
根据第二方对第二用户评价模型的模型参数进行迭代更新,直至达到训练截止条件。
在上述实施方式基础上,还包括第二方对齐模块550,第二方对齐模块550用于:
接收第一方服务器发送的第二公钥;
对第二方样本进行哈希加密,根据第二公钥对随机数进行加密;
将加密的随机数与哈希加密的第二方样本相乘,得到第一加密数据;
将第一加密数据发送至第一方服务器;
接收第一方服务器发送的签名数据和第一方样本加密数据;
去除签名数据中的随机数;
对签名数据进行哈希加密,得到第二方样本加密数据;
根据第二方样本加密数据和第一方样本加密数据的交集确定目标样本加密数据;
将目标样本加密数据发送至第一方服务器。
在上述实施方式基础上还包括第二方特征筛选模块560,第二方特征筛选模块560用于:
将第二方原始用户特征中的字符串转换为数值型变量;
对第一方原始用户特征和第二方原始用户特征进行筛选,确定目标用户特征;
根据目标用户特征对原始第二方用户数据进行过滤,得到第二方样本。
在上述实施方式基础上,第二方训练模块540用于:
根据联邦学习,结合第一用户评价模型对第二用户评价模型进行训练,包括:
作为数据提供方使用秘钥对第二方样本进行加密,得到加密的第二方样本;
作为数据提供方将秘钥和加密的第二方样本发送至可致信环境服务器,以便可致信服务器根据秘钥对加密的第二方样本解密,得到第二方样本;
作为数据提供方,将训练任务与第二方样本绑定,以便可致信环境服务基于联邦学习对第一用户评价模型和第二用户评价模型进行训练,得到第一用户评价模型的模型参数和第二用户评价模型的模型参数;
接收可致信环境服务器发送的第二用户评价模型的模型参数,根据第二用户评价模型的模型参数生成第二用户评价模型。
本发明实施例提供的基于联邦学习的用户评分装置,第二用户特征确定模块510获取第二业务系统存储的当前用户的第二用户特征;第二用户评分响应模块520响应于第一方服务器发起的对第二用户评价模型的调用请求,将第二用户特征输入至第二用户评价模型,得到第二用户评分;第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型;第二用户评分发送模块530将第二用户评分发送至第一方服务器,以便第一方服务器根据第二用户评分和第一用户评分确定当前用户的目标用户评分,第一用户评分为根据第一用户评价模型得到。第二方服务器在联邦学习的训练过程中,能够在保护数据真实数据不被查看的情况下,实现第二用户评价模型与第一用户评价模型进行基于联邦学习的训练。得到的第二用户评价模型能够与第一用户评价模型共同对用户进行评分,实现第二用户评价模型为第一用户评价模型提供第二用户评分,提高第一方用户评价的准确性,同时保护了第二方的真实数据,提高数据安全性。
本发明实施例所提供的基于联邦学习的用户评分装置可执行本发明任意实施例所提供的基于联邦学习的用户评分方法,具备执行方法相应的功能模块和有益效果。
实施例五
图8为本发明实施例五提供的一种第一方服务器的结构示意图,如图8所示,该第一方服务器包括第一处理器60、第一存储器61、第一输入装置62和第一输出装置63;第一方服务器中第一处理器60的数量可以是一个或多个,图8中以一个第一处理器60为例;第一方服务器中的第一处理器60、第一存储器61、第一输入装置62和第一输出装置63可以通过总线或其他方式连接,图8中以通过总线连接为例。
第一存储器61作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的基于联邦学习的用户评分方法对应的程序指令/模块(例如,基于联邦学习的用户评分装置中的第一用户特征获取模块410、第一用户评分确定模块420、第二用户评分获取模块430、目标用户评分确定模块440、第一方训练模块450、第一方样本对齐模块460以及第一方特征筛选模块470)。第一处理器60通过运行存储在第一存储器61中的软件程序、指令以及模块,从而执行第一方服务器的各种功能应用以及数据处理,即实现上述的基于联邦学习的用户评分方法。
第一存储器61可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,第一存储器61可以包括高速随机存取第一存储器,还可以包括非易失性第一存储器,例如至少一个磁盘第一存储器件、闪存器件、或其他非易失性固态第一存储器件。在一些实例中,第一存储器61可进一步包括相对于第一处理器60远程设置的第一存储器,这些远程第一存储器可以通过网络连接至第一方服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
第一输入装置62可用于接收输入的数字或字符信息,以及产生与第一方服务器的用户设置以及功能控制有关的键信号输入。第一输出装置63可包括显示屏等显示设备。
实施例六
图9为本发明实施例六提供的一种第二方服务器的结构示意图,如图9所示,该第二方服务器包括第二处理器70、第二存储器71、第二输入装置72和第二输出装置73;第一方服务器中第二处理器70的数量可以是一个或多个,图9中以一个第二处理器70为例;第一方服务器中的第二处理器70、第二存储器71、第二输入装置72和第二输出装置73可以通过总线或其他方式连接,图9中以通过总线连接为例。
第二存储器71作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的基于联邦学习的用户评分方法对应的程序指令/模块(例如,基于联邦学习的用户评分装置中的第二用户特征确定模块510、第二用户评分响应模块520、第二用户评分发送模块530、第二方训练模块540、第二方对齐模块550以及第二方特征筛选模块560)。第二处理器70通过运行存储在第二存储器71中的软件程序、指令以及模块,从而执行第一方服务器的各种功能应用以及数据处理,即实现上述的基于联邦学习的用户评分方法。
第二存储器71可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,第二存储器71可以包括高速随机存取第二存储器,还可以包括非易失性第二存储器,例如至少一个磁盘第二存储器件、闪存器件、或其他非易失性固态第二存储器件。在一些实例中,第二存储器71可进一步包括相对于第二处理器70远程设置的第二存储器,这些远程第二存储器可以通过网络连接至第一方服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
第二输入装置72可用于接收输入的数字或字符信息,以及产生与第一方服务器的用户设置以及功能控制有关的键信号输入。第二输出装置73可包括显示屏等显示设备。
实施例七
本发明实施例七还提供一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行一种基于联邦学习的用户评分方法,该方法可以应用于第一方服务器,包括:
获取第一业务系统存储的当前用户的第一用户特征;
将第一用户特征输入至第一用户评价模型,得到第一用户评分;
调用第二用户评价模型对当前用户的第二用户特征进行处理,得到第二用户评分,第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型,第二用户特征为第二业务系统存储当前用户的用户特征;
根据第一用户评分和第二用户评分确定当前用户的目标用户评分。
在上述实施方式的基础上,在根据第一用户评价模型获取第一用户特征之前,还包括:
根据联邦学习,结合第二用户评价模型对第一用户评价模型进行训练。
在上述实施方式的基础上,根据联邦学习,结合第二用户评价模型对第一用户评价模型进行训练,包括:
接收协作者服务器发送的第一公钥;
对第一用户评价模型的模型参数进行初始化;
根据第一用户评价模型的模型参数和目标样本确定第一方中间结果;
根据第一公钥对第一方中间结果和目标样本的用户标签进行加密;
接收第二方服务器发送的加密后的第二方中间结果;
根据加密的第一方中间结果、加密的用户标签以及加密后的第二方中间结果,确定残差;
将残差发送至第二方服务器;
根据残差计算加密的第一方梯度;
将加密的第一方梯度发送至协作者服务器,以便协作者服务器根据第一私钥对加密的第一方梯度进行解密,得到第一方梯度,第一私钥与第一公钥匹配;
接收协作者服务器发送的解密后的第一方梯度;
根据解密后的第一方梯度对第一用户评价模型的模型参数进行迭代更新,直至达到训练截止条件。
在上述实施方式的基础上,在对第一用户评价模型的模型参数进行初始化之前,还包括:
将第二公钥发送至第二方服务器;
接收第二方服务器发送的第一加密数据,第一加密数据包括使用第二公钥加密的随机数以及哈希加密的第二方样本;
根据第二私钥对使用公钥加密的随机数进行解密,得到随机数,第二私钥与第二公钥匹配;
根据第二私钥对哈希加密的第二方样本进行私钥签名,得到签名数据;
对第一方样本进行哈希加密,根据第二私钥对加密的第一方样本进行私钥签名,对私钥签名的第一方样本进行哈希加密,得到第一方样本加密数据;
将签名数据和第一方样本加密数据发送至第二方服务器;
接收第二方服务器发送的目标样本加密数据,目标样本加密数据包括加密的第一方样本与第二方样本的交集;
根据哈希算法以及第二私钥对目标加密数据进行解密,得到目标样本。
在上述实施方式的基础上,在对第一用户评价模型的模型参数进行初始化之前,还包括:
将第一方原始用户特征中的字符串转换为数值型变量;
对转换后的第一方原始用户特征和第二方原始用户特征进行筛选,确定目标用户特征;
根据目标用户特征对原始第一方用户数据进行过滤,得到第一方样本。
在上述实施方式的基础上,根据联邦学习,结合第二用户评价模型对第一用户评价模型进行训练,包括:
作为数据提供方根据秘钥对第一方样本进行加密,得到加密的第一方样本;
作为数据提供方将秘钥和加密的第一方样本发送至可致信环境服务器,以便可致信服务器根据秘钥对加密的第一方样本解密,得到第一方样本;
作为函数提供方,向可致信环境服务器发送逻辑回归函数,获取可致信环境服务器反馈的逻辑回归函数标识;
作为任务方,使用逻辑回归函数标识指定数据提供方,创建训练任务;
作为数据提供方,将训练任务与第一方样本绑定,以便可致信环境服务基于联邦学习对第一用户评价模型和第二用户评价模型进行训练,得到第一用户评价模型的模型参数和第二用户评价模型的模型参数;
接收可致信环境服务器发送的第一用户评价模型的模型参数,根据第一用户评价模型的模型参数生成第一用户评价模型。
该方法还可以应用于第二方服务器,包括:
获取第二业务系统存储的当前用户的第二用户特征;
响应于第一方服务器发起的对第二用户评价模型的调用请求,将第二用户特征输入至第二用户评价模型,得到第二用户评分;第一用户评价模型和第二用户评价模型为通过联邦学习训练得到的神经网络模型;
将第二用户评分发送至第一方服务器,以便第一方服务器根据第二用户评分和第一用户评分确定当前用户的目标用户评分,第一用户评分为根据第一用户评价模型得到。
在上述实施方式的基础上,在根据第二用户评价模型获取第二用户特征之前,还包括:
根据联邦学习,结合第一用户评价模型对第二用户评价模型进行训练。
在上述实施方式的基础上,根据联邦学习,结合第一用户评价模型对第二用户评价模型进行训练,包括:
接收协作者服务器发送的第一公钥;
对第二用户评价模型的模型参数进行初始化;
根据第二用户评价模型的模型参数和目标样本确定第二方中间结果;
根据第一公钥对第二方中间结果进行加密;
将加密后的第二方中间结果发送至第一方服务器,以便第一方服务器根据加密的第一方中间结果、加密的用户标签以及加密后的第二方中间结果,确定残差;
接收第一方服务器发送的残差,根据残差计算加密的第二方梯度;
将加密的第二方梯度发送至协作者服务器,以便协作者服务器根据第一私钥对加密的第二方梯度进行解密,得到第二方梯度,第一私钥与第一公钥匹配;
接收协作者服务器发送的第二方梯度;
根据第二方对第二用户评价模型的模型参数进行迭代更新,直至达到训练截止条件。
在上述实施方式的基础上,在对第二用户评价模型的模型参数进行初始化之前,还包括:
接收第一方服务器发送的第二公钥;
对第二方样本进行哈希加密,根据第二公钥对随机数进行加密;
将加密的随机数与哈希加密的第二方样本相乘,得到第一加密数据;
将第一加密数据发送至第一方服务器;
接收第一方服务器发送的签名数据和第一方样本加密数据;
去除签名数据中的随机数;
对签名数据进行哈希加密,得到第二方样本加密数据;
根据第二方样本加密数据和第一方样本加密数据的交集确定目标样本加密数据;
将目标样本加密数据发送至第一方服务器。
在上述实施方式的基础上,在对第二用户评价模型的模型参数进行初始化之前,还包括:
将第二方原始用户特征中的字符串转换为数值型变量;
对第一方原始用户特征和第二方原始用户特征进行筛选,确定目标用户特征;
根据目标用户特征对原始第二方用户数据进行过滤,得到第二方样本。
在上述实施方式的基础上,根据联邦学习,结合第一用户评价模型对第二用户评价模型进行训练,包括:
作为数据提供方使用秘钥对第二方样本进行加密,得到加密的第二方样本;
作为数据提供方将秘钥和加密的第二方样本发送至可致信环境服务器,以便可致信服务器根据秘钥对加密的第二方样本解密,得到第二方样本;
作为数据提供方,将训练任务与第二方样本绑定,以便可致信环境服务基于联邦学习对第一用户评价模型和第二用户评价模型进行训练,得到第一用户评价模型的模型参数和第二用户评价模型的模型参数;
接收可致信环境服务器发送的第二用户评价模型的模型参数,根据第二用户评价模型的模型参数生成第二用户评价模型。
在上述实施方式的基础上,根据第一用户评分和第二用户评分确定目标用户评分,包括:
根据第一用户评分和第二用户评分确定联邦学习评分;
根据可致信环境确定可致信环境评分;
根据联邦学习评分、联邦学习评分的权重、可致信环境评分以及可致信环境评分的权重确定目标用户评分。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上的方法操作,还可以执行本发明任意实施例所提供的基于联邦学习的用户评分方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述基于联邦学习的用户评分装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (18)
1.一种基于联邦学习的用户评分方法,其特征在于,应用于第一方服务器,包括:
获取第一业务系统存储的当前用户的第一用户特征;
将所述第一用户特征输入至第一用户评价模型,得到第一用户评分;
调用第二用户评价模型对所述当前用户的第二用户特征进行处理,得到第二用户评分,所述第一用户评价模型和所述第二用户评价模型为通过联邦学习训练得到的神经网络模型,所述第二用户特征为第二业务系统存储当前用户的用户特征;
根据所述第一用户评分和所述第二用户评分确定所述当前用户的目标用户评分。
2.根据权利要求1所述的方法,其特征在于,在根据第一用户评价模型获取第一用户特征之前,还包括:
根据联邦学习,结合第二用户评价模型对第一用户评价模型进行训练。
3.根据权利要求2所述的方法,其特征在于,所述根据联邦学习,结合第二用户评价模型对第一用户评价模型进行训练,包括:
接收协作者服务器发送的第一公钥;
对第一用户评价模型的模型参数进行初始化;
根据第一用户评价模型的模型参数和目标样本确定第一方中间结果;
根据所述第一公钥对所述第一方中间结果和目标样本的用户标签进行加密;
接收第二方服务器发送的加密后的第二方中间结果;
根据加密的第一方中间结果、加密的用户标签以及所述加密后的第二方中间结果,确定残差;
将所述残差发送至第二方服务器;
根据所述残差计算加密的第一方梯度;
将所述加密的第一方梯度发送至协作者服务器,以便所述协作者服务器根据第一私钥对所述加密的第一方梯度进行解密,得到第一方梯度,所述第一私钥与所述第一公钥匹配;
接收协作者服务器发送的解密后的第一方梯度;
根据所述解密后的第一方梯度对所述第一用户评价模型的模型参数进行迭代更新,直至达到训练截止条件。
4.根据权利要求3所述的方法,其特征在于,在对第一用户评价模型的模型参数进行初始化之前,还包括:
将第二公钥发送至第二方服务器;
接收所述第二方服务器发送的第一加密数据,所述第一加密数据包括使用所述第二公钥加密的随机数以及哈希加密的第二方样本;
根据第二私钥对使用公钥加密的随机数进行解密,得到随机数,所述第二私钥与所述第二公钥匹配;
根据所述第二私钥对所述哈希加密的第二方样本进行私钥签名,得到签名数据;
对第一方样本进行哈希加密,根据所述第二私钥对加密的第一方样本进行私钥签名,对私钥签名的第一方样本进行哈希加密,得到第一方样本加密数据;
将所述签名数据和所述第一方样本加密数据发送至所述第二方服务器;
接收所述第二方服务器发送的目标样本加密数据,所述目标样本加密数据包括加密的第一方样本与第二方样本的交集;
根据哈希算法以及所述第二私钥对所述目标加密数据进行解密,得到目标样本。
5.根据权利要求4述的方法,其特征在于,在对第一用户评价模型的模型参数进行初始化之前,还包括:
将第一方原始用户特征中的字符串转换为数值型变量;
对转换后的所述第一方原始用户特征和第二方原始用户特征进行筛选,确定目标用户特征;
根据所述目标用户特征对原始第一方用户数据进行过滤,得到第一方样本。
6.根据权利要求2所述的方法,其特征在于,所述根据联邦学习,结合第二用户评价模型对第一用户评价模型进行训练,包括:
作为数据提供方根据秘钥对第一方样本进行加密,得到加密的第一方样本;
作为数据提供方将所述秘钥和所述加密的第一方样本发送至可致信环境服务器,以便所述可致信服务器根据所述秘钥对所述加密的第一方样本解密,得到第一方样本;
作为函数提供方,向所述可致信环境服务器发送逻辑回归函数,获取所述可致信环境服务器反馈的逻辑回归函数标识;
作为任务方,使用所述逻辑回归函数标识指定数据提供方,创建训练任务;
作为数据提供方,将训练任务与第一方样本绑定,以便可致信环境服务基于联邦学习对第一用户评价模型和第二用户评价模型进行训练,得到第一用户评价模型的模型参数和第二用户评价模型的模型参数;
接收可致信环境服务器发送的第一用户评价模型的模型参数,根据所述第一用户评价模型的模型参数生成第一用户评价模型。
7.根据权利要求6所述的方法,其特征在于,根据所述第一用户评分和所述第二用户评分确定目标用户评分,包括:
根据所述第一用户评分和所述第二用户评分确定联邦学习评分;
根据可致信环境确定可致信环境评分;
根据所述联邦学习评分、联邦学习评分的权重、所述可致信环境评分以及可致信环境评分的权重确定目标用户评分。
8.一种基于联邦学习的用户评分方法,其特征在于,应用于第二方服务器,包括:
获取第二业务系统存储的当前用户的第二用户特征;
响应于第一方服务器发起的对第二用户评价模型的调用请求,将所述第二用户特征输入至第二用户评价模型,得到第二用户评分;第一用户评价模型和所述第二用户评价模型为通过联邦学习训练得到的神经网络模型;
将所述第二用户评分发送至所述第一方服务器,以便所述第一方服务器根据所述第二用户评分和第一用户评分确定所述当前用户的目标用户评分,所述第一用户评分为根据所述第一用户评价模型得到。
9.根据权利要求8所述的方法,其特征在于,在根据第二用户评价模型获取第二用户特征之前,还包括:
根据联邦学习,结合第一用户评价模型对第二用户评价模型进行训练。
10.根据权利要求9所述的方法,其特征在于,所述根据联邦学习,结合第一用户评价模型对第二用户评价模型进行训练,包括:
接收协作者服务器发送的第一公钥;
对第二用户评价模型的模型参数进行初始化;
根据第二用户评价模型的模型参数和目标样本确定第二方中间结果;
根据所述第一公钥对所述第二方中间结果进行加密;
将加密后的第二方中间结果发送至第一方服务器,以便所述第一方服务器根据加密的第一方中间结果、加密的用户标签以及所述加密后的第二方中间结果,确定残差;
接收所述第一方服务器发送的残差,根据所述残差计算加密的第二方梯度;
将所述加密的第二方梯度发送至协作者服务器,以便所述协作者服务器根据第一私钥对所述加密的第二方梯度进行解密,得到第二方梯度,所述第一私钥与所述第一公钥匹配;
接收协作者服务器发送的第二方梯度;
根据所述第二方对第二用户评价模型的模型参数进行迭代更新,直至达到训练截止条件。
11.根据权利要求10所述的方法,其特征在于,在对第二用户评价模型的模型参数进行初始化之前,还包括:
接收第一方服务器发送的第二公钥;
对第二方样本进行哈希加密,根据所述第二公钥对随机数进行加密;
将加密的随机数与哈希加密的第二方样本相乘,得到第一加密数据;
将所述第一加密数据发送至所述第一方服务器;
接收所述第一方服务器发送的签名数据和第一方样本加密数据;
去除所述签名数据中的随机数;
对所述签名数据进行哈希加密,得到第二方样本加密数据;
根据所述第二方样本加密数据和所述第一方样本加密数据的交集确定目标样本加密数据;
将目标样本加密数据发送至所述第一方服务器。
12.根据权利要求11所述的方法,其特征在于,在对第二用户评价模型的模型参数进行初始化之前,还包括:
将第二方原始用户特征中的字符串转换为数值型变量;
对第一方原始用户特征和所述第二方原始用户特征进行筛选,确定目标用户特征;
根据所述目标用户特征对原始第二方用户数据进行过滤,得到第二方样本。
13.根据权利要求9所述的方法,其特征在于,所述根据联邦学习,结合第一用户评价模型对第二用户评价模型进行训练,包括:
作为数据提供方使用秘钥对第二方样本进行加密,得到加密的第二方样本;
作为数据提供方将所述秘钥和所述加密的第二方样本发送至可致信环境服务器,以便可致信服务器根据所述秘钥对所述加密的第二方样本解密,得到第二方样本;
作为数据提供方,将训练任务与第二方样本绑定,以便可致信环境服务基于联邦学习对第一用户评价模型和第二用户评价模型进行训练,得到第一用户评价模型的模型参数和第二用户评价模型的模型参数;
接收可致信环境服务器发送的第二用户评价模型的模型参数,根据所述第二用户评价模型的模型参数生成第二用户评价模型。
14.一种基于联邦学习的用户评分装置,其特征在于,应用于第一方服务器,包括:
第一用户特征获取模块,用于获取第一业务系统存储的当前用户的第一用户特征;
第一用户评分确定模块,用于将所述第一用户特征输入至第一用户评价模型,得到第一用户评分;
第二用户评分调用模块,用于调用第二用户评价模型对所述当前用户的第二用户特征进行处理,得到第二用户评分,所述第一用户评价模型和所述第二用户评价模型为通过联邦学习训练得到的神经网络模型,所述第二用户特征为第二业务系统存储当前用户的用户特征;
目标用户评分确定模块,用于根据所述第一用户评分和所述第二用户评分确定所述当前用户的目标用户评分。
15.一种基于联邦学习的用户评分装置,其特征在于,应用于第二方服务器,包括:
第二用户特征确定模块,用于获取第二业务系统存储的当前用户的第二用户特征;
第二用户评分响应模块,用于响应于第一方服务器发起的对第二用户评价模型的调用请求,将所述第二用户特征输入至第二用户评价模型,得到第二用户评分;第一用户评价模型和所述第二用户评价模型为通过联邦学习训练得到的神经网络模型;
第二用户评分发送模块,用于将所述第二用户评分发送至所述第一方服务器,以便所述第一方服务器根据所述第二用户评分和第一用户评分确定所述当前用户的目标用户评分,所述第一用户评分为根据所述第一用户评价模型得到。
16.一种第一方服务器,其特征在于,所述第一方服务器包括:
一个或多个第一处理器;
第一存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个第一处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的基于联邦学习的用户评分方法。
17.一种第二方服务器,其特征在于,所述第二方服务器包括:
一个或多个第二处理器;
第二存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个第二处理器执行,使得所述一个或多个第二处理器实现如权利要求8-13中任一所述的基于联邦学习的用户评分方法。
18.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-13中任一所述的基于联邦学习的用户评分方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210048632.XA CN114418380B (zh) | 2022-01-17 | 2022-01-17 | 基于联邦学习的用户评分方法、服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210048632.XA CN114418380B (zh) | 2022-01-17 | 2022-01-17 | 基于联邦学习的用户评分方法、服务器及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114418380A true CN114418380A (zh) | 2022-04-29 |
CN114418380B CN114418380B (zh) | 2024-09-06 |
Family
ID=81273670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210048632.XA Active CN114418380B (zh) | 2022-01-17 | 2022-01-17 | 基于联邦学习的用户评分方法、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114418380B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023216494A1 (zh) * | 2022-05-09 | 2023-11-16 | 北京淇瑀信息科技有限公司 | 基于联邦学习的用户服务策略确定方法及装置 |
WO2024147440A1 (ko) * | 2023-01-03 | 2024-07-11 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021115480A1 (zh) * | 2020-06-30 | 2021-06-17 | 平安科技(深圳)有限公司 | 联邦学习方法、装置、设备和存储介质 |
WO2021121106A1 (zh) * | 2019-12-20 | 2021-06-24 | 深圳前海微众银行股份有限公司 | 基于联邦学习的个性化推荐方法、装置、设备及介质 |
CN113158241A (zh) * | 2021-04-06 | 2021-07-23 | 深圳市洞见智慧科技有限公司 | 基于联邦学习的岗位推荐方法及装置 |
CN113722987A (zh) * | 2021-08-16 | 2021-11-30 | 京东科技控股股份有限公司 | 联邦学习模型的训练方法、装置、电子设备和存储介质 |
-
2022
- 2022-01-17 CN CN202210048632.XA patent/CN114418380B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021121106A1 (zh) * | 2019-12-20 | 2021-06-24 | 深圳前海微众银行股份有限公司 | 基于联邦学习的个性化推荐方法、装置、设备及介质 |
WO2021115480A1 (zh) * | 2020-06-30 | 2021-06-17 | 平安科技(深圳)有限公司 | 联邦学习方法、装置、设备和存储介质 |
CN113158241A (zh) * | 2021-04-06 | 2021-07-23 | 深圳市洞见智慧科技有限公司 | 基于联邦学习的岗位推荐方法及装置 |
CN113722987A (zh) * | 2021-08-16 | 2021-11-30 | 京东科技控股股份有限公司 | 联邦学习模型的训练方法、装置、电子设备和存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023216494A1 (zh) * | 2022-05-09 | 2023-11-16 | 北京淇瑀信息科技有限公司 | 基于联邦学习的用户服务策略确定方法及装置 |
WO2024147440A1 (ko) * | 2023-01-03 | 2024-07-11 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
Also Published As
Publication number | Publication date |
---|---|
CN114418380B (zh) | 2024-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10547444B2 (en) | Cloud encryption key broker apparatuses, methods and systems | |
US20180248699A1 (en) | Systems and methods for providing a universal decentralized solution for verification of users with cross-verification features | |
CN109768983B (zh) | 基于区块链的多维动态身份识别方法、装置及系统 | |
CN113011632B (zh) | 企业风险评估方法、装置、设备及计算机可读存储介质 | |
CN114418380B (zh) | 基于联邦学习的用户评分方法、服务器及存储介质 | |
CN111414650A (zh) | 一种基于区块链存证的订单处理方法及系统 | |
CN111818186B (zh) | 一种信息共享方法和系统 | |
CN110837653A (zh) | 标签预测方法、装置以及计算机可读存储介质 | |
CN111383113A (zh) | 可疑客户预测方法、装置、设备及可读存储介质 | |
CN110471908A (zh) | 一种联合建模方法和装置 | |
CN110414197B (zh) | 基于行为特征的银行用户身份验证方法及装置 | |
US11362806B2 (en) | System and methods for recording codes in a distributed environment | |
US11699185B2 (en) | Systems and methods for privacy-preserving inventory matching | |
CN111681141B (zh) | 文件认证方法、文件认证装置及终端设备 | |
CA2948229A1 (en) | Systems and method for tracking enterprise events using hybrid public-private blockchain ledgers | |
CN117036023A (zh) | 元宇宙内识别异常交易网络的方法、系统、设备及介质 | |
WO2020039173A1 (en) | Transaction system and method | |
CN116051269A (zh) | 一种基于区块链和零知识证明的质押融资业务数据处理方法以及装置 | |
CN115756255A (zh) | 停车场设备的设备参数处理方法、装置、设备和存储介质 | |
CN115525922A (zh) | 基于隐私计算的金融隐私数据安全决策方法、装置及设备 | |
CN108632228B (zh) | 一种决策引擎调度方法及系统 | |
CN114553684B (zh) | 网点运维方法、装置、计算机设备、存储介质 | |
CN111985922B (zh) | 基于区块链离线支付的信息分配方法及数字金融服务平台 | |
US20240037543A1 (en) | Systems and methods for entity labeling based on behavior | |
EP4332811A1 (en) | Method, computer program and system for collecting confidential data from several data providers, for joint analysis of said data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |