CN115695004A - 数据处理方法、装置和服务器 - Google Patents

数据处理方法、装置和服务器 Download PDF

Info

Publication number
CN115695004A
CN115695004A CN202211353849.8A CN202211353849A CN115695004A CN 115695004 A CN115695004 A CN 115695004A CN 202211353849 A CN202211353849 A CN 202211353849A CN 115695004 A CN115695004 A CN 115695004A
Authority
CN
China
Prior art keywords
server
data
target
ciphertext data
intermediate result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211353849.8A
Other languages
English (en)
Inventor
张延�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202211353849.8A priority Critical patent/CN115695004A/zh
Publication of CN115695004A publication Critical patent/CN115695004A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书提供了数据处理方法、装置和服务器,应用于人工智能技术领域。基于该方法,具体实施前,第一服务器和第二服务器可以响应联合训练请求,分别利用各自所持有的数据,在保护数据隐私的前提下,通过第三服务器的协助,联合训练得到符合预设的精度要求的目标模型。具体实施时,在第一服务器需要确定目标用户是否符合要求时,第一服务器和第二服务器可以响应目标数据处理请求,分别利用各自所持有的目标用户的第一类特征数据和第二类特征数据,在保护数据隐私的前提下,通过第三服务器的协助,合作确定出目标用户是否符合要求。从而能够在保护参与方的数据隐私的前提下,利用参与方各自所持有的数据,高效、安全地完成相应的数据处理。

Description

数据处理方法、装置和服务器
技术领域
本说明书属于人工智能技术领域,尤其涉及数据处理方法、装置和服务器。
背景技术
在一些数据处理场景中,不同的数据方可能各自分别持有相同用户对象的不同类型的特征数据。例如,A银行持有C城用户的储蓄数据,B银行持有C城用户的交易数据等。
在某些情况下,有时需要不同的数据方合作,分别使用各自所持有的数据来完成相应的数据处理;同时还要求在进行上述数据处理的过程中,要保护参与方的数据隐私,避免参与方所持有的数据遭到泄露。
因此,亟需一种能够在保护参与方数据隐私的前提下,有效地利用参与方各自所持有的数据来完成相应的数据处理的数据处理方法。
发明内容
本说明书提供了一种数据处理方法、装置和服务器,能够在保护参与方的数据隐私的前提下,利用参与方各自所持有的数据,高效、安全地完成相应的数据处理,有效地避免在数据处理的过程中参与方所持有的数据遭到泄露。
本说明书实施例提供了一种数据处理方法,应用于第一服务器,所述第一服务器持有目标用户的第一类特征数据,所述方法包括:
响应目标数据处理请求,利用预设公钥加密目标用户的第一类特征数据,得到目标用户的第一类特征数据的密文数据;
利用目标模型处理目标用户的第一类特征数据的密文数据,得到第一中间结果的密文数据;其中,所述目标模型为第一服务器和第二服务器经第三服务器协助联合训练得到的;所述第二服务器持有目标用户的第二类特征数据;所述第二服务器响应目标数据处理请求,利用目标模型和目标用户的第二类特征数据,得到第二中间结果的密文数据;
将所述第一中间结果的密文数据发送至第三服务器;其中,第二服务器将第二中间结果的密文数据发送至第三服务器;第三服务器组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;第三服务器将所述第三中间结果的密文数据发送至第一服务器;
利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;并将目标结果的密文数据发送至第三服务器;其中,第三服务器利用预设私钥对目标结果的密文数据进行解密处理,得到目标结果;
接收并根据目标结果,确定目标用户是否符合要求。
在一个实施例中,所述目标模型包括:用户的逾期违约风险预测模型。
在一个实施例中,所述目标用户的第一类特征数据包括以下至少之一:目标用户在第一机构的交易记录、目标用户在第一机构的注册数据、目标用户在第一机构的业务办理记录。
在一个实施例中,根据目标结果,确定目标用户是否符合要求,包括:
根据目标结果,确定目标用户是否存在逾期违约风险;
在确定目标用户不存在逾期违约风险的情况下,确定目标用户符合要求。
在一个实施例中,所述目标模型包括基于CNN-GRU神经网络结构的模型。
在一个实施例中,所述方法还包括:
响应联合训练请求,根据预设的样本对齐规则,通过与第二服务器、第三服务器协作进行样本对齐处理,从所持有的第一样本用户的第一类特征数据中确定出参与联合训练的第三样本用户的第一类特征数据;其中,第二服务器通过与第一服务器协作进行样本对齐处理,从所持有的第二样本用户的第二类特征数据中确定出参与联合训练的第三样本用户的第二类特征数据;
利用预设公钥加密第三样本用户的第一类特征数据,得到第三样本用户的第一类特征数据的密文数据;
利用第一模型处理第三样本用户的第一类特征数据的密文数据,得到第一样本中间结果的密文数据和关于修正第一模型的第一权重参数的密文数据;其中,所述第一模型为第一服务器根据第三服务器所提供的模型参数所构建得到的模型;
将所述第一样本中间结果的密文数据和第一权重参数的密文数据发送至第三服务器;其中,第二服务器将第二样本中间结果的密文数据和第二权重参数的密文数据发送至第三服务器;第三服务器利用预设私钥进行解密处理,得到第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数;第三服务器还根据第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数,更新第一模型,得到第一模型参数的更新数据;
接收第三服务器返回的第一模型参数的更新数据;
根据第一模型参数的更新数据,更新第一模型,得到第二模型。
在一个实施例中,在得到第二模型之后,所述方法还包括:
响应联合测试请求,利用预设公钥加密测试样本用户的第一类特征数据,得到测试样本用户的第一类特征数据的密文数据;
利用第二模型处理测试样本用户的第一类特征数据的密文数据,得到第一测试中间结果的密文数据;
将所述第一测试中间结果的密文数据发送至第三服务器;其中,第二服务器将第二测试中间结果的密文数据发送至第三服务器;第三服务器利用预设私钥解密,得到第一测试中间结果、第二测试中间结果;第三服务器还根据第一测试中间结果、第二测试中间结果,确定第二模型是否符合预设的精度要求。
在一个实施例中,在根据预设的样本对齐规则,通过与第二服务器协作进行样本对齐处理之前,所述方法还包括:
接收预设公钥;其中,第三服务器响应联合训练请求,根据预设的加密规则,生成相互对应的预设公钥和预设私钥;第三服务器将预设公钥分别发送至第一服务器和第二服务器。
在一个实施例中,根据预设的样本对齐规则,通过与第二服务器、第三服务器协作进行样本对齐处理,从所持有的第一样本用户的第一类特征数据中确定出参与联合训练的第三样本用户的第一类特征数据,包括:
根据预设的样本对齐规则,获取第一样本用户的用户标识;并利用预设公钥对第一样本用户的用户标识进行加密处理,得到第一样本用户的用户标识的密文数据;
将第一样本用户的用户标识的密文数据发送至第三服务器;其中,第二服务器将第二样本用户的用户标识的密文数据发送至第三服务器;所述第三服务器根据第一样本用户的用户标识的密文数据和第二样本用户的用户标识的密文数据进行核对处理,以确定出相同的用户标识的密文数据作为第三样本用户的用户标识的密文数据;
接收第三样本用户的用户标识的密文数据;
根据第三样本用户的用户标识的密文数据,从所持有的第一样本用户的第一类特征数据中确定出参与联合训练的第三样本用户的第一类特征数据。
本说明书实施例还提供了一种数据处理方法,应用于第三服务器,包括:
接收关于目标用户的第一中间结果的密文数据和第二中间结果的密文数据;其中,第一中间结果的密文数据为第一服务器响应目标数据处理请求,利用所持有的目标用户的第一类特征数据和目标模型得到的;第二中间结果的密文数据为第二服务器响应目标数据处理请求,利用所持有的目标用户的第二类特征数据和目标模型得到的;
组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;
将所述第三中间结果的密文数据发送至第一服务器;其中,第一服务器利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;
接收目标结果的密文数据;
利用预设私钥解密目标结果的密文数据,得到目标结果;并将目标结果发送至第一服务器。
在一个实施例中,所述方法还包括:
响应联合训练请求,根据预设的样本对齐规则,通过与第二服务器、第三服务器协作进行样本对齐处理,确定出参与联合训练的第三样本用户;
接收第一样本中间结果的密文数据、第一权重参数的密文数据、第二样本中间结果的密文数据、第二权重参数的密文数据;其中,第一样本中间结果的密文数据、第一权重参数的密文数据为第一服务器利用第三样本用户的第一类特征数据和第一模型得到的;第二样本中间结果的密文数据、第二权重参数的密文数据为第二服务器利用第三样本用户的第二类特征数据和第一模型得到的;
利用预设私钥对第一样本中间结果的密文数据、第一权重参数的密文数据、第二样本中间结果的密文数据、第二权重参数的密文数据进行解密处理,得到第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数;
根据第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数,更新第一模型,得到第一模型参数的更新数据;
将第一模型参数的更新数据分别发送至第一服务器和第二服务器。
本说明书实施例还提供了一种数据处理装置,应用于第一服务器,所述第一服务器持有目标用户的第一类特征数据,所述装置包括:
加密模块,用于响应目标数据处理请求,利用预设公钥加密目标用户的第一类特征数据,得到目标用户的第一类特征数据的密文数据;
第一处理模块,用于利用目标模型处理目标用户的第一类特征数据的密文数据,得到第一中间结果的密文数据;其中,所述目标模型为第一服务器和第二服务器经第三服务器协助联合训练得到的;所述第二服务器持有目标用户的第二类特征数据;所述第二服务器响应目标数据处理请求,利用目标模型和目标用户的第二类特征数据,得到第二中间结果的密文数据;
发送模块,用于将所述第一中间结果的密文数据发送至第三服务器;其中,第二服务器将第二中间结果的密文数据发送至第三服务器;第三服务器组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;第三服务器将所述第三中间结果的密文数据发送至第一服务器;
第二处理模块,用于利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;并将目标结果的密文数据发送至第三服务器;其中,第三服务器利用预设私钥对目标结果的密文数据进行解密处理,得到目标结果;
确定模块,用于接收并根据目标结果,确定目标用户是否符合要求。
本说明书实施例还提供了一种数据处理装置,应用于第三服务器,包括:
第一接收模块,用于接收关于目标用户的第一中间结果的密文数据和第二中间结果的密文数据;其中,第一中间结果的密文数据为第一服务器响应目标数据处理请求,利用所持有的目标用户的第一类特征数据和目标模型得到的;第二中间结果的密文数据为第二服务器响应目标数据处理请求,利用所持有的目标用户的第二类特征数据和目标模型得到的;
组合模块,用于组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;
发送模块,用于将所述第三中间结果的密文数据发送至第一服务器;其中,第一服务器利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;
第二接收模块,用于接收目标结果的密文数据;
解密模块,用于利用预设私钥解密目标结果的密文数据,得到目标结果;并将目标结果发送至第一服务器。
本说明书实施例还提供了一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述数据处理方法的相关步骤。
本说明书实施例还提供了一种计算机程序产品,包含有计算机程序,所述计算机程序被处理器执行时实现所述数据处理方法的相关步骤。
基于本说明书提供的数据处理方法、装置和服务器,具体实施前,第一服务器和第二服务器可以响应联合训练请求,分别利用各自所持有的数据,在保护数据隐私的前提下,通过第三服务器的协助,联合训练得到符合预设的精度要求的目标模型。具体实施时,在第一服务器需要确定目标用户是否符合要求时,第一服务器和第二服务器可以响应目标数据处理请求,分别利用各自所持有的目标用户的第一类特征数据和第二类特征数据,在保护数据隐私的前提下,通过第三服务器的协助,合作确定出目标用户是否符合要求。从而能够在保护参与方的数据隐私的前提下,利用参与方各自所持有的数据,高效、安全地完成相应的数据处理,能够有效地避免在数据处理的过程中参与方所持有的数据遭到泄露。
附图说明
为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书的一个实施例提供的数据处理方法的流程示意图;
图2是在一个场景示例中,应用本说明书实施例提供的数据处理方法的一种实施例的示意图;
图3是在一个场景示例中,应用本说明书实施例提供的数据处理方法的一种实施例的示意图;
图4是在一个场景示例中,应用本说明书实施例提供的数据处理方法的一种实施例的示意图;
图5是在一个场景示例中,应用本说明书实施例提供的数据处理方法的一种实施例的示意图;
图6是在一个场景示例中,应用本说明书实施例提供的数据处理方法的一种实施例的示意图;
图7是本说明书的一个实施例提供的服务器的结构组成示意图;
图8是本说明书的一个实施例提供的数据处理装置的结构组成示意图;
图9是本说明书的另一个实施例提供的数据处理装置的结构组成示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
参阅图1所示,本说明书实施例提供了一种数据处理方法,其中,该方法具体应用于第一服务器一侧,第一服务器具体可以持有目标用户的第一类特征数据。具体实施时,该方法可以包括以下内容:
S101:响应目标数据处理请求,利用预设公钥加密目标用户的第一类特征数据,得到目标用户的第一类特征数据的密文数据;
S102:利用目标模型处理目标用户的第一类特征数据的密文数据,得到第一中间结果的密文数据;其中,所述目标模型为第一服务器和第二服务器经第三服务器协助联合训练得到的;所述第二服务器持有目标用户的第二类特征数据;所述第二服务器响应目标数据处理请求,利用目标模型和目标用户的第二类特征数据,得到第二中间结果的密文数据;
S103:将所述第一中间结果的密文数据发送至第三服务器;其中,第二服务器将第二中间结果的密文数据发送至第三服务器;第三服务器组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;第三服务器将所述第三中间结果的密文数据发送至第一服务器;
S104:利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;并将目标结果的密文数据发送至第三服务器;其中,第三服务器利用预设私钥对目标结果的密文数据进行解密处理,得到目标结果;
S105:接收并根据目标结果,确定目标用户是否符合要求。
通过上述实施例,第一服务器和第二服务器可以通过第三服务器协作,在保护数据隐私的前提下,分别利用各自所持有的目标用户的特征数据,联合进行相应的数据处理,以确定出目标用户是否符合要求。
在一些实施例中,上述数据处理方法具体可以用于第一服务器一侧。其中,参阅图2所示,第一服务器具体可以为部署于第一数据方(或者第一机构,例如,A银行)的服务器。上述第一数据方持有目标用户的第一类特征数据,以及第一样本用户的第一类特征数据。
上述目标用户具体可以理解为当前第一服务器期望联合利用第二服务器所持有的数据,通过第三服务器协作,以确定是否符合要求的用户对象。
参阅图2所示,上述第二服务器具体可以为部署于第二数据方(或者第二机构,例如,B银行)的服务器。上述第二数据方持有目标用户的第二类特征数据,以第二样本用户的第二类特征数据。
其中,上述第一样本用户和第二样本用户存在重叠。上述第一类特征数据与第二类特征数据可以是完全不同的特征数据;也可以是存在部分差异的特征数据。
上述第三服务器具体可以为部署于第一数据方和第二数据方共同信任的第三数据方一侧的,为第一服务器和第二服务器联合进行数据处理提供协助服务的服务器。
具体的,上述第一服务器、第二服务器、第三服务器可以包括一种能够实现数据传输、数据处理等功能的后台服务器。上述第一服务器、第二服务器、第三服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,上述第一服务器、第二服务器、第三服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定上述第一服务器、第二服务器、第三服务器所包含的服务器的数量。上述第一服务器、第二服务器、第三服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
在一些实施例中,上述目标模型具体可以理解为第一服务器和第二服务器预先通过联合训练得到的,能够基于用户的第一类特征数据和第二类特征数据,预测用户的逾期违约风险的神经网络模型。上述目标模型还可以是第一服务器和第二服务器预先通过联邦学习合作训练得到的。关于目标模型的具体训练过程后续将另做说明。
相应的,目标用户符合要求可以理解为目标用户不存在逾期违约风险。相反,目标用户不符合要求可以理解为目标用户存在逾期违约风险。
在一些实施例中,上述目标模型可以包括:用户的逾期违约风险预测模型。具体的,例如,可以是用于预测用户是否存在借贷逾期风险的预测模型。又例如,还可以是用于预测用户是否存在合同逾期风险的预测模型等等。当然,需要说明的是,上述所列举的目标模型只是一种示意性说明。具体实施时,根据具体的应用场景和处理需求,上述目标模型还可以包括其他类型的模型。对此,本说明书不作限定。
在一些实施例中,当第一服务器需要确定目标用户是否符合要求的请求下,可以向第二服务器、第三服务器发起关于目标用户的目标数据处理请求。其中,上述目标数据处理请求至少携带有目标用户的用户标识。
在一些实施例中,具体实施时,第一服务器可以响应目标数据处理请求,利用预设公钥对目标用户的第一类特征数据进行加密处理,得到目标用户的第一类特征数据的密文数据。同时,第二服务器可以响应目标数据处理请求,利用预设公钥对目标用户的第二类特征数据进行加密处理,得到目标用户的第二类特征数据的密文数据。
其中,上述预设公钥具体可以是第三服务器预先根据预设的加密规则生成的。第一服务器和第二服务器分别持有并保管预设公钥,第三服务器持有并保管与预设公钥对应的预设私钥。
在一些实施例中,所述目标用户的第一类特征数据具体可以包括以下至少之一:目标用户在第一机构的交易记录、目标用户在第一机构的注册数据、目标用户在第一机构的业务办理记录等行为特征数据。
此外,所述目标用户的第二类特征数据具体可以包括以下至少之一:目标用户的年龄、职业、性别、户籍地、家庭地址、婚姻状态、学历等属性特征数据。
需要说明的是,在本说明书中,与用户相关的信息数据均为在用户知晓且同意的前提下获取和使用的。并且,在本说明书中,对于上述与用户相关的信息数据的的获取、存储、使用、处理等均符合国家法律法规的相关规定。
在一些实施例中,具体实施时,第一服务器还可以根据预设的特征处理规则,对目标用户的第一类特征数据进行进一步的特征处理,以得到效果更好、更加精细的特征数据,再利用预设公钥对其进行加密,作为目标用户的第一类特征数据的密文数据,以参与后续的数据处理。其中,预设的特征处理规则包括基于FICO的特征处理规则。上述FICO具体可以理解为一种个人信用评级法,或者信用评分体系。
具体实施时,可以根据上述预设的特征处理规则,以FICO信用评分体系中的五大类数据为指标,对目标用户的第一类特征数据进行评价;根据评价结果,生成对应于各个时间区间的特征向量序列,作为目标用户特征处理后的第一类特征数据。
通过上述实施例,可以根据预设的特征处理规则先对目标用户的第一类特征数据进行特征处理,以得到效果相对更好的处理后的第一类特征数据来代替原本的第一类特征数据参与后续的数据处理,提高后续数据处理的准确度。
在一些实施例中,上述目标模型具体可以包括基于CNN-GRU神经网络结构的模型。
具体的,参阅图3所示,上述目标模型至少可以包括:卷积神经网络子模型和循环神经网络子模型。其中,卷积神经网络子模型具体可以用于从数据中提取出局部抽象特征;循环神经网络子模型具体可以用于进一步从局部抽象特征提取得到时序特征信息等。
上述卷积神经网络(CONVOLUTIONAL NEURAL NETWORK,CNN),具体可以是指一类包含卷积计算且具有深度结构的前馈神经网络,具有表征学习的能力,能够按其阶层结构对输入信息进行平移不变分类。
上述循环神经网络(RECURRENT NEURAL NETWORK,RNN),具体可以是指一类以序列数据为输入,在序列的演进方向进行递归且所有节点(循环单元)按链式连接的递归神经网络。
进一步,上述循环神经网络子模型还可以包含有GRU结构。上述GRU结构可以称为门控循环单元GATED RECURRENT UNIT),具体可以是指循环神经网络中的一种本控机制,仅含有一个重置门(RESET GATE)和一个更新门(UPDATE GATE),用于解决标准循环神经网络中梯度消失的问题,同时也可以很好的处理时间间隔和延迟较长的序列问题,并能同时保留序列的长期信息。
通过上述实施例,利用基于CNN-GRU神经网络结构的模型作为目标模型能够有效地处理输入的用户的特征数据,以便精准地确定出该用户是否存在逾期违约的风险。
在一些实施例中,具体实施时,第一服务器可以利用目标模型处理目标用户的第一类特征数据的密文数据,得到第一中间结果的密文数据。同时,第二服务器可以利用目标模型处理目标用户的第二类特征数据的密文数据,得到第二中间结果的密文数据。其中,第一中间结果的密文数据具体可以为使用目标模型处理第一类特征数据的密文数据所得到的第一梯度的密文数据。类似的,第二中间结果的密文数据具体可以为使用目标模型处理第二类特征数据的密文数据所得到的第二梯度的密文数据。
进一步,第一服务器可以将上述第一中间结果的密文数据发送至第三服务器。同时,第二服务器将上述第二中间结果的密文数据发送至第三服务器。
第三服务器可以根据相应的组合规则,组合上述第一中间结果的密文数据和第二中间结果的密文数据,得到组合后的第三中间结果的密文数据;再将该第三中间结果的密文数据发送给第一服务器。
第一服务器在接收到第三中间结果的密文数据之后,可以再次利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;再将目标结果的密文数据发送给第三服务器。
第三服务器可以利用所持有的预设私钥对目标结果的密文数据进行解密处理,得到明文形式的目标结果;再将目标结果返回给第一服务器。
这样,第一服务器可以得到关于目标用户的目标结果。
在上述数据处理过程中,目标用户的第一类特征数据始终没有离开第一服务器,同时,目标用户的第二类特征数据也始终没有离开第二服务器;并且,在上述数据处理过程中,除最后第三服务器将目标结果发送给第一服务器以外,第一服务器、第二服务器、第三服务器之间数据的交互都是在密文状态下进行的,从而可以有效地保护数据处理过程中的数据安全,能够在保护参与方的数据隐私的前提下,充分利用第一服务器、第二服务器各自持有的数据,完成关于目标用户的数据处理,得到最终的目标结果。
在一些实施例中,上述根据目标结果,确定目标用户是否符合要求,具体实施时,可以包括:根据目标结果,确定目标用户是否存在逾期违约风险;在确定目标用户不存在逾期违约风险的情况下,确定目标用户符合要求。
在一些实施例中,在确定目标用户符合要求的情况下,可以判断该目标用户为具有较好信用的用户,进而可以为该目标用户提供更多的业务服务。相反,在确定目标用户不符合要求的情况下,可以判断该目标用户为可能存在信用风险的用户,进而可以对该目标用户设置风险标签,以便对该目标用户进行进一步的信用判定。
在一些实施例中,参阅图4所示,所述方法具体实施时,还可以包括以下内容:
S401:响应联合训练请求,根据预设的样本对齐规则,通过与第二服务器、第三服务器协作进行样本对齐处理,从所持有的第一样本用户的第一类特征数据中确定出参与联合训练的第三样本用户的第一类特征数据;其中,第二服务器通过与第一服务器协作进行样本对齐处理,从所持有的第二样本用户的第二类特征数据中确定出参与联合训练的第三样本用户的第二类特征数据;
S402:利用预设公钥加密第三样本用户的第一类特征数据,得到第三样本用户的第一类特征数据的密文数据;
S403:利用第一模型处理第三样本用户的第一类特征数据的密文数据,得到第一样本中间结果的密文数据和关于修正第一模型的第一权重参数的密文数据;其中,所述第一模型为第一服务器根据第三服务器所提供的模型参数所构建得到的模型;
S404:将所述第一样本中间结果的密文数据和第一权重参数的密文数据发送至第三服务器;其中,第二服务器将第二样本中间结果的密文数据和第二权重参数的密文数据发送至第三服务器;第三服务器利用预设私钥进行解密处理,得到第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数;第三服务器还根据第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数,更新第一模型,得到第一模型参数的更新数据;
S405:接收第三服务器返回的第一模型参数的更新数据;
S406:根据第一模型参数的更新数据,更新第一模型,得到第二模型。
其中,上述联合训练请求具体可以是第一服务器发起的,也可以是第二服务器发起的,甚至还可以是第三服务器发起的。
在一些实施例中,在根据预设的样本对齐规则,通过与第二服务器协作进行样本对齐处理之前,所述方法具体实施时,还可以包括:接收预设公钥;其中,第三服务器响应联合训练请求,根据预设的加密规则,生成相互对应的预设公钥和预设私钥;第三服务器将预设公钥分别发送至第一服务器和第二服务器。
其中,预设的加密规则具体可以包括基于同态加密算法的加密规则。具体的,例如,上述预设的加密规则可以是基于CKKS算法的加密规则等。
在一些实施例中,上述根据预设的样本对齐规则,通过与第二服务器、第三服务器协作进行样本对齐处理,从所持有的第一样本用户的第一类特征数据中确定出参与联合训练的第三样本用户的第一类特征数据,具体实施时,可以包括以下内容:
S1:根据预设的样本对齐规则,获取第一样本用户的用户标识;并利用预设公钥对第一样本用户的用户标识进行加密处理,得到第一样本用户的用户标识的密文数据。
S2:将第一样本用户的用户标识的密文数据发送至第三服务器;其中,第二服务器将第二样本用户的用户标识的密文数据发送至第三服务器;所述第三服务器根据第一样本用户的用户标识的密文数据和第二样本用户的用户标识的密文数据进行核对处理,以确定出相同的用户标识的密文数据作为第三样本用户的用户标识的密文数据;
S3:接收第三样本用户的用户标识的密文数据;
S4:根据第三样本用户的用户标识的密文数据,从所持有的第一样本用户的第一类特征数据中确定出参与联合训练的第三样本用户的第一类特征数据。
在本实施例中,第二服务器可以利用预设公钥对第二样本用户的用户标识进行加密处理,得到第二样本用户的用户标识的密文数据;并将第二样本用户的用户标识的密文数据发送至第三服务器。
第三服务器在接收到第一样本用户的用户标识的密文数据和第二样本用户的用户标识的密文数据之后,可以在密文的状态,对第一样本用户的用户标识的密文数据和第二样本用户的用户标识的密文数据进行核对处理,以找出两种用户标识的密文数据中相同的用户标识的密文数据作为第三样本用户的用户标识的密文数据。其中,上述第三样本用户具体可以理解为第一样本用户和第二样本用户重叠的样本用户,即第一服务器和第二服务器共同持有的样本用户。进一步,第三服务器可以将第三样本用户的用户标识的密文数据按照统一的顺序排序好之后,再将排序后的第三样本用户的用户标识的密文数据分别发送给第一服务器和第二服务器。这样,在每一次联合训练时,第一服务器和第二服务器可以根据排序后的第三样本用户的用户标识的密文数据,确定对应本次联合训练的排序位置的第三用户标识的密文数据;再分别从所持有的第一样本用户的第一类特征数据和第二样本用户的第二类特征数据中获取与本次的第三用户标识的密文数据对应的特征数据,从而可以找到并使用相同的第三用户的特征数据来进行本次的联合训练。
在一些实施例中,在进行第一次联合训练时,上述第一模型可以是第三服务器构建的初始模型。第三服务器可以将初始模型的模型参数分别发送给第一服务器和第二服务器,以便第一服务器和第二服务器可以在本地,利用初始模型的模型参数还原出本次的第一模型。
具体实施时,第一服务器可以利用预设公钥加密第三样本用户的第一类特征数据,得到第三样本用户的第一类特征数据的密文数据;并利用第一模型处理第三样本用户的第一类特征数据的密文数据,得到第一样本中间结果的密文数据和关于修正第一模型的第一权重参数的密文数据。第二服务器进行类似操作,本说明书不作赘述。
具体的,在第一服务器侧,第一服务器可以先将第三样本用户的第一类特征数据的密文数据输入至第一模型的卷积神经网络子模型(CNN)中,得到并输出多个时间区间的特征向量的密文数据;再将多个时间区间的特征向量的密文数据输入至循环神经网络子模型(RNN)中的GRU编码器中,得到并输出多个时间区间的隐藏状态向量的密文数据;进一步,第一模型可以基于多个时间区间的隐藏状态向量的密文数据进行权重初始化,并不断进行相应迭代处理,以使得权重参数U、V和W通过不断更新获取得到最优值;同时,通过第一模型输出第一样本中间结果的密文数据。
具体进行相应迭代处理处理时,第一模型可以先在向前传播过程中进行正则化处理,以控制神经网络的学习能力,防止发生过拟合现象;同时,第一模型还会使用tanh非线性函数作为激活函数进行初始化,以确定神经元的输出,并在运行至最后一层利用损失函数根据预测结果与真实值之间的误差计算出损失值,进而再进行反向传播,以将此损失值反向传递给每个神经元,使得每个神经元会采用随机梯度下降方式,修正第一模型的权重参数U、V和W,最终得到更新的权重参数,即,关于修正第一模型的第一权重参数的密文数据。此外,还可以通过修改后的第一模型输出与第三样本用户对应的第一样本中间结果的密文数据。
进而可以将上述关于修正第一模型的第一权重参数的密文数据,以及与第三样本用户对应的第一样本中间结果的密文数据发送给第三服务器。
按照上述方式,在第二服务器一侧,也可以得到关于修正第一模型的第二权重参数的密文数据,以及与第三样本用户对应的第二样本中间结果的密文数据;并将关于修正第一模型的第二权重参数的密文数据,以及与第三样本用户对应的第二样本中间结果的密文数据发送给第三服务器。
第三服务器在接收到上述数据之后,可以先利用所持有的预设私钥对第一样本中间结果的密文数据、第一权重参数的密文数据、第二样本中间结果的密文数据和第二权重参数的密文数据进行解密处理,得到第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数;再汇总组合第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数,并对第一模型进行更新,得到第一模型参数的更新数据;并将第一模型参数的更新数据分别发送给第一服务器和第二服务器。
在第一服务器一侧,第一服务器接收并根据第一模型参数的更新数据,更新第一模型,得到更新后的第一模型,记为第二模型。类似的,在第二服务器一侧,第二服务器也可以更新得到第二模型。从而完成了本次的联合训练。
在一些实施例中,在得到第二模型之后,参阅图5所示,所述方法具体实施时,还可以包括以下内容:
S1:响应联合测试请求,利用预设公钥加密测试样本用户的第一类特征数据,得到测试样本用户的第一类特征数据的密文数据;
S2:利用第二模型处理测试样本用户的第一类特征数据的密文数据,得到第一测试中间结果的密文数据;
S3:将所述第一测试中间结果的密文数据发送至第三服务器;其中,第二服务器将第二测试中间结果的密文数据发送至第三服务器;第三服务器利用预设私钥解密,得到第一测试中间结果、第二测试中间结果;第三服务器还根据第一测试中间结果、第二测试中间结果,确定第二模型是否符合预设的精度要求。
其中,上述测试样本用户具体可以是从第三样本用户中确定出样本用户。
在本实施例中,第三服务器根据第一测试中间结果、第二测试中间结果,通过判断第二模型的模型函数是否收敛,确定第二模型是否符合预设的精度要求。
在确定第二模型符合预设的精度要求的情况下,第三服务器可以分别向第一服务器和第二服务器发送表征联合训练结束的第一类指示信息。第一服务器和第二服务器接收并响应该第一类指示信息,将当前得到的第二模型确定为目标模型;并结束联合训练。
相反,在确定第二模型不符合预设的精度要求的情况下,第三服务器可以分别向第一服务器和第二服务器发送表征联合训练未结束的第二类指示信息。第一服务器和第二服务器接收并响应第二类指示信息将当前得到的第二模型确定为下一次联合训练的第一模型;并重复上述联合训练过程,进行下一次联合训练,直到所得到第二模型符合预设的精度要求为止。
通过上述实施例,第一服务器和第二服务器可以在第三服务器的协助下,分别使用各自所持有的样本用户的特征数据进行联合训练,以得到符合预设的精度要求的目标模型;同时,在联合训练的过程中,能有效地保护双方的数据隐私。
由上可见,基于本说明书实施例提供的数据处理方法,具体实施前,第一服务器和第二服务器可以响应联合训练请求,分别利用各自所持有的数据,在保护数据隐私的前提下,通过第三服务器的协助,联合训练得到符合预设的精度要求的目标模型。具体实施时,在第一服务器需要确定目标用户是否符合要求时,第一服务器和第二服务器可以响应目标数据处理请求,分别利用各自所持有的目标用户的第一类特征数据和第二类特征数据,在保护数据隐私的前提下,通过第三服务器的协助,合作确定出目标用户是否符合要求。从而能够在保护参与方的数据隐私的前提下,利用参与方各自所持有的数据,高效、安全地完成相应的数据处理,能够有效地避免在数据处理的过程中参与方所持有的数据遭到泄露。
参阅图6所示,本说明书实施例还提供了另一种数据处理方法,具体应用于第三服务器一侧,具体实施时,可以包括以下内容:
S601:接收关于目标用户的第一中间结果的密文数据和第二中间结果的密文数据;其中,第一中间结果的密文数据为第一服务器响应目标数据处理请求,利用所持有的目标用户的第一类特征数据和目标模型得到的;第二中间结果的密文数据为第二服务器响应目标数据处理请求,利用所持有的目标用户的第二类特征数据和目标模型得到的;
S602:组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;
S603:将所述第三中间结果的密文数据发送至第一服务器;其中,第一服务器利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;
S604:接收目标结果的密文数据;
S605:利用预设私钥解密目标结果的密文数据,得到目标结果;并将目标结果发送至第一服务器。
在一些实施例中,所述方法具体实施时,还可以包括以下内容:
S1:响应联合训练请求,根据预设的样本对齐规则,通过与第二服务器、第三服务器协作进行样本对齐处理,确定出参与联合训练的第三样本用户;
S2:接收第一样本中间结果的密文数据、第一权重参数的密文数据、第二样本中间结果的密文数据、第二权重参数的密文数据;其中,第一样本中间结果的密文数据、第一权重参数的密文数据为第一服务器利用第三样本用户的第一类特征数据和第一模型得到的;第二样本中间结果的密文数据、第二权重参数的密文数据为第二服务器利用第三样本用户的第二类特征数据和第一模型得到的;
S3:利用预设私钥对第一样本中间结果的密文数据、第一权重参数的密文数据、第二样本中间结果的密文数据、第二权重参数的密文数据进行解密处理,得到第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数;
S4:根据第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数,更新第一模型,得到第一模型参数的更新数据;
S5:将第一模型参数的更新数据分别发送至第一服务器和第二服务器。
通过上述实施例,第三服务器可以有效地协助第一服务器和第二服务器在保护参与方的数据隐私的前提下,联合完成相应的数据处理。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:响应目标数据处理请求,利用预设公钥加密目标用户的第一类特征数据,得到目标用户的第一类特征数据的密文数据;利用目标模型处理目标用户的第一类特征数据的密文数据,得到第一中间结果的密文数据;其中,所述目标模型为第一服务器和第二服务器经第三服务器协助联合训练得到的;所述第二服务器持有目标用户的第二类特征数据;所述第二服务器响应目标数据处理请求,利用目标模型和目标用户的第二类特征数据,得到第二中间结果的密文数据;将所述第一中间结果的密文数据发送至第三服务器;其中,第二服务器将第二中间结果的密文数据发送至第三服务器;第三服务器组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;第三服务器将所述第三中间结果的密文数据发送至第一服务器;利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;并将目标结果的密文数据发送至第三服务器;其中,第三服务器利用预设私钥对目标结果的密文数据进行解密处理,得到目标结果;接收并根据目标结果,确定目标用户是否符合要求。
为了能够更加准确地完成上述指令,参阅图7所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口701、处理器702以及存储器703,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口701,具体可以用于接收目标数据处理请求;
所述处理器702,具体可以用于响应目标数据处理请求,利用预设公钥加密目标用户的第一类特征数据,得到目标用户的第一类特征数据的密文数据;利用目标模型处理目标用户的第一类特征数据的密文数据,得到第一中间结果的密文数据;其中,所述目标模型为第一服务器和第二服务器经第三服务器协助联合训练得到的;所述第二服务器持有目标用户的第二类特征数据;所述第二服务器响应目标数据处理请求,利用目标模型和目标用户的第二类特征数据,得到第二中间结果的密文数据;将所述第一中间结果的密文数据发送至第三服务器;其中,第二服务器将第二中间结果的密文数据发送至第三服务器;第三服务器组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;第三服务器将所述第三中间结果的密文数据发送至第一服务器;利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;并将目标结果的密文数据发送至第三服务器;其中,第三服务器利用预设私钥对目标结果的密文数据进行解密处理,得到目标结果;接收并根据目标结果,确定目标用户是否符合要求;
所述存储器703,具体可以用于存储相应的指令程序。
在本实施例中,所述网络通信端口701可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的端口,也可以是负责进行FTP数据通信的端口,还可以是负责进行邮件数据通信的端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器702可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器703可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供另一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:接收关于目标用户的第一中间结果的密文数据和第二中间结果的密文数据;其中,第一中间结果的密文数据为第一服务器响应目标数据处理请求,利用所持有的目标用户的第一类特征数据和目标模型得到的;第二中间结果的密文数据为第二服务器响应目标数据处理请求,利用所持有的目标用户的第二类特征数据和目标模型得到的;组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;将所述第三中间结果的密文数据发送至第一服务器;其中,第一服务器利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;接收目标结果的密文数据;利用预设私钥解密目标结果的密文数据,得到目标结果;并将目标结果发送至第一服务器。
本说明书实施例还提供了一种基于上述数据处理方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:响应目标数据处理请求,利用预设公钥加密目标用户的第一类特征数据,得到目标用户的第一类特征数据的密文数据;利用目标模型处理目标用户的第一类特征数据的密文数据,得到第一中间结果的密文数据;其中,所述目标模型为第一服务器和第二服务器经第三服务器协助联合训练得到的;所述第二服务器持有目标用户的第二类特征数据;所述第二服务器响应目标数据处理请求,利用目标模型和目标用户的第二类特征数据,得到第二中间结果的密文数据;将所述第一中间结果的密文数据发送至第三服务器;其中,第二服务器将第二中间结果的密文数据发送至第三服务器;第三服务器组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;第三服务器将所述第三中间结果的密文数据发送至第一服务器;利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;并将目标结果的密文数据发送至第三服务器;其中,第三服务器利用预设私钥对目标结果的密文数据进行解密处理,得到目标结果;接收并根据目标结果,确定目标用户是否符合要求。
本说明书实施例还提供了一种基于上述数据处理方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:接收关于目标用户的第一中间结果的密文数据和第二中间结果的密文数据;其中,第一中间结果的密文数据为第一服务器响应目标数据处理请求,利用所持有的目标用户的第一类特征数据和目标模型得到的;第二中间结果的密文数据为第二服务器响应目标数据处理请求,利用所持有的目标用户的第二类特征数据和目标模型得到的;组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;将所述第三中间结果的密文数据发送至第一服务器;其中,第一服务器利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;接收目标结果的密文数据;利用预设私钥解密目标结果的密文数据,得到目标结果;并将目标结果发送至第一服务器。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
本说明书实施例还提供了计算机程序产品,包含有计算机程序,所述计算机程序被处理器执行时实现以下步骤:响应目标数据处理请求,利用预设公钥加密目标用户的第一类特征数据,得到目标用户的第一类特征数据的密文数据;利用目标模型处理目标用户的第一类特征数据的密文数据,得到第一中间结果的密文数据;其中,所述目标模型为第一服务器和第二服务器经第三服务器协助联合训练得到的;所述第二服务器持有目标用户的第二类特征数据;所述第二服务器响应目标数据处理请求,利用目标模型和目标用户的第二类特征数据,得到第二中间结果的密文数据;将所述第一中间结果的密文数据发送至第三服务器;其中,第二服务器将第二中间结果的密文数据发送至第三服务器;第三服务器组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;第三服务器将所述第三中间结果的密文数据发送至第一服务器;利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;并将目标结果的密文数据发送至第三服务器;其中,第三服务器利用预设私钥对目标结果的密文数据进行解密处理,得到目标结果;接收并根据目标结果,确定目标用户是否符合要求。
本说明书实施例还提供了计算机程序产品,包含有计算机程序,所述计算机程序被处理器执行时实现以下步骤:接收关于目标用户的第一中间结果的密文数据和第二中间结果的密文数据;其中,第一中间结果的密文数据为第一服务器响应目标数据处理请求,利用所持有的目标用户的第一类特征数据和目标模型得到的;第二中间结果的密文数据为第二服务器响应目标数据处理请求,利用所持有的目标用户的第二类特征数据和目标模型得到的;组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;将所述第三中间结果的密文数据发送至第一服务器;其中,第一服务器利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;接收目标结果的密文数据;利用预设私钥解密目标结果的密文数据,得到目标结果;并将目标结果发送至第一服务器。
参阅图8所示,在软件层面上,本说明书实施例还提供了一种数据处理装置,该装置具体可以包括以下的结构模块:
加密模块801,具体可以用于响应目标数据处理请求,利用预设公钥加密目标用户的第一类特征数据,得到目标用户的第一类特征数据的密文数据;
第一处理模块802,具体可以用于利用目标模型处理目标用户的第一类特征数据的密文数据,得到第一中间结果的密文数据;其中,所述目标模型为第一服务器和第二服务器经第三服务器协助联合训练得到的;所述第二服务器持有目标用户的第二类特征数据;所述第二服务器响应目标数据处理请求,利用目标模型和目标用户的第二类特征数据,得到第二中间结果的密文数据;
发送模块803,具体可以用于将所述第一中间结果的密文数据发送至第三服务器;其中,第二服务器将第二中间结果的密文数据发送至第三服务器;第三服务器组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;第三服务器将所述第三中间结果的密文数据发送至第一服务器;
第二处理模块804,具体可以用于利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;并将目标结果的密文数据发送至第三服务器;其中,第三服务器利用预设私钥对目标结果的密文数据进行解密处理,得到目标结果;
确定模块805,具体可以用于接收并根据目标结果,确定目标用户是否符合要求。
在一些实施例中,所述目标模型具体可以包括:用户的逾期违约风险预测模型等。
在一些实施例中,所述目标用户的第一类特征数据包括以下至少之一:目标用户在第一机构的交易记录、目标用户在第一机构的注册数据、目标用户在第一机构的业务办理记录等。
在一些实施例中,上述确定模块805具体实施时,可以按照以下方式根据目标结果,确定目标用户是否符合要求:根据目标结果,确定目标用户是否存在逾期违约风险;在确定目标用户不存在逾期违约风险的情况下,确定目标用户符合要求。
在一些实施例中,所述目标模型具体可以包括基于CNN-GRU神经网络结构的模型等。
在一些实施例中,所述装置还包括训练模块,具体可以用于响应联合训练请求,根据预设的样本对齐规则,通过与第二服务器、第三服务器协作进行样本对齐处理,从所持有的第一样本用户的第一类特征数据中确定出参与联合训练的第三样本用户的第一类特征数据;其中,第二服务器通过与第一服务器协作进行样本对齐处理,从所持有的第二样本用户的第二类特征数据中确定出参与联合训练的第三样本用户的第二类特征数据;利用预设公钥加密第三样本用户的第一类特征数据,得到第三样本用户的第一类特征数据的密文数据;利用第一模型处理第三样本用户的第一类特征数据的密文数据,得到第一样本中间结果的密文数据和关于修正第一模型的第一权重参数的密文数据;其中,所述第一模型为第一服务器根据第三服务器所提供的模型参数所构建得到的模型;将所述第一样本中间结果的密文数据和第一权重参数的密文数据发送至第三服务器;其中,第二服务器将第二样本中间结果的密文数据和第二权重参数的密文数据发送至第三服务器;第三服务器利用预设私钥进行解密处理,得到第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数;第三服务器还根据第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数,更新第一模型,得到第一模型参数的更新数据;接收第三服务器返回的第一模型参数的更新数据;根据第一模型参数的更新数据,更新第一模型,得到第二模型。
在一些实施例中,在得到第二模型之后,所述训练模块还可以用于响应联合测试请求,利用预设公钥加密测试样本用户的第一类特征数据,得到测试样本用户的第一类特征数据的密文数据;利用第二模型处理测试样本用户的第一类特征数据的密文数据,得到第一测试中间结果的密文数据;将所述第一测试中间结果的密文数据发送至第三服务器;其中,第二服务器将第二测试中间结果的密文数据发送至第三服务器;第三服务器利用预设私钥解密,得到第一测试中间结果、第二测试中间结果;第三服务器还根据第一测试中间结果、第二测试中间结果,确定第二模型是否符合预设的精度要求。
在一些实施例中,在根据预设的样本对齐规则,通过与第二服务器协作进行样本对齐处理之前,上述训练模块具体实施时,还可以用于接收预设公钥;其中,第三服务器响应联合训练请求,根据预设的加密规则,生成相互对应的预设公钥和预设私钥;第三服务器将预设公钥分别发送至第一服务器和第二服务器。
在一些实施例中,上述训练模块具体实施时,可以按照以下方式根据预设的样本对齐规则,通过与第二服务器、第三服务器协作进行样本对齐处理,从所持有的第一样本用户的第一类特征数据中确定出参与联合训练的第三样本用户的第一类特征数据:根据预设的样本对齐规则,获取第一样本用户的用户标识;并利用预设公钥对第一样本用户的用户标识进行加密处理,得到第一样本用户的用户标识的密文数据;将第一样本用户的用户标识的密文数据发送至第三服务器;其中,第二服务器将第二样本用户的用户标识的密文数据发送至第三服务器;所述第三服务器根据第一样本用户的用户标识的密文数据和第二样本用户的用户标识的密文数据进行核对处理,以确定出相同的用户标识的密文数据作为第三样本用户的用户标识的密文数据;接收第三样本用户的用户标识的密文数据;根据第三样本用户的用户标识的密文数据,从所持有的第一样本用户的第一类特征数据中确定出参与联合训练的第三样本用户的第一类特征数据。
参阅图9所示,在软件层面上,本说明书实施例还提供了一种数据处理装置,该装置具体可以包括以下的结构模块:
第一接收模块901,具体可以用于接收关于目标用户的第一中间结果的密文数据和第二中间结果的密文数据;其中,第一中间结果的密文数据为第一服务器响应目标数据处理请求,利用所持有的目标用户的第一类特征数据和目标模型得到的;第二中间结果的密文数据为第二服务器响应目标数据处理请求,利用所持有的目标用户的第二类特征数据和目标模型得到的;
组合模块902,具体可以用于组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;
发送模块903,具体可以用于将所述第三中间结果的密文数据发送至第一服务器;其中,第一服务器利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;
第二接收模块904,具体可以用于接收目标结果的密文数据;
解密模块905,具体可以用于利用预设私钥解密目标结果的密文数据,得到目标结果;并将目标结果发送至第一服务器。
在一些实施例中,所述装置还可以包括训练模块,具体可以用于响应联合训练请求,根据预设的样本对齐规则,通过与第二服务器、第三服务器协作进行样本对齐处理,确定出参与联合训练的第三样本用户;接收第一样本中间结果的密文数据、第一权重参数的密文数据、第二样本中间结果的密文数据、第二权重参数的密文数据;其中,第一样本中间结果的密文数据、第一权重参数的密文数据为第一服务器利用第三样本用户的第一类特征数据和第一模型得到的;第二样本中间结果的密文数据、第二权重参数的密文数据为第二服务器利用第三样本用户的第二类特征数据和第一模型得到的;利用预设私钥对第一样本中间结果的密文数据、第一权重参数的密文数据、第二样本中间结果的密文数据、第二权重参数的密文数据进行解密处理,得到第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数;根据第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数,更新第一模型,得到第一模型参数的更新数据;将第一模型参数的更新数据分别发送至第一服务器和第二服务器。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
由上可见,基于本说明书实施例提供的数据处理装置,能够在保护参与方的数据隐私的前提下,利用参与方各自所持有的数据,高效、安全地完成相应的数据处理,能够有效地避免在数据处理的过程中参与方所持有的数据遭到泄露。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

Claims (15)

1.一种数据处理方法,其特征在于,应用于第一服务器,所述第一服务器持有目标用户的第一类特征数据,所述方法包括:
响应目标数据处理请求,利用预设公钥加密目标用户的第一类特征数据,得到目标用户的第一类特征数据的密文数据;
利用目标模型处理目标用户的第一类特征数据的密文数据,得到第一中间结果的密文数据;其中,所述目标模型为第一服务器和第二服务器经第三服务器协助联合训练得到的;所述第二服务器持有目标用户的第二类特征数据;所述第二服务器响应目标数据处理请求,利用目标模型和目标用户的第二类特征数据,得到第二中间结果的密文数据;
将所述第一中间结果的密文数据发送至第三服务器;其中,第二服务器将第二中间结果的密文数据发送至第三服务器;第三服务器组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;第三服务器将所述第三中间结果的密文数据发送至第一服务器;
利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;并将目标结果的密文数据发送至第三服务器;其中,第三服务器利用预设私钥对目标结果的密文数据进行解密处理,得到目标结果;
接收并根据目标结果,确定目标用户是否符合要求。
2.根据权利要求1所述的方法,其特征在于,所述目标模型包括:用户的逾期违约风险预测模型。
3.根据权利要求2所述的方法,其特征在于,所述目标用户的第一类特征数据包括以下至少之一:目标用户在第一机构的交易记录、目标用户在第一机构的注册数据、目标用户在第一机构的业务办理记录。
4.根据权利要求2所述的方法,其特征在于,根据目标结果,确定目标用户是否符合要求,包括:
根据目标结果,确定目标用户是否存在逾期违约风险;
在确定目标用户不存在逾期违约风险的情况下,确定目标用户符合要求。
5.根据权利要求1所述的方法,其特征在于,所述目标模型包括基于CNN-GRU神经网络结构的模型。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应联合训练请求,根据预设的样本对齐规则,通过与第二服务器、第三服务器协作进行样本对齐处理,从所持有的第一样本用户的第一类特征数据中确定出参与联合训练的第三样本用户的第一类特征数据;其中,第二服务器通过与第一服务器协作进行样本对齐处理,从所持有的第二样本用户的第二类特征数据中确定出参与联合训练的第三样本用户的第二类特征数据;
利用预设公钥加密第三样本用户的第一类特征数据,得到第三样本用户的第一类特征数据的密文数据;
利用第一模型处理第三样本用户的第一类特征数据的密文数据,得到第一样本中间结果的密文数据和关于修正第一模型的第一权重参数的密文数据;其中,所述第一模型为第一服务器根据第三服务器所提供的模型参数所构建得到的模型;
将所述第一样本中间结果的密文数据和第一权重参数的密文数据发送至第三服务器;其中,第二服务器将第二样本中间结果的密文数据和第二权重参数的密文数据发送至第三服务器;第三服务器利用预设私钥进行解密处理,得到第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数;第三服务器还根据第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数,更新第一模型,得到第一模型参数的更新数据;
接收第三服务器返回的第一模型参数的更新数据;
根据第一模型参数的更新数据,更新第一模型,得到第二模型。
7.根据权利要求6所述的方法,其特征在于,在得到第二模型之后,所述方法还包括:
响应联合测试请求,利用预设公钥加密测试样本用户的第一类特征数据,得到测试样本用户的第一类特征数据的密文数据;
利用第二模型处理测试样本用户的第一类特征数据的密文数据,得到第一测试中间结果的密文数据;
将所述第一测试中间结果的密文数据发送至第三服务器;其中,第二服务器将第二测试中间结果的密文数据发送至第三服务器;第三服务器利用预设私钥解密,得到第一测试中间结果、第二测试中间结果;第三服务器还根据第一测试中间结果、第二测试中间结果,确定第二模型是否符合预设的精度要求。
8.根据权利要求6所述的方法,其特征在于,在根据预设的样本对齐规则,通过与第二服务器协作进行样本对齐处理之前,所述方法还包括:
接收预设公钥;其中,第三服务器响应联合训练请求,根据预设的加密规则,生成相互对应的预设公钥和预设私钥;第三服务器将预设公钥分别发送至第一服务器和第二服务器。
9.根据权利要求6所述的方法,其特征在于,根据预设的样本对齐规则,通过与第二服务器、第三服务器协作进行样本对齐处理,从所持有的第一样本用户的第一类特征数据中确定出参与联合训练的第三样本用户的第一类特征数据,包括:
根据预设的样本对齐规则,获取第一样本用户的用户标识;并利用预设公钥对第一样本用户的用户标识进行加密处理,得到第一样本用户的用户标识的密文数据;
将第一样本用户的用户标识的密文数据发送至第三服务器;其中,第二服务器将第二样本用户的用户标识的密文数据发送至第三服务器;所述第三服务器根据第一样本用户的用户标识的密文数据和第二样本用户的用户标识的密文数据进行核对处理,以确定出相同的用户标识的密文数据作为第三样本用户的用户标识的密文数据;
接收第三样本用户的用户标识的密文数据;
根据第三样本用户的用户标识的密文数据,从所持有的第一样本用户的第一类特征数据中确定出参与联合训练的第三样本用户的第一类特征数据。
10.一种数据处理方法,其特征在于,应用于第三服务器,包括:
接收关于目标用户的第一中间结果的密文数据和第二中间结果的密文数据;其中,第一中间结果的密文数据为第一服务器响应目标数据处理请求,利用所持有的目标用户的第一类特征数据和目标模型得到的;第二中间结果的密文数据为第二服务器响应目标数据处理请求,利用所持有的目标用户的第二类特征数据和目标模型得到的;
组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;
将所述第三中间结果的密文数据发送至第一服务器;其中,第一服务器利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;
接收目标结果的密文数据;
利用预设私钥解密目标结果的密文数据,得到目标结果;并将目标结果发送至第一服务器。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
响应联合训练请求,根据预设的样本对齐规则,通过与第二服务器、第三服务器协作进行样本对齐处理,确定出参与联合训练的第三样本用户;
接收第一样本中间结果的密文数据、第一权重参数的密文数据、第二样本中间结果的密文数据、第二权重参数的密文数据;其中,第一样本中间结果的密文数据、第一权重参数的密文数据为第一服务器利用第三样本用户的第一类特征数据和第一模型得到的;第二样本中间结果的密文数据、第二权重参数的密文数据为第二服务器利用第三样本用户的第二类特征数据和第一模型得到的;
利用预设私钥对第一样本中间结果的密文数据、第一权重参数的密文数据、第二样本中间结果的密文数据、第二权重参数的密文数据进行解密处理,得到第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数;
根据第一样本中间结果、第二样本中间结果、第一权重参数和第二权重参数,更新第一模型,得到第一模型参数的更新数据;
将第一模型参数的更新数据分别发送至第一服务器和第二服务器。
12.一种数据处理装置,其特征在于,应用于第一服务器,所述第一服务器持有目标用户的第一类特征数据,所述装置包括:
加密模块,用于响应目标数据处理请求,利用预设公钥加密目标用户的第一类特征数据,得到目标用户的第一类特征数据的密文数据;
第一处理模块,用于利用目标模型处理目标用户的第一类特征数据的密文数据,得到第一中间结果的密文数据;其中,所述目标模型为第一服务器和第二服务器经第三服务器协助联合训练得到的;所述第二服务器持有目标用户的第二类特征数据;所述第二服务器响应目标数据处理请求,利用目标模型和目标用户的第二类特征数据,得到第二中间结果的密文数据;
发送模块,用于将所述第一中间结果的密文数据发送至第三服务器;其中,第二服务器将第二中间结果的密文数据发送至第三服务器;第三服务器组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;第三服务器将所述第三中间结果的密文数据发送至第一服务器;
第二处理模块,用于利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;并将目标结果的密文数据发送至第三服务器;其中,第三服务器利用预设私钥对目标结果的密文数据进行解密处理,得到目标结果;
确定模块,用于接收并根据目标结果,确定目标用户是否符合要求。
13.一种数据处理装置,其特征在于,应用于第三服务器,包括:
第一接收模块,用于接收关于目标用户的第一中间结果的密文数据和第二中间结果的密文数据;其中,第一中间结果的密文数据为第一服务器响应目标数据处理请求,利用所持有的目标用户的第一类特征数据和目标模型得到的;第二中间结果的密文数据为第二服务器响应目标数据处理请求,利用所持有的目标用户的第二类特征数据和目标模型得到的;
组合模块,用于组合第一中间结果的密文数据和第二中间结果的密文数据,得到第三中间结果的密文数据;
发送模块,用于将所述第三中间结果的密文数据发送至第一服务器;其中,第一服务器利用目标模型处理第三中间结果的密文数据,得到目标结果的密文数据;
第二接收模块,用于接收目标结果的密文数据;
解密模块,用于利用预设私钥解密目标结果的密文数据,得到目标结果;并将目标结果发送至第一服务器。
14.一种服务器,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至9,或10至11中任一项所述方法的步骤。
15.一种计算机程序产品,其特征在于,包含有计算机程序,所述计算机程序被处理器执行时实现权利要求1至9,或10至11中任一项所述方法的步骤。
CN202211353849.8A 2022-11-01 2022-11-01 数据处理方法、装置和服务器 Pending CN115695004A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211353849.8A CN115695004A (zh) 2022-11-01 2022-11-01 数据处理方法、装置和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211353849.8A CN115695004A (zh) 2022-11-01 2022-11-01 数据处理方法、装置和服务器

Publications (1)

Publication Number Publication Date
CN115695004A true CN115695004A (zh) 2023-02-03

Family

ID=85047691

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211353849.8A Pending CN115695004A (zh) 2022-11-01 2022-11-01 数据处理方法、装置和服务器

Country Status (1)

Country Link
CN (1) CN115695004A (zh)

Similar Documents

Publication Publication Date Title
CN110457912B (zh) 数据处理方法、装置和电子设备
US10963400B2 (en) Smart contract creation and monitoring for event identification in a blockchain
CN107704930B (zh) 基于共享数据的建模方法、装置、系统及电子设备
CN110414567B (zh) 数据处理方法、装置和电子设备
CN111800411B (zh) 保护隐私的业务预测模型联合更新方法及装置
CN105389488B (zh) 身份认证方法及装置
CN110427969B (zh) 数据处理方法、装置和电子设备
CN109426861A (zh) 数据加密、机器学习模型训练方法、装置及电子设备
CN113240505B (zh) 图数据的处理方法、装置、设备、存储介质及程序产品
CN113505882A (zh) 基于联邦神经网络模型的数据处理方法、相关设备及介质
CN111144576A (zh) 模型训练方法、装置和电子设备
CN111428887A (zh) 一种基于多个计算节点的模型训练控制方法、装置及系统
CN112600830B (zh) 业务数据处理方法、装置、电子设备及存储介质
CN114255037A (zh) 隐私保护下的多方联合排序方法和数据处理方法
CN116955857A (zh) 数据处理方法、装置、介质及电子设备
CN114003510A (zh) 基于Mock服务的脚本测试方法、装置、设备及介质
CN114254353A (zh) 基于隐私保护的数据处理方法、装置和服务器
CN117114059B (zh) 神经网络中激活函数的计算方法、装置以及计算设备
CN113254989B (zh) 目标数据的融合方法、装置和服务器
CN115118520B (zh) 数据处理方法、装置和服务器
CN115695004A (zh) 数据处理方法、装置和服务器
CN113255928B (zh) 模型的训练方法、装置和服务器
Sumathi et al. Scale-based secured sensitive data storage for banking services in cloud
Ahmed et al. Secure and scalable blockchain-based federated learning for cryptocurrency fraud detection: A systematic review
CN110569659A (zh) 数据处理方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination