CN110956275A - 风险预测和风险预测模型的训练方法、装置及电子设备 - Google Patents
风险预测和风险预测模型的训练方法、装置及电子设备 Download PDFInfo
- Publication number
- CN110956275A CN110956275A CN201911179340.4A CN201911179340A CN110956275A CN 110956275 A CN110956275 A CN 110956275A CN 201911179340 A CN201911179340 A CN 201911179340A CN 110956275 A CN110956275 A CN 110956275A
- Authority
- CN
- China
- Prior art keywords
- private data
- target
- prediction model
- user
- target group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Educational Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例公开了一种风险预测和风险预测模型的训练方法、装置及电子设备,该方法包括:获取与目标用户的用户标识对应的第一私有数据和第二私有数据;将所述第一私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级;将所述第一私有数据和所述第二私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级。
Description
技术领域
本文件涉及计算机软件技术领域,尤其涉及一种风险预测和风险预测模型的训练方法、装置及电子设备。
背景技术
目前,具备完善的风险识别能力的企业在对外赋能时,往往希望能够帮助银行、独立软件开发商(ISV,Independent Software Vendors)等其他机构,准确识别用户或商户在风险场景中的风险等级。现有的方案,往往是使用上述具备完善的风险识别能力的企业的大数据,针对其所有用户和商户训练得到一个风险预测模型,并将该风险预测模型针对其他机构的用户或商户的识别结果输出给对应的机构。
然而,上述方式在识别其他机构的用户或商户的风险等级时,由于缺乏其他机构本身的个性化数据,可能会出现识别准确率较低的情况。因此,如何充分利用一些已有数据,训练得到识别准确率较高的风险预测模型,仍然需要进一步的解决方案。
发明内容
本说明书实施例的目的是提供一种风险预测和风险预测模型的训练方法、装置及电子设备,以提高风险预测模型的识别准确率。
为解决上述技术问题,本说明书实施例是这样实现的:
第一方面,提出了一种风险预测方法,包括:
从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与所述目标用户的用户标识对应的第二私有数据;
将所述第一私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
将所述第一私有数据和所述第二私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
第二方面,提出了一种风险预测模型的训练方法,包括:
获取赋能机构的用户的私有数据和目标群体用户的私有数据,其中,所述目标群体用户为所述赋能机构和目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据,所述赋能机构的用户包括所述目标群体用户;
基于所述赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型;
基于所述目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
其中,所述第一风险预测模型和所述第二风险预测模型用于联合识别用户的风险等级。
第三方面,提出了一种风险预测装置,包括:
获取单元,从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与所述目标用户的用户标识对应的第二私有数据;
第一预测单元,将所述第一私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
第二预测单元,将所述第一私有数据和所述第二私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
第三预测单元,基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
第四方面,提出了一种风险预测模型的训练装置,包括:
数据获取单元,获取赋能机构的用户的私有数据和目标群体用户的私有数据,其中,所述目标群体用户为所述赋能机构和目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据,所述赋能机构的用户包括所述目标群体用户;
第一训练单元,基于所述赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型;
第二训练单元,基于所述目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
其中,所述第一风险预测模型和所述第二风险预测模型用于联合识别用户的风险等级。
第五方面,提出了一种电子设备,该电子设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与所述目标用户的用户标识对应的第二私有数据;
将所述第一私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
将所述第一私有数据和所述第二私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
第六方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与所述目标用户的用户标识对应的第二私有数据;
将所述第一私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
将所述第一私有数据和所述第二私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
第七方面,提出了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取与目标用户的用户标识对应的私有数据;
将与所述目标用户的用户标识对应的私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
将与所述目标用户的用户标识对应的私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
第八方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取与目标用户的用户标识对应的私有数据;
将与所述目标用户的用户标识对应的私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
将与所述目标用户的用户标识对应的私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
由以上本说明书实施例提供的技术方案可见,本说明书实施例方案至少具备如下一种技术效果:
本说明书提供的一种或多个实施例,能够基于赋能机构的用户的私有数据通过同构迁移训练得到的第一风险预测模型,对目标用户的风险等级进行预测;并能够基于赋能机构和目标机构共同的目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,对目标用户的风险等级进行二次预测,并结合这两次预测结果来确定目标用户的风险等级。由于充分利用了赋能机构的用户的私有数据、以及赋能机构和目标机构共同的目标群体用户的私有数据,训练得到第一风险预测模型和第二风险预测模型联合对目标用户的风险等级进行预测,提高了风险等级的预测准确率。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书的一个实施例提供的一种风险预测方法的实施流程示意图。
图2是本说明书的一个实施例提供的风险预测方法应用在一种实际场景中的示意图。
图3是本说明书的一个实施例提供的一种风险预测模型的训练方法的流程示意图。
图4是本说明书的一个实施例提供的风险预测模型的训练方法中的两种模型的训练过程示意图。
图5是本说明书的一个实施例提供的一种风险预测装置的结构示意图。
图6是本说明书的一个实施例提供的一种风险预测模型的训练装置的结构示意图。
图7是本说明书的一个实施例提供的一种电子设备的结构示意图。
图8是本说明书的一个实施例提供的另一种电子设备的结构示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本文件一部分实施例,而不是全部的实施例。基于本文件中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本文件保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
为提高风险预测模型的识别准确率,本说明书一个或多个实施例提供一种风险预测方法,能够基于赋能机构的用户的私有数据通过同构迁移训练得到的第一风险预测模型,对目标用户的风险等级进行预测;并能够基于赋能机构和目标机构共同的目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,对目标用户的风险等级进行二次预测,并结合这两次预测结果来确定目标用户的风险等级。
由于充分利用了赋能机构的用户的私有数据、以及赋能机构和目标机构共同的目标群体用户的私有数据,训练得到第一风险预测模型和第二风险预测模型联合对目标用户的风险等级进行预测,且第二风险预测模型在训练时是以第一风险预测模型的拟合误差为目标的,最后综合第一风险预测模型和第二风险预测模型的预测结果,极大地提高了对用户风险等级的预测准确率。
应理解,本说明书实施例提供的风险预测方法的执行主体,可以但不限于服务器等能够被配置为执行本说明书实施例提供的该方法装置中的至少一种。
为便于描述,下文以该方法的执行主体为能够执行该方法的服务器为例,对该方法的实施方式进行介绍。可以理解,该方法的执行主体为服务器只是一种示例性的说明,并不应理解为对该方法的限定。
图1是本说明书的一个实施例提供的一种风险预测方法的实施流程示意图。图1的方法可包括:
S110,从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与目标用户的用户标识对应的第二私有数据。
应理解,赋能机构与目标机构之间可以存在直接的合作关系,也可以存在间接的合作关系(即可以是通过中间机构建立的合作关系),且后文所述的第一风险预测模型和第二风险预测模型均是为目标机构服务的,而由于目标机构和赋能机构之间往往存在一些共同的用户。在对这些用户的风险等级进行预测时,则可以基于这些用户的用户标识,从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与目标用户的用户标识对应的第二私有数据。
其中,第一私有数据和第二私有数据具体可包括目标用户的交易数据信息、目标用户的身份数据信息、目标用户的账号数据信息、目标用户的注册数据信息、目标用户的职业、年龄、收入等等。
S120,将第一私有数据输入到第一风险等级预测模型中,预测得到目标用户的第一风险等级,第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的。
该第一风险等级具体可以是一个风险分值,取值范围可以是[0,1]。
S130,将第一私有数据和第二私有数据输入到第二风险等级预测模型中,预测得到目标用户的第二风险等级,第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差。
其中,目标群体用户为赋能机构和目标机构的共同用户,目标群体用户的私有数据包括目标群体用户在赋能机构中的私有数据、和目标群体用户在目标机构中的私有数据。
需要说明的是,第二风险等级预测模型在训练时具体可以是以第一风险等级预测模型的拟合误差为预测目标训练得到的。其中,第一风险等级预测模型的拟合误差error=真实值Y-预测值Y1。
S140,基于第一风险等级和第二风险等级,预测目标用户的风险等级。
可选地,为了更好地融合第一风险预测模型和第二风险预测模型的模型预测结果,本说明书一个或多个实施例可以通过加法模型来融合两者的预测结果。具体地,基于第一风险等级和第二风险等级,确定目标用户的风险等级,包括:
通过加法模型基于第一风险等级和第二风险等级,确定目标用户的风险等级。
其中,加法模型由多个基模型相加而成,在本说明书实施例中,该加法模型由第一风险预测模型和第二风险预测模型相加而成,即预测值F(x)=f1(x)+f2(x),其中,f1(x)为第一风险预测模型的预测结果即第一风险等级,f2(x)为第二风险预测模型的预测结果即第二风险等级。具体来说,假设第一风险预测模型的预测目标是f1(x),那么第二风险预测模型的预测目标是Y-f1(x),Y为真实值,那么通过加法模型得到的预测值则是F(x)=f1(x)+f2(x)=Y,即预测值的范围还是[0,1]。
下面结合图2所示的风险预测方法应用在一种实际场景中的示意图,对风险预测方法的实施过程进行详细描述,包括:
S21,基于赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型,其中,赋能机构的用户包括一些目标机构的用户。
应理解,为了充分利用赋能机构的用户的私有数据,这里所述的赋能机构的用户的私有数据具体可以是该赋能机构的全量用户的私有数据。
S22,从赋能机构的用户数据库中获取与目标用户的用户ID相对应的第一私有数据,并将第一私有数据输入到第一风险预测模型中,以通过第一风险预测模型对目标用户的风险等级进行预测,输出目标用户的第一风险等级的预测值Y1。
S23,获取第一风险预测模型的拟合误差error,即目标用户的真实风险等级值Y与Y1的差值error=Y-Y1。
S24,基于目标群体用户的私有数据,并以第一风险预测模型的拟合误差error为对应的标签,通过纵向联邦学习训练得到第二风险预测模型。
其中,目标群体用户为赋能机构和目标机构的共同用户,目标群体用户的私有数据包括目标群体用户在赋能机构中的私有数据、和目标群体用户在目标机构中的私有数据。且第二风险预测模型是以第一风险预测模型的拟合误差error为预测目标训练得到的。
S25,从目标机构的用户数据库中获取与目标用户的ID相对应的第二私有数据,并将S22获取的第一私有数据和该第二私有数据输入到第二风险预测模型中,以通过第二风险预测模型对目标用户的风险等级进行预测,输出目标用户的第二风险等级的预测值Y2。
S26,基于加法模型得到目标用户的风险等级,输出得到目标用户的风险等级的预测值Y1+Y2。
本说明书提供的一种或多个实施例,能够基于赋能机构的用户的私有数据通过同构迁移训练得到的第一风险预测模型,对目标用户的风险等级进行预测;并能够基于赋能机构和目标机构共同的目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,对目标用户的风险等级进行二次预测,并结合这两次预测结果来确定目标用户的风险等级。由于充分利用了赋能机构的用户的私有数据、以及赋能机构和目标机构共同的目标群体用户的私有数据,训练得到第一风险预测模型和第二风险预测模型联合对目标用户的风险等级进行预测,提高了风险等级的预测准确率。
图3是本说明书的一个实施例提供的一种风险预测模型的训练方法的实施流程示意图,包括:
S310,获取赋能机构的用户的私有数据和目标群体用户的私有数据,其中,目标群体用户为赋能机构和目标机构的共同用户,目标群体用户的私有数据包括目标群体用户在赋能机构中的私有数据、和目标群体用户在目标机构中的私有数据,赋能机构的用户包括目标群体用户。
其中,赋能机构期望通过在保护赋能机构本身和目标机构的私有数据的前提下,联合使用赋能机构的用户的私有数据和目标机构的私有数据,共同完成第一风险预测模型和第二风险预测模型的训练。基于此,本说明书实施例采用同构迁移和纵向联邦学习的模型训练方式,分别训练得到第一风险预测模型和第二风险预测模型,并将第一风险预测模型和第二风险预测模型联合起来预测用户的风险等级。
由于同构迁移只需使用赋能机构本身所有的用户的私有数据,并结合赋能机构和目标机构共同的目标群体用户在赋能机构中的私有数据,对目标机构进行了一次模型适配,得到第一风险预测模型;再通过纵向联邦学习使用目标群体用户在赋能机构中的私有数据和目标机构中的私有数据,训练得到第二风险预测模型,充分利用了赋能机构所有的用户的私有数据和目标机构可提供的目标群体用户的私有数据,提高了风险预测的准确率。
如图4所示,为本说明书实施例提供的通过同构迁移和纵向联邦学习进行模型训练的示意图。在图4(a)中,灰色区域为赋能机构拥有的所有用户ID,以及对应的私有数据(即图示的源域+目标域部分),目标域中包含的用户的私有数据为赋能机构和目标机构的共同用户在赋能机构中的私有数据,也就是说,目标域中包含的用户的私有数据为赋能机构和目标机构重叠的那部分数据。
S320,基于赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型。
应理解,为了训练得到适配于目标机构的第一风险预测模型,本说明书一个或多个实施例在通过同构迁移训练得到第一风险预测模型时,应首先获取赋能机构与目标机构的共同用户即目标群体用户在赋能机构中的私有数据。具体地,基于赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型,包括:
获取赋能机构中目标群体用户的私有数据;
基于赋能机构的用户的私有数据和赋能机构中所述目标群体用户的私有数据,通过同构迁移训练得到第一风险预测模型。
如图4(a)所示,为本说明书实施例提供的通过同构迁移训练得到第一风险预测模型的示意图,具体过程包括:
首先,用源域中包含的用户的私有数据训练得到神经网络类模型,具体训练方式本说明书实施例对此不作具体限定;然后,对模型网络的每一层,计算源域中包含的用户的私有数据在此层输出的均值μ1和标准差σ1,以及目标域中包含的用户的私有数据在此层输出的均值μ2和标准差σ2;再通过训练得到的模型对目标域中包含的用户的私有数据进行预测,得到预测值U,再对该预测值进行统一数据分布,得到预测值[(U-μ2)/σ2]*σ1+μ1,从而统一训练得到的第一风险预测模型对源域和目标域中的用户的私有数据的预测结果的范围。
S330,基于目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差。
其中,第一风险预测模型和第二风险预测模型用于联合识别用户的风险等级。
应理解,为了提高风险预测模型的预测准确率,从而更好地为目标机构服务,本说明书一个或多个实施例还可通过纵向联邦学习训练得到第二风险预测模型。具体地,基于目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,包括:
基于第一风险预测模型对测试数据的预测值和测试数据对应的真实值,获取第一风险预测模型的拟合误差;
基于目标群体用户的私有数据,通过纵向联邦学习训练得到第二风险预测模型,直到第二风险预测模型的预测值逼近第一风险预测模型的拟合误差。
如图4(b)所示,为本说明书实施例提供的通过纵向联邦学习训练得到第二风险预测模型的示意图。该第二风险预测模型具体是基于赋能机构和目标机构的共同用户,即目标群体用户在赋能机构中的私有数据和目标群体用户在目标机构中的私有数据,以赋能机构无法获知或反推目标机构的数据,且目标机构无法获知或反推赋能机构的数据的前提下,通过纵向联邦学习训练得到的。
本说明书提供的一种或多个实施例,能够基于赋能机构的用户的私有数据通过同构迁移训练得到的第一风险预测模型,对用户的风险等级进行预测;并能够基于赋能机构和目标机构共同的目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,对用户的风险等级进行二次预测,并结合这两次预测结果来确定用户的风险等级。由于充分利用了赋能机构的用户的私有数据、以及赋能机构和目标机构共同的目标群体用户的私有数据,训练得到第一风险预测模型和第二风险预测模型联合对用户的风险等级进行预测,提高了风险等级的预测准确率。
图5是本说明书的一个实施例提供的一种风险预测装置500的结构示意图。请参考图5,在一种软件实施方式中,风险预测装置500可包括:
获取单元501,从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与所述目标用户的用户标识对应的第二私有数据;
第一预测单元502,将所述第一私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
第二预测单元503,将所述第一私有数据和所述第二私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
第三预测单元504,基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
可选地,在一种实施方式中,所述第三预测单元504,用于:
通过加法模型基于所述第一风险等级和所述第二风险等级,确定所述目标用户的风险等级。
风险预测装置500能够实现图1~图2的方法实施例的方法,具体可参考图1~图2所示实施例的风险预测方法,不再赘述。
图6是本说明书的一个实施例提供的一种风险预测模型的训练装置600的结构示意图。请参考图6,在一种软件实施方式中,风险预测模型的训练装置600可包括:
数据获取单元601,获取赋能机构的用户的私有数据和目标群体用户的私有数据,其中,所述目标群体用户为所述赋能机构和目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据,所述赋能机构的用户包括所述目标群体用户;
第一训练单元602,基于所述赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型;
第二训练单元603,基于所述目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
其中,所述第一风险预测模型和所述第二风险预测模型用于联合识别用户的风险等级。
可选地,在一种实施方式中,所述第一训练单元602,用于:
获取所述赋能机构中所述目标群体用户的私有数据;
基于所述赋能机构的用户的私有数据和所述赋能机构中所述目标群体用户的私有数据,通过同构迁移训练得到所述第一风险预测模型。
可选地,在一种实施方式中,所述第二训练单元603,用于:
基于所述第一风险预测模型对测试数据的预测值和所述测试数据对应的真实值,获取所述第一风险预测模型的拟合误差;
基于所述目标群体用户的私有数据,通过纵向联邦学习训练得到第二风险预测模型,直到所述第二风险预测模型的预测值逼近所述第一风险预测模型的拟合误差。
风险预测模型的训练装置600能够实现图3~图4的方法实施例的方法,具体可参考图3~图4所示实施例的风险预测模型的训练方法,不再赘述。
图7是本说明书的一个实施例电子设备的结构示意图。请参考图7,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成风险预测装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与所述目标用户的用户标识对应的第二私有数据;
将所述第一私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
将所述第一私有数据和所述第二私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
上述如本说明书图1~图2所示实施例揭示的风险预测装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central ProcessingUnit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1~图2的方法,并实现风险预测装置在图1~图2所示实施例的功能,本说明书实施例在此不再赘述。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1~图2所示实施例的方法,并具体用于执行以下操作:
从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与所述目标用户的用户标识对应的第二私有数据;
将所述第一私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
将所述第一私有数据和所述第二私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
图8是本说明书的一个实施例电子设备的结构示意图。请参考图8,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成风险预测模型的训练装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取赋能机构的用户的私有数据和目标群体用户的私有数据,其中,所述目标群体用户为所述赋能机构和目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据,所述赋能机构的用户包括所述目标群体用户;
基于所述赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型;
基于所述目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
其中,所述第一风险预测模型和所述第二风险预测模型用于联合识别用户的风险等级。
上述如本说明书图3~图4所示实施例揭示的风险预测模型的训练装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图3~图4的方法,并实现风险预测模型的训练装置在图3~图4所示实施例的功能,本说明书实施例在此不再赘述。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图3~图4所示实施例的方法,并具体用于执行以下操作:
获取赋能机构的用户的私有数据和目标群体用户的私有数据,其中,所述目标群体用户为所述赋能机构和目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据,所述赋能机构的用户包括所述目标群体用户;
基于所述赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型;
基于所述目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
其中,所述第一风险预测模型和所述第二风险预测模型用于联合识别用户的风险等级。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
总之,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
Claims (11)
1.一种风险预测方法,包括:
从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与所述目标用户的用户标识对应的第二私有数据;
将所述第一私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
将所述第一私有数据和所述第二私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
2.如权利要求1所述的方法,基于所述第一风险等级和所述第二风险等级,确定所述目标用户的风险等级,包括:
通过加法模型基于所述第一风险等级和所述第二风险等级,确定所述目标用户的风险等级。
3.一种风险预测模型的训练方法,包括:
获取赋能机构的用户的私有数据和目标群体用户的私有数据,其中,所述目标群体用户为所述赋能机构和目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据,所述赋能机构的用户包括所述目标群体用户;
基于所述赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型;
基于所述目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
其中,所述第一风险预测模型和所述第二风险预测模型用于联合识别用户的风险等级。
4.如权利要求3所述的方法,基于所述赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型,包括:
获取所述赋能机构中所述目标群体用户的私有数据;
基于所述赋能机构的用户的私有数据和所述赋能机构中所述目标群体用户的私有数据,通过同构迁移训练得到所述第一风险预测模型。
5.如权利要求4所述的方法,基于所述目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,包括:
基于所述第一风险预测模型对测试数据的预测值和所述测试数据对应的真实值,获取所述第一风险预测模型的拟合误差;
基于所述目标群体用户的私有数据,通过纵向联邦学习训练得到第二风险预测模型,直到所述第二风险预测模型的预测值逼近所述第一风险预测模型的拟合误差。
6.一种风险预测装置,包括:
获取单元,从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与所述目标用户的用户标识对应的第二私有数据;
第一预测单元,将所述第一私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
第二预测单元,将所述第一私有数据和所述第二私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
第三预测单元,基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
7.一种风险预测模型的训练装置,包括:
数据获取单元,获取赋能机构的用户的私有数据和目标群体用户的私有数据,其中,所述目标群体用户为所述赋能机构和目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据,所述赋能机构的用户包括所述目标群体用户;
第一训练单元,基于所述赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型;
第二训练单元,基于所述目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
其中,所述第一风险预测模型和所述第二风险预测模型用于联合识别用户的风险等级。
8.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与所述目标用户的用户标识对应的第二私有数据;
将所述第一私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
将所述第一私有数据和所述第二私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
9.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
从赋能机构的用户数据库中获取与目标用户的用户标识对应的第一私有数据、以及从目标机构的用户数据库中获取与所述目标用户的用户标识对应的第二私有数据;
将所述第一私有数据输入到第一风险等级预测模型中,预测得到所述目标用户的第一风险等级,所述第一风险等级预测模型为基于赋能机构的用户的私有数据通过同构迁移训练得到的;
将所述第一私有数据和所述第二私有数据输入到第二风险等级预测模型中,预测得到所述目标用户的第二风险等级,所述第二风险等级预测模型为基于目标群体用户的私有数据及对应的标签、通过纵向联邦学习训练得到的,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
基于所述第一风险等级和所述第二风险等级,预测所述目标用户的风险等级;
其中,所述目标群体用户为所述赋能机构和所述目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据。
10.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取赋能机构的用户的私有数据和目标群体用户的私有数据,其中,所述目标群体用户为所述赋能机构和目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据,所述赋能机构的用户包括所述目标群体用户;
基于所述赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型;
基于所述目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
其中,所述第一风险预测模型和所述第二风险预测模型用于联合识别用户的风险等级。
11.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取赋能机构的用户的私有数据和目标群体用户的私有数据,其中,所述目标群体用户为所述赋能机构和目标机构的共同用户,所述目标群体用户的私有数据包括所述目标群体用户在所述赋能机构中的私有数据、和所述目标群体用户在目标机构中的私有数据,所述赋能机构的用户包括所述目标群体用户;
基于所述赋能机构的用户的私有数据,通过同构迁移训练得到第一风险预测模型;
基于所述目标群体用户的私有数据及对应的标签,通过纵向联邦学习训练得到第二风险预测模型,所述目标群体用户的私有数据对应的标签为目标群体用户在第一风险预测模型对应的拟合误差;
其中,所述第一风险预测模型和所述第二风险预测模型用于联合识别用户的风险等级。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911179340.4A CN110956275B (zh) | 2019-11-27 | 2019-11-27 | 风险预测和风险预测模型的训练方法、装置及电子设备 |
TW109115557A TWI764148B (zh) | 2019-11-27 | 2020-05-11 | 風險預測和風險預測模型的訓練方法、裝置及電子設備 |
PCT/CN2020/124718 WO2021103909A1 (zh) | 2019-11-27 | 2020-10-29 | 风险预测和风险预测模型的训练方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911179340.4A CN110956275B (zh) | 2019-11-27 | 2019-11-27 | 风险预测和风险预测模型的训练方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110956275A true CN110956275A (zh) | 2020-04-03 |
CN110956275B CN110956275B (zh) | 2021-04-02 |
Family
ID=69976974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911179340.4A Active CN110956275B (zh) | 2019-11-27 | 2019-11-27 | 风险预测和风险预测模型的训练方法、装置及电子设备 |
Country Status (3)
Country | Link |
---|---|
CN (1) | CN110956275B (zh) |
TW (1) | TWI764148B (zh) |
WO (1) | WO2021103909A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111582565A (zh) * | 2020-04-26 | 2020-08-25 | 支付宝(杭州)信息技术有限公司 | 数据融合方法、装置和电子设备 |
CN111738440A (zh) * | 2020-07-31 | 2020-10-02 | 支付宝(杭州)信息技术有限公司 | 一种基于领域自适应与联邦学习的模型训练方法及系统 |
CN112309529A (zh) * | 2020-11-02 | 2021-02-02 | 常州市第一人民医院 | 一种基于人工智能的感染控制管理方法及系统 |
WO2021103909A1 (zh) * | 2019-11-27 | 2021-06-03 | 支付宝(杭州)信息技术有限公司 | 风险预测和风险预测模型的训练方法、装置及电子设备 |
CN113011632A (zh) * | 2021-01-29 | 2021-06-22 | 招商银行股份有限公司 | 企业风险评估方法、装置、设备及计算机可读存储介质 |
CN113269431A (zh) * | 2021-05-20 | 2021-08-17 | 深圳易财信息技术有限公司 | 库存风险预测方法、设备、介质及计算机程序产品 |
CN114037359A (zh) * | 2021-12-16 | 2022-02-11 | 厦门美亚亿安信息科技有限公司 | 一种基于联邦学习的企业风险预测方法和系统 |
US11429301B2 (en) * | 2020-04-22 | 2022-08-30 | Dell Products L.P. | Data contextual migration in an information handling system |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115018318B (zh) * | 2022-06-01 | 2023-04-18 | 航天神舟智慧系统技术有限公司 | 一种社会区域风险预测分析方法与系统 |
CN115545216B (zh) * | 2022-10-19 | 2023-06-30 | 上海零数众合信息科技有限公司 | 一种业务指标预测方法、装置、设备和存储介质 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105321028A (zh) * | 2014-08-05 | 2016-02-10 | 瑞昶科技股份有限公司 | 工厂环境风险筛检方法 |
CN106408282A (zh) * | 2016-08-25 | 2017-02-15 | 深圳怡化电脑股份有限公司 | 一种自助终端的转账业务处理方法及系统 |
CN106530078A (zh) * | 2016-11-29 | 2017-03-22 | 流量海科技成都有限公司 | 基于跨行业数据的贷款风险预警方法及系统 |
CN107450426A (zh) * | 2017-08-01 | 2017-12-08 | 中国建筑第八工程局有限公司 | 基坑施工变形统计分析方法及系统 |
CN108520343A (zh) * | 2018-03-26 | 2018-09-11 | 平安科技(深圳)有限公司 | 风险模型训练方法、风险识别方法、装置、设备及介质 |
CN108895532A (zh) * | 2018-04-20 | 2018-11-27 | 太原理工大学 | 基于随机分布控制算法的区域供热节能控制方法 |
CN109165840A (zh) * | 2018-08-20 | 2019-01-08 | 平安科技(深圳)有限公司 | 风险预测处理方法、装置、计算机设备和介质 |
CN109255444A (zh) * | 2018-08-10 | 2019-01-22 | 深圳前海微众银行股份有限公司 | 基于迁移学习的联邦建模方法、设备及可读存储介质 |
WO2019036035A1 (en) * | 2017-08-16 | 2019-02-21 | ODH, Inc. | DATA PROCESSING APPARATUS FOR ACCESSING A SHARED MEMORY IN PROCESSING STRUCTURED DATA FOR MODIFYING A DATA STRUCTURE OF A PARAMETER VECTOR |
CN109544166A (zh) * | 2018-11-05 | 2019-03-29 | 阿里巴巴集团控股有限公司 | 一种风险识别方法和装置 |
CN109598414A (zh) * | 2018-11-13 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 风险评估模型训练、风险评估方法、装置及电子设备 |
US20190114546A1 (en) * | 2017-10-12 | 2019-04-18 | Nvidia Corporation | Refining labeling of time-associated data |
CN110245954A (zh) * | 2019-05-27 | 2019-09-17 | 阿里巴巴集团控股有限公司 | 用于风险控制的方法和装置 |
CN110246032A (zh) * | 2019-06-21 | 2019-09-17 | 深圳前海微众银行股份有限公司 | 贷后风险监控方法、装置及计算机可读存储介质 |
CN110348721A (zh) * | 2019-06-29 | 2019-10-18 | 北京淇瑀信息科技有限公司 | 基于gbst的金融违约风险预测方法、装置和电子设备 |
US10468137B1 (en) * | 2013-06-14 | 2019-11-05 | Cerner Innovation, Inc. | Managing treatment of children with Tetralogy of Fallot |
CN110442457A (zh) * | 2019-08-12 | 2019-11-12 | 北京大学深圳研究生院 | 基于联邦学习的模型训练方法、装置及服务器 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040260703A1 (en) * | 2003-06-20 | 2004-12-23 | Elkins Debra A. | Quantitative property loss risk model and decision analysis framework |
CN108984613A (zh) * | 2018-06-12 | 2018-12-11 | 北京航空航天大学 | 一种基于迁移学习的缺陷报告跨项目分类方法 |
CN109002861B (zh) * | 2018-08-10 | 2021-11-09 | 深圳前海微众银行股份有限公司 | 联邦建模方法、设备及存储介质 |
CN110033120A (zh) * | 2019-03-06 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 用于为商户提供风险预测赋能服务的方法及装置 |
CN110245510B (zh) * | 2019-06-19 | 2021-12-07 | 北京百度网讯科技有限公司 | 用于预测信息的方法和装置 |
CN110399742B (zh) * | 2019-07-29 | 2020-12-18 | 深圳前海微众银行股份有限公司 | 一种联邦迁移学习模型的训练、预测方法及装置 |
CN110956275B (zh) * | 2019-11-27 | 2021-04-02 | 支付宝(杭州)信息技术有限公司 | 风险预测和风险预测模型的训练方法、装置及电子设备 |
-
2019
- 2019-11-27 CN CN201911179340.4A patent/CN110956275B/zh active Active
-
2020
- 2020-05-11 TW TW109115557A patent/TWI764148B/zh active
- 2020-10-29 WO PCT/CN2020/124718 patent/WO2021103909A1/zh active Application Filing
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10468137B1 (en) * | 2013-06-14 | 2019-11-05 | Cerner Innovation, Inc. | Managing treatment of children with Tetralogy of Fallot |
CN105321028A (zh) * | 2014-08-05 | 2016-02-10 | 瑞昶科技股份有限公司 | 工厂环境风险筛检方法 |
CN106408282A (zh) * | 2016-08-25 | 2017-02-15 | 深圳怡化电脑股份有限公司 | 一种自助终端的转账业务处理方法及系统 |
CN106530078A (zh) * | 2016-11-29 | 2017-03-22 | 流量海科技成都有限公司 | 基于跨行业数据的贷款风险预警方法及系统 |
CN107450426A (zh) * | 2017-08-01 | 2017-12-08 | 中国建筑第八工程局有限公司 | 基坑施工变形统计分析方法及系统 |
WO2019036035A1 (en) * | 2017-08-16 | 2019-02-21 | ODH, Inc. | DATA PROCESSING APPARATUS FOR ACCESSING A SHARED MEMORY IN PROCESSING STRUCTURED DATA FOR MODIFYING A DATA STRUCTURE OF A PARAMETER VECTOR |
US20190114546A1 (en) * | 2017-10-12 | 2019-04-18 | Nvidia Corporation | Refining labeling of time-associated data |
CN108520343A (zh) * | 2018-03-26 | 2018-09-11 | 平安科技(深圳)有限公司 | 风险模型训练方法、风险识别方法、装置、设备及介质 |
CN108895532A (zh) * | 2018-04-20 | 2018-11-27 | 太原理工大学 | 基于随机分布控制算法的区域供热节能控制方法 |
CN109255444A (zh) * | 2018-08-10 | 2019-01-22 | 深圳前海微众银行股份有限公司 | 基于迁移学习的联邦建模方法、设备及可读存储介质 |
CN109165840A (zh) * | 2018-08-20 | 2019-01-08 | 平安科技(深圳)有限公司 | 风险预测处理方法、装置、计算机设备和介质 |
CN109544166A (zh) * | 2018-11-05 | 2019-03-29 | 阿里巴巴集团控股有限公司 | 一种风险识别方法和装置 |
CN109598414A (zh) * | 2018-11-13 | 2019-04-09 | 阿里巴巴集团控股有限公司 | 风险评估模型训练、风险评估方法、装置及电子设备 |
CN110245954A (zh) * | 2019-05-27 | 2019-09-17 | 阿里巴巴集团控股有限公司 | 用于风险控制的方法和装置 |
CN110246032A (zh) * | 2019-06-21 | 2019-09-17 | 深圳前海微众银行股份有限公司 | 贷后风险监控方法、装置及计算机可读存储介质 |
CN110348721A (zh) * | 2019-06-29 | 2019-10-18 | 北京淇瑀信息科技有限公司 | 基于gbst的金融违约风险预测方法、装置和电子设备 |
CN110442457A (zh) * | 2019-08-12 | 2019-11-12 | 北京大学深圳研究生院 | 基于联邦学习的模型训练方法、装置及服务器 |
Non-Patent Citations (5)
Title |
---|
ANDREW HARD 等: "Federated Learning for Mobile Keyboard Prediction", 《ARXIV:1811.03604V2》 * |
LIV DYRE 等: "Imperfect practice makes perfect: error management training improves transfer of learning", 《MED EDUC.》 * |
李茂莹 等: "同构迁移学习理论和算法研究进展", 《南京信息工程大学学报(自然科学版)》 * |
王干军 等: "基于随机森林的高压电缆局部放电特征寻优", 《电网技术》 * |
金亚虹 等: "错误结果反馈对追踪任务学习迁移的影响", 《上海体育学院学报》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021103909A1 (zh) * | 2019-11-27 | 2021-06-03 | 支付宝(杭州)信息技术有限公司 | 风险预测和风险预测模型的训练方法、装置及电子设备 |
US11429301B2 (en) * | 2020-04-22 | 2022-08-30 | Dell Products L.P. | Data contextual migration in an information handling system |
CN111582565A (zh) * | 2020-04-26 | 2020-08-25 | 支付宝(杭州)信息技术有限公司 | 数据融合方法、装置和电子设备 |
CN111738440A (zh) * | 2020-07-31 | 2020-10-02 | 支付宝(杭州)信息技术有限公司 | 一种基于领域自适应与联邦学习的模型训练方法及系统 |
CN112309529A (zh) * | 2020-11-02 | 2021-02-02 | 常州市第一人民医院 | 一种基于人工智能的感染控制管理方法及系统 |
CN113011632A (zh) * | 2021-01-29 | 2021-06-22 | 招商银行股份有限公司 | 企业风险评估方法、装置、设备及计算机可读存储介质 |
CN113269431A (zh) * | 2021-05-20 | 2021-08-17 | 深圳易财信息技术有限公司 | 库存风险预测方法、设备、介质及计算机程序产品 |
CN113269431B (zh) * | 2021-05-20 | 2023-12-05 | 深圳易财信息技术有限公司 | 库存风险预测方法、设备、介质及计算机程序产品 |
CN114037359A (zh) * | 2021-12-16 | 2022-02-11 | 厦门美亚亿安信息科技有限公司 | 一种基于联邦学习的企业风险预测方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
TWI764148B (zh) | 2022-05-11 |
WO2021103909A1 (zh) | 2021-06-03 |
TW202121268A (zh) | 2021-06-01 |
CN110956275B (zh) | 2021-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110956275B (zh) | 风险预测和风险预测模型的训练方法、装置及电子设备 | |
CN109347787B (zh) | 一种身份信息的识别方法及装置 | |
TWI743773B (zh) | 基於隱私資料保護的異常採集行為識別方法和裝置 | |
CN109033772B (zh) | 一种验证信息的输入方法及装置 | |
CN112184143B (zh) | 一种合规审核规则中的模型训练方法、装置和设备 | |
CN108173706B (zh) | 一种多业务系统下的业务标记方法、装置及设备 | |
CN109271611B (zh) | 一种数据校验方法、装置及电子设备 | |
CN111415158B (zh) | 一种基于区块链的风控方法和系统 | |
CN108550046B (zh) | 一种资源和营销推荐方法、装置及电子设备 | |
CN113408254B (zh) | 一种页面表单信息填写方法、装置、设备和可读介质 | |
CN110119860A (zh) | 一种垃圾账号检测方法、装置以及设备 | |
US11461503B2 (en) | Service processing method and apparatus | |
CN108616361B (zh) | 一种识别设备唯一性的方法及装置 | |
CN113222667A (zh) | 权益分享处理方法及装置 | |
CN110704423B (zh) | 激励信息获取方法、装置及存储介质、电子设备 | |
CN110334936B (zh) | 一种信贷资质评分模型的构建方法、装置和设备 | |
CN111582872A (zh) | 异常账号检测模型训练、异常账号检测方法、装置及设备 | |
CN113743618A (zh) | 时间序列数据处理方法、装置、可读介质及电子设备 | |
CN111275071B (zh) | 预测模型训练、预测方法、装置及电子设备 | |
CN109598478B (zh) | 一种风测结果描述文案的生成方法、装置及电子设备 | |
CN109740336B (zh) | 一种图片中的验证信息的识别方法、装置及电子设备 | |
CN110443291B (zh) | 一种模型训练方法、装置及设备 | |
CN112286968A (zh) | 一种业务识别方法、设备、介质及电子设备 | |
CN110458393B (zh) | 一种风险识别方案的确定方法、装置及电子设备 | |
CN111143327B (zh) | 一种数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40030520 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |