CN116245599A - 信用评估模型待的训练方法、信用评估方法以及设备 - Google Patents
信用评估模型待的训练方法、信用评估方法以及设备 Download PDFInfo
- Publication number
- CN116245599A CN116245599A CN202211731673.5A CN202211731673A CN116245599A CN 116245599 A CN116245599 A CN 116245599A CN 202211731673 A CN202211731673 A CN 202211731673A CN 116245599 A CN116245599 A CN 116245599A
- Authority
- CN
- China
- Prior art keywords
- object data
- data set
- credit
- model
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Medical Informatics (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Molecular Biology (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书公开了一种信用评估模型待的训练方法、信用评估方法、装置、设备以及存储介质,方法包括:获取第一对象数据集、第一信用评估模型、第二对象数据集以及第二信用评估模型,所述第一对象数据集和所述第一信用评估模型来自服务平台,所述第二对象数据集和所述第二信用评估模型来自信用评估平台;对所述第一对象数据集和所述第二对象数据集进行数据混淆,得到第三对象数据集和第四对象数据集,所述第三对象数据集和所述第四对象数据集对应于不同的数据混淆方式;基于所述第三对象数据集、所述第四对象数据集、所述第一信用评估模型和所述第二信用评估模型,训练目标信用评估模型,所述目标信用评估模型用于基于对象数据进行信用评估。
Description
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种信用评估模型待的训练方法、信用评估方法、装置、设备以及存储介质。
背景技术
随着计算机技术的发展,服务平台为用户提供的在线服务的类型越来越多,比如,金融服务平台能够为用户提供在线金融服务,外卖平台能够为用户提供外卖服务,购物平台能够为用户提供在线购物服务等。
相关技术中,服务平台在提供在线服务的同时,通常需要对用户进行信用评估,根据信用评估的结果来为用户提供服务。在对用户进行信用评估的过程中,服务平台往往会借助信用评估平台提供的信用评估结果,虽然信用评估平台提供的信用评估结果会进行加密,但是也存在用户在信用评估平台上的信用评估结果发生泄漏的风险。
发明内容
本说明书实施例提供了一种信用评估模型待的训练方法、信用评估方法、装置、设备以及存储介质,可以降低用户在信用评估平台上的信息发生泄漏的风险,技术方案如下。
一方面,提供了一种信用评估模型的训练方法,所述方法包括:
获取第一对象数据集、第一信用评估模型、第二对象数据集以及第二信用评估模型,所述第一对象数据集和所述第一信用评估模型来自服务平台,所述第二对象数据集和所述第二信用评估模型来自信用评估平台;
对所述第一对象数据集和所述第二对象数据集进行数据混淆,得到第三对象数据集和第四对象数据集,所述第三对象数据集和所述第四对象数据集对应于不同的数据混淆方式;
基于所述第三对象数据集、所述第四对象数据集、所述第一信用评估模型和所述第二信用评估模型,训练目标信用评估模型,所述目标信用评估模型用于基于对象数据进行信用评估。
一方面,提供了一种信用评估方法,所述方法包括:
在目标对象调用目标服务的情况下,获取所述目标对象的第一对象数据和第二对象数据,所述第一对象数据来自服务平台,所述第二对象数据来自信用评估平台;
将所述第一对象数据和所述第二对象数据输入目标信用评估模型,通过所述目标信用评估模型,基于所述第一对象数据和所述第二对象数据进行信用评估,得到所述目标对象的预测信用值;
将所述目标对象的预测信用值发送至所述服务平台,以使所述服务平台基于所述预测信用值为所述目标对象提供所述目标服务;
其中,所述目标信用评估模型是基于第三对象数据集、第四对象数据集、第一信用评估模型和第二信用评估模型训练得到的,所述第三对象数据集和所述第四对象数据集是对第一对象数据集和第二对象数据集进行数据混淆得到的,所述第一对象数据集和所述第一信用评估模型来自所述服务平台,所述第二对象数据集和所述第二信用评估模型来自所述信用评估平台。
一方面,提供了一种信用评估模型的训练装置,所述装置包括:
第一获取模块,用于获取第一对象数据集、第一信用评估模型、第二对象数据集以及第二信用评估模型,所述第一对象数据集和所述第一信用评估模型来自服务平台,所述第二对象数据集和所述第二信用评估模型来自信用评估平台;
数据混淆模块,用于对所述第一对象数据集和所述第二对象数据集进行数据混淆,得到第三对象数据集和第四对象数据集,所述第三对象数据集和所述第四对象数据集对应于不同的数据混淆方式;
训练模块,用于基于所述第三对象数据集、所述第四对象数据集、所述第一信用评估模型和所述第二信用评估模型,训练目标信用评估模型,所述目标信用评估模型用于基于对象数据进行信用评估。
在一种可能的实施方式中,所述数据混淆模块,用于执行下述任一项:
采用不同组合方式将所述第一对象数据集中的数据和所述第二对象数据集中的数据进行随机组合,得到所述第三对象数据集和所述第四对象数据集;
采用不同权重将所述第一对象数据集和所述第二对象数据集中相同对象的数据进行加权融合,得到所述第三对象数据集和所述第四对象数据集;
在所述第一对象数据集中的数据和所述第二对象数据集中的数据上随机增加数值,得到所述第三对象数据集和所述第四对象数据集。
在一种可能的实施方式中,所述数据混淆模块,用于从所述第一对象数据集中获取第一数据子集和第二数据子集;从所述第二对象数据集中获取第三数据子集和第四数据子集;将所述第一数据子集和所述第二数据子集与所述第三数据子集和所述第四数据子集进行随机组合,得到所述第三对象数据集和所述第四对象数据集。
在一种可能的实施方式中,所述数据混淆模块,用于对于所述第一对象数据集中的第一对象数据和所述第二对象数据集中的第二数据,采用第一权重组合将所述第一对象数据和所述第二对象数据进行加权融合,得到所述第三对象数据集中的第三对象数据,所述第一对象数据和所述第二对象数据为相同对象且相同类型的数据;采用第二权重组合将所述第一对象数据和所述第二对象数据进行加权融合,得到所述第四对象数据集中的第四对象数据,所述第一权重组合和所述第二权重组合不同。
在一种可能的实施方式中,所述训练模块,用于采用所述第三对象数据集训练所述第一信用评估模型;采用所述第四对象数据集训练所述第二信用评估模型;在所述第一信用评估模型和所述第二信用评估模型的训练过程中,基于所述第一信用评估模型和所述第二信用评估模型,训练所述目标信用评估模型。
在一种可能的实施方式中,所述训练模块,用于将所述第三对象数据集中的第三对象数据输入所述第一信用评估模型,通过所述第一信用评估模型,基于所述第三对象数据进行信用评估,得到所述第三对象数据对应的第一预测信用值;基于所述第一预测信用值和所述第三对象数据的标注信用值之间的第一差异信息,对所述第一信用评估模型进行训练;所述采用所述第四对象数据集训练所述第二信用评估模型包括:将所述第四对象数据集中的第四对象数据输入所述第二信用评估模型,通过所述第二信用评估模型,基于所述第四对象数据进行信用评估,得到所述第四对象数据对应的第二预测信用值;基于所述第二预测信用值和所述第四对象数据的标注信用值之间的第二差异信息,对所述第二信用评估模型进行训练。
在一种可能的实施方式中,所述训练模块,用于在任一轮迭代过程中,获取所述第一信用评估模型的第一模型更新信息以及所述第二信用评估模型的第二模型更新信息;基于所述第一模型更新信息和所述第二模型更新信息,训练所述目标信用评估模型。
在一种可能的实施方式中,所述训练模块,还用于在下一轮迭代之前,采用所述目标信用评估模型的模型参数更新所述第一信用评估模型和所述第二信用评估模型。
在一种可能的实施方式中,所述装置还包括存储模块,用于对所述第一对象数据集进行加密存储;对所述第二对象数据集进行加密存储。
一方面,提供了一种信用评估装置,所述装置包括:
第二获取模块,用于在目标对象调用目标服务的情况下,获取所述目标对象的第一对象数据和第二对象数据,所述第一对象数据来自服务平台,所述第二对象数据来自信用评估平台;
信用评估模块,用于将所述第一对象数据和所述第二对象数据输入目标信用评估模型,通过所述目标信用评估模型,基于所述第一对象数据和所述第二对象数据进行信用评估,得到所述目标对象的预测信用值;
发送模块,用于将所述目标对象的预测信用值发送至所述服务平台,以使所述服务平台基于所述预测信用值为所述目标对象提供所述目标服务;
其中,所述目标信用评估模型是基于第三对象数据集、第四对象数据集、第一信用评估模型和第二信用评估模型训练得到的,所述第三对象数据集和所述第四对象数据集是对第一对象数据集和第二对象数据集进行数据混淆得到的,所述第一对象数据集和所述第一信用评估模型来自所述服务平台,所述第二对象数据集和所述第二信用评估模型来自所述信用评估平台。
一方面,提供了一种计算机设备,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条计算机程序,所述计算机程序由所述一个或多个处理器加载并执行以实现所述信用评估模型的训练方法或信用评估方法。
一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现所述信用评估模型的训练方法或所述信用评估方法。
一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括程序代码,该程序代码存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取该程序代码,处理器执行该程序代码,使得该计算机设备执行上述信用评估模型的训练方法或上述信用评估方法。
通过本说明书实施例提供的技术方案,从服务平台获取了第一对象数据集以及第一信用评估模型,从信用评估平台获取了第二对象数据集以及第二信用评估模型,对该第一对象数据集和该第二对象数据集进行了数据混淆,得到第三对象数据集和第四对象数据集,从而保证该第一对象数据集和该第二对象数据集中数据的安全。基于第三对象数据集、第四对象数据集、该第一信用评估模型和该第二信用评估模型来训练目标信用评估模型,能够在得到综合了服务平台和信用评估平台的信用评估结果的前提下,保证服务平台和信用评估平台数据的安全性。
附图说明
为了更清楚地说明本说明书实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书实施例提供的一种信用评估模型的训练方法的实施环境的示意图;
图2是本说明书实施例提供的一种信用评估模型的训练方法流的程图;
图3是本说明书实施例提供的一种信用评估方法的流程图;
图4是本说明书实施例提供的另一种信用评估模型的训练方法流的程图;
图5是本说明书实施例提供的另一种信用评估方法的流程图;
图6是本说明书实施例提供的一种信用评估模型的训练装置的结构示意图;
图7是本说明书实施例提供的一种信用评估装置的结构示意图;
图8是本说明书实施例提供的一种终端的结构示意图;
图9是本说明书实施例提供的一种服务器的结构示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合附图对本说明书实施方式作进一步的详细描述。
本说明书中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
隐私计算:是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的;在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。
数据混淆:对两份数据,故意对数据进行加密、随机组合和加权组合等方式,组合出新数据的方式,无法还原出原始数据的方法。
联邦学习(Federated Learning,FL):联邦学习是当前流行的一种分布式机器学习框架,联邦学习的诞生消除了用户在训练模型时对隐私数据泄露的担忧。在不暴露用户本地数据的情况下,能够实现和将整个数据集放在一起建模相同或相差不大的效果。多个终端仅需要与服务器进行一系列信息的交换就能够联合训练出一个机器学习模型。联邦学习是基于监督学习方法实现的,本说明书实施例中,将此种基于监督学习方法实现的联邦学习称为监督联邦学习,在监督联邦学习应用场景下,终端具有标准标签的数据集,终端通过与服务器进行交互,执行监督联邦学习任务。
差分隐私(Differential Privacy):与差分隐私相关的一个关键概念是相邻数据集。假设给定两个数据集x和x′,如果它们有且仅有一条数据不一样,那么这两个数据集可称为相邻数据集。如果对于一个随机算法,如果其分别作用于这两个相邻数据集得到的两个输出,例如,分别训练得到两个机器学习模型,而难以区分是从哪个数据集获得的输出,那么这个随机算法就被认为满足差分隐私要求。
云技术(Cloud Technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。在联邦学习的过程中考虑攻击的问题涉及云技术中的云安全领域。云安全(Cloud Security)是指基于云计算商业模式应用的安全软件、硬件、用户、机构、安全云平台的总称。云安全融合了并行处理、网格计算、未知病毒行为判断等新兴技术和概念,通过网状的大量客户端对网络中软件行为的异常监测,获取互联网中木马、恶意程序的最新信息,并发送到服务端进行自动分析和处理,再把病毒和木马的解决方案分发到每一个客户端。
归一化:将取值范围不同的数列映射到(0,1)区间上,便于数据的处理。在一些情况下,归一化后的数值可以直接被实现为概率。
学习率(Learning Rate):用于控制模型的学习进度,学习率可以指导模型在梯度下降法中,如何使用损失函数的梯度调整网络权重。学习率如果过大,可能会使损失函数直接越过全局最优点,此时表现为损失过大;学习率如果过小,损失函数的变化速度很慢,会大大增加网络的收敛复杂度,并且很容易被困在局部最小值或者鞍点。
需要说明的是,本说明书所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本说明书中涉及的对象特征、交互行为特征以及用户信息等都是在充分授权的情况下获取的。
图1是本说明书实施例提供的一种信用评估方法的实施环境示意图,参见图1,该实施环境包括终端110、服务平台120、信用评估平台130以及隐私计算平台140。
终端110通过无线网络或有线网络与服务平台120和信用评估平台130相连。可选的,终端110是智能手机、平板电脑、笔记本电脑、台式计算机、智能手表等,但并不局限于此。终端110安装和运行有支持服务调用的应用程序,终端110是目标对象使用的终端。
服务平台120是独立的物理服务器,或者是多个物理服务器构成的服务器集群或者分布式系统,或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、分发网络(Content Delivery Network,CDN),以及大数据和人工智能平台等基础云计算服务的云服务器。服务平台120为终端110上运行的应用程序提供后台服务,比如,服务平台120为终端110上运行的应用程序提供对应的服务。服务平台120通过无线网络或有线网络与信用评估平台130以及隐私计算平台140相连。需要说明的是,服务平台120包括多种类型,不同类型的服务平台为目标对象提供不同类型的服务。
信用评估平台130是独立的物理服务器,或者是多个物理服务器构成的服务器集群或者分布式系统,或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、分发网络(Content Delivery Network,CDN),以及大数据和人工智能平台等基础云计算服务的云服务器。信用评估平台130为目标对象提供信用评估的服务,比如,目标对象可以通过终端110将对象数据上传至信用评估平台130,信用评估平台130能够基于对象数据实现对目标对象的信用评估,得到该目标对象的信用评估结果。信用评估平台130通过无线网络或有线网络与隐私计算平台140相连,信用评估平台130上存储的对象数据会在加密后上传至隐私计算平台140。
隐私计算平台140是独立的物理服务器,或者是多个物理服务器构成的服务器集群或者分布式系统,或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、分发网络(Content Delivery Network,CDN),以及大数据和人工智能平台等基础云计算服务的云服务器。隐私计算平台140提供隐私计算服务,达到对数据“可用、不可见”的目的。在本说明书实施例中,隐私计算服务是指数据混淆和联邦学习。
本领域技术人员可以知晓,上述终端110和服务平台120的数量可以更多或更少。比如上述终端110和服务平台120均仅为一个,或者上述终端110和服务平台120均为几十个或几百个,或者更多数量,此时上述实施环境中还包括其他终端和服务平台,本说明书实施例对终端的数量和设备类型不加以限定。
介绍完本说明书实施例的实施环境之后,下面将结合上述实施环境对本说明书实施例的应用场景进行介绍,在下述说明过程中,终端也即是上述实施环境中的终端110,服务平台也即是上述实施环境中的服务平台120,信用评估平台也即是上述实施环境中的信用评估平台130,隐私计算平台也即是上述实施环境中的隐私计算平台140。本说明书实施例提供的技术方案能够应用在用户使用服务平台提供的各类服务的场景下,比如,应用在用户使用在线金融服务的场景下,或者应用在用户使用在线租赁服务的场景下,或者应用在用户使用在线购物服务的场景下等,其中,用户也被称为目标对象。
无论是在上述哪种场景下,隐私计算平台均能够采用本说明书实施例提供的信用评估模型的训练方法来训练一个目标信用评估模型。在后续使用服务平台提供的任一服务时,能够基于该目标信用评估模型对目标对象进行信用评估,基于信用评估结果来提供服务。
在隐私计算平台训练该目标信用评估模型的过程中,使用了服务平台上传的第一对象数据集和信用评估平台上传的第二对象数据集。为了保证第一对象数据集和第二对象数据集中的数据不发生泄漏,隐私计算平台对该第一对象数据集和该第二对象数据集进行了数据混淆,得到第三对象数据集和第四对象数据集,经过数据混淆之后,该第三对象数据集与该第一对象数据集和该第二对象数据集中的数据不同,该第四对象数据集与该第一对象数据集和该第二对象数据集中的数据不同,使用该第三对象数据集和该第四对象数据集无法还原该第一对象数据集和该第二对象数据集,从而保证该第一对象数据集和该第二对象数据集的安全。另外,隐私计算平台除了获取该第一对象数据集和该第二对象数据集之外,还从服务平台获取了第一信用评估模型,从信用评估平台获取了第二信用评估模型,其中,该第一信用评估模型是服务平台基于第一对象数据集训练得到的,用于服务平台进行本地的信用评估。该第二信用评估模型是信用评估平台基于第二对象数据训练得到的,用于信用评估平台进行综合的信用评估。隐私计算平台能够利用第三对象数据集、第四对象数据集、该第一信用评估模型以及该第二信用评估模型,训练目标信用评估模型,该目标信用评估模型与该第一信用评估模型和该第二信用评估模型均不同,使用目标信用评估模型也能够进行信用评估,但是信用评估的结果与第一信用评估模型和该第二信用评估模型的信用评估结果不同,对于服务平台来说,使用目标信用评估模型能够实现对目标对象的信用评估,但是不会泄露目标对象在信用评估平台上的数据,也即是不会泄露第二对象数据集中的数据,保证数据的安全性。
本说明书实施例还提供了一种信用评估方法,基于上述隐私计算平台训练得到的目标信用评估平台实现。
以本说明书实施例提供的技术方案应用在用户使用在线金融服务的场景下为例,在目标对象想要使用服务平台提供的在线金融服务时,服务平台将存储的该目标对象的对象数据发送至隐私计算平台,隐私计算平台将该对象数据输入训练完成的目标信用评估模型,得到该目标对象的信用评估结果。隐私计算平台将该信用评估结果发送给服务平台,服务平台基于该信用评估结果向用户提供在线金融服务。
上述是以本说明书实施例提供的技术方案应用在用户使用在线金融服务的场景下为例进行说明的,在上述其他应用场景中,服务平台均能够通过上述方式来为目标对象提供相应的服务,在此不再赘述。
在介绍完本说明书实施例的实施环境和应用场景之后,下面对本说明书实施例提供的信用评估模型的训练方法进行介绍,参见图2,以执行主体为隐私计算平台为例,方法包括下述步骤。
202、隐私计算平台获取第一对象数据集、第一信用评估模型、第二对象数据集以及第二信用评估模型,该第一对象数据集和该第一信用评估模型来自服务平台,该第二对象数据集和该第二信用评估模型来自信用评估平台。
其中,服务平台也即是提供目标服务的平台,该目标服务为在线服务,相应地,该目标服务为在线服务,比如为在线金融服务、在线租赁服务、在线购物服务以及外卖服务等,本说明书实施例对此不作限定。服务平台在为目标对象提供的目标服务的过程中,需要对目标对象进行信用评估,该第一信用评估模型也即是该服务平台用于进行信用评估的模型,该第一对象数据集是服务平台为不同用户提供目标服务时所产生数据的集合,该第一信用评估模型是基于该第一对象数据集训练得到的。信用评估平台是提供信用评估服务的第三方平台,目标对象授权该信用评估平台调用对象数据,信用评估平台基于对象数据来对目标对象进行信用评估,相应地,该第二信用评估模型也即是该信用评估平台用于进行信用平台的模型,该第二对象数据集包括不同对象授权该信用评估平台使用的数据的集合。隐私计算平台用于在保证数据安全性的前提下使用相应的数据。
204、隐私计算平台对该第一对象数据集和该第二对象数据集进行数据混淆,得到第三对象数据集和第四对象数据集,该第三对象数据集和该第四对象数据集对应于不同的数据混淆方式。
其中,数据混淆用于混淆获取的数据,数据混淆之后无法再还原数据混淆之前的数据,相应地,该第一对象数据集和该第二对象数据集是数据混淆前的数据,该第三对象数据集和该第四对象数据集是数据混淆之后的数据,使用该第三对象数据集和该第四对象数据集无法还原该第一对象数据集和该第二对象数据集。采用不同的数据混淆方式对该第一对象数据集和该第二对象数据集进行混淆,得到的第三对象数据集和该第四对象数据集中的数据也不相同。
206、隐私计算平台基于该第三对象数据集、该第四对象数据集、该第一信用评估模型和该第二信用评估模型,训练目标信用评估模型,该目标信用评估模型用于基于对象数据进行信用评估。
其中,训练该目标信用评估模型的过程中使用了该第三对象数据集、该第四对象数据集、该第一信用评估模型以及该第二信用评估模型,该目标信用评估模型能够综合该第一信用评估模型和该第二信用评估模型的信用评估能力,使得该目标信用评估模型既能够进行信用评估,又不会泄露信息,实现对数据的保密。
通过本说明书实施例提供的技术方案,从服务平台获取了第一对象数据集以及第一信用评估模型,从信用评估平台获取了第二对象数据集以及第二信用评估模型,对该第一对象数据集和该第二对象数据集进行了数据混淆,得到第三对象数据集和第四对象数据集,从而保证该第一对象数据集和该第二对象数据集中数据的安全。基于第三对象数据集、第四对象数据集、该第一信用评估模型和该第二信用评估模型来训练目标信用评估模型,能够在得到综合了服务平台和信用评估平台的信用评估结果的前提下,保证服务平台和信用评估平台数据的安全性。
在介绍完本说明书实施例提供的信用评估模型的训练方法之后,下面对本说明书实施例提供的信用评估方法进行说明,参见图3,以执行主体为隐私计算平台为例,方法包括下述步骤。
302、在目标对象调用目标服务的情况下,隐私计算平台获取该目标对象的第一对象数据和第二对象数据,该第一对象数据来自服务平台,该第二对象数据来自信用评估平台。
其中,目标对象是调用该目标服务的用户,调用该目标服务。该目标对象的第一对象数据是该目标对象在使用该服务平台提供的目标服务时所产生的数据。该目标对象的第二对象数据是该目标对象授权给该信用评估平台使用的数据。
304、隐私计算平台将该第一对象数据和该第二对象数据输入目标信用评估模型,通过该目标信用评估模型,基于该第一对象数据和该第二对象数据进行信用评估,得到该目标对象的预测信用值。
其中,该目标信用评估模型是基于第三对象数据集、第四对象数据集、第一信用评估模型和第二信用评估模型训练得到的,该第三对象数据集和该第四对象数据集是对第一对象数据集和第二对象数据集进行数据混淆得到的,该第一对象数据集和该第一信用评估模型来自服务平台,该第二对象数据集和该第二信用评估模型来自信用评估平台。该预测信用值综合了第一信用评估模型和该第二信用评估模型的信用评估结果,是一个综合的预测信用值。
306、隐私计算平台将该目标对象的预测信用值发送至该服务平台,以使该服务平台基于该预测信用值为该目标对象提供该目标服务。
其中,该目标对象的预测信用值能够综合反映服务平台对该目标对象的信用评估结果以及该信用评估平台对该目标对象的信用评估结果,但是基于该预测信用值又无法反推该信用评估平台对该目标对象的信用评估结果,保证了目标对象在信用评估平台上信息的安全性。另外,服务平台基于该预测信用值向该目标对象提供目标服务,提供目标服务的安全性较高。
通过本说明书实施例提供的技术方案,在目标对象调用服务平台提供的目标服务的情况下,从服务平台获取目标对象的第一对象数据,从信用评估平台获取目标对象的第二对象数据。将该第一对象数据和该第二对象数据输入目标信用评估模型,由该目标信用评估模型基于该第一对象数据和该第二对象数据进行信用评估,得到该目标对象的预测信用值,该目标信用值能够综合反映该服务平台对该目标对象的信用评估结果以及该信用评估平台对该目标对象的信用评估结果,但是基于该预测信用值又无法反推该信用评估平台对该目标对象的信用评估结果,保证了目标对象在信用评估平台上信息的安全性。
上述步骤202-206是对本说明书实施例提供的信用评估模型的训练方法的简单介绍,下面将结合一些例子,对本说明书实施例提供的信用评估模型的训练方法进行更加清楚地说明,参见图4,以执行主体为隐私计算平台为例,方法包括下述步骤。
402、隐私计算平台获取第一对象数据集、第一信用评估模型、第二对象数据集以及第二信用评估模型,该第一对象数据集和该第一信用评估模型来自服务平台,该第二对象数据集和该第二信用评估模型来自信用评估平台。
其中,服务平台也即是提供目标服务的平台,该目标服务为在线服务,相应地,该目标服务为在线服务,比如为在线金融服务、在线租赁服务、在线购物服务以及外卖服务等,本说明书实施例对此不作限定。服务平台在为目标对象提供的目标服务的过程中,需要对目标对象进行信用评估,该第一信用评估模型也即是该服务平台用于进行信用评估的模型,将任一对象的对象数据输入该第一信用评估模型能够得到第一信用评估结果,该第一信用评估结果为该服务平台对该对象的信用评估结果。该第一对象数据集是服务平台为不同用户提供目标服务时所产生数据的集合,该第一信用评估模型是基于该第一对象数据集训练得到的。信用评估平台是提供信用评估服务的第三方平台,目标对象授权该信用评估平台调用对象数据,信用评估平台基于对象数据来对目标对象进行信用评估,相应地,该第二信用评估模型也即是该信用评估平台用于进行信用平台的模型,将任一对象的对象数据输入该第二信用评估模型能够得到第二信用评估结果,该第二信用评估结果为该信用评估平台对该对象的信用评估结果。该第二对象数据集包括不同对象授权该信用评估平台使用的数据的集合。隐私计算平台用于在保证数据安全性的前提下使用相应的数据。
需要说明的是,获取和使用该第一对象数据集中的数据以及该第二对象数据集中的数据经过对应对象的充分授权。
在一种可能的实施方式中,隐私计算平台从服务平台获取第一对象数据集和第一信用评估模型,从信用评估平台获取第二对象数据集和第二信用评估模型。
其中,该第一信用评估模型和该第二信用评估模型均能够进行独立的信用评估。在一些实施例中,该第一信用评估模型和该第二信用评估模型的模型具有相同的模型结构。获取该第一信用评估模型和该第二信用评估模型是指获取该第一信用评估模型和该第二信用评估模型的模型参数。
在这种实施方式下,隐私计算平台能够从服务平台获取第一对象数据集,从信用评估平台获取第二对象数据集,后续利用不同平台上的对象数据以及信用评估模型来训练目标信用评估模型,使得训练完成的目标信用评估模型能够输出更加准确的信用评估结果。
为了对本说明书实施例提供的技术方案进行更加清楚的说明,下面分别对该第一对象数据集和该第二对象数据集的内容进行说明。
该第一对象数据集包括多个对象的第一对象数据以及多个对象的第一信用评估结果,该第一对象数据是对应对象在使用服务平台提供的目标服务时产生的数据,该第一信用评估结果是该服务平台利用该第一信用评估模型得到的,该第一信用评估结果能够在后续训练目标信用评估模型时作为标注。相应地,该第二对象数据集包括多个对象的第二对象数据以及多个对象的第二信用评估结果,该第二对象数据是对应对象授权信用评估平台使用的数据,该第二信用评估结果是该信用评估平台利用该第二信用评估模型得到的,该第二信用评估结果也能够在后续训练目标信用评估模型时作为标注。该第一对象数据集和该第二对象数据集可以对应于不同数量的对象。
在一些实施例中,该隐私计算平台获取该第一对象数据集和该第二对象数据集之后,能够对该第一对象数据集进行加密存储,以及对该第二对象数据集进行加密存储。通过对该第一对象数据集和该第二对象数据集进行加密存储,能够提高该第一对象数据集和该第二对象数据集的安全性。
其中,隐私计算平台能够采用任一加密方法对该第一对象数据集和该第二对象数据集进行加密,本说明书实施例对此不作限定。
在一些实施例中,该隐私计算平台获取该第一对象数据集和该第二对象数据集之后,能够对该第一对象数据集和该第二对象数据集进行数据增强,以增加该第一对象数据集和该第二对象数据集中的数据量,从而为后续训练目标信用评估模型提供更加充足的训练数据,提高目标信用评估模型的训练效果。
其中,隐私计算平台可以采用任一种数据增强的方式对该第一对象数据集和该第二对象数据集进行数据增强,本说明书实施例对此不作限定。以对象数据集中任一对象数据为基准进行数据增强之后,得到的增强对象数据与该对象数据对应于相同的信用评估结果,也即是在后续训练过程中对应于相同的标注。
404、隐私计算平台对该第一对象数据集和该第二对象数据集进行数据混淆,得到第三对象数据集和第四对象数据集,该第三对象数据集和该第四对象数据集对应于不同的数据混淆方式。
其中,数据混淆用于混淆获取的数据,数据混淆之后无法再还原数据混淆之前的数据,相应地,该第一对象数据集和该第二对象数据集是数据混淆前的数据,该第三对象数据集和该第四对象数据集是数据混淆之后的数据,使用该第三对象数据集和该第四对象数据集无法还原该第一对象数据集和该第二对象数据集。采用不同的数据混淆方式对该第一对象数据集和该第二对象数据集进行混淆,得到的第三对象数据集和该第四对象数据集中的数据也不相同。
在一种可能的实施方式中,隐私计算平台采用不同组合方式将该第一对象数据集中的数据和该第二对象数据集中的数据进行随机组合,得到该第三对象数据集和该第四对象数据集。
在这种实施方式下,隐私计算平台能够将第一对象数据集中的数据和该第二对象数据集中的数据进行随机组合,得到不同于该第一对象数据集和该第二对象数据集的第三对象数据集和第四对象数据集,保障该第一对象数据集和该第二对象数据集的安全。
举例来说,隐私计算平台从该第一对象数据集中获取第一数据子集和第二数据子集。隐私计算平台从该第二对象数据集中获取第三数据子集和第四数据子集。隐私计算平台将该第一数据子集和该第二数据子集与该第三数据子集和该第四数据子集进行随机组合,得到该第三对象数据集和该第四对象数据集。
比如,该隐私计算平台在该第一对象数据集中进行随机采样,得到该第一数据子集和该第二数据子集。在该随机采样为有放回的随机采样的情况下,该第一数据子集和该第二数据子集中可能存在相同的数据,该有放回的随机采样是指被采样过的数据还可能被再次采样;在该随机采样为无放回的随机采样的情况下,该第一数据子集和该第二数据子集中不存在相同的数据,该无放回的随机采样是指采样过的数据不会被再次采样,隐私计算平台能够采用任一种方式进行随机采样,本说明书实施例对此不作限定。相应地,该隐私计算平台在该第二对象数据集中进行随机采样,得到该第三数据子集和该第四数据子集。在该随机采样为有放回的随机采样的情况下,该第三数据子集和该第四数据子集中可能存在相同的数据;在该随机采样为无放回的随机采样的情况下,该第三数据子集和该第四数据子集中不存在相同的数据。隐私计算平台将该第一数据子集和该第三数据子集进行组合,得到该第三对象数据集。隐私计算平台将该第二数据子集和该第四数据子集进行组合,得到该第四对象数据集。或者,隐私计算平台将该第一数据子集和该第四数据子集进行组合,得到该第三对象数据集。隐私计算平台将该第二数据子集和该第三数据子集进行组合,得到该第四对象数据集。
在一种可能的实施方式中,隐私计算平台采用不同权重将该第一对象数据集和该第二对象数据集中相同对象的数据进行加权融合,得到该第三对象数据集和该第四对象数据集。
在这种实施方式下,隐私计算平台能够通过加权融合的方式来对该第一对象数据集和该第二对象数据集进行数据混淆,根据得到的第三对象数据集和第四对象数据集无法还原该第一对象数据集和该第二对象数据集,从而保证该第一对象数据集和该第二对象数据集的安全。
举例来说,对于该第一对象数据集中的第一对象数据和该第二对象数据集中的第二数据,隐私计算平台采用第一权重组合将该第一对象数据和该第二对象数据进行加权融合,得到该第三对象数据集中的第三对象数据,该第一对象数据和该第二对象数据为相同对象且相同类型的数据。隐私计算平台采用第二权重组合将该第一对象数据和该第二对象数据进行加权融合,得到该第四对象数据集中的第四对象数据,该第一权重组合和该第二权重组合不同。其中,该第一权重组合包括第一权重和第二权重,两个权重,该第二权重组合包括第三权重和第四权重两个权重,该第一权重、该第二权重、该第三权重和该第四权重均不相同,该第一权重、该第二权重、该第三权重和该第四权重由技术人员根据实际情况进行设置,本说明书实施例对此不作限定。
比如,隐私计算平台从该第一对象数据集中获取目标对象的第一对象数据,从该第二对象数据集中获取该目标对象的第二对象数据,该第二对象数据与该第一对象数据为相同类型的数据。隐私计算平台采用第一权重组合中的第一权重和第二权重,将该第一对象数据和该第二对象数据进行加权融合,得到该目标对象的第三对象数据,该第三对象数据属于该第三对象数据集。隐私计算平台采用第二权重组合中的第三权重和第四权重,将该第一对象数据和该第二对象数据进行加权融合,得到该目标对象的第四对象数据,该第四对象数据属于该第四对象数据集。也即是,隐私计算平台通过下述公式(1)来对该第一对象数据和该第二对象数据进行加权融合,得到第三对象数据和第四对象数据。
D3=aD1+bD2
(1)
D4=cD1+dD2
其中,D3为第三对象数据,D4为第四对象数据,D1为第一对象数据,D2为第二对象数据,a为第一权重,b为第二权重,a+b=1,c为第三权重,d为第四权重,c+d=1,a、b、c和d均不相同。
需要说明的是,该第一对象数据集包括多个对象的第一对象数据以及多个对象的第一信用评估结果。该第二对象数据集包括多个对象的第二对象数据以及多个对象的第二信用评估结果。上述加权融合过程是指对该第一对象数据集中的第一对象数据和该第二对象数据集中的第二对象数据中进行加权融合,以及对第一信用评估结果和第二信用评估结果分别进行求和,也即是,从整体上来说,第一对象数据和第二对象数据属于相同类型的数据,第一信用评估结果和第二信用评估结果属于相同类型的数据。在后续训练目标信用评估模型的过程中,可以采用加权融合第一信用评估结果和第二信用评估结果得到的融合信用评估结果作为标注。
在一种可能的实施方式中,隐私计算平台在该第一对象数据集中的数据和该第二对象数据集中的数据上随机增加数值,得到该第三对象数据集和该第四对象数据集。
在这种实施方式下,隐私计算平台能够在该第一对象数据集中的数据和该第二对象数据集中的数据上随机增加数值,使得第三对象数据集和该第四对象数据集与该第一对象数据集和该第二对象数据集完全不同,提高第一对象数据集和该第二对象数据集的安全性。
举例来说,对于该第一对象数据集中的任一第一对象数据,隐私计算平台随机生成第一数值,将该第一数值增加到该第一对象数据中,得到第三对象数据,该第三对象数据属于该第三对象数据集。对于该第二对象数据集中的任一第二对象数据,隐私计算平台随机生成第二数值,将该第二数值增加到该第二对象数据中,得到第四对象数据,该第四对象数据属于该第四对象数据集。
406、隐私计算平台采用该第三对象数据集训练该第一信用评估模型。
在一种可能的实施方式中,隐私计算平台将该第三对象数据集中的第三对象数据输入该第一信用评估模型,通过该第一信用评估模型,基于该第三对象数据进行信用评估,得到该第三对象数据对应的第一预测信用值。隐私计算平台基于该第一预测信用值和该第三对象数据的标注信用值之间的第一差异信息,对该第一信用评估模型进行训练。
需要说明的是,对该第一信用评估模型进行训练需要多个迭代过程,上述实施方式是以一次迭代过程为例进行说明的,其他迭代过程属于同一发明构思,在此不再赘述。
其中,该第三对象数据集是对该第一对象数据集和该第二对象数据集进行数据混淆后得到的,该第三对象数据的标注信用值与目标第一对象数据的第一信用评估结果和/或目标第二对象数据的第二信用评估结果相关,也即是与数据混淆的方式相关,下面将对不同数据混淆方式下该标注信用值的确定方法进行说明,该目标第一对象数据和该目标第二对象数据是数据混淆过程中与该第三对象数据相关的对象数据。该目标第一对象数据属于该第一对象数据集,该目标第二对象数据属于该第二对象数据集。
在隐私计算平台采用不同组合方式将该第一对象数据集中的数据和该第二对象数据集中的数据进行随机组合,得到该第三对象数据集和该第四对象数据集的情况下,该标注信用值为该目标第一对象数据的第一信用评估结果或目标第二对象数据的第二信用评估结果,该第一信用评估结果和该第二信用评估结果均是信用值。在该目标第一对象数据被分配到该第三对象数据集的情况下,该标注信用值为该第一信用标注结果;在该目标第二对象数据被分配到该第三对象数据集的情况下,该标注信用值为该第二信用标注结果。
在隐私计算平台采用不同权重将该第一对象数据集和该第二对象数据集中相同对象的数据进行加权融合,得到该第三对象数据集和该第四对象数据集的情况下,该标注信用值为对该目标第一对象数据的第一信用评估结果和目标第二对象数据的第二信用评估结果进行加权求和得到的。
在隐私计算平台在该第一对象数据集中的数据和该第二对象数据集中的数据上随机增加数值,得到该第三对象数据集和该第四对象数据集的情况下,该标注信用值为该目标第一对象数据的第一信用评估结果或目标第二对象数据的第二信用评估结果。在将随机增加数值的第一对象数据集确定为第三对象数据集的情况下,该标注信用值为该第一信用标注结果;在将随机增加数值的第二对象数据集确定为第三对象数据集的情况下,该标注信用值为该第二信用标注结果。
在这种实施方式下,隐私计算平台能够利用第三对象数据集对该第一信用评估模型进行训练,使得该第一信用评估模型能够学习到更多知识。
下面通过几个例子对上述实施方式进行说明。
例1、隐私计算平台将该第三对象数据集中的第三对象数据输入该第一信用评估模型,通过该第一信用评估模型,对该第三对象数据进行回归处理,得到该第三对象数据对应的第一预测信用值。隐私计算平台基于该第一预测信用值和该第三对象数据的标注信用值之间的第一差异信息,确定对该第一信用评估模型进行训练的第一梯度。隐私计算平台基于该第一梯度,对该第一信用评估模型进行训练。
其中,回归处理包括为线性回归(Linear Regression,LR)、多项式回归(Polynomial Regression,PR)、逐步回归(Stepwise Regression,SR)、岭回归(RidgeRegression,RR)、套索回归(Lasso Regression,LaR)以及弹性回归(Elastic NetRegression,ENR)等,本说明书实施例对此不作限定。
例2、隐私计算平台将该第三对象数据集中的第三对象数据输入该第一信用评估模型,通过该第一信用评估模型,对该第三对象数据进行特征提取,得到该第三对象数据的第三对象数据特征。隐私计算平台通过该第一信用评估模型,对该第三对象数据特征进行全连接和归一化,得到该第三对象数据对应的第一预测信用值。隐私计算平台基于该第一预测信用值和该第三对象数据的标注信用值之间的第一差异信息,确定对该第一信用评估模型进行训练的第一梯度。隐私计算平台基于该第一梯度,对该第一信用评估模型进行训练。
其中,特征提取包括卷积、全连接以及注意力编码等方式,本说明书实施例对此不作限定。
408、隐私计算平台采用该第四对象数据集训练该第二信用评估模型。
在一种可能的实施方式中,隐私计算平台将该第四对象数据集中的第四对象数据输入该第二信用评估模型,通过该第二信用评估模型,基于该第四对象数据进行信用评估,得到该第四对象数据对应的第二预测信用值。隐私计算平台基于该第二预测信用值和该第四对象数据的标注信用值之间的第二差异信息,对该第二信用评估模型进行训练。
需要说明的是,对该第二信用评估模型进行训练需要多个迭代过程,上述实施方式是以一次迭代过程为例进行说明的,其他迭代过程属于同一发明构思,在此不再赘述。
其中,该第四对象数据集是对该第一对象数据集和该第二对象数据集进行数据混淆后得到的,该第四对象数据的标注信用值与目标第一对象数据的第二信用评估结果和/或目标第二对象数据的第二信用评估结果相关,也即是与数据混淆的方式相关,下面将对不同数据混淆方式下该标注信用值的确定方法进行说明,该目标第一对象数据和该目标第二对象数据是数据混淆过程中与该第四对象数据相关的对象数据。该目标第一对象数据属于该第一对象数据集,该目标第二对象数据属于该第二对象数据集。
在隐私计算平台采用不同组合方式将该第一对象数据集中的数据和该第二对象数据集中的数据进行随机组合,得到该第三对象数据集和该第四对象数据集的情况下,该标注信用值为该目标第一对象数据的第二信用评估结果或目标第二对象数据的第二信用评估结果,该第二信用评估结果和该第二信用评估结果均是信用值。在该目标第一对象数据被分配到该第四对象数据集的情况下,该标注信用值为该第一信用标注结果;在该目标第二对象数据被分配到该第四对象数据集的情况下,该标注信用值为该第二信用标注结果。
在隐私计算平台采用不同权重将该第一对象数据集和该第二对象数据集中相同对象的数据进行加权融合,得到该第三对象数据集和该第四对象数据集的情况下,该标注信用值为对该目标第一对象数据的第二信用评估结果和目标第二对象数据的第二信用评估结果进行加权求和得到的。
在隐私计算平台在该第一对象数据集中的数据和该第二对象数据集中的数据上随机增加数值,得到该第三对象数据集和该第四对象数据集的情况下,该标注信用值为该目标第一对象数据的第二信用评估结果或目标第二对象数据的第二信用评估结果。在将随机增加数值的第一对象数据集确定为第四对象数据集的情况下,该标注信用值为该第一信用标注结果;在将随机增加数值的第二对象数据集确定为第四对象数据集的情况下,该标注信用值为该第二信用标注结果。
在这种实施方式下,隐私计算平台能够利用第四对象数据集对该第二信用评估模型进行训练,使得该第二信用评估模型能够学习到更多知识。
下面通过几个例子对上述实施方式进行说明。
例1、隐私计算平台将该第四对象数据集中的第四对象数据输入该第二信用评估模型,通过该第二信用评估模型,对该第四对象数据进行回归处理,得到该第四对象数据对应的第二预测信用值。隐私计算平台基于该第二预测信用值和该第四对象数据的标注信用值之间的第二差异信息,确定对该第二信用评估模型进行训练的第二梯度。隐私计算平台基于该第二梯度,对该第二信用评估模型进行训练。
例2、隐私计算平台将该第四对象数据集中的第四对象数据输入该第二信用评估模型,通过该第二信用评估模型,对该第四对象数据进行特征提取,得到该第四对象数据的第四对象数据特征。隐私计算平台通过该第二信用评估模型,对该第四对象数据特征进行全连接和归一化,得到该第四对象数据对应的第二预测信用值。隐私计算平台基于该第二预测信用值和该第四对象数据的标注信用值之间的第二差异信息,确定对该第二信用评估模型进行训练的第二梯度。隐私计算平台基于该第二梯度,对该第二信用评估模型进行训练。
410、在该第一信用评估模型和该第二信用评估模型的训练过程中,隐私计算平台基于该第一信用评估模型和该第二信用评估模型,训练该目标信用评估模型。
其中,训练该目标信用评估模型的过程中使用了该第三对象数据集、该第四对象数据集、该第一信用评估模型以及该第二信用评估模型,该目标信用评估模型能够综合该第一信用评估模型和该第二信用评估模型的信用评估能力,使得该目标信用评估模型既能够进行信用评估,又不会泄露信息,实现对数据的保密。隐私计算平台基于该第一信用评估模型和该第二信用评估模型进行训练的过程也即是联邦学习的过程。
另外,在第一轮迭代训练之前,隐私计算平台能够基于该第一信用评估模型和该第二信用评估模型得到初始目标信用评估模型。比如,隐私计算平台基于该第一信用评估模型的第一模型参数和该第二信用评估模型的第二模型参数,确定目标模型参数。隐私计算平台基于该目标模型参数,生成该初始目标信用评估模型,该初始目标信用评估模型是第一轮迭代训练时的目标信用评估模型,该目标信用评估模型的模型结构与该第一信用评估模型和该第二信用评估模型相同。比如,隐私计算平台将该第一模型参数的该第二模型参数进行加权融合,得到该目标模型参数。
在一种可能的实施方式中,在任一轮迭代过程中,隐私计算平台获取该第一信用评估模型的第一模型更新信息以及该第二信用评估模型的第二模型更新信息。隐私计算平台基于该第一模型更新信息和该第二模型更新信息,训练该目标信用评估模型。
其中,该第一模型更新信息是隐私计算平台基于第三对象数据集对第一信用评估模型进行一轮迭代训练后得到的,该第一模型更新信息能够反映该第一信用评估模型的模型参数的更新情况。相应地,该第二模型更新信息是隐私计算平台基于第四对象数据集对第二信用评估模型进行一轮迭代训练后得到的,该第二模型更新信息能够反映该第二信用评估模型的模型参数的更新情况。
在这种实施方式下,隐私计算平台能够利用第一信用评估模型和第二信用评估模型来训练目标信用评估模型,使得该目标信用评估模型能够学习到更多的信息,提高该目标信用评估模型进行信用评估的准确性。
举例来说,在任一轮迭代过程中,隐私计算平台获取该第一信用评估模型的第一模型更新信息以及该第二信用评估模型的第二模型更新信息。隐私计算平台将该第一模型更新信息和该第二模型更新信息进行加权融合,得到目标模型更新信息。隐私计算平台基于该目标模型更新信息,更新该目标信用模型的模型参数。
在一些实施例中,在下一轮迭代之前,隐私计算平台采用该目标信用评估模型的模型参数更新该第一信用评估模型和该第二信用评估模型。
在这种实施方式下,隐私计算平台能够在目标信用评估模型更新完成之后,将目标信用评估模型的模型参数下发给第一信用评估模型和第二信用评估模型,使得第一信用评估模型和第二信用评估模型的模型参数在下一轮迭代之前保持同步。
需要说明的是,上述步骤406-410是以一轮联邦学习过程为例进行说明的,训练该目标信用评估模型需要多轮联邦学习过程,每轮联邦学习过程均属于同一发明构思,实现过程不再赘述。
上述所有可选技术方案,可以采用任意结合形成本说明书的可选实施例,在此不再一一赘述。
通过本说明书实施例提供的技术方案,从服务平台获取了第一对象数据集以及第一信用评估模型,从信用评估平台获取了第二对象数据集以及第二信用评估模型,对该第一对象数据集和该第二对象数据集进行了数据混淆,得到第三对象数据集和第四对象数据集,从而保证该第一对象数据集和该第二对象数据集中数据的安全。基于第三对象数据集、第四对象数据集、该第一信用评估模型和该第二信用评估模型来训练目标信用评估模型,能够在得到综合了服务平台和信用评估平台的信用评估结果的前提下,保证服务平台和信用评估平台数据的安全性。
进一步来说,使用训练得到的目标信用评估模型时,服务平台无法感知对象在信用评估平台上的信用评估结果,实现了数据隔离。采用数据混淆和联邦学习,从数据和训练两个层次保证了信用评估结果的隐私性。综合使用服务平台和信用评估平台的数据来训练目标信用评估模型,使得目标信用评估模型在进行信用评估时具有更高的准确性。
上述步骤402-410是对本说明书实施例提供的信用评估模型的训练方法进行的说明,上述步骤302-306是对本说明书实施例提供的信用评估方法的简单介绍,下面将结合一些例子,对本说明书实施例提供的信用评估方法进行更加清楚的说明,参见图5,以执行主体为隐私计算平台为例,方法包括下述步骤。
502、在目标对象调用目标服务的情况下,隐私计算平台获取该目标对象的第一对象数据和第二对象数据,该第一对象数据来自服务平台,该第二对象数据来自信用评估平台。
其中,目标对象是调用该目标服务的用户,调用该目标服务。该目标对象的第一对象数据是该目标对象在使用该服务平台提供的目标服务时所产生的数据。该目标对象的第二对象数据是该目标对象授权给该信用评估平台使用的数据。
在一种可能的实施方式中,响应于目标对象对目标服务的调用请求,服务平台向信用评估平台发送隐私数据交换请求,该调用请求和该隐私数据交换请求均携带该目标对象的对象标识,该隐私数据交换请求用于请求该目标对象的第二对象数据发送至隐私计算平台。响应于该隐私数据交换请求,信用评估平台将该目标对象的第二对象数据发送至隐私计算平台。服务平台将该目标对象的第一对象数据发送至隐私计算平台,隐私计算平台获取该目标对象的第一对象数据和第二对象数据。
504、隐私计算平台将该第一对象数据和该第二对象数据输入目标信用评估模型,通过该目标信用评估模型,基于该第一对象数据和该第二对象数据进行信用评估,得到该目标对象的预测信用值。
其中,该目标信用评估模型是基于第三对象数据集、第四对象数据集、第一信用评估模型和第二信用评估模型训练得到的,该第三对象数据集和该第四对象数据集是对第一对象数据集和第二对象数据集进行数据混淆得到的,该第一对象数据集和该第一信用评估模型来自服务平台,该第二对象数据集和该第二信用评估模型来自信用评估平台。该预测信用值综合了第一信用评估模型和该第二信用评估模型的信用评估结果,是一个综合的预测信用值。
在一种可能的实施方式中,隐私计算平台将该第一对象数据和该第二对象数据输入该目标信用评估模型,通过该目标信用评估模型,分别对该第一对象数据和该第二对象数据进行回归处理,得到该第一对象数据对应的第一信用值和该第二对象数据对应的第二信用值。隐私计算平台将该第一信用值和该第二信用值进行加权融合,得到该目标对象的预测信用值。
其中,加权融合的权重由技术人员根据实际情况进行设置,本说明书实施例对此不作限定。
例2、隐私计算平台将该第一对象数据和该第二对象数据输入该目标信用评估模型,通过该目标信用评估模型,分别对该第一对象数据和该第二对象数据进行特征提取,得到该第一对象数据和该第二对象数据的该第一对象数据和该第二对象数据特征。隐私计算平台通过该目标信用评估模型,对该第一对象数据和该第二对象数据特征分别进行全连接和归一化,得到该第一对象数据对应的第一信用值和该第二对象数据对应的第二信用值。隐私计算平台将该第一信用值和该第二信用值进行加权融合,得到该目标对象的预测信用值。
506、隐私计算平台将该目标对象的预测信用值发送至该服务平台,以使该服务平台基于该预测信用值为该目标对象提供该目标服务。
其中,该目标对象的预测信用值能够综合反映服务平台对该目标对象的信用评估结果以及该信用评估平台对该目标对象的信用评估结果,但是基于该预测信用值又无法反推该信用评估平台对该目标对象的信用评估结果,保证了目标对象在信用评估平台上信息的安全性。另外,服务平台基于该预测信用值向该目标对象提供目标服务,提供目标服务的安全性较高。
上述所有可选技术方案,可以采用任意结合形成本说明书的可选实施例,在此不再一一赘述。
通过本说明书实施例提供的技术方案,在目标对象调用服务平台提供的目标服务的情况下,从服务平台获取目标对象的第一对象数据,从信用评估平台获取目标对象的第二对象数据。将该第一对象数据和该第二对象数据输入目标信用评估模型,由该目标信用评估模型基于该第一对象数据和该第二对象数据进行信用评估,得到该目标对象的预测信用值,该目标信用值能够综合反映该服务平台对该目标对象的信用评估结果以及该信用评估平台对该目标对象的信用评估结果,但是基于该预测信用值又无法反推该信用评估平台对该目标对象的信用评估结果,保证了目标对象在信用评估平台上信息的安全性。
图6是本说明书实施例提供的一种信用评估模型的训练装置的结构示意图,参见图6,装置包括:第一获取模块601、数据混淆模块602以及训练模块603。
第一获取模块601,用于获取第一对象数据集、第一信用评估模型、第二对象数据集以及第二信用评估模型,该第一对象数据集和该第一信用评估模型来自服务平台,该第二对象数据集和该第二信用评估模型来自信用评估平台。
数据混淆模块602,用于对该第一对象数据集和该第二对象数据集进行数据混淆,得到第三对象数据集和第四对象数据集,该第三对象数据集和该第四对象数据集对应于不同的数据混淆方式。
训练模块603,用于基于该第三对象数据集、该第四对象数据集、该第一信用评估模型和该第二信用评估模型,训练目标信用评估模型,该目标信用评估模型用于基于对象数据进行信用评估。
在一种可能的实施方式中,该数据混淆模块602,用于执行下述任一项:
采用不同组合方式将该第一对象数据集中的数据和该第二对象数据集中的数据进行随机组合,得到该第三对象数据集和该第四对象数据集。
采用不同权重将该第一对象数据集和该第二对象数据集中相同对象的数据进行加权融合,得到该第三对象数据集和该第四对象数据集。
在该第一对象数据集中的数据和该第二对象数据集中的数据上随机增加数值,得到该第三对象数据集和该第四对象数据集。
在一种可能的实施方式中,该数据混淆模块602,用于从该第一对象数据集中获取第一数据子集和第二数据子集。从该第二对象数据集中获取第三数据子集和第四数据子集。将该第一数据子集和该第二数据子集与该第三数据子集和该第四数据子集进行随机组合,得到该第三对象数据集和该第四对象数据集。
在一种可能的实施方式中,该数据混淆模块602,用于对于该第一对象数据集中的第一对象数据和该第二对象数据集中的第二数据,采用第一权重组合将该第一对象数据和该第二对象数据进行加权融合,得到该第三对象数据集中的第三对象数据,该第一对象数据和该第二对象数据为相同对象且相同类型的数据。采用第二权重组合将该第一对象数据和该第二对象数据进行加权融合,得到该第四对象数据集中的第四对象数据,该第一权重组合和该第二权重组合不同。
在一种可能的实施方式中,该训练模块603,用于采用该第三对象数据集训练该第一信用评估模型。采用该第四对象数据集训练该第二信用评估模型。在该第一信用评估模型和该第二信用评估模型的训练过程中,基于该第一信用评估模型和该第二信用评估模型,训练该目标信用评估模型。
在一种可能的实施方式中,该训练模块603,用于将该第三对象数据集中的第三对象数据输入该第一信用评估模型,通过该第一信用评估模型,基于该第三对象数据进行信用评估,得到该第三对象数据对应的第一预测信用值。基于该第一预测信用值和该第三对象数据的标注信用值之间的第一差异信息,对该第一信用评估模型进行训练。该采用该第四对象数据集训练该第二信用评估模型包括:将该第四对象数据集中的第四对象数据输入该第二信用评估模型,通过该第二信用评估模型,基于该第四对象数据进行信用评估,得到该第四对象数据对应的第二预测信用值。基于该第二预测信用值和该第四对象数据的标注信用值之间的第二差异信息,对该第二信用评估模型进行训练。
在一种可能的实施方式中,该训练模块603,用于在任一轮迭代过程中,获取该第一信用评估模型的第一模型更新信息以及该第二信用评估模型的第二模型更新信息。基于该第一模型更新信息和该第二模型更新信息,训练该目标信用评估模型。
在一种可能的实施方式中,该训练模块603,还用于在下一轮迭代之前,采用该目标信用评估模型的模型参数更新该第一信用评估模型和该第二信用评估模型。
在一种可能的实施方式中,该装置还包括存储模块,用于对该第一对象数据集进行加密存储。对该第二对象数据集进行加密存储。
需要说明的是:上述实施例提供的信用评估模型的训练装置在训练信用评估模型时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的信用评估装置与信用评估方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
通过本说明书实施例提供的技术方案,从服务平台获取了第一对象数据集以及第一信用评估模型,从信用评估平台获取了第二对象数据集以及第二信用评估模型,对该第一对象数据集和该第二对象数据集进行了数据混淆,得到第三对象数据集和第四对象数据集,从而保证该第一对象数据集和该第二对象数据集中数据的安全。基于第三对象数据集、第四对象数据集、该第一信用评估模型和该第二信用评估模型来训练目标信用评估模型,能够在得到综合了服务平台和信用评估平台的信用评估结果的前提下,保证服务平台和信用评估平台数据的安全性。
图7是本说明书实施例提供的一种信用评估装置的结构示意图,参见图7,装置包括:第二获取模块701、信用评估模块702以及发送模块703。
第二获取模块701,用于在目标对象调用目标服务的情况下,获取该目标对象的第一对象数据和第二对象数据,该第一对象数据来自服务平台,该第二对象数据来自信用评估平台。
信用评估模块702,用于将该第一对象数据和该第二对象数据输入目标信用评估模型,通过该目标信用评估模型,基于该第一对象数据和该第二对象数据进行信用评估,得到该目标对象的预测信用值。
发送模块703,用于将该目标对象的预测信用值发送至该服务平台,以使该服务平台基于该预测信用值为该目标对象提供该目标服务。
其中,该目标信用评估模型是基于第三对象数据集、第四对象数据集、第一信用评估模型和第二信用评估模型训练得到的,该第三对象数据集和该第四对象数据集是对第一对象数据集和第二对象数据集进行数据混淆得到的,该第一对象数据集和该第一信用评估模型来自该服务平台,该第二对象数据集和该第二信用评估模型来自该信用评估平台。
需要说明的是:上述实施例提供的信用评估装置在评估信用时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的信用评估装置与信用评估方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
通过本说明书实施例提供的技术方案,在目标对象调用服务平台提供的目标服务的情况下,从服务平台获取目标对象的第一对象数据,从信用评估平台获取目标对象的第二对象数据。将该第一对象数据和该第二对象数据输入目标信用评估模型,由该目标信用评估模型基于该第一对象数据和该第二对象数据进行信用评估,得到该目标对象的预测信用值,该目标信用值能够综合反映该服务平台对该目标对象的信用评估结果以及该信用评估平台对该目标对象的信用评估结果,但是基于该预测信用值又无法反推该信用评估平台对该目标对象的信用评估结果,保证了目标对象在信用评估平台上信息的安全性。
本说明书实施例提供了一种计算机设备,用于执行上述方法,该计算机设备可以实现为终端或者服务器,下面先对终端的结构进行介绍:
图8是本说明书实施例提供的一种终端的结构示意图。该终端800可以是:智能手机、平板电脑、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端800包括有:一个或多个处理器801和一个或多个存储器802。
处理器801可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器801可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器801还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器802可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器802还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器802中的非暂态的计算机可读存储介质用于存储至少一个计算机程序,该至少一个计算机程序用于被处理器801所执行以实现本说明书中方法实施例提供的信用评估模型的训练方法或信用评估方法。
在一些实施例中,终端800还可选包括有:外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地,外围设备包括:射频电路804、显示屏805、摄像头组件806、音频电路807和电源808中的至少一种。
外围设备接口803可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中,处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上;在一些其他实施例中,处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路804用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选的,射频电路804包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。
显示屏805用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时,显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时,显示屏805还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。
摄像头组件806用于采集图像或视频。可选的,摄像头组件806包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。
音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器801进行处理,或者输入至射频电路804以实现语音通信。
电源808用于为终端800中的各个组件进行供电。电源808可以是交流电、直流电、一次性电池或可充电电池。
在一些实施例中,终端800还包括有一个或多个传感器809。该一个或多个传感器809包括但不限于:加速度传感器810、陀螺仪传感器811、压力传感器812、光学传感器813以及接近传感器814。
加速度传感器810可以检测以终端800建立的坐标系的三个坐标轴上的加速度大小。
陀螺仪传感器811可以终端800的机体方向及转动角度,陀螺仪传感器811可以与加速度传感器810协同采集用户对终端800的3D动作。
压力传感器812可以设置在终端800的侧边框和/或显示屏805的下层。当压力传感器812设置在终端800的侧边框时,可以检测用户对终端800的握持信号,由处理器801根据压力传感器812采集的握持信号进行左右手识别或快捷操作。当压力传感器812设置在显示屏805的下层时,由处理器801根据用户对显示屏805的压力操作,实现对UI界面上的可操作性控件进行控制。
光学传感器813用于采集环境光强度。在一个实施例中,处理器801可以根据光学传感器813采集的环境光强度,控制显示屏805的显示亮度。
接近传感器814用于采集用户与终端800的正面之间的距离。
本领域技术人员可以理解,图8中示出的结构并不构成对终端800的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
上述计算机设备还可以实现为服务器,下面对服务器的结构进行介绍:
图9是本说明书实施例提供的一种服务器的结构示意图,该服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(Central Processing Units,CPU)901和一个或多个的存储器902,其中,所述一个或多个存储器902中存储有至少一条计算机程序,所述至少一条计算机程序由所述一个或多个处理器901加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器900还可以具有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器900还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括计算机程序的存储器,上述计算机程序可由处理器执行以完成上述实施例中的信用评估模型的训练方法或信用评估方法。例如,该计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact Disc Read-OnlyMemory,CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括程序代码,该程序代码存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取该程序代码,处理器执行该程序代码,使得该计算机设备执行上述信用评估模型的训练方法或信用评估方法。
在一些实施例中,本说明书实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
上述仅为本说明书的可选实施例,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书的保护范围之内。
Claims (15)
1.一种信用评估模型的训练方法,所述方法包括:
获取第一对象数据集、第一信用评估模型、第二对象数据集以及第二信用评估模型,所述第一对象数据集和所述第一信用评估模型来自服务平台,所述第二对象数据集和所述第二信用评估模型来自信用评估平台;
对所述第一对象数据集和所述第二对象数据集进行数据混淆,得到第三对象数据集和第四对象数据集,所述第三对象数据集和所述第四对象数据集对应于不同的数据混淆方式;
基于所述第三对象数据集、所述第四对象数据集、所述第一信用评估模型和所述第二信用评估模型,训练目标信用评估模型,所述目标信用评估模型用于基于对象数据进行信用评估。
2.根据权利要求1所述的方法,所述对所述第一对象数据集和所述第二对象数据集进行数据混淆,得到第三对象数据集和第四对象数据集包括下述任一项:
采用不同组合方式将所述第一对象数据集中的数据和所述第二对象数据集中的数据进行随机组合,得到所述第三对象数据集和所述第四对象数据集;
采用不同权重将所述第一对象数据集和所述第二对象数据集中相同对象的数据进行加权融合,得到所述第三对象数据集和所述第四对象数据集;
在所述第一对象数据集中的数据和所述第二对象数据集中的数据上随机增加数值,得到所述第三对象数据集和所述第四对象数据集。
3.根据权利要求2所述的方法,所述采用不同组合方式将所述第一对象数据集中的数据和所述第二对象数据集中的数据进行随机组合,得到所述第三对象数据集和所述第四对象数据集包括:
从所述第一对象数据集中获取第一数据子集和第二数据子集;
从所述第二对象数据集中获取第三数据子集和第四数据子集;
将所述第一数据子集和所述第二数据子集与所述第三数据子集和所述第四数据子集进行随机组合,得到所述第三对象数据集和所述第四对象数据集。
4.根据权利要求2所述的方法,所述采用不同权重将所述第一对象数据集和所述第二对象数据集中相同对象的数据进行加权融合,得到所述第三对象数据集和所述第四对象数据集包括:
对于所述第一对象数据集中的第一对象数据和所述第二对象数据集中的第二数据,采用第一权重组合将所述第一对象数据和所述第二对象数据进行加权融合,得到所述第三对象数据集中的第三对象数据,所述第一对象数据和所述第二对象数据为相同对象且相同类型的数据;
采用第二权重组合将所述第一对象数据和所述第二对象数据进行加权融合,得到所述第四对象数据集中的第四对象数据,所述第一权重组合和所述第二权重组合不同。
5.根据权利要求1所述的方法,所述基于所述第三对象数据集、所述第四对象数据集、所述第一信用评估模型和所述第二信用评估模型,训练目标信用评估模型包括:
采用所述第三对象数据集训练所述第一信用评估模型;
采用所述第四对象数据集训练所述第二信用评估模型;
在所述第一信用评估模型和所述第二信用评估模型的训练过程中,基于所述第一信用评估模型和所述第二信用评估模型,训练所述目标信用评估模型。
6.根据权利要求5所述的方法,所述采用所述第三对象数据集训练所述第一信用评估模型包括:
将所述第三对象数据集中的第三对象数据输入所述第一信用评估模型,通过所述第一信用评估模型,基于所述第三对象数据进行信用评估,得到所述第三对象数据对应的第一预测信用值;基于所述第一预测信用值和所述第三对象数据的标注信用值之间的第一差异信息,对所述第一信用评估模型进行训练;
所述采用所述第四对象数据集训练所述第二信用评估模型包括:
将所述第四对象数据集中的第四对象数据输入所述第二信用评估模型,通过所述第二信用评估模型,基于所述第四对象数据进行信用评估,得到所述第四对象数据对应的第二预测信用值;基于所述第二预测信用值和所述第四对象数据的标注信用值之间的第二差异信息,对所述第二信用评估模型进行训练。
7.根据权利要求5所述的方法,所述在所述第一信用评估模型和所述第二信用评估模型的训练过程中,基于所述第一信用评估模型和所述第二信用评估模型,训练所述目标信用评估模型包括:
在任一轮迭代过程中,获取所述第一信用评估模型的第一模型更新信息以及所述第二信用评估模型的第二模型更新信息;
基于所述第一模型更新信息和所述第二模型更新信息,训练所述目标信用评估模型。
8.根据权利要求7所述的方法,所述基于所述第一模型更新信息和所述第二模型更新信息,训练所述目标信用评估模型之后,所述方法还包括:
在下一轮迭代之前,采用所述目标信用评估模型的模型参数更新所述第一信用评估模型和所述第二信用评估模型。
9.根据权利要求1-8任一项所述的方法,所述获取第一对象数据集、第一信用评估模型、第二对象数据集以及第二信用评估模型之后,所述方法还包括:
对所述第一对象数据集进行加密存储;
对所述第二对象数据集进行加密存储。
10.一种信用评估方法,所述方法包括:
在目标对象调用目标服务的情况下,获取所述目标对象的第一对象数据和第二对象数据,所述第一对象数据来自服务平台,所述第二对象数据来自信用评估平台;
将所述第一对象数据和所述第二对象数据输入目标信用评估模型,通过所述目标信用评估模型,基于所述第一对象数据和所述第二对象数据进行信用评估,得到所述目标对象的预测信用值;
将所述目标对象的预测信用值发送至所述服务平台,以使所述服务平台基于所述预测信用值为所述目标对象提供所述目标服务;
其中,所述目标信用评估模型是基于第三对象数据集、第四对象数据集、第一信用评估模型和第二信用评估模型训练得到的,所述第三对象数据集和所述第四对象数据集是对第一对象数据集和第二对象数据集进行数据混淆得到的,所述第一对象数据集和所述第一信用评估模型来自所述服务平台,所述第二对象数据集和所述第二信用评估模型来自所述信用评估平台。
11.一种信用评估模型的训练装置,所述装置包括:
第一获取模块,用于获取第一对象数据集、第一信用评估模型、第二对象数据集以及第二信用评估模型,所述第一对象数据集和所述第一信用评估模型来自服务平台,所述第二对象数据集和所述第二信用评估模型来自信用评估平台;
数据混淆模块,用于对所述第一对象数据集和所述第二对象数据集进行数据混淆,得到第三对象数据集和第四对象数据集,所述第三对象数据集和所述第四对象数据集对应于不同的数据混淆方式;
训练模块,用于基于所述第三对象数据集、所述第四对象数据集、所述第一信用评估模型和所述第二信用评估模型,训练目标信用评估模型,所述目标信用评估模型用于基于对象数据进行信用评估。
12.一种信用评估装置,所述装置包括:
第二获取模块,用于在目标对象调用目标服务的情况下,获取所述目标对象的第一对象数据和第二对象数据,所述第一对象数据来自服务平台,所述第二对象数据来自信用评估平台;
信用评估模块,用于将所述第一对象数据和所述第二对象数据输入目标信用评估模型,通过所述目标信用评估模型,基于所述第一对象数据和所述第二对象数据进行信用评估,得到所述目标对象的预测信用值;
发送模块,用于将所述目标对象的预测信用值发送至所述服务平台,以使所述服务平台基于所述预测信用值为所述目标对象提供所述目标服务;
其中,所述目标信用评估模型是基于第三对象数据集、第四对象数据集、第一信用评估模型和第二信用评估模型训练得到的,所述第三对象数据集和所述第四对象数据集是对第一对象数据集和第二对象数据集进行数据混淆得到的,所述第一对象数据集和所述第一信用评估模型来自所述服务平台,所述第二对象数据集和所述第二信用评估模型来自所述信用评估平台。
13.一种计算机设备,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条计算机程序,所述计算机程序由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求9任一项所述的信用评估模型的训练方法,或实现如权利要求10所述的信用评估方法。
14.一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至权利要求9任一项所述的信用评估模型的训练方法,或实现如权利要求10所述的信用评估方法。
15.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至权利要求9任一项所述的信用评估模型的训练方法,或实现如权利要求10所述的信用评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211731673.5A CN116245599A (zh) | 2022-12-30 | 2022-12-30 | 信用评估模型待的训练方法、信用评估方法以及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211731673.5A CN116245599A (zh) | 2022-12-30 | 2022-12-30 | 信用评估模型待的训练方法、信用评估方法以及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116245599A true CN116245599A (zh) | 2023-06-09 |
Family
ID=86628859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211731673.5A Pending CN116245599A (zh) | 2022-12-30 | 2022-12-30 | 信用评估模型待的训练方法、信用评估方法以及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116245599A (zh) |
-
2022
- 2022-12-30 CN CN202211731673.5A patent/CN116245599A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10693872B1 (en) | Identity verification system | |
CN114091617B (zh) | 联邦学习建模优化方法、电子设备、存储介质及程序产品 | |
CN110569909B (zh) | 基于区块链的故障预警方法、装置、设备及存储介质 | |
CN110598879B (zh) | 基于区块链的垃圾回收方法、装置、设备及存储介质 | |
CN112257876A (zh) | 联邦学习方法、装置、计算机设备及介质 | |
US12047513B2 (en) | Labeling method, apparatus, and device, and readable storage medium | |
CN111104980B (zh) | 确定分类结果的方法、装置、设备及存储介质 | |
CN112989767B (zh) | 医学词语标注方法、医学词语映射方法、装置及设备 | |
CN106778295B (zh) | 文件存储、显示方法、装置及终端 | |
CN111612167A (zh) | 机器学习模型的联合训练方法、装置、设备及存储介质 | |
CN110825863A (zh) | 一种文本对融合方法及装置 | |
CN112990053A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN115270163A (zh) | 数据处理方法、相关装置及存储介质 | |
CN112231768B (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN112037305B (zh) | 对图像中的树状组织进行重建的方法、设备及存储介质 | |
CN113722738A (zh) | 数据保护方法、装置、介质及电子设备 | |
CN114581091A (zh) | 一种身份验证方法、装置、计算机设备及存储介质 | |
CN115719094B (zh) | 基于联邦学习的模型训练方法、装置、设备及存储介质 | |
CN116245599A (zh) | 信用评估模型待的训练方法、信用评估方法以及设备 | |
CN111897709B (zh) | 监控用户的方法、装置、电子设备及介质 | |
CN109743289B (zh) | 一种基于神经网络的数据验证方法、装置及电子设备 | |
CN116756558A (zh) | 关联方识别模型的训练方法、关联方识别方法以及装置 | |
CN111756705B (zh) | 活体检测算法的攻击测试方法、装置、设备及存储介质 | |
CN116980236B (zh) | 网络安全检测方法、装置、设备及存储介质 | |
CN113807530B (zh) | 信息处理系统、方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |