CN111401913A - 一种私有数据保护的模型学习方法、装置及系统 - Google Patents

一种私有数据保护的模型学习方法、装置及系统 Download PDF

Info

Publication number
CN111401913A
CN111401913A CN202010198214.XA CN202010198214A CN111401913A CN 111401913 A CN111401913 A CN 111401913A CN 202010198214 A CN202010198214 A CN 202010198214A CN 111401913 A CN111401913 A CN 111401913A
Authority
CN
China
Prior art keywords
wind control
model parameters
model
energized
control model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010198214.XA
Other languages
English (en)
Inventor
宋博文
奚冬博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010198214.XA priority Critical patent/CN111401913A/zh
Publication of CN111401913A publication Critical patent/CN111401913A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例提供一种基于私有数据保护的模型学习方法、装置及系统。其中,方法包括:联盟中的非赋能成员对象基于属于私有数据的风险特征集合,对本地的风控模型进行训练,得到本地的风控模型的模型参数,其中,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征。所述联盟中的非赋能成员对象将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象。所述赋能成员对象基于所述联盟中的至少两个成员对象的风控模型的模型参数,确定目标模型参数。所述赋能成员对象将所述目标模型参数发送至所述联盟中的非赋能成员对象。接收到所述目标模型参数的非赋能成员对象,基于所述目标模型参数,对本地的风控模型进行调整。

Description

一种私有数据保护的模型学习方法、装置及系统
技术领域
本文件涉及人工智能技术领域,尤其涉及一种私有数据保护的模型学习方法、装置及系统。
背景技术
深度学习模型凭借具有机械化处理信息的能力,得到了越来越广泛的使用。在支付领域中,深度学习模型可以对交易数据进行分析,以更深刻理解用户,从而实现风险防控。
目前,随着电子支付应用的普及,支付业务的形态也越来越多,加上支付业务的交易数据不易进行共享,使得机构开发风控模型的难度大幅增加。为此,有必要在保证私有数据隐私的前提下,提出一种可跨场景冷启动的联合建模的风控方案。
发明内容
本说明书实施例目的是提供一种私有数据保护的模型学习方法、装置及系统,能够在保证私有数据隐私的前提下,实现可跨场景冷启动的联合建模的风控方案。
为了实现上述目的,本说明书实施例是这样实现的:
第一方面,提供一种私有数据保护的模型学习方法,包括:
联盟中的非赋能成员对象基于属于私有数据的风险特征集合,对本地的风控模型进行训练,得到本地的风控模型的模型参数,其中,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
所述联盟中的非赋能成员对象将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象;
所述赋能成员对象基于所述联盟中的至少两个成员对象的风控模型的模型参数,确定目标模型参数;
所述赋能成员对象将所述目标模型参数发送至所述联盟中的非赋能成员对象;
接收到所述目标模型参数的非赋能成员对象,基于所述目标模型参数,对本地的风控模型进行调整。
第二方面,提供一种私有数据保护的模型学习方法,包括:
联盟中的非赋能成员对象基于属于私有数据的风险特征集合,对本地的风控模型进行训练,得到本地的风控模型的模型参数,其中,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
所述非赋能成员对象将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象;
所述联盟中的非赋能成员对象接收所述赋能成员对象反馈的目标模型参数,其中,所述目标模型参数是赋能成员对象基于所述联盟中的至少两个成员对象的风控模型的模型参数确定得到的;
所述非赋能成员对象,基于所述目标模型参数,对本地的风控模型进行调整。
第三方面,提供一种私有数据保护的模型学习方法,包括:
联盟中的赋能成员对象接收所述联盟中的非赋能成员对象发送的风控模型的模型参数,其中,所述非赋能成员对象发送的风控模型的模型参数是基于属于所述非赋能成员对象的私有数据的风险特征集合训练得到的,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
所述赋能成员对象基于所述联盟中的至少两个成员对象的风控模型的模型参数,确定得到目标模型参数;
所述赋能成员对象将所述目标模型参数发送至所述联盟中的非赋能成员对象,从而使得接收到所述目标模型参数的非赋能成员对象基于所述目标模型参数对本地的风控模型进行调整。
第四方面,提供一种联盟中的非赋能成员对象装置,包括:
训练模块,基于属于私有数据的风险特征集合,对本地的风控模型进行训练,得到本地的风控模型的模型参数,其中,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
发送模块,将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象;
接收模块,接收所述赋能成员对象反馈的目标模型参数,其中,所述目标模型参数是赋能成员对象基于所述联盟中的至少两个成员对象的风控模型的模型参数确定得到的;
调整模块,基于所述目标模型参数,对本地的风控模型进行调整。
第五方面,提供一种联盟中的赋能成员对象装置,包括:
接收模块,接收所述联盟中的非赋能成员对象发送的风控模型的模型参数,其中,所述非赋能成员对象发送的风控模型的模型参数是基于属于所述非赋能成员对象的私有数据的风险特征集合训练得到的,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
确定模块,基于所述联盟中的至少两个成员对象的风控模型的模型参数,确定得到目标模型参数;
发送模块,将所述目标模型参数发送至所述联盟中的非赋能成员对象,从而使得接收到所述目标模型参数的非赋能成员对象基于所述目标模型参数对本地的风控模型进行调整。
第六方面,提供一种联盟系统,包括:赋能成员对象和多个非赋能成员对象;其中,
非赋能成员对象基于属于私有数据的风险特征集合,对本地的风控模型进行训练,得到本地的风控模型的模型参数,并将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象;以及,基于所述赋能成员对象发送的目标模型参数,对本地的风控模型进行调整;其中,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
所述赋能成员对象接收非赋能成员对象发送的风控模型的模型参数,并所述联盟系统中的至少两个成员对象的风控模型的模型参数,确定得到目标模型参数,并将所述目标模型参数发送至所述联盟系统中的非赋能成员对象。
本说明书实施例的方案中,联盟中的各成员对象可以共同搭建风控模型,并分别根据自身的私有数据对风控模型进行训练,从而将训练后获得的模型参数提供给其中的赋能成员对象。赋能成员对象对各成员对象训练得到的模型参数进行汇总,以确定出目标模型参数,并将目标模型参数反馈给其他成员对象,使得联盟中的任何成员对象都有能力将自身的风控模型调整至较佳的性能水平。整个方案中,各成员对象只交互了训练后获得的知识数据,而敏感性较强的训练数据不出域,保障了隐私性。此外,各成员对象基于交易逻辑拓扑的图特征训练风控模型,而图特征的获取方式适用于不同的支付业务形态,因此训练后的风控模型具有较强的泛用性,特别适合跨场景冷启动的应用场景。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例提供的基于私有数据保护的模型学习方法的流程示意图。
图2为本说明书实施例提供的非赋能成员对象装置的结构示意图。
图3为本说明书实施例提供的赋能成员对象装置的结构示意图。
图4为本说明书实施例提供的联盟系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
目前,在支付业务领域里,越来越多的机构使用深度学习模型进行风险防控。但随着电子支付的普及,支付业务的形态也越来也多,加上敏感性较强的交易数据不易实现共享,造成机构之间无法开展协作,导致没有能力为如此多的支付业务形态开发风控模型。
为此,本文件旨在保证私有数据隐私的前提下,提出一种可跨场景冷启动的联合建模的风控方案。
图1是本说明书实施例私有数据保护的模型学习方法的流程图。图1所示的方法可以由下文相对应的装置和系统执行,包括:
步骤S102,联盟中的非赋能成员对象基于属于私有数据的风险特征集合,对本地的风控模型进行训练,得到本地的风控模型的模型参数,其中,风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征。
本说明书实施例中,赋能成员对象具有收集非赋能成员对象的模型参数的职能。这里,联盟中的成员对象并不一定都具有模型训练能力。本步骤中,只需要具有模型训练能力的非赋能成员对象将本地训练获得模型参数发送至赋能成员对象。
此外还应理解的是,本说明书实施例的风控模型是基于交易样本数据中的交易逻辑拓扑的图特征训练得到的。交易逻辑拓扑可以放映出支付方、被支付方、支付设备、支付使用方式等之间的逻辑关系,是交易样本数据中能够直接体现的信息。在交易逻辑拓扑图像中,支付方、被支付方、支付设备、支付商品等作为交易逻辑拓扑中的节点,图特征包括交易逻辑拓扑图像中的节点个体的特征、节点之间的关联特征等,例如:度中心性、相对中介度以及相对紧密度等。显然,对于任何交易业务形态来讲,都离不开支付方、被支付方、支付设备、支付商品等这些信息及其之间的交易逻辑关系,因此可以套用本说明书实施例的这种方式获取各种交易业务形态的图特征,使得风控模型的训练具有极高的泛用性。
步骤S104,联盟中的非赋能成员对象将本地的风控模型的模型参数发送至联盟中的赋能成员对象。
应理解的是,本步骤中非赋能成员对象所发送的模型参数属于知识数据,而训练风控模型所使用的敏感数据不出域,因此不存在隐私泄露的风险。当然,为了实现更高的隐私保护,非赋能成员对象也可以基于安全多方计算协议,将本地的风控模型的模型参数加密发送至联盟中的赋能成员对象,从而保证模型参数只在联盟内部实现共享。
步骤S106,赋能成员对象基于联盟中的至少两个成员对象的风控模型的模型参数,确定目标模型参数。
具体地,本说明书实施例不限定赋能成员对象是否成参与联合建模。若赋能成员也参与联合建模,则本步骤中,骤赋能成员对象基于赋能成员对象自身训练得到的风控模型的模型参数以及联盟中的至少一个非赋能成员对象的风控模型的模型参数,确定目标模型参数;若赋能成员不参与联合建模,则赋能成员对象只基于联盟中的非赋能成员对象的风控模型的模型参数,确定目标模型参数。
这里,本说明书实施例不对目标模型参数的确定方式作具体限定。作为示例性介绍,赋能成员对象可以将联盟中的至少两个成员对象的风控模型的模型参数按照对应的加权因子进行进行加权计算,得到目标模型参数。
在实际应用中,业务规模越大的成员对象,其所收集到的训练样本就越全面;而模型训练能力越强的成员对象,其针对联盟的贡献度也就越高,因此可以提高这类成员对象对目标模型参数的影响程度。即,本说明书实施例中,联盟中任意目标成员对象的风控模型的模型参数所对应的加权因子可以是基于目标成员对象的交易额和/或目标成员对象针对联盟的贡献度所确定得到。
步骤S108,赋能成员对象将目标模型参数发送至联盟中的非赋能成员对象。
步骤S110,接收到目标模型参数的非赋能成员对象,基于目标模型参数,对本地的风控模型进行调整。
这里,本说明书实施例不对风控模型的调整方式作具体限定。作为示例性介绍,非集中计算平台成员对象可以直接将本地的学习模型的模型参数调整为目标模型参数,或者调整至将本地的学习模型的模型参数调整为与目标模型参数的中值。
此外,风控模型的调整也可以是迭代进行的。
即,非赋能成员对象在对本地的风控模型调整完成后,若本地的风控模型未满足预设收敛条件,则将调整完成后的本地的风控模型的模型参数发送至赋能成员对象,以获得述赋能成员对象更新后的目标模型参数,并基于更新后的目标模型参数对本地的风控模型进行再次调整,直至本地的风控模型调满足预设收敛条件。
或者,非赋能成员对象在对本地的风控模型调整完成后,若本地的风控模型未满足预设收敛条件,还可以基于属于私有数据的风险特征集合,对本地的风控模型继续进行训练,得到新的模型参数。在训练到达一定轮次后,非赋能成员对象将本地的风控模型最细内的模型参数发送至赋能成员对象,以得到赋能成员对象反馈的更新后的目标模型参数。之后,非赋能成员对象基于更新后的目标模型参数对本地的风控模型进行再次调整,直至本地的风控模型调满足预设收敛条件。
基于图1所示的模型学习方法可以知道,本说明书实施例的方案中,联盟中的各成员对象可以共同搭建风控模型,并分别根据自身的私有数据对风控模型进行训练,从而将训练后获得的模型参数提供给其中的赋能成员对象。赋能成员对象对各成员对象训练得到的模型参数进行汇总,以确定出目标模型参数,并将目标模型参数反馈给其他成员对象,使得联盟中的任何成员对象都有能力将自身的风控模型调整至较佳的性能水平。整个方案中,各成员对象只交互了训练后获得的知识数据,而敏感性较强的训练数据不出域,保障了隐私性。此外,各成员对象基于交易逻辑拓扑的图特征训练风控模型,而图特征的获取方式适用于不同的支付业务形态,因此训练后的风控模型具有较强的泛用性,特别适合跨场景冷启动的应用场景。
下面结合不同的实现方式对联盟中各成员对象基于图特征训练风控模型的方法进行详细介绍。
实现方式一
在本实现方式一中,风控模型用于识别支付方存在的风险,即交易样本数据中的支付方作为样本对象。支付方被标注划分为“有风险”和“无风险”两种标签结果。
对应地,联盟中的非赋能成员基于交易样本数据,构建交易样本数据中针对支付方的交易逻辑拓扑图。为方便理解,以拓扑结构简单的二部图为例。交易逻辑拓扑图可以但不限是:支付方与被支付方的二部图、支付方与支付商品的二部图、支付方与支付设备的二部图、支付方与支付方式的二部图。
联盟中的非赋能成员对象可以将交易逻辑拓扑图中支付方节点与对应的邻居节点的图特征输入至因式分解机(FM,Factorization Machine)模型,利用FM模型的功能对输入的图特征(例如:度中心性、相对中介度以及相对紧密度)进行抽象、组合,以获得针对支付方节点表征的图特征。也就是说,本实现方式一基于因式分解机算法,将交易逻辑拓扑图中支付方以及支付方相关联所有图特征进行重新组合,定义出支付方更高阶的的图特征。
之后,非赋能成员对象将FM模型针对支付方节点表征的图特征添加至本地的风控模型的风险特征集合中,后续利用本地的的风险特征集合中的图特征对图像类的风控模型进行训练。
具体地,图特征作为风控模型的输入数据,图特征所对应的支付方节点的标签(即“有风险”或“无风险”)作为风控模型的输出数据。在具体训练过程中,图特征输入至风控模型后,可以得到风控模型所输出的训练结果。这个训练结果是风控模型根据图特征所预测“有风险”还是“无风险”的结果,与标签指示的真值结果可能存在误差。通过最大似然估计所推导出的损失函数,计算出训练结果与真值结果的误差值,并以降低误差为目的,优化调整风控模型中特征向量所对应的权重值,以实现训练意义。
基于上述描述可以知道,本实现方式一利用FM模型的特征组合优势,直接对支付方的图结构进行学习并集成,从而泛化、高效获得风控模型所需要的训练数据。对于冷启动的支付业务场景,可以直接套用训练出有效的风控模型。
实现方式二
在实现方式二中,风控模型具体识别支付方存在的风险,即交易样本数据中的支付方作为样本对象。支付方被标注划分为“有风险”和“无风险”两种标签结果。
对应地,联盟中的非赋能成员基于交易样本数据,构建交易样本数据中针对支付方的交易逻辑拓扑图。为方便理解,以拓扑结构相对简单的二部图为例。交易逻辑拓扑图可以但不限是:支付方与被支付方的二部图、支付方与支付商品的二部图、支付方与支付设备的二部图、支付方与支付方式的二部图。
之后,非赋能成员对象利用社区发现算法,确定二部图中支付方的社区。
下面以支付方与被支付方的二部图为例对社区发现算法进行消息介绍。
二部图G=(V,E)是一个无向图,顶点V可分割为两个互不相交的子集(A,B)。子集A由支付方组成,子集B由被支付方组成,并且图中的每条边(i,j)所关联的两个顶点i和j分别属于这两个不同的顶点集(i in A,j in B)。
在社区发现过程中,首先对二部图的边进行筛选,降低后续对二部图划分社区的计算复杂度。具体地,可以基于已有的k-core算法,或者muliti-kcore算法,对二部图进行切边过滤。
以基于k-core算法进行切边过滤为例,本步骤可以计算二部图中每个顶点的core值。对于core值小于k的顶点,则将其以及关联的边从二部图中删除。之后,更新二部图中剩余顶点的core值,并继续删除二部图中core值小于k的顶点以及关联的边。在迭代一定次数之后,达到过滤的目的。
在对二部图的边筛选完成后,对二部图中支付方和被支付方划分社区。
具体地,划分社区过程中需要迭代执行以下步骤:
a)构建与二部图的节点一一对应的社区;其中,二部图的支付方和被支付方作为二部图的初始节点。
b)基于节点针对各个社区的模块度增量,确定节点对应的目标社区,并将节点归入至对应的目标社区内,直到所有节点的所属社区不再变化。
需要说明的是,模块度增量是根据节点的边权重和环权重所确定得到,由于属于现有技术,本文不再举例赘述。
c)将归入至同一社区的所有节点合并为一个新节点,使得合并前社区内节点之间的边权重转化为合并后新节点的环权重,合并前社区间的边权重转化为合并后新节点间的边权重;其中,合并而成的新节点作为二部图更新后的节点;若本轮迭代构建的社区与上轮迭代构建的社区之间的差异社区数量小于或等于预设阈值,则迭代结束;或者,若本轮迭代达到预设迭代次数,则迭代结束。
其中,本步骤可以将迭代过程中构建得到的二部图的社区以及社区包含的支付方和被支付方,或者将最后一轮迭代过程中构建得到的所述二部图的社区以及社区包含的支付方和被支付方,作为二部图的社区发现结果。
在划分社区完成后,非赋能成员对象将支付方所属社区在二部图中的图特征(例如:支付方所属社区在二部图中的“有风险”标签的浓度、度中心性、相对中介度以及相对紧密度等)作为风控模型的输入,将支付方的标签作为风控模型的输出,以对风控模型进行有监督训练。
同样地,实现方式二的方案利用社区发现算法,可以泛化性地获取交易逻辑拓扑图中支付方相关的图特征。对于冷启动的支付业务场景,可以直接套用训练出有效的风控模型。
在非赋能成员对象对本地的风控模型完成训练后,即可按照安全对象计算协议,将本地的风控模型的模型参数发送至赋能成员对象。
对应地,赋能成员对象可以对已获得的各成员对象的模型参数进行汇总,以加权计算出目标模型参数。在加权计算过程中,赋能成员对象可以先对各成员对象的模型参数进行归类,在加权的时候,再为每一类别的模型参数进行单独表征,从而避免数量较多的一类模型参数淹没掉数量较少的一类模型参数。
之后,赋能成员对象将目标模型参数反馈给非赋能成员对象。这样一来,联盟中包含赋能成员对象在内的所有成员对象都可以得到目标模型参数,并直接使用目标模型参数对本地的风控模型进行优化调整。
综上所述,在本说明书实施例的模型学习方法下,联盟中的各成员对象不需要共享自己私有的交易样本数据,从而对私有数据提供了的隐私保护。同时,对于一些没有模型训练能力或模型训练能力较差的成员对象,也能够在联盟中其他成员对象的协助下,将自己的风控模型优化到较佳的性能水平上。
以上是对本说明书实施例的方法的介绍。应理解,在不脱离本文上述原理基础之上,还可以进行适当的变化,这些变化也应视为本说明书实施例的保护范围。
与上述模型学习方法相对应地,本说明书实施例还提供一种联盟中的非赋能成员对象装置。图2为赋能成员对象装置的结构示意图,包括:
训练模块210,基于属于私有数据的风险特征集合,对本地的风控模型进行训练,得到本地的风控模型的模型参数,其中,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
发送模块220,将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象;
接收模块230,接收所述赋能成员对象反馈的目标模型参数,其中,所述目标模型参数是赋能成员对象基于所述联盟中的至少两个成员对象的风控模型的模型参数确定得到的;
调整模块240,基于所述目标模型参数,对本地的风控模型进行调整。
本说明书实施例的非赋能成员对象装置可以与联盟中的其他成员对象可以共同搭建风控模型,并分别根据自身的私有数据对风控模型进行训练,从而将训练后获得的模型参数提供给其中的赋能成员对象。赋能成员对象对各成员对象训练得到的模型参数进行汇总,以确定出目标模型参数,并将目标模型参数反馈给其他成员对象,使得联盟中的任何成员对象都有能力将自身的风控模型调整至较佳的性能水平。整个方案中,各成员对象只交互了训练后获得的知识数据,而敏感性较强的训练数据不出域,保障了隐私性。此外,各成员对象基于交易逻辑拓扑的图特征训练风控模型,而图特征的获取方式适用于不同的支付业务形态,因此训练后的风控模型具有较强的泛用性,特别适合跨场景冷启动的应用场景。
应理解,本说明书实施例的非赋能成员对象装置可以实现图1所示的模型学习方法中关于非赋能成员对象所执行的步骤,由于原理相同,本文不再举例赘述。
与上述模型学习方法相对应地,本说明书实施例还提供一种联盟中的赋能成员对象装置。图3为赋能成员对象装置的结构示意图,包括:
接收模块310,接收所述联盟中的非赋能成员对象发送的风控模型的模型参数,其中,所述非赋能成员对象发送的风控模型的模型参数是基于属于所述非赋能成员对象的私有数据的风险特征集合训练得到的,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
确定模块320,基于所述联盟中的至少两个成员对象的风控模型的模型参数,确定得到目标模型参数;
发送模块330,将所述目标模型参数发送至所述联盟中的非赋能成员对象,从而使得接收到所述目标模型参数的非赋能成员对象基于所述目标模型参数对本地的风控模型进行调整。
本说明书实施例的赋能成员对象装置可以收集联盟中的非赋能成员对象本地训练后获得的风控模型的模型参数,从而汇总确定出目标模型参数,并将目标模型参数反馈给非赋能成员对象,使得联盟中的任何非赋能成员对象都有能力将自身的风控模型调整至较佳的性能水平。整个方案中,非赋能成员对象只交互了训练后获得的知识数据,而敏感性较强的训练数据不出域,保障了隐私性。此外,非赋能成员对象基于交易逻辑拓扑的图特征训练风控模型,而图特征的获取方式适用于不同的支付业务形态,因此训练后的风控模型具有较强的泛用性,特别适合跨场景冷启动的应用场景。
应理解,本说明书实施例的赋能成员对象装置可以实现图1所示的模型学习方法中关于赋能成员对象所执行的步骤,由于原理相同,本文不再举例赘述。
与上述模型学习方法相对应地,本说明书实施例还提供一种联盟系统。图4是联盟系统的结构示意图,包括:赋能成员对象410和多个非赋能成员对象420。其中:
非赋能成员对象420基于属于私有数据的风险特征集合,对本地的风控模型进行训练,得到本地的风控模型的模型参数,并将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象410;以及,基于所述赋能成员对象410发送的目标模型参数,对本地的风控模型进行调整;其中,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
所述赋能成员对象接收非赋能成员对象420发送的风控模型的模型参数,并所述联盟系统中的至少两个成员对象的风控模型的模型参数,确定得到目标模型参数,并将所述目标模型参数发送至所述联盟系统中的非赋能成员对象420。
基于图4所示的联盟系统可以知道:本说明书实施例的方案中,联盟中的各成员对象可以共同搭建风控模型,并分别根据自身的私有数据对风控模型进行训练,从而将训练后获得的模型参数提供给其中的赋能成员对象。赋能成员对象对各成员对象训练得到的模型参数进行汇总,以确定出目标模型参数,并将目标模型参数反馈给其他成员对象,使得联盟中的任何成员对象都有能力将自身的风控模型调整至较佳的性能水平。整个方案中,各成员对象只交互了训练后获得的知识数据,而敏感性较强的训练数据不出域,保障了隐私性。此外,各成员对象基于交易逻辑拓扑的图特征训练风控模型,而图特征的获取方式适用于不同的支付业务形态,因此训练后的风控模型具有较强的泛用性,特别适合跨场景冷启动的应用场景。
可选地,非赋能成员对象410在对本地的风控模型进行训练前,还基于交易样本数据,构建所述交易样本数据中针对支付方的交易逻辑拓扑图;之后,将所述交易逻辑拓扑图中支付方节点与对应的邻居节点的图特征输入至因式分解机模型,得到由因式分解机模型针对支付方节点表征的图特征;并将所述因式分解机模型针对支付方节点表征的图特征添加至本地的风控模型的风险特征集合中。
其中,所述交易逻辑拓扑图包括以下至少一者:
支付方与被支付方的二部图、支付方与支付商品的二部图、支付方与支付设备的二部图和支付方与支付方式的二部图。
其中,所述交易逻辑拓扑图中支付方节点与对应的邻居节点的图特征包括以下至少一者:
度中心性、相对中介度以及相对紧密度。
可选地,赋能成员对象410基于所述联盟中的至少两个成员对象的风控模型的模型参数,确定目标模型参数,包括:基于所述赋能成员对象410的风控模型的模型参数以及所述联盟中的至少一个非赋能成员对象420的风控模型的模型参数,确定目标模型参数;或者,基于所述联盟中的至少两个非赋能成员对象420的风控模型的模型参数,确定目标模型参数。
可选地,非赋能成员对象420具体基于安全多方计算协议,将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象410。
可选地,赋能成员对象具体将所述联盟中的至少两个成员对象的风控模型的模型参数按照对应的加权因子进行进行加权计算,以得到目标模型参数;其中,目标成员对象的风控模型的模型参数所对应的加权因子是基于所述目标成员对象的交易额和/或所述目标成员对象针对所述联盟的贡献度确定得到的。
可选地,风控模型的模型参数包括风控模型中的至少一个特征向量的权重值。
可选地,非赋能成员对象420在对本地的风控模型调整完成后,若本地的风控模型未满足预设收敛条件,则将调整完成后的本地的风控模型的模型参数发送至所述赋能成员对象410,以获得所述赋能成员对象410更新后的目标模型参数,并基于更新后的目标模型参数对本地的风控模型进行调整。
显然,本说明书实施例的联盟系统可以作为上述图1所示的模型学习方法的执行主体,因此实现模型学习方法在图1所实现的功能。由于原理相同,本文不再赘述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。此外,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。

Claims (14)

1.一种私有数据保护的模型学习方法,包括:
联盟中的非赋能成员对象基于属于私有数据的风险特征集合,对本地的风控模型进行训练,得到本地的风控模型的模型参数,其中,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
所述联盟中的非赋能成员对象将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象;
所述赋能成员对象基于所述联盟中的至少两个成员对象的风控模型的模型参数,确定目标模型参数;
所述赋能成员对象将所述目标模型参数发送至所述联盟中的非赋能成员对象;
接收到所述目标模型参数的非赋能成员对象,基于所述目标模型参数,对本地的风控模型进行调整。
2.根据权利要求1所述的训练方法,
联盟中的非赋能成员对象在对本地的风控模型进行训练前,还包括:
联盟中的非赋能成员基于交易样本数据,构建所述交易样本数据中针对支付方的交易逻辑拓扑图;
联盟中的非赋能成员对象将所述交易逻辑拓扑图中支付方节点与对应的邻居节点的图特征输入至因式分解机模型,得到由因式分解机模型针对支付方节点表征的图特征;
联盟中的非赋能成员对象将所述因式分解机模型针对支付方节点表征的图特征添加至本地的风控模型的风险特征集合中。
3.根据权利要求2所述的训练方法,
所述交易逻辑拓扑图包括以下至少一者:
支付方与被支付方的二部图、支付方与支付商品的二部图、支付方与支付设备的二部图和支付方与支付方式的二部图。
4.根据权利要求2所述的训练方法,
所述交易逻辑拓扑图中支付方节点与对应的邻居节点的图特征包括以下至少一者:
度中心性、相对中介度以及相对紧密度。
5.根据权利要求1所述的方法,
所述赋能成员对象基于所述联盟中的至少两个成员对象的风控模型的模型参数,确定目标模型参数,包括:
所述赋能成员对象基于所述赋能成员对象的风控模型的模型参数以及所述联盟中的至少一个非赋能成员对象的风控模型的模型参数,确定目标模型参数;
或者,
所述赋能成员对象基于所述联盟中的至少两个非赋能成员对象的风控模型的模型参数,确定目标模型参数。
6.根据权利要求1所述的方法,
联盟中的非赋能成员对象将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象,包括:
联盟中的非赋能成员对象基于安全多方计算协议,将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象。
7.根据权利要求1所述的方法,
所述赋能成员对象基于所述联盟中的至少两个能成员对象的风控模型的模型参数,确定目标模型参数,包括:
所述赋能成员对象将所述联盟中的至少两个成员对象的风控模型的模型参数按照对应的加权因子进行进行加权计算,得到目标模型参数;其中,目标成员对象的风控模型的模型参数所对应的加权因子是基于所述目标成员对象的交易额和/或所述目标成员对象针对所述联盟的贡献度确定得到的。
8.根据权利要求1-5中任一项所述的方法,
风控模型的模型参数包括风控模型中的至少一个特征向量的权重值。
9.根据权利要求1-5中任一项所述的方法,还包括:
所述联盟中的非赋能成员对象在对本地的风控模型调整完成后,若本地的风控模型未满足预设收敛条件,则将调整完成后的本地的风控模型的模型参数发送至所述赋能成员对象,以获得所述赋能成员对象更新后的目标模型参数,并基于更新后的目标模型参数对本地的风控模型进行调整。
10.一种私有数据保护的模型学习方法,包括:
联盟中的非赋能成员对象基于属于私有数据的风险特征集合,对本地的风控模型进行训练,得到本地的风控模型的模型参数,其中,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
所述非赋能成员对象将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象;
所述联盟中的非赋能成员对象接收所述赋能成员对象反馈的目标模型参数,其中,所述目标模型参数是赋能成员对象基于所述联盟中的至少两个成员对象的风控模型的模型参数确定得到的;
所述非赋能成员对象,基于所述目标模型参数,对本地的风控模型进行调整。
11.一种基于私有数据保护的模型学习方法,包括:
联盟中的赋能成员对象接收所述联盟中的非赋能成员对象发送的风控模型的模型参数,其中,所述非赋能成员对象发送的风控模型的模型参数是基于属于所述非赋能成员对象的私有数据的风险特征集合训练得到的,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
所述赋能成员对象基于所述联盟中的至少两个成员对象的风控模型的模型参数,确定得到目标模型参数;
所述赋能成员对象将所述目标模型参数发送至所述联盟中的非赋能成员对象,从而使得接收到所述目标模型参数的非赋能成员对象基于所述目标模型参数对本地的风控模型进行调整。
12.一种联盟中的非赋能成员对象装置,包括:
训练模块,基于属于私有数据的风险特征集合,对本地的风控模型进行训练,得到本地的风控模型的模型参数,其中,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
发送模块,将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象;
接收模块,接收所述赋能成员对象反馈的目标模型参数,其中,所述目标模型参数是赋能成员对象基于所述联盟中的至少两个成员对象的风控模型的模型参数确定得到的;
调整模块,基于所述目标模型参数,对本地的风控模型进行调整。
13.一种联盟中的赋能成员对象装置,包括:
接收模块,接收所述联盟中的非赋能成员对象发送的风控模型的模型参数,其中,所述非赋能成员对象发送的风控模型的模型参数是基于属于所述非赋能成员对象的私有数据的风险特征集合训练得到的,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
确定模块,基于所述联盟中的至少两个成员对象的风控模型的模型参数,确定得到目标模型参数;
发送模块,将所述目标模型参数发送至所述联盟中的非赋能成员对象,从而使得接收到所述目标模型参数的非赋能成员对象基于所述目标模型参数对本地的风控模型进行调整。
14.一种联盟系统,包括:赋能成员对象和多个非赋能成员对象;其中,
非赋能成员对象基于属于私有数据的风险特征集合,对本地的风控模型进行训练,得到本地的风控模型的模型参数,并将本地的风控模型的模型参数发送至所述联盟中的赋能成员对象;以及,基于所述赋能成员对象发送的目标模型参数,对本地的风控模型进行调整;其中,所述风险特征集合包含有交易样本数据中的交易逻辑拓扑的图特征;
所述赋能成员对象接收非赋能成员对象发送的风控模型的模型参数,并所述联盟系统中的至少两个成员对象的风控模型的模型参数,确定得到目标模型参数,并将所述目标模型参数发送至所述联盟系统中的非赋能成员对象。
CN202010198214.XA 2020-03-19 2020-03-19 一种私有数据保护的模型学习方法、装置及系统 Pending CN111401913A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010198214.XA CN111401913A (zh) 2020-03-19 2020-03-19 一种私有数据保护的模型学习方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010198214.XA CN111401913A (zh) 2020-03-19 2020-03-19 一种私有数据保护的模型学习方法、装置及系统

Publications (1)

Publication Number Publication Date
CN111401913A true CN111401913A (zh) 2020-07-10

Family

ID=71413496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010198214.XA Pending CN111401913A (zh) 2020-03-19 2020-03-19 一种私有数据保护的模型学习方法、装置及系统

Country Status (1)

Country Link
CN (1) CN111401913A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112380495A (zh) * 2020-12-04 2021-02-19 贵州师范学院 安全多方乘法运算方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108351881A (zh) * 2015-10-16 2018-07-31 谷歌有限责任公司 分布式最优化的系统和方法
CN110020866A (zh) * 2019-01-22 2019-07-16 阿里巴巴集团控股有限公司 一种识别模型的训练方法、装置及电子设备
US20190227980A1 (en) * 2018-01-22 2019-07-25 Google Llc Training User-Level Differentially Private Machine-Learned Models
US20190385043A1 (en) * 2018-06-19 2019-12-19 Adobe Inc. Asynchronously training machine learning models across client devices for adaptive intelligence
CN110610242A (zh) * 2019-09-02 2019-12-24 深圳前海微众银行股份有限公司 一种联邦学习中参与者权重的设置方法及装置
CN110795768A (zh) * 2020-01-06 2020-02-14 支付宝(杭州)信息技术有限公司 基于私有数据保护的模型学习方法、装置及系统
CN110795631A (zh) * 2019-10-29 2020-02-14 支付宝(杭州)信息技术有限公司 一种基于因子分解机的推送模型优化、预测方法和装置
CN110874650A (zh) * 2020-01-16 2020-03-10 支付宝(杭州)信息技术有限公司 融合公域数据和私有数据的联盟学习方法、装置和系统
CN110874647A (zh) * 2020-01-16 2020-03-10 支付宝(杭州)信息技术有限公司 联盟学习中的私有数据评估、联盟学习方法、装置及系统
CN110874649A (zh) * 2020-01-16 2020-03-10 支付宝(杭州)信息技术有限公司 基于状态机的联邦学习方法、系统、客户端及电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108351881A (zh) * 2015-10-16 2018-07-31 谷歌有限责任公司 分布式最优化的系统和方法
US20190227980A1 (en) * 2018-01-22 2019-07-25 Google Llc Training User-Level Differentially Private Machine-Learned Models
US20190385043A1 (en) * 2018-06-19 2019-12-19 Adobe Inc. Asynchronously training machine learning models across client devices for adaptive intelligence
CN110020866A (zh) * 2019-01-22 2019-07-16 阿里巴巴集团控股有限公司 一种识别模型的训练方法、装置及电子设备
CN110610242A (zh) * 2019-09-02 2019-12-24 深圳前海微众银行股份有限公司 一种联邦学习中参与者权重的设置方法及装置
CN110795631A (zh) * 2019-10-29 2020-02-14 支付宝(杭州)信息技术有限公司 一种基于因子分解机的推送模型优化、预测方法和装置
CN110795768A (zh) * 2020-01-06 2020-02-14 支付宝(杭州)信息技术有限公司 基于私有数据保护的模型学习方法、装置及系统
CN110874650A (zh) * 2020-01-16 2020-03-10 支付宝(杭州)信息技术有限公司 融合公域数据和私有数据的联盟学习方法、装置和系统
CN110874647A (zh) * 2020-01-16 2020-03-10 支付宝(杭州)信息技术有限公司 联盟学习中的私有数据评估、联盟学习方法、装置及系统
CN110874649A (zh) * 2020-01-16 2020-03-10 支付宝(杭州)信息技术有限公司 基于状态机的联邦学习方法、系统、客户端及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112380495A (zh) * 2020-12-04 2021-02-19 贵州师范学院 安全多方乘法运算方法及系统
CN112380495B (zh) * 2020-12-04 2023-06-16 贵州师范学院 安全多方乘法运算方法及系统

Similar Documents

Publication Publication Date Title
Huang et al. Stochastic consensus over noisy networks with Markovian and arbitrary switches
Forero et al. Consensus-based distributed linear support vector machines
CN110795768B (zh) 基于私有数据保护的模型学习方法、装置及系统
CN115455471A (zh) 提升隐私和鲁棒的联邦推荐方法、装置、设备及存储介质
CN111224905B (zh) 一种大规模物联网中基于卷积残差网络的多用户检测方法
Shlezinger et al. Collaborative inference via ensembles on the edge
Wang et al. Reputation-enabled federated learning model aggregation in mobile platforms
Shi et al. Signal recognition based on federated learning
Wang et al. Unsupervised learning for asynchronous resource allocation in ad-hoc wireless networks
Chen et al. Multi-user edge-assisted video analytics task offloading game based on deep reinforcement learning
CN113783716A (zh) 基于云边协同框架的流量预测方法及装置
Zhang et al. Optimization of image transmission in a cooperative semantic communication networks
Ni et al. MSCET: A multi-scenario offloading schedule for biomedical data processing and analysis in cloud-edge-terminal collaborative vehicular networks
CN111401913A (zh) 一种私有数据保护的模型学习方法、装置及系统
Wang et al. Byzantine-resilient resource allocation over decentralized networks
Xia et al. An event-triggered collaborative neurodynamic approach to distributed global optimization
Bazerque et al. Distributed lasso for in-network linear regression
Zheng et al. A distributed learning architecture for semantic communication in autonomous driving networks for task offloading
Li et al. Graph-based multi-view learning for cooperative spectrum sensing
Clarkson Applications of neural networks in telecommunications
Yuan et al. Retracted: Multi‐vehicle group‐aware data protection model based on differential privacy for autonomous sensor networks
CN116055495A (zh) 基于综合信任的边缘计算资源协同的方法
Wang et al. Deep learning method for generalized modulation classification under varying noise condition
Dandoush et al. Secure and Privacy-Preserving Federated Learning-Based Resource Allocation for Next Generation Networks
Yu et al. Resource optimization for UAV-assisted mobile edge computing system based on deep reinforcement learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40033184

Country of ref document: HK