CN117010018A - 本地模型的联邦预测方法、系统及相关设备 - Google Patents
本地模型的联邦预测方法、系统及相关设备 Download PDFInfo
- Publication number
- CN117010018A CN117010018A CN202310952598.3A CN202310952598A CN117010018A CN 117010018 A CN117010018 A CN 117010018A CN 202310952598 A CN202310952598 A CN 202310952598A CN 117010018 A CN117010018 A CN 117010018A
- Authority
- CN
- China
- Prior art keywords
- party
- splitting
- decision tree
- federal
- tree model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000003066 decision tree Methods 0.000 claims abstract description 116
- 238000004590 computer program Methods 0.000 claims description 13
- 238000004062 sedimentation Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 238000009333 weeding Methods 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/70—Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer
- G06F21/71—Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure computing or processing of information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computer Security & Cryptography (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种本地模型的联邦预测方法、系统及相关设备,方法包括:第一方将本地模型转换为联邦决策树模型,得到第一联邦决策树模型和第二联邦决策树模型;确定第一联邦决策树模型的k条路径的分裂点序号集合并遍历;当分裂点属于第二方时,第二方将特征序号对应的本地特征进行秘密分享,并与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果,将每一分裂结果进行逻辑与运算,得到运算结果,将其恢复为目标明文;第一方根据目标明文将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到预测结果。采用本申请实施例可以在保护模型隐私和基于该模型完成新样本预测。
Description
技术领域
本申请涉及隐私计算技术领域以及计算机技术领域,具体涉及一种本地模型的联邦预测方法、系统及相关设备。
背景技术
近年来,越来越多的银行等金融机构采用联邦学习(federated learning,FL)、多方安全计算(securemulti-party computation,MPC)等隐私计算技术来进行外部数据的融合使用,但针对行内已有的联合外部数据基于机器学习训练好的本地模型或者通过专家制定的规则模型,目前没有很好的办法在保护模型隐私同时又要保护外部数据安全的条件下,基于该模型完成新样本的预测,因此,如何在保护模型隐私同时,又能够在保证外部数据安全的条件下,基于该模型完成新样本的预测。
发明内容
本申请实施例提供了一种本地模型的联邦预测方法、系统及相关设备,可以在保护模型隐私同时,又能够在保证外部数据安全的条件下,基于该模型完成新样本的预测。
第一方面,本申请实施例提供一种本地模型的联邦预测方法,应用于两方计算系统,所述两方计算系统包括两个参与方,所述两个参与方包括第一方和第二方;所述方法包括:
通过所述第一方根据本地模型中的分裂点特征所属参与方,将所述本地模型转换为联邦决策树模型,得到所述第一方对应的第一联邦决策树模型和所述第二方对应的第二联邦决策树模型;
通过所述第一方确定所述第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,k为叶子节点的数量,遍历所述k条路径下的每个分裂点序号集合;
当分裂点属于所述第二方时,通过所述第二方将特征序号对应的本地特征进行秘密分享,并与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果;
通过所述第二方将所述密文分裂结果中的每一分裂结果进行逻辑与运算,得到运算结果,将所述运算结果恢复为目标明文,将所述目标明文发送给所述第一方;
通过所述第一方根据所述目标明文将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果。
第二方面,本申请实施例提供了一种两方计算系统,所述两方计算系统包括两个参与方,所述两个参与方包括第一方和第二方;其中,
所述第一方,用于根据本地模型中的分裂点特征所属参与方,将所述本地模型转换为联邦决策树模型,得到所述第一方对应的第一联邦决策树模型和所述第二方对应的第二联邦决策树模型;通过所述第一方确定所述第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,k为叶子节点的数量,遍历所述k条路径下的每个分裂点序号集合;
所述第二方,用于当分裂点属于所述第二方时,将特征序号对应的本地特征进行秘密分享,并与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果;
所述第二方,用于将所述密文分裂结果中的每一分裂结果进行逻辑与运算,得到运算结果,将所述运算结果恢复为目标明文,将所述目标明文发送给所述第一方;
所述第一方,用于根据所述目标明文将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,具备如下有益效果:
可以看出,本申请实施例中所描述的本地模型的联邦预测方法、系统及相关设备,应用于两方计算系统,两方计算系统包括两个参与方,两个参与方包括第一方和第二方;通过第一方根据本地模型中的分裂点特征所属参与方,将本地模型转换为联邦决策树模型,得到第一方对应的第一联邦决策树模型和第二方对应的第二联邦决策树模型,确定第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,k为叶子节点的数量,遍历k条路径下的每个分裂点序号集合,当分裂点属于第二方时,通过第二方将特征序号对应的本地特征进行秘密分享,并与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果,通过第二方将密文分裂结果中的每一分裂结果进行逻辑与运算,得到运算结果,将运算结果恢复为目标明文,将目标明文发送给第一方,通过第一方根据目标明文将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果,如此,可以帮助机构继续结合外部数据利用历史沉淀本地模型的同时,保护本地模型不泄露。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种用于实现本地模型的联邦预测方法的两方计算系统的架构示意图;
图2是本申请实施例提供的一种本地模型的联邦预测方法的流程示意图;
图3是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例所描述计算节点可以为电子设备,电子设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、行车记录仪、服务器、笔记本电脑、移动互联网设备(MID,Mobile Internet Devices)或穿戴式设备(如智能手表、蓝牙耳机)等,上述仅是举例,而非穷举,包含但不限于上述电子设备,该电子设备也可以为云服务器,或者,该电子设备也可以为计算机集群。本申请实施例中,第一方、第二方均可以为上述电子设备。
下面对本申请实施例进行详细介绍。
请参阅图1,图1是本申请实施例提供的一种用于实现本地模型的联邦预测方法的两方计算系统的架构示意图,如图所示,本两方计算系统包括两个参与方,所述两个参与方包括第一方和第二方;基于该两方计算系统可以实现如下功能,具体如下:
所述第一方,用于根据本地模型中的分裂点特征所属参与方,将所述本地模型转换为联邦决策树模型,得到所述第一方对应的第一联邦决策树模型和所述第二方对应的第二联邦决策树模型;通过所述第一方确定所述第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,k为叶子节点的数量,遍历所述k条路径下的每个分裂点序号集合;
所述第二方,用于当分裂点属于所述第二方时,将特征序号对应的本地特征进行秘密分享,并与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果;
所述第二方,用于将所述密文分裂结果中的每一分裂结果进行逻辑与运算,得到运算结果,将所述运算结果恢复为目标明文,将所述目标明文发送给所述第一方;
所述第一方,用于根据所述目标明文将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果。
可选的,所述第一联邦决策树模型的联邦模型结构为原始决策树模型;
所述第二联邦决策树模型的联邦模型结构为三元组结构,所述三元组结构包括:分裂点序号、分裂点特征序号和分裂阈值。
可选的,所述第一联邦决策树模型和所述第二方对应的第二联邦决策树模型均存放在所述第一方侧。
可选的,在所述确定所述第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合方面,所述第一方具体用于:
对所述第一联邦决策树模型进行分裂路径解析,得到所述第一联邦决策树模型中root节点到每个叶子节点的路径;
根据所述第一联邦决策树模型中root节点到每个叶子节点的路径确定每个路径上的分裂点序号集合,得到所述k条路径的分裂点序号集合。
可选的,所述第一方还具体用于:
当分裂点属于所述第一方的本方时,进行本地特征与分裂阈值的明文比较,得到明文分裂结果;
根据所述明文分裂结果将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果。
请参阅图2,图2是本申请实施例提供的一种本地模型的联邦预测方法的流程示意图,应用于图1所示的两方计算系统,所述两方计算系统包括两个参与方,所述两个参与方包括第一方和第二方;如图所示,该本地模型的联邦预测方法包括:
201、通过所述第一方根据本地模型中的分裂点特征所属参与方,将所述本地模型转换为联邦决策树模型,得到所述第一方对应的第一联邦决策树模型和所述第二方对应的第二联邦决策树模型。
本申请实施例中,两方计算系统可以包括两个参与方,两个参与方可以包括第一方和第二方。
本申请实施例中,预设决策树可以预先设置或者系统默认,预设决策树可以理解为以第一方结合第二方的数据训练的树模型。预设决策树可以包括以下至少一种:决策树、多颗决策树的集成(随机森林、一个优化的分布式梯度增强库(xgboost,XGB)等)等等,在此不做限定。本地模型为本地树模型。
举例说明下,第一方可以包括银行,第二方可以包括电商,以银行结合电商数据训练的树模型(决策树、多颗决策树的集成(随机森林、XGB等)),本申请实施例能够用于判断用户是否违约的场景。银行侧的特征可能包括职业、银行资产、历史违约情况等;电商侧的特征可能包括年龄、购买习惯、消费习惯、薅羊毛情况等。即分裂点特征可以包括以下至少一种:年龄、职业、银行资产、历史违约情况、购买习惯、消费习惯、薅羊毛情况等等,在此不做限定。
具体的,可以通过两个参与方中的每一参与方根据预设决策树中的分裂点特征所属参与方,得到第一方对应的第一联邦决策树模型和第二方对应的第二联邦决策树模型,即可以将本地树模型转换为第一方的第一联邦决策树模型,将本地树模型转换为第二方的第二联邦决策树模型,进而,可以帮助机构继续结合外部数据利用历史沉淀的本地模型。
可选的,所述第一联邦决策树模型的联邦模型结构为原始决策树模型;
所述第二联邦决策树模型的联邦模型结构为三元组结构,所述三元组结构包括:分裂点序号、分裂点特征序号和分裂阈值。
本申请实施例中,第一联邦决策树模型的联邦模型结构为原始决策树模型,即本地模型的原始模型结构。第二联邦决策树模型的联邦模型结构为三元组结构,三元组结构包括:分裂点序号、分裂点特征序号和分裂阈值,在第一方为银行,第二方为电商时,银行侧的联邦模型结构即为原始决策树模型;电商侧联邦模型结构为【分裂点序号,电商侧分裂点特征序号,分裂阈值】元组。
可选的,所述第一联邦决策树模型和所述第二方对应的第二联邦决策树模型均存放在所述第一方侧。
具体实现中,第一联邦决策树模型和第二方对应的第二联邦决策树模型均存放在第一方侧,即两个模型均存放在银行侧,如此,能够保证安全性,提升安全监管效率。
202、通过所述第一方确定所述第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,k为叶子节点的数量,遍历所述k条路径下的每个分裂点序号集合。
本申请实施例中,k为正整数。第一方可以确定第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,k为叶子节点的数量,遍历该k条路径下的每个分裂点序号集合。
可选的,上述步骤202,通过所述第一方确定所述第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,k为叶子节点的数量,遍历所述k条路径下的每个分裂点序号集合,可以包括如下步骤:
通过所述第一方对所述第一联邦决策树模型进行分裂路径解析,得到所述第一联邦决策树模型中root节点到每个叶子节点的路径;根据所述第一联邦决策树模型中root节点到每个叶子节点的路径确定每个路径上的分裂点序号集合,得到所述k条路径下的每个分裂点序号集合。
本申请实施例中,第一方可以对第一联邦决策树模型进行分裂路径解析,得到第一联邦决策树模型中根(root)节点到每个叶子节点的路径,再根据第一联邦决策树模型中root节点到每个叶子节点的路径确定每个路径上的分裂点序号集合,得到k条路径下的每个分裂点序号集合,以第一方为银行为例,则银行对自身模型进行分裂路径解析,得到决策树中root节点到每个叶子节点的路径,继而得到每个路径上的分裂点序号集合。
203、当分裂点属于所述第二方时,通过所述第二方将特征序号对应的本地特征进行秘密分享,并与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果。
其中,本地特征可以包括以下至少一种:年龄、购买习惯、消费习惯、薅羊毛情况等等,在此不做限定。
本申请实施例中,分裂点是一颗决策树上的多个节点(如root节点就是第一个分裂点),特征序号是每个分裂点上选择的第几个特征和它对应的阈值做比较,例如,第一个特征小于18,则可对应到具体的特征年龄小于18。
本申请实施例中,第一方可以将分裂点对应的分裂阈值进行秘密分享,即第一方本地拥有分裂点阈值的一部分,第二方拥有分裂点阈值的另一部分,两部分相加即为原分裂点阈值,第二方将特征序号对应的本地特征进行秘密分享,即第二方本地拥有特征的一部分,第一方拥有特征的另一部分,两部分相加即为原特征。双方将秘密分享的特征与秘密分享的分裂点阈值进行秘密分享比较运算得到密文分裂结果。
本申请实施例中,当分裂点(分裂点序号)属于第二方时,第二方可以将特征序号对应的本地特征进行秘密分享,并将该本地特征与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果。其中,秘密分享指参与者将自己的私有数据分成多个部分,并分别分享给其它参与者。只有当所有参与者共同完成计算任务时,才能将所有部分组合起来,得到最终的结果。这种方法能够确保每个参与者的私密数据在计算过程中不被泄露,从而保护了隐私和安全。因为需要计算分裂点阈值(第一方)和特征(第二方)的比较运算。为保护模型和数据安全,不能直接明文计算。
例如,一个简单的实现途径是第一方自身生成一个随机数,然后用私有数据减去这个随机数发送给第二方,两方分别得到私有数据的一部分。只有两者相加才可恢复为原始数据。
其中,第一方将分裂点对应的分裂阈值进行秘密分享,即第一方本地拥有分裂阈值的一部分,第二方拥有分裂阈值的另一部分,两部分相加即为原分裂阈值,每一方持有的都是密态的分裂点阈值。
204、通过所述第二方将所述密文分裂结果中的每一分裂结果进行逻辑与运算,得到运算结果,将所述运算结果恢复为目标明文,将所述目标明文发送给所述第一方。
具体实现中,密态的话,是不能知道哪些样本分配到哪个叶子节点上的,可以理解,密文运算结果分布在两方,每方拥有一部分,恢复为明文才能知道具体的分裂结果。
本申请实施例中,第二方将密文分裂结果中的每一分裂结果进行逻辑与运算,得到运算结果,将运算结果恢复为目标明文,将目标明文发送给第一方,从而,在外部原始数据特征不出私域的同时,保护模型不泄露。
205、通过所述第一方根据所述目标明文将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果。
具体实现中,每条分裂路径最终会产生True和False的结果,True表示样本落在该分裂路径对应的叶子节点上,False表示不属于该叶子节点,将为True的样本赋值为对该路径下的叶子节点权重。
本申请实施例中,第一方可以根据目标明文将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果,相较全密态方案在性能和通信量上有着很大优势。以第一方为银行为例,第一方将目标明文的结果为True的样本赋值为对该路径下的叶子节点权重,再将所有待评分样本分配至不同的叶子节点上,即可得到所有样本的预测结果,可以帮助机构继续结合外部数据利用历史沉淀本地模型的同时,保护本地模型不泄露。
本申请实施例中,通过将联邦学习(FL)技术和多方安全计算(MPC)技术相结合,可以帮助机构继续结合外部数据利用历史沉淀本地模型的同时,保护本地模型不泄露。且在性能和通信量上有着很大优势。
可选的,还可以包括如下步骤:
当分裂点属于所述第一方的本方时,进行本地特征与分裂阈值的明文比较,得到明文分裂结果;通过所述第一方根据所述明文分裂结果将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果。
本申请实施例中,当分裂点属于第一方的本方时,进行本地特征与分裂阈值的明文比较,得到明文分裂结果,第一方根据明文分裂结果将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果,可以帮助机构继续结合外部数据利用历史沉淀本地模型的同时,保护本地模型不泄露。
举例说明下,以第一方为银行,第二方为电商为例,具体实现中,以银行结合电商数据训练的树模型(决策树、多颗决策树的集成(随机森林、XGB等))判断用户是否违约的场景为例,银行侧的特征可能包括职业、银行资产、历史违约情况等;电商侧的特征可能包括购买习惯、消费习惯、薅羊毛情况等。基于该树模型基础上,可以包括如下步骤:
S1、根据决策树中的分裂点特征所属参与方(银行或者电商),将本地决策树模型转换为联邦决策树模型:银行侧的联邦模型结构即为原始决策树模型;电商侧联邦模型结构为【分裂点序号,电商侧分裂点特征序号,分裂阈值】元组,两个模型均存放在银行侧;
S2、银行对自身模型进行分裂路径解析,得到决策树中root节点到每个叶子节点的路径,继而得到每个路径上的分裂点序号集合;
S3、遍历每个分裂点序号集合,当分裂点属于本方时,进行本地特征与分裂阈值的明文比较,得到明文分裂结果;
S4、当分裂点属于电商侧模型时,银行将分裂点特征序号同步至电商侧,并将分裂点阈值进行秘密分享;
S5、电商侧将特征序号对应的本地特征进行秘密分享,然后与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果;
S6、对路径上的每个分裂结果进行逻辑与运算,并将结果恢复为明文给到银行侧;
S7、结果为True的样本赋值为对该路径下的叶子节点权重;
S8、将所有待评分样本分配至不同的叶子节点上,即可得到所有样本的预测结果。
可以看出,本申请实施例中所描述的本地模型的联邦预测方法,应用于两方计算系统,两方计算系统包括两个参与方,两个参与方包括第一方和第二方;通过第一方根据本地模型中的分裂点特征所属参与方,将本地模型转换为联邦决策树模型,得到第一方对应的第一联邦决策树模型和第二方对应的第二联邦决策树模型,确定第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,k为叶子节点的数量,遍历k条路径下的每个分裂点序号集合,当分裂点属于第二方时,通过第二方将特征序号对应的本地特征进行秘密分享,并与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果,通过第二方将密文分裂结果中的每一分裂结果进行逻辑与运算,得到运算结果,将运算结果恢复为目标明文,将目标明文发送给第一方,通过第一方根据目标明文将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果,如此,可以帮助机构继续结合外部数据利用历史沉淀本地模型的同时,保护本地模型不泄露。
与上述实施例一致地,请参阅图3,图3是本申请实施例提供的一种电子设备的结构示意图,如图所示,该电子设备包括处理器、存储器、通信接口以及一个或多个程序,应用于两方计算系统,所述两方计算系统包括两个参与方,所述两个参与方包括第一方和第二方;上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,本申请实施例中,上述程序包括用于执行以下步骤的指令:
通过所述第一方根据本地模型中的分裂点特征所属参与方,将所述本地模型转换为联邦决策树模型,得到所述第一方对应的第一联邦决策树模型和所述第二方对应的第二联邦决策树模型;
通过所述第一方确定所述第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,k为叶子节点的数量,遍历所述k条路径下的每个分裂点序号集合;
当分裂点属于所述第二方时,通过所述第二方将特征序号对应的本地特征进行秘密分享,并与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果;
通过所述第二方将所述密文分裂结果中的每一分裂结果进行逻辑与运算,得到运算结果,将所述运算结果恢复为目标明文,将所述目标明文发送给所述第一方;
通过所述第一方根据所述目标明文将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果。
可选的,所述第一联邦决策树模型的联邦模型结构为原始决策树模型;
所述第二联邦决策树模型的联邦模型结构为三元组结构,所述三元组结构包括:分裂点序号、分裂点特征序号和分裂阈值。
可选的,所述第一联邦决策树模型和所述第二方对应的第二联邦决策树模型均存放在所述第一方侧。
可选的,在所述通过所述第一方确定所述第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合方面,上述程序包括用于执行以下步骤的指令:
通过所述第一方对所述第一联邦决策树模型进行分裂路径解析,得到所述第一联邦决策树模型中root节点到每个叶子节点的路径;
根据所述第一联邦决策树模型中root节点到每个叶子节点的路径确定每个路径上的分裂点序号集合,得到所述k条路径的分裂点序号集合。
可选的,上述程序还包括用于执行以下步骤的指令:
当分裂点属于所述第一方的本方时,通过所述第一方进行本地特征与分裂阈值的明文比较,得到明文分裂结果;
根据所述明文分裂结果将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果。
可以看出,本申请实施例中所描述的本地模型的电子设备,应用于两方计算系统,两方计算系统包括两个参与方,两个参与方包括第一方和第二方;通过第一方根据本地模型中的分裂点特征所属参与方,将本地模型转换为联邦决策树模型,得到第一方对应的第一联邦决策树模型和第二方对应的第二联邦决策树模型,确定第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,k为叶子节点的数量,遍历k条路径下的每个分裂点序号集合,当分裂点属于第二方时,通过第二方将特征序号对应的本地特征进行秘密分享,并与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果,通过第二方将密文分裂结果中的每一分裂结果进行逻辑与运算,得到运算结果,将运算结果恢复为目标明文,将目标明文发送给第一方,通过第一方根据目标明文将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果,如此,可以帮助机构继续结合外部数据利用历史沉淀本地模型的同时,保护本地模型不泄露。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种本地模型的联邦预测方法,其特征在于,应用于两方计算系统,所述两方计算系统包括两个参与方,所述两个参与方包括第一方和第二方;所述方法包括:
通过所述第一方根据本地模型中的分裂点特征所属参与方,将所述本地模型转换为联邦决策树模型,得到所述第一方对应的第一联邦决策树模型和所述第二方对应的第二联邦决策树模型;
通过所述第一方确定所述第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,k为叶子节点的数量,遍历所述k条路径下的每个分裂点序号集合;
当分裂点属于所述第二方时,通过所述第二方将特征序号对应的本地特征进行秘密分享,并与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果;
通过所述第二方将所述密文分裂结果中的每一分裂结果进行逻辑与运算,得到运算结果,将所述运算结果恢复为目标明文,将所述目标明文发送给所述第一方;
通过所述第一方根据所述目标明文将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述第一联邦决策树模型的联邦模型结构为原始决策树模型;
所述第二联邦决策树模型的联邦模型结构为三元组结构,所述三元组结构包括:分裂点序号、分裂点特征序号和分裂阈值。
3.根据权利要求2所述的方法,其特征在于,所述第一联邦决策树模型和所述第二方对应的第二联邦决策树模型均存放在所述第一方侧。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述通过所述第一方确定所述第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,包括:
通过所述第一方对所述第一联邦决策树模型进行分裂路径解析,得到所述第一联邦决策树模型中root节点到每个叶子节点的路径;
根据所述第一联邦决策树模型中root节点到每个叶子节点的路径确定每个路径上的分裂点序号集合,得到所述k条路径的分裂点序号集合。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
当分裂点属于所述第一方的本方时,通过所述第一方进行本地特征与分裂阈值的明文比较,得到明文分裂结果;
根据所述明文分裂结果将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果。
6.一种两方计算系统,其特征在于,所述两方计算系统包括两个参与方,所述两个参与方包括第一方和第二方;其中,
所述第一方,用于根据本地模型中的分裂点特征所属参与方,将所述本地模型转换为联邦决策树模型,得到所述第一方对应的第一联邦决策树模型和所述第二方对应的第二联邦决策树模型;通过所述第一方确定所述第一联邦决策树模型的每条分裂路径的分裂点序号集合,得到k条路径的分裂点序号集合,k为叶子节点的数量,遍历所述k条路径下的每个分裂点序号集合;
所述第二方,用于当分裂点属于所述第二方时,将特征序号对应的本地特征进行秘密分享,并与密态分裂点阈值进行秘密分享比较运算,得到密文分裂结果;
所述第二方,用于将所述密文分裂结果中的每一分裂结果进行逻辑与运算,得到运算结果,将所述运算结果恢复为目标明文,将所述目标明文发送给所述第一方;
所述第一方,用于根据所述目标明文将结果为真的样本赋值为对该路径下的叶子节点权重,将所有待评分样本分配至不同的叶子节点上,得到所有样本的预测结果。
7.根据权利要求6所述的系统,其特征在于,所述第一联邦决策树模型的联邦模型结构为原始决策树模型;
所述第二联邦决策树模型的联邦模型结构为三元组结构,所述三元组结构包括:分裂点序号、分裂点特征序号和分裂阈值。
8.根据权利要求7所述的系统,其特征在于,所述第一联邦决策树模型和所述第二方对应的第二联邦决策树模型均存放在所述第一方侧。
9.一种电子设备,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-5任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310952598.3A CN117010018A (zh) | 2023-07-28 | 2023-07-28 | 本地模型的联邦预测方法、系统及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310952598.3A CN117010018A (zh) | 2023-07-28 | 2023-07-28 | 本地模型的联邦预测方法、系统及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117010018A true CN117010018A (zh) | 2023-11-07 |
Family
ID=88565024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310952598.3A Pending CN117010018A (zh) | 2023-07-28 | 2023-07-28 | 本地模型的联邦预测方法、系统及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117010018A (zh) |
-
2023
- 2023-07-28 CN CN202310952598.3A patent/CN117010018A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110399742B (zh) | 一种联邦迁移学习模型的训练、预测方法及装置 | |
Liu et al. | Cloud-enabled privacy-preserving collaborative learning for mobile sensing | |
CN113505882B (zh) | 基于联邦神经网络模型的数据处理方法、相关设备及介质 | |
CN111612167B (zh) | 机器学习模型的联合训练方法、装置、设备及存储介质 | |
CN111131412B (zh) | 实现5g移动端计算的方法、系统、移动端及云端服务器 | |
CN108985569A (zh) | 一种车辆风险评估方法、服务器 | |
Vladimirov et al. | Security and privacy protection obstacles with 3D reconstructed models of people in applications and the metaverse: A survey | |
US10706148B2 (en) | Spatial and temporal convolution networks for system calls based process monitoring | |
CN113792890A (zh) | 一种基于联邦学习的模型训练方法及相关设备 | |
CN113239401A (zh) | 一种基于电力物联网的大数据分析系统、方法及计算机存储介质 | |
CN116432040B (zh) | 基于联邦学习的模型训练方法、装置、介质以及电子设备 | |
CN113033717A (zh) | 一种模型生成方法、装置以及用于模型生成的装置 | |
CN117278210A (zh) | 基于可信执行环境的随机不经意传输扩展方法及相关装置 | |
CN106254226B (zh) | 一种信息同步方法及装置 | |
CN117390676A (zh) | 可信执行环境的离线隐私保护预测方法、系统及设备 | |
CN117151736A (zh) | 反电诈管理预警方法及系统 | |
CN113254989B (zh) | 目标数据的融合方法、装置和服务器 | |
CN117010018A (zh) | 本地模型的联邦预测方法、系统及相关设备 | |
CN109815715A (zh) | 一种数据加密方法和相关装置 | |
CN115423208A (zh) | 基于隐私计算的电子保函价值预测方法及装置 | |
CN110059097A (zh) | 数据处理方法和装置 | |
CN115564447A (zh) | 一种信用卡交易风险检测方法及装置 | |
CN114547684A (zh) | 一种保护隐私数据的多方联合训练树模型的方法及装置 | |
Pešterac et al. | Loss of privacy in electronic payment systems | |
Sandeepa et al. | Privacy of the Metaverse: Current Issues, AI Attacks, and Possible Solutions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |