CN111125727B - 混淆电路生成方法、预测结果确定方法、装置和电子设备 - Google Patents
混淆电路生成方法、预测结果确定方法、装置和电子设备 Download PDFInfo
- Publication number
- CN111125727B CN111125727B CN201911219782.7A CN201911219782A CN111125727B CN 111125727 B CN111125727 B CN 111125727B CN 201911219782 A CN201911219782 A CN 201911219782A CN 111125727 B CN111125727 B CN 111125727B
- Authority
- CN
- China
- Prior art keywords
- model
- party
- data
- leaf node
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
Abstract
本说明书提供混淆电路生成方法、预测结果确定方法、装置和电子设备的实施例。所述方法包括:执行混淆电路,得到森林模型中多个叶子节点的多个标签,所述标签用于标识叶子节点的匹配状态;对所述多个标签进行求和处理,得到求和结果;将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。本说明的实施例,通过多方安全计算,可以在模型方不泄漏森林模型、且数据方不泄漏业务数据的条件下,获得森林模型的预测结果,实现了隐私保护。
Description
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种混淆电路生成方法、预测结果确定方法、装置和电子设备。
背景技术
在业务实际中,通常一方拥有需要保密的模型(以下称为模型方),另一方拥有需要保密的业务数据(以下称为数据方)。如何在所述模型方不泄漏所述模型、且所述数据方不泄漏所述业务数据的条件下,使得模型方和/或模型方获得基于所述模型对所述业务数据进行预测后的预测结果,是当前亟需解决的技术问题。
发明内容
本说明书实施例提供一种混淆电路生成方法、预测结果确定方法、装置和电子设备,用于在模型方不泄漏模型、且数据方不泄漏业务数据的条件下,确定模型的预测结果,以实现隐私保护。
为实现上述目的,本说明书中一个或多个实施例提供的技术方案如下。
根据本说明书一个或多个实施例的第一方面,提供了一种混淆电路生成方法,应用于模型方,所述模型方持有森林模型,所述森林模型包括多个叶子节点,该方法包括:根据所述森林模型生成混淆电路,所述混淆电路的输出包括多个标签,每个标签用于标识一个叶子节点的匹配状态;向数据方发送所述混淆电路。
根据本说明书一个或多个实施例的第二方面,提供了一种预测结果确定方法,应用于数据方,所述数据方持有混淆电路,所述混淆电路是根据森林模型生成的,所述森林模型包括多个叶子节点,该方法包括:执行所述混淆电路得到多个标签,每个标签用于标识一个叶子节点的匹配状态;对所述多个标签进行求和处理,得到求和结果;将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
根据本说明书一个或多个实施例的第三方面,提供了一种预测结果确定方法,应用于数据方,所述数据方持有混淆电路,所述混淆电路是根据森林模型生成的,所述森林模型包括多个叶子节点,该方法包括:接收模型方发来的多个密文数据集合,每个密文数据对应一个叶子节点;执行所述混淆电路得到多个标签,每个标签用于标识一个叶子节点的匹配状态;根据标签和密文数据集合,计算叶子节点所对应的明文数据;对所述多个叶子节点所对应的多个明文数据进行求和处理,得到求和结果;将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
根据本说明书一个或多个实施例的第四方面,提供了一种混淆电路生成装置,应用于模型方,所述模型方持有森林模型,所述森林模型包括多个叶子节点,该装置包括:混淆电路生成单元,用于根据所述森林模型生成混淆电路,所述混淆电路的输出包括多个标签,每个标签用于标识一个叶子节点的匹配状态;混淆电路发送单元,用于向数据方发送所述混淆电路。
根据本说明书一个或多个实施例的第五方面,提供了一种预测结果确定装置,应用于数据方,所述数据方持有混淆电路,所述混淆电路是根据森林模型生成的,所述森林模型包括多个叶子节点,该装置包括:混淆电路执行单元,用于执行所述混淆电路得到多个标签,每个标签用于标识一个叶子节点的匹配状态;标签求和单元,用于对所述多个标签进行求和处理,得到求和结果;求和结果处理单元,用于将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
根据本说明书一个或多个实施例的第六方面,提供了一种预测结果确定装置,应用于数据方,所述数据方持有混淆电路,所述混淆电路是根据森林模型生成的,所述森林模型包括多个叶子节点,该装置包括:密文数据接收单元,用于接收模型方发来的多个密文数据集合,每个密文数据对应一个叶子节点;混淆电路执行单元,用于执行所述混淆电路得到多个标签,每个标签用于标识一个叶子节点的匹配状态;明文数据获取单元,用于根据标签和密文数据集合,计算叶子节点所对应的明文数据;明文数据求和单元,用于对所述多个叶子节点所对应的多个明文数据进行求和处理,得到求和结果;求和结果处理单元,用于将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
根据本说明书一个或多个实施例的第七方面,提供了一种电子设备,包括:存储器,用于存储计算机指令;处理器,用于执行所述计算机指令以实现如第一方面所述的方法步骤。
根据本说明书一个或多个实施例的第八方面,提供了一种电子设备,包括:存储器,用于存储计算机指令;处理器,用于执行所述计算机指令以实现如第二方面所述的方法步骤。
根据本说明书一个或多个实施例的第九方面,提供了一种电子设备,包括:存储器,用于存储计算机指令;处理器,用于执行所述计算机指令以实现如第三方面所述的方法步骤。
由以上本说明书实施例提供的技术方案可见,数据方通过执行与森林模型相对应的混淆电路,可以得到森林模型中多个叶子节点的标签。利用叶子节点的标签,模型方和/或数据方可以得到森林模型的预测结果。这样一方面,可以在模型方不泄漏森林模型、且数据方不泄漏业务数据的条件下,获得森林模型的预测结果,实现了隐私保护。另一方面,混淆电路的输出为叶子节点的标签,从而避免了叶子节点的叶子值参与混淆电路的计算,减少了模型方和数据方之间的通信开销。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一实施例的树模型示意图;
图2为本说明书一实施例的逻辑电路示意图;
图3为本说明书一实施例的数据处理方法流程图;
图4为本说明书一实施例的逻辑电路示意图;
图5为本说明书一实施例的逻辑电路示意图;
图6为本说明书一实施例的数据处理方法流程图;
图7为本说明书一实施例的混淆电路生成方法流程图;
图8为本说明书一实施例的预测结果确定方法流程图;
图9为本说明书一实施例的预测结果确定方法流程图;
图10为本说明书一实施例的混淆电路装置的功能结构示意图;
图11为本说明书一实施例的预测结果确定装置的功能结构示意图;
图12为本说明书一实施例的预测结果确定装置的功能结构示意图;
图13为本说明书一实施例的电子设备的功能结构示意图。
具体实施方式
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。此外,应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。
为了便于本领域技术人员理解本说明书实施例的技术方案,下面先对本说明书实施例的技术术语进行说明。
树模型:一种有监督的机器学习模型。所述树模型包括了多个节点。每个节点可以对应有位置标识,所述位置标识可以用于标识该节点在树模型中的位置,具体例如可以为该节点的编号等。所述多个节点能够形成多个预测路径。所述预测路径的起始节点为所述树模型的根节点,终止节点为所述树模型的叶子节点。
分裂节点:当树模型中的一个节点能够向下分裂时,可以将该节点称为分裂节点。所述分裂节点具体可以包括根节点、以及除去叶子节点和根节点以外的其它节点(以下称为内部节点)。所述分裂节点对应有分裂条件,所述分裂条件可以用于选择预测路径。
叶子节点:当树模型中的一个节点不能够向下分裂时,可以将该节点称为叶子节点。所述叶子节点对应有叶子值。树模型的不同叶子节点所对应的叶子值可以相同或不同。每个叶子值可以表示一种预测结果。所述叶子值可以为数值或向量等。
以下介绍树模型一个场景示例。
请参阅图1。在本场景示例中,树模型Tree1可以包括节点1、2、3、4、5、6、7、8、9、10、11等11个节点。其中,节点1为根节点;节点2、3、4和5为内部节点;节点6、7、8、9、10和11为叶子节点。节点1、2、4、8可以形成一个预测路径,节点1、2、4、9可以形成一个预测路径;节点1、2、5、10可以形成一个预测路径;节点1、2、5、11可以形成一个预测路径;节点1、3、6可以形成一个预测路径;节点1、3、7可以形成一个预测路径。
节点1、2、3、4和5对应的分裂条件可以如下表1所示。
表1
分裂条件“年龄大于20岁”、“年收入大于5万”、“有房”、“有车”、“已婚”可以用于选择预测路径。当不满足分裂条件(即判断结果为0)时,可以选择左边的预测路径;当满足分裂条件(即判断结果为0)时,可以选择右边的预测路径。
节点6、7、8、9、10和11对应的叶子值如下表2所示。
表2
节点 | 叶子值 |
节点6 | 20 |
节点7 | 40 |
节点8 | 80 |
节点9 | 100 |
节点10 | 200 |
节点11 | 250 |
所述树模型可以包括决策树模型。所述决策树模型可以包括回归决策树和分类决策树等。所述回归决策树的预测结果可以为一个具体的数值。所述分类决策树的预测结果可以为一个具体的类别。值得说明的是,为了便于分析计算,通常可以采用向量来表示类别。例如,向量[1 0 0]可以表示类别A,向量[0 1 0]可以表示类别B,向量[0 0 1]可以表示类别C。当然,此处的向量仅为示例,在实际应用中还可以采用其它的数学方式来表示类别。
森林模型:一种有监督的机器学习模型。所述森林模型可以包括至少一个树模型。其中,用于实现将多个树模型集成为森林模型的算法可以包括随机森林(Random Forest)、极值梯度提升(Extreme Gradient Boosting,XGBoost)、梯度提升决策树(GradientBoosting Decision Tree,GBDT)等算法。
所述森林模型可以包括决策森林模型。所述决策森林模型可以包括回归决策森林和分类决策森林。所述回归决策森林可以包括一个或多个回归决策树。当回归决策森林包括一个回归决策树时,可以将该回归决策树的预测结果作为该回归决策森林的预测结果。当回归决策森林包括多个回归决策树时,可以对所述多个回归决策树的预测结果进行求和处理,可以将求和结果作为该回归决策森林的预测结果。所述分类决策森林可以包括一个或多个分类决策树。当分类决策森林包括一个分类决策树时,可以将该分类决策树的预测结果作为该分类决策森林的预测结果。当分类决策森林包括多个分类决策树时,可以对所述多个分类决策树的预测结果进行统计,可以将统计结果作为该分类决策森林的预测结果。值得说明的是,在一些场景下,分类决策树的预测结果可以表示为向量,所述向量可以用于表示类别。如此,可以对分类决策森林中多个分类决策树预测出的向量进行求和处理,可以将求和结果作为分类决策森林的预测结果。例如,某一分类决策森林可以包括分类决策树Tree2、Tree3、Tree4。分类决策树Tree2的预测结果可以表示为向量[1 0 0],向量[1 00]表示类别A。分类决策树Tree3的预测结果可以表示为向量[0 1 0],向量[0 1 0]表示类别B。分类决策树Tree4的预测结果可以表示为向量[1 0 0],向量[0 0 1]表示类别C。那么,可以对向量[1 0 0]、[0 1 0]和[1 0 0]进行求和处理,得到向量[2 1 0]作为分类决策森林的预测结果。向量[2 1 0]表示在分类决策森林中预测结果为类别A的次数为2次、预测结果为类别B的次数为1次,预测结果为类别C的次数为0次。
多方安全计算(Secure Muti-Party Computation,MPC)是一种保护数据隐私安全的算法。多方安全计算能让参与计算的多个数据方在不暴露自身数据的前提下进行协作计算。
混淆电路(Garbled Circuit)是一种保护数据隐私的安全计算协议,可以用于实现多方安全计算。具体地,可以将给定的计算任务转换为逻辑电路,所述逻辑电路可以由至少一个运算门构成,所述运算门可以包括与门、或门、异或门等等。所述逻辑电路可以包括至少两个输入线和至少一个输出线。通过对所述逻辑电路的输入线和/或输出线进行加密便可以得到混淆电路。这样多个数据方可以在不泄漏自身数据的前提下,使用所述混淆电路进行协作计算,得到所述计算任务的执行结果。
不经意传输(Oblivious Transfer,OT),又称为茫然传输,是一种可以保护隐私的双方通信协议,能够使通信双方以一种选择模糊化的方式传递数据。具体地,发送方可以具有多个数据。经由不经意传输接收方能够获得所述多个数据中的一个或多个数据。在此过程中,发送方不知晓接收方接收的是哪些数据;而接收方不能够获得其所接收数据之外的其它任何数据。不经意传输协议是混淆电路的基础协议。在使用混淆电路进行协作计算的过程中,通常会使用到不经意传输协议。
以下介绍混淆电路的一个场景示例。
数据方P1持有数据x1和数据x3,数据方P2持有数据x2。函数y=f(x1,x2,x3)=x1x2x3可以表示为如图2所示的逻辑电路。所述逻辑电路由与门1和与门2构成。所述逻辑电路可以包括输入线a、输入线b、输入线d、输出线c和输出线s。
以下介绍数据方P1生成与门1的混淆真值表的过程。
与门1对应的真值表可以如表3所示。
表3
A | b | c |
0 | 0 | 0 |
0 | 1 | 0 |
1 | 0 | 0 |
1 | 1 | 1 |
数据方P1可以生成两个随机数(以下称为混淆值)和分别对应输入线a的两个输入值0和1;可以生成两个混淆值和分别对应输入线b的两个输入值0和1;可以生成两个混淆值和分别对应输出线c的两个输出值0和1。由此可以得到如表4所示的随机化真值表。
表4
数据方P1可以分别将混淆值和作为密钥,对混淆值进行加密,得到混淆值密文可以分别将混淆值和作为密钥,对混淆值进行加密,得到混淆值密文可以分别将混淆值和作为密钥,对混淆值进行加密,得到混淆值密文可以分别将混淆值和作为密钥,对混淆值进行加密,得到混淆值密文由此可以得到如表5所示的加密的随机化真值表。
表5
数据方P1可以打乱表5中各行的排列顺序,得到如表6所示的混淆真值表。
表6
数据方P1还可以生成与门2的混淆真值表,具体过程与生成与门1的混淆真值表的过程相类似,在此不再详述。
数据方P1可以分别将与门1的混淆真值表和与门2的混淆真值表发送给数据方P2。数据方P2可以接收与门1的混淆真值表和与门2的混淆真值表。
数据方P1可以将数据x1的各个比特(bit)在输入线a对应的混淆值发送给数据方P2;可以将数据x3的各个比特(bit)在输入线d对应的混淆值发送给数据方P2。数据方P2可以接收数据x1和数据x3的各个比特对应的混淆值。例如,数据x1=b0×20+b1×21+...+bi×2i+...。对于数据x1的第i个比特bi,当bi的值为0时,数据方P1可以将bi在输入线a对应的混淆值发送给数据方P2;当bi的值为1时,数据方P1可以将bi在输入线a对应的混淆值发送给数据方P2。
数据方P1可以以混淆值和作为输入,数据方P2可以以数据x2的各个比特作为输入,二者进行不经意传输。数据方P2可以得到数据x2的各个比特对应的混淆值。具体地,数据方P1可以生成两个混淆值和分别对应输入线d的两个输入值0和1。如此对于数据x2的每个比特,数据方P1可以以混淆值和作为在不经意传输过程中输入的秘密信息,数据方P2可以以该比特作为在不经意传输过程中输入的选择信息,进行不经意传输。通过不经意传输,数据方P2可以得到该比特在输入线d对应的混淆值。具体地,当该比特的值为0时,数据方P2可以得到混淆值当该比特的值为1时,数据方P2可以得到混淆值根据不经意传输的特性,数据方P1并不知晓数据方P2具体选择的是哪个混淆值,数据方P2也不能够知晓除了所选择的混淆值以外的其它混淆值。
通过以上过程,数据方P2获得了数据x1、数据x2和数据x3的各个比特对应的混淆值。如此数据方P2可以使用数据x1的每个比特在输入线a对应的混淆值、以及数据x2的相应比特在输入线b对应的混淆值,尝试对与门1的混淆真值表中的4个混淆值密文进行解密;数据方P2仅能够成功解密其中的一个混淆值密文,从而得到输出线c的一个混淆值。接下来,数据方P2可以使用数据x3的相应比特在输入线d对应的混淆值、以及解密出的输出线c的混淆值,尝试对与门2的混淆真值表中的4个混淆值密文进行解密;数据方P2仅能够成功解密其中的一个混淆值密文,得到输出线s的一个混淆值。数据方P2可以将解密出的输出线s的混淆值发送给数据方P1。数据方P1可以接收输出线s的混淆值;可以根据输出线s的混淆值、以及混淆值和输出值的对应关系,获得输出线s的输出值。
输出线s的每个输出值可以视作函数y=f(x1,x2,x3)=x1x2x3取值的一个比特。如此数据方P1可以根据输出线s的多个输出值,确定出函数y=f(x1,x2,x3)=x1x2x3的取值。
本说明书提供数据处理系统的实施例。
在一些实施例中,所述数据处理系统可以包括模型方和数据方。所述模型方可以为服务器、手机、平板电脑、或个人电脑等设备;或者,也可以为由多台设备组成的系统,例如由多个服务器组成的服务器集群。所述模型方拥有需要保密的森林模型。所述数据方可以为服务器、手机、平板电脑、或个人电脑等设备;或者,也可以为由多台设备组成的系统,例如由多个服务器组成的服务器集群。所述数据方拥有需要保密的业务数据,所述业务数据例如可以为交易数据、或借贷数据等等。在一个场景示例中,所述模型方可以为金融机构的设备。所述数据方可以为数据机构的设备,诸如大数据公司、政府机构的设备等。
在一些实施例中,所述模型方和所述数据方可以进行协作计算,以便所述模型方和/或所述数据方能够获得森林模型的预测结果。在此过程中,所述模型方不能够泄漏自身的森林模型(例如分裂节点的分裂条件和叶子节点的叶子值),所述数据方不能够泄漏自身的业务数据。具体过程可以参见后续的数据处理方法实施例。
本说明书提供数据处理方法的实施例。所述数据处理方法可以包括部署阶段和实施阶段,所述部署阶段可以包括步骤S101-步骤S105,所述实施阶段可以包括步骤S107-步骤S111。部署阶段的方法步骤并非是必须的。例如,可以预先执行部署阶段的方法步骤,这样在需要确定所需的判断结果时,仅执行实施阶段的方法步骤就可以了。
请参阅图3。所述数据处理方法具体可以包括以下步骤。
步骤S101:模型方根据森林模型生成混淆电路。
在一些实施例中,模型方可以持有森林模型。所述森林模型可以包括至少一个树模型,所述树模型可以包括至少两个叶子节点。这样所述森林模型便可以包括n个叶子节点,所述n个叶子节点可以包括森林模型中各个树模型的叶子节点,n为大于或等于2的整数。
模型方可以根据所述森林模型生成混淆电路。所述混淆电路可以包括多个输出,所述多个输出可以包括森林模型中多个叶子节点的多个标签。每个标签可以用于标识一个叶子节点的匹配状态。这样由于所述混淆电路的输出为叶子节点的标签,而不是森林模型的预测结果(即不是叶子节点的叶子值),从而避免了叶子节点的叶子值参与混淆电路的计算,减少了模型方和数据方之间的通信开销。
所述标签可以包括以下至少之一:第一标签、第二标签。所述第一标签可以用于标识叶子节点没有被匹配到,所述第二标签可以用于标识叶子节点被匹配到。在实际应用中,森林模型中的每个叶子节点可以对应有随机数。如此对于森林模型中的每个叶子节点,模型方可以将叶子节点所对应的随机数作为该叶子节点的第一标签;可以根据叶子节点所对应的随机数、以及叶子节点所对应的叶子值计算该叶子节点的第二标签。
在一些实施例中,如前面所述,森林模型中的每个叶子节点可以对应有随机数。如此所述森林模型的n个叶子节点对应了n个随机数。所述n个随机数的和(以下称为第一特定数据)可以为随机数或数值0。
或者,所述第一特定数据也可以为噪声数据(以下称为第一噪声数据)。例如,可以为第一噪声数据。所述第一噪声数据可以为数值较小的随机数。在实际应用中,模型方可以生成n-1个随机数作为n-1个叶子节点所对应的随机数;可以生成第一噪声数据作为第一特定数据;可以根据第一特定数据和所述n-1个随机数,计算剩余的一个叶子节点所对应的随机数。例如,模型方可以生成n-1个随机数r[1]、r[2]、...、r[i]、...、r[n-1]作为n-1个叶子节点所对应的随机数;可以生成第一噪声数据s作为第一特定数据;可以计算作为第n个叶子节点所对应的随机数。
或者,所述第一特定数据还可以为数值0。例如,在实际应用中,模型方可以生成n-1个随机数作为n-1个叶子节点所对应的随机数;可以将数值0作为第一特定数据;可以根据第一特定数据和所述n-1个随机数,计算剩余的一个叶子节点所对应的随机数。例如,模型方可以生成n-1个随机数r[1]、r[2]、...、r[i]、…、r[n-1]作为n-1个叶子节点所对应的随机数;可以将数值0作为第一特定数据,可以计算作为第n个叶子节点所对应的随机数。
在一些实施例中,模型方可以根据森林模型构建逻辑电路。所述逻辑电路可以由至少一个运算门构成,所述运算门可以包括与门、或门、异或门等等。所述逻辑电路可以包括多个输入线和多个输出线。通过对所述逻辑电路的输入线和/或输出线进行加密便可以得到混淆电路。所述混淆电路可以包括所述逻辑电路的混淆真值表。
在一些实施方式中,所述逻辑电路的输入可以包括分裂节点所对应的分裂条件的输入。例如,所述分裂条件可以包括比较判断条件,所述比较判断条件可以包括大于判断条件、大于或等于判断条件、等于判断条件、小于判断条件、小于或等于判断条件等等。那么,所述分裂条件可以包括两个输入,所述两个输入可以包括所述比较判断条件的阈值以及待与阈值进行比较的数据。
所述逻辑电路的输出可以包括叶子节点的状态值,所述状态值可以用于标识叶子节点的匹配状态。所述状态值可以包括第一取值和第二取值。所述第一取值可以用于标识叶子节点没有被匹配到。所述第二取值可以用于标识叶子节点被匹配到。所述第一取值例如可以为0,所述第二取值例如可以为1。
这样本实施方式的逻辑电路能够实现分裂条件的计算、以及根据分裂条件的计算结果进行预测。值得说明的是,分裂条件的计算结果可以包括分裂条件成立和分裂条件不成立。分裂条件不成立例如可以采用数值0来表示,分裂条件成立例如可以采用数值1来表示。
例如,某一森林模型可以包括如图1所示的树模型。在该树模型中,节点1的分裂条件可以为x1>t1,节点2的分裂条件可以为x2>t2,节点3的分裂条件可以为x3==t3,节点4的分裂条件可以为x4==t4,节点5的分裂条件可以为x5==t5。节点6的状态值可以为V6,节点7的状态值可以为V7,节点8的状态值可以为V8,节点9的状态值可以为V9,节点10的状态值可以为V10、节点10的状态值可以为V11。根据该树模型,模型方可以构建如图4所示的逻辑电路。
通过对所述逻辑电路的输入线和/或输出线进行加密便可以得到混淆电路。
本实施例方式的混淆电路能够实现分裂条件的安全计算、以及根据分裂条件的计算结果进行安全预测。所述混淆电路的输入可以包括分裂条件的输入所对应的混淆值,所述混淆电路的输出可以包括状态值所对应的混淆值。值得说明的是,状态值所对应的混淆值便可以理解为叶子节点的标签。具体地,状态值的第一取值所对应的混淆值便可以理解为叶子节点的第一标签,状态值的第二取值所对应的混淆值便可以理解为叶子节点的第二标签。
在另一些实施方式中,所述逻辑电路的输入可以包括分裂条件的计算结果。所述逻辑电路的输出可以包括叶子节点的状态值。这样本实施方式的逻辑电路能够实现根据分裂条件的计算结果进行预测。值得说明的是,模型方和数据方可以通过任意方式预先获得分裂条件的计算结果,本实施方式对此并不做具体限定。例如,模型方和数据方可以通过多方安全计算技术(例如同态加密技术、混淆电路技术)预先获得分裂条件的计算结果。
例如,某一森林模型可以包括如图1所示的树模型。在该树模型中,节点1的分裂条件可以为x1>t1,x1>t1的计算结果可以为cond1。节点2的分裂条件可以为x2>t2,x2>t2的计算结果可以为cond2。节点3的分裂条件可以为x3==t3,x3==t3的计算结果可以为cond3。节点4的分裂条件可以为x4==t4,x4==t4的计算结果可以为cond4。节点5的分裂条件可以为x5==t5,x5==t5的计算结果可以为cond5。节点6的状态值可以为V6,节点7的状态值可以为V7,节点8的状态值可以为V8,节点9的状态值可以为V9,节点10的状态值可以为V10、节点10的状态值可以为V11。根据该树模型,模型方可以构建如图5所示的逻辑电路。
通过对所述逻辑电路的输入线和/或输出线进行加密便可以得到混淆电路。
本实施例方式的混淆电路能够实现根据分裂条件的计算结果进行安全预测。所述混淆电路的输入可以包括分裂条件的计算结果所对应的混淆值,所述混淆电路的输出可以包括状态值所对应的混淆值。值得说明的是,状态值所对应的混淆值便可以理解为叶子节点的标签。具体地,状态值的第一取值所对应的混淆值便可以理解为叶子节点的第一标签,状态值的第二取值所对应的混淆值便可以理解为叶子节点的第二标签。
步骤S103:模型方向数据方发送所述混淆电路。
步骤S105:数据方接收所述混淆电路。
步骤S107:数据方执行所述混淆电路,得到多个标签。
在一些实施例中,数据方可以与模型方进行通信,以获得所述混淆电路的各个输入线的混淆值。根据所述混淆值,数据方可以执行所述混淆电路,得到森林模型中各个叶子节点的标签。在实际应用中,数据方可以采用不经意传输的方式与模型方进行通信,以获得所述混淆电路的各个输入线的混淆值。具体过程可以参见图2所对应的场景示例,在此不再赘述。值得说明的是,数据方可以得到森林模型中n个叶子节点的n个标签。所述n个标签中的部分标签可以为第一标签,另一部分标签可以为第二标签。但是数据方并不知晓所获得的第一标签是哪些叶子节点的,也不知晓所获得的第二标签是哪些叶子节点的。例如,森林模型可以包括一个树模型。由于数模型中通常仅有一个叶子节点被匹配到,因而所述n个标签可以包括:n-1个第一标签、一个第二标签。又例如,森林模型可以包括m个树模型。由于每个树模型均有一个叶子节点被匹配到,因而所述n个标签可以包括:n-m个第一标签、m个第二标签。
步骤S109:数据方对所述多个标签进行求和处理,得到求和结果。
在一些实施例中,经过步骤S107,数据方可以得到n个标签。数据方可以对所述n个标签进行求和处理,得到求和结果(以下称为第二特定数据)。
步骤S111:数据方将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
在一些实施例中,可以由数据方获得森林模型的预测结果或精度受限的预测结果。
所述第一特定数据可以为数值0,这样所述第二特定数据可以等于森林模型的预测结果。通过将所述求和结果作为所述森林模型的预测结果,数据方可以得到森林模型的预测结果。或者,所述第一特定数据可以为第一噪声数据,这样所述第二特定数据可以等于森林模型的预测结果和第一噪声数据的和。通过将所述求和结果作为所述森林模型的预测结果,数据方可以得到森林模型的精度受限的预测结果。
在一些实施例中,可以由模型方获得森林模型的预测结果或精度受限的预测结果。
所述第一特定数据可以为完全的随机数,这样所述第二特定数据可以等于森林模型的预测结果和该随机数的和。数据方可以向模型方发送所述第二特定数据。模型方可以接收所述第二特定数据;可以根据所述第二特定数据和该随机数,计算森林模型的预测结果。具体地,模型方可以将所述第二特定数据和该随机数相减,得到森林模型的预测结果。或者,数据方可以将所述第二特定数据和一个噪声数据(以下称为第二噪声数据)进行求和,得到求和结果(以下称为第三特定数据);可以向模型方发送所述第三特定数据。模型方可以接收所述第三特定数据;可以根据所述第三特定数据和该随机数,计算森林模型的精度受限的预测结果。具体地,模型方可以将所述第三特定数据和该随机数相减,得到森林模型的精度受限的预测结果。
在一些实施例中,可以由模型方和/或数据方获得森林模型的预测结果与预设值的大小关系。所述预设值的大小可以根据实际需要灵活设定。在实际应用中,所述预设值可以为临界值。在预测结果大于所述预设值时,可以执行一种预置操作;在预测结果小于所述预设值时,可以执行另一种预置操作。例如,所述预设值可以为风险评估业务中的一个临界值。森林模型的预测结果可以为用户的信用分值。当某一用户的信用分值大于所述预设值时,表示该用户的风险水平较高,可以拒绝执行对该用户进行贷款的操作;当某一用户的信用分值小于所述阈值时,表示该用户的风险水平较低,可以执行对该用户进行贷款的操作。值得说明的是,模型方和数据方仅知晓森林模型的预测结果与预设值的大小关系、以及具体的预设值,而无法知晓森林模型的预测结果。
在实际应用中,所述第一特定数据可以为完全的随机数,所述第二特定数据可以等于森林模型的预测结果和该随机数的和。数据方可以以所述第二特定数据为输入,模型方可以以所述第一特定数据、以及预设值为输入,二者合作执行多方安全比较算法。通过执行多方安全比较算法可以实现:在数据方不泄漏所述第二特定数据、且模型方不泄漏所述第一特定数据的条件下,模型方和/或数据方获得森林模型的预测结果与所述预设值之间的大小关系。这里可以采用现有的任意类型的安全比较算法,例如混淆电路等。具体地,例如,模型方可以根据函数y=f(r,t,g)=g-r-t构建混淆电路,进而可以向数据方发送该混淆电路。数据方可以接收该混淆电路,进而可以执行该混淆电路,从而得到森林模型的预测结果与所述预设值之间的大小关系。其中,g表示第二特定数据,r表示第一特定数据,t表示预设值。
值得说明的是,当森林模型中包括一个树模型时,模型方可以为该树模型生成混淆电路。这样对于该树模型,通过执行图3所对应的实施例,可以由数据方获得该树模型的预测结果或精度受限的预测结果;或者,可以由模型方获得该树模型的预测结果或精度受限的预测结果;又或者,可以由模型方和/或数据方获得该树模型的预测结果与预设值的大小关系。
当森林模型中包括多个树模型时,模型方可以为所述森林模型生成一个混淆电路。这样对于所述森林模型,通过执行图3所对应的实施例,可以由数据方获得森林模型的预测结果或精度受限的预测结果;或者,可以由模型方获得森林模型的预测结果或精度受限的预测结果;又或者,可以由模型方和/或数据方获得森林模型的预测结果与预设值的大小关系。
当然,当森林模型中包括多个树模型时,模型方也可以生成多个混淆电路,每个混淆电路可以对应所述森林模型中的一个树模型。这样对于每个树模型,通过执行图3所对应的实施例,可以由数据方获得该树模型的预测结果或精度受限的预测结果;或者,可以由模型方获得该树模型的预测结果或精度受限的预测结果;又或者,可以由模型方和/或数据方获得该树模型的预测结果与预设值的大小关系。由森林模型中各个树模型的预测结果或精度受限的预测结果,便可以确定出所述森林模型的预测结果或精度受限的预测结果。
本说明书的一些实施例中,数据方通过执行与森林模型相对应的混淆电路,可以得到森林模型中多个叶子节点的标签。利用叶子节点的标签,模型方和/或数据方可以得到森林模型的预测结果。这样一方面,可以在模型方不泄漏森林模型(例如分裂节点和叶子值)、且数据方不泄漏业务数据的条件下,获得森林模型的预测结果,实现了隐私保护。另一方面,混淆电路的输出为叶子节点的标签,从而避免了叶子节点的叶子值参与混淆电路的计算,减少了模型方和数据方之间的通信开销。
本说明书提供数据处理方法的实施例。所述数据处理方法可以包括部署阶段和实施阶段,所述部署阶段可以包括步骤S201-步骤S207,所述实施阶段可以包括步骤S209-步骤S215。部署阶段的方法步骤并非是必须的。例如,可以预先执行部署阶段的方法步骤,这样在需要确定所需的判断结果时,仅执行实施阶段的方法步骤就可以了。
请参阅图6。所述数据处理方法具体可以包括以下步骤。
步骤S201:模型方根据森林模型生成混淆电路。
步骤S203:模型方根据第一标签和第二标签,获取叶子节点所对应的密文数据集合。
在一些实施例中,模型方可以为所述森林模型中的每个叶子节点生成第一标签和第二标签。例如,对于所述森林模型中的每个叶子节点,模型方可以生成两个随机数分别作为该叶子节点的第一标签和第二标签。
在一些实施例中,对于所述森林模型中的每个叶子节点,模型方可以根据该叶子节点的第一标签和第二标签,生成该叶子节点所对应的密文数据集合,所述密文数据集合可以包括至少两个密文数据。具体地,模型方可以根据该叶子节点的第一标签、以及该叶子节点所对应的随机数,计算得到一个密文数据;可以根据该叶子节点的第二标签、该叶子节点所对应的随机数、以及该叶子节点的叶子值,计算得到另一个密文数据。关于叶子节点所对应随机数的介绍可以参见前面的实施例。
例如,叶子节点i所对应的密文数据集合可以包括和r[i]表示叶子节点i所对应的随机数,表示叶子节点i的第一标签,表示利用对r[i]进行加密后所得到的密文数据;Oi表示叶子节点i所对应的叶子值,表示叶子节点i的第二标签,表示利用对r[i]+Oi进行加密后所得到的密文数据;i为1和n之间的整数,n表示森林模型中叶子节点的数量。
步骤S205:模型方向数据方发送混淆电路和每个叶子节点所对应的密文数据集合。
步骤S207:数据方接收混淆电路和每个叶子节点所对应的密文数据集合。
步骤S209:数据方执行所述混淆电路,得到多个标签。
步骤S211:数据方根据标签和密文数据集合,计算叶子节点所对应的明文数据。
在一些实施例中,经过步骤S207,数据方可以得到所述森林模型中每个叶子节点所对应的密文数据集合。经过步骤S211,数据方可以得到所述森林模型中每个叶子节点的标签。这样对于所述森林模型中的每个叶子节点,数据方可以根据该叶子节点的标签,对该叶子节点所对应密文数据集合中的各个密文数据进行解密;但仅有一个密文数据能够被成功解密,从而得到该叶子节点所对应的明文数据。
延续前面的例子,经过步骤S207,数据方可以得到叶子节点j所对应的密文数据集合可以包括和经过步骤S211,数据方可以得到叶子节点j的标签数据方可以根据标签对密文数据和进行解密;但仅有密文数据能够被成功解密,从而得到叶子节点j所对应的明文数据r[j]。
步骤S213:数据方对所述多个叶子节点所对应的多个明文数据进行求和处理,得到求和结果。
步骤S215:数据方将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
具体过程可以参见前面的实施例。
值得说明的是,当森林模型中包括一个树模型时,模型方可以为该树模型生成混淆电路。这样对于该树模型,通过执行图6所对应的实施例,可以由数据方获得该树模型的预测结果或精度受限的预测结果;或者,可以由模型方获得该树模型的预测结果或精度受限的预测结果;又或者,可以由模型方和/或数据方获得该树模型的预测结果与预设值的大小关系。
当森林模型中包括多个树模型时,模型方可以为所述森林模型生成一个混淆电路。这样对于所述森林模型,通过执行图6所对应的实施例,可以由数据方获得森林模型的预测结果或精度受限的预测结果;或者,可以由模型方获得森林模型的预测结果或精度受限的预测结果;又或者,可以由模型方和/或数据方获得森林模型的预测结果与预设值的大小关系。
当然,当森林模型中包括多个树模型时,模型方也可以生成多个混淆电路,每个混淆电路可以对应所述森林模型中的一个树模型。这样对于每个树模型,通过执行图6所对应的实施例,可以由数据方获得该树模型的预测结果或精度受限的预测结果;或者,可以由模型方获得该树模型的预测结果或精度受限的预测结果;又或者,可以由模型方和/或数据方获得该树模型的预测结果与预设值的大小关系。由森林模型中各个树模型的预测结果或精度受限的预测结果,便可以确定出所述森林模型的预测结果或精度受限的预测结果。
本说明书的一些实施例中,数据方通过执行与森林模型相对应的混淆电路,可以得到森林模型中多个叶子节点的标签。利用叶子节点的标签,模型方和/或数据方可以得到森林模型的预测结果。这样一方面,可以在模型方不泄漏森林模型(例如分裂节点和叶子值)、且数据方不泄漏业务数据的条件下,获得森林模型的预测结果,实现了隐私保护。另一方面,混淆电路的输出为叶子节点的标签,从而避免了叶子节点的叶子值参与混淆电路的计算,减少了模型方和数据方之间的通信开销。
本说明书还提供混淆电路生成方法的实施例。所述混淆电路生成方法以模型方为执行主体。所述模型方可以持有森林模型,所述森林模型可以包括多个叶子节点。
请参阅图7,所述混淆电路生成方法可以包括以下步骤。
步骤S31:根据所述森林模型生成混淆电路。
步骤S33:向数据方发送所述混淆电路。
在一些实施例中,所述混淆电路可以包括多个输出,所述多个输出可以包括森林模型中多个叶子节点的多个标签。每个标签可以用于标识一个叶子节点的匹配状态。具体地,所述标签可以包括以下至少之一:第一标签、第二标签。所述第一标签可以用于标识叶子节点没有被匹配到,所述第二标签可以用于标识叶子节点被匹配到。这样由于所述混淆电路的输出为叶子节点的标签,而不是森林模型的预测结果(即不是叶子节点的叶子值),从而避免了叶子节点的叶子值参与混淆电路的计算,减少了模型方和数据方之间的通信开销。
在一些实施例中,森林模型中的每个叶子节点可以对应有随机数。如此对于森林模型中的每个叶子节点,模型方可以将叶子节点所对应的随机数作为该叶子节点的第一标签;可以根据叶子节点所对应的随机数、以及叶子节点所对应的叶子值计算该叶子节点的第二标签。例如,叶子节点i的第一标签可以为叶子节点i的第二标签可以为r[i]表示叶子节点i所对应的随机数,Oi表示叶子节点i所对应的叶子值,i为1和n之间的整数。
在另一些实施例中,模型方可以为所述森林模型中的每个叶子节点生成第一标签和第二标签。例如,对于所述森林模型中的每个叶子节点,模型方可以生成两个随机数分别作为该叶子节点的第一标签和第二标签。
进一步地,对于所述森林模型中的每个叶子节点,模型方可以根据该叶子节点的第一标签和第二标签,生成该叶子节点所对应的密文数据集合;可以向数据方发送该叶子节点所对应的密文数据集合。所述密文数据集合可以包括至少两个密文数据。具体地,模型方可以根据该叶子节点的第一标签、以及该叶子节点所对应的随机数,计算得到一个密文数据;可以根据该叶子节点的第二标签、该叶子节点所对应的随机数、以及该叶子节点的叶子值,计算得到另一个密文数据。关于叶子节点所对应随机数的介绍可以参见前面的实施例。
例如,叶子节点i所对应的密文数据集合可以包括和r[i]表示叶子节点i所对应的随机数,表示叶子节点i的第一标签,表示利用对r[i]进行加密后所得到的密文数据;Oi表示叶子节点i所对应的叶子值,表示叶子节点i的第二标签,表示利用对r[i]+Oi进行加密后所得到的密文数据;i为1和n之间的整数,n表示森林模型中叶子节点的数量。
本说明书的一些实施例中,模型方可以生成与森林模型相对应的混淆电路。混淆电路的输出为森林模型中叶子节点的标签,从而避免了叶子节点的叶子值参与混淆电路的计算,减少了模型方和数据方之间的通信开销。
本说明书还提供预测结果确定方法的实施例。所述预测结果确定方法以数据方为执行主体。所述数据方可以持有混淆电路。所述混淆电路是根据森林模型生成的,所述森林模型可以包括多个叶子节点。
请参阅图8,所述预测结果确定方法可以包括以下步骤。
步骤S41:执行所述混淆电路得到多个标签。
步骤S43:对所述多个标签进行求和处理,得到求和结果。
步骤S45:将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
本说明书的一些实施例中,数据方通过执行与森林模型相对应的混淆电路,可以得到森林模型中多个叶子节点的标签。利用叶子节点的标签,模型方和/或数据方可以得到森林模型的预测结果。这样一方面,可以在模型方不泄漏森林模型(例如分裂节点和叶子值)、且数据方不泄漏业务数据的条件下,获得森林模型的预测结果,实现了隐私保护。另一方面,混淆电路的输出为叶子节点的标签,从而避免了叶子节点的叶子值参与混淆电路的计算,减少了模型方和数据方之间的通信开销。
本说明书还提供预测结果确定方法的实施例。所述预测结果确定方法以数据方为执行主体。所述数据方可以持有混淆电路。所述混淆电路是根据森林模型生成的,所述森林模型可以包括多个叶子节点。
请参阅图9,所述预测结果确定方法可以包括以下步骤。
步骤S51:接收模型方发来的多个密文数据集合,每个密文数据对应一个叶子节点。
步骤S53:执行所述混淆电路得到多个标签,每个标签用于标识一个叶子节点的匹配状态。
步骤S55:根据标签和密文数据集合,计算叶子节点所对应的明文数据。
步骤S57:对所述多个叶子节点所对应的多个明文数据进行求和处理,得到求和结果。
步骤S59:将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
本说明书的一些实施例中,数据方通过执行与森林模型相对应的混淆电路,可以得到森林模型中多个叶子节点的标签。利用叶子节点的标签,模型方和/或数据方可以得到森林模型的预测结果。这样一方面,可以在模型方不泄漏森林模型(例如分裂节点和叶子值)、且数据方不泄漏业务数据的条件下,获得森林模型的预测结果,实现了隐私保护。另一方面,混淆电路的输出为叶子节点的标签,从而避免了叶子节点的叶子值参与混淆电路的计算,减少了模型方和数据方之间的通信开销。
本说明书还提供混淆电路生成装置的实施例。所述混淆电路生成装置以模型方为执行主体。所述模型方可以持有森林模型,所述森林模型可以包括多个叶子节点。
请参阅图10,所述混淆电路生成装置可以包括以下单元。
混淆电路生成单元61,用于根据所述森林模型生成混淆电路,所述混淆电路的输出包括多个标签,每个标签用于标识一个叶子节点的匹配状态;
混淆电路发送单元63,用于向数据方发送所述混淆电路。
本说明书还提供预测结果确定装置的实施例。所述预测结果确定装置以数据方为执行主体。所述数据方可以持有混淆电路。所述混淆电路是根据森林模型生成的,所述森林模型可以包括多个叶子节点。
请参阅图11,所述预测结果确定装置可以包括以下单元。
混淆电路执行单元71,用于执行所述混淆电路得到多个标签,每个标签用于标识一个叶子节点的匹配状态;
标签求和单元73,用于对所述多个标签进行求和处理,得到求和结果;
求和结果处理单元75,用于将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
本说明书还提供预测结果确定装置的实施例。所述预测结果确定装置以数据方为执行主体。所述数据方可以持有混淆电路,所述混淆电路是根据森林模型生成的,所述森林模型可以包括多个叶子节点。
请参阅图12,所述预测结果确定装置可以包括以下单元。
密文数据接收单元81,用于接收模型方发来的多个密文数据集合,每个密文数据对应一个叶子节点;
混淆电路执行单元83,用于执行所述混淆电路得到多个标签,每个标签用于标识一个叶子节点的匹配状态;
明文数据获取单元85,用于根据标签和密文数据集合,计算叶子节点所对应的明文数据;
明文数据求和单元87,用于对所述多个叶子节点所对应的多个明文数据进行求和处理,得到求和结果;
求和结果处理单元89,用于将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
下面介绍本说明书电子设备的一个实施例。图13是该实施例中电子设备的硬件结构示意图。如图13所示,该电子设备可以包括一个或多个(图中仅示出一个)处理器、存储器和传输模块。当然,本领域普通技术人员可以理解,图13所示的硬件结构仅为示意,其并不对上述电子设备的硬件结构造成限定。在实际中该电子设备还可以包括比图13所示更多或者更少的组件单元;或者,具有与图13所示不同的配置。
所述存储器可以包括高速随机存储器;或者,还可以包括非易失性存储器,例如一个或者多个磁性存储装置、闪存或者其他非易失性固态存储器。当然,所述存储器还可以包括远程设置的网络存储器。所述远程设置的网络存储器可以通过诸如互联网、企业内部网、局域网、移动通信网等网络连接至所述区块链客户端。所述存储器可以用于存储应用软件的程序指令或模块,例如本说明书图7、图8或图9所对应实施例的程序指令或模块。
所述处理器可以按任何适当的方式实现。例如,所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以读取并执行所述存储器中的程序指令或模块。
所述传输模块可以用于经由网络进行数据传输,例如经由诸如互联网、企业内部网、局域网、移动通信网等网络进行数据传输。
本说明书还提供计算机存储介质的一个实施例。所述计算机存储介质包括但不限于随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard Disk Drive,HDD)、存储卡(Memory Card)等等。所述计算机存储介质存储有计算机程序指令。在所述计算机程序指令被执行时实现:本说明书图7、图8或图9所对应实施例的程序指令或模块。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。尤其,对于单侧实施的方法实施例(例如图7、图8和图9所对应的实施例)、装置实施例、电子设备实施例、以及计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。另外,可以理解的是,本领域技术人员在阅读本说明书文件之后,可以无需创造性劳动想到将本说明书列举的部分或全部实施例进行任意组合,这些组合也在本说明书公开和保护的范围内。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
Claims (18)
1.一种混淆电路生成方法,应用于模型方,所述模型方持有森林模型,所述森林模型包括多个叶子节点,该方法包括:
根据所述森林模型生成混淆电路,所述混淆电路的输出包括多个标签,每个标签用于标识一个叶子节点的匹配状态;
向数据方发送所述混淆电路;以使数据方执行所述混淆电路,得到多个标签,对所述多个标签进行求和处理,得到求和结果,将所述求和结果作为所述森林模型的预测结果;或者,数据方向模型方发送所述求和结果,以使模型方根据所述求和结果计算所述森林模型的预测结果;或者,数据方以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
2.如权利要求1所述的方法,所述标签包括以下至少之一:第一标签、第二标签;
所述第一标签用于标识叶子节点没有被匹配到;
所述第二标签用于标识叶子节点被匹配到。
4.如权利要求2所述的方法,还包括:
根据第一标签和第二标签获取叶子节点所对应的密文数据集合;
向数据方发送每个叶子节点所对应的密文数据集合。
7.一种预测结果确定方法,应用于数据方,所述数据方持有混淆电路,所述混淆电路是由模型方根据森林模型生成的,所述森林模型包括多个叶子节点,该方法包括:
执行所述混淆电路得到多个标签,每个标签用于标识一个叶子节点的匹配状态;
对所述多个标签进行求和处理,得到求和结果;
将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
8.如权利要求7所述的方法,所述标签包括以下至少之一:第一标签、第二标签;
所述第一标签用于标识叶子节点没有被匹配到;
所述第二标签用于标识叶子节点被匹配到。
10.一种预测结果确定方法,应用于数据方,所述数据方持有混淆电路,所述混淆电路是由模型方根据森林模型生成的,所述森林模型包括多个叶子节点,该方法包括:
接收模型方发来的多个密文数据集合,每个密文数据对应一个叶子节点;
执行所述混淆电路得到多个标签,每个标签用于标识一个叶子节点的匹配状态;
根据标签和密文数据集合,计算叶子节点所对应的明文数据;
对所述多个叶子节点所对应的多个明文数据进行求和处理,得到求和结果;
将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
11.如权利要求10所述的方法,所述标签包括以下至少之一:第一标签、第二标签;
所述第一标签用于标识叶子节点没有被匹配到;
所述第二标签用于标识叶子节点被匹配到。
13.一种混淆电路生成装置,应用于模型方,所述模型方持有森林模型,所述森林模型包括多个叶子节点,该装置包括:
混淆电路生成单元,用于根据所述森林模型生成混淆电路,所述混淆电路的输出包括多个标签,每个标签用于标识一个叶子节点的匹配状态;
混淆电路发送单元,用于向数据方发送所述混淆电路;以使数据方执行所述混淆电路,得到多个标签,对所述多个标签进行求和处理,得到求和结果,将所述求和结果作为所述森林模型的预测结果;或者,数据方向模型方发送所述求和结果,以使模型方根据所述求和结果计算所述森林模型的预测结果;或者,数据方以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
14.一种预测结果确定装置,应用于数据方,所述数据方持有混淆电路,所述混淆电路是由模型方根据森林模型生成的,所述森林模型包括多个叶子节点,该装置包括:
混淆电路执行单元,用于执行所述混淆电路得到多个标签,每个标签用于标识一个叶子节点的匹配状态;
标签求和单元,用于对所述多个标签进行求和处理,得到求和结果;
求和结果处理单元,用于将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
15.一种预测结果确定装置,应用于数据方,所述数据方持有混淆电路,所述混淆电路是由模型方根据森林模型生成的,所述森林模型包括多个叶子节点,该装置包括:
密文数据接收单元,用于接收模型方发来的多个密文数据集合,每个密文数据对应一个叶子节点;
混淆电路执行单元,用于执行所述混淆电路得到多个标签,每个标签用于标识一个叶子节点的匹配状态;
明文数据获取单元,用于根据标签和密文数据集合,计算叶子节点所对应的明文数据;
明文数据求和单元,用于对所述多个叶子节点所对应的多个明文数据进行求和处理,得到求和结果;
求和结果处理单元,用于将所述求和结果作为所述森林模型的预测结果;或者,向模型方发送所述求和结果,以便模型方根据所述求和结果计算所述森林模型的预测结果;或者,以所述求和结果为输入,与模型方共同执行多方安全比较算法,以比较所述森林模型的预测结果与预设值的大小。
16.一种电子设备,包括:
存储器,用于存储计算机指令;
处理器,用于执行所述计算机指令以实现如权利要求1-6中任一项所述的方法步骤。
17.一种电子设备,包括:
存储器,用于存储计算机指令;
处理器,用于执行所述计算机指令以实现如权利要求7-9中任一项所述的方法步骤。
18.一种电子设备,包括:
存储器,用于存储计算机指令;
处理器,用于执行所述计算机指令以实现如权利要求10-12中任一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911219782.7A CN111125727B (zh) | 2019-12-03 | 2019-12-03 | 混淆电路生成方法、预测结果确定方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911219782.7A CN111125727B (zh) | 2019-12-03 | 2019-12-03 | 混淆电路生成方法、预测结果确定方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111125727A CN111125727A (zh) | 2020-05-08 |
CN111125727B true CN111125727B (zh) | 2021-05-14 |
Family
ID=70497238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911219782.7A Active CN111125727B (zh) | 2019-12-03 | 2019-12-03 | 混淆电路生成方法、预测结果确定方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111125727B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460515B (zh) * | 2020-06-19 | 2020-11-20 | 支付宝(杭州)信息技术有限公司 | 数据匹配方法、装置和电子设备 |
CN112711744A (zh) * | 2020-06-23 | 2021-04-27 | 华控清交信息科技(北京)有限公司 | 一种计算任务的处理方法、装置和用于计算任务的处理装置 |
CN117216731A (zh) * | 2020-09-15 | 2023-12-12 | 华为技术有限公司 | 一种处理人工智能模型的方法、数据处理的方法及装置 |
CN113051177B (zh) * | 2021-04-20 | 2022-10-04 | 支付宝(杭州)信息技术有限公司 | 测试方法和装置 |
CN114285558B (zh) * | 2021-12-24 | 2023-09-08 | 浙江大学 | 一种基于半可信硬件的多方隐私计算方法及装置 |
CN114500006B (zh) * | 2022-01-05 | 2023-08-04 | 支付宝(杭州)信息技术有限公司 | 查询请求的处理方法及装置 |
CN114119214A (zh) * | 2022-01-28 | 2022-03-01 | 中国测绘科学研究院 | 一种基于多方安全计算的信用评估计算方法 |
CN114900442B (zh) * | 2022-05-27 | 2024-03-29 | 中金金融认证中心有限公司 | 用于对业务数据进行预测的方法及其相关产品 |
CN115563645A (zh) * | 2022-09-17 | 2023-01-03 | 工业和信息化部装备工业发展中心 | 基于自动驾驶模拟仿真业务场景的安全协同计算方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570537A (zh) * | 2016-11-17 | 2017-04-19 | 天津大学 | 一种基于混淆矩阵的随机森林模型选择方法 |
KR20180086021A (ko) * | 2017-01-20 | 2018-07-30 | 이화여자대학교 산학협력단 | 랜덤한 트리 cnn에 기반한 영상 분석 방법 및 포레스트 cnn에 기반한 영상 분석 방법 |
CN109146563A (zh) * | 2018-08-14 | 2019-01-04 | 电子科技大学 | 一种基于迁移学习的城市住宅地价评估方法 |
CN109359470A (zh) * | 2018-08-14 | 2019-02-19 | 阿里巴巴集团控股有限公司 | 多方安全计算方法及装置、电子设备 |
CN110414567A (zh) * | 2019-07-01 | 2019-11-05 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置和电子设备 |
CN110457912A (zh) * | 2019-07-01 | 2019-11-15 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置和电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033854B (zh) * | 2018-07-17 | 2020-06-09 | 阿里巴巴集团控股有限公司 | 基于模型的预测方法和装置 |
-
2019
- 2019-12-03 CN CN201911219782.7A patent/CN111125727B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106570537A (zh) * | 2016-11-17 | 2017-04-19 | 天津大学 | 一种基于混淆矩阵的随机森林模型选择方法 |
KR20180086021A (ko) * | 2017-01-20 | 2018-07-30 | 이화여자대학교 산학협력단 | 랜덤한 트리 cnn에 기반한 영상 분석 방법 및 포레스트 cnn에 기반한 영상 분석 방법 |
CN109146563A (zh) * | 2018-08-14 | 2019-01-04 | 电子科技大学 | 一种基于迁移学习的城市住宅地价评估方法 |
CN109359470A (zh) * | 2018-08-14 | 2019-02-19 | 阿里巴巴集团控股有限公司 | 多方安全计算方法及装置、电子设备 |
CN110414567A (zh) * | 2019-07-01 | 2019-11-05 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置和电子设备 |
CN110457912A (zh) * | 2019-07-01 | 2019-11-15 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置和电子设备 |
Non-Patent Citations (1)
Title |
---|
随机森林算法优化研究;曹正凤;《中国博士学位论文全文数据库 社会科学Ⅱ辑》;20140815(第8期);第H123-22页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111125727A (zh) | 2020-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111125727B (zh) | 混淆电路生成方法、预测结果确定方法、装置和电子设备 | |
CN110457912B (zh) | 数据处理方法、装置和电子设备 | |
CN110414567B (zh) | 数据处理方法、装置和电子设备 | |
CN110427969B (zh) | 数据处理方法、装置和电子设备 | |
CN110580409B (zh) | 模型参数确定方法、装置和电子设备 | |
CN113239404B (zh) | 一种基于差分隐私和混沌加密的联邦学习方法 | |
CN110569227B (zh) | 模型参数确定方法、装置和电子设备 | |
CN110580410B (zh) | 模型参数确定方法、装置和电子设备 | |
CN111428887B (zh) | 一种基于多个计算节点的模型训练控制方法、装置及系统 | |
CN111144576A (zh) | 模型训练方法、装置和电子设备 | |
US20200175426A1 (en) | Data-based prediction results using decision forests | |
CN110391895B (zh) | 数据预处理方法、密文数据获取方法、装置和电子设备 | |
CN111143862B (zh) | 数据处理方法、查询方法、装置、电子设备和系统 | |
CN113239391A (zh) | 一种无第三方的逻辑回归联邦学习模型训练系统及方法 | |
CN113722755A (zh) | 实现隐私保护的数据处理系统、方法、装置和设备 | |
CN111046431B (zh) | 数据处理方法、查询方法、装置、电子设备和系统 | |
CN111159730B (zh) | 数据处理方法、查询方法、装置、电子设备和系统 | |
US20200293911A1 (en) | Performing data processing based on decision tree | |
CN111046408A (zh) | 判断结果处理方法、查询方法、装置、电子设备和系统 | |
CN116094686B (zh) | 用于量子卷积计算的同态加密方法、系统、设备及终端 | |
Adams et al. | Private text classification with convolutional neural networks | |
CN110569659B (zh) | 数据处理方法、装置和电子设备 | |
CN115085897A (zh) | 用于保护隐私的数据处理方法、装置和计算机设备 | |
Pentyala et al. | Privfair: a library for privacy-preserving fairness auditing | |
CN112232639A (zh) | 统计方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220124 Address after: Room 803, floor 8, No. 618 Wai Road, Huangpu District, Shanghai 200010 Patentee after: Ant blockchain Technology (Shanghai) Co.,Ltd. Address before: 310000 801-11 section B, 8th floor, 556 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province Patentee before: Alipay (Hangzhou) Information Technology Co.,Ltd. |
|
TR01 | Transfer of patent right |