CN112000991A - 多方数据联合处理方法、装置及系统 - Google Patents
多方数据联合处理方法、装置及系统 Download PDFInfo
- Publication number
- CN112000991A CN112000991A CN202011166510.8A CN202011166510A CN112000991A CN 112000991 A CN112000991 A CN 112000991A CN 202011166510 A CN202011166510 A CN 202011166510A CN 112000991 A CN112000991 A CN 112000991A
- Authority
- CN
- China
- Prior art keywords
- data
- local
- party
- multiparty
- member devices
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioethics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
Abstract
本说明书的实施例提供基于隐私保护的多方数据联合处理方法、装置及系统。每个成员设备具有本地隐私数据。在各个成员设备处,响应于用于对多个成员设备的本地隐私数据执行多方数据联合处理的数据处理请求,生成本地随机数,并且使用本地隐私数据在本地执行第一函数计算得到本地处理结果。多方数据联合处理是针对各个成员设备的本地隐私数据执行第二函数计算,并且第二函数计算可被表征为各个成员设备的第一函数计算的组合运算。多个成员设备使用各自的本地随机数和本地处理结果来执行多方安全计算得到多方数据联合处理结果,每个成员设备具有多方数据联合处理结果的多方数据联合处理结果分片。
Description
技术领域
本说明书实施例通常涉及数据处理领域,尤其涉及基于隐私保护的多方数据联合处理方法、多方数据联合处理装置以及多方数据联合处理系统。
背景技术
随着技术的发展,越来越多的业务应用场景需要使用多个数据拥有方的本地数据来进行多方数据联合处理,例如,使用机器学习模型的业务应用场景,比如,使用机器学习模型进行风险评估、人群识别、业务分类等。在机器学习模型的应用中,在比如模型预测或模型训练的应用场景下,需要使用多个数据拥有方的本地数据来联合进行模型预测处理得到模型预测结果。
由于各个数据拥有方的本地数据是隐私数据,需要进行数据隐私保护,从而使得如何在对各个数据拥有方的本地数据进行数据隐私保护的情况下实现多方数据联合处理,成为亟待解决的问题。
发明内容
鉴于上述,本说明书实施例提供一种基于隐私保护的多方数据联合处理方法、多方数据联合处理装置以及多方数据联合处理系统。利用该多方数据联合处理方法、多方数据联合处理装置及多方数据联合处理系统,可以在确保各个数据拥有方的本地数据的数据隐私安全的情况下实现多方数据联合处理。
根据本说明书实施例的一个方面,提供一种用于基于隐私保护的多方数据联合处理的方法,所述多方包括多个成员设备,每个成员设备具有本地隐私数据,所述方法包括:在各个成员设备处,响应于用于对所述多个成员设备的本地隐私数据执行多方数据联合处理的数据处理请求,生成本地随机数,并且使用本地隐私数据在本地执行第一函数计算得到本地处理结果,所述多方数据联合处理是针对各个成员设备的本地隐私数据执行第二函数计算,以及所述第二函数计算可被表征为各个成员设备的第一函数计算的组合运算;以及经由所述多个成员设备,使用各自的本地随机数和本地处理结果来执行多方安全计算得到多方数据联合处理结果,每个成员设备具有所述多方数据联合处理结果的多方数据联合处理结果分片。
可选地,在上述方面的一个示例中,所述本地隐私数据包括本地模型和业务对象的本地特征数据,所述多个成员设备的本地模型共同组成机器学习模型,所述多个成员设备的本地特征数据共同组成所述机器学习模型的模型特征数据,以及所述多方数据联合处理是所述机器学习模型的模型预测处理。
可选地,在上述方面的一个示例中,所述本地隐私数据是基于垂直切分的本地隐私数据或者基于水平切分的本地隐私数据。
可选地,在上述方面的一个示例中,所述机器学习模型包括逻辑回归模型或神经网络模型;以及所述业务对象包括以下之一:用户,商品,事件和关系。
可选地,在上述方面的一个示例中,经由所述多个成员设备,使用各自的本地随机
数和本地处理结果来执行多方安全计算得到多方数据联合处理结果包括:经由所述多个成
员设备,使用各自的本地随机数和本地处理结果来执行多方安全计算得到中间处理结果,
每个成员设备具有所述中间处理结果的中间处理结果分片,所述中间处理结果基于得到,m为所述多个成员设备的本地随机数之和;以及经由所述多个
成员设备,使用各自的本地随机数以及各自的中间处理结果分片来执行多方计算得到所述
多方数据联合处理结果,每个成员设备具有所述多方数据联合处理结果的多方数据联合处
理结果分片。
可选地,在上述方面的一个示例中,经由所述多个成员设备,使用各自的本地随机数以及各自的中间处理结果分片来执行多方计算得到所述多方数据联合处理结果包括:在各个成员设备处,分别计算各自的中间处理结果分片与各自的本地随机数之间的求和结果以及求差结果;经由所述多个成员设备使用各自的求和结果来进行多方求和得到多方求和结果;以及在各个成员设备处,分别将各自的求差结果除以所述多方求和结果得到各自的多方数据联合处理结果分片。
可选地,在上述方面的一个示例中,经由所述多个成员设备使用各自的求和结果来进行多方求和得到多方求和结果包括:经由所述多个成员设备使用各自的求和结果来进行多方安全求和得到多方求和结果。
可选地,在上述方面的一个示例中,所述多方安全计算包括下述多方安全计算中的一种:基于秘密共享的多方安全计算;基于同态加密的多方安全计算;基于不经意传输的多方安全计算;基于混淆电路的多方安全计算;和基于可信执行环境的多方安全计算。
根据本说明书的实施例的另一方面,提供一种用于基于隐私保护的多方数据联合处理的方法,所述多方包括多个成员设备,每个成员设备具有本地隐私数据,所述方法由一个成员设备执行,所述方法包括:响应于用于对所述多个成员设备的本地隐私数据执行多方数据联合处理的数据处理请求,生成本地随机数,并且使用本地隐私数据在本地执行第一函数计算得到本地处理结果,所述多方数据联合处理是针对各个成员设备的本地隐私数据执行第二函数计算,以及所述第二函数计算可被表征为各个成员设备的第一函数计算的组合运算;以及与其余成员设备一起,使用各自的本地随机数和本地处理结果来执行多方安全计算得到多方数据联合处理结果,每个成员设备具有所述多方数据联合处理结果的多方数据联合处理结果分片,每个其余成员设备的本地随机数由该其余成员设备生成,并且每个其余成员设备的本地处理结果由该其余成员设备使用本地隐私数据来在本地执行所述第一函数计算得到。
根据本说明书的实施例的另一方面,提供一种用于基于隐私保护的多方数据联合处理的装置,所述多方包括多个成员设备,每个成员设备具有本地隐私数据,所述装置应用于一个成员设备,所述装置包括:随机数生成单元,响应于用于对所述多个成员设备的本地隐私数据执行多方数据联合处理的数据处理请求,生成本地随机数,所述多方数据联合处理是针对各个成员设备的本地隐私数据执行第二函数计算,以及所述第二函数计算可被表征为各个成员设备的第一函数计算的组合运算;本地处理单元,使用本地隐私数据在本地执行所述第一函数计算得到本地处理结果;以及多方安全计算单元,与所述多个成员设备中的其余成员设备一起,使用各自的本地随机数和本地处理结果来执行多方安全计算得到多方数据联合处理结果,每个成员设备具有所述多方数据联合处理结果的多方数据联合处理结果分片,每个其余成员设备的本地随机数由该其余成员设备生成,并且每个其余成员设备的本地处理结果由该其余成员设备使用本地隐私数据在本地执行所述第一函数计算得到。
可选地,在上述方面的一个示例中,所述本地隐私数据包括本地模型和业务对象的本地特征数据,所述多个成员设备的本地模型共同组成机器学习模型,所述多个成员设备的本地特征数据共同组成所述机器学习模型的模型特征数据,以及所述多方数据联合处理是所述机器学习模型的模型预测处理。
可选地,在上述方面的一个示例中,所述多方安全计算单元包括:中间结果计算模
块,与所述多个成员设备中的其余成员设备一起,使用各自的本地随机数和本地处理结果
来执行多方安全计算得到中间处理结果,每个成员设备具有所述中间处理结果的中间处理
结果分片,所述中间处理结果基于得到,m为所述多个成员设备的本
地随机数之和;以及多方数据联合处理结果计算模块,与所述多个成员设备中的其余成员
设备一起,使用各自的本地随机数以及各自的中间处理结果分片来执行多方计算得到所述
多方数据联合处理结果,每个成员设备具有所述多方数据联合处理结果的多方数据联合处
理结果分片。
可选地,在上述方面的一个示例中,所述多方数据联合处理结果计算模块:计算中间处理结果分片与本地随机数之间的求和结果以及求差结果;与所述多个成员设备中的其余成员设备一起,使用各自的求和结果来进行多方求和得到多方求和结果;以及将本地计算出的求差结果除以所述多方求和结果得到所述多方数据联合处理结果分片。
根据本说明书的实施例的另一方面,提供一种用于基于隐私保护的多方数据联合处理的系统,包括:多个成员设备,每个成员设备具有本地隐私数据,并且包括如上所述的用于基于隐私保护的多方数据联合处理的装置。
根据本说明书的实施例的另一方面,提供一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的在成员设备处执行的多方数据联合处理方法。
根据本说明书的实施例的另一方面,提供一种机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的在成员设备处执行的多方数据联合处理方法。
附图说明
通过参照下面的附图,可以实现对于本说明书内容的本质和优点的进一步理解。在附图中,类似组件或特征可以具有相同的附图标记。
图1示出了根据本说明书的实施例的多方数据联合处理系统的架构示例示意图。
图2示出了根据本说明书的实施例的基于隐私保护的多方数据联合处理方法的流程图。
图3示出了根据本说明书的实施例的基于隐私保护的多方数据联合处理过程的一个示例的流程图。
图4示出了图3中的基于本地随机数以及中间处理结果分片的多方计算过程的一个示例的流程图。
图5示出了根据本说明书的实施例的用于基于隐私保护的多方数据联合处理的装置的方框图。
图6示出了根据本说明书的实施例的多方安全计算单元的一个实现示例的方框图。
图7示出了根据本说明书的实施例的用于实现在成员设备处执行的基于隐私保护的多方数据联合处理过程的电子设备的示意图。
具体实施方式
现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本说明书内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。例如,所描述的方法可以按照与所描述的顺序不同的顺序来执行,以及各个步骤可以被添加、省略或者组合。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
在一些业务应用场景中,会涉及多个数据拥有方,每个数据拥有方在本地收集本地隐私数据。在进行业务处理时,需要使用多个数据拥有方的本地数据来进行多方数据联合处理。例如,在使用机器学习模型来进行风险评估、人群识别、业务分类等的应用场景下,需要使用多个数据拥有方的本地隐私数据来联合进行模型预测处理得到模型预测结果。由于各个数据拥有方的本地数据是隐私数据,在进行多方数据联合处理时,需要进行数据隐私保护。
本说明书的实施例提供了一种基于隐私保护的多方数据联合处理方案。在该多方数据联合处理方案中,多方数据联合处理是针对各个成员设备的本地隐私数据执行第二函数计算,并且第二函数计算可被表征为各个成员设备的第一函数计算的组合运算。在进行多方数据联合处理时,响应于用于对多个成员设备的本地隐私数据执行多方数据联合处理的数据处理请求,在各个成员设备处生成本地随机数,并且使用本地隐私数据在本地执行第一函数计算得到本地处理结果。由于多方数据联合处理可以表征为各个成员设备处的第一函数计算的组合运算,从而可以通过多个成员设备使用各自的本地随机数和本地处理结果来执行多方安全计算,在确保各个成员设备的本地隐私数据安全的情况下,得到多方数据联合处理结果。
下面将参考附图来详细描述根据本说明书的实施例的基于隐私保护的多方数据联合处理方法、装置及系统。
图1示出了根据本说明书的实施例的多方数据联合处理系统100的架构示例示意图。
如图1所示,多方数据联合处理系统100包括多个成员设备110-1到110-N以及网络120。网络120的示例例如可以包括但不局限于互联网或局域网等。在图1的示例中,成员设备110-1到110-N经由网络120可通信地连接,由此彼此之间进行数据通信。在本说明书的其它实施例中,多方数据联合处理系统100可以不包括网络120,并且各个成员设备110-1到110-N之间直接可通信地连接。
各个成员设备110-1到110-N分别具有本地隐私数据,并且分别具有多方数据联合处理装置111-1到111-N。各个成员设备经由各自的多方数据联合处理装置来使用各自的本地隐私数据来进行多方数据联合处理,由此得到多方数据联合处理结果。所得到的多方数据联合处理结果被分为多个(N个)多方数据联合处理结果分片,每个成员设备具有一个多方数据联合处理结果分片。
在本说明书的实施例中,成员设备可以包括终端设备或服务端设备。所述服务器设备可以包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述终端设备可以包括但不限于:智能手机、个人电脑(personal computer,PC)、笔记本电脑、平板电脑、电子阅读器、网络电视、可穿戴设备等智能终端设备中的任一种。在本说明书的实施例中,术语“多个”指的是“两个或两个以上”。为了描述简单,在下面的描述中,以两个成员设备为例进行说明。
在本说明书中,各个成员设备110-1到110-N的本地隐私数据可以是各个成员设备在本地收集的数据,例如可以包括但不限于在本地收集的用户特征数据、业务处理数据、金融交易数据、商品交易数据、医疗健康数据等等。所述本地隐私数据例如可以应用于机器学习模型来进行模型预测、模型训练以及其它合适的多方数据联合处理。
图2示出了根据本说明书的实施例的基于隐私保护的多方数据联合处理方法200的流程图。
如图2所示,在210,响应于用于对多个成员设备的本地隐私数据执行多方数据联
合处理的数据处理请求,在各个成员设备i处,分别生成本地随机数。这里,数据处理请
求可以是从位于多方数据联合处理系统之外的第三方设备接收的,也可以是由多方数据联
合处理系统中的一个成员设备发起的。
在220,在各个成员设备处,使用本地隐私数据在本地执行第一函数计算得到本地处理结果。在本说明书的实施例中,多方数据联合处理可以是针对各个成员设备的本地隐私数据执行第二函数计算,并且第二函数计算可被表征为各个成员设备的第一函数计算的组合运算。此外,可选地,在一个示例中,组合运算可以例如是四则运算中的任何一种或多种运算的组合。
可选地,在一个示例中,本地隐私数据可以包括本地模型和业务对象的本地特征数据。多个成员设备的本地模型共同组成机器学习模型,并且多个成员设备的本地特征数据共同组成机器学习模型的模型特征数据。此外,多方数据联合处理例如可以是机器学习模型的模型预测处理。例如,多方数据联合处理可以是在使用机器学习模型进行模型预测或模型训练的情况下,基于多个成员设备的本地隐私数据进行的模型预测过程。可选地,在一个示例中,机器学习模型的示例可以包括逻辑回归模型或神经网络模型。此外,可选地,业务对象的示例可以包括以下之一:用户,商品,事件和关系。
例如,在一个示例中,在多方数据联合处理是机器学习模型的模型预测处理的情
况下,各个成员设备i处的第一函数运算可以为,其中,为成员设备i的本地模
型,为成员设备i的本地特征数据。此外,第二函数计算为激活函数,其中,N为成员设备总数。在本说明书的其它实施例中,第二函数计
算可以为其它形式的激活函数。
此外,可选地,在一个示例中,本地隐私数据可以是基于垂直切分的本地隐私数据
或者基于水平切分的本地隐私数据。在本说明书的实施例中,术语“水平切分”是指按照模
块/功能(或者某种指定规则)将数据样本集切分为多个数据子集,各个数据子集包含一部
分数据样本,并且每个数据子集中所包括的数据样本是完整数据样本,即,包括该数据样本
的所有特征数据。在水平切分的情形下,各个数据拥有方获取本地数据以形成本地数据样
本集,该本地数据样本集中所包含的每条数据都是完整的数据样本。在本说明书的实施例
中,术语“垂直切分”是指按照模块/功能(或者某种指定规则)来将数据样本集切分为多个
数据子集中,各个数据子集包含数据样本集中的每条数据样本的部分样本数据,所有数据
子集中所包含的部分样本数据构成该条完整数据样本。在一个例子中,假设存在两个数据
拥有方Alice和Bob,并且数据样本包括特征数据、,则经过垂直切分后,数据拥有方
Alice拥有该数据样本的,以及数据拥有方Bob拥有该数据样本的。在垂直切分的情
形下,各个数据拥有方获取本地数据以形成本地数据样本集,该本地数据样本集中所包含
的每条数据不是完整的数据样本,所有数据拥有方的数据样本集的数据组合在一起构成完
整数据样本。
回到图2,在230,经由多个成员设备,使用各自的本地随机数和本地处理结果来执行多方安全计算得到多方数据联合处理结果,每个成员设备具有所述多方数据联合处理结果的多方数据联合处理结果分片。例如,针对第二函数计算所表征成的第一函数计算的组合计算,首先,在各个成员设备处计算出该组合计算中的可在本地计算出的部分结果,然后使用本地可计算出的部分结果来在多个成员设备之间执行多方安全计算得到多方数据联合处理结果。
图3示出了根据本说明书的实施例的基于隐私保护的多方数据联合处理过程300
的一个示例的流程图。在图3示出的示例中,成员设备包括两个成员设备110-1和110-2。多
方数据联合处理是机器学习模型的模型预测处理,各个成员设备i处的第一函数运算为,其中,为该成员设备i的本地模型,为该成员设备i的本地特征数据。此外,第二
函数计算为激活函数,其中,N为成员设备总数。
在320,在成员设备110-1处,使用本地模型和本地特征数据来在本地执行
第一函数计算,得到本地处理结果。在成员设备110-2处,使用本地模型和本地特征数据来在本地执行第一函数计算,得到本地处理结果。
在330,成员设备110-1和110-2使用各自的本地随机数、和本地处理结果、来执行多方安全计算得到中间处理结果。这里,m为多方
成员设备的本地随机数之和。根据上面的公式分解,可以在成员设备110-1和110-2之间,使
用多方安全计算来分别计算出(以及。在上面的每个计算处理中,前一括号内的计算是在成员设
备110-1处本地计算出,以及后一括号内的计算在成员设备110-2本地计算出,然后使用各
个成员设备的本地计算结果来执行多方安全计算得到最后的乘法计算结果。此外,如上按
照多方安全计算出来的中间处理结果被分为多个中间处理结果分片,每个成员设备具有中
间处理结果的一个中间处理结果分片。例如,成员设备110-1具有中间处理结果分片,以及成员设备110-2具有中间处理结果分片。
可选地,在一个示例中,多方安全计算可以包括但不限于下述多方安全计算中的一种:基于秘密共享的多方安全计算;基于同态加密的多方安全计算;基于不经意传输的多方安全计算;基于混淆电路的多方安全计算;和基于可信执行环境的多方安全计算。
在340,成员设备110-1和110-2使用各自的本地随机数以及各自的中间处理结果分片来执行多方计算得到多方数据联合处理结果,每个成员设备具有多方数据联合处理结果的一个多方数据联合处理结果分片。
图4示出了图3中的基于本地随机数以及中间处理结果分片的多方计算过程的一个实现示例400的流程图。
如图4所示,在410,在成员设备110-1处,计算中间处理结果分片与本地随机数之间的求和结果,以及计算中间处理结果分片与本地随机数之间的求差结果。在成员设备110-2处,计算中间处理结果分片与本地随机数之间的求和结果,并且计算中间处理结果分片与本地随机数之间的求差结果。
在如上得到多方求和结果后,在430,在各个成员设备(例如,成员设备110-1和
110-2)处,分别将各自的求差结果除以多方求和结果得到各自的多方数据联合处理结果分
片。例如,在成员设备110-1处,得到处理结果分片。在成员设
备110-2处,得到处理结果分片。
此外,要说明的是,在图3和图4的示例中是以2个成员设备为例进行说明。在成员设备包括多于2个成员设备的情况下,按照相同的方式进行多方安全计算以及多方求和计算。
如上参照图1到图4,对根据本说明书的实施例的基于隐私保护的多方数据联合处理方法进行了描述。
利用上述多方数据联合处理方法,针对可以表征为各个成员设备处的本地计算的组合运算的多方数据联合处理,通过各个成员设备处本地使用各自的本地隐私数据进行本地计算,并且使用本地计算结果来进行多方安全计算来实现多方数据联合处理,可以在确保各个成员设备处的本地隐私数据的数据隐私安全的情况下,实现多方数据联合处理。
图5示出了根据本说明书的实施例的用于基于隐私保护的多方数据联合处理的装置(下文中称为“多方数据联合处理装置”)500的方框图。如图5所示,多方数据联合处理装置500包括随机数生成单元510、本地处理单元520和多方安全计算单元530。
随机数生成单元510被配置为响应于用于对多个成员设备的本地隐私数据执行多方数据联合处理的数据处理请求,生成本地随机数。多方数据联合处理是针对各个成员设备的本地隐私数据执行第二函数计算,以及第二函数计算可被表征为各个成员设备的第一函数计算的组合运算。
本地处理单元520被配置为使用本地隐私数据在本地执行第一函数计算得到本地处理结果。
多方安全计算单元530被配置为与其余成员设备一起,使用各自的本地随机数和本地处理结果来执行多方安全计算得到多方数据联合处理结果,每个成员设备具有所述多方数据联合处理结果的多方数据联合处理结果分片。此外,每个其余成员设备的本地随机数由该其余成员设备生成,并且每个其余成员设备的本地处理结果由该其余成员设备使用本地隐私数据在本地执行第一函数计算得到。
此外,可选地,在一个示例中,本地隐私数据可以包括本地模型和业务对象的本地特征数据。多个成员设备的本地模型共同组成机器学习模型,并且多个成员设备的本地特征数据共同组成机器学习模型的模型特征数据。多方数据联合处理是机器学习模型的模型预测处理。
图6示出了根据本说明书的实施例的多方安全计算单元600的一个实现示例的方
框图。在图6中示出的示例中,第i个成员设备的第一函数计算为,其中,为第i个
成员设备的本地模型,为第i个成员设备的本地特征数据,以及第二函数计算为激活函数,其中,N为成员设备总数。
如图6所示,多方安全计算单元600包括中间结果计算模块610和多方数据联合处理结果计算模块620。
中间结果计算模块610被配置为与其余成员设备一起,使用各自的本地随机数和
本地处理结果来执行多方安全计算得到中间处理结果,每个成员设备具有所述中间处理结
果的中间处理结果分片,所述中间处理结果基于得到,m为多个成员
设备的本地随机数之和。
多方数据联合处理结果计算模块620被配置为与其余成员设备一起,使用各自的本地随机数以及各自的中间处理结果分片来执行多方计算得到所述多方数据联合处理结果,每个成员设备具有多方数据联合处理结果的多方数据联合处理结果分片。
此外,可选地,多方数据联合处理结果计算模块620可以被进一步配置为计算中间处理结果分片与本地随机数之间的求和结果以及求差结果;与其余成员设备一起,使用各自的求和结果来进行多方求和得到多方求和结果;以及将本地计算出的求差结果除以多方求和结果得到多方数据联合处理结果分片。
如上参照图1到图6,对根据本说明书实施例的基于隐私保护的多方数据联合处理方法和多方数据联合处理装置进行了描述。上面的多方数据联合处理装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。
图7示出了根据本说明书的实施例的用于实现在成员设备处执行的基于隐私保护的多方数据联合处理过程的电子设备700的示意图。如图7所示,电子设备700可以包括至少一个处理器710、存储器(例如,非易失性存储器)720、内存730和通信接口740,并且至少一个处理器710、存储器720、内存730和通信接口740经由总线760连接在一起。至少一个处理器710执行在存储器中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在存储器中存储计算机可执行指令,其当执行时使得至少一个处理器710:响应于用于对多个成员设备的本地隐私数据执行多方数据联合处理的数据处理请求,生成本地随机数,并且使用本地隐私数据在本地执行第一函数计算得到本地处理结果,多方数据联合处理是针对各个成员设备的本地隐私数据执行第二函数计算,以及第二函数计算可被表征为各个成员设备的第一函数计算的组合运算;以及与其余成员设备一起,使用各自的本地随机数和本地处理结果来执行多方安全计算得到多方数据联合处理结果,每个成员设备具有多方数据联合处理结果的多方数据联合处理结果分片,每个其余成员设备的本地随机数由该其余成员设备生成,并且每个其余成员设备的本地处理结果由该其余成员设备使用本地隐私数据来在本地执行第一函数计算得到。
应该理解,在存储器中存储的计算机可执行指令当执行时使得至少一个处理器710进行本说明书的各个实施例中以上结合图1-6描述的各种操作和功能。
根据一个实施例,提供了一种比如机器可读介质(例如,非暂时性机器可读介质)的程序产品。机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本说明书的各个实施例中以上结合图1-6描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。
可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上或云上下载程序代码。
本领域技术人员应当理解,上面公开的各个实施例可以在不偏离发明实质的情况下做出各种变形和修改。因此,本发明的保护范围应当由所附的权利要求书来限定。
需要说明的是,上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的,可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理实体实现,或者,有些单元可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
以上各实施例中,硬件单元或模块可以通过机械方式或电气方式实现。例如,一个硬件单元、模块或处理器可以包括永久性专用的电路或逻辑(如专门的处理器,FPGA或ASIC)来完成相应操作。硬件单元或处理器还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。
上面结合附图阐述的具体实施方式描述了示例性实施例,但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。
Claims (18)
1.一种用于基于隐私保护的多方数据联合处理的方法,所述多方包括多个成员设备,每个成员设备具有本地隐私数据,所述方法包括:
在各个成员设备处,响应于用于对所述多个成员设备的本地隐私数据执行多方数据联合处理的数据处理请求,生成本地随机数,并且使用本地隐私数据在本地执行第一函数计算得到本地处理结果,所述多方数据联合处理是针对各个成员设备的本地隐私数据执行第二函数计算,以及所述第二函数计算可被表征为各个成员设备的第一函数计算的组合运算;以及
经由所述多个成员设备,使用各自的本地随机数和本地处理结果来执行多方安全计算得到多方数据联合处理结果,每个成员设备具有所述多方数据联合处理结果的多方数据联合处理结果分片。
2.如权利要求1所述的方法,其中,所述本地隐私数据包括本地模型和业务对象的本地特征数据,所述多个成员设备的本地模型共同组成机器学习模型,所述多个成员设备的本地特征数据共同组成所述机器学习模型的模型特征数据,以及所述多方数据联合处理是所述机器学习模型的模型预测处理。
3.如权利要求2所述的方法,其中,所述本地隐私数据是基于垂直切分的本地隐私数据或者基于水平切分的本地隐私数据。
4.如权利要求2所述的方法,其中,所述机器学习模型包括逻辑回归模型或神经网络模型;以及所述业务对象包括以下之一:用户,商品,事件和关系。
7.如权利要求6所述的方法,其中,经由所述多个成员设备,使用各自的本地随机数以及各自的中间处理结果分片来执行多方计算得到所述多方数据联合处理结果包括:
在各个成员设备处,分别计算各自的中间处理结果分片与各自的本地随机数之间的求和结果以及求差结果;
经由所述多个成员设备使用各自的求和结果来进行多方求和得到多方求和结果;以及
在各个成员设备处,分别将各自的求差结果除以所述多方求和结果得到各自的多方数据联合处理结果分片。
8.如权利要求7所述的方法,其中,经由所述多个成员设备使用各自的求和结果来进行多方求和得到多方求和结果包括:
经由所述多个成员设备使用各自的求和结果来进行多方安全求和得到多方求和结果。
9.如权利要求1到6中任一所述的方法,其中,所述多方安全计算包括下述多方安全计算中的一种:
基于秘密共享的多方安全计算;
基于同态加密的多方安全计算;
基于不经意传输的多方安全计算;
基于混淆电路的多方安全计算;和
基于可信执行环境的多方安全计算。
10.一种用于基于隐私保护的多方数据联合处理的方法,所述多方包括多个成员设备,每个成员设备具有本地隐私数据,所述方法由一个成员设备执行,所述方法包括:
响应于用于对所述多个成员设备的本地隐私数据执行多方数据联合处理的数据处理请求,生成本地随机数,并且使用本地隐私数据在本地执行第一函数计算得到本地处理结果,所述多方数据联合处理是针对各个成员设备的本地隐私数据执行第二函数计算,以及所述第二函数计算可被表征为各个成员设备的第一函数计算的组合运算;以及
与所述多个成员设备中的其余成员设备一起,使用各自的本地随机数和本地处理结果来执行多方安全计算得到多方数据联合处理结果,每个成员设备具有所述多方数据联合处理结果的多方数据联合处理结果分片,每个其余成员设备的本地随机数由该其余成员设备生成,并且每个其余成员设备的本地处理结果由该其余成员设备使用本地隐私数据来在本地执行所述第一函数计算得到。
11.一种用于基于隐私保护的多方数据联合处理的装置,所述多方包括多个成员设备,每个成员设备具有本地隐私数据,所述装置应用于一个成员设备,所述装置包括:
随机数生成单元,响应于用于对所述多个成员设备的本地隐私数据执行多方数据联合处理的数据处理请求,生成本地随机数,所述多方数据联合处理是针对各个成员设备的本地隐私数据执行第二函数计算,以及所述第二函数计算可被表征为各个成员设备的第一函数计算的组合运算;
本地处理单元,使用本地隐私数据在本地执行所述第一函数计算得到本地处理结果;以及
多方安全计算单元,与所述多个成员设备中的其余成员设备一起,使用各自的本地随机数和本地处理结果来执行多方安全计算得到多方数据联合处理结果,每个成员设备具有所述多方数据联合处理结果的多方数据联合处理结果分片,每个其余成员设备的本地随机数由该其余成员设备生成,并且每个其余成员设备的本地处理结果由该其余成员设备使用本地隐私数据在本地执行所述第一函数计算得到。
12.如权利要求11所述的装置,其中,所述本地隐私数据包括本地模型和业务对象的本地特征数据,所述多个成员设备的本地模型共同组成机器学习模型,所述多个成员设备的本地特征数据共同组成所述机器学习模型的模型特征数据,以及所述多方数据联合处理是所述机器学习模型的模型预测处理。
15.如权利要求14所述的装置,其中,所述多方数据联合处理结果计算模块:
计算中间处理结果分片与本地随机数之间的求和结果以及求差结果;
与所述多个成员设备中的其余成员设备一起,使用各自的求和结果来进行多方求和得到多方求和结果;以及
将本地计算出的求差结果除以所述多方求和结果得到所述多方数据联合处理结果分片。
16.一种用于基于隐私保护的多方数据联合处理的系统,包括:
多个成员设备,每个成员设备具有本地隐私数据,并且包括如权利要求11 到15中任一所述的装置。
17.一种电子设备,包括:
至少一个处理器,以及
与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如权利要求10所述的方法。
18.一种机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如权利要求10所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011166510.8A CN112000991B (zh) | 2020-10-27 | 2020-10-27 | 多方数据联合处理方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011166510.8A CN112000991B (zh) | 2020-10-27 | 2020-10-27 | 多方数据联合处理方法、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112000991A true CN112000991A (zh) | 2020-11-27 |
CN112000991B CN112000991B (zh) | 2021-02-09 |
Family
ID=73475207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011166510.8A Active CN112000991B (zh) | 2020-10-27 | 2020-10-27 | 多方数据联合处理方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112000991B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329072A (zh) * | 2020-12-31 | 2021-02-05 | 支付宝(杭州)信息技术有限公司 | 一种基于安全多方计算的模型联合训练方法 |
CN112380404A (zh) * | 2020-12-14 | 2021-02-19 | 支付宝(杭州)信息技术有限公司 | 数据过滤方法、装置及系统 |
CN112613076A (zh) * | 2021-01-22 | 2021-04-06 | 支付宝(杭州)信息技术有限公司 | 保护隐私的多方数据处理的方法、装置和系统 |
CN112818338A (zh) * | 2021-01-22 | 2021-05-18 | 支付宝(杭州)信息技术有限公司 | 一种程序运行方法及系统 |
CN112926051A (zh) * | 2021-03-25 | 2021-06-08 | 支付宝(杭州)信息技术有限公司 | 多方安全计算方法和装置 |
CN113094745A (zh) * | 2021-03-31 | 2021-07-09 | 支付宝(杭州)信息技术有限公司 | 基于隐私保护的数据变换方法、装置和服务器 |
CN113095430A (zh) * | 2021-04-26 | 2021-07-09 | 北京瑞莱智慧科技有限公司 | 可保护隐私的模型更新方法、对象识别方法、系统、装置、介质和设备 |
WO2023016170A1 (zh) * | 2021-08-10 | 2023-02-16 | 支付宝(杭州)信息技术有限公司 | 基于容器集群对联合计算多方进行服务校验的方法及系统 |
CN116108494A (zh) * | 2023-04-12 | 2023-05-12 | 蓝象智联(杭州)科技有限公司 | 一种保护隐私的多方联合数据统计方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110991655A (zh) * | 2019-12-17 | 2020-04-10 | 支付宝(杭州)信息技术有限公司 | 多方联合进行模型数据处理的方法及装置 |
CN111026359A (zh) * | 2019-12-17 | 2020-04-17 | 支付宝(杭州)信息技术有限公司 | 多方联合判定隐私数据的数值范围的方法和装置 |
CN111523145A (zh) * | 2020-07-03 | 2020-08-11 | 支付宝(杭州)信息技术有限公司 | 针对隐私数据进行安全运算的方法和装置 |
-
2020
- 2020-10-27 CN CN202011166510.8A patent/CN112000991B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110991655A (zh) * | 2019-12-17 | 2020-04-10 | 支付宝(杭州)信息技术有限公司 | 多方联合进行模型数据处理的方法及装置 |
CN111026359A (zh) * | 2019-12-17 | 2020-04-17 | 支付宝(杭州)信息技术有限公司 | 多方联合判定隐私数据的数值范围的方法和装置 |
CN111523145A (zh) * | 2020-07-03 | 2020-08-11 | 支付宝(杭州)信息技术有限公司 | 针对隐私数据进行安全运算的方法和装置 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112380404B (zh) * | 2020-12-14 | 2021-05-11 | 支付宝(杭州)信息技术有限公司 | 数据过滤方法、装置及系统 |
CN112380404A (zh) * | 2020-12-14 | 2021-02-19 | 支付宝(杭州)信息技术有限公司 | 数据过滤方法、装置及系统 |
CN112329072B (zh) * | 2020-12-31 | 2021-03-30 | 支付宝(杭州)信息技术有限公司 | 一种基于安全多方计算的模型联合训练方法 |
CN112329072A (zh) * | 2020-12-31 | 2021-02-05 | 支付宝(杭州)信息技术有限公司 | 一种基于安全多方计算的模型联合训练方法 |
CN112613076B (zh) * | 2021-01-22 | 2021-10-01 | 支付宝(杭州)信息技术有限公司 | 保护隐私的多方数据处理的方法、装置和系统 |
CN112818338A (zh) * | 2021-01-22 | 2021-05-18 | 支付宝(杭州)信息技术有限公司 | 一种程序运行方法及系统 |
CN112613076A (zh) * | 2021-01-22 | 2021-04-06 | 支付宝(杭州)信息技术有限公司 | 保护隐私的多方数据处理的方法、装置和系统 |
CN112926051A (zh) * | 2021-03-25 | 2021-06-08 | 支付宝(杭州)信息技术有限公司 | 多方安全计算方法和装置 |
CN113094745A (zh) * | 2021-03-31 | 2021-07-09 | 支付宝(杭州)信息技术有限公司 | 基于隐私保护的数据变换方法、装置和服务器 |
CN113095430A (zh) * | 2021-04-26 | 2021-07-09 | 北京瑞莱智慧科技有限公司 | 可保护隐私的模型更新方法、对象识别方法、系统、装置、介质和设备 |
WO2023016170A1 (zh) * | 2021-08-10 | 2023-02-16 | 支付宝(杭州)信息技术有限公司 | 基于容器集群对联合计算多方进行服务校验的方法及系统 |
CN116108494A (zh) * | 2023-04-12 | 2023-05-12 | 蓝象智联(杭州)科技有限公司 | 一种保护隐私的多方联合数据统计方法 |
CN116108494B (zh) * | 2023-04-12 | 2023-06-20 | 蓝象智联(杭州)科技有限公司 | 一种保护隐私的多方联合数据统计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112000991B (zh) | 2021-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112000991B (zh) | 多方数据联合处理方法、装置及系统 | |
CN111523673B (zh) | 模型训练方法、装置及系统 | |
US20200143079A1 (en) | Privacy-preserving visual recognition via adversarial learning | |
US20180115426A1 (en) | Systems and methods for providing a universal decentralized solution for verification of users with cross-verification features | |
CN111061963B (zh) | 基于多方安全计算的机器学习模型训练及预测方法、装置 | |
CN111062487B (zh) | 基于数据隐私保护的机器学习模型特征筛选方法及装置 | |
CN112052942B (zh) | 神经网络模型训练方法、装置及系统 | |
CN111079939B (zh) | 基于数据隐私保护的机器学习模型特征筛选方法及装置 | |
CN112580826B (zh) | 业务模型训练方法、装置及系统 | |
CN112597540B (zh) | 基于隐私保护的多重共线性检测方法、装置及系统 | |
CN112132270B (zh) | 基于隐私保护的神经网络模型训练方法、装置及系统 | |
Xu et al. | Secure and verifiable inference in deep neural networks | |
CN112101531B (zh) | 基于隐私保护的神经网络模型训练方法、装置及系统 | |
CN110826420A (zh) | 人脸识别模型的训练方法及装置 | |
Bisogni et al. | ECB2: A novel encryption scheme using face biometrics for signing blockchain transactions | |
CN111741020A (zh) | 基于数据隐私保护的公共数据集确定方法、装置及系统 | |
CN110929887B (zh) | 逻辑回归模型训练方法、装置及系统 | |
AU2018100478A4 (en) | Systems and methods for providing a universal decentralized solution for verification of users with cross-verification features | |
CN111523556A (zh) | 模型训练方法、装置及系统 | |
Tayyab et al. | Cryptographic based secure model on dataset for deep learning algorithms | |
Karri | Secure robot face recognition in cloud environments | |
US20230385446A1 (en) | Privacy-preserving clustering methods and apparatuses | |
CN112598127A (zh) | 联邦学习模型训练方法和装置、电子设备、介质和产品 | |
CN111738453B (zh) | 基于样本加权的业务模型训练方法、装置及系统 | |
CN112183757A (zh) | 模型训练方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |