CN112487489A - 保护隐私的联合数据处理方法及装置 - Google Patents

保护隐私的联合数据处理方法及装置 Download PDF

Info

Publication number
CN112487489A
CN112487489A CN202110160210.7A CN202110160210A CN112487489A CN 112487489 A CN112487489 A CN 112487489A CN 202110160210 A CN202110160210 A CN 202110160210A CN 112487489 A CN112487489 A CN 112487489A
Authority
CN
China
Prior art keywords
result
node
order
platform
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110160210.7A
Other languages
English (en)
Other versions
CN112487489B (zh
Inventor
陈超超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202110160210.7A priority Critical patent/CN112487489B/zh
Publication of CN112487489A publication Critical patent/CN112487489A/zh
Application granted granted Critical
Publication of CN112487489B publication Critical patent/CN112487489B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/38Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
    • G06F7/48Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
    • G06F7/52Multiplying; Dividing
    • G06F7/523Multiplying only

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Algebra (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供一种保护隐私的联合数据处理方法及装置,在联合数据处理方法中,确定第一节点的第一组邻居节点。基于第一组邻居节点的k‑1阶向量的第一分片,和其它n‑1个平台确定的其它n‑1组邻居节点的k‑1阶向量的对应分片,采用第一多方安全计算MPC方法进行聚合运算,得到第一节点的n组邻居节点的k‑1阶向量的聚合结果的第一结果分片。将第一节点的k‑1阶向量的第一分片与第一结果分片进行整合,得到对应于第一平台的第一整合结果。基于第一整合结果以及第一平台拥有的第k阶权重矩阵,以及其它n‑1个平台获取的其它整合结果和拥有的第k阶权重矩阵,采用第二MPC方法进行乘法运算,得到第一节点的k阶向量的第一分片。

Description

保护隐私的联合数据处理方法及装置
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种保护隐私的联合数据处理方法及装置。
背景技术
关系网络图是对现实世界中实体之间的关系的描述,目前广泛地应用于各种计算机信息处理中。一般地,关系网络图包含一个节点集合和一个边集合,节点表示现实世界中的实体,边表示现实世界中实体之间的联系。例如,在社交网络中,人就是实体,人和人之间的关系或联系就是边。
在许多情况下,希望将关系网络图中的每个节点(实体)用多维空间中的向量来表示,也就是将各个节点映射到一个多维空间中,用多维空间中的点代表图中的节点。多维空间可以是2维、3维空间,也可以是更高维空间。用多维空间的坐标来表达图中的节点,可以应用于计算节点和节点之间的相似度,发现图中的社团结构,预测未来可能形成的边联系,以及对图进行可视化等。将图中的节点映射到多维空间的过程称为图嵌入。
传统技术中,图嵌入是由单独的机构或平台来执行。然而,在实际应用中,为进行某种预测(比如,风险识别)或者进行安全计算等,通常需要结合多平台或者多机构的关系网络图的信息。因此,就需要提供一种能够在保护各平台数据安全的情况下,多平台联合进行图嵌入处理的方案。
发明内容
本说明书一个或多个实施例描述了一种保护隐私的联合数据处理方法及装置,可以在保证各平台的数据安全的情况下,联合进行数据处理。
第一方面,提供了一种保护隐私的联合数据处理方法,包括:
确定所述第一节点在所述第一关系网络图中的第一组邻居节点;
基于所述第一组邻居节点的k-1阶向量的第一分片,和其它n-1个平台针对所述第一节点确定的其它n-1组邻居节点的k-1阶向量的对应分片,采用第一多方安全计算MPC方法进行聚合运算,得到所述第一节点的n组邻居节点的k-1阶向量的聚合结果的第一结果分片;
将所述第一节点的k-1阶向量的第一分片与所述第一结果分片进行整合,得到对应于所述第一平台的第一整合结果;
基于所述第一整合结果以及所述第一平台拥有的第k阶权重矩阵,以及其它n-1个平台获取的其它整合结果和拥有的第k阶权重矩阵,采用第二MPC方法进行乘法运算,得到所述第一节点的k阶向量的第一分片。
第二方面,提供了一种保护隐私的联合数据处理装置,包括:
确定单元,用于确定所述第一节点在所述第一关系网络图中的第一组邻居节点;
聚合运算单元,用于基于所述第一组邻居节点的k-1阶向量的第一分片,和其它n-1个平台针对所述第一节点确定的其它n-1组邻居节点的k-1阶向量的对应分片,采用第一多方安全计算MPC方法进行聚合运算,得到所述第一节点的n组邻居节点的k-1阶向量的聚合结果的第一结果分片;
整合单元,用于将所述第一节点的k-1阶向量的第一分片与所述第一结果分片进行整合,得到对应于所述第一平台的第一整合结果;
乘法运算单元,用于基于所述第一整合结果以及所述第一平台拥有的第k阶权重矩阵,以及其它n-1个平台获取的其它整合结果和拥有的第k阶权重矩阵,采用第二MPC方法进行乘法运算,得到所述第一节点的k阶向量的第一分片。
第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述第一方面的方法。
第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述第一方面的方法。
本说明书一个或多个实施例提供的保护隐私的联合数据处理方法及装置,每个平台通过采用多方安全计算方法,联合其它平台对其维护的关联网络图中的各节点进行多级向量嵌入,其中在任意的第一节点的k级向量嵌入中,每个平台仅获取到第一节点k阶向量的一个分片。由此,可以避免在多平台联合进行图嵌入处理的过程中,各平台的隐私数据泄露的问题。也就是说,本说明书提供的方案,可以实现在保证各平台的数据安全的情况下,联合进行图嵌入处理。
附图说明
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书提供的关系网络图示意图;
图2为本说明书提供的一个实施例的实施场景示意图;
图3为本说明书一个实施例提供的保护隐私的联合数据处理方法流程图;
图4为本说明书一个实施例提供的保护隐私的联合数据处理装置示意图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1为本说明书提供的关系网络图示意图。如图1所示,该关系网络图可以包括多个节点,在这些节点中,具有关联关系的节点之间用边进行连接。通过边进行连接的节点,称为邻居节点。在一个例子中,图1中的节点表示社交网络中的人或用户,两个节点之间通过边连接起来,即标识对应的两个用户存在社交上的关联,例如转账、留言、通讯等等。
需要理解,在图1中的关系网络图中,为了示出各节点以及节点间的连接关系,而示意性示出各个节点,此时节点位置仅是出于示意,而不具有实际的意义和信息量。而通过图嵌入的算法,可以为各个节点赋予有意义的嵌入向量。
已经存在一些图嵌入的算法,在已知关系网络图的拓扑结构的情况下,将其中节点映射为多维空间的向量(即嵌入向量)。在多数图嵌入算法中,为了能得到每个节点的嵌入向量,都会在计算时考虑其关联关系,就是考虑其邻居节点。需要说明,这里的邻居节点不仅包括与当前节点直接相连的邻居节点,也就是一阶邻居节点,还会考虑邻居节点的邻居节点,也就是当前节点的二阶邻居节点,甚至更高阶邻居节点。以图1为例来说,在获取节点7的嵌入向量时,可以同时考虑节点1、节点2、节点3、节点8和节点9。其中,节点3、节点8和节点9为节点7的一阶邻居节点,节点1和节点2为节点7的二阶邻居节点。
具体地,在进行图嵌入时,主要执行如下两个步骤:第一,生成初阶向量。比如,可以是基于节点所代表的对象的属性特征,确定节点的初阶向量。再比如,也可以是随机生成初阶向量。第二,针对各节点进行多级向量嵌入。以节点v为例来说,在进行第k级向量嵌入之后,其对应的k阶向量的计算公式可以表示为:
Figure DEST_PATH_IMAGE001
(公式1)
其中, N(v)为节点v的邻居节点集合,
Figure 262875DEST_PATH_IMAGE002
为节点v的邻居节点u的k-1阶向量,AGGk为第k级向量嵌入使用的聚合函数,用于对各邻居节点的k-1阶向量进行聚合,这里的聚合例如可以为加和、求平均以及池化(pooling)等。
Figure DEST_PATH_IMAGE003
为各邻居节点的k-1阶向量的聚合结果,
Figure 852119DEST_PATH_IMAGE004
为节点v的k-1阶向量,CONCAT()为整合函数,Wk为第k级向量嵌入使用的权重矩阵,
Figure DEST_PATH_IMAGE005
为节点v的k阶向量。
应理解,上述是某一平台或机构的图嵌入的处理步骤。在许多情况下,为进行某种预测(比如,风险识别)或者进行安全计算,可能需要多平台联合进行图嵌入处理。
图2为本说明书提供的一个实施例的实施场景示意图。图2中,平台1-平台n分别维护n个关系网络图,并分别拥有用于对所维护的关系网络图进行嵌入处理的各阶权重矩阵。图2中,n个平台中的每个平台可以联合其它n-1个平台进行图嵌入处理,该图嵌入处理包括针对所维护的关系网络图中各节点执行多级向量嵌入。其中,n为正整数。
以上述n个平台中的任意的第一平台为例来说,其针对所维护的第一关系网络图中任意的第一节点执行第k级向量嵌入包括:确定第一节点在第一关系网络图中的第一组邻居节点。基于第一组邻居节点的k-1阶向量的第一分片,和其它n-1个平台针对第一节点确定的其它n-1组邻居节点的k-1阶向量的对应分片,采用第一多方安全计算MPC方法进行聚合运算,得到第一节点的n组邻居节点的k-1阶向量的聚合结果的第一结果分片。将第一节点的k-1阶向量的第一分片与第一结果分片进行整合,得到对应于第一平台的第一整合结果。基于第一整合结果以及第一平台拥有的第k阶权重矩阵,以及其它n-1个平台获取的其它整合结果和拥有的第k阶权重矩阵,采用第二MPC方法进行乘法运算,得到第一节点的k阶向量的第一分片。
由此可见,在本说明书实施例提供的联合数据处理方法中,在多平台联合进行图嵌入处理时,每个平台仅获取到各节点的各阶向量的一个分片,由此,可以避免在多平台联合进行图嵌入处理的过程中,各平台的隐私数据泄露的问题。
图3为本说明书一个实施例提供的保护隐私的联合数据处理方法流程图。需要说明,该方法涉及针对n个平台各自所维护的各关系网络图中各节点的多级向量嵌入,图3仅示出任意的第一平台针对所维护的第一关系网络图中任意的第一节点的第k级向量嵌入,其中k为正整数,且k≥2。其中第1级向量嵌入也称为初级向量嵌入。具体的初级向量嵌入后续说明。
第一节点的其它级向量嵌入、其它节点的各级向量嵌入以及其它关系网络图中各节点的各级向量嵌入,可以参见该第一节点的第k级向量嵌入。可以理解,在针对n个平台各自所维护的各关系网络图中各节点执行多级向量嵌入后,也即在多平台联合进行图嵌入处理之后,n个平台可以拥有各自所维护的关系网络图中各节点的各阶向量的对应分片,进而可以基于各关系网络图中各节点的各阶向量的对应分片,联合进行某种预测(比如,风险识别)或者进行安全计算等。
以下先对初级向量嵌入进行说明。具体地,在第一平台执行图3所示的方法之前,可以先执行如下的初级向量嵌入:获取第一节点所代表的对象的属性特征,根据该属性特征确定第一节点的初阶向量的第一分片。该第一分片可以为d维向量,其中,d为要映射的多维空间的维数。
本说明书所述的关系网络图中的每个节点可以代表一个对象,该对象可以具有属性特征。以上述对象为用户为例来说,对象的属性特征可以包括但不限于用户注册时长以及用户注册信息(例如年龄、职业、收入等)。
类似的,第一平台还可以确定第一关系网络图中其它节点的初阶向量的第一分片,以及其它n-1个平台可以确定其它关系网络图中各节点的初阶向量的对应分片。
当然,在实际应用中,当某关系网络图中的某个节点所代表的对象不具有属性特征时,也可以随机生成d维向量作为该节点的初阶向量的对应分片,本说明书对此不作限定。
在各平台执行完成初级向量嵌入之后,也即在各平台确定出各自所维护的关系网络图中各节点的初阶向量的对应分片之后,就可以执行图3所示的方法。图3中,该方法可以包括:
步骤302,确定第一节点在第一关系网络图中的第一组邻居节点。
在本说明书实施例中,第一平台所维护的第一关系网络图可以与其它n-1个平台所维护的其它关系网络图具有相同数目个节点,但各关系网络图中同一节点所代表的对象的属性特征以及节点之间的连接关系可以不同。应理解,本说明书实施例提供的方案正是为了聚合不同平台所维护的各关系网络图中各节点的属性特征以及连接关系,以便于执行某种预测。
需要说明,上述第一组邻居节点至少包括第一节点在第一关系网络图中一阶邻居节点,此外还可以包括二阶邻居节点,甚至更高阶邻居节点。
步骤304,基于第一组邻居节点的k-1阶向量的第一分片,和其它n-1个平台针对第一节点确定的其它n-1组邻居节点的k-1阶向量的对应分片,采用第一多方安全计算(Secure Multi-Party Computation,MPC)方法进行聚合运算,得到第一节点的n组邻居节点的k-1阶向量的聚合结果的第一结果分片。
需要说明,由于各平台所维护的关系网络图中节点之间的连接关系可以不同,从而上述n组邻居节点中的邻居节点可不同。
上述第一多方安全计算方法可以包括但不限于秘密分享、混淆电路以及同态加密中的任一种。以秘密分享为例来说,上述采用第一MPC方法进行聚合运算可以包括:步骤a,对第一组邻居节点的k-1阶向量的第一分片进行聚合运算,得到第一中间结果。步骤b,采用秘密分享除法协议,对第一中间结果与其它n-1个平台获取的其它中间结果之和,与n组邻居节点中各邻居节点的总数目进行求商。将求商结果作为上述聚合结果。步骤c,获取在求商的过程中,第一平台拥有的数据分片,并将其拥有的数据分片作为第一结果分片。
首先在步骤a,对第一组邻居节点的k-1阶向量的第一分片进行聚合运算可以包括:对第一组邻居节点的k-1阶向量的第一分片进行求平均、求加权平均或者求和等。
以聚合运算为求平均为例来说,可以根据如下公式获取上述第一中间结果:
Figure 428594DEST_PATH_IMAGE006
(公式2)
其中,i为正整数,且其取值范围为[1,n],
Figure DEST_PATH_IMAGE007
为第i个平台所维护的第i个关系网络图中节点v的邻居节点集合,也称节点v的第i组邻居节点,
Figure 168011DEST_PATH_IMAGE008
为第i个平台拥有的邻居节点u的k-1阶向量的对应分片,Mean()为求平均运算,
Figure DEST_PATH_IMAGE009
为第i个平台获取的节点v的各邻居节点的k-1阶向量的中间结果。其中在第i个平台为第一平台时,这里的第i组邻居节点为上述第一组邻居节点,这里的对应分片为第一分片,以及这里的中间结果即为上述第一中间结果。
接着在步骤b,可以根据如下公式获取上述聚合结果:
Figure 451225DEST_PATH_IMAGE010
(公式3)
其中,n为平台的数目,i为正整数,且其取值范围为[1,n],
Figure DEST_PATH_IMAGE011
为上述聚合结果,在该一种实现方式中,其也为求商结果,
Figure 349386DEST_PATH_IMAGE012
为第i个平台获取的节点v的第i组邻居节点的k-1阶向量的中间结果。其中,在第i个平台为第一平台时,这里的中间结果为第一中间结果。而在第i个平台为其它平台时,这里的中间结果为其它中间结果。从而上述公式中分子的物理含义为:对第一中间结果与其它n-1个平台获取的其它中间结果进行求和。
Figure DEST_PATH_IMAGE013
为第i个关系网络图中节点v的邻居节点的数目。从而上述公式中分母的物理含义可以为:对n个关系网络图中节点v的邻居节点的数目进行求和,也即分母表示n组邻居节点中各邻居节点的总数目。
然后在步骤c,应理解,在n个平台采用秘密分享求商协议求商的过程中,每个平台可以拥有一个数据分片。在本说明书中,将在求商过程中,各平台拥有的数据分片作为各自对应的结果分片,具体可以表示为:
Figure 413157DEST_PATH_IMAGE014
。其中,在第i个平台为第一平台时,这里的结果分片为上述第一结果分片。
还以秘密分享为例来说,上述采用第一MPC方法进行聚合运算可以包括:步骤x,采用秘密分享求最大协议,对n组邻居节点中各邻居节点的k-1阶向量的对应分片的求和结果进行比较,以选取出对应于最大求和结果的目标邻居节点。步骤y,将目标邻居节点的k-1阶向量作为上述聚合结果。步骤z,将第一平台拥有的、目标邻居节点的k-1阶向量的第一分片作为第一结果分片。
首先在步骤x和步骤y,可以根据如下公式确定上述聚合结果:
Figure DEST_PATH_IMAGE015
(公式4)
其中,i为正整数,且其取值范围为[1,n],
Figure 425107DEST_PATH_IMAGE016
为上述聚合结果,在该另一种实现方式中,其也为目标邻居节点的k-1阶向量,
Figure DEST_PATH_IMAGE017
为第i个平台所维护的第i个关系网络图中节点v的邻居节点集合,也称节点v的第i组邻居节点,
Figure 31668DEST_PATH_IMAGE018
为第i个平台拥有的邻居节点u的k-1阶向量的对应分片,Max-Pooling()为最大池化运算。其中在第i个平台为第一平台时,这里的第i组邻居节点为上述第一组邻居节点。
接着在步骤z,应理解,由于在k-1级向量嵌入结束之后,n个平台中的每个平台可以拥有各节点的k-1向量的对应分片。从而在选取出目标邻居节点之后,各平台只需要将各自拥有的目标邻居节点的k-1阶向量的对应分片,作为各自拥有的聚合结果的结果分片即可,具体可以表示为:
Figure DEST_PATH_IMAGE019
。其中在第i个平台为第一平台时,这里的对应分片为上述第一分片,这里的结果分片即为上述第一结果分片。
步骤306,将第一节点的k-1阶向量的第一分片与第一结果分片进行整合,得到对应于第一平台的第一整合结果。
这里的整合也可以理解为是将第一节点的k-1阶向量的第一分片与第一结果分片进行拼接。
在一个例子中,可以根据如下公式对第一分片和第一结果分片进行整合:
Figure 697136DEST_PATH_IMAGE020
(公式5)
其中,i为正整数,且其取值范围为[1,n],CONCAT()为整合函数,
Figure DEST_PATH_IMAGE021
为第i个平台拥有的节点v的k-1阶向量的对应分片。
Figure 123569DEST_PATH_IMAGE022
为第i个平台拥有的聚合结果的结果分片。
Figure 391740DEST_PATH_IMAGE023
为第i个平台的整合结果。其中在第i个平台为第一平台时,这里的对应分片即为上述第一分片,这里的结果分片即为上述第一结果分片,这里的整合结果即为上述第一整合结果。
步骤308,基于第一整合结果以及第一平台拥有的第k阶权重矩阵,以及其它n-1个平台获取的其它整合结果和拥有的第k阶权重矩阵,采用第二MPC方法进行乘法运算,得到第一节点的k阶向量的第一分片。
上述第二MPC方法可以包括但不限于秘密分享、混淆电路以及同态加密中的任一种。以秘密分享为例来说,上述采用第二MPC方法进行乘法运算可以包括:步骤u,计算第一整合结果与第一平台拥有的第k阶权重矩阵的第一乘积。步骤v,采用秘密分享乘法协议,依次分别对第一整合结果与其它n-1个平台拥有的第k阶权重矩阵进行相乘,并分别对其它整合结果与第一平台拥有的第k阶权重矩阵进行相乘。获取在上述相乘的过程中,第一平台拥有的各第一数据分片。步骤w,对第一乘积与各第一数据分片进行求和,得到第一求和结果。基于第一求和结果,以及其它n-1个平台获取的其它求和结果,确定第一节点的k阶向量的第一分片。
关于上述步骤u,其相应的计算公式可以表示为:
Figure DEST_PATH_IMAGE024
,其中,
Figure 584299DEST_PATH_IMAGE025
为第i个平台的整合结果,
Figure DEST_PATH_IMAGE026
为第i个平台拥有的第k阶权重矩阵。应理解,在第i个平台为第一平台时,这里的整合结果为第一整合结果,这里的第k阶权重矩阵为第一平台拥有的第k阶权重矩阵。
关于上述步骤v,相应的计算公式可以分别表示为:
Figure 686247DEST_PATH_IMAGE027
Figure DEST_PATH_IMAGE028
,其中,j=1,2,…,n,且j≠i。也即
Figure 865556DEST_PATH_IMAGE029
为n个平台中除第i个平台之外的其它n-1个平台拥有的第k阶权重矩阵,
Figure 671838DEST_PATH_IMAGE030
为n个平台中除第i个平台之外的其它n-1个平台获取的其它整合结果。在执行上述两种运算的过程中,第i个平台拥有的第一数据分片分别可以表示为:
Figure 456254DEST_PATH_IMAGE031
Figure 322579DEST_PATH_IMAGE032
关于上述步骤w,在得到第一求和结果之后,确定第一节点的k阶向量的第一分片可以包括:步骤w1,对第一求和结果进行求平方,得到第一求平方结果。步骤w2,采用秘密分享乘法协议,依次分别对第一求和结果与其它求和结果进行求内积,并分别对其它求和结果与第一求和结果进行求内积。步骤w3,获取在求内积的过程中,第一平台拥有的各第二数据分片。对第一求平方结果和各第二数据分片进行求和,得到总求平方结果。步骤w4,基于第一求和结果以及总求平方结果,利用多项式函数,确定第一节点的k阶向量的第一分片。
关于步骤w1,可以将第一求和结果表示为
Figure 458025DEST_PATH_IMAGE033
,且将其它求和结果表示为
Figure DEST_PATH_IMAGE034
,其中,j=1,2,…,n,且j≠i,则第一求平方结果可以表示为:
Figure 67998DEST_PATH_IMAGE035
关于步骤w2,相应的计算公式可以分别表示为:
Figure DEST_PATH_IMAGE036
Figure 238079DEST_PATH_IMAGE037
。在执行上述两种运算的过程中,第i个平台拥有的第一数据分片分别可以表示为:
Figure 540885DEST_PATH_IMAGE038
Figure DEST_PATH_IMAGE039
关于步骤w3,可以将总求平方结果表示为:
Figure 898048DEST_PATH_IMAGE040
关于步骤w4,可以根据如下公式确定第一节点的k阶向量的第一分片:
Figure DEST_PATH_IMAGE041
(公式6)
其中,
Figure 452657DEST_PATH_IMAGE042
为第一节点的k阶向量的第一分片,n为平台数目,
Figure DEST_PATH_IMAGE043
为第一求和结果,
Figure 601879DEST_PATH_IMAGE044
为总求平方结果,q0,q1和q2分别为多项式系数。
应理解,通过重复执行上述步骤302-步骤308,可以确定出第一节点的各阶向量的第一分片。类似地,还可以确定出第一关系网络图中其它节点的各阶向量的第一分片,以及可以确定出其它关系网络图中各节点的各阶向量的对应分片,至此完成了n个平台联合进行图嵌入处理。之后可以基于各关系网络图中各节点的各阶向量,联合进行某种预测(比如,风险识别)或者进行安全计算等。
综上,本说明书实施例提供的保护隐私的联合数据处理方法,每个平台通过采用多方安全计算方法,联合其它平台对其维护的关联网络图中的各节点进行多级向量嵌入,其中在任意的第一节点的k级向量嵌入中,每个平台仅获取到第一节点k阶向量的一个分片。由此,可以避免在多平台联合进行图嵌入处理的过程中,各平台的隐私数据泄露的问题。也就是说,本说明书提供的方案,可以实现在保证各平台的数据安全的情况下,联合进行图嵌入处理。
与上述保护隐私的联合数据处理方法对应地,本说明书一个实施例还提供的一种保护隐私的联合数据处理装置。该装置涉及n个平台,n个平台分别维护n个关系网络图,并分别拥有用于对所维护的关系网络图进行嵌入处理的各阶权重矩阵。该装置集成于n个平台中任意的第一平台,用于针对第一平台所维护的第一关系网络图中任意的第一节点执行多级向量嵌入。如图4所示,该装置通过其包括的以下单元执行其中任意的第k级向量嵌入:
确定单元402,用于确定第一节点在第一关系网络图中的第一组邻居节点。
确定单元402还用于:
获取第一节点所代表的对象的属性特征,根据该属性特征确定第一节点的初阶向量的第一分片。
聚合运算单元404,用于基于第一组邻居节点的k-1阶向量的第一分片,和其它n-1个平台针对第一节点确定的其它n-1组邻居节点的k-1阶向量的对应分片,采用第一多方安全计算MPC方法进行聚合运算,得到第一节点的n组邻居节点的k-1阶向量的聚合结果的第一结果分片。
聚合运算单元404具体可以用于:
对第一组邻居节点的k-1阶向量的第一分片进行聚合运算,得到第一中间结果。比如,对第一组邻居节点的k-1阶向量的第一分片进行求平均、求加权平均或者求和等;
采用秘密分享除法协议,对第一中间结果与其它n-1个平台获取的其它中间结果之和,与n组邻居节点中各邻居节点的总数目进行求商。将求商结果作为聚合结果;
获取在求商的过程中,第一平台拥有的数据分片,并将该数据分片作为第一结果分片。
聚合运算单元404还具体用于:
采用秘密分享求最大协议,对n组邻居节点中各邻居节点的k-1阶向量的对应分片的求和结果进行比较,以选取出对应于最大求和结果的目标邻居节点;
将目标邻居节点的k-1阶向量作为聚合结果;
将第一平台拥有的、目标邻居节点的k-1阶向量的第一分片作为第一结果分片。
整合单元406,用于将第一节点的k-1阶向量的第一分片与第一结果分片进行整合,得到对应于第一平台的第一整合结果。
整合单元406具体可以用于:
将第一节点的k-1阶向量的第一分片与第一结果分片进行拼接。
乘法运算单元408,用于基于第一整合结果以及第一平台拥有的第k阶权重矩阵,以及其它n-1个平台获取的其它整合结果和拥有的第k阶权重矩阵,采用第二MPC方法进行乘法运算,得到第一节点的k阶向量的第一分片。
乘法运算单元408具体可以用于:
计算第一整合结果与第一平台拥有的第k阶权重矩阵的第一乘积;
采用秘密分享乘法协议,依次分别对第一整合结果与其它n-1个平台拥有的第k阶权重矩阵进行相乘,并分别对其它整合结果与第一平台拥有的第k阶权重矩阵进行相乘;
获取在上述相乘的过程中,第一平台拥有的各第一数据分片;
对第一乘积与各第一数据分片进行求和,得到第一求和结果;
基于第一求和结果,以及其它n-1个平台获取的其它求和结果,确定第一节点的k阶向量的第一分片。
乘法运算单元408还具体可以用于:
对第一求和结果进行求平方,得到第一求平方结果;
采用秘密分享乘法协议,依次分别对第一求和结果与其它求和结果进行求内积,并分别对其它求和结果与第一求和结果进行求内积;
获取在求内积的过程中,第一平台拥有的各第二数据分片;
对第一求平方结果和各第二数据分片进行求和,得到总求平方结果;
基于第一求和结果以及总求平方结果,利用多项式函数,确定第一节点的k阶向量的第一分片。
本说明书上述实施例装置的各功能模块的功能,可以通过上述方法实施例的各步骤来实现,因此,本说明书一个实施例提供的装置的具体工作过程,在此不复赘述。
本说明书一个实施例提供的保护隐私的联合数据处理装置,可以实现在保证各平台的数据安全的情况下,联合进行图嵌入处理。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图3所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图3所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
结合本说明书公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于服务器中。当然,处理器和存储介质也可以作为分立组件存在于服务器中。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述的具体实施方式,对本说明书的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书的具体实施方式而已,并不用于限定本说明书的保护范围,凡在本说明书的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的保护范围之内。

Claims (18)

1.一种保护隐私的联合数据处理方法,涉及n个平台,所述n个平台分别维护n个关系网络图,并分别拥有用于对所维护的关系网络图进行嵌入处理的各阶权重矩阵;所述方法通过所述n个平台中任意的第一平台执行,包括针对所述第一平台所维护的第一关系网络图中任意的第一节点执行多级向量嵌入,其中任意的第k级向量嵌入包括:
确定所述第一节点在所述第一关系网络图中的第一组邻居节点;
基于所述第一组邻居节点的k-1阶向量的第一分片,和其它n-1个平台针对所述第一节点确定的其它n-1组邻居节点的k-1阶向量的对应分片,采用第一多方安全计算MPC方法进行聚合运算,得到所述第一节点的n组邻居节点的k-1阶向量的聚合结果的第一结果分片;
将所述第一节点的k-1阶向量的第一分片与所述第一结果分片进行整合,得到对应于所述第一平台的第一整合结果;
基于所述第一整合结果以及所述第一平台拥有的第k阶权重矩阵,以及其它n-1个平台获取的其它整合结果和拥有的第k阶权重矩阵,采用第二MPC方法进行乘法运算,得到所述第一节点的k阶向量的第一分片。
2.根据权利要求1所述的方法,所述执行多级向量嵌入还包括,执行初级向量嵌入,具体包括:
获取所述第一节点所代表的对象的属性特征,根据该属性特征确定所述第一节点的初阶向量的第一分片。
3.根据权利要求1所述的方法,所述采用第一多方安全计算MPC方法进行聚合运算,包括:
对所述第一组邻居节点的k-1阶向量的第一分片进行聚合运算,得到第一中间结果;
采用秘密分享除法协议,对所述第一中间结果与其它n-1个平台获取的其它中间结果之和,与所述n组邻居节点中各邻居节点的总数目进行求商;将所述求商结果作为所述聚合结果;
获取在所述求商的过程中,所述第一平台拥有的数据分片,并将所述数据分片作为所述第一结果分片。
4.根据权利要求3所述的方法,所述对所述第一组邻居节点的k-1阶向量的第一分片进行聚合运算,包括:
对所述第一组邻居节点的k-1阶向量的第一分片进行求平均、求加权平均或者求和。
5.根据权利要求1所述的方法,所述采用第一多方安全计算MPC方法进行聚合运算,包括:
采用秘密分享求最大协议,对所述n组邻居节点中各邻居节点的k-1阶向量的对应分片的求和结果进行比较,以选取出对应于最大求和结果的目标邻居节点;
将所述目标邻居节点的k-1阶向量作为所述聚合结果;
将所述第一平台拥有的、所述目标邻居节点的k-1阶向量的第一分片作为所述第一结果分片。
6.根据权利要求1所述的方法,所述将所述第一节点的k-1阶向量的第一分片与所述第一结果分片进行整合,包括:
将所述第一节点的k-1阶向量的第一分片与所述第一结果分片进行拼接。
7.根据权利要求1所述的方法,所述采用第二MPC方法进行乘法运算,包括:
计算所述第一整合结果与所述第一平台拥有的第k阶权重矩阵的第一乘积;
采用秘密分享乘法协议,依次分别对所述第一整合结果与其它n-1个平台拥有的第k阶权重矩阵进行相乘,并分别对所述其它整合结果与所述第一平台拥有的第k阶权重矩阵进行相乘;
获取在所述相乘的过程中,所述第一平台拥有的各第一数据分片;
对所述第一乘积与所述各第一数据分片进行求和,得到第一求和结果;
基于所述第一求和结果,以及所述其它n-1个平台获取的其它求和结果,确定所述第一节点的k阶向量的第一分片。
8.根据权利要求7所述的方法,所述基于所述第一求和结果,以及所述其它n-1个平台获取的其它求和结果,确定所述第一节点的k阶向量的第一分片,包括:
对所述第一求和结果进行求平方,得到第一求平方结果;
采用秘密分享乘法协议,依次分别对所述第一求和结果与所述其它求和结果进行求内积,并分别对所述其它求和结果与所述第一求和结果进行求内积;
获取在所述求内积的过程中,所述第一平台拥有的各第二数据分片;
对所述第一求平方结果和所述各第二数据分片进行求和,得到总求平方结果;
基于所述第一求和结果以及所述总求平方结果,利用多项式函数,确定所述第一节点的k阶向量的第一分片。
9.一种保护隐私的联合数据处理装置,涉及n个平台,所述n个平台分别维护n个关系网络图,并分别拥有用于对所维护的关系网络图进行嵌入处理的各阶权重矩阵;所述装置集成于所述n个平台中任意的第一平台,用于针对所述第一平台所维护的第一关系网络图中任意的第一节点执行多级向量嵌入,所述装置通过其包括的以下单元执行其中任意的第k级向量嵌入:
确定单元,用于确定所述第一节点在所述第一关系网络图中的第一组邻居节点;
聚合运算单元,用于基于所述第一组邻居节点的k-1阶向量的第一分片,和其它n-1个平台针对所述第一节点确定的其它n-1组邻居节点的k-1阶向量的对应分片,采用第一多方安全计算MPC方法进行聚合运算,得到所述第一节点的n组邻居节点的k-1阶向量的聚合结果的第一结果分片;
整合单元,用于将所述第一节点的k-1阶向量的第一分片与所述第一结果分片进行整合,得到对应于所述第一平台的第一整合结果;
乘法运算单元,用于基于所述第一整合结果以及所述第一平台拥有的第k阶权重矩阵,以及其它n-1个平台获取的其它整合结果和拥有的第k阶权重矩阵,采用第二MPC方法进行乘法运算,得到所述第一节点的k阶向量的第一分片。
10.根据权利要求9所述的装置,所述确定单元还用于:
获取所述第一节点所代表的对象的属性特征,根据该属性特征确定所述第一节点的初阶向量的第一分片。
11.根据权利要求9所述的装置,所述聚合运算单元具体用于:
对所述第一组邻居节点的k-1阶向量的第一分片进行聚合运算,得到第一中间结果;
采用秘密分享除法协议,对所述第一中间结果与其它n-1个平台获取的其它中间结果之和,与所述n组邻居节点中各邻居节点的总数目进行求商;将所述求商结果作为所述聚合结果;
获取在所述求商的过程中,所述第一平台拥有的数据分片,并将所述数据分片作为所述第一结果分片。
12.根据权利要求11所述的装置,所述聚合运算单元还具体用于:
对所述第一组邻居节点的k-1阶向量的第一分片进行求平均、求加权平均或者求和。
13.根据权利要求9所述的装置,所述聚合运算单元具体用于:
采用秘密分享求最大协议,对所述n组邻居节点中各邻居节点的k-1阶向量的对应分片的求和结果进行比较,以选取出对应于最大求和结果的目标邻居节点;
将所述目标邻居节点的k-1阶向量作为所述聚合结果;
将所述第一平台拥有的、所述目标邻居节点的k-1阶向量的第一分片作为所述第一结果分片。
14.根据权利要求9所述的装置,所述整合单元具体用于:
将所述第一节点的k-1阶向量的第一分片与所述第一结果分片进行拼接。
15.根据权利要求9所述的装置,所述乘法运算单元具体用于:
计算所述第一整合结果与所述第一平台拥有的第k阶权重矩阵的第一乘积;
采用秘密分享乘法协议,依次分别对所述第一整合结果与其它n-1个平台拥有的第k阶权重矩阵进行相乘,并分别对所述其它整合结果与所述第一平台拥有的第k阶权重矩阵进行相乘;
获取在所述相乘的过程中,所述第一平台拥有的各第一数据分片;
对所述第一乘积与所述各第一数据分片进行求和,得到第一求和结果;
基于所述第一求和结果,以及所述其它n-1个平台获取的其它求和结果,确定所述第一节点的k阶向量的第一分片。
16.根据权利要求15所述的装置,所述乘法运算单元还具体用于:
对所述第一求和结果进行求平方,得到第一求平方结果;
采用秘密分享乘法协议,依次分别对所述第一求和结果与所述其它求和结果进行求内积,并分别对所述其它求和结果与所述第一求和结果进行求内积;
获取在所述求内积的过程中,所述第一平台拥有的各第二数据分片;
对所述第一求平方结果和所述各第二数据分片进行求和,得到总求平方结果;
基于所述第一求和结果以及所述总求平方结果,利用多项式函数,确定所述第一节点的k阶向量的第一分片。
17.一种计算机可读存储介质,其上存储有计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-8中任一项所述的方法。
18.一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-8中任一项所述的方法。
CN202110160210.7A 2021-02-05 2021-02-05 保护隐私的联合数据处理方法及装置 Active CN112487489B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110160210.7A CN112487489B (zh) 2021-02-05 2021-02-05 保护隐私的联合数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110160210.7A CN112487489B (zh) 2021-02-05 2021-02-05 保护隐私的联合数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN112487489A true CN112487489A (zh) 2021-03-12
CN112487489B CN112487489B (zh) 2021-04-27

Family

ID=74912233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110160210.7A Active CN112487489B (zh) 2021-02-05 2021-02-05 保护隐私的联合数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN112487489B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113065162A (zh) * 2021-04-25 2021-07-02 支付宝(杭州)信息技术有限公司 和共享形式的隐私数据的处理方法和装置
CN113434886A (zh) * 2021-07-01 2021-09-24 支付宝(杭州)信息技术有限公司 联合生成用于安全计算的数据元组的方法及装置
CN115396101A (zh) * 2022-10-26 2022-11-25 华控清交信息科技(北京)有限公司 一种基于秘密分享的不经意打乱方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109194707A (zh) * 2018-07-24 2019-01-11 阿里巴巴集团控股有限公司 分布式图嵌入的方法及装置
CN109918454A (zh) * 2019-02-22 2019-06-21 阿里巴巴集团控股有限公司 对关系网络图进行节点嵌入的方法及装置
CN110866190A (zh) * 2019-11-18 2020-03-06 支付宝(杭州)信息技术有限公司 训练用于表征知识图谱的图神经网络模型的方法及装置
CN111489168A (zh) * 2020-04-17 2020-08-04 支付宝(杭州)信息技术有限公司 一种目标对象的风险识别方法、装置和处理设备
CN112100680A (zh) * 2020-11-16 2020-12-18 支付宝(杭州)信息技术有限公司 保护隐私的多平台数据处理方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109194707A (zh) * 2018-07-24 2019-01-11 阿里巴巴集团控股有限公司 分布式图嵌入的方法及装置
CN109918454A (zh) * 2019-02-22 2019-06-21 阿里巴巴集团控股有限公司 对关系网络图进行节点嵌入的方法及装置
CN110866190A (zh) * 2019-11-18 2020-03-06 支付宝(杭州)信息技术有限公司 训练用于表征知识图谱的图神经网络模型的方法及装置
CN111489168A (zh) * 2020-04-17 2020-08-04 支付宝(杭州)信息技术有限公司 一种目标对象的风险识别方法、装置和处理设备
CN112100680A (zh) * 2020-11-16 2020-12-18 支付宝(杭州)信息技术有限公司 保护隐私的多平台数据处理方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113065162A (zh) * 2021-04-25 2021-07-02 支付宝(杭州)信息技术有限公司 和共享形式的隐私数据的处理方法和装置
CN113434886A (zh) * 2021-07-01 2021-09-24 支付宝(杭州)信息技术有限公司 联合生成用于安全计算的数据元组的方法及装置
CN113434886B (zh) * 2021-07-01 2022-05-17 支付宝(杭州)信息技术有限公司 联合生成用于安全计算的数据元组的方法及装置
CN115396101A (zh) * 2022-10-26 2022-11-25 华控清交信息科技(北京)有限公司 一种基于秘密分享的不经意打乱方法和系统
CN115396101B (zh) * 2022-10-26 2022-12-27 华控清交信息科技(北京)有限公司 一种基于秘密分享的不经意打乱方法和系统

Also Published As

Publication number Publication date
CN112487489B (zh) 2021-04-27

Similar Documents

Publication Publication Date Title
CN112487489B (zh) 保护隐私的联合数据处理方法及装置
Lacharité et al. Improved reconstruction attacks on encrypted data using range query leakage
CN109859054B (zh) 网络社团挖掘方法、装置、计算机设备及存储介质
CN111046429B (zh) 基于隐私保护的关系网络构建方法及装置
CN108171663B (zh) 基于特征图最近邻替换的卷积神经网络的图像填充系统
CN109063041B (zh) 关系网络图嵌入的方法及装置
Chen et al. Measuring query privacy in location-based services
Chang et al. Privacy preserving subgraph matching on large graphs in cloud
CN111444544B (zh) 针对多方的隐私数据进行聚类的方法和装置
CN113240505B (zh) 图数据的处理方法、装置、设备、存储介质及程序产品
Meka et al. Matrix completion from power-law distributed samples
CN111026359B (zh) 多方联合判定隐私数据的数值范围的方法和装置
CN106817390B (zh) 一种用户数据共享的方法和设备
Neininger et al. On the contraction method with degenerate limit equation
Ding et al. K-means clustering with distributed dimensions
Casanellas et al. Geometry of the Kimura 3-parameter model
Wainakh et al. Efficient privacy-preserving recommendations based on social graphs
Forsgård et al. Lopsided approximation of amoebas
Mireshghallah et al. A principled approach to learning stochastic representations for privacy in deep neural inference
Battarbee et al. Cryptanalysis of semidirect product key exchange using matrices over non-commutative rings
Kawamoto et al. On the compositionality of quantitative information flow
da Silva et al. Inference in distributed data clustering
CN116401708A (zh) 去中心化社交图数据的本地差分隐私保护方法和系统
CN113781117B (zh) 营销方案的生成方法、装置、电子设备及计算机存储介质
Blanton et al. Secure and oblivious maximum bipartite matching size algorithm with applications to secure fingerprint identification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant