CN112100680B - 保护隐私的多平台数据处理方法及装置 - Google Patents

保护隐私的多平台数据处理方法及装置 Download PDF

Info

Publication number
CN112100680B
CN112100680B CN202011280164.6A CN202011280164A CN112100680B CN 112100680 B CN112100680 B CN 112100680B CN 202011280164 A CN202011280164 A CN 202011280164A CN 112100680 B CN112100680 B CN 112100680B
Authority
CN
China
Prior art keywords
platform
attribute
result
sub
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011280164.6A
Other languages
English (en)
Other versions
CN112100680A (zh
Inventor
陈超超
崔锦铭
王力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202011280164.6A priority Critical patent/CN112100680B/zh
Publication of CN112100680A publication Critical patent/CN112100680A/zh
Application granted granted Critical
Publication of CN112100680B publication Critical patent/CN112100680B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供一种保护隐私的多平台数据处理方法及装置,在数据处理方法中,第一平台通过与其它各平台执行PSI协议,获取第一平台与其它各平台之间共同的目标业务实体。对于目标业务实体的若干实体属性中任意的第一属性,采用与其它各平台约定的安全计算方法,获取多平台各自维护的第一属性的各属性值的融合结果的第一子结果并保存。其中,保存的第一子结果用于恢复出第一属性的融合结果。恢复出的融合结果用于确定融合后的知识图谱。

Description

保护隐私的多平台数据处理方法及装置
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种保护隐私的多平台数据处理方法及装置。
背景技术
现有技术中,已经针对各种领域或各种主题,整理有各种形式的知识图谱。这些知识图谱通常由不同的机构或平台所独有。换句话说,这些知识图谱通常为各机构或平台的隐私数据。
然而,在实际应用中,为进行某种预测(比如,风险识别)或者进行多方安全计算等,通常需要对不同平台的知识图谱执行融合等处理。因此,就需要提供一种能够在保护各平台数据安全的情况下,对各平台数据进行处理的方案。
发明内容
本说明书一个或多个实施例描述了一种保护隐私的多平台数据处理方法及装置,可以在保证各平台的数据安全的情况下,对各平台的数据进行处理。
第一方面,提供了一种保护隐私的多平台数据处理方法,包括:
通过与其它各平台执行隐私保护集合求交PSI协议,获取所述第一平台与所述其它各平台之间共同的目标业务实体;
对于所述目标业务实体的若干实体属性中任意的第一属性,采用与所述其它各平台约定的安全计算方法,获取所述多平台各自维护的第一属性的各属性值的融合结果的第一子结果并保存;其中,保存的所述第一子结果用于恢复出所述第一属性的融合结果;恢复出的所述融合结果用于确定融合后的知识图谱。
第二方面,提供了一种保护隐私的多平台数据处理装置,包括:
执行单元,用于通过与其它各平台执行隐私保护集合求交PSI协议,获取所述第一平台与所述其它各平台之间共同的目标业务实体;
获取单元,用于对于所述目标业务实体的若干实体属性中任意的第一属性,采用与所述其它各平台约定的安全计算方法,获取所述多平台各自维护的第一属性的各属性值的融合结果的第一子结果并保存;其中,保存的所述第一子结果用于恢复出所述第一属性的融合结果;恢复出的所述融合结果用于确定融合后的知识图谱。
第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述第一方面的方法。
第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述第一方面的方法。
本说明书一个或多个实施例提供的保护隐私的多平台数据处理方法及装置,首先,通过在多平台之间执行PSI协议,获取多平台之间共同的目标业务实体。该PSI协议的执行,可以确保各平台的业务实体不被泄露。之后,针对目标业务实体的各实体属性,采用约定的安全多方计算方法,获取各平台维护的该属性的各属性值的融合结果的子结果。这里的安全多方计算方法可以实现各平台的实体属性的属性值的隐私保护。最后,各平台保存目标业务实体的各实体属性的融合结果的子结果,可以确保各实体属性的融合结果的安全性。总而言之,本说明书实施例可以在保证各平台的数据安全的情况下,对各平台的数据进行处理。
附图说明
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书提供的一个实施例的实施场景示意图;
图2为本说明书一个实施例提供的保护隐私的多平台数据处理方法流程图;
图3a为平台A维护的知识图谱示意图;
图3b为平台B维护的知识图谱示意图;
图4为融合后的知识图谱示意图;
图5为本说明书一个实施例提供的保护隐私的多平台数据处理装置示意图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
在描述本说明书提供的方案之前,先对本方案的发明构思进行说明。
本说明书所述的知识图谱可以整理为节点连接图的形式,其中包括多个节点,每个节点对应于一个业务实体,该业务实体具有若干实体属性。
如前所述,为了进行某种预测(比如,风险识别)或进行多方安全计算等,通常需要对不同平台的知识图谱执行融合等处理。而在针对各平台的知识图谱执行融合等处理时,确保各平台数据的安全性是一个需要解决的问题。
本说明书主要针对知识谱图的融合进行讨论。应理解,知识图谱的融合主要包括如下几方面:第一、共同的目标业务实体的确定。第二、共同的目标业务实体的实体属性的融合。第三、共同的目标业务实体的实体属性的融合结果的存储。关于上述第一方面,本申请的发明人提出,可以通过在各平台之间执行隐私保护集合求交(Private SetIntersection,PSI)协议,确定各平台之间共同的目标业务实体。PSI协议允许持有各自集合的两方来共同计算两个集合的共同数据。在协议交互的最后,一方或是两方应该得到正确的共同数据,而且不会得到共同数据以外另一方集合中的任何数据。也即,该PSI协议的执行,可以确保各平台的业务实体不被泄露。
关于上述第二方面,本申请的发明人提出,对于目标业务实体的若干实体属性中任意的第一属性,采用与其它各平台约定的安全计算方法,对多平台各自维护的第一属性的各属性值进行融合,
需要说明的是,这里的安全多方计算方法可以实现各平台的实体属性的属性值的隐私保护。
关于上述第三方面,本申请的发明人提出各平台各自对应保存目标业务实体的各实体属性的融合结果的子结果。应理解,对各平台各自对应保存的子结果进行汇总(如,求和)之后,就可以恢复出各实体属性的融合结果,进而可以确定出融合后的知识图谱。
这里各平台各自对应保存目标业务实体的各实体属性的融合结果的子结果,可以确保各实体属性的融合结果的安全性。
总而言之,本说明书实施例可以在保证各平台的数据安全的情况下,对各平台的数据进行处理。
图1为本说明书提供的一个实施例的实施场景示意图。图1中,平台1-平台N各自维护有知识图谱,其中,每个平台维护的知识图谱包括若干节点,其中的每个节点代表一个业务实体(Entity),该业务实体具有若干实体属性(Property)。此外,节点之间的边代表业务实体之间的关系。其中,由两个业务实体及该两者之间的边可以构成一个事实,可以表示如下的三元组:(实体1,关系,实体2)。在本说明书中,上述知识图谱可以包括但不限于以下任一种:企业知识图谱、产品知识图谱、人物知识图谱、信息知识图谱、股票知识图谱、基金知识图谱以及机构知识图谱等。
为了应对某种预测或者进行安全多方计算等,可以预先针对各平台的知识图谱进行融合。应理解,这里待融合的知识图谱属于同一类别,比如,同为企业知识图谱或者人物知识图谱等。图1中,平台1-平台N中任意的第一平台通过与其它各平台执行PSI协议,确定各平台共同的目标业务实体。之后,第一平台可以按照与其它各平台执行约定的安全计算方法,获取目标业务实体的各实体属性的融合结果的子结果并保存。此外,平台1-平台N中各平台均可与可信的第三方(比如,PSI服务器或者第一服务器)通信,具体通信过程后续说明。
图2为本说明书一个实施例提供的保护隐私的多平台数据处理方法流程图。所述方法的执行主体可以为具有处理能力的设备:服务器或者系统或者平台,如,可以为图1的平台1-平台N中任意的第一平台。如图2所示,所述方法具体可以包括:
步骤202,通过与其它各平台执行隐私保护集合求交PSI协议,获取第一平台与其它各平台之间共同的目标业务实体。
可选地,在执行步骤202之前,各平台可以先对各自维护的业务实体的名称进行标准化。比如,可以将名称“Einstein”标准化为“Albert Einstein”。
步骤202中的PSI协议可以是指基于SGX的PSI协议,也可以是指传统的PSI协议。其中,传统的PSI协议可以包括但不限于基于安全性受限的协议、基于公钥体系的协议、基于电路的协议、基于盲传输(oblivious transfer,OT)的协议以及基于FHE的协议。
以基于SGX的PSI协议为例来说,上述获取第一平台与其它各平台之间共同的目标业务实体可以包括:步骤a,分别将第一平台的各业务实体的名称与预定义字符串(也称为盐值(salt))拼接后进行哈希运算,得到各条哈希运算结果。步骤b,对各条哈希运算结果进行加密,并向PSI服务器发送加密结果,以供PSI服务器在其可信执行环境(TrustedExecution Environment,TEE)中对加密结果进行解密,并将解密得到的各条哈希运算结果与其它各平台的各条哈希运算结果进行比对,以确定第一平台与其它各平台之间共同的目标业务实体的指示。步骤c,接收目标业务实体的指示,并基于该指示以及第一平台维护的各业务实体,确定目标业务实体。
需要说明的是,在执行步骤a之前,第一平台可以先对PSI服务器进行远程认证,以确保其处于可信状态。之后,第一平台可以请求PSI服务器针对其生成对应的字符串(即salt)。在一个例子中,PSI服务器可以通过硬件指令(如,rdrand指令)来生成字符串。
接着,在步骤b中,可以先对各条哈希结果进行排序,之后对排序后的各条哈希结果进行加密。此外,在各平台的各条哈希结果经排序的情况下,可以采用流式求交的方式进行求交,并且可以分布式并行处理。
最后,在步骤c中,目标业务实体的指示可以是一个多维向量,其中向量的每个元素对应于一个业务实体。在一个例子中,向量中元素的取值可以包括0和1,其中,0表示对应业务实体为非公共的业务实体,1表示对应业务实体为公共的目标业务实体。应理解,第一平台基于该指示以及各业务实体,就可以得到各平台公共的目标业务实体。
还需要说明的是,由于上述PSI协议是在各平台之间执行的,因此其它各平台也会执行上述与预定义字符串拼接并进行哈希、对各条哈希结果进行排序并加密以及根据接收的指示确定目标业务实体的步骤,具体执行过程同上述步骤a-步骤c类似,在此不复赘述。总之,在执行步骤202之后,各平台均可以获取到各平台共同的目标业务实体。
本说明书实施例通过在多平台之间执行PSI协议,获取多平台之间共同的目标业务实体,可以确保各平台的业务实体不被泄露。
举例来说,假设有两个平台:平台A和平台B,且平台A维护的知识图谱如图3a所示,且平台B维护的知识图谱如图3b所示。那么对于图3a所示的知识图谱,其具体可以存储为表1所示的形式。
表1
Figure DEST_PATH_IMAGE001
从图3a和表1可以看出,平台A维护有四个业务实体,每个业务实体具有两个实体属性。
同样的,对于图3b所示的知识图谱,其具体可以存储为表2所示的形式。
表2
Figure 45967DEST_PATH_IMAGE002
从图3b和表2可以看出,平台B 维护有四个业务实体,每个业务实体具有两个实体属性。
此外,从表1和表2可以看出,在传统技术中,各业务实体的实体属性的属性值是以明文形式存储的。
应理解,在该示例中,通过在平台A和平台B之间执行PSI协议,可以获取到该两个平台之间公共的目标业务实体为:B和C。
步骤204,对于目标业务实体的若干实体属性中任意的第一属性,采用与其它各平台约定的安全计算方法,获取多平台各自维护的第一属性的各属性值的融合结果的第一子结果并保存。
这里的安全计算方法可以包括但不限于以下任一种:秘密分享法、同态加密法以及混淆电路法等。
需要说明的是,本说明书实施例采用的安全多方计算方法可以实现各平台的实体属性的属性值的隐私保护。
以下分三种情况,对多平台各自维护的第一属性的各属性值的融合结果的第一子结果(以下简称第一属性的第一子结果)的获取方法进行说明:
第一种,多平台各自维护的第一属性的各属性值各自具有更新时间。在该种情况下,上述获取第一属性的第一子结果可以包括:采用与其它各平台约定的安全计算方法,对各属性值各自的更新时间进行比较。将对应于最晚更新时间的属性值作为融合结果,并采用秘密分享法,对融合结果进行划分。获取划分得到的对应于多个平台的多个子结果中,对应于第一平台的第一子结果。
举例来说,假设实体属性为用户年龄,且平台A维护的用户年龄为:18岁,对应的更新时间为:2020年8月2日,平台B维护的用户年龄为:20岁,对应的更新时间为:2019年3月2日,则由于平台A维护的用户年龄的更新时间晚于B平台维护的用户年龄,从而将“18岁”作为用户年龄的融合结果,且采用秘密分享法对“18岁”进行划分。
需要说明的是,在第一种情况下,上述获取第一子结果的步骤可以是在全保密的状态下执行。在这情况下,各平台无法获知各平台各自维护的属性值,也无法获知哪个平台维护的属性值作为融合结果。当然,也可以是允许部分消息被获知,比如,各平台无法获知各平台各自维护的属性值,但可以获知哪个平台维护的属性值作为融合结果。
在允许部分消息被获知的情况下,上述获取第一平台的第一子结果可以包括:采用与其它各平台约定的安全计算方法,对多平台各自维护的第一属性的各属性值的更新时间进行比较。若对应于最晚更新时间的属性值由第一平台维护,则第一平台将其维护的属性值作为融合结果,并采用秘密分享法,对融合结果进行划分,得到对应于多平台的多个子结果。从中选取对应于第一平台的第一子结果。若对应于最晚更新时间的属性值由其它各平台中任意的第二平台维护,则向第二平台发送通知消息,该通知消息用于通知第二平台将其维护的属性值作为融合结果,并采用秘密分享法,对融合结果进行划分。从第二平台接收划分的对应于多个平台的多个子结果中对应于第一平台的第一子结果。
总之,在各属性值各自有更新时间时,可以不考虑属性值本身的大小,而直接基于更新时间,对多平台各自维护的第一属性的各属性值进行融合(如,选取对应于最晚更新时间的属性值)。并基于融合结果对实体属性的属性值进行校正。
第二种,多平台各自维护的第一属性的各属性值不具有更新时间,但有大小关系。
在一个例子中,上述第一属性例如可以为“continuous”或“discrete”类别的实体属性。
需要说明的是,在第一属性的各属性值具有大小关系时,随着所采用的安全计算方法不同,第一属性的第一子结果的获取方法也不同。
以秘密分享法为例来说,上述获取第一属性的第一子结果可以包括:采用秘密分享法,计算多平台各自维护的第一属性的各属性值的最大值、最小值或者加权平均值,并将计算结果作为第一属性的融合结果。获取在计算过程中,第一平台维护的数据分片。将第一平台维护的数据分片作为第一属性的融合结果的第一子结果。
由于在使用秘密分享法的过程中,各平台均会维护有各自的数据分片。其中,任一平台的数据分片可以是通过对其自身维护的数据进行划分后得到的子分片与其它平台对各自维护的数据进行划分后分配给该平台的各子分片进行融合(如,求和)得到。应理解,在对各平台维护的数据分片进行进一步融合之后,就可以得到最终的计算结果。如,得到第一属性的融合结果。
再以同态加密法和混淆电路法为例来说,上述获取第一属性的第一子结果可以包括:采用同态加密法或混淆电路法,计算多平台各自维护的第一属性的各属性值的最大值、最小值或者加权平均值,并将计算结果作为第一属性的融合结果。采用秘密分享法,对融合结果进行划分,并获取划分得到的多个子结果中对应于第一平台的第一子结果。
需要说明的是,在第二种情况下,上述获取第一子结果的步骤是在全保密的状态下执行。即各平台无法获知各平台各自维护的属性值,也无法获知最终的融合结果。
总之,在各属性值具有大小关系时,可以通过计算最大值、最小值或者加权平均值等,对第一属性的各属性值进行融合。并基于融合结果对实体属性的属性值进行校正。
第三种,多平台各自维护的第一属性的各属性值不具有更新时间,且无大小关系。
在一个例子中,这里的第一属性例如可以为“categorical”类别的实体属性。
在该种情况下,上述获取第一属性的第一子结果可以包括:采用与其它各平台约定的安全计算方法,对多平台各自维护的第一属性的各属性值的取值范围进行比较。将对应于最大取值范围的属性值作为融合结果,并采用秘密分享法,对融合结果进行划分,获取划分得到的多个子结果中对应于第一平台的第一子结果。
同上述第一种情况类似地,第一子结果的获取步骤可以是在全保密的状态下执行。在这情况下,各平台无法获知各平台各自维护的属性值,也无法获知哪个平台维护的属性值作为融合结果。当然,也可以是允许部分消息被获知,比如,各平台无法获知各平台各自维护的属性值,但可以获知哪个平台维护的属性值作为融合结果。
在允许部分消息被获知的情况下,上述获取第一平台的第一子结果可以包括:采用与其它各平台约定的安全计算方法,对多平台各自维护的第一属性的各属性值的取值范围进行比较。若对应于最大取值范围的属性值由第一平台维护,则第一平台将其维护的属性值作为融合结果,并采用秘密分享法,对融合结果进行划分,得到对应于多平台的多个子结果。从中选取对应于第一平台的第一子结果。若对应于最大取值范围的属性值由其它各平台中任意的第二平台维护,则向第二平台发送通知消息,该通知消息用于通知第二平台将其维护的属性值作为融合结果,并采用秘密分享法,对融合结果进行划分。从第二平台接收划分的多个子结果中对应于第一平台的第一子结果。
总之,在各属性值无大小关系时,可以基于各平台各自维护的第一属性的各属性值的取值范围,对第一属性的各属性值进行融合。并基于融合结果对实体属性的属性值进行校正。
最后,需要说明的是,在第一平台获取到对应的第一子结果的同时,其它各平台也会获取到各自对应的第一子结果。应理解,基于多平台各自维护的第一属性的第一子结果,就可以恢复出第一属性的融合结果。比如,对多平台各自维护的第一属性的第一子结果进行求和,就可以恢复出第一属性的融合结果。
以上是针对图谱融合过程中,各平台的共同的目标业务实体的实体属性的融合过程的说明,对于各平台的非共同的业务实体,则直接保存其实体属性的明文属性值即可。
还以前述图3a和图3b为例来说,在对目标业务实体B和C的各实体属性的属性值进行融合之后,也即在执行步骤204之后,平台A所维护的知识图谱可以更新为如表3所示的形式。
表3
Figure DEST_PATH_IMAGE003
其中,<x2,1>A为平台A保存的第二个业务实体(即业务实体B)的第一个实体属性的融合结果的子结果。类似地,<x2,2>A为平台A保存的第二个业务实体的第二个实体属性的融合结果的子结果。<x3,1>A为平台A保存的第三个业务实体(即业务实体C)的第一个实体属性的融合结果的子结果。<x3,2>A为平台A保存的第三个业务实体的第二个实体属性的融合结果的子结果。
此外,平台B所维护的知识图谱可以更新为如表4所示的形式。
表4
Figure 71691DEST_PATH_IMAGE004
其中,<x2,1>B为平台B保存的第二个业务实体(即业务实体B)的第一个实体属性的融合结果的子结果。类似地,<x2,2>B为平台B保存的第二个业务实体的第二个实体属性的融合结果的子结果。<x3,1>B为平台B保存的第三个业务实体(即业务实体C)的第一个实体属性的融合结果的子结果。<x3,2>B为平台B保存的第三个业务实体的第二个实体属性的融合结果的子结果。
从表4可以看出,对于目标业务实体B和C,平台B只保存了各实体属性的融合结果的子结果。而对于非共同的业务实体E和F,平台B则直接保存各实体属性的明文属性值。
应理解,基于<x2,1>A和<x2,1>B就可以恢复出第二个业务实体B的第一个实体属性的融合结果。同理,基于<x2,2>A和<x2,2>B就可以恢复出第二个业务实体B的第二个实体属性的融合结果等等。
基于恢复出的目标业务实体的各实体属性的融合结果以及非共同的业务实体的各实体属性的明文属性值,就可以确定出融合后的知识图谱。
在本说明书实施例中,可以采用两种方式确定出融合后的知识图谱。第一种,由可信的第三方确定;第二种,采用安全计算方法确定。
以下先针对第一种方式进行说明:
在一个示例中,第一平台可以向第一服务器(即可信的第三方)发送融合请求。第一服务器在接收到融合请求之后,可以获取多平台各自维护的目标业务实体的各实体属性的第一子结果。此外,还可以获取非公共的业务实体的各实体属性的明文属性值。之后,将获取的子结果以及明文属性值加载到可信执行环境TEE中,以及在TEE中,将多平台各自维护的目标业务实体的同一实体属性的第一子结果进行求和,以恢复出目标业务实体的各实体属性的融合结果。最后,基于恢复出的目标业务实体的各实体属性的融合结果,以及非公共的业务实体的各实体属性的明文属性值,就可以确定出融合后的知识图谱。
还以前述图3a和图3b为例来说,假设目标业务实体B和C的两个实体属性的对应属性值各自具有更新时间,且平台B维护的各属性值的更新时间最晚为例来说,融合后的知识图谱可以如图4所示。图4中,业务实体B的第一个实体属性的融合结果为0.8,其通过对<x2,1>A与<x2,1>B求和得到。业务实体B的第二个实体属性的融合结果为1,其通过对<x2,2>A与<x2,2>B求和得到。业务实体C的第一个实体属性的融合结果为0.5,其通过对<x3,1>A与<x3,1>B求和得到。业务实体C的第二个实体属性的融合结果为1,其通过对<x3,2>A与<x3,3>B求和得到。而对于非公共的业务实体A、D、E和F,其实体属性的属性值为初始属性值。
在第二种实现方式中,可以采用安全计算方法,对多平台各自维护的目标业务实体的同一实体属性的第一子结果进行求和,以恢复出目标业务实体的各实体属性的融合结果。基于恢复出的目标业务实体的各实体属性的融合结果,确定融合后的知识图谱。
综上,本说明书实施例提供的保护隐私的多平台数据处理方法,首先,通过在多平台之间执行PSI协议,获取多平台之间共同的目标业务实体。该PSI协议的执行,可以确保各平台的业务实体不被泄露。之后,针对目标业务实体的各实体属性,采用约定的安全多方计算方法,获取各平台维护的该属性的各属性值的融合结果的子结果。这里的安全多方计算方法可以实现各平台的实体属性的属性值的隐私保护。最后,各平台保存目标业务实体的各实体属性的融合结果的子结果,可以确保各实体属性的融合结果的安全性。总而言之,本说明书实施例可以在保证各平台的数据安全的情况下,对各平台的数据进行处理。
与上述保护隐私的多平台数据处理方法对应地,本说明书一个实施例还提供的一种保护隐私的多平台数据处理装置。该多平台各自维护有知识图谱,其中,每个平台维护的知识图谱包括若干节点,其中的每个节点代表一个业务实体,该业务实体具有若干实体属性。这里的知识图谱可以包括以下任一种:企业知识图谱、产品知识图谱、人物知识图谱、信息知识图谱、股票知识图谱、基金知识图谱以及机构知识图谱。如图5所示,该装置可以包括:
执行单元502,用于通过与其它各平台执行隐私保护集合求交PSI协议,获取第一平台与其它各平台之间共同的目标业务实体。
执行单元502具体可以用于:
分别将第一平台的各业务实体的名称与预定义字符串拼接后进行哈希运算,得到各条哈希运算结果。
对各条哈希运算结果进行加密,并向PSI服务器发送加密结果。以供PSI服务器在其可信执行环境TEE中对加密结果进行解密,并将解密得到的各条哈希运算结果与其它各平台的各条哈希运算结果进行比对,以确定第一平台与其它各平台之间共同的目标业务实体的指示。
接收目标业务实体的指示,并基于接收的指示以及第一平台维护的各业务实体,确定目标业务实体。
获取单元504,用于对于目标业务实体的若干实体属性中任意的第一属性,采用与其它各平台约定的安全计算方法,获取多平台各自维护的第一属性的各属性值的融合结果的第一子结果并保存。其中,保存的第一子结果用于恢复出第一属性的融合结果,恢复出的融合结果用于确定融合后的知识图谱。
在各属性值各自具有更新时间的情况下,获取单元504具体可以用于:
采用与其它各平台约定的安全计算方法,对各属性值各自的更新时间进行比较。
将对应于最晚更新时间的属性值作为融合结果,并采用秘密分享法,对融合结果进行划分。
获取划分得到的多个子结果中对应于第一平台的第一子结果。
在各属性值有大小关系的情况下,获取单元504具体可以用于:
采用秘密分享法,计算多平台各自维护的第一属性的各属性值的最大值、最小值或者加权平均值,并将计算结果作为第一属性的融合结果。
获取在计算过程中,第一平台维护的数据分片。
将第一平台维护的数据分片作为第一属性的融合结果的第一子结果。
在各属性值有大小关系的情况下,获取单元504还具体可以用于:
采用同态加密法或混淆电路法,计算多平台各自维护的第一属性的各属性值的最大值、最小值或者加权平均值,并将计算结果作为第一属性的融合结果。
采用秘密分享法,对融合结果进行划分,并获取划分得到的多个子结果中对应于第一平台的第一子结果。
在各属性值无大小关系的情况下,获取单元504具体可以用于:
采用与其它各平台约定的安全计算方法,对多平台各自维护的第一属性的各属性值的取值范围进行比较。
将对应于最大取值范围的属性值作为融合结果,并采用秘密分享法,对融合结果进行划分,获取划分得到的多个子结果中对应于第一平台的第一子结果。
可选地,该装置还可以包括:
发送单元506,用于向第一服务器发送融合请求,以使第一服务器获取多平台各自维护的目标业务实体的各实体属性的第一子结果,并将其加载到可信执行环境TEE中,以及在TEE中,将多平台各自维护的目标业务实体的同一实体属性的第一子结果进行求和,以恢复出目标业务实体的各实体属性的融合结果。基于恢复出的融合结果,确定融合后的知识图谱。
可选地,该装置还可以包括:
恢复单元508,用于采用安全计算方法,对多平台各自维护的目标业务实体的同一实体属性的第一子结果进行求和,以恢复出目标业务实体的各实体属性的融合结果。
确定单元510,用于基于恢复出的融合结果,确定融合后的知识图谱。
本说明书上述实施例装置的各功能模块的功能,可以通过上述方法实施例的各步骤来实现,因此,本说明书一个实施例提供的装置的具体工作过程,在此不复赘述。
本说明书一个实施例提供的保护隐私的多平台数据处理装置,可以在保证各平台的数据安全的情况下,对各平台的数据进行处理。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
结合本说明书公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于服务器中。当然,处理器和存储介质也可以作为分立组件存在于服务器中。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述的具体实施方式,对本说明书的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书的具体实施方式而已,并不用于限定本说明书的保护范围,凡在本说明书的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的保护范围之内。

Claims (18)

1.一种保护隐私的多平台数据处理方法,所述多平台各自维护有知识图谱,其中,每个平台维护的知识图谱包括若干节点,其中的每个节点代表一个业务实体,该业务实体具有若干实体属性;所述方法通过所述多平台中任意的第一平台执行,包括:
通过与其它各平台执行隐私保护集合求交PSI协议,获取所述第一平台与所述其它各平台之间共同的目标业务实体;
对于所述目标业务实体的若干实体属性中任意的第一属性,采用与所述其它各平台约定的安全计算方法,获取所述多平台各自维护的第一属性的各属性值的融合结果的第一子结果并保存;其中,保存的所述第一子结果用于恢复出所述第一属性的融合结果;恢复出的所述融合结果用于确定融合后的知识图谱;
所述各属性值各自具有更新时间;
所述采用与所述其它各平台约定的安全计算方法,获取所述多平台各自维护的第一属性的各属性值的融合结果的第一子结果,包括:
采用与所述其它各平台约定的安全计算方法,对所述各属性值各自的更新时间进行比较;
将对应于最晚更新时间的属性值作为所述融合结果,并采用秘密分享法,对所述融合结果进行划分;
获取划分得到的多个子结果中对应于所述第一平台的第一子结果。
2.根据权利要求1所述的方法,所述各属性值有大小关系;
所述采用与所述其它各平台约定的安全计算方法,获取所述第一属性的融合结果的子结果,包括:
采用秘密分享法,计算所述多平台各自维护的第一属性的各属性值的最大值、最小值或者加权平均值,并将计算结果作为所述第一属性的融合结果;
获取在计算过程中,所述第一平台维护的数据分片;
将所述第一平台维护的数据分片作为所述第一属性的融合结果的第一子结果。
3.根据权利要求1所述的方法,所述各属性值有大小关系;
所述采用与所述其它各平台约定的安全计算方法,获取所述第一属性的融合结果的子结果,包括:
采用同态加密法或混淆电路法,计算所述多平台各自维护的第一属性的各属性值的最大值、最小值或者加权平均值,并将计算结果作为所述第一属性的融合结果;
采用秘密分享法,对所述融合结果进行划分,并获取划分得到的多个子结果中对应于所述第一平台的第一子结果。
4.根据权利要求1所述的方法,所述各属性值无大小关系;
所述采用与所述其它各平台约定的安全计算方法,获取所述第一属性的融合结果的子结果,包括:
采用与所述其它各平台约定的安全计算方法,对所述多平台各自维护的第一属性的各属性值的取值范围进行比较;
将对应于最大取值范围的属性值作为所述融合结果,并采用秘密分享法,对所述融合结果进行划分,获取划分得到的多个子结果中对应于所述第一平台的第一子结果。
5.根据权利要求1所述的方法,所述通过与其它各平台执行隐私保护集合求交PSI协议,获取所述第一平台与所述其它各平台之间共同的目标业务实体,包括:
分别将所述第一平台的各业务实体的名称与预定义字符串拼接后进行哈希运算,得到各条哈希运算结果;
对所述各条哈希运算结果进行加密,并向PSI服务器发送加密结果;以供所述PSI服务器在其可信执行环境TEE中对所述加密结果进行解密,并将解密得到的各条哈希运算结果与所述其它各平台的各条哈希运算结果进行比对,以确定所述第一平台与所述其它各平台之间共同的目标业务实体的指示;
接收所述目标业务实体的指示,并基于所述指示以及所述第一平台维护的各业务实体,确定所述目标业务实体。
6.根据权利要求1所述的方法,还包括:
向第一服务器发送融合请求,以使所述第一服务器获取所述多平台各自维护的所述目标业务实体的各实体属性的第一子结果,并将其加载到可信执行环境TEE中,以及在所述TEE中,将所述多平台各自维护的所述目标业务实体的同一实体属性的第一子结果进行求和,以恢复出所述目标业务实体的各实体属性的融合结果;基于恢复出的融合结果,确定融合后的知识图谱。
7.根据权利要求1所述的方法,还包括:
采用所述安全计算方法,对所述多平台各自维护的所述目标业务实体的同一实体属性的第一子结果进行求和,以恢复出所述目标业务实体的各实体属性的融合结果;
基于恢复出的融合结果,确定融合后的知识图谱。
8.根据权利要求1所述的方法,所述知识图谱包括以下任一种:企业知识图谱、产品知识图谱、人物知识图谱、信息知识图谱、股票知识图谱、基金知识图谱以及机构知识图谱。
9.一种保护隐私的多平台数据处理装置,所述多平台各自维护有知识图谱,其中,每个平台维护的知识图谱包括若干节点,其中的每个节点代表一个业务实体,该业务实体具有若干实体属性;所述装置设置于所述多平台中任意的第一平台,包括:
执行单元,用于通过与其它各平台执行隐私保护集合求交PSI协议,获取所述第一平台与所述其它各平台之间共同的目标业务实体;
获取单元,用于对于所述目标业务实体的若干实体属性中任意的第一属性,采用与所述其它各平台约定的安全计算方法,获取所述多平台各自维护的第一属性的各属性值的融合结果的第一子结果并保存;其中,保存的所述第一子结果用于恢复出所述第一属性的融合结果;恢复出的所述融合结果用于确定融合后的知识图谱;
所述各属性值各自具有更新时间;
所述获取单元具体用于:
采用与所述其它各平台约定的安全计算方法,对所述各属性值各自的更新时间进行比较;
将对应于最晚更新时间的属性值作为所述融合结果,并采用秘密分享法,对所述融合结果进行划分;
获取划分得到的多个子结果中对应于所述第一平台的第一子结果。
10.根据权利要求9所述的装置,所述各属性值有大小关系;
所述获取单元具体用于:
采用秘密分享法,计算所述多平台各自维护的第一属性的各属性值的最大值、最小值或者加权平均值,并将计算结果作为所述第一属性的融合结果;
获取在计算过程中,所述第一平台维护的数据分片;
将所述第一平台维护的数据分片作为所述第一属性的融合结果的第一子结果。
11.根据权利要求9所述的装置,所述各属性值有大小关系;
所述获取单元具体用于:
采用同态加密法或混淆电路法,计算所述多平台各自维护的第一属性的各属性值的最大值、最小值或者加权平均值,并将计算结果作为所述第一属性的融合结果;
采用秘密分享法,对所述融合结果进行划分,并获取划分得到的多个子结果中对应于所述第一平台的第一子结果。
12.根据权利要求9所述的装置,所述各属性值无大小关系;
所述获取单元具体用于:
采用与所述其它各平台约定的安全计算方法,对所述多平台各自维护的第一属性的各属性值的取值范围进行比较;
将对应于最大取值范围的属性值作为所述融合结果,并采用秘密分享法,对所述融合结果进行划分,获取划分得到的多个子结果中对应于所述第一平台的第一子结果。
13.根据权利要求9所述的装置,所述执行单元具体用于:
分别将所述第一平台的各业务实体的名称与预定义字符串拼接后进行哈希运算,得到各条哈希运算结果;
对所述各条哈希运算结果进行加密,并向PSI服务器发送加密结果;以供所述PSI服务器在其可信执行环境TEE中对所述加密结果进行解密,并将解密得到的各条哈希运算结果与所述其它各平台的各条哈希运算结果进行比对,以确定所述第一平台与所述其它各平台之间共同的目标业务实体的指示;
接收所述目标业务实体的指示,并基于所述指示以及所述第一平台维护的各业务实体,确定所述目标业务实体。
14.根据权利要求9所述的装置,还包括:
发送单元,用于向第一服务器发送融合请求,以使所述第一服务器获取所述多平台各自维护的所述目标业务实体的各实体属性的第一子结果,并将其加载到可信执行环境TEE中,以及在所述TEE中,将所述多平台各自维护的所述目标业务实体的同一实体属性的第一子结果进行求和,以恢复出所述目标业务实体的各实体属性的融合结果;基于恢复出的融合结果,确定融合后的知识图谱。
15.根据权利要求9所述的装置,还包括:
恢复单元,用于采用所述安全计算方法,对所述多平台各自维护的所述目标业务实体的同一实体属性的第一子结果进行求和,以恢复出所述目标业务实体的各实体属性的融合结果;
确定单元,用于基于恢复出的融合结果,确定融合后的知识图谱。
16.根据权利要求9所述的装置,所述知识图谱包括以下任一种:企业知识图谱、产品知识图谱、人物知识图谱、信息知识图谱、股票知识图谱、基金知识图谱以及机构知识图谱。
17.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-8中任一项所述的方法。
18.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-8中任一项所述的方法。
CN202011280164.6A 2020-11-16 2020-11-16 保护隐私的多平台数据处理方法及装置 Active CN112100680B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011280164.6A CN112100680B (zh) 2020-11-16 2020-11-16 保护隐私的多平台数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011280164.6A CN112100680B (zh) 2020-11-16 2020-11-16 保护隐私的多平台数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN112100680A CN112100680A (zh) 2020-12-18
CN112100680B true CN112100680B (zh) 2021-02-05

Family

ID=73784599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011280164.6A Active CN112100680B (zh) 2020-11-16 2020-11-16 保护隐私的多平台数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN112100680B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836868A (zh) * 2021-01-22 2021-05-25 支付宝(杭州)信息技术有限公司 一种链接预测模型的联合训练方法和装置
CN112487489B (zh) * 2021-02-05 2021-04-27 支付宝(杭州)信息技术有限公司 保护隐私的联合数据处理方法及装置
CN113254989B (zh) * 2021-04-27 2022-02-15 支付宝(杭州)信息技术有限公司 目标数据的融合方法、装置和服务器
CN115378624B (zh) * 2022-04-14 2024-01-30 中国电信股份有限公司 知识图谱构建方法、装置、电子设备及存储介质
CN114866312A (zh) * 2022-04-24 2022-08-05 支付宝(杭州)信息技术有限公司 一种保护数据隐私的共有数据确定方法及装置
CN114692209B (zh) * 2022-05-31 2022-09-20 蓝象智联(杭州)科技有限公司 一种基于混淆技术的图联邦方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886029B (zh) * 2019-01-28 2020-09-22 湖北工业大学 基于多项式表示的隐私保护集合交集计算方法与系统
CN111259443B (zh) * 2020-01-16 2022-07-01 百融云创科技股份有限公司 一种基于psi技术保护联邦学习预测阶段隐私的方法
CN111401483B (zh) * 2020-05-15 2022-05-17 支付宝(杭州)信息技术有限公司 样本数据处理方法、装置及多方模型训练系统
CN111539026B (zh) * 2020-06-19 2020-09-29 支付宝(杭州)信息技术有限公司 针对隐私数据进行安全运算的方法和装置

Also Published As

Publication number Publication date
CN112100680A (zh) 2020-12-18

Similar Documents

Publication Publication Date Title
CN112100680B (zh) 保护隐私的多平台数据处理方法及装置
ES2687182T3 (es) Determinar un secreto común para el intercambio seguro de información y claves criptográficas jerárquicas y deterministas
CN111079128B (zh) 一种数据处理方法、装置、电子设备以及存储介质
US20190356472A1 (en) Blockchain-implemented method and system
US10693657B2 (en) Method and apparatus for verifying processed data
CN110602147B (zh) 一种基于云平台的数据加密安全存储方法、系统和存储介质
KR101982237B1 (ko) 클라우드 컴퓨팅 환경에서의 속성 기반 암호화를 이용한 데이터 공유 방법 및 시스템
US10700855B2 (en) Reinforcement learning-based encryption and decryption method and client and server system performing the same
US20200235925A1 (en) Access to secured information
CN112131316A (zh) 应用于区块链系统的数据处理方法及装置
Soltani et al. Practical key recovery model for self-sovereign identity based digital wallets
US20240121089A1 (en) Protecting data using controlled corruption in computer networks
CN112307504B (zh) 一种安全多方计算方法、装置、电子设备及存储介质
CN112118245B (zh) 密钥管理方法、系统和设备
CN114219052A (zh) 一种图数据融合方法、装置、电子设备及存储介质
CN115905633A (zh) 一种隐私保护的图相似性检索方法及系统
Soltani et al. Decentralized and privacy-preserving key management model
US11101975B2 (en) Ciphertext matching system and ciphertext matching method
CN117155549A (zh) 密钥分发方法、装置、计算机设备和存储介质
US20220216999A1 (en) Blockchain system for supporting change of plain text data included in transaction
CN116155483A (zh) 区块链签名机安全设计方法及签名机
CN114650188A (zh) 一种基于代理节点的数据安全传输方法及装置
CN114692209A (zh) 一种基于混淆技术的图联邦方法及系统
CN114398651A (zh) 秘密数据共享方法及分布式系统
CN107193884B (zh) 一种匹配数据的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40042994

Country of ref document: HK