CN112800466A - 基于隐私保护的数据处理方法、装置和服务器 - Google Patents

基于隐私保护的数据处理方法、装置和服务器 Download PDF

Info

Publication number
CN112800466A
CN112800466A CN202110183313.5A CN202110183313A CN112800466A CN 112800466 A CN112800466 A CN 112800466A CN 202110183313 A CN202110183313 A CN 202110183313A CN 112800466 A CN112800466 A CN 112800466A
Authority
CN
China
Prior art keywords
matrix
server
data
fragmentation
intermediate result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110183313.5A
Other languages
English (en)
Other versions
CN112800466B (zh
Inventor
周亚顺
尹栋
李漓春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202110183313.5A priority Critical patent/CN112800466B/zh
Publication of CN112800466A publication Critical patent/CN112800466A/zh
Application granted granted Critical
Publication of CN112800466B publication Critical patent/CN112800466B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书提供了基于隐私保护的数据处理方法、装置和服务器。针对分开持有特征数据和标签数据,且一方所持有的标签数据包含多种标签的复杂场景,第一服务器和第二服务器可以先基于秘密分享算法各自计算得到乘积秘密的第一分片矩阵和第二分片矩阵,并分别将上述分片矩阵发送至第三服务器;第三服务器先合并分片矩阵得到乘积秘密的明文数据矩阵,再根据预设的处理规则,对乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵,并将从中间结果数据矩阵拆分出的分片矩阵分别提供给第一服务器和第二服务器。从而可以适用标签种类较多的复杂场景,能够在保护参与方的数据隐私的前提下,高效地通过合作确定出中间结果数据矩阵的分片矩阵。

Description

基于隐私保护的数据处理方法、装置和服务器
技术领域
本说明书属于互联网技术领域,尤其涉及基于隐私保护的数据处理方法、装置和服务器。
背景技术
在一些数据处理场景(例如,联合建模场景等)中,有时会存在数据隔离。例如,参与数据处理的一方持有特征数据,另一方持有标签数据,且要求双方在合作进行相关数据处理的不能向对方泄露己方所持有的数据。
针对上述场景,通常需要在保护各自数据隐私的前提下,先通过合作确定出基于乘积秘密所得到的中间结果数据的分片(例如,基于激励函数得到的share);双方可以利用各自分别持有的中间结果数据的分片,再通过合作,进行进一步的数据处理(例如,模型训练等)。
但针对一些相对更复杂的场景,例如,其中一方所持有的标签数据所包含的标签种类较多(例如,大于2)的情况,基于上述方法,数据处理过程将会变得较为复杂、繁琐,且难以较好地兼顾数据隐私的保护和处理效率。
因此,亟需一种能适用于所涉及的标签种类较多,且存在数据隔离的复杂场景,在保护参与方的数据隐私的前提下,高效地通过合作确定出中间结果数据矩阵的分片矩阵的方法。
发明内容
本说明书提供了一种基于隐私保护的数据处理方法、装置和服务器,以适用于所涉及的标签数据的标签种类较多,且存在数据隔离的复杂场景,能够在保护参与方的数据隐私的前提下,高效地通过合作确定出中间结果数据矩阵的分片矩阵。
本说明书提供的一种基于隐私保护的数据处理方法、装置和服务器是这样实现的:
一种基于隐私保护的数据处理方法,应用于第二服务器,包括:接收第三服务器响应触发请求生成并发送的第二随机数集;并获取初始模型参数矩阵的第二分片矩阵;基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵;其中,所述标签数据的种类数大于2;将所述乘积秘密的第二分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第一服务器的乘积秘密的第一分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;接收所述中间结果数据矩阵的第二分片矩阵。
一种基于隐私保护的数据处理方法,应用于第三服务器,包括:响应触发请求,生成第一随机数集和第二随机数集,并将所述第一随机数集发送至第一服务器,将所述第二随机数集发送至第二服务器;其中,所述第一服务器持有特征数据,所述第二服务器持有标签数据,所述标签数据的种类数大于2;接收关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵和第二分片矩阵;并合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;将所述中间结果数据矩阵的第一分片矩阵发送至第一服务器;将所述中间结果数据矩阵的第二分片矩阵发送至第二服务器。
一种基于隐私保护的数据处理方法,应用于第一服务器,包括:接收第三服务器响应触发请求生成并发送的第一随机数集;并获取初始模型参数矩阵的第一分片矩阵;基于秘密分享算法,根据所述第一随机数集、所述初始模型参数矩阵的第一分片矩阵,以及基于所持有的特征数据所构建的特征数据矩阵,与持有标签数据的第二服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵;其中,所述标签数据的种类数大于2;将所述乘积秘密的第一分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第二服务器的乘积秘密的第二分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;接收所述中间结果数据矩阵的第一分片矩阵。
一种基于隐私保护的数据处理装置,包括:第一接收模块,用于接收第三服务器响应触发请求生成并发送的第二随机数集;并获取初始模型参数矩阵的第二分片矩阵;处理模块,用于基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵;其中,所述标签数据的种类数大于2;发送模块,用于将所述乘积秘密的第二分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第一服务器的乘积秘密的第一分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;第二接收模块,用于接收所述中间结果数据矩阵的第二分片矩阵。
一种基于隐私保护的数据处理装置,包括:生成模块,用于响应触发请求,生成第一随机数集和第二随机数集,并将所述第一随机数集发送至第一服务器,将所述第二随机数集发送至第二服务器;其中,所述第一服务器持有特征数据,所述第二服务器持有标签数据,所述标签数据的种类数大于2;接收模块,用于接收关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵和第二分片矩阵;并合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;处理模块,用于根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;发送模块,用于将所述中间结果数据矩阵的第一分片矩阵发送至第一服务器;将所述中间结果数据矩阵的第二分片矩阵发送至第二服务器。
一种基于隐私保护的数据处理装置,包括:第一接收模块,用于接收第三服务器响应触发请求生成并发送的第一随机数集;并获取初始模型参数矩阵的第一分片矩阵;处理模块,用于基于秘密分享算法,根据所述第一随机数集、所述初始模型参数矩阵的第一分片矩阵,以及基于所持有的特征数据所构建的特征数据矩阵,与持有标签数据的第二服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵;其中,所述标签数据的种类数大于2;发送模块,用于将所述乘积秘密的第一分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第二服务器的乘积秘密的第二分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;第二接收模块,用于接收所述中间结果数据矩阵的第一分片矩阵。
一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现上述基于隐私保护的数据处理方法的相关步骤。
本说明书提供的基于隐私保护的数据处理方法、装置和服务器,基于该方法,负责提供数据服务的第三服务器先响应触发请求生成相应的第一随机数集和第二随机数集;并将第一随机数集发送给持有特征数据的第一服务器,将第二随机数集发送给持有多个标签种类的标签数据的第二服务器;第二服务器可以基于秘密分享算法,根据第二随机数集、初始模型参数矩阵的第二分片矩阵,以及基于标签数据构建得到标签数据矩阵,与持有第一随机数集、初始模型参数矩阵的第一分片矩阵,以及基于特征数据构建得到的特征数据矩阵的第一服务器合作,各自分别计算得到的关于特征数据矩阵与初始模型参数矩阵的乘积秘密的一个分片矩阵;再分别将各自得到的乘积秘密的分片矩阵发送给第三服务器;第三服务器先通过合并分片矩阵,得到乘积秘密的明文数据矩阵;再通过根据预设的处理规则,对乘积秘密的明文数据矩阵进行相应的softmax处理,高效得到中间结果数据矩阵;并将该中间结果数据矩阵拆分成两个分片矩阵,分别发送给第一服务器和第二服务器。从而可以适用于第一服务器持有特征数据,第二服务器持有标签数据,存在数据隔离,且第二服务器所持有的标签数据中标签种类较多的复杂场景,能够在保护参与方的数据隐私的前提下,高效、准确地通过合作确定出中间结果数据矩阵的分片矩阵。
附图说明
为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是应用本说明书实施例提供的基于隐私保护的数据处理方法的系统的结构组成的一个实施例的示意图;
图2是本说明书的一个实施例提供的基于隐私保护的数据处理方法的流程示意图;
图3是在一个场景示例中,应用本说明书实施例提供的基于隐私保护的数据处理方法的一种实施例的示意图;
图4是在一个场景示例中,应用本说明书实施例提供的基于隐私保护的数据处理方法的一种实施例的示意图;
图5是本说明书的一个实施例提供的基于隐私保护的数据处理方法的流程示意图;
图6是本说明书的一个实施例提供的基于隐私保护的数据处理方法的流程示意图;
图7是本说明书的一个实施例提供的服务器的结构组成示意图;
图8是本说明书的一个实施例提供的基于隐私保护的数据处理装置的结构组成示意图;
图9是本说明书的一个实施例提供的基于隐私保护的数据处理装置的结构组成示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
本说明书实施例提供了一种基于隐私保护的数据处理方法,该方法具体可以应用于包含有第一服务器、第二服务器和第三服务器的数据处理系统中。具体可以参阅图1所示。第一服务器、第二服务器和第三服务器相互之间可以通过有线或无线的方式相连,以进行具体的数据交互。
其中,上述第一服务器具体可以理解为部署于第一数据方一侧的服务器。具体的,第一服务器至少可以持有第一数据方(例如,某购物网站等)所拥有的特征数据,例如,用户的性别、用户的月消费金额、用户地址等数据。
上述第二服务器具体可以理解为部署于第二数据方一侧的服务器。具体的,第二服务器至少可以持有第二数据方(例如,某信用评价机构等)所拥有的标签数据,例如,用户的信用风险标签、用户的借贷评级标签等等。且,第二服务器所持有的标签数据的标签种类数至少大于2。此外,上述第二服务器也可以持有部分特征数据,例如,用户的月收入数据、用户的还贷数据等等。
需要说明的是,第一服务器所持有的特征数据,与第二服务器所持有的标签数据对应相同的标识信息(例如,同一个用户的身份标识等)。
上述第三服务器具体可以理解为部署于独立第三方一侧的服务器。具体的,上述第三方具体可以为独立于第一数据方、第二数据方,负责为第一服务器和第二服务器生成符合具体要求的随机数数据,以及诸如统计计算等部分数据处理的数据服务提供方。
在本实施例中,上述第一服务器、第二服务器、第三服务器具体可以包括一种能够实现数据传输、数据处理等功能的后台服务器。具体的,上述第一服务器、第二服务器、第三服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,上述第一服务器、第二服务器、第三服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定上述第一服务器、第二服务器、第三服务器所包含的服务器数量。上述第一服务器、第二服务器、第三服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
当前要求针对第一服务器和第二服务器存在数据隔离,且第二服务器所持有的标签数据包含有多个种类标签的复杂场景,能够在保护参与双方各自所持有数据的数据隐私、避免对外泄露己方所持有的数据的前提下,高效地同合作生成并分别持有一个关于特征数据矩阵与初始模型参数矩阵的乘积秘密的一个分片矩阵(例如,一个share)。
在本实施例中,具体实施时,可以是由第一服务器或第二服务器在系统中发起触发请求。
相应的,在第三服务器一侧,第三服务器可以响应所述触发请求,先基于秘密分享算法,生成符合当前场景要求的第一随机数集和第二随机数集。其中,上述第一随机数集进一步可以包括:第一子随机数集U和第二子随机数集Z0。上述第二随机数集进一步可以包括:第三子随机数集V和第四子随机数集Z1。其中,上述第一随机数集和第二随机数集满足以下预设的数据关系:U*V=Z0+Z1。
接着,第三服务器可以将上述第一随机数集分发给第一服务器;将上述第二随机数集分发给第二服务器。
在第一服务器一侧,第一服务器接收上述第一随机数集。同时,第一服务器可以根据所持有的特征数据,构建出对应的特征数据矩阵。此外,第一服务器还可以获取得到初始模型参数矩阵的第一分片矩阵(可以记为X)。
在第二服务器一侧,第二服务器接收上述第二随机数集。同时,第二服务器可以先对所持有的对应相同标识信息的标签数据进行预设的编码处理,根据编码结果,得到与该标识信息对应的标签向量。其中,上述标签向量所包含的数据元素的个数等于标签数据的种类数,且标签向量中每一个数据元素对应一种标签。此外,第二服务器还可以获取得到初始模型参数矩阵的第二分片矩阵(可以记为Y)。
进一步,第一服务器可以基于秘密分享算法,利用第一随机数集、初始模型参数矩阵的第一分片矩阵,以及特征数据矩阵,与利用第二随机数集、初始模型参数矩阵的第二分片矩阵,以及标签数据矩阵的第二服务器合作,各自计算得到各自持有的关于特征数据矩阵与初始模型参数矩阵的乘积秘密的分片矩阵。其中,第一服务器计算得到上述乘积秘密的第一分片矩阵,第二服务器计算得到上述乘积秘密的第二分片矩阵。
第一服务器和第二服务器在基于秘密分享算法进行合作时,第一服务器可以根据特征数据矩阵、第一随机数子集和初始模型参数矩阵的第一分片矩阵,计算得到对应的第一中间矩阵(例如,E)。同时,第二服务器可以根据第三随机数子集和初始模型参数矩阵的第二分片矩阵,计算得到对应的第二中间矩阵(例如,F)。
接着,第一服务器可以将第一中间矩阵发送至第二服务器。第二服务器可以将第二中间矩阵发送至第一服务器。
在第一服务器一侧,第一服务器可以根据第一随机数子集、第二中间矩阵和第二随机数子集,计算得到对应的关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵(例如,C0)。并将上述乘积秘密的第一分片矩阵发送给第三服务器。
在第二服务器一侧,第二服务器可以根据第一中间矩阵、第三随机数子集和第四随机数子集,计算得到对应的关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵(例如,C1)。并将上述乘积秘密的第二分片矩阵发送至第三服务器。
相应的,第三服务器接收乘积秘密的第一分片矩阵和第二分片矩阵,并合并上述第一分片矩阵和第二分片矩阵得到乘积秘密的明文数据矩阵。
需要说明的是,这里第三服务器所得到的乘积秘密的明文数据矩阵只是一种统计值,无法知道具体的特征数据的数据值,以及具体的标签数据的数据值。因此,不会对第一服务器和第二服务器所持有的数据造成泄漏。
进一步,第三服务器可以根据考虑了涉及多种类标签后的所改进的预设的处理规则,对上述乘积秘密的明文数据矩阵进行相应的softmax处理(或者称softmax操作),得到对应的中间结果数据矩阵(可以记为A);再对中间结果数据矩阵进行拆分,得到中间结果数据矩阵的第一分片矩阵和第二分片矩阵。并将中间结果数据矩阵的第一分片矩阵发送给第一服务器;将中间结果数据矩阵的第二分片矩阵发送给第二服务器。
第一服务器得到中间结果数据矩阵的第一分片矩阵,并基于秘密分享算法,利用上述中间结果数据矩阵的第一分片矩阵,与得到中间结果数据矩阵的第二分片矩阵的第二服务器合作,通过联合训练,最终得到符合要求的目标模型。
通过上述实施例,可以适用于第一服务器持有特征数据,第二服务器持有标签数据,存在数据隔离,且第二服务器所持有的标签数据的标签种类较多的复杂场景,能够在保护参与方的数据隐私的前提下,高效、准确地通过合作确定出中间结果数据矩阵的分片矩阵;进一步,可以再分别根据各自所持有的中间结果数据矩阵的分片矩阵,联合训练得到目标模型。
参阅图2所示,本说明书实施例提供了一种基于隐私保护的数据处理方法。其中,该方法具体应用于第二服务器一侧。具体实施时,该方法可以包括以下内容。
S201:接收第三服务器响应触发请求生成并发送的第二随机数集;并获取初始模型参数矩阵的第二分片矩阵。
在一些实施例中,上述第一服务器持有多个特征数据,其中,每个特征数据与一组标识信息中的一个标识信息对应。上述第二服务器持有多个标签数据。其中,每个标签数据与相同一组标识信息中的一个标识信息对应。上述第三服务器独立于第一服务器和第二服务器,为负责提供随机数数据,以及部分数据计算、统计等数据处理服务的第三方服务器。
在一些实施例中,针对模型训练场景,上述特征数据具体可以包括用于表征标识信息所对应的数据对象的数据特征的参数数据。例如,用户A的年龄、职业、月收入等特征。相应的,上述数据标签具体可以包括用于表征标识信息所对应的数据对象的对象类型的参数数据。例如,用户A为有固定收入的用户,同时为存在不良还款记录的用户,还为高新技术人才用户等。在本实施例中,上述第二服务器所持有的对应同一个标识信息的多个不同种类的标签具体可以是互斥的标签。
在一些更加复杂的模型训练场景中,上述第二服务器除了可以持有标签数据外,还可以同时持有对应相同标识信息的其他特征数据。
在一些实施例中,针对其他类型的应用场景,第一服务器和第二服务器还可以分别持有其他不同类型的数据。
具体的,例如,在数据统计场景中,第一服务器还可以持有与一组标识信息分别对应的多个第一类统计数据。例如,用户B的工作月份统计数据。相应的,第二服务器可以持有与同一组标识信息分别对应的多个第二类统计数。例如,用户B的月收入统计数据。
当然,需要说明的是,上述所列举的应用场景,以及与上述应用场景相关的第一服务器和第二服务器各自持有的数据只是一种示意性说明。具体实施时,根据具体情况和处理需求,还可以应用于其他类型的应用场景中,第一服务器和第二服务器还可以分别持有其他类型的数据。对此,本说明书不作限定。
在一些实施例中,当需要第一服务器和第二服务器合作,计算得到中间结果数据矩阵的分片矩阵时,第一服务器或第二服务器可以先在系统中发起触发请求。
相应的,第一服务器、第二服务器和第三服务器可以先响应上述触发请求分别进行准备阶段的数据处理;然后在实施阶段,由第一服务器、第二服务器和第三服务器进行三方合作,由第三服务器计算得到用于后续模型训练的中间结果数据矩阵的第一分片矩阵和第二分片矩阵,并将中间结果数据矩阵的第一分片矩阵提供给第一服务器持有,将中间结果数据矩阵的第二分片矩阵提供给第二服务器持有。
在一些实施例中,在准备阶段,可以参阅图3所示,第三服务器可以响应上述触发请求,生成符合要求的第一随机数集和第二随机数集。其中,上述第一随机数集包含有第一随机数子集、第二随机数子集;上述第二随机数集包含有第三随机数子集、第四随机数子集。且,上述第一随机数子集、第二随机数子集、第三随机数子集和第四随机数子集相互之间满足预设的数据关系。
进一步,第三服务器可以将上述第一随机数集发送给第一服务器;并将第二随机数集发送给第二服务器。
在第二服务器一侧,参阅图3所示,在准备阶段,第二服务器可以接收上述第二随机数集。同时,第二服务器还可以获取基于所持有的标签数据构建的标签数据矩阵(例如,Y)。
在一些实施例中,具体实施时,第二服务器可以按照以下方式获取相应的标签数据矩阵:对所持有的标签数据进行预设的编码处理,得到与标识信息对应的标签向量;其中,所述标签向量所包含的数据元素的个数等于标签数据的种类数;根据标签向量所对应的标识信息,排列多个标签向量,以构建得到标签数据矩阵。
在一些实施例中,标签向量中的每一个数据元素分别对应一种标签。上述标签向量用于表征与标识信息对应的数据对象与多种标签之间的对应关系。
具体的,对应某个标识信息的标签向量中的某个数据元素的数据值为预设数据值(例如,1),则表征与该标识信息对应的数据对象具有与该数据元素对应的标签。相反,则表征与该标识信息对应的数据对象不具有与该数据元素对应的标签。
例如,与标识信息t对应的标签向量可以表示为以下形式:[0,0,0,1]。基于该标签向量,首先可以确定出第二服务器所持有的标签数据可以分4个种类,分别是对应向量中从左往右数的第一个数据元素(可以记为标签1)、第二个数据元素(可以记为标签2)、第三个数据元素(可以记为标签3)和第四个数据元素(可以记为标签4)的4种标签。其中,上述标签1、标签2、标签3和标签4具体可以是四种互斥的不同种类的标签。
进一步,针对该标签向量,由于第一个数据元素的数据值为0,不等于预设数据值1,则可以确定与标识信息t对应的数据对象不具有标签1。同理,可以确定该数据对象也不具有标签2和标签3。又由于第四个数据元素的数据值为1,等于预设数据值,则可以确定该数据对象具有标签4。
在一些实施例中,上述预设的编码处理具体可以包括one-hot编码。其中,上述one-hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都有独立的寄存器位,并且在任意时候只有一位有效。
在一些实施例中,在按照上述方式得到与标识信息对应的多个标签向量后,可以根据基于标识信息的排列顺序(例如,基于标识信息的首字母的排列顺序,或者基于标识信息的哈希值的数值排列顺序等),排列多个标签向量的转置向量,得到符合要求的标签数据矩阵。
类似的,在第一服务器一侧,参阅图3所示,在准备阶段,第一服务器可以接收上述第一随机数集。同时,第一服务器还可以获取基于所持有的特征数据构建的特征数据矩阵(例如,X)。
在一些实施例中,具体实施时,第一服务器可以按照以下方式获取相应的特征数据矩阵:根据对应同一个标识信息的多种特征数据的数据值,构建对应该标识信息的特征向量;其中,所述特征向量所包含的数据元素的个数等于特征数据的种类数,且所述特征向量所包含的各个数据元素的数据值与一种特征数据的数据值对应;根据特征数据所对应的标识信息,排列多个特征向量,以构建得到特征数据矩阵。
在一些实施例中,在按照上述方式得到与标识信息对应的多个特征向量后,可以根据基于标识信息的与排列标签向量所使用的相同的排列顺序,排列多个特征向量的转置向量,得到符合要求的特征数据矩阵。
在准备阶段,第二服务器还可以获取初始模型参数矩阵(可以记为W0)的第二分片矩阵(可以记为W0-2)。同时,第一服务器可以获取初始模型参数矩阵的第一分片矩阵(可以记为W0-1)。
在一些实施例中,第二服务器可以通过与第一服务器合作,在第二服务器本地生成上述初始模型参数矩阵的第二分片矩阵。
具体的,可以包括:统计标签数据的种类数(可以记为N);将所述标签数据的种类数发送至第一服务器;同时,接收第一服务器统计并发送的特征数据的种类数(可以记为k)。进一步,第二服务器可以根据所述标签数据的种类数和所述特征数据的种类数,在第二服务器一侧构建得到初始模型参数矩阵的第二分片矩阵。其中,所述初始模型参数矩阵的第二分片矩阵的行数和列数分别等于所述标签数据的种类数和特征数据的种类数,维度为N*k的初始模型参数矩阵的第二分片矩阵。
类似的,第一服务器可以根据标签数据的种类数和特征数据的种类数,在第一服务器一侧构建得到初始模型参数矩阵的第一分片矩阵。其中,所述初始模型参数矩阵的第一分片矩阵的行数和列数分别等于所述标签数据的种类数和特征数据的种类数,维度为N*k的初始模型参数矩阵的第一分片矩阵。
在一些实施例中,第二服务器还可以通过与第三服务器交互,以获取在第三服务器侧生成的上述初始模型参数矩阵的第二分片矩阵。
具体的,第二服务器在统计标签数据的种类数之后,所述方法还可以包括:将所述标签数据的种类数发送至第三服务器。同时,第一服务器将统计得到的特征数据的种类数发送至第三服务器。
第三服务器还接收来自第一服务器的特征数据的种类数和来自第二服务器的标签数据的种类数;并根据所述特征数据的种类数和所述标签数据的种类数,构建初始模型参数矩阵;其中,所述初始模型参数矩阵的行数和列数分别等于所述标签数据的种类数和特征数据的种类数。第三服务器将所述初始模型参数矩阵拆分为初始模型参数矩阵的第一分片矩阵和第二分片矩阵;再将初始模型参数矩阵的第一分片矩阵发送至第一服务器,将初始模型参数矩阵的第二分片矩阵发送至第二服务器。
相应的,第二服务器接收并获取上述初始模型参数矩阵的第二分片矩阵。类似的,第一服务器也可以通过与第三服务器交互,接收并获取初始模型参数矩阵的第一分片矩阵。
S202:基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵;其中,所述标签数据的种类数大于2。
在本实施例中,上述秘密分享算法(Secret Sharing,SS)具体是指一种保护数据隐私安全的算法,基于该算法,多个数据方可以在不泄漏自身数据的前提下,通过秘密分享进行协作计算,共享秘密信息,使得各个数据方可以分别获得秘密信息的一个分片。
在一些实施例中,参阅图3所示,在处理阶段,第一服务器和第二服务器在基于秘密分享算法进行合作分别计算得到第一中间矩阵和第二中间矩阵;并相互交换各自计算得到的中间矩阵;再利用交换得到的中间矩阵,进行联合计算(例如,进行以下算式的运算:Z=W0*X.T,其中,Z表示特征数据矩阵与初始模型参数矩阵的乘积秘密的明文数据矩阵,X.T表示X的转置矩阵),得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵(例如,Z-1)和第二分片矩阵(例如,Z-2)。
具体的,第二服务器可以根据第三随机数子集和初始模型参数矩阵的第二分片矩阵,基于秘密分享算法,计算得到对应的第二中间矩阵;并将第二中间矩阵发送至第一服务器。
同时,第一服务器可以根据第一随机数子集、特征数据矩阵和初始模型参数矩阵的第一分片矩阵,基于秘密分享算法,计算得到对应的第一中间矩阵;并将第一中间矩阵发送至第二服务器。
进而,第二服务器可以根据第一随机数子集、第二中间矩阵,以及第二随机数子集,基于秘密分享算法,计算得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵。
同时,第一服务器可以根据第三随机数子集、第一中间矩阵,以及第四随机数子集,基于秘密分箱算法,计算得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵。
S203:将所述乘积秘密的第二分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第一服务器的乘积秘密的第一分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵。
在本实施例中,上述softmax处理具体可以理解为一种基于softmax逻辑回归模型的数据处理。其中,softmax逻辑回归模型是基于逻辑回归模型在多分类问题上的推广所得到的模型结构。上述中间结果数据矩阵(可以记为A),也可以称为激活矩阵,可以理解为一种以softmax函数作为激活函数所得到的激活数据,类似于简单场景(例如,所涉及到的标签数据的标签种类不超过2的联合建模场景)中以sigmoid作为激活函数所得到的激活值。
在一些实施例中,参阅图3所示,第二服务器可以将上述乘积秘密的第二分片矩阵发送至第三服务器。同时,第一服务器可以将上述乘积秘密的第一分片矩阵发送至第三服务器。
相应的,第三服务器可以接收到乘积秘密的第一分片矩阵和第二分片矩阵,并独立地对上述乘积秘密的第一分片矩阵和第二分片矩阵进行相应处理,以得到后续用于联合模型训练的中间结果数据矩阵的第一分片矩阵和第二分片矩阵;并将中间结果数据矩阵的第一分片矩阵发送至第一服务器,将中间结果数据矩阵的第二分片矩阵发送至第二服务器。
在一些实施例中,参阅图3所示,第三服务器可以先将所述乘积秘密的第一分片矩阵和第二分片矩阵进行合并,得到所述乘积秘密的明文数据矩阵。
进一步,又考虑到针对存在数据隔离,且标签数据中标签种类较多的复杂场景,上述通过合并恢复得到乘积秘密不同于简单场景(例如,只存在正标签和负标签两种标签)所得到向量数据形式的乘积秘密,而是一种复杂的矩阵数据。
为了能够更加高效、准确地对上述乘积秘密的明文数据矩阵进行处理,以得到效果较好的中间结果数据矩阵,可以结合乘积秘密的明文数据矩阵的具体特点,利用改进后的预设的处理规则,对上述乘积秘密的明文数据矩阵进行相应的softmax处理。其中,上述预设的处理规则具体可以理解为一种针对乘积秘密的明文数据矩阵的数据特点进行改进后的,用于进行softmax运算的处理规则。
在一些实施例中,第三服务器可以根据上述改进了的预设的处理规则,对上述乘积秘密的明文数据矩阵进行具体的softmax处理,以高效、准确地得到对应的中间结果数据矩阵。
在一些实施例中,具体实施时,根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,可以包括:根据预设的处理规则,将所述乘积秘密的明文数据矩阵按列拆分成按顺序排列的多个第一向量;对所述多个第一向量分别进行softmax处理,得到对应的多个第二向量;根据第二向量与第一向量的对应关系,以及第一向量的排列顺序,组合所述多个第二向量,得到所述中间结果数据矩阵。
具体的,例如,可以参阅图4所示,第三服务器合并得到的乘积秘密的明文数据矩阵为3*4的矩阵数据。其中,标签数据的种类数为3,且所涉及到的参与训练的数据对象(或者标识信息)的数量为4。
第三服务器具体根据预设的处理规则对上述乘积秘密的明文数据矩阵进行相应的softmax处理时,可以先按列从该矩阵拆分出以下多个第一向量:与第一列对应的第一个第一向量[2,3,4](记为p1-1)、与第二列对应的第二个第一向量[1,1,2](记为p1-2)、与第三列对应的第三个第一向量[3,2,1](记为p1-3)、与第四列对应的第四个第一向量[3,2,4](记为p1-4)。并记录下上述四个第一向量的排列顺序,即:p1-1,p1-2,p1-3,p1-4。
再对每一个第一向量分别进行softmax处理,得到对应的第二向量。具体的,可以对每一个第一向量中所包含各个数据元素分别进行softmax计算,得到各个数据元素的softmax值。再根据各个数据元素的softmax值,构建得到对应的第二向量。
具体实施时,可以先按照以下算式计算出第一向量中各个数据元素的softmax值:
Figure BDA0002942700810000131
其中,zi表示第一向量中编号为i的数据元素,softmax(zi)表示第一向量中编号为i的数据元素的softmax值,T表示第一向量中所包含的数据元素的总数。
以对第一向量p1-1进行softmax处理,得到对应的第二向量p2-1为例。利用上述算式,可以计算出与p1-1所包含各个数据元素分别对应的softmax值:
Figure BDA0002942700810000132
Figure BDA0002942700810000133
再按照p1-1中各个数据元素的排列顺序,排列上述对应的softmax值,可以得到对应的第二向量p2-1,表示为:[0.0903,0.2447,0.665]。
按照上述方式可以计算出与基于乘积秘密的明文数据矩阵得到的多个第一向量分别对应的多个第二向量,分别表示为p2-1,p2-2,p2-3,p2-4。
进一步,可以参阅图4所示,对上述多个第二向量进行转置处理,得到对应的第二向量的转置向量,分别可以表示p2-1.T,p2-2.T,p2-3.T,p2-4.T。例如,对应的p2-1的转置向量具体可以表示为:[0.0903,0.2447,0.665]T
再根据第二向量与第一向量的对应关系,按照基于乘积秘密的明文数据矩阵所确定出第一向量的排列顺序,排列多个第二向量的转置向量,以得到符合要求的中间结果数据矩阵。
通过上述实施例,第三服务器可以有效地处理复杂场景中构建得到较为复杂的、矩阵数据形式的乘积秘密,并较为高效、准确地处理得到效果较好的中间结果数据矩阵。
在一些实施例中,第三服务器可以将上述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和第二分片矩阵两部分;再将中间结果数据矩阵的第一分片矩阵发送至第一服务器,将中间结果数据矩阵的第二分片矩阵发送至第二服务器。
S204:接收所述中间结果数据矩阵的第二分片矩阵。
在本实施例中,第二服务器可以接收得到第三服务器生成并发送的中间结果数据矩阵的第二分片矩阵。同时,第一服务器也可以接收得到第三服务器生成并发送的中间结果数据矩阵的第一分片矩阵。
在一些实施例中,在接收所述中间结果数据矩阵的第二分片矩阵之后,所述方法具体实施时,还可以包括以下内容:基于秘密分享算法,根据所述中间结果数据矩阵的第二分片矩阵和标签数据矩阵,与第一服务器合作,通过联合训练,以得到目标模型。
在本实施例中,上述目标模型具体可以理解为一种基于数据对象的特征数据,能够同时预测出该数据对象是否具有多种标签的预测模型。
在一些实施例中,具体实施时,第一服务器和第二服务器可以基于秘密分享算法进行合作,利用第一服务器所持有的特征数据矩阵、中间结果数据矩阵的第一分片矩阵,以及第二服务器所持有的标签数据矩阵、中间结果数据矩阵的第二分片矩阵,通过联合训练,以分别得到目标模型参数矩阵的第一分片矩阵和第二分片矩阵,从而确定出了符合要求的目标模型。其中,将上述目标模型参数矩阵的第一分片矩阵和第二分片矩阵合并,可以得到完整的目标模型的模型参数。
在一些实施例中,具体进行联合训练时,第二服务器可以先基于秘密分享算法,根据所持有的中间结果数据矩阵的第二分片矩阵,以及标签数据矩阵,与第一服务器进行第一类合作,计算得到模型梯度数据矩阵(可以记为dW)的第二分片矩阵。
同时,第一服务器可以基于秘密分享算法,根据所持有的中间结果数据矩阵的第一分片矩阵,以及特征数据矩阵,与第二服务器进行第一类合作,得到模型梯度数据矩阵的第一分片矩阵。
在进行上述第一类合作之前,第二服务器还可以获取第三服务器提供的第四随机数集;同时,第一服务器还可以获取第三服务器提供的第三随机数集。
进而具体合作时,第二服务器可以根据中间结果数据矩阵的第二分片矩阵、标签数据矩阵,以及第四随机数集与第一服务器合作,进行基于秘密分享算法的运算(例如,联合进行以下运算:dW=(A-Y)*X),得到模型梯度数据矩阵的第二分片矩阵。
类似的,第一服务器可以根据中间结果数据矩阵的第一分片矩阵、特征数据矩阵,以及第三随机数集与第二服务器合作,进行基于秘密分享算法的运算,得到模型梯度数据矩阵的第一分片矩阵。
进一步,第二服务器可以基于秘密分享算法,再根据模型梯度数据矩阵的第二分片矩阵、模型参数矩阵的第二分片矩阵,与第一服务器进行第二类合作,得到更新的模型参数矩阵的第二分片矩阵。
同时,第一服务器可以基于秘密分享算法,再根据模型梯度数据矩阵的第一分片矩阵、模型参数矩阵的第一分片矩阵,与第二服务器进行第二类合作,得到更新的模型参数矩阵的第一分片矩阵。
在进行上述第二类合作之前,第二服务器还可以获取第三服务器提供的第六随机数集;同时,第一服务器还可以获取第三服务器提供的第五随机数集。
进而具体合作时,第二服务器可以根据模型梯度数据矩阵的第二分片矩阵、模型参数矩阵的第二分片矩阵,以及第六随机数集与第一服务器合作,进行基于秘密分享算法的运算(例如,联合进行以下运算:W1=W0-lr*dW,其中,lr表示预设的学习率),得到更新的模型参数矩阵(例如,W1)的第二分片矩阵。
类似的,第一服务器可以根据模型梯度数据矩阵的第一分片矩阵、模型参数矩阵的第一分片矩阵,以及第五随机数集与第二服务器合作,进行基于秘密分享算法的运算,得到更新的模型参数矩阵的第一分片矩阵。
从而可以完成一次联合训练,得到一次更新的模型参数矩阵。
进一步,第一服务器和第二服务器可以合作,利用各自所持有的更新的模型参数矩阵的分片矩阵,合并出当前次更新的模型参数矩阵;并通过检测模型精度,以确定当前次更新的模型参数矩阵是否符合预设的精度要求。
在确定当前次更新的模型参数矩阵符合预设的精度要求的情况下,停止联合训练,并将当前次的更新的模型确定为所需要的目标模型。
在确定当前次更新的模型参数矩阵不符合预设的精度要求的情况下,可以按照上述实施例,重复进行多次训练,对模型参数矩阵进行多次更新,直到更新的模型参数矩阵符合预设的精度要求为止。
进一步,在重复进行多次训练时,还可以累积训练次数;并根据训练次数,有针对性地调整每次训练时所使用的预设的学习率的具体数值。
具体的,可以随着所累积的训练次数数值的增加,逐步地减小所使用的预设的学习率的数值。从而可以根据模型的训练进度,有针对性地对联合训练的步长进行动态调整,使得能够更加快速地得到符合预设精度要求的目标模型,提高联合训练效率。
从而可以通过多次联合训练,得到符合预设的精度要求的目标模型。
在一些实施例中,在按照上述完成联合训练后,第一服务器持有目标模型参数矩阵的第一分片矩阵,第二服务器持有目标模型参数矩阵的第二分片矩阵。进一步,可以根据约定,确定出目标模型的持有方。另一方可以将持有的目标模型参数矩阵的分片矩阵发送至目标模型的持有方。持有方可以在本地生成并持有完整的目标模型。进而持有方可以利用所持有的目标模型,处理所接收的待测数据对象的多种特征数据,以确定出待测数据对象多种标签。
例如,根据预先约定的关于目标模型的从属协议,确定第一服务器可以持有目标模型;相应的,第二服务器可以将所持有的目标模型参数矩阵的第二分片矩阵发送给第一服务器;第一服务器可以根据目标模型参数矩阵的第一分片矩阵和第二分片矩阵,在本地合成并持有完整的目标模型。
由上可见,本说明书实施例提供的基于隐私保护的数据处理方法,可以适用于第一服务器持有特征数据,第二服务器持有标签数据,存在数据隔离,且第二服务器所持有的标签数据标签种类较多的复杂场景,能够在保护参与方的数据隐私的前提下,高效、准确地通过合作确定出中间结果数据矩阵的分片矩阵。进而参与方可以利用各自持有的中间结果数据矩阵的分片矩阵,以分别持有的特征数据和标签数据,通过联合训练得到符合要求的目标模型。
在一些实施例中,为了能够更加精细地训练得到精度更高、效果更好的目标模型,第一服务器和第二服务器还可以将各自所持有的对应多个标识信息(例如,M个)的多个特征数据和多个标签数据拆分为多组(例如,分成多个batch)数据。其中,每一组数据分别包含有对应m个标识信息的特征数据和数据标签。需要指出的是,不同组的m的取值可以相同,也可以不同。
第一服务器和第二服务器再分别利用上述多组数据,依次进行多轮连续训练,以得到符合预设的精度要求目标模型。其中,每一轮训练只利用一组数据,且每一轮训练所使用的初始模型参数矩阵为上一轮训练得到的模型参数矩阵。
在一些实施例中,下面以多轮训练中当前轮训练为例进行说明。
首先,第一服务器和第二服务器可以分别获取当前轮的特征数据矩阵和当前轮的标签数据矩阵。
具体的,在第二服务器一侧,可以包括以下内容:第二服务器与所述第一服务器合作,确定出当前轮的随机数种子;根据所述当前轮的随机数种子和预设的伪随机数生成器,生成当前轮的伪随机数序列;根据当前轮的伪随机数序列,确定出相对应的当前轮的标识信息序列;根据所述当前轮的标识信息序列,筛选出多个当前轮的标签数据;并对多个当前轮的标签数据进行排序,得到排序后的多个当前轮的标签数据;根据所述排序后的多个当前轮的标签数据,构建当前轮的标签数据矩阵。
其中,上述当前轮的伪随机数序列中的一个伪随机数与一个标识信息一一对应。并且,上述当前轮的伪随机数序列、伪随机数与标识信息的对应关系,以及当前轮的随机数种子不对外公开。这样可以避免后续第三服务器在计算关于当前轮的特征数据矩阵与上一轮的模型参数矩阵的当前轮的乘积秘密的分片矩阵时,可以根据所接收到的数据,推测出当前轮所涉及的标识信息,从而可以更好地保护第一服务器、第二服务器的数据安全。
类似的,在第一服务器一侧,可以包括以下内容:第一服务器与所述第二服务器合作,确定出当前轮的随机数种子;根据所述当前轮的随机数种子和预设的伪随机数生成器,生成当前轮的伪随机数序列;根据当前轮的伪随机数序列,确定出相对应的当前轮的标识信息序列;根据所述当前轮的标识信息序列,筛选出多个当前轮的特征数据;并根据伪随机数序列中伪随机数的排列顺序,对多个当前轮的特征数据进行排序,得到排序后的多个当前轮的特征数据;根据所述排序后的多个当前轮的特征数据,构建当前轮的特征数据矩阵。
进一步,在第二服务器一侧,还可以包括:获取上一轮的模型参数矩阵的第二分片矩阵,作为当前轮的初始模型参数的第二分片矩阵;基于秘密分享算法,根据所述第二随机数集、所述上一轮的模型参数矩阵的第二分片矩阵,与持有特征数据的第一服务器合作,得到关于当前轮的特征数据矩阵与上一轮的模型参数矩阵的当前轮的乘积秘密的第二分片矩阵。
同时,在第一服务器一侧可以得到关于当前轮的特征数据矩阵与上一轮的模型参数矩阵的当前轮的乘积秘密的第一分片矩阵。
继而,在第二服务器一侧,在得到关于当前轮的特征数据矩阵与上一轮的模型参数矩阵的当前轮的乘积秘密的第二分片矩阵之后,所述方法还可以包括:将所述当前轮的乘积秘密的第二分片矩阵发送至第三服务器;接收第三服务器发送的当前轮的中间结果数据矩阵的第二分片矩阵;基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第二分片矩阵,以及当前轮的标签数据矩阵,与第一服务器合作,通过联合训练得到当前轮的模型参数矩阵的第二分片矩阵。
其中,上述基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第二分片矩阵,以及当前轮的标签数据矩阵,与第一服务器合作,通过联合训练得到当前轮的模型参数矩阵的第二分片矩阵,具体可以包括:基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第二分片矩阵、当前轮的标签数据矩阵,与第一服务器进行第一类合作,以得到当前轮的模型梯度数据矩阵的第二分片矩阵;基于秘密分享算法,根据所述当前轮的模型梯度数据矩阵的第二分片矩阵、上一轮的模型参数矩阵的第二分片矩阵,与第一服务器进行第二类合作,以得到当前轮的模型参数矩阵的第二分片矩阵;其中,所述第一服务器得到当前轮的模型参数矩阵的第一分片矩阵。
类似的,在第一服务器一侧,可以将所述当前轮的乘积秘密的第一分片矩阵发送至第三服务器;接收第三服务器发送的当前轮的中间结果数据矩阵的第一分片矩阵;基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第一分片矩阵,以及当前轮的标签数据矩阵,与第二服务器合作,通过联合训练得到当前轮的模型参数矩阵的第一分片矩阵。
从而可以完成当前轮的一次联合训练。
按照上述方式,可以针对当前轮进行多次联合训练,直到所得到的模型参数矩阵符合当前轮要求后,将当前轮最后一次训练得到的模型参数矩阵的第一分片矩阵和第二分片矩阵,确定为当前轮的模型参数矩阵的第一分片矩阵和第二分片矩阵,并分别作为通过当前轮训练后的更新的模型参数矩阵的第一分片矩阵第二分片矩阵。
这样才完成当前轮的训练,进而可以进行下一轮的训练。
按照上述方式,在通过多轮的联合训练之后,第一服务器和第二服务器可以合作得到精度相对更高、效果相对更好的目标模型。
由上可见,本说明书实施例提供的基于隐私保护的数据处理方法,当持有多个种类的标签数据的第二服务器,需要与持有特征数据的第一服务器合作训练目标模型时,可以发起触发请求;负责提供数据服务的第三服务器响应触发请求生成相应的第一随机数集和第二随机数集;并将第一随机数集发送给第一服务器,将第二随机数集发送给第二服务器;第二服务器可以基于秘密分享算法,根据第二随机数集、初始模型参数矩阵的第二分片矩阵,以及基于标签数据构建得到标签数据矩阵,与持有第一随机数集、初始模型参数矩阵的第一分片矩阵,以及基于特征数据构建得到的特征数据矩阵的第一服务器合作,各自分别计算得到的关于特征数据矩阵与初始模型参数矩阵的乘积秘密的一个分片矩阵;再分别将各自的分片矩阵发送给第三服务器;第三服务器先合并不同的分片矩阵,得到乘积秘密的明文数据矩阵;再根据预设的处理规则,对乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将该中间结果数据矩阵拆分成两个分片矩阵,分别发送给第一服务器和第二服务器;进而第一服务器和第二服务器可以基于秘密分享算法,根据各自所持有的中间结果数据矩阵的分片矩阵进行合作,联合训练得到目标模型。从而可以适用于第一服务器持有特征数据,第二服务器持有标签数据,存在数据隔离,且第二服务器所持有的标签数据中标签种类较多的复杂场景,能够在保护参与方的数据隐私的前提下,高效、准确地通过合作确定出中间结果数据矩阵的分片矩阵。进而参与方可以利用各自持有的中间结果数据矩阵的分片矩阵,通过联合训练得到符合要求的目标模型。
参阅图5所示,本说明书实施例还提供了另一种基于隐私保护的数据处理方法。其中,该方法应用于第三服务器一侧,具体实施时,可以包括以下内容。
S501:响应触发请求,生成第一随机数集和第二随机数集,并将所述第一随机数集发送至第一服务器,将所述第二随机数集发送至第二服务器;其中,所述第一服务器持有特征数据,所述第二服务器持有标签数据,所述标签数据的种类数大于2。
S502:接收关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵和第二分片矩阵;并合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵。
S503:根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵。
S504:将所述中间结果数据矩阵的第一分片矩阵发送至第一服务器;将所述中间结果数据矩阵的第二分片矩阵发送至第二服务器。
在一些实施例中,上述根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵,具体实施时,可以包括以下内容:根据预设的处理规则,将所述乘积秘密的明文数据矩阵按列拆分成按顺序排列的多个第一向量;对所述多个第一向量分别进行softmax处理,得到对应的多个第二向量;根据第二向量与第一向量的对应关系,以及第一向量的排列顺序,组合所述多个第二向量,得到所述中间结果数据矩阵。
在一些实施例中,在接收关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵和第二分片矩阵之前,所述方法具体实施时,还可以包括:接收第一服务器发送的特征数据的种类数,和第二服务器发送的标签数据的种类数;根据所述特征数据的种类数和所述标签数据的种类数,构建初始模型参数矩阵;其中,所述初始模型参数矩阵的行数和列数分别等于所述标签数据的种类数和特征数据的种类数;将所述初始模型参数矩阵拆分为初始模型参数矩阵的第一分片矩阵和第二分片矩阵;将所述初始模型参数矩阵的第一分片矩阵发送至第一服务器;将所述初始模型参数矩阵的第二分片矩阵发送至第二服务器。
在一些实施例中,所述方法具体实施时,还可以包括:接收当前轮的乘积秘密的第一分片矩阵和第二分片矩阵;合并所述当前轮的乘积秘密的第一分片矩阵和第二分片矩阵,得到当前轮的乘积秘密的明文数据矩阵;根据预设的处理规则,对所述当前轮的乘积秘密的明文数据矩阵进行相应的softmax处理,得到当前轮的中间结果数据矩阵;并将所述当前轮的中间结果数据矩阵拆分为当前轮的中间结果数据矩阵的第一分片矩阵和当前轮的中间结果数据矩阵的第二分片矩阵;将所述当前轮的中间结果数据矩阵的第一分片矩阵发送至第一服务器;将所述当前轮的中间结果数据矩阵的第二分片矩阵发送至第二服务器。
参阅图6所示,本说明书实施例还提供了另一种基于隐私保护的数据处理方法。其中,该方法应用于第一服务器一侧,具体实施时,可以包括以下内容。
S601:接收第三服务器响应触发请求生成并发送的第一随机数集;并获取初始模型参数矩阵的第一分片矩阵。
S602:基于秘密分享算法,根据所述第一随机数集、所述初始模型参数矩阵的第一分片矩阵,以及基于所持有的特征数据所构建的特征数据矩阵,与持有标签数据的第二服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵;其中,所述标签数据的种类数大于2。
S603:将所述乘积秘密的第一分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第二服务器的乘积秘密的第二分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵。
S604:接收所述中间结果数据矩阵的第一分片矩阵。
在一些实施例中,在接收所述中间结果数据矩阵的第一分片矩阵之后,所述方法具体实施时,还可以包括:基于秘密分享算法,根据所述中间结果数据矩阵的第一分片矩阵和特征数据矩阵,与第二服务器合作,通过联合训练,以得到目标模型。
在一些实施例中,所述方法具体实施时,还可以包括:与所述第二服务器合作,确定出当前轮的随机数种子;根据所述当前轮的随机数种子和预设的伪随机数生成器,生成当前轮的伪随机数序列;根据当前轮的伪随机数序列,确定出相对应的当前轮的标识信息序列;根据所述当前轮的标识信息序列,筛选出多个当前轮的特征数据;并对多个当前轮的特征数据进行排序,得到排序后的多个当前轮的特征数据;根据所述排序后的多个当前轮的特征数据,构建当前轮的特征数据矩阵。
在一些实施例中,所述方法具体实施时,还可以包括:获取上一轮的模型参数矩阵的第一分片矩阵,作为当前轮的初始模型参数的第一分片矩阵;基于秘密分享算法,根据所述第一随机数集、所述上一轮的模型参数矩阵的第一分片矩阵,以及当前轮的特征数据矩阵,与持有标签数据的第二服务器合作,得到关于当前轮的特征数据矩阵与上一轮的模型参数矩阵的当前轮的乘积秘密的第一分片矩阵。
在一些实施例中,在得到关于当前轮的特征数据矩阵与上一轮的模型参数矩阵的当前轮的乘积秘密的第一分片矩阵之后,所述方法具体实施时,还可以包括:将所述当前轮的乘积秘密的第一分片矩阵发送至第三服务器;接收第三服务器发送的当前轮的中间结果数据矩阵的第一分片矩阵;基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第一分片矩阵,以及当前轮的特征数据矩阵,与第二服务器合作,通过联合训练得到当前轮的模型参数矩阵的第一分片矩阵。
在一些实施例中,上述基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第一分片矩阵,以及当前轮的特征数据矩阵,与第二服务器合作,通过联合训练得到当前轮的模型参数矩阵的第一分片矩阵,具体实施时,可以包括:基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第一分片矩阵、当前轮的特征数据矩阵,与第二服务器进行第一类合作,以得到当前轮的模型梯度数据矩阵的第一分片矩阵;基于秘密分享算法,根据所述当前轮的模型梯度数据矩阵的第一分片矩阵、上一轮的模型参数矩阵的第一分片矩阵,与第二服务器进行第二类合作,以得到当前轮的模型参数矩阵的第一分片矩阵;其中,所述第二服务器得到当前轮的模型参数矩阵的第二分片矩阵。
由上可见,本说明书实施例提供的基于隐私保护的数据处理方法,适用于第一服务器持有特征数据,第二服务器持有标签数据,存在数据隔离,且第二服务器所持有的标签数据中标签种类较多的复杂场景,能够在保护参与方的数据隐私的前提下,高效、准确地通过合作确定出中间结果数据矩阵的分片矩阵。进而参与方可以利用各自持有的中间结果数据矩阵的分片矩阵,通过联合训练得到符合要求的目标模型。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:接收第三服务器响应触发请求生成并发送的第二随机数集;并获取初始模型参数矩阵的第二分片矩阵;基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵;其中,所述标签数据的种类数大于2;将所述乘积秘密的第二分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第一服务器的乘积秘密的第一分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;接收所述中间结果数据矩阵的第二分片矩阵。
为了能够更加准确地完成上述指令,参阅图7所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口701、处理器702以及存储器703,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口701,具体可以用于接收第三服务器响应触发请求生成并发送的第二随机数集;并获取初始模型参数矩阵的第二分片矩阵。
所述处理器702,具体可以用于基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵;其中,所述标签数据的种类数大于2;将所述乘积秘密的第二分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第一服务器的乘积秘密的第一分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;接收所述中间结果数据矩阵的第二分片矩阵。
所述存储器703,具体可以用于存储相应的指令程序。
在本实施例中,所述网络通信端口701可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的端口,也可以是负责进行FTP数据通信的端口,还可以是负责进行邮件数据通信的端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器702可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器703可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:接收第三服务器响应触发请求生成并发送的第一随机数集;并获取初始模型参数矩阵的第一分片矩阵;基于秘密分享算法,根据所述第一随机数集、所述初始模型参数矩阵的第一分片矩阵,以及基于所持有的特征数据所构建的特征数据矩阵,与持有标签数据的第二服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵;其中,所述标签数据的种类数大于2;将所述乘积秘密的第一分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第二服务器的乘积秘密的第二分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;接收所述中间结果数据矩阵的第一分片矩阵。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:响应触发请求,生成第一随机数集和第二随机数集,并将所述第一随机数集发送至第一服务器,将所述第二随机数集发送至第二服务器;其中,所述第一服务器持有特征数据,所述第二服务器持有标签数据,所述标签数据的种类数大于2;接收关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵和第二分片矩阵;并合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;将所述中间结果数据矩阵的第一分片矩阵发送至第一服务器;将所述中间结果数据矩阵的第二分片矩阵发送至第二服务器。
本说明书实施例还提供了一种基于上述基于隐私保护的数据处理方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:接收第三服务器响应触发请求生成并发送的第二随机数集;并获取初始模型参数矩阵的第二分片矩阵;基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵;其中,所述标签数据的种类数大于2;将所述乘积秘密的第二分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第一服务器的乘积秘密的第一分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;接收所述中间结果数据矩阵的第二分片矩阵。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
参阅图8所示,在软件层面上,本说明书实施例还提供了一种基于隐私保护的数据处理装置,该装置具体可以包括以下的结构模块。
第一接收模块801,具体可以用于接收第三服务器响应触发请求生成并发送的第二随机数集;并获取初始模型参数矩阵的第二分片矩阵;
处理模块802,具体可以用于基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵;其中,所述标签数据的种类数大于2;
发送模块803,具体可以用于将所述乘积秘密的第二分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第一服务器的乘积秘密的第一分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;
第二接收模块804,具体可以用于接收所述中间结果数据矩阵的第二分片矩阵。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
参阅图9所示,在软件层面上,本说明书实施例还提供了另一种基于隐私保护的数据处理装置,该装置具体可以包括以下的结构模块。
生成模块901,具体可以用于响应触发请求,生成第一随机数集和第二随机数集,并将所述第一随机数集发送至第一服务器,将所述第二随机数集发送至第二服务器;其中,所述第一服务器持有特征数据,所述第二服务器持有标签数据,所述标签数据的种类数大于2;
接收模块902,具体可以用于接收关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵和第二分片矩阵;并合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;
处理模块903,具体可以用于根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;
发送模块904,具体可以用于将所述中间结果数据矩阵的第一分片矩阵发送至第一服务器;将所述中间结果数据矩阵的第二分片矩阵发送至第二服务器。
本说明书还提供一种基于隐私保护的数据处理装置,包括:第一接收模块,具体可以用于接收第三服务器响应触发请求生成并发送的第一随机数集;并获取初始模型参数矩阵的第一分片矩阵;处理模块,具体可以用于基于秘密分享算法,根据所述第一随机数集、所述初始模型参数矩阵的第一分片矩阵,以及基于所持有的特征数据所构建的特征数据矩阵,与持有标签数据的第二服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵;其中,所述标签数据的种类数大于2;发送模块,具体可以用于将所述乘积秘密的第一分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第二服务器的乘积秘密的第二分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;第二接收模块,具体可以用于接收所述中间结果数据矩阵的第一分片矩阵。
由上可见,本说明书实施例提供的基于隐私保护的数据处理装置,可以适用于第一服务器持有特征数据,第二服务器持有标签数据,存在数据隔离,且第二服务器所持有的标签数据中标签种类较多的复杂场景,能够在保护参与方的数据隐私的前提下,高效、准确地通过合作确定出中间结果数据矩阵的分片矩阵。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

Claims (19)

1.一种基于隐私保护的数据处理方法,应用于第二服务器,包括:
接收第三服务器响应触发请求生成并发送的第二随机数集;并获取初始模型参数矩阵的第二分片矩阵;
基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵;其中,所述标签数据的种类数大于2;
将所述乘积秘密的第二分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第一服务器的乘积秘密的第一分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;
接收所述中间结果数据矩阵的第二分片矩阵。
2.根据权利要求1所述的方法,在接收所述中间结果数据矩阵的第二分片矩阵之后,所述方法还包括:
基于秘密分享算法,根据所述中间结果数据矩阵的第二分片矩阵和标签数据矩阵,与第一服务器合作,通过联合训练,以得到目标模型。
3.根据权利要求1所述的方法,在基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作之前,所述方法还包括:
对所持有的标签数据进行预设的编码处理,得到与标识信息对应的标签向量;其中,所述标签向量所包含的数据元素的个数等于标签数据的种类数;
根据标签向量所对应的标识信息,排列多个标签向量,以构建得到标签数据矩阵。
4.根据权利要求1所述的方法,获取初始模型参数矩阵的第二分片矩阵,包括:
统计标签数据的种类数;
将所述标签数据的种类数发送至第一服务器;接收第一服务器发送的特征数据的种类数;
根据所述标签数据的种类数和所述特征数据的种类数,构建初始模型参数矩阵的第二分片矩阵;其中,所述初始模型参数矩阵的第二分片矩阵的行数和列数分别等于所述标签数据的种类数和特征数据的种类数。
5.根据权利要求4所述的方法,在统计标签数据的种类数之后,所述方法还包括:
将所述标签数据的种类数发送至第三服务器;其中,第三服务器还接收来自第一服务器的特征数据的种类数;所述第三服务器根据所述特征数据的种类数和所述标签数据的种类数,构建初始模型参数矩阵;并将所述初始模型参数矩阵拆分为初始模型参数矩阵的第一分片矩阵和第二分片矩阵;所述初始模型参数矩阵的行数和列数分别等于所述标签数据的种类数和特征数据的种类数;
接收第三服务器发送的初始模型参数矩阵的第二分片矩阵。
6.根据权利要求1所述的方法,所述方法还包括:
与所述第一服务器合作,确定出当前轮的随机数种子;
根据所述当前轮的随机数种子和预设的伪随机数生成器,生成当前轮的伪随机数序列;
根据当前轮的伪随机数序列,确定出相对应的当前轮的标识信息序列;
根据所述当前轮的标识信息序列,筛选出多个当前轮的标签数据;并对多个当前轮的标签数据进行排序,得到排序后的多个当前轮的标签数据;
根据所述排序后的多个当前轮的标签数据,构建当前轮的标签数据矩阵。
7.根据权利要求6所述的方法,所述方法还包括:
获取上一轮的模型参数矩阵的第二分片矩阵,作为当前轮的初始模型参数的第二分片矩阵;
基于秘密分享算法,根据所述第二随机数集、所述上一轮的模型参数矩阵的第二分片矩阵,与持有特征数据的第一服务器合作,得到关于当前轮的特征数据矩阵与上一轮的模型参数矩阵的当前轮的乘积秘密的第二分片矩阵。
8.根据权利要求7所述的方法,在得到关于当前轮的特征数据矩阵与上一轮的模型参数矩阵的当前轮的乘积秘密的第二分片矩阵之后,所述方法还包括:
将所述当前轮的乘积秘密的第二分片矩阵发送至第三服务器;
接收第三服务器发送的当前轮的中间结果数据矩阵的第二分片矩阵;
基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第二分片矩阵,以及当前轮的标签数据矩阵,与第一服务器合作,通过联合训练得到当前轮的模型参数矩阵的第二分片矩阵。
9.根据权利要求8所述的方法,基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第一分片矩阵,以及当前轮的标签数据矩阵,与第二服务器合作,通过联合训练得到当前轮的模型参数矩阵的第二分片矩阵,包括:
基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第二分片矩阵、当前轮的标签数据矩阵,与第一服务器进行第一类合作,以得到当前轮的模型梯度数据矩阵的第二分片矩阵;
基于秘密分享算法,根据所述当前轮的模型梯度数据矩阵的第二分片矩阵、上一轮的模型参数矩阵的第二分片矩阵,与第一服务器进行第二类合作,以得到当前轮的模型参数矩阵的第二分片矩阵;其中,所述第一服务器得到当前轮的模型参数矩阵的第一分片矩阵。
10.一种基于隐私保护的数据处理方法,应用于第三服务器,包括:
响应触发请求,生成第一随机数集和第二随机数集,并将所述第一随机数集发送至第一服务器,将所述第二随机数集发送至第二服务器;其中,所述第一服务器持有特征数据,所述第二服务器持有标签数据,所述标签数据的种类数大于2;
接收关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵和第二分片矩阵;并合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;
根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;
将所述中间结果数据矩阵的第一分片矩阵发送至第一服务器;将所述中间结果数据矩阵的第二分片矩阵发送至第二服务器。
11.根据权利要求10所述的方法,根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵,包括:
根据预设的处理规则,将所述乘积秘密的明文数据矩阵按列拆分成按顺序排列的多个第一向量;
对所述多个第一向量分别进行softmax处理,得到对应的多个第二向量;
根据第二向量与第一向量的对应关系,以及第一向量的排列顺序,组合所述多个第二向量,得到所述中间结果数据矩阵。
12.根据权利要求10所述的方法,在接收关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵和第二分片矩阵之前,所述方法还包括:
接收第一服务器发送的特征数据的种类数,和第二服务器发送的标签数据的种类数;
根据所述特征数据的种类数和所述标签数据的种类数,构建初始模型参数矩阵;其中,所述初始模型参数矩阵的行数和列数分别等于所述标签数据的种类数和特征数据的种类数;
将所述初始模型参数矩阵拆分为初始模型参数矩阵的第一分片矩阵和第二分片矩阵;
将所述初始模型参数矩阵的第一分片矩阵发送至第一服务器;将所述初始模型参数矩阵的第二分片矩阵发送至第二服务器。
13.根据权利要求10所述的方法,所述方法还包括:
接收当前轮的乘积秘密的第一分片矩阵和第二分片矩阵;
合并所述当前轮的乘积秘密的第一分片矩阵和第二分片矩阵,得到当前轮的乘积秘密的明文数据矩阵;
根据预设的处理规则,对所述当前轮的乘积秘密的明文数据矩阵进行相应的softmax处理,得到当前轮的中间结果数据矩阵;并将所述当前轮的中间结果数据矩阵拆分为当前轮的中间结果数据矩阵的第一分片矩阵和当前轮的中间结果数据矩阵的第二分片矩阵;
将所述当前轮的中间结果数据矩阵的第一分片矩阵发送至第一服务器;将所述当前轮的中间结果数据矩阵的第二分片矩阵发送至第二服务器。
14.一种基于隐私保护的数据处理方法,应用于第一服务器,包括:
接收第三服务器响应触发请求生成并发送的第一随机数集;并获取初始模型参数矩阵的第一分片矩阵;
基于秘密分享算法,根据所述第一随机数集、所述初始模型参数矩阵的第一分片矩阵,以及基于所持有的特征数据所构建的特征数据矩阵,与持有标签数据的第二服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵;其中,所述标签数据的种类数大于2;
将所述乘积秘密的第一分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第二服务器的乘积秘密的第二分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;
接收所述中间结果数据矩阵的第一分片矩阵。
15.根据权利要求14所述的方法,在接收所述中间结果数据矩阵的第一分片矩阵之后,所述方法还包括:
基于秘密分享算法,根据所述中间结果数据矩阵的第一分片矩阵和特征数据矩阵,与第二服务器合作,通过联合训练,以得到目标模型。
16.一种基于隐私保护的数据处理装置,包括:
第一接收模块,用于接收第三服务器响应触发请求生成并发送的第二随机数集;并获取初始模型参数矩阵的第二分片矩阵;
处理模块,用于基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵;其中,所述标签数据的种类数大于2;
发送模块,用于将所述乘积秘密的第二分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第一服务器的乘积秘密的第一分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;
第二接收模块,用于接收所述中间结果数据矩阵的第二分片矩阵。
17.一种基于隐私保护的数据处理装置,包括:
生成模块,用于响应触发请求,生成第一随机数集和第二随机数集,并将所述第一随机数集发送至第一服务器,将所述第二随机数集发送至第二服务器;其中,所述第一服务器持有特征数据,所述第二服务器持有标签数据,所述标签数据的种类数大于2;
接收模块,用于接收关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵和第二分片矩阵;并合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;
处理模块,用于根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;
发送模块,用于将所述中间结果数据矩阵的第一分片矩阵发送至第一服务器;将所述中间结果数据矩阵的第二分片矩阵发送至第二服务器。
18.一种基于隐私保护的数据处理装置,包括:
第一接收模块,用于接收第三服务器响应触发请求生成并发送的第一随机数集;并获取初始模型参数矩阵的第一分片矩阵;
处理模块,用于基于秘密分享算法,根据所述第一随机数集、所述初始模型参数矩阵的第一分片矩阵,以及基于所持有的特征数据所构建的特征数据矩阵,与持有标签数据的第二服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵;其中,所述标签数据的种类数大于2;
发送模块,用于将所述乘积秘密的第一分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第二服务器的乘积秘密的第二分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;
第二接收模块,用于接收所述中间结果数据矩阵的第一分片矩阵。
19.一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至9,10至13,或14至15中任一项所述方法的步骤。
CN202110183313.5A 2021-02-10 2021-02-10 基于隐私保护的数据处理方法、装置和服务器 Active CN112800466B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110183313.5A CN112800466B (zh) 2021-02-10 2021-02-10 基于隐私保护的数据处理方法、装置和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110183313.5A CN112800466B (zh) 2021-02-10 2021-02-10 基于隐私保护的数据处理方法、装置和服务器

Publications (2)

Publication Number Publication Date
CN112800466A true CN112800466A (zh) 2021-05-14
CN112800466B CN112800466B (zh) 2022-04-22

Family

ID=75815140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110183313.5A Active CN112800466B (zh) 2021-02-10 2021-02-10 基于隐私保护的数据处理方法、装置和服务器

Country Status (1)

Country Link
CN (1) CN112800466B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113448739A (zh) * 2021-08-31 2021-09-28 阿里云计算有限公司 一种数据处理方法及装置
CN114172648A (zh) * 2022-02-10 2022-03-11 支付宝(杭州)信息技术有限公司 一种基于秘密分享的排序方法和系统
CN114282256A (zh) * 2022-03-04 2022-04-05 支付宝(杭州)信息技术有限公司 一种基于秘密分享的排序打乱方法和恢复方法
CN114282076A (zh) * 2022-03-04 2022-04-05 支付宝(杭州)信息技术有限公司 一种基于秘密分享的排序方法和系统
CN114723069A (zh) * 2022-04-15 2022-07-08 支付宝(杭州)信息技术有限公司 参数更新方法、装置和电子设备
CN115168910A (zh) * 2022-09-08 2022-10-11 蓝象智联(杭州)科技有限公司 一种基于秘密分享的共享数据等宽分箱方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9009089B1 (en) * 2011-06-27 2015-04-14 Hrl Laboratories, Llc Secure pattern matching
CN111062056A (zh) * 2019-12-13 2020-04-24 支付宝(杭州)信息技术有限公司 基于迁移学习实现的私有数据保护建模方法、系统及装置
CN111160573A (zh) * 2020-04-01 2020-05-15 支付宝(杭州)信息技术有限公司 保护数据隐私的双方联合训练业务预测模型的方法和装置
CN111162896A (zh) * 2020-04-01 2020-05-15 支付宝(杭州)信息技术有限公司 双方联合进行数据处理的方法及装置
CN111178549A (zh) * 2020-04-10 2020-05-19 支付宝(杭州)信息技术有限公司 保护数据隐私的双方联合训练业务预测模型的方法和装置
CN111291417A (zh) * 2020-05-09 2020-06-16 支付宝(杭州)信息技术有限公司 保护数据隐私的多方联合训练对象推荐模型的方法及装置
CN111460528A (zh) * 2020-04-01 2020-07-28 支付宝(杭州)信息技术有限公司 一种基于Adam优化算法的多方联合训练方法及系统
CN111475854A (zh) * 2020-06-24 2020-07-31 支付宝(杭州)信息技术有限公司 保护两方数据隐私的协同计算方法及系统
CN111738361A (zh) * 2020-07-31 2020-10-02 支付宝(杭州)信息技术有限公司 业务模型的联合训练方法及装置
CN111967035A (zh) * 2020-10-23 2020-11-20 支付宝(杭州)信息技术有限公司 模型训练方法、装置和电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9009089B1 (en) * 2011-06-27 2015-04-14 Hrl Laboratories, Llc Secure pattern matching
CN111062056A (zh) * 2019-12-13 2020-04-24 支付宝(杭州)信息技术有限公司 基于迁移学习实现的私有数据保护建模方法、系统及装置
CN111160573A (zh) * 2020-04-01 2020-05-15 支付宝(杭州)信息技术有限公司 保护数据隐私的双方联合训练业务预测模型的方法和装置
CN111162896A (zh) * 2020-04-01 2020-05-15 支付宝(杭州)信息技术有限公司 双方联合进行数据处理的方法及装置
CN111460528A (zh) * 2020-04-01 2020-07-28 支付宝(杭州)信息技术有限公司 一种基于Adam优化算法的多方联合训练方法及系统
CN111178549A (zh) * 2020-04-10 2020-05-19 支付宝(杭州)信息技术有限公司 保护数据隐私的双方联合训练业务预测模型的方法和装置
CN111291417A (zh) * 2020-05-09 2020-06-16 支付宝(杭州)信息技术有限公司 保护数据隐私的多方联合训练对象推荐模型的方法及装置
CN111475854A (zh) * 2020-06-24 2020-07-31 支付宝(杭州)信息技术有限公司 保护两方数据隐私的协同计算方法及系统
CN111738361A (zh) * 2020-07-31 2020-10-02 支付宝(杭州)信息技术有限公司 业务模型的联合训练方法及装置
CN111967035A (zh) * 2020-10-23 2020-11-20 支付宝(杭州)信息技术有限公司 模型训练方法、装置和电子设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
EMMANUEL BOACHIE: "Creating Password Security using Spark Authentication Secret for Data Privacy and Protection", 《ICTCE 2018: PROCEEDINGS OF THE 2ND INTERNATIONAL CONFERENCE ON TELECOMMUNICATIONS AND COMMUNICATION ENGINEERING》 *
刘建等: "面向移动云的属性基密文访问控制优化方法", 《通信学报》 *
蒋瀚等: "隐私保护机器学习的密码学方法", 《电子与信息学报》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113448739A (zh) * 2021-08-31 2021-09-28 阿里云计算有限公司 一种数据处理方法及装置
CN113448739B (zh) * 2021-08-31 2022-02-11 阿里云计算有限公司 一种数据处理方法及装置
CN114172648A (zh) * 2022-02-10 2022-03-11 支付宝(杭州)信息技术有限公司 一种基于秘密分享的排序方法和系统
CN114172648B (zh) * 2022-02-10 2022-05-31 支付宝(杭州)信息技术有限公司 一种基于秘密分享的排序方法和系统
CN114282256A (zh) * 2022-03-04 2022-04-05 支付宝(杭州)信息技术有限公司 一种基于秘密分享的排序打乱方法和恢复方法
CN114282076A (zh) * 2022-03-04 2022-04-05 支付宝(杭州)信息技术有限公司 一种基于秘密分享的排序方法和系统
CN114282076B (zh) * 2022-03-04 2022-06-14 支付宝(杭州)信息技术有限公司 一种基于秘密分享的排序方法和系统
CN114723069A (zh) * 2022-04-15 2022-07-08 支付宝(杭州)信息技术有限公司 参数更新方法、装置和电子设备
CN115168910A (zh) * 2022-09-08 2022-10-11 蓝象智联(杭州)科技有限公司 一种基于秘密分享的共享数据等宽分箱方法
CN115168910B (zh) * 2022-09-08 2022-12-23 蓝象智联(杭州)科技有限公司 一种基于秘密分享的共享数据等宽分箱方法

Also Published As

Publication number Publication date
CN112800466B (zh) 2022-04-22

Similar Documents

Publication Publication Date Title
CN112800466B (zh) 基于隐私保护的数据处理方法、装置和服务器
CN112949760B (zh) 基于联邦学习的模型精度控制方法、装置及存储介质
CN113505882B (zh) 基于联邦神经网络模型的数据处理方法、相关设备及介质
CN108712429A (zh) 基于区块链云外包计算数据的隐私保护方法
CN110351363A (zh) 数据备份方法、设备及计算机可读存储介质
CN112365001B (zh) 模型的生成方法、装置和服务器
CN111163130A (zh) 一种网络服务系统及其数据传输方法
CN113542228A (zh) 基于联邦学习的数据传输方法、装置以及可读存储介质
CN114691167A (zh) 机器学习模型更新的方法和装置
CN114255037A (zh) 隐私保护下的多方联合排序方法和数据处理方法
CN114254353A (zh) 基于隐私保护的数据处理方法、装置和服务器
CN110874481B (zh) 一种基于gbdt模型的预测方法和装置
CN116468132A (zh) 用户数据处理的系统、方法以及装置
CN103701587B (zh) 一种多接口密码模块并行调度方法
CN112468521A (zh) 基于隐私保护的数据处理方法、装置和服务器
CN112926090A (zh) 基于差分隐私的业务分析方法及装置
CN112597525A (zh) 基于隐私保护的数据处理方法、装置和服务器
CN113254989B (zh) 目标数据的融合方法、装置和服务器
CN110351364A (zh) 数据存储方法、设备及计算机可读存储介质
CN113094739B (zh) 基于隐私保护的数据处理方法、装置和服务器
CN112468285B (zh) 基于隐私保护的数据处理方法、装置和服务器
CN109815715A (zh) 一种数据加密方法和相关装置
CN113254996B (zh) 图神经网络训练方法、装置、计算设备及存储介质
CN115118520A (zh) 数据处理方法、装置和服务器
CN114422105A (zh) 联合建模方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant