CN112906904B - 一种数据处理方法、装置和用于数据处理的装置 - Google Patents

一种数据处理方法、装置和用于数据处理的装置 Download PDF

Info

Publication number
CN112906904B
CN112906904B CN202110150822.8A CN202110150822A CN112906904B CN 112906904 B CN112906904 B CN 112906904B CN 202110150822 A CN202110150822 A CN 202110150822A CN 112906904 B CN112906904 B CN 112906904B
Authority
CN
China
Prior art keywords
data
ordered
characteristic value
data party
union
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110150822.8A
Other languages
English (en)
Other versions
CN112906904A (zh
Inventor
陈璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huakong Tsingjiao Information Technology Beijing Co Ltd
Original Assignee
Huakong Tsingjiao Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huakong Tsingjiao Information Technology Beijing Co Ltd filed Critical Huakong Tsingjiao Information Technology Beijing Co Ltd
Priority to CN202110150822.8A priority Critical patent/CN112906904B/zh
Publication of CN112906904A publication Critical patent/CN112906904A/zh
Application granted granted Critical
Publication of CN112906904B publication Critical patent/CN112906904B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/70Type of the data to be coded, other than image and sound
    • H03M7/705Unicode

Abstract

本发明实施例提供一种数据处理方法、装置和用于数据处理的装置。其中的方法包括:获取m个数据方中每个数据方的特征值集合,所述特征值集合中的特征值为密文;合并所述特征值集合,得到合并集合;根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,其中,第i个数据方的特征值并集为将所述合并集合中的非第i个数据方的特征值用占位符替代所得到;向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码。本发明实施例可以保证各数据方的特征值不会暴露给其他数据方,可以保证联合独热编码的数据隐私安全性。

Description

一种数据处理方法、装置和用于数据处理的装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理方法、装置和用于数据处理的装置。
背景技术
独热编码即One-Hot编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有独立的寄存器位,并且在任意时候,其中只有一位有效。
对于具有n个取值的特征数据,经过独热编码后,得到n维的0-1向量,并且在任意时候,这个向量里只会有一个1。例如,对于表示颜色的特征数据,具有如下3个取值:红色=1、绿色=2、蓝色=3,经过独热编码后,可以得到如下0-1向量:红色=(0,0,1)、绿色=(0,1,0)、蓝色=(1,0,0)。独热编码将离散特征的取值转换成稀疏数据,解决了分类器不好处理属性数据的问题,在一定程度上也起到了扩充特征的作用。
然而,在对多方数据进行联合独热编码时,例如对A方持有的数据和B方持有的数据进行联合独热编码,将导致A方的数据暴露给B方,以及B方的数据暴露给A方,可能造成隐私数据的泄露。
发明内容
本发明实施例提供一种数据处理方法、装置和用于数据处理的装置,在对多方数据进行联合独热编码的过程中,可以保证各方数据的隐私安全。
为了解决上述问题,第一方面,本发明实施例公开了一种数据处理方法,应用于密文计算引擎,所述方法包括:
获取m个数据方中每个数据方的特征值集合,所述特征值集合中的特征值为密文;
合并所述特征值集合,得到合并集合;
根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,其中,第i个数据方的特征值并集为将所述合并集合中的非第i个数据方的特征值用占位符替代所得到;
向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码。
可选地,所述根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,包括:
对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中存在,则保留当前元素,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中不存在,则用占位符替换当前元素,在所述合并集合中的所有元素匹配完成之后,得到第i个数据方对应的特征值并集;
在所述合并集合与所述m个数据方中所有数据方的特征值集合匹配完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
可选地,所述每个数据方的特征值集合均为有序列表,所述合并所述特征值集合,得到合并集合,包括:
合并所述每个数据方的有序列表,得到有序合并列表;
所述根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,包括:
遍历比较所述有序合并列表中的元素和所述每个数据方的有序列表中的元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素相同,则j和k分别指向下一个元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向下一个元素,k保持不变;
在第i个数据方的有序列表中的元素遍历完成时,若所述有序合并列表中的元素也遍历完成,则得到第i个数据方对应的特征值并集,若所述有序合并列表中存在剩余元素,则用占位符替换所述有序合并列表中的剩余元素,得到第i个数据方对应的特征值并集;
在所述有序合并列表与所述m个数据方中所有数据方的有序列表遍历比较完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
可选地,所述m个数据方的特征值集合中的特征值对应相同的特征。
第二方面,本发明实施例公开了一种数据处理方法,应用于数据方,所述方法包括:
将持有的特征值集合发送至密文计算引擎,以使所述密文计算引擎合并m个数据方的特征值集合,得到合并集合,并且根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,其中,第i个数据方对应的特征值并集中的非第i个数据方的特征值用占位符替代,所述特征值集合中的特征值为密文;
接收所述密文计算引擎返回的所述数据方对应的特征值并集;
对所述特征值并集进行解密,并对解密后的特征值并集进行独热编码。
可选地,所述对解密后的特征值并集进行独热编码,包括:
根据所述特征值并集中的元素个数,确定维度;
将所述解密后的特征值并集中的占位符替换为0;
将替换后的特征值并集编码为所述维度的0-1向量。
可选地,所述将持有的特征值集合发送至密文计算引擎之前,所述方法还包括:
对所述特征值集合中的特征值进行排序,得到有序列表;
所述将持有的特征值集合发送至密文计算引擎,包括:
将所述有序列表发送至密文计算引擎。
第三方面,本发明实施例公开了一种数据处理装置,应用于密文计算引擎,所述装置包括:
特征值获取模块,用于获取m个数据方中每个数据方的特征值集合,所述特征值集合中的特征值为密文;
特征值合并模块,用于合并所述特征值集合,得到合并集合;
特征值替换模块,用于根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,其中,第i个数据方的特征值并集为将所述合并集合中的非第i个数据方的特征值用占位符替代所得到;
特征值编码模块,用于向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码。
可选地,所述特征值替换模块,包括:
匹配子模块,用于对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中存在,则保留当前元素,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中不存在,则用占位符替换当前元素,在所述合并集合中的所有元素匹配完成之后,得到第i个数据方对应的特征值并集;
第一获取子模块,用于在所述合并集合与所述m个数据方中所有数据方的特征值集合匹配完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
可选地,所述每个数据方的特征值集合均为有序列表,所述特征值合并模块,具体用于合并所述每个数据方的有序列表,得到有序合并列表;
所述特征值替换模块,包括:
遍历子模块,用于遍历比较所述有序合并列表中的元素和所述每个数据方的有序列表中的元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素相同,则j和k分别指向下一个元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向下一个元素,k保持不变;
特征替换子模块,用于在第i个数据方的有序列表中的元素遍历完成时,若所述有序合并列表中的元素也遍历完成,则得到第i个数据方对应的特征值并集,若所述有序合并列表中存在剩余元素,则用占位符替换所述有序合并列表中的剩余元素,得到第i个数据方对应的特征值并集;
第二获取子模块,用于在所述有序合并列表与所述m个数据方中所有数据方的有序列表遍历比较完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
可选地,所述m个数据方的特征值集合中的特征值对应相同的特征。
第四方面,本发明实施例公开了一种数据处理装置,应用于数据方,所述装置包括:
特征值发送模块,用于将持有的特征值集合发送至密文计算引擎,以使所述密文计算引擎合并m个数据方的特征值集合,得到合并集合,并且根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,其中,第i个数据方对应的特征值并集中的非第i个数据方的特征值用占位符替代,所述特征值集合中的特征值为密文;
并集接收模块,用于接收所述密文计算引擎返回的所述数据方对应的特征值并集;
解密编码模块,用于对所述特征值并集进行解密,并对解密后的特征值并集进行独热编码。
可选地,所述解密编码模块,包括:
维度确定子模块,用于根据所述特征值并集中的元素个数,确定维度;
占位符替换子模块,用于将所述解密后的特征值并集中的占位符替换为0;
编码子模块,用于将替换后的特征值并集编码为所述维度的0-1向量。
可选地,所述装置还包括:
排序模块,用于对所述特征值集合中的特征值进行排序,得到有序列表;
所述特征值发送模块,具体用于将所述有序列表发送至密文计算引擎。
第五方面,本发明实施例公开了一种用于数据处理的装置,应用于密文计算引擎,所述装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取m个数据方中每个数据方的特征值集合,所述特征值集合中的特征值为密文;
合并所述特征值集合,得到合并集合;
根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,其中,第i个数据方的特征值并集为将所述合并集合中的非第i个数据方的特征值用占位符替代所得到;
向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码。
可选地,所述根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,包括:
对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中存在,则保留当前元素,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中不存在,则用占位符替换当前元素,在所述合并集合中的所有元素匹配完成之后,得到第i个数据方对应的特征值并集;
在所述合并集合与所述m个数据方中所有数据方的特征值集合匹配完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
可选地,所述每个数据方的特征值集合均为有序列表,所述合并所述特征值集合,得到合并集合,包括:
合并所述每个数据方的有序列表,得到有序合并列表;
所述根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,包括:
遍历比较所述有序合并列表中的元素和所述每个数据方的有序列表中的元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素相同,则j和k分别指向下一个元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向下一个元素,k保持不变;
在第i个数据方的有序列表中的元素遍历完成时,若所述有序合并列表中的元素也遍历完成,则得到第i个数据方对应的特征值并集,若所述有序合并列表中存在剩余元素,则用占位符替换所述有序合并列表中的剩余元素,得到第i个数据方对应的特征值并集;
在所述有序合并列表与所述m个数据方中所有数据方的有序列表遍历比较完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
可选地,所述m个数据方的特征值集合中的特征值对应相同的特征。
第六方面,本发明实施例公开了一种用于数据处理的装置,应用于数据方,所述装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
将持有的特征值集合发送至密文计算引擎,以使所述密文计算引擎合并m个数据方的特征值集合,得到合并集合,并且根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,其中,第i个数据方对应的特征值并集中的非第i个数据方的特征值用占位符替代,所述特征值集合中的特征值为密文;
接收所述密文计算引擎返回的所述数据方对应的特征值并集;
对所述特征值并集进行解密,并对解密后的特征值并集进行独热编码。
可选地,所述对解密后的特征值并集进行独热编码,包括:
根据所述特征值并集中的元素个数,确定维度;
将所述解密后的特征值并集中的占位符替换为0;
将替换后的特征值并集编码为所述维度的0-1向量。
可选地,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
对所述特征值集合中的特征值进行排序,得到有序列表;
所述将持有的特征值集合发送至密文计算引擎,包括:
将所述有序列表发送至密文计算引擎。
第七方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的数据处理方法。
本发明实施例包括以下优点:
本发明实施例通过密文计算引擎获取m个数据方中每个数据方的特征值集合,所述特征值集合中的特征值为密文,以防止特征值明文泄露。密文计算引擎合各数据方的特征值集合,得到合并集合,并根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,最后向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码,从而实现对m个数据方的特征值进行联合独热编码。其中,第i个数据方的特征值并集为将所述合并集合中的非第i个数据方的特征值用占位符替代所得到,由此,第i个数据方无法获知非第i个数据方的特征值的相关信息。通过本发明实施例的数据处理方法,在多个数据方对特征值进行联合独热编码的过程中,可以保证各数据方的特征值不会暴露给其他数据方,可以保证联合独热编码的数据隐私安全性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种数据处理方法实施例的步骤流程图;
图2是本发明的一个示例中数据方A和数据方B的特征值进行联合独热编码的过程示意图;
图3是本发明的另一种数据处理方法实施例的步骤流程图;
图4是本发明的一种数据处理装置实施例的结构框图;
图5是本发明的另一种数据处理装置实施例的结构框图;
图6是本发明的一种用于数据处理的装置800的框图;
图7是本发明的一些实施例中服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
方法实施例
参照图1,示出了本发明的一种数据处理方法实施例的步骤流程图,应用于密文计算引擎,所述方法具体可以包括如下步骤:
步骤101、获取m个数据方中每个数据方的特征值集合,所述特征值集合中的特征值为密文;
步骤102、合并所述特征值集合,得到合并集合;
步骤103、根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,其中,第i个数据方的特征值并集为将所述合并集合中的非第i个数据方的特征值用占位符替代所得到;
步骤104、向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码。
本发明实施例可用于对m个数据方的特征值进行联合独热编码。其中,m为大于或等于2的整数。为便于描述,本发明实施例中以两个数据方(m=2)的特征值进行联合独热编码为例,多于两个数据方的场景相互参照即可。
在本发明实施例中,所述m个数据方的特征值集合中的特征值可以对应相同的特征。一个示例中,数据方A和数据方B都具有特征C的相关特征值。对于数据方A,特征C具有如下5个特征值[1,2,2,3,1],数据方A的特征值集合可以记为CA=[1,2,3]。对于数据方B,特征C具有如下6个特征值[2,3,4,2,3,3],数据方B的特征值集合可以记为CB=[2,3,4]。
进一步地,m个数据方中的每个数据方可以对其持有的特征值集合中的特征值进行加密,在该示例中,数据方A可以对特征值集合CA=[1,2,3]中的特征值进行加密,得到加密后的特征值集合C’A=enc([1,2,3]),数据方B可以对特征值集合CB=[2,3,4]中的特征值进行加密,得到加密后的特征值集合C’B=enc([2,3,4])。C’A和C’B中的特征值均为密文,可以有效防止特征值的明文数值被泄露。
所述特征值可以为敏感数据,如环境监控数据、用户征信数据、用户账户数据、个人健康数据等。本发明实施例提供的数据处理方法可应用于大数据共享系统,通过对敏感数据基于密文进行联合独热编码,可以在避免敏感数据存在被泄露风险的基础上,实现多方数据的融合,进而可以对多方产生的业务数据执行汇集、处理和分析等操作,解决信息孤岛,提高多个网络服务中的海量级业务数据的应用价值。
m个数据方中的每个数据方可以将其持有的加密后的特征值集合发送至密文计算引擎参与联合独热编码。在该示例中,数据方A将其持有的特征值集合C’A=enc([1,2,3])发送至密文计算引擎参与联合独热编码,数据方B将其持有的特征值集合C’B=enc([2,3,4])发送至密文计算引擎参与联合独热编码。密文计算引擎获取每个数据方的特征值集合之后,合并所述特征值集合,得到所有数据方加密后的特征值的合并集合。
在本发明实施例中,所述密文计算引擎可以通过预设数量的计算节点对计算任务进行协同计算,所述计算任务用于对输入数据进行数据处理,所述计算任务包括但不限于:加、减、乘、除等数字计算,以及与、或、非等逻辑计算等。
在该示例中,密文计算引擎获取数据方A的特征值集合C’A=enc([1,2,3])和数据方B的特征值集合C’B=enc([2,3,4])之后,合并特征值集合C’A和特征值集合C’B,得到所有数据方加密后的特征值的合并集合,记为C’=enc([1,2,3,4])。
密文计算引擎根据所述合并集合,确定m个数据方中每个数据方对应的特征值并集。为了避免向数据方A暴露数据方B的特征值,以及避免向数据方B暴露数据方A的特征值,本发明实施例在确定m个数据方中每个数据方对应的特征值并集的过程中,对于第i个数据方对应的特征值并集,可以通过将所述合并集合中的非第i个数据方的特征值用占位符替代得到。其中,1≤i≤m。其中,特征值并集中的特征值为密文。
可以理解,所述占位符可以为预先设置的一种特殊符号,可以为任意标识符,本发明实施例中记为C。在该示例中,对于数据方A对应的特征值并集,可以通过将所述合并集合C’=enc([1,2,3,4])中的非数据方A的特征值用占位符C替代得到。在合并集合C’=enc([1,2,3,4])中,特征值“4”为数据方B特有的特征值,而非数据方A的特征值,因此,将C’=enc([1,2,3,4])中的特征值“4”用占位符C替代,可以得到数据方A对应的特征值并集,如记为C’并A=enc([1,2,3,C])。同样的方法,可以得到数据方B对应的特征值并集,如记为C’并B=enc([C,2,3,4])。
在本发明的一种可选实施例中,所述根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,包括:
对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中存在,则保留当前元素,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中不存在,则用占位符替换当前元素,在所述合并集合中的所有元素匹配完成之后,得到第i个数据方对应的特征值并集;
在所述合并集合与所述m个数据方中所有数据方的特征值集合匹配完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
在确定m个数据方中第i个数据方对应的特征值并集时,可以对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,以判断合并集合中的各特征值是否为第i个数据方的特征值。
假设第i个数据方为上述示例中的数据方A,在确定数据方A的特征值并集时,对所述合并集合C’=enc([1,2,3,4])中的每个元素分别与数据方A的特征值集合C’A=enc([1,2,3])进行匹配。需要说明的是,由于合并集合和每个数据方的特征值集合中的特征值均为密文,因此,对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,指的是基于密文进行匹配。也即,对所述合并集合C’=enc([1,2,3,4])中的每个元素分别与数据方A的特征值集合C’A=enc([1,2,3]),在密文的基础上进行匹配。若所述合并集合C’=enc([1,2,3,4])中的当前元素在数据方A的特征值集合中存在,则保留当前元素,若不存在,则用占位符替换当前元素。
例如,C’=enc([1,2,3,4])中的第一个元素“1”在特征值集合C’A=enc([1,2,3])中存在,则保留第一个元素“1”,同样地,保留合并集合C’=enc([1,2,3,4])中的第二个元素“2”和第三个元素“3”。C’=enc([1,2,3,4])中的第四个元素“4”在特征值集合C’A=enc([1,2,3])中不存在,因此,用占位符C替换第四个元素“4”,得到数据方A的特征值并集为C’并A=enc([1,2,3,C])。
进一步地,本发明实施例可以将基于密文的匹配操作转化为基于密文的比较操作,上述对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,可以为对所述合并集合中的每个元素分别与第i个数据方的特征值集合中的每个元素在密文基础上进行比较,若比较结果为相等,则说明合并集合中的当前元素在第i个数据方的特征值集合中存在,否则,说明合并集合中的当前元素在第i个数据方的特征值集合中不存在。
在确定数据方A的特征值并集之后,用同样的方法可以确定数据方B的特征值并集,得到数据方B的特征值并集为C’并B=enc([C,2,3,4])。此时,得到m(m=2)个数据方中每个数据方对应的特征值并集。
在具体应用中,在确定所述m个数据方中每个数据方对应的特征值并集的过程中,需要遍历m个数据方的每个数据方的特征值集合与合并集合进行匹配,随着m的增大以及每个数据方的特征值集合的特征值个数的增加,导致遍历计算的复杂度也在增加。例如,求第i个数据方对应的特征值并集,原特征值并集C’的集合大小为n,第i个数据方原特征值并集C’i的集合大小为ni,匹配过程的计算复杂度为O(n*ni)。因此,为了降低遍历计算的复杂度,提高遍历计算的效率,本发明实施例中的每个数据方可以预先对其持有的特征值集合进行排序,得到有序列表,也即,所述每个数据方的特征值集合均为有序列表,对有序列表进行遍历比较,匹配过程的计算复杂度将极大地降低为O(n)。
需要说明的是,本发明实施例中的示例是以各数据方预先对其持有的特征值集合进行排序得到有序列表为例。在上述示例中,数据方A的特征值集合C’A=enc([1,2,3])为有序列表,数据方B的特征值集合C’B=enc([2,3,4])为有序列表。
在本发明的一种可选实施例中,所述每个数据方的特征值集合均为有序列表,所述合并所述特征值集合,得到合并集合,包括:
合并所述每个数据方的有序列表,得到有序合并列表;
所述根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,包括:
遍历比较所述有序合并列表中的元素和所述每个数据方的有序列表中的元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素相同,则j和k分别指向下一个元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向下一个元素,k保持不变;
在第i个数据方的有序列表中的元素遍历完成时,若所述有序合并列表中的元素也遍历完成,则得到第i个数据方对应的特征值并集,若所述有序合并列表中存在剩余元素,则用占位符替换所述有序合并列表中的剩余元素,得到第i个数据方对应的特征值并集C’并i
在所述有序合并列表与所述m个数据方中所有数据方的有序列表遍历比较完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
在上述示例中,数据方A的特征值集合C’A=enc([1,2,3])和数据方B的特征值集合C’B=enc([2,3,4])均为有序列表。密文计算引擎合并每个数据方的有序列表,得到有序合并列表,即C’=enc([1,2,3,4])。
在确定m个数据方中第i个数据方的特征值并集时,对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,以判断合并集合中的各特征值是否为第i个数据方的特征值。
假设第i个数据方为上述示例中的数据方A,在确定数据方A的特征值并集时,遍历比较所述有序合并列表C’=enc([1,2,3,4])中的元素和所述数据方A的有序列表C’A=enc([1,2,3])中的元素,若所述有序合并列表中的第j个元素与数据方A的有序列表中的第k个元素相同,则j指向有序合并列表C’中的下一个元素,并且k指向有序列表C’A中的下一个元素。若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向有序合并列表C’中的下一个元素,k还是指向当前元素,不进行移动。
其中,j用于指示有序合并列表中的元素索引,k用于指示第i个数据方的有序列表中的元素索引。在该示例中,首先比较有序合并列表C’中的第一个(j=0)元素与数据方A的有序列表中的第一个(k=0)元素,由于二者相同,因此j和k分别指向下一个元素,也即,继续比较有序合并列表C’中的第二个(j=1)元素与数据方A的有序列表中的第二个(k=1)元素。以此类推,若所述有序合并列表中的第j个元素与数据方A的有序列表中的第k个元素相同,则j和k分别指向下一个元素,若所述有序合并列表中的第j个元素与数据方A的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向下一个元素。
在数据方A的有序列表C’A=enc([1,2,3])中的元素遍历完成时,有序合并列表C’=enc([1,2,3,4])中存在剩余元素“4”,说明该元素不是数据方A的特征值,因此,用占位符C替换所述有序合并列表中的剩余元素“4”,得到数据方A对应的特征值并集,即C’并A=enc([1,2,3,C])。
用同样的方法可以得到数据方B对应的特征值并集,如C’并B=enc([C,2,3,4])。
在实际应用中,密文计算引擎对长度分别为n1和n2的无序列表进行合并的复杂度是O(n1*n2),而对长度分别为n1和n2的有序列表进行合并的复杂度是O(n1+n2),在本发明实施例中,每个数据方预先对其持有的特征值集合进行排序,得到有序列表,可以降低密文计算引擎合并各数据方的特征值集合的复杂度,提高合并计算的效率。在确定m个数据方中每个数据方对应的特征值并集的过程中,需要对所述合并集合中的每个元素分别与第i个数据方的特征值集合中的元素进行遍历比较,在每个数据方的特征值集合均为有序列表的情况下,只需遍历一遍有序合并列表和每个数据方的有序列表即可,总计算复杂度为可以降低密文计算引擎执行遍历比较操作的复杂度,提高遍历比较的效率。
在确定m个数据方中每个数据方对应的特征值并集之后,密文计算引擎向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码。
参照图2,示出了本发明实施例对上述示例中数据方A和数据方B的特征值进行联合独热编码的过程示意图。在该示例中,密文计算引擎向数据方A返回其对应的特征值并集C’并A=enc([1,2,3,C]),以及向数据方B返回其对应的特征值并集C’并B=enc([C,2,3,4])。
这样,数据方A可以在其本地对特征值并集C’并A=enc([1,2,3,C])进行独热编码。具体地,数据方A可以先对特征值并集C’并A中的特征值进行解密,得到明文的特征值并集C并A=[1,2,3,C],进而可以对明文的特征值并集C并A=[1,2,3,C]进行独热编码,以实现对数据方A和数据方B的特征值进行联合独热编码。
对于具有n个取值的特征数据,经过独热编码后,可以得到n维的0-1向量,并且在任意时候,这个向量里只会有一个1。在该示例中,特征值并集C’并A包含4个元素(也即包含4个特征数据),因此可以将C’并A编码为4维的0-1向量。此外,由于占位符C代表该数据方没有的特征值,因此,对于占位符C的维度,可以填充为0。如图2所示,在数据方A本地,数据A表示数据方A持有的特征值,数据A’表示数据方A进行联合独热编码后得到的数据。
在特征值并集C并A=[1,2,3,C]中,由于非数据方A的其他数据方的特征值以占位符C替代,因此,数据方A无法获知其他数据方的特征值的信息。
同样地,数据方B可以在其本地对特征值并集C’并B=enc([C,2,3,4])进行独热编码。具体地,数据方B可以先对特征值并集C’并B中的特征值进行解密,得到明文的特征值并集C并B=[C,2,3,4],进而可以对明文的特征值并集C并B=[C,2,3,4]进行独热编码,以实现对数据方A和数据方B的特征值进行联合独热编码。如图2所示,在数据方B本地,数据B表示数据方B持有的特征值,数据B’表示数据方B进行联合独热编码后得到的数据。
在特征值并集C并B=[C,2,3,4]中,由于非数据方B的其他数据方的特征值在特征值并集C’并B中以占位符C表示,因此,数据方B无法获知其他数据方的特征值的信息。
通过本发明实施例的数据处理方法,在多个数据方对特征值进行联合独热编码的过程中,可以保证各数据方的特征值不会暴露给其他数据方,可以保证联合独热编码的数据隐私安全性。
参照图3,示出了本发明的另一种数据处理方法实施例的步骤流程图,应用于数据方,所述方法具体可以包括如下步骤:
步骤301、将持有的特征值集合发送至密文计算引擎,以使所述密文计算引擎合并m个数据方的特征值集合,得到合并集合,并且根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,其中,第i个数据方对应的特征值并集中的非第i个数据方的特征值用占位符替代,所述特征值集合中的特征值为密文;
步骤302、接收所述密文计算引擎返回的所述数据方对应的特征值并集;
步骤303、对所述特征值并集进行解密,并对解密后的特征值并集进行独热编码。
本发明实施例可用于对m个数据方的特征值进行联合独热编码。其中,m为大于或等于2的整数。为便于描述,本发明实施例中以两个数据方(m=2)的特征值进行联合独热编码为例,多于两个数据方的场景相互参照即可。
在本发明实施例中,所述m个数据方的特征值集合中的特征值可以对应相同的特征。一个示例中,数据方A和数据方B都具有特征C的相关特征值。对于数据方A,特征C具有如下5个特征值[1,2,2,3,1],数据方A的特征值集合可以记为CA=[1,2,3]。对于数据方B,特征C具有如下6个特征值[2,3,4,2,3,3],数据方B的特征值集合可以记为CB=[2,3,4]。
进一步地,m个数据方中的每个数据方可以对其持有的特征值集合中的特征值进行加密,在该示例中,数据方A可以对特征值集合CA=[1,2,3]中的特征值进行加密,得到特征值集合C’A=enc([1,2,3]),数据方B可以对特征值集合CB=[2,3,4]中的特征值进行加密,得到特征值集合C’B=enc([2,3,4])。C’A和C’B中的特征值均为密文,可以防止特征值的明文被泄露。
m个数据方中的每个数据方可以将其持有的特征值集合发送至密文计算引擎参与联合独热编码。在该示例中,数据方A将其持有的特征值集合C’A=enc([1,2,3])发送至密文计算引擎参与联合独热编码,数据方B将其持有的特征值集合C’B=enc([2,3,4])发送至密文计算引擎参与联合独热编码。
密文计算引擎获取每个数据方的特征值集合之后,合并所述特征值集合,得到合并集合,如C’=enc([1,2,3,4])。
密文计算引擎根据所述合并集合,确定m个数据方中每个数据方对应的特征值并集。为了避免向数据方A暴露数据方B的特征值,以及避免向数据方B暴露数据方A的特征值,本发明实施例在确定m个数据方中每个数据方对应的特征值并集的过程中,对于第i个数据方对应的特征值并集,可以通过将所述合并集合中的非第i个数据方的特征值用占位符替代得到。其中,1≤i≤m。
可以理解,所述占位符可以为预先设置的一种特殊符号,可以为任意标识符,本发明实施例中记为C。在该示例中,数据方A可以接收到密文计算引擎返回的特征值并集C’并A=enc([1,2,3,C]),数据方B可以接收到密文计算引擎返回的特征值并集C’并B=enc([C,2,3,4])。
每个数据方可以对其接收到的特征值并集进行解密,并对解密后的特征值并集进行独热编码,以实现对m个数据方的特征值进行联合独热编码。例如,数据方A对其接收到的特征值并集C’并A=enc([1,2,3,C])中的特征值进行解密,可以得到特征值并集C并A=[1,2,3,C]。数据方A可以对C并A中解密后的特征值进行独热编码,以实现对数据方A和数据方B的特征值进行联合独热编码。
同样的,数据方B对其接收到的特征值并集C’并B=enc([C,2,3,4])中的特征值进行解密,可以得到特征值并集C并B=[C,2,3,4]。数据方B可以对C并B中解密后的特征值进行独热编码,以实现对数据方A和数据方B的特征值进行联合独热编码。
在本发明的一种可选实施例中,所述将持有的特征值集合发送至密文计算引擎之前,所述方法还可以包括:对所述特征值集合中的特征值进行排序,得到有序列表;
所述将持有的特征值集合发送至密文计算引擎,具体可以包括:将所述有序列表发送至密文计算引擎。
为降低密文计算引擎合并各数据方的特征值集合的复杂度,以及降低密文计算引擎确定m个数据方中每个数据方对应的特征值并集的过程中,对所述合并集合中的每个元素分别与第i个数据方的特征值集合中的元素进行遍历比较的复杂度,每个数据方可以预先在本地对其持有的特征值集合中的特征值进行排序,得到有序列表,并将各自的有序列表发送至密文计算引擎。
这样,密文计算引擎对各数据方的有序列表进行合并,可以降低合并操作的复杂度。此外,在确定m个数据方中每个数据方对应的特征值并集的过程中,在每个数据方的特征值集合均为有序列表的情况下,密文计算引擎只需遍历一遍有序合并列表和每个数据方的有序列表,即可确定m个数据方中每个数据方对应的特征值并集,总复杂度为可以降低密文计算引擎执行遍历比较操作的复杂度,提高遍历比较的效率。
在上述示例中,数据方A和数据方B各自在本地获取特征C的特征值集合之后,对各自的特征值集合进行排序。数据方A可以得到有序列表CA=[1,2,3],数据方B可以得到有序列表CB=[2,3,4],数据方A和数据方B对各自的有序列表分别加密后发送至密文计算引擎。
密文计算引擎对接收到的数据方A的有序列表C’A=enc([1,2,3])和数据方B的有序列表C’B=enc([2,3,4])进行合并,得到有序合并列表C’=enc([1,2,3,4])。
密文计算引擎根据所述有序合并列表,确定所述m个数据方中每个数据方对应的特征值并集,并且向所述m个数据方中每个数据方返回其对应的特征值并集,数据方接收到密文计算引擎返回的特征值并集之后,对所述特征值并集进行解密,并对解密后的特征值并集进行独热编码。
在本发明的一种可选实施例中,所述对解密后的特征值并集进行独热编码,具体可以包括:
根据所述特征值并集中的元素个数,确定维度;
将所述解密后的特征值并集中的占位符替换为0;
将替换后的特征值并集编码为所述维度的0-1向量。
在数据方获取其对应的特征值并集之后,可以根据所述特征值并集中的元素个数,确定维度。例如,数据方A可以获取其对应的特征值并集C’并A=enc([1,2,3,C]),特征值并集C’并A=enc([1,2,3,C])中有4个元素,可以确定维度为4。此外,由于占位符C代表该数据方没有的特征值,因此,对于占位符C的维度,可以填充为0。也即,将所述解密后的特征值并集中的占位符替换为0。将替换后的特征值并集编码为所述维度的0-1向量,即可得到独热编码后的数据。
如图2所示,在数据方A本地,数据A表示数据方A持有的特征值,数据A’表示数据方A进行联合独热编码后得到的数据。在数据方B本地,数据B表示数据方B持有的特征值,数据B’表示数据方B进行联合独热编码后得到的数据。
通过本发明实施例的数据处理方法,在多个数据方对特征值进行联合独热编码的过程中,可以保证各数据方的特征值不会暴露给其他数据方,可以保证联合独热编码的数据隐私安全性。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
装置实施例
参照图4,示出了本发明的一种数据处理装置实施例的结构框图,所述装置应用于密文计算引擎,所述装置具体可以包括:
特征值获取模块401,用于获取m个数据方中每个数据方的特征值集合,所述特征值集合中的特征值为密文;
特征值合并模块402,用于合并所述特征值集合,得到合并集合;
特征值替换模块403,用于根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,其中,第i个数据方的特征值并集为将所述合并集合中的非第i个数据方的特征值用占位符替代所得到;
特征值编码模块404,用于向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码。
可选地,所述特征值替换模块,包括:
匹配子模块,用于对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中存在,则保留当前元素,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中不存在,则用占位符替换当前元素,在所述合并集合中的所有元素匹配完成之后,得到第i个数据方对应的特征值并集;
第一获取子模块,用于在所述合并集合与所述m个数据方中所有数据方的特征值集合匹配完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
可选地,所述每个数据方的特征值集合均为有序列表,所述特征值合并模块,具体用于合并所述每个数据方的有序列表,得到有序合并列表;
所述特征值替换模块,包括:
遍历子模块,用于遍历比较所述有序合并列表中的元素和所述每个数据方的有序列表中的元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素相同,则j和k分别指向下一个元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向下一个元素,k保持不变;
特征替换子模块,用于在第i个数据方的有序列表中的元素遍历完成时,若所述有序合并列表中的元素也遍历完成,则得到第i个数据方对应的特征值并集,若所述有序合并列表中存在剩余元素,则用占位符替换所述有序合并列表中的剩余元素,得到第i个数据方对应的特征值并集;
第二获取子模块,用于在所述有序合并列表与所述m个数据方中所有数据方的有序列表遍历比较完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
可选地,所述m个数据方的特征值集合中的特征值对应相同的特征。
参照图5,示出了本发明的另一种数据处理装置实施例的结构框图,所述装置应用于数据方,所述装置具体可以包括:
特征值发送模块501,用于将持有的特征值集合发送至密文计算引擎,以使所述密文计算引擎合并m个数据方的特征值集合,得到合并集合,并且根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,其中,第i个数据方对应的特征值并集中的非第i个数据方的特征值用占位符替代,所述特征值集合中的特征值为密文;
并集接收模块502,用于接收所述密文计算引擎返回的所述数据方对应的特征值并集;
解密编码模块503,用于对所述特征值并集进行解密,并对解密后的特征值并集进行独热编码。
可选地,所述解密编码模块,包括:
维度确定子模块,用于根据所述特征值并集中的元素个数,确定维度;
占位符替换子模块,用于将所述解密后的特征值并集中的占位符替换为0;
编码子模块,用于将替换后的特征值并集编码为所述维度的0-1向量。
可选地,所述装置还包括:
排序模块,用于对所述特征值集合中的特征值进行排序,得到有序列表;
所述特征值发送模块,具体用于将所述有序列表发送至密文计算引擎。
通过本发明实施例的数据处理装置,在多个数据方对特征值进行联合独热编码的过程中,可以保证各数据方的特征值不会暴露给其他数据方,可以保证联合独热编码的数据隐私安全性。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于数据处理的装置,应用于密文计算引擎,所述装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取m个数据方中每个数据方的特征值集合,所述特征值集合中的特征值为密文;合并所述特征值集合,得到合并集合;根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,其中,第i个数据方的特征值并集为将所述合并集合中的非第i个数据方的特征值用占位符替代所得到;向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码。
本发明实施例提供了一种用于数据处理的装置,应用于数据方,所述装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:将持有的特征值集合发送至密文计算引擎,以使所述密文计算引擎合并m个数据方的特征值集合,得到合并集合,并且根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,其中,第i个数据方对应的特征值并集中的非第i个数据方的特征值用占位符替代,所述特征值集合中的特征值为密文;接收所述密文计算引擎返回的所述数据方对应的特征值并集;对所述特征值并集进行解密,并对解密后的特征值并集进行独热编码。
图6是根据一示例性实施例示出的一种用于数据处理的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音信息处理模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频信息处理(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图7是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行图1所示的数据处理方法。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行一种数据处理方法,所述方法包括:获取m个数据方中每个数据方的特征值集合,所述特征值集合中的特征值为密文;合并所述特征值集合,得到合并集合;根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,其中,第i个数据方的特征值并集为将所述合并集合中的非第i个数据方的特征值用占位符替代所得到;向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行一种数据处理方法,所述方法包括:将持有的特征值集合发送至密文计算引擎,以使所述密文计算引擎合并m个数据方的特征值集合,得到合并集合,并且根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,其中,第i个数据方对应的特征值并集中的非第i个数据方的特征值用占位符替代,所述特征值集合中的特征值为密文;接收所述密文计算引擎返回的所述数据方对应的特征值并集;对所述特征值并集进行解密,并对解密后的特征值并集进行独热编码。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种数据处理方法、一种数据处理装置和一种用于数据处理的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (16)

1.一种数据处理方法,其特征在于,应用于密文计算引擎,所述方法包括:
获取m个数据方中每个数据方的特征值集合,所述特征值集合中的特征值为密文;m为大于或等于2的整数;
合并所述特征值集合,得到合并集合;
根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,其中,第i个数据方的特征值并集为将所述合并集合中的非第i个数据方的特征值用占位符替代所得到;1≤i≤m;
向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码;
其中,所述根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,包括:
对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中存在,则保留当前元素,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中不存在,则用占位符替换当前元素,在所述合并集合中的所有元素匹配完成之后,得到第i个数据方对应的特征值并集;
在所述合并集合与所述m个数据方中所有数据方的特征值集合匹配完成之后,得到所述m个数据方中每个数据方对应的特征值并集;
或者,所述每个数据方的特征值集合均为有序列表,所述合并所述特征值集合,得到合并集合,包括:
合并所述每个数据方的有序列表,得到有序合并列表;
所述根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,包括:
遍历比较所述有序合并列表中的元素和所述每个数据方的有序列表中的元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素相同,则j和k分别指向下一个元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向下一个元素,k保持不变;
在第i个数据方的有序列表中的元素遍历完成时,若所述有序合并列表中的元素也遍历完成,则得到第i个数据方对应的特征值并集,若所述有序合并列表中存在剩余元素,则用占位符替换所述有序合并列表中的剩余元素,得到第i个数据方对应的特征值并集;
在所述有序合并列表与所述m个数据方中所有数据方的有序列表遍历比较完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
2.根据权利要求1所述的方法,其特征在于,所述m个数据方的特征值集合中的特征值对应相同的特征。
3.一种数据处理方法,其特征在于,应用于数据方,所述方法包括:
将持有的特征值集合发送至密文计算引擎,以使所述密文计算引擎合并m个数据方的特征值集合,得到合并集合,并且根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,其中,第i个数据方对应的特征值并集中的非第i个数据方的特征值用占位符替代,所述特征值集合中的特征值为密文;m为大于或等于2的整数;1≤i≤m;
接收所述密文计算引擎返回的所述数据方对应的特征值并集;
对所述特征值并集进行解密,并对解密后的特征值并集进行独热编码;
其中,所述根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,包括:
对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中存在,则保留当前元素,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中不存在,则用占位符替换当前元素,在所述合并集合中的所有元素匹配完成之后,得到第i个数据方对应的特征值并集;
在所述合并集合与所述m个数据方中所有数据方的特征值集合匹配完成之后,得到所述m个数据方中每个数据方对应的特征值并集;
或者,所述每个数据方的特征值集合均为有序列表,所述合并m个数据方的特征值集合,得到合并集合,包括:
合并所述每个数据方的有序列表,得到有序合并列表;
所述根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,包括:
遍历比较所述有序合并列表中的元素和所述每个数据方的有序列表中的元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素相同,则j和k分别指向下一个元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向下一个元素,k保持不变;
在第i个数据方的有序列表中的元素遍历完成时,若所述有序合并列表中的元素也遍历完成,则得到第i个数据方对应的特征值并集,若所述有序合并列表中存在剩余元素,则用占位符替换所述有序合并列表中的剩余元素,得到第i个数据方对应的特征值并集;
在所述有序合并列表与所述m个数据方中所有数据方的有序列表遍历比较完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
4.根据权利要求3所述的方法,其特征在于,所述对解密后的特征值并集进行独热编码,包括:
根据所述特征值并集中的元素个数,确定维度;
将所述解密后的特征值并集中的占位符替换为0;
将替换后的特征值并集编码为所述维度的0-1向量。
5.根据权利要求3所述的方法,其特征在于,所述将持有的特征值集合发送至密文计算引擎之前,所述方法还包括:
对所述特征值集合中的特征值进行排序,得到有序列表;
所述将持有的特征值集合发送至密文计算引擎,包括:
将所述有序列表发送至密文计算引擎。
6.一种数据处理装置,其特征在于,应用于密文计算引擎,所述装置包括:
特征值获取模块,用于获取m个数据方中每个数据方的特征值集合,所述特征值集合中的特征值为密文;m为大于或等于2的整数;
特征值合并模块,用于合并所述特征值集合,得到合并集合;
特征值替换模块,用于根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,其中,第i个数据方的特征值并集为将所述合并集合中的非第i个数据方的特征值用占位符替代所得到;1≤i≤m;
特征值编码模块,用于向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码;
其中,所述特征值替换模块,包括:
匹配子模块,用于对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中存在,则保留当前元素,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中不存在,则用占位符替换当前元素,在所述合并集合中的所有元素匹配完成之后,得到第i个数据方对应的特征值并集;
第一获取子模块,用于在所述合并集合与所述m个数据方中所有数据方的特征值集合匹配完成之后,得到所述m个数据方中每个数据方对应的特征值并集;
或者,所述每个数据方的特征值集合均为有序列表,所述特征值合并模块,具体用于合并所述每个数据方的有序列表,得到有序合并列表;
所述特征值替换模块,包括:
遍历子模块,用于遍历比较所述有序合并列表中的元素和所述每个数据方的有序列表中的元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素相同,则j和k分别指向下一个元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向下一个元素,k保持不变;
特征替换子模块,用于在第i个数据方的有序列表中的元素遍历完成时,若所述有序合并列表中的元素也遍历完成,则得到第i个数据方对应的特征值并集,若所述有序合并列表中存在剩余元素,则用占位符替换所述有序合并列表中的剩余元素,得到第i个数据方对应的特征值并集;
第二获取子模块,用于在所述有序合并列表与所述m个数据方中所有数据方的有序列表遍历比较完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
7.根据权利要求6所述的装置,其特征在于,所述m个数据方的特征值集合中的特征值对应相同的特征。
8.一种数据处理装置,其特征在于,应用于数据方,所述装置包括:
特征值发送模块,用于将持有的特征值集合发送至密文计算引擎,以使所述密文计算引擎合并m个数据方的特征值集合,得到合并集合,并且根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,其中,第i个数据方对应的特征值并集中的非第i个数据方的特征值用占位符替代,所述特征值集合中的特征值为密文;m为大于或等于2的整数;1≤i≤m;
并集接收模块,用于接收所述密文计算引擎返回的所述数据方对应的特征值并集;
解密编码模块,用于对所述特征值并集进行解密,并对解密后的特征值并集进行独热编码;
其中,所述密文计算引擎包括特征值合并模块和特征值替换模块;
所述特征值合并模块用于合并所述特征值集合,得到合并集合;
所述特征值替换模块包括:
匹配子模块,用于对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中存在,则保留当前元素,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中不存在,则用占位符替换当前元素,在所述合并集合中的所有元素匹配完成之后,得到第i个数据方对应的特征值并集;
第一获取子模块,用于在所述合并集合与所述m个数据方中所有数据方的特征值集合匹配完成之后,得到所述m个数据方中每个数据方对应的特征值并集;
或者,所述每个数据方的特征值集合均为有序列表,所述特征值合并模块,具体用于合并所述每个数据方的有序列表,得到有序合并列表;
所述特征值替换模块,包括:
遍历子模块,用于遍历比较所述有序合并列表中的元素和所述每个数据方的有序列表中的元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素相同,则j和k分别指向下一个元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向下一个元素,k保持不变;
特征替换子模块,用于在第i个数据方的有序列表中的元素遍历完成时,若所述有序合并列表中的元素也遍历完成,则得到第i个数据方对应的特征值并集,若所述有序合并列表中存在剩余元素,则用占位符替换所述有序合并列表中的剩余元素,得到第i个数据方对应的特征值并集;
第二获取子模块,用于在所述有序合并列表与所述m个数据方中所有数据方的有序列表遍历比较完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
9.根据权利要求8所述的装置,其特征在于,所述解密编码模块,包括:
维度确定子模块,用于根据所述特征值并集中的元素个数,确定维度;
占位符替换子模块,用于将所述解密后的特征值并集中的占位符替换为0;
编码子模块,用于将替换后的特征值并集编码为所述维度的0-1向量。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
排序模块,用于对所述特征值集合中的特征值进行排序,得到有序列表;
所述特征值发送模块,具体用于将所述有序列表发送至密文计算引擎。
11.一种用于数据处理的装置,其特征在于,应用于密文计算引擎,所述装置包括有存储器,以及一个以上的程序,其中一个以上程序存储于存储器中,且经配置以由一个以上处理器执行所述一个以上程序包含用于进行以下操作的指令:
获取m个数据方中每个数据方的特征值集合,所述特征值集合中的特征值为密文;m为大于或等于2的整数;
合并所述特征值集合,得到合并集合;
根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,其中,第i个数据方的特征值并集为将所述合并集合中的非第i个数据方的特征值用占位符替代所得到;1≤i≤m;
向所述m个数据方中每个数据方返回其对应的特征值并集,以使每个数据方对各自接收的特征值并集进行独热编码;
所述根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,包括:
对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中存在,则保留当前元素,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中不存在,则用占位符替换当前元素,在所述合并集合中的所有元素匹配完成之后,得到第i个数据方对应的特征值并集;
在所述合并集合与所述m个数据方中所有数据方的特征值集合匹配完成之后,得到所述m个数据方中每个数据方对应的特征值并集;
或者,所述每个数据方的特征值集合均为有序列表,所述合并所述特征值集合,得到合并集合,包括:
合并所述每个数据方的有序列表,得到有序合并列表;
所述根据所述合并集合,确定所述m个数据方中每个数据方对应的特征值并集,包括:
遍历比较所述有序合并列表中的元素和所述每个数据方的有序列表中的元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素相同,则j和k分别指向下一个元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向下一个元素,k保持不变;
在第i个数据方的有序列表中的元素遍历完成时,若所述有序合并列表中的元素也遍历完成,则得到第i个数据方对应的特征值并集,若所述有序合并列表中存在剩余元素,则用占位符替换所述有序合并列表中的剩余元素,得到第i个数据方对应的特征值并集;
在所述有序合并列表与所述m个数据方中所有数据方的有序列表遍历比较完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
12.根据权利要求11所述的装置,其特征在于,所述m个数据方的特征值集合中的特征值对应相同的特征。
13.一种用于数据处理的装置,其特征在于,应用于数据方,所述装置包括有存储器,以及一个以上的程序,其中一个以上程序存储于存储器中,且经配置以由一个以上处理器执行所述一个以上程序包含用于进行以下操作的指令:
将持有的特征值集合发送至密文计算引擎,以使所述密文计算引擎合并m个数据方的特征值集合,得到合并集合,并且根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,其中,第i个数据方对应的特征值并集中的非第i个数据方的特征值用占位符替代,所述特征值集合中的特征值为密文;m为大于或等于2的整数;1≤i≤m;
接收所述密文计算引擎返回的所述数据方对应的特征值并集;
对所述特征值并集进行解密,并对解密后的特征值并集进行独热编码;
其中,所述根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,包括:
对所述合并集合中的每个元素分别与第i个数据方的特征值集合进行匹配,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中存在,则保留当前元素,若所述合并集合中的当前元素在所述第i个数据方的特征值集合中不存在,则用占位符替换当前元素,在所述合并集合中的所有元素匹配完成之后,得到第i个数据方对应的特征值并集;
在所述合并集合与所述m个数据方中所有数据方的特征值集合匹配完成之后,得到所述m个数据方中每个数据方对应的特征值并集;
或者,所述每个数据方的特征值集合均为有序列表,所述合并m个数据方的特征值集合,得到合并集合,包括:
合并所述每个数据方的有序列表,得到有序合并列表;
所述根据所述合并集合确定m个数据方中每个数据方对应的特征值并集,包括:
遍历比较所述有序合并列表中的元素和所述每个数据方的有序列表中的元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素相同,则j和k分别指向下一个元素,若所述有序合并列表中的第j个元素与第i个数据方的有序列表中的第k个元素不同,则用占位符替换所述有序合并列表中的第j个元素,并且j指向下一个元素,k保持不变;
在第i个数据方的有序列表中的元素遍历完成时,若所述有序合并列表中的元素也遍历完成,则得到第i个数据方对应的特征值并集,若所述有序合并列表中存在剩余元素,则用占位符替换所述有序合并列表中的剩余元素,得到第i个数据方对应的特征值并集;
在所述有序合并列表与所述m个数据方中所有数据方的有序列表遍历比较完成之后,得到所述m个数据方中每个数据方对应的特征值并集。
14.根据权利要求13所述的装置,其特征在于,所述对解密后的特征值并集进行独热编码,包括:
根据所述特征值并集中的元素个数,确定维度;
将所述解密后的特征值并集中的占位符替换为0;
将替换后的特征值并集编码为所述维度的0-1向量。
15.根据权利要求13所述的装置,其特征在于,所述装置还经配置以由一个以上处理器执行所述一个以上程序包含用于进行以下操作的指令:
对所述特征值集合中的特征值进行排序,得到有序列表;
所述将持有的特征值集合发送至密文计算引擎,包括:
将所述有序列表发送至密文计算引擎。
16.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至5任一所述的数据处理方法。
CN202110150822.8A 2021-02-03 2021-02-03 一种数据处理方法、装置和用于数据处理的装置 Active CN112906904B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110150822.8A CN112906904B (zh) 2021-02-03 2021-02-03 一种数据处理方法、装置和用于数据处理的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110150822.8A CN112906904B (zh) 2021-02-03 2021-02-03 一种数据处理方法、装置和用于数据处理的装置

Publications (2)

Publication Number Publication Date
CN112906904A CN112906904A (zh) 2021-06-04
CN112906904B true CN112906904B (zh) 2024-03-26

Family

ID=76121894

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110150822.8A Active CN112906904B (zh) 2021-02-03 2021-02-03 一种数据处理方法、装置和用于数据处理的装置

Country Status (1)

Country Link
CN (1) CN112906904B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120059435A (ko) * 2010-11-30 2012-06-08 고려대학교 산학협력단 프라이버시를 보호할 수 있는 집합 연산 방법
CN107391973A (zh) * 2017-07-17 2017-11-24 北京深思数盾科技股份有限公司 一种函数保护方法及装置
WO2018102861A1 (en) * 2016-12-08 2018-06-14 Commonwealth Scientific And Industrial Research Organisation Secure text analytics
CN111310194A (zh) * 2020-02-14 2020-06-19 全球能源互联网研究院有限公司 一种漏洞渗透验证方法及装置
CN111742313A (zh) * 2018-02-14 2020-10-02 万思伴股份有限公司 用于隐私保留上下文认证的系统、装置及方法
CN111832067A (zh) * 2020-05-26 2020-10-27 华控清交信息科技(北京)有限公司 一种数据处理方法、装置和用于数据处理的装置
CN111885079A (zh) * 2020-07-31 2020-11-03 支付宝(杭州)信息技术有限公司 保护数据隐私的多方联合处理数据的方法及装置
CN111898767A (zh) * 2020-08-06 2020-11-06 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及介质
CN111931207A (zh) * 2020-08-07 2020-11-13 北京百度网讯科技有限公司 获得隐私集合交集的方法、装置、设备及存储介质
CN111950624A (zh) * 2020-08-10 2020-11-17 中国平安人寿保险股份有限公司 客户风险评估模型构建方法、装置、存储介质及终端设备
CN111967615A (zh) * 2020-09-25 2020-11-20 北京百度网讯科技有限公司 基于特征抽取的多模型训练方法及系统、电子设备和介质
CN112183765A (zh) * 2020-10-30 2021-01-05 浙江大学 一种用于共享学习的多源多模态数据预处理方法及系统
CN112307056A (zh) * 2019-07-31 2021-02-02 华控清交信息科技(北京)有限公司 一种数据处理方法、装置和用于数据处理的装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9467424B2 (en) * 2011-10-07 2016-10-11 Salesforce.Com, Inc. Methods and systems for proxying data
GB2548163B (en) * 2016-03-11 2022-06-15 V Nova Int Ltd Data processing devices, data processing units, methods and computer programs for processsing telemetry data
CN107506650A (zh) * 2016-06-14 2017-12-22 索尼公司 信息处理设备和信息处理方法
US10984340B2 (en) * 2017-03-31 2021-04-20 Intuit Inc. Composite machine-learning system for label prediction and training data collection
US10608811B2 (en) * 2017-06-15 2020-03-31 Microsoft Technology Licensing, Llc Private set intersection encryption techniques
CN108536669B (zh) * 2018-02-27 2019-10-22 北京达佳互联信息技术有限公司 文字信息处理方法、装置及终端
US20200242506A1 (en) * 2019-01-25 2020-07-30 Optum Services (Ireland) Limited Systems and methods for time-based abnormality identification within uniform dataset
US11392689B2 (en) * 2019-03-28 2022-07-19 Crowdstrike, Inc. Computer-security violation detection using coordinate vectors
WO2020206180A1 (en) * 2019-04-02 2020-10-08 Nusantao, Inc. Managing access to data and managing operations performed by applications

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120059435A (ko) * 2010-11-30 2012-06-08 고려대학교 산학협력단 프라이버시를 보호할 수 있는 집합 연산 방법
WO2018102861A1 (en) * 2016-12-08 2018-06-14 Commonwealth Scientific And Industrial Research Organisation Secure text analytics
CN107391973A (zh) * 2017-07-17 2017-11-24 北京深思数盾科技股份有限公司 一种函数保护方法及装置
CN111742313A (zh) * 2018-02-14 2020-10-02 万思伴股份有限公司 用于隐私保留上下文认证的系统、装置及方法
CN112307056A (zh) * 2019-07-31 2021-02-02 华控清交信息科技(北京)有限公司 一种数据处理方法、装置和用于数据处理的装置
CN111310194A (zh) * 2020-02-14 2020-06-19 全球能源互联网研究院有限公司 一种漏洞渗透验证方法及装置
CN111832067A (zh) * 2020-05-26 2020-10-27 华控清交信息科技(北京)有限公司 一种数据处理方法、装置和用于数据处理的装置
CN111885079A (zh) * 2020-07-31 2020-11-03 支付宝(杭州)信息技术有限公司 保护数据隐私的多方联合处理数据的方法及装置
CN111898767A (zh) * 2020-08-06 2020-11-06 深圳前海微众银行股份有限公司 数据处理方法、装置、设备及介质
CN111931207A (zh) * 2020-08-07 2020-11-13 北京百度网讯科技有限公司 获得隐私集合交集的方法、装置、设备及存储介质
CN111950624A (zh) * 2020-08-10 2020-11-17 中国平安人寿保险股份有限公司 客户风险评估模型构建方法、装置、存储介质及终端设备
CN111967615A (zh) * 2020-09-25 2020-11-20 北京百度网讯科技有限公司 基于特征抽取的多模型训练方法及系统、电子设备和介质
CN112183765A (zh) * 2020-10-30 2021-01-05 浙江大学 一种用于共享学习的多源多模态数据预处理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
企业电子文档的安全存储和访问问题的研究;杨本杰;工业控制计算机(11);第3、4、7页 *

Also Published As

Publication number Publication date
CN112906904A (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
US20220382884A1 (en) Method and device for parsing shared password
CN112241250B (zh) 一种数据处理方法、装置和用于数据处理的装置
CN114401154B (zh) 一种数据处理方法、装置、密文计算引擎和用于数据处理的装置
CN114978512B (zh) 一种隐私求交方法、装置和可读存储介质
CN112688779B (zh) 一种数据处理方法、装置和用于数据处理的装置
CN114840568B (zh) 一种密文排序方法、装置和用于密文排序的装置
CN114969830B (zh) 一种隐私求交方法、系统和可读存储介质
CN113315631A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN114884645B (zh) 一种隐私计算方法、装置和可读存储介质
CN112269904B (zh) 数据处理方法及装置
CN108053241B (zh) 数据分析方法、装置及计算机可读存储介质
CN112487415B (zh) 计算任务的安全性检测方法及装置
CN115941181B (zh) 一种乱序秘密分享方法、系统和可读存储介质
CN112464257A (zh) 一种数据检测方法、装置和用于数据检测的装置
CN112906904B (zh) 一种数据处理方法、装置和用于数据处理的装置
CN114885038B (zh) 一种加密协议转换方法、结果获取节点和隐私计算节点
CN107193530B (zh) 一种生成随机数的方法和装置
CN113239389B (zh) 一种数据处理方法、装置和用于数据处理的装置
CN114996752A (zh) 一种多方隐私求交方法、装置和用于多方隐私求交的装置
CN112468290B (zh) 一种数据处理方法、装置和用于数据处理的装置
CN114553552A (zh) 数据加密方法和装置、数据解密方法和装置及存储介质
US11444927B2 (en) Method and apparatus for encrypting data
CN114880691B (zh) 一种字符编码解码方法、装置和用于字符编码解码的装置
CN113779500B (zh) 一种数据处理方法、装置和用于数据处理的装置
CN112016637B (zh) 分层抽样方法、装置和用于分层抽样的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant