CN116522366A - 一种适用于大数据的多方数据处理方法、存储介质和产品 - Google Patents

一种适用于大数据的多方数据处理方法、存储介质和产品 Download PDF

Info

Publication number
CN116522366A
CN116522366A CN202310753796.7A CN202310753796A CN116522366A CN 116522366 A CN116522366 A CN 116522366A CN 202310753796 A CN202310753796 A CN 202310753796A CN 116522366 A CN116522366 A CN 116522366A
Authority
CN
China
Prior art keywords
party
data
data processing
ciphertext
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310753796.7A
Other languages
English (en)
Other versions
CN116522366B (zh
Inventor
张民敏
刘会议
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Sanwei Xinan Information Technology Co ltd
Sanwei Xin'an Technology Co ltd
Original Assignee
Shandong Sanwei Xinan Information Technology Co ltd
Sanwei Xin'an Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Sanwei Xinan Information Technology Co ltd, Sanwei Xin'an Technology Co ltd filed Critical Shandong Sanwei Xinan Information Technology Co ltd
Priority to CN202310753796.7A priority Critical patent/CN116522366B/zh
Publication of CN116522366A publication Critical patent/CN116522366A/zh
Application granted granted Critical
Publication of CN116522366B publication Critical patent/CN116522366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开了一种适用于大数据的多方数据处理方法、存储介质和产品,利用了选择排序和安全多方计算技术,面向系统中的三种实体包括用户、一个数据处理方以及一个辅助计算方,系统的所有实体都是半诚实的,数据处理方和辅助计算方之间不能合谋,数据处理方计算密钥,用户根据密钥进行加密获得密文,并发送至辅助计算方;数据处理方和辅助计算方之间对密文进行排序,并根据排序结果计算后n个密文的数据之和,数据处理方将数据之和及排序次序发送给对应的用户。本发明方法可以在多个互不信任的参与者之间实现数据处理而不泄露各方的隐私。

Description

一种适用于大数据的多方数据处理方法、存储介质和产品
技术领域
本发明涉及信息安全技术领域,更具体的说是涉及一种适用于大数据的多方数据处理方法、存储介质和产品。
背景技术
随着信息技术的发展,现代社会进入了大数据时代,与此同时,信息泄露事件不断发生,网络攻击愈演愈烈。信息技术在给人们带来便捷的同时,信息安全问题也不断凸显,人们对隐私保护的需求日益增长。
通常情况下,人们都是使用加密技术来确保数据的安全性。但是被加密的数据在不解密的情况下,直接进行排序是比较困难的。多方安全计算中参与方使用各自的秘密输入协同计算某个函数,即使在一方甚至多方被攻击的情况下,仍能保证参与方的输入不被意外泄露,并且保证函数计算结果的正确性和隐私安全,从而实现了数据“可用而不可见”。而多方安全计算中多方进行数据处理,过程复杂,计算量和通信量较大,且多方交互同样存在信息安全问题。
因此,如何提供一种适用于大数据的多方数据处理方法是本领域技术人员亟需解决的问题。
发明内容
鉴于此,本发明提供了一种适用于大数据的多方数据处理方法、存储介质和产品,利用了选择排序和安全多方计算技术,面向系统中的三种实体:用户、一个数据处理方以及一个辅助计算方,系统的所有实体都是半诚实的,数据处理方和辅助计算方之间不能合谋,从而保证了数据的安全性。
为了实现上述目的,本发明采用如下技术方案:
一种适用于大数据的多方数据处理方法,包括以下步骤:
步骤1:数据处理方计算密钥,用户根据密钥进行加密获得密文,并发送至辅助计算方;
步骤2:数据处理方和辅助计算方之间交互计算,对所有用户的密文进行排序,并根据排序结果计算后n个密文的数据之和;
步骤3:对于每个用户,数据处理方将其排序次序和数据之和发送给该用户。
优选的,步骤1的具体过程为:
步骤11:数据处理方调用密钥生成算法KeyGen,生成公钥pk和私钥sk,并公开公钥pk;
步骤12:用户根据公钥pk对其私有数据x进行加密,获得密文[x],并将密文[x]发送至辅助计算方。
优选的,步骤2的具体过程为:
步骤21:数据处理方与辅助计算方之间进行选择排序计算,二者利用算法SelectSort将用户数据按照从小到大的顺序排序,计算过程中数据均以密文的状态存在;
步骤22:数据处理方将排序结果发送给辅助计算方,辅助计算方求得排序结果中后n个密文的乘积,并将乘积结果发送给数据处理方;
步骤23:数据处理方对乘积结果进行解密,得到后n个密文的数据之和。
优选的,排序计算的具体过程为:
步骤211:在数据处理方和辅助计算方分别计算每个用户的数据的算数分享份额;
步骤212:数据处理方和辅助计算方以各自拥有的数据的算数分享份额为输入,分别运行A-Y转换,将数据的算数分享份额转换成数据的Yao分享份额;
步骤213:数据处理方和辅助计算方以各自拥有的数据的Yao分享份额为输入,运行Yao协议,计算出最小数据的序号对应的序号Yao分享份额;
步骤214:基于序号的Yao分享份额,数据处理方和辅助计算方运行Yao协议和Y-A转换,计算出最小数据的序号对应的用户及其当前排序位置;采用argmin算法计算排序位置;
步骤215:获得所有用户的数据对应的排序位置,即所有密文排序完成,获得排序结果。
优选的,步骤3中数据处理方知道所有用户数据的大小次序及后n个用户数据之和。对于每个用户,数据处理方将其排序次序以及后n个用户数据之和发送给该用户。数据处理方知道用户原始的明文数据的大小次序,但不知道具体的明文;每个用户知道且只知道自己的数据在所有用户数据中的大小次序以及后n个用户数据之和。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种适用于大数据的多方数据处理方法、存储介质和产品,设计了一种适用于大数据的多方数据处理方法,该方法可以在多个互不信任的参与者之间实现数据处理而不泄露各方的隐私;本发明设计的协议利用可信第三方对收到的匿名数据进行选择排序,之后将排序后的结果发送给参与方,从而使参与方知道且只知道自己的数据在所有参与方中的大小次序以及后个用户数据之和;本发明所设计的协议中所有用户之间无需进行任何交互,每个用户的计算复杂度和通信复杂度与计算函数无关。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的多方数据处理系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种适用于大数据的多方数据处理方法,多方数据处理系统如图1所示。
系统主要由三个主体组成:一个数据处理方、一个辅助计算方以及多个用户。系统主要有3个主要流程:
(1)在初始化阶段,数据处理方生成公钥和私钥,并将公钥公开;用户使用公钥对其私有数据加密得到密文,并将密文发送给辅助计算方。
(2)在数据处理阶段,数据处理方与辅助计算方进行选择排序计算,二者利用一个安全选择排序算法SelectSort,将用户数据按照从小到大的顺序排序。数据处理方将排序结果发送给辅助计算方,辅助计算方求得后n个数据密文的乘积,将乘积结果发送给数据处理方,数据处理方对乘积结果进行解密,即得到后n个数据之和。
(3)在广播阶段,在广播阶段,数据处理方知道所有用户原始数据的大小次序。对于每个用户,数据处理方将其排序次序以及后n个数据之和发送给该用户,每个用户知道且只知道自己的数据在所有用户数据中的大小次序以及后n个数据之和。
实施例
在一个具体实施例中,在医疗大数据应用场景中的具体实施步骤如下:在医疗应用场景中,每家医院独立地拥有本医院患者的详细数据,医院希望能够对所有患者的数据进行分析,以帮助医院提升诊疗水平、优化改善科室建设、加强院间医疗合作,但是医院不希望其他机构获取其私有数据。
一、初始化阶段:
数据处理方调用Paillier加密方案的密钥生成算法KeyGen,随机选择两个大素数p和q,N=pq,生成公钥pk=N和私钥,并将公钥pk公开;假设医院数目为n,医院/>分别使用公钥pk对某病例患病数量xi加密得到密文[xi],并将密文[xi]发送给辅助计算方。
二、数据处理阶段:
数据处理方与辅助计算方利用安全选择排序算法SelectSort,将患病数量按照从小到大的顺序排序,计算过程中数据均以密文的状态存在。
设数据处理方为,辅助计算方为/>,安全选择排序算法SelectSort运算的具体过程如下:
S1:对于未排序的患病数量密文,m表示未排序的元素数目,/>均匀随机地选择/>作为xt的算术分享份额,即Q2得到/>;设/>为Q1端xt的算术分享份额,Q2计算/>,即,并将/>发送给Q1
S2:对于,/>运行Paillier加密方案的解密算法Dec,计算/>,得到/>
S3:Q1和Q2分别运行A-Y转换,将数据的算数分享份额转换为Yao分享份额,分别得到向量的Yao分享份额/>和/>
S4:Q1和Q2调用Yao协议,计算函数argmin(X),分别得到X中最小元素的序号j对应的Yao分享份额和/>
S5:对于,Q1和Q2调用Yao协议,计算/>;当t=j时,equality(t,j)=1,/>,/>;当/>时,equality(t,j)=0,/>,/>
S6:Q1持有,Q2持有/>,其中,/>,j=argmin(X);Q1和Q2运行Y-A转换,将F的Yao分享份额转换为算数分享份额,分别得到/>和/>
S7:Q1用公钥pk对进行加密,得到/>并发送给Q2
S8:对于,Q2同样地对/>进行加密,得到/>,Q2计算/>,得到/>
S9:Q2及对应的医院ID发送给Q1,Q1对/>解密得到/>,其中,其他等于0,则序号j为最小数据对应的序号。Q1记录序号j对应的医院ID及其当前排序位置;
S10:重复执行S1~S9,直到所有医院数据排序完毕;
S11:数据处理方得到所有医院患病数量的大小次序,将排序结果发送给辅助计算方,辅助计算方求得排序中的后n个数据密文的乘积,将发送给数据处理方,数据处理方对进行解密,即得到后n个患病数量之和。
三、广播阶段:
对于每家医院,数据处理方将该医院患病数据的大小次序结果以及后n个患病数量之和广播给该医院,最终,每家医院知道且只知道自己的数据在所有医院数据中的大小次序以及后n个患病数量之和。通过对数据的分析,可以实现有针对性地加强特色科室建设,储备特色人才等目的。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种适用于大数据的多方数据处理方法,其特征在于,包括以下步骤:
步骤1:数据处理方计算密钥,用户根据密钥进行加密获得密文,并发送至辅助计算方;
步骤2:数据处理方和辅助计算方之间交互计算,对所有用户的密文进行排序,并根据排序结果计算后n个密文的数据之和;
步骤3:数据处理方根据排序结果将每个用户对应的排序次序以及数据之和广播给对应的用户。
2.根据权利要求1所述的一种适用于大数据的多方数据处理方法,其特征在于,步骤1的具体过程为:
步骤11:数据处理方调用密钥生成算法KeyGen,生成公钥和私钥,并公开公钥;
步骤12:用户根据公钥对其私有数据进行加密,获得密文,并将密文发送至辅助计算方。
3.根据权利要求1所述的一种适用于大数据的多方数据处理方法,其特征在于,步骤2的具体过程为:
步骤21:数据处理方和辅助计算方之间采用SelectSort算法对所有用户的密文按照从小到大的顺序进行计算排序,计算过程中所有数据均为密文状态;
步骤22:数据处理方将排序结果发送给辅助计算方,辅助计算方计算排序结果中后n个密文的乘积,并将乘积结果发送给数据处理方;
步骤23:数据处理方对乘积结果进行解密,得到后n个密文的数据之和。
4.根据权利要求3所述的一种适用于大数据的多方数据处理方法,其特征在于,排序的具体过程为:
步骤211:在数据处理方和辅助计算方分别计算每个用户的数据的算数分享份额;
步骤212:分别对数据处理方和辅助计算方的数据的算数分享份额进行A-Y转换,获得数据的Yao分享份额;
步骤213:分别对数据处理方和辅助计算方的数据的Yao分享份额采用Yao协议计算出最小数据的序号对应的序号Yao分享份额;
步骤214:数据处理方和辅助计算方分别对序号Yao分享份额采用Yao协议计算和Y-A转换,计算出最小数据的序号对应的用户及其当前排序位置;
步骤215:获得所有用户的密文对应的排序位置,得到排序结果。
5.根据权利要求2所述的一种适用于大数据的多方数据处理方法,其特征在于,步骤3中数据处理方存储有所有用户的私有数据的大小次序,数据处理方将每个用户对应的排序次序以及数据之和发送给对应的用户。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-5任一所述方法的步骤。
7.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-5任一所述方法的步骤。
CN202310753796.7A 2023-06-26 2023-06-26 一种适用于大数据的多方数据处理方法、存储介质和产品 Active CN116522366B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310753796.7A CN116522366B (zh) 2023-06-26 2023-06-26 一种适用于大数据的多方数据处理方法、存储介质和产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310753796.7A CN116522366B (zh) 2023-06-26 2023-06-26 一种适用于大数据的多方数据处理方法、存储介质和产品

Publications (2)

Publication Number Publication Date
CN116522366A true CN116522366A (zh) 2023-08-01
CN116522366B CN116522366B (zh) 2023-09-19

Family

ID=87396208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310753796.7A Active CN116522366B (zh) 2023-06-26 2023-06-26 一种适用于大数据的多方数据处理方法、存储介质和产品

Country Status (1)

Country Link
CN (1) CN116522366B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116719502A (zh) * 2023-08-11 2023-09-08 蓝象智联(杭州)科技有限公司 一种基于隐私保护的数据相减运算方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150149763A1 (en) * 2013-11-27 2015-05-28 Microsoft Corporation Server-Aided Private Set Intersection (PSI) with Data Transfer
CN113127916A (zh) * 2021-05-18 2021-07-16 腾讯科技(深圳)有限公司 数据集合处理方法、数据处理方法、装置及存储介质
CN114168977A (zh) * 2021-11-07 2022-03-11 西安电子科技大学 一种基于密文的数值安全排序方法及系统
CN114726524A (zh) * 2022-06-02 2022-07-08 平安科技(深圳)有限公司 目标数据的排序方法、装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150149763A1 (en) * 2013-11-27 2015-05-28 Microsoft Corporation Server-Aided Private Set Intersection (PSI) with Data Transfer
CN113127916A (zh) * 2021-05-18 2021-07-16 腾讯科技(深圳)有限公司 数据集合处理方法、数据处理方法、装置及存储介质
CN114168977A (zh) * 2021-11-07 2022-03-11 西安电子科技大学 一种基于密文的数值安全排序方法及系统
CN114726524A (zh) * 2022-06-02 2022-07-08 平安科技(深圳)有限公司 目标数据的排序方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116719502A (zh) * 2023-08-11 2023-09-08 蓝象智联(杭州)科技有限公司 一种基于隐私保护的数据相减运算方法
CN116719502B (zh) * 2023-08-11 2023-10-20 蓝象智联(杭州)科技有限公司 一种基于隐私保护的数据相减运算方法

Also Published As

Publication number Publication date
CN116522366B (zh) 2023-09-19

Similar Documents

Publication Publication Date Title
Xing et al. Mutual privacy preserving $ k $-means clustering in social participatory sensing
Belguith et al. Phoabe: Securely outsourcing multi-authority attribute based encryption with policy hidden for cloud assisted iot
Wu et al. Toward blockchains for health-care systems: Applying the bilinear pairing technology to ensure privacy protection and accuracy in data sharing
Liu et al. An efficient privacy-preserving outsourced calculation toolkit with multiple keys
CN105794145B (zh) 利用服务器辅助的私有集交集(psi)的方法
Zhang et al. Fine-grained private matching for proximity-based mobile social networking
CN107196926B (zh) 一种云外包隐私集合比较方法与装置
RU2534944C2 (ru) Способ обеспечения безопасности связи в сети, используемые для этого устройство связи, сеть и компьютерная программа
CN106961336A (zh) 一种基于sm2算法的密钥分量托管方法和系统
CN109361510B (zh) 一种支持溢出检测和大整数运算的信息处理方法及应用
CN109214201A (zh) 一种数据共享方法、终端设备及计算机可读存储介质
CN112003696B (zh) Sm9密钥生成方法、系统、电子设备、装置及存储介质
Bilogrevic et al. Meetings through the cloud: privacy-preserving scheduling on mobile devices
US20110060901A1 (en) Cryptographic System for Performing Secure Iterative Matrix Inversions and Solving Systems of Linear Equations
CN116522366B (zh) 一种适用于大数据的多方数据处理方法、存储介质和产品
Feng et al. Privacy-preserving computation in cyber-physical-social systems: A survey of the state-of-the-art and perspectives
Hou et al. Verifiable privacy-preserving scheme based on vertical federated random forest
Liu et al. A privacy-preserving outsourced functional computation framework across large-scale multiple encrypted domains
CN114039785B (zh) 数据加密、解密、处理方法、装置、设备和存储介质
CN111159766A (zh) 一种具有隐私保护的网约车服务方法、系统及存储介质
Wang et al. Privacy preserving computations over healthcare data
Huang et al. A conference key agreement protocol with fault-tolerant capability
Andersen et al. Privacy preserving health data processing
Karati et al. Design of a secure file storage and access protocol for cloud-enabled Internet of Things environment
CN110198216A (zh) 一种保护隐私的增量真值发现方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant