CN117235801B - 隐私数据的统计方法、电子设备及存储介质 - Google Patents

隐私数据的统计方法、电子设备及存储介质 Download PDF

Info

Publication number
CN117235801B
CN117235801B CN202311492477.1A CN202311492477A CN117235801B CN 117235801 B CN117235801 B CN 117235801B CN 202311492477 A CN202311492477 A CN 202311492477A CN 117235801 B CN117235801 B CN 117235801B
Authority
CN
China
Prior art keywords
data
key
computing node
statistical
ciphertext
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311492477.1A
Other languages
English (en)
Other versions
CN117235801A (zh
Inventor
俞海清
张舒畅
宋英齐
胡益榕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tianrun Foundation Technology Development Co ltd
Original Assignee
Beijing Tianrun Foundation Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tianrun Foundation Technology Development Co ltd filed Critical Beijing Tianrun Foundation Technology Development Co ltd
Priority to CN202311492477.1A priority Critical patent/CN117235801B/zh
Publication of CN117235801A publication Critical patent/CN117235801A/zh
Application granted granted Critical
Publication of CN117235801B publication Critical patent/CN117235801B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Storage Device Security (AREA)
  • Complex Calculations (AREA)

Abstract

本公开提供了一种隐私数据的统计方法、电子设备及存储介质,涉及数据安全领域。该隐私数据的统计方法应用于统计数据需求方,该方法包括:获取多个统计数据密文,每个统计数据密文由统计数据密文对应的计算节点对多个隐私数据密文进行目标统计运算得到,每个隐私数据密文由隐私数据密文对应的数据持有方基于多个随机噪声和计算节点所公开的计算节点秘钥,将所持有的隐私数据加密得到;获取统计数据秘钥,统计数据秘钥由多个计算节点各自公开的计算节点秘钥确定;基于统计数据秘钥,对多个统计数据密文进行解密,得到统计数据。以此,能够在得到真实、准确的统计数据的同时,规避隐私数据在传递、统计运算过程中泄露的风险。

Description

隐私数据的统计方法、电子设备及存储介质
技术领域
本公开涉及数据安全技术领域,具体涉及一种隐私数据的统计方法、电子设备及存储介质。
背景技术
现代社会中,数据统计已经成为各个领域中不可或缺的一部分。通过对社会各方面数据进行统计分析,可以了解社会的发展情况和问题,并为政府制定相关政策提供依据。然而,这些原始数据分别由不同的参与方持有,并且具有隐私性,在统计过程中,需要确保参与方的隐私数据不被泄露。
相关技术中,为避免真实信息遭到泄露,会在隐私数据上加入噪声,但该方法在保护隐私数据的同时,牺牲了统计结果的准确性。另一种相关技术中,会通过同态加密的方式进行统计运算,但该方法所得的统计结果需要由私钥持有方进行解密并公开,而私钥持有方同样可能对加密数据本身进行解密获得各方的隐私数据,对数据安全造成威胁。
发明内容
有鉴于此,本公开实施例提供了一种隐私数据的统计方法、电子设备及存储介质。
第一方面,本公开一实施例提供了一种隐私数据的统计方法,应用于统计数据需求方,统计数据需求方与多个计算节点通信连接,计算节点与多个数据持有方通信连接。该方法包括:获取多个统计数据密文,每个统计数据密文由统计数据密文对应的计算节点对多个隐私数据密文进行目标统计运算得到,每个隐私数据密文由隐私数据密文对应的数据持有方基于多个随机噪声和计算节点所公开的计算节点秘钥,将所持有的隐私数据加密得到;获取统计数据秘钥,统计数据秘钥由多个计算节点各自公开的计算节点秘钥确定;基于统计数据秘钥,对多个统计数据密文进行解密,得到统计数据。
结合第一方面,在第一方面的某些实现方式中,统计数据秘钥满足以下条件:对任意的/>阶多项式/>,/>均成立,其中,表示统计数据秘钥中的第j个分量,m表示计算节点的数量,/>表示第j个计算节点所公开的计算节点秘钥。
结合第一方面,在第一方面的某些实现方式中,统计数据秘钥包括多个分量,每个分量分别对应于一个计算节点公开的统计数据密文,基于统计数据秘钥,对多个统计数据密文进行解密,得到统计数据,包括:分别将统计数据秘钥的多个分量与对应的统计数据密文相乘;基于所得的乘积,确定统计数据。
第二方面,本公开一实施例提供了一种隐私数据的统计方法,应用于数据持有方,数据持有方与多个计算节点通信连接,计算节点与统计数据需求方通信连接。该方法包括:确定多个随机噪声,随机噪声的数量由计算节点的数量确定;获取计算节点秘钥,计算节点秘钥由计算节点确定并公开;利用多个随机噪声和计算节点秘钥,将数据持有方所持有的隐私数据加密,得到数据持有方的隐私数据密文;将隐私数据密文发送给计算节点,以便计算节点基于隐私数据密文进行目标统计运算,得到计算节点的统计数据密文,并且数据统计需求方对统计数据密文进行解密,得到统计数据。
结合第二方面,在第二方面的某些实现方式中,利用多个随机噪声和计算节点秘钥,将数据持有方所持有的隐私数据加密,得到数据持有方的隐私数据密文,包括:以数据持有方所持有的隐私数据为常数项,以多个随机噪声为系数,生成多项式;将多项式中的变量代入计算节点秘钥进行计算,得到数据持有方的隐私数据密文。
结合第二方面,在第二方面的某些实现方式中,在利用多个随机噪声和计算节点秘钥,将数据持有方所持有的隐私数据加密,得到数据持有方的隐私数据密文之前,还包括:确定隐私数据的数据精度;基于数据精度,对隐私数据进行处理,以使处理后的隐私数据为整数。
第三方面,本公开一实施例提供了一种隐私数据的统计方法,应用于计算节点,计算节点分别与数据持有方、统计数据需求方通信连接。该方法包括:确定计算节点秘钥,并将计算节点秘钥公开;获取多个隐私数据密文,隐私数据密文分别由数据持有方基于计算节点秘钥对数据持有方所持有的隐私数据加密得到;对多个隐私数据密文进行目标统计运算,得到计算节点的统计数据密文,并将统计数据密文公开,以便统计数据需求方基于统计数据密文确定统计数据。
结合第三方面,在第三方面的某些实现方式中,确定计算节点秘钥,包括:在有限域中,随机地选取一个数作为计算节点秘钥;其中,p为大于2n(m-1)M的素数,n表示数据持有方的数量,m表示计算节点的数量,M表示多个数据持有方所持有的隐私数据的绝对值的上界。
第四方面,本公开一实施例提供了一种电子设备,该电子设备包括:处理器;存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行第一方面、第二方面和第三方面的方法。
第五方面,本公开一实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时实现第一方面、第二方面和第二方面的方法。
在本公开实施例中,统计数据秘钥仅能用于解密多个统计数据密文,以得到真实、准确的统计数据,而不能解密隐私数据密文,因此规避了解密过程中隐私数据泄露的风险。同时,统计数据需求方无法直接接触到原始的隐私数据,因此能够规避隐私数据在传递、统计运算过程中泄露的风险。
附图说明
通过结合附图对本公开实施例进行更详细地描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1所示为本公开一示例性实施例提供的隐私数据的统计方法的应用场景示意图。
图2所示为本公开一示例性实施例提供的隐私数据的统计方法的流程示意图。
图3所示为本公开一示例性实施例提供的利用多个随机噪声和计算节点秘钥,将数据持有方所持有的隐私数据加密,得到数据持有方的隐私数据密文的流程示意图。
图4所示为本公开另一示例性实施例提供的隐私数据的统计方法的流程示意图。
图5所示为本公开一示例性实施例提供的基于统计数据秘钥,对多个统计数据密文进行解密,得到统计数据步骤的流程示意图。
图6所示为本公开一示例性实施例提供的隐私数据的统计装置的结构示意图。
图7所示为本公开另一示例性实施例提供的隐私数据的统计装置的结构示意图。
图8所示为本公开又一示例性实施例提供的隐私数据的统计装置的结构示意图。
图9所示为本公开一实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
在当今每日接触海量数据的信息化时代,面对瞬息万变的经济社会发展,无论政府部门还是商业公司,都需要借助统计数据揭示事物在特定时间和特定方面的数量特征,通过对事物的定量分析、定性分析,从而做出正确的决策。同时,信息化也为数据安全带来了新的挑战。
在某个应用场景中,某省的统计调查局想调查本省咖啡店的年度平均盈收情况。应调查局的要求,每家咖啡店分别向调查局提供本店的年度盈收数据;调查局接收各咖啡店的年度盈收数据并对其求平均值,得到本省咖啡店的年度平均盈收数据,并基于全面公开原则,将年度平均盈收数据向公众公开。每家咖啡店的年度盈收数据属于自身的商业秘密,具有一定的隐私性,因此无论是在咖啡店向调查局提供数据的过程中,还是在统计运算过程中,都需要尽量规避数据泄露风险,确保各方的数据安全。
如上所述,在一种相关技术中,为保护隐私数据的安全,数据持有方会在原始的隐私数据上加入噪声,对隐私数据进行加密,以避免真实信息遭到泄露。这种方法虽然能够从源头上规避隐私数据泄露的风险,但基于加密数据的统计运算会受到噪声的影响,进而无法获得准确的统计结果。
在另一种相关技术中,会通过同态加密的方式进行数据统计。同态加密可以在不解密的条件下对同态加密数据进行统计运算,并对计算结果进行解密,解密得到的结果与对未加密的原始数据进行相同的统计运算直接得到的结果相同。这种方法能够保证统计结果的准确性;但最终的统计结果需要由私钥持有方进行解密得到,而私钥持有方同样能够对加密数据本身进行解密,获得各方的隐私数据,为隐私数据的安全带来隐患。
面对上述技术问题,本公开提供一种隐私数据的统计方法,应用于统计数据需求方,该方法包括:获取多个统计数据密文,每个统计数据密文由统计数据密文对应的计算节点对多个隐私数据密文进行目标统计运算得到,每个隐私数据密文由隐私数据密文对应的数据持有方基于多个随机噪声和计算节点所公开的计算节点秘钥,将所持有的隐私数据加密得到;获取统计数据秘钥,统计数据秘钥由多个计算节点各自公开的计算节点秘钥确定;基于统计数据秘钥,对多个统计数据密文进行解密,得到统计数据。本公开的方法中,隐私数据由数据持有方基于随机噪声加密,并且统计结果能够基于加密数据计算直接得到,因此能够避免在数据传递、统计运算过程中泄露的风险;并且,基于加密数据计算所得的统计结果与真实的统计结果相同,保证了统计结果的准确性和真实性。
图1所示为本公开一示例性实施例提供的隐私数据的统计方法的应用场景示意图。本公开实施例提出的隐私数据的统计方法可由电子设备执行,该电子设备可以是终端,比如智能手机、平板电脑、台式计算机、智能语音交互设备或者车载终端等等;或者该电子设备还可以是服务器,比如独立的物理服务器、由多个物理服务器构成的区块链或者分布式系统,或者能够进行云计算的云服务器。
基于本公开实施例提出的隐私数据的统计方法,如图1所示,本实施环境包括数据持有方110、计算节点120和统计数据需求方130,数据持有方110和计算节点120之间通信连接,计算节点120和统计数据需求方130之间通信连接。其中,统计数据需求方130的数量可以为一个或多个,数据持有方110和计算节点120的数量为多个,并且计算节点120的数量可以根据实际情况确定,本公开对此不做具体限制。
示例性地,统计数据需求方130可以是有数据统计需求的机构或平台,例如统计调查局、交易平台等。计算节点120可由包含计算资源的多个第三方平台、区块链节点构成。
当本公开的方法应用于上述应用场景时,统计数据需求方130可以是本省的省调查局,并指定该省辖下的各市调查局为计算节点120,数据持有方110可以是本省的咖啡店。每家咖啡店将本店的年度盈收数据通过本公开的方法向各市调查局汇报,则各市调查局通过本公开的方法计算并公布计算结果,省调查局便能根据各市调查局的计算结果得出该省咖啡店的年度平均盈收。这样可以保护年度盈收数据隐私,又能够得到准确的统计结果。
在另一些实施例中,本公开实施例中的隐私数据的统计方法还可应用于交易平台的数据统计。具体地,如需统计各交易平台的用户消费同比和环比增量,数据监管机构和/或交易平台均可作为统计数据需求方130,并且可指定交易平台、数据监管机构等作为共同计算节点120,各交易平台的用户作为数据持有方110,用户可以从用户从端设备中,向各计算节点120通过本公开的方法上报数据,交易平台和监管机构可共同计算并公布计算结果,最终得到用户消费同比和环比增量。这样可以保护用户数据隐私,也可以防止交易平台篡改数据等作弊行为。
图2所示为本公开一示例性实施例提供的隐私数据的统计方法的流程示意图。如图2所示,本公开实施例提供的隐私数据的统计方法涉及统计数据需求方、计算节点和数据持有方,其中,统计数据需求方可以同时作为计算节点。统计数据需求方与计算节点通信连接,计算节点与数据持有方通信连接。值得注意的是,通信连接可以是双方通过信号传输直接地交互;也可以是一方向外部公开某些信息,另一方从外部获取公开信息的过程。
下面结合说明书附图,从统计数据需求方、计算节点和数据持有方三方面举例说明本公开实施例提供的隐私数据的统计方法。
如图2所示,针对计算节点,本公开实施例提供的隐私数据的统计方法包括如下步骤。
S210,确定计算节点秘钥,并将计算节点秘钥公开。
每个计算节点确定一个计算节点秘钥,计算节点秘钥是在某个预设范围内确定的随机数。在计算节点确定计算节点秘钥后,需要将其公开,以便数据持有方基于计算节点秘钥对持有的隐私数据加密,或便于统计数据需求方基于多个计算节点秘钥确定统计数据秘钥。
示例性地,在某个应用场景下共有m个计算节点,计算节点j(j=1,…,m)在预设范围内,随机地选择随机数作为计算节点j的计算节点秘钥;以此,最终得到m个计算节点秘钥/>,每个计算节点秘钥对应于一个计算节点。值得注意的,由于计算节点秘钥是在同一个预设范围内随机确定的,一组计算节点秘钥内可能会出现重复。
此外,计算节点秘钥的取值范围越大,本方法的安全性越高,而计算效率相应降低,因此,为提高统计过程的安全性,可以适当地扩大计算节点秘钥的取值范围,具体实施可以根据实际的应用场景确定。
S220,获取多个隐私数据密文。
隐私数据密文是由数据持有方基于计算节点秘钥对自身持有的隐私数据加密得到的。每个计算节点均能得到全部数据持有方所发送的隐私数据密文。
示例性地,在某个应用场景下共有n个数据持有方和m个计算节点,数据持有方i(i=1,…, n)能够获取m个计算节点所公布的全部计算节点秘钥。当数据持有方i想要将自身持有的隐私数据/>发送给计算节点j时,首先会基于计算节点j对应的计算节点秘钥/>对隐私数据/>加密,得到分别对应于数据持有方i和计算节点j的隐私数据密文/>,并将加密后的隐私数据密文/>发送给计算节点j。
值得注意的,每个数据持有方都会分别针对每个计算节点对隐私数据进行加密。对应于计算节点秘钥的不同,计算节点所得到的、同一数据持有方发送的隐私数据密文也不尽相同。若是计算节点错误地得到了其他计算节点对应的隐私数据密文,可能会影响最终的统计数据的准确性。
S230,对多个隐私数据密文进行目标统计运算,得到计算节点的统计数据密文,并将统计数据密文公开。
目标统计运算可以包括求和、求积等运算。对应于想要得到的统计数据的统计运算方式,每个计算节点均对多个隐私数据密文执行相同的统计运算,运算所得的结果作为对应于该计算节点的统计数据密文。在得到统计数据密文后,需要将其公开,以便统计数据需求方基于多个计算结果公开的统计数据密文,计算得到最终的统计数据。
示例性地,若想得到隐私数据的算术平均值,那么便需要对/>执行求和操作。相应的,计算节点j需要对获取的多个隐私数据密文/>执行求和操作,得到计算节点j的统计数据密文/>。m个计算节点均对自身接收的多个隐私数据密文执行求和操作,得到m个统计数据密文/>
或者,若想得到隐私数据的几何平均值,那么便需要对/>执行求积操作。相应的,计算节点j需要对获取的多个隐私数据密文/>执行求积操作,此时计算节点j的统计数据密文/>。m个计算节点均对自身接收的多个隐私数据密文执行求积操作,得到m个统计数据密文/>
以上简单的介绍了目标统计运算包括的求和、求积运算,在实际应用中,可以通过泰勒公式将一些复杂的函数逼近近似地表示为简单的多项式函数,因此,本公开实施例提供的方法能够适用于多种复杂的统计运算。
在本公开实施例中,计算节点能够向数据持有方提供随机的计算节点秘钥,以便数据持有方基于计算节点秘钥对隐私数据进行加密;并对加密的隐私数据执行目标统计运算。在此过程中,计算节点无法直接接触到原始的隐私数据,因此能够规避隐私数据在传递、统计运算过程中泄露的风险。
下面进一步介绍确定计算节点秘钥的一种具体实现方式。
在一些实施例中,确定计算节点秘钥,包括:在有限域中,随机地选取一个数作为计算节点秘钥。
其中,p是大于2n(m-1)M的素数,n表示数据持有方的数量,m表示计算节点的数量,M表示多个数据持有方所持有的隐私数据的绝对值的上界。p是有限域的的特征。
计算节点秘钥的选取会影响本公开实施例提供的方法的准确性和计算效率。基于有限域实施的隐私数据的统计方法能够同时保证准确性和计算效率。
以上详细介绍了针对计算节点的隐私数据的统计方法。上述实施例提供的方法中,计算节点无法直接接触到原始的隐私数据,此外,计算节点也无法基于自身持有的计算节点秘钥将隐私数据密文还原为原始的隐私数据,这一优势得益于数据持有方对隐私数据的加密方法,下面对此做进一步介绍。
继续参考图2,针对数据持有方,本公开实施例提供的隐私数据的统计方法包括如下步骤。
S240,确定多个随机噪声。
多个随机噪声是数据持有方在预设范围内随机确定的,随机噪声的数量由计算节点的数量确定。若计算节点的数量为m,则随机噪声的数量t=m-1。
示例性地,数据持有方i在有限域上随机地选择t个随机数/>作为数据持有方i的随机噪声。
S250,获取计算节点秘钥。
计算节点秘钥由计算节点确定并公开,因此,数据持有方均能自由地获取全部计算节点对应的计算节点秘钥。
S260,利用多个随机噪声和计算节点秘钥,将数据持有方所持有的隐私数据加密,得到数据持有方的隐私数据密文。
在数据持有方确定随机噪声,并得到每个计算节点对应的计算节点秘钥之后,便能基于二者确定出分别对应于每个计算节点的隐私数据密文。
具体地,当数据持有方i想要将自身持有的隐私数据发送给计算节点j时,会获取计算节点j对应的计算节点秘钥/>,并基于多个随机噪声/>和计算节点秘钥/>共同对隐私数据/>加密,得到隐私数据密文/>
因此,即使数据持有方基于同一组随机噪声进行加密,对应于不同计算节点的隐私数据密文也不尽相同。
S270,将隐私数据密文发送给计算节点。
在得到隐私数据密文后,需要将其发送给对应的计算节点,以便计算节点基于多个数据持有方发送的隐私数据密文进行目标统计运算,得到计算节点的统计数据密文,数据统计需求方对多个计算节点的统计数据密文进行解密,得到统计数据。
示例性地,在数据持有方i基于多个随机噪声和计算节点秘钥/>对隐私数据加密,得到隐私数据密文/>之后,将加密后的隐私数据密文/>发送给对应的计算节点j。
在本公开实施例中,数据持有方同时基于随机确定的多个随机噪声和计算节点秘钥加密隐私数据,因此,加密所得的隐私数据密文无法由计算节点所持有的计算节点秘钥解密,规避了统计运算过程中隐私数据泄露的风险。同时,用于加密的多个随机噪声由相应的数据持有方私密地确定并持有,并不向计算节点等外部公开,因此对于非数据持有方而言,基于随机噪声加密得到的隐私数据密文是无法被解密的,这进一步提高了隐私数据安全性。
下面结合图3进一步介绍加密隐私数据的一种具体实现方式。
图3所示为本公开一示例性实施例提供的利用多个随机噪声和计算节点秘钥,将数据持有方所持有的隐私数据加密,得到数据持有方的隐私数据密文的流程示意图。如图3所示,本公开实施例提供的利用多个随机噪声和计算节点秘钥,将数据持有方所持有的隐私数据加密,得到数据持有方的隐私数据密文步骤,包括如下步骤。
S261,以数据持有方所持有的隐私数据为常数项,以多个随机噪声为系数,生成多项式。
具体地,数据持有方i(i=1,…, n)所生成的多项式可以表示为。其中,X为多项式的变量,/>分别表示多个随机噪声,/>表示数据持有方i所持有的隐私数据。
S262,将多项式中的变量代入计算节点秘钥进行计算,得到数据持有方的隐私数据密文。
具体地,当数据持有方i想要将自身持有的隐私数据发送给计算节点j时,会获取计算节点j对应的计算节点秘钥/>。接着,将计算节点秘钥/>代入上述多项式/>,得到对应于计算节点j的数据持有方i的隐私数据密文/>,以完成对隐私数据的加密。
或者,当数据持有方i想要将自身持有的隐私数据发送给计算节点m时,会获取计算节点m对应的计算节点秘钥/>。接着,将计算节点秘钥/>代入上述多项式/>,得到对应于计算节点m的数据持有方i的隐私数据密文/>,以完成对隐私数据的加密。
可以观察到,在本公开实施例中,同一数据持有方可以基于同一组随机噪声对隐私数据的进行加密。每个数据持有方分别对应一组不同的、随机确定的随机噪声,因此多个数据持有方之间也无法解密对方的隐私数据密文,进一步提高了隐私数据安全性。
在本公开实施例中,为了得到合适的、用于确定p值和多个随机噪声的预设范围,可以由数据持有方对隐私数据进行预处理。下面结合图4进一步介绍对隐私数据进行预处理的一种具体实现方式。
如图4所示,在本公开实施例提供的利用多个随机噪声和计算节点秘钥,将数据持有方所持有的隐私数据加密,得到数据持有方的隐私数据密文步骤之前,包括如下步骤。
S410,确定隐私数据的数据精度。
数据精度可以根据实际应用场景具体确定。示例性地,对于货币数据而言,数据精度通常为0.01。
S420,基于数据精度,对隐私数据进行处理,以使处理后的隐私数据为整数。
具体地,首先基于精度统一地将隐私数据放大相应的倍数W。例如,货币数据的数据精度为0.01,则W=1/0.01=100;接着,需要对统一地将隐私数据乘以W,使得隐私数据变为整数形式。
以上预处理过程,能够统一数据的精度,确定合适的预设范围,使得全部的隐私数据均能表示在预设范围(如,有限域)中。并且,能够基于预设范围进一步得到确定合适的p值和多个随机噪声。
值得注意的是,若是数据持有方在对隐私数据加密之前执行了上述预处理的步骤,那么用于加密的隐私数据与真实的隐私数据间相差W倍。基于预处理后的隐私数据得到的统计数据需要执行相应的后处理操作,以消除预处理带来的误差。
具体地,在预处理时,数据持有方统一地将隐私数据放大W倍。那么数据需求方在基于本公开实施例提供的方法得到统计数据后,需要相应地对统计数据进行缩小。若目标统计运算中进行的是求和操作,则需要将统计数据缩小W倍,即;若目标统计运算中进行的是求积操作,则需要将统计数据缩小/>倍,即/>。可以理解的是,上述的后处理操作仅是示例性地,除上述列举的求和、求积操作之外,其他的目标统计运算的后处理可以根据实际的运算规则确定。
以上详细介绍了针对数据持有方、计算节点的隐私数据的统计方法。但若想得到真实的统计数据,还需要对计算节点的计算结果进行进一步的计算,下面对此做进一步介绍。
继续参考图2,针对统计数据需求方,本公开实施例提供的隐私数据的统计方法包括如下步骤。
S280,获取多个统计数据密文。
每个统计数据密文分别由对应的计算节点所公开。具体地,每个计算节点获取由多个数据持有方分别发送的、与计算节点对应的多个隐私数据密文,并对多个隐私数据密文进行目标统计运算,得到每个计算节点各自的统计数据密文,并将统计数据密文公开。
S290,获取统计数据秘钥。
统计数据秘钥由多个计算节点各自公开的计算节点秘钥确定。具体地,每个计算节点秘钥分别由对应的计算节点确定并公开。
在获取全部计算节点公开的多个计算节点秘钥之后,便能基于多个计算节点秘钥确定统计数据秘钥。
S2100,基于统计数据秘钥,对多个统计数据密文进行解密,得到统计数据。
如上所述,在获取多个统计数据密文,以及用于解密多个统计数据密文的统计数据秘钥后,便能基于统计数据秘钥解密统计数据密文,得到真实的统计数据。
由于上述的统计数据密文和用于计算统计数据秘钥的计算节点秘钥均是公开的信息,因此任意的关心统计数据的计算节点、数据持有方、第三方机构或个人均能通过实施本公开实施例的方法得到统计数据。
在本公开实施例中,统计数据需求方能够基于公开的信息得到真实、准确的统计数据。在此过程中,统计数据秘钥仅能用于解密多个统计数据密文,以得到统计数据,而不能解密隐私数据密文,因此规避了解密过程中隐私数据泄露的风险。
下面介绍获取统计数据秘钥的一种具体实现方式。
在一些实施例中,若想要得到统计数据秘钥,首先,需要收集每个计算节点公开的计算节点密钥;接着,基于计算节点密钥,计算得到满足预设条件的统计数据秘钥。
假设在某个应用场景下共有m个计算节点,那么共有m个计算节点秘钥,每个计算节点秘钥对应于一个计算节点。基于m个计算节点秘钥/>所确定的统计数据秘钥/>需要满足以下条件:
对任意的阶多项式/>,/>均成立。
其中,统计数据秘钥是包括j个元素的向量,/>分别表示统计数据秘钥中的第j个分量,m表示计算节点的数量,/>表示第j个计算节点所公开的计算节点秘钥。
具体地,为计算上述的统计数据秘钥,仅需解如下线性方程组即可:
基于本公开实施例的方法确定的统计数据秘钥具有将由多项式确定的一组数还原为多项式的常数项的能力。因此,能够作为统计数据秘钥,能够解密由本公开实施例的方法加密并执行统计运算得到的统计数据密文,进而得到最终的统计数据。
下面结合图5进一步介绍对多个统计数据密文进行解密,得到统计数据的一种具体实现方式。
如图5所示,本公开一示例性实施例提供的基于统计数据秘钥,对多个统计数据密文进行解密,得到统计数据步骤,包括如下步骤。
S2101,分别将统计数据秘钥的多个分量与对应的统计数据密文相乘。
具体地,统计数据秘钥包括m个分量/>,每个分量分别对应于一个计算节点公开的统计数据密文,该对应关系可以是任意的,仅需将分量与计算节点一一对应即可。
接着,基于分量与计算节点的一一对应关系,将二者相乘。
S2102,基于所得的乘积,确定统计数据。
接着,能够通过上述的乘积,得到最终的统计数据。
具体地,可以通过将上述的乘积相加,得到统计数据。其中,/>为计算节点j对应的统计数据密文。
通过以上步骤,便能基于统计数据秘钥对解密多个统计数据密文进行解密,得到统计数据。并且解密过程均是基于公开数据计算的,任意的关系统计结果的组织或个人均能通过本公开实施例的方法得到准确的统计数据,这样既可以保护用户数据隐私,又可以预防篡改数据等作弊行为,以保证统计数据的正确性和公开性。
上文结合图2至图5,详细描述了本公开的隐私数据的统计方法实施例,下面结合图6至图8,详细描述本公开的隐私数据的统计装置实施例。应理解,隐私数据的统计方法实施例的描述与隐私数据的统计装置实施例的描述相互对应,因此,未详细描述的部分可以参见前面方法实施例。
图6所示为本公开一示例性实施例提供的隐私数据的统计装置的结构示意图。示例性地,该隐私数据的统计装置应用于统计数据需求方。如图6所示,本公开实施例提供的隐私数据的统计装置600包括:
第一获取模块610,用于获取多个统计数据密文,每个统计数据密文由统计数据密文对应的计算节点对多个隐私数据密文进行目标统计运算得到,每个隐私数据密文由隐私数据密文对应的数据持有方基于多个随机噪声和计算节点所公开的计算节点秘钥,将所持有的隐私数据加密得到;
第二获取模块620,用于获取统计数据秘钥,统计数据秘钥由多个计算节点各自公开的计算节点秘钥确定;
解密模块630,用于基于统计数据秘钥,对多个统计数据密文进行解密,得到统计数据。
在本公开一实施例中,统计数据秘钥满足以下条件:对任意的/>阶多项式,/>均成立,其中,/>表示统计数据秘钥中的第j个分量,m表示计算节点的数量,/>表示第j个计算节点所公开的计算节点秘钥。
在本公开一实施例中,统计数据秘钥包括多个分量,每个分量分别对应于一个计算节点公开的统计数据密文,解密模块630还用于,分别将统计数据秘钥的多个分量与对应的统计数据密文相乘;基于所得的乘积,确定统计数据。
图7所示为本公开另一示例性实施例提供的隐私数据的统计装置的结构示意图。示例性地,该隐私数据的统计装置应用于数据持有方。如图7所示,本公开实施例提供的隐私数据的统计装置700包括:
确定模块710,用于确定多个随机噪声,随机噪声的数量由计算节点的数量确定;
获取模块720,用于获取计算节点秘钥,计算节点秘钥由计算节点确定并公开;
加密模块730,用于利用多个随机噪声和计算节点秘钥,将数据持有方所持有的隐私数据加密,得到数据持有方的隐私数据密文;
发送模块740,用于将隐私数据密文发送给计算节点,以便计算节点基于隐私数据密文进行目标统计运算,得到计算节点的统计数据密文。
在本公开一实施例中,加密模块730还用于,以数据持有方所持有的隐私数据为常数项,以多个随机噪声为系数,生成多项式;将多项式中的变量代入计算节点秘钥进行计算,得到数据持有方的隐私数据密文。
在本公开一实施例中,隐私数据的统计装置700还包括预处理模块,用于确定隐私数据的数据精度;基于数据精度,对隐私数据进行处理,以使处理后的隐私数据为整数。
图8所示为本公开又一示例性实施例提供的隐私数据的统计装置的结构示意图。示例性地,该隐私数据的统计装置应用于计算节点。如图8所示,本公开实施例提供的隐私数据的统计装置800包括:
确定模块810,用于确定计算节点秘钥,并将计算节点秘钥公开;
获取模块820,用于获取多个隐私数据密文,隐私数据密文分别由数据持有方基于计算节点秘钥对数据持有方所持有的隐私数据加密得到;
统计运算模块830,用于对多个隐私数据密文进行目标统计运算,得到计算节点的统计数据密文,并将统计数据密文公开,以便统计数据需求方基于统计数据密文确定统计数据。
在本公开一实施例中,确定模块810还用于,在有限域中,随机地选取一个数作为计算节点秘钥;其中,p为大于2n(m-1)M的素数,n表示数据持有方的数量,m表示计算节点的数量,M表示多个数据持有方所持有的隐私数据的绝对值的上界。
下面,参考图9来描述根据本公开实施例的电子设备。图9所示为本公开一示例性实施例提供的电子设备的结构示意图。
如图9所示,电子设备900包括一个或多个处理器901和存储器902。
处理器901可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备90中的其他组件以执行期望的功能。
存储器902可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器901可以运行所述程序指令,以实现上文所述的本公开的各个实施例的隐私数据的统计方法以及/或者其他期望的功能。
在一些实施例中,电子设备900还可以包括:输入装置903和输出装置904,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置903可以包括例如键盘、鼠标等等。
该输出装置904可以向外部输出各种信息,包括P个参与方各自的指标密文、目标评价规则、每个参与方提供的多个指标、Q个参与方的排列结果等。该输出装置904可以包括例如显示器、扬声器、打印机,以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图9中仅示出了该电子设备900中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备900还可以包括任何其他适当的组件。
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述描述的根据本公开各种实施例的隐私数据的统计方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行,或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述描述的根据本公开各种实施例的隐私数据的统计方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (9)

1.一种隐私数据的统计方法,其特征在于,应用于统计数据需求方,所述统计数据需求方与多个计算节点通信连接,所述计算节点与多个数据持有方通信连接;
其中,所述方法包括:
获取多个统计数据密文,每个所述统计数据密文由所述统计数据密文对应的计算节点对多个隐私数据密文进行目标统计运算得到,每个所述隐私数据密文由所述隐私数据密文对应的数据持有方基于多个随机噪声和所述计算节点所公开的计算节点秘钥,将所持有的隐私数据加密得到;
获取统计数据秘钥,所述统计数据秘钥由所述多个计算节点各自公开的计算节点秘钥确定;
基于所述统计数据秘钥,对所述多个统计数据密文进行解密,得到统计数据;
其中,所述统计数据秘钥满足以下条件:对任意的/>阶多项式,/>均成立,
其中,所述统计数据秘钥是包括m个元素的向量,/>表示所述统计数据秘钥中的第j个分量,m表示计算节点的数量,/>表示第j个计算节点所公开的计算节点秘钥,均为任意常数,所述统计数据秘钥具有将由多项式确定的一组数还原为多项式的常数项的能力;
为计算所述统计数据秘钥,仅需解如下线性方程组:
2.根据权利要求1所述的隐私数据的统计方法,其特征在于,所述统计数据秘钥包括多个分量,每个所述分量分别对应于一个计算节点公开的统计数据密文,所述基于所述统计数据秘钥,对所述多个统计数据密文进行解密,得到统计数据,包括:
分别将所述统计数据秘钥的多个分量与对应的统计数据密文相乘;
基于所得的乘积,确定所述统计数据。
3.一种隐私数据的统计方法,其特征在于,应用于数据持有方,所述数据持有方与多个计算节点通信连接,所述计算节点与统计数据需求方通信连接;
其中,所述方法包括:
确定多个随机噪声,所述随机噪声的数量由所述计算节点的数量确定;
获取计算节点秘钥,所述计算节点秘钥由所述计算节点确定并公开;
利用所述多个随机噪声和所述计算节点秘钥,将所述数据持有方所持有的隐私数据加密,得到所述数据持有方的隐私数据密文;
将所述隐私数据密文发送给所述计算节点,以便所述计算节点基于所述隐私数据密文进行目标统计运算,得到所述计算节点的统计数据密文,并且所述数据统计需求方基于统计数据秘钥对所述统计数据密文进行解密,得到统计数据;
其中,所述统计数据秘钥满足以下条件:对任意的/>阶多项式,/>均成立,
其中,所述统计数据秘钥是包括m个元素的向量,/>表示所述统计数据秘钥中的第j个分量,m表示计算节点的数量,/>表示第j个计算节点所公开的计算节点秘钥,均为任意常数,所述统计数据秘钥具有将由多项式确定的一组数还原为多项式的常数项的能力;
为计算所述统计数据秘钥,仅需解如下线性方程组:
4.根据权利要求3所述的隐私数据的统计方法,其特征在于,所述利用所述多个随机噪声和所述计算节点秘钥,将所述数据持有方所持有的隐私数据加密,得到所述数据持有方的隐私数据密文,包括:
以所述数据持有方所持有的隐私数据为常数项,以所述多个随机噪声为系数,生成多项式;
将所述多项式中的变量代入所述计算节点秘钥进行计算,得到所述数据持有方的隐私数据密文。
5.根据权利要求3所述的隐私数据的统计方法,其特征在于,在所述利用所述多个随机噪声和所述计算节点秘钥,将所述数据持有方所持有的隐私数据加密,得到所述数据持有方的隐私数据密文之前,还包括:
确定所述隐私数据的数据精度;
基于所述数据精度,对所述隐私数据进行处理,以使处理后的隐私数据为整数。
6.一种隐私数据的统计方法,其特征在于,应用于计算节点,所述计算节点分别与数据持有方、统计数据需求方通信连接;
其中,所述方法包括:
确定计算节点秘钥,并将所述计算节点秘钥公开;
获取多个隐私数据密文,所述隐私数据密文分别由数据持有方基于所述计算节点秘钥对所述数据持有方所持有的隐私数据加密得到;
对所述多个隐私数据密文进行目标统计运算,得到所述计算节点的统计数据密文,并将所述统计数据密文公开,以便所述统计数据需求方基于所述统计数据密文和统计数据秘钥确定统计数据;
其中,所述统计数据秘钥满足以下条件:对任意的/>阶多项式,/>均成立,
其中,所述统计数据秘钥是包括m个元素的向量,/>表示所述统计数据秘钥中的第j个分量,m表示计算节点的数量,/>表示第j个计算节点所公开的计算节点秘钥,均为任意常数,所述统计数据秘钥具有将由多项式确定的一组数还原为多项式的常数项的能力;
为计算所述统计数据秘钥,仅需解如下线性方程组:
7.根据权利要求6所述的隐私数据的统计方法,其特征在于,所述确定计算节点秘钥,包括:
在有限域中,随机地选取一个数作为所述计算节点秘钥;
其中,p为大于2n(m-1)M的素数,n表示所述数据持有方的数量,m表示所述计算节点的数量,M表示所述多个数据持有方所持有的隐私数据的绝对值的上界。
8.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7任一项所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。
CN202311492477.1A 2023-11-10 2023-11-10 隐私数据的统计方法、电子设备及存储介质 Active CN117235801B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311492477.1A CN117235801B (zh) 2023-11-10 2023-11-10 隐私数据的统计方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311492477.1A CN117235801B (zh) 2023-11-10 2023-11-10 隐私数据的统计方法、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN117235801A CN117235801A (zh) 2023-12-15
CN117235801B true CN117235801B (zh) 2024-02-09

Family

ID=89098498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311492477.1A Active CN117235801B (zh) 2023-11-10 2023-11-10 隐私数据的统计方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117235801B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989368A (zh) * 2021-02-07 2021-06-18 支付宝(杭州)信息技术有限公司 多方联合进行隐私数据处理的方法及装置
CN113676317A (zh) * 2021-07-06 2021-11-19 熵链科技(福建)有限公司 保护参与方隐私且可获取参与方统计数据的方法及系统
CN114710258A (zh) * 2022-03-01 2022-07-05 北京航空航天大学 电力数据的隐私计算方法、系统、电子设备及存储介质
CN116049626A (zh) * 2022-12-30 2023-05-02 人保信息科技有限公司 一种数据统计方法、装置、设备以及存储介质
CN116192386A (zh) * 2023-03-03 2023-05-30 遥相科技发展(北京)有限公司 基于区块链隐私计算的多平台互通方法及装置
CN116975125A (zh) * 2023-08-03 2023-10-31 中国工商银行股份有限公司 数据统计方法、装置、系统、存储介质和程序产品

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241016B (zh) * 2018-08-14 2020-07-07 阿里巴巴集团控股有限公司 多方安全计算方法及装置、电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989368A (zh) * 2021-02-07 2021-06-18 支付宝(杭州)信息技术有限公司 多方联合进行隐私数据处理的方法及装置
CN113676317A (zh) * 2021-07-06 2021-11-19 熵链科技(福建)有限公司 保护参与方隐私且可获取参与方统计数据的方法及系统
CN114710258A (zh) * 2022-03-01 2022-07-05 北京航空航天大学 电力数据的隐私计算方法、系统、电子设备及存储介质
CN116049626A (zh) * 2022-12-30 2023-05-02 人保信息科技有限公司 一种数据统计方法、装置、设备以及存储介质
CN116192386A (zh) * 2023-03-03 2023-05-30 遥相科技发展(北京)有限公司 基于区块链隐私计算的多平台互通方法及装置
CN116975125A (zh) * 2023-08-03 2023-10-31 中国工商银行股份有限公司 数据统计方法、装置、系统、存储介质和程序产品

Also Published As

Publication number Publication date
CN117235801A (zh) 2023-12-15

Similar Documents

Publication Publication Date Title
Archer et al. From keys to databases—real-world applications of secure multi-party computation
Yu et al. Platform-independent secure blockchain-based voting system
EP1940074B1 (en) Secure computation of private values
KR20160041028A (ko) 프라이버시 보호 행렬 분해를 위한 방법 및 시스템
WO2012067214A1 (ja) 情報処理装置、情報処理方法、及び、プログラム
KR20160009012A (ko) 행렬 분해 및 리지 회귀에 기초한 프라이버시-보호 추천을 위한 방법 및 시스템
CN109446828B (zh) 一种安全多方计算方法及装置
US8533487B2 (en) Secure logical vector clocks
Lu et al. A control-theoretic perspective on cyber-physical privacy: Where data privacy meets dynamic systems
CN111967038A (zh) 数据处理系统、方法、设备、编辑器及存储介质
KR20170108826A (ko) 성형 네트워크에서 암호화된 데이터의 장애-허용 집계
Oppermann et al. Secure cloud computing: Reference architecture for measuring instrument under legal control
Cartlidge et al. Multi‐party computation mechanism for anonymous equity block trading: A secure implementation of turquoise plato uncross
Li Combination of blockchain and AI for music intellectual property protection
CN110874481B (zh) 一种基于gbdt模型的预测方法和装置
CN112800479B (zh) 利用可信第三方的多方联合数据处理方法及装置
Yang et al. A lightweight delegated private set intersection cardinality protocol
CN117235801B (zh) 隐私数据的统计方法、电子设备及存储介质
CN115982779B (zh) 一种数据匿名化方法、装置、电子设备及存储介质
CN114514550A (zh) 将请求分区成区块链的交易
WO2013153628A1 (ja) 演算処理システムおよび演算結果認証方法
US12008136B2 (en) Systems and methods for privacy-preserving inventory matching with security against malicious adversaries
GB2575896A (en) Methods and systems for validating data in a distributed computing network
CN115361229A (zh) 一种政府公共数据的安全分享方法以及系统
KR102281265B1 (ko) 시간 제약을 지원하는 교집합 연산을 위한 함수 암호 기술

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant