CN113392138B - 一种隐私数据的统计分析方法、装置、服务器和存储介质 - Google Patents

一种隐私数据的统计分析方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN113392138B
CN113392138B CN202110516213.XA CN202110516213A CN113392138B CN 113392138 B CN113392138 B CN 113392138B CN 202110516213 A CN202110516213 A CN 202110516213A CN 113392138 B CN113392138 B CN 113392138B
Authority
CN
China
Prior art keywords
data set
median
data
privacy
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110516213.XA
Other languages
English (en)
Other versions
CN113392138A (zh
Inventor
李伟
邱炜伟
匡立中
汪小益
刘毅恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Qulian Technology Co Ltd
Original Assignee
Hangzhou Qulian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Qulian Technology Co Ltd filed Critical Hangzhou Qulian Technology Co Ltd
Priority to CN202110516213.XA priority Critical patent/CN113392138B/zh
Publication of CN113392138A publication Critical patent/CN113392138A/zh
Application granted granted Critical
Publication of CN113392138B publication Critical patent/CN113392138B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及数据处理技术领域,尤其涉及一种隐私数据的统计分析方法、装置、服务器和存储介质。该统计分析方法包括:获取第一隐私数据集,并发送数据请求至第二设备,数据请求用于指示第二设备生成第二隐私数据集;将第一隐私数据集的大小发送至第二设备,并接收第二设备反馈的第二隐私数据集的大小;根据第一隐私数据集的大小、第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,目标数据集为第一隐私数据集与第二隐私数据集合并后得到的数据集;根据目标中位数,进行统计分析。采用该统计分析方法,既保护了用户隐私数据不被公开,又可实现用户利用确定的中位数进行有效的统计分析,提高了数据的流通价值。

Description

一种隐私数据的统计分析方法、装置、服务器和存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种隐私数据的统计分析方法、装置、服务器和存储介质。
背景技术
随着大数据时代的到来,数据的重要性日渐凸显,数据开放共享可以满足不同领域对各类数据进行挖掘、统计分析的需求。数据不同于其他生产要素,其拥有隐私性这种特殊特性,数据的需求量虽然很大,但真正可以开放共享利用的数据却很少。在数据开放共享的过程中,如果数据拥有者直接将真实数据共享发布出来,必将造成用户隐私的泄露。例如,某机构需要根据医院里用户的体检数据统计分析某年龄阶段的健康请求,如果医院将用户的真实体检数据直接分享发布给机构,会泄露用户隐私。
在实际生活中,中位数的应用场景非常广阔,可用于统计分析。某机构通过获取医院体检指标中的身体质量指数(BMI)的中位数来统计某年龄阶段的健康情况,医院无需将用户的BMI指数全部分享给机构。然而,如何在保护用户隐私数据的基础上,有效确定中位数,以便中位数请求方根据确定的中位数进行有效的统计分析,是当前需要考虑的问题。
发明内容
有鉴于此,本申请实施例提供了一种隐私数据的统计分析方法、装置、服务器和存储介质,可在保护用户隐私数据的基础上,有效确定中位数,以便中位数请求方根据确定的中位数进行有效的统计分析。
本申请实施例的第一方面提供了一种隐私数据的统计分析方法,包括:
获取第一隐私数据集,并发送数据请求至第二设备,所述数据请求用于指示所述第二设备生成第二隐私数据集;
将所述第一隐私数据集的大小发送至所述第二设备,并接收所述第二设备反馈的所述第二隐私数据集的大小;
根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,所述目标数据集为所述第一隐私数据集与所述第二隐私数据集合并后得到的数据集;
根据所述目标中位数,进行统计分析。
在第一方面的一种可能的实现方式中,所述根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,可以包括:
根据所述第一隐私数据集的大小与所述第二隐私数据集的大小,确定第一数据集;
根据预设隐私比较算法,比较所述第一数据集的第一中位数与第二数据集的第二中位数,其中,所述第二数据集具体为:所述第二设备根据所述第一隐私数据集的大小与所述第二隐私数据集的大小确定;
若所述第一中位数与所述第二中位数相等,则将所述第一中位数确定为所述目标数据集的目标中位数。
在第一方面的一种可能的实现方式中,所述根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,还包括:
若所述第一中位数与所述第二中位数不相等,则执行第一数据删除指令,所述第一数据删除指令用于指示所述第一设备删除所述第一数据集中第一指定位置的数据,得到第一更新数据集;
将所述第一中位数与所述第二中位数的比较结果发送至所述第二设备,以使得所述第二设备执行第二数据删除指令,所述第二数据删除指令用于指示所述第二设备删除所述第二数据集中第二指定位置的数据,得到第二更新数据集,其中,所述第二数据集中删除的数据数量与所述第一数据集中删除的数据数量相等;
根据预设隐私比较算法,比较所述第一更新数据集中的第一更新中位数与所述第二更新数据集中的第二更新中位数;
若所述第一更新中位数与所述第二更新中位数相等,则将所述第一更新中位数确定为目标中位数。
在第一方面的一种可能的实现方式中,在所述执行第一数据删除指令之前,还包括:
获取所述第一数据集中数据的数量,以及所述第二数据集中数据的数量;
若所述第一数据集中数据的数量与所述第二数据集中数据的数量均大于预设数量阈值,则执行所述执行第一数据删除指令。
在第一方面的一种可能的实现方式中,所述根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,还包括:
若所述第一中位数与所述第二中位数不相等,则获取所述第一数据集中数据的数量,以及所述第二数据集中数据的数量;
若所述第一数据集中数据的数量达到预设数量阈值,或者,所述第二数据集中数据的数量达到所述预设数量阈值,则将所第一数据集中的数据与所述第二数据集中的数据进行比较排序;
根据所述比较排序的结果,确定所述目标数据集的目标中位数。
在第一方面的一种可能的实现方式中,在所述第二设备生成所述第二隐私数据集之前,包括:
接收所述第二设备基于所述数据请求发送的身份验证请求;
基于所述身份验证请求,发送身份信息至所述第二设备,以使得所述第二设备根据所述身份信息对所述第一设备进行身份验证,若所述第一设备的身份验证通过,则基于所述数据请求,生成第二隐私数据集。
本申请实施例中,第一设备通过获取第一隐私数据集,并发送数据请求至第二设备,然后将所述第一隐私数据集的大小发送至所述第二设备,并接收所述第二设备反馈的所述第二隐私数据集的大小,第一设备和第二设备双方仅告知对方自己隐私数据集的大小,无需暴露自己隐私数据的实际数据值,可有效保护用户隐私,第一设备再根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,有效确定目标数据集的目标中位数,最后根据所述目标中位数,进行统计分析,既保护了用户隐私数据不被公开,又可实现用户利用确定的中位数进行有效的统计分析,提高了数据的流通价值。
本申请实施例的第二方面提供了一种隐私数据的统计分析装置,应用于第一设备,所述统计分析装置包括:
隐私数据集生成单元,用于获取第一隐私数据集,并发送数据请求至第二设备,所述数据请求用于指示所述第二设备生成第二隐私数据集;
数据集大小获取单元,用于将所述第一隐私数据集的大小发送至所述第二设备,并接收所述第二设备反馈的所述第二隐私数据集的大小;
中位数确定单元,用于根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,所述目标数据集为所述第一隐私数据集与所述第二隐私数据集合并后得到的数据集;
统计分析单元,用于根据所述目标中位数,进行统计分析。
本申请实施例的第三方面提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例的第一方面提供的隐私数据的统计分析方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如本申请实施例的第一方面提供的隐私数据的统计分析方法的步骤。
本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行本申请实施例的第一方面所述的隐私数据的统计分析方法的步骤。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的隐私数据的统计分析方法的实现流程图;
图2是本申请实施例提供的一种隐私数据的统计分析方法中确定目标数据集的目标中位数的具体实现流程图;
图3是本申请实施例提供的一种隐私数据的统计分析方法中第一中位数与第二中位数不相等时,确定目标数据集的目标中位数的一种具体实现流程图;
图4是本申请实施例提供的一种隐私数据的统计分析方法中确定是否执行第一数据删除指令的一种具体实现流程图;
图5是本申请实施例提供的一种隐私数据的统计分析方法中第一中位数与第二中位数不相等时,确定目标数据集的目标中位数的另一种具体实现流程图;
图6是本申请实施例提供的另一种隐私数据的统计分析方法的一个实施例的流程图;
图7是本申请实施例提供的一种隐私数据的统计分析装置的一个实施例的结构图;
图8是本申请实施例提供的一种服务器的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
目前,研究分析人员在进行挖掘、统计分析时,需要的数据量较大,数据开发共享可以满足不同领域对各类数据进行挖掘、统计分析的需求。然而,在数据开放共享的过程中,如果数据拥有者直接将真实数据共享发布出来,必将造成用户隐私的泄露。利用中位数进行统计分析,无需获取实际数值,只需计算中位数,然而,目前中位数的计算依然会造成用户隐私的泄露,如何在保护用户隐私数据的基础上,有效确定中位数,以便中位数请求方根据确定的中位数进行有效的统计分析,是当前需要考虑的问题。
针对上述问题,本申请实施例提供了一种隐私数据的统计分析方法、装置、服务器和存储介质,数据请求方(第一设备)和数据提供方(第二设备)之间直接交互,双方仅告知对方自己隐私数据集的大小,无需暴露自己隐私数据的实际数据值,可有效保护用户隐私,根据双方数据集的大小以及预设隐私比较算法,有效确定目标中位数,最后数据请求方可根据述目标中位数,进行统计分析,在保护用户隐私数据不公开的基础上,进行准确有效的统计分析,提高数据的流通价值。
应当理解,本申请各个方法实施例提供了一种隐私数据的统计分析方法适用于需要执行统计分析的各种类型的终端设备或者服务器,具体可以包括手机、平板电脑、可穿戴设备、笔记本电脑、和台式电脑等智能设备。
下面结合具体实施例对本申请提供的隐私数据的统计分析方法进行示例性的说明。
图1示出了本申请实施例提供的隐私数据的统计分析方法的实现流程,本实施例中包括第一设备、第二设备,第一设备和第二设备通信连接。需要说明的是,本申请不对与第一设备连接的第二设备的种类和数量进行任何限定。本申请实施例的执行端为第一设备,所述第一设备可以为客户端、服务器等终端设备。该方法流程可以包括如下步骤S101至S104。
S101、获取第一隐私数据集,并发送数据请求至第二设备,所述数据请求用于指示所述第二设备生成第二隐私数据集。
上述第一隐私数据集包括上述第一设备的本地隐私数据,上述第二隐私数据集包括上述第二设备中与上述数据请求对应的隐私数据。上述第一隐私数据集和上述第二隐私数据集均为有序数据集,即,上述第一隐私数据集和上述第二隐私数据集中的数据均按大小有序排列。
本申请实施例中,第一设备与第二设备可直接通信连接,无需通过中间服务器。
在一些可能实施方式中,上述获取第一隐私数据集具体包括:第一设备检测统计分析需求指令,基于该统计分析需求指令,在本地数据库中查找与所述统计分析需求对应的隐私数据,根据查找到的隐私数据,生成上述第一隐私数据集。上述第二设备在检测到上述第一设备发送的数据请求时,在第二设备的数据库中查找与该数据请求对应的隐私数据,生成第二隐私数据集。
在一些可能的实施方式中,上述数据请求携带数据类型,以便第二设备查找对应的隐私数据。
S102、将所述第一隐私数据集的大小发送至所述第二设备,并接收所述第二设备反馈的所述第二隐私数据集的大小。
本申请实施例中,为保护用户数据的隐私,第一设备和第二设备无需告知对方隐私数据集中数据的真实数值,而是仅将数据集的大小告知对方,即第一设备告知第二设备上述第一隐私数据集的大小,第二设备告知第一设备上述第二隐私数据集的大小。
在一些实施方式中,上述第一设备将第一隐私数据集的大小发送至上述第二设备,并向上述第二设备请求第二隐私数据集的大小,上述第二设备根据该请求,向第一设备反馈上述第二隐私数据集的大小。
在一些实施方式中,上述第一设备将第一隐私数据集的大小发送至上述第二设备,上述第二设备接收到上述第一隐私数据集的大小后,直接向第一设备反馈上述第二隐私数据集的大小,无需等待第一设备的请求,可提高响应速度。
S103、根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,所述目标数据集为所述第一隐私数据集与所述第二隐私数据集合并后得到的数据集。
本申请实施例中,第一设备根据第一隐私数据集的大小、第二隐私数据集的大小,结合预设隐私比较算法,确定上述第一隐私数据集和第二隐私数据集合并后得到的目标数据集的目标中位数。
作为本申请一种可能的实施方式,图2示出了本申请实施例提供的统计分析方法中,所述根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数的一种具体实现流程,详述如下:
A1:根据所述第一隐私数据集的大小与所述第二隐私数据集的大小,确定第一数据集。
第一设备比较上述第一隐私数据集与上述第二隐私数据集的大小,并根据比较结果,确定第一隐私数据集。本申请实施例中,若上述第一隐私数据集大于上述第二隐私数据集,则上述第一隐私数据集即为上述第一数据集。若上述第一隐私数据集小于上述第二隐私数据集,则对上述第一隐私数据集进行数据集扩充,使得扩充后的第一隐私数据集的大小与上述第二隐私数据集的大小的差值小于或等于1,将进行扩充后的第一隐私数据集确定第一数据集。若上述第一隐私数据集与上述第二隐私数据集的大小相等,则上述第一隐私数据集即为上述第一数据集。
需说明的是,在本申请实施例中,原始的第一隐私数据集的中位数与进行扩充后的第一隐私数据集的中位数相同,即,扩充添加的数据不影响第一隐私数据集的中位数。
具体地,第一设备在上述第一隐私数据集的头部插入若干噪声数据,在上述第一隐私数据集的尾部插入等量的噪声数据,直到第一隐私数据集与上述第二隐私数据集的大小之差小于或等于1。上述第一隐私数据集的头部插入的噪声数据与上述第一隐私数据集的尾部插入的等量的噪声数据需使得上述第一隐私数据集扩充前后的中位数不发生改变,例如,在上述第一隐私数据集的头部插入负无穷,在上述第一隐私集的尾部插入正无穷,上述第一隐私数据集插入的负无穷的数量与插入的正无穷的数量相同。
A2:根据预设隐私比较算法,比较所述第一数据集的第一中位数与第二数据集的第二中位数,其中,所述第二数据集具体为:所述第二设备根据所述第一隐私数据集的大小与所述第二隐私数据集的大小确定。
在本申请实施例中,第二设备比较上述第一隐私数据集与上述第二隐私数据集的大小,并根据比较结果,确定第二隐私数据集。本申请实施例中,若上述第一隐私数据集小于上述第二隐私数据集,则上述第二隐私数据集即为上述第二数据集。若上述第二隐私数据集小于上述第一隐私数据集,则对上述第二隐私数据集进行数据集扩充,使得扩充后的第二隐私数据集的大小与上述第一隐私数据集的大小的差值小于或等于1,将进行扩充后的第二隐私数据集确定第二数据集。若上述第一隐私数据集与上述第二隐私数据集的大小相等,上述第二隐私数据集即为上述第二数据集。
在一种应用场景中,数据发起方获取第一隐私数据集SI,SI={a0,a1,…,am},数据提供方根据数据发起方发送的数据请求,生成第二隐私数据集SP,SP={b0,b1,…,bn},数据发起方将SI的大小发送至数据提供方,并接收数据提供方反馈的SP的大小,数据发起方比较SI和SP的大小,若SI和SP两个数据集的大小相等,则将SI确定为第一数据集,将SP确定为第二数据集。若SI中数据数量小于SP中数据数量,数据集SI中数据按从小到大排序,则在集合SI的头部插入若干-∞,在集合SI的尾部插入与等量的+∞,直到||SI|-|SP||≤1;若SI中数据数量大于SP中数据数量,数据集SP中数据按从小到大排序,则在集合SP的头部插入若干-∞,在集合SP的尾部插入与等量的+∞,直到||SI|-|SP||≤1;其中,|I|表示集合SI的大小,|P|表示集合SP的大小。
例如,SI={1,2,3,4,5,6,7},SP={3,4},对数据集合SP进行补充,最终补充为SP={-∞,-∞,3,4,+∞,+∞},此时||SI|-|SP||=|7-6|=1。
隐私计算算法是一种可以保证在原始数据不出库的情况下发挥数据的作用,让数据的价值流通起来,而隐私中位数是隐私计算中很重要的一个算法。在本申请实施例中,上述第一设备和上述第二设备分别采用现有的隐私中位数算法计算各自隐私数据集的中位数,保护自己数据集中数据的隐私。第一设备根据隐私中位数算法计算上述第一数据集的第一中位数,第二设备根据隐私中位数算法计算上述第二数据集的第二中位数。
第一设备再根据预设隐私比较算法,比较第一中位数与第二中位数的大小。上述预设隐私比较算法用于对未知具体数据间的大小比较。上述预设隐私比较算法参见现有隐私比较算法,此处不赘述。
A3:若所述第一中位数与所述第二中位数相等,则将所述第一中位数确定为所述目标数据集的目标中位数。
在本申请实施例中,第一设备计算自己第一数据集中的第一中位数,第二设备计算自己第二数据集中的第二中位数,第一设备再利用预设隐私比较算法比较两个中位数的大小,第一设备无需向第二设备公布第一数据集中的数据,第二设备也无需向第一设备公布第二数据集中的数据,从而有效保护用户数据隐私。若第一中位数和第二中位数相等,即可确定上述第一中位数为目标数据集的目标中位数。
本申请实施例中,第一设备根据第一数据集中的第一中位数和第二设备的第二中位数的大小关系确定目标中位数,无需将第一数据集中的数据与第二数据集中的数据一一进行隐私比较,及保护用户隐私,提高了数据安全,同时,提高了中位数确定的效率。
作为本申请一种可能的实施方式,图3示出了本申请实施例提供的统计分析方法实施例中,第一中位数与第二中位数不相等时,确定目标中位数的具体实现流程,详述如下:
B1:若所述第一中位数与所述第二中位数不相等,则执行第一数据删除指令,所述第一数据删除指令用于指示所述第一设备删除所述第一数据集中第一指定位置的数据,得到第一更新数据集。
在本申请实施例中,当上述第一中位数与上述第二中位数不相等时,无法直接确定目标中位数,此时,第一设备执行第一数据删除指令,将第一数据集中第一指定位置的数据删除,从而得到第一更新数据集。
B2:将所述第一中位数与所述第二中位数的比较结果发送至所述第二设备,以使得所述第二设备执行第二数据删除指令,所述第二数据删除指令用于指示所述第二设备删除所述第二数据集中第二指定位置的数据,得到第二更新数据集,其中,所述第二数据集中删除的数据数量与所述第一数据集中删除的数据数量相等。
当上述第一中位数与上述第二中位数不相等时,第一设备将上述第一中位数与上述第二中位数的比较结果发送至第二设备,第二设备执行第二数据删除指令,将第二数据集中第二指定位置的数据删除,从而得到第二更新数据集,第一数据集中删除的数据数量与第二数据集中删除的数据数量相等。
本申请实施例中,当上述第一中位数小于上述第二中位数时,上述第一指定位置的数据是指上述第一数据集中比上述第一中位数小的数据,上述第二指定位置的数据是指上述第二数据集中比上述第二中位数大的数据。当上述第一中位数大于上述第二中位数时,上述第一指定位置的数据是指上述第一数据集中比上述第一中位数大的数据,上述第二指定位置的数据是指上述第二数据集中比上述第二中位数小的数据。
本申请实施例中,当上述第一数据集中包含上述第一中位数,上述第二数据集中包含上述第二中位数时,上述第一指定位置与上述第二指定位置不相同。上述第一指定位置与上述第一中位数的位置相关,上述第二指定位置与上述第二中位数的位置相关。
示例性地,若上述第一数据集中包含上述第一中位数,上述第二数据集中包含上述第二中位数,且上述第一数据集与上述第二数据集中的数据均为升序排序,当上述第一中位数小于上述第二中位数时,上述第一指定位置的数据为上述第一数据集中上述第一中位数左侧的数据,上述第二指定位置的数据为上述第二数据集中上述第二中位数右侧的数据。当上述第一中位数大于上述第二中位数时,上述第一指定位置的数据为上述第一数据集中上述第一中位数右侧的数据,上述第二指定位置为上述第二数据集中上述第二中位数左侧的数据。
示例性地,若上述第一数据集与上述第二数据集中的数据均为降序排序,当上述第一中位数小于上述第二中位数时,上述第一指定位置的数据为上述第一数据集中上述第一中位数右侧的数据,上述第二指定位置的数据为上述第二数据集中上述第二中位数左侧的数据。当上述第一中位数大于上述第二中位数时,上述第一指定位置的数据为上述第一数据集中上述第一中位数左侧的数据,上述第二指定位置的数据为上述第二数据集中上述第二中位数右侧的数据。
在一种可能的实施方式中,上述第一数据集中可能不包含上述第一中位数,上述第二数据集中可能不包含上述第二中位数,此时,当上述第一中位数小于上述第二中位数时,上述第一指定位置的数据是指上述第一数据集中比上述第一中位数小的数据,上述第二指定位置的数据是指上述第二数据集中比上述第二中位数大的数据。当上述第一中位数大于上述第二中位数时,上述第一指定位置的数据是指上述第一数据集中比上述第一中位数大的数据,上述第二指定位置的数据是指上述第二数据集中比上述第二中位数小的数据。
本申请实施例中,根据上述第一指定位置数据量和上述第二指定位置数据量的比较结果,确定上述第一指定位置要删除的数据的数量与上述第二指定位置要删除的数据量。具体地,比较上述第一指定位置数据量与上述第二指定位置数据量,将其中较小的数据量确定为上述第一指定位置要删除的数据的数量以及上述第二指定位置要删除的数据的数量。
例如,SI={1,2,3,4,5,6,7},SP={3,4},对数据集合SP进行补充,最终补充为SP={-∞,-∞,3,4,+∞,+∞},此时||SI|-|SP||=|7-6|=1。数据发起方的数据集SI的中位数为mI=4,数据提供方的数据集SP的中位数为mP=3.5,mI>mP,数据集SI右侧有3个数据,数据集SP左侧有3个数据,因此,删除的数据量为3,数据发起方执行第一数据删除指令,删除数据集中4右侧的3个数据,得到第一更新数据集SI1={1,2,3,4},数据提供方执行第二数据删除指令,删除数据集中3.5左侧的3个数据,得到第二更新数据集SP1={4,+∞,+∞}。
B3:根据预设隐私比较算法,比较所述第一更新数据集中的第一更新中位数与所述第二更新数据集中的第二更新中位数。
第一设备再根据预设隐私比较算法,比较第一更新中位数与第二更新中位数的大小。上述预设隐私比较算法用于对未知具体数据间的大小比较。上述预设隐私比较算法参见现有隐私比较算法,此处不赘述。
B4:若所述第一更新中位数与所述第二更新中位数相等,则将所述第一更新中位数确定为目标中位数。
作为本申请一种可能的实施方式,如图4所示,若所述第一中位数与所述第二中位数不相等,在所述执行第一数据删除指令之前,还包括:
C1:获取所述第一数据集中数据的数量,以及所述第二数据集中数据的数量。
C2:若所述第一数据集中数据的数量与所述第二数据集中数据的数量均大于预设数量阈值,则执行所述执行第一数据删除指令。
在本申请实施例中,当上述第一中位数与上述第二中位数不相等时,先确定第一数据集中数据的数量与第二数据集中数据的数量是否足够删除,当所述第一数据集中数据的数量与所述第二数据集中数据的数量均大于预设数量阈值时,再执行第一数据删除指令,避免删除数据集中数据太少而导致易泄露隐私。
作为本申请一种可能的实施方式,图5示出了本申请实施例提供的统计分析方法实施例中,第一中位数与第二中位数不相等时,确定目标中位数的另一种具体实现流程,详述如下:
D1:若所述第一中位数与所述第二中位数不相等,则获取所述第一数据集中数据的数量,以及所述第二数据集中数据的数量。
D2:若所述第一数据集中数据的数量达到预设数量阈值,或者,所述第二数据集中数据的数量达到所述预设数量阈值,则将所第一数据集中的数据与所述第二数据集中的数据进行比较排序。其中,比较排序采用隐私比较算法一一比较进行排序。上述预设数量阈值可以为2。
D3:根据所述比较排序的结果,确定所述目标数据集的目标中位数。
在本申请实施例中,当所述第一数据集中数据的数量达到预设数量阈值时,或者,当所述第二数据集中数据的数量达到预设数量阈值时,第一设备和第二设备都不再执行数据删除指令,此时,直接采用隐私比较算法,将所第一数据集中的数据与所述第二数据集中的数据一一比较进行排序,进而得到目标数据集的目标中位数。
示例性地,SI1={1,2,3,4},SP1={4,+∞,+∞},此时mI1=2.5,mP1=+∞,mI<mP,数据集SI1中在2.5左边的元素有两个,数据集SP1中在+∞右边的元素有1个,此时,1<2,故第一设备删除数据集SI1左侧1个元素,第二设备删除数据集SP1右侧1个元素,更新后得到数据集SI2={2,3,4},数据集SP2={4,+∞}。,此时mI2和mP2依然不相等,且数据集SP2中的数据集达到预设数量阈值2,此时,采用隐私比较算法,将数据集SI2和数据集SP2一一比较进行排序,进而得到目标数据集的目标中位数。
S104、根据所述目标中位数,进行统计分析。
本申请实施例中,上述统计分析需求指令包括用户的统计分析需求,根据上述目标中位数和上述统计分析需求,进行统计分析。
在本申请实施例中,第一设备通过获取第一隐私数据集,并发送数据请求至第二设备,然后将所述第一隐私数据集的大小发送至所述第二设备,并接收所述第二设备反馈的所述第二隐私数据集的大小,第一设备和第二设备双方仅告知对方自己隐私数据集的大小,无需暴露自己隐私数据的实际数据值,可有效保护用户隐私,第一设备再根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,有效确定目标数据集的目标中位数,最后根据所述目标中位数,进行统计分析,既保护了用户隐私数据不被公开,又可实现用户利用确定的中位数进行有效的统计分析,提高了数据的流通价值。
作为本申请一种可能的实施方式,图6示出了本申请实施例提供的一种包括身份验证的隐私数据的统计分析方法,详述如下:
S201:获取第一隐私数据集,并发送数据请求至第二设备,所述数据请求用于指示所述第二设备生成第二隐私数据集。
本实施例中,步骤S201的具体步骤参见上述实施例步骤S101。
S202:接收所述第二设备基于所述数据请求发送的身份验证请求。
S203:基于所述身份验证请求,发送身份信息至所述第二设备,以使得所述第二设备根据所述身份信息对所述第一设备进行身份验证,若所述第一设备的身份验证通过,则基于所述数据请求,生成第二隐私数据集。
本申请实施例中,上述身份信息可以是表示身份的任意标识信息。
S204:将所述第一隐私数据集的大小发送至所述第二设备,并接收所述第二设备反馈的所述第二隐私数据集的大小。
S205:根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,所述目标数据集为所述第一隐私数据集与所述第二隐私数据集合并后得到的数据集。
S206:根据所述目标中位数,进行统计分析。
本实施例中,步骤S204至步骤S206的具体步骤参见上述实施例步骤S102至步骤S104,在此不再赘述。
本申请实施例中,通过身份验证进一步提高数据的安全性。
应理解,上述各个实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的隐私数据的统计分析方法,图7示出了本申请实施例提供的隐私数据的统计分析装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图7,该统计分析装置应用于第一设备,该统计分析装置包括:隐私数据集生成单元71,数据集大小获取单元72,中位数确定单元73,统计分析单元74,其中:
隐私数据集生成单元71,用于获取第一隐私数据集,并发送数据请求至第二设备,所述数据请求用于指示所述第二设备生成第二隐私数据集;
数据集大小获取单元72,用于将所述第一隐私数据集的大小发送至所述第二设备,并接收所述第二设备反馈的所述第二隐私数据集的大小;
中位数确定单元73,用于根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,所述目标数据集为所述第一隐私数据集与所述第二隐私数据集合并后得到的数据集;
统计分析单元74,用于根据所述目标中位数,进行统计分析。
作为本申请一种可能的实施方式,所述中位数确定单元包括:
第一数据集确定模块,用于根据所述第一隐私数据集的大小与所述第二隐私数据集的大小,确定第一数据集;
隐私数据比较模块,用于根据预设隐私比较算法,比较所述第一数据集的第一中位数与第二数据集的第二中位数,其中,所述第二数据集具体为:所述第二设备根据所述第一隐私数据集的大小与所述第二隐私数据集的大小确定;
第一目标中位数确定模块,用于若所述第一中位数与所述第二中位数相等,则将所述第一中位数确定为所述目标数据集的目标中位数。
作为本申请一种可能的实施方式,所述中位数确定单元还包括:
第一数据集更新模块,用于若所述第一中位数与所述第二中位数不相等,则执行第一数据删除指令,所述第一数据删除指令用于指示所述第一设备删除所述第一数据集中第一指定位置的数据,得到第一更新数据集;
第二数据集更新模块,用于将所述第一中位数与所述第二中位数的比较结果发送至所述第二设备,以使得所述第二设备执行第二数据删除指令,所述第二数据删除指令用于指示所述第二设备删除所述第二数据集中第二指定位置的数据,得到第二更新数据集;
第二数据比较模块,用于根据预设隐私比较算法,比较所述第一更新数据集中的第一更新中位数与所述第二更新数据集中的第二更新中位数;
第二目标中位数确定模块,用于若所述第一更新中位数与所述第二更新中位数相等,则将所述第一更新中位数确定为目标中位数。
作为本申请一种可能的实施方式,所述中位数确定单元还包括:
第一数量确定模块,用于获取所述第一数据集中数据的数量,以及所述第二数据集中数据的数量;
所述第一数据集更新模块,还用于若所述第一数据集中数据的数量与所述第二数据集中数据的数量均大于预设数量阈值,则执行所述执行第一数据删除指令。
作为本申请一种可能的实施方式,所述中位数确定单元还包括:
第二数据量确定模块,用于若所述第一中位数与所述第二中位数不相等,则获取所述第一数据集中数据的数量,以及所述第二数据集中数据的数量;
排序比较模块,用于若所述第一数据集中数据的数量达到预设数量阈值,或者,所述第二数据集中数据的数量达到所述预设数量阈值,则将所第一数据集中的数据与所述第二数据集中的数据进行比较排序;
第三目标中位数确定模块,用于根据所述比较排序的结果,确定所述目标数据集的目标中位数。
作为本申请一种可能的实施方式,统计分析装置还包括:
身份验证单元,用于接收所述第二设备基于所述数据请求发送的身份验证请求;
所述隐私数据集生成单元,还用于基于所述身份验证请求,发送身份信息至所述第二设备,以使得所述第二设备根据所述身份信息对所述第一设备进行身份验证,若所述第一设备的身份验证通过,则基于所述数据请求,生成第二隐私数据集。
由上可见,本申请实施例中,第一设备通过获取第一隐私数据集,并发送数据请求至第二设备,然后将所述第一隐私数据集的大小发送至所述第二设备,并接收所述第二设备反馈的所述第二隐私数据集的大小,第一设备和第二设备双方仅告知对方自己隐私数据集的大小,无需暴露自己隐私数据的实际数据值,可有效保护用户隐私,第一设备再根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,有效确定目标数据集的目标中位数,最后根据所述目标中位数,进行统计分析,既保护了用户隐私数据不被公开,又可实现用户利用确定的中位数进行有效的统计分析,提高了数据的流通价值。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如图1至图6表示的任意一种隐私数据的统计分析方法的步骤。
本申请实施例还提供一种计算机程序产品,当该计算机程序产品在终端设备上运行时,使得终端设备执行实现如图1至图6表示的任意一种隐私数据的统计分析方法的步骤。
图8是本申请一实施例提供的服务器的示意图。如图8所示,该实施例的服务器8包括:处理器80、存储器81以及存储在所述存储器81中并可在所述处理器80上运行的计算机程序82。所述处理器80执行所述计算机程序82时实现上述各个隐私数据的统计分析方法的实施例中的步骤,例如图1所示的步骤S101至S104。或者,所述处理器80执行所述计算机程序82时实现上述各装置实施例中各模块/单元的功能,例如图7所示模块71至73的功能。
所述计算机程序82可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器81中,并由所述处理器80执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序82在所述服务器8中的执行过程。
所称处理器80可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器81可以是所述服务器8的内部存储单元,例如服务器8的硬盘或内存。所述存储器81也可以是所述服务器8的外部存储设备,例如所述服务器8上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器81还可以既包括所述服务器8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述服务器所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种隐私数据的统计分析方法,其特征在于,应用于第一设备,所述统计分析方法包括:
获取第一隐私数据集,并发送数据请求至第二设备,所述数据请求用于指示所述第二设备生成第二隐私数据集;
将所述第一隐私数据集的大小发送至所述第二设备,并接收所述第二设备反馈的所述第二隐私数据集的大小;
根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,所述目标数据集为所述第一隐私数据集与所述第二隐私数据集合并后得到的数据集;
根据所述目标中位数,进行统计分析;
所述根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,包括:
根据所述第一隐私数据集的大小与所述第二隐私数据集的大小,确定第一数据集,包括:若所述第一隐私数据集的大小小于所述第二隐私数据集的大小,则对所述第一隐私数据集进行数据集扩充,使得扩充后的第一隐私数据集的大小与所述第二隐私数据集的大小的差值小于或等于1,将进行扩充后的第一隐私数据集确定第一数据集,其中,扩充前的第一隐私数据集的中位数与进行扩充后的第一隐私数据集的中位数相同。
2.如权利要求1所述的统计分析方法,其特征在于,所述根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,还包括:
根据预设隐私比较算法,比较所述第一数据集的第一中位数与第二数据集的第二中位数,其中,所述第二数据集具体为:所述第二设备根据所述第一隐私数据集的大小与所述第二隐私数据集的大小确定;
若所述第一中位数与所述第二中位数相等,则将所述第一中位数确定为所述目标数据集的目标中位数。
3.如权利要求2所述的统计分析方法,其特征在于,所述根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,还包括:
若所述第一中位数与所述第二中位数不相等,则执行第一数据删除指令,所述第一数据删除指令用于指示所述第一设备删除所述第一数据集中第一指定位置的数据,得到第一更新数据集;
将所述第一中位数与所述第二中位数的比较结果发送至所述第二设备,以使得所述第二设备执行第二数据删除指令,所述第二数据删除指令用于指示所述第二设备删除所述第二数据集中第二指定位置的数据,得到第二更新数据集,其中,所述第二数据集中删除的数据数量与所述第一数据集中删除的数据数量相等;
根据预设隐私比较算法,比较所述第一更新数据集中的第一更新中位数与所述第二更新数据集中的第二更新中位数;
若所述第一更新中位数与所述第二更新中位数相等,则将所述第一更新中位数确定为目标中位数。
4.如权利要求3所述的统计分析方法,其特征在于,在所述执行第一数据删除指令之前,还包括:
获取所述第一数据集中数据的数量,以及所述第二数据集中数据的数量;
若所述第一数据集中数据的数量与所述第二数据集中数据的数量均大于预设数量阈值,则执行所述执行第一数据删除指令。
5.如权利要求2所述的统计分析方法,其特征在于,所述根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,还包括:
若所述第一中位数与所述第二中位数不相等,则获取所述第一数据集中数据的数量,以及所述第二数据集中数据的数量;
若所述第一数据集中数据的数量达到预设数量阈值,或者,所述第二数据集中数据的数量达到所述预设数量阈值,则将所第一数据集中的数据与所述第二数据集中的数据进行比较排序;
根据所述比较排序的结果,确定所述目标数据集的目标中位数。
6.如权利要求1至5任一项所述的统计分析方法,其特征在于,在所述第二设备生成所述第二隐私数据集之前,包括:
接收所述第二设备基于所述数据请求发送的身份验证请求;
基于所述身份验证请求,发送身份信息至所述第二设备,以使得所述第二设备根据所述身份信息对所述第一设备进行身份验证,若所述第一设备的身份验证通过,则基于所述数据请求,生成第二隐私数据集。
7.一种隐私数据的统计分析装置,其特征在于,应用于第一设备,所述统计分析装置包括:
隐私数据集生成单元,用于获取第一隐私数据集,并发送数据请求至第二设备,所述数据请求用于指示所述第二设备生成第二隐私数据集;
数据集大小获取单元,用于将所述第一隐私数据集的大小发送至所述第二设备,并接收所述第二设备反馈的所述第二隐私数据集的大小;
中位数确定单元,用于根据所述第一隐私数据集的大小、所述第二隐私数据集的大小,以及预设隐私比较算法,确定目标数据集的目标中位数,所述目标数据集为所述第一隐私数据集与所述第二隐私数据集合并后得到的数据集;
统计分析单元,用于根据所述目标中位数,进行统计分析;
所述中位数确定单元包括:
第一数据集确定模块,用于根据所述第一隐私数据集的大小与所述第二隐私数据集的大小,确定第一数据集,包括:若所述第一隐私数据集的大小小于所述第二隐私数据集的大小,则对所述第一隐私数据集进行数据集扩充,使得扩充后的第一隐私数据集的大小与所述第二隐私数据集的大小的差值小于或等于1,将进行扩充后的第一隐私数据集确定第一数据集,其中,扩充前的第一隐私数据集的中位数与进行扩充后的第一隐私数据集的中位数相同。
8.如权利要求7所述的统计分析装置,其特征在于,所述中位数确定单元还包括:
隐私数据比较模块,用于根据预设隐私比较算法,比较所述第一数据集的第一中位数与第二数据集的第二中位数,其中,所述第二数据集具体为:所述第二设备根据所述第一隐私数据集的大小与所述第二隐私数据集的大小确定;
第一目标中位数确定模块,用于若所述第一中位数与所述第二中位数相等,则将所述第一中位数确定为所述目标数据集的目标中位数。
9.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的隐私数据的统计分析方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的隐私数据的统计分析方法的步骤。
CN202110516213.XA 2021-05-12 2021-05-12 一种隐私数据的统计分析方法、装置、服务器和存储介质 Active CN113392138B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110516213.XA CN113392138B (zh) 2021-05-12 2021-05-12 一种隐私数据的统计分析方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110516213.XA CN113392138B (zh) 2021-05-12 2021-05-12 一种隐私数据的统计分析方法、装置、服务器和存储介质

Publications (2)

Publication Number Publication Date
CN113392138A CN113392138A (zh) 2021-09-14
CN113392138B true CN113392138B (zh) 2023-03-14

Family

ID=77616939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110516213.XA Active CN113392138B (zh) 2021-05-12 2021-05-12 一种隐私数据的统计分析方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN113392138B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114417983A (zh) * 2021-12-30 2022-04-29 上海蓝凡网络科技股份有限公司 一种保护隐私安全的隐私数据融合方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106815348A (zh) * 2017-01-18 2017-06-09 安徽师范大学 一种隐私保护空间离群点检测方法
CN109726587A (zh) * 2018-12-21 2019-05-07 盐城师范学院 一种基于差分隐私的空间数据划分方法
CN110651449A (zh) * 2017-06-04 2020-01-03 苹果公司 使用计数均值草图的差分隐私
CN111917533A (zh) * 2019-05-10 2020-11-10 Sap欧洲公司 具有减少泄漏的区间统计量的隐私保护基准分析

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10467234B2 (en) * 2015-11-02 2019-11-05 LeapYear Technologies, Inc. Differentially private database queries involving rank statistics

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106815348A (zh) * 2017-01-18 2017-06-09 安徽师范大学 一种隐私保护空间离群点检测方法
CN110651449A (zh) * 2017-06-04 2020-01-03 苹果公司 使用计数均值草图的差分隐私
CN109726587A (zh) * 2018-12-21 2019-05-07 盐城师范学院 一种基于差分隐私的空间数据划分方法
CN111917533A (zh) * 2019-05-10 2020-11-10 Sap欧洲公司 具有减少泄漏的区间统计量的隐私保护基准分析

Also Published As

Publication number Publication date
CN113392138A (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
CN112153085B (zh) 一种数据处理方法、节点及区块链系统
CN108734028B (zh) 基于区块链的数据管理方法、区块链节点及存储介质
CN110852882B (zh) 用于区块链网络的分组共识方法、装置、设备和介质
CN112163412B (zh) 数据校验方法、装置、电子设备及存储介质
CN112052251B (zh) 目标数据更新方法和相关装置、设备及存储介质
CN111461763A (zh) 一种资源分配方法及装置
CN112307331B (zh) 一种基于区块链高校毕业生智能招聘信息推送方法、系统及终端设备
CN111629063A (zh) 基于区块链的分布式文件下载的方法和电子设备
CN113886499B (zh) 基于区块链的病理数据分享方法、分享系统及计算设备
CN113392138B (zh) 一种隐私数据的统计分析方法、装置、服务器和存储介质
CN115757406A (zh) 数据存储方法、装置、电子设备及存储介质
CN110020040B (zh) 查询数据的方法、装置和系统
CN113111078B (zh) 资源数据处理方法、装置、计算机设备和存储介质
CN111898027A (zh) 确定特征维度的方法、装置、电子设备和计算机可读介质
CN110662210A (zh) 基于区块链的二次或多次手机号的识别方法、系统及设备
CN114822782A (zh) 医学影像分析方法、系统、设备、介质和程序产品
CN114237517A (zh) 一种文件分散存储方法及装置
CN114398678A (zh) 电子文件防篡改的登记验证方法、装置、电子设备及介质
CN113419792A (zh) 一种事件处理方法、装置、终端设备和存储介质
CN112291241A (zh) 防火墙开墙方法、防火墙开墙装置及终端设备
CN111460273A (zh) 信息推送方法和装置
CN118070327B (zh) 满足差分隐私保护的社交图中距离查询方法及装置
CN109754189A (zh) 一种制卡任务的分配方法、一种制卡任务的获取方法、计算机装置及计算机可读存储介质
CN117435963B (zh) 数字资产欺诈群体确定方法、装置、电子设备和存储介质
CN112667730B (zh) 一种外部数据验证方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant