CN112613065A - 一种基于差分隐私保护的数据共享方法及装置 - Google Patents
一种基于差分隐私保护的数据共享方法及装置 Download PDFInfo
- Publication number
- CN112613065A CN112613065A CN202011391185.5A CN202011391185A CN112613065A CN 112613065 A CN112613065 A CN 112613065A CN 202011391185 A CN202011391185 A CN 202011391185A CN 112613065 A CN112613065 A CN 112613065A
- Authority
- CN
- China
- Prior art keywords
- data
- privacy protection
- differential privacy
- algorithm
- budget
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000000586 desensitisation Methods 0.000 claims description 37
- 238000009826 distribution Methods 0.000 claims description 23
- 230000007246 mechanism Effects 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 7
- 239000000654 additive Substances 0.000 claims description 4
- 230000000996 additive effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 244000075898 Lantana strigocamara Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0407—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the identity of one or more communicating identities is hidden
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Storage Device Security (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于差分隐私保护的数据共享方法及装置,所述方法包括:将包括敏感数据的原始数据集划分为N个子数据集;采取差分隐私保护算法,为各个子数据集提供差分隐私保护;提供多个数据查询接口,供外部系统使用差分隐私保护数据,更新隐私预算值。根据本发明的方案,为含有敏感数据的原始数据集提供差分隐私保护,从而使数据需求单位可以安全地使用这些数据,满足其业务需求。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种基于差分隐私保护的数据共享方法及装置。
背景技术
2015年国务院印发了《促进大数据发展行动纲要》,数据这个概念开始得到大家广泛认知并且重视。从2015年国内第一个贵阳大数据交易所挂牌以来,官方数据交易中心已经成立了数十个,商业的数据交易平台更加数不胜数。我国作为数据大国,无论数据量,还是市场规模都保持多年的显著增长。国内目前数据市场的规模已经超过8000亿元,超过2014年的十余倍。
2020年3月,中共中央国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》中,首次提出将数据与土地、劳动力、资本和技术并称为五大要素。由此可以看出,数据作为新型生产力的重要因素,将成为继石油、电力之后,成为以信息技术为基础的第四次工业革命的重要驱动力,这一概念已经得到国家的认可并会得到积极的推进。
但是另一方面,数据不同于其他四个生产力要素的一个显著特点是其具有较大的安全性问题。特别是包含大量敏感数据的某些行业中,这些数据敏感、数据价值高,例如能够提高银行信贷安全水平,提供能源合理应用能力。但由于个人隐私保护等法律法规的要求,为保护个人隐私,这些敏感数据不能提供给其它使用机构,造成数据价值被限制,并且相关行业的风险无法有效降低。如何在依照法规规定的情况下,既保障敏感数据安全,又能够激活数据价值,成为众多行业面临的巨大挑战。
现有技术在数据共享场景中,采用数据脱敏技术,达到实时模糊化敏感数据的效果,数据脱敏技术的目的是通过隐藏敏感数据,以防止这些数据的滥用。目前存在多种数据脱敏技术,例如用相似的字符替代一些字段,用屏蔽字符(例如,‘x’)替代字符;用虚拟的姓氏替代真正的姓氏,以及在数据库数列中对数据进行重组。数据脱敏也被称为数据混淆、数据保密、数据消毒、数据扰频、数据匿名化和数据认证。脱敏可实现对业务系统数据库中敏感数据进行透明的动态脱敏、静态脱敏。动态脱敏是对生产数据库中返回的数据可以进行屏蔽、隐藏等多种脱敏策略。静态脱敏是对于开发、测试,或者数据外发等场景,提供批量的数据脱敏能力。通过采样、替换等方式生成脱敏后的准真实数据库,脱敏后的数据同时保留原有的关联关系。
图1为现有技术中数据脱敏的流程图,如图1所示。
但现有技术的基于脱敏技术的数据共享方式无法抵抗差分攻击。攻击者可以通过脱敏集与其它公开集进行关联,采取不断丰富背景知识的方法,还原个人隐私数据。
这种因脱敏数据集公开而导致个人隐私泄漏的案例已经发生多起。20世纪90年代,美国马萨诸塞州集团保险委员会(GIC)发布了“经过匿名化处理的”医疗数据,用于公共医学研究。在数据发布之前,为了防止隐私泄露,特地删除了数据中所有的个人敏感信息,例如身份证号、姓名、住址。卡内基梅隆大学Latanya Sweeney将匿名化的GIC数据库与选民登记记录关联分析,成功还原了隐私数据,找到了马萨诸塞州州长的医疗记录。
发明内容
为解决上述技术问题,本发明提出了一种基于差分隐私保护的数据共享方法及装置,所述方法及装置,用以解决现有技术中,脱敏数据集共享会受到差分攻击,而导致的数据泄露的问题,实现数据的安全使用。
根据本发明的第一方面,提供一种基于差分隐私保护的数据共享方法,所述方法包括以下步骤:
步骤S201:将包括敏感数据的原始数据集划分为N个子数据集;
步骤S202:采取差分隐私保护算法,为各个子数据集提供差分隐私保护;
步骤S203:提供多个数据查询接口,供外部系统使用差分隐私保护数据,更新隐私预算值。
进一步地,所述差分隐私保护算法包括添加噪声算法和隐私预算算法。
进一步地,所述添加噪声算法为随机噪声算法,采集Laplace机制向查询结果中加入服从Laplace分布的随机噪声;设记位参数为0,需要保护的数值的x,尺度参数a的Laplace分布为Lap(a),其概率密度函数为:
设D为脱敏子数据集,F(D)为脱敏子数据集D的查询结果;
设D’为D的邻近脱敏子数据集,F(D’)为邻近脱敏子数据集D’的查询结果;
有M(F(D))=M(F(D’)),则隐私保护算法M为D提供差分隐私保护。
其中,M(F(D))=F(D)+p(x),M(F(D’))=F(D’)+p(x)。
进一步地,所述隐私预算算法,查询分为高预算查询和低预算查询两类。
根据本发明第二方面,提供一种基于差分隐私保护的数据共享装置,所述装置包括:
划分模块:配置为将包括敏感数据的原始数据集划分为N个子数据集;
隐私保护模块:配置为采取差分隐私保护算法,为各个子数据集提供差分隐私保护;
查询模块:配置为提供多个数据查询接口,供外部系统使用差分隐私保护数据,更新隐私预算值。
进一步地,所述差分隐私保护算法包括添加噪声算法和隐私预算算法。
进一步地,所述添加噪声算法为随机噪声算法,采集Laplace机制向查询结果中加入服从Laplace分布的随机噪声;设记位参数为0,需要保护的数值的x,尺度参数a的Laplace分布为Lap(a),其概率密度函数为:
设D为脱敏子数据集,F(D)为脱敏子数据集D的查询结果;
设D’为D的邻近脱敏子数据集,F(D’)为邻近脱敏子数据集D’的查询结果;
有M(F(D))=M(F(D’)),则隐私保护算法M为D提供差分隐私保护。
其中,M(F(D))=F(D)+p(x),M(F(D’))=F(D’)+p(x)。
进一步地,所述隐私预算算法,查询分为高预算查询和低预算查询两类。
根据本发明第三方面,提供一种基于差分隐私保护的数据共享系统,包括:
处理器,用于执行多条指令;
存储器,用于存储多条指令;
其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如前所述的基于差分隐私保护的数据共享方法。
根据本发明第四方面,提供一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的基于差分隐私保护的数据共享方法。
根据本发明的上述方案,为含有敏感数据的原始数据集提供差分隐私保护,从而使数据需求单位可以安全地使用这些数据,满足其业务需求。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明提供如下附图进行说明。在附图中:
图1为现有技术中数据脱敏的流程图;
图2为本发明一个实施方式的基于差分隐私保护的数据共享方法流程图;
图3为本发明一个实施方式的基于差分隐私保护的数据共享方法的架构图;
图4为本发明一个实施方式中噪声算法的示意图;
图5为本发明一个实施方式的城商银零售与信贷数据安全服务项目系统架构示意图;
图6为本发明一个实施方式的随机噪声技术原理示意图;
图7为本发明一个实施方式的基于差分隐私保护的数据共享装置结构框图。
具体实施方式
定义:
差分隐私:差分隐私是针对统计数据库的隐私泄露问题提出的一种新的隐私定义。
Laplace分布:Laplace是一种连续的概率分布。
中位数:是按顺序排列的一组数据中居于中间位置的数。
PWM:private multiplicative weights,Hardt提出的PMW机制,PMW通过投票机制构建复合算法进行隐私预算消耗。
TPS:Transaction Per Second,每秒事务处理量,是反映系统处理能力的关键性能指标。
首先结合图2说明为本发明一个实施方式的基于差分隐私保护的数据共享方法流程图。如图2所示,所述方法包括以下步骤:
步骤S201:将包括敏感数据的原始数据集划分为N个子数据集;
步骤S202:采取差分隐私保护算法,为各个子数据集提供差分隐私保护;
步骤S203:提供多个数据查询接口,供外部系统使用差分隐私保护数据,更新隐私预算值。
所述步骤S201:将包括敏感数据的原始数据集划分为N个子数据集,其中,所述原始数据集包括例如个人信息等大量敏感数据,根据划分策略将原始数据集划分为N个数据集,每个数据集均为原始数据集的子集。
所述划分策略可以为业务需求,例如,接收查询指令,获取查询结果,将查询结果作为子数据集。
所述步骤S202:采取差分隐私保护算法,为各个子数据集提供差分隐私保护,其中,所述差分隐私保护算法包括添加噪声算法和隐私预算算法。
所述添加噪声算法为随机噪声算法,本实施例中,采集Laplace机制向查询结果中加入服从Laplace分布的随机噪声。设记位参数为0,需要保护的数值记为x,尺度参数a的Laplace分布为Lap(a),其概率密度函数为:
设D为脱敏子数据集,F(D)为脱敏子数据集D的查询结果;
设D’为D的邻近脱敏子数据集,F(D’)为邻近脱敏子数据集D’的查询结果;
有M(F(D))=M(F(D’)),则隐私保护算法M为D提供差分隐私保护。
其中,M(F(D))=F(D)+p(x),M(F(D’))=F(D’)+p(x)。
所述隐私预算算法,将查询分为高预算查询和低预算查询两类;
其中低预算查询采用中位数机制,所述中位数机制由Roth和Roughgarden提出,将中位数作为隐私预算值供查询算法使用。当查询结果为奇数时m0.5=x’(n+1)/2;当查询结果为偶数时m0.5=(x’(n/2)+x’(n/2+1))/2。查询过程逐渐由中位数向外偏离,当偏离值超过2个标准差后,重新生成随机噪声,调整输出结果概率密度分布。其中x’为查询结果集,n为x’这个数据集的索引,m0.5为要某个数据集合的中位数,x’(n+1)为遍历x’这个数据集的每一个数据,x’(n/2)为x’数据集中间位置的数据,x’(n/2+1)为遍历x’数据集中间位置后面的每一个数据。
高预算查询采用Hardt提出的PMW机制,PMW通过投票机制构建复合算法进行隐私预算消耗。PWM将查询结构在值域上的分布作为一个直方图,为每个查询的值设置对应频率并添加噪声。若两个查询间的差异小于事先设置的可接受的差异值,则输出上次查询的结果,并且不消耗隐私预算,若差异值大于阈值,则发布新的查询结果,并消耗较高隐私预算。查询结果精准度,满足k个查询,误差为
所述步骤S203:提供多个数据查询接口,供外部系统使用差分隐私保护数据,更新隐私预算值,其中:
根据查询结果集与查询算法,将查询分为高隐私预算查询和低隐私预算查询,每次查询时,根据查询类型,更新隐私预算或调整噪声,确保共享数据安全,避免差分攻击。
图3为本发明一个实施方式的基于差分隐私保护的数据共享方法的架构图,如图3所示,外部系统需要通过查询来获取数据,具有原始敏感数据的系统提供差分隐私保护方法,为各个子数据集提供差分隐私保护。图4为本发明一个实施方式中噪声算法的示意图。
本实施方式大幅提高个人隐私数据保障能力。基于差分隐私保护的数据共享系统,采用Laplace随机噪声算法、中位数隐私预算算法、PWM隐私预算算法,为数据统计类服务提供可靠隐私保护,实现不同组织机构间安全地使用隐私数据,保障个人隐私安全。显著提升数据使用效率。基于差分隐私保护的数据共享系统,采用Laplace随机噪声算法、中位数隐私预算算法、PWM隐私预算算法,有效保护个人隐私数据安全,使用原本无法被外部机构使用的数据,可以在差分隐私保护的条件下安全地使用,帮助企业发挥数据价值,用数据推动业务发展。
又一实施例为某城商银零售与信贷数据安全服务方案。此城商行属于我国大型商业银行,分支遍布我国所有省份,经过多年运营积累了大量数据,包括储户个人数据、企业数据、银行零售数据、担保数据、信贷数据等8个大类。此城商行的上级集团单位主营业务包括银行、保险、消费金融等,银行的优质数据资产能够为保险、消费金融提供有效的数据支撑,提高保单制定精准度,降低消费金融客户贷款不良率。如何既满足保险、消费金融机构的数据需求,又保护客户隐私是摆在银行、保险、消费金融机构前必须要解决的问题。
本实施例的系统架构如图5所示。此项目采用差分隐私保护技术构建数据共享系统,实现了在保护个人隐私情况下的数据安全使用。在项目中,原始数据集是包括2000万条个人账户信息、个人交易流水信息的庞大数据集。首先,采集客户ID、姓名、身份证号、银行账号隐匿,电话号码掩盖等方式形成脱敏数据集。然后,通过Laplace噪声算法生成数据噪声,采用中位数和PMW隐私预算算法生成查询函数初始预算值。
本实施例中,脱敏数据集共有2000万条数据,根据不同数据使用场景,共有X个数据集。
数据集X表示2000万条数据集;数据集D∈Xi是X的子集;F(D)是针对数据子集的使用函数;M()是隐私保护算法;针对数据集D有,M(F(D))=F(D)+e;D’是数据集D的子集,针对D’有,M(F(D’))=F(D’)+e
其中e是随机噪声的概率密度函数。
M(F(D))=M(F(D’))二者统计结果一致。
本实施例中,随机噪声技术原理如图6所示。
当使用年龄、学历、已婚等条件,查询某个时间段内,房贷逾期人数(万)时,
M(F(D))的概率分布为{1.9,1.9,2.0,2.3}
M(F(D’))的概述分布为{1.9,1.9,2.0,2.3}
根据差分隐私保护原理,可以证明已为数据集D提供了符合数学基础的差分隐私保护。
本实施例的主要技术指标为:1、新建连接速度(次/秒)>3000;2、新建连接速度(次/秒)>3000;3、每秒服务数(TPS)>500。
本发明实施例进一步给出一种基于差分隐私保护的数据共享装置,如图7所示,所述装置包括:
划分模块:配置为将包括敏感数据的原始数据集划分为N个子数据集;
隐私保护模块:配置为采取差分隐私保护算法,为各个子数据集提供差分隐私保护;
查询模块:配置为提供多个数据查询接口,供外部系统使用差分隐私保护数据,更新隐私预算值。
本发明实施例进一步给出一种基于差分隐私保护的数据共享系统,包括:
处理器,用于执行多条指令;
存储器,用于存储多条指令;
其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如前所述的一种基于差分隐私保护的数据共享方法。
本发明实施例进一步给出一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的基于差分隐私保护的数据共享方法。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,实体机服务器,或者网络云服务器等,需安装Windows或者Windows Server操作系统)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (10)
1.一种基于差分隐私保护的数据共享方法,其特征在于,包括以下步骤:
步骤S201:将包括敏感数据的原始数据集划分为N个子数据集;
步骤S202:采取差分隐私保护算法,为各个子数据集提供差分隐私保护;
步骤S203:提供多个数据查询接口,供外部系统使用差分隐私保护数据,更新隐私预算值。
2.如权利要求1所述的基于差分隐私保护的数据共享方法,其特征在于,所述差分隐私保护算法包括添加噪声算法和隐私预算算法。
4.如权利要求2所述的基于差分隐私保护的数据共享方法,其特征在于,所述隐私预算算法,查询分为高预算查询和低预算查询两类。
5.一种基于差分隐私保护的数据共享装置,其特征在于,所述装置包括:
划分模块:配置为将包括敏感数据的原始数据集划分为N个子数据集;
隐私保护模块:配置为采取差分隐私保护算法,为各个子数据集提供差分隐私保护;
查询模块:配置为提供多个数据查询接口,供外部系统使用差分隐私保护数据,更新隐私预算值。
6.如权利要求5所述的基于差分隐私保护的数据共享装置,其特征在于,所述差分隐私保护算法包括添加噪声算法和隐私预算算法。
8.如权利要求6所述的基于差分隐私保护的数据共享装置,其特征在于,所述隐私预算算法,查询分为高预算查询和低预算查询两类。
9.一种基于差分隐私保护的数据共享系统,其特征在于,包括:
处理器,用于执行多条指令;
存储器,用于存储多条指令;
其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如权利要求1-4之任一项所述的基于差分隐私保护的数据共享方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如权利要求1-4之任一项所述的基于差分隐私保护的数据共享方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011391185.5A CN112613065A (zh) | 2020-12-02 | 2020-12-02 | 一种基于差分隐私保护的数据共享方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011391185.5A CN112613065A (zh) | 2020-12-02 | 2020-12-02 | 一种基于差分隐私保护的数据共享方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112613065A true CN112613065A (zh) | 2021-04-06 |
Family
ID=75228498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011391185.5A Pending CN112613065A (zh) | 2020-12-02 | 2020-12-02 | 一种基于差分隐私保护的数据共享方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112613065A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112967812A (zh) * | 2021-04-20 | 2021-06-15 | 钟爱健康科技(广东)有限公司 | 一种基于联邦学习的防窃取攻击医疗诊断模型保护方法 |
CN115587385A (zh) * | 2022-10-09 | 2023-01-10 | 九有技术(深圳)有限公司 | 本地化差分隐私与中心化差分隐私结合的数据脱敏方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197492A (zh) * | 2017-12-29 | 2018-06-22 | 南京邮电大学 | 一种基于差分隐私预算分配的数据查询方法及系统 |
CN108537055A (zh) * | 2018-03-06 | 2018-09-14 | 南京邮电大学 | 一种数据查询隐私保护的隐私预算分配和数据发布方法及其系统 |
CN110334757A (zh) * | 2019-06-27 | 2019-10-15 | 南京邮电大学 | 面向大数据分析的隐私保护聚类方法及计算机存储介质 |
US20200034566A1 (en) * | 2018-07-24 | 2020-01-30 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems, Methods, and Apparatuses for Implementing a Privacy-Preserving Social Media Data Outsourcing Model |
-
2020
- 2020-12-02 CN CN202011391185.5A patent/CN112613065A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197492A (zh) * | 2017-12-29 | 2018-06-22 | 南京邮电大学 | 一种基于差分隐私预算分配的数据查询方法及系统 |
CN108537055A (zh) * | 2018-03-06 | 2018-09-14 | 南京邮电大学 | 一种数据查询隐私保护的隐私预算分配和数据发布方法及其系统 |
US20200034566A1 (en) * | 2018-07-24 | 2020-01-30 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems, Methods, and Apparatuses for Implementing a Privacy-Preserving Social Media Data Outsourcing Model |
CN110334757A (zh) * | 2019-06-27 | 2019-10-15 | 南京邮电大学 | 面向大数据分析的隐私保护聚类方法及计算机存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112967812A (zh) * | 2021-04-20 | 2021-06-15 | 钟爱健康科技(广东)有限公司 | 一种基于联邦学习的防窃取攻击医疗诊断模型保护方法 |
CN115587385A (zh) * | 2022-10-09 | 2023-01-10 | 九有技术(深圳)有限公司 | 本地化差分隐私与中心化差分隐私结合的数据脱敏方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9720943B2 (en) | Columnar table data protection | |
EP3561636A1 (en) | Record level data security | |
US20110270837A1 (en) | Method and system for logical data masking | |
CN112613065A (zh) | 一种基于差分隐私保护的数据共享方法及装置 | |
CN109117669B (zh) | MapReduce相似连接查询的隐私保护方法及系统 | |
CN113158233B (zh) | 数据预处理方法、装置及计算机存储介质 | |
CN109711186A (zh) | 内存数据库中的数据匿名化 | |
CN104866775A (zh) | 一种金融数据的漂白方法 | |
Karakasidis et al. | Scalable blocking for privacy preserving record linkage | |
CN113343298A (zh) | 基于数据仿真算法的数据脱敏系统 | |
CN113343299A (zh) | Hive数据库动态脱敏系统及实现方法 | |
Tripathy et al. | A fast p-sensitive l-diversity Anonymisation algorithm | |
Prakash et al. | Haphazard, enhanced haphazard and personalised anonymisation for privacy preserving data mining on sensitive data sources | |
Piao et al. | Research on government data publishing based on differential privacy model | |
Tang | Understanding authoritarianism | |
Wang et al. | Multi-dimensional k-anonymity Based on Mapping for Protecting Privacy. | |
Sun et al. | On the identity anonymization of high‐dimensional rating data | |
Han et al. | Blockchain-based differential privacy cost management system | |
EP4170574A1 (en) | Synthesizing user transactional data for de-identifying sensitive information | |
CN116644462A (zh) | 一种数据脱敏方法和系统 | |
Ronqui et al. | Covid-19 Emergency Aid: How the Brazilian Government used Social Big Data Analytics to give economic support and protect vulnerable citizens | |
US12032721B2 (en) | Synthesizing user transactional data for de-identifying sensitive information | |
CN111796929B (zh) | 一种多租户模式下的租户合并方法 | |
Vallarano et al. | Exploring the Bitcoin Mesoscale | |
US20220405417A1 (en) | Sensitive data classification in non-relational databases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |