CN102867022A - 通过部分删除某些项目达到对集合型数据匿名化的系统 - Google Patents

通过部分删除某些项目达到对集合型数据匿名化的系统 Download PDF

Info

Publication number
CN102867022A
CN102867022A CN2012102854695A CN201210285469A CN102867022A CN 102867022 A CN102867022 A CN 102867022A CN 2012102854695 A CN2012102854695 A CN 2012102854695A CN 201210285469 A CN201210285469 A CN 201210285469A CN 102867022 A CN102867022 A CN 102867022A
Authority
CN
China
Prior art keywords
module
dangerous
strong association
rule
association rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012102854695A
Other languages
English (en)
Other versions
CN102867022B (zh
Inventor
朱其立
许信辉
贾枭
潘超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201210285469.5A priority Critical patent/CN102867022B/zh
Publication of CN102867022A publication Critical patent/CN102867022A/zh
Application granted granted Critical
Publication of CN102867022B publication Critical patent/CN102867022B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Storage Device Security (AREA)

Abstract

本发明提供通过部分删除某些项目达到对集合型数据匿名化的系统,其首先对集合型数据集进行预处理;其次利用多轮迭代方法对数据集中危险敏感的强关联规则进行消去并保证删除掉的项目尽量少。具体迭代的实施过程为:不断从数据集中筛选出敏感的强关联规则;从数据集中部分删除该规则中某些项目,以使得该危险敏感的强关联规则变为安全敏感的弱关联规则或不再存在于数据集中,直到最终数据集中不再存在危险敏感的强关联规则即可跳出该迭代过程。系统为了能让该匿名化处理过程以更快的速度进行,该系统结合了分而治之的思想,使得匿名化过程可以通过多个线程并发的执行,在保证不剧烈增加删除项目数目的前提下,匿名化处理过程效率大大提升。

Description

通过部分删除某些项目达到对集合型数据匿名化的系统
技术领域
本发明涉及计算机技术领域的系统框架,具体是通过部分删除某些项目达到对集合型数据匿名化的系统。
背景技术
随着计算机技术的飞快发展和迅速普及,海量的数字信息正在悄无声息地繁殖。无论是政府组织、社会机构,还是公司团体、个人都在不经意间制造并收集着丰富的数据信息。与此同时纷繁的数字信息也给数据分析师和相关科研人员带来了新的契机和挑战。科学家和工程师们通过利用数字信息进行各类统计分析、知识挖掘等活动,形成总结式的认识和规则,引导今后的相关活动和决定、并可做出相关预测,最终加速技术进步、提高人们的生活品质。然而数字信息的传递与流通过程中,必须要慎重考虑安全与隐私问题。集合型数据作为一类颇具价值的数据源,广泛存在于我们的日常生活中,例如超市/网购购物清单、提交搜索引擎搜索关键字等等。但原始集合型数据中存在数据属主的大量隐私信息,如何匿名化集合型数据以实现对数据属主隐私的保护,同时保证匿名化后数据的有效性,成为近些年来研究的热门课题。
目前,过去的研究成果中对集合型数据的匿名化方法多集中使用全局删除和全局泛化方法。Y.Xu(参见Y.Xu,K.Wang,A.W.-C.Fu,and P.S.Yu.Anonymizingtransaction databases for publication KDD 2008)很早就研究了集合型数据匿名化问题,通过使用全局删除非隐私条目的方法保护数据属主的隐私;而J.Cao(参见J.Cao,P.Karras,C.Raissi,and K.-L.Tan.ρ-uncertainty:inference-prooftransaction anonymization VLDB 2010)同时使用了全局删除和全局泛化方法消去数据集中所有危险敏感的强关联规则。但由于全局删除方法使用大量剧烈删除操作,造成信息失真严重;而全局泛化方法不但改变了数据本身的模样,并且使用了并不被数据使用者公认的泛化分类结构。
发明内容
本发明针对现有技术中存在的上述不足,提供了一种通过部分删除某些项目达到对集合型数据进行匿名化的算法,及一整套基于该算法实现的集合型数据匿名化系统框架。在保证尽可能少地删除条目的前提下,确保消去集合型数据中所有的危险敏感的强关联规则。
根据本发明的一个方面,提供一种通过部分删除某些项目达到对集合型数据进行匿名化的系统,包括数据集预处理模块、起到加速匿名化的分治模块、危险敏感的强关联规则筛选模块及通过部分删除方法实现的关联规则消去模块,还包括检测危险敏感的强关联规则存在与否模块和最终结果整合模块,其中:
-数据集预处理模块,用于对原始集合型数据集进行前期处理,包括对数据集的信息统计,对项目的标识符进行正向哈希映射,对记录的排序及对记录的预删除处理;
-危险敏感的强关联规则筛选模块,用于从数据集中筛选出危险敏感的强关联规则;
-关联规则消去模块,用于对危险敏感的强关联规则筛选模块筛选出的敏感的强关联规则,利用部分删除策略使得危险敏感的强关联规则变为安全敏感的弱关联规则或不再存在于数据集中;
-检测危险敏感的强关联规则存在与否模块,用于检查数据集中是否仍然存在危险敏感的强关联规则;
-最终结果整合模块,用于将各个子数据集匿名化的结果进行整合,对项目的标识符进行反向哈希映射,并对整合后结果进行信息统计。
优选地,所述数据集预处理模块对数据集进行信息统计,通过哈希映射对项目的标识符进行简化,再对记录进行排序和可配置的预删除处理,所得预处理结果传递给分治模块或危险敏感的强关联规则筛选模块进行下一步操作。
优选地,还包括分治模块,其中,分治模块用于对数据集进行近似平均的划分,划分成大小近似的若干子数据集,并对各子数据集进行单独匿名化处理。
优选地,所述危险敏感的强关联规则筛选模块通过使用固定大小的缓冲区存储遍历数据集过程中产生出的固定数目的关联规则。
优选地,所述危险敏感的强关联规则筛选模块包括以下装置:
第一处理模块,用于遍历数据集中每一个记录,根据当前记录产生存在于该记录中的关联规则,将该关联规则存储于所述固定大小的缓冲区中,更新记录对应关联规则强弱信息的数据结构;
第二处理模块,用于当缓冲区被填满时,不再往缓冲区增加新的关联规则而只是更新记录缓冲区中关联规则强弱信息的数据结构;
第三处理模块,用于当遍历到长度超过一个固定阈值的记录时,则不再通过第一处理模块和第二处理模块产生关联规则和更新记录关联规则的强弱信息的数据结构,而是通过对整个数据集中包含关联规则中具体项目的记录编号集合直接做交集运算以确定关联规则的强弱;
第四处理模块,用于从缓冲区中筛选出所有危险敏感的强关联规则供关联规则消去模块作下一步处理。
优选地,所述关联规则消去模块对危险敏感的强关联规则进行消去。
优选地,所述关联规则消去模块包括以下装置:
第五处理模块,用于从缓冲区中挑选某一危险敏感的强关联规则进行消去,确定消去该规则应从哪些记录中删除具体的哪个项目;
第六处理模块,用于在通过所述第五处理模块选定的记录中删除选定的项目后,更新记录缓冲区中关联规则强弱信息的数据结构;
第七处理模块,用于当缓冲区中不再存在危险敏感的强关联规则,则进入检测危险敏感的强关联规则存在与否模块;否则回到所述第五处理模块重复操作。
优选地,所述检测危险敏感的强关联规则存在与否模块扫描数据集确定是否仍有危险敏感的强关联规则存在,若存在则回到敏感的强关联规则筛选模块重复新的迭代的过程;否则进入结果整合模块。
优选地,所述最终结果整合模块将各个子数据集匿名化的结果进行整合。
优选地,分治模块的运行前提是保证不剧烈增加删除项目数目。
本发明工作时,先对原始数据集进行信息统计,通过哈希映射对项目的标识符进行简化,再对记录进行排序和预删除处理(可选),所得预处理结果传递给分治模块或危险敏感的强关联规则筛选模块进行下一步操作。分治模块得到预处理的数据集后,进行近似平均的划分,划分成大小近似的若干子数据集,并对各子数据集单独进行随后的匿名化处理。危险敏感的强关联规则筛选模块通过使用固定大小的缓冲区存储遍历数据集过程中产生出的固定数目的关联规则,具体地,其通过子模块(第一处理模块、第二处理模块、第三处理模块、第四处理模块)实现的筛选功能如下:遍历数据集中每一个记录,根据当前记录产生存在于该记录中的关联规则,将该关联规则存储于如上描述的大小固定的缓冲区中,更新记录对应关联规则强弱等信息的数据结构;当缓冲区被填满时,不再往缓冲区增加新的关联规则而只是更新记录缓冲区中关联规则强弱等信息的数据结构;当遍历到长度超过一个固定阈值(算法的一个输入参数)的记录时,通过对整个数据集中包含关联规则中具体项目的记录编号集合直接做交集运算以确定关联规则的强弱;从缓冲区中筛选出所有危险敏感的强关联规则供关联规则消去模块作下一步处理。关联规则消去模块对危险敏感的强关联规则进行消去,具体地,其通过子模块(第五处理模块、第六处理模块、第七处理模块)实现的消去功能如下:从缓冲区中挑选某一危险敏感的强关联规则进行消去,确定消去该规则应从哪些记录中删除具体的哪个项目;在从选定的记录中删除选定的项目后,更新记录缓冲区中关联规则强弱等信息的数据结构;若缓冲区中不再存在危险敏感的强关联规则,则进入检测危险敏感的强关联规则存在与否模块;否则继续处理缓冲区中的危险敏感的强关联规则。检测危险敏感的强关联规则存在与否模块扫描数据集确定是否仍有危险敏感的强关联规则存在,若存在则回到敏感的强关联规则筛选模块重复新的迭代的过程;否则进入最终结果整合模块。而最终结果整合模块将各个子数据集匿名化的结果进行最终整合。
与现有技术相比,本发明创造性的使用了部分删除条目的方法对集合型数据进行匿名化,弥补了现有全局删除和全局泛化的集合型数据匿名化方法的缺陷和不足。本发明引入一定大小的缓冲区来存储数目巨大的关联规则,使用迭代法不断消去危险关联规则,引入分而治之的思想通过多线程技术加速匿名化的处理过程,并将短记录与长记录区别处理,还提供了预删除处理的选项,使得该算法正确高效地完成了集合型数据的匿名化,并极大程度地保持了剩余数据的使用价值。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出本发明的系统框架模块框图;
图2示出本发明的数据集预处理模块和分治模块的实施细节;
图3示出本发明的危险敏感的强关联规则筛选模块中关联规则的生成细节;
图4示出本发明的关联规则消去模块消去敏感规则的实施细节。
具体实施方式
下面结合附图对本发明的实施例作详细说明,本实施例在以发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
本实施例的任务是对一简化集合型数据集进行匿名化,该数据集为记录一(a)、记录二(a,b)、记录三(a,d,c)、记录四(b,c)、记录五(d),其中项目a、c、d为隐私条目,仅项目b为非隐私条目,且要求对该数据集匿名化后的结果中所有敏感关联规则的置信度(confidence)不高于0.5。
如图1所示,本实施例包括6个模块:数据集预处理模块、起到加速匿名化的分治模块、危险敏感的强关联规则筛选模块及通过部分删除方法实现的关联规则消去模块,还包括检测危险敏感的强关联规则存在与否的模块和最终结果整合模块。所述数据集预处理模块,用于对原始集合型数据集进行前期处理,包括对数据集的信息统计,对项目的标识符进行正向哈希映射,对记录的排序及对记录的预删除处理等。所述分治模块,用于对数据集进行近似平均的划分,划分成大小近似的若干子数据集,并对各子数据集进行单独匿名化处理。所述危险敏感的强关联规则筛选模块,用于从数据集中筛选出危险敏感的强关联规则。所述关联规则消去模块,利用部分删除策略使得危险敏感的强关联规则变为“安全”敏感的弱关联规则或不再存在于数据集中。所述检测危险敏感的强关联规则存在与否的模块,检查数据集中是否仍然存在危险敏感的强关联规则。所述最终结果整合模块,用于将各个子数据集匿名化的结果进行整合,对项目的标识符进行反向哈希映射,并对整合后结果进行信息统计等。
在本实施例的一个优选例中,所述分治模块可以被省略。
如图2所示,数据集预处理模块首先将原始项目编号经哈希映射后映射到简易的整数编号,再将数据集中的记录按照记录长度递增序进行排序。随后分治模块将数据集划分成大小近似的两个子数据集,等待紧接着的其它模块分别对两个子数据集进行处理。图2省略了预处理模块中对数据集进行信息统计的结果展示。
如图3所示,危险敏感的强关联规则筛选模块分别对两个子数据集进行处理,筛选出各子数据集中的敏感的关联规则。具体敏感关联规则的生成和对应置信度的计算参照“发明内容”部分中敏感的强关联规则筛选模块的描述。
如图4所示,关联规则消去模块不断从缓冲区中挑选某一危险敏感的强关联规则进行消去,确定消去该规则应从哪些记录中删除具体的哪个项目;在从选定的记录中删除选定的项目后,更新记录缓冲区中关联规则强弱等信息的数据结构;若缓冲区中不再存在危险敏感的强关联规则,则进入检测危险敏感的强关联规则存在与否模块。
对各子数据集分别进行匿名化过程后,利用结果整合模块,将各个子数据集匿名化的结果进行整合,对项目的标识符进行反向哈希映射,并对整合后结果进行信息统计等。这样就完成了对原始数据集的匿名化任务。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (10)

1.一种通过部分删除某些项目达到对集合型数据匿名化的系统,其特征在于,包括数据集预处理模块、起到加速匿名化的分治模块、危险敏感的强关联规则筛选模块及通过部分删除方法实现的关联规则消去模块,还包括检测危险敏感的强关联规则存在与否模块和最终结果整合模块,其中:
-数据集预处理模块,用于对原始集合型数据集进行前期处理,包括对数据集的信息统计,对项目的标识符进行正向哈希映射,对记录的排序及对记录的预删除处理;
-危险敏感的强关联规则筛选模块,用于从数据集中筛选出危险敏感的强关联规则;
-关联规则消去模块,用于对危险敏感的强关联规则筛选模块筛选出的敏感的强关联规则,利用部分删除策略使得危险敏感的强关联规则变为安全敏感的弱关联规则或不再存在于数据集中;
-检测危险敏感的强关联规则存在与否模块,用于检查数据集中是否仍然存在危险敏感的强关联规则;
-最终结果整合模块,用于将各个子数据集匿名化的结果进行整合,对项目的标识符进行反向哈希映射,并对整合后结果进行信息统计。
2.根据权利要求1所述的通过部分删除某些项目达到对集合型数据匿名化的系统,其特征在于,所述数据集预处理模块对数据集进行信息统计,通过哈希映射对项目的标识符进行简化,再对记录进行排序和可配置的预删除处理,所得预处理结果传递给分治模块或危险敏感的强关联规则筛选模块进行下一步操作。
3.根据权利要求1所述的通过部分删除某些项目达到对集合型数据匿名化的系统,其特征在于,还包括分治模块,其中,分治模块用于对数据集进行近似平均的划分,划分成大小近似的若干子数据集,并对各子数据集进行单独匿名化处理。
4.根据权利要求1所述的通过部分删除某些项目达到对集合型数据匿名化的系统,其特征在于,所述危险敏感的强关联规则筛选模块通过使用固定大小的缓冲区存储遍历数据集过程中产生出的固定数目的关联规则。
5.根据权利要求4所述的通过部分删除某些项目达到对集合型数据匿名化的系统,其特征在于,所述危险敏感的强关联规则筛选模块包括以下装置:
第一处理模块,用于遍历数据集中每一个记录,根据当前记录产生存在于该记录中的关联规则,将该关联规则存储于所述固定大小的缓冲区中,更新记录对应关联规则强弱信息的数据结构;
第二处理模块,用于当缓冲区被填满时,不再往缓冲区增加新的关联规则而只是更新记录缓冲区中关联规则强弱信息的数据结构;
第三处理模块,用于当遍历到长度超过一个固定阈值的记录时,则不再通过第一处理模块和第二处理模块产生关联规则和更新记录关联规则的强弱信息的数据结构,而是通过对整个数据集中包含关联规则中具体项目的记录编号集合直接做交集运算以确定关联规则的强弱;
第四处理模块,用于从缓冲区中筛选出所有危险敏感的强关联规则供关联规则消去模块作下一步处理。
6.根据权利要求1所述的通过部分删除某些项目达到对集合型数据匿名化的系统,其特征在于,所述关联规则消去模块对危险敏感的强关联规则进行消去。
7.根据权利要求6所述的通过部分删除某些项目达到对集合型数据匿名化的系统,其特征在于,所述关联规则消去模块包括以下装置:
第五处理模块,用于从缓冲区中挑选某一危险敏感的强关联规则进行消去,确定消去该规则应从哪些记录中删除具体的哪个项目;
第六处理模块,用于在通过所述第五处理模块选定的记录中删除选定的项目后,更新记录缓冲区中关联规则强弱信息的数据结构;
第七处理模块,用于当缓冲区中不再存在危险敏感的强关联规则,则进入检测危险敏感的强关联规则存在与否模块;否则回到所述第五处理模块重复操作。
8.根据权利要求1所述的通过部分删除某些项目达到对集合型数据匿名化的系统,其特征在于,所述检测危险敏感的强关联规则存在与否模块扫描数据集确定是否仍有危险敏感的强关联规则存在,若存在则回到敏感的强关联规则筛选模块重复新的迭代的过程;否则进入结果整合模块。
9.根据权利要求1所述的通过部分删除某些项目达到对集合型数据匿名化的系统,其特征在于,所述最终结果整合模块将各个子数据集匿名化的结果进行整合。
10.根据权利要求2所述的通过部分删除某些项目达到对集合型数据匿名化的系统,其特征在于,分治模块的运行前提是保证不剧烈增加删除项目数目。
CN201210285469.5A 2012-08-10 2012-08-10 通过部分删除某些项目达到对集合型数据匿名化的系统 Expired - Fee Related CN102867022B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210285469.5A CN102867022B (zh) 2012-08-10 2012-08-10 通过部分删除某些项目达到对集合型数据匿名化的系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210285469.5A CN102867022B (zh) 2012-08-10 2012-08-10 通过部分删除某些项目达到对集合型数据匿名化的系统

Publications (2)

Publication Number Publication Date
CN102867022A true CN102867022A (zh) 2013-01-09
CN102867022B CN102867022B (zh) 2015-01-14

Family

ID=47445891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210285469.5A Expired - Fee Related CN102867022B (zh) 2012-08-10 2012-08-10 通过部分删除某些项目达到对集合型数据匿名化的系统

Country Status (1)

Country Link
CN (1) CN102867022B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361123A (zh) * 2014-12-03 2015-02-18 中国科学技术大学 一种个人行为数据匿名化方法及系统
CN105574087A (zh) * 2015-12-10 2016-05-11 天津海量信息技术有限公司 依据数据关联规则的必要条件分析方法
WO2017092696A1 (zh) * 2015-12-02 2017-06-08 中国银联股份有限公司 不泄露隐私的大数据安全融合方法
US20180012039A1 (en) * 2015-01-27 2018-01-11 Ntt Pc Communications Incorporated Anonymization processing device, anonymization processing method, and program
WO2019180599A1 (en) * 2018-03-19 2019-09-26 International Business Machines Corporation Data anonymization
CN112765659A (zh) * 2021-01-20 2021-05-07 丁同梅 针对大数据云服务的数据泄露防护方法及大数据服务器
CN113474778A (zh) * 2019-02-26 2021-10-01 日本电信电话株式会社 匿名化装置、匿名化方法、程序
CN114039990A (zh) * 2021-11-01 2022-02-11 上海交通大学 不经意访问存储系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3591561A1 (en) 2018-07-06 2020-01-08 Synergic Partners S.L.U. An anonymized data processing method and computer programs thereof

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101834872A (zh) * 2010-05-19 2010-09-15 天津大学 基于度优先的K-Anonymity匿名算法的数据处理方法
WO2010127216A2 (en) * 2009-05-01 2010-11-04 Telcodia Technologies, Inc. Automated determination of quasi-identifiers using program analysis
CN102156755A (zh) * 2011-05-06 2011-08-17 天津大学 一种k-匿名改进方法
CN102542209A (zh) * 2010-12-21 2012-07-04 日电(中国)有限公司 数据匿名方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010127216A2 (en) * 2009-05-01 2010-11-04 Telcodia Technologies, Inc. Automated determination of quasi-identifiers using program analysis
CN101834872A (zh) * 2010-05-19 2010-09-15 天津大学 基于度优先的K-Anonymity匿名算法的数据处理方法
CN102542209A (zh) * 2010-12-21 2012-07-04 日电(中国)有限公司 数据匿名方法和系统
CN102156755A (zh) * 2011-05-06 2011-08-17 天津大学 一种k-匿名改进方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
王智慧等: "一种基于聚类的数据匿名方法", 《软件学报》, vol. 21, no. 4, 30 April 2010 (2010-04-30), pages 680 - 693 *
胡新平等: "基于敏感元组的隐私数据保护方法", 《东南大学学报(自然科学版)》, vol. 40, no. 5, 30 September 2010 (2010-09-30), pages 911 - 916 *
许信辉等: "一种集合型数据匿名化的部分删除策略", 《计算机工程》, vol. 39, no. 11, 30 November 2013 (2013-11-30), pages 139 - 142 *
韩建民等: "面向敏感值的个性化隐私保护", 《电子学报》, vol. 38, no. 7, 31 July 2010 (2010-07-31), pages 1723 - 1728 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361123A (zh) * 2014-12-03 2015-02-18 中国科学技术大学 一种个人行为数据匿名化方法及系统
CN104361123B (zh) * 2014-12-03 2017-11-03 中国科学技术大学 一种个人行为数据匿名化方法及系统
US20180012039A1 (en) * 2015-01-27 2018-01-11 Ntt Pc Communications Incorporated Anonymization processing device, anonymization processing method, and program
WO2017092696A1 (zh) * 2015-12-02 2017-06-08 中国银联股份有限公司 不泄露隐私的大数据安全融合方法
CN105574087A (zh) * 2015-12-10 2016-05-11 天津海量信息技术有限公司 依据数据关联规则的必要条件分析方法
CN105574087B (zh) * 2015-12-10 2018-12-07 天津海量信息技术股份有限公司 依据数据关联规则的必要条件分析方法
GB2586716A (en) * 2018-03-19 2021-03-03 Ibm Data anonymization
CN111868727A (zh) * 2018-03-19 2020-10-30 国际商业机器公司 数据匿名化
WO2019180599A1 (en) * 2018-03-19 2019-09-26 International Business Machines Corporation Data anonymization
US11106820B2 (en) 2018-03-19 2021-08-31 International Business Machines Corporation Data anonymization
GB2586716B (en) * 2018-03-19 2022-10-12 Ibm Data anonymization
CN113474778A (zh) * 2019-02-26 2021-10-01 日本电信电话株式会社 匿名化装置、匿名化方法、程序
CN113474778B (zh) * 2019-02-26 2024-02-20 日本电信电话株式会社 匿名化装置、匿名化方法、计算机可读取的记录介质
CN112765659A (zh) * 2021-01-20 2021-05-07 丁同梅 针对大数据云服务的数据泄露防护方法及大数据服务器
CN112765659B (zh) * 2021-01-20 2021-09-21 曙光星云信息技术(北京)有限公司 针对大数据云服务的数据泄露防护方法及大数据服务器
CN114039990A (zh) * 2021-11-01 2022-02-11 上海交通大学 不经意访问存储系统
CN114039990B (zh) * 2021-11-01 2022-07-29 上海交通大学 不经意访问存储系统

Also Published As

Publication number Publication date
CN102867022B (zh) 2015-01-14

Similar Documents

Publication Publication Date Title
CN102867022B (zh) 通过部分删除某些项目达到对集合型数据匿名化的系统
US20120323919A1 (en) Distributed reverse semantic index
US10496760B2 (en) Partitioned joins in analytical databases
Amato et al. Towards automatic generation of hardware classifiers
CN104951512A (zh) 一种基于互联网的舆情数据采集方法及系统
CN103761337B (zh) 非结构化数据处理方法及系统
CN111913860B (zh) 一种操作行为分析方法及装置
US20190149344A1 (en) Intelligent search system for service cost and method thereof
CN107967347A (zh) 批量数据处理方法、服务器、系统及存储介质
CN108389394B (zh) 车辆初次入城分析的方法及系统
CN102314449B (zh) 后置数据访问过滤器和过滤方法
Galanopoulos et al. Attention mechanisms, signal encodings and fusion strategies for improved ad-hoc video search with dual encoding networks
CN103136372A (zh) 网络可信性行为管理中url快速定位、分类和过滤方法
CN112000773A (zh) 基于搜索引擎技术的数据关联关系挖掘方法及应用
CN105095436A (zh) 数据源数据自动建模方法
CN108197474A (zh) 移动终端应用的分类和检测方法
Chen et al. Evaluating temporal queries over video feeds
CN108369584A (zh) 信息处理系统、函数创建方法和函数创建程序
CN104750853A (zh) 一种异构数据搜索方法及装置
CN100362520C (zh) 一种专用集成电路综合系统及方法
CN102955778B (zh) 一种网络社区数据的快速查找方法及系统
JP2013041385A (ja) 文献検索方法、文献検索装置及び文献検索プログラム
CN102045158A (zh) 一种隐蔽信道标识方法
KR101600275B1 (ko) 실시간 빅 데이터 이벤트 처리 시스템
Fang et al. A hybrid detection method for android malware

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150114

Termination date: 20170810