CN110008744A - 数据脱敏方法和相关装置 - Google Patents

数据脱敏方法和相关装置 Download PDF

Info

Publication number
CN110008744A
CN110008744A CN201910241311.XA CN201910241311A CN110008744A CN 110008744 A CN110008744 A CN 110008744A CN 201910241311 A CN201910241311 A CN 201910241311A CN 110008744 A CN110008744 A CN 110008744A
Authority
CN
China
Prior art keywords
mark
data
sequence
dictionary
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910241311.XA
Other languages
English (en)
Other versions
CN110008744B (zh
Inventor
高勇
董晓琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910241311.XA priority Critical patent/CN110008744B/zh
Publication of CN110008744A publication Critical patent/CN110008744A/zh
Priority to PCT/CN2019/102746 priority patent/WO2020192007A1/zh
Application granted granted Critical
Publication of CN110008744B publication Critical patent/CN110008744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供数据脱敏方法和相关装置,其中,方法包括:确定第一数据对应的数据字典和脱敏密钥,数据字典包括数据序列和第一标识序列的对应关系,数据序列中的数据对应第一标识序列中的标识;根据数据字典确定与第一数据对应的第一标识;根据脱敏密钥确定标识字典,标识字典包括第一标识序列和第二标识序列的对应关系,第二标识序列为对第一标识序列进行重排序得到的序列,第二标识序列中的标识对应第一标识序列中的标识;根据标识字典在第二标识序列中确定与第一标识对应的第二标识;根据数据字典确定与第二标识对应的第二数据,并将第二数据确定为第一数据对应的脱敏数据。该方案可同时兼顾未脱敏数据的安全性和脱敏数据的可还原性。

Description

数据脱敏方法和相关装置
技术领域
本发明涉及信息安全技术领域,尤其数据脱敏方法和相关装置。
背景技术
数据脱敏,又称数据漂白、数据去隐私化或数据变形,是指对某些敏感信息按照一定规则进行数据的变形,使得数据变换为另一个数据,以实现对敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的场景下,在不违反系统规则条件下,在利用真实数据进行改造并提供测试使用时需要对如身份证号、手机号、卡号、客户号等个人信息进行数据脱敏后才能使用。
数据脱敏按脱敏规则划分可分为可恢复脱敏与不可恢复脱敏。其中,可恢复脱敏是指脱敏后的数据通过一定的方式,可以恢复成原来的敏感数据;不可恢复脱敏是指脱敏后的数据被脱敏的部分使用任何方式都不能恢复出。目前,数据脱敏一般是通过建立一个数据字典,然后根据该数据字典进行一定的映射,得到脱敏后的数据。一种方式是根据数据字典随机映射,这种方式即为不可恢复脱敏,但存在的问题在于进行随机脱敏后的数据无法还原为原始数据;另一种方式是根据数据字典按照一定的映射规则进行映射,这种方式为可恢复脱敏,但存在的问题在于映射关系容易被获知的风险,安全性不足。
发明内容
本发明实施例提供数据脱敏方法和相关装置,解决目前的脱敏方法无法兼顾数据还原和数据安全的问题。
第一方面,提供一种数据脱敏方法,包括:
确定第一数据对应的数据字典和脱敏密钥,所述第一数据为待脱敏的数据,所述数据字典包括数据序列和第一标识序列的对应关系,所述数据序列包括多个数据,所述第一标识序列包括多个标识,所述数据序列中的一个标识对应所述第一标识序列中的一个数据,所述数据脱敏密钥包括至少一个所述第一标识序列中的标识;
根据所述数据字典在所述第一标识序列中确定与所述第一数据对应的第一标识;
根据所述脱敏密钥确定标识字典,所述标识字典包括所述第一标识序列和第二标识序列的对应关系,所述第二标识序列为根据所述脱敏密钥中的标识对所述第一标识序列进行重排序得到的序列,所述第二标识序列中的一个标识对应所述第一标识序列中的一个标识;
根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识;
根据所述数据字典确定在所述数据序列中与所述第二标识对应的第二数据,并将所述第二数据确定为所述第一数据对应的脱敏数据。
该技术方案通过根据数据脱敏密钥确定标识字典,然后利用数据字典和标识字典对数据进行多次映射得到脱敏后的数据,在标识字典中对标识的映射相当于打乱了数据与数据之间的映射顺序,使得映射具备随机映射的特性,其他人根据脱敏后的数据无法推导出映射关系,保证了数据的安全性,由于是通过数据脱敏密钥中的标识得到标识字典,那么根据脱敏密钥可确定标识字典,然后根据逆向的映射过程,可以对脱敏后的数据进行还原,保证了脱敏后的数据的可还原性,即,该技术方案的数据脱敏方案可同时兼顾数据的安全性和脱敏数据的可还原性。
结合第一方面,在一种可能的实现方式中,所述脱敏密钥包括m个标识,所述标识字典包括M个子标识字典,所述M个子标识字典由可重复排列的m个子标识字典排列组合得到,所述m个子标识字典分别为根据所述m个标识确定的子标识字典,m、M均为正整数,M大于或等于m;所述M个子标识字典中的第i个子标识字典包括所述第一标识序列和第i标识序列的对应关系,所述第i标识序列为对所述第一标识序列进行重排序得到的序列,所述第i标识序列中的一个标识对应所述第一标识序列中的一个标识,i为正整数,i大于或等于1并且小于或等于M;所述根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识,包括:根据所述第i个子标识字典在所述第i标识序列中确定与所述第i标识对应的第(i+1)标识,其中,当i=1时,所述第i标识为所述第一标识;将第M标识序列中的第(M+1)标识确定为所述第二标识。通过根据脱敏密钥中的多个标识,分别确定多个子标识字典,多个子标识字典经过可重复性地排列组合得到标识字典,依次利用标识字典中的子标识字典对标识进行多次映射,进一步打乱了数据与数据之间的映射关系,提高了安全性。
结合第一方面,在一种可能的实现方式中,所述第i个子标识字典为根据所述脱敏密钥中的第j个标识确定的子标识字典,j为正整数,j大于或等于1并且小于或等于m;其中,M=m,i=j,或者,M=2m-1,
结合第一方面,在一种可能的实现方式中,所述第i标识序列为对所述第一标识序列进行按顺序移位得到的序列,并且,所述第j个标识在所述第i个子标识字典的第i标识序列中位于第k位,k为大于或等于1并且小于或等于N的任一正整数,N等于所述第一标识序列中的标识的个数。标识字典中的除第一标识序列外的另一个标识序列为对第一标识序列进行按顺序移位的序列,起到了更改标识序列中的标识的顺序的作用,将一个标识固定在一个固定位置,建立其标识与某个移序后的标识序列之间的对应关系。
结合第一方面,在一种可能的实现方式中,所述确定第一数据对应的数据字典和脱敏密钥之后,包括:确定所述M个子标识字典中的第A个子标识字典,所述第A个子标识字典为根据所述脱敏密钥中的第a个标识确定的子标识字典,B为所述第一数据在待脱敏的数据整体中的排列顺序,所述数据整体包括至少两个数据,a和n均为正整数,N等于所述第一标识序列中的标识的个数;根据所述第A个子标识字典确定第A标识序列中的第三标识,所述第三标识在所述第A标识序列中位于所述第a个标识的后一位;在所述脱敏密钥中将所述第a个标识替换为所述第三标识;将替换得到的脱敏密钥确定为所述第一数据的下一个数据对应的脱敏密钥。按照一定的规则将前一个数据对应的脱敏密钥中的标识进行替换,得到后一个数据对应的脱敏密钥,则在对数据脱敏的过程中,仅需一个脱敏密钥即可实现数据脱敏,每个数据采用不同的脱敏密钥对其进行脱敏,增大了其他用户获知脱敏采用的映射关系的难度,增强了数据脱敏的安全性。
第二方面,提供一种数据脱敏装置,包括:
字典密钥确定模块,用于确定第一数据对应的数据字典和脱敏密钥,所述第一数据为待脱敏的数据所述数据字典包括数据序列和第一标识序列的对应关系,所述数据序列包括多个数据,所述第一标识序列包括多个标识,所述数据序列中的一个数据对应所述第一标识序列中的一个标识,所述脱敏密钥包括至少一个所述第一标识序列中的标识;
第一标识确定模块,用于根据所述数据字典确定在所述第一标识序列中确定与所述第一数据对应的第一标识;
标识字典确定模块,用于根据所述脱敏密钥确定标识字典,所述标识字典包括所述第一标识序列和第二标识序列的对应关系,所述第二标识序列为根据所述脱敏密钥中的标识对所述第一标识序列进行重排序得到的序列,所述第二标识序列中的一个标识对应所述第一标识序列中的一个标识;
第二标识确定模块,用于根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识;
脱敏数据确定模块,用于根据所述数据字典在所述数据序列中确定与所述第二标识对应的第二数据,并将所述第二数据确定为所述第一数据对应的脱敏数据。
第三方面,提供另一种数据脱敏装置,包括处理器、存储器以及输入输出接口,所述处理器、存储器和输入输出接口相互连接,其中,所述输入输出接口用于输入或输出数据,所述存储器用于存储数据脱敏装置执行上述方法的应用程序代码,所述处理器被配置用于执行上述第一方面的方法。
第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
通过根据数据脱敏密钥确定标识字典,然后利用数据字典和标识字典对数据进行多次映射得到脱敏后的数据,在标识字典中对标识的映射相当于打乱了数据字典原始的映射顺序,使得映射具备随机映射的特性,其他人根据脱敏后的数据无法推导出映射关系,保证了数据的安全性,由于是通过数据脱敏密钥中的标识得到标识字典,那么根据脱敏密钥可确定标识字典,然后根据逆向的映射过程,可以对脱敏后的数据进行还原,保证了脱敏后的数据的可还原性,即,该技术方案的数据脱敏方案可同时兼顾数据的安全性和脱敏数据的可还原性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种数据脱敏方法的流程示意图;
图2是本发明实施例提供的一种数据与标识的变换的示意图;
图3是本发明实施例提供的一种映射示意图;
图4是本发明实施例提供的一种数据脱敏装置的组成结构示意图;
图5是本发明实施例提供的另一种数据脱敏装置的组成结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例的方案可以应用于金融公司、政府单位、医院、银行等各个行业中需要利用敏感数据进行数据挖掘、数据分析等使用敏感数据的场景中。在这些场景中,在利用敏感数据进行数据挖掘或数据分析之前,需要对这些敏感数据进行数据脱敏,以防止敏感数据泄露。例如,本发明实施例的方案具体可应用于社保数据中心需要将社保数据提供给外包开发人员进行社保系统的开发和测试,在这种场景下,需要将社保数据进行数据脱敏后提供给外包开发人员。又如,本发明实施例的方案具体还可应用于运营商将客户信息、通话记录等业务数据提供给如监察机构、公安机关、政府部门等不同身份的访问者,运营商需要根据不同身份的用户配置不同的数据脱敏规则以满足其不同的需求。本发明实施例中,敏感数据包括但不限于姓名、身份证号码、居住地址、电话号码、银行账号、邮箱地址、所属城市、邮编、各种密码(如账户查询密码、取款密码、登录密码等)、组织机构名称、营业执照号码、银行账号、交易日期、交易金额等于用户主体或用户主体的行为有关的数据。
以下介绍发明实施例的技术方案。
参见图1,图1是本发明实施例提供的一种数据脱敏方法的流程示意图,如图所示,该方法包括如下步骤:
S101,确定第一数据对应的数据字典和脱敏密钥,第一数据为待脱敏的数据,数据字典包括数据序列和第一标识序列,数据序列包括多个数据,第一标识序列包括多个标识,数据序列中的一个数据对应第一标识序列中的一个标识。
这里,第一数据对应的数据字典为与第一数据所属的类型或类别相对应的数据字典,数据序列包括该第一数据所属的类型或类别对应的所有可能的数据。其中,第一数据所属的类型或类别具体是指当前待脱敏的数据具体是什么类型或类别的数据。例如,当前待脱敏的数据为身份证号码,则第一数据所属的类型或类别为身份证号码,数据序列包括身份证号码对应的所有可能的数据,即第一数据字典包括0至9中的每一个数字以及X。又如,当前待脱敏的数据为邮箱地址,则第一数据所属的类型或类别为邮箱地址,数据序列包括邮箱地址对应的所有可能的数据,即数据序列包括0至9中的每一个数字、A至Z和a至z中的每一个英文字母以及邮箱地址可能用到的其他字符,如“.”、“/”等字符。
这里,第一标识序列为根据第一数据序列中的数据的个数和类型所设置的个数与该数据序列中的数据的个数相同的,并且,类型与第一数据序列中的数据的类型相同或不同的标识的组合。例如,数据序列包括身份证号码对应的所有可能的数据,即第一数据字典包括0至9中的每一个数字以及X,则第一标识序列可以为由英文字母a至k组成的序列,第一标识序列也可以为数字0至9以及X组成的序列。本发明实施例中,第一标识序列中的标识可以包括与脱敏任务相关的和/或与脱敏操作人员相关的所有的可能的标识。例如,第一标识序列中的标识包括脱敏任务的任务号对应的所有可能的标识,假设脱敏任务的任务号由0至9中的任一数字以及A和B两个字母组成,则第一标识序列中的标识可以包括0至9中的每一个数字以及A和B两个字母。又如,第一标识序列中的标识也包括脱敏操作人员的工号对应的所有可能的标识,假设脱敏操作人员的工号由0至9中的任一数字组成,则第一标识序列中的标识可以包括0至9中的每一个数字。又如,第一标识序列中的标识序列包括脱敏任务的任务号对应的所有可能的标识和脱敏操作人员的工号对应的所有可能的标识,假设脱敏任务的任务号由0至9中的任一数字以及A和B两个字母组成,脱敏操作人员的工号由0至9中的任一数字组成,则第一标识序列中的数据标识可以包括0至9中的每一个数据以及A和B两个字母。不限于这里的描述。
这里,脱敏密钥由第一标识序列中的至少一个标识组成。在一种可能的实施方式中,该脱敏密钥可以为与脱敏任务相关的某一个账号或者号码或者标识或编号。例如,脱敏密钥可以为脱敏任务的任务号,或者,脱敏密钥可以为执行当前脱敏任务的脱敏操作人员的工号、脱敏编号,或者,第一脱敏密钥可以为脱敏任务的任务号与执行当前脱敏任务的脱敏操作人员的工号、脱敏编号。
以下举例来对第一数据、第一数据对应的数据字典和脱敏密钥进行说明。例如,当前执行的脱敏任务为对用户的电话号码进行数据脱敏,脱敏任务的编号为0x001,当前执行脱敏任务的脱敏操作人员的工号为bj856,脱敏任务编号的格式为“0x+数字编号”,脱敏操作人员的工号格式为“bj+数字编号”,电话号码由数字组成,则第一数据为用户的电话号码中的一个数据,第一数据对应的数据字典中如图2中的A所示,其中,图2中A的左边一列(数据)为数据序列,第一数据序列由电话号码所有可能的数字组成,右边一列(标识1)为第一标识序列,第一标识序列由脱敏任务编号中的数字编号的所有可能的数字或者脱敏操作人员的工号中的数字编号的所有可能的数字组成。第一脱敏密钥可以为“001”或“856”,当第一脱敏密钥为“001”时,第一脱敏密钥与脱敏任务的脱敏任务编号相关,第一脱敏密钥可以用于表示脱敏任务的任务编号;当第一脱敏密钥为“856”时,第一脱敏密钥与当前执行脱敏任务的脱敏操作人员的工号相关,其第一脱敏密钥可以用于表示当前执行脱敏任务的脱敏操作人员的工号。
具体实现中,可以针对脱敏场景中涉及的数据类别预设一个或多个数据字典,使得该一个或多个数据字典中的第一数据序列中的数据能够涵盖该数据类别可能存在的所有数据,并保存数据类别与数据字典之间的对应关系。在进行数据脱敏时,可根据第一数据所属的类别或类型确定与第一数据对应的数据字典,然后根据该第一数据在当前待脱敏的所有数据中的排列顺序确定第一数据对应的第一脱敏密钥。
S102,根据数据字典在第一标识序列中确定与第一数据对应的第一标识。
例如,数据字典如图2中的A所示,第一数据为3,可根据数据字典确定在第一标识序列(标识1)中确定3为与数据“3”对应的第一标识。
S103,根据脱敏密钥确定标识字典,标识字典包括第一标识序列和第二标识序列的对应关系,第二标识序列为根据脱敏密钥中的标识对第一标识序列进行重排序得到的序列,第二标识序列中的一个标识对应第一标识序列中的一个标识。
这里,对第一标识序列中的标识进行重排序是指将第一标识序列中的标识在第一标识序列中的顺序进行变化和调整,使得这些标识在变化后的标识序列中的排列顺序与在第一标识序列中的排列顺序不同,即对第一标识序列进行重排序得到的序列中包含的标识与第一标识序列中包含的标识的内容和个数相同,标识在对第一标识序列进行重排序得到的序列中的顺序和标识在第一标识序列中的顺序不同。
例如,第一标识序列如图2中的A的右边一列所示,则对第一标识序列中的标识进行重排序后的标识序列可以如图2中的B所示。对比图2中的B和A可知,B中的标识的排列顺序相对于A中的标识的排列顺序发生了变化。
本发明实施例中,标识字典可以由脱敏密钥对应的一个或多个子标识字典组成,脱敏密钥对应的子标识字典的个数可以与脱敏密钥包含的标识的个数有关。以下具体介绍根据脱敏密钥确定标识字典的方式。
根据脱敏密钥确定标识字典可以分为以下两个步骤:
步骤一、确定脱敏密钥中的各个标识对应的子标识字典。以脱敏密钥包括m个标识为例,m为正整数,m大于或等于1。由于脱敏密钥包括m个标识,则根据脱敏密钥中的m个标识确定的子标识字典有m个,即首先确定m个标识各自对应的m个子标识字典。
在一种可行的实施方式中,可以根据预设的重排序规则和脱敏密钥中的m个标识分别对第一标识序列进行重排序,得到脱敏密钥中的m个标识各自对应的m个重排序标识序列,然后将第一标识序列分别与脱敏密钥中的m个标识各自对应的m个重排序标识序列组成脱敏密钥中的m个标识各自对应的m个子标识字典。
具体地,预设的重排序规则可以有多种。在一种具体实现方式中,预设的重排序规则可以为对第一标识序列进行按顺序移位,使得目标标识在移位得到的重排序标识序列中处于第k位,k为大于或等于1并且小于或等于N的任一正整数,N为第一标识序列中标识的个数。这里,目标标识是要确定与其相对应的重排序标识序列的标识。
举例进行说明,例如,脱敏密钥为856,第一标识序列如图2中的A的右边一列数据所示,则根据预设的重排序规则和脱敏密钥中的m个标识分别对第一标识序列进行重排序,得到脱敏密钥中的m个标识各自对应的m个重排序标识序列的过程如下:
1、将第一标识序列中的标识进行按顺序移位,使得脱敏密钥中的标识“8”在移位后的序列中位于第1位,移位后的序列如图2中的B所示,图2中的B所示的序列即为标识“8”对应的重排序标识序列。
2、将第一标识序列中的标识进行按顺序移位,使得脱敏密钥中的标识“5”在移位后的序列中位于第1位,移位后的序列如图2中的C所示,图2中的C所示的序列即为标识“5”对应的重排序标识序列。
3、将第一标识序列中的标识进行按顺序移位,使得脱敏密钥中的标识“6”在移位后的序列中位于第1位,移位后的序列如图2中的D所示,图2中的D所示的序列即为标识“6”对应的重排序标识序列。
进一步地,将第一标识序列分别与脱敏密钥中的m个标识各自对应的m个重排序标识序列组成脱敏密钥中的m个标识各自对应的m个子标识字典的过程可以如下:
1、将第一标识序列与标识“8”对应的重排序标识序列组成标识“8”对应的子标识字典,“8”对应的子标识字典如图2中的E所示。
2、将第一标识序列与标识“5”对应的重排序标识序列组成标识“5”对应的子标识字典,“5”对应的子标识字典如图2中的F所示。
3、将第一标识序列与标识“6”对应的重排序标识序列组成标识“6”对应的子标识字典,“6”对应的子标识字典如图2中的G所示。
在另一种具体实现方式中,重排序规则还可以为在第一标识序列中将目标标识与位于第h位的标识进行替换,得到目标标识对应的重排序标识序列,h为大于或等于1并且小于或等于N的任一正整数。
在另一种可行的实施方式中,也可以事先根据预设的重排序规则和第一标识序列中的N个标识为第一标识序列中的N个标识设置与其相对应的N个重排序标识序列,然后分别建立N个重排序标识序列与第一标识序列中的N个标识之间的对应关系,其中,N为第一标识序列中的标识的总个数。在根据脱敏密钥确定标识字典时,根据N个重排序标识序列与N个标识之间的对应关系,以及,脱敏密钥中的m个标识,确定与脱敏密钥中的m个标识相对应的m个重排序标识序列,然后将第一标识序列分别与脱敏密钥中的m个标识对应的重排序标识序列组成m个子标识字典。
步骤二、按照预设的排列组合规则将m个标识各自对应的m个子标识字典进行可重复性地排列和组合,以得到标识字典。将m个子标识字典进行可重复性地排列和组合所得到的标识字典包括M个子标识字典,M为正整数,M大于或等于m。该M个子标识字典中的第i个子标识字典包括第一标识序列和第i标识序列,该第i标识序列为该第i个子标识字典对应的标识所对应的重排序标识序列,i为正整数,i大于或等于1并且小于或等于M。例如,第i个子标识字典为脱敏密钥中的第1个标识对应的子标识字典,则第i标识序列为脱敏密钥中的第1个标识对应的重排序标识序列。其中,第i标识序列中的第M标识序列为第二标识序列。
这里,可重复性地排列和组合,是指在按照预设的排列组合规则对m个子标识字典进行排列组合的过程中,可多次或重复使用m个子标识字典中的一个或多个子标识字典与m个子标识字典中的其他标识字典进行排列组合。例如,得到4个子标识字典,分别为子标识字典1、子标识字典2、子标识字典3以及子标识字典4,则在按照预设的排列组合规则对m个子标识字典进行排列组合的过程中,使用子标识字典1两次,与子标识字典2、子标识字典3以及子标识字典4进行排列组合,以此得到包含5个子标识字典的标识字典。
具体地,预设的排列组合规则可以有多种。在一种可能的实施方式中,排列组合规则可以为:按脱敏密钥中的标识在脱敏密钥中的排列顺序对子标识字典进行排列组合,使得排列组合得到的标识字典包含的子标识字典的个数等于脱敏密钥中的标识的个数,以及,进行排列组合后的各个子标识字典在标识字典中的顺序等于各个子标识字典对应的标识在脱敏密钥中的顺序。即使得M=m,以及第i个子标识字典为根据脱敏密钥中的第j个标识确定的子标识字典,j=i,j为大于或等于1并且小于或等于m的正整数。
举例来进行说明,例如,脱敏密钥中的标识分别为标识1、标识2、标识3,标识1在脱敏密钥中的顺序为1,标识2在脱敏密钥中的顺序为2,在脱敏密钥中的顺序为3,通过步骤一确定标识1对应的子标识字典为子标识字典1,通过步骤一确定标识2对应的子标识字典为子标识字典2,通过步骤一确定标识3对应的子标识字典为子标识字典3。按照上述预设的排列组合规则将子标识字典进行排列组合得到的标识字典包括子标识字典1、标识字典2以及子标识字典3,并且,子标识字典1在标识字典中的顺序为1,标识字典2在标识字典中的顺序为2,,子标识字典3在标识字典中的顺序为3。
在另一种可能的实施方式中,排列组合规则还可以为:按脱敏密钥中的标识在脱敏密钥中的排列顺序对子标识字典进行排列组合,使得排列组合得到的标识字典包含的子标识字典的个数等于脱敏密钥中的标识的个数的两倍减一,进行排列组合后的各个子标识字典在标识字典中的顺序等于各个子标识字典对应的标识在脱敏密钥中的顺序,或者,等于各个子标识字典在标识中的逆向顺序等于各个子标识字典对应的标识。即使得M=2m-1,第i个子标识字典为根据脱敏密钥中的第j个标识确定的子标识字典,j为大于或等于1并且小于或等于m的正整数。
举例来进行说明,例如,脱敏密钥中的标识分别为标识1、标识2、标识3,标识1在脱敏密钥中的顺序为1,标识2在脱敏密钥中的顺序为2,在脱敏密钥中的顺序为3,通过步骤一确定标识1对应的子标识字典为子标识字典1,通过步骤一确定标识2对应的子标识字典为子标识字典2,通过步骤一确定标识3对应的子标识字典为子标识字典3。那么,按照上述排列组合规则将子标识字典进行排列组合得到的标识字典包括2个子标识字典1、2个标识字典2以及1个子标识字典3,并且,子标识字典1在标识字典中的顺序为1和5,标识字典2在标识字典中的顺序为2和4,子标识字典3在标识字典中的顺序为3。
不限于上述两种排列组合规则,在可选实施方式中,还可以有其他的排列组合规则,本发明实施例不做限制。
S104,根据标识字典在第二标识序列中确定与第一标识对应的第二标识。
这里,在脱敏密钥包括一个标识的情况下,标识字典由第一标识序列和第二标识序列组成,根据标识字典在第二标识序列中确定第一标识对应的第二标识的具体实现方式为:将第二标识序列中与第一标识对应的标识确定为第二标识。
举例来说明,例如,标识字典由图2中B和图2中的A中的第一标识序列(标识1)组成,则标识字典可以如图2中的E所示。假设确定的第一标识为3,则根据E确定的第二标识为1。
这里,在脱敏密钥包括多个标识的情况下,标识字典由M个子标识字典组成,M个子标识字典中的第i个子标识字典包括第一标识序列和第i标识序列,第i标识序列为对第一标识序列进行重排序得到的序列,第i标识序列中的一个标识对应第一标识序列中的一个标识,第M标识序列为第二标识序列。根据标识字典在第二标识序列中确定第一标识对应的第二标识的具体实现方式为:根据第i个子标识字典在第i标识序列中确定与第i标识对应的第(i+1)标识,其中,当i=1时,第i标识为第一标识,将第M标识序列中的第(M+1)标识确定为第二标识。其具体过程可以为:根据第1个子标识字典在第1标识序列中确定与第一标识对应的第2标识;根据第2个子标识字典在第2标识序列中确定与第2标识对应的第3标识;……;根据第M个子标识字典在第M标识序列中确定与第M标识对应的第(M+1)标识。
举例来进行说明,M=5,第一标识为3,子标识字典分别如图2中的E、F、G所示。其中,E所示的子标识字典在标识字典中的顺序为1和5,F所示的子标识字典在标识字典中的顺序为2和4,G所示的子标识字典的在标识字典中的顺序为3,则上述过程可以如图3所示,首先根据第1个子标识字典在第1标识序列中与第一标识对应的第2标识,第1个子标识字典为E所示的子标识字典,第1标识序列为E所示的子标识字典中标识2这一标识序列,即根据E所示的子标识字典确定在标识2这一标识序列中确定3对应的标识,3对应的标识为1;然后根据第2个子标识字典在第2标识序列中与第2标识对应的第3标识,第2个子标识字典为F所示的子标识字典,第2标识序列为F所示的子标识字典中标识2这一标识序列,,即根据F所示的子标识字典在标识2这一标识序列中确定1对应的标识,1对应的标识为6;接着,根据第3个子标识字典在第3标识序列中与第3标识对应的第4标识,第3个子标识字典为G所示的子标识字典,第1标识序列为G所示的子标识字典中标识2这一标识序列,即根据G所示的子标识字典在标识2这一标识序列中确定6对应的标识,6对应的标识为2;接着,根据第4个子标识字典在第4标识序列中与第4标识对应的第5标识,第4个子标识字典为F所示的子标识字典,第4标识序列为F所示的子标识字典中标识2这一标识序列,即根据F所示的标识字典确定2对应的标识,2对应的标识为7;最后,根据第5个子标识字典在第5标识序列中与第5标识对应的第6标识,第5个子标识字典为E所示的子标识字典,第1标识序列为E所示的子标识字典中标识2这一标识序列,,即根据E所示的标识字典确定7对应的标识,7对应的标识为5。
S105,根据数据字典在数据序列中确定与第二标识对应的第二数据。
例如,数据字典如图2中的A所示,根据标识字典确定的第二标识为7,则根据数据字典在数据序列(数据)中确定标识“7”对应的数据,将标识“7”对应的数据确定为第二数据,标识“7”对应的数据为7,则将数据“7”确定为第一数据对应的脱敏数据。
结合图2和图3可知,通过上述方案,将数据3变换成了数据7,实现了对数据的脱敏。在上述方案中,根据数据脱敏密钥确定标识字典,然后利用数据字典和标识字典对数据进行多次映射得到脱敏后的数据,在标识字典中对标识的映射相当于打乱了数据字典原始的映射顺序,使得映射具备随机映射的特性,其他人根据脱敏后的数据无法推导出映射关系,保证了数据的安全性,由于是通过数据脱敏密钥中的标识得到标识字典,那么根据脱敏密钥可确定标识字典,然后根据逆向的映射过程,可以对脱敏后的数据进行还原,保证了脱敏后的数据的可还原性,即,本发明实施例可同时兼顾数据的安全性和脱敏数据的可还原性。
在一种可行的实施方式中,可以对待脱敏的属于同一类型的数据均按上述图1所示的方法进行数据脱敏。
在另一种可行的实施方式中,也可以采用不同的脱敏密钥对待脱敏的属于同一数据整体的不同数据进行数据脱敏,数据整体中的两个相邻数据所对应的脱敏密钥之间可以相互关联。其中,数据整体可以是指完整的组合起来拥有实际含义的数据的集合。具体地,数据整体可以为一个姓名、一个身份证号码、一个居住地址、一个电话号码、一个银行账号或一个邮箱地址等对应的所有数据。例如,数据整体为一个身份证号码对应的所有数据,对于中国大陆的身份证号码来说,该数据整体为一个包含18位数字的数据集合。可选地,数据整体也可以是指待脱敏的所有数据的集合,例如,待脱敏的数据一共有100个,那么数据整体可以是指包含了这100个数据的集合。
可选地,上述方法还可以包括如下步骤,确定标识字典中的第A个子标识字典,第A个子标识字典为根据脱敏密钥中的第a个标识确定的子标识字典,B为第一数据在待脱敏的数据整体中的排列顺序,待脱敏的数据整体包括至少两个数据,a和n均为正整数,N等于第一标识序列中的标识的个数;根据第A个子标识字典确定第A标识序列中的第三标识,第三标识在第A标识序列中位于第a个标识的后一位;在脱敏密钥中将第a个标识替换为第三标识;将替换得到的脱敏密钥确定为第一数据的下一个数据对应的脱敏密钥。
举例来进行说明,例如,待脱敏的数据整体为一个身份证号码对应的所有数据的集合,那么数据字典的第一数据序列包括0至9以及X这11个数据,即N=11,假设待脱敏的数据整体为500310111111111111,第一数据为3,数据脱敏密钥为856,3在待脱敏的数据整体中的排列顺序为4,则确定B=4,m=3,N*m为33,B不为N*m的整数倍,那么在标识字典中确定根据脱敏密钥中的第1个标识确定的子标识字典,即确定标识“8”对应的子标识字典,假设标识8对应的标识字典为如图2中的E所示,图2中的E所示的第二标识序列(标识2)中排列在8下一位的为9,则将9确定为第三标识,然后在第一脱敏密钥中将8替换为9,替换得到的脱敏密钥为956,将956确定为3的下一个数据“1”对应的脱敏密钥。
针对同一个数据整体中的不同数据,采用不同的脱敏密钥,可进一步保证数据的安全性,同时根据相邻数据对应的脱敏密钥之间的联系,根据其中一个脱敏密钥可推得其他的脱敏密钥,从而可以分别对数据进行还原,也能保证数据的可还原性。
上面介绍了发明实施例的方法,下面介绍发明实施例的装置。
参见图4,图4是本发明实施例提供的一种数据脱敏装置的组成结构示意图,该装置30包括:
字典密钥确定模块301,用于确定第一数据对应的数据字典和脱敏密钥,所述第一数据为待脱敏的数据,所述数据字典包括数据序列和第一标识序列的对应关系,所述数据序列包括多个数据,所述第一标识序列包括多个标识,所述数据序列中的一个数据对应所述第一标识序列中的一个标识,所述脱敏密钥包括至少一个所述第一标识序列中的标识;
第一标识确定模块302,用于根据所述数据字典确定在所述第一标识序列中确定与所述第一数据对应的第一标识;
标识字典确定模块303,用于根据所述脱敏密钥确定标识字典,所述标识字典包括所述第一标识序列和第二标识序列的对应关系,所述第二标识序列为根据所述脱敏密钥中的标识对所述第一标识序列进行重排序得到的序列,所述第二标识序列中的一个标识对应所述第一标识序列中的一个标识;
第二标识确定模块304,用于根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识;
脱敏数据确定模块305,用于根据所述数据字典在所述数据序列中确定与所述第二标识对应的第二数据,并将所述第二数据确定为所述第一数据对应的脱敏数据。
在一种可能的设计中,所述脱敏密钥包括m个标识,所述标识字典包括M个子标识字典,所述M个子标识字典由可重复排列的m个子标识字典排列组合得到,所述m个子标识字典为根据所述m个标识字典确定的子标识字典,m、M均为正整数,M大于或等于m;
所述M个子标识字典中的第i个子标识字典包括所述第一标识序列和第i标识序列的对应关系,所述第i标识序列为对所述第一标识序列进行重排序得到的序列,所述第i标识序列中的一个标识对应所述第一标识序列中的一个标识,第M标识序列为所述第二标识序列,i为正整数,i大于或等于1并且小于或等于M;
第二标识确定模块303具体用于:
根据所述第i个子标识字典在所述第i标识序列中确定与所述第i标识对应的第(i+1)标识,其中,当i=1时,所述第i标识为所述第一标识;
将第M标识序列中的第M标识确定为所述第二标识。
在一种可能的设计中,M=m,所述第i个子标识字典为根据所述脱敏密钥中的第j个标识确定的子标识字典,j=i,j为正整数,j大于或等于1并且小于或等于m;或者
M=2m-1,所述第i个子标识字典为根据所述脱敏密钥中的第j个标识确定的子标识字典,
在一种可能的设计中,所述第i标识序列为对所述第一标识序列进行按顺序移位得到的序列,并且,所述第j个标识在所述第i个子标识字典的第i标识序列中位于第k位,k为大于或等于1并且小于或等于N的任一正整数,N等于所述第一标识序列中的标识的个数。
在一种可能的设计中,该字典密钥确定模块301还用于:
确定所述标识字典中的第A个子标识字典,所述第A个子标识字典为根据所述脱敏密钥中的第a个标识确定的子标识字典,B为所述第一数据在待脱敏的数据整体中的排列顺序,所述数据整体包括至少两个数据,a和n均为正整数,N等于所述第一标识序列中的标识的个数;
根据所述第A个子标识字典确定第A标识序列中的第三标识,所述第三标识在所述第A标识序列中位于所述第a个标识的后一位;
在所述脱敏密钥中将所述第a个标识替换为所述第三标识;
将替换得到的脱敏密钥确定为所述第一数据的下一个数据对应的脱敏密钥。
需要说明的是,图4对应的实施例中未提及的内容可参见方法实施例的描述,这里不再赘述。
本发明实施例中,数据脱敏装置根据数据脱敏密钥确定标识字典,然后利用数据字典和标识字典对数据进行多次映射得到脱敏后的数据,在标识字典中对标识的映射相当于打乱了数据字典原始的映射顺序,使得映射具备随机映射的特性,其他人根据脱敏后的数据无法推导出映射关系,保证了数据的安全性,由于是通过数据脱敏密钥中的标识得到标识字典,那么根据脱敏密钥可确定标识字典,然后根据逆向的映射过程,可以对脱敏后的数据进行还原,保证了脱敏后的数据的可还原性。
参见图5,图5是本发明实施例提供的另一种数据脱敏装置的组成结构示意图,该装置40包括处理器401、存储器402以及输入输出接口403。处理器401连接到存储器402和输入输出接口403,例如处理器401可以通过总线连接到存储器402和输入输出接口403。
处理器401被配置为支持数据脱敏装置执行前述方法实施例中的数据脱敏方法中相应的功能。该处理器401可以是中央处理器(central processdngundt,CPU),网络处理器(network processor,NP),硬件芯片或者其任意组合。上述硬件芯片可以是专用集成电路(appldcatdonspecdfdcdntegratedcdrcudt,ASDC),可编程逻辑器件(programmablelogdcdevdce,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmablelogdcdevdce,CPLD),现场可编程逻辑门阵列(fdeld-programmable gate array,FPGA),通用阵列逻辑(generdcarray logdc,GAL)或其任意组合。
存储器402存储器用于存储程序代码等。存储器402可以包括易失性存储器(volatdle memory,VM),例如随机存取存储器(random access memory,RAM);存储器402也可以包括非易失性存储器(non-volatdlememory,NVM),例如只读存储器(read-onlymemory,ROM),快闪存储器(flash memory),硬盘(hard ddskdrdve,HDD)或固态硬盘(soldd-state drdve,SSD);存储器402还可以包括上述种类的存储器的组合。本发明实施例中,存储器402用于待脱敏的数据、数据字典、脱敏密钥等。
所述输入输出接口403用于输入或输出数据。
处理器401可以调用所述程序代码以执行以下操作:
确定第一数据对应的数据字典和脱敏密钥,所述第一数据为待脱敏的数据,所述数据字典包括数据序列和第一标识序列的对应关系,所述数据序列包括多个数据,所述第一标识序列包括多个标识,所述数据序列中的一个标识对应所述第一标识序列中的一个数据,所述数据脱敏密钥包括至少一个所述第一标识序列中的标识;
根据所述数据字典在所述第一标识序列中确定与所述第一数据对应的第一标识;
根据所述脱敏密钥确定标识字典,所述标识字典包括所述第一标识序列和第二标识序列的对应关系,所述第二标识序列为对所述第一标识序列进行重排序得到的序列,所述第二标识序列中的一个标识对应所述第一标识序列中的一个标识;
根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识;
根据所述数据字典确定在所述数据序列中与所述第二标识对应的第二数据,并将所述第二数据确定为所述第一数据对应的脱敏数据。
需要说明的是,各个操作的实现还可以对应参照方法实施例的相应描述;所述处理器401还可以与输入输出接口403配合执行上述方法实施例中的其他操作。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法,所述计算机可以为上述提到的数据脱敏装置的一部分。例如为上述的处理器401。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、ROM或RAM等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种数据脱敏方法,其特征在于,包括:
确定第一数据对应的数据字典和脱敏密钥,所述第一数据为待脱敏的数据,所述数据字典包括数据序列和第一标识序列的对应关系,所述数据序列包括多个数据,所述第一标识序列包括多个标识,所述数据序列中的一个数据对应所述第一标识序列中的一个标识,所述脱敏密钥包括至少一个所述第一标识序列中的标识;
根据所述数据字典在所述第一标识序列中确定与所述第一数据对应的第一标识;
根据所述脱敏密钥确定标识字典,所述标识字典包括所述第一标识序列和第二标识序列的对应关系,所述第二标识序列为根据所述脱敏密钥中的标识对所述第一标识序列进行重排序得到的序列,所述第二标识序列中的一个标识对应所述第一标识序列中的一个标识;
根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识;
根据所述数据字典在所述数据序列中确定与所述第二标识对应的第二数据,并将所述第二数据确定为所述第一数据对应的脱敏数据。
2.根据权利要求1所述的方法,其特征在于,所述脱敏密钥包括m个标识,所述标识字典包括M个子标识字典,所述M个子标识字典由可重复排列的m个子标识字典排列组合得到,所述m个子标识字典为根据所述m个标识确定的子标识字典,m、M均为正整数,M大于或等于m;
所述M个子标识字典中的第i个子标识字典包括所述第一标识序列和第i标识序列的对应关系,所述第i标识序列为对所述第一标识序列进行重排序得到的序列,所述第i标识序列中的一个标识对应所述第一标识序列中的一个标识,第M标识序列为所述第二标识序列,i为正整数,i大于或等于1并且小于或等于M;
所述根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识,包括:
根据所述第i个子标识字典在所述第i标识序列中确定与第i标识对应的第(i+1)标识,其中,当i=1时,所述第i标识为所述第一标识;
将第M标识序列中的第(M+1)标识确定为所述第二标识。
3.根据权利要求2所述的方法,其特征在于,
M=m,所述第i个子标识字典为根据所述脱敏密钥中的第j个标识确定的子标识字典,j=i,j为正整数,j大于或等于1并且小于或等于m;或者
M=2m-1,所述第i个子标识字典为根据所述脱敏密钥中的第j个标识确定的子标识字典,
4.根据权利要求3所述的方法,其特征在于,所述第i标识序列为对所述第一标识序列进行按顺序移位得到的序列,并且,所述第j个标识在所述第i个子标识字典的第i标识序列中位于第k位,k为大于或等于1并且小于或等于N的任一正整数,N等于所述第一标识序列中的标识的个数。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述确定第一数据对应的数据字典和脱敏密钥之后,包括:
确定所述标识字典中的第A个子标识字典,所述第A个子标识字典为根据所述脱敏密钥中的第a个标识确定的子标识字典,B为所述第一数据在待脱敏的数据整体中的排列顺序,所述数据整体包括至少两个数据,a和n均为正整数,N等于所述第一标识序列中的标识的个数;
根据所述第A个子标识字典确定第A标识序列中的第三标识,所述第三标识在所述第A标识序列中位于所述第a个标识的后一位;
在所述脱敏密钥中将所述第a个标识替换为所述第三标识;
将替换得到的脱敏密钥确定为所述第一数据的下一个数据对应的脱敏密钥。
6.一种数据脱敏装置,其特征在于,包括:
字典密钥确定模块,用于确定第一数据对应的数据字典和脱敏密钥,所述第一数据为待脱敏的数据,所述数据字典包括数据序列和第一标识序列的对应关系,所述数据序列包括多个数据,所述第一标识序列包括多个标识,所述数据序列中的一个数据对应所述第一标识序列中的一个标识,所述脱敏密钥包括至少一个所述第一标识序列中的标识;
第一标识确定模块,用于根据所述数据字典确定在所述第一标识序列中确定与所述第一数据对应的第一标识;
标识字典确定模块,用于根据所述脱敏密钥确定标识字典,所述标识字典包括所述第一标识序列和第二标识序列的对应关系,所述第二标识序列为根据所述脱敏密钥中的标识对所述第一标识序列进行重排序得到的序列,所述第二标识序列中的一个标识对应所述第一标识序列中的一个标识;
第二标识确定模块,用于根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识;
脱敏数据确定模块,用于根据所述数据字典在所述数据序列中确定与所述第二标识对应的第二数据,并将所述第二数据确定为所述第一数据对应的脱敏数据。
7.根据权利要求6所述的装置,其特征在于,所述脱敏密钥包括m个标识,所述标识字典包括M个子标识字典,所述M个子标识字典由可重复排列的m个子标识字典排列组合得到,所述m个子标识字典为根据所述m个标识字典确定的子标识字典,m、M均为正整数,M大于或等于m;
所述M个子标识字典中的第i个子标识字典包括所述第一标识序列和第i标识序列的对应关系,所述第i标识序列为对所述第一标识序列进行重排序得到的序列,所述第i标识序列中的一个标识对应所述第一标识序列中的一个标识,第M标识序列为所述第二标识序列,i为正整数,i大于或等于1并且小于或等于M;
所述第二标识确定模块具体用于:
根据所述第i个子标识字典在所述第i标识序列中确定与所述第i标识对应的第(i+1)标识,其中,当i=1时,所述第i标识为所述第一标识;
将第M标识序列中的第(M+1)标识确定为所述第二标识。
8.根据权利要求7所述的装置,其特征在于,
M=m,所述第i个子标识字典为根据所述脱敏密钥中的第j个标识确定的子标识字典,j=i,j为正整数,j大于或等于1并且小于或等于m;或者
M=2m-1,所述第i个子标识字典为根据所述脱敏密钥中的第j个标识确定的子标识字典,
9.一种数据脱敏装置,包括处理器、存储器以及输入输出接口,所述处理器、存储器和输入输出接口相互连接,其中,所述输入输出接口用于输入或输出数据,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,执行如权利要求1-5任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-5任一项所述的方法。
CN201910241311.XA 2019-03-28 2019-03-28 数据脱敏方法和相关装置 Active CN110008744B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910241311.XA CN110008744B (zh) 2019-03-28 2019-03-28 数据脱敏方法和相关装置
PCT/CN2019/102746 WO2020192007A1 (zh) 2019-03-28 2019-08-27 数据脱敏方法和相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910241311.XA CN110008744B (zh) 2019-03-28 2019-03-28 数据脱敏方法和相关装置

Publications (2)

Publication Number Publication Date
CN110008744A true CN110008744A (zh) 2019-07-12
CN110008744B CN110008744B (zh) 2022-04-01

Family

ID=67168466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910241311.XA Active CN110008744B (zh) 2019-03-28 2019-03-28 数据脱敏方法和相关装置

Country Status (2)

Country Link
CN (1) CN110008744B (zh)
WO (1) WO2020192007A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457949A (zh) * 2019-08-14 2019-11-15 于向东 一种基于数据字典的保持唯一性、完整性、关联性的数据脱敏方法
WO2020192007A1 (zh) * 2019-03-28 2020-10-01 平安科技(深圳)有限公司 数据脱敏方法和相关装置
CN111737750A (zh) * 2020-06-30 2020-10-02 绿盟科技集团股份有限公司 一种数据处理方法、装置、电子设备及存储介质
CN112582045A (zh) * 2020-12-22 2021-03-30 无锡慧方科技有限公司 一种电子式医疗报告单传输系统

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113282931A (zh) * 2021-05-19 2021-08-20 绿盟科技集团股份有限公司 一种风险评估方法、装置、设备及介质
CN115118438B (zh) * 2022-08-29 2023-01-20 北京智芯微电子科技有限公司 基于区块链的终端数字身份管理方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1475918A (zh) * 2002-08-14 2004-02-18 北京唯美星计算机安全保护技术有限公 多存储器式物理隔离型计算机数据安全防护方法及装置
US20060005017A1 (en) * 2004-06-22 2006-01-05 Black Alistair D Method and apparatus for recognition and real time encryption of sensitive terms in documents
CN105975870A (zh) * 2016-05-19 2016-09-28 上海点荣金融信息服务有限责任公司 数据脱敏方法和系统
CN107145799A (zh) * 2017-05-04 2017-09-08 山东浪潮云服务信息科技有限公司 一种数据脱敏方法及装置
CN107609418A (zh) * 2017-08-31 2018-01-19 深圳市牛鼎丰科技有限公司 文本数据的脱敏方法、装置、存储设备以及计算机设备
CN107871083A (zh) * 2017-11-07 2018-04-03 平安科技(深圳)有限公司 脱敏规则配置方法、应用服务器及计算机可读存储介质
CN107992727A (zh) * 2017-12-11 2018-05-04 北京安华金和科技有限公司 一种基于原有数据变形实现的水印处理和数据溯源方法
CN108289095A (zh) * 2018-01-02 2018-07-17 诚壹泰合(北京)科技有限公司 一种敏感数据存储方法、装置及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8176080B2 (en) * 2009-03-06 2012-05-08 Hewlett-Packard Development Company, L.P. Desensitizing character strings
CN109039586B (zh) * 2018-08-17 2021-06-29 贵州大学 一种可恢复的保留数字类型轻量级脱敏方法
CN110008744B (zh) * 2019-03-28 2022-04-01 平安科技(深圳)有限公司 数据脱敏方法和相关装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1475918A (zh) * 2002-08-14 2004-02-18 北京唯美星计算机安全保护技术有限公 多存储器式物理隔离型计算机数据安全防护方法及装置
US20060005017A1 (en) * 2004-06-22 2006-01-05 Black Alistair D Method and apparatus for recognition and real time encryption of sensitive terms in documents
CN105975870A (zh) * 2016-05-19 2016-09-28 上海点荣金融信息服务有限责任公司 数据脱敏方法和系统
CN107145799A (zh) * 2017-05-04 2017-09-08 山东浪潮云服务信息科技有限公司 一种数据脱敏方法及装置
CN107609418A (zh) * 2017-08-31 2018-01-19 深圳市牛鼎丰科技有限公司 文本数据的脱敏方法、装置、存储设备以及计算机设备
CN107871083A (zh) * 2017-11-07 2018-04-03 平安科技(深圳)有限公司 脱敏规则配置方法、应用服务器及计算机可读存储介质
CN107992727A (zh) * 2017-12-11 2018-05-04 北京安华金和科技有限公司 一种基于原有数据变形实现的水印处理和数据溯源方法
CN108289095A (zh) * 2018-01-02 2018-07-17 诚壹泰合(北京)科技有限公司 一种敏感数据存储方法、装置及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JAMES R.JOHNSON: "Detecting Emergent Terrorism Events: Finding Needles in Information Haystacks", 《2012 EUROPEAN INTELLIGENCE AND SECURITY INFORMATICS CONFERENCE》 *
矫真 等: "营销系统敏感数据分级分类管理", 《通信电源技术》 *
艾解清 等: "客户隐私数据流转安全管理系统", 《信息安全研究》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020192007A1 (zh) * 2019-03-28 2020-10-01 平安科技(深圳)有限公司 数据脱敏方法和相关装置
CN110457949A (zh) * 2019-08-14 2019-11-15 于向东 一种基于数据字典的保持唯一性、完整性、关联性的数据脱敏方法
CN111737750A (zh) * 2020-06-30 2020-10-02 绿盟科技集团股份有限公司 一种数据处理方法、装置、电子设备及存储介质
CN111737750B (zh) * 2020-06-30 2023-12-26 绿盟科技集团股份有限公司 一种数据处理方法、装置、电子设备及存储介质
CN112582045A (zh) * 2020-12-22 2021-03-30 无锡慧方科技有限公司 一种电子式医疗报告单传输系统

Also Published As

Publication number Publication date
WO2020192007A1 (zh) 2020-10-01
CN110008744B (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
CN110008744A (zh) 数据脱敏方法和相关装置
Kapoor et al. Leakage and the reproducibility crisis in ML-based science
EP2565802A1 (en) Data masking setup
CN106156145A (zh) 一种地址数据的管理方法和装置
US9329778B2 (en) Supplementing a virtual input keyboard
CN103646049B (zh) 自动生成数据报表的方法及系统
US20210157900A1 (en) Securing passwords by using dummy characters
JP2021507360A (ja) データを非特定化する方法、データを非特定化するためのシステム、および非データを特定化するためのコンピュータ・プログラム
CN111813808A (zh) 一种大数据快速脱敏的方法及装置
CN108733644A (zh) 一种文本情感分析方法、计算机可读存储介质及终端设备
CN101809568A (zh) 电子设备、显示控制方法以及程序
CN110289059A (zh) 医疗数据处理方法、装置、存储介质及电子设备
CN107491536A (zh) 一种试题校验方法、试题校验装置及电子设备
CN107408105A (zh) 有条件受控加样式
CN114186275A (zh) 隐私保护方法、装置、计算机设备及存储介质
CN115344340A (zh) 基于捆绑会话组的交互方法、装置和计算机设备
CN107451036A (zh) 输入提示方法、装置和设备
CN108415971B (zh) 采用知识图谱推荐供求信息的方法和装置
CN110008445A (zh) 事件抽取方法及装置、电子设备
CN107808076B (zh) 一种终端设备的解锁方法、终端设备以及存储介质
CN106469017A (zh) 一种终端设置密码及认证的方法及装置
CN112256853A (zh) 问题生成方法、装置、设备及计算机可读存储介质
Reeder et al. User interface dependability through goal-error prevention
CN108364009A (zh) 二维结构公式的识别方法、计算设备及计算机存储介质
Vincent National Attributes as Predictors of Delegate Attitudes at the United Nations1

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant