CN111767565B - 一种数据脱敏的处理方法、处理装置和存储介质 - Google Patents

一种数据脱敏的处理方法、处理装置和存储介质 Download PDF

Info

Publication number
CN111767565B
CN111767565B CN201910195883.9A CN201910195883A CN111767565B CN 111767565 B CN111767565 B CN 111767565B CN 201910195883 A CN201910195883 A CN 201910195883A CN 111767565 B CN111767565 B CN 111767565B
Authority
CN
China
Prior art keywords
character
string
desensitized
characters
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910195883.9A
Other languages
English (en)
Other versions
CN111767565A (zh
Inventor
孙秉乾
洪敬风
沈华林
胡兆丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201910195883.9A priority Critical patent/CN111767565B/zh
Publication of CN111767565A publication Critical patent/CN111767565A/zh
Application granted granted Critical
Publication of CN111767565B publication Critical patent/CN111767565B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请公开了一种数据脱敏的处理方法、处理装置和存储介质,其中,该方法包括:获取待脱敏字符串;遍历待脱敏字符串中的各个字符,将连续字符的数量超过预设位数,且字符类型均为数字的待脱敏字符串中的部分连续字符确定为待脱敏数组串;在待脱敏数组串中,将在预设起始位置起的连续的预设位数的字符替换为预设的数字,以生成脱敏后数组串,并进行存储;将待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符,并进行存储,其中,非保留字符随机确定;根据结果缓冲区中存储的各个字符,生成脱敏后字符串。本申请实施例通过识别待脱敏字符串中的各个字符,对字符进行脱敏,不需要提前定义数据格式,同时遍历各个字符,保证了脱敏的充分和完整性。

Description

一种数据脱敏的处理方法、处理装置和存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据脱敏的处理方法、处理装置和存储介质。
背景技术
数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。通常在不违反系统规则条件的情况下,对涉及客户安全的数据或者一些商业性敏感数据等真实数据进行改造并提供测试,如身份证号、手机号、卡号、客户号等个人信息都可以进行数据脱敏处理。这样就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。
现有技术中主要是通过提前定义数据格式或者基于自然语言识别来对敏感数据进行处理。比如导入外部字典表,用于随机替换敏感数据真值,以实现数据脱敏的效果
但是对于不确定性的异构数据,现有的脱敏处理方法不能保证敏感数据都得到处理,并且处理速度较慢,脱敏效果不理想。另外,可逆的脱敏算法可以实现脱敏之后的数据追溯,但是它的有效性依赖于算法的保密或者密钥的保密,一旦泄漏,脱敏处理失效。不可逆的脱敏算法,主要基于消息摘要算法。一旦脱敏之后,数据无法追溯。而通过现有技术对敏感数据进行脱敏处理后,原有数据格式发生改变。例手机号13812345678经过脱敏处理后,变成了fb9b5908054fb6b5659c85df7151188d,无法获知原数据类型及含义,这就使得无法对脱敏后的数据进行定性分析。
发明内容
本申请实施例提供了一种数据脱敏的处理方法,该方法根据待脱敏字符串中的各个字符之间的关系,识别需要脱敏的字符,实现对待脱敏字符串的充分脱敏。
该方法包括:
获取待脱敏字符串;
遍历所述待脱敏字符串中的各个字符,将连续字符的数量超过预设位数,且字符类型均为数字的所述待脱敏字符串中的部分连续字符确定为待脱敏数组串;
在所述待脱敏数组串中,将在预设起始位置起的连续的预设位数的字符替换为预设的数字,以生成脱敏后数组串,并将所述脱敏后数组串存储在结果缓冲区;
将所述待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的所述非保留字对应的遮盖字符存储在所述结果缓冲区,其中,所述非保留字符随机确定;
根据所述结果缓冲区中存储的各个字符,生成脱敏后字符串。
可选地,获取当前字符的字符类型;
在所述当前字符的所述字符类型为数字时,获取当前字符的前一个字符的字符类型;
在所述前一个字符的字符类型为数字时,将所述当前字符存入已经建立的数字缓冲区;
当遍历完所述待脱敏字符串包含的所有字符后,判断所述数字缓冲区中包含的连续字符的数量是否超过所述预设位数;
当所述数字缓冲区中存储的连续字符的数量超过所述预设位数时,将连续字符组成的数组串确定为待脱敏数组串。
可选地,若所述当前字符的前一个字符的字符类型为非数字时,新建数字缓冲区,并将所述当前字符存入所述数字缓冲区。
可选地,当所述数字缓冲区中存储的连续字符的数量未超过预设位数时,关闭所述数字缓冲区,并将所述数字缓冲区中存储的连续字符存储在结果缓冲区中。
可选地,若所述当前字符的字符类型为非数字时,获取当前字符的前一个字符的字符类型;
若所述前一个字符的字符类型为数字时,关闭所述数字缓冲区,并将所述当前字符存储在所述结果缓冲区。
可选地,若所述当前字符的所述字符类型为非数字,获取当前字符的前一个字符类型;
若所述前一个字符的字符类型为非数字时,判断所述当前字符是否为ASCII字符;
当所述当前字符为非ASCII字符时,根据随机确定的所述保留字符,将所述当前字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的所述非保留字符对应的遮盖字符存储在所述结果缓冲区。
可选地,若所述当前字符为ASCII字符时,将当前字符存储在所述结果缓冲区。
可选地,生成所述脱敏后数组串在脱敏前对应的数组串的随机盐;
获取所述脱敏后数组串在所述待脱敏字符串中的位置信息;
根据所述随机盐和所述脱敏前对应的数组串,生成所述脱敏后字符串的第一哈希串;
基于所述随机盐、所述位置信息和所述第一哈希串,组成所述脱敏后数组串对应的追溯识别信息。
可选地,获取待追溯数字串;
在所述预设起始位置起,将所述待追溯数字串分离为前缀数字串和后缀数字串,其中,所述后缀数字串包含所述预设位数的字符;
根据所述前缀数字串,在所述各个脱敏后字符串中查找包含所述前缀数字串的脱敏后数组串;
当所述脱敏后数组串包含所述前缀数字串时,获取该所述脱敏后数组串对应的所述追溯识别信息;
基于所述追溯识别信息,确定所述脱敏后数组串包含所述待追溯数字串的结果。
可选地,根据所述待追溯数字串的所述后缀数字串和所述追溯识别信息中的随机盐,生成第二哈希串;
将所述第二哈希串与所述追溯识别信息中的所述第一哈希串进行对比;
若所述第二哈希串与所述第一哈希串完全相同,则确定所述脱敏后数组串对应的待脱敏数组串包含所述待追溯数字串;
若所述第二哈希串与所述第一哈希串不同,则确定所述脱敏后数组串与所述待追溯数字串不对应。
在本发明的另一个实施例中,提供了一种数据脱敏的处理装置,该装置包括:
第一获取模块,用于获取待脱敏字符串;
第一确定模块,用于遍历所述待脱敏字符串中的各个字符,将连续字符的数量超过预设位数,且字符类型均为数字的所述待脱敏字符串中的部分连续字符确定为待脱敏数组串;
第一生成模块,用于在所述待脱敏数组串中,将在预设起始位置起的连续的预设位数的字符替换为预设的数字,以生成脱敏后数组串,并将所述脱敏后数组串存储在结果缓冲区;
第二生成模块,用于将所述待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的所述非保留字对应的遮盖字符存储在所述结果缓冲区,其中,所述非保留字符随机确定;
第三生成模块,用于根据所述结果缓冲区中存储的各个字符,生成脱敏后字符串。
可选地,该第一确定模块包括:
第一获取单元,用于获取当前字符的字符类型;
第二获取单元,用于在所述当前字符的所述字符类型为数字时,获取当前字符的前一个字符的字符类型;
第一存储单元,用于在所述前一个字符的字符类型为数字时,将所述当前字符存入已经建立的数字缓冲区;
第一判断单元,用于当遍历完所述待脱敏字符串包含的所有字符后,判断所述数字缓冲区中包含的连续字符的数量是否超过所述预设位数;
第一确定单元,用于当所述数字缓冲区中存储的连续字符的数量超过所述预设位数时,将连续字符组成的数组串确定为待脱敏数组串。
可选地,第一确定模块还包括:
第二存储单元,用于若所述当前字符的前一个字符的字符类型为非数字时,新建数字缓冲区,并将所述当前字符存入所述数字缓冲区。
可选地,该第一确定模块还包括:
第三存储单元,用于当所述数字缓冲区中存储的连续字符的数量未超过预设位数时,关闭所述数字缓冲区,并将所述数字缓冲区中存储的连续字符存储在结果缓冲区中。
可选地,该装置还包括:
第二获取模块,用于若所述当前字符的字符类型为非数字时,获取当前字符的前一个字符的字符类型;
第一存储模块,用于若所述前一个字符的字符类型为数字时,关闭所述数字缓冲区,并将所述当前字符存储在所述结果缓冲区。
可选地,第二生成模块包括:
第三获取单元,用于若所述当前字符的所述字符类型为非数字,获取当前字符的前一个字符类型;
第二判断单元,用于若所述前一个字符的字符类型为非数字时,判断所述当前字符是否为ASCII字符;
第三存储单元,用于当所述当前字符为非ASCII字符时,根据随机确定的所述保留字符,将所述当前字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的所述非保留字符对应的遮盖字符存储在所述结果缓冲区。
可选地,第二生成模块还包括:
第四存储单元,用于若所述当前字符为ASCII字符时,将当前字符存储在所述结果缓冲区。
可选地,第一生成模块还包括:
第一生成单元,用于生成所述脱敏后数组串在脱敏前对应的数组串的随机盐;
第四获取单元,用于获取所述脱敏后数组串在所述待脱敏字符串中的位置信息;
第二生成单元,用于根据所述随机盐和所述脱敏前对应的数组串,生成所述脱敏后字符串的第一哈希串;
组成单元,用于基于所述随机盐、所述位置信息和所述第一哈希串,组成所述脱敏后数组串对应的追溯识别信息。
可选地,该装置还包括:
第三获取模块,用于获取待追溯数字串;
分离模块,用于在所述预设起始位置起,将所述待追溯数字串分离为前缀数字串和后缀数字串,其中,所述后缀数字串包含所述预设位数的字符;
查找模块,用于根据所述前缀数字串,在所述各个脱敏后字符串中查找包含所述前缀数字串的脱敏后数组串;
第四获取模块,用于当所述脱敏后数组串包含所述前缀数字串时,获取该所述脱敏后数组串对应的所述追溯识别信息;
判断模块,用于基于所述追溯识别信息,确定所述脱敏后数组串包含所述待追溯数字串的结果。
可选地,判断模块包括:
第二生成单元,用于根据所述待追溯数字串的所述后缀数字串和所述追溯识别信息中的随机盐,生成第二哈希串;
对比单元,用于将所述第二哈希串与所述追溯识别信息中的所述第一哈希串进行对比;
第二确定单元,用于若所述第二哈希串与所述第一哈希串完全相同,则确定所述脱敏后数组串对应的待脱敏数组串包含所述待追溯数字串;
第三确定单元,用于若所述第二哈希串与所述第一哈希串不同,则确定所述脱敏后数组串与所述待追溯数字串不对应。
在本发明的另一个实施例中,提供了一种非瞬时计算机可读存储介质,所述非瞬时计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行上述一种数据脱敏的处理方法中的各个步骤。
在本发明的另一个实施例中,提供了一种终端设备,包括处理器,所述处理器用于执行上述一种数据脱敏的处理方法中的各个步骤。
如上可见,基于上述实施例,首先获取待脱敏字符串,其次,遍历待脱敏字符串中的各个字符,将连续字符的数量超过预设位数,且字符类型均为数字的待脱敏字符串中的部分连续字符确定为待脱敏数组串,同时,在待脱敏数组串中,将在预设起始位置起的连续的预设位数的字符替换为预设的数字,以生成脱敏后数组串,并将脱敏后数组串存储在结果缓冲区,然后,将待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的非保留字对应的遮盖字符存储在结果缓冲区,其中,非保留字符随机确定,最后,根据结果缓冲区存储的各个字符,生成脱敏后字符串。本申请实施例通过遍历待脱敏字符串中的各个字符,对需要脱敏的字符进行脱敏处理,不需要提前定义数据格式,提升了脱敏效率。同时,对待脱敏字符串中的每个字符进行识别,保证了脱敏的充分性和完整性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种数据脱敏的处理方法的应用场景的示意图;
图2示出了本申请实施例所提供的一种数据脱敏的处理方法的具体流程的示意图;
图3示出了本申请实施例所提供的另一种数据脱敏的处理方法的具体流程的示意图;
图4示出了本申请实施例所提供的经过脱敏处理的脱敏后字符串的显示示意图;
图5示出了本申请实施例所提供的对经过脱敏处理的脱敏后数组串进行追溯的具体流程的示意图;
图6示出了本申请实施例所提供的一种数据脱敏的处理装置的示意图;
图7示出了本申请实施例所提供的一种终端设备的示意图。
具体实施方式
为使本申请的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明进一步详细说明。
基于现有技术中的问题,本申请实施例提供了一种数据脱敏的处理方法,通过对敏感数据进行识别,在不需要提前定义数据格式的情况下,遍历待脱敏字符串,根据待脱敏字符串中各个字符的前后关系,对需要进行脱敏处理的字符进行充分且完整的脱敏处理。另外,对于进行脱敏处理后的数组串,可以进行追溯。同时,保证脱敏后的数据格式与原数据格式一样具有可读性。
本申请的应用领域主要是在数据处理技术领域中,适用于某些需要显示脱敏数据的业务场景中,如快递单中客户的个人信息或者电子商务订单中客户的个人信息的保密显示等。如图1所示,为本申请实施例中所提供的方法的应用场景的示意图。其中,用户端11提供需要进行脱敏处理的待脱敏字符串,服务器12通过网络获取待脱敏字符串,并进行脱敏处理,脱敏后字符串可以通过建立在服务器12和终端设备13之间的通信链路介质传输,并在终端设备13上进行显示。其中,在终端设备13上显示可以是在用户手机或者电脑等终端设备上进行显示,或者在打印设备上进行打印。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等通信链路介质。
本申请实施例所提供的一种数据脱敏的处理方法的具体流程,参见图2所示,详细步骤如下:
S21,获取待脱敏字符串。
本步骤中,根据预先设定,服务器在获取的信息中确定需要进行脱敏处理的信息。一般情况下,需要进行脱敏处理的信息可以是用户个人信息,如用户填写的个人地址,姓名以及电话号码等。用户在用户终端填写用户个人信息,由服务器获取用户个人信息,并将其中的部分信息确定为待脱敏字符串。
S22,遍历待脱敏字符串中的各个字符,将连续字符的数量超过预设位数,且字符类型均为数字的待脱敏字符串中的部分连续字符确定为待脱敏数组串。
本步骤中,在通过上述步骤S21获取了待脱敏字符串后,遍历待脱敏字符串中的各个字符,并确定各个字符的字符类型。一般情况下,字符类型包括数字、美国信息交换标准代码(American Standard Code for Information Interchange,ASCII)中的字符以及非ASCII字符,如汉字等。在遍历完待脱敏字符串中的各个字符后,将其中连续字符的数量超过预设位数,且其中每个字符的字符类型均为数字的字符确定为待脱敏数组串。具体的,预设位数可以预先设定,如设定预设位数为6位,则在待脱敏字符串中连续六位的字符均为数字时,则可以将这些连续字符确定为待脱敏数组串。
S23,在待脱敏数组串中,将在预设起始位置起的连续的预设位数的字符替换为预设的数字,以生成脱敏后数组串,并将脱敏后数组串存储在结果缓冲区。
本步骤中,在确定了上述待脱敏数组串后,确定其中连续的预设位数的数字类型的字符的预设起始位置。具体的,预设起始位置是对该待脱敏数组串进行脱敏的字符的起始位置。预设起始位置是从待脱敏数组串的最后一个字符开始向前预设位数的字符对应的位置,并对从预设起始位置起的连续的预设位数的字符进行脱敏处理。即将这些原始的数字字符替换为其它数字。在进行完上述脱敏处理后,将生成的脱敏后字符串存储在结果缓冲区。其中,结果缓冲区用于存储正在进行脱敏处理的待脱敏字符串中的部分字符的中间量。
S24,将待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的非保留字对应的遮盖字符存储在结果缓冲区,其中,非保留字符随机确定。
这里,待脱敏字符串中存在非ASCII字符时,判断每一个非ASCII字符是否为保留字。具体的,非ASCII字符一般为汉字。当待脱敏字符串中存在汉字等非ASCII字符时,判断其是否是保留字。其中,保留字根据预先设定随机确定。如可以预先设置保留字字典,当待脱敏字符串中的非ASCII字符为保留字字典中的保留字时,不进行脱敏处理。而当非ASCII字符为非保留字时,将对应的非ASCII字符替换为遮盖字符,并对应的存储在加过缓冲区。
S25,根据结果缓冲区中存储的各个字符,生成脱敏后字符串。
这里,在经过上述各个步骤处理后,将对待脱敏字符串进行脱敏后的各个字符存储在结果缓冲区中,生成脱敏后字符串。其中,除了进行脱敏处理后的数字类型的字符和非ASCII字符,结果缓冲区中还存储有不需要进行脱敏处理的其它ASCII字符,如字母和符号等。这类字符完整保留,与进过脱敏的字符按照待脱敏字符串待脱敏字符串的字符排列顺序生成脱敏后字符串。
基于本申请的上述实施例,首先获取待脱敏字符串,并遍历待脱敏字符串中的各个字符,将连续字符的数量超过预设位数,且字符类型均为数字的带脱敏字符串中的部分连续字符确定为待脱敏数组。其次,在待脱敏数组串中,将在预设位置其的连续的预设位数的字符替换为预设的数字,以生成脱敏后数组串,并将脱敏后数组串存储在结果缓冲区。然后,将待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的非保留字对应的遮盖字符存储在结果缓冲区,其中,非保留字符随机确定。最后,根据结果缓冲区中存储的各个字符,生成脱敏后字符串。本申请实施例通过对待脱敏字符串中各个字符进行识别,并对其中符合要求的字符进行脱敏处理,保证了对待脱敏字符串进行完整和充分的脱敏处理,不需要提前定义数据格式。同时,对其中符合要求的字符进行脱敏的处理方式保证了脱敏后字符串具有一定的可读性。
如图3所示,为本申请实施例中的另一种数据脱敏的处理方法的具体流程的示意图。其中,该具体流程的详细过程如下:
S301,获取待脱敏字符串。
S302,遍历带脱敏字符串中的各个字符,获取当前字符的字符类型。
S303,判断当前字符的字符类型。
这里,判断待脱敏字符串中的字符类型主要是判断当前字符类型是否为数字,并在数字和非数字的情况下分别对待脱敏字符串进行处理。
S304,在当前字符的字符类型为数字时,获取当前字符的前一个字符的字符类型。
S305,判断当前字符的前一个字符的字符类型。
本步骤中,与上述步骤S33中一致,主要判断当前字符的前一个字符的字符类型是否为数字,并在数字和非数字的情况下分别进行处理。
S306,在前一个字符的字符类型为数字时,将当前字符存入已经建立的数字缓冲区。
本步骤中,在前一个字符的字符类型为数字且当前字符的字符类型也为数字的情况下,前一个字符为数字时,会建立数字缓冲区,并将前一个字符存储在数字缓冲区中。在当前字符同样是数字时,将当前字符也存储在数字缓冲区中。
S307,在当前字符的前一个字符的字符类型是非数字时,新建数字缓冲区,并将当前字符存入数字缓冲区。
S308,在遍历完待脱敏字符串中的所有字符时,判断数字缓冲区中的连续字符是否超过预设位数。
本步骤中,如确定预设位数为6位,在遍历完待脱敏字符串时,对数字缓冲区中的字符位数进行判断,判断其中字符位数是否超过6位。其中,数字缓冲区中只存储连续且位数超过预设位数的字符类型为数字的字符。
S309,在数字缓冲区中存储的字符数量超过预设位数时,将连续字符组成的数组串确定为待脱敏数组串。
S310,当数字缓冲区中存储的连续字符的数量未超过预设位数时,关闭数字缓冲区,并将数字缓冲区中存储的连续字符存储在结果缓冲区中。
本步骤中,当数字缓冲区中的字符位数不满足预设位数的条件时,则该对应的数字字符不符合脱敏的条件,不进行脱敏处理,并关闭数字缓冲区,将原数字缓冲区中的字符存储在结果缓冲区中。
S311,在待脱敏数组串中,将在预设起始位置起的连续的预设位数的字符替换为预设的数字,以生成脱敏后数组串,并将脱敏后数组串存储在结果缓冲区。
S312,生成脱敏后数组串在脱敏前对应的数组串的随机盐。
这里,在脱敏时针对脱敏后数组串生成的随机盐一般是指随机生成的一组字符串,可以包括随机的大小写字母、数字、字符,其位数可以预先设置。
S313,根据随机盐,生成与脱敏后数组串对应的追溯识别信息。
本步骤中,在对待脱敏数组串进行脱敏处理后,会生成两段文本。一段是脱敏后数组串,一段是用于对待脱敏数组串进行追溯的追溯识别信息。具体的,在生成与脱敏前的数组串对应的随机盐后,获取脱敏后数组串在待脱敏字符串中的位置信息。同时,根据随机盐和脱敏前对应的数组串,生成脱敏后字符串的第一哈希串。其中,对随机盐和脱敏前的数组串做SHA256运算,以得到脱敏后字符串的第一哈希串。如脱敏前的数组串是450046,生成的随机盐是1550735999,则对450046和1550735999进行SHA256运算,得到第一哈希串342cf440a8deeb9b107f5752f8977123。
最后,基于随机盐、位置信息和第一哈希串,组成脱敏后数组串对应的追溯识别信息。具体的,是将随机盐、位置信息和第一哈希串直接罗列组成追溯识别信息。每条待脱敏字符串中若存在需要脱敏的数组串,则在完成脱敏处理后,除了生成脱敏后字符串,也会对应的生成与脱敏后数组串对应的追溯识别信息。如{'salt':1550735999,'26':'342cf440a8deeb9b107f5752f8977123'}。其中,1550735999为随机盐,26为数组串的位置,342cf440a8deeb9b107f5752f8977123为第一哈希串。
S314,若当前字符的字符类型为非数字时,获取当前字符的前一个字符的字符类型
S315,判断当前字符的前一个字符的字符类型。
S316,若前一个字符的字符类型为数字时,关闭数字缓冲区,并将当前字符存储在结果缓冲区。
本步骤中,若前一个字符的字符类型为数字时,且当前字符的字符类型为非数字时,数字字符的存储已经完毕,所以关闭前一个字符为数字时创建的数字缓冲区。同时,将当前字符存储在结果缓冲区。
S317,若前一个字符的字符类型为非数字时,判断当前字符是否为ASCII字符。
S318,若当前字符为非ASCII字符时,根据随机确定的保留字符,将当前字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的非保留字对应的遮盖字符存储在结果缓冲区。
S319,若当前字符为ASCII字符时,将当前字符存储在结果缓冲区。
S320,根据结果缓冲区中存储的各个字符,生成脱敏后字符串。
上述图3所示实施例主要是通过遍历待脱敏字符串中各个字符,对待脱敏字符串中符合条件的各个字符进行脱敏,并将脱敏后的字符和未脱敏的字符按照原待脱敏字符串的排列顺序排列,生成脱敏后字符串。如图4所示,为经过脱敏处理的脱敏后字符串的显示示意图。其中,401和403为订单页面,402为对脱敏后字符串显示的示意图。
上述实施例中对待脱敏字符串进行脱敏处理的方法通过对待脱敏字符串中的每个字符做一次遍历,只关心当前字符,以及当前字符和前后字符的关系,不关心数据格式。其中,对于非ASCII字符,其主要成分是汉字,通过预设的汉字字典表,若当前非ASCII字符在汉字字典表中时,进行保留;若不存在,则随机保留,如对其中一半的非ASCII字符进行保留。经过上述处理后的脱敏后字符串有一定的可读性。例如汉字字典表中有地址单位,例如:市,区,镇,街,道,路。若待脱敏字符串为地址信息:北京市朝阳区北辰西路北辰世纪中心。则对待脱敏字符串进行脱敏之后对应的脱敏后字符串为:北*市**区北**路北辰***心。可见,脱敏后字符串具有一定的可读性,能识别它是一个地址,但不能还原具体的地址。而对于数字,若规定预设位数为6位,则对连续6位以下的数字不做处理。而6位及6位以上的数字,若预先设置替换数字为0,则后6位替换成0,前面的部分保留。另外,对于ASCII表中的非数组部分,不做脱敏,完整保留。经过以上方式处理的数据,一定不包含完整的手机号,身份证号,护照号,也不包含完整的通信地址等需要脱敏的数据信息。
对于待脱敏字符串中的数字字符组成的数组串,在脱敏后可以实现追溯。具体的,如果数组串的长度小于预设位数,如小于6位,可以直接从显示的脱敏后字符串中查询到。如果数字长度大于等于6位,先用上述脱敏的处理方法对需要追溯的数组串进行脱敏,然后使用脱敏后数组串在脱敏后字符串对应的追溯识别信息中进行查找,如果检索到,再匹配对应的哈希串是否相等,如果相等,可证明脱敏后字符串对应的脱敏前的数据中包含这个数组串。通过以上方法实现对数组串的追溯。如图5所示,为本申请实施例中的对经过脱敏处理的脱敏后数组串进行追溯的具体流程的示意图。其中,该具体流程的详细过程如下:
S501,获取待追溯数字串。
这里,需要进行追溯的待追溯数字串一般为手机号。如给定一串手机号,在脱敏后字符串中查找是否包含有该手机号。
S502,在预设起始位置起,将待追溯数字串分离为前缀数字串和后缀数字串。
本步骤中,后缀数字串包含预设位数的字符。
S503,根据前缀数字串,在各个脱敏后字符串中查找包含前缀数字串的脱敏后数组串。
这里,服务器中一般包含有大量脱敏后字符串,为了缩减可追溯范围,减少运算耗时时间和运算量。首先通过待追溯数字串分离出的前缀数字串在大量脱敏后字符串中进行查找,并筛选出包含该前缀数字串的脱敏后数组串。
S504,当脱敏后数组串包含前缀数字串时,获取该脱敏后数组串对应的追溯识别信息。
S505,根据待追溯数字串的后缀数字串和追溯识别信息中的随机盐,生成第二哈希串。
这里,对待追溯数字串中的后缀数字串和获取的追溯识别信息中的随机盐做SHA256运算,以生成第二哈希串。
S506,将第二哈希串与追溯识别信息中的第一哈希串进行对比。
S507,若相同,则确定脱敏后数组串对应的待脱敏数组串包含待追溯数字串。
S508,若不同,则确定脱敏后数组串与待追溯数字串不对应。
综上,若需要给待脱敏数组串进行脱敏处理,则效果如下:
待脱敏数组串原文:
{'consignerMobile':'13810450046','printAddress':'黑龙江省绥化市肇东市正阳十道街北尚城壹品A区商服15门','userLevel};
脱敏之后的脱敏后数组串:
{'consignerMobile':'13810000000','printAddress':'□□□省□□市□□市□□□道街□□□□□A区□□15门','userLevel};
追溯识别信息:
{'salt':1550735999,'26':'342cf440a8deeb9b107f5752f8977123'}。
其中,脱敏的目的是隐藏敏感信息,例如手机号,订单号,地址。保证这些信息不可恢复,但是保留格式,保留人工阅读识别特征。待脱敏数组串在脱敏之后会生成两段文本,一段是脱敏之后的脱敏后数组串,一段是用于追溯的追溯识别信息。在该例中,被脱敏的数字串是450046,26是450046在原文中的位置,salt是生成的随机盐,即1550735999,342cf440a8deeb9b107f5752f8977123是450046+1550735999的hash值。
若进行追溯,追溯的过程是给定手机号,查找包含这个手机号的脱敏后数组串。例如给定手机号:13810450046。对给定手机号做分离,其中,前缀数字串为13810,后缀数字串为450046。首先,用前缀数字串在所有脱敏后字符串中查询,找到如下脱敏后字符串:
{'consignerMobile':'13810000000','printAddress':'□□□省□□市□□市□□□道街□□□□□A区□□15门','userLevel};以及对应的追溯识别信息:{'salt':1550735999,'26':'342cf440a8deeb9b107f5752f8977123'}。
其次,取出salt,即1550735999,用salt1550735999和后缀数字串450046做SHA256运算,然后将得到的哈希串与追溯识别信息中的哈希串342cf440a8deeb9b107f5752f8977123比对。若比对一致,则确定脱敏后数组串对应的待脱敏数组串包含待追溯数字串。
如果换一个手机号13810556677,上面展示的脱敏后数组串在哈希串的比对中不会一致。同样的,若再换一个手机号15022450046,上面展示的脱敏后数组串不会被查找出。
本申请实施例基于上述步骤实现数据脱敏的处理方法。
本申请实施例中提供的一种数据脱敏的处理方法,通过遍历待脱敏字符串实现对敏感数据的识别。对敏感数据的每个字符做一次遍历,只关心这个字符本身,以及这个字符和前后字符的关系,不关心数据格式。这种不关心数据格式的脱敏处理方式可用于异构数据,同时并且可以保证完整和充分脱敏。解决了现有技术中,在识别敏感数据方面主要依赖于对数据格式的提前定义或者基于自然语言的识别的问题。同时,对于不确定性的异构数据可能存在的脱敏效果不理想,不能保证敏感数据都得到处理,以及处理速度较慢的问题也提出了解决方案。实现一个不需要提前定义格式的高效脱敏算法,保证充分脱敏。同时,对数组串的脱敏方式,具有可追溯,不可逆的特性,以在没有密钥,算法完全公开的情况下,脱敏依然有效。另外,脱敏之后的数据格式和原数据保持一样具有可读性,例如对手机号的脱敏,虽然不能还原出原始手机号,但是能看出这是一个手机号,而不是一串无意义的数字。
基于同一发明构思,本申请实施例还提供一种数据脱敏的处理装置,其中,如图6所示,该装置包括:
第一获取模块601,用于获取待脱敏字符串;
第一确定模块602,用于遍历所述待脱敏字符串中的各个字符,将连续字符的数量超过预设位数,且字符类型均为数字的所述待脱敏字符串中的部分连续字符确定为待脱敏数组串;
第一生成模块603,用于在所述待脱敏数组串中,将在预设起始位置起的连续的预设位数的字符替换为预设的数字,以生成脱敏后数组串,并将所述脱敏后数组串存储在结果缓冲区;
第二生成模块604,用于将所述待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的所述非保留字对应的遮盖字符存储在所述结果缓冲区,其中,所述非保留字符随机确定;
第三生成模块605,用于根据所述结果缓冲区中存储的各个字符,生成脱敏后字符串。
本实施例中,第一获取模块601、第一确定模块602、第一生成模块603、第二生成模块64和第三生成模块605的具体功能和交互方式,可参见图1对应的实施例的记载,在此不再赘述。
可选地,第一确定模块包括:
第一获取单元,用于获取当前字符的字符类型;
第二获取单元,用于在所述当前字符的所述字符类型为数字时,获取当前字符的前一个字符的字符类型;
第一存储单元,用于在所述前一个字符的字符类型为数字时,将所述当前字符存入已经建立的数字缓冲区;
第一判断单元,用于当遍历完所述待脱敏字符串包含的所有字符后,判断所述数字缓冲区中包含的连续字符的数量是否超过所述预设位数;
第一确定单元,用于当所述数字缓冲区中存储的连续字符的数量超过所述预设位数时,将连续字符组成的数组串确定为待脱敏数组串。
可选地,第一确定模块还包括:
第二存储单元,用于若所述当前字符的前一个字符的字符类型为非数字时,新建数字缓冲区,并将所述当前字符存入所述数字缓冲区。
可选地,该第一确定模块还包括:
第三存储单元,用于当所述数字缓冲区中存储的连续字符的数量未超过预设位数时,关闭所述数字缓冲区,并将所述数字缓冲区中存储的连续字符存储在结果缓冲区中。
可选地,该装置还包括:
第二获取模块606,用于若所述当前字符的字符类型为非数字时,获取当前字符的前一个字符的字符类型;
第一存储模块607,用于若所述前一个字符的字符类型为数字时,关闭所述数字缓冲区,并将所述当前字符存储在所述结果缓冲区。
可选地,第二生成模块604包括:
第三获取单元,用于若所述当前字符的所述字符类型为非数字,获取当前字符的前一个字符类型;
第二判断单元,用于若所述前一个字符的字符类型为非数字时,判断所述当前字符是否为ASCII字符;
第三存储单元,用于当所述当前字符为非ASCII字符时,根据随机确定的所述保留字符,将所述当前字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的所述非保留字符对应的遮盖字符存储在所述结果缓冲区。
可选地,第二生成模块604还包括:
第四存储单元,用于若所述当前字符为ASCII字符时,将当前字符存储在所述结果缓冲区。
可选地,第一生成模块603还包括:
第一生成单元,用于生成所述脱敏后数组串在脱敏前对应的数组串的随机盐;
第四获取单元,用于获取所述脱敏后数组串在所述待脱敏字符串中的位置信息;
第二生成单元,用于根据所述随机盐和所述脱敏前对应的数组串,生成所述脱敏后字符串的第一哈希串;
组成单元,用于基于所述随机盐、所述位置信息和所述第一哈希串,组成所述脱敏后数组串对应的追溯识别信息。
可选地,该装置还包括:
第三获取模块608,用于获取待追溯数字串;
分离模块609,用于在所述预设起始位置起,将所述待追溯数字串分离为前缀数字串和后缀数字串,其中,所述后缀数字串包含所述预设位数的字符;
查找模块610,用于根据所述前缀数字串,在所述各个脱敏后字符串中查找包含所述前缀数字串的脱敏后数组串;
第四获取模块611,用于当所述脱敏后数组串包含所述前缀数字串时,获取该所述脱敏后数组串对应的所述追溯识别信息;
判断模块612,用于基于所述追溯识别信息,判断所述脱敏后数组串在脱敏前是否包含所述待追溯数字串。
可选地,判断模块612包括:
第二生成单元,用于根据所述待追溯数字串的所述后缀数字串和所述追溯识别信息中的随机盐,生成第二哈希串;
对比单元,用于将所述第二哈希串与所述追溯识别信息中的所述第一哈希串进行对比;
第二确定单元,用于若所述第二哈希串与所述第一哈希串完全相同,则确定所述脱敏后数组串在脱敏前包含所述待追溯数字串;
第三确定单元,用于若所述第二哈希串与所述第一哈希串不同,则确定所述脱敏后数组串与所述待追溯数字串不对应。
如图7所示,本申请的又一实施例还提供一种终端设备,包括处理器70,其中,处理器70用于执行上述一种数据脱敏的处理方法中的各个步骤。
从图7中还可以看出,上述实施例提供的终端设备还包括非瞬时计算机可读存储介质71,该非瞬时计算机可读存储介质71上存储有计算机程序,该计算机程序被处理器70运行时执行上述一种数据脱敏的处理方法中的各个步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘和FLASH等,该存储介质上的计算机程序被运行时,能够执行上述一种数据脱敏的处理方法中的各个步骤。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (20)

1.一种数据脱敏的处理方法,其特征在于,包括:
获取待脱敏字符串;
遍历所述待脱敏字符串中的各个字符,将连续字符的数量超过预设位数,且字符类型均为数字的所述待脱敏字符串中的部分连续字符确定为待脱敏数组串;
在所述待脱敏数组串中,将在预设起始位置起的连续的预设位数的字符替换为预设的数字,以生成脱敏后数组串,并将所述脱敏后数组串存储在结果缓冲区;
将所述待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的所述非保留字对应的遮盖字符存储在所述结果缓冲区,其中,所述非保留字符随机确定;
根据所述结果缓冲区中存储的各个字符,生成脱敏后字符串;
其中,在所述将在预设起始位置起的连续的预设位数的字符替换为预设的数字的步骤的同时,该方法还包括:
生成所述脱敏后数组串在脱敏前对应的数组串的随机盐;
获取所述脱敏后数组串在所述待脱敏字符串中的位置信息;
根据所述随机盐和所述脱敏前对应的数组串,生成所述脱敏后字符串的第一哈希串;
基于所述随机盐、所述位置信息和所述第一哈希串,组成所述脱敏后数组串对应的追溯识别信息。
2.根据权利要求1所述的方法,其特征在于,所述将连续字符的数量超过预设位数,且字符类型均为数字的所述待脱敏字符串中的部分连续字符确定为待脱敏数组串的步骤,包括:
获取当前字符的字符类型;
在所述当前字符的所述字符类型为数字时,获取当前字符的前一个字符的字符类型;
在所述前一个字符的字符类型为数字时,将所述当前字符存入已经建立的数字缓冲区;
当遍历完所述待脱敏字符串包含的所有字符后,判断所述数字缓冲区中包含的连续字符的数量是否超过所述预设位数;
当所述数字缓冲区中存储的连续字符的数量超过所述预设位数时,将连续字符组成的数组串确定为待脱敏数组串。
3.根据权利要求2所述的方法,其特征在于,所述在前一个字符的字符类型为数字时,将所述当前字符存入已经建立的数字缓冲区的步骤和所述判断所述数字缓冲区中包含的连续字符的数量是否超过所述预设位数的步骤之间,还包括:
若所述当前字符的前一个字符的字符类型为非数字时,新建数字缓冲区,并将所述当前字符存入所述数字缓冲区。
4.根据权利要求2所述的方法,其特征在于,所述当数字缓冲区中存储的连续字符的数量超过所述预设位数时,将连续字符组成的数组串确定为待脱敏数组串的步骤之后,还包括:
当所述数字缓冲区中存储的连续字符的数量未超过预设位数时,关闭所述数字缓冲区,并将所述数字缓冲区中存储的连续字符存储在结果缓冲区中。
5.根据权利要求2所述的方法,其特征在于,所述将在预设起始位置起的连续的预设位数的字符替换为预设的数字的步骤和所述将所述待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符的步骤之间,还包括:
若所述当前字符的字符类型为非数字时,获取当前字符的前一个字符的字符类型;
若所述前一个字符的字符类型为数字时,关闭所述数字缓冲区,并将所述当前字符存储在所述结果缓冲区。
6.根据权利要求5所述的方法,其特征在于,所述将待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符的步骤,包括:
若所述当前字符的所述字符类型为非数字,获取当前字符的前一个字符类型;
若所述前一个字符的字符类型为非数字时,判断所述当前字符是否为ASCII字符;
当所述当前字符为非ASCII字符时,根据随机确定的所述保留字符,将所述当前字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的所述非保留字符对应的遮盖字符存储在所述结果缓冲区。
7.根据权利要求6所述的方法,其特征在于,所述将当前字符中的非保留字符随机替换为预设的遮盖字符的步骤之后,还包括:
若所述当前字符为ASCII字符时,将当前字符存储在所述结果缓冲区。
8.根据权利要求1所述的方法,其特征在于,所述根据结果缓冲区中存储的各个字符,生成脱敏后字符串的步骤之后,该方法还包括:
获取待追溯数字串;
在所述预设起始位置起,将所述待追溯数字串分离为前缀数字串和后缀数字串,其中,所述后缀数字串包含所述预设位数的字符;
根据所述前缀数字串,在所述各个脱敏后字符串中查找包含所述前缀数字串的脱敏后数组串;
当所述脱敏后数组串包含所述前缀数字串时,获取该所述脱敏后数组串对应的所述追溯识别信息;
基于所述追溯识别信息,确定所述脱敏后数组串包含所述待追溯数字串的结果。
9.根据权利要求8所述的方法,其特征在于,所述确定所述脱敏后数组串包含所述待追溯数字串的结果的步骤,包括:
根据所述待追溯数字串的所述后缀数字串和所述追溯识别信息中的随机盐,生成第二哈希串;
将所述第二哈希串与所述追溯识别信息中的所述第一哈希串进行对比;
若所述第二哈希串与所述第一哈希串完全相同,则确定所述脱敏后数组串对应的待脱敏数组串包含所述待追溯数字串;
若所述第二哈希串与所述第一哈希串不同,则确定所述脱敏后数组串与所述待追溯数字串不对应。
10.一种数据脱敏的处理装置,其特征在于,包括:
第一获取模块,用于获取待脱敏字符串;
第一确定模块,用于遍历所述待脱敏字符串中的各个字符,将连续字符的数量超过预设位数,且字符类型均为数字的所述待脱敏字符串中的部分连续字符确定为待脱敏数组串;
第一生成模块,用于在所述待脱敏数组串中,将在预设起始位置起的连续的预设位数的字符替换为预设的数字,以生成脱敏后数组串,并将所述脱敏后数组串存储在结果缓冲区;
第二生成模块,用于将所述待脱敏字符串中的非ASCII字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的所述非保留字对应的遮盖字符存储在所述结果缓冲区,其中,所述非保留字符随机确定;
第三生成模块,用于根据所述结果缓冲区中存储的各个字符,生成脱敏后字符串;
其中,所述第一生成模块还包括:
第一生成单元,用于生成所述脱敏后数组串在脱敏前对应的数组串的随机盐;
第四获取单元,用于获取所述脱敏后数组串在所述待脱敏字符串中的位置信息;
第二生成单元,用于根据所述随机盐和所述脱敏前对应的数组串,生成所述脱敏后字符串的第一哈希串;
组成单元,用于基于所述随机盐、所述位置信息和所述第一哈希串,组成所述脱敏后数组串对应的追溯识别信息。
11.根据权利要求10所述的装置,其特征在于,所述第一确定模块包括:
第一获取单元,用于获取当前字符的字符类型;
第二获取单元,用于在所述当前字符的所述字符类型为数字时,获取当前字符的前一个字符的字符类型;
第一存储单元,用于在所述前一个字符的字符类型为数字时,将所述当前字符存入已经建立的数字缓冲区;
第一判断单元,用于当遍历完所述待脱敏字符串包含的所有字符后,判断所述数字缓冲区中包含的连续字符的数量是否超过所述预设位数;
第一确定单元,用于当所述数字缓冲区中存储的连续字符的数量超过所述预设位数时,将连续字符组成的数组串确定为待脱敏数组串。
12.根据权利要求10所述的装置,其特征在于,所述第一确定模块还包括:
第二存储单元,用于若所述当前字符的前一个字符的字符类型为非数字时,新建数字缓冲区,并将所述当前字符存入所述数字缓冲区。
13.根据权利要求10所述的装置,其特征在于,所述第一确定模块还包括:
第三存储单元,用于当所述数字缓冲区中存储的连续字符的数量未超过预设位数时,关闭所述数字缓冲区,并将所述数字缓冲区中存储的连续字符存储在结果缓冲区中。
14.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于若所述当前字符的字符类型为非数字时,获取当前字符的前一个字符的字符类型;
第一存储模块,用于若所述前一个字符的字符类型为数字时,关闭所述数字缓冲区,并将所述当前字符存储在所述结果缓冲区。
15.根据权利要求10所述的装置,其特征在于,所述第二生成模块包括:
第三获取单元,用于若所述当前字符的所述字符类型为非数字,获取当前字符的前一个字符类型;
第二判断单元,用于若所述前一个字符的字符类型为非数字时,判断所述当前字符是否为ASCII字符;
第三存储单元,用于当所述当前字符为非ASCII字符时,根据随机确定的所述保留字符,将所述当前字符中的非保留字符替换为预设的遮盖字符,并将脱敏后的所述非保留字符对应的遮盖字符存储在所述结果缓冲区。
16.根据权利要求10所述的装置,其特征在于,所述第二生成模块还包括:
第四存储单元,用于若所述当前字符为ASCII字符时,将当前字符存储在所述结果缓冲区。
17.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第三获取模块,用于获取待追溯数字串;
分离模块,用于在所述预设起始位置起,将所述待追溯数字串分离为前缀数字串和后缀数字串,其中,所述后缀数字串包含所述预设位数的字符;
查找模块,用于根据所述前缀数字串,在所述各个脱敏后字符串中查找包含所述前缀数字串的脱敏后数组串;
第四获取模块,用于当所述脱敏后数组串包含所述前缀数字串时,获取该所述脱敏后数组串对应的所述追溯识别信息;
判断模块,用于基于所述追溯识别信息,确定所述脱敏后数组串包含所述待追溯数字串的结果。
18.根据权利要求10所述的装置,其特征在于,所述判断模块包括:
第二生成单元,用于根据所述待追溯数字串的所述后缀数字串和所述追溯识别信息中的随机盐,生成第二哈希串;
对比单元,用于将所述第二哈希串与所述追溯识别信息中的所述第一哈希串进行对比;
第二确定单元,用于若所述第二哈希串与所述第一哈希串完全相同,则确定所述脱敏后数组串对应的待脱敏数组串包含所述待追溯数字串;
第三确定单元,用于若所述第二哈希串与所述第一哈希串不同,则确定所述脱敏后数组串与所述待追溯数字串不对应。
19.一种非瞬时计算机可读存储介质,其特征在于,所述非瞬时计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行如权利要求1至9任一项所述的数据脱敏的处理方法中的各个步骤。
20.一种终端设备,其特征在于,包括处理器,所述处理器用于执行如权利要求1至9中任一项所述的数据脱敏的处理方法中的各步骤。
CN201910195883.9A 2019-03-15 2019-03-15 一种数据脱敏的处理方法、处理装置和存储介质 Active CN111767565B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910195883.9A CN111767565B (zh) 2019-03-15 2019-03-15 一种数据脱敏的处理方法、处理装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910195883.9A CN111767565B (zh) 2019-03-15 2019-03-15 一种数据脱敏的处理方法、处理装置和存储介质

Publications (2)

Publication Number Publication Date
CN111767565A CN111767565A (zh) 2020-10-13
CN111767565B true CN111767565B (zh) 2024-04-12

Family

ID=72717951

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910195883.9A Active CN111767565B (zh) 2019-03-15 2019-03-15 一种数据脱敏的处理方法、处理装置和存储介质

Country Status (1)

Country Link
CN (1) CN111767565B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112395645B (zh) * 2020-11-30 2024-06-11 中国民航信息网络股份有限公司 一种数据脱敏处理方法及装置
CN112800108A (zh) * 2021-01-18 2021-05-14 湖北宸威玺链信息技术有限公司 基于区块链的脱敏数据完整性检测方法及检测系统
CN112800447A (zh) * 2021-01-27 2021-05-14 北京明略软件系统有限公司 一种基于数据含义配置格式保留加密的方法与系统
CN113094742B (zh) * 2021-03-15 2024-05-03 国政通科技有限公司 数据脱敏方法、数据脱敏装置、电子设备及存储介质
CN113065164B (zh) * 2021-04-30 2024-07-05 中国工商银行股份有限公司 脱敏方法、装置和电子设备
CN113360942A (zh) * 2021-06-15 2021-09-07 广州小鹏智慧充电科技有限公司 数据处理方法、装置及电子设备
CN113242333A (zh) * 2021-07-12 2021-08-10 广州朗国电子科技股份有限公司 一种局域网ip映射生成方法及生成器
CN113434641B (zh) * 2021-07-26 2022-10-11 广州四三九九信息科技有限公司 一种多线程屏蔽字查询替换方法
CN118228293B (zh) * 2024-05-22 2024-08-27 天津市天益达科技发展有限公司 一种信息传输脱敏处理方法、系统、设备及存储介质
CN118627130A (zh) * 2024-08-13 2024-09-10 天翼视联科技有限公司 密态模糊搜索方法、装置以及计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776762A (zh) * 2018-06-08 2018-11-09 北京中电普华信息技术有限公司 一种数据脱敏的处理方法及装置
CN109344370A (zh) * 2018-08-23 2019-02-15 阿里巴巴集团控股有限公司 敏感内容脱敏、还原方法、装置及设备
CN109388965A (zh) * 2018-09-10 2019-02-26 全球能源互联网研究院有限公司 一种混合数据的脱敏方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090132419A1 (en) * 2007-11-15 2009-05-21 Garland Grammer Obfuscating sensitive data while preserving data usability

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776762A (zh) * 2018-06-08 2018-11-09 北京中电普华信息技术有限公司 一种数据脱敏的处理方法及装置
CN109344370A (zh) * 2018-08-23 2019-02-15 阿里巴巴集团控股有限公司 敏感内容脱敏、还原方法、装置及设备
CN109388965A (zh) * 2018-09-10 2019-02-26 全球能源互联网研究院有限公司 一种混合数据的脱敏方法及系统

Also Published As

Publication number Publication date
CN111767565A (zh) 2020-10-13

Similar Documents

Publication Publication Date Title
CN111767565B (zh) 一种数据脱敏的处理方法、处理装置和存储介质
CN107145799A (zh) 一种数据脱敏方法及装置
CN110008744B (zh) 数据脱敏方法和相关装置
CN107872323B (zh) 一种基于用户信息检测的口令安全性评估方法及系统
CN115618371A (zh) 一种非文本数据的脱敏方法、装置及存储介质
CN114818000B (zh) 隐私保护的集合混淆求交方法、系统及相关设备
CN108846292B (zh) 脱敏规则生成方法及装置
CN110955713A (zh) 一种助记词生成方法、装置及存储介质
CN111930976A (zh) 演示文稿生成方法、装置、设备及存储介质
CN113094742A (zh) 数据脱敏方法、数据脱敏装置、电子设备及存储介质
CN114707180B (zh) 日志脱敏方法和装置
CN112784112A (zh) 报文校验方法及装置
CN108932434B (zh) 一种基于机器学习技术的数据加密方法及装置
Torvi et al. An unique data security using text steganography
CN116055067B (zh) 一种弱口令检测的方法、装置、电子设备及介质
CN106357412B (zh) 一种核验身份信息的方法、装置及系统
CN109740359B (zh) 用于数据脱敏的方法、装置及存储介质
CN108985759B (zh) 一种加密货币的地址生成方法及系统、设备和存储介质
CN113841146A (zh) 同时满足安全性和易用性的密码生成方法
CN114840634A (zh) 信息存储方法、装置、电子设备和计算机可读介质
CN112528674B (zh) 文本处理方法、模型的训练方法、装置、设备及存储介质
CN114780649A (zh) 一种识别结构化数据实体类型的方法及装置
CN114928363A (zh) 数据处理方法、装置、计算机设备和存储介质
CN114298699A (zh) 非同质化代币的生成方法、获取方法及装置
CN105005743B (zh) 电话号码漂白和反向漂白方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant