CN114996758A - 一种数据脱敏方法、装置及电子设备 - Google Patents
一种数据脱敏方法、装置及电子设备 Download PDFInfo
- Publication number
- CN114996758A CN114996758A CN202210665534.0A CN202210665534A CN114996758A CN 114996758 A CN114996758 A CN 114996758A CN 202210665534 A CN202210665534 A CN 202210665534A CN 114996758 A CN114996758 A CN 114996758A
- Authority
- CN
- China
- Prior art keywords
- data
- desensitization
- script
- target
- target data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种数据脱敏方法、装置及电子设备,可应用于金融领域或其他领域。本申请中,用户仅需要输入待处理数据,后续数据脱敏设备能够基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据,确定所述目标数据对应的脱敏方式,获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本。相比于人工编写数据脱敏程序的方式,减少用户的数据输入量,并配置了数据脱敏脚本模板,能够避免由于人工编写错误导致的数据脱敏程序错误的情况,提高数据脱敏程序的准确度,且节省人力。
Description
技术领域
本发明涉及数据脱敏领域,更具体的说,涉及一种数据脱敏方法、装置及电子设备。
背景技术
数据脱敏指对数据中的敏感信息通过脱敏规则进行变形,实现敏感隐私数据的可靠保护。这样,就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的接近真实的数据集。
目前,在进行数据脱敏时,是人工编写数据脱敏程序,此种方式编写的数据脱敏程序的准确度低,且浪费人力。
发明内容
有鉴于此,本发明提供一种数据脱敏方法、装置及电子设备,以解决人工编写的数据脱敏程序的准确度低,且浪费人力的问题。
为解决上述技术问题,本发明采用了如下技术方案:
一种数据脱敏方法,应用于数据脱敏设备,所述数据脱敏方法包括:
获取待处理数据;所述待处理数据为用户通过预设输入方式输入;所述待处理数据的数量为多个;
基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据;
确定所述目标数据对应的脱敏方式;
获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本;
配置按日触发的脱敏工作流,所述脱敏工作流包括配置的所述目标数据的处理时间和处理顺序;
在达到所述处理时间时,运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序对所述目标数据进行数据脱敏操作。
可选地,基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据,包括:
获取所述待处理数据的属性信息中的字段信息,并基于所述字段信息确定所述待处理数据的脱敏类别;
筛选出脱敏类别为预设脱敏类别的待处理数据,并作为需要进行数据脱敏操作的目标数据。
可选地,确定所述目标数据对应的脱敏方式,包括:
获取所述目标数据对应的候选脱敏方式;
确定所述目标数据的业务场景;
从所述候选脱敏方式中选择出符合所述业务场景的候选脱敏方式,并作为所述目标数据的脱敏方式。
可选地,将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本,包括:
确定出所述数据脱敏脚本模板中添加所述目标数据和所述目标数据对应的脱敏方式的目标位置;
将所述目标数据和所述目标数据对应的脱敏方式,采用sql拼接的方式,添加到相应的目标位置,得到数据脱敏脚本。
可选地,运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序对所述目标数据进行数据脱敏操作,包括:
将所述数据脱敏脚本进行注册操作,并使用spark计算引擎运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序,确定出进行数据脱敏操作的目标数据,并按照所述目标数据对应的脱敏方式,对所述目标数据进行数据脱敏操作。
一种数据脱敏装置,应用于数据脱敏设备,所述数据脱敏装置包括:
数据获取模块,用于获取待处理数据;所述待处理数据为用户通过预设输入方式输入;所述待处理数据的数量为多个;
数据确定模块,用于基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据;
方式确定模块,用于确定所述目标数据对应的脱敏方式;
脚本生成模块,用于获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本;
工作流配置模块,用于配置按日触发的脱敏工作流,所述脱敏工作流包括配置的所述目标数据的处理时间和处理顺序;
脱敏处理模块,用于在达到所述处理时间时,运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序对所述目标数据进行数据脱敏操作。
可选地,所述数据确定模块具体用于:
获取所述待处理数据的属性信息中的字段信息,并基于所述字段信息确定所述待处理数据的脱敏类别,筛选出脱敏类别为预设脱敏类别的待处理数据,并作为需要进行数据脱敏操作的目标数据。
可选地,所述方式确定模块具体用于:
获取所述目标数据对应的候选脱敏方式,确定所述目标数据的业务场景,从所述候选脱敏方式中选择出符合所述业务场景的候选脱敏方式,并作为所述目标数据的脱敏方式。
可选地,所述脚本生成模块具体用于:
确定出所述数据脱敏脚本模板中添加所述目标数据和所述目标数据对应的脱敏方式的目标位置,将所述目标数据和所述目标数据对应的脱敏方式,采用sql拼接的方式,添加到相应的目标位置,得到数据脱敏脚本。
一种电子设备,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于执行上述的数据脱敏方法。
相较于现有技术,本发明具有以下有益效果:
本发明提供了一种数据脱敏方法、装置及电子设备,本发明中,用户仅需要输入待处理数据,后续数据脱敏设备能够基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据,确定所述目标数据对应的脱敏方式,获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本。相比于人工编写数据脱敏程序的方式,减少用户的数据输入量,并配置了数据脱敏脚本模板,能够避免由于人工编写错误导致的数据脱敏程序错误的情况,提高数据脱敏程序的准确度,且节省人力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种数据脱敏方法的方法流程图;
图2为本发明实施例提供的另一种数据脱敏方法的方法流程图;
图3为本发明实施例提供的再一种数据脱敏方法的方法流程图;
图4为本发明实施例提供的又一种数据脱敏方法的方法流程图;
图5为本发明实施例提供的一种数据脱敏装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,在进行数据脱敏时,是人工根据自身经验编写数据脱敏程序,人工编写容易出错,编写的数据脱敏程序中存在错误,使得编写的数据脱敏程序的准确度低,容易出现数据脱敏程序运行失败等情况。此外,人工编写浪费人力。
为了解决上述的数据脱敏程序的准确度低,且浪费人力的情况。本发明提供了一种数据脱敏方法、装置及电子设备,本发明中,用户仅需要输入待处理数据,后续数据脱敏设备能够基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据,确定所述目标数据对应的脱敏方式,获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本。相比于人工编写数据脱敏程序的方式,减少用户的数据输入量,并配置了数据脱敏脚本模板,能够避免由于人工编写错误导致的数据脱敏程序错误的情况,提高数据脱敏程序的准确度,且节省人力。
需要说明的是,本发明提供的一种数据脱敏方法、装置及电子设备可用于金融领域或其他领域,例如,可用于金融领域中的程序编写应用场景。其他领域为除金融领域之外的任意领域。上述仅为示例,并不对本发明提供的一种数据脱敏方法、装置及电子设备的应用领域进行限定。
在上述内容的基础上,本发明的一实施例提供了一种数据脱敏方法,应用于数据脱敏设备,数据脱敏设备可以是服务器、处理器等设备。
参照图1,数据脱敏方法可以包括:
S11、获取待处理数据。
所述待处理数据为用户通过预设输入方式输入。
其中,用户可以通过数据脱敏设备的数据表信息管理模块可视化进行待处理数据的输入。
该模块的主要功能是管理BDP-ODSS的源数据表,用户可按上游系统、表名检索,用于记录表结构信息,如表的基本信息和表中的字段的字段信息。其中,字段信息包括字段描述、取值范围、字段类型信息(数字型,字符型等)等。
用户通过数据表信息管理模块选择BDP-ODSS的源数据表中,需要进行脱敏的数据。
在选择时,首先选择需要进行数据脱敏操作的源数据表,然后从该源数据表中,选择出需要进行数据脱敏操作的字段。
源数据表中的这些字段为待处理数据,一般情况下,选择的待处理数据的数量为多个。在实际选择时,用户可以选择多个源数据表,每个源数据表中选择出多个字段。
S12、基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据。
其中,待处理数据的属性信息可以包括上述的字段信息,字段信息参照上述相应描述。
在实际应用中,会预先配置出只有哪些数据可以进行数据脱敏操作。虽然用户选择了一些需要进行数据脱敏操作的待处理数据,但有些待处理数据程序不能进行数据脱敏操作,则还需要从待处理数据中确定出程序能够进行数据脱敏操作的目标数据。
具体的,参照图2,步骤S12可以包括:
S21、获取所述待处理数据的属性信息中的字段信息,并基于所述字段信息确定所述待处理数据的脱敏类别。
具体的,字段信息中的字段描述可以描述该字段的一些基本信息,如,该字段为卡号数据、该字段为日期,该字段为包括校验位的账号等。
则可以从数据库获取字段信息中的字段类型信息和字段描述,并基于字段内容信息对该字段描述进行语义分析,即可得到待处理数据的脱敏类别。
S22、筛选出脱敏类别为预设脱敏类别的待处理数据,并作为需要进行数据脱敏操作的目标数据。
在实际应用中,能够进行数据脱敏操作的脱敏类别为预设脱敏类型。根据实际应用,配置了六种预设脱敏类别,分别为:
1、客户号或未包含校验位的账号;
2、包含校验位的账号;
3、卡号;
4、其它号码;
5、其他非号码类,包括汉字;
6、日期类。
在通过步骤S21确定出待处理数据的脱敏类别之后,判断该脱敏类别是否是预设脱敏类别。若是,则将该待处理数据作为需要进行数据脱敏操作的目标数据。
S13、确定所述目标数据对应的脱敏方式。
在实际应用中,预先配置了多种脱敏方式,如对照表、数据替换、偏移取整、掩码屏蔽、随机值、固定值、运算、加密等。对于同一数据,可以采用多种脱敏方式中的一种进行脱敏操作。
如卡号可以通过数据替换、固定值等方式进行脱敏操作。
在目标数据可以采用多种脱敏方式进行脱敏操作时,需要从多种脱敏方式中选择出一种来进行脱敏操作。
具体的,参照图3,步骤S13可以包括:
S31、获取所述目标数据对应的候选脱敏方式。
具体的,对于一预设脱敏类别,需要预先配置好其可以采用的候选脱敏方式。如对于日期类,可以采用数据替换、偏移取整、掩码屏蔽、随机值、固定值这几种候选脱敏方式。
对于一目标数据,首先获取目标数据对应的预设脱敏类别,然后将该预设脱敏类别对应的候选脱敏方式,作为目标数据对应的候选脱敏方式。
S32、确定所述目标数据的业务场景。
具体的,对于同一数据,不同的业务场景可以采用的不同的脱敏方式。则对于一目标数据,首先需要根据目标数据所在的源数据表的基本信息,确定出业务场景,如转账场景、汇款场景等。
S33、从所述候选脱敏方式中选择出符合所述业务场景的候选脱敏方式,并作为所述目标数据的脱敏方式。
具体的,每一业务场景可以使用哪种候选脱敏方式,可以预先配置。
则在确定出目标数据对应的候选脱敏方式后,可以从所述候选脱敏方式中选择出符合所述业务场景的候选脱敏方式,并作为所述目标数据的脱敏方式。
若是从所述候选脱敏方式中选择出的符合所述业务场景的候选脱敏方式为多个,则择一使用。
举例来说,对于2022.5这一目标数据,其对应的候选脱敏方式可以是数据替换、偏移取整、掩码屏蔽、随机值、固定值这几种候选脱敏方式,2022.5的业务场景为转账,转账可使用的候选脱敏方式为数据替换和偏移取整。则可以将数据替换和偏移取整之一作为2022.5这一目标数据的脱敏方式。
需要说明的是,每一脱敏方式可以对应一个hive UDF函数。hive UDF函数可以是人工预先编写,也可以是自动生成,本实施例中不做限定。
另外,用户还可以在字段信息中直接添加是否需要脱敏、如果需要脱敏则标记对应的脱敏类别,则在进行脱敏方式的确定时,可以直接从字段信息中获取脱敏类别,不再需要分析得到脱敏类别。
S14、获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本。
具体的,数据脱敏脚本模板需要预先定义,是一个公共sql脚本。
在获取到数据脱敏脚本模板之后,可以调用数据脱敏设备中的脱敏脚本公共组件将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本。
在生成数据脱敏脚本时,可以通过sql拼接按模板格式生成数据脱敏脚本。
具体的,参照图4,“将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本”,可以包括:
S41、确定出所述数据脱敏脚本模板中添加所述目标数据和所述目标数据对应的脱敏方式的目标位置。
具体的,数据脱敏脚本模板中需要添加数据的部分设置为位置标识,该位置标识表征此部分添加的是目标数据还是脱敏方式。
则可以根据位置标识,确定出数据脱敏脚本模板中,目标数据和所述目标数据对应的脱敏方式的目标位置。
一般情况下,目标数据位于目标数据对应的脱敏方式之前,且紧邻。
S42、将所述目标数据和所述目标数据对应的脱敏方式,采用sql拼接的方式,通过使用连接符添加到相应的目标位置,一键自动化生成表的脱敏脚本hivesql,得到数据脱敏脚本。
数据脱敏脚本可以如:
其中,数据脱敏脚本中的加下划线的字体即为本实施例中添加的目标数据和所述目标数据对应的脱敏方式。
需要说明的是,若是待处理数据涉及到多个源数据表,则可以为每个源数据表分别生成一个数据脱敏脚本,也可以是所有的源数据表的数据脱敏脚本通过连接符进行连接。
S15、配置按日触发的脱敏工作流。
所述脱敏工作流包括配置的所述目标数据的处理时间和处理顺序。
其中,在配置脱敏工作流时,可以按日触发。如可以设定每日的八点触发。
配置工作流时,需要考虑需要进行脱敏操作的目标数据的工作量和每日的处理量,使得工作流中,每日分配的任务量不大于每日的处理量。
需要说明的是,同一源数据表中的目标数据可以分配在同一日中,以方便操作。
在需要进行脱敏的源数据表的数量较多时,可以每天处理一部分源数据表,如18日,分别处理源数据表1-8,19日,分别处理源数据表9-10……
在实际应用中,可以设定每个源数据表的处理时间,如8点处理源数据表1,9点处理源数据表2……。此外,也可以是上一源数据表处理完成后,则顺序处理下一源数据表。
S16、在达到所述处理时间时,运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序对所述目标数据进行数据脱敏操作。
具体的,对于数据脱敏脚本,首先进行数据仓库工具hive上的注册,注册完成后。可以使用spark计算引擎运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序,确定出进行数据脱敏操作的目标数据,并按照所述目标数据对应的脱敏方式,对所述目标数据进行数据脱敏操作。脱敏时,可以对不同的目标数据进行不同脱敏方式的脱敏。
在实际应用中,可以在大数据平台创建脱敏工作流,工作流任务按日触发调起数据脱敏脚本,脚本运行在大数据平台上,自动化对每日的上游数据进行自动化脱敏后供后续的报表模型加工使用。
本发明在大数据平台下,实现大数据按日批量自动化脱敏,无需人为干预调起,并可以建立起完善的机制从源数据开始对数据表、脱敏方式、加工脚本、脱敏函数进行管理,可视化配置,系统可扩展性强,实现脱敏版本管理,代码复用,减少重复分析的成本,节省人力资源,大大地提高测试埋数造数的效率和准确性。
本实施例中,用户仅需要输入待处理数据,后续数据脱敏设备能够基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据,确定所述目标数据对应的脱敏方式,获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本。相比于人工编写数据脱敏程序的方式,减少用户的数据输入量,并配置了数据脱敏脚本模板,能够避免由于人工编写错误导致的数据脱敏程序错误的情况,提高数据脱敏程序的准确度,且节省人力。
可选地,在上述数据脱敏方法的实施例的基础上,本发明的另一实施例提供了一种数据脱敏装置,应用于数据脱敏设备,参照图5,所述数据脱敏装置包括:
数据获取模块11,用于获取待处理数据;所述待处理数据为用户通过预设输入方式输入;所述待处理数据的数量为多个;
数据确定模块12,用于基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据;
方式确定模块13,用于确定所述目标数据对应的脱敏方式;
脚本生成模块14,用于获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本;
工作流配置模块15,用于配置按日触发的脱敏工作流,所述脱敏工作流包括配置的所述目标数据的处理时间和处理顺序;
脱敏处理模块16,用于在达到所述处理时间时,运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序对所述目标数据进行数据脱敏操作。
进一步,所述数据确定模块具体用于:
获取所述待处理数据的属性信息中的字段信息,并基于所述字段信息确定所述待处理数据的脱敏类别,筛选出脱敏类别为预设脱敏类别的待处理数据,并作为需要进行数据脱敏操作的目标数据。
进一步,所述方式确定模块具体用于:
获取所述目标数据对应的候选脱敏方式,确定所述目标数据的业务场景,从所述候选脱敏方式中选择出符合所述业务场景的候选脱敏方式,并作为所述目标数据的脱敏方式。
进一步,所述脚本生成模块具体用于:
确定出所述数据脱敏脚本模板中添加所述目标数据和所述目标数据对应的脱敏方式的目标位置,将所述目标数据和所述目标数据对应的脱敏方式,采用sql拼接的方式,添加到相应的目标位置,得到数据脱敏脚本。
进一步,脱敏处理模块具体用于:
将所述数据脱敏脚本进行注册操作,并使用spark计算引擎运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序,确定出进行数据脱敏操作的目标数据,并按照所述目标数据对应的脱敏方式,对所述目标数据进行数据脱敏操作。
本实施例中,用户仅需要输入待处理数据,后续数据脱敏设备能够基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据,确定所述目标数据对应的脱敏方式,获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本。相比于人工编写数据脱敏程序的方式,减少用户的数据输入量,并配置了数据脱敏脚本模板,能够避免由于人工编写错误导致的数据脱敏程序错误的情况,提高数据脱敏程序的准确度,且节省人力。
需要说明的是,本实施例中的各个模块的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
可选地,在上述数据脱敏方法及装置的实施例的基础上,本发明的另一实施例提供了一种电子设备,电子设备可以是数据脱敏设备,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于执行上述的数据脱敏方法。
具体的,所述数据脱敏方法包括:
获取待处理数据;所述待处理数据为用户通过预设输入方式输入;所述待处理数据的数量为多个;
基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据;
确定所述目标数据对应的脱敏方式;
获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本;
配置按日触发的脱敏工作流,所述脱敏工作流包括配置的所述目标数据的处理时间和处理顺序;
在达到所述处理时间时,运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序对所述目标数据进行数据脱敏操作。
进一步,基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据,包括:
获取所述待处理数据的属性信息中的字段信息,并基于所述字段信息确定所述待处理数据的脱敏类别;
筛选出脱敏类别为预设脱敏类别的待处理数据,并作为需要进行数据脱敏操作的目标数据。
进一步,确定所述目标数据对应的脱敏方式,包括:
获取所述目标数据对应的候选脱敏方式;
确定所述目标数据的业务场景;
从所述候选脱敏方式中选择出符合所述业务场景的候选脱敏方式,并作为所述目标数据的脱敏方式。
进一步,将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本,包括:
确定出所述数据脱敏脚本模板中添加所述目标数据和所述目标数据对应的脱敏方式的目标位置;
将所述目标数据和所述目标数据对应的脱敏方式,采用sql拼接的方式,添加到相应的目标位置,得到数据脱敏脚本。
进一步,运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序对所述目标数据进行数据脱敏操作,包括:
将所述数据脱敏脚本进行注册操作,并使用spark计算引擎运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序,确定出进行数据脱敏操作的目标数据,并按照所述目标数据对应的脱敏方式,对所述目标数据进行数据脱敏操作。
本实施例中,用户仅需要输入待处理数据,后续数据脱敏设备能够基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据,确定所述目标数据对应的脱敏方式,获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本。相比于人工编写数据脱敏程序的方式,减少用户的数据输入量,并配置了数据脱敏脚本模板,能够避免由于人工编写错误导致的数据脱敏程序错误的情况,提高数据脱敏程序的准确度,且节省人力。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种数据脱敏方法,其特征在于,应用于数据脱敏设备,所述数据脱敏方法包括:
获取待处理数据;所述待处理数据为用户通过预设输入方式输入;所述待处理数据的数量为多个;
基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据;
确定所述目标数据对应的脱敏方式;
获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本;
配置按日触发的脱敏工作流,所述脱敏工作流包括配置的所述目标数据的处理时间和处理顺序;
在达到所述处理时间时,运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序对所述目标数据进行数据脱敏操作。
2.根据权利要求1所述的数据脱敏方法,其特征在于,基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据,包括:
获取所述待处理数据的属性信息中的字段信息,并基于所述字段信息确定所述待处理数据的脱敏类别;
筛选出脱敏类别为预设脱敏类别的待处理数据,并作为需要进行数据脱敏操作的目标数据。
3.根据权利要求1所述的数据脱敏方法,其特征在于,确定所述目标数据对应的脱敏方式,包括:
获取所述目标数据对应的候选脱敏方式;
确定所述目标数据的业务场景;
从所述候选脱敏方式中选择出符合所述业务场景的候选脱敏方式,并作为所述目标数据的脱敏方式。
4.根据权利要求1所述的数据脱敏方法,其特征在于,将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本,包括:
确定出所述数据脱敏脚本模板中添加所述目标数据和所述目标数据对应的脱敏方式的目标位置;
将所述目标数据和所述目标数据对应的脱敏方式,采用sql拼接的方式,添加到相应的目标位置,得到数据脱敏脚本。
5.根据权利要求1所述的数据脱敏方法,其特征在于,运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序对所述目标数据进行数据脱敏操作,包括:
将所述数据脱敏脚本进行注册操作,并使用spark计算引擎运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序,确定出进行数据脱敏操作的目标数据,并按照所述目标数据对应的脱敏方式,对所述目标数据进行数据脱敏操作。
6.一种数据脱敏装置,其特征在于,应用于数据脱敏设备,所述数据脱敏装置包括:
数据获取模块,用于获取待处理数据;所述待处理数据为用户通过预设输入方式输入;所述待处理数据的数量为多个;
数据确定模块,用于基于所述待处理数据的属性信息,从所述待处理数据中确定出需要进行数据脱敏操作的目标数据;
方式确定模块,用于确定所述目标数据对应的脱敏方式;
脚本生成模块,用于获取数据脱敏脚本模板,并将所述目标数据和所述目标数据对应的脱敏方式,添加到所述数据脱敏脚本模板中,得到数据脱敏脚本;
工作流配置模块,用于配置按日触发的脱敏工作流,所述脱敏工作流包括配置的所述目标数据的处理时间和处理顺序;
脱敏处理模块,用于在达到所述处理时间时,运行所述数据脱敏脚本,以使所述数据脱敏脚本按照所述处理顺序对所述目标数据进行数据脱敏操作。
7.根据权利要求6所述的数据脱敏装置,其特征在于,所述数据确定模块具体用于:
获取所述待处理数据的属性信息中的字段信息,并基于所述字段信息确定所述待处理数据的脱敏类别,筛选出脱敏类别为预设脱敏类别的待处理数据,并作为需要进行数据脱敏操作的目标数据。
8.根据权利要求6所述的数据脱敏装置,其特征在于,所述方式确定模块具体用于:
获取所述目标数据对应的候选脱敏方式,确定所述目标数据的业务场景,从所述候选脱敏方式中选择出符合所述业务场景的候选脱敏方式,并作为所述目标数据的脱敏方式。
9.根据权利要求6所述的数据脱敏装置,其特征在于,所述脚本生成模块具体用于:
确定出所述数据脱敏脚本模板中添加所述目标数据和所述目标数据对应的脱敏方式的目标位置,将所述目标数据和所述目标数据对应的脱敏方式,采用sql拼接的方式,添加到相应的目标位置,得到数据脱敏脚本。
10.一种电子设备,其特征在于,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于执行如权利要求1-5任一项所述的数据脱敏方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210665534.0A CN114996758A (zh) | 2022-06-14 | 2022-06-14 | 一种数据脱敏方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210665534.0A CN114996758A (zh) | 2022-06-14 | 2022-06-14 | 一种数据脱敏方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114996758A true CN114996758A (zh) | 2022-09-02 |
Family
ID=83034530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210665534.0A Pending CN114996758A (zh) | 2022-06-14 | 2022-06-14 | 一种数据脱敏方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114996758A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024139031A1 (zh) * | 2022-12-30 | 2024-07-04 | 上海爱数信息技术股份有限公司 | 数据处理方法 |
-
2022
- 2022-06-14 CN CN202210665534.0A patent/CN114996758A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024139031A1 (zh) * | 2022-12-30 | 2024-07-04 | 上海爱数信息技术股份有限公司 | 数据处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110795455B (zh) | 依赖关系解析方法、电子装置、计算机设备及可读存储介质 | |
CN110457260B (zh) | 文件处理方法、装置、设备及计算机可读存储介质 | |
CN111061733B (zh) | 数据处理方法、装置、电子设备和计算机可读存储介质 | |
CN112287013B (zh) | 数据转换方法及适配器 | |
CN113268500B (zh) | 业务处理方法、装置及电子设备 | |
CN110109981B (zh) | 工作队列的信息展示方法、装置、计算机设备和存储介质 | |
CN109711189B (zh) | 数据脱敏方法及装置、存储介质、终端 | |
CN111562907A (zh) | 自定义接口数据的转换方法与系统 | |
CN114996758A (zh) | 一种数据脱敏方法、装置及电子设备 | |
CN109189688B (zh) | 一种测试用例脚本的生成方法、生成装置及电子设备 | |
CN114861218A (zh) | 数据脱敏方法及装置 | |
CN110633258A (zh) | 日志插入方法、装置、计算机装置及存储介质 | |
CN110188106B (zh) | 一种数据管理方法和装置 | |
CN117033309A (zh) | 一种数据转换方法、装置、电子设备及可读存储介质 | |
CN116431481A (zh) | 一种基于多代码情况下的代码参数校验方法及装置 | |
CN115858049A (zh) | Rpa流程组件化编排方法、装置、设备和介质 | |
CN110110280B (zh) | 对坐标的曲线积分计算方法、装置、设备及存储介质 | |
CN112380820A (zh) | 数据自动回填方法、装置、电子设备及计算机存储介质 | |
CN113626281A (zh) | 慢sql语句追踪方法、装置、电子设备及存储介质 | |
CN112287738A (zh) | 图形控件的文本匹配方法及装置、介质、电子设备 | |
CN111126015B (zh) | 一种报表编制方法、设备 | |
US20190019054A1 (en) | Contact Information Identification System | |
CN113792048B (zh) | 非关系型数据库的表单校验规则生成方法和系统 | |
CN111079391B (zh) | 一种报表的生成方法及装置 | |
CN115080596B (zh) | 数据处理方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |