CN112347510A - 脱敏方法和脱敏装置 - Google Patents

脱敏方法和脱敏装置 Download PDF

Info

Publication number
CN112347510A
CN112347510A CN202011235759.XA CN202011235759A CN112347510A CN 112347510 A CN112347510 A CN 112347510A CN 202011235759 A CN202011235759 A CN 202011235759A CN 112347510 A CN112347510 A CN 112347510A
Authority
CN
China
Prior art keywords
data
desensitization
data type
desensitized
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011235759.XA
Other languages
English (en)
Other versions
CN112347510B (zh
Inventor
凌奥
沈怡
单慧宁
杨玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202011235759.XA priority Critical patent/CN112347510B/zh
Publication of CN112347510A publication Critical patent/CN112347510A/zh
Application granted granted Critical
Publication of CN112347510B publication Critical patent/CN112347510B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种脱敏方法和脱敏装置,属于信息安全技术领域。该脱敏方法包括获取待脱敏资源中的数据的数据类型,得到第一数据类型信息;获取需要进行脱敏的数据类型,得到第二数据类型信息;将所述第一数据类型信息与所述第二数据类型信息中相同的数据类型,确定为脱敏数据类型;以及对所述待脱敏资源中属于所述脱敏数据类型的数据进行脱敏。本公开还提供了一种电子设备、以及一种计算机可读存储介质。

Description

脱敏方法和脱敏装置
技术领域
本公开属于信息安全技术领域,更具体地,涉及一种脱敏方法和脱敏装置、一种电子设备、以及一种计算机可读存储介质。
背景技术
近年来国内外数据安全形势日益严峻,客户敏感数据保护要求愈加严格。尤其是对于金融行业会要求通过对客户敏感数据进行脱敏处理以降低客户数据的外泄风险。
现有的数据脱敏操作通常是由运维人员手动触发,而且通常会针对数据库中要脱敏的数据类型编写对应的脚本进行脱敏。这导致对不同来源的数据进行脱敏每次都得编写不同的脚本,无法统一自动化地进行脱敏。而且,由运维人员手工触发脱敏,存在漏做、不做脱敏、或者脚本被篡改等风险。
发明内容
有鉴于此,本公开实施例提供了一种可以广泛适用且自动执行的脱敏方法、脱敏装置、电子设备、以及介质。
本公开实施例的一个方面提供了一种脱敏方法。所述方法包括:获取待脱敏资源中的数据的数据类型,得到第一数据类型信息;获取需要进行脱敏的数据类型,得到第二数据类型信息;将所述第一数据类型信息与所述第二数据类型信息中相同的数据类型,确定为脱敏数据类型;以及对所述待脱敏资源中属于所述脱敏数据类型的数据进行脱敏。
根据本公开的实施例,所述方法还包括对生产环境下产生的数据的数据类型进行标记,其中,所述待脱敏资源中的数据来自于所述生产环境下产生的数据。则,所述获取待脱敏资源中的数据的数据类型,得到第一数据类型信息包括,根据对所述待脱敏资源中的数据的标记,获得所述第一数据类型信息。
根据本公开的实施例,所述对生产环境下产生的数据的数据类型进行标记包括:预先设置数据分类规则;以及按照所述数据分类规则对所述生产环境下产生的数据的数据类型进行标记。
根据本公开的实施例,所述对所述待脱敏资源中属于所述脱敏数据类型的数据进行脱敏包括:基于所述待脱敏资源的数据来源信息,获得第一脱敏规则;以及按照所述第一脱敏规则对所述待脱敏资源中属于所述脱敏数据类型的数据进行脱敏。
根据本公开的实施例,所述方法还包括:预先设置与M个数据来源信息中的每个数据来源信息对应的脱敏规则,其中,M为大于等于1的整数,所述M个数据来源信息包括数据库类型信息、文件类型信息、或接口类型信息中的至少之一。
根据本公开的实施例,所述基于所述待脱敏资源的数据来源信息,获得第一脱敏规则还包括:当不存在所述待脱敏资源的数据来源信息对应的脱敏规则时,等待人工处理;以及接收人工输入的与所述待脱敏资源的数据来源信息对应的所述第一脱敏规则。
根据本公开的实施例,所述对所述待脱敏资源中属于所述脱敏数据类型的数据进行脱敏包括:逐条读取所述待脱敏资源中的每条数据;以及对每条数据进行脱敏后,实时输出该条数据。
根据本公开的实施例,所述方法还包括预先设置N个脱敏策略;每个所述脱敏策略规定了需要进行脱敏的数据类型;N为大于等于1的整数;当N大于或等于2时,不同的所述脱敏策略中规定的数据类型不完全相同。则,所述获取需要进行脱敏的数据类型,得到第二数据类型信息包括:从N个所述脱敏策略中选择其中之一,以及基于所选择的所述脱敏策略,得到所述第二数据类型信息。
根据本公开的实施例,所述方法还包括,输出对所述待脱敏资源中的数据进行脱敏的脱敏日志。
本公开实施例的另一方面提供了一种脱敏装置。所述脱敏装置包括第一获取模块、第二获取模块、确定模块、以及脱敏模块。第一获取模块用于获取待脱敏资源中的数据的数据类型,得到第一数据类型信息。第二获取模块用于获取需要进行脱敏的数据类型,得到第二数据类型信息。确定模块用于将所述第一数据类型信息与所述第二数据类型信息中相同的数据类型,确定为脱敏数据类型。脱敏模块用于对所述待脱敏资源中属于所述脱敏数据类型的数据进行脱敏。
根据本公开的实施例,所述脱敏装置还包括生产数据标记模块。所述生产数据标记模块用于对生产环境下产生的数据的数据类型进行标记,其中,所述待脱敏资源中的数据来自于所述生产环境下产生的数据。所述第一获取模块还用于根据对所述待脱敏资源中的数据的标记,获得所述第一数据类型信息。
根据本公开的实施例,所述生产数据标记模块还用于预先设置数据分类规则,以及按照所述数据分类规则对所述生产环境下产生的数据的数据类型进行标记。
根据本公开的实施例,所述脱敏装置还包括脱敏规则设置模块。所述脱敏规则设置模块用于预先设置与M个数据来源信息中的每个数据来源信息对应的脱敏规则,其中,M为大于等于1的整数,所述M个数据来源信息包括数据库类型信息、文件类型信息、或接口类型信息中的至少之一。
根据本公开的实施例,所述脱敏模块还用于基于所述待脱敏资源的数据来源信息,获得第一脱敏规则;以及按照所述第一脱敏规则对所述待脱敏资源中属于所述脱敏数据类型的数据进行脱敏。
根据本公开的实施例,所述装置还包括脱敏策略设置模块。所述脱敏策略设置模块用于预先设置N个脱敏策略,每个所述脱敏策略规定了需要进行脱敏的数据类型;N为大于等于1的整数;当N大于或等于2时,不同的所述脱敏策略中规定的数据类型不完全相同。则所述第二获取模块还用于从N个所述脱敏策略中选择其中之一,以及基于所选择的所述脱敏策略,得到所述第二数据类型信息。
根据本公开的实施例,所述脱敏装置还包括日志模块。所述日志模块用于输出对所述待脱敏资源中的数据进行脱敏的脱敏日志。
本公开实施例的另一方面,提供了一种电子设备。所述电子设备包括一个或多个存储器、以及一个或多个处理器。所述存储器上存储有计算机可执行指令。所述处理器执行所述指令,以实现如上所述的方法。
本公开实施例的另一方面,提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如上所述的方法。
本公开实施例的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
上述一个或多个实施例具有如下优点或益效果:脱敏操作可以仅依赖数据类型的判断,而不依赖具体的使用场景以及具体的数据来源等,从而可以提供广泛适用的数据脱敏方案,在较大程度上可以实现数据脱敏的自动化和标准化。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的脱敏方法和脱敏装置的应用场景;
图2示意性示出了根据本公开一实施例的脱敏方法的流程图;
图3示意性示出了根据本公开一实施例的脱敏方法的流程图;
图4示意性示出了根据本公开一实施例的脱敏方法的流程图;
图5示意性示出了根据本公开一实施例的脱敏方法中执行脱敏操作的流程图;
图6示意性示出了根据本公开一实施例的脱敏方法的流程图;
图7示意性示出了根据本公开一实施例的脱敏装置的框图;
图8示意性示出了根据本公开另一实施例的脱敏装置的示意;以及
图9示意性示出了适于实现根据本公开实施例的脱敏方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
图1示意性示出了根据本公开实施例的脱敏方法和脱敏装置的应用场景100。
如图1所示,根据该实施例的应用场景100可以包括本公开实施例的脱敏装置110。
一般在用于测试、或者日志打印、或者其他对外提供数据时,会调用脱敏装置110进行数据脱敏。其中,根据本公开的实施例,在调用脱敏装置110的同时可以向脱敏装置110指定脱敏需求。该脱敏需求例如可以包括要对哪部分生产数据中的哪些类型的数据进行脱敏。根据该脱敏需求可以得到待脱敏资源101以及脱敏数据类型102。进而脱敏装置110将待脱敏资源101中的数据中符合脱敏数据类型102的数据进行脱敏后,输出脱敏后的资源103。脱敏装置110可以具体实现为下文所描述的脱敏装置700、脱敏装置800、或者电子设备900、或者计算机可读存储介质、或者计算机程序等。
该脱敏装置110可以执行根据本公开实施例的脱敏方法,进行数据脱敏。首先获取待脱敏资源101中的数据的数据类型,得到第一数据类型信息,然后获取需要进行脱敏的数据类型,得到第二数据类型信息,接下来将第一数据类型信息与第二数据类型信息中相同的数据类型,确定为脱敏数据类型102,最后对待脱敏资源101中属于脱敏数据类型102的数据进行脱敏。
数据类型例如可以括用户信息(例如,身份证号、电话号码、出生年月等类别)、财务信息(例如,扣款、转账、借贷信息等)、网络信息(例如,IP地址、登陆地、等等),账户信息(例如,储蓄卡卡号、信用卡卡号,等等),宗教信仰等类型。数据类型的内容和分类具体可以根据需要、经验或者不同法律法规来设置。
根据本公开的实施例,待脱敏资源101可以是数据库资源、文件资源、或者接口传输的资源。从而,本公开实施例在数据类型这一维度上对待脱敏资源101进行分析和处理,从而将数据类型和数据来源进行了解耦,使得本公开实施例的方法和装置可以应用于各种数据来源的资源。
该脱敏装置100可以不依赖于具体的使用场景,仅依据确定出的脱敏数据类型102进行数据脱敏,可以适用于联机业务场景下的脱敏需求,也可以适用于批量业务场景下的脱敏需求。
可见,本公开实施例的脱敏方法和脱敏装置提供了一种可以广泛适用于不同数据来源、不同应用场景下的统一的数据脱敏方案,在较大程度上可以实现数据脱敏的自动化和标准化。
需要说明的是,本公开实施例的脱敏方法和脱敏装置可用于金融领域,也可用于除金融领域之外的任意领域,对此本公开不做限定。
以下结合图1,参考图2~图6对本公开各个实施例的脱敏方法进行示例性说明。
图2示意性示出了根据本公开一实施例的脱敏方法的流程图。
如图2所示,根据该实施例的脱敏方法可以包括操作S210~操作S240。
在操作S210,获取待脱敏资源101中的数据的数据类型,得到第一数据类型信息。例如,可以对该脱敏资源101中的数据进行数据类型识别,得到第一数据类型信息。或者例如,根据本公开的一些实施例,可以按照一定的规则(例如,定时或手动触发)对生产环境下产生的全量生产数据的数据类型进行标记。其中,待脱敏资源101来自与生产环境下生产的数据。从而,当获取到待脱敏资源101时,待脱敏资源101中的数据的数据类型就可以根据所进行的标记获得。
在操作S220,获取需要进行脱敏的数据类型,得到第二数据类型信息。例如可以在调用脱敏装置110时,指定需要进行脱敏的数据类型。又例如,可以在脱敏装置110中预先设置多个脱敏策略,每个脱敏策略规定了需要进行脱敏的数据类型。从而,在调用脱敏装置110时通过选择对应的脱敏策略,来得到第二数据类型信息。
在操作S230,将第一数据类型信息与第二数据类型信息中相同的数据类型,确定为脱敏数据类型102。
当第一数据类型信息与第二数据类型信息相比,不存在相同的数据类型时,说明待脱敏资源101不需要进行脱敏操作,可以直接输出。
当第一数据类型信息与第二数据类型信息相比,存在相同的数据类型时,就可以将该相同的数据类型作为脱敏数据类型102。
在操作S240,对待脱敏资源101中属于脱敏数据类型102的数据进行脱敏。
根据本公开一实施例,在操作S240中进行脱敏时,可以逐条读取待脱敏资源101中的每条数据,并对每条数据进行脱敏后,实时输出该条数据。以此方式,可以按照流式处理的方在获取到生产数据的同时进行脱敏,可以不必将生产数据存储在本地后再运行脱敏装置110进行脱敏,从而可以避免生产数据从本地被截取,降低生产数据在本地存储泄露的风险。
根据本公开的实施例,在数据类型这一维度上对待脱敏资源101进行分析和处理,使得脱敏操作仅依赖数据类型的判断,而不依赖具体的使用场景以及具体的数据来源等,以此方式提供了一种可以广泛适用于不同数据来源、不同应用场景下的数据脱敏方案,在较大程度上可以实现数据脱敏的自动化和标准化。
图3示意性示出了根据本公开一实施例的脱敏方法的流程图。
如图3所示,根据该实施例的脱敏方法可以包括操作S311、操作S312、以及操作S220~操作S240。
首先在操作S311,对生产环境下产生的数据的数据类型进行标记,其中,待脱敏资源101中的数据来自于生产环境下产生的数据。
例如,可以定时或手动触发对生产环境下产生的全量生产数据的数据类型进行分类标记。其中,生产环境下产生的数据例如可以是生产环境下写入各个数据库的数据,或者可以是生产环境下生成的文件中的数据,或者各类接口传输的数据等。
根据本公开的一个实施例,可以预先设置数据分类规则,然后按照数据分类规则对生产环境下产生的数据的数据类型进行标记。
该数据分类规则可以包括设置数据类型的内容。例如可以根据不同的法律法规要求设置可能被要求脱敏的数据类型的内容。数据类型例如可以包括用户信息(例如,身份证号、电话号码、出生年月等类别)、财务信息(例如,扣款、转账、借贷信息等)、网络信息(例如,IP地址、登陆地、等等),账户信息(例如,储蓄卡卡号、信用卡卡号,等等)等类型。根据一些法律法规或习俗,宗教信仰、性别、身高、种族等信息也可以被设置为要标记分类的数据类型。
该数据分类规则也可以包括如何进行数据类型的分类等。例如,可以根据各个数据库中的每个数据表中各个字段的字段名、或者数据格式(数字、还是字母、数据长度等)来识别或设置各个字段的数据类型。又例如,对于文本数据,可以通过分词、词性识别等标记文本中的数据的数据类型。
然后在操作S312,根据对待脱敏资源101中的数据的标记,获得第一数据类型信息。在调用脱敏装置110进行脱敏时,根据指定脱敏需求中给出的待脱敏资源101的信息(例如,数据库名和数据表名),查询对待脱敏资源101中的数据的数据类型的标记,就可以得到第一数据类型信息。
接下来经过操作S220~操作S240,根据第一数据类型信息和第二数据类型信息得到脱敏数据类型102,并对待脱敏资源101中属于脱敏数据类型102的数据进行脱敏。具体与前述一致,此处不再赘述。
根据本公开的实施例,可以通过对生产环境下产生的数据(例如,全量生产数据)按照几乎全部可能被要求脱敏的数据类型进行分类标记,在极大程度上可以确保几乎所有的客户敏感数据均被识别并标记出。从而在在调用脱敏装置110进行脱敏时,不仅可以快速自动确定出脱敏数据类型102,还可以在极大程度上地确保所有的客户敏感数据均纳入了脱敏范围,提高脱敏的覆盖范围和效率。
图4示意性示出了根据本公开一实施例的脱敏方法的流程图。
如图4所示,根据该实施例的脱敏方法可以包括操作S410、操作S210、操作S211~操作S222、以及操作S230~操作S240。
首先在操作S410,预先设置N个脱敏策略,每个脱敏策略规定了需要进行脱敏的数据类型;N为大于等于1的整数;当N大于或等于2时,不同的脱敏策略中规定的数据类型不完全相同。例如,在每个脱敏策略中可以以脱敏数据列表的方式规定需要脱敏的数据类型。
然后在有脱敏需求时在操作S210,获取待脱敏资源101中的数据的数据类型,得到第一数据类型信息。具体与前述一致。
接着在操作S221,从N个脱敏策略中选择其中之一。例如,根据脱敏需求选择脱敏策略。例如,当调用脱敏装置110时指定一个脱敏对象参数,该脱敏对象参数用于标识一个脱敏策略。根据该脱敏对象参数,就可以选择出该脱敏策略。
之后在操作S222,基于所选择的脱敏策略,得到第二数据类型信息。从而,在要对待脱敏资源101进行脱敏时,可以根据调用方选择的脱敏策略,确定出第二数据类型信息
接下来经过操作S230~操作S240,根据第一数据类型信息和第二数据类型信息得到脱敏数据类型102,并对待脱敏资源101中属于脱敏数据类型102的数据进行脱敏。具体与前述一致,不再赘述。
图5示意性示出了根据本公开一实施例的脱敏方法中执行脱敏操作的流程图。
如图5所示,根据本公开的实施例,操作S240可以包括操作S241~操作S242。根据本公开另一些实施例,在操作S241之前还可以包括操作S510~操作S540。根据本公开实施例的脱敏方法中可以根据待脱敏资源101的数据来源确定执行脱敏操作时所使用的脱敏规则。
具体地在操作S510,预先设置与M个数据来源信息中的每个数据来源信息对应的脱敏规则,其中,M为大于等于1的整数,M个数据来源信息包括数据库类型信息、文件类型信息、或接口类型信息中的至少之一。
在脱敏装置110中可以针对待脱敏资源101的可能的各种数据来源设置对应的脱敏规则,其中,数据来源可以包括各种类型的数据库、各种文件、以及各类接口等;例如,对不同类型的数据库(例如,MySQL数据库和Orical数据库)可以设置不同的SQL语句;或者为适应不同数据库的数据读写方式设置不同的数据读写和脱敏替换方式;或者对于文件或者接口中的数据设置不同的读取数据的方式、数据识别方式等。
在操作S520,确定是否存在待脱敏资源101的数据来源信息对应的脱敏规则。若不存在,则执行操作S530和操作S540;若存在则执行操作S241~操作S242。
在操作S530,当不存在待脱敏资源101的数据来源信息对应的脱敏规则时,触发异常处理机制,等待人工处理。
在操作S540,接收人工输入的与待脱敏资源101的数据来源信息对应的第一脱敏规则。然后人工触发脱敏流程恢复执行,例如返回操作S520。
当脱敏装置110对待脱敏资源101进行脱敏时,发现没有与待脱敏资源101的数据来源对应的脱敏规则时,可以触发异常处理机制,等待人工输入与该待脱敏资源101的数据来源对应的脱敏规则后,再继续进行脱敏。从而可以避免当没有合适的脱敏规则时就不对数据进行脱敏而导致的漏检问题。
在操作S241,基于待脱敏资源101的数据来源信息,获得第一脱敏规则。例如,获得预先设置的与待脱敏资源101的数据来源信息对应的脱敏规则,即为第一脱敏规则。
然后在操作S242,按照第一脱敏规则对待脱敏资源中属于脱敏数据类型102的数据进行脱敏。
以此方式,脱敏装置110在对待脱敏资源101执行脱敏操作时,可以根据待脱敏资源101的数据来源选择对应的脱敏规则来实现数据脱敏,使得脱敏装置110可以适用于对多种数据来源中的数据自动脱敏。
图6示意性示出了根据本公开一实施例的脱敏方法的流程图。
如图6所示,根据该实施例的脱敏方法可以除了操作S210~操作S240以外,还可以包括操作S650。
在操作S650,输出对待脱敏资源101中的数据进行脱敏的脱敏日志。脱敏日志记录脱敏装置110在对待脱敏资源101进行脱敏过程中的运行情况和运行结果,例如,是否触发异常处理,脱敏数据类型102,对属于脱敏数据类型102的数据进行的脱敏操作的内容(例如,替换或者转换前后的数据、替换或者转换的逻辑等)。以便于后期追踪或者数据维护等。
图7示意性示出了根据本公开一实施例的脱敏装置700的框图。
如图7所示,根据本公开实施例的脱敏装置700可以包括第一获取模块710、第二获取模块720、确定模块730、以及脱敏模块740。根据本公开另一些实施例,脱敏装置700还可以包括生产数据标记模块750、脱敏规则设置模块760、脱敏策略设置模块770、和日志模块780中的任意至少之一。该脱敏装置700为脱敏装置110的一个具体实施例,可以用于执行参考图2~图6所描述的脱敏方法。
第一获取模块710用于获取待脱敏资源中的数据的数据类型,得到第一数据类型信息。
第二获取模块720用于获取需要进行脱敏的数据类型,得到第二数据类型信息。
确定模块730用于将第一数据类型信息与第二数据类型信息中相同的数据类型,确定为脱敏数据类型。
脱敏模块740用于对待脱敏资源中属于脱敏数据类型的数据进行脱敏。
根据本公开一实施例,生产数据标记模块750用于对生产环境下产生的数据的数据类型进行标记,其中,待脱敏资源中的数据来自于生产环境下产生的数据。根据本公开的另一实施例,生产数据标记模块750还用于预先设置数据分类规则,以及按照数据分类规则对生产环境下产生的数据的数据类型进行标记。相应地,第一获取模块710还用于根据对待脱敏资源中的数据的标记,获得第一数据类型信息。
根据本公开一实施例,脱敏规则设置模块760用于预先设置与M个数据来源信息中的每个数据来源信息对应的脱敏规则,其中,M为大于等于1的整数,M个数据来源信息包括数据库类型信息、文件类型信息、或接口类型信息中的至少之一。进一步地,脱敏模块740还用于基于待脱敏资源的数据来源信息,获得第一脱敏规则,以及按照第一脱敏规则对待脱敏资源中属于脱敏数据类型的数据进行脱敏。
根据本公开一实施例,脱敏策略设置模块770用于预先设置N个脱敏策略,每个脱敏策略规定了需要进行脱敏的数据类型;N为大于等于1的整数;当N大于或等于2时,不同的脱敏策略中规定的数据类型不完全相同。则第二获取模块720还用于从N个脱敏策略中选择其中之一,以及基于所选择的脱敏策略,得到第二数据类型信息。
根据本公开的实施例,日志模块780用于输出对待脱敏资源中的数据进行脱敏的脱敏日志。
图8示意性示出了根据本公开另一实施例的脱敏装置800的示意。该脱敏装置800为脱敏装置110的另一具体实施例。
如图8所示,该脱敏装置800可以包括脱敏程序模块810、数据类型标记模块820、参数管理模块830、异常处置模块840、日志记录模块850、以及用户交互模块860。
脱敏程序模块810:负责接收脱敏需求801。脱敏需求801可以包括待脱敏资源的信息(例如,待脱敏资源的名称或者存储位置等)和用于指示脱敏策略的脱敏对象参数。脱敏程序模块810通过与数据类型标记模块820、参数管理模块830交互,获得脱敏程序模块810的执行参数。该执行参数例如可以是对待脱敏资源中的字段、数据等替换后的结果参数等。脱敏程序模块810根据参数运行脱敏程序,记录程序运行日志并对外输出脱敏后的数据结果。若脱敏过程中有任何异常情况,将具体情况提供给异常处置模块840处理。
数据类型标记模块820:负责根据预先设置的数据分类规则,自动对生产数据804的数据类型进行分类标记,得到数据分类信息。同时在脱敏过程中,可以从数据分类信息中查询对待脱敏资源中的数据的标记,得到第一数据类型信息,并将结果返回脱敏程序模块810。
参数管理模块830:其中存储了脱敏策略和与不同数据来源对应的脱敏规则。每个脱敏策略中可以通过脱敏数据列表记录需要实施脱敏的数据类别。脱敏规则中记录了对不同数据来源(包括数据库、文件、接口)进行脱敏操作的手段。
异常处置模块840:负责接收并存储脱敏程序模块810提供的脱敏异常情况,通过用户交互模块860向运维人员提示,待运维人员处理后,向脱敏程序模块810重新发起脱敏流程。
日志记录模块850:负责记录脱敏程序运行情况和运行结果。
用户交互模块860:负责接收并展现运维人员设置的数据分类规则、脱敏规则、脱敏策略等参数,负责向运维人员展现脱敏异常情况和日志记录。
脱敏装置800的工作场景可以分为脱敏处置场景、以及运维场景。
在脱敏处置场景中,脱敏装置800被调用进行数据脱敏,具体可以包括以下步骤S11~步骤S18。
步骤S11,脱敏程序模块810接收数据需求801。数据需求801包括待脱敏资源的信息以及脱敏对象参数。
步骤S12,脱敏程序模块810将数据需求801提供给数据类型标记模块820,数据类型标记模块820从对生产数据804分类标记得到的数据分信息中查询到待脱敏资源中的数据的数据类型信息(即,第一数据类型信息),并将结果返回脱敏程序模块810。
步骤S13,脱敏程序模块810将第一数据类型信息和脱敏对象参数提供给参数管理模块830,参数管理模块830根据脱敏对象参数选择对应的脱敏策略。依据所选择的脱敏策略中脱敏数据列表中该规定的数据类型得到第二数据类型信息。再结合第一数据类型信息和第二数据类型信息确认是否存在需要脱敏的数据类型(即,得到脱敏数据类型)。若存在脱敏数据类型,将脱敏数据类型的返回脱敏程序模块810,并执行步骤S14,否则执行步骤S17。
步骤S14,脱敏程序模块810将脱敏数据类型、待脱敏资源的数据来源信息提供给参数管理模块830。参数管理模块830根据待脱敏资源的数据来源信息选择对应的脱敏规则,生成脱敏程序模块810的执行参数,并将结果返回脱敏程序模块810。
步骤S15,脱敏程序模块810从生产环境获取待脱敏数据资源,并根据执行参数运行脱敏程序。
步骤S16,若脱敏过程中出现异常情况,脱敏程序模块810将具体情况提供给异常处置模块840处理
步骤S17,脱敏程序运行结束后,脱敏程序模块810将程序运行情况提供给日志记录模块850。
步骤S18,脱敏程序模块810将脱敏后的数据结果(即,脱敏数据803向外输出。
在运维场景中,运维人员设置并访问脱敏装置800中的各种参数,例如脱敏策略、脱敏规则、数据分类规则、异常处置触发条件等。具体可以包括以下步骤S21~步骤S26。
步骤S21,用户通过web页面,访问用户交互模块860,进行参数设置、异常处置和日志审计
步骤S22,用户交互模块860从数据类型标记模块820获取数据分类规则、数据类型的内容并向运维人员进行展示,在运维人员修改或新增数据分类规则、数据类型的内容后,提供给数据类型标记模块820进行存储。
步骤S23,数据类型标记模块820根据数据类型的内容和数据分类规则,自动对全量生产数据进行分类标记,并记录在数据分类信息中。
步骤S24,用户交互模块860从参数管理模块830获取脱敏数据列表、脱敏规则并向运维人员进行展示,在运维人员修改或新增脱敏策略中的脱敏数据列表、脱敏规则后,提供给参数管理模块830进行存储。
步骤S25,用户交互模块860从异常处置模块840获取脱敏异常情况并向运维人员进行展示,在运维人员确认已完成处置后,将信息提供给异常处置模块840,异常处置模块840向脱敏程序模块810重新发起脱敏流程。
步骤S26,用户交互模块860从日志记录模块850获取脱敏程序运行日志向运维人员进行展示。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一获取模块710、第二获取模块720、确定模块730、脱敏模块740、生产数据标记模块750、脱敏规则设置模块760、脱敏策略设置模块770、日志模块780、脱敏程序模块810、数据类型标记模块820、参数管理模块830、异常处置模块840、日志记录模块850中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一获取模块710、第二获取模块720、确定模块730、脱敏模块740、生产数据标记模块750、脱敏规则设置模块760、脱敏策略设置模块770、日志模块780、脱敏程序模块810、数据类型标记模块820、参数管理模块830、异常处置模块840、日志记录模块850中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一获取模块710、第二获取模块720、确定模块730、脱敏模块740、生产数据标记模块750、脱敏规则设置模块760、脱敏策略设置模块770、日志模块780、脱敏程序模块810、数据类型标记模块820、参数管理模块830、异常处置模块840、日志记录模块850中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图9示意性示出了适于实现根据本公开实施例的脱敏方法的电子设备900图。图9示出的电子设备900为脱敏装置110的一个具体实施例。电子设备900仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,根据本公开实施例的电子设备900包括处理器901,其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。处理器901例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器901还可以包括用于缓存用途的板载存储器。处理器901可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 903中,存储有电子设备900操作所需的各种程序和数据。处理器901、ROM902以及RAM 903通过总线904彼此相连。处理器901通过执行ROM 902和/或RAM 903中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 902和RAM 903以外的一个或多个存储器中。处理器901也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备900还可以包括输入/输出(I/O)接口905,输入/输出(I/O)接口905也连接至总线904。电子设备900还可以包括连接至I/O接口905的以下部件中的一项或多项:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被处理器901执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM902和/或RAM 903和/或ROM 902和RAM 903以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (12)

1.一种脱敏方法,包括:
获取待脱敏资源中的数据的数据类型,得到第一数据类型信息;
获取需要进行脱敏的数据类型,得到第二数据类型信息;
将所述第一数据类型信息与所述第二数据类型信息中相同的数据类型,确定为脱敏数据类型;以及
对所述待脱敏资源中属于所述脱敏数据类型的数据进行脱敏。
2.根据权利要求1所述的方法,其中,
所述方法还包括:对生产环境下产生的数据的数据类型进行标记,其中,所述待脱敏资源中的数据来自于所述生产环境下产生的数据;
则所述获取待脱敏资源中的数据的数据类型,得到第一数据类型信息包括:根据对所述待脱敏资源中的数据的标记,获得所述第一数据类型信息。
3.根据权利要求2所述的方法,其中,所述对生产环境下产生的数据的数据类型进行标记包括:
预先设置数据分类规则;以及
按照所述数据分类规则对所述生产环境下产生的数据的数据类型进行标记。
4.根据权利要求1所述的方法,其中,所述对所述待脱敏资源中属于所述脱敏数据类型的数据进行脱敏包括:
基于所述待脱敏资源的数据来源信息,获得第一脱敏规则;以及
按照所述第一脱敏规则对所述待脱敏资源中属于所述脱敏数据类型的数据进行脱敏。
5.根据权利要求4所述的方法,其中,所述方法还包括:
预先设置与M个数据来源信息中的每个数据来源信息对应的脱敏规则,其中,M为大于等于1的整数,所述M个数据来源信息包括数据库类型信息、文件类型信息、或接口类型信息中的至少之一。
6.根据权利要求5所述的方法,其中,所述基于所述待脱敏资源的数据来源信息,获得第一脱敏规则还包括:
当不存在所述待脱敏资源的数据来源信息对应的脱敏规则时,等待人工处理;以及
接收人工输入的与所述待脱敏资源的数据来源信息对应的所述第一脱敏规则。
7.根据权利要求1所述的方法,其中,所述对所述待脱敏资源中属于所述脱敏数据类型的数据进行脱敏包括:
逐条读取所述待脱敏资源中的每条数据;以及
对每条数据进行脱敏后,实时输出该条数据。
8.根据权利要求1所述的方法,其中,
所述方法还包括:预先设置N个脱敏策略,每个所述脱敏策略规定了需要进行脱敏的数据类型;N为大于等于1的整数;当N大于或等于2时,不同的所述脱敏策略中规定的数据类型不完全相同;
则所述获取需要进行脱敏的数据类型,得到第二数据类型信息包括:从N个所述脱敏策略中选择其中之一,以及基于所选择的所述脱敏策略,得到所述第二数据类型信息。
9.根据权利要求1所述的方法,其中,所述方法还包括:
输出对所述待脱敏资源中的数据进行脱敏的脱敏日志。
10.一种脱敏装置,包括:
第一获取模块,用于获取待脱敏资源中的数据的数据类型,得到第一数据类型信息;
第二获取模块,用于获取需要进行脱敏的数据类型,得到第二数据类型信息;
确定模块,用于将所述第一数据类型信息与所述第二数据类型信息中相同的数据类型,确定为脱敏数据类型;以及
脱敏模块,用于对所述待脱敏资源中属于所述脱敏数据类型的数据进行脱敏。
11.一种电子设备,包括:
一个或多个存储器,其上存储有计算机可执行指令;
一个或多个处理器,所述处理器执行所述指令,以实现根据权利要求1~9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~9中任一项所述的方法。
CN202011235759.XA 2020-11-06 2020-11-06 脱敏方法和脱敏装置 Active CN112347510B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011235759.XA CN112347510B (zh) 2020-11-06 2020-11-06 脱敏方法和脱敏装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011235759.XA CN112347510B (zh) 2020-11-06 2020-11-06 脱敏方法和脱敏装置

Publications (2)

Publication Number Publication Date
CN112347510A true CN112347510A (zh) 2021-02-09
CN112347510B CN112347510B (zh) 2024-03-29

Family

ID=74429495

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011235759.XA Active CN112347510B (zh) 2020-11-06 2020-11-06 脱敏方法和脱敏装置

Country Status (1)

Country Link
CN (1) CN112347510B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679418A (zh) * 2017-09-30 2018-02-09 武汉汉思信息技术有限责任公司 数据脱敏方法、服务器及存储介质
CN109388965A (zh) * 2018-09-10 2019-02-26 全球能源互联网研究院有限公司 一种混合数据的脱敏方法及系统
CN109558746A (zh) * 2018-11-06 2019-04-02 泰康保险集团股份有限公司 数据脱敏方法、装置、电子设备及存储介质
CN110245470A (zh) * 2019-04-25 2019-09-17 深圳壹账通智能科技有限公司 智能数据脱敏方法、装置、计算机设备和存储介质
CN110955914A (zh) * 2019-12-02 2020-04-03 智器云南京信息科技有限公司 一种待脱敏数据的处理方法、系统、终端设备和存储介质
CN111339559A (zh) * 2020-02-25 2020-06-26 北京同邦卓益科技有限公司 一种日志脱敏的数据处理方法及装置
CN111651784A (zh) * 2020-04-28 2020-09-11 中国平安财产保险股份有限公司 日志脱敏方法、装置、设备及计算机可读存储介质
CN111666587A (zh) * 2020-05-10 2020-09-15 武汉理工大学 基于监督学习的食品数据多属性特征联合脱敏方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679418A (zh) * 2017-09-30 2018-02-09 武汉汉思信息技术有限责任公司 数据脱敏方法、服务器及存储介质
CN109388965A (zh) * 2018-09-10 2019-02-26 全球能源互联网研究院有限公司 一种混合数据的脱敏方法及系统
CN109558746A (zh) * 2018-11-06 2019-04-02 泰康保险集团股份有限公司 数据脱敏方法、装置、电子设备及存储介质
CN110245470A (zh) * 2019-04-25 2019-09-17 深圳壹账通智能科技有限公司 智能数据脱敏方法、装置、计算机设备和存储介质
CN110955914A (zh) * 2019-12-02 2020-04-03 智器云南京信息科技有限公司 一种待脱敏数据的处理方法、系统、终端设备和存储介质
CN111339559A (zh) * 2020-02-25 2020-06-26 北京同邦卓益科技有限公司 一种日志脱敏的数据处理方法及装置
CN111651784A (zh) * 2020-04-28 2020-09-11 中国平安财产保险股份有限公司 日志脱敏方法、装置、设备及计算机可读存储介质
CN111666587A (zh) * 2020-05-10 2020-09-15 武汉理工大学 基于监督学习的食品数据多属性特征联合脱敏方法和装置

Also Published As

Publication number Publication date
CN112347510B (zh) 2024-03-29

Similar Documents

Publication Publication Date Title
CN111240994B (zh) 漏洞处理方法、装置、电子设备及可读存储介质
US9753838B2 (en) System and method to classify automated code inspection services defect output for defect analysis
US8316353B2 (en) Problem analysis via matching contiguous stack trace lines to symptom rules
US10009227B2 (en) Network service provisioning tool and method
US11184313B1 (en) Message content cleansing
CN115357663A (zh) 基于增量数据同步组件的数据同步方法、系统及装置
CN115080433A (zh) 基于流量回放的测试方法及装置
CN116701123A (zh) 任务预警方法、装置、设备、介质及程序产品
CN112347510A (zh) 脱敏方法和脱敏装置
CN115391655A (zh) 信息查询方法及装置、电子设备和计算机可读存储介质
CN114301713A (zh) 风险访问检测模型的训练方法、风险访问检测方法及装置
CN111405060B (zh) 服务影响范围确定方法、装置、工具和电子设备
CN114707961A (zh) 基于审批流配置的待审批任务执行方法、装置、设备、介质和程序产品
CN113449886A (zh) 数据处理方法、处理装置、设备及存储介质
CN114691830B (zh) 一种基于大数据的网络安全分析方法及系统
CN115499292B (zh) 一种告警方法、装置、设备及存储介质
CN114004721A (zh) 机检查验方法、装置与电子设备
CN117171731A (zh) 权限管理方法、装置、设备及存储介质
CN114138564A (zh) 故障处理方法、处理装置、电子设备及可读存储介质
CN114610641A (zh) 基于应用系统的软件测试有效性评估方法及装置
CN116975200A (zh) 用于控制服务器工作状态的方法、装置、设备及介质
CN113344584A (zh) 基于黑名单的数据反哺方法、装置、系统及存储介质
CN116126930A (zh) 基于大数据分析的生产过程工艺监控方法及系统
CN115269356A (zh) 数据处理方法及装置、电子设备和计算机可读存储介质
CN116434365A (zh) 请求响应方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant