CN111310232A - 数据脱敏方法及装置、电子设备、存储介质 - Google Patents
数据脱敏方法及装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN111310232A CN111310232A CN202010188732.3A CN202010188732A CN111310232A CN 111310232 A CN111310232 A CN 111310232A CN 202010188732 A CN202010188732 A CN 202010188732A CN 111310232 A CN111310232 A CN 111310232A
- Authority
- CN
- China
- Prior art keywords
- data
- desensitization
- field
- rule
- desensitization rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000586 desensitisation Methods 0.000 title claims abstract description 292
- 238000000034 method Methods 0.000 title claims abstract description 45
- 210000004369 blood Anatomy 0.000 claims abstract description 32
- 239000008280 blood Substances 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims description 35
- 238000013075 data extraction Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims description 6
- 230000004048 modification Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Storage Device Security (AREA)
Abstract
本说明书提供一种数据脱敏方法及装置、电子设备、存储介质,所述方法包括:获取数据表中字段的血缘关系;确定与设置了脱敏规则的第一字段具有血缘关系的第二字段;根据所述第一字段的脱敏规则为所述第二字段设置脱敏规则,使所述第二字段的脱敏规则包含所述第一字段的脱敏规则。从而,实现了对数据库中的字段自动批量地设置脱敏规则,对全链路数据进行批量脱敏,避免因遗漏设置部分字段的敏感规则,造成的信息泄露,从而不仅确保了平台侧数据展示的安全性,还减少了平台侧对数据进行脱敏的资源消耗。
Description
技术领域
本说明书涉及大数据技术领域,尤其涉及数据脱敏方法及装置、电子设备、存储介质。
背景技术
大数据平台侧由于数据的汇总核心数据的价值非常高,很容易造成一些核心数据因过于开放造成数据泄露。同时数据在开发过程中又经过多次的转换处理,极大可能在某些中间处理表中遗漏一些核心字段的相关数据脱敏工作,增加数据泄露的风险。
发明内容
为克服相关技术中存在的问题,本说明书提供了数据脱敏方法及装置、电子设备、存储介质。
根据本说明书实施例的第一方面,提供一种数据脱敏方法,所述数据脱敏方法包括:
获取数据表中字段的血缘关系;
确定与设置了脱敏规则的第一字段具有血缘关系的第二字段;
根据所述第一字段的脱敏规则为所述第二字段设置脱敏规则,使所述第二字段的脱敏规则包含所述第一字段的脱敏规则。
可选地,所述数据脱敏方法还包括:
若所述第一字段的脱敏规则发生了修改,则根据修改后的脱敏规则更新所述第二字段的脱敏规则。
可选地,所述数据脱敏方法还包括:
为所述数据表中的至少一部分字段设置数据元,其中,相同数据元的字段关联相同的脱敏规则。
可选地,所述数据脱敏方法还包括:
周期性地根据所述脱敏规则对所述字段的数据进行脱敏处理;
和/或,在所述字段的数据有更新的情况下,根据所述脱敏规则对所述字段的数据进行脱敏处理;
周期性地根据所述脱敏规则对所述字段的数据进行脱敏校验。
可选地,所述数据脱敏方法还包括:
在接受到数据抽取请求的情况下,根据所述数据抽取请求从所述数据表中抽取根据所述脱敏规则进行了脱敏处理的目标数据。
根据本说明书实施例的第二方面,提供一种数据脱敏装置,所述数据脱敏装置包括:
获取模块,用于获取数据表中字段的血缘关系;
确定模块,用于确定与设置了脱敏规则的第一字段具有血缘关系的第二字段;
规则设置模块,用于根据所述第一字段的脱敏规则为所述第二字段设置脱敏规则,使所述第二字段的脱敏规则包含所述第一字段的脱敏规则。
可选地,所述数据脱敏装置还包括:
修改模块,用于在所述第一字段的脱敏规则发生了修改的情况下,根据修改后的脱敏规则更新所述第二字段的脱敏规则。
可选地,所述数据脱敏装置还包括:
数据元设置模块,用于为所述数据表中的至少一部分字段设置数据元,其中,相同数据元的字段关联相同的脱敏规则。
可选地,所述数据脱敏装置还包括:脱敏模块;
所述脱敏模块用于:
周期性地根据所述脱敏规则对所述字段的数据进行脱敏处理;
和/或,在所述字段的数据有更新的情况下,根据所述脱敏规则对所述字段的数据进行脱敏处理;
周期性地根据所述脱敏规则对所述字段的数据进行脱敏校验。
可选地,所述数据脱敏装置还包括:
抽取模块,用于在接受到数据抽取请求的情况下,根据所述数据抽取请求从所述数据表中抽取根据所述脱敏规则进行了脱敏处理的目标数据。
根据本说明书实施例的第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的数据脱敏方法。
根据本说明书实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的数据脱敏方法的步骤。
本说明书的实施例提供的技术方案可以包括以下有益效果:
本说明书实施例中,借助字段的血缘关系,实现了对数据库中的字段自动批量地设置脱敏规则,对全链路数据进行批量脱敏,避免因遗漏设置部分字段的敏感规则,造成的信息泄露,从而不仅确保了平台侧数据展示的安全性,还减少了平台侧对数据进行脱敏的资源消耗。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书一起用于解释本说明书的原理。
图1是本说明书根据一示例性实施例示出的一种数据脱敏方法的流程图。
图2是本说明书根据一示例性实施例示出的多个字段的血缘关系的示意图。
图3是本说明书根据一示例性实施例示出的另一种数据脱敏方法的流程图。
图4是本说明书根据一示例性实施例示出的一种数据脱敏装置的模块示意图。
图5本说明书根据一示例性实施例示出的一种电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
大数据平台侧由于数据的汇总核心数据的价值非常高,很容易造成一些核心数据因过于开放引起的敏感信息泄露,因此平台侧展示数据之前,需要对敏感数据进行脱处理。
目前,关于数据的脱敏处理存在两种方式:
方式一、在平台侧设置脱敏规则,平台侧从数据库抽取数据后,根据脱敏规则对抽取的数据进行脱敏处理后展示。采用该方式,平台侧需要浪费额外的计算资源用于数据的脱敏,会占用平台侧数据传输的资源,影响数据传输效率。
方式二、在数据库侧设置脱敏规则,用户对数据库中的字段设置脱敏规则,并根据该脱敏规则对对应的数据进行脱敏处理,平台侧从数据库抽取经过脱敏处理的数据并展示。由于数据库中的字段成千上万,采用人工方式在数据库中设置脱敏规则,容易遗漏一些核心字段的脱敏规则设置。同时数据在开发过程中又经过多次的转换处理,极大可能在某些中间处理表中遗漏一些核心字段的脱敏规则设置,增加数据泄露的风险。例如,若用户为字段a和字段b设置了脱敏规则,但没有给字段c设置脱敏规则,而字段c的数据由字段a和字段b的数据拼接得到,若平台侧展示了经过脱敏处理的字段a(和/或字段b)的数据以及未经脱敏处理的字段c的数据,很容易根据字段c的数据确定字段a(和/或字段b)的数据,造成敏感信息泄露。
针对上述方式二,容易遗漏一些字段的脱敏规则设置,造成敏感信息泄露的问题,本发明实施例提供一种数据脱敏方法,借助字段的血缘关系,对全链路字段批量设置脱敏规则,避免遗漏核心字段的敏感规则的设置。
接下来对本说明书实施例进行详细说明。
如图1所示,图1是本说明书根据一示例性实施例示出的一种数据脱敏方法的流程图,包括以下步骤:
步骤101、获取数据表中字段的血缘关系。
其中,数据表可以是存储在数据库中的一张数据表也可以是多张数据表。字段的血缘关系也即一张或多张数据表的血缘关系。
对存储于数据表中的数据进行各种加工组合、转换,又会产生新的数据,这些数据之间就存在着天然的联系,这些联系称为数据字段的血缘关系,也即血缘关系就是指数据字段产生的链路关系。
比如客户在网上购物后,购物数据被存到数据库的表A中。若希望查看某个月卖的最火的是哪些物品时,就需要对数据库中的原始数据进行加工汇总,形成一张中间表B来存储阶段处理的数据,若逻辑较复杂时,还要继续加工继续形成中间表,直到最后处理成平台侧展现使用的最终表,假设为表C。那么表A中的数据字段是表C中的数据字段的最初来源,是表C的父字段。从表A中的数据字段到表B中的数据字段再到表C中的数据字段,这条链路就是表C中数据字段的血缘关系。
步骤102、确定与设置了脱敏规则的第一字段具有血缘关系的第二字段。
其中,第一字段对应的数据可以是敏感数据,也即对隐私性、安全性要求较高的数据,例如,身份证号码、车牌号、手机号码等。第一字段的脱敏规则可以是用户根据实际需求自行设置的,用于对数据进行脱敏处理。脱敏规则可以但不限于采用以下规则中的至少一种:隐藏末尾位数、全数据加密和部分数据替换等。
图2是本说明书根据一示例性实施例示出的多个字段的血缘关系的示意图,图中字段与字段之间的线段表示两个字段之间存在血缘关系,例如,图中字段a→字段c→字段f→字段h构成具有血缘关系的链路,字段i→字段c→字段e→字段g也构成具有血缘关系的链路。从图中可以看出与字段c(第一字段)具有血缘关系的字段(第二字段)包括:字段a、字段i、字段e、字段f、字段g和字段h。本实施例中,通过遍历血缘关系可以将字段上下游相关的字段都纳入脱敏范围,以便于后续对数据的批量脱敏处理。
步骤103、根据第一字段的脱敏规则为第二字段设置脱敏规则。
其中,第二字段可能是未设置脱敏规则的字段,也可能是设置有脱敏规则的字段。
在一个实施例中,若执行步骤103之前,第二字段未设置脱敏规则,则依据第一字段给第二字段设置脱敏规则,例如,若第一字段设置的脱敏规则为隐藏末尾位数,则步骤103中根据第一字段的脱敏规则为第二字段设置脱敏规则后,第二字段的脱敏规则也被设置为隐藏末尾位数,第二字段的脱敏规则与第一字段的脱敏规则相同。
在另一个实施例中,若执行步骤103之前,第二字段设置有脱敏规则,该脱敏规则可能是用户设置的,例如,用户给第二字段设置的脱敏规则为全数据加密,给第一字段设置的脱敏规则为隐藏末尾位数,则步骤103中根据第一字段的脱敏规则为第二字段设置脱敏规则后,第二字段包括两个脱敏规则:全数据加密以及隐藏末尾位数。
在另一个实施例中,若执行步骤103之前,第二字段设置有脱敏规则,且第二字段的脱敏规则与第一字段的脱敏规则相同,则无需执行步骤103。
本说明书实施例的数据脱敏方法,借助字段的血缘关系,实现了对数据库中的字段自动批量地设置脱敏规则,对全链路数据进行批量脱敏,避免因遗漏设置部分字段的敏感规则,造成的信息泄露。该方法根据业务逻辑自动科学脱敏,确保脱敏后的数据仍然能够反馈真实的数据性状,且减少了人工维护成本,提升了脱敏完整性。
在另一个实施例中,若第一字段的脱敏规则发生了修改,则根据修改后的脱敏规则更新第二字段的脱敏规则,以确保脱敏规则的统一性,便于管理。例如,在第一字段的脱敏规则由a变为b时,则相对应的将第二字段的脱敏规则修改为b。
在另一个实施例中,步骤102~步骤103可以周期性地执行,使得即便数据表中的字段信息发生了修改,例如,字段的增加,也能及时对新增的字段设置脱敏规则。
为字段设置了脱敏规则之后,可以立即对字段的数据进行脱敏处理,之后可周期性地根据脱敏规则对字段的数据进行脱敏处理;也可以在字段的数据有更新的情况下,例如,数据修改、数据新增、数据计算转换等,根据脱敏规则对修改的数据或对该字段的全部数据进行脱敏处理;还可以在接收到数据抽取请求的情况下,根据脱敏规则对数据进行脱敏处理。从而,确保能及时准确地将数据进行脱敏处理,保证平台侧从数据库抽取的数据均是经过脱敏处理的。
在另一个实施例中,还可以周期性地根据脱敏规则对字段的数据进行脱敏校验,也即使用脱敏规则验证该字段的数据是否均进行了脱敏处理。若校验成功,说明数据未发生更新,不需要重新脱敏;若全部或部分数据未校验成功,说明该部分数据未进行脱敏处理,则触发一次脱敏处理,以确保能及时准确地将数据进行脱敏处理,保证平台侧从数据库抽取并展示的数据均是经过脱敏处理的。
在另一个实施例中,还可以根据数据的最后更新时刻等数据信息筛选出哪些数据进行了脱敏处理,哪些数据未进行脱敏处理。例如,数据表A中包含1~350条数据,假设在2020年1月1日9:00对数据表A中字段a的数据进行了一次脱敏处理,若第1~200条数据的最后更新时刻为2020年12月30日9:00,早于2020年1月1日9:00,说明第1~200条数据经过了脱敏处理;若第201~350条数据的最后更新时刻为2020年1月2日9:00,晚于2020年1月1日9:00,说明第201~350条数据很可能未经过脱敏处理,需要对其进行脱敏处理。
由于上述任一实施例中,数据脱敏是在数据库侧进行的,在接受到数据抽取请求的情况下,根据数据抽取请求从数据表中抽取的目标数据始终是经过脱敏处理的,从而不仅确保了平台侧数据展示的安全性,还减少了平台侧对数据进行脱敏的资源消耗。
图3是本说明书根据一示例性实施例示出的另一种数据脱敏方法的流程图,包括以下步骤:
步骤301、为数据表中的至少一部分字段设置数据元。
其中,该至少一部分字段对应的数据一般是对安全性、隐私性要求较高的敏感数据。
数据元为用一组属性描述字段的定义、标识、表示和允许值的信息单元,例如数据元描述了字段的长度、类型、内容的范围字典值、字段含义等。
本实施例中,相同业务属性的字段可以关联至相同的数据元,数据元与对应的脱敏规则直接绑定,可为相同数据元的字段设置相同的脱敏规则,对对应的数据进行相同逻辑的脱敏,使得脱敏后的数据性状保持一致,达到所有数据表的脱敏规则在集群内整体相通的目的。
例如,对字段涉及身份证、手机号等相同业务属性的字段设置相同的数据元,则根据数据元与脱敏规则的关联关系会为这些字段设置相同的脱敏规则,例如将字段“身份证号码”、字段“手机号码”的脱敏规则均设置为采取脱敏后四位,确保在脱敏过程中保持数据原有的性状。
在一个实施例中,可以记录数据表中字段数据的存储路径、存储类型、最后更新时刻等数据信息,用于为对应字段设置数据元。
步骤302、获取数据表中字段的血缘关系。
其中,数据表可以是存储在数据库中的一张数据表也可以是多张数据表。字段的血缘关系也即一张或多张数据表的血缘关系。
对存储于数据表中的数据进行各种加工组合、转换,又会产生新的数据,这些数据之间就存在着天然的联系,这些联系称为数据字段的血缘关系。直白点说,血缘关系就是指数据字段产生的链路关系。
比如客户在网上购物后,购物数据被存到数据库的表A中。若希望查看某个月卖的最火的是哪些物品时,就需要对数据库中的原始数据进行加工汇总,形成一张中间表B来存储阶段处理的数据,若逻辑较复杂时,还要继续加工继续形成中间表,直到最后处理成平台侧展现使用的最终表,假设为表C。那么表A中的数据字段是表C中的数据字段的最初来源,是表C的父字段。从表A中的数据字段到表B中的数据字段再到表C中的数据字段,这条链路就是表C中数据字段的血缘关系。
步骤303、确定与设置了脱敏规则的第一字段具有血缘关系的第二字段。
其中,第一字段对应的数据可以是敏感数据,也即对隐私性、安全性要求较高的数据,例如,身份证号码、车牌号、手机号码等。第一字段的脱敏规则可以是用户根据实际需求自行设置的,用于对数据进行脱敏处理,脱敏规则可以但不限于采用以下规则中的至少一种:隐藏末尾位数、全数据加密和部分数据替换。
步骤304、根据第一字段的脱敏规则为第二字段设置脱敏规则。
其中,第二字段可能是未设置脱敏规则的字段,也可能是设置有脱敏规则的字段。
在一个实施例中,若执行步骤304之前,第二字段未设置脱敏规则,可以依据第一字段给第二字段设置脱敏规则,例如,若为第一字段设置的脱敏规则为隐藏末尾位数,则步骤304中根据第一字段的脱敏规则为第二字段设置脱敏规则后,第二字段的脱敏规则也被设置为隐藏末尾位数,第二字段的脱敏规则与第一字段的脱敏规则相同。
在另一个实施例中,若执行步骤304之前,第二字段设置有脱敏规则,该脱敏规则可能是用户设置的,例如,用户给第二字段设置的脱敏规则为全数据加密,给第一字段设置的脱敏规则为隐藏末尾位数,则步骤304中根据第一字段的脱敏规则为第二字段设置脱敏规则后,第二字段包括两个脱敏规则:全数据加密以及隐藏末尾位数。
在另一个实施例中,若执行步骤304之前,第二字段设置有脱敏规则,且第二字段的脱敏规则与第一字段的脱敏规则相同,则无需执行步骤304。
本说明书实施例的数据脱敏方法,借助字段的血缘关系,实现了对数据据库中的字段自动批量地设置脱敏规则,对全链路数据进行批量脱敏,避免因遗漏设置部分字段的敏感规则,造成的信息泄露。该方法根据业务逻辑自动科学脱敏,确保脱敏后的数据仍然能够反馈真实的数据性状,且减少了人工维护成本,提升了脱敏完整性。
在另一个实施例中,若第一字段的脱敏规则发生了修改,则根据修改后的脱敏规则更新第二字段的脱敏规则,以确保脱敏规则的统一性,便于管理。例如,在第一字段的脱敏规则由a变为b时,则相对应的将第二字段的脱敏规则修改为b。
在另一个实施例中,步骤303~步骤304可以周期性地执行,使得即便数据表中的字段信息进行了修改,例如,字段的增加,也能及时对新增的字段设置脱敏规则。
为字段设置了脱敏规则之后,可以立即对字段的数据进行脱敏处理,之后可周期性地根据脱敏规则对字段的数据进行脱敏处理;也可以在字段的数据有更新的情况下,例如,数据修改、数据新增、数据计算转换等,根据脱敏规则对修改的数据或对该字段的全部数据进行脱敏处理;还可以在接收到数据抽取请求的情况下,根据脱敏规则对数据进行脱敏处理。从而,确保能及时准确地将数据进行脱敏处理,保证平台侧从数据库抽取的数据均是经过脱敏处理的。
在另一个实施例中,还可以周期性地根据脱敏规则对字段的数据进行脱敏校验,也即使用脱敏规则验证该字段的数据是否均进行了脱敏处理。若校验成功,说明数据未发生更新,不需要重新脱敏;若全部或部分数据未校验成功,说明该部分数据未进行脱敏处理,则触发一次脱敏处理,以确保能及时准确地将数据进行脱敏处理,保证平台侧从数据库抽取并展示的数据均是经过脱敏处理的。
在另一个实施例中,还可以根据数据的最后更新时刻等数据信息筛选出哪些数据进行了脱敏处理,哪些数据未进行脱敏处理。例如,数据表A中包含1~350条数据,若在2020年1月1日9:00对数据表A中字段a的数据进行了脱敏处理;假设第1~200条数据的最后更新时刻为2020年12月30日9:00,早于2020年1月1日9:00,说明第1~200条数据经过了脱敏处理;假设第201~350条数据的最后更新时刻为2020年1月2日9:00,晚于2020年1月1日9:00,说明第201~350条数据很可能为经过脱敏处理。
由于上述任一实施例中,数据脱敏是在数据库侧进行的,在接受到数据抽取请求的情况下,根据数据抽取请求从数据表中抽取的目标数据始终是经过脱敏处理的,从而不仅确保了平台侧数据展示的安全性,还减少了平台侧对数据进行脱敏的资源消耗。
与前述数据脱敏方法的实施例相对应,本说明书还提供了数据脱敏装置的实施例。
图4是本说明书根据一示例性实施例示出的一种数据脱敏装置的模块示意图,该数据脱敏装置包括:获取模块41、确定模块42和规则设置模块43。
获取模块41用于获取数据表中字段的血缘关系;
确定模块42用于确定与设置了脱敏规则的第一字段具有血缘关系的第二字段;
规则设置模块43用于根据所述第一字段的脱敏规则为所述第二字段设置脱敏规则,使所述第二字段的脱敏规则包含所述第一字段的脱敏规则。
可选地,所述数据脱敏装置还包括:
修改模块,用于在所述第一字段的脱敏规则发生了修改的情况下,根据修改后的脱敏规则更新所述第二字段的脱敏规则。
可选地,所述数据脱敏装置还包括:
数据元设置模块,用于为所述数据表中的至少一部分字段设置数据元,其中,相同数据元的字段关联相同的脱敏规则。
可选地,所述数据脱敏装置还包括:脱敏模块;
所述脱敏模块用于:
周期性地根据所述脱敏规则对所述字段的数据进行脱敏处理;
和/或,在所述字段的数据有更新的情况下,根据所述脱敏规则对所述字段的数据进行脱敏处理;
周期性地根据所述脱敏规则对所述字段的数据进行脱敏校验。
可选地,所述数据脱敏装置还包括:
抽取模块,用于在接受到数据抽取请求的情况下,根据所述数据抽取请求从所述数据表中抽取根据所述脱敏规则进行了脱敏处理的目标数据。
图5是本发明一示例实施例示出的一种电子设备的结构示意图,示出了适于用来实现本发明任一实施例的示例性电子设备50的框图。图5显示的电子设备50仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备50可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备50的组件可以包括但不限于:上述至少一个处理器51、上述至少一个存储器52、连接不同系统组件(包括存储器52和处理器51)的总线53。
总线53包括数据总线、地址总线和控制总线。
存储器52可以包括易失性存储器,例如随机存取存储器(RAM)521和/或高速缓存存储器522,还可以进一步包括只读存储器(ROM)523。
存储器52还可以包括具有一组(至少一个)程序模块524的程序工具525(或实用工具),这样的程序模块524包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器51通过运行存储在存储器52中的计算机程序,从而执行各种功能应用以及数据处理,例如上述任一实施例所提供的方法。
电子设备50也可以与一个或多个外部设备54(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口55进行。并且,模型生成的电子设备50还可以通过网络适配器56与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器56通过总线53与模型生成的电子设备50的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的电子设备50使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的数据脱敏方法的步骤。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。
Claims (12)
1.一种数据脱敏方法,其特征在于,所述数据脱敏方法包括:
获取数据表中字段的血缘关系;
确定与设置了脱敏规则的第一字段具有血缘关系的第二字段;
根据所述第一字段的脱敏规则为所述第二字段设置脱敏规则,使所述第二字段的脱敏规则包含所述第一字段的脱敏规则。
2.如权利要求1所述的数据脱敏方法,其特征在于,所述数据脱敏方法还包括:
若所述第一字段的脱敏规则发生了修改,则根据修改后的脱敏规则更新所述第二字段的脱敏规则。
3.如权利要求1所述的数据脱敏方法,其特征在于,所述数据脱敏方法还包括:
为所述数据表中的至少一部分字段设置数据元,其中,相同数据元的字段关联相同的脱敏规则。
4.如权利要求1所述的数据脱敏方法,其特征在于,所述数据脱敏方法还包括:
周期性地根据所述脱敏规则对所述字段的数据进行脱敏处理;
和/或,在所述字段的数据有更新的情况下,根据所述脱敏规则对所述字段的数据进行脱敏处理;
周期性地根据所述脱敏规则对所述字段的数据进行脱敏校验。
5.如权利要求1所述的数据脱敏方法,其特征在于,所述数据脱敏方法还包括:
在接受到数据抽取请求的情况下,根据所述数据抽取请求从所述数据表中抽取根据所述脱敏规则进行了脱敏处理的目标数据。
6.一种数据脱敏装置,其特征在于,所述数据脱敏装置包括:
获取模块,用于获取数据表中字段的血缘关系;
确定模块,用于确定与设置了脱敏规则的第一字段具有血缘关系的第二字段;
规则设置模块,用于根据所述第一字段的脱敏规则为所述第二字段设置脱敏规则,使所述第二字段的脱敏规则包含所述第一字段的脱敏规则。
7.如权利要求6所述的数据脱敏装置,其特征在于,所述数据脱敏装置还包括:
修改模块,用于在所述第一字段的脱敏规则发生了修改的情况下,根据修改后的脱敏规则更新所述第二字段的脱敏规则。
8.如权利要求6所述的数据脱敏装置,其特征在于,所述数据脱敏装置还包括:
数据元设置模块,用于为所述数据表中的至少一部分字段设置数据元,其中,相同数据元的字段关联相同的脱敏规则。
9.如权利要求6所述的数据脱敏装置,其特征在于,所述数据脱敏装置还包括:脱敏模块;
所述脱敏模块用于:
周期性地根据所述脱敏规则对所述字段的数据进行脱敏处理;
和/或,在所述字段的数据有更新的情况下,根据所述脱敏规则对所述字段的数据进行脱敏处理;
周期性地根据所述脱敏规则对所述字段的数据进行脱敏校验。
10.如权利要求6所述的数据脱敏装置,其特征在于,所述数据脱敏装置还包括:
抽取模块,用于在接受到数据抽取请求的情况下,根据所述数据抽取请求从所述数据表中抽取根据所述脱敏规则进行了脱敏处理的目标数据。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述的数据脱敏方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5任一项所述的数据脱敏方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010188732.3A CN111310232A (zh) | 2020-03-17 | 2020-03-17 | 数据脱敏方法及装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010188732.3A CN111310232A (zh) | 2020-03-17 | 2020-03-17 | 数据脱敏方法及装置、电子设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111310232A true CN111310232A (zh) | 2020-06-19 |
Family
ID=71158804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010188732.3A Pending CN111310232A (zh) | 2020-03-17 | 2020-03-17 | 数据脱敏方法及装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111310232A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112231747A (zh) * | 2020-09-25 | 2021-01-15 | 中国建设银行股份有限公司 | 数据脱敏方法、数据脱敏装置以及计算机可读介质 |
CN112528327A (zh) * | 2020-12-08 | 2021-03-19 | 杭州数梦工场科技有限公司 | 数据脱敏方法及装置、数据还原方法及装置 |
CN113672653A (zh) * | 2021-08-09 | 2021-11-19 | 支付宝(杭州)信息技术有限公司 | 识别数据库中的隐私数据的方法和装置 |
CN113901513A (zh) * | 2021-09-30 | 2022-01-07 | 四川新网银行股份有限公司 | 一种基于血缘解析的动态数据脱敏方法 |
CN114880713A (zh) * | 2022-06-30 | 2022-08-09 | 深圳红途科技有限公司 | 基于数据链路的用户行为分析方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120259877A1 (en) * | 2011-04-07 | 2012-10-11 | Infosys Technologies Limited | Methods and systems for runtime data anonymization |
CN105653981A (zh) * | 2015-12-31 | 2016-06-08 | 中国电子科技网络信息安全有限公司 | 大数据平台的数据流通与交易的敏感数据保护系统及方法 |
CN106959955A (zh) * | 2016-01-11 | 2017-07-18 | 中国移动通信集团陕西有限公司 | 一种数据库的数据处理方法及装置 |
CN110196861A (zh) * | 2018-02-24 | 2019-09-03 | 中兴通讯股份有限公司 | 一种数据脱敏方法和装置 |
CN110443059A (zh) * | 2018-05-02 | 2019-11-12 | 中兴通讯股份有限公司 | 数据保护方法及装置 |
-
2020
- 2020-03-17 CN CN202010188732.3A patent/CN111310232A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120259877A1 (en) * | 2011-04-07 | 2012-10-11 | Infosys Technologies Limited | Methods and systems for runtime data anonymization |
CN105653981A (zh) * | 2015-12-31 | 2016-06-08 | 中国电子科技网络信息安全有限公司 | 大数据平台的数据流通与交易的敏感数据保护系统及方法 |
CN106959955A (zh) * | 2016-01-11 | 2017-07-18 | 中国移动通信集团陕西有限公司 | 一种数据库的数据处理方法及装置 |
CN110196861A (zh) * | 2018-02-24 | 2019-09-03 | 中兴通讯股份有限公司 | 一种数据脱敏方法和装置 |
CN110443059A (zh) * | 2018-05-02 | 2019-11-12 | 中兴通讯股份有限公司 | 数据保护方法及装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112231747A (zh) * | 2020-09-25 | 2021-01-15 | 中国建设银行股份有限公司 | 数据脱敏方法、数据脱敏装置以及计算机可读介质 |
CN112528327A (zh) * | 2020-12-08 | 2021-03-19 | 杭州数梦工场科技有限公司 | 数据脱敏方法及装置、数据还原方法及装置 |
CN112528327B (zh) * | 2020-12-08 | 2024-08-02 | 杭州数梦工场科技有限公司 | 数据脱敏方法及装置、数据还原方法及装置 |
CN113672653A (zh) * | 2021-08-09 | 2021-11-19 | 支付宝(杭州)信息技术有限公司 | 识别数据库中的隐私数据的方法和装置 |
CN113901513A (zh) * | 2021-09-30 | 2022-01-07 | 四川新网银行股份有限公司 | 一种基于血缘解析的动态数据脱敏方法 |
CN114880713A (zh) * | 2022-06-30 | 2022-08-09 | 深圳红途科技有限公司 | 基于数据链路的用户行为分析方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111310232A (zh) | 数据脱敏方法及装置、电子设备、存储介质 | |
CN111177569B (zh) | 基于人工智能的推荐处理方法、装置及设备 | |
US11698890B2 (en) | System and method for generating a column-oriented data structure repository for columns of single data types | |
CN109285076A (zh) | 智能核保处理方法、服务器及存储介质 | |
EP2565802A1 (en) | Data masking setup | |
US20100250730A1 (en) | Automated license reconciliation for deployed applications | |
CN111414389B (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
US11373006B2 (en) | Processing system using natural language processing for performing dataset filtering and sanitization | |
CN110795697A (zh) | 逻辑表达式的获取方法、装置、存储介质以及电子装置 | |
CN109902514A (zh) | 一种数据脱敏控制系统、方法、服务器和存储介质 | |
US7428486B1 (en) | System and method for generating process simulation parameters | |
CN112667695A (zh) | 一种保险数据信息的生成方法、装置、服务器及存储介质 | |
CA3153550A1 (en) | Core recommendation method, device and system | |
CN113886419A (zh) | Sql语句处理方法、装置、计算机设备及存储介质 | |
CN114418398A (zh) | 场景任务开发方法、装置、设备及存储介质 | |
CN114186961A (zh) | 业务审批流程配置方法、装置、计算机设备和存储介质 | |
CN112527280A (zh) | 界面展示方法、装置、服务器及可读存储介质 | |
CN116628005A (zh) | 结构化查询语句处理方法、装置、设备及存储介质 | |
US20160292282A1 (en) | Detecting and responding to single entity intent queries | |
CN113032647B (zh) | 数据分析系统 | |
CN113703753B (zh) | 用于产品开发的方法、装置和产品开发系统 | |
CN111859985A (zh) | Ai客服模型测试方法、装置、电子设备及存储介质 | |
CN112214497A (zh) | 一种标签的处理方法、装置及计算机系统 | |
CN111767222A (zh) | 数据模型的验证方法、装置、电子设备、存储介质 | |
US7257602B2 (en) | Determining a characteristic function from a matrix with enrichment and compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200619 |
|
RJ01 | Rejection of invention patent application after publication |