CN108256350A - 一种基于敏感信息类型关联的信息复合脱敏方法 - Google Patents
一种基于敏感信息类型关联的信息复合脱敏方法 Download PDFInfo
- Publication number
- CN108256350A CN108256350A CN201711478413.0A CN201711478413A CN108256350A CN 108256350 A CN108256350 A CN 108256350A CN 201711478413 A CN201711478413 A CN 201711478413A CN 108256350 A CN108256350 A CN 108256350A
- Authority
- CN
- China
- Prior art keywords
- information
- sensitive
- type
- sensitive information
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6227—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Storage Device Security (AREA)
Abstract
本发明涉及一种基于敏感信息类型关联的信息复合脱敏方法,包括以下步骤:确定要脱敏的数据库字段信息;设置数据库字段信息所包含的敏感信息类型;设置与敏感信息类型一一对应的脱敏规则;将所述数据库字段信息的各项信息值进行敏感信息类型匹配;根据敏感信息类型所对应的脱敏规则脱敏,将脱敏信息值更新到数据库中。本发明能够将数据库字段信息中的各项信息值与设置的敏感信息类型相匹配,根据敏感信息类型所对应的脱敏规则将数据库字段信息中的各项信息值进行转换,本发明能够同时识别并匹配多种敏感信息类型,可以同时对多项敏感信息进行脱敏,提高了个人信息的安全性。
Description
技术领域
本发明涉及信息安全技术领域,尤其涉及一种基于敏感信息类型关联的信息复合脱敏方法。
背景技术
目前,大数据应用广泛的同时,个人信息保护受到了前所未有的挑战。人们在享受数据分析给自己生活带来的贴切服务的同时,也深受个人信息泄露甚至被骚扰的困扰,因此对于数据的脱敏使用就显得尤为重要。
数据脱敏,指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样,就可以在开发、测试和其它非生产环境以及外包或云计算环境中安全地使用脱敏后的真实数据集。
现有技术中的脱敏功能都只针对用户某单一类型的敏感数据进行脱敏,比如:电话号码数据脱敏为电话号码、姓名数据脱敏为姓名、身份证件号码数据脱敏为身份证件号码;对于复合类型的数据信息的脱敏普通脱敏方式就显得不足,如原始数据同时存在电话号码、姓名、身份证件号码等复合数据信息时普通脱敏方式就无法根据用户的原始信息类型进行对应数据的脱敏。
发明内容
本发明所要解决的技术问题是提供一种基于敏感信息类型关联的信息复合脱敏方法,能够同时对多项敏感数据进行脱敏,以保护个人信息的安全。
为解决上述技术问题,本发明的技术方案是:一种基于敏感信息类型关联的信息复合脱敏方法,包括以下步骤:
S1:选择或查询要脱敏的数据库类型、数据库名称、数据库表名或数据库字段名,并确定要脱敏的数据库字段信息;
S2:设置所述数据库字段信息所包含的敏感信息类型;
S3:设置与所述敏感信息类型一一对应的脱敏规则;
S4:将所述数据库字段信息的各项信息值与步骤S2中设置的敏感信息类型进行匹配,确定所述数据库字段信息的各项信息值所对应敏感信息类型;
S5:数据脱敏,根据敏感信息类型所对应的脱敏规则,将所述数据库字段信息的各项信息值进行转换,并将转换后的脱敏信息值更新到数据库中。
作为优选的技术方案,所述敏感信息类型包括:姓名、电话号码、电子邮件、身份证件号码、默认敏感信息类型。
作为优选的技术方案,若所述数据库字段信息的信息值中包含有未知的敏感数据类型,将其设置为默认敏感信息类型。
作为优选的技术方案,步骤S4中,敏感信息类型匹配的方法是:设置敏感信息类型所对应的正则表达式和数据格式,将所述数据库字段信息的各项信息值分别与各敏感信息类型所对应的正则表达式和数据格式进行对比,根据所述数据库字段信息的各项信息值所符合的正则表达式和数据格式,确定所述数据库字段信息中的各项信息值所对应的敏感信息类型。
作为优选的技术方案,还包括用户设置自定义敏感数据类型的步骤,其方法是:设置所述自定义敏感数据类型的名称,设置所述自定义敏感数据类型的脱敏规则,以及设置匹配所述自定义敏感数据类型的正则表达式和数据格式。
由于采用了上述技术方案,本发明的有益效果是:本发明能够将数据库字段信息中的各项信息值与设置的敏感信息类型相匹配,根据敏感信息类型所对应的脱敏规则将数据库字段信息中的各项信息值进行转换,本发明能够同时识别并匹配多种敏感信息类型,可以同时对多项敏感信息进行脱敏,提高了个人信息的安全性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的流程图。
具体实施方式
如图1所示,一种基于敏感信息类型关联的信息复合脱敏方法,包括以下步骤:
S1:选择或查询要脱敏的数据库类型、数据库名称、数据库表名或数据库字段名,并确定要脱敏的数据库字段信息。
S2:设置所述数据库字段信息所包含的敏感信息类型,优选的,敏感信息类型包括:姓名、电话号码、电子邮件、身份证件号码、默认敏感信息类型,若数据库字段信息的信息值中包含有未知的敏感数据类型,将其设置为默认敏感信息类型。
S3:设置与所述敏感信息类型一一对应的脱敏规则。
S4:将数据库字段信息的各项信息值与步骤S2中设置的敏感信息类型进行匹配,确定数据库字段信息的各项信息值所对应敏感信息类型,敏感信息类型匹配的方法是:设置敏感信息类型所对应的正则表达式和数据格式,将数据库字段信息的各项信息值分别与各敏感信息类型所对应的正则表达式和数据格式进行对比,根据数据库字段信息的各项信息值所符合的正则表达式和数据格式,确定数据库字段信息中的各项信息值所对应的敏感信息类型。
S5:数据脱敏,根据敏感信息类型所对应的脱敏规则,将所述数据库字段信息的各项信息值进行转换,并将转换后的脱敏信息值更新到数据库中。
本发明还包括用户设置自定义敏感数据类型的步骤,其方法是:设置自定义敏感数据类型的名称,设置自定义敏感数据类型的脱敏规则,以及设置匹配自定义敏感数据类型的正则表达式和数据格式。
例如,选择oracle数据库,orcl数据库名,test数据库表,user_info字段,根据步骤S2,设置数据库字段user_info包含哪些敏感信息类型,敏感信息类型可设置一到多个。如test数据库表中user_info字段中包含有电话号码、电子邮件、姓名、身份证件号码四种用户信息,则敏感信息类型选择电话号码、电子邮件、姓名、身份证件号码等敏感信息类型,当user_info中包含未知类型的用户数据时,同时可选择字段包含默认敏感信息类型。
根据步骤S3设置敏感信息类型对应的脱敏规则,如电话号码敏感信息类型对应的脱敏规则为生成随机电话号码、电子邮件敏感信息类型对应的脱敏规则为生成随机电子邮件用户名、姓名敏感信息类型对应的脱敏规则为生成随机姓名、身份证件号码敏感信息类型对应的脱敏规则为生成随机身份证件号码。
根据正则表达式和数据格式进行敏感信息类型匹配,识别数据库字段中某值是否属于步骤S2中设置的敏感信息类型,如user_info字段中包含如下值:值一:古天乐;值二:15889345756;值三:gutianle@163.com;值四:152222191306226052;值五:abcdefg等。则值一(古天乐)匹配时根据正则表达式[\\u4E00-\\u9FA5]{2,4}及姓氏库(用来判断是否以姓氏开头的字库)匹配为姓名的敏感信息类型,值二根据正则表达式(^((\+86)|(86))[\s|-]?((1[34578]\d{9})|(0?[1-9]\d{1,2}[\s|-]?[1-9]\d{6,7})))|((1[34578]\d{9})|(0[1-9]\d{1,2}[\s|-]?[1-9]\d{6,7}))匹配为电话号码的敏感信息类型,同理,值三匹配为电子邮件的敏感信息类型、值四匹配为身份证件号的敏感信息类型、值五未能匹配到任何敏感信息类型时设置值五为默认敏感信息类型。
根据步骤S3中设置的脱敏规则进行数据的脱敏。脱敏后数据如:古天乐脱敏后为尹天金、15889345756脱敏后为13410979206、gutianle@163.com脱敏后为jammjjgg@163.com、152222191306226052脱敏后为210181190508153917、abcdefg脱敏后为dedgjed。
将脱敏后的数据更新到数据库表test中user_info字段。
以上显示和描述了本发明的基本原理、主要特征及本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (5)
1.一种基于敏感信息类型关联的信息复合脱敏方法,其特征在于:包括以下步骤:
S1:选择或查询要脱敏的数据库类型、数据库名称、数据库表名或数据库字段名,并确定要脱敏的数据库字段信息;
S2:设置所述数据库字段信息所包含的敏感信息类型;
S3:设置与所述敏感信息类型一一对应的脱敏规则;
S4:将所述数据库字段信息的各项信息值与步骤S2中设置的敏感信息类型进行匹配,确定所述数据库字段信息的各项信息值所对应敏感信息类型;
S5:数据脱敏,根据敏感信息类型所对应的脱敏规则,将所述数据库字段信息的各项信息值进行转换,并将转换后的脱敏信息值更新到数据库中。
2.如权利要求1所述的一种基于敏感信息类型关联的信息复合脱敏方法,其特征在于:所述敏感信息类型包括:姓名、电话号码、电子邮件、身份证件号码、默认敏感信息类型。
3.如权利要求2所述的一种基于敏感信息类型关联的信息复合脱敏方法,其特征在于:若所述数据库字段信息的信息值中包含有未知的敏感数据类型,将其设置为默认敏感信息类型。
4.如权利要求1所述的一种基于敏感信息类型关联的信息复合脱敏方法,其特征在于:步骤S4中,敏感信息类型匹配的方法是:设置敏感信息类型所对应的正则表达式和数据格式,将所述数据库字段信息的各项信息值分别与各敏感信息类型所对应的正则表达式和数据格式进行对比,根据所述数据库字段信息的各项信息值所符合的正则表达式和数据格式,确定所述数据库字段信息中的各项信息值所对应的敏感信息类型。
5.如权利要求4所述的一种基于敏感信息类型关联的信息复合脱敏方法,其特征在于:还包括用户设置自定义敏感数据类型的步骤,其方法是:设置所述自定义敏感数据类型的名称,设置所述自定义敏感数据类型的脱敏规则,以及设置匹配所述自定义敏感数据类型的正则表达式和数据格式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711478413.0A CN108256350A (zh) | 2017-12-29 | 2017-12-29 | 一种基于敏感信息类型关联的信息复合脱敏方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711478413.0A CN108256350A (zh) | 2017-12-29 | 2017-12-29 | 一种基于敏感信息类型关联的信息复合脱敏方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108256350A true CN108256350A (zh) | 2018-07-06 |
Family
ID=62724717
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711478413.0A Pending CN108256350A (zh) | 2017-12-29 | 2017-12-29 | 一种基于敏感信息类型关联的信息复合脱敏方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108256350A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109409121A (zh) * | 2018-09-07 | 2019-03-01 | 阿里巴巴集团控股有限公司 | 脱敏处理方法、装置和服务器 |
CN109614816A (zh) * | 2018-11-19 | 2019-04-12 | 平安科技(深圳)有限公司 | 数据脱敏方法、装置及存储介质 |
CN109729076A (zh) * | 2018-12-19 | 2019-05-07 | 上海晶赞融宣科技有限公司 | 数据脱敏、逆脱敏方法及装置、存储介质、终端 |
CN110781515A (zh) * | 2019-10-25 | 2020-02-11 | 上海凯馨信息科技有限公司 | 一种静态数据脱敏方法及脱敏装置 |
CN111159759A (zh) * | 2019-12-19 | 2020-05-15 | 上海上讯信息技术股份有限公司 | 基于黑白名单的混合敏感信息发现方法、装置及电子设备 |
CN111199054A (zh) * | 2019-12-20 | 2020-05-26 | 深圳昂楷科技有限公司 | 一种数据脱敏方法、装置及数据脱敏设备 |
CN112100664A (zh) * | 2020-09-21 | 2020-12-18 | 国网辽宁省电力有限公司电力科学研究院 | 基于正则表达式验证的电力用户信息静态数据脱敏方法 |
CN113536370A (zh) * | 2021-07-06 | 2021-10-22 | 上海上讯信息技术股份有限公司 | 一种用于医疗影像文件数据脱敏的方法及系统 |
CN114598542A (zh) * | 2022-03-21 | 2022-06-07 | 深圳市远行科技股份有限公司 | 一种用户信息安全处理方法、装置、智能终端、存储介质 |
CN116484410A (zh) * | 2023-06-16 | 2023-07-25 | 鱼快创领智能科技(南京)有限公司 | 一种无侵入式动态脱敏加密方法及系统 |
CN117708885A (zh) * | 2024-02-05 | 2024-03-15 | 盛业信息科技服务(深圳)有限公司 | 一种基于决策引擎的个人敏感信息保护控制方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080288548A1 (en) * | 2007-05-14 | 2008-11-20 | Oracle International Corporation | Desensitizing data in cloning |
CN106203145A (zh) * | 2016-08-04 | 2016-12-07 | 北京网智天元科技股份有限公司 | 数据脱敏方法及相关设备 |
CN106295400A (zh) * | 2016-08-04 | 2017-01-04 | 北京网智天元科技股份有限公司 | 蒙版式数据脱敏方法及相关设备 |
CN106529329A (zh) * | 2016-10-11 | 2017-03-22 | 中国电子科技网络信息安全有限公司 | 一种用于大数据的脱敏系统及脱敏方法 |
CN106599713A (zh) * | 2016-11-11 | 2017-04-26 | 中国电子科技网络信息安全有限公司 | 一种基于大数据的数据库脱敏系统及方法 |
CN106778288A (zh) * | 2015-11-24 | 2017-05-31 | 阿里巴巴集团控股有限公司 | 一种数据脱敏的方法及系统 |
CN107423632A (zh) * | 2017-04-20 | 2017-12-01 | 北京同余科技有限公司 | 可定制的敏感数据脱敏方法和系统 |
-
2017
- 2017-12-29 CN CN201711478413.0A patent/CN108256350A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080288548A1 (en) * | 2007-05-14 | 2008-11-20 | Oracle International Corporation | Desensitizing data in cloning |
CN106778288A (zh) * | 2015-11-24 | 2017-05-31 | 阿里巴巴集团控股有限公司 | 一种数据脱敏的方法及系统 |
CN106203145A (zh) * | 2016-08-04 | 2016-12-07 | 北京网智天元科技股份有限公司 | 数据脱敏方法及相关设备 |
CN106295400A (zh) * | 2016-08-04 | 2017-01-04 | 北京网智天元科技股份有限公司 | 蒙版式数据脱敏方法及相关设备 |
CN106529329A (zh) * | 2016-10-11 | 2017-03-22 | 中国电子科技网络信息安全有限公司 | 一种用于大数据的脱敏系统及脱敏方法 |
CN106599713A (zh) * | 2016-11-11 | 2017-04-26 | 中国电子科技网络信息安全有限公司 | 一种基于大数据的数据库脱敏系统及方法 |
CN107423632A (zh) * | 2017-04-20 | 2017-12-01 | 北京同余科技有限公司 | 可定制的敏感数据脱敏方法和系统 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109409121A (zh) * | 2018-09-07 | 2019-03-01 | 阿里巴巴集团控股有限公司 | 脱敏处理方法、装置和服务器 |
CN109409121B (zh) * | 2018-09-07 | 2022-10-11 | 创新先进技术有限公司 | 脱敏处理方法、装置和服务器 |
CN109614816A (zh) * | 2018-11-19 | 2019-04-12 | 平安科技(深圳)有限公司 | 数据脱敏方法、装置及存储介质 |
CN109614816B (zh) * | 2018-11-19 | 2024-05-07 | 平安科技(深圳)有限公司 | 数据脱敏方法、装置及存储介质 |
CN109729076B (zh) * | 2018-12-19 | 2022-06-24 | 上海晶赞融宣科技有限公司 | 数据脱敏、逆脱敏方法及装置、存储介质、终端 |
CN109729076A (zh) * | 2018-12-19 | 2019-05-07 | 上海晶赞融宣科技有限公司 | 数据脱敏、逆脱敏方法及装置、存储介质、终端 |
CN110781515A (zh) * | 2019-10-25 | 2020-02-11 | 上海凯馨信息科技有限公司 | 一种静态数据脱敏方法及脱敏装置 |
CN110781515B (zh) * | 2019-10-25 | 2023-09-26 | 上海凯馨信息科技有限公司 | 一种静态数据脱敏方法及脱敏装置 |
CN111159759A (zh) * | 2019-12-19 | 2020-05-15 | 上海上讯信息技术股份有限公司 | 基于黑白名单的混合敏感信息发现方法、装置及电子设备 |
CN111199054B (zh) * | 2019-12-20 | 2023-09-19 | 深圳昂楷科技有限公司 | 一种数据脱敏方法、装置及数据脱敏设备 |
CN111199054A (zh) * | 2019-12-20 | 2020-05-26 | 深圳昂楷科技有限公司 | 一种数据脱敏方法、装置及数据脱敏设备 |
CN112100664A (zh) * | 2020-09-21 | 2020-12-18 | 国网辽宁省电力有限公司电力科学研究院 | 基于正则表达式验证的电力用户信息静态数据脱敏方法 |
CN113536370A (zh) * | 2021-07-06 | 2021-10-22 | 上海上讯信息技术股份有限公司 | 一种用于医疗影像文件数据脱敏的方法及系统 |
CN114598542A (zh) * | 2022-03-21 | 2022-06-07 | 深圳市远行科技股份有限公司 | 一种用户信息安全处理方法、装置、智能终端、存储介质 |
CN116484410A (zh) * | 2023-06-16 | 2023-07-25 | 鱼快创领智能科技(南京)有限公司 | 一种无侵入式动态脱敏加密方法及系统 |
CN117708885A (zh) * | 2024-02-05 | 2024-03-15 | 盛业信息科技服务(深圳)有限公司 | 一种基于决策引擎的个人敏感信息保护控制方法及系统 |
CN117708885B (zh) * | 2024-02-05 | 2024-05-28 | 盛业信息科技服务(深圳)有限公司 | 一种基于决策引擎的个人敏感信息保护控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108256350A (zh) | 一种基于敏感信息类型关联的信息复合脱敏方法 | |
WO2020134657A1 (zh) | 系统日志脱敏方法、脱敏系统、计算机设备及存储介质 | |
CN104573094B (zh) | 网络账号识别匹配方法 | |
CN110399733A (zh) | 一种针对结构化数据的脱敏平台 | |
US20050182780A1 (en) | Data de-duplication | |
US9189748B2 (en) | Information extraction system, method, and program | |
CN106959955A (zh) | 一种数据库的数据处理方法及装置 | |
De Silva et al. | User type classification of tweets with implications for event recognition | |
EP3972192B1 (en) | Method and system for layered detection of phishing websites | |
CN105045715B (zh) | 基于编程模式和模式匹配的漏洞聚类方法 | |
CN109062936B (zh) | 一种数据查询方法、计算机可读存储介质及终端设备 | |
AU2017236048A1 (en) | Determining an emergent identity over time | |
US20230418976A1 (en) | Identifying personally identifiable information within an unstructured data store | |
CN104184653A (zh) | 一种消息过滤的方法和装置 | |
CN105792152A (zh) | 伪基站短信识别方法和装置 | |
CN103076894B (zh) | 一种用于根据对象标识信息构建输入词条的方法与设备 | |
JP5098631B2 (ja) | メール分類システム、メール検索システム | |
CN106997320A (zh) | 代码评审过程中的代码显示方法和装置 | |
CN110580301A (zh) | 一种高效商标检索方法、系统及平台 | |
CN110941744A (zh) | 一种数据列表添加器及添加方法 | |
US10320811B1 (en) | Impersonation detection and abuse prevention machines | |
US20160078072A1 (en) | Term variant discernment system and method therefor | |
CN109359481A (zh) | 一种基于bk树的反碰撞搜索约减方法 | |
JP4272690B1 (ja) | 個人情報ファイル判定システム | |
US10318600B1 (en) | Extended search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180706 |
|
RJ01 | Rejection of invention patent application after publication |