CN108062484A - 一种基于数据敏感特征和数据库元数据的分类分级方法 - Google Patents

一种基于数据敏感特征和数据库元数据的分类分级方法 Download PDF

Info

Publication number
CN108062484A
CN108062484A CN201711303997.8A CN201711303997A CN108062484A CN 108062484 A CN108062484 A CN 108062484A CN 201711303997 A CN201711303997 A CN 201711303997A CN 108062484 A CN108062484 A CN 108062484A
Authority
CN
China
Prior art keywords
classification
data
database
feature
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711303997.8A
Other languages
English (en)
Inventor
杨海峰
温礼辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING ANHUA JINHE TECHNOLOGY CO LTD
Original Assignee
BEIJING ANHUA JINHE TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING ANHUA JINHE TECHNOLOGY CO LTD filed Critical BEIJING ANHUA JINHE TECHNOLOGY CO LTD
Priority to CN201711303997.8A priority Critical patent/CN108062484A/zh
Publication of CN108062484A publication Critical patent/CN108062484A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2113Multi-level security, e.g. mandatory access control

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于数据敏感特征和数据库元数据的分类分级方法,其技术特点是:根据行业标准建立该标准的数据分类分级;对产生的分类节点中的每个最底层节点配置分类判断规则,同时关联该行业标准应用的数据库;授权扫描数据库,梳理并缓存数据库的敏感数据特征和元数据;依据配置的分类判断规则和缓存的敏感数据特征和元数据依次对每个字段进行分类分级判断。本发明根据数据自身的数据敏感特征和元数据对数据进行类别和等级划分,可广泛地应用于各类数据库安全产品中,依据分类分级结果可以自动化准确地制定不同的审计防控策略,在提高安全产品使用效率的同时可以对重点数据重点防护。

Description

一种基于数据敏感特征和数据库元数据的分类分级方法
技术领域
本发明属于数据库安全技术领域,尤其是一种基于数据敏感特征和数据库元数据的分类分级方法。
背景技术
目前,数据库应用已深入到各个领域,沉淀的数据越来越多。随之而来的海量数据在采集、存储、使用、外发等各环节稍不慎都会造成重要敏感数据的泄露甚至是被篡改。引入数据分类分级策略可以对数据库、表、字段实现自动分类分级,进而针对不同类别或者级别数据实行不同的存储、审计和安全管控策略,做到了对数据精准安全管理同时也提高了数据安全管理的效率。如何基于数据敏感特征和数据库元数据进行快速、准确地分类分级是目前迫切需要解决的问题。
发明内容
本发明的目地在于克服现有技术的不足,提出一种设计合理、自动程度高且准确率高的基于数据敏感特征和数据库元数据的分类分级方法。
本发明解决其技术问题是采取以下技术方案实现的:
一种基于数据敏感特征和数据库元数据的分类分级方法,包括以下步骤:
步骤1:根据行业标准建立该标准的数据分类分级;
步骤2:对步骤1产生的分类节点中的每个最底层节点配置分类判断规则,同时关联该行业标准应用的数据库;
步骤3:授权扫描数据库,梳理并缓存数据库的敏感数据特征和元数据;
步骤4:依据步骤2配置的分类判断规则和步骤3缓存的敏感数据特征和元数据依次对每个字段进行分类分级判断。
所述步骤1的数据分类分级是对数据划分类别并给数据分类配置数据等级。
所述数据等级包括但不限于极敏感级、敏感级、较敏感级和低敏感级。
所述分类判断规则是分类信息和数据库字段产生映射的条件;分类判断规则包括该分类所包含的敏感数据特征以及相关元数据的精确和模糊匹配。
所述敏感数据特征是指一列数据的内容模型,该敏感数据特征是通过对数据库内每张表的字段内容进行部分抽样、预处理分析、正则判断形成的。
所述的数据库元数据包括但不限于数据库名、模式名、表名、字段名。
本发明的优点和积极效果是:
1、本发明根据数据自身的数据敏感特征和元数据对数据进行类别和等级划分,对不同类别或者级别数据在采集、存储、使用、外发等过程提供更加合适精准的安全操作策略,在提高数据安全防护的同时也提高了数据防护的效率,其处理过程自动化程度高、并且分类结果准确性强。
2、本发明可广泛地应用于各类数据库安全产品中,依据分类分级结果可以自动化准确地制定不同的审计防控策略,在提高安全产品使用效率的同时可以对重点数据重点防护。
附图说明
图1是本发明的处理流程图。
具体实施方式
以下结合附图对本发明实施例做进一步详述。
一种基于数据敏感特征和数据库元数据的分类分级方法,如图1所示,包括以下步骤:
步骤1:根据行业标准建立该标准的数据分类分级。
本步骤需要根据行业规范标准建立具体的数据分类、对分类节点配置数据等级,数据等级包括但不限于极敏感级、敏感级、较敏感级和低敏感级。同时,可以对已有的分类分级信息导入,从而提高效率。
步骤2:对步骤1产生的分类节点中的每个最底层节点配置分类判断规则配置分类判断规则,同时需要关联该标准应用的数据库。
本步骤需要制定各个最底层分类节点的判断规则,所述分类判断规则是分类信息和数据库字段产生映射的条件,即一种表字段和具体分类进行映射的条件。分类判断规则包括该分类所包含的敏感数据特征(姓名,身份证号码等)以及相关元数据的精确和模糊匹配。同时添加使用此规则的数据库。
步骤3:授权扫描数据库,梳理缓存数据库内的敏感数据特征和元数据;
本步骤主要用于提取数据模型特征和数据库元数据。通过扫描数据库获取非系统表的所有字段的抽样数据,同时对各个字段抽样数据进行预处理和正则判断形成可能的敏感数据特征(姓名,身份证号码等)并缓存,在此过程中也需要对数据库的元数据(表名、字段名称等)进行获取缓存。所述敏感数据特征是指一列数据的内容模型,该敏感数据特征是通过对数据库内每张表的字段内容进行部分抽样、预处理分析、正则判断形成的。
步骤4:依据步骤2配置的分类判断规则和步骤3缓存的信息依次对每个字段进行分类分级判断;
本步骤是数据分类分级的关键步骤。利用敏感数据特征和元数据对每个字段进行判断,判断过程是字段特征是否在当前分类规则包含的敏感数据特征范围内,字段名称是否匹配规则包含的字段名称或者是模糊匹配。如果满足以上任一条件则认定此字段属于当前分类。
本发明在数据分类分级时,数据库和表的类别依赖于字段的类别。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

Claims (6)

1.一种基于数据敏感特征和数据库元数据的分类分级方法,其特征在于包括以下步骤:
步骤1:根据行业标准建立该标准的数据分类分级;
步骤2:对步骤1产生的分类节点中的每个最底层节点配置分类判断规则,同时关联该行业标准应用的数据库;
步骤3:授权扫描数据库,梳理并缓存数据库的敏感数据特征和元数据;
步骤4:依据步骤2配置的分类判断规则和步骤3缓存的敏感数据特征和元数据依次对每个字段进行分类分级判断。
2.根据权利要求1所述的一种基于数据敏感特征和数据库元数据的分类分级方法,其特征在于:所述步骤1的数据分类分级是对数据划分类别并给数据分类配置数据等级。
3.根据权利要求2所述的一种基于数据敏感特征和数据库元数据的分类分级方法,其特征在于:所述数据等级包括但不限于极敏感级、敏感级、较敏感级和低敏感级。
4.根据权利要求1所述的一种基于数据敏感特征和数据库元数据的分类分级方法,其特征在于:所述分类判断规则是分类信息和数据库字段产生映射的条件;分类判断规则包括该分类所包含的敏感数据特征以及相关元数据的精确和模糊匹配。
5.根据权利要求1所述的一种基于数据敏感特征和数据库元数据的分类分级方法,其特征在于:所述敏感数据特征是指一列数据的内容模型,该敏感数据特征是通过对数据库内每张表的字段内容进行部分抽样、预处理分析、正则判断形成的。
6.根据权利要求1所述的一种基于数据敏感特征和数据库元数据的分类分级方法,其特征在于:所述的数据库元数据包括但不限于数据库名、模式名、表名、字段名。
CN201711303997.8A 2017-12-11 2017-12-11 一种基于数据敏感特征和数据库元数据的分类分级方法 Pending CN108062484A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711303997.8A CN108062484A (zh) 2017-12-11 2017-12-11 一种基于数据敏感特征和数据库元数据的分类分级方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711303997.8A CN108062484A (zh) 2017-12-11 2017-12-11 一种基于数据敏感特征和数据库元数据的分类分级方法

Publications (1)

Publication Number Publication Date
CN108062484A true CN108062484A (zh) 2018-05-22

Family

ID=62136371

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711303997.8A Pending CN108062484A (zh) 2017-12-11 2017-12-11 一种基于数据敏感特征和数据库元数据的分类分级方法

Country Status (1)

Country Link
CN (1) CN108062484A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109561092A (zh) * 2018-12-03 2019-04-02 北京安华金和科技有限公司 基于数据流量及数据探测结果进行安全态势建模的方法
CN109635587A (zh) * 2018-12-17 2019-04-16 杭州安恒信息技术股份有限公司 实现数据自动分类分级保护的方法和装置
CN109753811A (zh) * 2018-12-28 2019-05-14 北京东方国信科技股份有限公司 一种检测敏感信息的数据探针设计方法及装置
CN110110551A (zh) * 2019-04-19 2019-08-09 中共中央办公厅电子科技学院(北京电子科技学院) 一种数据存储方法及装置
CN110399432A (zh) * 2019-07-23 2019-11-01 杭州城市大数据运营有限公司 一种表的分类方法、装置、计算机设备及存储介质
CN110765337A (zh) * 2019-11-15 2020-02-07 中科院计算技术研究所大数据研究院 一种基于互联网大数据的服务提供方法
CN111460495A (zh) * 2020-03-27 2020-07-28 北京锐安科技有限公司 一种数据分级管理系统和方法
CN111783045A (zh) * 2020-06-22 2020-10-16 厦门市美亚柏科信息股份有限公司 基于分级分类的数据授权方法和装置
CN112632556A (zh) * 2020-12-18 2021-04-09 北京明朝万达科技股份有限公司 一种基于数据分类分级的端点安全响应的方法及装置
CN113157664A (zh) * 2021-03-18 2021-07-23 中睿信数字技术有限公司 基于分级标识的数据分级与授权方法和系统
CN113360522A (zh) * 2020-03-05 2021-09-07 奇安信科技集团股份有限公司 一种快速识别敏感数据的方法及装置
CN114265967A (zh) * 2022-03-01 2022-04-01 中国光大银行股份有限公司 一种敏感数据安全等级标注方法及装置
US11361104B1 (en) * 2017-12-05 2022-06-14 Jagannadha babu Kolli Method and system for securing data stored in a cloud-based software system
CN115114647A (zh) * 2022-08-26 2022-09-27 湖南华菱电子商务有限公司 一种基于数字中台构建客户画像的客户信息管理方法及系统
CN115168345A (zh) * 2022-06-27 2022-10-11 天翼爱音乐文化科技有限公司 数据库分级分类方法、系统、装置及存储介质
CN117648635A (zh) * 2024-01-30 2024-03-05 深圳昂楷科技有限公司 敏感信息分类分级方法及系统、电子设备
CN117786545A (zh) * 2024-02-28 2024-03-29 北京宇信科技集团股份有限公司 一种数据分类方法、分类系统、存储介质和计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744654A (zh) * 2013-12-20 2014-04-23 中电长城网际系统应用有限公司 基于分级分类的信息防泄漏模板的生成方法和装置
CN104123370A (zh) * 2014-07-24 2014-10-29 杭州安恒信息技术有限公司 数据库敏感信息探测方法及系统
CN106156046A (zh) * 2015-03-27 2016-11-23 中国移动通信集团云南有限公司 一种信息化管理方法、装置、系统及分析设备
CN107357902A (zh) * 2017-07-14 2017-11-17 电子科技大学 一种基于关联规则的数据表分类系统与方法
CN104809405B (zh) * 2015-04-24 2018-06-01 广东电网有限责任公司信息中心 基于分级分类的结构化数据资产防泄露方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744654A (zh) * 2013-12-20 2014-04-23 中电长城网际系统应用有限公司 基于分级分类的信息防泄漏模板的生成方法和装置
CN104123370A (zh) * 2014-07-24 2014-10-29 杭州安恒信息技术有限公司 数据库敏感信息探测方法及系统
CN106156046A (zh) * 2015-03-27 2016-11-23 中国移动通信集团云南有限公司 一种信息化管理方法、装置、系统及分析设备
CN104809405B (zh) * 2015-04-24 2018-06-01 广东电网有限责任公司信息中心 基于分级分类的结构化数据资产防泄露方法
CN107357902A (zh) * 2017-07-14 2017-11-17 电子科技大学 一种基于关联规则的数据表分类系统与方法

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11361104B1 (en) * 2017-12-05 2022-06-14 Jagannadha babu Kolli Method and system for securing data stored in a cloud-based software system
CN109561092A (zh) * 2018-12-03 2019-04-02 北京安华金和科技有限公司 基于数据流量及数据探测结果进行安全态势建模的方法
CN109561092B (zh) * 2018-12-03 2021-01-26 北京安华金和科技有限公司 基于数据流量及数据探测结果进行安全态势建模的方法
CN109635587A (zh) * 2018-12-17 2019-04-16 杭州安恒信息技术股份有限公司 实现数据自动分类分级保护的方法和装置
CN109635587B (zh) * 2018-12-17 2022-03-11 杭州安恒信息技术股份有限公司 实现数据自动分类分级保护的方法和装置
CN109753811B (zh) * 2018-12-28 2021-04-23 北京东方国信科技股份有限公司 一种检测敏感信息的数据探针设计方法及装置
CN109753811A (zh) * 2018-12-28 2019-05-14 北京东方国信科技股份有限公司 一种检测敏感信息的数据探针设计方法及装置
CN110110551A (zh) * 2019-04-19 2019-08-09 中共中央办公厅电子科技学院(北京电子科技学院) 一种数据存储方法及装置
CN110110551B (zh) * 2019-04-19 2021-08-24 中共中央办公厅电子科技学院(北京电子科技学院) 一种数据存储方法及装置
CN110399432A (zh) * 2019-07-23 2019-11-01 杭州城市大数据运营有限公司 一种表的分类方法、装置、计算机设备及存储介质
CN110765337B (zh) * 2019-11-15 2021-04-06 中科院计算技术研究所大数据研究院 一种基于互联网大数据的服务提供方法
CN110765337A (zh) * 2019-11-15 2020-02-07 中科院计算技术研究所大数据研究院 一种基于互联网大数据的服务提供方法
CN113360522B (zh) * 2020-03-05 2023-10-31 奇安信科技集团股份有限公司 一种快速识别敏感数据的方法及装置
CN113360522A (zh) * 2020-03-05 2021-09-07 奇安信科技集团股份有限公司 一种快速识别敏感数据的方法及装置
CN111460495A (zh) * 2020-03-27 2020-07-28 北京锐安科技有限公司 一种数据分级管理系统和方法
CN111783045A (zh) * 2020-06-22 2020-10-16 厦门市美亚柏科信息股份有限公司 基于分级分类的数据授权方法和装置
CN111783045B (zh) * 2020-06-22 2022-08-12 厦门市美亚柏科信息股份有限公司 基于分级分类的数据授权方法和装置
CN112632556A (zh) * 2020-12-18 2021-04-09 北京明朝万达科技股份有限公司 一种基于数据分类分级的端点安全响应的方法及装置
CN113157664A (zh) * 2021-03-18 2021-07-23 中睿信数字技术有限公司 基于分级标识的数据分级与授权方法和系统
CN113157664B (zh) * 2021-03-18 2023-08-25 中睿信数字技术有限公司 基于分级标识的数据分级与授权方法和系统
CN114265967A (zh) * 2022-03-01 2022-04-01 中国光大银行股份有限公司 一种敏感数据安全等级标注方法及装置
CN115168345A (zh) * 2022-06-27 2022-10-11 天翼爱音乐文化科技有限公司 数据库分级分类方法、系统、装置及存储介质
CN115168345B (zh) * 2022-06-27 2023-04-18 天翼爱音乐文化科技有限公司 数据库分级分类方法、系统、装置及存储介质
CN115114647A (zh) * 2022-08-26 2022-09-27 湖南华菱电子商务有限公司 一种基于数字中台构建客户画像的客户信息管理方法及系统
CN115114647B (zh) * 2022-08-26 2022-11-11 湖南华菱电子商务有限公司 一种基于数字中台构建客户画像的客户信息管理方法及系统
CN117648635A (zh) * 2024-01-30 2024-03-05 深圳昂楷科技有限公司 敏感信息分类分级方法及系统、电子设备
CN117648635B (zh) * 2024-01-30 2024-05-03 深圳昂楷科技有限公司 敏感信息分类分级方法及系统、电子设备
CN117786545A (zh) * 2024-02-28 2024-03-29 北京宇信科技集团股份有限公司 一种数据分类方法、分类系统、存储介质和计算机设备

Similar Documents

Publication Publication Date Title
CN108062484A (zh) 一种基于数据敏感特征和数据库元数据的分类分级方法
CN107704637B (zh) 一种面向突发事件的知识图谱构建方法
CN107391598B (zh) 一种威胁情报自动生成方法及系统
CN102402615B (zh) 一种基于结构化查询语言语句的源信息追踪方法
CN111538741B (zh) 一种面向警情大数据的深度学习分析方法及系统
CN108108890A (zh) 一种基于工序关联关系的工艺缺陷风险分析方法
CN108363717B (zh) 一种数据安全级别的识别检测方法及装置
WO2021128523A1 (zh) 一种基于科技大数据的技术成熟度判断方法和系统
CN107516040A (zh) 一种基于数据控制流图的脆弱性特征分析和获取方法
CN106227788A (zh) 一种以Lucene为基础的数据库查询方法
CN110569273A (zh) 一种基于相关性排序的专利检索系统及方法
CN107943514A (zh) 一种软件文档中核心代码元素的挖掘方法及系统
CN107168868A (zh) 一种基于采样和集成学习的软件更改缺陷预测方法
CN118245441B (zh) 一种可自动归类的工商数字档案管理系统
CN115794803A (zh) 一种基于大数据ai技术的工程审计问题监测方法与系统
CN111723136A (zh) 一种面向网格事件分类分级处置的单维聚类分析方法
CN108268462A (zh) 一种关系完整性的数据质量检测系统
Yandong et al. Real‐Time Prediction Model of Coal and Gas Outburst
CN105808602B (zh) 一种垃圾信息的检测方法及装置
CN105573984B (zh) 社会经济指标的识别方法及装置
CN106775694A (zh) 一种软件配置代码制品的层次分类方法
Xia et al. Source Code Vulnerability Detection Based On SAR-GIN
Xia et al. A study on the significance of software metrics in defect prediction
CN114066219A (zh) 一种关联矩阵下用电异常点智能识别的窃电分析方法
CN112100670A (zh) 一种基于大数据的隐私数据分级保护方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180522

WD01 Invention patent application deemed withdrawn after publication