CN113626865A - 一种防止泄露敏感信息的数据共享开放方法及系统 - Google Patents
一种防止泄露敏感信息的数据共享开放方法及系统 Download PDFInfo
- Publication number
- CN113626865A CN113626865A CN202110917980.1A CN202110917980A CN113626865A CN 113626865 A CN113626865 A CN 113626865A CN 202110917980 A CN202110917980 A CN 202110917980A CN 113626865 A CN113626865 A CN 113626865A
- Authority
- CN
- China
- Prior art keywords
- data
- task
- sensitive information
- sharing
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 139
- 230000035945 sensitivity Effects 0.000 claims abstract description 20
- 238000007726 management method Methods 0.000 claims description 43
- 238000013500 data storage Methods 0.000 claims description 13
- 238000010801 machine learning Methods 0.000 claims description 13
- 230000003068 static effect Effects 0.000 claims description 12
- 238000000586 desensitisation Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 7
- 238000012550 audit Methods 0.000 claims description 6
- 238000013475 authorization Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000002955 isolation Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 claims description 3
- 238000013075 data extraction Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000000873 masking effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 7
- 238000003066 decision tree Methods 0.000 description 6
- 238000005034 decoration Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Storage Device Security (AREA)
Abstract
本发明公开了一种防止泄露敏感信息的数据共享开放方法及系统,系统包括原始数据存储库、元数据存储库、数据标定模块、任务管理模块、数据处理模块、数据共享网站和数据开放网站。该方法包括对原始数据所包含的信息敏感进行识别并标定;根据标定结果生成数据处理规则;根据数据处理规则生成数据处理任务;执行处理任务对原始数据所包含的敏感信息进行处理;基于处理后的数据对外提供数据共享和开放服务。本发明所述的方法及系统能够有效识别数据中的敏感信息,并自动将转换后的数据抽取到物理隔离的共享库、开放库对外提供数据服务,或以数据服务接口的形式对外提供数据共享开放服务,可有效避免敏感信息泄露,且具有极高的处理效率。
Description
技术领域
本发明属于数据共享开放技术领域,尤其涉及一种防止泄露敏感信息的数据共享开放方法及系统。
背景技术
随着信息化发展不断深入,不同系统、不同组织或者不同个体之间必然存在数据共享开放的需求。数据流通成为数据时代中释放数据红利和价值主要手段和途径。
而数据共享不可避免涉及到敏感信息保护的问题,如个人隐私信息、商业敏感信息等,如果不进行处理,会存在敏感信息泄露的风险。
目前主要的数据共享、数据开放过程是经过申请、审核、授权访问的形式,通过人工识别敏感信息、判定数据的共享范围和共享形式、配置数据脱敏方法等。
而随着数据共享开放的需求越来越广泛,上述方式存在效率低下、审查尺度难以统一等问题,因而会导致诸多问题,如:人工效率低下,周期过长;存在审核不严、导致敏感数据泄露的风险;惧怕担责,导致数据不敢共享等。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种防止泄露敏感信息的数据共享开放方法及系统。
为了解决上述技术问题,本发明第一方面公开了一种防止泄露敏感信息的数据共享开放方法,包括:
S1、对原始数据所包含的敏感信息进行识别并标定;
S2、根据标定结果生成数据处理规则库;
S3、根据数据处理规则库生成数据处理任务;
S4、执行数据处理任务,对原始数据所包含的敏感信息进行处理;
S5、基于处理后的数据和数据共享开放规则对外提供数据共享和开放服务。
结合第一方面,进一步的,所述的步骤S1包括:
S101、对原始数据进行抽样;
S102、结合机器学习算法,判断抽样数据是否包含敏感信息,以及所述敏感信息的敏感信息类型和敏感等级等。如数据是否包含个人身份证号、个人联系方式、个人地址、银行卡号等。
S103、根据判断结果,使用标签对数据各信息项的敏感属性进行标定;所述敏感属性包括数据信息项是否包含敏感信息、敏感信息类型以及敏感等级。
数据敏感属性的判定,通常根据个人经验、结合数据本身的属性和业务背景综合判断,具有低效、不客观、尺度不统一等缺点。而采用机器学习的方法,经过训练,可以生成一个标准化的判定模型,从而解决人工标定的上述问题。
结合第一方面,进一步的,所述的步骤S103中使用标签对数据各信息项的敏感属性进行标定,可对各单信息项的敏感属性进行标定;也可以对多个信息项的组合所包含的敏感信息进行标定。
敏感信息既有可能包含在单个信息项中,如个人联系方式;也可能包含在一些特定的信息项的组合中,如一条信息中同时包含了身份证号码、籍贯和出生日期等属性,即使按照规则对身份证号相关位置进行了脱敏,仍然有可能从脱敏后的数据结合籍贯和出生日期信息唯一确定该条记录所关联的自然人个体,即导致个人敏感信息的泄露。对于多个信息项组合的敏感信息形式,人工审核标定极容易忽略,而通过固化到数据标定模块中,则可以提高敏感信息发现的准确率。
结合第一方面,进一步的,所述的步骤S2根据标定结果,结合机器学习算法,制定数据处理规则,形成数据处理规则库;所述数据处理规则包括数据脱敏、变形、字段屏蔽、字符串替换等。
结合第一方面,进一步的,所述的步骤S3中数据处理任务包括一个以上的子任务、抽取任务和数据加载任务,所述子任务用于根据数据处理规则库中的一条处理规则对数据进行处理,所述对数据进行处理包括敏感信息脱敏、加密、变形和替换;所述抽取任务用于抽取原始数据,所述数据加载任务用于对处理后的数据输出到文件、数据库或数据仓库等,供数据共享和开放使用;
步骤S3包括:
S301、根据数据处理规则库中的每一条处理规则,生成对数据进行处理的一个子任务;
S302、将一个以上的子任务连接在一起,并在第一个子任务前增加数据抽取任务、在最后一个子任务后增加数据加载任务,生成数据处理任务。
结合第一方面,进一步的,所述的步骤S3中的数据处理任务的任务类型包括离线处理任务和实时处理任务,所述离线处理任务能够周期性地对原始数据进行数据处理,获得静态数据,并将静态数据存入数据库或文件系统,静态数据能够直接对外共享或开放;所述实时处理任务指在收到数据共享或数据开放请求时,动态执行数据处理任务,获得动态数据,并向请求方发送动态数据;
所述的步骤S4中,数据处理任务根据任务类型由系统调度执行,当任务类型为离线处理任务时,则执行离线处理任务,生成静态数据;当任务类型为实时处理任务时,则在收到数据共享或开放请求时,执行实时处理任务,生成动态数据,并向请求方发送动态数据。
第二方面,提供了一种防止泄露敏感信息的数据共享开放系统,包括原始数据存储库、元数据存储库、数据标定模块、规则管理模块、任务管理模块、数据处理模块、数据共享网站和数据开放网站,
所述原始数据存储库,用于保存需要被共享或开放的原始数据,所述原始数据包括结构化的数据、半结构化数据和非结构化数据;
所述元数据存储库,用于保存元数据信息,包括数据格式、存储方式、访问方式,是否可以共享、是否可以开放,以及经数据标定模块分析后生成的标签数据,所述标签数据包括是否包含敏感信息、敏感信息类型和敏感等级;
所述数据标定模块,与原始数据存储库、元数据存储库和规则管理模块连接,用于对原始数据所包含的敏感信息、敏感信息类型和敏感等级进行识别并标定;
所述规则管理模块,与数据标定模块、元数据存储库连接,用于根据标定结果生成数据处理规则库;
所述任务管理模块,与规则管理模块和数据处理模块连接,用于根据数据处理规则库生成数据处理任务,对数据处理任务进行管理;所述数据处理任务的任务类型包括离线处理任务和实时处理任务;所述管理包括任务的启动、停止和调度;
所述数据处理模块,与原始数据存储库连接,并通过网络隔离设备与数据共享网站和数据开放网站连接;所述数据处理模块用于接收任务管理模块的调度,执行离线处理任务或实时处理任务;
所述数据共享网站,以数据资源目录的形式,将共享数据库、共享数据文件系统和共享数据服务接口展现在网站上,并提供数据申请/授权、上线/下线、权限管理、流量管理和日志审计功能。
所述数据开放网站,以数据资源目录的形式,将开放数据库、开放数据文件系统和开放数据服务接口展现在网站上,并提供数据申请/授权、上线/下线、权限管理、流量管理和日志审计功能。
结合第二方面,进一步的,所述数据标定模块包含一个敏感数据分析模型,通过机器学习和模型训练,实现采集分析原始数据,并判定各原始数据是否包含敏感信息、敏感信息类型和敏感等级,并生成相应的标签,保存到元数据存储库。
结合第二方面,进一步的,所述规则管理模块,包含一个规则引擎,通过读取元数据存储库中的敏感信息元数据,根据数据存储方式和共享开放属性,匹配对应的数据处理规则。
结合第二方面,进一步的,数据共享网站、数据开放网站、原始数据存储库、元数据存储库、数据标定模块、任务管理模块、数据处理模块及原始数据是物理隔离的,通过单向网闸和安全设备实现数据交换,以进一步降低敏感信息被泄露的风险。
有益效果:
本发明所述的防止泄露敏感信息的数据共享开放方法及系统可以自动识别原始数据中所包含的敏感信息、敏感信息类型和敏感等级,并结合机器学习、规则引擎等技术手段,自动生成数据处理任务,并基于处理后的数据提供数据共享和数据开放服务。借助该方法及系统实现高效自动化的数据共享和开放,且能很好的保护隐私数据不被泄露。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1为本发明实施例所述的一种防止泄漏敏感信息的数据共享开放系统结构图。
图2为本发明实施例所述的一种防止泄漏敏感信息的数据共享开放方法处理流程图。
具体实施方式
下面将结合附图,对本发明的实施例进行描述。
本发明第一实施例公开一种防止泄露敏感信息的数据共享开放方法,如图2所示,包括:
S1、对原始数据所包含的敏感信息进行识别并标定;
S2、根据标定结果生成数据处理规则库;
S3、根据数据处理规则库生成数据处理流程和任务;
S4、执行数据处理任务,对原始数据所包含的敏感信息进行处理;
S5、基于处理后的数据和数据共享开放规则对外提供数据共享和开放服务,所述数据共享开放规则根据业务需要设置,包括无条件共享开放、仅部分字段可共享开放和需对字段进行脱敏后方可共享开放等。
第一实施例中,所述的步骤S1的具体执行方法如下:
S101、对原始数据进行抽样;所述原始数据包括结构化的数据、半结构化数据和非结构化数据,对于结构化数据,不同数据的相同列,其数据格式、含义等都是一样的,仅需要抽样即可获取其数据属性;对于非结构化数据,需要进行全文扫描和标定。
S102、结合机器学习算法,判断抽样的数据是否包含敏感信息,以及所述敏感信息的敏感信息类型和敏感等级等,如数据是否包含个人身份证号、个人联系方式、个人地址、银行卡号等。本实施例中,可以使用分类技术对抽样的数据进行分类管理,通过机器学习引擎,实施有监督机器学习,最终实现自动标定抽样数据的敏感属性。
在本实施例中,可以使用决策树算法作为一种可选实现方式。决策树是一种简单而又被广泛使用的分类器,具体实施中,通过对数据的业务属性、对应业务场景中该数据是否包含敏感信息、敏感信息类型以及敏感等级进行量化,来构建训练集形成决策树。并可以在使用过程中,持续将新的业务场景中数据的敏感属性加入训练集,对决策树持续改进以提高决策树的鲁棒性。
S103、根据判断结果,使用标签对数据各信息项的敏感属性进行标定;所述敏感属性包括数据信息项是否包含敏感信息、敏感信息类型以及敏感等级。
第一实施例中,所述的步骤S103中使用标签对数据各信息项的敏感属性进行标定,可对各单信息项的敏感属性进行标定;也可以对多个信息项的组合所包含的敏感信息进行标定。
第一实施例中,所述的步骤S2根据标定结果,结合机器学习算法制定数据处理规则库。所述数据处理规则包括数据脱敏、变形、字段屏蔽和字符串替换等;本实施例中,可以采用决策树算法作为一种可选的实现方式。将数据的敏感属性、各类数据处理规则对敏感信息的保护效果等进行量化,实施有监督学习形成决策树,并持续把新的数据处理规则加入训练集。
第一实施例中,所述的步骤S3中数据处理任务包括一个以上的子任务、抽取任务和数据加载任务,所述子任务用于根据数据处理规则库中的一条处理规则对数据进行处理,所述对数据进行处理包括敏感信息脱敏、加密、变形和替换;所述抽取任务用于抽取原始数据,所述数据加载任务用于对处理后的数据输出到文件、数据库或数据仓库等,供数据共享和开放使用;
所述的步骤S3的具体执行方法如下:
S301、根据数据处理规则库中的每一条处理规则,生成对数据进行处理的一个子任务;
S302、将一个以上的子任务连接在一起,并在第一个子任务前增加数据抽取任务、在最后一个子任务后增加数据加载任务,生成数据处理任务。
第一实施例中,所述的步骤S3中的数据处理任务的任务类型包括离线处理任务和实时处理任务,所述离线处理任务能够周期性地对原始数据进行数据处理,获得静态数据,并将静态数据存入数据库或文件系统,静态数据能够直接对外共享或开放;所述实时处理任务指在收到数据共享或数据开放请求时,动态执行数据处理任务,获得动态数据,并向请求方发送动态数据;
所述的步骤S4中,数据处理任务根据任务类型由系统调度执行,当任务类型为离线处理任务时,则执行离线处理任务,生成静态数据;当任务类型为实时处理任务时,则在收到数据共享或开放请求时,执行实时处理任务,生成动态数据,并向请求方发送动态数据。
本发明第二实施例公开一种防止泄露敏感信息的数据共享开放系统,如图1所示,包括原始数据存储库、元数据存储库、数据标定模块、规则管理模块、任务管理模块、数据处理模块、数据共享网站和数据开放网站:
原始数据存储库,用于保存需要被共享或开放的原始数据,所述原始数据包括结构化的数据、半结构化数据和非结构化数据。
元数据存储库,用于保存元数据信息,包括数据格式、存储方式、访问方式,是否可以共享、是否可以开放,以及经数据标定模块分析后生成的标签数据,如是否包含敏感信息、敏感信息类型、敏感等级等。
数据标定模块,与原始数据存储库、元数据存储库和规则管理模块连接,用于对原始数据所包含的敏感信息、敏感信息类型和敏感等级进行识别并标定;
规则管理模块,与数据标定模块、元数据存储库连接,用于根据标定结果生成数据处理规则库;
任务管理模块,与规则管理模块、数据处理模块连接,用于根据数据处理规则库生成数据处理任务,对数据处理任务进行管理;所述数据处理任务的任务类型包括离线处理任务和实时处理任务;所述管理包括任务的启动、停止和调度;
数据处理模块,与原始数据存储库连接,并通过网络隔离设备与数据共享网站和数据开放网站连接;所述数据处理模块是数据处理任务的计算引擎,用于接收任务管理模块的调度,并进行相关的离线或实时数据处理工作。对于离线任务,把数据转换后存入共享库、开放库或者以文件形式存入共享开放网站对应的文件系统;对于实时任务,可根据配置生成数据服务接口,和对应的接口后台实现,并将服务接口注册到共享网站或开放网站以对外提供服务。
数据共享网站,以数据资源目录的形式,把共享数据库、共享数据文件系统和共享数据服务接口展现在网站上,并提供数据申请/授权、上线/下线、权限管理、流量管理、日志审计等流程和功能。
数据开放网站,以数据资源目录的形式,把开放数据库、开放数据文件系统和开放数据服务接口展现在网站上,并提供数据申请/授权、上线/下线、权限管理、流量管理、日志审计等流程和功能。
例如,针对政务数据处理,数据共享网站用于将政府内部各部门或其所属单位之间的数据交换或提供数据服务;数据开放网站用于面向社会公众提供数据或数据服务。
第二实施例中,所述的数据标定模块包含一个敏感数据分析模型,通过机器学习和模型训练,实现采集分析原始数据,并判定各原始数据是否包含敏感信息、敏感信息类型和敏感等级,并生成相应的标签,保存到元数据存储库。
第二实施例中,所述的规则管理模块,包含一个规则引擎,通过读取元数据存储库中的敏感信息元数据,根据数据的存储类型和共享开放属性,匹配对应的数据处理规则。
第二实施例中,所述的数据共享网站、开放网站数据和数据处理模块之间通过隔离设备实现物理隔离,防止未经授权或未经处理的数据被共享或开放,保护原始数据所包含的敏感信息不被泄露。
数据共享网站、数据开放网站、原始数据存储库、元数据存储库、数据标定模块、任务管理模块、数据处理模块及原始数据是物理隔离的,通过单向网闸和安全设备实现数据交换,以进一步降低敏感信息被泄露的风险。
本发明提供了一种防止泄露敏感信息的数据共享开放方法及系统,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (10)
1.一种防止泄露敏感信息的数据共享开放方法,其特征在于,包括:
S1、对原始数据所包含的敏感信息进行识别并标定;
S2、根据标定结果生成数据处理规则库;
S3、根据数据处理规则库生成数据处理任务;
S4、执行数据处理任务,对原始数据所包含的敏感信息进行处理;
S5、基于处理后的数据和数据共享开放规则对外提供数据共享和开放服务。
2.根据权利要求1所述的一种防止泄露敏感信息的数据共享开放方法,其特征在于,所述的步骤S1包括:
S101、对原始数据进行抽样;
S102、结合机器学习算法,判断抽样数据是否包含敏感信息,以及所述敏感信息的敏感信息类型和敏感等级;
S103、根据判断结果,使用标签对数据各信息项的敏感属性进行标定;所述敏感属性包括数据信息项是否包含敏感信息、敏感信息类型以及敏感等级。
3.根据权利要求2所述的一种防止泄露敏感信息的数据共享开放方法,其特征在于,所述的步骤S103中使用标签对数据各信息项的敏感属性进行标定,可对各单信息项的敏感属性进行标定;也可以对多个信息项的组合所包含的敏感信息进行标定。
4.根据权利要求1所述的一种防止泄露敏感信息的数据共享开放方法,其特征在于,所述的步骤S2根据标定结果,结合机器学习算法,制定数据处理规则,形成数据处理规则库;所述数据处理规则包括数据脱敏、变形、字段屏蔽和字符串替换。
5.根据权利要求1所述的一种防止泄露敏感信息的数据共享开放方法,其特征在于,所述的步骤S3中数据处理任务包括一个以上的子任务、抽取任务和数据加载任务,所述子任务用于根据数据处理规则库中的一条处理规则对数据进行处理,所述对数据进行处理包括敏感信息脱敏、加密、变形和替换;所述抽取任务用于抽取原始数据,所述数据加载任务用于对处理后的数据输出到文件、数据库或数据仓库,供数据共享和开放使用;
所述步骤S3包括:
S301、根据数据处理规则库中的每一条处理规则,生成对数据进行处理的一个子任务;
S302、将一个以上的子任务连接在一起,并在第一个子任务前增加数据抽取任务、在最后一个子任务后增加数据加载任务,生成数据处理任务。
6.根据权利要求1所述的一种防止泄露敏感信息的数据共享开放方法,其特征在于,所述的步骤S3中的数据处理任务的任务类型包括离线处理任务和实时处理任务,所述离线处理任务能够周期性地对原始数据进行数据处理,获得静态数据,并将静态数据存入数据库或文件系统,静态数据能够直接对外共享或开放;所述实时处理任务指在收到数据共享或数据开放请求时,动态执行数据处理任务,获得动态数据,并向请求方发送动态数据;
所述的步骤S4中,数据处理任务根据任务类型由系统调度执行,当任务类型为离线处理任务时,则执行离线处理任务,生成静态数据;当任务类型为实时处理任务时,则在收到数据共享或开放请求时,执行实时处理任务,生成动态数据,并向请求方发送动态数据。
7.一种防止泄露敏感信息的数据共享开放系统,其特征在于,包括原始数据存储库、元数据存储库、数据标定模块、规则管理模块、任务管理模块、数据处理模块、数据共享网站和数据开放网站,
所述原始数据存储库,用于保存需要被共享或开放的原始数据,所述原始数据包括结构化的数据、半结构化数据和非结构化数据;
所述元数据存储库,用于保存元数据信息,包括数据格式、存储方式、访问方式,是否可以共享、是否可以开放,以及经数据标定模块分析后生成的标签数据,所述标签数据包括是否包含敏感信息、敏感信息类型和敏感等级;
所述数据标定模块,与原始数据存储库、元数据存储库和规则管理模块连接,用于对原始数据所包含的敏感信息、敏感信息类型和敏感等级进行识别并标定;
所述规则管理模块,与数据标定模块、元数据存储库连接,用于根据标定结果生成数据处理规则库;
所述任务管理模块,与规则管理模块和数据处理模块连接,用于根据数据处理规则库生成数据处理任务,对数据处理任务进行管理;所述数据处理任务的任务类型包括离线处理任务和实时处理任务;所述管理包括任务的启动、停止和调度;
所述数据处理模块,与原始数据存储库连接,并通过网络隔离设备与数据共享网站和数据开放网站连接;所述数据处理模块用于接收任务管理模块的调度,执行离线处理任务或实时处理任务;
所述数据共享网站,以数据资源目录的形式,将共享数据库、共享数据文件系统和共享数据服务接口展现在网站上,并提供数据申请/授权、上线/下线、权限管理、流量管理和日志审计功能;
所述数据开放网站,以数据资源目录的形式,将开放数据库、开放数据文件系统和开放数据服务接口展现在网站上,并提供数据申请/授权、上线/下线、权限管理、流量管理和日志审计功能。
8.根据权利要求7所述的一种防止泄露敏感信息的数据共享开放系统,其特征在于,所述数据标定模块包含一个敏感数据分析模型,通过机器学习和模型训练,实现采集分析原始数据,并判定各原始数据是否包含敏感信息、敏感信息类型和敏感等级,并生成相应的标签,保存到元数据存储库。
9.根据权利要求7所述的一种防止泄露敏感信息的数据共享开放系统,其特征在于,所述规则管理模块,包含一个规则引擎,通过读取元数据存储库中的敏感信息元数据,根据数据存储方式和共享开放属性,匹配对应的数据处理规则。
10.根据权利要求7所述的一种防止泄露敏感信息的数据共享开放系统,其特征在于,数据共享网站、数据开放网站、原始数据存储库、元数据存储库、数据标定模块、任务管理模块、数据处理模块及原始数据是物理隔离的,通过单向网闸和安全设备实现数据交换。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110917980.1A CN113626865A (zh) | 2021-08-11 | 2021-08-11 | 一种防止泄露敏感信息的数据共享开放方法及系统 |
PCT/CN2022/106225 WO2023016192A1 (zh) | 2021-08-11 | 2022-07-18 | 一种防止泄露敏感信息的数据共享开放方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110917980.1A CN113626865A (zh) | 2021-08-11 | 2021-08-11 | 一种防止泄露敏感信息的数据共享开放方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113626865A true CN113626865A (zh) | 2021-11-09 |
Family
ID=78384299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110917980.1A Pending CN113626865A (zh) | 2021-08-11 | 2021-08-11 | 一种防止泄露敏感信息的数据共享开放方法及系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113626865A (zh) |
WO (1) | WO2023016192A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114238280A (zh) * | 2021-12-20 | 2022-03-25 | 中电金信软件有限公司 | 构建金融敏感信息标准库的方法、装置及电子设备 |
WO2023016192A1 (zh) * | 2021-08-11 | 2023-02-16 | 南京莱斯网信技术研究院有限公司 | 一种防止泄露敏感信息的数据共享开放方法及系统 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117077201B (zh) * | 2023-08-30 | 2024-03-29 | 国网山东省电力公司德州供电公司 | 一种基于多域联合的高密级数据共享防泄漏方法及系统 |
CN117725611B (zh) * | 2023-11-30 | 2024-09-13 | 国网青海省电力公司信息通信公司 | 数据共享方法及装置 |
CN117708847B (zh) * | 2023-12-04 | 2024-08-30 | 广州智租信息科技有限责任公司 | 基于数据压缩与加密的3c产品租赁平台数据处理方法 |
CN117874117A (zh) * | 2024-01-18 | 2024-04-12 | 杭州泛嘉科技有限公司 | 一种数据信息管理的会员增值服务平台 |
CN118094568B (zh) * | 2024-04-22 | 2024-07-12 | 软极网络技术(北京)有限公司 | 一种基于安全可信环境的数据要素交易流通系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529329A (zh) * | 2016-10-11 | 2017-03-22 | 中国电子科技网络信息安全有限公司 | 一种用于大数据的脱敏系统及脱敏方法 |
CN107480549A (zh) * | 2017-06-28 | 2017-12-15 | 银江股份有限公司 | 一种面向数据共享的敏感信息脱敏方法及系统 |
CN111400765A (zh) * | 2020-03-25 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 一种隐私数据的访问方法、装置及电子设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10019588B2 (en) * | 2016-01-15 | 2018-07-10 | FinLocker LLC | Systems and/or methods for enabling cooperatively-completed rules-based data analytics of potentially sensitive data |
CN108304726A (zh) * | 2017-01-13 | 2018-07-20 | 中国移动通信集团贵州有限公司 | 数据脱敏方法和装置 |
CN109344258B (zh) * | 2018-11-28 | 2021-11-12 | 中国电子科技网络信息安全有限公司 | 一种智能化自适应敏感数据识别系统及方法 |
CN110851860A (zh) * | 2019-10-23 | 2020-02-28 | 国网天津市电力公司电力科学研究院 | 一种基于匿名化隐私技术的用电数据脱敏算法模型构建方法 |
CN113626865A (zh) * | 2021-08-11 | 2021-11-09 | 南京莱斯网信技术研究院有限公司 | 一种防止泄露敏感信息的数据共享开放方法及系统 |
-
2021
- 2021-08-11 CN CN202110917980.1A patent/CN113626865A/zh active Pending
-
2022
- 2022-07-18 WO PCT/CN2022/106225 patent/WO2023016192A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529329A (zh) * | 2016-10-11 | 2017-03-22 | 中国电子科技网络信息安全有限公司 | 一种用于大数据的脱敏系统及脱敏方法 |
CN107480549A (zh) * | 2017-06-28 | 2017-12-15 | 银江股份有限公司 | 一种面向数据共享的敏感信息脱敏方法及系统 |
CN111400765A (zh) * | 2020-03-25 | 2020-07-10 | 支付宝(杭州)信息技术有限公司 | 一种隐私数据的访问方法、装置及电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023016192A1 (zh) * | 2021-08-11 | 2023-02-16 | 南京莱斯网信技术研究院有限公司 | 一种防止泄露敏感信息的数据共享开放方法及系统 |
CN114238280A (zh) * | 2021-12-20 | 2022-03-25 | 中电金信软件有限公司 | 构建金融敏感信息标准库的方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2023016192A1 (zh) | 2023-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113626865A (zh) | 一种防止泄露敏感信息的数据共享开放方法及系统 | |
US11295034B2 (en) | System and methods for privacy management | |
US12008137B2 (en) | Systems and method of contextual data masking for private and secure data linkage | |
US11893136B2 (en) | Token-based data security systems and methods with cross-referencing tokens in freeform text within structured document | |
CN114186275A (zh) | 隐私保护方法、装置、计算机设备及存储介质 | |
CN115329381A (zh) | 基于敏感数据的分析预警方法、装置、计算机设备及介质 | |
CN113158233A (zh) | 数据预处理方法、装置及计算机存储介质 | |
CN111489105A (zh) | 一种企业风险识别方法、装置及设备 | |
CN117574436B (zh) | 一种基于张量的大数据隐私安全防护方法 | |
Fu et al. | Data correlation‐based analysis methods for automatic memory forensic | |
CN106156904B (zh) | 一种基于eID的跨平台虚拟资产溯源方法 | |
Kenyon et al. | Big data science for predicting insurance claims fraud | |
US8307001B2 (en) | Auditing of curation information | |
CN112346938B (zh) | 操作审计方法、装置及服务器和计算机可读存储介质 | |
Ibrishimova | Cyber incident classification: issues and challenges | |
CN112347066B (zh) | 日志处理方法、装置及服务器和计算机可读存储介质 | |
CN111782967A (zh) | 信息处理方法、装置、电子设备和计算机可读存储介质 | |
Dubey et al. | A major threat to big data: data security | |
CN110399749A (zh) | 数据资产管理方法及系统 | |
Mundt et al. | Enhancing Incident Management by an Improved Understanding of Data Exfiltration: Definition, Evaluation, Review | |
CN117951748B (zh) | 隐私数据的数据存储架构构建方法、装置、设备及介质 | |
CN110287711B (zh) | 一种保护用户隐私的分析方法 | |
Templ et al. | Practical applications in statistical disclosure control using R | |
CN112347510B (zh) | 脱敏方法和脱敏装置 | |
CN115221857B (zh) | 一种含数值类型的数据相似性检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |