CN110443058A - 一种xml文档脱敏的方法及装置 - Google Patents
一种xml文档脱敏的方法及装置 Download PDFInfo
- Publication number
- CN110443058A CN110443058A CN201810410838.6A CN201810410838A CN110443058A CN 110443058 A CN110443058 A CN 110443058A CN 201810410838 A CN201810410838 A CN 201810410838A CN 110443058 A CN110443058 A CN 110443058A
- Authority
- CN
- China
- Prior art keywords
- desensitization
- xml document
- back end
- data
- xml
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000586 desensitisation Methods 0.000 title claims abstract description 313
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000010276 construction Methods 0.000 claims abstract description 47
- 230000008569 process Effects 0.000 claims abstract description 30
- 230000008521 reorganization Effects 0.000 claims abstract description 8
- 238000007405 data analysis Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 4
- 239000012141 concentrate Substances 0.000 claims description 4
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 230000006798 recombination Effects 0.000 claims description 3
- 238000005215 recombination Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000013497 data interchange Methods 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种XML文档脱敏的方法及装置,涉及计算机技术领域,其方法包括:XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;所述XML文档脱敏装置对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档。本发明通过灵活设置脱敏策略,有效保护XML中的敏感数据,适用于实时或者离线的XML数据脱敏场景。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种XML(Extensible Markup Language,可扩展标记语言)文档脱敏的方法及装置。
背景技术
XML一种类似于HTML(HyperText Markup Language,超文本标记语言)的语言,XML格式统一,跨平台和语言,早已成为业界公认的数据交换标准。XML文档是一种树结构,它从“根”开始,然后扩展到“枝叶”。节点树中的节点彼此之间都有等级关系,可以在不了解树的确切结构且不了解其中包含的数据类型的情况下,对其进行遍历。
以下面的XML片段为例:
<bookstore>
<book category="历史">
<title lang="cn">上下五千年</title>
<author>张三</author>
<year>2017</year>
<price>99.99</price>
</book>
</bookstore>
在上面的XML生成的树片段如图1所示,<title>元素是<book>元素的第一个子节点,而<price>元素是<book>元素的最后一个子节点。<book>元素是<title>、<author>、<year>以及<price>元素的父节点。
随着移动互联网的快速发展,网络中的信息量呈现出爆炸型增长。然而由于网络应用程序本身的缺陷加上管理上的疏忽,越来越多的敏感信息暴露于数据交换过程中。比如XML中保存了比如家庭住址、电话号码、身份证号、工作单位等等,会严重暴露用户的隐私。
目前,在现有技术中,针对XML中的敏感数据脱敏技术问题,业界尚未提出有效的解决方案。
发明内容
根据本发明实施例提供的方案解决的技术问题是无法保护XML中敏感数据。
根据本发明实施例提供的一种XML文档脱敏的方法,包括:
XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;
所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;
所述XML文档脱敏装置对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档。
优选地,还包括所述XML文档脱敏装置生成并保存所述待脱敏的XML文档的脱敏策略包括:
所述XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;
所述XML文档脱敏装置通过对XML文档树结构中的每个数据节点进行数据分析,得到所述XML文档树结构中含有敏感数据的数据节点集;
所述XML文档脱敏装置对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法,生成所述待脱敏XML文档的脱敏策略,并将所述脱敏策略保存至脱敏数据库中。
优选地,所述XML文档脱敏装置对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法包括:
所述XML文档脱敏装置获取每个数据节点的数据类型;
所述XML文档脱敏装置根据数据类型与脱敏算法的对应关系,为每个数据节点设置脱敏算法。
优选地,所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段包括:
所述XML文档脱敏装置通过依次对所述XML文档树结构中的每个数据节点进行数据分析;
若所述数据节点包含敏感数据,则所述XML文档脱敏装置根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。
优选地,所述XML文档脱敏装置根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段包括:
所述XML文档脱敏装置根据待脱敏XML文档,从脱敏数据库中读取所述待脱敏XML文档相对应的脱敏策略;
所述XML文档脱敏装置根据所述数据节点,从所述脱敏策略中查找所述数据节点的脱敏算法;
所述XML文档脱敏装置根据所述脱敏算法对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。
根据本发明实施例提供的一种XML文档脱敏的装置,包括:
解析模块,用于解析待脱敏XML文档,得到XML文档树结构;
数据脱敏模块,用于根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;
重组模块,用于对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档。
优选地,还包括生成脱敏策略模块,具体用于解析待脱敏XML文档,得到XML文档树结构,并通过对XML文档树结构中的每个数据节点进行数据分析,得到所述XML文档树结构中含有敏感数据的数据节点集,以及对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法,生成所述待脱敏XML文档的脱敏策略,并将所述脱敏策略保存至脱敏数据库中。
优选地,所述数据脱敏模块包括:
判断单元,用于通过依次对所述XML文档树结构中的每个数据节点进行数据分析;
数据脱敏单元,用于在所述数据节点包含敏感数据时,根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。
根据本发明实施例提供的一种XML文档脱敏的设备,所述设备包括:处理器,以及与所述处理器耦接的存储器;所述存储器上存储有可在所述处理器上运行的XML文档脱敏的程序,所述XML文档脱敏的程序被所述处理器执行时实现根据本发明实施例提供的XML文档脱敏的方法的步骤。
根据本发明实施例提供的一种计算机存储介质,存储有XML文档脱敏的程序,所述XML文档脱敏的程序被处理器执行时实现根据本发明实施例提供的XML文档脱敏的方法的步骤。
根据本发明实施例提供的方案,与现有方法相比,能够灵活设置脱敏策略,有效保护XML中的敏感数据,适用于实时或者离线的XML数据脱敏场景。
附图说明
图1是现有技术提供的XML文档树结构示意图;
图2是本发明实施例提供的一种XML文档脱敏的方法流程图;
图3是本发明实施例提供的一种XML文档脱敏的装置示意图;
图4是本发明实施例提供的XML文档脱敏装置的示意图;
图5是本发明实施例提供的实施例1的XML文档脱敏流程图;
图6是本发明实施例提供的实施例1脱敏策略设置示意图;
图7是本发明实施例提供的实施例2的XML脱敏流程图;
图8是本发明实施例提供的实施例3的XML脱敏流程图;
图9是本发明实施例提供的实施例4的XML脱敏流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图2是本发明实施例提供的一种XML文档脱敏的方法流程图,如图2所示,包括:
步骤S201:XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;
步骤S202:所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;
步骤S203:所述XML文档脱敏装置对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档。
本发明实施例还包括所述XML文档脱敏装置生成并保存所述待脱敏的XML文档的脱敏策略包括:所述XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;所述XML文档脱敏装置通过对XML文档树结构中的每个数据节点进行数据分析,得到所述XML文档树结构中含有敏感数据的数据节点集;所述XML文档脱敏装置对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法,生成所述待脱敏XML文档的脱敏策略,并将所述脱敏策略保存至脱敏数据库中。
具体得说,所述XML文档脱敏装置对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法包括:所述XML文档脱敏装置获取每个数据节点的数据类型;所述XML文档脱敏装置根据数据类型与脱敏算法的对应关系,为每个数据节点设置脱敏算法。
其中,所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段包括:所述XML文档脱敏装置通过依次对所述XML文档树结构中的每个数据节点进行数据分析;若所述数据节点包含敏感数据,则所述XML文档脱敏装置根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。
具体地说,所述XML文档脱敏装置根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段包括:所述XML文档脱敏装置根据待脱敏XML文档,从脱敏数据库中读取所述待脱敏XML文档相对应的脱敏策略;所述XML文档脱敏装置根据所述数据节点,从所述脱敏策略中查找所述数据节点的脱敏算法;所述XML文档脱敏装置根据所述脱敏算法对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。
图3是本发明实施例提供的一种XML文档脱敏的装置示意图,如图3所示,包括:解析模块301,用于解析待脱敏XML文档,得到XML文档树结构;数据脱敏模块302,用于根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;重组模块303,用于对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档。
本发明实施例还包括生成脱敏策略模块,具体用于解析待脱敏XML文档,得到XML文档树结构,并通过对XML文档树结构中的每个数据节点进行数据分析,得到所述XML文档树结构中含有敏感数据的数据节点集,以及对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法,生成所述待脱敏XML文档的脱敏策略,并将所述脱敏策略保存至脱敏数据库中。
其中,所述数据脱敏模块302包括:判断单元,用于通过依次对所述XML文档树结构中的每个数据节点进行数据分析;数据脱敏单元,用于在所述数据节点包含敏感数据时,根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。
本发明实施例提供的一种XML文档脱敏的设备,所述设备包括:处理器,以及与所述处理器耦接的存储器;所述存储器上存储有可在所述处理器上运行的XML文档脱敏的程序,所述XML文档脱敏的程序被所述处理器执行时实现根据本发明实施例提供的XML文档脱敏的方法的步骤。
本发明实施例提供的一种计算机存储介质,存储有XML文档脱敏的程序,所述XML文档脱敏的程序被处理器执行时实现根据本发明实施例提供的XML文档脱敏的方法的步骤。
图4是本发明实施例提供的XML文档脱敏装置的示意图,如图4所示,包括:XML解析模块、XML结果处理模块、策略模块、脱敏数据库以及脱敏算法模块。
所述XML解析模块:首先从策略模块获取该XML文档的脱敏策略,然后读取XML格式的文档并进行解析,获取树节点值,根据获得的脱敏策略判断当前节点是否需要脱敏转换,如果当前节点需要脱敏,则调用节点对应的脱敏规则进行脱敏转换,最后将脱敏后的生成的数据进行组织,并将结果写入XML格式的文档中;
所述XML结果处理模块:将脱敏后的XML文档存储到存储设备中或者实时发送给应用程序。
所述策略模块:提供脱敏策略配置界面及策略获取接口。策略模块读取并解析待脱敏XML数据文件或者样本XML文件获取其文档树结构,在该XML文档树结构上选择含有敏感数据的节点,设置对应的脱敏算法,然后生成该XML文档对应的脱敏策略,写入脱敏数据库。
所述脱敏数据库,保存XML文档对应的脱敏策略。
所述脱敏算法模块,提供各种脱敏算法的实现及接口调用,包括但不限于加密、替换、随机、偏移等脱敏技术。
利用上述XML文档脱敏装置中的各模块,对XML文档进行脱敏处理的过程具体包括:
步骤1:通过策略模块的策略配置界面或者接口设置待脱敏XML文档的脱敏策略;
特别地:由于XML文档是以结构树的方式存在,本发明通过策略模块读取并解析待脱敏XML数据文件或者样本XML文件获取其文档树结构,在该XML文档树结构上选择含有敏感数据的节点,设置对应的脱敏算法,然后生成该XML文档对应的脱敏策略,写入脱敏数据库。
步骤2:XML解析模块从策略模块获取该XML文档的脱敏策略;
步骤3:XML解析模块读取待脱敏的XML数据文档并进行解析;
步骤4:XML解析模块根据脱敏策略逐个判断当前节点是否需要执行数据脱敏,调用对应的脱敏规则对XML的敏感数据进行脱敏转换,所有节点处理完成后XML解析模块重新组合并生成脱敏后的XML文档;
步骤5:XML结果处理模块将脱敏后生成的XML文档实时发送给应用程序或者写入存储系统。
图5是本发明实施例提供的实施例1的XML文档脱敏流程图,如图5所示,包括:
步骤501:通过策略模块的策略配置界面或者接口设置待脱敏XML文档的脱敏策略;
步骤1.1:指定需要脱敏XML文件,该数据XML文件可以是待脱敏XML文件的采样数据,不需要数据全集;
步骤1.2:策略模块读取并解析待脱敏XML数据文件或者样本XML文件获取其文档树结构;
步骤1.3:如图6所示,在该XML文档树结构上选择含有敏感数据的节点,设置对应的脱敏算法,包括不限于替换、截断、随机等;
步骤1.4:策略模块生成该XML文档对应的脱敏策略,包括每个敏感数据节点的名称、脱敏算法及该节点在数据文件XML文档树的相对位置等;
步骤502:XML解析模块从策略模块读取并解析该待脱敏XML文档的脱敏策略文件;
步骤503:XML解析模块读取待脱敏的XML数据文档并进行解析,可以利用DOM(Document Object Model,文档对象模型)和SAX(Simple APIs for XML,XML简单应用程序接口);基于DOM的XML解析会将一个XML文档转换成一个对象模型的集合(通常称DOM树);而SAX不需要整个读入文档就可以对解析出的内容进行处理,是一种逐步解析的方法。
步骤504:XML解析模块在对XML文档进行遍历过程中,根据获取的脱敏策略逐个判断当前节点是否需要执行数据脱敏,如果需要脱敏,则调用对应的脱敏规则对XML的敏感数据进行脱敏转换,所有节点处理完成后XML解析模块重新组合并生成脱敏后的XML文档;
步骤505:XML结果处理模块将脱敏后生成的XML文档实时发送给应用程序或者写入存储系统。
图7是本发明实施例提供的实施例2的XML脱敏流程图,如图7所示,将XML文件脱敏的装置部署在XML脱敏服务器上,接收实时的脱敏请求或者对已有的XML文档进行离线式的脱敏处理,本实施例详述在数据实时交换过程中保护XML中的敏感数据,具体包括:
步骤701:在策略界面设置待脱敏XML文件的脱敏规则;
步骤702:应用程序直接向XML脱敏服务器发起XML实时脱敏请求;
步骤703:XML解析模块从策略模块获取脱敏策略;
步骤704:XML解析模块读取XML数据文档并进行解析;
步骤705:XML解析模块根据脱敏策略逐个判断当前节点是否需要执行数据脱敏,调用对应的脱敏规则对XML的敏感数据进行脱敏转换;XML解析模块重新组合并生成脱敏后的XML文档;
步骤706:XML处理模块将脱敏后生成的XML文档发送给应用程序。
图8是本发明实施例提供的实施例3的XML脱敏流程图,如图8所示,将XML文件脱敏的装置部署在XML脱敏服务器上,接受实时的脱敏请求或者对已有XML文档进行脱敏处理,本实施例详述XML文件的静态脱敏,以对数据库导出的XML格式的数据进行脱敏为例说明,具体包括:
步骤801:从数据库中把数据导出并生成XML文档;
步骤802:将XML文档传输到本发明装置所在XML脱敏服务器;
步骤803:在策略界面设置待脱敏XML数据文件的脱敏规则;
步骤804:XML解析模块从策略模块获取脱敏策略;
步骤805:XML解析模块读取XML格式的文档并进行解析;
步骤806:XML解析模块根据脱敏策略逐个判断当前节点是否需要执行数据脱敏,调用对应的脱敏规则对XML的敏感数据进行脱敏转换;重新组合并生成脱敏后的XML文档;
步骤:807:XML处理模块将脱敏后生成的XML文档保存到存储设备。
图9是本发明实施例提供的实施例4的XML脱敏流程图,如图9所示,JSON(JavaScript Object Notation,JS对象标记)是一种轻量级的数据交换格式,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得JSON成为理想的数据交换语言,具体包括:
步骤901:通过JSON转换工具将JSON格式文件转换为XML格式;
步骤902:将XML文档传输到本发明装置所在XML脱敏服务器;
步骤903:在策略规则界面设置XML脱敏规则;
步骤904:XML解析模块从策略模块获取脱敏策略;
步骤905:XML解析模块读取XML格式的文档并进行解析;
步骤906:XML解析模块根据脱敏策略逐个判断当前节点是否需要执行数据脱敏,调用对应的脱敏规则对XML的敏感数据进行脱敏转换;重新组合并生成脱敏后的XML文档;
步骤907:XML处理模块将脱敏后生成的XML文档保存到存储设备。
步骤908:通过XML转换工具将XML格式转换为JSON格式。
根据本发明实施例提供的方案,通过灵活设置脱敏策略,有效保护XML中的敏感数据,适用于实时或者离线的XML数据脱敏场景。
尽管上文对本发明进行了详细说明,但是本发明不限于此,本技术领域技术人员可以根据本发明的原理进行各种修改。因此,凡按照本发明原理所作的修改,都应当理解为落入本发明的保护范围。
Claims (10)
1.一种XML文档脱敏的方法,包括:
XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;
所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;
所述XML文档脱敏装置对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档;
其中,所述XML是指可扩展标记语言。
2.根据权利要求1所述的方法,还包括所述XML文档脱敏装置生成并保存所述待脱敏的XML文档的脱敏策略,包括:
所述XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;
所述XML文档脱敏装置通过对XML文档树结构中的每个数据节点进行数据分析,得到所述XML文档树结构中含有敏感数据的数据节点集;
所述XML文档脱敏装置对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法,生成所述待脱敏XML文档的脱敏策略,并将所述脱敏策略保存至脱敏数据库中。
3.根据权利要求2所述的方法,所述XML文档脱敏装置对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法包括:
所述XML文档脱敏装置获取每个数据节点的数据类型;
所述XML文档脱敏装置根据数据类型与脱敏算法的对应关系,为每个数据节点设置脱敏算法。
4.根据权利要求1所述的方法,所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段包括:
所述XML文档脱敏装置通过依次对所述XML文档树结构中的每个数据节点进行数据分析;
若所述数据节点包含敏感数据,则所述XML文档脱敏装置根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。
5.根据权利要求4所述的方法,所述XML文档脱敏装置根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段包括:
所述XML文档脱敏装置根据待脱敏XML文档,从脱敏数据库中读取所述待脱敏XML文档相对应的脱敏策略;
所述XML文档脱敏装置根据所述数据节点,从所述脱敏策略中查找所述数据节点的脱敏算法;
所述XML文档脱敏装置根据所述脱敏算法对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。
6.一种XML文档脱敏的装置,包括:
解析模块,用于通过对待脱敏XML文档进行解析,得到XML文档树结构;
数据脱敏模块,用于根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;
重组模块,用于对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档;
其中,所述XML是指可扩展标记语言。
7.根据权利要求6所述的装置,还包括生成脱敏策略模块,具体用于通过对待脱敏XML文档进行解析,得到XML文档树结构,并通过对XML文档树结构中的每个数据节点进行数据分析,得到所述XML文档树结构中含有敏感数据的数据节点集,以及对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法,生成所述待脱敏XML文档的脱敏策略,并将所述脱敏策略保存至脱敏数据库中。
8.根据权利要求7所述的装置,所述数据脱敏模块包括:
判断单元,用于通过依次对所述XML文档树结构中的每个数据节点进行数据分析,判断所述数据节点是否包含敏感数据;
数据脱敏单元,用于在判断所述数据节点包含敏感数据时,根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。
9.一种XML文档脱敏的设备,所述设备包括:处理器,以及与所述处理器耦接的存储器;所述存储器上存储有可在所述处理器上运行的XML文档脱敏的程序,所述XML文档脱敏的程序被所述处理器执行时实现包括:
通过对待脱敏XML文档进行解析,得到XML文档树结构;
根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;
对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档;
其中,所述XML是指可扩展标记语言。
10.一种计算机存储介质,存储有XML文档脱敏的程序,所述XML文档脱敏的程序被处理器执行时实现包括:
通过对待脱敏XML文档进行解析,得到XML文档树结构;
根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;
对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档;
其中,所述XML是指可扩展标记语言。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810410838.6A CN110443058A (zh) | 2018-05-02 | 2018-05-02 | 一种xml文档脱敏的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810410838.6A CN110443058A (zh) | 2018-05-02 | 2018-05-02 | 一种xml文档脱敏的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110443058A true CN110443058A (zh) | 2019-11-12 |
Family
ID=68427685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810410838.6A Pending CN110443058A (zh) | 2018-05-02 | 2018-05-02 | 一种xml文档脱敏的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110443058A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291410A (zh) * | 2020-02-13 | 2020-06-16 | 支付宝(杭州)信息技术有限公司 | 电子文档的脱敏处理方法及其装置 |
CN111709052A (zh) * | 2020-06-01 | 2020-09-25 | 支付宝(杭州)信息技术有限公司 | 一种隐私数据识别和处理方法、装置、设备和可读介质 |
CN114117498A (zh) * | 2021-12-01 | 2022-03-01 | 恒安嘉新(北京)科技股份公司 | 脱敏数据的实现方法、装置、系统、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107180200A (zh) * | 2017-04-20 | 2017-09-19 | 北京同余科技有限公司 | 数据文件可定制化脱敏方法和系统 |
CN107423632A (zh) * | 2017-04-20 | 2017-12-01 | 北京同余科技有限公司 | 可定制的敏感数据脱敏方法和系统 |
-
2018
- 2018-05-02 CN CN201810410838.6A patent/CN110443058A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107180200A (zh) * | 2017-04-20 | 2017-09-19 | 北京同余科技有限公司 | 数据文件可定制化脱敏方法和系统 |
CN107423632A (zh) * | 2017-04-20 | 2017-12-01 | 北京同余科技有限公司 | 可定制的敏感数据脱敏方法和系统 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291410A (zh) * | 2020-02-13 | 2020-06-16 | 支付宝(杭州)信息技术有限公司 | 电子文档的脱敏处理方法及其装置 |
CN111291410B (zh) * | 2020-02-13 | 2021-09-07 | 支付宝(杭州)信息技术有限公司 | 电子文档的脱敏处理方法及其装置 |
CN111709052A (zh) * | 2020-06-01 | 2020-09-25 | 支付宝(杭州)信息技术有限公司 | 一种隐私数据识别和处理方法、装置、设备和可读介质 |
CN111709052B (zh) * | 2020-06-01 | 2021-05-25 | 支付宝(杭州)信息技术有限公司 | 一种隐私数据识别和处理方法、装置、设备和可读介质 |
CN114117498A (zh) * | 2021-12-01 | 2022-03-01 | 恒安嘉新(北京)科技股份公司 | 脱敏数据的实现方法、装置、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20030023638A1 (en) | Method and apparatus for processing content | |
US6910071B2 (en) | Surveillance monitoring and automated reporting method for detecting data changes | |
CN108549569B (zh) | 一种搜索应用程序内信息的方法及设备 | |
CN111666490A (zh) | 基于kafka的信息推送方法、装置、设备及存储介质 | |
CN111339559A (zh) | 一种日志脱敏的数据处理方法及装置 | |
CN110443058A (zh) | 一种xml文档脱敏的方法及装置 | |
CN111241389A (zh) | 基于矩阵的敏感词过滤方法、装置、电子设备、存储介质 | |
CN111400378A (zh) | 基于ElasticSearch的日志实时显示方法、装置、计算机设备和介质 | |
CN113220657B (zh) | 数据处理方法、装置及计算机设备 | |
CN109582844A (zh) | 一种识别爬虫的方法、装置及系统 | |
CN112956157A (zh) | 追踪客户端设备事件的系统和方法 | |
CN112187713A (zh) | 报文转换的方法、装置、计算机设备和存储介质 | |
CN113360300B (zh) | 接口调用链路生成方法、装置、设备及可读存储介质 | |
CN112130944A (zh) | 页面异常的检测方法、装置、设备及存储介质 | |
CN106557483A (zh) | 一种数据处理、数据查询方法及设备 | |
CN110442439B (zh) | 任务进程处理方法、装置和计算机设备 | |
CN111538645A (zh) | 数据可视化方法及相关设备 | |
CN116776030A (zh) | 灰度发布方法、装置、计算机设备、存储介质 | |
CN110764994A (zh) | 页面元素封装方法、装置、电子设备及存储介质 | |
CN115982503A (zh) | 一种基于云平台的网站信息采集方法及系统 | |
CN116155597A (zh) | 访问请求的处理方法、装置及计算机设备 | |
CN113641632B (zh) | 一种命令行提取日志数据转图形展示的方法 | |
CN110011845A (zh) | 日志采集方法及系统 | |
CN112528189B (zh) | 基于数据的组件封装方法、装置、计算机设备及存储介质 | |
CN113778996A (zh) | 一种大数据流数据处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |