CN109740363B - 文档分级脱敏加密方法 - Google Patents

文档分级脱敏加密方法 Download PDF

Info

Publication number
CN109740363B
CN109740363B CN201910009142.7A CN201910009142A CN109740363B CN 109740363 B CN109740363 B CN 109740363B CN 201910009142 A CN201910009142 A CN 201910009142A CN 109740363 B CN109740363 B CN 109740363B
Authority
CN
China
Prior art keywords
document
security
desensitization
level
encryption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910009142.7A
Other languages
English (en)
Other versions
CN109740363A (zh
Inventor
彭长根
魏自强
张爽
王艳
方粘粘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou University
Original Assignee
Guizhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou University filed Critical Guizhou University
Priority to CN201910009142.7A priority Critical patent/CN109740363B/zh
Publication of CN109740363A publication Critical patent/CN109740363A/zh
Application granted granted Critical
Publication of CN109740363B publication Critical patent/CN109740363B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种文档分级脱敏加密方法。本发明将文档脱敏技术、文档分级技术以及文档加密技术结合实现文档保密性、完整性、可用性、安全共享、文档分级以及特殊情况下的工作需要,构造敏感信息的可计算的线性代数模型,实现敏感信息的快速、准确定位,以及多信息关联确定,防止泄露国家机密,对保障国家安全有着积极推进的作用。对于等级不同的人员,实现保密文档的分级解密访问控制技术,即拥有不同安全级别的人员在解密相同的保密文档时,可以获取不同的解密信息。实现分级解密的能力。提高加密文件在传输和共享方案中访问控制的灵活性、安全性。分级脱敏加密方法适用于银行、军工单位、党政机关等安全办公需求。

Description

文档分级脱敏加密方法
技术领域
本发明涉及计算机安全技术领域,具体为一种文档分级脱敏加密方法。
背景技术
文档存储在计算机系统中,并通过计算机网络进行传输、交换,其中,国家机密、商业信息以及个人隐私等数据一旦被非法窃取或删改将造成难以估量的损失。对于文档构建多级安全等级,同时对用户划分等级,使的用户权限和文档等级相对应。以达到对用户的权限进行控制和管理,减少或防止攻击。
敏感数据被泄露和攻击的危险存在其生命周期的所有部分,例如生产、存储等。这些风险包括:数据库侵人、协议漏洞、内部人员越权访问、以及合法职员错误操作等。大多数公司专注于外围安全和终端防护,购置反病毒软件或防火墙,并安全的配置网络设备。但是,对于各行业的中心资产数据来说,这种预防方法实现能力有限。伴随着大数据时期,隐私数据的价值越来越高,各行业应重点投资保护敏感数据的外漏风险,达到预期的安全收益。数据脱敏指在保留其文档原有的特征的条件下,根据需要对敏感数据进行一定的变换或遮蔽。不论是管理者还是使用者,只有在必须知道和被授权的条件下,才能通过特定的工具和运用程序来访问数据的真实值。以此减少那些重要数据在移动和共享时的风险。在不降低安全性、扩大原有数据的使用规模和共享对象的先前条件下,数据脱敏是大数据环境下最有用的保护敏感信息的方法。
但在一些特殊情况下,诸如一些高安全等级的文档里提到的任务需要不同安全等级的人员共同完成。而低安全等级的人员又无法查看高安全等级的文档,因此将高安全等级的文档进行分级脱敏,即将同一份文档脱敏成不同的安全等级的文档,供不同安全等级的人员查看,这样可很好的解决这类问题。
发明内容
针对现有技术的不足,本发明提供了一种基于国密的代理签章方法,它实现文档保密性、完整性、可用性、安全共享、文档分级以及特殊情况下的工作需要,还能实现敏感信息的快速、准确定位,以及多信息关联确定。
为实现以上目的,本发明通过以下技术方案予以实现:文档分级脱敏加密方法,先建立敏感信息表,敏感信息表通过人为创建、更新敏感信息表,或通过机器学习创建、更新敏感信息表;文档创建者对文档进行安全划分;文档创建者选择对文档进行二次分级并脱敏后进行文档加密共享。
具体操作包括如下步骤:
1)初始化:划分文档的安全等级,以及相对应的人员安全等级;确定加密算法及系统密钥参数;
2)创建文档不同安全等级敏感信息表:对于不同安全等级,建立相对应的安全等级敏感信息表;根据人为创建或机器学习的方式更新敏感信息表;
3)可计算的线性代数模型构造:首先将一个单调布尔函数转化成一个访问树,用到的访问树都是二叉树:每一个内部节点都是AND或者OR这样的逻辑关系,叶子结点对应着信息,完成以上变换之后,将访问树变换成一个等价矩阵M;从树的根节点开始,以自顶向下的方式用向量表示一个内部结点;根节点设置其向量为1,即一个长度为1的向量;父节点是一个向量a标记的AND,用向量a|1标记它左边的子节点,用向量(0,…0)|-1标记它右边的子节点,其中(0,…0)表示长度为c的零向量;然后将c的长度增加1用于对下一层节点进行如上处理,对下一层节点进行如上处理;整个树的所有节点都标记完成后,所标记树的叶子节点的向量构成了线性矩阵;当这些向量的长度不同的情况下,采用0在该向量的末尾补齐,使得所有向量的长度都相同;将访问树转化成其对应的矩阵M,然后将矩阵M的横向量相加,如果可化为(1,0,..,0),则表示这些信息能够组成敏感信息,如不能则表示这些信息不是敏感信息;
4)文档创始人提交文档上传请求:创建人提出请求,通过则进入下步,不通过则结束;
5)文档分级:创建者给文档确定安全等级,然后系统根据敏感信息表判断文档安全等级是否合理;杜绝低安全等级人员上传高安全等级文档、杜绝高安全等级文档被划分为低安全等级文档或杜绝低安全等级人员操作高安全等级文档;提高文档在传输和共享方案中访问控制的灵活性和安全性;
6)加密:对文档进行加密,对于不同安全等级的文档选择不同的加密算法加密文档;对于不同安全等级的文档密钥可选择不同的非对称密码算法加密文档密钥。
7)上传共享:创建者将分级、脱密、加密后的文档上传共享,供不同安全等级的人员解密使用。
对于不同安全等级文档,选择不同加密方法及混合加密方法。
加密方法包括加密算法DES、3DES、AES及国密SM4;非对称加密算法可选择RES、ECC及国密SM2。
所述的机器学习方式包括关联规则学习、关键词分析、基于事例推理的学习、数据语义分析及历史数据分析。
有益效果
与现有技术相比,本发明将文档脱敏技术、文档分级技术以及文档加密技术结合实现文档保密性、完整性、可用性、安全共享、文档分级以及特殊情况下的工作需要,构造敏感信息的可计算的线性代数模型,实现敏感信息的快速、准确定位,以及多信息关联确定,防止泄露国家机密,对保障国家安全有着积极推进的作用。对于等级不同的人员,实现保密文档的分级解密访问控制技术,即拥有不同安全级别的人员在解密相同的保密文档时,可以获取不同的解密信息。实现分级解密的能力。提高加密文件在传输和共享方案中访问控制的灵活性、安全性。分级脱敏加密方法适用于银行、军工单位、党政机关等安全办公需求。
附图说明
图1根据发明方式的文档分级脱密加密方法的流程图;
图2多信息可计算的线性代数模型构造图;
图3文档安全级别,人员安全级别对应图;
图4分级脱密图;
图5为高等级别敏感信息表访问树及可计算的线性代数矩阵。
具体实施方式
下面将以国标SM2、SM4对本发明进行进一步说明,但并不作为本发明的限定。
本发明的实施例1:文档分级脱敏加密方法,
初始化:划分文档的安全等级,以及相对应的人员安全等级;确定加密算法、系统密钥参数等。本实施例优选的将文档安全等级从高到底可划分为:文档安全一级>文档安全二级>文档安全三级>文档安全四级>文档安全五级;对应人员安全级别从高到底可划分为:人员安全一级>人员安全二级>人员安全三级>人员安全四级>人员安全五级。安全人员可以处理文档安全级别不高于本人对应文档安全级别的文档、不能处理文档级别高于本人对应文档安全级别的文档。
优选加密算法国标SM2、SM4。
创建文档不同安全等级敏感信息表:
文档安全一级敏感信息表:(预研战机OR(发动机技术AND突破)OR领导指示、……)。
文档安全二级敏感信息表:(检查OR问题)AND(技术AND 6S)OR财务)。
文档安全三级敏感信息表:(批评AND有害……)。
文档安全四级敏感信息表:(内部轮休表OR问题AND整顿……)。
文档安全五级敏感信息表:(端午放假通知OR国庆放假通知OR春节放假通知……)。
实施例将以文档安全二级敏感信息表为例构造访问树及可计算的线性代数矩阵。如图5所示。将各信息所代表的横向量相加,看是否可以转化为(1,0,0,0)。例如文档中出现(“检测”,“技术”)信息。则将所代表的向量(1,1,0)、(0,-1,0)相加,得到向量(1,0,0)说明当文档中同时出现(“检测”,“技术”)时,可定位中高等级别敏感信息。
文档创始人提交文档上传请求:创建人提出请求,通过则进入下步,不通过则结束。系统判定创建人是否有上传文档的等权限。
文档分级:创建者给文档确定安全等级,然后系统根据敏感信息表判断文档安全等级是否合理。例如当上传者将文档定级为中高等级别,而文档里有“预研战机”等信息,系统提示定级不准确,不准上传。或者一般级别人员定文档级别为中高等级别,由于低级人员无权定高安全级别文档,不准上传。杜绝低安全等级人员上传高安全等级文档、杜绝高安全等级文档被划分为低安全等级文档、杜绝低安全等级人员操作高安全等级文档;提高文档在传输和共享方案中访问控制的灵活性和安全性。
文档脱敏二次分级:创建人选择是否进行对文档进行脱敏和二次分级。
当用户未选择文档脱敏时,跳到加密步。
用户选择文档脱敏和二次分级时,系统依据文档安全等级敏感信息表和用户选择脱敏等级,脱敏成不同级别的安全文档。利用替换、混淆、加密、遮挡等方法实现文档脱敏。例如用户安全级别为重要级别,上传文档安全级别为中高等级别,文档编号为3645152678,选择脱敏级别分为中等级别、中低等级别,脱敏完后该文档有中高等级别、中等级别、中低等级别3个安全级别的文档。不与不同安全级别的人员,可以查看不同级别的文档,提高加密文件在传输和共享方案中访问控制的灵活性、安全性。
加密:更加系统选择的加密的算法,对文档利用国密SM4进行加密。利用国密SM2加密文档密钥。
上传共享:创建者将分级、脱密、加密后的文档上传共享。更加实际文档操作人为或通过机器学习的办法更新.敏感信息表。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (5)

1.一种文档分级脱敏加密方法,其特征在于:先建立敏感信息表,敏感信息表通过人为创建、更新敏感信息表,或通过机器学习创建、更新敏感信息表;文档创建者对文档进行安全划分;文档创建者选择对文档进行二次分级并脱敏后进行文档加密共享;
具体操作包括如下步骤:
1)初始化:划分文档的安全等级,以及相对应的人员安全等级;确定加密算法及系统密钥参数;
2)创建文档不同安全等级敏感信息表:对于不同安全等级,建立相对应的安全等级敏感信息表;根据人为创建或机器学习的方式更新敏感信息表;
3)可计算的线性代数模型构造:首先将一个单调布尔函数转化成一个访问树,用到的访问树都是二叉树:每一个内部节点都是AND或者OR这样的逻辑关系,叶子结点对应着信息,完成以上变换之后,将访问树变换成一个等价矩阵M;从树的根节点开始,以自顶向下的方式用向量表示一个内部结点;根节点设置其向量为1,即一个长度为1的向量;父节点是一个向量a标记的AND,用向量a|1标记它左边的子节点,用向量(0,…0)|-1标记它右边的子节点,其中(0,…0)表示长度为c的零向量;然后将c的长度增加1用于对下一层节点并进行如上述方法处理;直到整个树的所有节点都标记完成后,所标记树的叶子节点的向量构成了线性矩阵;当这些向量的长度不同的情况下,采用0在该向量的末尾补齐,使得所有向量的长度都相同;将访问树转化成其对应的矩阵M,然后将矩阵M的横向量相加,如果可化为(1,0,..,0),则表示这些信息能够组成敏感信息,如不能则表示这些信息不是敏感信息;
4)文档创始人提交文档上传请求:创建人提出请求,通过则进入下步,不通过则结束;
5)文档分级:创建者给文档确定安全等级,然后系统根据敏感信息表判断文档安全等级是否合理;杜绝低安全等级人员上传高安全等级文档、杜绝高安全等级文档被划分为低安全等级文档或杜绝低安全等级人员操作高安全等级文档;提高文档在传输和共享方案中访问控制的灵活性和安全性;
6)加密:对文档进行加密,对于不同安全等级的文档选择不同的加密算法加密文档;对于不同安全等级的文档密钥可选择不同的非对称密码算法加密文档密钥;
7)上传共享:创建者将分级、脱密、加密后的文档上传共享,供不同安全等级的人员解密使用。
2.根据权利要求1所述的文档分级脱敏加密方法,其特征在于:对于不同安全等级文档,选择不同加密方法及混合加密方法。
3.根据权利要求2所述的文档分级脱敏加密方法,其特征在于:加密方法包括加密算法DES、3DES、AES及国密SM4,用于加密文档;非对称加密算法可选择RES、ECC及国密SM2。
4.根据权利要求1所述的文档分级脱敏加密方法,其特征在于:所述的机器学习方式包括关联规则学习、关键词分析、基于事例推理的学习、数据语义分析及历史数据分析。
5.根据权利要求1所述的文档分级脱敏加密方法,其特征在于:在进行加密前,将文档脱敏二次分级:创建人选择是否进行对文档进行脱敏和二次分级,不进行脱敏和二次分级,则进入加密步骤;如果进行脱敏和二次分级,则依据文档安全等级敏感信息表和用户选择脱敏等级,脱敏成不同安全级别的安全文档;脱敏是利用替换、混淆、加密或遮挡的方式中的一种或几种实现文档脱敏。
CN201910009142.7A 2019-01-04 2019-01-04 文档分级脱敏加密方法 Active CN109740363B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910009142.7A CN109740363B (zh) 2019-01-04 2019-01-04 文档分级脱敏加密方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910009142.7A CN109740363B (zh) 2019-01-04 2019-01-04 文档分级脱敏加密方法

Publications (2)

Publication Number Publication Date
CN109740363A CN109740363A (zh) 2019-05-10
CN109740363B true CN109740363B (zh) 2023-03-14

Family

ID=66363541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910009142.7A Active CN109740363B (zh) 2019-01-04 2019-01-04 文档分级脱敏加密方法

Country Status (1)

Country Link
CN (1) CN109740363B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110138792B (zh) * 2019-05-21 2020-01-14 上海市疾病预防控制中心 一种公共卫生地理数据去隐私处理方法及系统
CN110263556A (zh) * 2019-05-22 2019-09-20 广东安创信息科技开发有限公司 一种oa系统数据的加解密方法及系统
CN110262908A (zh) * 2019-06-21 2019-09-20 珠海格力电器股份有限公司 一种剪切板数据的处理方法及装置
CN110704685A (zh) * 2019-11-11 2020-01-17 国网青海省电力公司海东供电公司 一种电力物联网多源数据融合装置
CN111199048B (zh) * 2020-01-02 2023-07-25 航天信息股份有限公司 基于具有生命周期的容器的大数据分级脱敏方法和系统
CN112181897A (zh) * 2020-08-28 2021-01-05 广东亚灏科技有限公司 一种面向电子文档的安全等级快速鉴定方法
CN112311879A (zh) * 2020-10-30 2021-02-02 平安信托有限责任公司 限制网盘上传方法、装置、计算机设备和存储介质
CN112769784A (zh) * 2020-12-29 2021-05-07 北京明朝万达科技股份有限公司 文本的处理方法和装置、计算机可读存储介质及处理器
CN113079011B (zh) * 2021-03-18 2023-06-02 长鑫存储技术有限公司 密钥推送、操作文件的方法、存储介质、以及计算机设备
CN113271309B (zh) * 2021-05-24 2022-04-08 四川师范大学 一种分层文件加密方法及系统
CN114611145B (zh) * 2022-03-14 2023-01-06 穗保(广州)科技有限公司 一种基于互联网在线文档的数据安全共享平台
CN114866532B (zh) * 2022-04-25 2023-11-10 安天科技集团股份有限公司 端点文件安全检查结果信息上传方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649587A (zh) * 2016-11-17 2017-05-10 国家电网公司 一种基于大数据信息系统的高安全性脱敏方法
CN107301353A (zh) * 2017-06-27 2017-10-27 徐萍 一种流式密集型数据脱敏方法及其数据脱敏设备
CN107423632A (zh) * 2017-04-20 2017-12-01 北京同余科技有限公司 可定制的敏感数据脱敏方法和系统
CN107480549A (zh) * 2017-06-28 2017-12-15 银江股份有限公司 一种面向数据共享的敏感信息脱敏方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9503266B2 (en) * 2014-05-25 2016-11-22 Fujitsu Limited Relational encryption

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649587A (zh) * 2016-11-17 2017-05-10 国家电网公司 一种基于大数据信息系统的高安全性脱敏方法
CN107423632A (zh) * 2017-04-20 2017-12-01 北京同余科技有限公司 可定制的敏感数据脱敏方法和系统
CN107301353A (zh) * 2017-06-27 2017-10-27 徐萍 一种流式密集型数据脱敏方法及其数据脱敏设备
CN107480549A (zh) * 2017-06-28 2017-12-15 银江股份有限公司 一种面向数据共享的敏感信息脱敏方法及系统

Also Published As

Publication number Publication date
CN109740363A (zh) 2019-05-10

Similar Documents

Publication Publication Date Title
CN109740363B (zh) 文档分级脱敏加密方法
Mehmood et al. Protection of big data privacy
CN104780175B (zh) 基于角色的分级分类访问的授权管理方法
Salam et al. Implementation of searchable symmetric encryption for privacy-preserving keyword search on cloud storage
CN101587479A (zh) 面向数据库管理系统内核的数据加解密系统及其方法
CN109829333B (zh) 一种基于OpenID的关键信息保护方法及系统
CN109165526B (zh) 一种大数据安全与隐私保护方法、装置及存储介质
JP2020092414A (ja) ブロックチェーンのための暗号化データ共有管理
CN111967024A (zh) 一种文件敏感数据保护方法及装置
US10536276B2 (en) Associating identical fields encrypted with different keys
Rao et al. R-PEKS: RBAC enabled PEKS for secure access of cloud data
CN112822010B (zh) 一种基于量子密钥和区块链的可移动存储介质管理方法
CN103379133A (zh) 一种安全可信的云存储系统
WO2018080857A1 (en) Systems and methods for creating, storing, and analyzing secure data
CN104283930B (zh) 安全索引的关键字搜索系统及建立该系统的方法
EP3704617B1 (en) Privacy-preserving log analysis
Rijanandi et al. Implementation of encrypt national ID card in Sinovi application use waterfall methodology
EP3461055B1 (en) System and method for secure outsourced annotation of datasets
Amalarethinam et al. GLObfus: An Enhanced Data Security Method to Protect Numerical Data in Public Cloud Storage
Polikarpova et al. Development information system of cryptographic protection for enterprise local network
Raja et al. An enhanced study on cloud data services using security technologies
EP4123486A1 (en) Systems and methods for improved researcher privacy in distributed ledger-based query logging systems
Hsiao et al. Efficient Hierarchical Key Management Scheme for VR/AR Database Systems.
MAHMOUD et al. MODIFICATIONS OF AN ENCRYPTED-BASED SQL MODELS FOR MULTILEVEL DATABASE
US20130036474A1 (en) Method and Apparatus for Secure Data Representation Allowing Efficient Collection, Search and Retrieval

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant