CN109871426A - 一种涉密数据的监测识别方法 - Google Patents

一种涉密数据的监测识别方法 Download PDF

Info

Publication number
CN109871426A
CN109871426A CN201811550257.9A CN201811550257A CN109871426A CN 109871426 A CN109871426 A CN 109871426A CN 201811550257 A CN201811550257 A CN 201811550257A CN 109871426 A CN109871426 A CN 109871426A
Authority
CN
China
Prior art keywords
phrase
plaintext
concerning security
security matters
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811550257.9A
Other languages
English (en)
Other versions
CN109871426B (zh
Inventor
张黎明
高小飞
徐劲榕
王伟
徐宏
金鑫
刘书涵
花志伟
金海松
胡遨洋
张振威
杨泰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongxiang Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
Tongxiang Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongxiang Power Supply Co of State Grid Zhejiang Electric Power Co Ltd filed Critical Tongxiang Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority to CN201811550257.9A priority Critical patent/CN109871426B/zh
Publication of CN109871426A publication Critical patent/CN109871426A/zh
Application granted granted Critical
Publication of CN109871426B publication Critical patent/CN109871426B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及涉密信息监控技术领域,具体涉及一种涉密数据的监测识别方法,包括以下步骤:A)获取网关通信数据,使用通用解密方式解密数据,若解密成功进入C;B)验证数据发送源是否有资质发送非通用加解密方式资料,若有则回到步骤A,若无则发出告警;C)列举明文中出现次数超过阈值N的短语,若短语与涉密关键词匹配则发出告警,反之,则对短语进行语义识别,若语义识别成功则回到步骤A,若语义识别失败,则发出告警。本发明的实质性效果是:通过解密方法初步判断密级,通过明文短语匹配监测识别涉密资料,及时发现正在泄露的资料,通过短语语义识别,及时发现风险数据传输活动,及时发出警告并由人工甄别,进一步提高数据安全性。

Description

一种涉密数据的监测识别方法
技术领域
本发明涉及涉密信息监控技术领域,具体涉及一种涉密数据的监测识别方法。
背景技术
为应对全球变暖,在应对气候变化中发挥更大的作用,我国近期大力推广无纸化办公。无纸化办公即采用计算机的信息化,将数据资料全部数字化,存储到服务器中。这样就带来了信息数据泄露的风险。在信息化时代,数据资料已经成为了企业的重要资产,这些资料一旦泄漏,将会对企业造成难以估量的损失。目前为了防止资料外泄,各企业均采用了多种加密方法将数据加密。但过于复杂的加密方法会严重降低资料传输效率,使用过于复杂的加密方式并不现实。而采用一般复杂程度的加密方式,就会存在被解密的风险。虽然目前企业多采用两级加密,即普通密级资料使用简单加密,高密级资料使用复杂加密方法,用于缓解加密可靠性与效率的矛盾。但单纯依靠数据加密,只要窃密方获取到秘钥,就能够获得原文,因而不能有效保护企业的数据资产。而对企业的对外网关数据进行监控,能够起到补漏的作用,及时发现正在外泄的数据,及时告警拦截,通常能够有效避免损失。因而需要研发一种能够快速在网关数据中检索到涉密信息的监测方法。
中国专利CN105357009B,公开日2018年7月24日,一种涉密数据的传输回收系统,包括权限验证模块、数据读取模块、数据验证模块、数据传输模块、回收销毁模块、传输显示模块、数据存储模块,数据接收终端模块。本发明通过数据验证模块验证传输数据的格式和内容、通过数据传输模块建立与接收终端的数据连接、通过回收销毁模块进行数据接收终端的数据销毁,解决了现在技术中软件层面对数据的非授权使用、数据误传、隐秘数据泄露等问题,提高了数据传输的正确性、安全性,具有较好的应用推广价值。但其不能对网关数据进行快速识别监测,不能有效保护企业数据资料的安全。
发明内容
本发明要解决的技术问题是:目前企业缺乏网关快速涉密资料监测识别方法的技术问题。提出了一种使用多种识别验证方法的效率高的能够识别风险数据传输活动的涉密数据的监测识别方法。
为解决上述技术问题,本发明所采取的技术方案为:一种涉密数据的监测识别方法,包括以下步骤:A)获取网关通信数据,使用通用解密方式解密数据,若解密成功则进入步骤C,若解密失败则进入步骤B;B)验证数据发送源是否有资质发送非通用加解密方式资料,若有则回到步骤A重新执行,若无资质则发出告警,而后回到步骤A重新执行,所述发送非通用加解密方式资料的资质为按次限时发放;C)导入解密得到的明文,列举明文中出现次数超过设定阈值N的短语,将所列举的短语与涉密关键词比对,若短语与涉密关键词匹配则发出告警,而后回到步骤A重新执行,若短语与所有涉密关键词均不匹配则对短语进行语义识别,若语义识别成功则回到步骤A重新执行,若语义识别失败,则发出告警,而后回到步骤A重新执行。所述发送非通用加解密方式资料的资质为按次限时发放,超过次数或者超过时间均为无发送非通用加解密方式资料的资质,因而能够有效保护高密级资料的安全。通用加密资料解密后,进行涉密关键词匹配能够识别通过普通加密方式进行的资料传输,此时发出告警能够及时发现涉密资料的外泄,若短语与涉密关键词均不匹配,则进行语义识别,若无法识别出语义,则列为风险数据传输,发出告警并由人工标注语义或发现泄密活动。
作为优选,所述列举明文中出现次数超过设定阈值N的短语的方法包括以下步骤:C1)统计明文中每个单字出现的数量,并按升序排列形成排列E;C2)从排列E的第一个单字开始,将单字依次与后续的单字组成词e,在明文中搜索词e出现的次数,若词e在明文中出现次数超过设定阈值N,则将词e在明文中第一次出现时的前面的单字加入词e形成向前扩展词e,而后在明文中搜索,若向前扩展词e在明文中出现次数仍超过设定阈值N,则将向前扩展词e在明文中第一次出现时的前面的单字继续扩展,直到向前扩展词e在明文中出现次数仍低于设定阈值N,而后将词e在明文中第一次出现时的前面的单字加入向前扩展词e形成向后扩展词e,并统计向后扩展词e在明文中出现的次数,若出现次数仍超过设定阈值N,则继续向后扩展,直到向后扩展词e在明文中出现次数低于设定阈值N,将向后扩展词e列入出现次数超过设定阈值N的短语;C3)重复步骤C2,直到遍历排列E,形成最终的出现次数超过设定阈值N的短语。
作为优选,所述对短语进行语义识别的方法包括以下步骤:C101)将短语在网关历史明文数据中搜索,若出现次数少于设定阈值Nt,则进入步骤C102,反之进入步骤C103;C102)将短语与人工标定表比对,若人工标定表中不存在与所述短语匹配的记录时,发出告警,并由人工标定,若所述短语不涉密则加入人工标定表,若所述短语涉密则进入涉密流程。
作为优选,所述通用解密方式包括行业通用加解密方式和企业自行制定的无需使用权限的加解密方式。
作为优选,所述短语与涉密关键词匹配的方法为:依次计算短语与涉密关键词的相似度,将与短语相似度最高且相似度高于设定阈值的涉密关键词作为与短语匹配的涉密关键词。
本发明的实质性效果是:通过解密方法初步判断密级,通过明文短语匹配监测识别涉密资料,及时发现正在泄露的资料,通过短语语义识别,及时发现风险数据传输活动,及时发出警告并由人工甄别,进一步提高数据安全性。
附图说明
图1为实施例一监测识别方法流程框图。
具体实施方式
下面通过具体实施例,并结合附图,对本发明的具体实施方式作进一步具体说明。
实施例一:
一种涉密数据的监测识别方法,如图1所示,为实施例一监测识别方法流程框图,本实施例包括以下步骤:A)获取网关通信数据,使用通用解密方式解密数据,若解密成功则进入步骤C,若解密失败则进入步骤B;B)验证数据发送源是否有资质发送非通用加解密方式资料,若有则回到步骤A重新执行,若无资质则发出告警,而后回到步骤A重新执行,发送非通用加解密方式资料的资质为按次限时发放;C)导入解密得到的明文,列举明文中出现次数超过设定阈值N的短语,将所列举的短语与涉密关键词比对,若短语与涉密关键词匹配则发出告警,而后回到步骤A重新执行,若短语与所有涉密关键词均不匹配则对短语进行语义识别,若语义识别成功则回到步骤A重新执行,若语义识别失败,则发出告警,而后回到步骤A重新执行。发送非通用加解密方式资料的资质为按次限时发放,超过次数或者超过时间均为无发送非通用加解密方式资料的资质,因而能够有效保护高密级资料的安全。
列举出现次数超过设定阈值N的短语的方法,包括以下步骤:C1)统计明文中每个单字出现的数量,并按升序排列形成排列E;C2)从排列E的第一个单字开始,将单字依次与后续的单字组成词e,在明文中搜索词e出现的次数,若词e在明文中出现次数超过设定阈值N,则将词e在明文中第一次出现时的前面的单字加入词e形成向前扩展词e,而后在明文中搜索,若向前扩展词e在明文中出现次数仍超过设定阈值N,则将向前扩展词e在明文中第一次出现时的前面的单字继续扩展,直到向前扩展词e在明文中出现次数仍低于设定阈值N,而后将词e在明文中第一次出现时的前面的单字加入向前扩展词e形成向后扩展词e,并统计向后扩展词e在明文中出现的次数,若出现次数仍超过设定阈值N,则继续向后扩展,直到向后扩展词e在明文中出现次数低于设定阈值N,将向后扩展词e列入出现次数超过设定阈值N的短语;C3)重复步骤C2,直到遍历排列E,形成最终的出现次数超过设定阈值N的短语。
对短语进行语义识别的方法包括以下步骤:C101)将短语在网关历史明文数据中搜索,若出现次数少于设定阈值Nt,则进入步骤C102,反之进入步骤C103;C102)将短语与人工标定表比对,若人工标定表中不存在与短语匹配的记录时,发出告警,并由人工标定,若短语不涉密则加入人工标定表,若短语涉密则进入涉密流程。
通用解密方式包括行业通用加解密方式和企业自行制定的无需使用权限的加解密方式。短语与涉密关键词匹配的方法为:依次计算短语与涉密关键词的相似度,将与短语相似度最高且相似度高于设定阈值的涉密关键词作为与短语匹配的涉密关键词。
通用加密资料解密后,进行涉密关键词匹配能够识别通过普通加密方式进行的资料传输,此时发出告警能够及时发现涉密资料的外泄,若短语与涉密关键词均不匹配,则进行语义识别,若无法识别出语义,则列为风险数据传输,发出告警并由人工标注语义或发现泄密活动。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。

Claims (7)

1.一种涉密数据的监测识别方法,其特征在于,
包括以下步骤:
A)获取网关通信数据,使用通用解密方式解密数据,若解密成功则进入步骤C,若解密失败则进入步骤B;
B)验证数据发送源是否有资质发送非通用加解密方式资料,若有则回到步骤A重新执行,若无资质则发出告警,而后回到步骤A重新执行,所述发送非通用加解密方式资料的资质为按次限时发放;
C)导入解密得到的明文,列举明文中出现次数超过设定阈值N的短语,将所列举的短语与涉密关键词比对,若短语与涉密关键词匹配则发出告警,而后回到步骤A重新执行,若短语与所有涉密关键词均不匹配则对短语进行语义识别,若语义识别成功则回到步骤A重新执行,若语义识别失败,则发出告警,而后回到步骤A重新执行。
2.根据权利要求1所述的一种涉密数据的监测识别方法,其特征在于,
所述列举明文中出现次数超过设定阈值N的短语的方法包括以下步骤:
C1)统计明文中每个单字出现的数量,并按升序排列形成排列E;
C2)从排列E的第一个单字开始,将单字依次与后续的单字组成词e,在明文中搜索词e出现的次数,若词e在明文中出现次数超过设定阈值N,则将词e在明文中第一次出现时的前面的单字加入词e形成向前扩展词e,而后在明文中搜索,若向前扩展词e在明文中出现次数仍超过设定阈值N,则将向前扩展词e在明文中第一次出现时的前面的单字继续扩展,直到向前扩展词e在明文中出现次数仍低于设定阈值N,而后将词e在明文中第一次出现时的前面的单字加入向前扩展词e形成向后扩展词e,并统计向后扩展词e在明文中出现的次数,若出现次数仍超过设定阈值N,则继续向后扩展,直到向后扩展词e在明文中出现次数低于设定阈值N,将向后扩展词e列入出现次数超过设定阈值N的短语;
C3)重复步骤C2,直到遍历排列E,形成最终的出现次数超过设定阈值N的短语。
3.根据权利要求1或2所述的一种涉密数据的监测识别方法,其特征在于,
所述对短语进行语义识别的方法包括以下步骤:
C101)将短语在网关历史明文数据中搜索,若出现次数少于设定阈值Nt,则进入步骤C102,反之进入步骤C103;
C102)将短语与人工标定表比对,若人工标定表中不存在与所述短语匹配的记录时,发出告警,并由人工标定,若所述短语不涉密则加入人工标定表,若所述短语涉密则进入涉密流程。
4.根据权利要求1或2所述的一种涉密数据的监测识别方法,其特征在于,
所述通用解密方式包括行业通用加解密方式和企业自行制定的无需使用权限的加解密方式。
5.根据权利要求3所述的一种涉密数据的监测识别方法,其特征在于,
所述通用解密方式包括行业通用加解密方式和企业自行制定的无需使用权限的加解密方式。
6.根据权利要求1或2所述的一种涉密数据的监测识别方法,其特征在于,
所述短语与涉密关键词匹配的方法为:依次计算短语与涉密关键词的相似度,将与短语相似度最高且相似度高于设定阈值的涉密关键词作为与短语匹配的涉密关键词。
7.根据权利要求3所述的一种涉密数据的监测识别方法,其特征在于,
所述短语与涉密关键词匹配的方法为:依次计算短语与涉密关键词的相似度,将与短语相似度最高且相似度高于设定阈值的涉密关键词作为与短语匹配的涉密关键词。
CN201811550257.9A 2018-12-18 2018-12-18 一种涉密数据的监测识别方法 Active CN109871426B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811550257.9A CN109871426B (zh) 2018-12-18 2018-12-18 一种涉密数据的监测识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811550257.9A CN109871426B (zh) 2018-12-18 2018-12-18 一种涉密数据的监测识别方法

Publications (2)

Publication Number Publication Date
CN109871426A true CN109871426A (zh) 2019-06-11
CN109871426B CN109871426B (zh) 2021-08-10

Family

ID=66917134

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811550257.9A Active CN109871426B (zh) 2018-12-18 2018-12-18 一种涉密数据的监测识别方法

Country Status (1)

Country Link
CN (1) CN109871426B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287493A (zh) * 2019-06-28 2019-09-27 中国科学技术信息研究所 风险短语识别方法、装置、电子设备及存储介质
CN110768969A (zh) * 2019-10-14 2020-02-07 深圳Tcl数字技术有限公司 基于网络数据监控的测试方法、装置及可读存储介质

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020138417A1 (en) * 2001-03-20 2002-09-26 David Lawrence Risk management clearinghouse
US20070174908A1 (en) * 2006-01-24 2007-07-26 Eshun Kobi O Method and apparatus for thwarting spyware
CN101212642A (zh) * 2006-12-25 2008-07-02 北京握奇数据系统有限公司 一种广播信号处理方法、系统及接收终端
CN101315709A (zh) * 2007-05-29 2008-12-03 夏普株式会社 图像数据管理系统
CN101639882A (zh) * 2009-08-28 2010-02-03 华中科技大学 基于存储加密的数据库安全保密系统
CN101894242A (zh) * 2010-06-22 2010-11-24 上海华御信息技术有限公司 移动电子设备信息安全保护系统及方法
CN101931947A (zh) * 2010-07-28 2010-12-29 南京航空航天大学 基于可搜索密文的wsn数据安全处理方法
CN102710633A (zh) * 2012-05-29 2012-10-03 大连佳姆信息安全软件技术有限公司 一种涉密电子文件的云安全管理系统及方法
CN102819604A (zh) * 2012-08-20 2012-12-12 徐亮 基于内容相关性的文件涉密内容检索、密级判定及标注方法
CN102855292A (zh) * 2010-05-31 2013-01-02 广西大学 密文全文检索系统的安全覆盖网构建方法及对应的全文检索方法
CN103049466A (zh) * 2012-05-14 2013-04-17 深圳市朗科科技股份有限公司 一种基于分布式密文存储的全文检索方法及系统
CN103955537A (zh) * 2014-05-16 2014-07-30 福州大学 一种语义模糊可搜索加密云盘设计方法及系统
CN105447113A (zh) * 2015-11-13 2016-03-30 四川九成信息技术有限公司 一种基于大数据的信息分析方法
CN106535181A (zh) * 2016-12-22 2017-03-22 努比亚技术有限公司 移动终端及其信息管理方法
CN106815200A (zh) * 2015-11-30 2017-06-09 任子行网络技术股份有限公司 基于关键词的不良文本检测方法及装置
CN108123933A (zh) * 2017-12-05 2018-06-05 南京南邮信息产业技术研究院有限公司 基于互联网大数据的信息泄露自动监测方法和系统
CN108549701A (zh) * 2018-04-17 2018-09-18 上海海事大学 云环境加密外包数据语义扩展搜索方法及系统

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020138417A1 (en) * 2001-03-20 2002-09-26 David Lawrence Risk management clearinghouse
US20070174908A1 (en) * 2006-01-24 2007-07-26 Eshun Kobi O Method and apparatus for thwarting spyware
CN101212642A (zh) * 2006-12-25 2008-07-02 北京握奇数据系统有限公司 一种广播信号处理方法、系统及接收终端
CN101315709A (zh) * 2007-05-29 2008-12-03 夏普株式会社 图像数据管理系统
CN101639882A (zh) * 2009-08-28 2010-02-03 华中科技大学 基于存储加密的数据库安全保密系统
CN102855292A (zh) * 2010-05-31 2013-01-02 广西大学 密文全文检索系统的安全覆盖网构建方法及对应的全文检索方法
CN101894242A (zh) * 2010-06-22 2010-11-24 上海华御信息技术有限公司 移动电子设备信息安全保护系统及方法
CN101931947A (zh) * 2010-07-28 2010-12-29 南京航空航天大学 基于可搜索密文的wsn数据安全处理方法
CN103049466A (zh) * 2012-05-14 2013-04-17 深圳市朗科科技股份有限公司 一种基于分布式密文存储的全文检索方法及系统
CN102710633A (zh) * 2012-05-29 2012-10-03 大连佳姆信息安全软件技术有限公司 一种涉密电子文件的云安全管理系统及方法
CN102819604A (zh) * 2012-08-20 2012-12-12 徐亮 基于内容相关性的文件涉密内容检索、密级判定及标注方法
CN103955537A (zh) * 2014-05-16 2014-07-30 福州大学 一种语义模糊可搜索加密云盘设计方法及系统
CN105447113A (zh) * 2015-11-13 2016-03-30 四川九成信息技术有限公司 一种基于大数据的信息分析方法
CN106815200A (zh) * 2015-11-30 2017-06-09 任子行网络技术股份有限公司 基于关键词的不良文本检测方法及装置
CN106535181A (zh) * 2016-12-22 2017-03-22 努比亚技术有限公司 移动终端及其信息管理方法
CN108123933A (zh) * 2017-12-05 2018-06-05 南京南邮信息产业技术研究院有限公司 基于互联网大数据的信息泄露自动监测方法和系统
CN108549701A (zh) * 2018-04-17 2018-09-18 上海海事大学 云环境加密外包数据语义扩展搜索方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287493A (zh) * 2019-06-28 2019-09-27 中国科学技术信息研究所 风险短语识别方法、装置、电子设备及存储介质
CN110287493B (zh) * 2019-06-28 2023-04-18 中国科学技术信息研究所 风险短语识别方法、装置、电子设备及存储介质
CN110768969A (zh) * 2019-10-14 2020-02-07 深圳Tcl数字技术有限公司 基于网络数据监控的测试方法、装置及可读存储介质
CN110768969B (zh) * 2019-10-14 2023-10-17 深圳Tcl数字技术有限公司 基于网络数据监控的测试方法、装置及可读存储介质

Also Published As

Publication number Publication date
CN109871426B (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
US7797541B2 (en) Method and apparatus for providing cellular telephone service using an authenticating cellular telephone device
US7540021B2 (en) System and methods for an identity theft protection bot
US8225402B1 (en) Anomaly-based detection of SQL injection attacks
Chothia et al. A statistical test for information leaks using continuous mutual information
CN102916963A (zh) 一种数据安全交换方法、装置、节点及系统
CN108363929B (zh) 一种存储设备信息消除报告生成和防篡改系统及方法
Camara et al. Distortion‐Free Watermarking Approach for Relational Database Integrity Checking
CN114444033A (zh) 一种基于物联网的数据安全防护系统及方法
CN109871426A (zh) 一种涉密数据的监测识别方法
CN112329042A (zh) 一种大数据安全存储系统及方法
CN111639355B (zh) 一种数据安全管理方法和系统
CN109918921A (zh) 一种网络通信数据涉密检测方法
CN101938475A (zh) 互联网信息发布者身份鉴别方法及其系统
CN108090364B (zh) 一种数据泄漏源的定位方法及系统
CN105989482A (zh) 一种数据加密方法
CN116055067B (zh) 一种弱口令检测的方法、装置、电子设备及介质
CN108985075A (zh) 一种轻量级的镜像文件磁盘加密系统和方法
JPH10200522A (ja) Icカード利用暗号化方法およびシステムおよびicカード
Craiger et al. Law enforcement and digital evidence
CN106254341A (zh) 针对集中式电子数据保全系统的数据指纹提取方法及系统
CN111611459B (zh) 一种基于区块链的档案数据保护方法
Ahvanooey et al. Information hiding in digital textual contents: Techniques and current challenges
CN111444270B (zh) 基于区块链的控制有害信息的方法及系统
CN102270323A (zh) 一种多重安防卷烟数码防伪方法
CN111625861A (zh) 一种基于移动互联网平台的区块链标识加密系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant