CN101763394B - 计算机系统涉密文件搜索方法 - Google Patents

计算机系统涉密文件搜索方法 Download PDF

Info

Publication number
CN101763394B
CN101763394B CN2009101568143A CN200910156814A CN101763394B CN 101763394 B CN101763394 B CN 101763394B CN 2009101568143 A CN2009101568143 A CN 2009101568143A CN 200910156814 A CN200910156814 A CN 200910156814A CN 101763394 B CN101763394 B CN 101763394B
Authority
CN
China
Prior art keywords
search
secret
document
file
searching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009101568143A
Other languages
English (en)
Other versions
CN101763394A (zh
Inventor
傅如毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Yuanwang Information Co Ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN2009101568143A priority Critical patent/CN101763394B/zh
Publication of CN101763394A publication Critical patent/CN101763394A/zh
Application granted granted Critical
Publication of CN101763394B publication Critical patent/CN101763394B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)

Abstract

本发明公开了一种计算机系统涉密文件搜索方法,依次包括解析步骤:解析步骤:依照不同计算机文件类型、版本,解析出文档内容、格式信息;搜索匹配步骤:对文档内容及格式特征信息按照“设定策略组合”进行搜索匹配,生成该文件是否被判断为涉密文件的结果;展现步骤:对被判断为涉密文件的文件名、文件存放路径进行界面展现。本发明对文档内容及能展现在打印稿中的格式特征按照涉密文件样式进行联合查找匹配,兼顾搜索结果的完整性与准确性,大大减少了人工判断的工作量,提高了涉密文件查找的命中率。本方法能够高效、完整、准确地搜索出计算机系统中存放的涉密文件,对于减少涉密信息泄露风险,提高涉密文件管理能力,加强信息安全保护具有重要作用。

Description

计算机系统涉密文件搜索方法
【技术领域】
本发明涉及对计算机系统中存放的涉密文件进行搜索的方法。
【背景技术】
信息技术的快速发展大力推动了计算机网络与信息系统在政府及企事业单位的广泛应用,为办公及生产建设的电子化、自动化提供了坚实保障,同时,各种涉密信息也大量以电子文件的形式存储于计算机系统中。这种涉密文件在非涉密计算机上的存在,给信息安全带来了严重隐患,尤其在政府内网(公安、检察院、法院、政府、财税、电力等等领域)环境中,防止涉密文件的非法存储可以说已成为国家安全保密工作的重中之重。现有的涉密文件搜索程序基本上采用关键字查找方法,对涉密文件的搜索工作并无太好使用效果,这主要是由于以下几方面的缺点造成的:
1、搜索结果准确性不高。设定的关键字可能会在涉密文件中存在,但也有其他许多文档会存在相同关键字内容,使用关键字搜索的方法必然导致搜索到的结果中包含了大量的非涉密文件,仍需人工进行判断,这对计算机中存在大量文件或者对大量计算机进行搜索检查时效率不高。
2、搜索结果完整性不强。涉密文件内容各种各样,无法采用统一关键字的方式涵盖所有涉密文件内容,导致搜索结果中漏掉相当多的涉密文件,这给安全保密工作留下隐患。
【发明内容】
本发明的目的就是解决现有技术中的问题,提出一种计算机系统涉密文件搜索方法,能够更加完整且准确地发现计算机系统中存放的涉密文件,以便于消除信息安全保密工作的隐患。
为实现上述目的,本发明提出了一种计算机系统涉密文件搜索方法,依次包括以下步骤:
A、解析步骤:依照不同计算机文件类型、版本,解析出文档内容、格式信息;
B、搜索匹配步骤:对文档内容及格式特征信息按照“设定策略组合”进行搜索匹配,生成该文件是否被判断为涉密文件的结果;
C、展现步骤:对被判断为涉密文件的文件名、文件存放路径进行界面展现。
作为优选,所述解析步骤中解析出文档内容、格式信息是指根据文件后缀名和文件内容中的特征字节联合判断,解析文档的结构化存储格式或纯文本,提取出文档内容和格式信息,所述文档内容是指文字和图片内容,所述格式信息是指字体、字号、字符和显示位置等等信息。
作为优选,所述解析步骤中采用二进制码解析方法,二进制搜索可不依赖操作系统是否安装有待解析文档的编辑软件,所述待解析文档的编辑软件是指Microsoft Office软件或PDF软件或WinRAR软件或WPS软件。
作为优选,所述解析步骤中也可以采用二进制码以外(包括字符、文字等等)的其他解析方法,并相应调整搜索匹配步骤中的“设定策略组合”的码的类型。或者采用二进制码与二进制码以外的解析方法结合解析。二进制码以外的方法是指采用操作系统的搜索接口进行解析或者采用待解析文档的编辑软件搜索接口进行解析,所述编辑软件是指Microsoft Office软件或PDF软件或WPS软件。
所述搜索匹配步骤中的“设定策略组合”是指根据展现在打印稿中的不同密级(绝密文件、机密文件、秘密文件、内部文件等)、不同类型、不同行业的涉密文件分析出多个特征点(可分为重要特征点、一般特征点),多个特征点之间进行“与”、“或”、“非”中至少一种的组合来搜索匹配,然后编译到计算机能识别的语言。
作为优选,所述搜索匹配步骤中的“设定策略组合”采用两种策略进行组合搜索,一种是可选择全面搜索策略或精确搜索策略;另一种是可选择普密级搜索策略或绝密级搜索策略或秘密级搜索策略或内部文档搜索策略。不同密级有绝密文件、机密文件、秘密文件、内部文件等,分析出不同密级、不同类型、不同行业的共性的重要特征点、一般特征点,归纳出一些差异的特征点,这些特征点包括关键字、字符、位置、格式等信息。
作为优选,所述搜索匹配步骤中的“设定策略组合”可以选择采用全面搜索策略、精确搜索策略、普密级搜索策略、绝密级搜索策略。
作为优选,所述搜索匹配步骤中可选择对文件头部分和/或文件尾部分进行查找匹配。在匹配步骤中采用只对文件开头部分和/或结尾部分进行匹配运算的方法后,可加快涉密文件搜索速度,提高计算机系统涉密文件搜索的效率。
作为优选,所述展现步骤中可按密级排序展现,并可根据搜索策略匹配程度按判断可能性的百分比排序展现。
作为优选,在所述搜索匹配步骤之后还包括排除步骤:通过内容及格式特征判断是否为涉密文件教学例文,如果是教学例文则从搜索结果中删除。
作为优选,在所述解析步骤之前还可设定文件系统恢复步骤:通过文件系统恢复,将删除的文件进行复原,然后再转到解析步骤。
作为优选,所述展现步骤中可按密级排序展现,并可根据搜索策略匹配程度按判断可能性的百分比排序展现。
作为优选,该方法可应用到单机版应用程序中使用,也可应用到网络版应用程序中使用。
本发明的有益效果:本发明对文档内容及能展现在打印稿中的格式特征按照涉密文件样式进行组合查找匹配,可选择是否设定文件系统恢复搜索,并通过精确搜索或全面搜索等不同匹配规则策略组的设置。实现搜索计算机系统中存放的涉密文件的功能。该方法能兼顾搜索结果的完整性与准确性,大大减少了人工判断的工作量,提高了涉密文件查找的命中率。本方法能够高效、完整、准确地搜索出计算机系统中存放的涉密文件,对于减少涉密信息泄露风险,提高涉密文件管理能力,加强信息安全保护具有重要作用。
本发明的特征及优点将通过实施例结合附图进行详细说明。
【附图说明】
图1是本发明计算机系统涉密文件搜索方法的流程图。
【具体实施方式】
参阅图1,计算机系统涉密文件搜索流程具体步骤描述如下:
1)、程序启动之后,由用户设定搜索范围,选择精确搜索或全面搜索及是否进行文件系统恢复搜索。
2)、若设定为进行文件系统恢复搜索,则对搜索范围内的删除文件进行恢复,每一个恢复文件均做标记。
3)、开始遍历搜索范围内的每一个文件,若文件为压缩文件,则先进行解压缩。
4)、解析文档内容及格式信息,根据不同的文件类型,使用相应的方法进行解析。如TXT文档,直接读取文本内容及相应格式信息;如WORD文档,按照其结构化存储格式进行结构解析,提取其中文本、图片及相应格式信息,或特定地针对WORD2007及以上版本,在解压缩之后解析其包含的XML标签,取得文本、图片及相应格式信息;对PDF等其他文件类型,采用相关方法解析出文本、图片及相应格式信息。
5)、对文档内容及能展现在打印稿中的格式特征按照涉密文件样式进行联合查找匹配,判断该文件是否符合涉密文件特征。
6)、若判断符合涉密文件特征,则进入到第7步判断是否为涉密文件教学例文,若不符合涉密文件特征,则进入到第10步判断在第2步中是否设定为进行文件系统恢复搜索。
7)、判断是否为涉密文件教学例文,若不是涉密文件教学例文,则为搜索到涉密文件,进入第8步进行界面显示及记录;若是涉密文件教学例文,则进入到第10步判断在第2步中是否设定为进行文件系统恢复搜索。
8)、对搜索到的涉密文件进行界面显示,并将文件存放路径记录到U盘隐藏扇区中。
9)、若设定备份,则将涉密文件及文件存放路径备份到U盘隐藏扇区中,同时将原文件粉碎。并转到第12步判断是否搜索完成。
10)、在第6步中判断为不符合涉密文件特征,或在第7步中判断为符合涉密文件教学例文的情况,进行是否设定为文件系统恢复的判断:若未设定为文件系统恢复,转到第12步;若已设定为文件系统恢复,则进入到第11步判断是否为恢复文档的判断。
11)、若为恢复文档,则将该文档进行删除,转到第12步;若不是恢复文档,转到第12步。
12)、判断是否搜索完成,若未搜索完成,则选择下一文件,并转到第3步进行判断,若搜索完成,则结束流程。
本实施例通过对文档内容及能展现在打印稿中的格式特征进行组合查找匹配的方法,搜索本机中符合涉密文件特征的文档,并通过判断是否为涉密文件教学例文,排除这些教学例文对搜索结果的干扰,提高搜索准确度。同时可选择设定进行文件系统恢复搜索的方法,将可恢复的文件复原再进行搜索,达到更高的搜索强度和全面性。搜索的结果可选择为被记录到U盘的隐藏扇区,防止搜索结果的人为更改,以利于提高信息安全检查时对涉密文件搜索取证的公正性。
本实施例的计算机系统涉密文件搜索方法以单机版为例。程序一般固化于U盘上,U盘插入后自动运行,进行本机涉密文件存储状况的检查。用户可设定搜索的文件夹或进行本机可访问存储设备的全盘搜索,并可设定搜索过程中采用精确搜索或全面搜索策略及是否进行文件系统恢复搜索。搜索结果在用户界面上列表显示,并自动可选择存入U盘隐藏扇区,提供取证,用专用应用程序可读回。程序可根据设定自动备份涉密文件到U盘隐藏扇区,并彻底粉碎本机文件系统中的涉密文件,这里的本机文件系统包括本机硬盘、映射到本机的网络驱动器及连接到本机的移动存储设备。
本发明可应用于政府内网(公安、检察院、法院、政府、财税、电力等等领域)、企事业单位的计算机安全保密检查工作,对(非涉密)计算机上存储涉密文件进行检查。本发明提出的计算机系统涉密文件搜索方法可做成单机版和网络版两种形式,更多的应用于网络版的内网安全管理系统软件中,实现网络化、高效率、实时性监测、检查,为信息安全工作提供强有力技术手段。
虽然本发明已通过参考优选的实施例进行了图示和描述,但是,本专业普通技术人员应当了解,在权利要求书的范围内,可作形式和细节上的各种各样变化。

Claims (8)

1.计算机系统涉密文件搜索方法,其特征在于:依次包括以下步骤:
A、解析步骤:依照不同计算机文件类型、版本,解析出文档内容、格式信息;
B、搜索匹配步骤:对文档内容及格式特征信息按照“设定策略组合”进行搜索匹配,生成该文件是否被判断为涉密文件的结果;
C、展现步骤:对被判断为涉密文件的文件名、文件存放路径进行界面展现,
所述搜索匹配步骤中的“设定策略组合”是指根据展现在打印稿中的不同密级、不同类型、不同行业的涉密文件分析出多个特征点,多个特征点之间进行“与”、“或”、“非”中至少一种的组合来搜索匹配,所述搜索匹配步骤中的“设定策略组合”采用两种策略进行组合搜索,一种是可选择全面搜索策略或精确搜索策略;另一种是可选择普密级搜索策略或绝密级搜索策略或秘密级搜索策略或内部文档搜索策略。
2.如权利要求1所述的计算机系统涉密文件搜索方法,其特征在于:所述解析步骤中解析出文档内容、格式信息是指根据文件后缀名和文件内容中的特征字节联合判断,解析文档的结构化存储格式或纯文本,提取出文档内容和格式信息,所述文档内容是指文字和图片内容,所述格式信息是指字体、字号、字符和显示位置信息。
3.如权利要求1所述的计算机系统涉密文件搜索方法,其特征在于:所述解析步骤中采用二进制码解析方法,二进制搜索可不依赖操作系统是否安装有待解析文档的编辑软件,所述编辑软件是指Microsoft Office软件或PDF软件或WinRAR软件或WPS软件。
4.如权利要求1所述的计算机系统涉密文件搜索方法,其特征在于:所述解析步骤中采用操作系统的搜索接口进行解析或者采用待解析文档的编辑软件搜索接口进行解析,所述编辑软件是指Microsoft Office软件或PDF软件或WPS软件。
5.如权利要求1所述的计算机系统涉密文件搜索方法,其特征在于:所述搜索匹配步骤中可选择对文件头部分和/或文件尾部分进行查找匹配。
6.如权利要求1所述的计算机系统涉密文件搜索方法,其特征在于:所述展现步骤中可按密级排序展现,并可根据搜索策略匹配程度按判断可能性的百分比排序展现。
7.如权利要求1至6中任一项所述的计算机系统涉密文件搜索方法,其特征在于:在所述搜索匹配步骤之后还包括排除步骤:通过内容及格式特征判断是否为涉密文件教学例文,如果是教学例文则从搜索结果中删除。
8.如权利要求1至6中任一项所述的计算机系统涉密文件搜索方法,其特征在于:在所述解析步骤之前还可设定文件系统恢复步骤:通过文件系统恢复,将删除的文件进行复原,然后再转到解析步骤。
CN2009101568143A 2009-12-31 2009-12-31 计算机系统涉密文件搜索方法 Active CN101763394B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101568143A CN101763394B (zh) 2009-12-31 2009-12-31 计算机系统涉密文件搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101568143A CN101763394B (zh) 2009-12-31 2009-12-31 计算机系统涉密文件搜索方法

Publications (2)

Publication Number Publication Date
CN101763394A CN101763394A (zh) 2010-06-30
CN101763394B true CN101763394B (zh) 2012-06-06

Family

ID=42494558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101568143A Active CN101763394B (zh) 2009-12-31 2009-12-31 计算机系统涉密文件搜索方法

Country Status (1)

Country Link
CN (1) CN101763394B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102937926B (zh) * 2012-10-30 2015-05-20 厦门市美亚柏科信息股份有限公司 一种恢复移动终端已删除sqlite文件的方法及装置
CN103902618A (zh) * 2012-12-28 2014-07-02 华为技术有限公司 一种文件查找方法及装置
CN103164515B (zh) * 2013-03-01 2015-03-25 傅如毅 计算机系统涉密文件知识库搜索方法
CN103209170A (zh) * 2013-03-04 2013-07-17 汉柏科技有限公司 文件类型识别方法及识别系统
CN104572713A (zh) * 2013-10-18 2015-04-29 英业达科技有限公司 文件搜寻保护系统及其方法
CN103678692B (zh) * 2013-12-26 2018-04-27 北京奇虎科技有限公司 一种下载文件的安全扫描方法及装置
CN106874776B (zh) * 2016-12-30 2020-06-09 厦门天锐科技股份有限公司 一种加密文件的解密方法
CN107145801A (zh) * 2017-04-26 2017-09-08 浙江远望信息股份有限公司 一种后缀名遭篡改的涉密文件自动发现方法
CN110750960A (zh) * 2018-07-05 2020-02-04 武汉斗鱼网络科技有限公司 一种配置文件的解析方法、存储介质、电子设备及系统
CN109284252B (zh) * 2018-09-11 2021-07-06 武汉虹信科技发展有限责任公司 一种通信设备中轻量级文件系统管理方法
CN111030982B (zh) * 2019-09-26 2023-06-02 北京安天网络安全技术有限公司 一种针对涉密文件的强管控方法、系统及存储介质

Also Published As

Publication number Publication date
CN101763394A (zh) 2010-06-30

Similar Documents

Publication Publication Date Title
CN101763394B (zh) 计算机系统涉密文件搜索方法
CN103164515B (zh) 计算机系统涉密文件知识库搜索方法
US9262390B2 (en) Methods and systems for annotating electronic documents
CN104035997B (zh) 一种基于文本分类和图像深度挖掘的科技情报获取与推送方法
CN110532811B (zh) 一种pdf签章方法及pdf签章系统
CN102819604B (zh) 基于内容相关性的文件涉密内容检索、密级判定及标注方法
CN110245112A (zh) 基于ai的智能化档案管理方法、系统、终端及存储介质
CN103729402A (zh) 一种基于图书目录的知识图谱的构建方法
CN103699585A (zh) 文件的元数据存储以及文件恢复的方法、装置和系统
CN101630315B (zh) 一种快速检索方法及系统
CN103177022A (zh) 一种恶意文件搜索方法及装置
US7818810B2 (en) Control of document content having extraction permissives
CN102045268A (zh) 一种电子邮件数据恢复方法及装置
CN112506860A (zh) 基于区块链的协同审计方法、装置及系统
CN108038441A (zh) 一种基于图像识别的系统与方法
Jeong et al. Study on the tracking revision history of MS Word files for forensic investigation
US20070083510A1 (en) Capturing bibliographic attribution information during cut/copy/paste operations
Huang et al. Overview of the INEX 2009 link the wiki track
CN104408097A (zh) 一种基于字符段热更新的混合索引方法及系统
CN107491530B (zh) 一种基于文件自动标记信息的社会关系挖掘分析方法
CN102662981B (zh) 基于特征扫描的Windows回收站删除记录取证方法
Oyri News Item Extraction for Text Mining inWeb Newspapers
CN108777621A (zh) 一种获取支付工具支付宝交易记录的方法
CN106126375B (zh) 一种基于Hash的YAFFS2文件各版本恢复方法
CN107392060A (zh) 一种硬盘、复印机安全检查方法、系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: ZHUJI YUANGWANG INVEST CO., LTD.

Free format text: FORMER OWNER: FU RUYI

Effective date: 20130106

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130106

Address after: 311800 No. 98 North Ring Road, Zhejiang, Zhuji

Patentee after: Zhuji Yuan Yuan Investment Co., Ltd.

Address before: 301, room 2, unit 14, Jinshan Village, Jiyang street, Zhejiang, Zhuji 311800, China

Patentee before: Fu Ruyi

PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method for searching secret-related files in computer system

Effective date of registration: 20130108

Granted publication date: 20120606

Pledgee: China Co truction Bank Corp Hangzhou Binjiang branch

Pledgor: Zhuji Yuan Yuan Investment Co., Ltd.

Registration number: 2013990000018

PLDC Enforcement, change and cancellation of contracts on pledge of patent right or utility model
C56 Change in the name or address of the patentee

Owner name: ZHEJIANG YUANWANG HOLDING GROUP CO., LTD.

Free format text: FORMER NAME: ZHUJI YUANGWANG INVEST CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: 311800 No. 98 North Ring Road, Zhejiang, Zhuji

Patentee after: Zhejiang far view Holding Group Co Ltd

Address before: 311800 No. 98 North Ring Road, Zhejiang, Zhuji

Patentee before: Zhuji Yuan Yuan Investment Co., Ltd.

PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20140710

Granted publication date: 20120606

Pledgee: China Co truction Bank Corp Hangzhou Binjiang branch

Pledgor: Zhejiang far view Holding Group Co Ltd

Registration number: 2013990000018

PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method for searching secret-related files in computer system

Effective date of registration: 20140711

Granted publication date: 20120606

Pledgee: China Co truction Bank Corp Hangzhou Binjiang branch

Pledgor: Zhejiang far view Holding Group Co Ltd

Registration number: 2014990000567

PLDC Enforcement, change and cancellation of contracts on pledge of patent right or utility model
PM01 Change of the registration of the contract for pledge of patent right

Change date: 20140710

Registration number: 2013990000018

Pledgor after: Zhejiang far view Holding Group Co Ltd

Pledgor before: Zhuji Yuan Yuan Investment Co., Ltd.

ASS Succession or assignment of patent right

Owner name: ZHEJIANG YUANWANG ELECTRONICS CO., LTD.

Free format text: FORMER OWNER: ZHEJIANG YUANWANG HOLDING GROUP CO., LTD.

Effective date: 20150527

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 311800 SHAOXING, ZHEJIANG PROVINCE TO: 310000 HANGZHOU, ZHEJIANG PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20150527

Address after: Hangzhou City, Zhejiang province 310000 Binjiang District Dangfeng Road No. 788 building 15 layer sea

Patentee after: Zhejiang Yuan Yuan Electronics Co., Ltd.

Address before: 311800 No. 98 North Ring Road, Zhejiang, Zhuji

Patentee before: Zhejiang far view Holding Group Co Ltd

C56 Change in the name or address of the patentee

Owner name: ZHEJIANG YUANWANG INFORMATION CO., LTD.

Free format text: FORMER NAME: ZHEJIANG YUANWANG ELECTRONICS CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: Hangzhou City, Zhejiang province 310000 Binjiang District Dangfeng Road No. 788 building 15 layer sea

Patentee after: ZHEJIANG YUANWANG INFORMATION CO., LTD.

Address before: Hangzhou City, Zhejiang province 310000 Binjiang District Dangfeng Road No. 788 building 15 layer sea

Patentee before: Zhejiang Yuan Yuan Electronics Co., Ltd.

PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20150805

Granted publication date: 20120606

Pledgee: China Co truction Bank Corp Hangzhou Binjiang branch

Pledgor: Zhejiang far view Holding Group Co Ltd

Registration number: 2014990000567

PLDC Enforcement, change and cancellation of contracts on pledge of patent right or utility model