CN115080704A - 一种基于评分机制的计算机文件保密检查方法及系统 - Google Patents

一种基于评分机制的计算机文件保密检查方法及系统 Download PDF

Info

Publication number
CN115080704A
CN115080704A CN202210850998.9A CN202210850998A CN115080704A CN 115080704 A CN115080704 A CN 115080704A CN 202210850998 A CN202210850998 A CN 202210850998A CN 115080704 A CN115080704 A CN 115080704A
Authority
CN
China
Prior art keywords
file
computer
score
matching
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210850998.9A
Other languages
English (en)
Other versions
CN115080704B (zh
Inventor
林群雄
陈岸明
李汉群
麦媛玲
孙全忠
陈志荣
刘剑龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Shi'an Information Technology Co ltd
Original Assignee
Guangzhou Shi'an Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shi'an Information Technology Co ltd filed Critical Guangzhou Shi'an Information Technology Co ltd
Priority to CN202210850998.9A priority Critical patent/CN115080704B/zh
Publication of CN115080704A publication Critical patent/CN115080704A/zh
Application granted granted Critical
Publication of CN115080704B publication Critical patent/CN115080704B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis

Abstract

本发明提出一种基于评分机制的计算机文件保密检查方法及系统,涉及信息安全的技术领域,通过对文件格式解析,针对命中的文件,进入模板库匹配、内容检索和公文格式识别,基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值,以最终评分值与涉密程度对比,最终评分值越高,涉密程度的可能性越高,即通过设定涉密程度阈值灵活决定上报信息,通过评分机制评估后上报检查结果,提升了检查结果的准确性,降低了检查人员的工作压力。

Description

一种基于评分机制的计算机文件保密检查方法及系统
技术领域
本发明涉及信息安全的技术领域,更具体地,涉及一种基于评分机制的计算机文件保密检查方法及系统。
背景技术
保密单位存在的意义重大,对保密单位而言,保密检查工作有利于保障保密工作免受外来干涉,保持长期稳定发展,利用保密检查工具对计算机文件进行安全保密检查,可辅助检查人员完成保密检查工作,及时检测到终端违规存储的敏感文件,降低安全隐患。
若没有保密检查工具的辅助,日常保密检查工作将无法有效开展,通过保密检查工具可以深层次的检测到相关的违规文件记录,及时发现问题,规避风险,保密检查工具是保密管理部门降低风险、规避责任不可或缺的一个重要工具。
常规的计算机文件保密检查通常是通过关键字组合、文件模板等多种方式对计算机文件进行鉴别,但该方式会检查出大量的无效和重复数据,检查结果的准确性较低。因此,该方式造成用户体验感差,可用性不强,给管理员后续造成的排查压力大。
发明内容
为解决现有计算机文件保密检查的方式检查结果有效性低、准确性差的问题,本发明提出一种基于评分机制的计算机文件保密检查方法及系统,通过评分机制评估后上报检查结果,提升了检查结果的准确性,降低了检查人员的工作压力。
为了达到上述技术效果,本发明的技术方案如下:
一种基于评分机制的计算机文件保密检查方法,所述检查方法包括以下步骤:
S1.下发检索策略,开始对计算机上存储的文件进行保密检查,根据模板或关键字查找文件;
S2.在文件查找到后,对文件进行文件格式解析,然后进入模板库匹配、内容检索和公文格式识别;
S3.基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值;
S4.设置涉密程度阈值,判断文件的最终评分值是否大于涉密程度阈值,若是,将文件预鉴别为涉密文件,提醒工作人员对涉密文件进行鉴别;否则,不处理。
在本技术方案中,通过对文件格式解析,针对命中的文件,进入模板库匹配、内容检索和公文格式识别,基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值,以最终评分值与涉密程度对比,最终评分值越高,涉密程度的可能性越高,即通过设定涉密程度阈值灵活决定上报信息,通过评分机制评估后上报检查结果,提升了检查结果的准确性,降低了检查人员的工作压力。
优选地,在步骤S1中,所述的检索策略为经计算机软件配置的策略,检索策略下发后,计算机根据检索策略中的内容开始对计算机上存储的文件进行检索,根据模板或关键字从根目录及当前目录查找文件。
优选地,模板库匹配、内容检索和公文格式识别中包括以下过程:
A.关键字匹配,将检索策略中的内容与文件中的内容进行匹配,确认是否命中;
B.具体位置的匹配,包括对文件指定位置文件头、正文、标题、文件名匹配、关键字全字匹配、前/后部匹配;
C.文件特征的匹配,根据M级模板预定义的特征进行匹配,特征包括文件头、标点符合。
D.关键字提取,所述的关键字为检索策略下发时可检索的关键字,根据命中结果进行分析提取,为命中率高的关键字。
在此,通过文件特征的匹配对文件格式进行不同定义的分值,保证了多关键字同时命中。
优选地,在所述的关键字提取时,首先确定文件内容,包括文件头、正文、标题及文件名,然后对文件内容创建成Trie树,打包成一整个特征文字,一次进行全部检测,并标上fail位置指针,将保密检查过程中有效关键字提取至词库,供智能关键字推荐使用,解决了多字符串匹配的问题,仅需匹配检测一次即可,无需逐一匹配检测,实现快速的保密检查。
优选地,步骤S3所述的基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值包括基础分值和附加分值,在模板库匹配、内容检索及公文格式识别后分别获得对应的基础分值和附加分值,基准分值计算参数包括:通过文件模板命中、关键字命中首行、命中非首行,均对应一定的基础分数;所述附加分值计算参数包括文件类型、文件字数、特殊符号及标识,均对应一定的附加分数;根据敏感关键词组在文件中所在的位置、命中的次数、文件类型、文件字数计算出基准分,再通过附加条件进行加减分调整,包括内置关键字语意、辅助关键字、公文模板结构、文件特征进行分析调整附加分。
优选地,骤S3所述的基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值与基础分值、附加分值的关系为:
最终评分值=基础分值+附加分值。
优选地,基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值越高,文件涉密程度的可能性越高。
一种计算机设备,所述计算机设备包括处理器、存储器及存储在存储器上的计算机程序,所述处理器执行存储在存储器上的计算机程序,以实现所述的基于评分机制的计算机文件保密检查方法。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,该指令被处理器执行时,实现所述的方法的步骤。
一种基于评分机制的计算机文件保密检查系统,所述系统包括:
检索策略下发模块,下发检索策略,开始对计算机上存储的文件进行保密检查,根据模板或关键字查找文件;
文件格式解析模块,在文件查找到后,对文件进行文件格式解析,然后进入模板库匹配、内容检索和公文格式识别;
评分机制模块,基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值;
涉密报告模块,用于设置涉密程度阈值,判断文件的最终评分值是否大于涉密程度阈值,若是,将文件预鉴别为涉密文件,提醒工作人员对涉密文件进行鉴别;否则,不处理。
与现有技术相比,本发明技术方案的有益效果是:
本发明提出一种基于评分机制的计算机文件保密检查方法及系统,通过对文件格式解析,针对命中的文件,进入模板库匹配、内容检索和公文格式识别,基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值,以最终评分值与涉密程度对比,最终评分值越高,涉密程度的可能性越高,即通过设定涉密程度阈值灵活决定上报信息,通过评分机制评估后上报检查结果,提升了检查结果的准确性,降低了检查人员的工作压力。
附图说明
图1表示本发明实施例1中提出的基于评分机制的计算机文件保密检查方法的流程整体示意图;
图2表示本发明实施例1中提出的基于评分机制的计算机文件保密检查整体过程示意图;
图3表示本发明实施例4中提出的基于评分机制的计算机文件保密检查系统的结构图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好地说明本实施例,附图某些部位会有省略、放大或缩小,并不代表实际尺寸;
对于本领域技术人员来说,附图中某些公知内容说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
附图中描述位置关系的仅用于示例性说明,不能理解为对本专利的限制;
实施例1
如图1所示,本实施例提出一种基于评分机制的计算机文件保密检查方法,参见图1,该保密检查方法包括以下步骤:
S1.下发检索策略,开始对计算机上存储的文件进行保密检查,根据模板或关键字查找文件;
在本步骤实施时,检索策略为经计算机软件配置的策略,检索策略下发后,计算机根据检索策略中的内容开始对计算机上存储的文件进行检索,根据模板或关键字从根目录及当前目录查找文件。如根据关键字在指定目录中查找文件,可通过编程实现,由计算机配置检索查找功能,查找指定目录列表中的文件关键字,结果返回包含此关键字的对象;
检索策略配置及下发、文件检索、检查结果返回包括以下过程:
(1).检查人员(检查工具使用者)通过检查工具配置策略信息,包括检索的关键字、文件密级模板、文件类型以及需检索的盘符。保存之后生成策略文件下发到计算机。
(2)终端计算机收到检索策略文件之后对策略文件进行解析,首先查找策略中的文件类型,再对命中的文件名称或内容进行检索匹配;
(3)找到对应文件后,如全部符合策略文件中的要求,返回结果进行展示。
S2.在文件查找到后,对文件进行文件格式解析,然后进入模板库匹配、内容检索和公文格式识别;
模板库匹配、内容检索和公文格式识别中包括以下过程:
(1).关键字匹配,将检索策略中的内容与文件中的内容进行匹配,确认是否命中;
(2).具体位置的匹配,包括对文件指定位置文件头、正文、标题、文件名匹配、关键字全字匹配、前/后部匹配;
(3).文件特征的匹配,根据M级模板预定义的特征进行匹配,特征包括文件头、标点符合。
(4).关键字提取,所述的关键字为检索策略下发时可检索的关键字,根据命中结果进行分析提取,为命中率高的关键字。
在此,通过文件特征的匹配对文件格式进行不同定义的分值,保证了多关键字同时命中。所述模板库匹配、内容检索和公文格式识别中包括:关键字匹配(根据策略文件中的内容与文档中的内容进行匹配,看是否命中)、具体位置的匹配(对文件指定位置匹配(如文件头、正文、标题、文件名等);关键字全字匹配、前/后部匹配;)、文件特征的匹配(文件特征搜索(文件头、标点符合等特性);文档特征是我们根据相关M级模板定义好的特征,比如文档左上角出现M级、有效期等作为一个特征进行匹配)和关键字智能提取(下发策略时可检索的关键字。
在所述的关键字提取时,首先确定文件内容,包括文件头、正文、标题及文件名,然后对文件内容创建成Trie树,打包成一整个特征文字,一次进行全部检测,并标上fail位置指针,将保密检查过程中有效关键字提取至词库,供智能关键字推荐使用,解决了多字符串匹配的问题,仅需匹配检测一次即可,无需逐一匹配检测,实现快速的保密检查。
S3.基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值;
基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值包括基础分值和附加分值,在模板库匹配、内容检索及公文格式识别后分别获得对应的基础分值和附加分值,基准分值计算参数包括:通过文件模板命中、关键字命中首行、命中非首行,均对应一定的基础分数;所述附加分值计算参数包括文件类型、文件字数、特殊符号及标识,均对应一定的附加分数;根据敏感关键词组在文件中所在的位置、命中的次数、文件类型、文件字数计算出基准分,再通过附加条件进行加减分调整,包括内置关键字语意、辅助关键字、公文模板结构、文件特征进行分析调整附加分,具体计算方式如下:
其中,设命中文件名=A,命中首行=B,命中非首行(前512字节)=C,命中非首行(512字节后)=D;则关键字总数 = [Y]n,X={A、B、C、D},关键字命中数=[X]1,Y={A、B、C、D},此外,A命中分值=30,B命中分值=55,C命中分值=40,D命中分值=25,固定加分项分值=10,加分分值=10,减分(前512字节)分值=-15,减分(512字节后)分值=-10,A命中基数=10,B命中基数=20,C命中基数=15,D命中基数=5,最高命中分值=z,最高命中基数=m,最高关键字命中总数=y,最高关键字命中数=x,则:
命中总分值=z+m*(x/ y) + 1*A1/A1 + 1*B1/B1 + 1*C1/C1 + 1*D1/D1;
示例1:
A关键字命中 (0/3)
B关键字命中 (2/5)
C关键字命中 (0/7)
D关键字命中 (0/10)
命中总分值 = 55 + 20*(2/5)+ 1*0/0 + 1*2/2 + 1*0/0 + 1*0/0 = 64
最后再综合分析计算得出文件最终评分分值,以上的过程示意参见图2。
基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值与基础分值、附加分值的关系为:
最终评分值=基础分值+附加分值。
基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值越高,文件涉密程度的可能性越高,依次采取步骤S4的过程:
S4.设置涉密程度阈值,判断文件的最终评分值是否大于涉密程度阈值,若是,将文件预鉴别为涉密文件,提醒工作人员对涉密文件进行鉴别;否则,不处理。
整体上,通过对文件格式解析,针对命中的文件,进入模板库匹配、内容检索和公文格式识别,基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值,以最终评分值与涉密程度对比,最终评分值越高,涉密程度的可能性越高,即通过设定涉密程度阈值灵活决定上报信息,通过评分机制评估后上报检查结果,提升了检查结果的准确性,降低了检查人员的工作压力。
实施例2
本实施例提出一种计算机设备,计算机设备包括处理器、存储器及存储在存储器上的计算机程序,所述处理器执行存储在存储器上的计算机程序,以实现基于评分机制的计算机文件保密检查方法。
实施例3
本实施例提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,该指令被处理器执行时,实现基于评分机制的计算机文件保密检查方法的步骤。
实施例4
如图3所示,本申请还提出一种基于评分机制的计算机文件保密检查系统,所述系统包括:
检索策略下发模块101,用于下发检索策略,开始对计算机上存储的文件进行保密检查,根据模板或关键字查找文件;
文件格式解析模块102,在文件查找到后,对文件进行文件格式解析,然后进入模板库匹配、内容检索和公文格式识别;
评分机制模块103,基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值;
涉密报告模块104,用于设置涉密程度阈值,判断文件的最终评分值是否大于涉密程度阈值,若是,将文件预鉴别为涉密文件,提醒工作人员对涉密文件进行鉴别;否则,不处理。
显然,本发明的上述实施例仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (9)

1.一种基于评分机制的计算机文件保密检查方法,其特征在于,所述保密检查方法包括以下步骤:
S1.下发检索策略,开始对计算机上存储的文件进行保密检查,根据模板或关键字查找文件;
S2.在文件查找到后,对文件进行文件格式解析,然后进入模板库匹配、内容检索和公文格式识别;
模板库匹配、内容检索和公文格式识别中包括以下过程:
A.关键字匹配,将检索策略中的内容与文件中的内容进行匹配,确认是否命中;
B.具体位置的匹配,包括对文件指定位置文件头、正文、标题、文件名匹配、关键字全字匹配、前/后部匹配;
C.文件特征的匹配,根据M级模板预定义的特征进行匹配,特征包括文件头、标点符合;
D.关键字提取,所述的关键字为检索策略下发时可检索的关键字,根据命中结果进行分析提取,为命中率高的关键字;
S3.基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值;
S4.设置涉密程度阈值,判断文件的最终评分值是否大于涉密程度阈值,若是,将文件预鉴别为涉密文件,提醒工作人员对涉密文件进行鉴别;否则,不处理。
2.根据权利要求1所述的基于评分机制的计算机文件保密检查方法,其特征在于,在步骤S1中,所述的检索策略为经计算机软件配置的策略,检索策略下发后,计算机根据检索策略中的内容开始对计算机上存储的文件进行检索,根据模板或关键字从根目录及当前目录查找文件。
3.根据权利要求1所述的基于评分机制的计算机文件保密检查方法,其特征在于,在所述的关键字提取时,首先确定文件内容,包括文件头、正文、标题及文件名,然后对文件内容创建成Trie树,打包成一整个特征文字,一次进行全部检测,并标上fail位置指针,将保密检查过程中有效关键字提取至词库,供智能关键字推荐使用。
4.根据权利要求1所述的基于评分机制的计算机文件保密检查方法,其特征在于,步骤S3所述的基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值包括基础分值和附加分值,在模板库匹配、内容检索及公文格式识别后分别获得对应的基础分值和附加分值,基准分值计算参数包括:通过文件模板命中、关键字命中首行、命中非首行,均对应一定的基础分数;所述附加分值计算参数包括文件类型、文件字数、特殊符号及标识,均对应一定的附加分数;根据敏感关键词组在文件中所在的位置、命中的次数、文件类型、文件字数计算出基准分,再通过附加条件进行加减分调整,包括内置关键字语意、辅助关键字、公文模板结构、文件特征进行分析调整附加分。
5.根据权利要求4所述的基于评分机制的计算机文件保密检查方法,其特征在于,步骤S3所述的基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值与基础分值、附加分值的关系为:
最终评分值=基础分值+附加分值。
6.根据权利要求5所述的基于评分机制的计算机文件保密检查方法,其特征在于,基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值越高,文件涉密程度的可能性越高。
7.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器及存储在存储器上的计算机程序,所述处理器执行存储在存储器上的计算机程序,以实现权利要求1~6任意一项所述的基于评分机制的计算机文件保密检查方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,该指令被处理器执行时,实现权利要求1~6任意一项所述的方法的步骤。
9.一种基于评分机制的计算机文件保密检查系统,其特征在于,所述系统包括:
检索策略下发模块,下发检索策略,开始对计算机上存储的文件进行保密检查,根据模板或关键字查找文件;
文件格式解析模块,在文件查找到后,对文件进行文件格式解析,然后进入模板库匹配、内容检索和公文格式识别;
评分机制模块,基于模板库匹配、内容检索和公文格式识别的结果确定文件的最终评分值;
涉密报告模块,用于设置涉密程度阈值,判断文件的最终评分值是否大于涉密程度阈值,若是,将文件预鉴别为涉密文件,提醒工作人员对涉密文件进行鉴别;否则,不处理。
CN202210850998.9A 2022-07-20 2022-07-20 一种基于评分机制的计算机文件保密检查方法及系统 Active CN115080704B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210850998.9A CN115080704B (zh) 2022-07-20 2022-07-20 一种基于评分机制的计算机文件保密检查方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210850998.9A CN115080704B (zh) 2022-07-20 2022-07-20 一种基于评分机制的计算机文件保密检查方法及系统

Publications (2)

Publication Number Publication Date
CN115080704A true CN115080704A (zh) 2022-09-20
CN115080704B CN115080704B (zh) 2022-11-11

Family

ID=83259212

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210850998.9A Active CN115080704B (zh) 2022-07-20 2022-07-20 一种基于评分机制的计算机文件保密检查方法及系统

Country Status (1)

Country Link
CN (1) CN115080704B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116074450A (zh) * 2022-12-27 2023-05-05 普世(南京)智能科技有限公司 一种高效的涉密文件及光盘自助回收方法及系统
CN117077207A (zh) * 2023-09-01 2023-11-17 广州世安智慧科技有限公司 一种敏感信息检测方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007323511A (ja) * 2006-06-02 2007-12-13 Nippon Telegr & Teleph Corp <Ntt> 個人情報を保護する方法及びそのシステム
CN102984128A (zh) * 2012-11-05 2013-03-20 中国电力科学研究院 一种基于网络的计算机信息保密检测方法
CN108399164A (zh) * 2018-03-27 2018-08-14 国网黑龙江省电力有限公司电力科学研究院 基于模板的电子公文分类分级系统
CN110298024A (zh) * 2018-03-21 2019-10-01 西北工业大学 涉密文档的检测方法、装置及存储介质
CN110955395A (zh) * 2019-12-17 2020-04-03 珠海格力电器股份有限公司 打印系统的风险评估方法、装置及存储介质
CN112100630A (zh) * 2019-06-18 2020-12-18 国网江苏省电力有限公司常州供电分公司 一种针对保密文件的识别方法
CN112347779A (zh) * 2020-11-23 2021-02-09 军工保密资格审查认证中心 一种涉密文本密级自动判定的方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007323511A (ja) * 2006-06-02 2007-12-13 Nippon Telegr & Teleph Corp <Ntt> 個人情報を保護する方法及びそのシステム
CN102984128A (zh) * 2012-11-05 2013-03-20 中国电力科学研究院 一种基于网络的计算机信息保密检测方法
CN110298024A (zh) * 2018-03-21 2019-10-01 西北工业大学 涉密文档的检测方法、装置及存储介质
CN108399164A (zh) * 2018-03-27 2018-08-14 国网黑龙江省电力有限公司电力科学研究院 基于模板的电子公文分类分级系统
CN112100630A (zh) * 2019-06-18 2020-12-18 国网江苏省电力有限公司常州供电分公司 一种针对保密文件的识别方法
CN110955395A (zh) * 2019-12-17 2020-04-03 珠海格力电器股份有限公司 打印系统的风险评估方法、装置及存储介质
CN112347779A (zh) * 2020-11-23 2021-02-09 军工保密资格审查认证中心 一种涉密文本密级自动判定的方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116074450A (zh) * 2022-12-27 2023-05-05 普世(南京)智能科技有限公司 一种高效的涉密文件及光盘自助回收方法及系统
CN116074450B (zh) * 2022-12-27 2023-08-18 普世(南京)智能科技有限公司 一种高效的涉密文件及光盘自助回收方法及系统
CN117077207A (zh) * 2023-09-01 2023-11-17 广州世安智慧科技有限公司 一种敏感信息检测方法及系统

Also Published As

Publication number Publication date
CN115080704B (zh) 2022-11-11

Similar Documents

Publication Publication Date Title
CN115080704B (zh) 一种基于评分机制的计算机文件保密检查方法及系统
US6415250B1 (en) System and method for identifying language using morphologically-based techniques
US8356045B2 (en) Method to identify common structures in formatted text documents
US6697801B1 (en) Methods of hierarchically parsing and indexing text
US8205155B2 (en) Text management software
US9852122B2 (en) Method of automated analysis of text documents
US20090327115A1 (en) Financial event and relationship extraction
CN107085583B (zh) 一种基于内容的电子文档管理方法及装置
CN106815207A (zh) 用于法律裁判文书的信息处理方法及装置
CN114722137A (zh) 基于敏感数据识别的安全策略配置方法、装置及电子设备
CN101021851A (zh) 文本检索装置、检索方法、记录文本检索程序的记录介质
CN108153728A (zh) 一种关键词确定方法及装置
CN112395881B (zh) 物料标签的构建方法、装置、可读存储介质及电子设备
CN115544975B (zh) 一种日志格式转换方法及设备
CN114676231A (zh) 一种目标信息检测方法、设备和介质
CN112330501A (zh) 一种文书处理方法、装置、电子设备及存储介质
CN115168345B (zh) 数据库分级分类方法、系统、装置及存储介质
CN107590233A (zh) 一种文件管理方法及装置
US20110172991A1 (en) Sentence extracting method, sentence extracting apparatus, and non-transitory computer readable record medium storing sentence extracting program
CN110909532B (zh) 用户名称匹配方法、装置、计算机设备和存储介质
Montoya et al. Information retrieval on documents methodology based on entropy filtering methodologies
JP4558369B2 (ja) 情報抽出システム、情報抽出方法、コンピュータプログラム
JP3928351B2 (ja) 確率を用いた特徴単語の選択方法
JP2004206468A (ja) 文書管理システム及び文書管理プログラム
CN117389980B (zh) 日志文件分析方法及装置、计算机设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Computer File Confidentiality Check Method and System Based on Scoring Mechanism

Effective date of registration: 20231117

Granted publication date: 20221111

Pledgee: Shanghai Pudong Development Bank Limited by Share Ltd. Guangzhou branch

Pledgor: Guangzhou Shi'an Information Technology Co.,Ltd.

Registration number: Y2023980066359

PE01 Entry into force of the registration of the contract for pledge of patent right