CN105117462A - 一种敏感词检查方法和装置 - Google Patents

一种敏感词检查方法和装置 Download PDF

Info

Publication number
CN105117462A
CN105117462A CN201510523090.7A CN201510523090A CN105117462A CN 105117462 A CN105117462 A CN 105117462A CN 201510523090 A CN201510523090 A CN 201510523090A CN 105117462 A CN105117462 A CN 105117462A
Authority
CN
China
Prior art keywords
examine
text message
sensitive word
catalogue
file destination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510523090.7A
Other languages
English (en)
Inventor
贾高峰
曹良景
火一莽
万月亮
曹晓飞
刘虹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruian Technology Co Ltd
Original Assignee
Beijing Ruian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruian Technology Co Ltd filed Critical Beijing Ruian Technology Co Ltd
Priority to CN201510523090.7A priority Critical patent/CN105117462A/zh
Publication of CN105117462A publication Critical patent/CN105117462A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种敏感词检查方法和装置,包括:扫描待检查目录,获取待检查的目标文件;从待检查的目标文件中获取待检查的文本信息;根据敏感词库对所述待检查的文本信息进行分词处理,确认所述文本信息中是否存在敏感词,若存在敏感词,则将所述待检查的目标文件搬移到待验证目录,否则,将所述待检查的目标文件搬移到已验证目录中。本实施例通过采用上述方法可以有效提高敏感词检查的检查效率,获得理想的检查效果。

Description

一种敏感词检查方法和装置
技术领域
本发明实施例涉及计算机信息安全技术领域,尤其涉及一种敏感词检查方法和装置。
背景技术
信息安全关系到企业信息安全和国家信息安全。随着信息化建设的快速发展,企业越来越重视自身的信息安全工作。
如何提升企业信息安全是企业信息化建设中的重中之重。在日常工作中,企业往往需要对出入企业内网和外网的信息内容进行信息安全检查,确保敏感信息不被泄露。目前常用的信息安全检查方式多为人工检查方法。
由于人的精力有限,另外企业越大,每天进出企业网络的信息种类越多,内容越复杂,若企业信息安全完全靠人工检查来实现,这无疑是一项既耗时又耗力的工作,而且容易出现检查不够全面,检查效果不够理想等问题。
发明内容
本发明提供一种敏感词检查方法和装置,由系统或系统与人工结合检查敏感词,既提高敏感词的检查效率,又可以获得理想的检查效果。
第一方面,本发明实施例提供了一种敏感词检查方法,包括:扫描待检查目录,获取待检查的目标文件;从待检查的目标文件中获取待检查的文本信息;根据敏感词库对所述待检查的文本信息进行分词处理,确认所述文本信息中是否存在敏感词,若存在敏感词,则将所述待检查的目标文件搬移到待验证目录,否则,将所述待检查的目标文件搬移到已验证目录中。
进一步的,所述扫描待检查目录,获取待检查的目标文件包括:扫描待检查目录,若发现所述待检查目录中存在文件类型为目标文件类型的文件,则该文件即为待检查的目标文件。
进一步的,所述从待检查的目标文件中获取待检查的文本信息包括:根据所述待检查的目标文件的文件类型,调用与该文件类型相对应的提取函数,利用所述提取函数提取所述待检查的目标文件中的文本信息,形成待检查的文本信息。
进一步的,所述根据敏感词库对所述待检查的文本信息进行分词处理,确认所述文本信息中是否存在敏感词包括:根据敏感词库对所述待检查的文本信息进行分词处理,对分词处理结果进行逻辑判断,通过逻辑判断结果,确认所述文本信息中是否存在敏感词。
进一步的,所述方法还包括:若所述文本信息存在敏感词,则将其所对应的所述目标文件的文件名、提取出来的待检查的文本信息、分词处理结果、分词处理时间添加到验证数据库中;
以及将所述待检查的目标文件搬移到待验证目录之后还包括:对所述待验证目录中的目标文件进行人工验证,确认所述待验证目录中的目标文件是否确实含有敏感词,若确实存在敏感词,将其搬移到检查不通过目录,否则,将其搬移到已验证目录。
第二方面,本发明实施例还提供了一种敏感词检查装置,该敏感词检查装置包括:目录扫描模块,用于扫描待检查目录,获取待检查的目标文件;文本信息提取模块,用于从待检查的目标文件中获取待检查的文本信息;敏感词检查模块,用于根据敏感词库对所述待检查的文本信息进行分词处理,确认所述文本信息中是否存在敏感词;以及用于若所述文本信息存在敏感词,则将所述待检查的目标文件搬移到待验证目录,否则,将所述待检查的目标文件搬移到已验证目录中。
进一步的,所述目标扫描模块具体用于:若发现所述待检查目录中存在文件类型为目标文件类型的文件,则该文件即为待检查的目标文件。
进一步的,所述文本信息提取模块具体用于:根据所述待检查的目标文件的文件类型,调用与该文件类型相对应的提取函数,利用所述提取函数提取所述待检查的目标文件中的文本信息,形成待检查的文本信息。
进一步的:敏感词检查模块具体用于:根据敏感词库对所述待检查的文本信息进行分词处理,对分词处理结果进行逻辑判断,通过逻辑判断结果,确认所述文本信息中是否存在敏感词。
进一步的,所述装置还包括:
文件信息添加模块,用于若所述文本信息存在敏感词,则将其所对应的所述目标文件的文件名、提取出来的待检查的文本信息、分词处理结果、分词处理时间添加到验证数据库中;
人工验证模块,用于由人工对所述待验证目录中的目标文件进行验证,确认是否确实含有敏感词,以及若确实存在敏感词,将其搬移到检查不通过目录,否则,将其搬移到已验证目录。
本发明实施例通过自行扫描获得待检查的目标文件,并对其进行敏感词检查,可以解决由于人工检查而出现的检查效率低,检查不够全面,检查效果不理想的问题,提高了敏感词检查效率,并可以获得理想的检查效果。
附图说明
图1是本发明实施例一中提供的一种敏感词检查方法流程图;
图2是本发明实施例二中提供的另一种敏感词检查方法流程图;
图3是本发明实施例三中提供的一种敏感词检查装置。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种敏感词检查方法的流程图,本实施例可适用于对存储设备中含有敏感词的文件进行检查的情况,该方法可以由系统来执行,具体包括如下步骤:
S110、扫描待检查目录,获取待检查的目标文件;
其中,所述待检查目录为存储设备中可以用于存储数据的文件夹,其具体范围可以采用系统默认目录或由人工自行设定的目录,可以为全部存储空间,也可以为部分存储空间。对待检查目录进行扫描可以定时自行扫描,也可以在接收到用户发出的要求扫描的请求后开始扫描。
所述待检查的目标文件是指该文件的文件类型属于目标文件类型中的一种的文件,目标文件可以为后缀为txt、doc、docx、xls、xlsx、ppt、pptx、wps、log等的文件。
扫描待检查目录,若发现所述待检查目录中存在文件类型为目标文件类型的文件,则该文件即为待检查的目标文件。具体为对待检查目录进行扫描,并将所扫描到的所有文件的文件类型与目标文件类型进行比对。若发现该文件的文件类型为所述目标文件类型中的一种,即该文件为后缀为txt、doc、docx、xls、xlsx、ppt、pptx、wps、log等的文件,则该文件为待检查的目标文件。
S120,从待检查的目标文件中获取待检查的文本信息;
根据所述待检查的目标文件的文件类型,调用与该文件类型相对应的提取函数,利用所述提取函数提取所述待检查的目标文件中的文本信息,形成待检查的文本信息。
此步骤的具体实施过程为:
首先,读取所述待检查的目标文件,判断所述待检查的目标文件的文件类型,并查找用于调用该文件类型的提取函数;
其次,利用所查找到的所述提取函数提取所述待检查的目标文件中的文本信息,形成待检查的文本信息,并将所述待检查的文本信息传递给下一个步骤的执行主体。
在该步骤中,可以所有待检查的目标文件的文本信息经提取后,形成一个待检查的文本信息,即所述待检查的文本信息内的每一条文本信息对应一个所述待检查的目标文件,并记录每一条文本信息所对应的所述目标文件的相关信息,如文件名、存储路径(即扫描前存储路径)、最后修改时间等。优选的,每个所述待检查目标文件的文本信息分别形成一个单独的待检查文本信息,并记录每一个待检查文本信息所对应的所述目标文件的相关信息,这样有利于方便用户明确每个待检查的文本信息与待检查的目标文件的对应关系。
S130,根据敏感词库对所述待检查的文本信息进行分词处理,确认所述文本信息中是否存在敏感词,若存在敏感词,则将所述待检查的目标文件搬移到待验证目录,否则,将所述待检查的目标文件搬移到已验证目录中。
所述敏感词库包括所述待检查的目标文件中不应该包括的所有敏感词。该敏感词库可以由人工或系统对敏感词进行添加、删除、修改等操作。
根据敏感词库对所述待检查的文本信息进行分词处理,对分词处理结果进行逻辑判断,通过逻辑判断结果,确认所述文本信息中是否存在敏感词
此步骤的具体实施过程为:
首先,对所述待检查的文本信息进行分词处理。其中,所述分词处理的方法可以为正向最大匹配法、逆向最大匹配法、最少切分法和双向最大匹配法等。在分词处理的过程中,若发现所述待检查的文本信息中包含所述敏感词库中的敏感词时,统计所述待检查的文本信息中所包含的敏感词的数量,直至该待检查的文本信息全部被分词处理完毕,将统计所得的所述待检查文本信息中所含敏感词的数量作为分词处理结果输出。在对所述待检查的文本信息进行分词处理时,优选是,若发现敏感词,在该文本信息内对所述敏感词进行特殊标记,如高亮显示,添加下画线、添加方框等。这样可以方便用户查看该文本信息时能够迅速找到该文本信息所包含的敏感词的位置。
其次,调用用于对分词处理结果进行逻辑判断的函数,对分词处理结果进行逻辑判断,通过逻辑判断结果,确认所述文本信息中是否存在敏感词。对所述分词处理结果进行逻辑判断,判断所述待检查文本信息的分词处理结果中所包含的敏感词的数量是否大于零。若大于零,即所述待检查的文本信息中包括敏感词库中敏感词的个数为至少一个,读取所述文本信息对应的待检查文件的扫描前的存储路径,将所述待检查的目标文件从其扫描前的存储位置搬移到待验证目录。若经过逻辑判断所述分词处理结果为所述待检查文本信息中所包含敏感词的数量为零,即所述文本信息中不包括敏感词库中的任何敏感词,读取所述待检查文本信息对应的待检查文件的扫描前的存储路径,将所述待检查的目标文件从其扫描前存储位置搬移到已验证目录。
本实施例的技术方案,通过自行扫描获得待检查的目标文件,并对其进行敏感词检查,可以解决因为由人工检查而出现的检查效率低,检查不够全面,检查效果不理想的问题,提高了敏感词检查效率,并可以获得理想的检查效果。
实施例二
图2为本发明实施例二提供的又一种敏感词检查方法的流程图。本实施例在前述实施例基础上,增加了人工验证步骤。
本实施例所提供的方法具体包括如下:
S210、扫描待检查目录,获取待检查的目标文件;
S220、从待检查的目标文件中获取待检查的文本信息;
S230、根据敏感词库对所述待检查的文本信息进行分词处理,确认所述文本信息中是否存在敏感词,若存在敏感词,则将所述待检查的目标文件搬移到待验证目录,否则,将所述待检查的目标文件搬移到已验证目录中。
S240、若所述文本信息存在敏感词,则将其所对应的所述目标文件的文件名、提取出来的待检查的文本信息、分词处理结果、分词处理时间添加到验证数据库中;
以及将所述待检查的目标文件搬移到待验证目录之后还包括:对所述待验证目录中的目标文件进行人工验证,确认所述待验证目录中的目标文件是否确实含有敏感词,若确实存在敏感词,将其搬移到检查不通过目录,否则,将其搬移到已验证目录。
所述验证数据库主要用于存储含有敏感词的目标文件的文件名、提取出来的待检查的文本信息、分词处理结果和分词处理时间等,其所使用的数据库可以为mysql数据库、oracle数据库或sqlserver数据库等。在接收到人工验证请求时,调用待验证数据库中包含有敏感词的目标文件的相关信息,呈现给用户,可以方便用户进行人工验证。
上述方案中的所述已验证目录,待验证目录和验证不通过目录可以自行设定建立的时刻,可以在扫描待检查目录之前建立,也可以在接受到系统在需要进行搬移动作信号时建立,也可以在得到用户建立相应文件夹的命令时建立。在完成一次敏感词检查后,可以立即删除所述已验证目录,待验证目录和验证不通过目录,也可以保留,用于下次敏感词检查时继续使用。
上述方法执行完成以后,优选是,读取已验证目录中的文件的扫描前存储路径,并按照已验证目录中每个文件各自的扫描前存储路径将它们搬移到扫描前存储位置,这样有利于用户在查找时,可以快速找到所需要查找的文件夹。
另外,在完成一次敏感词检查后,在开始下一次敏感词检查前,扫描待检查目录时,优选是,在获得待检查文件后,对待检查文件的相关信息,如文件名,文件最后修改的时间,文件存储路径等与上次敏感词检查时形成的待检查文件的相关信息进行比对,通过逻辑判断确定本次所获得的对比文件是否已在之前的敏感词检查过程中已检查。若已检查,则直接跳过,否则从该待检查的目标文件中获取待检查的文本信息,这样可以有效避免对同一文件重复检查,有助于提高敏感词检查的检查效率。
本实施例的技术方法,通过在系统敏感词检查之后,添加人工验证的步骤,可以避免由于系统的非智能性而出现的误判。
实施例三
图3是本发明实施例三提供的一种敏感词检查装置,该装置包括:目录扫描模块310、文本信息提取模块320、敏感词检查模块330。
其中,目录扫描模块310,用于扫描待检查目录,获取待检查的目标文件;文本信息提取模块320,用于从待检查的目标文件中获取待检查的文本信息;敏感词检查模块330,用于根据敏感词库对所述待检查的文本信息进行分词处理,确认所述文本信息中是否存在敏感词;以及用于若所述文本信息存在敏感词,则将所述待检查的目标文件搬移到待验证目录,否则,将所述待检查的目标文件搬移到已验证目录中。
进一步的,目标扫描模块310具体用于:若发现所述待检查目录中存在文件类型为目标文件类型的文件,则该文件即为待检查的目标文件。
进一步的,所述文本信息提取模块320具体用于:根据所述待检查的目标文件的文件类型,调用与该文件类型相对应的提取函数,利用所述提取函数提取所述待检查的目标文件中的文本信息,形成待检查的文本信息。
进一步的,敏感词检查模块330具体用于:根据敏感词库对所述待检查的文本信息进行分词处理,对分词处理结果进行逻辑判断,通过逻辑判断结果,确认所述文本信息中是否存在敏感词。
在上述方案的基础上,该装置可选是还包括:文件信息添加模块,用于若所述文本信息存在敏感词,则将其所对应的所述目标文件的文件名、提取出来的待检查的文本信息、分词处理结果、分词处理时间添加到验证数据库中;人工验证模块,用于由人工对所述待验证目录中的目标文件进行验证,确认是否确实含有敏感词,以及若确实存在敏感词,将其搬移到检查不通过目录,否则,将其搬移到已验证目录。
本实施例中所提供的敏感词检查装置,可以替代人工对敏感词的检查,可以有效提高敏感词检查的检查效率,并且能够有效的实现全面检查,获得理想的检查效果。
本发明实施例所提供的敏感词检查装置可用于执行本发明实施例所提供的敏感词检查方法,具备相应的功能和有益效果。
以上对本发明的具体描述旨在说明具体实施方式的实现方式,不能理解为是对本发明的限制。本领域普通技术人员在本发明的教导下,可以在详述的实施方案的基础上做出各种变体,这些变体均应包含在本发明的构思之内。本发明所要求保护的范围仅由所述的权利要求书进行限制。

Claims (10)

1.一种敏感词检查方法,其特征在于,包括:
扫描待检查目录,获取待检查的目标文件;
从待检查的目标文件中获取待检查的文本信息;
根据敏感词库对所述待检查的文本信息进行分词处理,确认所述文本信息中是否存在敏感词,若存在敏感词,则将所述待检查的目标文件搬移到待验证目录,否则,将所述待检查的目标文件搬移到已验证目录中。
2.根据权利要求1所述的敏感词检查方法,其特征在于,所述扫描待检查目录,获取待检查的目标文件包括:
扫描待检查目录,若发现所述待检查目录中存在文件类型为目标文件类型的文件,则该文件即为待检查的目标文件。
3.根据权利要求1所述的敏感词检查方法,其特征在于,所述从待检查的目标文件中获取待检查的文本信息包括:
根据所述待检查的目标文件的文件类型,调用与该文件类型相对应的提取函数,利用所述提取函数提取所述待检查的目标文件中的文本信息,形成待检查的文本信息。
4.根据权利要求1所述的敏感词检查方法,其特征在于,所述根据敏感词库对所述待检查的文本信息进行分词处理,确认所述文本信息中是否存在敏感词包括:
根据敏感词库对所述待检查的文本信息进行分词处理,对分词处理结果进行逻辑判断,通过逻辑判断结果,确认所述文本信息中是否存在敏感词。
5.根据权利要求1所述的敏感词检查方法,其特征在于,所述方法还包括:
若所述文本信息存在敏感词,则将其所对应的所述目标文件的文件名、提取出来的待检查的文本信息、分词处理结果、分词处理时间添加到验证数据库中;
以及将所述待检查的目标文件搬移到待验证目录之后还包括:对所述待验证目录中的目标文件进行人工验证,确认所述待验证目录中的目标文件是否确实含有敏感词,若确实存在敏感词,将其搬移到检查不通过目录,否则,将其搬移到已验证目录。
6.一种敏感词检查装置,其特征在于,包括:
目录扫描模块,用于扫描待检查目录,获取待检查的目标文件;
文本信息提取模块,用于从待检查的目标文件中获取待检查的文本信息;
敏感词检查模块,用于根据敏感词库对所述待检查的文本信息进行分词处理,确认所述文本信息中是否存在敏感词;
以及用于若所述文本信息存在敏感词,则将所述待检查的目标文件搬移到待验证目录,否则,将所述待检查的目标文件搬移到已验证目录中。
7.根据权利要求6所述的敏感词检查装置,其特征在于,所述目标扫描模块具体用于:
若发现所述待检查目录中存在文件类型为目标文件类型的文件,则该文件即为待检查的目标文件。
8.根据权利要求6所述的敏感词检查装置,其特征在于,所述文本信息提取模块具体用于:
根据所述待检查的目标文件的文件类型,调用与该文件类型相对应的提取函数,利用所述提取函数提取所述待检查的目标文件中的文本信息,形成待检查的文本信息。
9.根据权利要求6所述的敏感词检查装置,其特征在于,所述敏感词检查模块具体用于:
根据敏感词库对所述待检查的文本信息进行分词处理,对分词处理结果进行逻辑判断,通过逻辑判断结果,确认所述文本信息中是否存在敏感词。
10.根据权利要求6所述的敏感词检查装置,其特征在于,所述装置还包括:
文件信息添加模块,用于若所述文本信息存在敏感词,则将其所对应的所述目标文件的文件名、提取出来的待检查的文本信息、分词处理结果、分词处理时间添加到验证数据库中;
人工验证模块,用于由人工对所述待验证目录中的目标文件进行验证,确认是否确实含有敏感词,以及若确实存在敏感词,将其搬移到检查不通过目录,否则,将其搬移到已验证目录。
CN201510523090.7A 2015-08-24 2015-08-24 一种敏感词检查方法和装置 Pending CN105117462A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510523090.7A CN105117462A (zh) 2015-08-24 2015-08-24 一种敏感词检查方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510523090.7A CN105117462A (zh) 2015-08-24 2015-08-24 一种敏感词检查方法和装置

Publications (1)

Publication Number Publication Date
CN105117462A true CN105117462A (zh) 2015-12-02

Family

ID=54665452

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510523090.7A Pending CN105117462A (zh) 2015-08-24 2015-08-24 一种敏感词检查方法和装置

Country Status (1)

Country Link
CN (1) CN105117462A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106972980A (zh) * 2017-02-24 2017-07-21 山东中创软件商用中间件股份有限公司 一种应用服务器集群的一致性验证方法及装置
CN107392060A (zh) * 2017-07-03 2017-11-24 北京立思辰计算机技术有限公司 一种硬盘、复印机安全检查方法、系统
CN107908786A (zh) * 2017-12-11 2018-04-13 广东欧珀移动通信有限公司 处理宗教忌讳信息的方法、装置和计算机可读存储介质
CN110874398A (zh) * 2020-01-14 2020-03-10 广东博智林机器人有限公司 违禁词处理方法、装置、电子设备及存储介质
CN112015999A (zh) * 2019-05-13 2020-12-01 阿里巴巴集团控股有限公司 风险提示方法、信息提示方法、计算机设备、存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
CN102184188A (zh) * 2011-04-15 2011-09-14 百度在线网络技术(北京)有限公司 一种用于确定目标文本的敏感度的方法与设备
CN103164515A (zh) * 2013-03-01 2013-06-19 傅如毅 计算机系统涉密文件知识库搜索方法
US8646073B2 (en) * 2011-05-18 2014-02-04 Check Point Software Technologies Ltd. Detection of account hijacking in a social network
CN104156365A (zh) * 2013-05-14 2014-11-19 中国移动通信集团湖南有限公司 一种文件的监控方法、装置及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
CN102184188A (zh) * 2011-04-15 2011-09-14 百度在线网络技术(北京)有限公司 一种用于确定目标文本的敏感度的方法与设备
US8646073B2 (en) * 2011-05-18 2014-02-04 Check Point Software Technologies Ltd. Detection of account hijacking in a social network
CN103164515A (zh) * 2013-03-01 2013-06-19 傅如毅 计算机系统涉密文件知识库搜索方法
CN104156365A (zh) * 2013-05-14 2014-11-19 中国移动通信集团湖南有限公司 一种文件的监控方法、装置及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106972980A (zh) * 2017-02-24 2017-07-21 山东中创软件商用中间件股份有限公司 一种应用服务器集群的一致性验证方法及装置
CN107392060A (zh) * 2017-07-03 2017-11-24 北京立思辰计算机技术有限公司 一种硬盘、复印机安全检查方法、系统
CN107908786A (zh) * 2017-12-11 2018-04-13 广东欧珀移动通信有限公司 处理宗教忌讳信息的方法、装置和计算机可读存储介质
CN112015999A (zh) * 2019-05-13 2020-12-01 阿里巴巴集团控股有限公司 风险提示方法、信息提示方法、计算机设备、存储介质
CN110874398A (zh) * 2020-01-14 2020-03-10 广东博智林机器人有限公司 违禁词处理方法、装置、电子设备及存储介质
CN110874398B (zh) * 2020-01-14 2020-06-02 广东博智林机器人有限公司 违禁词处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN105117462A (zh) 一种敏感词检查方法和装置
CN101826099B (zh) 一种相似文档识别、文档扩散度确定的方法及系统
US20190205344A1 (en) Systems and methods for performing a range query on a skiplist data structure
CN108205560B (zh) 一种数据同步方法以及装置
EP3438845A1 (en) Data updating method and device for a distributed database system
CN110909229A (zh) 一种基于模拟浏览器访问的网页数据获取和存储的系统
CN103744875B (zh) 基于文件系统的数据快速迁移方法及系统
CN106484694B (zh) 基于分布式数据库的全文搜索方法及系统
CN108021717A (zh) 一种轻量级嵌入式文件系统的实现方法
CN108494728B (zh) 防止流量劫持的黑名单库创建方法、装置、设备及介质
US7882089B1 (en) Caching database information
CN107341105A (zh) 信息处理方法、终端及服务器
CN103927212A (zh) 自动分析源文件信息的方法及装置
CN116126997B (zh) 一种文献去重存储方法、系统、设备及存储介质
US9990369B2 (en) Method and apparatus for scanning files
CN113688148B (zh) 城轨数据查询方法、装置、电子设备及可读存储介质
CN111125743B (zh) 权限管理方法、系统、计算机设备及计算机可读存储介质
CN111552956A (zh) 一种用于后台管理的角色权限控制方法及装置
US10262056B2 (en) Method and system for performing search queries using and building a block-level index
CN112527757B (zh) 基于大规模芯片测试结果的快速检索方法
CN114692144A (zh) 一种基于内存取证的dll注入检测方法
US8214336B2 (en) Preservation of digital content
CN113886425A (zh) 数据处理方法、装置、设备以及存储介质
CN112363758A (zh) 一种获取开源项目第三方组件信息的方法及装置
US20200342134A1 (en) Method and apparatus for inspecting sensitive information stored in file system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151202

RJ01 Rejection of invention patent application after publication