CN106294488A - 垃圾文件扫描方法及装置 - Google Patents

垃圾文件扫描方法及装置 Download PDF

Info

Publication number
CN106294488A
CN106294488A CN201510308771.1A CN201510308771A CN106294488A CN 106294488 A CN106294488 A CN 106294488A CN 201510308771 A CN201510308771 A CN 201510308771A CN 106294488 A CN106294488 A CN 106294488A
Authority
CN
China
Prior art keywords
fileinfo
file
scanned
garbage files
scanning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510308771.1A
Other languages
English (en)
Inventor
詹浩祥
蔡颖星
凌志航
杨朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201510308771.1A priority Critical patent/CN106294488A/zh
Publication of CN106294488A publication Critical patent/CN106294488A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1724Details of de-fragmentation performed by the file system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1748De-duplication implemented within the file system, e.g. based on file segments

Abstract

一种垃圾文件扫描方法及装置,该方法包括步骤:获取待扫描文件;获取所述待扫描文件的第一文件信息,判断所述第一文件信息是否与第一文件信息扫描规则相匹配;若匹配,获取所述待扫描文件的第二文件信息,判断所述第二文件信息是否与第二文件信息扫描规则相匹配;若匹配,判定所述待扫描文件为垃圾文件。本发明实施例方案极大地提高了垃圾文件扫描结果的准确性,提高了智能终端的应用性能。

Description

垃圾文件扫描方法及装置
技术领域
本发明涉及计算机安全领域,特别涉及一种垃圾文件扫描方法及垃圾文件扫描装置。
背景技术
随着智能终端的应用日益广泛,智能终端在使用过程中会生成各种不同的垃圾文件,例如即时通讯软件使用过程中产生的各种临时文件。且随时智能终端使用时间的增长,所存在的垃圾文件也会不断增多,不仅占用智能终端的存储空间,而且会影响到智能终端的运行性能,因此需要对智能终端中的垃圾文件进行清理。在对垃圾文件进行清理时,需要先采用一定的手段扫描出垃圾文件,再针对扫描出的垃圾文件进行清理。在目前的垃圾文件的扫描方案中,考虑对于各个不同的软件而言,临时文件等垃圾文件一般都会存储到指定的目录位置,因此在扫描时都是基于目录进行扫描,如果扫描到指定目录文件夹,则认为该目录文件夹下的所有文件都是垃圾文件,这种单一的以文件目录文件夹来确定垃圾文件的方式,不关心该目录文件夹下的文件是何种类型以及是否确实为垃圾文件,因而垃圾文件的扫描能力较为薄弱,如果该目录文件夹下只有某一类文件才是需要进行删除的垃圾文件,会影响到垃圾文件扫描结果的准确性,若将该目录文件夹下的所有文件都作为垃圾文件删除,还会影响到智能终端的应用性能。
发明内容
基于此,本发明实施例的目的在于提供一种垃圾文件扫描方法及垃圾文件扫描装置,其可以提高垃圾文件扫描结果的准确性,提高智能终端的应用性能。
为达到上述目的,本发明实施例采用以下技术方案:
一种垃圾文件扫描方法,包括步骤:
获取待扫描文件;
获取所述待扫描文件的第一文件信息,判断所述第一文件信息是否与第一文件信息扫描规则相匹配;
若匹配,获取所述待扫描文件的第二文件信息,判断所述第二文件信息是否与第二文件信息扫描规则相匹配;
若匹配,判定所述待扫描文件为垃圾文件。
一种垃圾文件扫描装置,包括:
文件获取模块,用于获取待扫描文件;
第一扫描模块,用于获取所述待扫描文件的第一文件信息,判断所述第一文件信息是否与第一文件信息扫描规则相匹配;
第二扫描模块,用于在所述第一扫描模块的判定结果为匹配时,获取所述待扫描文件的第二文件信息,判断所述第二文件信息是否与第二文件信息扫描规则相匹配;
结果判定模块,用于在所述第二扫描模块的判定结果为匹配时,判定所述待扫描文件为垃圾文件。
根据如上所述的本发明实施例的方案,其是基于待扫描文件的两种文件信息,采用两种扫描规则进行匹配,并在两种扫描规则都匹配时,才判定待扫描文件为垃圾文件,极大地提高了垃圾文件扫描结果的准确性,提高了智能终端的应用性能。
附图说明
图1是一个实施例中的本发明方案的工作环境示意图;
图2是一个实施例中智能终端的组成结构示意图;
图3是一个实施例中的垃圾文件扫描方法的流程示意图;
图4是另一个实施例中的垃圾文件扫描方法的流程示意图;
图5是另一个实施例中的垃圾文件扫描方法的流程示意图;
图6是另一个实施例中的垃圾文件扫描方法的流程示意图;
图7是一个具体示例中的垃圾文件扫描方法的流程示意图;
图8是一个实施例中的垃圾文件扫描装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
图1示出了本发明一个实施例中的工作环境示意图。智能终端100通过网络与服务器101连接,智能终端100通过网络与服务器101进行交互。智能终端100在应用过程中,可能会产生各种类型的垃圾文件,这类垃圾文件并不是智能终端100运行时必须使用的文件,而且很可能会影响到智能终端100的应用性能,因此,智能终端100可以对其自身上的垃圾文件进行扫描,并可以基于扫描结果对各垃圾文件进行处理,例如删除、忽略、移至其他位置等等。智能终端100在对垃圾文件进行扫描时,所基于的扫描规则可以是存储在该智能终端100本地,也可以是从服务器101获得。本发明实施例针对的是对智能终端100上的垃圾文件的扫描方案。
智能终端100在一个实施例中的结构示意图如图2所示。该智能终端包括通过系统总线连接的处理器、存储介质、通信接口、电源接口和内存。其中,智能终端100的存储介质存储有一种垃圾文件扫描装置,该装置用于实现对智能终端上的文件是否为垃圾文件的扫描。智能终端100的通信接口用于与服务器101连接和通信,智能终端100的电源接口用于与外部电源连接,外部电源通过该电源接口向智能终端100供电。智能终端100可以是任何一种能够实现智能输入输出的设备,例如移动终端,比如手机、平板电脑等;也可以是其它具有上述结构的设备,比如个人计算机。
结合图1、图2所示的示意图,以下对垃圾文件扫描方法及垃圾文件扫描装置的各实施例进行说明。
图3示出了一个实施例中的垃圾文件扫描方法的流程示意图。如图3所示,本实施例中的方法包括:
步骤S301:获取待扫描文件,进入步骤S302;
步骤S302:获取所述待扫描文件的第一文件信息,进入步骤S303;
步骤S303:判断所述第一文件信息是否与第一文件信息扫描规则相匹配,若匹配,则进入步骤S304;
步骤S304:获取所述待扫描文件的第二文件信息,进入步骤S305;
步骤S305:判断所述第二文件信息是否与第二文件信息扫描规则相匹配,若匹配,进入步骤S306;
步骤S306:判定所述待扫描文件为垃圾文件。
根据如上所述的本发明实施例的方案,其是基于待扫描文件的两种文件信息,采用两种扫描规则进行匹配,并在两种扫描规则都匹配时,才判定待扫描文件为垃圾文件,极大地提高了垃圾文件扫描结果的准确性,提高了智能终端的应用性能。
基于实际需要,还可以基于待扫描文件的两种以上的文件信息,采用两种以上的扫描规则来进行匹配。以采用三种扫描规则进行匹配为例,图4中示出了另一个实施例中的垃圾文件扫描方法的流程示意图。
如图4所示,在采用三种扫描规则进行匹配时,在上述步骤S305与步骤S306之间还包括步骤S3051和步骤S3052。
如图4所示,在上述步骤S305中判定第二文件信息与第二文件信息扫描规则相匹配时,进入步骤S3051;
在步骤S3051中,获取所述待扫描文件的第三文件信息,然后进入步骤S3052;
在步骤S3052中,判断所述第三文件信息是否与第三文件信息扫描规则相匹配,若匹配,则进入步骤S306,判定所述待扫描文件为垃圾文件。
其中,在存在多个扫描规则的情况下,可能并没有对其中的某个扫描规则进行配置,因而可以只结合配置了的扫描规则进行扫描确定。据此,图5中示出了另一个实施例中的垃圾文件扫描方法的流程示意图,如图5所示,在该实施例中,在上述图3所示的实施例的基础上,在步骤S301与步骤S302之间还包括步骤S3012,在步骤S303与步骤S304之间还包括步骤S3034。
如图5所示,本实施例中的方法具体包括:
步骤S301:获取待扫描文件,进入步骤S3012;
步骤S3012:判断第一文件信息扫描规则是否为空,若不为空,则进入步骤S302,若为空,则进入步骤S3034;
步骤S302:获取所述待扫描文件的第一文件信息,进入步骤S303;
步骤S303:判断所述第一文件信息是否与第一文件信息扫描规则相匹配,若匹配,则进入步骤S3034;
步骤S3034:判断第二文件信息扫描规则是否为空,若不为空,则进入步骤S304,若为空,则进入步骤S306;
步骤S304:获取所述待扫描文件的第二文件信息,进入步骤S305;
步骤S305:判断所述第二文件信息是否与第二文件信息扫描规则相匹配,若匹配,进入步骤S306;
步骤S306:判定所述待扫描文件为垃圾文件。
在图5所示的示例中,是以第一文件信息扫描规则为空时,直接进入对第二文件信息扫描规则是否为空进行判断。在另一个实施例中,也可以限定必须同时基于这些规则进行扫描匹配,在第一文件信息扫描规则为空时,可以直接判定该待扫描文件不是垃圾文件,相应地,在判定第二文件信息扫描规则为空时,也可以直接判定该待扫描文件不是垃圾文件,如图6所示。
其中,上述第一文件信息、第二文件信息、第三文件信息,可以基于实际需要进行设定,在一个具体示例中,第一文件信息、第二文件信息、第三文件信息可以是所述待扫描文件的所在文件目录、文件名、文件大小、文件创建时间、最近访问时间最近修改时间中的任何一个信息。
在另一个情况下,针对待扫描文件的所在文件目录、文件名、文件大小、文件创建时间、最近访问时间最近修改时间这六种信息,可以分别设定对应的扫描规则进行扫描,以综合对待扫描文件是否为垃圾文件进行判定。从而,在上述图4所示的实施例的基础上,在上述步骤S3052与步骤S306之间还可以包括如下步骤:
获取所述待扫描文件的第四文件信息,判断所述第四文件信息是否与第四文件信息扫描规则匹配;
若匹配,获取所述待扫描文件的第五文件信息,判断所述第五文件信息是否与第五文件信息扫描规则匹配;
若匹配,获取所述待扫描文件的第六文件信息,判断所述第六文件信息是否与第六文件信息扫描规则匹配;
若匹配,进入步骤S306,判定所述待扫描文件为垃圾文件。
其中,上述第一文件信息、第二文件信息、第三文件信息、第四文件信息、第五文件信息、第六文件信息与待扫描文件的所在文件目录、文件名、文件大小、文件创建时间、最近访问时间、最近修改时间之间的一一对应关系,可以采用任何方式确定,只要它们是一对一的关系即可,例如第一文件信息可以是待扫描文件的所在文件目录,也可以是文件创建时间,相应地其他文件信息只能与剩下的五种信息中的一种进行对应。
在本发明的一个具体示例中,考虑到在获取不同的文件信息时所耗费的时间有所不同,对这种对应关系做如下设定:第一文件信息、第二文件信息、第三文件信息、第四文件信息、第五文件信息、第六文件信息分别为待扫描文件的所在文件目录、文件名、文件大小、文件创建时间、最近访问时间、最近修改时间。
在这种对应关系的设定的基础上,图7示出了一个具体示例中的垃圾文件扫描方法的流程示意图,图7所示中,是以必须同时具备这些规则为例进行说明。
如图7所示,该具体示例中的方法包括如下步骤:
步骤S701:获取待扫描文件,进入步骤S702;
步骤S702:判断文件目录扫描规则是否为空,若不为空,则进入步骤S703,若为空,则直接进入步骤S715,判定待扫描文件不是垃圾文件;
步骤S703:获取所述待扫描文件的所在文件目录,并判断所在文件目录是否与文件目录扫描规则相匹配,若匹配,则进入步骤S704,若不匹配,则直接进入步骤S715,判定待扫描文件不是垃圾文件;
步骤S704:判断文件名扫描规则是否为空,若不为空,则进入步骤S705,若为空,则直接进入步骤S715,判定待扫描文件不是垃圾文件;
步骤S705:获取所述待扫描文件的文件名,并判断文件名是否与文件名扫描规则相匹配,若匹配,则进入步骤S706,若不匹配,则直接进入步骤S715,判定待扫描文件不是垃圾文件;
步骤S706:判断文件大小扫描规则是否为空,若不为空,则进入步骤S707,若为空,则直接进入步骤S715,判定待扫描文件不是垃圾文件;
步骤S707:获取所述待扫描文件的文件大小,并判断文件大小是否与文件大小扫描规则相匹配,若匹配,则进入步骤S708,若不匹配,则直接进入步骤S715,判定待扫描文件不是垃圾文件;
步骤S708:判断文件创建时间扫描规则是否为空,若不为空,则进入步骤S709,若为空,则直接进入步骤S715,判定待扫描文件不是垃圾文件;
步骤S709:获取所述待扫描文件的文件创建时间,并判断文件创建时间是否与文件创建时间扫描规则相匹配,若匹配,则进入步骤S710,若不匹配,则直接进入步骤S715,判定待扫描文件不是垃圾文件;
步骤S710:判断文件最近访问时间扫描规则是否为空,若不为空,则进入步骤S711,若为空,则直接进入步骤S715,判定待扫描文件不是垃圾文件;
步骤S711:获取所述待扫描文件的最近访问时间,并判断最近访问时间是否与文件最近访问时间扫描规则相匹配,若匹配,则进入步骤S712,若不匹配,则直接进入步骤S715,判定待扫描文件不是垃圾文件;
步骤S712:判断文件最近修改时间扫描规则是否为空,若不为空,则进入步骤S713,若为空,则直接进入步骤S715,判定待扫描文件不是垃圾文件;
步骤S713:获取所述待扫描文件的最近修改时间,并判断最近修改时间是否与文件最近修改时间扫描规则相匹配,若匹配,则进入步骤S714,若不匹配,则直接进入步骤S715,判定待扫描文件不是垃圾文件;
步骤S714:判定所述待扫描文件为垃圾文件;
步骤S715:判定待扫描文件不是垃圾文件。
当然,在实际应用中,也可以结合实际需要,可以是在有任何一个扫描规则匹配的情况下、或者是至少两个扫描规则匹配的情况下就认为是垃圾文件,而无需所有的扫描规则都匹配。
其中,上述文件目录扫描规则,可以以目录路径为字段来进行匹配。在其中一个具体实例中,文件目录扫描规则可以包含下述四种描述:按照路径名单逐级处理、通配目录(例如通配一级目录、通配二级目录等等)、文件目录正则描述、文件目录正则取反。
其中,按照路径名单逐级处理,是指指定的目录路径,如果待扫描文件的所在文件目录与指定的目录路径匹配,则认为与文件目录扫描规则匹配。例如,假设指定的目录路径为/tencent/MicroMsg,则在待扫描文件的所在文件目录为/tencent/MicroMsg,则认为是与文件目录扫描规则相匹配的。
上述通配目录,是指符合相应级别及名称的目录路径,如果待扫描文件的所在文件目录的目录路径级别且指定级别的目录名称相匹配,则认为与文件目录扫描规则相匹配。例如,以通配一级目录为例,假设设定的通配一级目录为/*/MicroMsg,那么,待扫描文件的所在文件目录无论为/A/MicroMsg、/B/MicroMsg、/C/MicroMsg,由于其都满足/*/MicroMsg的通配规则,因而都可以认为是与文件目录扫描规则相匹配的。而以通配二级目录为例,假设设定的通配二级目录为/*/*/MicroMsg,那么,待扫描文件的所在文件目录无论为/A/B/MicroMsg、/B/A/MicroMsg、/A/C/MicroMsg,由于其都满足/*/*/MicroMsg的通配规则,因而都可以认为是与文件目录扫描规则相匹配的。
上述文件目录正则描述表示正则匹配。在其中一个具体示例中,可以用//开头表示使用文件目录正则匹配,例如假设设定的文件目录正则描述为/tencent//Micro.*,那么,该/tencent文件目录下的所有包含Micro.名称的文件目录,无论是/tencent/Micro.A、/tencent/Micro.B/tencent/Micro.C,还是其他的符合该规则的任何文件目录,都会认为是相匹配的。
上述文件目录正则取反则表示与上述文件目录正则匹配相反的描述。结合上述正则匹配的示例,在其中一个具体示例中,可以用//!开头表示使用文件目录正则取反。假设设定的正则取反描述为/tencent//!Micro.*,那么,该/tencent文件夹下的所有不包含Micro.名称的文件目录,都会认为是相匹配的,例如假设该/tencent文件夹下有文件目录/tencent/Micro.A、/tencent/X.A,那么,目录/tencent/Micro.A会被认为是不匹配的,而目录/tencent/X.A会被认为是相匹配的。
上述文件名扫描规则也可以包含多种描述,在其中一个具体示例中,可以包含下述三种描述:文件名正则匹配、文件名正则匹配并反选、简单后缀匹配。
其中,在一个具体示例中,可以用/开头表示文件名正则匹配,一个具体的文件名正则匹配的示例可以为/.*\.apk,在此情况下,如果该文件的文件名符合该规则示例,则认为是相匹配的。例如,如果某文件的文件名为.A\.apk,则认为文件名是相匹配的。
结合上述文件名正则匹配的示例,在其中一个具体示例中,可以用/!开头表示文件名正则匹配并反选,一个具体的文件名正则匹配把那个反选的示例可以为/!.*\.apk。在此情况下,如果该文件的文件名符合该规则示例,则认为是相匹配的。例如,如果某文件的文件名为.A\.apk,则认为文件名是不匹配的。
简单后缀匹配则只是简单地以文件的后缀名进行匹配,而不关注文件名本身的命名内容。一个简单的简单后缀匹配的示例可以是.apk,在此情况下,如果文件的后缀名为.apk,则认为是相匹配的。
上述文件大小匹配规则中,可以通过设定取值区间来表示,例如一个具体的取值区间可以为(0,100)或者!(100,—),单位可以为k,其中!表示取反,—表示无穷大。基于该具体示例的取值区间,如果该文件的文件大小在(0,100)的区间范围内,或者如果该文件的文件大小不在(100,—)的范围内,则认为文件过小,是相匹配的。当然,基于实际需要,也可以设定其他的取值区间。
上述创建时间扫描规则、最近修改时间扫描规则、最近访问时间扫描规则都可以通过设定时间区间来表示。一个具体的时间区间可以为!(0,3)或者(3,—),单位可以为天,其中!表示取反,—表示无穷大。以最近访问时间扫描规则设定的时间区间为(3,—)为例,如果该文件的最近访问时间是在3天以上,则认为是与最近访问时间扫描规则相匹配的。
在基于上述本发明实施例的方法确定出垃圾文件后,在将扫描得到的垃圾文件在智能终端的界面上进行显示以呈现给智能终端的用户时,可以针对不同的扫描规则的匹配结果,给出不同垃圾文件描述信息。例如在基于文件名匹配规则的简单后缀匹配得到匹配结果的情况下,可以给出该文件为APK安装包等提示信息,在基于最近访问时间扫描规则得到匹配结果的情况下,给出该文件已经有多少天没有访问的提示信息。其他的扫描规则的信息描述都会与该扫描规则来对应,在此不再详加赘述。
基于与上述垃圾文件扫描方法相同的思想,本发明实施例还提供一种垃圾文件扫描装置。图8中示出了一个实施例中的垃圾文件扫描装置的结构示意图。
如图8所示,本实施例中的装置包括有:
文件获取模块801,用于获取待扫描文件;
第一扫描模块802,用于获取所述待扫描文件的第一文件信息,判断所述第一文件信息是否与第一文件信息扫描规则相匹配;
第二扫描模块803,用于在所述第一扫描模块801的判定结果为匹配时,获取所述待扫描文件的第二文件信息,判断所述第二文件信息是否与第二文件信息扫描规则相匹配;
结果判定模块800,用于在所述第二扫描模块803的判定结果为匹配时,判定所述待扫描文件为垃圾文件。
根据如上所述的本发明实施例的方案,其是基于待扫描文件的两种文件信息,采用两种扫描规则进行匹配,并在两种扫描规则都匹配时,才判定待扫描文件为垃圾文件,极大地提高了垃圾文件扫描结果的准确性,提高了智能终端的应用性能。
基于实际需要,还可以基于待扫描文件的两种以上的文件信息,采用两种以上的扫描规则来进行匹配。以采用三种扫描规则进行匹配为例,如图8所示,本实施例中的装置还可以包括第三扫描模块804;
其中,该第三扫描模块804,用于在所述第二扫描模块803的判定结果为匹配时,获取所述待扫描文件的第三文件信息,判断所述第三文件信息是否与第三文件信息扫描规则匹配;
所述结果判定模块800在所述第三扫描模块804的判定结果为匹配时,判定所述待扫描文件为垃圾文件的步骤。
其中,在存在多个扫描规则的情况下,可能并没有对其中的某个扫描规则进行配置,因而可以只结合配置了的扫描规则进行扫描确定。因此,在一个具体示例中:
所述第一扫描模块802,还用于在获取所述待扫描文件的第一文件信息之前,判断第一文件信息扫描规则是否为空,并在判定结果为不为空时获取所述第一文件信息;
所述第二扫描模块803,还用于在所述第一扫描模块802的判定结果为第一文件信息扫描规则为空时,或者第一扫描模块802的判定结果为匹配时,判断第二文件信息扫描规则是否为空,并在判定不为空时获取所述第二文件信息。
在该示例中,是以第一文件信息扫描规则为空时,直接进入对第二文件信息扫描规则是否为空进行判断。在另一个实施例中,也可以限定必须同时基于这些规则进行扫描匹配,在第一文件信息扫描规则为空时,可以直接判定该待扫描文件不是垃圾文件,相应地,在判定第二文件信息扫描规则为空时,也可以直接判定该待扫描文件不是垃圾文件。
其中,上述第一文件信息、第二文件信息、第三文件信息,可以基于实际需要进行设定,在一个具体示例中,第一文件信息、第二文件信息、第三文件信息可以是所述待扫描文件的所在文件目录、文件名、文件大小、文件创建时间、最近访问时间最近修改时间中的任何一个信息。
在另一个情况下,针对待扫描文件的所在文件目录、文件名、文件大小、文件创建时间、最近访问时间最近修改时间这六种信息,可以分别设定对应的扫描规则进行扫描,以综合对待扫描文件是否为垃圾文件进行判定。从而,如图8所示,本实施例中的装置还可以包括有第四扫描模块805、第五扫描模块806、第六扫描模块807;
其中,所述第四扫描模块805,用于在所述第三扫描模块804的判定结果为匹配时,获取所述待扫描文件的第四文件信息,判断所述第四文件信息是否与第四文件信息扫描规则匹配;
所述第五扫描模块806,用于在所述第四扫描模块805的判定结果为匹配时,获取所述待扫描文件的第五文件信息,判断所述第五文件信息是否与第五文件信息扫描规则匹配;
所述第六扫描模块807,用于在所述第五扫描模块806的判定结果为匹配时,获取所述待扫描文件的第六文件信息,判断所述第六文件信息是否与第六文件信息扫描规则匹配;
所述结果判定模块800在所述第六扫描模块807的判定结果为匹配时,判定所述待扫描文件为垃圾文件。
结合图8所示的示例,所述结果判定模块800可以在满足下述条件中的任意一个时,判定所述待扫描文件不是垃圾文件:
所述第一扫描模块802判定所述第一文件信息与第一文件信息扫描规则不匹配;
所述第二扫描模块803判定所述第二文件信息与第二文件信息扫描规则不匹配;
所述第三扫描模块804判定所述第三文件信息与第三文件信息扫描规则不匹配;
所述第四扫描模块805判定所述第四文件信息与第四文件信息扫描规则不匹配;
所述第五扫描模块806判定所述第五文件信息与第五文件信息扫描规则不匹配;
所述第六扫描模块807判定所述第六文件信息与第六文件信息扫描规则不匹配。
其中,上述第一文件信息、第二文件信息、第三文件信息、第四文件信息、第五文件信息、第六文件信息与待扫描文件的所在文件目录、文件名、文件大小、文件创建时间、最近访问时间、最近修改时间之间的一一对应关系,可以采用任何方式确定,只要它们是一对一的关系即可,例如第一文件信息可以是待扫描文件的所在文件目录,也可以是文件创建时间,相应地其他文件信息只能与剩下的五种信息中的一种进行对应。
在本发明的一个具体示例中,考虑到在获取不同的文件信息时所耗费的时间有所不同,对这种对应关系做如下设定:第一文件信息、第二文件信息、第三文件信息、第四文件信息、第五文件信息、第六文件信息分别为待扫描文件的所在文件目录、文件名、文件大小、文件创建时间、最近访问时间、最近修改时间。
本领域技术人员可以理解,本发明的垃圾文件扫描装置中的各扫描规则的具体设定及匹配方式,可以与上述本发明的垃圾文件扫描方法中的相同,在此不再复述。
此外,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种垃圾文件扫描方法,其特征在于,包括步骤:
获取待扫描文件;
获取所述待扫描文件的第一文件信息,判断所述第一文件信息是否与第一文件信息扫描规则相匹配;
若匹配,获取所述待扫描文件的第二文件信息,判断所述第二文件信息是否与第二文件信息扫描规则相匹配;
若匹配,判定所述待扫描文件为垃圾文件。
2.根据权利要求1所述的垃圾文件扫描方法,其特征在于,在判定所述第二文件信息与第二文件信息扫描规则相匹配之后、判定所述待扫描文件为垃圾文件之前,还包括步骤:
获取所述待扫描文件的第三文件信息,判断所述第三文件信息是否与第三文件信息扫描规则匹配;
若匹配,进入判定所述待扫描文件为垃圾文件的步骤。
3.根据权利要求2所述的垃圾文件扫描方法,其特征在于:
在获取所述待扫描文件的第一文件信息之前,还包括步骤:判断第一文件信息扫描规则是否为空;
若不为空,则进入获取所述待扫描文件的第一文件信息的步骤;
若为空,判断第二文件信息扫描规则是否为空,若否,则进入获取所述待扫描文件的第二文件信息的步骤。
4.根据权利要求2所述的垃圾文件扫描方法,其特征在于,在判定所述第三文件信息与第三文件信息扫描规则相匹配之后、判定所述待扫描文件为垃圾文件之前,还包括步骤:
获取所述待扫描文件的第四文件信息,判断所述第四文件信息是否与第四文件信息扫描规则匹配;
若匹配,获取所述待扫描文件的第五文件信息,判断所述第五文件信息是否与第五文件信息扫描规则匹配;
若匹配,获取所述待扫描文件的第六文件信息,判断所述第六文件信息是否与第六文件信息扫描规则匹配;
若匹配,进入判定所述待扫描文件为垃圾文件的步骤。
5.根据权利要求1至4任意一项所述的垃圾文件扫描方法,其特征在于,所述第一文件信息、所述第二文件信息、所述第三文件信息、所述第四文件信息、所述第五文件信息、所述第六文件信息分别为所述待扫描文件的所在文件目录、文件名、文件大小、文件创建时间、最近访问时间、最近修改时间。
6.根据权利要求4所述的垃圾文件扫描方法,其特征在于,在满足下述条件中的任意一个时,判定所述待扫描文件不是垃圾文件:
所述第一文件信息与第一文件信息扫描规则不匹配;
所述第二文件信息与第二文件信息扫描规则不匹配;
所述第三文件信息与第三文件信息扫描规则不匹配;
所述第四文件信息与第四文件信息扫描规则不匹配;
所述第五文件信息与第五文件信息扫描规则不匹配;
所述第六文件信息与第六文件信息扫描规则不匹配。
7.一种垃圾文件扫描装置,其特征在于,包括:
文件获取模块,用于获取待扫描文件;
第一扫描模块,用于获取所述待扫描文件的第一文件信息,判断所述第一文件信息是否与第一文件信息扫描规则相匹配;
第二扫描模块,用于在所述第一扫描模块的判定结果为匹配时,获取所述待扫描文件的第二文件信息,判断所述第二文件信息是否与第二文件信息扫描规则相匹配;
结果判定模块,用于在所述第二扫描模块的判定结果为匹配时,判定所述待扫描文件为垃圾文件。
8.根据权利要求7所述的垃圾文件扫描装置,其特征在于,还包括第三扫描模块;
所述第三扫描模块,用于在所述第二扫描模块的判定结果为匹配时,获取所述待扫描文件的第三文件信息,判断所述第三文件信息是否与第三文件信息扫描规则匹配;
所述结果判定模块在所述第三扫描模块的判定结果为匹配时,判定所述待扫描文件为垃圾文件的步骤。
9.根据权利要求8所述的垃圾文件扫描装置,其特征在于:
所述第一扫描模块,还用于在获取所述待扫描文件的第一文件信息之前,判断第一文件信息扫描规则是否为空,并在判定结果为不为空时获取所述第一文件信息;
所述第二扫描模块,还用于在所述第一扫描模块的判定结果为第一文件信息扫描规则为空时,或者第一扫描模块的判定结果为匹配时,判断第二文件信息扫描规则是否为空,并在判定不为空时获取所述第二文件信息。
10.根据权利要求8所述的垃圾文件扫描装置,其特征在于,还包括第四扫描模块、第五扫描模块、第六扫描模块;
所述第四扫描模块,用于在所述第三扫描模块的判定结果为匹配时,获取所述待扫描文件的第四文件信息,判断所述第四文件信息是否与第四文件信息扫描规则匹配;
所述第五扫描模块,用于在所述第四扫描模块的判定结果为匹配时,获取所述待扫描文件的第五文件信息,判断所述第五文件信息是否与第五文件信息扫描规则匹配;
所述第六扫描模块,用于在所述第五扫描模块的判定结果为匹配时,获取所述待扫描文件的第六文件信息,判断所述第六文件信息是否与第六文件信息扫描规则匹配;
所述结果判定模块在所述第六扫描模块的判定结果为匹配时,判定所述待扫描文件为垃圾文件。
11.根据权利要求7至10任意一项所述的垃圾文件扫描装置,其特征在于,所述第一文件信息、所述第二文件信息、所述第三文件信息、所述第四文件信息、所述第五文件信息、所述第六文件信息分别为所述待扫描文件的所在文件目录、文件名、文件大小、文件创建时间、最近访问时间、最近修改时间。
12.根据权利要求10所述的垃圾文件扫描装置,其特征在于,所述结果判定模块在满足下述条件中的任意一个时,判定所述待扫描文件不是垃圾文件:
所述第一扫描模块判定所述第一文件信息与第一文件信息扫描规则不匹配;
所述第二扫描模块判定所述第二文件信息与第二文件信息扫描规则不匹配;
所述第三扫描模块判定所述第三文件信息与第三文件信息扫描规则不匹配;
所述第四扫描模块判定所述第四文件信息与第四文件信息扫描规则不匹配;
所述第五扫描模块判定所述第五文件信息与第五文件信息扫描规则不匹配;
所述第六扫描模块判定所述第六文件信息与第六文件信息扫描规则不匹配。
CN201510308771.1A 2015-06-05 2015-06-05 垃圾文件扫描方法及装置 Pending CN106294488A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510308771.1A CN106294488A (zh) 2015-06-05 2015-06-05 垃圾文件扫描方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510308771.1A CN106294488A (zh) 2015-06-05 2015-06-05 垃圾文件扫描方法及装置

Publications (1)

Publication Number Publication Date
CN106294488A true CN106294488A (zh) 2017-01-04

Family

ID=57659674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510308771.1A Pending CN106294488A (zh) 2015-06-05 2015-06-05 垃圾文件扫描方法及装置

Country Status (1)

Country Link
CN (1) CN106294488A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038223A (zh) * 2017-12-21 2018-05-15 珠海市君天电子科技有限公司 垃圾文件信息库建立方法、垃圾文件识别方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464904A (zh) * 2009-01-09 2009-06-24 华为技术有限公司 文件识别方法及装置
CN103365882A (zh) * 2012-03-30 2013-10-23 网秦无限(北京)科技有限公司 一种移动终端上垃圾文件清理的方法和系统
CN103501241A (zh) * 2013-09-18 2014-01-08 华为技术有限公司 垃圾文件清理方法、装置和系统
CN104156414A (zh) * 2014-07-30 2014-11-19 珠海市君天电子科技有限公司 一种垃圾文件的清理方法、装置及终端
CN104239091A (zh) * 2014-08-25 2014-12-24 北京金山安全软件有限公司 一种文件清理方法、装置及终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101464904A (zh) * 2009-01-09 2009-06-24 华为技术有限公司 文件识别方法及装置
CN103365882A (zh) * 2012-03-30 2013-10-23 网秦无限(北京)科技有限公司 一种移动终端上垃圾文件清理的方法和系统
CN103501241A (zh) * 2013-09-18 2014-01-08 华为技术有限公司 垃圾文件清理方法、装置和系统
CN104156414A (zh) * 2014-07-30 2014-11-19 珠海市君天电子科技有限公司 一种垃圾文件的清理方法、装置及终端
CN104239091A (zh) * 2014-08-25 2014-12-24 北京金山安全软件有限公司 一种文件清理方法、装置及终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李爱武: "《基于LINUX的ORACLE数据库管理》", 31 March 2008 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038223A (zh) * 2017-12-21 2018-05-15 珠海市君天电子科技有限公司 垃圾文件信息库建立方法、垃圾文件识别方法及装置

Similar Documents

Publication Publication Date Title
CN102598007B (zh) 有效检测采指纹数据和信息的系统和方法
CN103150509B (zh) 一种基于虚拟执行的病毒检测系统
CN102819713B (zh) 一种检测弹窗安全性的方法和系统
US20040006588A1 (en) System and method for collecting electronic evidence data
CN102271053A (zh) 自动化迁移中的网络重配置的方法和系统
CN103136342B (zh) 应用程序app的搜索方法、系统以及搜索服务器
CN102955912B (zh) 一种程序恶意属性判别方法和服务器
CN102663067B (zh) 一种基于Linux操作系统终端的文件打开方法
CN104980552B (zh) 实现Android移动终端自动化测试的方法及系统
CN102193948A (zh) 特征匹配方法和装置
CN103077208B (zh) 统一资源定位符匹配处理方法及装置
CN107846407A (zh) 一种批量检测ssrf漏洞的方法及系统
CN102982167A (zh) 图像处理器和图像处理方法
CN110225375B (zh) 一种直播间连麦权限检测方法、存储介质、设备及系统
CN105468981A (zh) 基于漏洞识别技术的插件安全扫描装置及扫描方法
CN106294488A (zh) 垃圾文件扫描方法及装置
CN108243207B (zh) 一种网络云盘的数据存储方法
CN104902026A (zh) 一种信息处理方法及云服务平台
CN115242487B (zh) 一种基于元行为的apt攻击样本增强及检测方法
CN113660241B (zh) 一种基于深度强化学习的自动化渗透测试方法
CN105094810A (zh) 基于通用网关接口插件的数据处理方法和装置
CN107885502A (zh) 接口处理方法、处理装置、接口管理方法和管理装置
CN111541675B (zh) 一种基于白名单的网络安全防护方法、装置及设备
EP2622482A1 (en) System for configurable reporting of network data and related method
CN107704595A (zh) 一种快速删除文件的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170104