CN105446987B - 图片类垃圾文件的识别方法、装置和电子设备 - Google Patents
图片类垃圾文件的识别方法、装置和电子设备 Download PDFInfo
- Publication number
- CN105446987B CN105446987B CN201410309644.9A CN201410309644A CN105446987B CN 105446987 B CN105446987 B CN 105446987B CN 201410309644 A CN201410309644 A CN 201410309644A CN 105446987 B CN105446987 B CN 105446987B
- Authority
- CN
- China
- Prior art keywords
- file
- store path
- picture
- garbage files
- picture category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Library & Information Science (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图片类垃圾文件的识别方法、装置和电子设备,其中,所述图片类垃圾文件的识别方法,包括:获取图片类文件的存储路径;获取存储路径中文件的文件名特征;以及根据文件名特征判断存储路径中的文件是否为图片类垃圾文件。本发明实施例的图片类垃圾文件的识别方法,实现了图片类垃圾文件的自动识别,并且识别效率高、准确率高,从而能够更高效精准地对图片类垃圾文件进行清理,提升终端设备的存储空间,进而提升系统的流畅度和相应速度,提升用户体验。
Description
技术领域
本发明涉及文件处理领域,尤其涉及一种图片类垃圾文件的识别方法、装置和系统。
背景技术
随着计算机及互联网技术的不断发展,用户可在计算机设备以及移动终端设备中安装各种应用程序。在用户启动应用程序时,会触发一个或多个与该应用程序对应的存储路径,在应用程序的使用过程中,会产生大量的垃圾文件存储在这个存储路径中,占用设备的存储空间,逐渐积累会导致设备存储空间不足。由于移动终端的存储空间员小于计算机设备,因此对于移动终端来说,垃圾文件对存储空间的占用甚至会导致移动终端反应速度变慢、严重影响了用户的使用。特别是图片类文件,占用的存储空间较文字信息所占用的空间更大,因此,亟须对图片类垃圾文件进行识别和清理。
但是,目前文件清理主要是针对缓存文件进行的,例如,用户可选择清除缓存数据,或者针对不同的应用程序分别清除缓存数据,但是这些都是批量清除,而不能在众多数据中识别出终端设备中的图片类垃圾文件,从而难以在保存有用文件同时对垃圾文件进行清理,用户体验差。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明第一方面的目的在于提出一种图片类垃圾文件的识别方法,实现了图片类垃圾文件的自动识别,并且识别效率高、准确率高。
本发明的第二方面的目的在于提出一种图片类垃圾文件的识别装置。
本发明的第三方面的目的在于提出一种电子设备。
为达上述目的,根据本发明第一方面实施例提出了一种图片类垃圾文件的识别方法,包括:获取图片类文件的存储路径;获取所述存储路径中文件的文件名特征;以及根据所述文件名特征判断所述存储路径中的文件是否为图片类垃圾文件。
本发明实施例的图片类垃圾文件的识别方法,通过获取图片类文件的存储路径,并获取存储路径中的文件名特征,以根据文件名特征判断存储路径中的文件是否为图片类垃圾文件,能够根据图片类垃圾文件的共性特征对图片类垃圾文件进行识别,实现了图片类垃圾文件的自动识别,并且识别效率高、准确率高,从而能够更高效精准地对图片类垃圾文件进行清理,提升终端设备的存储空间,进而提升系统的流畅度和相应速度,提升用户体验。
本发明的第二方面的实施例提供了一种图片类垃圾文件的识别装置,包括:第一获取模块,用于获取图片类文件的存储路径;第二获取模块,用于获取所述存储路径中文件的文件名特征;以及第一判断模块,用于根据所述文件名特征判断所述存储路径中的文件是否为图片类垃圾文件。
本发明实施例的图片类垃圾文件的识别装置,通过获取图片类文件的存储路径,并获取存储路径中的文件名特征,以根据文件名特征和/或存储路径判断存储路径中的文件是否为图片类垃圾文件,能够根据图片类垃圾文件的共性特征对图片类垃圾文件进行识别,实现了图片类垃圾文件的自动识别,并且识别效率高、准确率高,从而能够更高效精准地对图片类垃圾文件进行清理,提升终端设备的存储空间,进而提升系统的流畅度和相应速度,提升用户体验。
本发明的第三方面的实施例提供了一种电子设备,包括本发明第二方面实施例的图片类垃圾文件的识别装置。
本发明实施例的电子设备,通过获取图片类文件的存储路径,并获取存储路径中的文件名特征,以根据文件名特征和/或存储路径判断存储路径中的文件是否为图片类垃圾文件,能够根据图片类垃圾文件的共性特征对图片类垃圾文件进行识别,实现了图片类垃圾文件的自动识别,并且识别效率高、准确率高,从而能够更高效精准地对图片类垃圾文件进行清理,提升终端设备的存储空间,进而提升系统的流畅度和相应速度,提升用户体验。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的图片类垃圾文件的识别方法的流程图;
图2为根据本发明另一个实施例的图片类垃圾文件的识别方法的流程图;
图3为根据本发明又一个实施例的图片类垃圾文件的识别方法的流程图;
图4为根据本发明一个实施例的图片类垃圾文件的识别过程的示意图;
图5为根据本发明一个实施例的图片类垃圾文件的识别装置的结构示意图;
图6为根据本发明另一个实施例的图片类垃圾文件的识别装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
需要说明的是,本发明的实施例优选适用于移动终端,例如,IOS操作系统(IOS是由苹果公司开发的手持设备操作系统)、安卓操作系统(Android系统是一种基于Linux的自由及开放源代码的操作系统)、Windows Phone操作系统(Windows Phone是微软公司发布的一款手机操作系统)的移动终端,当然也适用于个人计算机以及其他智能移动终端,本发明对此不作限定。应当理解,在本发明的实施例中,移动终端可以是手机、平板电脑、个人数字助理、电子书等具有各种操作系统的硬件设备。
下面参考附图描述根据本发明实施例的图片类垃圾文件的识别方法、装置和电子设备。
图1为根据本发明一个实施例的图片类垃圾文件的识别方法的流程图。
如图1所示,该图片类垃圾文件的识别方法,包括:
S101,获取图片类文件的存储路径。
在本发明的一个实施例中,为了能够识别图片类垃圾文件,需要从终端中的各个应用触发的存储路径中筛选出图片类文件的存储路径,从而能够对该存储路径下的图片文件进行识别。具体地,可首先获取终端中各个存储路径中文件的文件类型,然后根据文件类型确定终端中各个存储路径中图片类型文件所占比例,并将图片类型文件所占比例大于第一预设比例的存储路径作为图片类文件的存储路径。
其中,第一预设比例可根据需要设定,例如,第一预设比例可为90%。
S102,获取存储路径中文件的文件名特征。
在本发明的一个实施例中,文件名特征是指文件名中的字符串特征,如文件名中包含分隔符的数量、文件名中字符序列的格式、文件名中是否包含表示分辨率或其他属性的字符串等特征。
S103,根据文件名特征判断存储路径中的文件是否为图片类垃圾文件。
在本发明的实施例中,由于图片类垃圾文件的文件名具有一些共性的特征,如,包含多个分隔符、包含表示分辨率属性的字符序列、文件名是MD5值随机字符序列或者文件名是随机数字序列等特征。如果存储路径中的文件大多数具有这些共性的特征,则说明存储路径中的文件是图片类垃圾文件。因此,作为可选的判断方式,可通过以下A1、A2、A3、A4中的一种或多种判断存储路径中的文件是否为图片类垃圾文件。
A1,根据文件名特征判断存储路径中文件名中分隔符的数量大于预设数量的文件所占的比例是否大于第二预设比例,如果大于第二预设比例,则判断存储路径中的文件为图片类垃圾文件。举例来说,分隔符可以是“_”、“%”、“#”、“&”、“*”、“@”等符号。其中,预设数量可为任意值,举例来说,预设数量可为5。也就是说,如果存储路径中超过第二预设比例的文件的文件名中的分隔符超过5个,则可判断存储路径中的文件为图片类垃圾文件。
A2,根据文件名特征判断存储路径中文件名中包括表示分辨率属性的字符串的文件所占比例是否大于第二预设比例,如果大于第二预设比例,则判断存储路径中的文件为图片类垃圾文件。其中,表示分辨率属性的字符串可以是120*210、100*180等数字序列*(或×)数字序列的字符串特征。如果存储路径中超过第二预设比例的文件的文件名中包括表示分辨率属性的字符串,则可判断存储路径中的文件为图片类垃圾文件。
A3,根据文件名特征判断存储路径中文件名为MD5值随机字符序列的文件所占比例是否大于第二预设比例,如果大于第二预设比例,则判断存储路径中的文件为图片类垃圾文件。MD5(Message-Digest Algorithm5,信息-摘要算法5)值是通过信息摘要算法对一个任意长度的字节串进行变换得到的一定长度的十六进制字符串。例如,0c29def086ced83435dc542db0f4c356即为一个MD5值随机字符序列的示例。如果存储路径中超过第二预设比例的文件的文件名是MD5值随机字符序列,则可判断存储路径中的文件为图片类垃圾文件。
A4,根据文件名特征判断存储路径中文件名为随机数字序列的文件所占比例大于第二预设比例,如果大于第二预设比例,则判断存储路径中的文件为图片类垃圾文件。在本发明的一个实施例中,随机数字序列为具有一定长度的纯数字字符串。随机数字序列的长度可通过对图片类垃圾文件进行统计分析得到。举例来说,随机数字序列的长度可为8-11,如果存储路径中超过第二预设比例的文件的文件名为8-11位的随机数字序列,则可判断存储路径中的文件为图片类垃圾文件。
应当理解,在A1、A2、A3、A4中的第二预设比例可根据需要预先设定,在本发明的一个实施例中,第二预设比例可为90%,当然,在本发明的其他实施例中,第二预设比例也可为其他值。
在本发明的实施例中,在识别出图片类垃圾文件之后,可对图片类垃圾文件执行清理步骤,具体地,可自动对识别出的图片类垃圾文件进行清理,也可将识别出的图片类垃圾文件向用户进行提示,并根据用户的指令清理相应的文件。从而释放出终端设备的存储空间,使系统运行更流畅、相应速度更快。
本发明实施例的图片类垃圾文件的识别方法,通过获取图片类文件的存储路径,并获取存储路径中的文件名特征,以根据文件名特征判断存储路径中的文件是否为图片类垃圾文件,能够根据图片类垃圾文件的共性特征对图片类垃圾文件进行识别,实现了图片类垃圾文件的自动识别,并且识别效率高、准确率高,从而能够更高效精准地对图片类垃圾文件进行清理,提升终端设备的存储空间,进而提升系统的流畅度和相应速度,提升用户体验。
在本发发明另一个实施例中,对于图片类垃圾文件来说,其存储路径也具有一些共性特征,因此本发明实施例的图片类垃圾文件的识别方法还可包括根据图片类文件的存储路径判断存储路径中的文件是否为图片类垃圾文件的步骤。具体地,图2为根据本发明另一个实施例的图片类垃圾文件的识别方法的流程图。如图2所示,该类垃圾文件的识别方法,包括:
S201,获取图片类文件的存储路径。
在本发明的一个实施例中,为了能够识别图片类垃圾文件,需要从终端中的各个应用触发的存储路径中筛选出图片类文件的存储路径,从而能够对该存储路径下的图片文件进行识别。具体地,可首先获取终端中各个存储路径中文件的文件类型,然后根据文件类型确定终端中各个存储路径中图片类型文件所占比例,并将图片类型文件所占比例大于第一预设比例的存储路径作为图片类文件的存储路径。
其中,第一预设比例可根据需要设定,例如,第一预设比例可为90%。
S202,获取存储路径中文件的文件名特征。
在本发明的一个实施例中,文件名特征是指文件名中的字符串特征,如文件名中包含分隔符的数量、文件名中字符序列的格式、文件名中是否包含表示分辨率或其他属性的字符串等特征。
S203,根据文件名特征判断存储路径中的文件是否为图片类垃圾文件。
在本发明的实施例中,由于图片类垃圾文件的文件名具有一些共性的特征,如,包含多个分隔符、包含表示分辨率属性的字符序列、文件名是MD5值随机字符序列或者文件名是随机数字序列等特征。如果存储路径中的文件大多数具有这些共性的特征,则说明存储路径中的文件是图片类垃圾文件。因此,作为可选的判断方式,可通过A1、A2、A3、A4中的一种或多种判断存储路径中的文件是否为图片类垃圾文件。
S204,根据图片类文件的存储路径判断存储路径中的文件是否为图片类垃圾文件。
具体地,作为一个可选的实施例,根据图片类文件的存储路径判断存储路径中的文件是否为图片类垃圾文件可具体包括:判断存储路径中是否包括预设新闻类关键字和预设图像类关键字的组合,如果包括预设新闻类关键字和预设图像类关键字的组合,则判断存储路径中的文件为图片类垃圾文件。其中,预设新闻类关键字可为新闻类应用程序触发的关键字news,预设图像类关键字可为image。具体地,对于新闻类应用程序触发的存储路径,如果包括关键字“news”和“image”的组合,则可判断该存储路径中的文件为图片类垃圾文件。
当然,如果存储路径中包括购物类应用关键字和预设图像类关键字的组合,说明该存储路径中的文件为购物网站中商品的图片,则可判断存储路径中的文件为图片类垃圾文件。举例来说,购物类应用关键字如taobao、jingdong等。
其中,步骤S204可在S203之前执行,也可在步骤S204之后执行。
本发明实施例的图片类垃圾文件的识别方法,可通过存储路径中的关键字判断存储路径中的文件是否为图片类垃圾文件,进一步提高了识别效率、识别准确率。
在本发明的一个实施例中,对于获取到的图片类文件的存储路径,其中部分存储路径中的文件虽然具有上述共性特征,但是却可能是系统或应用程序的常规文件,因此为了防止这种系统或应用程序的常规文件被误判为图片类垃圾文件,可在判断存储路径中的文件为图片类垃圾文件之前,对系统或应用程序的常规文件进行识别。具体地,图3为根据本发明又一个实施例的图片类垃圾文件的识别方法的流程图。图4为根据本发明一个实施例的图片类垃圾文件的识别过程的示意图。如图3和图4所示,该图片类垃圾文件的识别方法,包括:
S301,获取图片类文件的存储路径。
在本发明的一个实施例中,为了能够识别图片类垃圾文件,需要从终端中的各个应用触发的存储路径中筛选出图片类文件的存储路径,从而能够对该存储路径下的图片文件进行识别。具体地,可首先获取终端中各个存储路径中文件的文件类型,然后根据文件类型确定终端中各个存储路径中图片类型文件所占比例,并将图片类型文件所占比例大于第一预设比例的存储路径作为图片类文件的存储路径。
其中,第一预设比例可根据需要设定,例如,第一预设比例可为90%。
S302,获取存储路径中文件的文件名特征。
在本发明的一个实施例中,文件名特征是指文件名中的字符串特征,如文件名中包含分隔符的数量、文件名中字符序列的格式、文件名中是否包含表示分辨率或其他属性的字符串等特征。
S303,判断存储路径中是否包括预设关键词,如果存储路径中包括预设关键词,则判断存储路径中的文件不是图片类垃圾文件。
其中,预设关键字可为“cover”、“backup”、“album”等表示系统或应用程序的常规文件的关键字。如果存储路径中的文件包括预设关键字,则表明存储路径中的文件为系统或应用程序的常规文件,不可被判断为图片类垃圾文件。
在本发明的一个实施例中,如果存储路径中不包括预设关键词,即存储路径中的文件为未知类型文件时,则执行S306。
S304,获取存储路径中文件的后缀名的种类,如果存储路径中文件的后缀名的种类超过预设种类阈值,则判断存储路径中的文件不是图片类垃圾文件。
由于位于同一存储路径下的图片类垃圾文件大多具有相同的格式,即具有相同的后缀名,因此,如果存储路径中文件的后缀名的种类超过预设阈值,则表明存储路径中的文件不是图片类垃圾文件。举例来说,预设种类阈值可为2,如果存储路径中同时包括.jpg、.png、.gif三种,则判断存储路径中的文件不是图片类垃圾文件。
在本发明的一个实施例中,如果存储路径中文件的后缀名的种类不超过预设种类阈值,即存储路径中的文件为未知类型文件时,则执行S306。
S305,获取触发存储路径的应用程序的类型,根据触发存储路径的应用程序的类型对应的预设规则判断存储路径中的文件是否为图片类垃圾文件。
具体地,在本发明的一个实施例中,如果触发存储路径的应用程序的类型为即时通信类应用程序,则判断存储路径中的文件不是图片类垃圾文件。举例来说,对于微信中的聊天记录中的图片,则被判断为不是图片类垃圾文件。
在本发明的一个实施例中,在步骤S305未判断存储路径中的文件为图片类垃圾文件时,即存储路径中的文件为未知类型文件时,执行S306。
在本发明的一个实施例中,步骤S303、S304、S305的先后顺序不限。
S306,根据文件名特征判断存储路径中的文件是否为图片类垃圾文件。
在本发明的实施例中,由于图片类垃圾文件的文件名具有一些共性的特征,如,包含多个分隔符、包含表示分辨率属性的字符序列、文件名是MD5值随机字符序列或者文件名是随机数字序列等特征。如果存储路径中的文件大多数具有这些共性的特征,则说明存储路径中的文件是图片类垃圾文件。因此,作为可选的判断方式,可通过A1、A2、A3、A4中的一种或多种判断存储路径中的文件是否为图片类垃圾文件。
S307,根据图片类文件的存储路径判断存储路径中的文件是否为图片类垃圾文件。
具体地,作为一个可选的实施例,根据图片类文件的存储路径判断存储路径中的文件是否为图片类垃圾文件可具体包括:判断存储路径中是否包括预设新闻类关键字和预设图像类关键字的组合,如果包括预设新闻类关键字和预设图像类关键字的组合,则判断存储路径中的文件为图片类垃圾文件。其中,预设新闻类关键字可为新闻类应用程序触发的关键字news,预设图像类关键字可为image。具体地,对于新闻类应用程序触发的存储路径,如果包括关键字“news”和“image”的组合,则可判断该存储路径中的文件为图片类垃圾文件。
当然,如果存储路径中包括购物类应用关键字和预设图像类关键字的组合,说明该存储路径中的文件为购物网站中商品的图片,则可判断存储路径中的文件为图片类垃圾文件。举例来说,购物类应用关键字如taobao、jingdong等。上述几种关键字组合仅为示例性的,在本发明的其他实施例中,也可根据其他类应用程序对应的关键字组合,作为判断标准,从而能够针对不同应用程序类型触发的存储路径中的文件进行识别,提高识别的广度和精度。
其中,步骤S306可在S307之前执行,也可在步骤S307之后执行。
在本发明的其他实施例中,如图4所示,也可先执行步骤S306-S307,当在步骤S306-S307的执行过程中触发了判断存储路径中的文件为图片类垃圾文件之后,再执行步骤S303和S305。即在可能为图片类垃圾文件的文件中先将不是图片类垃圾文件(系统或应用程序的常规文件)对应的存储路径排除出去,剩余其他的存储路径中的文件判断为图片类垃圾文件,从而可以避免误判的可能。
本发明实施例的图片类垃圾文件的识别方法,可通过一些常规文件的特征对不是图片类垃圾文件的常规文件进行识别,从而能够避免将常规文件误判为垃圾文件,提高了识别的准确性,避免终端中常规文件被删除,进一步提升了用户体验。
为了实现上述实施例,本发明还提出一种图片类垃圾文件的识别装置。
图5为根据本发明一个实施例的图片类垃圾文件的识别装置的结构示意图。如图5所示,该图片类垃圾文件的识别装置,包括:第一获取模块10、第二获取模块20和第一判断模块30。
具体地,第一获取模块10用于获取图片类文件的存储路径。在本发明的一个实施例中,为了能够识别图片类垃圾文件,第一获取模块10需要从终端中的各个应用触发的存储路径中筛选出图片类文件的存储路径,从而能够对该存储路径下的图片文件进行识别。更具体地,第一获取模块具体用于获取终端中各个存储路径中文件的文件类型,以及根据文件类型确定终端中各个存储路径中图片类型文件所占比例,并将图片类型文件所占比例大于第一预设比例的存储路径作为图片类文件的存储路径。
其中,第一预设比例可根据需要设定,例如,第一预设比例可为90%。
第二获取模块20用于获取存储路径中文件的文件名特征。在本发明的一个实施例中,文件名特征是指文件名中的字符串特征,如文件名中包含分隔符的数量、文件名中字符序列的格式、文件名中是否包含表示分辨率或其他属性的字符串等特征。
第一判断模块30用于根据文件名特征判断存储路径中的文件是否为图片类垃圾文件。在本发明的实施例中,由于图片类垃圾文件的文件名具有一些共性的特征,如,包含多个分隔符、包含表示分辨率属性的字符序列、文件名是MD5值随机字符序列或者文件名是随机数字序列等特征。如果存储路径中的文件大多数具有这些共性的特征,则说明存储路径中的文件是图片类垃圾文件。因此,作为可选的判断方式,第一判断模块30可具体用于执行A1、A2、A3、A4中的一种或多种来判断存储路径中的文件是否为图片类垃圾文件。其中,A1、A2、A3、A4具体见方法实施例部分,在此不再赘述。
在本发明的另一个实施例中,对于图片类垃圾文件来说,其存储路径也具有一些共性特征,因此,第一判断模块30还用于根据图片类文件的存储路径判断存储路径中的文件是否为图片类垃圾文件。更具体地,第一判断模块30具体用于:判断存储路径中是否包括预设新闻类关键字和预设图像类关键字的组合,并在包括预设新闻类关键字和预设图像类关键字的组合时,判断存储路径中的文件为图片类垃圾文件。其中,预设新闻类关键字可为新闻类应用程序触发的关键字news,预设图像类关键字可为image。具体地,对于新闻类应用程序触发的存储路径,如果包括关键字“news”和“image”的组合,则可判断该存储路径中的文件为图片类垃圾文件。
当然,如果存储路径中包括购物类应用关键字和预设图像类关键字的组合,说明该存储路径中的文件为购物网站中商品的图片,则第一判断模块30还用于据此判断存储路径中的文件为图片类垃圾文件。举例来说,购物类应用关键字如taobao、jingdong等。上述几种关键字组合仅为示例性的,在本发明的其他实施例中,也可根据其他类应用程序对应的关键字组合,作为判断标准,从而能够针对不同应用程序类型触发的存储路径中的文件进行识别,提高识别的广度和精度。
本发明实施例的图片类垃圾文件的识别装置,通过获取图片类文件的存储路径,并获取存储路径中的文件名特征,以根据文件名特征和/或存储路径判断存储路径中的文件是否为图片类垃圾文件,能够根据图片类垃圾文件的共性特征对图片类垃圾文件进行识别,实现了图片类垃圾文件的自动识别,并且识别效率高、准确率高,从而能够更高效精准地对图片类垃圾文件进行清理,提升终端设备的存储空间,进而提升系统的流畅度和相应速度,提升用户体验。
图6为根据本发明另一个实施例的图片类垃圾文件的识别装置的结构示意图。如图6所示,该图片类垃圾文件的识别装置,包括:第一获取模块10、第二获取模块20、第一判断模块30和第二判断模块40。
具体地,第二判断模块40用于在第一判断模块判断存储路径中的文件为图片类垃圾文件之前,判断存储路径中是否包括预设关键词,并在存储路径中包括预设关键词时,判断存储路径中的文件不是图片类垃圾文件。其中,预设关键字可为“cover”、“backup”、“album”等表示系统或应用程序的常规文件的关键字。如果存储路径中的文件包括预设关键字,则表明存储路径中的文件为系统或应用程序的常规文件,不可被判断为图片类垃圾文件。
在本发明的一个实施例中,第二判断模块40还用于获取存储路径中文件的后缀名的种类,并在存储路径中文件的后缀名的种类超过预设种类阈值时,判断筛选出的存储路径中的文件不是垃圾文件。由于位于同一存储路径下的图片类垃圾文件大多具有相同的格式,即具有相同的后缀名,因此,如果存储路径中文件的后缀名的种类超过预设阈值,则表明存储路径中的文件不是图片类垃圾文件。举例来说,预设种类阈值可为2,如果存储路径中同时包括.jpg、.png、.gif三种,则判断存储路径中的文件不是图片类垃圾文件。
在本发明的一个实施例中,第二判断模块40还用于获取触发存储路径的应用程序的类型并根据触发存储路径的应用程序的类型对应的预设规则判断存储路径中的文件是否为图片类垃圾文件。更具体地,第二判断模块40具体用于在触发存储路径的应用程序的类型为即时通信类应用程序时,判断存储路径中的文件不是图片类垃圾文件。举例来说,对于微信中的聊天记录中的图片,则被判断为不是图片类垃圾文件。
本发明实施例的图片类垃圾文件的识别装置,可通过一些常规文件的特征对不是图片类垃圾文件的常规文件进行识别,从而能够避免将常规文件误判为垃圾文件,提高了识别的准确性,避免终端中常规文件被删除,进一步提升了用户体验。
为了实现上述实施例,本发明还提出一种电子设备。
本发明实施例的电子设备包括本发明任一实施例的图片类垃圾文件的识别装置。
本发明实施例的电子设备,通过获取图片类文件的存储路径,并获取存储路径中的文件名特征,以根据文件名特征和/或存储路径判断存储路径中的文件是否为图片类垃圾文件,能够根据图片类垃圾文件的共性特征对图片类垃圾文件进行识别,实现了图片类垃圾文件的自动识别,并且识别效率高、准确率高,从而能够更高效精准地对图片类垃圾文件进行清理,提升终端设备的存储空间,进而提升系统的流畅度和相应速度,提升用户体验。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (23)
1.一种图片类垃圾文件的识别方法,其特征在于,包括:
获取图片类文件的存储路径,所述获取图片类文件的存储路径,具体包括:获取终端中各个存储路径中文件的文件类型;根据所述文件类型确定所述终端中各个存储路径中图片类型文件所占比例;以及将图片类型文件所占比例大于第一预设比例的存储路径作为所述图片类文件的存储路径;
获取所述存储路径中文件的文件名特征;以及
根据所述文件名特征判断所述存储路径中的文件是否为图片类垃圾文件。
2.如权利要求1所述的方法,其特征在于,还包括:
根据所述图片类文件的存储路径判断所述存储路径中的文件是否为图片类垃圾文件。
3.如权利要求2所述的方法,其特征在于,所述根据所述图片类文件的存储路径判断所述存储路径中的文件是否为图片类垃圾文件具体包括:
判断所述存储路径中是否包括预设新闻类关键字和预设图像类关键字的组合;
如果包括所述预设新闻类关键字和预设图像类关键字的组合,则判断所述存储路径中的文件为图片类垃圾文件。
4.如权利要求1所述的方法,其特征在于,所述根据文件名特征判断所述存储路径中的文件是否为图片类垃圾文件具体包括:
根据所述文件名特征判断所述存储路径中文件名中分隔符的数量大于预设数量的文件所占的比例是否大于第二预设比例;
如果大于所述第二预设比例,则判断所述存储路径中的文件为图片类垃圾文件。
5.如权利要求1所述的方法,其特征在于,所述根据文件名特征判断所述存储路径中的文件是否为图片类垃圾文件具体包括:
根据所述文件名特征判断所述存储路径中文件名中包括表示分辨率属性的字符串的文件所占比例是否大于第二预设比例;
如果大于所述第二预设比例,则判断所述存储路径中的文件为图片类垃圾文件。
6.如权利要求1所述的方法,其特征在于,所述根据文件名特征判断所述存储路径中的文件是否为图片类垃圾文件具体包括:
根据所述文件名特征判断所述存储路径中文件名为MD5值随机字符序列的文件所占比例是否大于第二预设比例;
如果大于所述第二预设比例,则判断所述存储路径中的文件为图片类垃圾文件。
7.如权利要求1所述的方法,其特征在于,所述根据文件名特征判断所述存储路径中的文件是否为图片类垃圾文件具体包括:
根据所述文件名特征判断所述存储路径中文件名为随机数字序列的文件所占比例大于第二预设比例;
如果大于所述第二预设比例,则判断所述存储路径中的文件为图片类垃圾文件。
8.如权利要求3-7任一项所述的方法,其特征在于,在判断所述存储路径中的文件为图片类垃圾文件之前,还包括:
判断所述存储路径中是否包括预设关键词;以及
如果所述存储路径中包括预设关键词,则判断所述存储路径中的文件不是图片类垃圾文件。
9.如权利要求3-7任一项所述的方法,其特征在于,在判断所述存储路径中的文件为图片类垃圾文件之前,还包括:
获取所述存储路径中文件的后缀名的种类;
如果所述存储路径中文件的后缀名的种类超过预设种类阈值,则判断所述存储路径中的文件不是图片类垃圾文件。
10.如权利要求3-7任一项所述的方法,其特征在于,在判断所述存储路径中的文件为图片类垃圾文件之前,还包括:
获取触发所述存储路径的应用程序的类型;
根据所述触发所述存储路径的应用程序的类型对应的预设规则判断所述存储路径中的文件是否为图片类垃圾文件。
11.如权利要求10所述的方法,其特征在于,如果所述触发所述存储路径的应用程序的类型为即时通信类应用程序,则判断所述存储路径中的文件不是图片类垃圾文件。
12.一种图片类垃圾文件的识别装置,其特征在于,包括:
第一获取模块,用于获取图片类文件的存储路径,所述第一获取模块具体用于:
获取终端中各个存储路径中文件的文件类型;根据所述文件类型确定所述终端中各个存储路径中图片类型文件所占比例,并将图片类型文件所占比例大于第一预设比例的存储路径作为所述图片类文件的存储路径;
第二获取模块,用于获取所述存储路径中文件的文件名特征;以及
第一判断模块,用于根据所述文件名特征判断所述存储路径中的文件是否为图片类垃圾文件。
13.如权利要求12所述的装置,其特征在于,
所述第一判断模块还用于根据所述图片类文件的存储路径判断所述存储路径中的文件是否为图片类垃圾文件。
14.如权利要求13所述的装置,其特征在于,所述第一判断模块具体用于:
判断所述存储路径中是否包括预设新闻类关键字和预设图像类关键字的组合;
如果包括所述预设新闻类关键字和预设图像类关键字的组合,则判断所述存储路径中的文件为图片类垃圾文件。
15.如权利要求12所述的装置,其特征在于,所述第一判断模块具体用于:
根据所述文件名特征判断所述存储路径中文件名中分隔符的数量大于预设数量的文件所占的比例是否大于第二预设比例;
如果大于所述第二预设比例,则判断所述存储路径中的文件为图片类垃圾文件。
16.如权利要求12所述的装置,其特征在于,所述第一判断模块具体用于:
根据所述文件名特征判断所述存储路径中文件名中包括表示分辨率属性的字符串的文件所占比例是否大于第二预设比例;
如果大于所述第二预设比例,则判断所述存储路径中的文件为图片类垃圾文件。
17.如权利要求12所述的装置,其特征在于,所述第一判断模块具体用于:
根据所述文件名特征判断所述存储路径中文件名为MD5值随机字符序列的文件所占比例是否大于第二预设比例;
如果大于所述第二预设比例,则判断所述存储路径中的文件为图片类垃圾文件。
18.如权利要求12所述的装置,其特征在于,所述第一判断模块具体用于:
根据所述文件名特征判断所述存储路径中文件名为随机数字序列的文件所占比例大于第二预设比例;
如果大于所述第二预设比例,则判断所述存储路径中的文件为图片类垃圾文件。
19.如权利要求14-18任一项所述的装置,其特征在于,还包括:
第二判断模块,用于在所述第一判断模块判断所述存储路径中的文件为图片类垃圾文件之前,判断所述存储路径中是否包括预设关键词,并在所述存储路径中包括预设关键词时,判断所述存储路径中的文件不是图片类垃圾文件。
20.如权利要求19所述的装置,其特征在于,所述第二判断模块还用于:
获取所述存储路径中文件的后缀名的种类,并在所述存储路径中文件的后缀名的种类超过预设种类阈值时,判断所述存储路径中的文件不是垃圾文件。
21.如权利要求19所述的装置,其特征在于,所述第二判断模块还用于:
获取触发所述存储路径的应用程序的类型并根据所述触发所述存储路径的应用程序的类型对应的预设规则判断所述存储路径中的文件是否为图片类垃圾文件。
22.如权利要求21所述的装置,其特征在于,所述第二判断模块具体用于在所述触发所述存储路径的应用程序的类型为即时通信类应用程序时,判断所述存储路径中的文件不是图片类垃圾文件。
23.一种电子设备,其特征在于,包括如权利要求12-22任一项所述的图片类垃圾文件的识别装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410309644.9A CN105446987B (zh) | 2014-06-30 | 2014-06-30 | 图片类垃圾文件的识别方法、装置和电子设备 |
US15/322,995 US10838917B2 (en) | 2014-06-30 | 2015-06-23 | Junk picture file identification method, apparatus, and electronic device |
PCT/CN2015/082115 WO2016000545A1 (zh) | 2014-06-30 | 2015-06-23 | 图片类垃圾文件的识别方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410309644.9A CN105446987B (zh) | 2014-06-30 | 2014-06-30 | 图片类垃圾文件的识别方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105446987A CN105446987A (zh) | 2016-03-30 |
CN105446987B true CN105446987B (zh) | 2019-03-26 |
Family
ID=55018429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410309644.9A Active CN105446987B (zh) | 2014-06-30 | 2014-06-30 | 图片类垃圾文件的识别方法、装置和电子设备 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10838917B2 (zh) |
CN (1) | CN105446987B (zh) |
WO (1) | WO2016000545A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105808674A (zh) * | 2016-03-01 | 2016-07-27 | 北京金山安全软件有限公司 | 一种图片展示方法、装置及电子设备 |
CN105808677A (zh) * | 2016-03-01 | 2016-07-27 | 北京金山安全软件有限公司 | 一种图片删除方法、装置及电子设备 |
CN106227867B (zh) * | 2016-07-29 | 2019-10-25 | 努比亚技术有限公司 | 一种文件管理的方法及装置 |
CN107066604B (zh) * | 2017-04-25 | 2020-12-01 | 西安阳易信息技术有限公司 | 一种垃圾文件清理方法和终端 |
CN107609066A (zh) * | 2017-08-30 | 2018-01-19 | 努比亚技术有限公司 | 清理文件的方法、设备及计算机可存储介质 |
CN109451447A (zh) * | 2018-11-13 | 2019-03-08 | 北京奇虎科技有限公司 | 一种鉴别垃圾信息的方法、装置、存储介质和设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567319A (zh) * | 2010-12-10 | 2012-07-11 | 腾讯科技(深圳)有限公司 | 网页图片过滤方法及系统 |
CN103365882A (zh) * | 2012-03-30 | 2013-10-23 | 网秦无限(北京)科技有限公司 | 一种移动终端上垃圾文件清理的方法和系统 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7096418B1 (en) * | 2000-02-02 | 2006-08-22 | Persistence Software, Inc. | Dynamic web page cache |
KR100769371B1 (ko) * | 2001-05-12 | 2007-10-22 | 엘지전자 주식회사 | 스크립트 파일이 포함 기록된 기록매체와, 그 재생장치 및방법 |
US7133893B2 (en) * | 2001-08-03 | 2006-11-07 | Hewlett-Packard Development Company, L.P. | Opportunistic transmission of portably stored digital data |
CA2489236C (en) * | 2002-06-12 | 2014-01-14 | Jena Jordahl | Data storage, retrieval, manipulation and display tools enabling multiple hierarchical points of view |
EP1549012A1 (en) * | 2003-12-24 | 2005-06-29 | DataCenterTechnologies N.V. | Method and system for identifying the content of files in a network |
CN100357943C (zh) * | 2004-03-17 | 2007-12-26 | 联想(北京)有限公司 | 一种检查机群文件系统中垃圾文件的方法 |
CN100370749C (zh) * | 2005-01-26 | 2008-02-20 | 华为技术有限公司 | 保证交换机各个单板软件版本一致的方法 |
KR100778764B1 (ko) * | 2006-08-02 | 2007-11-27 | 삼성전자주식회사 | 이동통신 단말기의 파일 자동 분류 방법 및 그 장치 |
CN101256575B (zh) * | 2008-03-25 | 2010-06-23 | 华为技术有限公司 | 提高单板磁盘空间利用率的方法及装置 |
CN101582072A (zh) * | 2008-05-16 | 2009-11-18 | 鸿富锦精密工业(深圳)有限公司 | 代码统计系统及方法 |
CN102654872A (zh) * | 2011-03-03 | 2012-09-05 | 腾讯科技(深圳)有限公司 | 一种清理应用程序产生的垃圾文件的方法及装置 |
CN102550714B (zh) * | 2012-01-10 | 2013-07-17 | 安徽农业大学 | 电磁式自动加压理条机 |
CN102880713B (zh) * | 2012-09-29 | 2016-08-03 | 北京奇虎科技有限公司 | 文件清理方法及装置 |
CN102970420B (zh) | 2012-11-07 | 2014-01-22 | 广东欧珀移动通信有限公司 | 一种Android 系统中的图片过滤方法及系统 |
CN103020645A (zh) * | 2013-01-06 | 2013-04-03 | 深圳市彩讯科技有限公司 | 一种垃圾图片识别方法和系统 |
CN104021159B (zh) * | 2014-05-26 | 2017-07-28 | 北京金山安全软件有限公司 | 一种客户端文件清理方法和装置 |
CN105446980B (zh) * | 2014-06-27 | 2018-12-14 | 北京金山安全软件有限公司 | 一种鉴别图片垃圾文件的方法及装置 |
CN105224574B (zh) * | 2014-06-30 | 2019-02-19 | 北京金山安全软件有限公司 | 垃圾文件自动识别的方法和装置 |
CN105045928A (zh) * | 2015-08-27 | 2015-11-11 | 北京金山安全软件有限公司 | 一种待清理数据展示方法、装置及电子设备 |
US10305833B1 (en) * | 2017-07-23 | 2019-05-28 | Turing Technology, Inc. | Blockchain based email procedures |
CN110019033A (zh) * | 2017-09-21 | 2019-07-16 | 北京金山安全软件有限公司 | 一种垃圾特征获取方法、装置、服务器及可读存储介质 |
-
2014
- 2014-06-30 CN CN201410309644.9A patent/CN105446987B/zh active Active
-
2015
- 2015-06-23 US US15/322,995 patent/US10838917B2/en active Active
- 2015-06-23 WO PCT/CN2015/082115 patent/WO2016000545A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567319A (zh) * | 2010-12-10 | 2012-07-11 | 腾讯科技(深圳)有限公司 | 网页图片过滤方法及系统 |
CN103365882A (zh) * | 2012-03-30 | 2013-10-23 | 网秦无限(北京)科技有限公司 | 一种移动终端上垃圾文件清理的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
US20170132239A1 (en) | 2017-05-11 |
CN105446987A (zh) | 2016-03-30 |
WO2016000545A1 (zh) | 2016-01-07 |
US10838917B2 (en) | 2020-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105446987B (zh) | 图片类垃圾文件的识别方法、装置和电子设备 | |
CN109271512B (zh) | 舆情评论信息的情感分析方法、装置及存储介质 | |
CN105630932B (zh) | 一种智能终端的文件管理方法和装置 | |
CN105988837B (zh) | 一种应用程序的安装方法及装置 | |
CN103927303B (zh) | 一种查找账户的方法和装置 | |
CN104346569A (zh) | 移动终端中恶意广告的识别方法、装置和移动终端 | |
US9544177B2 (en) | System and method for contact merge management | |
CN109492118A (zh) | 一种数据检测方法及检测装置 | |
CN109683728B (zh) | 群组成员添加方法及装置 | |
CN106227483B (zh) | 一种显示控制方法及移动终端 | |
CN107451253B (zh) | 数据处理方法及装置 | |
CN107977246A (zh) | 对应用程序的通知进行处理的方法和设备 | |
US10402370B2 (en) | Information processing method and electronic apparatus | |
CN110769064A (zh) | 一种用于离线推送消息的系统、方法和设备 | |
CN115344315B (zh) | 小程序页面的皮肤切换方法、装置和电子设备 | |
CN106358220B (zh) | 异常联系人信息的检测方法、装置及系统 | |
TW201027394A (en) | Method, apparatus and computer program product for providing an input order independent character input mechanism | |
CN105847516B (zh) | 一种联系人信息管理方法及装置 | |
CN107015719A (zh) | 通知提示方法及装置 | |
US20170171128A1 (en) | Method and electronic device for email processing | |
KR101858544B1 (ko) | 정보 처리 방법 및 장치 | |
CN106657316B (zh) | 一种消息撤回方法及装置 | |
CN109725919A (zh) | 一种信息处理方法、装置、设备及存储介质 | |
CN106060238A (zh) | 移动终端信息清理方法 | |
CN107688951B (zh) | 信息推送方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |