CN106202166A - 文件的清理方法、装置及相应的客户端 - Google Patents

文件的清理方法、装置及相应的客户端 Download PDF

Info

Publication number
CN106202166A
CN106202166A CN201610473996.7A CN201610473996A CN106202166A CN 106202166 A CN106202166 A CN 106202166A CN 201610473996 A CN201610473996 A CN 201610473996A CN 106202166 A CN106202166 A CN 106202166A
Authority
CN
China
Prior art keywords
file
clearance
cleaning
characteristic
catalogue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610473996.7A
Other languages
English (en)
Other versions
CN106202166B (zh
Inventor
张金晶
李强
常富洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihu Technology Service Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201610473996.7A priority Critical patent/CN106202166B/zh
Publication of CN106202166A publication Critical patent/CN106202166A/zh
Application granted granted Critical
Publication of CN106202166B publication Critical patent/CN106202166B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了文件的清理方法及清理装置,该文件的清理方法包括:接收客户端发送的待清理文件的特征数据;将待清理文件的特征数据输入预存的判断模型以获取输出结果;基于输出结果确定待清理文件的文件清理目录;将待清理文件的文件清理目录下发至相应的客户端。通过本发明,实现了自动化对客户端发送的待清理文件的特征数据进行精确快速地处理,为相应的客户端精确快速地根据待清理文件的文件清理目录清理相应的文件提供了重要的前提保障;进一步地,通过清理相应客户端的待清理文件,使得相应客户端所在终端设备提高了运行效率,从而提高了用户使用体验。

Description

文件的清理方法、装置及相应的客户端
技术领域
本发明涉及计算机技术领域,具体而言,本发明涉及一种文件的清理方法和一种客户端文件的清理方法,及一种文件的清理装置和一种文件清理的客户端。
背景技术
随着软件相关技术的飞速发展,人们的生活和工作对应用程序的依赖度也随之提高,人们在终端设备中使用的应用程序的种类也越来越多,当越来越多的应用程序在终端设备中运行时,将会产生大量的垃圾文件,导致终端设备的大量存储空间被无用数据占用,严重时将致使终端设备储空间不足,从而影响终端设备的运行效率,因此需要对终端设备的垃圾文件进行清理。
现有的垃圾文件清理技术,在确定垃圾文件的过程中,需要人工在垃圾文件库中进行判断比对及筛选操作,无法实现自动化的确认垃圾文件,由于人工确定的垃圾文件的类型存在一定的错误率,且由于人工筛选存在一定时间滞后情况,无法及时的获取各类型的垃圾文件。因此现有的垃圾清理文件技术在清理垃圾文件时容易出现错误清理或清理不干净的情况,从而可能导致将用户的有用文件清除,使得相应的应用程序运行出错。因此,需要一种文件的清理方案,实现安全高效的垃圾文件清理。
发明内容
为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:
本发明的实施例提出了一种文件的清理方法,包括:
接收客户端发送的待清理文件的特征数据;
将待清理文件的特征数据输入预存的判断模型以获取输出结果;
基于输出结果确定待清理文件的文件清理目录;
将待清理文件的文件清理目录下发至相应的客户端。
可选地,该方法还包括:
获取多个文件的相关信息及相应的清理方式以作为原始样本数据;
基于原始样本数据构建训练特征;
将训练特征通过预定的算法进行训练以确定判断模型;
其中,预定的算法包括GBDT分类算法。
优选地,将待清理文件的特征数据输入预存的判断模型以获取输出结果,包括:
将待清理文件的特征数据输入预存的判断模型,依据判断模型中的判断规则来确定待清理文件中的文件是否需要清理,并作为输出结果;
其中,判断规则包括以下至少一项:
清理包含预定名称后缀的文件;
清理系统的日志文件;
清理应用程序卸载后的残留文件;
清理具有相同后缀名文件的数量大小超过预定阈值的文件。
优选地,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
本发明的另一实施例提出了一种客户端文件的清理方法,包括:
基于文件清理的触发操作,提取待清理文件的特征数据;
将待清理文件的特征数据发送至服务器进行训练;
接收服务器返回的待清理文件的文件清理目录;
根据待清理文件的文件清理目录,对待清理文件执行相应的操作。
优选地,对待清理文件执行相应的操作包括一键清理、手动清理、建议保留中的至少一项。
优选地,根据待清理文件的清理目录,对文件执行相应的一键清理操作,包括:
获取待清理文件的清理目录中清理文件的文件名称;
根据清理文件的文件名称,对客户端中对应文件名称的文件执行一键清理操作。
优选地,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
本发明的又另一实施例提出了一种文件的清理装置,包括:
第一接收模块,用于接收客户端发送的待清理文件的特征数据;
输入模块,用于将待清理文件的特征数据输入预存的判断模型以获取输出结果;
确定模块,用于基于输出结果确定待清理文件的文件清理目录;
下发模块,用于将待清理文件的文件清理目录下发至相应的客户端。
可选地,该装置还包括:
获取模块,用于获取多个文件的相关信息及相应的清理方式以作为原始样本数据;
构建模块,用于基于原始样本数据构建训练特征;
训练模块,用于将训练特征通过预定的算法进行训练以确定判断模型;
其中,预定的算法包括GBDT分类算法。
优选地,输入模块用于将待清理文件的特征数据输入预存的判断模型,依据判断模型中的判断规则来确定待清理文件中的文件是否需要清理,并作为输出结果;
其中,判断规则包括以下至少一项:
清理包含预定名称后缀的文件;
清理系统的日志文件;
清理应用程序卸载后的残留文件;
清理具有相同后缀名文件的数量大小超过预定阈值的文件。
优选地,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
本发明的再另一实施例提出了一种文件清理的客户端,包括:
提取模块,用于基于文件清理的触发操作,提取待清理文件的特征数据;
发送模块,用于将待清理文件的特征数据发送至服务器进行训练;
第二接收模块,用于接收服务器返回的待清理文件的文件清理目录;
执行模块,用于根据待清理文件的文件清理目录,对待清理文件执行相应的操作。
优选地,对待清理文件执行相应的操作包括一键清理、手动清理、建议保留中的至少一项。
优选地,执行模块,包括:
获取单元,用于获取待清理文件的清理目录中清理文件的文件名称;
一键清理单元,用于根据清理文件的文件名称,对客户端中对应文件名称的文件执行一键清理操作。
优选地,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
本发明的实施例中,提出了一种文件的清理方案,接收客户端发送的待清理文件的特征数据,将待清理文件的特征数据输入预存的判断模型以获取输出结果,实现了自动化对客户端发送的待清理文件的特征数据进行精确快速地处理,为后续确定待清理文件的文件清理目录提供了可靠的前提保障;基于输出结果确定待清理文件的文件清理目录,将待清理文件的文件清理目录下发至相应的客户端,为相应的客户端精确快速地根据待清理文件的文件清理目录清理相应的文件提供了重要的前提保障。进一步地,通过清理相应客户端的待清理文件,使得相应客户端所在终端设备提高了运行效率,从而提高了用户使用体验。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明中一个实施例的文件的清理方法的流程图;
图2为本发明中另一实施例的客户端文件的清理方法的流程图;
图3为本发明中又一实施例的文件的清理装置的结构示意图;
图4为本发明中再一实施例的文件清理的客户端的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
图1为本发明中一个实施例的文件的清理方法的流程图。
本发明的实施例中,各步骤所执行的内容概述如下:步骤S110:接收客户端发送的待清理文件的特征数据;步骤S120:将待清理文件的特征数据输入预存的判断模型以获取输出结果;步骤S130:基于输出结果确定待清理文件的文件清理目录;步骤S140:将待清理文件的文件清理目录下发至相应的客户端。
本发明的实施例中,提出了一种文件的清理方法,接收客户端发送的待清理文件的特征数据,将待清理文件的特征数据输入预存的判断模型以获取输出结果,实现了自动化对客户端发送的待清理文件的特征数据进行精确快速地处理,为后续确定待清理文件的文件清理目录提供了可靠的前提保障;基于输出结果确定待清理文件的文件清理目录,将待清理文件的文件清理目录下发至相应的客户端,为相应的客户端精确快速地根据待清理文件的文件清理目录清理相应的文件提供了重要的前提保障。进一步地,通过清理相应客户端的待清理文件,使得相应客户端所在终端设备提高了运行效率,从而提高了用户使用体验。
以下针对各个步骤的具体实现做进一步的说明:
步骤S110:接收客户端发送的待清理文件的特征数据。
具体地,服务器接收客户端发送的待清理文件的特征数据。
其中,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件清理目录下文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
例如,服务器接收终端设备发送的待清理文件的特征数据,如应用程序QQ的包名信息“com.tencent.mm”、QQ在终端设备中的根路径信息“../data/”、QQ在终端设备中的子路径信息“../data/data/com.tencent.qq/databases/”、QQ包名的标签信息“1”、QQ包名的分类信息“即时通信”、文件的后缀信息,如终端设备“../data/”目录下的文件包含的两种后缀名分别为“.temp”和“.txt”、应用程序文件的大小和应用程序文件的数量,如终端设备“../data/data/com.tencent.qq/databases/”路径下各个文件的大小信息和所有文件的总数量100个、后缀名为“.temp”文件的总数量为50个和后缀名为“.txt”文件的总数量为10个。
步骤S120:将待清理文件的特征数据输入预存的判断模型以获取输出结果。
具体地,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,以获取训练后的输出结果。
在实际应用中,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练之前,可预先将待清理文件的特征数据进行归一化处理,再将归一化处理后的待清理文件的特征数据输入判断模型进行训练得到训练后的输出结果,输出结果包括了待清理文件对应的文件类型、清理类型和清理建议等信息。
又例如,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,预存的判断模型训练待清理文件的特征数据的方法如将待清理文件的特征数据通过矩阵数据分析法进行分析处理,在矩阵图的基础上,把各个待清理文件的特征数据分别放在行和列,随后在行和列的交叉点中用数量来描述这些因素之间的对比,再进行数量计算,定量分析,确定相对需要清理的可能性较大的待清理文件的特征数据,得到训练后的输出结果,输出结果包括了待清理文件对应的文件类型、清理类型和清理建议等信息。
在一优选实施例中,步骤S120具体包括步骤S121(图中未示出);步骤S121:将待清理文件的特征数据输入预存的判断模型,依据判断模型中的判断规则来确定待清理文件中的文件是否需要清理,并作为输出结果;
其中,判断规则包括以下至少一项:
清理包含预定名称后缀的文件;
清理系统的日志文件;
清理应用程序卸载后的残留文件;
清理具有相同后缀名文件的数量大小超过预定阈值的文件。
例如,服务器将接收到的终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,预存的判断模型训练待清理文件的特征数据的方法如将待清理文件的特征数据通过矩阵数据分析法进行分析处理,确定相对需要清理的可能性较大的待清理文件的特征数据;判断模型中的判断规则如清理包含“.temp”后缀的文件、清理系统的日志文件、清理应用程序卸载后的残留文件和清理具有相同后缀名文件的数量大小超过200个的文件,随后依据判断规则,判断通过矩阵数据分析法进行分析处理后确定相对需要清理的可能性较大的各待清理文件的特征数据中包含“.temp”后缀的文件、日志文件、QQ卸载后的残留文件、微信卸载后的残留文件为需要清理的文件,各待清理文件的特征数据中具有相同后缀名“.txt”文件的数量大小300个,依据判断规则清理具有相同后缀名文件的数量大小超过200个的文件,可判断各后缀名为“.txt”的文件为需要清理的文件,并输出判断结果,输出结果包括了各待清理文件对应的文件类型如系统文件或日志文件等、清理类型如一键清理或手动清理和清理建议如建议保留等信息。
步骤S130:基于输出结果确定待清理文件的文件清理目录。
具体地,基于预存的判断模型的输出结果确定待清理文件的文件清理目录。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
例如,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,基于训练后的输出结果中的各待清理文件对应的文件类型、清理类型和清理建议等信息,确定待清理文件的文件清理目录,如文件的描述信息为“文件名:aaa.temp,文件路径:../data/data/com.tencent.qq/databases/”,对应该文件描述信息的清理类型信息为“文本清理”、清理建议信息为“一键清理”和卸载残留信息为“非卸载残留文件”。
步骤S140:将待清理文件的文件清理目录下发至相应的客户端。
具体地,将基于输出结果确定待清理文件的文件清理目录下发至发送该待清理文件特征数据的客户端。
例如,服务器将接收终端设备A的客户端发送的待清理文件的特征数据输入预存的判断模型进行训练,基于训练后的输出结果中的各待清理文件对应的文件类型、清理类型和清理建议等信息,确定待清理文件的文件清理目录,随后,将该文件清理目录下发至终端设备A该相应的客户端。
在一优选实施例中,该方法还包括步骤S150(图中未示出)、步骤S160(图中未示出)和步骤S170(图中未示出);步骤S150:获取多个文件的相关信息及相应的清理方式以作为原始样本数据;步骤S160:基于原始样本数据构建训练特征;步骤S170:将训练特征通过预定的算法进行训练以确定判断模型。
优选地,预定的算法包括GBDT分类算法。
例如,服务器从历史数据中获取各待清理文件的相关信息,包括各待清理文件的特征数据,以及各待清理文件的清理方式,清理方式包括一键清理、手动清理和建议保留,作为原始样本数据,基于已获取的原始样本数据通过矩阵数据分析法构建训练特征,将训练特征通过GBDT分类算法进行训练以确定判断模型。
图2为本发明中另一实施例的客户端文件的清理方法的流程图。
本发明的实施例中,各步骤所执行的内容概述如下:步骤S210:基于文件清理的触发操作,提取待清理文件的特征数据;步骤S220:将待清理文件的特征数据发送至服务器进行训练;步骤S230:接收服务器返回的待清理文件的文件清理目录;步骤S240:根据待清理文件的文件清理目录,对待清理文件执行相应的操作。
以下针对各个步骤的具体实现做进一步的说明:
步骤S210:基于文件清理的触发操作,提取待清理文件的特征数据。
优选地,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、目录下文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
例如,在客户端的终端设备中,用户点击应用程序APP提供的人机交互界面中的文件清理按钮,随后基于对文件清理按钮的点击触发操作,APP提取待清理文件的特征数据,如应用程序QQ的包名信息“com.tencent.mm”、QQ在终端设备中的根路径信息“../data/”、QQ在终端设备中的子路径信息“../data/data/com.tencent.qq/databases/”、QQ包名的标签信息“1”、QQ包名的分类信息“即时通信”、文件的后缀信息,如终端设备“../data/”目录下的文件包含的两种后缀名分别为“.temp”和“.txt”、应用程序文件的大小和应用程序文件的数量,如终端设备“../data/data/com.tencent.qq/databases/”路径下各个文件的大小信息和所有文件的总数量1000个、后缀名为“.temp”文件的总数量为500个和后缀名为“.txt”文件的总数量为100个。
步骤S220:将待清理文件的特征数据发送至服务器进行训练。
例如,在客户端的终端设备A中,用户触发文件清理按钮,客户端提取待清理文件的特征数据,随后将已提取的待清理文件的特征数据发送至服务器的预存的判断模型进行训练,服务器根据输出结果确定待清理文件的文件清理目录,随后服务器将该确定待清理文件的文件清理目录下发至终端设备A的该客户端。
步骤S230:接收服务器返回的待清理文件的文件清理目录。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
例如,接上例,客户端的终端设备A,接收服务器返回的的待清理文件的文件清理目录,文件清理目录中包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留,如文件的描述信息为“文件名:aaa.temp,文件路径:../data/data/com.tencent.qq/databases/”,对应该文件描述信息的清理类型信息为“文本清理”、清理建议信息为“一键清理”和卸载残留信息为“非卸载残留文件”。
步骤S240:根据待清理文件的文件清理目录,对待清理文件执行相应的操作。
其中,对待清理文件执行相应的操作包括一键清理、手动清理、建议保留中的至少一项。
在一优选实施例中,步骤S240进一步包括步骤S241(图中未示出)和步骤S242(图中未示出);步骤S241:获取待清理文件的清理目录中清理文件的文件名称;步骤S242:根据清理文件的文件名称,对客户端中对应文件名称的文件执行一键清理操作。
例如,客户端接收到服务器返回的的待清理文件的文件清理目录,根据待清理文件的文件清理目录中文件的描述信息为“文件名:aaa.temp,文件路径:../data/data/com.tencent.qq/databases/”对应的清理建议信息为“一键清理”,对终端设备中“../data/data/com.tencent.qq/databases/”路径下的“aaa.temp”文件执行一键清理的操作,根据待清理文件的文件清理目录中文件的描述信息为“文件名:bb.cache,文件路径:../data/data/com.tencent.qq/databases/”对应的清理建议信息为“建议保留”,对终端设备中“../data/data/com.tencent.qq/databases/”路径下的“bb.cache”文件不执行任何操作。
图3为本发明中又另一实施例的文件的清理装置的结构示意图。
本发明的实施例中,各模块所执行的内容概述如下:第一接收模块310接收客户端发送的待清理文件的特征数据;输入模块320将待清理文件的特征数据输入预存的判断模型以获取输出结果;确定模块330基于输出结果确定待清理文件的文件清理目录;下发模块340将待清理文件的文件清理目录下发至相应的客户端。
本发明的实施例中,提出了一种文件的清理装置,接收客户端发送的待清理文件的特征数据,将待清理文件的特征数据输入预存的判断模型以获取输出结果,实现了自动化对客户端发送的待清理文件的特征数据进行精确快速地处理,为后续确定待清理文件的文件清理目录提供了可靠的前提保障;基于输出结果确定待清理文件的文件清理目录,将待清理文件的文件清理目录下发至相应的客户端,为相应的客户端精确快速地根据待清理文件的文件清理目录清理相应的文件提供了重要的前提保障。进一步地,通过清理相应客户端的待清理文件,使得相应客户端所在终端设备提高了运行效率,从而提高了用户使用体验。
以下针对各个模块的具体实现做进一步的说明:
第一接收模块310接收客户端发送的待清理文件的特征数据。
具体地,服务器接收客户端发送的待清理文件的特征数据。
其中,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件清理目录下文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
例如,服务器接收终端设备发送的待清理文件的特征数据,如应用程序QQ的包名信息“com.tencent.mm”、QQ在终端设备中的根路径信息“../data/”、QQ在终端设备中的子路径信息“../data/data/com.tencent.qq/databases/”、QQ包名的标签信息“1”、QQ包名的分类信息“即时通信”、文件的后缀信息,如终端设备“../data/”目录下的文件包含的两种后缀名分别为“.temp”和“.txt”、应用程序文件的大小和应用程序文件的数量,如终端设备“../data/data/com.tencent.qq/databases/”路径下各个文件的大小信息和所有文件的总数量100个、后缀名为“.temp”文件的总数量为50个和后缀名为“.txt”文件的总数量为10个。
输入模块320将待清理文件的特征数据输入预存的判断模型以获取输出结果。
具体地,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,以获取训练后的输出结果。
在实际应用中,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练之前,可预先将待清理文件的特征数据进行归一化处理,再将归一化处理后的待清理文件的特征数据输入判断模型进行训练得到训练后的输出结果,输出结果包括了待清理文件对应的文件类型、清理类型和清理建议等信息。
又例如,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,预存的判断模型训练待清理文件的特征数据的方法如将待清理文件的特征数据通过矩阵数据分析法进行分析处理,在矩阵图的基础上,把各个待清理文件的特征数据分别放在行和列,随后在行和列的交叉点中用数量来描述这些因素之间的对比,再进行数量计算,定量分析,确定相对需要清理的可能性较大的待清理文件的特征数据,得到训练后的输出结果,输出结果包括了待清理文件对应的文件类型、清理类型和清理建议等信息。
在一优选实施例中,输入模块320将待清理文件的特征数据输入预存的判断模型,依据判断模型中的判断规则来确定待清理文件中的文件是否需要清理,并作为输出结果;
其中,判断规则包括以下至少一项:
清理包含预定名称后缀的文件;
清理系统的日志文件;
清理应用程序卸载后的残留文件;
清理具有相同后缀名文件的数量大小超过预定阈值的文件。
例如,服务器将接收到的终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,预存的判断模型训练待清理文件的特征数据的方法如将待清理文件的特征数据通过矩阵数据分析法进行分析处理,确定相对需要清理的可能性较大的待清理文件的特征数据;判断模型中的判断规则如清理包含“.temp”后缀的文件、清理系统的日志文件、清理应用程序卸载后的残留文件和清理具有相同后缀名文件的数量大小超过200个的文件,随后依据判断规则,判断通过矩阵数据分析法进行分析处理后确定相对需要清理的可能性较大的各待清理文件的特征数据中包含“.temp”后缀的文件、日志文件、QQ卸载后的残留文件、微信卸载后的残留文件为需要清理的文件,各待清理文件的特征数据中具有相同后缀名“.txt”文件的数量大小300个,依据判断规则清理具有相同后缀名文件的数量大小超过200个的文件,可判断各后缀名为“.txt”的文件为需要清理的文件,并输出判断结果,输出结果包括了各待清理文件对应的文件类型如系统文件或日志文件等、清理类型如一键清理或手动清理和清理建议如建议保留等信息。
确定模块330基于输出结果确定待清理文件的文件清理目录。
具体地,基于预存的判断模型的输出结果确定待清理文件的文件清理目录。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
例如,服务器将接收终端设备发送的待清理文件的特征数据输入预存的判断模型进行训练,基于训练后的输出结果中的各待清理文件对应的文件类型、清理类型和清理建议等信息,确定待清理文件的文件清理目录,如文件的描述信息为“文件名:aaa.temp,文件路径:../data/data/com.tencent.qq/databases/”,对应该文件描述信息的清理类型信息为“文本清理”、清理建议信息为“一键清理”和卸载残留信息为“非卸载残留文件”。
下发模块340将待清理文件的文件清理目录下发至相应的客户端。
具体地,将基于输出结果确定待清理文件的文件清理目录下发至发送该待清理文件特征数据的客户端。
例如,服务器将接收终端设备A的客户端发送的待清理文件的特征数据输入预存的判断模型进行训练,基于训练后的输出结果中的各待清理文件对应的文件类型、清理类型和清理建议等信息,确定待清理文件的文件清理目录,随后,将该文件清理目录下发至终端设备A该相应的客户端。
在一优选实施例中,该装置还包括获取模块350(图中未示出)、构建模块360(图中未示出)和训练模块370(图中未示出);获取模块350获取多个文件的相关信息及相应的清理方式以作为原始样本数据;构建模块360基于原始样本数据构建训练特征;训练模块370将训练特征通过预定的算法进行训练以确定判断模型。
优选地,预定的算法包括GBDT分类算法。
例如,服务器从历史数据中获取各待清理文件的相关信息,包括各待清理文件的特征数据,以及各待清理文件的清理方式,清理方式包括一键清理、手动清理和建议保留,作为原始样本数据,基于已获取的原始样本数据通过矩阵数据分析法构建训练特征,将训练特征通过GBDT分类算法进行训练以确定判断模型。
图4为本发明中再另一实施例的文件清理的客户端的结构示意图。
本发明的实施例中,各模块所执行的内容概述如下:提取模块410基于文件清理的触发操作,提取待清理文件的特征数据;发送模块420将待清理文件的特征数据发送至服务器进行训练;第二接收模块430接收服务器返回的待清理文件的文件清理目录;执行模块440根据待清理文件的文件清理目录,对待清理文件执行相应的操作。
以下针对各个模块的具体实现做进一步的说明:
提取模块410基于文件清理的触发操作,提取待清理文件的特征数据。
优选地,待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、目录下文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
例如,在客户端的终端设备中,用户点击应用程序APP提供的人机交互界面中的文件清理按钮,随后基于对文件清理按钮的点击触发操作,APP提取待清理文件的特征数据,如应用程序QQ的包名信息“com.tencent.mm”、QQ在终端设备中的根路径信息“../data/”、QQ在终端设备中的子路径信息“../data/data/com.tencent.qq/databases/”、QQ包名的标签信息“1”、QQ包名的分类信息“即时通信”、文件的后缀信息,如终端设备“../data/”目录下的文件包含的两种后缀名分别为“.temp”和“.txt”、应用程序文件的大小和应用程序文件的数量,如终端设备“../data/data/com.tencent.qq/databases/”路径下各个文件的大小信息和所有文件的总数量1000个、后缀名为“.temp”文件的总数量为500个和后缀名为“.txt”文件的总数量为100个。
发送模块420将待清理文件的特征数据发送至服务器进行训练。
例如,在客户端的终端设备A中,用户触发文件清理按钮,客户端提取待清理文件的特征数据,随后将已提取的待清理文件的特征数据发送至服务器的预存的判断模型进行训练,服务器根据输出结果确定待清理文件的文件清理目录,随后服务器将该确定待清理文件的文件清理目录下发至终端设备A的该客户端。
第二接收模块430接收服务器返回的待清理文件的文件清理目录。
优选地,文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
例如,接上例,客户端的终端设备A,接收服务器返回的的待清理文件的文件清理目录,文件清理目录中包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留,如文件的描述信息为“文件名:aaa.temp,文件路径:../data/data/com.tencent.qq/databases/”,对应该文件描述信息的清理类型信息为“文本清理”、清理建议信息为“一键清理”和卸载残留信息为“非卸载残留文件”。
执行模块440根据待清理文件的文件清理目录,对待清理文件执行相应的操作。
其中,对待清理文件执行相应的操作包括一键清理、手动清理、建议保留中的至少一项。
在一优选实施例中,执行模块440包括获取单元441(图中未示出)和一键清理单元442(图中未示出);获取单元441获取待清理文件的清理目录中清理文件的文件名称;一键清理单元442根据清理文件的文件名称,对客户端中对应文件名称的文件执行一键清理操作。
例如,客户端接收到服务器返回的的待清理文件的文件清理目录,根据待清理文件的文件清理目录中文件的描述信息为“文件名:aaa.temp,文件路径:../data/data/com.tencent.qq/databases/”对应的清理建议信息为“一键清理”,对终端设备中“../data/data/com.tencent.qq/databases/”路径下的“aaa.temp”文件执行一键清理的操作,根据待清理文件的文件清理目录中文件的描述信息为“文件名:bb.cache,文件路径:../data/data/com.tencent.qq/databases/”对应的清理建议信息为“建议保留”,对终端设备中“../data/data/com.tencent.qq/databases/”路径下的“bb.cache”文件不执行任何操作。
本技术领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随即存储器)、EPROM(Erasable ProgrammableRead-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically ErasableProgrammable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种文件的清理方法,包括:
接收客户端发送的待清理文件的特征数据;
将所述待清理文件的特征数据输入预存的判断模型以获取输出结果;
基于所述输出结果确定所述待清理文件的文件清理目录;
将所述待清理文件的文件清理目录下发至相应的客户端。
2.根据权利要求1所述的方法,还包括:
获取多个文件的相关信息及相应的清理方式以作为原始样本数据;
基于所述原始样本数据构建训练特征;
将所述训练特征通过预定的算法进行训练以确定所述判断模型;
其中,所述预定的算法包括GBDT分类算法。
3.根据权利要求1所述的方法,将所述待清理文件的特征数据输入预存的判断模型以获取输出结果,包括:
将所述待清理文件的特征数据输入预存的判断模型,依据所述判断模型中的判断规则来确定所述待清理文件中的文件是否需要清理,并作为输出结果;
其中,所述判断规则包括以下至少一项:
清理包含预定名称后缀的文件;
清理系统的日志文件;
清理应用程序卸载后的残留文件;
清理具有相同后缀名文件的数量大小超过预定阈值的文件。
4.根据权利要求1-3任一项所述的方法,所述待清理文件的特征数据包括以下至少一项:
应用程序的名称、应用程序的包名、应用程序在客户端中的根路径、子路径、应用程序包名的标签信息、应用程序包名的分类信息、文件的后缀信息、应用程序文件的大小和应用程序文件的数量。
5.根据权利要求1-4任一项所述的方法,所述文件清理目录,包括文件的描述信息、文件类型、清理类型、清理建议和卸载残留中的至少一项。
6.一种客户端文件的清理方法,包括:
基于文件清理的触发操作,提取所述待清理文件的特征数据;
将所述待清理文件的特征数据发送至服务器进行训练;
接收服务器返回的待清理文件的文件清理目录;
根据所述待清理文件的文件清理目录,对所述待清理文件执行相应的操作。
7.根据权利要求6所述的方法,其中,所述对所述待清理文件执行相应的操作包括一键清理、手动清理、建议保留中的至少一项。
8.根据权利要求7所述的方法,其中,根据所述待清理文件的清理目录,对所述文件执行相应的一键清理操作,包括:
获取所述待清理文件的清理目录中清理文件的文件名称;
根据所述清理文件的文件名称,对客户端中对应文件名称的文件执行一键清理操作。
9.一种文件的清理装置,包括:
第一接收模块,用于接收客户端发送的待清理文件的特征数据;
输入模块,用于将所述待清理文件的特征数据输入预存的判断模型以获取输出结果;
确定模块,用于基于所述输出结果确定所述待清理文件的文件清理目录;
下发模块,用于将所述待清理文件的文件清理目录下发至相应的客户端。
10.一种文件清理的客户端,包括:
提取模块,用于基于文件清理的触发操作,提取所述待清理文件的特征数据;
发送模块,用于将所述待清理文件的特征数据发送至服务器进行训练;
第二接收模块,用于接收服务器返回的待清理文件的文件清理目录;
执行模块,用于根据所述待清理文件的文件清理目录,对所述待清理文件执行相应的操作。
CN201610473996.7A 2016-06-24 2016-06-24 文件的清理方法、装置及相应的客户端 Active CN106202166B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610473996.7A CN106202166B (zh) 2016-06-24 2016-06-24 文件的清理方法、装置及相应的客户端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610473996.7A CN106202166B (zh) 2016-06-24 2016-06-24 文件的清理方法、装置及相应的客户端

Publications (2)

Publication Number Publication Date
CN106202166A true CN106202166A (zh) 2016-12-07
CN106202166B CN106202166B (zh) 2020-08-18

Family

ID=57461756

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610473996.7A Active CN106202166B (zh) 2016-06-24 2016-06-24 文件的清理方法、装置及相应的客户端

Country Status (1)

Country Link
CN (1) CN106202166B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107656743A (zh) * 2017-09-28 2018-02-02 努比亚技术有限公司 一种应用的卸载方法、终端及可读存储介质
CN107729081A (zh) * 2017-09-30 2018-02-23 广东欧珀移动通信有限公司 应用管理方法、装置、存储介质及电子设备
CN107977454A (zh) * 2017-12-15 2018-05-01 传神语联网网络科技股份有限公司 双语语料清洗的方法、装置及计算机可读存储介质
CN108108421A (zh) * 2017-12-15 2018-06-01 广东欧珀移动通信有限公司 文件管理方法、装置、存储介质及电子设备
CN108153862A (zh) * 2017-12-22 2018-06-12 联想(北京)有限公司 文件清理方法、装置和系统
CN108287860A (zh) * 2017-09-05 2018-07-17 腾讯科技(深圳)有限公司 模型生成方法、垃圾文件识别方法及装置
CN109669779A (zh) * 2018-12-25 2019-04-23 上海碳蓝网络科技有限公司 用于确定数据的清理路径、清理数据的方法和设备
CN109800206A (zh) * 2018-12-14 2019-05-24 深圳壹账通智能科技有限公司 桌面清理方法、装置、终端设备
CN110489384A (zh) * 2019-07-23 2019-11-22 广东以诺通讯有限公司 一种基于终端学习的存储空间优化方法及终端
WO2021159898A1 (zh) * 2020-02-12 2021-08-19 深圳壹账通智能科技有限公司 基于隐私保护的深度学习方法、系统、服务器及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092938A (zh) * 2013-01-07 2013-05-08 浙江鸿程计算机系统有限公司 一种智能清理Android手机SD卡垃圾文件的方法
CN103646086A (zh) * 2013-12-13 2014-03-19 北京奇虎科技有限公司 一种垃圾文件的清理方法和装置
CN104021160A (zh) * 2014-05-26 2014-09-03 北京金山安全软件有限公司 一种客户端数据清理方法和装置
CN104754002A (zh) * 2013-12-30 2015-07-01 北京金山网络科技有限公司 清理文件的方法、装置、移动终端及云端服务器

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092938A (zh) * 2013-01-07 2013-05-08 浙江鸿程计算机系统有限公司 一种智能清理Android手机SD卡垃圾文件的方法
CN103646086A (zh) * 2013-12-13 2014-03-19 北京奇虎科技有限公司 一种垃圾文件的清理方法和装置
CN104754002A (zh) * 2013-12-30 2015-07-01 北京金山网络科技有限公司 清理文件的方法、装置、移动终端及云端服务器
CN104021160A (zh) * 2014-05-26 2014-09-03 北京金山安全软件有限公司 一种客户端数据清理方法和装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108287860A (zh) * 2017-09-05 2018-07-17 腾讯科技(深圳)有限公司 模型生成方法、垃圾文件识别方法及装置
CN107656743A (zh) * 2017-09-28 2018-02-02 努比亚技术有限公司 一种应用的卸载方法、终端及可读存储介质
CN107656743B (zh) * 2017-09-28 2021-04-16 努比亚技术有限公司 一种应用的卸载方法、终端及可读存储介质
CN107729081B (zh) * 2017-09-30 2020-07-07 Oppo广东移动通信有限公司 应用管理方法、装置、存储介质及电子设备
CN107729081A (zh) * 2017-09-30 2018-02-23 广东欧珀移动通信有限公司 应用管理方法、装置、存储介质及电子设备
US11249645B2 (en) 2017-09-30 2022-02-15 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Application management method, storage medium, and electronic apparatus
CN108108421A (zh) * 2017-12-15 2018-06-01 广东欧珀移动通信有限公司 文件管理方法、装置、存储介质及电子设备
CN107977454A (zh) * 2017-12-15 2018-05-01 传神语联网网络科技股份有限公司 双语语料清洗的方法、装置及计算机可读存储介质
CN108153862A (zh) * 2017-12-22 2018-06-12 联想(北京)有限公司 文件清理方法、装置和系统
CN109800206A (zh) * 2018-12-14 2019-05-24 深圳壹账通智能科技有限公司 桌面清理方法、装置、终端设备
CN109669779A (zh) * 2018-12-25 2019-04-23 上海碳蓝网络科技有限公司 用于确定数据的清理路径、清理数据的方法和设备
CN110489384A (zh) * 2019-07-23 2019-11-22 广东以诺通讯有限公司 一种基于终端学习的存储空间优化方法及终端
WO2021159898A1 (zh) * 2020-02-12 2021-08-19 深圳壹账通智能科技有限公司 基于隐私保护的深度学习方法、系统、服务器及存储介质

Also Published As

Publication number Publication date
CN106202166B (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
CN106202166A (zh) 文件的清理方法、装置及相应的客户端
CN110874530B (zh) 关键词提取方法、装置、终端设备及存储介质
CN110490246B (zh) 垃圾类别确定方法、装置、存储介质及电子设备
CN105160548A (zh) 对广告点击率进行预测的方法及装置
CN110458296B (zh) 目标事件的标记方法和装置、存储介质及电子装置
CN105574544A (zh) 一种数据处理方法和装置
JP5948291B2 (ja) 監視情報分析装置及び方法
CN111339151B (zh) 在线考试方法、装置、设备及计算机存储介质
CN110837998A (zh) 一种合同审核方法、装置、设备以及介质
CN111882087A (zh) 设备维保处理方法、装置、计算机系统及可读存储介质
CN111861328B (zh) 建立物流识别库的方法、物流轨迹查询更新方法及设备
CN110472231B (zh) 一种识别法律文书案由的方法和装置
CN109766440B (zh) 一种用于为对象文本描述确定默认分类信息的方法及系统
CN110096478A (zh) 文档索引生成方法及设备
CN107329956B (zh) 一种项目信息标准化方法及装置
CN113535815B (zh) 适于电子商务的业务操作行为大数据挖掘方法及系统
CN108139379A (zh) 法医文件的众包自动化审查
CN102902737B (zh) 一种网络图像自主收集与筛选方法
CN108038124A (zh) 一种基于大数据的pdf文档采集处理方法、系统及装置
CN113205442A (zh) 基于区块链的电子政务数据反馈管理方法及装置
US20070219989A1 (en) Document retrieval
CN110718087B (zh) 数据融合处理方法及装置
US6879722B2 (en) Method and apparatus for statistical text filtering
CN110745419A (zh) 垃圾产生信息的管理方法、垃圾回收方法及电子设备
CN116484841B (zh) 基于自动化审核的信息校验系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200529

Address after: 100015 308, 3 / F, 102 / F, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing

Applicant after: Beijing Qihu Technology Service Co., Ltd

Address before: 100088 Beijing city Xicheng District xinjiekouwai Street 28, block D room 112 (Desheng Park)

Applicant before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Applicant before: Qizhi software (Beijing) Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant