CN110109877A - 一种文件自动分类方法、存储介质、设备及系统 - Google Patents
一种文件自动分类方法、存储介质、设备及系统 Download PDFInfo
- Publication number
- CN110109877A CN110109877A CN201810023321.1A CN201810023321A CN110109877A CN 110109877 A CN110109877 A CN 110109877A CN 201810023321 A CN201810023321 A CN 201810023321A CN 110109877 A CN110109877 A CN 110109877A
- Authority
- CN
- China
- Prior art keywords
- file
- document
- list
- name
- wait
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/70—Software maintenance or management
- G06F8/71—Version control; Configuration management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种文件自动分类方法、存储介质、设备及系统,涉及文件整理技术领域,该方法包括以下步骤:设置待整理文件夹名单以及忽略文件名单;设置文件整理列表,文件整理列表内具有多种预设的文件后缀名,每种文件后缀名对应一个目标文件夹,多个目标文件夹按依次排列;识别待整理文件夹名单中的待整理文件的后缀名,并将与预设的文件后缀名相匹配的待整理文件转移至相应的目标文件夹。本发明通过预先进行整理规则的设置,从而使得文件能够自动进行整理分类,在保护文件不丢失的前提下,使得系统的运行速度得到提高。
Description
技术领域
本发明涉及文件整理技术领域,具体涉及一种文件自动分类方法、存储介质、设备及系统。
背景技术
随着越来越多的浏览器、下载工具将用户目录的下载文件夹作为默认的文件下载目录,但若长时间未对下载文件夹进行整理的话,那么久而久之文件夹会存在较多缓存文件,当缓存文件越来越多时,后期要下载文件夹目录下找到需要的文件将会变得越来越困难,同时,如果开启了系统的文件索引,那么系统将会变得越来越卡顿。
当前对下载文件夹进行整理的方式多为用户手动进行整理,但本方式操作步骤较为繁琐,一出现文件误删的情况,从而造成了文件丢失的问题。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种文件自动分类方法、存储介质、设备及系统,通过预先进行整理规则的设置,从而使得文件能够自动进行整理分类,在保护文件不丢失的前提下,使得系统的运行速度得到提高。
为达到以上目的,本发明采取的技术方案是:
一种文件自动分类方法,包括以下步骤:
设置待整理文件夹名单以及忽略文件名单;
设置文件整理列表,所述文件整理列表内具有多种预设的文件后缀名,每种文件后缀名对应一个目标文件夹,多个所述目标文件夹按依次排列;
识别所述待整理文件夹名单中的待整理文件的后缀名,并将与预设的文件后缀名相匹配的待整理文件转移至相应的目标文件夹。
在上述技术方案的基础上,文件自动分类方法还包括以下步骤:
当所述待整理文件的后缀名与各预设的所述文件后缀名均不匹配时,则将所述待整理文件存储与所述文件整理列表中最后一个所述目标文件夹内。
在上述技术方案的基础上,文件自动分类方法还包括以下步骤:
当所述待整理文件夹中存在至少两个重名的所述待整理文件时,在将重名的各所述待整理文件转移至与同一所述目标文件夹时,在各所述待整理文件的文件名后按照转移顺序添加区别后缀;
所述区别后缀为常数,所述区别后缀的数值与各所述待整理文件的转移先后顺序相同。
在上述技术方案的基础上,文件自动分类方法还包括以下步骤:
创建一日志文件,其用于记录文件整理情况。
本发明还公开一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述文件自动分类方法的步骤。
本发明还公开一种文件自动分类设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述文件自动分类方法的步骤。
本发明还公开一种文件自动分类系统,该系统包括:
待整理文件单元,其用于设置待整理文件名单;
忽略文件单元,其用于设置忽略文件名单;
文件整理规则单元,其用于设置文件整理列表,所述文件整理列表内具有多种预设的文件后缀名,每种文件后缀名对应一个目标文件夹,多个所述目标文件夹按依次排列;
文件整理单元,其用于识别所述待整理文件夹名单中的待整理文件的后缀名,并将与预设的文件后缀名相匹配的待整理文件转移至相应的目标文件夹。
在上述技术方案的基础上,文件自动分类系统还包括:补充整理单元,其用于当所述待整理文件的后缀名与各预设的所述文件后缀名均不匹配时,将所述待整理文件存储与所述文件整理列表中最后一个所述目标文件夹内。
在上述技术方案的基础上,文件自动分类系统还包括:文件名称修正单元,其用于当所述待整理文件夹中存在至少两个重名的所述待整理文件时,在将重名的各所述待整理文件转移至与同一所述目标文件夹时,对各所述待整理文件的文件名后按照转移顺序添加区别后缀;
所述区别后缀为常数,所述区别后缀的数值与各所述待整理文件的转移先后顺序相同。
在上述技术方案的基础上,文件自动分类系统还包括:工作记录单元,其用于记录文件整理情况。
与现有技术相比,本发明的优点在于:
(1)本发明预先设置的文件整理列表,利用文件整理列表内预设的文件后缀名与目标文件夹的对应关系,多将与预设的文件后缀名相匹配的待整理文件转移至相应的目标文件夹;
与现有技术相比,本发明通过预先进行整理规则的设置,从而使得文件能够自动进行整理分类,在保护文件不丢失的前提下,使得系统的运行速度得到提高。
附图说明
图1为本发明实施例中文件自动分类方法的流程图;
图2为本发明实施例中文件自动分类设备的结构框图;
图3为本发明实施例中文件自动分类系统的结构框图。
具体实施方式
以下结合附图对本发明的实施例作进一步详细说明。
参见图1所示,本发明实施例提供一种文件自动分类方法,包括以下步骤:
S1、设置待整理文件夹名单以及忽略文件名单;
S2、设置文件整理列表,文件整理列表内具有多种预设的文件后缀名,每种文件后缀名对应一个目标文件夹,多个目标文件夹按依次排列;
S3、识别待整理文件夹名单中的待整理文件的后缀名,并将与预设的文件后缀名相匹配的待整理文件转移至相应的目标文件夹。
本发明中,待整理文件夹名单用于列出所有需要进行整理的文件,而忽略文件名单则用于列出不需要进行整理的文件;
设置文件整理列表内存在多个预设的文件后缀名,而每种与预设的文件后缀名均对应一个目标文件夹,该目标文件夹用于存储与预设的文件后缀名对应的待整理文件;
通过预先进行整理规则的设置,从而使得文件能够自动进行整理分类,在保护文件不丢失的前提下,使得系统的运行速度得到提高。
需要说明的是,在设置待整理文件夹名单以及忽略文件名单时,具体的实施方式可以是:
配置一个JSON格式的文本文件,在该文件中,包括include_patterns,exclude_patterns以及extension_patterns,其中include_patterns为一系列需要被处理的文件模式,即待整理文件夹名单,exclude_patterns,为一系列需要被排除操作的文件模式,即忽略文件名单,这些文件模式可以是后缀名也可以是文件名中的关键字等,extension_patterns则为文件的后缀名到相关文件类型的对象映射关系,即上述实施例中预设的文件后缀名与目标文件夹的对应关系;
通过灵活的文本文件来自定义工具的运行逻辑,可以让工具满足更多的需求,使用起来也更加的广泛和便利;
同时,采用JSON格式的文本文件来存储配置信息,是因为JSON格式使用更为普遍和广泛,方便用户进行使用。
进一步地,后续的处理工作包括:
在程序运行之后,首先会将include_patterns,exclude_patterns,extension_patterns存储到合适的变量中进行存储,然后会创建合适数量的线程然后将include_patterns中的文件目录根据线程的数量进行划分,通过每个线程分别处理一定数量的目录。
由于遍历文件操作需要占用计算机大量的I/O资源,而当include_patterns中的目录过多的时候,单线程的处理显然会导致低效,而运用多线程对目录进行处理,一方面可以充分利用现代计算机多CPU的优势,同时由于处理任务的线程与UI线程独立,因此也不会给用户带来程序假死的体验。
另外,在工作线程中,线程首先会调用assort这个入口函数,在入口函数中,assort首先会调用list_dir对当前的目录里边的文件进行遍历,在获得了一个文件名之后,程序首先会提取文件的扩展名例如:work.pdf这个文件经过提取扩展名变成了pdf,然后对应的函数会在extension_patterns查找当前的扩展名是否存在着对应的映射关系,如果存在,那么最终的目标目录就是映射的值。
本实施例中,文件自动分类方法还包括以下步骤:
当待整理文件的后缀名与各预设的文件后缀名均不匹配时,则将待整理文件存储与文件整理列表中最后一个目标文件夹内。
本实施例中,文件自动分类方法还包括以下步骤:
当待整理文件夹中存在至少两个重名的待整理文件时,在将重名的各待整理文件转移至与同一目标文件夹时,在各待整理文件的文件名后按照转移顺序添加区别后缀;
区别后缀为常数,区别后缀的数值与各待整理文件的转移先后顺序相同;
其中,在获得了文件应该被整理到的目标目录之后,工作线程首先会调用check_folder_exists函数判断目标目录是否存在,如果不存在则创建对应的目录,在检查了目录的存在性之后,工作线程接着会检查对应的目录是否存在着同名的文件,如果存在,则对正在被处理的文件名进行处理(在文件名后边添加(index))这样的后缀,其中index为1,2,3...n,这样防止多个同名文件的存在,在判断了所有可能存在的状况之后,工具会将文件移动到对应的目录,完成文件的整理。
本实施例中,文件自动分类方法还包括以下步骤:
创建一日志文件,其用于记录文件整理情况。
一种存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述文件自动分类方法的步骤。
参见图2所示,本发明实施例提供一种文件自动分类设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,处理器执行计算机程序时实现上述文件自动分类方法的步骤。
参见图3所示,本发明实施例提供一种文件自动分类系统,该系统包括:
待整理文件单元,其用于设置待整理文件名单;
忽略文件单元,其用于设置忽略文件名单;
文件整理规则单元,其用于设置文件整理列表,文件整理列表内具有多种预设的文件后缀名,每种文件后缀名对应一个目标文件夹,多个目标文件夹按依次排列;
文件整理单元,其用于识别待整理文件夹名单中的待整理文件的后缀名,并将与预设的文件后缀名相匹配的待整理文件转移至相应的目标文件夹。
本实施例中,文件自动分类系统还包括:
补充整理单元,其用于当待整理文件的后缀名与各预设的文件后缀名均不匹配时,将待整理文件存储与文件整理列表中最后一个目标文件夹内。
本实施例中,文件自动分类系统中:
文件名称修正单元,其用于当待整理文件夹中存在至少两个重名的待整理文件时,在将重名的各待整理文件转移至与同一目标文件夹时,对各待整理文件的文件名后按照转移顺序添加区别后缀;
区别后缀为常数,区别后缀的数值与各待整理文件的转移先后顺序相同。
本实施例中,文件自动分类系统还包括:工作记录单元,其用于记录文件整理情况。
需要说明的是:上述实施例提供的系统在实现文件自动分类操作时,仅以上述各功能模块的划分进行举例说明,实际应用中,可根据需要而将上述功能分配由不同功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
本发明不局限于上述实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (10)
1.一种文件自动分类方法,其特征在于,该方法包括以下步骤:
设置待整理文件夹名单以及忽略文件名单;
设置文件整理列表,所述文件整理列表内具有多种预设的文件后缀名,每种文件后缀名对应一个目标文件夹,多个所述目标文件夹按依次排列;
识别所述待整理文件夹名单中的待整理文件的后缀名,并将与预设的文件后缀名相匹配的待整理文件转移至相应的目标文件夹。
2.如权利要求1所述的文件自动分类方法,其特征在于,该方法还包括以下步骤:
当所述待整理文件的后缀名与各预设的所述文件后缀名均不匹配时,则将所述待整理文件存储与所述文件整理列表中最后一个所述目标文件夹内。
3.如权利要求1所述的文件自动分类方法,其特征在于,该方法还包括以下步骤:
当所述待整理文件夹中存在至少两个重名的所述待整理文件时,在将重名的各所述待整理文件转移至与同一所述目标文件夹时,在各所述待整理文件的文件名后按照转移顺序添加区别后缀;
所述区别后缀为常数,所述区别后缀的数值与各所述待整理文件的转移先后顺序相同。
4.如权利要求1所述的文件自动分类方法,其特征在于,该方法还包括以下步骤:
创建一日志文件,其用于记录文件整理情况。
5.一种存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现上述权利要求1至4中任一项所述方法的步骤。
6.一种文件自动分类设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现上述权利要求1至4中任一项所述方法的步骤。
7.一种文件自动分类系统,其特征在于,该系统包括:
待整理文件单元,其用于设置待整理文件名单;
忽略文件单元,其用于设置忽略文件名单;
文件整理规则单元,其用于设置文件整理列表,所述文件整理列表内具有多种预设的文件后缀名,每种文件后缀名对应一个目标文件夹,多个所述目标文件夹按依次排列;
文件整理单元,其用于识别所述待整理文件夹名单中的待整理文件的后缀名,并将与预设的文件后缀名相匹配的待整理文件转移至相应的目标文件夹。
8.如权利要求7所述的文件自动分类系统,其特征在于,该系统还包括:
补充整理单元,其用于当所述待整理文件的后缀名与各预设的所述文件后缀名均不匹配时,将所述待整理文件存储与所述文件整理列表中最后一个所述目标文件夹内。
9.如权利要求7所述的文件自动分类系统,其特征在于,该系统还包括:
文件名称修正单元,其用于当所述待整理文件夹中存在至少两个重名的所述待整理文件时,在将重名的各所述待整理文件转移至与同一所述目标文件夹时,对各所述待整理文件的文件名后按照转移顺序添加区别后缀;
所述区别后缀为常数,所述区别后缀的数值与各所述待整理文件的转移先后顺序相同。
10.如权利要求7所述的文件自动分类系统,其特征在于,该系统还包括:工作记录单元,其用于记录文件整理情况。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810023321.1A CN110109877A (zh) | 2018-01-10 | 2018-01-10 | 一种文件自动分类方法、存储介质、设备及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810023321.1A CN110109877A (zh) | 2018-01-10 | 2018-01-10 | 一种文件自动分类方法、存储介质、设备及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110109877A true CN110109877A (zh) | 2019-08-09 |
Family
ID=67483047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810023321.1A Pending CN110109877A (zh) | 2018-01-10 | 2018-01-10 | 一种文件自动分类方法、存储介质、设备及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110109877A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488731A (zh) * | 2020-04-15 | 2020-08-04 | 深圳前海环融联易信息科技服务有限公司 | 文件生成方法、装置、计算机设备以及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110055157A1 (en) * | 2009-08-31 | 2011-03-03 | Hong Fu Jin Precision Industry (Shenzhen) Co., Ltd. | System, apparatus, and method with automatic file copying function |
CN102622384A (zh) * | 2011-06-14 | 2012-08-01 | 北京小米科技有限责任公司 | 一种文件管理的方法 |
CN103823899A (zh) * | 2014-03-17 | 2014-05-28 | 广东欧珀移动通信有限公司 | 一种自动整理文件的方法及移动终端 |
CN105701195A (zh) * | 2016-01-12 | 2016-06-22 | 深圳市创维电器科技有限公司 | 一种根据文件类型自动分类存储的实现方法及系统 |
-
2018
- 2018-01-10 CN CN201810023321.1A patent/CN110109877A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110055157A1 (en) * | 2009-08-31 | 2011-03-03 | Hong Fu Jin Precision Industry (Shenzhen) Co., Ltd. | System, apparatus, and method with automatic file copying function |
CN102622384A (zh) * | 2011-06-14 | 2012-08-01 | 北京小米科技有限责任公司 | 一种文件管理的方法 |
CN103823899A (zh) * | 2014-03-17 | 2014-05-28 | 广东欧珀移动通信有限公司 | 一种自动整理文件的方法及移动终端 |
CN105701195A (zh) * | 2016-01-12 | 2016-06-22 | 深圳市创维电器科技有限公司 | 一种根据文件类型自动分类存储的实现方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488731A (zh) * | 2020-04-15 | 2020-08-04 | 深圳前海环融联易信息科技服务有限公司 | 文件生成方法、装置、计算机设备以及存储介质 |
CN111488731B (zh) * | 2020-04-15 | 2023-09-29 | 深圳前海环融联易信息科技服务有限公司 | 文件生成方法、装置、计算机设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8996592B2 (en) | Methods, systems, and computer program products for identifying a container associated with a plurality of files | |
US7930288B2 (en) | Knowledge extraction for automatic ontology maintenance | |
US8938474B2 (en) | Securing application information in system-wide search engines | |
CN103425672B (zh) | 一种数据库索引的建立方法及装置 | |
US20150120695A1 (en) | Indexing of file in a hadoop cluster | |
RU2619195C2 (ru) | Способ и устройство для нахождения файла в устройстве хранения и маршрутизатор | |
US20160132536A1 (en) | Unified data object management system and the method | |
CN107291949B (zh) | 信息搜索方法及装置 | |
CN101976259A (zh) | 一种推荐系列文档的方法和装置 | |
CN105893010A (zh) | 用于容器部署的主机调度方法及系统 | |
CN103631623A (zh) | 一种集群系统中部署应用软件的方法及装置 | |
CN103473076A (zh) | 一种代码版本的发布方法及系统 | |
CN106021390A (zh) | 一种文件的管理方法和装置 | |
CN110109877A (zh) | 一种文件自动分类方法、存储介质、设备及系统 | |
CN107085613A (zh) | 入库文件的过滤方法和装置 | |
CN109947759A (zh) | 一种数据索引建立方法、索引检索方法及装置 | |
CN107273401A (zh) | 应用程序数据文件的管理方法、移动设备及存储装置 | |
Priyadarshini et al. | Semantic retrieval of relevant sources for large scale virtual documents | |
Kaur et al. | Image processing on multinode hadoop cluster | |
CN103853832A (zh) | 一种全文检索系统中可定制的数据抓取方法 | |
CN112463596B (zh) | 测试用例数据的处理方法、装置、设备以及处理设备 | |
CN112784135A (zh) | 一种网页信息识别系统 | |
US20140208057A1 (en) | Storage card partition system and method | |
JPH07121413A (ja) | ファイル管理装置 | |
CN106372089B (zh) | 确定词语位置的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190809 |