CN108009204A - 基于扩展名分类并去冗余的方法及系统 - Google Patents

基于扩展名分类并去冗余的方法及系统 Download PDF

Info

Publication number
CN108009204A
CN108009204A CN201711061075.0A CN201711061075A CN108009204A CN 108009204 A CN108009204 A CN 108009204A CN 201711061075 A CN201711061075 A CN 201711061075A CN 108009204 A CN108009204 A CN 108009204A
Authority
CN
China
Prior art keywords
file type
file
operating frequency
type
files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711061075.0A
Other languages
English (en)
Inventor
朱世伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Onething Technology Co Ltd
Original Assignee
Shenzhen Onething Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Onething Technology Co Ltd filed Critical Shenzhen Onething Technology Co Ltd
Priority to CN201711061075.0A priority Critical patent/CN108009204A/zh
Publication of CN108009204A publication Critical patent/CN108009204A/zh
Priority to PCT/CN2018/101272 priority patent/WO2019085591A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/162Delete operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及计算机信息技术领域,公开了一种基于扩展名分类并去冗余的方法及系统。所述基于扩展名分类并去冗余的方法,包括:扫描磁盘数据以获取全部文件的拓展名;分析获取的全部文件的拓展名以获取全部文件的文件类型;根据获取的全部文件的文件类型对全部文件进行分类;根据文件操作历史分析常用文件类型和极少使用文件类型;以及删除分析出的极少使用文件类型的文件。本发明的技术方案,提升了磁盘文件分类查询的便捷性和工作效率,并方便快捷地实现了磁盘存储数据的无用数据的去冗余操作,提高了磁盘去冗余的便捷性和工作效率,节省了磁盘存储空间并提升了磁盘存储空间利用率。

Description

基于扩展名分类并去冗余的方法及系统
技术领域
本发明涉及计算机信息技术领域,尤其涉及一种基于扩展名分类并去冗余的方法及系统。
背景技术
现有计算设备磁盘存储有大量系统文件和应用APP文件,并且随着使用时间的增加磁盘数据越来越庞大,占用大量磁盘空间且影响系统性能。现有磁盘对应文件的查询分类管理通常是通过磁盘目录进行的,需要用户熟悉磁盘目录和文件名称,文件查询分类操作繁琐耗时,且通过删除预设特定磁盘目录下文件的数据去冗余方式操作同样繁琐耗时,导致现有磁盘文件分类查询和去冗余的便捷性、工作效率和用户体验不佳。
发明内容
鉴于此,本发明提供一种基于扩展名分类并去冗余的方法及系统,解决现有磁盘基于磁盘目录的文件分类查询和去冗余操作的便捷性、工作效率和用户体验不佳的技术问题。
根据本发明的一个实施例,提供一种基于扩展名分类并去冗余的方法,包括:扫描磁盘数据以获取全部文件的拓展名;分析获取的全部文件的拓展名以获取全部文件的文件类型;根据获取的全部文件的文件类型对全部文件进行分类;根据文件操作历史分析常用文件类型和极少使用文件类型;以及删除分析出的极少使用文件类型的文件。
优选的,所述根据文件操作历史分析常用文件类型和极少使用文件类型,包括:调取磁盘的文件操作历史;分析调取的磁盘的文件操作历史中全部使用文件类型的操作频率;对分析的全部使用文件类型的操作频率进行排序;以及根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型。
优选的,所述根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型,包括:将排序的全部使用文件类型的操作频率中排序最高预设个数的文件类型确定为常用文件类型;以及将排序的全部使用文件类型的操作频率中排序最低预设个数的文件类型确定为极少使用文件类型。
优选的,所述根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型,包括:将排序的全部使用文件类型的操作频率中排序最高预设比例的文件类型确定为常用文件类型;以及将排序的全部使用文件类型的操作频率中排序最低预设比例的文件类型确定为极少使用文件类型。
优选的,所述根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型,包括:将排序的全部使用文件类型的操作频率中高于预设频率的文件类型确定为常用文件类型;以及将排序的全部使用文件类型的操作频率中低于预设频率的文件类型确定为极少使用文件类型。
根据本发明的另一个实施例,还提供一种基于扩展名分类并去冗余的系统,包括:磁盘扫描模块,用于扫描磁盘数据以获取全部文件的拓展名;文件类型分析模块,用于分析所述磁盘扫描模块获取的全部文件的拓展名以获取全部文件的文件类型;文件分类模块,用于根据所述文件类型分析模块获取的全部文件的文件类型对全部文件进行分类;文件使用分析模块,用于根据文件操作历史分析常用文件类型和极少使用文件类型;以及文件删除模块,用于删除所述文件使用分析模块分析出的极少使用文件类型的文件。
优选的,所述文件使用分析模块包括:文件操作历史调取单元,用于调取磁盘的文件操作历史;文件类型操作频率分析单元,用于分析所述文件操作历史调取单元调取的磁盘的文件操作历史中全部使用文件类型的操作频率;文件类型操作频率排序单元,用于对所述文件类型操作频率分析单元分析的全部使用文件类型的操作频率进行排序;以及文件类型使用频率确定单元,用于根据所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型。
优选的,所述文件类型使用频率确定单元包括:第一确定子单元,用于将所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率中排序最高预设个数的文件类型确定为常用文件类型;以及第二确定子单元,用于将所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率中排序最低预设个数的文件类型确定为极少使用文件类型。
优选的,所述文件类型使用频率确定单元包括:第三确定子单元,用于将所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率中排序最高预设比例的文件类型确定为常用文件类型;以及第四确定子单元,用于将所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率中排序最低预设比例的文件类型确定为极少使用文件类型。
优选的,所述文件类型使用频率确定单元包括:第五确定子单元,用于将所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率中高于预设频率的文件类型确定为常用文件类型;以及第六确定子单元,用于将所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率中低于预设频率的文件类型确定为极少使用文件类型。
本发明提供的基于扩展名分类并去冗余的方法及系统,扫描磁盘数据以获取全部文件的拓展名,分析获取的全部文件的拓展名以获取全部文件的文件类型,根据获取的全部文件的文件类型对全部文件进行分类,用户可根据分类类别快速查询到需要的文件,提升了磁盘文件分类查询的便捷性和工作效率,根据文件操作历史分析常用文件类型和极少使用文件类型,并删除分析出的极少使用文件类型的文件,通过提取和删除极少使用的文件类型的文件,方便快捷地实现了磁盘存储数据的无用数据的去冗余操作,提高了磁盘去冗余的便捷性和工作效率,节省了磁盘存储空间,提升了磁盘存储空间利用率和磁盘使用的用户体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例中基于扩展名分类并去冗余的方法的流程示意图。
图2为本发明一个实施例中分析常用文件类型和极少使用文件类型的流程示意图。
图3为本发明一个实施例中确定常用文件类型和极少使用文件类型的流程示意图。
图4为本发明另一个实施例中确定常用文件类型和极少使用文件类型的流程示意图。
图5为本发明又一个实施例中确定常用文件类型和极少使用文件类型的流程示意图。
图6为本发明一个实施例中基于扩展名分类并去冗余的系统的结构示意图。
图7为本发明一个实施例中文件使用分析模块的结构示意图。
图8为本发明一个实施例中文件类型使用频率确定单元的结构示意图。
图9为本发明另一个实施例中文件类型使用频率确定单元的结构示意图。
图10为本发明又一个实施例中文件类型使用频率确定单元的结构示意图。
具体实施方式
下面结合附图和具体实施方式对本发明的技术方案作进一步更详细的描述。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以结合具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
图1为本发明一个实施例中基于扩展名分类并去冗余的方法的流程示意图。如图所示,所述基于扩展名分类并去冗余的方法,包括:
步骤S101:扫描磁盘数据以获取全部文件的拓展名。
在本实施例中,所述磁盘设置在计算设备或智能硬件内且与芯片电气连接,其内置有Windows或IOS操作系统,并可安装各种计算机应用APP。随着系统和各个计算机应用的使用,所述磁盘内会产生越来越多的数据比如系统文件、应用数据文件等,在需要对磁盘数据进行分类和去冗余时,可通过磁盘扫描进程扫描全部磁盘数据,获取全部文件的拓展名,比如“.docx”、“.sys”、“.jpg”、“.xls”、“.dwg”等。
步骤S102:分析获取的全部文件的拓展名以获取全部文件的文件类型。
在获取到全部文件的拓展名后,根据安装的各种应用文件类型的预设拓展名配置分析获取的全部文件的拓展名以获取全部文件的文件类型,比如分析拓展名“.docx”为文档文件、拓展名“.sys”为系统文件、拓展名“.jpg”为图片文件、拓展名“.xls”为表格问文件、拓展名“.dwg”为制图文件等。
步骤S103:根据获取的全部文件的文件类型对全部文件进行分类。
在获取到全部文件的文件类型后,根据获取的全部文件的文件类型对全部文件进行分类,即根据文件拓展名将全部文件按照文件类型进行快速分类,用户可根据分类类别快速查询到需要的文件,提升了磁盘文件分类查询的便捷性和工作效率。
步骤S104:根据文件操作历史分析常用文件类型和极少使用文件类型。
在对全部文件进行分类后,根据文件操作历史分析常用文件类型和极少使用文件类型。参见图2,所述分析常用文件类型和极少使用文件类型,包括:
步骤S201:调取磁盘的文件操作历史。
步骤S202:分析调取的磁盘的文件操作历史中全部使用文件类型的操作频率。
步骤S203:对分析的全部使用文件类型的操作频率进行排序。
步骤S204:根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型。
在本实施例中,首先调取磁盘的文件操作历史记录比如文件的新建、编辑、修改、复制等操作记录,进一步分析调取的磁盘的文件操作历史中全部使用文件类型的操作频率比如全部文件类型的年或月操作频率,然后对分析的全部使用文件类型的操作频率进行排序,最后根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型,将操作频率较高的文件类型确定为常用文件类型,将操作频率较低的文件类型确定为极少使用文件类型,根据文件类型的使用频率对磁盘进行分类。
参见图3,在本实施例中,所述根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型,包括:
步骤S301:将排序的全部使用文件类型的操作频率中排序最高预设个数的文件类型确定为常用文件类型。
步骤S302:将排序的全部使用文件类型的操作频率中排序最低预设个数的文件类型确定为极少使用文件类型。
在本实施例中,将排序的全部使用文件类型的操作频率中排序最高预设个数的文件类型确定为常用文件类型,将排序的全部使用文件类型的操作频率中排序最低预设个数的文件类型确定为极少使用文件类型,即将排序最高和最低的预设个数的文件类型分别确定为常用文件类型和极少使用文件类型。
参见图4,在另一个实施例中,所述根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型,包括:
步骤S401:将排序的全部使用文件类型的操作频率中排序最高预设比例的文件类型确定为常用文件类型。
步骤S402:将排序的全部使用文件类型的操作频率中排序最低预设比例的文件类型确定为极少使用文件类型。
在本实施例中,将排序的全部使用文件类型的操作频率中排序最高预设比例的文件类型确定为常用文件类型,将排序的全部使用文件类型的操作频率中排序最低预设比例的文件类型确定为极少使用文件类型,即将排序最高和最低的预设比例的文件类型分别确定为常用文件类型和极少使用文件类型。
参见图5,在又一个实施例中,所述根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型,包括:
步骤S501:将排序的全部使用文件类型的操作频率中高于预设频率的文件类型确定为常用文件类型。
步骤S502:将排序的全部使用文件类型的操作频率中低于预设频率的文件类型确定为极少使用文件类型。
在本实施例中,将排序的全部使用文件类型的操作频率中高于预设频率的文件类型确定为常用文件类型,将排序的全部使用文件类型的操作频率中低于预设频率的文件类型确定为极少使用文件类型,即将排序高于预设频率和低于预设频率的文件类型分别确定为常用文件类型和极少使用文件类型。
步骤S105:删除分析出的极少使用文件类型的文件。
在分析出极少使用的文件类型后,将分析出的极少使用文件类型的文件从所述磁盘中删除,通过提取和删除极少使用的文件类型的文件,方便快捷地实现了磁盘存储数据的无用数据的去冗余操作,节省了磁盘存储空间,提高了磁盘存储空间利用率,提升了磁盘去冗余的便捷性和工作效率。
在本实施例的基于扩展名分类并去冗余的方法中,扫描磁盘数据以获取全部文件的拓展名,分析获取的全部文件的拓展名以获取全部文件的文件类型,根据获取的全部文件的文件类型对全部文件进行分类,用户可根据分类类别快速查询到需要的文件,提升了磁盘文件分类查询的便捷性和工作效率,根据文件操作历史分析常用文件类型和极少使用文件类型,并删除分析出的极少使用文件类型的文件,通过提取和删除极少使用的文件类型的文件,方便快捷地实现了磁盘存储数据的无用数据的去冗余操作,提高了磁盘去冗余的便捷性和工作效率,节省了磁盘存储空间,提升了磁盘存储空间利用率和磁盘使用的用户体验。
参见图6,在上述方法实施例的基础上,本发明另一个实施例提供一种基于扩展名分类并去冗余的系统100,包括磁盘扫描模10、文件类型分析模块20、文件分类模块30、文件使用分析模块40和文件删除模块50。
在本实施例中,所述磁盘设置在计算设备或智能硬件内且与芯片电气连接,其内置有Windows或IOS操作系统,并可安装各种计算机应用APP。随着系统和各个计算机应用的使用,所述磁盘内会产生越来越多的数据比如系统文件、应用数据文件等,在需要对磁盘数据进行分类和去冗余时,所述磁盘扫描模10通过磁盘扫描进程扫描全部磁盘数据,获取全部文件的拓展名,比如“.docx”、“.sys”、“.jpg”、“.xls”、“.dwg”等。
在所述磁盘扫描模10获取到全部文件的拓展名后,所述文件类型分析模块20根据安装的各种应用文件类型的预设拓展名配置分析所述磁盘扫描模10获取的全部文件的拓展名以获取全部文件的文件类型,比如分析拓展名“.docx”为文档文件、拓展名“.sys”为系统文件、拓展名“.jpg”为图片文件、拓展名“.xls”为表格问文件、拓展名“.dwg”为制图文件等。
在所述文件类型分析模块20获取到全部文件的文件类型后,所述文件分类模块30根据所述文件类型分析模块20获取的全部文件的文件类型对全部文件进行分类,即根据文件拓展名将全部文件按照文件类型进行快速分类,用户可根据分类类别快速查询到需要的文件,提升了磁盘文件分类查询的便捷性和工作效率。
在所述文件分类模块30对全部文件进行分类后,所述文件使用分析模块40根据文件操作历史分析常用文件类型和极少使用文件类型。参见图7,所述文件使用分析模块40包括文件操作历史调取单元401、文件类型操作频率分析单元402、文件类型操作频率排序单元403和文件类型使用频率确定单元404。
在本实施例中,所述文件操作历史调取单元401调取磁盘的文件操作历史记录比如文件的新建、编辑、修改、复制等操作记录,所述文件类型操作频率分析单元402进一步分析所述文件操作历史调取单元401调取的磁盘的文件操作历史中全部使用文件类型的操作频率比如全部文件类型的年或月操作频率,所述文件类型操作频率排序单元403对所述文件类型操作频率分析单元402分析的全部使用文件类型的操作频率进行排序,所述文件类型使用频率确定单元404根据所述文件类型操作频率排序单元403排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型,将操作频率较高的文件类型确定为常用文件类型,将操作频率较低的文件类型确定为极少使用文件类型,根据文件类型的使用频率对磁盘进行分类。
参见图8,在本实施例中,所述文件类型使用频率确定单元404包括第一确定子单元4041和第二确定子单元4042。
在本实施例中,所述第一确定子单元4041将所述文件类型操作频率排序单元403排序的全部使用文件类型的操作频率中排序最高预设个数的文件类型确定为常用文件类型,所述第二确定子单元4042将所述文件类型操作频率排序单元403排序的全部使用文件类型的操作频率中排序最低预设个数的文件类型确定为极少使用文件类型,即将所述文件类型操作频率排序单元403排序最高和最低的预设个数的文件类型分别确定为常用文件类型和极少使用文件类型。
参见图9,在另一个实施例中,所述文件类型使用频率确定单元404包括第三确定子单元4043和第四确定子单元4044。
在本实施例中,所述第三确定子单元4043将所述文件类型操作频率排序单元403排序的全部使用文件类型的操作频率中排序最高预设比例的文件类型确定为常用文件类型,所述第四确定子单元4044将所述文件类型操作频率排序单元403排序的全部使用文件类型的操作频率中排序最低预设比例的文件类型确定为极少使用文件类型,即将所述文件类型操作频率排序单元403排序最高和最低的预设比例的文件类型分别确定为常用文件类型和极少使用文件类型。
参见图10,在又一个实施例中,所述文件类型使用频率确定单元404包括第五确定子单元4045和第六确定子单元4046。
在本实施例中,所述第五确定子单元4045将所述文件类型操作频率排序单元403排序的全部使用文件类型的操作频率中高于预设频率的文件类型确定为常用文件类型,所述第六确定子单元4046将所述文件类型操作频率排序单元403排序的全部使用文件类型的操作频率中低于预设频率的文件类型确定为极少使用文件类型,即将所述文件类型操作频率排序单元403排序高于预设频率和低于预设频率的文件类型分别确定为常用文件类型和极少使用文件类型。
在所述文件使用分析模块40分析出极少使用的文件类型后,所述文件删除模块50将所述文件使用分析模块40分析出的极少使用文件类型的文件从所述磁盘中删除,通过提取和删除极少使用的文件类型的文件,方便快捷地实现了磁盘存储数据的无用数据的去冗余操作,节省了磁盘存储空间,提高了磁盘存储空间利用率,提升了磁盘去冗余的便捷性和工作效率。
在本实施例的基于扩展名分类并去冗余的系统100中,磁盘扫描模10扫描磁盘数据以获取全部文件的拓展名,文件类型分析模块20分析磁盘扫描模10获取的全部文件的拓展名以获取全部文件的文件类型,文件分类模块30根据文件类型分析模块20获取的全部文件的文件类型对全部文件进行分类,用户可根据分类类别快速查询到需要的文件,提升了磁盘文件分类查询的便捷性和工作效率,文件使用分析模块40根据文件操作历史分析常用文件类型和极少使用文件类型,文件删除模块50删除文件使用分析模块40分析出的极少使用文件类型的文件,通过提取和删除极少使用的文件类型的文件,方便快捷地实现了磁盘存储数据的无用数据的去冗余操作,提高了磁盘去冗余的便捷性和工作效率,节省了磁盘存储空间,提升了磁盘存储空间利用率和磁盘使用的用户体验。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (10)

1.一种基于扩展名分类并去冗余的方法,其特征在于,包括:
扫描磁盘数据以获取全部文件的拓展名;
分析获取的全部文件的拓展名以获取全部文件的文件类型;
根据获取的全部文件的文件类型对全部文件进行分类;
根据文件操作历史分析常用文件类型和极少使用文件类型;以及
删除分析出的极少使用文件类型的文件。
2.根据权利要求1所述的基于扩展名分类并去冗余的方法,其特征在于,所述根据文件操作历史分析常用文件类型和极少使用文件类型,包括:
调取磁盘的文件操作历史;
分析调取的磁盘的文件操作历史中全部使用文件类型的操作频率;
对分析的全部使用文件类型的操作频率进行排序;以及
根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型。
3.根据权利要求2所述的基于扩展名分类并去冗余的方法,其特征在于,所述根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型,包括:
将排序的全部使用文件类型的操作频率中排序最高预设个数的文件类型确定为常用文件类型;以及
将排序的全部使用文件类型的操作频率中排序最低预设个数的文件类型确定为极少使用文件类型。
4.根据权利要求2所述的基于扩展名分类并去冗余的方法,其特征在于,所述根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型,包括:
将排序的全部使用文件类型的操作频率中排序最高预设比例的文件类型确定为常用文件类型;以及
将排序的全部使用文件类型的操作频率中排序最低预设比例的文件类型确定为极少使用文件类型。
5.根据权利要求2所述的基于扩展名分类并去冗余的方法,其特征在于,所述根据排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型,包括:
将排序的全部使用文件类型的操作频率中高于预设频率的文件类型确定为常用文件类型;以及
将排序的全部使用文件类型的操作频率中低于预设频率的文件类型确定为极少使用文件类型。
6.一种基于扩展名分类并去冗余的系统,其特征在于,包括:
磁盘扫描模块,用于扫描磁盘数据以获取全部文件的拓展名;
文件类型分析模块,用于分析所述磁盘扫描模块获取的全部文件的拓展名以获取全部文件的文件类型;
文件分类模块,用于根据所述文件类型分析模块获取的全部文件的文件类型对全部文件进行分类;
文件使用分析模块,用于根据文件操作历史分析常用文件类型和极少使用文件类型;以及
文件删除模块,用于删除所述文件使用分析模块分析出的极少使用文件类型的文件。
7.根据权利要求6所述的基于扩展名分类并去冗余的系统,其特征在于,所述文件使用分析模块包括:
文件操作历史调取单元,用于调取磁盘的文件操作历史;
文件类型操作频率分析单元,用于分析所述文件操作历史调取单元调取的磁盘的文件操作历史中全部使用文件类型的操作频率;
文件类型操作频率排序单元,用于对所述文件类型操作频率分析单元分析的全部使用文件类型的操作频率进行排序;以及
文件类型使用频率确定单元,用于根据所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率确定常用文件类型和极少使用文件类型。
8.根据权利要求7所述的基于扩展名分类并去冗余的系统,其特征在于,所述文件类型使用频率确定单元包括:
第一确定子单元,用于将所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率中排序最高预设个数的文件类型确定为常用文件类型;以及
第二确定子单元,用于将所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率中排序最低预设个数的文件类型确定为极少使用文件类型。
9.根据权利要求7所述的基于扩展名分类并去冗余的系统,其特征在于,所述文件类型使用频率确定单元包括:
第三确定子单元,用于将所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率中排序最高预设比例的文件类型确定为常用文件类型;以及
第四确定子单元,用于将所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率中排序最低预设比例的文件类型确定为极少使用文件类型。
10.根据权利要求7所述的基于扩展名分类并去冗余的系统,其特征在于,所述文件类型使用频率确定单元包括:
第五确定子单元,用于将所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率中高于预设频率的文件类型确定为常用文件类型;以及
第六确定子单元,用于将所述文件类型操作频率排序单元排序的全部使用文件类型的操作频率中低于预设频率的文件类型确定为极少使用文件类型。
CN201711061075.0A 2017-11-02 2017-11-02 基于扩展名分类并去冗余的方法及系统 Pending CN108009204A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201711061075.0A CN108009204A (zh) 2017-11-02 2017-11-02 基于扩展名分类并去冗余的方法及系统
PCT/CN2018/101272 WO2019085591A1 (zh) 2017-11-02 2018-08-20 智能硬件设备、磁盘数据智能处理方法和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711061075.0A CN108009204A (zh) 2017-11-02 2017-11-02 基于扩展名分类并去冗余的方法及系统

Publications (1)

Publication Number Publication Date
CN108009204A true CN108009204A (zh) 2018-05-08

Family

ID=62052193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711061075.0A Pending CN108009204A (zh) 2017-11-02 2017-11-02 基于扩展名分类并去冗余的方法及系统

Country Status (2)

Country Link
CN (1) CN108009204A (zh)
WO (1) WO2019085591A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019085591A1 (zh) * 2017-11-02 2019-05-09 深圳市网心科技有限公司 智能硬件设备、磁盘数据智能处理方法和存储介质
CN111143849A (zh) * 2019-12-31 2020-05-12 奇安信科技集团股份有限公司 应用于电子设备的文件类型识别方法和装置、电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1360267A (zh) * 2002-01-30 2002-07-24 北京大学 文件分类查找方法
CN101599986A (zh) * 2008-06-02 2009-12-09 宏碁股份有限公司 加速文件传输速度的方法及计算机系统
CN103646072A (zh) * 2013-12-10 2014-03-19 河南博仕达通信技术有限公司 文件自动分类方法及移动终端
CN104978369A (zh) * 2014-04-14 2015-10-14 腾讯科技(深圳)有限公司 一种文件查找方法和装置
CN106101271A (zh) * 2016-08-08 2016-11-09 北京小米移动软件有限公司 优化存储空间的方法及装置
WO2016197706A1 (zh) * 2015-06-09 2016-12-15 中兴通讯股份有限公司 数据的迁移方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100834574B1 (ko) * 2006-09-29 2008-06-02 한국전자통신연구원 파일 저장 시스템 및 그 시스템에서의 파일 저장 및 검색방법
CN104408163B (zh) * 2014-12-05 2018-09-14 浪潮(北京)电子信息产业有限公司 一种数据分级存储方法和装置
CN106503008B (zh) * 2015-09-07 2020-02-14 网宿科技股份有限公司 文件存储方法和装置及文件查询方法和装置
CN105677871A (zh) * 2016-01-08 2016-06-15 珠海格力电器股份有限公司 一种音频文件的分类方法、装置和文件管理器
CN105808770A (zh) * 2016-03-22 2016-07-27 北京北方微电子基地设备工艺研究中心有限责任公司 文件管理的方法及装置
CN107784108A (zh) * 2017-10-31 2018-03-09 郑州云海信息技术有限公司 一种数据存储管理方法、装置及设备
CN108009204A (zh) * 2017-11-02 2018-05-08 深圳市网心科技有限公司 基于扩展名分类并去冗余的方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1360267A (zh) * 2002-01-30 2002-07-24 北京大学 文件分类查找方法
CN101599986A (zh) * 2008-06-02 2009-12-09 宏碁股份有限公司 加速文件传输速度的方法及计算机系统
CN103646072A (zh) * 2013-12-10 2014-03-19 河南博仕达通信技术有限公司 文件自动分类方法及移动终端
CN104978369A (zh) * 2014-04-14 2015-10-14 腾讯科技(深圳)有限公司 一种文件查找方法和装置
WO2016197706A1 (zh) * 2015-06-09 2016-12-15 中兴通讯股份有限公司 数据的迁移方法及装置
CN106101271A (zh) * 2016-08-08 2016-11-09 北京小米移动软件有限公司 优化存储空间的方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019085591A1 (zh) * 2017-11-02 2019-05-09 深圳市网心科技有限公司 智能硬件设备、磁盘数据智能处理方法和存储介质
CN111143849A (zh) * 2019-12-31 2020-05-12 奇安信科技集团股份有限公司 应用于电子设备的文件类型识别方法和装置、电子设备
CN111143849B (zh) * 2019-12-31 2022-06-24 奇安信科技集团股份有限公司 应用于电子设备的文件类型识别方法和装置、电子设备

Also Published As

Publication number Publication date
WO2019085591A1 (zh) 2019-05-09

Similar Documents

Publication Publication Date Title
CN109299183A (zh) 一种数据处理方法、装置、终端设备和存储介质
US11146613B2 (en) Distributed computing on document formats
CN102741803B (zh) 用于促进数据发现的系统和方法
JP5759915B2 (ja) ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置
CN105808633A (zh) 数据归档方法和系统
CN108334628A (zh) 一种新闻事件聚类的方法、装置、设备和储存介质
US9280551B2 (en) De-duplication deployment planning
US11030172B2 (en) Database archiving method and device for creating index information and method and device of retrieving archived database including index information
EP3422204A1 (en) Method and apparatus for archiving database, and method and apparatus for searching archived database
CN103744628A (zh) SSTable文件存储方法及装置
CN108009204A (zh) 基于扩展名分类并去冗余的方法及系统
CN105389509A (zh) 文件扫描方法及装置
CN108932271A (zh) 一种文件管理方法及装置
CN114780485A (zh) 一种电子档案管理方法、系统、可读存储介质及设备
US20180011923A1 (en) Value range synopsis in column-organized analytical databases
CN115190331A (zh) 一种适用于5g环境的全服务型媒资资源管理系统及方法
CN117156172B (zh) 视频切片上报方法、系统、存储介质及计算机
CN106021359A (zh) Cad文件的修改方法及装置
US11704279B2 (en) Event driven migration, recall, and data placement optimization based on custom metadata
Liu et al. deBWT: parallel construction of Burrows–Wheeler Transform for large collection of genomes with de Bruijn-branch encoding
JP2021140430A (ja) データベースマイグレーション方法、データベースマイグレーションシステム、及びデータベースマイグレーションプログラム
CN110471764A (zh) 一种内存清理的处理方法及装置
CN105408896A (zh) 信息管理装置和信息管理方法
CN106528577B (zh) 一种设置待清理文件的方法和装置
CN105824968B (zh) 一种清理文件夹的方法、装置及移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180508