CN114860656A - 一种文件扫描方法、装置、电子设备以及存储介质 - Google Patents
一种文件扫描方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN114860656A CN114860656A CN202210377071.8A CN202210377071A CN114860656A CN 114860656 A CN114860656 A CN 114860656A CN 202210377071 A CN202210377071 A CN 202210377071A CN 114860656 A CN114860656 A CN 114860656A
- Authority
- CN
- China
- Prior art keywords
- information
- file information
- directory
- file
- storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 93
- 230000015654 memory Effects 0.000 claims description 17
- 238000001914 filtration Methods 0.000 claims description 5
- 230000009286 beneficial effect Effects 0.000 abstract description 13
- 238000004590 computer program Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000002349 favourable effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种文件扫描方法、装置、电子设备以及存储介质,该方法包括:对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息;多叉树文件信息包括若干个目录对象信息;对多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合;存储树文件信息集合可快速响应于文件存储过程中的暂停存储操作与继续存储操作。可见,本发明有利于提高扫描的性能,支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种文件扫描方法、装置、电子设备以及存储介质。
背景技术
随着电脑和手机上的文件越来越多,目录文件的传输成为了人们对文件传输的需求中一种必不可少的功能。目前市面上传输类应用,在传输目录的扫描过程中容易出现以下问题:在目录扫描的过程中不支持暂停和继续操作;传输完成的目录文件将所有的子文件作为一级展示,没有保留原有目录树结构;在传输有海量子文件或者有复杂目录树结构的目录文件时,会出现程序卡死问题。
发明内容
本发明提供一种文件扫描方法、装置、电子设备以及存储介质能够将复杂的目录结构按照层级一级级的进行扫描处理,并保留目录树结构,且可将目录树分页进行存储,有利于提高扫描的性能,支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
为了解决上述背景技术中的技术问题,本发明实施例第一方面公开了一种文件扫描方法,所述方法包括:
对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息;所述多叉树文件信息包括若干个目录对象信息;
对所述多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合;所述存储树文件信息集合用于响应于所述待扫描文件信息中文件存储过程的暂停存储操作与继续存储操作。
作为一种可选的实施方式,在本发明实施例第一方面中,
所述对所述多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合,包括:
根据所述多叉树文件信息,确定出目标扫描目录信息,并对所述多叉树文件信息进行更新;所述目标扫描目录信息包括第一路径信息和第一主键信息;
根据所述目标扫描目录信息,确定出该目标扫描目录信息对应的存储树文件信息;
判断更新后的多叉树文件信息是否存在所述目录对象信息,得到第二判断结果;
当所述第二判断结果为是时,触发执行所述根据所述多叉树文件信息,确定出目标扫描目录信息,并对所述多叉树文件信息进行更新;
当所述第二判断结果为否时,确定出包括若干个存储树文件信息的存储树文件信息集合。
作为一种可选的实施方式,在本发明实施例第一方面中,
所述对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息,包括:
判断获取到的待扫描文件信息中是否存在目录对象信息,得到第一判断结果;
当所述第一判断结果为否时,根据所述待扫描文件信息对应的任务根路径信息,确定出根目录对象信息集合;所述根目录对象信息集合包括若干个根目录对象信息;所述根目录对象信息包括第二路径信息和第二主键信息;
根据所述根目录对象信息集合,确定出多叉树文件信息;
当所述第一判断结果为是时,确定所述待扫描文件信息为所述多叉树文件信息。
作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述目标扫描目录信息,确定出该目标扫描目录信息对应的存储树文件信息,包括:
根据所述目标扫描目录信息对应的第一路径信息,确定出该目标扫描目录信息对应的子文件信息;
根据所述目标扫描目录信息对应的第一主键信息对所述子文件信息进行赋值处理,得到该目标扫描目录信息对应的属性文件信息;
对该目标扫描目录信息对应的属性文件信息进行分组处理,得到该目标扫描目录信息对应的存储树文件信息。
作为一种可选的实施方式,在本发明实施例第一方面中,在所述根据所述目标扫描目录信息对应的第一路径信息,确定出该目标扫描目录信息对应的子文件信息之前,所述方法还包括:
判断数据库中的缓存文件信息中是否满足有值条件,得到第三判断结果;所述有值条件与所述缓存文件信息中已缓存过的文件信息相关;
当所述第三判断结果为是,利用所述缓存文件信息对所述子文件信息进行过滤更新。
作为一种可选的实施方式,在本发明实施例第一方面中,所述对该目标扫描目录信息对应的属性文件信息进行分组处理,得到该目标扫描目录信息对应的存储树文件信息,包括:
获取分组阈值;
利用所述分组阈值对该目标扫描目录信息对应的属性文件信息进行分组,得到该目标扫描目录信息对应的存储树文件信息;所述存存储树文件信息包括M个存储文件信息;所述M为小于等于所述分组阈值的非负数。
作为一种可选的实施方式,在本发明实施例第一方面中,在所述对所述多叉树文件信息进行结构化处理,得到存储树文件信息集合之后,所述方法还包括:
判断所述存储树文件信息集合是否满足目录文件条件,得到第四判断结果;所述目标文件条件表征所述存储树文件信息存在目录文件;
当所述第四判断结果为是,根据所述存储树文件信息集合,确定出子目录对象信息集合;所述子目录对象信息集合包括若干个子目录对象信息;
利用所述子目录对象信息集合对所述多叉树文件信息进行更新,并触发执行所述对所述多叉树文件信息进行结构化处理,得到存储树文件信息集合。
本发明实施例第二方面公开了一种文件扫描装置,所述装置包括:
第一处理模块,用于对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息;所述多叉树文件信息包括若干个目录对象信息;
第二处理模块,用于对所述多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合;所述存储树文件信息集合用于响应于所述待扫描文件信息中文件存储过程中的暂停存储操作与继续存储操作。
作为一种该可选的实施方式,在本发明实施例第二方面中,
所述第二处理模块对所述多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合的具体方式为:
根据所述多叉树文件信息,确定出目标扫描目录信息,并对所述多叉树文件信息进行更新;所述目标扫描目录信息包括第一路径信息和第一主键信息;
根据所述目标扫描目录信息,确定出该目标扫描目录信息对应的存储树文件信息;
判断更新后的多叉树文件信息是否存在所述目录对象信息,得到第二判断结果;
当所述第二判断结果为是时,触发执行所述根据所述多叉树文件信息,确定出目标扫描目录信息,并对所述多叉树文件信息进行更新;
当所述第二判断结果为否时,确定出包括若干个存储树文件信息的存储树文件信息集合。
作为一种该可选的实施方式,在本发明实施例第二方面中,
所述第一处理模块对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息的具体方式为:
判断获取到的待扫描文件信息中是否存在目录对象信息,得到第一判断结果;
当所述第一判断结果为否时,根据所述待扫描文件信息对应的任务根路径信息,确定出根目录对象信息集合;所述根目录对象信息集合包括若干个根目录对象信息;所述根目录对象信息包括第二路径信息和第二主键信息;
根据所述根目录对象信息集合,确定出多叉树文件信息;
当所述第一判断结果为是时,确定所述待扫描文件信息为所述多叉树文件信息。
作为一种该可选的实施方式,在本发明实施例第二方面中,所述第二处理模块根据所述目标扫描目录信息,确定出该目标扫描目录信息对应的存储树文件信息的具体方式为:
根据所述目标扫描目录信息对应的第一路径信息,确定出该目标扫描目录信息对应的子文件信息;
根据所述目标扫描目录信息对应的第一主键信息对所述子文件信息进行赋值处理,得到该目标扫描目录信息对应的属性文件信息;
对该目标扫描目录信息对应的属性文件信息进行分组处理,得到该目标扫描目录信息对应的存储树文件信息。
作为一种该可选的实施方式,在本发明实施例第二方面中,在所述第二处理模块根据所述目标扫描目录信息对应的第一路径信息,确定出该目标扫描目录信息对应的子文件信息之前,所述装置还包括:
第一判断模块,用于判断数据库中的缓存文件信息中是否满足有值条件,得到第三判断结果;所述有值条件与所述缓存文件信息中已缓存过的文件信息相关;
第一更新模块,用于当所述第三判断结果为是,利用所述缓存文件信息对所述子文件信息进行过滤更新。
作为一种该可选的实施方式,在本发明实施例第二方面中,所述第二处理模块对该目标扫描目录信息对应的属性文件信息进行分组处理,得到该目标扫描目录信息对应的存储树文件信息的具体方式为:
获取分组阈值;
利用所述分组阈值对该目标扫描目录信息对应的属性文件信息进行分组,得到该目标扫描目录信息对应的存储树文件信息;所述存存储树文件信息包括M个存储文件信息;所述M为小于等于所述分组阈值的非负数。
作为一种该可选的实施方式,在本发明实施例第二方面中,在所述第二处理模块对所述多叉树文件信息进行结构化处理,得到存储树文件信息集合之后,所述装置还包括:
第二判断模块,用于判断所述存储树文件信息集合是否满足目录文件条件,得到第四判断结果;所述目标文件条件表征所述存储树文件信息存在目录文件;
确定模块,用于当所述第四判断结果为是,根据所述存储树文件信息集合,确定出子目录对象信息集合;所述子目录对象信息集合包括若干个子目录对象信息;
第二更新模块,用于利用所述子目录对象信息集合对所述多叉树文件信息进行更新,并触发执行所述对所述多叉树文件信息进行结构化处理,得到存储树文件信息集合。
本发明第三方面公开了另一种文件扫描装置,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的文件扫描方法中的部分或全部步骤。
本发明第四方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明实施例第一方面公开的文件扫描方法中的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明的方法包括:对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息;多叉树文件信息包括若干个目录对象信息;目录对象信息包括第一路径信息和第一主键信息;对多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息存储树文件信息集合;存储树文件信息集合可快速响应于文件存储过程中的暂停存储操作与继续存储操作。可见,本发明能够将复杂的目录结构按照层级一级级的进行扫描处理,并保留目录树结构,且可将目录树分页进行存储,有利于提高扫描的性能,支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种文件扫描方法的流程示意图;
图2是本发明实施例公开的另一种文件扫描方法的流程示意图;
图3是本发明实施例公开的一种文件扫描装置的结构示意图;
图4是本发明实施例公开的另一种文件扫描装置的结构示意图;
图5本发明实施例公开的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明公开了一种文件扫描方法、装置、电子设备以及存储介质,能够对待扫描文件信息进行目录扫描,构建目录树结构并对文件进行分组存储,有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种文件扫描方法的流程示意图。其中,图1所描述的文件扫描方法应用于数据处理系统中,如文件扫描管理的本地服务器或云端服务器等,本发明实施例不做限定。如图1所示,该文件扫描方法可以包括以下操作:
101、对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息。
本发明实施例中,上述多叉树文件信息包括若干个目录对象信息。
本发明实施例中,上述目录对象信息包括第一路径信息和第一主键信息。
102、对多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合。
本发明实施例中,上述存储树文件信息集合用于响应于所述待扫描文件信息中文件存储过程的暂停存储操作与继续存储操作。
可选的,上述第一主键信息表征父目录在数据库中存储的主键。
可选的,上述第一路径信息表征子文件的目录路径。
可选的,上述存存储树文件信息包括M个存储文件信息。
在该可选的实施例中,作为一种可选的实施方式,在上述对多叉树文件信息进行结构化处理,得到存储树文件信息集合之后,上述方法还包括:
对于任一存储树文件信息,按序将该存储树文件信息中的存储文件信息存储至数据库。
在该可选的实施例中,作为一种可选的实施方式,在上述对多叉树文件信息进行结构化处理,得到存储树文件信息集合之后,上述方法还包括:
检测是否接收到中断扫描信号;
当接收到中断扫描信号时,中止存储文件信息的存储,并生成中断节点信息;
检测是否接收到继续操作信号;
当接收到继续操作信号时,根据上述中断节点信息继续将存储文件信息存储至数据库。
可选的,上述中断节点信息表征存储文件信息的当前存储记录。
可选的,上述存储树文件信息可按照目录树状结构对所有子文件进行展示。
可选的,上述文件扫描方法将复杂的目录结构按照层级一级级的进行扫描处理,以优化扫描性能。
可选的,上述文件扫描方法可在目录扫描过程中实时更新当前扫描到的文件和目录总数,以及扫描到的文件总大小。
可见,实施本发明实施例所描述的文件扫描方法能够对待扫描文件信息进行目录扫描,构建目录树结构并对文件进行分组存储,有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
在一个可选的实施例中,上述通讯系统信息还包括第二系统的第二设备信息
上述对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息,包括:
判断获取到的待扫描文件信息中是否存在目录对象信息,得到第一判断结果;
当第一判断结果为否时,根据待扫描文件信息对应的任务根路径信息,确定出根目录对象信息集合;根目录对象信息集合包括若干个根目录对象信息;根目录对象信息包括第二路径信息和第二主键信息;
根据根目录对象信息集合,确定出多叉树文件信息;
当第一判断结果为是时,确定待扫描文件信息为多叉树文件信息。
可选的,上述第二路径信息表征待扫描文件信息对应的任务根路径。
可选的,上述第二主键信息表征根路径在数据库中的主键。
可见,实施本发明实施例所描述的文件扫描方法能够通过对待扫描文件信息的判断处理等综合处理得到多叉树文件信息,有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
在另一个可选的实施例中,上述对多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合,包括:
根据多叉树文件信息,确定出目标扫描目录信息,并对多叉树文件信息进行更新;目标扫描目录信息包括第一路径信息和第一主键信息;
根据目标扫描目录信息,确定出该目标扫描目录信息对应的存储树文件信息;
判断更新后的多叉树文件信息是否存在所述目录对象信息,得到第二判断结果;
当第二判断结果为是时,触发执行根据所述多叉树文件信息,确定出目标扫描目录信息,并对多叉树文件信息进行更新;
当第二判断结果为否时,确定出包括若干个存储树文件信息的存储树文件信息集合。
可选的,上述根据多叉树文件信息,确定出目标扫描目录信息,并对多叉树文件信息进行更新是从多叉树文件信息中依序选定目录对象信息为目标扫描目录信息,并将该目录对象信息从多叉树文件信息删除,生成新的多叉树文件信息,以提高扫描效率。
可见,实施本发明实施例所描述的文件扫描方法能够通过多叉树文件信息确定得到目标扫描目录信息,再确定得到存储树文件信息,有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
在又一个可选的实施例中,上述根据目标扫描目录信息,确定出该目标扫描目录信息对应的存储树文件信息,包括:
根据目标扫描目录信息对应的第一路径信息,确定出该目标扫描目录信息对应的子文件信息;
根据目标扫描目录信息对应的第一主键信息对子文件信息进行赋值处理,得到该目标扫描目录信息对应的属性文件信息;
对该目标扫描目录信息对应的属性文件信息进行分组处理,得到该目标扫描目录信息对应的存储树文件信息。
可选的,上述利用第一主键信息对子文件信息进行赋值处理是将父目录在数据库中存储的主键作为子文件的pid字段,以便于通过目录的主键快速查询到该目录下所有的子文件。
可见,实施本发明实施例所描述的文件扫描方法能够利用第一路径信息和第一主键信息生成属性文件信息,并对其进行分组处理得到存储树文件信息,更有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
在又一个可选的实施例中,在根据目标扫描目录信息对应的第一路径信息,确定出该目标扫描目录信息对应的子文件信息之前,方法还包括:
判断数据库中的缓存文件信息中是否满足有值条件,得到第三判断结果;有值条件与缓存文件信息中已缓存过的文件信息相关;
当第三判断结果为是,利用缓存文件信息对子文件信息进行过滤更新。
可选的,上述缓存文件信息表征目标扫描目录信息的第一主键信息所对应的目录路径中已经缓存过的子文件情况。
可选的,上述利用缓存文件信息对子文件信息进行过滤更新为将目标扫描目录信息的第一主键信息所对应的目录路径中所有与已经缓存过的子文件相匹配的子文件过滤掉。
可见,实施本发明实施例所描述的文件扫描方法能够通过对缓存文件信息的判断处理来对子文件信息进行过滤更新,更有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
在一个可选的实施例中,上述对该目标扫描目录信息对应的属性文件信息进行分组处理,得到该目标扫描目录信息对应的存储树文件信息,包括:
获取分组阈值;
利用分组阈值对该目标扫描目录信息对应的属性文件信息进行分组,得到该目标扫描目录信息对应的存储树文件信息;存存储树文件信息包括M个存储文件信息;M为小于等于分组阈值的非负数。
优选的,上述分组阈值为256。
可选的,上述利用分组阈值对该目标扫描目录信息对应的属性文件信息进行分组是将目标扫描目录信息中同一层级的所有子文件以256个子文件为一组进行分组,以便在存储过程中遇到暂停,可回退到当前存储树文件信息对应的存储记录,从而快速响应暂停继续操作。
可见,实施本发明实施例所描述的文件扫描方法能够利用分组阈值对属性文件信息进行分组以得到存储树文件信息,更有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
实施例二
请参阅图2,图2是本发明实施例公开的另一种文件扫描方法的流程示意图。其中,图2所描述的文件扫描方法应用于数据处理系统中,如文件扫描管理的本地服务器或云端服务器等,本发明实施例不做限定。如图2所示,该文件扫描方法可以包括以下操作:
201、对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息。
202、对多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合。
203、判断存储树文件信息集合是否满足目录文件条件,得到第四判断结果。
本发明实施例中,上述目标文件条件表征存储树文件信息存在目录文件。
204、当第四判断结果为是,根据存储树文件信息集合,确定出子目录对象信息集合。
本发明实施例中,上述子目录对象信息集合包括若干个子目录对象信息。
205、利用子目录对象信息集合对多叉树文件信息进行更新,并触发执行对多叉树文件信息进行结构化处理,得到存储树文件信息集合。
本发明实施例中,针对步骤201-步骤202的具体技术细节和技术名词解释,可以参照实施例一中针对步骤101-步骤102的详细描述,本发明实施例不再赘述。
可选的,上述子目录对象信息包括子目录路径信息和子目录主键信息。
可选的,上述子目录主键信息表征子目录存储在数据库中的主键。
可见,实施本发明实施例所描述的文件扫描方法能够对待扫描文件信息进行目录扫描,构建目录树结构并对文件进行分组存储,有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
实施例三
请参阅图3,图3是本发明实施例公开的一种文件扫描装置的结构示意图。其中,图3所描述的装置能够应用于数据处理系统中,如文件扫描管理的本地服务器或云端服务器等,本发明实施例不做限定。如图3所示,该装置可以包括:
第一处理模块301,用于对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息;多叉树文件信息包括若干个目录对象信息;目录对象信息包括第一路径信息和第一主键信息;
第二处理模块302,用于对多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合;存储树文件信息集合包括若干个存储树文件信息;存储树文件信息集合用于响应于待扫描文件信息中文件存储过程中的暂停存储操作与继续存储操作。
可见,实施图3所描述的文件扫描装置,能够对待扫描文件信息进行目录扫描,构建目录树结构并对文件进行分组存储,有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
在另一个可选的实施例中,如图4所示,第二处理模块302对多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合的具体方式为:
根据多叉树文件信息,确定出目标扫描目录信息,并对多叉树文件信息进行更新;目标扫描目录信息包括第一路径信息和第一主键信息;
根据目标扫描目录信息,确定出该目标扫描目录信息对应的存储树文件信息;
判断更新后的多叉树文件信息是否存在目录对象信息,得到第二判断结果;
当第二判断结果为是时,触发执行根据所述多叉树文件信息,确定出目标扫描目录信息,并对多叉树文件信息进行更新;
当第二判断结果为否时,确定出包括若干个存储树文件信息的存储树文件信息集合。
可见,实施图4所描述的文件扫描装置,能够通过对待扫描文件信息的判断处理等综合处理得到多叉树文件信息,有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
在又一个可选的实施例中,如图4所示,第一处理模块301对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息的具体方式为:
判断获取到的待扫描文件信息中是否存在目录对象信息,得到第一判断结果;
当第一判断结果为否时,根据待扫描文件信息对应的任务根路径信息,确定出根目录对象信息集合;根目录对象信息集合包括若干个根目录对象信息;根目录对象信息包括第二路径信息和第二主键信息;
根据根目录对象信息集合,确定出多叉树文件信息;
当第一判断结果为是时,确定待扫描文件信息为所述多叉树文件信息。
可见,实施图4所描述的文件扫描装置,能够通过多叉树文件信息确定得到目标扫描目录信息,再确定得到存储树文件信息,有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
在又一个可选的实施例中,如图4所示,第二处理模块302根据目标扫描目录信息,确定出该目标扫描目录信息对应的存储树文件信息的具体方式为:
根据目标扫描目录信息对应的第一路径信息,确定出该目标扫描目录信息对应的子文件信息;
根据目标扫描目录信息对应的第一主键信息对子文件信息进行赋值处理,得到该目标扫描目录信息对应的属性文件信息;
对该目标扫描目录信息对应的属性文件信息进行分组处理,得到该目标扫描目录信息对应的存储树文件信息。
可见,实施图4所描述的文件扫描装置,能够利用第一路径信息和第一主键信息生成属性文件信息,并对其进行分组处理得到存储树文件信息,更有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
在又一个可选的实施例中,如图4所示,在第二处理模块302根据目标扫描目录信息对应的第一路径信息,确定出该目标扫描目录信息对应的子文件信息之前,装置还包括:
第一判断模块303,用于判断数据库中的缓存文件信息中是否满足有值条件,得到第三判断结果;有值条件与缓存文件信息中已缓存过的文件信息相关;
第一更新模块304,用于当第三判断结果为是,利用缓存文件信息对子文件信息进行过滤更新。
可见,实施图4所描述的文件扫描装置,能够通过对缓存文件信息的判断处理来对子文件信息进行过滤更新,更有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
在又一个可选的实施例中,如图4所示,第二处理模块302对该目标扫描目录信息对应的属性文件信息进行分组处理,得到该目标扫描目录信息对应的存储树文件信息的具体方式为:
获取分组阈值;
利用分组阈值对该目标扫描目录信息对应的属性文件信息进行分组,得到该目标扫描目录信息对应的存储树文件信息;存存储树文件信息包括M个存储文件信息;M为小于等于分组阈值的非负数。
可见,实施图4所描述的文件扫描装置,能够利用分组阈值对属性文件信息进行分组以得到存储树文件信息,更有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
在又一个可选的实施例中,如图4所示,在第二处理模块302对多叉树文件信息进行结构化处理,得到存储树文件信息集合之后,装置还包括:
第二判断模块305,用于判断存储树文件信息集合是否满足目录文件条件,得到第四判断结果;目标文件条件表征存储树文件信息存在目录文件;
确定模块306,用于当第四判断结果为是,根据存储树文件信息集合,确定出子目录对象信息集合;子目录对象信息集合包括若干个子目录对象信息;
第二更新模块307,用于利用子目录对象信息集合对多叉树文件信息进行更新,并触发执行对多叉树文件信息进行结构化处理,得到存储树文件信息集合。
可见,实施图4所描述的文件扫描装置,能够对待扫描文件信息进行目录扫描,构建目录树结构并对文件进行分组存储,有利于提高扫描的性能,支持百万级复杂的目录结构扫描、支持扫描过程中的暂停和继续操作,快速响应暂停继续操作。
实施例四
请参阅图5,图5是本发明实施例公开的又一种电子设备的结构示意图。其中,图5所描述的电子设备能够应用于数据处理系统中,如文件扫描管理的本地服务器或云端服务器等,本发明实施例不做限定。如图5所示,该装置可以包括:
存储有可执行程序代码的存储器401;
与存储器401耦合的处理器402;
处理器402调用存储器401中存储的可执行程序代码,用于执行实施例一或实施例二所描述的文件扫描方法中的步骤。
实施例五
本发明实施例公开了一种计算机读存储介质,其存储用于电子数据交换的计算机程序,其中,该计算机程序使得计算机执行实施例一或实施例二所描述的文件扫描方法中的步骤。
实施例六
本发明实施例公开了一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行实施例一或实施例二所描述的文件扫描方法中的步骤。
以上所描述的装置实施例仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
最后应说明的是:本发明实施例公开的一种文件扫描方法、装置、电子设备以及存储介质所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。
Claims (10)
1.一种文件扫描方法,其特征在于,所述方法包括:
对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息;所述多叉树文件信息包括若干个目录对象信息;
对所述多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合;所述存储树文件信息集合用于响应于所述待扫描文件信息中文件存储过程的暂停存储操作与继续存储操作。
2.根据权利要求1所述的文件扫描方法,其特征在于,所述对所述多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合,包括:
根据所述多叉树文件信息,确定出目标扫描目录信息,并对所述多叉树文件信息进行更新;所述目标扫描目录信息包括第一路径信息和第一主键信息;
根据所述目标扫描目录信息,确定出该目标扫描目录信息对应的存储树文件信息;
判断更新后的多叉树文件信息是否存在所述目录对象信息,得到第二判断结果;
当所述第二判断结果为是时,触发执行所述根据所述多叉树文件信息,确定出目标扫描目录信息,并对所述多叉树文件信息进行更新;
当所述第二判断结果为否时,确定出包括若干个存储树文件信息的存储树文件信息集合。
3.根据权利要求1所述的文件扫描方法,其特征在于,所述对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息,包括:
判断获取到的待扫描文件信息中是否存在目录对象信息,得到第一判断结果;
当所述第一判断结果为否时,根据所述待扫描文件信息对应的任务根路径信息,确定出根目录对象信息集合;所述根目录对象信息集合包括若干个根目录对象信息;所述根目录对象信息包括第二路径信息和第二主键信息;
根据所述根目录对象信息集合,确定出多叉树文件信息;
当所述第一判断结果为是时,确定所述待扫描文件信息为所述多叉树文件信息。
4.根据权利要求3所述的文件扫描方法,其特征在于,所述根据所述目标扫描目录信息,确定出该目标扫描目录信息对应的存储树文件信息,包括:
根据所述目标扫描目录信息对应的第一路径信息,确定出该目标扫描目录信息对应的子文件信息;
根据所述目标扫描目录信息对应的第一主键信息对所述子文件信息进行赋值处理,得到该目标扫描目录信息对应的属性文件信息;
对该目标扫描目录信息对应的属性文件信息进行分组处理,得到该目标扫描目录信息对应的存储树文件信息。
5.根据权利要求4所述的文件扫描方法,其特征在于,在所述根据所述目标扫描目录信息对应的第一路径信息,确定出该目标扫描目录信息对应的子文件信息之前,所述方法还包括:
判断数据库中的缓存文件信息中是否满足有值条件,得到第三判断结果;所述有值条件与所述缓存文件信息中已缓存过的文件信息相关;
当所述第三判断结果为是,利用所述缓存文件信息对所述子文件信息进行过滤更新。
6.根据权利要求4所述的文件扫描方法,其特征在于,所述对该目标扫描目录信息对应的属性文件信息进行分组处理,得到该目标扫描目录信息对应的存储树文件信息,包括:
获取分组阈值;
利用所述分组阈值对该目标扫描目录信息对应的属性文件信息进行分组,得到该目标扫描目录信息对应的存储树文件信息;所述存存储树文件信息包括M个存储文件信息;所述M为小于等于所述分组阈值的非负数。
7.根据权利要求1所述的文件扫描方法,其特征在于,在所述对所述多叉树文件信息进行结构化处理,得到存储树文件信息集合之后,所述方法还包括:
判断所述存储树文件信息集合是否满足目录文件条件,得到第四判断结果;所述目标文件条件表征所述存储树文件信息存在目录文件;
当所述第四判断结果为是,根据所述存储树文件信息集合,确定出子目录对象信息集合;所述子目录对象信息集合包括若干个子目录对象信息;
利用所述子目录对象信息集合对所述多叉树文件信息进行更新,并触发执行所述对所述多叉树文件信息进行结构化处理,得到存储树文件信息集合。
8.一种文件扫描装置,其特征在于,所述装置包括:
第一处理模块,用于对获取到的待扫描文件信息进行文件扫描处理,得到多叉树文件信息;所述多叉树文件信息包括若干个目录对象信息;
第二处理模块,用于对所述多叉树文件信息进行结构化处理,得到包括若干个存储树文件信息的存储树文件信息集合;所述存储树文件信息集合用于响应于所述待扫描文件信息中文件存储过程的暂停存储操作与继续存储操作。
9.一种电子设备,其特征在于,所述电子设备包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-7任一项所述的文件扫描方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如权利要求1-7任一项所述的文件扫描方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210377071.8A CN114860656A (zh) | 2022-04-12 | 2022-04-12 | 一种文件扫描方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210377071.8A CN114860656A (zh) | 2022-04-12 | 2022-04-12 | 一种文件扫描方法、装置、电子设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114860656A true CN114860656A (zh) | 2022-08-05 |
Family
ID=82629208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210377071.8A Pending CN114860656A (zh) | 2022-04-12 | 2022-04-12 | 一种文件扫描方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114860656A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160203149A1 (en) * | 2014-08-25 | 2016-07-14 | Biadu Online Network Technology (Beijing) Co., Ltd | File scanning method and apparatus related application |
US20170220588A1 (en) * | 2014-11-04 | 2017-08-03 | Shenzhen Skyworth Digital Technology Co.,Ltd | Method and system for scanning local media file |
US20180307700A1 (en) * | 2017-04-25 | 2018-10-25 | Beijing Kingsoft Internet Security Software Co., Ltd. | Method and apparatus for scanning files and intelligent terminal |
CN111125298A (zh) * | 2019-12-23 | 2020-05-08 | 深圳市斯博科技有限公司 | 重建ntfs文件目录树的方法、设备及存储介质 |
WO2021003932A1 (zh) * | 2019-07-05 | 2021-01-14 | 平安国际智慧城市科技股份有限公司 | 文件管理方法、装置、计算机设备和存储介质 |
CN112286878A (zh) * | 2019-07-24 | 2021-01-29 | 腾讯科技(深圳)有限公司 | 文件扫描方法、装置、终端及存储介质 |
CN112306959A (zh) * | 2020-10-30 | 2021-02-02 | 广州朗国电子科技有限公司 | 一种移动存储设备的文件扫描方法、存储介质及设备终端 |
CN113805937A (zh) * | 2021-09-22 | 2021-12-17 | 深圳市绿联科技股份有限公司 | 一种文件生成方法、装置、电子设备以及存储介质 |
CN114116611A (zh) * | 2020-08-29 | 2022-03-01 | 华为技术有限公司 | 一种文件扫描方法及相关装置 |
-
2022
- 2022-04-12 CN CN202210377071.8A patent/CN114860656A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160203149A1 (en) * | 2014-08-25 | 2016-07-14 | Biadu Online Network Technology (Beijing) Co., Ltd | File scanning method and apparatus related application |
US20170220588A1 (en) * | 2014-11-04 | 2017-08-03 | Shenzhen Skyworth Digital Technology Co.,Ltd | Method and system for scanning local media file |
US20180307700A1 (en) * | 2017-04-25 | 2018-10-25 | Beijing Kingsoft Internet Security Software Co., Ltd. | Method and apparatus for scanning files and intelligent terminal |
WO2021003932A1 (zh) * | 2019-07-05 | 2021-01-14 | 平安国际智慧城市科技股份有限公司 | 文件管理方法、装置、计算机设备和存储介质 |
CN112286878A (zh) * | 2019-07-24 | 2021-01-29 | 腾讯科技(深圳)有限公司 | 文件扫描方法、装置、终端及存储介质 |
CN111125298A (zh) * | 2019-12-23 | 2020-05-08 | 深圳市斯博科技有限公司 | 重建ntfs文件目录树的方法、设备及存储介质 |
CN114116611A (zh) * | 2020-08-29 | 2022-03-01 | 华为技术有限公司 | 一种文件扫描方法及相关装置 |
CN112306959A (zh) * | 2020-10-30 | 2021-02-02 | 广州朗国电子科技有限公司 | 一种移动存储设备的文件扫描方法、存储介质及设备终端 |
CN113805937A (zh) * | 2021-09-22 | 2021-12-17 | 深圳市绿联科技股份有限公司 | 一种文件生成方法、装置、电子设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107889069B (zh) | 一种短信网关选择方法、装置、服务器及可读存储介质 | |
CN108572795B (zh) | 基于搭建存储虚拟化的扩容方法、装置、设备和存储介质 | |
EP3633519A1 (en) | Method for storing objects, and object store gateway | |
CN109522282B (zh) | 图片管理方法、装置、计算机装置及存储介质 | |
CN112433757A (zh) | 一种确定接口调用关系的方法和装置 | |
CN114860656A (zh) | 一种文件扫描方法、装置、电子设备以及存储介质 | |
CN112883065A (zh) | 一种数据存储方法、装置及计算机设备 | |
CN110765073B (zh) | 分布式存储系统的文件管理方法、介质、设备及装置 | |
CN112559913A (zh) | 一种数据处理方法、装置、计算设备及可读存储介质 | |
CN109783440B (zh) | 数据存储方法及数据检索方法、装置、介质、电子设备 | |
CN115129789A (zh) | 一种分布式对象存储系统的桶索引存储方法、装置及介质 | |
CN113746924A (zh) | 一种电网业务数据跨区传输方法及装置 | |
CN111061719B (zh) | 数据收集方法、装置、设备和存储介质 | |
CN103856535A (zh) | 一种获取用户数据的方法和装置 | |
JP2008129794A (ja) | バックアップシステム及びバックアップ装置 | |
CN111563064A (zh) | 一种文件操作的方法、系统、设备及可读存储介质 | |
CN113704242A (zh) | 一种数据处理方法和装置 | |
CN106528577B (zh) | 一种设置待清理文件的方法和装置 | |
CN112929459B (zh) | 一种边缘系统及数据操作请求的处理方法 | |
CN113626409B (zh) | 一种测试资料处理方法、装置、设备及存储介质 | |
CN110213314B (zh) | 确定存储节点的方法、装置、服务器 | |
CN111061721B (zh) | 数据处理方法及装置 | |
CN116126902A (zh) | SQL中分区剪枝支持like操作的方法和存储介质 | |
CN114153428A (zh) | 一种基于任务图元的数据处理方法及装置 | |
CN117560371A (zh) | 一种区块链的数据处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |