CN117992411A - 文件管理方法、装置、电子设备及存储介质 - Google Patents

文件管理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117992411A
CN117992411A CN202211346548.2A CN202211346548A CN117992411A CN 117992411 A CN117992411 A CN 117992411A CN 202211346548 A CN202211346548 A CN 202211346548A CN 117992411 A CN117992411 A CN 117992411A
Authority
CN
China
Prior art keywords
file
uploaded
identification
retrieval
currently determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211346548.2A
Other languages
English (en)
Inventor
涂勇军
江秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Realme Mobile Telecommunications Shenzhen Co Ltd
Original Assignee
Realme Mobile Telecommunications Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Realme Mobile Telecommunications Shenzhen Co Ltd filed Critical Realme Mobile Telecommunications Shenzhen Co Ltd
Priority to CN202211346548.2A priority Critical patent/CN117992411A/zh
Publication of CN117992411A publication Critical patent/CN117992411A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请适用于信息技术领域,提供了一种文件管理方法、装置、电子设备及存储介质。上述方法通过确定与待上传文件对应的检索标识;若标识库中存在当前确定的检索标识,且待上传文件的上传任务与目标文件的上传任务不一致,则建立待上传文件至目标文件的映射关系,使电子设备在响应待上传文件的调用指令时,可以在本地未存储待上传文件的情况下,为用户提供目标文件的映射文件,映射文件的文件内容与待上传文件的文件内容相同,通过避免重复文件的上传,减少了电子设备中的冗余文件,节省存储资源,并减少传输过程的带宽资源占用和数据处理时间,提高数据处理效率;且映射文件被修改时不会改变目标文件的文件内容,提高了目标文件的安全性和完整性。

Description

文件管理方法、装置、电子设备及存储介质
技术领域
本申请属于信息技术领域,尤其涉及一种文件管理方法、装置、电子设备及存储介质。
背景技术
在服务器、手机、网络电视等电子设备中,需要频繁进行数据访问,数据存储量大且均为多路并发上传下载,需要更高效的文件管理系统对数据进行管理,以提高数据处理效率。
目前的文件管理系统通常可以实现数据的快速上传和下载,而在大量数据对电子设备进行访问时,容易导致文件管理系统中存储有冗余文件,占用带宽资源和数据处理时间,使数据处理效率下降。
发明内容
有鉴于此,本申请实施例提供了一种文件管理方法、装置、电子设备及存储介质,以解决现有的文件管理系统中存储有冗余文件,占用带宽资源和数据处理时间,使数据处理效率下降的问题。
本申请实施例的第一方面提供了一种文件管理方法,包括:
确定与待上传文件对应的检索标识,其中,文件内容相同的文件所对应的检索标识相同,且文件内容不同的文件所对应的检索标识不同;
若标识库中不存在当前确定的检索标识,则接收所述待上传文件,并将当前确定的检索标识记录在所述标识库中;
若所述标识库中存在当前确定的检索标识,且所述待上传文件的上传任务与目标文件的上传任务不一致,则建立所述待上传文件至所述目标文件的映射关系,其中,所述映射关系用于将所述待上传文件的调用路径映射至所述目标文件的存储路径,所述目标文件为检索标识与当前确定的检索标识相同的已上传文件。
本申请实施例的第一方面提供一种文件管理方法,确定与待上传文件对应的检索标识;若标识库中不存在当前确定的检索标识,则接收待上传文件,并将当前确定的检索标识记录在标识库中;若标识库中存在当前确定的检索标识,且待上传文件的上传任务与目标文件的上传任务不一致,则建立待上传文件至目标文件的映射关系,使电子设备在响应待上传文件的调用指令时,可以在本地未存储待上传文件的情况下,为用户提供目标文件的映射文件,映射文件的文件内容与待上传文件的文件内容相同,通过避免重复数据的上传,减少了电子设备中的冗余文件,节省存储资源,减少数据传输过程的带宽资源占用和数据处理时间,提高数据处理效率;且映射文件被修改时不会改变目标文件的文件内容,避免目标文件的文件内容被修改,提高了目标文件的安全性和完整性。
本申请实施例的第二方面提供了一种文件管理装置,包括:
标识生成模块,用于确定与待上传文件对应的检索标识,其中,文件内容相同的文件所对应的检索标识相同,且文件内容不同的文件所对应的检索标识不同;
上传模块,用于若标识库中不存在当前确定的检索标识,则接收所述待上传文件,并将当前确定的检索标识记录在所述标识库中;
映射模块,用于若所述标识库中存在当前确定的检索标识,且所述待上传文件的上传任务与目标文件的上传任务不一致,则建立所述待上传文件至所述目标文件的映射关系,其中,所述映射关系用于将所述待上传文件的调用路径映射至所述目标文件的存储路径,所述目标文件为检索标识与当前确定的检索标识相同的已上传文件。
本申请实施例的第三方面提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例的第一方面提供的文件管理方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本申请实施例第一方面提供的文件管理方法的步骤。
可以理解的是,上述第二方面至第四方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的电子设备的结构示意图;
图2是本申请实施例提供的文件管理方法的第一种流程示意图;
图3是本申请实施例提供的多个电子设备进行文件管理交互时的场景示意图;
图4是本申请实施例提供的文件管理方法的第二种流程示意图;
图5是本申请实施例提供的文件管理方法的第三种流程示意图;
图6是本申请实施例提供的文件管理方法的第四种流程示意图;
图7是本申请实施例提供的文件管理装置的第一种结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
在应用中,目前的文件管理系统通常可以实现数据的快速上传和下载,而在大量数据对电子设备进行访问时,容易导致文件管理系统中存储有冗余文件,占用带宽资源和数据处理时间,使数据处理效率下降。
针对上述技术问题,本申请实施例提供一种文件管理方法,确定与待上传文件对应的检索标识;若标识库中不存在当前确定的检索标识,则接收待上传文件,并将当前确定的检索标识记录在标识库中;若标识库中存在当前确定的检索标识,且待上传文件的上传任务与目标文件的上传任务不一致,则建立待上传文件至目标文件的映射关系,使电子设备在响应待上传文件的调用指令时,可以在本地未存储待上传文件的情况下,为用户提供目标文件的映射文件,映射文件的文件内容与待上传文件的文件内容相同,通过避免重复数据的上传,减少了电子设备中的冗余文件,节省存储资源,减少数据传输过程的带宽资源占用和数据处理时间,提高数据处理效率;且映射文件被修改时不会改变目标文件的文件内容,避免目标文件的文件内容被修改,提高了目标文件的安全性和完整性。
本申请实施例提供的文件管理方法可以应用于具有数据存储功能的电子设备,电子设备可以接收并管理其他电子设备上传的数据,也可以发送数据至其他电子设备。电子设备可以是手机、平板电脑、可穿戴设备、车载设备、增强现实(Augmented Reality,AR)/虚拟现实(Virtual Reality,VR)设备、笔记本电脑、超级移动个人计算机(Ultra-MobilePersonal Computer,UMPC)、上网本、个人数字助理(Personal Digital Assistant,PDA)等。本申请实施例对电子设备的具体类型不作任何限制。
图1示例性的示出了电子设备100的结构示意图,电子设备100处理器10,存储器20,音频模块30,摄像模块40,传感器模块50,输入模块60,显示模块70、无线通信模块80及电源模块90等。其中,音频模块30可以包括扬声器31和麦克风32等,摄像模块40可以包括短焦摄像头41、长焦摄像头42及闪光灯43等,传感器模块50可以包括红外线传感器51、加速度传感器52、位置传感器53、指纹传感器54及虹膜传感器55等,输入模块60可以包括触控面板61和外接输入单元62等,无线通信模块80可以包括蓝牙、光无线通信(Optical Wireless)、移动通信(Mobile Communications)、无线局域网(Wireless Local Area Network,WLAN)、近场通信(Near Field Communication,NFC)和紫蜂协议(ZigBee)等无线通信单元。
在应用中,处理器10可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在应用中,存储器20在一些实施例中可以是电子设备的内部存储单元,例如电子设备的硬盘或内存。存储器20在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器20还可以既包括电子设备的内部存储单元也包括外部存储设备。存储器20用于存储操作系统、应用程序、引导装载程序(BootLoader)等计算机程序21。存储器20还可以用于暂时地存储已经输出或者将要输出的数据。
在应用中,显示模块70可以是直面屏、曲面屏或柔性屏,具体可以是折叠屏,折叠屏可以包括至少一块柔性屏,或者,折叠屏可以包括至少一块柔性屏以及至少一块直面屏或曲面屏,本申请实施例对显示模块70的具体类型不作任何限制。
可以理解的是,本申请实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括图形处理器等。图示的部件可以以硬件,软件或软件和硬件的组合实现。
如图2所示,本申请实施例提供的文件管理方法,包括如下步骤S201至步骤S203:
步骤S201、确定与待上传文件对应的检索标识,其中,文件内容相同的文件所对应的检索标识相同,且文件内容不同的文件所对应的检索标识不同。
在应用中,在电子设备接收到上传指令时,可以根据上传指令携带的待上传文件的文件内容,生成检索标识,检索标识可以用于表征多个文件之间的一致性,其中,对于文件内容相同的多个文件,所对应的检索标识均相同;对于文件内容不同的多个文件,所对应的检索标识各不相同。
在应用中,电子设备可以通过数据摘要算法根据待上传文件的文件内容生成检索标识,信息摘要算法可以是循环冗余校核(Cyclic Redundancy Check,CRC)算法,根据生成的检索标识的字节数量,具体可以是CRC8算法、CRC16算法或CRC32算法;也可以是消息摘要算法(Message Digest Algorithm,MD),根据消息摘要算法的版本类型,具体可以是MD1算法、MD2算法、MD3算法、MD4算法或MD5算法;还可以是安全散列算法(Secure HashAlgorithm,SHA),根据生成的检索标识的字节数量,具体可以是SHA-1算法、SHA-256算法、SHA-384算法或SHA512算法。本申请实施例对生成检索标识的具体算法类型不作任何限制。
在一个实施例中,步骤S201之前包括:
接收初始文件,记录与初始文件对应的检索标识和所述初始文件的存储路径。
在应用中,电子设备可以接收多个初始文件以用于建立标识库,对于每个初始文件,电子设备可以根据初始文件的文件内容生成检索标识,并记录存储路径,便于在接收到调用指令时,根据存储路径快速调用对应的初始文件。
在应用中,标识库还可以根据每个文件被调用的频率对所有文件进行排序,具体的,可以根据每个文件被调用的频率进行倒序排序,即被调用的频率越高,文件在标识库中的排序越靠前,使用户可以根据文件的排序直观地获取文件被调用的频率。
表1示例性的示出了标识库包含三个文件,并记录了三个文件的文件名、检索标识(采用MD5算法生成)、存储路径及调用频率时的标识库内容:
文件名 MD5值 存储路径 调用频率
File1 File1_MD5_Value Path_File1 Count_File1
File2 File2_MD5_Value Path_File2 Count_File2
File3 File3_MD5_Value Path_File3 Count_File3
表1
步骤S202、检测标识库中是否存在当前确定的检索标识。
在应用中,在确定待上传文件的检索标识后,可以根据当前确定的检索标识在标识库中进行查重,若标识库中不存在当前确定的检索标识,进入步骤S203,若标识库中存在当前确定的检索标识,进入步骤S204。
步骤S203、若标识库中不存在当前确定的检索标识,则接收待上传文件,并将当前确定的检索标识记录在标识库中。
在应用中,若标识库中不存在当前确定的检索标识,说明标识库中未存在与待上传文件的文件内容相同的已上传文件,则接收待上传文件以存储至电子设备本地,并将待上传文件记录至标识库中,以记录待上传文件的文件名、检索标识、存储路径及调用频率等信息。
步骤S204、若标识库中存在当前确定的检索标识,且待上传文件的上传任务与目标文件的上传任务不一致,则建立待上传文件至目标文件的映射关系,其中,映射关系用于将待上传文件的调用路径映射至目标文件的存储路径,目标文件为检索标识与当前确定的检索标识相同的已上传文件。
在应用中,若标识库中存在当前确定的检索标识,说明标识库中存在目标文件,目标文件为检索标识与当前确定的检索标识相同的已上传文件,检测待上传文件的上传任务与目标文件的上传任务是否一致,若不一致,说明标识库中存储有针对不同任务但包含相同文件内容的目标文件,建立待上传文件至目标文件的映射关系,使待上传文件的调用路径映射至目标文件的存储路径。
其中,上传任务可以通过读取上传指令获取,上传任务可以根据上传类型进行划分,也可以根据发起上传的应用(Application,APP)进行划分。
例如,在上传任务根据上传类型划分时,上传任务可以包括手动上传图像和根据预设同步周期自动上传图像等;在上传任务同时根据上传类型和发起上传的应用划分时,上传任务可以包括相册应用发起的手动上传图像,相册应用发起的手动上传图像根据预设同步周期自动上传图像,第三方应用发起的手动上传图像,或者是第三方应用发起的根据预设同步周期自动上传图像。
在应用中,基于上述映射关系,在接收到待上传文件的调用指令时,电子设备可以基于目标文件的存储路径生成映射文件,映射文件的文件内容和目标文件的文件内容一致,从而在未存储待上传文件的情况下为用户提供了与待上传文件相同的文件内容,减少了电子设备中的冗余文件,且映射文件被修改时不会改变目标文件的文件内容,避免目标文件的文件内容被修改,提高目标文件的安全性。
在表1的基础上,表2示例性的示出了包含映射关系时的标识库示意表。其中,File4为待上传文件,File3为与File4对应的目标文件,且File4的上传任务与File3的上传任务不一致,因此建立File4至File3的映射关系。
表2
在一个实施例中,步骤S204之后,还包括:
若待上传文件已建立至目标文件的映射关系,在接收到待上传文件的调用指令时,根据目标文件的存储路径生成副本文件以响应调用指令;
在调用指令结束时,删除副本文件。
在应用中,基于上述映射关系,在接收到待上传文件的调用指令时,还可以根据目标文件的存储路径生成副本文件响应调用指令,副本文件的文件内容和目标文件的文件内容一致,区别在于,副本文件可以在调用指令结束时自动删除,在为用户提供了与待上传文件相同的文件内容的同时,支持临时调用目标文件,减低目标文件的泄露风险,进一步提高目标文件的安全性。
在一个实施例中,步骤S202之后,还包括:
若标识库中存在当前确定的检索标识,且待上传文件的上传任务与目标文件的上传任务一致,则建立待上传文件的文件名与当前确定的检索标识的对应关系,其中,对应关系用于确定当前确定的检索标识所对应的目标文件或多个文件内容相同的文件,且多个文件内容相同的文件的调用路径为目标文件的存储路径。
在应用中,若标识库中存在当前确定的检索标识,且待上传文件的上传任务与目标文件的上传任务一致,说明标识库中已存储有针对相同任务的包含相同文件内容的目标文件。通过建立上述对应关系,可以在接收到待上传文件的调用指令时,电子设备可以通过直接调用目标文件实现用户对待上传文件的调用,从而在未存储待上传文件的情况下为用户提供了与待上传文件相同的文件内容,减少了电子设备中的冗余文件。
在应用中,确定与待上传文件对应的检索标识;若标识库中不存在当前确定的检索标识,则接收待上传文件,并将当前确定的检索标识记录在标识库中;若标识库中存在当前确定的检索标识,且待上传文件的上传任务与目标文件的上传任务不一致,则建立待上传文件至目标文件的映射关系,使电子设备在响应待上传文件的调用指令时,可以在本地未存储待上传文件的情况下,为用户提供目标文件的映射文件,映射文件的文件内容与待上传文件的文件内容相同,通过避免重复数据的上传,减少了电子设备中的冗余文件,节省存储资源,减少数据传输过程的带宽资源占用和数据处理时间,提高数据处理效率;且映射文件被修改时不会改变目标文件的文件内容,避免目标文件的文件内容被修改,提高了目标文件的安全性和完整性。
图3示例性的示出了多个电子设备进行文件管理交互时的场景示意图,其中,子电子设备101/102可以在本地运行文件管理方法,子电子设备101/102之间的数据可以互相传输,也可以将数据上传至主电子设备103,主电子设备103作为服务器运行文件管理方法,以接收并管理多个子电子设备101/102上传的数据。
如图4所示,在一个实施例中,基于图2所对应的实施例,包括如下步骤S401至步骤S407:
步骤S401、确定与待上传文件对应的检索标识,其中,文件内容相同的文件所对应的检索标识相同,且文件内容不同的文件所对应的检索标识不同;
步骤S402、检测标识库中是否存在当前确定的检索标识;
步骤S403、若标识库中不存在当前确定的检索标识,则接收待上传文件,并将当前确定的检索标识记录在标识库中;
在应用中,步骤S401至步骤S403提供的文件管理方法和上述步骤S201至步骤S203提供的文件管理方法一致,在此不再赘述。
步骤S404、检测待上传文件的上传任务与目标文件的上传任务是否一致。
在应用中,电子设备可以根据待上传文件的上传指令读取待上传文件的上传任务,并根据目标文件的上传指令读取目标文件的上传任务,若待上传文件的上传任务与目标文件的上传任务不一致,进入步骤S405,若待上传文件的上传任务与目标文件的上传任务一致,则检测是否接收到覆盖指令,若接收到覆盖指令,进入步骤S406,若未接收到覆盖指令,进入步骤S407。
步骤S405、若标识库中存在当前确定的检索标识,且待上传文件的上传任务与目标文件的上传任务不一致,则建立待上传文件至目标文件的映射关系,其中,映射关系用于将待上传文件的调用路径映射至目标文件的存储路径,目标文件为检索标识与当前确定的检索标识相同的已上传文件。
在应用中,步骤S405可以参照上述步骤S204的相关描述,在此不再赘述。
步骤S406、若标识库中存在当前确定的检索标识,且待上传文件的上传任务与目标文件的上传任务一致,则在接收到覆盖指令时,将目标文件的文件名替换为待上传文件的文件名,以建立待上传文件的文件名与当前确定的检索标识的对应关系;
步骤S407、若标识库中存在当前确定的检索标识,且待上传文件的上传任务与目标文件的上传任务一致,则在未接收到覆盖指令时,保留目标文件的文件名与当前确定的检索标识的对应关系,并建立待上传文件的文件名与当前确定的检索标识的对应关系。
在应用中,覆盖指令用于确定是否将目标文件的文件名替换为待上传文件的文件名。具体的,若接收到覆盖指令,将目标文件的文件名替换为待上传文件的文件名,以建立待上传文件的文件名与当前确定的检索标识的对应关系,从而在接收到待上传文件的调用指令时,电子设备可以通过直接调用目标文件实现用户对待上传文件的调用,且删除了目标文件的文件名与当前确定的检索标识的对应关系,用户无法在标识库中根据目标文件的文件名检索到任何文件。
在表1的基础上,表3示例性的示出了接收到覆盖指令并将目标文件的文件名替换为待上传文件的文件名时的标识库示意表。其中,File100为待上传文件,File3为目标文件,File100的上传任务与File3的上传任务一致且接收到了覆盖指令。
文件名 MD5值 存储路径 检索频率
File1 File1_MD5_Value Path_File1 Count_File1
File2 File2_MD5_Value Path_File2 Count_File2
File100 File3_MD5_Value Path_File3 Count_File3
表3
在应用中,若未接收到覆盖指令,在保留目标文件的文件名与当前确定的检索标识的对应关系的同时,建立待上传文件的文件名与当前确定的检索标识的对应关系,使当前确定的检索标识同时对应目标文件的文件名和待上传文件的文件名。
在表1的基础上,表4示例性的示出了未接收到覆盖指令时,保留目标文件的文件名与当前确定的检索标识的对应关系,并建立待上传文件的文件名与当前确定的检索标识的对应关系时的标识库示意图。其中,File200为待上传文件,File3为目标文件,File200的上传任务与File3的上传任务一致且未接收到覆盖指令。
文件名 MD5值 存储路径 检索频率
File1 File1_MD5_Value Path_File1 Count_File1
File2 File2_MD5_Value Path_File2 Count_File2
File3/File200 File3_MD5_Value Path_File3 Count_File3
表4
在应用中,通过根据是否接收到覆盖指令,可以灵活调整当前确定的检索标识与目标文件的文件名和待上传文件的文件名的对应关系,提高了标识库对文件的管理能力。
如图5所示,本申请实施例提供的另一种文件管理方法,基于图2或图4所对应的实施例,包括如下步骤S501至步骤S503:
步骤S501、在接收到删除指令时,基于待删除文件获取文件特征;待删除文件为删除指令携带的参考文件,或者,为标识库中的任一已上传文件。
在应用中,在前述文件管理方法的基础上,电子设备还可以接收删除指令,删除指令可以携带参考文件以作为待删除文件,也可以指定标识库中的任一已上传文件作为待删除文件。
在应用中,电子设备可以基于待删除文件获取文件特征,具体的,可以根据待删除文件的文件类型确定文件特征的提取方法,例如,在待删除文件的文件类型为图像时,可以采用预设的图像特征提取算法获取图像特征;在待删除文件的文件类型为文本时,可以采用预设的语义识别算法获取语义特征;在待删除文件的文件类型为表格(例如Excel文件)时,可以识别表格中的数值或文字作为关键字特征。
步骤S502、根据文件特征在标识库中进行检索,获取相似文件。
在应用中,电子设备可以根据文件特征在标识库中进行检索,获取相似文件。具体的,针对标识库中每个已上传文件,获取已上传文件的文件特征和待删除文件的文件特征的重合比例,若重合比例大于预设重合比例,将相应已上传文件记为相似文件。其中,预设重合比例可以是100%,即已上传文件的文件特征和待删除文件的文件特征完全相同,预设重合比例也可以是90%、80%等,本申请实施例对预设重合比例的具体数值不作任何限制。
在一个实施例中,待删除文件的文件类型为图像,文件特征为图像特征,步骤S502包括:
通过相似图算法和/或聚类算法根据图像特征在标识库中进行检索,获取相似图像。
在应用中,待删除文件的文件类型为图像,可以将相似图算法和/或聚类算法作为预设的图像特征提取算法,获取待删除文件的图像特征,并根据上述图像特征在标识库中进行检索,获取相似图像。检索相似图像的方法可以参照步骤S502中的相关描述,在此不再赘述。
步骤S503、删除待删除文件和相似文件。
在应用中,在获取到相似文件后,可以将存储于电子设备的相似文件和待删除文件进行删除,并删除相似文件和待删除文件在标识库中的相关信息,例如文件名、检索标识、存储路径、调用频率、映射关系等信息。
在应用中,通过在接收到删除指令时,根据待删除文件检索获取相似文件,并删除待删除文件和相似文件,使电子设备可以基于用户提供的参考文件或标识库中的任一已上传文件,遍历整个标识库查找相似文件,实现对相似文件的聚类,提高了删除效率并有效精简了标识库,降低标识库中存储的已上传文件的冗余程度。
如图6所示,在一个实施例中,基于图5所对应的实施例,包括如下步骤S601至步骤S605:
步骤S601、在接收到删除指令时,确定与参考文件对应的检索标识;
步骤S602、若标识库中存在当前确定的检索标识,则根据目标文件进行特征提取,得到文件特征;
步骤S603、若标识库中不存在当前确定的检索标识,则根据参考文件进行特征提取,得到文件特征。
在应用中,在接收到删除指令时,可以确定与参考文件对应的检索标识,检索标识的确定方法可以参照上述步骤S201中的相关描述,在此不再赘述。
在应用中,可以判断标识库中是否存在当前确定的检索标识,若存在,进入步骤S602,直接根据目标文件进行特征提取,得到文件特征;若不存在,进入步骤S603,接收参考文件并根据参考文件进行特征提取,得到文件特征。
步骤S604、根据文件特征在标识库中进行检索,获取相似文件;
步骤S605、删除待删除文件和相似文件。
在应用中,步骤S604和步骤S605提供的文件管理方法和上述步骤S502和步骤S503提供的文件管理方法一致,在此不再赘述。
在应用中,在接收到删除指令时,可以先基于参考文件确定检索标识,并判断标识库中是否存在检索标识与当前确定的检索标识相同的已上传文件(即目标文件),若存在,则不接收参考文件,直接基于目标文件获取相似文件,从而提高数据处理效率;若不存在,则接收并根据参考文件获取相似文件,提高响应删除指令时的灵活性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
如图7所示,本申请实施例还提供一种文件管理装置200,用于执行上述文件管理方法实施例中的步骤。文件管理装置200可以是终端设备中的虚拟装置(virtualappliance),由终端设备的处理器运行,也可以是终端设备本身。
如图7所示,本申请实施例提供的文件管理装置200,包括:
标识生成模块210,用于确定与待上传文件对应的检索标识,其中,文件内容相同的文件所对应的检索标识相同,且文件内容不同的文件所对应的检索标识不同;
上传模块220,用于若标识库中不存在当前确定的检索标识,则接收待上传文件,并将当前确定的检索标识记录在标识库中;
映射模块230,用于若标识库中存在当前确定的检索标识,且待上传文件的上传任务与目标文件的上传任务不一致,则建立待上传文件至目标文件的映射关系,其中,映射关系用于将待上传文件的调用路径映射至目标文件的存储路径,目标文件为检索标识与当前确定的检索标识相同的已上传文件。
在一个实施例中,文件管理装置200还包括:
第一响应单元,用于若所述待上传文件已建立至所述目标文件的映射关系,在接收到所述待上传文件的调用指令时,根据所述目标文件的存储路径生成副本文件以响应所述调用指令;
在所述调用指令结束时,删除所述副本文件。
在一个实施例中,文件管理装置200还包括:
对应模块,用于若所述标识库中存在当前确定的检索标识,且所述待上传文件的上传任务与目标文件的上传任务一致,则建立所述待上传文件的文件名与所述当前确定的检索标识的对应关系,其中,所述对应关系用于确定所述当前确定的检索标识所对应的目标文件或多个文件内容相同的文件,且所述多个文件内容相同的文件的调用路径为所述目标文件的存储路径。
在一个实施例中,文件管理装置200还包括:
删除模块,用于在接收到删除指令时,基于待删除文件获取文件特征;所述待删除文件为所述删除指令携带的参考文件,或者,为所述标识库中的任一已上传文件;
根据所述文件特征在所述标识库中进行检索,获取相似文件;
删除所述待删除文件和所述相似文件。
在应用中,文件管理装置200中的各模块可以为软件程序模块,也可以通过处理器中集成的不同逻辑电路实现,还可以通过多个分布式处理器实现。
需要说明的是,上述模块之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见文件管理方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中,上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中模块的具体工作过程,可以参考前述文件管理方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述文件管理方法实施例中的步骤。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质至少可以包括:能够将计算机程序代码携带到拍照终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的终端设备和方法,可以通过其它的方式实现。例如,以上所描述的终端设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或模块的间接耦合或通讯连接,可以是电性,机械或其它的形式。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种文件管理方法,其特征在于,包括:
确定与待上传文件对应的检索标识,其中,文件内容相同的文件所对应的检索标识相同,且文件内容不同的文件所对应的检索标识不同;
若标识库中不存在当前确定的检索标识,则接收所述待上传文件,并将当前确定的检索标识记录在所述标识库中;
若所述标识库中存在当前确定的检索标识,且所述待上传文件的上传任务与目标文件的上传任务不一致,则建立所述待上传文件至所述目标文件的映射关系,其中,所述映射关系用于将所述待上传文件的调用路径映射至所述目标文件的存储路径,所述目标文件为检索标识与当前确定的检索标识相同的已上传文件。
2.如权利要求1所述的文件管理方法,其特征在于,所述方法还包括:
若所述待上传文件已建立至所述目标文件的映射关系,在接收到所述待上传文件的调用指令时,根据所述目标文件的存储路径生成副本文件以响应所述调用指令;
在所述调用指令结束时,删除所述副本文件。
3.如权利要求1所述的文件管理方法,其特征在于,所述方法还包括:
若所述标识库中存在当前确定的检索标识,且所述待上传文件的上传任务与目标文件的上传任务一致,则建立所述待上传文件的文件名与所述当前确定的检索标识的对应关系,其中,所述对应关系用于确定所述当前确定的检索标识所对应的目标文件或多个文件内容相同的文件,且所述多个文件内容相同的文件的调用路径为所述目标文件的存储路径。
4.如权利要求2所述的文件管理方法,其特征在于,所述建立所述待上传文件的文件名与所述当前确定的检索标识的对应关系,包括:
在接收到覆盖指令时,将所述目标文件的文件名替换为所述待上传文件的文件名,以建立所述待上传文件的文件名与所述当前确定的检索标识的对应关系;
在未接收到覆盖指令时,保留所述目标文件的文件名与所述当前确定的检索标识的对应关系,并建立所述待上传文件的文件名与所述当前确定的检索标识的对应关系。
5.如权利要求1至4任一项所述的文件管理方法,其特征在于,所述方法还包括:
在接收到删除指令时,基于待删除文件获取文件特征;所述待删除文件为所述删除指令携带的参考文件,或者,为所述标识库中的任一已上传文件;
根据所述文件特征在所述标识库中进行检索,获取相似文件;
删除所述待删除文件和所述相似文件。
6.如权利要求5所述的文件管理方法,其特征在于,所述在接收到删除指令时,基于待删除文件获取文件特征,包括:
在接收到删除指令时,确定与参考文件对应的检索标识;
若所述标识库中存在当前确定的检索标识,则根据目标文件进行特征提取,得到文件特征;
若所述标识库中不存在当前确定的检索标识,则根据所述参考文件进行特征提取,得到文件特征。
7.如权利要求5所述的文件管理方法,其特征在于,所述待删除文件的文件类型为图像,所述文件特征为图像特征,所述根据所述文件特征在所述标识库中进行检索,获取相似文件,包括:
通过相似图算法和/或聚类算法根据所述图像特征在所述标识库中进行检索,获取相似图像。
8.一种文件管理装置,其特征在于,包括:
标识生成模块,用于确定与待上传文件对应的检索标识,其中,文件内容相同的文件所对应的检索标识相同,且文件内容不同的文件所对应的检索标识不同;
上传模块,用于若标识库中不存在当前确定的检索标识,则接收所述待上传文件,并将当前确定的检索标识记录在所述标识库中;
映射模块,用于若所述标识库中存在当前确定的检索标识,且所述待上传文件的上传任务与目标文件的上传任务不一致,则建立所述待上传文件至所述目标文件的映射关系,其中,所述映射关系用于将所述待上传文件的调用路径映射至所述目标文件的存储路径,所述目标文件为检索标识与当前确定的检索标识相同的已上传文件。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述文件管理方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述文件管理方法的步骤。
CN202211346548.2A 2022-10-31 2022-10-31 文件管理方法、装置、电子设备及存储介质 Pending CN117992411A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211346548.2A CN117992411A (zh) 2022-10-31 2022-10-31 文件管理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211346548.2A CN117992411A (zh) 2022-10-31 2022-10-31 文件管理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117992411A true CN117992411A (zh) 2024-05-07

Family

ID=90885926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211346548.2A Pending CN117992411A (zh) 2022-10-31 2022-10-31 文件管理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117992411A (zh)

Similar Documents

Publication Publication Date Title
JP5497206B2 (ja) ディレクトリエントリを処理するための方法及びコンピュータ装置
US9614893B2 (en) Method, apparatus and system for auto-synchronization of compressed content files
US20090157716A1 (en) Apparatus and method for acquiring data from memory of terminal
CN103873575B (zh) 基于wifi用户界面进行应用操作的方法及设备
US20080005697A1 (en) Mobile terminal having function of managing file and folder
US20150215399A1 (en) Terminal and server performing data synchronization
CN112654974B (zh) 一种文件扫描方法、文件扫描装置及终端设备
CN112286457B (zh) 对象重删方法、装置、电子设备及机器可读存储介质
JPWO2006001507A1 (ja) 情報提供システム、情報提供サーバ、携帯端末、情報提供制御プログラム及び携帯端末制御プログラム
CN111090623B (zh) 一种数据审计方法、装置、电子设备及存储介质
CN117992411A (zh) 文件管理方法、装置、电子设备及存储介质
CN112988663A (zh) 文件存储方法和电子设备
CN112559913A (zh) 一种数据处理方法、装置、计算设备及可读存储介质
CN117708212A (zh) 元数据采集方法、装置及电子设备
CN112347046B (zh) 一种获取分布式系统中文件的创建时间的方法
US12001400B2 (en) Method and apparatus for synchronizing file
CN112817782B (zh) 一种数据采集上报方法、装置、电子设备和存储介质
CN115509990A (zh) 电子文件归档方法、装置、系统与计算机可读存储介质
US20130218851A1 (en) Storage system, data management device, method and program
CN116010347A (zh) 资源更新方法、装置、系统、电子设备及存储介质
CN110597576B (zh) 一种文件备注处理方法、系统
CN109325057B (zh) 中间件管理方法、装置、计算机设备以及存储介质
CN112988684A (zh) 一种基于哈希算法电子公文数据的提取和去重方法及系统
WO2017075194A1 (en) Efficient differential techniques for metafiles
CN111522780B (zh) 一种记录文件创建者信息的方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination