CN111078643B - 一种批量删除文件的方法、装置及电子设备 - Google Patents

一种批量删除文件的方法、装置及电子设备 Download PDF

Info

Publication number
CN111078643B
CN111078643B CN201911295135.4A CN201911295135A CN111078643B CN 111078643 B CN111078643 B CN 111078643B CN 201911295135 A CN201911295135 A CN 201911295135A CN 111078643 B CN111078643 B CN 111078643B
Authority
CN
China
Prior art keywords
deleted
file
files
operation information
directory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911295135.4A
Other languages
English (en)
Other versions
CN111078643A (zh
Inventor
张鼎鸿
豆文明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Big Data Technologies Co Ltd
Original Assignee
New H3C Big Data Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Big Data Technologies Co Ltd filed Critical New H3C Big Data Technologies Co Ltd
Priority to CN201911295135.4A priority Critical patent/CN111078643B/zh
Publication of CN111078643A publication Critical patent/CN111078643A/zh
Application granted granted Critical
Publication of CN111078643B publication Critical patent/CN111078643B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/162Delete operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1734Details of monitoring file system events, e.g. by the use of hooks, filter drivers, logs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种批量删除文件的方法、装置及电子设备。其中,所述方法包括:获取针对多个待删除文件的删除操作的操作信息;将所有获取到的操作信息记录于事件日志中的同一事件,所述事件日志用于记录对所述分布式存储系统中文件所进行的操作;读取所述事件日志,获取所述事件日志所记录的操作信息;依次针对每个获取到的操作信息,执行该操作信息所表示的删除操作。可以将针对多个待删除文件各自的删除操作的操作信息合并写入事件日志中,减少了向事件日志中写入操作信息的次数,从而有效减少记录操作信息的次数,减少了与日志进程交互所花费的时间,可以有效节省批量删除所花费的时间,提高批量删除的效率。

Description

一种批量删除文件的方法、装置及电子设备
技术领域
本发明涉及分布式存储技术领域,特别是涉及一种批量删除文件的方法、装置及电子设备。
背景技术
出于实际需求,用户可能需要删除分布式存储系统中的多个文件,以linux操作系统为例,用户可以通过-rm–rf指令删除指定目录下的所有文件。相关技术中,可以调用删除进程,依次针对每个文件,将针对该文件的删除操作的操作信息作为一个事件记录于事件日志中,再通过回调处理,依次针对事件日志中所记录的每个事件,执行该事件中所记录的操作信息所表示的删除操作,以删除这多个文件。
但是,由于进程间通信存在一定延时,因此删除进程向用于管理事件日志的进程(下文称日志进程)请求以向管理事件日志中写入事件,需要花费一定时间。示例性的,如果需要删除100万个文件,由于需要记录100万个事件,因此删除进程需要向日志进程请求100万次,而这100万次请求将花费较多时间,导致删除文件的效率较低。
发明内容
本发明实施例的目的在于提供一种批量删除文件的方法、装置及电子设备,以实现提高删除文件的效率,节省删除多个文件所花费的时间。具体技术方案如下:
在本发明实施例的第一方面,提供了一种批量删除文件的方法,所述方法包括:
获取针对多个待删除文件的删除操作的操作信息;
将所有获取到的操作信息记录于事件日志中的同一事件,所述事件日志用于记录对所述分布式存储系统中文件所进行的操作;
读取所述事件日志,获取所述事件日志所记录的操作信息;
依次针对每个获取到的操作信息,执行该操作信息所表示的删除操作。
在一种可能的实现方式中,所述依次针对每个获取到的操作信息,执行该操作信息所表示的删除操作,包括:
将获取到的操作信息缓存为操作信息队列;
重复执行以下操作直至所述操作信息队列为空:
针对所述操作信息队列中最后一个操作信息,执行该操作信息所表示的删除操作,以删除该操作信息对应的待删除文件;
删除所述操作信息队列中最后一个操作信息。
在一种可能的实现方式中,述方法还包括:
在接收到客户端针对目标目录的删除指令时;
将所述目标目录下包括的文件作为待删除文件,转移至预设缓存目录下,所述预设缓存目录为客户端无法访问的目录;
向所述客户端反馈用于表示已经完成所述删除指令的反馈信息;
所述获取针对多个待删除文件的删除操作的操作信息,包括:
针对所述预设缓存目录下的多个待删除文件,生成针对所述多个待删除文件的删除操作的操作信息。
在一种可能的实现方式中,所述预设缓存目录中属于同一目录下的所有待删除文件被预先划分为至少一个目录分片,每个目录分片中所包括的待删除文件的数量不多于预设数量阈值;
所述针对所述预设缓存目录下的多个待删除文件,生成针对所述多个待删除文件的删除操作的操作信息,包括:
遍历所述缓存目录,以检索所述缓存目录中是否存在非空目录分片;
每当检索到非空目录分片,如果该非空目录分片中包括多个待删除文件,生成针对所述多个待删除文件的删除操作的操作信息。
在一种可能的实现方式中,在所述将所有获取到的操作信息记录于事件日志中的同一事件之前,所述方法还包括:
请求获取所述多个待删除文件的文件锁;
每成功获取到一个待删除文件的文件锁,标记该一个待删除文件;
请求获取所述多个待删除文件中未标记的待删除文件的文件锁,直至成功获取所述多个待删除文件的文件锁。
在一种可能的实现方式中,所述请求获取所述多个待删除文件中未标记的待删除文件的文件锁,直至成功获取所述多个待删除文件的文件锁,包括:
依次针对所述多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记;
如果该待删除文件未被标记,请求该待删除文件的文件锁;
返回执行所述依次针对所述多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记的步骤,直至成功获取所述多个待删除文件的文件锁。
在本发明实施例的第二方面,提供了一种批量删除文件的装置,所述装置包括:
信息获取模块,用于获取针对多个待删除文件的删除操作的操作信息;
日志记录模块,用于将所有获取到的操作信息记录于事件日志中的同一事件,所述事件日志用于记录对所述分布式存储系统中文件所进行的操作;
日志读取模块,用于读取所述事件日志,获取所述事件日志所记录的操作信息;
回调模块,用于依次针对每个获取到的操作信息,执行该操作信息所表示的删除操作。
在一种可能的实现方式中所述回调模块,具体用于将获取到的操作信息缓存为操作信息队列;
重复执行以下操作直至所述操作信息队列为空:
针对所述操作信息队列中最后一个操作信息,执行该操作信息所表示的删除操作,以删除该操作信息对应的待删除文件;
删除所述操作信息队列中最后一个操作信息。
在一种可能的实现方式中,所述装置还包括操作转换模块,用于在接收到客户端针对目标目录的删除指令时;
将所述目标目录下包括的文件作为待删除文件,转移至预设缓存目录下,所述预设缓存目录为客户端无法访问的目录;
向所述客户端反馈用于表示已经完成所述删除指令的反馈信息;
所述信息获取模块,具体用于针对所述预设缓存目录下的多个待删除文件,生成针对所述多个待删除文件的删除操作的操作信息。
在一种可能的实现方式中,所述预设缓存目录中属于同一目录下的所有待删除文件被预先划分为至少一个目录分片,每个目录分片中所包括的待删除文件的数量不多于预设数量阈值;
所述信息获取模块,具体用于遍历所述缓存目录,以检索所述缓存目录中是否存在非空目录分片;
每当检索到非空目录分片,如果该非空目录分片中包括多个待删除文件,生成针对所述多个待删除文件的删除操作的操作信息。
在一种可能的实现方式中,所述装置还包括,拿锁模块,用于请求获取所述多个待删除文件的文件锁;
每成功获取到一个待删除文件的文件锁,标记该一个待删除文件;
请求获取所述多个待删除文件中未标记的待删除文件的文件锁,直至成功获取所述多个待删除文件的文件锁。
在一种可能的实现方式中,所述拿锁模块,具体用于依次针对所述多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记;
如果该待删除文件未被标记,请求该待删除文件的文件锁;
返回执行所述依次针对所述多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记的步骤,直至成功获取所述多个待删除文件的文件锁。
在本发明实施例的第三方面,提供了一种电子设备,包括:
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面任一所述的方法步骤。
在本发明实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一所述的方法步骤。
本发明实施例提供的批量删除文件的方法、装置及电子设备,可以将针对多个待删除文件各自的删除操作的操作信息合并写入事件日志中,减少了向事件日志中写入操作信息的次数,相较于相关技术中,删除每个文件时都会针对删除该文件的删除文件记录一条事件日志,可以有效减少记录操作信息的次数,减少了与日志进程交互所花费的时间,可以有效节省批量删除所花费的时间,提高批量删除的效率。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的批量删除文件的方法的一种流程示意图;
图2为本发明实施例提供的批量删除文件的拿锁方法的一种流程示意图;
图3为本发明实施例提供的批量删除文件的装置的一种结构示意图;
图4为本发明实施例提供的电子设备的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以linux系统为例,-rm-rf指令是一种常用的用于批量删除的指令,该指令可以用于删除指定目录下的所有文件。在实现该指令时,由于存储文件磁盘响应较慢,因此删除进程可以向日志进程发送请求,以将针对每个待删除文件的删除操作的操作信息记录在事件日志中,事件日志中的每个事件记录一个操作信息。在完成事件的记录后,通过回调函数,依次针对事件日志中的每个事件,获取该事件所记录的操作信息,并执行该操作信息所表示的删除操作,以在磁盘中删除该操作信息对应的待删除文件。但是,如果指定目录下存在100万个文件,则删除进程需要至少向管理事件日志的后台进程发送100万个请求,受限制于进程间通信的延时,则删除这100万个文件至少需要花费100万个延时的时长,可见删除这些文件花费的时长较长,删除文件的效率较低。
基于此,本发明实施例提供了一种批量删除文件的方法,可以参见图1,图1所示为本发明实施例提供的批量删除文件的方法的一种流程示意图,可以包括:
S101,获取针对多个待删除文件的删除操作的操作信息。
S102,将所有获取到的操作信息记录于事件日志中的同一事件。
S103,读取事件日志,获取事件日志所记录对的操作信息。
S104,依次针对每个获取到的操作信息,执行该操作信息所表示的删除操作。
选用该实施例,可以将针对多个待删除文件各自的删除操作的操作信息合并写入事件日志中,减少了向事件日志中写入操作信息的次数,相较于相关技术中,删除每个文件时都会针对删除该文件的删除文件记录一条事件日志,可以有效减少记录操作信息的次数,减少了与日志进程交互所花费的时间,可以有效节省批量删除所花费的时间,提高批量删除的效率。
其中,S101中的多个待删除文件可以是所有待删除文件,也可以是部分待删除文件。多个待删除文件中所包括的待删除文件的数量,可以根据应用场景的不同而不同,本实施例对此不做限制。
S102中,事件日志用于记录对分布式存储系统中文件所进行的操作。将多个操作信息记录于同一个事件,可以是指针对多个操作信息,合并向日志进程发送合并请求,以将多个操作信息记录于事件日志中的同一个事件中。
在一种可能的实施例中,S104可以是删除进程将获取到的所有操作信息缓存为操作信息队列,重复执行以下步骤直至操作信息队列为空:
针对操作信息队列中最后一个操作信息,执行该操作信息所表示的删除操作,以删除该操作信息对应的待删除文件;删除操作信息队列中最后一个操作信息,确定删除后操作信息队列中新的最后一个操作信息。
示例性的,假设读取到操作信息1-3,可以缓存为操作信息队列{操作信息1,操作信息2,操作信息3},操作信息队列中各操作信息的顺位可以根据实际需求进行排列,则可以针对操作信息3,执行操作信息3所表示的删除操作,以删除操作信息3对应的待删除文件,并在操作信息队列中删除操作信息3,此时操作信息队列为{操作信息1,操作信息2},新的最后一个操作信息为操作信息2,则可以针对操作信息2,执行操作信息2所表示的删除操作,删除操作信息2对应的待删除文件,并在操作信息队列中删除操作信息2。此时操作信息队列为{操作信息1},新的最后一个操作信息为操作信息1,则可以针对操作信息1,执行操作信息1所表示的删除操作,删除操作信息1对应的待删除文件,并在操作信息队列中删除操作信息1,此时操作信息队列为空。以linux系统为例,该流程可以是通过pop函数实现的,pop函数用于删除队列中最后一个元素,并获取删除最后一个元素后的队列中新的最后一个元素,示例性的,对于操作信息队列{操作信息1,操作信息2,操作信息3},执行pop函数,则可以获取到操作信息2,并且操作信息队列变化为{操作信息1,操作信息2}。
在一些应用场景中,客户端在执行业务的过程中可能需要批量删除目标目录下的所有文件,则客户端可以中断业务的执行,并向分布式存储系统发送针对目标目录的删除指令,分布式存储系统按照该删除指令,删除目标目录以及目标目录下的所有文件,在删除目标目录以及目标目录下的所有文件后,分布式存储系统向客户端反馈用于表示已经完成该删除指令的反馈信息。客户端在接收到该反馈信息后,继续业务的执行。但是,删除文件需要花费一定时间,当目标目录下包括大量文件时,删除目标目录下的所有文件可能需要花费大量时间。导致客户端中断业务时间过长,致使客户端的业务凋零。
基于此,在一种可能的实现方式中,分布式存储系统可以在接收到针对目标目录的删除指令时,将目标目录下包括的文件作为待删除文件,转移至预设缓存目录下,并向客户端反馈用于表示已经完成删除指令的反馈信息。为了更好的说明将待删除文件转移至预设缓存目录的实现方式,在这里以linux操作系统为例,预设缓存目录命名为./rmdir为例进行说明。其中,为了防止有其他目录访问该预设缓存目录,应当锁定该预设缓存目录。对于其他操作系统,由于原理是相同的,因此不在此赘述。
在现有技术中,rmdir命令为删除命令,具体在应用时,可以利用rmdir+文件夹名称的方式删除上述文件夹名称对应的非空文件夹。在本实施所提供的方法中,可以通过rmdir与拓展属性标识相组合,表示批量删除。在接收到针对目标目录的rmdir操作指令后,如果该rmdir操作指令用于表示批量删除,则将该操作指令转换为rename操作指令,以将目标目录中的所有文件转移至./rmdir目录下,示例性的,假设接收到的rmdir操作指令为rmdir a/b,即目标目录为目录/a下的目录/b,如果该rmdir操作指令用于表示批量删除,则可以将该rmdir操作指令转换为rename a/b/.rmdir/a/b,以将目录/b所包括的文件转移至目录/.rmdir下。./rmdir为预设的用于存储待删除文件的目录,该目录无法被客户端访问,因此对于客户端,被转移至该目录下的文件可以视为已经被逻辑删除。如果该rmdir操作指令用于表示常规删除,则可以按照相关技术中任一删除文件的流程删除目标目录。可以是根据rmdir操作指令是否具有muti del扩展属性判断rmdir操作指令是否表示批量删除,如果rmdir操作指令中具有muti del扩展属性,则可以确定该rmdir操作指令表示批量删除,如果rmdir操作指令中不具有muti del扩展属性,则可以确定rmdir操作指令表示常规删除。在其他可能的应用场景中,也可以是其他方式确定rmdir操作指令表示批量删除或常规删除。
选用该实施例,可以实现异步化删除,通过将删除操作转换为转移操作,将目标目录下的文件转移至预设缓存目录,以逻辑删除目标目录下的文件,使得分布式存储系统能够尽快向客户端反馈用于表示已经完成删除指令的反馈信息,避免因客户端因中断业务时间过长,导致业务凋零。
可以理解的是,目标目录所包括的文件转移至预设缓存目录是将目标目录所包括的文件逻辑删除,分布式存储系统还需要继续物理删除这些文件。在一种可能的实施例中,分布式存储系统可以针对缓存目录下的多个待删除文件,生成针对多个待删除文件的删除操作的操作信息,以物理删除这些待删除文件。下面将对分布式存储系统对预设缓存目录所包括的待删除文件进行物理删除的流程进行详细说明。
在一种可能的实施例中,预设缓存目录中属于同一目录下的所有待删除文件被预先划分为至少一个目录分片,目录分片为一种逻辑结构,每个目录分片中所包括的待删除文件的数量不多于预设数量阈值。目录分片可以是根据预设规则进行划分的,示例性的,可以是将同一目录下的第1至第500个文件划分至一个目录分片,第501至第1000个文件划分至一个目录分片,以此类推,每个目录分片所包括的文件的数量不多于500个。
分布式存储系统可以维护一个定时进程,该定时进程定期遍历该缓存目录,以检索缓存目录中是否存在非空目录分片,非空目录分片是指该目录分片中至少包括一个待删除文件。每当定时进程检索到非空目录分片,如果该非空目录分片包括多个待删除文件,则定时进程可以生成针对这多个待删除文件的删除操作的操作信息,并将这些操作信息发送至删除进程,删除进程可以针对这些操作信息,合并向日志进程发送请求,以将这些操作信息记录于事件日志中的同一条日志。分布式操作系统调用回调函数,以读取事件日志,获取事件日志所记录的操作信息,并依次针对每个获取到的操作信息,执行该操作信息所表示的删除操作,以删除该多个待删除文件。每当定时进程检索到一个目录下的所有目录分片均为空,则可以删除该目录。
在删除待删除文件前,删除进程需要先获取多个待删除文件的文件锁,以防止其他进程对待删除文件进行修改。在一种可能的实施例中,可以是按照预设顺序,依次请求获取多个待删除文件的文件锁,如果至少一个待删除文件的文件锁获取失败,则再次依次请求获取这多个待删除文件的文件锁,对于请求获取到的文件锁,如果该文件锁已经在先前的请求中已经成功获取,则释放该文件锁,如果该文件锁尚未在先前的请求中成功获取,则保存该文件锁。直至成功获取多个待删除文件中每个待删除文件的文件锁。
示例性的,假设存在10个待删除文件,分别记为待删除文件1-10,则可以是从待删除文件1开始直至待删除文件10,依次申请每个待删除文件的文件锁。假设待删除文件7的文件锁获取失败,则再次从待删除文件1开始至直至待删除文件10,依次申请每个待删除文件的文件锁,对于待删除文件7,假设本次所有待删除文件的文件锁均获取成功,则对于待删除文件1-6、8-10,释放本次获取到的文件锁,对于待删除文件7,保存本次获取到的文件锁。
但是,假设待删除文件中所包括的待删除文件的数目为N,并且该方法失败获取次数为M,则需要请求N*(M+1)次以获取文件锁,当待删除文件的数目较多时,该请求次数较多,由于该请求同样存在延时,可能导致批量删除效率较低。
有鉴于此,可以参见图2,图2所示为本发明实施例提供的批量删除文件的拿锁方法的一种流程示意图,可以包括:
S201,请求获取多个待删除文件的文件锁。
S202,每成功获取到一个待删除文件的文件锁,标记该一个待删除文件。
示例性的,假设成功获取待删除文件1的文件锁,则可以标记待删除文件1,标记的方式根据应用场景的不同可以不同,示例性的,可以维护一个数组,该数组中的每个元素用于表示一个待删除文件,每个元素的初始值为0,每当成功获取一个待删除文件的文件锁,则该该数组中将表示该待删除文件的元素的数值设置为1。
S203,请求获取多个待删除文件中未标记的待删除文件的文件锁,直至成功获取多个待删除文件的文件锁。
示例性的,假设一共有待删除文件1-10,其中待删除文件1-9已经被标记,则请求获取待删除文件10的文件锁。在一种可能的实施例中,可以是依次针对多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记,如果该待删除文件未被标记,则请求该待删除文件的文件锁,如果该待删除文件未被标记,则拒绝重复请求该待删除文件的文件锁。在遍历所有待删除文件后,如果所有待删除文件已经被被标记,则可以认为已经成功获取多个待删除文件中所有待删除文件的文件锁,如果尚有待删除文件未被标记,则可以认为尚未成功获取多个待删除文件中所有待删除文件的文件锁,因此再次按照上述流程遍历所有待删除文件,直至成功获取多个待删除文件中所有待删除文件的文件锁。
选用该实施例,假设共计有N个待删除文件,请求获取文件锁失败的次数为M次,则需要请求N+M次以获取文件锁,相比于N*(M+1),可以有效减少请求的次数,例如,以N=100000,M=10为例,选用该实施例需要请求100010次文件锁,而相关技术中需要请求1100000次文件锁。因此,选用该实施例可以通过更改批量删除文件的拿锁机制,合并请求获取多个待删除文件的文件锁,有效降低获取文件锁所花费的时间,进而可以降低分布式存储系统批量删除时所花费的时间。
参见图3,图3所示为本发明实施例提供的批量删除文件的装置的一种结构示意图,装置包括:
信息获取模块301,用于获取针对多个待删除文件的删除操作的操作信息;
日志记录模块302,用于将所有获取到的操作信息记录于事件日志中的同一事件,事件日志用于记录对分布式存储系统中文件所进行的操作;
日志读取模块303,用于读取事件日志,获取事件日志所记录的操作信息;
回调模块304,用于依次针对每个获取到的操作信息,执行该操作信息所表示的删除操作。
在一种可能的实现方式中回调模块304,具体用于将获取到的操作信息缓存为操作信息队列;
重复执行以下操作直至操作信息队列为空:
针对操作信息队列中最后一个操作信息,执行该操作信息所表示的删除操作,以删除该操作信息对应的待删除文件;
删除操作信息队列中最后一个操作信息。
在一种可能的实现方式中,装置还包括操作转换模块,用于在接收到客户端针对目标目录的删除指令时;
将目标目录下包括的文件作为待删除文件,转移至预设缓存目录下,预设缓存目录为客户端无法访问的目录;
向客户端反馈用于表示已经完成删除指令的反馈信息;
信息获取模块301,具体用于针对预设缓存目录下的多个待删除文件,生成针对多个待删除文件的删除操作的操作信息。
在一种可能的实现方式中,预设缓存目录中属于同一目录下的所有待删除文件被预先划分为至少一个目录分片,每个目录分片中所包括的待删除文件的数量不多于预设数量阈值;
信息获取模块301,具体用于遍历缓存目录,以检索缓存目录中是否存在非空目录分片;
每当检索到非空目录分片,如果该非空目录分片中包括多个待删除文件,生成针对多个待删除文件的删除操作的操作信息。
在一种可能的实现方式中,装置还包括,拿锁模块,用于请求获取多个待删除文件的文件锁;
每成功获取到一个待删除文件的文件锁,标记该一个待删除文件;
请求获取多个待删除文件中未标记的待删除文件的文件锁,直至成功获取多个待删除文件的文件锁:
在一种可能的实现方式中,拿锁模块,具体用于依次针对多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记;
如果该待删除文件未被标记,请求该待删除文件的文件锁;
返回执行依次针对多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记的步骤,直至成功获取多个待删除文件的文件锁。
本发明实施例还提供了一种电子设备,如图4所示,包括:
存储器401,用于存放计算机程序;
处理器402,用于执行存储器401上所存放的程序时,实现如下步骤:
获取针对多个待删除文件的删除操作的操作信息;
将所有获取到的操作信息记录于事件日志中的同一事件,事件日志用于记录对分布式存储系统中文件所进行的操作;
读取事件日志,获取事件日志所记录的操作信息;
依次针对每个获取到的操作信息,执行该操作信息所表示的删除操作。
在一种可能的实现方式中,依次针对每个获取到的操作信息,执行该操作信息所表示的删除操作,包括:
将获取到的操作信息缓存为操作信息队列;
重复执行以下操作直至操作信息队列为空:
针对操作信息队列中最后一个操作信息,执行该操作信息所表示的删除操作,以删除该操作信息对应的待删除文件;
删除操作信息队列中最后一个操作信息。
在一种可能的实现方式中,述方法还包括:
在接收到客户端针对目标目录的删除指令时;
将目标目录下包括的文件作为待删除文件,转移至预设缓存目录下,预设缓存目录为客户端无法访问的目录;
向客户端反馈用于表示已经完成删除指令的反馈信息;
获取针对多个待删除文件的删除操作的操作信息,包括:
针对预设缓存目录下的多个待删除文件,生成针对多个待删除文件的删除操作的操作信息。
在一种可能的实现方式中,预设缓存目录中属于同一目录下的所有待删除文件被预先划分为至少一个目录分片,每个目录分片中所包括的待删除文件的数量不多于预设数量阈值;
针对预设缓存目录下的多个待删除文件,生成针对多个待删除文件的删除操作的操作信息,包括:
遍历缓存目录,以检索缓存目录中是否存在非空目录分片;
每当检索到非空目录分片,如果该非空目录分片中包括多个待删除文件,生成针对多个待删除文件的删除操作的操作信息。
在一种可能的实现方式中,在将所有获取到的操作信息记录于事件日志中的同一事件之前,方法还包括:
请求获取多个待删除文件的文件锁;
每成功获取到一个待删除文件的文件锁,标记该一个待删除文件;
请求获取多个待删除文件中未标记的待删除文件的文件锁,直至成功获取多个待删除文件的文件锁。
在一种可能的实现方式中,请求获取多个待删除文件中未标记的待删除文件的文件锁,直至成功获取多个待删除文件的文件锁,包括:
依次针对多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记;
如果该待删除文件未被标记,请求该待删除文件的文件锁;
返回执行依次针对多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记的步骤,直至成功获取多个待删除文件的文件锁。
上述电子设备提到的存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一批量删除文件的方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一批量删除文件的方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质以及计算机程序产品的实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种批量删除文件的方法,所述方法应用于分布式存储系统,其特征在于,所述方法包括:
获取针对多个待删除文件的删除操作的操作信息;
将所有获取到的操作信息记录于事件日志中的同一事件,所述事件日志用于记录对所述分布式存储系统中文件所进行的操作;
读取所述事件日志,获取所述事件日志所记录的操作信息;
依次针对每个获取到的操作信息,执行该操作信息所表示的删除操作;
所述依次针对每个获取到的操作信息,执行该操作信息所表示的删除操作,包括:
将获取到的操作信息缓存为操作信息队列;
重复执行以下操作直至所述操作信息队列为空:
针对所述操作信息队列中最后一个操作信息,执行该操作信息所表示的删除操作,以删除该操作信息对应的待删除文件;
删除所述操作信息队列中最后一个操作信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到客户端针对目标目录的删除指令时;
将所述目标目录下包括的文件作为待删除文件,转移至预设缓存目录下,所述预设缓存目录为客户端无法访问的目录;
向所述客户端反馈用于表示已经完成所述删除指令的反馈信息;
所述获取针对多个待删除文件的删除操作的操作信息,包括:
针对所述预设缓存目录下的多个待删除文件,生成针对所述多个待删除文件的删除操作的操作信息。
3.根据权利要求2所述的方法,其特征在于,所述预设缓存目录中属于同一目录下的所有待删除文件被预先划分为至少一个目录分片,每个目录分片中所包括的待删除文件的数量不多于预设数量阈值;
所述针对所述预设缓存目录下的多个待删除文件,生成针对所述多个待删除文件的删除操作的操作信息,包括:
遍历所述缓存目录,以检索所述缓存目录中是否存在非空目录分片;
每当检索到非空目录分片,如果该非空目录分片中包括多个待删除文件,生成针对所述多个待删除文件的删除操作的操作信息。
4.根据权利要求1所述的方法,其特征在于,在所述将所有获取到的操作信息记录于事件日志中的同一事件之前,所述方法还包括:
请求获取所述多个待删除文件的文件锁;
每成功获取到一个待删除文件的文件锁,标记该一个待删除文件;
请求获取所述多个待删除文件中未标记的待删除文件的文件锁,直至成功获取所述多个待删除文件的文件锁。
5.根据权利要求4所述的方法,其特征在于,所述请求获取所述多个待删除文件中未标记的待删除文件的文件锁,直至成功获取所述多个待删除文件的文件锁,包括:
依次针对所述多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记;
如果该待删除文件未被标记,请求该待删除文件的文件锁;
返回执行所述依次针对所述多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记的步骤,直至成功获取所述多个待删除文件的文件锁。
6.一种批量删除文件的装置,其特征在于,所述装置应用于分布式存储系统,所述装置包括:
信息获取模块,用于获取针对多个待删除文件的删除操作的操作信息;
日志记录模块,用于将所有获取到的操作信息记录于事件日志中的同一事件,所述事件日志用于记录对所述分布式存储系统中文件所进行的操作;
日志读取模块,用于读取所述事件日志,获取所述事件日志所记录的操作信息;
回调模块,用于依次针对每个获取到的操作信息,执行该操作信息所表示的删除操作;
所述回调模块,具体用于将获取到的操作信息缓存为操作信息队列;
重复执行以下操作直至所述操作信息队列为空:
针对所述操作信息队列中最后一个操作信息,执行该操作信息所表示的删除操作,以删除该操作信息对应的待删除文件;
删除所述操作信息队列中最后一个操作信息。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括操作转换模块,用于在接收到客户端针对目标目录的删除指令时;
将所述目标目录下包括的文件作为待删除文件,转移至预设缓存目录下,所述预设缓存目录为客户端无法访问的目录;
向所述客户端反馈用于表示已经完成所述删除指令的反馈信息;
所述信息获取模块,具体用于针对所述预设缓存目录下的多个待删除文件,生成针对所述多个待删除文件的删除操作的操作信息。
8.根据权利要求7所述的装置,其特征在于,所述预设缓存目录中属于同一目录下的所有待删除文件被预先划分为至少一个目录分片,每个目录分片中所包括的待删除文件的数量不多于预设数量阈值;
所述信息获取模块,具体用于遍历所述缓存目录,以检索所述缓存目录中是否存在非空目录分片;
每当检索到非空目录分片,如果该非空目录分片中包括多个待删除文件,生成针对所述多个待删除文件的删除操作的操作信息。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括,拿锁模块,用于请求获取所述多个待删除文件的文件锁;
每成功获取到一个待删除文件的文件锁,标记该一个待删除文件;
请求获取所述多个待删除文件中未标记的待删除文件的文件锁,直至成功获取所述多个待删除文件的文件锁。
10.根据权利要求9所述的装置,其特征在于,所述拿锁模块,具体用于依次针对所述多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记;
如果该待删除文件未被标记,请求该待删除文件的文件锁;
返回执行所述依次针对所述多个待删除文件中的每个待删除文件,确定该待删除文件是否被标记的步骤,直至成功获取所述多个待删除文件的文件锁。
11.一种电子设备,其特征在于,包括:
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法步骤。
CN201911295135.4A 2019-12-16 2019-12-16 一种批量删除文件的方法、装置及电子设备 Active CN111078643B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911295135.4A CN111078643B (zh) 2019-12-16 2019-12-16 一种批量删除文件的方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911295135.4A CN111078643B (zh) 2019-12-16 2019-12-16 一种批量删除文件的方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111078643A CN111078643A (zh) 2020-04-28
CN111078643B true CN111078643B (zh) 2022-07-22

Family

ID=70314966

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911295135.4A Active CN111078643B (zh) 2019-12-16 2019-12-16 一种批量删除文件的方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111078643B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112395345A (zh) * 2020-12-04 2021-02-23 江苏苏宁云计算有限公司 HBase的全量数据导入方法、装置、计算机设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1987803A (zh) * 2005-12-22 2007-06-27 国际商业机器公司 在数字数据处理系统中管理进程的事件日志的方法和装置
CN101673269A (zh) * 2008-09-11 2010-03-17 同方威视技术股份有限公司 图像文件锁定方法和图像文件维护方法
CN102024015A (zh) * 2009-09-18 2011-04-20 软件股份公司 用于批量删除数据库系统的数据记录的方法
CN104572762A (zh) * 2013-10-24 2015-04-29 杭州海康威视数字技术股份有限公司 删除及恢复录像文件的方法和装置
WO2016086552A1 (zh) * 2014-12-04 2016-06-09 中兴通讯股份有限公司 一种文件处理的方法及客户端
US9442955B1 (en) * 2012-12-28 2016-09-13 Emc Corporation Managing delete operations in files of file systems
US9645892B1 (en) * 2014-07-08 2017-05-09 EMC IP Holding Company LLC Recording file events in change logs while incrementally backing up file systems
JP2018142231A (ja) * 2017-02-28 2018-09-13 キヤノンマーケティングジャパン株式会社 帳票システム、その処理方法及びプログラム
CN109766317A (zh) * 2019-01-08 2019-05-17 浪潮电子信息产业股份有限公司 一种文件的删除方法、装置、设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9378234B2 (en) * 2013-03-11 2016-06-28 International Business Machines Corporation Management of updates in a database system
WO2018090256A1 (zh) * 2016-11-16 2018-05-24 华为技术有限公司 一种目录删除方法、装置和存储服务器

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1987803A (zh) * 2005-12-22 2007-06-27 国际商业机器公司 在数字数据处理系统中管理进程的事件日志的方法和装置
CN101673269A (zh) * 2008-09-11 2010-03-17 同方威视技术股份有限公司 图像文件锁定方法和图像文件维护方法
CN102024015A (zh) * 2009-09-18 2011-04-20 软件股份公司 用于批量删除数据库系统的数据记录的方法
US9442955B1 (en) * 2012-12-28 2016-09-13 Emc Corporation Managing delete operations in files of file systems
CN104572762A (zh) * 2013-10-24 2015-04-29 杭州海康威视数字技术股份有限公司 删除及恢复录像文件的方法和装置
US9645892B1 (en) * 2014-07-08 2017-05-09 EMC IP Holding Company LLC Recording file events in change logs while incrementally backing up file systems
WO2016086552A1 (zh) * 2014-12-04 2016-06-09 中兴通讯股份有限公司 一种文件处理的方法及客户端
JP2018142231A (ja) * 2017-02-28 2018-09-13 キヤノンマーケティングジャパン株式会社 帳票システム、その処理方法及びプログラム
CN109766317A (zh) * 2019-01-08 2019-05-17 浪潮电子信息产业股份有限公司 一种文件的删除方法、装置、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
一种可选择地删除多类型文件的实用删除程序;龚飞;《电脑编程技巧与维护》;19981231(第06期);10-15 *
一种视频点播日志分析系统的设计与实现;朱明等;《计算机应用与软件》;20150115(第01期);39-43、81 *
快速清理Windows事件日志;行人三;《电脑迷》;20131101(第11期);86 *

Also Published As

Publication number Publication date
CN111078643A (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
US10250710B2 (en) Systems and methods for caching of managed content in a distributed environment using a multi-tiered architecture including off-line access to cached content
US10754835B2 (en) High-efficiency deduplication module of a database-management system
US9195668B2 (en) Log access method storage control apparatus, archive system, and method of operation
US9715507B2 (en) Techniques for reconciling metadata and data in a cloud storage system without service interruption
KR20200093597A (ko) 콘텐츠 아이템의 동기화를 위한 고유 식별자의 할당 및 재할당
CN102629247B (zh) 一种数据处理方法、装置和系统
CN110008041B (zh) 一种消息处理方法及装置
US11093387B1 (en) Garbage collection based on transmission object models
US10013312B2 (en) Method and system for a safe archiving of data
GB2518158A (en) Method and system for data access in a storage infrastructure
US11940877B2 (en) Restoring a directory to a state prior to a past synchronization event
CN113377868A (zh) 一种基于分布式kv数据库的离线存储系统
JP2023512247A (ja) 複数のチェーンを使用した共有キャッシュ内のオブジェクトの管理
US11093453B1 (en) System and method for asynchronous cleaning of data objects on cloud partition in a file system with deduplication
JP6293709B2 (ja) ストレージシステムおよびストレージシステム用プログラム
US20170193201A1 (en) Automatic notifications for inadvertent file events
CN115840731A (zh) 文件处理方法、计算设备及计算机存储介质
US9934248B2 (en) Computer system and data management method
US10222994B2 (en) Storing selected data in a stub file in a hierarchical storage management system
CN111078643B (zh) 一种批量删除文件的方法、装置及电子设备
CN111309799A (zh) 数据合并的实现方法、装置、系统及存储介质
CN110941595A (zh) 一种文件系统访问方法及装置
CN116303267A (zh) 数据访问方法、装置、设备以及存储介质
CN116225627A (zh) 事务记录方法和系统
CN110888847B (zh) 一种回收站系统及文件回收方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant