CN109471836A - 一种数据迁移方法、装置和系统 - Google Patents

一种数据迁移方法、装置和系统 Download PDF

Info

Publication number
CN109471836A
CN109471836A CN201811295927.7A CN201811295927A CN109471836A CN 109471836 A CN109471836 A CN 109471836A CN 201811295927 A CN201811295927 A CN 201811295927A CN 109471836 A CN109471836 A CN 109471836A
Authority
CN
China
Prior art keywords
file
migrated
listed files
migration
destination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811295927.7A
Other languages
English (en)
Inventor
苏志恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201811295927.7A priority Critical patent/CN109471836A/zh
Publication of CN109471836A publication Critical patent/CN109471836A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种数据迁移方法、装置和系统,元数据端统计各文件的访问热度;依据各文件的访问热度以及存储位置,建立待迁移文件列表;当待迁移文件列表的数据量满足预设条件时,则向目标客户端发送文件迁移指令。目标客户端在接收到元数据端发送的文件迁移指令后,依据待迁移文件列表中包含的文件标识信息,批量读取目标文件;并将聚合后的目标文件写入指定的存储介质。通过对待迁移的文件进行汇总,以便于目标客户端将多个待迁移文件进行整合后写入指定的存储介质,减少了文件迁移的读写次数,提升了文件迁移的效率,从而减少迁移过程对系统资源的消耗,提升了分布式系统读写响应速度和性能。

Description

一种数据迁移方法、装置和系统
技术领域
本发明涉及数据存储技术领域,特别是涉及一种数据迁移方法、装置和系统。
背景技术
在分布式文件系统中,存储介质可以划分为慢存储介质和快存储介质。对于频繁访问的文件,若将其存储在慢存储介质中,则会影响文件的读取性能。
在一段时间内,文件被访问的次数越多,文件的热度就越高。传统方式中,会根据元数据端统计的文件热度信息,把达到一定热度的文件,由慢存储介质迁移到快存储介质上。文件迁移的过程会占用系统资源,若需要迁移的文件数量较多且以小文件为主时,将这些文件一个一个的从慢存储介质读数据写入到快速存储介质,频繁的迁移会占用较多的系统资源,对分布式系统的读写性能产生影响,降低分布式文件系统的响应能力。
可见,如何提升文件迁移效率,以降低文件迁移对系统资源的消耗,是本领域技术人员亟待解决的问题。
发明内容
本发明实施例的目的是提供一种数据迁移方法、装置和系统,可以提升文件迁移效率,以降低文件迁移对系统资源的消耗。
为解决上述技术问题,本发明实施例提供一种数据迁移方法,包括:
统计各文件的访问热度;
依据各文件的访问热度以及存储位置,建立待迁移文件列表;
判断所述待迁移文件列表的数据量是否满足预设条件;
若是,则向目标客户端发送文件迁移指令,以便于所述目标客户端根据所述文件迁移指令,将所述待迁移文件列表中指向的目标文件批量迁移至指定位置。
可选的,所述依据各文件的访问热度以及存储位置,建立待迁移文件列表包括:
收集访问热度大于或等于预设上限值的第一初始文件;收集访问热度小于或等于预设下限值的第二初始文件;
从所述第一初始文件中选取出存储位置归属于第一存储介质的第一文件,并将所述第一文件的文件标识信息加入第一待迁移文件列表中;从所述第二初始文件中选取出存储位置归属于第二存储介质的第二文件,并将所述第二文件的文件标识信息加入第二待迁移文件列表中,以完成待迁移文件列表的建立;
其中,所述第一存储介质的数据读取速率低于所述第二存储介质的数据读取速率。
可选的,在所述向目标客户端发送文件迁移指令之前还包括:
将所述待迁移文件列表存储到日志文件中。
可选的,还包括:
当接收到所述目标客户端反馈的迁移完成的提示信息后,将所述待迁移文件列表从所述日志文件中删除。
可选的,在所述待迁移文件列表的数据量满足预设条件之后,在所述向目标客户端发送文件迁移指令之前还包括:
关闭向所述待迁移文件列表中写入文件标识信息的任务;
相应的,在接收到所述目标客户端反馈的迁移完成的提示信息之后还包括:
开启向所述待迁移文件列表中写入文件标识信息的任务。
本发明实施例还提供了一种数据迁移装置,包括统计单元、建立单元、判断单元和发送单元;
所述统计单元,用于统计各文件的访问热度;
所述建立单元,用于依据各文件的访问热度以及存储位置,建立待迁移文件列表;
所述判断单元,用于判断所述待迁移文件列表的数据量是否满足预设条件;若是,则触发所述发送单元;
所述发送单元,用于向目标客户端发送文件迁移指令,以便于所述目标客户端根据所述文件迁移指令,将所述待迁移文件列表中指向的目标文件批量迁移至指定位置。
可选的,所述建立单元包括收集子单元和选取子单元;
所述收集子单元,用于收集访问热度大于或等于预设上限值的第一初始文件;收集访问热度小于或等于预设下限值的第二初始文件;
所述选取子单元,用于从所述第一初始文件中选取出存储位置归属于第一存储介质的第一文件,并将所述第一文件的文件标识信息加入第一待迁移文件列表中;从所述第二初始文件中选取出存储位置归属于第二存储介质的第二文件,并将所述第二文件的文件标识信息加入第二待迁移文件列表中,以完成待迁移文件列表的建立;
其中,所述第一存储介质的数据读取速率低于所述第二存储介质的数据读取速率。
可选的,还包括存储单元;
所述存储单元,用于在所述向目标客户端发送文件迁移指令之前,将所述待迁移文件列表存储到日志文件中。
可选的,还包括删除单元;
所述删除单元,用于当接收到所述目标客户端反馈的迁移完成的提示信息后,将所述待迁移文件列表从所述日志文件中删除。
可选的,还包括关闭单元和开启单元;
所述关闭单元,用于在所述待迁移文件列表的数据量满足预设条件之后,在所述向目标客户端发送文件迁移指令之前,关闭向所述待迁移文件列表中写入文件标识信息的任务;
相应的,所述开启单元,用于在接收到所述目标客户端反馈的迁移完成的提示信息之后,开启向所述待迁移文件列表中写入文件标识信息的任务。
本发明实施例还提供了一种数据迁移方法,包括:
接收元数据端发送的文件迁移指令;其中,所述文件迁移指令中携带有待迁移文件列表;
依据所述待迁移文件列表中包含的文件标识信息,批量读取目标文件;
将各所述目标文件进行聚合,并将聚合后的目标文件写入指定的存储介质。
可选的,还包括:
当完成所述待迁移文件列表中所有文件的迁移后,向所述元数据端发送迁移完成的提示信息。
本发明实施例还提供了一种数据迁移装置,包括接收单元、读取单元和整合单元;
所述接收单元,用于接收元数据端发送的文件迁移指令;其中,所述文件迁移指令中携带有待迁移文件列表;
所述读取单元,用于依据所述待迁移文件列表中包含的文件标识信息,批量读取目标文件;
所述整合单元,用于将各所述目标文件进行聚合,并将聚合后的目标文件写入指定的存储介质。
可选的,还包括发送单元;
所述发送单元,用于当完成所述待迁移文件列表中所有文件的迁移后,向所述元数据端发送迁移完成的提示信息。
本发明实施例还提供了一种数据迁移系统,包括元数据端和目标客户端;
所述元数据端,用于统计各文件的访问热度;依据各文件的访问热度以及存储位置,建立待迁移文件列表;判断所述待迁移文件列表的数据量是否满足预设条件;若是,则向目标客户端发送文件迁移指令,以便于所述目标客户端根据所述文件迁移指令,将所述待迁移文件列表中指向的目标文件批量迁移至指定位置
所述目标客户端,用于接收元数据端发送的文件迁移指令;其中,所述文件迁移指令中携带有待迁移文件列表;依据所述待迁移文件列表中包含的文件标识信息,批量读取目标文件;将各所述目标文件进行聚合,并将聚合后的目标文件写入指定的存储介质。
由上述技术方案可以看出,元数据端统计各文件的访问热度;依据各文件的访问热度以及存储位置,建立待迁移文件列表;当待迁移文件列表的数据量满足预设条件时,则向目标客户端发送文件迁移指令;其中,文件迁移指令中携带有待迁移文件列表。目标客户端在接收到元数据端发送的文件迁移指令后,依据待迁移文件列表中包含的文件标识信息,批量读取目标文件;并将聚合后的目标文件写入指定的存储介质,在该技术方案中,通过建立待迁移文件列表,可以将待迁移的文件进行汇总,以便于目标客户端可以将多个待迁移文件进行整合后写入指定的存储介质,减少了文件迁移的读写次数,执行一次迁移操作便可以将多个文件同时迁移到指定的存储介质,提升了文件迁移的效率,从而减少迁移过程对系统资源的消耗,提升了分布式系统读写响应速度和性能。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据迁移方法的信令图;
图2为本发明实施例提供的一种基于元数据端的数据迁移装置的结构示意图;
图3为本发明实施例提供的一种基于目标客户端的数据迁移装置的结构示意图;
图4为本发明实施例提供的一种数据迁移系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
接下来,详细介绍本发明实施例所提供的一种数据迁移方法。图1为本发明实施例提供的一种数据迁移方法的流程图,该方法包括:
S101:元数据端统计各文件的访问热度。
在分布式文件系统中,元数据端可以用于统计文件的相关信息,例如,文件的访问热度、文件的存储位置、文件的大小等信息。客户端可以实现文件的存储和迁移。元数据端和客户端之间具有通信连接,可以实现信息的交互。
访问热度反映了文件被调用的次数,在本发明实施例中,元数据端可以对各文件的访问热度进行统计,为了便于管理,可以建立文件热度列表,在该文件热度列表中可以存储各文件的文件标识信息及其对应的访问热度。
其中,文件标识信息可以包括文件的名称、文件大小、文件的存储位置等信息。
S102:元数据端依据各文件的访问热度以及存储位置,建立待迁移文件列表。
建立待迁移文件列表是为了将待迁移的文件进行汇总,以便于目标客户端可以将多个待迁移文件进行整合后写入指定的存储介质,减少文件迁移的读写次数。
在具体实现中,为了提升文件的读写性能,可以将访问热度较高的文件存储在数据读取速率较高的存储介质中,将访问热度较低的文件存储在数据读取速率较低的存储介质中。为了便于区分这两类存储介质,可以将数据读取速率较低的存储介质称作第一存储介质,将数据读取速率较高的存储介质称作第二存储介质。即第一存储介质的数据读取速率低于第二存储介质的数据读取速率。
在本发明实施例中,需要将存储于第一存储介质但是访问热度较高的文件进行迁移,将存储于第二存储介质但是访问热度较低的文件进行迁移。因此,建立的待迁移文件列表可以包括两个文件列表。
具体的,可以收集访问热度大于或等于预设上限值的第一初始文件;收集访问热度小于或等于预设下限值的第二初始文件。然后从第一初始文件中选取出存储位置归属于第一存储介质的第一文件,并将第一文件的文件标识信息加入第一待迁移文件列表中;从第二初始文件中选取出存储位置归属于第二存储介质的第二文件,并将第二文件的文件标识信息加入第二待迁移文件列表中,以完成待迁移文件列表的建立。
其中,预设上限值和预设下限值的具体取值可以依据实际需求进行设定,在此不做限定。
在具体实现中,也可以先统计存储于第一存储介质中的文件,然后从这些文件中选取出访问热度大于或等于预设上限值的第一文件,从而构建第一待迁移文件列表;同理,也可以先统计存储于第二存储介质中的文件,然后从这些文件中选取出访问热度小于或等于预设下限值的第二文件,从而构建第二待迁移文件列表。
需要说明的是,每对目标文件执行一次迁移,则会重新对目标文件的访问热度进行统计。
S103:元数据端判断待迁移文件列表的数据量是否满足预设条件。
待迁移文件列表中记录有文件的大小,在具体实现中,可以将待迁移文件列表中各文件的大小进行累加,将该累加值作为待迁移文件列表的数据量。
除此之外,也可以以待迁移文件列表中所指向的文件的个数作为待迁移文件列表的数据量。
对于数据量的大小可以设置参考值,当待迁移文件列表的数据量大于或等于该参考值时,则说明此时可以对待迁移文件列表中指向的文件执行迁移操作,即执行S104。
S104:元数据端向目标客户端发送文件迁移指令。
客户端负责文件的存储和迁移,因此,当待迁移文件列表的数据量满足预设条件时,元数据端可以向目标客户端发送文件迁移指令。
目标客户端可以是分布式文件系统中满足负载要求的客户端。
在分布式文件系统中包含有多个客户端,元数据端可以依据各客户端的负载情况,选取出满足负载要求的目标客户端,并向目标客户端发送文件迁移指令。
当客户端负载量较大时,则该客户端执行文件迁移操作的效率会较低,因此,在具体应用中,元数据端可以选取负载量较小的客户端作为目标客户端。
其中,选取的目标客户端的数量可以有多个,每个目标客户端执行的操作类似,在后续介绍中均以一个目标客户端为例展开说明。
S105:目标客户端接收元数据端发送的文件迁移指令。
其中,文件迁移指令中可以携带有待迁移文件列表。
需要说明的是,当选取的目标客户端有多个时,则向每个目标客户端发送的文件迁移指令中可以携带待迁移文件列表中的部分列表信息,汇总各目标客户端接收到的部分列表信息,可以组成完整的待迁移文件列表。
S106:目标客户端依据待迁移文件列表中包含的文件标识信息,批量读取目标文件。
文件标识信息中包含了文件的存储位置,目标客户端依据文件存储位置,可以读取到相应的目标文件。
在同一个存储目录下,可能有多个目标文件需要迁移,此时可以同时读取这多个目标文件,实现目标文件的批量读取。
S107:目标客户端将各目标文件进行聚合,并将聚合后的目标文件写入指定的存储介质。
目标客户端读取出的目标文件可以有多个,为了降低文件迁移时文件的写入次数,目标客户端可以将读取的目标文件进行聚合,得到一个或多个大文件,每个大文件中包含有多个目标文件,然后将这些大文件写入指定的存储介质。
当读取的是第一待迁移文件列表中所指向的目标文件时,则需要将聚合后的目标文件迁移至第二存储介质;相应的,当读取的是第二待迁移文件列表中所指向的目标文件时,则需要将聚合后的目标文件迁移至第一存储介质。
由上述技术方案可以看出,元数据端统计各文件的访问热度;依据各文件的访问热度以及存储位置,建立待迁移文件列表;当待迁移文件列表的数据量满足预设条件时,则向目标客户端发送文件迁移指令;其中,文件迁移指令中携带有待迁移文件列表。目标客户端在接收到元数据端发送的文件迁移指令后,依据待迁移文件列表中包含的文件标识信息,批量读取目标文件;并将聚合后的目标文件写入指定的存储介质,在该技术方案中,通过建立待迁移文件列表,可以将待迁移的文件进行汇总,以便于目标客户端可以将多个待迁移文件进行整合后写入指定的存储介质,减少了文件迁移的读写次数,执行一次迁移操作便可以将多个文件同时迁移到指定的存储介质,提升了文件迁移的效率,从而减少迁移过程对系统资源的消耗,提升了分布式系统读写响应速度和性能。
在本发明实施例中,待迁移文件列表中记录的文件标识信息是执行文件迁移的重要依据,为了避免列表信息的丢失,在向目标客户端发送文件迁移指令之前,可以先将待迁移文件列表存储到日志文件中。
通过将待迁移文件列表存储到日志文件中,提升了待迁移文件列表的安全性,当待迁移文件列表在传输过程中丢失后,元数据端可以查询日志文件重新获取到待迁移文件列表。
在实际应用中,当目标客户端完成待迁移文件列表中所有文件的迁移后,可以向元数据端发送迁移完成的提示信息,以便于元数据端可以及时获知数据迁移的执行情况。
相应的,当元数据端接收到目标客户端反馈的迁移完成的提示信息后,则说明目标文件已经完成了迁移,此时原本存储在日志文件中的待迁移文件列表已经失效,为了降低无效信息对存储资源的占用,元数据端可以将待迁移文件列表从日志文件中删除。
在本发明实施例中,目标客户端可以把迁移成功的文件列表记录到日志中,直至将待迁移文件列表中所指向的所有目标文件迁移完毕,则结束记录。在该文件列表中存储有目标文件迁移后的存储位置。元数据端通过查询日志中的文件列表,便可以获取到文件当前的存储位置。
随着文件访问热度的变化,待迁移文件列表中存储的信息会发生更新变化。目标客户端依据于待迁移文件列表中记载的文件标识信息执行目标文件的批量迁移,如果在文件迁移过程中,继续向待迁移文件列表写入新的文件标识信息,会对目标客户端的迁移工作造成混乱,导致目标客户端不知道待迁移文件列表中所指向的哪些文件属于迁移的文件,哪些文件属于新加入的但未达到迁移条件的文件。
因此,为了保证文件正确有序的迁移,在待迁移文件列表的数据量满足预设条件之后,并且在元数据端向目标客户端发送文件迁移指令之前,可以先关闭向待迁移文件列表中写入文件标识信息的任务;相应的,在接收到目标客户端反馈的迁移完成的提示信息之后,则可以开启向待迁移文件列表中写入文件标识信息的任务。
在执行数据迁移的过程中,关闭向待迁移文件列表中写入文件标识信息的任务,可以有效的避免待迁移文件列表的动态变化,对目标客户端执行迁移工作带来的影响,保证了文件正确有序的迁移。
图2为本发明实施例提供的一种基于元数据端的数据迁移装置的结构示意图,包括统计单元21、建立单元22、判断单元23和发送单元24;
统计单元21,用于统计各文件的访问热度;
建立单元22,用于依据各文件的访问热度以及存储位置,建立待迁移文件列表;
判断单元23,用于判断待迁移文件列表的数据量是否满足预设条件;若是,则触发发送单元24;
发送单元24,用于向目标客户端发送文件迁移指令,以便于目标客户端根据文件迁移指令,将待迁移文件列表中指向的目标文件批量迁移至指定位置。
可选的,建立单元包括收集子单元和选取子单元;
收集子单元,用于收集访问热度大于或等于预设上限值的第一初始文件;收集访问热度小于或等于预设下限值的第二初始文件;
选取子单元,用于从第一初始文件中选取出存储位置归属于第一存储介质的第一文件,并将第一文件的文件标识信息加入第一待迁移文件列表中;从第二初始文件中选取出存储位置归属于第二存储介质的第二文件,并将第二文件的文件标识信息加入第二待迁移文件列表中,以完成待迁移文件列表的建立;
其中,第一存储介质的数据读取速率低于第二存储介质的数据读取速率。
可选的,还包括存储单元;
存储单元,用于在向目标客户端发送文件迁移指令之前,将待迁移文件列表存储到日志文件中。
可选的,还包括删除单元;
删除单元,用于当接收到目标客户端反馈的迁移完成的提示信息后,将待迁移文件列表从日志文件中删除。
可选的,还包括关闭单元和开启单元;
关闭单元,用于在待迁移文件列表的数据量满足预设条件之后,在向目标客户端发送文件迁移指令之前,关闭向待迁移文件列表中写入文件标识信息的任务;
相应的,开启单元,用于在接收到目标客户端反馈的迁移完成的提示信息之后,开启向待迁移文件列表中写入文件标识信息的任务。
图2所对应实施例中特征的说明可以参见图1所对应实施例的相关说明,这里不再一一赘述。
由上述技术方案可以看出,元数据端统计各文件的访问热度;依据各文件的访问热度以及存储位置,建立待迁移文件列表;当待迁移文件列表的数据量满足预设条件时,则向目标客户端发送携带有待迁移文件列表的文件迁移指令,以便于目标客户端根据文件迁移指令,将待迁移文件列表中指向的目标文件批量迁移至指定位置。在该技术方案中,通过建立待迁移文件列表,可以将待迁移的文件进行汇总,以便于目标客户端可以将多个待迁移文件进行整合后写入指定的存储介质,减少了文件迁移的读写次数,执行一次迁移操作便可以将多个文件同时迁移到指定的存储介质,提升了文件迁移的效率,从而减少迁移过程对系统资源的消耗,提升了分布式系统读写响应速度和性能。
图3为本发明实施例提供的一种数据迁移装置的结构示意图,包括接收单元31、读取单元32和整合单元33;
接收单元31,用于接收元数据端发送的文件迁移指令;其中,文件迁移指令中携带有待迁移文件列表;
读取单元32,用于依据待迁移文件列表中包含的文件标识信息,批量读取目标文件;
整合单元33,用于将各目标文件进行聚合,并将聚合后的目标文件写入指定的存储介质。
可选的,还包括发送单元;
发送单元,用于当完成待迁移文件列表中所有文件的迁移后,向元数据端发送迁移完成的提示信息。
图3所对应实施例中特征的说明可以参见图1所对应实施例的相关说明,这里不再一一赘述。
由上述技术方案可以看出,目标客户端接收元数据端发送的文件迁移指令;其中,文件迁移指令中携带有待迁移文件列表;目标客户端依据待迁移文件列表中包含的文件标识信息,批量读取目标文件;并将聚合后的目标文件写入指定的存储介质,在该技术方案中,通过建立待迁移文件列表,可以将待迁移的文件进行汇总,以便于目标客户端可以将多个待迁移文件进行整合后写入指定的存储介质,减少了文件迁移的读写次数,执行一次迁移操作便可以将多个文件同时迁移到指定的存储介质,提升了文件迁移的效率,从而减少迁移过程对系统资源的消耗,提升了分布式系统读写响应速度和性能。
图4为本发明实施例提供的一种数据迁移系统40的结构示意图,包括元数据端41和目标客户端42;
元数据端41,用于统计各文件的访问热度;依据各文件的访问热度以及存储位置,建立待迁移文件列表;判断待迁移文件列表的数据量是否满足预设条件;若是,则向目标客户端发送文件迁移指令,以便于目标客户端根据文件迁移指令,将待迁移文件列表中指向的目标文件批量迁移至指定位置
目标客户端42,用于接收元数据端发送的文件迁移指令;其中,文件迁移指令中携带有待迁移文件列表;依据待迁移文件列表中包含的文件标识信息,批量读取目标文件;将各目标文件进行聚合,并将聚合后的目标文件写入指定的存储介质。
以上对本发明实施例所提供的一种数据迁移方法、装置和系统进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

Claims (10)

1.一种数据迁移方法,其特征在于,包括:
统计各文件的访问热度;
依据各文件的访问热度以及存储位置,建立待迁移文件列表;
判断所述待迁移文件列表的数据量是否满足预设条件;
若是,则向目标客户端发送文件迁移指令,以便于所述目标客户端根据所述文件迁移指令,将所述待迁移文件列表中指向的目标文件批量迁移至指定位置。
2.根据权利要求1所述的方法,其特征在于,所述依据各文件的访问热度以及存储位置,建立待迁移文件列表包括:
收集访问热度大于或等于预设上限值的第一初始文件;收集访问热度小于或等于预设下限值的第二初始文件;
从所述第一初始文件中选取出存储位置归属于第一存储介质的第一文件,并将所述第一文件的文件标识信息加入第一待迁移文件列表中;从所述第二初始文件中选取出存储位置归属于第二存储介质的第二文件,并将所述第二文件的文件标识信息加入第二待迁移文件列表中,以完成待迁移文件列表的建立;
其中,所述第一存储介质的数据读取速率低于所述第二存储介质的数据读取速率。
3.根据权利要求1所述的方法,其特征在于,在所述向目标客户端发送文件迁移指令之前还包括:
将所述待迁移文件列表存储到日志文件中。
4.根据权利要求3所述的方法,其特征在于,还包括:
当接收到所述目标客户端反馈的迁移完成的提示信息后,将所述待迁移文件列表从所述日志文件中删除。
5.根据权利要求4所述的方法,其特征在于,在所述待迁移文件列表的数据量满足预设条件之后,在所述向目标客户端发送文件迁移指令之前还包括:
关闭向所述待迁移文件列表中写入文件标识信息的任务;
相应的,在接收到所述目标客户端反馈的迁移完成的提示信息之后还包括:
开启向所述待迁移文件列表中写入文件标识信息的任务。
6.一种数据迁移装置,其特征在于,包括统计单元、建立单元、判断单元和发送单元;
所述统计单元,用于统计各文件的访问热度;
所述建立单元,用于依据各文件的访问热度以及存储位置,建立待迁移文件列表;
所述判断单元,用于判断所述待迁移文件列表的数据量是否满足预设条件;若是,则触发所述发送单元;
所述发送单元,用于向目标客户端发送文件迁移指令,以便于所述目标客户端根据所述文件迁移指令,将所述待迁移文件列表中指向的目标文件批量迁移至指定位置。
7.一种数据迁移方法,其特征在于,包括:
接收元数据端发送的文件迁移指令;其中,所述文件迁移指令中携带有待迁移文件列表;
依据所述待迁移文件列表中包含的文件标识信息,批量读取目标文件;
将各所述目标文件进行聚合,并将聚合后的目标文件写入指定的存储介质。
8.根据权利要求7所述的方法,其特征在于,还包括:
当完成所述待迁移文件列表中所有文件的迁移后,向所述元数据端发送迁移完成的提示信息。
9.一种数据迁移装置,其特征在于,包括接收单元、读取单元和整合单元;
所述接收单元,用于接收元数据端发送的文件迁移指令;其中,所述文件迁移指令中携带有待迁移文件列表;
所述读取单元,用于依据所述待迁移文件列表中包含的文件标识信息,批量读取目标文件;
所述整合单元,用于将各所述目标文件进行聚合,并将聚合后的目标文件写入指定的存储介质。
10.一种数据迁移系统,其特征在于,包括元数据端和目标客户端;
所述元数据端,用于统计各文件的访问热度;依据各文件的访问热度以及存储位置,建立待迁移文件列表;判断所述待迁移文件列表的数据量是否满足预设条件;若是,则向目标客户端发送文件迁移指令,以便于所述目标客户端根据所述文件迁移指令,将所述待迁移文件列表中指向的目标文件批量迁移至指定位置;
所述目标客户端,用于接收元数据端发送的文件迁移指令;其中,所述文件迁移指令中携带有待迁移文件列表;依据所述待迁移文件列表中包含的文件标识信息,批量读取目标文件;将各所述目标文件进行聚合,并将聚合后的目标文件写入指定的存储介质。
CN201811295927.7A 2018-11-01 2018-11-01 一种数据迁移方法、装置和系统 Pending CN109471836A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811295927.7A CN109471836A (zh) 2018-11-01 2018-11-01 一种数据迁移方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811295927.7A CN109471836A (zh) 2018-11-01 2018-11-01 一种数据迁移方法、装置和系统

Publications (1)

Publication Number Publication Date
CN109471836A true CN109471836A (zh) 2019-03-15

Family

ID=65672524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811295927.7A Pending CN109471836A (zh) 2018-11-01 2018-11-01 一种数据迁移方法、装置和系统

Country Status (1)

Country Link
CN (1) CN109471836A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125058A (zh) * 2019-12-06 2020-05-08 浪潮电子信息产业股份有限公司 一种数据迁移方法、装置和系统
CN111984196A (zh) * 2020-08-21 2020-11-24 苏州浪潮智能科技有限公司 一种文件迁移方法、装置、设备及可读存储介质
CN112463730A (zh) * 2020-12-02 2021-03-09 苏州浪潮智能科技有限公司 一种存储海量小文件分级优化的方法、系统及介质
CN112860188A (zh) * 2021-02-09 2021-05-28 山东英信计算机技术有限公司 一种数据迁移方法、系统、设备以及介质
CN113672556A (zh) * 2021-08-19 2021-11-19 工银科技有限公司 一种批量文件的迁移方法及装置
CN114327283A (zh) * 2021-12-30 2022-04-12 西北工业大学 分布式存储系统内的数据迁移方法及分布式存储系统
CN114564147A (zh) * 2022-01-06 2022-05-31 浙江大华存储科技有限公司 一种数据流的自适应调整方法、系统、硬盘和存储介质
CN115904263A (zh) * 2023-03-10 2023-04-04 浪潮电子信息产业股份有限公司 一种数据迁移方法、系统、设备及计算机可读存储介质
CN116069263A (zh) * 2023-03-07 2023-05-05 苏州浪潮智能科技有限公司 文件系统的优化方法、装置、服务器、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100274826A1 (en) * 2009-04-23 2010-10-28 Hitachi, Ltd. Method for clipping migration candidate file in hierarchical storage management system
CN105808620A (zh) * 2014-12-31 2016-07-27 华为技术有限公司 一种管理磁盘文件的方法和装置
CN107340975A (zh) * 2017-07-13 2017-11-10 郑州云海信息技术有限公司 一种文件存储的方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100274826A1 (en) * 2009-04-23 2010-10-28 Hitachi, Ltd. Method for clipping migration candidate file in hierarchical storage management system
CN105808620A (zh) * 2014-12-31 2016-07-27 华为技术有限公司 一种管理磁盘文件的方法和装置
CN107340975A (zh) * 2017-07-13 2017-11-10 郑州云海信息技术有限公司 一种文件存储的方法及装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125058A (zh) * 2019-12-06 2020-05-08 浪潮电子信息产业股份有限公司 一种数据迁移方法、装置和系统
CN111984196A (zh) * 2020-08-21 2020-11-24 苏州浪潮智能科技有限公司 一种文件迁移方法、装置、设备及可读存储介质
CN111984196B (zh) * 2020-08-21 2022-08-19 苏州浪潮智能科技有限公司 一种文件迁移方法、装置、设备及可读存储介质
CN112463730B (zh) * 2020-12-02 2022-07-19 苏州浪潮智能科技有限公司 一种存储海量小文件分级优化的方法、系统及介质
CN112463730A (zh) * 2020-12-02 2021-03-09 苏州浪潮智能科技有限公司 一种存储海量小文件分级优化的方法、系统及介质
CN112860188A (zh) * 2021-02-09 2021-05-28 山东英信计算机技术有限公司 一种数据迁移方法、系统、设备以及介质
WO2022171000A1 (zh) * 2021-02-09 2022-08-18 山东英信计算机技术有限公司 一种数据迁移方法、系统、设备以及介质
CN113672556A (zh) * 2021-08-19 2021-11-19 工银科技有限公司 一种批量文件的迁移方法及装置
CN114327283A (zh) * 2021-12-30 2022-04-12 西北工业大学 分布式存储系统内的数据迁移方法及分布式存储系统
CN114327283B (zh) * 2021-12-30 2024-03-12 西北工业大学 分布式存储系统内的数据迁移方法及分布式存储系统
CN114564147A (zh) * 2022-01-06 2022-05-31 浙江大华存储科技有限公司 一种数据流的自适应调整方法、系统、硬盘和存储介质
CN116069263A (zh) * 2023-03-07 2023-05-05 苏州浪潮智能科技有限公司 文件系统的优化方法、装置、服务器、设备及存储介质
CN115904263A (zh) * 2023-03-10 2023-04-04 浪潮电子信息产业股份有限公司 一种数据迁移方法、系统、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN109471836A (zh) 一种数据迁移方法、装置和系统
US6981075B2 (en) Information processing apparatus and communication path selection method
CN101795211B (zh) 一种数据存储方法及系统
CN107506447A (zh) 一种基于本地文件系统的小文件读写方法及系统
CN101673192B (zh) 时序化的数据处理方法、装置及系统
US20060265558A1 (en) Information processing method and system
KR20070024573A (ko) 최적의 성능을 위한 파일 관리 방법
CN107979636B (zh) 冷热数据分介质存储平台设计系统及方法
CN107643880A (zh) 基于分布式文件系统的文件数据迁移的方法及装置
CN110018788A (zh) 分级存储方法、装置、电子设备及计算机可读存储介质
Nath et al. Online maintenance of very large random samples on flash storage
US8472449B2 (en) Packet file system
CN109032517A (zh) 一种数据落盘的方法、装置和计算机可读存储介质
CN102902709B (zh) 一种固定空间分配的文件存储系统及实现方法
CN109918448A (zh) 一种基于用户行为的云存储数据分级方法
CN103279532A (zh) 多集合元素去重并标识所属集合的过滤系统及其方法
CN107704203A (zh) 聚合大文件的删除方法、装置、设备及计算机存储介质
CN107315540A (zh) 一种自动分层存储方法及系统
CN108763531A (zh) 一种mdvr文件存储系统及其运行方法
CN110287152A (zh) 一种数据管理的方法以及相关装置
CN109521969A (zh) 一种固态硬盘数据回收方法、装置和计算机可读存储介质
CN107885859A (zh) 一种文件个数配额的方法、装置和计算机可读存储介质
CN104915376B (zh) 一种云存储中文件的归档压缩方法
CN101706814B (zh) 基于移动向量的文件存储覆盖方法
CN109062514A (zh) 一种基于命名空间的带宽控制方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190315