CN114706816A - 数据迁移方法、装置及存储介质 - Google Patents
数据迁移方法、装置及存储介质 Download PDFInfo
- Publication number
- CN114706816A CN114706816A CN202210295958.2A CN202210295958A CN114706816A CN 114706816 A CN114706816 A CN 114706816A CN 202210295958 A CN202210295958 A CN 202210295958A CN 114706816 A CN114706816 A CN 114706816A
- Authority
- CN
- China
- Prior art keywords
- task
- data migration
- type
- tasks
- parallelism
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/119—Details of migration of file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
- G06F16/1824—Distributed file systems implemented using Network-attached Storage [NAS] architecture
- G06F16/183—Provision of network file services by network file servers, e.g. by using NFS, CIFS
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种数据迁移方法、装置及存储介质,涉及分布式技术,大数据技术领域,能够在保证高效率迁移数据的基础上,对数据迁移任务所占用的带宽进行有效控制。该方法包括:确定M个数据迁移任务中每个数据迁移任务的信息;数据迁移任务的信息包括:文件数量和文件大小中至少一项;根据每个数据迁移任务的信息,确定N种类型任务中每种类型任务的任务并行度;任一类型任务的任务并行度与任一类型任务中的一个或多个数据迁移任务的文件数量正相关,和/或,任一类型任务的任务并行度与类型任务中的一个或多个数据迁移任务的文件大小负相关;根据N种类型任务中每种类型任务的任务并行度,迁移M个数据迁移任务。本申请实施例用于数据迁移过程中。
Description
技术领域
本申请涉及分布式技术,大数据技术领域,尤其涉及一种数据迁移方法、装置及存储介质。
背景技术
在将一个城域网中的数据迁移至另外一个城域网的过程中,任务服务器会生成至少一个数据迁移任务。在不为上述数据迁移任务提供专线支持(即为上述数据迁移任务配置专用的带宽)的情况下,数据迁移任务和其他任务需要共享同一宽带。为了避免数据迁移任务占用太多带宽,任务服务器可以为数据迁移任务设置带宽限制,这样避免了数据迁移任务影响其他任务的正常运行。
目前,在数据迁移的过程中,只要满足传输的条件(例如,资源条件、时间条件等),任务服务器就会发起数据迁移任务,无法对数据迁移任务的占用的带宽进行合理的规划,这样很有可能出现数据迁移任务的传输效率较低的情况,或者数据迁移任务所占用的带宽超过带宽限制的情况。
发明内容
本申请提供一种数据迁移方法、装置及存储介质,能够在保证高效率迁移数据的基础上,对数据迁移任务所占用的带宽进行有效控制。
为达到上述目的,本申请采用如下技术方案:
第一方面,本申请提供一种数据迁移方法,该方法包括:确定M个数据迁移任务中每个数据迁移任务的信息;数据迁移任务的信息包括:文件数量和文件大小中至少一项,M为正整数;根据每个数据迁移任务的信息,确定N种类型任务中每种类型任务的任务并行度;任务并行度用于指示并行迁移的数据迁移任务的数量;任一类型任务的任务并行度与任一类型任务中的一个或多个数据迁移任务的文件数量正相关,和/或,任一类型任务的任务并行度与类型任务中的一个或多个数据迁移任务的文件大小负相关;N为小于M的正整数;根据N种类型任务中每种类型任务的任务并行度,迁移M个数据迁移任务。
上述技术方案至少带来以下有益效果:本申请提供的数据迁移方法,先确定每个数据迁移任务的信息,再根据上述每个数据迁移任务的信息,合理的为N种类型任务中每种类型任务设置任务并行度,使得当任务服务器进行数据迁移时,需要参考每种类型任务的任务并行度迁移数据迁移任务,这样基于任务并行度进行并行迁移,可以在保证高效率传输的基础上,避免了多个占用带宽较大的数据迁移任务同时迁移,导致多个数据迁移任务占用的带宽之和超出带宽限制的问题,并且还可以通过提高任务并行度,提高带宽利用率,进而有效控制并行迁移的数据迁移任务占用的带宽。。
在一种可能的实现方式中,根据每个数据迁移任务的信息,确定N种类型任务中每种类型任务的任务并行度,包括:根据每个数据迁移任务的信息,将M个数据迁移任务划分为N种类型任务;根据目标类型任务中的一个或多个数据迁移任务的信息,确定目标类型任务的任务并行度;目标类型任务为N种类型任务中的任一种类型任务。
在一种可能的实现方式中,N种类型任务包括:第一类型任务、第二类型任务、第三类型任务、以及第四类型任务中至少一项;数据迁移任务的信息包括:文件数量和文件大小;根据每个数据迁移任务的信息,将M个数据迁移任务划分为N种类型任务,包括:确定M个数据迁移任务中,文件数量小于或等于第一预设阈值的数据迁移任务为第一类型任务;和/或,确定M个数据迁移任务中,文件大小大于第二预设阈值,且文件数量小于第三预设阈值的数据迁移任务为第二类型任务;和/或,确定M个数据迁移任务中,文件大小大于第四预设阈值且小于第二预设阈值,文件数量小于第五预设阈值且大于第三预设阈值的数据迁移任务为第三类型任务;和/或,确定M个数据迁移任务中,文件大小大于第六预设阈值且小于第四预设阈值,文件数量小于第七预设阈值且大于第五预设阈值的数据迁移任务为第四类型任务。
在一种可能的实现方式中,第一类型任务的任务并行度小于第二类型任务的任务并行度,或者第一类型任务的任务并行度大于第四类型任务的任务并行度;第二类型任务的任务并行度小于第三类型任务的任务并行度;第三类型任务的任务并行度小于第四类型任务的任务并行度。
在一种可能的实现方式中,在根据N种类型任务中每种类型任务的任务并行度,迁移M个数据迁移任务之前,方法还包括:根据第一数据迁移任务的文件数量或者第一数据迁移任务的文件大小,确定第一数据迁移任务的文件并行度和第一数据迁移任务的带宽值;第一数据迁移任务为第一类型任务;文件并行度用于指示并行迁移的文件的数量;根据第二数据迁移任务的文件数量确定第二数据迁移任务的文件并行度,并根据带宽阈值和第二数据迁移任务的文件并行度,确定第二数据迁移任务的带宽值;第二数据迁移任务为第二类型任务、第三类型任务、以及第四类型任务中的任意一种。
在一种可能的实现方式中,在根据N种类型任务中每种类型任务的任务并行度,迁移M个数据迁移任务之后,方法还包括:在数据迁移任务迁移完成的情况下,对比迁移之前的数据迁移任务中的文件数量与迁移完成的数据迁移任务中的文件数量;在迁移之前的数据迁移任务中的文件数量与迁移完成的数据迁移任务中的文件数量不一致的情况下,根据迁移之前的数据迁移任务中的文件调整迁移之后的数据迁移任务的文件。
第二方面,本申请提供一种数据迁移装置,该装置包括:处理单元;处理单元,用于:确定M个数据迁移任务中每个数据迁移任务的信息;数据迁移任务的信息包括:文件数量和文件大小中至少一项,M为正整数;根据每个数据迁移任务的信息,确定N种类型任务中每种类型任务的任务并行度;任务并行度用于指示并行迁移的数据迁移任务的数量;任一类型任务的任务并行度与任一类型任务中的一个或多个数据迁移任务的文件数量正相关,和/或,任一类型任务的任务并行度与类型任务中的一个或多个数据迁移任务的文件大小负相关;N为小于M的正整数;根据N种类型任务中每种类型任务的任务并行度,迁移M个数据迁移任务。
在一种可能的实现方式中,处理单元,具体用于:根据每个数据迁移任务的信息,将M个数据迁移任务划分为N种类型任务;根据目标类型任务中的一个或多个数据迁移任务的信息,确定目标类型任务的任务并行度;目标类型任务为N种类型任务中的任一种类型任务。
在一种可能的实现方式中,N种类型任务包括:第一类型任务、第二类型任务、第三类型任务、以及第四类型任务中至少一项;数据迁移任务的信息包括:文件数量和文件大小;处理单元,具体用于:确定M个数据迁移任务中,文件数量小于或等于第一预设阈值的数据迁移任务为第一类型任务;和/或,确定M个数据迁移任务中,文件大小大于第二预设阈值,且文件数量小于第三预设阈值的数据迁移任务为第二类型任务;和/或,确定M个数据迁移任务中,文件大小大于第四预设阈值且小于第二预设阈值,文件数量小于第五预设阈值且大于第三预设阈值的数据迁移任务为第三类型任务;和/或,确定M个数据迁移任务中,文件大小大于第六预设阈值且小于第四预设阈值,文件数量小于第七预设阈值且大于第五预设阈值的数据迁移任务为第四类型任务。
在一种可能的实现方式中,第一类型任务的任务并行度小于第二类型任务的任务并行度,或者第一类型任务的任务并行度大于第四类型任务的任务并行度;第二类型任务的任务并行度小于第三类型任务的任务并行度;第三类型任务的任务并行度小于第四类型任务的任务并行度。
在一种可能的实现方式中,处理单元,还用于:根据第一数据迁移任务的文件数量或者第一数据迁移任务的文件大小,确定第一数据迁移任务的文件并行度和第一数据迁移任务的带宽值;第一数据迁移任务为第一类型任务;文件并行度用于指示并行迁移的文件的数量;根据第二数据迁移任务的文件数量确定第二数据迁移任务的文件并行度,并根据带宽阈值和第二数据迁移任务的文件并行度,确定第二数据迁移任务的带宽值;第二数据迁移任务为第二类型任务、第三类型任务、以及第四类型任务中的任意一种。
在一种可能的实现方式中,处理单元,还用于:在数据迁移任务迁移完成的情况下,对比迁移之前的数据迁移任务中的文件数量与迁移完成的数据迁移任务中的文件数量;在迁移之前的数据迁移任务中的文件数量与迁移完成的数据迁移任务中的文件数量不一致的情况下,根据迁移之前的数据迁移任务中的文件调整迁移之后的数据迁移任务的文件。
第三方面,本申请提供了一种数据迁移装置,该装置包括:处理器和通信接口;通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的数据迁移方法。
第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在终端上运行时,使得终端执行如第一方面和第一方面的任一种可能的实现方式中描述的数据迁移方法。
第五方面,本申请提供一种包含指令的计算机程序产品,当计算机程序产品在数据迁移装置上运行时,使得数据迁移装置执行如第一方面和第一方面的任一种可能的实现方式中所描述的数据迁移方法。
第六方面,本申请提供一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的数据迁移方法。
具体的,本申请中提供的芯片还包括存储器,用于存储计算机程序或指令。
本申请中第二方面、第三方面、第四方面、第五方面以及第六方面的描述,可以参考第一方面详细描述;并且,第二方面、第三方面、第四方面、第五方面以及第六方面的有益效果,可以参考第一方面的有益效果分析,此处不再赘述。
附图说明
图1为本申请实施例提供的一种数据迁移系统的结构图;
图2为本申请实施例提供的一种数据迁移方法的流程图;
图3为本申请实施例提供的另一种数据迁移方法的流程图;
图4为本申请实施例提供的另一种数据迁移方法的流程图;
图5为本申请实施例提供的另一种数据迁移方法的结构示意图;
图6为本申请实施例提供的另一种数据迁移方法的结构示意图;
图7为本申请实施例提供的一种数据迁移装置的结构示意图;
图8为本申请实施例提供的另一种数据迁移装置的结构示意图。
具体实施方式
下面结合附图对本申请实施例提供的数据迁移方法及装置进行详细地描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
以下,对本申请实施例涉及的名词进行解释,以方便读者理解。
一、城域网
城域网(metropolitan area network,MAN)是指在一个城市范围内所建立的计算机通信网。
需要说明的是,城域网的典型应用为宽带城域网。上述宽带城域网是指在城市范围内,以网络之间互连的协议(internet protocol,IP)和异步传输模式(asynchronoustransfer mode,ATM)技术为基础,以光纤作为传输媒介,将数据、语音、视频等服务集合起来,形成的高带宽、多功能、多业务接入的多媒体计算机通信网络。
二、数据迁移任务
数据迁移任务是指在数据迁移过程中生成的任务,使得任务服务器可以通过数据迁移任务对数据进行迁移。
需要说明的是,数据迁移任务的迁移过程包括:任务准备阶段、任务传输阶段、以及任务结束阶段。
任务准备阶段和任务结束阶段不会占用带宽,而在任务传输阶段中,数据迁移任务会占用带宽,对数据迁移任务中的数据进行传输。若数据迁移任务的文件大小较大,则该数据迁移任务的任务准备阶段和任务结束阶段的时长较短。若数据迁移任务的文件大小较小,则该数据迁移任务的任务准备阶段和任务结束阶段的时长较长。
需要指出的是,在数据迁移过程中,上述数据迁移任务还可以通过传输语句表示。
三、带宽限制
带宽限制指的是为特定任务设置的固定带宽值。
需要说明的是,运营商为数据迁移任务设置固定的带宽,这样可以避免数据迁移任务占用的较多的宽带资源,导致其他任务没有足够的可用带宽资源的问题。
以上是对本申请实施例中涉及到的部分概念所做的简单介绍。
如图1所示,图1示出了本申请实施例提供的一种通信系统的结构示意图。该通信系统100包括:任务服务器101和至少一个网络服务器102。图1以通信系统100包括一个任务服务器101和两个网络服务器102为例。
任务服务器101,用于确定M个数据迁移任务中每个数据迁移任务的信息,并根据每个数据迁移任务的信息,确定N种类型任务中每种类型任务的任务并行度。
一种可能的实现方式中,任务服务器101可以为腾讯TM大数据平台(tencent bigdata terrace,TSDS)。
网络服务器102,用于存储城域网中的数据。
一种可能的实现方式中,网络服务器102可以为城域网中的服务器,网络服务器102还可以为城域网中的计算设备。
此外,本申请实施例描述的通信系统是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着网络架构的演变和新通信系统的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
在将一个城域网中的数据迁移至另外一个城域网的过程中,任务服务器会生成至少一个数据迁移任务。在不为上述数据迁移任务提供专线支持(即为上述数据迁移任务配置专用的带宽)的情况下,数据迁移任务和其他任务需要共享同一宽带。为了避免数据迁移任务占用太多带宽,任务服务器可以为数据迁移任务设置带宽限制,这样避免了数据迁移任务影响其他任务的正常运行。
目前,在数据迁移的过程中,只要满足传输的条件(例如,资源条件、时间条件等),任务服务器就会发起数据迁移任务,无法对数据迁移任务的占用的带宽进行合理的规划,这样很有可能出现数据迁移任务的传输效率较低的情况,或者数据迁移任务所占用的带宽超过带宽限制的情况。
为了解决上述通用技术中存在的问题,本申请实施例提出了一种数据迁移方法,能够在保证高效率迁移数据的基础上,对数据迁移任务所占用的带宽进行有效控制。如图2所示,本实施例提供的数据迁移方法包括:
S201、任务服务器确定M个数据迁移任务中每个数据迁移任务的信息。
其中,数据迁移任务的信息包括:文件数量和文件大小中的至少一项。M为正整数。
可选的,在上述S201之前,任务服务器还可以根据待迁移的数据生成多个数据迁移任务。上述多个数据迁移任务的数量可以由任务服务器根据实际情况确定,本申请对此不作任何限制。
需要说明的是,M的值可以由任务服务器根据实际情况设置。例如,若任务服务器生成了100个数据迁移任务,则任务服务器可以将M设置为88,还可以将M设置为100。
需要指出的是,上述数据迁移任务还可以称之为目录。
S202、任务服务器根据每个数据迁移任务的信息,确定N种类型任务中每种类型任务的任务并行度。
其中,任务并行度用于指示并行迁移的数据迁移任务的数量。任一类型任务的任务并行度与任一类型任务中的一个或多个数据迁移任务的文件数量正相关,和/或,任一类型任务的任务并行度与类型任务中的一个或多个数据迁移任务的文件大小负相关。N为小于M的正整数。
一种可能的实现方式中,上述S202的具体实现过程可以为:任务服务器可以先根据每个数据迁移任务的信息,将上述M个数据迁移任务划分为N种类型任务,再从N种类型任务中,确定一个类型任务(记为类型任务#1)。任务服务器根据类型任务#1中的一个或多个数据迁移任务的信息确定类型任务#1的任务并行度,并根据上述方法确定上述N种类型任务中,除类型任务#1之外的其他类型任务的任务并行度。
作为一种可行的实现方式,任务服务器还可以将上述M个数据迁移任务划分为N个集合。上述N个集合中的每个集合包括一种类型的数据迁移任务。任务服务器根据目标集合中的一个或多个数据迁移任务的信息,确定该目标集合的任务并行度。目标集合为上述N个集合中的任一个集合。
S203、任务服务器根据N种类型任务中每种类型任务的任务并行度,迁移M个数据迁移任务。
作为一种可行的实现方式,任务服务器可以先根据每种类型任务的任务并行度,从每种类型任务中确定对应数量的数据迁移任务,再将上述确定的数据迁移任务进行并行迁移。任务服务器可以分批将上述M个数据迁移任务进行并行迁移,直至将上述M个数据迁移任务中的所有迁移任务迁移完成。
上述技术方案至少带来以下有益效果:本申请提供的数据迁移方法,任务服务器先确定每个数据迁移任务的信息,再根据上述每个数据迁移任务的信息,合理的为N种类型任务中每种类型任务设置任务并行度,使得当任务服务器进行数据迁移时,需要参考每种类型任务的任务并行度迁移数据迁移任务,这样基于任务并行度进行并行迁移,可以在保证高效率传输的基础上,避免了多个占用带宽较大的数据迁移任务同时迁移,导致多个数据迁移任务占用的带宽之和超出带宽限制的问题,并且还可以通过提高任务并行度,提高带宽利用率,进而有效控制并行迁移的数据迁移任务占用的带宽。例如,若某一类型任务(记为类型任务#2)的文件大小较大,则类型任务#2所占用的带宽较大,这样需要将类型任务#2的任务并行度设置的较低(即任一类型任务的任务并行度与任一类型任务中的一个或多个数据迁移任务的文件数量正相关,和/或,任一类型任务的任务并行度与类型任务中的一个或多个数据迁移任务的文件大小负相关),这样为类型任务#2设置合适的任务并行度,可以在保证高效率数据迁移的基础上,避免了多个占用带宽较大的数据迁移任务同时迁移,导致多个数据迁移任务占用的带宽之和超出带宽限制的问题。
又例如,若某一类型任务(记为类型任务#3)的文件大小较小,则类型任务#3所占用的带宽较小,这样需要将该类型任务#3的任务并行度设置的较高一些,这样避免了带宽利用率较低,导致的带宽资源浪费的问题。
由于数据迁移任务的文件大小和数据迁移任务的文件数量呈负相关,因此,在数据迁移任务的文件数量较少的情况下,该数据迁移任务的文件大小会较大,这样任务服务器可以将该数据迁移任务对应的类型任务的任务并行度设置的较低,使得在保证高效率数据迁移的基础上,避免了多个占用带宽较大的数据迁移任务同时迁移,导致多个数据迁移任务占用的带宽之和超出带宽限制的问题。相应的,在数据迁移任务的文件数量较多的情况下,该数据迁移任务的文件大小会较小,这样任务服务器可以将该数据迁移任务对应的类型任务的任务并行度设置的较高,避免了带宽利用率较低,导致的带宽资源浪费的问题。
一种可能的实现方式中,结合图2,如图3所示,上述S202具体可以通过以下S301至S302确定。
S301、任务服务器根据每个数据迁移任务的信息,将M个数据迁移任务划分为N种类型任务。
举例说明,当数据迁移任务的信息仅包括数据迁移任务的文件数量时,任务服务器需要根据数据迁移任务的文件数量,将M个数据迁移任务划分为N种类型任务。例如,任务服务器将文件数量大于或等于100的数据迁移任务记为类型任务#4,将文件数量小于100且大于80的数据迁移任务记为类型任务#5,将文件数量小于80的数据迁移任务记为类型任务#6。在该情况下,N种类型任务包括:类型任务#4、类型任务#5、以及类型任务#6。
当数据迁移任务的信息仅包括数据迁移任务的文件大小时,任务服务器需要根据数据迁移任务的文件大小,将M个数据迁移任务划分为N种类型任务。例如,任务服务器将文件大小大于或等于200的数据迁移任务记为类型任务#7,将文件大小小于200且大于150的数据迁移任务记为类型任务#8,将文件大小小于150的数据迁移任务记为类型任务#9。在该情况下,N种类型任务包括:类型任务#7、类型任务#8、以及类型任务#9。
当数据迁移任务的信息包括:数据迁移任务的文件数量和数据迁移任务的文件大小时,任务服务器需要根据数据迁移任务的文件数量和数据迁移任务的文件大小,将M个数据迁移任务划分为N种类型任务。例如,任务服务器将文件数量大于或等于100,且文件大小小于200的数据迁移任务记为类型任务#10,将文件数量小于100,文件数量大于100且小于或等于200的数据迁移任务记为类型任务#11。在该情况下,N种类型任务包括:类型任务#10和类型任务#11。
S302、任务服务器根据目标类型任务中的一个或多个数据迁移任务的信息,确定目标类型任务的任务并行度。
其中,目标类型任务为N种类型任务中的任一种类型任务。
作为一种可行的实现方式,任务服务器可以根据目标类型任务中的一个数据迁移任务的信息,确定目标类型任务的任务并行度。在该情况下,若目标类型任务中的任一个数据迁移任务的文件数量较多,则任务服务器可以将目标类型任务的任务并行度设置的较高。若目标类型任务中的任一个数据迁移任务的文件数量较少,则任务服务器可以将目标类型任务的任务并行度设置的较低。若目标类型任务中的任一个数据迁移任务的文件大小较小,则任务服务器可以将目标类型任务的任务并行度设置的较高。若目标类型任务中的任一个数据迁移任务的文件大小较大,则任务服务器可以将目标类型任务的任务并行度设置的较低。
作为另一种可行的实现方式,任务服务器可以根据目标类型任务中的多个数据迁移任务的信息,确定目标类型任务的任务并行度。在该情况下,若目标类型任务中的任意多个数据迁移任务的文件数量的平均值较高,则任务服务器将目标类型任务的任务并行度设置的较高。若目标类型任务中的任意多个数据迁移任务的文件数量的平均值较低,则任务服务器将目标类型任务的任务并行度设置的较低。若目标类型任务中的任意多个数据迁移任务的文件大小的平均值较高,则任务服务器将目标类型任务的任务并行度设置的较高。若目标类型任务中的任意多个数据迁移任务的文件大小的平均值较低,则任务服务器将目标类型任务的任务并行度设置的较低。
在一些可选的情形中,数据迁移任务的文件大小可以是上述数据迁移任务中的所有文件的文件大小的平均值,数据迁移任务的文件大小还可以是上述数据迁移任务中的所有文件中任一个文件的文件大小。
作为一种可选的实现方式,上述任意多个数据迁移任务的数量需要小于或等于上述M个数据迁移任务中,目标类型任务的数量。上述任意多个数据迁移任务的数量可以由任务服务器根据实际情况设置,本申请对此不做其他限制。
上述技术方案至少带来以下有益效果:本申请提供的数据迁移方法,任务服务器先将M个数据迁移任务划分为N种类型任务,再确定上述N种类型任务中每种类型任务的任务并行度,使得在数据迁移的过程中,任务服务器可以为N种类型任务中的每种类型任务设置合适的任务并行度。如此,任务服务器可以在保证高效率数据迁移的基础上,避免多个占用带宽较大的数据迁移任务同时迁移,导致多个数据迁移任务占用的带宽之和超出带宽限制的问题;而且,由于任务服务器通过任务并行度通过设置任务并行度,控制了数据迁移任务中带宽的占用,因此,任务服务器可以通过提高任务并行度,提高并行迁移的数据迁移任务的数量,进而提高了带宽的利用率
需要说明的是,在N种类型任务包括:第一类型任务、第二类型任务、第三类型任务、以及第四类型任务中至少一种,且数据迁移任务的信息包括:文件数量和文件大小的情况下,结合图3,如图4所示,上述S301具体可以通过以下S401至S404确定。
S401、任务服务器确定M个数据迁移任务中,文件数量小于或等于第一预设阈值的数据迁移任务为第一类型任务。
S402、任务服务器确定M个数据迁移任务中,文件大小大于第二预设阈值,且文件数量小于第三预设阈值的数据迁移任务为第二类型任务。
需要说明的是,由于上述第二类型任务的文件大小较大,因此任务服务器可以将上述第二类型任务的迁移时间设置在网络负载较低的时间段或者网络通畅的时间段。
S403、任务服务器确定M个数据迁移任务中,文件大小大于第四预设阈值且小于第二预设阈值,文件数量小于第五预设阈值且大于第三预设阈值的数据迁移任务为第三类型任务。
S404、任务服务器确定M个数据迁移任务中,文件大小大于第六预设阈值且小于第四预设阈值,文件数量小于第七预设阈值且大于第五预设阈值的数据迁移任务为第四类型任务。
作为一种可选的实现方式,预设阈值与类型任务之间的关闭可以如下表1所示。由下表1可知,第一预设阈值>第二预设阈值>第四预设阈值>第六预设阈值,第三预设阈值<第五预设阈值<第七预设阈值。
表1
示例性的,任务服务器可以将第一预设阈值设置为0,将第二预设阈值设置为200,将第四预设阈值设置为180,将第六预设阈值设置为150。任务服务器可以将第三预设阈值设置为5,将第五预设阈值设置为8,将第七预设阈值设置为10。
需要指出的是,上述仅为第一预设阈值、第二预设阈值、第三预设阈值、第四预设阈值、第五预设阈值、第六预设阈值、以及第七预设阈值的一种示例性的描述。任务服务器还可以将第一预设阈值、第二预设阈值、第三预设阈值、第四预设阈值、第五预设阈值、第六预设阈值、以及第七预设阈值设置为其他数值,本申请对此不作任何限制。
一种可能的实现方式中,第一类型任务的任务并行度小于第二类型任务的任务并行度,或者第一类型任务的任务并行度大于第四类型任务的任务并行度。第二类型任务的任务并行度小于第三类型任务的任务并行度。第三类型任务的任务并行度小于第四类型任务的任务并行度。
需要说明的是,由于第一类型任务的文件数量和文件大小可以为0,或者特别小,迁移第一类型任务时只占用资源(例如,时频资源),对带宽的占用基本上可以忽略不计,因此,第一类型任务的任务并行度对于整个带宽的控制是没有较大的影响。
在第一类型任务的数量较少的情况下,任务服务器可以将第一类型任务的任务并行度设置的较低,使得第一类型任务的任务并行度小于第二类型任务的任务并行度。
示例性的,任务服务器将第一类型任务的任务并行度设置为1,第二类型任务的任务并行度设置为3,第三类型任务的任务并行度设置为5,第四类型任务的任务并行度设置为8。在该情况下,第一类型任务的任务并行度(例如,1)小于第二类型任务的任务并行度(例如,3)。第二类型任务的任务并行度(例如,3)小于第三类型任务的任务并行度(例如,5)。第三类型任务的任务并行度(例如,5)小于第四类型任务的任务并行度(例如,8)。
可选的,在第一类型任务的数量较多的情况下,任务服务器还可以将第一类型任务的任务并行度设置的较高,使得第一类型任务的任务并行度大于第四类型任务,以便于上述第一类型任务可以在规定时间段内完成迁移。例如,任务服务器将第一类型任务的任务并行度设置为10,第二类型任务的任务并行度设置为3,第三类型任务的任务并行度设置为5,第四类型任务的任务并行度设置为8。在该情况下,第二类型任务的任务并行度(例如,3)小于第三类型任务的任务并行度(例如,5)。第三类型任务的任务并行度(例如,5)小于第四类型任务的任务并行度(例如,8)。第四类型任务的任务并行度(例如,8)小于第一类型任务的任务并行度(例如,10)。
举例说明,由于第二预设阈值>第四预设阈值>第六预设阈值,因此第二类型任务的文件大小>第三类型任务的文件大小>第四类型任务的文件大小。由于任一类型任务的任务并行度与类型任务中的一个或多个数据迁移任务的文件大小负相关,因此第二类型任务的任务并行度<第三类型任务的任务并行度<第四类型任务的任务并行度。例如,任务服务器将第二类型任务的任务并行度设置为3,将第三类型任务的任务并行度设置为5,将第四类型任务的任务并行度设置为8。
由于第三预设阈值<第五预设阈值<第七预设阈值,因此第二类型任务的文件数量<第三类型任务的文件数量<第四类型任务的文件大小。由于任一类型任务的任务并行度与类型任务中的一个或多个数据迁移任务的文件数量正相关,因此第二类型任务的任务并行度<第三类型任务的任务并行度<第四类型任务的任务并行度。
作为一种可行的实现方式,任务服务器在设置第四类型任务的任务并行度的过程中,还可以参考上述M个数据迁移任务中,第四类型任务的数量。若上述M个数据迁移任务中,第四类型任务的数量较少,则任务服务器只需将第四类型任务的任务并行度设置的较低(但第四类型任务的任务并行度需高于第三类型任务的任务并行度)。例如,任务服务器将第三类型任务的任务并行度设置为5,将第四类型任务的任务并行度设置为8。若上述M个数据迁移任务中,第四类型任务的数量较多,则任务服务器可以将第四类型任务的任务并行度设置的较高。例如,任务服务器将第三类型任务的任务并行度设置为5,将第四类型任务的任务并行度设置为15。
相应的,在设置第二类型任务的任务并行度和第三类型任务的任务并行度的过程中,还可以参考上述M个数据迁移任务中,第二类型任务的数量,以及上述M个数据迁移任务中,第三类型任务的数量。
需要指出的是,图4所示的方法是以N种类型任务包括:第一类型任务、第二类型任务、第三类型任务、以及第四类型任务为例进行说明的,N种类型任务还可以包括第五类型任务、第六类型任务等,本申请对比不做任何限制。关于在N种类型任务包括:第一类型任务、第二类型任务、第三类型任务、第四类型任务、第五类型任务、以及第六类型任务的情况下,任务服务器确定第一类型任务、第二类型任务、第三类型任务、第四类型任务、第五类型任务、以及第六类型任务的具体实现过程可以参考图4所示的方法进行理解,此处不再赘述。
可以理解的是,图4所示的方法是在数据迁移任务的信息包括:数据迁移任务的文件数量和数据迁移任务的文件大小的情况下,任务服务器将M个数据迁移任务划分成N种类型任务的方法。关于在数据迁移任务的信息仅包括数据迁移任务的文件数量,或者数据迁移任务的信息仅包括数据迁移任务的文件大小的情况下,任务服务器将M个数据迁移任务划分成N种类型任务的具体实现过程可以参考图4所示的方法进行理解,此处不再赘述。
上述技术方案至少带来以下有益效果:本申请提供的数据迁移方法,在N种类型任务包括:第一类型任务、第二类型任务、第三类型任务、以及第四类型任务,且数据迁移任务的信息包括:数据迁移任务的文件数量和数据迁移任务的文件大小的情况下,任务服务器通过第一预设阈值、第二预设阈值、第三预设阈值、第四预设阈值、第五预设阈值、第六预设阈值、以及第七预设阈值,将M个数据迁移任务划分为四种类型任务。通过上述方法,能够快速的将M个数据迁移任务划分为四种类型任务,为后续任务服务器为四种类型任务中的每种类型任务设置任务并行度提供数据基础。
需要说明的是,为了上述M个数据迁移任务能够成功迁移完成,任务服务器还需要为上述M个数据迁移任务中的每个数据迁移任务设置文件并行度和带宽值。结合图4,如图5所示,在上述S203之前,任务服务器为上述M个数据迁移任务中的每个数据迁移任务设置文件并行度和带宽值的具体实现过程可以通过以下S501-S502实现。
S501、任务服务器根据第一数据迁移任务的文件数量或者第一数据迁移任务的文件大小,确定第一数据迁移任务的文件并行度和第一数据迁移任务的带宽值。
其中,第一数据迁移任务为第一类型任务。文件并行度用于指示并行迁移的文件的数量。
一种可能的实现方式中,由于第一数据迁移任务的文件数量或者第一数据迁移任务的文件大小均较小,因此,任务服务器可以将第一数据迁移任务的文件并行度设置为与第一数据迁移任务的文件数量相同的值,将第一数据迁移任务的带宽值设置为0.5倍的第一数据迁移任务的文件数量的值。或者,任务服务器可以将第一数据迁移任务的文件并行度设置为与第一数据迁移任务的文件大小相同的值,将第一数据迁移任务的带宽值设置为0.5倍的第一数据迁移任务的文件大小的值。
示例性的,在第一数据迁移任务的文件数量为2,或者第一数据迁移任务的文件大小为2的情况下,任务服务器可以将第一数据迁移任务的文件并行度设置为2,并将第一数据迁移任务的带宽值设置为1。
S502、任务服务器根据第二数据迁移任务的文件数量确定第二数据迁移任务的文件并行度,并根据带宽阈值和第二数据迁移任务的文件并行度,确定第二数据迁移任务的带宽值。
其中,第二数据迁移任务为第二类型任务、第三类型任务、以及第四类型任务中的任意一种。
需要说明的是,任务服务器确定第二数据迁移任务的文件并行度和第二数据迁移任务的带宽值的方法与第二数据迁移任务的类型有关。在第二数据迁移任务为不同类型任务的情况下,计算设备确定第二数据迁移任务的文件并行度和第二数据迁移任务的带宽值的方法不同。因此,以下对情况1、第二数据迁移任务为第二类型任务;情况2、第二数据迁移任务为第三类型任务;情况3、第二数据迁移任务为第四类型任务分别进行说明。
情况1、第二数据迁移任务为第二类型任务。
在情况1中,第二数据迁移任务的文件并行度满足以下公式1:
L=t×0.8 公式1
其中,L为第二数据迁移任务的文件并行度。t为第二数据迁移任务的文件数量。
在情况1中,第二数据迁移任务的带宽值满足以下公式2:
b=c/L 公式2
其中,b为第二数据迁移任务的带宽值。c为带宽阈值。
情况2、第二数据迁移任务为第三类型任务。
在情况2中,第二数据迁移任务的文件并行度满足以下公式3:
L=t 公式3
在情况2中,第二数据迁移任务的带宽值满足以下公式4:
b=c×0.5/L 公式4
情况3、第二数据迁移任务为第四类型任务。
在情况3中,第二数据迁移任务的文件并行度满足以上公式3。
在情况3中,第二数据迁移任务的带宽值满足以下公式5:
b=c×0.3/L 公式4
可选的,在情况3中,任务服务器还可以将第二数据任务的带宽值设置为固定值(例如,1)。
上述技术方案至少带来以下有益效果:本申请提供的数据迁移方法,任务服务器根据第一数据迁移任务的文件数量或者第一数据迁移任务的文件大小,确定第一数据迁移任务的文件并行度和第一数据迁移任务的带宽值,并根据第二数据迁移任务的文件数量确定第二数据迁移任务的文件并行度,根据带宽阈值和第二数据迁移任务的文件并行度,确定第二数据迁移任务的带宽值,这样可以得到上述M种数据迁移任务中每个数据迁移任务的带宽值和文件并行度,为后续数据迁移任务的迁移提供了数据准备。
需要说明的是,在数据迁移任务迁移完成之后,任务服务器还可以对迁移完成的数据迁移任务中的文件进行对比和修复。结合图5,如图6所示,在上述S203之后,任务服务器对迁移完成的数据迁移任务中的文件进行对比和修复的具体实现过程可以通过以下S601-S603实现。
S601、任务服务器确定数据迁移任务是否迁移完成。
作为一种可行的实现方式,任务服务器可以通过查询数据迁移任务的中间状态确定数据迁移任务是否迁移完成。
若否,则任务服务器结束流程。
作为一种可选的实现方式,若任务服务器在数据迁移任务的中间状态中未查询到已迁移完成的中间状态,则任务服务器可以确定数据迁移任务未迁移完成。
若是,则任务服务器执行S602。
在一种可行的实现方式中,若任务服务器在数据迁移任务的中间状态中查询到已迁移完成的中间状态,则任务服务器可以确定数据迁移任务已迁移完成。
S602、任务服务器确定迁移之前的数据迁移任务中的文件数量与迁移完成的数据迁移任务中的文件数量是否一致。
示例性的,迁移之前的数据迁移任务中的文件数量可以为5,迁移完成的数据迁移任务中的文件数量可以为4。
若是,则任务服务器结束流程。
若否,则任务服务器执行S603。
结合上述示例,任务服务器可以确定迁移之前的数据迁移任务中的文件数量与迁移完成的数据迁移任务中的文件数量不一致。
S603、任务服务器根据迁移之前的数据迁移任务中的文件调整迁移之后的数据迁移任务的文件。
作为一种可行的实现方式,上述S603的具体实现过程可以为:任务服务器先对比迁移之前的数据迁移任务中的文件与迁移完成的数据迁移任务中的文件,从迁移之前的数据迁移任务中的文件中,确定不存在于迁移完成的数据迁移任务中的文件(记为文件#1),并将文件#1迁移至迁移完成的数据迁移任务中。任务服务器先对比迁移之前的数据迁移任务中的文件与迁移完成的数据迁移任务中的文件,从迁移完成的数据迁移任务中的文件中,确定不存在于迁移之前的数据迁移任务中的文件(记为文件#2),并将文件#2删除。
需要指出的是,上述文件#2可以为在迁移过程中生成的乱码文件或者错误文件。
上述技术方案至少带来以下有益效果:本申请提供的数据迁移方法,任务服务器对迁移完成的数据迁移任务中的文件数量进行对比,并对迁移完成的数据迁移任务中的文件进行修复,这样保证了数据迁移完成之后,数据迁移任务中的文件的正确性。
可以理解的是,上述数据迁移方法可以由数据迁移装置实现。数据迁移装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,本申请公开实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请公开实施例的范围。
本申请公开实施例可以根据上述方法示例生成的数据迁移装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请公开实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图7为本发明实施例提供的一种数据迁移装置的结构示意图。如图7所示,数据迁移装置70可以用于执行图2-图6所示的数据迁移方法。该数据迁移装置70可以包括:处理单元701。可选的,该数据迁移装置70还可以包括:通信单元702。
处理单元701,用于:确定M个数据迁移任务中每个数据迁移任务的信息;数据迁移任务的信息包括:文件数量和文件大小中至少一项,M为正整数;根据每个数据迁移任务的信息,确定N种类型任务中每种类型任务的任务并行度;任务并行度用于指示并行迁移的数据迁移任务的数量;任一类型任务的任务并行度与任一类型任务中的一个或多个数据迁移任务的文件数量正相关,和/或,任一类型任务的任务并行度与类型任务中的一个或多个数据迁移任务的文件大小负相关;N为小于M的正整数;根据N种类型任务中每种类型任务的任务并行度,迁移M个数据迁移任务。
在一种可能的实现方式中,处理单元701,具体用于:根据每个数据迁移任务的信息,将M个数据迁移任务划分为N种类型任务;根据目标类型任务中的一个或多个数据迁移任务的信息,确定目标类型任务的任务并行度;目标类型任务为N种类型任务中的任一种类型任务。
在一种可能的实现方式中,N种类型任务包括:第一类型任务、第二类型任务、第三类型任务、以及第四类型任务中至少一项;数据迁移任务的信息包括:数据迁移任务的文件数量和数据迁移任务的文件大小;处理单元701,具体用于:确定M个数据迁移任务中,文件数量小于或等于第一预设阈值的数据迁移任务为第一类型任务;和/或,确定M个数据迁移任务中,文件大小大于第二预设阈值,且文件数量小于第三预设阈值的数据迁移任务为第二类型任务;和/或,确定M个数据迁移任务中,文件大小大于第四预设阈值且小于第二预设阈值,文件数量小于第五预设阈值且大于第三预设阈值的数据迁移任务为第三类型任务;和/或,确定M个数据迁移任务中,文件大小大于第六预设阈值且小于第四预设阈值,文件数量小于第七预设阈值且大于第五预设阈值的数据迁移任务为第四类型任务。
在一种可能的实现方式中,第一类型任务的任务并行度小于第二类型任务的任务并行度,或者第一类型任务的任务并行度大于第四类型任务的任务并行度;第二类型任务的任务并行度小于第三类型任务的任务并行度;第三类型任务的任务并行度小于第四类型任务的任务并行度。
在一种可能的实现方式中,在确定M个数据迁移任务中每个数据迁移任务的信息之后,处理单元701,还用于:根据第一数据迁移任务的文件数量或者第一数据迁移任务的文件大小,确定第一数据迁移任务的文件并行度和第一数据迁移任务的带宽值;第一数据迁移任务为第一类型任务;文件并行度用于指示并行迁移的文件的数量;根据第二数据迁移任务的文件数量确定第二数据迁移任务的文件并行度,并根据带宽阈值和第二数据迁移任务的文件并行度,确定第二数据迁移任务的带宽值;第二数据迁移任务为第二类型任务、第三类型任务、以及第四类型任务中的任意一种。
在一种可能的实现方式中,在根据每个数据迁移任务的信息,确定N种类型任务中每种类型任务的任务并行度之后,处理单元701,还用于:在数据迁移任务迁移完成的情况下,对比迁移之前的数据迁移任务中的文件数量与迁移完成的数据迁移任务中的文件数量;在迁移之前的数据迁移任务中的文件数量与迁移完成的数据迁移任务中的文件数量不一致的情况下,根据迁移之前的数据迁移任务中的文件调整迁移之后的数据迁移任务的文件。
图8示出了上述实施例中所涉及的数据迁移装置的又一种可能的结构示意图。该数据迁移装置80包括:目录分类模块801和并行调度模块802。
目录分类模块801,用于确定M个数据迁移任务中每个数据迁移任务的信息;数据迁移任务的信息包括:数据迁移任务的文件数量和数据迁移任务的文件大小中的至少一项;M为正整数。
并行调度模块802,用于根据每个数据迁移任务的信息,确定N种类型任务中每种类型任务的任务并行度,并根据N种类型任务中每种类型任务的任务并行度,迁移M个数据迁移任务;任务并行度用于指示并行迁移的数据迁移任务的数量;任一类型任务的任务并行度与任一类型任务中的一个或多个数据迁移任务的文件数量正相关,和/或,任一类型任务的任务并行度与类型任务中的一个或多个数据迁移任务的文件大小负相关;N为小于M的正整数。
在一种可能的实现方式中,并行调度模块802,具体用于:根据每个数据迁移任务的信息,将M个数据迁移任务划分为N种类型任务;根据目标类型任务中的一个或多个数据迁移任务的信息,确定目标类型任务的任务并行度;目标类型任务为N种类型任务中的任一种类型任务。
在一种可能的实现方式中,N种类型任务包括:第一类型任务、第二类型任务、第三类型任务、以及第四类型任务中至少一项;数据迁移任务的信息包括:数据迁移任务的文件数量和数据迁移任务的文件大小;目录分类模块801,具体用于:确定M个数据迁移任务中,文件数量小于或等于第一预设阈值的数据迁移任务为第一类型任务;和/或,确定M个数据迁移任务中,文件大小大于第二预设阈值,且文件数量小于第三预设阈值的数据迁移任务为第二类型任务;和/或,确定M个数据迁移任务中,文件大小大于第四预设阈值且小于第二预设阈值,文件数量小于第五预设阈值且大于第三预设阈值的数据迁移任务为第三类型任务;和/或,确定M个数据迁移任务中,文件大小大于第六预设阈值且小于第四预设阈值,文件数量小于第七预设阈值且大于第五预设阈值的数据迁移任务为第四类型任务。
在一种可能的实现方式中,第一类型任务的任务并行度小于第二类型任务的任务并行度,或者第一类型任务的任务并行度大于第四类型任务的任务并行度;第二类型任务的任务并行度小于第三类型任务的任务并行度;第三类型任务的任务并行度小于第四类型任务的任务并行度。
在一种可能的实现方式中,该数据迁移装置80包括:数据核对修复模块803。数据核对修复模块803,用于:根据第一数据迁移任务的文件数量或者第一数据迁移任务的文件大小,确定第一数据迁移任务的文件并行度和第一数据迁移任务的带宽值;第一数据迁移任务为第一类型任务;文件并行度用于指示并行迁移的文件的数量;根据第二数据迁移任务的文件数量确定第二数据迁移任务的文件并行度,并根据带宽阈值和第二数据迁移任务的文件并行度,确定第二数据迁移任务的带宽值;第二数据迁移任务为第二类型任务、第三类型任务、以及第四类型任务中的任意一种。
在一种可能的实现方式中,并行调度模块,还用于:在数据迁移任务迁移完成的情况下,对比迁移之前的数据迁移任务中的文件数量与迁移完成的数据迁移任务中的文件数量;在迁移之前的数据迁移任务中的文件数量与迁移完成的数据迁移任务中的文件数量不一致的情况下,根据迁移之前的数据迁移任务中的文件调整迁移之后的数据迁移任务的文件。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合、或者本领域熟知的任何其它形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(Application Specific Integrated Circuit,ASIC)中。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (14)
1.一种数据迁移方法,其特征在于,包括:
确定M个数据迁移任务中每个数据迁移任务的信息;所述数据迁移任务的信息包括:文件数量和文件大小中至少一项,M为正整数;
根据所述每个数据迁移任务的信息,确定N种类型任务中每种类型任务的任务并行度;所述任务并行度用于指示并行迁移的数据迁移任务的数量;任一类型任务的任务并行度与所述任一类型任务中的一个或多个数据迁移任务的文件数量正相关,和/或,所述任一类型任务的任务并行度与所述类型任务中的一个或多个数据迁移任务的文件大小负相关;N为小于M的正整数;
根据所述N种类型任务中每种类型任务的任务并行度,迁移所述M个数据迁移任务。
2.根据权利要求1所述的方法,其特征在于,所述根据所述每个数据迁移任务的信息,确定N种类型任务中每种类型任务的任务并行度,包括:
根据所述每个数据迁移任务的信息,将所述M个数据迁移任务划分为所述N种类型任务;
根据目标类型任务中的一个或多个数据迁移任务的信息,确定所述目标类型任务的任务并行度;所述目标类型任务为所述N种类型任务中的任一种类型任务。
3.根据权利要求2所述的方法,其特征在于,所述N种类型任务包括:第一类型任务、第二类型任务、第三类型任务、以及第四类型任务中至少一种;所述数据迁移任务的信息包括:所述文件数量和所述文件大小;
所述根据所述每个数据迁移任务的信息,将所述M个数据迁移任务划分为所述N种类型任务,包括:
确定所述M个数据迁移任务中,所述文件数量小于或等于第一预设阈值的数据迁移任务为所述第一类型任务;
和/或,确定所述M个数据迁移任务中,所述文件大小大于第二预设阈值,且所述文件数量小于第三预设阈值的数据迁移任务为所述第二类型任务;
和/或,确定所述M个数据迁移任务中,所述文件大小大于第四预设阈值且小于所述第二预设阈值,所述文件数量小于第五预设阈值且大于所述第三预设阈值的数据迁移任务为所述第三类型任务;
和/或,确定所述M个数据迁移任务中,所述文件大小大于第六预设阈值且小于所述第四预设阈值,所述文件数量小于第七预设阈值且大于所述第五预设阈值的数据迁移任务为所述第四类型任务。
4.根据权利要求3所述的方法,其特征在于,所述第一类型任务的任务并行度小于所述第二类型任务的任务并行度,或者所述第一类型任务的任务并行度大于所述第四类型任务的任务并行度;
所述第二类型任务的任务并行度小于所述第三类型任务的任务并行度;
所述第三类型任务的任务并行度小于所述第四类型任务的任务并行度。
5.根据权利要求3或4所述的方法,其特征在于,在所述根据所述N种类型任务中每种类型任务的任务并行度,迁移所述M个数据迁移任务之前,所述方法还包括:
根据第一数据迁移任务的文件数量或者所述第一数据迁移任务的文件大小,确定所述第一数据迁移任务的文件并行度和所述第一数据迁移任务的带宽值;所述第一数据迁移任务为所述第一类型任务;所述文件并行度用于指示并行迁移的文件的数量;
根据第二数据迁移任务的文件数量确定所述第二数据迁移任务的文件并行度,并根据带宽阈值和所述第二数据迁移任务的文件并行度,确定所述第二数据迁移任务的带宽值;所述第二数据迁移任务为所述第二类型任务、所述第三类型任务、以及所述第四类型任务中的任意一种。
6.根据权利要求1-4任一项所述的方法,其特征在于,在所述根据所述N种类型任务中每种类型任务的任务并行度,迁移所述M个数据迁移任务之后,所述方法还包括:
在所述数据迁移任务迁移完成的情况下,对比迁移之前的数据迁移任务中的文件数量与迁移完成的数据迁移任务中的文件数量;
在所述迁移之前的数据迁移任务中的文件数量与所述迁移完成的数据迁移任务中的文件数量不一致的情况下,根据所述迁移之前的数据迁移任务中的文件调整所述迁移之后的数据迁移任务的文件。
7.一种数据迁移装置,其特征在于,包括:处理单元;所述处理单元,用于:
确定M个数据迁移任务中每个数据迁移任务的信息;所述数据迁移任务的信息包括:文件数量和文件大小中至少一项,M为正整数;
根据所述每个数据迁移任务的信息,确定N种类型任务中每种类型任务的任务并行度;所述任务并行度用于指示并行迁移的数据迁移任务的数量;任一类型任务的任务并行度与所述任一类型任务中的一个或多个数据迁移任务的文件数量正相关,和/或,所述任一类型任务的任务并行度与所述类型任务中的一个或多个数据迁移任务的文件大小负相关;N为小于M的正整数;
根据所述N种类型任务中每种类型任务的任务并行度,迁移所述M个数据迁移任务。
8.根据权利要求7所述的装置,其特征在于,所述处理单元,具体用于:
根据所述每个数据迁移任务的信息,将所述M个数据迁移任务划分为所述N种类型任务;
根据目标类型任务中的一个或多个数据迁移任务的信息,确定所述目标类型任务的任务并行度;所述目标类型任务为所述N种类型任务中的任一种类型任务。
9.根据权利要求8所述的装置,其特征在于,所述N种类型任务包括:第一类型任务、第二类型任务、第三类型任务、以及第四类型任务中至少一种;所述数据迁移任务的信息包括:所述文件数量和所述文件大小;
所述处理单元,具体用于:
确定所述M个数据迁移任务中,所述文件数量小于或等于第一预设阈值的数据迁移任务为所述第一类型任务;
和/或,确定所述M个数据迁移任务中,所述文件大小大于第二预设阈值,且所述文件数量小于第三预设阈值的数据迁移任务为所述第二类型任务;
和/或,确定所述M个数据迁移任务中,所述文件大小大于第四预设阈值且小于所述第二预设阈值,所述文件数量小于第五预设阈值且大于所述第三预设阈值的数据迁移任务为所述第三类型任务;
和/或,确定所述M个数据迁移任务中,所述文件大小大于第六预设阈值且小于所述第四预设阈值,所述文件数量小于第七预设阈值且大于所述第五预设阈值的数据迁移任务为所述第四类型任务。
10.根据权利要求9所述的装置,其特征在于,所述第一类型任务的任务并行度小于所述第二类型任务的任务并行度,或者所述第一类型任务的任务并行度大于所述第四类型任务的任务并行度;
所述第二类型任务的任务并行度小于所述第三类型任务的任务并行度;
所述第三类型任务的任务并行度小于所述第四类型任务的任务并行度。
11.根据权利要求9或10所述的装置,其特征在于,所述处理单元,还用于:
根据第一数据迁移任务的文件数量或者所述第一数据迁移任务的文件大小,确定所述第一数据迁移任务的文件并行度和所述第一数据迁移任务的带宽值;所述第一数据迁移任务为所述第一类型任务;所述文件并行度用于指示并行迁移的文件的数量;
根据第二数据迁移任务的文件数量确定所述第二数据迁移任务的文件并行度,并根据带宽阈值和所述第二数据迁移任务的文件并行度,确定所述第二数据迁移任务的带宽值;所述第二数据迁移任务为所述第二类型任务、所述第三类型任务、以及所述第四类型任务中的任意一种。
12.根据权利要求7-10任一项所述的装置,其特征在于,所述处理单元,还用于:
在所述数据迁移任务迁移完成的情况下,对比迁移之前的数据迁移任务中的文件数量与迁移完成的数据迁移任务中的文件数量;
在所述迁移之前的数据迁移任务中的文件数量与所述迁移完成的数据迁移任务中的文件数量不一致的情况下,根据所述迁移之前的数据迁移任务中的文件调整所述迁移之后的数据迁移任务的文件。
13.一种数据迁移装置,其特征在于,包括:处理器和通信接口;所述通信接口和所述处理器耦合,所述处理器用于运行计算机程序或指令,以实现如权利要求1-6任一项中所述的数据迁移方法。
14.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当计算机执行该指令时,该计算机执行上述权利要求1-6任一项中所述的数据迁移方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210295958.2A CN114706816A (zh) | 2022-03-24 | 2022-03-24 | 数据迁移方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210295958.2A CN114706816A (zh) | 2022-03-24 | 2022-03-24 | 数据迁移方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114706816A true CN114706816A (zh) | 2022-07-05 |
Family
ID=82170732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210295958.2A Pending CN114706816A (zh) | 2022-03-24 | 2022-03-24 | 数据迁移方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114706816A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116614379A (zh) * | 2023-07-18 | 2023-08-18 | 中移(苏州)软件技术有限公司 | 迁移服务的带宽调整方法、装置及相关设备 |
CN117573327A (zh) * | 2024-01-15 | 2024-02-20 | 吉奥时空信息技术股份有限公司 | 一种智能调度和趋势监控的方法、设备及存储介质 |
-
2022
- 2022-03-24 CN CN202210295958.2A patent/CN114706816A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116614379A (zh) * | 2023-07-18 | 2023-08-18 | 中移(苏州)软件技术有限公司 | 迁移服务的带宽调整方法、装置及相关设备 |
CN116614379B (zh) * | 2023-07-18 | 2023-10-10 | 中移(苏州)软件技术有限公司 | 迁移服务的带宽调整方法、装置及相关设备 |
CN117573327A (zh) * | 2024-01-15 | 2024-02-20 | 吉奥时空信息技术股份有限公司 | 一种智能调度和趋势监控的方法、设备及存储介质 |
CN117573327B (zh) * | 2024-01-15 | 2024-04-16 | 吉奥时空信息技术股份有限公司 | 一种智能调度和趋势监控的方法、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11340803B2 (en) | Method for configuring resources, electronic device and computer program product | |
CN114706816A (zh) | 数据迁移方法、装置及存储介质 | |
EP3451727B1 (en) | Access scheduling method and device for terminal, and computer storage medium | |
US9513835B2 (en) | Impact-based migration scheduling from a first tier at a source to a second tier at a destination | |
US20150381709A1 (en) | Input/output management in a distributed strict queue | |
US9591101B2 (en) | Message batching in a distributed strict queue | |
US9571414B2 (en) | Multi-tiered processing using a distributed strict queue | |
CN109412841A (zh) | 虚拟机资源的调整方法、装置和云平台 | |
CN110659151A (zh) | 数据校验方法及装置,存储介质 | |
US20150378796A1 (en) | Client control in a distributed strict queue | |
CN108304272B (zh) | 一种数据io请求的处理方法及装置 | |
US20110035499A1 (en) | Discontinuous access management method using waiting ticket for resource allocation control, waiting ticket management method, and resource allocation control method | |
CN110515728B (zh) | 服务器调度方法、装置、电子设备及机器可读存储介质 | |
US9577878B2 (en) | Geographic awareness in a distributed strict queue | |
CN113282580A (zh) | 用于执行定时任务的方法、存储介质及服务器 | |
US11263184B1 (en) | Partition splitting in a distributed database | |
CN112099728B (zh) | 一种执行写操作、读操作的方法及装置 | |
CN104281587A (zh) | 一种建立连接的方法及装置 | |
CN105450679A (zh) | 进行数据云存储的方法及系统 | |
CN108829340B (zh) | 存储处理方法、装置、存储介质及处理器 | |
CN113821174B (zh) | 存储处理方法、装置、网卡设备及存储介质 | |
US8918555B1 (en) | Adaptive and prioritized replication scheduling in storage clusters | |
JP2019121333A (ja) | データダイナミックマイグレーション方法とデータダイナミックマイグレーション装置 | |
CN113253944A (zh) | 一种磁盘阵列访问方法、系统及存储介质 | |
CN106202262A (zh) | 一种信息处理方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |