CN106487841A - 一种数据迁移方法及设备 - Google Patents

一种数据迁移方法及设备 Download PDF

Info

Publication number
CN106487841A
CN106487841A CN201510536873.9A CN201510536873A CN106487841A CN 106487841 A CN106487841 A CN 106487841A CN 201510536873 A CN201510536873 A CN 201510536873A CN 106487841 A CN106487841 A CN 106487841A
Authority
CN
China
Prior art keywords
migration
migrated
task
file
slicing files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510536873.9A
Other languages
English (en)
Inventor
闫长海
尹书威
刘中巍
丁辉
周皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510536873.9A priority Critical patent/CN106487841A/zh
Priority to PCT/CN2016/095854 priority patent/WO2017032262A1/zh
Publication of CN106487841A publication Critical patent/CN106487841A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/563Data redirection of data network streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications

Abstract

本申请公开了一种数据迁移方法,在从分片迁移队列中获取各个分片文件的子迁移任务,即根据各子迁移任务从与待迁移文件对应的源网络存储中对各分片文件进行迁移处理,从而能够充分利用网络资源进行分片迁移,提高了网络存储资源的迁移效率,以及节省了设备的资源。

Description

一种数据迁移方法及设备
技术领域
本申请涉及通信技术领域,特别涉及一种数据迁移方法。本申请同时还涉及一种数据迁移设备。
背景技术
随着互联网技术的不断发展,云存储越来越成为不可或缺的技术之一。现在市场上提供云存储服务有很多(比如阿里云的OSS…),很受客户喜欢。因此随着使用用户数量越来越多,用户在使用云存储的过程中也不可避免碰到更换云存储服务的情况。
在现有技术中,当用户想更换云存储服务的时候,发现迁移云存储中的数据很麻烦。有的用户云存储的数据很大(几十T到PB),用传统方法迁移,需要很多的机器来进行迁移,迁移的时间也非常长,迁移成本很高。
发明内容
本申请提供了一种数据迁移方法,用以方便快捷地针对网络存储的数据进行迁移,提高迁移效率以及节省设备资源。该方法包括:
从分片迁移队列中获取各个分片文件的子迁移任务,所述分片文件由待迁移文件分片生成,所述子迁移任务根据与所述待迁移文件对应的迁移任务生成;
根据各所述子迁移任务在与所述待迁移文件对应的源网络存储中对各所述分片文件进行迁移处理。
优选地,根据各所述子迁移任务在与所述待迁移文件对应的源网络存储中对各所述分片文件进行迁移处理,具体为:
向所述源网络存储请求与各所述分片文件对应的数据迁移流,所述数据迁移流用于将数据从所述源网络存储转移至内存;
将所述数据迁移流作为数据输入流上传至所述子迁移任务指定的目标网络存储,所述数据输入流用于将所述数据从所述内存转移至所述目标网络存储。
优选地,在从分片迁移队列中获取各个分片文件的子迁移任务之前,还包括:
从异步迁移队列中获取所述待迁移任务;
判断与所述待迁移任务对应的待迁移文件是否已迁移完成;
若判断结果为是,从所述异步迁移队列中获取其他的待迁移任务;
若判断结果为否,根据所述待迁移文件的容量以及预设的分片参数将所述待迁移文件分片处理为多个所述分片文件,并生成与各所述分片文件对应的子迁移任务。
优选地,在从异步迁移队列中获取所述待迁移任务之前,还包括:
获取迁移配置信息;
根据所述迁移配置信息在所述源网络存储的文件中扫描所述待迁移文件;
根据扫描结果生成所述迁移任务,并将所述迁移任务加入所述异步迁移任务队列中。
优选地,在根据各所述子迁移任务在与所述待迁移文件对应的源网络存储中对各所述分片文件进行迁移处理之后,还包括:
判断与所述待迁移文件对应的所有分片文件是否全部迁移成功;
若是,更新并存储所述待迁移文件的迁移状态。
相应地,本申请还提出了一种数据迁移设备,包括:
获取模块,从分片迁移队列中获取各个分片文件的子迁移任务,所述分片文件由待迁移文件分片生成,所述子迁移任务根据与所述待迁移文件对应的迁移任务生成;
迁移模块,根据各所述子迁移任务在与所述待迁移文件对应的源网络存储中对各所述分片文件进行迁移处理。
优选地,所述迁移模块具体用于:
向所述源网络存储请求与各所述分片文件对应的数据迁移流,所述数据迁移流用于将数据从所述源网络存储转移至内存;
将所述数据迁移流作为数据输入流上传至所述子迁移任务指定的目标网络存储,所述数据输入流用于将所述数据从所述内存转移至所述目标网络存储。
优选地,还包括:
判断模块,从异步迁移队列中获取所述待迁移任务,判断与所述待迁移任务对应的待迁移文件是否已迁移完成;
若判断结果为是,所述判断模块从所述异步迁移队列中获取其他的待迁移任务;
若判断结果为否,所述判断模块根据所述待迁移文件的容量以及预设的分片参数将所述待迁移文件分片处理为多个所述分片文件,并生成与各所述分片文件对应的子迁移任务。
优选地,还包括:
生成模块,获取迁移配置信息,根据所述迁移配置信息在所述源网络存储的文件中扫描所述待迁移文件,根据扫描结果生成所述迁移任务,并将所述迁移任务加入所述异步迁移任务队列中。
优选地,还包括:
更新模块,判断与所述待迁移文件对应的所有分片文件是否全部迁移成功,并在判断结果为是时更新并存储所述待迁移文件的迁移状态。
由此可见,通过应用本申请的技术方案,在从分片迁移队列中获取各个分片文件的子迁移任务,即根据各子迁移任务从与待迁移文件对应的源网络存储中对各分片文件进行迁移处理,从而能够充分利用网络资源进行分片迁移,提高了网络存储资源的迁移效率,以及节省了设备资源。
附图说明
图1为本申请提出的一种数据迁移方法的流程示意图;
图2为本申请提出的一种数据迁移设备的结构示意图。
具体实施方式
有鉴于背景技术所提出的技术问题,本申请提出了一种数据迁移方法,如图1所示,包括如下步骤:
S101,从分片迁移队列中获取各个分片文件的子迁移任务,所述分片文件由待迁移文件分片生成,所述子迁移任务根据与所述待迁移文件对应的迁移任务生成。
针对用户所提出的文件迁移请求,本申请首先需要基于请求获取迁移配置信息,在根据所述迁移配置信息在所述源网络存储的文件中扫描所述待迁移文件之后,再根据扫描结果生成所述迁移任务,并将所述迁移任务加入所述异步迁移任务队列中。
后续过程中,由于本申请需要针对各个待迁移文件进行分片处理,因此在本申请的优选实施例中,在该步骤之前首先需要从异步迁移队列中获取所述待迁移任务,判断与所述待迁移任务对应的待迁移文件是否已迁移完成,并基于结果做如下处理:
(1)若判断结果为是,从所述异步迁移队列中获取其他的待迁移任务;
(2)若判断结果为否,根据所述待迁移文件的容量以及预设的分片参数将所述待迁移文件分片处理为多个所述分片文件,并生成与各所述分片文件对应的子迁移任务。
S102,根据各所述子迁移任务在与所述待迁移文件对应的源网络存储中对各所述分片文件进行迁移处理。
在现有的数据转存过程中,必须将待迁移的数据从源网络存储中下载到一个临时的存储空间中,后续再从该临时空间将待迁移数据上传至目标网络存储中。这样的转存方式不仅需要额外地设置下载以及上传的中间存储空间,而且下载过程以及上传过程均需要耗费一定的时间。因此为进一步提高网络存储的迁移效率,本申请的技术方案去掉了现有的迁移过程中的两次本地IO操作。在本步骤对应的优选实施例中,首先向所述源网络存储请求与各所述分片文件对应的数据迁移流,随后将所述数据迁移流作为数据输入流上传至所述子迁移任务指定的目标网络存储。由于数据迁移流的作用都是将数据从源网络存储中下载到内存中,而数据输入流的作用则是将数据从内存中直接上传至目标存储,因此本申请的技术方案在获取到与分片的待迁移数据对应的数据迁移流之后,将该数据迁移流的目的地址直接指向目标存储(即作为上传的数据输入流),这样数据的传输全部都在内存中实现,而不必再依赖于中间硬盘的转村。从而实现各个分片文件的数据仅通过内存直接完成下载以及上传。
为了确保各个分片文件最后都迁移完毕,从而保证整个文件的迁移成功。在该步骤之后,本申请优选实施例还将判断与所述待迁移文件对应的所有分片文件是否全部迁移成功,并在结果为是时更新并存储所述待迁移文件的迁移状态,若否的话则继续从分片迁移队列中获取各个分片文件的子迁移任务。
为达到以上技术目的,本申请还提出了一种数据迁移设备,如图2所示,包括:
获取模块210,从分片迁移队列中获取各个分片文件的子迁移任务,所述分片文件由待迁移文件分片生成,所述子迁移任务根据与所述待迁移文件对应的迁移任务生成;
迁移模块220,根据各所述子迁移任务在与所述待迁移文件对应的源网络存储中对各所述分片文件进行迁移处理。
在具体的应用场景中,所述迁移模块具体用于:
向所述源网络存储请求与各所述分片文件对应的数据迁移流,所述数据迁移流用于将数据从所述源网络存储转移至内存;
将所述数据迁移流作为数据输入流上传至所述子迁移任务指定的目标网络存储,所述数据输入流用于将所述数据从所述内存转移至所述目标网络存储。
在具体的应用场景中,还包括:
判断模块,从异步迁移队列中获取所述待迁移任务,判断与所述待迁移任务对应的待迁移文件是否已迁移完成;
若判断结果为是,所述判断模块从所述异步迁移队列中获取其他的待迁移任务;
若判断结果为否,所述判断模块根据所述待迁移文件的容量以及预设的分片参数将所述待迁移文件分片处理为多个所述分片文件,并生成与各所述分片文件对应的子迁移任务。
在具体的应用场景中,还包括:
生成模块,获取迁移配置信息,根据所述迁移配置信息在所述源网络存储的文件中扫描所述待迁移文件,根据扫描结果生成所述迁移任务,并将所述迁移任务加入所述异步迁移任务队列中。
在具体的应用场景中,还包括:
更新模块,判断与所述待迁移文件对应的所有分片文件是否全部迁移成功,并在判断结果为是时更新并存储所述待迁移文件的迁移状态。
通过应用本申请的技术方案,在从分片迁移队列中获取各个分片文件的子迁移任务,即根据各子迁移任务从与待迁移文件对应的源网络存储中对各分片文件进行迁移处理,从而能够充分利用网络资源进行分片迁移,提高了网络存储资源的迁移效率,以及节省了设备消耗资源。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。
本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。
以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种数据迁移方法,其特征在于,包括:
从分片迁移队列中获取各个分片文件的子迁移任务,所述分片文件由待迁移文件分片生成,所述子迁移任务根据与所述待迁移文件对应的迁移任务生成;
根据各所述子迁移任务在与所述待迁移文件对应的源网络存储中对各所述分片文件进行迁移处理。
2.如权利要求1所述的方法,其特征在于,根据各所述子迁移任务在与所述待迁移文件对应的源网络存储中对各所述分片文件进行迁移处理,具体为:
向所述源网络存储请求与各所述分片文件对应的数据迁移流,所述数据迁移流用于将数据从所述源网络存储转移至内存;
将所述数据迁移流作为数据输入流上传至所述子迁移任务指定的目标网络存储,所述数据输入流用于将所述数据从所述内存转移至所述目标网络存储。
3.如权利要求1所述的方法,其特征在于,在从分片迁移队列中获取各个分片文件的子迁移任务之前,还包括:
从异步迁移队列中获取所述待迁移任务;
判断与所述待迁移任务对应的待迁移文件是否已迁移完成;
若判断结果为是,从所述异步迁移队列中获取其他的待迁移任务;
若判断结果为否,根据所述待迁移文件的容量以及预设的分片参数将所述待迁移文件分片处理为多个所述分片文件,并生成与各所述分片文件对应的子迁移任务。
4.如权利要求1所述的方法,其特征在于,在从异步迁移队列中获取所述待迁移任务之前,还包括:
获取迁移配置信息;
根据所述迁移配置信息在所述源网络存储的文件中扫描所述待迁移文件;
根据扫描结果生成所述迁移任务,并将所述迁移任务加入所述异步迁移任务队列中。
5.如权利要求1所述的方法,其特征在于,在根据各所述子迁移任务在与所述待迁移文件对应的源网络存储中对各所述分片文件进行迁移处理之后,还包括:
判断与所述待迁移文件对应的所有分片文件是否全部迁移成功;
若是,更新并存储所述待迁移文件的迁移状态。
6.一种数据迁移设备,其特征在于,包括:
获取模块,从分片迁移队列中获取各个分片文件的子迁移任务,所述分片文件由待迁移文件分片生成,所述子迁移任务根据与所述待迁移文件对应的迁移任务生成;
迁移模块,根据各所述子迁移任务在与所述待迁移文件对应的源网络存储中对各所述分片文件进行迁移处理。
7.如权利要求6所述的设备,其特征在于,所述迁移模块具体用于:
向所述源网络存储请求与各所述分片文件对应的数据迁移流,所述数据迁移流用于将数据从所述源网络存储转移至内存;
将所述数据迁移流作为数据输入流上传至所述子迁移任务指定的目标网络存储,所述数据输入流用于将所述数据从所述内存转移至所述目标网络存储。
8.如权利要求6所述的设备,其特征在于,还包括:
判断模块,从异步迁移队列中获取所述待迁移任务,判断与所述待迁移任务对应的待迁移文件是否已迁移完成;
若判断结果为是,所述判断模块从所述异步迁移队列中获取其他的待迁移任务;
若判断结果为否,所述判断模块根据所述待迁移文件的容量以及预设的分片参数将所述待迁移文件分片处理为多个所述分片文件,并生成与各所述分片文件对应的子迁移任务。
9.如权利要求6所述的设备,其特征在于,还包括:
生成模块,获取迁移配置信息,根据所述迁移配置信息在所述源网络存储的文件中扫描所述待迁移文件,根据扫描结果生成所述迁移任务,并将所述迁移任务加入所述异步迁移任务队列中。
10.如权利要求6所述的设备,其特征在于,还包括:
更新模块,判断与所述待迁移文件对应的所有分片文件是否全部迁移成功,并在判断结果为是时更新并存储所述待迁移文件的迁移状态。
CN201510536873.9A 2015-08-27 2015-08-27 一种数据迁移方法及设备 Pending CN106487841A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510536873.9A CN106487841A (zh) 2015-08-27 2015-08-27 一种数据迁移方法及设备
PCT/CN2016/095854 WO2017032262A1 (zh) 2015-08-27 2016-08-18 一种数据迁移方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510536873.9A CN106487841A (zh) 2015-08-27 2015-08-27 一种数据迁移方法及设备

Publications (1)

Publication Number Publication Date
CN106487841A true CN106487841A (zh) 2017-03-08

Family

ID=58099614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510536873.9A Pending CN106487841A (zh) 2015-08-27 2015-08-27 一种数据迁移方法及设备

Country Status (2)

Country Link
CN (1) CN106487841A (zh)
WO (1) WO2017032262A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710679A (zh) * 2018-12-28 2019-05-03 北京旷视科技有限公司 数据抽取方法及装置
CN110597766A (zh) * 2019-08-16 2019-12-20 深圳市元征科技股份有限公司 一种数据传输方法及装置
CN112199355A (zh) * 2020-12-09 2021-01-08 北京易真学思教育科技有限公司 数据迁移方法、装置、电子设备及存储介质
CN112866025A (zh) * 2021-01-14 2021-05-28 公安部第三研究所 一种智能合约的分片处理方法
CN113791736A (zh) * 2021-09-15 2021-12-14 京东科技信息技术有限公司 数据迁移方法、网卡设备、服务器及数据迁移系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446180A (zh) * 2018-03-23 2018-08-24 南京航空航天大学 一种基于数据迁移的数据中心动态任务调度方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008005102A8 (en) * 2006-05-13 2008-07-17 Sap Ag Consistent set of interfaces derived from a business object model
CN102999537A (zh) * 2011-09-19 2013-03-27 阿里巴巴集团控股有限公司 一种数据迁移系统和方法
CN104077239A (zh) * 2014-06-24 2014-10-01 华为技术有限公司 Ip硬盘与存储系统,及其数据操作方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8914340B2 (en) * 2008-02-06 2014-12-16 International Business Machines Corporation Apparatus, system, and method for relocating storage pool hot spots
CN104144175B (zh) * 2013-05-06 2019-09-13 腾讯科技(深圳)有限公司 数据迁移的方法、装置及系统
CN104536994A (zh) * 2014-12-11 2015-04-22 北京京东尚科信息技术有限公司 通用的数据迁移方法和装置
CN104731888B (zh) * 2015-03-12 2018-09-04 北京奇虎科技有限公司 一种数据迁移的方法、装置和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008005102A8 (en) * 2006-05-13 2008-07-17 Sap Ag Consistent set of interfaces derived from a business object model
CN102999537A (zh) * 2011-09-19 2013-03-27 阿里巴巴集团控股有限公司 一种数据迁移系统和方法
CN104077239A (zh) * 2014-06-24 2014-10-01 华为技术有限公司 Ip硬盘与存储系统,及其数据操作方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710679A (zh) * 2018-12-28 2019-05-03 北京旷视科技有限公司 数据抽取方法及装置
CN110597766A (zh) * 2019-08-16 2019-12-20 深圳市元征科技股份有限公司 一种数据传输方法及装置
CN110597766B (zh) * 2019-08-16 2024-01-05 深圳市元征科技股份有限公司 一种数据传输方法及装置
CN112199355A (zh) * 2020-12-09 2021-01-08 北京易真学思教育科技有限公司 数据迁移方法、装置、电子设备及存储介质
CN112866025A (zh) * 2021-01-14 2021-05-28 公安部第三研究所 一种智能合约的分片处理方法
CN113791736A (zh) * 2021-09-15 2021-12-14 京东科技信息技术有限公司 数据迁移方法、网卡设备、服务器及数据迁移系统

Also Published As

Publication number Publication date
WO2017032262A1 (zh) 2017-03-02

Similar Documents

Publication Publication Date Title
CN106487841A (zh) 一种数据迁移方法及设备
US20190199777A1 (en) System and method for batch computing
Kristensen Scavenger: Transparent development of efficient cyber foraging applications
WO2020011154A1 (zh) 区块链透明分片方法、装置及系统
CN102801779B (zh) 一种界面呈现方法、系统和终端
JP6669961B2 (ja) プロセッサ、再構成可能回路の制御方法及びプログラム
US11310348B2 (en) Highly scalable, fault tolerant remote access architecture and method of connecting thereto
KR102486243B1 (ko) 데이터 저장소를 파티셔닝하고 리밸런싱하는 기법
US8694685B2 (en) Migrating virtual machines with adaptive compression
US20170134495A1 (en) Method and apparatus for sharing collaboratively edited document
CN103873290A (zh) 一种用于评估应用的性能的方法和系统
US9935999B1 (en) File download manager
CN106776395B (zh) 一种共享集群的任务调度方法及装置
KR20210036226A (ko) 복수의 엣지와 클라우드를 포함하는 분산 컴퓨팅 시스템 및 이의 적응적 지능 활용을 위한 분석 모델 제공 방법
CN103491143A (zh) 一种文件分享方法及装置
CN104468759B (zh) PaaS平台中实现应用迁移的方法和装置
CN104410660A (zh) 多媒体资源的下载方法、装置、路由器及服务器
CN105159760A (zh) 云资源迁移方法和统一的跨平台云资源迁移能力开放接口
US10334030B2 (en) Load balancing between computing clouds
US20170264682A1 (en) Data movement among distributed data centers
CN104408047A (zh) 一种基于nfs文件服务器的文本文件多机并行上传到hdfs方法
CN106797557A (zh) 数据传输的方法和终端
KR20130051820A (ko) 모바일 환경에서의 소프트웨어 마이그레이션 장치 및 방법
Shiraz et al. A lightweight distributed framework for computational offloading in mobile cloud computing
CN103841157B (zh) 文件分享装置及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170308

WD01 Invention patent application deemed withdrawn after publication