CN111522796B - 系统间的数据迁移方法、装置、计算机设备及介质 - Google Patents

系统间的数据迁移方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN111522796B
CN111522796B CN202010331236.9A CN202010331236A CN111522796B CN 111522796 B CN111522796 B CN 111522796B CN 202010331236 A CN202010331236 A CN 202010331236A CN 111522796 B CN111522796 B CN 111522796B
Authority
CN
China
Prior art keywords
data
migrated
target
splitting
migration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010331236.9A
Other languages
English (en)
Other versions
CN111522796A (zh
Inventor
纪瑞贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Dajiaying Information Technology Co Ltd
Original Assignee
Suzhou Dajiaying Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Dajiaying Information Technology Co Ltd filed Critical Suzhou Dajiaying Information Technology Co Ltd
Priority to CN202010331236.9A priority Critical patent/CN111522796B/zh
Publication of CN111522796A publication Critical patent/CN111522796A/zh
Application granted granted Critical
Publication of CN111522796B publication Critical patent/CN111522796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种系统间的数据迁移方法、装置、计算机设备和存储介质,该方法包括:获取与待迁移系统中的目标业务子模块对应的全部待迁移数据;根据全部待迁移数据,确定与处理线程匹配的单次处理任务量;通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将待迁移数据对应存储于待迁移数据数组中;根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中。本发明实施例的技术方案简单、便捷的实现了多个业务相似系统之间的数据迁移。

Description

系统间的数据迁移方法、装置、计算机设备及介质
技术领域
本发明实施例涉及数据处理技术,尤其涉及一种系统间的数据迁移方法、装置、计算机设备及介质。
背景技术
目前,企业可以构建数据库系统存储各类业务数据,随着企业业务的不断发展,该数据库中需要存储的业务数据的数据类型或数据格式均可能发生变化,此时,企业需要构建新的数据库系统存储新的业务数据。
为了保证业务数据的连续性和可追溯性,企业需要将旧系统中存储的业务数据按照新系统要求的形式对应存储于新系统中,这就涉及到两个业务类似,但是数据库结构不同的系统间的数据迁移问题。现有技术中,在进行不同系统间的数据迁移时,通常是需要通过SQL(Structured Query Language,结构化查询语言)脚本进行数据行级别的操作。
发明人在实现本发明过程中,发现现有技术存在如下缺陷:对于复杂的业务数据迁移,SQL脚本复杂难以维护,很容易导致编码错误;对于复杂的业务甚至系统级别的数据迁移,SQL脚本的数据迁移方式无法实现;需要对旧数据进行读取和操作,要求迁移的双方数据库运行在同一个数据库实例上。
发明内容
本发明实施例提供了一种系统间的数据迁移方法、装置、计算机设备及存储介质,以简单、便捷的实现多个业务相似系统之间的数据迁移。
第一方面,本发明实施例提供了一种系统间的数据迁移方法,所述方法包括:
获取与待迁移系统中的目标业务子模块对应的全部待迁移数据,待迁移系统包括与业务领域匹配的多个业务子模块;
根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量;
通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中;
根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中。
第二方面,本发明实施例还提供了一种系统间的数据迁移装置,该装置包括:
待迁移数据获取模块,用于获取与待迁移系统中的目标业务子模块对应的全部待迁移数据,待迁移系统包括与业务领域匹配的多个业务子模块;
单次处理任务量确定模块,用于根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量;
待迁移数据数组存储模块,用于通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中;
待迁移数据转换模块,用于根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中。
第三方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的系统间的数据迁移方法。
第四方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的系统间的数据迁移方法。
本发明实施例的技术方案通过获取与待迁移系统中的目标业务子模块对应的全部待迁移数据;根据全部待迁移数据,确定与处理线程匹配的单次处理任务量;通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中;根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中的技术手段,只要待迁移系统与目标迁移系统双方的业务类似,即可按照通用性的方式实现复杂业务数据的完整迁移,容易实现且容易操作,能够减少失误发生的概率,且不需要迁移的双方数据库运行在同一个数据库实例上。
附图说明
图1是本发明实施例一中的一种系统间的数据迁移方法的流程图;
图2是本发明实施例二中的一种系统间的数据迁移方法的流程图;
图3a是本发明实施例三中的一种系统间的数据迁移方法的流程图;
图3b是本发明实施例的具体应用场景适用的一种数据迁移过程的示意图;
图4是本发明实施例四中的一种系统间的数据迁移装置的结构图;
图5是本发明实施例五中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的一种系统间的数据迁移方法的流程图,本实施例可适用于在业务类似但数据库结构不同的多个系统间进行数据迁移的情况,该方法可以由系统间的数据迁移装置来执行,该装置可以由软件和/或硬件来实现,并一般可以集在具有数据识别与处理功能的终端或者服务器中,本实施例的方法具体包括如下步骤:
S110、获取与待迁移系统中的目标业务子模块对应的全部待迁移数据,待迁移系统包括与业务领域匹配的多个业务子模块。
其中,本发明实施例的技术方案主要适用于将旧系统存储的旧数据,转换为新系统(也即,目标迁移系统)的数据存储形式后在新系统进行存储的情况。待迁移系统具体是指需要将内部存储的旧数据进行转存的旧系统。该待迁移系统可以具体为一个存储有旧数据的数据库,上述数据库中存储有表单、图表、以及视图等数据。在本实施例中,待迁移系统中包括与业务领域(或者说业务功能)对应的多个业务子模块,以实现将待迁移系统存储的数据能够按照业务领域进行分组的数据迁移。
例如,在电子商务系统的数据库中,一般存储有各类订单数据、账单数据以及用户数据等,针对与上述数据库匹配的系统,可以首先将该系统划分为订单模块、账单模块以及用户模块等多个业务子模块。
当需要对上述系统的数据库中的全部数据进行数据迁移时,可以分别针对订单模块中包括的全部数据(也即,与该订单模块对应的待迁移数据),账单模块中包括的全部数据以及用户模块中包括的全部数据分别进行上述数据迁移操作,以最终实现整个系统的数据迁移。或者,也可以仅针对上述系统的数据库中指定业务子模块对应的全部数据进行数据迁移操作,本实施例对此并不进行限制。
S120、根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量。
考虑到一般需要进行数据迁移的数据量很大,为了节省数据迁移时间,一般采取多线程机制,实现数据迁移过程。通过多个处理线程的共同处理,将待迁移系统的目标业务子模块中的全部待迁移数据读取处理,并存储在一个或者多个数据结构中。
在本实施例中,考虑到各个处理线程对数据的处理速度各不相同,处理速度快的处理线程在单次任务处理结束后,可以继续获取新的任务继续进行处理。为了降低各个处理线程之间依赖性,提高各个处理线程的处理效率,可以预先规定与处理线程匹配的单次处理任务量。这样,当处理速度快的处理线程完成本次处理任务时,可以直接确定其下一次需要处理的任务在全部任务中的位置。
在一个具体的例子中,全部待迁移数据为1000条订单数据,需要5个处理线程将上述订单数据从待迁移系统中读取出来。假设单次处理任务量为100,则每个处理线程在第一次读取任务所需处理的订单数据均可以明确,例如,处理线程1处理:1-100条订单数据,处理线程2处理:101-200条订单数据,处理线程3处理:201-300条订单数据,处理线程4处理:301-400条订单数据以及处理线程5处理:401-500条订单数据。
当处理线程4首先完成301-400条订单数据的读取后,其可以直接处理: 501-600条订单数据,而无需等待其他处理线程处理完成才能重新被分配处理任务。
在本实施例中,可以根据全部待迁移数据的数据总量以及处理线程的处理速度以及内存容量等参数,确定与处理线程匹配的单次处理任务量;还可以根据全部待迁移数据的数据总量以及预设的拆分次数(或者,也可以称为拆分数量),确定与处理线程匹配的单次处理任务量;还可以根据全部待迁移数据的数据类型(例如,时间递增型),确定与处理线程匹配的单次处理任务量等,本实施例对此并不进行限制。
S130、通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中。
为了实现将待迁移数据转换为目标迁移系统所适配的目标数据,或者说适宜在目标迁移系统中存储的目标数据,需要首先读取全部待迁移数据缓存在设定的一个或者多个数据结构中,进而可以直接对该一个或者多个数据结构中存储的数据进行转换。具体的,可以将待迁移数据中的每一项数据存储为一个数据对象(例如,结构体数据),进而可以将每个数据对象作为一个数组元素对应存储于待迁移数据数组中,以通过一个待迁移数据数组存储全部待迁移数据。
其中,本领域技术人员可以根据实际情况选择将全部待迁移数据均迁移至目标迁移系统,也可以选择仅将待迁移数据中的部分数据(例如,数值型或者字符串型)迁移至目标迁移系统等,本实施例对此并不进行限制。
相应的,可以通过各个处理线程的并行执行,将全部待迁移数据均存储在该待迁移数据数组中,也可以选择将设定数据类型的数据存储在该待迁移数据数组中。
S140、根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中。
在本实施例中,考虑到业务子模块不同,从待迁移数据转换至目标数据的转换方式也不同。因此,可以预先实现与不同业务子模块分别对应的转换方法,进而可以通过接口调用的方式,使用该转换方法将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据。
本发明实施例的技术方案通过获取与待迁移系统中的目标业务子模块对应的全部待迁移数据;根据全部待迁移数据,确定与处理线程匹配的单次处理任务量;通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中;根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中的技术手段,只要待迁移系统与目标迁移系统双方的业务类似,即可实现复杂业务数据的完整迁移,容易实现且容易操作,能够减少失误发生的概率,且不需要迁移的双方数据库运行在同一个数据库实例上。
实施例二
图2是本发明实施例二提供的一种系统间的数据迁移方法的流程图,本发明实施例以上述各实施例为基础进行进一步具体化,在本实施例中,将根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量的操作,具体化为:根据与所述全部待迁移数据匹配的数据总量,以及预设的拆分次数,确定与处理线程匹配的单次处理任务量。
相应的,如图2所示,本发明实施例的方案具体包括如下步骤:
S210、获取与待迁移系统中的目标业务子模块对应的全部待迁移数据。
其中,待迁移系统包括与业务领域匹配的多个业务子模块;
S220、根据与所述全部待迁移数据匹配的数据总量,以及预设的拆分次数,确定与处理线程匹配的单次处理任务量。
其中,拆分次数具体是指拆分数量,也即,需要将该待迁移数据拆分为多少个单次处理任务进行处理,上述拆分次数可以根据计算机内存或者处理性能等实际情况进行预设。上述单次处理任务量是指每个处理线程在一次任务过程中,需要处理的任务量。
相应的,将与所述全部待迁移数据匹配的数据总量除以拆分次数的计算结果,即为处理线程匹配的单次处理任务量。
S230、通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中。
S240、根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中。
在本实施例中,通过根据与所述全部待迁移数据匹配的数据总量,以及由计算机内存或者处理性能等实际情况进行预设的拆分次数,确定与处理线程匹配的单次处理任务量,可以科学的计算每个处理线程的单次任务需要读取的数据量,可以进一步提高数据的迁移效率,减少数据迁移所需的时间。
在上述各实施例的基础上,根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量,还可以具体包括:
根据与所述目标业务子模块的目标业务类型,确定拆分属性,并根据所述拆分属性对全部待迁移数据进行拆分,以确定与处理线程匹配的单次处理任务量。
具体的,考虑到业务子模块的业务类型不同,待迁移数据的实际物理意义也不同,如果仅仅按照拆分次数,将待迁移数据均分到每个处理线程中进行处理,可能会破坏待迁移数据之间的连贯性。因此,为了保证数据读取的准确性和连贯性,可以根据与所述目标业务子模块的目标业务类型,确定拆分属性,并根据所述拆分属性对全部待迁移数据进行拆分。
具体的,可以预先建立业务类型与拆分属性之间的映射关系,以及与不同拆分属性分别匹配的数据拆分方式,进而可以根据业务子模块的业务类型,对待迁移数据进行定制化的数据拆分。
在本实施例的一个可选的实施方式中,根据与所述目标业务子模块的目标业务类型,确定拆分属性,并根据所述拆分属性对全部待迁移数据进行拆分,以确定与处理线程匹配的单次处理任务量,包括:
如果确定所述目标业务类型为时间增序类业务,则以时间作为拆分属性;
选取设定时间单元,并按照所述时间单元对全部待迁移数据进行拆分,其中,一个拆分结果中包括的任务量为一个处理线程的单次处理任务量。
其中,时间增序类业务具体是指数据是以自然时间的增序进行存储的,且每个设定时间单元(例如,天、周或者月)内的数据具有整体性和连贯性。因此,如果对上述类型的数据仍然按照一个统一数值的单次处理任务量进行拆分,会破坏待迁移数据之间的连贯性。
相应的,可以按照最小的时间连贯单元,例如:天,对全部待迁移数据进行拆分,使得每个线程读取同一天内生成的全部待迁移数据。
例如:我们在迁移订单模块中存储的数据时,将与订模块对应的数据按日期拆分,并进行处理的,这样可以保证所读取的数据是以天为单位进行存储的,进而上述数据可以以天为单元刷进存储至目标迁移系统中,这样才能保证数据的正确性和准确性。
实施例三
图3a是本发明实施例三提供的一种系统间的数据迁移方法的流程图,本发明实施例以上述各实施例为基础进行进一步具体化,在本实施例中,在执行获取与待迁移系统中的目标业务子模块对应的全部待迁移数据的操作之前,还可以包括:将所述待迁移系统按照业务领域预先划分为多个业务子模块;按照预设的业务对象模板,构建与每个业务子模板分别对应的业务对象,并针对每个所述业务对象分别实现数据拆分接口、待迁移数据获取接口以及数据转换接口。
相应的,如图3a所示,本发明实施例的方案具体包括如下步骤:
S310、将所述待迁移系统按照业务领域预先划分为多个业务子模块。
S320、按照预设的业务对象模板,构建与每个业务子模板分别对应的业务对象,并针对每个所述业务对象分别实现数据拆分接口、待迁移数据获取接口以及数据转换接口。
在本实施例中,可以针对每个业务子模块实现一个业务对象,并在每一个业务对象中实现三个功能接口,也即:数据拆分接口、待迁移数据获取接口以及数据转换接口。
其中,数据拆分接口可以实现根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量的功能;待迁移数据获取接口可以实现通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中的功能,数据转换接口可以实现根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统的功能。
S330、获取与待迁移系统中的目标业务子模块对应的全部待迁移数据。
其中,在获取与待迁移系统中的目标业务子模块对应的全部待迁移数据之后,还包括:
在实现了每个业务对象的上述三个功能接口后,通过调用与所述目标业务子模块匹配的目标业务对象的开始方法,可以实现所述目标业务对象中的数据拆分接口、待迁移数据获取接口以及数据转换接口的功能。
S340、通过所述数据拆分接口,根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量。
S350、通过所述待迁移数据获取接口,通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中。
可选的,为了保证数据完整性的要求,一般需要将全部待迁移数据均迁移至目标迁移系统中,因此,在针对待迁移数据进行读取并存储于待迁移数据数组时,可以加入相应的忽略类型标签(例如,json:"Data,omitempty),以将各个类型的待迁移数据均存储于所述待迁移数据数组中。
其中,所述忽略类型标签表示不论待迁移数据中存储的数据是何种类型,均对应读取并存储至待迁移数据数组中。
相应的,可以在所述待迁移数据获取接口中,预先在所述待迁移数据数组的数据结构中加入忽略类型标签,以将各个类型的待迁移数据均存储于所述待迁移数据数组中。
S360、通过所述数据转换接口,根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统。
在本实施例中,可以独立实现从待迁移数据到目标迁移数据的数据转换方法,实现将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,也可以直接调用所述目标迁移系统中的已有功能方法作为转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据。也即,在数据转换接口中包括的转换方法为所述目标迁移系统中的已有功能方法。通过使用该已有功能方法对目标迁移系统的服务进行调用,可以直接生成目标迁移系统所适配的目标数据。
通过对目标迁移系统中的已有功能方法的直接使用,在减少人为工作量的同时,可以最大程度保证转换后数据与目标迁移系统的兼容性,保证转换后得到的目标数据的准确性,减少迁移失败的概率。
本发明实施例的技术方案针对待迁移系统的每个业务子模块均实现一个业务对象,并针对每个业务对象分别实现数据拆分接口、待迁移数据获取接口以及数据转换接口,当调用与所述目标业务子模块匹配的目标业务对象的开始方法,可以实现所述目标业务对象中的数据拆分接口、待迁移数据获取接口以及数据转换接口的功能,保证了整个数据迁移方法的通用性和可移植性,提供了一种数据迁移方法的标准实现方式,不再要求开发人员写大量复杂的SQL脚本,减少失误和时间成本。
具体应用场景
图3b是本发明实施例的具体应用场景适用的一种数据迁移过程的示意图。如图3b所示,在实现将原系统(待迁移系统)中DB(DataBase,数据库)中的待迁移数据迁移至目标系统(目标迁移系统)中的DB中时,针对原系统(待迁移系统)中DB,首先可以生成与该原系统匹配的多个业务对象(hander_xx,hander_yy等),并在每个业务对象中分别实现数据拆分接口(split)、待迁移数据获取接口(old)以及数据转换接口(transfer),进而可以通过执行每个业务对象的方法,将原系统中每个业务模块中的全部待迁移数据转换成目标系统所适配的目标数据,并存储至该目标系统中。典型的,在数据转换接口(transfer) 中,可以通过调用目标系统自带的系统服务(service),或者说直接调用目标迁移系统中的已有功能方法,实现从待迁移数据到目标数据的转换。
可选的,本发明实施例的方法可以通过一个第三方工具实现,通过该工具,可以将两个业务类似的系统之间数据迁移分为四个步骤:
一、对原有的业务数据按业务领域或模块做拆分,规划需要迁移的业务数据的模块界限和范围,确定两个系统间需要迁移哪些数据。
二、将具体的某领域或模块数据按数据量大小,确定每个线程处理的任务数,即同一时间有多少线程在处理该任务,每个线程需要处理的数据量。
三、原有系统的业务数据获取。
四、原有业务数据到目标系统的转换,通过调用新系统提供的rpc(远程过程调用协议)服务,可以实现让旧数据按照新系统的业务完成数据的存储。
这四个步骤相应地被抽象成handler对象和3个接口:split、old以及transfer,这样将原本完全隔绝的两个系统通过业务领域的方式关联,使数据的迁移转换成对业务领域的迁移,使原系统业务数据能够为目标系统所使用。具体实现如下:
第一步:对原有系统的业务模块做拆分。
想要将两个表结构不同的系统进行数据迁移,如果直接按照数据表的方式拆分是不合理也无法实现的,因为完全无法一一对应上,因此只能将新旧系统按照业务模块做拆分,将需要的业务数据转换存储到另一个系统。一个完整的系统包含很多个子模块,比如用户模块、订单以及账单模块等。我们这里将一个个模块定义成一个个handler,handler的结构定义如下:
type handler struct{
tr Transfer
old Old
spl Split
operateName string
totalCntint//总数据量
splitCntint//拆分次数
}
func(hl*handler)Start(limitSizeint){
star:=time.Now().Unix()
hl.initSplit(limitSize)
hl.initContrast()
hl.initOldData(limitSize)
varwgTransync.WaitGroup
hl.transferData(&wgTran)
wgTran.Wait()
end:=time.Now().Unix()
duration=end–star
fmt.Println("****耗时:",duration,"秒*****")
}
一个handler是对一个业务模块数据迁移过程的封装,它持有转换过程中需要的三个接口,当需要对某一个业务模块数据进行迁移时,只需要对这个模块实现这三个接口并创建一个新handler,调用其开始方法即可。
第二步:将具体的某领域或模块数据按数据量大小确定每个线程处理的任务数。
模块不同,原系统数据范围和数据量大小也不同,数据性质不同,同时新系统的处理能力也不同,所以针对不同模块,按照一定预估能力划分每个线程的任务量,才能最大限度利用服务器资源并且减少程序消耗时间。
type Split interface{
GetDbCnt(limitSizeint)(splitCnt,totalCntint)
}
例如我们在迁移名单数据时,将名单模块的数据按日期拆分,保证每天的刷名单顺序是按照自然时间刷进新系统的,这样才能保证数据的正确性和准确性。
第三步:原有系统业务数据的获取。
type Old interface{
GetOld(current,limitSizeint)(error,[]*OldInfo)
GetProcessName(current int)string
}
typeOldInfostruct{
Id int64
Data interface{}`json:"Data,omitempty"`
}
这一步将每个模块需要处理的旧数据通过gorm连接从数据库中取出,每个线程取出的数据量依赖前一步的结果,并构造旧数据源的数组,是下一步转换到新系统的数据源。
第四步:原有业务数据到目标系统的转换。
不同的模块可以实现方法不同,这里可以进行更多更复杂的原系统和新系统的业务组装,实现用SQL脚本不能完成的事情,而且还能利用现有目标系统的服务接口,完全按照目标系统的业务逻辑完成数据转换,减少数据业务逻辑错误的风险的同时,还能控制并发数量,动态调整对服务器的压力。
Figure BDA0002465019670000171
Figure BDA0002465019670000181
Figure BDA0002465019670000191
在这一步,我们在迁移原系统供应商数据时,如果单纯用SQL脚本,需要处理大量的服务商与合作商关系建立的复杂数据,根本无法完成,但是依赖现有目标系统的服务接口,我们在这一步直接调用已有服务的方法,完成了将原系统的供应商数据全部迁移到新系统的过程。
在两个业务类似的系统之间,按照拆分的业务领域和模块而不是数据库表进行系统级别的数据迁移,并且能够对每个模块动态控制并发量,在迁移的过程中可以调用目标系统已有的服务和接口完成数据转换。通过使用本工具,不再要求数据迁移一定要库表结构类似,而且可以完成两个系统级别之间的数据迁移。不再要求开发人员写大量复杂的SQL脚本,减少失误和时间成本。
实施例四
图4为本发明实施例四提供的一种系统间的数据迁移装置的结构图,该装置包括:待迁移数据获取模块410、单次处理任务量确定模块420待迁移数据数组存储模块430以及待迁移数据转换模块440,其中:
待迁移数据获取模块410,用于获取与待迁移系统中的目标业务子模块对应的全部待迁移数据,待迁移系统包括与业务领域匹配的多个业务子模块。
单次处理任务量确定模块420,用于根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量。
待迁移数据数组存储模块430,用于通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中。
待迁移数据转换模块440,用于根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中。
本发明实施例的技术方案通过获取与待迁移系统中的目标业务子模块对应的全部待迁移数据;根据全部待迁移数据,确定与处理线程匹配的单次处理任务量;通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中;根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中的技术手段,只要待迁移系统与目标迁移系统双方的业务类似,即可按照通用性的方式实现复杂业务数据的完整迁移,容易实现且容易操作,能够减少失误发生的概率,且不需要迁移的双方数据库运行在同一个数据库实例上。
在上述各实施例的基础上,单次处理任务量确定模块420,可以具体包括,第一确定单元,用于:
根据与所述全部待迁移数据匹配的数据总量,以及预设的拆分次数,确定与处理线程匹配的单次处理任务量。
在上述各实施例的基础上,单次处理任务量确定模块420,可以具体包括,第二确定单元,用于:
根据与所述目标业务子模块的目标业务类型,确定拆分属性,并根据所述拆分属性对全部待迁移数据进行拆分,以确定与处理线程匹配的单次处理任务量。
在上述各实施例的基础上,第二确定单元可以具体用于:
如果确定所述目标业务类型为时间增序类业务,则以时间作为拆分属性;
选取设定时间单元,并按照所述时间单元对全部待迁移数据进行拆分,其中,一个拆分结果中包括的任务量为一个处理线程的单次处理任务量。
在上述各实施例的基础上,还可以包括:
业务子模块划分模块,用于在获取与待迁移系统中的目标业务子模块对应的全部待迁移数据之前,将所述待迁移系统按照业务领域预先划分为多个业务子模块;
业务对象构建模块,用于按照预设的业务对象模板,构建与每个业务子模板分别对应的业务对象,并针对每个所述业务对象分别实现数据拆分接口、待迁移数据获取接口以及数据转换接口,其中:
所述数据拆分接口,用于实现单次处理任务量确定模块420的功能;
所述待迁移数据获取接口,用于实现待迁移数据数组存储模块430的功能;
所述数据转换接口,用于实现待迁移数据转换模块440的功能。
在上述各实施例的基础上,还可以包括,接口功能实现模块,用于在获取与待迁移系统中的目标业务子模块对应的全部待迁移数据之后,通过调用与所述目标业务子模块匹配的目标业务对象的开始方法,实现所述数据拆分接口、待迁移数据获取接口以及数据转换接口的功能。
在上述各实施例的基础上,在所述待迁移数据获取接口中,预先在所述待迁移数据数组的数据结构中加入忽略类型标签,以将各个类型的待迁移数据均存储于所述待迁移数据数组中。
在上述各实施例的基础上,在数据转换接口中包括的转换方法为所述目标迁移系统中的已有功能方法。
本发明实施例所提供的系统间的数据迁移装置可执行本发明任意实施例所提供的系统间的数据迁移方法,具备执行方法相应的功能模块和有益效果。
实施例五
图5为本发明实施例五提供的一种计算机设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图5显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机设备12以通用计算设备的形式表现。计算机设备12 的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器 28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA) 总线,微通道体系结构(MA6)总线,增强型ISA总线、视频电子标准协会(VESA) 局域总线以及外围组件互连(P6I)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如6D-ROM, DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/ 或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该设备/终端/服务器12 交互的设备通信,和/或与使得该设备/终端/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备 12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的系统间的数据迁移方法。
也即:当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现:获取与待迁移系统中的目标业务子模块对应的全部待迁移数据,待迁移系统包括与业务领域匹配的多个业务子模块;根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量;通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中;根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中。
实施例六
本发明实施例六还提供了一种计算机可读存储介质。其上存储有计算机程序,该程序被处理器执行时实现:获取与待迁移系统中的目标业务子模块对应的全部待迁移数据,待迁移系统包括与业务领域匹配的多个业务子模块;根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量;通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中;根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器 (CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、 Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种系统间的数据迁移方法,其特征在于,包括:
获取与待迁移系统中的目标业务子模块对应的全部待迁移数据,待迁移系统包括与业务领域匹配的多个业务子模块;
根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量;
通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中;
根据与不同业务子模块分别对应的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中;
其中,所述根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量,包括:
预先建立业务类型与拆分属性之间的映射关系,以及与不同拆分属性分别匹配的数据拆分方式;
根据所述目标业务子模块的目标业务类型,确定所述拆分属性,并根据所述拆分属性对所述全部待迁移数据进行定制化的拆分,以确定与处理线程匹配的单次处理任务量。
2.根据权利要求1所述的方法,其特征在于,根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量,包括:
根据与所述全部待迁移数据匹配的数据总量,以及预设的拆分次数,确定与处理线程匹配的单次处理任务量。
3.根据权利要求1所述的方法,其特征在于,根据与所述目标业务子模块的目标业务类型,确定拆分属性,并根据所述拆分属性对全部待迁移数据进行拆分,以确定与处理线程匹配的单次处理任务量,包括:
如果确定所述目标业务类型为时间增序类业务,则以时间作为拆分属性;
选取设定时间单元,并按照所述时间单元对全部待迁移数据进行拆分,其中,一个拆分结果中包括的任务量为一个处理线程的单次处理任务量。
4.根据权利要求1-3任一项所述的方法,其特征在于,在获取与待迁移系统中的目标业务子模块对应的全部待迁移数据之前,还包括:
将所述待迁移系统按照业务领域预先划分为多个业务子模块;
按照预设的业务对象模板,构建与每个业务子模板分别对应的业务对象,并针对每个所述业务对象分别实现数据拆分接口、待迁移数据获取接口以及数据转换接口,其中:
所述数据拆分接口,用于实现根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量的操作;
所述待迁移数据获取接口,用于实现通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中的操作;
所述数据转换接口,用于实现根据预设的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中的操作。
5.根据权利要求4所述的方法,其特征在于,在获取与待迁移系统中的目标业务子模块对应的全部待迁移数据之后,还包括:
通过调用与所述目标业务子模块匹配的目标业务对象的开始方法,实现所述目标业务对象中的数据拆分接口、待迁移数据获取接口以及数据转换接口的功能。
6.根据权利要求4所述的方法,其特征在于:
在所述待迁移数据获取接口中,预先在所述待迁移数据数组的数据结构中加入忽略类型标签,以将各个类型的待迁移数据均存储于所述待迁移数据数组中。
7.根据权利要求4所述的方法,其特征在于,在数据转换接口中包括的转换方法为所述目标迁移系统中的已有功能方法。
8.一种系统间的数据迁移装置,其特征在于,包括:
待迁移数据获取模块,用于获取与待迁移系统中的目标业务子模块对应的全部待迁移数据,待迁移系统包括与业务领域匹配的多个业务子模块;
单次处理任务量确定模块,用于根据所述全部待迁移数据,确定与处理线程匹配的单次处理任务量;
待迁移数据数组存储模块,用于通过每个处理线程根据单次处理任务量,从待迁移系统中取出匹配的待迁移数据,并将所述待迁移数据对应存储于待迁移数据数组中;
待迁移数据转换模块,用于根据与不同业务子模块分别对应的转换方法,将待迁移数据数组中的待迁移数据转换为目标迁移系统所适配的目标数据,并将所述目标数据存储于目标迁移系统中;
其中,所述单次处理任务量确定模块,具体用于:
预先建立业务类型与拆分属性之间的映射关系,以及与不同拆分属性分别匹配的数据拆分方式;
根据所述目标业务子模块的目标业务类型,确定所述拆分属性,并根据所述拆分属性对所述全部待迁移数据进行定制化的拆分,以确定与处理线程匹配的单次处理任务量。
9.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的系统间的数据迁移方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的系统间的数据迁移方法。
CN202010331236.9A 2020-04-24 2020-04-24 系统间的数据迁移方法、装置、计算机设备及介质 Active CN111522796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010331236.9A CN111522796B (zh) 2020-04-24 2020-04-24 系统间的数据迁移方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010331236.9A CN111522796B (zh) 2020-04-24 2020-04-24 系统间的数据迁移方法、装置、计算机设备及介质

Publications (2)

Publication Number Publication Date
CN111522796A CN111522796A (zh) 2020-08-11
CN111522796B true CN111522796B (zh) 2022-10-28

Family

ID=71904440

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010331236.9A Active CN111522796B (zh) 2020-04-24 2020-04-24 系统间的数据迁移方法、装置、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN111522796B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434013A (zh) * 2020-11-30 2021-03-02 中国建设银行股份有限公司 数据表迁移方法、装置、电子设备及存储介质
CN112732423B (zh) * 2020-12-30 2023-01-20 平安科技(深圳)有限公司 流程迁移方法、装置、设备及介质
CN112817742B (zh) * 2021-01-12 2024-03-01 平安科技(深圳)有限公司 数据迁移方法、装置、设备及存储介质
CN113034111A (zh) * 2021-03-31 2021-06-25 北京金山云网络技术有限公司 一种数据导出、导入方法及装置
CN113568890A (zh) * 2021-08-03 2021-10-29 拉扎斯网络科技(上海)有限公司 数据迁移方法、装置、电子设备及计算机可读存储介质
CN115964155B (zh) * 2023-03-16 2023-05-30 燧原智能科技(成都)有限公司 芯片内数据处理硬件、芯片内数据处理方法及ai平台

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102508929A (zh) * 2011-12-01 2012-06-20 浪潮(北京)电子信息产业有限公司 实现异构数据库数据迁移的系统、装置及方法
CN110471688A (zh) * 2019-08-21 2019-11-19 深圳蓝贝科技有限公司 业务系统处理方法、装置、设备及存储介质
CN110765069A (zh) * 2019-09-29 2020-02-07 北京淇瑀信息科技有限公司 一种数据迁移方法、装置及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102508929A (zh) * 2011-12-01 2012-06-20 浪潮(北京)电子信息产业有限公司 实现异构数据库数据迁移的系统、装置及方法
CN110471688A (zh) * 2019-08-21 2019-11-19 深圳蓝贝科技有限公司 业务系统处理方法、装置、设备及存储介质
CN110765069A (zh) * 2019-09-29 2020-02-07 北京淇瑀信息科技有限公司 一种数据迁移方法、装置及系统

Also Published As

Publication number Publication date
CN111522796A (zh) 2020-08-11

Similar Documents

Publication Publication Date Title
CN111522796B (zh) 系统间的数据迁移方法、装置、计算机设备及介质
US11061718B2 (en) Pattern-based artificial intelligence planner for computer environment migration
CN110008045B (zh) 微服务的聚合方法、装置、设备及存储介质
US7818410B1 (en) System and method of implementing major application migration
CN110457277A (zh) 业务处理性能分析方法、装置、设备及存储介质
CN111596927B (zh) 服务部署方法、装置及电子设备
US20160019242A1 (en) Migrating Federated Data to Multi-Source Universe Database Environment
US9971794B2 (en) Converting data objects from multi- to single-source database environment
CN112579569A (zh) 一种数据迁移方法和装置
US10817285B1 (en) Transactional migration system
CN114398179B (zh) 一种跟踪标识的获取方法、装置、服务器及存储介质
CN112000738A (zh) 数据库连接的切换方法、装置、设备及介质
CN111813758A (zh) 数据库文件分布式分析方法、装置、服务器及存储介质
US20200327140A1 (en) Systems and methods for access to multi-tenant heterogeneous databases
CN112363914B (zh) 一种并行测试资源配置寻优的方法、计算设备及存储介质
US11163601B2 (en) Dynamically determine the transaction coordinator in multitier hybrid transaction processing middleware systems
CN111611479A (zh) 用于网络资源推荐的数据处理方法及相关装置
US10169076B2 (en) Distributed batch job promotion within enterprise computing environments
US20200159641A1 (en) Debugging asynchronous functions
CN110704099A (zh) 联盟链的构建方法、装置和电子设备
CN115328891A (zh) 数据迁移方法、装置、存储介质及电子设备
US20210182284A1 (en) System and method for data ingestion and workflow generation
CN114217790A (zh) 接口编排调度方法、装置、电子设备及介质
CN110399296B (zh) 测试客户端与服务端之间交互接口的方法、系统和介质
CN111881025B (zh) 一种自动化测试任务调度方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant